一句话核心

从Chatbot到Agent,AI从一个任务变成多个任务的编排,CPU从"配角"重新变成"刚需"——而RISC-V第一次在这个赛道拿到了入场券。

芯片行业最容易被忽视的转向

过去两年所有人都在讨论GPU:谁家的算力更大、谁家的显存更多、谁能跑更大的模型。

但阿里达摩院首席科学家孟建熠说了一句很关键的话:

原来的Chatbot只有一个任务,就是聊天,用GPU就行了。但Agent有很多任务要编排,这部分工作更适合CPU做。

这不是一家之言。黄仁勋在GTC上也发布了全新架构的Vera CPU。

一个隐含的行业共识正在形成:AI的下一个战场不在算力,在任务编排。

玄铁C950:RISC-V第一次打到顶配

孟建熠带队20多年,从2003年中天微开始做CPU IP,中间经历了"除了坚持没有别的故事"的黑暗十年。2018年被阿里收购后转向RISC-V,今年3月终于拿到C950的成绩单。

关键数据:单位频率性能22分/GHz

对比对象单位频率性能
x86 最高端24-25分
Arm 最高端26+分
玄铁C95022分
上一代C93015.2分

这个数字的意义:RISC-V从"只能做低端IoT"的学术产物,第一次在CPU最核心指标上和x86、Arm站在了同一水位。

而且C950原生集成了Matrix矩阵运算引擎,直接支持Qwen3、DeepSeek V3等千亿参数模型。这意味着:不是只有GPU才能跑大模型。

平头哥和玄铁的关系:很多人搞混了

阿里的芯片布局有两条线:

  • 平头哥:做完整芯片(含光NPU、真武训推一体芯片等),全部是玄铁的客户
  • 玄铁:做CPU IP授权,RISC-V架构,400+下游客户

简单说,平头哥是"整车厂",玄铁是"发动机供应商"。玄铁不造芯片,但它的IP会出现在阿里云的服务器里、全志科技的AI眼镜芯片里、瑞芯微的机器人控制芯片里。

Agent时代CPU为什么重要?

理解这个逻辑只需要一句话:GPU负责跑模型,CPU负责决定下一步干什么。

Chatbot时代,AI只有一个任务(对话),GPU从头包到尾。Agent时代,AI要同时做搜索、查数据库、调用工具、管理上下文——这些全是CPU的活。

如果CPU很慢,GPU就要等。整体效率不是被最短的板决定的,而是被最慢的环节决定的。

这也解释了为什么孟建熠两年前就立项做C950,那时"龙虾"还没火——他赌的不是Agent这个概念,而是"AGI时代CPU一定会成为瓶颈"这个判断。

RISC-V vs Arm:真正的差异化是"可定制"

Arm授权模式是"你不能改我任何一行代码"。玄铁的做法相反:支持客户在自己的IP基础上二次开发和定制化。

这在AI时代可能是一个杀手级差异。AI终端形态百花齐放(眼镜、机器人、车载、边缘设备),每个场景对芯片的需求不同。标准化产品(Arm)很难同时满足所有场景,但可定制的RISC-V可以。

当然,生态壁垒仍然巨大——游戏、应用都针对Arm优化。孟建熠也承认"生态"是最难的事。

商业视角:这意味着什么

  1. RISC-V拿到了云计算入场券。C950的性能已经可以用于云服务器CPU,堆叠多核后能进入数据中心。这意味着在x86和Arm垄断的市场里,出现了第三个可选项。

  2. 国产芯片的路径不是"替代英伟达",而是"找到他们做不了的地方"。孟建熠原话:“我不是说一定要把谁颠覆掉,我认为我一定会找到他们做不了的地方。”

  3. “AI芯片=GPU"这个等式正在被改写。C950原生集成矩阵运算引擎,CPU直接跑千亿参数模型——GPU作为AI专用加速器的垄断地位正在松动。

  4. 生态建设必须背靠大厂。孟建熠在知合计算做了三年下游产品后得出结论:跳过生态做市场还是很难。阿里+达摩院的生态能力,是玄铁相比其他RISC-V玩家的核心优势。

  5. 英伟达也有路径依赖。孟建熠评价英伟达"成本很高”,CUDA仍会长期存在,但RISC-V+定制化这条路线,在特定场景下会更有竞争力。


基于新皮层(第一财经)与阿里达摩院首席科学家孟建熠的对话整理分析。 原文:https://mp.weixin.qq.com/s/W0S8H3ITwgCuGb9wMLgnsA