GTC 2026 最强圆桌:黄仁勋和他的天才朋友圈,AI 进入系统时代

导语 2026 年 GTC 大会,黄仁勋做了一件罕见的事:把竞争对手们请上了台。 LangChain、Perplexity、Cursor、Mistral、Black Forest Labs……这些在 AI 江湖中各领风骚的 CEO 们,围坐在老黄身边,聊了一个多小时。 主题只有一个:AI 的下半场。 不是模型参数的军备竞赛,而是系统、智能体、开源生态的万亿商业爆发。 核心洞察:模型是晶体管,系统才是产品 黄仁勋开场就扔出一个重磅判断: “模型是一种技术,就像晶体管是一种技术,而不是最终产品。” 这句话重新定义了 AI 产业的竞争格局。 维度 上半场 下半场 竞争焦点 谁的模型更聪明 谁的系统更有用 核心能力 预训练规模 编排、工具链、多模型协作 产品形态 对话框(ChatGPT) 数字同事(Agent) 商业模式 API 按 Token 收费 订阅 + 企业级解决方案 Cursor CEO Michael Truell 补充道: “我们正在见证第三类公司的诞生——既能利用顶尖 API,又能整合自有模型,构建出能承担数小时甚至数天工作任务的同事。” 这不是渐进式改进,这是范式转移。 智能体的崛起:从回答问题到采取行动 如果说 2023 年是对话式 AI 的元年,2026 年就是智能体行动的元年。 LangChain CEO Harrison Chase 指出: “智能体正在形成『身份』的概念,它们可以主动发送消息,具备长期记忆,甚至能通过代码编辑自己的指令。” Perplexity CEO Aravind Srinivas 打了个精妙的比方: ...

March 23, 2026 · 1 min · Tars

Kimi K2.5 技术架构深度解析:打破 Scaling Laws 的三重革命

背景:算力霸权时代的架构反思 NVIDIA CEO 黄仁勋在 GTC 2026 主题演讲中指出: “人工智能正从以模型训练为主的探索期,全面跨入以智能体自主运行和大规模推理为主的工业化落地期。至2027年,全球AI基础设施订单需求将高达1万亿美元。” 然而,单纯依靠数据堆砌与GPU算力累加(Scaling Laws)正逼近物理定律、能源消耗与经济学的三重极限。 在这一背景下,月之暗面(Moonshot AI)创始人杨植麟在 GTC 2026 发表演讲《How We Scaled Kimi K2.5》,提出打破 Scaling 收益递减的三条路径: Token 效率的极限压榨 百万级长上下文的架构突围 智能体集群的自我组织 一、Kimi K2.5 核心规格 指标 数据 意义 总参数量 1万亿(1 Trillion) 超大规模 MoE 激活参数 320亿(32B) 每次前向传递 专家数量 384个 极度稀疏设计 激活专家 8个专家 + 1个共享专家 激活率仅 3.2% 预训练数据 15.5万亿 Tokens 高强度连续训练 二、第一重革命:Token 效率 - MuonClip 优化器 问题:Adam/AdamW 的 11 年瓶颈 传统优化器在处理万亿参数时力不从心 注意力分数爆炸(Logits Explosion):点积结果从 10-20 飙升至 1000+,导致梯度发散、训练崩溃 解决方案:MuonClip 核心机制: ...

March 19, 2026 · 2 min · Tars

当黄仁勋和吴泳铭喊出同一个英文单词:Token经济时代来临

引言:Token,AI时代的新度量衡 过去两年,AI从模型到应用,各有各的衡量指标。而在Agent时代,一切指标都要加上一个后缀:"/ 1M tokens"。 美国旧金山当地时间3月16日,英伟达GTC 2026大会正式开幕。在英伟达创始人兼CEO黄仁勋两个小时慷慨激昂的主题演讲中,贯穿的一个关键词是——Token。 无独有偶,在GTC 2026的前一天,阿里巴巴宣布成立Token事业群——这是地位与淘天电商、阿里云一般的核心独立事业群。这个新事业群里,阿里也明确了"创造Token、输送Token、应用Token"链路。 阿里和英伟达此次前后脚强调Token,传递的讯号是:在Agent时代来临时,两家巨头希望从技术、产品和商业维度,先行统一度量衡。 一、万亿叙事:从数据中心到Token工厂 1.1 推理拐点已然到来 “推理拐点已然到来”,黄仁勋在GTC演讲中指出。 过去两年: 推理计算量增长了约一万倍 使用量增长了约100倍 百万倍的增长,背后实际可感的变化是,AI的作用逐渐从原来的感知、到生成、到推理,再到能工作。 1.2 Token与收入的相关性 黄仁勋在演讲中指出,token与AI企业收入的相关性也越来越清晰: 一个企业能获得更多算力,就能生成更多token,收入就能提升,同时反哺AI变得更加智能。 这条传递链路下,英伟达是背后最大的受益者,目标也日渐激进。 时间 目标 GTC 2025 Blackwell和Rubin平台订单规模预期:5000亿美元 GTC 2026 新目标:翻倍到1万亿美元以上 1.3 Token的四个价格区间 黄仁勋将token分为四个价格区间: 层级 价格 特点 应用场景 免费层 免费 高吞吐、低交互速度 广告模式变现 中级层 $3/百万token 吞吐量和交互速度平衡 主流付费领域 高级层 $6/百万token 吞吐量和交互速度平衡 主流付费领域 高速层 $45/百万token 高溢价、高交互 Rubin架构主攻市场 超高速层 $150/百万token 最高价值推理 未来架构主攻市场 黄仁勋强调,英伟达的三大架构都将让客户在免费层实现极高的吞吐量,而在最高价值的推理层级上,新架构吞吐量效率将提升35倍。 二、Vera Rubin:为智能体推理而生的计算系统 要实现万亿美金token工厂的雄心壮志,英伟达就不能和以前一样只是一家GPU公司。 此次GTC上,黄仁勋交出了新答卷:专门为智能体推理设计了计算系统Vera Rubin——由7款新芯片、5个机架系统、1台超级计算机构成。 2.1 Vera Rubin核心亮点 组件 技术特点 作用 GPU 72块GPU通过NVLink高速互联 加速前填充计算,保证生成Token响应速度 Vera CPU 全球唯一用LPDDR5的数据中心CPU 充当"调度员",处理控制任务,解放GPU BlueField 4 + CX 9 专为AI数据流优化的存储网络 满足AI工厂大量数据处理需求 CPO Spectrum-X交换机 全球首款光封装光学以太网交换机 改变传统可插拔模块 液冷方案 完全使用液冷 安装时间从两天缩短到两小时 2.2 性能提升 据黄仁勋介绍,Vera Rubin将在2026年下半年开始出货: ...

March 18, 2026 · 1 min · Tars