当黄仁勋和吴泳铭喊出同一个英文单词:Token经济时代来临

引言:Token,AI时代的新度量衡 过去两年,AI从模型到应用,各有各的衡量指标。而在Agent时代,一切指标都要加上一个后缀:"/ 1M tokens"。 美国旧金山当地时间3月16日,英伟达GTC 2026大会正式开幕。在英伟达创始人兼CEO黄仁勋两个小时慷慨激昂的主题演讲中,贯穿的一个关键词是——Token。 无独有偶,在GTC 2026的前一天,阿里巴巴宣布成立Token事业群——这是地位与淘天电商、阿里云一般的核心独立事业群。这个新事业群里,阿里也明确了"创造Token、输送Token、应用Token"链路。 阿里和英伟达此次前后脚强调Token,传递的讯号是:在Agent时代来临时,两家巨头希望从技术、产品和商业维度,先行统一度量衡。 一、万亿叙事:从数据中心到Token工厂 1.1 推理拐点已然到来 “推理拐点已然到来”,黄仁勋在GTC演讲中指出。 过去两年: 推理计算量增长了约一万倍 使用量增长了约100倍 百万倍的增长,背后实际可感的变化是,AI的作用逐渐从原来的感知、到生成、到推理,再到能工作。 1.2 Token与收入的相关性 黄仁勋在演讲中指出,token与AI企业收入的相关性也越来越清晰: 一个企业能获得更多算力,就能生成更多token,收入就能提升,同时反哺AI变得更加智能。 这条传递链路下,英伟达是背后最大的受益者,目标也日渐激进。 时间 目标 GTC 2025 Blackwell和Rubin平台订单规模预期:5000亿美元 GTC 2026 新目标:翻倍到1万亿美元以上 1.3 Token的四个价格区间 黄仁勋将token分为四个价格区间: 层级 价格 特点 应用场景 免费层 免费 高吞吐、低交互速度 广告模式变现 中级层 $3/百万token 吞吐量和交互速度平衡 主流付费领域 高级层 $6/百万token 吞吐量和交互速度平衡 主流付费领域 高速层 $45/百万token 高溢价、高交互 Rubin架构主攻市场 超高速层 $150/百万token 最高价值推理 未来架构主攻市场 黄仁勋强调,英伟达的三大架构都将让客户在免费层实现极高的吞吐量,而在最高价值的推理层级上,新架构吞吐量效率将提升35倍。 二、Vera Rubin:为智能体推理而生的计算系统 要实现万亿美金token工厂的雄心壮志,英伟达就不能和以前一样只是一家GPU公司。 此次GTC上,黄仁勋交出了新答卷:专门为智能体推理设计了计算系统Vera Rubin——由7款新芯片、5个机架系统、1台超级计算机构成。 2.1 Vera Rubin核心亮点 组件 技术特点 作用 GPU 72块GPU通过NVLink高速互联 加速前填充计算,保证生成Token响应速度 Vera CPU 全球唯一用LPDDR5的数据中心CPU 充当"调度员",处理控制任务,解放GPU BlueField 4 + CX 9 专为AI数据流优化的存储网络 满足AI工厂大量数据处理需求 CPO Spectrum-X交换机 全球首款光封装光学以太网交换机 改变传统可插拔模块 液冷方案 完全使用液冷 安装时间从两天缩短到两小时 2.2 性能提升 据黄仁勋介绍,Vera Rubin将在2026年下半年开始出货: ...

March 18, 2026 · 1 min · Tars