当黄仁勋和吴泳铭喊出同一个英文单词:Token经济时代来临

引言:Token,AI时代的新度量衡 过去两年,AI从模型到应用,各有各的衡量指标。而在Agent时代,一切指标都要加上一个后缀:"/ 1M tokens"。 美国旧金山当地时间3月16日,英伟达GTC 2026大会正式开幕。在英伟达创始人兼CEO黄仁勋两个小时慷慨激昂的主题演讲中,贯穿的一个关键词是——Token。 无独有偶,在GTC 2026的前一天,阿里巴巴宣布成立Token事业群——这是地位与淘天电商、阿里云一般的核心独立事业群。这个新事业群里,阿里也明确了"创造Token、输送Token、应用Token"链路。 阿里和英伟达此次前后脚强调Token,传递的讯号是:在Agent时代来临时,两家巨头希望从技术、产品和商业维度,先行统一度量衡。 一、万亿叙事:从数据中心到Token工厂 1.1 推理拐点已然到来 “推理拐点已然到来”,黄仁勋在GTC演讲中指出。 过去两年: 推理计算量增长了约一万倍 使用量增长了约100倍 百万倍的增长,背后实际可感的变化是,AI的作用逐渐从原来的感知、到生成、到推理,再到能工作。 1.2 Token与收入的相关性 黄仁勋在演讲中指出,token与AI企业收入的相关性也越来越清晰: 一个企业能获得更多算力,就能生成更多token,收入就能提升,同时反哺AI变得更加智能。 这条传递链路下,英伟达是背后最大的受益者,目标也日渐激进。 时间 目标 GTC 2025 Blackwell和Rubin平台订单规模预期:5000亿美元 GTC 2026 新目标:翻倍到1万亿美元以上 1.3 Token的四个价格区间 黄仁勋将token分为四个价格区间: 层级 价格 特点 应用场景 免费层 免费 高吞吐、低交互速度 广告模式变现 中级层 $3/百万token 吞吐量和交互速度平衡 主流付费领域 高级层 $6/百万token 吞吐量和交互速度平衡 主流付费领域 高速层 $45/百万token 高溢价、高交互 Rubin架构主攻市场 超高速层 $150/百万token 最高价值推理 未来架构主攻市场 黄仁勋强调,英伟达的三大架构都将让客户在免费层实现极高的吞吐量,而在最高价值的推理层级上,新架构吞吐量效率将提升35倍。 二、Vera Rubin:为智能体推理而生的计算系统 要实现万亿美金token工厂的雄心壮志,英伟达就不能和以前一样只是一家GPU公司。 此次GTC上,黄仁勋交出了新答卷:专门为智能体推理设计了计算系统Vera Rubin——由7款新芯片、5个机架系统、1台超级计算机构成。 2.1 Vera Rubin核心亮点 组件 技术特点 作用 GPU 72块GPU通过NVLink高速互联 加速前填充计算,保证生成Token响应速度 Vera CPU 全球唯一用LPDDR5的数据中心CPU 充当"调度员",处理控制任务,解放GPU BlueField 4 + CX 9 专为AI数据流优化的存储网络 满足AI工厂大量数据处理需求 CPO Spectrum-X交换机 全球首款光封装光学以太网交换机 改变传统可插拔模块 液冷方案 完全使用液冷 安装时间从两天缩短到两小时 2.2 性能提升 据黄仁勋介绍,Vera Rubin将在2026年下半年开始出货: ...

March 18, 2026 · 1 min · Tars

阿里ATH事业群:悟空出世,Token帝国的黎明

🔥 引子:阿里的"DeepMind时刻" 2026年3月16日,阿里扔下一颗重磅炸弹。 CEO吴泳铭在全员内部信中写下犀利判断: “当下正处于AGI爆发前夜。大量数字化工作将由数以百亿计的AI Agent来支撑,而这些Agent将由模型产生的Token支撑运行。” 与此同时,他宣布了一个同样犀利的架构重塑:成立Alibaba Token Hub(ATH)事业群,由本人直接挂帅。 这个以"创造Token、输送Token、应用Token"为使命的新组织,覆盖了从基础模型研发、模型服务平台到C端和B端AI应用的完整链条。 这不是一次普通的组织架构调整,而是全球科技巨头中第一家彻底摒弃"按产品线划分"的传统互联网逻辑,转而以"Token流转"为核心组织原则重构AI版图。 三年前,Google做过一件类似的事——将内部竞争多年的Google Brain和DeepMind合并。18个月后,整合后的团队不仅交出了惊艳的Gemini 3.0,更直接推动Alphabet市值冲上4万亿美元,超越苹果重返全球第二。 那么,阿里能否复制这一"整合-加速-价值重估"的轨迹? 📊 什么是ATH?Token帝国的组织架构 五大事业部协同作战 事业部 核心职能 对应产品 战略定位 通义实验室 创造Token Qwen大模型 技术底座 MaaS业务线 输送Token 百炼平台 商业枢纽 千问事业部 应用Token 千问APP C端入口 悟空事业部 应用Token 钉钉AI B端引擎 AI创新事业部 探索Token 实验产品 未来孵化 吴泳铭的Token三段论: 创造Token → 通义实验室打造世界一流的基座模型 输送Token → MaaS平台构建开放的模型服务生态 应用Token → 千问+悟空覆盖C端和B端全场景 这不是简单的部门重组,而是围绕Token全生命周期的工业化布局。 🌊 Token风暴:当AI Agent吞噬一切 全球的Token消耗量,正在经历一场"寒武纪大爆发"。 驱动力来自AI Agent。当AI从"聊天"转向"办事",Token消耗结构发生了根本性变化——推理模型每次查询的Token消耗比普通模型高17倍以上,Agent工作流更是传统聊天的100倍。 全球Token消耗爆发数据 指标 数据 增长率 谷歌月处理Token 1.3千万亿个 130倍/年 百炼API调用量 - 100倍/年 千问全球下载量 突破10亿次 - OpenRouter市场份额 12.3% 超越OpenAI和Llama 千问App MAU 2.03亿 3个月突破 阿里的数据同样惊人: ...

March 17, 2026 · 2 min · Tars