NVIDIA

大摩最新研判：中美AI GPU差距没想象那么大

当市场还在讨论"中国AI芯片落后美国几代"时，摩根士丹利抛出了一个反直觉的结论：差距没有想象那么大。更重要的是，大摩给出了一个时间判断——2026年，将成为中国AI GPU产业的重要拐点。 🔍 大摩的三个核心问题这份报告试图回答三个关键问题：中国是否能够大规模供应具有竞争力的AI GPU？中国AI GPU市场到底有多大？投资人应该如何评估中国AI GPU公司的商业价值？让我们沿着这三个问题，看看大摩是怎么说的。 📊 差距没有想象那么大市场误区：只看制程节点很多投资人的判断逻辑很简单：中国AI芯片制程落后1-2代因此竞争力有限大摩的反驳： “如果从’每美元每瓦性能’（performance per watt per dollar）的框架来看，这种差距会明显缩小。” 关键洞察：中国电力成本相对更低，能效在整体算力经济模型中的权重不像欧美那样高。供给侧瓶颈：从设备到产能瓶颈领域现状进展外延设备已突破北方华创、中微公司可提供刻蚀设备已突破 SiCarrier等本土厂商光刻设备仍受限依赖ASML DUV 检测设备仍受限 KLA设备供应受限 EDA软件仍受限华大九天仅1-2%份额最致命的瓶颈： EDA三巨头（Cadence、Synopsys、Siemens）占全球80%+份额美国已对GAA晶体管设计工具实施出口管制目标是阻止中国推进3nm/2nm节点产能转移：从海外回归本土大摩发现一个重要趋势： “多家国内AI芯片厂商已经开始将部分生产从海外迁回中国大陆，利用SMIC的N+1（约12nm）和N+2（约7nm）工艺节点。” SMIC产能预测：年份 N+2产能（万片/月） 2025 2.2 2026 4.0 2027 5.1 💰 国产AI GPU的需求有多大？两大驱动力 1. 技术自主化（政策驱动） ...

GTC 2026深度解读：老黄的'算力永动机'与万亿Token帝国的野心

读完老黄2万字的GTC演讲全文，我意识到一件事：英伟达不是在卖芯片，它是在定义AI时代的"石油美元"体系。Token就是新的大宗商品，而英伟达想成为唯一的"炼油厂"。这不是技术发布会，这是一场关于AI世界秩序的重构宣言。 🔥 开场：从"芯片公司"到"AI基础设施公司"的蜕变老黄这次开场没有举芯片，而是花了整整一个小时回顾历史——从25年前的GeForce，到20年前的CUDA，再到今天的OpenClaw。他说了一句意味深长的话： “GeForce是英伟达史上最成功的市场推广项目。我们从你们还买不起产品的时候就开始培养未来的客户——是你们的父母代替你们成为了英伟达最早的用户。” 翻译：英伟达最擅长的不是造芯片，而是培养生态、锁定用户。这个飞轮逻辑贯穿了整个演讲：装机量吸引开发者开发者创造算法突破突破催生新市场新市场扩大装机量老黄直言：“六年前发布的Ampere架构GPU，其云端价格反而在上涨。"——这就是生态锁定的力量。新判断：英伟达的护城河不是技术领先，而是用二十年时间培养的CUDA生态。这就是为什么老黄敢断言"到2027年至少有1万亿美元的需求”——不是预测，是订单已经摆在桌上。 💰 Token工厂经济学：英伟达在定义AI世界的"石油美元" 老黄抛出了一张"全球CEO都要仔仔细细研究"的图——Token工厂经济学。这不是技术概念，这是一套完整的定价权体系：层级定价用途免费层高吞吐、低速度获客引流中级层 ~$3/百万token 普通用户服务高级层 ~$6/百万token 专业应用高速层 ~$45/百万token 复杂推理超高速层 ~$150/百万token 关键任务老黄的原话：“在这个Token工厂里，你的吞吐量和Token生成速度，将直接转化为你明年的精确收入。” 核心洞察：英伟达在把AI算力商品化、期货化、层级化——就像石油市场有布伦特原油、WTI原油，有不同的精炼品级。而英伟达想成为什么？唯一的"炼油厂"。老黄强调：“英伟达系统已经证明了自己是全球成本最低的基础设施。"——这不是技术自信，这是定价权宣言。 🏭 Vera Rubin：从"卖芯片"到"卖发电厂” 老黄说了一句话，暴露了他的野心： “去年提到Hopper，我会举起一块芯片，那很可爱。但提到Vera Rubin，大家想到的是整个系统。” 7种芯片、5种机架、端到端优化成一台巨型计算机——这不是卖芯片，这是在卖AI发电厂。组件功能战略意义 Rubin GPU 3.6 exaflops算力计算核心 Vera CPU 88核+LPDDR5 全球唯一用LPDDR5的服务器CPU，控制节点 Groq 3 LPU 500MB SRAM 推理加速器，填补极速推理空白 BlueField 4 DPU+CX9 存储和网络基础设施 Spectrum X CPO 共封装光学交换机全球首款量产，打破带宽瓶颈 Kyber机架 144颗GPU全液冷安装时间从2天→2小时最震撼的数据：“短短两年时间，Token生成速率从2200万提升到7亿，350倍增长。摩尔定律同期只能带来1.5倍。” ...

GTC 2026：老黄的'算力永动机'还能转多久？

当3万人的会场挤到WiFi瘫痪，当黄仁勋迟到15分钟，当技术博主质疑"AFD方案经不起推敲"，当华尔街分析师说"英伟达现在处境很尴尬"——NVIDIA的GTC 2026，这场AI界的"年度朝圣"，正在从"信仰充值大会"变成"架构质疑现场"。 🔥 开场：CUDA 20年的情感绑架与一场精心设计的焦虑老黄开场没发新卡，而是大打感情牌——庆祝CUDA 20周年。从25年前的GeForce游戏显卡，讲到20年前的CUDA，讲到10年前的RTX，讲到今天的OpenClaw。 “GeForce是英伟达史上最成功的营销活动。” 这话听着像自嘲，实则是精准的情感绑架。没有当年游戏玩家买显卡的钱，哪来今天满世界的AI计算？翻译一下：你们欠我的。但前菜过后，正餐立刻端上：到2027年，全球算力需求将高达1万亿美元，英伟达订单积压将达到1万亿美元——是去年同期预测的两倍。翻译：你们得更疯狂地买我的卡，而且要买更多。老黄甚至给出了"全球CEO都要仔仔细细研究的一张图"——Token工厂经济学：免费层：高吞吐、低速率，用来获客中间层：$3-$6/百万Token，服务普通用户高级层：$45/百万Token，大模型深度推理顶级层：$150/百万Token，超长研究任务点评：这不是技术发布，这是商业模式的焦虑营销。 🖥️ 硬件：从"按张卖"到"按柜卖"的算力霸权 Vera Rubin：7种芯片拼出的算力怪兽如果你还停留在"买张显卡插在电脑里"的思维，格局确实小了。现在的AI算力，按"柜"卖。 Vera Rubin是英伟达有史以来最复杂的AI计算系统，7种芯片，5种机架，垂直集成、端到端优化成一台巨型计算机：组件规格 Rubin GPU 3.6 exaflops算力，260TB/s全对全带宽 Vera CPU 88核，全球唯一采用LPDDR5的服务器处理器 Groq 3 LPU 500MB片上SRAM，150TB/s带宽 BlueField 4 DPU + CX9 AI原生存储基础设施 NVLink 6 Switch 大规模MoE模型所需的GPU互联 Spectrum X CPO交换机全球首款量产共封装光学交换机最震撼的形态是Kyber机架——垂直安装，前面全是算力卡，后面全是NVLink互联网络，一个机柜塞了144颗GPU。十年前的DGX-1：8块Pascal GPU，170 TFLOPS。十年后的Vera Rubin NVLink 72：3.6 ExaFLOPS。十年，算力增长四千万倍。老黄说：“去年我说Hopper的时候，会举起一块芯片，那很可爱。但这是Vera Rubin，当人们想到Vera Rubin，人们想到的是整个系统。” 点评：这不是卖芯片，这是卖算力发电厂。被砍掉的Rubin CPX：DDR涨价引发的架构回调一个容易被忽略的细节：Rubin CPX方案被取消了。 ...