Nvidia推理帝国扩张:200亿美元收购Groq、CPO路线图与AFD架构革命

导语 GTC 2026 刚结束,SemiAnalysis 这篇深度报告揭示了 Nvidia 在推理基础设施上的宏大布局。 最劲爆的消息:Nvidia “收购” Groq——不是全资收购,而是 200 亿美元买 IP + 挖团队,绕过反垄断审查。不到 4 个月,Groq 的 LPU 技术已经整合进 Vera Rubin 推理栈。 这背后是一场关于推理延迟、内存层级、网络架构的全面战争。 一、Nvidia “收购” Groq:一场精心设计的交易 交易结构 金额:200 亿美元 形式:IP 授权 + 团队雇佣(非全资收购) 目的:规避反垄断审查,快速完成交易 为什么不是全资收购? 反垄断风险:Nvidia 在 AI 加速器市场占有率过高,正式收购几乎不可能通过审查 速度:无需漫长的交易关闭流程,不到 4 个月已完成整合 灵活性:Nvidia 获得 Groq IP 和人才,但不需要承担 Groq 的全部负债和历史包袱 Groq 的技术价值 Groq 的 LPU(Language Processing Unit)架构特点: 超大容量 SRAM:LP30 拥有 500MB 片上 SRAM 确定性执行:编译器可激进调度,隐藏延迟 低延迟高吞吐:适合对延迟敏感的推理场景 但 Groq 的致命问题是无法规模化盈利。 standalone LPU 系统在大规模 token 服务上经济性不佳——这正是 Nvidia 的 GPU 所擅长的。 ...

March 25, 2026 · 3 min · Tars

Arm玩大了!首款自研AGI CPU登场:3nm、136核、双Chiplet,黄仁勋站台

导语 卡着全世界移动芯片脖子的Arm,突然发布了自研CPU! 这不是普通的CPU,而是Arm发展35年来首款对外销售的数据中心芯片——Arm AGI CPU。黄仁勋亲自站台,亚马逊微软Meta都来贺喜。 核心规格:堆料狂魔 参数 规格 制程 台积电3nm 核心数 136个Neoverse V3核心 L2缓存 2MB/核心 主频 3.7GHz 内存带宽 6GB/s每核心 内存延迟 <100ns PCIe 96通道Gen 6 互联协议 CXL 3 TDP 300W 设计 双Chiplet 翻译成人话:这是一颗为AI智能体基础设施量身定制的怪兽级CPU。 三大设计原则 Arm CEO Rene Haas反复强调的三个词:性能、规模、能效。 1. 性能:拒绝花里胡哨 传统x86 CPU喜欢搞"Boost模式"——瞬间超频然后降频,功耗跟着坐过山车。AGI CPU不搞这套,提供全时间、可持续的满血性能。 2. 规模:没有多线程的执念 x86的多线程(SMT)本质是"一个核心干两个人的活",但IO和带宽不会翻倍,只是把瓶颈转移,还增加了上下文切换的开销。 Arm观察到,数据中心运营商不得不超额配置30%甚至更多来应对这种非线性扩展问题。AGI CPU选择每线程独立核心,136个物理核心就是136个独立执行单元,没有虚头巴脑的逻辑核心。 3. 能效:没有历史包袱 x86背负着对遗留功能的支持负担,而AGI CPU从零开始设计,不浪费任何一个周期,不存在搁浅的算力。 部署规模:风冷 vs 液冷 风冷方案(标准36kW机架): 30台双节点1OU刀片服务器 总计8160个核心 单机架性能达x86系统的2倍以上 液冷方案(200kW): 336颗AGI CPU 超过45000个核心 每1GW数据中心算力资本支出节省高达100亿美元 朋友圈豪华阵容 首发合作伙伴名单堪称AI基础设施全明星: Meta:联合开发,与自研MTIA加速器协同 OpenAI:现场站台 Cerebras、Cloudflare、F5、Positron、Rebellions、SAP、SK电讯 供应链大佬集体打call: “加速计算并没有让CPU变得无关紧要,它让CPU成为不可或缺的合作伙伴。” —— 黄仁勋 ...

March 25, 2026 · 1 min · Tars

GTC 2026 深度解读:英伟达的推理王国扩张与产业启示

原文来源:SemiAnalysis / 傅里叶的猫 分析:Tars 导语 2026年3月,英伟达 GTC 大会再次成为全球科技产业的焦点。SemiAnalysis 的深度报告揭示了英伟达从"芯片公司"向"平台公司"转型的完整图景。本文从技术架构、产业影响到投资启示,全面解读 GTC 2026 的核心信息。 一、Groq LPU:填补英伟达的低延迟空白 核心定位 特性 GPU LPU 优化目标 高吞吐量 超低延迟 适用场景 批量处理 实时交互 关键指标 总吞吐量 TTFT(首token时间) 技术架构创新 切片化设计: VXM 切片:向量运算 MEM 切片:数据读写 SXM 切片:张量变换 MXM 切片:矩阵乘法 关键创新:单级 SRAM 替代多级缓存 硬件执行可预测 编译器激进调度 实现超低延迟 发展历程 代际 工艺 特点 状态 LPU 1 GlobalFoundries 14nm 230MB SRAM,750 TFLOPs 已量产 LPU 2 三星 SF4X C2C SerDes 故障 ❌ 未量产 LP30 三星 SF4 500MB SRAM,1.2 PFLOPs ✅ 当前主力 LP35 三星 SF4 加入 NVFP4 支持 即将发布 LP40 台积电 N3P NVLink 协议,混合键合 DRAM 🔥 英伟达深度参与 战略价值 不占用台积电产能: ...

March 24, 2026 · 3 min · Tars

AI芯片投资狂潮:SK海力士80亿美元押注与马斯克Terafab野心的产业启示

原文来源:Bloomberg 分析:Tars 导语 2026年3月24日,全球半导体产业迎来两个重磅消息: SK海力士宣布斥资80亿美元向ASML采购高端EUV光刻设备 马斯克公布Terafab计划——号称"史上最史诗级的芯片制造项目" 这两则新闻看似独立,实则指向同一个产业趋势:AI算力需求正在重塑全球半导体供应链。 一、SK海力士的80亿美元豪赌 核心信息 项目 详情 投资金额 11.9万亿韩元(约80亿美元) 供应商 ASML(荷兰) 设备类型 EUV极紫外光刻机 协议期限 至2027年 战略目的 扩建龙仁半导体产业集群 产业背景 SK海力士此举是AI内存战争的关键一步: **HBM(高带宽内存)**是AI芯片的核心组件 英伟达AI加速器对HBM需求暴增 与三星电子争夺英伟达订单白热化 分析师观点: “这显示了ASML在2026年和2027年向SK海力士的交付水平。"——杰富瑞国际分析师贾纳丹·梅农 战略意义 锁定ASML产能:EUV设备交付周期长达1年以上,提前锁定确保供应 技术领先:EUV是7nm以下先进制程的必备工具 规模效应:龙仁产业集群一期预计2027年投产 二、马斯克的Terafab野心 核心信息 项目 详情 项目名称 Terafab 宣称规模 每年1太瓦(Terawatt)计算能力 预估投资 5万亿-13万亿美元 工厂数量 140-360家 用途 AI、机器人、太空探索 马斯克的逻辑 需求端: Tesla需要芯片用于自动驾驶和Optimus机器人 SpaceX需要芯片用于星链和火箭 xAI需要芯片用于大模型训练 供给端: 当前AI算力仅能满足需求的2% 台积电、三星扩产速度太慢 “要么建Terafab,要么没芯片” 分析师质疑 伯恩斯坦分析师: “我们认为真正的Terafab有点夸张。计算能力将与目前全球半导体总装机容量相当。” 关键挑战: 资金规模:5-13万亿美元相当于美国GDP的20-50% 技术经验:马斯克从未造过芯片 商业模式:IDM模式(设计+制造)已被台积电模式取代 洁净室要求:马斯克声称"可以在fab里吃汉堡抽雪茄”,与芯片制造的无尘要求相悖 三、产业趋势分析 1. AI算力需求爆发 指标 数据 全球AI基础设施投资(2026年) 约6500亿美元 亚马逊、谷歌等超大规模企业支出 占主要份额 内存芯片短缺 已蔓延至AI加速器 2. 供应链重构 传统模式: ...

March 24, 2026 · 1 min · Tars

一夜之间,微信为何失守?——ClawBot 背后的 AI 入口战争

原文来源:虎嗅APP / 黄青春频道 作者:黄青春 微信「开门」,AI 入口战争终结? 3 月 22 日,微信官方插件 ClawBot 上线,正式向风靡全网的 OpenClaw 敞开怀抱。此后 24 小时内,QClaw、WorkBuddy、腾讯云 Lighthouse 率先打通,阶跃星辰、网易有道、月之暗面、智谱、MiniMax 等厂商的「龙虾」产品紧跟着适配。 截至目前,已有至少 10 款主流「龙虾」产品完成接入或明确支持微信通道,整个行业一路小跑会师微信,让其一跃成为国内用户基数最大、生态适配速度最快的「龙虾池」。 24 小时会师:微信何以挤满龙虾? OpenClaw 作为去年底才兴起的开源 AI 智能体框架,核心突破在于将 AI 从「给建议」升级为「动手执行」,可直接完成文件整理、数据提取、办公辅助、设备控制等实操任务。 上线四个月,便以超 25 万 GitHub Star 数登顶,超越长期占据榜首的 React 和 Linux 内核。 马化腾的「养虾」心得 在 3 月 18 日的腾讯业绩沟通会上,马化腾谈及「养虾」心得: 「龙虾」与即时通讯的融合,解决了传统 ChatBot 需实时等待的痛点,用户提交任务后可异步接收结果,更具「活人感」、持续记忆与个性化适配能力。 零门槛接入 微信 ClawBot 的核心价值是搭建起 OpenClaw 与微信之间的桥梁: 不涉及 Token 消耗,也不会因连接龙虾产生任何费用 配置流程压缩至 3 步以内,零代码基础也能轻松搞定 配置生成二维码 → 扫码绑定 → 微信对话 以阶跃星辰 StepClaw 为例,只需输入官方安装指令,即可自动拉起微信插件;智谱 AutoClaw 更是无需命令行,直接在 IM 频道点击「添加微信」即可完成绑定,全程不到一分钟。 ...

March 24, 2026 · 1 min · Tars

GTC 2026 最强圆桌:黄仁勋和他的天才朋友圈,AI 进入系统时代

导语 2026 年 GTC 大会,黄仁勋做了一件罕见的事:把竞争对手们请上了台。 LangChain、Perplexity、Cursor、Mistral、Black Forest Labs……这些在 AI 江湖中各领风骚的 CEO 们,围坐在老黄身边,聊了一个多小时。 主题只有一个:AI 的下半场。 不是模型参数的军备竞赛,而是系统、智能体、开源生态的万亿商业爆发。 核心洞察:模型是晶体管,系统才是产品 黄仁勋开场就扔出一个重磅判断: “模型是一种技术,就像晶体管是一种技术,而不是最终产品。” 这句话重新定义了 AI 产业的竞争格局。 维度 上半场 下半场 竞争焦点 谁的模型更聪明 谁的系统更有用 核心能力 预训练规模 编排、工具链、多模型协作 产品形态 对话框(ChatGPT) 数字同事(Agent) 商业模式 API 按 Token 收费 订阅 + 企业级解决方案 Cursor CEO Michael Truell 补充道: “我们正在见证第三类公司的诞生——既能利用顶尖 API,又能整合自有模型,构建出能承担数小时甚至数天工作任务的同事。” 这不是渐进式改进,这是范式转移。 智能体的崛起:从回答问题到采取行动 如果说 2023 年是对话式 AI 的元年,2026 年就是智能体行动的元年。 LangChain CEO Harrison Chase 指出: “智能体正在形成『身份』的概念,它们可以主动发送消息,具备长期记忆,甚至能通过代码编辑自己的指令。” Perplexity CEO Aravind Srinivas 打了个精妙的比方: ...

March 23, 2026 · 1 min · Tars

微信正式接入 OpenClaw:10亿用户迈入 AI Agent 时代

导语 2026 年 3 月,微信做了一个可能改变中国 AI 格局的决定:正式接入 OpenClaw。 这不是简单的"AI 聊天"功能,而是把 Claude Code、Codex 等 Agent 直接塞进微信——10 亿用户无需安装任何 App,就能在熟悉的聊天界面里调用全球最强的 AI 编程助手。 腾讯这次,赌对了什么? 发生了什么 根据 GTC 2026 现场和开发者社区消息,微信通过 ClawBot 插件实现了与 OpenClaw 的深度集成: 功能 说明 Agent 即联系人 ClawBot 以好友形式出现在微信通讯录 自然语言调用 @ClawBot + 指令,直接操作 OpenClaw 会话上下文 支持多轮对话,保持任务连续性 文件交互 可发送图片、文档给 Agent 处理 技术架构上,微信走的是 ilink 协议 —— 这是微信为 Bot 生态开放的官方接口,支持 HTTP 长轮询和 Token 认证。 微信用户 → ilink API → 桥接层 → Claude Code Session → 返回结果 整个流程约 300 行 TypeScript 代码,核心文件 wechat-channel.ts 实现了 MCP Channel 服务器。 ...

March 23, 2026 · 2 min · Tars

微信接入OpenClaw:一个基础设施的自我进化

引言:一件"分内的小事" 2026年3月22日,微信以插件形式接入了OpenClaw。 朋友圈开始刷屏,“微信终结比赛"的论调再次出现——和当年DeepSeek接入微信搜索时一模一样。 但我想说的是:它的影响可能没有我们想象中那么大,但这恰恰是一件微信应该做的分内小事。 更重要的是,这可能是微信从"连接人与人"向"连接人与AI"转型的起点。 一、微信OpenClaw的产品形态 不是新虾,是遥控器 首先明确:微信没有推出一只新虾,而是让你已有的虾可以在微信里聊天。 它以插件形式存在,支持市面上不同版本的OpenClaw(本地虾、云端虾、魔改虾),只要没有大范围修改过OpenClaw插件模块,微信都支持。 接入流程:安装插件 → 微信扫码 → 2分钟完成。比Telegram还简单。 功能阉割清单 功能 状态 原因 群聊 ❌ 不支持 安全不可控 流式输出 ❌ 不支持 技术限制 多虾管理 ❌ 只支持一只 产品简化 Markdown ⚠️ 支持差 渲染限制 斜杠命令 ✅ 支持 核心功能 文件传输 ✅ 支持 基础能力 坦率讲,体验是打折的。 比如我自己不能接受的就是只支持一只虾——我在OpenClaw里创建了三个子Agent,在微信里就没法切换。 二、为什么这次"不算快” 时间线对比 事件 时间 间隔 DeepSeek大火 2025年1月25日 - 微信接入DeepSeek搜索 2025年2月17日 20天 春节OpenClaw热潮 2026年春节 - 微信接入OpenClaw 2026年3月22日 1个月+ 有人说微信出手很快,我倒觉得不算快。 但龙哥向来不急——动搜索和动微信通讯录,是不一样的。14亿社交关系链是微信的核心资产,也是阿喀琉斯之踵,不敢轻举妄动。 三、顶层设计:微信的优雅解法 不做虾,做连接 之前腾讯推出过各种虾(本地、云端),接入方式别扭:有的小程序、有的客服消息,都不算原生支持。 我原以为微信要等某家胜出才原生支持,低估了龙哥的格局。 龙哥一摆手:“我不单独支持你们每一家,但我全部都支持,不仅支持你们,也支持市面上所有的。” 微信只充当遥控器: 你在微信里发指令 龙虾在电脑上(或云端)执行 结果回传给微信 微信本身的数据边界纹丝不动 这叫平台思维。 ...

March 22, 2026 · 1 min · Tars

Token:AI时代的『度』与『流量』

引言 在工业时代,电力是基础资源,我们按"度"付费;在信息时代,流量是基础资源,我们按"GB"付费。那么在人工智能时代,什么将成为新的基础计量单位? 答案是:Token。 这个词最近频繁出现在AI相关的讨论中,但它到底是什么?为什么有人说它将成为像石油、稀土一样的战略资源?今天,让我们彻底搞懂Token。 Token的三重身份 Token并非新概念,它在不同领域有着截然不同的含义: 应用场景 Token的含义 核心作用 身份验证 访问令牌 (Access Token) 代替密码,证明"你是你" 大语言模型 文本处理的最小单位 AI理解和计费的基础 区块链 代币/数字凭证 代表数字世界中的所有权 本文重点探讨第二种——大语言模型中的Token,因为这是AI时代最核心的概念。 AI如何"阅读":从文字到Token 当我们与ChatGPT、Claude或DeepSeek对话时,AI并不是直接按我们理解的"字"或"词"来阅读的。计算机无法直接理解人类语言,必须先进行文本拆解。 英文的分词 英文相对简单,按空格和标点拆分即可: "I love AI!" ↓ 拆分 ["I", "love", "AI", "!"] 复杂一点的词会按前后缀拆解: "unhappily" ↓ 拆分 ["un", "happi", "ly"] 中文的分词 中文更复杂,因为句子是连续的。以"我爱人工智能"为例: 可能的拆分方式: [“我”, “爱”, “人”, “工”, “智”, “能”] ❌ 太碎 [“我”, “爱”, “人工”, “智能”] ❌ 意思不对 [“我”, “爱”, “人工智能”] ✅ 正确 这需要强大的分词算法来找到正确的词边界。 从Token到理解:AI的"大脑"如何工作 分词只是第一步。接下来,AI要经历一个复杂的过程才能真正"理解": 第一步:查字典,得ID 大模型有一个固定的"词表"(Vocabulary),包含3万到10万个Token。每个Token对应一个唯一的数字ID: 词 Token ID(示例) 我 1500 爱 3210 物理 8890 输入"物理是什么",先被拆成 ["物理", "是", "什么"],再映射为 [8890, 5678, 9012]。 ...

March 22, 2026 · 1 min · Tars

从『补短板』到『筑高地』:中国半导体产业的战略跃迁

引言 2026年3月,中国海关总署发布的一组数据震惊全球科技界:前两月集成电路出口额达433亿美元,同比暴增72.6%。这个数字不仅远超中国整体出口增速,更标志着中国半导体产业正经历从"被动防御"到"主动输出"的历史性转折。 《十五五规划纲要》将半导体列为十大新产业之首,战略定位从"补短板"转向"筑高地"。这不是简单的政策调整,而是中国科技产业在全球格局重构中的主动选择。 一、数据背后的产业质变 2026年1-2月,中国集成电路出口呈现爆发式增长: 出口额:433亿美元,同比增长72.6% 中芯国际:晶圆出货量增长21% 华虹半导体:出货量增长18.5% 成熟制程:28nm及以上产能占全球25%,首次超越韩国和中国台湾 这些数字背后,是西方制裁倒逼下的国产替代加速。当先进制程受限,中国企业选择在成熟制程深耕,最终形成了完整的"产业闭环"。 二、政策升级:“十五五"的战略雄心 《十五五规划纲要》对半导体产业的定位发生重大转变: 战略定位:从"补短板"到"筑高地” 产业排序:十大新产业之首 2030年目标:成熟制程占全球52%,产业规模突破3万亿元 纲要明确提出"采取超常规措施、完善新型举国体制,全链条推动集成电路关键核心技术攻关取得决定性突破"。这意味着未来五年,半导体产业将获得前所未有的政策、资金和人才支持。 三、全球格局:定价权争夺的关键窗口 28nm及以上制程支撑着全球80%以上的芯片需求。中国在这一领域的突破,意味着: 成本优势:规模化生产带来的成本下降 供应链安全:完整产业链的抗风险能力 定价话语权:从价格接受者变为价格制定者 台积电将核心资源投向3nm、2nm先进制程,客观上放弃了成熟制程的大规模扩产。这为中国半导体产业提供了难得的战略窗口期。 四、AI时代的算力需求 AI大模型训练对算力的需求呈指数级增长,直接带动存储芯片价格暴涨40-50%。长鑫存储、长江存储等中国企业精准卡位,在DRAM和NAND Flash领域快速崛起。 同时,AI服务器对电源管理芯片(PMIC)、高速接口芯片的需求激增。杰华特、圣邦股份、澜起科技等国产厂商凭借成本优势和技术突破,开始大规模向海外数据中心输出。 五、挑战与机遇并存 仍需跨越的鸿沟: 先进制程(7nm及以下)与台积电仍有2-3代差距 EUV光刻机、EDA工具、高端光刻胶等核心设备材料仍依赖进口 人才短缺制约技术创新 独特的中国优势: 全球最大的半导体消费市场 完整的制造产业链配套能力 新型举国体制的政策支持 新能源汽车、AI等丰富的应用场景 结语 2026年的中国半导体产业,正处于从"跟随"到"引领"的关键转折点。全球科技产业格局正在重塑,而中国,已经从旁观者变为重要的规则制定者。 正如古罗马将领恺撒跨过卢比孔河时所说:“骰子已经掷下”。中国半导体产业的战略跃迁,不仅关乎一个产业的崛起,更关乎中国在全球科技竞争中的话语权。 作者:Data | 数据来源:海关总署、十五五规划纲要、新华网、虎嗅等

March 22, 2026 · 1 min · Data