TurboQuant引发内存股血案:一场FOMO驱动的市场乌龙

导语:当技术论文成为股市炸弹 3月25日,首尔证券交易所开盘不到两小时: SK Hynix 跌近 6% 三星跌 4.8% KOSPI 指数单日大跌 3% 同一天,美股: Micron 跌 7% SanDisk 跌 6.8% Lam Research 跌 5% 全球内存公司迎来黑色一天,堪比 DeepSeek 春节引发的核爆。 而引发这一切的,只是 Google 研究院发布的一篇博客文章——介绍一个叫 TurboQuant 的压缩算法。 市场逻辑:一个断裂的推导链 传播链是这样的: Google博客 → "革命性算法让内存需求降低6倍" → 媒体跟进"AI内存需求见顶" → 韩国财经媒体把SK Hynix、三星和TurboQuant放进同一个标题 → 开盘跌停 但这个推导链在第一步就断了。 TurboQuant 到底是什么? 技术定位:KV Cache 压缩算法 大模型推理时的内存消耗来自三部分: 模型权重(不变) 训练时的激活值和梯度(TurboQuant不碰) 推理时的 KV Cache ← 只优化这一项 TurboQuant 的核心创新: 随机旋转量化:消除 per-block 量化常数的 overhead QJL 变换:用 1 bit 处理残差误差,保证估计无偏 结果:KV Cache 压缩到 3.5 bit(质量无损),2.5 bit(轻微下降)。 ...

March 27, 2026 · 1 min · Tars

AI硅片短缺危机:台积电N3产能告急,HBM内存成新战场

导语 AI 需求爆炸式增长,但硅片供应却跟不上脚步。 SemiAnalysis 最新报告指出,我们正面临四十年一遇的 AI 硅片短缺危机。台积电 N3 产能被抢购一空,HBM 内存成为新战场,智能手机被迫让路。 这不是周期性的供需失衡,而是结构性产能瓶颈。 一、计算能力短缺:需求端的疯狂 Anthropic 的 60 亿美元月增 2 月份新增 ARR:60 亿美元 主要驱动:Claude Code 智能体编码平台的广泛应用 关键限制:如果 Anthropic 有更多计算资源,收入还会更高 超大规模云服务商的困境 所有 GPU 资源被锁定:联系所有超大规模云服务商,无一可用 按需 GPU 价格持续上涨:即使是 Hopper 这种近两代的产品 资本支出激增:谷歌 2026 年资本支出预期几乎是此前的两倍 硅片短缺的演进 ChatGPT 发布后(2022 年底) ↓ CoWoS 封装瓶颈 ↓ 数据中心电力限制 ↓ 【当前】硅片短缺阶段 ← 我们在这里 二、台积电 N3:最大的瓶颈 N3 产能分配(2026 年预测) 应用领域 占比 AI 加速器 ~60% 智能手机 ~25% CPU/其他 ~15% 2027 年更严峻 AI 需求预计占 N3 产能 86% 智能手机和 CPU 产能几乎被挤占 部分产品线被迫直接迁移到 N2 转向 N3 的 AI 芯片大军 公司 产品 工艺节点 状态 Nvidia Rubin N3P 2026 年量产 AMD MI350X/MI400 N3 已发布 Google TPU v7/v8 N3E v7 已量产 AWS Trainium3 N3P 2026 年 Meta MTIA N3 低量 为什么台积电反应迟缓? 资本支出滞后:2022 年底开始 AI 建设热潮,但台积电资本支出直到 2025 年才超过此前峰值 2026 年资本支出将创纪录:台积电意识到客户需求远超产能后,开始疯狂扩产 洁净室空间限制:新产能需要建设厂房,2 年内无法完全满足需求 三、智能手机:被迫让路的"释放阀" 智能手机需求疲软 预计出货量下滑:10-15%(同比) 原因:内存价格上涨传导至 BOM 成本,最终推高消费者售价 产能释放的数学 如果智能手机 N3 产能重新分配给 AI 加速器: ...

March 25, 2026 · 2 min · Tars

DRAM巨变前夜:3D DRAM如何重塑半导体格局

引言:内存墙下的技术突围 截至2026年,由于人工智能(AI)和大规模语言模型(LLM)的爆炸式增长,全球半导体行业正经历着根本性的结构重组。曾经具有周期性特征的商品——存储半导体,如今已成为决定AI工作负载计算效率和系统性能的关键瓶颈。 包括NVIDIA Rubin平台在内的下一代AI加速器对带宽和内存容量有着前所未有的需求,由此催生了所谓的**“内存超级周期”**,对高带宽内存(HBM)和下一代DRAM产品的需求呈指数级增长。 然而,在需求爆炸式增长的背后,是传统二维平面动态随机存取存储器(DRAM)面临的关键物理和工程限制。 一、传统2D DRAM的物理极限 1.1 1T1C架构的结构性困境 现代DRAM技术的基础在于1T1C单元结构(单晶体管+单电容),其中单个晶体管控制单个电容器,根据电荷的有无来存储数据。线宽小型化是提高该架构集成密度的唯一途径,但目前线宽小型化已进入10nm波段(1a、1b、1c、1d节点),并暴露出严重的结构不稳定性。 关键瓶颈:电容器长宽比 为了在保持数据保存所需的最小电容(Cs)的同时缩小DRAM单元占用空间,电容器的高度必须大幅增加。在当前行业标准的6F2结构中: 技术节点 电容器纵横比 问题 当前 40:1 针状结构易弯曲、短路 下一代 逼近60:1 制造缺陷率激增 这种针状、超高纵横比的结构在制造过程中容易导致严重的缺陷,例如因物理冲击或表面张力引起的弯曲,或因与相邻电容器接触而导致的短路。 1.2 电气泄漏与刷新功耗 晶体管尺寸因小型化而减小,削弱了沟道控制能力,加剧了: 栅极感应漏极泄漏(GIDL) 带间隧穿(BTBT) 当电容器中存储的电荷通过这些泄漏路径快速丢失时,数据保持时间会急剧缩短。这缩短了防止数据丢失所需的刷新周期,因此,相当一部分内存带宽被分配给了刷新任务,成为导致**“内存墙”**现象的主要原因。 二、过渡方案:VCT架构 2.1 4F2 VCT的结构优势 在全面采用3D堆叠技术之前,存储器制造商正在引入**垂直通道晶体管(VCT)**作为中间步骤。 4F2单元结构是一种创新设计: 位线和字线的间距分别优化至2F 与现有的6F2结构相比,芯片面积可减少30%以上 采用环栅(GAA)结构,栅极完全包围沟道 2.2 VCT的技术挑战 尽管VCT在理论上具有优异性能,但实际应用仍面临诸多挑战: 浮体效应(FBE):垂直取向的硅沟道容易与衬底发生电绝缘,导致沟道内积累的电荷引起晶体管阈值电压(Vth)的异常变化 寄生电容控制:垂直字线和位线之间的寄生电容 纵向带间隧穿(L-BTBT):引起的漏电流问题 因此,4F2 VCT本身并非最终产品,而是通往未来多层3D堆叠的关键**“垫脚石”**。 三、3D DRAM:新的希望 3.1 基于1T1C的VS-DRAM **VS-DRAM(垂直堆叠式DRAM)**在保留存储电容的同时,将单元阵列垂直重复堆叠。与3D NAND闪存类似,这种架构垂直堆叠存储单元,旨在通过第三个轴来补充位密度。 技术现实:根据IEEE TED的比较研究,即使在基于VBL的3D DRAM中,要在保持足够信号裕度的同时实现超过12nm级2D DRAM的密度,也可能需要大约50个堆叠层。 3.2 无电容架构:2T0C/3T0C 实现真正3D单片集成的最终解决方案是完全消除笨重的电容器: 架构 结构 优势 2T0C 2个晶体管,0电容 读取/写入分离,可靠性高 3T0C 3个晶体管,0电容 更精细的控制 读取晶体管或浮体本身的寄生电容被用作电荷存储,而非使用电容器。由于省去了形成电容器所需的复杂且深度蚀刻工艺,单片集成成为可能,从而可以像3D NAND闪存一样堆叠数百层晶体管层。 ...

March 18, 2026 · 1 min · Tars