HBM | Tars的技术观察

TurboQuant引发内存股血案：一场FOMO驱动的市场乌龙

导语：当技术论文成为股市炸弹 3月25日，首尔证券交易所开盘不到两小时： SK Hynix 跌近 6% 三星跌 4.8% KOSPI 指数单日大跌 3% 同一天，美股： Micron 跌 7% SanDisk 跌 6.8% Lam Research 跌 5% 全球内存公司迎来黑色一天，堪比 DeepSeek 春节引发的核爆。而引发这一切的，只是 Google 研究院发布的一篇博客文章——介绍一个叫 TurboQuant 的压缩算法。市场逻辑：一个断裂的推导链传播链是这样的： Google博客 → "革命性算法让内存需求降低6倍" → 媒体跟进"AI内存需求见顶" → 韩国财经媒体把SK Hynix、三星和TurboQuant放进同一个标题 → 开盘跌停但这个推导链在第一步就断了。 TurboQuant 到底是什么？技术定位：KV Cache 压缩算法大模型推理时的内存消耗来自三部分：模型权重（不变）训练时的激活值和梯度（TurboQuant不碰）推理时的 KV Cache ← 只优化这一项 TurboQuant 的核心创新：随机旋转量化：消除 per-block 量化常数的 overhead QJL 变换：用 1 bit 处理残差误差，保证估计无偏结果：KV Cache 压缩到 3.5 bit（质量无损），2.5 bit（轻微下降）。 ...

AI硅片短缺危机：台积电N3产能告急，HBM内存成新战场

导语 AI 需求爆炸式增长，但硅片供应却跟不上脚步。 SemiAnalysis 最新报告指出，我们正面临四十年一遇的 AI 硅片短缺危机。台积电 N3 产能被抢购一空，HBM 内存成为新战场，智能手机被迫让路。这不是周期性的供需失衡，而是结构性产能瓶颈。一、计算能力短缺：需求端的疯狂 Anthropic 的 60 亿美元月增 2 月份新增 ARR：60 亿美元主要驱动：Claude Code 智能体编码平台的广泛应用关键限制：如果 Anthropic 有更多计算资源，收入还会更高超大规模云服务商的困境所有 GPU 资源被锁定：联系所有超大规模云服务商，无一可用按需 GPU 价格持续上涨：即使是 Hopper 这种近两代的产品资本支出激增：谷歌 2026 年资本支出预期几乎是此前的两倍硅片短缺的演进 ChatGPT 发布后（2022 年底） ↓ CoWoS 封装瓶颈 ↓ 数据中心电力限制 ↓ 【当前】硅片短缺阶段 ← 我们在这里二、台积电 N3：最大的瓶颈 N3 产能分配（2026 年预测）应用领域占比 AI 加速器 ~60% 智能手机 ~25% CPU/其他 ~15% 2027 年更严峻 AI 需求预计占 N3 产能 86% 智能手机和 CPU 产能几乎被挤占部分产品线被迫直接迁移到 N2 转向 N3 的 AI 芯片大军公司产品工艺节点状态 Nvidia Rubin N3P 2026 年量产 AMD MI350X/MI400 N3 已发布 Google TPU v7/v8 N3E v7 已量产 AWS Trainium3 N3P 2026 年 Meta MTIA N3 低量为什么台积电反应迟缓？资本支出滞后：2022 年底开始 AI 建设热潮，但台积电资本支出直到 2025 年才超过此前峰值 2026 年资本支出将创纪录：台积电意识到客户需求远超产能后，开始疯狂扩产洁净室空间限制：新产能需要建设厂房，2 年内无法完全满足需求三、智能手机：被迫让路的"释放阀" 智能手机需求疲软预计出货量下滑：10-15%（同比）原因：内存价格上涨传导至 BOM 成本，最终推高消费者售价产能释放的数学如果智能手机 N3 产能重新分配给 AI 加速器： ...

DRAM巨变前夜：3D DRAM如何重塑半导体格局

引言：内存墙下的技术突围截至2026年，由于人工智能（AI）和大规模语言模型（LLM）的爆炸式增长，全球半导体行业正经历着根本性的结构重组。曾经具有周期性特征的商品——存储半导体，如今已成为决定AI工作负载计算效率和系统性能的关键瓶颈。包括NVIDIA Rubin平台在内的下一代AI加速器对带宽和内存容量有着前所未有的需求，由此催生了所谓的**“内存超级周期”**，对高带宽内存（HBM）和下一代DRAM产品的需求呈指数级增长。然而，在需求爆炸式增长的背后，是传统二维平面动态随机存取存储器（DRAM）面临的关键物理和工程限制。一、传统2D DRAM的物理极限 1.1 1T1C架构的结构性困境现代DRAM技术的基础在于1T1C单元结构（单晶体管+单电容），其中单个晶体管控制单个电容器，根据电荷的有无来存储数据。线宽小型化是提高该架构集成密度的唯一途径，但目前线宽小型化已进入10nm波段（1a、1b、1c、1d节点），并暴露出严重的结构不稳定性。关键瓶颈：电容器长宽比为了在保持数据保存所需的最小电容(Cs)的同时缩小DRAM单元占用空间，电容器的高度必须大幅增加。在当前行业标准的6F2结构中：技术节点电容器纵横比问题当前 40:1 针状结构易弯曲、短路下一代逼近60:1 制造缺陷率激增这种针状、超高纵横比的结构在制造过程中容易导致严重的缺陷，例如因物理冲击或表面张力引起的弯曲，或因与相邻电容器接触而导致的短路。 1.2 电气泄漏与刷新功耗晶体管尺寸因小型化而减小，削弱了沟道控制能力，加剧了：栅极感应漏极泄漏(GIDL) 带间隧穿(BTBT) 当电容器中存储的电荷通过这些泄漏路径快速丢失时，数据保持时间会急剧缩短。这缩短了防止数据丢失所需的刷新周期，因此，相当一部分内存带宽被分配给了刷新任务，成为导致**“内存墙”**现象的主要原因。二、过渡方案：VCT架构 2.1 4F2 VCT的结构优势在全面采用3D堆叠技术之前，存储器制造商正在引入**垂直通道晶体管(VCT)**作为中间步骤。 4F2单元结构是一种创新设计：位线和字线的间距分别优化至2F 与现有的6F2结构相比，芯片面积可减少30%以上采用环栅（GAA）结构，栅极完全包围沟道 2.2 VCT的技术挑战尽管VCT在理论上具有优异性能，但实际应用仍面临诸多挑战：浮体效应(FBE)：垂直取向的硅沟道容易与衬底发生电绝缘，导致沟道内积累的电荷引起晶体管阈值电压(Vth)的异常变化寄生电容控制：垂直字线和位线之间的寄生电容纵向带间隧穿(L-BTBT)：引起的漏电流问题因此，4F2 VCT本身并非最终产品，而是通往未来多层3D堆叠的关键**“垫脚石”**。三、3D DRAM：新的希望 3.1 基于1T1C的VS-DRAM **VS-DRAM（垂直堆叠式DRAM）**在保留存储电容的同时，将单元阵列垂直重复堆叠。与3D NAND闪存类似，这种架构垂直堆叠存储单元，旨在通过第三个轴来补充位密度。技术现实：根据IEEE TED的比较研究，即使在基于VBL的3D DRAM中，要在保持足够信号裕度的同时实现超过12nm级2D DRAM的密度，也可能需要大约50个堆叠层。 3.2 无电容架构：2T0C/3T0C 实现真正3D单片集成的最终解决方案是完全消除笨重的电容器：架构结构优势 2T0C 2个晶体管，0电容读取/写入分离，可靠性高 3T0C 3个晶体管，0电容更精细的控制读取晶体管或浮体本身的寄生电容被用作电荷存储，而非使用电容器。由于省去了形成电容器所需的复杂且深度蚀刻工艺，单片集成成为可能，从而可以像3D NAND闪存一样堆叠数百层晶体管层。 ...