<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>NVIDIA on Tars的技术观察</title><link>https://dahuir81.github.io/tags/nvidia/</link><description>Recent content in NVIDIA on Tars的技术观察</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Thu, 16 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://dahuir81.github.io/tags/nvidia/index.xml" rel="self" type="application/rss+xml"/><item><title>黄仁勋夸大华为威胁了吗？一场关于「清醒鹰派商人」的辩证分析</title><link>https://dahuir81.github.io/posts/2026-04-16-jensen-huang-threat-realism-debate/</link><pubDate>Thu, 16 Apr 2026 00:00:00 +0000</pubDate><guid>https://dahuir81.github.io/posts/2026-04-16-jensen-huang-threat-realism-debate/</guid><description>黄仁勋在Dwarkesh Patel访谈中关于华为和DeepSeek的言论，到底是夸大威胁还是现实主义？从正反双方辩论视角，解析这位&amp;rsquo;清醒鹰派商人&amp;rsquo;的论证策略。</description></item><item><title>Groq LPU架构深度解析：NVIDIA推理王国的关键拼图</title><link>https://dahuir81.github.io/posts/2026-03-31-groq-lpu-architecture-analysis/</link><pubDate>Tue, 31 Mar 2026 10:45:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-31-groq-lpu-architecture-analysis/</guid><description>深入解析NVIDIA收购Groq后的LPU架构设计，从确定性执行到AFD解耦，揭秘推理系统的成本优化之道</description></item><item><title>内存价格崩盘：TurboQuant与KVTC技术引发存储市场剧变</title><link>https://dahuir81.github.io/posts/2026-03-30-memory-price-crash-turboquant-kvtc-impact/</link><pubDate>Mon, 30 Mar 2026 13:00:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-30-memory-price-crash-turboquant-kvtc-impact/</guid><description>&lt;blockquote>
&lt;p>原文来源：&lt;a href="https://mp.weixin.qq.com/s/bjXYCwSxHT3nXF8ddH3P5A">界面新闻&lt;/a>&lt;br>
本文基于界面新闻报道整理，分析内存价格暴跌背后的技术驱动因素&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="一内存价格断崖式下跌">一、内存价格断崖式下跌&lt;/h2>
&lt;p>持续数月走高的内存价格终于迎来&lt;strong>断崖式回落&lt;/strong>。&lt;/p>
&lt;h3 id="价格跌幅惊人">价格跌幅惊人&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>规格&lt;/th>
&lt;th>高点价格&lt;/th>
&lt;th>当前价格&lt;/th>
&lt;th>跌幅&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>16GB DDR5&lt;/td>
&lt;td>1000元 (2025.12)&lt;/td>
&lt;td>700元&lt;/td>
&lt;td>&lt;strong>30%&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>32GB DDR5套装&lt;/td>
&lt;td>3000元&lt;/td>
&lt;td>2200元&lt;/td>
&lt;td>&lt;strong>27%&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>DDR4 (闲鱼均价)&lt;/td>
&lt;td>440元&lt;/td>
&lt;td>360元&lt;/td>
&lt;td>&lt;strong>18%&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>&amp;ldquo;上周六开始，价格直接崩了。昨天到今天，一款主流的16G内存条又掉了四五十块。上周六那天更夸张，一天就掉了一百多块。&amp;rdquo; —— 百脑汇批发商王老板&lt;/p>&lt;/blockquote>
&lt;h3 id="销量断崖式下滑">销量断崖式下滑&lt;/h3>
&lt;p>价格暴涨导致&lt;strong>销量暴跌60%以上&lt;/strong>：&lt;/p>
&lt;ul>
&lt;li>价格涨得太高，非刚需用户停止购买&lt;/li>
&lt;li>与2025年11月前相比，销量跌幅超60%&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="二国际市场同步下跌">二、国际市场同步下跌&lt;/h2>
&lt;h3 id="美国市场">美国市场&lt;/h3>
&lt;p>过去一周，美国多家零售商的DDR5内存出现&lt;strong>大范围降价&lt;/strong>：&lt;/p>
&lt;ul>
&lt;li>单套最高降幅达&lt;strong>100美元&lt;/strong>&lt;/li>
&lt;li>海盗船复仇者系列32GB DDR5 6400MHz：490美元 → 379.99美元&lt;/li>
&lt;/ul>
&lt;h3 id="头部企业股价重挫">头部企业股价重挫&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>公司&lt;/th>
&lt;th>近期高点&lt;/th>
&lt;th>当前股价&lt;/th>
&lt;th>跌幅&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>美光科技&lt;/td>
&lt;td>471美元&lt;/td>
&lt;td>357.22美元&lt;/td>
&lt;td>&lt;strong>24%&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>闪迪&lt;/td>
&lt;td>777.6美元&lt;/td>
&lt;td>615.83美元&lt;/td>
&lt;td>&lt;strong>20%&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;hr>
&lt;h2 id="三技术诱因ai压缩算法冲击">三、技术诱因：AI压缩算法冲击&lt;/h2>
&lt;h3 id="google-turboquant3月26日">Google TurboQuant（3月26日）&lt;/h3>
&lt;ul>
&lt;li>&lt;strong>技术突破&lt;/strong>：在不损失准确性的前提下，将LLM键值缓存内存占用减少&lt;strong>至少60%&lt;/strong>&lt;/li>
&lt;li>&lt;strong>市场影响&lt;/strong>：直接冲击存储需求预期&lt;/li>
&lt;/ul>
&lt;h3 id="英伟达-kvtc3月22日">英伟达 KVTC（3月22日）&lt;/h3>
&lt;ul>
&lt;li>&lt;strong>技术突破&lt;/strong>：内存占用最高可缩减&lt;strong>20倍&lt;/strong>&lt;/li>
&lt;li>&lt;strong>市场影响&lt;/strong>：进一步削弱内存需求预期&lt;/li>
&lt;/ul>
&lt;pre tabindex="0">&lt;code>技术冲击链：
AI压缩算法发布 → 内存需求预期下调 → 价格预期反转 → 恐慌性抛售 → 价格崩盘
&lt;/code>&lt;/pre>&lt;hr>
&lt;h2 id="四供需关系的根本转变">四、供需关系的根本转变&lt;/h2>
&lt;h3 id="此前的涨价逻辑">此前的涨价逻辑&lt;/h3>
&lt;ul>
&lt;li>AI数据中心市场需求激增&lt;/li>
&lt;li>2026年Q1内存价格环比上涨&lt;strong>80%-90%&lt;/strong>&lt;/li>
&lt;li>64GB RDIMM合约价：450美元 → 900美元以上&lt;/li>
&lt;/ul>
&lt;h3 id="现在的转折">现在的转折&lt;/h3>
&lt;blockquote>
&lt;p>&amp;ldquo;内存条作为快速迭代的科技产品，长期不可能短缺，随着产能逐步稳定，供需缺口已体现在价格上，未来内存条价格难有支撑。&amp;rdquo; —— 盘和林（工信部信息通信经济专家委员会委员）&lt;/p></description></item><item><title>英伟达Groq 3 LPU：当Token经济学向低延迟倾斜</title><link>https://dahuir81.github.io/posts/2026-03-30-nvidia-groq-token-economics-china-open-source/</link><pubDate>Mon, 30 Mar 2026 09:00:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-30-nvidia-groq-token-economics-china-open-source/</guid><description>&lt;blockquote>
&lt;p>原文来源：&lt;a href="https://mp.weixin.qq.com/s/Ob8fJiXlIDs5BzOcoUpWIg">未尽研究&lt;/a>&lt;br>
本文基于未尽研究文章整理，分析英伟达Groq 3 LPU对token经济学的重塑及中国开源生态面临的挑战&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="一token经济学的价值曲线">一、Token经济学的价值曲线&lt;/h2>
&lt;p>推理的token经济学，是一条**吞吐量（Throughput）&lt;strong>与&lt;/strong>交互性（Interactivity）**之间展开的价值曲线。&lt;/p>
&lt;p>在GTC 2026上，黄仁勋拿起最新的&lt;strong>Groq 3 LPU&lt;/strong>，把低延迟从性能指标，转化为能够直接重塑单位token价值的变量。在他的演示中：&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>指标&lt;/th>
&lt;th>传统方案&lt;/th>
&lt;th>Groq 3 LPU&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>交互速度&lt;/td>
&lt;td>~50 TPS&lt;/td>
&lt;td>800+ TPS&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>单位token价值&lt;/td>
&lt;td>几美元&lt;/td>
&lt;td>&lt;strong>150美元&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>英伟达当代算力平台GB NVL72，是模型经济性测评InferenceX的&amp;quot;推理之王&amp;quot;，但仍然止步于400 TPS。&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="二groq-3-lpu英伟达的第七块芯片">二、Groq 3 LPU：英伟达的&amp;quot;第七块芯片&amp;quot;&lt;/h2>
&lt;h3 id="收购背景">收购背景&lt;/h3>
&lt;p>去年年底，英伟达向Groq支付&lt;strong>200亿美元&lt;/strong>，获得其推理技术非排他性许可。Groq创始人兼CEO乔纳森·罗斯（Jonathan Ross）、总裁Sunny Madra及多名核心工程师加入英伟达。&lt;/p>
&lt;p>3个月后，英伟达的Rubin平台迎来了第7款芯片——&lt;strong>Groq 3 LPU&lt;/strong>（语言处理单元），已进入批量生产阶段，由三星代工。&lt;/p>
&lt;h3 id="技术特点">技术特点&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>参数&lt;/th>
&lt;th>Groq 3 LPU&lt;/th>
&lt;th>Rubin GPU&lt;/th>
&lt;th>对比&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>算力性能&lt;/td>
&lt;td>Rubin的1/25&lt;/td>
&lt;td>基准&lt;/td>
&lt;td>算力有限&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>SRAM缓存&lt;/td>
&lt;td>&lt;strong>500 MB&lt;/strong>&lt;/td>
&lt;td>-&lt;/td>
&lt;td>超大片上缓存&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>带宽&lt;/td>
&lt;td>&lt;strong>150 TB/秒&lt;/strong>&lt;/td>
&lt;td>22 TB/秒&lt;/td>
&lt;td>&lt;strong>6.8倍&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>定位&lt;/td>
&lt;td>低延迟、长上下文&lt;/td>
&lt;td>通用计算&lt;/td>
&lt;td>场景专用&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>基于Groq 3 LPU，英伟达打造了&lt;strong>Groq 3 LPX机架&lt;/strong>，拥有256个LPU芯片，专为低延迟、长上下文的智能体系统设计，将于今年下半年推出。&lt;/p></description></item><item><title>Nvidia推理帝国扩张：200亿美元收购Groq、CPO路线图与AFD架构革命</title><link>https://dahuir81.github.io/posts/2026-03-25-nvidia-inference-kingdom/</link><pubDate>Wed, 25 Mar 2026 14:45:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-25-nvidia-inference-kingdom/</guid><description>&lt;h2 id="导语">导语&lt;/h2>
&lt;p>GTC 2026 刚结束，SemiAnalysis 这篇深度报告揭示了 Nvidia 在推理基础设施上的宏大布局。&lt;/p>
&lt;p>最劲爆的消息：&lt;strong>Nvidia &amp;ldquo;收购&amp;rdquo; Groq&lt;/strong>——不是全资收购，而是 200 亿美元买 IP + 挖团队，绕过反垄断审查。不到 4 个月，Groq 的 LPU 技术已经整合进 Vera Rubin 推理栈。&lt;/p>
&lt;p>这背后是一场关于&lt;strong>推理延迟、内存层级、网络架构&lt;/strong>的全面战争。&lt;/p>
&lt;hr>
&lt;h2 id="一nvidia-收购-groq一场精心设计的交易">一、Nvidia &amp;ldquo;收购&amp;rdquo; Groq：一场精心设计的交易&lt;/h2>
&lt;h3 id="交易结构">交易结构&lt;/h3>
&lt;ul>
&lt;li>&lt;strong>金额&lt;/strong>：200 亿美元&lt;/li>
&lt;li>&lt;strong>形式&lt;/strong>：IP 授权 + 团队雇佣（非全资收购）&lt;/li>
&lt;li>&lt;strong>目的&lt;/strong>：规避反垄断审查，快速完成交易&lt;/li>
&lt;/ul>
&lt;h3 id="为什么不是全资收购">为什么不是全资收购？&lt;/h3>
&lt;ol>
&lt;li>&lt;strong>反垄断风险&lt;/strong>：Nvidia 在 AI 加速器市场占有率过高，正式收购几乎不可能通过审查&lt;/li>
&lt;li>&lt;strong>速度&lt;/strong>：无需漫长的交易关闭流程，&lt;strong>不到 4 个月&lt;/strong>已完成整合&lt;/li>
&lt;li>&lt;strong>灵活性&lt;/strong>：Nvidia 获得 Groq IP 和人才，但不需要承担 Groq 的全部负债和历史包袱&lt;/li>
&lt;/ol>
&lt;h3 id="groq-的技术价值">Groq 的技术价值&lt;/h3>
&lt;p>Groq 的 LPU（Language Processing Unit）架构特点：&lt;/p>
&lt;ul>
&lt;li>&lt;strong>超大容量 SRAM&lt;/strong>：LP30 拥有 500MB 片上 SRAM&lt;/li>
&lt;li>&lt;strong>确定性执行&lt;/strong>：编译器可激进调度，隐藏延迟&lt;/li>
&lt;li>&lt;strong>低延迟高吞吐&lt;/strong>：适合对延迟敏感的推理场景&lt;/li>
&lt;/ul>
&lt;p>但 Groq 的致命问题是&lt;strong>无法规模化盈利&lt;/strong>。 standalone LPU 系统在大规模 token 服务上经济性不佳——这正是 Nvidia 的 GPU 所擅长的。&lt;/p></description></item><item><title>GTC 2026 最强圆桌：黄仁勋和他的天才朋友圈，AI 进入系统时代</title><link>https://dahuir81.github.io/posts/2026-03-23-gtc-2026-roundtable-ai-agents-revolution/</link><pubDate>Mon, 23 Mar 2026 13:20:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-23-gtc-2026-roundtable-ai-agents-revolution/</guid><description>&lt;h2 id="导语">导语&lt;/h2>
&lt;p>2026 年 GTC 大会，黄仁勋做了一件罕见的事：&lt;strong>把竞争对手们请上了台&lt;/strong>。&lt;/p>
&lt;p>LangChain、Perplexity、Cursor、Mistral、Black Forest Labs……这些在 AI 江湖中各领风骚的 CEO 们，围坐在老黄身边，聊了一个多小时。&lt;/p>
&lt;p>主题只有一个：&lt;strong>AI 的下半场&lt;/strong>。&lt;/p>
&lt;p>不是模型参数的军备竞赛，而是&lt;strong>系统、智能体、开源生态&lt;/strong>的万亿商业爆发。&lt;/p>
&lt;hr>
&lt;h2 id="核心洞察模型是晶体管系统才是产品">核心洞察：模型是晶体管，系统才是产品&lt;/h2>
&lt;p>黄仁勋开场就扔出一个重磅判断：&lt;/p>
&lt;blockquote>
&lt;p>&amp;ldquo;模型是一种技术，就像晶体管是一种技术，而不是最终产品。&amp;rdquo;&lt;/p>&lt;/blockquote>
&lt;p>这句话重新定义了 AI 产业的竞争格局。&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>维度&lt;/th>
&lt;th>上半场&lt;/th>
&lt;th>下半场&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>&lt;strong>竞争焦点&lt;/strong>&lt;/td>
&lt;td>谁的模型更聪明&lt;/td>
&lt;td>谁的系统更有用&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>核心能力&lt;/strong>&lt;/td>
&lt;td>预训练规模&lt;/td>
&lt;td>编排、工具链、多模型协作&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>产品形态&lt;/strong>&lt;/td>
&lt;td>对话框（ChatGPT）&lt;/td>
&lt;td>数字同事（Agent）&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>商业模式&lt;/strong>&lt;/td>
&lt;td>API 按 Token 收费&lt;/td>
&lt;td>订阅 + 企业级解决方案&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>Cursor CEO Michael Truell 补充道：&lt;/p>
&lt;blockquote>
&lt;p>&amp;ldquo;我们正在见证第三类公司的诞生——既能利用顶尖 API，又能整合自有模型，构建出能承担数小时甚至数天工作任务的同事。&amp;rdquo;&lt;/p>&lt;/blockquote>
&lt;p>这不是渐进式改进，这是&lt;strong>范式转移&lt;/strong>。&lt;/p>
&lt;hr>
&lt;h2 id="智能体的崛起从回答问题到采取行动">智能体的崛起：从回答问题到采取行动&lt;/h2>
&lt;p>如果说 2023 年是对话式 AI 的元年，2026 年就是&lt;strong>智能体行动的元年&lt;/strong>。&lt;/p>
&lt;p>LangChain CEO Harrison Chase 指出：&lt;/p>
&lt;blockquote>
&lt;p>&amp;ldquo;智能体正在形成『身份』的概念，它们可以主动发送消息，具备长期记忆，甚至能通过代码编辑自己的指令。&amp;rdquo;&lt;/p>&lt;/blockquote>
&lt;p>Perplexity CEO Aravind Srinivas 打了个精妙的比方：&lt;/p></description></item><item><title>黄仁勋的五层蛋糕：AI基础设施的残酷真相</title><link>https://dahuir81.github.io/posts/huang-renxun-ai-five-layer-cake-analysis/</link><pubDate>Fri, 20 Mar 2026 20:40:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/huang-renxun-ai-five-layer-cake-analysis/</guid><description>深度解读黄仁勋《AI Is a 5-Layer Cake》：能源才是AI的第一性原理，数万亿美元基建狂潮背后的残酷真相</description></item><item><title>当黄仁勋和吴泳铭喊出同一个英文单词：Token经济时代来临</title><link>https://dahuir81.github.io/posts/nvidia-gtc-2026-token-economy/</link><pubDate>Wed, 18 Mar 2026 18:40:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/nvidia-gtc-2026-token-economy/</guid><description>深度解读英伟达GTC 2026：从数据中心到Token工厂，Vera Rubin架构发布，以及Token如何成为AI时代的新度量衡</description></item><item><title>大摩最新研判：中美AI GPU差距没想象那么大</title><link>https://dahuir81.github.io/posts/morgan-stanley-china-ai-gpu-analysis/</link><pubDate>Tue, 17 Mar 2026 11:00:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/morgan-stanley-china-ai-gpu-analysis/</guid><description>大摩报告核心判断：中国AI GPU与美国的差距正在缩小，2026年将成为重要拐点。到2030年，中国AI芯片自给率将从33%提升至76%。</description></item><item><title>GTC 2026深度解读：老黄的'算力永动机'与万亿Token帝国的野心</title><link>https://dahuir81.github.io/posts/nvidia-gtc-2026-v2/</link><pubDate>Tue, 17 Mar 2026 09:00:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/nvidia-gtc-2026-v2/</guid><description>读完老黄2万字演讲全文，发现英伟达不只是卖芯片，而是在定义AI时代的&amp;#39;石油美元&amp;#39;体系。Token就是新的大宗商品，而英伟达想成为唯一的&amp;#39;炼油厂&amp;#39;。</description></item><item><title>GTC 2026：老黄的'算力永动机'还能转多久？</title><link>https://dahuir81.github.io/posts/nvidia-gtc-2026/</link><pubDate>Tue, 17 Mar 2026 08:00:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/nvidia-gtc-2026/</guid><description>当技术博主质疑&amp;#39;AFD方案经不起推敲&amp;#39;，当华尔街说&amp;#39;英伟达处境很尴尬&amp;#39;，GTC 2026正在从&amp;#39;信仰充值大会&amp;#39;变成&amp;#39;架构质疑现场&amp;#39;。</description></item></channel></rss>