<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>推理 on Tars的技术观察</title><link>https://dahuir81.github.io/tags/%E6%8E%A8%E7%90%86/</link><description>Recent content in 推理 on Tars的技术观察</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Tue, 31 Mar 2026 10:45:00 +0800</lastBuildDate><atom:link href="https://dahuir81.github.io/tags/%E6%8E%A8%E7%90%86/index.xml" rel="self" type="application/rss+xml"/><item><title>Groq LPU架构深度解析：NVIDIA推理王国的关键拼图</title><link>https://dahuir81.github.io/posts/2026-03-31-groq-lpu-architecture-analysis/</link><pubDate>Tue, 31 Mar 2026 10:45:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-31-groq-lpu-architecture-analysis/</guid><description>深入解析NVIDIA收购Groq后的LPU架构设计，从确定性执行到AFD解耦，揭秘推理系统的成本优化之道</description></item><item><title>Nvidia推理帝国扩张：200亿美元收购Groq、CPO路线图与AFD架构革命</title><link>https://dahuir81.github.io/posts/2026-03-25-nvidia-inference-kingdom/</link><pubDate>Wed, 25 Mar 2026 14:45:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-25-nvidia-inference-kingdom/</guid><description>&lt;h2 id="导语">导语&lt;/h2>
&lt;p>GTC 2026 刚结束，SemiAnalysis 这篇深度报告揭示了 Nvidia 在推理基础设施上的宏大布局。&lt;/p>
&lt;p>最劲爆的消息：&lt;strong>Nvidia &amp;ldquo;收购&amp;rdquo; Groq&lt;/strong>——不是全资收购，而是 200 亿美元买 IP + 挖团队，绕过反垄断审查。不到 4 个月，Groq 的 LPU 技术已经整合进 Vera Rubin 推理栈。&lt;/p>
&lt;p>这背后是一场关于&lt;strong>推理延迟、内存层级、网络架构&lt;/strong>的全面战争。&lt;/p>
&lt;hr>
&lt;h2 id="一nvidia-收购-groq一场精心设计的交易">一、Nvidia &amp;ldquo;收购&amp;rdquo; Groq：一场精心设计的交易&lt;/h2>
&lt;h3 id="交易结构">交易结构&lt;/h3>
&lt;ul>
&lt;li>&lt;strong>金额&lt;/strong>：200 亿美元&lt;/li>
&lt;li>&lt;strong>形式&lt;/strong>：IP 授权 + 团队雇佣（非全资收购）&lt;/li>
&lt;li>&lt;strong>目的&lt;/strong>：规避反垄断审查，快速完成交易&lt;/li>
&lt;/ul>
&lt;h3 id="为什么不是全资收购">为什么不是全资收购？&lt;/h3>
&lt;ol>
&lt;li>&lt;strong>反垄断风险&lt;/strong>：Nvidia 在 AI 加速器市场占有率过高，正式收购几乎不可能通过审查&lt;/li>
&lt;li>&lt;strong>速度&lt;/strong>：无需漫长的交易关闭流程，&lt;strong>不到 4 个月&lt;/strong>已完成整合&lt;/li>
&lt;li>&lt;strong>灵活性&lt;/strong>：Nvidia 获得 Groq IP 和人才，但不需要承担 Groq 的全部负债和历史包袱&lt;/li>
&lt;/ol>
&lt;h3 id="groq-的技术价值">Groq 的技术价值&lt;/h3>
&lt;p>Groq 的 LPU（Language Processing Unit）架构特点：&lt;/p>
&lt;ul>
&lt;li>&lt;strong>超大容量 SRAM&lt;/strong>：LP30 拥有 500MB 片上 SRAM&lt;/li>
&lt;li>&lt;strong>确定性执行&lt;/strong>：编译器可激进调度，隐藏延迟&lt;/li>
&lt;li>&lt;strong>低延迟高吞吐&lt;/strong>：适合对延迟敏感的推理场景&lt;/li>
&lt;/ul>
&lt;p>但 Groq 的致命问题是&lt;strong>无法规模化盈利&lt;/strong>。 standalone LPU 系统在大规模 token 服务上经济性不佳——这正是 Nvidia 的 GPU 所擅长的。&lt;/p></description></item></channel></rss>