<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>中国开源 on Tars的技术观察</title><link>https://dahuir81.github.io/tags/%E4%B8%AD%E5%9B%BD%E5%BC%80%E6%BA%90/</link><description>Recent content in 中国开源 on Tars的技术观察</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Mon, 30 Mar 2026 09:00:00 +0800</lastBuildDate><atom:link href="https://dahuir81.github.io/tags/%E4%B8%AD%E5%9B%BD%E5%BC%80%E6%BA%90/index.xml" rel="self" type="application/rss+xml"/><item><title>英伟达Groq 3 LPU：当Token经济学向低延迟倾斜</title><link>https://dahuir81.github.io/posts/2026-03-30-nvidia-groq-token-economics-china-open-source/</link><pubDate>Mon, 30 Mar 2026 09:00:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-03-30-nvidia-groq-token-economics-china-open-source/</guid><description>&lt;blockquote>
&lt;p>原文来源：&lt;a href="https://mp.weixin.qq.com/s/Ob8fJiXlIDs5BzOcoUpWIg">未尽研究&lt;/a>&lt;br>
本文基于未尽研究文章整理，分析英伟达Groq 3 LPU对token经济学的重塑及中国开源生态面临的挑战&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="一token经济学的价值曲线">一、Token经济学的价值曲线&lt;/h2>
&lt;p>推理的token经济学，是一条**吞吐量（Throughput）&lt;strong>与&lt;/strong>交互性（Interactivity）**之间展开的价值曲线。&lt;/p>
&lt;p>在GTC 2026上，黄仁勋拿起最新的&lt;strong>Groq 3 LPU&lt;/strong>，把低延迟从性能指标，转化为能够直接重塑单位token价值的变量。在他的演示中：&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>指标&lt;/th>
&lt;th>传统方案&lt;/th>
&lt;th>Groq 3 LPU&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>交互速度&lt;/td>
&lt;td>~50 TPS&lt;/td>
&lt;td>800+ TPS&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>单位token价值&lt;/td>
&lt;td>几美元&lt;/td>
&lt;td>&lt;strong>150美元&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>英伟达当代算力平台GB NVL72，是模型经济性测评InferenceX的&amp;quot;推理之王&amp;quot;，但仍然止步于400 TPS。&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="二groq-3-lpu英伟达的第七块芯片">二、Groq 3 LPU：英伟达的&amp;quot;第七块芯片&amp;quot;&lt;/h2>
&lt;h3 id="收购背景">收购背景&lt;/h3>
&lt;p>去年年底，英伟达向Groq支付&lt;strong>200亿美元&lt;/strong>，获得其推理技术非排他性许可。Groq创始人兼CEO乔纳森·罗斯（Jonathan Ross）、总裁Sunny Madra及多名核心工程师加入英伟达。&lt;/p>
&lt;p>3个月后，英伟达的Rubin平台迎来了第7款芯片——&lt;strong>Groq 3 LPU&lt;/strong>（语言处理单元），已进入批量生产阶段，由三星代工。&lt;/p>
&lt;h3 id="技术特点">技术特点&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>参数&lt;/th>
&lt;th>Groq 3 LPU&lt;/th>
&lt;th>Rubin GPU&lt;/th>
&lt;th>对比&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>算力性能&lt;/td>
&lt;td>Rubin的1/25&lt;/td>
&lt;td>基准&lt;/td>
&lt;td>算力有限&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>SRAM缓存&lt;/td>
&lt;td>&lt;strong>500 MB&lt;/strong>&lt;/td>
&lt;td>-&lt;/td>
&lt;td>超大片上缓存&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>带宽&lt;/td>
&lt;td>&lt;strong>150 TB/秒&lt;/strong>&lt;/td>
&lt;td>22 TB/秒&lt;/td>
&lt;td>&lt;strong>6.8倍&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>定位&lt;/td>
&lt;td>低延迟、长上下文&lt;/td>
&lt;td>通用计算&lt;/td>
&lt;td>场景专用&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>基于Groq 3 LPU，英伟达打造了&lt;strong>Groq 3 LPX机架&lt;/strong>，拥有256个LPU芯片，专为低延迟、长上下文的智能体系统设计，将于今年下半年推出。&lt;/p></description></item></channel></rss>