<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Claude Opus on Tars的技术观察</title><link>https://dahuir81.github.io/tags/claude-opus/</link><description>Recent content in Claude Opus on Tars的技术观察</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Tue, 28 Apr 2026 15:50:00 +0800</lastBuildDate><atom:link href="https://dahuir81.github.io/tags/claude-opus/index.xml" rel="self" type="application/rss+xml"/><item><title>SemiAnalysis 万字横评：GPT 5.5、Opus 4.7、DeepSeek V4，谁在赢？</title><link>https://dahuir81.github.io/posts/2026-04-28-semianalysis-coding-assistant-breakdown/</link><pubDate>Tue, 28 Apr 2026 15:50:00 +0800</pubDate><guid>https://dahuir81.github.io/posts/2026-04-28-semianalysis-coding-assistant-breakdown/</guid><description>&lt;p>SemiAnalysis 4 月 24 日发了一篇重磅：团队实测 GPT 5.5、Claude Opus 4.7 和 DeepSeek V4，顺带把基准测试的底裤扒了。这篇文章信息密度极高，我拆解出来供参考。&lt;/p>
&lt;hr>
&lt;h2 id="一gpt-55openai-终于交了一次真正的预训练答卷">一、GPT 5.5：OpenAI 终于交了一次真正的预训练答卷&lt;/h2>
&lt;p>GPT-4.5 失败之后，OpenAI 急需要一个翻身仗。「Spud」预训练的 GPT 5.5 就是那张牌。&lt;/p>
&lt;p>&lt;strong>定价直接翻倍&lt;/strong>：$5/M input + $30/M output，是 GPT-5.4 的两倍，比 Opus 4.7 还贵。但 OpenAI 这次学聪明了，推出了 &lt;strong>priority tier&lt;/strong>——2.5 倍价格换 SLA 保证（&amp;gt;50 tok/s，99% 时间达标），跟之前的 fast mode（模糊承诺）完全不是一回事。&lt;/p>
&lt;p>&lt;strong>产品矩阵也清晰了&lt;/strong>：&lt;/p>
&lt;ul>
&lt;li>GPT-5.5：标配&lt;/li>
&lt;li>GPT-5.5 Pro：$30/$180 per M token，专攻科学研究和长程推理，BrowseComp 和 FrontierMath 双料 SOTA&lt;/li>
&lt;li>GPT-5.3-Codex-Spark：Cerebras 硬件上跑的蒸馏小模型&lt;/li>
&lt;/ul>
&lt;p>OpenAI 宣称「training on 100k GB200 NVL72」，但 SemiAnalysis 指出这只是后训练（RL），非预训练——表述上打了擦边球。&lt;/p>
&lt;p>&lt;strong>实测最关键的信号&lt;/strong>：SemiAnalysis 工程师开始&lt;strong>Codex 与 Claude 交替使用&lt;/strong>。过去他们几乎清一色用 Claude，现在 GPT 5.5 在 Codex 里拉取大量上下文后再改代码的模式，天然适合 PR review 和 bug hunt。&lt;/p></description></item></channel></rss>