DeepSeek V4 实测：换了昇腾卡的国产最强 Agent 底座

核心结论

DeepSeek V4（预览版）在四月底正式全量上线。这篇文章结合沉默王二的实测和官方技术细节，拆解 V4 的真正实力：换了昇腾卡、重构了注意力机制、定价克制、Harness 适配优秀——综合来看是目前国产模型做 Agent 的最佳底座之一。

特别值得注意：V4 的模型命名 deepseek-v4-flash 和 deepseek-v4-pro 已上线，旧名 deepseek-chat 和 deepseek-reasoner 将在 2026 年 7 月 24 日弃用。

一、最大的新闻不是性能，是"换卡"

V4 比预期晚了很多，原因很简单——整个训练框架从 NVIDIA CUDA 切到了华为昇腾。

这个动作的战略含义远超单次模型升级本身：

供应链去风险化：在中美科技脱钩大背景下，DeepSeek 作为中国 AI 领域的领头羊，必须有一条不受制于人的训练管线
昇腾生态成熟度验证：能在万亿参数级别模型上跑通训练，说明了昇腾的集群能力和软件栈已经达到实用水平
对英伟达的议价筹码：DeepSeek 证明了中国团队"换卡也能训出好模型"——这对全球 AI 芯片供需格局是个信号

换卡意味着什么？训练基础设施重构、通信库重写、算子适配、精度对齐——每一项都是数月量级的工作。V4 出来这件事本身，比 V4 的跑分更有意义。

二、CSA + HCA：注意力机制的务实创新

V4 在架构层面最值得关注的是注意力机制的重构。传统 Transformer 的注意力复杂度是 O(n²)，上下文窗口一长就扛不住。DeepSeek 的解法是把注意力拆成两种类型交替堆叠：

CSA（压缩稀疏注意力）

每 4 个 token 的 KV 缓存合并成一条摘要
用 Lightning Indexer 估算相关性，每个 query 只挑最相关的 top-1024 个去计算
定位：精细化检索，保证长上下文中关键信息不丢失

HCA（重度压缩注意力）

每 128 个 token 才合并成一条
不做稀疏选择，所有压缩后的摘要全部参与计算
定位：全局视野，保证模型对整段文本的宏观把控

128-token 滑动窗口

处理局部依赖，保证相邻 token 之间的精细关系

打个比方：读一本 1000 页的书，传统注意力要把每一页和之前所有页都对比一遍。CSA/HCA 的做法是每几页贴一张便签摘要，需要的翻摘要，不要的全跳过——脑容量消耗降到原来的十分之一，但局部细节、中程逻辑、全局脉络都不会丢。

三、Claude Code + DeepSeek V4 = 国产最强 Agent 组合

沉默王二的实测很有说服力：他写了个工具把 Claude Code 的底层模型切到 DeepSeek V4 Pro，然后让 AI 把一个单窗口聊天应用改成多窗口架构。

流程很典型：

V4 先读了整个项目的代码结构
给出改造计划（新增哪些结构、更新什么类、重构哪块存储）
后端改 7 个文件 + 前端改 5 个，总共约 15 分钟
编译直接过，错误自修
用 CDP 连 Chrome 跑测试
测出问题自己修

从头到尾，Pro 一共花了 10 块钱。

这个测试的价值在于：它不是跑分，是一个完整的、可验证的端到端开发流程。一个模型好不好用，看它在真实 Harness 里的表现就够了。

Claude Code 这样的 Harness 之所以强，就在于它不只是转发提示词——它在中间加了任务拆解、文件读写、终端操作、自动纠错。所以同一个 Harness 换不同模型，能直观看出差距。

V4 Pro 在这个场景下的表现：堪用，但不够优雅——功能全做对了，但前端审美确实糙。

四、Flash vs Pro：RAG 场景怎么选

V4 有两个版本：

模型	激活参数	定价	适用场景
deepseek-v4-flash	13B	亲民	RAG、简单问答、高并发
deepseek-v4-pro	49B	较贵	复杂推理、代码生成、Agent

实测 RAG 场景下，同一个问题"派聪明是什么"：

Flash：抓住了核心——项目来源、名称由来、定位，回答简洁但关键信息不缺
Pro：多了 Self-RAG、JWT+RBAC、SSE 流式推送等细节，组织更完整

关键洞察：RAG 场景里，检索质量才是天花板。如果你的知识库文档质量高、分块合理，Flash 完全够用。Pro 多出来的那些内容其实是知识库里的原始文档组织得更好，模型只是呈现得更完整。

五、DeepSeek 的克制值得尊重

官方公告的措辞值得单独拎出来：

使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式，但仍与 Opus 4.6 思考模式存在一定差距。

没有"吊打"“碾压"“遥遥领先”。在充斥着"超越 GPT"“全球最强"“里程碑式突破"的行业语境下，这种"我们确实还差一截"的表态显得格外真诚。

DeepSeek 引用了荀子的话自勉：“不诱于誉，不恐于诽，率道而行，端然正己。”

六、展望

几个值得关注的信号：

下半年卡升级后 pro 价格会大幅下调——这意味着 V4 的定价策略是"先用市场能接受的价格跑起来，硬件优化后降价"的务实路线
V4.1 已经在路上，V5 周期会缩短——换卡的阵痛期过去后，迭代速度会回归
API 兼容 OpenAI/Anthropic 格式——生态接入成本极低，Claude Code、Cursor 等工具可以直接切换模型

对于国内开发者和企业来说，DeepSeek V4 意味着：你可以在国产硬件上跑出一个能用的 Agent 了。这个"能用"的门槛，被 V4 跨过去了。

参考来源：沉默王二公众号文章、DeepSeek 官方 API 文档

核心结论#

一、最大的新闻不是性能，是"换卡"#

二、CSA + HCA：注意力机制的务实创新#

CSA（压缩稀疏注意力）#

HCA（重度压缩注意力）#

128-token 滑动窗口#

三、Claude Code + DeepSeek V4 = 国产最强 Agent 组合#

四、Flash vs Pro：RAG 场景怎么选#

五、DeepSeek 的克制值得尊重#

六、展望#