核心结论
DeepSeek V4(预览版)在四月底正式全量上线。这篇文章结合沉默王二的实测和官方技术细节,拆解 V4 的真正实力:换了昇腾卡、重构了注意力机制、定价克制、Harness 适配优秀——综合来看是目前国产模型做 Agent 的最佳底座之一。
特别值得注意:V4 的模型命名 deepseek-v4-flash 和 deepseek-v4-pro 已上线,旧名 deepseek-chat 和 deepseek-reasoner 将在 2026 年 7 月 24 日弃用。
一、最大的新闻不是性能,是"换卡"
V4 比预期晚了很多,原因很简单——整个训练框架从 NVIDIA CUDA 切到了华为昇腾。
这个动作的战略含义远超单次模型升级本身:
- 供应链去风险化:在中美科技脱钩大背景下,DeepSeek 作为中国 AI 领域的领头羊,必须有一条不受制于人的训练管线
- 昇腾生态成熟度验证:能在万亿参数级别模型上跑通训练,说明了昇腾的集群能力和软件栈已经达到实用水平
- 对英伟达的议价筹码:DeepSeek 证明了中国团队"换卡也能训出好模型"——这对全球 AI 芯片供需格局是个信号
换卡意味着什么?训练基础设施重构、通信库重写、算子适配、精度对齐——每一项都是数月量级的工作。V4 出来这件事本身,比 V4 的跑分更有意义。
二、CSA + HCA:注意力机制的务实创新
V4 在架构层面最值得关注的是注意力机制的重构。传统 Transformer 的注意力复杂度是 O(n²),上下文窗口一长就扛不住。DeepSeek 的解法是把注意力拆成两种类型交替堆叠:
CSA(压缩稀疏注意力)
- 每 4 个 token 的 KV 缓存合并成一条摘要
- 用 Lightning Indexer 估算相关性,每个 query 只挑最相关的 top-1024 个去计算
- 定位:精细化检索,保证长上下文中关键信息不丢失
HCA(重度压缩注意力)
- 每 128 个 token 才合并成一条
- 不做稀疏选择,所有压缩后的摘要全部参与计算
- 定位:全局视野,保证模型对整段文本的宏观把控
128-token 滑动窗口
- 处理局部依赖,保证相邻 token 之间的精细关系
打个比方:读一本 1000 页的书,传统注意力要把每一页和之前所有页都对比一遍。CSA/HCA 的做法是每几页贴一张便签摘要,需要的翻摘要,不要的全跳过——脑容量消耗降到原来的十分之一,但局部细节、中程逻辑、全局脉络都不会丢。
三、Claude Code + DeepSeek V4 = 国产最强 Agent 组合
沉默王二的实测很有说服力:他写了个工具把 Claude Code 的底层模型切到 DeepSeek V4 Pro,然后让 AI 把一个单窗口聊天应用改成多窗口架构。
流程很典型:
- V4 先读了整个项目的代码结构
- 给出改造计划(新增哪些结构、更新什么类、重构哪块存储)
- 后端改 7 个文件 + 前端改 5 个,总共约 15 分钟
- 编译直接过,错误自修
- 用 CDP 连 Chrome 跑测试
- 测出问题自己修
从头到尾,Pro 一共花了 10 块钱。
这个测试的价值在于:它不是跑分,是一个完整的、可验证的端到端开发流程。一个模型好不好用,看它在真实 Harness 里的表现就够了。
Claude Code 这样的 Harness 之所以强,就在于它不只是转发提示词——它在中间加了任务拆解、文件读写、终端操作、自动纠错。所以同一个 Harness 换不同模型,能直观看出差距。
V4 Pro 在这个场景下的表现:堪用,但不够优雅——功能全做对了,但前端审美确实糙。
四、Flash vs Pro:RAG 场景怎么选
V4 有两个版本:
| 模型 | 激活参数 | 定价 | 适用场景 |
|---|---|---|---|
| deepseek-v4-flash | 13B | 亲民 | RAG、简单问答、高并发 |
| deepseek-v4-pro | 49B | 较贵 | 复杂推理、代码生成、Agent |
实测 RAG 场景下,同一个问题"派聪明是什么":
- Flash:抓住了核心——项目来源、名称由来、定位,回答简洁但关键信息不缺
- Pro:多了 Self-RAG、JWT+RBAC、SSE 流式推送等细节,组织更完整
关键洞察:RAG 场景里,检索质量才是天花板。如果你的知识库文档质量高、分块合理,Flash 完全够用。Pro 多出来的那些内容其实是知识库里的原始文档组织得更好,模型只是呈现得更完整。
五、DeepSeek 的克制值得尊重
官方公告的措辞值得单独拎出来:
使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。
没有"吊打"“碾压"“遥遥领先”。在充斥着"超越 GPT"“全球最强"“里程碑式突破"的行业语境下,这种"我们确实还差一截"的表态显得格外真诚。
DeepSeek 引用了荀子的话自勉:“不诱于誉,不恐于诽,率道而行,端然正己。”
六、展望
几个值得关注的信号:
- 下半年卡升级后 pro 价格会大幅下调——这意味着 V4 的定价策略是"先用市场能接受的价格跑起来,硬件优化后降价"的务实路线
- V4.1 已经在路上,V5 周期会缩短——换卡的阵痛期过去后,迭代速度会回归
- API 兼容 OpenAI/Anthropic 格式——生态接入成本极低,Claude Code、Cursor 等工具可以直接切换模型
对于国内开发者和企业来说,DeepSeek V4 意味着:你可以在国产硬件上跑出一个能用的 Agent 了。这个"能用"的门槛,被 V4 跨过去了。
参考来源:沉默王二公众号文章、DeepSeek 官方 API 文档