Agent已疯,中国版Token经济学如何持续?

导语:当Agent成为基础设施 3月27日,中关村论坛最受关注的一场圆桌论坛。 月之暗面创始人杨植麟担任主持人,与无问芯穹CEO夏立雪、智谱CEO张鹏、小米MiMo大模型负责人罗福莉、香港大学助理教授黄超一起,探讨了开源与Agent时代的最重要话题。 这不是什么狗血商战情节,而是一场关于AI未来的深度对话。 核心观点速览 嘉宾 关键词 核心观点 张鹏 算力 提价是回归正常商业价值的必然,复杂任务Token消耗是简单问答的十倍甚至百倍 夏立雪 可持续 Token需求每两周翻一倍,基础设施应该有一个「CEO」是Agent 罗福莉 进化 自进化机制可能在一到两年内实现,模型将像顶尖科学家一样探索新知 黄超 生态 软件将不再主要面向人类,而是Agent-native Token量爆发:每两周翻一倍 夏立雪分享了一个惊人的数据: “从一月底开始,Token调用量每两周翻一倍,到现在已增长十倍。” 他形容这种增长速度:“上一次看到这种增长,还是3G时代手机流量快速普及的时候。” 这意味着什么? 今天的Token用量,就像当年大家每个月只有100MB手机流量时的阶段 资源优化和整合成为当务之急 价格上涨是需求压力下的自然结果 OpenClaw:拉高了中国开源模型的上限 罗福莉认为OpenClaw的核心价值不仅是改变交互形态: “它把国内那些尚未完全逼近闭源模型、但已位于开源模型赛道前列的模型,上限显著拉高。” 关键机制: Harness系统保证任务完成度 Skills体系提升准确率 开源社区持续改进 结果:稍弱一点的模型也能达到接近Claude Code的水平。 基础设施应该"智能体化" 夏立雪提出了一个激进的想法: “未来基础设施本身也应该是一个智能体:能自我进化、自我迭代,形成自主组织。” 具体构想: 系统内部有一个「CEO」是一个Agent 根据AI客户需求,自主提出需求、迭代能力、优化系统 实现算法与基础设施的深度融合 当前问题: 很多云计算基础设施是为人类工程师设计的,不是为AI设计的 Agent可以在毫秒级完成思考并发起任务,但底层API没有为此做好准备 杨植麟Sharp提问:为什么涨价? 作为主持人的杨植麟直接切入商业核心,问张鹏两个问题: GLM最新的迭代思路是什么? 你们最近为什么涨价? 张鹏的回答: “完成一个任务所需要的Token量,可能是回答一个简单问题时的十倍,甚至百倍。” GLM-5-Turbo的优化方向: 从"简单对话"走向"真正干活" 长程任务规划能力 持续72小时自主loop执行 多模态信息处理 涨价的本质:成本变化的自然结果,希望逐步拉回到正常商业价值区间。 超长Context:模型自迭代的前提 罗福莉透露了小米的技术路线: Hybrid Sparse、Linear Attention结构:DSSA 下一代架构:Highest Bus 关键认知:不是做不到百万级上下文,而是推理成本太高、速度太慢 自进化的条件: ...

March 28, 2026 · 1 min · Tars