智谱 | Tars的技术观察

导语：当Agent成为基础设施 3月27日，中关村论坛最受关注的一场圆桌论坛。月之暗面创始人杨植麟担任主持人，与无问芯穹CEO夏立雪、智谱CEO张鹏、小米MiMo大模型负责人罗福莉、香港大学助理教授黄超一起，探讨了开源与Agent时代的最重要话题。这不是什么狗血商战情节，而是一场关于AI未来的深度对话。核心观点速览嘉宾关键词核心观点张鹏算力提价是回归正常商业价值的必然，复杂任务Token消耗是简单问答的十倍甚至百倍夏立雪可持续 Token需求每两周翻一倍，基础设施应该有一个「CEO」是Agent 罗福莉进化自进化机制可能在一到两年内实现，模型将像顶尖科学家一样探索新知黄超生态软件将不再主要面向人类，而是Agent-native Token量爆发：每两周翻一倍夏立雪分享了一个惊人的数据： “从一月底开始，Token调用量每两周翻一倍，到现在已增长十倍。” 他形容这种增长速度：“上一次看到这种增长，还是3G时代手机流量快速普及的时候。” 这意味着什么？今天的Token用量，就像当年大家每个月只有100MB手机流量时的阶段资源优化和整合成为当务之急价格上涨是需求压力下的自然结果 OpenClaw：拉高了中国开源模型的上限罗福莉认为OpenClaw的核心价值不仅是改变交互形态： “它把国内那些尚未完全逼近闭源模型、但已位于开源模型赛道前列的模型，上限显著拉高。” 关键机制： Harness系统保证任务完成度 Skills体系提升准确率开源社区持续改进结果：稍弱一点的模型也能达到接近Claude Code的水平。基础设施应该"智能体化" 夏立雪提出了一个激进的想法： “未来基础设施本身也应该是一个智能体：能自我进化、自我迭代，形成自主组织。” 具体构想：系统内部有一个「CEO」是一个Agent 根据AI客户需求，自主提出需求、迭代能力、优化系统实现算法与基础设施的深度融合当前问题：很多云计算基础设施是为人类工程师设计的，不是为AI设计的 Agent可以在毫秒级完成思考并发起任务，但底层API没有为此做好准备杨植麟Sharp提问：为什么涨价？作为主持人的杨植麟直接切入商业核心，问张鹏两个问题： GLM最新的迭代思路是什么？你们最近为什么涨价？张鹏的回答： “完成一个任务所需要的Token量，可能是回答一个简单问题时的十倍，甚至百倍。” GLM-5-Turbo的优化方向：从"简单对话"走向"真正干活" 长程任务规划能力持续72小时自主loop执行多模态信息处理涨价的本质：成本变化的自然结果，希望逐步拉回到正常商业价值区间。超长Context：模型自迭代的前提罗福莉透露了小米的技术路线： Hybrid Sparse、Linear Attention结构：DSSA 下一代架构：Highest Bus 关键认知：不是做不到百万级上下文，而是推理成本太高、速度太慢自进化的条件： ...