云算力涨价潮:当GPU从贬值预期走向供不应求

一、Michael Burry 的 3 年预言与市场的 40% 反转 2025 年 11 月,以成功预测 2008 年次贷危机而闻名的"大空头"Michael Burry 做出了一个大胆的判断:看空英伟达。他的核心逻辑简单直接——GPU 的生命周期只有 2-3 年,随着新一代芯片的推出,旧卡将迅速贬值,英伟达的高估值难以为继。 这个判断在当时就有争议,但也不无道理。毕竟,科技行业的摩尔定律历来如此:新产品推出,旧产品迅速过时。H100 在 2022 年发布,按照 3 年生命周期的逻辑,到 2025 年应该开始走下坡路。更何况,英伟达已经推出了性能更强、成本更低的 Blackwell 系列。 然而,仅仅 4 个月后,市场给出了截然相反的答案。 根据 GPU 租赁市场的最新数据,H100 的一年期租赁价格从 2025 年 10 月的 $1.67/小时/GPU 暴涨至 2026 年 2 月的 $2.35/小时/GPU,涨幅高达 40%。这张已经"服役"近 4 年的老卡,不仅没有贬值,反而出现了供不应求的局面——所有 GPU 类型的按需租赁容量完全售罄,到 2026 年 8-9 月的所有新增产能已被预订一空。 市场的疯狂程度超出想象: 客户正在争相以 $14/小时/GPU 的价格购买 AWS 的 p6-b200 现货实例 一些 Neocloud 巨头不再出售单节点 H100 正在以 2-3 年前签约时的完全相同的价格续约,一些 H100 合同甚至续约到 2028 年,为期 4 年 寻找哪怕 8 个节点(64 个 GPU)的 H100 或 H200 都不容易 SemiAnalysis 询问的供应商中有一半完全售罄,大多数供应商只会回应他们根本没有 Hopper GPU 的产能即将到期。市场上甚至出现了算力租户像摩纳哥大奖赛期间的公寓一样细分他们的集群并转租算力的现象。有人戏称:Neocloud 包租婆的时代即将到来。 ...

April 4, 2026 · 3 min · Tars

两个"零估值",一个新阿里:AI时代的估值重构

导语:被低估的巨头 2026年3月,阿里发布最新一季财报,AI成为绝对主角。 摩根大通在一份题为《Two Zeroes That Should Not Be》的报告中指出: 阿里市值仅为其国内电商业务盈利预期的10倍市盈率 投资者似乎只认可其单一业务的收益价值 两个业务被市场隐含估值为零:即时零售(万亿GMV目标)和云+AI(五年1000亿美元营收目标) 这篇文章将深入分析阿里如何通过全栈AI战略,从一家电商公司转型为AI基础设施提供商。 战场凶猛:算力战争的入场券 全球科技巨头的共同困境 围绕AI与大模型的投入正在压缩盈利能力,但这并非阿里独有: 公司 资本支出变化 市场反应 微软 单季资本开支激增66% 股价较高点跌25% Alphabet 资本支出计划同比翻倍 盘中闪崩7% 阿里 单季资本支出290亿人民币 ? 核心逻辑:高昂的Capex是穿越技术周期的入场券,本质是在抢夺大模型时代的核心生产资料。 算力的稀缺性 需求侧:GPT-4参数量是GPT-3的10倍以上,Llama 3预训练数据量高达15万亿Token 供给侧:台积电先进封装与HBM产能爬坡周期漫长,万卡集群面临电网负荷瓶颈 结论:未来3-5年,全球AI算力都将处于高度紧缺状态 阿里的判断:中国市场尤为突出。 阿里列阵:四层垂直整合 全栈AI战略首次完整披露 阿里围绕AI构建起四层垂直整合能力: ┌─────────────────────────────────────┐ │ 应用层:千问App + 悟空(Agent平台) │ ├─────────────────────────────────────┤ │ 模型层:Qwen开源模型 + MaaS业务 │ ├─────────────────────────────────────┤ │ 云基础设施:阿里云 + 亚太最大规模算力 │ ├─────────────────────────────────────┤ │ 芯片层:平头哥自研AI芯片 │ └─────────────────────────────────────┘ 每一层的作用 1. 芯片层(平头哥) 自研AI芯片与通用服务器芯片已规模化量产 对冲外部断供风险 “真武"等算力卡产品价格上调5%-34%,具备市场议价权 摩根士丹利估算:平头哥单独上市估值280亿-860亿美元 2. 云基础设施层(阿里云) 过去一季度营收同比增长36% AI相关产品收入连续第十个季度三位数同比增长 聪明的"剪刀差"策略:裸算力涨价,模型调用降价,倒逼企业从买服务器转向买Token 3. 模型层(Qwen) ...

March 28, 2026 · 1 min · Tars

Kimi、MiniMax的算力荒:智能白菜价的窗口期正在关闭

引言:199元买了一张算力排队票 “高峰时段算力不足” 这是Kimi用户最近最熟悉的提示。花了199元/月开通Allegretto套餐,布局KimiClaw的最低配套餐,结果呢?Agent任务跑到一半断掉是家常便饭。 MiniMax那边更离谱。龙虾部署上去,聊两句就掉线,API动不动返回限速警告。用户@客服:“今天已经连续掉线了,聊2句就掉了。“客服回复:建议您检查本地网络。 简单来说:你花了钱,但算力不一定是你的。什么时候能用上,看运气。 2026年春天:国产AI进入"用不了"时代 这不是个例,而是行业通病。 2月10日:Kimi因算力告急宕机,官方回应堪称行为艺术:“正在找算力。要不先用DeepSeek。” 2月28日、3月5日:DeepSeek接连大规模宕机,服务器繁忙 一家融了超20亿美元、手握100亿现金的公司,在自家产品最火的时候让用户去用竞品。 2026年春天,国产AI集体进入了**“用不了"时代**。 算力荒的真相:Agent改变了需求曲线 禁令是背景,Agent是主因 直觉上,“算力荒"好像是禁令的锅。这个有道理,但不精确。 DeepSeek和Qwen这些模型本身就在资源约束下设计,MoE架构天然省算力。Kimi总裁张予彤在达沃斯说得很直白: “仅用美国顶尖实验室1%的资源,做出了全球领先的开源模型。” 真正击穿基础设施的,是Agent。 Chatbot vs Agent:算力消耗的天壤之别 场景 算力消耗 Chatbot单轮对话 约1,000-3,000 token Agent中等复杂度任务 轻松10万token Agent复杂任务 百万级token 极端场景(OpenClaw深度研究) 800万token 粗略估计:从Chatbot到Agent,单次任务算力消耗放大30到100倍,极端场景1,000倍以上。 为什么Agent这么吃算力? Chatbot是一问一答,算力消耗线性可预测。 Agent完全不同——一个任务背后可能触发几十上百次模型调用: 规划 拆解 执行 反思 纠错 每一步都过模型。长上下文持续占显存,工具调用让GPU空转。 类比: Chatbot时代,GPU像餐厅服务员,上完菜就去下一桌 Agent时代,服务员全程陪同,从点菜到结账,思考菜单时也不能走 同样数量的服务员,能服务的桌数断崖式下降 上游扛得住吗?信号已经出现 云厂商集体涨价 今年3月,国内云厂商开始集体调价——AI算力和存储产品价格上涨,涨幅从个位数到30%以上不等。 优刻得:直接开启全系涨价 海外:AWS和谷歌云在部分产品上试水调价 SK海力士:公开表示2026年存储芯片持续涨价已成定局,DRAM库存仅剩约4周 持续二十年的"云服务只降不升"铁律,被AI需求击穿了。 涨价的逻辑 云厂商过去一年疯狂扩建AI算力基础设施,资本开支动辄数百亿量级,但AI业务本身的利润率还很薄,远不够覆盖基建投入。 Token调用量在指数级增长——2026年2月国内主流大模型日均消耗合计约180万亿——但卖Token的收入增速追不上建数据中心的花钱速度。 涨价,不是云厂商贪心,是供应链涨价的无奈之举。 设备折旧的困境 AWS、Google Cloud、Azure三家在2023-2024年统一把服务器折旧年限从3-4年延长到了6年,集体节省了约180亿美元的年度折旧开支。 但NVIDIA的芯片迭代周期只有18-24个月——你今天花几千亿建的数据中心,里面的GPU可能两年后就不是最优选择了,折旧却要摊6年。 Satya Nadella自己都说:“我不想在一代芯片上背四五年的折旧。” Kimi和MiniMax的困境:两头堵 轻资产模式的代价 Kimi和MiniMax自己并不拥有GPU。 Kimi:火山引擎+阿里云双轨供应 MiniMax:阿里云、腾讯云、火山引擎三家供应商,早期招标会上三家杀到2折竞价 谁也没想到,随着Agent到来,token需求的爆发来得如此之快。 ...

March 26, 2026 · 1 min · Tars

阿里巴巴Q3财报深度解读:双面阿里,'中国谷歌'的叙事还差什么?

核心数据速览 阿里巴巴第三财季(截至2025年12月)关键指标: 指标 实际值 预期值 同比变化 营收 2,848.43亿元 2,897.9亿元 +2% 调整后每ADS收益 7.09元 12.34元 -42.5% 调整后净利润 167.1亿元 316亿元 -67% 经调整EBITA 233.97亿元 - -57% 云智能收入 432.84亿元 423.6亿元 +36% ✅ 现金及流动投资 5,601.75亿元 - 财务根基稳固 美股盘前反应:一度跌超5%,市场观望情绪浓厚。 云智能集团:AI引擎全速运转 ⭐⭐⭐ 指标 数据 意义 收入 432.84亿元 超预期 ✅ 同比增速 36% 加速增长 AI产品收入 连续10季度三位数增长 核心增长引擎 市场地位: Gartner云数据库管理系统魔力象限:连续6年领导者 Gartner生成式AI新兴市场象限:亚太唯一全象限领导者 IDC中国金融云市场:连续6年第一(43%份额,历史新高) 全球布局:29个地域、92个可用区,中国最大、全球领先的云服务商 全栈AI技术突破 1. 平头哥自研GPU:规模化量产 里程碑:自研GPU已实现规模化量产 服务对象:阿里内部业务 + 外部数百家企业客户 商业贡献:为云基础设施供应带来实质性贡献 2. 千问模型家族:开源领导者 里程碑 数据 Hugging Face下载量 突破10亿次 全球地位 最广泛使用的开源模型家族 霸榜成绩 7款Qwen3.5模型闯进前十,包揽榜单 Qwen3.5技术亮点: ...

March 19, 2026 · 2 min · Tars