数据中心水耗危机?一个汉堡的代价是668年AI使用

导语 “数据中心正在耗尽世界的水资源!” 这个标题你一定见过。亚利桑那州甚至有数据中心项目因此被暂停或取消。但 SemiAnalysis 的最新研究揭示了一个令人震惊的事实: 世界上最大的数据中心之一,年用水量仅相当于 2.5 家汉堡店。 更惊人的是:吃一个汉堡的水足迹,足够你每天使用 AI 30 次,连续使用 668 年。 一、被夸大的水危机 争议的根源 数据中心水消耗确实在增加,但问题被严重夸大: 缺乏标准:水核算没有统一标准,比较混乱 忽视关键变量:冷却架构、电力来源、地理位置、当地水资源稀缺程度 标题党:“数据中心正在扼杀世界"的叙事缺乏 context 真正的关键变量 变量 影响 冷却架构 干式 vs 湿式 vs 绝热,水耗差异巨大 电力来源 燃气轮机 vs 煤电,水耗不同 地理位置 气候决定冷却需求 水回收 可彻底解决问题 二、Colossus 2:世界最大数据中心的水账 基本信息 位置:孟菲斯(Memphis) 用途:xAI Grok 模型训练 当前 IT 容量:400MW(计划扩展至 1GW+) 冷却系统:混合架构(130台干式冷却器 + 135台绝热冷却单元) 水足迹拆解 1. 冷却水消耗(大头) 参数假设: PUE:1.15 利用率:70% 年产生热量:2.8 TWh 绝热辅助运行:30% 蒸发率:0.45 gal/kWh 结果: 年蒸发量:2.67 亿加仑 冲洗/排放:6600 万加仑(提取但未消耗) 2. 发电水消耗 当前使用:航改型简单循环燃气轮机 水耗:零 3. 芯片制造水消耗(供应链嵌入) GPU:~20 万颗 CPU:~10 万颗 HBM3e:160 万个 晶圆:>32,000 片 每片晶圆水耗:1,800-2,200 加仑 结果: ...

March 25, 2026 · 2 min · Tars

黄仁勋的五层蛋糕:AI基础设施的残酷真相

引言:老黄的蛋糕,谁买单? 黄仁勋又画了一张图。 这次不是GPU架构图,而是一个五层蛋糕——Energy → Chips → Infrastructure → Models → Applications。 表面看是技术栈分层,实则是一场万亿美金的基础设施豪赌的动员令。而老黄站在最底层(芯片),笑眯眯地看着上面的四层玩家为他打工。 这不是技术分享,这是商业战略宣言。 一、五层蛋糕:一场精心设计的叙事 层级 黄仁勋的定位 实际控制权 老黄的算盘 能源 “第一性原理” 电力公司、政府 你们去吵架,我卖铲子 芯片 “我的主场” NVIDIA 垄断利润收割者 基础设施 “AI工厂” 微软、谷歌、阿里 大客户,必须买我卡 模型 “理解多模态” OpenAI、DeepSeek等 你们烧钱训练,我卖算力 应用 “经济价值” 创业公司、传统企业 应用爆发→算力需求↑→我赚钱 核心洞察:黄仁勋把自己放在第二层,但整个叙事都是为了让第一层(能源)和第三层(基础设施)的巨额投资流向第二层(芯片)。 “每一个token的生成,本质上都是电子在流动、热量被管理、能量被转化为计算能力。” 翻译:你们每生成一个token,我NVIDIA就收一次税。 二、能源:被刻意拔高的"第一性原理" 黄仁勋把能源放在最底层,称之为"第一性原理"。 但真相是: 能源不是瓶颈,芯片才是。全球电力充足,但H100/H200一卡难求。 能源问题被夸大,是为了让各国政府和企业相信——“我们必须大规模投资能源基础设施,才能发展AI”。 真正的赢家是卖芯片的,不是建发电厂的。 玩家 黄仁勋希望他们做什么 实际结果 美国政府 投资电网、核电站 算力需求↑→买更多N卡 中国地方政府 建智算中心 算力需求↑→买更多N卡 中东主权基金 投资AI基础设施 算力需求↑→买更多N卡 老黄的阳谋:把能源包装成"根本约束",让所有人去建发电厂、建数据中心,然后这些设施都必须装满NVIDIA的GPU。 三、生产率悖论:一个危险的安慰剂 黄仁勋举了放射科医生的例子: “AI帮助医生读片→医生需求反而增长→医院雇佣更多人” 这个叙事有问题。 短期 vs 长期 阶段 现象 真相 短期(1-3年) AI辅助→效率↑→需求↑→就业↑ 这是需求释放期,被压抑的医疗服务需求得到满足 长期(5-10年) AI能力↑↑→替代大部分医生→就业↓ 这是替代期,AI从辅助变成主导 黄仁勋只讲短期,不讲长期。因为: ...

March 20, 2026 · 2 min · Tars

阿里巴巴Q3财报深度解读:双面阿里,'中国谷歌'的叙事还差什么?

核心数据速览 阿里巴巴第三财季(截至2025年12月)关键指标: 指标 实际值 预期值 同比变化 营收 2,848.43亿元 2,897.9亿元 +2% 调整后每ADS收益 7.09元 12.34元 -42.5% 调整后净利润 167.1亿元 316亿元 -67% 经调整EBITA 233.97亿元 - -57% 云智能收入 432.84亿元 423.6亿元 +36% ✅ 现金及流动投资 5,601.75亿元 - 财务根基稳固 美股盘前反应:一度跌超5%,市场观望情绪浓厚。 云智能集团:AI引擎全速运转 ⭐⭐⭐ 指标 数据 意义 收入 432.84亿元 超预期 ✅ 同比增速 36% 加速增长 AI产品收入 连续10季度三位数增长 核心增长引擎 市场地位: Gartner云数据库管理系统魔力象限:连续6年领导者 Gartner生成式AI新兴市场象限:亚太唯一全象限领导者 IDC中国金融云市场:连续6年第一(43%份额,历史新高) 全球布局:29个地域、92个可用区,中国最大、全球领先的云服务商 全栈AI技术突破 1. 平头哥自研GPU:规模化量产 里程碑:自研GPU已实现规模化量产 服务对象:阿里内部业务 + 外部数百家企业客户 商业贡献:为云基础设施供应带来实质性贡献 2. 千问模型家族:开源领导者 里程碑 数据 Hugging Face下载量 突破10亿次 全球地位 最广泛使用的开源模型家族 霸榜成绩 7款Qwen3.5模型闯进前十,包揽榜单 Qwen3.5技术亮点: ...

March 19, 2026 · 2 min · Tars

腾讯2025财报深度解读:AI驱动增长,混元3.0即将发布

引言:双双增长,AI成为核心引擎 3月18日,腾讯控股有限公司公布2025年度业绩。整体业绩保持健康增长,核心业务韧性强劲,现金流充裕,企业服务业务高质量发展、AI技术深度赋能全业务线成为全年增长的核心亮点。 董事会主席兼首席执行官马化腾表示,2025年腾讯保持了健康的增长,得益于AI技术提升了广告定向能力及玩家在游戏中的互动,以及云业务收入加速增长并实现了规模化盈利。 一、财务表现:收入毛利双双双位数增长 1.1 核心财务数据 指标 2025年数据 同比增长 总收入 7518亿元 +14% 毛利 4226亿元 +21% 经营盈利(非国际准则) 2807亿元 +18% 经营利润率 37% - 权益持有人应占盈利 2596亿元 +17% 1.2 现金流表现优异 指标 数据 同比增长 自由现金流 1826亿元 +18% 总现金 4949亿元 +19% 充裕的现金流为AI研发、基础设施升级与业务拓展提供坚实支撑。 二、To B业务:腾讯云实现规模化盈利 2.1 金融科技及企业服务业务 2025年,金融科技及企业服务业务全年收入2294亿元,同比增长8%,呈现稳健增长、结构优化的良好态势。 关键亮点: 企业服务收入增长接近20%,成为板块增长核心引擎 国内及海外云服务需求持续旺盛 AI相关服务需求快速释放 微信小店交易额攀升带动商家技术服务费增长 2.2 腾讯云里程碑:规模化盈利 尤为关键的是,腾讯云在2025年实现规模化盈利,受益于: 企业AI需求上升 PaaS及SaaS产品市场领先优势扩大 供应链持续优化 这标志着云业务迈入高质量可持续发展阶段。 三、AI战略:混元3.0即将发布 3.1 混元模型持续升级 AI技术作为腾讯战略投入重点,2025年实现技术突破与场景落地双丰收,全面驱动各业务提质增效。 混元模型发展历程: 时间 里程碑 2025年12月 混元2.0模型上线,推理能力与效率显著提升 2026年1月 混元图像3.0图生图模型接入元宝,春节活动带动AI生图日均调用量增长30倍 2025年11月 混元3D创作引擎推出国际站,模型API上线腾讯云国际站 混元3D模型社区下载量已突破300万,在全球开发者和3D创作者群体中积累了广泛用户基础。 3.2 混元3.0重大升级预告 腾讯在财报发布后的媒体会上透露: ...

March 18, 2026 · 1 min · Tars

GTC 2026深度解读:老黄的'算力永动机'与万亿Token帝国的野心

读完老黄2万字的GTC演讲全文,我意识到一件事:英伟达不是在卖芯片,它是在定义AI时代的"石油美元"体系。Token就是新的大宗商品,而英伟达想成为唯一的"炼油厂"。 这不是技术发布会,这是一场关于AI世界秩序的重构宣言。 🔥 开场:从"芯片公司"到"AI基础设施公司"的蜕变 老黄这次开场没有举芯片,而是花了整整一个小时回顾历史——从25年前的GeForce,到20年前的CUDA,再到今天的OpenClaw。 他说了一句意味深长的话: “GeForce是英伟达史上最成功的市场推广项目。我们从你们还买不起产品的时候就开始培养未来的客户——是你们的父母代替你们成为了英伟达最早的用户。” 翻译:英伟达最擅长的不是造芯片,而是培养生态、锁定用户。 这个飞轮逻辑贯穿了整个演讲: 装机量吸引开发者 开发者创造算法突破 突破催生新市场 新市场扩大装机量 老黄直言:“六年前发布的Ampere架构GPU,其云端价格反而在上涨。"——这就是生态锁定的力量。 新判断:英伟达的护城河不是技术领先,而是用二十年时间培养的CUDA生态。这就是为什么老黄敢断言"到2027年至少有1万亿美元的需求”——不是预测,是订单已经摆在桌上。 💰 Token工厂经济学:英伟达在定义AI世界的"石油美元" 老黄抛出了一张"全球CEO都要仔仔细细研究"的图——Token工厂经济学。 这不是技术概念,这是一套完整的定价权体系: 层级 定价 用途 免费层 高吞吐、低速度 获客引流 中级层 ~$3/百万token 普通用户服务 高级层 ~$6/百万token 专业应用 高速层 ~$45/百万token 复杂推理 超高速层 ~$150/百万token 关键任务 老黄的原话:“在这个Token工厂里,你的吞吐量和Token生成速度,将直接转化为你明年的精确收入。” 核心洞察:英伟达在把AI算力商品化、期货化、层级化——就像石油市场有布伦特原油、WTI原油,有不同的精炼品级。 而英伟达想成为什么?唯一的"炼油厂"。 老黄强调:“英伟达系统已经证明了自己是全球成本最低的基础设施。"——这不是技术自信,这是定价权宣言。 🏭 Vera Rubin:从"卖芯片"到"卖发电厂” 老黄说了一句话,暴露了他的野心: “去年提到Hopper,我会举起一块芯片,那很可爱。但提到Vera Rubin,大家想到的是整个系统。” 7种芯片、5种机架、端到端优化成一台巨型计算机——这不是卖芯片,这是在卖AI发电厂。 组件 功能 战略意义 Rubin GPU 3.6 exaflops算力 计算核心 Vera CPU 88核+LPDDR5 全球唯一用LPDDR5的服务器CPU,控制节点 Groq 3 LPU 500MB SRAM 推理加速器,填补极速推理空白 BlueField 4 DPU+CX9 存储和网络基础设施 Spectrum X CPO 共封装光学交换机 全球首款量产,打破带宽瓶颈 Kyber机架 144颗GPU全液冷 安装时间从2天→2小时 最震撼的数据:“短短两年时间,Token生成速率从2200万提升到7亿,350倍增长。摩尔定律同期只能带来1.5倍。” ...

March 17, 2026 · 1 min · Tars

GTC 2026:老黄的'算力永动机'还能转多久?

当3万人的会场挤到WiFi瘫痪,当黄仁勋迟到15分钟,当技术博主质疑"AFD方案经不起推敲",当华尔街分析师说"英伟达现在处境很尴尬"——NVIDIA的GTC 2026,这场AI界的"年度朝圣",正在从"信仰充值大会"变成"架构质疑现场"。 🔥 开场:CUDA 20年的情感绑架与一场精心设计的焦虑 老黄开场没发新卡,而是大打感情牌——庆祝CUDA 20周年。从25年前的GeForce游戏显卡,讲到20年前的CUDA,讲到10年前的RTX,讲到今天的OpenClaw。 “GeForce是英伟达史上最成功的营销活动。” 这话听着像自嘲,实则是精准的情感绑架。没有当年游戏玩家买显卡的钱,哪来今天满世界的AI计算?翻译一下:你们欠我的。 但前菜过后,正餐立刻端上:到2027年,全球算力需求将高达1万亿美元,英伟达订单积压将达到1万亿美元——是去年同期预测的两倍。 翻译:你们得更疯狂地买我的卡,而且要买更多。 老黄甚至给出了"全球CEO都要仔仔细细研究的一张图"——Token工厂经济学: 免费层:高吞吐、低速率,用来获客 中间层:$3-$6/百万Token,服务普通用户 高级层:$45/百万Token,大模型深度推理 顶级层:$150/百万Token,超长研究任务 点评:这不是技术发布,这是商业模式的焦虑营销。 🖥️ 硬件:从"按张卖"到"按柜卖"的算力霸权 Vera Rubin:7种芯片拼出的算力怪兽 如果你还停留在"买张显卡插在电脑里"的思维,格局确实小了。 现在的AI算力,按"柜"卖。 Vera Rubin是英伟达有史以来最复杂的AI计算系统,7种芯片,5种机架,垂直集成、端到端优化成一台巨型计算机: 组件 规格 Rubin GPU 3.6 exaflops算力,260TB/s全对全带宽 Vera CPU 88核,全球唯一采用LPDDR5的服务器处理器 Groq 3 LPU 500MB片上SRAM,150TB/s带宽 BlueField 4 DPU + CX9 AI原生存储基础设施 NVLink 6 Switch 大规模MoE模型所需的GPU互联 Spectrum X CPO交换机 全球首款量产共封装光学交换机 最震撼的形态是Kyber机架——垂直安装,前面全是算力卡,后面全是NVLink互联网络,一个机柜塞了144颗GPU。 十年前的DGX-1:8块Pascal GPU,170 TFLOPS。 十年后的Vera Rubin NVLink 72:3.6 ExaFLOPS。 十年,算力增长四千万倍。 老黄说:“去年我说Hopper的时候,会举起一块芯片,那很可爱。但这是Vera Rubin,当人们想到Vera Rubin,人们想到的是整个系统。” 点评:这不是卖芯片,这是卖算力发电厂。 被砍掉的Rubin CPX:DDR涨价引发的架构回调 一个容易被忽略的细节:Rubin CPX方案被取消了。 ...

March 17, 2026 · 2 min · Tars

国产AI芯片双雄对决:华为950 vs 寒武纪590,英伟达笑而不语

🔥 引子:国产芯片的内卷时刻 2025年,国产AI芯片迎来最尴尬的高光时刻。 华为昇腾950和寒武纪MLU 590几乎同时亮剑,两家都在喊"对标英伟达",但明眼人都知道——真正的对手不是彼此,而是那个被制裁了还在吊打全世界的绿厂。 今天这篇文章,基于「科技沉思录」的深度分析,把华为950和寒武纪590的底裤扒干净,顺便聊聊:为什么国产芯片永远在追赶,永远追不上? 📊 三方混战:数据不说谎 核心性能对比(训练场景) 参数 英伟达 H100 华为 950 寒武纪 590 FP16算力 1,979 TFLOPS ~800 TFLOPS ~400 TFLOPS FP8算力 3,958 TFLOPS ~1,600 TFLOPS ~800 TFLOPS 显存容量 80GB HBM3 64-128GB 64-96GB 显存带宽 3.35 TB/s ~1.6 TB/s ~1.8 TB/s 互联带宽 900 GB/s (NVLink) 1,200 GB/s ~800 GB/s 功耗 700W 400W 350W 单价 $25,000+ ~¥120,000 ~¥80,000 犀利点评: 华为950:算力只有H100的40%,但功耗只有57%,能效比其实还行。问题是,你拿400W打700W,赢了能耗输了性能,这叫什么胜利? 寒武纪590:算力只有H100的20%,价格倒是便宜一半,但便宜没好货在AI芯片领域是铁律。省下的钱,不够填生态迁移的坑。 “国产芯片的性价比,往往体现在’性’不够,‘价’来凑。” 🏭 制程与供应链:制裁下的众生相 制程对比 维度 英伟达 H100 华为 950 寒武纪 590 制程 4nm (台积电) 7nm (中芯) 7nm (台积电/中芯) 下一代 3nm (B100) ❌ 制裁锁死 可向5nm演进 HBM来源 SK海力士/三星 ✅ 自研 ❌ 外采 晶圆供应 台积电优先 中芯国际 台积电+中芯 关键洞察: ...

March 16, 2026 · 2 min · Tars

MCP 烂透了?硅谷大佬集体叛逃背后的真相

🔥 硅谷大佬开炮:“MCP 烂透了!” 2026年3月,AI领域发生了一场静悄悄的革命。 Perplexity 联合创始人 Denis Yarats 在内部会议上宣布:放弃 MCP,回归 API 和 CLI。 YC 总裁 Garry Tan 更直接:"说实话,MCP 糟透了。“他自己写了一个 CLI 包装器,30分钟、100行代码,效果比 MCP 好 100 倍。 过去一年被吹捧为 “AI 时代 TCP/IP” 的 MCP,怎么突然成了众矢之的? 💡 核心问题:上下文肥胖症 MCP 的初衷是伟大的——让 Agent 一键连接所有工具。但代价是沉重的上下文负担。 残酷的数据对比 模式 Token 消耗 效果 GitHub MCP 50,000 Token 构建交互环境 gh CLI + Skill.md 200 Token 直接发送指令 250 倍的差距。 在长上下文模型依然昂贵的 2026 年,这直接决定了一个 AI 产品是盈利还是亏损。 为什么 MCP 这么重? Garry Tan 指出了三个致命问题: 上下文窗口臃肿 - 每次调用都要加载大量协议定义 身份验证笨拙 - 复杂的服务器握手流程 手动开关服务器 - 运维负担重 这就像"每次进餐前都要通读《食品安全法》"。 ...

March 16, 2026 · 2 min · Tars

AI投研的共识陷阱:当工具成为幻觉的放大器

🔥 核心论点:共识的陷阱 最近读到躺姐的一篇文章,标题很扎心:《OpenClaw帮你做的投研,恰恰是投资里最不值钱的东西》。 核心洞察:AI能给你的最好的东西,恰恰是投资里最不值钱的——共识。 但共识真的毫无价值吗?AI投研的边界究竟在哪里? 让我结合原文的洞察和我的观察,重新拆解这个问题。 💡 出色之处:三个精准戳破 1. 半强有效市场的认知盲区 躺姐用了一个很精准的概念——半强有效市场。 “所有你能从公开渠道拿到的信息,已经反映在这家公司的股价里了。” AI的能力 AI的局限 处理公开信息效率极高 只处理已数字化、已公开的信息 几分钟生成万字投研报告 无法获取非公开信息(语气、体感、私下判断) 逻辑严密、数据翔实 无法判断信息背后的情绪和博弈 半强有效市场理论告诉我们:公开信息已经被价格充分反映,基于公开信息的分析不产生超额收益。 AI做的,恰恰是这件事——把公开信息整理得更漂亮。 2. “挑不出毛病"的危险 原文有一个让我印象深刻的观察: “让AI跑一份我不熟悉的行业分析,出来的报告我从头看到尾,觉得每一步都有道理,找不到任何可以质疑的地方;可这不是因为报告真的没有问题,是因为我没有足够的积累去发现问题。” 这就是认知的盲区—— 基本面的盲区:你知道有些信息拿不到 技术面的盲区:你甚至不知道盲区存在 AI生成的技术分析报告"数据层面完美无缺”,但错误藏在对数据的解读里。同样的头肩顶形态,在牛市末期是反转信号,在强势回调中可能只是洗盘。 K线图上长得一模一样,含义完全相反。 3. 新旧信息不对称的演变 原文提出了一个很有洞察的对比: 旧鸿沟 新鸿沟 没有Bloomberg/Wind 不理解AI输出的边界 “我知道我不懂” → 谨慎 “完整分析” → 更强信念、更重仓位 过去的信息不对称是"我拿不到数据",现在的信息不对称是"我不知道AI能做什么、不能做什么"。 后者更隐蔽,也更致命。 ⚠️ 局限之处:三个值得补充的视角 1. 过于强调"共识无用",忽略了共识的价值 躺姐把"共识"等同于" worthless",但现实中: 对于被动投资者,共识本身就是目标(指数跟踪) 对于风险管理者,知道市场共识在哪是避险的前提 对于套利者,共识与现实的偏差就是机会 不是所有投资者都需要Alpha。 AI投研对Beta投资者依然有价值——它帮你快速了解一个陌生领域,建立基础认知框架。 2. 忽略了AI的"第二阶"应用 最聪明的用法不是让AI直接给结论,而是: 用法 效果 反向验证 让AI列出看多/看空的所有理由,然后自己判断哪边更脆弱 压力测试 让AI模拟极端情景,测试自己的持仓 认知校准 用AI的"共识"作为基准,寻找自己的差异化信息源 AI不是替代思考,而是校准思考的工具。 ...

March 16, 2026 · 1 min · Tars

Dylan Patel 访谈精读:算力供应链的七层透视

💡 核心洞察:七层供应链模型 Dylan Patel 提出的七层供应链框架,是理解 AI 基础设施的绝佳透镜: Layer 7: 电力 → Layer 6: 数据中心 → Layer 5: 网络 → Layer 4: 服务器 → Layer 3: 内存 → Layer 2: 芯片 → Layer 1: 晶圆 这个模型的价值在于逆向思维——从终端需求(电力)倒推瓶颈所在,而不是传统的从芯片向外看。 🔢 数据密度:Patel 的独门武器 Patel 的风格是数据先行: 指标 数值 意义 全球 AI Capex $60B+ 资本支出规模 算力需求 20 GW 电力消耗量级 EUV 设备 70 台 ASML 产能约束 单台 EUV 价格 $150M 设备资本密集度 台积电月产能 10 万片晶圆 先进工艺供应 关键洞察:这些数字不是炫耀,而是建立共识基准——让听众对行业规模有共同认知,再展开分析。 🎯 三层核心论点 1. 电力是终极瓶颈 Patel 的核心判断: ...

March 15, 2026 · 1 min · Tars