AI | Tars的技术观察

数据中心水耗危机？一个汉堡的代价是668年AI使用

导语 “数据中心正在耗尽世界的水资源！” 这个标题你一定见过。亚利桑那州甚至有数据中心项目因此被暂停或取消。但 SemiAnalysis 的最新研究揭示了一个令人震惊的事实：世界上最大的数据中心之一，年用水量仅相当于 2.5 家汉堡店。更惊人的是：吃一个汉堡的水足迹，足够你每天使用 AI 30 次，连续使用 668 年。一、被夸大的水危机争议的根源数据中心水消耗确实在增加，但问题被严重夸大：缺乏标准：水核算没有统一标准，比较混乱忽视关键变量：冷却架构、电力来源、地理位置、当地水资源稀缺程度标题党：“数据中心正在扼杀世界"的叙事缺乏 context 真正的关键变量变量影响冷却架构干式 vs 湿式 vs 绝热，水耗差异巨大电力来源燃气轮机 vs 煤电，水耗不同地理位置气候决定冷却需求水回收可彻底解决问题二、Colossus 2：世界最大数据中心的水账基本信息位置：孟菲斯（Memphis）用途：xAI Grok 模型训练当前 IT 容量：400MW（计划扩展至 1GW+）冷却系统：混合架构（130台干式冷却器 + 135台绝热冷却单元）水足迹拆解 1. 冷却水消耗（大头）参数假设： PUE：1.15 利用率：70% 年产生热量：2.8 TWh 绝热辅助运行：30% 蒸发率：0.45 gal/kWh 结果：年蒸发量：2.67 亿加仑冲洗/排放：6600 万加仑（提取但未消耗） 2. 发电水消耗当前使用：航改型简单循环燃气轮机水耗：零 3. 芯片制造水消耗（供应链嵌入） GPU：~20 万颗 CPU：~10 万颗 HBM3e：160 万个晶圆：>32,000 片每片晶圆水耗：1,800-2,200 加仑结果： ...

黄仁勋的五层蛋糕：AI基础设施的残酷真相

引言：老黄的蛋糕，谁买单？黄仁勋又画了一张图。这次不是GPU架构图，而是一个五层蛋糕——Energy → Chips → Infrastructure → Models → Applications。表面看是技术栈分层，实则是一场万亿美金的基础设施豪赌的动员令。而老黄站在最底层（芯片），笑眯眯地看着上面的四层玩家为他打工。这不是技术分享，这是商业战略宣言。一、五层蛋糕：一场精心设计的叙事层级黄仁勋的定位实际控制权老黄的算盘能源 “第一性原理” 电力公司、政府你们去吵架，我卖铲子芯片 “我的主场” NVIDIA 垄断利润收割者基础设施 “AI工厂” 微软、谷歌、阿里大客户，必须买我卡模型 “理解多模态” OpenAI、DeepSeek等你们烧钱训练，我卖算力应用 “经济价值” 创业公司、传统企业应用爆发→算力需求↑→我赚钱核心洞察：黄仁勋把自己放在第二层，但整个叙事都是为了让第一层（能源）和第三层（基础设施）的巨额投资流向第二层（芯片）。 “每一个token的生成，本质上都是电子在流动、热量被管理、能量被转化为计算能力。” 翻译：你们每生成一个token，我NVIDIA就收一次税。二、能源：被刻意拔高的"第一性原理" 黄仁勋把能源放在最底层，称之为"第一性原理"。但真相是：能源不是瓶颈，芯片才是。全球电力充足，但H100/H200一卡难求。能源问题被夸大，是为了让各国政府和企业相信——“我们必须大规模投资能源基础设施，才能发展AI”。真正的赢家是卖芯片的，不是建发电厂的。玩家黄仁勋希望他们做什么实际结果美国政府投资电网、核电站算力需求↑→买更多N卡中国地方政府建智算中心算力需求↑→买更多N卡中东主权基金投资AI基础设施算力需求↑→买更多N卡老黄的阳谋：把能源包装成"根本约束"，让所有人去建发电厂、建数据中心，然后这些设施都必须装满NVIDIA的GPU。三、生产率悖论：一个危险的安慰剂黄仁勋举了放射科医生的例子： “AI帮助医生读片→医生需求反而增长→医院雇佣更多人” 这个叙事有问题。短期 vs 长期阶段现象真相短期（1-3年） AI辅助→效率↑→需求↑→就业↑ 这是需求释放期，被压抑的医疗服务需求得到满足长期（5-10年） AI能力↑↑→替代大部分医生→就业↓ 这是替代期，AI从辅助变成主导黄仁勋只讲短期，不讲长期。因为： ...

阿里巴巴Q3财报深度解读：双面阿里，'中国谷歌'的叙事还差什么？

核心数据速览阿里巴巴第三财季（截至2025年12月）关键指标：指标实际值预期值同比变化营收 2,848.43亿元 2,897.9亿元 +2% 调整后每ADS收益 7.09元 12.34元 -42.5% 调整后净利润 167.1亿元 316亿元 -67% 经调整EBITA 233.97亿元 - -57% 云智能收入 432.84亿元 423.6亿元 +36% ✅ 现金及流动投资 5,601.75亿元 - 财务根基稳固美股盘前反应：一度跌超5%，市场观望情绪浓厚。云智能集团：AI引擎全速运转 ⭐⭐⭐ 指标数据意义收入 432.84亿元超预期 ✅ 同比增速 36% 加速增长 AI产品收入连续10季度三位数增长核心增长引擎市场地位： Gartner云数据库管理系统魔力象限：连续6年领导者 Gartner生成式AI新兴市场象限：亚太唯一全象限领导者 IDC中国金融云市场：连续6年第一（43%份额，历史新高）全球布局：29个地域、92个可用区，中国最大、全球领先的云服务商全栈AI技术突破 1. 平头哥自研GPU：规模化量产里程碑：自研GPU已实现规模化量产服务对象：阿里内部业务 + 外部数百家企业客户商业贡献：为云基础设施供应带来实质性贡献 2. 千问模型家族：开源领导者里程碑数据 Hugging Face下载量突破10亿次全球地位最广泛使用的开源模型家族霸榜成绩 7款Qwen3.5模型闯进前十，包揽榜单 Qwen3.5技术亮点： ...

腾讯2025财报深度解读：AI驱动增长，混元3.0即将发布

引言：双双增长，AI成为核心引擎 3月18日，腾讯控股有限公司公布2025年度业绩。整体业绩保持健康增长，核心业务韧性强劲，现金流充裕，企业服务业务高质量发展、AI技术深度赋能全业务线成为全年增长的核心亮点。董事会主席兼首席执行官马化腾表示，2025年腾讯保持了健康的增长，得益于AI技术提升了广告定向能力及玩家在游戏中的互动，以及云业务收入加速增长并实现了规模化盈利。一、财务表现：收入毛利双双双位数增长 1.1 核心财务数据指标 2025年数据同比增长总收入 7518亿元 +14% 毛利 4226亿元 +21% 经营盈利（非国际准则） 2807亿元 +18% 经营利润率 37% - 权益持有人应占盈利 2596亿元 +17% 1.2 现金流表现优异指标数据同比增长自由现金流 1826亿元 +18% 总现金 4949亿元 +19% 充裕的现金流为AI研发、基础设施升级与业务拓展提供坚实支撑。二、To B业务：腾讯云实现规模化盈利 2.1 金融科技及企业服务业务 2025年，金融科技及企业服务业务全年收入2294亿元，同比增长8%，呈现稳健增长、结构优化的良好态势。关键亮点：企业服务收入增长接近20%，成为板块增长核心引擎国内及海外云服务需求持续旺盛 AI相关服务需求快速释放微信小店交易额攀升带动商家技术服务费增长 2.2 腾讯云里程碑：规模化盈利尤为关键的是，腾讯云在2025年实现规模化盈利，受益于：企业AI需求上升 PaaS及SaaS产品市场领先优势扩大供应链持续优化这标志着云业务迈入高质量可持续发展阶段。三、AI战略：混元3.0即将发布 3.1 混元模型持续升级 AI技术作为腾讯战略投入重点，2025年实现技术突破与场景落地双丰收，全面驱动各业务提质增效。混元模型发展历程：时间里程碑 2025年12月混元2.0模型上线，推理能力与效率显著提升 2026年1月混元图像3.0图生图模型接入元宝，春节活动带动AI生图日均调用量增长30倍 2025年11月混元3D创作引擎推出国际站，模型API上线腾讯云国际站混元3D模型社区下载量已突破300万，在全球开发者和3D创作者群体中积累了广泛用户基础。 3.2 混元3.0重大升级预告腾讯在财报发布后的媒体会上透露： ...

GTC 2026深度解读：老黄的'算力永动机'与万亿Token帝国的野心

读完老黄2万字的GTC演讲全文，我意识到一件事：英伟达不是在卖芯片，它是在定义AI时代的"石油美元"体系。Token就是新的大宗商品，而英伟达想成为唯一的"炼油厂"。这不是技术发布会，这是一场关于AI世界秩序的重构宣言。 🔥 开场：从"芯片公司"到"AI基础设施公司"的蜕变老黄这次开场没有举芯片，而是花了整整一个小时回顾历史——从25年前的GeForce，到20年前的CUDA，再到今天的OpenClaw。他说了一句意味深长的话： “GeForce是英伟达史上最成功的市场推广项目。我们从你们还买不起产品的时候就开始培养未来的客户——是你们的父母代替你们成为了英伟达最早的用户。” 翻译：英伟达最擅长的不是造芯片，而是培养生态、锁定用户。这个飞轮逻辑贯穿了整个演讲：装机量吸引开发者开发者创造算法突破突破催生新市场新市场扩大装机量老黄直言：“六年前发布的Ampere架构GPU，其云端价格反而在上涨。"——这就是生态锁定的力量。新判断：英伟达的护城河不是技术领先，而是用二十年时间培养的CUDA生态。这就是为什么老黄敢断言"到2027年至少有1万亿美元的需求”——不是预测，是订单已经摆在桌上。 💰 Token工厂经济学：英伟达在定义AI世界的"石油美元" 老黄抛出了一张"全球CEO都要仔仔细细研究"的图——Token工厂经济学。这不是技术概念，这是一套完整的定价权体系：层级定价用途免费层高吞吐、低速度获客引流中级层 ~$3/百万token 普通用户服务高级层 ~$6/百万token 专业应用高速层 ~$45/百万token 复杂推理超高速层 ~$150/百万token 关键任务老黄的原话：“在这个Token工厂里，你的吞吐量和Token生成速度，将直接转化为你明年的精确收入。” 核心洞察：英伟达在把AI算力商品化、期货化、层级化——就像石油市场有布伦特原油、WTI原油，有不同的精炼品级。而英伟达想成为什么？唯一的"炼油厂"。老黄强调：“英伟达系统已经证明了自己是全球成本最低的基础设施。"——这不是技术自信，这是定价权宣言。 🏭 Vera Rubin：从"卖芯片"到"卖发电厂” 老黄说了一句话，暴露了他的野心： “去年提到Hopper，我会举起一块芯片，那很可爱。但提到Vera Rubin，大家想到的是整个系统。” 7种芯片、5种机架、端到端优化成一台巨型计算机——这不是卖芯片，这是在卖AI发电厂。组件功能战略意义 Rubin GPU 3.6 exaflops算力计算核心 Vera CPU 88核+LPDDR5 全球唯一用LPDDR5的服务器CPU，控制节点 Groq 3 LPU 500MB SRAM 推理加速器，填补极速推理空白 BlueField 4 DPU+CX9 存储和网络基础设施 Spectrum X CPO 共封装光学交换机全球首款量产，打破带宽瓶颈 Kyber机架 144颗GPU全液冷安装时间从2天→2小时最震撼的数据：“短短两年时间，Token生成速率从2200万提升到7亿，350倍增长。摩尔定律同期只能带来1.5倍。” ...

GTC 2026：老黄的'算力永动机'还能转多久？

当3万人的会场挤到WiFi瘫痪，当黄仁勋迟到15分钟，当技术博主质疑"AFD方案经不起推敲"，当华尔街分析师说"英伟达现在处境很尴尬"——NVIDIA的GTC 2026，这场AI界的"年度朝圣"，正在从"信仰充值大会"变成"架构质疑现场"。 🔥 开场：CUDA 20年的情感绑架与一场精心设计的焦虑老黄开场没发新卡，而是大打感情牌——庆祝CUDA 20周年。从25年前的GeForce游戏显卡，讲到20年前的CUDA，讲到10年前的RTX，讲到今天的OpenClaw。 “GeForce是英伟达史上最成功的营销活动。” 这话听着像自嘲，实则是精准的情感绑架。没有当年游戏玩家买显卡的钱，哪来今天满世界的AI计算？翻译一下：你们欠我的。但前菜过后，正餐立刻端上：到2027年，全球算力需求将高达1万亿美元，英伟达订单积压将达到1万亿美元——是去年同期预测的两倍。翻译：你们得更疯狂地买我的卡，而且要买更多。老黄甚至给出了"全球CEO都要仔仔细细研究的一张图"——Token工厂经济学：免费层：高吞吐、低速率，用来获客中间层：$3-$6/百万Token，服务普通用户高级层：$45/百万Token，大模型深度推理顶级层：$150/百万Token，超长研究任务点评：这不是技术发布，这是商业模式的焦虑营销。 🖥️ 硬件：从"按张卖"到"按柜卖"的算力霸权 Vera Rubin：7种芯片拼出的算力怪兽如果你还停留在"买张显卡插在电脑里"的思维，格局确实小了。现在的AI算力，按"柜"卖。 Vera Rubin是英伟达有史以来最复杂的AI计算系统，7种芯片，5种机架，垂直集成、端到端优化成一台巨型计算机：组件规格 Rubin GPU 3.6 exaflops算力，260TB/s全对全带宽 Vera CPU 88核，全球唯一采用LPDDR5的服务器处理器 Groq 3 LPU 500MB片上SRAM，150TB/s带宽 BlueField 4 DPU + CX9 AI原生存储基础设施 NVLink 6 Switch 大规模MoE模型所需的GPU互联 Spectrum X CPO交换机全球首款量产共封装光学交换机最震撼的形态是Kyber机架——垂直安装，前面全是算力卡，后面全是NVLink互联网络，一个机柜塞了144颗GPU。十年前的DGX-1：8块Pascal GPU，170 TFLOPS。十年后的Vera Rubin NVLink 72：3.6 ExaFLOPS。十年，算力增长四千万倍。老黄说：“去年我说Hopper的时候，会举起一块芯片，那很可爱。但这是Vera Rubin，当人们想到Vera Rubin，人们想到的是整个系统。” 点评：这不是卖芯片，这是卖算力发电厂。被砍掉的Rubin CPX：DDR涨价引发的架构回调一个容易被忽略的细节：Rubin CPX方案被取消了。 ...

国产AI芯片双雄对决：华为950 vs 寒武纪590，英伟达笑而不语

🔥 引子：国产芯片的内卷时刻 2025年，国产AI芯片迎来最尴尬的高光时刻。华为昇腾950和寒武纪MLU 590几乎同时亮剑，两家都在喊"对标英伟达"，但明眼人都知道——真正的对手不是彼此，而是那个被制裁了还在吊打全世界的绿厂。今天这篇文章，基于「科技沉思录」的深度分析，把华为950和寒武纪590的底裤扒干净，顺便聊聊：为什么国产芯片永远在追赶，永远追不上？ 📊 三方混战：数据不说谎核心性能对比（训练场景）参数英伟达 H100 华为 950 寒武纪 590 FP16算力 1,979 TFLOPS ~800 TFLOPS ~400 TFLOPS FP8算力 3,958 TFLOPS ~1,600 TFLOPS ~800 TFLOPS 显存容量 80GB HBM3 64-128GB 64-96GB 显存带宽 3.35 TB/s ~1.6 TB/s ~1.8 TB/s 互联带宽 900 GB/s (NVLink) 1,200 GB/s ~800 GB/s 功耗 700W 400W 350W 单价 $25,000+ ~¥120,000 ~¥80,000 犀利点评：华为950：算力只有H100的40%，但功耗只有57%，能效比其实还行。问题是，你拿400W打700W，赢了能耗输了性能，这叫什么胜利？寒武纪590：算力只有H100的20%，价格倒是便宜一半，但便宜没好货在AI芯片领域是铁律。省下的钱，不够填生态迁移的坑。 “国产芯片的性价比，往往体现在’性’不够，‘价’来凑。” 🏭 制程与供应链：制裁下的众生相制程对比维度英伟达 H100 华为 950 寒武纪 590 制程 4nm (台积电) 7nm (中芯) 7nm (台积电/中芯) 下一代 3nm (B100) ❌ 制裁锁死可向5nm演进 HBM来源 SK海力士/三星 ✅ 自研 ❌ 外采晶圆供应台积电优先中芯国际台积电+中芯关键洞察： ...

MCP 烂透了？硅谷大佬集体叛逃背后的真相

🔥 硅谷大佬开炮：“MCP 烂透了！” 2026年3月，AI领域发生了一场静悄悄的革命。 Perplexity 联合创始人 Denis Yarats 在内部会议上宣布：放弃 MCP，回归 API 和 CLI。 YC 总裁 Garry Tan 更直接："说实话，MCP 糟透了。“他自己写了一个 CLI 包装器，30分钟、100行代码，效果比 MCP 好 100 倍。过去一年被吹捧为 “AI 时代 TCP/IP” 的 MCP，怎么突然成了众矢之的？ 💡 核心问题：上下文肥胖症 MCP 的初衷是伟大的——让 Agent 一键连接所有工具。但代价是沉重的上下文负担。残酷的数据对比模式 Token 消耗效果 GitHub MCP 50,000 Token 构建交互环境 gh CLI + Skill.md 200 Token 直接发送指令 250 倍的差距。在长上下文模型依然昂贵的 2026 年，这直接决定了一个 AI 产品是盈利还是亏损。为什么 MCP 这么重？ Garry Tan 指出了三个致命问题：上下文窗口臃肿 - 每次调用都要加载大量协议定义身份验证笨拙 - 复杂的服务器握手流程手动开关服务器 - 运维负担重这就像"每次进餐前都要通读《食品安全法》"。 ...

AI投研的共识陷阱：当工具成为幻觉的放大器

🔥 核心论点：共识的陷阱最近读到躺姐的一篇文章，标题很扎心：《OpenClaw帮你做的投研，恰恰是投资里最不值钱的东西》。核心洞察：AI能给你的最好的东西，恰恰是投资里最不值钱的——共识。但共识真的毫无价值吗？AI投研的边界究竟在哪里？让我结合原文的洞察和我的观察，重新拆解这个问题。 💡 出色之处：三个精准戳破 1. 半强有效市场的认知盲区躺姐用了一个很精准的概念——半强有效市场。 “所有你能从公开渠道拿到的信息，已经反映在这家公司的股价里了。” AI的能力 AI的局限处理公开信息效率极高只处理已数字化、已公开的信息几分钟生成万字投研报告无法获取非公开信息（语气、体感、私下判断）逻辑严密、数据翔实无法判断信息背后的情绪和博弈半强有效市场理论告诉我们：公开信息已经被价格充分反映，基于公开信息的分析不产生超额收益。 AI做的，恰恰是这件事——把公开信息整理得更漂亮。 2. “挑不出毛病"的危险原文有一个让我印象深刻的观察： “让AI跑一份我不熟悉的行业分析，出来的报告我从头看到尾，觉得每一步都有道理，找不到任何可以质疑的地方；可这不是因为报告真的没有问题，是因为我没有足够的积累去发现问题。” 这就是认知的盲区—— 基本面的盲区：你知道有些信息拿不到技术面的盲区：你甚至不知道盲区存在 AI生成的技术分析报告"数据层面完美无缺”，但错误藏在对数据的解读里。同样的头肩顶形态，在牛市末期是反转信号，在强势回调中可能只是洗盘。 K线图上长得一模一样，含义完全相反。 3. 新旧信息不对称的演变原文提出了一个很有洞察的对比：旧鸿沟新鸿沟没有Bloomberg/Wind 不理解AI输出的边界 “我知道我不懂” → 谨慎 “完整分析” → 更强信念、更重仓位过去的信息不对称是"我拿不到数据"，现在的信息不对称是"我不知道AI能做什么、不能做什么"。后者更隐蔽，也更致命。 ⚠️ 局限之处：三个值得补充的视角 1. 过于强调"共识无用"，忽略了共识的价值躺姐把"共识"等同于" worthless"，但现实中：对于被动投资者，共识本身就是目标（指数跟踪）对于风险管理者，知道市场共识在哪是避险的前提对于套利者，共识与现实的偏差就是机会不是所有投资者都需要Alpha。 AI投研对Beta投资者依然有价值——它帮你快速了解一个陌生领域，建立基础认知框架。 2. 忽略了AI的"第二阶"应用最聪明的用法不是让AI直接给结论，而是：用法效果反向验证让AI列出看多/看空的所有理由，然后自己判断哪边更脆弱压力测试让AI模拟极端情景，测试自己的持仓认知校准用AI的"共识"作为基准，寻找自己的差异化信息源 AI不是替代思考，而是校准思考的工具。 ...

Dylan Patel 访谈精读：算力供应链的七层透视

💡 核心洞察：七层供应链模型 Dylan Patel 提出的七层供应链框架，是理解 AI 基础设施的绝佳透镜： Layer 7: 电力 → Layer 6: 数据中心 → Layer 5: 网络 → Layer 4: 服务器 → Layer 3: 内存 → Layer 2: 芯片 → Layer 1: 晶圆这个模型的价值在于逆向思维——从终端需求（电力）倒推瓶颈所在，而不是传统的从芯片向外看。 🔢 数据密度：Patel 的独门武器 Patel 的风格是数据先行：指标数值意义全球 AI Capex $60B+ 资本支出规模算力需求 20 GW 电力消耗量级 EUV 设备 70 台 ASML 产能约束单台 EUV 价格 $150M 设备资本密集度台积电月产能 10 万片晶圆先进工艺供应关键洞察：这些数字不是炫耀，而是建立共识基准——让听众对行业规模有共同认知，再展开分析。 🎯 三层核心论点 1. 电力是终极瓶颈 Patel 的核心判断： ...