从Chatbot到Agent:算力消耗暴增30倍的底层逻辑与行业变局

2026年春天,我亲历了一场算力危机。

2月10日,Kimi因算力告急宕机,官方回应堪称行为艺术:"正在找算力,要不用DeepSeek。"一家融了超20亿美元、手握100亿现金的公司,在产品最火的时候让用户去用竞品。同一天DeepSeek也没好到哪去,2月28日、3月5日接连大规模宕机。国产AI集体进入了"用不了"时代。

直觉上,"算力荒"是芯片禁令的锅。这个判断有道理,但不精确。禁令是背景板,DeepSeek和Qwen本身就在资源约束下设计,MoE架构天然省算力。Kimi总裁张予彤在达沃斯说得很直白:仅用美国顶尖实验室1%的资源,做出了全球领先的开源模型。

真正击穿基础设施的,是Agent。

Chatbot是一问一答,算力消耗线性可预测。Agent完全不同——一个任务可能触发几十上百次模型调用:规划、拆解、执行、反思、纠错,每一步都过模型。

 从Chatbot到Agent:算力消耗暴增30倍的底层逻辑与行业变局 IT技术

粗略计算:Chatbot单轮对话消耗1,000至3,000个token。Agent做一次完整任务,中等复杂度轻松吃掉10万token,复杂任务到百万级。有开发者报告单次OpenClaw运行烧掉800万token。再叠加K2.5Thinking这类推理链模型,思考过程的隐藏token能把成本放大10到30倍。

保守估计,从Chatbot到Agent,单次任务算力消耗放大30到100倍,极端场景1,000倍以上。

Deloitte研究点出一个宏观悖论:过去两年token单价降了280倍,但企业AI账单反而飙升——推理成本降了1,000倍,需求增长了10,000倍。

轻资产模式的双刃剑

问题在于,Kimi和MiniMax自己并不拥有GPU。从财报看,MiniMax固定资产开支极低,算力几乎全部来自第三方云服务——轻资产模式,与OpenAI自建数据中心完全不同。

Kimi背后是火山引擎和阿里云双轨供应:火山引擎从2023年起独家提供训练和推理方案,后阿里投了月之暗面8亿美元,其中一部分直接以阿里云算力结算。MiniMax更复杂,阿里云、腾讯云、火山引擎都是供应商,早期招标会上三家杀到2折竞价。

用户骂Kimi卡的时候,Kimi可能也在骂火山引擎和阿里云卡。算力荒是从芯片到云服务到模型公司到用户的四层传导,Kimi和MiniMax站在最下游,承受每一层压力的叠加。

涨价链条已经启动

今年3月,国内云厂商集体调价——AI算力和存储产品价格上涨,涨幅从个位数到30%以上不等。优刻得直接全系涨价。海外也不例外,AWS和谷歌云在部分产品上试水调价。SK海力士公开表示2026年存储芯片持续涨价已成定局,DRAM库存仅剩约4周。

 从Chatbot到Agent:算力消耗暴增30倍的底层逻辑与行业变局 IT技术

涨价的逻辑不复杂:云厂商过去一年疯狂扩建AI算力基础设施,资本开支动辄数百亿量级,但AI业务本身的利润率还很薄,远不够覆盖基建投入。Token调用量在指数级增长——2026年2月国内主流大模型日均消耗合计约180万亿——但卖Token的收入增速追不上建数据中心的花钱速度。

更棘手的是设备折旧。AWS、GoogleCloud、Azure三家在2023至2024年统一把服务器折旧年限从3至4年延长到6年,集体节省了约180亿美元年度折旧开支。但NVIDIA芯片迭代周期只有18至24个月——今天花几千亿建的数据中心,里面的GPU可能两年后就不是最优选择,折旧却要摊6年。

SatyaNadella自己都说:"我不想在一代芯片上背四五年的折旧。"

行业格局重塑

火山引擎凭借豆包以日均63万亿Token领跑,拿下公有云大模型调用量49.2%的份额,几乎一家占了半壁江山。阿里云日均32万亿排第二,腾讯元宝28万亿、DeepSeek22万亿紧随其后。但调用量第一和营收第一不是同一家——按Omdia统计,阿里云以35.8%营收份额稳居AI云市场第一,超过第二到第四名总和。火山赢在"轻",阿里赢在"重"。

Kimi和MiniMax的算力命脉就握在这两家手里。MiniMax上市后资本市场对Token增长狂热追捧——M2.5发布首周调用量暴涨至3.07万亿Token——但每一个Token背后都是真实的推理成本。MiniMax2025年全年营收不足8000万美元,经调整净亏损2.5亿,毛利率刚爬到25%。上游一涨价,这个刚转正的毛利随时可能被吃掉。

方法提炼:如何在算力荒中存活

第一,优先选择重资产玩家。阿里云、火山引擎这类自建基础设施的云厂商,抗波动能力更强。

第二,关注企业级方案。Kimi的Allegretto套餐已经199元/月,几乎和ClaudePro同价。如果继续涨价,"白菜价"智能就不存在了。

第三,Agent需求曲线还在陡峭上升期。KimiK2.5刚上线不到一个月,收入就超过了2025年全年;MiniMaxM2.5发布首周Token消耗量超过三家竞品之和。需求按周增长,供给按年追赶,中间的剪刀差就是涨价和限流的空间。

2026年,Agent改变了算力需求曲线。便宜的智能没变贵,使用智能的方式变了,资源出现了挤兑。涨价什么时候会停?短期内恐怕看不到。