2026-01-08作者:大湾区国际数据中心大会暨展览会
前数据中心行业投资还没到泡沫,更多的是结构性问题。
未来电信的业务模式将发生重大变化,经过几年的发展,云计算在运营商的经营角度来看已经成为基础业务了。下一步价值的变化是Token。
数据中心行业人拼得的已经不是你有多少机柜,你有多少服务器,而是你用最优的成本,压榨出多少算力,你的碳力值是多少,你的快速响应交付能力是多少,你的技术是否能获得客户的认可,这是你的生存需求证。
模型任务数据、集群负载数据和底层调度数据实际上是三个数据的孤岛,怎么把它们联动起来呢?很重要的是值的负载率。
……
一个数据中心脱网,引发60多个数据中心集体“崩盘”——这不是科幻电影,而是发生在美国弗吉尼亚的真实案例。当AI训练负载以20兆瓦的速率剧烈波动时,电网稳定性的多米诺骨牌瞬间倒塌。
这个惨痛教训,正是2026年全球数据中心产业面临的缩影:算、电、热——每一项都在向极限发起挑战。本期,IDC圈结合第二十届IDC产业年度大典(IDCC 2025)嘉宾精彩发言为大家梳理2026年数据中心正面临的五大核心挑战:
GW级数据中心园区一年电耗可能高达50亿度。这个数字意味着什么?相当于一座中等城市全年的用电量,全部被一个园区“吞掉”。在美国,能源供给瓶颈已经显现;在中国,当智算中心以年均25%的电力负荷增长率疯狂扩张时,同样的问题正在逼近。
更深层的矛盾在于:智算中心申请用电时,电力公司必须预留相应的储备容量。选择2N冗余架构意味着双倍的容量占用——不仅仅是消耗问题,而是整个电力系统的资源锁定。到2028年,智算中心对电力的“占用”规模将远超实际消耗,这才是真正让电网规划者头疼的问题。
电费占数据中心总投资的20%,但在运维费用中这个比例飙升至56%。从去年的数据来看,整个数据中心行业在美国的耗电量相当于纽约十年的用电总量。到2030年,北美和中国的数据中心耗电量占当地全社会用电量的比例都将达到惊人的高位。这不再是一个行业问题,而是关乎整个社会能源结构的战略议题。
机柜密度已经突破1000千瓦,2026年兆瓦级单机柜即将成为现实。液冷时代已然到来——但液冷就是万能解药吗?
一个被忽视的细节是:液冷系统中DN50规格的管道只能支撑两三百千瓦的散热需求。当功率密度继续攀升,管径必须加大,但这将给安装部署带来巨大挑战,甚至需要打破传统标准机柜的设计框架。液冷解决了一个问题,却打开了另一个潘多拉魔盒。
地域差异让问题更加复杂。缺水地区如何保障液冷用水?寒冷地区如何解决防冻问题?当芯片密度以每年20%的速度增长,制冷技术的迭代速度能否跟上?2025年出现的超节点已经是100千瓦起步,2026年新建的数据中心将以100千瓦液冷机柜为基本形态——这不是未来,而是已经到来的现实。
一个更隐蔽的矛盾正在浮现:企业天然追求PUE最优的解决方案,因为在TCO(总拥有成本)的贡献中,PUE的权重远高于WUE。结果呢?某些区域因为所有企业都选择低PUE方案,水资源已经捉襟见肘。能源效率与水资源消耗之间的跷跷板,正在考验每一个数据中心运营者的智慧。
传统交流供电方式下,63A线缆能支撑的功率极限大约在300千瓦,极致情况下可以做到370千瓦——这就是天花板。电怎么供进去,线缆怎么部署,成为AI时代数据中心的第一道拦路虎。
更麻烦的是服务器内部的空间争夺。以前服务器电源(PSU)可能只占6U空间,但随着功率密度提升,PSU占用的空间可能膨胀到20U。计算单元和供电单元在机柜里“抢地盘”,这显然不是长久之计。
AI训练带来的并行计算特性,让负载波动变得前所未有的剧烈。根据UPTIME的统计,单次数据中心停机造成的损失超过100万美元,而电力故障导致的停机占比高达40%以上。不同等级的数据中心对在线率的要求从4个“9”到5个“9”不等——后者意味着全年停机时间不能超过5分钟。在负载像过山车一样起伏的AI训练场景下,这几乎是一个不可能完成的任务。
AI时代的业务迭代速度远超传统IT。大型数据中心的交付周期需要压缩到90天甚至更短。你的客户已经在追问:T+6甚至T+3的高效交付,你能做到吗?
建设成本同比增长40%,投资回收期延长至5到6年。这背后的主要推手是高端GPU的大规模采用——算力中心不是传统机房的升级版,而是一种全新的基础设施形态,从承重结构到制冷系统,从供电架构到网络拓扑,几乎每个环节都要推倒重来。
运维端的压力同样巨大。万级服务器构成的集群,如果按传统的“多少兆瓦配多少人”的模式扩张,人才供给根本跟不上。AI运维正在从锦上添花变成刚需:故障定位时间必须缩短到分钟级,否则百万美元级的停机损失将成为常态。一个残酷的现实是:基础设施资源利用率普遍偏低——网络端口、电力、空间、机柜,每个维度都存在大量浪费。一边是疯狂的资源消耗,一边是低下的利用效率,这种结构性矛盾正在吞噬行业利润。
放眼全国,传统数据中心的上架率有的地方不到30%。资源错配令行业痛心疾首。与此同时,阿里巴巴等头部企业的管理层却在财报中表示数据中心基础设施供不应求。这个看似矛盾的现象背后,是产业协同的严重不足——传统机房产能过剩,AI适配机房却一柜难求。
技术层面的割裂同样触目惊心。异构融合说起来容易,做起来难。我国算力结构相对单一,高端算力紧缺,国产芯片的软件工具链尚不成熟。模型任务数据、集群负载数据和底层调度数据实际上形成了三个数据孤岛——IDC不会把基础数据交给集群使用者,集群使用者也不会把调用数据交给模型端。如何打通这三层数据,提升整体负载率,是摆在整个产业面前的共同难题。
从金融视角看,数据中心行业投资还没到泡沫阶段——空置率和回报率都还在合理区间。但结构性问题已经非常明显:老的IDC在2012年、2013年靠抢能耗、圈土地野蛮生长;到了今天,市场下手无情,高功率机柜、液冷支撑能力、百兆级交换能力成为新的入场券。战略上犯糊涂的企业,正在被市场淘汰。
数据中心在一个生命周期内会装载多种算力芯片,掌握芯片发展趋势对于基础设施规划至关重要。近十年来,行业几乎一直在比拼TCO和PUE——谁做得更优,谁就是更优秀的数据中心。但进入AI时代,评价维度正在发生根本性变化:用最优的成本压榨出多少算力、碳力值是多少、快速响应交付能力如何、技术能否获得客户认可——这些才是新的生存需求证。
IDC是重资产行业,技术能力强的企业可能因为资金链断裂而倒下。那些在市场上生存下来的老江湖,早已学会利用金融工具把成熟资产盘活,把死钱变成流水,滚雪球式地浇灌新兴业务。从纯粹的资产持有者变成灵活的资产经营者,这是一家企业的格局与高度,也是穿越周期的生存之道。
@大湾区国际数据中心大会暨展览会 版权所有