• 实时要闻
  • 当前位置:首页 > 实时要闻
  • 深度|当前智算中心面临的最大风险

    2025-11-12作者:大湾区国际数据中心大会暨展览会

    · Meta的Zuckerberg(扎克伯格):“在基础设施上超支数千亿美元的风险,小于被排除在外的风险。”

    · 知名半导体机构Semianalysis 的Dylan Patel透露:“OpenAI和Anthropic目前占据Nvidia GPU总出货量三分之一的份额,成为最大终端买家。”

    · 《The NVIDIA Way》一书作者Tae Kim在公开媒体发文指出:“问世8年的TPU利用率仍达100%,5年前发布的A100 GPU也已经售罄。”

    · Groq CEO、Google TPU创始人之一Jonathan Ross表示:“在Groq采用1年期摊销,那些沿用3-5年摊销期的做法“完全错了”。芯片不仅涉及资本支出(CapEx)的前期投资,还包括运营支出(OpEx)以及电力、水冷等配套成本。”

    ……

    当前全球科技与算力大厂都在疯狂卷AI与算力,以上言论值得关注,智算中心运营正面临一个巨大的隐藏风险:智算中心GPU的资本支出与折旧问题。

    111.png



    当前主流芯片更新周期


    下面是结合当前市场情况,列出的一些国内外主流芯片的更新周期(仅供参考):


    但实际运营智算中心时,面临的问题要比上表呈现出来的数字复杂得多。

    举个例子,以AI算力云业务的GPU投资回报周期为例:一台搭载8×NVIDIA H100 GPU服务器(成本假设为¥280万元人民币),在2023年前期算力紧缺时其租用价格一度高达每卡每小时4~8美元,若保持高利用率,十多个月即可收回成本。这使得不少运营者初期ROI(投资回报)看起来非常可观。然而随着2024年供给缓解、算力租赁价格下滑,中期租价降至每卡仅1美元/小时左右,按100%售出率测算5年总收入约¥450万,扣除设备与机房等成本(约¥560万,含服务器购置和5年运维电力等附加成本,五年反而亏损约¥110万。直线折旧法下前两年盈利、第三年开始亏损的现象表明:GPU资产的经济寿命通常小于账面折旧年限。


    为弥补后期亏损,常见做法是在第3年时再投入更新一批更新一代GPU,用新设备盈利来填补旧设备的折旧亏损,进行滚动扩张,但这也潜藏风险(扩大杠杆可能隐藏亏损直至难以为继)。因此,运营方更倾向于在性能/效率显著提升的新品出现时尽早更新GPU,保证算力供给具备竞争力,并避免旧卡后期大幅贬值带来的亏损,但这样又会带来新的风险。

    112.png

    GPU的折旧速度比想象的要快


    当前一代 GPU 的使用寿命比大多数人认为的要短,也比公司在摊销计划中预估的要短。我们正进入AI周期的下一阶段,在这个阶段,数据中心和能源供应日趋紧张,最重要的指标已经变成每瓦特产出的Token数 (tokens per watt)。需要关注的是,像Nvidia这样的芯片厂商已经转向1年的产品升级周期,这意味着每年你都能获得比上一代更强大、更节能的加速器。这与我们历史上经历的摩尔定律和芯片发展完全不同。Jensen (黄仁勋) 指出,从Hopper到Blackwell,将Token成本降低了10倍。也就是说随时未来的发展,GPU的摊销速度应该比新兴云服务商和超大规模云服务商建模的速度要快得多。在最近一期播客中,Groq的CEO Jonathan Ross,Google TPU 创始人之一就表示,Groq正采用1年期的摊销(那些采用 3-5 年摊销期的人完全错了)。对于芯片,你不仅有资本支出的前期投资,还有运行该芯片的运营支出 (OpEx),以及相关的电力和水冷成本。超大规模云服务商对GPU采用3-4年的摊销周期,而Corewave和一些新兴云服务商采用6年的Nvidia GPU折旧周期,但问题来了,如果他们的摊销周期是2年而不是6年,这些新兴云服务商的亏损会大得多,这是整个产业链中一个令人担忧的一个重要压力点。


    智算中心运营的最大风险


    可能有人会说,我看到很多人在租用Nvidia H100,那是Nvidia 3年前开始销售的产品,但这背后其实有两个重要原因。


    回到以6年摊销计算的Coreweave。这意味着,当Nvidia Vera Rubin在2026年末正式推出时,AI推理需求已经大幅提升,智算中心需要持续运行GPU需要持续高负荷运行时,必须要建造新数据中心才能维持,但这需要时间。所以,带来的结果就是,对于想要扩展算力大部分公司将不得不在现有运行的数据中心中用新GPU替换旧GPU,以获得更多每瓦特Token产出,因为他们的功耗受到限制,这将会在实际上大幅压缩GPU芯片资产的摊销周期。
    所以,当下延长GPU摊销周期的问题在于,即使今天利润看起来比实际更高,但当GPU换代的真实动作发生时就会面临成本大增亏损的风险。这也就解释了微软这类企业为什么会选择和云服务商合作:因为围绕看到客户对算力的需求激增。Microsoft希望维护客户关系并让客户满意,但对进一步增加资本支出缺乏足够信心,所以宁愿将部分风险转移给其他方。客户不知道也不在乎Microsoft是否拥有物理基础设施,当热潮消退时,Microsoft不必将芯片计为损失,因为新兴云服务商已经承担了这一风险。这对Microsoft而言是双赢——他们保留了客户,如果需求被证实是长期可持续的,他们有充足时间建设自己的数据中心并转回自身基础设施。与此同时,在当前所处的狂热周期中,微软还可以将芯片过时速度超预期的风险转移出去。总之,GPU作为AI时代数据中心的核心资产,其折旧和评估需要动态权衡技术演进和经济回报。对于高端GPU,3年前后即进入更新窗口,高负载环境甚至更短;数据中心整体资产评估则融合了财务折旧和算力价值视角,既看设备账面生命周期,也看其在不断变化的AI市场中的供需价值。不同区域由于运营环境和策略差异,在设备折旧和资产管理上各有侧重:比如我国重要强调可控回报和国产替代,北美追求效率领先和灵活财务,东南亚注重成本管控和外部支持。在未来几年,随着AI芯片技术的发展和各地算力需求的成熟,GPU资产的折旧策略和评估方法也将持续变化,值得算力产业高度关注。



    约2.65亿!168台智算服务器、49台组网交换机,2025年联通数科启动集中采购招标 深度|当前智算中心面临的最大风险 投资百亿,阿里云智能临平数据中心D楼完成通水通电 进入新建设阶段 数据中心行业亟需诞生一个“新角色” 总投资约22.28亿!嘉唐科技绿电超算中心及风电项目签约落户黑龙江通河 【重大项目竣工速递】练塘工业园区08-01地块项目(青浦云湖数据中心)完工 总投资11.9亿元 濮阳大数据中心项目主体封顶 百亿“链主”落地!长三角·平湖润泽国际信息港项目(B区)正式竣工 约2.65亿!168台智算服务器、49台组网交换机,2025年联通数科启动集中采购招标 投资26.2亿元,孝感大数据产业园一期项目开工 规划机柜约2376个!中国电信(国家)数字青海绿色大数据中心二期项目正式开工 总投资9.5亿元,湖北移动襄阳云计算中心数字信息化服务项目开工 十五五规划建议:适度超前建设新型基础设施,深入推进数字中国建设 绿色发展驱动格局重塑,数据中心迈向“全生命周期”降碳新纪元 1.44E算力 全球首个生产级GB300 NVL72超算集群正式上线 预计投资91亿美元 字节跳动巴西数据中心即将开工 总投资158亿,杭钢与阿里合作的浙江云计算数据中心南区项目即将动工 存量0.3779元/kWh!河南“136号文”承接方案征求意见 连下三城!正泰交付菲律宾三大数据中心项目,中国企业开足马力扬帆“出海” 唐河油品:打造应急电力保障安全护盾,守护数据中心电力生命线! 中标价格约32亿!华峻云计算产业园区项目(一期)EPC招标结果公示 湖北出台“算网存用”新政:重金补贴算力建设,推动存算协同发展 能耗、成本、碳排三重压:智算中心如何借“算电协同”实现破局? 微软狂砸73亿美元建“全球最强AI数据中心”,将部署10万块英伟达GB200 唐河油品:打造应急电力保障安全护盾,守护数据中心电力生命线! 中卫市数据中心集群建设刷新进度条:智算规模占全国13.6%、八大枢纽节点17%! 聚焦算力设施场景应用 发改委、能源局印发《新型储能规模化建设专项行动方案(2025—2027年)》 估值3.3亿元,成都一处T3+数据中心将被司法拍卖 英伟达一个卖GPU的,开始对数据中心建设指手画脚了 崩溃了!数据中心绿电直连、直供到底怎么选? 数据中心锂离子电池室消防自动灭火系统改造设计 从电力保障到AI未来:科士达为马来西亚国家级AI数据中心提供核心动力支持 数据中心建设流程全解析 数据中心浸没式液冷用含氟冷却液应用研究进展 不同冷却系统对液冷数据中心节能性的影响——大湾区国际数据中心 破解数据中心供电难题,驱动服务器稳定、高效运行——大湾区国际数据中心 全国首个绿电聚合直供数据中心试点项目在甘肃庆阳开工建设——大湾区国际数据中心 未来新建6栋机房!中国联通贵安智·云数据中心加速扩容——大湾区国际数据中心 数据中心电气系统比选分析——大湾区国际数据中心 AI时代的数据中心变革:算力重构、液冷革命与绿色突围——大湾区国际数据中心 数据中心基础设施的关键技术——云计算技术——大湾区国际数据中心 1GW! 全国首个绿电聚合直供数据中心试点项目正式开工——大湾区国际数据中心 AI数据中心液冷产业深度分析:技术演进、核心公司与投资机遇 南方万国数据中心REIT成功登陆上交所,上市首日涨停​,开创数字基建资产证券化新篇章​——大湾区国际数据中心 可持续数据中心之五:Google 数据中心 可持续数据中心之四:Equinix TR1 多伦多数据中心 普平数据集团(PDG)成为亚太地区首个获得超大规模 OCP Ready™ v2 认证的数据中心企业 27.5亿元!张家口新新瑞云计算数据中心项目1号楼主体封顶 数据中心的硬件构成有哪3个关键技术?——大湾区国际数据中心 不同的数据中心冷却技术及其互补性——大湾区国际数据中心

    @大湾区国际数据中心大会暨展览会 版权所有

    粤ICP备2024291375号