花费数亿建立智算中心,80%的GPU无法出租,重点分析

2024-12-21

欢迎关注“智能涌现”


作者邱晓芬


苏建勋的编辑


近两年来,中国AI产业出现了一个奇迹:


许多没有任何GPU背景和计算率经验的上市公司将计算中心作为他们发展第二曲线的起点,并将其策略转化为AI领域——例如,生产味精的企业(莲花控股)、造染企业(锦鸡股份)、甚至还有赌博行业的玩家(鸿博股份)等等。


但是到了2024年底,情况发生了逆转。


十一月二十九日,莲花控股宣布,其GPU服务器采购合同近7亿元,仅交付12台,其余318台因“存在不确定性”而决定解除合同——根据一台英伟达H800服务器210万元的价格,布局智算中心近两年的转型,该公司仅收入2500万元。


不仅是莲花控股,最近也有不少上市公司宣布,他们决定暂停或取消原计算中心建设项目,不惜承担合同违约的风险。



图源IC Photo


近两年来,国内智算中心的建设一直是行业对AI预期高涨的疯狂——截至上半年,国内算率已达246。 EFLOPS,智能化计算率同比增长65%以上,在许多领域,如工业、教育、医疗、能源等,计算率应用超过13,000个。


在一波智算中心建设热潮中,这些上市公司扮演着不同的角色。他们有的选择简单粗暴地支付建设费用,有的选择设备(如GPU/软件解决方案/算法模型),有的以更轻的方式介入,协助计算中心提供运营管理。


由两年前趋之若鹜,到现在由热转冷,国内智算中心发生了什么?


一个困难的账户

当许多计算中心人士最近访问国内各大计算中心时,他们对目前的市场情况感到惊讶。他们不谋而合,告诉《智能出现》,目前国内计算中心市场正处于沉默状态。


”“现在看来,机房出租率基本在20%-30%之间,有的是企业级。智算中心甚至只有10%左右”一位业内人士说。


从纯粹的商业角度来看,这不是一种健康的状态。一位业内人士拆解了一个智能计算中心的成本构成——


例如,由英伟达H100组成的千卡集群智算中心,前期投资成本如下:


购买算率设备约3亿;


网上设备的成本大约是2.5千万;


储存和安全设备的费用约为1000万;


平台软件和液冷改造费用约1000万;


总成本约为3.5亿元。


智算中心不仅需要在前期投入重资产,还需要在后续运营过程中投入日常电力、维修、人员费用等。经过计算,年支出约5000万元。


换句话说,在国内建立一个千卡集群规模的小型智算中心,前期要支付3.5亿硬成本,每年还要支付5000万元来支持运营。



图片来自 IC Photo


而且这些智算中心建成后,算率输送给谁?怎样赚钱?


目前国内厂商处理AI计算能力的方式有:大型互联网企业、弹药充足的AI企业、细分赛道的龙头企业,一般都是基于安全考虑,建立自己的智能计算中心。其他大多数需要AI计算能力的企业基本都选择了向第三方智能计算中心租用计算能力的方式。


另外,这些智算中心还可以为前三类玩家补充部分算率,以满足不时的需要。


近年来,智算中心建设的热情部分来自于政府补贴减少,尽管成本很高。近两年来,各地出台了各种政策支持智算中心建设。资金补贴,税收优惠,土地供应等等。


举例来说,有地方政策提醒,当项目总投资超过1亿时,就会有实际投资。5%-15%不同比例的补贴。在一些风/光资源丰富的省份,投资智算中心的公司也会给予额外的光伏指标。


一位业内人士总结,各地对智算中心建设的扶持政策,是需要“一地一议”的程度。


但是,补贴毕竟不在商业范围内。白花花的钱建成智算中心后,钱能否在后续回笼,主要是实际运行后能否回笼。租出多少卡片(即机房利用率)、还有租赁价格挂钩。


但是现在,这两个数据并不乐观。在不久前的一篇文章中,《智能涌现》指出,从年初的12-18万元/月,一台英伟达H100服务器(8卡)的租金价格,到目前为止,每月减少75000元,减少50%左右。


若按目前机房利用率的20%计算,一个英伟达H100千卡集群智算中心的年利润仅为2300万元( 即7.5 万元/月✖️12 个月✖️128 台服务器✖️20%)-也就是说,即使一个计算能力中心勉强维持经营,结果基本上是只能覆盖一半的正常运营成本。,更别提收回前面的重资产了。


投资建设智算中心,目前是一个艰难的账户。


130,000计算力中心,苦等加血。

很多业内人士告诉《智能出现》,目前智能计算中心存在严重闲置的情况。核心原因是计算能力中心投入应用后,发现AI需求没有预期的快速增长,计算率难以消耗。


以前大家都估计,国内的算率租赁市场每年都会有10%的增长,结果目前看来,只有5%左右。


所以,目前每一个智算中心的目标都是覆盖运营成本,“回到原来的理想,甚至是最高的标准,长久的理想。”。智算中心产业链企业「智伯乐科技」CEO岳远航告诉《智能出现》,经过他们的计算,发现即使一个智能计算中心的设备租赁率上升到60%,至少需要7年时间才能恢复原状。



图片来自 IC Photo


除AI需求没有像预期的那样出现外,智算中心闲置,本质上与其存在一定的滞后性有关。


举例来说,一些智算中心在设计研究时,一般都是根据当前的市场需求和硬件状况来设计的。而且等到真正落地的时候,一般已经过去了几个月甚至几年——而此时,硬件产品可能已经迭代了好几轮,甚至市场需求也发生了剧烈的变化。


目前,一些智算中心各自采取了措施,以尽可能降低日常运营成本。


一些智算中心直接关停岳远航说:“当我走进机房时,我发现灯已经关闭,没有嗡嗡的风扇散热声。此外,一些智能计算中心选择直接选择。出售英特尔和英伟达的旧设备。,最大限度地减轻资金压力。


对一些尚未建成的智算中心,一些企业选择在建设过程中暂停项目,或者直接取消规划中的二期项目。一位业内人士甚至《智能出现》表示,由于智能计算中心项目中途暂停,之前高价购买的英伟达卡“砸手”。


很明显,计算市场正悄然转变为买方市场。在过去的两年里,如果说这个行业是“一芯难寻”的话。、到目前为止,“算率难找”的情况已经完全相反。


如今,大多数AI企业更倾向于节约计算率,降低不必要的成本,通常会根据需求和预算选择合适的计算资源,比如要求更低的优惠价格,以及更好的服务。


一些智算中心争取市场份额,以维持计算率销售,还不惜选择降价、或提升服务(如提升运营能力、帮助下游优化模型等)等方式来吸引下游客户。


作为水、电、煤的普遍存在,计算率牢牢抓住了AI行业的命脉,尤其是在国际形势不明朗的时候。虽然计算中心在现阶段是一个艰难的账户,但我们很难粗暴地得到不应该重建的观点。


对长期而言,有业内人士抛出了一个问题——


“ 可能只是短期现象,因为AI算率无法消耗。你现在能暂时让计算能力中心闲置吗?还是等AI应用在未来爆发的时候,你能不能赶紧去建计算能力中心?"


延伸阅读:


房租在10个月内暴跌50%,为什么英伟达H100不香?聚焦分析



end


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com