提高成本效率,芯片制造商驱动:加速液冷散热技术渗透到数据中心

2024-09-29

随着 AI 随着大型模型的快速发展,数据中心服务器所需的功率密度大大提高,如何探索液冷散热技术成为当务之急。


最近,香港首个可以开展实际业务的液冷散热方案落地。一些服务器行业的人对 21 据《世纪经济报道》记者称,在世界许多地区市场,液冷散热的接受度仍然较低,如何平衡原始投资和市场扩张已经成为当前需要面对的问题。


英伟达之前发布过 GPU 虽然商品有两种技术路线:风冷和液冷,但大多数受欢迎的是风冷方案。随着新一代英伟达 GPU 发布时,预计液冷散热比例也将逐步提高。


Global Switch 来自香港的数据中心。图片


加速液冷商业


最近,数据中心服务商 Global Switch 与合作伙伴合作 Supermicro、xFusion(超聚变)和 Liquidstack 在香港数据中心,合作展示了第一个液冷技术机房的实景模块。


Global Switch 香港董事总经理 Eric Liu 介绍,这是香港第一个可以实际开展业务的液冷方案。过去几年,Global Switch 液冷技术数据中心基础设施也在欧洲等市场推广。“最近,香港的一些客户已经向我们咨询了液冷技术模块。此外,液冷技术的发展也是为了让数据中心的发展更加可持续。"


Eric Liu 告知 21 《世纪经济报道》记者, Global Switch 目前,香港公司不仅为众多头部公有云厂商提供定制服务,还为众多中小客户提供传统托管服务。我们的基础设施和运营管理可以更灵活地支持客户多样化的部署需求。"


随着 AI 大型模型正在蓬勃发展,客户端的需求也越来越多样化。“最初,传统数据中心服务器的最大功率在于 1000W,配备 10 台式服务器可以满足日常计算的需要;但是现在 AI 在时代,我们的顾客提出至少翻一番。 20KW 功率密度,如今已上升到 40KW 甚至更多。转化为液冷散热技术迫在眉睫。“他分析说,经过计算,业界认为,传统的风冷散热技术,最多只能支持到 25KW-30KW 功率密度的数据中心服务器,超过这个功率将无法满足运行需要。


因此,单个机柜的功率密度越高,需要的机柜总数越少,数据中心的建设规模就越集中。这个结果可以通过引入液冷技术来实现。


一个服务器行业的人也是对的。 21 根据《世纪经济报道》记者的分析,一方面,选择液冷散热技术可以更好地实现低碳化政策,同时提高计算密度。另外一方面,从业界重视的是什么? PUE从数据角度来看,传统的风冷散热服务器除了服务器本身的功耗外,还需要提供额外的空调来冷却服务器,这将大大提高用电需求,而液冷散热可以大大减少这个问题。


Global Switch 首席商务官 Matthew Dent 据分析,随着数据中心功率密度的不断提高,服务提供商需要提供足够完善的物理环境、电力、温度和湿度,从低到高灵活满足功率要求。“我们主要提供管道、监控、运维等能力,帮助客户灵活安排不同类型的数据中心机柜。”


第三方机构 TrendForce 集邦咨询认为,随之而来 NVIDIA(英伟达)Blackwell 新平台有望 2024 2008年第四季度出货,将明显增加液冷散热策略的渗透率,从 2024 年 10% 上下至 2025 年将突破 20%。随着全球 ESG(环境、社会和企业治理)意识提高, CSP(云服务业人员)加快建设 AI 服务器,预期有利于将散热方案从气冷转变为液冷。


但目前液冷散热技术主要有三种:冷板式液冷、浸没式液冷、喷淋式液冷,对于这一点,不同的服务器制造商有不同的选择。


上述业内人士对记者进行了分析,“我们认为,选择浸没式液冷方案所面临的难题是,目前主流 GPU 芯片供应商没有为该方案提供质量保证,即当产品浸入水中时,如遇意外,不承诺正常使用,因此维护成本较高。"


Matthew Dent 则告知 21 世纪经济报道记者,“这三种技术规范各有优缺点。目前,冷板液冷方案的优点是可以通过调节水温来减少数据中心的运行。 PUE、达到节能效果。”


成本向可控方向发展


一个数据中心服务商 21 《世纪经济报道》记者表示,尽管英伟达之前 H100 在发布过程中,提供了两种解决方案:液冷和风冷,但是市场上大多数用户更倾向于使用风冷。


归根结底,主要考虑到液冷服务器和配套设施的开发进度相对较长,成本较高,客户希望通过更快、更低的成本实现业务的快速落地,在行业内占据大模型的领先地位。


在投放市场初期,这也是新技术必须面对的问题:如何保证成本回收。


“根据我的观察,国外市场对液冷服务器的接受程度偏向于传统,宁可稳定。这是因为它还涉及到 IT 部门费用审批等问题。“上述业内人士分析记者,液冷技术作为一种新的技术路线,在开始投资时,由于水、电路等的改造,其初始支出确实高于风冷。”然而,我们计算了大约三年,我们提供的产品的使用成本和维护成本开始下降。考虑到服务器的一般寿命? 3~5 年,长则 5 年过去了,所以从长远来看,液冷方案要比风冷方案投入三年左右才能开始省钱。"


此外,国外市场更接受风冷战略的另一个重要原因是土地价格差异。“比如中国香港、新加坡等市场地价较高,对液冷技术的接受度会高于欧美主要市场。欧美市场可能会先考虑买更多的土地来推动风冷计划的路线。”前述人士继续说道。


对工业界担忧的投资成本问题,Eric Liu 指出目前市场上有一个误区,认为将数据中心转化为液冷技术意味着基础设施的一切都是从零开始的。“但事实并非如此。借助现有的基础设施和技术,我们可以在原有设施的基础上,通过与合作伙伴的联合,增加液冷方案的实施,实现灵活的部署。”


他继续说:“所有智能技术一开始都会投入很多,但是液冷技术会满足下一代客户的需求。同时,随着业务的不断发展,客户的投资效益会迅速提高,也有助于降低长期运营成本。”


根据记者的了解,Global Switch 位于将军澳地区的香港数据中心有三条海缆登陆站,也有利于赋能当地企业出海业务。


根据第三方组织世邦魏理仕的分析,预计香港数据中心市场规模将从 2023 年 30 亿美元,增加到 2028 年约 57 亿美金。这种情况也很大程度上归功于政策支持。今年 8 月香港特区政府曾公开表态,强调发展 AI 基础设施计算能力的重要性。按照官方估计,到达 2030 多年前,香港的计算能力需求将达到 PFlops15,000。


不仅如此,对于数据中心服务提供商来说,从过去开始 IDC 转为 AIDC 升级也成了现在的题目。


“现在我们还没有定义正在从现在开始。 CPU 为中心转为 GPU 作为中心,只是相比之下,GPU 需要快速增长。面临这一趋势,我们作为数据中心服务提供商,应对方法是提供灵活的解决方案。芯片不是我们提供的 AI 设备,但是可以根据客户对功率的需求,提供不同的散热方案,如传统风冷和新兴液冷。" Matthew Dent 向记者指出,Global Switch 从过去开始,我已经准备好承接了。 4KW 功率柜,到单机柜 120KW 需要升级功率。用户可根据需要随意选择气体或液体冷却技术,并通过不同的冷却路线进行规划。


据报道,中国香港和新加坡都是亚洲地区。 Global Switch 重视市场,“我们也在评价新区域的发展。在中国香港地区,有很多来自中国内地的新需求,包括跨境需求和地方需求。" Matthew Dent 据介绍,目前全球主要市场对数据中心功率密度的提高有较高的需求,伦敦、巴黎、法兰克福、悉尼等其他市场也是如此。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com