智算中心,建设热潮的终点是产业运营

2024-08-31

如何操作大量建成后的算率消纳?成为业界日益关注的焦点。



8月28日至30日,2024中国国际大数据产业博览会正在贵阳如火如荼地进行。一位业内人士观察到,与以往不同的是,在这次数博会上,数据元素、智能计算基础设施正在与智能化、大模型应用领域等一起成为一个热门话题。


各式各样的专业论坛,人潮汹涌,展区人头攒动,大家交换各地的项目信息和技术规范。


据业界观察,2024年,智算中心建设热持续升温。据数智前线不完全统计,仅在今年的前七个月,中国就有140多个智算中心相关中标项目。,而且还有更多的项目在路上。


在过去的一个月里,各地的智算市场仍然有许多新的趋势。8月中旬,两大绿色智算中心项目总投资13.5亿元在新疆石河子签约同步建设;下半年,华中湖北襄阳正式宣布,第一个智算中心正式启用;随后,位于东北的哈尔滨也有消息称,“中国最大的超万卡智算中心”将于月底投入使用。


各地都在密集推出各种智能计算项目,地方政府、中央国有企业和产业链企业都非常活跃和积极。每个人都把它作为新生产力发展的关键抓手,或者说是吸引投资的有力途径。


但另一方面,随着建设的不断推进,市场上出现了一些共性问题。在8月初在北京举行的一次气氛热烈的智算会议上,一家大型央企曾坦言,已经投产的智能计算中心目前面临着巨大的成本和经济效益挑战,呼吁产业链更多地利用计算率。


智能计算中心的建设如何更加务实?如何操作大量建成后的计算率?成为业界日益关注的焦点。


01 计算焦虑,有解决办法吗?


去年,大模型的爆发迅速搅动了智能计算市场。“以前大家都不知道怎么用百P的智能计算中心,但是大模型火了之后,社会对计算能力的需求就处于疯狂上升的趋势。因此,许多地方政府有信心投资更大规模的智能计算中心。”一位资深行业人士告诉数智一线。


自今年年初以来,智算中心的受欢迎程度日益增加。尤其是以三大运营商为代表的地方政府和央国企,都在大举投资。例如,根据IDC的统计,截至今年6月,参与政府建设并投产的智算中心数量已接近百个


在这种情况下,更多的玩家迅速聚集和扩大产业链。一位智能计算中心的建筑承包商告诉智能前线,每个人都在疯狂地寻找项目和谈论合作。


另一方面,随着智能计算中心如雨后春笋般涌现,如何使用越来越多的智能计算率成为焦点。“毕竟算率还是消费的。”一位供应商在向数智一线介绍了自己的计划后,立刻表达了自己的感受。


“算率问题现在是双重焦虑。当你没有的时候,你会焦虑。”北京电力智能战略与市场负责人杨震坦言,在过去的一年里,作为北京电子控制的AI出身公司,他们接触了大量的政府和企业客户,能够明显感受到每个人对于消纳算率的需求越来越迫切


归根结底,之前一波智算中心的建设,已经踩过一波“高空置率”的坑。一位业内人士透露,2021年、有些项目在2022年上下建成后,甚至平均利用率都不到30%


在新一波的建设热潮中,业界也看到了隐患。“我们公司接待了很多来自其他地方的客户,我们也想建立一个智能计算中心,但经过讨论,我们发现他们中的许多人不知道基本概念。”一位智能计算服务提供商直言不讳地表示,这让他们担心,如果没有足够正确的认知和科学规划,“一哄而上”,未来是否会很快出现“鸡毛遍地”。


在过去,只要你有钱有人,你就可以建立一个小型云计算中心。然而,智能计算中心不同,发展还处于起步阶段。从规划、建设到运营的每一个环节都极其复杂,充满挑战和风险,远不是简单地堆砌一堆GPU服务器。


同时,在如火如荼的智能计算发展建设中,技术层面仍有大量的卡点。“大型智能计算中心是重大科技攻关的重要基地。从底层芯片和数据原材料开始,到工具链和大型模型的能力制造,智能计算云的能力投放,以及液冷、网络、存储等多个基础设施的技术层面,以及如何真正为行业服务,都需要整体的规划和建设。”杨震说。


以电力问题为例。上半年,为了满足人工智能和数据中心的电力需求,美国电力开发商新增发电量20.2GW(1GW=100万KW),同比增长21%,创下近20年来的最大增长。一些企业甚至计算,最近马斯克建成的10万卡AI集群“孟菲斯”一天的功耗相当于北京东城区一天的功耗。


事实上,为了解决这一问题,行业已经开始关注智能计算中心的科学规划和合理运营。今年7月,国家信息中心信息化和产业发展部主任单志广提醒,在构建一体化计算率体系的过程中,为了避免重建和轻需求,应以应用为导向,提高整个算率中心的应用程度。


在一些地方,计算能力的需求也是通过计算优惠券来驱动的。有些投资者会在招标时提出项目承包商要做相应的运营KPI考核。但仅仅这样做是远远不够的。


杨震认为,虽然市场倾向于通过包销或吸引投资来解决问题,但效果并不能立竿见影,可持续发展。例如,一些地方政府可以通过计算优惠券等方式短时间带动需求,但由于行业没有实现“自我成长”,后续实力不足。。这类顾客开始主动寻找他们,讨论有效地管理、加速和运营其计算率。


一些业内人士开始反思和总结,真正需要建设的不仅仅是智能计算中心,而是以智能计算中心所在公园为核心,辐射上下游产业链,汇聚产、学、研融合的产业群体,形成当地的人工智能产业生态。


"从长远来看,打造一个健康良性的智算中心商业闭环。,或者更关键、更有效的方法。”杨震告诉数智前线。


因此,在帮助当地政府建立智能计算中心时,业界已经开始呼吁将人工智能产业链真正用于当地经济,形成良性循环,从一开始就与当地产业经济紧密结合,进行整体规划和生态引入。


02 商业闭环,如何跑通?


对于各级政府和企业来说,如何从最后开始构建智能计算中心的商业闭环,本质上是挖掘人工智能的使用场景,实现当地产业或单位的智能转型升级。


"我们通常会说,与其给予政策,不如给予商业闭环的机会,让人工智能企业自循环成长。。”杨震说。比如,当地政府最初可以释放自己的一些数据和场景,形成一些人工智能的标杆,然后进一步与当地行业和龙头企业结合,让雪球越滚越大。


但是,为了让政府和企业建立标杆,行业首先要从人工智能的三个要素——算率、数据和算法等方面做好充分的准备。目前,这些要素中仍有许多卡点。


例如,在算率方面,为了支持人工智能产业的爆发需求和自主发展,采用各种国产芯片建设更多集群已经成为一种趋势,但国内最早的计算能力平台在各地的利用率并不高。很多用户反映,国产芯片的生态还有很大的发展空间,结构不同,工具链、软件、算法都是自成一体的。在这些平台上移植大型模型需要做大量的工作。


相比之下,英伟达的市场份额为80%~90%。它多年来一直投资于CUDA生态,促进了全球框架、算法和应用的创新和优化,无一例外地落到了它的平台上。今年,英伟达还突出了一个声明:禁止基于CUDA的其他硬件平台运行软件。这意味着,其它芯片制造商更应该孤军奋战。


一些厂商已经开始行动,以填补底层计算率的山谷,实现大模型在不同平台上的自由流畅运行。比如北电数智针对性推出了“前进”和“宝塔”两款产品,“初衷是高效协助。国产芯片更好的集群战斗。”杨震说。


在这个过程中,我们必须克服许多技术困难。北电数字智能产业生态学负责人吴岳举了一个例子。适配层,填补和屏蔽软件栈中国产芯片的差异,对齐算子精度;通过开发高性能算法,优化加速主流框架,将国产芯片性能提高到2~3倍


目前,大多数异构集群本质上是分离的。北电数智作为公共智算中心的规划建设和建设运营商,希望“算率烟管”可消除。"通过Token计费与我们的混池技术相匹配,我们可以将智算中心的利用率提高到两倍左右."


这儿有许多愚蠢的功夫,但我们认为这是必须的。”吴岳说。只有通过这些,国产芯片才能更好地销售和使用,才能不断得到更好的生态支持。


另外,决定人工智能结局的关键因素——数据方面,根据统计,在美国,中国的开源数据集总量只有1/9,80%以上的优质数据掌握在政府、机构和公司手中,由于缺乏可靠的数据空间,很多数据无法获取,无法流通,无法使用。而且,人工智能是一个热门数据产业,高质量发展的基础在于高质量数据的流通。因此,行业正在进行大量探索。


“这里边最重要的是保护数据提供者的利益。。”杨震分析说,“现阶段市场不成熟,大家的认知也不均匀,最重要的是建立规则和机制。。“比如像医院这样的公共机构,要想真正为公众创造财富,除了需要一个可靠的平台主体,还需要在制药、诊疗、医疗等不同领域确认使用权利,以及数据价值的确定和分配等方面面临和解决大量优质数据的问题。


因此,基于上述考虑,他们专门创建了一个商品——红湖可信数据空间。杨震认为,如何在这个数据空间中探索流通规则是核心。与过去的公共数据空间相比,可信数据空间不仅强调隐私计算、区块链等数据安全技术,而且通过上链存证、数字合同等能力,让供应商和买方可以直接对接,约定数据的用途和使用次数。,并且通过技术手段进行监督,规则建立后,可以形成闭环。


目前大部分企业对数据交易的规则和认知还没有拉齐,还有很多规则需要不断建立。比如在科研机构面向同一个研究领域,如果一方共享所有洞察信息,就应该有权访问同一个研究领域其他科研机构在空间内的洞察数据。这一规则建立后,可以有效叠加数据洞察,加快该领域的研究进展。


此外,面对企业级数据流通的实现需求,有实际场景应用的数据需求者可以通过第三方可靠主体保护数据隐私,规避合规风险,挖掘数据价值,在可靠的数据生态系统中实现数据资产的商业转换。


在算法方面,为了在打开用户场景的同时打开数据,业界认为垂直模型和场景模型是当前有效的方法。北电数智规划的垂直模型矩阵,多与政务、医疗、文化、教育、交通等民生有关。比如北京电力数字智能揭牌,执教北京市某委办公室政务大模型项目;与三甲医院合作签署“皮肤数字医疗协同项目”,探索医院大语言模型、多模态AI技术、国产AI芯片的应用;与领先的工业公司合作供应链模型等。


“在这个时代,人们需要善于做产业组织和产业攻坚的事情。如果他们理解了底层的物品,上层的物品就很容易解决了。”目前,北电数智正在联合生态合作伙伴,在AI产业链的每一层建设产品,形成对外全栈服务,打造AI工厂的智能计算中心。


03 为什么智算中心需要“打开”?


除计算率、数据和算法攻关外,生态聚集也是极其重要的,这已经成为行业共识。


“对于整个行业来说,在过去的20年里,我从未见过任何技术浪潮。像这个大模型一样,我可以从上到下颠覆技术和商业。”一位从业者觉得所有从业者都转向了全面的技术创新。开放合作、产学研合作等形式变得极其重要。


“人工智能产业需要通过项目和生态实践,把每个人都引入其中,一起工作。”杨震认为,“这是我们最深刻、最底层的想法和做法之一。”


北京市数字经济计算能力中心是北电数字智能规划建设和运营的第一个星火智能计算标杆项目。与普通智能计算中心不同,整栋楼没有充满机柜、服务器、芯片等基础设施。智能计算中心一楼采用开放式设计,这里有计算展厅,计算剧院,联合实验室,以及准备中的产投孵化计划。它也是国内智算中心的第一个。



这一设计,寓意打开智算中心的产业聚集高地,充分聚集产业要素,实现技术攻关,以及生态的汇聚。,最终尽量打开人工智能的场景,使产业形成闭环。智能计算中心不再仅仅是计算提供地,而是人工智能产业的孕育基地。


“本质上,我们不是在运营智能计算中心,而是在运营人工智能产业生态。我们的目标是成为生态的一流节点。”杨震说。在过去的一年里,北电数字智能几乎每月接触100家生态企业,旨在快速形成初具规模的人工智能产业链,为企业和政府客户形成“即插即用”的人工智能赋能平台。


当前,北电数智已经开始协助各地智算中心进行规划建设和运营,通过这些技术攻关和生态汇聚。


计划初期,智算中心要注意各地的产业布局。。比如某个地方以旅游为主,需要结合文化模式赋能文化和文化创作。然而,另一个靠近它的城市有制造业的领导者,人工智能应该考虑提高制造业的质量和效率。


为什么智算中心建设一开始就要考虑当地的工业经济?那是由于它涉及到智算中心的规划建设。比如动画、机器人、无人智能驾驶、低空经济等不同的行业。...它们对智算芯片的需求不同,不同芯片之间的比例也不同。


“就像低空经济一样,它需要大量的模拟计算、图形渲染和AI计算。如何匹配所需的芯片是一个很大的知识。”吴岳说,如何兼顾实践和推理,给出芯片选择的建议,是一件专业的事情。只有前期科学规划,后期才能更好的操作。


为了进一步深入协助当地智能计算行业的运营,他们还在机器人、AI制药、工业、模拟等垂直领域的开发者上花了更多的时间。数智一线了解到,北电数智将突破专门领域的大模型算法,让目前只能在英伟达算率上运行的专门领域的模型算法转化为国内计算能力平台。


所有这些工作都将进一步深入开放各地行业的人工智能场景,通过在计算率、算法、数据三个要素的层面上充分开放,以开放的理念建设和运营智能计算中心,充分拥抱AI产业链各个层面的生态。只有这样,智能计算中心才能成为人工智能产业长期发展的沃土,人工智能才能真正落入当地产业经济发展阶段。


本文来自微信微信官方账号“数智前线”(ID:作者:赵艳秋,szqx1991) 周享玥,编辑:牛慧,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com