继续创新压力,洗牌,摩尔进程要做“国产英伟达”?

2024-09-14

上线 4天内销售额超过1000万件,全平台最高同时在线人数超过300万,Steam平台27万。 评价,96%好评。第一款国产3A游戏《黑神话:悟空》的火爆,不仅有山西,还有国产GPU厂商。


当《黑神话:悟空》正式发布时,摩尔进程发布的V270.80驱动软件已经解决了《黑神话:悟空》Benchmark在DirectX11模式中运行时的闪回问题。大批玩家关注,8月25日摩尔进程百度信息指数达到近30天的峰值。



摩尔进程成立于2020年10月,在国内GPU制造商中相对低调。直到2023年10月,美国商务部突然将摩尔进程列入贸易管制“黑名单”,摩尔进程才引起市场大量关注。


然而,在风险投资圈,摩尔的进程是“高调”的。摩尔进程不仅核心团队来自英伟达,而且创始人张建中是原英伟达中国区总经理和英伟达全球副总裁。丰富的英伟达基因,以及近年来从高层到地方对国内替代政策的大力支持,使得摩尔进程受到资本的高度青睐。


据悉,在摩尔进程成立至今完成的五轮融资中,每一轮融资阵容都极其强大,管理层包括上下游资本、头部机构、政府基金、战略投资等。



在资本的帮助下,摩尔的发展速度更快。摩尔进程现有产品包括MTT,围绕TOC端桌面显卡。 S80、S70、S50、S30、S10。摩尔进程产品围绕TOB端AI模型,包括MCCX训推一体机。 D800、KUAEEAAI超融合一体机 FUSION,用来部署服务器推理,训练。并且支持LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、各种主流大模型的开源,如玉言。


换句话说,摩尔进程已经建立了从芯片、板卡、服务器、集群到软件的全栈AI智能计算产品线。市场认为,摩尔进程是国内只有国内GPU芯片厂商,在性能上可以与英伟达进行比较。然而,国内GPU市场正在进入洗牌阶段,以弥补软件生态和AI大模型技术快速迭代带来的技术创新压力,使摩尔进程真正成为英伟达。


01.桌面显卡销量有限,生态系统建设仍需使用力量。


"其盛也,始则人畏之。甚至人恶之,极则群起而攻之"。也许这就是英伟达现在的真实写照。


自2024年以来,英伟达已经招募了欧盟、法国和其他地方的监管机构进行调查,要求他们提供相关的销售和其他数据。此前,市场上有报道称,法国反垄断机构对英伟达当地办公室进行了突袭搜查,扣押了一些物品和相关数据。


据外媒报道,英伟达收到了美国司法部的法律传票,正式调查了英伟达。受此影响,英伟达市值暴跌近2800亿美元,创下美股最高纪录。按照合同赔偿客户只是一件小事,英伟达后续开放的很多技术才是重点。习惯于高调和强势的黄仁勋将如何应对成为全球技术行业关注的焦点。



早在供应链预期范围内,英伟达就被全球多个国家调查。服务器供应链表示,英伟达在AI中 GPU的市场份额高达90%,唯一的同级对手是AMD和Intel,但是两者的出货量与英伟达相差甚远。


英伟达在全球市场几乎没有竞争对手,不仅控制了下游客户的定价权和供应期权。台积电、富士康、广达等上游难以替代的巨大供应链也缺乏自主权。


然而,英伟达并不满足于此。一方面,它促进GPU产品的购买和使用,通过技术不断升级和投资,保持其竞争优势。


公开数据显示,英伟达自2023年至2024年8月底参与投资74笔,涉及金额高达109亿美元。包括数据中心设计、开发和运营企业Applied Digital,日本Google技术人员创建的Sakanana AI等等。


另一方面,黄仁勋不希望英伟达只扮演供应商的角色,而是试图将英伟达打造成一站式服务平台,即AI工厂,这是数据中心的所有关键元素,从而增加客户对英伟达产品的依赖。


面对英伟达不可动摇的地位和芯片短缺,以腾讯和阿里为代表的国内大厂商依托资金和技术,加快了AI芯片自主研发的进程。比如腾讯自主研发的电影编码芯片沧海,已经进入量产阶段,支持云游戏到视频直播等服务。一些资金和技术实力较差的厂商,要么选择租赁,要么选择从东南亚购买A100和H100系列芯片,然后通过香港进入中国市场。


此外,调整大模型的训练方法已经成为许多制造商的策略之一。零一万物CEO创始人李开复表示,由于缺乏足够的GPU资源,他们只能开发更有效的AI基础设施和推理引擎。这种低精度的培训模式也应用于美国海外制造商,其核心优势在于加快模型的输出速度。


海外谷歌、OpenAl、除了加快自主研发芯片的进程外,微软、Google和英特尔等大型厂商最近还携手成立了Ultra。 Accelerator Link。建立UALink联盟的背后,正是为了打破谷歌的生态护城河。



根据服务器供应链,英伟达的护城河绝不仅仅是一个拥有10多年研发的强大GPU技术和平行计算架构CUDA。NVLink和NVSwitch交换机芯片在2014年推出,使得英伟达的GPU技术和生态系统更加强大和完整。作为一个封闭的生态系统,CUDA只能在英伟达自己的GPU上运行。NVLink也是英伟达独家开发的,竞争者只能采用PCIe等其他互联协议。


目前,中国的GPU行业面临着与英伟达CUDA相似的软件生态系统缺乏的核心和突出问题,尽管摩尔进程建立了适应MUSA生态的MUSA生态。 CUDA,但是很多JD.COM平台已经购买了MTT。 S80客户称,MTT 由于软件兼容性、卡顿性等问题,S80可能不适合新手使用。



很多玩家在评价之后发现,MTT S80的实际表现与英伟达等一线厂商的显卡还有很大差距。按照黑色神话检测工具的标准,MTT S80大致处于勉强可以玩的状态。在《黑神话:悟空》开启服务之后,很多玩家也对打开游戏后出现黑屏、闪回的情况做出了反应。


在摩尔进程V270.80驱动版和1280*720p分辨率中,玩家李阳(化名)告诉DoNews,《黑神话:悟空》的最高分辨率只有20多帧,真正进入游戏后无法畅游。



桌面显卡的竞争力仍然需要提高,这直接影响到其桌面显卡的销量增长。JD.COM官方旗舰店MTTS80评论量仅为2万。 ,其它显卡商品的评论量不到2000点 ,这个方面说明摩尔进程桌面级显卡出货量不佳。


此外,从与APP厂商的前期沟通到中期APP厂商的安排、开发和测试,再到最终完全上线,整个内容生态建设不仅耗时较长,而且需要厂商依靠庞大的营销团队和技术团队。



不仅是软件生态,芯片互联也是一个大问题。联发科CEO蔡力直言,从整个系统来看,芯片之间的互联技术是除计算部分以外发展的最大瓶颈。换句话说,如何不断突破软硬件问题,可能是摩尔进程这个相对年轻的GPU企业需要长期解决的问题。


02.大模型技术不断升级,面临创新压力。


为了“围剿”英伟达,国内厂商逐渐分化了两条实际路径。首先,大多数以兖原和天数智能芯为代表的制造商从对硬件和软件要求不高的推理场景入手,以防止与英伟达竞争。


另外一家以摩尔进程、华为为代表的少数厂商,选择从千卡到万卡进行训练,重点训练场景,直接硬刚英伟达。


比如夸娥摩尔线程(KUAE)基于大型智算加速卡MTTT基于智算集群解决方案。 S4000,可以从千卡扩展到万卡集群,从而建立一个先进的计算率基础设施,用于大模型和通用人工智能。


摩尔进程创始人兼首席执行官张建中表示,夸娥万卡智算集群作为摩尔进程全栈AI战略的重要拼图,可以为各行各业的数字智能转型提供澎湃算率。


制造商的理想可能很美好,但现实是国产AI芯片在落地过程中不可避免地会出现各种问题。包括讯飞、百度、腾讯等互联网大厂商在内的华为推出的Ascend系列AI芯片客户。然而,援引英国《金融时报》报道称,Ascend和英伟达芯片在AI模型培训方面仍存在差距,存在稳定性问题、芯片连接问题、华为CANN平台错误频繁传播问题等。在使用华为芯片时,百度经常会出现崩溃,从而影响AI项目的开发。


为了解决问题,华为直接派工程师到现场处理客户问题,百度、科大讯飞、腾讯都有华为团队支持。与华为相比,华为Ascend系列芯片在为摩尔进程敲响警钟的同时,在资金和人员配置上略有不足。如果采用华为常用的“堆人头”定制服务模式,也会对其综合成本、现金流、利润提出很大挑战。


除了上述问题,目前全球GPU厂商面临的问题是AI大模型技术迭代速度过快与芯片长发展进度的矛盾,这对摩尔线程的可持续创新能力和市场洞察力提出了极高的要求。


今年以来,半导体行业重点关注高带宽存储器和高速传输技术两个方向。无论是三星、SK海力士、美光快速配制生产能力,加快量产HBM满足市场需求,还是运算芯片厂商纷纷投入通信传输技术开发,比如英伟达的NVLink、UALink由英特尔主导,博通和Marvell都致力于各个层次的高速传输研究开发,通过SerDes和UCIE相关IP技术切入市场,联发科和神盾集团可以侧面证实。


但是行业IP核在GPU中占据了80%以上。但是IP的研发并不容易,GPU 需要36-48个月的IP自主研究和200名工程师。选择购买IP可以缩短12-18个月的开发周期。而且前端和后续设计的高端芯片需要1-3年,流片阶段需要3-6个月。如果流片失败了,只能继续上演这个过程。而且即使流片成功,也要经过3-12个月的产品检测升级,才能开始大规模生产。


这意味着当时GPU制造商提出的AIic设计理念可能很新颖,但如果成品制造出来,很有可能跟不上市场需求和行业技术进步,最终会被市场淘汰。


换句话说,在AI模型时代,GPU制造商面临着比以前更大的压力,更难生存。张建中还指出,摩尔的目标是至少生存10年。


国内GPU洗牌加剧,摩尔进程迎接考试


不只是摩尔进程想要“活下去”,国内许多投资者也不断地对自己所说的被投项目需要“先活下去”。


近两年来,在地缘政治带来的不确定性和运营管理团队融资不足等多种因素的共同影响下,国内GPU厂商一度在芯片领域走红,行业急转直下。


GPU制造商烧光融资,或者裁员或者解散。因此,到2024年,这一状况不但没有得到改善,反而继续恶化,国内GPU产业正迎来洗牌整合期。尽管在6年内完成了10次融资,但累计融资金额高达70亿元,目前正在开始a股IPO流程。然而,并不是所有的GPU制造商都如此“幸运”地获得了约25亿元的融资,估值约150亿元。为重庆当地AI独角兽而战的象帝因与资本的赌博失败而遭到投资者的反击。企业关闭,大规模裁员,创始人由“吸金人”转变为失信人。



南京锤算子公司锤算上海。近日,虽然东芯与其他投资者投资2亿元和1.28亿元,暂时消除了资金短缺的困境,但GPU的重资金特征意味着后续可能需要寻找大量外部资金来延续生命。在GPU项目越来越谨慎的背景下,大量GPU公司的倒闭让投资者血本无归。随着全球科技市场的不断变化,这个问题变得更加严重。


宏邈董事长和执行长陈俊圣指出,恐怖电影正在全球技术产业上演。尽管发展路线不同,但制造商或建立计算能力中心或建立数据中心都需要服务器、存储器和海量数据。投入这么多费用,又有多少厂家挖到金矿?虽然微软从Copilot中受益匪浅,但是它是否愿意投资呢?或许目前厂商仍然关注AI硬件、计算率等,但核心仍然是商业模式的延续。


陈俊圣的焦虑是当前全球技术产业的真实写照。除了英伟达,短期内真正盈利大幅增长的厂商有限。在AI大模型上游,AI大模型的爆发让国内服务器一哥和号称率领先的浪潮信息在2024年上半年暴涨,转亏为盈,业绩创历史新高。



然而,在信息业绩大幅提升的背后,以价换量是相当有意义的。2024年上半年,7.74%的毛利率创下了近年来最低毛利率的浪潮信息。根据浪潮信息,毛利率下降主要受客户结构、产品结构、原材料供应、市场竞争等综合影响。换句话说,如果后续GPU厂商竞争激烈,是否也会采取以价换量的策略?



对于大型制造商而言,Open AI仍然处于亏损状态。援引The Informantion报道,Open 尽管AI的利润从2023年底的16亿美元迅速上升到今年上半年的34亿美元。但是《纽约时报》预测,Open AI的技术投资可能超过70亿美元,是其收入的两倍以上。现在Open AI正在调整组织结构,筹集新一轮资本。


但Open AI的34亿美元收入是基于每周活跃用户2亿,每月收费20美元的基础。国内有多少大型厂商可以实现GPT用户数量,让用户愿意继续支付?当大型厂商长期亏损,不断优化算法模型,降低对AI芯片的需求时,GPU厂商会面临哪些问题?


另外,与英伟达的产品相比,当地的GPU芯片还有很大的差距。从ic设计的角度来看,与英伟达的差距是12-18个月。在芯片制造工艺方面,英伟达选择了3纳米工艺,目前国内止步于5-7纳米,这使得已经处于融资困难、退出困难的金融市场更加谨慎。


随着客户结构和AI大模型市场的变化,摩尔进程如何应对未来可能出现的现金流问题,持续补充业务所需的大量资金?


或许摩尔过程中经历的这些问题就是目前国内很多GPU厂商的现状。正如张建中所说,摩尔过程希望做的是解决最难做的事情,帮助中国和行业处理计算能力不足的问题。


在国内替代的道路上,或许摩尔的过程中还有很多问题需要一一解决。然而,正是许多摩尔工艺制造商的出现,预计国内外差距将逐步缩小,并可能实现超车。


本文来自微信微信官方账号“DoNews”(ID:ilovedonews),作者:曹双涛,编辑:杨博丞,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com