六年心血付诸东流,马斯克叫停自研芯片究竟为何?

08-17 06:42

俗话说:“欲练神功,必先自宫。”为应对即将到来的车企激烈竞争,马斯克要对自己“下狠手”了?

不久前,彭博社报道称,特斯拉突然终止了已研发六年的芯片项目Dojo,这简直是舍弃了核心业务啊。

不仅六年的工作成果付诸东流,整个研发团队也随之解散。

项目负责人彼得·班农直接辞职,约20名工程师也跳槽到一家名为DensityAI的初创公司。巧合的是,这家公司的老板正是2021年首次发布Dojo芯片的前特斯拉总监加内什·文卡塔拉马南。

可以说,特斯拉裁员“催生”了一家新公司。

而此时的特斯拉,只剩下一团糟的局面。甚至有消息称,Dojo的专利都不在特斯拉手中,以后想再重启这个项目都没机会了。

这确实让人意外。毕竟Dojo刚推出时,大家都对它寄予厚望。

大家都知道,特斯拉智能驾驶采用的是纯视觉算法,该方案上限高但下限也低,关键在于算法能力。由于是端到端架构,迭代算法只能依靠不断训练。

特斯拉启动Dojo项目就是为了智能驾驶训练,如果成功,能让特斯拉FSD达到极高水平。

过去用于智能驾驶训练的GPU并非专门为深度学习训练设计,而Dojo通过分布式2D架构解决了高带宽和低延迟问题,存算一体的设计让训练能效更高。相比主流的英伟达A100,Dojo在相同成本下性能可达其4倍。这对特斯拉来说,既能更好地训练智能驾驶,又能打破英伟达在芯片领域的垄断,让特斯拉成为真正的人工智能企业。

所以,马斯克认为Dojo是“实现完全自动驾驶的关键”,摩根士丹利也预测Dojo将为特斯拉带来5000亿美元的市值增长。但上个月还说Dojo 2即将量产,现在却突然终止,实在让人难以接受。

很多人会想,是不是特斯拉开始走下坡路了,为了省钱连关键的芯片业务都要砍掉?

其实有这方面原因,如今的特斯拉已不如从前。从财报来看,今年第一、二季度,特斯拉关键营收指标下滑,同比分别减少9.23%和11.78%。

销量数据更是惨不忍睹,7月,特斯拉在全球市场销量下滑,在英国同比暴跌60%,德国下滑55.1%,在中国市场也不如以往火热。

不过,特斯拉还没到绝境。前几天,它花43亿美元购买LG的磷酸铁锂电池,还花165亿美元向三星订购芯片。十几亿美元的Dojo项目,特斯拉还是负担得起的。

马斯克发帖称,终止Dojo项目主要是因为“没必要分散资源同时开发两种不同的AI芯片”。

目前,特斯拉有两条芯片研发路线。一条是HW系列,用于汽车;另一条是Dojo,用于智能驾驶训练。过去这两条路线互不干扰,但这次的AI6(HW 6.0)超出预期,算力和带宽大幅提升,既能作为FSD的终端芯片,也能用于智能驾驶训练,Dojo的存在意义就不大了。

以马斯克的性格,肯定不会在没意义的事情上浪费钱和精力。

另外,Dojo的研发进度也不理想。Dojo 2还未量产,Dojo 1因性能缺陷、成本高昂,缺乏市场竞争力。与更成熟的HW芯片相比,马斯克自然选择放弃看不到前景的Dojo。

但Dojo从一开始就是错误的吗?未必。马斯克看得很明白,他曾说:“我认为Dojo前景渺茫,但值得一试,因为回报可能非常高。”说白了,有点像赌博。

这场豪赌并非毫无缘由,要从当时的情况说起。最初,特斯拉只有HW芯片,1.0版本用的是Mobileye的产品。但Mobileye像个黑盒,不允许特斯拉修改算法、共享数据,功能也保守,与特斯拉理念不符。2016年Model S智能驾驶事故后,双方分道扬镳。

这次失败的合作让马斯克明白,和别人合作无法实现自己的想法,自研才是出路。此后,特斯拉先自研智能驾驶,芯片用英伟达过渡几年后,2019年HW3.0开始自研。

后来的HW4.0、HW5.0(即AI4、AI5),是特斯拉进行框架设计、神经网络优化和系统集成,利用三星和台积电的工艺生产。总之,在智能驾驶芯片上,特斯拉尝到了自研的甜头。

之后,马斯克将目光转向智能驾驶训练。由于HW的分离式内存架构更适合推理而非训练,他只能重新开始。2019年,马斯克在特斯拉自动驾驶日上提出用Dojo训练自动驾驶。2021年AI DAY上,特斯拉展示了Dojo超算的核心——7nm的D1芯片。

大家可能会疑惑,马斯克称Dojo为超级计算机,它和D1芯片有什么关系?其实,Dojo是个算力体系,从低到高分为内核、芯片、瓦片、模组、机柜和ExaPOD。一块D1芯片由354个核心(CPU)组成,25个D1芯片组成一个瓦片,6个瓦片是一个模组,2个模组是1个机柜,10个机柜是1个ExaPOD训练集群,最终算力能达到1.1 EFLOP。

从D1芯片到训练集群并不简单。2021年特斯拉展示了D1芯片和瓦片,次年安装了首个机柜,原计划2023年建成七台ExaPOD。但2023年马斯克发现,Dojo可能会使训练成本提高十倍以上,成功可能性不大。

然而,马斯克的赌性占了上风,特斯拉不仅继续投入巨资,还提出了Dojo 1.5、Dojo 2和Dojo 3,这几乎是个无底洞。但Dojo超算性能仅与英伟达H100系统相当,只能寄希望于Dojo 2。

相比Dojo 1,第二代Dojo采用了台积电最新的InFO - SoW晶圆级封装技术,尺寸更小、损耗更低、效率更高。但Dojo 2仍不成熟,D2芯片算力虽提升到D1的10倍,但在通用AI场景中不如英伟达的H200 GPU集群,且芯片良品率低,成本无优势。如今AI6的出现让Dojo前景黯淡,难道要指望Dojo 3?还不如留着钱应对关税。马斯克果断放弃Dojo,再次考虑英伟达的芯片。

他解释说,如今的AI5和AI6从某种意义上就是Dojo 3。但AI6至少要到2027年量产,采用三星的2nm(SF2)制程技术,良品率只有40% - 50%。虽然特斯拉给了三星165亿美元,但三星供货仍亏损,这块“饼”能做成什么样,现在还不好说。

总之,Dojo是马斯克的一场豪赌,只是输了。为避免深陷困境,他选择及时止损,将精力投入到更有希望的方向。但对车企来说,Dojo并非反例,自研虽然困难,但却是必经之路。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com