六大芯片,血战手机AI芯片光明顶顶

06-25 10:22
芯片,AI手机必须克服的一道坎。

移动电话AI芯片对决,正成为当今科技赛场上极其重要的一场比赛。


从手机芯片厂商到移动终端巨头,都在支撑端AI。无论是系统级还是个性化AI的实现,AI的端计算都是不可或缺的,而计算离不开芯片。


特别是结合当前的AI智能体,AI OS方向已经成为行业共识,人工智能对芯片能力的需求越来越高,这样的需求并非简单的“TOPS“计算率,是对芯片全方位能力的挑战。


放眼国内,小米取出自研SoC招式,玄戒O1首秀即在CPU。、在GPU性能方面,高通联发科与苹果A18掰手腕, Pro比赛相互胜负。根据小米的说法,其自主研发的NPU架构也实现了许多细节创新。



五月二十二日,小米发布玄戒O1自研芯片


华为虽然海思的麒麟手机芯片仍然受制于工艺流程,但它在架构和软件系统上寻找突破口。自研泰山大小核彻底摆脱了Arm架构,基于自研鸿蒙系统操作系统的深度提升,整机性能连年提升,AI功能落地率甚至部分超过了安卓旗舰机。



六月二十日华为开发者大会(HDC)最新的手机端侧AI功能显示在上面,AI可以帮助用户在拍照时进行辅助构图


放眼世界,苹果芯片在硬件性能方面遇到了很多有力的挑战者。在AI落后的情况下,苹果迫切需要根据芯片和系统的优势来实现AI体验。三星3nm工艺曝光率令人担忧,自己的Exynos旗舰芯未能量产落地,内部团队动荡不安,但其多年的技术积累使其仍是AI手机时代不可忽视的一股芯片力量。


当终端厂商加码布局自研芯片时,高通,联发科自然,我也感受到了压力。高通自主研发的Oryon架构CPU进一步提高了能效比,联发科联合发布了AI开发工具招式,力求以健全的生态吸引AI开发者。



高通于2024年10月21日发布选择Oryon SoC骁龙8CPU旗舰 Elite


看看这个行业,尽管制作手机并不一定是“得芯片者得天下”,但是在AI手机时代加强对芯片技术的控制,已经悄然成为巨头们的必然选择。



六大主流手机AI芯片厂商旗舰SoC及工艺状况


从工艺流程到芯片架构,再到基于芯片AI的开发生态,现在每个家庭的关键动作和布局是什么,台上台下的精彩较量是什么?我们试图在这场AI芯片手机大战中了解更多关键趋势。


01.2nm被苹果抢先包圆,小米高通联发科要靠什么来打赢“能效比”?


为什么芯片对AI手机的感觉如此重要?在所有功能真正落地之前,性能和功耗表现都可以算是必须克服的一道坎。


对于移动智能设备来说,PPT中美丽AI功能的实现是一条绝对的“红线”,前提是不能以牺牲手机功耗和电池寿命为基础。


近十年来,提高芯片能效一直是智能手机芯片行业迭代的重点,但是在AI手机时代,这种需求显得更加迫切。


从工艺流程到芯片架构设计,各个家庭的竞争态势日益激烈。


在技术方面,目前旗舰机SoC的技术流程已经普遍进入第二代3nm阶段,包括苹果、高通、联发科和小米。当然,苹果每年都会率先采用最新最强的包圆台积电技术,比如明年的2nm。


Jeff,苹果分析师 A19提到了Pu Pro芯片将采用第三代台积电3nm工艺,苹果将尽快到明年的iPhone。 台积电2nm工艺引入18系列。



在财务报告电话会上,台积电董事长魏哲家透露,首批2nm的台积电宝山厂产能已全部被苹果包围。


虽然高通、联发科、小米不是第一批,但目前旗舰芯片也采用了苹果的“同款”技术。虽然三星自己集团的半导体部门有先进的工艺技术,但在量产和内部管理方面却频频“翻车”,甚至计划了3nm。 Exynos系列芯片很难直接生产。


就在最近,三星芯片业务被曝出伪造数据、掩盖缺陷的丑闻,据悉,三星芯片工程师也纷纷跳槽到对家,算得上是“屋漏偏逢连夜雨”。


与三星技术翻车相比,华为海思在这里承压前行。由于代工的限制,麒麟手机芯片无法使用最新的工艺流程。在提高芯片能效比方面,将与同代选择新技术的旗舰芯片拉开一定差距,操作系统和软件的提高将极大地为提高整机性能做出贡献。



CPU多核能效曲线(红点为麒麟9020,紫色、绿色曲线为高通、联发科旗舰芯,时间为2024年12月),来源:极客湾Geekerwan


总体而言,工艺制程的升级对于提高芯片能效非常重要,但是工艺制程的进步明显放缓,如果想要提高手机的能效性,就不能仅仅依靠技术升级。


在2024年的IEDM会议上,台积电提到,同面积2nm芯片晶体管的数量比3nm芯片多15%,同功耗下芯片性能提升约15%。


除了工艺之外,在ic设计、架构等方面,更多的厂商可以独立控制阶段的技术创新就显得更加重要,它也是每个家庭都能形成差异的一部分。


02.巨人坚持自研结构,ic设计掀起了“真伪自研对决”


业界普遍认为,在制作AI手机这件事上,苹果具有先天优势,软硬件打通。——掌握底层技术的深度越深,就越容易实现整机更好的体验。


各手机AI芯片自研深度或许决定了其AI手机体验的上限天花板。


虽然自研芯片的优势并非绝对,但是加强对自研芯片技术的掌握,已成为当前手机芯片领域不可避免的趋势。


具体来说,各手机AI芯片的自研方式各不相同,苹果,华为,高通,基于Arm指令集,在SoC的所有核心模块中实现自主研究;联发科,小米,三星,选择Arm公版架构基于Arm指令集。 部分模块自主研发。


毫无疑问,无论哪种方式,都是“自研”。简而言之,Arm指令集就像芯片所说的“语言”,但即使两个人都用同样的语言写文章,也会有“大学生论文”和“小学生作文”的区别。


苹果这里的自研深度自然不用多说,甚至可以说是“断档式领先”。


其实深度自主研究在AI方面可以带来很多优势。比如苹果芯片的GPU模块可以优化图像处理和AI计算,其神经网络引擎(NPU)更加具有苹果独特的优势,对端侧AI各种功能的加速进行了深度提升。



华为虽然芯片技术有限,但麒麟芯片的结构一直在迭代。据了解,在最新的麒麟9020中,华为已经实现了从超大核到小核的CPU全部核心替代泰山自研架构。GPU也有自己的马良系列。



来源:极客湾Geekerwannerwanner华为麒麟9020芯片CPU


实际上,华为也是麒麟9020这一代才实现的完全核心模块自研,此前9010CPU小核仍在使用Arm公版IP。


在AI手机的浪潮中,华为是第一家在手机行业使用大模型能力,实现自身智能助手升级的厂商。其自主研发的麒麟芯片与自主研发的鸿蒙系统操作系统深度协同,让华为即使工艺流程有限,每年也能顺利实现一定程度的整机性能提升,这对AI感觉的落地也非常重要。


与苹果华为这样的“自产自销”厂商相比,高通作为三方芯片制造商,其自研芯片的特性在一定程度上受到安卓系统的限制。


当前高通自主研究Oryon CPU已迭代到第二代,并在旗舰机中大规模生产应用,其自主研发的Adreno GPU也做了十多年。


Oryon CPU架构的突破,帮助高通在CPU单核、多核性能方面领先于同代联发科旗舰SoC,在手机CPU能效方面排名第一。


Hexagon是高通自主研发的 NPU,AI算率最新一代已经超过80TOPS,据报道,今年将超过100TOPS,从算率平方根层面来看,高通自主研发NPU具有明显的优势。


联发科,小米CPU、所有GPU核心模块都围绕着Arm。 IP授权定制设计,都是Arm架构;三星Exynos 尽管CPU是Arm架构,但是GPU使用了AMD的RDNA。 3架构。



小米玄戒O1 来源:小米核心CPU:


ISP和NPU都没有“公版”的说法,所以每个家庭都是自己定制的,比如ISP联发科的Imagiq、自研ISP的小米;联发科旗舰芯NPU的计算率为42TOPS,小米还拥有自研6核NPU。


不久前,关于芯片“自研”的讨论成为科技界最大的话题。事实上,如前所述,是否采用Arm架构或Arm架构进行芯片自研? 对IP授权没有直接影响。


一部手机SoC包含数百个IP模块。如何高效低功耗地整合每个模块,保证其协调性,实现差异化优势,才是真正的难点。


一位芯片行业人士告诉智慧,最难的不是“自主研究”,而是真正理解ic设计的每一个细节,做出成熟易用、性能功耗平衡极佳的芯片。事实上,实现这一事件的过程是自主研发芯片。


可以看出,自研芯片核心技术一方面可以直观地给商品带来性能或感觉优势,另一方面,芯片自主研发带来的不仅仅是芯片产品本身,更是对一个厂商整个技术版图的重要补充,有助于厂商提升芯片与操作系统、大模型、应用的协同性。


没有深入的自我研究,很难像苹果一样实现人无我的优势,加强移动AI芯片自主研发技术,已成为行业的必然方向。


03.都说苹果AI掉队了,怎么会突然被苹果“反将一手”?


正如前面所说,现在已经不再是“唯TOPS论”的时代,伴随着终端AI的快速发展,AI应用真正落地的能效性能成为业界关注的焦点。


优秀的模型一个接一个,但是AI手机上的AI应用能否高效利用端面AI大模型的能力,如何在有限的能效内更高效地运行AI,从而实现良好的AI体验,还有很大的优化空间。


基于芯片本身的坚实性,移动电话AI芯片相关开发加速工具支持的完善程度也非常关键。


在这方面,苹果在今年的WWDC上迈出了非常关键的一步。——对所有应用程序开放权限,允许应用程序直接访问苹果智能核心设备端大语言模型。



怎样访问?苹果发布了一个基本的模型框架,即苹果开源机学习框架,这是业界经常讨论的。(MLX),使开发者能够使用苹果模型,开发工具App。 在整个系统中,Intents使开发者能够将App的内容和功能联系起来。


具体来说,苹果MLX支持Python、C 、根据GitHub信息,C和Swift等多种主流编程语言的API对开发者来说比较熟悉和易用,同时支持函数变换的组合、延迟计算模式、动态图构建、跨设备运行能力和统一内存模型。


在性能方面,与传统的机器学习框架相比,苹果MLX内存传输成本为零拷贝,优化了苹果芯片的GPU计算能力。未来MLX可以直接调用ANE专用指令集,而其他框架大多是间接支持或有限支持;在动态图响应速度方面,MLX可以达到毫秒级,PyTorch为秒级,TensorFlow需要分钟级。


对开发者而言,MLX的实时错误跟踪比传统静态图框快3-5倍,85%的NumPy/PyTorch代码可以直接迁移,同时也可以利用苹果芯片的统一结构来减少跨平台的适应。


可以说,AppleMLX是整个过程的开源框架,从模型训练到推理,并且深度整合了自己的硬件。


虽然Android阵营没有完全比较苹果MLX的开源机学习框架,但各自的软件平台或开发工具也在开发者提高效率和降低成本方面发布。更多的安卓芯片制造商通过闭源SDK或开源合作来支持AI开发。


例如高通的AI软件栈,可以让开发者在手机上市前几个月,通过高通Device Cloud,基于骁龙8 Elite开发AI应用服务,进行调试、升级。ONNX可通过AI应用、像DirectML这样的框架和AI软件栈,可以加速NPU。



AI软件栈高通


这里有联发科天玑开发工具集(Dimensity Development Studio),举例来说,Neuron Studio可以根据神经网络进行自动调优,帮助开发者进行跨模型全链路分析,节省调优时间。



另外,联发科天玑AI开发套件2.0,通过开源弹性结构提高开放性,模型库适应的模型数量增加了3.3倍,支持DeepSeek等热门模型的核心技术,提高tokens的生产速度。


总的来说,AI芯片能力可以被开发者有效地应用到AI应用中,从而实现更好的终端AI体验。目前只有苹果在做最完美的事情。安卓阵营不是不做,但是不统一的生态,各自的战斗仍然会带来巨大的挑战。


04.结论:手机AI芯片对决,不能输的硬仗。


手机AI芯片在AI手机大踏步前进的同时,走向了舞台C位,成为巨头的战略要地。


虽然苹果在AI功能落地的“丰富度”上似乎没有那么惊艳,但仔细整理后可以看出,它的AI功能侧实现率极高,从底层芯片、操作系统到大模型、应用,安卓阵营很难追求一段时间。


从团队到技术,苹果AI确实存在着内部深层次的问题,但归根结底,苹果还是按照自己最擅长的做法——小步快跑,做AI,苹果的确在“架桥铺路”上花费了更多的时间,但是一旦打好基础,AI大厦的上限就会充满想象力。


这也是安卓阵营从终端厂商到芯片厂商不断增加芯片自主研发技术布局的重要性。没有这些底层技术的支持,真正好的终端AI感受是不可或缺的。


毫无疑问,AI的到来为手机芯片市场注入了新的活力,带来了新的变量。能否做出好的手机AI芯片,将成为打赢AI手机之战的关键。


本文来自微信微信官方账号的“智东西”(ID:zhidxcom),作家:云鹏,编辑:心缘,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com