手机AI日益关键,厂商缘何不再强调NPU算力

3天前
如今的手机NPU,已难以实现每一代硬件算力直接“翻番”。

如今,“AI”已成为智能手机行业各大厂商频繁提及的宣传重点。


一方面,头部手机品牌纷纷宣称拥有“自研AI大模型”,并借助各类“性能优化方案”,在手机上推出了主打影像、服务日常生活或辅助游戏体验的“AI功能”。



另一方面,上游芯片厂商在发布新款SoC时,也普遍会展示NPU架构改进、能效提升,以及联合AI大模型进行端侧性能优化的内容。



若回顾前些年的智能手机宣传便会发现,在“手机AI”尚未普及的阶段,厂商宣传早期“NPU”时,都会明确给出性能(算力)指标。尽管当时NPU的应用场景有限,但消费者能直观看出不同品牌、不同代次SoC在NPU性能上的差异与进步幅度。



如今,手机SoC性能更强,NPU更先进,支持的“端侧AI”功能也更多,但厂商宣传时却普遍只进行具体的“功能演示”。无论是手机厂商还是上游芯片厂商,似乎都对“NPU算力数字”这一直观、便于普通消费者对比优劣的参数避而不谈。


这究竟是为何呢?


NPU算力“遇瓶颈”?这种说法并非完全错误


根据常识,当某个数据突然停止公布时,往往意味着它可能不再亮眼。


手机NPU似乎也是如此。以高通为例,2019年的骁龙855是首款公开NPU算力的产品,当时算力为7TOPs。后续的骁龙865、骁龙888、骁龙8 Gen1官方均公布了算力数据,分别为15TOPs、26TOPs、52TOPs。



但骁龙8 Gen1之后,高通便不再公布NPU的“算力数字”。从公开技术资料可知,2024年发布的骁龙8至尊版NPU算力为80TOPs,今年换代的第五代骁龙8至尊版则为100TOPs。


不难发现,尽管这两代旗舰SoC的NPU性能在行业中仍处于领先地位,但从骁龙8 Gen2到骁龙8 Gen3,NPU的“算力数字”进步速度确实有所放缓。



从这份统计数据能看出,高通的NPU性能领先优势明显


当然,这只是高通一家的情况。从三易生活掌握的数据来看,其他主流手机芯片厂商在“NPU算力数字”方面可能更不乐观。因此,当高通带头不再公开宣传NPU算力时,其他厂商自然也有理由效仿。


NPU性能进步放缓的原因?不止芯片设计那么简单


从相关数据可见,最早几代手机SoC的NPU,几乎每次换代都能实现算力翻倍。但近两年,NPU的“算力”进步速度明显减慢。



对此,一个容易想到的理由是,早期NPU在设计上留有较多“余量”,所以能实现代代算力翻倍。但随着半导体制程成本上升,加上厂商需将更多功耗分配给新架构的CPU和GPU,这种“任性”的设计便难以维系。


不过,若关注过当时手机厂商的宣传会发现,在停止宣传NPU“算力数字”后,他们几乎仍会在每次芯片换代时宣称新NPU比前代“性能翻倍”。



显然,如今NPU的“硬件算力”远未达到每次更新都翻倍的程度。那么这个“性能翻倍”从何而来?其实,过去与现在的“手机AI”在技术内涵和处理任务类型上已发生巨大变化,对NPU的设计需求也截然不同。


例如,早期“手机AI”几乎集中在“计算视觉”领域,如面部识别、拍照自动场景优化、视频自动画面增强等。这些技术需要NPU具备强大的图像信号吞吐量,因此最早的NPU完全聚焦于“峰值算力”,追求在最短时间内完成计算。由于NPU平时很少参与手机日常工作,能效比稍差也无关紧要。



但现在情况已大不相同。手机“AI功能”不再局限于计算视觉,更多集中在“内容生成”,如AI生文、AI生画、拍照时用AI生成缺失细节等。此外,AI功能增多,系统日常调用NPU的场景愈发频繁,这使得现在的NPU一方面要针对生成式AI任务修改底层架构,另一方面必须比过去更注重长时间运行的能效比。


举个例子,近期部分机型开始用NPU协助GPU进行游戏“超帧超分”处理。显然,若NPU仍采用以前“爆发式”的性能设计思路,肯定无法满足需求。


手机NPU还会持续进步吗?会,但思路已变


在针对新的AI应用需求调整底层设计后,如今各大芯片厂商的NPU“硬件性能”在近两年确实重回增长轨道。不过受各种限制,手机NPU已无法像以前那样实现每一代硬件算力直接“翻番”。



难道以后手机NPU就无法实现大幅性能提升了吗?


从现有信息来看,并非如此,但肯定不会像以前那样单纯靠“堆规模”和提升频率来解决问题。比如,部分手机厂商会将私有算法“固化”进NPU,通过算法定制硬件,提升NPU执行特定任务的计算效率。



对更多品牌而言,与大模型开展技术合作,深度调校AI功能在NPU上的兼容性和执行速度,是当下提升NPU性能的主要方式。例如,近日三星与Nota AI达成合作,计划通过软件优化让Exynos 2500的NPU(算力59TOPs)在实际AI执行速度上“追平”第五代骁龙8至尊版的100TOPs算力NPU。


尽管对这种“优化”能否实现尚存疑虑,但它至少表明,对于如今手机SoC的NPU设计,软件优化的效果甚至可能比单纯的硬件设计更重要。


本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com