在Imagination下注GPU“AI进化”的边缘AI时刻,
Imagination在人工智能推理日益走向边缘计算的浪潮中推出了全新的E系列。(E-Series)GPU IP,以革命性的方式“AI 图形紧密结合架构,回应边缘侧对低功耗、高灵活性和强计算能力的多重要求。E系列试图通过架构创新、计算率扩展、功耗提升和软件生态支持,重新定义“边缘AI计算”的边界,提供一条兼顾灵活性和效率的技术路径。
边缘AI进入加速期,GPU迎来转型窗口。
目前,边缘侧AI推理正以前所未有的速度增长。从市场应用程序来看,自动驾驶、智能手机、工厂设备甚至消费级机器人正在逐渐脱离云端,开始完成图像识别、路径规划、语音交互等智能任务。
Imagination中国区技术主管艾克指出,边缘AI需求的爆发源于多个因素:一是隐私性敏感数据(例如健康数据或企业数据)不能上云;第二,实时性要求(例如辅助驾驶的瞬时响应);第三,边缘设备资源限制(例如功耗和计算率)。根据统计,Hugging FaceAI模型的下载量从2023年的70万飙升到2025年的700万,反映了边缘侧模型部署的几何级增长。与此同时,AI算法从卷积神经网络(CNN)快速迭代复杂的多模态模型,如Transformer、图片视频等,对硬件的灵活性和并行计算能力提出了更高的要求。

面对边缘AI,传统的处理器架构各有优缺点:CPU灵活,但很难处理并行任务;NPU很强大,但面对新模型和算法时却缺钱;GPU,特别是可编程的通用GPU,正好介于两者之间。但是传统的GPU并不是为AI推理而生,它的结构仍然有很大的优化空间。随着当前AI工作负荷的逐步变化,AI硬件系统仍然需要一定程度的灵活性和通用加速性,以确保系统未来的适用性。E系列GPU,Imagination 正是在这个夹缝中,IP开辟了一条新的道路。

E系列:GPU设计范式转换
结构创新:图形与AI的深度融合
E系列GPU是Imagination产品线的一大飞跃,其最大特点,在于其对“AI 系统地重构图形“融合”。
根据Imagination中国区技术总监艾克的说法,Imagination多年来积累了大量的图像处理技术,例如分层延迟渲染技术(TBDR)、压缩缓冲等技术,自然具有低功耗、高利用率的特点。因此,在服务AI推理时,架构表现出强大的性能密度优势。E-Series 在GPU系统中嵌入AI加速能力,使GPU从图形引擎演变为通用AI处理的核心。
大家都知道,ImaginationPowerVR GPU架构在功耗有限的设备上已经使用了近20年。然而,在硬件功耗和面积控制方面,E系列比上一代D系列在相同的工艺节点下完成了平均能效提高35%。这个问题的关键在于,E-全新的Series引入爆炸式Cpu(Burst Processors)技术归功于指令调度路径的压缩和当地寄存器(每个计算单元配置接近 0.5MB 回收机制、矩阵乘法运算单元集成优化等结构升级。与传统的NPU相比,E系列不需要返回CPU处理“未知算法”,大大提高了系统的稳定性和灵活性。


相对于NPU,E 该系列的优点不仅体现在可编程性和灵活性上,还体现在其对未来模型进化的结构适应性上。目前市场上的AI解决方案大多采用GPU和NPU的物理隔离结构,在数据交互、功耗效率和系统成本方面存在不足。而E系列则完成了AI计算单元与GPU图形管道的深度集成:AI计算核心与GPU USC(统一渲染集群)共享寄存器、缓存和调度机制,打破了以往“各行其是”的瓶颈,促进了图形与AI的真正协调。

这种设计不仅提高了资源利用率,而且带来了显著的数据路径压缩,有效减少了推理延迟,特别适合图形增强AI场景,如图像超分辨率、场景理解、光线遮蔽计算、景深识别等。它还适合Vulkan、主流计算界面,如OpenCL,编程生态友好,具有广泛的开发者支持基础。
“许多 NPU 当前主流模型(如CNN)只能在设计时适应,一旦模型在未来发生变化(例如 Transformer 或者多模态网络),目前NPU无法支持, GPU 编程的灵活性保证了它的长期适应性。”这对汽车规级芯片来说尤为重要,它的生命周期超过十年。Imagination发言人指出。
计算飞跃:从轻量级到多模态的整个场景覆盖
就计算率而言,E系列Neural Cores(神经核)支持AI算率覆盖2TOPS至200TOPS,支持从轻量级终端到复杂多模态系统的全场景布局。配备4核1.6GHz,图形添加能力可达400Gpixels//s,FP32浮点运算能力13TFLOPS,INT8推理性能更是令人惊叹的200TOPS。与上一代相比,该单位面积下的算率密度提高了3.6倍,远远超过了传统GPU结构的性能曲线。
与此同时,E系列还支持FP32。、BF16、FP8、结合Imagination优化的计算库和图片优化编译器,MXFP4等多种AI主流格式,开发者可以通过TVM等框架方便地完成PyTorch。、主流模型布局和适配,如TensorFlow。
灵活扩展和多任务并行
在任务调度方面,E系列支持16个虚拟机案例的运行隔离,AI可以通过我们的硬件虚拟化实现。、异步并行计算图形、UI等多项任务。它在各种车载场景下,如Cockpit域、娱乐域、驾驶辅助域等,都表现出了良好的适应性。例如,在智能驾驶舱中,E系列可以同时承担仪器渲染和人机交互的AI任务;在驾驶区域,可以实现对驾驶员状态的AI监控和语音交互响应。

另外,E系列支持单核0.25T。 FP32轻巧布署最多核200T强算率横向扩展,包括移动终端、工业终端、AI 从单芯片集成到异构协同,PC甚至边缘数据中心的弹性能力,为SoC厂商提供多种路径选择。
完善生态,打通从模型到芯片布局的闭环。
软件和硬件协同是边缘AI落地的关键环节。Imagination为E系列搭建了包括数学计算库在内的完整软件栈支持,FFT、Kernel升级,TVM适配,Graph Compiler、TensorRT Lite推理链,以及多操作系统,编译工具和调试套件。开发者不仅可以完成离线模型的部署,还可以实现轻量级应用的在线部署和推理推送,从而支持各种边缘场景的动态智能需求,包括自动驾驶、移动终端和工业终端。
值得注意的是,Imagination在RISC-V生态也起着关键作用。凭借其出色的图形和AI能力,已经与多个RISC-V平台用户进行了集成验证,并在边缘智能中不断推动开源硬件与高效算率的协同演变。
就实际着陆而言,Imagination已经为E系列规划了多个子系列产品,各自面向功能安全需求的汽车域控。(EXS)、消费电子(EXT)、以及AI 高性能领域,如PC(EXD)。为了满足从轻量级设备到复杂多模态系统的广泛需求,我们可以与客户合作开发配置方案。在Imagination看来,随着AI模型迭代的快速发展和多模式计算需求的不断增加,GPU表现出比NPU更好的可扩展性和生命周期优势,特别适合未来十年仍需不断升级的车载平台。
首款E-Series GPU 目前,IP将于2025年秋季正式上市,授权已经完成。同步开发汽车、消费电子、桌面和移动版本。伴随着官方发布日期的临近,该系列产品有望在中国市场掀起一波边缘算率升级的新热潮。Imagination 中国区董事长兼亚太总裁白农强调,中国是世界上最重要的战略市场之一,公司将继续加大本土化投资,深化与本土生态的合作。
写在最后
GPUE系列 IP是Imagination技术积累的里程碑,它不仅在性能、功耗和芯片面积上有所突破,而且通过架构创新,从过去的图形渲染向通用AI计算迈进。E系列以图形渲染和AI推理为统一计算平台,面对边缘AI应用的爆发式增长,特别是在轻型大模型(如DeepSeek)快速发展的背景下,为用户提供了更高的灵活性和竞争力。
未来的AI,在云,更在边。Imagination E系列代表了GPU和AI融合的范式变化,不仅在性能和功耗之间找到了新的平衡,而且通过深度融合和软硬件协同,为边缘智能提供了更具可扩展性、灵活性和经济性的技术解决方案。
本文来自微信公众号“半导体行业观察”(ID:icbank),作者:杜芹,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




