将3B端侧大模型放入手机中，vivo还发布了适合手机的智能机身。

2024-10-12

作者邱晓芬

苏建勋的编辑

10月10日，2024 vivo开发者大会（ODC）举办深圳国际会展中心。这一次，vivo展示了他们在模型上的新进展。

在近两年的vivo开发者大会上，AI一直占据着最大的空间。——vivo AI全球研究院院长周边向包括36氪在内的媒体表示，投资AI6年来，在AI方面，vivo累计投资超过230亿元。

在去年的开发者大会上，vivo发布了一个由五种语言模型组成的蓝心大模型矩阵，分别是10亿、100亿和1000亿。假设vivo去年在模型上更加追求“专业精致”，经过一年的沉淀，vivo今年在AI上的战略追求AI的落地和与实际场景的融合。

蓝心大模型矩阵

端大模型与手机场景自然匹配，是本次开发者大会AI部分的重点。这一次，vivo发布了蓝心端大模型(以下简称“蓝心3B”)，参数30亿元——而在此之前，手机厂商基本都在卷6B。、7B参数模型。

周围表示，过去，行业对大模型量级的执着追求有尺寸上限。。然而，过度追求侧面的大参数是没有意义的。相反，在手机有限的空间内，内存和电量被挤压并没有起到任何作用。vivo团队发现，3B模型是最适合手机端侧使用的参数。

据介绍，“蓝心3B”在对话写作、摘要总结、信息提取等方面几乎可以与行业7B-9B模型相媲美。vivo提供了一系列参数对比——蓝心3B的性能比蓝心7B提高了300%。、提高功耗46%、只有1.4的内存占用GB。

然而，vivo的“蓝心大模型矩阵”不仅仅是一个端侧大模型，vivo还公布了其他类型的大模型(语音、图像和多模型)的升级。

举例来说，vivo现在全新的语言模型，是基于千亿级的云模型，这次vivo重点提高了意图理解和任务规划能力，与去年相比，整体技能提升30%；

全新的vivo蓝心语音模型，加强了对自然语义的准确理解，模拟人声的能力；

今年，vivo的蓝心图像模型强调了东方美学和中国特色；

蓝心多模态大模型，则提升了其视觉感知理解能力。

据周围人士介绍，目前手机上大型云模型的调用成本已降至不到一分钱一次”。

降低成本不仅是因为云成本的降低，也是因为vivo继续推动大规模终端的普及。“今年，我们有十几个或几十个终端功能，未来所有的聊天、识别、决策和执行都可能终端化”。

到目前为止，vivo的AI能力已经覆盖了全球60多个国家和地区，为手机用户提供了5亿多的服务，大型token的输出量超过3万亿个。。

但是，各种大型模型升级，打好了底层技术设施，而要让用户感觉到，还需要进一步实用。这次开发者大会上，基于蓝心大模型技术，vivo在手机上进行了探索。“PhoneGPT”手机智能体。

PhoneGPT

这种智能体重在演示中构建了用户与手机的互动技术。举例来说，基于vivo的语音交互“蓝心小V”，用户可以自动识别屏幕界面，直接控制音频进行独立对话，为了完成顾客交代的任务，例如帮助顾客订购餐厅、咖啡等。

没有强大操作系统的支持，就无法实现AI在手机上的实现，vivo也以蓝心大模型为基础，探索AI与OS的深度融合。在这次开发者大会上，vivo推出了“原系统5”的新一代操作系统（OriginOS 5）。

周围表示，操作系统的重构包括，构建完整的互动，数字化服务体验。

就交互式体验而言，基于“原始系统” 5"用户可以一个一个复制，一个一个拖动，满足用户的多任务需求。此外，系统还支持新的声音，如苗族、壮族方言等。

关于数字服务体验的重构，在蓝心多模态大模型技术的加持下，vivo推出了全新的小V圈搜索功能。

根据vivo的说法，在现有文本搜索的基础上，通过图像识别与圈选互动的结合，精确搜索目标，提供更方便的“一圈即搜”。

原系统5还对“原子岛”功能进行了全新升级。除了通知功能，“蓝心小V”的意图识别能力可以分析判断用户目前的需求，积极为用户提供后服务。

end

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com