将3B端侧大模型放入手机中,vivo还发布了适合手机的智能机身。

2024-10-12

作者邱晓芬


苏建勋的编辑


10月10日,2024 vivo开发者大会(ODC)举办深圳国际会展中心。这一次,vivo展示了他们在模型上的新进展。


在近两年的vivo开发者大会上,AI一直占据着最大的空间。——vivo AI全球研究院院长周边向包括36氪在内的媒体表示,投资AI6年来,在AI方面,vivo累计投资超过230亿元。


在去年的开发者大会上,vivo发布了一个由五种语言模型组成的蓝心大模型矩阵,分别是10亿、100亿和1000亿。假设vivo去年在模型上更加追求“专业精致”,经过一年的沉淀,vivo今年在AI上的战略追求AI的落地和与实际场景的融合。



蓝心大模型矩阵


端大模型与手机场景自然匹配,是本次开发者大会AI部分的重点。这一次,vivo发布了蓝心端大模型(以下简称“蓝心3B”),参数30亿元——而在此之前,手机厂商基本都在卷6B。、7B参数模型。


周围表示,过去,行业对大模型量级的执着追求有尺寸上限。。然而,过度追求侧面的大参数是没有意义的。相反,在手机有限的空间内,内存和电量被挤压并没有起到任何作用。vivo团队发现,3B模型是最适合手机端侧使用的参数。


据介绍,“蓝心3B”在对话写作、摘要总结、信息提取等方面几乎可以与行业7B-9B模型相媲美。vivo提供了一系列参数对比——蓝心3B的性能比蓝心7B提高了300%。、提高功耗46%、只有1.4的内存占用GB


然而,vivo的“蓝心大模型矩阵”不仅仅是一个端侧大模型,vivo还公布了其他类型的大模型(语音、图像和多模型)的升级。


举例来说,vivo现在全新的语言模型,是基于千亿级的云模型,这次vivo重点提高了意图理解和任务规划能力,与去年相比,整体技能提升30%


全新的vivo蓝心语音模型,加强了对自然语义的准确理解,模拟人声的能力;


今年,vivo的蓝心图像模型强调了东方美学和中国特色;


蓝心多模态大模型,则提升了其视觉感知理解能力。


据周围人士介绍,目前手机上大型云模型的调用成本已降至不到一分钱一次”


降低成本不仅是因为云成本的降低,也是因为vivo继续推动大规模终端的普及。“今年,我们有十几个或几十个终端功能,未来所有的聊天、识别、决策和执行都可能终端化”。


到目前为止,vivo的AI能力已经覆盖了全球60多个国家和地区,为手机用户提供了5亿多的服务,大型token的输出量超过3万亿个。


但是,各种大型模型升级,打好了底层技术设施,而要让用户感觉到,还需要进一步实用。这次开发者大会上, 基于蓝心大模型技术,vivo在手机上进行了探索。“PhoneGPT”手机智能体



PhoneGPT


这种智能体重在演示中构建了用户与手机的互动技术。举例来说,基于vivo的语音交互“蓝心小V”,用户可以自动识别屏幕界面,直接控制音频进行独立对话,为了完成顾客交代的任务,例如帮助顾客订购餐厅、咖啡等。


没有强大操作系统的支持,就无法实现AI在手机上的实现,vivo也以蓝心大模型为基础,探索AI与OS的深度融合。在这次开发者大会上,vivo推出了“原系统5”的新一代操作系统(OriginOS 5)。


周围表示,操作系统的重构包括,构建完整的互动,数字化服务体验。


就交互式体验而言,基于“原始系统” 5"用户可以一个一个复制,一个一个拖动,满足用户的多任务需求。此外,系统还支持新的声音,如苗族、壮族方言等。


关于数字服务体验的重构,在蓝心多模态大模型技术的加持下,vivo推出了全新的小V圈搜索功能。


根据vivo的说法,在现有文本搜索的基础上,通过图像识别与圈选互动的结合,精确搜索目标,提供更方便的“一圈即搜”。


原系统5还对“原子岛”功能进行了全新升级。除了通知功能,“蓝心小V”的意图识别能力可以分析判断用户目前的需求,积极为用户提供后服务。


end


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com