第一个“有双眼”的国产大模型出现在服贸会上。

2024-09-13

在9月12日开幕的2024年中国国际服务贸易交易会(以下简称服务贸易会)上,智谱AI(即北京智谱华章科技有限公司)成功解锁了“双眼”。 视频聊天功能。据报道,这是世界上第一个面向大众客户的大型视频通话功能。


据报道,言语视频通话功能跨越文本、音频和视频三大模式,具有即时推理能力。用户可以打开摄像头,通过视频聊天窗口与言语交流。言语不仅可以“看到”用户的画面,还可以理解指令并准确执行。即使频繁中断,也能快速反应。在画面上敲重点,言语也能理解客户希望关注的地方。


提供作业指导。


智谱AI表示,GPT-4o之前已经推出了语音,但是并没有向公众开放视频功能,使用清言可以体验到目前最先进的AI/大模型技术。以往与AI的互动主要是文字形式,有了视频功能,用户可以告别文字长篇大论的提示和AI的流畅交流。清言就像一个人类助手,有视力,能听懂客户身边的话。只要摄像头一拍,AI就能知道客户的环境,想让AI做什么。用户只需要口头指示。


国内大型模型成功解锁了“双眼”。


清言视频通话功能也可以转化为随身英语翻译,可以实现中英文的即时翻译,根据客户的环境信息进行英语对话,帮助纠正客户的发音和拼写错误。该功能的应用场景包括旅游时随时讲解景点故事,识别视障人士的环境等。还可以提供学科作业指导和面试指导,在会议中完成记录和总结,分析复杂的数据图,即时解读计算机屏幕代码。


智谱AI将在这次服贸会上展示多种最新产品。除清言App的视频通话功能外,还包括AI生成视频功能。今年早些时候,智谱推出了CogVideoX视频生成模型,并在智谱清言App上推出了视频生成的“清影”功能。清影对所有客户开放,只需输入文本或上传照片,30秒内即可生成6秒视频。今年七月,清影推出清言App,客户在六天内生成超过100万个视频。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com