第六天OpenAI:真正的AI助手-不仅可以理解屏幕,还可以和你聊天。

2024-12-16

作者 |AI 工作坊


来源 | AI 深层研究员 管理智慧


咨询合作 | 13699120588


本文仅代表作者自己的观点。


还记得影片《Her》中间,主角爱上了 AI 助理的故事?在那个时候,我们可能会认为这是科幻电影的浪漫想象。但是现在 12 月 12 日,OpenAI 在第六天的发布会上, " 科幻场景 " 正悄悄地走进现实:ChatGPT 高级语音模式获得公开访问限制,不但可以通过自然语音与您交谈,还可以了解您的屏幕内容。


那不再是好莱坞的想象。Plus 和 Pro 现在订阅者可以在移动端感受到这种真实意义上的感觉。 AI 助手。它可以理解你的屏幕内容,用自然的声音回应你的问题,就像电影里那个理解你,理解你的人。 AI 助手一样。


如今 AI 终于有了助手 " 察言观色 " 能力,我们仿佛回到了十年前第一次拿起智能手机的时刻。 - 你们可以感觉到,有些事情会一直改变。


为什么这次更新如此重要?


这次更新的核心是全新的语音模式升级。有趣的是,OpenAI 年底推出了一个特别的选择。 "SantaGPT" 语音,这种暖心的设定,让我想起了上个世纪互联网早期的网络音响。但是很明显,现在 AI 已走得更远。根据我们的观察,有以下几个独特的突破:


1、互动模式的创新 --与传统的文本输入方式不同,语音交互大大降低了使用门槛。特别是当它与之合作时。 "SantaGPT" 这种特殊的语音,AI 它不再是一个冰冷的工具,而是一个有温度的数字助手。恐怕这种改变的意义会再次发生。 OpenAI 自己还没有完全意识到。


2、整合多模态能力 --视觉识别加上屏幕共享,这种组合让我看到了未来办公场景的无限可能。想象一下,当你解决问题的时候,AI 不只是听你说话,还可以看到你的操作,立即给出建议,这将彻底改变我们的工作方式。


3、商业探索的新思路 --优先考虑这些高级功能。 Team 用户和 Plus、Pro 订阅者开放,OpenAI 表现出明确的商业化思维。但是更有意思的是,他们选择在年底推出。 "SantaGPT",这种带有情感色彩的尝试,暗示着 AI 个性化服务发展方向。


OpenAI、Google 与 Meta 的较量


人工智能领域,OpenAI、Google 和 Meta 三大巨头正在进行残酷的竞争,各自呈现出独特的优势和策略。


1.Google 的生成式 AI 之路


Google 的 Bard(后更名为 Gemini)虽然起步较晚,但凭借强大的搜索引擎和数据优势,快速追逐。最近推出的 Gemini 2.0 展示多模态能力,能处理文本、图像、音频、视频等多种数据形式。但是,在实际应用场景中,Google 看起来还是比较保守的,还没有完全释放它的潜力。


2.Meta 社交 AI 布局


Meta 大力投资开源项目,推出 Llama 系列模型。最新的 Llama 3.2 具有视觉和音频输入能力,适用于各种应用,如机器人和虚拟现实。此外,Meta 将 AI 助手集成到 Facebook、Instagram、WhatsApp 等待渠道,提供实时信息和图像生成等功能。但在商业模式上,Meta 目前仍处于探索阶段,尚未形成明确的盈利路径。


3.OpenAI 差异化突破


OpenAI 致力于提升用户体验和互动自然,推出了具有视觉和屏幕共享功能的产品 ChatGPT 先进的语音模式,并引入“ SantaGPT “语音模式,体现了对用户心理的深刻把握。就商业化而言,OpenAI 选择订阅制度,已经初见成效,Plus 和 Pro 新功能可以优先考虑订阅者。


三大巨头在 AI 各个领域各显其能。Google 随着技术水平的不断创新,但是应用落地仍然需要加快。Meta 积极布局,通过开源与社交平台的整合。 AI 生态学,但是商业模式还需要明确。OpenAI 然后以用户体验为核心,有序推进商业化进程,展现强大的市场适应能力。


这次更新的意义何在?


基于这次更新,我是对的 AI 我记得上周我和一位设计师朋友聊天的时候,他提到了一个有趣的观点,那就是助理未来的发展。 AI 助理应该像一个认识你多年的老朋友,而非一个标准化的工具。它让我想起了 AI 无限可能的个性化发展。


想像一下,当你早晨醒来时,AI 助理不再用机械的声音提醒你今天的时间表,而是用你喜欢的配音员的声音和你习惯的说话方式互动。它知道你的生活和休息,什么时候需要专注于你的工作,什么时候你想放松和听音乐。这不再是科幻电影中的场景,而是触手可及的未来。


在多模态能力方面,变化已经悄然开始。前几天在研究一个复杂的设计方案的时候,我在想:如果 AI 助理可以实时看到我的设计稿,了解我的创作意图,然后从专业的角度给出建议,这将是一种多么美妙的感觉。更进一步,当 AI 能准确识别我的手势、表情,甚至情绪波动,人机交互就会变得前所未有。


我最期待的是场景应用的演变。在不久的将来,当你走进一家咖啡店,AI 助手不仅可以帮你点餐,还可以根据你的情绪和当天的天气推荐最适合你的咖啡。在办公室里,它可以注意到你的工作压力,并及时提供减压建议。在创意工作中,它可以捕捉到你的灵感火花,帮助你把你的想法变成现实。


那不是天马行空的想象。 OpenAI 根据这次更新,AI 正以惊人的速度向这些方面发展。这是一种常见和 AI 与团队打交道,我们深信这些变化不仅会改变我们的工作模式,而且会重塑我们与技术的关系。


结论:拥抱变化,保持清醒


最后,我们对这次更新持谨慎和乐观态度。这代表了 AI 助手正朝着更自然、更智能的方向发展。但是同时,我们也要保持清醒,理性对待。 AI 提高能力。


归根结底,技术的发展不是目的,而是方法。真正重要的是,它能给我们的生活和工作带来怎样的改变。


原始视频链接:https://www.youtube.com/watch?v=NIQDnWlwYyQ&t=43s&ab_channel=OpenA


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com