在Mac软件中,ChatGPT正从对话助手转变为“AI代理人”。

2024-12-21

十二月二十日,OpenAI历时12天的新闻发布会已经进入第11天,也就是最后一天,该公司发布了MacOS桌面应用程序及其与各种应用程序的互操作功能。它将成为“代理人工智能”(Agentic AI,或者说智能体)的未来打下了基础,使得ChatGPT更加强大,并且无缝地融入到用户的日常工作过程中。


OpenAI首席产品官凯文·韦尔在第11天的发布会上(Kevin Weil)与两位身着圣诞主题西服的同事一起,共同探讨了MacOS桌面应用程序的最新发布。它们强调ChatGPT从简单的对话助手向更强大的代理工具转变,这意味着ChatGPT现在可以代表客户执行更多的任务,给用户带来前所未有的便利。


1 第一推三大功能


现在,客户已经可以通过MacOS桌面应用程序来检查和自动化他们的ChatGPT工作。尽管2025年将会出现更多类似的版本,但是在此之前,OpenAI已经率先推出了以下三个功能:


首先,借助“借助”Work with Apps“功能,客户现在可以将ChatGPT访问到更多的编码应用程序,包含BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio、AppCode、CLion、DataGrip、GoLand、IntelliJ IDEA、PHPStorm、PyCharm、RubyMine、RustRover、WebStorm、Prompt和Warp等。


OpenAI在MacOS桌面应用的演示中,展示了人工智能如何深入应用程序,获取和理解其上下文信息。当用户使用“Work with Apps“功能选择一个应用程序,ChatGPT可以立即访问,洞察应用程序内部,并提供即时协助。


ChatGPT当然不仅仅是一个简单的查看工具,它依靠强大的人工智能模型,可以实现多种功能。ChatGPT不仅可以捕获客户屏幕上的内容,还可以深入应用内部,浏览更多信息。例如,ChatGPT在处理长串代码时,可以实现无滚动浏览,大大提高了工作效率。


和Windows一起 与Recall功能相比,ChatGPT更注重与应用程序的即时协调,而不仅仅是记录和构建记忆库。在另一次演示中,OpenAI团队将ChatGPT与XCode紧密结合,使其能够在苹果开发应用程序中工作。ChatGPT可以生成代码或处理编程问题,客户只需简单地提出要求。


值得注意的是,OpenAI还展示了ChatGPT的一项新技能:它可以将生成的代码直接嵌入XCode中,这种功能有望大大简化工作流程。尽管ChatGPT代码在即时演示中试图遭遇两次失败,但是在第三次试验中,OpenAI团队成功地使代码运行起来。


其次,对于使用ChatGPT写作的客户来说,OpenAI宣布MacOS桌面应用已经完成了Applee。 Notes、支持Quip和Notion。OpenAI团队正在现场演示中浏览一份文件,该文件旨在为Notion中的徒步旅行提供指南。



有了这一新功能,ChatGPT可以无缝地与Notion合作。现场演示侧重于文档中的特定文本段落,并将任务设置为“补充这些对话要点”。此外,客户还可以使用ChatGPT的搜索功能来生成回应。例如,在演示中,它根据所选文本生成了关于“诺顿皇帝(诺顿一世)”的对话要点,并附有引用和来源。


三是MacOS桌面应用除了文本选择、复制和粘贴传统操作外,还支持先进的语音模式,可以与其他应用程序合作。在这种模式下,用户可以使用Apple。 在Notes中设置了“节日派对歌单”,并通过ChatGPT征求圣诞老人对备选音乐的意见。ChatGPT甚至可以指出顾客的错误,例如圣诞歌曲《Frosty the Snowman》误写为《Freezy the Snowman》。



这一功能现在已经正式发布,用户只需要确保MacOS应用程序的最新版本,并且订阅了ChatGPT Plus、ChatGPT Pro、ChatGPT Team、ChatGPT 或者Enterprise或ChatGPT Edu中的任何服务,都可以立即体验。


在隐私保护方面,OpenAI强调,ChatGPT只会与应用程序互动,直到客户手动触发。一旦该功能被激活,用户将清楚地知道将在消息中添加哪些内容,从而有效改善隐私焦虑。


2 再次曝光AGI彩蛋


从当地时间12月5日起,OpenAI开始了一个密集的新功能发布周期,计划在接下来的12天内通过12场直播活动陆续推出新产品和功能。在此之前,OpenAI已经陆续发布了许多创新,包括ChatGPT Pro计划,强化微调技术,Sora、Canvas、高级语音视觉功能、Projects功能、ChatGPT搜索、满血版o1模型、通过API向第三方开发者开放大模型o1系列、通过电话和WhatsApp与ChatGPT互动等。


随着新闻发布会的结束,人们越来越关注AGI(通用人工智能)。OpenAI在第11天的新闻发布会结束时表示:“第12天,我们准备了非常特别的内容,不要错过!”


在屏幕的角落里,可以看到名字“AGI_Interface.swift""文件夹。在过去的12天里,这种惊喜已经不是第一次了。几天前,OpenAI还公布了一个日历活动彩蛋,名为“非常秘密的AGI”,这无疑进一步增强了大家对这12天系列公告的期待。每个人都猜测这些公告是否正在共同描绘通用智能的宏伟蓝图。



OpenAI还表示,ChatGPT的Windows应用程序也将很快发布。但是更令人震惊的是,它们决定了一个新的智能体的出现,并且有望在2025年发布。OpenAI说:“随着我们的模型越来越强大,ChatGPT将表现出越来越强的自主性。


几个星期前,有传言说OpenAI正在开发一款名为“Operator“代理人工智能,公司在第11天的发布活动中只确定了这个计划。或许,这一举动背后是竞争对手的压力影响。


最近,谷歌宣布了Project 智能体能代表用户在浏览器工具选项卡中进行导航和操作,Mariner项目。与此同时,微软还推出了Copilot Vision功能,可以在用户的网页浏览器中查看内容,并提供相关信息。当然,在Computerter发布之前,Anthropic当然会发布。 Use功能,在时间上领先于其它同类工具。


如今,OpenAI的12天系列活动只剩下最后一天了,他们似乎把最精彩的部分留到了最后——一个全新而强大的前沿模型即将亮相。让我们期待看看OpenAI带来了什么新产品,这个新模型和之前的o1模型有什么不同。


值得一提的是,一些基准测试表明,o1模型是迄今为止最强大的人工智能模型之一,甚至在编码任务上超越了Claude。 最近,X平台的一位客户发现了GPT-4.5模型,尽管目前该模型只提供有限的预览功能。


现在,所有的目光都集中在OpenAI上,每个人都翘首以待,看看他们在新闻发布会的最后一天会带来怎样的惊喜。


本文来自微信微信官方账号“腾讯科技”,作者:腾讯科技,编译:金鹿,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com