OpenAI最强推理模型o3发布：AGI能力暴涨接近人类水平

2024-12-22

快科技 12 月 21 日消息，OpenAI "持续 12 “日圣诞节”终于迎来了令人兴奋的大结局，OpenAI 推出重磅收官新产品，其最强前沿推理模型升级版—— o3。

OpenAI 号称 o3 在某些环境下接近通用人工智能（AGI），共有 o3 和精简版 o3-mini 两个版本。

评估显示，o3 准确度比在软件工程检测中的准确度 o1 高近快科技竞赛数学评价47%。 12 月 21 每日消息，准确率比 o1 高 15%, 人类博士专家级生化物检测的准确度比 o1 高近 13%。

AGI o3在相关测试中最佳成绩超出人类水平门槛的87.5 85，显示迈向类人智能的突破。

对比之下，GPT-3 评估结果如下 0%，GPT-4o 为 5%，而 o3 一举提高成绩 87.5%。

OpenAI 计划于明年年初发布 o3 系列模型，CEO Altman 建议这种模式可能不会在一段时间内推出给公众，并表示希望在正式发布之前，有一个联邦政府的测试框架来指导监控和降低这种模式的风险。

从星期五开始，OpenAI 允许安全研究人员注册浏览 o3 和 o3-mini 的浏览。

OpenAI12 田间技术直播要点汇总：

1、推出“满血版”推理模型 o1 和 ChatGPT Pro(每月订阅费 200 美金）。

2、推出强化微调研究项目，可以使用数十到数千个高质量的任务定制模型。

3、正式推出 AI 视频生成模型 Sora Turbo，最高支持 1080p 20s 视频。

4、发布升级版 Canvas 创建助手，主要推广高效的编程和写作，向全体用户开放。

5、与苹果合作发布 iOS 18.2，Siri、写作工具和 Visual Intelligence 与 ChatGPT 深层集成

6、全量上线 4o 视频聊天，可以实时对话，了解用户的持续动作，也有记忆。

7、推出 Projects In ChatGPT，可整合 ChatGPT 各种功能，便于项目的建立和管理。

8、ChatGPT 全新升级搜索功能，增加地图集成、实时搜索等功能，向所有用户开放。

9、OpenAI 开放满血 o1 模型 API，即时 API 直接支持 WebRTC，且定价猛砍 60%。

10、ChatGPT 进入手机，拨打免费号码连接聊天机器人，每月免费通话。 15 分钟。

11、支持原生应用程序的自动合作功能， AI Agent 游戏玩法相似，能主动了解顾客的需求。

12、o1 下一代模型 o3 亮相，推出两个版本，正式版本， o3 以及精简版 o3-mini。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

OpenAI最强推理模型o3发布：AGI能力暴涨 接近人类水平