OpenAI最强推理模型o3发布:AGI能力暴涨 接近人类水平
快科技 12 月 21 日消息,OpenAI "持续 12 “日圣诞节”终于迎来了令人兴奋的大结局,OpenAI 推出重磅收官新产品,其最强前沿推理模型升级版—— o3。
OpenAI 号称 o3 在某些环境下接近通用人工智能(AGI),共有 o3 和精简版 o3-mini 两个版本。
评估显示,o3 准确度比在软件工程检测中的准确度 o1 高近 快科技竞赛数学评价47%。 12 月 21 每日消息,准确率比 o1 高 15%, 人类博士专家级生化物检测的准确度比 o1 高近 13%。
AGI o3在相关测试中 最佳成绩 超出人类水平门槛的87.5 85,显示迈向类人智能的突破。
对比之下,GPT-3 评估结果如下 0%,GPT-4o 为 5%,而 o3 一举提高成绩 87.5%。
OpenAI 计划于明年年初发布 o3 系列模型,CEO Altman 建议这种模式可能不会在一段时间内推出给公众,并表示希望在正式发布之前,有一个联邦政府的测试框架来指导监控和降低这种模式的风险。
从星期五开始,OpenAI 允许安全研究人员注册浏览 o3 和 o3-mini 的浏览。
OpenAI12 田间技术直播要点汇总:
1、推出“满血版”推理模型 o1 和 ChatGPT Pro(每月订阅费 200 美金)。
2、推出强化微调研究项目,可以使用数十到数千个高质量的任务定制模型。
3、正式推出 AI 视频生成模型 Sora Turbo,最高支持 1080p 20s 视频。
4、发布升级版 Canvas 创建助手,主要推广高效的编程和写作,向全体用户开放。
5、与苹果合作发布 iOS 18.2,Siri、写作工具和 Visual Intelligence 与 ChatGPT 深层集成
6、全量上线 4o 视频聊天,可以实时对话,了解用户的持续动作,也有记忆。
7、推出 Projects In ChatGPT,可整合 ChatGPT 各种功能,便于项目的建立和管理。
8、ChatGPT 全新升级搜索功能,增加地图集成、实时搜索等功能,向所有用户开放。
9、OpenAI 开放满血 o1 模型 API,即时 API 直接支持 WebRTC,且定价猛砍 60%。
10、ChatGPT 进入手机,拨打免费号码连接聊天机器人,每月免费通话。 15 分钟。
11、支持原生应用程序的自动合作功能, AI Agent 游戏玩法相似,能主动了解顾客的需求。
12、o1 下一代模型 o3 亮相,推出两个版本,正式版本, o3 以及精简版 o3-mini。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




