OpenAI最强推理模型o3发布:AGI能力暴涨 接近人类水平

2024-12-22

快科技 12 月 21 日消息,OpenAI "持续 12 “日圣诞节”终于迎来了令人兴奋的大结局,OpenAI 推出重磅收官新产品,其最强前沿推理模型升级版—— o3。


OpenAI 号称 o3 在某些环境下接近通用人工智能(AGI),共有 o3 和精简版 o3-mini 两个版本。


评估显示,o3 准确度比在软件工程检测中的准确度 o1 高近 快科技竞赛数学评价47%。 12 月 21 每日消息,准确率比 o1 高 15%, 人类博士专家级生化物检测的准确度比 o1 高近 13%。


AGI o3在相关测试中 最佳成绩 超出人类水平门槛的87.5 85,显示迈向类人智能的突破。


对比之下,GPT-3 评估结果如下 0%,GPT-4o 为 5%,而 o3 一举提高成绩 87.5%。


OpenAI 计划于明年年初发布 o3 系列模型,CEO Altman 建议这种模式可能不会在一段时间内推出给公众,并表示希望在正式发布之前,有一个联邦政府的测试框架来指导监控和降低这种模式的风险。


从星期五开始,OpenAI 允许安全研究人员注册浏览 o3 和 o3-mini 的浏览。


OpenAI12 田间技术直播要点汇总:


1、推出“满血版”推理模型 o1 和 ChatGPT Pro(每月订阅费 200 美金)。


2、推出强化微调研究项目,可以使用数十到数千个高质量的任务定制模型。


3、正式推出 AI 视频生成模型 Sora Turbo,最高支持 1080p 20s 视频。


4、发布升级版 Canvas 创建助手,主要推广高效的编程和写作,向全体用户开放。


5、与苹果合作发布 iOS 18.2,Siri、写作工具和 Visual Intelligence 与 ChatGPT 深层集成


6、全量上线 4o 视频聊天,可以实时对话,了解用户的持续动作,也有记忆。


7、推出 Projects In ChatGPT,可整合 ChatGPT 各种功能,便于项目的建立和管理。


8、ChatGPT 全新升级搜索功能,增加地图集成、实时搜索等功能,向所有用户开放。


9、OpenAI 开放满血 o1 模型 API,即时 API 直接支持 WebRTC,且定价猛砍 60%。


10、ChatGPT 进入手机,拨打免费号码连接聊天机器人,每月免费通话。 15 分钟。


11、支持原生应用程序的自动合作功能, AI Agent 游戏玩法相似,能主动了解顾客的需求。


12、o1 下一代模型 o3 亮相,推出两个版本,正式版本, o3 以及精简版 o3-mini。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com