OpenAI o1 推理模型 API 上线,只对特定开发者开放。
IT 世家 12 月 18 日消息," OpenAI 12 “天”活动进入第一 9 天,OpenAI 今天宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并实时同步包括 GPT-4o、即时 API 以及微调 API 等待多个开发工具。
据悉,可以使用第一批 o1 API 的开发者为 OpenAI “第五级”客户。为了达到这个水平,开发者需要 OpenAI 累积消费至少在平台上 1000 美金(IT 家族备注:目前的约定 7285 人民币),而且自首次成功支付以来,账户已经超过了 30 天。o1 API 替代了此前 API 中提供的 o1-preview 模型。
不像大多数人工智能模型,o1 等推理模型能有效地进行自我事实核查。,这样就可以避免一些常见的错误。但是它的缺点是计算成本高,而且需要更长的时间才能得出结论。OpenAI 对 o1 每个分析合同都收费 75 万字收取 15 美元,每次生成约定 75 万字收取 60 美金,它是最新的“非推理”模型 GPT-4o 的六倍。
相较于 o1-preview,API 里的 o1 具有较好的可定制性,增加了函数调用(允许模型与外部数据连接)、开发信息(允许开发者指导模型的语气和风格)和图像分析等功能。o1除了结构化导出外, 它还提供了一个名字“” reasoning_effort "的 API 在回答问题之前,允许开发者控制模型“思考”的时间。
OpenAI 表示,API 中(和即将登陆的聊天机器人平台 ChatGPT)的 o1 是“最近经过后训练”版本,版本号为" o1-2024-12-17 "。和两个星期前相比 ChatGPT 中发布的 o1 模型,新版本根据用户反馈,在模型行为的很多方面都有所改进,但是 OpenAI 具体细节没有透露。OpenAI 一篇博客文章说:“我们正在逐步推出访问限制,同时努力扩大浏览范围,覆盖更多的客户等级,提高速度限制。" OpenAI 根据其网站上的一份说明,最新的 o1 应能提供“更全面、更准确的答案”,尤其是在编程与业务相关的问题上,不太可能错误地拒绝请求。
关于与其他开发者有关的新闻,OpenAI 新版本也发布了 GPT-4o 和 GPT-4o mini 模型,作为其实时 API(Realtime API)的一部分。即时 API 是 OpenAI 用来构建低延迟、人工智能生成语音响应的应用程序 API。新模型(分别是" gpt-4o-realtime-preview-2024-12-17 "和" gpt-4o-mini-realtime-preview-2024-12-17 ")数据效率高,可靠性高,使用成本低。
即时 API 目前还处于测试阶段,但是已经获得了很多新的功能,比如并发的外部响应,允许运行内容审核等后台任务,不中断交互。该 API 现在还支持 WebRTC,它是用来为基于浏览器的客户端、智能手机和物联网设备构建实时语音应用的开放标准。值得注意的是,OpenAI 在 12 月初聘请了 WebRTC 的创建者 Justin Uberti。"我们的 WebRTC 整合的目的是在实际环境中,即使网络速度不稳定,也能实现顺畅、快速的交互响应,” OpenAI “它能处理音频编码、流式传输、噪声抑制和拥堵控制,”博客上写道。"
最后一次更新是,OpenAI 为其微调 API 引入喜好微调;喜欢微调比较模型响应的匹配,用“教学”模型区分问题的首选答案和“非首选”答案。公司还针对 Go 和 Java “初步浏览”测试版推出了官方软件开发工具包。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




