第九天OpenAI:向第三方开发者开放最先进的大型o1,成本暴跌60%
敲重点
OpenAI o1 API增加了支持功能,如函数调用、结构输出和视觉能力。
即时API更新包括WebRTC集成的简化版本,GPT-4o音频价格下降60%。
偏好微调促使模型更容易根据客户和开发者的喜好进行定制。
Go和Java是新推出的 目前SDK已经提供了测试版本。

从当地时间12月5日起,OpenAI开始了一个密集的新功能发布周期,计划在接下来的12天内通过12场直播推出新产品和功能。在此之前,OpenAI已经陆续发布了很多创新,包括满血版o1模型,ChatGPT Pro计划,强化微调技术,Sora视频生成工具、Canvass交互界面、先进的语音视觉功能,智能文件夹Projects,ChatGPT搜索功能向所有ChatGPT客户开放等。
十二月十八日,也就是在OpenAI发布会的第九天,该公司正式宣布将使用其应用程序编程界面。(API)向第三方开发者开放其尖端大模型o1系列。这个消息对于开发者来说无疑是一个巨大的好消息,无论是面向企业还是面向消费者,因为他们渴望建立一个全新的高级人工智能应用程序,或者将OpenAI最先进的技术融入到他们目前的应用程序和工作流程中。
OpenAI的o1系列模型于2024年9月发布。作为公司“新家族”系列的第一部力作,它超越了GPT系列的大语言模型。(LLM)引入了“推理”功能的范围。
o1系列模型包括o1和o1。 mini,虽然响应客户提醒并生成答案需要更长的时间,但他们会在形成答案的过程中进行自我检查,以确保答案的准确性,并有效防止“幻觉”。OpenAI在发布时声称o1可以处理更复杂的问题,达到医生的水平,这也在客户的具体反馈中得到了验证。
虽然开发者之前可以浏览o1的预览版本,并在此基础上开发自己的应用,比如博士顾问或者实验室助手,但是API发布的完整o1模型带来了更高的性能、更低的延迟和新的功能,让它更容易融入到实际的应用场景中。
大约两个星期半之前,OpenAI已经通过了ChatGPT Plus和ChatGPT Pro计划将o1模型推出给消费者,并增加了图像和文件功能,以应对客户上传的图像和文件。
在今天发布的同时,OpenAI还宣布了实时API的重大更新,以及降价策略和新的微调方法,旨在帮助开发者更好地控制自己的模型。
现在,完整的o1模型可以通过OpenAIAPI提供给开发者。
新推出的o1模型内部编号为o1-2024-12-17,专门设计用于处理复杂的多步推理任务。与早期的o1浏览版相比,这个版本在准确性、效率和灵活性方面都有了显著的提高。

OpenAI公布了一系列标准测试的结果,显示了新模型在编码、数学和视觉推理方面的显著进步。例如,在SWE-bench Verifiedo1的编码结果从41.3提高到48.9,(希望通过更可靠的方法来评估人工智能模型处理现实世界软件问题的基准测试)。在AIME检测中,以数学为重点,o1的性能从42跃升至79.2。这些显著的改进使o1成为构建简化客户支持流程、改进物流解决方案或处理挑战性分析问题的理想工具。

另外,o1还增加了几个特性,进一步增强了它为开发者提供的功能。结构化导出功能使模型响应能够可靠地匹配定制格式(如JSON模式),从而保证与外部系统互动时的一致性和准确性。引入函数调用功能可以简化o1连接到API和数据库的过程,使整合更加方便。与此同时,o1还具有在视觉输入中进行推理的能力,这一特点在生产、科学、编码等领域开辟了新的应用领域。
OpenAI还推出了新的reasoning_effort参数,以使开发者能够更精细地控制o1的动作。该参数允许开发者根据任务要求调整模型在任务中所花费的时间,从而在性能和响应时间之间找到最佳的平衡点。
2.OpenAI实时API正在升级,支持智能对话语音/音频AI助手。
OpenAI还宣布了实时API的重大更新,旨在支持语音助手、实时翻译工具或虚拟导师等低延迟、自然的对话体验。
在这次更新中,新的WebRTC集成已经成为一个亮点。它直接支持音频流动、噪声抑制和拥堵控制,大大简化了基于语音的应用程序的构建过程。现在,开发人员可以通过最小化设置来集成即时功能,即使在多变的网络环境中也可以保持稳定的性能。
OpenAI在定价方面也推出了一项新策略,使得GPT-4o音频的成本降低了60%。具体而言,每100万输入Tokens的成本是40美元,每100万输出Tokens的成本是80美元。与此同时,缓存音频输入的成本也降低了87.5%,目前的定价是每100万输入Tokens。 2.5美金。
OpenAI还推出了GPT-4o,以进一步提高性价比。 mini,这种模式比较小,成本效率也比较高。它的价格更贴近百姓,每100万输入Tokens的费用是10美元,每100万输出Tokens的费用是20美元。此外,GPT-4o Tokensmini的文本费率也比较低,输入Tokens的起点价为0.60美元,导出Tokens的起点价为2.40美元。
OpenAI除了定价调整外,还赋予开发者更多的控制即时API响应的权利。例如,后台任务(如内容审核)可以在不影响用户体验的情况下运行,具有并发带外响应的特点。开发者还可以根据实际需要定制输入前后文本,致力于对话的特定部分,控制语音响应的触发时机,从而实现更准确、更无缝的互动体验。
喜好微调提供了新的自定义选项
另外一个重要的新功能是喜好微调,这是一种创新的模型定制方法,可以根据用户和开发者的喜好对模型性能进行优化。
与依靠精确输入输出的传统监管微调不同,微调喜欢通过成双比较来指导模型选择更好的响应。这种方法在处理主观任务后特别有效,如总结、创造性写作或语气和风格更重要的使用场景。
与Rogo AI等合作伙伴的初步检测已显示出喜好微调的巨大潜力。Rogo AI专注于为金融分析师打造助手。他们报告说,与传统的微调方法相比,偏好微调显著提高了模型处理复杂性和查询超出分布范围的能力,使任务的准确性提高了5%以上。目前,GPT-4o-2024-08-06和GPT-4o-4o-2024-08-06-mini-可以在2024-07-18模型中使用,并计划在明年年初扩展到更多的新模型。
新SDKDK面向Go和Java开发者。
OpenAI正在扩展其官方SDK产品线,以进一步优化集成流程,目前正在推出Go和Java版SDK测试版。新增加的SDK和现有的Python、Node.js和.NET库密切相关,极大地拓展了开发者在不同编程环境下与OpenAI模型互动的便利性。Go 在建立可扩展的后端系统方面,SDK表现出独特的优势,而Java SDK是专门为企业级应用而设计的,依靠强大的类型和稳定的生态系统。

通过这一系列更新,OpenAI为开发者提供了一个功能更全面的工具箱,旨在帮助他们开发高级、高度可定制的人工智能应用。OpenAI的最新产品旨在为公司提供更好的性能状态和更高的成本效率,无论是使用o1模型强化的推理能力,即时API的显著增强,还是灵活多样的微调选项,从而不断扩大人工智能的集成边界。
本文来源于“腾讯科技”,编译:金鹿,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



