OpenAI 放大招:AI 代理商开发迎来四大更新!

06-05 07:29

IT 世家 6 月 4 日消息,OpenAI 公司昨日(6 月 3 日本)发布博文,宣布升级旗下。 AI 除了提高平台兼容性和语音界面支持,智能体开发工具还增强了可观测性。(observability)。


1.TypeScript 支持开发者生态的拓展


OpenAI 宣布其 Agents SDK 新增 TypeScript 支持,继 Python 在版本之后,进一步覆盖 JavaScript 和 Node.js 环境开发者。


IT 世家注:这个版本和 Python 版本功能对齐,包括 Handoffs(任务转移机制)、Guardrails(运行时行为约束)和 Tracing(执行跟踪)等关键部件。


此外,MCP(模型前后协议)确保智能体步骤间前后文传递顺畅。TypeScript SDK 适配现代 Web 和云原生应用栈,开发者可以在前端浏览器和后端使用 Node.js 智能体在环境中统一构建。


2. RealtimeAgent 有助于语音应用和人工控制


支持低延迟语音应用,OpenAI 推出 RealtimeAgent 扩展新功能 Agents SDK,集成式音频输入导出,状态交互,中断处理。


这个功能的亮点在于“人机回路”(HITL)审计机制,支持开发者 Runtime 对于需要控制、合规检查或领域检验的应用,暂停智能体执行、检查状态并手动确定后再次非常重要。开发者可以完全保留前后文本并恢复执行。


3. 跟踪语音对话


OpenAI 还升级了 Traces 支持仪表板 Realtime API 对话跟踪,涵盖音频输入导出、工具调用、用户中断等环节,提供统一的审计记录,简化调整和性能优化。


4. 改进语音对语音模型


OpenAI 还改进了语音对话模型,重点降低了延迟,提高了对话的自然性和中断处理能力,包括更快的流式响应,更有表现力的音频生成,以及对重叠输入的稳定响应。这些更新有助于构建动态多模式对话智能体。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com