探寻AI写代码新高度:Claude Opus 4.1模型亮相
IT之家8月6日消息,Anthropic公司于今日(8月6日)发布公告,宣布推出Claude Opus 4.1模型。相较于今年5月推出的Claude 4系列模型,该模型主要在编码、推理和执行指令的能力方面有所改进。
Anthropic表示,Claude Opus 4.1在SWE - bench Verified(用于评估软件工程准确性)上的准确率提升到了74.5%。作为对比,Claude Sonnet 3.7的准确率为62.3%,Claude Opus 4的准确率为72.5%。具体而言,更新后的模型在“深度研究和数据分析技能,尤其是在细节追踪和代理搜索方面”表现更为出色。

与Opus 4相比,Opus 4.1在大多数功能上都有提升,特别是在多文件代码重构方面表现突出。IT之家附上相关数据如下:

Rakuten Group发现,Opus 4.1不会进行不必要的调整,也不会引入新的错误,能够精确地在大型代码库中定位并修正错误。
Windsurf报告称,Opus 4.1在其初级开发者基准测试中,比Opus 4的表现提高了标准差的一个单位,这一性能提升幅度与从Sonnet 3.7到Sonnet 4的提升相当。
从今日起,最新的模型面向Claude客户开放,用户可以通过Claude Code、Anthropic的API、亚马逊Bedrock和谷歌云的Vertex AI使用该模型。

同时,Anthropic在社交媒体上表示,计划在未来几周内发布“对我们模型的重大改进”,因此可以期待Claude系列模型有更多升级。此外,OpenAI也预计将在本周发布新消息。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




