一月逆袭,安天科技大模型登顶世界第一

2025-10-16

一个月前还位居第三,一个月后便拿下世界第一。10月8日,权威网络安全大模型评测平台CyberSec - Eval更新了CS - Eval数据集的评测结果。其中,安天科技自主研发的“安天澜砥威胁检测分析垂直大模型(N2 - 1008版本)”表现卓越,以91.51的平均分综合成绩排名第一。并且,该模型在业务连续性与应急响应恢复、安全架构设计、漏洞管理与渗透测试、AI与网络安全评测四个单项中,取得第一名或与第一名持平的成绩。


▲ CyberSec - Eval综合排名TOP10


据介绍,CyberSec - Eval(CS - Eval)是目前国内外最具代表性与专业性的网络安全大模型评测基准之一。它由阿里安全、复旦大学、中国科学院大学联合构建,于2024年上线。该评测平台覆盖全面,测评贴近实战,聚焦真实安全场景下的理解、推理与决策能力评估,还采用标准化测试集与评分机制,为行业提供了可比对、可复现的参考依据。目前,已有一批知名研发机构、互联网安全团队、知名安全企业加入该平台的测试。“安天澜砥威胁检测分析垂直大模型N2分支”于今年9月9日首次提交测试并于次日公开,当时综合排名进入前三。经过近30天的持续训练后,在10月8日以综合成绩91.51分登顶,获得榜单综合平均排名第一。


据了解,安天自主研发的澜砥威胁检测分析垂直大模型主要面向二进制、脚本等对象进行分析鉴定。该模型的训练数据涵盖文件识别信息、判定信息、属性信息、结构信息、行为信息、主机环境信息、数据信息等。它支持对不同场景下向量特征进行威胁判定,并输出详实的知识理解,形成适用于不同需求和场景的多形态检测方式,提升后台隐蔽威胁判定能力,进一步为安全运营赋能。


目前,这一技术主要应用于网络安全的威胁检测分析领域。在客户侧,大模型作为安天引擎的增强插件,为安全产品提供更强的威胁检测分析能力。


记者:刘首辰


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com