谷歌AI古籍破译新突破:错误率低至0.56%,媲美人类专家
IT之家11月16日消息,科技媒体golem于11月15日发布博文,报道称谷歌通过其AI Studio平台,正在测试一款尚未命名的AI模型,该模型在破译难以辨认的历史手稿方面已接近人类专家的水平。
IT之家援引博文介绍,历史学家Mark Humphries使用一套专门开发的基准数据集,对该模型的性能进行了系统性测试。结果显示,在处理五份高难度历史手稿时,该模型的整体字符错误率约为1.7%,且大部分错误是标点符号和大小写方面的,而非单词本身。

Humphries的评估还指出,如果排除模糊的标点符号和大小写错误,该AI模型的字符错误率会大幅降至约0.56%,即每转写200个字符才出现一个错误。

根据新发现的未知Gemini型号转录的奥尔巴尼账簿页面
如此惊人的准确度,使得该模型的性能足以与从事历史文献转写的专业人类工作者相媲美。此次测试的文档包含了18至19世纪的多种手写风格,其中有不少字迹潦草、拼写错误和语法不一致的复杂样本,这进一步体现了该模型的强大能力。
该模型最令人惊喜的是,它不只是能进行简单的文字转写,还展现出了复杂的推理能力。在处理一份18世纪商人的日记时,原文中一条关于购买糖的记录仅标记了数字“145”,未注明计量单位。
谷歌的AI模型没有直接转写为“145”,而是输出了“14磅5盎司”。研究人员发现,AI是通过反向计算账本中记录的总价,并结合当时英国的货币(磅、先令、便士)与重量单位关系,成功推断出这一结果的。

尽管初步结果令人振奋,但Humphries也强调了当前评估存在局限性。由于该模型以A/B测试形式零星出现,难以进行系统性的大规模测试,目前仅评估了基准数据集中约10%的样本。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




