AI与历史的距离|AI在古典学中的应用
2023年,高等教育(HE)在高等教育教学中,许多大学和政策组织都在努力制定高等教育教学。(T&L)生成式人工智能在中应用的指导原则和指导。在教学规定中,美国、英国和欧洲许多大学都加入了AI使用的规范和要求。教师对AI的态度相差甚远。有的老师根本不在乎学生用AI帮助写论文,甚至对这种行为持开放态度,支持AI解放学生的现代语言束缚,让他们更多地投入到问题讨论中。与此同时,一些学者讽刺人工智能是“人工智能障碍”,认为它不能代替历史学者的工作。然而,没想到的是,AI已经悄然升级,超越了一些学者翻译和整理古典语言资料的速度。几个月前,DeepL无法处理中文术语表,但现在它正在迅速改进。“senate能够同时对应古老的元老院和现代的参议院,人工智能对情境的掌握也使术语翻译更加精确。人工智能在古代语言资料的恢复、翻译、教学和研究中发挥着越来越重要的作用,其效果也备受关注。国际会议和工作坊就此进行了热烈的讨论。
人工智能在高校课程中使用的标准和标准
现在,人工智能用于研究的可能性已经超出了人们的想象。过去让人一筹莫展的焦碳纸草,如今已不再需要手动去探索其中的奥秘。对于因公元79年维苏威火山爆发而被掩埋、因高温碳化而变得非常虚弱的纸莎草文献,研究人员利用X射线断层扫描技术对这些虚弱的秘密药物进行3D扫描,然后在3D图像中准确跟踪和铺设卷曲的纸莎草层。在先进的机器学习模式的帮助下,准确地识别了这些复杂的文字。“维苏威挑战”(Vesuvius Challenge)活动还鼓励参与者检查和破解赫库兰尼姆纸莎草纸秘密片段中的墨迹和字母形状,结合3D绘图和人工智能技术进行数字扫描。除了纸草学,学术界还不同程度地探索了人工智能在史料检索、古典语言训练、古典文本破解、翻译和研究中的应用。
史料检索
https://humanitext.ai界面
最近,日本学者推出了Humanitexte 新的Antiqua人工智能对话系统。该系统目前正处于实习阶段,可以免费提供客户体验。Humanitext Antiqua旨在为古典研究领域的学者和研究者提供不可或缺的辅助工具。截至目前,Humanitext Antiqua已经包含了22位西方古典作家的全集,总共有400篇左右的文字。平台覆盖的作者和作品数量仍在不断扩大。这个系统的乐趣在于让学者与古典文本交谈。借助强大的前后文搜索功能和基于对话的互动模式,用户可以直观地深入探索和分析古典文学作品。目前,R&D部门仍在努力进一步改进检索和增强生成(RAG)前后搜索功能的技术和准确性。然而,在实际试用过程中,使用中文提问给出的检索文献并不尽如人意,使用英文对话的结果更加令人印象深刻。虽然数据库给出了搜索史料的英文翻译,但并没有提供古希腊语的原文、版本和译者信息,所以只能在整理材料时提供参考,不能直接引用。
Humanitext 新的Antiqua人工智能对话系统
Humanitext 新的Antiqua人工智能对话系统
文本研究
AI在古典文本研究中的应用非常多样,涵盖了文本数字化、文本识别、不完整的文本恢复、文献定位(时代、空间、作者)、文献语言分析,文本校勘,文献翻译等诸多方面。在英语分析过程中,在文本中定位单词或字符边界。(Tokenization)并且识别句子的界限(sentence segmentation)有助于实现古代语言分析的自动化。但是,语言和写作系统的抽象性和多样性给这两项工作带来了许多挑战。在作者风格分析、文本谱系分析、互文分析等方面,使用AI进一步为文本校勘提供参考。此外,AI对文本的解读也并非毫无价值。情感分析(Sentiment analysis)BERT技术致力于从文本中获取主观信息和情感状态,(Bidirectional Encoder Representations from Transformers)引进对此有很大帮助。
现在有学者试图通过计算语言学来研究荷马传说的语言。John Pavlopoulos等学者使用基于字符的统计语言模型来分析伊利亚特。、奥德赛和荷马颂诗之间的语言相似性和差异通过语言模型提取了文本中的各种特征,如词频、词序、句法结构等。因此,荷马传说很可能是由多位作者创作的,而不是单一作者创作的。通过计算机分析,可以得出一些书卷之间的语言相似度很高,而另一些则相差甚远。给予阿佛洛狄璧颂诗的语言与《伊利亚特》和《奥德赛》相似,而给予赫尔墨斯的颂诗则相差甚远。统计学语言模型可以有效地对《伊利亚特》和《奥德赛》中的段落进行分类,并且与学者的分类结果相似。字符级语言模型可以比传统的基于单词的语言模型更好地捕捉语言的微小差异。
经典语言教学
Edward 在全球工作坊中,Ross介绍了人工智能教学在古代语言课程中的应用。如何使用ChatGPT4o,他和他的实验团队展示了、Copilot、Gemini和Claude等AI模型可以设计古希腊语、拉丁语和梵语等古代语言的教学训练。例如,AI需要快速生成词汇测试、古典文献翻译、阅读理解题目、图像和声音。以伊利亚特和维吉尔的埃涅阿斯纪为例,Ross要求不同的AI系统分别是经典段落设计阅读理解题和古希腊语法题。
GPT可以对维吉尔的拉丁文《埃涅阿斯纪》提出相应的问题。但是,GPT提出的阅读理解问题在处理《伊利亚特》希腊语时比较模糊。所以Ross进一步要求GPT提供具体的外语学习问题。虽然Copilot每天只免费回答四个问题,但是它的设计问题质量很高,而且能给出答案,这在教学辅助方面是非常有价值的。然而,如果你试图让它模仿西塞罗写拉丁语散文,你可能会遇到严重的词汇选择问题。值得注意的是,Copilot的提问能力可能会超出给定的文本范围,有时会根据对整个伊利亚特的认知而提出问题。这种情况在一定程度上说明了它对历史语境的掌握不足,只能给出背景问题。免费版Claude提供的问题并不实用。Gemini可以阅读希腊语,并且可以提出一些基本问题,但是这些问题通常不够详细。如果要求其对具体细节提出问题,Gemini将转化为希腊语法层面的问题,而与段落内容相关的文本解释较少。
当前我国古希腊、拉丁语教学课程对古典语言的写作练习(Composition)对语言课程的需求可能不高,大多数大学的语言课程主要是阅读。古典语言写作的训练对于进一步提高语言能力也非常重要。当我们给出一个与古典学家相关的话题,要求AI进行写作练习时,GPT在收集信息的准确性和语言特征的变化方面的表现远远超过Gemini。
普通版拉丁语芬利GPT简介
拉丁语芬利GPT西塞罗文风版介绍
诗歌文本翻译
在古典文本中,散文的翻译比诗歌更难。虽然AI可以自动识别清晰的古希腊语截图,但诗歌的翻译仍然不尽如人意。在这方面,Claude3.5诗歌的节奏无法翻译。免费版GPT中文翻译的表现不如Gemini,缺乏恢复诗歌节奏的概念。即使给出反映诗歌风格的指令,中文翻译也不整齐。
古希腊原文
GPT4.0
GPT4.0
GPT3.5
Gemini不仅会给出翻译,还会逐行给出评论。
Gemini在古典语言教学中的优势在于:第一,Gemini的词汇量比GPT3.5大。因此,它能为学习者提供更丰富、更准确的词汇学习资源。Gemini在生成阅读理解题和语法分析时,表现出相对完整和系统的能力,其题目设计既基础又具有挑战性,特别适合本科生等新手,有利于他们逐步掌握古希腊语句的结构和阅读水平。
目前,一些国内大学不能同时开设古希腊语和拉丁语课程,学生可能没有足够的时间和精力同时参加两门语言课程。Gemini等AI可以帮助古希腊语和拉丁语的替代复习,面对学过其中一门语言但需要保持熟练程度的学生。
语法知识点解释:
Gemini的一个显著缺点是暂时无法有效处理残留文本、符文和古希腊语文本,通过OCR(光学字符识别)技术从图像中提取。残留文本往往很难自动识别和分析,因为它们的存储条件差,写作风格不同或模糊和断裂。Gemini在这方面的不足限制了它在一些特定的研究和应用领域的范围。
在文字识别方面,Gemini对图片中的拉丁语文字识别更有效,但是对图片中的古希腊语来说却相对较弱。然而,Gemini仍然试图向路人提供一些其他的帮助,比如给出相关的外语学习资源和软件,就像一个善良的路人,当他无法回答路人寻找的实际方向时。然而,AI识别能力的提高速度非常快。仅仅在第一个问题的两个月后,Gemini就能给出一个相对粗糙和错误的答案。(Μή γὰρ τοῦτο τὸν γ᾽ ὡς ἀληθῶς ἄνδρα ἐάτεον ἐστί.)GPT给出的识别结果也同样不完整和准确。(Μὴ γὰρ τοῦτο τόν γε ὡς ἀληθῶς ἄνδρα ἐάτεον ἐστίν.)
对于教师来说,AI目前对古代语言的教学并不是颠覆性的,而是锦上添花,可以丰富课堂的趣味性,帮助设计和复习课程作业。教室黑板占据的空间越来越小,甚至在少数欧洲大学将教室现代化的过程中消失。在某种程度上,这也影响了传统的课堂板书。即使是语言专业的教室,由于黑板太小,教师也改为用电子笔注释和输入来呈现板书。因此,AI的自动联想输入有助于提高电子课堂学习的效率。
对于学生来说,目前AI的弊端也不容忽视。很多学生在问AI单词的意思之后就不再翻字典了。使用AI来检查文本情境缺失时的单词暂时是不可取的。但是,最近嵌入浏览器的AI可以更好地解决这个问题,通过阅读网页内容可以更准确地提供单词的含义。第一,由于缺乏字典数据的支持,许多AI仍然不足以支持阅读各种诗歌文本。对复杂的多方言文本而言,AI无法准确识别难度较大的词形变化,常常给出错误的词义。第二,AI给出的单词义项比较简单,而且缺乏常用的用法和文字的展示,这对学生的词汇积累非常不利。同时,询问AI单词的含义,使学生不再考虑古希腊语词形变化的规则。如果不要求AI提供古希腊语的词汇原型,学生就会失去记忆单词的机会。
符文识别和翻译
如果古典语言散文的翻译相对容易,格律诗词难度大,AI如何分析碑铭、纸草等残篇?AI似乎可以更快地处理希腊拉丁符文残篇,这是一个简单的、现代的语言翻译。您可以将Sider嵌入Chrome等浏览器中,从而打开铭文https。://epigraphy.packhum.org/等待站点后,用鼠标勾选文本,Sider可以立即打开铭文的翻译工作。
符文识别和翻译
Sider 用于希腊铭文翻译的Fusion示例
遗憾的是,在碑铭训练中使用免费AI,大小写的转换并不尽如人意。当我们要求Sider将希腊小写文本转换成希腊大写字母时,结果出现了。ΗΩ等待字母转换错误和局部失败。而且,承载铭文的石碑本身所具有的物质属性和字母形式是AI转换文本所不能呈现的。所以,在碑铭学课程中,使用传统照片进行转写训练更可靠。
当没有古代语言基础的学生搜索训练史料,选择碑文是否是所需的史料时,AI的翻译可能会派上用场。然而,在研究中,符文翻译仍然不能脱离人工校对。当涉及跨行和严重损坏时,AI的翻译并不令人满意。即使面对相对完整简单的荣誉符文,AI的翻译也经常会出现一些问题。
比较Sider和专家的符文翻译。
碑文具有高度程式化的表达,AI处理相对简单的殡葬符文和荣誉铭文基本不在话下,但面对复杂的法令符文,尤其是残篇,其翻译表现需要加强。现在国内古代史教学中,仍有少数高校有条件设立碑铭学课程和培训。很多学生基本上不会尝试探索和使用没有现代语言翻译的碑铭史料。但是如果没有古代语言的基础,学生也没有能力对AI进行翻译,在这种情况下,使用AI的符文翻译也是非常危险的。或许,目前AI翻译碑铭和纸草的能力可以为学生的论文写作增添一份史料脚注。
假设AI在碑铭翻译方面给研究带来了方便,可以提高初学者浏览和总结史料的速度。因此,DeepMind开发的Ithaca项目在破解和研究古希腊铭文方面更具革命性。早在2019年,Pythia就出现了一种古老的文本修复模式,它利用深度神经网络从损伤的文本输入中恢复缺失的字符,将最大的古希腊铭文库PHI转换为机器可操作的文本。(PHI-ML)。而且Ithaca项目不仅可以修复不完整的符文,而且可以为铭记的铭刻时间和位置提供参考。值得注意的是,Ithaca的输出结果并非单一答案,而是提供了多种概率,这为研究者提供了大量的参考和参考。
但是,数据库的封闭性降低了AI学习能力的提高速度。现在Ithaca项目的数据库主要依赖于希腊铭文公共数据集(例如The Packard Humanities Institute’s Searchable Greek Inscriptions),最新的博睿出版社《希腊铭文补编》(SEG)和碑铭学年鉴(AE)等待最新数据未能完全列入。一旦开源问题消失,Ithaca的应用很可能成为未来碑铭教学中不得不添加的实践环节。
近年来,碑铭学的数字化也成为学术界讨论的一个重要问题。第九届Epigraphy.2025年4月2日至4日,将在丹麦举行info研讨会。会议由奥胡斯大学历史和古典研究系过去的社交网络项目和实验室主办,汇集了数字符文的研究人员和爱好者,讨论当前的趋势和问题(参考https)://epigraphy.info/)。
使用AI可能会错过什么?
在依靠AI的过程中,阅读古典语言本身的快乐和痛苦可能会被校对翻译的准确性所取代。对于还没有掌握古典语言和现代语言的学生来说,懒惰取代了熟悉词形变化和方言变化的学习机会。高效机械的工作方式可能会打破漫游古代世界的空闲感,这可能是选择古典学习的人在这个时代一直试图抵御的洪流。
观察字母形态的变化,刻字方式的变化,铭文的物质特征,在阅读碑文的过程中,都是让读者津津乐道的事。与一键生成的AI翻译相比,在“放慢速度”翻译符文的过程中,审视过去学校勘察文本的读者可能会突然大放异彩,意识到旧版本的错误,并为这种微妙而无用的发现欣喜若狂。在碑铭博物馆漫游欣赏各种各样的石碑,一位学者可能会突然意识到,面前的残碑是另一组碎片。长期丢失的拼图终于重现了完整的面貌。这种在场感和成就感也是AI拼接符文照片无法感受到的乐趣。
现代AI工具这么方便,很多碑文学家可能只是一笑置之。因为你可以在希腊罗马的碑文中自由行走,在办公室里,你可以从旋转的角度看碑文的照片,挠头破解隐藏在腐朽碑面上的字母痕迹。拼写好的碑文全景也是没有人能带走的研究乐趣。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




