AI与历史的距离|当AI“阅读”我的西夏文研究时。
人工智能浪潮正以前所未有的速度和深度影响着我们生活的方方面面。从日常聊天助手到复杂的科学计算,它无处不在。当人工智能(AI)当一个有趣的问题不仅可以作诗、绘画、编程,甚至开始涉足解读深刻而晦涩难懂的史学文献时,也会出现:历史与AI的关系会走向何方?仅仅是高效率的工具,还是会成为激发深度思考的伙伴?历史这门古老而智慧的学科,又将迎来怎样的挑战和机遇?这个故事是本文想要与读者深入探讨的。它可能不仅仅是个人经历的分享,更是对我们如何与AI共舞,重塑知识生产方式的探索,在即将到来的智能时代。
一是AI撮合的意外重逢。
最近,一段AI产生的对话音频,让我这个一直穿梭在计算机科学理性与历史人文感性之间的数字人文从业者,体验到了前所未有的“共鸣”。故事的开头相当偶然:一位朋友试图“喂”谷歌的AI工具NotebookLM,这是我几年前发表的一篇关于西夏字典《文海》网络分析的论文。当朋友把AI生成的英语对话音频转给我时,我最初的期望可能只是AI可以提取一个常规的论文摘要或信息。然而,结果远远超出了预期:两个“虚拟人”之间的对话极具感染力,他们不仅准确地解读了我探索的核心,而且诠释了流畅、自然、独特的角度,甚至有些想法让我觉得它似乎比我考虑的还要长。那一刻,我觉得AI不再只是一个冷冰冰的,执行指令的工具。它似乎有一定的“理解”,成为一个“思维伙伴”,可以跨越语言障碍,与我进行深入的学术对话。
从新的角度来看,AI“匹配”的“意外重逢”不仅带来了惊喜,也引起了我对AI在历史研究中潜力的深刻思考:AI是如何介入历史研究的?它将如何重塑我们与历史的“距离”,甚至是历史学者本身?这不仅关系到技术的发展,也关系到我们如何认识过去,了解现在,塑造未来。
二是从抽象数据到历史叙事
我的专业是计算机科学和技术,但我一直在陕西师范大学历史文化学院工作。这种交叉背景让我自然地将技术融入到历史专业的研究中。近年来,我更加关注数字人文,尤其是智能技术在历史研究中的深度应用。2022年,《西夏文字典》发表于《数字人文》杂志〈文海〉“网络分析”一文,是我在这方面的一次尝试。
近千年前由党项人创立的西夏文,就像历史长河中宁静的星星,记录了一个王朝的兴衰和文明的印记。而且《文海》是西夏人自己编写的“解字书”,必须包含深入解读西夏文明的关键。然而,西夏文已经成为一种“死字”,其复杂的字体结构、庞大的文献数量和复杂的字体解释关系促进了现代专家对西夏文学习和研究的挑战。
目前,AI技术对西夏文字的自动识别率已经很高,不考虑情况将单个西夏文字转换成相应的文字也不是什么大问题。但是西夏文字要准确翻译成中文,要么读西夏草书,要么大规模分析西夏文字数据库,还是很难的。
西夏文OCR系统:将西夏文献照片转录为可搜索文本。
我用网络分析的方法把《文海》中的每一个西夏人物都当成一个节点,字与字之间的解释关系被视为一个连接节点,同时整个字典被转化为一个庞大而复杂的“西夏人物解释关系网”。这样做的目的是通过结构化的数据分析,探索《文海》中隐藏的西夏人物的组织规律和西夏人的一些核心概念和认知结构。
《西夏文字典》和《文海》的构建词典网络的表现。照片来自《西夏文字典》〈文海〉文章《网络分析》。
“文海”字形解释举例
这项研究的核心奉献之一是提出了一种方法来识别文海中的“基本字集”。这个过程在AI产生的中文版对话节目中被生动地比作“洗面筋”。有趣的是,这个比喻与我在课堂上向学生解释类似概念时使用的表达方式不谋而合,这可能与朋友们在第一次与AI互动时巧妙地将相关指导融入Prompt中。这正是我第一次听到AI这个描述时特别震惊的原因——它就像一个回声,一个人类思维和AI能力在特定指引下的微妙共鸣。想象一下,根据解释,整个文海中的文字相互关联和交织,形成一个像面团一样的网络,而我们的算法,就像一双不知疲倦的手,在水中反复洗“面团”:那些只被别的字解释,却没有自己解释任何其他字(或者解释网络中只有入口,没有出口)的“末端”字被层层“洗”掉。经过多轮迭代,最终沉淀下来的是整个词典语义基石的核心部分,即基本词集——就像充满粘性的“面筋”一样,是这种语言的“基本组成部分”,这是最精华、最基本、不可简化的。
找出“面筋”,下一步就是了解其它单词是如何围绕这一核心构建的。通过计算每一个非核心词到达基本词集的“定义距离”,研究揭示了《文海》中西夏词解释关系清晰的层次结构。这个过程在中文对话中被比作“剥洋葱”:最核心的基本词集就像“洋葱心”(第0层),只有这一层直接解释的词组成了“洋葱”的第一层,只有前两层解释的词组成了第二层...所以一层一层向外扩展。另一种形容英语对话——“树”:核心词集是“树干”,其他词是树干上的“树枝”。延伸越多,词的意义可能越复杂,其构成也取决于更接近树干的词。
文海词典网络层次结构可视化
AI解读还提出了“恢复葱”的角度(或沿“树”的脉络向上追溯):这种由内而外的层次结构,是否暗示了一条高效学习西夏字的隐藏路径?也就是说,“从核心到外学”,首先掌握最基本的核心词,然后逐步理解其衍化词。也许这样可以让学习这个古老文字的过程,不再“遥不可及”,就像进行一个有趣的“语言寻宝游戏”。这些AI产生的隐喻和延伸,即使有些可能来自巧妙的提醒,它们最终呈现的准确性和形象也真的很神奇,这也让我意识到,即使是对自己的研究,AI也能提供启发性的“再解读”。这种“再解读”的力量不仅仅在于它巧妙的修辞(比如在英语对话中,通过“靴子”这个词的例子,将“文海”这个词的解释比作“视觉拼图”),还在于它有时候可以像一面没有偏见的镜子,反映出我们习以为常的研究路径中可能出现的盲点,提醒我们从一个全新的角度来看待习以为常的结论。
这种将抽象数据结构转化为可理解的知识模型的方法,其潜力远不止《文海》这个孤立的例子。另一个对OPTED(Oxford Plain Text English Dictionary)在网络分析实验中,我们进一步见证了AI在连接抽象数据和具体意义方面的卓越能力。
类似于文海的研究,我们通过单词和单词之间的相互训解关系来构建网络,同时也发现了一些由单词和句子组成的“强连接部件”。(Strongly Connected Components,在英语对话中,它被形象地理解为“网络中的圈子”,并以“男人和孩子”相关的群体为例,强调它揭示了“更深层次的概念联系”)。例如,在实验中发现了一个包括“popovtsy, dukhobors, dukhobortsy, judaizers, bezpopovtsy, molokane, skoptsy, raskolnik, molokany, raskolniki"等一系列与俄罗斯东正教不同教派相关的生僻字。这些词在字典的网络结构中紧密相连,这本身就暗示着它们之间存在着超越简单词意义的深层结构关系,很可能反映了现实世界中特定文化领域的知识地图或概念群。但是,对于那些没有宗教历史背景的人来说,这些独立的词汇就像一串密码,其背后的历史人文意义难以破解。
此时,历史学家的专业洞察力和AI的叙事能力再次展现出“共生”的魅力。以这些“密码词”为核心,我们引导AI讲述一个故事。令人惊讶的是,AI不仅成功编织了一个连贯的叙述,更重要的是,它赋予了这些通过技术方法提取的抽象联系和生动的历史解释,清晰地描绘了17世纪以来俄罗斯官方东正教与各种不同教派之间复杂互动的场景。这个过程,与其说是简单的语言学习辅助,不如说是一个由历史学者主导的过程(提问、提供材料、判断方向)。、小规模的“历史知识重构”,AI赋能(信息快速整合,文字生成)。AI在这里扮演了一个关键的桥梁角色,高效地将冰冷而结构化的数据(词汇网络)转化为温度和逻辑的历史叙事。这一“点石成金”的应用,更好地体现了AI在帮助人文研究者探索数据、构建解释等方面的巨大潜力。从更深层次的角度来看,这个案例也揭示了网络分析方法本身可以成为历史研究的有力工具。其分析数据(如强连接部件)可以反映特定历史时期的文化、宗教和社会特征,而AI的介入大大加速和深化了这些技术发现的历史解读。
三、AI如何催化“对话”的深度思考?
目前用大模型做学术总结和文献总结并不少见,但大部分都是分析别人的研究。这一次,经过朋友的尝试,让AI解读和“反刍”我自己的研究工作,但我的感受却大不相同。这种由AI驱动的重新审视自己的研究,有时候真的能带来“惊艳”的发现,让人觉得AI不再只是一个工具,更像是一个能提供新视角的“思维伙伴”。
这种将长篇语料材料(如一篇完整的学术论文)交给大模型生成一定深度的“对话方式”的内容,似乎比普通人和AI直接进行即时问答的方式更具思辨性。在我的初步思考中,可能有以下几个原因:第一,结构化精加工。如果AI面对的是一篇完整、逻辑严谨的学术论文,它就能进行更系统、更深入的信息处理。为了产生有价值的“对话”,AI不仅要理解论文的核心观点和论证过程,还要模拟不同对话者的身份和语气,甚至设计问答的思维过程。这个过程,远比处理碎片化即时提问复杂,也更能驱动AI调用其深层次的文本理解和知识重构能力。其次是多视角思辨模拟。谈话方式自然包含着不同视角的碰撞。即使这些“对话者”是虚拟的,AI在设计他们的演讲时,也要考虑观点的多样性和论证的多样性。这使得对话的最终内容更容易呈现出思辨的色彩,探索的价值和局限可以从不同的侧面揭示出来,而不仅仅是单向的信息导出。其次是知识的“反刍”和“再创造”。当AI开始谈论内容时,实际上是在对原始研究进行深入的“反刍”。它需要消化、吸收、理解,然后以新的方式(对话)重新组织和表达。这个过程本身,就是一种知识的再加工甚至“再创造”。就像朋友转给我的英语对话一样,它流畅的逻辑和准确的单词表明,在“理解”了我的论文之后,AI已经可以用另一个语言系统来转移和表达高质量的知识了。
所以,论文作者将自己的研究成果交给AI进行解读和“对话”,将来也许会成为一种极具价值的学术反思方式。因为作者自己最了解自己研究的初衷、过程和细节,一个强大的AI模型就像一个知识渊博、逻辑严密、不知疲倦的“贤者”或“心灵镜像”,作者可以随时随地与自己的研究进行“对话”,保证讨论的深度和注意力。在这个过程中,基本上没有因为不同的交流目标知识背景而导致的信息消耗或理解偏差,或者更容易激起作者对探索的深刻审视和新的灵感火花。
四、AI时代新坐标“思考伙伴”与历史学者。
回顾我和AI围绕文海论文的“冒险”,最让我感动的不是AI的“博学”或“高效”,而是它成为“思考伙伴”的潜力。“思考伙伴”意味着AI不再只是一个被动接受指令和输出结果的工具,而是可以在与人类智慧的有效互动中以某种方式参与我们的思维过程,提供启发和反馈,甚至从其独特的“角度”挑战我们现有的认知。AI使用的“洗面筋”在解读《文海》网络分析研究时。、“剥洋葱”的比喻,以及“恢复洋葱”的学习路径猜测,都是有力的例子。如上所述,“洗面筋”的出现很可能与朋友最初将相关的导向表达融入Prompt中有关,这本身就生动地解释了AI的洞察力不是凭空而来的,而是人类智慧和AI能力在特定指引下共同诞生的结果。更令人兴奋的是,英语对话中提到的萨丕尔-沃尔夫假设,一种语言结构(如文海独特的层次结构和核心概念组织模式)是否会反过来塑造使用这种语言的人的思维模式和世界感知模式?对于独特的语言体系《文海》的深入分析,或许可以为这个经典题目提供新的实证资料。理解人类组织语言的复杂方式无疑可以为开发更智能、更有理解力的人工智能系统提供宝贵的启发,甚至引发我们对知识本质及其相关方式的深刻质疑,这些都远远超出了语言学或历史本身的范围,当然也超出了我论文讨论的范围。
这一“双向互动”方式,可能会给未来的历史研究带来许多深刻的变化。它能加速知识的发现与整合,帮助研究者快速定位信息,识别模式,在浩如烟海的参考文献中建立联系。它可以帮助学者跳出惯性思维。AI基于大规模数据训练形成的“角度”有时可以帮助我们发现被忽视的联系或意想不到的问题。它还可以促进跨学科对话和融合。AI可以作为不同学科知识之间的“桥梁”,帮助历史学者理解和应用其他学科的理论和方法。这座桥的建设方向、内容的选择和最终价值的赋予始终掌握在历史学者手中。
人工智能真正成为“思考伙伴”,绝对不可能一蹴而就,而是一个历史学家与人工智能技术共同进化、“相互导航”的过程。学者自身强大的专业素养,清晰的问题意识和开放的探索心态是这一过程的发动机。我们学会了如何与AI“对话”,如何设计一个可以激发AI深层潜力的Prompt,如何提出震撼本质的问题,如何辨证地理解AI的“思维方式”,如何将AI的洞察与人类的智慧有机结合——这些探索本身就是在不断“校正”AI的能力边界和应用领域。另一方面,AI的每一次能力飞跃也在为历史学家开辟新的研究领域,促使他们不断优化和建立自己的“新时代坐标”。这一动态“共生坐标”的建立,也许正是AI时代学术研究中最具魅力和潜力的一幕。
“历史与AI的距离”正在改变
从《文海》的网络分析,到AI对这一分析的跨语言解读和“反刍”,再到OPTED词典中AI的叙事能力,我们看到了一个清晰的轨迹:数字技术与人文研究的结合正从最初的数据化和可视化转向更深层次的智能化和交互化。
毫无疑问,AI的介入正在改变“历史与AI的距离”。它们之间的路径不再是单向的、静态的,而是充满了动态的交互和无限的可能。AI不仅带来了如何保证研究严谨性、防止技术滥用等挑战,也带来了前所未有的机遇,让我们能够以全新的方式亲近历史,理解过去,从中学习未来的智慧。这不仅仅是关于一本古老的词典或一个死字的研究,更是关于人类的好奇心、理解过去的欲望,以及这些探索与我们目前的外语学习、教育创新甚至技术发展有着惊人的联系。
正如我在复旦大学报告《AI赋能史学研究新视野——从跨语言文献分析到深度历史探索》中所期待的,AI的真正价值不在于取代学者的探索,而在于增强学者的探索;不是给出唯一正确的答案,而是激发更多元化的历史想象力。未来,历史学家和AI可能会像一对默契的伴侣一样,共同探索历史研究的全新领域,在海量的历史数据和深刻的人类智慧之间。每一次“小运气”,比如“AI理解我的西夏文学研究”,都给了我们对这个无限可能的未来更多的期待和信心。
【作者张光伟是陕西师范大学历史文化学院的讲师,是陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心的副主任,主要从事“人工智能” 历史交叉学科研究:(1)中国古代文字识别与智能古籍数字化基于深度学习,历史地舆信息的多维提取和可视化重构;(2)大模型与历史研究的深度融合;(3)我国一流本科虚拟仿真实验课程“敦煌石窟历史实践教学虚拟仿真实验”项目负责人在历史研究与教学中的应用。]
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




