如何才能在文学教育中进行“人机协作”?

2024-07-25

编者按:近日,复旦大学、华东师范大学、同济大学、上海大学、上海师范大学等上海高校学者联合发起了“我们今天需要什么样的文学教育”系列活动作坊。六月二十八日,由同济大学中文系主办的第一期工作坊“人工智能时代文学教育与文学阅读”在同济大学举行。本论文是同济大学人文学院中文系助理教授林莹在工作坊发言的修改稿。


我将从“艺术”的角度分享一些“人机协同”的课堂案例。有四个案例,都是由我的课堂教学经验或即将付诸行动的教学理念造成的。我想借此机会吸引更多的关注,请批评我的建议。


林莹在车间里讲话。


第一种情况与一个字有关。在大学语文课上,我将介绍汉字的结构和生成方法。就在刚刚过去的春季学期,我以“春”字为例。在开始解释这个词之前,我给同学们预留了30秒的时间去思考。思考的内容是,如果你穿越到几千年前的造字现场,你会如何创造“春”字,必须呈现哪些因素?从现在开始,离答案公布还有30秒左右,各位观众可以同步思考。


接着,我请Chat-GPT在课堂上回答。我把指令敲进对话框,让它描述春天的到来。Chat-GPT很快给出了五个标准,其中前两个标准是“温暖的温度”和“绿色的新叶子”。这个答案基本符合我们的第一反应。这时,我请同学们转过头,一起查看汉代许慎的《文字解释》和相关文献的分析。


许慎的说法是,“春天,从日出来,春天出生,屯声”;清人段玉裁的《说文解字注》和它大同小异:“从日本开始。日本人有时候会生孩子。屯字,就像木头出生的时候。屯也声。”两者的关键区别在于如何理解“屯”的部分。许慎认为“屯”是一种纯粹的声音,段玉裁提出了“屯”的声音和意思,这就是所谓的“亦声”。


我们把古人的解读和Chat-GPT 答案对比:“日”对应Chat-GPT所说的“温暖温度”,“日”对应“绿色新叶”(见图1中亮色块的相互关系)。“春天”的甲骨文字形中,“肚子”变成了两个“肚子”,而“屯”几乎是植物发芽的拟态(图一右下角)。不难看出,虽然我们的祖先和AI模型被漫长的历史和海量的网络数据分开,但它们在描述春天时是不谋而合的,这是浪漫和科学的。在这种情况下,AI主要扮演着类似于“智能助教”或“赛博对话”的角色。


图一 古代先民和人工智能,在描述春天时可以不谋而合。


第2例与一首诗有关。同济大学出版社出版的大学语文教材,收录了苏轼著名的《六月二十日夜渡海》一诗。这首诗的前两联是“参横斗转欲三更,苦雨终风也解晴。云散月明谁点缀,天容海色本澄清。在第一句中,“参横斗转”一词,教材中的注释是“参、斗:两星宿名。横转:星宿位置移动”。虽然这个解释简单明了,但是“参横斗转”到底描述了什么样的情况,因为离我们的现代生活太远了,学生还是会有一种陌生感,很难真正理解和认可。


鉴于这首诗的写作时间和地点非常明确,如果把时间和空间信息(“地点取今海南省海口市,日期取1100年7月28日”)带入天象模拟软件Stellarium,模拟夜间星空,你会意识到“这段时间的参宿位于地平线以下,根本无法观察到。即使你在夜晚参宿,三星连接也几乎是垂直的。由此可以看出,当苏轼谈到“参横斗转”时,他并不像过去批评家所认为的那样现实。在他的书中,“参横斗转”这个词和“与诗中的“云散月亮,天容海色”同为典故”。相比之下,清人彭孙邈的诗,他在《三月十五夜月自元月来无日不雨,夜始月色赋十韵》中写道:“天挂欲横参”。根据Stellarium的说法,在这首诗所写的《1661年4月13日》和《浙江海盐》的时空中,彭氏所在的夜晚确实有“参横”的星象,而且当时是一个“月球被照亮部分占98.8%”的明月之夜,所以所唱的场景与诗题所说的“从元月开始,无日不雨,是夜始见月色”是一致的,属于主客观上“守云散见月亮”的同步状态。换言之,两首诗所写的“参横”就像是真实的差异。


以上关于案例二的引用、比较、分析和结论,包括引用的文字和图片(图2)资料,均来自刘梦涵《古典诗词“参横”意象的季节性规律和审美价值——基于数字人文天象模拟技术的分析》(2023年第一期数字人文),这是她在安徽大学唐宸老师指导下的国家级大学生创新创业培训项目“古诗词中的‘参横’意境——基于天象模拟技术的探索”阶段性成果。在这种情况下,大数据虚拟仿真软件作为一种“电子教具”,可以帮助讲师将遥远而陌生的术语“翻译”成学生亲身感受的日常景观。


我要介绍的第三个案例,和一部小说有关。本人为中文系大二学生开设了“红楼梦”专业选修课。对《红楼梦》的研究,首要任务之一就是理清书中错综复杂的人物关系。假如你为《红楼梦》画了一幅人物关系图,你会如何构思?一般而言,我们会根据血缘和亲缘关系来制图。这个当然离不开文字细读的功夫,这也是中文系师生的“看家本领”。而且与传统的细读(close reading)相应地,AI可以为我们增加新的远读。(distant reading)角度。


2021年,作者季泽豪试图用“自然语言理解、社交网络分析、信息可视化、数据挖掘等”再次解读《红楼梦》中的人物关系。在华东师范大学情报学专业的硕士课程作业中。他“基于共词分析法的基本理论,将《红楼梦》作品中的每一段都视为书中人物出现的舞台和共现模块,从而统计人物之间的共现频率或相处强度”,从而基于段落共现关系,“将实体抽象为节点, 将目标之间的关系抽象为边缘,生成复杂的网络图谱并进行可视化处理,构建新的人物关系图(图3)。该图用七种颜色代表“基于模块化算法产生的七大聚类人群”。“节点的大小由PageRank算法和加权中心决定。节点越大,角色本身及其邻居节点在整个网络中就越重要。这是一个很好的算法,可以兼顾自己和自己的‘朋友圈’。”(参考季泽豪的《这是读红楼梦的DNA密码》?——资料话红楼,网络绘人心”,知乎ID“我是全能小滑块”)。


如果说过去《红楼梦》中人物的关系图显示了亲密关系和应有的亲密关系,那么这种反映团聚关系和重要性的新型网状图就直观地呈现了人物的文字、真实的亲密关系和存在感的强弱。其中最突出的两个群体分别标有红色和紫色,一个以贾母、王熙凤为首,另一个以贾宝玉为首。它为读者提供了一条从特写到远景观察视域的解读路径。但是,对远景的解读还是要回到文字的细节上,不能只靠远景来大作诠释。文字细读始终是第一位的,远读虽然让我们免于陷入细节的风险,但仍然是第二位的,辅助性的。


四是最后一个案例,是我将付诸行动的一种写作练习设想。据我观察,在我们主流的阅读培养和写作练习中,长期存在两个轻微畸形的问题。一是输入重虚构作品,轻非虚构作品;第二,导出侧重于原创写作、轻写和仿写。后来,华东师范大学徐俪成先生的讲话涉及到仿写。他强调艺术风格与表达特点和文字手法的关系,让学生通过模仿古代作家的风格来写拟作,从中学习作品分析和写作实践的多重能力,这一点我印象深刻。在此,我主要结合“改写”和“非虚构作品”两点来分享一个教学理念。


这一教学理念源于我的教学和育儿经验。我曾经从一个大一新生那里听到一个有代表性的自我报告,那就是他们经历了高考,来到了大学,本来可以自由阅读,但是接受了漫长的语文应试教育,他们就像一个长期营养不良的人,突然面对丰盛的自助餐,不知道如何随意享受。此外,他们的肠胃系统早已过于虚弱,即使被迫进食,其实也没有福气。这一描述令人心碎。罗马不是一天建成的,我认为,要改变这种状况,就必须把注意力转移到更早的节点。所以我给的处方就是帮助孩子尽快养成独立阅读的习惯。所以,从科学的角度来看,到底几岁能实现自主阅读?那是我在抚养孩子时遇到的一个疑问。


由于英语阅读材料有完善的通用分级系统,一方面可以通过蓝思值检测等方便方式快速定位读者的阅读水平,另一方面可以根据分级标准对现有文本进行分级,或者将现有文本改写成其他级别,提供给相应级别的读者。这里所说的“将现有文本改写成其他级别”,包括“小猪佩奇”系列故事等虚构作品的重写(参考图4,这本书适合英语水平二级的读者自主阅读),以及NASA新闻等非虚构作品的重写(图5,本文有五个级别可供选择,以满足不同英语水平的读者的自主阅读需求。这些重写版本由newsela平台提供,该平台专门重写新闻报道和专题文章,主题包括自然、人文、社会科学等诸多领域。


图四 《小猪佩奇》的故事被改写成了二级。(Level 2)读本。


即使是语言能力较低的读者,在分级标准明确、分级阅读材料丰富的情况下,也能找到自己喜欢阅读、适合自己阅读的文本,自由享受阅读的快乐。平和双语学校的李天蔚老师今天早上提到,高中生对一些作家的作品“不感兴趣”,也枚举了他们“感兴趣”的对象。如果语文课堂教育要创造条件,让学生喜欢原本“不感兴趣”的好作家和难作品,那么课后独立阅读就是创造条件,让学生充分探索自己“感兴趣”的文本世界。从这个角度来看,如何对中文进行分级,如何对中文读本进行重写,从话题到等级都有足够的覆盖面和适应性版本,构成了培养孩子自主阅读习惯(促进对外汉语教学)的基础工作之一。


中文分级是一项非常困难的工作。由于汉语本身的复杂性和独特性,我们无法通过简单的移植英语分级标准来实现汉语分级。在这种情况下,每个人都不妨反过来,从改写开始。重写文字,就像上面提到的仿写工作一样,本身就是一种可行而有效的写作实践。所以,在我的写作练习设想中,我打算让AI成为竞争对手和合作伙伴。我在写作课程的一个模块中制定了这样的教学计划(参照图6)。第一步,让学生选择重写的主题和目标读者——这里的读者可以是他们的弟弟、妹妹、侄子和侄子,也可以是他们同龄的外国朋友;第二步,根据目标读者的阅读兴趣和能力特点,确定具体的重写文本,开始手动重写;第三步,选择两种或两种以上的AI语言模型,发布重写指令,重写AI处理差异的版本,并与自己的手动重写结果进行比较。最后,我们学习了“人”和“机器”的优势,通过人机共同输出了一个理想的版本,并将此版本交给目标读者,接受读者的阅读反馈。希望借助这样的训练和反馈,一方面可以帮助作者调整改写结果,提高语言表达的灵活性、准确性和适用性,另一方面也可以帮助我们不断积累中文分级的具体指标,从“归纳”的角度反馈中文读物的分级和分级。


图六 一种让AI成为竞争对手和合作者的写作实践想法。


在这一点上,我已经分享了四个案例。让我们回顾一下。第二个和第三个案例是以一首诗和一部小说为例,将数字人文研究成果引入到教学中,这是课程内容中的“人机协调”。随着新兴交叉学科数字人文的不断推广,相信会有越来越多的研究成果来自学术界或自主原创,可以引入人文学科的教学现场(我自己也尝试过一点,参考林莹和施维加的《古代小说文献数字化优化路径探索——一种基于“条件生成对抗网络”的方式。(ConGAN)孙超主编的《数字人文与古代文学研究》,2023年版上海三联书店)。第一个和第四个案例,以一个单词和一个写作练习假设为例,属于教学方法上的“人机协同”,也就是说,让机器充当人类的助教,从而提高教学效果,让学生更快更好地理解知识产生的思维方式,掌握语言和文字的实际应用能力。


上个月初,高考结束后不久,AI也经历了第一次全卷高考。这次评估只针对“这次评估”GPT-4o和2024年高考前开源的6个模型进行了实验。“为了公平起见,本次评估没有纳入商业闭源模型,因为闭源模型的更新时间无法确定。”。根据评价结果,AI模型在语文和英语两个科目上的表现尤为突出。满分150分的语文答卷,AI模型的分数可以高达124分(图7,参考“大模型”!2024-06-19,作者为上海人工智能实验室,第一次AI高考全卷评测结果公布,“澎湃新闻·澎湃号·政务”频道。


当今人工智能技术日新月异的背景下,单纯教授知识的教学早已意义不大,迟早会被AI所取代。比知识点更重要的是知识背后的思维、逻辑和方法、知识之外的情感、想法和洞察力,以及运用知识应对实际需求的实践能力。AI在这些方面不能成为单独的教育者,但可以作为教育者的优质教具和助教。也正是从这个意义上说,“人机协同”教学法,充分强调人的主体性,灵活调用AI功能,很有可能在未来的人文教育中不断拓宽应用,展现魅力。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com