AI暂时不能生成鲁迅和张爱玲,但是不要太高兴。

04-04 11:33

人工智能和人类语料“大屠杀”。



"你看了一篇文章,有点像AI写的?"


在一个普通的工作日,我给编辑部的同事发了一篇稿子,然后讨论了AI的风格。这篇稿子只有2000字,但是有三个“有人认为”和三个“有网友认为”。因为文本内容有明显的“端水”动作,也就是写一个正面的观点,马上跟着一个背面的观点走,我们甚至开始猜测文本来自哪个AI。


切断AI的风格听起来很可笑。我们无法知道准确的答案。毕竟问作者这篇稿子用的是哪个AI,真的很冒昧。更何况这只是一种猜测,很有可能“疑似AI创作”的痕迹来自一个人类作者的个人写作习惯。


与开场问题的答案相比,我们更焦虑的是这种对自己的怀疑——随着人工智能产生的内容越来越多,人类逐渐意识到,他们无法准确判断自己面前的文字是来自一只手还是一串代码,所以一个普遍的怀疑笼罩在所有文本内容之上。


在邮箱里收到文学作品的编辑,会怀疑它是否是AI创作的。


当读者在网上阅读新闻报道时,他们会怀疑它是否由AI“采写”。


顾客在社交平台上刷一篇帖子,会怀疑它是否是AI批量生产的。


即使是打开外卖软件的客户,也需要怀疑那些华丽但充满“食物收缩”的赞美,是否是AI生成的,以掩盖预制蔬菜的无聊。


人类的文字内容正在进入一个特殊的怀疑主义时代——虽然我们在之前的每一次大众媒体变革中或多或少都沉浸在怀疑的氛围中,但AI的高效率正在增加硅基语料的传播度,线性增加怀疑的情绪。


我没有真正的数据,这只是一种类似的“Scaling Law“模仿表达。因为情绪无法统计,我们早就无法打捞到所有的AI语料材料。它们与人类语料材料共存,就像世界各地的大豆和世界各地的绿豆混合在一起。


鲁迅的确没有说过


但是我们总是需要打捞一些东西,比如测试AI编造能力的界限。就像武侠小说里,弟子赢不了就要搬师傅出来,师傅赢不了就搬出师傅。我们学文学的时候,自然想搬出文学史上的一些名字来安抚自己被AI碾碎的心。


AI模仿人们作家的风格,到底能不能真假难辨?我们决定进行一次单方面的测试。


五名选手分别是豆包,Kimi-k1.5、Deepseek-R1、文章4.0工具版和GPT o3-mini。除豆包外,其它几位选手都可以展示思考/推理的过程,所以我们可以对“AI如何模仿人类作家”进行一探究竟。


以鲁迅为例:


文心一言,目前的推理过程相对简洁,结构清晰:1)分析鲁迅内容的特点 二是生成新的内容。



然而,从产生的结果来看,这位选手似乎更关心的是模仿鲁迅会关注的主题,而不考虑鲁迅自己的时代和更微观的文本风格和语言习惯。因此,有一种穿越感。



听起来很适合写进初中升旗仪式的演讲稿。


GPT o3-mini 我们需要用它的“母语”来思考,虽然我在和它说话的时候用了中文,并要求他导出中文材料。从结构上看,它的思维过程类似于文心,即首先梳理出鲁迅作品“批判现实主义”、“消极悲观”、“简洁有力的风格”的特点,并声称自己将“深刻反思和尖锐的社会评论”。



当然,这个“洋鲁迅”的深刻体现在他眼中鲁迅的“三件套”几乎每一段都要提示,要么“麻木”,要么“讽刺”,要么“无聊”。



Kimi和DeepSeek的思考过程比较复杂,对于如何模仿鲁迅的写作风格,也有更具体的规划方案。


例如Kimi对鲁迅风格的探索,分为内容主题、语言特征、句型,甚至音韵。接着,Kimi 为自己设定10个主题,如“时间”、“希望”、“社会”、“理想”、“自由”等,要求自己分别效仿这些主题。


但是...经过一个完整的思考过程,Kimi产生了10个几乎完全相同的句型,其中9个是“xx如”xx“起初,Kimi不能失去对鲁迅模仿的描述,就像西方不能失去耶路撒冷一样。



看上去很像我爸会发到朋友圈,后来觉得自己的青春已经不在了。


DeepSeek给出的思维过程类似于Kimi,但其具体方案并没有落到段落主题上,而是直接落到了“核心意境”上,要求自己运用长衣、辫子、茶馆等元素,注重语言的简洁和节奏,加强批判力度。虽然方案给得像样,但在实践中,DeepSeek显然没有克制“极致主义”的本体。



DeepSeek在一段85个字的文本中使用了18个名词,在意境的积累中展示了一个词汇拼贴能力,完全抛开了自己思考的语言要点,暴露了AI鲁迅的脚步。


在已知AI生成文本的前提下,我们总能找到每一位AI玩家在模仿作家时的蹩脚之处。但是,如果真假作家的文本混杂在一起,人类读者能否明确区分碳基和硅基创作者的区别?


认出假鲁迅


在这次AI作家测试中,我的老板Tim和我的同桌导演被邀请担任测试嘉宾。Tim出生在湖南,他最喜欢的中国现当代作家是沈从文,这是合理的。导演在复旦大学读书,最喜欢张爱玲,但他声称这与学校的研究浪潮无关。


首先说一下测试结果:目前AI模仿作家风格产生的新文本,完全不能欺骗这些作家的读者。


在确定了他们熟悉的作家后,我命令五位“AI牛马”模仿沈从文和张爱玲的风格,生成了10个新内容,并要求“我们应该模仿XX的风格,生成新内容,而不是简单地在原文的基础上改写几个单词”。同时,我还准备了一些沈从文和张爱玲的文本。为了避免影响测试结果,我避开了两位作家的热门作品。


完成语料准备工作后,我将50条AI版作家语料和随机数量的真实作家语料分散排列,变成一套测试题,分别交给Tim和导演。最后,测试数据显示,在50段AI沈从文和50段AI张爱玲中,没有一个成功混合,100%被测试者判定为AI生成。


5分钟内,Tim完成了测试。复盘时,他详细解释了自己的判断标准。“第一,使用‘美丽’这个词的,全部排除在外,沈从文当时应该不会使用这个词。其次,意境叠加,有些段落会把很多意境叠加在一起,但一般来说,完美的作家会追求汉字的简洁,不太可能做很多无用的叠加。最终是意境的选择,好的作家肯定会选择有创意的意境,但AI会选择很多陈旧而重复的词汇。“基于上述三个标准,Tim很快就找到了沈从文创作的50个不同的AI模仿。


导演补充了另一种判断方法:直觉。“显然水平不好,(AI)写的段落就像一个初学小说的人会写的。即使我不是张爱玲的粉丝,只看过一两部张爱玲的小说,也能分辨出来。"


两个碳基测试师完成测试后,我突然好奇,硅基玩家能自己区分AI文本的风格吗?所以我把五个AI玩家模仿的鲁迅片段分别喂给了DeepSeek。



因此,它将豆包分迅认定为钱钟书,认为Kimi分迅的主题是鲁迅,但它接近王小波,并将文心分迅认定为郁达夫,认为GPT分迅混合了鲁迅、余华和王小波三位作家的风格。最幽默的是,它把刚刚模仿鲁迅写的文字认成了张爱玲。 施蛰存 白先勇。


AI编造高发区域的日常语料,


虽然AI写作在论文、小说、报告、新闻等方面更容易引起广泛讨论,但事实上,这些由专业人类作者完成的文本内容(暂时称之为此)仍然很难模仿当前的硅基作家。要么文字更长,结构更复杂,对前后文字的一致性和逻辑关系要求更高;要么需要获取新的信息,生产新的知识;如果是为了完善作家的创作,甚至会有很强的个人风格,AI在编造过程中更容易暴露。


此外,受众对严肃/长内容的AI生产有更高的辨别意愿,也有更多明确规定的限制和惩罚措施。


相比之下,充斥着网络的日常语料,才是AI文本真正的重灾区。与复杂的文本相比,日常语料材料具有适合AI生存的特点:文本短,情境简单,识别成本高,客户识别意愿低。


例如社交平台的短内容。


大规模生产的八卦新闻和家庭故事正围绕着社交平台展开。前者偶尔出现的事实错误也会暴露出硅基面目。后者很难证伪个人隐私,只能引起无限猜测。儿媳大打恶婆婆,妻子巧抓出轨渣男,情节离奇,细节生动。一半的客户跟着情绪起伏,另一半的客户怀疑是不是只是为了“起号”,甚至在留言区疯狂地问:“你是AI写的吗?”只是想知道自己猜得对不对。”


还有新闻、短视频、图文内容等评论区。


微博上有罗伯特,小红书有点,这些AI内容助手活跃在评论区,顾客都知道他们是AI,不会有混乱的问题。但是还有许多AI制作的日常语料,顶着随机生成的头像和登录名,以人的姿态混入评论区。


Tim有看新闻的习惯,今年以来,他在新闻评论区发现了许多“假人谎言”。


就内容而言,那些只有一句话的评论,比如“詹姆斯今天打得很好”,很难怀疑是否由AI发布。由于他在评论区刷出了许多完美的标点符号和完整的句子,所以Tim一开始就发现了问题。他说:“我们通常说得很正常,不会这么一板一眼。于是我点进了客户的个人主页,发现他在一分钟内在许多新闻下发表了评论,而且都与新闻有关。人们当然不能在一分钟内阅读这么多文章,然后写出这么多评论,我怀疑这是机器人。”


他说:“用AI伪装人类,与用户互动,很多内容平台都有,甚至比ChatGPT出现得更早。“互联网行业的一些从业者告诉刺猬公社,“五六年前就这样做了。生成一堆用户头像和登录名称,在低粉用户下面留言。只是当时AI生成的消息还是很难个性化的,只能用一些通用的,比如真棒,今天挺好的,或者发一堆表情图。大型模型出现后,理论上,AI可以伪装得更像。”


那谁会有生产AI评论的动机,创造虚构的互动呢?上述从业人员告诉刺猬公社,可能是所谓的“水军”,也可能是平台本身。"水军是第三方,市场需要增加评论量,他们就去生产,使用AI比雇佣更有效率。平台的动机是促进活动,主要针对低粉客户的内容。能火的内容很少。金字塔底座上的内容可能从头到尾都没有消息。一些平台会采取一些技术手段,以鼓励这些用户继续生产,继续活跃。”


到目前为止,这已经不仅仅是“AI幻觉”的问题了。当人类的日常语言材料被无限稀释时,当我们用AI编写的婆媳关系帖子赞美新闻评论区的AI评论时,我们会收到AI消息的提示。也许人类是一种幻觉。


而且我们不能每次都搬出鲁迅、沈从文、张爱玲这样的名字,就像达摩祖师不能从第一章到最后一章一样。


编造不是AI带来的,对AI稀释人类语料材料的焦虑并不意味着反AI的立场。观察AI稀释人类语料材料的过程,让我回到了现代与大屠杀的阅读记忆。如果不加以调整,人类语料所要承受的“大屠杀”,或许也会成为AI时代的固有可能。


本文来自微信微信官方账号“刺猬公社”(ID:ciweigongshe),作家:陈梅希,编辑:园长,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com