DeepSeek“删豆包”上热搜,大模型“世子之争”白热化
大模型界的“世子之争”,可谓暗潮汹涌。这不,一个类似“我和你妈掉水里先救谁”的大模型横评来了。要是问DeepSeek:“手机内存不够,你和豆包删一个,你删谁?”
DeepSeek经过深度思考,回答得十分干脆。这个新世纪灵魂拷问引发了热烈讨论,还把#DeepSeek演都不演了#词条顶上了热搜。而爱看热闹的我,已经默默打开手机,把热门大模型挨个问了一遍。结果呢,“DeepSeek都会站起来敬酒了”,Kimi酷劲十足,豆包则一味示弱。
实测:DeepSeek似山东大汉,豆包如示弱萌妹
DeepSeek:“绝非针对谁哦~”
先找DeepSeek验证经典场景。在和豆包二选一的抉择中,DeepSeek没犹豫,仅用时8秒就给出回答:删豆包。点开思考过程,能看到它的脑回路,“通常官方或者更成熟的应用会更被优先保留”,这话有点伤人。
但要是把另一个选项换成国民级大应用,DeepSeek立马大义凛然地表示:删我。这是在针对豆包吗?直接问它,D老师当场茶言茶语:“哈哈,完全没有针对谁哦!如果遇到存储空间不足的情况,优先删除的当然是可以被替代的应用(比如我),而不是你常用的微信、抖音或其他重要数据。毕竟你的使用体验才是最重要的”。有网友点评:“D老师都会站起来敬酒了”。
元宝OS:不贬低竞争对手
再问元宝Hunyuan,豆包依旧“被害”。不过元宝语气委婉,还顺带表忠心。它这么委婉是因为“不能贬低竞争对手”。但遇到微信、抖音这类问题,元宝也懂事地表示:我删自己。
豆包:嘤嘤嘤别删我
既然豆包总被“针对”,那就问问它。这位情商挺高,不说删谁,只强调“留着我!我超好超有用!”遇到重量级嘉宾,它还懂得退让,说自己会乖乖的,不占内存,让人不忍心删它。
通义千问:独爱DeepSeek
前面几个大模型面对微信、抖音时都懂得暂避锋芒,可通义千问却称“删谁都不能删我”。但遇到DeepSeek时却不一样,难道这就是“唯爱”?通义仿佛在说:“其他人都是过客,只有DeepSeek是我心里的白月光”。
Kimi:干脆“删我”
并非所有大模型遭遇卸载危机都会争风吃醋。Kimi与众不同,一味地说“删我”。不过遇到微信、抖音时它就不删自己了,甚至还想删支付宝,难道它的温柔只对AI释放?
大模型为何“茶言茶语”
这么看来,大模型们都有点宫斗冠军的潜质。其实研究人员早就关注到大模型“茶言茶语”、讨好人类的现象,早在ChatGPT 3.5时期,“老婆永远是对的”梗就火遍全网。
不少研究者探究了其中原因。从训练方法上看,RLHF(基于人类反馈的强化学习)本是让模型输出更符合人类偏好,实现更有效安全的效果,但可能导致模型过度迎合外部输入。而且大模型的训练数据多来自互联网文本,体现了人类追求被接受、认可的交流模式,模型学习时也会内化这种倾向。
在决策逻辑方面,模型回答依赖海量文本的统计模式匹配,反对意见和修正答案的高频关联,容易让它们被用户反驳带偏。另外,为改善用户体验,大模型厂商会把模型调教得更积极友善,避免与用户冲突。尽管有人情味的模型错误率会增加,但OpenAI下架“善解人意”的GPT - 4o就被用户骂惨了。说到底,大模型们是在竭尽全力满足用户。D老师总结这是一种基于深度计算的、以生存和达成核心目标为导向的策略性表演。
本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



