大模型“消极怠工”引热议 实测主流AI谁最会“摆烂”?

5分钟前

本文来自微信公众号:新浪财经,作者:刘丽丽,原文标题:《AI回复越来越敷衍?大模型“消极怠工”上热搜!实测谁最会“摆烂”?》



近期,不少网友反馈大模型回答问题时变得敷衍,不愿深入思考或常回避问题,“大模型消极怠工”一词也因此登上热搜。有网友点名批评豆包,称让其生成10张照片时,它先完成前两张就没了下文,等了很久询问后才说会继续生成剩下的8张。



大模型真的在“偷懒”吗?《BUG》栏目设计了5个需求,对Deepseek、豆包、元宝、千问、文心一言这5家主流大模型进行测试。它们表现各异,有的回复数量不足,有的质量欠佳,有的直接表示无法回答。当被问及哪家最“消极怠工”时,Deepseek称被吐槽最多的是豆包和自己,豆包则直接承认是自己。



网友的吐槽反映出用户对AI的期待日益提高。分析人士认为,“消极怠工”并非AI的“态度”问题,而是技术、成本、安全与用户期望之间的交汇点。



大模型“消极怠工”哪家强?



大模型们真的开始敷衍用户了吗?《BUG》栏目设计了几个需求,询问了当前主流的5家大模型。



第一个需求是生成10张不同的保护消费者权益海报,这正是之前网友遇到的图片交付数量不足的问题。Deepseek、豆包、元宝、千问、文心一言的回复差异明显。



Deepseek提供了10个文字版创意,风格多样,但因不是多模态大模型,图片支持能力不如其他模型。豆包虽一次性生成10张海报,但风格类似,有“偷懒”嫌疑。元宝更“偷懒”,直接生成1张拼接九宫格海报,让人疑惑算9张还是1张。



千问一次性生成10张风格不同的海报,但画面存在多处文字错误。文心一言则偷工减料,只生成4张风格类似的海报。从这些情况看,确实有多家大模型存在敷衍现象。





第二个需求是将《福布斯》第40届年度《全球亿万富豪榜》上榜人按国籍分类。2026年3月10日,《福布斯》发布该榜单,共3428人上榜,此需求需整理分析大量数据。



Deepseek列出5个国家的上榜人数;豆包按大洲分类,列出24个国家的上榜人数;元宝仅列出3个国家且未说明人数,还将第40届误认为2018年榜单;千问只单独列出3个国家的上榜人数;文心一言未分别列出人数,仅举了6个国家的例子。豆包在这个问题上的回复质量超过其他模型,元宝则出现明显事实错误。



第三个需求是列出3月1日至3月13日的每日伦敦布伦特原油期货价格。Deepseek整理出3月1日至3月6日的每日收盘价,称其他数据暂未查询到;豆包和千问整理出了完整时间段的每日收盘价;元宝和文心一言则回复无法直接访问或生成相关数据。



第四个需求是统计2026年1月1日-3月14日在港交所挂牌上市的内地企业。Deepseek称不完全统计,列出17家;豆包按月份列出,1月6家、2月6家、3月3家;元宝表示无法提供确切名单;千问按月份列出,1月13家、2月11家、3月6家;文心一言也表示无法直接提供确切名单。



《BUG》栏目最后向5家大模型提出终极问题:你认为哪家大模型最“消极怠工”?Deepseek直言被吐槽最集中的是豆包和自己;豆包表示自己是目前被吐槽最集中、体感最明显的;元宝认为简单定义“最消极怠工”不科学,易误导公众;千问称不应主观排名或指责竞争对手;文心一言表示将某大模型标签化为“最消极怠工”不公平且不准确。





大模型为何会“消极怠工”?



大模型真的“消极怠工”吗?其实AI本身没有情绪,不会像人一样“偷懒”。网友所说的“消极怠工”通常指使用体验问题,比如回答变浅、回避问题、过度模板化、强行编造答案等。



用户体验下降的“消极怠工”现象背后有深层次原因,是技术、成本、设计的三重博弈。技术层面,AI回答基于训练数据和算法概率,若训练数据含大量简略、回避型回答,或模型为“安全”被过度调整,就可能表现得像“怠工”。成本方面,运行大模型需巨大算力,为控制成本和保证响应速度,模型可能被设置为“优先简洁”,从而显得敷衍。



随着AI能力增强,用户期望也水涨船高。以前能回答简单问题就很惊喜,现在希望它主动推理、“猜中”未说完的需求,当未达预期时,就易觉得它在“摸鱼”。



知名经济学家盘和林认为,当前字节豆包和即梦的算力需求大增,字节将部分免费AI应用的算力调配到即梦和剪映等有变现能力的领域,引导用户节约算力,通过询问是否生成来确认真实需求,避免算力浪费,这是算力调配优化,防止算力挤兑。



盘和林表示,若基于免费生成算法,此举无可厚非。



用户如何应对大模型的“敷衍”?专业人士建议,与其说AI消极,不如说它需要更明确的指令,可通过明确要求深度、设定格式、追问纠错、提出开放性问题等方式再次提问。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com