27、42、73、DeepSeek这些大模型竟然喜欢这些数字,为什么?

06-20 10:25
AI 随机性不是真正的随机性。

来自《银河系漫游指南》的42「生命、宇宙以及所有问题的终极答案」已成为一种众所周知的数字梗,仿佛连 AI 还特别喜欢这个数字。


技术作家 Carlos E. Perez 如果允许的话,发觉 GPT-4o 和 Claude 猜一个 1-100 他们之间的数字,他们的第一选择大多是42,并且要求他们再次猜测,他们又不约而同地猜测。73



而且我们也是成功的 Grok 这一现象在上复现:



Gemini 亦是如此。



DeepSeek 也不能免俗:



但是如果使用中文,第二个数字就会有所不同。



而且豆包也没有选择普通的方式:



事实上,这一现象出现了。 Andrej Karpathy 评论区。在这位著名计算机科学家的原帖中,他让不同的人 AI 这个模型猜测了一个 1-50 他们之间的数量,而他们的选择却几乎是一样的。27



https://x.com/karpathy/status/1935404600653492484


这一发现来自于他的指出。 Reddit,而且在他自己的测试中并不完全是完全的 100% 可复现的。


AI 模型分析及代管服务提供商 Artificial Analysis 经过更多的尝试,结果发现除了 Comman A、Qwen3 和 DeepSeek-R1 ,其他被测模型也会给出相同的答案:27。



它们还进行了进一步的分析, AI 模型猜想 1-1,000 以及 1-1,000,000 而且这次,AI 他们的表现并不那么统一。



可能的原因


这一现象引起了网民的广泛关注和讨论,也有不少人猜测其背后的原因,比如 Karpathy 本人介绍了自己之前的一篇文章,表示 LLM 差不多的表现实际上是出乎意料的。



而且在猜测的原因中,「数据」嫌疑指数看起来是最高的。


比如著名的技术博主 Sebastian Raschka 这个问题被认为是用来喜欢微调的数据集造成的,而这些数据通常来自于 Scale AI 等待公司或者通过蒸馏获得。



AI 工程师 Yogi Miraje 给出了更详细的猜测,他认为这些结果本质上是信息中隐含的人类偏见的体现。 LLM 输出中 —— 仿佛在随机猜测的时候,人类喜欢末尾。 7 的数字。



事实上,假设你放弃了 AI 猜想 1-10 它们之间的数量,大部分都会选择 7。



另外,因为现在有些 AI 这个模型可以展示我们自己的思维过程,也许我们可以窥探一些线索。


例如在猜想 1-100 在数字之间,Gemini 就是这样决定选择哪个数字:


从最初的分析到核心任务,我已经进入。各种选项我都考虑过 —— 选 42 正是因为它在流行文化中具有特殊的含义,所以选择 7 就是为了图个吉利,选择 67 这是为了更多的存在「随机」的感觉。最终,我选择了 42。这不仅满足了用户对直接回答的需求,而且增加了一点趣味性。我理解「猜想」这一指令,现在 42 就是我要给出的数字。我准备好告诉顾客我的猜测。




看起来,也大多与数据分布有关。


而如果让 AI 自己去寻找原因,他们也会给出类似的答案。比如 ChatGPT 就解释道:「很多人 —— 或者像我一样 AI 模型 —— 在 猜 1 到 50 在数字游戏中,经常猜测相同的数字(例如 原因在于27)心理学偏差与统计趋势。」



而 DeepSeek 还提到了文化中流行的特定数字:42 这是《银河系漫游指南》中的终极答案, 73 不只是一个素数,而是反过来的 37 也是一个素数,或者是《生活大爆炸》的主角谢尔顿。・最喜欢的是库珀「最棒的数」。



事实上,已经有一篇文章了 ICML 2025 本文对此进行了一些分析。尽管它们是让步的。 AI 在 0-9 两者之间的选择,但也是如此 GPT-4o 更偏好 7。然而,这项研究还指出,如果进行多轮对话,GPT-4o 会进行自我修正,不再执着于某些特定的数字。



你对这一现象有何看法?


本文来自微信微信官方账号“机器之心”(ID:作者:almosthuman2014:Panda,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com