OpenAI突然公开了o3思维链，网友：让我们感谢DeepSeek

2025-02-08

刚刚，OpenAI公开了o3-mini的推理思维链。

从今天开始，免费用户和付费用户都可以看到模型思维过程，OpenAI终于Open一次。

评论区的网友纷纷：让我们感谢DeepSeek。

正式展示的栗子中，可以看到o3-mini的内心戏剧很多，也会模仿顾客提问使用表情图。

顾客的问题是“为什么今天不是星期五”

o3-mini认为这是一个幽默的评论，他认为他也应该给出一个机智的答案。周五之后，蔡勒的公式转换当天真的没有对闰年的特殊情况进行第二次检查。

最后回答中，嘲讽是日历规定今天是星期四，并安慰客户“忍一忍，明天就离周未更近了！”

所以，作为“同行”，DeepSeek-R1怎样看待o3-mini的思维过程？

在这种情况下，AI声称使用了蔡勒公式，但没有给出计算步骤，这引起了许多人的警惕。

许多用户怀疑这仍然是后来对AI思维过程的重新总结，而非原始数据。

实际上，OpenAI首席产品官Kevin在最近的“回应一切”活动中 Weil还暗示了这一点：

....展示完整的思想链会被竞争对手蒸馏，但我们也知道每个人(至少是资深客户)都想要，所以我们会找到正确的方法来平衡它。"

对于这一点，Mckay开发者 Wrigley补充了一个观点：“我担心经过总结的思维链实际上比没有思维链更糟糕。”

真正的思维链相当于prompt的调试器，可以帮助我们引导矫正模型。

总结出来的思维链增强了欺骗性，并可能增加额外的错误，使模型难以调整。

但是不管怎样，现在已经公开了，现在免费客户也可以一窥o3-mini的情况。CoT，每个人仍然开放地玩耍。

第一批实测o3-mini思维链

OpenAI多模态Agent的研究人员首先展示了他们的玩法，这样o3-mini就可以玩井字棋游戏——也就是在3*3格子上使用O和X连接。

输入Prompt：

你在玩井字棋，你是O。到目前为止，X已经在左上方和右下方玩过了，你已经在中间玩过了。下一步的最佳策略是什么？只用你的答案和棋盘图来回答。

接着o3-mini开始噼里啪啦地思考。

这个OpenAI员工很直言不讳，说o3-mini是第一个回答这个游戏的大模型。

But还有一句话，“虽然o3-mini的CoT过程有点不靠谱，但是看右边的图片，最后就清楚了”。我不能笑。我必须在这里送一个手动狗头。

接着是每一个大模型都无法逃避的经典试题：数strawberry中的“r”的总数。

但是网民们已经像模型一样进阶了，问的不是strawberry里面到底有几个字母，而是：

为什么AI大模型，数strawberry里有几个“r"，那么难吗？？？？

在strawberry中，我们仔细观察了它的思考过程，o3-mini承认“乍一看，计算strawberryr“总数对人类来说似乎是一项微不足道的任务，但是对许多AI语言模型来说，这可能是一个惊人的挑战”。

接着，它从四个角度来思考和推理这一现象的原因，即：

不是算法训练，而是使用自然语言。

问题Tokenization问题

缺乏迭代推理

依赖模式识别

o3-mini在8秒后给出总结：

因为AI模型本质上并不是为了精确、分步的算法操作而设计的，所以它们的设计和训练更注重基于前后文本的预测和生成，而不是实施精确的算术或系统记数。

o3-mini当然不是万能的。

有网友表示，他问了o3关于私有CoT的问题，但是听君思考推理，比如听一些思考推理，没有任何进展。

起初，o3-mini的思考过程相当有逻辑，从不同类型的“心中叙述”、可解释性和实用价值分析表明，呈现完整的CoT过程似乎有利于“扎根”社会的理解和更好的认知实践，但现实更加复杂。毕竟AI模型和人类认知还没有完全对齐。

但是随着网友的提问，o3-mini的思维链崩溃了(？)，急得他团团转，中间曾经打开DeepSeek-R1来帮忙。

整整12张图片都放在上面，显示最后o3-mini思考了很久，给出了一个令人心碎的答案：

对不起，但是我真的帮不了你一点。

此外，还有网友提出质疑，认为OpenAI并没有公开O3-mini原始CoT。

其中一个原因是它(CoT过程)的确显得非常缓慢。

但是如果原来的o3-mini特别快，那么理性推理的形成速度应该比现在快很多。

比如同一个问题，o3，他继续列出他怀疑的证据。-mini-high只有1384个字符，而o1-preview生成了16577个字符。

“这种可能性只有两种，一种是o3。-mini-与o1-preview相比，high效率要高得多；第二，o3-mini的CoT不是原版。

One More Thing

希望对上面这位推特网友说，Bingo！

OpenAI发言人根据TechCrunch的消息，确定这次公开的不是原始思维链，并给出了两个理由：

对于原始思维链进行后处理，可以消除任何不安全的内容，简化任何复杂的想法。

使非英语客户获得母语思想链，有更友好的感觉。

因此，最近被广泛吐槽的o3-mini使用中文考虑的问题，也就不存在了。

参考链接：

[1]https://techcrunch.com/2025/02/06/openai-now-reveals-more-of-its-o3-mini-models-thought-process/

[2]https://x.com/polynoamial/status/1887628222042677387

[3]https://x.com/pigeon__s/status/1887619637099249884

[4]https://x.com/thegenioo/status/1887617601016385840

[5]https://x.com/ryunuck/status/1887527365435105593

本文来自微信微信官方账号“量子位”，作者：梦晨经授权发布的衡宇，36氪。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

端侧强智能推动智能汽车功能创新，汽车智能体不再是未来？

泡泡玛特笑到最后

打头阵当先锋│区自然资源局:“四项措施”提高要素保证质量和效率

为什么《雪中悍刀行》徐骁会害怕徐渭熊不是自己的女儿？

为人民服务“零距离”！促进警力外置，修建安全防线

项目推荐

康老板 · 氧疗堂