OpenAI突然公开了o3思维链,网友:让我们感谢DeepSeek
刚刚,OpenAI公开了o3-mini的推理思维链。
从今天开始,免费用户和付费用户都可以看到模型思维过程,OpenAI终于Open一次。

评论区的网友纷纷:让我们感谢DeepSeek。

正式展示的栗子中,可以看到o3-mini的内心戏剧很多,也会模仿顾客提问使用表情图。
顾客的问题是“为什么今天不是星期五”
o3-mini认为这是一个幽默的评论,他认为他也应该给出一个机智的答案。周五之后,蔡勒的公式转换当天真的没有对闰年的特殊情况进行第二次检查。
最后回答中,嘲讽是日历规定今天是星期四,并安慰客户“忍一忍,明天就离周未更近了!”

所以,作为“同行”,DeepSeek-R1怎样看待o3-mini的思维过程?

在这种情况下,AI声称使用了蔡勒公式,但没有给出计算步骤,这引起了许多人的警惕。
许多用户怀疑这仍然是后来对AI思维过程的重新总结,而非原始数据。

实际上,OpenAI首席产品官Kevin在最近的“回应一切”活动中 Weil还暗示了这一点:
....展示完整的思想链会被竞争对手蒸馏,但我们也知道每个人(至少是资深客户)都想要,所以我们会找到正确的方法来平衡它。"

对于这一点,Mckay开发者 Wrigley补充了一个观点:“我担心经过总结的思维链实际上比没有思维链更糟糕。”
真正的思维链相当于prompt的调试器,可以帮助我们引导矫正模型。
总结出来的思维链增强了欺骗性,并可能增加额外的错误,使模型难以调整。

但是不管怎样,现在已经公开了,现在免费客户也可以一窥o3-mini的情况。CoT,每个人仍然开放地玩耍。
第一批实测o3-mini思维链
OpenAI多模态Agent的研究人员首先展示了他们的玩法,这样o3-mini就可以玩井字棋游戏——也就是在3*3格子上使用O和X连接。
输入Prompt:
你在玩井字棋,你是O。到目前为止,X已经在左上方和右下方玩过了,你已经在中间玩过了。下一步的最佳策略是什么?只用你的答案和棋盘图来回答。
接着o3-mini开始噼里啪啦地思考。

这个OpenAI员工很直言不讳,说o3-mini是第一个回答这个游戏的大模型。
But还有一句话,“虽然o3-mini的CoT过程有点不靠谱,但是看右边的图片,最后就清楚了”。我不能笑。我必须在这里送一个手动狗头。

接着是每一个大模型都无法逃避的经典试题:数strawberry中的“r”的总数。
但是网民们已经像模型一样进阶了,问的不是strawberry里面到底有几个字母,而是:
为什么AI大模型,数strawberry里有几个“r",那么难吗????
在strawberry中,我们仔细观察了它的思考过程,o3-mini承认“乍一看,计算strawberryr“总数对人类来说似乎是一项微不足道的任务,但是对许多AI语言模型来说,这可能是一个惊人的挑战”。
接着,它从四个角度来思考和推理这一现象的原因,即:
不是算法训练,而是使用自然语言。
问题Tokenization问题
缺乏迭代推理
依赖模式识别
o3-mini在8秒后给出总结:
因为AI模型本质上并不是为了精确、分步的算法操作而设计的,所以它们的设计和训练更注重基于前后文本的预测和生成,而不是实施精确的算术或系统记数。

o3-mini当然不是万能的。
有网友表示,他问了o3关于私有CoT的问题,但是听君思考推理,比如听一些思考推理,没有任何进展。
起初,o3-mini的思考过程相当有逻辑,从不同类型的“心中叙述”、可解释性和实用价值分析表明,呈现完整的CoT过程似乎有利于“扎根”社会的理解和更好的认知实践,但现实更加复杂。毕竟AI模型和人类认知还没有完全对齐。

但是随着网友的提问,o3-mini的思维链崩溃了(?),急得他团团转,中间曾经打开DeepSeek-R1来帮忙。
整整12张图片都放在上面,显示最后o3-mini思考了很久,给出了一个令人心碎的答案:
对不起,但是我真的帮不了你一点。

此外,还有网友提出质疑,认为OpenAI并没有公开O3-mini原始CoT。
其中一个原因是它(CoT过程)的确显得非常缓慢。
但是如果原来的o3-mini特别快,那么理性推理的形成速度应该比现在快很多。
比如同一个问题,o3,他继续列出他怀疑的证据。-mini-high只有1384个字符,而o1-preview生成了16577个字符。
“这种可能性只有两种,一种是o3。-mini-与o1-preview相比,high效率要高得多;第二,o3-mini的CoT不是原版。

One More Thing
希望对上面这位推特网友说,Bingo!
OpenAI发言人根据TechCrunch的消息,确定这次公开的不是原始思维链,并给出了两个理由:
对于原始思维链进行后处理,可以消除任何不安全的内容,简化任何复杂的想法。
使非英语客户获得母语思想链,有更友好的感觉。
因此,最近被广泛吐槽的o3-mini使用中文考虑的问题,也就不存在了。


参考链接:
[1]https://techcrunch.com/2025/02/06/openai-now-reveals-more-of-its-o3-mini-models-thought-process/
[2]https://x.com/polynoamial/status/1887628222042677387
[3]https://x.com/pigeon__s/status/1887619637099249884
[4]https://x.com/thegenioo/status/1887617601016385840
[5]https://x.com/ryunuck/status/1887527365435105593
本文来自微信微信官方账号“量子位”,作者:梦晨 经授权发布的衡宇,36氪。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




