O1打开了大模型推理能力的天花板,但离AGI还很远。
今天早上北京时间,OpenAI 忽然发布了 OpenAI o1 系列模型,OpenAI CEO Sam Altman 高赞O1:“OpenAI o1 这是一个新范式的开始:可以进行通用的复杂推理。 AI。”
在我看来,OpenAI这次发布了O1,营销策略和以前一模一样——从X平台上的“草莓”照片展示,到声称Level 2级别具有博士推理能力,再到每月2000美元的费用,以及比GPT-4o强100倍的夸张描述,都是为了制造FOMO(害怕错过)的情绪。但是,在实际发布的时候,却设置了一系列的限制,不管是只提供o1-mini和o1-preview版本,还是没有完整的o1,或者每周只有30次调用频率。
为何要这样做?
我认为这仍然是一个“鬼”的计算率。众所周知,OpenAI正在筹集65亿美元,估值1500亿美元。虽然GPT已经成为单个收入最高的Gen-AI应用,但培训新模型的成本、昂贵的人工成本和推理新模型运行所需的计算率已经成为一个限制因素。
从预期的角度来看,在之前的各种OpenAI采访中,我们已经遇到了推理能力的主要进步,我们使用了不同于以前的方法。更容易猜到的是从之前提示的系统1思维方式转变为独立的Think。 Step by 系统2Step方法。
令人失望的是,推理能力仍然只在文本领域,无法处理多模式内容和实时处理。这进一步验证了蓝码的观点:即未来大模型会分为不同的类别、纯文本、多模式(离线)和多模式(即时),每个模式都会变成不同的轨道。

网上已经有很多关于实际使用结果的描述,这里就不重复了。可以说,OpenAI的发布确实向大家展示了进步的概率,虽然还是有低级错误,比如9.11和9.9的比较。
O1的发布意味着国内大型模型制造商可以复制“工作”。在目前的市场上,纯文本输入输出模型的家族竞争非常激烈,有大量的开源/闭源、不同尺寸、不同垂直行业的文本模型。O1将掀起新一轮的竞争——大模型推理能力的天花板将被打开。但是,在O1模式下,推理的算率成本将进一步上升,因此通过小模型、大模型合作架构来完成端到端的任务将变得更具成本效益,因此,在未来,我预测甚至会出现子母模型、连环模型组合方案,旨在将推理成本降低到同等智商人类员工的水平。

此外,O1的推出无疑会加速AI在刚需场景中的应用。因为推理能力是其核心竞争力,虽然需要几分钟才能达到目标,但是对于在办公室工作的人来说,几分钟的响应速度已经很快了。
在我看来,O1意味着我们可以通过投入更多的计算率来生成一个逻辑一致的代码块,这暗示了大量复杂业务任务自动化的潜力。例如,信用审计、人力资源计算年终奖、管理会计等领域。
举个简单的例子,很多人都有在Excel中建模和计算任务的经验。O1就像未来更智能的Excel背后的“大脑”。未来,各种预测和分析只能通过对话来进行。
使用澜码的Agentic 从AI产品结构来看,O1可以作为业务活动安排中蓝色代码的基础,预测下一个动作应该是什么。其推理能力可以解锁更多的需求场景,提高专家赋能基层业务单位的水平。

关于O1的发布,有媒体指出它已经具备了Agent的推理能力,这一点我基本认同。但是,对于O1和AGI(人工通用智能)之间的关系,我仍然不那么乐观。蓝色代码有一个关于Agent概念的示意图。从图中可以看出,实现AGI所需的环境建模和目标认知能力。但是,目前的模型类别在处理现实世界中的时空关系时,仍然显得捉襟见肘。

从现有的模型结构来看,大型模型没有长期的记忆,所以无法回忆过去或预测未来。此外,大型模型本身受到服务器的限制,缺乏对空间的感知。我之前提到过波普尔的“三个世界”假设:物理世界是“世界1”,每个人脑海中的主观世界是“世界2”,我们用语言符号/硅基构建的世界3。
目前O1只能被困在世界3中。如果不能主动观察世界1,或者通过世界2了解世界1,可能连基本的时空概念都无法建立,更不用说学习关于世界1的新知识了。
所以,具体智能(这不仅仅是指物理世界中的机器人,还包括数字世界中的AI,比如蓝码设计的。 Agent)突破至少是我们和AGI之间的一块大石头。搬走这块石头后,还会有下一个“坑”吗?我们不得不等待。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




