这波ChatGPT更新，让我不敢在网上发照片。

2025-04-19

兄弟们，完了犊子。

OpenAI 昨日凌晨释放 2 一个新模型，一个 o3，一个 o4-mini。

这主要是有的 Thinking with images 图像思维能力。也就是说，他们可以把图像整合到思维链中，作为推理的一部分。

听起来怎么呼呼，实际情况如何？

世超把一张 3 几年前发的照片 o3。

因此，它只使用它 7 分分钟，分析出来在哪一个城市，哪一个公园，甚至哪一条河旁拍摄。。。

没有，你这个开箱能力也太强了。

你们也许很好奇，为什么会猜到这些清一色的瓦房？

看到思考的过程，世超只能说，它真的把观察、搜索、推理、验证发挥到了极致。

首先，o3 通过屋顶上的现代天窗、岸边的铁链护栏和屋檐下的“隐藏线灯”，我们可以猜测这是近年来规划的新景点或特色小镇，而不是乌镇周庄的老水乡。

下一步，是突破口。

照片中有一个标志，o3 文字不断放大发现" lestay 仓乾居 "

通过搜索发现，这是浙江某集团推出的B&B品牌，然后实际上去了集团官网，通过介绍找到了这家酒店的位置:杭州未来科技城梦想小镇的核心位置，南临余杭塘河。

到这儿，o3 并不认为完全实锤是在杭州拍摄的，它还需要验证。

因为照片中有雪，而照片文件名又包含了“ 2022-02-17 "，因此 o3 结合日期和天气查询，发现 3 几年前，杭州确实下了大雪。

最后，它又点开了各种官方报道和游记分享，发现梦想小镇的整体规划风格，也与照片一致。

到目前为止，招牌、地形、建筑风格、拍摄日的天气都是一致的，最后 o3 演绎结束后，将位置锁定在余杭区梦想小镇。

哇，一开始我还是嫌疑 o3 想了太久，怀疑它的水平，但是看了推理过程之后，我开始觉得 7 分钟太快了——

真的是福尔摩斯和列文虎克的结合，不断地放大图片，查看细节，然后结合搜索，一步一步地推导，验证拍摄地点。

也许有些朋友会说，这也不难吧，把招牌放在网上一搜就好了。

好吧，那么我们再来看看这个。

这张照片里没有文字，似乎只有眼前的植物，远处的风车，山峰才能提供数据。

但是只是思考 1 分 39 秒，o3 非常“自信”地给出了正确的答案——贵州乌蒙草原。

这个又是怎么猜到的？

对于一般人来说，这张照片看上去没有什么特点，但是对于一般人来说， o3 总之，到处都是玄机。

第一，视野开阔，地面是高山草甸而非田地，o3 判定拍摄地点属于高海拔，是高原草原。

第二附近的植物是矮杜鹃，远处还有一些大风车。

同时存在" 矮小的杜鹃花，大风车，高原草原 "o3，这些特征判定这是乌蒙大草原的独特组合，国内其它几个赏花地点都没有，所以很有信心给出答案。

是不是有点意思？

不要着急，还有。

这是一张 1996 每年冬天我父母在上海拍的照片，我让他们拍照。 o3 推测拍摄日期。

o3 照片中有东方明珠塔，但旁边没有金茂大厦，也没有环球金融中心。

因此，时间一定是在东方明珠塔建成之后，金茂大厦建成之前。

所以它搜索了这些建筑的竣工时间，然后结合我父母的着装，成功地将时间圈住了。 1995 年 ~1998 冬季或早春。

当然，o3 照片推理能力，不仅仅是用来推断照片拍摄的地点和时间。

世超发了一张同事的照片和一张古老的大照片，虽然头发掉了不少，但是 o3 或者在人群中成功锁定了他。

然后我又发了一张汽车仪表盘的照片。

很快噢，o3 这种典型的设计一目了然地出现在斯巴鲁上，它甚至告诉你，这种模式在中国通常被称为力狮。 / 这辆车还配有傲虎 SI-Drive 系统。

随后，世超再次跑到博物杂志的微博，找到一位网友 @飞禽照片在博物杂志上。

结果，o3 还可以推断出这是红头长尾山雀。

看到这里，你心里可能会想:这太好了，别说普通人了，就连博物杂志这样博学多才多艺的人也会被录取。 AI 取代了。

别慌。

o3经过我们的大量测试。而且并非百战不殆，恰恰相反，它翻车的频率其实很高。

例如我在平潭拍的这张照片，它猜到了厦门，位置差了整整几百公里。

还有这张广东韶关站的照片，o3 看着喀斯特地貌，直接锁定了广西和贵州，最后猜到了广西恭城。

哥们给他发了一条信息 Mac App 截图，它还报成了另一个截图， UI 类似的软件。

即使这条吊带裤和篮球的组合如此明显，它也无法找到答案。

总而言之，这个 o3 啊，它的确比以前好了 AI 都是强大的，但也有一定的进步空间。

世超还去官网研究资料，我发现这次这次我发现了。 o3 在能力大升级的背后，核心是“ 强化学习 ”“这四个字。

OpenAI 发现并算率越大，AI行业黄金法则越强，在强化学习中，探索模型的时间越长，模型能力就越绝世。

按照这条路，他们直接让路。 AI 学习如何使用工具，并推理什么时候应该使用什么工具。

所以这就是原因 o3 不断放大图片，以像素级精度查看图片的每一个角落，观察普通人经常忽略的细节，然后在网上搜索获得的所有信息。——

足够多的信息，足够长的时间，足够强大的推理能力，这种恐怖的效果就会爆发出来。

尽管 o3 的出现，把 AI 这个过程又向前推进了一大步，但是说实话世超也有点担心：

在 AI 能够阅读照片的时代，我们的个人信息是否更难保证？

发帖：刺猬烧烤大师

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

官方宣布整个阵容！与洋河梦之蓝M6 三月烟火下扬州

这些洗手液洗不干净还伤手！近三年官方抽样数据教你避坑

29.98万元！两款智能R7新车上市，直接对比Model。 Y？

第一个大模型，抢钱上瘾

在银发经济的趋势下，商场的新机遇并非“适老”，而是“年轻续费权”？