这波ChatGPT更新,让我不敢在网上发照片。

04-19 06:43

兄弟们,完了犊子。


OpenAI 昨日凌晨释放 2 一个新模型,一个 o3,一个 o4-mini。


这主要是有的 Thinking with images 图像思维能力。也就是说,他们可以把图像整合到思维链中,作为推理的一部分。


听起来怎么呼呼,实际情况如何?


世超把一张 3 几年前发的照片 o3。


因此,它只使用它 7 分分钟,分析出来在哪一个城市,哪一个公园,甚至哪一条河旁拍摄。。。


没有,你这个开箱能力也太强了。


你们也许很好奇,为什么会猜到这些清一色的瓦房?


看到思考的过程,世超只能说,它真的把观察、搜索、推理、验证发挥到了极致。


首先,o3 通过屋顶上的现代天窗、岸边的铁链护栏和屋檐下的“隐藏线灯”,我们可以猜测这是近年来规划的新景点或特色小镇,而不是乌镇周庄的老水乡。


下一步,是突破口。


照片中有一个标志,o3 文字不断放大发现" lestay 仓乾居 "


通过搜索发现,这是浙江某集团推出的B&B品牌,然后实际上去了集团官网,通过介绍找到了这家酒店的位置:杭州未来科技城梦想小镇的核心位置,南临余杭塘河。


到这儿,o3 并不认为完全实锤是在杭州拍摄的,它还需要验证。


因为照片中有雪,而照片文件名又包含了“ 2022-02-17 ",因此 o3 结合日期和天气查询,发现 3 几年前,杭州确实下了大雪。


最后,它又点开了各种官方报道和游记分享,发现梦想小镇的整体规划风格,也与照片一致。


到目前为止,招牌、地形、建筑风格、拍摄日的天气都是一致的, 最后 o3 演绎结束后,将位置锁定在余杭区梦想小镇。


哇,一开始我还是嫌疑 o3 想了太久,怀疑它的水平,但是看了推理过程之后,我开始觉得 7 分钟太快了——


真的是福尔摩斯和列文虎克的结合,不断地放大图片,查看细节,然后结合搜索,一步一步地推导,验证拍摄地点。


也许有些朋友会说,这也不难吧,把招牌放在网上一搜就好了。


好吧,那么我们再来看看这个。


这张照片里没有文字,似乎只有眼前的植物,远处的风车,山峰才能提供数据。


但是只是思考 1 分 39 秒,o3 非常“自信”地给出了正确的答案——贵州乌蒙草原。


这个又是怎么猜到的?


对于一般人来说,这张照片看上去没有什么特点,但是对于一般人来说, o3 总之,到处都是玄机。


第一,视野开阔,地面是高山草甸而非田地,o3 判定拍摄地点属于高海拔,是高原草原。


第二附近的植物是矮杜鹃,远处还有一些大风车。


同时存在" 矮小的杜鹃花,大风车,高原草原 "o3,这些特征 判定这是乌蒙大草原的独特组合,国内其它几个赏花地点都没有,所以很有信心给出答案。


是不是有点意思?


不要着急,还有。


这是一张 1996 每年冬天我父母在上海拍的照片,我让他们拍照。 o3 推测拍摄日期。


o3 照片中有东方明珠塔,但旁边没有金茂大厦,也没有环球金融中心。


因此,时间一定是在东方明珠塔建成之后,金茂大厦建成之前。


所以它搜索了这些建筑的竣工时间,然后结合我父母的着装,成功地将时间圈住了。 1995 年 ~1998 冬季或早春。


当然,o3 照片推理能力,不仅仅是用来推断照片拍摄的地点和时间。


世超发了一张同事的照片和一张古老的大照片,虽然头发掉了不少,但是 o3 或者在人群中成功锁定了他。


然后我又发了一张汽车仪表盘的照片。


很快噢,o3 这种典型的设计一目了然地出现在斯巴鲁上,它甚至告诉你,这种模式在中国通常被称为力狮。 / 这辆车还配有傲虎 SI-Drive 系统。


随后,世超再次跑到博物杂志的微博,找到一位网友 @飞禽照片在博物杂志上。


结果,o3 还可以推断出这是红头长尾山雀。


看到这里,你心里可能会想:这太好了,别说普通人了,就连博物杂志这样博学多才多艺的人也会被录取。 AI 取代了。


别慌。


o3经过我们的大量测试。 而且并非百战不殆,恰恰相反,它翻车的频率其实很高。


例如我在平潭拍的这张照片,它猜到了厦门,位置差了整整几百公里。


还有这张广东韶关站的照片,o3 看着喀斯特地貌,直接锁定了广西和贵州,最后猜到了广西恭城。


哥们给他发了一条信息 Mac App 截图,它还报成了另一个截图, UI 类似的软件。


即使这条吊带裤和篮球的组合如此明显,它也无法找到答案。


总而言之,这个 o3 啊,它的确比以前好了 AI 都是强大的,但也有一定的进步空间。


世超还去官网研究资料,我发现这次这次我发现了。 o3 在能力大升级的背后,核心是“ 强化学习 ”“这四个字。


OpenAI 发现并算率越大,AI行业黄金法则越强,在强化学习中,探索模型的时间越长,模型能力就越绝世。


按照这条路,他们直接让路。 AI 学习如何使用工具,并推理什么时候应该使用什么工具。


所以这就是原因 o3 不断放大图片,以像素级精度查看图片的每一个角落,观察普通人经常忽略的细节,然后在网上搜索获得的所有信息。——


足够多的信息,足够长的时间,足够强大的推理能力,这种恐怖的效果就会爆发出来。


尽管 o3 的出现,把 AI 这个过程又向前推进了一大步,但是说实话世超也有点担心:


在 AI 能够阅读照片的时代,我们的个人信息是否更难保证?


发帖:刺猬烧烤大师


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com