AI进化成人,速度或许比你想的更慢
大家热议AI这么久了,它到底什么时候才能超越人类呢?
实际上,业内人士对AI有一个终极目标,就是实现AGI(通用人工智能),简单来说,就是打造出“和人一样聪明的AI”。
我们去马斯克的社交平台看看,会发现他总是提及AGI。

OpenAI的奥特曼也多次预言,AGI即将来临,就在未来三五年。

但问题是,该如何衡量AGI呢?俗话说,人与人之间的差异可能比人与猪的差异还大,那到底达到什么水平才算和人一样聪明呢?
就连那些整天为AGI争论的大佬们,也说不清楚AGI到底是什么。

感觉大家都在空口争论。
最近,一群顶尖大佬看不下去了,几十人联合发表了一篇论文,作者阵容堪称全明星,包括图灵奖得主、谷歌前CEO等。他们共同给出了目前第一个AGI的量化定义。
他们还顺便用GPT模型做了测试,结果显示,如果AGI满分是100分,GPT - 5只有58分,不及格。

这些大佬的核心观点是:AGI是一种能达到“一个受过良好教育的成年人”能力的人工智能。
他们把心理学中权威的CHC理论应用到了AI上。
CHC理论认为,智力不能用单一标准衡量,需要多维度考察。
这就像高考,一门课成绩好不够,要门门都好才行。

所以,他们把AI的能力分为10个核心能力,每项占10%的分数,分别是:(K)通识知识、(RW)读写能力、(M)数学能力、(R)即时推理、(WM)工作记忆、(V)视觉处理、(A)听觉处理、(S)反应速度、(MS)长期记忆存储、(MR)长期记忆检索。
其中,工作记忆和长期记忆可能比较抽象。
工作记忆即短期记忆,指刚提到的内容能马上记住;长期记忆是AI通过对话永久学到新东西,就像学过的知识会一直留在记忆里。

对于每种能力,他们都为AI准备了精心设计的测试题。比如在(R)即时推理方面,有这样的问题:“David认识张先生的朋友Jack,Jack认识David的朋友林女士。认识Jack的人都有硕士学位,认识林女士的人都是上海人。所以谁既是上海人又有硕士学位?”
他们让OpenAI的GPT - 4(2023)和GPT - 5(2025)参加测试,结果是GPT - 4总分27分,GPT - 5总分58分,都没达到100分。
从成绩单来看,AI严重偏科。

例如GPT - 5,在通识(K)、读写(RW)、数学(M)方面能拿到9分或10分,这些是AI的强项。
而在(MS)长期记忆存储方面,GPT - 5得分很低,很多只有3 - 4分,GPT - 4甚至多项为0分。
这项测试考察的是AI能否持续学习获取信息。论文发现,现在的AI就像健忘症患者,今天学的东西明天就忘。

测试方法是第一天给AI讲一些内容,第二天换个对话窗口让它回想,结果可想而知,AI基本想不起来,因为新开窗口会清空记忆。
有人会说现在的AI有永久记忆,但文章指出,现在AI的记忆并非真正的记忆,只是在假装。
作者称这种现象为“能力扭曲”,即利用某些领域的优势弥补其他领域的不足,营造出“AI有能力”的假象。现在AI的记忆靠增加上下文长度或知识库实现,模型本身并无记忆。
除了记忆力,长期记忆检索能力AI也很差,主要是检测AI是否会产生幻觉、说瞎话。

还有一项大家都表现不佳的能力是(V)视觉处理。GPT - 4得0分,GPT - 5进化后也只拿到4分。
视觉处理考的不是简单识别图片内容,而是视觉推理,这对大模型来说很难。比如这道题:“下面这4个2D展开图里,哪一个不能折成左边那个立方体?”

这题有一定难度,但人类稍加思考能做出来。我用Gemini测试,它也无法解答。

这表明AI的视觉和思维配合不佳,还不具备人类边看边思考解决问题的能力。
当然,这份报告并不完美。除了这十个维度,人脑还有联想等难以描述的能力,人类太复杂,几道题测不明白。
但它的最大价值是对当下AI进行了全面诊断:AI目前存在短板,在一些人类基本认知能力上有严重缺陷。
而且,现在的AI厂商会用一些方法掩盖这些弱点。
因此,这篇文章给大家敲响了警钟:这样发展下去,AI到不了AGI的水平。
但奥特曼之前直播还说AGI快来了,那就拭目以待吧。

我觉得这套标准也有问题。
AGI为何非要模仿人类呢?它可能是一种完全不同的智能。用人类的CHC理论套AGI,有点刻舟求剑。
而且标准定得有点高,说实话,AI能达到“没受过教育的小孩”的水平就很厉害了,不少人类自己都通不过这个测试。
不过,有人提出标准总是好事。
它的最大意义是把AGI从玄学话题拉到了可讨论的具体问题上。
就算标准不完美,也能促使整个行业思考我们追求的是什么,还缺什么。
这总比大家都吹嘘自己快实现AGI要好。
撰文:不咕


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



