AI爆炸程序员失业潮,小扎正在开发编程智能体,「中级程序员」剩下的最后一年?

01-14 11:22

今年,编程可能从就业环境中最受欢迎的技能之一转变为能够完全自动化的技能。


自小扎近期「信心十足」就演讲而言,这并非空穴来风:


到2025年,我们的Meta和其他正在研究这个领域的公司很可能会开发一种AI,它可以发挥相当于中级工程师的作用,并且有编写代码的能力。



甚至,他也提出了一个「终极构想」——大多数Meta代码的编写,以及AI系统的开发,都将由「人·工智能」工程师来完成,没有「人·类」工程师!


按照小扎的话来说,未来的人类将在重复的工作中得到解放,探索更多的可能性,具有更强的创造力。



Meta软件工程师的工资从每年18.4万美元到E9级每年325.1万美元不等。在这些工程中,中级软件工程师的年薪大约是50万美元。


事实上,从2024年底开始,科技界就开始充满这种雄心勃勃的态度。「推测」。


各大厂商的研究人员和高管们,开始急切地讨论超级智能系统的到来,仿佛一场智能革命即将席卷而来。



MarceSalesforce的老板 更有甚者,Bernioff公司今年将停止招聘软件工程师。


马斯克:非常AI将于2030年问世。

马斯克在去年12月的一条推文中说:「到2025年底,AI将超越所有人类个人的智能水平,到2027-2028年,AI将超越所有人类的个人智能。」


「AI在2030年几乎不可避免地会超过全人类的智能总和(接近100%的概率)。」


奥特曼:AI将于2025年全面进入就业环境

相似的,OpenAI 在今年1月的博客中,CEO奥特曼还表示,OpenAI已经掌握了构建传统AGI的方法。


并且他认为,在2025年,AI智能体可能会首次出现「加入劳动力市场」,并且实质性地改变了公司的产出。


Dario Amodei:预计AGI将在2025-2027年实现

去年6月,Anthropic CEO Dario Amodei表示,他认为AGI将在未来1-3年内实现。「可能性很大」。



如何解读AI圈「将来宣言」?


就像宾大教授Ethan Mollick指出,这些业内人士的大胆预测有明显的目的。——它们筹集资金,提高股票估值,或许还在说服自己创造历史。


大模型本身在稳定性上也有实质性的缺陷:在一些任务上表现突出,但在看似简单的任务上却显得无能为力。这种「能力参差不齐」是当前AI系统的核心特征,短期内难以得到根本改进。


但是,将这些预测简单地归类为炒作,是很不明智的。


无论出于何种目的,AI实验室的研究人员和工程师似乎真诚地相信,他们正在见证一个前所未有的突破。


仅仅依靠他们的这种确信可能是不够的——但是越来越多的公开基准测试和演示开始揭示他们为什么会有这样的想法。


正如潮汐正以超乎想象的速度上升。



潮汐渐涨

十二月底,OpenAI发布了世界上最强大的公告。「推理模型」——o3。这是一系列测试中令人震惊的进展,可以说是完全超出了我们对AI技术水平的预期。


其中,有三个特别值得注意的标准:


1. GPQA:即使使用谷歌也不能回答博士级别的测试。


在测试中,可以使用互联网的医生在他们的专业领域得分为81%,而在领域之外,他们下降了34%。相比之下,o3总体上达到了87%的准确率,首次超越了人类专家。


2. Frontier Math:非公开数学题目是由数学家建立的。


这个测试非常困难,以前没有AI能得到超过2%的分数,而o3能得到25%的准确率。


3. ARC-AGI,对人类来说,题目相对容易,但对AI来说很难进行智能体检。


这里,o3再一次击败了之前所有的AI和人类标准水平,得分达到87.5%。


尽管这些测试都有局限性,但是它们表明,事实上,我们以前认为AI无法逾越的门槛很快就会被突破。



AI智能体

当AI变得越来越智能化时,它们就成了更有效的AI智能体。


智力体又是一个定义模糊的术语,通常指AI,它可以独立实现一系列的目标能力。


一些早期的智能系统已经在之前的文章中展示过,过去几周的发展也向我们证明,实用的AI智能体已经在一些细分但经济效益重要的领域变得可行。


一个典型的例子是谷歌的Gemini及其Deep Research功能-定制的研究型AI智能体。


举例来说,我们问它「从创始人的角度来看,创业公司各种融资方式的增长非常高。」。智能机构将立即制定计划,并阅读多达173个网站。


一份完整的分析报告在十分钟后发布!其中,有118篇参考文献,篇幅接近17页。



所以,质量怎么样?


身为沃顿商学院教授创业入门课程超过十年的教师,Ethan Mollick不仅在这一领域发表了一篇文章,自己创办了一家公司,还写了一本关于创业的书。


在他看来,这份报告相当扎实,没有发现任何明显的错误,有兴趣的读者可以查看原文进行验证。


此外,教授还指出,目前AI智能体最大的局限性不在于准确性,而在于只能浏览公开的非付费网站,无法获得学术或付费出版物的内容。而且它的分析略显浅薄,在面对矛盾的证据时缺乏有力的论证。


综上所述,尽管它还不如最好的人类专家,但它已经超过了他所看到的许多报告的标准。



Deep Research项目负责人透露,这只是一个小团队的试点项目。因此,可以推测,意愿更强、规模更大的团队和公司也可以取得类似的效果。


现在,AI智能体已成为特定领域的实际商品,而非遥不可及的想法。


这就引发了一个问题:一般的AI智能体很快就会出现吗?用户只需要提问,这些一般的AI智能体就可以通过计算机和互联网实现目标。


随著时间的推移,谜底迟早会揭晓。


由于AI智能体能将在现实世界中发挥真正的作用,一旦通用智能系统能够可靠、安全地运行,就会带来巨大的变化。


「小进步」不断

智能和超级智能是实现革命性AI的核心要素,但许多其他领域也在快速发展。包括AI记忆能力(前后窗口)的提高,以及赋予其视觉和语音能力的多模态技术。


回顾过去的发展历程,我们可以清楚地看到这一进步。


举例来说,在ChatGPT发布之前,Ethan 一直使用Mollick。「用wifi乘飞机的水獭」该提示用于检测图像和视频模型。


2023年10月,这个提示只能生成令人毛骨悚然的怪物形象。仅仅18个月后,这个提示就可以通过多个图像创作工具完美控制。


最新的谷歌Veo是根据教授的测试。 2只需不到15分钟就可以完成30秒的视频生成。(当然,等待视频渲染需要一些时间)


可以看到,画面中的阴影和光线质量,以及水獭打开笔记本电脑这一细节的处理,都是精彩的。


随后,教授再次提高了难度,将水獭的精彩故事改编成了80年代风格的科幻动画,让水獭在太空中遨游。此外,Suno还使用了复古风格的主题歌曲。


类似地,创作过程几乎不需要人工控制。


「洪水」即将到来,未雨绸缪


纵观这些发展,我们应该如何预测每个AI实验室的智能浪潮即将到来?


现在我们已经看到AI足以改变很多脑力劳动的能力:o3基准测试突破了之前的堡垒;AI智能体可以在特定领域进行复杂的研究;多模态系统可以创造越来越微妙的内容。


而且这只是一个开始,更强大的系统和通用的AI智能体即将出现。


面对这些预测,令人担忧的不是时间表是否准确,而是我们甚至没有做好充分的准备来应对当前的AI能力,更不用说实现预测的概率了。


当AI研究人员致力于对齐问题时,很少有人试图描述和讨论AI深度渗透的世界会是什么样子——这不仅仅是一个技术问题,更是如何选择和部署AI。


人生未来研究所,基础问题研究所,Metaculus的创始人,Anthony Aguirre曾经写道:


科技公司之所以建立价值万亿美元的AI基础设施,并不是因为他们期望你每月支付20美元,并使用AI工具来提高生产力。但是因为他们知道,如果可能的话,你的老板愿意花几百甚至几千美元用AI代替你。



就像Marc的开场 Bernioff「证词」:由于AI带来了显著的生产力提高,Salesforce不会在2025年招聘软件工程师。



在这波浪潮中,农民工的命运可能会发生变化,公司估计要转型...这可能与每个人息息相关。


即将到来的智能浪潮本身并没有什么善恶之分,关键在于我们如何提前计划,如何适应变化。


首先,我们选择如何控制它:这将决定这是促进进步的动力,还是动荡的根源。


此时此刻就是进行这些讨论的最佳时机,等到浪潮汹涌而至,为时已晚!


参考资料:


https://www.businessinsider.com/mark-zuckerberg-meta-ai-replace-engineers-coders-joe-rogan-podcast-2025-1


https://www.oneusefulthing.org/p/prophecies-of-the-flood


https://controlai.news/p/the-unknown-future-predicting-ai


本文来自微信微信官方账号“新智元”,作者:新智元,编辑:好困。 KingHZ,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com