GPT-5问世引多方反应,马斯克直言不服

08-13 06:15

人工智能巨头OpenAI最近终于推出了备受瞩目的新一代旗舰模型GPT-5。



在发布会上,CEO山姆·奥特曼用形象的比喻形容其跃升:“GPT - 3像高中生,偶尔有灵感但缺乏稳定;GPT - 4像大学生,兼具智能与实用;而GPT - 5,则像是与一位博士级专家对话。”他还自嘲“在GPT - 5面前一无是处”,这极大地勾起了全球用户的好奇心。这场历经两年半等待的升级,可谓“千呼万唤始出来”。



实际上,GPT - 5的诞生颇为不易。背后经历了长达一年的艰难研发,核心团队还遭遇高薪挖角,算力开销更是惊人。OpenAI一路走来既焦虑又艰辛,如今终于将这个“统一系统”推出,大家都期待它能带来新惊喜。



总体而言,GPT - 5最大的变化是从“聊天机器人”进化成了真正能干活的“全能助理”。


首先,多模态功能强大,让新助理的“脑子”更灵活。过去与它交流,说话和发图需分开,现在“听说读写看”一体化,它能迅速理解各种信息。更重要的是,它学会了“动手”,能直接连接其他软件,帮助操作Office、在开发工具里写代码,甚至处理工作流程。



为使这个助理更具个性,OpenAI预设了不同“人格”,用户可随时切换成毒舌、严谨或善解人意的模式。



自从DeepSeek开创“Think模式”后,让大模型在回答前先“想一想”成了行业标配。但GPT - 5有所不同,用户只需在提问时加上“认真思考”,系统就会自动切换到更擅长深度分析的gpt - 5 - thinking模式,用更强的能力解决问题。



GPT传统的“屠榜”环节也不例外。OpenAI公布了25个榜单,图表显示GPT - 5在各维度表现出色。事实性幻觉大幅减少,比GPT - 4o少了44%,比o3少了78%,基本不再“胡说八道”。在数学竞赛、现实世界编程能力、人类知识测试、多模态能力等方面均创新高。





发布会结束后,全球网红和博主立刻对GPT - 5进行各种“极限施压”测试。拥有50万粉丝的油管主Matthew Berman用25分钟视频展示了近30个高难度任务。比如,让GPT - 5写程序瞬间生成、打乱并复原复杂的20阶魔方;在网页里复刻出可用的Word和Excel完整应用。从“生命游戏”3D版到可调节重力、空气阻力的流体动力学模拟器,GPT - 5展现出“博士生水平”。







然而,开发者狂欢的同时,另一边情况却不同。资本市场率先“用脚投票”,发布当天概念股普遍回调,显然未被这个“博士生”完全打动。毕竟大家等了两年半,期待的是一场革命性升级,结果只是常规升级,失望在所难免。而且如今AI竞赛激烈,各路技术差距缩小,OpenAI想靠常规操作拉开差距已很困难。




OpenAI的老冤家马斯克率先唱反调,直接拿出成绩单表示GPT - 5不如他家的Grok 4。



普通网友的吐槽声也增多。大家感觉GPT - 5“智商”提高了,但“情商”下降。很多人反映用它写文案、话术,文字生硬、机械,缺乏灵动和自然。有网友调侃:“情绪和逻辑就像跷跷板,你把逻辑这头死死按住,情感那头可不就弹飞了吗?”不过,有网友发现设置里可切换回过去的模型。




这种情况让很多人觉得AI似乎进入了瓶颈期。争议最大的是官方宣传的编程能力,很多人觉得不如Claude好用。不过也有网友反馈,开发粤语学习应用时,Claude和Gemini在生成UI和精准修改代码时出现问题,只有GPT - 5顺利完成任务且效果很好。




总体来说,GPT - 5像个严重偏科的天才,文科表现不佳,写不出有温度的文字;但理科,尤其是在严密逻辑和复杂工程能力领域,表现出色。正如网友所说:只是没有预期那么好……但仍旧是当前最能打的大模型。


本文来自微信公众号“科技狐”(ID:kejihutv),作者:老狐,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com