GPT-5问世引多方反应，马斯克直言不服

2025-08-13

人工智能巨头OpenAI最近终于推出了备受瞩目的新一代旗舰模型GPT-5。

在发布会上，CEO山姆·奥特曼用形象的比喻形容其跃升：“GPT - 3像高中生，偶尔有灵感但缺乏稳定；GPT - 4像大学生，兼具智能与实用；而GPT - 5，则像是与一位博士级专家对话。”他还自嘲“在GPT - 5面前一无是处”，这极大地勾起了全球用户的好奇心。这场历经两年半等待的升级，可谓“千呼万唤始出来”。

实际上，GPT - 5的诞生颇为不易。背后经历了长达一年的艰难研发，核心团队还遭遇高薪挖角，算力开销更是惊人。OpenAI一路走来既焦虑又艰辛，如今终于将这个“统一系统”推出，大家都期待它能带来新惊喜。

总体而言，GPT - 5最大的变化是从“聊天机器人”进化成了真正能干活的“全能助理”。

首先，多模态功能强大，让新助理的“脑子”更灵活。过去与它交流，说话和发图需分开，现在“听说读写看”一体化，它能迅速理解各种信息。更重要的是，它学会了“动手”，能直接连接其他软件，帮助操作Office、在开发工具里写代码，甚至处理工作流程。

为使这个助理更具个性，OpenAI预设了不同“人格”，用户可随时切换成毒舌、严谨或善解人意的模式。

自从DeepSeek开创“Think模式”后，让大模型在回答前先“想一想”成了行业标配。但GPT - 5有所不同，用户只需在提问时加上“认真思考”，系统就会自动切换到更擅长深度分析的gpt - 5 - thinking模式，用更强的能力解决问题。

GPT传统的“屠榜”环节也不例外。OpenAI公布了25个榜单，图表显示GPT - 5在各维度表现出色。事实性幻觉大幅减少，比GPT - 4o少了44%，比o3少了78%，基本不再“胡说八道”。在数学竞赛、现实世界编程能力、人类知识测试、多模态能力等方面均创新高。

发布会结束后，全球网红和博主立刻对GPT - 5进行各种“极限施压”测试。拥有50万粉丝的油管主Matthew Berman用25分钟视频展示了近30个高难度任务。比如，让GPT - 5写程序瞬间生成、打乱并复原复杂的20阶魔方；在网页里复刻出可用的Word和Excel完整应用。从“生命游戏”3D版到可调节重力、空气阻力的流体动力学模拟器，GPT - 5展现出“博士生水平”。

然而，开发者狂欢的同时，另一边情况却不同。资本市场率先“用脚投票”，发布当天概念股普遍回调，显然未被这个“博士生”完全打动。毕竟大家等了两年半，期待的是一场革命性升级，结果只是常规升级，失望在所难免。而且如今AI竞赛激烈，各路技术差距缩小，OpenAI想靠常规操作拉开差距已很困难。

OpenAI的老冤家马斯克率先唱反调，直接拿出成绩单表示GPT - 5不如他家的Grok 4。

普通网友的吐槽声也增多。大家感觉GPT - 5“智商”提高了，但“情商”下降。很多人反映用它写文案、话术，文字生硬、机械，缺乏灵动和自然。有网友调侃：“情绪和逻辑就像跷跷板，你把逻辑这头死死按住，情感那头可不就弹飞了吗？”不过，有网友发现设置里可切换回过去的模型。

这种情况让很多人觉得AI似乎进入了瓶颈期。争议最大的是官方宣传的编程能力，很多人觉得不如Claude好用。不过也有网友反馈，开发粤语学习应用时，Claude和Gemini在生成UI和精准修改代码时出现问题，只有GPT - 5顺利完成任务且效果很好。

总体来说，GPT - 5像个严重偏科的天才，文科表现不佳，写不出有温度的文字；但理科，尤其是在严密逻辑和复杂工程能力领域，表现出色。正如网友所说：只是没有预期那么好……但仍旧是当前最能打的大模型。

本文来自微信公众号“科技狐”（ID：kejihutv），作者：老狐，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

25周年纪念版《大梦敦煌》闪耀黄河之滨，再续千年传奇

超高“研”值！揭秘上岸秘诀

10天建成70米“安心墙”，“三无小区”急难愁盼问题解决

应急科普：新版《家用防灾应急包》国家标准重磅发布，家庭必备！

新奇！呼和浩特的专属“A-u-t-u-m-n”浪漫来袭