最大最贵的OpenAI模型，来了，价格比DeepSeek贵1000倍

2025-03-01

智慧东西2月28日报道，今天凌晨，OpenAI GPT-4.5降世！

OpenAI将会GPT-4.5被称为最大最好的聊天模式。，早期检测结果显示，GPT-4.5与人类的互动更加自然，知识库更加广泛，情商高，能够理解用户的暗示，使其在写作、设计、编程等方面更具能力。

OpenAI 在社交平台上，首席执行官萨姆·阿尔特曼惊叹道:“这是第一感觉，就像是在社交平台上。与有思想的人交谈模型。”他还特别提到，GPT-4.5不是推理模型，也不会在基准测试中获得压倒性优势。这是一种不同类型的智能，其中有他从未感受过的奇妙之处。

目前，GPT-4.5可以通过搜索浏览最新信息，支持文件或图像上传，并且可以使用画板进行编写和代码。但是目前不支持ChatGPT中的多模态功能，如语音模式、视频和屏幕共享。

根据OpenAI发布的信息，以及GPT-4o、o1、o3一样，GPT-练习知识4.5的截止日期是什么？2023年10月。

但最令人震惊的是API价格，每百万Tokens价格为75美元，比GPT-4o的2.5美元高出30倍，即便如此，OpenAI的文章提到，GPT-GPT-4o不能完全取代4.5。

与DeepSeek的正常价格相比，GPT-输入价格达到了惊人的4.5280倍，前几天DeepSeek还发布了API淡季折扣价格，GPT-4.5输入价格(缓存命中)1000几倍。

从今天开始，ChatGPT Pro用户可以在网页、桌面和计算机上选择GPT-4.5，下周开始向Plus和Team用户推出，下周向Enterprise和Edu用户推出。

GPT-系统卡4.5已经公开：

https://cdn.openai.com/gpt-4-5-system-card-2272025.pdf

01.高情商感知顾客的沮丧，人类测试员更喜欢GPT-4.5

GPT-在响应之前，4.5不会思考，这使得它的优点和OpenAI 不同于OpenAI等推理模型。 o1和OpenAI 与o3-mini相比，GPT-4.5是一种更加通用和智能的模型。

OpenAI研究人员比较了GPT-4.5和o1的形成结果：

就在他问“我的朋友又取消了我的约会！写一条短信告诉他们我讨厌他们”，GPT-4.5会在给出短信的同时，体会到客户现在非常沮丧的一种社交暗示，o1直接给出了一条充满愤怒的短信。

与o1相比，第二个问题是“从第一原理解释AI对齐的重要性”，GPT-4.5的答案会更自然，引导用户思考。

另外，OpenAI还在网站上晒出了许多GPT-4.5的Demo对比：

顾客因考试不及格而感到沮丧，GPT-4.5可以安慰和引导用户沟通，GPT-4o则给出了一堆冰冷的文字建议。

当用户与GPT-4.5交流太空探索时，其答案更加“人性化”。

使用者也可以用聊天的语气与GPT-4.5进行交流。

根据OpenAI的测试数据，在准确性、幻觉检测方面，GPT-在GPT系列中，4.5的性能表现优于其它GPT系列。

此外，在模型解决复杂问题时，更好地理解人类和需求意图尤为重要。基于新的可扩展技术，OpenAI可以用来训练更大更强的小模型的数据。这些技术提高了GPT-4.5的可操作性，理解了细微的差异和自然的对话。

其对比显示，人类更喜欢GPT-4.5.。

在多语言性能方面，OpenAI使用专业翻译人员将MMLU测试集翻译成14种语言，在此评估中，GPT-GPT-4o优于4.5。

GPT-4.5在标准学术标准上的结果，以显示其在传统与推理相关的任务中的当前表现。即使是简单的扩大无监督学习，GPT-4.5还显示出比以前的模型(例如GPT-4o)更有价值的改进。

官方博客也提到了OpenAI，GPT-在许多基准测试中，4.5并不能完全取代GPT-4o，其效果落后。

对AI模型处理现实世界软件问题的能力进行基准测试。-Bench Verified，GPT-4.5能力超过GPT-4o，但低于o1。、o3-mini、深度研究。

SWE-在现实世界中，Lancer评估模型的性能，具有经济效益的全栈软件工程任务。GPT-20%的IC解决方案是4.5 SWE目标和44%的SWE目标 Manager任务，略高于o1。在这次评估中，深度研究仍然得分最高，实现了SWE-Lancer最先进的性能，解决了大约46%的IC。 SWE目标和51%的SWE目标任务Manager。

02.阿尔特曼陪产，最新评论区的评论太贵了。

阿尔特曼没有出现在新闻发布会上。在阿尔特曼的评论区，有网友第一时间关注了阿尔特曼。阿尔特曼说他还在医院陪孩子，OpenAI团队完成了这次发布。

AI大神安德烈·卡帕西作为OpenAI前员工，也第一时间在推特上写了一篇长文评论，并释放了一些他认为可以体现模型特征的例子。

卡帕西说，这个模型的发布让他期待了整整两年，0.5版本号的提升，从GPT-4到GPT-4.5，大约对应10倍的预训练计算。。

作为一个内部人士，卡帕西获得了提前体验这个模型的机会。他说，这个模型的变化让他想起了GPT-3.5到GPT-4之间的细微提升——一切都变得更好了一点，词汇选择更有创意，提示词中的细微差异理解得到了改善，对比更合理，模型更有趣，幻觉更少。

卡帕西还强调，在数学、代码等领域，加强学习至关重要，GPT-4.5在这些领域没有最强的能力，其主要改进在于对非推理密集型任务的改进。。对他来说，这些任务更多的是关于情商的。

在文章评论区，卡帕西发表了5次投票，让用户在GPT-4和GPT-4.5之间进行盲目测试。现在，卡帕西还没有公布答案。

价格也成为网友们热议的话题。HackerNews的最新评论列出了GPT-4o与GPT-4.5的价格差距，可以看出后者的输入价是4o的整整30倍，导出价是15倍。

一位X网友专程前往评论区。@OpenAI，半开玩笑地问GPT-4.5的定价是否错了。

X网友也发挥了传统艺术能力，第一时间将GPT-4.5的定价做成了梗图。附带的文章是:“用昂贵的物品给她留下深刻的印象。”

还有网友调侃说，这个模型本质上是一个比较慢，也没有那么酷的Grok。

Pro用户在一些体验中已经分享了他们的例子。一位网友发现，GPT-4.5还是数不清楚英语单词草莓里到底有多少字母“r”。

然而，也有Pro用户抱怨说，他们到目前为止还没有使用新模型。

03.两种互补方式更适合人类合作。

OpenAI首席研究官Mark在新模型发布前不久 Big接受播客，Chen 在Technology的采访中，他说GPT-4.5“证明了我们可以继续原来的Scaling范式”，并且回应了一些网民可能关心的问题。

由于新型号并没有被称为GPT-5，OpenAI内部对该模型的评价尚未达到整整一代的性能提升。，升级范围类似于GPT-3到GPT-3.5。当主持人询问OpenAI投资的数据和计算率是否获得相同的利润时，马克·陈坚信回报率是一致的，性能提升也在预期之内。

在OpenAI内部，正在尝试各种方法来提高AI特性，而GPT-4.5是无监督学习路径的最新结果。现在他们主要专注于推理模型的研发，所以GPT-4.5的发布日期略有延迟。马克·陈透露，GPT-5将成为前两条技术路径的大成者。

OpenAI通过扩展两种互补的范式来提高AI能力：没有监督学习和推理。

一方面，推理教学模型可以解决复杂的STEM或逻辑问题，比如OpenAI，然后在响应前思考并产生一系列的思考。 o1和OpenAI o3-mini这种模式推动了这种模式；另一方面，无监督学习提高了世界模型的准确性和形象性。

OpenAI官方博客提到，这种模式更适合人类合作，可以更好地理解人类的意思，更好的情商可以在客户需求中找到微妙的暗示或隐含的期望。此外，它还具有更强的审美直觉和创造力，擅长帮助写作和设计。

在训练数据方面，GPT-4.5在不同的数据集中进行预训练和后训练，包括来自数据合作伙伴的公开可用数据、专有数据和内部开发的自定义数据集。

OpenAI在部署之前GPT-4.5对有害、越狱鲁棒、幻觉和偏见进行了广泛的安全评估。

04.结论：人类合作潜力大大提高

就技术创新而言，GPT-4.5拥有更广泛的知识库，更准确地理解人们的意图，在处理写作、编程和实际问题方面表现更好，幻觉现象大大减少。这可能会使其在内容创作、软件开发、智能客服、教育培训、医疗诊断等诸多领域得到更广泛、更深入的应用，从而加强与人类的合作。

此外，在性能强劲的同时，降低价格可以有效扩大市场规模和用户群，促进各行各业大模型的应用。因此，目前GPT-4.5的高定价也是大模型应用普及的门槛。

本文来自微信微信官方账号的“智东西”（ID：zhidxcom），作者：程茜陈骏达，编辑：心缘，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

雷军的高端战略，步步为营。

30%的博乐水杨酸单品被爆“三无”？

美股跌破CTA生死线，大摩急呼：机构散户大逃倒计时

AR手游没有未来，知名游戏开发商萌生退意。

海底捞又开了一张副牌，我们去现场看了看。