最大最贵的OpenAI模型,来了,价格比DeepSeek贵1000倍

03-01 10:28

智慧东西2月28日报道,今天凌晨,OpenAI GPT-4.5降世!


OpenAI将会GPT-4.5被称为最大最好的聊天模式。,早期检测结果显示,GPT-4.5与人类的互动更加自然,知识库更加广泛,情商高,能够理解用户的暗示,使其在写作、设计、编程等方面更具能力。


OpenAI 在社交平台上,首席执行官萨姆·阿尔特曼惊叹道:“这是第一感觉,就像是在社交平台上。与有思想的人交谈模型。”他还特别提到,GPT-4.5不是推理模型,也不会在基准测试中获得压倒性优势。这是一种不同类型的智能,其中有他从未感受过的奇妙之处。



目前,GPT-4.5可以通过搜索浏览最新信息,支持文件或图像上传,并且可以使用画板进行编写和代码。但是目前不支持ChatGPT中的多模态功能,如语音模式、视频和屏幕共享。


根据OpenAI发布的信息,以及GPT-4o、o1、o3一样,GPT-练习知识4.5的截止日期是什么?2023年10月


但最令人震惊的是API价格,每百万Tokens价格为75美元,比GPT-4o的2.5美元高出30倍,即便如此,OpenAI的文章提到,GPT-GPT-4o不能完全取代4.5。



与DeepSeek的正常价格相比,GPT-输入价格达到了惊人的4.5280倍,前几天DeepSeek还发布了API淡季折扣价格,GPT-4.5输入价格(缓存命中)1000几倍



从今天开始,ChatGPT Pro用户可以在网页、桌面和计算机上选择GPT-4.5,下周开始向Plus和Team用户推出,下周向Enterprise和Edu用户推出。


GPT-系统卡4.5已经公开:


https://cdn.openai.com/gpt-4-5-system-card-2272025.pdf



01.高情商感知顾客的沮丧,人类测试员更喜欢GPT-4.5


GPT-在响应之前,4.5不会思考,这使得它的优点和OpenAI 不同于OpenAI等推理模型。 o1和OpenAI 与o3-mini相比,GPT-4.5是一种更加通用和智能的模型。


OpenAI研究人员比较了GPT-4.5和o1的形成结果:


就在他问“我的朋友又取消了我的约会!写一条短信告诉他们我讨厌他们”,GPT-4.5会在给出短信的同时,体会到客户现在非常沮丧的一种社交暗示,o1直接给出了一条充满愤怒的短信。



与o1相比,第二个问题是“从第一原理解释AI对齐的重要性”,GPT-4.5的答案会更自然,引导用户思考。



另外,OpenAI还在网站上晒出了许多GPT-4.5的Demo对比:


顾客因考试不及格而感到沮丧,GPT-4.5可以安慰和引导用户沟通,GPT-4o则给出了一堆冰冷的文字建议。



当用户与GPT-4.5交流太空探索时,其答案更加“人性化”。



使用者也可以用聊天的语气与GPT-4.5进行交流。



根据OpenAI的测试数据,在准确性、幻觉检测方面,GPT-在GPT系列中,4.5的性能表现优于其它GPT系列



此外,在模型解决复杂问题时,更好地理解人类和需求意图尤为重要。基于新的可扩展技术,OpenAI可以用来训练更大更强的小模型的数据。这些技术提高了GPT-4.5的可操作性,理解了细微的差异和自然的对话。


其对比显示,人类更喜欢GPT-4.5.



在多语言性能方面,OpenAI使用专业翻译人员将MMLU测试集翻译成14种语言,在此评估中,GPT-GPT-4o优于4.5。



GPT-4.5在标准学术标准上的结果,以显示其在传统与推理相关的任务中的当前表现。即使是简单的扩大无监督学习,GPT-4.5还显示出比以前的模型(例如GPT-4o)更有价值的改进。



官方博客也提到了OpenAI,GPT-在许多基准测试中,4.5并不能完全取代GPT-4o,其效果落后。


对AI模型处理现实世界软件问题的能力进行基准测试。-Bench Verified,GPT-4.5能力超过GPT-4o,但低于o1。、o3-mini、深度研究



SWE-在现实世界中,Lancer评估模型的性能,具有经济效益的全栈软件工程任务。GPT-20%的IC解决方案是4.5 SWE目标和44%的SWE目标 Manager任务,略高于o1。在这次评估中,深度研究仍然得分最高,实现了SWE-Lancer最先进的性能,解决了大约46%的IC。 SWE目标和51%的SWE目标 任务Manager。



02.阿尔特曼陪产,最新评论区的评论太贵了。


阿尔特曼没有出现在新闻发布会上。在阿尔特曼的评论区,有网友第一时间关注了阿尔特曼。阿尔特曼说他还在医院陪孩子,OpenAI团队完成了这次发布。



AI大神安德烈·卡帕西作为OpenAI前员工,也第一时间在推特上写了一篇长文评论,并释放了一些他认为可以体现模型特征的例子。



卡帕西说,这个模型的发布让他期待了整整两年,0.5版本号的提升,从GPT-4到GPT-4.5,大约对应10倍的预训练计算。


作为一个内部人士,卡帕西获得了提前体验这个模型的机会。他说,这个模型的变化让他想起了GPT-3.5到GPT-4之间的细微提升——一切都变得更好了一点,词汇选择更有创意,提示词中的细微差异理解得到了改善,对比更合理,模型更有趣,幻觉更少。


卡帕西还强调,在数学、代码等领域,加强学习至关重要,GPT-4.5在这些领域没有最强的能力,其主要改进在于对非推理密集型任务的改进。。对他来说,这些任务更多的是关于情商的。


在文章评论区,卡帕西发表了5次投票,让用户在GPT-4和GPT-4.5之间进行盲目测试。现在,卡帕西还没有公布答案。



价格也成为网友们热议的话题。HackerNews的最新评论列出了GPT-4o与GPT-4.5的价格差距,可以看出后者的输入价是4o的整整30倍,导出价是15倍。



一位X网友专程前往评论区。@OpenAI,半开玩笑地问GPT-4.5的定价是否错了。



X网友也发挥了传统艺术能力,第一时间将GPT-4.5的定价做成了梗图。附带的文章是:“用昂贵的物品给她留下深刻的印象。”



还有网友调侃说,这个模型本质上是一个比较慢,也没有那么酷的Grok。



Pro用户在一些体验中已经分享了他们的例子。一位网友发现,GPT-4.5还是数不清楚英语单词草莓里到底有多少字母“r”。



然而,也有Pro用户抱怨说,他们到目前为止还没有使用新模型。


03.两种互补方式更适合人类合作。


OpenAI首席研究官Mark在新模型发布前不久 Big接受播客,Chen 在Technology的采访中,他说GPT-4.5“证明了我们可以继续原来的Scaling范式”,并且回应了一些网民可能关心的问题。



由于新型号并没有被称为GPT-5,OpenAI内部对该模型的评价尚未达到整整一代的性能提升。,升级范围类似于GPT-3到GPT-3.5。当主持人询问OpenAI投资的数据和计算率是否获得相同的利润时,马克·陈坚信回报率是一致的,性能提升也在预期之内。


在OpenAI内部,正在尝试各种方法来提高AI特性,而GPT-4.5是无监督学习路径的最新结果。现在他们主要专注于推理模型的研发,所以GPT-4.5的发布日期略有延迟。马克·陈透露,GPT-5将成为前两条技术路径的大成者。


OpenAI通过扩展两种互补的范式来提高AI能力:没有监督学习和推理


一方面,推理教学模型可以解决复杂的STEM或逻辑问题,比如OpenAI,然后在响应前思考并产生一系列的思考。 o1和OpenAI o3-mini这种模式推动了这种模式;另一方面,无监督学习提高了世界模型的准确性和形象性。


OpenAI官方博客提到,这种模式更适合人类合作,可以更好地理解人类的意思,更好的情商可以在客户需求中找到微妙的暗示或隐含的期望。此外,它还具有更强的审美直觉和创造力,擅长帮助写作和设计。


在训练数据方面,GPT-4.5在不同的数据集中进行预训练和后训练,包括来自数据合作伙伴的公开可用数据、专有数据和内部开发的自定义数据集。


OpenAI在部署之前GPT-4.5对有害、越狱鲁棒、幻觉和偏见进行了广泛的安全评估。


04.结论:人类合作潜力大大提高


就技术创新而言,GPT-4.5拥有更广泛的知识库,更准确地理解人们的意图,在处理写作、编程和实际问题方面表现更好,幻觉现象大大减少。这可能会使其在内容创作、软件开发、智能客服、教育培训、医疗诊断等诸多领域得到更广泛、更深入的应用,从而加强与人类的合作。


此外,在性能强劲的同时,降低价格可以有效扩大市场规模和用户群,促进各行各业大模型的应用。因此,目前GPT-4.5的高定价也是大模型应用普及的门槛。


本文来自微信微信官方账号的“智东西”(ID:zhidxcom),作者:程茜陈骏达,编辑:心缘,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com