OpenAI的新挑战:九大商品复杂,难以管理,顾客眼花缭乱

2024-10-01

据Supervised今天报道,虽然OpenAI的最新模式o1在性能上有了显著提高,但它也给企业带来了一个新的潜在挑战:产品组合复杂。


OpenAI最新产品o1和o1-mini,事实上,用户和客户可以在性能和支出之间进行权衡:他们也可以选择等待更长的时间,暂时支付更多的费用,但是输出结果应该会好很多。并非那种可以插入呼叫中心的应用程序接口。(API),但它确实为这个覆盖了一系列目标市场的企业填补了一个新的目标市场(除了没有“几乎无所不能的商品”)。


O1的使用场景基本上是一个“你需要稍微思考一下”的问题。Box美国云服务管理平台 亚伦·列维CEO(Aaron Levie)给出了一个优秀的公司应用领域,即需要在合同中找到一个非常具体的参数值——例如,合同的最终签署日期,即合同的实际生效日期。这是一个真正的“需要稍微思考一下”的问题,在一个简单的问题上增加了一层复杂性,人们可能会在不同的日子签订合同。


对OpenAI而言,这也是一个比较新的使用场景。在过去,OpenAI可能需要调用一系列长API,并要求模型提醒调整或检索增强生成。(RAG)完成所需任务的方法。反之,整个过程可能会被压缩成一两次调用,从而简化某些结构。OpenAI已经经历了一个“SaaS化”的过程,在这个过程中,OpenAI逐渐成熟,成为一家真正的公司。


由于OpenAI逐渐发展成为一家真正的公司,其产品组合(或模型组合)日益复杂,OpenAI面临着企业产品组合复杂的挑战。产品组合越大,管理就越困难。现阶段企业面临的最大挑战是如何避免复杂的产品组合,难以向用户传递价值。并且随着模型质量的不断提高,任何细微的分心都会导致OpenAI被其它前沿模型公司超越。


Supervised总结了OpenAI目前非常庞大的API组合,共有9种产品:


1、GPT-4o:一种多模式、昂贵的模式(虽然也没有幸免于降价的影响),应该是一种通用的好产品。


2、GPT-4o mini:GPT-GPT-3.5作为其主要模型,4o的削弱版本。 为了满足大量更简单的使用场景,Turbo的接班人。


上述模型的微调版本可以满足客户的具体需求。虽然它们是通过API提供的,但它们可能会让一些更注重安全的企业望而却步。


3、o1:以速度价格为代价换取质量模型,让它有更多的时间看答案进行“推理”。基本上就是一个需要“停下来想一想”的问题。


4、o1-mini:如同4o 就像mini一样,它是o1的弱化版本,用于设计...同样的“停下来想一想”问题,但我们可以假设它真的可以解决一系列问题。


5、Whisper:这是市场上最好的语音转文本模型,毫无疑问,它是为了生成OpenAI所需的训练数据而建立的。


6、文字嵌入:没有最好的嵌入式商品,但是它的优点一般是与其它OpenAI商品一起提供,从而减少了购买的麻烦。


7、文字转语音:假设延迟正常,您可以将其应用到类似呼叫中心的API中。这里有一般和高清两个版本的API。


8、高级语音助手:一种技术奇迹般的商品,它能让你在ChatGPT中主动交谈,尽管它的应用领域仍然不清楚。


9、ChatGPT:OpenAI将上述所有内容“实用化”,集成到一家前端公司的友好包装中。


在此期间,Meta开始表现出更多的混乱,几乎每个类别都发布了更新模型。然而,虽然它们存在于同一个“桶”中,但Meta的这些模型是开源的,并支持一系列非常不同的产品。本质上,OpenAI正试图再次创建一个新的类别,但它也面临着产品组合复杂的风险。


以下是OpenAI及其竞争对手的产品定价对比:



在o1发布一段时间后,这笔费用可能远远达不到。OpenAI已开始逐步增加速度限制,最近o1-preview从每周30个增加到50个,o1-mini从每周50个增加到每天50个。



虽然OpenAI的吸引力一直在于便利性、价格和性能之间的最佳平衡,但其复杂的产品组合无疑是一个挑战和机遇。本文作者马修·林利(Matthew Lynley)严重怀疑价格不会一直这么高,因为下一个GPT模型最终会准备好。但是到目前为止,它至少在试图筹集巨额资金时,开发商已经拥有了一些价格较高的商品作为谈判筹码。


但是,这里的挑战和任何一个成熟企业随着时间的推移开始面临的问题是一样的:商品复杂。虽然OpenAI以API和ChatGPT的方式在技术上拥有“两个”产品,但是这些产品都有很多支部,服务于非常广泛的使用场景。这类API也远远超出了聊天补充和文字生成的范围,涵盖了各种各样的模式。而且它的语音产品看起来像ChatGPT的“惊艳”部分,实际上可能是其产品组合中最尴尬的部分。


如果你还能称OpenAI为创业公司,那么商品复杂性在创业领域是一个公认的问题。随着创业公司的成熟,其用户和客户群的不断扩大,它必须有方向地发展,更少的商品满足更多客户的需求,而不是为每个人建立一切。或者更简单地说,做一些事情,但一定要做好。


为OpenAI提供如此广泛的使用场景,以便将用户引导到一定的稳定状态。在这种状态下,它可能赚不到钱,但至少不会亏本。在API方面,传统的做法是将客户推向其主要模型(尤其是微调版本),但对于ChatGPT来说,这一点并不清楚。


虽然新型号在ChatGPT中具有速度限制,但它也是OpenAI除API以外极其重要的业务部分。据The Information报道,OpenAI 布拉德·莱特卡普·布拉德·莱特(Brad Lightcap)通知员工,OpenAI有1000多万ChatGPT付费订阅用户,还有100万公司订阅用户。(彭博社此前曾报道,OpenAI有100万ChatGPT公司订阅用户。)


当然,我们可以做很多粗略的计算,但我们都会得到同样的看法:除了API,ChatGPT的公司业务将是OpenAI业务的重要组成部分。


但是ChatGPT带来的收入并不像API那样直接随着o1的应用而增加。不管是通过API还是ChatGPT内部运行o1,实际运行它的成本都会随着预训练计算资源的转变而改变。


幸好OpenAI在这个领域取得了很大的进步。目前业内人士额外关注的一种方法是蒙特卡洛树搜索(Monte Carlo Tree Search),这样可以减少生成高质量结果所需的计算量。蒸馏(distillation)随着人们的兴趣转向管理高性能模型的推理成本,蒸馏法也得到了极大的发展,这是另一种“缩小”大模型的方法。(蒸馏是一种压缩机器学习模型的方法,用来将大型模型的知识转移到较小的模型中。)


“这是甜点,将传统的预测机器学习策略与现代技术相结合。”斯里·安巴蒂,模型开发商和平台h2o的联合创始人。(Sri Ambati)告诉马修,“树形搜索是一种绝对的天才技能,它是一个很容易实现的目标,与大语言模型的卓越相结合。”


诺姆·布朗是与专家和知情人士交谈时经常提到的另一点。(Noam Brown)在OpenAI工作。布朗一般被认为是博弈论领域的顶尖专家,许多人关心他的工作将如何应用到OpenAI的产品中。布朗也是一篇论文的共同作者,讨论了蒙特卡洛树搜索在R&D代理中的应用。


结论:OpenAI面临成本挑战,降价保证竞争力


OpenAI的API面临的问题是,根据最近与大多数企业和平台的情况,成本是构建情景AI应用的第一或第二个重要参考标准。然而,OpenAI已经表现出逐渐降低价格以保持竞争力的想法。


另外,ChatGPT的公司业务似乎是OpenAI业务的主要动力,这也说明了问题,因为这些开发基本上都是为公司的套件服务的。对于一些对运营和成本要求较高的公司来说,利用现成的廉价商品在公司内部开发定制产品越来越有吸引力。


有一种愤世嫉俗的观点认为,OpenAI试图说:“嘿,看,我们还在创造非常先进的东西,所以不要忽视我们的融资号召。”


然而,这一观点的另一面是,根据CNBC的报道,OpenAI似乎已经获得了一轮超额认购的巨额融资,并成长为一家更适合企业产品的企业。现在,OpenAI只需要保证它不能在销售电话中用巨大的产品组合来欺骗公司。


本文来自微信微信官方账号的“智东西”(ID:zhidxcom),作家:吴浪娜,编辑:漠影,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com