大型模型不需要眼前的共识。
没有共识是个好消息,至少说明在这个市场上,并不是每个人都局限于眼前的利益,也有人在沿着另一条逻辑路线前进,在不确定性中找到更多的可能性,打持久战。
确定性的机会通常指向需求场景,需要实干家,不断优化体验;不确定的机会通常依赖于技术创新,探索者需要探索一条应用之路。这就是为什么人们不会对雷军结局造车的决心感到惊讶,但很难完全相信杨植麟在月亮暗面创业过程中的技术理想主义。
在模型领域,没有新能源汽车这样的市场共识。企业在确定性和不确定性之间进行衡量,是造成行业矛盾的主要原因。选择确定性还是拥抱不确定性,决定了公司是优先赚钱还是优先做好技术;是坚持做闭源大模型,还是赌开源大模型,肯定会追上来;是要依靠通用模型在点爆行业推出超级应用,还是要通过小模型先占领目标市场?
在目前的环境下,企业和投资者会从更现实的角度来考虑,生存和赚钱比不确定的理想愿景更有说服力。然而,人们对大模型的期望是给行业带来更彻底的变化。从长远来看,很多企业的大模型应用还在对原有工具进行小修小补,很难产生点爆技术的应用,也很难抵挡未来大模型技术迭代带来的洗牌。
泛滥的「智能体」这是最明显的例子。国内大模型的落地催生了各种以智能体名称命名的聊天机器人和各种聊天机器人。「XX助手」。百度文心一言以蔽之,充满了像伏地魔、花朵-叔叔这样的模拟对话机器人;kimi 还有一些个人助理,比如文书笔杆、I人嘴替换等;Tiktok中字节豆包的推广也依赖于批准作业、练习英语口语等简单功能点来吸引用户。
很难想象这样的聊天机器人能有多强大。如果我们对大模型的期望只停留在追求确定性的阶段——利用它来提高智能客服的对话体验,提高数据收集和整理的效率,扩展一些图像或生成一些代码,这样的大模型可能会带来远远低于我们目前的预期。
大型杀手级应用的出现必须是为了摆脱当前某种感觉的生命。现在,没有共识是个好消息,至少说明在这个市场上,并不是每个人都局限于眼前的利益,也有人在沿着另一条逻辑路线前进,在不确定性中找到更多的可能性,打持久战。
两种大型模型逻辑
中局与终局是目前大模型领域比较具有代表性的两个发展逻辑。
中局的思路以朱啸虎(金沙江风险投资主管合伙人)为代表,包括一些专注于网络层的企业家,致力于利用开源大模型快速构建服务于细分需求的小模型,然后通过数据积累和模型迭代建立竞争门槛;最终的思路以月亮的暗面为代表,倾向于继续投资大模型能力的提升,等待技术迭代点的超级应用。
在中局的逻辑中,将大模型的认知和管理能力融入到现有场景中,使这些场景能够应用大模型的形成能力,提高解决方案的性能,从而形成新的商业概率。这一逻辑之所以受到青睐,是因为它具有一定的需求,能够快速看到结果,客户更愿意付费。
在朱啸虎的介绍中,一家使用开源大模型进行AI视频采访的公司,2023年的收入比2022年翻了一番;使用开源大模型制作AIGC广告短片的企业,2023年的收入超过5000万元,比2022年增长了四到五倍。
朱啸虎追求的机会是利用LLaMA这种快速升级的大型开源模型,结合垂直场景的数据积累和人工微调,在几个月内提高某个垂直场景的效率,在模型开发中先赚到第一桶金。
对于大模型的发展,朱啸虎持悲观预期,对应用场景的发展持乐观态度,主张从实际出发,先赚能赚的钱。
月亮暗面的创始人杨植麟的想法更具技术理想主义。他相信大模型会逐渐完成对世界的建模,杀手级应用自然会在这个过程中出现。
在杨植麟的最终逻辑下,大模型是一个解释世界的工具,就像人们可以用语言来描述世界和理解世界一样。大模型用数学作为语言建模,让AI也能理解世界,描述世界。AI依靠这种学习能力,逐渐像人一样使用工具,使AGI成为帮助人们链接和管理细分场景的工具「助手」。
AI可以使用工具,这意味着许多场景的运行模式将会发生巨大的变化。也许企业未来不需要有专门的视频面试工具,也不需要有独立的AI客服,而是整合到以大模型为主的企业级智能体中,依靠智能体打通和控制公司的差异阶段。
在即将被OpenAI点燃的AI搜索中,真正的难点不是搜索结果应该以网页列表的形式显示,而是应该如何利用AI的理解能力,将APP分解的信息再次链接成一个整体。在Kimi 其中,可以看到哪些值得购买,小红书的相关内容可以使用个人助理。「什么值得买」和「美好生活指南」去唤起它。

然而,随着杨植麟2个月套现4000万美元的消息,市场质疑了他的最终逻辑。月亮的阴暗面直接面向C端用户,客户获取成本高,收入前景低。在没有新的变化之前,月亮阴暗面商业化前景的不确定性被称为杨植麟缺乏信心和急于套现的原因。
聊天机器人不能发扬大模型
就目前而言,国内大型模型应用给品尝者的整体感觉还处于大而无当阶段。,提出问题后,很难得到满意的答案。一方面是由于大模型本身技术能力不足,另一方面是由于客户缺乏大模型应用的经验。
在许多大型应用程序推出之初,只有一个对话框,用户可以在对话框中提出任何问题并得到答案。然而,使用准确的Prompt来充分开发大型模型的现有能力已经成为大多数用户在短时间内无法逾越的门槛。
目前充斥着文心一言、豆包等大模型应用的智能体,很多都是为了降低大模型的使用门槛而包装的Prompt,即将部分用户的使用经验沉淀成可以共享的智能体,让用户根据自己的需求找到不同的智能体,获得更有针对性、更高效的答案。
在英语理解能力方面,Prompt门槛的出现本质上仍然是一个大模型。即使客户使用现成的Prompt获取有效信息,他们仍然不得不面对不成熟的感觉。Prompt或所谓的智能体可以解决第一次沟通的效率问题,但不能解决复杂对话的效果问题。大模型应用通常不止一轮对话。
这就是为什么智能机构仍然停留在客户服务和营销领域,而不是在其他生产和生活领域。由于客户服务和营销领域在模型应用之前已经完成了基本的智能对话体验,大模型的理解能力可以使互动更加灵活和自然。
从李彦宏(百度创始人)演讲中提到的案例可以看出,百度在公司智能体方面的实践是为大型无代码客服机器人提供一套生成工具。企业可以上传私域知识,自动形成对话材料,过滤不在自己业务范围内的内容,与第三方相关的工具。
客户服务机器人包装为智能体,将为百度的搜索生态服务。在百度APP上搜索用户「什么时候去新加坡至少是什么时候?」当时新加坡旅游局AI分身给出的答案会显示在前面,点击可以进行更多的对话。本质上,这种智能体是百度销售搜索营销、云服务等产品的新切入点,就像之前的百家号和小程序一样。
但是无论是to B的客户服务机器人,或者to C的各种Prompt都不是独一无二的,很难成为大模型的点爆应用。如今,展示在用户面前的智能体和大模型应用仍然只停留在优化工具的时期,只是为了让搜索更加智能。正如王小川(百川智能创始人兼首席执行官)所说,他专注于搜索如何使用大型模型,而不是如何学会如何使用大型模型进行搜索。
理想情况下,智能身体应该可以调用工具来完成更复杂的任务,而不仅仅是聊天。这里需要提到的是,无论Rabbit R1是否只是安卓App的套壳产品,但它似乎更接近智能体理想的状态——通过不断学习和理解人的复杂意图,模仿人的动作,结合大语言模型和所谓的大动作模型,创造性地升级APP体验。
我会同意杨植麟所说的,技术是这个时代唯一的新变量。不管是在to。 B还是to 在C场景中,当其他变量没有改变时,技术对知识的认知越来越准确,对人的意图和行为的理解也越来越准确,可以处理的任务也会越来越复杂,智能身体的能力也会越来越强。
Kimi的流行证明了大型应用具有被点燃的市场基础。Kimi于2023年10月上线,2024年2月日活浏览量在国内排名前三。3月份,Kimi的关注度持续上升,5次扩张,浏览量环比增长321.58%,前后文长度从最初的20多万字增加到200万字。
没有共识是一个很好的共识。
目前还没有解决的是,什么时候会出现一个超级应用程序,让大众客户保持高频使用。就大型模型应用现状而言,国内外仍处于工具升级阶段,只取决于大型模型的性能不同,效果也会有所不同。例如,AdobeAI的最新应用仍然侧重于AI图像编辑功能的创新和优化,文生图像功能的推出,以及视频内容的转换、增加和辅助镜头的生成。
面向未来,让大模型学会在不依赖人工微调的情况下使用工具,是技术发展的另一个节点。扎克伯格说,「对Llama-3来说,当我们正式进入更多类似于智能体的行为时,我认为其中一些将是更多的手工设计。对于Llama-4,我们的目标将是在模型中包含更多这样的东西。。」
最终能力的大幅提升,仍然依赖于大模型本身的进步。但是,大型模型的每一次进步,都需要花费相当大的资金。根据THE DECODER披露,GPT-一次训练的费用是6300万美元。但根据AI OpenAI的Index估算GPT-四是利用价值7800万美元的计算资源进行实践,谷歌的Geminini Ultra 会计费用高达1.91亿美元。
我国在模型方面没有达成共识的原因之一就是培训成本高。国内大型模式的融资额度低于海外。2月份,月亮的黑暗面获得了10亿美元的A轮投资,3月份Minimax获得了6亿美元的战略投资。与亚马逊向Anthropic增加的27.5亿美元投资相比,并不多。而且国内环境不利于大模型的进一步融资。
另一个原因是对大模型技术未来发展的多元化预期。一些大型开源模型的支持者会认为,大型开源模型和大型闭源模型的发展将受到大型技术发展坡度的影响。坡度越陡,闭源优势越大。一旦坡度变慢,开源就会迅速追上去。
等待开源大模型追逐的人预计,大模型技术发展的坡度将在短时间内放缓。这样,闭源大模型和开源大模型的差距就会相对缩小。提前深化场景,积累一定数据的公司,可以利用开源大模型,打造不少于闭源大模型公司的场景堡垒。
对小型企业而言,以应用领域为目标对小型技能进行训练,然后根据技术进步不断重新进步。「练号」,能够在这一大技术趋势下不断抓住小风口,即使在大风口到来的时候,也会以插件的形式参与进来。。对巨头企业而言,其优势在于多场景的结合,是对核心入口的竞争,「再开新号」成本太高,技术迭代常常意味着一场淘汰赛的开启。
企业间的共识并未根据融资能力的差异、技术应用价值预期的差异、自身体量的差异形成。
这是个好消息,说明大模型领域还远没有像新能源汽车那样进入市场成熟阶段。虽然不确定性会增加失败的风险,但也有更大的机会,足以说服一些公司探索和追求技术高峰。
能够理解中局的无奈,却不应该放弃对终局的坚持。
本文来自微信微信官方账号“窄播”(ID:exact-interaction),作者:李威,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




