大型进化理论:AI产业落地将何去何从?

2025-01-24

2024年,是大模型翻天覆地的一年。


“百模对决”爆发后不久,大模型的价格战接踵而至,高成本的大模型几乎进入了免费时代。大型模型已经从庞大的实验室工具转变为高效灵活的应用助手,在许多行业中根深蒂固。


没有人质疑大模型是“用锤子找钉子”,更迫切的需求来自市场。行业对大模型应用的渴望推动了AI。 在AI周围,Agent走向前台 Agent的混战已经开始了。


同时,以视频生成模型Sora为代表的多模态技术逐渐成熟,大模型技术范式发展迅速,给人们带来了巨大的想象空间。


今年,大模型领域充满了混乱和兴奋,技术和应用相互成就,共同推动市场快速发展。


回顾2024年大模型产业的发展,我们可以看到一条逐步明确的进化路径:低成本降低了大模型落地门槛;AI Agent为大型模型提供了极好的应用方法;多模式直接拓宽了大模型能力的边界,所有这些都为大模型行业的落地按下了加速键。


假设说“成本”,AI Agent、“多模态”三个关键字,代表着2024年大模型的进化方向,那么它们也代表着大模型走向产业落地的关键节点。


伴随着新年的到来,这种发展趋势将在2025年持续下去吗?大型产业的落地又将卷向何方?



成本,打开大模型落地卡点


在过去的一年里,大型模型已经到了更加务实的落地阶段,但是落地总是绕不过一个卡点-成本。


大模型参数高达1000亿,一次培训所需的资金大多是大多数公司“烧不起”的。因此,企业在选择模型时,不仅要注重效果,还要考虑成本,这是决策的重要组成部分。


这些变化来自于市场对大模型的实际需求。2024年,在市场需求和残酷竞争的多重推动下,大模型的价格战提前到来,国内顶级大模型厂商基本卷入降价潮,价格达到了不可思议的水平。但从某种意义上说,价格战也最大限度地降低了大模型的访问门槛,公司不会因为价格而纠结。


同时,大模型的落地推动,让越来越多的企业意识到,在特定的场景中,或许不需要跑出一般大模型的计算量。


“大模型不是参数越高越好。”一位金融科技负责人发现,在许多垂直场景下,更轻的大模型也可以达到通用大模型的效果,而推理成本更低,使用更简单。


随之而来的趋势是,轻量级模型开始流行。


Google在国外发布了20。 亿到70 1亿参数轻量级模型Gemma;Meta发布了从70亿、130亿、330亿到700亿的Llama系列模型,不同的场景选择了不同的模型组合,效果得到了验证。


百度在国内发布了三款轻量级模型,从大到小都是ERNIE。 Speed、ERNIE Lite、ERNIE Tiny,模型调用服务由百度智能云千帆大模型平台提供。核心理念是帮助客户降低成本。在特定场景下,超小模型也能达到1000亿级大模型的效率。


在经历了这一系列大模型需求的变化后,百度智能云千帆产品的负责人感慨万千。“在完全关注成本的状态下,大家对大模型的期待变成了‘不需要给我最大的参数和最贵的模型’,而是‘从我的场景中获得最好的模型’,不再追求一个模型来解决所有问题’。


杭州全诊医学采用ERNIE,性价比更高。 Speed。AI医疗助手的医学术语通过使用20万份精准病历数据来精准调整大模型,使其更加准确和规范,病历产生的准确率提高了45%,医生的咨询量提高了20%。


模型蒸馏、混合专家模型在此过程中,(MoE)等待创新技术层出不穷,为了在降低模型计算资源消耗的同时保持大模型性能。


但是最终降本并不止于此。实际上,企业为了实现成本效益的最大化,往往需要对特定场景进行定制。


宁波媒体利用大模型定制开发了一套AI评价助手系统,用于记者作文。“小记者投稿5万多篇,宁波晚报的记者和老师都要看花了。幸运的是,拥有百度智能云的千帆ModelBuilder平台开发的智能作文批改系统,可以直接提高作文的筛选和复习效率,对作文进行AI评价,并提出改进意见。”宁波晚报某项目负责人表示。


该系统的背后,是基于百度智能云千帆ModelBuilder提供模型调整模板-作文评论样板房,同时还辅以全过程的模型训练和调整工具链,以提高模型运行效率。


不仅如此,千帆ModelBuilder还提供了一站式的数据洞察和处理平台,企业可以建立自己的数据飞轮,让模型越来越聪明;底层为千帆平台的模型训练和模型推理提供了稳定高效的算率支撑,保证了稳定快捷的性能。


这一技术进化,进一步降低了企业的成本,推动了大型产业的落地。


根据沙利文联合头豹发布的《2024年中国行业大型市场报告》,2023年中国行业大型市场规模达到105亿元,2024年市场规模达到165亿元,同比增长57%,2028年市场规模有望达到624亿元。


总的来说,2024年,行业通过降价、工具链、定制模型等一系列措施,成功打通了大模型落地卡点,以超高的性价比迎来了行业落地需求的爆发。在这个过程中,公司对大模型成本的终极追求逐渐升级为提高业务效率和核心收益,大模型技术正在进入更多的商业世界。



AI Agent,大型模型应用的场景突破


随着AI产业竞争进入“落地赛”后半段,业界将目光从模型本身转向AI应用。


2024年上半年,国内大型模型项目大多以智能计算中心和模型中心为中心进行中标。从下半年开始,很多企业的招标内容都转向了应用,越来越细分。


百度创始人、董事长兼首席执行官李彦宏曾公开表示,基本模型本身需要通过应用来展示其价值。那么,AI时代应用的核心媒体应该是什么呢?这个问题一度成为业内热议的焦点。


在百度2024年世界大会上,李彦宏明确表示,“智能体是AI应用最主流的形式,即将迎来爆发点”。虽然行业对AI的看法 Agent的概念还没有达成共识,但李彦宏的发言让行业更加确定了AI应用的发展趋势。在过去的一年里,国内外的云制造商、大型制造商、运营商和软件制造商纷纷涌入跑道,没有人想错过这个“馒头”。


毫无疑问,AI Agent已成为2024年大型模型领域最耀眼的存在,其数量一度呈爆炸式增长。资料显示,截至2024年11月,千帆大型模型平台已帮助客户调整33,000个模型,开发77,000个企业应用程序。


更加令人兴奋的是,AI Agent的爆发不是虚假的繁荣,而是真正的市场基础。与昂贵的大模型相比,能够负担得起的公司并不多,AI Agent更像是一个轻量级的AI解决方案,具有独立思考、独立安排、记忆和反思的能力,能够处理具体的业务问题,为具体的场景带来最真实的成本降低。


但是企业级业务不能容忍很大的误差。如何根据设定的工作流出任务,保证导出的稳定性和个性化,是企业级Agent全面落地的巨大挑战。


比如在保险行业的车险续保需求场景中,让Agent取代真人销售涉及到很多业务难点:如何化解和引导客户最初的拒绝态度?如何根据客户的历史车险情况给出优惠政策?如何根据工作流程成功引导用户续保?


为了解决这个问题,百度智能云基于千帆AppBuilder工作流Agent的探索,通过工作流安排的形式和大模型的能力,对售前数字员工进行更新。


这种工作流Agent可以防止大模型凭空发挥,同时辅以人工安排,提高执行的稳定性和可控性,规划调度的准确率可以达到95%。同时,工作流Agent还具有随时学习新知识和回忆新知识的能力,记忆准确率可达96% ,为用户提供个性化服务。


过去,企业至少需要一两年的时间才能培养出这样一个合格的金牌销售,但现在建造这样一个“数字员工”最快只需要一个小时。这种工作流Agent也可以快速整合到网页搜索、微信微信官方账号、企业网站等业务系统中,方便访问用户。


当AI Agent已经满足了企业级的需求,过去AI不太可能实现的一些需求场景已经照进了现实。更具市场创意的是多Agent合作产品的推出。


2024年11月,百度发布的无代码开发工具“秒”非常具有代表性。代码直接从大模型生成,不需要人写。它的门槛很低,每个人都可以入门。通过文心大模型的探索和规划能力,可以调度和安排不同的Agent,这意味着每个人都可以指挥多个Agent协同实现自己的目标,而无需编写一行代码。只要使用自然语言就可以直接生成代码,建立应用程序。


更有甚者,李彦宏声称“我们将迎来一个前所未有的只有想法才能赚钱的时代”。


“秒哒” 商品的发布意味着AIAgent已经进入了公众的视野。如果越来越多的人意识到AIAgent有用,AIAgent就会迅速爆发。根据银河证券的研究报告,到2028年,中国AIAgent Agent市场规模将激增至8520亿元,复合增长率为72.7%。


假如把2024年看作是AI的话 在Agent爆发前夕,那么2025年将是AI。 Agent落地第一年。对企业而言,AI会更加重视 Agent在商业场景中的作用;对大型制造商而言,AI Agent技术和工具链的支撑能力已经成为基本要求。



AI交互技术,多模态,原生融合


AI领域在2024年迎来了一个重要的转折点——多模态大模型的兴起。


随着视频生成模式Sora的出现,OpenAI多模式AI大模式GPT-4o的到来,百度百度支持Vidu等第一个全自研视频大模式的发布,这些都让业界看到了AI发展的新方向,多模式已经成为全球大模型厂商竞争的焦点。


从技术角度来看,多模态增强了AI系统处理复杂任务的能力。与单模态相比,多模态模型可以提供更全面、更准确的理解和响应,融合了文本、图像、音频、视频等多种类型的数据。


不但如此,多模态大模型极大地扩展了AI的应用范围。在过去的一年里,基于多模式大模型技术的创业公司如雨后春笋般涌现,文生图片、文生视频、文生3D、多模态应用层出不穷,如文生音乐、文生代码等,智能产品更是以多模态为基础,为市场带来了巨大的想象空间。尽管多模式大模式勾勒的未来十分美好,但也必须承认,多模式离产业落地还有很长的路要走。


李彦宏在百度世界2024年会议上发表了类似的观点:“在过去的24个月里,大模型最大的变化是‘幻觉’基本消除了。如今,RAG在文字上做得很好,使得大模型可用且可信。然而,像图像这样的多模式技术需要准确性和可控性才能实用。”。


这次演讲证实了行业新的探索方向:清除多模态产生的幻觉,进一步提高多模态产生的可用性。


目前,iRAG是业界公认的提高模型能力的技术方向。它是一种幻觉,通过引入外部知识来检索和增强生成技术,可以更好地去除大型模型。


在全球范围内,百度的这种能力是非常领先的。基于检索和强化的文学绘图技术iRAG,可以结合网页搜索的亿级图片资源和强大的基本模型能力,生成各种超真实的图片。iRAG可以大大降低创作成本,如影视剧、漫画、连续绘本、海报制作等应用场景。


近日,百度智能云千帆大模型平台全面推出iRAG功能,用户可通过千帆ModelBuilder直接调用iRAG接口;同时,千帆AppBuilder提供丰富的多模态部件和数字人能力,如iRAG图片生成、文生视频、图片视频等,可在Agent中定制属于自己的智能体分身;到目前为止,千帆AppBuilder已经提供了90多个高质量的官方部件,如网页搜索和百度地图,让AI可以使用更多的工具,进一步提高AI能力;消除大模型幻觉是AI应用爆发的基础。


展望2025年多模态大模型的发展方向,或许可以用一句话来概括:离幻觉更远,离落地更近。


从行业到行业,AI落地,


在过去的一年里,人们充分感受到2024年是大模型改变世界的一年。模型能力的不断迭代和训练成本的不断降低,智能体的蓬勃发展,多模式市场的快速增长,都在宣布一个新时代的到来。


来自市场的数据直观地显示了过去一年中国大型模型的爆发。百度数据显示,截至11月初,百度文心大模型日均调用量超过15亿,比5月份公布的2亿增长7.5倍。与一年前首次披露的5000万次相比,增长了30倍左右。李彦宏感叹“这个增长率超出预期”,这条陡峭的增长曲线表明AI是真正的需求。


据公开招标数据显示,2024年国内大型中标项目数量和金额均大幅增加。从2024年1月到11月,共有728个大型中标项目,是2023年全年的3.6倍;中标金额为17.1亿元,是2023年全年的2.6倍。


在数据激增的背后,AI的价值开始被看到。特别是央国企作为领头羊,已经正式进入更深层次的产业落地。


国家电网联合百度打造国内首个千亿多模态电力行业模式,为电网安全稳定运行、促进新能源消耗、提供良好供电服务提供“超级大脑”。


山东港口联合百度打造世界上第一个落地应用的港口模式,将智能服务深入港口管理的方方面面,打造汽车、船舶、货物全链智能服务网络,提高物流供应链客户服务效率。数据显示,超过60%的央企联合百度智能云进行AI创新。


不仅如此,各行业的龙头企业也在陆续跟进。很多上半年等着看的公司,下半年开始积极寻求已经成功落地的解决方案,希望在自己的业务中复制。


蔚来汽车与百度智能云千帆平台合作,打造了端云多模式模型,开发了人工智能助手NOMI的问答功能,让NOMI成为更了解客户、更聪明的驾驶舱AI合作伙伴。蔚来汽车驾驶舱人工智能R&D负责人高杰表示,随着大型模型技术的出现,NOMI的能力进一步提高。


2024年,大型模型在许多行业完成了广泛而深入的着陆,为各行各业带来了显著的价值。正如百度集团执行副总裁、百度智能云业务集团总裁沈抖所说,过去一年是大型模型从技术转型到产业转型的关键一年。大型模型重构一切,为每个企业提供公平的增长机会。


在这一轮产业变革中,大型模型制造商也迅速构建了自己的技术能力和游戏玩法体系。以百度智能云为代表的头部厂商,从大模型底座到企业级大模型开发平台和全链工具,再到多元化的AI应用,都构建了端到端、全链路的体系,充分满足了客户对大模型整体解决方案的需求。


公开数据显示,2024年,百度智能云模型在三个维度中排名第一,即中标项目数量、行业覆盖面数量和中国国有企业中标项目数量。能源、政务、金融三个行业中标项目数量位居所有厂商第一,成为企业级应用大模型落地的主力军。


如今,大型模型仍在迅速渗透到各行各业。IDC预测,到2025年,中国生成型AI软件的市场规模将达到35.4亿美元。伴随着大型模型产业以惊人的速度不断发展,2025年大型模型市场格局将会发生新的变化,这可能会带来人类历史上生产力的又一次变化。


本文来自微信微信官方账号“科技云报道”(ID:ITCloud-BD),作者:科技云报告,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com