货拉拉CTO张浩:AI竞争关键不在基础模型,而在行业应用场景

11-29 07:06
运营效率与用户体验是货拉拉的两大核心。

2025年的商业世界正处于新旧交替的关键节点。在商业叙事重构、科技浪潮席卷的当下,WISE2025商业之王大会以“风景这边独好”为主题,试图在不确定性中锚定中国商业的确定性未来。我们在此记录这场思想盛宴的开篇,捕捉那些在变局中坚定前行的声音。


11月27-28日,被誉为“年度科技与商业风向标”的36氪WISE2025商业之王大会在北京798艺术区传导空间举办。


今年的WISE不再是传统意义上的行业峰会,而是以“科技爽文短剧”为载体的沉浸式体验。从AI重塑硬件边界,到具身智能叩响真实世界大门;从出海浪潮中的品牌全球化,到传统行业装上“赛博义肢”——我们还原的不仅是趋势,更是在无数商业实践中淬炼出的真知。


我们将在后续内容中,逐帧拆解这些“爽剧”背后的真实逻辑,一同领略2025年商业的“风景这边独好”。


以下是货拉拉CTO张浩的演讲实录,经编辑整理:


大家下午好!我是货拉拉CTO张浩。



刚才的圆桌讨论中,谈到AI当前对哪个行业影响深刻,地瓜机器人的秦总表示暂未看到明显迹象。


接下来我将分享AI在货拉拉的应用落地情况,先不谈未来,只讲过去两年的发展路径。讲完后,请大家再判断:当前AI对行业的影响到底有多大?



大家在大街上常能看到货拉拉的车辆,这里不再赘述业务场景。货拉拉最早成立于香港,2014年进入中国内地,至今已有12年历史。除中国外,还在东南亚、南美洲等400多个城市和地区提供服务,月均活跃用户近2000万,活跃司机200万。作为业务撮合平台,核心是促成货主与司机的交易,因此运营效率和用户体验是货拉拉的核心能力,也是AI需重点突破的两个方向。


每家公司的业务场景和落地阶段不同。2023年ChatGPT横空出世后,我们也开始相关研究。首要问题是:在货拉拉所处行业及公司结构中,AI在哪些领域能发挥最大作用?


我们参考高盛2023年AI研报的评估方法,通过岗位调研、任务拆解、自动化难度评级,量化AI提效潜力。生成式AI将率先在高数据密度、人力密集型领域引发生产力革命,因此我们优先选择业务安全、研发、产品、运营等场景落地;而对于确定性要求高、容错率低的场景,如数据分析,我们认为时机尚未成熟。


确定方向后,便是技术落地路径问题。


和所有科技公司一样,2023年初我们也想做货运行业垂类大模型,投入了不少资源和精力。


最终,我们用时间和成本换回两个结论:


第一,基础大模型本身更新迭代极快,与其在基础大模型上耗费大量时间,不如深耕行业数字资产、业务API及行业know-how的落地。


第二,搭建企业自身的AI应用平台比做基础大模型更重要,随着基础大模型的升级,企业AI应用能自动提升效率。


基于这两个认知,我们调整重心,不再纠结于基础大模型。随后用一年多时间打造了三个完整的平台应用:海豚平台、悟空平台和评测标注平台。


简单介绍这三个平台:


悟空平台旨在让非专业人士能在5分钟内搭建初级企业智能体应用。



它有三个主要特点:


一是可视化流程编排,通过拖拽即可整合公司各类数据资产的API接口。


二是0代码智能构建,通过自然语言就能搭建基础智能体。


三是可建设企业级工具库和MCP,正如之前所说,我们的竞争优势不在技术层面,而在于做好企业数字化资产。


海豚平台面向专业算法开发者,实现从数据训练、模型开发、上线维护到生命周期管理的一站式效率提升。


我们希望通过这个企业内部平台,为算法工程师节省在资源、数据、模型开发、检测等方面的时间。


当然,模型构建上线后的评测环节至关重要。为此我们推出标注AB试验平台和拉拉智评,完善模型PK、AB试验分流等环节。


过去有个玩笑说“人工智能就是人工+智能”,因为大量精力花在标注和评测上。做好评测体系,才能确保每次上线的结果可靠可重复。


以上是对三个平台的简要介绍,这也是我们引以为傲的成果。我们的经验是:大模型是行业、大厂提供的公共基础能力,而平台应用需企业自行打造,这样才能让业务“跑得更快”。


接下来分享几个应用场景。这些场景虽无颠覆性突破,但值得推广且有微创新。


比如AI安全防控。在货运场景中,货拉拉用户可能遇到违规载人、危险品运输、危险驾驶等行为。


平台需及时干预,但这类事件处理窗口短(仅几分钟),若未及时检测干预,可能引发问题。


针对安全驾驶实时监测窗口短、准确率要求高的特点,我们通过大模型结合语音、图像及非结构化数据进行实时检测干预,对下单流程分层处置。一年多来,危险品运输和违规载人的风险订单量下降30%,订单提醒率达100%。


第二是AI Coding。任何科技公司都会用到AI Coding,核心问题是它能否提升产研效率?答案是肯定的。


从一年多前使用AI Coding至今,90%的个体和团队已应用。研发流程渗透率从PRD、研发、上线、调试到监控,AI Coding覆盖了60%,整体渗透率较高。


但也存在不足:当前AI Coding仅能提升约10%的工作效率。


若在座有工程师会知道,程序员并非每天8小时都在写代码。我们统计发现,工程师日均仅30%时间用于写代码;假设代码工作中30%由AI生成,最多仅10%的上线代码来自AI Coding,比例不算高。


原因在于,AI Coding在新工程及前端任务中能生成大段代码,但面对复杂业务逻辑,开发者需与AI反复用自然语言沟通才能得到正确逻辑,且代码不一定能上线。


也就是说,写代码时间减少了,但检查、纠错、测试的时间增加了,一增一减后效果并不显著。


再看一些微创新。在产品体验方面,新用户可能不清楚哪种车型适合装货,也不知道货物的尺寸重量。为此我们开发了“拍货选车”功能:用户用摄像头拍摄货物,AI通过点云分割计算体积,再与车库车型自动匹配,10秒内即可推荐最合适的车型,使用效果良好。


作为互联网公司,我们每天收到大量用户反馈,这些反馈内容繁杂,人工打标、分类、总结效率低下。于是我们用大语言模型打造用户反馈分析器,通过小模型快速识别分类,再由大模型总结整理。


这一功能效果显著,比如我们很快发现用户反馈开发票效率低的问题,这类信息以前很容易被忽略,现在能精准捕捉。


同样,同事离职、产品迭代后,可能出现“知识死角”:几个月或几年后,没人知道某个功能是谁做的、为何这么做。


针对这一问题,我们用大语言模型整合公司所有PRD文档、代码仓库、配置等资料,通过数据分析打造了AI产品知识专家,能解决历史问题,尤其是知识冗余和跨部门协作问题。


业务流程中存在大量给用户发短信的需求,短信成本不低,其中有不少节省空间。


短信内容由人工撰写,存在优化空间,大语言模型天然适合这项工作。通过智能优化分析,我们简化、优化了以往表达不准确、过于冗长的短信内容,一年节省约12%的短信成本。


此外还有潜在收益:风险防范。一条短信可能发送给数百万用户,大语言模型能提前预测用词和内容的合规风险,便于及时干预。


如今AGI技术让数字人无处不在。以前纯文本或语音助理缺乏人物形象,现在我们用真实AI数字人作为业务伙伴,在公司内部和外部场景都得到了良好应用。


比如我们的AI应用专家在通话时,曾出现方言听不懂、答非所问的情况;与外部交流时,即便答对,用户因知道是AI也可能不信任。


为此我们构建了AI+ASR+LDM+TTS的三维串联体系。


ASR通过独创热词运营及与第三方合作优化声学模型,语义识别准确率达94%。


重要的是,我们发现带方言的AI业务伙伴更具真实感,于是调整了口音音色,使AI真人度达92%,效果不错。


另外,在线场景中用户常带有情绪(如焦急、生气),此时需及时安抚并引导至不同场景。我们通过大语言模型实现问题改写、场景路由及Multi-Agent模式,大幅提升问题解决率和准确率。


最后回到开头的问题:当前AI在服务类业务场景中主要做两件事——增收和降本。


不同行业特点不同,像货拉拉所处的O2O行业(无论是电商还是货运)本质仍是服务行业,核心价值还是服务本身,这一点不会被AI取代。未来若无人驾驶+具身智能完全普及,AI或许能胜任服务工作,但目前还不行。


AI在货拉拉这类行业中,提效作用相对边缘,约5%-10%。部分岗位受影响较大,但总体仍是提效、防风险和降成本的渠道。


不过我们仍需保持乐观。首先,基础大模型演进日新月异,呈指数级发展,今天的问题可能三个月后就不再是问题。


具体落地方面,我们将向多模态模型方案推进。刚才提到的AI业务伙伴分ASR、LLM和TTS三个阶段,但维持准确率和时延仍有困难。


因此,单个模型整合端到端三个模块是未来方向。目前我们单个数字人做得较好,未来希望从上游到下游全打通,用多个数字人整体提升企业流程效率。


当然,用户体验是重中之重,目前AI在这方面作用相对较小。但随着AI能力提升,未来有望通过端到端大模型助手,在智能选车、智能填单、内部运营答疑等方面实现提效。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com