VLA是特斯拉V13的对手吗?

04-09 11:03

二月底,特斯拉FSD进入中国,国内所有智驾公司都收紧了背部。


三月份,特斯拉FSD“翻车”与“顺滑”同时存在,大佬们的笑容虽然回到了脸上,但是心中的焦虑却不得而知。


回顾特斯拉FSD进入中国后的表现,有一种分离感,将《智驾迷惑行为奖》和《智驾优秀学生演示稿》放在一起。一方面,在上海陆家嘴,FSD把公交车道当成超车道;在广州塔下,导航明显显示绿灯,但由于“前方施工”的警示牌被视为广告牌,汽车突然刹车。一方面在常规驾驶中展现了老司机的水平,能够准确避开非机动车,毫不犹豫地完成转弯、转弯等操作,给用户一种熟练丝滑的感觉。



在常规驾驶中,FSD表现平滑。


造成这种场景的原因也很简单。特斯拉底层AI技术积累丰富,可以支撑常规使用过程中智能驾驶的平滑体验。但由于端到端模型的配备(与传统的模块化智能驾驶模型相比,端到端模型在感知、决策、控制等过程中不会造成信息损失,但基本上还是按照指令进行相应的操作。我无法理解潮汐车道等其他路况的驾驶规则。)缺乏中国的数据训练系统,导致FSD不了解中国复杂的人车游戏场景和特殊道路的驾驶规则,这也演变成了特斯拉的“智能驾驶迷惑行为奖励”。


这也是老板们集体焦虑的症结。由于其强大的底层逻辑能力,特斯拉一旦弥补了国内的不足,势必会为国内汽车公司创造一个“乌云”。


此时,VLA出现了。



好消息和坏消息


好消息是,VLA模型可以解决端到端的“短板”,结合看、想、做三个动作,分别使用摄像头。 激光雷达收集实时路况,相当于给车安装了24k大眼睛;大语言模型通过处理交通标志、行人意图等方式分析下一步路况。毫不夸张地说,即使是“行人也要闯红灯”,潮汐车道和公交车道也要处理;根据你看到的和想到的,VLA可以为车辆做出最好的路线,控制车辆,并且可以贴心地解释决策逻辑,比如“速度下降是因为前面有孩子突然突破。”...


简单来说,VLA融合了视觉、语言和动作,赋予了车辆“类人思维链”,从端到端的“看图说话”发展为“阅读理解”。


由于VLA能够解决端到端的技术短板,那么为什么国内汽车公司仍然对特斯拉FSD进入中国感到焦虑?其实很容易理解,特斯拉FSD的基本能力和学习能力都很强。只有通过在互联网上寻找中国道路的视频短片来训练,系统才能展现老司机的一面。一旦特斯拉在中国补足数据,克服在中国遇到的“水土不服”,它可能会成为中国市场上最好的智能驾驶员之一。 日前,元戎在百人会议上启动CEO周光和博世中国区总裁吴永桥也直言不讳,FSD 在端到端智驾技术上,V13领先于国内高级智驾系统一代差。


所以,国内VLA能否跨越底层技术的参差?FSD V13和VLA在业内被视为智能驾驶模型阶段的产物。在周光看来,VLA的能力使其成为“通才系统”,即在垂直领域具有广泛的情景适应性。



“VLA可以弥补端到端模型的不足。它是一个驾驶员,能够理解语义信息和特殊车道的驾驶规则。只有先成为驾驶员,才能成为驾驶领域的专家,也就是实现完全自动驾驶。”周光认为VLA架构是L5的转折点。他认为VLA的本质是构建一个统一的时空认知框架,为L5级自动驾驶提供了底层支撑。


总之,周光认为元戎推出的VLA是一个很好的方案,在保留核心AI能力的基础上,向L5推进,既满足了技术追求,又满足了商业化。


好消息足够刺激,坏消息让人有些不安——那就是VLA车型还没有完全落地。但是别担心,我已经在做了。



四条路线的“反击”之路


目前国内市场上明确布局VLA的玩家有四个,分别是数据“疯子”理想、“合资”大户奇瑞、“买买买专业户”吉利、激进选手元戎。



“理想用的是”MindVLA",结合了3D高斯编码、MoE混合和专家结构等高大技术,复杂路况决策的准确性确实领先于同行。但关键问题是,他们必须同时保持两个系统:端到端和VLM。虽然数据(自信)充足——动态数据湖覆盖了整个行业的第一个密度,但他们豪言要在2025年实现“数据自由”,但R&D成本飙升,立即覆盖了造车新势力的成本。


奇瑞,一个合资大户,有很多朋友。拉华为和英伟达做猎鹰智能驾驶,计划在猎鹰900上实现VLA模型,但它的世界模型。(WM)预测能力尚未达到标准,落地时间为2027年。


“客户专业户”吉利以“万里浩瀚”智能驾驶系统为矛头,使用“全球AI” “天地一体”的组合拳,试图利用生态辗压单一技术。


激进派元戎的启动与前三者有本质区别。它不仅是少数投资开发VLA的智能驾驶解决方案供应商,而且已经将前者抛在脑后,进入大规模生产阶段。不出意外,你可以看到元戎VLA车型在年中上路。


其他人开始研究,元戎已大量生产?事实上,如果你仔细看看元戎的发展路线,你会发现TA一直在默默地走在前列。2020年,元戎推出“无图”智能驾驶,直到2024年才刮起无图的风;2024年,当汽车公司大肆讨论端到端时,元戎推出的端到端已经量产;2025年,元戎的下一代VLA在占据端到端市场份额时,已经量产。


周光曾经直言自己是国内智能驾驶技术的“启蒙教师”,现在看来,的确不必惊讶。


在任何行业,落后就要挨打是共识,智能驾驶行业无非就是智能驾驶行业。汽车公司都想“领先”自己。这时,选择一个“稳定”的第三方的优势就体现出来了。


已实现大规模生产的公司首先建立了技术环城河:凭借VLA技术支持的长期推理和全局管理能力,城市NOA的具体使用次数将大幅增加,从而为企业积累更大规模、更高质量的真实场景数据;基于Scaling Law(规模法),数据规模的提高会反馈算法性能迭代,进一步提升用户体验。



比如元戎的启动,不仅已经进入量产阶段,还与高通达成了合作。通过对算法开发的深入研究,未来将有机会向更多芯片平台释放VLA模型,支持纯视觉和激光雷达版本,这意味着作为第三方元戎,生动地诠释了什么是“好的工作,少的东西,和任何人在一起。”


当然,后来者也不是不可能居上。但这意味着不仅要花费大量的资金和资金,还要浪费九牛二虎的力量,别人可能会迭代到第三代甚至第四代,白白错过最佳发展的“黄金窗口期”。


综上所述,吃力不讨好。正如作家张岱所说,“你不能养一头牛喝一口牛”。养殖(底层逻辑)-护理(AI技术的延伸能力)-生产(量产能力)因为有完善的牧场,真的没有必要。



FSDD在2023年宣布 当BetaV12(全自动驾驶测试版)全面转变为端到端结构时,在一定程度上颠覆了行业的认知。当特斯拉将未满血版的V13同步到中国时,国内智能驾驶行业再次掀起波澜,汽车公司的高管们总是警惕自己的心脏能否承受特斯拉数据补充后对自己产品的影响。


目前,国内智驾领域的龙头企业已经实现量产,各家公司的工程化能力都处于同一水平。


智能驾驶的竞争也从工程能力转变为AI模型的底层能力。可以预计,当今年国内VLA技术车型逐渐上路时,特斯拉FSD和国内VLA哪个更强哪个更弱,可能会有新的答案。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com