理想智能驾驶围绕“端到端”变阵,加速AI大模型上车
在智能驾驶行业," 端到端 " 正引领着一场技术变革。这最先由特斯拉引起,国内华为、蔚小理等玩家纷纷跟进。技术之外,组织变动也接踵而至。
36 氪汽车独家获悉,理想汽车近期成立了 " 端到端自动驾驶 " 的实体组织,整体 200 人出头;同时公司其他团队一些成员也在灵活支援项目。
理想不是唯一这样做的企业。此前蔚来汽车已经率先做出组织变革,成立了专门负责端到端的大模型部门。
理想智能驾驶团队主要分为算法研发、量产研发两个大组,团队约 800 人。" 端到端 " 的研发主力部署在算法研发组,由理想智能驾驶技术研发负责人贾鹏负责。
具体来看,算法研发下设感知算法、行为智能、认知智能等组。" 感知算法 " 由常黎主导;" 行为智能 " 包含端到端架构、端到端模型、控制模型等,由杨毅负责;" 认知智能 " 包含认知模型、云端模型等,实际由詹锟负责。
如果要打个比方,端到端三个主力小组的职责,分别对应智驾系统的感知能力、行走能力,和认知世界的能力。这基本与理想的端到端方案模块呼应。
前不久,理想公开了其端到端自动驾驶技术方案,其方案分为端到端模型、VLM(即 Vision-Language Model,视觉语言模型)视觉语言模型、世界模型三部分。
此外,与算法研发组平行,量产研发组由量产负责人王佳佳负责,包含智能行车、智能泊车、智能安全等。贾鹏与王佳佳均向理想智能驾驶负责人郎咸朋汇报。
针对上述信息,36 氪汽车向理想汽车求证,截至发稿,未获回应。
CEO 李想公开表示,到今年底或明年初,理想就会推出端到端 +VLM 的自动驾驶方案,方案将由超 1000 万 clips(视频片段)训练而成。理想还打算将参数达 22 亿的视觉语言大模型搬上车。
组织架构的实体化,也将从人力调度方面加速理想 " 端到端 " 计划的落地。
理想智驾,曲折自研
所谓端到端,就是把传感器数据作为输入,车辆控制指令作为输出,中间环节过程都靠 AI 神经网络模型来完成。这已经成为智能驾驶行业下一代共识方案。
但 " 端到端 " 方案的起势并不容易。据特斯拉计算,完成一个端到端自动驾驶的训练至少需要 100 万个、分布多样、高质量的 clips (视频片段)才能正常工作。
马斯克曾强调过数据在自动驾驶方面的重要性:" 用 100 万个视频 case 训练,勉强够用;200 万个,稍好一些;300 万个,就会感到 Wow(惊叹);到了 1000 万个,就变得难以置信了。"
对于刚刚转入端到端方案的车企而言,需要耗费一段时间才能看到成果。
然而当下国内的智驾行业竞争激烈,叠加特斯拉 FSD(即 Full-Self Driving,指特斯拉全自动驾驶软件包)入华、华为智驾的 " 鲶鱼效应 ",小鹏、蔚来等玩家都在积极追击。
理想一直都扮演着智驾追赶者的角色。为了高效追赶,理想内部分成了两队人马。
一是在智驾系统 AD Max 上选择自研,搭载英伟达 Orin 芯片与激光雷达,提供城市领航辅助驾驶功能(具备城市道路点到点辅助驾驶能力);
二是在智驾系统 AD Pro 上与供应商合作,搭载地平线征程 5 芯片,无激光雷达,能提供记忆行车、城市 LCC(车道居中辅助)等功能。
此前据 36 氪汽车报道,智驾 AD Pro 方案启用了智能驾驶供应商轻舟智航。轻舟有 300 多人,从去年末开始几乎全员驻场在理想的顺义总部。随着近日 AD Pro 版本车型功能升级,开发任务告一段落,轻舟主要人力已经撤出理想项目。
而在自研方案上,理想的城市领航辅助功能追赶几乎从 2023 年才开始。一年半多时间里,理想数次切换了智驾的技术路线。
2023 年 4 月,理想喊出了城市 NOA 落地 100 城的目标,但 " 主要是为了应对华为和小鹏的智能驾驶冲击,口号先行 "。近半年后,理想主动将 " 城市 NOA100 城 " 改成了 " 通勤 NOA100 城 "(通勤 NOA 指在用户高频路段开启点到点辅助驾驶),因为前者 " 难度太大 "。
然而 " 通勤 NOA" 的路同样不好走,有理想智能驾驶人士向 36 氪汽车解释,通勤方案的本质是预先建图,仍然依赖高精地图,不符合行业技术趋势。实际落地扩张效果也不好," 原定目标是一天开拓 1 条路线,但实际上三个月只构建了 2-3 条路线,效率很低 "。
意识到不对,理想在去年转而全力追击 " 无图 NOA"(指不依赖高精地图的城区点到点辅助驾驶)功能。
不过由于理想纯电车型 MEGA 失利,理想整体放弃 80 万辆的销量目标后,公司进入裁员节奏,智能驾驶团队也被波及。目前理想智能驾驶团队人数约 800 人,与年初的 1300 人相比已经大幅裁减。
而理想无图智驾方案的推送,也从原本的 4 月推迟到了 7 月。直到近日理想才向 AD Max 用户推送了无图 NOA 功能,号称全国范围内、可导航的城市道路都可使用功能。
在端到端的效果可检验之前,当下推送的功能版本,是理想智能驾驶占领市场、获得用户口碑的关键。
端到端是一场资源战
在端到端方案的实践中,先行者特斯拉 FSD v12 版本在北美地区已经取得了令人惊艳的效果。
而国内的玩家也从特斯拉的验证中,找到了通关秘籍:在积累海量的驾驶行为数据、更大云端算力的训练下,端到端方案会更加拟人。
今年 4 月,马斯克表示,对英伟达 H100 AI 芯片的采购量将从 3.5 万增加到 8.5 万,并计划投资 100 亿美元用于汽车的联合训练和推理人工智能。此外,特斯拉自研的训练芯片 Dojo 近期也开始在台积电投入量产。
同样,理想在走上端到端方案之后,也在筹谋更大训练算力。有内部人士告诉 36 氪,理想认为智能驾驶的下一个竞争点,一定是超算中心。
有知情人士告诉 36 氪,去年秋季雁栖湖会议上,美团 CEO 王兴、Y Combinator 中国创始人陆奇都劝李想,在云端训练 GPU 领域加大投入。
据 36 氪汽车了解,除了去年向火山引擎购买的 300 多台英伟达服务器外,目前理想还跟阿里云、百度云等云厂商都有合作。" 现在在高价收购英伟达的卡。"
同行也预判到了超算的重要性。从云端算力来看,目前华为是国内智能驾驶训练算力最大的玩家。华为表示,6 月其智能驾驶训练算力将达 3.5EFLOPS。小鹏、蔚来智驾中心算力分别是 0.6EFLOPS、1.4 EFLOPS,而据 36 氪了解,理想的智算中心算力为 1.4 EFLOPS。甚至老牌车企长城也在加入战局,超算中心算力为 1.64EFLOPS。
端到端之战,不仅是车企智能驾驶技术路线的一次变更,更考验着车企们长期的兵马粮草供给。这将是一场耐力比拼。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




