理想汽车 CEO 李想:要么做端到端,要么不再做自动驾驶。
IT 世家 12 月 26 今晚,理想汽车发布了“理想汽车” AI Talk 访谈实录 02 "理想汽车董事长兼董事长 CEO 智能驾驶R&D副总裁李想、郎咸朋回答了一些关于智能驾驶的问题。
IT “理想的世家附” AI Talk 访谈实录 02 “以下是一些关键内容:
张小珺:第一次试驾端到端是怎样的体验?
郎咸朋:第一次尝试这辆车,从中关村开到北京交通大学。开了几公里,我问旁边的贾鹏,这是规则还是怎么做的?为什么我觉得开得这么好?他说他没有写任何规则,所有这些都是系统根据我们给出的数据训练出来的。
众所周知,如果前面有刹车,需要慢慢减速,甚至稍微抬起刹车,这样刹车过程非常舒适。在这个过程中,我们团队在规则阶段写了很长时间的代码,但并没有达到完全拟人化、解决所有场景的表现。
但是我第一次试驾端到端,它的垂直方向已经比以前试过的所有东西都要好了,这才用不到短短。 15 天啊。所以我觉得当时建立了一个信心,就是端到端肯定能做出来。而且一旦做出来,肯定会比现在所有的智能驾驶软件都要好。
张小珺:既然端到端是神丹妙药,为什么去年不上呢?特斯拉去年就上了,你去年在干什么?
郎咸朋:我们在等待,等待足够的数据和计算率,等待我们就可以了。
端到端 VLM 事实上,大模型的最终本质是使用人工智能进行自动驾驶。人工智能的三个要素:算法、数据和计算率。这三个要素必须完整。我们今年准备好了,所以我们可以做到这一点。
理想 AD Max 车型销售,从去年开始到今年年初(高质量培训),信息量达到 10 1亿(公里)的上下规模是基础。二是计算率的基础。今年年初,我们的计算率也达到了。 5EFLOPS。再加上第三步,端到端的一些预研也取得了一定的成绩,所以今年年初是一个合适的时间和地点,我们可以做到这一点。去年我们还在补习的过程。
为什么许多企业的端到端都是两种模式,而非两种模式? One Model?
郎咸朋:这是算法和想法的问题。当我们想做端到端的时候,我们为自己设定了一个目标。我们必须使用纯数据驱动的方法来做到这一点,而不是将之前的规则结合起来,所以它的性能上限会很高。
张小珺:为什么理想是端到端? VLM,不像特斯拉只用端到端?每个人对自己的端到端都不够自信吗?
郎咸朋:我们不能这么说。我们在做技术规范的时候,充分借鉴了世界上所有先进的方案,但是一直解决不了的问题是,当一个自动驾驶或者智能驾驶系统工作的时候,如果遇到以前没见过的场景,应该怎么做?我们认为这是端到端。 VLM,便是系统 1 系统 2 这种方法,更好地模仿人脑的工作方法。
张小珺:特斯拉没有使用激光雷达,大家为什么要使用?
李想:许多人不太理解这个说法:为什么要保留激光雷达,或者安全?。是因为你技术不好吗?不,中国和美国不一样。如果你晚上经常在中国路上开车,你会看到一辆尾灯坏了的大卡车,甚至一辆尾灯坏了的大卡车会直接停在主干道上。至少我们今天的摄像头可以在半夜看不到光线下的距离。事实上,只有 100 米出头。
但是激光雷达,在没有任何光源的情况下都能看到。 200 米。这样可以帮助我们实现 130 公里 / 小时的 AEB 自动紧急制动。那么我认为这很重要,因为我们是一辆面向家庭的汽车,每个人的人身安全都很重要,所以我们继续保留激光雷达的根源。而且后面的车型还会保留。如果马斯克在中国,在深夜以不同的高速行驶,我相信他也会选择保存前面的一个激光雷达。因为特斯拉同样重视安全,只是他想在这种环境中看到它。
张小珺:理想激进的使用只有一个模型端到端,其它车企还在使用两个模型,为什么?
李想:很多时候可能和我们有一些很好的外脑关系,比如王兴和陆奇博士,他们会给我们带来很多启发。有一次,陆奇博士告诉我们,你应该思考人们是如何工作的。我认为这对我们当时有很大的帮助。
今年年初,我还强迫智能驾驶团队去美国。他们在不同的城市开车。 FSD V12。另一方面,我们的研究工作也在进行中,那时我们已经从头发到头发。 VLM 各种各样的研究论文。回来后,我觉得要么你这样做,要么我们不再做自动驾驶。。你今天依靠这些规则来做的事情,和请供应商做的事情有什么不同?没什么区别。
我说服郎博他们很重要,我说你们经常解决一个问题。 Corner Case(极端情况),还有三个其他的。 Corner Case。每个人一生都在处理 Corner Case,处理不完。
张小珺:大家都说理想做智驾是最迟最慢的投资,你怎么看?
郎咸朋:2018 年 1 当我每个月都加入我的理想时,我和李想讨论了这个问题。决定智能驾驶或自动驾驶最终实现的关键因素是什么?我们当时谈论的是数据。人才可以流动,算法可以提高,算率也很重要,但只要有健康的资金和合理的资金使用,就可以买到。
所以最重要的是数据,这是买不到的,要做好自动驾驶,必须有这样一个非常高质量、规模非常大的数据。因此,我们必须按照节奏进行自动驾驶。一开始要做好车,卖好车,然后积累更多的资金、人才和数据,在一定的时间点投入大量资金,才能达到更好的自动驾驶效果。事实上,从今天的结果来看,我们可以看到这一点:我们自动驾驶的节奏很好。
张小珺:什么时候理想意识到,智驾对卖车有帮助?
郎咸朋:就实际表现而言,是从今年开始的。,今年的智能驾驶确实对销售有很好的促进作用。我们 2 月 AD Max 交货比例仅为 20% 从上到下,到今年下半年, 50% 那么,这就是实实在在的表现。最初大家都认为自动驾驶是一种功能,它和座椅加热没有太大区别,也没有解决顾客日常出行的舒适问题。直到现在我们使用它 AI 来做自动驾驶,端到端 VLM 真正释放顾客长期驾驶疲劳。在我们能够实现全面的时候 MPI(城市 1000高速综合接管里程 每个人都愿意在公里、几百公里的时候为自动驾驶买单。
张小珺:理想提出监督智能驾驶和自动驾驶。 L1 到 L5 传统分类的区别是什么?
郎咸朋:这实际上反映了我们对自动驾驶研发的思维差异。以前许多人认为 L3 自动驾驶是 L2 辅助驾驶的延续,只需 L2 辅助驾驶的场景越来越多,总有一天可以无限接近。 L3,甚至可以做到。 L3。
但是在我们看来,L3 或有监督智能驾驶,它不是 L2 继续,而是 L4 或者自动驾驶的主导程序。事实上,我们正在研发、成长和迭代未来的自动驾驶能力,而不是遵循过去的应用。 L2 思考,去做现在的自动驾驶。
张小珺:你说自动驾驶是能力,辅助驾驶是功能,两者的本质区别是什么?
郎咸朋:功能是预设条件,能力是应对所有条件。你们不能把所有的预设都用光。
如果是功能的话,还是用上一代的这个软件。 1.0 计划自动驾驶。最大的问题是,在研发之初,所有条件、所有界限和最终确定性的结果都要明确设置。这在自动驾驶中是非常困难的。
能力的话,就是用人工智能的方式进行自动驾驶。如果我们把自动驾驶作为一种能力来开发,从最本质上考虑人是如何学会驾驶的。起初,人们来到驾校学习,掌握了基本的驾驶技术再次参加考试。在掌握了基本能力之后,作为实习司机一边练习一边提高能力,逐渐成长为老司机。我们系统 1 系统 2 计划使自动驾驶系统具有迭代和增长的能力。随着数据量的增加,性能会逐渐提高。这就是人们常说的规模效应。
张小珺:每个人都验证过自动驾驶的规模效应吗?
郎咸朋:我们已经验证过了。这不是我们发明的。所有的大模型应用都符合这个规律。换句话说,数据规模和数据质量的增加会带动特性的增加。而且性能增长接近线性,这是我们使用大模型最本质的好处。
张小珺:有监督智能驾驶阶段,理想交付给用户的商品长什么样?
郎咸朋:整个场景,一体化端到端商品。要实现智能驾驶的监管,一个前提是实现车位到停车位,即解决前100米和后100米的问题。以前智能驾驶是从主干道开始的,现在可以从小区停车位开始,然后包括公园道路、停车、市政道路、高速公路和收费站。 ETC 将全部打通。
高速城市全场景升级端到端 VLM,以及创新的 AI 推理可视化交互,将在不久的将来随之而来。 OTA 全部推送给所有人 AD Max 客户。
张小珺:L3 何时实现?
郎咸朋:根据现在的端到端。 VLM 这个系统,如果能力继续迭代,我们就有希望了。 2025 年去完成 L3 的。
张小珺:面对李想年初对智驾的愤怒,你的职业危机何时解除?
郎咸朋:我觉得还没有消除,因为还没有达到极致。今年我们的目标是全面 MPI(城市 实现高速综合接管里程 100 公里接管一次的能力。这一接管并非安全接管,并非说你要撞车才接管,而是用户觉得车开得不符合感觉,不舒服。到明年、后年,我们将逐步提高到明年, 500 公里、甚至 1000 公里以上。慢慢地让大家对智驾越来越自信,越来越依赖。
张小珺:要实现这一目标,需要储备多少计算能力和数据?
郎咸朋:要达到 500 公里的综合 MPI(城市 预计需要高速综合接管里程) 2000 万 Clips(视频短片)的水平。 2000 万 Clips 从不到 5% 老司机去筛选,这里隐含的数据量,要达到 50 一亿公里甚至几百亿公里的水平。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




