两个核心观点:
1. 特斯拉不是是目前唯一在坚持纯视觉方案的企业,纯视觉方案是被技术领域高度认可的未来技术趋势之一;
2. 特斯拉坚持纯视觉方案符合马斯克推崇的“第一性原则“,其核心是轻硬件,重算法;
纯视觉方案是目前全球自动驾驶领域一个非常热门的研究方向,另一个非常成熟的参赛选手就是mobileye。Mobileye在2020年的CES上就已经展示了基于纯视觉的城市无干预自动驾驶。
2021年北美和英国的华人汽车工程协会搞了一个自动驾驶方面的技术论坛,我也在里面听听。与会的在国内和美欧工作的自动驾驶研究人员的观点还是比较一致的,那就是从技术逻辑的角度来说纯视觉更可能是“正确的选择“,而激光雷达方案更多的是现有的技术能够拼凑出可用系统的现实选择。
其实这有点像“三体”中章北海所在的时代面临的选择,到底是使用成熟的化学工质推进方案还是看起来连技术基础都有很多突破空间的无工质推进方案。
那么,为什么会有这样的观点呢?
因为这个观点的核心并不在于复杂的两者技术的解读,而在于这些技术背后的理论基础,那就是:
视觉方案是轻单车硬件,重软件算法、云计算和大数据协作来实现识别的方案;
激光雷达方案则相反,重单车硬件系统,是靠硬件扫描出的海量高精度数据来实现识别的方案。
这就是两者最大的区别,也是为什么特斯拉在一片反对声中必须坚持纯视觉方案的根本原因。我相信这也是马斯克所推崇的第一性原则相关:
“我在想存在一种好的思维框架。那是物理学的东西,你知道,有点儿像第一原理推理(first principles reasoning)。总体来讲,我认为存在将事情缩减至其根本实质……你必须能够把那些问题“煮沸”才能从里面找出那些最基本的东西。 – 马斯克“
马斯克使用这种方法实现了SpaceX火箭的成本降低到只有传统火箭公司十分之一甚至百分之一的费用。而自动驾驶领域坚持纯视觉在我看来也是如此。
新一代的智能自动驾驶如果未来需要普及,那么前提必然是低成本。因为在高端高价产品中应用然后逐渐降价,这是改良性创新技术的策略。而真正能够实现颠覆和技术壁垒的破坏性创新,其本质核心必然是低成本。
使用激光雷达和最大限度使用摄像头(甚至会减少传统雷达的维度)的本身逻辑是一致的,那就是传统的传感器的识别能力无法应对完整的自动驾驶。他们尝试解决的问题都是一个:识别。更直接的来说,就是要进行自动驾驶的策略响应,前提首先是要把真实的路况引入到数字世界之中。
传统雷达的识别过程本身就是一个依赖大量标定过程的概率论问题解析。一个最简单的例子是,一个人的雷达反射大小和一个可口可乐易拉罐是一样的。而且对高度方向上的解析极差,几乎可以认为是没有,也无法识别人的肢体尺寸位置。摄像头只是作为辅助识别。也就是说雷达告诉你前面有个东西,摄像头去识别这个东西可能是什么,然后确定车辆是否要做反应或者如何做反应。位置、距离等信息都来自于雷达,但是雷达的识别很差,可视化里面就是一些大小的点线,然后需要人工标定去识别这些可能是什么。摄像头当然也需要大量的人工标定。现在4D雷达对的这种情况有很大的改善,但是点的精细度还远远不够。
激光雷达带来的识别能力是颠覆性的,以它超高精度的扫描能力将真实世界快速精确的复刻到数字世界里面,识别的难度也大大降低了,因为反射面基本就是物体真实的反射面。这听起来很完美,但是激光雷达高精度扫描的结果就是大量的数据,因为你首先要事无巨细的在数字世界真实重建显示,然后处理速度还要足够快以方便后续的识别与策略运用计算。那么最后其结果就是代价高昂的激光雷达+超级强大的处理芯片及匹配系统+本地化的策略运用。这套系统相对来说更加依赖本车的自身单车算力。所以使用这样系统的车辆必然需要巨额的硬件投入。
有人认为视觉方案就是和现在一样,只是强化了一下摄像头的作用。但是这里面有3点本质上的不同:
1-算法上贯彻的以视觉为主。
2-更加强大的摄像系统(但是成本依然远低于激光雷达方案)
3-这才是最重要的一点:机器学习和云计算。简单的摄像头背后的云端算法才是核心。
前两者听起来比较好理解,而且大家直接看Mobileye的测试视频就能惊叹与视觉方案目前能够做到的精度和效果。但是云计算是这些企业在宣传中会隐藏的,但是这才是他们的杀手锏。
在Mobileye的2020年CES的基于视觉无人驾驶视频中,测试效果就已经非常惊艳的,而且是从市区到高速公路再到市区的复杂路况纯视觉无干预。但是里面有一个拐弯,Mobileye的技术人员再后来介绍,事实上如果在那条道路上也有一辆搭载了Mobileye视觉无论驾驶系统车辆的存在,那么在当前道路上根本看不到十字路口右侧道路来车的测试车就会提前预知看不到的道路上的车辆情况。而且这个技术已经应用了。
这才是视觉方案真正可怕的地方,它的价值在云端,而不是单车算力。
Mobileye开发出来的算法,可以将视觉方案看到的情况的识别结果,纳入到一个函数之中,然后将这个函数实时的分享到云端,然后通过云端交互对同样区域的车辆提供充足的信息。也就是说,在这个路段跑过的车辆越多,当前和你一起在跑的车越多,你就可以提前甚至实时获取这个路段的所有最新信息。
单车摄像头的识别当然比不上激光雷达,但是视觉方案配合识别大幅压缩后的数据,通过机器学习和云计算辅助单车的识别效果,才是视觉方案认为在未来能够PK激光雷达方案的全部实力。
我们简化一下描述:
激光雷达方案强单车硬件和算力,而视觉方案的单车硬件投入低,核心策略基于云端,这样就可以实现车辆的硬件购买成本低,而自动驾驶功能可以通过订阅等灵活方式购买,因为主要的消耗是在云端。破坏性创新,前提必然是便宜。
激光雷达当然也可以通过云计算来提升,但是大部分是策略优化,依赖度不高,一方面的原因是处理激光雷达数据的投入已经很大了。
这就是为什么马斯克会贬低激光雷达方案,并坚持纯视觉方案。
所以在2021年中美日欧华人汽车工程协会全球联线座谈的无人驾驶专场,所有专家一致认为,无人驾驶的未来是视觉的。
但是,(转折来了),激光雷达方案依然有其生存空间,而且在中国,激光雷达更是可能在可预见的未来成为唯一可行的方案。
WHY?
因为基于视觉的方案的真正屠龙技是云端互联和大量的数据交互建模,而这种包含实际道路和真实人流视觉识别结果的数据通过企业的内部算法上传到私有企业管理的云端进行运算、存储、识别和分发,或许在美国和欧洲国家可以,但是在中国是万万不可能完全自由放开的。Mobileye以及所有视觉方案算法企业提出的所谓“函数”的目的,其本身也就是希望淡化系统需要将道路及其实时交通工具和人流信息上传的敏感度,将其弱化为“数学函数”。但是,这种话术或许在2020年之前还行得通,随着特斯拉地图信息问题、滴滴美国上市事件以及近期的俄罗斯-乌克兰冲突的大背景下,这种全国性质的方案基本上不可能通过监管部门的审查,而且还有一个数据出境监管的问题。
Mobileye目前也在尝试通过和很多中国本土主机厂合作来绕过这个限制,第一波交流的时候对于算法和服务器的策略很强势,所以基本上全崩了。然后现在和个别本土企业已经在做项目了,据说开放度还可以,但是毕竟是国外系统,未来会发生什么?谁也不知道。
来源:知乎 www.zhihu.com
作者:JackyQ
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 224 个回答,查看全部。
延伸阅读:
怎么看待特斯拉推行纯视觉方案,放弃超声波雷达?