小程序
传感搜
传感圈

几个廉价摄像头就能取代激光雷达?特斯拉“虚拟激光雷达”技术再引争论

2020-05-18
关注
摘要 现在,特斯拉推崇一种称为“虚拟激光雷达”或“伪激光雷达”(pseudo-LiDAR)的技术。该技术涉及到构建工具来进行摄像头图像采集(三维立体或二维)并计算出图像中每个像素的距离信息。

  众所周知,特斯拉创始人埃隆·马斯克(Elon Musk)反对自动驾驶车辆采用激光雷达(LiDAR),他认为依赖激光雷达就像行走依赖拐杖一样,因此他从未打算在特斯拉中使用激光雷达。然而目前这个观点仍具有争议性,未来表现如何还有待时间来判定。

  现在,特斯拉推崇一种称为“虚拟激光雷达”或“伪激光雷达”(pseudo-LiDAR)的技术。该技术涉及到构建工具来进行摄像头图像采集(三维立体或二维)并计算出图像中每个像素的距离信息。而我们知道,激光雷达则是通过计算光脉冲抵达目标物体并返回所需的时间来确定与每个像素之间的距离。

  在今年2月份的Scaled Machine Learning大会上,特斯拉就分享了如何仅用几个摄像头获得传统激光雷达精度的技术。通过将视觉传感器(摄像头)收到的视觉信息进行3D渲染、用人工智能(AI)软件将车道线、交通、行人等信息与进行匹配,最终使车辆作出决策。

  那么到底什么是“虚拟激光雷达”呢?

  大家都知道的是,人类可以通过大脑来估算距离。我们知道目标物体有多大,知道它们是如何移动的,因此我们知道距离它们有多远。同时,人类还拥有一些“天赋”,如人眼的立体视觉特性,但只适用于中等距离;还有一个天赋是“运动视差”,视线在视野中横向移动时见到的物体的运动方向和速度具有差异性,这也为我们提供了判断远近的信息。

  这么看来,人的大脑就可以完全胜任估算距离这个任务了,事实上,开车时闭上一只眼睛也能够估算距离。目前,人们正在尝试通过神经网络来构建机器学习技术,从而判断与图像之间的距离。而这就解释“虚拟激光雷达”技术含义的一个很好的示例。

  

  这张来自“虚拟激光雷达”论文的图片用黄色显示了真实的点云,用粉色显示了旧技术,用蓝色显示了他们的新系统

  其实先前,早有研究人员与马斯克的想法不谋而合。2019年6月的计算机视觉和模式识别会议上,康奈尔大学的研究人员发表了“视觉深度估计的'虚拟激光雷达':弥合自动驾驶3D对象检测中的差距”,讨论了在自动驾驶汽车上使用一对廉价摄像头以3D视角观看世界的新方法,详细介绍了自动驾驶汽车的潜在突破。

  能够在三个维度上可视化并检测车辆周围的物体,对于自动驾驶汽车在与其他车辆、骑自行车的人和行人经常共用道路的世界中安全运行至关重要。作为驾驶员,每当转过头来扫描汽车周围的情况时,大脑都会立即以3D形式可视化周围环境并评估潜在危害。

  仅使用便宜的传感器仅检测自动驾驶汽车附近的物体是不够的,当它以100 km / h的速度在公路上行驶时,它需要查看前进的方向并能够制定规避危险的计划。

  这就是为什么会经常看到激光雷达(光检测和测距)系统安装在自动驾驶汽车上的原因,他们使用旋转激光扫描车辆周围环境,并生成远近物体的3D图像,从而使该软件能够分析结果并查明需要避免的事物。

  然而,激光雷达的价格昂贵,通常会在汽车的价格标签上增加价值14,000美元的零部件,并且需要将其安装在汽车顶部,以获得最佳的制高点。在我们试图最大化汽油和电动汽车的续航力的时候,激光雷达的升级给汽车的空气动力学及其性能增加了很多阻力。

  一般来说,摄像头通常被认为是劣于激光雷达的技术,因为它们通常以低角度安装在车辆保险杠附近,从而导致图像倾向于使远处的物体变形,从而使试图处理和解释数据的神经网络感到困惑。

  

  康奈尔大学研究人员在自动驾驶汽车上进行实验的截图

  但是,康奈尔大学研究人员的研究表明,通过在车辆挡风玻璃后方的两侧放置一对廉价摄像机,就可以生成立体图像,并将其转换为3D数据。由于图像是从较高的角度生成的,因此通常更接近LIDAR系统的安装位置,而且最后该摄像头在目标物体检测方面的性能已接近激光雷达。研究人员以鸟瞰图来分析摄像头捕捉到的图像,可以将目标检测准确率提升2倍,从而使立体摄像头成为激光雷达的可行替代方案,且其成本要低很多。

  训练“虚拟激光雷达”技术的两种方法

  训练“虚拟激光雷达”并不是非常困难的,但通常,训练需要提供足够多的标记图像。一辆测试车上可能装有昂贵的激光雷达,因此可以开车四处获取与激光雷达“地面真实”距离数据相结合的训练数据。通过激光雷达计算出的真实距离来显示神经网络中的大量图像,这样它就能很好地自行计算出距离。这种技术是“无监督学习”的变体,因为不需要提前对数据进行人工标记,比监督学习成本低很多,因此,如果神经网络发展得好,那就应该是这样的。同时,还可以训练模拟器数据来改善模型。

  另一种有效的训练方法是依赖于现实世界中以可预测的方式改变距离的物体。例如,当你看到物体沿着物理学允许的路径移动时,你的估算很可能是正确的。但是,如果你看到物体以不可能的运动方式在某个空间移动,你就知道那是错误的。

  神经网络的问题在于倾向于看单帧图像,而不是像人类那样看运动图像。实际上,单看静止图像,人类会出现较多错误。相信随着时间的推移,机器学习技术会克服这一点。问题是,我们必须获得高可靠性才能脱颖而出。同时还需要具有对从未见过的事物进行处理的能力,而这个能力对于神经网络技术来说将是巨大的挑战。例如,你在开车,前方道路上有一物体,你需要尽可能快速并准确地知道它离你有多远。如果该物体是汽车,你已知汽车的大小,所以能很快判断它的距离。同理,一辆汽车如果发生侧翻,但是训练数据库可能从未遇到过此类事件。对于某一随机物体,你想知道是远处的大型物体的还是附近的小型物体?唯一的方法就是看它与道路几何形状的关系。这个情况更复杂。

  

  “虚拟激光雷达”的未来是否明朗?

  如果可以解决以上问题,那么他们一定拥有一款可以捕获摄像头图像,并且也能够生成激光雷达生成的“3D点云”的工具,而且由于摄像头价格便宜,因此它的成本要低得多。同时,在远距离范围内,该工具也能够做到这一点。通常激光雷达的探测距离只有约120 m,好一点的大概能到240 m。众所周知,人类肉眼看到的距离能够达到1600 m。

  然而讽刺的是,致力于激光雷达技术的开发人员已经建立了依赖于这些点云的系统,并花费了大量时间对其进行完善。如果“虚拟激光雷达”系统可用于生成高质量点云,则人们可以立即使用它。那些一直希望使用“虚拟激光雷达”技术的人在使用这种形式的数据方面没有类似的经验。相反,他们还计划将视觉系统的其它元素(将图像分为不同的对象,并对它们进行分类)与距离估算结合在一起。但是目前来说,他们可能还没有足够的能力来实现他们期待的突破。

  另一方面,使用激光雷达的公司会说“太好了,终于可以用便宜的技术代替昂贵的激光雷达了。”但是,如果是热衷于激光雷达的厂商(如福特、Cruise、Waymo和Aurora),他们可能会觉得浪费了一大笔钱。

  很明显的一点是,你需要了解到道路上所有物体的距离,并且必须正确且快速地完成距离估算。新闻已多次报道特斯拉自动驾驶汽车撞向卡车、防护栏以及前方车道上的熄火车辆,因为这些车辆被一辆突然驶离的汽车挡住了。当道路上的障碍物突然被车上的传感器感应到时,你需要知道它距离你有多远,并且数据具有高可靠性,这样你就可以启动紧急制动。激光雷达几乎都是这样运行的,但计算机视觉却不行。“虚拟激光雷达”技术是解决该问题的关键。但目前,大多数公司还是计划使用激光雷达来解决此问题,他们知道激光雷达是有效的,而且他们希望看到它变得越来越便宜。

  作者:Brad Templeton

  自新型冠状病毒肺炎疫情爆发以来,新利18国际娱乐一直密切关注疫情进展,根据国家及地方政府的最新调控与安排,为更好的服务相关企业,在疫情期间,新利18国际娱乐免费发布企业相关文章,免费成为新利18国际娱乐认证作者,请点击认证,大家同心协力,抗击疫情,为早日打赢这场防控攻坚战贡献自己的一份力量。

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

张帅说传感

解读传感器发展趋势,洞悉传感器产业背后发展逻辑,关注企业、技术、市场、产品等。

关注

点击进入下一篇

光学相控芯片有望彻底改变自主导航

提取码
复制提取码
点击跳转至百度网盘