如果特斯拉制造相机的梦想像激光雷达一样真正实现

ZzeyeeU.jpg!web 3i2Ane2.jpg!web 这张来自伪激光雷达论文的图片显示了旧的黄色实点云

作者 | Brad Templeton

译者 | 天道酬勤，责编 | Carol

特斯拉 CEO 埃隆·马斯克（Elon Musk）对自动驾驶激光雷达（3D图像技术）的看法是众所周知的。他不打算在特斯拉里使用这个技术。TSLA （https://www.forbes.com/companies/tesla/#6aa1b19848d4） 这是一个有争议的观点，只有历史才能证明他们在这场赌局中做的好不好。

特斯拉推广的一种方法有时称为伪或虚拟激光雷达。这涉及到构建工具来拍摄摄像机图像（立体或常规），并计算出图像中每个像素的距离。激光雷达实际上是通过计时光脉冲击到达像素并以光速返回所需的时间来计算出到每个像素的距离。另一方面，人类利用我们的大脑来估计距离。我们知道物体有多大，它们如何运动，这让我们知道它们离我们有多远。我们还使用其他一些技巧，例如由于两只眼睛而产生的立体视觉，但只能适用于中等距离。另一个好技巧是“运动视差”，你可以跟踪事物在背景和其他事物下的运动方式，这会给你提供其他线索。

这是好事，人类的大脑可以胜任这项任务——事实上，你可以在开车的时候闭上一只眼睛来完成这项任务。人们正尝试利用神经网络来建立机器学习技术，来计算出与图像的距离。这是一个虚拟激光雷达。

训练虚拟激光雷达比训练许多神经网络要容易得多。正常情况下，训练需要你提供许多训练图像，而人类要努力计算出真实的距离。由于测试车上可能装有真正昂贵的激光雷达，因此你可以四处行驶来获得与从激光雷达中学到的“地面真实”距离数据相结合的训练数据。你向神经网络展示大量由激光雷达计算出真实距离的图像，并且它擅长于自行计算距离。这种技术是无监督学习的一种变体，因为你不需要人工标记，它比有监督学习便宜得多，因此，如果神经网络有什么东西可以做得很好，那就应该是这个。你还可以训练模拟器数据来改善模型。

另一种有用的训练技术是，根据现实世界中的物体以可预测的方式改变距离这一事实。当你看到一个物体沿着物理学允许的路径移动时，你的估计很可能是正确的。如果你看到物体以不可能的方式在太空中跳跃，你就会知道它们是错误的。

他们做得很好。神经网络的一个问题是它们倾向于观察单帧图像，而不是像人类那样看运动图像。实际上，人类在静止图像上会犯很多错误。随着时间的流逝，机器学习技术可能会超越这一点。问题是我们必须“拿你的生命做赌注”。你还需要对从未见过的事物进行处理，这可能会挑战神经网络。

例如，在前方道路的车道上停下了一些不寻常的东西。你需要知道它有多远，并且需要非常可靠地很快找到它。如果是一辆汽车，你会知道车有多大，所以你知道它有多远。同理，一辆汽车在侧身旋转（对于人类而言），但是训练数据库可能从未见过这种情况。对于一个随机物体，你想知道，它是一个远处的大物体还是一个附近的小物体？唯一的方法就是看它与道路几何形状的关系，这是更复杂的。

如果有人做到这一点，他们将拥有一种工具，可以拍摄相机图像，并产生激光雷达产生的3D“点云”，而且由于相机价格更便宜，因此可以以更低的成本进行生产。他们也可能在很长的距离内做到这一点。许多激光雷达只能看到约120m，花式的看240m。众所周知，人类会理解他们在一英里以外看到的东西。

具有讽刺意味的是，致力于激光雷达的开发人员已经建立了依赖于这些点云的系统，并花费了大量时间对其进行完善。如果一个伪LIDAR系统突然变得可用于产生质量点云，则他们可以立即使用它。那些一直希望使用伪激光雷达的人，在使用这种形式的数据方面不会有相同的经验。相反，他们将计划将其视觉系统的其他元素（将图像分割为不同的对象，并对它们进行分类）与距离估计结合在一起。他们可能没有能力利用他们一直希望的突破。

另一方面，使用公司的激光雷达只会说“太好了，我们可以用便宜的东西代替昂贵的激光雷达。” 如果他们也是制造激光雷达的公司（例如福特、克鲁斯、Waymo和Aurora），他们可能会觉得自己浪费了一些钱。

很明显，你需要知道道路上所有物体的距离，必须正确计算出距离，并且你必须快速完成计算。我们已经看到特斯拉自动驾驶仪多次撞向卡车、防撞栏和前方车道上被一辆突然驶离的汽车挡住的车辆。当道路上的障碍物突然出现在你的传感器上时，你要知道该障碍物离你有多远，这样你才可以启动紧急制动。激光雷达几乎总是这样做，但计算机视觉却不是。伪激光雷达是解决该问题的一项努力——但目前，大多数其他公司计划使用激光雷达来解决这个问题，他们知道这种方法是行得通的，但他们期希望看到这种方法会变得便宜。

当然，如果特斯拉是内部解决这个问题的公司，它就不会与其他公司分享（尽管示演示活动可能会促使其他公司做同样的事情）。感知团队也可能会尝试开发一种可以来匹配距离估计和分类，而不是生成激光雷达样式的点云。这不是伪激光雷达，但如果普遍准确的话，也同样有用。

原文链接：https://www.forbes.com/sites/bradtempleton/2020/04/14/if-teslas-dream-of-making-cameras-perform-as-well-as-lidar-comes-true-it-may-help-teslas-competitors-more/?ss=ai#1b9ad0f858e8

本文为 AI 科技大本营翻译，转载请注明出处

nayQVbv.jpg!web

AJJj6n.jpg!web

Recommend

Predicting Interest Rate with Classification Models — Part 1

Object Detection in 6 steps using Detectron2

Adventures in hardware, part 2 - even lower level

这些手写代码会了吗？少年

[译]基于以太坊和USDC搭建去中心化金融系统

Kafka 是如何实现事务的？

一文学会MySQL的explain工具

图解：什么是 B+树？（汇总篇）

Lenses for Tree Traversals

数据库系统浅出-MageByte

About Joyk