1

让数据标注和训练降本又增效,特斯拉、毫末智行“去了人工、加了智能”-品玩

 1 year ago
source link: https://www.pingwest.com/w/265851
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

让数据标注和训练降本又增效,特斯拉、毫末智行“去了人工、加了智能”-品玩

让数据标注和训练降本又增效,特斯拉、毫末智行“去了人工、加了智能”

15分钟前

众所周知,自动驾驶技术的进步离不开大规模路测数据。而评价路测数据质量高低的维度有三个,一个是数据的规模,一个是数据的精度,一个是数据的广度。

对于“自动驾驶何时能真正实现”,业内一直引述这样一组数据。根据美国兰德公司的研究,自动驾驶汽车需要在真实或者虚拟环境中至少进行110亿英里(177亿公里)的里程测试,才能证明自动驾驶系统比人类驾驶员更可靠。

article-body

用兰德公司自己的估算,假设由100辆车组成的车队,每年365天每天24小时不间歇以28英里每小时的平均速度进行测试,大概需要500年。

别说普通人等不了那么久,信奉长期主义的投资人都熬不到。那么自动驾驶还能不能搞了?

答案是可以。解决方案也是从路测数据的三个维度中找。

对于数据的规模,既然需要数十甚至上百亿公里,就不要仅仅指望几十台上百台测试车了。特斯拉显然找到了解法,那就是从量产上路的乘用车里挖掘数据的金矿。

据特斯拉披露,在2020年初,特斯拉辅助驾驶的累计行驶里程就已经超过了48亿公里,而特斯拉的自动驾驶能力也有着显著的提高。带头大哥的成果让走渐进式量产辅助驾驶路线的国内玩家看到了光明的前途。

再看数据的精度和广度,这就要提到标注和训练了。基于深度学习算法的自动驾驶,必然绕不过数据的标注和训练,数据标注的精度决定了算法的准确率,训练的广度决定了算法的适应性和鲁棒性。但同时,数据标注和训练又是自动驾驶技术研发中成本最高的两个“吞金兽”。

也就是说,自动驾驶的成熟不仅仅是一个数量问题,更是一个质量问题和成本问题。标注和训练的成本问题的解决,决定了自动驾驶技术能不能早日走进大众的日常生活。

数据标注的成本贵在哪里?答案是人工。要不业内都在调侃“人工智能是有多少智能里面,就有多少人工”。那么,有没有解决方案呢?有。那就是用“智能”替代“人工”,让标注自动化。这也印证了那句,只有魔法才能打败魔法,解决AI难题的还是要靠AI。

article-body

数据训练的成本贵在哪里?答案就是实际路测。车要喝油,人要休息,路测成本几乎成为压倒Waymo这只骆驼的稻草。那么,有没有解决方案呢?有。那就是仿真。

再仔细审题,兰德公司报告里也提到177亿公里的数据也可以通过仿真训练来得到。

至此,我们知道,想要自动驾驶早日实现,就得获得大规模的、有精度的、有广泛场景的好数据。那要真正实现,还得把数据标注和训练的成本降下来。

问题来了。到底怎么“降本增效”呢?

这里不得不提到以特斯拉、毫末智行为代表的头部自动驾驶企业。我们通过这两家公开的解决方案来看下降服自动驾驶这两只“吞金兽”的关键在哪里?

标注与训练:加速自动驾驶技术的关键

标注与训练,对于自动驾驶的重要性,必须要再多说一点。

基于自动驾驶第一性原理可知,自动驾驶本质上是对人类驾驶的学习与模仿,而标注与训练之于自动驾驶,就相当于从新手到老司机,驾驶者对道路环境的逐步熟悉与理解。

新手上路,在排除各类电子产品的辅助外,首先需要学会认路,包括各类交通标志、车道线;在此基础上,也需要学会认人,包括参与到交通中的各类人与车辆。

而标注工作,就是让自动驾驶学会认路与认人,并在各种环境的综合影响下,做到对周边的所有交通参与者认得清、认得准,为算法决策提供精确的信息参考。

article-body

对比标注,训练的工作就非常简单易懂了。新手需要经历各种环境与路况的洗礼,由此总结经验,逐步蜕变至老手;训练工作则会让自动驾驶复刻这一过程,以提升泛化性。

唯一的问题在于,在人类驾驶的过程中,标注与训练的工作是非常缓慢的,驾驶者可能在一年之内就能掌握要领,也可能需要花费好几年才能摸清诀窍;自动驾驶若要复刻这一过程,就需要投入大量成本,并且要求时间越短,投入成本就越高。

显而易见,单靠人力堆叠是不可能实现这一目标的,所以自动驾驶想要快速落地快速成熟,必须为标注与训练降本增效。

标注是自动驾驶最高的成本来源。以往自动驾驶企业的大量标注工作都是由人力完成,标注效率低、成本高,很难对海量数据做到高效标注。若要降低标注成本,引入自动标注能力是必然的。

另一个则是训练。以往自动驾驶的训练工作都是在真实场景中进行,但就如同人类无法掌控自然一样,驾驶环境的变量也是自动驾驶企业无法掌握的。

article-body

举一个简单的例子,如果某自动驾驶企业想要在春天训练并验证一套适用于我国路况的冬季冰雪环境下的自动驾驶算法该怎么办?

这种独特的天气环境是很难在真实场景中遇到的,而即使遇到,也很难保证其变量是否将影响到训练效果,而如果能为算法模型搭建仿真系统进行训练,将极大提升训练效率。

一句话总结,标注与训练成本决定了自动驾驶技术的迭代速度,谁能够有效降低标注与训练成本,谁就能更快实现自动驾驶技术的迭代。

特斯拉:用AI学习人类的逻辑,然后替换人类

和所有自动驾驶企业一样,特斯拉的标注工作在开始阶段也是由人力完成的,但在车辆行驶数据规模快速膨胀后,人工标注在面对海量数据时的无力也被无限放大。

由此,特斯拉将自动标注能力引入了自动驾驶技术中,并根据各自优势与人工标注进行任务分配,在大幅降低人工标注成本的同时,提升整体标注效率。

article-body

对于静态标注物,特斯拉会基于摄像头反馈的图像信息,给出这一场景的三维点预测估值,首先将其映射到摄像头中,在与真实场景进行结果对比后,再将其进行跨时空维度的优化与重建。

而其它车辆在经过这一场景时,同样的数据也将经过标注系统进行融合和优化,既提升精度,也提升鲜度。对于动态标注物,特斯拉会标注到物体具有时序性的标注单元,由此计算其运动轨迹和各项参数,给出车辆的应对策略。

article-body

不难看出,特斯拉的自动标注逻辑实际是对人类思维的复刻,而这一逻辑也正是基于马斯克对第一性原理的深度思考得来。

在人类的世界中,人类可以依据既往经验,凭肉眼快速对所见事物得出其位置、尺寸、质量的粗估值,再通过测量进行验证,对自己的肉眼评估能力进行修正。

而特斯拉则根据算法,由视觉感知得到的图像信息快速给到三维点估值,再反馈至图像中进行验证。由此,只需要自动标注,特斯拉就能以终端为单元高效运行标注模型,云端也能将海量数据进行快速融合优化,效率比人工标注有了极大提升。

与标注逻辑相同,特斯拉也把第一性原理带到了训练领域,但不同于“实践出真知”,特斯拉希望通过“冥想”降低训练成本。

article-body

之前提到,真实场景包含很多变量,其中部分特殊场景不仅可遇不可求,在依靠真实车队训练的模式下,更需要多次重复训练才能给到最佳的训练结果。

由此,特斯拉建立了一套能够模仿感知系统视角下的仿真世界,这有些类似于人类的赛车游戏,但其能够精确模仿多种复杂场景与变量,并且进行重复多次训练,直到算法模型打磨成熟。

在仿真系统中,特斯拉不仅可以对算法模型进行多种场景与变量下的重复训练,也可以将一些失败驾驶数据的场景复原、并通过复盘来分析其失败原因,以进一步优化算法。由此特斯拉自动驾驶技术得以实现快速迭代,并成为当前商业化最成功的自动驾驶企业。

毫末智行:以数据驱动,让标注与仿真训练又快又省

毫末智行CEO顾维灏曾在2021 HAOMO AI DAY表示,数据智能是毫末智行自动驾驶的核心,而这一核心也对毫末智行的标注能力带来了强大的驱动作用。

和特斯拉一样,毫末智行也引入了自动标注能力,但不同于特斯拉的标注逻辑,毫末智行通过对感知物体进行物体的追踪与运动属性检测,并加入时序信息,由此获得4D点云标注信息。

article-body

基于这一自动标注能力,毫末智行首先能够将动态标注物与静态标注物区分开来,但如果要对动态标注物的运动逻辑进行更精确的判断,就需要更稠密的点云信息。

对此毫末智行的做法是,其可以将当前已收集到的多维度、多角度的点云信息进行压缩,在提升现有点云稠密度的同时,再去进行物体检测,获得更精确的点云标注信息。

如果说特斯拉的标注逻辑是像人一样去“先猜后验”,那么毫末智行就是做数学题式的“画图求解”,密集的4D点云信息能够大大提升整个自动驾驶世界的精度,这符合其数据是自动驾驶的核心的想法。

最重要的是,这能够让毫末智行的标注成本降低80%,并且大幅提升标注效率。

article-body

在引入自动标注实现标注能力的“降本增效”后,毫末智行还需要针对训练能力进行优化,在数据智能体系MANA中,这一部分被称之为验证能力。

在现实场景中,受各类感知硬件性能参数与安装位置影响,自动驾驶感知系统在实际工作中会受到场景中各种因素影响,例如摄像头出现光斑、激光雷达被泥沙遮挡等。

另一方面,各类极端场景与变量对自动驾驶算法模型泛化性的威胁依旧存在,想要保证自动驾驶技术的成熟,毫末智行也需要对这类场景与变量进行验证。

对此,毫末智行也搭建了一套能够模仿感知系统视角下的仿真体系,通过重现各种场景,对算法模型进行训练和验证,使很多在真实场景中需要至少1年的验证工作,在不到1秒的时间内就能完成。

仿真系统虽然能提升验证效率,但随之到来的问题还有对更高算力性能的要求。

article-body

据2022 HAOMO AI DAY的信息,毫末智行选择与阿里云PAI-EFLOPS团队合作,基于128卡A100集群,进行Swin Transformer模型分布式训练,提升训练效率。

另一方面,毫末智行还通过与阿里合作实现了混合精度优化、算子优化、编译优化,在实现模型训练成本降低超过60%的同时,加速比超过了96%,让“快”和“省”同时实现。

为加速自动驾驶系统的进化,毫末智行未来将借助云计算和超算中心的超高算力优势,把虚拟测试优化得更顺畅、更真实,以保证验证与训练效果快速有效。

用魔法打败魔法,用AI搞定AI

总的来看,特斯拉与毫末智行在“降本增效”方面的想法是英雄所见略同的,那就是“学会放手”,通过赋予自动驾驶更多“智能”,使其学会自己跑步,由此解放人力,实现降本增效。

俗话说,只有用魔法才能打败魔法,那么搞定自动驾驶这道AI难题的,也只有用AI技术本身了。

具体来看,首先以引入自动标注能力,实现海量数据下标注速度的提升与人工成本的降低,并通过人工+自动标注协同的方式发挥各自优势,进一步保证标注效率与质量。

而在训练方面,二者都为自己打造了一套用于训练与验证算法模型的仿真系统,并通过对应系统的算力、算法优化,进一步提升训练效率,保证仿真系统的高效运行。

通过在标注与训练方面的升级改进,特斯拉与毫末智行分别成为了国内外自动驾驶研发落地进度最快的自动驾驶企业,但面对当前的城市场景,自动驾驶还无法做到完全安全这一前提,所以自动驾驶何时突破L2至L3,还需要再等待一会。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK