首家跟进ChatGPT的自动驾驶公司！毫末官宣DriveGPT认知大模型

昭慧 2023-02-17 16:06:11 来源：量子位

中国自动驾驶公司早就用了“ChatGPT”

曹原发自副驾寺

智能车参考|公众号AI4Auto

ChatGPT自动驾驶版，横空出世。

毫末智行宣布，自动驾驶认知大模型正式升级为DriveGPT，在自动驾驶模型算法方面，全面应用ChatGPT的模型和技术逻辑。

4bbf902dc3fe466e9e2f444b32158041~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=PCwrf3AFAa7d1rOlzM5LQojIaTY%3D

ChatGPT更被人熟知的身份是“会聊天的AI”，底层技术传统上讲属于NLP领域。

但NLP大模型跨界应用到视觉领域，早已有之。比如毫末智行一直提倡的Transformer大模型，最早就诞生于NLP领域。

ChatGPT大火，甚至被比尔盖茨比喻成和互联网诞生一样重要。而一向追逐前沿AI应用的毫末智行，如何把ChatGPT用在自动驾驶上？

从ChatGPT到DriveGPT

毫末智行的自动驾驶认知大模型（人驾自监督认知大模型），正式升级为DriveGPT。

稍微解释一下，毫末的自动驾驶认知大模型采用的是RLHF（人类反馈强化技术）算法，通过不断输入真实人驾接管数据，持续优化自动驾驶决策模型。

6f0bf6649cda4895b4fdccc5ecdc2c38~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=JWVHH507HoUxAtR%2B5LOP49JQETM%3D

也就是说，毫末的这个模型在不断学习千千万万个老司机的驾驶经验，进而帮助模型自己能独立做出最优决策。

而ChatGPT之所以能成为“很会聊天的AI”，也是因为训练的时候使用了RLHF算法，利用人类知识，让模型能判断自己的答案质量，训练自己逐步给出更高质量的回答。

709313ee7c334bc0bf2b69b0708b87ee~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=OTutUB9ugpF%2F0OsK1%2FsQ%2FsjXmyE%3D

目前，毫末智行已经完成DriveGPT的模型搭建和第一阶段数据跑通，现在的参数规模可以对标GPT-2的水平，大约7.74亿。

ChatGPT的爆火也不过是这几个月的事情，而毫末现在已经有了能落地的进展。

这样的速度背后，其实是AI技术向超大规模数据、超大规模模型演变的大趋势。

毫末智行的自动驾驶模型中，其实早就应用了和ChatGPT相同的模块。

毫末智行的认知决策算法

先看看毫末怎么迭代认知决策算法的。

7233101347604235aba333c32f9027bb~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=SgpLc5NAdmRL1sMr0BlJNuYSPp8%3D

毫末这套认知决策算法进化分为三个阶段：

第一个阶段，引入个别场景的端到端的模仿学习，直接拟合人驾行为；

第二个阶段，通过认知大模型，引入海量正常人驾数据，通过Prompt的方式实现认知决策的可控、可解释；

第三个阶段，也就是毫末认知决策算法现在处于的阶段，引入真实接管数据，并在大模型中开始使用RLHF算法，让模型学习人驾接管数据。

这其中第三个阶段，就是和ChatGPT训练逻辑类似的阶段，也是能引入这套模式的阶段。

也就是说，当毫末认知决策算法通过拟合、学习人驾数据，具有一定的驾驶决策能力后，毫末构建了一套奖励规则（即奖励模型，reward model）。

e82ead57684f46dc86c8b67bb0d93e73~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=Y1LVtQIJ4FRiX8npdYuWUD0PDAk%3D

在同一个驾驶环境下，如果人类驾驶行为和算法决策一致，不选择接管，计为一个good case；如果人类司机接管了，就计为一个bad case。

通过把good case和bad case这种“好坏”的价值判断模型引入算法训练，能够进一步让算法做出更好的驾驶决策。

cc52cc6307574c1cb3da3ed9470a2b22~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=Ai2tpLmhmVbMkB9YGZUTKXPABPA%3D

目前，毫末智行DriveGPT已经进入算法进化的第二个阶段，接下来就是第三阶段：输入大规模真实接管数据，让模型强化学习人驾数据反馈。

并且，毫末还会把DriveGPT作为云端测评模型，评估车端小模型的驾驶效果。

关于DriveGPT更多重要进展，4月HAOMO AI Day上毫末会进一步公布。

而毫末智行能实现这些目标，离不开背后强大的算力支持。

为什么是毫末智行

毫末在国内应该第一个明确提出自动驾驶重感知轻地图的技术路线。

去年行业的发展验证了毫末的先见之明。

ADAS系统尽量减少高精地图信息的依赖，自然就要求车端的感知识别能力更强大。

在研发端来说，迭代这样的大模型，需要更大的算力来支撑。

今年1月，在毫末举办的AI Day上，这个自动驾驶量产公司宣布自建智算中心MANA OASIS。

a6aa3346a0db4e6892c757b56273ee3a~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=ElSTXoiKR5M71HkDn3LUQWYBmjw%3D

通过和字节跳动旗下火山引擎的合作，MANA OASIS算力可达0.67 EFLOPS（每秒6.7×1017次浮点运算）。

智算中心不仅算力几乎全部为自动驾驶服务，架构也根据自动驾驶的业务特性做出调整，计算、存储和通信都具有很强的基础能力。

并且，毫末MANA OASIS还支持千亿参数的AI大模型的完整训练，收敛周期效率得到大大提升。

0322a2254dd145218614535dc8b4b732~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=LDyQSnAGtU1WTL1hKzxMNRnAwKY%3D

在AI Day上毫末还宣布了五大模型，除了上文提到的自动驾驶认知大模型（现在叫DriveGPT），还有视频自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型，从数据、目标识别准确率、路径预测规划、整体乘坐体验等多个角度共同提升毫末自动驾驶能力。

毫末自建超算，从技术层面解释了为何它能成为第一个真正把ChatGPT相关技术真正在自动驾驶领域应用的玩家。

而从公司整体策略上，支撑毫末在研发端进展迅速的条件，是它以自动驾驶量产上车为核心目标的整体战略，以及背后长城汽车每年百万销量的落地规模支持。

c7a078ddf46640389357be8fb90bb50f~tplv-obj.image?traceid=202302171553525CDB2D38DE6F883AC2CF&x-expires=2147483647&x-signature=1iIEUqFFj%2B38WXWsmqaWn9z0w%2Fk%3D

毕竟无论是NLP还是自动驾驶，不断获取大规模低成本的数据获取渠道，才是一切的基础。

说了这么多，毫末智行的技术，体现在乘用车上了吗？

毫末NOH，已经量产上车。

今年毫末智行的目标是实现城市NOH大规模量产上车，即在城市内实现能自动识别红绿灯、人车混行场景，大部分时间不用人类驾驶的高阶智能驾驶功能。

在明年，毫末城市NOH预计会在国内100个城市落地。

</div

首家跟进ChatGPT的自动驾驶公司！毫末官宣DriveGPT认知大模型

首家跟进ChatGPT的自动驾驶公司！毫末官宣DriveGPT认知大模型

从ChatGPT到DriveGPT

毫末智行的认知决策算法

为什么是毫末智行

Recommend

Penako - Convert website to mobile apps | Product Hunt

You can inject Deep Learning Anti-Aliasing (DLAA) into most DLSS-supported games...

Microsoft's GPT-powered Bing Chat will call you a liar if you try to prove it is...

Can we efficiently explain model behaviors?

SaaS for travel agencies with itineraries and payments

Decoupling deliberation from competition

Random local install woes

吴恩达给ChatGPT泼冷水/ 罗永浩谈欠薪/ 谷歌元老离职… 今日更多新鲜事在此

Snowball Analytics - Powerful portfolio tracker for modern investors | Product H...

Brainsounds - Soundboard for focus, meditation and relaxation | Product Hunt

About Joyk