首家跟进ChatGPT的自动驾驶公司！毫末官宣DriveGPT认知大模型

2023-02-17

　　曹原发自副驾寺

　　智能车参考|公众号AI4Auto

　　ChatGPT自动驾驶版，横空出世。

　　毫末智行宣布，自动驾驶认知大模型正式升级为DriveGPT，在自动驾驶模型算法方面，全面应用ChatGPT的模型和技术逻辑。

　　ChatGPT更被人熟知的身份是“会聊天的AI”，底层技术传统上讲属于NLP领域。

　　但NLP大模型跨界应用到视觉领域，早已有之。比如毫末智行一直提倡的Transformer大模型，最早就诞生于NLP领域。

　　ChatGPT大火，甚至被比尔盖茨比喻成和互联网诞生一样重要。而一向追逐前沿AI应用的毫末智行，如何把ChatGPT用在自动驾驶上？

　　从ChatGPT到DriveGPT

　　毫末智行的自动驾驶认知大模型（人驾自监督认知大模型），正式升级为DriveGPT。

　　稍微解释一下，毫末的自动驾驶认知大模型采用的是RLHF（人类反馈强化技术）算法，通过不断输入真实人驾接管数据，持续优化自动驾驶决策模型。

　　也就是说，毫末的这个模型在不断学习千千万万个老司机的驾驶经验，进而帮助模型自己能独立做出最优决策。

　　而ChatGPT之所以能成为“很会聊天的AI”，也是因为训练的时候使用了RLHF算法，利用人类知识，让模型能判断自己的答案质量，训练自己逐步给出更高质量的回答。

　　目前，毫末智行已经完成DriveGPT的模型搭建和第一阶段数据跑通，现在的参数规模可以对标GPT-2的水平，大约7.74亿。

　　ChatGPT的爆火也不过是这几个月的事情，而毫末现在已经有了能落地的进展。

　　这样的速度背后，其实是AI技术向超大规模数据、超大规模模型演变的大趋势。

　　毫末智行的自动驾驶模型中，其实早就应用了和ChatGPT相同的模块。

　　毫末智行的认知决策算法

　　先看看毫末怎么迭代认知决策算法的。

　　毫末这套认知决策算法进化分为三个阶段：

　　第一个阶段，引入个别场景的端到端的模仿学习，直接拟合人驾行为；

　　第二个阶段，通过认知大模型，引入海量正常人驾数据，通过Prompt的方式实现认知决策的可控、可解释；

　　第三个阶段，也就是毫末认知决策算法现在处于的阶段，引入真实接管数据，并在大模型中开始使用RLHF算法，让模型学习人驾接管数据。

　　这其中第三个阶段，就是和ChatGPT训练逻辑类似的阶段，也是能引入这套模式的阶段。

　　也就是说，当毫末认知决策算法通过拟合、学习人驾数据，具有一定的驾驶决策能力后，毫末构建了一套奖励规则（即奖励模型，reward model）。

　　在同一个驾驶环境下，如果人类驾驶行为和算法决策一致，不选择接管，计为一个good case；如果人类司机接管了，就计为一个bad case。

　　通过把good case和bad case这种“好坏”的价值判断模型引入算法训练，能够进一步让算法做出更好的驾驶决策。

　　目前，毫末智行DriveGPT已经进入算法进化的第二个阶段，接下来就是第三阶段：输入大规模真实接管数据，让模型强化学习人驾数据反馈。

　　并且，毫末还会把DriveGPT作为云端测评模型，评估车端小模型的驾驶效果。

　　关于DriveGPT更多重要进展，4月HAOMO AI Day上毫末会进一步公布。

　　而毫末智行能实现这些目标，离不开背后强大的算力支持。

　　为什么是毫末智行

　　毫末在国内应该第一个明确提出自动驾驶重感知轻地图的技术路线。

　　去年行业的发展验证了毫末的先见之明。

　　ADAS系统尽量减少高精地图信息的依赖，自然就要求车端的感知识别能力更强大。

　　在研发端来说，迭代这样的大模型，需要更大的算力来支撑。

　　今年1月，在毫末举办的AI Day上，这个自动驾驶量产公司宣布自建智算中心MANA OASIS。

　　通过和字节跳动旗下火山引擎的合作，MANA OASIS算力可达0.67 EFLOPS（每秒6.7x1017次浮点运算）。

　　智算中心不仅算力几乎全部为自动驾驶服务，架构也根据自动驾驶的业务特性做出调整，计算、存储和通信都具有很强的基础能力。

　　并且，毫末MANA OASIS还支持千亿参数的AI大模型的完整训练，收敛周期效率得到大大提升。

　　在AI Day上毫末还宣布了五大模型，除了上文提到的自动驾驶认知大模型（现在叫DriveGPT），还有视频自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型，从数据、目标识别准确率、路径预测规划、整体乘坐体验等多个角度共同提升毫末自动驾驶能力。

　　毫末自建超算，从技术层面解释了为何它能成为第一个真正把ChatGPT相关技术真正在自动驾驶领域应用的玩家。

　　而从公司整体策略上，支撑毫末在研发端进展迅速的条件，是它以自动驾驶量产上车为核心目标的整体战略，以及背后长城汽车每年百万销量的落地规模支持。

　　毕竟无论是NLP还是自动驾驶，不断获取大规模低成本的数据获取渠道，才是一切的基础。

　　说了这么多，毫末智行的技术，体现在乘用车上了吗？

　　毫末NOH，已经量产上车。

　　今年毫末智行的目标是实现城市NOH大规模量产上车，即在城市内实现能自动识别红绿灯、人车混行场景，大部分时间不用人类驾驶的高阶智能驾驶功能。

　　在明年，毫末城市NOH预计会在国内100个城市落地。

<<ChatGPT热潮下的元宇宙大会④｜院士讲坛共话元宇宙要走中国特色的发展道路

汤姆猫：公司并不直接拥有类ChatGPT应用程序技术>>

首家跟进ChatGPT的自动驾驶公司！毫末官宣DriveGPT认知大模型

您可能还会对下面的文章感兴趣：

随便看看