cha

首家跟进ChatGPT的自动驾驶公司!毫末官宣DriveGPT认知大模型

  曹原 发自 副驾寺

  智能车参考|公众号AI4Auto

  ChatGPT自动驾驶版,横空出世。

  毫末智行宣布,自动驾驶认知大模型正式升级为DriveGPT,在自动驾驶模型算法方面,全面应用ChatGPT的模型和技术逻辑。

  ChatGPT更被人熟知的身份是“会聊天的AI”,底层技术传统上讲属于NLP领域。

  但NLP大模型跨界应用到视觉领域,早已有之。比如毫末智行一直提倡的Transformer大模型,最早就诞生于NLP领域。

  ChatGPT大火,甚至被比尔盖茨比喻成和互联网诞生一样重要。而一向追逐前沿AI应用的毫末智行,如何把ChatGPT用在自动驾驶上?

  从ChatGPT到DriveGPT

  毫末智行的自动驾驶认知大模型(人驾自监督认知大模型),正式升级为DriveGPT。

  稍微解释一下,毫末的自动驾驶认知大模型采用的是RLHF(人类反馈强化技术)算法,通过不断输入真实人驾接管数据,持续优化自动驾驶决策模型。

  也就是说,毫末的这个模型在不断学习千千万万个老司机的驾驶经验,进而帮助模型自己能独立做出最优决策。

  而ChatGPT之所以能成为“很会聊天的AI”,也是因为训练的时候使用了RLHF算法,利用人类知识,让模型能判断自己的答案质量,训练自己逐步给出更高质量的回答。

  目前,毫末智行已经完成DriveGPT的模型搭建和第一阶段数据跑通,现在的参数规模可以对标GPT-2的水平,大约7.74亿。

  ChatGPT的爆火也不过是这几个月的事情,而毫末现在已经有了能落地的进展。

  这样的速度背后,其实是AI技术向超大规模数据、超大规模模型演变的大趋势。

  毫末智行的自动驾驶模型中,其实早就应用了和ChatGPT相同的模块。

  毫末智行的认知决策算法

  先看看毫末怎么迭代认知决策算法的。

  毫末这套认知决策算法进化分为三个阶段:

  第一个阶段,引入个别场景的端到端的模仿学习,直接拟合人驾行为;

  第二个阶段,通过认知大模型,引入海量正常人驾数据,通过Prompt的方式实现认知决策的可控、可解释;

  第三个阶段,也就是毫末认知决策算法现在处于的阶段,引入真实接管数据,并在大模型中开始使用RLHF算法,让模型学习人驾接管数据。

  这其中第三个阶段,就是和ChatGPT训练逻辑类似的阶段,也是能引入这套模式的阶段。

  也就是说,当毫末认知决策算法通过拟合、学习人驾数据,具有一定的驾驶决策能力后,毫末构建了一套奖励规则(即奖励模型,reward model)。

  在同一个驾驶环境下,如果人类驾驶行为和算法决策一致,不选择接管,计为一个good case;如果人类司机接管了,就计为一个bad case。

  通过把good case和bad case这种“好坏”的价值判断模型引入算法训练,能够进一步让算法做出更好的驾驶决策。

  目前,毫末智行DriveGPT已经进入算法进化的第二个阶段,接下来就是第三阶段:输入大规模真实接管数据,让模型强化学习人驾数据反馈。

  并且,毫末还会把DriveGPT作为云端测评模型,评估车端小模型的驾驶效果。

  关于DriveGPT更多重要进展,4月HAOMO AI Day上毫末会进一步公布。

  而毫末智行能实现这些目标,离不开背后强大的算力支持。

  为什么是毫末智行

  毫末在国内应该第一个明确提出自动驾驶重感知轻地图的技术路线。

  去年行业的发展验证了毫末的先见之明。

  ADAS系统尽量减少高精地图信息的依赖,自然就要求车端的感知识别能力更强大。

  在研发端来说,迭代这样的大模型,需要更大的算力来支撑。

  今年1月,在毫末举办的AI Day上,这个自动驾驶量产公司宣布自建智算中心MANA OASIS。

  通过和字节跳动旗下火山引擎的合作,MANA OASIS算力可达0.67 EFLOPS(每秒6.7x1017次浮点运算)。

  智算中心不仅算力几乎全部为自动驾驶服务,架构也根据自动驾驶的业务特性做出调整,计算、存储和通信都具有很强的基础能力。

  并且,毫末MANA OASIS还支持千亿参数的AI大模型的完整训练,收敛周期效率得到大大提升。

  在AI Day上毫末还宣布了五大模型,除了上文提到的自动驾驶认知大模型(现在叫DriveGPT),还有视频自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型,从数据、目标识别准确率、路径预测规划、整体乘坐体验等多个角度共同提升毫末自动驾驶能力。

  毫末自建超算,从技术层面解释了为何它能成为第一个真正把ChatGPT相关技术真正在自动驾驶领域应用的玩家。

  而从公司整体策略上,支撑毫末在研发端进展迅速的条件,是它以自动驾驶量产上车为核心目标的整体战略,以及背后长城汽车每年百万销量的落地规模支持。

  毕竟无论是NLP还是自动驾驶,不断获取大规模低成本的数据获取渠道,才是一切的基础。

  说了这么多,毫末智行的技术,体现在乘用车上了吗?

  毫末NOH,已经量产上车。

  今年毫末智行的目标是实现城市NOH大规模量产上车,即在城市内实现能自动识别红绿灯、人车混行场景,大部分时间不用人类驾驶的高阶智能驾驶功能。

  在明年,毫末城市NOH预计会在国内100个城市落地。


您可能还会对下面的文章感兴趣:

登录 注册 退出