Waymo近日宣布了一项创新成果——基于谷歌多模态大语言模型(MLLM)Gemini的“端到端多模态自动驾驶模型”(EMMA)。该模型旨在通过模拟人类的思维方式,提升无人驾驶车辆在复杂环境中的导航和决策能力。
据Waymo介绍,传统的自动驾驶系统设计往往采用模块化方法,虽然在一定程度上取得了成功,但在扩展性和新环境适应性方面仍有待提升。为了克服这些挑战,Waymo引入了Gemini大语言模型,利用其强大的推理能力和丰富的世界知识,打造了一个更加智能和灵活的自动驾驶系统。
然而,EMMA模型在实际应用中仍面临一些技术难题。由于计算开销过大,该模型目前无法整合来自激光雷达或雷达的3D传感器输入,只能处理有限数量的图像帧。此外,研究团队还指出,Gemini等MLLM模型可能会产生“幻觉”,这对无人驾驶汽车的安全性构成了潜在威胁。因此,在EMMA模型能够广泛应用之前,还需要进行更多的研究和优化。
以上就是Waymo发布EMMA自动驾驶模型,探索多模态大语言模型在自动驾驶领域的应用的全部内容了,ll22手游网精心打造,旨在为您呈现一个满载精彩纷呈资讯的宝库,全球前沿资讯、深度剖析行业动态、汇聚热门话题与独特视角,力求为您带来一场场知识与娱乐并重的盛宴。