游戏百科

Waymo 终于出了一篇博客完整阐述其 AI 应用,作为沉淀了丰富规则的老牌、大

Waymo 终于出了一篇博客完整阐述其 AI 应用,作为沉淀了丰富规则的老牌、大佬级 Robotaxi 玩家,Waymo 系统的 AI 化也很有趣,符合预期。Waymo 对比同期的大部分 Robotaxi 玩家,属于在 AI 上走得非常快的,对比特斯拉 FSD,是一个保守派。Waymo 基于自己的基础模型 Waymo Foundation Model 开发了部署在车上的自动驾驶模型 Waymo Driver、让 Waymo Driver 跑在里面以进行训练的闭环的、逼真的仿真模型 Simulator,以及一个苛刻的评估模型 Critic。Waymo Foundation Model 是一个世界模型,但不是纯粹的端到端,当然也不会是过去的模块化系统。简单理解,这是一个分段式端到端,试图融合吸收端到端和模块化的优势。这个模型在训练过程中支持完整的端到端信号反向传播,说明模型内的模块和模块之间是通过向量传播的,可以全局训练优化。但 Waymo 要求模型输出对象、语义属性、道路属性等结构化信息,这是为什么?- 当 Driver 模型开错了,可以通过这些结构化信息准确判断模型错在哪了。方便安全验证。-仿真模型 Simulator 在生成仿真环境信息的时候,可以高效、符合物理规律且大规模的闭环仿真。- 评估模型 Critic 和强化学习通过这些结构化信息,可以设计一个清晰的奖励信号,让模型学习目标非常明确,性能更快的收敛。Waymo Foundation Model 的输入有系统一和系统二两个部分,系统一对应快思考,输入多传感器融合的信息,系统二是一个 VLM 模型,Waymo 用了 Gemini 模型训练这个 VLM 模型,以理解现实世界中罕见、新鲜或包含复杂语义信息的场景。系统一和系统二的输出都会给到下游,下游的世界模型再输出预测、高精地图、本车轨迹等信息。最后,Waymo 也会用大模型蒸馏小模型,但这里的细节在于,Waymo 连云端的仿真模型 Simulator,也是蒸馏而来的,可见基础模型的参数量规模应该是非常庞大的。另外,由于传感器路线原因,Waymo 的仿真模型 Simulator 还可以生成非常逼真的 LiDAR 点云。最后,Waymo 的一句话非常微妙:庞大的全自动驾驶(指主驾无人)经验是无可替代的。任何仿真、手动驾驶数据采集或测试员操作都无法复制 Waymo Driver 在全自动驾驶时遇到的各种状况和反应。全自动驾驶经验是否如此的不可替代?我觉得也未必。Waymo 这句话是一次性扫射了特斯拉、所有高阶 ADAS 玩家及所有 Robotaxi 玩家,因为在全自动驾驶里程这个指标上,目前没有人比他们更高。