华为选了WEWA WEWA到底比VLA难在哪、强在哪
- 汽车资讯
- 17小时前
- 13热度
把自动驾驶拆成两条路:一条叫 VLA,靠大模型“背网课”;另一条叫 WEWA(World-Experience-With-Action),靠车自己“长脑子”。华为选了后者。到底 WEWA 比 VLA 难在哪、强在哪?用三句话、两个场景、一张图,给你一次讲透。
一、VLA 像“学霸刷题”,WEWA 像“老司机上路”
VLA 路线把互联网图文全部喂给大模型,让它先学会“红灯停、绿灯行”,再把文字答案翻译成驾驶动作。优点是见效快,缺点是“纸上谈兵”——遇到从没见过的异形车、施工锥桶,就可能“蒙圈”。
WEWA 不走这条路。它让车辆像人类老司机一样,先“看”世界(World),再“体验”物理规律(Experience),最后直接输出“动作”(With-Action)。不用文字做中间商,减少一步,出错概率就少一步。
WEWA 不走这条路。它让车辆像人类老司机一样,先“看”世界(World),再“体验”物理规律(Experience),最后直接输出“动作”(With-Action)。不用文字做中间商,减少一步,出错概率就少一步。
二、WEWA 的“三件套”
-
世界模型 World Model
用激光雷达+摄像头实时构建 3D 语义网格,把道路、行人、车辆都变成带物理属性的“乐高积木”。每块积木都有速度、质量、摩擦系数,系统能预测 3-5 秒后的世界长什么样。 -
体验引擎 Experience Engine
一圈圈跑出来的数据不再只是“图片”,而是带“体感”的轨迹。比如同一弯道的 1000 次过弯,系统会记录轮胎打滑角度、悬架压缩量、纵向加速度,形成“肌肉记忆”。 -
动作原子 Action Atoms
把油门、刹车、转向拆成 256 个“原子动作”,系统直接在这些原子里搜索最优组合,不再用语言描述“减速 30%”,而是直接给出“刹车 0.8 bar、方向-5°”。
三、两个日常场景,看懂差异
场景 A:暴雨+反光地面
VLA 可能因训练数据不足,误判水面为“坑洼”;WEWA 的世界模型直接测出摩擦系数 0.25,体验引擎调出雨天过弯数据,动作原子提前 0.3 秒轻刹,车辆稳稳通过。
场景 B:施工路段临时改道
VLA 若没见过“红色水马+箭头灯”组合,需要云端下发新模型;WEWA 把水马当“质量 20 kg、高度 0.8 m”的障碍物,直接绕行,无需联网。
VLA 可能因训练数据不足,误判水面为“坑洼”;WEWA 的世界模型直接测出摩擦系数 0.25,体验引擎调出雨天过弯数据,动作原子提前 0.3 秒轻刹,车辆稳稳通过。
场景 B:施工路段临时改道
VLA 若没见过“红色水马+箭头灯”组合,需要云端下发新模型;WEWA 把水马当“质量 20 kg、高度 0.8 m”的障碍物,直接绕行,无需联网。

四、为什么 WEWA 难做
数据:需要带“物理标签”的实车数据,比纯图片贵 10 倍;
算力:3D 网格每帧 1000 万点云,实时推理需 1000 TOPS;
验证:一次 OTA 更新要跑 500 万公里真实路测,成本陡增。
华为给出的答案是:自研 800 TOPS 昇腾芯片 + 自建 600 PFLOPS 超算中心 + 每天 100 万公里的车队数据采集,把“难”拆成“可落地”。
算力:3D 网格每帧 1000 万点云,实时推理需 1000 TOPS;
验证:一次 OTA 更新要跑 500 万公里真实路测,成本陡增。
华为给出的答案是:自研 800 TOPS 昇腾芯片 + 自建 600 PFLOPS 超算中心 + 每天 100 万公里的车队数据采集,把“难”拆成“可落地”。
五、用户能得到什么
城区 NOA 不再“画大饼”,异形障碍物一次学会;无高精地图也能开,OTA 频率降到季度级,稳定性提升;极端天气接管次数预计下降 40%,长途自驾更安心。
总之,VLA 让车先“看懂文字”再开车,WEWA 让车直接“看懂世界”再开车。前者像背题库,后者像长脑子;前者快,后者稳。华为押注 WEWA,就是押注自动驾驶的“老司机灵魂”。