如何评价余承东认为特斯拉FSD上限很高,下限很低的说法?余承东对FSD这个评价,

在迷雾的丧失啊 2024-08-10 04:50:29

如何评价余承东认为特斯拉FSD上限很高,下限很低的说法?

余承东对FSD这个评价,算是对目前端到端OneModel方向的标准行业认识。

上限很高讲的是端到端的方案能够解决大量现在rulebase的问题。

在华为ADS2.0的时代,大家做智能驾驶主要是靠纯粹的手搓规则。

比如你从1万条规则增加到10万条规则,你会感觉汽车的智能驾驶能力提升了40%,从智障变成能用了。

从10万条增加到50万条,你会感觉又提升了30%,从能用变成了还可以。

从50万条增加到100万条,你感觉提升了20%,有些比较刁钻的场景也可以解决了。

这时候问题就来了,如果rulebase还要再继续提升的话,就需要把100万条规则增加到200万条,这次提升的幅度可能就只有10%了。

然而我们肉眼可见的,人力会再次翻一倍,而且你的投入越大,收益会越小。

另外你从系统的复杂性来说,当规则越来越多的时候,它理论上确实是会更安全,但是它也会变得更加不可解释,当出现问题的时候,会越来越难解决。

所以我们看ADS2.0时代下,大家跟随特斯拉用BEV空间方案,解决的是95%的常见问题,大家会感觉智驾的进步突飞猛进。

这就相当于所有人都还在解决吃不吃的饱的问题,你突然让大家都能每顿饭吃得上肉,大家的体验就很好。

然而到了端到端的时代,这个路线主要解决的是开发工程的问题。

相当于大家吃的还是猪肉,但是你这次给吃的是粮食猪了。

但问题也在这里,就是大家还是在一个更关注吃饱的方面,你提供一个吃好的选择,体验提升不是很大。

端到端的好处在于,它直接从传感器输出到模块,不用先处理一个空间出来,让模块在空间里理解。

同时数据直接到模型,模型可以直接理解原始数据,这就有一个模型自训练学习的基础。

而且我们熟悉的训练大模型的方法,也都可以用到车载模型上。

你比如蒸馏模型,用更好的数据去喂。

像华为有一篇智驾论文就介绍了,怎么用激光雷达的数据当老师,去教育同平台的视觉方案,让视觉方案的体验更好地接近于激光雷达方案。

这就是工程上的一种优点,它大大提高了复用率通用性,不再是每个平台都要手搓海量的规则。

但这个方法也不是完美的。

纯粹的OneModel端到端,世界模型是会赋予它理解场景前所未有的能力,但是大模型有的通病,他也全都有。

简而言之,onemodel会经常理解岔,而且做出车主完全无法理解的操作。

因为之前的智能驾驶架构里面,传感器到BEV之后,有认路的模组,有预测动作的模组,有负责安全的模组等等,每一块都是各干各的,而且有优先级的排序。

onemodel是把判断都丢给一个模型,直出结果。

好处就是快,结构简洁,可以不断训练,升级也快,天花板也很高,不用养一个很大的智驾研发团队——你也可以看到其实都是对车厂的好处。

而问题就是,大模型幻觉的问题无法解决,它时不时会抽风。

这个也就是余承东所说的,下限很低,就是这么一个问题很难解决。

所以在onemodel的路径下,现在大家搞得是串联端到端,我们看华为发布会上ADS3.0的架构图里面,也把安全模块大大放大了。

这里面主要做的工作就是把BEV空间去掉了,所以提到了信息无损传输和决策速度快一倍。

理解起来很简单,就是识别特征的工作直接从传感器原数据识别了,不用在处理好的BEV空间里识别。

现在端到端的技术路线还刚刚开始,如果智驾要真的更大范围普及,有更强大的体验,那肯定是要上大模型的,靠人力手搓规则,现在已经摸到天花板了。

所以特斯拉在技术上确实有前瞻性,但主要也是有名,而且敢于上新技术。

实际上端到端在学术界几年前就关注到了,国内智驾供应商也是两三年前就开始做预研了,很早大家就意识到了这个问题。

现在的问题是,智驾做得好的厂商,上端到端反而是循序渐进的,在规则安全的基础上做。

而有些智驾做得不好的国内厂商,一来就硬上,既没有算力群,也没有积累,更没有对臭搞技术的敬畏,直接宣称要做onemodel。

大家可以看到,我对智驾就是非常激进的改革派了,但是对于直接研发半年硬上onemodel的厂商,我只能说四个字。

谋财害命。

0 阅读:111
在迷雾的丧失啊

在迷雾的丧失啊

感谢大家的关注