“用嘴开车”特斯拉的fsd是怎么把语音控制塞进fsd里的?

嘿,你听说没,理想又给特斯拉上了一课!埃隆·马斯克,也就是特斯拉的老总,前两天在社交媒体上放话了,FSD马上要上线语音指令功能。这下好了,驾驶员以后给车下个指令就能自己停车、变道啥的,简直就是“用嘴开车”。这功能听起来挺酷,但咱们理想的老车主估计要乐开花了。理想这边早就领先了,去年上线的VLA大模型早就把这些搞通了,超车、靠边停车这些事儿全都是靠语音控制的。 不过这也让我有点好奇,特斯拉到底是怎么把语音控制塞进FSD里的?毕竟大家都知道特斯拉的FSD是端到端模型。这种架构的话,搞语音理解肯定不容易。国内很多类似的方案都是给端到端模型外挂了一个像VLM那样的大脑来解决问题。那马斯克是不是也这么干的?反正不管咋说,“用嘴开车”这事儿听起来就挺带劲的。咱们就等着看这次特斯拉的实际表现怎么样吧。