虽然沈抖在3月27日提到,2026年博鳌亚洲论坛期间大家对具身智能、未来机器人格外关注,但要想实现应用落地,还得先解决“本体”“数据”“模型”这三个关键难题。作为百度集团执行副总裁,他在3月25日的演讲中承认,虽然中国具备完整的供应链体系、工程师红利还有全球领先的成本控制能力,但目前具身智能领域的投入相比大语言模型差距太大。他预测,等到VLA大模型实现规模化量产,成本会大幅下降,甚至可能按Token来收费。 沈抖表示,真正的困难在于不仅要造出机器,还要让它能感知环境、理解任务并完成动作。基于这种认识,他觉得工业场景比家庭场景更适合标准化落地。他认为关键在于突破本体量产、数据收集和模型训练这三道关,而这都离不开强大的AI全栈基础设施支持。现场展示的电力具身智能联合实验室,正是由北京人形机器人创新中心与中国电科院合作建立,利用了百度智能云的AI Infra去训练北京人形的VLA大模型。 这次论坛上,杨昕华记者注意到,百度智能云数字人ViviDora作为特邀嘉宾发言。据悉,这个由客悦团队打造的ViviDora使用了慧播星技术,基于领先的AI全栈基础设施研发而成,能够提供完全拟真的实时交互与真实反馈。上游新闻的报道显示,这次年会的各项活动于3月27日落下帷幕。