宇树科技开源面向人形机器人操作的视觉语言动作大模型 推动“具身智能”能力加速落地

人形机器人产业正快速发展,但如何让机器人具备真正的物理交互能力仍是行业难题。传统视觉-语言模型虽然在图文理解上表现良好,但在实际操作中常因缺乏物理常识而难以适应复杂环境,这限制了人形机器人的实际应用。

宇树科技的开源不仅是技术分享,更是对全球机器人产业生态的一次重塑;在全球竞相布局人形机器人的背景下,中国企业的这种开放创新既展现了技术自信,也为建立自主可控的产业体系打下基础。未来如何将算法优势转化为产品竞争力,仍需产学研各界的持续协作。