李飞飞团队World Labs获10亿美元融资全球科技巨头押注三维建模新赛道

针对“让机器理解并三维世界中作出决策”目标，World Labs近日宣布完成新一轮10亿美元融资，引发业界对“世界模型”路线的关注。不同于传统侧重文本或二维图像的模型，“世界模型”强调对空间结构、物体关系、物理规律与交互反馈的综合表征，意在让系统不仅能“看见”，还能够“推演”和“行动”。问题在于，当前多模态大模型在内容生成上进展迅速，但在真实三维环境的可解释性、可控性与可执行性上仍存明显短板：一是生成内容与物理一致性、尺度与遮挡关系等细节容易出现偏差；二是面向机器人等“落地场景”时，需要把感知、规划与控制联动起来，对数据、算力与工程体系提出更高要求；三是从娱乐与设计扩展到工业、科研等场景，安全性、可靠性与验证机制仍待完善。由此，“世界模型”被视为补齐从“内容生成”走向“空间智能”的关键一环，也成为资本与产业同时押注的方向。融资与合作背后有多重原因。首先，三维数据与仿真训练成本高企，训练“世界模型”往往需要更大规模的算力集群、数据管线和渲染/物理引擎能力，资金与产业伙伴的协同能显著降低研发门槛。其次，投资方结构呈现“软硬结合”特征：既包括芯片与算力生态企业，也包括设计软件与产业资本，反映出市场普遍判断该技术一旦成熟，将更可能以工具链、平台化能力进入生产流程，而非停留在展示性应用。再次，生成式技术竞争加剧，差异化路线成为初创企业突围的重要选择。相较同质化明显的通用模型赛道，围绕三维世界理解、可交互生成与决策的技术栈，具备更强的壁垒构建空间。从影响看，“世界模型”若在可控生成与环境推演上取得突破，可能对多个领域产生连锁效应。其一，叙事与内容产业将加速从“平面创作”向“可交互空间叙事”迁移，影视预演、游戏关卡、虚拟拍摄与数字资产生产效率有望提升。其二，创意设计与工程应用或迎来流程重构：从概念草图到三维场景、从产品外观到空间布局，前期探索成本可能降低，迭代速度可能加快。其三，机器人技术受益更为直接。机器人在复杂环境中执行任务，核心难点在于环境建模与任务规划。若“世界模型”能够在仿真与现实之间建立更可靠的映射，训练、评测与部署效率将提升，并可能推动服务机器人、仓储物流、特种作业等场景的规模化落地。其四，在科学发现领域，三维结构建模与仿真推演需求广泛存在，有关技术若能与学科数据体系结合，或将推动实验设计与数据分析方式创新。同时也应看到，对策层面仍需多方协同解决关键瓶颈。一是强化数据与评测体系建设。三维世界的“正确性”不只取决于视觉效果，还取决于物理一致性与交互可验证性，需要更权威的基准测试和行业可比指标。二是提升可控与安全能力。面向机器人、工业等高风险场景，模型必须具备可追溯、可验证的决策链路，避免“看似合理但不可执行”的输出进入实际系统。三是推动软硬件生态联动。三维生成、渲染、仿真与实时推理对硬件、引擎、工具链依赖更强，开放接口、兼容主流工作流、降低集成成本，将决定技术从实验室走向规模应用的速度。四是重视合规与版权治理。三维资产涉及素材来源、数据授权与内容责任边界，相关机制若不完善，可能成为商业化的长期风险点。前景判断上，World Labs推出的Marble以“由图像或文本生成三维世界”为切入点，反映出行业正在从“生成单个三维物体”迈向“生成可交互场景”，从“视觉结果”迈向“空间逻辑”。短期看，该类产品更可能在创意、娱乐、教育培训等容错率较高的领域率先形成商业闭环；中期看，若在物理一致性与任务可执行性上持续提升，将逐步向机器人训练与工业仿真渗透；长期看，“世界模型”若能形成通用平台能力，可能成为新一代空间计算与智能体系统的重要底座。但技术路线的兑现仍取决于数据、算力、评测与工程化的系统推进，也取决于产业伙伴能否共同构建可持续的生态。

世界模型技术代表了人工智能向更高层次发展的努力；从识别图像中的物体到理解和生成完整的三维世界，该跨越反映了人工智能从感知向认知演进的方向。World Labs的融资和产品推出标志着这项技术已从理论研究进入实际应用阶段。随着更多企业和资本的参与，世界模型技术有望在未来几年内催生多项应用，重塑创意产业、制造业和科研领域的工作方式。这既是技术进步的机遇，也对产业生态、人才培养和伦理规范提出了新的挑战。

李飞飞团队World Labs获10亿美元融资 全球科技巨头押注三维建模新赛道

李飞飞团队World Labs获10亿美元融资全球科技巨头押注三维建模新赛道