全国首单具身智能数据集交易落地南京 数据要素市场化改革迈出关键一步

问题:当智能系统走向真实世界,决定其能力上限的关键正在发生变化。

随着算法持续开源、算力供给不断增强,行业竞争焦点逐步从“谁的模型更大”转向“谁的数据更好、更可用”。

尤其在具身智能领域,机器人要在办公、商超、餐饮、家政等复杂场景中完成抓取、放置、整理等任务,难点不在于单一动作能否生成,而在于面对多目标、多材质、多约束环境时能否稳定执行。

由此,高质量数据集成为训练与迭代不可替代的基础资源:它既要真实反映物理世界,也要能够被模型高效吸收并转化为可泛化的能力。

原因:数据为何会成为稀缺资源?

一方面,具身智能的数据采集天然“重资产、重流程”。

在南京玄武区一家企业的采集室内,遥操人员通过穿戴设备引导机器人弯肘、抬臂、向前抓取等基础动作,屏幕上的操作被同步映射为机器人的执行轨迹,并被记录为包含视频、关节角度、力矩、电流等多维信息的结构化数据。

看似简单的“叠毛巾”,在现实中却常因材质形变、摩擦系数变化、手指夹持误差等因素反复失败,需要大量重复演练和精细标注才能形成稳定样本。

另一方面,数据从“采集”到“可交易”并非自然生成。

高质量数据不仅要量足,更要标准统一、噪声可控、标注可靠、任务指令清晰,并满足隐私保护、知识产权、来源可追溯等要求。

正因为生产链条长、门槛高、成本高,才使得经过清洗与标注、可直接用于训练的“成品数据”具备显著市场价值。

影响:全国首笔具身智能数据集交易的落地,释放出多重信号。

其一,数据产品化、资产化进程正在加速。

以此次上架的数据集为例,产品包含约2.5万条结构化数据,按条计价、可溯源管理,单条数据时长约10秒、容量从几十兆到上百兆不等,既有机器人“所见”的视频,也有执行过程中各关节状态参数及对应任务指令,具备直接投入训练的可用性。

其二,产业分工将进一步细化:数据采集、清洗标注、质量评估、合规审查、交易交付等环节将形成更专业的服务体系,推动“数据供给侧”出现更多专门化企业与平台能力。

其三,应用落地节奏有望提速。

对购买方而言,直接采购高质量数据,相当于缩短了从搭建采集环境到反复调参的周期,降低试错成本与不确定性,有助于以更快速度推动模型在复杂环境中的认知与执行能力迭代。

对策:推动高质量数据集发展,核心在于“标准、生态、合规”三条主线协同发力。

首先,要以可复用标准提升数据供给效率。

具身智能数据涉及多模态信息与时序同步,需明确采集规范、字段结构、标注体系、质量评估指标等基础标准,促进跨企业、跨平台的互认与复用,减少“各自为战”导致的重复采集与浪费。

其次,要以平台能力激活生态协同。

作为数据要素资源较为集聚的地区,江苏正在从供需两侧协同推进价值实现与产业转化。

相关数据显示,截至2025年10月底,江苏在医疗、交通、工业、能源、文旅等重点领域已形成高质量数据集321个,数据总规模超93PB。

南京作为中国软件名城,正推动“数据要素×”与“人工智能+”行动深度融合;玄武区通过运营江苏国际数据港、江苏省数据交易所、玄武大模型工厂等基础设施,持续开展市场启蒙与服务,帮助企业识别数据价值、完善产品形态、对接应用需求,促进数据安全有序流通与高效配置。

再次,要把合规作为交易的生命线。

数据来源合法、权属清晰、使用边界明确、审计可追溯,是数据要素市场健康发展的底座。

只有把安全与合规嵌入采集、加工、交易、交付全流程,数据产品才能真正“能用、敢用、好用”。

前景:面向未来,具身智能数据的价值将更多体现为“场景牵引下的能力供给”。

随着服务业、制造业对柔性自动化需求增长,机器人将从单一工位走向复杂空间,数据将从“数量竞争”转向“结构竞争”和“知识密度竞争”。

预计高质量数据集将呈现三大趋势:一是行业化与细分化加速,围绕家政、零售、仓储、养老等典型场景形成可复制的任务库与数据产品;二是数据治理更精细,围绕质量评估、版本管理、合规审计形成通用能力;三是交易机制更成熟,通过平台撮合、标准化交付与服务化定制,推动数据从资源变要素、从要素变生产力。

可以预见,谁能持续稳定供给高质量数据,谁就更有可能在下一轮产业竞合中占据先机。

高质量数据集的交易突破,标志着我国数据要素市场正在从概念阶段向实践阶段迈进。

这不仅是一次技术创新,更是一次生产要素配置方式的深刻变革。

当人工智能向真实世界深处演进,数据的价值将愈加凸显。

南京玄武的探索表明,通过完善基础设施、规范交易秩序、引导产业生态,完全可以将数据这一新型生产要素转化为推动经济高质量发展的强大动力。

未来,随着更多高质量数据集进入交易市场,数据驱动的AI产业生态将更加完善,人工智能与实体经济的融合也将更加深入。