视觉中国上线“数据服务”业务板块以全流程合规交付回应大模型训练数据“质”“权”之问

随着人工智能大模型进入商业化应用深水区,训练数据的质量与合规性问题日益凸显。

视觉中国旗下VCG网站近日正式开通数据服务业务板块,这一举措不仅填补了国内市场在高质量、版权清晰训练数据方面的供给缺口,也为大模型产业的健康发展提供了重要支撑。

当前,国内大模型企业在训练过程中普遍面临数据困境。

一方面,海量训练需求与高质量数据供给不足形成矛盾;另一方面,版权纠纷与合规风险制约着模型的商业化进程。

行业调研显示,数据质量与版权合规性已成为影响大模型企业长期发展的核心制约因素。

在此背景下,建立规范化、可持续的数据服务体系成为产业界的迫切需求。

视觉中国此次推出的数据服务业务,依托其多年积累的内容生态优势,构建了覆盖全球的视觉数据资源库。

据了解,该数据库可调用超过7亿条多模态视觉素材,涵盖图片、视频、三维模型等多种形态。

内容既包括动物、植物、建筑、风景等通用类别,也涵盖合规人像、餐饮美食、地标建筑、传统文化等垂直领域的专业数据集。

所有数据均经过专业清洗、质量审核与结构化标注处理,确保符合大模型训练的技术要求。

在版权合规层面,视觉中国建立了完整的授权追溯机制。

每一条数据均来自版权方的合法授权,具备清晰的权属证明链条,实现了从数据采集、合规审查、内容处理到授权交付的全流程可验证管理。

这一体系不仅满足了国内大模型企业的合规需求,也符合全球范围内对训练数据治理的严格标准,为模型的商业化应用扫清了法律障碍。

值得关注的是,视觉中国在数据服务中引入了价值分成机制。

根据2025年半年报披露,公司及其控股企业光厂创意已向上游供稿方完成首次大模型训练数据授权许可的收益分配。

这一创新模式让数据贡献者能够分享大模型商业化带来的成果,形成了"数据供给-模型训练-商业回报"的良性循环。

业内人士认为,这种机制从源头激励了高质量内容的持续产出,对推动整个产业生态的可持续发展具有示范意义。

目前,该业务已为阿里巴巴、腾讯、华为云等多家头部科技企业提供数据支持,进入规模化推广阶段。

随着合作申请通道的正式开启,更多大模型企业将有机会获得专业化的数据服务。

视觉中国表示,未来将继续深化在智能技术、内容数据与应用场景融合方面的战略布局,构建更加开放、高效的数据服务体系。

从产业发展角度观察,视觉中国数据服务业务的上线具有多重意义。

其一,它为国内大模型企业提供了规范化的数据获取渠道,降低了版权风险和合规成本;其二,通过建立收益分成机制,保护了内容创作者的权益,促进了优质内容的生产;其三,推动了训练数据市场的规范化发展,为行业树立了可借鉴的标准。

在数字经济与实体经济深度融合的大背景下，数据要素的价值挖掘与合规使用已成为全球性课题。

视觉中国此次业务创新，不仅为AI产业发展提供了关键基础设施，更探索出一条兼顾技术创新与版权保护的发展路径。

这启示我们，只有建立权责明确、利益共享的数据生态，才能实现人工智能技术的可持续发展，为数字中国建设注入持久动力。

视觉中国上线“数据服务”业务板块 以全流程合规交付回应大模型训练数据“质”“权”之问