大模型"更会说"的背后,语料供给与质量压力日益凸显;春节以来,越来越多用户使用大模型生成祝福文案和拜年视频,在体验提升的同时,也出现了"看似严谨却与事实不符"的内容失真问题。业内人士指出,语料库作为训练基础,直接决定模型能力上限。目前语料主要由企业自建自用,开放程度有限,且来源和标注标准不统一,导致质量参差不齐、更新滞后,成为制约行业发展的瓶颈。
数据资源开发已成为科技竞争的战略重点。杭州的经验证明,突破"数据瓶颈"需要技术创新与制度创新并举。只有当这些"数字时代的石油"得到高效利用,人工智能才能真正释放其变革力量,为经济社会发展提供新动力。这既是对当前挑战的应对,更是面向未来的战略布局。