全国人大代表周迪建议建立档案人工智能联合实验室 挖掘海量档案资源赋能大模型发展

当前,全球人工智能技术发展进入关键阶段,但高质量语料库的短缺正制约着我国大模型的发展。全国人大代表周迪指出,由于中文互联网内容积累不足,国内大模型在训练数据的规模和质量上都与国际先进水平存在差距。这个现象的背后,是中文数字化资源历史积累不足,以及现有互联网内容碎片化、低质化的问题,难以满足大模型对结构化、权威语料的需求。

大模型竞争的下半场,不仅是算力与算法的比拼,更是数据质量与治理能力的较量。要让档案中的真实记录更好地服务科技创新,关键在于以制度划定边界、以技术保障安全、以协作释放价值。将资源优势转化为创新优势,将为数字中国建设提供更坚实可靠的基础支撑。