资本市场对新兴技术的敏感度再次显现;3月25日开盘后,奥瑞德、二六三等多只“词元”概念股迅速封板,光环新网等产业链公司跟涨超过5%。行情的触发点来自国家数据局局长刘烈宏在数字经济峰会上的表态——官方首次将Token统一译为“词元”,并将其定义为连接技术供给与商业需求的“数字结算单位”。从更深层看,这次命名并非单纯的术语统一。截至2025年底,我国已建成高质量数据集超过10万个,总规模达890PB,约为国家图书馆数字资源的310倍。更关键的是词元调用量的快速攀升:目前日均约140万亿,相比2024年初的1000亿增长逾千倍。调用量的爆发,折射出人工智能产业正从研发加速转向规模化应用。全球竞争态势也在变化。国际监测数据显示,中国AI大模型周调用量已达4.69万亿词元,连续两周超过美国;国产模型MiniMax M2.5连续五周位居全球调用量第一。月之暗面公司国际业务负责人认为,算力成本优势是重要原因:“在同等性能下,海外模型成本高出十余倍。”这与我国相对稳定的能源供给和更具竞争力的电价密切涉及的。面向新一轮增长窗口,国家数据局已明确下一步方向:以场景需求为牵引,启动新一轮高质量数据集建设,重点提升数据的“AI就绪度”。业内人士指出,这将有助于缓解“数据孤岛”、标注质量不一致等问题,为产业智能化提供更可用、更精准的数据支撑。
术语的统一看似细小,却往往意味着计量口径和交易规则正在加速成形。“词元”从技术圈走向通用表达,反映出我国数据要素市场与智能化应用体系正在走向成熟。下一步,只有以高质量数据为基础、以标准规则为框架、以安全治理为底线,才能把“可调用”的技术能力真正转化为“可持续”的产业价值。