一、竞争格局转变,“能干活”成为新标尺 全球人工智能进入新阶段。早期竞争的重点是通用对话能力,各方主要比拼语言理解与生成是否流畅。随着技术和数据积累加深,市场与产业的关注点发生转向——能否真实、复杂场景中完成高价值任务,正在成为衡量技术水平的新标准。 在这个趋势下,我国具备明显优势:完整的工业体系、多样的应用场景和超大规模市场需求,为人工智能深度落地提供了土壤。关键在于,如何把这些条件转化为可持续的实际竞争力。 二、大模型存在明显短板,“博而不精”制约深度应用 上海人工智能实验室近期研究指出,大模型存在结构性短板:前沿模型在通用科学常识测试中的得分约为50分(满分100分),但在专业推理任务(如专项文献检索、具体实验方案设计等)中,得分会降至15至30分。 这反映出传统深度学习路径的局限:模型在数据充足、任务定义清晰的场景中表现较好,但在科学发现中常见的“未知的未知”面前容易失效。通用能力的覆盖面与专业推理的深度之间,仍存在明显差距。 三、通专融合是破局路径,训练机制须系统重构 针对上述问题,周伯文提出“通专融合”的解决思路:把通用能力的广度与专业逻辑的深度结合起来——使系统既能跨领域迁移——也能在特定专业场景达到专家级水平。 要实现这一目标,训练机制需要在三上突破:一是建立类似“导师制”的过程反馈机制,让模型学习过程中持续获得更准确的专业指导;二是提升模型的主动探索能力,使其在面对未知问题时具备自发的求知与追问能力;三是鼓励多样化解法,减少对单一路径的依赖,提高处理复杂问题的灵活性与鲁棒性。 四、应用价值可量化,电力交易场景验证经济效益 通专融合的价值不仅体现在技术指标上,也可以在产业场景中直接量化。以电力现货市场智能报价为例,通用大模型能够生成行业分析报告,但往往难以在快速变化的市场中给出足够精准的报价。在电力交易领域,预测精度每提升一个百分点,可能带来数亿元级别的收益差异。 基于SAGE架构的通专融合系统不仅能理解政策文本,还能像资深交易员一样完成长链条数值推理,把专业判断嵌入实时决策流程。该案例表明,通专融合不是抽象概念,而是一条能算清经济账的落地路径。 五、科研范式面临系统性变革,AGI4S开启新阶段 在科学研究领域,人工智能的角色正从“工具”转向“引擎”。在此前的“人工智能驱动科学研究”阶段,技术多在单点环节发挥加速作用,蛋白质结构预测是代表性案例。进入“通用人工智能驱动的科学研究”新阶段,系统需要具备更强的自主性、跨领域整合能力与创造性:不仅能帮助研究者产生跨学科想法、判断假设价值,还能自主构建或创新性组合研究工具。 这一转变将影响创新全链条:在未知探索层面,持续拓展科学发现边界,触及尚未被意识到的认知盲区;在共性技术层面,将早期成果沉淀为可复用的技术模块,服务更广泛的科研群体;在产业加速层面,让成熟成果更快嵌入产业链,缩短小试、中试周期,实现降本增效。 六、前沿六问保持清醒,双轮驱动推动落地 在推动技术突破的同时,周伯文提出需要冷静面对的六个前沿问题,涵盖边界之问、预测之问、语言之问、交叉之问、验证之问与新科学之问。这六问并非否定技术前景,而是为长期价值设定清晰的检验坐标,反映了在技术热潮中保持审慎的专业态度。 在推进落地上,上海人工智能实验室采取“双轮驱动”。一方面建立前沿部署工程师机制,由专业队伍把前沿能力更快、更准地部署到科研与产业场景,打通从模型到应用的关键环节;另一方面推动科学领域与人工智能领域的顶尖科学家深度协作,以高水平人才联合攻关前沿难题。
技术竞争已进入深水区,胜负不再取决于“说得像不像”,而在于“做得成不成、算得准不准、能否被验证与复用”;通专融合的核心,是让通用能力与专业知识在真实问题中相互校正、共同进化。坚持以场景牵引、以验证为尺度、以协同为方法,才能把技术潜力转化为科研突破与产业升级的确定性增量。