问题:从“能聊”走向“能做”,行业进入关键拐点 大模型技术近两年快速迭代,通用对话能力不断逼近“可用”门槛,行业关注点正从“回答是否流畅”转向“任务是否完成”;与会专家指出,单纯比拼对话体验的边际收益正在下降,下一阶段更具决定性的能力是让系统能够拆解目标、调用工具、持续执行并交付结果,即从“对话型助手”迈向“行动型智能体”。这意味着竞争不再局限于语言生成本身,而将扩展到任务编排、工具调用、长期记忆、多模态感知与可靠执行等更复杂链条。 原因:需求牵引与效率瓶颈叠加,推动技术路线加速分化 研讨认为,行业路线分化背后是应用需求的自然选择。一上,面向个人用户的平台型服务更强调体验与规模;另一方面,面向企业的深度场景更看重稳定性、可控成本与可度量价值。尤其软件开发、运维、数据分析等场景,代码有关任务对算力与调用量消耗显著,能够形成明确的投入产出评估,从而更容易率先实现规模化落地。此外,“堆规模换能力”的路径正面临成本与工程复杂度约束,倒逼行业将更多精力转向训练与推理效率、数据质量、强化学习流程、工具链和评测体系等“硬功夫”,以较小的资源增量换取更大的能力提升。 影响:产业竞争从模型参数转向系统工程,落地门槛与人才要求同步抬升 与会者普遍认为,未来竞争不仅是模型能力之争,更是“模型+产品+工程+生态”的综合能力之争。首先,智能体要在真实世界稳定运行,需要更完整的系统工程能力:任务规划、权限与安全、容错机制、可追溯审计、人机协同界面等都将成为产品的基础设施。其次,衡量指标也在变化:除了准确率和对齐度,更需要关注“智能效率”——在有限算力、有限成本下获得可持续收益的能力。再次,人才结构将随之调整:研究与产品边界更融合,既懂算法又能端到端交付的人才更加紧缺,团队需要兼具技术判断与产业理解,避免“能演示、难上线”的落差。 对策:以代码能力与智能体为抓手,针对三项要素打造可复制的落地路径 围绕如何把“行动能力”做深做实,研讨提出了较为一致的落地方向。 其一,聚焦代码能力,推动从“生成”到“执行”的闭环。代码任务天然具有可验证性,适合通过自动评测、持续集成等方式形成快速迭代闭环,有助于提升可靠性并沉淀工具链与数据资产。 其二,做强智能体关键能力,形成可交付的“托管式”体验。与会者强调,面向用户的理想形态应是给出相对模糊目标后,系统能够在较长周期内自主分解、选择工具、迭代策略并完成交付,但前提是价值真实、成本可控、执行足够快,才能抢占产业窗口期。 其三,持续投入强化学习与基础设施建设。多位专家认为,强化学习在提升“主动性”和“自我改进”上潜力较大,但仍受制于训练范式、数据与环境构建、评测标准等短板。要实现可持续提升,需要加强算力调度、训练管线、数据治理与安全合规等基础设施,避免能力提升停留在“短板环节”。 前景:新范式或在中期显现,创新生态决定长期竞争力 在对未来判断上,研讨认为,随着学界算力条件改善与产业界效率约束加剧,持续学习、记忆机制、多模态与更高效的训练推理方法有望带来阶段性突破。下一轮技术跃迁未必来自单一维度的规模扩张,更可能来自系统性方法改进与工程化能力提升的叠加。与会人士同时指出,青年人才在此轮竞赛中表现活跃,敢于攻坚与探索的团队需要更稳定创新环境、更清晰的成果转化通道以及更包容的试错机制。只有形成“长期投入—持续迭代—规模落地”的正循环,才能在全球竞争中获得更稳固的主动权。
这场汇聚中国人工智能领域最强大脑的闭门会议,不仅展现了技术演进的最新趋势,更揭示出人才梯队更新带来的创新活力。在全球竞争日益激烈的背景下,如何将青年科学家的创造力转化为持续的技术突破,如何构建更富活力的创新生态系统,将成为决定人工智能领域未来格局的关键课题。中国科研团队表现出的务实态度与长远眼光,为应对这些挑战提供了重要思路。