陶哲轩：生成式模型冲击科研生态——论文激增挤压评审资源，数据验证更关键

问题——论文“激增”与评审“有限”矛盾凸显陶哲轩在对谈中围绕科学发现如何产生以及学术筛选为何重要展开讨论。他指出，科学研究并不是一次“灵光乍现”，而是一套完整流程，涵盖问题识别、数据获取、分析策略、提出假设、验证以及阐释表达。现实中，学术共同体往往更看重“想法”和“新概念”，却容易在证据链、可重复性与方法严谨性上把关不够。随着论文产出持续攀升，同行评审在时间、专业覆盖与组织成本上压力加大，“审得完”“审得准”的难题同时变得更突出。原因——重“产出速度”轻“验证强度”，信息噪声挤压优质成果陶哲轩以开普勒的经历作类比，强调科学进展常伴随大量尝试与试错。开普勒曾用几何结构解释行星轨道间距，设想宏大但与观测存在偏差；在获得更完整、更精确的数据后，他通过长期计算与比对，提出椭圆轨道与等面积定律，并在多年积累中发现轨道周期与距离的规律。陶哲轩认为，这段历史说明，“提出许多设想”并不稀缺，真正决定科学价值的是严格验证与高质量数据支撑。如果“尝试”缺少同等强度的检验与筛选，就会变成噪声堆积，反而拖慢知识体系的有效更新。在当前学术生态中，部分领域对量化指标存在路径依赖，加之新工具降低写作与整理门槛，论文增长更快，而评审与复核资源增长相对滞后，结构性张力随之加剧。研究者、期刊与机构在“快速发表”的竞争中更容易放大边际成果，分散评审注意力，使真正高质量、需要更长周期验证的研究不易被及时识别。影响——学术公信力与创新效率面临双重压力首先，评审负荷过高可能导致判断粗糙化，审稿周期拉长、意见质量不均，削弱期刊与会议的筛选能力。其次，低质量研究占据传播渠道，可能误导后续研究方向，造成重复投入与资源浪费。再次，当“数量巨大但可靠性不足”的论文成为常态，学术共同体的互信基础会被削弱；科研成果进入工程应用与公共决策环节时，也可能引发连锁风险。陶哲轩特别强调，科学史上的突破性理论往往建立在长期、细致的数据积累与校验之上。开普勒定律之所以成为里程碑，既在于洞察力，也在于依托精确观测与反复比对；而这些数据的获得，离不开第谷·布拉赫等人的持续测量与记录。换言之，科研体系既要鼓励提出问题与假设，也要充分认可高质量数据采集与严谨验证的价值。对策——以“可验证”为核心重建质量关口，完善学术治理链条一是强化可重复性与数据共享的制度安排。针对实验、观测与计算研究提出更明确的记录、开源与复核要求，推动关键结论可被独立检验，减少“只讲结果、不讲证据”的论文。二是优化同行评审的组织方式，提升专业匹配与责任边界。可探索分层评审、对重点论文加严复核、引入统计与方法学审查等做法，把有限的高水平评审资源集中用于“关键结论、关键方法、关键数据”。三是改革评价导向，降低对单纯数量指标的依赖，提高对长期数据工程、基础测量、负结果报告与高质量复现研究的认可度。对青年科研人员而言，减少“只求快发”的压力，有助于把时间用于更扎实的验证与积累。四是推动学术传播端建立“质量标识”。通过更透明的审稿记录、更清晰的证据分级与更严格的更正撤回机制，让读者与研究者更高效识别可靠成果，抑制噪声扩散。前景——从“灵感崇拜”走向“证据链崇拜”，以制度提升创新含金量陶哲轩的观点指向更深层的转变：科学突破不只来自某个瞬间的天才想法，而是数据、方法、验证与表达共同构成的系统工程。面对论文与信息快速增长的现实，学术界需要用更完善的治理手段维护“可验证、可复核、可积累”的知识生产秩序，让经得起检验的创新更快被发现、更广泛被信任，也让高质量数据与严谨复核获得与“新点子”同等甚至更高的重视。

从第谷的精密观测到开普勒的定律发现，科学史一再表明：真理的筛选离不开时间与耐心。当现代学术界站在论文快速膨胀的关口，重拾“大胆假设、小心求证”的科研准则，或许比任何技术手段都更能守住知识的纯度与进步的价值。