咱们国家的科研团队在通用人工智能逻辑推理这块取得了大突破。北京这边的消息传来,1月26号的夜晚,这个由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院还有北京大学武汉人工智能研究院联手搞出来的大项目,总算在国际顶级学术期刊《自然-机器智能》上挂上了号。这套叫“通矩模型”的系统可是真争气,不光被大家捧得很高,还把国际同行都给震住了。专家说了,这是全世界第一个能自己出题又能自己解的通用AI系统,是咱们国家在自动化推理这块实现自主创新的标志性成果,能力和花样已经跑到了世界前列。 逻辑推理,尤其是几何这块,一直被当成看AI能不能懂事儿的试金石,也是通往通用人工智能(AGI)必须爬的一座大山。这块儿有两大硬茬子难啃:一个是“组合爆炸”,稍微加个辅助线,解题的路就多得让人头疼;另一个是“高质量数据太少”,现有的题库有限,标起来还贵得很。 面对这些难题,咱们的科研团队没走老路子,不搞数据驱动那一套,而是回到了逻辑的根本上。他们从数学家怎么想的这个过程中找灵感,开发了一套精密的搜索框架。这个框架让AI能像人类一样抽象地建模复杂世界,每个步骤都走得很有条理,大大减少了瞎试的次数。 最关键的是团队弄出了“规范化表示”技术。这就像是给了AI一双能看穿表象的眼睛。不管图形怎么旋转、翻转还是缩放,“通矩模型”都能迅速把那些看起来不一样但其实一样的图形合并起来。比如一个三角形怎么摆都能找到它不变的关系。这种对对称性的理解特别厉害。 找解题灵感这一块更像人类搞创作。系统通过“价值函数”来模拟数学家的眼光。用强化学习技术,系统能判断每条推理路走得好不好看、简不简洁。第一作者张驰说,当AI觉得一个命题比它构建起来还难时,就像是发现了灵感一样。这种“价值引导”的机制让模型能从一大堆可能中挑出好看的题目。 实验结果也证明这玩意儿很猛。只用一张消费级显卡,它就能在38分钟内搞定自2000年以来所有国际数学奥林匹克竞赛(IMO)的几何难题。通讯作者朱毅鑫说这不仅仅是解题快了点。 它探索了一种“小数据、大任务”的新路子。系统不依赖海量标注数据,而是靠内部逻辑自己变和价值引导来提升能力。朱毅鑫说这更接近人类是怎么学和发现的。 这个“通矩模型”的成功让咱们在基础研究的“深水区”有了大收获。它不光能帮着搞自动化证明、教个性化教育,还有望给青少年出题讲解提供服务。更重要的是它给AGI提供了新路子,也展示了咱们的创新活力和实力。 研究团队表示以后还要接着干通用智能模型这块活儿,推动咱们在更多复杂逻辑推理和科学发现上领路全球。