日本人工智能初创企业LifePrompt这次把2026年的大学入学统一考试真题拿来给AI模型做测试,结果非常惊人。他们一共测了15个科目,每科都打100分。表现最好的是OpenAI的GPT-5.2 Thinking模型,在数学、化学、信息学还有政治经济学这些一共九门学科里全拿了满分。整个15个科目的平均分更是达到了96.9分,简直就是全能。谷歌Gemini 3.0 Pro也不错,平均分也有91.4分,说明AI技术整体水平确实在提升。 测试特意关掉了互联网搜索引擎,让AI完全靠自己的知识库和算法答题。结果发现AI在理科和部分社会科学上的解题能力简直接近完美了。特别是在考人类科学I类专业的那些科目里,正确率高达97%,比2024年的66%和2025年的91%都高出一大截。 不过日语这块儿有点逊色,最好的模型也只答对了90%。LifePrompt的负责人远藤聪说,AI在信息处理和阅读上强得没话说,能拿满分是靠这个。但日语文本的理解还得练。这说明AI在语言文化这种需要直觉和经验的地方还得继续努力。 日本每年有50万考生参加这个考试,成绩决定能不能进全国813所大学。河合塾分析说,要是这次考了89%的正确率,就有50%的机会被人类科学I类专业录取。而AI直接拿了97%的正确率,这成绩让大家开始琢磨教育评估体系该怎么改。 LifePrompt从2024年就开始定期测试AI的考试能力,积累了不少数据。这些数据告诉我们:AI在标准化知识考核、逻辑推理上已经很强了;但在理解文化背景、创意和情感共鸣这些方面,人类还是占优势的。 这一进展标志着AI已经深入教育评估的深度认知领域了。这既展示了它处理复杂问题的能力,也逼着我们重新思考人类智能和技术智能的界限。技术发展是挡不住的,我们得主动适应、好好引导,才能培养出既有情怀又懂科技的新一代人来。