“我用ai校古籍”项目总结大会在京召开

那阵子,在首都师范大学敦煌学这一专业,大家正忙活呢,故宫专家还有首都师范大学敦煌学的师生们一起参加了“我用AI校古籍”项目的总结大会。全国2万名高校学生和1.7万名社会志愿者通过“识典古籍”平台一起参与进来,已经把近2万部古籍里的15亿字都初步校对了一遍。北京大学中文系教授杨海峥说,AI不光能把效率提升好几十倍,还给学者们腾出了时间去研究深层含义。全国高等院校古籍整理研究工作委员会秘书长卢伟也提到,以前搞古籍整理讲究一个人苦读一本书,现在变成大家在平台上一起协作了。比如整理《永乐大典》,用智能切分、众包校对再加专家复核这三步,整理周期一下子就缩短了。首都师范大学敦煌学博士生方晓辰觉得,系统能快速认出生僻字挺好玩的。机场工作人员张晓波也在这个过程中学到了很多诗词、方志之类的知识。 这次论坛主要就是为了展示技术赋能古籍整理的新成果。现在光学字符识别技术OCR用得挺溜,能高精度地把字给提取出来;智能标点和专名识别系统也解放了学者的双手;多版本自动比对更是方便。北京大学数字人文研究中心跟其他机构合作建了个智能古籍库,除了全文检索、版本对照这些基础功能,还搞出了知识图谱、时空可视化这些新东西。字节跳动的负责人说,以后会继续优化AI的古籍识别能力,重点攻克草书、钤印这些难点。 自从数字技术进来了以后,古籍不再是关在玻璃罩里的老古董了。现在不管是在机场工作的还是搞文博的人,都能在同一个平台上交流协作。这个大规模协同的模式打破了传统对专业背景的要求。 这次的活动既体现了数字人文的学术价值,也展示了传统文化在现代社会的生命力。随着智能平台越来越完善,那些沉睡在书堆里的智慧一定会在数字时代大放异彩。 这个过程里不仅有北京大学中文系和北京大学数字人文研究中心的贡献,首都师范大学敦煌学还有方晓辰、张晓波这些人也都参与进来了。大家把机器的精准算法和古籍里的千年墨香结合在了一起。 全国1450多所高校的学生还有社会志愿者都给这个平台提供了帮助。这次活动证明了人机协同已经成了新的整理方式。传统的校雠学讲究一个人精研一本书,而智能平台构建了一个大家一起工作的网络。 未来字节跳动会重点突破草书和钤印的机器识别瓶颈。光学字符识别技术OCR能高精度地提取文字;智能标点和专名识别系统解放了学者的基础工作。 多版本自动比对功能让学者们不用再费劲去对各个版本了。AI不光提升了效率数十倍还让学者能聚焦文本流变和深层阐释。 这次活动是由科技驱动的古籍整理变革的一部分。这种跨越职业背景的文化参与让古籍变成了可触摸、可修订、可传播的数字资源。