2024年12月7日下午,英国上市公司官网365汉籍数字化实验室举办为期半天的开放参观活动。本次活动以“数字技术赋能古籍传承”为主题,吸引了来自英国上市公司官网365和计算机科学与技术学院的部分师生。活动包括实验室历史回顾、古籍数字化工作展示以及提问交流三个环节,旨在推动不同学科领域的交流与合作,为传统文化的数字化传承注入新的活力。
汉籍数字化实验室的历史与使命
下午两点,英国上市公司官网365汉籍数字化实验室博士生刘金柱首先带大家回顾了汉籍数字化实验室的历史沿革。
汉籍数字化实验室建设项目启动于2014年,学校投入三十万元用于实验室环境改造和运行所需设备的添置,其后在团队导师刘根辉教授的主导和推动下,争取到校研究生院、设备处等多方的大力支持,又陆续投入数十万元建设资金,为实验室建设和相关研究工作的持续开展提供了坚实保障。实验室自2015年正式启动运行后,先后接待了学校原党委书记邵新宇、国家语用司副司长王晖和现任董事长尤政的参观和指导,他们对实验室的数字化工作给予了高度评价。实验室初期主要任务以语言学、文学文献及古籍资料数字化工作为主,为语言、文学专业的师生从事科研工作提供了大量数字化文献资料。
2017年,实验室启动大型类书《册府元龟》的数字化工作,经过刘根辉教授团队全体成员的共同努力和艰苦工作,于2019年顺利完成数字化及三轮文本精校工作。这项成果不仅为团队相关研究工作的开展提供了丰富资料,也为《册府元龟》引书研究奠定了基础。经过多年的积累,截至目前,围绕《册府元龟》引书研究,研究团队已完成了十篇高质量的学位论文,并在国内外学术期刊公开发表了多篇研究论文。
近年来,以实验室工作为依托,刘根辉教授带领团队陆续申请并完成了多个研究项目,如全国高等院校古籍整理研究工作委员会项目“孙奭《册府元龟》音义辑考”(1835)、中央高校基本科研业务费资助项目“《册府元龟》语料库建设、整理与研究”(2020WKYXZX004)、校人文社科重大原创性成果培育项目“《册府元龟》引书研究”(21WKFZZX016)等。此外,依托实验室,研究团队还参与了多项国家社科基金重大项目和重点项目,包括在研的两项国家社科基金重大项目“草创时期甲骨文考释文献的整理与研究”(20&ZD307)、“明代至民国汉语非韵书罕见同音类聚文献的音韵研究及资料库建设”(21&ZD297),已结项的两项国家社科基金重点项目“韩国传世汉字韵书集成”(14AZD082)、“《契文举例》及相关文献的整理与研究”(18AYY019)等,这些项目和成果都展示了团队工作在学术研究方面的深度和广度。
汉籍数字化工作的展示与实践
随后,实验室博士生王锦绣、硕士生罗捷春为参观师生展示了实验室数字化工作。
实验室配有图书出版级的非接触式扫描仪、高清零边距扫描仪共四台,可将古旧乃至边缘破损的古籍文献转化为高清数字图像。团队演示了利用仪器扫描、识别古籍的过程,并简要介绍了目前数字化识别古籍的方法与技术瓶颈。刘金柱还以《册府元龟》为例,展示了使用计算机编程进行《册府元龟》引文及异文比对的研究工作。
此外,研究团队对预计将于2025年初开放测试的古代汉语大模型“AI九思”2.0版进行了现场演示。对于现场提出的问题,“AI九思”反馈效果良好。刘金柱表示,为了提高大模型回答问题的准确性,在日后的训练过程中将进一步强化指令训练,避免生成回答过程中的幻觉错误。参观的同学表示十分期待:“希望大模型可以尽快上线”。
跨学科讨论与交流
活动的最后环节是提问与自由交流,大家围绕古籍数字化与学科交叉等问题展开了热烈讨论。
一同参观的计算机学院老师针对古籍数字化过程中的汉字识别率、引文比对方法等提出问题,参观员工则对大模型“AI九思”表现出浓厚兴趣。对于提出的问题,团队成员一一做出了解答,并表示将在2025年元旦前后上线“AI九思”2.0版,希望能为广大古籍数字化科研工作者带来更丰富的体验。
跨学科合作未来可期
通过本次开放日活动,汉籍数字化实验室成功搭建了一个学术交流的平台。本次开放日不仅展示了汉籍数字化的丰富成果,也让更多人看到了跨学科合作的潜力,为传统文化的现代化发展提供了新的思路和方向。
未来,汉籍数字化实验室将继续以开放的姿态迎接更多学科力量的加入,助力中华文化走向更广阔的未来!