当前位置: 首页 >> 学术讲座 >> 正文

2025“北外中国学讲堂”第二讲“文献的数字化和数智化”学术讲座顺利举办

发布者: [发表时间]:2025-04-14 [来源]: [浏览次数]:

3月31日下午,在国内大厦4号楼508会议室,由国际中国文化研究院主办的“文献的数字化和智数化”学术讲座顺利举办。本次讲座由浙江大学文学院教授、浙大文学院数字人文研究中心主任徐永明主讲,国际中国文化研究院助理研究员黄一玫主持。

首先,徐永明教授从当代文科学子肩负的使命切入,对跨学科人才培养表达了深切期望。据统计,当前中国所藏古籍仅有六分之一完成了数字化处理,后续的标点和著录工作与预期目标差距较大。在文科招生规模缩减的大环境下,整理历史文化遗产的任务愈发艰巨。徐教授援引《马克思恩格斯选集》中关于自由王国与必然王国的论述,指出当下人工智能时代正处在二者的过渡阶段,从必然王国迈向自由王国,仍有很长的路要走。在虚拟世界中立足,复合型人才是不可或缺的。紧接着,徐教授以诸多学界青年学者的成功案例为引,进一步强调掌握数字人文技能的重要性。他指出,编程、数据库、电子制表软件、文本分析、空间分析和网络分析这六大能力,已成为哈佛大学筛选访问学者的关键指标。在中国文化数字化战略以及其他政策的大力支持下,数字人文领域发展前景广阔,大有可为。

随后,徐永明教授深入阐释了文献的不同形态及其特点。他提到,在纸本(金石)文献、数字化文献与结构化数据之后,智慧化数据,即“数智化”文献,成为学术研究的重点对象。对数字化文献进行结构化处理,需开展计量统计、空间分析、社会网络分析,并进行可视化呈现。现阶段,这些工作仍无法由机器完全替代。智慧化数据作为结构化数据与文本数据融合的产物,其构建更离不开专业人员的深度参与。徐教授列举了MARKUS、宋元学案等数据库的成功案例,对传统数据库的优势与不足进行了深入剖析,表达了对现存问题的忧虑。他指出,当前数字人文领域缺乏统一管理与顶层设计,投入产出比偏低,数据孤岛现象严重,这些问题亟待解决。

最后,徐永明教授借助图表,介绍了国内外重点智慧数据平台。其中,CDBD(中国历代人物传记资料库)、CHGIS(中国历史地理信息系统)以及 WorldMap,均由哈佛大学主持开发,在全球范围内发挥着引领示范作用。近年来,在徐永明教授团队的不懈努力下,学术地图发布平台(现云四库数据地图)、智慧古籍平台以及云四库垂直大模型相继问世,并持续迭代更新。徐教授表示,经过严格筛选,云四库垂直大模型的数据来源更加纯粹、真实,具有鲜明的学术专业性,目前已向北外师生开放使用,欢迎大家使用并提出宝贵意见。桐城派代表人物姚鼐曾提出“义理、考据、辞章”三位一体的论学理念,在此基础上,徐永明教授进一步倡导培养“义理、考据、辞章、算力(algorithm)”四位一体的新文科人才。《易经》有言:“关乎天文,以察时变;关乎人文,以化成天下。”徐永明教授总结道:“关乎数理,以入虚拟之世界;关乎AI,以建最强之大脑。”

黄老师总结到,在本次讲座中,徐永明教授用真实可视的数据介绍了海内外数字人文基础设施建设情况,并结合自身开发建设数字化文献平台和智能知识问答的经验,对数字人文的发展前景等做出了科学的评价与分析。希望当今学者能够充分利用徐教授搭建的学术平台,学习并使用先进的技术对研究数据进行深度分析与应用。

讲座结束后,现场师生与徐教授展开了积极互动。徐永明教授对同学们提出的每个问题进行了细致剖析,并结合提问者的实际情况,提供了切实可行的方法指导。在两个小时的精彩分享与深入研讨后,本次专题讲座在热烈的掌声中圆满结束。

(国际中国文化研究院2024级硕士生水己泰供稿)