与哈佛大学教授、著名汉学家包弼德(Peter K.Bol)对话,是极富有冲击力的。这份冲击首先体现在语言上,这位西装革履、眉眼深邃的教授张口便是一嘴流利的美国口音普通话,而细听分享的文本,则更会为他深厚的中国历史知识储备、前沿的数字人文研究方法而震撼。
日前,包弼徳做客“连麦杭州悦读会”,以“数字人文对宋史研究的贡献——以中国历代人物传记资料库(CBDB)为例”为分享主题,与大家聊一聊数字人文那些事。
从1966年考入荷兰莱顿大学汉学院算起,包弼德投身中国研究已经57年,从一名对中国感兴趣的青年成长为在哈佛任教的资深汉学家。
对于大部分中国网友来说,认识包弼徳是因为哈佛大学中国史公开课上,他用《两只老虎》的曲子谱写了一首“中国朝代歌”。同时,他的著作《斯文:唐宋思想的转型》《历史上的理学》被翻译为中文,影响广泛。
要想研究中国历史,有一个最基础却是最困难的门槛:如何完全掌握并传承卷帙浩繁、层出不穷的古籍文献?单靠个人的知识储备实在捉襟见肘。近年来,伴随着科技的进步,以古籍数字化为代表的“数字人文”新潮流正在兴起。
2005年,包弼德接手主持了由汉学家、宾夕法尼亚大学终身教授郝若贝(Robert Hartwell)于20世纪七八十年代建立的CBDB((China Biographical Database Project)数据库。经过近20年的完善与扩充,目前该项目由哈佛大学费正清中国研究中心、中研院历史语言研究所与北京大学中国古代史研究中心共同负责建设,实现了从数据库文本中提取与人物相关的信息从而给人物的生平建立模型。
在交流中,包弼德教授以图表展示了CBDB中的数据体量、分布、变化趋势与来源,并介绍搭建CBDB平台的实际应用,即为群体传记学研究提供一个关系型数据库。
根据群体传记学所需的数据类型从文献史料中提取人名、地址、入仕途径、亲属关系、社会关系等信息,用计算机进行编码与储存。
通过这样一个关系型数据库可以迅速查询到有某种特征的群体以及具体某位人物的社会网络、亲属关系、入仕途径等等,在研究地方史、家族史、宋代思想史等领域都有良好的应用前景。
透过CBDB的应用与实践,包弼徳教授为专家学者与历史爱好者打开了一片数字人文的广袤蓝图。以CBDB为代表的数字人文工具加快了文本处理的速度,也为学术研究提供了新的工具、方法与思路:在广阔时间和空间中寻找变化和趋势,在复杂的人物关系网络中寻找联系与共性。
“人看不清楚的复杂事情,尤其是文学文本的挖掘,数字人文非常有用。”
包弼德说,不仅在学术研究,在工业、在医院,数字技术、人工智能都将带来巨大进步。不过他也特别强调,数据库所建立的模型只是对变化的证明,而不是对变化的解释,其背后的原因仍然需要靠中国社会史研究才能给出答案。
“转载请注明出处”