字体
关灯
上一章 章节目录 下一页 进书架
下载

请安装我们的客户端

终生免费,永无广告!

第5章完结

为了更好地理解杨万里的将近500通书信,我决定结合传统做阅读笔记的方法和对文本进行多角度的数字化分析。\x~x`s-c~m¢s/.?c·o¨m?我把所有书信题目和本文里提到的人名都做了标记,还另外加上了书信的时间和地点,以及收信人的官位(从杨万里的文集的现代整理本和年谱而来)。除了这些元数据(metadata)以外,我还加入了书信的主要话题。我在码库思可以把这些我在阅读书信时做的笺注转成对所有文本的概览,并利用地图、时间轴、社会网络图、表格、标记和词云等,浏览时间、地点、收信人、主题、书信里提到的任何地点、收信人的官位等。我可以把这些跟CBDB导出的数据结合起来,既可以宏观地检阅所有数据的情况,也可以集中地看某时段、主题或具体的书信内容(我们基于250通书信的样本分析出来的结果见图3~图6)。这样的工作有部分可以在Excel软件中完成,但是能把元数据、全文和各种可视化的选项结合,是灵活度高得多的做法。我不断因为这种新方法而重新检讨我过去在没有这些工具时细读史料获得的印象。从我这里附上的截图已经可以看到我们得出的一些整体观察(例如宰执作为收信人的现象非常突出,从吉州发到京城的书信也非常多,等等)。不过,由于这是一项仍在进行的研究,我这里希望说明的只是这种数字化研究方式在方法上和语文学上的优势,而非结论本身。/秒/蟑^踕/暁¨税?枉_ .追?醉~薪¢漳/截\

图3 在码库思标记杨万里书信(其中250通作为样本)之后,利用VISUS导出资料,在Palladio分析其地域和时代分布

图4 从VISUS导出标记过的杨万里书信(其中250通作为样本)之后,Palladio地图视图中的分面浏览(faceted browsing)界面

图5 从VISUS导出标记过的杨万里书信(其中250通作为样本)之后,Palladio社会网络视图中的分面浏览界面

图6 从VISUS导出标记过的杨万里书信(其中250通作为样本)之后,生成出官名和地名的词云

在我们翻译《贞观政要》的过程中,我们进行标记的目的不同,主要是为了编辑文本。由于翻译是集体进行的,我们对整部书进行标记,以进行标准化处理。标记的内容包括官名、地名、人名、书名的各个列表。我们也编制了一个灵活度很高的电子版,让读者可以用更多不同方式读这部书——这么一来,书中段落既可以用时间顺序来排列,又可以按它们在不同版本中的次序来排列。

在数字化研究中,很多进展都是研究开始之前无法预料的,往往令人惊喜不断。这些可能会吸引学者更投入使用数字化语文学的研究方法。+三+叶_屋\ ^蕪~错_内+容*在标记王明清《挥麈录》的信息来源人之后,为了看看该书提到什么人,而且都是哪些人提到的,我把其中出现的所有人名都标记了一遍。通过利用不同方法来衡量这些人物的中间性(centrality),我既可以据此印证我本来的估计(例如蔡京的中间性应该很高),又可以确认文本中不太明显的一些现象(例如曾布和宋高宗),甚至可以探索重要人物是跟何种主张联系在一起。关于他们的主张,我们不只可以通过对术语做考察,还可以通过分析群集(clustering),看某些人对其他人物的依附。这些发现可以帮助我们开发新的算法,预测文本包含什么偏见,并帮助历史学者判断他们的研究里需要包括哪些史料,并将之放到更广的思想和政治语境中。

结语

我希望以上内容能够清晰地说明一点:数字化的研究方法可以用于多种历史课题的研究,从特定文本的细读到大批文本的探索和分析,到利用成千上万篇文字来绘图,其中包含各种丰富的可能性。数字化的分析未必需要成为量化史学,我们现在借助数字化分析可以写出多种多样的历史著作。我们可以利用数字化分析寻找历史文本和物件的内在结构和信息,比如我过去第一个历史地理信息(GIS)方面的研究成果就曾把《历代地理指掌图》凡例中的读法在电子地图上呈现。[26]我们也可以试试实现社会科学化的史学,例如利用社会网络分析、取样、概率方法等研究工具,以测试过去的结论,提出新的问题,突出过去研究中的空白,并提出新的解释,等等。而且,我们在这过程中可以继续使用并丰富研究文史的传统方法,这些方法从近代早期就已经是史学研究的基石。

参考资料

笔者的博客文章:

不想错过《唐宋历史评论.第三辑》更新?安装晋江文学城专用APP,作者更新立即推送!终生免费,永无广告!可换源阅读!

放弃 立即下载
上一章 章节目录 下一页 推荐票