• 密云建造师学习资料交流组

    夏明方|大数据与生态史: 中国灾害史料整理与数据库建设

    世界生态环境史2021-09-20 15:48:53

    大数据与生态史:中国灾害史料整理与数据库建设



    [摘要] 本文在系统回顾有史以来中国灾害史料之发掘、整理和数据化过程的基础上,从人与自然交互作用的生态史角度,借鉴目前流行的大数据思维,对历史时期,尤其是建国以来国内灾害史学者业已进行的大规模史料整理与数据库建设展开批判性分析,一方面充分肯定这些工作对推进中国灾害史研究做出的重大贡献,另一方面则分析其内在局限与诸多不足,进而以清代为例,提出有关中国灾害历史数据库建设的最新构想,以为打造一个服务于国内外中国灾害史研究者的可持续扩展的公共学术交流平台而张本。


    [关键词] 生态史 大数据 清代 灾害数据库


    [中图分类号] K249 [文献标识码] A [文章编号] 1002 - 8587 ( 2015) - 02 - 0067 - 17




    21 世纪的中国历史学已进入前所未有的史料新革命时代,历史研究的数据化、信息化已成刻不容缓的必然之势,可谓大潮所至,浩浩荡荡,不可遏止。尽管在其初起之时,难免鱼龙混杂,泥沙俱下,不少学者竟而忧心忡忡,但 “河行百里者清”,相信经过史界同仁持之不懈的批评、反思和相应的规范、调整和重构,积而久之,此类数据化工作及其对史学的影响终将走向健康发展的轨道。作为自然科学和社会科学多学科交叉的灾害史研究,更应该发扬中国历史学研究的优良传统,继续奋进,成为这一潮流的排头兵,从而推动中国史学的新发展,亦借此推进史学为社会服务的步伐。这里拟从灾害史学界正在兴起的生态史研究范式出发,借鉴当前广为流行的大数据思维,对历史时期特别是建国以来中国灾害史料的文献整理与数据化建设进行较为系统的梳理和批判性分析,进而以清代为例,就中国灾害历史数据库建设提出某些新的构想。不妥之处,亟盼方家指教。


    一、有史以来中国灾害史料的发掘与整理


    在灾害史料的数据处理方面,以往研究作出的大量开创性工作,为探讨中国长期气候变化和灾害演变规律奠定了比较坚实的基础。


    早期的工作是以年表形式出现的灾害频次或空间分布统计。邓拓的 《中国救荒史》从 《汉志》所引 《礼记疏》,认为我国最早的灾害统计是古代阴阳家对 “水旱之大数”的推测。但依据史料记载进行较为严格的灾害发生时空分布统计的,还是明末徐光启的 《除蝗疏》。 至 19 世

    纪 70 年代,英国人谢立山先后发表了有关中国历史时期 ( 始于唐而终于明) 旱涝次数的统计结果。 清末民初以降,此类统计更为多见。清人黄伯禄曾从 10 多部史书和 391 种地方志中搜集公元前 1767 年至公元 1895 年间的大小地震记载 3322 次,后由法国传教士整理、补充,于 1913年编译出版,名为 Catalogue des Tremblement de Terre en Chine Ⅱ,是为第一部法文发表的 《中国地震目录》。 其他如 1921 年存吾的 《历代地震一览表》 ( 《地学杂志》1921 年 12 卷 4 期、5、6、7 期) ,1933 年邓清安的 《历代灾祥录》 ( 真平印务局 1933 年版) ,1935 年陈家祥 《中国历代蝗虫记载》( 《浙江昆虫局年刊》1935 年第 5 号) ,1949 年的 《钱江历代之潮患》( 《工程建设》1949 年第 1 期) 等都是此方面史料的汇编。其中较有代表性的成果,则有武同举 1926 年编著的 《淮系年表全编》,分栏列载传说中的唐尧至清宣统三年约 4200 余年淮河水系 “水患”、“水利”事件; 王树林的 《清代灾荒: 一个统计的研究》 ( 《社会学界》第 6 卷,1932 年 6 月) ; 以及沈怡编纂、赵世暹增补、郑道隆绘图的 《黄河年表》 ( 1935 年) ,共列表七,按年摘录公元前 2297 至公元 1933 年有关决溢、修筑的文献记载,并在 “总论”中分别以河道变迁和朝代为次,统计史籍所载黄河决溢次数。 但最为重要的,当属陈高庸的 《中国历代天灾人祸表》,此系民国年间历史学者从事的唯一一次大型综合性的灾害文献整理,所收文献包括 《资治通鉴》、《续资治通鉴》,《明史》、《明纪》,《清史稿》、《清史纪事本末》、《清鉴》等,还包括二十五史的本纪和五行志、《古今图书集成·庶征典》、十通、各朝会典、会要、实录以及其他有关史籍。


    解放以后,这种处理方式得到更为广泛的运用。诸如前面提及的很多资料整理,或纯以年表形式出现,如江苏省革命委员会水利局 1976 年 6 月编印的 《江苏省近两千年洪涝旱潮灾害年表》,张秉轮、方兆本主编 《淮河、长江中下游地区旱涝灾害年表》 ( 安徽教育出版社 1998 年版) ,或附加年表,如 “清代洪涝档案史料丛书”。其中的集大成者为宋正海主编,广东教育出版社 1992 年出版的 《中国重大自然灾害及异常年表》。全书按天象、地质象、地震象、气象、水象、海洋象、植物象、动物象、人体象等九大分科共列 254 个年表,100 余万字。其中自然异常类数较多,但多为短表、中表,自然灾害类数较少,但多为长表、超长表,其所占篇幅远超前者。


    从 1970 年代开始,研究者开始对历史时期的旱涝或地震灾害按其影响或危害程度进行等级划分,经数据转换以后制成可视化、数字化的图集。其中最具标志性的成果,是 1970 年代末 80年代初出版的 《中国近五百年旱涝分布图集》和顾功叙主编的 《中国地震目录: 公元前 1831—公元 1969》( 科学出版社,1983 年) ,两书迄今仍是国内外学术界从事中国气候变化和水、旱、地震等灾害研究的最重要的数据基础。此后又有 《明时期中国历史地震图集》、《清时期中国历史地震图集》以及 《远古至元时期中国历史地震图集》, 将历史时期破坏性地震以等震线和其他形式绘制地图,每震一图,并附简要文字说明和部分记载地震的历史文物,陈正祥的蝗灾分布

    图也别具一格。


    从 1991 年到 1996 年,中国测绘科学院联合北京大学、中国人民大学、复旦大学、中科院地理所、北京市社科院等单位的数十位专家,查阅了明清两代 530 余年大量的历史实录、文集、笔记和方志,将明清两代各类重大自然灾害史料整理、统计、摘录出来,经过定级、定量研究和计算机处理,形成编制图集的主要素材,继而选用经过历史考证、反映明清两代行政疆域的两种地理底图,将不同时期的灾害专题按照等级和灾种转绘其上,直观地表现出灾害发生的时间、空间、强度、频率、危害程度以及人类与自然灾害作斗争的经验。其最终成果即为 《中国自然灾害地图集》明清卷。据介绍,该书共分水灾,旱灾,水旱与灾伤,地震,蝗灾、风潮灾、冰雹灾、寒霜、冰雪灾、瘟疫、饥荒,黄河决口等 6 个图组,总计 356 幅地图; 另有分析灾害强度、频率的 “直方图”数十幅,每图均对灾情和救灾措施有简要的文字说明。 可惜此图制成后,迄今未见出版。


    此方面的后续进展可见于史培军的 《中国自然灾害系统地图集》 ( 科学出版社,2003 年)和 《中国自然灾害风险地图集》 ( 科学出版社,2011 年) 。尤其是前者,收录了近 500 年地震、洪水、台风、暴风雪和冰雹等自然灾害的宝贵资料,其中的 400 多幅地图及 50 余张统计表格,有助于分析我国各类灾害的形成、特点、演变及其分布格局。


    必须指出的是,不管是年表,还是图集,毕竟是以纸本的形式而存在,难以容纳我国数千年来积累的极为丰富的灾害、气候记录; 另一方面,将历史时期不同来源的资料汇聚在一起进行简单的频次统计,往往又忽略了这些资料因体例互异而造成的不均一性,不利于在较大的时空范围内进行对比研究。20 世纪 20 年代,竺可桢广泛搜集我国历史文献中 “雨旱灾荒、严寒酷暑”等记载,作为降水、气温等相关气候变化的代用资料,并首次运用每百年水旱灾比率作为标准,探究公元 100—1600 年间气候干湿变化的周期性 “脉动”,为后人研究历史气候指明了方向。1970 年代末中央气象局旱涝等级体系的确立,更是一个突破性的进展。从 20 世纪 80 年代开始,随着计算机的普及和发展,历史气候变化与自然灾害史料的信息化处理和数据库建立终于走进科学工作者的研究日程之中,并呈现不断的发展变化之势。


    1980 年代的史料信息化处理,主要是延续竺可桢的思路,将灾害信息转化成气候变化参数,消除不均一性,再通过数字编码等程序,实现信息化、标准化,节省存储空间。陈家其在 《从太湖流域的旱涝史料看气候信息的处理》一文中指出,历史气候信息处理的目的,在于建立一套方法,在信息提取的基础上将定性的历史气候信息转化为气候变化参数,并消除各种不均一性,从而建立历史气候序列,并着重介绍了建立太湖流域历史旱涝等级序列的方法和步骤。林振杰和郑斯中根据我国自然灾害史料的特点,设计了一套由灾情发生时间、地点、灾情种类及严重程度、参考文献等要素组成的数字编码方案,详细给出了用于灾情描述的编码表,如大气圈异常、水圈响应、动植物响应、人类初级响应及政府响应等描述用语的编码表。


    至 1990 年代,史料信息化处理和数据库建立的流程更加科学、完善,包含的信息量也更大,并且采用现代数据库技术对系统进行总体设计和使用流程编制,以实现数据库之间的互访,并建立属性数据与空间数据的联系。郑景云等提出了对主要源于历史档案的民国时期自然灾害史料进行信息化处理的方法,其中包括逐条史料的字段分解、对字段进行统一编码以建立数据库这两个过程,主要字段包括受灾地点、受灾范围、受灾成数、时间要素、天气状况、灾害级别、受灾程度、收成状况、人类响应措施等。 王静爱等根据所搜集的中国自然灾害数据和图件,应用数据库技术建立了由中国自然致灾因子数据库、中国省级报刊所载自然灾害 ( 1949—1990) 数据库、中国农村自然灾害灾情数据库、中国历史自然灾害数据库和中国行政区划 ( 县级单元) 空间数据库等 5 个子数据库所组成的中国自然灾害数据库,每个子数据库又分为原始资料库和派生数据库,并以国家统一县市代码作为各子数据库的公有字段,实现数据库之间的互访,建立属性数据库和空间数据库的联系。方伟华和王静爱探讨了中国历史水灾案例数据库的建立和存在问题。


    21 世纪以来,随着计算机技术的发展、信息共享网络的普及,气候变化和灾害史料的信息处理和数据库建立开始有了一些比较专门的研究,使得信息化更为规范,数据库功能开发更为全面,并力求能够提取与国际全球变化接轨的数字信息。郑景云等建立了过去 2000 年的环境变化数据库,通过各种历史环境要素重建的方法,将各类史料派生的资料或数据重建为历史环境变化的代用数据,采用树状与网状相结合的思路设计数据库的总体结构,从而实现了资料与数据的存储、检索、处理和空间分析功能。 2004 年,中国气象局经多部门合作完成了中国古籍中气象记录的采集、勘校工作,出版了 《中国三千年气象记录总集》,进而研制生成历史气候基础资料系统,推进了历史气候基础资料的规范化和客观定量化。 徐榕焓等以 《中国古代重大自然灾害和异常年表总集》为数据源,设计了包括灾害表、灾害时间表、灾害地点表、方志典籍表以及灾害数据主表等 5 张表在内的历史自然灾害数据库。 方修琦等建立了清代长江三角洲地区干旱、洪涝、台风灾害数据库,其设计采用三层结构,可实现查询、检索、简单分析和可视化的功能; 同时还建立了全国尺度的历史时期气候变化影响与适应数据库,构建了历史时期气候变化影响与适应研究的指标体系,重建了人口变率、农民起义频次、农业丰歉等级、社会经济波动等


    4 条全国序列及 10 余条区域尺度的代用指标序列,并建立了不同层次和区域的历史气候变化影响与社会响应的典型案例库。


    目前,有关气候变化与自然灾害史料的信息化处理和数据库的建立,主要有以下几家单位的代表性成果: ( 1) 中国气象局 “中国历史气候基础资料系统”; ( 2) 中科院地理所 “过去 2000年环境变化数据库”; ( 3) 中国水利水电科学研究院 “水旱灾害网络共享数据库”等。这些数据库为研究中国气候历史变化与自然灾害的时空演变规律提供了坚实的基础。


    三、灾害史研究的范式转换与已有史料整理存在的问题

    <section style="width: 70px;height: 40px;margin-top: -38px;margin-left: -40px;transform: translateZ(10px);background-image: url(" no-repeat;"="" 50%="" 640?wx_fmt='png");background-size:' un1liav7ojib6bhfzkzkwiaigyjtbrkwxd65y01ibf1koregfneewu59tl0y8iawev2cbv3tcll68smjgaxexceq6g="" mmbiz_png="" mmbiz.qpic.cn="">


    对于中国灾害史研究的学术梳理大都是从民国时期开始的,而实际上,以上揭示的有史以来灾害信息的记录和整理过程,并不能简单地看成是现实发生的灾害事实本身,而实际上是不同时期国人灾害认知的产物。


    这样的认知体系,大体经历了三个阶段,概括说来就是 “天命观”、 “科学观”和 “生态观”。纵观几千年的历史长河,其中绝大多数时间都是浸润在具有浓厚神秘主义色彩的 “天命观”或 “灾异观”之中,主要作为自然变动过程的灾害通常被看成人事活动的响应,因而也就与人间社会生活杂糅在一起,成为了中国文化传统的有机组成部分。清末民国以来,现代科学思想的传播与影响,使灾害逐渐成为一个独立的研究对象从人文视野中分离出来,并因之确立了一个具有现代科学特质的现代灾害学理论体系,是为灾害的 “科学观”,但是在建国以后相当长的时间里,人文社会科学的长期缺场,使这样的研究日渐趋于唯科学主义的路径,灾害研究的主体,灾害研究的对象,乃至灾害信息的搜集与整理,均偏重于自然科学或自然变异方面。 大约从 1980 年代中后期开始,随着自然科学学者对自身研究的不断反思,尤其是人文社会科学的重新介入,灾害形成的社会根源、灾害的社会影响以及人类对灾害的反应,越来越引起学界的重视,故而使得人文社会科学与自然科学逐渐结合起来,这实际上也是一种以人与自然相互作用为核心的生态系统分析模式———灾害的 “生态观”在灾害史、灾害学领域的诞生与成长的过程。


    以这样的生态观来考察灾害问题,首先需要对灾害本身有一个重新的认识,亦即所谓的自然灾害,并不仅仅是纯粹的自然力量异常变动的结果,而无论是在其形成之动力、作用之过程及其对人类生存的自然、社会环境造成的结果等方面,无不体现了自然与社会的双重属性,因此对于灾害的史料整理,也必须兼顾这两个方面。与此同时,对于灾害事件,则相应地需要一种过程的眼光,不再像先前那样,将其当做一个相对封闭的固化结构或个别的独立事件,而是把它看成一个开放着的,自然与社会两种力量不停地交互作用、相互转化的动态演化系统,既要看到灾害发生前其在自然、社会中的酝酿,更应看到之后其在自然与社会系统层层扩散的过程,这就要求我们必须扩展文献资料的搜索范围,不能仅仅局限于灾害发生即所谓成灾之时,局限于成灾的时间、地点、范围、程度等灾害要素,而应该以此为中心,扩及灾前之自然、社会变动,灾后人类的回应与调整,以及人们对灾害事件的认知与评价。而且,作为一种开放的动态演化系统,各类灾害之间,灾害与环境之间,实处于普遍联系、互为关联的复杂网络之中,这要求我们必须有一个整体的眼光,普遍联系的眼光,不仅要把各类灾害事件看成相互作用的整体网络,更应将其置放于包括自然与社会在内的整个生态系统的变动过程之中进行考察。


    对过去的灾害记录亦即灾害史料,也应作如是观。以往的研究当然不会简单地把这些记录与实际发生的灾害完全等同起来,除了资料的真伪之外,灾害信息记录的完整与否也是学界长期以来倍加关注的问题,但关键在于那些经过考证已被确定为 “真”的历史记载,并非像绝大多数学者一直认为的那样,是对自然变动过程的客观反映,当然也不能将其完全看成是主观建构的产物,就像近年来一些受后现代解构思潮影响的学者所坚称的那样,而应当把它视为灾害过程与灾害认知相互作用的结果。如此一来,我们就必须尽可能地穷尽各类不同的灾害描述或灾害记录,从各自不同的话语特征出发,进行系统的交互式校勘,才有可能对其性质进行较为准确的判定,从而为数据转换工作奠定坚实的历史考证基础。


    据此重新审视历史时期,尤其是建国以来中国灾害史的资料整理和数据化工作,我们当然不能否认其为推动中国灾害史研究做出的不可磨灭的巨大贡献,也不能否认其在未来研究中所起的基础性作用,但是必须看到,相较与新时代灾害史的最新研究态势,其中的诸多不足之处似亦勿庸讳言。


    首先,从文献学的角度来说,以往的灾害史料整理,大体上有四类,一是根据特定的研究需要,从文献中查找史料,予以摘录、归类、校核、编排,如各类气候历史资料; 二是对各类资料进行综合比勘,在保留史料原貌的基础上做总结性描述,如 《近代中国灾荒纪年》; 三是对反映灾情与救荒的专门文献进行标点,汇总出版; 四是将有关灾害史料从原始文献中分离出来,大致分类后,据原始文献直接影印。就资料来源而言,第一种类型的史料汇编,多为自然科学工作者所为。这些资料,利用范围各有所长,亦各有所短。目前为学界广为利用的 《中国近五百年旱涝分布图集》所收资料基本上以方志为主,档案、报刊、官私文献及其他相关史料涉猎甚少,而所用方志虽然多达 2100 余种,仍不及现存方志总量的五分之一。《中国三千年气象灾害总录》收录文献达 7855 种,但主要是正史或地方志,见于私人日记和清代的宫廷档案气象记录,因其体例另成一格,编者并未对此作系统收录。《中国地震历史资料汇编》涉猎的文献种类最为多样,但是在档案、碑刻文献等方面仍有大量增补的空间。至于晚清报纸对于灾情的连续报道,均告阙如。清人文集收录亦少。对于地方志,也主要利用 “灾异志”、“祥异志”或 “大事记”等部分,对于其他部分无从涉及。第二种类型的灾害史料,对档案、报纸及文集的利用力度较大,但是对地方志利用很少,外文报刊对中国灾情的报道也未见采用。《近代中国灾荒纪年》将各类史料揉为一体进行叙述,有利于从总体上反映灾害全貌,却不利于从文种角度分析史料本身的价值。第三种类型的资料汇编,主题鲜明,便于从政府与民间两个角度探讨人类对于灾害的应对与响应,而且其中大多数文献都是围绕特定重大灾害事件编撰而成,如 《钦定辛酉工赈纪事》,内含全面、系统的灾情描述和救灾过程,有助于从个案角度对灾害影响模式进行深层次的分析,但仍有许多重要文献未加收入。第四种形式为专题文献复制。如历代方志之 《灾异志》汇总,以及 《中国历代荒政史料》,规模庞大,又系影印,便于保存史料原貌和查核史料,但所占纸本容量太大,利用仍有不便,流传不广,难以在更大范围内实现资料共享,亦未加甄别,属于剪刀加浆糊式的古籍整理层次。此外,还有一种是作为子集收录于其他非灾害类专题的史料集之中,往往比较零散,不系统。


    其二,从史料的灾害信息而言,主要由自然科学工作者整理的资料汇编,其涵盖的灾害种类,主要是涉及影响中国社会的三大主要灾害,即水灾、旱灾与地震,其他灾害如蝗、疫、风、雹、霜、雪、寒冻、酷热以及山崩、滑坡、尘暴、火灾等,尚缺少全面、系统的整理; 对灾害之前的异常现象或灾害导致的其他方面的变化,如旱涝之后农作物的异常丰收 ( 史载 “大有”、“大有年”等) ,亦未给予足够的注意,不利于更全面地揭示灾害的成因及其环境后果。更突出的问题是,这些资料大都偏重于雨情、水情等自然变动方面的信息,对灾害导致的社会后果则相对简略,不利于更全面地揭示灾害影响的社会扩散过程。建国后最早成书的 《中国地震资料年表》,仅聚焦于描述地震成灾的过程,而有关灾前震兆、灾后救济方面的内容则较少。后来的《中国地震历史资料汇编》吸取这一教训,对所选资料原样保存,可算是一大进步,但并未被其他著作效仿,殊为可惜。如 “清代洪涝档案史料丛书”,在这一方面尚有改进的余地。


    其三,对于搜集的资料,大部分著作都是照单全收,未能与其他史料进行比勘,亦未对资料记载的历史语境进行客观的分析,以致难以识别史料记载的陷阱与雷区,最终有损研究结论的可靠性。如有清一代成灾标准的更改与变化,连续多年的甘肃冒赈案对资料记载的影响以及道光中叶开始江南及其他部分省区日趋严重和普遍的灾歉捏报问题等。尤其是 《中国气象灾害大典》一书中涉及建国之前的灾害史料,基本上是以 1980 年代以前整理的气候历史资料为依据,在灾情叙述过程中又将各种来源的史料杂糅在一起,且绝大多数分卷没有交待资料出处,难以查核,不能不说是一件令人遗憾的事情。即便是 《近代中国灾荒纪年》对此有明确意识,但也存在一些问题。


    第四,以上资料汇编,有不少是以清代作为独立的时限,但更多的是以几千年或近五百年作为研究尺度的,虽然大都将清代包括在内,但并未将其作为独立的对象予以处理。实际上,与此前其他时期相比,有清一代遗留下来的灾害资料最为丰富,最为多样,最能反映近世中国自然环境变动与救灾机制嬗变的过程。尤其是在新世纪国家清史工程启动之后,大规模的文献整理工作随之喷涌而出,给世人增加了更为丰富的文献宝库可以供发掘,这当然包括灾荒史料在内。


    以年表和地图形式对灾害史料进行的数据处理,经过学界多年来的探讨与实践,其内在局限也越来越充分地显示出来:


    首先,就空间而言,《中国近五百年旱涝分布图集》是以 1—2 个府为单位进行计算的,且仅仅选择全国 120 个站点作为样本进行类推,在一个气候、地理类型极其多样化的国度,这一做法显然不足以反映相对真实的旱涝情势。这种情况,当然也为后续工作留下了大有作为的空间。其次,就时间而言,又是以 “年次”进行统计的,无法反映灾害的年内 ( 具体到月、日) 及年际变化。在确定灾害频次和等级时,又按照一定的比例进行统一核算,与事实不尽相符。 第三,包括其他灾害在内,各种统计数据往往是以单一灾害或单一灾种为对象,不利于对各类灾害的时空分布和内在关联进行综合性、整体性和相关性的分析,不利于动态地揭示灾害生成与演变的规律。第四,也是最重要的问题,就是对灾害社会性的淡化,以及由此而导致的灾害数据处理的 “自然化”和 “气候化”倾向,前者是指偏重对旱情、雨情和震情等自然现象的关注,而相对忽略了灾害形成、扩散过程中的社会因素,甚至将由社会因素所激发、加剧的灾害也统统纳入统计范围之内,结果有可能夸大自然界的变化程度; 后者与此息息相关,即是将史料中有关旱、涝灾害的记载,转换为气候变动现象进行统计分析,忽略了 “旱涝”概念的气象学界定和灾害学界定两者之间的区别, 结果造成评定后的气候情势与实际气候状况存在不小的差距。如何将学界最新的批评和相关建设性的意见转化到新阶段的资料整理与数据转化工作中去,也是一项极富挑战性的创新工作。


    这些问题,有的已在发端于 1980 年代的历史灾害与气候史料的信息化过程和数据库建设中得到较好的解决,有的则因思维定势,仍继续存在。大体说来,以上介绍的几种主要数据库,在数据库设计思路、子数据库结构、史料信息的字段编码处理、数据库功能等方面为未来的研究提供了很好的借鉴和基础,但是另一方面,在灾害史料的丰富性与均一化处理、更完善合理的数据库结构、灾害指标序列的提取、自然灾害本身与人类响应过程信息的融合等方面仍有进一步探讨、发展的空间。其带有普遍性的特点和问题在于:


    其一,已有数据库,其目标所指均非灾害研究,因而在资料的取舍方面也各有侧重。《中国三千年气象记录总集》主要搜集了天气、气候、大气物理现象方面的史料记录,旨在为中国历史气候研究提供基础资料; “过去 2000 年环境变化数据库”主要囊括历史文献中的旱涝、冷暖、灾害、雨雪、收成、粮价记录,还包括自然证据、现代观测资料等,目的是重建历史环境变化 ( 温度、降水) 的代用数据; “水旱灾害网络共享数据库”主要搜集水旱灾害方面的资料,为防洪抗灾提供网络信息平台。其他学者的研究,或关注自然灾害史料或历史气候信息化处理方法和数据库建立,或侧重某区域自然灾害数据库的建立,或聚焦于人类对气候变化影响与适应的序列和案例数据库等,亦复多样而纷杂。首都师范大学的阎守诚从 1999 年起曾组织力量开展这样的项目,设想建立一个专门的自然灾害数据库,终因力量有限,半途而废。故而,到目前为止,国内外还未曾建有一个能够记录灾害发生完整过程和信息,亦即包括从天气、地质等自然变异现象到成灾过程,乃至对人类社会影响及响应的综合性灾害史料数据库,以便更全面地揭示灾害成因和环境后果,更好地满足自然变动 ( 如气候变化) 、灾害分异、灾害影响与适应、防灾减灾应用等多方面研究的资料需求。


    其二是数据源各不相同,所据资料或以自行整理的史料为主,或以他人的工作为前提,都有很大的局限性。如张德二的数据库,水利水电科学研究院的数据库,主要是洪涝档案史料与此前学界整理的部分气候历史资料,新近出版的旱灾档案史料及 《再续行水金鉴》均未收录。中科院的环境变化数据库,多为雨雪粮价、土地利用等方面,直接的灾害史料所占比例相对较小。至于其他方面,前文在讨论史料汇编时已有涉及,兹不赘述。事实上,随着人文社会科学对灾害史研究的介入,学界对灾害认识更加全面,以往被遮蔽的信息逐渐引起广泛的关注,而且由于数字化进程的加速,原来未能利用、未曾发现的资料喷涌而出,如何构建一个更具包容性的方法论体系和技术系统,将这些资料纳入数据库建设之中,是未来数据库建设的重要目标之一。


    其三是现有数据库建设中未能体现资料校核、考证和比勘的过程。原始资料一经录入,即不再进行校核、考证,往往以讹传讹,而且不同种类的史料相互之间的比勘也不够深入,在很大程度上影响了最终成果的准确性、科学性。


    其四,从原始资料整理到数据库之间缺少一个过渡环节,即原始文献资料的信息集成,难以实现真正的资源共享,形成资料基础的累积性机制。毫无疑问,这些数据库,以其不同于纸本的存储形式,便于进行增补和修正,可惜多为单兵作战,未能聚为规模,难以形成重大突破,亦因彼此之间缺乏合作,未能形成资料基础的累积性成长机制,以致后续学者从事相关研究时每多重复劳动,浪费了大量的人力物力资源,延滞了学术发展的步伐。另一方面,这些资料,均经摘录转化而来,除少量公开出版之外,其原始文献的储存介质,或为原文复制的纸质、胶片,或为资料摘录卡片,量大体大,保管未尽完善,多有遗失、霉变,难以复原、查核。如 《中国自然灾害图集》,仅有纸本形式,且一直不曾出版。如此一来,这些数据库,大都未能实现资源共享的初衷,能够共享的仅仅是数据库的最终产出,即以数据库为基础而生成的各类分析性结论,因之难以形成真正的学术批判和学术交流机制。


    限于各自所处时代的历史条件,上述资料,尤其是旱涝气候史料的整理,还存在诸多重要缺陷,已经不能适应现时代灾害史研究的新要求。目前所要做的,就是在进一步扩展、夯实数据库资料基础的前提之下,将数据库共享的环节从输出结论的终端移向输入资料的始端,也就是在原始文献库和原始资料库的环节,建立文献校核平台,文献增补平台,形成互惠式公共信息交换机制,充分发挥学界整体力量,实现资源共享,以最小代价获取最大效果的资源积累和扩展,造福学界和人类。当代新技术的不断出现和发展,能够推动数据库设计的合理性、科学性、共享与多功能的实现。

    四、新时代中国灾害历史数据库建设构想——以清朝为中心

    <section style="width: 70px;height: 40px;margin-top: -38px;margin-left: -40px;transform: translateZ(10px);background-image: url(" no-repeat;"="" 50%="" 640?wx_fmt='png");background-size:' un1liav7ojib6bhfzkzkwiaigyjtbrkwxd65y01ibf1koregfneewu59tl0y8iawev2cbv3tcll68smjgaxexceq6g="" mmbiz_png="" mmbiz.qpic.cn="">


    通过上文的梳理和分析,似乎可以得出这样的结论,即一种在生态观视野下建设的灾害信息数据库,最起码应该达到如下之目标: 文献资料的集成性和累积性; 资料来源的多样性和整合性; 数据处理的精细化与科学性; 信息交流的公共性与开放性; 服务功能的多元化与可视化等。幸运的是,所有这些,从技术路径上来说,都可以在当今世界蓬勃兴起的 “大数据革命”① 中得到有效解决,而借助于这种新型的计算机和网络技术的发展,大量被尘封的历史文献资料,亦得以在短时间之内得到大规模的整理和公开,且势头迅猛而强劲,也为建立这样的数据网络奠定了极为雄厚的资料基础。


    当然,即便如此,欲对整个历史时期的灾害史料进行一次全面的校核和增补,绝不是少数研究者或科研单位短期内所能完成的,这将是一项长期艰巨的历史任务。以往的研究,或动员全国力量,或穷个人数十年心力,均非短时间所能一蹴而就。但是,如果根据现有条件,选择其中一个灾害记录相对丰富的断代作为重点,集中攻关,在未来五到十年的时间内,应是可以取得突破性进展的。处于明清小冰期之内、横跨传统与现代社会转型时期的清朝,应该是一个最具代表性的时段。此种清代灾害信息集成数据库若能如期建成,将会大大方便全球变化、灾害研究领域中史料的使用,并可望形成完整的一套史料考订和信息化集成的方法。这样的数据库也不仅仅是史学工作者的任务,应是和自然科学工作者分工合作的产物,若此将更有利于提高历史灾害数据库的完备性、可靠性以及科学问题的针对性,而兼容、便捷的信息化数据,亦便于未来学者对历史灾害规律、发生机制以及人类应对等问题进行更加深入的科学研究。从清史研究的角度来说,该数据库的建设,将和国内外学界已经完成或正在建设中的其他领域各种类型的数据库,相互衔接,相互配合,共同推动清史研究的信息化进程。


    正是基于这样的考量,中国人民大学清史研究所与北京师范大学地理学院、南开大学、中国政法大学、中山大学等兄弟单位的诸多同仁,决定携起手来,共同承担此项使命。其总体目标,是以人与自然交互作用的研究视野为中心,运用生态系统分析方法,在国内外已有研究的基础上,从事清代自然灾害史料的搜集、整理、校核、整合与数据转化工作,建立一个融资料的采集整理、存储更新、查询检索,以及服务于数据统计分析、制表绘图、动态演示等信息处理功能为一体的,可持续积累的扩展型灾害信息集成系统,为未来清代自然灾害地图集与清代自然灾害动态演示系统奠定资料与技术基础,进而也为国内外学界研究清代乃至中国自然灾害、环境变化以及灾害与社会的诸种关系提供公共信息平台,以期进一步推动清代灾害史、环境史乃至清代政治、经济、社会、文化等多方面的研究,亦为当代全球变化研究和国家减灾工程建设提供更准确、更全面的史料基础和学术借鉴。


    为实现上述总体目标,着重将从以下三个方面展开工作:


    其一是编纂 《清代自然灾害史料长编》。其体例,以年代为经,以省区为纬,按实录 ( 含通典、通志、东华录等) 、正史、方志、档案、文集、报刊、荒政专书以及其他文献等类别,依序排列史料,并按统一规范注明资料来源,以便查考。为改变以往史料汇编偏重灾情之不足,《长编》所收史料,将扩及与各该年次特定灾害事件有关的一应社会变动以及救灾备荒等各个方面。


    其二是撰写 《清代灾荒纪年》。此系效仿李文海教授主撰 《近代中国灾荒纪年》的体例,在对后者进行较大规模扩充、修改的基础上,突破鸦片战争的界限,将有清一代作为一个整体纳入记述的范围,形成一部完整的清代灾荒编年体概述,以反映清朝自立国至覆亡绵延 260 余年之久全国各地的灾情总貌以及相应的社会变动与救灾备荒实践的演进历程。《纪年》的撰写,一方面须以 《长编》为基础,尽可能充分地占有史料,另一方面必须充分借鉴国内外现有研究成果,并对各类史料进行比勘、考证和综合,从而形成对于特定灾害,尤其是重大灾害事件的准确判断和客观认识,最终较为清晰地勾勒出各类重大灾害发生的状况及其在社会层面扩散的过程。因此,《纪年》既是借鉴、吸收以往所有研究成果的集大成之作,同时也是为清代自然灾害信息集成数据库奠定坚实的历史学基础,为后续的数字编码和信息转化创造条件。


    其三是建设 “清代自然灾害信息集成数据库”: 作为一个完整的清代自然灾害信息集成系统,其最终建成之后,将是一个融资料的采集整理、存储更新、查询检索、校核比勘,以及数据统计分析、制表绘图、动态演示等信息处理功能为一体的巨大系统,依次包括原始文献库、原始记录库、专题数据库等三个部分或层级。


    其中,原始文献库和原始记录库两者合为原始数据库。前者主要存储包括图片、文档、网页、影像等各类型原始文献,且实现与原始记录库相互链接的功能。后者主要用于存储从各史料中摘录所得的所有有关灾害的信息,并实现检索查询、校核等功能。


    原始记录库包括原始记录表和原始校核表,设立 ID1 ( 以年和序号编号) 、地点 ( 省、县) 、灾害类型、史料记录、资料来源、原始出处、奏报人与奏报时间等字段,能够实现按照年份、灾害发生地点、灾害类型、社会影响、救灾程序等进行检索查询的功能。在原始记录表之外,另设原始校核表,记录考证校核过程与相关证据,并将校核过的数据记录存储其中,同时在原始记录表中设立考证备注字段,并将每条校核过后的记录与对应的考证备注建立链接。


    专题数据库是基于原始记录数据库而设立的不同类型 ( 依研究主题确定) 的数据库,由原始记录表、派生数据表和合成数据表三层组成,派生数据表分别与原始记录表、合成数据表建立链接。中间层为派生数据表,由原始记录表生成,目的是将该表中每条原始记录进行拆分,将文字信息转化为数量指标,以实现将不同类型信息分离成不同字段、使同一字段赋值唯一的功能。最顶层为合成数据表,由派生数据表生成,对于同一年同一 “发生地点”( 县) 的多条记录,从资料来源、资料分辨率、记述详略、对该地的针对性等方面进行比较、插补与剔除,并采用地理时空关联的分析方法进行校核,进而综合成一条记录,以建立属性数据与空间数据的链接,最终实现指标序列提取和空间制图分析以及动态演示等功能。


    该数据库同样是以 《清代自然灾害史料长编》为基础而建立的,但是与 《清代灾荒纪年》不同的是,它将与 《长编》一起,构成一个动态的与时俱进的灾害信息累积式扩展系统。作为过往研究的集大成之作,《纪年》一经撰写完毕,即难以容纳后续新发现的史料或最新的研究成果,增补、修订,殊非易易,但是 《长编》与数据库却是一个蓄水池,而且应是一个现有技术条件完全可以支撑的具有无限容量的蓄水池。任何在史料和研究上的新发现、新进展以及本项目在有限时间内难以收罗的其他史料,均可随时输入其中。当然,这样一种 “灌水”的工作,需要有一个可持续运行的灾害研究团队来负责,但更需要国内外从事相关研究的学者共同的努力与合作。为此,整个数据库的建设,从最初的原始文献库,到之后的原始记录库,从原始记录表到原始校核表,再到最终的输出端专题数据库,都将设计为一种开放式的公共交流平台,供相关研究者使用,同时也希望相关研究者能够通过此一平台之各个环节、各个层级,为数据库建设作出反馈和回报,从而以一种互惠的方式推动数据库的建设、维护和发展。


    中国人民大学 “近代中国灾害研究课题组”从一开始创立以来,就在李文海教授的引领下,将资料整理与建设放在头等重要的位置,并尽可能快速地将其成果向学界公布,以期推动中国灾害史研究的整体发展。另一方面,在整理编纂这些资料的过程中,也总是得到相关档案馆、图书馆以及学界诸多师友的鼎力支持。因而,不管是 《近代中国灾荒纪年》及其续编的出版,还是


    《中国荒政全书》和 《中国荒政书集成》的付梓,都当之无愧地属于一种公共文化工程。此次数据库建设,实则希望继承老一辈学者的无私奉献精神,并试图将这种公共工程从静态、凝固的纸质载体推向动态的电子网络,在数据库建成之后,将所有环节均对外开放,使利用者登录数据库之后,既可查阅利用其中的资源,也可直接进行资料输入、文献校核和发表评论等工作,如此交互操作,势必推动数据库的容量以更快的速度增长,使其变成一个名副其实的公共学术交流平台,并与学界同仁一起,在清代乃至中国灾害史研究领域的学术理念、学科建设与资料利用等方面取得新的突破性进展,共同促进中国灾害史研究的可持续发展。


    首先,在中国灾害史或灾害学的学术思想和研究理论方面,力图把中国历史学的考据传统与当代灾害、环境研究的最新技术手段、分析方法和研究理念充分结合起来,构建新的灾害研究模式。其中最核心的理念,就是运用人与非人类自然互动反馈的生态系统分析方法,推动人文社会科学与自然科学的有机融合,促进灾害研究范式的转换。具体而言,就是在资料整理的过程中,不仅将有关灾害的自然、社会各方面要素信息均囊括在内,还要从人与自然互动的视角分析史料记载本身的话语特征,尽可能从看似自然的变动中捕捉社会的影子,从看似社会的人文事件中寻找自然的力量,进而为更加准确、清晰地揭示灾害的生成、扩散与演化规律提供尽可能丰富的资料基础。


    与此相应,在学科建设方面,则力图进一步推动灾害史研究领域自然科学与人文社会科学的交叉与融合,进一步培育和壮大中国灾害史研究的新生力量。近百年来,中国灾害史研究的每一次重大发展,都离不开对灾害史料的大规模发掘和整理,以至于我国著名灾害学专家高建国先生,将建国以后地震史料、气候史料、洪涝档案史料以及荒政史料的整理与出版,称之为中国灾害史研究的四大里程碑。新的灾害数据库建设,将一改以往以纸质媒介为主导的资料整合与传播途径,同时打破现有数据库各自为营的封闭式管理模式,以其可持续的累积式信息扩展系统为灾害史研究提供崭新的公共学术平台,尽力推动灾害史研究从资料基础到技术路径等多方面的重大变革。而在此过程中凝结而成的新的研究团队以及经过实践锻炼的大批博士研究生和硕士研究生,也很有可能会成为更具活力的灾害研究队伍,反过来又为数据库建设的可持续发展提供不竭的人才支持。


    在文献发掘与利用方面,也力求借助于信息集成数据库的建设在诸多方面形成较大突破。这不仅体现在对灾害史资料基础的大规模扩展,也体现在对各类文献进行更加科学的辨析,更体现在通过 《长编》、《纪年》和数据库三个方面的建设,形成一种可持续的累积式灾害信息扩展机制,从而在节省大量人力、物力资源的基础上,为国内外清代或中国灾害史研究提供源源不绝的资料基础和强大的技术支撑。


    鉴于这样的数据库是一个包括自然变动与社会响应等各方面信息在内的综合性的大型灾害信息集成系统,故在文献方面,首先要做的,就是进一步扩大资料范围,细化数据指标。最大限度地涵括档案、方志、文集、报刊、官书、正史以及其他各类相关文献中的灾害信息; 就灾害信息本身的收录而言,也要求进一步扩展灾害种类和相关环境因素,即从水、旱、地震等灾害,扩至蝗灾、雹、风、霜、沙、潮、疫、寒、热、山崩、滑坡、泥石流、雪、火等各类灾害,以及农作物异常丰收等特殊气候、物候现象; 对于每一种灾害,其收录的内容,则注重自然与社会的结合,不仅包括自然现象,也包括由此引起的社会变动和反应,以期有助于完整、系统地展示灾害的时空分布与演化特征,灾害的成因与影响,以及灾害救济等各方面情况。其目的在于突破以往以单一灾害、单一灾种为主要内容的资料汇编形式,力求将历年各省区各类自然灾害包容其中,便于揭示各灾种之间的关联,从整体上反映灾害演变大势。


    与此同时,这一数据库将强化资料的甄别工作,即在资料库建设过程中,除了提供基本数据之外,还要预留空间,以便建立相应的原始文献链接,显示文献考证的过程,供用户查核,同时建立信息反馈系统,充分吸取学界研究成果,尽可能保证数据的完整性和准确性,亦可借学界同仁之众力,共同建立一个经得起时间考验的、符合学术标准的清代灾害历史资料库。相应地,通过将灾害资料的载体由纸本向电子平台转化,改变以往相对封闭、相对分散的资料整理传统,力求使其变成一个融开放性与累积性为一体的平等互惠、动态积聚的公共文化工程。此外,在充分借鉴国内外学术成果的基础上,通过数据制作的工作实践,尝试着建立一套新的灾害信息处理规范,建立更加合理的灾害评价体系,从而使灾害信息处理工作进入一个新的层次。


    总而言之,作为中国灾害史研究中迄今规模最大的 “断代工程”,其最终成果,将第一次以编年体形式全面、完整、系统地描述清代 260 余年间中国自然灾害的总体状况及其变化趋势,揭示灾害对中国社会各层面的诸多影响,呈现近世中国在灾难面前采取的一系列对策及其因时因地而发生的变异与革新,进而从传统走向现代化的艰难历程,其对于推进清代灾害史乃至中国灾害史的研究,拓展对历史时期中国社会生活和环境变迁的了解与认识,理应具有重要的学术价值;而且这样的成果,尽管是以文献整理与数据库建设为主要内容,但在实际建设过程中必然离不开对灾害学理论的深入探讨,更会促进人文社会科学与自然科学之间更紧密的合作与融合,推进生态系统分析方法在灾害史研究中的贯彻和运用,尤其是在史料的搜集、解读过程中传统考据学方法与现代科学实证分析手段的碰撞与结合,势必促成一门新的灾害历史文献学的孕育或胎动,进而将中国灾害史研究推向一个新的阶段,并在国内外灾害史研究的话语体系中占有相当的位置。中国有句古话,叫 “秀才不怕衣裳破,就怕肚里没有货”。历史研究尤其如此,只有在文献资料的整理和传播方面始终占据主导性的优势,才有可能在学术界立于不败之地。

    作者:夏明方(1964- )男,中国人民大学清史研究所教授。

    文章来源:《清史研究》,2015年02期。

    扫一扫二维码,关注西南环境史研究。

    更多新闻资讯,敬请访问西南环境史研究网。 网址:www.xnhjs.ynu.edu.cn


    友情链接

    1分快三