文章正文

诗词 散文 小说 杂文 校园 文苑 历史 人物 人生 生活 幽默 美文 资源中心小说阅读归一云思

红色文献数字化建设现状研究

时间:2023/11/9 作者: 图书馆界 热度: 18591
任 静,林卫东,李洪梅

  (山东省图书馆,山东 济南 250100)

1 引 言

红色文献是指1921年7月中国共产党成立至1949年10月新中国建立之前由中国共产党机关或各根据地出版、发行、制作的各种文献资料,涵盖图书、期刊、报纸、档案等,包括老一辈无产阶级革命家著作中具有代表性的版本,中国共产党从诞生到掌握政权期间的一些重要出版物以及档案文献、伟人名人手迹、标语、票证、传单等多种文献类型,还有国统区、敌占区刊行的进步书刊及伪装本等,具有重要的文献价值和收藏价值,是民国文献的重要组成部分。

  数字化技术的迅猛发展为红色文献的挖掘和整理提供了平台,继民国文献数字化建设后,随着国家对红色文献的重视,许多民国文献数字化开发公司如爱如生、大成、古联等,也开发了一批内容丰富、检索便捷的红色文献数据库。红色文献数据库相对于民国文献数据库来说,开发相对较晚,数据库功能更加成熟。公共图书馆和部分高校图书馆是红色文献的主要收藏单位,也陆续开发了一批红色文献全文数据库、书目数据库和专题数据库。这些红色文献数据库的开发,不仅有效保护了图书馆等收藏机构的纸质文献,而且为中共党史、新闻传播学、历史学、文化学和红色文化教育等特色学科和专业提供教学和科研支撑,同时,为普通大众和研究者在互联网上提供红色文献服务研究提供便利。

2 红色文献综合性全文数据库建设概况

红色文献综合性全文数据库大都是收录资源较全,检索功能便捷,并且有一定市场影响力的产品。

2.1 “爱如生红色历史文献数据库”

“爱如生红色历史文献数据库”是国内外第一个图文并茂全文检索的红色文献数据库,总计收录300余种文献,完整收录《红色中华》《新中华报》《新华日报》等红色报纸。

  该库的“三窗点选式”全图页面可以瞬间切换,强大的检索系统可以实现毫秒级全文检索。

2.2 “大成中共党史期刊数据库(—1949)”

“大成中共党史期刊数据库(—1949)”是国内建设较早的红色文献数据库,收录270多种期刊1万多期。该库的按篇检索提供题名、作者、刊名3个检索项,按刊检索提供刊名、年代、创刊地、单位4个检索项,支持繁体字检索。收录期刊有《八路军军政杂志》《东北画报》《激流》《解放》《民主青年》《秦钟》《群众》《中苏文化》等。

2.3 “中国历史文献总库——红色文献数据库”[3]

“红色文献数据库”收录红色图书、期刊、报纸约 6 500 余种,并持续扩充内容。该库具备全文检索功能,检索结果能够在图像中精准定位,其中的红色报纸和红色期刊都可实现篇目单独下载。红色图书包括毛泽东《论持久战》的各种版本;红色期刊包括当时延安出版的《布尔塞维克》《解放》《八路军军政杂志》等;红色报纸包括《邯郸日报》《冀中导报》《新洛阳报》《豫西日报》等。

2.4 国图“红色报刊档案数据库”

“红色报刊档案数据库”是由北京国图书刊服务有限责任公司开发,收录由中国共产党直接领导或间接创办的党报党刊,包括《群众》《解放日报》等重要红色报刊和档案资料。该库可提供20余万条文献,并且包含约3万余幅图片。

2.5 古联“红色经典报刊库”[5]

古联“红色经典报刊库”主要收录中国共产党直接或间接领导及参与创办的报刊,是弥足珍贵的党史资料。该库包含106种报刊,可以实现全文检索。其中包括《党的生活》《犁头》《劳动界》《劳动与妇女》《布尔塞维克》《北方红旗》《中国青年》《八路军军政杂志》等珍贵报刊。

2.6 “延安时期红色文献数字研究平台”

“延安时期红色文献数字研究平台”是延安大学图书馆建设的综合性红色文献研究平台,整合了延安时期的图书、报刊、档案、图片和音视频数字资源,多数文献资料都是首次解密、公开出版,具有珍贵的史料价值。该平台共包含3个数据库,其中,“延安时期中共中央机关报全文数据库”历时3年,实现了红色报纸OCR识别,辅以人工加工基本保证了文字识别的准确率,这在众多红色文献数字化项目中实属难得。

  

  图1 《延安时期中共中央机关报全文数据库》报纸全文数字化界面

2.7 “中国抗战大后方3D数字图书馆”

“中国抗战大后方3D数字图书馆”由重庆图书馆建设,收录近5万种数字藏品,包括抗战时期出版的各种报纸、杂志、期刊、名人手迹以及重庆图书馆收集的抗战时期的图片和视频资料。该图书馆利用3D虚拟现实技术像读者展示珍贵文献资料,是国内第一家抗战文献3D专题数字图书馆。

  从上述对综合性全文数据库的介绍可以看出:第一,从数据库收录资源的文献类型上看,以期刊、报纸和图书全部为收录对象的数据库较多,有“爱如生红色历史文献数据库”“延安时期红色文献数字研究平台”“红色文献数据库”,专门收录期刊的只有“大成中共党史期刊数据库(—1949)”,专门收录报刊的是古联“红色经典报刊库”。第二,从数据库收录资源的数量看,图书收录最多的是“中国历史文献总库——红色文献数据库”,收录图书 6 500 余种;期刊收录种类最多的是大成“中共党史期刊数据库(—1949)”,收录期刊1万多期;报纸收录种类最多的是“中国历史文献总库——红色文献数据库”,收录报纸70余种;档案收录最多的是国图“红色报刊档案数据库”。第三,目前已开发的红色文献数据库都非常注重检索功能,“红色文献数据库”可全文检索、篇目间迅速跳转、浏览与下载同步完成,还具备复制、引用、笔记、收藏等个性化功能,配备联机词典、纪年查询、专名查询等辅助工具;“延安时期红色文献数字研究平台”可以用不同的文献资料类型作为导航,并且具有简单的数据分析功能。

3 红色文献书目数据库建设概况

若干图书馆还建有一些非常有价值的红色文献书目数据库,这些书目数据库是开展红色文献研究、开发、利用最基础的资料来源。例如,延安大学的“延安时期红色文献数字研究平台”就是以书目数据为基础,最终建成一个综合性文献服务研究平台。红色文献书目数据库包含了红色文献的诸多基本著录信息,如题名、责任者、出版社、复本数、刊期、馆藏情况等,可分为全国性的书目数据库和地方性的书目数据库。红色文献全国性的书目数据库有中国国家图书馆的“革命历史文献联合编目中心资源库”,包含 10 964 条书目数据,成员馆有25家省市级公共图书馆和高校图书馆。该库提供题名、著者、年代、收藏单位、馆藏量等检索入口,包含题名与责任、版本项、出版项、载体形态项、主题、收藏单位等基本信息,可以查看标准名格式、字段名格式和MARC格式的数据信息。该库收录的红色文献都是各成员馆馆藏中比较有代表性的红色文献,并不是全面收录,因此,该库虽是全国性的联合目录但不能替代地方性的书目数据。

  地方性的书目数据库是各红色文献收藏单位根据地方红色文献的特点建设的,通过地方性的书目数据可以更有针对性地了解地方红色文献收藏情况,对地方红色文献研究具有重要意义。地方性的书目数据库有上海图书馆建设的“上海图书馆藏革命历史文献数据库”,包含 6 700 余种各类珍贵红色文献,其中,最具代表性的是毛泽东的著作、单行本、手迹、照片,共收录 1 390 种 4 100 余册;湖北省图书馆建设的“馆藏革命文献目录”,收录革命文献 1 095 种;辽宁省图书馆收藏的东北抗战文献比较丰富,建设的“东北抗战书目库”收录东北抗战图书书目信息300余种;广东省立中山图书馆建有书目数据库“孙中山文献库”;重庆图书馆是抗战时期国民政府的陪都,留下了丰富而珍贵的革命历史文献,“重庆图书馆馆藏革命文献目录(1919—1949)”收录中国共产党在革命实践过程中形成的图书、报纸、期刊、油印或石印的小册子和非正式出版物等各类文献;天津图书馆革命文献虽然数量和种类不多,但是,其中有些版本价值较高,是不可多得的珍贵文献,在其网站的特色馆藏栏目中建有“革命文献书目数据库”,该库可查询包括馆藏革命文献的题名、责任者和索取号,并提供封面图;湖南省图书馆的特色馆藏是与毛泽东相关的红色文献,建设有“馆藏毛著版本书目数据库”。

4 红色文献专题数据库建设概况

红色文献专题数据库大多是从红色文献资料中析出建设的,专题数据库的建设主要集中在公共图书馆,公共图书馆红色文献专题数据库数字化建设现状具体概况如表1所示。

  

  表1 红色文献专题数据库数字化建设现状

  

  续表1

  在这些专题数据库中,中国国家图书馆“抗战时期图片资源库”收录了约1.3万张抗战时期图片,揭示了中国军民与盟军共同抵御日本侵略的历史场景,展示了6个栏目,分别是中国远征军、军民抗战、日军暴行、对日受降和对日审判等;“上海图书馆藏淞沪抗战图片库”从馆藏的中、英、日语历史文献中选录两次淞沪战役相关图片达 8 000 余帧;南京图书馆的“抗战历史图片数据库”包含日本早期侵略、全面抗战、持久抗衡、日军侵华暴行、国际关系、光辉胜利、抗战文化等几个专栏;陕西省图书馆的“陕甘宁边区红色记忆多媒体系列数据库”分人物、事件、延安精神、革命旧址遗址纪念地和研究文献5个子库,集历史文献、图库、声像资料、参考书目等为一体,设有读者互动栏目,具备全文检索功能;吉林省图书馆的“东北抗日联军人物志数据库”包含344条数据;辽宁省图书馆建立了多个专题数据库,如“张学良专题数据库”包含611幅图片、相关文献索引733条,“九一八事变专题图片库”包含图片998幅,资料索引733篇,“中国共产党党史图片集”包含 1 274 个图片,“东北抗战事件库”包含数据400多条,“东北抗战图片库”包含 1 300 余幅图片,“东北抗战人物库”包含700多人的介绍等。

5 民国文献数据库中包含红色文献概况

红色文献也散见于民国文献数据库中,包含在民国文献数据库中的红色文献,基本不能实现一次性检索,查找单篇红色文献时至少需要提供红色文献的题名或责任者等信息。

5.1 民国文献综合性全文数据库中包含红色文献概况

包含红色文献的综合性全文数据库的有“抗战文献数据平台”,红色文献是平台的重要内容,该平台于2017年10月开始试运行,承诺永久向社会免费开放。平台收录200多种图书、报纸、期刊、图片等各种资源的红色文献,种类多样,其中包括抗战时期重要的红色期刊《火线》《中国农村》《解放》《群众》《战线》《共产党人》《海沫》《真理》《现代妇女》等,红色报纸《救亡日报》《新中华报》《太岳日报》《抗战日报》《解放日报》《抗敌报》等,报刊收录相对较全。烟台图书馆于2020年10月启动馆藏珍稀历史文献数字化项目“烟台图书馆珍贵历史文献数据库”,该数据库包含馆藏图书、报纸、期刊等胶东红色文献,其中,红色图书200多种,红色期刊10余种,该库于2021年7月左右面向读者开放。

5.2 民国文献书目数据库中包含红色文献概况

包含红色文献的书目数据库有大连图书馆建设的“馆藏旧报刊目录数据库”,收录有《民主青年》《文林》《友谊》《学习生活》等多种红色期刊;北京师范大学建设的“中文珍稀期刊题录库”中收录馆藏283种期刊,其中,收录50余种中国共产党各级党组织创办的红色期刊,如《边区政报》《共产党人》《共产国际月刊》《全民抗战》等;湖南图书馆建设的“馆藏缩微文献书目数据库”包含新中国成立前的部分红色期刊和红色报纸;中国人民大学建设的两个书目数据库“民国时期图书资源库(1912—1949)”和“民国时期期刊资源库(1912—1949)”,都包含解放区出版物和国统区出版的进步刊物,其中不少是独有或存世极罕的珍品;广东省立中山图书馆的“解放前广东报纸库”也包含部分红色报纸。

5.3 民国文献专题数据库中包含红色文献概况

包含红色文献的专题数据库有南京图书馆的“百年人物图片数据库”收录部分共产党人的详细生平介绍和重要独照及合影;湖南图书馆的“湖湘人物数据库”包含了共和国领导人、英雄模范、解放军将领的相关资料;广西壮族自治区图书馆的“广西民国照片数据库”“广西民国人物数据库”也包含部分红色文献内容。

  此外,很多图书馆虽然没有建立单独的数据库,但是开展着红色文献的整理工作,如首都图书馆2003年完成了馆藏红色文献的扫描工作,扫描了《抗敌报》《红色中华》《八路军军政杂志》《解放》《红旗》《红旗周报》等报刊;南京图书馆自2007年已完成革命书刊 4 885 册的全文扫描;山东省图书馆也完成了馆藏200余种红色报刊的全文扫描工作,主要用于出版和供读者阅读。

6 当前红色文献数字化建设的几点建议

目前,红色文献数字化正在持续建设中,针对以上红色文献数字化的建设概况,图书馆等收藏单位在进行红色文献数字化建设规划时可以考虑以下5点建议。

6.1 借鉴成熟经验,统筹规划建设

民国文献数字化建设要早于红色文献,各个数据库都有自己的资源特色。目前,建设的红色文献综合性全文数据库有一部分就是民国文献数据库的子数据库,如“古联红色经典报刊库”“爱如生红色历史文献数据库”“大成中共党史期刊数据库(—1949)”“中国近代期刊全文数据库——红色文献专题数据库”“中国历史文献总库——红色文献数据库”等,都是在成熟的数据库建设的基础上建立的单独的红色文献子数据库。因此,在红色文献数字化建设时,可以借鉴这样成功的经验,统筹规划红色文献数字化建设。

6.2 拓宽文献类型,全面持续建设

目前,红色文献数字化建设主要以期刊、图书为主,尤其是期刊资源得到了有效的开发和整理,综合性全文数据库中基本上都包含了期刊资源。但是,在红色文献数字化开发中,各类型数据库中收入报纸的品种和数量均不多。从目前已建成的红色文献数据库来看,除了期刊、图书和报纸,只有部分数据库有少量档案、手稿、非正式出版物等,但仍有大部分资源未纳入数字化建设的范围。针对目前的开发现状,应该拓宽红色文献类型,适当加强其他文献类型资源的建设,争取将所有红色文献类型都逐步纳入数字化建设。

6.3 建立联合目录,避免重复建设

红色文献数据库在开发的过程中,存在对某些类型资源过度开发以及大量重复建设等问题。例如,古联、大成、红色文献数据库、红色报刊档案数据库、延安时期红色文献数字研究平台等都包含《八路军军政杂志》《群众》等期刊。从全国范围来看,收藏红色文献的主要有图书馆、档案馆、军事科学院、革命纪念馆、高校图书馆、私人收藏家等。目前,需要摸清家底编纂《全国红色文献联合目录》或包含国外藏品在内的《红色文献联合目录》。另外,也需要建立地方性的联合目录,因为红色文献存在数量少、类型杂、分布广、伪装多等特点,地方性的联合目录要尽量收全,而且要与全国性的联合目录有效衔接,这样在数字化时才能有效避免重复建设。

6.4 建立统一标准,有利于资源共享

红色文献包括图书、报纸、期刊、档案、手稿、传单等多种文献类型,数字化时需要分别对待,在数字化建设的各种标准中,涉及图像扫描加工、数据标引、建库后期增补完善等多方面问题。首先,是扫描标准的制订,不论哪种文献类型最好选择24位彩图扫描,图像存储可根据文献不同选择JPEG、JPEG2000、TTFF和GIF作为存储格式,发布格式建议选择JPG、JPG2000格式,或将其转化为PDF格式,为资源的后期开发和长期保存奠定基础。其次,是主题内容的标引,需要进一步分析内容,注重局部内容的主题揭示,提供多途径的知识发现服务。再次,是建立数据库之后也要定期对数据内容持续修订增补,种类动态添加,使系统动态建设逐步完善。只有建立统一标准,才能为后期的资源共享打下基础。

6.5 借力纸版红色文献,加快专题数据库建设

专题数据库建设可以借力红色文献的影印出版,近年各大出版社出版了很多红色文献专题汇编。例如,国家图书馆出版社出版的《辛亥革命稀见文献汇编》(全45册)、《民国时期山东革命根据地红色期刊汇编》(全50册)、山东人民出版社出版的《山东党的革命历史文献选编1920—1949(全10卷)》、上海书店出版社出版的《不忘初心——上海市档案馆藏红色文献选萃》等,这些大型红色文献汇编基本上通过协调多个图书馆,远远超过某个单一图书馆的馆藏和文献整理水平,甚至调用私人原版文献编纂影印而成,其专业性和学术性更强。但是,已有的影印红色文献汇编价格偏高,很难满足读者的需求,图书馆可以考虑利用已出版的影印版红色文献,建设自己的专题数据库,这样,就可以加快专题数据库的建设,更好地为读者服务。
赞(0)


猜你喜欢

推荐阅读

参与评论

0 条评论
×

欢迎登录归一原创文学网站

最新评论