(西北大学公共管理学院,陕西 西安 710000)
科学数据作为国家科技创新发展和经济社会发展的重要基础性战略资源,在信息时代的发展中扮演着不可或缺的重要角色。当前,诸多高校图书馆承担着对科学数据的生产、存储、咨询、共享、利用等任务,科学数据管理服务逐渐成为高校图书馆的核心业务之一。2018年3月,国务院办公厅印发的《科学数据管理办法》(以下简称《办法》)为进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好地支撑国家科技创新、经济社会发展和国家安全提供了政策保障。本文采用网络调研与文献归纳的方法对美国的哈佛大学、斯坦福大学,英国的剑桥大学、牛津大学,新加坡的新加坡国立大学、南洋理工大学以及加拿大的多伦多大学、英属哥伦比亚大学这8所高校图书馆的科学数据服务内容进行整合与归纳,以期对我国的科学数据服务有所启示。
1 科学数据的概念及相关研究
1.1 科学数据的概念
科学数据是一个不断变化,不断被丰富的概念。当前,对科学数据的解释主要有以下几种:1)科学数据,亦称“科研数据”,是指科研人员在从事科学研究活动中所产生的以图表、文字、音视频等形式存在的大量数据集[1];2)科学数据是指从科技活动中产生的涵盖自然科学、工程技术科学、人文社科等领域且具有一定的保存价值的最原始、基础的数据或其衍生数据[2];3)科学数据是指在科技活动中或采取其他方法得到的体现客观世界本质特征、变化规律等方面的基础原始数据、以及依据科学研究需要,系统整理加工生成的各类数据集[3]。根据以上阐释可将科学数据的特征归为以下两点:1)在科研活动中产生的原始数据及衍生数据;2)能够被数字化或已经以数字化形式存在。本文所讲的科学数据管理是指如何在整个科研项目中管理数据。它涵盖前期的数据管理计划、数据的创建、收集、组织、管理、储存、备份、保存和共享研究者或科研机构的资料,且这些研究资料是根据法律、道德和拨款机构的规定来进行管理的。高校科研数据服务主要是指高校图书馆围绕着科研活动及其产生的数据资源、相关政策、环境等为研究人员提供科学数据组织、管理、存储、培训、咨询、利用、共享等内容的一系列管理服务的形式[2]。1.2 相关研究
科学数据管理服务工作在国外开展得较早,主要是美国、英国、澳大利亚、加拿大、新加坡等国家,且多由高校图书馆来负责这项工作。近年来,随着我国越来越重视科技的发展以及相关政策的出台,学术界也开始关注科学数据管理服务,与此同时也产生了不少理论性的研究成果,且多集中于对科学数据管理体系较为完善、成熟的国外高校科学数据监护、科学数据政策、平台建设、素养教育、开放共享、科学数据管理计划等方面的内容进行梳理和归纳,从而总结出对我国科学数据管理服务发展的启示或思考。如付少雄等[3]分别从科学数据管理模式、管理政策、管理平台及管理宣传这四方面对新加坡高校图书馆科学数据管理服务进行了较为完整的阐述,并在此基础上对我国科学数据管理服务提出可行性的建议;刘玉敏等[1]分别对美国“常春藤”高校和我国“211工程”高校图书馆的科学数据服务进行调研和对比,认为科学数据服务是E-Science环境下高校图书馆发展的契机和方向,指出我国需借鉴美国的先进理念与方法;杨文建等[4]对国外高校图书馆科研数据管理的具体内容进行归纳分析,并分别从政策、数据素养教育、宣传推广等方面对国内高校数据服务提出建议;陈媛媛等[5]从理论、实践、政策和教育方面对国内外高校图书馆的科学数据服务相关研究进行梳理与归纳;唐燕花[6]分别从政策制订、基础设施、服务、利益相关者和资金模式这五个科研数据管理服务实践的构成要素上对我国的科学数据实践提出了具体措施;朱彩萍[7]认为应将介绍推广、数据管理、数据监护、技术支持等多个方面嵌入到科学数据服务过程中。2 国外高校图书馆科学数据管理调研结果
本文采用网络调研与文献归纳相结合的方法对美国的哈佛大学(Harvard University)[8]、斯坦福大学(Stanford University)[9],英国的剑桥大学(University of Cambridge)[10]、牛津大学(University of Oxford)[11],新加坡的新加坡国立大学(National University of Singapore)[12]、南洋理工大学(Nanyang Technological University)[13]以及加拿大的多伦多大学(University of Toronto)[14]和英属哥伦比亚大学(University of British Columbia)[15]的图书馆在科学数据管理栏目的设置、是否有相关政策、服务内容等进行了调研,结果如表1所示。表1 8所国外高校图书馆科学数据管理现状一览表
2.1 科学数据栏目设置
表1中国外高校图书馆都有关于科学数据管理方面的栏目设置,名称则大同小异。哈佛大学图书馆称其为“数据管理”,斯坦福大学图书馆为“数据服务”,剑桥大学图书馆是“科学数据管理”,牛津大学图书馆设置为“信息与数据服务”,其余包括新加坡国立大学、南洋理工大学、多伦多大学、英属哥伦比亚大学图书馆均为“研究数据管理”。可见,国外高校图书馆已将科学数据作为独立且十分重要的官网栏目设置,这为本校的科研人员或其他的访问用户提供了较为明确的查找、获取、存储、保存科学数据的指南,简化了查找、获取等流程,节省了读者的时间,提高了科研效率。2.2 科学数据管理计划服务
科学数据管理计划是科学数据管理活动的第一步,也是整个科学数据服务不可或缺的一部分,是后续科学数据存储、组织等工作的指南。良好的科学数据管理计划服务可为科学数据管理工作奠定坚实的基础。大多数的国外高校图书馆都提供了科学数据管理计划服务,且这些计划的内容主要包括:元数据的创建、数据的格式、备份、描述、组织、分析、存储、分享、管理等。斯坦福大学图书馆与加州数字图书馆合作,为用户提供数据管理规划工具(DMPTool)[9]。具体而言,DMPTool包含许多需要此类计划的大型资助机构的数据管理计划模板,如NEH(国家人文基金会)、NIH(美国国立卫生研究院)、NOAA(国家海洋和大气管理局),等等。另外,其科学数据计划服务中还包括对医学等方面的敏感信息的保存、备份与共享;斯坦福大学图书馆还提供SDR[16](数字存储库)的服务,以实现研究数据的长期引用、访问与重用。新加坡国立大学图书馆也为用户提供了许多有用的科学数据管理计划模版,如简化的博士生DMP模板、供学位研究生使用的莫纳什大学的研究数据计划检查表以及爱丁堡数字管理中心的数据管理计划综合检查表(2013),等等。高校图书馆所提供的科学数据管理计划服务极大地促进了用户的需求满足,同时也推动了高校图书馆的服务发展。2.3 科学数据查找、获取与共享服务
科研数据是否能够被研究者个人或团体快速、便捷地查找、获取与共享逐渐成为衡量科学数据服务工作的重要指标。一方面,它能从侧面反映出研究者对相关领域的认知程度、贡献大小以及对科学数据的严谨态度;另一方面,它也能为他人的相关研究提供充分的佐证材料,是其科研成果的重要组成部分。英属哥伦比亚大学图书馆为研究者提供了Dataverse[15],用于发布、共享、参考、引用、提取和分析研究数据,帮助用户积极管理、共享数据。除此之外,该大学图书馆还开发了基于地图了解世界的Geodisy[16]软件,该软件能够以视觉、空间的方式帮助用户快速查找并获取所需数据,换言之,用户可以在特定地方获取到你所想要的任何信息、数据。同时,Geodisy是建立在FOSS基础上的,因此Geodisy本身就是一种开放的资源。剑桥大学图书馆在数据共享中提到学者们可以通过添加创作共用许可证来实现个人的数据及其他资源的重复利用。剑桥大学图书馆中的OpenPlant[10]中心是数据共享的典例,它是由英国自然科学基金会(BBSCRL)和英国自然科学基金会(EPSRC)资助的横跨剑桥和诺维奇的合成生物学中心,该中心将编制公开数据并产出,以克服目前知识产权做法和限制性许可在该领域造成的创新限制,促进了相关研究的发展。2.4 科学数据备份与保存服务
对科学数据的备份与保存在很大程度上能防止数据的意外丢失并保证数据的重用与长期访问,这对研究者及其后续工作的开展来说是十分重要的。斯坦福大学图书馆为研究者提供了许多不同领域的存储库,如专为大学内部的研究者提供的保护与保存数据的SDR[17](斯坦福数字存储库),SDR帮助斯坦福研究者保护和保存研究者在科研活动中产生的数据,并确保他人对这些数据的访问或使用。哈佛大学的Harvard Dtataverse[8]作为一个网络数据仓库,为所有研究者提供可开放使用的数据存储、访问等服务,增加科学研究对信息获取的便利性,为科研活动的发展提供支撑。新加坡国立大学图书馆为研究者提供OneDrive for Business[12],这是一个基于云的文件存储系统,不仅可以实现数据文档的存储、共享,还提供了针对Microsoft Office文档的在线编辑和协作工具;除此之外,nBox[18]也是新加坡国立大学图书馆为大学内的员工提供的一个在线存储空间,它允许员工在任何时间、任何地点、从任何设备安全地访问和共享数据。多伦多大学图书馆在数据的备份与保存方面作了更为详细的解释,其中包含数据备份的注意事项,如访问权限、可访问性、安全性、带宽速度、存储容量等,并采用“3-2-1”规则进行数据副本(原始副本、外部本地副本和外部远程副本)的维护,同时在进行备份前,需要识别哪些文件需要备份、自动化能力如何、数据的感知价值以及与数据相关的风险级别等。另外,多伦多大学图书馆还为研究者提供Dataverse、re3data.org和多学科数据存储库,如Zenodo[14]等用以保存数据。可见,国外高校图书馆对数据的备份与长期保存是十分重视的,为研究者后期对对相关数据的获取创造了良好的内外部环境。3 科学数据政策
完善的科学数据管理政策是研究者进行科研活动的重要依据与保障,同时也是图书馆开展科学数据管理活动及服务的前提条件。科学数据管理政策的制订是一个完整的生命周期,包括数据管理方面的主要职责、数据的采集、汇交、保存、共享、利用、保密、安全等诸多环节,每一环节都有详尽的管理办法要求,如责任主体、政府预算资助资金、应急管理及容灾备份机制的建立、科学数据中心、管理平台建设和数据维护等。目前,国外许多高校图书馆都建立了较为完善的数据管理体系,制订了较为详细完整的科学数据管理政策,如表2所示。表2中,8所高校图书馆均制订了与科学数据管理相关的政策,其中哈佛大学图书馆和斯坦福大学图书馆更加注重对数据的保存与获取,剑桥大学图书馆和牛津大学图书馆侧重于研究数据和管理计划、指导与服务,并细化了不同主体的责任,等等。数据管理政策的制订促进了高校图书馆数据管理服务的可持续发展。
表2 8所国外高校图书馆科学数据管理政策现状一览表
4 科学数据素养教育
科学数据是知识发现与科技创新的重要基础。随着国家对科技发展的重视程度越来越高,在对科学数据管理服务工作深入推进的同时,也对个人的科学数据素养提出了更高的要求。个人数据素养的高低直接影响其研究活动的开展以及最终研究成果的质量。许多国外高校为本校不同研究者提供了较为系统、完整的个性化的数据素养培训及研讨会。新加坡国立大学图书馆的科学数据教育主要呈现以下特点:1)形式:以线上培训和研讨会为主要教育方式。2)服务群体:针对不同研究级别的学者进行个性化的服务。如新加坡国立大学图书馆提供的线上免费课程MANTRA[19]分别为一般的研究性学生、职业研究者、高级学术研究院以及信息专业人才这四类不同级别的研究者提供有针对性的学习内容。MANTRA为一般的研究性学生提供一些数据管理上的基础知识,如了解RDM概念及术语介绍、学习如何规划研究项目中的例子等;对于信息专业人才而言,MARTRA则会帮助用户协助学者和研究性的学生编制研究数据管理计划,并推荐用户学习数据保护、权利及访问的相关知识。3)内容:提供一套完整的科学数据管理知识。包括科学研究数据的基础概念、文件的格式、数据保护、组织、访问、数据管理计划、元数据、共享,等等。牛津大学图书馆为研究者提供了丰富的科学数据管理的相关培训、教育课程和能使用到的工具、资源等,如数据管理计划、道德问题和数据保护、数据的备份、存储和安全,数据的组织,存储、共享,等等。尤其重要的一点是,牛津大学图书馆不仅为研究者提供了数据从产生、组织、备份到保存的具体操作及注意事项,还为数据管理的各个环节提供了必要的可选择的工具与资源,大大降低了科学数据管理的难度,提高了最终的质量。5 国外高校图书馆科学数据管理实践对我国的启示
通过以上网络调研的结果可知,国外高校图书馆在科学数据管理服务中已有较为完善的体系,这在一定程度上为我国的科学数据管理服务提供了借鉴。结合文献调研,笔者总结了以下几个方面的启示。5.1 完善相关法律法规
完善的法律与政策为科学数据管理工作指明发展方向。随着我国越来越重视科学技术在经济社会发展中的作用,政府在宏观上制订了一系列关于科学数据管理的政策,如《科学数据管理办法》《科学数据共享条例》《国家科技项目科学数据汇交暂行办法(草案)》等,但国内诸多高校图书馆并未据宏观政策制订适合本校科学数据管理工作发展的相关细则。许多国外高校图书馆在科学数据管理服务上制订了比较完备、系统的法规,如剑桥大学图书馆制订了科研数据政策,其中包含有整个政策的内容综述与框架,阐述科学数据管理背景、原则、学校师生在这方面担任的角色;研究资助者的政策以及与之相关的科学数据政策。剑桥大学图书馆的科学数据政策较为全面的涵盖了科学数据整个生命周期的内容,同时还保证了各个利益相关者的权益。因此,国内高校图书馆在开展科学数据工作时,应制订较为详尽、完整的政策,以保证科学数据管理服务活动的顺利进行。5.2 丰富科学数据管理服务内容
我国高校图书馆在科学数据管理服务的内容上主要集中于对数据的搜集、组织、存储、共享、出版等,缺乏对科学数据管理前期的计划服务,而国外高校图书馆则要求研究人员在进行科学数据管理时必须上交科学数据管理计划,以便对项目的筹资与审批,并将科学数据管理计划作为整个科学数据管理过程中不可缺失的重要环节。国内除复旦大学社会科学数据平台和北京大学开放研究数据平台外,其他高校科学数据服务暂不具备较好的在线数据分析功能,而国外的高校都将数据分析作为一个科学数据管理服务中的重要内容,如哈佛大学图书馆基于Dataverse进行后期的数据可视化分析。国外高校图书馆在科学数据前期的计划准备与后期的在线分析值得国内高校学习。5.3 面向用户的科学数据素养教育
高校科学数据管理服务的发展不仅仅是依靠对技术的支持,同样离不开对数据人员的专业素养培训。在对我国高校科学数据平台进行网络调研时,发现其中并没有明确针对用户开展广泛的系统的数据素养培训栏目或内容设置,多数高校图书馆仅对用户进行某一方面的教育,如复旦大学图书馆开展的“统计数据的查找与获取”数据应用实例培训,西北农林科技大学图书馆开展的“数据与事实检索”培训等教学实践,北京大学、上海交通大学、清华大学、南开大学等高校的图书馆开展的SPSS、Excel等相关数据处理软件培训(讲座)。总体而言,素养教育的培训内容较为狭窄,不够全面。目前,国外高校图书馆将数据人员的培训放在科学数据管理栏目中十分醒目的位置,内容丰富,形式多样,且根据不同的研究者群体提供个性化、有针对性的服务。如新加坡国立大学图书馆采用线上免费课程MANTRA,该课程将培训对象分为四大类,且对其提供符合该群体的学习内容,如推荐一般性的研究者学习有关科学数据管理的基础知识,信息专业人员则学习数据保护、权利及访问等较高层次的内容。除此之外,牛津大学图书馆也为数据人员提供较为全面的学习内容。一方面,为用户提供了数据自创建、组织、备份到保存、共享的具体操作及注意事项,另一方面,还为数据管理的各个环节提供了必要的可选择的工具与资源,提高了科研的效率。为数据人员提供丰富的数据管理课程、培训及必备的工具等对科学数据管理的各个方面都大有裨益。6 结 语
科学数据管理是促进科技发展的基础性工作,不仅对高校研究人员开展科研活动、提高科研成果质量有着重要意义,同时也在整个社会中发挥着不可替代的作用。高校图书馆作为科学数据管理的主要阵地,必须重视科学数据管理工作。
赞(0)
最新评论