(1.广西科技大学图书馆,广西 柳州 545006;2.广西财经学院图书馆,广西 南宁 530003)
广西本科高校科研数据管理调研报告
廖
球,莫崇菊,严扬帆,高
飞
(1.广西科技大学图书馆,广西 柳州 545006;2.广西财经学院图书馆,广西 南宁 530003)
对广西20多所本科高校的教师群体进行了关于科研数据管理行为、数据引用与再利用行为、对数据共享的意愿与期望等的调查与分析,了解到广西区内高校中的科研工作者对于科研数据管理缺乏系统性的认识,对数据管理与共享有着较大的需求,而高校对于科研数据的管理及再利用则几乎处在监管缺失的状态,并对广西高校科研数据管理建设提出了建议与思考。
科研数据;科学数据;数据管理;广西
高校在课题项目研究、推进科学研究与科技服务、产学研合作、重点实验室、工程研究中心建设等过程中形成了海量的科研数据,这些科研数据分散在科研人员或课题组中,基本上属个人专有,未能得到良好的组织、管理,在共享和流通中不仅不能充分发挥其使用价值,也会使一些研究结果无法进行追溯检查和验证,从而削弱国家对科技投入的效益。
科研数据既是课题研究成果的组成部分,又是科技创新的重要基础,只有将这些分散的科研数据集中起来开放共享,才能实现科研数据的价值转化。为了了解广西区内高校对科研数据使用与管理的情况,课题组对广西区内的本科高校进行了调研。
1 调研方法与范围
《广西本科院校科研数据管理与共享研究》课题组于2016年8月利用“问卷星”网站设计的调查问卷包含五个方面的内容:1)用户基本信息;2)用户产生科研数据的特征;3)用户的科研数据管理行为;4)用户对科研数据的引用与再利用行为;5)用户对科研数据共享的意愿与期望。问卷于9月开始通过QQ、邮箱等途径,主要面向广西26所本科院校的教师群体(包括少量研究生)宣传开放(网址为https://sojump.com/jq/9438939.aspx),试图通过他们的问卷答题,了解高校教师的科研行为及科研数据管理方式,以便研讨与制定关于科研数据管理的政策。2 问卷回收情况
截至2016年10月31日,课题组共回收96份问卷,其中有5份是区外高校用户填写,不在此次调研范围内,故有效的回收问卷总计为91份。26所高校分别是(排名不分先后):广西大学、桂林电子科技大学、广西医科大学、广西师范大学、广西民族大学、桂林理工大学、广西科技大学、广西中医药大学、桂林医学院、右江民族医学院、广西师范学院、河池学院、玉林师范学院、广西财经学院、广西艺术学院、百色学院、钦州学院、贺州学院、梧州学院、广西民族师范学院、桂林航天工业学院、南宁学院、北海艺术设计学院、广西警察学院、桂林旅游学院、广西科技师范学院。其中广西艺术学院、北海艺术设计学院的问卷回收数为0。3 问卷数据分析
3.1 用户基本信息此次参与问卷调研的用户,男女比例为47∶53,性别基本均衡。其他信息如表1所示。
表1 用户基本信息
根据表1所示,参与调研的用户中,中青年教师占大多数,有5.2%的用户有过海外留学经历;学历、职称均偏高,用户基本上都有过论文写作或科研的经历;用户所从事的学科领域主要集中在人文学科(文、史、哲)、社会科学(教育、经济、管理、法学)、工学、理学等,大部分用户有过与其他人合作科研的情况。
3.2 用户产生科研数据的特征
用户产生科研数据的特征,包括数据来源、数据类型与数据量大小。从表2看,用户的科研数据来源多样,其中最主要的来源是数据库及网络采集,占比76%;其次是社会调研,占比61.5%。就数据类型而言,用户在科学研究过程中产生的数据类型,大部分属于文本数据(手稿、Word、Excel等文件),图片及网页数据也占据大多数。用户每年在研究过程中产生的数据量,基本都在1GB以下,1MB~100MB的用户数量最多,占比36.5%。
表2 科研数据特征
3.3 用户的科研数据管理行为
用户的科研数据管理行为,是指用户对数据的保存、提交以及成果发表后对数据的处置行为。
对于科研数据的保存,绝大部分用户同时采取多种保存方式,以防数据丢失:有90.6%的用户习惯把数据保存在个人电脑中,75%的用户使用U盘或移动硬盘加以备份,47.9%的用户使用单位电脑保存数据,18.7%的人会把数据保存在网络数据平台,3.1%的人甚至会将数据上传到机构服务器。值得注意的是,在各种智能产品均可保存数据的时代,仍然有29.2%的用户将数据记录在纸质笔记本中。
对于如何处置论文或成果发表后的原始数据,有56.2%的用户选择将其归档,作为历史资料保存;45.8%的用户顺其自然,对保存在原来位置的数据不再管理;22.9%的用户将数据随科研成果提交给科研管理部门(如科技处),12.5%的用户把数据随科研成果提交给相应的期刊或出版社的数据库,10.4%的用户会共享给专门的数据存储库(如CNKI、万方等);8.3%的用户会将数据提交给图书馆、知识库或资料中心;6.2%的用户会把数据发布到项目的网站上。
对于在论文或成果发表后原始数据保存多长时间的问题,54.1%的用户选择永久保存,10.4%的用户会保存3~6年,14.6%的用户保存1~2年,21%的人仅保存1年以下,甚至有2%的用户至多只保存1个月。
对于因未能妥善保管数据而导致数据丢失的问题,64.6%用户偶尔遇到过,3.1%的用户则经常遇到,仅有18.7%的用户从未发生过数据丢失的问题。将近68%的用户对当前的数据管理及保存方式满意或基本满意,有25%的用户表示不满意。
遗憾的是,以团队为整体的科研数据管理工作还有待加强:近60%的用户反映团队无专人统一管理数据,基本上是各人管理各自产生及获取到的数据;近40%的用户会定期向团队负责人汇报统计好的数据;26%的用户会整理归档发表后的数据;仅有11.5%的用户表示团队有专门保存数据的流程或平台。
3.4 用户对科研数据的引用与再利用行为
在科学研究的过程中,很多人都或多或少地利用过他人的科研数据。在调查中,有45.8%的用户经常引用或利用他人的数据,53.1%的用户偶尔引用过,仅有1%的用户表示从来没有引用过。
对于获取他人科研数据的途径,几乎所有的用户都曾经从网络上采集过(如专业科学数据库、其他机构的知识库、免费公开的数据库等),79.2%的用户表示是从公开发表过的论文中附带的数据源中获得的,21.9%的用户利用合作团队之间的学术交流来获取数据,16.7%的用户则通过联系作者来获得。
哪些情况能够让人放心地使用或引用他人的数据呢?66.7%的用户比较相信源自官方科学数据平台的数据,61.5%的用户信任他所了解或熟悉的机构的数据,55.2%的用户信任通过同行评议或由正式出版物公布的数据,46.9%的用户比较看重数据的信息完整及规范程度,另有28.1%的用户则比较信任他所了解的作者的数据。
在问卷中,课题组列举了国内外科学界常用的21个科学数据库或平台(其中外文12个、中文9个),参与调研的用户了解或使用过最多的数据库是中国科学院科学数据库,但用户数也仅占36.5%,对其他各个数据平台有所了解的用户数量均在10%以下,48%的用户对这些数据平台几乎不了解,甚至没有听说过。这种情况说明大部分用户仅仅通过常规的文献数据库来获取数据,而对专门的科学数据平台缺乏了解。
在“在引用或利用他人数据时,遇到的最大困难是什么”这个问题上,59.4%的用户认为是数据的质量参差不齐,58.3%的用户认为在公开发表的文献中找不到原始数据,55.2%的用户认为是没有统一的科学数据平台,34.4%的用户认为是同行比较忌讳透露最新科学数据,而18.7%的用户则认为是同行未妥善保存以往数据。
反过来,对于“如果有人需要引用您的数据,您希望他以什么方式来表示引用”这个问题,81.2%的用户希望引用者能在参考文献中列出自己的数据来源,43.7%的用户希望在文章中以脚注的形式标明,36.5%的用户希望引用者在正文中说明,26%的用户希望在致谢中看到自己的名字,而18.7%的用户则希望引用者给予自己一个项目合作的机会,另有7.3%的用户希望自己能成为引用者的文章合著者。
3.5 用户对科研数据共享的意愿与期望
对科研数据共享抱有期望,源于大家认为科研数据的管理与长期保存比较重要(调研中有91.7%的用户认为科研数据管理与长期保存重要或者非常重要),而且对于“数据共享能给自己带来的好处”的问题:有77.08%的用户认为科研数据保存及共享能够更好地佐证自己的研究或他人的成果,并且能够提高科研数据的利用效率和价值;有70.83%的用户认为数据共享能够减少科研工作的重复性;56.25%的用户认为数据共享能够保证研究结果的真实性;55.21%的用户认为可以提高个人的学术成果影响力;50%的用户认为有利于数据的长期保存和唯一性;另有35.42%的用户则认为数据共享的行为具有潜在的经济价值。
假设1获得支持。通过实证分析得出,人力资本与结构资本对战略柔性的提升起到非常重要的推动作用,两者与资源柔性和协调柔性都有正向的影响。假设1实证研究结论如下:
对于“是否有过将自己的数据共享给他人”“在什么情况下愿意将数据共享给他人”“在什么范围内共享”等问题,用户的选择如表3所示。
表3 科学数据共享经历及意愿
从表3可以看出,大部分的用户愿意与别人共享自己的科研数据,并且有过共享经历,支持团队内部、校内或机构内部的数据共享,甚至有部分用户支持国内或国际范围的共享。
对于科研数据共享的主要障碍,用户的选择如图1所示,大家普遍担心的问题集中在数据质量、是否会被滥用、引发争议或法律问题以及数据的后续发展问题等。
图1 数据共享的障碍
在科研数据管理与长期保存方面,用户需要哪些服务呢?这从表4可见一斑:首先大部分用户希望有一个可供数据存储、发布和使用的平台,其次是希望能够获得有关科研数据获取途径与方法的培训,接下来是要有数据描述的标准,最后是数据组织、存储与共享流程管理的培训以及撰写科研数据管理计划的培训。
表4 科研数据管理服务需求
如果要创建一个科研数据共享平台,用户希望平台拥有多种功能,并且用户能够支配、管理平台当中自己的数据:80.2%的用户希望平台能够赋予自己管理自己数据的权限,实现数据的分级管理和访问控制;75%的用户希望平台能够实现数据与研究成果的关联;64.6%的用户希望能使大家实时了解自己的数据被使用的情况;55.2%的用户希望平台能保证数据安全和长期保存;53.1%的用户希望平台具有类似期刊论文引文的评价功能;51%的用户希望保存和管理程序简单。
至于将自己的科研数据递交在什么性质的平台上,用户的选择也具有多样性,如图2所示。
图2 科研数据递交平台的选择
以上数据表明,他们更愿意把数据存放在科研团队或学校内部自建的数据平台,学科领域内建立的专业数据平台及公益性机构(如图书馆联盟)建立的数据平台也是两个不错的选择,有三分之一左右的用户选择期刊杂志社自建的数据平台、政府管理部门或资助机构建立的数据平台,还有少部分的用户选择商业公司建立的科学数据平台。
3.6 学校层面对科研数据管理的要求
广西区内高校在科研数据管理与利用方面是否有所作为?调查问卷中有两道题涉及这个问题。一题是“您所在的学校有要求必须在项目过程或结束后提交科学数据给相关部门保存与管理吗?”另一题是“您所在学校是否制定了关于提交科学数据的相关政策或规定?”对此,用户的选择如表5所示。
表5 学校对科研数据管理的要求
根据表5的数据,普遍来说,学校层面可能更看重公开发表的论文及成果,而忽视了对科研过程中产生的数据进行管理以及再利用的问题。
课题组同时对广西各高校官网上的科研政策进行了调查,发现几乎所有的高校在科研项目的管理中,主要是沿袭国家社科基金项目管理办法及广西科技项目管理办法,重点关注的是科研经费的使用、项目进展情况的报告以及最终的研究成果,对于研究过程中的数据保管、提交、管理,均没有做出任何要求。
3.7 机构知识库的建设未能涵盖科研数据
机构知识库是学术机构为收集并保存本机构的智力成果而建立的数字资源仓库,这些智力成果在内容形式上包括:1)文本型成果,如内部文件、科技报告、学术期刊或会议论文、学位论文、著作等;2)演示性成果,如演示报告、音频视频作品、图表、课件、培训教材以及其他的多媒体或复合形态知识成果;3)数据型知识内容,例如各种形式的数据集、数据库等。
广西民族大学、桂林电子科技大学、广西建设职业技术学院等几所高校的图书馆已经建设有机构知识库,但从它们收录的内容来看,同样缺失了对科研数据的收集与保存。正在筹建机构知识库的广西大学、广西科技大学等高校,建议考虑在建设之初,就把科研数据考虑在内,根据科研活动的生命周期,搭建包括科研数据在内的面向科研过程的文献信息管理平台。
4 对广西高校科研数据管理与共享的建议和思考
从上述的调查与分析来看,广西区内高校中的科研工作者对于科研数据管理缺乏系统性的认识,对数据管理与共享有着较大的需求;而高校层面对于科研数据的管理及再利用则几乎处在监管缺失的状态,情况不容乐观。这种状况亟须加以改进,使科研数据的价值能最大限度地发挥出来。4.1 学校确立科研数据管理规划
早在十余年前,我国几个综合性的战略规划已把科学数据作为科技基础性资源,如《国家中长期科技发展规划纲要(2006—2020)》《国家“十二五”科学和技术发展规划》提出要加强科学数据开放、整合与共享,构建集中与分散相结合的国家科学数据中心群,形成国家科学数据分级分类共享服务体系,并已经启动了科学数据共享工程。政府有关部门编制了科学数据共享工程建设规划,制定了《科学数据共享工程管理办法》《科学数据共享条例》《国家科技计划项目科学数据汇交办法》《科学数据共享工程试点遴选和检查评估办法》《科学数据分类分级共享及其发布策略》等一系列数据共享的政策法规。
区内高校要积极响应国家的政策,要认识到将科研数据进行有效保存、共享和再利用,是对学校、科研人员、国家都有利的事情;要确立清晰的科研数据管理策略与规划,在全校推动科研数据管理与共享的开展。
4.2 建立配套的数据管理政策与制度
数据管理政策的目的在于使科研数据的存储、保留、公开和再利用能够按照法律法规、道德和资助机构的要求进行。参考国外大学的案例,科研数据管理政策可以包含三个大的方面:方针、程序和指南,具体的内容包括:政策的目的与原则,政策适用范围,术语定义,政策涉及的角色及其职责,数据管理计划要求,知识产权及所有权,数据保存,元数据标准,数据删除和销毁,数据安全、隐私和保护,数据访问,合作研究,服务支持,数据转移,相关文件和法律政策,其他规定,等等。
4.3 开展用户指导与培训
为了较好地执行由学校自上而下推行的科研数据管理政策,学校相关部门要给校内的研究人员提供详细的实践建议和指导。可以通过讲座培训、资料发放、一对一的咨询、建设专门网站并经常更新等途径,使用户掌握数据管理知识与技能,帮助用户更好地进行科研与教学活动。
4.4 探索建设全区共享的数据管理平台
在调研中,大部分用户希望有一个可供数据存储、发布和使用的平台。然而,不同学科产生的科研数据在类型、形态、描述、大小等方面有着太大的差异,能否建立一个通用的数据平台,来满足不同学科研究者的需要?学科不同、校情不同,不同高校是否能共享一个平台?这些问题需要再做进一步的研究与探索。
[1]邓 佳,詹华清.莫纳什大学科研数据管理实践及对我国机构知识库建设的启示[J].情报理论与实践,2014(5):136—139.
[2]国务院.国家中长期科技发展规划纲要(2006-2020)[EB/OL].[2017-02-22].http:∥www.gov.cn/jrzg/2006-02/09/content_183787.htm.
[3]科学技术部.国家“十二五”科学和技术发展规划[EB/OL].[2017-02-22].http:∥www.most.gov.cn/mostinfo/xinxifenlei/gjkjgh/201107/t20110713_88230.htm.
[4]丁 培.国外大学科研数据管理政策研究[J].图书馆论坛,2014(5):99—106.[说
明]本文系2016年CALIS广西文献信息服务中心预研项目“广西本科院校科研数据管理与共享研究”(项目编号:CALISGX201602)的研究成果之一。G250
B
1005-6041(2017)04-0042-05
2017-04-08
廖 球(1971—),女,硕士,研究馆员,广西科技大学图书馆;莫崇菊(1969—),女,本科,馆员,广西科技大学图书馆;严扬帆(1970—),女,硕士,副研究馆员,广西财经学院图书馆;高 飞(1980—),女,硕士,馆员,广西科技大学图书馆。
赞(0)
最新评论