[关键词]机构知识库;学术数据库;自建数据库;共建共享;资源共享;机构
[中图分类号]G250.74[文献标识码]A [文章编号]
随着网络技术的发展以及在信息社会化的趋势下,信息资源的开放共享已经不仅仅限于公共文化与商业性学术资源的范畴,正在触及和逐步深入到各个机构的自有自建的信息资源。自建学术数据库收录内容的独特性,使其颇受科学技术领域内人士的青睐。本文从对比国内外自建学术数据库出发,基于广西的实际情况,研究探索适合广西的机构自建学术数据库共建共享模式。
1 国内外自建学术数据库开放共享现状
机构自建学术数据库,是指学校、研究所、医院、政府机关及其他企事业单位针对本机构的性质自行搜集整理相关学术信息资源而建立的可在一定范围内共享的数据库。它既能在一定程度上满足机构内人员或机构服务受众在工作、生活及学习上的信息需求(有些甚至能支持领导决策),又可彰显本机构的信息特色,因此也可称为特色数据库。它可以是专家成果库、产品库、文献知识库,也可以是其他内容或类型的信息集成库。自存档、学科知识库、机构知识库都属于自建学术数据库的范畴。
1.1 国外情况
在Elsevier数据库及百链学术外文搜索中检索发现,国外在研究“自建学术数据库”或“特色数据库”的文献非常少,而研究“自存档”“学科知识库”及“机构知识库”的文献比较多,机构知识库是在学科知识库及自存档基础上发展而来的。因此本文所讨论国外的自建学术数据库,主要指的是机构知识库。
机构知识库是于上世纪末伴随着开放存取运动的发展而兴起的一种新的学术交流与资源共享模式,一般是大学或研究机构依托网络对本机构或多个机构成员所产生的电子学术资源进行收集、存储、发布、长期保存,并免费提供给机构内外的网络用户共享。美、英、德、日等发达国家的机构知识库起步早,资源数量多、种类多,大都得到国家层面的政策支持及经费资助,发展较为完善,并且趋向于多个机构联合联盟,影响力大,用户范围广。如:2013年2月,美国白宫科技政策办公室发布政策指令,要求所有研发资助达到1亿美元的联邦机构在6个月后提出并实施开放存缴政策,让联邦政府资助科研项目所产生的论文在发表后12个月实行开放获取;美国20多位国会议员提出“联邦资助科研成果公共获取法案”(Federal Research Public Access Act),要求以法律形式固化规定所有公共科研资助超过1亿美元的联邦机构都要实行公共获取政策[1]。英国政府则于2012 年 9 月拨出 1 000 万英镑支持 30 所研究型大学支付开放出版费用。
1.2 国内情况
国内研究自建学术数据库的文献也基本集中在大学及研究机构的特色数据库和机构知识库上。我国在开放存取建设上比西方国家起步要晚,进展也较缓慢,但可喜的是,目前已经开始取得一定成效并试图融入到国际大潮之中。
中国科学院从2009年开始正式在全院各个研究所建设机构知识库,目前已有76个研究所建成机构知识库,并制定了强制性的存储政策。同时,厦门大学、北京大学、清华大学、上海交通大学、北京理工大学和重庆大学也在积极进行机构知识库的建设和服务工作。2010年,中国科学院与德国马普学会在北京共同主办了第八次开放获取柏林国际会议,并与德国、英国、瑞典、美国等科研教育机构共同发起成立“开放知识库联盟”,通过全球合作推进开放存取知识库发展[2]。
然而,目前的开放存取运动,似乎仅限于在高校与科研机构中得到认同和利用,国内绝大部分企业、社会机构和公众对科技及学术信息的获取仍然受到很大的限制,获知能力与获取条件也极度不平衡。
1.3 广西机构自建学术数据库开放共享情况
本课题组于2013年3-11月在广西选取调查了111家机构(含高校、科学研究机构、企业、公共图书馆)的200多个自建学术数据库,大约可分为公共文化类型数据库、学术研究型数据库、决策辅助型数据库3种类型。其中,有61%的机构仅局限于本单位IP地址内访问和使用自建数据库,另有18%的机构允许协议单位人员通过密码登录使用数据库。只有21%的机构(主要是公共图书馆和部分高校图书馆的公共文化类型自建数据库)对用户无限制,实行全开放使用。从总体上看,广西的自建学术数据库开放共享的程度非常低,使数据库本身的价值得不到充分的发挥与体现。
要把各个不同机构的不同类型的自建学术数据库进行整合共享,面临着诸多困难:1)技术上的问题。第一是数据库建设技术的不统一。各个机构所用的建库平台和系统不一样,在抽查的35个样本机构中,采用的建库系统多达13种;第二是数据库文件格式及元数据标准的不统一;第三是访问权限的限制。很多机构的数据库都限制为机构内局域网访问。2)需要一个组织管理机构进行共建共享的统筹规划管理,并制定相关的共建共享政策与规范。3)缺乏专项建设资金,可持续发展不容乐观。
2 机构自建学术数据库开放共享中的关键问题研究
在全国甚至全球的信息资源共建共享的大趋势之下,广西的文献信息资源共建共享平台也在逐步完善中,但独具特色的机构自建学术数据库在共建共享中被忽略了。鉴于自建学术数据库收录内容的独特价值性,应该重视它们的利用情况,将其纳入广西信息资源建设与共享的规划中。
2.1选择合适的共享平台
自建学术数据库的共享,需要依托一定的计算机网络服务平台才可实现。目前整个广西范围内使用的信息资源共享平台有不少,影响较大的主要有:高校系统的CALIS数字图书馆系统平台(http://www.gx.calis.edu.cn:8090/)、情报系统的广西科技文献共享与服务平台(http://www.gxstd.com/)、医学系统的广西医学文献信息服务站(http://data.gxmi.net/)、自治区“人文强桂”建设工程成果————广西人文社科文献资源共享平台(http://www.rwqg.gxnu.edu.cn/portal/index.jsp)、公共文化系统的广西文化共享工程信息资源共享平台(http://gxwh.gxlib.org.cn/oai/)以及商业化的以百链云为基础的广西区域数字图书馆共享平台。另外还有一些基于云计算的公有云服务平台,如谷歌云、阿里云、新浪云、百度云等。
自建学术数据库的共享,是单独使用一个服务平台,还是与其他文献信息资源共用一个平台?在上述众多平台中,选择哪一个最合适?我们可以先了解各平台的特点:CALIS是整合了高校各图书馆文献资源并面向高校用户的数字图书馆,具有检索、申请传递、运送、结算、咨询等功能,但在使用前必须先整体导入用户信息,以保证用户身份的合法性,各馆还须有专人负责所有事务的处理;广西科技文献共享与服务平台整合部分科研系统、公共文化系统、高校系统的资源,集检索、申请、发送、咨询等功能,既面向集体用户(固定IP用户),也面向个体用户(动态IP用户),用户在使用前须免费注册并充值账户,但充值卡需到当地科技局申领获得,平台未提供其他充值途径;广西医学文献信息服务站是专业文献平台,功能单一,仅有检索与下载(需付费)功能;广西人文社科文献资源共享平台整合了部分高校和公共文化系统的资源,但平台功能还未完善,检索、咨询、传递等功能经常无法正常使用;广西文化共享工程信息资源共享平台中学术性、研究性的文献资源少,仅提供检索与浏览功能;广西区域数字图书馆共享平台整合了全国范围内高校、公共图书馆、研究所等机构的各学科各种类型的中外学术资源,提供一站式检索,用户在检索后可直接下载或通过邮箱申请文献传递并在24小时内获取,但须由各机构自己购买平台(每年支付费用)并在IP范围内使用。
如果使用公有云服务平台,机构则不需要订购软硬件,只要借助云平台,即可调试应用和服务。以新浪云(Sina App Engine,SAE)为例,SAE与新浪账号紧密联系,经过认证后即可使用。它借助Web Service Pool,支持MySQL数据库,提供以PHP和HTTP技术的同步计算为基础的计算中心,使许多不懂底层开发的使用者把SAE当作虚拟主机免费空间来使用,而且能够非常方便地在SAE上进行Web开发,包括创建Web应用、定制Web应用、部署Web应用、开发Web应用、切换线上版本和删除应用等操作,不必担心故障宕机、服务扩容[3]。另外,SAE的开发成本和运行维护成本较低,因为新浪云提供定额免费的存储空间和流量,即便超出了使用额度,也只需要即买即用、按需付费,投入成本不会过多。在云服务平台上,每位用户均可提供和分享信息资源与服务,甚至可以在线编辑、评论,促进用户与机构之间、机构与机构之间、用户与用户之间、用户与资源之间的互动,真正达到共建共享的目标。
因此,从用户使用、资金成本、功能性能、技术成熟程度、平台维护等多方面综合考虑,建议借用广西科技文献共享与服务平台,或者是选用公有云服务平台。当然,无论选择哪一个平台,必须对平台的各项功能进行重新设计或改进。
2.2一站式的资源整合与检索技术
面对多个数据库的海量信息,用户往往希望一次输入即可完成对所有数据库的检索,不同格式、不同类型的符合检索条件的相关数字资源能够一次呈现、无缝链接、顺畅获取。现在,众多的机构自建学术数据库分布在不同的地理位置,分别有各自的信息组织方式、处理方式和检索系统,为用户提供不同的查询方式和服务种类。如何整合如此众多的自建学术数据库,屏蔽各个数据库的差异,实现用户快速便捷地访问资源、发现资源及获取资源的愿望?
一站式的数字信息资源整合与检索技术能够解决这个问题。实际上,一站式检索已成为信息资源共享研究和实现的重要热点之一,并在国内外得到广泛应用,如清华同方、万方、百链云、CALIS系统等都支持一站式检索,西安交通大学、华中科技大学还自行开发了异构资源统一检索平台[4]。
一站式资源整合与检索中的关键技术主要有:1)J2EE技术(多层次分布式应用模型),一般采用客户端、应用服务器、数据库服务器三层结构,业务逻辑处理集中在应用服务器层,当业务逻辑有所改变时可以改动应用服务器层,对其他两层则改动较少,以提高系统的安全性;2)DOM(文档对象模型)技术,DOM是以层次结构组织的节点或信息片断的集合,也是一种与浏览器、平台、语言无关的接口,使得开发者可以访问页面其他的标准组件并做其他开发任务;3)Ajax技术,即异步JavaScript和XML,它是几种技术的强有力组合,包括XHTML和CSS标准化呈现、XML和XSLT进行数据交换与处理、DOM实现动态显示和交互、XMLHttPRequest对象进行异步数据读取、用JavaScript绑定和处理所有数据;4)Struts+Hibernate框架技术,是基于模型(Model)-视图(View)-控制器(Controller)模式的应用架构的开源框架;5)Web Service技术,其最大特点是跨平台的通用性,通过使用统一的标准,能够统一封装数据、消息、行为等,在无需考虑具体应用环境下让不同系统实现跨平台,彼此兼容,进行无缝通信和数据共享;6)SOA技术,即面向服务的体系结构,它将应用程序的不同功能单元(称为服务)通过这些服务之间定义良好的接口和契约联系起来;7)Lucene全文检索技术,它可以方便地嵌入到各种应用中实现针对应用的全文索引/检索功能[5]。
2.3采用联盟委员会的组织管理方式
自建学术数据库的共建共享是一项长期的系统性、协作性的互惠互利的大工程,必须有组织上的保障,尤其是在广西范围内跨地域、跨行业、跨部门的机构之间的合作共享。这种基于地域基础的共建共享,可以借鉴国外开放获取机构的经验,采用自治区内联盟的合作模式,由自治区级政府部门或科技文化部门牵头,召集广西范围内的相关机构,在自建信息资源共建共享的目标指引下根据一定的组织协议,共同组建一个联盟委员会。各机构在联盟共同发展、合作、进步的宗旨引导下,为避免重复性建设,节约原本就紧张的人力、物力和财力,提高广西各类自产自建信息资源的数量和水准,应以统筹规划、统一标准、联合共建、资源共享为方针,充分发挥自身的自建信息资源的价值,共同构建自建学术数据库共享平台,为广西的全面发展提供充足的信息资源。
2.4 构筑保障共建共享的制度体系
机构自建学术数据库的共建共享需要以规范化的数据格式为标准,并以政策、制度方面的保障作为支撑,尤其是要尽可能争取得到国家层面(或者是省区级政府层面)的政策支持和经费资助。制度保障体系包括技术标准规范、行为规范条例、利益平衡机制、经费保障机制、监督激励机制等多方面。技术标准规范能够控制和保证信息资源的数据质量标准、共建共享的技术标准(如检索技术、传递软件、支付与结算软件等)及评价系统的一致性;行为规范条例可以明确联盟成员必须履行的责任和义务;利益平衡机制确保成员机构的合法权益并有效调节成员机构之间错综复杂的利益关系;经费保障机制能够确保共建共享的可持续健康发展(可向政府申请拨付信息资源建设专项经费并争取形成长效性的支持);监督激励机制可以促使成员机构自觉履行各自的义务,约束制止不良行为的发生,激发参与共建的积极性,确保共享资源的数量与质量,使共建共享顺利进行。
2.5采取用户自助与文献传递相结合的服务模式
课题组在调查中了解到,用户在查找与获取信息时偏好自给自足,不喜欢受到他人的干预。因此,自建学术数据库共享平台所采取的服务模式,应以满足用户自助获取信息文献的需求为主要目标。各个机构的自建学术数据库整合在共享平台中,实现集中存储、统一发现、一站式检索、远程共享。用户在终端通过统一认证、统一授权、统一计费与结算,可以自行随时随地下载、浏览和使用这些资源。一些因知识产权问题而不能直接下载的信息,则可通过成员机构中的参考咨询员在平台中为用户检索、下载,或者用户通过E-mail申请文献传递的方式来实现共享。
此外,随着新技术对信息资源建设的不断渗入,共建共享平台可以探索拓展新的服务形式。比如,用户可使用手机移动分享自建学术数据库共享平台的信息资源,使信息服务无处不在,提高平台信息服务的能力与效率;平台上开设虚拟社区,方便用户进行全方位的交流与互助,也利于收集用户的反馈意见,促进平台的改进与完善。
2.6参与开放存取活动
机构自建学术数据库特别是机构知识库的共享,是否可加入到开放存取的运动大潮中去?在国内外开放存取运动的影响下,广西机构自建学术数据库加入开放存取是必然的趋势,可以分步骤逐步实现。首先是开放政府及其下属部门的公共政策类、文化类及其他类型的自建学术数据库;第二步是开放高校和科研机构的知识库,这些知识库的内容大部分是由国家和政府公共资金资助的科研项目成果;第三步开放企业及其他机构的不涉及知识产权和企业机密的自建学术数据库。
机构自建学术数据库参与开放存取活动,能够确保广西广大公众获得这些源于本土的知识来学习和创造的权利,真正实现社会知识权的公平保障和公共成果的公平利用,提高国家自主知识资产的社会共享能力,更好地把知识效益回馈于社会。
3 结语
广西的文献信息资源共享事业已经小有成就,有了不少的平台。但是,这些平台之间的联系较少,也存在一定的问题。希望自建学术数据库的共享,能促进解决这些问题。最便捷的方式是,自建学术数据库能与其他类型资源如图书、期刊、报纸、网络资源及学位论文等其他特种信息整合在一个平台中共享,并且能够融合咨询服务、文献传递、Google等学术搜索引擎、相关链接服务、个性化服务、意见反馈等服务功能,使平台成为一个信息发现和获取的服务平台,为用户提供一步到位的信息检索与服务,为科教兴桂发挥其应有的作用。
[参考文献]
[1]张晓林.实现开放获取,支撑科技创新:有关国家和机构支持科技期刊开放出版的政策与措施[J].中国科学院院刊,2013(3):378-385.
[2]李武,梁小建,杨琳.近五年来开放获取运动的国际进展分析[J].科技与出版,2013(8):71-75.
[3]龚洪敏.基于云计算机环境的优质资源共享平台的研究[D].西安:陕西师范大学,2013.
[4]解金兰,王雅娟.基于新门户建设的信息资源一站式检索服务研究:以我国重点高校图书馆为例[J].情报理论与实践,2013(8):62-65.
[5]王庆恒.基于一站式数字图书馆资源整合和服务集成系统的研究与实现[D].北京:北京邮电大学,2010.
[收稿日期]2014-04-01
[作者简介]廖球(1971-),女,硕士,副研究馆员,广西科技大学图书馆。
[说明]本文系2013年CALIS广西文献信息服务中心预研项目“广西机构自建数据库建设及其共享模式研究”(项目编号:CALISGX201306)和2013年度广西现代远程教育研究中心公开研究课题“广西高校图书信息资源远程共享研究”(批准号:2013ZXZD05)研究成果之一。


最新评论