文章正文

诗词 散文 小说 杂文 校园 文苑 历史 人物 人生 生活 幽默 美文 资源中心小说阅读归一云思

从数字化到数据化:信息组织工作如何应对图书馆智慧化转型

时间:2023/11/9 作者: 图书馆界 热度: 17789
徐 婷

  (广西壮族自治区桂林图书馆,广西 桂林 541100)

  2021年9月,《国家图书馆“十四五”发展规划》正式发布,明确提出图书馆“智慧转型”的战略任务和建设全国智慧图书馆体系的总体构想。智慧图书馆是以现代信息技术驱动,以知识内容生产、组织、传播和保存为核心,以业务流程与管理智慧化为基础,以服务空间与服务形式高度知识化、智能化、融合化为特点的新型图书馆发展形态。在国家图书馆提出的“1+3+N”智慧图书馆体系总体框架中,打造知识资源集成仓储、开发构建智慧图书馆管理系统和多维融合知识服务平台是智慧图书馆的主体部分。其中,加强知识资源组织加工,提升数字资源管理与服务的信息组织工作将为智慧图书馆建设提供必备的基石。因此,积极探讨图书馆信息组织工作如何应对智慧化转型的挑战,有助于促进智慧图书馆由概念构建走向实践探索。

1 图书馆信息组织工作的内涵及发展历程

1.1 图书馆信息组织工作的内涵

广义的信息组织指的是人类社会信息活动中产生的信息、信息生产者、信息技术等信息活动要素的集合,狭义的信息组织则是指人类社会经济活动中经过加工处理有序化并大量积累起来的有用信息集合。戴维民认为“信息组织是为了方便人们检索、获取信息而将庞杂无序的信息进行系统化和有序化的过程”。储节旺等认为“所谓信息组织,就是人们根据信息本身的特点,运用各种工具和方法,依据一定的标准,对其进行加工整理、排列与组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动”。一般来说,图书馆信息组织工作主要是针对已经组织好的信息资源(一次文献)进行再组织(二次文献、三次文献等),包括信息搜集与选择、信息分析与揭示、信息描述与加工、信息整理与存储、为用户提供信息咨询服务等。

1.2 图书馆信息组织工作的发展历程

1.2.1 传统图书馆信息组织模式。早期传统图书馆的信息资源以纸质印刷体为主,信息组织模式以手工操作为主,根据分类法和主题词表对文献信息进行标引、描述和排序,以卡片式形成馆藏目录。信息组织的价值是通过信息的采集、加工、存储向信息传播、共享、创新这样环环相扣的价值链(见图1)来实现的。随着20世纪60年代计算机技术应用于图书馆,产生了以机读目录(MARC)为标志的图书馆信息组织自动化阶段,信息环境、信息需求和信息利用模式都发生了改变,图书馆信息组织的对象经历了从文献信息向情报信息再向网络信息的迭代演化,从而引发了信息组织价值链各个环节的改变,为信息组织变革做准备。

  

  图1 信息组织价值链

  1.2.2 数字图书馆信息组织模式。数字图书馆的诞生从20世纪40年代“Memex”概念雏形,到80年代虚拟图书馆的构想,再到90年代国际图联(IFLA)大会提出“数字图书馆”理念,经历了里程碑式的发展。2000年,中国数字图书馆工程的实施标志着我国正式迈入数字图书馆行列。经过20年的建设和发展,我国已建成以国家数字图书馆为龙头的数字图书馆体系,截至2017年,数字图书馆推广工程覆盖全国41 家省级图书馆、486家地市级图书馆,服务辐射 2 900 多个县级图书馆,覆盖全国公共图书馆的数字图书馆网络体系全面连通。数字图书馆的信息组织范式更为复杂,对纸质书刊、光盘、磁带、胶片、胶卷等原始文献进行数字化存储和网络化组织,在资源描述方式上利用元数据、XML语言等使之成为数字图书馆可使用的数据。此外,依托公共数字文化工程,近年来全国各省级公共图书馆大力开展资源库建设,已建成一大批诸如地方特色文化专题资源、地方革命文化专题资源、图书馆公开课、地方文献数字化、地方特色音视频资源等数字文化专题资源库。

  1.2.3 智慧图书馆信息组织模式。当网络信息组织时代蓬勃兴盛的同时,大数据分析、云计算、物联网、区块链、人工智能等新的信息技术不断融入,推动着新一轮的信息革命纵深发展,这些新技术正在给图书馆赋能,孵化出智慧图书馆的未来图景。目前已有深圳、佛山、东莞、广州等地公共图书馆将智慧图书馆纳入“十四五”规划。智慧图书馆信息组织模式不再停留在信息加工和服务层面,而是以知识组织为核心,受“知识组织价值链”(见图2)所驱动,将数字图书馆的服务上升到知识服务和智慧服务层面。知识组织系统在知识的发掘、揭示、关联,以及价值评估、智能创造等环节发挥着特别作用。总体来说,未来智慧图书馆的信息组织将会更趋向于朝语义化、数据化、一体化、交互性等方面发展,信息知识组织系统的智能化重构将大大增强图书馆的应用功能和服务水平。

  

  图2 知识组织价值链

2 图书馆智慧化转型中信息组织工作的演化趋向

顺应时代的发展,由科技进步和人民群众日益增长的精神文化需求所推动的图书馆智慧化转型使图书馆信息组织模式仍在日新月异地演化进行中,而信息组织的核心要素早已发生改变(见表1),主要表现为以下几个方面。

  

  表1 图书馆信息组织工作的变化对比

2.1 信息组织对象的变化

传统图书馆信息组织对象最主要的载体形式是图书、报纸、期刊以及地方古籍等纸质印刷馆藏,随着信息时代的发展,电子载体越来越多,数字图书馆的信息组织对象是以自建地方特色数字资源库及外购或获得许可使用的数据库等数字馆藏信息形式所呈现。未来智慧图书馆的信息组织对象则是以知识资源为核心的数据馆藏,包括语义化词表等基础知识资源、各类文献细颗粒度标引的知识元、用户使用行为数据、用户知识交互及评价等数据。

2.2 信息组织方式的变化

过去的数字图书馆是为了便于长期储存大量文献的需要,运用数据库、元数据、搜索引擎等技术手段对文献资源作数字化和可视化处理,但信息组织方式大多呈现为线性结构,即采用分类法和主题法进行信息内容编排,按照资源类型、数据库列表等形成数字图书馆目录,用户通过查询检索仍是源于数字文献资源获取信息。智慧图书馆则是对数字化的文献资源深入做数据化的知识元加工处理,通过对知识元(如地名、人物、事件等细颗粒度标签标引)的揭示、重组与关联构建出一个多维互联的信息系统,从而实现大数据网络合作下的知识转化、交换和传播以及融合效应,用户可直接源于信息获取知识,获得真正的知识智能服务。

2.3 信息组织结果的变化

传统图书馆信息组织有相对封闭且独立的文献壁垒,馆际间的资源共享碍于地域、时间等因素难以实现。而网络技术的发展促使现代图书馆的改革建设,信息组织由封闭转变为开放。在数据开放的环境下,通过技术手段为公众提供一站式“文化信息资源的聚合和展示”,从而实现信息资源的共享。例如,国家公共服务云平台将各省级公共图书馆和地方数字图书馆的公共文化资源汇聚、整合到全国公共文化数据中心统一的云目录中,同时,省级图书馆数据管理平台也可以接收和获取国家公共服务云平台的相关资源与服务数据。在这个庞大的信息组织网络系统中,图书馆的馆藏资源及其他信息资源都可以通过关联数据发布,各馆不再是一个个信息孤岛,而是成为关联信息的枢纽,从而实现馆际智能联合检索和信息组织的互联互通。

2.4 信息服务方式的变化

传统图书馆信息资源获取渠道单一,且属于被动服务,用户获取信息的时间与成本相对较高。为适应网络时代公众获取资讯方式的变化,目前,我国一些公共图书馆在积极探索“互联网+公共文化”信息服务模式,如江苏省建设和完善中的公共图书馆大数据服务平台,其目标就是对全省公共图书馆及大部分基层点的业务数据、馆情数据的采集、加工和整理,并通过大数据分析,为全省用户提供一站式网络数字化的资源展示和应用服务。中国国家图书馆在智慧图书馆体系下计划构建的多维融合知识服务平台则是将知识生产全产业链协同贯通,建立标准统一、多元参与的“知识淘宝”,将信息服务变被动为主动,为用户提供全渠道、多终端、个性化、智能化、专业化的信息服务,极大提升信息服务效能。

3 图书馆智慧化转型中信息组织工作的问题与挑战

3.1 当前数字图书馆信息组织工作存在的不足

虽然我国在公共数字文化建设方面取得了阶段性的进展,全国公共图书馆的数字资源库群初具规模,数字服务网络基本成型,但距离“智慧化”尚有较大差距,主要表现在以下几个方面。

  3.1.1 馆藏资源数字化不完整,数字资源版权待完善。许多公共图书馆在进行数字资源建设的过程中,外购的数字资源库、在线数据库占比较大,自建馆藏数字资源较少,容易出现同质化、类型单一、针对性不强、易用性不高等弊端。还有一些已经数字化的自建资源没有彻底解决好版权许可问题,在服务边界方面缺乏法律确权和技术保障,尤其是2021年6月1日新修订的《著作权法》正式实施后扩大了保护作品的范围,对“合理使用”有了更严格的限定,并对著作权人的权利内容与权利归属作出进一步的修正,使得图书馆数字资源建设也要随之完善和改变。

  3.1.2 各类数字资源基于知识内容的描述、揭示度不高,缺乏关联性。数字图书馆信息组织方式正处在以文献作为基本著录单元的阶段,因此仍然属于粗粒度的信息表达,而基于元数据的知识表示方式不能完全解决语义异构问题,更不能系统揭示知识之间的语义关系,难以形成具有关联性的知识图谱,不利于用户对知识资源的全面掌握和深度挖掘。

  3.1.3 资源利用向服务能力转化不足。由于公共数字文化服务是新时代的产物,很多公共图书馆存在“重建设、轻服务”的现象,对如何利用本馆海量的数字文化资源并进行有效的推广与传播缺乏经验。而且,信息服务平台采取的是自上而下而不是以用户需求为导向的资源供给模式,跟不上当前公众知识需求的变化速度,导致资源访问和获取率不高,数字化服务就难以产生大规模的用户群体。

3.2 信息组织数据化所面对的挑战

信息组织数据化就是把信息中包含的有意义的知识元转化为计算机可识别、计算、分析、重组的结构化数据的过程。它是建设智慧图书馆的核心内容,为图书馆的智慧管理和智慧服务提供坚实的数据基础。智慧图书馆对数据进行有效的聚合和关联,是实现图书馆“物物相联”“人人相联”“人物相联”的重要支撑。

  3.2.1 在资源管理上形成知识关联的馆藏资源体系。智慧型信息组织可以利用知识内容内在的逻辑机理,依靠大数据技术分析各个知识元之间的相关属性,深入挖掘知识内涵,建立诸如同义关联、类目关联、关键词关联、检索关联等知识关联方式,将各类知识组织联通起来,加以整合利用。因此,知识标引建设与数字资源建设必须相辅相成。图书馆应利用语义网、大数据、智能计算等技术,对已数字化的地方特色文献、古籍、公开课、专题片等馆藏资源进行细粒度内容标识、关键知识点的标签标引建设,完成馆藏资源的语义标注及聚合,构建内容精细化揭示,多维度、多层次、多粒度的馆藏资源体系,实现对资源价值的深度挖掘及智能化,从而为用户提供信息资源的知识化、专题化服务。

  3.2.2 在信息服务上建成一体化的知识图谱服务体系。如何为用户提供准确的、个性化的知识服务是未来智慧图书馆信息组织工作的目标。在大数据时代,数据服务模式将因信息颗粒度细化而产生更加智能化的知识图谱服务。知识图谱的应用价值不仅局限于由关联数据模型构建而成的网状知识库,还能够提供与实体交互的智能问答、决策分析、常识推理等智能化应用。通过对馆藏数字资源和更多动态性异构网络数据资源进行面向知识图谱的深层次标引,实现智能度更高的知识推送和知识应用,能够有针对性地为用户提供其所需要的“知识干货”,最大限度地满足用户对知识的全面感知。一体化、智能化的知识图谱服务体系还将打破单向输出的知识屏障,体现出用户参与式架构,进行知识协同共享交互、用户间的知识分享等,在人机协同的大数据智慧机制中建立人与资源、资源与资源、人与人之间的知识链接,实现智慧情境下的知识服务功能。

4 面向智慧图书馆的信息组织工作发展思路

4.1 资源生成阶段

智慧图书馆信息组织数据化是一项量级庞大的工作(见图3),必须建立在数字资源的基础上。图书馆应构建统一规范的数字资源体系,对数字资源内容进行管理,拓宽数字资源的来源渠道,围绕图书、期刊、报纸、古籍、音视频等多种类型数字资源开展知识资源精细化标引、知识组织与新型数字资源建设工作。而“千里之行,始于足下”,地方图书馆首先要有针对性地挖掘地方特色文献及文化资源,分主题或以专题性数据库的形式确定数据加工的范围,并加强版权管理意识,积极解决版权遗留问题,优先选择已经获得版权许可的数字资源。

  

  图3 智慧图书馆信息组织工作流程框架设计

4.2 数据加工阶段

智慧化的信息组织是利用知识关联方法建立起的知识元集成信息组织系统。由于进行精细化标引的基础文献中存在的知识元数量庞杂、分散,且具有跨学科和交叉领域的特点,知识加工整理应遵循以下步骤:1)基于人工智能综合分析加工对象的文献形态、内容结构和服务需求,采取科学合理的分类和详细的标引措施。2)基于深度学习在自然语言处理、文本挖掘领域的定制化需求,确立知识抽取规范和抽取办法,形成知识抽取模型。3)利用信息语义分析工具、数据模型等知识抽取技术完成集约化的知识元标引,在技术的应用过程中需加强人工干预进行质量审核监控,以保证获得高质量的知识抽取数据。4)碎片化知识资源体系重组。利用知识内容内在的逻辑机理,依靠大数据技术识别各个知识元之间的相关属性,解析知识数据的内涵信息,建立诸如同义关联、类目关联、关键词关联、检索关联等知识关联方式,将各类知识数据联通起来,形成知识图谱。

4.3 数据管理阶段

智慧图书馆信息组织的数据管理包括数据分类、数据聚类、词表建模、本体建模、知识建库、数据封装、数据存储等。管理对象则分为元数据库、全文数据库、知识资源库、本体模型库、词表库、电子图像库等。其中,元数据作为“描述数据的数据”,在图书馆信息组织中发挥着重要作用。智慧图书馆应支持不同类型资源元数据的一体化、全周期的建设与管理,使元数据具有良好的互操作性及可重用性,满足“一次生产多次利用”的使用需求。为保证日后数据使用的延续性和知识更新的迭代性,还应采用一定的数据识别机制对不同来源、不同格式的元数据进行去重、补充、整合及语义关联,带动深层次的智慧协同开发与利用,实现对数据管理业务流程和系统功能的整合。

4.4 数据服务阶段

智慧图书馆将为用户提供基于知识图谱的信息服务,主要包括:实现语义搜索,使Web从网页链接向概念链接转变;支持内容聚合、精确定位与可视化检索,不同文献类型实现细分的垂直场景检索功能;利用分布式全文检索技术对内容进行高效的全文检索,确保信息的检全性与检准性;支持智能问答系统,以准确的自然语言为用户提供咨询解答;支持全终端无障碍阅读,并在严格的权限控制体系下实现数据安全保护;基于文献数字资源、多源异构数据的融合、业务管理数据、资源利用数据、用户行为及偏好等海量数据,进行多维化的大数据统计分析与决策,为用户做出精准的智能推荐,使用户获得更有深度与广度的信息资源等。这些都对图书馆信息服务平台的智慧化升级提出了更高的技术要求,是我们下一步要努力实现的目标。

5 结 语

在全国大力推动图书馆智慧化转型的形势下,图书馆信息组织工作经历着从数字化向数据化升级的变迁,面临的既是困难和挑战,也是巨大的发展契机。尽管“智慧图书馆”目前尚没有标准的实体对象作为参照,但我们要充分利用大数据时代下的新技术,探索图书馆信息组织工作未来发展路径,为公众提供高质量、个性化、实用便捷的知识服务,助推我国智慧图书馆事业不断向前发展。
赞(0)


猜你喜欢

推荐阅读

参与评论

0 条评论
×

欢迎登录归一原创文学网站

最新评论