数字人文视角下图书档案文献资源的协同开发研究

发布时间:2024-09-11 18:57:07被阅览数:34 次信息来源:《山西档案》

  作   者:巫晓萍

  摘   要:数字人文研究范式的兴起为图书馆学、档案学等学科带来新的发展契机。然而,当前图书档案在数字资源建设与知识服务中尚存在“条块分割”“数据孤岛”等问题,制约了文献信息资源内在价值的充分彰显。在系统梳理国内外相关研究与实践的基础上,分析制约图书档案文献资源融合的关键障碍,进而探析数字人文环境下图书档案文献资源融合的关键要素,从异构资源整合、知识组织与关联、情境化知识服务三个层面探寻其协同发展模式,以期为我国数字人文环境下的文献资源重构与优化提供借鉴和指南。

  关键词:数字人文;图书馆;档案馆;文献资源;协同开发

  数字人文,作为图书馆学、档案学等信息资源管理学科下的一个新兴学科与创新型研究范式,旨在利用数字技术手段解决人文社会科学问题,推动图情档领域服务模式的变革创新,跨学科融合研究、多元价值发现的理念也为图书档案文献资源的开发利用开辟了新的路径[1]。近年来,我国多次出台的相关文化战略与政策规划,为数字人文时代图书档案事业的融合发展指明方向。例如,2022年中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》,明确提出“加快文化数字化建设标准研究制定,健全文化资源数据分享动力机制”。同年,两办印发的《“十四五”文化发展规划》进一步强调“以物理分布、逻辑关联、快速链接、高效搜索、全面共享、重点集成为目标聚集文化数字资源”。在此背景下,作为人类文明与知识传递的重要载体,图书馆与档案馆所存储的数字文献资源亟须突破机构和系统的藩篱,实现互联互通、协同发展。这不仅是知识资源社会化共享的必然要求,而且契合了数字人文研究强调跨界整合、多维解构的时代特征[2]。因此,本研究立足于数字人文视角,深入探索图书档案文献资源的协同开发路径,对于深化文献信息资源建设、拓展知识服务功能、推动文化传承创新具有重要的理论与实践意义。

  1  馆藏机构合作的理论基础与障碍分析

  1.1 图书馆与档案馆合作的理论基础

  首先,在历史进程上,图书馆与档案馆自古以来肩负着收集、整理、保管和利用人类文明成果的重要使命,有着相似的社会职能分工。新世纪以来,网络信息技术的快速发展和公众文化需求的提升推动图书馆与档案馆在资源开发与利用服务等方面不断加强协作。二者在传承知识、服务社会的宗旨内核上一脉相承,为开展合作奠定了历史基础。

  其次,在资源属性上,图书馆与档案馆分别以出版物和特定历史时期的原生文献资料为典型馆藏,是国家文化遗产和智力资源的重要组成部分。再次,在资源形态上,图书档案资源逐渐由传统的纸质载体向以数字对象为主体的多模态资源演变,为跨越机构间的壁垒、实现异构资源关联融合创造了条件,也为二者合作共建文化资源平台、提供知识服务提供了资源基础。

  最后,在服务理念上,服务社会和公众是新时代图书馆与档案馆的共同使命。如何突破资源与服务的机构边界,整合分散于不同文献信息单位的优质资源,实现符合当代文化资源“以人为本”的服务理念逐渐成为衡量两馆服务水平的关键。强调以用户需求为导向,创新服务模式,注重资源与服务的有机统一,已成为图书馆与档案馆的融合路径。

  1.2 图书馆与档案馆合作的障碍分析

  图书馆与档案馆虽然在文献资源开发与利用服务方面有诸多互补性和契合性,但受原本体系中的管理制度、业务流程、资源标准等因素制约,实现双方融合与协同发展仍面临一些障碍。具体来讲,首先由于部门分割和条块管理的影响,我国公共图书馆与档案馆长期隶属于不同的行政管理系统,在资源建设、业务管理上缺乏必要的政策协调和交流合作。其次,图书馆与档案馆在资源采集与组织管理环节所遵循的原则、标准、规范各有异同。例如,我国图书馆普遍采用《中国图书馆分类法》等分类体系,按照一般文献的著录规则如CNMARC等,对出版型文献资源进行主题组织与描述;而档案馆基于档案的特殊属性,强调对重要文件材料的原始出处和形成背景进行实证与梳理,突出档案文献的证据价值和真实性。再次,图书馆和档案馆在数字资源组织方面分别采用了不同的元数据标准。例如,前者以都柏林核心元数据等描述性元数据为主,强调资源内容、题名、主题、检索途径等信息的规范标引;后者则主要采用编码档案著录标准EAD等档案界特有的编码标准,注重文件材料产生背景、处理历史、相互关系等方面的说明。要想推动二者的融合发展,关键在于遵循文化传承创新的内在规律,立足用户需求导向,在国家政策的引领下,在资源、技术、服务等层面不断深化合作内涵,拓展融合外延,最终形成布局合理、定位清晰、优势互补的文化资源整合与知识服务新格局。

  2  数字人文视角下图书档案文献资源协同开发路径

  2.1 数字人文视角下图书档案文献资源融合的总体框架

  结合图书档案文献资源的现实瓶颈,数字人文理念的引入推动了图书档案文献资源领域三个层面的变革:一是从资源整合的广度向深度延伸,通过跨机构、跨领域的文献资源关联,揭示文化知识的内在逻辑;二是从主题描述向语义关联拓展,通过本体构建与语义标引实现知识元的多维度聚合;三是从信息获取向知识发现的提升,为用户提供智慧化、交互式的资源感知与利用体验。换句话说,数字人文研究范式的变革为图书档案文献资源实现深层次、多维度、全方位的融合应用指明了方向。因此,基于当前研究所梳理的数字人文相关理念、关键技术和发展路径,本文尝试构建一个图书档案文献资源协同开发的总体框架。该框架由异构资源整合、知识组织与关联、情境化知识服务三个层次构成,对应了图书档案领域资源协同开发的核心要素[3]。值得注意的是,本研究提出的框架并非简单的自下而上的层次递进,而是一个动态开放的协同系统。随着数字人文研究方法与范式的不断深化,新的理念、新的技术、新的需求不断涌现,其框架的核心理念始终围绕着数据生命周期的本质,进行符合时代需求的调整与完善。

  2.2 面向异构资源整合的元数据标准化

  图书档案在采编标准、著录规则等方面存在诸多壁垒,建立资源描述的统一元数据标准、统一元数据语义等,能够实现多元资源属性的扩展,为后续多源异构的知识关联奠定基础。通过对比发现,图书馆与档案馆在元数据标准的采用上存在明显差异,面向异构文献资源整合描述已成为元数据发展的必然趋势。IFLA、ICA、DCMI等国际知名信息资源管理组织提出的一系列解决方案,为我国当前图书档案异构资源整合提供了实践参照。具体路径如下:一是要联合各馆机构发展综合性、扩展性的元数据框架,使得新一代元数据标准能够在兼容旧版规范的基础上,借鉴语义网、关联数据的理念,增强语义表达的外延与关联能力;二是要构建语义映射与转换机制,主要利用RDF、OWL等语义网标准范式,实现不同元数据模式在三元组层面上的匹配与关联;三是要发展基于图书档案资源属性的独特元数据应用框架,即在通用元数据标准的基础上,针对图书档案某一特定资源类型,制定适用于其内容、风格特点的元数据规范,能够在很大程度上弥补元数据语义表达的局限性[4]。

  2.3 面向知识关联的多维语义组织

  数字人文视域下的文献资源的知识组织与关联,主要是通过数字人文核心方法与工具,例如本体构建、信息抽取、关联数据等技术,深入文本、图像、音视频等多模态数据,揭示分散资源的内在联系,最终形成网状的语义知识库。由于当前传统图书分类法、主题词表等知识组织工具大多采用树状、层级式的结构模式,难以揭示各机构资源之间的复杂性和动态关联。运用深度学习等自然语言处理技术对海量异构数据进行抽取、映射、融合,构建基于主题概念的知识链接网络,能够形成图书文档资源的多维与动态集成。具体来讲,首先要遵循图书档案文献资源的内容产生、外在表现、管理传播等方面的一般规律,凝练资源、载体、主题、背景、行为主体、过程、关系等高层次实体,构建资源语义描述的通用本体,为不同馆藏资源的语义映射提供统一框架。其次,从特定视角对不同馆藏资源的核心语义单元及组配关系进行抽象,构建特征本体,能够在垂直领域形成规模化、精细化的知识组织。最后,运用自然语言处理、机器学习等人工智能技术,以领域本体为语义基础,对结构化、半结构化、非结构化的文献资源进行加工、处理、抽取、整合,链接其中的知识要素并形成关联数据,进而利用知识推理、知识融合等模式实现知识的深度价值挖掘[5]。

  2.4 面向知识服务的情境化应用呈现

  情境化知识服务是数字人文视角下图书档案文献资源协同开发的最终应用形态,其核心是基于用户需求场景,运用语义分析、知识推荐等技术,多角度、跨媒体地揭示隐含于文献资源中的知识价值,为用户提供沉浸式、交互式的知识体验。本框架基于数字叙事理论的资源情境化呈现路径,在坚持人本、需求导向的同时,注重技术、内容、体验的系统设计,充分挖掘馆藏的知识要素与关联脉络,构建沉浸式、关联化、智能化的知识服务生态,最大限度地彰显资源蕴含的人文价值。具体体现在以下三方面:第一,在资源组织层面上,叙事理论可为构建情节驱动的资源语义关联提供依据,依托领域知识图谱,重点刻画人物、事件、时间、地点等叙事元素,发掘文献线索间的因果逻辑,形成以人物为主线、情节为联结的知识化叙事场域,实现多重知识的逻辑关联;第二,在信息呈现方面,结合叙事的典型场景与话语模式,优化交互设计,如运用游戏化手段,将文献内容转化为沉浸式的探索体验,增强用户的现实体验;第三,在服务流程设计上,将AIGC类技术构建智慧问答系统接入图书档案数据库,形成智慧化信息检索与知识增强检索机制,绘制用户画像,规划出适合用户自身的虚拟场景,形成智慧化叙事新思路,为用户提供精准化、智能化的图书档案知识服务。

  参考文献

  [1]曾蕾,王晓光,范炜.图档博领域的智慧数据及其在数字人文研究中的角色[J].中国图书馆学报,2018(1):17-34.

  [2]牛力,高晨翔,张宇锋,等.发现、重构与故事化:数字人文视角下档案研究的路径与方法[J].中国图书馆学报,2021(1):88-107.

  [3]龙家庆,王玉珏,李子林,等.数字人文对我国档案领域的影响:挑战、机遇与对策[J].档案学研究,2020(1):104-110.

  [4]李凤强.图书档案信息资源共建模式研究[J].山西档案,2017(1):91-93.

  [5]张卫东,赵红颖,李洋.欧美图书档案数字化融合服务实践及启示[J].图书情报工作,2013(12):23-27,22.

  【作者简介】巫晓萍(1971—),女,汉族,福建南平人,福建省图书馆馆员,本科,研究方向:图书档案文献资源的保护、传承、传播和发展。