基于RiC-CM的红色档案情境元数据模型研究

发布时间:2024-04-09 20:08:19被阅览数:204 次信息来源:《中国档案》

  文/韩莹   王從   宫宇

  摘要:红色档案具有很高的政治、历史和文化价值,蕴含着复杂的背景信息、丰富的人物关系及特色鲜明的历史事件,展示了中国共产党的奋斗历程。本文聚焦于红色档案情境信息的捕获,从红色档案描述及著录方案入手,以国际档案理事会发布的Records in Contexts-Conceptual Model(RiC-CM)为指导,分析RiC-CM模型的基本结构及层级关系,在此基础上确定反映红色档案基本特征及情境信息的实体、属性及关系,构建红色档案情境元数据模型。

  关键词:红色档案;RiC-CM;情境元数据;元数据模型


  红色档案资源开发利用红色档案是党百年奋斗历程和辉煌成就的真实记录,蕴含着中国共产党人的初心和使命,具有鲜活的当代价值,是弘扬伟大建党精神、推进党史学习教育常态化、长效化和开展“五史”学习教育最为生动、最有说服力的教科书。2021年6月,中共中央办公厅、国务院办公厅印发《“十四五”全国档案事业发展规划》,指出要大力挖掘红色档案资源,建立“四史”教育专题档案资料库,传承红色基因。档案部门作为保管红色档案的重要场所,应该从传统的保管向分析、挖掘、保护、宣传等方面进行更广更深的探究,大力挖掘红色资源,运用现代档案管理手段,对红色档案资源进行科学管理;认真领悟并持续贯彻习近平总书记“把红色资源利用好、把红色传统发扬好、把红色基因传承好”的重要指示精神,更好地服务党和国家工作大局、服务人民群众。

  目前我国没有专门用于红色档案著录描述的体系规范,在实际应用中主要参考《档案著录规则》《博物馆藏品信息指标体系规范》等,描述标准不统一、内容不规范,缺乏对与红色档案相关的重要历史事件及人物信息的语义描述。因此笔者从红色档案资源描述及著录标准入手,专注于背景、事件、人物等情境信息的捕获,以国际档案理事会依据档案资源的著录特点发布的专业概念模型Records in Contexts-Conceptual Model(以下简称“RiC-CM”)为指导,构建专门用于红色档案著录及描述的情境元数据模型,进而对红色档案资源进行标准化管理,以利于未来红色档案资源的共享及长期保存。

  红色档案及情境元数据简介

  1.红色档案的内容范畴

  本文所研究的红色档案主要指“中国共产党领导中国人民在对敌斗争、政治活动、经济、文化、社会、军事等方面形成的具有保存价值的历史记录”,具有凭证价值、教育价值及文化价值。红色档案资源是红色革命精神的物质载体,它所包含的内容不仅仅是档案实体本身,还包含档案的来源,档案反映的真实历史,相关人物的活动,档案载体经历的变化,红色精神如何传播,档案由谁管理,档案如何保存、如何利用等等。

  红色档案的描述要从关注档案本身的描述,扩展到对资源的背景、演变过程、参与人员以及复杂生命周期中对世界产生影响的信息描述。在数字环境下为了更好地保护和利用红色档案,资源描述和著录方法需要更多的关注语义表达,细化对象要素,因此很有必要建立一套科学、规范、统一的元数据模型来描述、组织和检索红色档案。

  2.元数据模型及情境元数据

  通常对元数据的定义是关于数据的数据,是从资源中抽取用来说明其特征和内容的结构化数据,用于组织、管理、保存、检索信息和资源。元数据模型是针对某一类资源,提取共性的元数据实体,并分析实体之间的关系,形成一个实体关系模型,为相关资源描述提供参考,为特定数字化信息资源建立一种机器可理解的框架。

  关于“情境”的定义,在不同的领域具有不同的侧重点,在《辞海》中“情境”关注人、行为、社会环境;在信息科学领域,“情境”通常被定义为描述与用户和应用之间的交互相关的信息,内涵通常包括人、对象、对象的变化、事件、位置、应用环境、用户的情感等。

  笔者根据红色档案的特点,认为“情境”应包含与红色档案整个生命周期相关的人、事件、社会及历史背景、时间、空间等信息。情境元数据是为了提高事物情境信息的准确性、时效性、可理解性,按照一定标准确定描述此类信息所具备的元数据实体、属性及关系,以达到解释情境信息的作用。

  RiC-CM概述

  RiC-CM是国际档案理事会制定的文件著录系列标准之一,模型提取用于文件著录的可以表达背景、来源、上下文关系等的共性实体对象,分析其特征属性及其相互关系,在此基础上建构概念体系。Records in Contexts可以翻译成“情境中的文件”“背景中的文件”“语境中的文件”等,records可表示文件、档案、记录,笔者将context翻译成情境,“RiC-CM”译为“档案资料情境信息概念模型”。

  RiC-CM是为生成著录信息和情境内容提供的一种实体关系模型,也是一种描述情境信息的顶层元数据模型,旨在建立一个统一、灵活、可扩展的档案描述框架,为档案管理提供语义和结构基础,对理解和描述记录资源在时间和空间上创建、积累和管理的情境信息具有重要的现实意义和应用价值,是制定本土元数据模型的重要参考标准。

  1.RiC-CM结构概述

  RiC-CM的主体内容包括实体、属性及相互关系,强调记录与其创造者、管理者、使用者等相关实体之间的关系,并能够表达记录在不同层次上的语义信息。RiC-CM中规划了描述情境信息的4个核心实体,包括数据资源(record)、实例(instantiation)、创造者/使用者(agent)、活动(activity),核心档案实体对描述记录以及记录形成和长期使用的背景至关重要,在一定程度上实现了对资源情境信息的描述,可以为内涵和外延较复杂的红色档案提供基础框架,如图1所示。

1.jpg图1   RiC-CM实体结构图

  2.RiC-CM的优势

  RiC-CM模型支持多层次、多视角、多语言的档案描述,可以适应不同规模、不同类型及不同来源的档案;它允许对每个实体或关系进行多个属性值或属性集合的描述,并且可以根据不同的目标或目标群体选择不同的描述级别或视角;因此RiC-CM可以全面地反映红色档案所涉及的人物、事件和历史背景,以及它们之间的互动和影响,并且可以适应不同用户对红色档案信息内容、结构等各个维度的个性化表达。

  基于RiC-CM的红色档案情境元数据模型构建

  将RiC-CM应用于红色档案描述的尝试,探索了RiC-CM在中国特色档案领域的适用性和优势,笔者构建红色档案元数据模型是在此模型基础上进行取舍,保留必要实体及属性、关系,加入个性化需求,构建适合现有技术基础及符合资源特征的元数据模型,为红色档案描述提供了一个规范化和标准化的参考。

  1.确定红色档案元数据实体

  笔者从档案的法律关系及文件的生命周期两个方面分析红色档案的内涵,进而确定其情境元数据实体。

  《中华人民共和国档案法》中规定了档案的主体是指享有权利和承担义务的人或组织,客体是指主体的权利和义务所指向的对象,包括档案以及有关档案收集、整理、保护、利用及档案行政管理等行为。档案的生命周期以“DCC数字对象生命周期模型”(Digital Curation Lifecycle Model)为参考,基本上包含创建、鉴定、接收档案、长期保存、利用、加工转换等环节,各个流程需要根据相关标准规范纳入档案管理范围。

  因此,笔者将红色档案情境元数据模型中的实体划分为6类,即“档案资源对象、行为主体、事件、实例、时间、地域”,如图2所示。“档案资源对象”,可以是物品、出版物、文件、书信、录音录像资料等,对其描述除了包含传统档案特征的描述外,还应包含其文化特征,即档案中记载的历史文化信息及与历史事件相关的人、事、物等。“行为主体”是在世界中行动或执行活动的人或团体。“事件”是在时间和空间中发生的事情,笔者将事件类划分为3个子类,包含自然事件、历史事件、活动,活动指与档案收管存用相关的人类活动。“实例”是参与者以任何持久的、可恢复的形式在载体上记录档案。所有事物都存在于时间之中并存在于一定界限之内,因此,时间、地域对理解档案的来源及情境信息是至关重要的。

2.jpg图2   红色档案元数据实体层级图

  2.元数据实体属性

  属性是实体的特征,通过属性对实体显著特征的描述,进而让使用者和计算机认识实体。每个实体的属性不同,有共性的内容,如属性名称、注释、标识符等,更重要的是每个实体的各自不同的属性,如描述“组织”的“家庭类型”“法人团体类型”,描述“事件”的“历史”“活动类型”等。创建属性的时候可以使用现有的共享词汇,每个上级实体的属性与每个子实体共享。

  红色档案实体属性是描述红色档案的关键元素,通过前面的分析,结合RiC-CM、《档案著录规则》、《博物馆藏品信息指标体系规范》等成熟的国内外元数据参考模型及词汇表,选择提炼适用于描述红色档案的情境实体及属性元素,如表1所示。

表1   元数据实体属性及与RiC-CM的映射表

1.jpg  注:历史人物(博物A0540)、文物藏品级别(博物B0401)复用博物馆藏品信息指标体系规范中的属性元素。历史人物属性包括:姓名、民族、性别、籍贯、国别、生卒年月、主要经历、事迹、代表作品等。文物藏品级别是根据文物藏品的历史价值、艺术价值、科学价值确定的级别,参见《中华人民共和国文物保护法实施条例》和《文物藏品定级标准》。

  (1)档案资源对象属性

  档案资源对象属性包含档案特征、物理特征、文化特征3个方面,通过分析归纳并整合复用现有标准体系中的元数据元素,具体将红色档案资源对象元数据属性归纳为档案属性、物理属性、文化特征、语言、访问及使用条件。档案属性即描述红色档案作为档案所具备的基本属性,包含档号、分类号、保管期限等;物理特性即档案实体本身的物理特征描述,如材料、尺寸等;文化特征即红色档案作为特殊的档案类型所反映的历史文化内涵,包含历史背景说明、相关人物传略等。

  (2)行为主体属性

  红色档案行为主体包含红色资源全生命周期中参与的人和机构团体。其属性包含对人、组织、职位、机制的描述元素。

  (3)事件实体属性

  RiC-CM中定义的事件可以是自然的,也可以是人为的,还可以是对自然事件的人类反映,可以发生在特定的时刻,也可能发生在一段较长的时间内,一个事件由时间、空间的界限组成。

  本文构建模型中的“事件类”将复用RiC-CM中的RiC-E4事件类实体属性,在此基础上增添符合红色档案描述的属性元素。

  (4)实例实体属性

  “实例”是档案的其他表现形式,通常是数字化记录等,作为穿越时间和空间的信息交流手段,可以呈现档案在生命周期不同阶段的表现形态。本文构建的模型中实例实体复用RiC-CM中E06实体属性。

  (5)时间实体属性

  时间定位对于理解事物的情境信息至关重要,在RiC-CM中,日期的子实体包括单个日期、日期范围或日期集,数字标准日期通常基于ISO8601或扩展日期格式EDTF来确定。

  (6)地域实体属性

  “地域”指有界限的、命名的地理区域或地区。参考《博物馆藏品信息指标体系规范》,模型中的地域实体描述包括中国行政区划、中国古代国家与地方政权、中国革命根据地、世界各国和地区。

  3.确定红色档案元数据实体关系

  RiC-CM侧重于从档案的角度记录对世界有影响的联系,通过这种方式在实体之间建立联系,将有可能推断出关于记录情境的更复杂的信息。

  RiC-CM中涵盖了13类79个关系,包括整体与部分关系、序列关系、主题关系、记录资源与记录资源关系、记录资源与实例化关系、来源关系、实例化与实例化关系、管理关系、代理与代理关系、事件关系、规则关系、日期关系、空间关系,其关系的说明包括标识符、名称、使用范围、定义、范围注释、例子、顶层关系、下层关系等,以“相关联关系”为例,下层关系包括14个关系型,如表2所示。

表2   RiC-CM相关联关系类型表

1.jpg  关系的作用是描述实体之间的联系,为描述档案提供一个基础,并可能在这个基础之上建立更具体的词汇表来满足具体实现的需要。笔者复用RiC-CM的一部分关系来表述红色档案元数据模型实体之间的部分关联关系,包括核心实体之间的关系、核心实体的子实体或具体文件资源之间的关系,如图3所示。

1.jpg图3   红色档案情境元数据模型

  此模型基本涵盖描述红色档案情境信息的主要元素,完成了情境元数据实体提取并构建了相对稳定的关联关系,可以满足面向语义的档案描述与著录,进而增强检索功能。模型基于国际通用的RiC-CM构建,因此具有可扩展性,兼顾特殊性与通用性,并支持互操作。

  结语

  红色档案是具有中国特色的重要历史资料,本文的元数据模型研究是在国际标准的基础上寻求适合我国档案管理及红色档案特征描述的探索,是对档案描述的个性化研究,期待可以更好地展现红色档案复杂多样的情境信息和关联关系。

  本文的不足:由于RiC-CM还处于发展阶段,其自身也在不断完善,还需要各个国家机构在使用过程中进行充分的测试、验证以及评估,因此本模型中的元素及属性关系也需要在使用过程中根据各个机构的管理模式及资源特点进行匹配并不断填充、修改、完善。此外,可以用本体技术实现红色档案的语义化描述、从而提高可操作性、可查询行、可推理性。

  针对这些问题,笔者在未来的研究中将进一步融合本体技术和知识组织技术,期待能为红色档案资源的知识组织、长期保存、展示、传播提供思路和解决路径,促进红色档案价值的发挥及爱国主义教育功能的实现。

  参考文献:

  [1]姜惠丹.2011—2021年中国红色档案研究综述[J].档案天地,2022(2).

  [2]Jeffrey Pomerantz.元数据[M].中信出版社,2017.

  [3]Anind K.Dey,Gregory D.Abowd.Towards a Better Understanding of Context and Context-Awareness[EB/OL].https://www.cc.gatech.edu/fce/contexttoolkit/chiws/Dey.pdf.

  [4]Records in Contexts-Conceptual Model,Consultation Draft v0.2,July 2021[EB/OL].https://www.ica.org/en/egad-ric-conceptual-model.

  [5]龙家庆,王兴广.国际档案著录系列标准《背景中的文件(档案)》解析及启示[J].中国档案,2022(3).

  作者单位:北京交通大学档案馆

  责任编辑:周拯民