基于RiC的法国PIAAF项目对我国档案描述工作的启示

发布时间:2024-09-05 20:20:45被阅览数:81 次信息来源:《山西档案》

  作   者:张衍 陈漫

  摘   要:国际档案理事会(ICA)于2023年12月发布的最新档案描述标准《背景中的文件》(Records  in  Contexts,  RiC)将语义网技术、关联数据技术引入档案描述,以期实现档案工作转型升级。法国档案保管机构数据互操作试点(Pilote d’interopérabilité pour les Autorités Archivistiques Françaises, PIAAF)项目作为RiC标准本体技术的首次应用,为其概念证明作出了突出贡献,创新性、突破性强。通过分析PIAAF项目及其所依据的RiC描述标准,解读标准的进步性,审视项目实施进程中遇到的挑战及应对策略,从而针对性地从更新现有描述标准、建立领域本体、推动文化遗产机构元数据互操作、革新档案描述呈现方式等方面为我国档案描述工作提供有益建议。

  关键词:档案描述;PIAAF项目;RiC;档案著录规则

  档案描述是通过捕获、整理、分析、组织档案中的信息,准确创建档案描述单元的有机过程,最终完成档案本身的识别,解释档案的形成背景和信息来源系统[1];它是知识组织的核心活动[2],其实质是一种智能化控制[3]。为进一步统一和规范档案描述,ICA于1994年发布了《国际标准——档案描述规则(通则)》[ISAD(G)],并在之后的14年间陆续出台了《国际标准——机构、团体、家族描述规则》[ISAAR(CPF)]、《国际标准——职能描述规则》(ISDF)、《国际标准——档案保管机构描述规则》(ISDIAH)。这四份标准共同构成了目前国际档案学界通行的档案描述标准体系。我国档案领域通常将“archival description”译为“档案著录”,强调通过选择著录项目,提取其中最具档案价值和检索意义的特征,形成条目式记录,以实现智能控制。但在当前档案工作数据化转型的背景下,“archival description”工作更加注重档案的背景活动和档案之间的内在联系,着眼于建立语义网络、形成数据关联,其内涵已超出了传统“档案著录”的范畴。因此,本文提出将“archival description”译为“档案描述”,将其视为“档案著录”的下一个阶段,以更好适应当前信息技术的崭新发展局面和知识服务的现实需求。

  随着社会的发展,传统国际档案描述标准体系已无法适应愈加复杂的档案内容和类型。为进一步提升国际档案描述标准体系的能力和适用性,ICA成立档案描述专家组(Expert Group on Archival Description,EGAD),在协调、融合原档案描述标准体系的基础上,于2016年出台了RiC 0.1版,将语义网技术、关联数据技术、本体技术融入档案描述[4]。2017年,RiC本体(Records  in  Contexts-Ontology,RiC-O)测试版发布,法国国家档案馆立即将其应用于PIAAF项目。它以RiC-O为参考本体,旨在实现相关机构之间的元数据互操作。作为RiC-O在全球的首次应用,该项目为其概念证明作出了突出贡献,并对研究RiC-O在档案描述领域的作用提供了极大的参考价值。2023年12月,RiC前三部分1.0版本正式公布,这标志着RiC拥有了第一个稳定且完整的版本,是该标准发展的重要里程碑。在此背景下,本文试图对PIAAF项目及该项目所依据的RiC描述标准进行介绍,分析标准的进步性,审视项目实施过程中所遇到的挑战及应对策略,为我国的档案描述工作提供参考。

  1  法国 PIAAF 项目概况

  PIAAF项目是由法国国家档案馆(ANF)、法国国家图书馆(BnF)以及法国档案部际管理处(SIAF)领导的,Logilab公司负责程序设计的档案元数据语义化、可视化实验项目。

  ANF、BnF、SIAF都是国家行政管理、文化遗产、科学生态系统的重要组成部分,保存有大量元数据,但这些元数据均未实现语义化,且生态系统内信息封闭,信息交换程度低。上述原因使得元数据无法实现互联互通,形成关系网络,难以为用户提供高质量的信息服务。因此,为实现信息共建和互操作,并让元数据网络最大限度地发挥功效,PIAAF项目应运而生。它是法国文化遗产机构为实现信息共享与语义互操作的一次全新尝试。该项目以RiC-O为基础进行设计和软件开发,旨在验证目前各机构保存的XML/EAD格式和XML/EEA-CPF格式的档案元数据集能否成功转换为符合RiC-O标准的RDF数据集,并将来自多个机构的RDF数据集进行连接,最终在不牺牲信息粒度和可读性的情况下,生成可视化、动态的搜索页面[5],为用户提供更加直观、便捷的元数据检索体验。

  2  法国 PIAAF 项目的实施基础:RiC 标准体系及其进步性

  2.1 RiC 标准体系概述

  PIAAF所依赖的核心技术RiC-O是ICA最新发布的RiC描述标准体系中的关键组成部分。RiC标准体系是ICA为适应知识社会和智能化时代的飞速发展而制定的档案描述标准,共包括四个部分:《背景中的文件——档案描述介绍》(Records  in  Contexts-Foundations of Archival Description,RiC-FAD),《背景中的文件——概念模型》(Records  in  Contexts-Conceptual Model,RiC-CM),《背景中的文件——本体》(Records  in  Contexts-Ontology,RiC-O),以及仍在筹备阶段的《背景中的文件——应用指南》(Records  in  Contexts-Application Guidelines,RiC-AG)。目前,RiC-FAD、RiC-CM和RiC-O均已经正式发布1.0版本,标志着档案描述工作进入更加标准化、系统化的新时代。

  2.2 RiC 标准体系的进步性

  RiC描述标准对ISAD(G)、ISAAR(CPF)、ISDF和ISDIAH进行了整合和协调,在继承其优势的同时,引入图技术、语义网等相关技术,从多角度实现了对ISAD(G)等标准的超越。

  2.2.1 从多级描述到多维描述

  ISAD(G)等标准采用独立、内向型的分层描述方法,形成一种严谨的多级描述结构,以线性方式展现档案的内容和结构特征。然而,随着人类活动的日益丰富,档案的形成背景更加复杂,传统的线性描述方式显得捉襟见肘。为应对这一挑战,RiC标准引入了资源描述框架(RDF),以图形网络方式重新定义档案描述方式。它不仅保留了ISAD(G)层级结构的优势,还进一步扩展了描述复杂来源档案的能力[4]。

  研究人员在PIAAF项目中选用了多个XML格式的数据源。这种格式可通过树状图或层级结构表示档案描述元数据,但现实世界的复杂性和档案来源的多样性要求其描述方式朝着更为灵活和网络化的方向发展。RDF以其三元组模型结构满足了这一需求。它允许计算机更深入地理解数据的语义,为语义推理提供可能,从而实现更精准的资源发现[6]。借助RiC标准,PIAAF项目成功将XML格式的数据转化为RDF的网状结构。同时,档案中的各个知识单元被识别为实体或属性,不同全宗乃至于不同机构的数据通过共有实体实现链接,实体与属性、实体与实体之间通过关系紧密相连,打破了原有层级限制,实现了多维度链接和交互。

  以PIAAF项目中的法国历史学家和政治家Jean-NoëlJeanneney为例,若根据ISAD(G),其描述结果将以线性表格方式呈现,在RiC-O中则以图形网络的形式存储,他被定义为类别中的Person类。法国国家图书馆和国家档案馆均保存有他的相关资料;他编纂的《乔治·克莱蒙梭来信,1858—1929》一书被法国国家图书馆所收藏,法国国家档案馆则留有乔治·克莱蒙梭(GeorGes Clémenceau)的档案[7]。两个机构通过Jean-NoëlJeanneney以及GeorGes Clémenceau实体实现机构间元数据的关联,扩展了档案背景。

  2.2.2 采用语义网技术和开放数据技术实现信息组织和共享

  近年来,随着语义网技术在档案界的盛行,该技术在档案描述中的应用潜力逐渐被广大学者所认识。语义网技术的实现主要基于可扩展标记语言、资源描述框架和本体三大核心技术[8]。虽然多个项目已经为档案描述工作构建了特定本体,但是满足档案界特定需求的通用领域本体仍然缺失。

  为了填补领域本体的空白,EGAD在最新的国际档案描述标准RiC中进行了实践。在引入RDF的同时,为进一步提升现有概念模型(RiC-CM)的可操作性,EGAD将其转化为计算机可读取和处理的形式,即实现概念模型的本体化(RiC-O)[9]。这一本体为PIAAF项目提供了描述档案资源的通用词汇表和正式规则。通过RiC-O,PIAAF能够创建RDF数据集(或从现有档案元数据生成RDF数据集),允许通过本体逻辑进行推理,并使用SPARQL(SPARQL  Protocol  and  RDF  Query  Language)进行查询。这种查询方式是一种与以往不同的全新方式,用户可根据自己的实际需要提出问题,诸如“1800至1970年的责任者有哪些”“文件和文件集的在线数字副本有哪些”等。此外,使用RiC-O的数据库还可从RDF数据集中推断出新信息,并将其链接到机构外的其他资源,提升查询和推理的灵活性[10]。

  3  法国 PIAAF 项目的实施挑战及应对策略

  PIAAF项目作为RiC-O的重要试点项目,经历了数据源的整理、XML向RDF数据集的转换以及可视化呈现三个关键阶段,其实施过程中的经验教训对我国档案界了解和掌握RiC标准的实际应用具有重要意义,可为我国档案描述工作的转型升级提供宝贵经验。

  3.1 法国 PIAAF 项目实施中遇到的挑战

  3.1.1 数据准备:数据源的多样性和复杂性

  项目所涉及的数据涵盖了来自ANF、BnF和SIAF的276条XML/EAC-CPF规范记录和38条XML/EAD检索工具,内容主要聚焦于历史遗迹的记录、民用建筑的管理,以及公共阅读和公共图书馆服务等方面。由于各机构在数据处理过程中采用了不同的方法和工具系统,如国家档案馆的档案信息系统(SIA)、法国部际档案管理处的ICA-AtoM系统,以及法国国家图书馆的XML编辑器[11],这使得数据源十分复杂。因此,对于项目团队来说,如何高效整理、协调和统一这些复杂的数据源,以确保数据的一致性和可用性,成为迫切需要解决的重要问题。

  3.1.2 数据转换:缺少适用的领域本体

  在PIAAF项目的实施过程中,数据转换是最为关键的环节。此环节的核心工作是将XML格式的数据集转换成符合特定要求的RDF数据集。在这一过程中,一个合适的本体至关重要。本体为数据转换提供了清晰的分类和定义,确保数据元素能够被精确映射和关联。这不仅增强了数据的可解释性和可操作性,还通过标准化词汇表和规则使得转换过程更透明可控。开发人员和用户能更清晰地理解数据元素和数据间的关系,从而高效地处理和分析数据。

  然而,在项目初期,档案界尚未有一个完全符合PIAAF需求的领域本体。过去,档案本体大多是针对特定项目而构建的,其词汇表的覆盖范围相当有限,例如,罗马教皇格里高利大学(APUG)为描述其馆藏档案而开发的特定本体[12]。图书馆和博物馆领域的FRBRoo本体与CIDOC-CRM本体虽然应用广泛且表现出色,但是难以满足档案描述的独特性。档案描述的一个显著特点是其层级结构。因此,寻找或构建一个契合PIAAF项目需求的领域本体成为项目初期面临的最大挑战。

  3.1.3 数据呈现:复杂的内部关系与直观可视化的冲突

  XML格式向RDF格式的转换能够提升数据的计算机可读性。然而,对于人类用户来说,其难以直接理解RDF数据复杂的内部关系。因此,该项目必须在保持数据细节完整的同时,将错综复杂的内部关系以直观的形式展现给用户。这就亟需设计一个动态的符合人体工程学的图形界面。

  尽管已有多项实践对数据可视化的可能性进行了探索,但将图形与时间维度相结合,特别是展示多种类型对象和大量关系的案例仍然较少。PIAAF项目不仅需要以图形化的方式呈现各种对象和关系,还需要确保用户能够从多个起点或视角浏览这些图表或图形,同时保持信息的全面性和图形的可读性。鉴于这一特殊需求,PIAAF项目无法简单依赖现有的数据库或软件工具来实现其可视化目标。

  3.2 法国 PIAAF 项目采取的应对策略

  3.2.1 定义通用描述规则以整合多元数据

  各机构在保留各自的数据处理方法和工具系统的同时,就某些方面达成了共识,形成了一套共同规则,如实体名称的规范表示、标识符、实体间的关系类型等[7]。首先,三个机构都以共同的标准对自身数据源中涉及的实体规范名称;其次,为这些实体分配标识符以实现唯一标识,作为后续互联的关键;再次,细化实体之间的关系,如使用isControlledBy、isDirectedBy/isDirectorOf、hasPart/isPartOf等,使实体间的关系得到更准确的表述,从简单的层级关系或关联关系进一步扩展为受控关系、指导关系、组成关系等,这些关系使挖掘各个实体之间深层次的语义关联成为可能,从而实现实体互联。此外,为保证各个实体的规范性,合作机构还利用Ginco构建了两个小型的RDF/SKOS叙词表以便索引[13]。三个机构数据库中共有的实体如“Person”或“CorporateBody”等成为关联重要的中央互联节点,使ANF、BnF、SIAF甚至是维基百科中的数据都能实现集成共享与利用。

  3.2.2 选择RiC-O作为参考本体助力数据转换

  2017年,RiC-O测试版正式发布。尽管RiC-O当时尚处于测试阶段,但其蕴含的潜力与价值已不容忽视,为项目提供了最重要的技术支持。RiC-O包括类(Classes)、数据属性(Datatype properties)、对象属性(Object properties)、注释属性(Annotation properties)、命名个体(Named individuals)五大类,其中类、数据属性、对象属性分别对应RDF中的资源、属性和属性值,为XML转换为RDF定义了通用词汇表和正式规则。同时为了提高成功率,该项目尽可能选用RiC-O中较为成熟的类,如团体(Corporate body)、个人(Person)、地点(Place)、事件(Event)等,并为之编写了一套XSLT2脚本[11],确保能从元数据中生成XML/RDF文件。随着各个子体转换工作的顺利完成,项目团队进一步对生成的RDF数据集进行精细的对齐和互联工作。这一举措成功关联了ANF、BnF、SIAF数据库中的共同实体或相关实体,实现了数据的共享与互操作。

  数据转换完成后,所得RDF资源数量显著增加。这表明通过RiC-O,数据中的隐藏语义得到挖掘,语义信息更加丰富。原始数据中除了部分关系和背景元素被发现和描述外,大量暗含在自由文本中的资源或在原有关系中以被指向对象而存在的资源也得以揭示,例如原数据集中只有14种机构类别,而在转换后的数据中,这一数字增加到了20种。

  3.2.3 运用可视化技术呈现多元关系

  为了更好地呈现RDF数据集,ANF将转换后的数据交付给Logilab公司,将元数据间的复杂关联以直观的图形方式呈现给用户。

  PIAAF重点打造了四大功能界面:文本检索、SPARQL查询、实体组及实体页面。其中,实体组和实体页面是可视化的核心部分,它以图形形式展现各实体及属性间的关系。在实体组页面中,用户可借助团体类别(CatéGories de collectivités)、法律地位(Statuts juridiques)、活动领域(Domaines d'activité)、职位(Postes)、团体(Collectivités)、个人(Personnes)、文件组(Groupes de documents)7个切入点定位所需信息。每个实体组页面上半部为可视化图表,下半部列出所有有关实体。值得一提的是,可视化图表左侧设有复选框,包括Graphes、Resources和Relations三大模块,分别用于展示数据来源、涉及的实体类型以及所有关系类型,借助复选框可控制右侧图形中的实体和关系组合,如图1所示。实体页面与实体组相似,上半部分同为可视化图形,下半部分提供该实体属性和关系的信息介绍。

1.jpg

图1 PIAAF项目的可视化呈现

  此外,PIAAF项目还致力于实现图与时间维度的结合,以展示特定组织在不同时间和层级背景下的演化过程。其中,水平方向代表时间维度,垂直方向则表示组织的层级和隶属关系。这种设计能够清晰地揭示相关机构及其内部各个部门之间的层级结构和归属关系,并捕捉这些关系随时间推移所产生的动态变化,帮助研究人员更好地理解其发展轨迹。

  4  法国 PIAAF 项目的实践启示

  4.1 面向档案数智治理,积极研制下一代档案描述标准

  数智时代的来临推动治理范式不断演化,档案治理对象也从“模拟态”的传统档案到“数字态”的数字档案,再到“数据态”的档案数据[14],治理对象的巨大变化促使数据治理概念崭露头角。

  描述标准是档案描述工作的核心,一个先进的描述标准能够更好地引领档案描述工作的发展方向。因此,为了更好地契合数智时代,首先要更新现有档案描述标准。目前,我国档案描述的最新通用标准是国家档案局发布的《档案著录规则》(DA/T  18—2022)(以下简称新版《规则》)。与旧版《档案著录规则》(DA/T  18—1999)相比,新版《规则》增加了多级著录的思想,扩展了适用范围,囊括模拟态档案和数字态档案,但在处理当前盛行的数据态档案信息方面仍显不足。数据态档案信息对应的知识和内容空间强调以更为抽象的面向语义和关联的规范作为基础,甚至要求描述规范具备一定的语义搜索、逻辑判断与推理能力[15]。数据态档案的描述规则需从语义层面出发进行重构,对档案进行全面、准确的描述与关联,强调知识组织与知识管理[16]。

  PIAAF项目的成功实践离不开RiC描述标准体系的指导。它以RiC为基础,利用RiC-O实现基于语义的检索,深入挖掘数据之间的关系,实现机构间的数据共享。此外,本体本身就具有推理能力,可以在此基础上实现智能推理[17],以满足数据态下档案描述的需要。

  RiC标准体系作为ICA发布的最新国际档案描述标准,具有在全球范围内推行的潜力,因此我国档案界应充分重视并应用相关内容,结合我国档案描述工作具体实践,修正新版《规则》,制定适合自身需求和发展的最新标准,确保其与国际标准接轨,为日后参与国际数据共享工作奠定基础。同时,积极参加EGAD工作组,加入国际档案描述标准的研发与探讨,提升我国在国际档案领域的话语权和影响力。

  4.2 建立档案领域本体,奠基知识组织与服务

  知识服务的基础是对文献中的知识进行组织和管理,而知识组织则强调揭示知识单元(包括显性知识因子和隐性知识因子)、挖掘知识关联,最为快捷地为用户提供有效的知识或信息[18]。我国档案描述的最小单元为文件级,但知识组织和服务需要更细粒度的描述,即对文件中具体的事件、人物、地点、机构进行描述,探寻深层关系,以实现隐性知识向显性知识的转换。由于知识单元的粒度远小于文件单元,因此我国现有档案描述成果尚无法支持知识组织与服务的需求。

  机器可读、机器可算、机器可理解、机器可推理及机器自学习是实现优良知识组织的五大关键任务[18]。RiC-O的功能与这些任务高度契合,展现出在知识组织领域的巨大潜力。具体而言,RiC-O采用的RDF编码格式得到了各类编程语言的支持,使档案文本可转变为机器可识别的各类数据。此外,RiC-CM中定义的19个实体、42个属性及86个关系为档案信息的深度解构提供了可能,可打破我国档案描述长期以文件为最小单元的困境,实现知识单元的细粒度化,满足机器可算需求。RiC-O还能将档案的元数据全面转化为RDF三元组形式,为其赋予机器可读的语义,结合利用语义网和关联数据等技术实现基于语义的精准推理。然而,尽管RiC-O在多个方面表现出色,但在实现机器自学习、推动知识自动增长方面仍存在一定不足,有待未来进一步完善。

  目前,RiC-O已成功应用于法国PIAAF项目、瑞士国家图书馆ARKEN项目等多个国际知名项目,其有效性得到了充分证明。面对当前知识组织与服务日益增长的需求,我国档案界应敏锐地抓住这一机遇,积极引进RiC-O这一相对成熟的领域本体,减少在本体探索过程中的弯路和歧路,高效推动档案描述工作的发展。同时,RiC-O的引入将极大提升档案信息的机器可读性、可算性、可理解性和可推理性,为知识组织与服务提供坚实的基础。另外,RiC-O具有极强的可扩展性,各机构可根据自身的需要添加新的子类或子属性自由补充本体。因此,档案机构或特定项目在其系统中理解、实施和维护RiC-O更加容易。

  4.3 打破文化遗产联通壁垒,推动元数据互操作

  档案馆、图书馆、博物馆资源整合的实质是不同类型机构间的元数据整合[19],但LAM对所藏物品本质的理解存在差异,因此采用的元数据标准各不相同。若试图以一种统一的元数据标准进行整合,不仅可能阻碍现有资源充分利用,还会耗费巨大的人力、物力和财力。在此情况下,RiC试图在各个领域所描述对象的概念重叠处进行识别,借此作为互联共享渠道[4],而非强求所有机构采用相同的元数据标准。

  EGAD制定RiC的重要目的之一便是实现图书馆、博物馆与档案馆之间的互联操作。图书馆和博物馆共同推出的FRBRoo本体,成功融合了国际图联的功能需求模型与博物馆本体CIDOC-CRM,旨在全面捕捉和精准表示书目信息的基本语义,进而促进书目和博物馆信息的集成、调解与交换[20]。尽管图书馆界和博物馆界十分欢迎档案界的加入,但一直缺乏一个全面且准确解决档案领域问题的概念模型。RiC则为LAM领域的合作搭建了桥梁。

  PIAAF项目的成功实施彰显了RiC在文化遗产领域互操作中的可行性。借助RiC-O,该项目顺利实现了ANF、BnF、SIAF等数据资源的共享。同时,作为ICA大力推行的最新档案描述标准,RiC在国际上也引起了广泛的讨论与研究,且在文化遗产领域的影响力不断扩大,例如,Lina  Bountouri等[21]研究者致力于实现RiC-CM到博物馆本体CIDOC-CRM的语义映射,以期进一步推动档案机构与博物馆间的信息互通;Daria Mikhaylova等[22]通过将RiC-O扩展至历史建筑档案领域,成功构建了ITDT本体,为相关领域的数据整合与利用提供了有力支持;此外,RiC-OConverter软件也在不断更新完善中,能够将XML/EAC-CPF和XML/EAD等数据格式转换为符合RiC-O规范的RDF数据集 [23],为文化遗产数据的标准化处理与共享提供了便捷工具。

  若成功引入RiC标准,我国档案界可吸收国际先进研究成果,大幅降低实施难度,提升我国档案工作的国际化水平,同时也可在ICA设立的Google群组中与EGAD的核心成员及全球的RiC使用者共同讨论实施中遇到的问题。此外,借助ICA的资源和平台,RiC-O有望成为档案领域本体的国际标杆,为我国日后在全球文化遗产领域的数据共享中占据有利地位,进一步推动文化资源的共享和利用,实现文化繁荣和发展。

  4.4 创新档案描述呈现方式,实现信息内容可视化

  目前,我国通行的档案描述规则主要参考了ISAD(G)标准,其线性多级描述结构使得描述工作的成果多以表格形式展现。虽然该规则能直观呈现单份文件或全宗的具体信息,但是在揭示文件或全宗之间的内在联系方面存在局限,用户无法从更宽广的视角把握档案材料的性质及相互关系。此外,更加复杂的档案来源进一步削弱了线性格式的表达能力。

  为改善当前的描述呈现方式,借助RiC描述标准并结合可视化技术是一个理想的选择。RiC描述标准具备挖掘和抽取档案信息资源中的语义特征、结构特征、关系特征、利用特征、标引特征的能力。通过RDF和本体实现的多维描述形式,不仅能展示复杂的背景信息,还能清晰地揭示不同描述单元之间的关系,进一步相互关联知识单元,为用户提供更为全面、深入的理解。可视化技术则能够将这种多维抽象结构及其内在联系以图形化的具体方式呈现在用户面前,它使信息转化为有意义和可理解的视觉表征,从而促进用户对信息的搜索和认知加工过程 [24]。

  我国档案机构在呈现描述成果时不妨借鉴PIAAF的可视化设计形式。项目所选择的7个切入点,视角多元,内容明确,便于定位和理解,可满足绝大多数用户检索的需求。此外,其页面提供的实体属性与关系的介绍是线性表格形式的变形。用户能够并行查看两种档案信息,既可从宏观视角观察某一实体与相关实体之间的关系及其在整体信息系统中的位置,又能了解某一具体实体或文件的详细信息,进一步提高档案资源的可理解性和可用性。

  5  结语

  PIAAF项目以RiC为依据,并作为RiC-O在全球的首次运用,呈现出极强的突破性和创新性,特别是在档案元数据语义化和可视化方面。它成功验证了现有元数据转化为符合RiC-O标准的RDF数据集,并实现多机构关联的可行性。尽管PIAAF作为试点项目,数据范围仅局限于历史遗迹、民用建筑的管理,以及公共阅读和公共图书馆等领域,但对我国的档案描述工作具有极强的借鉴意义。档案界需要高度重视PIAAF项目和RiC标准,在我国创设合适的应用环境,使其生根发芽,推动我国档案描述工作转型升级。

  参考文献

  [1]ROE K.Arranging & describing archives & manuscripts[M].Chicago:Society of American Archivists,2005:13-14.

  [2]SILVA  A,GUIMARÃES J,TOGNOLI N. Ethical values in archival arrangement and description:an  analysis  of  professional codes of ethics[J].Knowledge Organization,2015(42):346-352.

  [3]段荣婷,马寅源,李真.档案著录本体标准化构建研究[J].档案学研究,2018(2):63-71.

  [4]International Council on Archives. Records in contexts-conceptualmodel[EB/OL] .(2023-12-21)[2024-04-05].https://www.ica.org/resource/records-in-contexts-conceptual-model.

  [5]PIAFF.Démonstrateur[EB/OL].[2024-04-28].https://piaaf.demo.logilab.fr/.

  [6]段荣婷.网络环境下的档案规范记录系统研究[M].北京:科学技术文献出版社,2018:56.

  [7]ANGJELI A,CLAVAUD  F,ROUSSEL S.Représenter en RDF,interconnecter et visualiser en graphe des jeux de métadonnées archivistiques de provenances multiples:un projet de prototype[J].Gazette des archives,2017(1):157-171.

  [8]张娟,陈人语.语义网背景下基于单元信息的知识组织框架研究[J].国家图书馆学刊,2018(6):54-59.

  [9]段荣婷,马寅源,李真.国际文件/档案著录标准化前沿与趋势展望:基于国际最新著录标准ICA  RiC的研究[J].档案管理,2018(1):28-35.

  [10]International  Council  on  Archives.International  council  on  archives  records  in  contexts  ontology  (ICA  RiC-O) version1.0.1[EB/OL].[2024-05-28].https://www.ica.org/standards/RiC/RiC-O_1-0-1.html.

  [11]PIAAF.Réalisation[EB/OL].[2024-04-05].https://piaaf.demo.logilab.fr/editorial/contexte-technique.

  [12]LUZZI D. A prototype ontology schema:my experience at the historical archives of the pontifical gregorian university(APUG)-anaphore[EB/OL].(2014-03-27)[2024-05-27].https://www.anaphore.eu/an-prototype-ontology-schema-my-experience-at-the-historical-archives-of-the-pontifical-gregorian-university-apug/.

  [13]CLAVAUD  F.Semantizing  and  visualising  archival  metadata:the French PIAAF prototype and the following projects at the Archives nationales de France (ANF)[EB/OL].[2024-05-22].https://enc.hal.science/hal-03958855.

  [14]金波,杨鹏.“数智”赋能档案治理现代化:话语转向、范式变革与路径构筑[J].档案学研究,2022(2):4-11.

  [15]钱毅,马林青.基于三态视角的档案描述标准特征及演进脉络分析[J].档案学通讯,2021(5):40-48.

  [16]王志宇,赵淑梅,王晓宇.数据管理视角下我国档案著录规则重构探析[J].档案学研究,2023(3):50-55.

  [17]段荣婷,马寅源,李真.档案著录本体标准化构建研究[J].档案学研究,2018(2):63-71.

  [18]夏翠娟,张磊,贺晨芝.面向知识服务的图书馆数字人文项目建设:方法、流程与技术[J].图书馆论坛,2018(1):1-9.

  [19]贾君枝.LAM馆藏资源的元数据整合方法比较分析[J].档案学研究,2022(1):79-84.

  [20]International Council of Museums&International Committee for Documentation. Home|FRBRoo[EB/OL].[2024-04-10].https://www.cidoc-crm.org/frbroo/.

  [21]BOUNTOURI L,DAMIGOS M,DRAKIOU M, et al.The Semantic Mapping of RiC-CM to CIDOC-CRM[C]//GOJ  D  H,CHEN S J,TUAROB  S.Leveraging  generative  intelligence  in  digital  libraries:  towards  human-machine collaboration.Singapore:Springer Nature,2023:90-99.

  [22]MIKHAYLOVA  D,METILLI D.Extending RiC-O  to  model  historical  architectural  archives:the  ITDT  ontology[J].Journal on Computing and Cultural Heritage,2023(4):1-15.

  [23]CLAVAUD  F,FRANCART T,CHARBONNIER P.RiC-O  Converter:a software to convert EAC-CPF  and  EAD2002 XML files to RDF datasets conforming to records in contexts ontology[J].Journal on Computing and Cultural Heritage,2023(3):1-13.

  [24]张继东.数字图书馆信息可视化应用模型研究[J].情报理论与实践,2011(1):103-106,128.

  【作者简介】张衍(1988—),男,汉族,江苏淮安人,上海大学文化遗产与信息管理学院副教授,博士,研究方向:比较档案学、档案信息资源开发与知识服务;陈漫(1999—),女,汉族,福建宁德人,上海大学文化遗产与信息管理学院硕士在读,研究方向:档案学基础理论。