基于事理图谱的红色档案数据可视化研究

发布时间:2024-08-28 19:36:39被阅览数:56 次信息来源:《山西档案》

  文/孟亭含

  摘    要:红色档案资源蕴含着中国共产党领导革命斗争的光辉历程和宝贵经验,在革命传统教育和爱国主义教育中具有独特价值。然而,当前红色档案资源组织方式相对简单,对革命历史事件脉络挖掘不足,可视化程度有待加强。引入事理图谱理论方法,构建红色档案资源可视化表现框架,对于创新红色档案知识组织、助力革命精神传承具有重要意义。在梳理事理图谱、档案可视化相关理论的基础上,从总体架构、图谱构建、脉络呈现、要素展示等方面,设计了事理驱动的红色档案资源可视化总体框架,为构建开放共享的红色档案知识服务生态、传承红色基因、赓续红色血脉提供坚实支撑。

  关键词:红色档案;事理图谱;可视化;知识图谱;档案资源组织

  红色档案,是指中国共产党领导人民进行革命斗争过程中形成的,具有重要保存价值的各类文献资料。红色档案真实地记录了党领导革命的光辉历程,承载着宝贵的历史记忆,蕴含着丰富的文化价值。新时代背景下,党和国家高度重视红色档案资源的开发利用。习近平总书记明确提出,要“用心用情用力保护好、管理好、运用好红色资源”,广泛开展红色档案的整理和研究,推动馆藏红色档案资源的数字化。2021年,中共中央办公厅、国务院办公厅印发的《“十四五”全国档案事业发展规划》再次强调,“要深入挖掘红色档案资源,传承红色基因,充分发挥档案在理想信念教育中的重要作用。”相关国家政策的提出表明,充分发掘红色档案的历史价值和时代意义是新时代档案工作的重要任务。随着数字技术的发展,可视化日益成为档案资源开发利用的重要手段。通过先进的可视化技术能够将档案中直观化呈现蕴含的信息与知识,增强档案内容的表现力,提升档案信息的传播效果,扩大档案的认知和影响力[1]。那么,如何以事理逻辑为基础对红色档案进行高效的知识组织和可视化呈现,是顺应智能时代档案事业发展需求,也是发挥红色档案独特价值的关键命题。事理图谱作为知识图谱的升级范式,为动态、深层次地理解和把握红色档案资源提供了新思路[2]。运用事理图谱等智能技术赋能档案资源建设,通过可视化方式提升档案的展示利用水平,必将极大地拓展红色档案服务的广度和深度,彰显红色档案在数字时代的独特价值。

  1  事理图谱与红色档案资源可视化

  1.1 事理图谱概念界定

  事理图谱(Event  Evolution  Graph)自2017年首次正式提出以来,正逐渐得到学术界和业界的广泛关注,并在各领域取得应用成果。事理图谱是一种面向事件演化的新型知识库,以“事件”为研究对象,图谱中的每个节点表示事件或泛化后的事理,边表示事件间的顺承、因果等逻辑关系。事理图谱不同于传统知识图谱,传统知识图谱以实体为核心对象,侧重对现实世界中客观事物的静态描述,聚焦于实体间的静态语义关联,难以刻画事物的动态演变,而事理图谱关注事件间的动态演化逻辑,旨在刻画客观世界中事件的发展规律与趋势。综合已有研究,事理图谱通常有三个显著特点:以事件为核心对象,通过抽象、泛化获得高层次的事件表示;重点关注事件间的顺承、因果两类关系,着眼于事件的时序演进与逻辑因果;事理关系带有不确定性,用概率刻画事件间的状态转移规律[3]。

  1.2 事理图谱的关键技术

  构建高质量的事理图谱离不开一系列关键技术的支撑,主要包括事件抽取、事件关系抽取、事件同指消解、事件泛化等核心技术。

  事件抽取。事件抽取旨在从非结构化文本中自动识别并提取事件及其关键要素,是事理图谱构建的基础。目前,主流的事件抽取方法可分为基于模板匹配、机器学习和深度学习三大分支。

  事件关系抽取。事件关系抽取致力于自动发现红色档案资源中存在事件之间的顺承、因果等逻辑关系。近年来,研究者尝试采用注意力机制、图神经网络等深度学习技术,在隐式事件关系抽取上取得了突破性进展。

  事件同指消解。由于同一事件可能存在多种表述方式,事件同指消解对于规范事理图谱中的事件表示至关重要。目前主要采用基于规则、无监督聚类以及有监督机器学习等方法实现。

  事件泛化。为提升事理图谱的适用性和可解释性,需对低层次具体事件进行抽象泛化,揭示事理规律。事件泛化有助于降低图谱规模,凸显事件间普适的逻辑关联。

  1.3 事理图谱对红色档案资源可视化的优势分析

  传统的档案组织方式多以实体要素为主线,以目录、索引等形式呈现档案内容,对革命事件的关联分析相对薄弱。当前,针对红色档案资源可视化的相关研究存在一些亟待解决的问题,如红色档案的开发利用多停留在单一事件展示层面,革命历史的发展脉络展现不足;红色档案可视化缺乏有机串联,难以形成沉浸式、全景式的整体认知。引入事理图谱理论方法,针对红色档案资源中事件间的顺承、因果逻辑,通过构建事件节点与事理关系,可将分散的革命事件关联重组为有机整体,形成革命知识的网状表征。在此基础上进一步开展可视化设计,将由复杂的因果递进关系构成的革命事件置于事理发展图景中,全面、立体地再现革命历史的来龙去脉,揭示历史发展的内在规律,为还原革命历程、研判革命趋势提供知识化支持。运用事件图谱中的事件抽取技术能够自动提取档案中的革命事件要素,进而构建事件知识库,再结合知识推理、智能知识问答等技术,可形成革命知识的纵深表达,从而衍生出革命史地图、革命事件问答等应用场景,为用户提供个性化、精准化的档案知识服务。

  2  基于事理图谱的红色档案资源可视化框架设计

  红色档案资源承载了中国共产党领导人民进行革命斗争的珍贵历史记忆,对于传承红色基因、坚定理想信念具有不可替代的作用。然而,当前红色档案资源的知识呈现途径较为单一,缺乏将革命历史事件脉络梳理清晰的动力。因此,本研究拟从总体架构、图谱构建、脉络呈现和要素展示四个核心模块,对基于事理图谱的红色档案资源可视化框架进行系统设计。

  2.1 红色档案资源可视化的总体架构

  基于事理图谱的红色档案资源可视化呈现旨在将分散的革命历史档案资料通过事件抽取、关系挖掘、图谱构建等系列信息处理环节,形成连贯的革命事件图景,为还原革命真相、感悟革命精神提供沉浸式、全景式的认知体验。因此,本研究提出了红色档案资源可视化的总体架构,由数据层、图谱层、可视层、应用层等部分组成。

  数据层主要面向红色档案文本、图像、视频、实物等海量多源异构资源,通过一系列的数智化采集、语义标注、质量评估、整合集成等预处理,形成结构化的元数据;图谱层以数据层为基础,通过一系列事理图谱构建技术,抽取档案中蕴含的革命事件、人物、地点及其关联关系,进而构建革命事件图谱知识库;可视层则在数据与知识库的基础上,以革命事件为核心对象,以革命事理逻辑为主线索,设计并实现革命历程时空脉络、事件要素多维度呈现等可视化场景;应用层融合图谱推理、知识问答等智能技术,开发革命事件检索、革命史地图、智能问答等应用服务,最终形成较为完整的、事理驱动的红色档案资源可视化利用体系。

  2.2 基于多元场景的红色档案事理图谱构建流程

  红色档案事理图谱是由革命事件节点及其时间顺序、因果关系等构成的语义网络。红色事理图谱构建的核心在于相关人物革命事件及事件间关系的自动化识别与抽取。结合先前研究,红色档案事理图谱构建主要包括革命历史事件抽取、事件间因果和时序关系抽取,以及事件泛化形成高层次事理逻辑等关键环节。

  展开来讲,革命历史事件的抽取要综合考虑红色档案资源的特点,参考已有红色革命事件的本体与规范,全面定义革命事件的类型体系、论元结构及触发词词表等,构建革命事件抽取规则库。在此基础上,首先通过人工标注部分红色档案高质量训练语料,融合条件随机场、长短期记忆神经网络等机器学习模型,实现革命事件论元的自动化识别和分类,形成标准化的革命事件知识库。其次,革命事件间因果关系、时序关系的抽取可通过运用基于连接词的模板匹配和基于马尔可夫逻辑网络的统计关系等方法,识别红色档案语料中显式和隐式的事件因果、时序关系,进而对初步抽取的事件关系进行置信度计算和数据清洗,形成高质量的事件关系集合。最后,根据事件泛化形成高层次的事理逻辑。由于革命斗争时间中存在复杂规律,需进一步对底层具体事件进行抽象与泛化。通过采用聚类算法、本体推理等技术,挖掘时间、地点、人物等维度的事件共性特征,迭代构建事件类的层次化谱系,运用表征学习等技术,从海量革命事件实例中归纳总结高层次的事理逻辑,形成稳定的、普适的革命事件图谱。事件泛化有助于降低事理图谱复杂度,提升革命事件的可解释性与认知效率。

  2.3 以事理逻辑为线索的革命事件脉络可视化设计

  传统革命历史叙事多采用线性、离散的可视化呈现方式,对革命事件间的逻辑关联刻画不足。而基于事理图谱呈现的革命事件脉络,能够清晰地凸显革命斗争在时间和空间上演进的轨迹与趋势。因此,充分利用事理图谱的关联分析与推理能力,以事理逻辑为线索,多视角、多维度地展现革命事件的历史脉络。具体从时间、空间、逻辑等维度进行可视化设计。首先,在时间维度上通过时间轴的形式刻画革命事件在不同历史时期的分布与演化,同时为用户提供多粒度的时间筛选与聚焦功能,方便用户快速定位特定时间段的革命事件。其次,在空间维度上,利用数字地图标注革命事件的地理坐标信息,直观呈现革命斗争在不同区域的分布与迁移轨迹。最后,在逻辑维度上,以革命事件为节点,以因果和时序关系为边构建革命事件网络,揭示革命斗争深层次的发展逻辑。通过融合三个维度建立包含时间、空间、逻辑的革命事件立体化呈现模型,形成沉浸式、寓教于乐的革命事件脉络体验场景。

  2.4 红色档案事件要素多维度可视化设计

  红色档案事件要素是指组成或影响革命事件的关键信息结构,如时间、地点、人物、组织、职务等类型。通过运用基于事理图谱框架理念,利用事件抽取、关系抽取、命名实体识别等自然语言处理技术,精准识别和关联革命事件的核心语义要素,进而多视图、多层次呈现事件要素。因此,红色档案事件要素多维度可视化设计以微观解构、中观比较、宏观概览等方式,有助于从不同粒度、不同侧面透视革命历史的奥秘。

  在微观层面上,以革命事件为核心节点,以时间、地点、人物、组织等语义实体为卫星节点,透视事件内部要素的关联,自动提取和感知事件的关键特征,为精准解构革命事件提供支撑。在中观层面,基于革命事件的时间、地点、人物等维度,通过多角度刻画不同时空背景、不同人物视角下革命事件的共性与个性特征,以小见大,感悟革命斗争的丰富内涵。在宏观层面,运用统计分析、知识发现等方法,判别革命事件要素的总体分布规律,形成革命斗争全局的概览式认知。同时,以关键词标签云、路径图谱等形式直观呈现高频事件要素间的关联,发掘革命历史研究的新视角、新思路[4]。

  3  结语

  红色档案蕴藏的革命历史和宝贵经验,是开展革命传统教育和爱国主义教育的丰富资源。针对当前红色档案资源开发利用中存在的知识组织粒度不够精细、事件脉络呈现不够生动立体等问题,本文提出了融合事理图谱理论方法的红色档案可视化框架,基于事理图谱构建革命历史知识库,形成脉络清晰、逻辑严密的革命事件图景,并采用情境化、沉浸式的可视化手段生动呈现出来,充分释放红色档案的思想教育内涵,增强红色文化的吸引力和感染力。

  参考文献

  [1]陈艳红,陈晶晶.数字人文视域下档案馆红色档案资源开发的时代价值与路径选择[J].档案学研究,2022(3):68-75.

  [2]孙大东,张怡涵.基于事理图谱的红色档案资源开发利用研究[J].档案学研究,2023(5):73-80.

  [3]魏建香,梁帅,朱云霞,等.事理图谱研究进展[J].情报资料工作,2023(6):35-43.

  [4]张蕾,刘旭光.新媒体环境下红色档案资源的开发利用研究:以沂蒙红色档案为例[J].山西档案,2021(5):118-127.

  【基金项目】2021年度河南省高等教育教学改革研究与实践项目“高等职业学校学院-书院双载体育人模式探索与实践”(项目编号:2021SJGLX651);河南省教育科学规划一般课题“智媒时代传媒人才培养模式的‘数智化’转型研究”(课题编号:2022YB0646)。

  【作者简介】孟亭含(1982—),女,汉族,河南开封人,开封文化艺术职业学院副教授,硕士,研究方向:高职教育。