数字人文视域下馆藏清代土尔扈特档案文献可视化开发

发布时间:2024-09-10 19:09:17被阅览数:14 次信息来源:《山西档案》

  作   者:华林 张富秋 刘菊 宋晓婷

  摘   要:清乾隆年间,土尔扈特部回归祖国事件形成的档案文献是中华民族共同体演进发展的档案佐证。数字人文环境下,对其档案进行可视化开发,可深入挖掘档案文本中的民族交往交流交融价值,提升档案馆知识服务效能,满足多元利用需求。据此,在阐释土尔扈特档案文献内涵外延、资源特征及其可视化开发理论与价值的基础上,提出以项目实施为依托的“多元共建共享”土尔扈特档案文献可视化开发方案。从档案的数据化整合、语义化处理与可视化服务等流程建构可视化开发路径,对于发掘土尔扈特档案文献中蕴含的爱国主义精神、维护新疆民族地区稳定发展,铸牢中华民族共同体意识具有重要现实意义。

  关键词:土尔扈特档案文献;可视化开发;数字人文;知识组织;中华民族共同体

  2022年7月,习近平总书记考察新疆时指出:“要加强中华民族共同体历史、中华民族多元一体格局的研究,充分挖掘和有效运用新疆各民族交往的历史事实、考古实物、文化遗存,讲清楚新疆自古以来就是我国不可分割的一部分和多民族聚居地区。”[1]土尔扈特回归是清代北方民族交往交流交融的代表性重大历史事件,所形成的大量档案文献记载了其回归前同清政府之间的友好往来,回归过程中受到清政府重视保护,得到伊犁将军妥善接济安置,获封爵位、游牧地,以及回归后同新疆各民族交流交融的史实,反映了清政府对新疆进行有效管辖、统治者奉行开明民族政策以及维护国家统一和民族团结的历史情况,是研究清代边疆治理方略、民族政策与中华民族共同体演进发展的重要档案史料。

  从学术视角看,学界已对清代土尔扈特档案文献展开研究。在印章档案方面,阿迪力·阿布力孜等[2]通过对新疆维吾尔自治区博物馆馆藏七枚土尔扈特银印进行解读,阐释了银印对于见证土尔扈特回归祖国与中华民族凝聚力的历史证据价值。在文书档案方面,李刚[3]对土尔扈特专档开展专题研究,郭美兰[4]整理并考释了部分土尔扈特回归后赴藏熬茶满文档案。在碑刻档案方面,李刚[5]对《土尔扈特全部归顺记》满汉碑文、流传版本进行考释辨析,认为其可与档案记载实现文献互证。

  从档案文献整理工作看,早在1988年,中国第一历史档案馆(以下简称“一史馆”)与中国社会科学院民族研究所就共同整理出版了《满文土尔扈特档案译编》,该汇编的出版发行促进了土尔扈特东归史学的研究[6]。2013年,一史馆同新疆和布克赛尔蒙古自治县史志办合编的《清代东归和布克赛尔土尔扈特满文档案全译》出版,该译著与《满文土尔扈特档案译编》在内容上可相互补充[7]。2021年,在土尔扈特回归250周年之际,满文土尔扈特专档全文检索数据库建成并面向社会开放[8]。

  综上所述,从学术研究层面来看,现阶段土尔扈特档案文献的研究尚停留在档案文献内容、价值及其翻译、考释、编辑与公布等基础性研究方面,且多从史学视角开展,缺乏档案学、数字人文等理论与方法的有机融合,更未关注到数字人文环境下其档案文献的可视化开发问题。从实践工作来看,现有开发成果的形式较为传统,档案文献整体上停留在“数字典藏”实然状态,利用服务处于信息服务阶段,限制了档案文献“三交”价值的深入挖掘,不利于提供知识化、精准化服务。数字人文的融入是开展馆藏土尔扈特档案文献知识重组、再生产与数字叙事的过程。本体、知识图谱等技术方法的综合应用,可促使馆藏土尔扈特档案文献实现“数字化—数据化—知识化”的蜕变,实现基于语义关系的知识聚合,由“数字典藏”走向“数字焕活”,更好地贯彻习近平总书记关于“中华民族共同体”系列重要论述的指示精神,促进档案文献活化利用,为铸牢中华民族共同体意识贡献档案力量。

  1  馆藏土尔扈特档案文献可视化开发阐述

  1.1 馆藏土尔扈特档案文献概念界定与资源特征

  目前,学界对于土尔扈特档案文献尚未进行理论界定,在梳理相关研究成果与对其进行档案文献研究的基础上,可将土尔扈特档案文献概念归纳为:围绕着土尔扈特回归事件,由土尔扈特部、清政府、沙俄政府等直接形成的,记录与反映土尔扈特部回归前与清政府互通往来,回归过程中受到清政府保护、接济安置以及回归后入朝觐见、封官受爵,并同新疆各民族广泛交往交流交融等历史情况,以文书、碑刻、印章、诗文等形态存世的历史记录。土尔扈特档案文献种类繁多,涉及汉、满、蒙、藏、俄、托忒等多种语言,资源体系完整,主要保存在一史馆、新疆维吾尔自治区档案馆、博物馆和俄罗斯相关文化机构,资源特征如下:

  一是遗存的丰富性。这一特点着重体现在数量、形态、语言等方面。其一,馆藏土尔扈特档案文献数量较为丰富,如一史馆珍藏有土尔扈特专档共计24册[3]。其中《满文土尔扈特档案译编》所收录的109件档案文献仅占满文土尔扈特专档总量的三分之一[6]。《清代东归和布克赛尔土尔扈特满文档案全译》的收录数量可达764件[7]。满文土尔扈特专档全文检索数据库中存储档案25册,共计4 300余画幅,28.5万余个满文单词[8]。其二,土尔扈特档案文献存世形态丰富,涵盖文书、碑刻、印章、诗文、书画等类型,其档案文献材质包括纸质、铁质、石质、银质等。其三,在书写文字方面有满、汉、藏、俄、拖忒等文字符号,部分档案文献存在合璧书写现象,直观展现了清代多民族文化交融的历史情境。

  二是价值的原始性。土尔扈特档案文献主要是在土尔扈特部、清政府、沙俄政府等在土尔扈特回归事件中直接形成的。其中,由清政府形成的档案占多数,多为君臣的往来上谕、奏折及相关衍生档案文献,具有真实性、原始性与直接性等特点。

  三是内部的系统性。其一是内容记载的系统完整,涉及清政府获悉回归消息的内部商议、对土尔扈特部的安抚政策、土尔扈特抵达伊犁时的情景记述与人口调查、赈济土尔扈特部众、封赏各首领以及耕牧戍边等历史情况,具有较高的史料价值。其二是文种间的关联性,由于不同文书间职能的差异,使得不同文种关于同一事务的记载在内容上各有侧重,从而在内容层面产生了关联,决定了土尔扈特档案文献是一个有机的整体[3],使其更具档案文献的原始性、权威性与价值性。

  1.2 馆藏土尔扈特档案文献可视化开发理论依据

  2004年7月,知识可视化这一概念在Martin  J.Eppler和Remo A. Burkhard共同编写的工作文档Knowledge Visualization-Towards a New Discipline and its Fields of Application中首次被提出并予以界定、描述[9]。2005年,这一概念在国内受到关注,此后陆续开展相关研究。知识可视化作为可视化技术发展所产生的一个重要研究分支,是科学计算可视化、数据可视化、信息可视化等进一步发展的结果。知识可视化以视觉化、形象化方式呈现出复杂抽象的知识,本质上是将隐性知识显性化、显性知识生动化、复杂知识简单化、抽象知识形象化的过程[10]。将知识可视化的理论、技术、方法引入档案馆馆藏资源的组织和挖掘领域,有助于促进档案文献的知识化开发,提升档案馆知识服务水平。

  具体而言,知识可视化理论、技术、方法的应用对于土尔扈特档案文献创新性开发有如下价值:其一,土尔扈特档案文献的知识元提取。现阶段已全文数据化的土尔扈特档案文献粒度尚未细化至知识层级,为进一步提升其数据价值,需开展深入文本的知识元抽取,形成基于人物、时间、地点等主题的知识集合。其二,土尔扈特档案文献语义化聚合。语义层面的深度聚合是实现土尔扈特档案文献可视化开发的关键,这一过程可通过自动化、半自动化与人工本体标注等方式加以实现。经由本体标注的土尔扈特档案文献可借助自身语义体系关联散落在各案卷、档案文本中的知识元,聚类形成多维度的知识簇。其三,土尔扈特档案文献可视化服务。土尔扈特档案文献可视化开发以面向用户需求的知识库为最终成果形式,“前站+后库”的设计可实现知识存储、组织、挖掘与可视化展示的联动,为用户提供“普适化+个性化”的知识服务。

  2  馆藏土尔扈特回归档案文献可视化开发价值意蕴

  2.1 学术意蕴:以点带面,谋求民族档案研究的价值创新

  从民族档案的既有研究来看,其多沿袭传统族裔民族视角,开展个体民族档案的定性研究。部分研究虽在研究技术、研究方法等方面有所创新,但研究视角仍未实现由个体民族到中华民族的升华。亦有部分研究虽意识到中华民族共同体语境下的民族档案研究转型问题,并对相关元问题进行深入阐发,但其研究仍停留在理论构建层面,具体实证研究尚未开展。立足中华民族共同体的政治高度和数字人文的现实环境,探讨馆藏土尔扈特档案文献可视化开发问题,在研究对象上,以土尔扈特档案文献为支点,推动由个体民族档案升华至各民族“三交”档案的研究;在研究理论上,有助于促进民族档案理论同数字人文理论相融合,催生新的研究领域;在研究方法上,可进一步深化新技术方法在民族档案研究中的应用,实现方法创新。

  2.2 实践意蕴:呼应现实,提升档案馆服务大局工作效能

  习近平总书记指出,要深入挖掘少数民族古籍中蕴藏的民族团结进步思想内涵,让少数民族古籍成为铸牢中华民族共同体意识的重要资源[11]。这一重要论述对于新时代民族档案文献价值发掘同样具有指导意义。土尔扈特档案文献记载了清代民族交往交流交融的重要历史事实,对其进行可视化开发的价值在于:其一,有助于贯彻落实新时代档案工作“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用”[12]的指导精神,发掘民族团结档案史料,助力于“三交”史研究与边疆民族地区稳定发展工作。其二,积极融合数字人文技术,丰富优化土尔扈特档案文献利用方式,改善重藏轻用的现实局面,以多元化服务满足边疆文化治理现实需求,为中华民族共同体建设提供档案文化助力。

  3  馆藏土尔扈特档案文献可视化开发实现路径

  土尔扈特档案文献是记载与反映历史上民族交往交流交融的珍贵档案史料,对其进行可视化开发,必须紧扣推动铸牢中华民族共同体意识的思想主线,并将其作为土尔扈特档案文献可视化开发的出发点与落脚点。土尔扈特档案文献是开展档案学、民族史、民族语言研究的重要资料。因此,在开展其可视化开发工作中,首先应树立多学科融合思维,广泛凝聚档案共识,做好顶层设计。其次,应开展资源整合共建,整合土尔扈特档案文献数字资源、数字人文技术资源、多学科智力资源以及政策文本资源。再次,要建设面向知识服务的土尔扈特档案文献数据库与可视化服务平台,实现档案文献内部知识元的组织关联和外部元数据的深度聚合,推动其由可阅读到可计算、可理解的转变。最后,可依托可视化服务平台,提供知识查询关联、知识导航、知识计算、知识推理发现等智慧化服务,促进档案文献共享利用。具体而言,土尔扈特档案文献可视化开发的基础条件在于数据资源的整合汇集与规范化处理,核心关键是基于本体模型架构的数据组织,最终价值实现方式则是依托土尔扈特档案文献知识图谱开展多维度的文本深层次挖掘(见图1)。

1.jpg

图1 土尔扈特档案文献可视化开发流程

  3.1 基础条件:实现土尔扈特档案文献资源全面汇集整合

  土尔扈特档案文献全方面汇集。其一,开展土尔扈特档案文献国内外征集活动。一方面,各收藏单位可形成以一史馆为核心的征集圈,通过复制、购买、捐赠与数字化等形式向官方或个人征集土尔扈特档案文献原件或复制件;另一方面,要切实开展档案对外交流合作工作,充分发挥一史馆对外窗口优势,与俄罗斯相关文化机构进行协商,以购买、交换、捐赠或复制等方式获取俄文相关档案文献。其二,土尔扈特档案文献资源体系构建。依据现存档案文献类型,可将其划分为历史文书、书画诗文、遗存实物等档案文献;依据文种可划分为奏折、上谕、朱批奏折、录副奏折等;依据时期可划分为回归前、回归中以及回归后档案文献三大类,完整串联起土尔扈特回归历史脉络。

  土尔扈特档案文献标准化整理。土尔扈特档案文献数量较多,内容纷繁复杂,就其文本内容而言,一是多民族文字杂糅,对其释读需要少数民族语言文字方面的专业素养;二是字形、字义、语法与书写亦会造成识读障碍。因此,可运用OCR技术和相关满文识别软件等对尚未实现全文数字化处理的土尔扈特档案文献文本进行初步提取,再由相关专家进行内容校对复盘后以二维表的形式存储于土尔扈特档案文献专题基础数据库中,以备后续利用。

  3.2 核心关键:推动土尔扈特档案文献资源走向知识聚合

  推动土尔扈特档案文献由资源整合走向知识聚合的关键步骤在于本体构建。当前,土尔扈特档案文献以单份档案文献为最小著录单位,实现了元数据对单份档案文献的规范描述,达到数字化与人工可读水平[13]。由人工可读走向机器可计算、理解是开展其档案文献文本深层次挖掘,实现知识组织与知识服务的必由之路,可通过本体构建加以实现。本研究选取斯坦福大学提出的七步构建法,运用Protégé软件作为构建工具,首先是土尔扈特档案文献本体构建范围与明确核心类。笔者在参考复用FOAF、EVENT、DCMI、CBDB、《清代档案主题词表》《明清档案分类表》《DA/T  8—2022 明清档案著录细则》等本体、词表、标准的基础上,结合《满文土尔扈特档案译编》《清代东归和布克赛尔土尔扈特满文档案全译》与一史馆开放档案文献条目,通过分析关键词共现特征,抽取档案文献文本中独立且具有共性关系的概念,实现档案文献文本中的隐性要素显性化,将土尔扈特档案文献本体中的核心类划分为全宗(def:General  archive)、案卷(def:Dossier)、档案(def:Archive)、人物(foaf:Agent)、时间(shl:Temporal)、地点(shl:Place)、职官(shl:Official Position)、主题(dc:Subject)、事件(ecrm:Event)等。其次是确定类的等级体系、定义类的属性。在上述大类基础上,于其下设置相关子类,形成土尔扈特档案文献本体类别体系;通过创建类间语义关系以及设置类自身属性,建立起土尔扈特档案文献语义体系。概言之,即创建对象属性(Object Property)与数据属性(Data Property),实现内容层面的语义关联,建立起灵活多维的土尔扈特档案文献语义知识网络,达到知识组织的效果。最后是将土尔扈特档案文献本体模型导入Protégé工具实现本体建模,并通过实体的添加与结果的检测对本体进行充实与修正。图2即为借助Protégé工具OntoGraf界面生成的土尔扈特档案文献本体可视化结果。

2.jpg

图2 土尔扈特回归档案本体模型

  由于Protégé工具可视化界面有限,故本研究仅选取土尔扈特档案文献本体中的事件类进行实例可视化展示,具体如图3所示。

3.jpg

图3 土尔扈特档案文献本体事件类可视化

  3.3 多维呈现:土尔扈特档案文献知识图谱可视化挖掘

  多模态的知识图谱是土尔扈特档案文献知识聚合的最终成果,知识图谱借助知识元间语义关系聚合形成土尔扈特档案文献知识网络,是开展其档案文献文本挖掘的有效工具。本研究借助Neo4j图数据库作为知识图谱生成、存储、挖掘的工具,将上文实例化的本体遵循一定映射规则导入其中,得到实体节点847个,关系1573对,为开展土尔扈特档案文献的知识发现研究奠定了数据基础。

  土尔扈特回归作为一个重要历史事件,由若干子事件组成,各子事件间层递关联,构成了事件发展的完整历史脉络。对其档案文献中所记载的事件进行检索可知,土尔扈特回归事件中,涉及接济安置事件所关联的档案文献数量最多,包括了人口统计,周济牲只、口粮、衣物,安置越冬地等事宜,具体如图4所示。研究认为,基于各子事件的完整呈现,一是可从整体上建构土尔扈特回归史料数字空间,依托档案文献记载,以数字叙事的方式引导研究者回到历史发生场域,实现历史的完整叙事;二是通过观察各子事件所关联的档案文献数量,可探明相关子事件在整个历史事件中的核心程度,使研究者在研究过程中有所侧重;三是在接济安置土尔扈特部方面关联的档案文献数量较多,亦可从侧面反映出清政府对土尔扈特回归的态度及重视程度,起到了知识发现的效果。

4.jpg

图4 土尔扈特回归事件知识图谱

  在数据库中,复对接济安置土尔扈特部事件主题内容,展开重点挖掘,进行二次检索,可探明接济安置土尔扈特部事件中的核心人物、次要人物、关键时间、地点以及形成的档案文献,立体还原历史情景。如图5所示,接济安置土尔扈特子事件的核心人物为弘历、伊勒图、舒赫德,三者分别为当时清政府最高统治者、两任伊犁将军,在土尔扈特回归过程中发挥着至关重要的作用。此外,相关档案文献所关联的地点,如额尔齐斯河、哈萨克、伊犁、塔尔巴哈台等皆是土尔扈特回归路线中重要的地理节点,通过对其梳理,研究者可快速厘清土尔扈特回归路线,助力研究的深入开展。综上,研究认为,其一,知识图谱强大的语义关联功能可改善传统人工搜集、查找档案文献的现状,将研究者从繁重的档案文献整理工作中解放出来,并为人工解读档案文献向计算机解读档案文献转变提供可能。其二,依托知识图谱开展土尔扈特档案文献价值挖掘,有助于研究者建立结构化、立体化思维,快速获取相关记载信息,观察并发现档案文献中的隐性知识,促进研究创新。

5.JPG

图5 土尔扈特回归核心事件知识图谱

  4  结语

  土尔扈特档案文献承载了土尔扈特部回归祖国的民族和国家历史记忆,是弘扬爱国主义精神的珍贵档案文献。立足民族档案服务中华民族共同体建设的现实需求,在梳理既有土尔扈特档案文献开发成果的基础上,引入数字人文可视化的理论、技术与方法对土尔扈特档案文献进行创新开发,对于焕活档案文献文本价值、服务中心大局工作具有重要现实意义。但是,现有学术研究中对土尔扈特档案文献资源整合共享与价值数字化挖掘等问题尚未进行深入的理论探讨;实践方面,土尔扈特档案文献互译出版、数据库建设、开放利用等工作有待提升,这也为今后研究留下了一定空间。在数字人文理论、技术与方法应用于档案文献价值挖掘的讨论日益受到关注的形势下,土尔扈特档案文献可视化开发不仅具有较好前景,相关研究成果亦可为中华民族共同体建设持续提供智力支持。

  参考文献

  [1]习近平系列重要讲话数据库.加强文化遗产保护传承 弘扬中华优秀传统文化[EB/OL].(2024-04-15)[2024-05-05].http://jhsjk.people.cn/article/40216491.

  [2]阿迪力·阿布力孜,郭家翔.义无反顾回归祖国的历史见证 出土土尔扈特银印背后的故事[J].中国民族,2023(5):105.

  [3]李刚,2023a.军机处满文土尔扈特专档评述[J].民族翻译,(2):58-64.

  [4]郭美兰.清代霍博克赛里土尔扈特蒙古赴藏熬茶活动初探[J].西部蒙古论坛,2013(2):41-48,128.

  [5]李刚,2023b.乾隆御制《土尔扈特全部归顺记》满汉碑文辨析[J].历史档案,(3):134-144.

  [6]中国社会科学院民族研究所民族史研究室,中国第一历史档案馆满文部.满文土尔扈特档案译编[M].北京:民族出版社,1988.

  [7]吴元丰,叶尔达,巴·巴图巴雅尔.清代东归和布克赛尔土尔扈特满文档案全译[M].乌鲁木齐:新疆人民出版社,2013.

  [8]皇史宬.满文专档:土尔扈特档全文检索数据库上线[EB/OL].(2021-06-09)[2024-05-05].https://mp.weixin.qq.com/s/58g7uS6QfqsgdFPY4T1asQ.

  [9]赵国庆.知识可视化2004定义的分析与修订[J].电化教育研究,2009(3):15-18.

  [10]孙雨生,张梦珍,朱礼军.国内知识可视化研究进展:理论分析[J].情报理论与实践, 2015(11):126-131.

  [11]光明网.让少数民族古籍成为铸牢中华民族共同体意识的重要资源[EB/OL] .(2020-07-17)[2024-05-05].https://m.gmw.cn/baijia/2020-07/17/34002774.html.

  [12]中华人民共和国国家档案局.中办国办印发《“十四五”全国档案事业发展规划》[EB/OL].(2021-06-09)[2024-05-05].https://www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.

  [13]夏天,钱毅.面向知识服务的档案数据语义化重组[J].档案学研究,2021(2):36-44.

  【基金项目】教育部重大招标项目“元明清时期中国边疆治理文献整理与数据库建设研究”(项目编号: 21JZD042)。

  【作者简介】华林(1965—),男,汉族,云南普洱人,云南大学历史与档案学院教授、博士生导师、全国档案专家领军人才,博士,研究方向:档案学、历史文献学、民族档案等;通讯作者:张富秋(2003—),男,汉族,黑龙江哈尔滨人,云南大学历史与档案学院学士在读,研究方向:民族档案整理、服务等;刘菊(2000—),女,汉族,四川泸州人,云南大学历史与档案学院硕士在读,研究方向:民族档案开发等;宋晓婷(2001—),女,汉族,辽宁大连人,云南大学历史与档案学院硕士在读,研究方向:民族档案服务等。