数字人文视角下民国档案资源开发研究:现状与前瞻

发布时间:2024-08-30 19:36:39被阅览数:78 次信息来源:《山西档案》

  作   者:杨晶伟 张红梅

  摘   要:随着数智技术的不断发展与数字人文领域的不断开拓,民国档案作为中国近现代历史变迁的珍贵记录,对其进行科学合理的开发利用有着鲜明的现实价值与时代意义。深入探讨数字人文视角下民国档案资源开发现状与前瞻,旨在为民国档案资源的深度开发与高效利用提供理论与实践指导,促进档案学科的交叉融合与创新发展。

  关键词:民国档案;档案资源开发;数字人文

  在数字技术与智能技术蓬勃发展的时代,档案资源的再开发与活化利用成为档案工作的重点内容。数字人文作为一种将数字技术与人文学科深度交融的新兴跨学科领域,为档案资源的深度开发与创新利用注入全新的生命活力。民国时期作为中国历史上一个承前启后的关键阶段,其档案资料是中国近现代历史变迁的珍贵记录,蕴含着丰富的历史信息与文化意蕴,对于开展中国近现代史、社会发展变迁、思想文化演进等方面的研究具有不可估量的意义与价值。在数字人文视角下,对民国档案资源进行深入挖掘、开发、利用、传播以及共享是深化历史认知、传承文化精髓、凸显档案价值的重要路径。

  在数字人文视域下,文本挖掘、情感计算、可视化、GIS空间分析等技术与方法为民国档案资源的处理带来了极大的便利,民国档案资源的开发利用也取得了相应进展。例如,通过高分辨率扫描仪和数字成像技术,可以高精度重现民国档案的原始风貌与真实内容;通过数据挖掘和文本分析技术,能够深入地还原与研究民国时期的政治、经济、文化、交通、科技等方面内容。然而,当前民国档案资源的数智化开发利用也面临诸多挑战。例如,民国档案资源多源异构,缺少科学统一的数字化标准,难以实现高效的利用与共享;数字化过程中出现色彩失真、字迹模糊、识别不准等情况;开发利用以及开放共享过程中面临数据安全、隐私保护与版权等方面的问题;民国档案资源的修复保护以及长期保存等问题。基于数字人文视角,对民国档案资源的开发现状进行深入分析与长远展望,运用数字化、智能化技术与工具深度赋能民国档案资源的开发利用与开放共享,是推动档案学科交叉融合,促进档案资源高效整合与高度共享,推动文化传承与教育普及,加快档案事业现代化建设的时代路径。

  1  民国档案资源开发利用现状

  1.1 民国档案资源研究方向与困境

  近年来,国内众多学者对民国档案资源的全生命周期展开了多视角、多维度的探索与研究,涉及民国档案的保护与修复、整理与管理、数字化与信息化建设、开发利用、著录工作等方向[1]。尤其是民国档案的保护与修复方面备受重视。一方面,档案机构亟须保护与修复受损的民国档案,这是当前档案工作的主要任务。另一方面,档案资源的真实性和完整性是进行开发利用的前提基础。做好民国档案资源的保护与修复是延续档案资源寿命、开发挖掘其多元价值的重要保障。

  尽管当前民国档案资源开发利用数字化进程已取得一定进展,但是依旧面临质量问题与安全风险。黄建军等指出民国档案数转模过程中存在的质量与安全问题,并提出了相应的解决方案[2]。此外,标准不清、工作流程不完善等也是亟待解决的难题。展望未来,一方面,应优化数字化流程,强化质量控制,确保档案信息的准确性和完整性。另一方面,需要加强对数字人文平台建设的指导,避免学科需求与公众需求之间的失衡,确保平台功能的全面性和实用性。

  1.2 民国档案资源具体研究视角与前瞻

  民国档案主题内容丰富多样,已成为多个学科研究的重要史料与凭证,包括历史学、档案学、政治学、经济学等学科领域。例如,李常宝[3]基于四川民国档案开展兵役相关研究,探讨如何通过实行兵役制度和国民兵身份证制度来管理兵源;张生等[4]以南京户籍卡为研究对象,深入展开对解放战争时期地下党斗争的分析与探究;冯小红等[5]以太行山文书为中心,系统阐述民国时期华北抗日根据地村庄管理组织的隐性经济职能。民国档案作为记载特定历史事件的重要文化遗产资源,在深入了解特定历史事件、开展跨学科研究和拓展研究深度、广度等方面发挥着重要作用。此外,民国档案在文化创意产业中展现出独特的魅力。陈宇[6]通过中华老字号采芝斋档案案例,探讨了档案与非物质文化遗产保护的结合情况,提出将档案融入美食、音乐等创意项目中,增强社会效应。这种模式既实现了民国档案资源的有效保护,又提升了档案的公众认知度和利用价值。

  随着民国档案的开放与数字化,社会公众对这一时期档案的兴趣日益浓厚。国家档案局推动的民国档案文件级目录著录工作,以及档案法对社会力量参与档案事业的鼓励,均有助于提高公众对民国档案的认知[7]。当前,如何更好地普及档案知识,提升公众的档案意识,是档案实践机构要认真落实和解决的问题。

  2  数字人文视角下民国档案资源开发

  2.1 文本挖掘与数据分析技术的应用

  第一,关键词提取与主题分析。在数字人文视域下,关键词提取与主题分析成为民国档案资源深度开发的高效工具。民国档案资源经过高精度扫描与光学字符识别技术深度加工处理后,成为机器可识别、可检索、可分析的数字模态;通过自然语言处理技术,如TF-IDF、LDA等算法,能够从海量民国档案文本中自动抽取高频关键词和主题词群,挖掘文本集合中隐藏的主体结构,把握民国档案内容的核心议题与时代特征,从而更深入地了解民国时期的社会、政治、经济、教育等方面的主题变迁。例如,通过对民国时期外交文件的分析,可以揭示出当时国际关系的热点问题和中国外交政策的演变轨迹。此外,主题模型的建立不仅能帮助相关研究者发现隐含的历史线索,还能为公众提供更加精准高效的检索和浏览体验。

  第二,情感分析与趋势预测。情感分析技术能帮助识别与判断情感倾向。该技术应用于民国档案,特别是新闻报道、私人信函和政府公告中,通过构建情感词典和规则,揭示当时社会情绪的倾向和变化趋势以及民众对特定事件或政策制度的态度。结合时间序列分析,可以进一步预测不同决策下历史事件的发展走向和影响。例如,通过对北伐战争时期新闻报道的情感倾向分析,可以更细腻地描绘出民众对革命的支持度与态度变迁,为理解历史事件的社会背景提供数据支持。

  2.2 可视化技术的采用

  第一,时空分布图的制作与分析。利用地理信息系统(GIS)技术和数字地图,将民国时期的档案资料定位到具体的时间和空间坐标上,可以直观生动地展示和呈现事件发生的地理分布和时空动态,即可以直观生动地观察民国某个历史事件在不同年份的传播路径以及某个地区在民国不同时期的事件密集度。例如,绘制民国时期重要人物的行踪图、疫病传播路线图或移民流动图,不仅能帮助相关研究者识别空间上的规律性,还能为理解历史事件的地域性影响提供直观依据。

  第二,网络关系图的构建与解读。通过社交网络分析(SNA)方法,可以将民国档案中的人物关系、组织结构、事件关联、信息传播路径等抽象关系转化为可视化网络图。这有助于揭示复杂的社会网络结构,深入分析关键节点和群体间的影响机制与互动关联。例如,通过构建国民党与共产党的政治联盟变化网络,清晰展现两党合作与对抗的动态过程以及背后的政治逻辑。

  2.3 虚拟现实与增强现实技术的探索

  第一,历史场景的重建与体验。借助虚拟现实技术,可以高度还原民国时期的街景、建筑、餐饮、重大事件现场等,为用户提供身临其境般的沉浸感与体验感。沉浸式体验不仅可以增强民国档案资源历史教育的吸引力,让用户获得更为饱满的情绪价值,还能为相关研究者提供更为直观立体的研究环境。

  第二,互动式学习模式的探索。增强现实技术的应用是在现实环境中叠加数字信息,为档案资源的教育普及与生动传播提供了新方式。通过移动终端,用户可以在博物馆、档案馆等场所扫描实物或图片,即时获取相关历史背景、人物介绍等信息,增强学习的主动性、互动性和趣味性。这种互动式学习模式,在提高用户参观体验效果的同时,也促进了档案知识的广泛传播,激发了用户对民国历史的浓厚兴趣和探索欲望。

  3  民国档案资源开发的前瞻性研究

  3.1 深度学习与民国档案资源的智能识别

  第一,利用深度学习模型实现自动化标注与分类。针对民国档案特有的繁体字、旧式语法及历史背景,深度学习模型通过定制化训练可以实现对档案文字的高精度自动标注、智能识别与分类。通过分析笔迹、文书格式及特定历史术语,深度学习模型能有效区分不同类型民国档案记录,如政府公文、私人信函、报纸杂志等,为后续研究提供科学便利的分类体系,显著提高民国档案管理的效度。

  第二,基于深度学习的内容提取与解析。利用深度学习技术以及神经网络模型解析民国档案中的隐含信息,可以获得更为精准、深入的档案资料。例如,从模糊不清的手稿、笔记、报刊中恢复文字内容或从照片、地图、影像中自动识别并标记历史地点、人物关系等。此外,结合情感分析与主题建模技术能帮助公众理解档案背后的社会情绪与时代主题,深化对民国时期政治、经济、文化动态的认识与了解。

  3.2 大数据与民国档案资源的关联性挖掘

  第一,跨库检索与数据整合。整合全国乃至全球范围内的民国档案数据库,运用大数据技术建立统一索引,构建系统完整、关联紧密、共享共建的民国档案资源库,实现跨地域、跨机构的档案资源整合与统一检索。通过时间序列分析、地理信息系统(GIS)集成等手段,可以直观展现民国时期事件的时空分布特征,为民国档案研究者提供宏观视角下的历史脉络梳理工具。

  第二,历史人物事件的关联网络分析。基于大数据技术,可以对民国档案中的历史事件和历史人物进行关联网络分析。通过构建民国时期重要历史事件与关键人物的复杂网络模型,揭示事件间的连锁反应与演进脉络、人物关系网的演变规律及其在历史进程中的影响与作用。例如,通过分析毛泽东、蒋介石等领袖人物的书信、电报往来,以及与之相关的战役、会议记录,可以更精细地描绘出政治权力结构与战略决策过程。

  3.3 公众参与与民国档案资源的共创共享

  第一,公众参与的档案注解与编辑模式。公众参与、共创共享是民国档案资源建设的趋势。建立面向公众的民国档案众包平台,邀请社会公众、档案专家、历史爱好者等多元主体积极参与档案的注解与编辑工作,贡献个人记忆、补充缺失信息、丰富档案内容、促进档案传播,提高民国档案资源建设的完成度与完整度[8]。此外,可以利用光学符号识别辅助校对功能,从而提高公众参与档案数字化的效率与质量。

  第二,社交媒体与民国档案资源传播。在全民记录、全民共享的社交媒体时代,档案机构可以结合微博、微信公众号、抖音等社交媒体平台,以故事化、视觉化的形式传播民国档案背后的故事。利用短视频、图文故事等形式,介绍重要历史人物的生平趣事、关键历史时刻的细节,让民国历史以更加生动、贴近现代审美的方式走进大众视野,激发社会公众对民国档案保护与研究的兴趣。此外,公众可以自主在社交媒体平台上进行民国档案知识的传播,实现即时交流与实时交互。

  参考文献

  [1]刘艺伟.2019—2023年民国档案研究述评[J].兰台世界,2024(1):16-19.

  [2]黄建军,黄旻倩,邵金耀,等.民国档案数转模安全问题与应对策略[J].档案学研究,2021(4):111-115.

  [3]李常宝.从兵役管区到身份证:日本军国主义侵华之际南京国民政府的兵役应对:基于川省民国档案的考察[J].民国档案,2019(1):81-88.

  [4]张生,徐春,孔爱萍.解放战争时期南京地下党的隐蔽斗争:以民国南京户籍卡档案为中心的研究[J].民国档案,2022(4):59-68.

  [5]冯小红,刘子元.华北抗日根据地村庄管理组织的隐性经济职能:以太行山文书为中心[J].民国档案,2023(2):134-144.

  [6]陈宇.构建民国档案与非遗保护的良好互动机制:从馆藏采芝斋档案说起[J].档案管理,2021(2):74-75.

  [7]丁家友,廖丽萍,倪乐贤.数字人文视域下书条石档案开发利用研究[J].山西档案,2023(6):25-33.

  [8]马仁杰,殳圣薇.论档案信息资源开发中叙事要素的构成及其优化路径[J].山西档案,2023(5):5-11.

  【作者简介】杨晶伟(1977—), 男,回族,河南周口人,信阳师范大学副教授,华中师范大学博士在读,研究方向:武术史、历史;通讯作者:张红梅(1980—),女,汉族,河南商丘人,信阳师范大学副教授,博士,研究方向:体育史。