数字人文视角下我国近代史料的挖掘与开发利用研究

发布时间:2024-10-31 06:58:04被阅览数:132 次信息来源:《山西档案》

  作者:李小旭
  摘要:数字人文的兴起为传统档案开发利用开辟了全新路径。聚焦数字人文视角下我国近代档案史料的开发利用,在梳理近代档案史料的类型、价值的基础上,围绕近代档案史料开发现状,探索数字人文环境下深化近代档案史料开发利用的技术路径。通过强化近代史料的数字化与数据化、加强典型专题近代史料的数据加工与分析、融合提升多源异构史料的沉浸式文化体验等,深层次挖掘近代史料蕴藏的价值,为拓展档案史料开发广度、提升档案史料利用深度、放大档案史料社会效应提供支撑与参考。
  关键词:数字人文;近代档案史料;开发利用
  数字人文作为数字技术与人文学科深度融合的新兴研究范式,正在深刻影响着传统人文学科的研究模式、话语体系与学术生态。随着数字化、数据化的快速发展,海量人文数据的采集、加工、分析与应用成为数字人文研究的重要内容。我国丰富的近代历史文献与档案资源蕴含着极高的学术价值与社会价值,是近代中国发展进程、社会变迁、文化交流的真实记录。充分发掘并开发近代史料的价值,对于传承历史记忆、坚定文化自信、服务当代社会具有重要意义[1]。近年来,国内学者围绕我国近代档案史料、科技档案史料等的整理与开发利用开展了一系列研究,取得了丰富的理论与实践成果。研究内容涉及了近代档案史料的收集整理、著录标引、编研出版、内容挖掘、情报分析等方面,研究方法涵盖了内容分析、数据建模、知识发现等定量与定性相融合的方法[2]。然而,随着数字人文研究的持续深化,传统的近代史料开发利用也面临诸多问题与挑战,其中包括海量异构史料的精准采集与规范化表达巫待加强,多源异构数据的关联融合与语义组织有待进一步深化,面向用户需求的知识发现与智能应用呕需进一步发展。越来越多研究表明,数字人文相关理念、技术与方法为破解上述难题、推动近代史料开发利用的理论创新与实践探索提供了新思路。
  1  数字人文相关理论视角与技术支撑
  1.1  数字人文的理念内涵与发展脉络
  数字人文是人文学科借助数字技术对人文对象开展数字化采集、加工、分析、呈现的研究范式。20世纪90年代,国际学界先后提出“人文计算”与“数字人文”的概念,标志着数字人文研究正式起步。2004年,《数字人文指南》的出版掀起了数字人文研究和实践的高潮。随后,以计算技术为核心的数字人文相继经历了可视化分析、空间分析、非结构化数据挖掘等发展阶段,展现出学科融合、问题导向、应用驱动的鲜明特征。数字人文研究贯穿了人文数据的全生命周期管理流程。具体而言,首先,通过多源异构数据的大规模采集与深层次加工,实现对人文现象的精准刻画与多维度解释。其次,借助语义分析、知识图谱等数字人文工具与方法,深化对人文资源的内容挖掘、关联分析、综合集成与融合应用,为传统人文学科研究范式的变革提供支持。
  1.2  数字人文理论对近代史料开发的启示
 
 波普尔的“三个世界”理论和诺拉提出的“记忆之场”理论对于数字人文视角下近代史料开发内涵的解释有着天然的独到见解。首先,从本体论层面阐释了世界存在的3种形式:客观世界的物理实在(世界1)、主观世界的心理状态(世界2)、客观知识的逻辑内容(世界3)。在数字人文视角下,档案史料所承载着多源异构的物理形式、语义内容与情感意义,呈现出波普尔所言的世界1、世界2、世界3的交织与融合。与之对应的是,对近代史料的开发利用,需要立足史料承载的物理形式、情感意义、精神内涵等不同维度,综合考量多模态史料的物质性、关联性、发展性、象征性等特点,最大限度地开发近代史料的史料价值、凭证价值、文化价值与情感价值,实现对历史现象的全面理解和对文化内涵的创造性阐述。其次,“记忆之场”理论强调历史记忆依托于一定的物质场所、象征符号与功能实践生成与建构。作为重要的群体记忆资源,档案史料记录着不同时代、不同地域人们的生活方式、价值观念,折射出特定历史语境下的文化传统与精神风貌。在数字人文理念的引领下,立足“记忆之场”理论开发近代史料,需要充分彰显不同时空背景下史料的物质性、象征性、功能性内涵[3]。
  1.3  数字人文关键技术在近代史料开发中的应用
  数字人文研究特别关注如何将先进的前沿信息技术契合应用在人文领域的各个方面。因此,数字化、数据挖掘、知识组织、信息可视化、虚拟现实等数字人文关键技术为近代史料开发利用提供了新思路。首先,文本数字化、图像数字化等技术加快了史料的数字化转化进程,为海量历史文献的全文检索、关联分析奠定了数据基础。其次,基于人工智能的自然语言处理、语义分析等技术助力从非结构化史料文本中精准抽取人名、地名、时间、事件等关键词,为史料的内容标引与深度挖掘提供支撑。最后,图谱可视化、科学计量分析、社会网络分析等技术则为揭示历史数据背后的时间序列、空间分布、人物关系网络绘制了清晰直观的图谱。
  2  近代档案史料的类型、价值与开发利用现状
  2.1  近代档案史料的类型及其价值解析
  我国近代档案史料丰富多样,涵盖了清末时期、民国时期政治、经济、文化、教育、外交等领域。从形式上看,近代档案史料以文书档案为主,兼有大量图片档案、实物档案等。第一,清末时期档案主要包括清政府及其所属机构的档案,诸如军机处档案、总理衙门档案等。这些档案真实地记录了清政府应对内忧外患的措施和洋务运动推动实业发展的进程,是研究晚清中国“静眼看世界”、开启现代化进程的重要史料。第二,民国时期档案则主要包括北洋政府和国民政府及其所属机构的档案资料,包含报刊档案、名人档案、革命历史档案等专门档案,客观反映了北洋时期议会民主的发展与困境,为全面认识和研究民国时期的社会面貌提供了重要史料支撑。近代档案史料蕴含着独特的史料价值,对于揭示历史事实、还原历史原貌具有不可替代的作用。以民国时期中国学生赴澳大利亚留学的档案卷宗为例,系统梳理民国政府选派留学生的名单、留学地点、学习情况等,可以勾勒出民国时期教育选拔制度、中外教育交流的发展脉络。
  2.2  档案馆近代档案史料开发利用现状审视
  近年来,随着《“十四五”全国档案事业发展规划》的实施和档案工作制度化、规范化、法治化建设的不断推进,档案部门高度重视馆藏档案史料的收集、整理与开发利用。各级综合性档案馆通过借助各种渠道征集近代档案史料,大幅提升了馆藏近代档案史料的质量。以广东省档案馆为例,该馆近年来先后征集到广州起义、辛亥革命、抗战等一批珍贵的近代档案史料,有力地支撑了我国近代各类重大历史事件的史料研究。我国各省市档案馆还依托档案数字化平台,有序推进馆藏档案史料的数字化进程,并开展档案编研、成果出版、展览利用等工作,有效扩大了近代档案史料的社会影响力。然而,目前对近代档案史料的开发利用主要集中于档案史料文本的数字化和档案史料内容的编研出版,对档案史料知识的语义组织、关联分析、关系揭示的重视不够,近代档案史料资源的聚合程度和集成化服务水平有待进一步提升。
  2.3  数字人文视角下近代档案史料的开发利用路径探寻
  在数字技术与人文研究深度融合的背景下,以数字化、数据化、智能化转化路径为基础,借助语义分析、知识组织、知识发现、知识管理等现代信息处理技术手段,为近代档案史料资源开发利用开拓出新路径,为其价值的深层次挖掘提供了广阔空间。例如,国内外国家档案馆围绕各地特色数字人文项目,针对不同档案史料进行文本分析、情感分析、社会网络分析,并开发了集关键词检索、热点分析、情感标注、关系图谱等功能于一体的档案开放服务平台,以可视化、沉浸式的方式再现历史,实现颠覆性公共服务新体验。因此,可以预见,随着数字人文研究的持续深化,以语义关联、知识发现为导向的档案史料知识化利用将成为未来发展趋势。借助自然语言处理、知识图谱等技术,对近代档案史料进行细粒度的内容语义标引,形成以知识点为中心的语义网络;并结合知识图谱构建技术,实现知识化档案的表示与关联,进而搭建集编目数据、全文数据、语义数据、关联数据于一体的知识化档案库,实现档案语义检索、关联分析、情境重现等知识服务[4]。只有与时俱进地拥抱数字人文,主动适应信息技术发展新趋势,才能真正将近代档案史料中凝结的历史知识转化为鲜活的记忆,将深藏的档案价值转化为助推民族复兴的精神力量。
  3  数字人文视角下近代史料的挖掘与开发路径
  3.1  多维度的近代史料数字化与数据化
  面对浩如烟海、类型多样的近代文献、报刊、图片等史料,如何实现规范化采集、精准化识别、关联化组织与语义化表达是近代史料数字化面临的关键挑战。国内外学者围绕OCR文字识别、数字化元数据著录、语义标注等典型知识组织技术开展了诸多应用实践,为破解以上难题提供了可资借鉴的思路。同时,借助自然语言处理、知识抽取等数字人文技术,海量非结构化史料文本中的人名、地名、时间、事件等信息要素被自动提取并精准定位,相似或关联的史料片段被聚合形成具有特定主题的数据集,使得近代历史信息在数字化还原与数据化重组中焕发出新的生机[5]。因此,数字化为近代史料的全面采集提供技术支撑,数据化则为近代史料的深度分析、关联挖掘、知识发现提供数据根基。
  3.2  面向典型专题的近代史料数据加工与分析
  在数字人文环境下,典型专题的近代史料开发逐渐从解释个案、梳理脉络走向揭示规律、刻画图景。基于多源异构的大数据资源,研究者不仅能够宏观把握专题数据的总体特征,还能细致勾勒事件演进的动态脉络。一系列研究表明,数字人文视角下近代史料的专题开发的分析手段正在从传统的内容分析、史料辑拓展至科学计量等定量分析手段,呈现出定性与定量相结合、宏观与微观相统一、继承与创新相融通的发展趋势。展开来讲,通过深度学习方法能够提取近代历史人物画像、历史事件的关键表征,进而形成对专题数据的特征化加工模式。以往对历史名人的研究侧重于对个人生平事迹的描述,如今则更加关注对人物活动轨迹、人际交往网络、思想观念流变的动态刻画。历史事件研究也由静态脉络梳理走向动态关联挖掘,情感分析、观点提取、因果关系发现等现代文本分析手段的引入让历史事件的形成、演进与影响得到更为细致的呈现。同时,地理信息分析、社会网络分析等数字人文分析方法在专题史料挖掘中得到广泛应用。时空数据的可视化重现、社会网络的拓扑结构映射为还原历史现场、揭示历史规律提供了崭新视角。
  3.3  融合多源异构史料的沉浸式文化体验
  传统的史料开发侧重于史料内容的结构化与图像化呈现,而在数字人文理念与技术的加持下,以沉浸式场景塑造历史文化语境、传承历史文化记忆的史料开发新模式应运而生。虚拟现实、增强现实等数字人文前沿技术能够营造身临其境的文化体验,成为传统史料开发利用的重要补充。学者不仅尝试虚拟再现重大历史事件发生的时空场景,更着力于在虚拟场景中融入历史档案、文物图像、口述史料等多源异构史料,力图全方位再现特定历史情境,让观者在沉浸式互动中亲历历史、感悟历史。此外,立足于“记忆场所”理论,无论是将革命旧址、历史文化街区打造成集历史展示、情境再现、文化传承于一体的综合体,还是依托特色历史文化资源,开发集资政、展览、研究等功能于一体的主题档案馆,整体实现了档案史料开发从单一的档案史料文本开发走向包容多源异构档案史料的融合性开发。在数字人文视角下,多源异构的近代档案史料的深度开发与利用,能够为传承红色基因、续文化血脉、坚定文化自信开辟新的路径。
  参考文献
  [1]刘慧琳数字人文:数据时代下的文化保护与传承[J].山西档案,2019(5):72-79.
  [2]蒋婧文。档案史料视角下高校传承红色文化路径研究[J].山西档案,2019(3):37-38.
  [3]李姗姗,崔璐,崔旭,记忆之场理论视域下档案史料的解构与重构[J].档案学研究,2023(2):103-110.
  [4]牛力,高晨翔,张宇锋,等.发现、重构与故事化:数字人文视角下档案研究的路径与方法[J].中国图书馆学报,2021,47(1):88-107.
  [5]杨光“让档案自已说话”:福柯的档案史料观[J].档案学研究,2023(3):137-143.
  【基金项目】山西省高等学校一般性教学改革创新项目“吕梁红色文化融入大学生政治信仰培育的价值与路径研究”(项目编号:J20231348)。
  【作者简介】李小旭(1991一),男,汉族,宁夏固原人,吕梁学院马克思主义学院助教,硕士,研究方向:大学生思想政治教育及中国近现代史基本问题。