发布时间:2025-01-03 08:17:34被阅览数:520 次信息来源:《山西档案》
作者:杜蕊
摘要:档案大数据为数字人文研究提供了丰富的数据资源,成为推动数字人文发展的重要支撑。首先,在梳理了数字人文的内涵界定与学科属性的基础上,探讨了档案大数据对数字人文研究的理论影响。其次,系统阐述了档案大数据采集、存储、管理与分析技术,探讨了数字人文研究中的计算方法与工具,提出了档案大数据支撑下数字人文研究的技术方法创新路径。再次,从课程设置、教学模式创新和人才培养目标三个方面探讨了档案大数据环境下数字人文研究的应用实践教学。旨在为推动档案学与数字人文的协同创新发展提供理论指导和实践参考。
关键词:档案大数据;数字人文;理论认知;技术方法;应用实践教学
近年来,随着数字经济与信息技术的飞速发展,大数据已经渗透到社会生活的方方面面。《“十四五”大数据产业发展规划》围绕“打造数字经济新优势”,作出了培育壮大大数据等新兴数字产业的明确部署,为传统学科领域与大数据技术的交叉融合带来了新的机遇和挑战。一方面,人文学科亟须利用大数据思维和方法推动学科的创新发展;另一方面,大数据技术的广泛应用也为人文研究注入了新的活力。作为人文学科的重要分支,档案学在大数据时代同样面临转型升级的紧迫需求。《“十四五”全国档案事业发展规划》明确提出,要推动档案全面纳入国家大数据战略,加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,在大数据环境中开展电子文件与电子档案一体化管理,为档案大数据环境下的数字人文研究指明了方向。事实上,档案大数据以其数据体量巨大、数据类型繁多、数据价值高等特点,为数字人文研究提供了丰富的数据资源,成为数字人文研究的重要支撑。
目前,学界对档案大数据的研究主要集中在对档案大数据的内涵界定、管理与应用等方面[1],对档案大数据如何支撑和推动数字人文研究的系统探讨还较为欠缺。而数字人文作为一个典型的交叉研究领域,其理论体系尚不成熟,技术方法有待创新,教育教学体系亟待构建。如何在档案大数据环境下推进数字人文研究的理论创新、技术突破和教学实践,仍是亟待解决的问题。鉴于此,本文拟在梳理档案大数据与数字人文相关研究的基础上,系统探讨档案大数据对数字人文研究理论的影响,并分析档案大数据支撑下数字人文研究的技术创新路径,进而探讨档案大数据环境下数字人文研究的课程体系构建、教学模式创新和人才培养目标。通过上述研究,本文力图构建档案大数据与数字人文交叉融合的理论分析框架,丰富档案大数据支撑下数字人文研究的技术方法,完善档案大数据环境下数字人文应用型人才培养体系,为推动档案学与数字人文的协同创新发展提供理论指导和实践参考。
1 档案大数据环境下数字人文研究的理论认知
1.1 数字人文的内涵界定与学科属性
数字人文,作为近年来兴起的一个跨学科研究领域,其内涵与外延尚无统一且严格的学术界定。从广义角度而言,数字人文是数字技术支持下人文研究范式的转型,旨在利用数字化手段重构人文学科的知识体系。狭义的数字人文则侧重强调利用数字工具和计算方法开展文本分析、知识挖掘等细粒度研究。尽管数字人文的内涵存在多种表述,但普遍认为数字人文以数字化的人文资源为基础,以现代信息技术和数字媒体为研究手段,致力于人文知识的数字化呈现、数字化分析和数字化传播,体现了鲜明的跨学科交叉融合特点。从学科属性来看,数字人文介于人文学科与计算机科学之间,兼具两大学科的理论特点和方法论特征。一方面,数字人文根植于传统人文学科,关注人文对象及其内在意义,强调人文思维与智慧;另一方面,数字人文吸纳了计算机科学的理论方法,注重用数字化、建模化的思维来审视人文现象。数字人文通过嫁接人文学科与计算机科学,催生出新的学科生长点,形成了独特的理论体系和话语体系,引领人文研究的范式革新。
1.2 档案大数据的概念内涵与基本特征
随着大数据技术的发展,档案学逐渐形成“大数据”的理念,对档案大数据的相关研究也应运而生。档案大数据主要指海量、动态、多源异构的数字化档案资源集合,具有数据体量巨大、数据类型繁多、数据处理高速等特点。与一般大数据相比,档案大数据具有价值密度高、真实性强、权威性高等显著特征,能够更好地支撑当代档案工作与档案学术研究。从内容上看,档案大数据不仅有以文本、图像、视频等形式存在的非结构化数据,还有以数据库等形式存储的结构化数据。同时,从管理的维度来看,档案大数据需要通过大数据采集、存储、清洗、分析、挖掘等全生命周期流程,实现数据资源的规范化管理和深度开发与利用。
1.3 档案大数据对数字人文研究的理论影响
从档案大数据的内涵出发,其海量的档案数据资源极大地拓宽了数字人文研究的视野,使得研究对象从传统的文本档案延伸到图像、视频、数据库等多种载体形式的档案,研究内容也从单一事件拓展到宏观的社会网络系统,为数字人文学者提供了更为广阔的研究空间。在大数据驱动的影响下,数字人文逐渐摆脱经验主义和思辨哲学的桎梏,转而强调数据为证、方法为要,注重从大规模数据中挖掘知识,从中洞察事物的发展脉络,发现事件的时空关联,为人文研究注入新的活力[2]。此外,从学科发展角度出发,档案大数据为数字人文学科体系重构提供了现实基础,推动数字人文逐步突破学科边界,与计算机科学、数据科学深度融合,形成了“计算X”模式下的多元学科图景,构建起具有鲜明时代特色的理论话语体系和学术范式。
2 档案大数据环境下数字人文研究的技术方法
2.1 档案大数据的采集、存储、管理与分析技术
随着数字化进程不断加快,海量异构的档案数据资源亟须通过规范化的技术手段予以有效管理和深度开发利用。首先,从数据采集来看,档案大数据的数据来源呈现多元化趋势。传统档案数字化、政府部门业务数据归档、互联网数据捕获等已成为档案大数据的重要来源渠道。与此同时,物联网感知、移动互联等新兴技术的应用,使得档案大数据采集更加智能化、自动化。其次,在数据存储与管理方面,档案大数据对传统的集中式存储架构提出了挑战。云存储、分布式存储等技术在档案大数据存储中得到广泛应用,NoSQL数据库、Neo4j图数据库等新型数据管理系统也被引入档案大数据管理实践中。此外,从大数据分析角度出发,数据挖掘、机器学习、深度学习等人工智能技术在档案大数据分析中崭露头角,极大地提升了对海量异构数据的计算与分析效率。通过主题建模,能够发现隐藏在档案大数据背后的关联模式与演化规律,并结合知识抽取手段,能够从非结构化档案数据中提炼出结构化的知识要素。
2.2 数字人文研究中的计算方法与工具
在大数据时代背景下,计算方法已成为数字人文研究的主流范式。云计算、人工智能等技术被广泛应用于文学、历史、艺术等人文学科领域,催生了一系列数字人文研究的新方法和新工具。以文本分析为例,自然语言处理、文本挖掘等技术的嵌入,使得大规模文本数据的语义理解和知识发现成为可能。通过词频统计、主题建模、情感分析等方法,能够分析文本内容的语义脉络、主题演化与情感倾向等,进而洞察社会文化现象背后的深层机制。另外,社会网络分析方法的引入,能够促使数字人文研究人员揭示隐藏在档案大数据中的人物关系网络、信息传播网络以及知识演化网络,有助于从宏观、动态、关联的视角审视社会文化现象。除文本分析、社会网络分析外,GIS空间分析、音频分析、视频分析等技术在数字人文研究中也得到广泛应用,它们能够可视化地呈现出历史文化现象的地理分布、时空演化、叙事结构、人物关系等信息,极大地拓展了数字人文研究的深度和广度。
2.3 档案大数据支撑下数字人文研究技术方法创新
档案大数据与数字人文研究的融合,正在催生新的技术方法。跨媒体、跨语言、跨文化的数据整合是档案大数据环境下数字人文研究的重要创新方向。首先,通过多模态信息融合、本体知识关联、语义链接等方法,能够实现不同来源、不同类型档案数据的关联整合,促进跨文化档案资源的共享与协同利用。其次,基于知识图谱的语义分析与推理是档案大数据赋能数字人文研究的另一重要路径。在数字人文研究中,知识图谱可用于人物、事件、观念等要素的语义链接,助力学者发现文献间的隐性关系与演化规律。再次,虚拟现实、人机交互等新兴技术在档案大数据支撑下的数字人文研究中也得到创新应用。数字人文强调人文内容的沉浸式体验与交互式阐释,虚拟现实、增强现实等技术为数字人文内容呈现提供了新的表现形式。在档案大数据时代,创新应用虚拟现实、人机交互技术,将极大地提升数字人文研究成果的传播效能和社会影响力。
3 档案大数据环境下数字人文研究的应用实践教学
3.1 档案大数据环境下数字人文研究的课程设置
档案大数据环境下,数字人文课程设置需紧密结合大数据时代特点,构建科学合理的课程体系。在理论课程设置方面,重点开设数字人文导论、数字人文研究方法论等奠基性课程,系统阐述数字人文的发展脉络、理论体系和研究范式,帮助学生理解数字人文的内涵要义、学科属性与发展前景。同时,还应开设数据科学基础、编程语言、数据库原理等技术理论课,夯实学生的计算机应用与数据分析理论基础。在实践课程体系构建方面,应开设数据采集、数据预处理、数据可视化等大数据采集与处理方面的实训课程,培养学生利用爬虫、数据清洗、统计绘图等工具获取和处理结构化、非结构化数据的技能[3]。在数字人文研究方法应用方面,可围绕文本分析、社会网络分析、空间分析等数字人文研究方法,设置相应的实践课程,指导学生应用Gephi、QGIS等数字人文研究工具开展相关案例分析,提升学生的实践能力。
3.2 档案大数据环境下数字人文研究的教学模式创新
首先,可通过设置贴近档案大数据应用实践的研究项目,引导学生在项目实践中掌握数字人文理论知识和技术方法,提升实践能力。以档案大数据文本分析项目为例,教师可拟定特定历史时期的重要档案文本,要求学生运用文本挖掘、主题建模等方法,分析档案文本内容,挖掘历史文化知识,并形成可视化分析报告。其次,通过选取典型的数字人文研究案例,引导学生剖析案例的理论基础、技术路线、实践效果,加深对数字人文研究全流程的把握。再次,借助慕课、微课等在线教育形态,有效拓展数字人文教育的时空边界,为更多学习者提供优质开放的教育资源。
3.3 档案大数据环境下数字人文研究的人才培养目标
在档案大数据时代,开展大量的数字人文研究亟须高质量的复合型、应用型、创新型人才。因此,在人才培养目标指引下,档案大数据环境下的数字人文教育必须坚持厚基础、重实践、促创新的培养理念。在夯实数理基础和人文基础的同时,注重实践能力培养,强调动手操作、项目实训,突出创新意识和创新能力的塑造[4]。基于此,可从以下几个方面推进数字人文创新型人才培养:一是优化人才培养方案,科学设置理论课程和实践课程的比例,加强实践教学环节;二是创新教学模式,广泛应用项目驱动、案例分析等教学方式,提升学生的实践能力;三是完善创新创业教育,通过举办与数字人文相关的创新大赛、创业沙龙等活动,激发学生的创新潜能;四是加强校企、校际之间的合作,为学生提供更多实习实践机会,拓展其数字人文专业视野。
参考文献
[1]陈雪燕,于英香.从档案管理走向档案数据管理:大数据时代下的档案管理范式转型[J].山西档案,2019(5):24-32.
[2]孙大东,张丽华.档案参与数字人文工作的SWOT分析[J].山西档案,2020(4):34-40.
[3]景晓悦.全球化视野下的数字人文教育:来自欧美的实践启示[J].山西档案,2024(5):100-102.
[4]王楠.数智赋能的高校人文教育策略转型研究[J].山西档案,2024(5):110-112.
【基金项目】2023年度开封地区哲学规划调研课题“以开封盘鼓分析开封宋文化品牌发展现状与对策研究”(课题编号:ZXSKGH-2023-0743)。
【作者简介】杜蕊(1988—),女,汉族,河南开封人,开封文化艺术职业学院学前教育学院讲师,硕士 ,研究方向:舞蹈、学前教育。