发布时间:2024-11-12 07:56:18被阅览数:74 次信息来源:《山西档案》
作者:艾丽菲亚·艾克拜尔
摘要:少数民族口述档案是中华民族历史记忆的重要载体。大数据时代下,少数民族口述档案信息资源呈现出类型多样化、获取方式多元化、内容时效性强等特点。大数据技术应用和思维影响深刻改变着口述档案资源管理模式。结合大数据理念和技术,从顶层框架设计、创新资源获取方式、建立元数据标准等方面入手,构建科学完善的少数民族口述档案信息资源体系,旨在推动口述档案资源的深度整合与创新应用,为传承弘扬中华优秀传统文化、服务国家文化治理现代化提供坚实的历史文化基础。
关键词:少数民族;口述档案;信息资源;大数据;元数据
2018年,我国颁布了关于口述档案采集的行业标准《口述史料采集与管理规范》(DA/T59—2017),该标准对口述史料采集规划、采集流程、史料管理等都进行了整体性规范,对口述档案的存与用具有一定的现实指导作用[1]。党的十八大以来,以习近平同志为核心的党中央高度重视口述历史和口述档案工作。习近平总书记在党的十九大报告中指出,要加强文物保护利用和文化遗产保护传承,加强各民族交往交流交融,继续打造中华文化新名片。为加强新时期口述档案工作指明了方向。
少数民族口述档案是中华民族历史记忆的重要载体,对传承和弘扬中华优秀传统文化、增强中华民族共同体意识具有不可替代的作用。在大数据时代背景下,亟须创新少数民族口述档案的资源建设模式,充分运用现代信息技术手段,全面提升少数民族口述档案的管理和服务水平。加强大数据时代下少数民族口述档案信息资源体系建设,对于传承和弘扬少数民族优秀传统文化、服务国家文化治理体系和治理能力现代化、促进档案学理论与方法创新具有重要意义。它有助于打通少数民族文化传承的“最后一公里”,通过口述档案资源的数字化采集和多样化呈现,让濒危的少数民族语言、习俗、技艺等得到及时记录和抢救,激发少数民族文化的生命力;有助于创新国家文化治理的方式方法,通过少数民族口述档案资源的汇聚整合和深度利用,促进多民族历史记忆的交流互鉴,为民族区域自治地方文化治理、民族事务治理提供坚实的历史文化基础;有助于丰富档案学的研究领域、拓展研究视野,在少数民族口述档案信息资源体系建设实践中,探索口述档案文本分析、口述档案大数据管理、数字人文研究等理论方法创新,推动档案学学科体系的完善和发展。本研究拟从大数据视角切入,围绕少数民族口述档案信息资源体系建设,通过分析大数据时代下少数民族口述档案信息资源的特点,探讨少数民族口述档案信息资源体系的构建路径。
1 大数据时代下少数民族口述档案信息资源特征分析
少数民族口述档案是以少数民族的口头叙述为主要内容,以录音、录像、文字等多种形式记录并保存少数民族历史文化信息的特殊档案。与传统文本档案相比,口述档案更侧重于记录普通个体或群体的生活经历、价值观念、情感态度等主观性信息[2]。大数据时代下少数民族口述档案信息资源有如下特征。
1.1 资源类型呈现多样化
从载体形式看,口述档案资源可以是文本、图片、音视频等多种形态,其中音视频类口述资源的比重日趋增大。从内容类型看,既有以口述当事人为主的个人口述史料,又有以特定群体为对象的群体口述史料;既有反映少数民族宏观历史进程的口述资料,又有聚焦少数民族具体生活场景的口述资料;既有常态性采集的日常口述记录,又有针对特定历史事件开展的专题口述记录。此外,随着网络和数字技术的发展,一些少数民族口述档案开始向网络化、数字化方向转变,多以数据库、专题网站等形式呈现,资源类型更加丰富多元。
1.2 资源获取方式多元化
大数据时代背景下,少数民族口述档案资源的获取方式日趋多元化。传统的获取方式主要是实地考察,通过面对面访谈、田野调查等方式获取口述资料。而在大数据时代,口述档案资源获取呈现出线上线下相结合的趋势。线下获取渠道进一步拓宽,除专业研究机构外,一些社会组织、民间团体、社区和个人也开始参与口述档案的征集工作;线上获取方式不断创新,通过网上问卷调查、远程视频访谈、在线人工智能等新方式与新技术,突破时间和空间限制,扩大口述对象的覆盖面。同时,一些研究者还开始尝试从网络自媒体、社交平台、数字遗产等新型数据源中发掘口述档案资源,通过数据挖掘、文本分析等技术提取有价值的口述信息。
1.3 资源记录内容时效性强
首先,口述档案资源的形成与记录是同步的,能够及时反映少数民族社会生活的最新状态,特别是借助数字化手段,口述资料可以快速、动态地生成与更新,有助于捕捉少数民族文化的发展变化。其次,口述档案资源的传播速度快,数字化的口述资源可以通过网络平台、移动终端等设施得以快速分享传播,缩短了口述资源从产生到利用的时间周期。最后,口述档案资源的利用效率高,全文检索、关联分析、可视化呈现等各种数字化工具,可以帮助用户快速找到所需信息,提升资源利用的时效性。
1.4 资源真实性与可靠性需要甄别
少数民族口述档案以口述者的亲身经历和主观认知为基础,记录了鲜活生动的第一手资料,具有较高的真实性。与官方文献记载相比,口述档案更能反映少数民族普通大众的真实生活状态和价值观念,有助于还原历史的本来面貌。然而,口述档案资源也存在一定的主观性和不确定性,可能出现被遗忘、被误解、被夸大、相矛盾等情况,因而资源的可靠性有待甄别。在大数据时代,海量的口述资源及其多样化的表现形式,对资源的真实性审核和可靠性判断提出了新的挑战,需要研究者审慎对待。可通过求证和比对等方法严格筛选,从数量和质量两个维度入手,在发掘更多真实可靠的口述档案资源的同时,提高对现有口述档案资源的分析利用水平。
2 大数据时代对少数民族口述档案信息资源的重要意义
2.1 大数据技术对少数民族口述档案信息资源管理的影响
大数据技术的应用为少数民族口述档案信息资源管理提供了新的手段和工具。首先,大数据采集技术突破了传统口述资料获取方式的时空限制,海量的音视频、文本、图片等非结构化数据可以通过数字化转化纳入口述档案资源库,极大地拓展了少数民族口述档案的数据来源;其次,大数据存储技术有效解决了少数民族口述档案电子化后海量异构数据存储的难题,分布式存储、云存储等技术提高了口述档案数据存储的安全性和可靠性;再次,大数据处理技术为口述档案资源的自动化加工、整合与分析提供支撑,语音识别、自然语言处理等人工智能技术可以快速、智能地对非结构化口述资料进行转写标引,知识图谱、语义链接技术可将多源口述数据关联融合,形成语义化的少数民族口述知识库;最后,大数据可视化技术创新了口述档案资源的展示与传播方式,动态信息图表、数字人文地图等为公众理解和利用少数民族口述档案资源提供了新的表达方式[3]。
2.2 大数据思维对少数民族口述档案信息资源管理的影响
大数据不仅是一种技术手段,还蕴含着一种全新的资源观和方法论。大数据思维引领下,少数民族口述档案信息资源管理理念和模式发生了深刻变革。一是强调口述档案资源开发的需求导向,通过分析利用大数据,深入洞察用户需求,为少数民族文化传承与学术研究提供精准智能的口述档案服务;二是推动口述档案资源管理从被动式存储向主动式揭示转型,充分发掘口述大数据的关联价值和预测价值,为中华民族伟大复兴提供文化基因库、思想资源库和智力支持;三是倡导综合集成的口述档案资源建设理念,加强口述档案与其他相关数据资源的融合共享,推动口述档案资源的跨界应用与创新利用;四是引入数据驱动的口述档案学研究范式,充分利用数据科学的理论与方法,对少数民族口述大数据开展多学科交叉研究,拓展口述档案学的学术外延。
3 少数民族口述档案信息资源体系的建设路径
3.1 构建科学合理的资源体系框架
建设少数民族口述档案信息资源体系要从顶层设计入手,构建一个科学合理的资源体系框架。资源体系框架应体现出系统性、完整性、针对性和可扩展性的特点。从系统性看,要统筹兼顾口述档案资源建设的各环节,形成采集、整理、编目、保管、鉴定、利用等一系列规范[4];从完整性看,要全面涵盖各少数民族的口述档案资源,不同历史时期、不同地域区域、不同类型载体的口述资料都应纳入资源体系;从针对性看,要充分考虑少数民族口述档案资源自身的独特属性,在资源标引、文本解读、版权保护等方面制定有针对性的规范;从可扩展性看,要立足少数民族口述档案事业的长远发展,资源体系框架要能够适应信息技术的更新换代,以开放灵活的方式吸纳新的资源类型。
3.2 创新口述档案信息资源的获取方式
丰富多样的资源获取渠道是做好少数民族口述档案信息资源建设的关键,须立足传统获取方式,积极拓展新的获取途径,做到线上线下协同发力、多管齐下。线下获取渠道要继续深入少数民族聚居区,开展实地口述采集工作,加强与少数民族群众的面对面交流,挖掘口述线索;整合社会资源,借助青年志愿者、“村头理事”等社会力量参与口述档案的联合征集;强化部门协作,推动党史、地方志、文化馆、非遗保护等部门与档案部门的资源共建共享。线上获取渠道要善于运用网络问卷、视频访谈、虚拟人等数字化采集手段,扩大受众参与面;积极开展面向少数民族网络社群的专项口述征集,利用微信、微博、短视频等新媒体平台吸引少数民族的民众参与口述内容的生成;探索利用大数据分析和自然语言处理技术,从海量网络数据中自动发现并提取有价值的少数民族口述信息;注重线上资源与线下资源的有机整合,推动实体口述档案的数字化转化,用好网上资源反哺实地采集工作。
3.3 建立口述档案元数据标准
元数据是支撑口述档案资源组织管理和揭示利用的重要工具,科学规范的元数据标准是高质量建设少数民族口述档案信息资源体系的关键因素。一方面,要制定全面系统的口述档案著录元数据标准,涵盖口述资料的采集、内容、载体、保管、版权等各方面要素,规范不同类型口述档案资源的元数据项。著录粒度要立体多元,包含顶层设置资源集合层、口述项目层的概括性元数据,中间设置口述记录层、口述片段层的细节性元数据,底层设置口述文本、音视频对象层的对象级元数据。著录格式要兼容开放,既要与档案界通行的EAD、ISAD(G) 等标准相衔接,又要借鉴都柏林核心元素集、MODS等图书情报界的通用标准。另一方面,要发展面向用户需求的检索利用元数据规范,从用户视角实施口述档案资源的主题标引、知识标注、情感标注等,增强元数据的语义化、知识化表达能力。标引词表要在中国分类主题词表的基础上,融入少数民族特色本土词汇,增强标引适用性。同时,探索引入知识图谱、本体构建等语义关联技术,增强口述档案元数据的机器可读性,提升口述资源的检索查询和关联发现能力。
4 结语
本研究围绕大数据时代下少数民族口述档案信息资源体系建设展开一系列探索。未来,少数民族口述档案信息资源建设大有可为,可从以下几方面进行研究:进一步拓宽民间社会的口述资料征集渠道,创新线上线下相结合的资源获取模式;运用语义关联、知识图谱等大数据技术,增强口述档案元数据标引的深度和广度;探索口述档案资源与其他文献、档案、文物等相关资源的链接融合,构建综合集成的少数民族文化大数据库;加强分析研究面向人文学科的口述大数据,促进历史学、民族学、人类学、语言学等学科领域与大数据科学、档案学的交叉创新;充分发挥少数民族口述档案资源在民族文化传承、民族地区历史研究、国家文化治理等方面的基础性作用,为铸牢中华民族共同体意识,推进中华民族伟大复兴贡献智慧和力量。
参考文献
[1] 王向女 , 邱怡璇 . 基于标准化流程设计的口述档案真实性保障研究 [J]. 山西档案 ,2021(2):14-24.
[2] 张锦 . 口述档案,口述传统与口述历史 : 概念的混淆及其成因 [J]. 山西档案 ,2019(2):5-22.
[3] 周林兴 , 林凯 . 大数据时代档案数据质量治理 : 因素、框架和路径 [J]. 档案学研究 ,2023(2):111-119.
[4] 金波 , 添志鹏 , 杨鹏 . 大数据时代档案数据治理运行机制建构 [J]. 档案学研究 ,2023(4):65-73.
【基金项目】国家社会科学基金民族学青年项目“现代化视阈下帕米尔高原多民族村落互惠共生机制调查研究”(项目编号:23CMZ030)。
【作者简介】艾丽菲亚•艾克拜尔(1994—),女,维吾尔族,新疆乌鲁木齐人,中央民族大学民族学与社会学学院博士在读,研究方向:民族历史文化。