数字史料库建设的若干关键问题探讨

发布时间:2024-10-31 07:12:04被阅览数:77 次信息来源:《山西档案》

  作者:陈英哲
  摘要:数字史料库建设是数字时代档案事业转型发展的重要抓手。纵观国内外发展现状,数字史料库建设在推动档案资源开放共享、革新学术研究范式等方面取得了显著成效,但是仍然面临诸多函待解决的关键问题。在梳理既有研究的基础上,立足数字人文背景,围绕技术应用、资源整合、学科服务3个维度,系统剖析了数字史料库建设的关键问题,并提出了应对策略。
  关键词:数字史料库;数字人文;学科服务
  随着信息技术的迭代升级和数字人文的蓬勃兴起,将档案史料数字化并建设数字史料库已成为档案界的重要任务和广泛共识。一方面,档案史料蕴含着丰富的历史文化遗产和社会记忆,需借助现代技术践行其保护与传承使命;另一方面,海量数字史料也为深化学术研究、拓展知识服务范围提供了数据资源支撑。《“十四五”全国档案事业发展规划》明确指出,“加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,推动数字档案馆(室)建设优化升级。”这为数字史料库建设指明了发展方向和路径。然而,数字史料库建设不仅涉及技术应用,更关乎资源整合、学科服务等诸多方面,目前仍然存在不少呕待探讨和解决的问题。对数字史料库建设的关键问题进行系统梳理,对于推动数字史料库建设高质量发展具有重要意义。
  本文拟在梳理前人研究成果的基础上,立足数字人文背景,围绕数字史料库建设这一核心议题,从技术应用、资源整合、学科服务3个维度切入,剖析数字史料库建设的关键问题,并探讨解决思路;旨在推动档案资源开发利用从数字化向智慧化跃升,引领档案学科与相关学科实现创新发展,为人文社会科学研究提供坚实的基础支撑。
  1  数字史料库建设的技术问题探讨
  1.1  数字化标准与规范
  统一规范的元数据方案是实现数字史料管理、检索、交换的前提和基础。目前,国际档案界已形成一批通用的元数据标准,如ISAD(G)、EAD等。但是这些标准大多源自传统档案编目,在适应数字史料特点、满足数字人文需求等方面仍显不足,函需在继承基础上创新发展。同时,档案数字化还涉及诸如数字对象命名、扫描参数设置、文件格式选择等一系列技术规范问题。制定科学合理的规范,既是保障数字史料质量的需要,也是实现数据互操作、开放共享的基础。但是目前相关标准规范仍不统一,各机构在实践中也缺乏有效的指导。
  为此,应该在广泛调研的基础上,制定统一权威、简明实用的数字化技术规范体系。例如,程妍妍等[1]学者采用功能分析的方法,建立我国数字档案馆标准规范体系框架,提出应当根据新时代、新对象的管理特点不断扩展内容,提出、研究、制定具有前瞻性的标准规范。
  1.2  数据采集与处理技术
  史料种类繁多,形态各异,数字化采集需要考虑多源异构问题。同时,很多史料年代久远,纸张泛黄,字迹模糊,给文字识别带来困难。数字化后的原始图像、音视频等数据量更是庞大,给存储管理和在线访问带来了一定压力。因此,数字史料库建设函需在多模态数据融合、OCR识别、自动标引、本体构建等方面取得技术突破。目前,一些学者已开始探索人工智能技术在数字档案开发利用中的应用。利用深度学习技术,可实现低质档案影像的智能修复与识别,构建档案知识图谱,支持语义检索和关联发现等[2]。
  1.3  系统架构与功能设计
  传统的史料管理系统大多采用集中式架构,侧重日常事务管理,难以适应数字人文环境下的资源整合、知识服务等新需求。目前,一些学者提出通过整合大数据、云计算、虚拟现实等新技术,建设智慧档案馆,提供用户体验。例如,任越等[3]学者认为,智慧档案馆是将“以人为本”理念深入融合到知识服务的各个环节中的机构形态,服务环节设计注重便捷性,服务过程以用户为中心,提供的知识服务产品契合用户需求;并且分析了智慧档案馆知识服务的特点和构成要素,以改善用户服务体验和提高档案馆知识服务能力。
  1.4  数据安全与知识产权保护
  随着数字史料的开放共享,数据安全和知识产权问题日益凸显。一方面,数字史料承载着机密、隐私等敏感信息,公开发布可能带来安全隐惠;另一方面,数字史料的网络传播也加剧了盗版侵权风险,函需完善知识产权保护机制。
  对此,技术和制度两个层面均需要齐头并进。技术上,应该采用访问控制、数字水印、同态加密等技术手段,强化身份认证和权限管理,防止敏感信息泄露,建立区块链存证机制,以便追踪数据来源,打击盗版侵权行为。制度上,应该明晰档案数字版权归属,完善开放许可协议,在有限开放与版权保护之间取得平衡;加强立法执法,营造良好的知识产权保护环境。
  2  数字史料库建设的资源整合问题探讨
  2.1  不同类型史料资源的异构整合

  史料的内容和形式呈现出多样化特征,既有文书、图纸等纸质类史料,也有录音、视频等音视频类史料。不同类型史料在载体、格式、内容、著录等方面存在较大差异,因此,采用统一的数字化整合方式难以深度发掘其价值,这为史料资源整合带来了一定挑战。同时,传统的史料整理方式大多围绕文本展开,对非文本史料缺乏足够重视。而在数字人文背景下,音频、实物等非文本史料的学术价值日益凸显,如何将其与文本史料有机融合,建立关联,实现一体化管理、检索和展示,成为一个函待解决的问题。
  近年来,语义网、本体库等新技术为异构数据整合提供了新思路。王志宇等[4]学者探讨如何利用关联数据及相关技术,实现语义网环境下数字档案资源管理与共享模式,以解决由数字档案资源分散、多样、异构造成的“资源孤岛”现象。
  2.2  地域性史料资源的区域联合
 
 史料具有鲜明的地域特色,反映着特定区域的历史变迁和文化风貌。然而,受行政区划、管理体制等因素的制约,地方史料资源分散保存在不同馆库,缺乏系统的整合,导致历史连续性和完整性的割裂现象。
  数字技术为打破地域藩篱、实现区域联合提供了可能。通过建立区域档案资源中心,可以统筹规划区域内数字史料库建设,实现元数据共享、异地备份、馆际互借等业务协同,不仅有利于史料资源的永久保存与异地利用,还能为区域性历史研究提供更加丰富、完整的资料支持。
  2.3  公私机构史料资源的社会协作
  除政府机关外,大量珍贵史料还分散保存在高校、科研院所、企事业单位、社会团体等不同类型公私机构中。随着开放、共享理念逐渐深入人心,越来越多公私机构意识到数字化开放的重要性,纷纷通过自建平台、捐赠等方式参与数字史料库建设,为打破部门壁垒、实现社会协同提供了广阔空间。
  政府可充分发挥政策引导和统筹协调作用,制定档案开放共享的法规制度和标准规范;档案部门可为社会机构提供数字化指导和业务培训:高校、企业可贡献技术、人才、资金等创新资源;社会力量可广泛参与数字化志愿服务。通过多方协同形成开放包容、合作共赢的数字档案生态体系,这将有利于提升数字史料库的社会价值。
  2.4  跨国界史料资源的国际合作交流
  档案史料的产生和流转不以国界为限。海外档案中有大量中国相关史料,反之亦然。尽管跨国界档案史料对于学术研究同样具有重要价值,但受语言、政治、文化等诸多因素的影响,各国档案史料交流合作仍面临诸多障碍。
  为此,应进一步加强与国际档案界的多边互动,积极参与制定数字档案国际标准规范,主动融入全球档案史料数字化进程;同时,还要拓展与周边国家的双边合作,聚焦双方共同关心的历史议题,开展联合数字化项目,实现优势互补、成果共享。
  3  数字史料库建设的学科服务问题探讨
  3.1  多学科背景下的史料描述
  档案学与历史学、政治学、社会学等诸多人文社会学科关系密切,数字档案资源的开发利用也呈现出明显的跨学科特点。然而,传统档案编目大多围绕档案学理论展开,缺乏多学科视角,难以充分满足其他学科研究的需求,制约了数字史料库的学术应用。
  在数字人文时代,突破学科藩篱,以开放包容的姿态拥抱多元用户,已成为数字史料库建设的时代要求。未来,在史料著录和内容揭示方面,应充分吸收不同学科的学术概念、术语体系,设置多维检索点,实现“一件史料,多重描述”。通过引入学科本体、构建多元主题词表等手段可有效支撑跨学科背景下的资源发现和知识关联。
  3.2  面向研究过程的功能拓展
  传统档案工作大多将档案保管和利用视为两个割裂环节,数字档案系统的功能设计也多侧重检索浏览,对学术研究过程缺乏深入支持。事实上,从课题设计、资料收集到内容分析、成果呈现,研究工作贯穿始终,需要数字史料库提供个性化、一站式精准服务。
  为此,数字史料库建设应该强化以用户为中心的思维,从研究流程出发,拓展功能,优化体验。比如,嵌入学术趋势分析、研究课题推送等功能,为研究选题提供智力支持;整合网络学术资源,为文献综述提供一站式服务;开发在线学术工具,支持文本标注、数据分析等研究活动;设置研究工作空间,实现资料的云端管理和团队协作管理;搭建学术交流社区,促进思想交流和跨学科对话。
  3.3  知识关联挖掘与学术评估
  海量数字史料资源的积累为开展数据驱动的学术研究奠定了基础。利用大数据技术,对数字史料进行深度开发利用,挖掘潜在新知识、新规律,形成新学术增长点,是数字史料库服务学术研究的重要方向。
  一方面,可利用数据挖掘、知识图谱等技术,在大规模异构史料数据中发现新的关联,揭示事物内在联系,为学术研究提供新的切入点和观察视角。另一方面,可基于史料大数据开展引文分析、社会网络分析等计量学研究,刻画学术演进脉络,评估学术影响力,为科研管理决策提供参考。
  3.4  人才培养与学科发展
  数字技术发展和学术研究范式变革对档案人才能力提出了新的要求。为此,高校档案学教育应顺应数字人文发展浪潮,加快人才培养模式变革。在课程设置上,高校应强化数字素养教育,增设数据科学、程序设计等课程;推行跨学科培养,鼓励学生选修相关学科课程。在教学方式上,高校应引入项目制学习方式,搭建产教融合平台,让学生参与数字史料库建设项目,在实践中实现自我提升。同时,档案学研究生教育还应强化学术训练,引导学生利用数字史料开展前沿研究,培养高层次、高水平创新人才。
  人才培养与学科发展相辅相成。推动档案学科数字化转型,需要加大学科宣传推广力度,提升学科的社会影响力。数字史料库作为新型学术基础设施应成为展示档案学科魅力、吸引青年学子的重要窗口。通过开办数字人文工作坊、发布前沿学术成果等方式可有效增强档案学科对相关学科的辐射带动作用。
  同时,档案学界还应积极参与、主导数字人文学术对话,加强与图书情报、历史、计算机等学科的协同创新,推动档案学研究范式的革新,开拓档案学知识体系的新疆域。可以预见,数字技术将为档案学科发展和数字史料库建设注入新的活力,开启斩新的发展篇章。
  4  结语
  本文在梳理既有研究的基础上,围绕技术应用、资源整合、学科服务3个维度,提出了数字史料库建设的相应建议对策,具体内容如下。
  在技术应用方面,需要准确把握数字历史大数据的特点,积极采用语义网、大数据、区块链、人工智能等前沿技术,创新元数据标准规范,优化系统架构功能,强化数据安全保障,打造开放融合、智能泛在的新型数字档案服务生态。
  在资源整合方面,要打破“资源孤岛”,消解体制藩篱,在多层级、多类型、跨部门、跨国界间建立协同机制,形成政府主导、社会参与的档案资源共建共享格局,充分彰显档案的史料价值和社会功能。
  在学科服务方面,应顺应数字人文潮流,拓展多学科视野,优化面向研究过程的功能,强化知识关联挖掘和学术评估,推进学科融合和范式创新,加快复合型创新人才培养,以全方位、精准化的学术服务推动相关学科发展。
  未来,数字史料库建设要坚持以需求为导向、以开放为特征、以融合为主线、以创新为动力,在传承中发展、在发展中创新,推动档案资源开发利用从数字化向智慧化跃升,引领档案学科与相关学科实现创新发展,为人文社会科学研究提供坚实的基础支撑。
  参考文献
  [1]程妍妍,李圆圆.我国数字档案馆标准规范体系研究[J].档案学通讯,2014(6):53-57.
  [2]李欢,施瑞婷,张洁:人工智能在档案资源开发利用中的应用分析[J]山西档案,2021(2):71-78.
  [3]任越,问宇鹏,智慧档案馆知识服务的构成要素及服务层次探析[J].山西档案,2021(3):15-23.
  [4]王志宇,熊华兰:语义网环境下数字档案资源关联与共享模式研究[].档案学研究,2019(5):114-119.
  【作者简介】陈英哲(1981一),女,蒙古族,内蒙古呼伦贝尔人,呼伦贝尔学院旅游地理与历史文化学院讲师,硕士,研究方向:历史文献学及中国古代史。