发布时间:2025-03-24 08:34:23被阅览数:84 次信息来源:《中国档案》
作者:宋宇
档案数字资源是国家和民族记忆的重要组成部分,在文化传承、社会发展、民生服务、科学研究等方面具有突出作用。国家对档案数据安全高度重视,在《中华人民共和国档案法》及其实施条例中均要求做好数据备份工作,为档案数字资源长期安全保存提供保障。2024年11月,国家档案局发布行业标准《档案数字资源备份实施规范》(DA/T99—2024),提出档案数字资源备份实施的相关要求。中国第一历史档案馆(以下简称“一史馆”)作为国家级档案馆,经过10余年大规模档案数字化工作,目前已形成800余万件档案数字资源。为做好馆藏档案数字资源的安全存储,一史馆自2013年开始通过多套、异质、异地备份的方式开展档案数字资源备份工作,形成了一套较为成熟的工作模式。笔者将结合DA/T99—2024要求及一史馆工作实际,探讨档案数字资源备份工作的策略制定、组织实施与问题对策。
备份的组织与管理
1.明确备份组织实施部门
DA/T99—2024要求建立职责明确、保障有力的档案数字资源备份工作机制和工作组织,统筹规划和实施档案数字资源备份工作。在档案馆的管理实践中,从备份工作技能要求和设施设备配备来看,一般由单位信息化部门或档案数据管理部门负责该项工作。一史馆由数据处负责档案数字资源备份工作,具体工作内容包括制定档案数字资源备份规划、备份策略、管理制度以及具体工作的组织实施。
2.明确备份对象,制定备份规划
根据馆藏档案数字资源的重要性,研究确定哪些数据需要备份,采用何种载体介质,备份几套数据,是否需要进行异地备份以及备份载体的存放空间等,并据此制定备份规划。一史馆内设有存储服务器机房、近线存储机房,采用磁盘阵列、大型磁带库和光盘库,通过多套、异质的备份形式开展备份工作,大部分数据资源备份2套以上,存于馆内机房和磁带光盘库房。
3.制定备份管理制度
为规范开展档案数字资源备份,应建立科学的管理制度,明确备份管理责任、备份工作流程、安全管理要求、演练与恢复等。一史馆自开展大规模档案数字化工作以来,建立《馆藏电子数据磁带备份工作规范》《馆藏档案电子数据安全管理规定》等规章制度,明确备份工作的责任分工、备份对象、备份套数、备份存储策略命名规范、安全管理要求,制定“数据接收、校验、备份流程图”,编制《出库申请单》《出库磁带号详表》《出库回库明细表》《异地备份作业详单》等系列表格,理顺和规范备份业务工作流程。同时,定期开展备份载体检测和恢复演练,对于达到生命周期拟报废的敏感信息载体委托专门的销毁机构进行销毁。
4.备份对象及载体选择
对于综合档案馆,备份对象包括档案管理系统和档案业务系统的数据库、档案目录、档案数字化图像、档案全文数据等,优先选择需永久或长期保存的档案数据。确定备份对象后,针对备份对象特点和需求选择与之匹配的硬盘、磁带、光盘等载体进行备份,并确定备份套数。一史馆馆藏的明、清两代政府档案均为永久保存,采用多套、异质、异地的方式开展档案数字资源备份工作。其中,档案数字化产生TIFF和JPG两种格式的图像,TIFF格式图像为典藏级数据,采用数据磁带备份1套正本和1套副本,另采用蓝光光盘备份1套副本。JPG格式图像为利用级数据,采用磁盘阵列保存1套正本和1套副本,另采用数据磁带和蓝光光盘各保存1套副本。为防范突发灾害,一史馆将1套TIFF格式磁带副本和1套JPG格式蓝光光盘副本运送到位于陕西省的异地备份库房保存,作为灾备数据。此外,对档案管理系统和业务系统的数据库、目录数据、全文数据等通过磁盘阵列和数据磁带2种载体进行备份,备份套数不少于2套。
5.备份系统建设
档案数字资源的备份主要依托系统备份功能和专业备份软件开展。数据库数据和档案管理系统内数据可以通过数据库备份工具、系统备份功能进行备份。对于非结构化数据,可以通过爱数、鼎甲、浪擎、Commvault等备份软件进行备份,并进行存储。一史馆档案信息管理平台等业务系统的数据通过数据库备份软件和系统备份功能备份,存于磁盘阵列并备份到数据磁带;对于档案数字化图片等非结构化数据资源通过CommvaultSimpana9.0软件存储于磁盘阵列、磁带等载体上。
6.备份设备准备
根据备份规划和备份策略,选择相应的备份设备,主要包括磁盘阵列、蓝光光盘库、磁带库、磁光电备份一体机、离线硬盘柜等设备,同时要考虑备份软件的兼容性。一史馆采用华为Ocean Stor 5510存储、昆腾I9000大型磁带库、星震BD8640蓝光光盘库等作为主要的数据备份设备,磁带库和蓝光光盘均内置机械臂和多驱动器,设定备份任务后,自动高效执行备份作业。
备份策略制定与实施
1.备份策略制定
(1)备份目标
采用具有通用普遍性、可持续性、技术非垄断的方案,并设立校验环节,保障备份数据的完整性、一致性、可恢复性,保证档案数字资源的长期安全保存。
(2)备份形式选择
根据备份需求,综合选择在线备份(磁盘、磁盘阵列)、近线备份(磁带库、磁光电一体机)、离线备份(光盘库、硬盘柜)等方式开展备份。对于重要的数据采取多套异质备份和异地备份。
(3)数据组织与存储策略名命名
为科学有效管理大量备份数据,对备份对象数据的组织可以以“全宗-档案门类(含二级类或项目)-卷”“全宗-档案门类·年度-保管期限-机构(问题)”等方式进行,根据管理需要对数据进行切块以便开展数据备份等工作。切块依据包括数据分类、存储载体容量等,切分好的数据以介质组为单位进行存储备份并编制相应目录。备份存储策略名称可结合备份数据组织和数据格式来编制。一史馆的做法是将一类数据组织成一个备份集合,为这个备份集合按照规则编写一个存储策略名称,并通过台账记录该备份集中所有备份子集的数据案卷范围、磁带数量、数据量、文件类别及副本号。备份集合存储策略的命名规则为“加工公司名称(拼音)_数字化期数_全宗类别_格式类别_副本号”。例如,A公司加工的第3期礼科题本数字化图像数据备份集的存储策略名称为“A_3_LiKeTiBen_TIFF2_Backup”,该数据集中包括的档案范围为“02全宗-02类-001项(000001—000091)卷”档案。
(4)备份校验方案制定
数据备份完成后,需对备份数据进行校验以确保数据备份的完整性、一致性。一史馆备份校验采用数字摘要码比对的方式。在备份前对备份对象每个文件或文件包采用SM3、MD5等算法计算数字摘要码,数据备份完成后,将备份的数据回滚到硬盘上再次计算数字摘要码并比对,如果两个码值一致则证明备份数据完整且一致。
2.备份实施与校验
备份数据准备就绪后,按照备份工作计划和管理规范开展数据备份,并对备份过程进行监督,监控备份任务执行情况。备份任务完成后进行校验,校验一致则该备份工作完成,记录备份情况,形成备份工作数据台账,包括备份人、备份完成时间、备份对象情况等。
3.载体出库与入库
对于采用数据磁带、蓝光光盘等进行备份的载体,设备库体内达到一定数量后,需要对载体执行出库操作。出库后将载体装盒贴签(数据磁带单独装盒,蓝光光盘可以单独装盒或采用高密度多片片匣保存)、编制台账表、登记出设备库体时间和存入库房时间,更新库房目录。
4.备份数据定期检测和恢复演练
每年对备份数据载体进行定期抽检,抽检比率不低于5%。检测内容主要包括载体外观、标签和数据可读性检测,通过将备份载体的数据回滚到磁盘中,对文件进行数字摘要运算,并与原摘要码值进行比对,如果一致则证明数据完好。也可通过工具软件对备份数据进行可读性检测。此外,依托系统备份软件进行的备份,每1—2年开展备份数据恢复测试和恢复演练。
不容忽视的问题与对策
1.备份环境的重新搭建
数据备份如果用到备份工具,需考虑在数据恢复的时候能够重新创建满足需求的备份环境,否则备份数据将面临无法恢复的问题。依托业务系统备份功能开展的备份,需要将系统的原安装文件、部署手册、系统安装配置需求等一同备份,在系统出现问题后,能够重新创建系统环境并恢复数据。依托爱数、鼎甲、Commvault等专业备份软件开展的备份,同样需要将该备份软件程序、密钥KEY、部署手册、操作说明、系统配置需求文件等一同拷贝备份,在本地系统或设备遭受重大破坏时,可重新搭建软件环境以实现数据可恢复。一史馆在本地机房和同城异地机房分别配置了一套磁带库、光盘库,实现硬件环境的互备,同时将安装程序等文件作为备份对象,实现软件环境的备份,从而保障备份数据可恢复。
2.异地备份数据的定期校验
本地备份数据的校验相对便捷,异地备份通常距离本地300公里以上,如何对异地备份数据按照规范要求进行定期校验成为一个现实问题。一史馆通过制作多盘测试数据磁带,随运送下批次备份数据磁带时分多次取回的方式进行定期数据校验。在向异地备份目的地运送数据磁带时,携带一定数量的测试数据磁带,回程时带回上一批次运送的部分测试磁带和本批次运送的部分测试磁带,回馆后进行文件数据摘要码运算并比对原来记录的码值,如码值一致则证明数据完好。下次运送时将测试带送回至异地备份目的地。
3.数据的迁移与软硬件被动升级
随存储技术升级迭代,原来的载体面临着被技术淘汰和老化的风险,数据载体要随着技术升级或生命周期规律而进行数据迁移。例如,LTO驱动器的数据读取只能向下兼容两代,之前采用的LTO4、LTO5格式的磁带要将数据回滚迁移到LTO6、LTO7或更先进的磁带上,以避免因设备淘汰而导致数据无法读出。此外,在驱动器等设备组件升级的过程中,要注意设备组件升级而被动带来的设备版本V码升级,并需提前测试设备版本V码升级后能否与备份工具软件兼容,做好充足测试和回退预案后再进行驱动器等设备组件的升级,确保备份数据可在新组件或设备新版本软件中能够顺利读出和恢复。
作者单位:中国第一历史档案馆
责任编辑:公喆