副省级以上综合档案馆档案数字资源备份工作调研与分析

发布时间:2024-07-16 20:12:21被阅览数:98 次信息来源:《中国档案》

  文/祝成

  档案数字资源备份工作是保障档案信息安全和档案信息系统业务连续性的重要措施之一。国家档案局高度重视此项工作,在《“十四五”全国档案事业发展规划》中明确指出要“完善备份机制,实现馆(室)藏全部档案数字资源完整备份,重要电子档案异地异质备份,积极探索备份新途径,加强备份工作全过程安全监控,切实保障档案数字资源安全”,为“十四五”期间扎实开展档案数字资源备份工作提供行动指南。

  为进一步掌握我国档案数字资源存储与备份现状,分析当前档案数字资源备份工作需求和存在的重难点问题,笔者所在项目组以问卷形式调研了全国47家副省级以上综合档案馆。

  总体情况

  1.问卷基本情况

  调研问卷设计25个问题,内容覆盖档案数字资源量、备份制度情况、备份对象范围、备份周期频率、载体与设备选择、问题与建议等诸多备份关键工作,面向47家副省级以上综合档案馆发放调研问卷,收回有效问卷42份。

  2.数据量情况

  40家(2家未提供此项数据)副省级以上综合档案馆馆藏档案数字资源总量约3166.86TB。其中,以档案数字化成果副本为主,数据量为2880TB,占调研的档案数字资源总量的90.94%;电子档案数据量为137.59TB,占调研的档案数字资源总量的4.35%;其余主要为资料类电子数据。馆藏档案数字资源总量达到100TB以上有8家,50TB以上有9家,10TB以上有15家。其中,馆藏档案数字资源总量最大的达531.05TB。

  3.制度建设情况

  42家副省级以上综合档案馆总体对档案数字资源备份工作较为重视,79%的档案馆制定了相关制度保障备份工作有序开展,62%的档案馆专题制定备份工作的办法、规定、方案指导该工作开展,部分档案馆还进一步细化备份管理模式,分别就在线备份和离线备份、本地备份和异地备份等方面单独建章立制。

  4.工作实施情况

  备份形式方面,42家副省级以上综合档案馆基本采用本地备份和异地备份结合、在线备份与离线备份互补的模式开展档案数字资源备份工作。技术路线的选择主要从各馆自身的档案数字资源量、设备应用方式、载体技术特点、成本与管理难度等角度综合考虑。

  备份对象方面,42家副省级以上综合档案馆均对档案目录数据和传统载体档案数字化成果进行备份,79%的档案馆对电子档案及其元数据进行备份,69%的档案馆对专题数据库进行备份,76%的档案馆对档案信息系统程序及其配置数据进行备份,50%的档案馆对档案信息系统的日志数据进行备份。

  备份套数方面,42家副省级以上综合档案馆的平均备份套数为3.71套,其中,26%的档案馆备份5套及以上数据,31%的档案馆备份4套数据,35%的档案馆备份3套数据。

  备份周期方面,半数以上档案馆明确了全量备份周期和增量备份周期,17%的档案馆不采用差分备份作为档案数字资源备份技术方案。在明确全量备份周期的档案馆中,38%的档案馆每年开展1次全量备份,25%的档案馆每年开展2次全量备份,17%的档案馆每月开展1次全量备份,另有8%的档案馆可每周开展1次全量备份。在明确增量备份周期的档案馆中,50%的档案馆每天开展1次增量备份,44%的档案馆每周开展1次增量备份,少数档案馆每月开展1次增量备份。此外,另有部分档案馆根据档案门类或重要程度制定不同的备份周期。

  备份设备与载体选择方面,98%的档案馆配有在线备份设备,95%的档案馆配有离线备份设备或载体。超半数档案馆选用磁盘阵列作为在线备份设备,部分单位还选用备份一体机、磁带库、光盘库等设备开展在线备份工作。离线备份采用的存储载体主要包括硬磁盘、磁带、光盘、缩微胶片,73%的档案馆选用硬磁盘(库)进行离线备份,56%的档案馆选用光盘(库)进行离线备份,39%的档案馆选用磁带(库)进行离线备份。41%的档案馆选择2种存储载体进行离线备份,17%的档案馆选择以上3种存储载体进行离线备份。另有36%的档案馆选用缩微胶片进行异质备份。

  异地备份方面,95%的档案馆明确了异地备份相关信息,43%的档案馆每2年进行1次异地备份,28%的档案馆每年进行1次异地备份。另有40%的档案馆已为下属市县区档案部门提供备份服务。

  薄弱环节

  1.顶层设计仍有不足

  《“十四五”全国档案事业发展规划》等顶层规划文件仅对档案数字资源备份工作提出了原则性要求,还缺乏更加完善、全面的顶层设计,主要表现在:

  一是宏观规划不足。尚未从国家高度对档案数字资源备份工作进行整体规划,缺乏相应的管理政策、整体工作安排和标准规范体系等。以馆际互备选址工作为例,该工作是一项综合考虑自然环境、交通、馆库条件等诸多因素的系统性工程,但目前仅有“相距300公里以上”“不属同一江河流域、同一电网、同一地震带”等基本要求,且各馆均在自愿结对的基础上开展备份工作,在缺少整体指导和专业评估的条件下,选址质量难以得到充分保证。

  二是政策支持不足。部分调研对象表示,档案数字资源备份工作面临资金不足、人才匮乏等问题,目前尚缺少相关专项政策保障各档案馆档案数字资源备份工作更好开展或支持各档案馆向其上级部门申请更多的人、财、物等基础保障。

  三是分散建设问题。档案数字资源备份工作投入较大,既需要投人大量资金用于基础设施建设和软硬件购置以满足其技术需求,又需要配备专业人员开展相关管理工作。各级档案部门分散开展档案数字资源备份工作,投资总量巨大,在一定程度上造成资源浪费。

  2.标准规范分布零散

  截至2024年3月,档案行业还没有专门针对档案数字资源备份工作出台标准规范,涉及备份工作的相关要求均根据其他档案工作需要,分散在各标准之中,且内容或不涉及具体实施方法,或要求不全面。2009年,国家档案局曾编制并发布的《档案馆防治灾害工作指南》,其中提出了档案备份的基本原则、档案备份的方式、档案信息管理系统的容灾备份、电子数据的备份等方面的要求,但该指南已发布近15年,当时的工作背景、技术条件等与今日相比,已发生较大变化。

  3.工作内容尚不完善

  通过对调查问卷进行整理分析,档案数字资源备份工作有以下方面有待完善。

  一是备份对象不全面。备份工作一方面是保障档案数字资源本身的安全,另一方面是保障档案信息系统业务连续性,且档案信息系统已成为档案数字资源必不可少的管理平台,因此要将档案信息系统程序及其配置数据纳入备份工作的范围内。档案信息系统的日志数据记录着对系统内档案数字资源管理的过程信息,在保障档案的原始记录性方面发挥重要的凭证性作用,因此也应纳入备份工作的范围内。从调研结果看,少数档案馆还未对档案信息系统程序及其配置数据、日志数据进行备份。

  二是备份周期不明确。随着档案数字资源的海量增长,各档案馆备份工作量与日俱增,部分档案馆表示,当前馆藏档案数字资源数据量庞大,执行一次完全备份用时过长,因此未定期开展档案数字资源全量备份和增量备份。但从技术的角度看,若仅在初次全量备份的基础上做增量备份,当恢复时需要依赖全量备份之后的全部增量备份,存在一定风险。

  三是备份检测不到位。档案数字资源备份工作的核心目标之一是保障其完整性、一致性和可恢复性。特别是对于离线备份工作而言,完成一次全量备份工作仅仅是备份工作的起步阶段,需定期对备份载体和备份内容进行检测,从而保证在遇到问题时可恢复“如初”。目前,少数档案馆未定期开展备份载体检测和备份数据检测。

  4.存储载体存在风险

  现主要档案数字资源备份存储载体均不完全满足档案数字资源长期安全保存需求。硬磁盘存在较大的数据篡改风险,可靠寿命仅3~5年;磁带需配套设备支撑,设备与载体更新迭代速度快,设备兼容性低,一般10年需进行数据迁移,迁移成本高昂;蓝光光盘理论寿命未历经时间验证,又有主要生产厂商宣布停产,存在载体退市风险;缩微胶片仅可存储影像文件,无法适应未来电子档案形式多样的趋势与要求。此外,除缩微胶片外,上述载体的核心技术均由国外把持,在日益复杂的国际形势下,存在被“卡脖子”的风险。

  对策建议

  1.加强顶层制度设计

  从国家层面加强对备份工作的科学规划,整体布局。在充分调研的基础上.适时出台相关政策性文件明确各级档案部门在备份工作中的职能定位,建立健全科学完善的本地备份、异地备份、区域性备份等工作机制,加大对档案数字资源备份工作的人力、财力,物力等政策保障力度,构建目标明确、层次适当、划分清晰的标准体系,推出科学规范、可操作性强、符合需求的工作指南,鼓励和推动备份工作制度与技术创新,引导数据存储产业对档案行业关注和投入,使备份工作更好地保障档案事业高质量发展。

  2.加快备份中心建设

  《“十四五”全国档案事业发展规划》在“档案信息化强基工程”专栏中提出“国家电子档案战略备份中心建设项目”,其主要目标是建设能够支撑各级国家档案馆开展重要电子档案异地异质备份的专业化备份环境。建设战略备份中心是统筹开展全国档案数字资源备份工作的重要举措,是完善档案信息化发展保障机制、推动档案信息化固本强基迈上新台阶的关键性基础保障。因此,应在充分调研、统筹规划的基础上,加快推动并实施国家电子档案战略备份中心建设。关于此项工作有以下3点建议:

  一是科学制定备份中心建设及运行方案。围绕其为各级档案部门开展重要电子档案异地异质备份的职能,应充分调研全国档案数字资源备份工作的相关需求,提前规划备份中心制度体系,明确其组织分工、岗位职责、工作流程、环境管理、设备管理、载体管理、数据管理、监控管理等要求。根据工作需要、数据总量等因素,合理选择技术路线,科学开展设备选型、系统研发等技术方案编制,保障备份中心建设工作统筹推进、顺利开展。

  二是打造“1+N”备份中心布局。在统筹规划,合理布局、分步实施,多方投入、集中管理的原则下,建议国家电子档案战略备份中心建设1个国家级总中心和N个区域级分中心。国家级总中心由国家档案局主导建立,并综合全国各省档案事业发展水平、地理位置、交通条件、基础设施建设情况,气候条件等多方面因素,依托备份工作经验丰富、基础设施较好和区域辐射能力强的省级档案局、档案馆成立区域级分中心,各区域级分中心覆盖范围由国家档案局指定,工作任务由国家档案局牵头统一制定。

  三是明确职责分工。由于国家级总中心与区域级分中心隶属不同责任主体,因此应明确各自职责,并制定统一、详细、明确的管理制度与工作流程。国家级总中心除承担业务职能外,还应承担国家电子档案战略备份中心的管理与指导职能,负责制定备份中心建设和管理办法以及相关规章制度,编制和组织实施备份中心总体发展规划,指导各区域级分中心的建设和运行,组织对区域级分中心的检查、评估和考核,研究制定对区域级分中心的支持政策与措施、划拨相关经费等。区域级分中心贯彻国家档案局有关国家电子档案战略备份中心建设和运行管理的方针政策,并以此为依据开展区域级分中心建设,配备区域级分中心建设和运行所需的人员、场地、基础设施设备等保障条件,根据区域内需求开展档案数字资源备份工作。

  3.构建标准规范体系

  当前,档案行业标准《档案数字资源备份实施规范》即将出台,这是我国档案行业首个针对档案数字资源备份工作的标准规范。应以此为基础,进一步对档案数字资源备份标准规范体系进行顶层设计、统筹规划、同步制定,建议可从数据、载体、基础设施和系统(软件)等角度,对档案数字资源备份标准体系进行整体设计。

  数据类标准是档案数字资源备份标准规范体系的核心,建议从国家、省、市等不同层级,围绕其不同的职能范围、需求等,从备份对象、数据组织、优先级选择、备份策略等方面作出细化规定。

  备份载体类标准较为成熟,建议在已有《档案缩微品保管规范》(DA/T21-1999)、《档案数据存储用LTO磁带应用规范》(DA/T 83-2019)、《档案数据硬磁盘离线存储管理规范》(DA/T75-2019)、《电子档案存储用可录类蓝光光盘(BD-R)技术要求和应用规范》(DA/T 74一2019)、《磁性载体档案管理与保护规范》(DA/T 15-1995)等标准的基础上,根据档案数字资源备份工作的实际需要,进行统筹整合,尽可能做到量化,例如,何种备份数据规模对应选择何种载体等。

  备份基础设施类标准建议结合《档案馆高压细水雾灭火系统技术规范》(DA/T 45-2021)、《档案馆建筑设计规范》(JGJ 25-2010)、《档案馆建设标准》(建标103-2008)等档案行业要求,根据备份数据规模、重要性等,分级提出建设标准和技术要求。

  备份系统类标准建议以《电子档案管理系统通用功能要求》(GB/T 39784-2021)国家档案局办公室印发的《电子档案管理系统基本功能规定》等文件为基础,制定档案数字资源备份系统通用功能要求等方面标准规范。

  4.规范备份工作流程

  即将发布实施的《档案数字资源备份实施规范》对档案数字资源备份工作的目标与原则、组织与管理、方式与流程等方面作出了全面的规定,是各级综合档案馆开展备份工作的重要参考。该标准在备份对象、备份周期、定期检测等前文备份工作内容薄弱之处均作出了明确的规定,参照该标准执行可进一步规范备份工作流程,筑牢档案安全的防线。建议在该标准实施后,各级档案馆应根据规范内容、结合各自实际,进一步细化相关要求,制定满足自身工作需要的备份相关制度。例如,因考虑到全国各级综合档案馆数字资源的价值、规模与变化情况、人员等实际情况不同,该标准规定了档案数字资源在线、离线备份的初次时限,但整体性周期备份时间不做强制要求,需要各档案馆结合自身实际情况进行明确规定。

  5.创新载体技术应用

  鉴于现阶段主要的数据存储载体难以完全满足档案数字资源备份工作的现状,档案行业应积极与存储产业加强沟通与合作,可效仿光盘,寻求生产档案级硬磁盘等符合档案数字资源长期安全保存和备份要求的存储载体的途径。更重要的是,应充分发挥科技创新在破解备份工作重难点问题中的关键作用,推进新型存储载体在档案行业的落地,创新已有类型载体在档案行业的应用。

  目前,数据存储技术呈跨学科、多样性发展,数字胶片、全息光盘、玻璃类光存储、DNA存储、蚕丝生物等技术是未来档案数字资源长期保存与备份工作关注的新方向。目前,除数字胶片外,其他存储技术还处于实验室研究阶段。下一步,建议一方面持续关注全息光盘、玻璃类光存储等新型数据存储技术的发展,另一方面积极开展数字胶片技术的研发和试点应用工作,为档案行业开展档案数字资源长期保存与备份工作提供新的、更多的解决方案。

  参考文献:

  [1]国家档案局.档案馆防治灾害工作指南[M].中国档案出版社,2010.

  [2]丁德胜.电子档案管理理论与实务[M].中国文史出版社,2023.

  [3]王善柏.档案数字资源长期存储介质[J].中国档案,2021(9).

  [本文系2022年国家档案局重点科技项目“档案数字资源备份策略及数字胶片技术应用研究”的阶段性研究成果]

  作者单位:国家档案局科研所

  责任编辑:周拯民