发布时间:2024-02-28 14:47:58被阅览数:840 次信息来源:《中国档案》
文/曾永志 刘晓芬 彭源新 吴建城 刘健
电子档案领域存在几个关键技术元素,分别是电子文件、元数据、“四性”检测和电子档案,只有将这几个关键部分整合完善,构建闭环成套的事务体系,电子档案才能得以稳步发展。目前普遍存在对电子文件、元数据、“四性”检测、电子档案的相互关系理解不够明晰的问题,导致在此基础上形成的电子档案及其成套性、通用性不能得到普遍认可。本文以“四性”检测为对象,联结电子文件、元数据、电子档案,结合深中通道交通建设项目电子档案“四性”检测的研究及实践综合阐述,力求完整展现“四性”检测的结构性内容。
“四性”检测背景概述
1.检测概述
电子档案“四性”检测是指在电子文件形成与电子档案管理的过程中,对其真实性、完整性、可用性、安全性进行检测。“真实”“完整”“可用”“安全”这4个特征决定一份电子文件是否能被普遍认可,是实现电子档案具有凭证、查考和保存价值的前提条件。
2.检测项目
“四性”检测目前的主要设计依据为《文书类电子档案检测一般要求》(DA/T70—2018),共有45项检测内容。其中包括真实性检测16项,检测电子档案的内容、逻辑结构和背景与形成时原始状况相一致的性质;完整性检测11项,检测电子档案的内容、结构和背景信息齐全且没有破坏、变异或丢失的性质;可用性检测9项,检测电子档案可以被检索、呈现和理解的性质;安全性检测9项,检测电子档案的管理过程可控、数据储存可靠,未被破坏、未被非法访问的性质。这些检测项基本覆盖了3个关键环节,分别为电子文件归档环节、电子档案移交与接收环节和电子档案长期保存环节。
3.检测环节
在电子文件归档环节,业务部门负责归档电子文件,检测归档信息包;在电子档案移交与接收环节,档案室负责移交与接收电子档案,检测移交信息包;在电子档案长期保存环节,档案管理部门负责长期保存电子档案,检测保存信息包。检测对象信息包是指封装后的电子文件及其元数据。
在归档环节,真实性的检测内容包含电子文件来源真实性等5项;完整性的检测内容包含电子文件总数量等4项;可用性的检测内容包含电子文件元数据可用性等4项;安全性的检测包含归档信息包病毒等3项。
在移交与接收环节,真实性的检测内容包含电子档案来源真实性等5项;完整性的检测内容包含电子档案的数据总量等4项;可用性的检测内容包含电子档案元数据可用性等4项;安全性检测包含移交信息包病毒等3项。
在长期保存环节,应先制定检测策略,确定检测周期、抽检比例、操作记录元数据补充等方案;真实性的检测内容包含电子档案固化信息等5项;完整性的检测内容包含移交信息包完整性等4项;可用性的检测内容包含备份数据可恢复性等4项;安全性的检测内容包含保存信息包病毒等4项。
为了符合《文书类电子档案检测一般要求》(DA/T70—2018)的要求,开发人员需要依据检测目的和检测方法逐项编码,建设可以应用于电子档案系统的“四性”检测系统功能模块。在系统开发实践工作过程中,“四性”检测整套工作的困难是较为显著的,且由于业务、团队工作成效不一,会出现不同系统“四性”检测结果不一致的现象,而不一致的现象也得不到及时公正明确的评判,继而将模糊性扩大,导致“四性”检测得不到高效落实,难以推广。在国内建设项目电子档案领域,还没有可以借鉴的可行经验,深中通道项目作为“超大型跨海集群工程”中的典范,具备高水平信息化、全域元数据的优良基础,集中力量研究“四性”检测技术,为建设项目树立范本。
“四性”检测技术构建
1.项目概述
深中通道项目是集“桥、岛、隧、水下互通”为一体的超大型跨海集群工程,是当今世界上综合建设难度最大的跨海集群工程之一,也是我国交通行业中首次全面推行智能建造的工程项目。具有工程建设规模宏大、工程技术复杂、建设周期长、参建单位多、业务系统多、智能建造应用广等特点,其电子档案也具有数据量大、签名量大、人员流动性高等特点。
深中通道项目在建设前期便开始整体筹划完善本项目的电子档案管理工作,辨识现状建设项目电子档案管理的重难点,以成套性作为关键突破点展开多项研究,为建设项目电子档案的可持续发展作出贡献,“四性”检测就是其中非常重要的一个部分。
目前,建设项目电子档案“四性”检测没有统一的规范指导,仅能依据《文书类电子档案检测一般要求》(DA/T70—2018)并结合建设项目的实际情况设计“四性”检测方案及对应模块。这对团队及人员的素质要求很高,需要工程专业、计算机专业、信息专业、档案专业相互密切配合。深中通道项目配备了全面的技术团队及人员,具备“四性”检测研究的基本条件。
2.研究内容
依据建设项目电子档案的特性,深中通道项目分别建设了业务系统和电子档案系统,业务系统负责工程资料电子文件的形成与预归档,电子档案系统负责电子文件的整理、归档与电子档案的管理。依据《文书类电子档案检测一般要求》(DA/T70—2018)的要求,结合深中通道项目建设期的实际情况,“四性”检测的2个关键环节为归档环节、移交接收环节,分别研究业务系统“四性”检测方案和电子档案系统“四性”检测方案。其中业务系统执行归档环节的“四性”检测,电子档案系统执行移交与接收环节的“四性”检测。
3.检测项目示例
对于归档环节的真实性检测分别为电子文件元数据真实性、内容真实性、元数据与内容关联真实性、归档信息包真实性检测4类,检测方案如表所示。
“四性”检测方案表
电子文件元数据真实性检测方案
电子文件内容真实性检测方案
元数据与内容关联真实性检测方案
归档信息包真实性检测方案
4.技术实现示例
对于检测方案中的每一个检测项目,深中通道项目均依据相关规范、结合建设项目的特点与实际情况,设计出明确的检测依据、检测指标。比如真实性的检测项“固化信息有效性检测”,在《文书类电子档案检测一般要求》(DA/T70—2018)中规定检测对象为电子文件及电子档案,检测依据和方法为对电子文件中包含的数字摘要、电子签名、电子印章、时间戳等技术措施的固化信息的有效性验证。
深中通道项目在规范的基础上,设计出具体的校验措施,如使用MD5码,MD5码不匹配则代表被篡改,此项检测不通过。MD5是一种信息摘要算法,是一种不可逆的加密算法,生活中对MD5比较典型的应用是登录验证,用户初始设置的登录密码被MD5加密存在服务器里面,表现为一个字符串,服务器只能通过判定即时输入的登录密码所形成的新MD5码与储存的原MD5码是否一致完成登录验证,但是难以反向计算出用户实际输入的登录密码,这样就能防止入侵者进入服务器盗取密码。
例1:真实性的检测项“元数据项数据长度检测”,在《文书类电子档案检测一般要求》(DA/T70—2018)中规定检测元数据项数据长度是否符合要求,检测对象是元数据,分别对数据库及信息包中的元数据项进行数据项长度检测。深中通道项目首先对电子档案元数据方案进行了成套的设计并制定了成体系的规范标注,再在此基础上对每项元数据的属性设定了通用长度范围,从而在“四性”检测时,能通过长度检测比对来得出是否通过此项检测的结果。
例2:可用性的检测项“信息包中包含的内容数据格式合规性检测”,在《文书类电子档案检测一般要求》(DA/T70—2018)中规定检测目的是可读可用,检测对象是信息包中的电子文件内容数据,检测依据和方法是对信息包是否包含非公开压缩算法、是否加密、是否包含不符合归档要求的格式文件等进行检测。深中通道项目对此检测项的设计方案包括以下几项:一是对电子文件大小进行检测,若检测出文件大小为0KB或1KB,则可判定此项检测不通过;二是通过系统模块设计快速打开电子文件,若过程中出现格式错误或者加密等原因导致电子文件无法正常打开,则可判定此项检测不通过;三是通过公开的压缩算法对压缩文件进行解压,并对压缩后的电子文件进行前述两项检测,若过程中出现阻碍,则此项检测不通过。
深中通道项目在电子档案“四性”检测方面进行了成套研究,从使用业务系统实现工程资料电子文件单轨运行,到制定实施元数据集“四性”检测成套实施方案,再到建设“四性”检测系统功能模块来满足不同环节的“四性”检测需求,将“四性”检测真正落实到了建设项目电子档案工作中。
[本文系2022年度国家档案局科技项目“超大型跨海通道集群工程交通建设项目电子档案全域管理体系及成套关键技术研究与应用”(项目编号:2022-X-007)的阶段性结果]
作者单位:深中通道管理中心
责任编辑:王辉