发布时间:2024-07-22 19:51:14被阅览数:226 次信息来源:《中国档案》
文/白文琳 安小米 肖雨馨
ISO/TR 8344:2024是一项由国际标准化组织(ISO)制定的技术报告标准,其全称为“Information and documentation-Issues and considerations for managingrecords in structured data environments”,即《信息与文献结构化数据环境下文件(档案)管理的问题及应对》。该标准的目的是为揭示在结构化数据环境下管理文件(档案)的问题,并提供相应指导,以帮助组织更有效地管理和利用文件(档案)。标准于2024年4月15日全球正式发布。
编制背景
随着政府、企业和社会的数字化转型的不断推进,文件(档案)越来越多地以结构化数据的形式在数据库中创建,或者在由数据库支持的业务系统中生成。这些结构化数据是满足业务开展,满足法律和监管要求,满足组织记忆、凭证、决策、文化等价值的权威信息来源。因此,加强文件(档案)管理来确保结构化数据环境下的文件(档案)的真实性、可靠性、完整性、可用性是业务平稳、高质量开展的重要保障,结构化数据环境下的文件(档案)管理能力的提升势在必行。
虽然ISO 30301《信息与文献文件管理体系:要求》给出了通用的文件管理体系要求,但是由于结构化数据环境下的特殊性,所以还需要考虑特定的文件(档案)管理流程、体系和要求。因此该标准提供了结构化数据环境下文件(档案)管理的总则,分析了结构化数据环境下文件(档案)管理的特殊问题并提出了应对的指导意见。
该标准的主要适用者包括数据政策制定者、系统设计师、业务系统管理者、数据管理专业人员、数据库管理专业人员以及文件(档案)管理专业人员,指导他们在结构化数据环境下规范开展文件(档案)管理。
编制过程及基本信息
该国际标准于2021年6月7日正式启动。2023年正式在ISO/TC46/SC11国际标准化组织信息与文献委员会下设的档案(文件)管理分技术委员会完成注册,并正式启动工作草案制定。2024年4月15日,标准正式发布。该标准在预研立项前还经历了2019年5月一2021年5月共2年的特别工作组研究阶段。
该标准由中国专家担任项目召集人、负责人。来自14个国家的34名注册专家共同合作完成了标准制定工作。其中,附录中的4个用例均由中国提供,分别是:中国石油长庆油田分公司档案馆、国网天津市电力公司档案馆、中国商飞上海飞机设计研究院、北京柏睿数据技术股份有限公司。
主要内容
该标准包含6章主要内容和9个规范性附录,具体包括:第一章范围、第二章规范性引用文件、第三章术语和定义、第四章基本概念、第五章结构化数据环境下管理文件的问题、第六章结构化数据环境下管理文件的问题应对,以及识别结构化数据的概念和特征、关系型数据库示例、从管理角度和技术角度解读文件(档案)概念、结构化数据环境下文件(档案)管理的模板和用例、来自中国的4个用例表以及ByDesign设计方法论9个规范性附录。其中,第四、五、六章是标准的重点内容。
1.第四章 基本概念
明确了数据、信息、文件和知识之间的关系;明确了实体文件(档案)和结构化数据、业务系统、数据库(关系型数据库、主数据和事务数据、其他形式数据库)等概念;区分了“文件(档案)”概念的不同理解;阐述了作为结构化数据的文件(档案)元数据的管理意义;辨识了结构化数据的基本特征。
2.第五章 结构化数据环境下管理文件的问题
通过来自中国的4个用例数据的收集与分析,标准得出了结构化数据环境下管理文件存在如下挑战和问题:
第一,单独的一份文件(档案)并不是独立存在的。结构化数据环境中,一份文件(档案)通常是整体数据结构的一部分,所有同类型的文件(档案)聚合在一起,不能实现单独管理。
第二,业务系统并非是为了捕获文件(档案)而设计。大多数的业务系统并没有按照ISO 16175的功能要求来捕获文件(档案)。因此,如果要求系统提供历史性的某个信息,例如公民以前的地址,则创建具有与时间点相关联的数据值的固定内容文件(档案)可能会面临挑战。
第三,数据经常被复用。数据库中的同一个数据经常在不同的业务流程和事务中被复用,数据在复用的过程中会产生新的文件(档案),还得遵从不同文件(档案)的留存和处置要求。
第四,文件(档案)控制可能无法应用于业务系统中。业务系统设计时很少考虑文件(档案)的管理规则和要求,例如业务系统制定的元数据保存、访问权限规则和文件(档案)管理要求所制定相应规则不尽相同,导致文件(档案)控制可能无法在业务系统中实现。
第五,业务系统中的文件(档案)过程可能有所不同。业务系统中的文件(档案)过程和文件(档案)系统中的过程可能存在不一致的情况,例如业务系统中的文件(档案)通常在创建时候被同时捕获,并不明显体现创新和捕获两个流程,而文件(档案)过程是明确区分的。
第六,文件(档案)的内涵可能取决于系统文档。结构化数据环境下的文件(档案)在留存了代码和额外的系统文档情况下,才有可能留存该文件(档案)的意义,因此系统文档的留存成为理解文件(档案)之间意义、关系的必要操作。
第七,对共享系统中的文件(档案)的所有权和控制可能并不清楚。很多业务系统的设计者和使用者是分开的,特别是多主体共同使用系统的情况下,文件(档案)的私有权和控制权是不明晰的,所受到的法律和监管要求也不尽相同。
第八,对个别文件(档案)的处置可行性存在难点。对于存储在关系型数据库中的文件(档案),处置过程要求从数据库中移除特定记录,也就存在以下处置问题:首先,需要确定组成文件(档案)的数据,虽然已经完成对文件(档案)留存的鉴定,但是为了使得文件(档案)是完整和有意义的,还需要识别和保留相应元数据。其次,销毁有难点。单份文件(档案)的删除操作会违背数据库的引用完整性规则。再次,需要处置的数据量大造成的难点。大量的数据的处置使得手动操作不可行,需要完成自动化设置,并且需要确保可信和合法。再次,处置全面性有难点。文件可能存在备份副本、纸质打印版本等,全面处置完毕存在难点。最后,确保及时、完整和不可逆的销毁操作有难点。在复杂的、分布式的、共享的或由第三方控制的结构化数据环境中,可能很难获得及时、完整和不可逆转销毁证明。
第九,处置与关系数据库的引用完整性规则之间的冲突。文件(档案)处置规则可能要求做删除处理,但关系数据库的引用完整性规则可能要求留存相同的文件(档案),也就可能会产生冲突。
第十,长期保存结构化数据文件(档案)。非结构化数据的保存通常需要转化为所要求的文件格式,虽然ISO/TR22999提供了数字文件格式的长期存储建议,但其中不包括数据库格式。
第十一,数据高度动态化特征。在某些技术或科学环境中,可能需要连续变化的数据值。例如,采样连续变化的值,并捕获和存储所得的样本值;确定连续变化值的平均值,并捕获和存储所得的平均值;在更适合存储范围(测量)值的非关系数据库中存储结果值;将通信网络中智能设备传感器的电流输出值存储下来等等均是挑战。
3.第六章 结构化数据环境下管理文件的问题应对
第一,方法论。明确在业务系统中管理文件(档案)的方法包括:①在业务系统中前置设计文件(档案)控制和流程,例如,捕获某个环节的历史数据和状态,使用数据库日志工具来记录更改的数据值等;②将其他应用程序中的文件(档案)控制或要求应用到业务系统中;③构建一个跨业务系统的文件(档案)管理系统。
第二,文件(档案)鉴定。首先,鉴定需要被捕获的文件(档案),在对业务环境进行战略分析和风险评估的基础上,确定需要创建和捕获的文件(档案)。其次,对管存要求进行鉴定。需要重点鉴定文件(档案)的聚合体,而非单个文件(档案),此外需要重点鉴定被复用的文件(档案)的留存要求。
第三,By Design方法的运用。提出By Design方法管理结构化数据环境下的文件(档案),具体采用管理规则设计方法和技术设计方法来实现。首先,管理规则设计方法要求在业务系统设计的整个生命周期中,特别是在初始设计阶段中就要明确文件(档案)的管理要求。具体包括:①鉴定将被捕获和保留的文件(档案)以及处置时间;②确定文件(档案)分类、索引、描述、访问控制处置和保存、监管等要求;③选择相应信息系统来捕获和保留这些文件(档案):④设计捕获、留存和处置文件(档案)的解决方案,包括基本系统连接:⑤建立、购买和实施用于捕获、留存和处理这些文件(档案)的解决方案。其次,技术设计方法建议在系统中自动化实现全生命周期范围内文件(档案)管理规则和流程的操作,采用机器可读标准技术实现机器对规则和要求的自动执行,自动解释、自动审计等功能。
第四,将其他应用程序中的文件(档案)控制手段或策略应用到业务系统中。将文件(档案)管理集中在一个应用程序中,并将文件(档案)控制或要求应用于其他应用程序,从而就地管理档案。
第五,从战略角度和执行角度构建一个跨业务系统的文件(档案)管理系统。从战略角度着手,将文件(档案)管理要求和数据治理要求嵌入组织数字化转型顶层设计中,如有关基础设施、体系架构、管理过程、系统、数据模型等。从执行角度着手,文件(档案)过程和控制管理最好嵌入文件(档案)系统中,对于部分不可行的档案管理过程和控制,无法将其作为功能纳入系统,但档案管理系统可能能够支持特定业务系统之外的文件(档案)管理要求,如保存数据库中使用的代码,捕获例如屏幕截图、数据库方案、用户指南等单独的文档,在系统层面实施处置权限便于系统升级、更换时实施处置行为。
作者单位:天津师范大学、中国人民大学
责任编辑:黄佳音