档案数据化与数据档案化:档案数据内涵的双维透视(摘编)

发布时间:2024-05-06 20:11:47被阅览数:181 次信息来源:《中国档案》

  文/金波   杨鹏   宋飞

  档案数据内涵的双向延伸与协同交互:

  从“档案”到“档案数据化”。也就是档案的数据化生存,重在将数据科学理论知识与数据管理技术方法融入档案资源建设与档案业务管理中,推动档案存量数据化、增量电子化与资源结构化,助力档案事业数据化转型。

  第一,档案存量数据化。通过对馆藏纸质档案、数字档案等存量档案的数据化,再借助数据挖掘、智能分析、虚拟现实等数智技术实现信息提取、知识转化、智能推送,充分释放档案数据价值潜能。

  第二,档案增量电子化。主要体现在电子档案数据化与档案业务数据化两方面。

  第三,档案资源结构化。一方面是档案资源结构的完整优化。通过广泛采集电子政务数据、社交媒体数据、网页邮件数据、智能终端数据等新型档案资源,提升档案数据在现代化档案资源体系中的占比,推动档案资源形式更加多样、内容更加丰富、结构更加优化。另一方面是档案数据的结构化。需要强化档案数据的形式化、标准化、量化处理,将档案资源转化为机器可理解计算、可语义识别、可建模分析的结构化数据,减少数据格式异构,使得档案数据能够被激活、关联、重组、挖掘。

  从“数据”到“数据档案化”。也就是数据的档案化管理,重在借助档案学知识原理与档案管理专业方法,将业务部门产生的具有保存价值的数据纳入档案管理范畴,赋予其档案属性,发挥档案部门在业务监督指导、信息可信认证、安全长期保存、开放共享利用等方面的管理经验和独特优势,促进数据管理规范化、安全化与价值化。

  第一,数据规范化。借助“四性”检测等档案管理方法,确保归档数据来源可靠、程序规范、要素合规、过程追溯,维护数据的真实完整、可信可用,从源头上管控档案数据质量。此外,依托档案管理制度规范和相关整理理论,明确数据采集捕获、检测处置、移交归档、深度著录、系统标引等业务流程,明晰归档数据的采集范围、格式规范、保管期限、元数据标准等,实现数据有序化、规范化、科学化运行。

  第二,数据安全化。根据档案数据系统依赖性、信息易变性等特性,明确数据在线离线存储方式,营建安全稳定的馆库设施环境,选择标准化程度高、耐久性能好、存储容量大、防篡改能力强的存储载体,确保档案数据长期可读可用;实施安全分级、安全监控、突发应急、内外网隔离等管理制度,避免档案数据失密泄密、丢失损坏;综合运用加密技术、区块链技术、隐私保护技术等手段,形成人防物防技防于一体的档案数据安全保障体系,确保档案数据实体与信息安全。

  第三,数据价值化。通过数据鉴定甄别,使得具有重要价值的各类数据记录得到完整安全保存,维护归档数据的法律凭证价值、历史文化价值和决策参考价值。借助大数据、人工智能等技术工具,通过智能检索推送、知识挖掘分析、开放流通共享、编纂开发呈现、可视化展演等方式,彰显档案数据价值密度高、价值效力强、价值潜能大的独特作用。

  档案数据:档案与数据的交融互化。档案数据作为档案学科与数据科学交融互化的产物,是档案数据化和数据档案化的双向互构、协同融合与内在统一。

  第一,法理概念融通。从档案与数据的法律定义来看,档案与数据的法律界定落脚点均为“记录”,二者具备相同的信息记录质性,在法理上具有天然的同宗近缘关系。大数据时代,万物皆可量化,数据成为描摹、重构、再现物质世界和人类活动的新载体,也成为信息生成、记录、读取和存储的新方式,而档案是海量数据中具有保存价值的数据记录,数据无论是长久存储还是共享利用都有归档需求,档案的“数据”属性和数据的“档案”价值构成档案数据的底层逻辑代码。

  第二,资源范畴融合。数据化的触角深入渗透到社会实践活动的各方面各领域,作为文件信息重要归宿的档案,与数据之间的资源边界日益泛化、模糊、交融,档案数据将逐渐成为大数据时代档案部门管理的主要资源形态。

  第三,管理业务融汇。数据管理涵盖归档、存储、共享、利用等步骤,档案管理重视文件的全程全面管控,二者在生命周期上存在交叠、融汇、关联,均强调管理业务的全流程全环节、连续完整统一,具有程序一致性和协作互补性的紧密联系。现行数据管理与档案数据管理是一个系统工程,需要开展数据业务与档案业务之间的协同综合管控,实现现行文件数据到数据归档存储的前后端一体化控制、数据管理系统与档案管理系统的统一化集成嵌套,促进数据的原始生成、安全保管与高效运行。

  [摘自《人大复印报刊资料·档案学》(京),2024(1);原文发表于《图书情报工作》(京),2023(6)]

  作者单位:上海大学文化遗产与信息管理学院、南京大学信息管理学院

  责任编辑:周拯民