电子档案单套制管理中的前沿技术应用现状与展望

发布时间:2024-08-29 19:22:34被阅览数:91 次信息来源:​中国档案报  作者:苏依纹 韩禹荣 彭 灿 张晨阳 赵婧羽 张 静 张茜雅

  一、前沿数字技术赋能电子档案单套制管理

  2021年,中办、国办印发《“十四五”全国档案事业发展规划》,强调提升档案利用服务能力,积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用。加速数字档案馆(室)建设,加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,推动数字档案馆(室)建设优化升级。这充分说明,前沿的数字技术运用是加快电子档案单套制管理转型的重要推手,也是提升电子档案管理效率、安全性和利用率的关键因素。

  然而,随着新技术不断涌现,有关前沿技术在电子档案单套制管理中的适配性、运用策略等问题上的理论储备与更新不足,实践方面亦缺少容纳人工智能、云计算等技术的全流程共通方案。因此,有必要从现有成熟实践切入,总结归纳最新技术运用经验,展望后续的技术运用策略。

  对此,本研究对《“十三五”时期档案科技优秀成果汇编》以及“十三五”期间企业电子文件归档和电子档案管理试点单位在报刊、网站、公众号等平台发布的相关信息开展调查与分析,选取51个成熟度高、转型成效好的代表性案例进行系统性研究,总结重点前沿技术在电子档案单套制管理中的突出应用场景,并基于此展望未来的技术创新方向,以期为相关工作的开展提供参考借鉴。

  二、电子档案单套制管理中的前沿技术应用现状

  基于各单位电子文件归档和电子档案管理的单套制实践现状,可根据不同管理阶段、场景,将应用的技术方法分为3大类别。一是在传输、归档等前端环节应用相关技术,以保证归档过程中电子文件及元数据的真实完整,为后续工作提供基础与保障。二是在电子档案存储、电子档案保存等后端环节中运用与文件存储、电子档案安全管控相关技术,以保障电子档案的长期保存和安全可用。三是在电子档案开发利用中运用新一代信息技术,以实现电子档案的高效开发和利用。

  (一)创建可信归档环境

  前端环节作为电子档案单套制管理的起始之处,必须保障电子文件能够从业务系统完整、连续、可信地归档至档案管理系统中。为达到上述目标,各单位在业务前端主要利用数据建模、传输、著录及“四性”检测技术,创建可信的电子文件归档环境。

  在归档与传输方面,各单位以自身业务实践为主体,开发、研究适用于本单位的电子文件上传、移交技术方案。有的通过运用Building Information Modeling (BIM)技术、人工智能、电子档案元数据提取等,实现电子文件及元数据的归档、著录与移交。如,上海市浦东新区档案局、国家档案局档案科学技术研究所基于BIM技术实现了对三维城建档案的接收保管。实践单位针对BIM档案的报送、审核、审批、保管、利用全过程构建了生态闭环,结合Geographic Information System(GIS)技术,得以在数字平台上接收、呈现BIM模型档案。部分单位采用集成接口技术实现数据上传与交换,开发了WebService、中间库等不同模式的系统接口。如,中国商飞上海飞机设计研究院制定了适合该单位的型号电子文件归档技术路线:当档案系统与中国商飞现有系统进行集成时,接口通过WebService方式实现。即,各业务系统把电子文件全文以流的方式传递到WebService接口,由接口进行接收,并归档到档案系统全文服务器中。

  在电子文件归档的“四性”检测上,多使用区块链、电子签名、电子签章、MD5校验、数字水印、数字摘要、可信时间戳等校验技术,来保障电子文件归档的真实性、完整性、安全性和可用性,为维护电子档案的凭证作用提供技术支撑。如,浙江省档案馆、省住房和城乡建设厅政务办理中心依托省政务服务网,在电子文件实时在线归档的同时,运用数字摘要、电子签名、可信时间戳等技术手段,提高行政审批电子文件与电子档案管理的可靠性与效率。多元化的“四性”检测技术在全面提高电子档案可追溯性与可信度的同时,促进档案行业形成技术选用共识、开展标准共建,为创建行业级、领域级的可信归档技术环境提供了保障。

  (二)实现保管安全高效

  电子档案存储、保存等流程作为关键的后端保障环节,既需要保障档案资源完整接收、安全可控与长期可用,又需要做好档案鉴定等为后续开发利用奠定基础。针对上述需求,各单位在后端建设中着重打造电子档案存储、安全管理、自动鉴定三大技术场景。

  在存储方面,主要关注电子档案的长期保存问题。一方面,通过运用云计算、分布式存储、Hadoop大数据技术等,实现电子档案在线保管、云端备份。另一方面,集成基于云架构的档案在线异地容灾技术,实现核心数据远程异地保存。在具体技术应用中,或依托分布式存储技术,建立电子档案存储平台,精细化管理档案信息;或应用Hadoop技术这一“存储系统+计算框架”软件框架,解决海量数据存储与计算问题,实现电子档案的分布式存储和快速获取。

  在鉴定方面,采用大数据、人工智能和OCR识别等技术,进行档案自动分类、自动鉴定保管期限或辅助开放鉴定,极大提升了工作效率。如,北京市档案馆积极探索档案开放鉴定辅助管理系统建设,运用OCR识别技术,对档案数字化副本加以解析,从敏感词库中读取敏感词,将档案原文与之一一对比,实现敏感词过滤筛选与文中定位,有力发挥技术辅助鉴定功能。

  在安全保障方面,主要运用签名对比、人脸识别、CA数字签名、数字摘要算法、数字水印等技术方法,加强档案保管过程中的风险管控,为电子档案单套制管理应用提供安全保障,防止档案数据被篡改。如,国家电网有限公司在数字档案馆系统中采用最新加密算法对密码进行加密,在传输过程采用SSL进行传输加密,以保障电子档案安全。东港瑞云数据技术有限公司运用区块链技术完成了“中小微企业档案管理云平台”建设,通过赋予存证档案哈希值,实现档案完整性查验。

  (三)拓展利用服务

  开发利用作为档案管理的最终环节,是实现电子档案价值、满足社会需求的关键步骤。在此阶段需要将前期积累保存的档案资源转化为可便捷访问、智能分析、深度利用的信息资产。为实现这一愿景,各单位在此环节通常以新兴技术为支撑,聚焦电子档案开发、利用双重应用场景进行探索尝试。

  在资源开发方面,积极运用数据挖掘、语义分析等大数据技术以及人工智能、交互式电子技术等,建立档案知识库,深度挖掘档案信息。运用云计算、大数据、物联网等技术实现档案资源集成化管理,并为用户提供数据分析、可视化等知识服务。同时,运用人工智能、数字人文、网络爬虫等信息技术,实现档案数字编研和深度开发,使档案叙事可视化。如,中国石油天然气集团有限公司投入开发档案系统BI分析工具,依托其高效的计算能力和强大的数据分析能力,提供同期数据对比分析、不同类目细分数据分析、用户行为数据分析、数据来源分析、基础和综合表单分析以及聚类分析等多维度的深度数据分析与呈现服务。

  在利用服务方面,运用人工智能、关联分析、自然语义分析、搜索引擎(如Elasticsearch、Solr)等,建立智能化检索平台,实现智能分类、自动检索,进而根据用户需求提供有针对性的检索服务,提高用户检索效率。同时,运用RFID电子标签、数据仓储、数据挖掘、云计算等技术将档案信息关联,实现档案智能定位与跟踪管理。如,原武汉市国土资源和规划信息中心联合武汉大学档案馆基于文本识别、文档关联等数据挖掘技术,利用PDF版式分析、OCR识别、语义分析、知识文本抽取等方法,构建了国土规划档案文本数据与文档关联规则库,应用语义分析技术抽取国土规划档案中的业务信息,实现抽取业务数据、国土规划主题词和文档关联规则库三者的关联,实现了国土规划管理业务的智能化跟踪与监督。

  三、电子档案单套制管理中的前沿技术应用策略

  结合当前实践现状特点,可提出以下电子档案单套制管理技术应用发展策略。

  一是促进技术创新迭代升级。一方面,通过巩固当前较为成熟的传统技术,在其基础上进行升级改造,实现技术的迭代升级,提升其在电子档案单套制管理相关业务环节中的效率和成熟度。另一方面,结合电子档案单套制管理业务流程,以实际需求为驱动力,积极开发与挖掘新兴技术的应用,重点发展人工智能技术,推动档案管理向智能化发展。档案部门要增强开发运用新兴技术的意识,通过与技术部门的深度合作,用技术突破当前的管理难题。

  二是打造典型应用场景,实现成果转化。可把握共同需求和实际场景需求,形成具有普遍性及推广价值的典型案例方案,突出重点管理要求,着重解决管理过程中的痛点和难点,形成具有一定可迁移性的技术应用参考示例,完善“1模式+N案例”形式的结构模型,加速技术成果转化。

  三是以业务驱动为技术选型和方案构建的原则。加强电子档案管理与业务流程框架的充分融合,释放业务机构的主导性,以应对电子档案管理过程中技术多元、重点不一而足的特点,助力于实现业务部门对档案的自主管理,探索多领域、多场景的电子档案管理模式。另外,各种技术的选用与过渡要与业务部门紧密合作,设计出个性化的、重点突出的技术应用方案,提高对实际业务的适用性和电子档案管理的效率。

  (“档案那些事儿”研究团队供稿)

  原载于《中国档案报》2024年8月29日 总第4181期  第四版