推动数字转型 引领数智浪潮——辽宁省档案馆争创全国示范数字档案馆建设实践

发布时间:2024-02-21 13:23:35被阅览数:1012 次信息来源:《中国档案》

  文/李映天  王坚

  2020年,以数字化思维推进数字政府建设为引领,辽宁省档案馆将创建全国示范数字档案馆工作写入《“十四五”辽宁省档案事业发展规划》。2021年4月,省档案馆正式启动国家级数字档案馆创建工作,成立以馆长为组长的数字档案馆创建领导小组及办公室,先后组织人员赴浙江、上海、福建等省市学习考察,借鉴先进经验。对照系统测试5个方面的具体要求,设计数字档案馆建设方案。2022年6月,数字档案馆系统建设一期项目通过专家验收,主要功能达到数字档案馆系统测试办法要求。在此基础上,辽宁省数字档案管理系统建设项目实施方案通过专家论证,并由省大数据局批复并下达投资计划,总投资额达1200万元。建设项目完善了数字档案馆系统,升级了硬件设备,提升了智能化水平。2023年5月,国家档案局组织专家对辽宁省档案馆数字档案馆系统进行了测试,省档案馆高分通过测试验收,成为东北地区首家通过测试的全国示范数字档案馆。

  主动作为、探索创新,释放数字档案资源新动能

  1.夯实基础,提升档案数字资源质量

  省档案馆馆藏档案资料约171万卷(件),馆藏资源较为丰富。回顾近十年的发展历程,省档案馆一直将档案资源建设作为基础业务工作的重点。

  一是存量档案数字化。2013—2017年,省档案馆制定了《辽宁省档案馆百万卷馆藏档案数字化五年规划》,集中开展大规模的馆藏档案数字化工作。截至2022年12月,应数字化档案的数字化率达92.52%;馆藏照片档案数字化完成率达100%。

  二是增量档案电子化。2018—2022年,按照年度接收计划,省档案馆积极融入“数字辽宁、智造强省”战略,推进一体化政务服务平台及协同办公平台电子档案接收。2020年3月,省档案馆被确定为电子文件单套归档和电子档案单套管理试点单位,于2022年7月通过国家档案局、国务院办公厅电子政务办公室、国家电子文件管理部际联席会议办公室联合验收。

  2.创新理念,着力破解数字资源难题

  省档案馆通过思维创新、理念创新、技术创新,着力破解大体量数据管理难点,提升大体量系统效率。

  一是树立“大档案”思维。省档案馆馆藏档案数字资源总量已超过140TB。面对如此庞大的数据量,省档案馆在规划时就树立“大档案”思维,充分考虑未来数据量的增长和应用系统的扩展,在设备选用、软件设计、数据库建设方面进行前瞻性规划和部署。

  二是引入“大集成”理念。面对数字档案馆系统中1000余万条目录、1.07亿画幅的存量档案以及持续增加的电子文件,省档案馆引入了“大集成”理念。政务外网部署省直机关电子档案一体化集中管理平台、电子档案接收平台、馆际共享平台;局域网部署数字档案馆系统、辅助库房管理系统、长期保存系统等;因特网部署网页信息采集系统、电子阅览室系统等,三网兼顾,统筹管理,平台对接,数据互通。

  三是应用新技术。通过提高虚拟服务器配置,提升系统的运算处理能力;通过数据压缩技术降低存储成本;通过并行查询、智能缓存和索引技术提升数据查询速度。目前,省档案馆数字档案馆系统实现了千万级数据的秒级查询。经过实测,目录检索时间不超过5秒,原文检索时间不超过15秒。

  构建平台、加速转型,打造档案业务新流程

  1.多维度构建基础业务系统平台

  省档案馆积极融入数字政府建设,打造了覆盖“收、管、存、用”全业务流程的一体化管理平台。实现了电子档案与档案数字化成果融合接收。在数字档案馆系统内,根据实际工作需求,科学定制业务流程,精准控制权限,对档案数字资源进行全生命周期、全流程有效管理。实施在线与离线、多套与异质、本地与异地相结合的综合备份策略,有效保障了档案数字资源的安全。区域一体化档案信息共享利用服务平台实现了14个市级综合档案馆全覆盖,高质量服务民生、服务社会。

  2.多举措构建长期保存机制

  档案数字资源的长期保存是提升档案安全性的关键。省档案馆结合自身特点,创新构建了“两地两库三巡检”长期保存机制。其核心内容是将两套保全库分别部署在省档案馆和距省档案馆160公里的电子档案备份中心,与管理库实现两地双向文件同步。

  “两库”指档案数字资源长期保全系统中的两套档案数据保全库。“两地”是指省档案馆、电子档案备份中心两地各部署一套保全库。“三巡检”是本地生产库自动巡检、本地保全库巡检及异地保全库巡检。长期保全系统实现对长期保存的档案数字资源库的自动安全巡检,及时预警,实现了离线备份、在线恢复、实时保全。

  3.多渠道发布档案利用信息

  针对不同类型、不同需求的利用者,省档案馆构建了多渠道的信息发布平台。在政务外网部署省直机关电子档案一体化集中管理平台,具备档案阅览功能,面向各立档单位用户提供档案查阅服务;在局域网部署电子阅览室系统和自助查档一体机,政务外网部署省档案馆馆际共享平台,为到馆利用者提供自助档案阅览及跨馆档案利用服务;在互联网部署辽宁省档案馆官网、辽宁省档案馆电子档案阅览室系统、“辽事通”App、“辽宁档案”微信公众号、辽宁红色资源移动微平台,有针对性地根据不同利用群体,在不同网络空间发布档案数字资源,提供个性化档案利用服务。

  数智征程、AI赋能,激发档案数字新引擎

  省档案馆着力打造“两高一低两化”的数字档案馆系统。“两高”即高智能、高性能,主要体现在不断深化智能场景的应用;“一低”即低代码开发,主要体现在系统的可扩展性强,能够灵活定制业务流程;“两化”即安全化、平台化。

  1.创新机制,多维度打造智能场景

  (1)“智能+档案筛密”助力档案安全保密工作提质增效

  省档案馆馆藏档案数字资源总量庞大,时间跨度长,密级字样种类繁多,且标注位置五花八门,凭借人工逐页筛查工作量巨大。为此,省档案馆开发了基于档案数字资源的智能筛密系统。

  初期工作人员选取5000份带密级的档案原文,对涉密印章、油印字样、繁体字样及手写字样进行标注。取80%样本作为训练数据集供模型学习,用20%样本进行算法验证。首先通过目录检索将目录中密级字段为“秘密”“机密”“绝密”的档案筛出来,然后对密级目录为非密或为空的档案进行智能筛密。

  筛密之初,工作人员专门针对馆藏档案数字资源进行了数据分析,将筛密样本分为1944—1966年,1977—1999年,2000年及以后3个不同时段,针对手写体、印刷体、图章等密级标识进行智能筛密鉴别工作。经过验证,以上3个时期档案平均筛查准确率为80.36%。随着机器训练的不断深入,筛出率和准确率还在不断提升。

  (2)“智能+档案鉴定”推动开放审核业务提档加速

  “智能+档案鉴定”模式通过大量的实践积累,建立多级敏感词库。同时,构建多维语义理解算法模型,突破单一的字、词匹配模式,从档案目录敏感字段、档案内容的敏感词、敏感语句以及敏感图像等多个维度进行语义理解,实现AI赋能档案鉴定工作。

  省档案馆采用的智能辅助鉴定系统经过两次升级。初期将智能鉴定功能嵌入数字档案馆系统的鉴定模块内,通过档案目录中的敏感词进行智能分析,给出AI预测值和敏感度,作为人工鉴定的参考,先期完成44个批次、200余万件档案辅助鉴定工作。后期系统升级,用1970—2000年5个不同全宗,600卷、13000件档案进行智能鉴定,经计算机初审给出智能鉴定意见,通过复审核查,准确率达到85%。目前该系统已大规模应用于档案开放审核工作,效率与准确率在实践中不断攀升。

  (3)“智能+档案编研”使编研工作变被动为主动

  编研工作的重点和难点在于对编研素材的分析和找到素材中的人物关系、事件关系和时间关系。知识图谱可以通过AI推理分析,挖掘出知识之间的关联、规律和趋势,从而实现自动化的知识推断和决策。省档案馆通过定制编研任务、固化编研模式,推动编研成果以知识图谱的形式展示,提升编研工作效率,使编研成果更加多元化、形象化、具体化。

  (4)“智能+利用服务”丰富档案检索手段,提升用户体验

  通过AI智能检索系统提高查准率、查全率。智能检索主要体现在两个方面。一是基于AI语义解析和大数据技术的智能推送体验。可根据原文的相似度和利用者历史查档行为进行自动分析,智能推送相关的档案内容。二是通过“以人搜照片”和“以人搜视频”功能,丰富档案检索方式。这一技术在进行照片及音视频档案目录整理过程中发挥了突出作用。这项技术的运用使得许多年代久远无法考证的老照片被识别,为后续分类、整理、鉴定、利用扫清了障碍。

  2.建设数字档案馆智能监管平台

  利用大数据可视化技术,以“模拟驾驶舱”的形式,通过数字档案馆运行综合展示、数字档案馆业务监管、中心机房及库房环境监管、数字档案馆系统日志监管4块大屏幕,对数字档案馆系统的业务和安全进行全流程监管和可视化展现。省档案馆据此分析出档案数字资源中的活跃数据和稳定数据,以此制定不同的长期保存和备份策略。通过档案利用数据的变化情况,掌握一段时期内查档利用需求,有针对性地开展全文识别和转换工作。同时也通过实时观测各项业务工作运行情况,动态掌握档案数字资源的保管情况。

  惟实励新,精进臻善。2023年是全面实施“十四五”规划的关键之年,也是辽宁省实现全面振兴新突破的开局之年,辽宁省档案馆将以建成“全国示范数字档案馆”为契机,继续向打造智慧档案馆的更高目标迈进,为打赢辽宁全面振兴全方位振兴的新时代“辽沈战役”贡献档案力量。

  作者单位:辽宁省档案馆

  责任编辑:王玥