从系统测试看全国高水平数字档案馆建设的三个特点

发布时间:2024-07-15 19:30:34被阅览数:125 次信息来源:《中国档案》

  文/ 王大众

  全国数字档案馆建设,从2010年国家档案局印发《数字档案馆建设指南》正式拉开帷幕。为了衡量和提升数字档案馆建设水平,做到以测促建,2014年,国家档案局印发《数字档案馆系统测试办法》,覆盖县级以上国家综合档案馆。《办法》设置了基础设施、系统功能、档案资源、保障体系4个一级指标,16个二级指标,测试采用百分制,结果达到80分以上认定为“通过国家级数字档案馆测试”,达到90分以上认定为“全国示范数字档案馆”。正式测试工作从2015年开始,截至2023年年底,9年间全国已建成91家全国示范数字档案馆,149家国家级数字档案馆。

  实践证明,通过开展数字档案馆系统测试工作,起到了较好的示范引领作用,有力推动了全国各地数字档案馆建设。国家档案局也借系统测试了解的实际情况,出台了一系列有针对性的标准规范,为加快全国档案馆数字化转型提供了有力支撑。梳理总结这些年测试工作的经验,可以看出全国高水平数字档案馆建设有不少共同特点。

  实现网络架构科学规划

  数字档案馆建设前期应对开展相关业务所需建设或接入的网络以及各网络应部署的业务进行统一规划。档案馆通常会面对政务内网、政务外网、互联网以及专用局域网。通过政务内网和政务外网开展档案数字资源在线移交接收,提供档案利用和共享服务等。通过互联网建设网站、微信公众号、移动App进行宣传、互动、开展查询利用服务等,一些档案馆也会通过互联网开展档案数字资源的主动采集,比如政府网站网页归档、馆藏相关多媒体档案采集,有的档案馆还会通过微信小程序、公众号等开展面向公众的红色档案资源、城市记忆、老照片征集。

  专用局域网通常是档案馆开展档案编研、鉴定、长期安全保存、备份、到馆查档等业务的核心网络。通常专用局域网络为非涉密网络,按照非涉密信息系统等级保护要求进行安全管理,主要是便于接收、管理、发布、利用档案数据。相对于涉密网络管理成本低、效率高,前提是确保非涉密局域网络中不存在涉密或被确定为以涉密方式管理的档案数据。这对于数据规模较大的档案馆来说,难度是很高的,但确是存在严重安全隐患、制约长远发展的关键问题,近些年越发受到高度重视。很多高水平数字档案馆都在开展测试前都进行了数据筛密工作。以辽宁省档案馆为例,全馆开展了近一年的数据筛密工作,同时使用了智能识别筛密工具,提升了工作效率和准确率。在此基础上的人工核对进一步提升智能识别水平,这是智能化合理应用的典型方式。

  也有单位将专用局域网确定为涉密网络,按照涉密信息系统分级保护要求开展安全管理。具体有两种方式,一种是建设在电子政务内网上,一种是单独建设。优势是管理安全级别高,但相对于非密网络管理成本高,在数据进出管理上,也需要有更加严格的审核审批流程。需要注意的是,即便确定为涉密网络,也要采取措施,确保网络中不存有密级在确定密级以上的档案数据。

  在网络整体规划上,一些档案馆的思路非常明确。如山东省档案馆提出“四网一岛一库”概念,“四网”即前面提到的四个网络;“一岛”是档案数据进馆安全岛,主要用于档案数据进入数字档案馆前的数据清洗和涉密分离等工作;“一库”是档案数字资源总库,涵盖全部馆藏。河南省档案馆提出“一库两中心三个服务平台”,“一库”是数字资源总库;“两中心”主要是与新馆建设同步进行,新馆、老馆进行同城备份,共同支撑数字档案备份中心和数字档案查询利用中心;“三个服务平台”是指基于局域网的馆藏数字档案资源服务平台、基于省电子政务外网的全省数字档案资源共享平台、基于互联网的公开档案数字资源服务平台。

  在网络整体规划确定后,应对各网络数据规模、应用量级现状、未来需求进行评估。数据规模包括对于现有情况的核查统计和对未来业务的增量评估,应用量级主要需要评估各类系统用户数、单位时间并发数量和数据流动带宽。例如,对于政务外网来说,仅仅支撑电子档案移交接收与同时提供电子档案共享利用相比是两个存储数量级别。对于互联网应用来说,百万以下用户数和百万以上用户数也有巨大区别,百万以上用户数的网络建设和防护要求陡然提升。

  信息技术与业务工作达到深度融合

  信息系统建设规划设计,主要是确定应部署的信息系统,各信息系统包括的模块,同一信息系统的各模块,不同信息系统间如何确保相互衔接、流畅运转,部署在不同网络的信息系统间如何传递和同步数据等。

  1.电子档案移交接收系统

  主要用于与立档单位之间完成电子档案及数字化成果的在线移交接收。一般会在政务外网上部署,也可以部署在政务内网上,主要取决于是否有业务需求。这个系统可以有功能延伸,比较普遍的是业务指导功能,就是档案馆可以实时看到移交前的数据情况,及时予以指导。还可以部署为方便立档单位使用,可以查阅利用本单位通过该平台移交的档案数据。

  在此基础上可以继续延伸建设集中式数字档案室系统,通过数据物理集中、权限逻辑分离的方式,为各立档单位提供对电子档案与数字化成果的“收、管、存、用”功能。

  2.馆藏档案综合管理系统

  该系统一般部署在专用局域网上,实现档案数字资源采集、接收、整理、保管、鉴定、编研、统计、开放审核、多媒体管理、库房管理、利用(到馆查档)等功能。一些数据规模较大的档案馆会专门建设海量数据长期安全保存系统,用以支持数据的检测、长期保存、安全备份等。这些功能,也有如开放审核、多媒体管理等是以单独应用形式存在,这与部署先后顺序、强化某项业务等相关。

  3.档案利用服务体系

  档案利用服务是目前各馆区别最大的地方。在服务方式上有查询响应、目录共享和全文共享等,在服务渠道上有互联网、政务网和到馆查档等。上海市档案馆通过政务内网开展了与全市16个区档案馆的数据共享,还印发了专门文件用于统一共享的数据格式。政务内网是机密级网络,使用政务内网开展共享,优势是安全级别高,可以实施除绝密数据外的所有档案数据共享,缺点是受众面小,只能由档案部门人员使用,再提供给利用者。江西省档案馆、湖北省档案馆通过政务外网实施共享,优势是可以直接面向公众,缺点是网络安全风险高,不能共享涉密和敏感信息。江苏省昆山市档案馆发表的《打好查档服务“组合拳”,增强群众对档案工作获得感》一文中,比较清晰地阐述了当前档案部门的利用服务体系层次,主要包括采用互联网的“网上查档大厅”、长三角一体化查档和接入全国档案查询利用服务平台:采用政务外网的与行政审批局、市场监管局、法院、城建档案馆、人力资源市场等共同开展的联动互查;采用现场查方式的到馆查档和市镇村三级查档自助机。

  档案数字资源建设得以切实加强

  档案数字资源是数字档案馆的基础和核心,其建设也是一个长期过程。数据规模大的档案馆,在档案数字资源建设方面的工作一般都会慎重考虑目标和周期。档案馆档案数字资源建设的重要工作包括电子档案接收、档案数字化及数字资源采集。

  高水平数字档案馆首先要建成覆盖全部馆藏的文件级目录数据库,为全部馆藏建立信息化台账。这是能够完整地以信息化方式管理、保存、利用档案的基本前提。其次是要完成一定比例的数字化工作。档案数字资源是档案信息化建设的主要管理和应用对象,因此,档案数字化工作一直受到各级档案部门高度重视。《“十四五”全国档案事业发展规划》提出“全国县级以上综合档案馆应数字化档案数字化率达到80%”,由各省级档案主管部门应根据本区域情况合理把握范围。

  在档案数字化方面,当前主要面临的是因开展工作较早,数字化规范不明确、应用设备技术不先进和双套进馆(移交纸质档案时同时移交数字化成果进馆的方式)规范不明确、质量把关不严格带来的数字化成果数据质量问题。一些档案馆采取积极有效方式,提升数字化成果数据质量。山东省档案馆、云南省档案馆科学规范数字化过程管理,严格数字化成果及进馆数据审核流程,广西壮族自治区档案馆持续开展数字化成果目录及原文数据质量核对,都取得了很好效果。一些档案馆在此基础上探索开展特定年代、特定类型档案的全文识别,取得一定成效。

  在电子档案接收方面,目前各档案馆在建设电子档案移交接收系统。根据国家档案局《电子档案移交接收办法》《电子档案移交接收操作规程》等确定的流程开展电子档案接收工作,相对容易实现。主要难点是受到区域信息化发展情况限制,区域内全程应用办公自动化系统、政务服务系统并产生规范电子档案的立档单位有限,部分档案馆电子档案管理基础设施不完善、信息系统功能不健全、人员缺乏电子档案管理经验,仅以简单形式管理电子档案,确保真实、完整、可用、安全的能力不足。

  总体来看,数字档案馆建设是一项系统工程,高位推动支持是其有力保障,科学整体谋划是其有序开展的前提,发挥效能、提升服务水平是其重要目标,做好安全防护是其底线。全国高水平数字档案馆建设的经验值得深入总结,也值得推广借鉴。

  作者单位:国家档案局

  责任编辑:王辉