发布时间:2024-12-13 08:19:50被阅览数:280 次信息来源:《山西档案》
作者:仇壮丽 刘敏
摘要:数据档案化治理是档案事业数字化转型的重要路径。基于数据档案化治理的现状,系统地梳理了档案数据治理领域的理论与实践成果,从数据整合与归档、数据质量、数据安全以及数字确权这四个关键维度出发,全面分析了当前所面临的挑战。基于此,提出了一系列协调数据档案治理的策略,包括多元化主体的协同合作、数据业务的生成与归档流程,以及智能化与技术赋能的创新路径,以期为我国的数据档案化治理提供参考价值。
关键词:数据档案化;数字化转型;科学数据;数据归档;多元主体
大数据时代的到来推动了数据的指数级增长,因此我国档案事业面临着数字化转型的挑战,在此背景下,数据档案化成为档案事业转型升级的一条重要途径。数据档案化旨在将档案学的思想与理念应用于数据管理,以促进数据的长期保存,确保其安全性和稳定性,进而推动我国档案事业的发展。2023年3月,中共中央、国务院印发《党和国家机构改革方案》,提出组建国家数据局。同年12月25日,国家数据局正式挂牌成立,这标志着国家从战略高度开始关注和重视对数据档案的管理。于档案领域而言,国家档案局作为与国家数据局在职能上有所交叉的数据管理机构,不仅要重视数据档案的转型,还要进一步协调与国家数据局的数据管理,从而探索数据档案治理的协调路径,以此为档案事业的发展提供新思路和新方向。
1 数据档案化治理概述
1.1 数据档案化的相关研究
关于“数据档案化”相关研究的总体状况,本文从近5年(2019—2023年)国家社会科学基金立项情况与中国知网收录的期刊论文两个角度出发,以“档案数据化”及“数据档案化”作为主要研究对象进行分析。据统计,国家社会科学基金已立项的“档案数据化”相关课题约12项,主要涉及档案数据管理、长期保存、协同治理、生态系统建构、安全治理等方面;而“数据档案化”相关课题只有1项,即章燕华负责的“数据档案化治理的基础理论与实现路径研究”。在中国知网的检索结果中,与“数据档案化”相关的论文数量为401篇,涉及数据档案的底层逻辑解析、新兴技术在档案数据中的应用和价值探索、高校或人事等领域的档案数据管理、数据安全治理等多个方面。学者们常通过对数据的分析,寻找数据、信息、知识与智慧之间的关系(DIKW模型),并运用档案学理论知识与思想,将“档案数据”作为档案管理的新对象和档案学领域的新目标进行研究。金波等[1]提出,档案数据是具备档案属性的数据记录,其范畴不仅包括经过档案数据化后的存量历史数据,还包括电子政务、社交媒体、智能终端等产生的实时原生数据。他还深入剖析了档案数据的内涵[2],并对档案数据质量保障[3]、档案数据安全治理[4]等方面进行了探索。但当以“数据档案化”为关键词进行精确检索时,相关论文只有3篇,主要聚焦于档案数据化与数据档案化的内涵透视及数据档案化治理研究两个方面。金波等[5]强调要聚焦档案数据内涵深化与实践创新,特别是在数据档案化层面,需运用档案学思想与档案管理专业方法,重塑数据档案化管理体系,以促进数据的有序归档与安全保管。
尽管如此,目前,整个档案领域对数据档案化的治理研究仍存在一定的局限性。只有章燕华[6]对数据档案化的治理框架进行了梳理。因此,对数据档案化的治理和协同发展研究是当前档案工作者需要关注的焦点。
1.2 数据档案化的内涵
“档案化”(archivization)[7]一词最初由西方哲学大师雅克·德里达(Jacques Derrida)在其专著《档案热病:弗洛伊德印象》(Archive Fever:A Freudian Impression)中正式提出。然而,与“archivization”相对应的英文词汇还有“archiving”,德里达所指的“档案化”主要是“对事件的记录”。在国内,学者何嘉荪等[8-9]就档案化问题进行了一系列阐述。他认为,德里达提出的档案化行为不仅仅是“对事件的记录”,还包括了档案化行为(archiving)的动态性,它之所以被人们所知,是因为它经过了背景化和再背景化的过程[10]。“数据档案化”(data archivization)中的数据和档案一样,经过了背景化和再背景化而为人所知,这表明数据已经历了“档案化”(archiving)的阶段。但目前国内对于“数据档案化”缺乏明确的定义,只阐述为“对数据档案化的管理”或“对数据档案化的治理”。数据档案化的本质是实行数据的档案化管理,旨在将档案学的专业知识与思想理念应用在数据资源管理中,实现数据资源管理的规范化、价值化和安全化。
当前对于业务部门和档案部门而言,“数据”和“档案”之间的管理和控制界限并不明确。业务部门在业务流程结束后产生的“数据”,往往被视为业务工作人员所需要管理的“档案”。若业务部门将这些“数据”“文件”“记录”等直接移交给档案部门统一管理,则可能带来操作上的不便。实际上,数据档案化管理从管理思维上来说强调弱化控制,主要通过干预数据资源管理来体现档案管理的价值,这一思维体现在不要求业务部门将数据资源的管理权限转交给档案部门,也不需要通过“归档”过程来明确划分数据阶段和档案阶段[11]。
尽管“数据档案化”的研究尚处于起步阶段,数据档案的管理主体和主体责任还不明确,但随着数字化转型的加速以及国家数据局的成立,从国家大数据战略角度出发,档案部门的定位、档案管理机构及数据管理部门的职能范围、数据管理中心、信息中心、档案馆等主体的职能划分将更加清晰明确。
1.3 数据档案化治理的意义
作为档案学与数据管理研究交叉融合的新兴领域,数据档案化管理具有重要的研究和应用价值。
第一,从理论维度来看,数据档案化治理不仅强化了对数据的控制和管理实践,还丰富了档案学的研究范畴,增强了学术自信。对各领域数据进行深度挖掘和有序归档,推动了学术的融合发展,促进了知识的创新,加强了跨学科研究与学术交流合作。
第二,从实践维度来看,数据档案化治理可以有效应对“数据孤岛”、共享障碍、数据安全与隐私保护等问题,能够促进数据的长期保存和可持续利用。此外,还能助力“数字中国”方案的有效实现,为档案与数据管理部门的工作提供决策参考。
因此,数据档案化的协调治理在多个领域具有重要的应用价值。它不仅确保了数据的持久性、安全性和易用性,而且为知识的沉淀与学术的探索奠定了坚实的基础。这一管理实践为政策制定者提供了可靠的数据支撑,激发了跨学科的创新合作,同时为社会治理的优化和数字经济的繁荣发展注入了强劲动力。
2 数据档案化治理的现状
2.1 宏观管理体制逐步完善
为有效解决数据行政管理职责多头管理、交叉分散等问题,以更好地发挥数据要素的价值,推动数字经济创新发展,国家为优化数据管理架构,成立了相关数据管理机构并出台了管理办法。
第一,成立相关机构。2023年12月25日,国家数据局正式挂牌成立。国家数据局明确了其职能,包括组织实施国家大数据战略,推进数字基础设施布局建设,组织数据要素基础制度建设,以及统筹推进数字经济发展[12]。国家高度重视数据资源管理,这一举措在一定程度上解决了数据管理分散的问题,有利于形成地方数据管理部门与国家数据局“上下联动”式的数据资源管理模式,进而推动国家数据治理[13]。截至2024年5月,全国共有31个省市级行政区设立了数据管理机构。江苏省数据局成为继国家数据局揭牌之后第一个省级数据局。为了规范各省数据管理,四川省数据局、上海市数据局、湖南省数据局(湖南省政务服务和大数据中心更名为湖南省数据局)、浙江省数据局等相继成立。多数机构的成立和更名均对标国家数据局的名称,上下一致,联动对齐,有利于建立起上下协同、标准统一、运行高效的数据管理组织体系。同时也揭示了规范数据资源管理的重要性,阐明了数据资源作为驱动数字化转型的核心和基础作用。各组织机构的成立,为数据资源的管理和档案事业的融合,以及数据管理部门与档案管理部门的互联互通提供了良好的契机。
第二,出台相关管理办法。为构建数据基础制度体系,2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)对外发布。该文件从个人、企业、社会三大数据权益主体视角出发,为数据治理过程中出现的权属界定不明、主体利益诉求不一致、数据生产和流通复杂等问题提供了指导性思路;也为提高数据要素治理效能、推动全民共享数字经济发展提供了有力支撑。为落实“数据二十条”,各地区出台了相关数据治理文件,例如,中共北京市委、北京市人民政府发布《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》,提出发挥“两区”政策优势,力争到2030年形成数据服务产业集聚区;上海市人民政府办公厅发布《立足数字经济新赛道 推动数据要素产业创新发展行动方案(2023—2025年)》,提出到2025年,数据要素市场体系基本建成;湖北省发展和改革委员会发布《湖北省数据要素市场建设实施方案》等。2023年12月,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,该计划中提出数据要素将聚焦于工业制造、现代农业等12个领域,推动各行业发挥数据要素的乘数效应,充分释放数据要素价值。
2.2 理论研究取得系列成果
数据档案化治理是大数据时代的重要课题,目前已成为众多学者研究关注的焦点。数据档案治理的研究对象广泛,包括红色档案、高校档案、城建档案、个人、企业与机构组织档案等[14];档案学界对各类型档案管理进行了深入研究,主要聚焦于数据归档、档案数据治理这两个方面。
章燕华[15]强调我国档案事业正从“档案大国”迈向“档案强国”。为促进档案信息化建设的高质量发展,诸多学者提出对电子文件归档与电子档案进行单套制管理。何思源等[16]提出从数据的生命周期入手,以归档范围和元数据标准为重点,对电子文件实行单套制管理。仇壮丽[17]强调应当对电子文件进行预归档,以促进电子档案的科学治理。于英香等[18]则将电子文件归档管理与知识服务相融合,提出了新的发展路径。李世华[19]则强调对政务数据资源进行档案化管理,主张扩大电子公文归档范围,以促进档案馆室一体化管理。
金波等[20]早在2019年就提出,从档案管理(archive management)到档案治理(archive governance)的转变,是档案治理体系和治理能力现代化的集中体现。档案数据治理的关键在于确保数据的高标准、高品质,保障数据在使用、存储和传输过程中的安全性,并构建一个完善的内部生态系统。例如,在U型理论指导下,通过语义滑动来促进数据的转换与价值释放[21],从而建立数据档案化模式。此外,为保障档案数据的高质量发展,有学者提出采用区块链、隐私计算、深度算法、聚类分析等先进技术对档案数据进行挖掘和分析,增强档案数据的可信力。基于TOE框架及PDCA[22]方法,可以有效促进档案数据质量的优化与提升。高质量的档案数据能够激发其活力,加快档案数据开放与共享,推动高质量档案数据赋能数字中国建设。最后,档案数据安全是档案数据治理的底线。面对网络黑客、数据泄露、病毒入侵等安全威胁,金波等[23]建议可以从法治建设、多元主体协同、利用技术赋能、培养专业人员等角度对档案数据安全进行协同治理,并构建一个档案数据安全体系,切实保障档案数据的安全。
2.3 部分领域取得实践进展
档案学与各学科之间交叉融合,多形式和多领域的数据档案不断涌现并取得实践成果,例如,在科学研究领域形成了科学档案数据,医疗领域实现医疗电子档案化管理等。
数据密集型的科学研究与科学发现已成为新的发展趋势,科学数据也随之成为重要的科技战略资源。中国科学院地理科学与资源研究所建立的国家野外科学观测研究台站(网络)和科学数据中心已成为国家具有重要影响力的科技基础支撑平台,引领着中国科学数据共享事业的发展[24]。科学数据的档案化治理、共享以及高质量利用成为了科学研究的首要任务。根据《科学数据管理办法》的定义,科学数据是科研档案的重要组成部分,且两者的目的相同,皆为共享和利用。孔祥盛[25]认为科学数据是科研档案的一个子集,并主张科学数据与科研档案应当统一管理,以推进科学数据的长期保存工作。蔡盈芳[26]也持类似观点,认为科学数据与科研档案应当协同管理。我国以北京大学、武汉大学、复旦大学为代表的高校已使用Python爬虫技术获取和聚类分析RDM数据要素,开展RDM服务实践,优化高校图书馆对科研数据的管理服务模式。上海交通大学为解决科研团队对科学数据的管理和共享问题,已推出科学数据平台,实现科学数据的档案化、共享化、实时化、科学化以及规范化管理。医疗数据对于医生、患者、家属等相关主体都具有重大意义。
医疗数据的档案化管理源于医疗实践,包括但不限于对患者病历、就诊检查影像资料、用药记录等数据的保存与使用。中南大学湘雅三医院以患者为中心,为重组碎片化的医疗数据,建立了电子病历无纸化系统[27],将患者的所有医疗信息在统一的标准下进行集成与存储。同时,湘雅三医院为实现电子病历的档案化管理,还建立了“病历博物馆”[28],该医院从1945年的第一份病历到最新入库的所有病历都保存在其中。医疗健康数据档案化治理是智慧医院建设的关键依托,通过数字化转型整合电子病历等医疗数据,促进医疗数据档案的一体化。这不仅确保了患者信息和医疗数据的安全性和可追溯性,而且使医生能够更准确地诊断和提出个性化治疗方案,同时也提升了医疗行业的整体水平与质量。
3 数据档案化治理存在的问题
在数据治理的整个生命周期中,档案化治理思维的嵌入使得数据的“采集、管理、利用”更加科学规范。在数据采集阶段,将前端控制理论和档案价值鉴定理论应用于数据的形成与归档,通过整合多源异构数据,为数据价值的实现奠定了坚实的基础;在数据管理阶段,需严格控制归档数据的质量,并构建全方位的数据安全保障体系,这是实现数据积累和确保数据长期可用的关键,也是数据档案化治理的核心工作;在数据利用阶段,应聚焦已归档数据的权属界定、数据资产的高效利用以及数据收益的合理分配,这不仅是实现数据资产增值的关键,还是数据档案化治理可持续发展的重要措施。从当前的数据档案化治理实践来看,主要存在以下三个方面的问题。
3.1 数据整合与归档问题
挖掘、整理、分析与归档大量且分散的数据是数据档案化治理的首要难题。一是异构数据的复杂性。多样性数据难以整合,主要体现在异构数据源与异构数据库的兼容性问题上。例如,医疗数据会产生包含关系型数据库中患者信息的表格数据、患者病史等电子健康记录、X射线片、CT扫描、心电图与血压监测等医疗设备的二进制存储数据,以及可穿戴设备和医疗实时监测的连续流数据等。这些多样的数据类型与数据存储格式分散在不同的医疗机构和存储系统中,如医学影像存档和通信系统(PACS)、电子病历系统等。这些系统间的数据格式、数据模型、数据访问接口、数据标准等各不相同,如PACS遵循国际DICOM标准实现数据访问,而电子病历系统可能采用HL7、FHIR等标准进行数据交换,导致数据难以在不同系统间有效整合与归档。二是数据保存的完整性。档案数据完整性问题主要体现在档案数据归档不齐全和归档数据属性缺失,其中元数据缺失是档案数据属性缺失的重要表现。在数据库建设和利用的过程中,诸如数据字典不完整、数据生命周期信息缺失、数据关系未记录等现象,影响了档案化管理的进程。此外,数据存储介质的寿命以及数据存储环境的稳定性也是造成数据难以归档齐全和长期保存的重要原因。数据存储介质,如软盘、硬盘、磁带、光盘等,都有固定的寿命,随着时间的推移和技术的更新,存储介质可能会出现老化或损坏的现象,导致数据丢失,旧技术可能无法支持数据迁移到新的存储设备上。
3.2 数据质量与安全问题
档案数据的质量控制与安全保障是直接影响档案数据能否长期保存的关键因素。数据的完整性、准确性、规范性、一致性、时效性与可访问性共同构成了数据质量评价指标框架。在数据档案化的质量治理主要强调数据的准确性与规范性。不准确或错误的数据会导致垃圾数据(Garbage in,Garbage out)的产生,并严重降低档案数据的价值。在档案工作中,数据的规范性问题包括档案数据的馆藏重复、档案数据的时效性滞后、数据标准不一致和不可访问性等。而数据格式不统一、命名规范混乱、编码规则多样等问题则直接阻碍了数据标准化体系的建立。此外,数据在归档过程中常涉及大量敏感信息与历史数据,数据隐私泄露、数据独裁、数据孤岛等现象极易引发数据安全问题。由于组织内部或外部攻击者的恶意行为,可能导致数据被窃取、泄露或滥用。例如,2016年雅虎数据泄露事件显示,该公司超过10亿用户账号被黑客窃取,导致股价跌幅超过6%[29]。数据独裁表现为当前人们过度依赖数据作出选择和判断,可能导致人类被数据所控制。若不对爆炸式增长的数据进行档案化管理,不采取正确的辨析与清洗手段,数据独裁现象将逐渐渗透并影响人类生活。当前,数据孤岛和数据共享困难主要表现为数据隔离、访问权限限制、数据冗余、数据集成困难以及业务协同受阻等问题。例如,不同业务部门间因信息共享不畅和业务流程复杂,导致公众在办理业务时出现“来回跑”的现象。
3.3 数据确权与收益问题
数据档案化治理体系以数据的共享、服务与利用为目标,因此数据确权与收益分配问题成为档案数据治理过程中的核心议题。一是确定数据的所有权、使用权和控制权的归属。在档案领域表现为档案数据归属权不明、档案数据使用权限边界模糊、档案数据流通的合规性等问题[30]。例如,湖南省常德市桃源县的档案管理存在多头管理的现象,法院、检察院、公安局以及民政局等部门均自行保管档案,未依法将到期档案及时移交给县综合档案馆[31]。这种分散的档案管理模式不仅降低了数据归档和保管的效率,而且限制了档案数据潜在价值的挖掘与利用,影响了数据驱动决策和创新活动的有效性。二是数据收益分配不均。“数据二十条”将数据权利定义为“数据产权”,强调要尊重数据处理者的劳动权,充分保障其使用数据与获得收益的权利。由于档案数据涉及多个利益相关者,档案的衍生数据以及公共数据的界限难以界定,如科学数据的版权归属、公共数据商业化等。数据收益是指通过数据交易、数据分析、数据服务等方式获得的经济利益。反映在档案领域表现为档案数据价值挖掘不充分、数据利用规则不明确、数据利益分配机制不完善等问题。例如,医疗数据利用缺乏明确的数据利用收费标准和应用成果转化的分配方式[32]。对数据进行要素化、资产化、档案化处理,对于促进数据流通并实现数据价值的最大化至关重要,这有助于提高档案数据的流通率与利用率。
4 数据档案化治理的协调路径
4.1 主体协同
4.1.1 制定相关政策指南,促进各主体间相互交流
随着大数据技术在档案事业中的应用,新型数据管理部门在履行职责时,往往需要档案部门的支持与协作。基于数据档案化管理,国家已出台《科学数据管理办法》,强调科研数据与科研档案的协同管理。然而,国家应进一步协同各主体机构,制定明确的数据归档范围、保管期限等相关的数据档案化政策指南,建立数据共享与档案保护的合作机制,以解决“数据孤岛”、数据归档不齐全等问题,以此推动数据档案化的管理进程。
其一,主体间合作机制。在建立统一的合作机制下,促进资源和技术共享。例如,联合研发数据档案化管理系统,加强各主体在归档系统开发方面的合作,促进数据在统一平台上的资源共享,提高资源利用率。
其二,主体间交流机制。高校、政府机构、科研院所、企业、学会等主体应加强交流。高校主体可以强化与档案学相关的学科建设,培养更多的档案专业人才,为档案专业毕业生提供档案管理岗位的实习和就业机会,从而促进与各档案管理机构主体间的交流。
其三,社会主体参与机制。鼓励社会各界通过档案志愿服务、资助捐赠等形式来支持档案工作,组织公众参与档案政策听证会,推动协商民主决策。同时,鼓励家庭建档、社群建档、社会办馆,形成从个人到家庭再到社会的档案协同治理格局。
4.1.2 划分管理职责界限,助推跨机构间的合作
为解决数据确权与机构职能界定不清的问题,各机构应明确在数据档案化中的角色,在统一的数据标准下,通过划分职责界限促进跨机构合作,实现档案数据的融合。
其一,定期召开协调会议。在会上讨论合作事项与划分管理职责,与会人员应包括部门领导及相关工作人员,确保信息交流和决策的高效性。明确共享数据的行使权、使用权、管理权归属,划分各管理部门职责,召开与档案数据相关的主题会议。
其二,建立一体化数据与档案分类体系。在职能分析的基础上,采用合理的技术与方法,将所管理的数据与档案建立关联,实现数据湖与档案管理系统中所含资源在逻辑上的一体化[33]。
其三,联合培养复合型人才。培养既具备档案理论基础又精通数据管理的复合型人才[34],使其能够更好地成为机构间的桥梁,引领数据档案化发展的新方向。
此治理模式促进了国家数据局、国家档案局等机构间更加多元化和深入的主体协同合作。通过这种跨领域的合作,能够探索出数据档案化治理的创新路径,为信息资源的长期发展和战略布局提供强有力的支撑和动力。
4.2 业务驱动
4.2.1 优化数据归档流程,规范数据归档标准
数据归档流程与标准规范是数据档案化管理的核心内容。通过技术手段系统规范元数据标准,确保数据准确传递与历史真实记录。传统数据归档先将数据存储在相关介质(磁盘、U盘、硬盘等)上,再由专人将实体介质携带至数据归档域,最后在归档域进行线下归档和存储。当业务部门需要使用相关数据时,需向档案部门提出申请,再通过实体介质将数据提供给需求方。在智能化时代背景下,为提高数据归档效率和保障档案数据安全,当前数据归档更倾向于使用自动归档系统。
为解决数据标准化问题,需统一元数据标准格式。例如,数据文件在保存时可选择表格格式为其标准格式(xls,xlsx,csv等),数据背景信息则可选择文本格式(txt)等。中国石油业务系统积极推动数据归档工作,已经完成电子公文系统(OA)、财务ERP和财务管理系统(FMIS)、合同管理系统和招标系统的数据归档工作[35]。江苏省昆山市档案馆为促进电子文件数据预归档,于2022年着手开发电子文件归档和电子档案管理系统[36],将电子文件归档进行单套制管理,有力支撑了政务服务的“一网通办”。自动归档系统在接收数据时,可以将数据格式抽象为“参数名:参数值”,确保在二进制的系统中,实现数据查询、分析和利用均能自动匹配参数名[37]。对于数据内容标准而言,在数据参数名建立后,应针对数据的保管期限设定明确的数值,便于后续数据的利用,减轻档案人员的工作压力,提高归档工作效率,优化整个归档机制。
4.2.2 挖掘数据资产价值,健全机制以激活市场
档案化管理是数据规范化、系统化、资产化的关键。基于档案化管理的深入挖掘,能够揭示数据的潜在价值,是激活市场活力、开辟新商业路径的重要途径。这一过程不仅促进了数据的深度利用,还推动了信息的透明化和有序化流通。数据要素作为数字经济发展的核心要点,具有显著的经济特征。需要注意的是,档案数据本身并不一定具有价值,而是资源管理机构通过挖掘与分析这些数据,驱动决策,从而创造出数据要素的资产价值。
所谓“数据驱动”,是要将数据应用于实际场景,实现数据的价值转化。我们可以利用档案数据开发新的产品或服务,推动行业的创新发展;利用数据支持政府决策和公共管理,提升社会治理效能;利用数据推动科学研究和教育教学创新,促进知识传播和人才培养等。总之,数据采集、整理、数字化、开放共享、分析挖掘、应用转化等一系列环节,可以有效激活数据的资产价值,推动档案事业乃至整个社会的创新发展。
在此前提下,各主体应建立数据安全、市场运行、生产要素分配、协同政府监管等机制,为数据供应方和需求方提供稳定的数据平台运营保障。随着生产要素参与分配机制的日益健全与完善,数据要素市场化配置的相应制度也在不断地规范和完善。这一进程将逐步明确数据的所有权界限,为数据的合理利用、流通和保护提供坚实的法律基础和清晰的权责界定,进而推动数据资源的高效配置,实现数据资源价值的最大化利用。建立健全数据规范与标准化、数据要素分配等机制,不仅能激活市场,还能确保数据交易的安全性和公平公正,进一步优化资源配置。
4.3 技术赋能
4.3.1 强化档案数据安全,构建多元化治理体系
安全是档案工作的底线和红线,是数据档案化管理的基本保障。档案数据安全涉及开放共享、数据验收、数据备份、涉密管理等多个环节。
其一,制定档案数据安全制度。加强对数据“敏感治理”模式的构建,以电子档案管理相关的法规为依据,引导档案化思维与数据治理的逻辑自洽,共同打造数据安全治理生态圈。
其二,在物理环境层面,需加强档案存储设备、网络设施、电力供应等基础设施的安全控制,以构建安全稳定的环境。例如,河北省石家庄市行唐县智慧档案馆就采用RFID技术对档案库房的温度、湿度、空气质量等环境参数进行实时监测和智能调控,确保了档案的安全保存[38]。
其三,及时备份重要的档案数据,以防止其意外丢失或损坏,确保档案数据的完整性和可用性。具体措施包括对档案数据进行定期全量备份、异地备份,以应对各种突发情况,确保数据的完整性不受影响。
其四,采用人工智能、区块链等先进技术手段,有效防范网络攻击和恶意软件的威胁。同时,在数据归档前,应对数据进行判断、清洗和筛选,排除低质量数据,减少数据异化和数据独裁的风险。例如,位于天津市的海河档案馆就建立了电子档案多层加密平台,通过对象访问控制、用户访问控制、系统日志管理和档案数据传输加密等多种手段,对电子文件进行了全面加固[39],进一步确保电子档案数据的安全保存。在构筑多元化治理体系的过程中,应不断完善和优化档案数据安全管理措施,以确保档案数据的机密性、完整性和可用性。
4.3.2 运行“参与式”管理模式,搭建全方位管理平台
随着智能化终端的广泛普及与应用,“参与式”档案管理模式的提出为数据档案化管理提供了新的角度。这一模式与以往档案管理工作模式的显著区别在于其充分利用了媒体环境,将个体视为档案初始的生成者,鼓励具备教育背景和档案管理认知的个体,整合自我信息,并参与档案管理工作。因此,实施“参与式”管理模式,不仅需要档案工作者、研究人员、高校教师及档案专业学生的参与,还需借助媒体手段,广泛收集来自不同领域、不同专业背景、不同年龄阶段公众的“声音”,让公众对数据档案化治理给出多角度反馈,从而推动知识服务与知识创新的协同发展。
同时,搭建集中的数据档案管理平台,为档案化管理提供信息共享与整合数据资源的基础支撑。例如,国家数据局与国家档案局可携手搭建数据档案管理和交流平台,这不仅可以促进机构间的信息互通,还可在平台上设立信息交流和反馈门户,作为各主体间交流的枢纽。各主体通过该平台共享档案资源,可有效避免重复工作,提升数据利用效率,打破“数据孤岛”现象。浙江省档案局与浙江省民政厅为打破民政部门与档案部门间的壁垒,通过推出婚姻登记数据电子化归档、异地查档等服务,促进了婚姻档案数据的共建共享。此外,高校和研究机构的科研成果也能为档案化工作提供理论和技术支持。档案数据管理机构的基础设施建设可运用数据挖掘技术构建数据档案资源模型,对电子文件先进行预归档处理,再通过元数据系统,实现数据的档案化、规范化管理。
5 结语
在“信息资源管理”的新文科建设背景下,档案学科如何以数字中国战略为导向进行数字化转型,是所有档案学者和相关机构应当探索的路径。数据档案化作为加快这一转型的关键路径之一,值得深入探索。首先,明确划分机构权责界限,促进各主体之间的合作与交流;其次,在此基础上创新档案数据的开发利用方式,激活其潜在的社会价值;再次,加强数据安全治理,守好数据安全的底线。数据档案化的协调管理不仅能够拓展档案事业发展的空间,还能助力社会数字化进程,推动数字中国目标的实现,为公众创造更加便捷的社会环境,进而促进数字经济的稳步增长。
参考文献
[1]金波,杨鹏.档案数据治理生态运行演化与平衡调控[J].信息资源管理学报,2023,13(6):62-71.
[2]金波,添志鹏.档案数据内涵与特征探析[J].档案学通讯,2020(3):4-11.
[3]金波,孙尧,杨鹏.基于区块链技术的档案数据质量保障研究[J].图书馆杂志,2023,42(10):25-33.
[4]金波,杨鹏.大数据时代档案数据安全治理策略探析[J].情报科学,2020,38(9):30-35.
[5] 金波,杨鹏,宋飞.档案数据化与数据档案化:档案数据内涵的双维透视[J].图书情报工作,2023,67(12):3-14.
[6]章燕华.数据档案化治理研究:一个研究分析框架[J].浙江档案,2022(11):25-29.
[7] DERRIDA J.Archive fever:a freudian impression[M].Chicago:University of Chicago Press, 1996.
[8]何嘉荪,史习人.对电子文件必须强调档案化管理而非归档管理[J].档案学通讯,2005(3):11-14.
[9]何嘉荪,马小敏.后保管时代档案学基础理论研究之四:档案化问题研究[J].档案学研究,2016(3):4-11.
[10]何嘉荪.从德里达的“档案化”到中国的“档案化治理”:大数据时代档案学理论的“扬弃”[J].浙江档案,2023(12):32-33,36-38.
[11]赵跃,孙晶琼,段先娥.档案化:档案科学介入数据资源管理的理性思考[J].档案学研究,2020(5):83-91.
[12]张克.从地方数据局到国家数据局:数据行政管理的职能优化与机构重塑[J].电子政务,2023(4):58-67.
[13]冉从敬,刘妍.国家数据局的成立及信息资源管理学科拓展[J].信息资源管理学报,2023,13(4):6-9.
[14]杨杰,马海群,邹纯龙.档案数据敏捷治理体系研究[J].山西档案,2024(1):25-32.
[15]章燕华.以数智化驱动引领档案事业现代化的发展进程与实施路径[J].档案学通讯,2023(6):4-13.
[16]何思源,张静.科研电子文件归档与电子档案管理探索性研究[J].中国档案,2023(1):62-63.
[17]仇壮丽.论预归档与电子文件的科学治理[J].档案学刊,2022(1):53-57.
[18]于英香,冯卉.电子文件归档管理与知识服务的冲突及理论思考[J].档案学研究,2023(3):79-86.
[19]李世华.基于政务云的统一政务数据和电子文件归档体系[J].中国档案,2024(3):44-45.
[20]金波,晏秦.从档案管理走向档案治理[J].档案学研究,2019(1):46-55.
[21]安新宇,钱毅.基于U型曲线理论的数据档案化模式构建研究[J].档案学研究,2024(2):106-115.
[22]周枫,金波.基于PDCA模型的档案数据质量治理研究[J/OL].情报科学:1-18[2024-05-15].http://kns.cnki.net/kcms/detail/22.1264.G2.20240506.1623.006.html.
[23]金波,杨鹏.大数据时代档案数据安全保障探究[J].档案学通讯,2022(3):30-38.
[24]廖小罕,封志明,高星,等.野外科学观测研究台站(网络)和科学数据中心建设发展[J].地理学报,2020,75(12):2669-2683.
[25]孔祥盛.汇交政策视角下科学数据与科研档案协同管理困境与反思[J].档案与建设,2023(1):62-66.
[26]蔡盈芳.推进科学数据与科研档案的协同管理[J].中国档案,2021(9):60-61.
[27]中国卫生信息管理杂志订阅号.中南大学湘雅三医院:互联互通造就电子病历无纸化,助力医院高质量发展[EB/OL].(2023-11-03)[2024-05-15]. https://mp.weixin.qq.com/s/TTIPIWzhfmoj5Hn1RfsERQ.
[28]傅容容.探访湘雅医院“病历博物馆”:从笔尖到指尖,260万份病历见证医学进步[EB/OL].(2023-02-12)[2024-05-15].https://news.csu.edu.cn/info/1063/155067.htm.
[29]雅虎数据泄露门[EB/OL].(2016-12-14)[2024-05-23].https://baike.baidu.com/item/%E9%9B%85%E8%99%8E%E6%95%B0%E6%8D%AE%E6%B3%84%E9%9C%B2%E9%97%A8/20283886?fr=ge_ala.
[30]顾安清.大数据时代档案数据权探析:提出、内容及保护路径[J].档案管理,2022(4):25-28.
[31]肖成良.县级档案行政管理机构设置存在的问题及解决对策[EB/OL].(2016-10-08)[2024-06-13].https://sdaj.hunan.gov.cn/sdaj/xhyqk/daxh_78268/xslw/201610/t20161008_3302889.html.
[32]王雪,夏义堃.健康医疗数据利用中数据权益保障的现实困境与完善对策:以欧盟健康数据空间为例[J].图书与情报,2024(2):55-68.
[33]刘越男,何思源,王强,等.企业档案与数据资产的协同管理:问题与对策[J].档案学研究,2022(6):94-102.
[34]陈雪燕,于英香.从档案管理走向档案数据管理:大数据时代下的档案管理范式转型[J].山西档案,2019(5):24-32.
[35]王强,高强.业务系统数据归档研究:以中国石油业务系统数据归档实践为例[J].浙江档案,2019(12):36-39.
[36]朱建忠.打造档案信息化系统矩阵推动进入后数字档案馆时代[J].档案与建设,2023(12):71-72.
[37]房果,李浅语,杨静,等.科研试验数据跨域归档研究[J].档案与建设,2024(3):42-48.
[38]因朵集团.河北石家庄市行唐县智慧档案馆建设案例分享[EB/OL].(2024-01-22)[2024-05-14].http://yinduokeji.com/shows-1201-42.html.
[39]海河水利委员会.海河档案馆获首个计算机软件著作权[EB/OL].(2020-09-09)[2024-05-14].http://www.hwcc.gov.cn/sxdzt/hwjswmjs/hwjswmjswmcj/202009/t20200909_85421.html.
【作者简介】仇壮丽(1975—),男,汉族,湖南安化人,湘潭大学公共管理学院教授、博士生导师,博士,研究方向:档案保护技术、档案信息化建设;刘敏(1999—),女,汉族,湖南郴州人,湘潭大学公共管理学院硕士在读,研究方向:档案信息化建设。