政策工具视角下的档案数据质量保障研究

发布时间:2024-12-26 08:08:56被阅览数:330 次信息来源:《山西档案》

  作者:赵欣淼 杨智勇

  摘要:数智时代下,档案管理对象正由数字形态向数据形态跃迁,管理空间也逐步由物理空间转向数字空间。档案数据质量不仅是档案数据治理的关键所在,还是档案数据化研究中的核心问题之一。采用内容分析方法,从基本政策工具和基于生命周期的档案数据质量两个维度对选取的国内外16篇政策文本进行了量化分析。分析结果表明,我国档案数据质量保障过程中存在法规制度不健全、标准规范不统一,多元主体间沟通不畅、协作机制尚未成型,以及档案数据质量保障的“末梢神经”不敏锐等问题。针对这些问题,分别在宏观、中观、微观三个层面提出了相应的优化路径。

  关键词:政策工具;档案数据质量;生命周期;协同共治

  随着新一代数字技术向纵深发展,各类数据呈现爆炸式增长,日益成为推动产业发展的新引擎。档案数据作为数据资源的重要组成部分,同样蕴藏着巨大的价值和潜能。然而,在深入挖掘档案数据价值的过程中,数据污染、数据缺失、数据冗余等一系列质量问题严重阻碍了档案数据价值的实现,因此,档案数据质量亟须得到加强管控和优化。当前,有关档案数据质量控制的研究重点主要围绕概念内涵和保障机制两方面展开。针对档案数据质量概念内涵,有学者提出,档案数据质量是在数据质量概念的基础之上[1],结合“档案数据”的特殊性进行理解的。它既包括档案内容数据、档案目录数据等与档案本身直接相关的数据质量,又涵盖档案利用数据等档案管理过程中积累的数据质量[2]。而针对档案数据质量保障机制,诸多学者从技术、制度、组织机构、管理方法等多个维度提出了相应策略。在技术维度,以区块链技术为例,通过区块链技术强化主体信任约束[3],并完善区块链技术应用的法治保障体系[4];在制度维度,档案机构积极制定档案数据质量控制规范[5],如档案数据质量监管制度[6]等;在组织机构维度,为保障档案数据质量,应协调各方力量,建立协同联动机制[7],形成档案数据质量保障主体之间互动、制衡、协作的关系,实现多元主体的协同共治[8];在管理方法维度,借鉴PDCA模型,将档案数据质量治理分为计划、执行、检查、改进四个阶段,通过循环往复的过程,持续提升档案数据质量[9]。总体而言,现有研究主要立足于档案数据治理现状,从宏观层面提出了对档案数据质量的理解,并提供了档案数据质量提升的管控机制与保障策略;但针对档案数据质量保障控制的系统研究仍相对薄弱,缺乏基于过程视角对档案数据质量保障的深入分析。因此,本文引入政策工具,根据政策特点与档案数据质量控制的要求,并结合档案数据全生命周期进行系统分析。针对档案数据质量政策制定及档案数据生命周期过程中存在的质量问题,提出了档案数据质量保障路径,以期为档案数据高质量发展提供借鉴思路。

  1  工具-生命周期二维政策分析框架

  政策工具作为行政治理的有效手段,是政策从理念转变为现实的关键路径,其核心是将政策制定者的价值选择转化为政策执行者的行动措施[10],从而为理解政策文本提供多维度的视角与方向,因此,可将政策工具设定为X维度。然而,政策工具的分类更多地展现了不同类型的政策手段。结合档案数据质量在全生命周期中的动态特性,将基于全生命周期的档案数据质量保障设定为Y维度。基于此,本文构建了以政策工具为X轴,基于生命周期的档案数据质量保障为Y轴的二维政策分析框架,旨在探索档案数据质量保障的提升方向与可行路径。

  1.1 X维度:基本政策工具

  政策工具是管理者为了实现高效、高质量的治理目标,而对各项活动采取的一种约束和规范手段。政策工具本身具有多种分类方式,其中,由ROTHWELL  et  al[11]提出的分类方法目前得到世界的公认,即将基本政策工具分为供给型、环境型和需求型三种类型。因此,本文以基本政策工具的这三种类型作为X轴的分类依据。这三类政策工具各自发挥着不同的作用,如图1所示。

1.jpg

图1  政策工具对档案数据质量的作用机制

  供给型政策工具是通过一系列活动、措施等来直接保障档案数据质量,为档案数据质量提供技术、资金等方面的支撑。环境型政策工具则为档案数据质量、档案数据治理等营造良好的管理环境,起到间接的促进作用。需求型政策工具旨在减少影响档案数据质量的不确定性因素,拉动和保障档案数据质量的持续提升。三类政策工具的具体名称及含义如表1所示。

表1  政策工具类型、名称及含义

2.jpg

  1.2 Y维度:基于生命周期的档案数据质量保障

  由于政策工具分类更多体现的是各类型政策手段的特点,而并未直接表明政策目的所在[12],因此仅通过X维度并不能全面深入地探究档案数据质量保障问题。为了更全面、系统地保障档案数据质量,需要确保在其生命周期的各个阶段都能得到妥善管理,因此将基于生命周期的档案数据质量保障设置为Y维度,各阶段活动的具体内涵如表2所示。

表2  基于生命周期的档案数据质量保障

3.jpg

  1.3 二维交叉分析框架

  X轴代表基本政策工具,涵盖了不同类型的政策手段;Y轴则代表基于生命周期的档案数据质量保障,即档案数据在全生命周期过程中的质量动态保障机制,如图2所示。借助工具-生命周期政策二维分析框架,可以深入研究档案数据质量保障策略。

4.JPG

图2  工具-生命周期二维政策分析框架

  2  档案数据质量政策文本选择与内容编码

  2.1 政策文本选择

  笔者在“北大法宝”数据库中,以“档案”“档案数据”“信息”“数据”“数据质量”为关键词进行了检索。为确保所选政策文本的权威性和时效性,将国内政策文本的时间范围设定为“2010年1月1日至今”,并将来源设定为“中央法规”。由于目前尚未出台专门针对保障档案数据质量的法律法规,因此将检索范围从档案领域扩展到更广泛的数据层面。此外,还借鉴了相关行业领域的数据质量规范以拓展研究视角,并提升档案数据质量规范的合理性和科学性。同时,考虑到部分政策文本可能未收录到数据库中,笔者还对国家档案局网站、《档案工作文件汇集》等渠道中的相关政策进行了补充收集。最终,共选取了11份与“档案数据质量”主题相关的国内政策文件。

  在国外文件的选取方面,美国是世界上第一个实现档案信息网络一体化的国家,英国、澳大利亚等国家紧随其后,在档案数字化、数据化方面取得了显著进展。因此,笔者围绕“档案数据质量”这一主题,以“archive data”“data”“data  quality”为关键词,在澳大利亚国家档案局官网、英国政府官网、国际货币基金组织官网、欧盟统计局官网、美国政府官网等多个权威网站中进行了检索。经过筛选,最终选取了5份与主题相关的国外文件。

  通过以上步骤,笔者共梳理出16份国内外政策文本,具体如表3所示。

表3  国内外档案数据质量政策文本列表

5.JPG

  2.2 政策文本内容编码

  笔者对表3中选取的16份国内外政策文本内容进行了深入分析,并根据其内容出现的位置进行了编号。具体编号方式依据政策文本内容的自身结构,以“政策序号-文本章节”的形式进行区分,如表4所示。

表4  国内外档案数据管理政策文本内容编码示例

6.JPG

  3  政策文本的量化分析

  借助基本政策工具-基于生命周期的档案数据质量保障二维框架,对16份国内外政策文本进行了编码分析,分别在X维度、Y维度、交叉维度上进行了总结。

  3.1 基本政策工具维度分析

  在对政策文本内容进行编码后,将编码结果依次归纳到对应子项中,得出了基本政策工具的具体分配比例图(见图3)。经统计,供给型政策工具占比27.6%、环境型政策工具占比61.9%、需求型政策工具占比10.2%。

7.JPG

图3  X维度基本政策工具具体分配比

  3.1.1 供给型政策工具维度

  在供给型政策工具中,公共服务(10%)的占比最高,其次是人力资源建设信息技术支持。这显示出国家对档案数据利用服务的高度重视,通过政策规定深入分析和挖掘档案数据资源,同时提供智能化的公共服务。人力资源建设(7.4%)与信息技术支持(6%)的比例相当,这从侧面印证了信息技术的应用与人力资源的培养、管理应保持同步,且两者在地位上同等重要。相比之下,基础设施设备(2.8%)和资金投入支持(1.4%)的比例较低,因此,国家应更加重视基础设施设备在档案数据安全保障中的作用,构建完善的基础设备设施体系。从实践角度看,国家应提高资金供给意识,鼓励档案馆等多主体利用资金积极探索新一代信息技术在档案数据质量保障中的应用,以充分发挥数据的价值。

  3.1.2 环境型政策工具维度

  由图3可知,保障档案数据质量主要依靠环境型政策工具进行相应的规范、约束。在环境型政策工具中,占比最高的是法律管制(23.5%)。提升档案数据质量,最为基础也最为有效的手段就是法律管制。法律管制在初期阶段能够保障档案数据质量,但过度依赖法律条文的管制作用,反而可能不利于档案数据质量的长期良性发展。相较于法律管制,策略性措施(9.4%)更具灵活性。例如,《中华人民共和国数据安全法》鼓励企业、社会团体、教育机构、科研机构等参与标准制定,这既明确了整体方向,又营造了相互协调、配合的社会共治氛围,优化了档案数据治理环境,为档案数据质量提供了有力保障;同时,也为多主体提供了发挥各自效用与价值的能动空间,充分调动了其积极性,使其能够投身到档案数据质量保障活动中。在权责分属(3.8%)方面,明确职责划分以及保护知识产权至关重要。例如,科学数据使用者应遵守知识产权相关规定,以维护多元主体的合法权益为立足点,为档案数据质量保障创造良好的环境。数据安全(11.4%)和数据共享、流通(3%)也是重要方面。数据安全贯穿于数据的全生命周期,包括载体安全以及传输过程中可能出现的数据丢失、失真等质量问题,这些都需要高度重视。

  3.1.3 需求型政策工具维度

  需求型政策工具相较于其他两类政策工具的使用稍显不足。具体而言,服务外包机制(1.4%)、社 会 参 与(1.8%)的占比相对较低,这表明国家对于专业技术机构、数据管理部门以及公众参与的关注度和支持力度还有待进一步提升。而合作交流机制(7%)则是促进档案数据共享利用的有效途径,同时也为构建立体化、网格化的主体协作交流机制提供了契机。

  3.2 基于生命周期的档案数据质量保障分析

  结合基本政策工具维度对Y维度进行分析,得出了基于生命周期的档案数据保障基本分配比例图(见图4)。由于政策工具可以作用于档案数据的不同阶段,进一步绘制了基本政策工具与基于生命周期的档案数据质量保障二维频数分布统计表(见表5)。

8.JPG

图4  基于生命周期的档案数据质量保障基本分配比例

表5  二维频数分布统计表

9.jpg

  统计结果显示,政策工具在基于生命周期的档案数据质量保障上存在分布失衡现象。其中,应用最多的是档案数据环境保障(57.3%),其政策工具运用较为均衡,涵盖了人力资源的建设、沟通交流机制的引导与强化、信息技术和基础设施设备的投入等诸多因素,这些因素共同构建了独属于档案数据质量的文化环境体系。而应用最少的为档案数据分析(2.6%),二者相差悬殊,这也充分体现了政策文本在档案数据全生命周期应用中的薄弱环节。美国行政管理和预算局发布的《2021年联邦数据战略行动计划》中提出将数据链接到原始来源,并将数据发布为集成主题或知识图谱。这启示我们,档案数据质量保障的最终目的与归宿是为共享、利用服务。因此,借助大数据、区块链等现代信息技术,一方面,可以实现档案数据资源之间的深度关联,为档案知识组织、知识发现等提供优质数据,从而释放、盘活档案数据的价值;另一方面,将推动档案数据在跨学科、跨行业、跨地域之间的整合与共享,消除数据沟通的障碍。

  3.3 交叉维度分析

  根据国内外文件的分析结果,借鉴国外的经验与教训,总结了国内档案数据质量当前所存在的具体问题,主要集中在档案数据质量保障的法规制度不健全及标准规范不统一,多元主体协作机制尚未成型,档案数据质量保障“末梢神经”不敏锐等方面。

  3.3.1 档案数据质量保障法规制度不健全、标准规范不统一

  当前,国家尚未出台专门针对档案数据质量保障的法律条文,缺乏顶层设计,导致档案数据质量管控力度不足。然而,在《“十四五”全国档案事业发展规划》《信息技术 数据质量评价指标》等政策中提及需要保障数据质量,可见国家已经认识到档案数据质量对档案数据化等工作的重要性。但专门针对档案数据质量保障的法规制度体系尚未成型,在档案治理过程中逐渐暴露出诸多质量问题,如共享利用过程中的知识产权问题。新修订《中华人民共和国档案法》提出利用档案涉及知识产权的,应当遵守有关法律、行政法规的规定,该政策较为笼统地表明保护知识产权的重要性,但在法理层面上并未出台档案领域知识产权的政策规定,这不利于形成相互信任的共享环境,亟须建立相应的追责制度或档案领域的知识产权细则,以推动优质档案数据资源的聚合,实现档案知识共享与创新。

  同时在已有法规条例中,存在部分法规政策的缺位现象。如在2016年宁波市原鄞州区与江东区档案馆合并时,由于缺乏统一的标准制度、档案数据资源分类、著录标准不一致等,就面临着因数字化标准不一致、馆藏资源难以融合的困境,进一步加剧了质量问题,不利于档案数据治理效能的提升[13]。根据表5可知,在法律管制方面,档案数据生成、档案数据环境保障占比将近97%,但在档案数据收集、分析中却并未涉及。因此政策文本在档案数据生命周期各阶段的应用中存在“政策真空区”,档案数据质量保障也亟须建立起系统、完善的法律和标准规范体系,以有效解决当前“数据烟囱”“数据孤岛”现象,增强档案数据治理能力。

  3.3.2 多元主体沟通不畅,协作机制尚未成型

  当前,尚未形成良好、健康、循环的档案数据质量保障生态环境。由于我国政府部门实行条块分割的管理体制,档案数据的流通因此受到阻碍。纵向、横向机构之间的交流不畅、融合困难,档案数据之间出现“断层”现象,形成了“数据烟囱”和“数据屏障”。虽然部分区域不断加强业务交流,推动协同发展,如京津冀三地档案部门在档案资源建设、利用服务等方面,持续加强馆藏档案资源的共建共享,但全国各级政府、横向、纵向部门之间的档案数据仍存在流通不便、沟通不畅的情况。

  多元主体协作机制尚未成型。参与档案数据质量保障的主体不明确且各主体之间的职责划分模糊,档案数据质量保障涉及诸多参与主体与环节,需借助协作机制以形成多元主体保障档案数据质量的全新、独立自洽模式。政策中提出要鼓励、引导、规范社会力量参与档案事务,但并未对社会力量的参与方式、渠道、职责以及档案部门的管理方式作出具体指导。同时,各协同主体之间的联动能力不足,导致档案数据处于分散、碎片状态,不利于档案数据价值密度的跃迁。

  多元参与主体在档案数据保障过程中因其管理理念、方法、渠道的不同而影响档案数据质量。多元主体在保障档案数据质量过程中实质上是一个协作共同体,包括具体保障活动、价值认知等。英国政府数据质量中心发布的《政府数据质量框架》中提出,要与用户定期沟通,以便应对动态变化的数据质量要求。由于过去受到“管理本位”观念的影响,档案部门对档案事务具有一定的垄断性和控制力[14],导致多元主体对协同参与保障档案数据质量的价值认知尚未成型。在开展活动的过程中,容易因为认知偏差而阻碍档案数据质量的提升以及治理效能的增长。

  3.3.3 档案数据质量保障的“末梢神经”不敏锐

  档案数据质量保障的“末梢神经”是指在档案数据全生命周期流转过程中,档案部门等参与主体对各环节的关注、把控、监管程度。政策文本主要依赖法律管制和目标规划来保障档案数据质量,但在实践层面上还存在诸多质量问题。例如,2022年,有学者调研31个省级档案馆官方网站发现,当前,档案数据质量欠佳主要表现在档案数据的供给机构与纸质档案数字化成果质量两方面。在开放目录方面,仅有“档号”“责任者”“题名”三个著录项[15]。

  在档案数据收集过程中,数据本身的质量是影响质量的关键因素。档案数据收集是生命周期循环的起点,需要借助一定的手段和流程来优化档案数据质量。欧盟统计局在《数据质量评估框架》中指出,要定期检测、优化数据收集流程,并及时监控用户需求与反馈。在档案数据分析环节,影响质量的因素包括档案数据整合能力和技术应用程度。借助数字技术对档案数据进行深度挖掘的重要基础是数据之间的高效集成。否则,数据格式不一、类型多样可能导致档案数据割裂和数据鸿沟,直接影响其可用性。在档案数据存储过程中,从保障数据安全角度出发,档案部门易出现“重保管、轻利用”的情况。因此,档案部门应以安全为底线、以需求为导向、以质量为核心,重点加强档案数据存储等环节的风险管理意识,保障档案数据的真实性和完整性。在档案数据共享、利用过程中,缺乏统一的档案数据交换机制是影响质量的主要因素。这导致当前档案数据治理存在一定的随意性,档案数据质量参差不齐,从而阻碍了开放共享的进程,影响了档案数据的可获得性和及时性。

  4  基于档案数据质量保障的优化路径

  高质量档案数据是激活档案数据要素价值、提升档案数据服务效能的关键与前提。因此,为保障档案数据质量,从宏观、中观、微观角度出发,构建了档案数据质量保障的优化路径,如图5所示,旨在激发档案数据服务潜能,促进档案数据质量保障生态的形成。

10.jpg

图5  档案数据质量保障优化路径

  4.1 宏观层:强化顶层规划,推动完善档案数据质量保障法律体系

  4.1.1 制定档案数据质量保障政策文本

  制定档案数据质量保障政策文本,旨在法制层面明确档案数据质量保障过程中的相关事宜及预期效果。当前,规范保障档案数据质量的条文并非成体系展现,而是零散地分布在文本中。因此,一方面,国家应结合法律、信息资源管理等多角度,因时制宜出台专门针对保障档案数据质量的政策文本,如档案数据质量保障的战略目标、发展规划等配套文件,以确保档案数据的规范性、一致性,推动质量保障走向规范,促进档案管理理念从“重数量”向“重质量”方向转型升级;另一方面,档案主管部门也应结合资源结构特点,协调各部门、行业领域等多主体,构建档案数据质量规范体系,把握其发展方向,增强档案数据质量全生命周期管理的针对性。

  4.1.2 完善档案数据质量保障相关法律体系

  保障档案数据质量的法律规范设计囊括诸多要素,因为参与质量保障多元主体包括国家、部门、行业组织、专家协会、社会公众等,同时保障档案数据质量需要众多环节协同运作才能达到预期目标。当前所显露的档案数据质量保障要素只是冰山一角,国家及有关主体在制定法律法规过程中应注意“补漏洞”“填空白”。“补漏洞”指的是针对目前法律法规体系中制约档案数据质量保障活动的条例进行完善,如应重点推进完备、系统、统一的档案数据开放标准与流程的制定,解决当前各行业、部门之间数据共享、流通困难等问题,否则后续高质量档案利用服务将无从谈起。“填空白”指的是国家、行业等应积极探索新的保障档案数据质量的制度机制,以推动档案数据质量保障环境生态平衡。

  4.1.3 建立数字空间场域下的档案数据质量保障思想群

  建立档案数据质量保障思想群,包括“安全底线思想”“绿色节能思想”“以人为本思想”等。首先,树立“安全底线思想”,档案数据安全是在全生命周期流转过程中影响数据质量的关键因素。因此,应遵循总体国家安全观的指引,贯彻档案数据安全底线思维。其次,倡导“绿色节能思想”,信息技术虽然缓解了“档案数据总量大幅攀升而数据质量增益效果不明显”的矛盾[3],但在此过程中也应关注技术使用的能耗问题,时刻贯彻节能低碳、绿色环保理念。再次,坚守“以人为本思想”,保障档案数据质量的最终目的是实现档案数据价值的释放,提供服务,其落脚点是社会公众。因此,保障档案数据质量需秉承以人为本的观念,从关怀视角出发,充分发挥档案的人文属性。

  4.2 中观层:以档案数据质量为导向,共筑立体化网格主体协作场域

  无论管理对象的称谓如何变化,文件、档案、文档、内容、信息、信息资源、数据、数据资源等,在数据管理的道路上,势必需要多部门协同合作[16]。因此,建立以质量为导向的网格主体合作交流运行机制显得尤为重要。立体化网格主体协作场域的具体内涵是多元主体通过横向、纵向的相互连接构成网格,网格之间相互作用、影响、耦合,进而演化为一个立体化网格主体协同场域。

  4.2.1 政府:宏观调控

  政府力量的加入旨在充当保障档案数据质量活动过程中的宏观调控角色,具有政策引领、组织协调、经费保障的重要作用[17]。在多元主体协作运行的过程中,可能会出现不适应、不协调、不匹配的情况。因此,政府应充分利用政策引领的优势,协调多元主体的行动,推动档案数据质量保障活动的开展;作为“掌舵者”,政府还应履行统筹规划的职责,调整政策文本与实践活动之间的“偏差”,以保障档案数据质量环境的生态平衡;还需进行必要的宏观调控和干预,确保档案数据质量保障活动能够高效、有序地开展。

  4.2.2 档案部门:主导协调

  档案部门(包括档案主管部门与档案馆、档案室等档案保管部门)[18]是保障档案数据质量的中坚力量。档案部门应发挥主导作用,对各方力量进行指导、协调、监督,并统筹协调各方利益,以促进网格主体之间的协同与合作。档案主管部门应充分发挥资源管控、质量控制等作用,制定与档案数据质量保障相关的规范、标准、目标规划,并对档案数据质量保障的相关法规等作出科学、合理、规范的解释。同时,档案部门还应协调处理好各方力量形成协作模式,从而营造健康、良好、有序的档案数据质量保障氛围。

  4.2.3 数据部门与技术机构:协同赋能

  为推进大数据战略,全国各地纷纷成立数据部门(如数据管理局、大数据管理中心等),这些部门可以负责汇聚、整合现行档案数据,是质量控制的协同方。技术机构则是指提供专业服务或咨询服务的机构(如科大讯飞、阿里云等),它们能够解决档案治理过程中所遇到技术性难题,是质量控制的赋能方。

  数据部门和技术机构主要与档案部门合作,共同保障档案数据质量。因此,档案部门应与数据部门和技术机构通过多手段、多渠道构建互联互通的合作机制,如通过外包服务提升档案数据存储过程的安全性,同时培养档案管理人员的专业和技术素养。通过建立健康良好的伙伴关系,充分发挥各自的优势,优化档案数据质量保障的多主体参与协作方式,补足自身短板,保障档案数据的完整性、真实性、安全性等。

  4.2.4 社会组织与公众:参与互动

  社会组织(包括档案学会、高校、企业、志愿者团体等)是推动档案数据质量保障的重要力量。档案学会等群体具备人员素质高、社会信用等级高等特点,可以充分培养此类人员并协调好社会组织及各群体的相关事宜。例如,高校可以组织充分调配智力资源,打造档案数据质量专题智库,推动档案数据质量保障活动的顺利开展。

  尽管当前全社会档案意识相对较弱,社会公众参与档案事业的程度较低[19],但社会公众的潜力不容小觑。首先,应激发社会公众的档案数据质量保障意识,如通过开展专题讲座、举办社会实践等活动提升社会公众的能力水平和保障意识,从而为高质量档案数据奠定基础。其次,应不断丰富和优化社会公众参与档案数据质量保障活动的方式,如志愿者活动、众包工作等。再次,应充分利用现代数字技术,打通与社会公众之间的双向沟通渠道,拓展社会公众的监管方式,实现无障碍式意见直达。通过高质高效地识别用户需求并动态调节档案数据分析的重点等方式,实现档案数据质量的精准优化。

  4.3 微观层:基于生命周期的档案数据质量提升

  4.3.1 档案数据收集

  分析用户需求是档案数据收集工作的开端,也是档案数据质量控制的终点。充分研判档案数据用户的潜在需求,能够提升档案数据分析与利用的精确度与针对性,同时有效降低档案部门开发的时间成本,实现档案数据质量的闭环管理。例如,欧盟统计局在《数据质量评估框架》中提出了监测和预测用户新需求及优先事项的方法。在收集档案数据后,应及时检测档案数据内容与元数据的关联度,以及档案数据内容之间的相关性,防止因其关联度过低而导致后续档案数据共享和利用困难的问题,因此需不断加强对档案数据生成过程的质量保障。

  4.3.2 档案数据分析

  档案数据资源整合是解决共享利用瓶颈的关键。档案数据资源的不均衡性、分散性、封闭性等特性限制了其共享利用[20]。为此,档案部门应积极推动形成专门的档案数据整合统一标准,以便于数据格式之间的转换,维护关联特性,形成档案领域“大数据”。同时,应综合应用新兴技术,如区块链、人工智能等数字技术,挖掘海量、离散档案数据之间的隐含关系,实现知识创新,解决数据割裂、数据异构所带来的档案数据质量问题,不断加快档案数据的知识化、智慧化开发步伐,充分激活档案数据的价值。例如,中国科学院合肥物质科学研究院借助区块链技术提出了一种档案数据保护与共享方法,实现了数字档案的保护、验证、恢复与共享[21]。但在应用数字技术时,应坚守技术边界,防止唯技术论、技术崇拜等思想的滋生,规避技术应用风险,形成积极探索、大胆试验、谨慎使用、持续完善的技术生态[22]。

  4.3.3 档案数据存储

  在将档案数据存储服务外包给第三方机构时,应与机构签订严密的档案数据保密协议及管理规范,确保档案数据在全生命周期下安全、真实、完整及可用。档案部门需持严格、审慎的态度进行筛选,并在合作前明确服务范围、目标、技术标准等内容,严守档案数据质量底线。外包期间,档案部门应定期对外包机构的存储情况进行检查和审查,及时掌握档案数据情况,以保障档案数据质量。验收时,应对成果进行严格的验收和评估,最大程度保障档案数据质量。

  4.3.4 档案数据共享与利用

  完善档案数据共享交换机制是提升档案数据质量的重要途径。国家应完善地方与部门之间的数据共享交换机制,借助统一规范的数据交换机制推动部门、区域、国家档案数据的流通和共享,打破“数据壁垒”。建构档案数据共享机制是保证档案数据质量的关键条件之一,应积极为立体化网格主体创造联动、合作契机,综合把控档案数据质量保障工作,优化档案数据开放共享格局。在档案数据共享和流通时,档案部门等应提供清晰、明确的档案数据质量信息,准确地向用户传达数据质量相关情况,以提升档案公信力。例如,英国政府发布的《政府数据质量框架》中提出,数据应保证质量且具有匿名性,并将其以适当的文件形式发布,以提升其实用性并保障数据服务的透明度。

  5  结语

  数智时代下,高质量档案数据为档案数据治理等活动开展赋能,与此同时,档案数据质量受到政策制定、人员队伍建设、技术配备等诸多方面因素的影响。因此,需引入政策工具,在宏观、中观、微观三个层面上,构建档案数据全生命周期的质量保障策略,以提升档案数据的价值密度,并充分释放其潜力。由于档案数据保障环境是动态发展、不断变化的,档案工作者应持续优化自身的治理手段和方式,以实现档案数据质量的可持续发展,共筑档案数据高质量发展的生态环境。

  参考文献

  [1]金波,周枫,杨鹏.档案数据研究进展与研究题域[J].情报科学,2021,39(11):187-193.

  [2]张夏子钰,周林兴.大数据时代档案数据质量:评估与优化[J].北京档案,2023(5):15-18.

  [3]王平,陈秀秀,李沐妍,等.区块链视角下档案数据质量管理路径研究[J].档案学研究,2023(2):120-127.

  [4]金波,孙尧,杨鹏.基于区块链技术的档案数据质量保障研究[J].图书馆杂志,2023,42(10):25-33.

  [5]周林兴,崔云萍.大数据视域下档案数据质量控制实现路径探析[J].档案学通讯,2022(3):39-47.

  [6]周林兴,林凯.大数据时代档案数据质量治理:因素、框架和路径[J].档案学研究,2023(2):111-119.

  [7]叶庆.谱写四部曲奏响奋进歌:丽水市高质量做好档案数据资源归集共享工作[J].浙江档案,2023(2):16-17.

  [8]金波,杨鹏,周枫.档案数据高质量发展:历史进程、演进逻辑与战略布局[J/OL].情报科学:1-15[2024-09-19].http://kns.cnki.net/kcms/detail/22.1264.G2.20240126.1857.020.html.

  [9]周枫,金波.基于PDCA模型的档案数据质量治理研究[J/OL].情报科学:1-18[2024-09-19].http://kns.cnki.net/kcms/detail/22.1264.G2.20240506.1623.006.html.

  [10] FLANAGAN K, UYARRA E, LARANJA M. Reconceptualising the‘policy mix’for innovation[J].Research Policy, 2011,40(5):702-713.

  [11]ROTHWELL R,ZEGVELD W.Reindusdalization and technology[M].London:Logman Group Limited,1985:83-104.

  [12]崔旭,张若为.2000—2025年档案事业政策嬗变的量化研究:基于档案事业的政策文本分析[J].档案与建设,2021(7):25-32.

  [13]李荔,罗锋.加快数字化转型 提升档案工作现代化水平[N].中国档案报,2020-05-25(3).

  [14]王英玮,戴柏清.制度创新视角下档案治理效能提升路径探析[J].档案学通讯,2022(4):17-25.

  [15]张贤莉.省级档案馆网站在线查询现状的分析与思考[EB/OL].(2022-06-15)[2024-07-16].http://www.zgdazxw.com.cn/news/2022-06/15/content_334076.html.

  [16]刘越男.数据治理:大数据时代档案管理的新视角和新职能[J].档案学研究,2020(5):50-57.

  [17]金波,王洁菲,添志鹏,等.档案数据治理运行机制探究[J].档案学通讯,2023(4):22-29.

  [18]邢慧.档案治理多元主体角色分析及其协同创新探究[J].档案管理,2020(6):25-27.

  [19]朱彤,张航,谭爽.元治理视域下档案治理主体协同策略研究[J].档案学研究,2022(5):74-80.

  [20]金波,陈坚,李佳男,等.大数据时代档案数据资源整合探究[J].档案与建设,2022(9):18-23.

  [21]谭海波,周桐,赵赫,等.基于区块链的档案数据保护与共享方法[J].软件学报,2019,30(9):2620-2635.

  [22]金波,杨鹏.“数智”赋能档案治理现代化:话语转向、范式变革与路径构筑[J].档案学研究,2022(2):4-11.

  【基金项目】国家社科基金一般项目“智慧社会背景下数字档案资源治理体系研究”(项目编号:20BTQ104)。

  【作者简介】赵欣淼(2002—),女,汉族,河北衡水人,上海大学文化遗产与信息管理学院硕士在读,研究方向:档案数据治理;杨智勇(1982—),男,汉族,河南焦作人,上海大学文化遗产与信息管理学院副教授,博士,研究方向:档案数据治理。