面向智慧服务的档案数据治理:动因、困境和路径

发布时间:2024-07-30 19:36:13被阅览数:309 次信息来源:《中国档案》

  文/杨智勇   温蓉玉

  摘要:档案数据治理在推动档案价值高效实现、满足社会智慧利用上发挥着重要作用。本文通过分析面向智慧服务的档案数据治理开展动因,厘清其在档案数据质量、档案数据权利、档案数据开发三方面遇到的困境,进而提出加强质量管控、明确权属关系和推进深度开发的策略选择,为数据治理更好推动档案智慧服务提供建设性意见。

  关键词:档案数据治理;智慧服务;数据质量;档案数据权利

  随着数字技术的进阶迭代和数字业态的广泛普及,社会及个体产生积累的数据数量、规模和种类正以前所未有的方式全方位扩张,数据成为新型生产要素。这种全方位的“数据化”趋势催生出档案数据和档案数据治理的相关议题。大数据浪潮加速推动档案载体形态从“模拟态”向“数字态”“数据态”转变,档案服务模式由被动烦琐的传统服务走向高效便捷的智慧服务。基于此背景,如何通过档案数据治理有效促进档案数据深层次开发和智慧服务,是值得深入研究的议题。

  近年来,档案数据治理已成为大数据时代档案学理论阐释和实践探索的前沿领域,诸多专家学者也分别从概念内涵、能力建设、框架体系等多个方面展开研究,但以档案利用服务为导向的数据治理理论研究仍显不足。鉴于此,笔者拟立足于档案智慧服务,在进行档案数据治理的动因分析基础上,厘清档案数据治理现状,进而提出面向智慧服务的档案数据治理策略,以期推动档案治理体系和利用体系建设。

  面向智慧服务的档案数据治理动因分析

  1.治理对象:档案数据突破开发瓶颈

  档案工作正在经历一个从手工收集纸质档案到自动采集电子档案、从主要管理档案实体到重点处理档案数据的变革过程。随着数字社会发展,档案客体的存在方式、服务手段也在不断变化,档案记录形态从以人工处理的模拟态、供计算机收集存储的数字态转向以算法、模型约束的数据态,记录尺度从文件级向数据级转变,档案数据正成为档案存量与增量的统称,逐步取代传统档案保管对象。如果说档案数字化的历史使命是帮助人们进入了电子化时代,档案数据化则是帮助人们打开了档案资源深层次开发挖掘的一道门,为更高级的档案智慧服务提供了更多的可能和想象空间。

  不同于传统档案信息不可计量、不易分析、不好关联的特点,档案数据具有较强的可编程计算性,在数据分析、数据挖掘等数字技术的支撑下可使其直接跨越信息和知识走向智慧,拥有较强的价值活性。由此,档案数据在资源开发和利用服务上具有优势,能够基于数据管理实现精准化、知识化和智能化的服务。档案成为一种可计算分析的“数据”,有利于突破档案信息资源深度开发瓶颈、开创以需求为导向的档案服务模式以及推动档案服务实现智慧化。

  2.治理方式:数据治理赋能智慧服务

  档案数据治理是档案治理现代化发展下的产物,档案智慧服务则是在信息技术支持下,进行数据挖掘分析、平台架构并与用户感知互动的全流程“智慧性”档案业务工作。面向智慧服务的档案数据治理建立在政策话语导向和档案实践需求的基础上。

  一方面,国家政策文件为档案数据治理提供导向和支撑。党的二十大报告提出,未来五年国家经济社会发展的主要目标之一是“改革开放迈出新步伐,国家治理体系与治理能力现代化深入推进”。中办、国办印发的《“十四五”全国档案事业发展规划》强调要主动融入数字经济、数字社会、数字政府建设,积极融入国家大数据战略,在战略层面描摹了档案事业面向数据治理的发展方向。可见,在数字时代,数据作为档案管理的重要对象和智慧服务的核心资源,加强档案数据治理是大势所趋。

  另一方面,档案智慧服务立足于科学高效的档案数据治理。档案数据是大数据时代档案信息资源的主体,其经由加工组织、挖掘利用能够展示社会、经济、文化等发展过程并预测规律,提供知识服务、决策支持,具有巨大的价值潜能。而作为一种新型治理方式,档案数据治理不仅有助于激活档案数据价值、释放档案数据内在潜能、实现海量数据向智慧化转化,更能够提供高质量的档案信息服务和知识服务,促进档案公共服务的精准化、智能化,将“资源库”变为“知识库”“思想库”“智慧库”。

  3.治理手段:新兴技术推动数据增值

  新兴技术既是档案数据治理的手段,其深入应用也是开展数据治理实现智慧服务的动因。以云计算、大数据、物联网、人工智能等为代表的新兴技术,已在推动档案领域业务形态发生变化,也为档案智慧服务的应用探索提供了基础保障。档案数据价值的提升和档案智慧服务的提供需要引入本体、模型、规则、算法等数据处理领域的理论方法,充分借助现代信息技术开展灵活多样的数据组织分析,对分散复杂的档案数据进行关联、聚类和展示。

  现代信息技术包括数据化技术、可视化技术、智能化技术等,其发展应用对档案服务效能的提升具有积极意义。其中,数据化技术可以通过析出和关联档案数据蕴含的内容、时间、地点等信息,挖掘档案知识价值,进而提供深度服务和智慧服务;可视化技术将庞杂的档案数据以图示形式显示,能够减轻处理大量档案数据的负担,直观展现档案数据内容、结构、形态等关键信息,为进一步内容研究提供基础;智能化技术可以代替部分人力,开展档案数据分类汇集、信息组织、知识挖掘等工作,更好适应档案服务多元场景,满足档案用户多元需求。新兴技术的更新迭代意味着档案服务手段的创新发展,既将促进档案数据的进一步组织、赋能和激活,也将推动档案服务走向场景化、智能化与智慧化,并不断改变“资源丰富、利用有限、知识贫乏”的格局,为决策者谋划“满意解”“最优解”,为组织机构输出知识产品,为社会公众提供增值服务,从而全面提升档案服务质量。

  面向智慧服务的档案数据治理困境剖析

  1.档案数据质量参差不齐

  档案数据质量是档案数据治理的关键,也是智慧服务的基石。档案数据质量控制有助于更好地提取档案数据中的关联特征,促进档案数据价值的深度发挥,进而提供高效便捷的档案智慧服务。但在当前的档案数据治理过程中,档案数据质量是一个亟待解决的难题。

  一是档案数据的准确性欠佳。由于档案数据来源广泛、种类复杂、动态流转,不同数据源之间不可避免存在信息不一致的问题。如2018年度福建省档案馆著录民国档案文件级目录381728条,经省档案馆馆方、第三方监理公司检查,共发现错误情况41193条,合格率仅为89.21%。

  二是档案数据的完整性不足。档案数据在采集、录入、转换、处理过程中,缺乏统一的标准和规范,或者存在操作失误、输入错误等问题,导致档案数据缺失。不完整的档案数据将影响记录的全面性和档案数据的可信度,也将导致数据分析结果失真,从而降低档案服务的整体质量。

  三是档案数据的时效性滞后。及时有效的档案数据对于智慧服务的应用具有重要意义,然而档案数据在收集、处理和传输过程中,会出现档案内容过时的现象,无法更好满足用户的现实需求,进而影响服务效果。

  2.档案数据权属争议不定

  档案数据内容挖掘与开发利用往往涉及档案数据所有权、知识产权等权利问题。档案数据权利是指相关主体在不同场景下享有的以特定档案数据为客体对象的权利类型,是一种基于档案数据的新型权能,涵盖着档案数据主权、所有权、知识产权等权利体系。在数据化浪潮下,档案数据涉及党政机关、档案部门、数据机构、第三方数据平台、社会公众等多元主体。由此,存在管理部门多样、管理权责交叉、管理权限不清、边界模糊泛化、公私权益冲突的权属困境。档案数据管理中公共数据收集与个人隐私安全、数据开放共享与重要信息保密、数据自由流动与信息违法传播、数据深度挖掘与知识产权保护等矛盾日益突出。但国家层面的数据权利制度体系尚未建立健全,不同档案数据权在不同场景下的权属问题缺乏明确界定,只有一些相关规定散见于各类律法中。例如,《中华人民共和国数据安全法》规定:“对于境外开展数据处理活动,损害国家安全、组织合法权益或者公民公共利益的,依法追究法律责任。”《中华人民共和国档案法》规定:“对于确定出境的档案按照国家有关规定办理审核手续。”

  同时,关于档案数据权利的关系协调机制、利益分配格局、多元协同体系尚未形成,不同主体间缺乏明确有效的沟通渠道、协作方式和合作桥梁,不利于档案数据权利的共建、共治和共享。面对以上挑战,需要开展档案数据权利治理,促进档案数据有序运行和规范流转,破解数据归属纷争和数据孤岛鸿沟,进一步推动档案智慧服务的开展。

  3.档案数据开发深度不足

  档案智慧服务建立在档案数据价值深度挖掘的基础上,然而,在档案数据资源开发利用过程中存在系列问题阻碍着档案智慧服务的呈现。

  一是对档案数据价值重视不够。尽管各级各类档案馆(室)都保存了大量丰富的档案资源,但档案人员往往受传统的“重收藏、轻利用”理念影响,习惯被动地去利用现有档案,较少注重对档案相关内容数据、管理数据和关联数据的积累、利用和开发。

  二是利用智能技术开发档案数据资源力度不足。尽管现在已有一些档案机构开展数据开发,但大都侧重于粗颗粒度的档案编研、信息检索和知识图谱,而基于人工智能技术的细颗粒度档案数据价值挖掘、关联分析、知识发现等开发应用还较少,档案数据的潜在经济价值和社会效益未得到充分体现。

  三是档案数据场景化开发程度不足。传统的档案管理“重建设、轻运营”,丰富的资源常常“束之高阁”,阻碍了档案价值的有效发挥;现代的档案治理既要加强档案数据的流动和管理,又要针对多样化利用需求进行场景化开发,而如何优化档案数据开发流程、智能匹配服务场景、更好实现档案数据价值,也是当前需要重点关注的问题。

  面向智慧服务的档案数据治理路径选择

  1.加强质量管控,奠定资源基础

  档案数据时效性较差、关联性不足、精准度欠佳等可用性问题是档案数据治理的痛点,如何通过机制建设、技术优化、资源配置等方式提升数据可用性,成为一个具有普遍意义且值得深入探究的问题。

  一是要推动档案数据质量管控标准规范和制度建设。在标准规范上,加强档案数据在产生、存储、利用等全生命周期的标准建设,形成全面系统的档案数据质量标准规范体系。在制度建设上,明确档案部门对档案数据的监管职责,对档案数据流程、系统和用户进行全面监控,实时发现传输通道或网络中档案数据的异常动态和用户不规范、不安全的利用行为。如浙江省安吉县档案局、档案馆在全县部署开展档案数据质量提升专项行动,系统制定专项文件,建立双重数据监测机制,全县各单位在进行移交前需自行开展规范性检测,检测通过后方可将数据提交至县档案馆,再由县档案馆进行移交前检测,最终实现数据返工率降低90%。

  二是要构筑档案数据质量技术保护屏障。强化档案数据处理技术、创新档案数据存储技术、完善档案数据安全技术,如开源技术、云存储技术、区块链技术等,为档案数据的准确性、完整性和时效性提供有力保障。

  三是要对档案数据进行分类分级管理。在分析档案数据应用场景的基础上,部署档案数据分级分类工作,可以将生成来源、敏感程度、重要程度等多维数据特征作为分类分级的依据,对档案数据进行内部划分,为档案数据的精细管理和价值深挖提供支持。同时,根据不同类型档案数据开展脱敏、整合、清洗等具体的管理和处理手段,既有助于保障档案数据要素的质量、促进档案数据价值实现,又能为不同类型数据开放共享和智慧服务提供支撑。

  2.明确权属关系,保障数据流通

  档案数据权利治理是多元主体协同合作,依据一定的法规准则,充分利用现代信息技术,保障各主体档案数据合法权益的活动和过程。作为一项系统性工程,档案数据治理需要多措并举,促进档案数据流通集成,赋能档案智慧服务。

  第一,档案数据权利治理内容复杂,需要跨领域知识整合,借鉴吸纳经济学、社会学、法学中的知识与方法等,为档案数据的权属界定提供解决思路。如参考经济学中权属分类、分配、确定的具体案例;融合社会学治理理论中法治、善治、共治等思维视角;对照法学中财产权、知识产权、隐私权等相关论述。

  第二,面向智慧服务的档案数据权利治理还需要秉持协同合作意识。档案数据权利治理主体多元、关系多样、方式多种,需要构建多主体协同共治的新矩阵,不仅要合理划分各主体在档案数据权属界定、保存管理等方面的职责边界,如杭州市档案局与杭州市数据管理局准确划分管理范围,5年后数据管理局的政务数据需移交给档案馆保存。同时,要推动多元主体间的档案数据资源集成共享,缓解档案数据资源分散无序、孤立异构等问题,为智慧服务的开展提供立体全面的资源基础。

  第三,具体到档案数据开发利用过程中的权属问题,需要有针对性地展开策略选择。如对于档案数据中含有独创性知识形态的劳动产品,可视为汇编作品适用著作权制度保护;对于选择编排上没有原创性、侧重于搜集整理,且含有大量单纯数值事实的档案数据库集而言,可引入邻接权制度予以保护。

  3.推进深度开发,满足用户需求

  档案数据深度开发是利用相应的技术与手段对档案数据内涵进行深入挖掘分析,将零散无序的档案数据转化为有序关联、便于理解利用的档案成果的过程。在此过程中,有必要充分利用治理手段和现代信息技术,创新档案数据开发方式,以提供满足用户需求的档案智慧服务。

  第一,积极借助大数据、人工智能、数字孪生、大语言模型等现代信息技术,对海量数据资源进行深度分析,提取档案数据中蕴含的信息与知识。通过对信息知识的聚合分析和动态呈现,将档案数据中的隐性价值转化为显性价值,在档案数据知识融合中不断增强档案数据的智慧服务能力。如OpenAI发布的文生视频大模型Sora能够根据所输入的提示语生成相应视频,在档案领域的应用则有助于对档案数据资源进行智能处理,实现视频自动生成,推动档案文化传播,增强用户视觉体验。

  第二,加强档案数据的“再生产”。在实现档案数据集成聚合的基础上,以用户需求或问题解决为开发导向,进一步对档案数据进行重塑开发,充分发挥档案数据的再生产功能,探索多样化、个性化与人本化的档案服务模式。例如上海市档案馆在2023年上线的“跟着档案观上海”数字人文平台,可根据平台相关档案标题及说明关键词,自动生成每个建筑点位的档案关联可视化图谱,用户可以通过档案知识图谱探索建筑地标、历史事件、人物之间的关系。

  第三,创新与时俱进的档案服务形式。档案服务的理念、手段与方式需要适应新时代的需求和变化,积极拓展档案服务领域和空间,充分利用现代技术,广泛研究用户利用心理、动机和需求,探索更便捷智慧的档案数据服务。如通过档案网站、手机App、微信小程序等智能服务平台开展档案信息在线推送、档案业务在线办理、用户在线互动等移动终端服务,实现档案信息个性化、特色化、便捷化服务,随时随地方便用户利用档案数据资源。

  参考文献:

  [1]钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(2).

  [2]金波,周枫,杨鹏.档案数据研究进展与研究题域[J].情报科学,2021(11).

  [3]赵栩莹.新技术环境下的档案智慧服务:思维、业态与机遇[J].北京档案,2021(11).

  [4]魏亮亮.面向数字人文的档案知识服务模式转型探析[J].档案学研究,2021(4).

  [5]方彦.民国档案文件级目录著录错情问题探析—以福建省档案馆为例[J].档案学研究,2019(4).

  [6]杨鹏.大数据时代档案数据权利及其体系构建[J].档案学通讯,2022(4).

  [7]周林兴,林凯.大数据时代档案数据质量治理:因素、框架和路径[J].档案学研究,2023(2).

  [8]徐拥军,王露露.档案部门参与大数据战略的必备条件和关键问题—以浙江省为例[J].浙江档案,2018(11).

  [9]倪代川,金波.数字档案馆生态系统可持续发展态势探析[J].档案与建设,2019(7).

  [本文系国家社科基金一般项目“智慧社会背景下数字档案资源治理体系研究”(项目编号:20BTQ104)的阶段性研究成果]

  作者单位:上海大学文化遗产与信息管理学院

  责任编辑:周拯民