数字时代档案工作的坚守与使命

发布时间:2024-07-23 19:35:11被阅览数:75 次信息来源:《中国档案》

  文/谷威 何芮 白文琳

  摘要:人类社会正在进入以数字化生产力为主要标志的全新历史阶段。迎接数字时代,激活数据要素潜能,推进网络强国建设,已上升为国家战略。在此背景下,文章从学科独立自主发展角度,从档案本身功能属性特殊性、档案工作的特殊内容与价值、档案及档案工作赋能能力三个维度展开探讨档案及档案工作在数字时代的坚守与使命,重点明确了档案的可信性、相互联系性、记忆工具价值,反思了档案鉴定、档案利用工作发展方向,从而坚定了档案学科时代话语权。

  关键词:档案和档案工作;数字时代;数据管理;档案鉴定;档案利用

  当下,数据融入生产、分配、流通、消费和社会服务管理等各环节,成为继土地、劳动力、资本、技术之外的第五大生产要素,深刻改变着生产方式、生活方式和社会治理方式,以数据为主的数字时代正在加速推进。档案界业已关注数字时代背景下的档案和档案工作并引发讨论热潮。

  在学术研究领域主要有以下研究角度:一是从宏观层面探讨档案与数据、档案数据、数据档案的管理机制、职能等;二是从微观层面探讨档案与数据、档案数据、数据档案在某一行业领域或者某一工作环节的原则、模式、方法等;三是少部分文献从理论角度梳理概念、属性及相互关系等。当前研究术语、主体还比较杂乱,档案数据、数据档案这些词汇混用乱用现象明显,很多研究简单地将档案信息表述为档案数据,然而其实质内容与档案信息管理并无差别。另外,部分研究将数据最新理论和实践简单套用在档案领域。在实践领域,关于数据机构与档案机构的关系的争辩也层出不穷,对各自的定位与使命存在一定程度的认知偏差,使得在各类机构进行数据管理、档案管理以及系统建设等环节出现了分工不明、责任不清等问题,影响实践工作的推进。

  笔者认为,历史和人民赋予档案、档案工作、档案机构独一无二的定位和功能,有必要从学科独立自主发展角度探讨数字时代档案和档案工作应坚守的定位和使命,明确新时代档案独有的话语权。笔者拟从档案本身功能属性特殊性、档案工作的特殊内容与价值、档案及档案工作赋能能力三个维度展开探讨其在数字时代的坚守与使命。

  档案:数字时代的自身坚守

  定义作为对事物本质特征或某一概念内涵和外延的说明,是区别和联系事物的根本方法。不同领域对数据的定义各有所见,《中华人民共和国数据安全法》将数据定义为任何以电子或者其他方式对信息的记录,这一定义几乎无所不包,档案似也是一种数据;在计算机领域,数据被定义为一种客观事实与结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。从这一定义出发,数据似是一种初始状态,档案则是一种组合状态。具体的档案定义更是多达数百种,业内普遍认可档案本质上是社会生活的历史记录。梳理多种定义来看,数据和档案都是一种记录,区别似乎在于记录的表现形式或状态,但无法具体说明数据与档案的关系与区别。笔者主要致力于探索档案工作的时代定位和发展路径,拟不采用广义的档案或数据定义,而从数字时代的数据集合和完成归档的档案视角,从数据与档案特征属性、价值、作用出发,探讨档案的时代定位。

  1.两者的状态及可信度不一

  数据的生命力在于流动,档案是固定的记录,档案的可信度高于数据。

  数据具有流动性,这也是其成为生产要素的前提,只有动态的、不断更新的数据才能持续创造价值。在传统模式下需要以实体形式进行交换的信息,经过数字化以后,其流动效率和质量大幅提升,国际贸易、跨境结算、远程服务交付等经济行为都是在此基础上衍生发展而来。数据的这一特性清晰地映射在各国数据立法实践中,影响力比较大的有欧盟发布旨在维护数据流通中个人隐私权的《通用数据保护条例》、美国发布旨在方便管理和索取数据的《澄清境外数据的合法使用法》等。

  档案则是经过系统整理的固化信息,这也是其作为凭证使用的前提。一份文件或者数据集经过归档环节进入档案保管进程,其形成者不得再对其进行任何操作。档案的这一特性反映在档案工作的方方面面。没有其他领域像文件档案管理领域一样如此重视凭证性业务信息的管理和维护,专注文件对象构成、元数据、“四性”维护、“四性”检测等问题,在反复应用和研究的过程中已经逐渐形成一套理论和方法体系。

  2.两者内部关系度不一

  档案内部、档案与档案之间存在着必然的因果关系,数据与数据正在突破因果关系走向相关关系,档案的联系性强于数据。

  众所周知,来源原则是世界各国公认的档案整理理论,是指按照档案来源进行整理和分类,保持同一来源档案不可分散、不同来源档案不得混淆的整理原则,由此英语中“档案”一词往往采用复数形式的“archives”,我国档案学界也有观点认为档案是文件的集合,这反映出档案与档案之间强烈的因果关系。伴随数据规模爆炸式增长,人们能够量化和研究两个或多个数据值之间存在的数理关系,通过数据的大量、高速、多样突破因果关系的局限,直观地反映事件或现象。有专家提出,在不久的将来,大数据,小数据的界限或将被消除,取而代之的是“全数据”或全量数据,也就是所有数据。然而,相关关系并不能揭示事务的本质,相关关系的不确定性和研究困境需要继续进行对因果关系的追求。在数据治理中,也需要有效完成对数据的存储、索引和查询,没有经过妥善管理的数据是难以使用的。相对来说,档案内部的联系性要强于数据,这也为档案场景化利用提供了路径。

  3.两者作用发挥阶段不一

  档案、数据深度参与生产生活阶段不同,数据定位于生产要素,档案偏向于记忆工具。

  从参与生产生活方式看,数据活跃在生产生活前端,从数字政府、数字经济到数字社会,从生产经营到消费平台,数据要素渗透在日常生活中,并在与客观世界融合发展的过程中促成了数据资产的价值创造。正如在最早开始系统推动大数据发展的美国,奥巴马政府将数据视为“未来的新石油”。2020年4月印发的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据与土地、劳动力、资本、技术等传统要素并列为生产要素之一,并提出数据要素参与生产分配。从长远来看,数据作为生产要素参与分配,将会促进新产业、新模式、新业态的繁荣发展,并将重新定义和重构着传统的生产方式和生活模式。对国家和社会具有保存价值的数据归档后成为档案,主要活跃在生产生活后端,沉淀为国家记忆、社会记忆,既可以反向促进数据的再生产,又成为书写人类文明、国家历史的工具。尽管存在档案资产论之说,但档案流通交易受法律严格控制,以交易为例外,不交易为常态存在。在应用档案场景中,档案所发挥的经济价值、社会价值也是建立在利用者对档案信息的再加工,实质是基于档案的参考价值和凭证价值,是对记忆的利用。正如我们对档案是历史记录的普遍认知,不管这种历史是十年前还是一年前,都是结束了的过程记录,都是一种记忆。

  因此,档案的可信、联系、记忆使其在数字时代占据着不可替代的作用,档案与数据的融合发展应是坚守两者特性的融合,是对相关领域的借鉴发展。

  档案鉴定:数字时代的不变使命

  1.档案鉴定仍有存在合理性和必要性

  近年来,不少学者基于数字时代背景提出了鉴定消亡论或弱化档案鉴定,主要理由包括数据爆炸式增长已无法实现鉴定、未来的技术可以实现全部数据归档保存、经过选择的数据不能代表全面的历史、价值鉴定理论未达成共识。囿于本文主题,笔者在此不对上述观点一一辩驳,仅从经济社会发展谈档案鉴定的时代使命。

  首先,风险管理和成本控制使得鉴定工作存在合理性和必要性。数据作为一种资产,在一般的组织机构中发挥着数字化转型、决策支持等角色,在以数据为生产力的组织机构意味着追求利润最大化。不少档案学者引用“全数据时代”证明鉴定工作必然消亡,然而全数据是暂时性的全面记录,不等于所有数据永久归档保管。永久保管意味着组织机构时刻警惕网络安全威胁、个人隐私泄露、用户数据失控等风险,意味着不断地备份、迁移实现数据可靠、可用,意味着数据权完全垄断。以此,不管是政府部门还是市场主体,都不会将永久保管所有数据作为选择项。实践中,2010年美国Twitter的社交媒体存档项目从“全部保存”的措施退让为有标准、有选择地获取推文,原因就是推文信息爆炸式增长,存储服务器不堪重负,缺乏足够的项目管理经验和能力去管理所有的推文。

  其次,维护国家记忆使得鉴定工作存在合理性和必要性。德国文化学家阿莱达·阿斯曼认为记忆与遗忘从来都不是互相排斥的,而是需要根据具体的语境和文化价值观念做出理性选择。国家记忆是一个高度政治化的概念,其目的就是要验证国家政治统治的合法性和正当性,塑造为全体国民所共享的文化价值和历史信念,从而增强其对国家的认同感和归属感,它为国家建构及其制度能力的提升奠定了必要而关键的基础。记忆与遗忘的斗争已经构成了数据的核心矛盾,数字技术大有取代人类本身而成为记忆主体的可能,这对国家记忆构建造成巨大威胁,因此有必要通过档案工作者的选择为国家留存真正有价值的历史记录,为后代寻根问祖提供依据,增强公众对民族和国家的认同和归属。

  2.档案鉴定的优化发展

  (1)重视对数据形态档案的技术鉴定

  数据在生产生活中的广泛参与及其高速流动性增加了归档难度。对于数据形态的记录,档案工作者不仅要考虑它的重要性,还要谨慎关注其真实性、完整性、可用性和安全性,上述“四性”关系着档案凭证价值、情报价值的发挥,是维护历史记录性这一档案特性的关键要求。因此,数据形式的档案鉴定应同时包括内容鉴定和技术鉴定。前者是判断数据所含内容信息的有用程度,决定保存多长时间;后者是判断数据的技术状况是否可保证档案价值实现。目前,《文书类电子档案检测一般要求》(DA/T 70-2018)等标准规范给出了电子档案技术鉴定的具体操作方法,相应地还应扩展到各类数据形态档案鉴定。另外,技术鉴定是手段而非目的,还需要档案部门从保证数据来源可靠、程序规范、要素合规三方面提前介入数据治理,借鉴司法认可的哈希值校验、电子认证、可信时间戳、区块链等真实性保障技术,实现数据治理与档案治理衔接。

  (2)利用人工智能技术应用于内容鉴定

  以机器学习为代表的人工智能具有超强的数据分析与处理能力,已广泛应用于无人驾驶、人脸识别、语音识别、自然语言处理等各个领域。惊人的数据产生速度使档案工作者很难承担数量如此巨大的档案鉴定工作。同时,人类无法承担的大量信息处理工作正是人工智能的“用武之地”。目前,国内外档案部门进行了一定实践探索,如瑞士纳沙泰尔州档案馆ArchiSelect项目等,其带来的隐私泄露、伦理风险也成为热议话题。从各行各业发展情况看,数字化转型是不可争议的发展趋势。未来,档案部门更要充分应用人工智能,在遵循既定规则的基础上,从测试中不断归纳数字档案共性以完成鉴定,并以共性反哺既定规则,完善和发展档案鉴定规则以获取更准确的鉴定结果。

  档案开发利用:数字时代的新赋能使命

  1.研究面向数字时代的档案利用制度

  大数据为档案开发利用提供了新技术、新方法、新手段,档案服务逐步走向个性化、精益化、智慧化,档案价值不断释放。与此同时,数据开放,数据交换和数据交易等数据开放共享工作成为各国政府关注焦点,其中存在的法律风险和制度空白业已引起多学科关注。数据与档案相生相随、密不可分的关系,催促传统档案利用制度的变革与发展。例如,从保障公民知情权和监督权角度,关注政府信息公开制度、政务数据公开制度、档案开放制度的衔接,促进一般信息的公平、自由流动;从权属角度关注数据权属问题对档案利用权的影响,目前数据权还处于探索争议阶段,我国正在构建数据资源持有权、数据加工使用权、数据产品经营权等权利分置的产权运行机制,在三权分置框架下,需要明确归档后档案权属和权利,特别是严格区分国家所有的档案和非国家所有档案,以此为基准界定档案利用权、档案数据安全责任机制,这对维护档案工作独立性也是至关重要。

  2.保障公民信息公平权益

  数据开放意味着使用数据的门槛降低,用户对数据的获取、使用和分享变得更加方便。但是,由于不同用户的信息获取能力、分析数据的条件与技术不同,从政务数据中获得的收益也不同,这有可能造成社会不平等、社会分化以及“数据鸿沟”的出现。在部分国家和地区,特权和不公平已经潜入到了数据活动之中,普通用户无法操控处理复杂的数据。美国学者祖博夫提出了“网络监控资本主义”的概念,他认为互联网公司等数据企业通过收集人们网络行为产生的数据,独占了数据利用权。正如前文所述,档案是记忆工具,档案馆肩负着为党管档、为国守史、为民服务的历史使命,是社会信息管理和利用的专业机构,是保障公民信息公平权益的最后一道保护线。档案馆在数据时代履行信息公正职责,可以迎合公共数据开放趋势,打破现有公共数据条块分散现状,在源头上完成数据类档案的“应收尽收”,让公民一站式查询到所需信息;可以统筹考虑公共数据开放状态,适当限缩经济、教育、科技、文化等类档案封闭期,让公民及时高效查询利用;可以参与公共数据产品开发,让公民公平享有档案衍生产品。

  3.为公民提供信息信赖保护

  詹金逊曾这样描述档案工作者的形象:“其信条是证据的神圣;其任务是保护他所负责的档案中的每一寸证据;其目标是毫无偏见地为所有求知者提供知识财富。”加拿大档案学者露西安娜·杜兰蒂从历史发展的角度考察了档案馆的本质特征,档案馆作为权威性和真实性文献保管场所的本质是经久不变的。档案职业的公信力逐步确立起来,并得到整个社会的认同。正如上文所述,相较于数据,档案是可信的、相互联系的,也就为公民享有可信赖信息提供了保护。同时,数据技术为可信产品提供了更多可能。例如,档案馆以可信的第三方参与公共数据产品和服务,无差别的为公民提供不涉及国家安全、个人隐私的档案资源出证服务,还可以按照“原始数据不出域、数据可用不可见”的要求,以模型、核验等产品和服务的形式向社会提供验证类产品和服务等,保护公民对可信信息依赖权利。

  150年前,马克思、恩格斯在《共产党宣言》德文版序言中写道,对于《共产党宣言》基本原理的运用,“随时随地都要以当时的历史条件为转移”。这一论述饱含着守正创新的理论追求和实践要求。作为数字时代的档案工作者,要深刻认知档案的本质属性,准确把握档案工作规律,坚守“不变之道”,全面衡量数据形式档案的新特征、新要求,踏实做好本职工作。与此同时,数据技术为档案工作提供了更多技术革新可能性和应对挑战的可行方式,唯有以开放、共享、创新姿态迎接新时代。

  参考文献:

  [1]王珊,萨师煊.数据库系统概论(第5版) [M].高等教育出版社,2014.

  [2]刘越男.数据管理大潮下电子文件管理的挑战与对策[J].北京档案,2021(6).

  [3]The Library of Congress will no longer archive every tweet[EB/OL].[2023-03-27].https://www.theverge.com/2017/12/26/16819748/library-of-congress-twitter-archive-project-stalled.

  [4]阿莱达·阿斯曼,王小米,记忆还是遗忘:如何走出共同的暴力历史?[J].国外理论动态,2016(6).

  [5]赵静蓉.数字时代中的国家记忆危机及其未来[J].文艺理论研究,2021(3).

  [6] See Shoshana Zuboff.The Age of Surveilla.nce Capitalism:The Fight for a Human Future at theNew Frontier of Power [M].Public Affairs,2019.

  [7]特里·库克.四个范式:欧洲档案学的观念和战略的变化[J].档案学研究,2011(3).

  [8] DurantiL. Archives as a place [J].Archives and Manuscripts,1996(2).

  作者单位:国家知识产权局、国家档案局、天津师范大学

  责任编辑:周拯民