“互联网+”视域下公众档案建设难点问题与应对策略

发布时间:2025-03-06 08:34:57被阅览数:37 次信息来源:《中国档案》

  作者:田伟   刘东

  公众档案建设具有重要的意义,但该领域的理论与实践当前总体处于起步阶段。为了科学推进公众档案建设发展,必须首先明确该领域建设事业所要达到的目标。对此,应当从“互联网+档案”的视角进行考察,档案事业的发展也必须更好地满足“互联网+”环境下用户的应用特点。在这样的时代背景下,公众档案的建设和发展应当是符合时代要求的具有活力的档案事业领域。具体来说,“互联网+”视域下公众档案事业的发展目标,应当是用户依托现代信息技术,能够安全高效地利用丰富的公众档案资源。以这个总体目标考察,当前该领域难点问题主要包括:(1)如何规范建立公众档案资源体系。针对公众档案的三大组成部分“个人存档”“民间文献”“社群档案”的各自特点,将公众资料转化为规范的档案资源。(2)如何科学有效存储公众档案资源。分别针对以电子载体形式和传统载体形式存在的公众档案资源,应研究相应数据存储策略。(3)如何有效利用公众档案资源。公众档案资源利用权限规则、利用渠道制度、利用互动交流制度规范等方面的问题研究。

  应对策略体系

  上述难点问题,涉及档案事业的“四大体系”、交叉学科协作发展等多方面的因素。为了推进这个系统性工程,需要以适当的理论模型指导,制订体系化的应对策略。

  霍尔模型是一种三维结构模型,该模型将系统工程描述为时间维、逻辑维、知识维,以三维结构描述系统工程的实施策略体系,可以用于解决系统工程综合型体系化策略制定问题。

  霍尔模型强调的是明确目标,核心是系统优化,这与当前推动实现“互联网+”视域下公众档案事业发展目标的需求十分一致。因此,本文以该模型为策略生成指导模型,如图所示。

1.jpg

公众档案发展策略霍尔模型图

  1.知识维

  该维度用以定义完成系统工程所需运用的专业知识领域。对于制定公众档案事业发展策略而言,对经典的霍尔模型知识维进行必要的重构。为了实现“互联网+”视域下的建设发展目标,应对档案事业的档案治理体系、档案资源体系、档案利用体系、档案安全体系进行综合性的知识运用。这四大体系也很好地刻画了推动公众档案事业发展的系统工程所需的不同知识领域,因此以此“四大体系”构成三维模型中的知识维。

  2.时间维

  该维度侧重于表达物的演化成熟度。对于公众档案事业发展,应该以“互联网+档案”视域刻画其成熟度。为此本文结合以往研究成果,以“‘互联网+’视域下档案信息化建设的四重境界理论”作为描述该领域事业发展成熟度的标准。在此将霍尔模型的时间维重构为“普通检索完备”“智慧检索完备”“远程获取完备”“跨界获取完备”4个发展阶段,以此“四重境界”体系构成三维模型中的时间维。

  3.逻辑维

  该维度侧重表达人在主观上采取逻辑步骤解决问题的思维程序。经典的霍尔模型逻辑维包括“明确问题”“评价设计”“系统综合”“系统分析”“优化”“决策”“行动计划”7个步骤。因此可在霍尔模型经典逻辑维指导下,以此7个步骤逐步制定公众档案建设发展策略。

  霍尔模型的三维结构可以综合考虑档案事业体系、“互联网+”思维以及系统工程方法等方面的因素,通过三维模型结构的交叉诠释,指导制定出系统化、前瞻性、实践性的公众档案事业建设发展策略体系。

  如表所示,以霍尔模型三维结构指导生成针对特定阶段任务的策略群,形成“立方体”式策略体系。这些策略可按规律编号,分别构成用以实现总目标的子任务。

霍尔模型指导下公众档案发展策略体系示例表

2.jpg

  公众档案发展策略霍尔模型图可生成4×7×4共计112个分策略。在此,其编号规则定义为“S+abc”。其中a标示时间维,普通检索完备、智慧检索完备、远程获取完备、跨界获取完备“四重境界”分别以1、2、3、4代表;b标示逻辑维,从明确问题到行动计划7个步骤分别以编号1~7代表;c标示知识维,档案治理体系、档案资源体系、档案利用体系、档案安全体系依次以1~4代表。编号表明各分策略所具有的特定含义。本文将典型策略阐述如下:

  (1)S243

  含义是满足智慧检索完备的档案利用体系系统分析策略。对“战疫”公众档案资源智慧检索完备两大组成部分(“智能检索系统”和“个性化推荐系统”)分别制定系统分析策略。如,“战疫”公众档案资源本体库建设方案分析、基于语义的多媒体公众档案检索方案分析、“战疫”公众档案协同过滤数据组织方案分析等方面。详细确定公众档案资源本体领域和范围,现有本体重用方案分析等。分析定义一定范围公众档案资源类属性和关系,进而构建实例。如对于照片形式的公众档案,通过本体库建设分析,将隐藏于照片档案各层次的信息规范化、形式化、电子化。

  以全局分析法、局部分析法、本体库知识架构分析等方法获取多媒体形式公众档案的查询扩展体系,特别是应用本体库中同义词与特定关联进行查询扩展方案分析,从而实现以公众档案本体库知识为基础,提升其检索智能水平。

  基于协同过滤等智能推荐技术对公众档案数据逻辑组织方案进行分析。如首先分析确定档案数据粒度,确定档案数据项目(item)数量,据此构造协同过滤二维矩阵,进而对公众档案数据在利用体系中的逻辑组织方式进行优化,分析确定最优数据组织方案。可设定各档案用户在协同过滤系统中评分行为相互独立,设U为特定公众档案利用系统中用户的总数量;I为特定公众档案利用系统中档案数据项目总数量;R为特定公众档案协同过滤系统中评分等级数量;则单个档案用户在此协同过滤系统中可表达的个性化评价状态数量为V=RI,此协同过滤系统中所有用户可表达的个性化评价状态数量为Vu=UV。

  相关研究表明,Vu的值应设较大,而R的值不宜过大以避免线性相似度计算失效,I的值应兼顾个性化评价状态数量和相同种类项目聚合。故应将相似类别公众档案数据在逻辑上聚合至同一协同过滤矩阵,以更好地满足用户多兴趣下个性化推荐,优化智能推荐中档案数据组织。

  (2)S411

  含义为满足跨界获取完备的档案治理体系明确问题策略。公众档案的跨界获取完备含义在于实现消除公众档案不同存储单元间信息壁垒,达成数据访问逻辑上的有序跨界应用。公众档案本身的特点即是高度分散,因此应依托档案治理体系的新理念,达成公众档案资源的跨界获取完备。

  档案治理体系是对档案资源及相关事务实施规划、组织、决策等一系列制度安排及运行过程的总和。档案治理体系建设本身即要求不同档案治理主体多元参与、协同运作。因此,档案部门应密切协同公众档案资源各方主体,明确跨界信息壁垒问题成因及解决路径,从而形成跨界档案治理的合力,促进档案形成者、档案利用者、档案管理机构等各方面安全高效获取档案资源。

  (3)S451

  含义为满足跨界获取完备的档案治理体系优化策略。对于公众档案资源的跨界获取完备优化,数字人文是一项重要发展理念。数字人文理念的引入,突破了传统档案资源组织思想和方法的局限,为相关决策者和领域学者提供了新的研究方法、路径与视角。数字人文基础设施建设主要包括“数字化”“数据化”“知识化”“可视化”4个阶段。因此公众档案资源的跨界获取完备优化,应以数字化筑牢档案资源获取基础,以数据化细化档案资源描述粒度,以知识化拓宽档案知识组织广度,以可视化延伸档案知识呈现深度。

  (4)S471

  含义为满足跨界获取完备的档案治理体系行动策略。联合公众档案资源各相关主体,推动实现以数字人文视角、方法和工具全面获取档案资源信息,跨界开展档案资源数字化、数据化、知识化行动计划。推进实现各相关主体通过档案全文原貌分析深入挖掘档案资源信息,将数字形态公众档案资源转换成可分析数据形态,进而打破跨界壁垒发现新知。以知识图谱等技术对档案资源进行语义和语法关联,实现目标主题的相关数据提取。以档案治理的理念推动实现服务模式与研究范式的转型。

  启示

  公众档案事业从无到有,逐步优化,实际上是一种大型复杂系统的建设发展。零敲碎打、不成体系的策略不能从整体上推进公众档案事业进步。应在体系化、目标明确的策略框架下以精益迭代方式协同发展。公众档案的研究为我们带来了新命题、新策略。本文所提出的理论模型框架也为相关领域档案事业发展提供一定参考。

  参考文献:

  [1]杨智勇,邓文霞.参与式视域下疫情档案信息服务模式建构研究[J].档案学研究,2021(6).

  [2]田伟,韩海涛.“互联网+”视域下档案信息化建设的四重境界[J].中国档案,2017(10).

  [本文系国家档案局科技项目“‘互联网+’视域下‘战疫’公众档案建设与发展策略研究”(项目编号:2022-R-003)的阶段性研究成果]

  作者单位:天津工业大学档案馆

  责任编辑:王辉