发布时间:2024-07-26 19:54:40被阅览数:259 次信息来源:《中国档案》
文/王哲 黎安润泽 初颖慧 刘春培
在国家政策引导与新兴技术驱动下,企业档案工作面临着数字化转型和知识化管理的新形势。中国南方电网有限责任公司(以下简称“南方电网”)对未来数据层、知识层和应用层的形态变化进行了深入分析,提出基于档案知识工程的知识赋能业务新路径,从档案资源中提取有价值的部分,构建数字档案知识图谱,建立档案知识管理平台,最终实现业务场景应用。
新形势:档案工作进入高质量发展阶段
随着新一轮科技革命和产业革命的浪潮席卷而来,档案工作的环境、对象、内容均发生了巨大的变化,迫切要求企业创新档案工作理念、方法、模式,加快档案工作的全面数字转型和智能升级。在数字时代,企业档案工作面临现代化管理和高质量发展的新形势,需要不断延伸档案工作空间,从被动等待的业务档案变为主动服务的档案业务,激活档案数据要素潜能,发挥档案知识赋能业务的创新引擎作用。南方电网抓住新形势下的挑战与机遇,将知识管理纳入战略规划和业务版图之中,积极借助现代化技术手段,构建以知识流引领业务流的档案知识赋能业务新路径,进而推进企业档案及各项业务的高质量创新发展。
新框架:档案知识赋能业务升级
1.理论基础:档案知识工程
随着新兴技术的发展以及设备算力的提升,档案资源正由可识别的数字态向可计算的数据态转化,相关学者开始探索档案管理工作的创新转型,逐渐形成系统化、工程化的档案知识发现与服务框架,并演化成档案知识工程理论。张斌等提出了面向组织决策的档案知识库,探讨档案知识获取、知识表示、知识推理与知识检索等知识工程的核心问题,为档案知识工程研究建立了理论基础。牛力等则总结归纳了包含知识获取、知识表示、知识组织、知识推理、知识检索、知识可视化六个部分的档案知识工程研究体系,并以知识工程和档案服务平台间的关系及融合机制为基础,探索了知识工程视角下档案知识服务的模式与机理。
2.南方电网数字档案知识管理蓝图
南方电网的档案知识管理愿景是“促进档案知识赋能,加速数字南网进程”,旨在通过南方电网档案知识管理研究与实践,强化前端档案知识治理,畅通中端档案知识供给,优化后端档案价值实现,在加快推进“数字南网”进程中贡献档案力量。基于此愿景,南方电网按照“以价值为驱动重塑档案数据知识转化”的逻辑进行档案知识管理蓝图规划,从数据层、知识层与应用层三个层次说明未来知识管理的形态变化,以价值为驱动重塑档案数据知识转化的核心逻辑,以档案知识塔工程、档案知识池工程、档案知识台工程、档案知识场工程和档案知识果工程五大工程体系构筑从档案数据到档案知识的转换路径,以构建档案赋能生态圈与知识创新生态圈为持续动力,支撑企业走向未来档案知识管理。
(1)未来数据层形态变化
南方电网数字档案知识管理蓝图中的未来数据层从全归档、全目录、全内容与全价值4个方面对档案数据层的对象与内容进行重塑,为从档案数据转化成为档案知识提供可用的数据准备。全归档指向文件材料归档范围的修订与细化、优化工作,实现应收尽收,应归尽归,以保障档案部门全面完整地留存业务记录,以过去经验为未来业务决策提供支撑。全目录指向馆藏档案的目录数据丰富与目录数据地图构建,提升档案目录的互鉴性与导览性,促进档案部门进行数据资产管控。全内容指向馆藏档案的内容数据提取与管理,深入数据分类管理,应对传统以元数据为基础的档案检索方式导致的查不全、查不准、耗时长等问题。全价值指向馆藏档案的多层次价值鉴定工作,在档案入馆时不仅要进行保存价值的判定,也要进行利用价值的判定。
(2)未来知识层形态变化
南方电网数字档案知识管理蓝图中的未来知识层主要包括多粒度、全关联、大模型与知识库四项特征,为从档案数据转化成档案知识提供可行的技术路线。多粒度意味着档案知识对象的多维认识问题。面向利用价值,南方电网数字档案知识对象呈现多粒度状态,包括粗粒度的资源知识对象、中粒度的结构知识对象、细粒度的要素知识对象。全关联意味着档案知识对象的顶层组织问题。针对不同类型档案知识对象,档案知识对象的顶层知识模型相应表现为档案资源类知识模型、内容考据类知识模型、知识要素类知识模型,从顶层组织角度构建起多粒度资源的全关联图景。大模型意味着大模型技术对档案知识组织形态的变革,其强大的泛化能力驱动档案数据向知识向量形态变化。知识库意味着对档案知识对象的大规模存储呈现。知识组织之后主要以知识库的形态呈现,南方电网根据档案知识对象加工程度的不同,分别构建原生知识库、专题知识库、知识资产库。
(3)未来应用层形态变化
南方电网数字档案知识管理蓝图中的未来应用层从业务场景牵引与知识应用赋能两个方面对档案应用层的逻辑进行构建,最终形成“场景牵引、知识赋能”的档案赋能业务格局。业务场景牵引指向档案知识的应用方向,主要体现在两个方面:一是前置南方电网场景需求,从具体的业务场景出发,明确业务场景需要什么样的档案内容支撑,体现在数据层对档案利用价值的识别与评估上;二是后设南方电网场景通道,提供不同知识库层次,满足不同的知识利用需求。知识应用赋能指向档案知识的应用成效,主要通过知识库、知识门户等提供服务,涵盖知识搜索、知识问答、知识推荐、知识推理、知识预测等功能。
新系统:档案知识工程五大内容域
1.档案知识塔工程:档案知识规范化表达
南方电网档案知识塔工程中所构建的概念模型是档案知识的抽象表示模型,为档案知识识别和档案知识抽取提供了模板。该工程可以指导如何从档案资源中提取有价值的部分,实现档案数据到档案知识的转化。南方电网通过自顶向下构建本体模型的方式,设计数字档案知识顶层知识模型,以这一概念模型为核心定义数据结构,按照知识的粗、中、细三种粒度定义南方电网数字档案的三类知识单元。进而南方电网在继承顶层知识模型的基本概念类与属性的基础上,选取典型业务领域构建子模型,刻画不同业务领域数字档案需要关注的知识内容。
2.档案知识池工程:档案知识关联化组织
南方电网档案知识池工程以档案知识塔工程中构建的概念模型为基础,通过知识抽取、知识融合、知识关联等步骤为档案知识工程提供充足、高质量的知识资源。从技术应用视角分析,指导如何从多源档案资源中抽取、关联档案知识,形成数字档案知识图谱。南方电网通过对现有技术的研究,提出大模型支撑下面向企业特征的知识图谱构建思路,包括知识获取、知识融合、知识存储和知识应用四个关键步骤,能够为企业员工提供知识检索、知识可视化、知识推理、知识推荐、知识问答与知识生成等典型知识服务。
3.档案知识台工程:档案知识系统化加工
南方电网档案知识台工程以前两项工程成果为基础,经过对档案知识的存储与加工、档案知识管理平台功能的规划与设计,南方电网明确了“档案加工、知识存储、知识加工”的档案知识价值实现路径。按照“数用分离”逻辑构建档案知识管理平台,明确平台所涉及的业务规则、使用级别、先决条件、基本功能、辅助功能、处理约束、输入输出信息、功能用例、规则算法等各功能要点,支持系统管理者对各业务领域的档案知识模型进行创建、修改与删除,接入人工智能等技术实现档案知识多粒度加工服务。
4.档案知识场工程:档案知识场景化应用
南方电网档案知识场工程以“部门、场景、知识”为建设主线,指导档案知识精准赋能南方电网各类业务场景,系统回答了“档案知识从哪里来、档案知识可以到哪里去”的问题。南方电网通过前期深入详尽的业务需求调研,梳理档案知识产生与应用场景类型,以生产运维、行政办公、科研创新三个典型场景为例阐述档案知识应用点,提供针对性的档案知识服务,形成档案知识从转化形成到场景化落地之间的闭环,提升企业用户满意度,释放档案知识价值。
5.档案知识果工程:档案知识跨域化共享
南方电网档案知识果工程强调档案知识的跨部门共享,通过用户角色划分、权限区别化设计、共享场景规划等步骤促进档案知识在企业内部的安全、高效流通。南方电网根据档案知识的重要与敏感程度,将其设定为全共享、域共享、不共享三种共享利用权限,并且根据企业部门和岗位职责的不同,为各部门设定相应的角色,建立用户角色与共享权限之间的映射关系,确保各部门用户在知识管理平台中能够尽可能获取范围内知识内容,以满足实际需求。此外,南方电网通过建立档案知识共享目录与通用交换流程,完善协同办公、共享知识库建设等共享场景设计,明确档案知识跨部门共享利用的路径。
参考文献:
[1]张斌,魏扣,郝琦.面向决策的档案知识库构建研究[J].图书情报工作,2016(5).
[2]张斌,高晨翔,牛力.对象、结构与价值:档案知识工程的基础问题探究[J].档案学通讯,2021(3).
[3]牛力,高晨翔,韩小汀.模式与机制:知识工程视点下的档案知识服务研究[J].档案学研究,2021(2).
[本文系国家档案局科技项目“人工智能在电网建设项目档案中的应用研究与策略路径”(项目编号:2023-X-008)的阶段性研究成果]
作者单位:中国南方电网有限责任公司档案馆、中国人民大学档案学院
责任编辑:巩慧