发布时间:2024-02-01 08:58:38被阅览数:657 次信息来源:《中国档案》
文/丁德胜
智慧档案是以数字技术应用为重要特点和基本前提的档案工作组织、建设、运行和管理新模式。智慧档案馆室建设作为实施智慧档案战略的重要内容和关键环节之一,需要按照“技术驱动、场景赋能、智慧发展”的总体思路,深入应用各种数字技术,设计并构建丰富的技术应用场景,通过技术场景化赋能、支撑智慧档案馆室建设。
智慧档案馆室建设涉及的数字技术
新一代数字技术有ABCD、ABCDEFG、ABCDI等多种说法。其中A是指人工智能(Artificial Intelligence;AI)、B是指区块链(Block Chain)、C是指云计算(Cloud Computing)、D是指大数据(Big Data)、E是指边缘计算(Edge Computing)、F是指雾计算(Fog computing)、G是指第五代通信技术(5G)、I是指物联网(Internet of Things;IoT)。另外还包括数字孪生(Digital Twin)、元宇宙(Metaverse)等。2020年,国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部联合印发《国家新一代人工智能标准体系建设指南》,将数字技术分为支撑技术、关键通用技术、关键领域技术,从标准体系角度对新一代数字技术作了梳理、分类。
鉴于数字档案本身的数据属性,以及智慧档案馆室涉及档案馆舍、网络、系统、软件、硬件等诸多因素,智慧档案馆室建设原则上应当包括人工智能、大数据、云计算、物联网、5G、区块链、数字孪生、元宇宙等所有的新一代数字技术,同时也包括这些技术本身包含的或派生的关键技术(如表所示)。
智慧档案馆室建设涉及的数字技术
在智慧档案馆室建设中,人工智能、大数据、云计算、物联网属于核心应用技术。其中,人工智能技术用于分析档案数据,从中提取有价值的信息。云计算技术用于提供存储和处理档案数据基础设施,使得大数据分析变得更加高效和可扩展。大数据技术用于分析和处理档案数据,从而实现智能决策。物联网用于实时采集信息并通过网络实现物与物、物与人的泛在连接,实现对物品和过程的智能化感知、识别和管理。5G、区块链、数字孪生、元宇宙属于重要支撑技术,主要用于支持智慧档案馆室通信、安全、建筑、展陈等方面内容的建设。这些技术之间存在比较复杂的交叉关系,彼此之间密切联系、相互促进,共同支撑智慧档案的数字化和智能化发展(如图1所示)。
图1 智慧档案馆室建设数字技术之间关系
智慧档案馆室数字技术创新应用场景
智慧档案馆室的建设内容包括智慧决策(Smart Decision)、智慧服务(Smart Service)、智慧数据(Smart Data)、智慧保护(Smart Custody)、智慧建筑(Smart Building)、智慧管理(Smart Governance)。结合档案工作实践和新一代数字技术发展情况,智慧档案馆室建设主要包括以下20项数字技术创新应用场景(如图2所示)。
图2 智慧档案馆室建设数字技术创新应用场景
智慧决策主要场景:
1.智能问答
智能问答是指通过问答形式为用户提供知识服务,从而帮助人们解决特定领域问题并做出正确决策的信息服务方式。智能问答一般通过构建基于检索的问答系统(Retrieval-basedQA)或者基于生成模型的问答系统(Generative-based QA)实现。在技术实现方法上,前者是在构建知识库的基础上,运用自然语言处理、机器学习等技术检索知识库中的信息来回答用户的问题。后者通过机器学习、深度学习等技术构建深层语义模型,并通过模型生成相应的回复来回答用户的问题。ChatGPT、文心一言等就属于比较典型的基于生成模型的问答系统。
2.辅助决策
辅助决策是指通过构建并使用辅助决策系统,为趋势分析、风险控制、资源优化等不同决策主题提供支持的信息服务方式。常见的辅助决策系统包括专家系统(Expert System;ES)、决策支持系统(Decision Support System;DSS)以及派生发展的智能或综合决策支持系统。辅助决策系统一般是在构建数据库、模型库、方法库、知识库等基础上,综合运用数据分析、数据可视化、自然语言处理、数据挖掘、机器学习、人机交互等技术,通过数据来洞察业务背后的规律,进而预测结果、验证假设、辅助决策、优化决策。
智慧服务主要场景:
3.智能利用
智能利用包括智能检索、精准服务等智能化、个性化档案利用服务。智能检索基于知识图谱、知识库、专家库等,运用自然语言处理、机器学习等技术构建强大的搜索引擎,实现立体多元、智能化检索。个性化服务是指通过用户画像、数据分析等方式,深刻把握用户多样化和个性化服务需要,通过大数据技术为用户推荐或主动推送档案信息知识。
4.智能开放
智能开放是指运用大数据、自然语言处理、人工智能等技术,智能化开展档案开放审核工作。智能开放一般做法是通过自然语言处理、数据分析、深度学习等技术建立档案开放审核模型,为档案开放审核提供建议,提升档案开放审核的效率和准确性。
5.数字编研
数字编研是指运用数据挖掘、文本挖掘、知识图谱、自然语言处理尤其是AI生成内容(AI-Generated Content,AIGC)等技术进行的多层次多维度编研。数据挖掘、文本挖掘有助于从大量的数据、文本中自动发现有用的信息和知识。运用知识图谱技术可以发现编研脉络及关联相关资源,为形成更多形式的新型编研成果提供依据与基础。AI生成内容可以通过私有化部署大型语言模型(Large Language Model,LLM)等方式直接生成编研提纲或具体内容。
6.数字展陈
数字展陈是基于互联网,用数字化的手段、技术和方式,在虚拟空间中实现档案展览展示核心功能的全新展陈方式。数字展陈主要应用三维建模和渲染、虚拟现实和增强现实等元宇宙技术,能够带给观众身临其境、虚拟相生的极致体验。
智慧数据主要场景:
7.智能收集
智能收集是指按照档案管理范围对档案数据进行智能鉴定和自动收集。智能鉴定是指对档案数据的收集范围和保管期限进行自动化、智能化鉴定。目前智能鉴定一般采用关键词匹配的方式进行,随着新技术的应用,档案鉴定可以通过构建鉴定模型或运用机器学习、自然语言处理、文本挖掘、语义分析等技术实现高效智能鉴定。自动收集是在确定收集范围的基础上,由系统按照档案管理范围和要求对电子档案、元数据、日志、用户反馈等信息数据进行的自动化收集。
8.智能整理
智能整理是指按照档案管理要求,运用新技术对档案进行的智能组件、分类、排列、编号、编目(著录)等整理行为。智能整理比较典型的做法包括使用生物特征识别技术对文本、录音、录像中的手写体、语音、图像等进行识别、抽取特征;运用自然语言技术对档案文本进行分析,辅助编目和著录;运用计算机视觉技术对照片进行人脸识别并自动分类;运用大数据技术对文本进行自动聚类、分类等。
9.智能治理
智能治理是指按照数据治理的要求,运用大数据和人工智能技术将档案资源数据化并进行智能化治理。智能治理包括运用自然语言技术将档案资源数据化,运用知识图谱等大规模语义网络整合数据,帮助机器理解数据、解释现象、知识推理;运用机器学习技术对档案数据进行数据挖掘和分析,识别是否有异常数据、涉密等特殊标记数据;通过机器学习算法进行深度分析,定位数据质量原因,提升数据质量管理能力等。
10.智能汇聚
智能汇聚是指通过自动化、智能化的方式汇聚建立档案目录库、元数据库、档案资源库、知识库等。目录库、元数据库、档案资源库、知识库等是电子档案现代化、智能化管理需要特别注重的数据库类型。智能汇聚就是在传统数据库建设基础上,运用自然语言、知识图谱等技术手段方式智能化建立数据库,支撑智慧档案管理。
智慧保护主要场景:
11.智能库房
智能库房是在档案实体库房内有机集成智能柜架、温湿度监测调控、空气质量控制、消防、安防等设施设备,并实现设备控制和档案管理自动化、智能化的库房。智能库房主要应用物联网、RFID、嵌入式系统、网络通信、机器人等技术实现档案的自动定位、识别、取放和其他智能化管理。智能库房与智慧建筑中的智能环境相结合,还能够实现档案库房环境的智能控制。
12.智能监测
智能监测是以档案实体和数字档案资源载体为主要管理对象,运用物联网、智能感知和无损检测等技术,针对实体档案和档案载体流转、存放和健康状态及影响因素进行全面量化分析并自动化智能化采取措施,实现档案的智能化保管。
13.可信管理
可信管理是在数字档案资源形成、流转、管理过程中,综合运用生物特征识别、云存储、区块链等技术为数字档案资源管理提供安全可信的数据共享和流转环境,并提供数据鉴权、追溯、审计等能力,实现安全可信管理。
14.智能存储
智能存储是以数字档案资源为管理对象,运用大数据、云存储等技术控制存储备份设施设备并自动实施电子档案存储、备份、恢复、迁移等工作。智能存储应当根据组织机构具体情况确定存储、备份、迁移策略,并通过自动化、智能化的方式予以执行。
智慧建筑主要场景:
15.智能环境
智能环境是指对档案馆舍建筑空气质量、水环境、热环境、声环境、光环境等相关参数进行自动化、智能化监测、报警和调控。智能环境通过传感器、嵌入式系统、网络通信等物联网技术、人工智能技术实现对建筑环境的实时监控和调节,以达到节能、舒适、高效的目的。
16.智能安防
智能安防是指运用传感器、计算机视觉、生物特征识别等技术实现档案建筑智能化安全防护。比如通过人脸、指纹、行为特征等生物特征识别技术实现对建筑内外的安全监控,实现对人员出入管理等。
17.智能消防
智能消防系统通过安装烟雾探测器、温度传感器、火灾报警器并通过5G、物联网、人工智能技术等实现智能化消防。智能消防能够提供火灾预警并在火灾发生时自动启动灭火设备,并通知相关部门进行紧急处理。
18.智能运维
智能运维主要是指对物业、交通、通信等进行的智能化管理。智能物业通过物联网技术、数字孪生、大数据分析等手段,实现对建筑设施、能源消耗、环境监测等方面的统一管理。智能交通通过计算机视觉、传感器、无线通信等手段实现对建筑内外交通状况的实时监控和管理。智能通信通过5G、光纤技术等实现建筑内高速网络接入和稳定通信服务。
智慧管理主要场景:
19.智能监督
智能监督是指依托人工智能、自然语言处理、云计算、知识图谱、大数据分析、机器学习、数据挖掘等对组织机构业务流程、电子档案生命周期管理、法规遵从、数据安全、数据质量进行全方位、多层次监督。
20.智能管控
智能管控主要是通过数字驾驶舱(Digital Cockpit)或数字孪生技术对智慧档案馆室的设施、资源、用户、技术、服务等管理领域的关键指标提供可视化综合监测,辅助管理者直观掌控运行态势并进行管理。数字驾驶舱一般依托大数据、人工智能技术实现。数字孪生主要通过仿真和建模、可视化等技术实现对实体对象动态仿真、监测、分析和控制。
综上,数字技术应用场景是数字技术在智慧档案馆室建设中应用的主要方式,同时也是智慧档案馆室建设的重要目标和方向,对于构建智慧档案馆室乃至智慧档案的建设内容具重要参考意义,值得进一步研究和探索。
作者单位:国家档案局
责任编辑:王辉