“AI+档案”应用场景的畅想与思考

发布时间:2023-09-14 00:22:46被阅览数:407 次信息来源:中国档案报

当下,第四次工业革命方兴未艾。人工智能、智慧网联时代的到来深刻影响着我们的生产生活和思想行为。在人们开始讨论人工智能时代人类文明向何处去的议题时,悠久而传统的档案工作也来到历史发展的十字路口。

一、“AI+档案”的出现

如果把客观世界未经处理的原始记录称为数据,那么,人类诞生以后,将数据以编码的形式表达出来,即形成了信息。而这些信息经过人们生产生活加工后便形成资料和档案,进而成为我们构建、重组、研判、提炼形成知识和智慧的基础。

20世纪50年代,阿兰·图灵在《计算机器与智能》中提出“图灵测试”,约翰·麦卡锡(John McCarthy)等科学家在美国达特茅斯学院举办的研讨会上正式提出“人工智能”概念。70多年来,人工智能的平台、算法、交互方式等迭代更新超乎人们想象。这一概念中的“人工”比较好理解,而“智能”主要涉及意识形成、自主思维、控制等问题。随着网络通信技术、深度学习算法的突破,未来人工智能有望在机器人、经济决策、控制系统、仿真系统中大显身手。

从当前及今后一段时期可预期的人工智能技术来看,AI不再仅仅局限于以往的数据分析和信息数字化,而主要以“AI+X”的形态呈现,例如智能客服、智能物流、智能医疗、智能金融等。AI可以通过计算、学习,自主推理、规划、交流和感知事物事件,并逐渐掌握使用工具和操控机械的能力,将人类从重复、繁重的劳动中解放出来,大大改变传统职业的行为模式。就档案领域而言,近年来档案数字化成果大多为基于扫描、拍摄、整理加工形成的图片、视频或数据等,随着技术应用场景日趋信息化、自动化,档案载体逐渐向无纸化、数字化过渡,档案正慢慢变成看得见、摸不着的数字编码,数字档案馆建设日趋成熟,“AI+档案”正潜移默化地改变传统的档案收集、整理、保管、利用等工作。

二、“AI+档案”的应用场景

1.云端收集整理,电子化归档

在可预期的“AI+档案”应用场景中,文件材料将不再装订、编页、装盒、入库,而是直接从资料形成部门或个人手中传送到云端存储,经档案系统依据算法进行自主编目、著录、标识后,存入数字档案馆备份。档案的原始属性和凭证价值主要依赖于数据存储记录和保管机构的信用证明来实现,归档效率和质量大幅提升。

2.智能保管利用,数字化查询

在可预期的“AI+档案”应用场景中,档案保管利用工作大多由数字档案馆承担,在妥善保管好历史档案数字化成果的基础上,数字档案馆将与各级数据中心高度融合,负责新生成电子档案的存储、备份、保管,存储空间和保管期限将不再受限,进一步优化和节约实体馆库空间。

数字档案馆还将进一步升级为智慧档案馆(人工智能档案馆),人工智能用类似眼、耳、鼻般的智能传感器高精度感知库房温湿度变化和周围事物,用手、足类的机械身体,精确执行移动、搬物等库房管理工作。历史档案通过数字孪生技术转化为数字档案,搭建虚拟档案馆,人们可用VR/AR方式虚拟操作和触感资料,远程分类、分层次、分权限查询利用档案。

3.智能行政监管,远程服务

在可预期的“AI+档案”应用场景中,档案行政管理职能主要通过规范各类系统平台开发、统筹制定档案行业标准等方式来履行。相应的监管职能则由平台远程自助自主落实。向社会提供更为优质便捷的远程数据科研和编研服务成为工作重点。

三、“AI+档案”的特点

1.全时空、全流程、全价值

在可预期的“AI+档案”应用场景中,档案与信息的边界愈发模糊,文件材料不再办结才能归档,而是转变为即时归档,实时化管理将成为常态。AI从信息产生之始即参与全过程留痕,归档功能自动爬梳、维护数据资源,且使用“区块链”技术的数据具有难以篡改、去中心化的特点,其真实性更加可靠。价值性与实效性叠加,利用渠道广泛多样,呈现出全时空、全流程、全价值的特点。因此,确保“AI+档案”系统的数据准确、运行稳定、反馈迅速成为首要任务。

2.多维度、虚拟化、海量级

随着技术不断发展,记载档案信息生成的数据格式日趋多样,而且多以文字、图形、音视频等融媒体形式,多维度展现档案形成的全貌。因此,功能强大的“AI+档案”系统需适应各种媒体格式,同步关联管理各类型档案。

同时,档案信息将以虚拟的数字编码形式出现,大部分资料以虚拟方式整理、归档、立卷,档案管理员运用数字孪生技术,搭建虚拟的3D库房,在虚拟的数字档案馆开展查阅利用,呈现出高度虚拟化的特点。

当前,人们生产生活新生成的数据呈几何级数增长,同时,人工智能平台建设也需要依靠大量的历史和现实数据,对存储空间的需求与日俱增。海量级存储需要强大的软硬件环境支撑,对“AI+档案”系统开发水平和时效性要求显著提高。

3.开放性、定制化、服务性

大规模人工智能应用形成的信息是广域开放的,相应的“AI+档案”系统也无法封闭运行,需要开放兼容各类平台数据格式,并面向社会开放共享。同时,由于不同性质、不同类型群体对人工智能的需求差异,在安全应用的前提下,“AI+档案”应针对有关各方的不同需求,分权限、有区别地部署,提供个性化接口、定制化服务。

在万物互联时代,档案数据来源于人工智能生态系统,涵盖智能应用、算法和平台等各方面各环节,数据的价值依托于共享和利用,数据资源市场日趋活跃。“AI+档案”系统开发日常维护需要经费支持,增值收益要依靠会员服务、广告推送等方式实现,因此,要加强数据市场监管,维护各方合法权益。

4.真实性、保密性

人工智能形成的档案数据可编辑、复制、删除,存在篡改、损毁风险,一般通过磁盘阵列实时或定期备份加以防范。使用系统加密、区块链等技术可提高可靠性、真实性,在一定条件下,还可追溯原始数据以鉴定真伪。

档案数据涉及国家机密、商业秘密、个人隐私,在人工智能开放的环境下,亟需设定严谨的密级管理和防火墙,提升档案信息安全保障标准,严密防范失泄密风险。可通过严苛的身份认证、访问控制、安全审计、交换控制等安防技术,分类、分权限提供管理和服务,确保档案数据与信息的安全。

四、思考与建议

1.解放思想,科学规划“AI+档案”未来发展

人工智能技术大潮已经到来,要解放思想、守正创新,紧跟时代发展的需要,主动融入当下数字政府、数字经济、智慧城市建设进程中去,鼓励前沿课题理论研究,培养人才,科学规划“AI+档案”未来发展方向。应加大投入,抢占未来人工智能技术制高点,加速传统档案工作转型,以回应新形势下人民群众对档案工作和数据安全的热切期盼。

2.高位统筹,严格管控“AI+档案”潜在风险

人工智能依靠自主学习形成自主思维,发展方向不可预估,存在失控的风险。开放的数据资源市场管理权限不严、边界模糊,存在失泄密隐患。亟需主管部门高位统筹,立足长远,尽早研判,完善监管。同时,鼓励基础理论研究,健全法律法规,规范“AI+档案”平台建设要求和数据标准,科学管控人工智能潜在风险。

3.创新有为,提升“AI+档案”应用能力

档案工作传承千年,在人工智能飞速发展的情境下,面临机遇与挑战,迫切需要档案部门推动人工智能与档案工作深度融合、高度集成;推动馆库和信息资源配置优化、效能提升;加强宣传培训和观摩交流,提升“AI+档案”应用能力,推动档案工作在不断创新中迈上发展新台阶。

原载于《中国档案报》2023年8月10日 总第4020期 第三版