人工智能如何赋能档案开放 ——福建省漳州市档案馆人工智能鉴定辅助系统使用初探

发布时间:2024-03-18 14:50:41被阅览数:285 次信息来源:中国档案 作者:翁冬婷

  近年来,福建省漳州市档案馆按照档案法和《国家档案馆档案开放办法》要求,积极探索人工智能辅助档案开放审核技术,引入人工智能鉴定辅助系统(以下简称“系统”),辅助人工完成15万条馆藏档案的开放审核工作,成效初显。

  系统深度学习,提高审核准确率

  人工智能鉴定的准确率,首先依赖于系统对馆藏档案数据特色和开放依据的深度学习。因此,为系统提供“学习素材”是关键。

  建立档案敏感词库。根据数字档案馆建设情况及馆藏实际,市档案馆专门建立档案敏感词库。系统通过对敏感词的学习,能够实现对档案目录及原文中的敏感词进行高亮提醒,并能帮助快速定位到相应位置,提高人工审核的效率。

  建立开放鉴定算法模型。通过学习已鉴定档案的审核结果,能够训练出符合开放条件的算法模型,并利用训练好的模型,推断出待鉴定档案数据的开放鉴定结论,实现待鉴定档案的自动分类分库,并生成“涉密档案库”“非密控制库”“拟开放库”。目前,人工智能鉴定的准确率可达到80%以上。

  优化可操作性方案。在试用系统的过程中,市档案馆不断提高鉴定结果准确率,并提供系统优化的可操作性方案,如,提高人工审核过程中数据刷新效率、加强审核结果数据的维护、提高敏感词定位速度等。

  实现全流程管理,提高审核效率

  系统会自动对导入的数据进行初步质量检查,包含字段是否为空、长度是否正确、内容是否符合要求等。成功导入后,再对数据进行初步开放鉴定判断,然后进入人工“三审”环节,即初审、复审、终审,从而实现在系统上的全流程管理。

  规范用户管理,实现过程留痕。不同用户按不同身份进入系统,即“三审”人员对应不同的使用和管理权限。从任务分配到各环节审核再到流转下一环节,均可实时记录相应的操作人员,确保各个流程留痕、可追溯。

  辅助数据初判,提高审核效率。系统通过对规则的学习,对拟开放审核数据进行初步判断,对待人工鉴定档案自动分类分库,高亮提示敏感词汇,给出判断依据。人工“三审”环节,将在人工智能鉴定结果的基础上进行判断,能够进一步提高效率。

  审核数据维护,方便成果利用。系统在对人工智能鉴定结果与人工鉴定结果进行对比分析的基础上,能够得出智能鉴定结果的差错率,并对出错结果进行进一步学习,通过反复学习和修正,逐步提高智能鉴定结果的准确率。开放审核结果的目录数据报表可自定义打印,可增加、修改、删除需打印的字段,为开放率的统计以及机关单位会审环节提供数据基础。

  拓展服务功能,提高系统利用率

  为提高系统的利用率,市档案馆还积极探索系统在其他档案鉴定业务上的应用。

  涉密档案筛查。通过档案目录和原文关键词的过滤,可对不同密级的档案进行筛查,对不同密级的档案数字化成果进行辅助剥离,准确率达80%以上。配合人工检查,准确率可达99%以上。

  到期档案鉴定。即以优化档案馆藏为目的,从现实和潜在档案利用需求出发,兼顾馆藏的数量、结构、内容、形成时间等因素,对已满保管期限档案的价值进行鉴定。

  密级鉴定。密级鉴定是指对馆藏涉密档案进行密级的重新鉴定,鉴定后档案将按照新的密级进行解密或划控。但如采用人工智能进行初步判断,系统还需对鉴定规则进行更深度的学习,方能真正实现人工智能辅助密级鉴定的功能。

  从目前成效看,市档案馆虽初步探索了“人工智能+人工”的档案开放审核模式,但在全面走向人工智能的过程中,还需要不断优化系统,并加强系统对鉴定规则的深度学习。

  原载于《中国档案报》2024年3月14日 总第4109期 第三版