发布时间:2024-06-06 19:22:56被阅览数:137 次信息来源:中国档案报 作者:刘军
本报讯 随着数字档案馆建设项目的深入推进,北京市昌平区档案馆积极探索人工智能辅助档案开放鉴定技术应用,建设辅助鉴定系统,打造“人工智能+”档案开放审核新模式。
区档案馆按照北京市关于档案鉴定工作相关标准,结合数字档案馆建设情况和馆藏实际,建立具有馆藏特色的鉴定词库,在此基础上建立“人工智能+”档案开放审核成果模型。将模型融合于档案馆系统应用,实现对馆藏目录数据和原文的敏感词快速匹配,提高开放审核的效率。以词库学习为基础,结合对已完成的鉴定数据的学习,建立开放控制推断算法模型。利用该模型,实现鉴定档案的分类,并得出开放鉴定结论和开放控制建议,达到初步鉴定目的。同时,融入语义审核的深度学习,不断提升开放鉴定控制决策的精确度。在系统测试阶段,制定以优化鉴定功能为目标的可操作性方案。持续进行词库扩充,提升鉴定敏感词的匹配效率。实时保存鉴定结果数据,作为输入数据定期更新鉴定算法模型。
在应用方面,将“智能鉴定”功能与人工审核相结合,对关键字段的类型和内容的完整性和合法性进行验证,记录人工初审、复审和终审的流程数据,实现全流程管理。不同角色的用户进入系统后,可对鉴定数据进行不同权限的审核。每一环节都进行系统跟踪,记录用户的每个操作步骤,形成任务流转图,供后续数据追踪。“智能鉴定”功能通过对鉴定规则的学习,对鉴定数据进行初判,给出控制意见和初步决断。人工审核在智能鉴定结果的基础上进行二次审核,实现线上线下两级联动,提高了鉴定效率和准确度。二次审核后形成的开放鉴定审核过程数据将被保存至系统后台,为鉴定统计等提供数据基础。
为确保安全,以“智能鉴定”为突破口,通过智能OCR技术对档案全文进行识别提取,利用涉密筛查功能,对人工分类后的非涉密档案进行二次智能鉴定筛查。系统对馆藏密章、手写字样、油印字样等进行标注,供智能筛密模型学习,生成标密模型。将模型应用于档案原文的二次智能涉密鉴定中,以提高数据资源质量。OCR技术和“智能鉴定”功能的应用,完成了开放鉴定升级,充实了开放档案数据的规模。同时,为资源开发利用提供了技术支撑和数据基础,实现了“智能鉴定”助推档案数据利用的升级迭代。
随着“人工智能+”档案开放鉴定模式不断完善,词库和算法均得到有效丰富优化。昌平区档案馆将持续提升开放鉴定的工作效能,努力把习近平总书记关于档案工作“四个好”“两个服务”总要求转化为推动昌平档案事业高质量发展的生动实践。
原载于《中国档案报》2024年6月6日 总第4145期 第二版