发布时间:2024-10-15 19:27:31被阅览数:150 次信息来源:中国档案网 作者:北京市昌平区档案馆 魏颖
北京市昌平区数字档案馆项目自立项建设以来,始终锚定“高水平数字档案馆”目标,守正创新、攻坚克难,目前已完成项目初验,整体进入试运行阶段。项目超前引进大语言模型、智能OCR识别等新质技术,聚力开发自动着录、跨模态检索、智慧编研等行业首创功能,并在全区范围落地推广,打造昌平档案数字转型“硬核”成果,为昌平区全面加快“四区”建设贡献更多档案智慧和力量。
一是实现降本增效,开发档案整理自动着录。为提高全区各单位归档效率,践行档案部门为基层减负,区档案馆在档案管理系统(“昌平区数字档案一体化平台”)中嵌入档案自动着录功能模块,实现着录信息智能判断、智能纠错、着录项智能填报。各单位档案工作人员可通过系统上传档案数字化副本,系统自动进行文字识别后通过Al算法模型进行分析,自动提取生成题名、年度、责任者、文件日期、文号等关键信息,并在系统中自动生成档案目录。
二是集约资源建设,构建全域档案全文数据库。为更好地推动全区档案工作数字化转型,区档案馆在“昌平区数字档案一体化平台”中嵌入智能OCR文档引擎模块,实现各立档单位档案全文检索,极大提高室藏档案的检索精度和利用效率。同时,将各室藏档案全文数据仓、馆藏档案数据仓“汇聚”,构建全区档案全文数据库,为昌平档案数据资源的深度开发利用、共享提供坚实的数据底座。
三是坚持创新制胜,实现馆藏数据跨模态检索。区档案馆在部署于局域网内的“馆藏档案资源一体化平台”上搭建基于智能OCR、大数据、语音识别等技术的跨模态检索模块,开发馆藏档案的全文检索、以图搜图、以文搜图、音频检索、视频检索等跨模态检索利用功能,破除传统检索功能局限,打通文档、照片、音视频数据界限,实现馆藏文档、音视频、照片全文的多维度、全方位一键搜索,进一步提升了档案利用质效,真正做到了馆藏档案管理的智慧化和检索的智能化。
四是紧扣智能服务,实现智慧辅助档案编研。为加强馆藏档案的深入编研,促进生成更多内容丰富、形式多样的编研成果,区档案馆在“馆藏档案资源一体化平台”建设中,应用“知识库+大语言模型”,开发了智慧辅助编研系统。系统能够自动完成事件抽取和文本摘要,形成事件抽取库和文本摘要库,并根据编研需求自动从库中抽取信息,生成编研成果,实现算力换人力,提高编研工作效能,推动编研工作的智能化转型。
五是拓优资源整合,集约开展网页档案在线采集。为更好地服务全区各网站主办单位网站网页归档工作需求,区档案馆研究开发了“昌平区网站网页电子文件采集系统”,为全区各单位网页归档工作提供免费的、统一规范的网页电子文件采集渠道,各单位在开展网页档案归档工作时,都可集约使用该系统,无需再投入成本自行开发网页采集系统。同时,该系统实现了与“区数字档案一体化平台”对接,系统将自动采集到的网页电子文件定时推送到一体化平台中,实现网页电子文件的在线归档。