基于大数据和人工智能的水电工程建设项目照片档案管理与利用分析研究

发布时间:2024-04-06 19:35:31被阅览数:216 次信息来源:《四川档案》

  □汪卫兵   陈宜坪   刘云峰

  0   引言

  2021年1月1日新修订的《档案法》正式施行,特别新增了“档案信息化建设”一章,加强档案信息化建设,保障电子档案、传统载体档案数字化成果等档案数字资源的安全保存与有效利用。国家鼓励档案馆开发利用馆藏档案,通过开展专题展览、公益讲座、媒体宣传等活动,进行爱国主义、集体主义、中国特色社会主义教育,传承发展中华优秀传统文化,继承革命文化,发展社会主义先进文化,增强文化自信,弘扬社会主义核心价值观。新修订的《档案法》对馆藏档案资源的开发利用提出了明确要求。

  2021年6月9日,《“十四五”全国档案事业发展规划》正式印发,明确指出:加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,推动数字档案馆(室)建设优化升级。要完善建设项目档案标准规范、创新建设项目档案监督指导方式、完善重大建设项目档案利用服务机制。“十四五”规划对重大建设项目档案工作和新技术的运用明确了要求。

  1   水电工程建设项目照片档案管理现状

  工程建设项目照片档案是对建设过程的具象化呈现,是珍贵的记忆资源,在回溯建设历程、印证工程质量、提升社会影响等方面有巨大价值。水电工程建设项目照片档案具有时序长、来源广、数量多、内容杂等特点,为保证归档的及时性和完整性,避免过程中因人员调动造成部分照片丢失等情况发生,目前主要按“年”进行收集整编,但这种方法无法保证工程照片的连续性和系统性,工程照片没有按照全生命周期进行系统管理,不能较好的展现出每个工程部位的施工过程,同时受限于装订厚度和相纸打印成本,整编时只能精挑细选,由此造成海量的照片资源依然存在于各参建单位相关人员手中,对于这些未归档的照片,存在永久消失的可能。另外根据水电工程建设项目档案借阅利用统计结果,照片档案利用率不高,除各类专项检查调卷外,几乎没有其他利用记录。主要原因是归档的照片档案单一独立,按“年”收集整编,以纸质图文编研成果进行展示,未与工程实体形成关联,相比于多媒体等宣传,效果较差一些。

  以分类整理为手段的传统管理方法,难以对照片的内容进行价值挖掘,照片的时空联系被严重隔断,使得利用模式单一、服务效果不理想,在回溯建设历程、印证工程质量、扩大对外宣传时存在诸多问题。国内外学者对水电工程建设项目照片档案管理及人工智能技术赋能已经有了一定的研究成果,且侧重方向各有不同。国内较为重视水电工程建设项目照片档案管理,结合具体项目也展开了一定程度的实践,提出了一些区别于传统照片实体的管理模式,在人工智能技术与档案的结合方面展开了一定畅想;国外学者的研究偏向于技术与社群记忆、人文关怀等结合。

  2   大数据及人工智能技术在照片档案中的研究与应用

  随着数字载体的成熟,大数据和人工智能技术不断发展,照片档案的研究重点逐渐从纸质载体的保存修复,转移到数字照片档案管理及利用。祝成教授对人工智能技术在照片档案数据化工作中的应用进行了分析,将照片档案中可被人工智能技术识别的实体分为人脸、环境、文字三大类;赵学敏教授提出基于深度学习的以图搜图照片档案管理系统架构,运用Keras深度学习框架和VGG16网络模型成功实现照片档案以图搜图实验。余英杰教授基于卷积神经网络人工智能技术在照片档案管理应用研究,对照片档案的信息和图片特征进行提取,获得图片数据集的模型,通过检索时的关键信息对比,实现对图片的检索。牛力教授提出以“发现”“重构”和“故事化”三原语为主线的档案研究路径基本模式,通过对照片档案进行元数据标注体系设计、照片档案语义挖掘、照片档案分层上下文识别,对照片档案数据进行“重构”,实现照片档案的故事化。

  国网江苏省电力有限公司苏州供电公司主动探索照片档案电子文件全生命周期管理,创建“照片档案全数字管理”理念,自主开发了数码照片档案册自动封装软件,对档案系统现有图像数据与文件信息进行定向重组;安徽大学采用“人工智能+数字人文”的研究方法,构建了利用导向的历史照片档案全生命周期管理体系,实现了基于记忆点的历史照片档案智能解析、基于人工智能的历史照片档案智能聚合、基于数字人文的历史照片档案叙事可视化;广州地铁集团有限公司档案部门聚焦AI人脸识别,提出了打造面向部门与公司的“2C”集中照片平台构想,以开放式照片征集、照片版权保护、照片社交、关联知识管理平台与智能推送、大事记与主题图库、拍摄业务化等方式提供新型共享服务。

  3   水电工程建设项目照片档案智慧管理与创新利用工作思路

  面对水电工程建设项目照片档案存在的难点,应对传统管理方法进行转型升级,结合大数据、人工智能技术进行照片智慧管理和利用,实现对照片资源提交著录、存入资源库中长久保存管理,并对所存储照片进行内容挖掘、查询、调用、编辑、发布的一体化管理。采取“照片档案资源库+照片档案编研库”,通过两库协同作业达到“1+1>2”的管理效果。“照片档案资源库”引入云计算思维及大数据分析技术,满足照片资源大量级存储,在此基础上实现“相似照片识别→元数据著录→内容识别”的核心工作,主要完成照片档案收集提交、著录、存储、管理等工作。“照片档案编研库”引入“数字编研”的理论及人脸识别、图片检索等技术,从多维度进行专项内容采编,构建起人物、时间、地点、事件、工程项目等对象的故事化叙事网络,完成照片档案全生命周期管理“用”的一环,最终实现两库协同处理照片档案资源保存管理、发掘照片内涵、重塑照片时空联系,提升水电工程建设项目照片档案服务利用价值。

  3.1   照片档案资源库

  改变传统的照片档案分级审核管理步骤,在提交审核阶段,优化照片档案资源全生命周期信息化管理流程,通过一定的系统操作实现无感化数据流转,达到分层管理、分级审核目的。为便于统一管理并实现照片资源的“应收尽收”和“分层管理”,应采取分层体系设计,对照片资源进行有效评级。照片评级分层管理是对照片是否留存、是否归档等用途的区分,判断不同照片的处理方式,将照片资源分为留存级、统管级和档案级,留存级与统管级互斥,统管级与档案级是包含关系。

  在著录阶段,对已经入库或者即将入库的照片资源,通过标签的方式进行内容标注。标注分为两种,一是借助人工智能算法完成自动标注,二是通过人工对照片内容的理解进行人工标注。引用人脸识别进行自动标注,实现对提交图片中的人物进行人脸识别,如果资源库中已有该人物的数据,则直接识别人物信息;如果没有,可以新建该人物的信息,便于以后识别其他照片时能够直接识别出来。引用大数据技术对海量照片中相似照片进行分析和识别,用于同类照片的自动聚合,实现半自动化的资源分类与标注。

  为实现语义层面的照片内容管理,应构建分类维度,包括照片内容所反映的人物、时间、工程项目名称和内容主题分类等。该分类维度为后续开展照片资源的开发利用、元数据标注拓展起到关键作用,所有分类维度均落实到元数据方案当中,实现利用检索点扩充的效果。结合照片档案的分类分层标准,同时兼顾编研与开发利用的需求,应制定适配水电工程建设项目照片档案元数据标准,为后续照片关联构建与利用编研打下基础。

  3.2   照片档案编研库

  档案数据的“故事化”属知识服务范畴,将经过多维组织的档案数据梳理成册并映射至多元可视化空间,以主题故事的形式对档案数据中蕴含的记忆进行叙事化表征。讲好档案故事需融入档案声音,并引入数字档案资源的可视化叙事服务理念,从制度、资源、平台等多方面规划实现策略。同时,借助科技手段促使档案故事多维开发,用自媒体平台助力档案故事跨网跨界传播。

  讲好水电工程建设项目照片档案“故事”,首先要了解受众的情感共鸣,以利用导向为核心,从企业文化、行业性质与工程建设特点出发,将其中蕴含的故事与工程纪实、领导检查等语境有机联系起来。重点把握“讲什么”“怎么讲”两方面。一是故事“讲什么”,即工程照片档案故事选题的把关,在故事选题方面注重选取典型事件、重点主题,紧扣重要时间点与用户需求点。二是故事“怎么讲”,需考虑其叙事形式和呈现效果,在保证照片档案故事真实的条件下,通过生动、详细的叙事可视化形式表达,增强情景沉浸感。

  在照片档案关联聚合的基础上,编研线索主要来源于时间、空间及拓展内容元数据项之间的关系。基于构建的时空与主题线索,水电工程建设项目可从时空、内容、场景等不同维度设计叙事可视框架,以加强照片档案叙事表达的能力与可视化效果。时空维度可通过结合工程图纸和三维模型,对于某一标注点的工程部位施工过程集中展示;内容维度可通过图文集合,以工程纪实、工程节点、大事记、党建工团、员工生活等内容为分类,以故事图集、照片墙等方式进行展示;场景维度可通过今昔对比等形式,以原始地貌和工程形象进行集合。

  4   总结与展望

  目前,关于水电工程建设项目照片档案智慧管理与创新利用的研究相关案例较少,对于大量级照片数据的存储、计算、检索是照片智慧管理中的关键点;区别于传统的照片档案利用模式,照片档案编研如何满足水电工程建设项目的实际需要,实现照片档案的“故事化”成果展示,需要做好全面调研后,根据项目特点进行专门设计。

  推动水电工程建设项目照片档案智慧管理和创新利用,充分发挥工程照片档案价值,实现照片档案全生命周期管理,是响应国家关于档案信息化建设的要求,因此,利用大数据和人工智能对照片档案进行智慧管理和价值挖掘具有较好的前景。

  参考文献

  [1]祝成.人工智能技术在档案数据化工作中的应用分析[J].中国档案,2021(04):64-65.

  [2]余英杰.基于卷积神经网络人工智能技术在照片档案管理应用研究[J].中国档案,2023(01):31-33.

  [3]廖玉玲.基于云计算的建设工程档案全过程监管模式可行性研究[J].档案学通讯,2013(06):74-78.

  [4]钟汝嘉.论大型水电工程声像档案管理[J].兰台内外,2020(11):2.DOI:CNKI:SUN:LTLW.0.2020-11-017.

  [5]王生河.浅析数码照片在水电工程建设管理中的应用[J].建筑安全,2013(11):2.DOI:10.3969/j.issn.1004-552X.2013.11.026.

  [6]牛力,高晨翔,张宇锋,闫石,徐拥军.发现、重构与故事化:数字人文视角下档案研究的路径与方法[J].中国图书馆学报,2021,47(01):88-107.

  [7]胡千乔.工程类数码照片档案的收集、管理与利用[J].机电兵船档案,2014.DOI:CNKI:SUN:JDBC.0.2014-06-025.

  [8]葛如一,刘思雨,吴熠,张琪,汪宇.照片档案管理数字化转型升级探索与实践[J].档案与建设,2021(05):53-55+62.

  [9]陈会明,史爱丽,王宁,金文光.人工智能技术在档案工作中的应用与发展刍议[J].中国档案,2020(03):72-74.

  [10]陈慧,罗慧玉,张凯,陈晖.AI赋能档案:AI技术在档案管理中的赋能模式探究[J].山西档案,2020(04):76-83+131.

  本文系国家档案局科技项目“基于大型水电工程建设项目照片档案智慧管理与利用创新研究”(项目编号:2022-X-028)研究成果之一。

  作者单位:雅砻江流域水电开发有限公司