基于卷积神经网络的图片深度学习和人工智能技术在照片档案管理领域应用研究

发布时间:2024-01-13 08:53:43被阅览数:242 次信息来源:《中国档案》

  文/余英杰

  照片档案管理技术随着数码和计算机技术的兴起得到逐步发展,在产生、传输、存储和使用过程中都依托着计算机、网络等技术和设备。随着多媒体信息数量的剧增,传统的文字搜索获取照片档案的方式已经无法满足用户快速获取图片的需要,在具体的实践中将图片深度学习与人工智能技术相结合应用到照片档案管理非常重要,能够大幅提升工作效率,极大满足用户的信息获取需求。

  基于卷积神经网络的图片深度学习和人工智能技术的实现原理

  1.图片深度学习技术

  图片深度学习技术通过对照片档案的信息和图片特征进行提取,形式为特征向量,然后获得图片数据集的模型,将其存放在海量数据库中,将待检索图片的特征向量和数据库中图片的特征向量进行比对,在图片库中和待检索图片具有最近向量距离的图片即为搜索结果,实现的技术路径如图1所示,通过对待检索图片批量预处理进行特征提取,然后在算法中进行相似度的计算,查找原图片库的索引,获取检索结果,通过不断调整和优化,使得该模型日臻完善。

1.jpg图1 图片深度学习的技术路径

  目前常用的图片深度学习算法是卷积神经网络(CNN),该算法的思想是将输入的图片信息进行平移不变分类,结合动态规划可以避免大量重复计算,由于该算法在视觉识别和自然语言处理方面应用广泛,所以在档案馆的照片类馆藏的识别和检索机制中应用效果比较理想。

  现阶段图片检索技术主要有关键词检索和分类检索两种方式,搜索方法包括:

  (1)以图片自带的外部信息作为检索原则

  图片在保存及收录时带有外部信息,即文件名、保存路径等内容,通过比对图片的外部信息来确认检索结果,该方式的有效性取决于保存图片时的外部信息正确与否。

  (2)以图片的包含信息描述作为检索原则

  该方法实现的前提是通过大量的人工对照片内含的物体、颜色、主要标识物等进行语言描述标注为关键词,通过检索词和关键词比对达到检索的效果。这种搜索方法可以得到很好的查准率,结果比较准确,但是由于需要人工参与而且工作量大,可以处理的图片数量有限,这类搜索效果取决于描述词的准确程度。

  (3)以图片的重点特征描述作为检索原则

  使用专门开发的软件分析收录的图片,建立图片的特征索引库,当用户检索图片时给出图片的主要特征描述关键词,此时点击搜索后搜索引擎可给出最符合关键词描述特征的图片,该方式通常是对具有确定特征的图片描述库进行定向图片检索。

  2.人工智能技术

  人工智能技术是将人工处理过的大量数据存入计算机,就像是在练习题后面附上参考答案一样。目前使用的深度学习技术可以对大量的图片进行训练,计算机通过设定的规则进行一段时间的训练后,可以“记住”图片的特征信息,通过检索时的关键信息比对,实现对图片的检索。计算机在学会标记方法后能够自动标记未标识的数据而并不需要人工参与,因此能够在较短时间内完成数据、文件的处理工作,从而使劳动力得到解放、劳动效率得到大幅提高。人工智能技术通常使用的技术策略如图2所示。

2.jpg

图2 人工智能技术策略图

  可行性分析

  目前,在电商网站上大量使用图片深度学习来提高用户的检索效率,这为档案管理人员提供了一种解决图片检索的思路,通过借鉴人工智能在电商图片检索中的应用和实践,对图片档案资源的检索进行算法的改进和修正,无疑可以大幅度提高检索的效率和精度。

  图片深度学习的底层逻辑是图片信息的比对和检索,在检索图片资源或进行图片深度学习时,图片所带信息作为“检索词”,此时搜索引擎的算法是按照“检索词”的相关性进行排列,提供从高到低的检索结果。这种检索方式不仅可以大大减轻档案馆工作人员的工作任务,同时通过图片深度学习和人工智能技术在照片档案管理中的应用可以发现相关照片档案间的关联及网络组织,可以更好地对重复的信息资源进行使用。图片深度学习在档案管理中的可行性主要表现在以下几个方面:

  第一,图片深度学习大幅度提高了档案管理中的检索、保存和系统维护效率。结合人工智能技术在信息化时代飞速发展的现实,档案管理也将跟着时代的步伐,在丰富和扩大馆藏量的基础上,使得照片档案管理和服务的方式方法有新的创新发展。

  第二,信息化大潮下,馆藏资源迅猛增长。如何从海量的图片数据中迅速准确地搜索到所需的图片信息以及如何科学高效对照片档案进行管理是档案馆亟须解决的课题。引入图片深度学习和人工智能技术进行图片快速录入与鉴定工作,是解决当前档案工作者管理难题的有效方法。

  第三,照片类馆藏资源不同于文字资源,自身具备的显著性对检索方式提出了新的要求。人们在图片搜索时希望能够在大量图片数据中快速准确找到所需图片,而不是搜索出大量不相关的图片或者搜索中对重要图片出现遗漏。图片深度学习和人工智能技术可以满足照片档案管理以及社会对其服务能力提高的要求,可以降低档案工作者的劳动强度,从而对档案服务水平也提出了更高水平的智能化、个性化和系统化的要求。

  研发规则

  图片深度学习技术的应用和人工智能的落地,均是通过检索系统的升级来体现的,在对检索系统进行研发的过程中,势必需要通过调研、确定、研发、修正等环节完善该检索系统,从而将人工智能技术与照片档案管理工作进行深入结合,使照片档案管理的服务水平和工作质量得到大幅提高。

  1.图片深度学习技术和人工智能的基础:以图片资源数据安全为本

  由于图片检索系统的设计原则之一就是保证信息安全和数据安全,在此基础上进行深度学习算法的应用时,也将会根据图片提取特征值计算的规模进行效率和系统安全的平衡,另外,在选择的模型进行训练时也将对效果和效率进行评估后再进行大规模的模型数据训练,从而在系统对图片资源的信息读取、预处理规模的选择上获得比较有利的设置,从而在保证检索效果的前提下获得最佳的检索效率。

  2.图片深度学习技术和人工智能的发展:以人工智能为技术基础

  图片深度学习技术根植于人工智能技术的应用,以及图片检索机制的更新。这一切的基础均是人工智能技术的迅速发展,随着该技术在不同行业的落地和应用实践,开发系统的人员可以从不同的媒介获得技术支持,特别是对于能够促进和提升照片档案管理质量、更好地发挥照片档案的决策支持作用的理论应深入学习、完全领悟,并能够真正应用到实践中,使新时代照片档案管理的水平和质量得到提高,更好地满足新时代经济社会高速、高质量发展的要求和目标,为辅助决策提供有效的文献参考和数据支撑。

  3.图片深度学习技术和人工智能的落地:检索原理设计与工作实际环节相结合

  使图片深度学习技术在检索系统进一步落地,需要将图片识别和检索机制相融合,通过在逻辑判断环节应用不同精度等级的检索,并适时按照正相关系数反馈并排列比对结果,将上述工作原理在照片档案的保管及分类工作中落地,通过将该工作机制规范化为图片智能检索智能机器人,来将图片比对工作进行自动化,在照片档案的检索工作中使用图像识别、图片深度学习进行处理,提升照片档案查找和图片档案搜索的效率,都将更好地发挥照片档案的参考价值。

  4.图片深度学习技术和人工智能的渗透:检索系统的专业性、高效性和系统性相统一

  图片深度学习技术在检索机制上的渗透以专业检索和高效检索为第一考量因素,图片深度学习的快捷性和检索机制要求的高响应速度相一致,既符合图片检索的要求,也是该技术发展并追求的目标。所以在照片类馆藏资源的检索机制设计时,必须将检索系统的特点与图片深度学习和人工智能技术的特点进行充分的比较研究,形成具有照片档案管理特点的检索系统,使该检索系统可以提供高效、快捷、精准的检索结果,并对档案编研工作提供资源支持,在检索系统的帮助下,可以杜绝大量的机械劳动,提高检索效率。

  5.图片深度学习技术和人工智能的未来:信息化、智能化、高效化和专业化的努力方向

  图片深度学习技术的未来发展方向将是在既定的检索机制下,提供快捷精准的检索服务,同时收录更多的图片资源,并且该类资源是经过整理后以统一编码的方式被档案资源管理系统收录,通过图片深度学习和人工智能技术的图像识别以及档案资源管理系统的深入融合,形成智能化的照片档案管理系统,在照片类档案资源的检索发展上迈出一大步,该技术的不断发展也将更好地满足照片档案管理工作的实际需要,使照片档案管理工作在快车道上继续驰骋。

  应用难点

  目前,图片深度学习和人工智能技术在照片档案管理应用中存在着以下几方面的难点。

  1.人工智能难以辨别图片的真实性

  数码影像资料的复制件的法律地位一直有争议,在档案界中,由于数码影像档案容易被复制的性质造成了数码影像档案真伪鉴定难度较大。《数码照片归档与管理规范》是目前照片类馆藏资源的收录和管理标准,它虽然对照片的存储信息有着统一的编码规范,但无法规避图片再编辑的行为。图像处理软件具有的各种强大的图像处理功能能够轻松地对照片进行各种后期处理,这就使得鉴定照片的真实性变得更加困难。另外,照片档案是否真实还受到其拍摄时的元数据真实、准确与否的影响。图像处理软件和图片元数据等因素都会使数码照片伪装性增强,给照片档案的真实性鉴定工作带来困难。

  2.信息收录源不完整、不标准

  运用图片深度学习和人工智能技术进行照片档案搜索的前提是馆藏照片档案库信息量足够丰富,可以支撑相当数据量的检索和比对。需要提前将馆藏电子照片档案形成图片集,提取各图片特征以生成特征库,而且要求馆藏图片数据库各图片的元数据要完备、标引要清晰。在实际的照片档案管理中,往往会因为各种不同原因使得数据信息存储不充分,原始图片和被修改图片均被存储和收录,无法通过机器的对比分辨谁真谁假,对检索机制和检索人员的工作量提出了较高程度的考验,而在该机制运行的过程中,由于对比参照物不够清晰,使得比对效果较差,无法到达预期目标。

  3.人工智能技术和资源储备不够发达

  目前,图片类的搜索技术,包括图片深度学习,尚处于人工智能技术应用的前期,还需要数年的经验积累和资源沉淀,加之缺乏相关标准规范,使得收录源对图片信息的标注仍处于“自成一格”状态。在传统的单机对比中仅需要根据经验比对知识,手动对照对比物和参照物的特征信息,但是这种检索方式耗时耗力,无法提升检索效率,另外由于数据库的数据量大,搜索的时间很长,使得服务器的负担增加,对于搜索的效率和准确率会带来很大影响。

  4.图片搜索效果差强人意

  在进行图片搜索时,不管是通过文本输入还是图片深度学习,其内部逻辑仍然是图片信息的迅速比对。通过比对输入图片的档号、题名、关键词等字段进行组合搜索来查找目标图片。然而,照片档案具有的非结构化数据的特点使得图片档案无法像文本数据那样使用数据库操作数据进行管理,因此,使用关键词进行搜索的方法进行照片档案搜索效果不佳。另外,对于照片档案信息进行语义识别和划分往往是主观的,不能使用词法分析等较成熟的方法进行准确识别和划分。

  解决方案

  1.通过前严后松的搜索机制和全流程管控的检索理念,提升检索效果

  目前在照片类馆藏资源的管理中,档案馆要借鉴电子文件管理中从前端进行控制和全程进行管理的理念,对照片档案强化质量的控制与从源头入手进行干预,使照片从拍摄、收集整理、归档到搜索使用建立起全过程的保障体系。从照片形成的部门和人员做起,强化部门归档,即照片形成者就是归档者,对其进行归档、编目等照片档案管理工作的指导,使其提高原始照片的归档意识,以此来保证照片档案的原始性和真实性。

  2.制定完善照片档案标准及评价指标体系

  照片档案不似文书档案易于检索,比对效果好,也不似声音资源可以通过声音进行高效识别,在其应用场景中又可以进行多种解读,所以照片检索亟须制定完善的照片说明标准、使得照片具有相对一致的检索标准,不仅可以提高检索效率,还可以提高收录效率。工作人员在进行收录的标注时,可以参考标准进行录入。这样在照片收录时的完整性和规范性能够获得一定的保障。另外对于收录工作进行指标评价体系的制定,不仅约束收录工作,而且还为收录工作指明了方向,这样对于照片收录的规范性上有了质的升级,可以说是对检索系统的高效运行奠定了深厚的信息源基础。

  3.开发具有自我特色的照片档案资源管理模式

  照片馆藏资源数据库的建立和持续丰富是图片深度学习的基础,将照片的真伪对比、时间戳对比以及照片内外部信息的对比纳入指标体系中,通过建立属于本档案馆的图标对比机制,从而获得更高准确率和更全搜索率的检索机制,不仅可以对给定的目标照片进行真实性分析,还可以基于深度学习特征的图片检索方法建立照片的真实性鉴定系统。研究视觉特征的中层表示来对高层语义与底层特征之间进行连接,通过对局部特征的位置信息进行引入来体现局部的结构或是用机器学习方式从数据中得到语义一致且具有一定结构信息的视觉模式。

  4.人工智能将会使检索系统更安全

  人工智能和深度学习在更“肥沃”的数据环境中将会获得更多“养分”,随着归档的图片库资源越来越丰富,模型训练也更加具有“人工智能”思想,图片检索也会随着检索得更加精确,而为检索人提供更舒适更便捷的检索体验,形成图片数据、数据训练、模型优化、检索机制更高效的良性循环,也就为系统运行的稳定性、可靠性、健壮性提供了科学的技术条件。

  参考文献:

  [1]顾伟.论声像档案检索方法[J].档案与建设,2017(11).

  [2]张恒博.基于内容的图像数据库检索的技术研究[D].大连理工大学,2008.

  [3]张磊.大规模互联网图像检索与模式挖掘[J].中国科学,2013(12).

  [4]陈慧,王晓晓,南梦洁,安小米.数字档案资源整合与服务过程中的隐性知识分类—以赋能思维为视角[J].图书与情报,2019(6).

  [5]陈会明,史爱丽,王宁,金文光.人工智能技术在档案工作中的应用与发展刍议[J].中国档案,2020(3).

  [6]朱云辉.人工智能技术在数字档案信息资源分类与检索中的应用[J].资源信息与工程,2018(12).

  [7]马绪超.人工智能及其在档案检索中的应用[J].黑龙江档案,1996(6).

  作者单位:广东省佛山市档案中心

  责任编辑:周拯民