浅谈人工智能画质增强与处理技术在档案数字化副本图像修复中的应用

发布时间:2024-06-27 20:28:30被阅览数:221 次信息来源:《四川档案》

  □   刘洪君1   张培2

  过去,各级档案馆(室)在档案数字化过程中,因实体档案存在褪色变形、阴影污渍、破损划痕等情况,以及数字化扫描技术不高和人为操作失误等因素,很多馆藏图片均存在画质不强的问题,直接影响档案的利用和档案数智化建设。重庆市档案馆、重庆市大渡口区档案馆、重钢集团档案馆联合福建帝视科技集团,组建项目团队,针对馆藏存量数字化图像开展数据实验、攻关,探索以人工智能手段增强图片质量,修复图片颜色彩等内容。

  1   存量数字化副本图像质量问题

  随着档案数字化转型的深入推进,馆藏照片、文书、声像、实物等档案均已在馆藏中以数字化副本形式出现,解决数字化副本的一系列问题,是档案“四个体系”建设的基础性工作。

  为了解馆藏数字化副本中存在的问题,我们以大渡口区档案馆2010年以前数字化的15000余卷120余万页文书、照片档案数字化图像为抽检对象,按照等距方式抽检了共81卷6743页数字化副本,主要存在以下几个问题:一是清晰度不够及色彩差异较大。被抽检的6743页数字化副本均为灰度扫描,分辨率达不到200dpi。原始色彩丢失严重,大部分图片较模糊,文字辨认困难,打印后加大了文字辨认难度。二是破损划痕、图像形变及局部失真的问题。抽检样本中,共498页存在扭曲变形、图像变色、文字失真,影响正常阅读,无法满足档案OCR识别。三是倒图、倾斜度过大的问题。档案在数字化处理后,图像副本要根据阅读习惯,采取转正、纠偏等措施进行后期处理。抽检样本中,27页存在倒图问题,159页存在图像倾斜问题。

  2   AI图像修复技术的引入应用

  由于过去数字化加工过程的主客观原因,导致数字化副本出现各种缺陷问题,导致画质不高,从而严重影响档案的利用,更是档案数字化转型的阻碍。传统解决方案一般采用物理修复后再重新进行数字化扫描,但存在成本高、效率低、限制多的特点,相较于馆藏数字化副本图像的体量和珍贵程度,可操作性不大。

  近年来,人工智能在图像修复方面大规模应用,AI图像修复技术已经取得了显著的进展,在多个领域展示了卓越的成果。例如在图像增强领域,利用基于深度卷积神经网络的超分辨率技术(超分辨率增强),将低分辨率图片重建成高分辨率图片,补充出损失的纹理细节。在图片去划痕上,利用AI图像缺陷检测和AI图像补全技术,对含有划痕、折痕、破损、缺角、污渍等缺陷的图像进行自动修复,可以有效地减少或消除图像上的缺陷痕迹。将AI技术引入到档案数字化副本图像修复中具有直接借鉴性和可行性。为此,项目团队制定方案,进行了实验测试并取得初步成果。

  3   借助AI技术批量智能修复档案图像的实验测试及效果

  本次档案图像AI修复主要有以下几个步骤:

  3.1   数据导入和训练数据制作

  对馆藏档案数据进行分析,针对原始档案图像中存在的问题,制定相应的修复方案。以高质量的档案图像为样本,分别制作了训练数据集。基于训练数据集,利用深度学习技术进行训练,构建了图像去噪、去划痕、去阴影杂质、超分辨率、细节增强、人脸增强、黑白上色等AI模型。

  首先,对档案图像进行分类、清洗和标注。通过分析,档案图像中存在噪点、划痕、阴影杂质、模糊、细节缺失、人脸模糊和无色问题,根据图像对应的问题进行分门别类,将同时有多种问题的作为测试数据集。

  其次,研究每一类问题的数据特征,设计相应的AI处理算法,分别针对制作对应算法的训练数据,将训练数据分为训练集、验证集。在缺陷修复算法中,通过两种方法制作训练数据,一是通过人工修图的方式得到无噪声、无划痕和无阴影杂质的图像对,得到有缺陷和无噪缺陷图像对。二是通过数据退化方法模拟缺陷,在无缺陷上的图像上添加缺陷,以此得到有缺陷和无噪缺陷图像对。在清晰度增强算法中,仅使用数据退化方法模拟模糊,得到对应模糊图像和清晰图像的数据对。在智能联想算法中,通过对有颜色的图像进行去色操作得到无色和有色的图像对。

  最后,基于制作的训练数据集对AI算法进行针对性的训练优化,通过验证集上的测试效果再对训练数据的标注进行优化、对AI算法的模型结构和训练参数进行调整,最终得到训练好的AI模型。

  3.2   批量化处理应用

  3.2.1   档案画质缺陷修复

  针对档案场景,训练的AI去噪点、去划痕、去阴影模型,能够更好的识别档案场景中的噪点、划痕、阴影。AI模型会分析图像中的像素信息,检测画质缺陷的位置和特征,并根据学习到的模式和规律,尝试恢复出原始的清晰图像。通过这种方式,AI画质缺陷修复可以在不损失原本图像信息的情况下提高照片的质量,去除干扰,使图像更加清晰、自然。

1.JPG

图像去阴影前后对比图

  3.2.2   档案画质清晰度增强

  利用AI超分辨率技术,该AI模型会分析图像中的像素信息,根据学习到的关系,预测出缺失部分的像素值,同时突出文字边缘和纹理的细节改善,从而达到提升图像分辨率,增强图像细节的效果。

  针对一些人物照片、画像等档案文件,AI照片人脸修复使用人脸图像进行训练,使训练好的AI模型具有丰富的人脸先验知识,是人脸专用的超分辨率模型。当图片中存在需要修复人脸图像时,AI模型会自动检测人脸位置,分析人脸特征,根据学习到的人脸先验,预测出缺失的细节和像素值,可以对模糊的脸部区域进行修复,补充五官、毛发和皮肤纹理等细节,可以显著提升人脸的清晰度。

  3.2.3   档案画质智能联想

  在经过以上处理之后,一般场景下的修复已经完成。项目团队考虑部分年代较为久远的灰度图片,如因展陈等需求,也可进行上色处理。为了尽可能的保证档案原始信息准确可靠,需要上色模型具有一定的可控性。针对这一情况,采用了AI多模态模型,多模态模型可以通过输入文本描述和参考图片等方式来控制最终的上色结果,能保证上色效果和历史史实保持一致。

  3.3   问题反馈与改进训练

  问题反馈与改进训练是档案数字化修复的关键环节。在修复过程中,建立了质量评估体系,对修复结果进行人工审核和反馈。通过建立有效的问题反馈机制和持续的模型改进训练,可以不断提高修复模型的性能和效果,更好地满足档案修复需求。

  项目团队定期收集修复过程中反馈的问题,并进行分析和处理。对问题进行分类,归纳常见问题类型。分析问题产生的原因,是模型缺陷还是数据问题。针对普遍存在的问题,扩充训练数据集,加入更多具有代表性的问题样本,提高模型的鲁棒性。针对特定问题,进行模型微调,调整模型参数或训练策略,提升模型针对性。

  参考文献

  [1]张新.图像处理中超分辨率与修复方法的研究[D].山东大学,2018.

  [2]罗海银,郑钰辉.图像修复方法研究综述[J].计算机科学与探索,2022,16(10).

  [3]强振平,何丽波,陈旭,徐丹.深度学习图像修复方法综述[J].中国图像图形学报,2019(3).

  [4]冯晓硕,沈樾,王冬琦.基于图像的数据增强方法发展现状综述[J].计算机科学与运用,2021(11).

  [5]张美玉,刘跃辉,侯向辉,秦绪佳.基于卷积网络的灰度图像自动上色方法[J].计算机工程与运用,2022(7).

  基金项目:本文系国家档案局科技项目“AI画质增强与处理技术在影像类档案修复的应用实践”(项目编号:2023-B-001)研究成果之一。

  作者单位:1.重庆市大渡口区档案馆;2.重庆市档案馆