发布时间:2024-09-26 19:30:30被阅览数:152 次信息来源:《中国档案》
文/周敬宜
随着社会数字化进程的不断推进,档案资源体系建设由以传统载体档案为主导向以档案数字资源为主导转变,各馆馆藏档案数字资源总量逐年稳步增加。海量档案数字资源如何长期、有效存储,确保电子档案的真实、完整、可用、安全,是档案部门的关键急需,更是数字时代的严峻挑战。数字胶片技术既具有数字信息存储载体的基本特点,又可以发挥胶片介质保存时间长达百年的显着优势,理论上可以有效解决这一难题。
档案部门一般使用缩微胶片存储原件缩微复制的图像信息,而数字胶片使用“记录二进制数据流信息的点状图像”存储原始数字信息,存储方式与硬磁盘、光盘、LTO磁带和固态硬盘更为接近。为进一步比较数字胶片与缩微胶片的数字信息存储情况,笔者利用数字胶片的数字信息存储原理,制作二阶、四阶灰度的胶片成像测试模板,使用显微成像系统和图像对比软件分析缩微胶片用于数字信息存储时的成像情况,评估得到缩微胶片的理论数据承载量。
胶片数据承载量测试模板设计
1.基本原理与设计概要
数字胶片的数据写入原理是将文本、图像、音视频等各类格式的文件经编码软件处理生成用灰度值表示二进制数据流信息的多幅点状图像,经高清投射输出至数字胶片;数据读取原理是将数字胶片中的图像扫描后,利用解码软件还原为原始文件。基于上述原理,课题组前期设计实验得到缩微胶片实际的单幅(48.5mm×28mm胶片区域内)承载量约0.06MB,与预期差距较大。为尽量剔除编解码软件等外因干扰,研究缩微胶片用于存储数字信息的最佳结果,本实验设计制作了胶片数据承载量测试模板。考虑到缩微胶片通常用于存储文件类黑白二值图像信息,而数字胶片常使用四阶灰度表示二进制数据流信息,所以分别设计制作了二阶、四阶灰度的胶片数据承载量测试模板。
胶片数据承载量测试模板不仅需要模拟数字信息的存储结果,还应方便观察成像情况,并测算出缩微胶片的单幅最大理论数据承载量。设计与制作主要分为三部分,首先确认模板灰度值,然后模拟数字信息内容,设计规律性强、便于观察区分的模板单元,最后根据数据容量情况,计算确认模板数量及尺寸。
2.确定模板灰度值
二阶灰度模板使用白(255)和黑(0)两色。四阶灰度模板不仅要包含黑白,还需明确中间两个灰度值。为得到具有较大区分度的灰度值,实验采用主观评价法进行筛选确认。首先,将胶片灰度标板打印、冲洗、扫描。依据主观评价法,成员各自选出能够明确区分四色的深灰、浅灰两个灰度值,再取平均结果,确认此次实验中较易区分的四阶灰度是白(255)、黑(0)、浅灰(210)和深灰(170)四色。
3.设计模板单元
为方便区分和观察单画幅区域内各像素点的图像质量,课题组将二阶灰度模板单元设计为“黑、白两色交替”的方式,如图1所示。
图1 二阶模板单元
四阶灰度模板单元如图2所示,设计原则有:(1)以“黑、深灰、浅灰、白四色交替排布”为核心目标,单元整体分布均匀;(2)确保各单元间易区分,单元四周设计明显的边框;(3)各子单元间规律排布,尽量减少由于“明暗对比”导致的视错觉现象,即将灰色图形放置于黑色背景,颜色会显得更灰暗,在白色背景上,颜色会显得更明亮;(4)防止相连形状过于密集,降低模板的有效分辨率,即避免同一颜色以2×2或更为密集的方式排列。
图2 四阶模板单元
4.计算模板尺寸
依据数字胶片的存储承载量,结合COM设备的最大分辨率是“11520×7200pix”,设计二阶、四阶灰度模板各28张,分辨率大小从“819×512pix”至“10991×6869pix”。
研究情况与结果分析
1.实验条件的控制
按要求规范操作,实验前开展曝光量测试。对承载实验结果的富士牌缩微胶片测量得到的最大密度为1.55,灰雾度为0.02,解像力为192lp/mm。测试结果符合GB/T17292、DA/T44要求。
实验的输出设备是赛数OP500型数字存档机,曝光时间246ms。冲洗设备为MicroformFP505,冲洗温度32°C,显影液、定影液是EPM Archive RTU Dev及EPM Archive RTU Fix No 1272/2008,冲洗速度为3m/min。
由于目前现有还原设备的分辨率较低,为减少干扰因素,尽可能观察到缩微胶片成像效果,使用基恩士KEYENCE数码显微成像系统进行初步观察,经测试筛选后选择了环形落射的照明方式,以进一步提高图像清晰度。最后,通过图像对比软件确认观察结果。
2.二阶灰度模板图像分析
(1)使用显微成像系统进行初步观察
实验发现“2591×1619pix”图像的黑白像素分布相对均匀、黑白交接处相对分明。而“2838×1774pix”图像的黑白像素分布不均,产生了周期性的条纹,即每间隔4×4或4×5的像素区域,纵横一列的黑白图形就会压缩变形、失真,如图3所示。
图3 周期性条纹图像
这一现象与图像混淆(Aliasing)现象一致,即离散量(像素)表示连续量(图形)而引起的失真现象。出现混淆现象的图像细节失真、部分图形遗失。在后续实验中,还发现了规则方格纹状的失真现象,即5×5或7×5像素区域形成了更大范围的黑白格,如图4所示。
图4 规则方格纹图像
另外,笔者所在课题组考虑产生这一现象可能还有其他因素。由于COM设备中拍摄光源是显示器光源,二阶模板黑白交替的图形实际形成了多个均匀间隔的点光源,光源叠加导致图像失真的因素。为验证上述推断,使用Matlab软件通过求解光源的二维傅里叶变换(公式1)使模拟信号转为数字信号,再模拟叠加特性,发现也出现了周期性条纹状的失真现象。此外,课题组还考虑了缩微胶片感光颗粒大小的原因,由于缩微胶片相比数字胶片,感光颗粒较大,解像力较小,也有可能导致这一现象的产生。
(2)使用图像对比软件进一步观察确认
为进一步观察实验结果,使用Beyond Compare 4.4软件的图像对比功能,观察图像的像素级差异,效果如图5所示。其中,蓝色区域为不重要差异像素,红色区域为重要差异像素,实验选取的容差值是133。
图5 2591×1619 pix图像(左)和2838×1774pix图像(右)的局部对比结果
通过对比“2591×1619pix”和“2838×1774pix”图像的还原细节,发现在相同的白色区域内(X:136,Y:47),前者的像素值(RGB:246,234,234)与白色(RGB:255,255,255)接近,周围大部分区域依旧保持白色,如图6所示。而后者像素值(RGB:73,68,74)与白色相差甚远,观察区域内已有大量杂色浸入。相同的黑色区域内(X:165,Y:46),前者像素值(RGB:26,24,25)与黑色(RGB:0,0,0)基本接近,周围区域呈均匀黑色分布,而后者像素值(RGB:55,51,50)与黑色稍有差距,周围区域特别是下半部分区域偏色明显,如图7所示。
图6 2591×1619 pix图像(左)和2838×1774pix图像(右)的白色区域比较
图7 2591×1619 pix图像(左)和2838×1774pix图像(右)的黑色区域比较
总的来说,“2591×1619pix”图像黑、白两色的区分度较为明显,“2838×1774pix”图像的部分白色区域已无明显白色像素,黑色区域偏色严重。
3.四阶灰度模板图像分析
相比二阶灰度模板图像,四阶灰度模板的图像质量整体较差。“819×512pix”图像的不同灰度值区域分布均匀、交接处相对较分明,而“1159×724pix”图像的不同灰度值区域已无法划分明显界限,深灰与黑色区域几乎无法分辨。
结语
研究通过设计胶片数据承载量测试模板,规避由编解码软件产生的潜在影响,使用显微成像系统和图像对比软件,剔除还原设备分辨率低的外因干扰因素。在理想的实验环境下,48.5mm×28mm缩微胶片区域内的最大数据承载量仅0.5MB,与数字胶片2MB的实际数据承载量仍存在明显差距。
结果显示,输出到缩微胶片的二阶灰度模板成像清晰度更高,而四阶灰度模板各区域间辨识度较差的主要原因是深灰区域难以区分和辨认。此外,在本批实验中,缩微胶片中出现的图像混淆现象或是导致其单幅理论数据承载量较小的主要原因,说明缩微胶片与数字胶片的成像差距不仅源于缩微胶片的物化性能、生产工艺,也可能与COM设备所使用的拍摄原理有关。目前,已知的反混淆措施有很多,如添加滤波器、提升物理分辨率和计算分辨率等,但距离实际投入使用还有较大技术差距。不仅如此,缩微胶片还原设备分辨率低,同样需要研发革新。
综上所述,现有缩微胶片及配套设备无法完全满足需要,数字胶片更适用于存储数字信息。
参考文献:
[1]郝晨辉.固本强基档案信息化建设再上新台阶[J].中国档案,2022(2).
[2]杜琳琳,郝晨辉.《数字档案信息输出到缩微胶片上的技术规范》简介[J].中国档案,2010(10).
[3]段东升等编着.数字档案信息缩微品输出[M].中国文史出版社.2013(8).
[4]RafaelC.Gonzalez等编着.数字图像处理(第三版)[M].电子工业出版社.2019(7).
[5]张建明,龙凌云,杨安荣.数字胶片技术及其在档案数字资源长期保存中的应用[J].中国档案,2023(2).
作者单位:国家档案局科研所
责任编辑:王辉