数字胶片技术及其在档案数字资源长期保存中的应用

发布时间:2024-01-16 09:20:11被阅览数:313 次信息来源:《中国档案》

  文/张建明  龙凌云  杨安荣

  缩微胶片制作是通过拍照或数字影像打印的方法把文献、档案、资料等信息由纸张载体转换到缩微胶片载体的一种技术。由于缩微胶片具有很高的解像力,能够忠实地反映档案原貌,保证了内容和表现形式的真实性,因此,从20世纪80年代开始广泛应用于档案管理,许多档案馆拍摄了大量的缩微胶片,在保护和抢救珍贵档案过程中发挥了重要作用,特别是在档案异质备份中占有重要地位,是较为理想的珍贵档案长期保存载体。《中华人民共和国档案法实施办法》对档案缩微品的法律地位作了规定:“档案缩微品,载有档案收藏单位法定代表人的签名或者印章标记的,具有与档案原件同等的效力。”

  开展缩微工作的主要方式

  一是纸转胶。以缩微拍摄作为抢救和复制档案的手段,将纸质档案拍摄成缩微图像保存到胶片上,目前依然是档案部门缩微胶片应用的主要方式。这种方式成本高、效率低、操作不便,只适合少量特别珍贵的纸质档案。

  二是数转胶。以计算机输出缩微品(Computer Output Microform,COM)技术为特色,直接将计算机文件输出为可读的缩微影像记录在胶片上,一般处理对象为纸质档案扫描之后的图像文件。这种方式自动化程度和效率相对较高,但会导致文件信息丢失,破坏了文件的原始性,很多文件格式(比如数据库文件、三维CAD文件、音视频文件等)根本无法保存。

  数字胶片及其技术原理

  在档案数字资源长期保存过程中,一方面胶片具有磁盘、磁带、光盘、固态硬盘等其他载体所无法比拟的保存期限(理论寿命500年,实际已经被历史证明的期限超过140年);另一方面,传统的缩微胶片保存方式在数字时代也面临很大的挑战,数转胶模式只能保存图像文件,很多电子文件格式根本无法保存。

  数字胶片的出现有望克服传统缩微在数字时代面临的挑战。数字胶片技术采用“数→胶→数”的胶片应用新模式,将拟保存的档案数字资源(数据包)经编码处理之后生成高密度二维码图像打印到胶片上,未来可以通过光学仪器读取胶片上的编码图像进行解码处理之后还原成原始数据,这样就可以直接在胶片中保存数字信息,是胶片技术的全新应用形式,充分发挥了胶片作为长期保存载体和异质备份载体的独特价值。

  数字胶片可以将数字资源不经过数模转换而以数字编码图像的形式直接保存到胶片上,任意格式随存随取,确保了数字资源的真实性和完整性,从而在突破传统胶片技术局限性的同时又继承了胶片载体的固有优势,使胶片可以用于档案数字资源的长期保存。数字胶片的技术原理如图1所示。

1.jpg图1  数字胶片的技术原理

  在整个流程图中,数据写入是最核心、最关键的环节。数字胶片数据写入的基本原理是将数据包的超高分辨率(4096×2160)二进制数字编码图像经4K反射投影技术投射到数据记录专用感光胶片之上,经感光、冲洗之后完成数据在胶片上的记录。每一幅编码图像在25mm×12.5mm的胶片区域上成像,称之为一帧,其中包含880万个像素点,按照4阶灰度存储,大约能保存2MB的数字信息,如图2所示。

1.jpg图2  在胶片上成像的数字编码图像

  将来在阅读时通过高速高清工业相机拍摄所需要的每一帧图像,如图3(a)所示,并对其进行解码处理,即可还原成原始数据。

1.jpg图3(a)  用工业相机拍摄之后的编码图像

  将图3(a)的左上角局部放大,可以看到图像的细节如图3(b)所示。

2.jpg

图3(b)  局部放大之后的编码图像

  可以看到每一幅图像中有编号、有边框、有定位点,还有用于存储数据的高密度4阶灰度的二维像素点阵。

  数字胶片是以卷为单位制作加工并保存的,一卷长度有300米、600米、900米等不同的规格。以900米一卷为例,总共约65000帧,大约可以存储120GB的数据,去掉其中的数据冗余部分,净数据存储容量在100GB左右。

  为了便于将来数据还原阅读,一卷数字胶片被划分成若干个存储单元,每个存储单元包括控制部分、信息呈现部分和内容部分三个部分。

  控制部分描述该存储单元的管理和技术元数据,其内容可以根据保存对象、保存目的和保存周期来设置,必要时甚至可以直接附上如何解码内容部分的源代码。信息呈现部分存储有助于正确呈现、理解和解释数字对象内容的结构信息和语义信息。控制部分和信息呈现部分都是以可视图像的形式存储的,未来的使用者可以直接放大阅读这部分信息,从而确保内容数据的恢复能力。内容部分是实际存储的数字资源,可以采用可视图像+数字编码的混合方式存储:主体部分采用数字编码形式,以每帧2MB的容量存储数据;数字资源的目录、缩略图等以可视图像的形式存储,便于快速识别和定位。

  数字胶片是典型的WORM(Write Once Read Many,一次写入多次读取)载体,在长达数百年的保存周期中,有可能需要多次回读。在数字胶片的保存和使用过程中,难免遇到沾灰、摩擦、刮划等情况。为了保证其可读性,数字胶片技术采用交叉交织里德—所罗门编码(CrossInterleaved Reed-Solomon Code,CIRC)用于检测和校正由随机和突发错误混合引发的缺陷。同时,为应对整帧丢失或破坏的问题,数字胶片使用帧到帧冗余的数据分条技术,将连续的片段存储在不同的物理帧上,这样可以在单个物理帧丢失的情况下恢复完整的数据。

  数字胶片在档案数字资源长期保存中的应用

  由于数字胶片技术在突破传统缩微胶片技术局限性的同时又继承了胶片稳定、可靠、安全的固有优势,预期将为我国档案数字资源的异质备份和长期保存作出重要贡献。

  数字胶片应用于档案数字资源长期保存需要配置三类装备(材料、设备、装具),如表1所示。

表1  数字胶片应用所需的三类装备

1.jpg  这其中,35mm数据记录专用胶片可以直接采购市场上主流品牌型号的产品,比如Kodak2237,目前中国乐凯集团有限公司正在进行该型号胶片的国产化研发工作;保管装具主要是指胶片盒和胶片柜,需要根据胶片保存环境要求(温度≤21°C,湿度20%~50%,防尘、防火、防水、防光等)进行设计生产,但相关生产工艺非常成熟,市场上也有很多同类产品;所以重点是数字胶片读写设备的研发。

  2022年度国家档案局科技项目重点项目“档案数字资源备份策略及数字胶片技术应用研究”(又称“数字罗塞塔计划(Digital Rosetta Plan,DRP)”)由国家档案局档案科学技术研究所牵头,上海鸿翼档案信息技术有限公司、中国人民大学档案学院、上海市高级人民法院共同承担,目前正在全力研发数字胶片写入、冲洗、读取全套设备,预计年底发布第一代样机。数字胶片全套设备包括数据写入设备、胶片冲洗设备、数据读取设备(专业级、桌面级)共三类四套设备。

  数字胶片写入、冲洗、读取全套设备研制成功之后,就可以面向档案部门提供数字胶片制作加工服务,主要包括以下两种方式:

  1.自建产线方式

  面向副省级以上档案馆/国家战略电子档案备份中心,需要配置数字胶片全套设备(写入设备、冲洗设备、读取设备)并建设胶片库房,建立数字胶片生产线,可以自行制作加工或者对外提供数字胶片制作加工服务,如图4(a)所示。

1.jpg

图4(a)  自建数字胶片制作加工生产线

  2.委托加工方式

  由相关专业公司建立移动式数字胶片加工中心,基于全套数字胶片制作设备,在符合档案安全管理要求的前提下,面向全国各级档案部门提供数字胶片驻场式制作服务,如图4(b)所示。

2.jpg

图4(b)  移动式数字胶片加工生产线

  数字胶片优势总结

  将数字胶片技术应用于档案数字资源长期保存,具有以下几方面的突出优势:

  保存寿命长:数字胶片的保存时间可长达数百年,被历史证明的保存期限也已超过140年,远超磁盘、磁带、固态硬盘、光盘等存储载体。

  安全性高:数字胶片是WORM载体,一次性写入,无法篡改和伪造;并且适合离线保存,防黑客、防电磁冲击,不容易被破坏。

  技术依赖低:数字胶片大量采用公开的算法和技术,其控制部分、信息呈现部分和可视图像都可以人眼识读,降低了对特定软硬件的依赖。

  保存内容灵活:可以混合保存可视图像和数字信息,适合各种类型档案数字资源的保存。

  维护成本低:超低迁移频率,保存几百年才需要迁移一次,可大幅降低长期保存过程中的维护成本,一次性投入,后期几乎零维护。

  能耗低:保存过程无须耗电,对环境温湿度要求不高,绿色节能。

  数字胶片技术继承了传统缩微胶片技术的优势和特点,并通过引入新时代的光学影像技术,以高密度数字编码图像来保存数字信息,使胶片技术在数字时代焕发了新的生命力。对档案数字资源保存而言,具备了保存寿命长、安全性高、技术依赖低、保存内容灵活、维护成本低和能耗低等突出优势,有望在档案数字资源的长期保存和异质备份中发挥重要作用。

  作者单位:上海市档案馆、上海鸿翼软件技术股份有限公司

  责任编辑:王辉