明清档案“数转模”项目实践探究

发布时间:2024-01-12 15:05:45被阅览数:338 次信息来源:《中国档案》

  文/王海欧

  中国第一历史档案馆(以下简称“一史馆”)明清档案“数转模”项目的实施过程,实际上就是档案信息存储于不同介质的转换过程,其操作实践主要是在档案信息资源从纸质载体转换到数字化存储介质的基础上,再将数字化存储方式转换为以胶片为载体的模拟技术存储方式。从操作实践情况来看,“数转模”项目既是一项巨大的项目管理工程,同时又是前后贯通且流程缜密的一个完整工作链。就其完整的工作流程而言,其实施过程先后主要经历“数据下载”“图像转换”“数据打包”“输出打印”“胶片冲洗”“胶片质检及入库”6个基本阶段。从技术层面讲,每个阶段的操作是否合理规范,均是直接影响缩微品质量优劣的风险因素,都有可能使原始档案的内容信息在介质转换过程中出现遗漏或失真,为此需要引起高度重视并认真对待。

  数据下载阶段

  首先要充分了解数字化档案的主要技术参数,这是对数字化档案进行介质转换的基础性工作。2011年,一史馆启动档案整理数字化工作时确定了一系列数字图像主要的技术参数,如图像文件格式为TIFF,全彩色、24位真彩色输出,分辨率不低于300dpi,单页档案尺寸不超过A3尺寸标准画幅等;对于归档备份数据,采用了多套多介质备份机制,仅扫描图像存储采用TIFF、JPEG以及无损压缩JPEG2000格式。综合多方调研结果,明清档案“数转模”项目决定优先采用JPEG图像文件格式进行转换,其最大优点是利用有损压缩方式去除冗余的图像数据,即用最少的磁盘空间得到较好的图像品质。

  图像转换阶段

  图像转换的初步工作是从服务器下载彩色图像及相关数据到本地,需要事先进行“彩转灰”、图像对比和图像的优化处理,转换时需要根据每一批档案的不同特点设置不同的“彩转灰”的参数,然后批量添加彩色图像数据,在预览“彩转灰”效果后,利用PhotoShop图像处理软件对下载的全部彩色图像进行可选颜色、曲线、色阶和亮度/对比度等操作优化处理,将处理后的彩色图像转换成灰度图像。在批量“彩转灰”后,会发现有个别图像转换效果不理想,有的图像过深或过浅,甚至有的图像档案边框不清晰,此时需要针对个别转换后背景较深或较浅的灰度图像单独进行调整,待预览效果满意后进行保存,从而确保转换灰度图像质量合格,整盘缩微胶片背景密度趋于一致。

  数据打包阶段

  数据打包是确保COM系统输出的缩微胶片能长期有效保存、缩微胶片模拟信息完整清晰的关键阶段。实践证明,“数转模”最重要、最繁琐的工作都在图像数据的准备和前处理环节,最为重要的是需要对输出数字影像重新进行编排以确保数字影像在缩微胶片上的顺序和原始档案的顺序一致。从技术层面讲,数据打包阶段的6个重要环节,是直接影响缩微品质量的根本因素。

  1.标版标识区设置环节

  标版标识区主要包括片首标识区及片尾标识区的文字标板和测试标板两方面内容。文字标板包括缩微制作批准书、缩微品印章、缩微品制作说明、档案原件证明、著录标板以及特殊情况说明的标版。测试标板主要是判断缩微品质量和COM系统工作状况的标版。OP800数字存档机有自带的技术标板及灰度检测标版,主要检测胶片密度、灰雾度及解像力3个技术指标。根据明清档案自身的特点,在此基础上单独增加了缩微拍摄时使用的技术标板即2#测试版,这样做的目的就是使用新、老测试版检测的数据可以进行有效对比,同时为缩微方面检测技术指标提供一种数据参考。

  2.输出文件设置环节

  首先添加档案附加信息。传统纸质档案数字化过程中,会产生一些新增加的非档案内容信息(如备考表及档案标识符号等)。在“数转模”过程中也需要将这些非档案内容信息随档案主体的信息一起转换成缩微胶片模拟信息进行保存。其次添加图形符号标板。内容包括“片首”“片尾”“待续”“续上”“O完”5个基本符号。其后进行文件检查及长度预测。检查内容主要包括所选图像是否完成“彩转灰”、文件格式是否为JPEG、分辨率是否为300dpi等技术指标,若检查中出现错误,系统软件会自动报错,工作人员要及时纠正。由于数字影像数据是存储在计算机设备上,通过计算数字影像横向或纵向像素点数可以知道原始档案的大小,据此可以比较精准地计算出合理的缩微胶片画幅容量区间,一是要确定输出时片头、片尾各留至少700mm护片区;二是要确定相对固定画幅数量的片首及片尾标识区以及每卷档案文件级的画幅数量。由此系统会自动计算打印影像所需的胶片长度。

  3.档案图像标准化设置环节

  档案标准化图像是按照档案案卷级及文件级的内在联系和顺序进行编排,这样使得每个文件夹中的数字图像都是按照最终输出到缩微胶片上的顺序进行排列,以确保数字影像与原始档案的顺序一致。为了对缩微胶片进行统一管理使用,一史馆利用系统软件自动影像偏斜、去黑边等校正功能将影像按照标准化大小进行统一处理,自动生成档案标准化图像的同时还生成了缩微胶片图像索引及电子目录文本索引。缩微胶片图像索引内容包括档案图像文件名及画幅编号,并打印在片首标识区和档案正文区之间,主要作用是记录本盘缩微胶片的档案正文图像数据。电子目录文本索引内容包括档案图像文件存储路径、文件名称、画幅类型、缩微编号、胶卷编号等内容,要求索引必须能够导入目前使用的档案目录数据库并与归档影像挂接。档案图像文件命名方式分为2种:一种为常规文件命名方式,按照“全宗—类别—项目—案卷—文件—画幅数”顺序排列命名;另一种为非常规文件的命名方式,比如,说明档案案卷级总体内容的备考表,每件档案残破情况的标识以及修前档案等情况说明。其命名规则有2种:一种是在案卷级下设0000-1代表“备考表”、0000-2代表“待续”、0000-3代表“续上”、0000-4代表“O完”;另一种是文件级下设0000-1代表“档案标识说明”、0000-2代表“修前档案”,这些特殊说明的标识按照要求需编排在该数字图像之前,目的是方便读者可以更好地利用缩微胶片。

  4.图像打包及导出电子目录文本索引设置环节

  图像打包就是将片首标识、缩微胶片图像索引、档案标准化图像、片尾标识依先后顺序,4个图像为一组按照缩微胶片各区段设置影像排列、画幅数等进行重新编排,且符合OP800数字存档机输出要求,建立并调整OP文件夹准备输出打印缩微胶片。同时导出电子目录文本数据为日后的图像及数据质检提供检查依据。设置4个图像为一组图像打包主要是为节省时间成本,据初步统计,按照4个图像打包比单个图像打包平均每盘可节省2~3个小时,为在有效时间内完成工作任务提供了保障。

  5.图像质检设置环节

  “数转模”的主要目的之一就是能够真实地将档案信息长期保存下来,因此图像质量检查工作至关重要。明清档案原件纸质状况以及“彩转灰”图像质量问题,会对输出缩微胶片上信息的清晰度及完整性产生相当大的影响,有时甚至可能造成档案信息丢失,因此输出前应事先做好预览工作,检查输出的数字图像是否符合标准,是否出现数字影像重复、遗漏等情况,数字档案信息内容是否完整,排列顺序是否正确,数字图像方向是否符合缩微品影像排列要求等预览内容。针对上述问题,质检人员应采取全检方式即对每一画幅逐一进行核对检查,主管部门应采取抽检方式进行核查。同时,为确保输出缩微胶片档案信息的完整性,节省校对时间和精力并保证校对效果,可以通过技术手段新增一个专门用于校对的图像对比软件,软件采用左右显示,彩色图像置于屏幕左侧,“彩转灰”图像置于屏幕右侧,左右图像一一对应核查,这样能极大提高质检效率。

  6.数据质检设置环节

  在确保图像质检合格后,还需要对打包后数据进行检查。从服务器下载的目录数据中,一般只保留档案编号及每件档案画幅数2个字段,再将导出的电子目录文本数据中的胶卷编号、每件档案起始号、终止号、档案画幅数等字段加入其中,利用公式自动计算出每件档案画幅数,只有从服务器下载的目录数据中每件档案画幅数与导出的电子目录文本数据中每件档案画幅数一致,才能说明“彩转灰”档案数据没有丢失。如果前后数据不一致,说明出现丢漏画幅情况,软件会自动报错,检查人员应及时作出更正检查。当然,还有一些基础性的检查工作,诸如电子目录数据与电子影像是否一致、电子影像文件逻辑顺序是否正确、案卷级文件的顺序是否准确完整等。

  输出打印阶段

  缩微品的密度和解像力是衡量缩微品质量的重要指标,而曝光量是影响缩微品密度和解像力的重要因素。因此,数字档案信息缩微品输出时设置准确的技术参数是必不可少的,所以在数字档案信息缩微品输出工作前,不仅应进行曝光实验确定COM设备的最佳曝光值,而且还要定期对输出设备进行检测,随时了解解像力、密度是否符合相关要求等。针对明清档案原件的特殊性以及扫描后数字影像的特点,正常情况下使用OP800数字存档机、windows10操作系统、汉龙公司数模整合系统应用软件,采用曝光量7×16×B12(B12会根据胶卷批次的不同稍加变动)等技术参数输出打印缩微胶片,基本上就能够满足缩微品的质量要求。

  胶片冲洗阶段

  缩微胶片冲洗是银盐缩微胶片成像过程的一个重要环节,对缩微胶片图像质量、使用效果和保存寿命都有一定程度的影响。银盐缩微胶片的冲洗过程包括显影、中间水洗、定影、水洗和干燥等过程。胶片冲洗必须使用胶片冲洗机进行,人工操作包括胶片安装、胶片牵引等。冲洗前,要确定冲洗条件,诸如药液配制比例(比利时EMP成品药液)、药液显影温度(37°C)、水洗温度(33°C)、输片速度(3米/分)、烘干速度(3米/分)等;冲洗时,要随时监控胶片密度变化情况;冲洗后,要及时在暗室取出胶片以免跑光影响缩微胶片质量。

  胶片质检及入库阶段

  缩微胶片质检主要检查缩微胶片背景密度、解像力及灰雾密度3个技术指标。考虑到明清档案纸张条件的特殊性,以及手写体档案破损严重等因素,就缩微胶片背景密度而言,确定输出密度值控制在0.8~1.1为宜,原底片密度差在0.3,灰雾密度不超过0.04,以确保缩微胶片能够达到长期保存的要求;就缩微胶片综合解像力而言,无论是传统缩微拍摄所形成的缩微胶片还是通过“数转模”后所形成的缩微胶片,其缩微影像清晰度的要求是完全一样的。值得注意的是,缩微品能否得到有效保存,其事后保存环境与管理也是十分重要的。严格意义上讲,原底片必须在防火保险箱或绝缘密封容器柜中保存,只有这样才可以有效防止缩微品影像的褪色变色。同时,胶片库房内必须配备除尘效率非常高的空气过滤装置,只有这样才能减少大气中有害气体和灰尘对缩微品的侵害。

  总之,明清档案“数转模”项目的核心目标是生产品质优良内容真实的高质量缩微胶片。从项目实践的宗旨上看,“数转模”项目的工作目标是改善数字化档案在档案保存方面存在的短板,在充分保持数字化档案在利用方面迅速便捷等优势的基础上,通过异质备份的方式把数字化档案的内容信息进行完整转换并融入项目实施的各阶段各环节,充分发挥缩微胶片有效保存方面的特有优势,确保与数字化档案一道形成各有侧重互补发展的良性机制,进而有效实现明清档案“数转模”项目的工作目标,全面提升项目的管理水平与管理质量。否则,在数字化时代借助信息技术所衍生的新的档案存储介质便徒具数字化形式,不仅违背真正有效保护与利用历史档案的初衷,而且最终损伤档案事业的根基。

  参考文献:

  [1]李丽云.论数字资源长期保存研究机制[J].北京档案,2010(9).

  [2]郎玉林.数字信息长期保存政策的宏观思考[J].兰台世界,2010(7).

  [3]金淑红.数字化技术与档案存储解决方案[J].科技创新与应用,2014(6).

  [4]李金凤.档案馆数字化与缩微技术的复合系统[J].缩微技术,2002(2).

  [5]林连君.试论缩微技术与光盘技术的特点及应用[J].档案学通讯,2001(6).

  [6]杜琳琳,郝晨辉.数字档案信息输出到缩微胶片上的技术规范[J].中国档案,2010(10).

  [7]李健.数字缩微技术—文献影像技术发展的新模式[J].数字与缩微影像,2012(4).

  [8]中国第一历史档案馆.明清档案与历史研究论文集[C].中国文史出版社,2015.

  [9]中国第一历史档案馆.明清档案事业九十年[M].人民出版社,2016.

  作者单位:中国第一历史档案馆

  责任编辑:王辉

1.jpg

彩转灰图像处理

2.jpg

输出打印

3.JPG

胶片冲洗

4.JPG

胶片质检