发布时间:2025-03-18 08:24:20被阅览数:87 次信息来源:《中国档案》
作者:罗永俊 毕晓然 郝阳 张晓龙
“内蒙古乌兰牧骑档案资源建设及珍贵音视频档案数字化抢救技术研究”项目2018年获得国家档案局立项,2021年通过国家档案局验收,2023年获得国家档案局优秀科技成果三等奖。
内蒙古自治区档案馆利用2年多时间,将馆藏527盘,以及从乌兰牧骑、内蒙古社科院等单位接收的463盘,共计990盘模拟音视频档案,进行了数字化采集与修复抢救。其中,音频档案类型有开盘带、卡座带、黑胶唱片;视频档案类型有VHS、Beta、U-Matic、DV等。通过对模拟音视频档案的前期物理修复、采集系统软硬件设备配置、数字化采集、数字化修复、建立数据库、数据挂接与保存等一系列抢救流程,探索了内蒙古多民族文化珍贵音视频档案抢救技术方法与原则等关键核心点。
研究背景
乌兰牧骑,蒙语原意为“红色的嫩芽”,1957年诞生在内蒙古自治区锡林郭勒盟苏尼特右旗,是活跃在草原农舍和蒙古包之间的文艺团队,具有“演出、宣传、辅导、服务”等职能,是深受广大农牧民喜爱的“红色文艺轻骑兵”。其形成的档案资源很多为民族歌舞声乐演奏等,具有内蒙古民族特色和历史文化价值,是珍贵的民族文化记忆。
由于乌兰牧骑演出的特殊性,其对历史音视频档案的保存和管理存在诸多不完善、不规范的问题:一是乌兰牧骑成立半个世纪以来形成的丰富的音视频档案资源,很多已经散失不见,其中部分散存在各地乌兰牧骑队伍中,需要进行系统深入的征集归档管理工作。二是早期的珍贵乌兰牧骑音视频档案为传统载体的模拟录音带、录像带,大多录制于20世纪50、60年代,因时间跨度久远、存放时间过长,早已超出保管期限,加之保管条件不当,均出现不同程度破损,少量出现失真、失效现象,亟待修复。三是由于技术手段的更新,这些录音带、录像带的读取设备现如今很多早已经被淘汰,无法打开读取,这些音视频档案亟须数字化转存,才可以有效利用与共享。四是部分损毁严重的珍贵音视频档案,在数字化采集之后仍然图像模糊声音嘈杂,需要进行抢救性修复工作,才可以“发声显影”发挥作用。将乌兰牧骑保存的无法读取的录音带、录像带抢救出来,转成可用计算机处理的音频和视频,成为当务之急。
为做好项目工作,内蒙古自治区档案馆音视频抢救技术研究项目组分3次对乌兰牧骑音视频档案资源进行了征集调研。第一次是2018年11月,调研了锡林郭勒盟苏尼特右旗、苏尼特左旗、赤峰市巴林右旗、喀喇沁旗;第二次是2019年6月,调研了鄂尔多斯市、鄂尔多斯市鄂托克前旗、乌审旗,包头市达茂旗;第三次是2019年7月,调研了呼伦贝尔市莫力达瓦达斡尔族自治旗、鄂伦春自治旗、根河市、兴安盟、兴安盟科右中旗、科右前旗、阿尔山市,共计15个乌兰牧骑。项目合计有7支乌兰牧骑队伍及部分其他单位将开盘式录音带142盘、盒式录音带173盘,录像带148盘,共计463盘交内蒙古自治区档案馆进行数字化采集及修复。
研究内容及成果特色
项目开展乌兰牧骑档案资源建设的内容与价值研究,乌兰牧骑档案资源的征集与整理,乌兰牧骑传统载体录音录像档案的数字化转存技术与方法研究,乌兰牧骑珍贵录音录像档案的数字化抢救修复技术与方法研究,通过调研分析、征集抢救、平台建设、翻译著录等研究过程,对乌兰牧骑珍贵录音录像档案进行抢救修复,使早年的原创歌舞、艺术创作能够再现,为艺术创作、歌舞传承等发挥作用,对民族文化的传承具有重要意义。
1.数字化前处理工作
一般采用橡胶除尘器除尘,软布蘸弱碱性溶剂擦拭盘面霉斑、污垢,对断裂、变形带基进行粘合连接与平整处理,手动调试带盘运转流畅度等方法进行前期物理修复,为音视频档案数字化奠定基础。
2.采样对比及采集数据
(1)模拟音视频档案信息输出与采集设备
音频信息输出设备有瑞士思德利Studer—A812Recorder-Reproducer开盘录音磁带机、1986年生产的日本夏普GF-777双卡卡座收音录音机、文曲星BK-898卡座带录放机。视频信息输出设备有日产松下1983年G30和日产松下2000年3CCD数字磁带摄像机、SONY9800P录像机等。音视频信息采集硬件设备:DAYANGD3-EditHD非线性编辑音视频采集系统,CanopusHDSTORMPlus高清采集卡。
(2)模拟音视频档案采集软件系统
视频采集系统:D-Cube-Edit3.0,音频采集系统:CoolEditPro2.1、AdobeAuditionCC。
(3)数字化信息采集
信息采集前,需要设定音视频档案信息采集技术参数,必须严格按照国家档案局颁布的《录音录像档案数字化规范》(DA/T62—2017)来执行。
①录音档案数字化技术参数设定与采样、采集:
首先,确定音频采集数据的基本数值类型,设置模拟声音讯号为Analog音频输入类型,TC码参数设置为信号稳定的LTC码,音频编码类型采用PCM编码,基于PCM编码的WAV格式是目前操作过程中使用最稳定的音频格式。
其次,对音频采样率的设置,依据采样数据进行了采样比对,比对发现,频率为48.0kHz量化精度32bit和频率96kHz量化精度32bit,其声音还原度比频率44.1kHz量化精度16bit或者24bit的声音效果更好,存储和传输的过程中没有声音的失真现象,编辑和处理也更加方便。
采样工作准备就绪后,对馆藏及乌兰牧骑等模拟音视频案进行了大量的数字化采集工作。其中包括:周恩来总理在内蒙古庆祝包钢一号锅炉建设成立时的录音讲话;乌兰夫同志在全国民族工作会议中关于内蒙古政治、经济建设、文化教育工作的讲话及少数民族广为流传的蒙古说书艺人乌力格尔的说唱录音。
②录像档案数字化技术参数设定与采样、采集(以VHS录像带为例):
视频数据采样参数中视频编码格式均采用MPEG-2IBP;帧率与档案原件相同,每秒25帧;画面的宽高比都是4:3,与档案原件相符;档案原件全部为PAL制式,所以它的分辨率均为720×576;色度采样率为标清视频不低于4:2:0;视频的量化位数为10bit,比特率为8Mbit/s。其音频采样率为48kHz,量化位数16bit,声道以档案原始声道为主;文件格式分别为AVI、MPEG。
采样完成后,开始对录像档案进行数字化采集。其中包括:内蒙古自治区建立初期老一辈革命家杨植霖、高克林同志的工作记录与访谈节目档案;鄂托克前旗乌兰牧骑队员深入基层为广大农牧民演出的录像档案,等等。
3.完善元数据著录
对于一个音视频资源文件内含多个不同主题的音视频档案的情况,需要根据每个主题的起止时间,在采集时按照主题进行切分,针对每个主题的不同内容与类型,必须严格按照《录音录像类电子档案元数据方案》(DA/T63—2017)与《档案著录规则》(DA/T18—1999)的要求,进行相应的著录,补充编目信息。采用的著录项目多达26项,以备后期录入媒资数据库,形成完整的目录数据。
在对数据文件命名时以档号为基础对音视频文件命名,确保每一个档号的唯一性;一条目录对应采集后的多个音视频文件时,可按档号与顺序号的组合对音视频文件命名并建立正确的存储路径,确保后期数据挂接的准确性。
4.一次修复与二次精修
(1)音频档案数字化修复
首先,把数字化采集后的音频档案原始文件进行保存,以拷贝件进行修复。先对音频文件各项指标进行数据提取与分析,分析指标有:信噪比、音高校正、动态范围、频谱失真、幅度失真,然后对于所提取的各项数据指标进行详细记录,以此确定降噪修复方案的基础。
采用的修复软件是CoolEditPro2.1与AdobeAuditionCC两款软件。主要完成以下工作:
①音量标准化提高。由于保存年代久远,采集后的原数据文件音量有的低到只有3分贝,人耳很难感受得到,必须对其进行音量标准化提高。通常把音量的标准放大到300%,达到9.542分贝,有时甚至放大600%,达到15.563分贝。但是,笼统地进行单一化放大,音量会出现平衡不一致,需要对波形文件逐段进行修复,直至整个波形文件平衡。
②音量降噪处理。音频文件的降噪处理分为降噪器,破音修复,嘶声、咔嗒声和噗声消除,以我国著名外交家乔冠华在1969年第26届联合国大会上的讲话录音为例,首先对需处理的文件进行噪声采样,设定文件的降噪级别,对噪声衰减、精度因数、平滑总量、转换宽度分别进行数值的调整,反复试验,最大限度地调整最佳音质。
③手工干预残存噪点:对消除低噪声后的素材进行主观听音评价和波形分析,然后使用软件中提供工具对信号进行手工干预,清除残存的噪点。
最后,以采样率为48.0kHz,采样精度为32bit,导出WAV文件格式进行保存。
(2)视频档案数字化修复
①视频档案修复原则。真实性是音视频档案数字化的基本要求,也是音视频档案作为原始记录的基本特性。真实性原则要求在进行音视频原载体的数字化转录时要时刻把握音视频原载体内容可控与高保真采集,以确保其原汁原味。同时,还应充分考虑数字化成果的保存与利用的不同需求,作为档案行业,因其原始记录的特性,决定了在进行数字化修复时,不需要像广播电视传媒行业一样,一味追求视觉与听觉的最高清晰度,而要坚持“最小干预”的修复原则,只要能够听清楚、看清楚即可,尽可能保持音视频档案的原始凭证作用。
②馆藏电影胶片画面修复。运用D-Cube-Edit3.0大洋非线性采集编辑软件对存在画面缺陷的影片做了修复处理。电影原素材为24帧/秒,因为软件的功能限制,不能对其逐帧修复,只能整段来进行修复,修复时画面明暗度、降噪点参数等都是根据不同画面来进行设定,没有绝对值。
修复内容包括:首先,调整画面明暗度。在编辑软件中选择调色功能,对画面的亮度先做调整,亮度调整分暗部调整、中亮部调整、高亮部调整,调整亮度数值是根据画面的不同随时进行调整。其次,削弱画面噪点。随着画面亮度的调整,画面的噪点也显现出来,画面粗糙、颗粒感强,必须对画面进行局部或整体降噪,对画面强度、质量、输出速度、平滑度等处理。视频经过降噪处理后,画面平滑度明显突出。最后,校正颜色偏色。有些彩色的影片偏色特别严重,有的甚至不能保证基本的红、绿、蓝三基色,遇到这种情况,利用大洋非线编辑软件里的RGB调色功能尽量对颜色的偏移做出调整,由于软件的局限性,修复效果不明显。
③录像带画面修复。此次项目组完成的录像带数字化修复中,VHS录像带居多,尤其是乌兰牧骑视频档案形成年代久远,拍摄以彩色片为主,但当时采用的录像带质量普遍不高,拍摄画面质量差。虽然经过采用D-Cube-Edit3.0大洋非线性编辑软件和AdobePremierePro做了画面的明暗度与偏色的调整、噪点的去除等第一次修复,效果依然不尽如人意。
④视频画面二次精修。视频画面采用大洋非线性编辑软件经过第一次修复后,画面还原效果还存在许多瑕疵,对于画面划痕多、噪点大的画面修复效果还不能满足基本观影的要求时,需用更专业的Pfclean破损视频修复软件、达芬奇专业调色软件对其进行专项修复,有处理难度特别大的画面还需用Photoshop图像处理软件逐帧来进行修复。
5.存储与备份
(1)音频文件存储与输出格式
由于音视频档案的特殊性,数字化后产生的音频文件输出格式采用PCM无压缩编码的WAV无损格式进行输出与保存,虽然输出格式体积大,存储需要一定的空间,但它能做到无损耗存储也可以使用多种音频编码来压缩其音频流,因此,对于数据的存储采用WAV格式,对于档案提供利用则采用MP3压缩格式。
(2)视频文件存储与输出格式
视频文件存储与输出格式分为两种,对数字化的视频文件以无压缩AVI格式作为原始文件的保存,提供利用时采用压缩MPEG格式。
(3)数据库建立及数据挂接
在大洋媒体资源系统eVIAS中为数字化后的音视频档案建立了音视频档案数据库。将数据全部挂接在大洋媒体资源数据库中,其目录数据与音视频数字文件对应挂接,实现目录数据与音视频数字文件的关联查询。同时通过在数据库中设置的编目索引,实现目录数据、音视频数据文件与实体档案原件的关联。
(4)数据备份
数据备份采用了完全备份的方式,具体分为3种,一是把数字化后所有的数据完全备份在大洋媒体资源数据库中,二是把所有数据备份在计算机硬盘中,三是把所有数据脱机备份在蓝光光盘中。同时采用以上3种数据备份方式,可以最大限度保证档案数据存储的安全性与利用的完整性。
同时,项目组在为乌兰牧骑等单位免费提供模拟载体音视频档案数字化采集与修复的基础上,也将数字化后的音视频档案备份在蓝光光盘中,连同模拟载体音视频档案原件一同交还乌兰牧骑等单位,使这些珍贵的历史音视频档案能够被查询利用,为社会提供服务。
成果应用情况
项目组为兴安盟乌兰牧骑、苏尼特右旗乌兰牧骑、科右前旗乌兰牧骑、鄂托克前旗乌兰牧骑、敖汉旗乌兰牧骑,呼伦贝尔阿尔山市、莫力达瓦达斡尔族自治旗、鄂伦春自治旗、根河市乌兰牧骑等总计36个单位免费提供模拟载体音视频档案数字化采集与修复服务,将数字化后的音视频档案备份在蓝光光盘中,连同模拟载体音视频档案原件一同交还乌兰牧骑等单位,收到大量的应用证明反馈与用户良好评价,使这些珍贵的历史音视频档案能够被查询利用,为社会提供服务。
内蒙古自治区档案馆对乌兰牧骑档案进行保护与抢救的同时,也对来自中央民族学院、内蒙古社会科学研究院、内蒙古艺术研究院、著名导演等的一些年代久远的模拟录音录像带进行了抢救与保护,内容包括蒙古民歌类(长调民歌、短调民歌、叙事民歌,如鄂尔多斯、阿拉善民歌等)、英雄史诗(包括巴尔虎英雄史诗,格斯尔,江格尔,胡仁乌力格尔如传统胡仁乌力格尔《水浒梁山》、革命胡仁乌力格尔《巴音陶海的斗争》《狼牙山五壮士》等)、叙事长诗(革命叙事长诗《胡日乐巴特尔》)、好来宝类说唱作品资料等,内容较为珍贵罕见,都很有研究价值。
为了提高音视频档案资源的利用,更好地为社会服务,2021年,自治区档案馆启用了检索快捷、搜索精准的“智慧兰台档案管理系统”,将2621盘共计10万余分钟乌兰牧骑及馆藏珍贵音视频档案陆续导入“智慧兰台档案管理系统”中。这些音视频档案在面向全区公众查询利用服务中得到了大量利用,尤其是乌兰牧骑音视频档案,在社会服务中起到了良好的作用,给乌兰牧骑队员日后的艺术创作及社会服务奠定了良好的借鉴基础。
截至2023年,内蒙古自治区档案馆共将6876盘共计33万余分钟馆藏音视频档案进行数字化转换与技术修复,实现馆藏音视频档案数字化率100%,使得珍贵的馆藏音视频档案得以保护、修复与传承,并持续在“智慧兰台检索利用服务平台”中面向全区提供共享利用。
[本文系国家档案局2023年度科技项目获奖成果]
作者单位:内蒙古自治区档案馆
责任编辑:王辉