原生数字视频文件归档格式选择及转换研究

发布时间:2025-01-07 08:10:29被阅览数:385 次信息来源:《山西档案》

  作者:王晨昊 丁家友 张照余

  摘要:视频社会化时代,海量格式各异的原生数字视频使视频文件的归档管理工作面临新的挑战。对编码格式、封装格式、视频码率和色彩采样格式四个决定视频文件图像质量、数据量及视频档案可用性、安全性的重要参数进行梳理归纳,并根据视频格式之间相互转换的需要,整理视频格式转换通道及优缺点,通过格式转换实验进一步阐明编码、封装、码率、采样四个指标对视频文件的影响和适用于当下国内技术环境的选择。综合实验结果与国内外实践案例及现行标准,给出适合我国当下档案管理工作的原生数字视频文件归档建议,以期对数字视频档案的长期保存及相关归档标准制定工作有所启示。

  关键词:数字视频文件;视频格式;格式转换;归档管理

  随着5G、AI及移动互联技术的进一步发展,我们正加速进入“视频社会化时代”[1]。截至2023年12月,我国网络视频用户规模达10.67亿人,占网民整体的97.7%[2]。视频正逐步成为互联网信息传播的重要媒介,能够跨越时空、文化和语言的阻隔,用动态且直观的方式吸引社会公众。因此,利用视频也可以讲好档案故事、传播档案文化。视频档案能够全面记录历史事实、生动构建社会记忆,是重要的人类文化遗产。

  近年来,超高分辨率(8K及以上)、360°全景视频、全息影像等新技术的发展,进一步提升了视频档案真实记录和还原历史,以及多维度、全方面、立体化开展档案叙事的能力,但同时也给视频档案归档及存储带来新的挑战。当下海量原生数字视频文件和层出不穷的视频格式,亟待档案界开展深入研究,制定相关标准,针对适用性较强、应用较广的技术标准方案探索国产替代方案。故本文梳理视频文件归档标准中的关键要素,通过具体实践探讨适用于我国当下技术环境与长期保存需求的原生数字视频归档格式与参数,回应视频社会化时代的档案管理工作需求。

  1  国内外研究与实践

  自19世纪视频技术发明后,视频载体不断变化发展,从20世纪初的胶片、20世纪中期的磁带(VHS、U-matic等 )、20世纪末的光盘(CD、DVD等),发展到21世纪的数字媒体(MP4、AV I等)。21世纪初,欧美档案学界开始讨论传统载体视频的数字化[3]与文件管理(如文件格式选择、元数据管理[4]及视频管理系统设计[5])等视频归档问题。自2006年,张照余[6]学者开始关注视频电子文件的归档格式和传统载体(磁带、光盘)音视频档案的数字化转存[7-8];WITTENBURG  et  al[9]提出当时常用的视频归档格式MPEG(.mpg)和AV I(.avi)很可能在5年内就不再适用,被诸如MXF(Material Exchange Format)等格式替代;PEARSON和GILL[10]提出,开放编码标准Motion JPEG  2000非常适合视频文件档案的长期保存需求,但受限于存储成本,所以建议图书馆使用有损压缩的MPEG-4或AV C格式;项文新等[11]认为MPEG-4将替代MPEG-2成为主流标准;张晶晶[12]也提出数字视频首选MPEG-4,RM格式可作为档案部门对外交流网站的存储格式;杨中营[13]建议以MPEG-2格式长期保存视频档案,在提供检索、预览等网络利用时可转换为MPEG-4、RM、ASF、WMV等流媒体格式,并给出建议的相应码和采样格式。之后,学者们通过对比评测,对视频档案的长期保存格式[14]、编 码[15]、封装格式进行了多角度探讨,提出了一系列方案[16],国外学者也提出了免费开源[17]方案。

  1.1 国内现行标准

  我国现行数字视频文件归档相关标准及地方规程如表1所示,其中关于数字视频归档格式的规定基本来自2016年发布的《电子文件归档与电子档案管理规范》(GB/T  18894-2016),但该规范主要针对归档业务环节的管理,格式管理只被简单提及。现行国家标准、行业标准及地方规定中关于数字视频归档格式的规定均较为泛化,缺少细则且较为滞后,大多只是几种主流格式的简单罗列,没有编码格式、色彩采样格式等具体参数的操作细则。这就导致各地方档案部门及各高校档案馆(室)在数字视频文件归档工作中采用不同方式,直接影响原生数字视频档案的交互兼容及长期可用性。

表1  我国现行数字视频文件归档相关标准与规定

1.jpg

  笔者通过实地走访各高校档案馆,结合相关学者[25-27]的实地调研数据分析发现,国内高校档案馆在数字视频文件归档方面普遍存在数字化标准不统一等问题。这使得高校档案馆在原生数字视频文件接收方面普遍处于被动状态,难以实现前端控制,做不到应收尽收,因此亟须建立、完善原生数字视频及声像档案管理制度,制定适用于当下的音视频数字化工作管理规范。对技术参数的设定是保证电子文件质量的重要步骤,也是电子文件归档管理制度和长期保存标准与工作规范的重要组成部分。在原生数字视频归档方面,应在当前相关标准基础上完善原生数字视频文件档案保存的基本参数指标,并在未来根据变化不断做出调整,及时补充新格式,并对过时格式进行迁移更新,建立动态的更新机制。这方面可以借鉴欧美档案馆与相关机构定期发布的操作指南中的模式,结合具体实操情况制定执行手册。

  1.2 国外指南与实践案例

  欧美图书馆、档案馆等相关机构、协会常以指南形式更新发布电子文件归档格式建议。例如,由美国国会图书馆、美国国家档案和记录管理局等牵头成立的美国联邦机构数字指南倡议FADGI(Federal Agencies Digitization Guidelines  Initiative)于2014年发布了《原生数字视频创建与存档指南》[28],包含8个原生数字视频创建与归档的案例(见表2)。FADGI建议使用无压缩编码进行数字视频归档,并对格式的元数据能力、多声道支持和时间码支持能力作出要求。

表2  FADGI 2014年数字视频创建与归档实践案例

2.jpg

  加拿大国家图书档案馆(Library and Archives Canada, LAC)于2015年发布了《具有永久保存价值的信息资源移交文件格式指南》[29],其中数字视频文件的推荐格式为无压缩4:2:2编码的AV I、无损JPEG 2000编码的MXF OP1a和无压缩4:2:2编码的QuickTime(.mov)格式,并指出一系列可以接受的主流编码格式。国际声音和视听档案协会(International Association of Sound and Audiovisual Archives,IASA)2019年发布的《视频保存指南IASA-TC 06》[30],建议以FFV1编码的Matroska(.mkv)格式、无损JPEG  2000编码的MXF格式和无压缩v210编码的MXF格式归档数字视频文件。十几年来,美国国会图书馆每年都会发布针对各类电子文件归档保存的推荐格式声明,在最新的《2023—2024推荐格式声明》[31]中建议数字视频首选归档格式为可互操作主格式IMF(包含MXF和XML文件),其次为RFC 9043标准FFV1编码的Matroska(.mkv)封装格式,接下来依次为ProRes、MPEG-2和XDCAM格式,以及MPEG-4等可接受的主流格式。

  由此可见,在当下欧美地区图书馆与档案馆的数字视频存档格式指南中,v210或JPEG 2000编码的MXF OP1a格式是认可度最高的最佳质量无损视频储存格式。QuickTime(.mov)格式得益于ProRes编码的灵活性,是在最高规格的MXF之下、画面质量与存储容量平衡性获得较高认可的视频文件格式,在美国的档案项目中获得了广泛的使用。近几年来,免费开源的FFV1编码Matroska(.mkv)格式在欧美图书馆与档案馆中获得了较为广泛的认可。

  1.3 研究与实践现状评述

  电子文件长期保存的根本目标是实现电子文件的长期安全保存、可读、可解析与理解[32],从文件格式的角度考量即要求归档格式具有原真性与可识读性,满足格式开放、格式自描述、稳定可转换、利于存储利用等特点。对于原生数字视频文件而言,原真性主要体现在视频画面质量上,由编码格式、码率和采样格式决定,可识读性、格式开放、格式自描述、利于存储、利于利用等长期保存格式需求由封装格式和编码格式决定。综上所述,对于原生数字视频文件的归档与长期保存的技术参数来说,编码格式、封装格式、码率和采样是四项关键参数,其中编码格式和封装格式标准众多且不断更新发展,决定了视频文件的可识读性、可用性、安全性和稳定性;码率和采样决定了视频文件的图像质量与数据量,直接影响视频档案的原真性和存储成本,因此为了便于归档管理,应给出明确的参数指南以便于操作。

  当下国内数字视频文件归档标准与规定大多是对2015年左右主流封装格式的简单罗列,缺少编码格式、色彩采样等具体参数的操作细则,虽然国内档案部门可参考借鉴国外指南更新操作指导手册,但就具体格式而言,国内外不同的技术应用环境使得国外指南中建议的编码格式与封装格式在国内的适用性与安全性方面仍有待商榷。具体而言,MXF格式是国内外公认的视频档案长期保存首选封装格式,其搭配的JPEG 2000无损编码格式适用性最强。近几年欧美档案馆广泛应用的美国苹果公司的ProRes编码QuickTime封装方案和免费开源的FFV1编码Matroska封装方案的适用性有待验证,且其编解码需使用专用收费软件或插件,不符合电子文件长期保存的开放性需求;Matroska(.mkv)封装格式虽因其开源特性支持几乎所有的编码格式,但其中只有搭配行业标准RFC  9043版FFV1编码方案获得欧美档案界认可,且必须使用FFmpeg软件或相关插件进行转换,其适用性与安全性等指标有待实践检验与评估。此外,国内相关行业、部门也在推动AV S系列等我国自主产权标准的国际标准化,且国内外的标准、指南都没有就非归档建议文件格式的转换与保存给出具体操作建议。故基于国内外研究实践现状,为完善档案馆声像档案管理制度与工作规范,满足长期保存需求,尤其是为视频文件归档前端控制和长期保存的技术参数细则制定提供参考依据,下文主要围绕以下两个问题展开:一是适用于我国当前技术环境且满足长期保存需求的原生数字视频文件归档格式及参数选择;二是主流视频格式文件的转换通道与对比。

  2  视频格式参数及选择原理

  标准的制定在电子文件管理中起着至关重要的作用,为电子文件长期保存提供制度依据和指导。为厘清国内数字原生视频归档格式的技术环境,完善电子文件归档管理制度,健全数字视频文件长期保存标准,本章对视频文件归档标准所需的四个重要参数(编码格式、封装格式、视频码率和色彩采样格式)进行特性与发展情况分析,总结提炼视频归档格式选择的技术原理。

  2.1 编码格式

  原始视频信号的数据量庞大,若不进行压缩则不利于传输和存储,视频编码技术及标准应运而生。压缩标准是指运用特殊的编码手段,对视频中不影响人们听觉和视觉体验的冗余数据进行有效删减的计算机处理技术标准。使用不同标准压缩的数字视频即表现为不同的编码格式。国际主流的视频编码标准基本都是由国际电信联盟ITU、国际标准化组织ISO和国际电工委员会IEC联合编制,已从1992年的第一代视频编码标准MPEG-1发展到2020年的最新标准H.266/VVC。我国数字音视频编解码技术标准工作组及谷歌、微软、苹果等公司也根据自身的技术与行业优势发布了一系列视频编码标准。表3列出了15种当下常用的视频编码格式。

表3  常用视频编码格式

3.jpg

  可见,编码格式随视频分辨率与网络传播效率的要求而快速迭代升级。1992年MPEG-1发布时应用对象还是VCD,2003年H.264、AV C发布时的主要应用对象是720p、1080p分辨率的高清数字视频和DVD视频,2013年H.265、HEVC发布时主要应用对象增加了超高清4K视频和立体3D视频。至2020年H.266、VVC发布时,4K流媒体传输已是常态,视频行业已向8K迈进,360°全景视频和HDR高动态范围视频逐渐增多。除H.26X系列国际标准外,我国具备自主知识产权的AV S系列标准也在不断更新,并已成为我国信息技术的国家标准和电视广播行业的行业标准,但主要局限于广播电视行业,在其他领域的推广较为缓慢。

  视频文件编码格式的选取需同时考虑压缩效能和兼容性,使归档文件在保证视频质量良好、视频信息完整的前提下,既有合适的文件体积便于存储,又具有广泛的适用性。JPEG2000无损和v210编码格式支持无损高规格储存,能够保存最完整的视频信息,但极低的压缩率带来存储成本压力。H.264是当下使用最广泛的国际标准编码格式,具有很强的交互能力、强大的兼容性和良好的扩展性,对于4K及以下分辨率的视频有着良好的压缩率和高质量的压缩效果,但随着4K、8K超高清分辨率视频的普及,未来可能被更完整支撑超高清视频的H.265编码所取代。因免费开源而逐渐获得欧美图书馆与档案馆认可的FFV1编码格式,可作为目前数字视频归档领域的“安卓”方案,但仍然有断供风险。而当下主流编码格式中唯一自主开发、自有专利的AV S系列编码因其使用场景的局限性,可作为档案部门重点关注和研发的潜在替代方案。总之,数字视频长期保存格式的选择应当考虑格式的开放性、标准性和稳定性,即优先考虑长期稳定发展、适用广泛的国际标准和开源标准。综上,JPEG2000、v210、H.26X、FFV1和AV S系列编码是当前技术环境下较为适合归档及符合长期保存需求的视频编码格式。

  2.2 封装格式

  数字视频的封装格式,指将视频编码数据、音频编码数据及其他相关数据打包封装所形成的文件格式,形成不同后缀名(或扩展名)的视频文件。常见的视频封装格式有MP4、Matroska、MXF等(见表4)。《电子文件归档与电子档案管理规范》(GB/T 18894—2016)要求“录像类电子文件以MPG、MP4、F LV、AV I等格式归档,视频比特率不低于8Mbps,珍贵且需永久保存的可收集、归档一套MXF格式文件”。

表4  常用视频封装格式及特性

4.JPG

  显然,随着视频分辨率的提高、编码标准的更新和技术环境的变化,之前广泛使用的MPG、F LV和AV I格式都将逐渐从主流应用场景中淘汰。其中,MPG(MPEG-1)格式主要受限于编码格式分辨率及码率对于当下超高清视频的使用限制;AV I格式虽然图像质量良好、支持跨平台使用,但缺点是占用存储空间过大、元数据功能不足,不适用于流媒体场景;F LV格式因Flash技术的衰落和HTML5技术的兴起,在新技术环境下逐渐被WebM等格式取代。其他已被淘汰的格式还有最早为移动设备开发,但分辨率支持不适用于当下环境的3GP格式;最早采用可变比特率的压缩方式,但因专利封闭而被大众抛弃的RM格式;以及作为微软专有格式,虽然对外开放但在元数据支持等性能以及编码支持更新等方面不如Matroska等开放格式,而逐渐少有人问津的WMV格式等。

  与此同时,有几种封装格式脱颖而出:(1)QuickTime(.mov)因其ProRes系列编码格式从无损压缩到低损高效压缩的多级支持,以及广泛兼容且存储灵活的元数据支持等能力,在专业视频制作领域占有了最大的使用份额。然而作为苹果公司的专有格式,其商业使用的授权费用不菲、管理成本较高,且从知识产权归属与信息安全的角度考虑,QuickTime格式不符合我国档案管理部门电子文件长期保存的可用性和安全性需求。(2)WebM作为谷歌专为现代流媒体应用设计的开放封装格式,取代F LV等格式迅速成为网页视频传播的主流格式。作为一种开源开放且广泛适用的格式,受限于为流媒体传播而设计的格式特性,其原真性不强,从电子文件真实性、完整性角度考虑不适合作为首选的数字视频归档格式。但WebM若作为原始归档视频的副本文件,不失为一种便于传播管理、维护原始视频档案完整性与安全性、降低档案管理部门存储与管理成本的封装格式选择。(3)以Matroska(.mkv)为代表的开源、开放格式快速兴起,因其强大的功能性和良好的兼容性得到了广泛使用。Matroska(.mkv)虽然支持几乎所有的编码格式,但由于其由民间开源社区自行开发,缺乏统一的国际标准,实际使用中可能存在兼容性问题与安全隐患。(4)MP4(MPEG-4 Part14)由于其广泛的设备支持与兼容性以及高效的编解码支持和多媒体元素的灵活支持能力,成为当下最主流的数字视频存储与播放格式。MP4格式技术成熟,国际标准体系完善,且相关专利建设有众多中国企业参与并在专利池中具有重要地位,信息安全有保障,对于档案管理部门来说MP4格式也是当下存储成本和管理成本最平衡、硬件支撑最完善的封装格式,满足数字视频文件长期保存的需求,适合作为当下原生数字视频的首选归档封装格式。

  2.3 视频码率

  视频码率是指视频在单位时间内传输或存储的数据量,一般以kbps(千比特每秒)或Mbps(兆比特每秒)为单位。例如,20 Mbps的码率即为每秒传输约20 Mb的数据,若视频文件时长1 min,则文件体积约为20×60/8=150 MB。一般来说,码率和图像的质量与文件自身的数据量成正比,即码率越高,画质越好,文件越大,故要选择适当的码率使文件在图像质量和存储容量之间达到平衡,既满足电子文件长期保存的原真性需求,又能控制好存储成本与管理成本。编码标准的更新主要是为了提高压缩质量和效率,实现在相同码率下传输更高质量的视频。例如,H.263编码可以2~4 Mbps的码率实现720×576分辨率的数字视频传输,H.264可以用低于2 Mbps的传输速度实现标清(1280×720)数字视频传输,H.265则可以低于1.5Mbps的码率传输全高清(1920×1080)视频,H.266可用相同码率实现超高清(3 840×2 160)视频传输,每一代H.26X编码格式都较之前提升了至少一倍的压缩效率。

  笔者根据前文关于视频编码及封装格式的讨论,选择H.264编码的MP4格式为适用于当前环境的模拟归档格式,将900 Mbps码率MXF格式的原始视频输出5种码率(30 M、20 M、15 M、10 M、5 M)的测试视频。以50 Mbps的测试视频为画质基准和PSNR参考项,计算各视频的峰值信噪比PSNR值(数值越大,图像质量越好)以及进行主观评分(0—10打分,分数越高,画质越好)和描述200%放大15  s处的画面中心细节,以比较测试码率对图像质量的影响,结果如表5所示。从测试结果来看,随着码率的降低,画面的细节和颜色都会逐渐缺失,20 Mbps及以上时无肉眼可见的变化,15 Mbps开始能发现轻微的细节缺失,码率降至10 Mbps时出现轻微的色阶断层,降至5 Mbps后画面明显模糊并伴有大量色阶断层。所以,对于当下主流的国际标准H.264编码来说,视频文件最好保持原始码率以保证图像质量与信息完整,若有必要进行压缩,码率也不宜低于15 Mbps,最好在20 Mbps及以上保证主要视频信息的完整,满足长期保存的原真性需求。

表5  MP4 H.264视频码率与图像质量测试

5.JPG

  2.4 色彩采样格式

  色彩采样格式也是关乎视频图像质量和文件存储数据量的重要参数,每个像素点采样时三个分量信号取样频率的比例就是采样格式,常用归档视频色彩采样格式分为RGB4:4:4和YUV4:4:4两大类。RGB格式以R(红色)、G(绿色)、B(蓝色)三种色彩进行分量,YUV格式以Y(亮度)、U(蓝色色度)、V(红色色度)为三种分量,数字表示三个分量的采样比例,如4:4:4意为三种分量以相等频率完全采样,是规格最高的无损采样格式。在YUV体系下还可细分为适用于数字视频的YCbCr格式和适用于模拟视频的YPbPr格式,其中Y均代表亮度分量,Cb/Pb代表蓝色色度分量,Cr/Pr代表红色色度分量。由于人眼对亮度比对色度更敏感,故在视频采样时可通过减少色度分量,在人眼不能明显察觉图像质量变化的情况下有效降低视频数据量。例如,YCbCr 4:4:4表示全像素无损采样,画质最好、数据存储量最大;YCbCr 4:2:2表示Y分量完整采样,Cb分量和Cr分量的水平采样率是Y分量的一半、垂直采样率与Y分量一致,这种方式在保持优质画面质量的同时明显减少了数据存储量,是常用的高质量视频色彩采样格式;YCbCr 4:2:0表示Y分量完整采样,Cb分量和Cr分量的水平采样率和垂直采样率均为Y分量的一半,进一步减少了数据量,是早期传统载体视频数字化时较多使用的采样格式;YCbCr 4:1:1表示Y分量完整采样,Cb分量和Cr分量的水平采样率是Y分量的1/4、垂直采样率与Y分量一致,是一种显著降低数据量的同时会导致较大色彩失真的激进方案,不太适合当下使用环境。目前来说,日常使用中较多选择RGB/YUV4:2:2或4:2:0的采样格式,4:4:4格式虽然采样最完整,但由于数据量极大,多限于专业领域使用,在档案管理中特别重要、有长期保存需求的视频文件可考虑选用,一般来说,4:2:2的采样规格足以满足视频归档和长期保存需求,是在视频档案原真性与存储管理成本间取得良好平衡的选择。

  3  格式转换实验与归档建议

  本节在前文初步探讨视频格式参数选择的基础上,梳理总结主流视频格式文件的转换通道,并通过视频转换实际测试,进一步展示编码格式、封装格式、视频码率和色彩采样格式的参数选择对视频文件的影响,以给出适用于当下国内技术环境的原生数字视频文件归档和长期保存的技术参数建议。

  3.1 视频格式转换通道

  常用视频转换方式主要分为在线工具和本地软件两大类,其中在线转换工具操作简便,对平台和使用者的设备性能没有要求,但受限于网络传输及服务提供者的服务器性能,一般会有文件大小和数量的限制。而本地软件又分为免费开源的FFmpeg、HandBrake等转换工具和Adobe Media Encoder、格式工厂等商业软件。其中,FFmpeg是平台最全面的视频转换工具,包括格式工厂的视频转换功能以及R语言、Python等编程语言中的视频格式转换包都是以FFmpeg为内核。部分专业视频制作领域的专有格式(如ProRes等)需要使用MediaEncoder、Davinci等商业软件或安装插件进行转换。本文选取6种常用转换工具,对其优缺点进行梳理(见表6),并对MXF、MP4、WebM格式的转换利用设计了转换通道(见图1、图2、图3)。

表6  常用视频格式转换工具

6.JPG

7.JPG

图1  常见格式转换为MP4格式的转换通道

8.JPG

图2  常见格式转换为MXF格式的转换通道

9.jpg

图3  常见格式转换为WebM格式的转换通道

  3.2 视频格式转换实验

  基于上述梳理,本文选取最新版本的格式工厂(v5.17,视频转换功能基于FFmpeg4.4)和Adobe Media Encoder(v24.3)进行视频格式转换实验,将时长1 min、分辨率3  840×2  160、帧率59.94帧、码率36.52 Mbps、10 bit4:2:2采样、H.264编码的QuickTime(.mov)封装原始视频,转换为其他常用编码和封装格式,尽可能保持分辨率、帧率和色彩采样格式不变,其他参数以默认编码方式转换,结果如表7和表8所示。

表7  常用视频封装格式H.26X编码转换测试

10.jpg

表8  其他常用视频格式转换测试

11.jpg

  通过表7和表8可以看出:(1)四种不同封装格式(MOV、MP4、MKV、AV I)在相同编码格式(H.264、H.265)下的转换结果是相同的,画质均无肉眼可见的变化且同一编码方式下的码率变化相同。即对于主流格式来说,视频的转换结果和图像质量主要取决于编码格式,与封装格式关系不大,此外,实验结果验证了H.265编码相较于H.264编码提升了接近一倍的压缩效率。(2)WebM格式以原视频1/3的码率实现超清视频传输,而转换为F LV格式的过程中,在码率基本不变的情况下丢失了大量视频信息,侧面证明了当前流媒体环境下WebM格式取代F LV格式的必然性。(3)转换结果验证了WMV、MPG、3GP等格式不适用于当下环境,现存的过时格式视频档案文件需及时进行文件迁移与格式更新。(4)Matroska(.mkv)封装格式使用国际标准的H.264、H.265编码时转换结果与MP4等封装格式相同,而使用FFV1编码时数据量陡增,可见FFV1编码虽然可以实现无损压缩,但其压缩率较低,且FFV1编码的转换只能使用FFmpeg工具实现,存在操作门槛高且不符合国内档案管理部门电子文件长期保存的需求。(5)MXF OP1a格式作为SMPTE制定的影视行业专业格式,虽然理论上有着最高的视频规格,可以保存最完整的视频信息与元数据信息,拥有良好的扩展性和容错性,但相应地也有着巨大的数据量。转换实验中在视频有效信息不变的情况下,JPEG 2000(YUV4:4:410 bit)编码的MXF OP1a格式文件存储容量增加了近97倍,JPEG 2000(YUV 4:2:2 10 bit)编码的MXF OP1a格式文件存储容量增加了77倍,可见无损MXF格式会给档案部门带来巨大的存储压力和文件访问难度。(6)通 过MXF文件的转换测试也可以看到,在其他参数相同的情况下,4:4:4采样规格的文件数据量比4:2:2采样规格多出约25%,而图像质量没有肉眼可见的变化,可见对于普通视频档案文件来说,4:2:2的色彩采样格式是足够使用的,不是必须使用4:4:4的采样规格,徒增档案部门的压力与成本。

  3.3 数字视频归档格式建议

  综上所述,针对我国当下的技术与使用环境,结合档案部门存力水平与长期保存需求考虑,v210或JPEG  2000编码的MXF封装格式文件搭配20 Mbps及以上码率的H.264、H.265编码MP4封装格式是适合我国当下原生数字视频文件归档的格式,大部分情况下色彩采样格式使用YUV  4:2:2足矣。选择的封装、编码格式均为稳定发展、技术成熟、国际标准体系完备、符合我国档案部门电子文件长期保存需求的格式,选择的码率与采样参数是在当下技术环境下既能满足我国档案管理部门电子文件原真性需求并可在存储、管理成本等方面取得平衡的参数。值得注意的是,所选格式均为国外企业、协会发起制定,我国企业、协会深度参与并建立了一定专利“护城河”,但并不具有完全知识产权的格式。从国家数据安全角度考虑,档案管理部门可重点关注、参与推广研发我国具备自主知识产权的AV S格式,以实现原生数字视频归档与长期保存的自主可控。

  具体建议如下:v210无压缩编码或JPEG  2000无损压缩编码的MXF OP1a格式是长期存储重要视频文件、保障视频画面质量与信息完整的首选格式,色彩采样格式可以选用YUV4:2:2,若地方档案管理部门存力水平较高、预算充足可考虑使用YUV4:4:4规格存储最完整的信息。结合数字档案文件长期存储需求与未来技术发展(编码格式更新以及封装格式更新等),对于精品视频档案和比较重要的视频档案,可以在保存视频信息最完整的无损压缩或无压缩MXF格式文件之外,同时保存H.265、H.264编码的MP4文件,以便于文件的预览与预处理,并保证原始MXF文件的完整性与安全性。对于其他视频档案,也可以在原始存储文件之外,生成WebM(AV 1)等小体积、适用于网络传播等流媒体环境的预览文件,以便于网络发布和数据库管理等,保障原始视频档案文件的完整性与安全性。适合我国当下技术环境与档案部门长期保存需求的原生数字视频文件归档格式与参数建议如表9所示,期望能为声像档案管理制度与工作规范的细则制定以及数字文件长期保存的标准制定提供参考。

表9  原生数字视频文件归档格式建议

12.jpg

  参考文献

  [1]新华网.《中国视频社会化趋势报告》发布[EB/OL].(2020-11-25)[2024-05-25].https://baijiahao.baidu.com/s?id=1684329421775627013&wfr=spider&for=pc.

  [2]中国互联网络信息中心. 第53次中国互联网络发展状况统计报告[R/OL].(2024-03-22)[2024-05-25].https://www.cnnic.cn/n4/2024/0322/c88-10964.html.

  [3] RIVERS J,THOMAS I,WALTON T. Developing standards and practices for archiving multimedia material[EB/OL].[2024-05-25].http://nia.ecsu.edu/ur/0607/teams/mmt/0607mmt_paper.pdf.

  [4] WACTLAR H D,CHRISTEL M G. Digital video archives: managing through metadata[J].Building a National Strategy  for Digital Preservation:Issues in Digital Media Archiving,2002(84):99.

  [5] WANG H A,CHEN G C,CHIU C Y,et al.A case study of technologies for a digital video archive system[C]//ICDAT.2005:101-114.

  [6]张照余.视频档案数字化:原理、设备与步骤[J].山西档案,2008(5):17-20.

  [7]霍妍琳,徐敏.国内外视频档案数字化的技术现状分析[J].北京档案,2011(4):49-50.

  [8]庞莉,赵豪迈.基于数字信息长期保存的音频、视频档案数字化研究[J].城建档案,2011(4):50-51.

  [9] WITTENBURG P,DIRKSMEYER R,BRUGMAN H,et al.Digital formats for images,audio and video[J].Language Archive Newsletter,2004(1):3-6.

  [10] PEARSON G,GILL M.An evaluation of Motion JPEG 2000 for video archiving[C]//IS&TArchiving Conference,April 26-29,2005,AlexandriaV A,US.WashingtonD C:IS&T,2005,2:237-243.

  [11]项文新,张照余.视频电子文件的归档格式研究[J]. 档案学研究,2006(4):52-56.

  [12]张晶晶.数字档案存储介质及格式研究[D].苏州:苏州大学,2009.

  [13]杨中营. 音像档案数字化浅析[J]. 北京档案,2013(7): 20-22.

  [14]王淑霞,边树芳. 高清视频档案保存格式标准研究[J].中国档案,2016(4):60-61.

  [15]屈洁莹.数字视频类电子文件存档格式探究[J].档案与建设,2017(1):33-38.

  [16] 高婷.电子文件长期保存格式标准研究[D].武汉:武汉大学,2020.

  [17] KROMER R.Matroska and FFV1:one file format for film and video archiving?[J].Journal of Film Preservation, 2017(96):41.

  [18]中国国家标准化管理委员会.电子文件归档与电子档案管理规范:GB/T 18894—2016[S/OL].[2024-05-25].https://www.cmu.edu.cn/dag/info/1884/4547.htm.

  [19]中华人民共和国国家档案局.录音录像档案数字化规范:DA/T 62—2017[S/OL].[2024-05-25].http://www.saacedu.org.cn/war/xiangxi.html?id=108.

  [20]中华人民共和国国家档案局.录音录像档案管理规范:DA/T 78—2019[S/OL].[2024-05-25].https://www.saac.gov.cn/daj/hybz/201912/5b3adc136d6c4428bca60517658ac8e9.shtml.

  [21]中华人民共和国国家档案局.公务电子邮件归档管理规则:DA/T 32—2021[S/OL].[2024-05-25].https://www.saac.gov.cn/daj/hybz/202109/8b71a80d44e546b1b480665350b1b139.shtml.

  [22]中华人民共和国国家档案局.实物档案数字化规范:DA/T 89—2022[S/OL].[2024-05-25].https://www.saac.gov.cn/daj/hybz/202206/9976d259ad074216bd11356535951f88.shtml.

  [23]中华人民共和国国家档案局.数字档案室建设指南[EB/OL].(2021-02-19)[2024-06-01].http://www.dajs.gov.cn/art/2021/2/19/art_57_9061.html.

  [24]苏州市档案局.关于印发《苏州市档案数字化操作规程》的通知[EB/OL].(2018-06-25)[2024-06-01].http://www.daj.suzhou.gov.cn/detail/78703.html.

  [25]田丽君,付希金, 王钰.高校声像档案管理现状与对策思考[J].兰台世界,2022(4):76-78.

  [26]龙芊良.高校声像档案数字化建设的问题与思考:以北京大学为例[J].北京档案, 2020(12):38-40.

  [27]付婧娇. 高校声像档案管理与利用现状及发展策略[J]. 办公室业务,2023(9):164-166.

  [28] FADGI.Creating and archiving born digital video[EB/OL].[2024-05-27].https://www.digitizationguidelines.gov/guidelines/video_bornDigital.html.

  [29] LAC.Guidlines on file formats for transferring information resources of enduring value[EB/OL].[2024-05-27].https://library-archives.canada.ca/eng/services/government-canada/information-disposition/managing-government-records/guidelines-information-management/Pages/guidelines-file-formats-enduring-value.aspx.

  [30] IASA.IASA-TC 06guidelines for the preservation of video recordings[EB/OL].[2024-05-27].https://www.iasa-web.org/tc06/guidelines-preservation-video-recordings.

  [31] LOC.Recommended formats statement[EB/OL].[2024-05-27].https://www.loc.gov/preservation/resources/rfs/moving.html#digital.

  [32]黄玉明.电子文件存档格式需求分析与战略研究[J]. 档案学通讯,2010(2):63-66.

  【基金项目】国家社会科学基金一般项目“电子档案‘单套制’管理施行条件与技术研究”(项目编号:21BTQ091)。

  【作者简介】王晨昊(1994—),男,汉族,江苏苏州人,苏州大学社会学院硕士在读,研究方向:档案信息化;通讯作者:丁家友(1986—),男,汉族,河南信阳人,苏州大学社会学院副研究员,博士,研究方向:档案数据保全、档案内容挖掘与编研等;张照余(1963—),男,汉族,江苏无锡人,苏州大学社会学院教授、苏大苏航档案数据保全研究中心负责人,博士,研究方向:电子文件管理、档案信息化。