基于IPFS与区块链技术的企业电子档案可信管理研究

发布时间:2024-09-05 19:04:43被阅览数:70 次信息来源:​中国档案报  作者:王 吟 王 智 孟嘉琦 王德政 曾 鸣

  在数字技术飞速发展的今天,电子文件已逐渐成为主要的文件材料类型,社会各界也愈发将目光聚焦于电子档案管理。然而,电子文件存在易更改性和软硬件依赖性,使得其真实性、完整性、凭证性遭受颇多质疑,被认为存在不可信风险。比较常见的观点是:电子档案是一串依附于介质存储的虚拟数据,其本质是比特字节,因此与传统纸质档案相比,在存储、传输等过程中存在更高被篡改的风险。实践中,多数机构采用给电子文件添加数字签名、电子签章等方式加强可信保障。问题在于,这些技术固然可以提供可信验证,但在电子档案被篡改或破坏后无法追回原文件。

  为解决上述电子档案可信管理的痛点问题,在风险发生时能够对电子档案进行验证并确保原文件的保全和恢复,2021年,中兴通讯股份有限公司申报了“基于IPFS与区块链技术的企业电子档案可信管理研究”国家档案局科技项目,并获准立项。经系统研究,形成了可靠的项目成果,于2023年顺利结项。项目采用将档案著录项信息存储在区块链、档案原文内容存储在IPFS的方式,建立附属于档案管理系统的电子凭证系统,从而实现企业电子档案的可信管理。

  一、国内外研究现状

  国外早期有关电子文件可信方面的研究更多停留在理论层面,文件管理国际标准ISO 15489《信息与文献—文件管理》认为,真实、可靠、完整、可用是电子文件符合可信标准的几个重要特征。基于该标准,国外开展了一系列有关电子文件可信方向的研究和项目,如InterPARES(电子系统中文件真实性永久保障国际合作研究项目)等。

  由于数字技术快速发展,相关研究逐渐转向技术在行业中的应用。如,墨尔本大学将区块链技术应用于在校生学籍档案的管理,萨里大学牵头开展有关区块链在文献保护领域的应用研究,还有的研究团队将IPFS与Ethereum区块链两种技术进行集成,利用IPFS的分布式存储和区块链的不可逆特性,尝试构建保障数据安全和处理速度且用户友好的数据共享平台。

  国内相关研究起步较晚。2014年,辽宁省档案学会举办了主题为“时间戳技术在电子档案管理中的应用”专题研讨会。此后,随着区块链等相关技术的日渐成熟,越来越多的学者开始研究如何将区块链等相关技术应用于档案保管和利用领域,取得了多样化的丰厚成果。从真实性保障的角度出发,中国人民大学信息资源管理学院院长、教授刘越男探究和分析了不同场景下、不同存储对象下,区块链技术的应用可能性,并给出了后续研究的方向和建议。武汉大学信息管理学院教授王平等学者借助区块链技术,构建起集文档数据、供需管理、区块链于一体的电子文件可信管理保护框架,为电子文件可信管理提供了可参考的框架支持。中石化搭建了企业档案私有区块链,对企业电子档案进行存证,并提供对外验证服务,为电子档案可信管理系统的构建提供了实践参考。

  二、电子档案可信管理的必要性

  随着互联网技术发展,企业生产经营越来越离不开电子文件的使用与流转。建设电子档案可信管理系统是档案数字化转型的题中之义。但当前,想要实现完全的单套管理仍面临很多困难,如失存、失读、失信、失密等。如何保障电子档案的真实、完整、可用是当前急需解决的问题。

  (一)档案数字化推进的重要前提

  各行各业数字化进程快速推进,电子文件为人们生产生活、日常利用提供了极大便利,所占比重不断增大,成为档案管理的主要形式。传统的纸质档案管理方法需要在文件材料收集整理归档中投入大量人、财、物等资源,且后续借阅利用效率较低。推动企业电子档案规范化建设,建立可信任的电子档案管理流程,维护良好的电子档案体系运行秩序,是企业档案数字化发展的必要前提,体现了大数据时代企业对档案管理的客观需求。

  (二)电子档案真实性的重要保证

  电子档案可信管理是保证电子档案真实可用的必要前提。原始记录性是档案的特有属性,是其可以作为法律证据的必要条件。缺乏原始记录性或真实性无法证实,会使档案的证据价值大打折扣。电子信息本身具有极高的易变性,不论是文档创建者还是计算机病毒或黑客都可以修改或毁坏电子文件,而这种篡改有时甚至无痕,给电子档案的安全保管带来极大挑战。因此,通过高新技术手段加强对电子档案的管理,让其始终保持形成时的最原始状态,是可信管理研究下保证电子档案真实性的重要内涵。

  三、电子档案可信管理的可行性

  (一)政策基础

  新修订的档案法明确规定,电子档案应当来源可靠、程序规范、要素合规,与传统载体档案具有同等效力,可以以电子形式作为凭证使用。这一规定确认了电子档案的法律地位,认定了电子档案的凭证效用。《财政部 国家档案局关于规范电子会计凭证报销入账归档的通知》提出,符合档案管理要求的电子会计档案与纸质档案具有同等法律效力。除法律、行政法规另有规定外,电子会计档案可不再另以纸质形式保存。《电子文件归档和电子档案管理规范》也对电子档案安全管理作出规范,要求确保数据安全。多条法律法规及管理规范明确了电子档案的法律地位,为推动电子档案可信管理奠定了政策基础。

  (二)技术基础

  区块链与IPFS等技术高速发展为可信管理提供了技术基础。区块链技术通过将点到点网络传输、分布式数据存储、分布式多方共识、非对称加密、哈希函数、默克尔树、智能合约等多种技术要素进行有机组合,允许在由多个不同主体的网络参与者构成的分布式网络中,对数据和交易进行可靠记录、同步、共享、验证。IPFS技术使用分布式哈希表实现文件永久的、去中心化的保存和共享,提供了更加安全、高性价比、可快速集成的存储解决方案。

  (三)人员基础

  数字化为企业档案利用提供了便捷通道,让员工可以更快速、更准确地找到所需档案,提升入库档案的可见性和利用率。对档案管理人员来说,新兴信息技术可以为档案保管和利用提供更加高效且安全的管理措施,最大限度地发挥其价值。近年来,企业档案管理人员积极利用数字水印、同态加密、区块链加密、分布式存储等技术,不断推动档案安全、高效利用,为企业内部开展电子档案可信管理提供有力行动支持。

  四、基于IPFS与区块链技术构建可信档案管理方案

  中兴通讯股份有限公司档案部门在充分分析电子档案可信管理的必要性和可行性后,提出了基于IPFS与区块链技术的电子档案可信管理方案,搭建了一套可信档案管理系统,有效保障企业档案安全。课题通过国家档案局科技项目验收,获得了专家组的高度评价。

  (一)总体方案

  系统总体采用去中心化的分布式存储技术,将区块链和IPFS技术相结合,通过区块链网络+IPFS网络,以双网协作的方式弥补了区块链网络存储容量受限的不足,并实现了链上链下协同。

  具体如下:将归档内容拆分为归档关键信息和归档文件两个部分,后者存储在IPFS网络,前者通过智能合约存储在区块链网络上,通过对IPFS存储文件的哈希连接完成上链,再由区块链向归档用户颁发可验证的电子凭证,并支持使用哈希值来验证档案原文的真实性,实现归档文件的可信、可验、可追溯。

  利用区块链的共识机制和IPFS的碎片化存储机制,可以保证链上的内容不被篡改,确保原始文件安全可信。当发现档案系统内的文件被篡改或因不可抗力因素导致损毁、破坏时,可利用IPFS基于内容寻址的特性,根据哈希值去寻找原始文件,进行数据解密与文件恢复,将原始文件还原至档案管理系统。

  (二)架构设计

  可信档案管理系统基于公司OTCP+CPaaS平台构建。如果采用集中部署方式,在无线联通5G共享共建的市场场景中则面临与其他产品无法共部署的问题,导致平台的核心能力(如存证、确权、可信共享等)无法为公司其他产品赋能。分布式可以很好满足无线网管共部署的需求,并结合云底座的轻量化、多场景交付形态的特性,由ZBaaS平台针对无线场景打造分层、分级多种场景的部署形态,能够满足5G共享共建小、中、大等各种规模组网要求,利用自身的特色业务为其他产品提供存证、确权、共享等可信赋能。系统部署两套集群,保障异地容灾。平台具有可扩展性,能够提供通用接口平台,可支持新增节点加入,供其他系统开发应用,并易于扩容。

  区块链和IPFS均具备准入控制与身份认证功能,需使用公司统一认证登录,并需要申请防火墙权限方能进入系统,具有一定的隐私保护能力。

  (三)创新点

  可信档案管理系统创新实现了区块链和IPFS两种技术优势的结合。将之应用于电子档案管理场景,成功打造了集档案存证、查证、验证、恢复为一体的平台,构建了可追溯、可信任、可恢复电子档案的完整证据链,保障档案真实可信及安全的同时,有效降低了存储成本,提高了利用效率。

  1.构建完善的档案存证平台,保障档案真实可信

  可信档案管理系统构建了完整的档案存证体系,包括归档上链、档案查证、存证验证、文件恢复等功能,实现了档案安全全流程保障。在此基础上,保存上链、验证及恢复记录,保证全部操作记录可追溯。建立文件恢复机制,保障本地档案被篡改后可恢复,弥补了区块链只能验证是否被篡改,无法找回真实文件的不足。

  该平台的建设,提高了电子档案管理效率,降低了成本,解决了电子档案真实性管理长期性受限、安全性难以保证的痛点问题,增强了用户对电子档案的信任,确保公司的电子档案得到长期安全保存。

  2.分布式存储与文档加密,保障档案安全

  IPFS自身机制特点保证档案信息安全。其作为去中心化的分布式系统,是一个由多个节点组成的对等网络,与区块链有相同的组网方式,支持私钥加密,保证了各节点的私密性。

  在IPFS中,每个文件均会根据文件内容计算出一个哈希值,作为文件的身份特征。文件将会经过碎片化处理,并将碎片存储在对应的哈希值的存储单元内,客户端通过查询哈希值利用哈希树找到对应的文件。假如文件内容被恶意篡改,哈希值一定会发生变化,当用户试图恶意修改内容时,系统会因为保存后计算的哈希值与存储单元的哈希值不同而拒绝修改,从而保证IPFS存储文件的不可篡改。

  3.IPFS与区块链协同运行,降低档案存储成本

  利用IPFS降低存储、带宽成本的优势,解决了区块链在实际的应用场景中长期性受限、存储效率低、成本高的缺点。现阶段大部分企业只利用区块链存储哈希值,而实际需要存放的业务数据及电子档案仍然用常规的存放方式存储在数据库中。这种数据存储方式并不能解决中心化存储带来的弊端。IPFS针对这一问题提供了另一种解决方法:使用IPFS存储业务数据和档案原文,将区块链数据与IPFS关联,并将关联信息保存在区块链中。

  这种IPFS与区块链协同工作的方式解决了区块链作为分布式账本,自身存储效率低、成本高的瓶颈,使得区块链在档案领域的应用场景更为广泛。此外,IPFS提供点对点内容分发网络,对于内容完全相同的文件,即同一哈希值的文件只会存储一次,节约了存储资源,降低了存储成本,为电子档案保存提供了一个高性能的集群化存储方案。

  五、展望

  可信档案管理系统解决了区块链由于自身大小的限制,无法存储档案原文件、只能验证无法找回的弊端,使整个档案凭证的作用机制更加完善,实现了档案真实性查证、验证与文件恢复的全流程管理,大大增强了用户信任度。通过哈希值建立区块链和IPFS存储的关联,首次结合了IPFS和区块链技术,实现了具有电子档案真实性查证验证与数据恢复功能的管理平台搭建,促进了区块链与IPFS相关科研成果的落地投产,是一次较为成功的应用示范探索,某种程度上为业内其他企业提供了思路借鉴和实践方向。

  目前研究成果在公司内部推广使用,保障了公司电子档案安全,提高了各业务单位对档案管理的信任度,应用效果理想,搭建的区块链平台可提供通用的接口、统一的服务,具有很强的泛用性和较高的推广价值。

  未来,将逐步推广可信档案管理系统在更为广泛的领域中应用。如,接入联盟链,与监管机构建立联系,建设完整的可信体系。聚焦IPFS存储在档案领域的多元化利用,利用IPFS长期、不可篡改的特性,将长期保存与区块链、IPFS技术结合,在IPFS平台实现电子档案长期保存与定期巡检。

  (作者单位:中兴通讯股份有限公司)

  原载于《中国档案报》2024年9月5日 总第4184期  第四版