发布时间:2025-01-09 17:24:31被阅览数:40 次信息来源:中国档案报 作者:赵彦昌
《非结构化电子文件管理研究》封面
《非结构化电子文件管理研究》一书由辽宁大学信息资源管理学院王志宇教授等著,是其主持的2016年国家社科基金项目“非结构化电子文件管理研究”结题成果。该书以电子文件管理工作中经常遇到的难题——非结构化电子文件的管理作为研究对象,力图从多个实际工作的场景出发,对该问题提出技术性解决方案,是一部电子文件管理理论和实践相结合的高水平学术著作。
主要内容
该书共8章23万字,内容全面而深入,从非结构化电子文件的形成、来源、移交、接收,到OS文件系统、电子文件管理系统、语义网和大数据等不同环境下的存储管理,再到基于社交媒体文件的归档体系,均进行了详尽阐述,为读者提供了丰富的理论和实践指导。
该书以电子文件管理理论方法和信息技术相关实践的应用为指导。主要针对非结构化电子文件数据数量庞大、格式多样和难以统一管理标准的特点,分析不同类型非结构化数据的存储原理和成因,并从档案学的角度提出了多种解决方案,创新了技术路线。特别是在大数据环境下,如何有效管理海量的非结构化电子文件,是该书的一个重要关注点。因此,结合电子文件管理现状,主要进行了以下几个方面研究。
一是分析了非结构化电子文件的来源与存储原理。针对非结构化电子文件海量、异构、格式多样、标准多样和对系统依赖性高的特点,指出非结构化电子文件管理中存在数据之间不兼容、数据真实性和安全性难保障、元数据管理研究滞后、电子文件之间联系性弱等问题和难点。
二是基于我国档案移交与接收的相关法律法规,结合沈阳市档案馆的管理实践,对非结构化电子文件的移交与接收工作进行了具体论述,指出了在非结构化电子文件的移交和接收过程中存在的问题,并针对相应问题提出合理建议和措施。
三是从OS文件系统和电子文件管理系统两个角度出发,论述了非结构化电子文件管理的虚拟文件夹技术、桌面搜索技术以及电子邮件归档技术、介质服务器存储技术,并对不同的存储与检索方法优缺点进行比较。
四是论述了语义网环境下非结构化电子文件的关联与元数据管理。具体分析了非结构化电子文件在语义化层面上关联的必要性、可行性及其实现机制,并提出基于XML技术的半结构化管理实现方案,以及语义网环境下非结构化电子文件管理技术路线和应用。
五是论述了大数据环境下非结构化电子文件的存储与检索。从大数据技术层面出发,分别介绍了基于大数据环境下的对象存储技术、分布式文件系统和NoSQL数据库技术的非结构化电子文件存储与检索方法,并将其优缺点进行了比较,阐述了相应的应用案例,指出了大数据环境下非结构化电子文件管理面临的挑战。
鲜明特色
针对目前我国非结构化电子文件存储管理中存在的问题及其自身特点,该书提出了一系列相应创新性的解决方案。在对实际情况的调研基础上,综合考虑了非结构化电子文件存储管理的要求和技术实现条件,旨在为非结构化电子文件存储管理提供科学参考。
跨学科知识融合。注重跨学科理论和技术融合,研究内容融合了档案学、信息科学和计算机科学等相关理论和方法,展现了一个跨学科的研究新视角,有助于全面分析电子文件存储管理的原理和优势。
丰富的案例分析和实证研究。书中分析了大量案例和实验数据,并对提出的解决方案进行了验证。案例来自不同行业、不同规模的企事业单位,具有代表性和参考价值。通过案例分析,读者可以具体了解到非结构化电子文件管理的实际应用效果。此外,为直观展示基于非关系型数据库电子文件存储的原理和方法,书中呈现了大量图表、流程图等,增强了可读性和指导性,也为我国非结构化电子文件存储管理的实践应用提供了重要参考价值。
全面的研究视角。该书从多个角度对非结构化电子文件管理进行了研究。包括理论框架、技术实现和实践应用等,提供了全面的视角。
学术贡献
该书通过实验论证和分析国内外实践案例,证明了基于NoSQL数据库电子文件存储管理的优势和方法,为电子文件存储和管理方法的变革提供了参考依据。与传统电子文件存储方式相比,该数据库能够通过分布式架构、高扩展性和高效的数据处理能力,有效解决当前海量电子文件存储量有限和检索低效等问题,能更灵活存储管理文档、图像、音频和视频等多模态电子文件。数据库的分布式存储架构也促进了不同地区电子文件的共享与相关单位的协作交流。其高可靠性也为非结构化电子文件存储安全提供了保障。该书立足国内电子文件工作发展特点,以智能化知识挖掘和管理为目标,探寻在大数据环境下采用新型技术手段对海量非结构化电子文件管理的新方法。
有助于跨学科跨领域融合。该书融合了档案学、信息科学、计算机科学等多个学科的理论和方法,展现了跨学科的广度和深度。探寻非结构化电子文件存储的应用实践,不仅推动了档案学领域的发展,为电子档案的高效利用和研究提供了技术支持,也为数据科学等跨学科的融合提供了可能。此外,该种融合有助于促进学术研究方法和技术的创新,进一步推动学术研究发展。
有助于非关系型数据库存储管理实践应用的推广。目前,国内NoSQL数据库等电子文件存储技术主要应用于大型企业中。而档案部门由于安全、技术条件等诸多因素,在非关系型数据库的电子文件存储方面尚停留在基于相关规则发布的实践探索层面,而该书为我国档案部门的文档型非关系型数据库存储管理提供了有力的技术理论支持。
丰富了电子文件存储的理论体系。目前,我国非结构化电子文件存储方面的研究尚处于发展阶段,学术理论和实践依然较少。该书有助于丰富非结构化电子文件存储管理的理论体系,指导电子文件存储的实践应用工作,促进档案学科的发展。
对未来电子文件存储管理发展趋势预测。随着人工智能、大数据等前沿技术和档案事业的不断发展,档案数字化和智能化研究不断深入,信息技术不断融入档案管理系统中。未来的档案管理会更加注重实现电子文件的海量存储和高效利用。因此,该书能够为我国当下和未来电子文件存储和管理实践发展中遇到的问题进行指导和展望,为档案事业发展的决策和规划提供重要参考。
总体来看,该书进一步开拓了国内电子文件管理研究的相关领域和增长点。我国传统档案学界对电子文件管理的相关理论和技术的研究已经长达20余年。在新理念、新思维、新技术的引导下,以智能化知识挖掘和管理为目标,电子文件管理研究正在进入全新的阶段和领域。书中以非结构化电子文件为切入点,开拓和探寻新环境下电子文件管理研究的进化和增长点,对档案学新问题研究提供理论支撑和技术支持。在大数据的浪潮推动下,海量非结构化电子文件管理已成为档案工作者不得不面对的问题。正是为了应对这一挑战,书中提供了一套系统、全面、深入的管理理论和实践指南。随着时代的发展和技术的不断进步,非结构化电子文件管理将面临更多机遇和挑战。相信该书可为相关研究和实践提供有力支持。
原载于《中国档案报》2025年1月9日 总第4236期 第四版