发布时间:2025-03-13 08:04:38被阅览数:108 次信息来源:《中国档案》
作者:柴晓燕徐菲
2022年,中国航空工业集团公司申请国家档案局企业集团数字档案馆(室)建设试点并通过评审,同年集团公司确定70多家试点单位,试点单位同步编制工作方案并完成评审及备案,中国航空工业集团第一飞机设计研究院(以下简称“一飞院”)是试点单位之一。试点工作启动后,一飞院迅速成立以院领导为组长的建设团队,编制企业集团数字档案馆实施方案,在单位内组织专家通过实施方案评审后,投入建设经费。一飞院新建了档案数据管理系统和档案智能平台,升级了档案工作硬件设备,改善了档案保管环境,整体提升了档案工作智能化水平。2023年11月,集团公司组织专家对一飞院数字档案馆建设试点工作进行了验收,单位高分通过测评及验收。
重造业务流程,提升档案数据管理能力
在试点工作中,为使档案业务深度融入飞机研制流程,档案人员运用电子文件全生命周期理论优化电子文件审签归档流程,开发档案数据管理系统与业务系统的接口并进行集成,提高结构化数据的归档效率。设计档案部门与业务部门点对点的自动化归档工作流程,加强非结构化数据的协同管理,形成了电子档案线上审签、归档、发放及利用的管理模式。一飞院档案部门经过三年的研究及实践应用,在试点工作中已经完成飞机三维模型的归档管理工作。一飞院成立由档案部门与信息化部门业务骨干组成的项目小组进行专项攻关,小组人员用时一年完成了多轮方案迭代后确定项目实施内容、路径和策略,编制了一飞院三维模型归档管理规范,经过两年的设计验证完成了整个项目的评审验收。档案数据管理系统遵循飞机产品结构树关系,自动解析飞机BOM结构树、模型及其关联关系,实时同步飞机产品数据管理系统的数据,实现对产品动态BOM树、飞机批架次及产品标准件的管理。归档的三维模型不依赖原设计环境,可以在线浏览,同时也符合电子档案“四性”检测要求及涉密信息安全保密要求。三维模型归档管理工作的研究成果可以为航空行业相应规范的制定提供借鉴。
统一数据架构,实现档案自动化标引
在建设档案数据管理系统时,档案人员梳理出各类归档数据的元数据信息表,制定统一的元数据描述规范和标准,统一系统的底层数据架构。通过与各业务系统的集成,档案数据管理系统接收了单位内部结构化、半结构化及非结构化档案数据,同时运用RDF资源描述框架,档案人员在系统中建立了各类型档案数据的要素关联关系,形成一飞院的档案“数据湖”。
在档案数据管理系统中,一飞院档案部门设计开发了档案数据智能管理模块。档案人员运用智能采集及自动分类工具,对飞行记录、维修记录、员工训练记录和其他与飞行安全相关的文档进行智能分类,建立索引,将所有的文档转换为可以被机器阅读和处理的格式后进行模型训练。
以归档的飞行日志数据举例。在飞行日志的数据库中,包含各种关于飞行的详细信息,如起飞时间、降落时间、飞行时长、飞行路线、天气条件、机组人员信息、飞机的机械状态等。首先,档案人员将数据从数据库中导出,转换为可以被算法处理的CSV格式的文件,每一条记录对应一次飞行过程,每一个属性对应一个飞行特征。其次,利用自然语言处理(NLP)工具对数据内容进行智能分析,从文档中提取关键词、主题等,对模型进行训练。例如文件中提到的“引擎故障”,就可以被定义属于“机械故障”类别。最后,将训练好的模型应用于所有数据进行自动分类和建立索引。模型可以自动将未标记的档案数据分类到前期训练数据预定义的属性类别中,模型也可以用于自动为档案数据添加索引信息,以便更容易进行检索和浏览。目前档案人员还在对系统中海量归档数据用模型进行训练,通过不断调整优化模型参数来改善机器学习的性能和效果,得到更加准确的数据标签,提高数据智能化标注水平。
关注用户需求,促进档案数据共享利用
一飞院档案部门在档案数据管理系统中设计开发了档案共享利用模块。档案人员组织开展网络问卷调查,收集用户的差异化需求,在方案设计中对档案利用业务环节逐步分解,确定每个步骤的数据分析焦点,开展对数据的分析,不断优化分析流程。此模块建设的目的就是利用模型预测与趋势分析工具对分类好的档案数据进行飞机维护需求的分析,以及预测飞机的潜在故障。
具体做法是档案人员在档案元数据基础上构造出新的数据特征。对于分类特征,因为一般是文本形式,因此需要档案人员将其转换为机器学习算法处理的数值形式,对于数值特征则将其标准化,转换为均值为0、标准差为1的形式。例如档案人员构造出飞机累计飞行小时数、飞机部件更换周期、飞机累积起降次数、飞机最近一次维护后的飞行小时数、飞行环境因子5个新特征,将这5个新特征与档案数据原始特征合并,生成新的完整数据集,这个数据集就是档案人员进行模型训练和测试的最终分析数据集,然后通过对大模型不断的训练及调整优化,来提高故障预测模型的准确性。
档案部门联合飞机外场部门成立专项小组,经过一年半的时间,通过对模型不断调试训练,利用飞机的飞行数据和维护数据预测出外场飞机的潜在故障,根据对潜在故障的跟踪观察,模型预测正确率达到50%~60%之间,对外场保障人员编制飞机维护计划具有一定参考价值。同时对于预测出的故障率高的配套产品,外场保障人员就可以提前计划高故障率备件的订购时间和数量,减少因为故障件返修时间长而造成的飞机停飞,同时可以对库存备件的数量进行管理,控制库存成本。
编制数据规范,创新档案编研工作模式
一飞院档案部门组织人员梳理形成与集团公司有关的业务数据清单,按照集团公司下发的数据格式规范,确保档案数据管理系统可以自动检测一飞院归档数据的格式及质量。通过集团公司档案管理系统的型号进馆模块,档案人员对系统中的档案数据进行验证、封装后上报给集团公司,最终实现与集团公司档案管理系统互联互通。为提高用户查询档案的精准率和有效性,一飞院新建了档案智能平台,利用新一代信息技术来发挥档案数据的“参谋”作用。平台可以对用户的行为习惯进行判断,从大量的档案数据中提取有用信息,自动生成一些经过初步加工的信息,为用户进行个性化的推荐。
档案人员通过分析飞机的运行数据、维护历史和飞行器技术发展趋势,利用大模型识别出飞机关键、重要的部件及机载软件是需要进行更换还是升级换代,基于此预测出飞机作战性能改进空间的大小和飞机研制成本增减的合理性,自动形成特定类型飞机的升级改进方案,这对一飞院开展型号立项论证有很大的参考价值。通过这些应用场景,档案智能平台不但能够提高单位的管理运营效率,还能够增强设计团队进行飞机选型的信心,为型号研制提供参考。
拓宽宣传途径,举办档案资源虚拟展览
一飞院档案部门精心组织了跨学科的项目团队开展档案虚拟展厅设计制作。该团队配备了摄影摄像人员、信息化技术人员及档案人员,确保项目实施过程中能够使数字媒体技术与档案资源深度融合,实现创新性与实用性的完美结合。在策划阶段,团队成员充分考虑了展示内容、用户体验以及交互设计等,形成了内容丰富准确的脚本。在制作阶段,团队成员首先对实物档案进行全景拍摄制作,再利用三维建模软件形成实物档案的三维模型,最后对形成的三维模型及虚拟展厅场景中的各种元素(灯光、幕墙等)进行渲染输出,力求呈现出逼真的视觉效果和流畅的交互体验。
在试点工作中,档案部门设计制作了两个虚拟展厅,包括“一代宗师徐舜寿—纪念徐舜寿诞辰105周年”“鲲鹏起兮—运-20首飞十周年回顾”2个展览,拓展了档案宣传工作新渠道。打造组件化虚拟空间,建立了易用型推广模式;改变交流体验方式,明确了拟态环境技术应用的新思路;满足用户需求,打破了展览时间和空间上的限制;使用多模态的人机交互方式,加强了互动体验。两个虚拟展厅的航空特色文化主题鲜明,深化了用户对档案的直观印象。虚拟展厅可以在电脑网页端展示,也可以结合VR全景设备进行沉浸式体验,实现实时漫游!
作者单位:中国航空工业集团第一飞机设计研究院
责任编辑:巩慧