科研电子文件归档与电子档案管理探索性研究

发布时间:2024-01-12 16:16:15被阅览数:322 次信息来源:《中国档案》

  文/何思源  张静

  2021年11月,中国人民大学档案学院和中国科学院档案馆承担的“科研电子文件归档与电子档案管理探索性研究”获得国家档案局优秀科技成果二等奖。该课题为科研电子文件归档、科研电子档案长期保存和知识服务提供了切实有效的新思路和新方法,促进了档案部门对科研档案和科学数据协同管理的重视和不断拓展。

  研究背景

  大数据时代科研信息化进程加速推进,数据驱动的知识发现和科研创新成为常态,跨学科、跨领域、跨地区、跨机构的重大科研项目逐渐增多,形成海量科研电子文件。一方面,大多科研档案部门能实际掌握的科研电子档案主要是科研管理档案,数量巨大、种类丰富的过程性、数据类科研文件仍分散保存在各类系统中。这些文件如果得不到有效的归档保存,极易失存、失控,无法满足支持科技创新、传承科学精神的需求。另一方面,科研电子文件具有专业性强、设备依赖性强、异构程度高、数据海量化、来源范围广、现实价值大等特点,无法完全复用一般性的电子文件归档和电子档案管理路径方法。此外,科研档案管理实践中存在重管轻用的倾向,与科学家对科研信息的开放共享需求形成较大反差,亟待知识服务等新方法的应用。因此,探索科研电子文件与电子档案管理是推动数字时代科研档案管理实践发展的迫切需要。

  课题研究的主要内容

  课题下设“国内外档案工作情况调研”和“中科院电子文件归档与电子档案管理基本路径研究”两个子课题,前者旨在对相关理论研究与实践进展进行全景调查,明晰发展态势,提出基本路径;后者则基于前者,面向实际需求,从制度建设和系统建设两个方面推动实施。

  1.国内外现状调查与趋势分析

  在制定《国内外档案工作情况调研方案》的基础上,课题组全面调研了6个国家和地区的科研档案及科学数据管理情况,围绕“收—管—用”三大业务环节,重点完成6个主管机构、10个科研相关机构(包括科研机构、科研资助机构、专门的科学数据管理和服务机构)、5个国际上有影响力的科研档案管理项目和2个国际组织的现状调研。

  总体来看,科研信息资源已成为国家科技基础设施的重要组成;开放共享与开发利用等信息服务能力成为档案部门赢得发展机遇、展示业务水平的重要标尺;实践中的文件、档案、数据、信息(资源)等概念的边界日益模糊,构建科研档案和科学数据合作共同体成为发展趋势。就归档而言,单套制电子文件归档成为档案事业的重点和热点,实践中涌现出以系统建设、制度保障和关键技术为抓手的多种实操方案;科学数据归档成为科研档案管理的重要议题,亟须实用的归档解决方案。就长期保存而言,规范文件形成和归档质量、实施前端管控和连续管理是实现长期保存的基础;已逐步形成以载体选择与更新、异地异质备份、格式管理、新技术应用等为核心的长期保存策略。就知识服务而言,在元数据标准方面,从注重建设转向注重复用,以实现数据互操作;在服务方面,注重提供面向不同用户的个性化服务,服务方式注重基础服务、专题服务和功能服务的综合集成,服务模式也逐渐从单主体、单一学科走向多主体、多学科联动服务。

  2.基本路径探析

  结合国内外科研档案管理发展趋势及中国科学院科研活动的现实需求、院所两级架构,可从战略和策略两个层面提出科研电子文件归档与电子档案管理的基本路径。在战略层面,一是明确科技档案工作在科技发展中的战略地位,发挥档案资源在支撑科研活动有效运作、保存科研过程证据、传承科研历史文化等方面的重要价值。二是坚持数字转型的发展路线,将档案信息化置于档案事业的关键,打通从文件、数据到档案的全生命周期。在策略层面,一是加强顶层设计和制度衔接,推动科学数据的归档管理和服务协同,并以归档范围、元数据标准、格式标准等为重点,健全完善标准规范体系。二是试点先行,突出科研特色、分级建设,强化院所两级协同,探索科研电子文件单套制归档、科研档案和科学数据协同管理、科研电子档案长期保存和知识服务的新模式、新方法。三是着重推动建设数字档案馆(室),提升院所两级档案部门的基础业务能力和服务水平。四是加强内外合作,对内建设自身档案专家队伍,对外联合科技文献和档案领域的科研院所、高等院校、技术公司,打造合作圈,为决策、咨询、培训提供全面支撑。

  3.制度规范编制

  基于前期调研及对基本路径的思考,课题组重点编制了上位类的《中国科学院电子文件归档与电子档案管理办法》(以下简称《办法》)以及配套的《中国科学院科技档案元数据标准》(以下简称《标准》)。

  《办法》明确了基本原则、管理职责、系统建设与运维、电子文件归档范围与要求以及电子档案的存储备份、共享利用、鉴定处置、移交进馆等内容。主要有两个方面特色:一是以数字转型为指引,面向电子档案单套制管理,明确了科研电子文件可仅以电子形式归档保存的基本条件,包括来源真实有效、系统功能完善、审签程序规范、采取电子档案的防篡改措施、建立备份机制等。二是提出科学数据归档和共享利用的要求。例如,第十九条规定“各单位业务系统产生的归档电子文件及其元数据原则上应在线归档,科学数据等特殊类型的电子文件可逻辑归档”,为科学数据提供了更多元、更灵活的归档方式。

  《标准》在《信息与文献文件管理过程文件元数据》(ISO23081,已被采标为GB/T26163—2010)、《文书类电子文件元数据方案》(DA/T46—2009)等标准的基础上,参考科学数据元数据方案,结合科技档案特点,为科技档案设计了统一的元数据方案,从元素名称、定义、目的、约束性、可重复性、类型等方面对元数据进行逐项规定。《标准》突出了档案著录的两大特点:一是多级著录,兼顾案卷级元数据(146项)和文件级元数据(125项);二是多实体著录,包括项目实体、档案实体、业务与人员实体。

  4.建设方案研究

  课题组编制了《中国科学院数字档案馆(室)建设方案》(以下简称《方案》),明确提出“以科研档案为核心,强化院所两级协同,同步推进数字档案馆、机关数字档案室和院属单位数字档案室建设”的整体思路。《方案》从建设模式、关键问题、基础设施、系统开发、传统载体档案数字化、电子文件归档、制度规范与安全保密体系、专题数据库等方面规划了建设内容。其中,中科院数字档案馆系统(系统框架如图所示)是核心和关键,包括移交接收系统、综合档案管理系统、长期保存系统、知识服务系统、“四性”检测模块和档案工作综合管理系统。其中,移交接收系统内嵌先导专项分类方案、归档模板(细化的归档范围与保管期限表)、元数据管理(包括配置、自动著录及数据校验)等,能满足多场景的档案数字资源收集整理与移交接收需求。长期保存系统采用磁光电混合存储的软硬件一体化解决方案,支持档案数字资源封装和解析、唯一标识统一管理、巡检、格式转换、介质批量自动检测和智能化管理服务等功能。知识服务系统以用户需求为导向,采用数据挖掘、知识图谱技术,实现主题可视化;引入中文信息抽取技术,实现实体抽取及关联关系可视化;引入模糊语义匹配技术,提升语义检索的查全率与查准率。

1.jpg数字档案馆系统建设框架图

  创新点及成果推广应用情况

  课题的创新性主要表现在4个方面:一是首次从理论和实践相结合的角度对科研电子文件归档和电子档案管理进行系统性研究;二是发现实践中存在科研档案和科学数据相互割裂的问题,首次提出科研档案和科学数据协同治理的理论构想,创新性地提出由制度规范、组织分工、业务方法、数据资源、信息服务等构成的管理协同框架;三是考虑到科研电子档案的特殊性,提出明确科学数据的档案属性、探索单轨制科研电子文件在线归档的新模式、长期保存过程中的混合存储策略、科研档案知识服务等创新策略;四是研制面向单套制的科研电子文件归档与电子档案管理制度,创新性地将科学数据归档纳入其中,并配套设计了多级、多实体的科技档案元数据方案。

  课题成果在实践中得到了广泛的推广应用,取得显著成效,主要表现在以下3个方面:一是关于科学数据和科研档案协同管理的资政报告获得领导批示;二是课题验收后,《办法》和《标准》草案经进一步完善已于2021年在中科院内正式公布实施,在《方案》的指导下,中科院档案馆于2021年完成系统开发,并于同年6月通过国家档案局验收,在突出科研特色、在科研项目管理中集成科研电子档案要求、知识图谱应用等方面取得突破;三是长春光机所、上海光机所、深圳先进院等多家所级单位根据课题成果完善科研档案管理制度,将相关要求嵌入业务系统和档案管理系统,实现包括论文关联数据在内的科研电子文件的在线归档,为开展科研电子档案单套制管理打下坚实基础。

  [本文系2021年度国家档案局科技项目获奖成果]

  作者单位:中国人民大学档案学院、中国科学院档案馆

  责任编辑:王辉