专注文档前沿 聚焦数智服务——档案智能开发与服务重点实验室

发布时间:2024-07-29 20:04:36被阅览数:106 次信息来源:《中国档案》

  文/王平   李沐妍   谢鹏鑫

  2023年,档案智能开发与服务重点实验室成功入选国家档案局首批重点实验室。实验室聚焦档案信息资源的智能开发与智慧服务领域开展档案科技研究和成果转化工作,由武汉大学信息管理学院牵头,与湖北省档案馆、武汉数据智能研究院、文华智典(武汉)科技有限公司三家单位共同建设,采取依托单位领导下的主任负责制,成立重点建设管理委员会作为建设执行机构,以及学术委员会作为学术指导机构。

  在打造高水平的档案学专业人才梯队的同时,实验室积极吸纳计算机科学、情报学、历史学等跨学科的优质人才,实现档案学与不同学科交叉融合,拓展数智兴档研究思路。近年来,实验室团队成功获批国家2030重大项目、新一代人工智能国家科技重大专项课题、国家社科基金重大项目、国家自科基金重点项目、国家自科基金面上项目、国家档案局科技项目等多项重要科研课题项目,在文件档案理解与建模、档案智能技术开发、档案智慧化管理与服务等方面取得了众多亮眼成绩,并在国际人工智能顶级会议或权威期刊上持续发表高水平研究成果。

  与此同时,实验室依托作为iSchools、IFLA、ALA、ALISE等多个国际会员单位的武汉大学信息管理学院,在与联合国教科文组织、国际档案理事会建立友好合作机制的基础上,积极在国际学术会议发表研究成果、接待国际同行来访交流,扩散国际学术影响力。

  为切实服务档案事业数智化转型升级,实验室形成了一套较为完整的产学研用合作的成果转化链条。团队研发的智慧档案综合管理平台在四川省的达州市,湖北省的武汉市、襄阳市、随州市、恩施州等地档案馆广泛投入使用。同时,实验室为测绘、气象等行业档案部门开发专门档案管理平台获得业界好评。

  目前,实验室已形成了一系列代表性成果。一是自主研发大语言模型“ArcGPT档案大模型”。通过构建包含档案专利、档案期刊/学位论文、档案专著及档案标准文献等多种类型的大规模档案知识数据集,基于自研的BatGPT预训练大模型基座,通过面向档案业务场景知识文本与代码预训练,结合有监督微调技术及价值对齐强化学习方法,具备档案知识问答、关键词抽取、文档智慧编研、文档识别与理解和档案图谱等数智化档案服务能力。同时,为了方便用户的使用,实验室基于大模型研发出智能密筛/开放审核一体机、档案大模型一体机,从而解决档案馆算力不足的难题。

  二是基于新技术研发的档案管理智慧化信息系统。包括面向文件档案管理和多模态档案知识挖掘需求,基于深度学习、计算机视觉及区块链等技术,研发并集成了档案智能密筛与开放审核、照片档案自动修复、多媒体档案智能检索、文档信息抽取与表示、复杂文档识别与理解等智能化文件档案管理应用的档案智慧中台,以及利用全域可信边缘计算技术,结合物联网及区块链等技术,面向三网物理隔离实现档案服务远程利用与实体馆室全域实时管控的智慧档案综合管理平台等。

  三是优化档案学数智技术教学活动的智慧档案全生命周期管理虚拟仿真实训平台。该平台以提升档案学专业学生人工智能素养为目标,通过对真实档案管理场景与业务逻辑的仿真,以及真实档案文件素材与AI算法的融合,以数智驱动档案全生命周期智慧化管理,实现了数智技术对档案“收、管、存、用”的高效赋能,提升了学生对“人工智能+档案管理”的深层认识,应用该平台的本科生课程已获批湖北省一流课程。

  实验室贯彻国家信息化发展战略,聚焦国家治理能力现代化框架下的档案信息资源智能开发与服务,开展档案科技基础工作,致力于加强档案事业创新发展中重大科技问题的理论研究,产出具有影响力、前瞻性、高水准的学术成果;研发解决数字档案信息资源管理工作痛点的技术工具,实践数智赋能,全面推动档案科技成果转化;打造档案科技人才聚集和培养的重要基地,提供高质量、专业性研创空间和发展机遇;搭建国内外档案界广泛交流的高端平台,多载体形式拓展学术交流和科技合作渠道;建设服务国家及地方的技术支援型档案智库,为档案事业发展的共性科技问题提供决策咨询和方案支撑。

  接下来,实验室将继续专注解决档案科技事业发展的前沿问题,聚焦复杂文档理解、大语言模型档案领域垂直应用、档案文化价值深度开发等研究内容,研发广泛适用于档案业务场景的应用平台和终端设备,并积极开展学术和产业交流,以及成果转化工作,为档案科技创新事业持续献出智慧力量。

  作者单位:武汉大学信息管理学院、档案智能开发与服务国家档案局重点实验室

  责任编辑:王辉