通用人工智能(AGI)技术在档案管理中的应用前景分析

发布时间:2024-12-23 08:38:33被阅览数:517 次信息来源:《山西档案》

  作者:贺莉

  摘要:通用人工智能(AGI)技术的快速发展,正在推动现代信息技术向“强人工智能”演进,并在越来越多的专业领域展现出变革性影响力。聚焦AGI技术在档案管理领域的应用前景,在梳理AGI技术发展现状的基础上,剖析了AGI技术在档案管理各环节的应用场景设计,阐释了AGI对档案管理工作的潜在影响。

  关键词:通用人工智能;档案智能化;AGI;大模型

  随着计算机视觉、大模型、空间技术、生物识别、自然语言处理、人机交互、知识图谱等关键技术的融合创新,通用人工智能(AGI)技术在各个领域迅速发展,为相关专业领域带来了全新的变革与机遇[1]。以2022年引爆全球的大语言模型ChatGPT为代表,AGI技术在文本生成、知识问答、图像识别等方面的惊人表现,不仅引发了业界和学界的高度关注,也让公众切身感受到了人工智能技术的魅力。AGI技术的快速发展,必然会给各行各业带来巨大的影响与变革。传统的档案管理事业作为信息资源组织与服务的核心领域,更需积极应对AGI技术带来的机遇与挑战[2]。一方面,从历史发展的角度看,档案管理工作是随着信息技术的变革而不断演进的,从手工管理到计算机辅助管理,再到如今数字化、网络化的信息化档案管理,信息技术发展一直是推动档案管理领域变革的关键动力。另一方面,AGI技术的智能化、个性化优势,与档案海量信息组织、知识挖掘与利用服务的需求高度契合,运用AGI技术辅助档案采集整理、智能检索利用、档案知识发现等工作,将极大地提升档案管理的智能化、精准化水平。

  1  档案管理领域信息化现状与AGI应用基础

  1.1 档案管理信息化发展历程与现状

  档案管理领域的信息化建设已有几十年的历史。从20世纪80年代计算机辅助档案管理的起步,到20世纪90年代数字化档案馆的兴起,再到21世纪以来数字档案、电子文件等的广泛应用,档案管理信息化一直在稳步发展[3]。《“十四五”全国档案事业发展规划》明确提出加快推进档案管理现代化,加强大数据、云计算、人工智能等新技术在档案工作中的应用。目前,我国各级档案部门和档案馆普遍建立了档案信息管理系统,实现了档案目录数据库和档案全文数据库建设,档案数字化工作取得了长足进步。

  然而,当前档案管理信息化还存在一些问题:一是档案数字化质量有待提高,部分数字档案的可检索性、可利用性不强;二是档案数据整合共享水平不高,档案大数据开发利用程度不足;三是档案信息化系统功能较为单一,缺乏智能化的辅助工具;四是档案信息化人才培养滞后,高层次信息技术人才缺乏。这些问题在一定程度上制约了档案信息资源的高效开发利用,档案工作亟须引入AGI等新一代信息技术,进一步推动档案管理的智能化和现代化发展。

  1.2 传统人工智能技术在档案管理中的应用现状

  近年来,以机器学习、自然语言处理为代表的传统人工智能技术开始在档案管理领域崭露头角,在辅助档案资源自动分类、档案目录数据自动生成、档案大数据智能检索等方面取得了一定进展[4]。例如,基于支持向量机、决策树等机器学习模型构建的档案自动分类系统,可大幅提高档案分类的效率和准确度;基于条件随机场、隐马尔可夫等序列标注算法构建的档案著录项自动抽取工具,能快速生成规范化的档案目录;基于  Lucene、Solr等构建的档案全文检索系统,支持档案文本内容的关键词组合检索。一些档案部门还尝试利用知识图谱技术、OCR技术对档案资源进行知识化和文本化处理,提升档案资源的语义关联和检索能力。

  但总体而言,传统人工智能技术在档案管理领域的应用还处于起步阶段,主要存在以下问题:一是以小数据和有监督学习为主,在复杂档案场景中的推广泛化能力不足;二是多以非结构化文本为处理对象,对于语音、图像等多模态档案的融合分析能力不强;三是主要实现数据层面的初步结构化提取,对档案深层知识内涵的理解和发掘利用仍有欠缺;四是侧重事后分析利用,在事前采集、事中归档等环节的主动辅助能力不足。

  1.3 AGI技术嵌入档案工作的必要性与可行性

  AGI作为新一代人工智能技术范式,以其强大的跨领域知识学习能力、自然语言理解与生成能力、多模态信息融合处理能力,为档案管理领域的智能化发展提供了全新的技术工具。引入AGI技术是突破当前档案管理信息化瓶颈、构建未来智慧档案的必由之路。一方面,AGI有助于档案海量异构数据的智能采集、知识化组织和计算分析处理,提升档案信息资源的时效性和集成性。另一方面,AGI突破了传统人机交互模式的局限,可通过自然语言实现用户需求的精准理解和快速响应,实现档案知识的个性化智能服务。此外,AGI在持续学习、主动分析、辅助决策等方面具有的优势,也将为档案管理人员赋能,推动档案管理从事后被动服务向事前预判、事中优化的主动管理转变。

  当前主流的AGI系统主要基于海量语料数据预训练的大语言模型,而档案工作恰恰积累了大量的历史文献、公文信息、多媒体资源等格式丰富、领域广泛的档案大数据资源,为AGI模型的优化和应用提供了得天独厚的数据基础。同时,前沿的AGI技术特别是类ChatGPT模型具有开源性,支持在特定领域语料上微调优化,这为档案部门结合自身业务需求制定适用的档案智能管理工具提供了技术可行性。此外,一些档案管理共性业务如档案编目、档案检索等对领域知识的依赖性不强,更有利于快速应用通用AGI模型。因此,在档案管理领域引入和应用AGI技术具有较好的数据基础、技术基础和应用场景,大有可为。

  2  AGI技术在档案管理各环节的应用场景设计

  2.1 电子文件归档

  传统的电子文件归档多依赖人工操作,存在效率低、差错多等问题。AGI可通过自然语言理解和知识推理能力,智能化辅助电子文件快速、准确归档。首先,将档案管理制度、归档要求等知识预先配置到AGI系统中,赋予其档案归档领域知识。其次,AGI系统通过自然语言分析,自动理解电子文件内容,识别文件主题、密级、保管期限、责任者等关键要素信息。再次,基于归档知识推理判断电子文件的归档类别、目录层级,提示合适的归档方式。最后,形成归档清单,并通过可视化人机交互界面引导档案人员进行确认,完成高效、规范化的电子文件归档。

  2.2 档案智能采集

  档案资料的形式越来越多样化,除传统的文本文件外,还包括音频、视频、图片等多种载体形式。利用AGI的多模态理解处理能力,可实现各类档案资料的智能化采集。对于声像档案,AGI可通过语音识别技术将音频内容转化为文本内容,同时提取说话人、语速、情感等要素;对于影像档案,AGI可通过视频场景理解,提取视频中的关键帧、字幕、主要人物等要素,并分割成语义场景;对于图像档案,AGI可通过图像识别分类技术,分析图片内容特征、场景,识别图像中的文字、人物、物体信息等要素。多模态档案采集后形成的结构化信息,可直接集成到档案管理流程中进行统一管理。此外,AGI还可实现多源、非结构化文本档案的规范化采集,不仅大大拓宽了档案采集的信息渠道,还提高了档案采集的效率和质量。

  2.3 档案智能整理

  档案整理涉及档案著录、分类、排序、编目等多项工作,对档案工作人员的业务能力要求很高。利用AGI的知识抽取、语义理解和归纳生成能力,可大幅提升档案整理的智能化水平。对于纸质档案,首先通过OCR影像识别将其转化为电子文本,然后利用AGI从档案文本中自动抽取题名、责任者、日期、保管期限等关键档案元数据,并通过知识推理实现档案的分类和排序,对分类结果进行归纳生成档案目录。基于AGI的档案整理可以从海量档案文本中自动学习档案分类和编目的知识,形成档案编目知识图谱,以辅助和规范档案工作人员的整理工作。

  2.4 档案智能鉴定

  传统的档案鉴定主要依靠人工阅读审核,存在主观性强、错漏风险高等问题。引入AGI技术,可辅助档案的价值与开放鉴定。对于档案价值鉴定,AGI系统通过对档案内容的语义分析,自动判定档案的历史、现实、社会等价值,评估档案的重要程度,为档案移交、销毁提供科学依据。对于开放鉴定,AGI系统通过对档案形成背景、内容主题、相关法律法规的综合分析,自动判定档案的开放条件、利用范围、控制措施,形成开放鉴定意见。

  2.5 档案智能检索

  随着档案检索需求的日益多样化,传统的档案目录和全文检索已难以满足用户需求。借助AGI的个性化智能和跨模态理解能力,可实现档案的智能化、个性化、跨模态检索。基于用户档案检索的历史行为数据,AGI可学习和理解用户的兴趣偏好,建立个性化的用户画像,从而主动为用户推荐相关档案。AGI可以打破不同模态档案之间的壁垒,实现跨模态档案资源的关联检索,用户可通过一段文字、一段语音或一张图片检索到相关的其他模态的档案,极大地拓展了档案利用的广度和深度。AGI还可支持用户以自然语言提问的方式获取档案知识,支持档案知识的可视化、情境化呈现,为用户带来了全面提升的交互体验。

  2.6 档案智能编研

  档案编研是发挥档案价值、传播档案文化的重要方式,但受制于档案编研人员的知识水平和工作效率。AGI可在多方面赋能档案编研:一是利用知识抽取、知识推理技术,快速梳理档案线索,发现新的历史事实和规律;二是利用自动文摘、机器写作等技术,辅助撰写编研成果;三是利用跨模态内容生成技术,制作图文并茂、视听一体的编研产品,提升档案文化的传播效果。AGI还可通过持续学习海量编研数据,掌握档案编研的业务规律和研究方法,为编研选题、资料选编、观点阐发提供智能决策支持,提升档案编研的深度和专业性。

  3  AGI技术应用对档案管理理念、管理方式的影响

  3.1 AGI促进档案工作的理念和视角发生转变

  随着AGI在档案管理领域的应用,档案工作的理念和视角也将发生重要转变。首先,档案管理将从传统的“资源视角”转向“知识视角”。利用AGI的知识抽取、知识推理和知识图谱构建能力,档案资料将从静态的信息载体转化为可计算、可关联、可溯源的知识化单元,纳入统一的档案知识库进行管理,强化档案工作对知识内涵的关注和深度挖掘,实现从档案管理到知识管理的跨越。其次,档案管理将更加重视跨模态信息融合。在AGI支持下,档案文本、图像、音频、视频等异构信息可实现统一表征、关联分析和综合利用,打通不同载体之间的壁垒,丰富档案资源的信息维度,增加档案呈现利用的方式。再次,档案管理将实现从单向服务向人机交互的转变。借助AGI的自然语言理解和生成能力,档案利用服务将从被动式服务转向主动、灵活、个性化的智能交互,用户可通过对话问答、语音交互等更加便捷的方式获取档案知识。

  3.2 AGI推动档案由被动式管理向个性化服务转变

  在传统档案管理模式下,档案工作大多是事后的、被动的,对用户需求的响应是滞后的、粗放的。而随着AGI技术的引入,档案管理服务模式将迎来全新升级。一方面,AGI系统可通过学习掌握海量档案工作数据中蕴藏的管理规律,形成领域知识图谱和专家经验模型,主动感知和预判档案管理过程可能出现的风险隐患,提前采取预防和控制措施,实现档案管理从事后被动向事前主动的转变。另一方面,基于用户档案利用轨迹、兴趣特征等大数据分析方法,AGI可精准刻画用户画像和生成知识图谱,主动为用户推送个性化的档案信息,满足用户差异化、精细化的档案利用需求。

  3.3 AGI重塑档案管理人员能力需求与培养模式

  AGI在赋能档案智能化管理的同时,也对档案工作人员的知识结构和能力素质提出了新的要求。档案管理人员不仅要掌握传统的档案专业知识,更要具备AGI技术基础知识,了解人工智能的发展规律和算法原理,能够使用AGI工具开展档案管理工作。面对智能时代不断变化的用户需求,档案管理人员要具有持续学习、应变创新的能力,善于利用AGI技术优化管理流程、创新服务模式。因此,档案学教育和人才培养体系建设需要与时俱进,加强对跨学科复合型人才的培养。一是在档案学专业教育中嵌入AGI等前沿信息技术课程,提高学生的技术素养;二是探索“档案学+”的交叉学科建设,培养既懂档案业务又懂交叉知识的复合型人才;三是鼓励在职档案人员加强AGI技术的学习培训,提升创新应用能力。

  参考文献

  [1]牛力,金持,黎安润泽.大模型在档案工作数智转型中的应用:新机遇、新模式和新转变[J/OL].档案学通讯:1-11[2024-07-26].https://doi.org/10.16113/j.cnki.daxtx.20240511.001.

  [2]闫慧.通用人工智能时代信息资源管理学科的发展方向[J].信息资源管理学报,2024(2):21-28,53.

  [3]李财富,王硕.人工智能技术赋能档案馆的应用前景研究:基于信息生命周期视角[J].山西档案,2024(1):108-115.

  [4]许剑颖,冯桂珍.ChatGPT赋能档案服务:技术特征、应用场景与实现路径[J].山西档案,2023(6):111-120.

  【基金项目】2023年山西省高等学校哲学社会科学研究项目“Web 3.0视角下社交媒体推动晋北地区红色文化传播耦合机制研究”(项目编号:2023W136);2023年大同市科技计划软科学项目“智能媒体语境下大同市网络舆情文化安全研究”(项目编号:2023083)。

  【作者简介】贺莉(1991—),女,汉族,山西大同人,山西大同大学新闻与传媒学院讲师,博士,研究方向:智能传播、融媒体与文化传播、新媒体与传播理论。