基于提示工程的档案文化遗产AIGC应用策略研究

发布时间:2024-11-13 10:40:17被阅览数:27 次信息来源:《山西档案》

  作者:徐千淇

  摘要:人工智能生成内容技术的兴起为档案文化遗产的智能化管理与创新传播带来新的契机与挑战。在梳理AIGC技术发展脉络、原理的基础上,分析了档案文化遗产数字化面临的问题,凝练了AIGC技术在档案业务流程中的应用需求,进而针对档案编目、档案检索、档案咨询、档案编研、档案宣传等典型业务场景,提出基于提示工程优化AIGC模型的应用策略,旨在为提升档案文化遗产的智能化管理水平、创新优秀档案文化传播模式提供理论参考与实践指引。

  关键词:人工智能生成内容;提示工程;档案文化遗产

  档案文化遗产作为国家宝贵的历史记忆和文化基因,在传承文明、服务社会、融通中外中发挥着不可替代的作用。然而,我国档案文化遗产长期存在数字化水平不高、知识化程度不深、智能化应用不足等问题,亟须创新技术手段来破解资源开发利用的瓶颈[1]。人工智能生成内容(Artificial Intelligence Generated Content,AIGC)技术的兴起为新时代档案文化遗产的数字化转化与智能化应用带来了新的契机,能够实现《“十四五”全国档案事业发展规划》提出的“档案科技创新实现新突破”伟大目标。AIGC是一种利用人工智能技术自动生成内容的新型生产方式,不仅能提升内容生产效率,还可通过模型对知识进行重组而创造出新颖的内容。国内外学者围绕AIGC技术开展了一系列探索性研究。国外研究较早关注AIGC的技术原理、模型架构等基础理论问题,并在医疗、教育等领域进行了应用实践。国内研究起步相对较晚却发展迅速,研究内容涵盖AIGC的概念内涵、发展态势、伦理风险、行业应用等诸多方面。在图书情报与档案领域,研究主要聚焦于AIGC对传统业务流程的重塑、知识服务的赋能、智慧档案馆建设的推动作用,但鲜有学者系统探讨AIGC在档案文化遗产领域的应用路径。现有研究表明,以深度学习、知识图谱等为代表的人工智能技术已在文化遗产数字化保护以及档案资源语义标引、智能检索等方面得到有益尝试并取得了可喜成果[1]。然而,海量异构的档案文化遗产资源对AIGC模型的语义理解、知识建模、智能生成等核心能力提出了更高要求,单纯的“端到端”模式下的数据驱动式学习存在语境理解能力弱、开放域适应不足等局限。提示工程是利用提示学习范式来优化预训练语言模型以完成下游任务的系列方法,能够有效引导AIGC系统理解任务意图并生成高质量、高准确率的结果。国外学者提出了一系列提示工程实践框架,如CLEAR框架从简洁、合理、明确、自适应、反思五个维度对提示工程过程进行了系统指引。国内学者探讨了基于提示工程的AIGC应用生态,并在智能写作、知识管理等场景开展了卓有成效的实践。受此启发,将提示工程引入档案文化遗产领域,对于AIGC赋能档案智能化管理与服务、促进档案资源创新应用大有裨益。然而,目前,鲜有研究从提示工程优化视角系统探讨AIGC在档案文化遗产应用中的理论基础、技术架构与实现路径。因此,本文基于提示工程的相关基础理论,在梳理国内外AIGC技术的发展脉络与应用现状的基础上,分析档案文化遗产领域的AIGC技术应用需求,提炼档案知识特征,系统探讨基于提示工程优化的AIGC模型在档案文化遗产智能管理与开发利用中的应用路径,以期为智慧档案馆建设提供理论参考和实践指导。

  1  AIGC技术发展与应用现状

  1.1 AIGC 的内涵与技术原理

  人工智能生成内容是一种利用人工智能技术自动生成内容的新型生产方式,既指内容生成技术,也泛指所生成的内容本身。AIGC源自人工智能领域的持续突破,其底层逻辑是通过机器学习算法从海量数据中归纳提炼知识,并将其应用于新内容的生成过程。AIGC的技术原理主要包括大规模语言模型预训练、多模态语义理解、内容生成等方面。其中,以Transformer为代表的注意力机制是AIGC的核心,使模型能够挖掘不同粒度文本片段间的依赖关系,增强语义编码与信息交互能力。在大数据与强大算力的驱动下,GPT、ERNIE、BERT等预训练模型实现了从海量非结构化数据中自主学习通用语义表征,为AIGC提供了坚实的技术底座。多模态语义理解技术可建立文本、图像、音视频等异构信息间的映射,增强模型对多源异构数据的理解能力。对抗生成网络、扩散模型等内容生成技术的发展,驱动AIGC模型从文本领域向多模态全场景快速拓展。

  1.2 AIGC 的发展脉络与代表性模型

  AIGC经历了从早期的规则模板式生成到基于深度学习的端到端生成,再到如今基于大语言模型的自然交互式生成等重要演进阶段。展开来讲,2014年提出的seq2seq模型开创了基于神经网络的文本生成范式。2017年提出的Transformer模型引入自注意力机制,奠定了预训练语言模型的发展基础。此后,GPT、BERT、T5、ERNIE等预训练模型相继问世并广泛应用于NLP任务。2022年,ChatGPT横空出世,其出色的开放域对话交互能力引爆AIGC发展浪潮。目前,以ChatGPT、文心一言、Claude为代表的AIGC系统正在加速创新拓展应用场景。从总体来看,不同AIGC系统在底层架构、知识增强、安全策略等方面各有侧重,但都在一定程度上实现了跨模态、跨语言、跨领域的内容生成,从而驱动传统行业加速人工智能化升级。

  1.3 AIGC 在图情档领域的应用实践

  AIGC为知识密集型图书情报与档案领域带来全新变革。在知识服务方面,AIGC技术可用于知识抽取、知识图谱的构建、智能问答等,极大提升了知识组织、揭示、利用的广度和深度;在用户服务方面,AIGC技术可应用于智能参考咨询、个性化推荐、智能搜索、智慧阅读等,为读者提供更加精准、高效、沉浸式的服务新体验;在档案管理方面,AIGC技术能够助力档案文件自动编目、档案信息标引、档案专题生成等,进而推动档案资源实现高质量开发和创新应用。国内外图书馆、档案馆的探索性实践表明,AIGC与行业知识深度融合,有望打破传统业务与服务模式,成为驱动行业变革的新引擎[2]。但也应注意到,AIGC在垂直领域应用中仍面临语义理解欠缺、领域知识构建不足、人机协同有待加强等问题,需要从知识增强、场景适配等维度系统优化。

  2  档案文化遗产领域的AIGC应用需求分析

  2.1 档案文化遗产资源数字化转化面临的挑战

  随着数字化时代的到来,加快档案文化遗产数字化转型已成为推动优秀传统文化创造性转化与创新性发展的重要举措。然而,档案文化遗产资源种类繁多、形态各异、语义隐晦,给自身的数字化转化带来诸多挑战。例如,档案文化遗产资源多以非结构化的特征呈现出来,缺乏统一规范的著录框架,难以适应结构化存储与语义化组织的需求;此外,档案专业语言、古文字识别等技术瓶颈也制约着档案文化遗产的规模化、精准化、数字化进程[3]。AIGC有望凭借其在语义理解、知识抽取、内容生成等方面的技术优势为破解上述难题提供新思路。

  2.2 AIGC 助力档案文化遗产资源开发的技术潜力

  AIGC为档案文化遗产数字化与智能化应用带来新的技术可能。在数字化采集方面,视觉语言预训练模型可用于档案扫描图像中手写体、印刷体文字的自动识别,减轻人工录入负担;在资源转化方面,AIGC可从档案原文中自动抽取、匹配、链接文本、图像、音视频等多模态信息,形成结构化、语义化的档案知识库;在资源标引方面,AIGC可建立多粒度档案主题词表、档案体粒度等语义标引规则,实现档案专业化、规范化描述;在资源检索方面,AIGC可用于构建档案语义检索模型,支持跨档案库、跨语种、跨模态的关联式检索,提高档案资源发现的查全率与查准率;在知识服务方面,AIGC可通过档案问题问答、档案故事生成、档案专题剪辑等方式,为用户提供沉浸式、个性化的档案文化遗产服务新体验。

  2.3 面向档案文化遗产的 AIGC 应用需求凝练

  推动AIGC在档案文化遗产领域的创新应用,需要立足智慧档案馆的当前发展需求,系统凝练技术应用新场景。首先,在档案资源数字化采集方面,需要AIGC辅助档案文字识别、档案音视频转写等任务,实现多源异构档案文化遗产的规模化数字化转化;其次,在档案资源知识化组织方面,需要充分挖掘AIGC在档案主题标引、档案语义关联、档案知识图谱构建等方面的潜力,建立兼顾档案特色与知识关联的组织新模式;再次,在档案资源检索利用方面,需要发挥AIGC在档案领域中的智能检索、智慧问答等环节的能力,为用户提供便捷、精准、个性化的档案发现新渠道;最后,在档案文化遗产开发方面,需要利用AIGC在档案文本生成、数字展览策划、知识科普与文艺创作等创新应用中的价值,拓展优秀档案文化的传播广度与影响力。因此,面向档案全生命周期管理各环节,系统规划AIGC应用需求,有利于厚植档案文化遗产数字化根基并激发资源创新应用的活力。

  3  基于提示工程的档案文化遗产AIGC应用策略

  3.1 提示工程范式的技术原理及框架

  提示工程范式是应对当前AIGC通用大模型在垂直领域应用中普遍存在语义理解偏差、领域适应能力不足等问题的关键范式。其核心理念是利用提示学习,引导预训练语言模型从海量文本中归纳、泛化领域知识,增强模型对特定任务的理解和执行能力。具体而言,提示工程将任务目标转化为自然语言指令序列并输入语言模型,通过设计连续或离散的提示模板,显示传递领域约束与任务规则,从而诱导语言模型做出符合任务期望的输出。目前,CLEAR框架、CoT提示范式等典型提示工程实践显著提升了语言模型在信息抽取、知识推理、对话交互等任务中的表现水平[4]。档案文化遗产领域的AIGC系统应进一步吸纳提示工程理念,基于档案任务特点优化提示方法,增强模型对档案语义、档案规则、档案知识的理解能力,以提升档案智能化管理与服务水平。

  3.2 基于提示工程的档案知识增强策略

  传统AIGC模型主要基于海量通用文本数据进行预训练,缺乏专门的档案知识建模与融合机制,难以充分理解和表达档案语义。因此,通过引入知识增强技术,从知识获取、知识表征、知识融合等环节发挥AIGC在档案领域的应用价值。首先,要构建覆盖面广、专业性强的档案语料知识库,包括结构化资源和非结构化资源,为档案知识学习提供高质量语料基础;其次,要设计兼顾档案特色的知识表征模型,综合运用知识图谱、本体论、因果图等方法,以弥补当前AIGC模型在知识表示粒度等方面的不足;最后,要发挥提示工程在语言模型微调中的威力,利用基于任务的提示等指令模版策略,引导AIGC模型从多源异构档案知识库中习得档案特定语义与规则,增强模型回答档案专业问题的能力。

  3.3 面向档案业务场景的 AIGC 模型应用

  基于提示工程优化的AIGC模型可广泛应用于档案智能化管理与服务的业务场景中。展开来讲,在档案编目领域,利用大规模档案目录语料库来微调AIGC模型,能够显著提升档案著录、档案主题标引的效率与规范性;在档案检索领域,利用档案语义提示、档案背景知识增强AIGC模型,可支持跨档案库、跨主题的关联式检索,提升用户获取档案的便捷性;在档案咨询领域,通过构建档案领域的指令对话数据集来微调AIGC模型,辅以虚拟人设计,能够实现智能化、个性化的人机对话式档案咨询;在档案编研领域,利用档案专题语料、档案事件知识微调AIGC模型,可辅助开展档案文献综述、档案编年史梳理等工作,提高档案二次开发效率;在档案宣传领域,利用档案故事语料、档案口述史语料训练AIGC模型,可自动生成体现档案价值的科普读物、宣传视频等,创新优秀档案文化的传播模式。从整体来看,在提示工程范式的指引下,针对典型档案业务场景定制AIGC模型,有望显著提升档案管理、档案利用、档案传播等环节的智能化水平,为用户提供沉浸式、个性化的档案文化遗产服务新体验。

  参考文献

  [1]许剑颖,冯桂珍.ChatGPT赋能档案服务:技术特征、应用场景与实现路径[J].山西档案,2023(6):111-120.

  [2] 牛力 , 金持 , 黎安润泽 . 大模型在档案工作数智转型中的应用 : 新机遇、新模式和新转变 [J/OL]. 档案学通讯 :1-11[2024-06-20].https://doi.org/10.16113/j.cnki.daxtx.20240511.001.

  [3] 陈艳红 , 李健 . 新一代人工智能生成内容档案身份的认定风险及规制研究 : 基于对ChatGPT生成内容的思考[J]. 档案学研究 ,2023(5):4-12.

  [4] 文森 , 钱力 , 胡懋地 , 等 . 基于大语言模型的问答技术研究进展综述 [J/OL]. 数据分析与知识发现 :1-17[2024-06-20].http://kns.cnki.net/kcms/detail/10.1478.G2.20231110.1612.002.html.

  【作者简介】徐千淇(1986—),女,汉族,河南巩义人,郑州商学院艺术学院副教授,硕士,研究方向:动画、数字媒体艺术设计。