大语言模型赋能档案工作现代化:成本、意愿与能效

发布时间:2025-01-22 08:30:26被阅览数:204 次信息来源:《山西档案》

  作者:郑春玉

  摘要:从成本、意愿和能效三个维度,系统分析了大语言模型赋能档案工作现代化需要重视的要点。研究发现,大语言模型的研发与应用需要投入高昂的技术、人力和时间成本,因此档案机构需要在自研和外包间作出权衡;档案工作者使用大语言模型的意愿受到技术接受度、工作习惯与流程适应性、专业素养水平的制约;大语言模型在提升档案工作效率、质量和创新方面效果显著,但其后续效果仍需长期评估。

  关键词:大语言模型;档案工作现代化;成本;意愿;能效

  人工智能技术正深刻影响和重塑各行各业,为传统工作方式注入了新的活力。作为人工智能的前沿分支,大语言模型凭借其强大的自然语言理解和生成能力,在机器翻译、智能问答、知识挖掘等领域取得了显著成就,并展现出广阔的应用前景。而档案工作肩负着记录历史、服务社会的重要职责,正面临着数字化转型和智能化升级的迫切需求。将大语言模型引入档案工作,有望突破档案信息处理的瓶颈,挖掘档案数据的价值,开创档案管理和服务的新局面[1]。

  然而,大语言模型是一项复杂且尖端的技术,其研发和应用需要多方主体的协同投入和长期磨合,不可能一蹴而就。而档案工作又具有鲜明的专业性和特殊性,知识密集且为经验导向型,这对技术的适配和内化提出了更高要求。大语言模型能否真正赋能档案工作现代化,取决于技术、业务、人员等多重因素的综合考量。本研究拟从成本、意愿、能效三个关键维度,深入剖析大语言模型与档案工作的融合过程,厘清制约其发展的瓶颈因素,探寻实现双向赋能的路径和方法,旨在为档案机构引入大语言模型提供理论指引和实践参考。

  1  大语言模型赋能档案工作现代化的成本构成分析

  1.1   大语言模型研发与迭代过程的成本

  大语言模型的研发和迭代是一个复杂的过程,需要投入大量的人力、物力和财力。首先,需要组建一支由语言学家、计算机科学家、数据科学家等多领域专家构成的跨学科研究团队,致力于算法模型的设计、优化与迭代。其次,为了构建高质量的训练数据集,需采集和清洗大规模的语料数据。这包括购买或合适爬取海量的文本资源,并投入大量人力进行数据标注和校验。再次,大语言模型的训练和调优过程会消耗大量的计算资源,因此需要采购高性能的GPU服务器,并支付高昂的电费和带宽费用。此外,大语言模型的研发还需大量的时间投入。若档案相关部门选择自主开发,则需配备多位研究人员,持续进行模型架构和参数的调整,通过反复试错和优化来提升模型性能。部分档案机构由于无法独立承担庞大的资金和时间成本,通常会选择与具备大语言模型产品或开发能力的公司或研究机构合作。这些机构可以采用预训练模型进行迁移学习,或直接使用匹配的API服务,从而在节约成本的同时,实现较好的这些效果。因此,档案机构在追求大语言模型赋能档案工作现代化的过程中,需综合考虑自主开发与外包合作的成本效益,权衡研发成本、时间成本与模型性能,以选择最优技术方案。

  1.2   大语言模型部署运行与系统维护的成本

  大语言模型的研发和迭代是档案工作现代化的基础,但还需考虑模型部署运行与系统维护的长期成本。一方面, 大语言模型的部署需适配特定的软硬件环境,这涉及硬件采购和软件调试等方面的成本投入。另一方面,在大语言模型投入使用后,还需要投入人力物力进行持续监控,及时解决运行故障,尤其在模型投入初期更为重要。此外,档案工作具有其独有的属性,若忽视了安全和保密工作,可能会导致模型被窃取、数据泄露或遭受恶意攻击等安全和隐私风险。大语言模型部署运行与系统维护成本虽会随着模型的运行时间增加而减少,但对于部分档案机构而言仍是一笔不小的投入。因此,档案机构需审慎评估和控制成本风险,确保模型安全稳定运行。

  1.3   档案工作人员使用大语言模型的培训与适配成本

  大语言模型在档案工作现代化的应用,还需考虑档案工作人员使用新技术的培训和适配成本。尽管档案工作人员已接受过系统的档案专业教育,对传统的档案工作理论、方法和流程了如指掌,但可能缺乏大数据、人工智能等前沿技术的相关知识和技能。为了提升档案工作人员对大语言模型的熟练掌握度和应用能力,需组织专业培训,包括模型基本原理、功能介绍、界面操作等使用知识,以及模型的局限性、潜在风险、使用禁忌等应用培训。培训形式可灵活多样,如线上课程、现场讲座、实操演练等,但需要投入相应的师资、场地和时间等成本。同时,引入大语言模型可能需要重新梳理和优化业务流程,建立人机协同的工作机制。这一过程中,又需投入额外的时间和精力成本。因此,大语言模型在档案工作现代化中的应用,不仅需考虑技术成本,还需投入必要的人力资本。

  2  档案工作者使用大语言模型意愿的影响因素研究

  2.1   技术接受度对使用意愿的影响

  档案工作者对大语言模型的接受程度,直接影响其使用新技术的意愿。根据技术接受模型(Technology Acceptance Model,TA M)理论,感知有用性和感知易用性是决定用户接受新技术的两个关键因素。感知有用性是指用户主观认为使用某项技术可以提升工作绩效的程度;而感知易用性则是指用户主观认为掌握某项技术的难易程度。当档案工作者认为大语言模型可以显著提高工作效率和质量,并且该技术的学习和操作难度不大时,其使用意愿就会大幅提升[2]。反之,如果他们认为大语言模型的实际效用有限,或者掌握该技术需要投入大量的时间和精力,那么其使用意愿就会降低,甚至可能产生抵触情绪。因此,在向档案工作者推广大语言模型时,一方面,要充分展示该技术在档案工作中的实际应用价值,通过提供真实案例和效果演示,以提升其感知有用性;另一方面,要为其提供易于理解的教程和培训,简化技术的使用流程和界面设计,降低学习曲线和认知负荷,提高其感知易用性。只有档案工作者充分认可大语言模型的有用性和易用性,才能最大化激发其使用新技术的内在动机和意愿。

  2.2   工作习惯与流程适应性对使用意愿的影响

  档案工作者既有的工作习惯和流程适应性,同样会影响其使用大语言模型的意愿。档案工作因其专业性和规范性,已形成了一整套成熟的工作理论、方法和规程。档案工作者经过长期的学习和实践,对现有的工作模式会产生路径依赖,具有较强的惯性。当引入大语言模型后,原有的工作习惯和流程不可避免地会受到冲击和挑战。一些工作环节可能会被简化或替代,同时会提出一些新的任务和要求,档案工作者需要适应人机协同的新型工作方式。心理学研究表明,频繁变更工作流程会引发员工的变革疲劳(change  fatigue),导致抵触和逃避心理。如果档案工作者难以适应快速变化的工作流程,可能会固守原有的工作习惯,排斥使用新技术。此外,大语言模型作为一种智能辅助工具,在使用过程中需要与档案工作者进行频繁的人机交互。人机界面的友好度和交互质量,直接影响档案工作者的使用体验和继续使用意愿[3]。如果大语言模型的人机交互设计不够人性化,缺乏必要的提示、反馈和引导,或者频繁出现交互障碍和失误操作,都会影响档案工作者的使用积极性。

  2.3   领域知识与经验依赖性对使用意愿的影响

  档案工作的专业性和经验依赖性,在一定程度上影响了大语言模型在该领域的应用意愿。档案工作涵盖档案管理、历史研究、文献鉴定等多个学科领域的专业知识,具有综合性和跨领域性[4]。档案工作者需经过系统学习和长期实践,才能掌握档案工作的基本理论、方法和技能。特别是在档案管理实务中,许多判断和决策都高度依赖于档案工作者多年累积的个人经验和隐性知识,这些经验和知识难以用明确的规则和程序来概括。引入大语言模型,意味着将专家的某些判断会交给智能算法来处理,但目前的大语言模型在处理档案领域的专业知识时,仍存在泛化能力不足、知识度不完善、常识性错误等问题,与人类专家相比尚有一定差距。因此,资深的档案工作者可能会质疑大语言模型能否真正理解和运用档案专业知识,对其给出的答案和建议也缺乏信心,从而降低了使用意愿。而对于经验尚浅的档案工作新人而言,过度依赖大语言模型的智能辅助,可能会替代自身对专业知识的学习和领悟,减少锻炼专业能力的机会,导致专业发展的“去技能化”。从长远来看,这种过度依赖的风险也可能反过来削弱档案工作者接受新技术的积极性。总体来说,档案知识的专业性和经验依赖性,客观上增加了大语言模型学习和应用档案知识的难度,主观上也加大了档案工作者使用新技术的顾虑。

  3  引入大语言模型对档案工作效能的评估与分析

  3.1   档案工作效率提升的定量评估

  引入大语言模型后,对档案工作效率的提升可以从多个量化指标进行考察和评估。首先,可以测算单位时间内的工作产出数量,包括档案编目、数字化加工、主题标引等任务的完成数量和速度。通过对比引入大语言模型前后的数据,可以直观地评估该技术对工作效率的促进作用。其次,可以计算单位工作成本所创造的价值,以此评估引入大语言模型的投入产出效益。档案工作传统上是劳动密集型的工作,主要依靠档案工作者的时间和智力投入,产出的价值与投入的人力成本呈正相关。但引入大语言模型后,算法可以替代部分人力,减少人均处理档案的时间和精力,进而降低单位知识产出的人力成本。最后,可以对比引入大语言模型前后的人力投入产出比,以评估其对组织人力资源配置效率的优化作用。在传统的档案管理工作中,受限于人力资源的数量和专业能力,往往存在任务分配不均、人力闲置浪费等问题,影响了组织的整体工作效率。引入大语言模型后,可以利用算法处理大批量的重复性、规则性工作,释放档案工作者的时间和精力,使其能够投入具有更高附加值及创造性的工作中,如档案开发利用、编研服务等。

  3.2   档案工作质量改善的定性分析

  引入大语言模型不仅能够提升档案工作效率,还能从多个维度改善工作质量。然而,这种质量提升效果往往难以直接量化,因此需要辅以定性分析的方法。一方面,传统的档案标引和检索往往依赖档案工作者的个人知识和经验,这导致同一内容的标引和检索结果因人而异,具有较大的主观性和随意性。而大语言模型的应用可以提高档案信息标引和检索的查准率和查全率,从而改善档案开发利用的质量和效果。另一方面,大语言模型可以强化档案信息的知识关联和语义串联,提升档案信息的组织质量和集成价值。在大语言模型的助力下,可以跨越档案资料的物理界限,根据其语义相关性,挖掘不同档案之间的内在联系,揭示档案所反映的历史全貌。将零散的档案条目映射到知识图谱中,并利用大语言模型的知识推理能力,可以构建档案资料的关联网络,实现档案的知识化组织与关联检索。

  3.3   档案工作创新性评估

  基于大语言模型的语义理解和知识生成能力,档案工作的流程优化、知识挖掘、智能服务等领域正不断涌现出诸多创新应用场景。这些创新实践的广度、深度和力度,构成了评估大语言模型应用成效的关键维度。

  就应用创新的广度而言,大语言模型可以渗透到档案工作的采集、整理、编目、保管、统计、鉴定、开发等各个业务环节,形成全流程的智能化创新格局,为传统档案业务流程赋能,实现降本增效。就应用创新的深度而言,大语言模型不仅能够对档案业务流程进行优化再造,更能深度融合档案核心业务,创造其新的工作方式和服务模式,实现档案价值的最大化与延伸。将碎片化的档案知识进行语义关联和情境化再现,形成立体化、沉浸式的档案知识服务体系,不仅拓展了档案价值的深度和广度,而且为档案知识服务注入了新的活力。就应用创新的力度而言,大语言模型的引入能引发档案工作理念的系统性重构。大语言模型为档案工作提供了智能内核,使档案部门从“守藏”走向“智藏”,从“静态资源”管理走向“动态智能”服务,激发了“用户思维”“服务思维”和“创新思维”。

  参考文献

  [1]皇甫超.大语言模型在档案实践中的应用研究[J].山西档案,2024(1):128-131.

  [2]张婷婷.企业档案部门对大语言模型的使用意愿影响因素研究[J].山西档案,2023(5):112-117,107.

  [3]张烨.基于UTAUT模型的综合档案馆馆员对人工智能技术的接受意愿研究[J].山西档案,2024(6):124-128.

  [4]聂曼影.档案专业人员任职能力体系研究[J].档案学研究,2021(5):23-27.

  【作者简介】郑春玉(1986—),女,汉族,四川达州人,武警警官学院副教授,硕士,研究方向:汉语言文字学方向。