语言学理论在档案领域的应用研究

发布时间:2024-12-25 08:14:59被阅览数:281 次信息来源:《山西档案》

  作者:张泽建

  摘要:探讨了语言学理论在档案领域的应用。首先,概述了结构主义语言学理论,分析了其在档案著录、档案分类和档案编目中的应用;其次,介绍了认知语言学理论,讨论了其在档案标引、档案检索中的应用;再次,总结了语料库语言学理论,阐述了其在档案语言资源建设、档案文本挖掘中的应用。通过系统梳理三大语言学流派的相关理论及其在档案工作中的应用,展现了语言学理论对档案工作的重要指导意义,为推动档案语言研究与档案事业发展提供了新的视角和路径。

  关键词:认知语言学;结构语言学;语料库语言学;档案管理

  档案工作是以档案为对象,以管理和利用档案信息资源为目的的一项专业活动。在档案工作的方方面面,语言发挥着重要作用。档案工作者依托语言对档案进行著录、标引、编目等,档案用户则通过语言实现对档案信息的检索和获取。由此可见,语言在组织、揭示、利用档案信息的过程中占据不可或缺的地位。

  作为研究语言的学科,语言学为档案语言研究提供了理论基础和方法指导[1]。运用语言学理论分析档案语言现象,总结档案语言规律,既有助于提升档案工作的科学化、标准化、规范化水平,也为档案语言本身的发展完善提供了助力。

  本文拟从结构主义语言学、认知语言学、语料库语言学三大语言学理论切入,系统探讨其在档案领域的应用。通过梳理相关理论要点,分析典型应用实践,展现语言学理论对档案著录、档案分类、档案标引、档案检索等工作的支撑和引领作用,为推进档案语言研究、完善档案语言理论体系提供参考。同时,本文也试图从宏观层面对语言学理论与档案学的融合发展进行探索,为开拓档案学研究的新领域、新方向提供思路,推动档案事业的创新发展。

  1  基于结构主义语言学的档案领域应用

  1.1  结构主义语言学理论概述

  结构主义语言学或称结构语言学,是指20世纪以费尔迪南·德·索绪尔的语言学理论为代表以及受这种理论影响而进行的语言理论研究。索绪尔提出语言是一个由符号构成的系统,符号之间存在着聚合关系和组合关系[2]。在其看来,语言学研究应该关注的是语言内部的结构,而非语言的外部表现。

  结构主义语言学强调语言的系统性和结构性,认为语言是一个自给自足的系统,语言结构可以独立于语言的使用而存在。语言系统由一系列要素构成,这些要素之间存在着一定的关系,共同构成了一个有机的整体。结构主义语言学的目标是揭示语言系统内部的结构关系,探寻语言要素之间的组合规律。

  1.2  结构主义语言学在档案著录中的应用

  档案著录是在编制档案目录时,对档案的内容和形式特征进行分析、选择和记录的过程。在这一过程中,档案工作者需要运用特定的语言将自然语言转化为标准语言。结构主义语言学为档案著录过程中语言的规范化和标准化转化提供了理论依据。

  结构主义语言学关注语言单位之间的聚合和组合关系。在档案著录中,可以将档案著录项看作最基本的语言单位。各个著录项之间并非孤立存在,而是以一定的逻辑关系组合在一起,共同构成完整的档案著录。运用聚合关系和组合关系的概念,可以分析不同档案著录项之间的关联方式,揭示档案著录语言的内在结构。此外,基于结构主义语言学的观点,还可以对档案著录规则进行理论分析。档案著录规则所规定的著录项设置、著录细则等,实质上反映了编制者对档案语言结构的特定认识。通过系统分析现有档案著录规则,可以发现其背后隐含的语言学预设,评估这些预设的合理性,进而提出优化建议,使著录规则更加符合档案语言的内在规律。

  1.3  结构主义语言学在档案分类中的应用

  档案分类是将档案按照一定的原则和方法进行组合与排序的过程。合理的档案分类可以揭示档案之间的内在联系,促进档案信息的组织与揭示。结构主义语言学为档案分类提供了新的理论视角和方法论指导。

  语义场理论是结构主义语言学的重要组成部分。语义场是指一组语义相关的词语所构成的集合,这些词语在语义上相互影响、相互依存,构成一个稳定的结构体系。利用语义场理论,可以对档案主题词进行系统化的语义分析,挖掘主题词之间的语义关联,构建科学的档案分类体系。通过分析档案主题词所属的语义场,可以揭示不同主题之间的逻辑关系,发现新的档案类目,优化已有的分类方案。

  1.4  结构主义语言学在档案编目中的应用

  档案编目是对档案按照一定的著录规则进行描述和标识的过程。档案编目的核心是对档案题名等检索点信息的著录和规范控制。结构主义语言学可以为档案编目工作提供理论支撑和实践指导。

  档案题名是档案的名称和标识,是读者检索和识别档案的主要途径。运用结构主义语言学的方法,可以从语言结构的角度对档案题名进行系统分析。通过研究题名的语法结构、词汇选择、修辞方式等,可以总结档案题名的构成规律和语言特点,从而提出规范化的档案题名著录方法。规范化的档案题名语言有利于提升档案的可检索性和识别度,方便读者快速、准确地查找所需档案。结构主义语言学还可以指导档案编目语言的规范化研究。档案编目语言是由编目规则、元数据标准、受控词表等构成的语言体系,其规范化水平直接影响档案编目的一致性和互操作性。基于结构主义语言学理论,可以分析编目语言的结构要素,揭示不同要素之间的关系,优化档案编目语言的组织方式。通过借鉴语言学的研究方法,可以开发档案编目语言的词典和语法规则,建立编目语言的应用标准,提高档案编目语言的规范化水平,推动档案编目实践的标准化发展。

  2  基于认知语言学的档案领域应用

  2.1  认知语言学理论概述

  认知语言学是语言学的一门分支学科,它以第2代认知科学和体验哲学为理论背景,在反对主流语言学转换生成语法的基础上诞生,在20世纪80年代后期至20世纪90年代开始成型。它以人的认知能力为基础,探讨语言与认知之间的关系。认知语言学家认为,语言是人类认知的产物,语言的结构和功能都与人的认知密切相关。

  认知语言学的两大理论支柱是概念隐喻理论和原型理论[3]。概念隐喻理论认为人们在认知过程中,往往借助一个熟悉的概念去理解另一个抽象的概念,这种跨域映射的认知机制普遍存在于语言表达中。原型理论则指出,人们对事物的认知和分类,通常以某个典型的成员为中心,形成一种辐射状的层级结构。处于中心地位的成员叫做原型,其他成员按照与原型的相似程度排列在原型周围。

  2.2  认知语言学在档案标引中的应用

  档案标引是为档案内容选取标引词,揭示档案主题的过程。传统的档案标引通常采用基于规则的方法,按照主题词表或叙词表进行规范化处理。然而,面对日益增长的档案信息,这种方法存在主题揭示不足、词表更新滞后等问题。认知语言学为解决这些问题提供了新的思路。

  根据概念隐喻理论,档案标引过程可以看作是一种隐喻映射,即用标引词这一熟悉概念去匹配、描述档案内容所表达的抽象主题。在这个过程中,标引者的认知经验和领域知识发挥着重要作用。借鉴概念隐喻理论,可以开发基于认知的档案标引方法。这种方法不拘泥于固定词表,而是充分利用标引者的认知能力,灵活地选取恰当的标引词,以便更准确地揭示档案主题。此外,运用概念隐喻理论还可以分析档案标引词的隐喻模式。通过系统梳理档案标引实践中的隐喻表达,归纳隐喻使用的规律,可以发现档案工作者的认知特点,进而优化档案标引词表的设计,提高标引词的认知相关性和用户接受度。

  2.3  认知语言学在档案检索中的应用

  档案检索是利用检索词对档案进行查找、定位的过程。高效、准确的档案检索可以帮助用户快速获取所需信息。认知语言学为优化档案检索提供了理论基础和方法指导。

  原型理论揭示了人类认知范畴的层级结构和典型性特征。运用这一理论,可以对档案用户的检索行为进行分析。通过实验和调查,可以发现用户检索词表达的原型特征,构建档案检索的认知原型模型。基于该模型,可以对档案检索系统的查询扩展机制进行优化,当用户输入某个检索词时,系统能够根据原型信息自动生成相关词,拓展检索范围,提高查全率。

  认知语言学还为档案本体的构建提供了理论支持。档案本体是对档案领域知识的形式化表示,它以概念为核心,刻画概念之间的语义关系。引入认知语言学理论,可以突破传统本体构建方法的局限,更多地考虑用户认知和实际需求。在概念层次、属性描述、关系定义等方面,都可以运用认知语言学的研究成果,设计符合用户认知习惯的档案本体,从而为档案检索提供更智能、更友好的语义支持。

  3  基于语料库语言学的档案领域应用

  3.1  语料库语言学理论概述

  语料库语言学主要研究机器可读的自然语言文本的采集、存储、检索、统计、词性和句法标注、句法语义分析,以及具有上述功能的语料库在语言定量分析、词典编纂、作品风格分析、自然语言理解和机器翻译等领域中的应用。

  语料库可以分为通用语料库和专门语料库两大类。通用语料库收录特定语言的各类言语材料,体现了语言的一般特点;专门语料库则聚焦于某个特定领域,展示该领域语言的专业性特征。语料库语言学采用定量与定性相结合的研究范式,既注重语言事实的客观描写和定量分析,也重视对语料的定性解读和理论概括。

  语料库语言学为档案语言研究开辟了广阔的空间。海量的档案文本构成了档案领域独特的语料,对其进行系统采集、加工和分析,可以全面考察档案语言的内部规律,揭示档案语言的独特性质,进而为档案工作实践提供语言学支撑。

  3.2  语料库语言学在档案语言资源建设中的应用

  档案语言资源是指服务于档案工作的语言材料,主要包括档案文本、元数据、规范词表等。高质量的语言资源是开展档案语言研究的前提和基础。语料库语言学为档案语言资源建设提供了理论指导和实践路径。

  档案文本是档案语料库建设的核心内容。按照语料库语言学的思路,档案文本收集应覆盖不同载体、不同门类、不同时代的档案,尽可能反映档案语言的多样性。同时,还要重视对档案文本的数字化、结构化加工,提高语料质量。随着档案数字化的推进,数字档案日益增多,极大地方便了档案语料的获取和处理。数字档案可以直接转化为机读文本,经过元数据标注、结构分析等处理步骤,形成高质量的档案语料库。

  基于语料库语言学理念,档案领域专业语料库的设计和构建成为重要应用方向之一。专业语料库围绕特定档案门类或工作领域,有针对性地收集语料,展现该领域语言运用的专业化特点。专业档案语料库可用于档案术语研究、档案体裁分析、档案语言标准化等多个方面。例如,通过建设红色档案语料库,可以提高档案资源的价值,不断扩大红色档案的影响范围[4];构建档案编目语料库,可以研究档案著录的语言特征和著录规则;开发档案主题词语料库,可以辅助主题词表的编制与优化。

  3.3  语料库语言学在档案文本挖掘中的应用

  档案文本蕴含着丰富的信息和知识。如何从浩瀚的档案文本中发现有价值的内容,揭示事物之间的内在联系,是档案工作面临的重要课题。语料库语言学为档案文本挖掘提供了新的技术手段和方法视角。

  语料库为档案文本挖掘奠定了数据基础。通过对大规模档案语料的收集和加工,可以建立起覆盖面广、时间跨度大的档案语料库。这不仅为定量研究档案用语提供了翔实的语言事实,也为基于统计的文本分析方法创造了条件。利用档案语料库,可以从词汇、句法、语义等多个维度对档案文本进行考察,发现档案语言使用的共性与个性,探索档案文本内容组织的一般规律,为档案文本挖掘提供理论支撑。

  档案主题和内容是文本挖掘的重点对象。通过对档案语料库进行主题模型训练,可以自动识别档案的隐含主题,提取文本的关键词,实现档案内容的自动分类。将档案语料按照主题进行聚类,可以发现不同主题之间的关联,进一步挖掘档案知识背后的深层语义结构。此外,追踪档案主题的历时演变,有助于揭示特定历史时期的社会文化图景,把握档案反映的宏观历史进程,为历史研究提供新的佐证。

  参考文献

  [1]周丽霞,田力仁.权利、记忆、语义视角下档案概念重塑[J].山西档案,2023(5):12-17,11.

  [2]黄秦安.结构主义语言学视域下对逻辑主义认识论的再审视[J].陕西师范大学学报(哲学社会科学版),2018(3):82-87.

  [3]廖巧云,翁馨.具身认知语言学研究的国际前沿与发展趋势[J].现代外语,2024(1):137-147.

  [4]娄丽娜.红色档案语料库构建的原则与方法[J].山西档案,2024(1):70-72.

  【作者简介】张泽建(1980—),男,汉族,河南南阳人,郑州旅游职业学院副教授,学士,研究方向:汉语言文学、旅游职业教育教学改革与研究。