基于语料库的中国古代档案语言研究

发布时间:2025-01-08 08:32:55被阅览数:174 次信息来源:《山西档案》

  作者:王淑娟

  摘要:中国古代档案作为一种宝贵的文化资源,是文化传播的重要媒介,也是承载文化的重要载体,更是我国传统文化中不可或缺的重要组成部分。中国古代档案语言博大精深,蕴含着丰富的制度文化内涵,是中华民族的智慧结晶。然而,传统档案语言研究主要依靠定性分析,其系统性、科学性有待加强。通过引入语料库方法,以中国古代典籍档案文献为研究对象,系统梳理古代档案语言的发展脉络,重点探讨古代档案术语的起源演变和体系构成,并总结语料库在古代档案语言研究中的具体应用。将语料库引入中国档案语言研究,不仅拓展了档案学研究方法,也为构建中国特色档案学理论体系提供了新视角。

  关键词:中国古代档案语言;古代档案术语体系;语料库;术语考证;语言演变

  长期以来,档案工作在我国国家治理体系和治理能力现代化中发挥着基础性、战略性作用。党的十九届四中全会强调,要“坚持和完善中国特色社会主义制度,推进国家治理体系和治理能力现代化”。2021年印发的《“十四五”全国档案事业发展规划》指出,要推进档案治理体系和治理能力现代化,加强档案资源体系建设,推动档案工作创新发展。在此背景下,加强档案语言研究,有助于全面贯彻新时代档案工作方针,加快构建中国特色档案学理论体系和话语体系,进而提升我国的档案治理能力。与此同时,随着语料库语言学的兴起和发展,语料库方法已经广泛应用于各领域语言研究中,极大地推动了语言研究的科学化、精细化、定量化发展。语料库方法以其客观、真实、系统等优势,为挖掘、分析和利用各类语言资源提供了有力工具[1]。然而,纵观档案语言研究领域,尽管已有学者开展了中国古代档案用语研究[2],但总体而言,档案界运用语料库方法开展古代档案语言研究的成果还较为匮乏。中国古代档案资料汗牛充栋、浩如烟海,蕴藏着丰富的语言资源,亟须利用新一代信息技术进行有效开发与高效利用。

  1  中国古代档案术语体系

  1.1 中国古代档案术语的基本概念与特点

  档案术语是用来表达或限定档案领域一般概念的语言指称。档案术语体系是反映档案理论的概念系统。中国古代档案术语源远流长,内涵丰富,具有鲜明的历史文化特色。一方面,中国古代档案术语植根于中华传统文化,吸收了古代典章制度、史学著作等特点,凝结了古代知识分子治学、为政的智慧。另一方面,古代档案术语伴随档案事业的发展而不断演进,呈现出继承性与创新性并存的特点。古代档案工作者在实践中不断总结提炼,形成了一系列兼具理论深度和实践价值的档案术语,折射出中国古代档案事业的发展脉络。因此,系统梳理中国古代档案术语,对于传承中华优秀传统文化,挖掘古代档案管理智慧,具有重要的理论价值和现实意义。

  1.2 中国古代档案术语体系的类别

  1.2.1 档案载体术语

  中国古代档案载体种类丰富,诸如殷商时期的甲骨、金文,西周时期的竹简、帛书,直到东汉纸张的出现,纸逐渐成为主要载体。与档案载体相关的术语有“简”“册”“缣”“纸”等。其中,“简”最早见于《诗经》,是用竹片或木板制成的书写材料;“册”原指用竹简编联在一起的书籍,后泛指书籍、文件;“缣”主要指丝织品,以帛书为载体的档案称为“缣素之书”;唐宋以后,纸张档案日益增多,“纸”遂成为档案载体的代名词。由此可见,档案载体术语反映了中国古代档案事业随社会生产力发展而不断进步的历程,成为维系传统文化一脉相承的纽带。

  1.2.2 档案收集整理术语

  中国古代档案工作十分重视档案的收集整理,形成了一整套术语体系,如“藏”“敛”“聚”“纳”等术语均都体现了档案收集之意,“简”“编”“缀”“综”“绎”等术语体现了档案整理之意。值得一提的是,古籍中常见“简编”“编次”“综核”等术语,反映出中国传统档案整理重视分类与编目。此外,宋代周湛创立的“千文架阁法”,开创了案卷与目录融为一体的档案管理模式,使宋代的档案事业发展到了一个新高度,形成了全国性的架阁库管理制度,堪称古代档案整理的典范[3]。因此,中国古代档案整理术语体现了“以类相从”“诚实准确”的基本原则。

  1.2.3 档案保管利用术语

  中国古代同样十分重视重要档案的存储保管,由此形成了丰富的档案保管术语。其中,“府”“库”“阁厨”“架”“柜”等术语既指代档案保管场所,也体现了古人根据档案性质特点而设置不同库房的智慧。此外,“秘”“封”“闭”“禁”等术语体现出了古代档案保密的观念。与此同时,中国古代也重视档案的开放利用,相关术语有“索”“检”“阅”“览”等。这些术语的广泛使用,反映出中国古代档案利用服务水平不断提高,逐步形成了存用兼顾、统一服务的基本理念。

  1.3 语料库视角下古代档案术语的考证辨析

  1.3.1 古代档案术语溯源

  在古代档案术语溯源方面,传统的古代档案术语考证主要依靠文献辨析和训诂考据,存在考证不足、界定不清等问题。那么,通过构建古代档案语料库,利用词频统计、共现分析等方法,能够揭示术语在不同历史时期的分布与演化特征,从而推断出档案术语产生的年代和背景。以“档案”一词为例,学界对其起源存在争议。王金玉利用文献资料指出“档案”一词来源于宋代“架阁文字”的演变。通过语料库共现分析可以发现,“文书”“文籍”“文案”“文档”等词与“架阁”在古籍档案文献中常常同时出现,进一步验证了“档案”源于“架阁”的可信度。由此可见,语料库为古代档案术语溯源研究提供了数据支持和实证依据。

  1.3.2 古代档案术语辨析

  语料库的构建也为古代档案术语的辨析提供了技术手段。古籍异文、版本讹误等造成术语歧义的情况屡见不鲜,成为档案术语考证的难点。传统辨析主要凭借个人考证和文献互证,存在主观性强、说服力不足等局限。语料库可通过全文检索、对比分析等方式,全面梳理文献线索,从文献记载和字形比对等方面,客观呈现出术语演变轨迹,进而提高术语辨析的科学性。因此,语料库为古代档案术语辨析提供了全新视角,开辟了新的技术路径。

  2  中国古代档案语言的演变

  2.1 中国古代档案语言的发展脉络

  中国古代档案语言伴随着档案事业而产生和发展,其发展历程与中国古代社会发展的历史进程相呼应。从新石器时期开始,人们利用文字载体记录信息,产生了珍贵的原始档案。到夏商周时期,王位世袭制形成,甲骨文、金文等载体应运而生,档案语言初具规模。再到秦汉魏晋南北朝时期,中央集权制度形成并发展,纸张发明后并被广泛应用,档案语言得到进一步完善。直到隋唐时期,律令制成熟,馆阁制等形成,使得档案语言臻于完备。宋元明清时期,档案管理制度日趋完善,档案编纂成就卓著,档案语言的发展也到了稳固时期。由此可见,中国古代档案语言应时代需求不断演进,呈现出与社会发展同频共振的阶段性特征。

  2.2 中国古代档案语言演变的影响因素

  中国古代档案语言的演变受多种因素影响,其中政治、经济、文化等社会因素起到关键性作用。展开来讲,首先,中国古代档案事业服务于君主专制统治需要,政治制度决定档案工作导向,进而主导档案语言的取向。例如秦汉以来,皇权至上观念主导着国家的档案工作,“秘”“禁”“阁”“闭”等术语高频出现。其次,经济基础的影响。政府财政收支与赋税征收是古代档案形成的重要来源之一,财政税收制度的变迁影响档案语言的创新。如唐宋财政管理日趋精细,“会”“计”“籍”“算”等档案术语应运而生。再次,中国传统文化重视文献书籍,儒家诚信思想、史学修史理念等深刻影响着档案语言的演变。诸如“信”“实”“核”“考”等术语的出现体现了实事求是的价值追求。

  2.3 语料库视角下古代档案语言的演变规律分析

  通过梳理发现,传统研究主要从学理分析、文献辨析等定性视角来阐释档案语言演进历程,而定量分析研究则相对匮乏。鉴于此,通过运用语料库相关技术,既能够全面梳理档案语言发展脉络,又能揭示档案语言分布频次、共现关系等数理特征,为定量分析奠定基础。例如,通过构建历代档案语料库,进行词频统计可以客观呈现档案核心术语在不同时期的分布情况,把握术语的兴衰更替。此外,通过共现分析还能够揭示档案术语之间的关联关系及其演化特征。如隋唐时期“藏”“秘”二字常常同时出现,这反映了统治者将档案视为机密的观念;而明清时期“存”“用”一起出现的频率大幅提升,则反映了古人档案利用观念的觉醒。由此可以得出,语料库有助于系统揭示档案语言的动态演进规律,为古代档案语言研究提供了崭新的定量分析工具。

  3  语料库在中国古代档案语言研究中的应用

  3.1 语料库在古代档案语言研究中的优势

  语料库为中国古代档案语言研究提供了全新的技术手段和实证路径。传统档案语言研究主要依靠文献辨析、学理阐释等定性方法,由于文献资料获取不全面、手工处理耗时费力,运用这些方法难以对档案语言形成系统性认识。反之,语料库为古代档案语言研究提供了丰富的文献资源。档案文献分散存储于各地图书馆、档案馆,集中利用难度大。通过构建相应的语料库,能够对原始文献进行规范化加工整理,集中呈现语料的真相,为研究者提供了便捷高效的资源获取途径。此外,语料库还为古代档案语言研究提供了先进的定量分析工具。通过分词、词频统计、共现分析、主题聚类等方法,语料库能够多角度、动态地揭示语言的系统性特征,有助于拓宽档案语言研究视野,创新研究方法,提升研究效率,增强学术研究的科学性、严谨性。

  3.2 语料库在古代档案术语的应用探索

  语料库在古代档案术语考证、术语体系构建等方面的研究实践值得探索。在术语考证方面,传统文献考证重在字音、字形的辨析,难以揭示术语在实际语境中的运用状况。相比之下,语料库有助于梳理术语的历时演变和共时分布,客观再现术语的应用实况。例如,通过语料库分析发现,“封”“藏”“秘”等术语在唐宋档案文献中常常同时出现,这进一步印证了唐宋时期档案保密观念盛行的结论。此外,在术语体系构建方面,语料库可助力揭示古代档案术语的逻辑关联。通过对不同时期档案语料进行聚类分析,能够发现各时期档案术语的核心类目及其分布特点,进而探寻术语体系的内在结构[4]。

  3.3 语料库在中国古代档案语言研究中的发展展望

  语料库作为中国古代档案语言研究的新兴方法和新型资源,其发展空间和应用前景十分广阔。首先,鉴于现有档案语料库多为综合性语料库的组成部分,档案语料库有待进一步精准化、专门化,以构建面向档案语言研究的专门语料库。这不仅需要全面采集古今档案文献,还需要在语料加工标注、信息提取、知识挖掘等方面进行有针对性的优化,以形成适配档案语言研究的专业语料资源。其次,目前档案语言研究对语料库技术的运用尚处于初级阶段,主要集中于术语频次统计等浅层应用。随着深度学习、知识图谱等人工智能技术的发展,古代档案语言研究有望利用情感分析、主题挖掘等智能工具,深入探究古代档案语言所蕴含的情感倾向、价值理念等深层内涵,进一步拓展档案语料库的应用广度和深度。再次,档案语料库研究涉及档案学、语言学、计算机科学等多学科知识,需要多学科协同攻关。未来应着力促进档案学、语料库语言学、数字人文等学科的交叉融合,建立多学科合作机制,促进理论方法、研究资源的共享共用,在多学科视角下推动中国古代档案语言研究实现新的突破。

  参考文献

  [1]娄丽娜.红色档案语料库构建的原则与方法[J].山西档案,2024(1):70-72.

  [2]张阳.语言学角度下的档案术语规范化问题研究[J].山西档案,2024(7):46-49.

  [3]李宗富,杨莹莹.“丈”用千年,“文”澄误传:王金玉中国档案史思想研究:谨以此纪念王金玉老师逝世二十周年[J].档案学研究,2022(6):40-47.

  [4]姚静,加小双,张渼婕.档案开放审核等相关概念的梳理与辨析[J].山西档案,2024(2):18-25,42.

  【作者简介】王淑娟(1985—),女,汉族,河南濮阳人,濮阳医学高等专科学校讲师,硕士,研究方向:语言文学,比较文学,教育研究等。