发布时间:2024-08-30 19:42:53被阅览数:141 次信息来源:《山西档案》
作 者:赵季若
摘 要:音乐类档案资源蕴含丰富的音乐艺术与文化内涵,但是传统的档案管理模式难以充分揭示其知识价值。立足数字人文视角,探索音乐档案资源知识组织理论方法的创新,推动档案学与数字人文研究的深度融合。分析音乐档案资源的独特特征,提炼数字人文环境下音乐知识组织面临的机遇与挑战,在此基础上构建出音乐类档案资源知识组织体系,包括用户需求、本体构建、语义描述、非语义情感表达与语义关联、知识图谱构建、知识共享平台等核心环节。采用的理论视角与技术路径为新时代背景下音乐档案资源领域内知识组织方法的革新提供了新思路。
关键词:音乐档案;知识组织;数字人文;知识图谱;资源整合
伴随着信息技术的飞速发展,数字人文(Digital Humanities)作为人文学科与计算机技术交叉融合的产物,为传统人文社科研究开辟了全新的路径。以大数据、人工智能为代表的新一代信息技术迅猛发展,为数字人文研究提供了前所未有的技术支撑,促进了数字人文理念与方法的创新和学科内涵的拓展[1]。作为图情档案领域的重要资源,独特且专业的音乐档案在记录音乐发展脉络、传承音乐文化遗产等方面蕴含着丰富的艺术价值与历史价值。后现代档案学思潮的兴起为音乐档案与数字人文的深度融合提供了理论契机。然而,音乐档案资源作为典型的多模态数据,其知识组织难度远大于一般的文本型档案资料,音乐档案资源类型多样、专业性强,给知识组织与管理利用带来诸多挑战。目前,对音乐档案资源的知识组织尚处于探索发展阶段,亟须引入数字人文理念与技术,以突破传统档案管理模式的局限。如何在数字人文视角下深度挖掘音乐档案的语义内涵,推动其知识组织方式的变革,实现多维关联、情境化呈现与智能应用,是本文的主要研究问题。因此,本文拟在梳理已有研究的基础上,结合数字人文的核心理念,探讨数字环境下音乐档案研究的新思路、新方法。首先,通过分析音乐档案资源的构成与特征,总结出当前音乐档案领域知识组织面临的一些问题。其次,通过阐述数字人文视角下音乐档案资源整合与知识组织的新思路,构建音乐档案资源知识组织体系,包括用户需求、本体构建、语义描述、非语义情感表达与语义关联、知识图谱构建、知识共享平台等核心环节。音乐档案资源知识组织体系的提出有助于推进档案学与数字人文在研究路径与方法层面的交互共享,实现传统档案理论方法与数字技术的协同创新,对于发掘音乐档案资源的深层价值,促进中国特色档案事业、文化产业的繁荣发展具有重要意义。
1 音乐档案资源的构成、特征、现状分析
1.1 音乐档案资源的构成
音乐档案资源主要由数字资源与非数字资源两大类构成。其中,数字化音乐档案资源主要包括三种:一是反映地域音乐非遗及名人资料的专题数据库,如西安音乐学院的西北鼓乐与陕北民歌数据库;二是与院校学科专业相关的特色资源库,如天津音乐学院的音乐美学史教学辅助库;三是由图书馆自建的馆藏文献数字化产品,如中央音乐学院的馆藏视频资料库等。非数字化音乐档案资源类型更加多样化,如从载体形态看涵盖图书文献、音像资料等,从内容属性看包括学术研究、音乐文化、教学教材、器乐说明、机构管理等。其显著特点是:相比于日趋同质化的数字资源,这些非数字化资源更能体现各类馆藏的专业特色、学科特色和地域特色。尤其是其中大量未经出版发行的手稿、采风资料、古籍、文书、自制音像制品等灰色文献,专业性与稀缺性更高,是音乐档案资源中的珍贵组成部分[2]。
1.2 当前音乐档案资源的特征
音乐档案资源的特征主要集中体现在资源种类多样化、专业性强和资源整合难度大这三个方面。首先,音乐档案资源不仅形态丰富,囊括纸质、音像、数字等不同的媒介载体,涉及音乐文献、音乐文化、学术研究、教学等诸多专业领域,不同属性的资源在管理与利用方式上存在较大差异。其次,无论是专业性的音乐元数据,还是特定领域的音乐术语,都对音乐这类特殊档案资源的知识组织提出了较高的专业要求[3]。再次,音乐艺术还有其特有的情感属性,用一般性的语义化方式很难准确表述音乐所蕴含的丰富情感。最后,海量多源异构的音乐档案资源给资源整合带来较大困难,传统的编目、著录等方法难以实现多维异构资源的有机融合,音乐档案资源语义关联缺失,知识揭示不足。这些问题制约了音乐档案资源管理与利用效能的充分发挥。
1.3 音乐档案资源知识组织的阻碍分析
纵观国内音乐档案资源管理与利用的现状,在知识组织层面还存在一些亟待解决的问题,主要表现在以下几方面:首先,音乐档案资源数字化进程参差不齐,实体馆藏与数字馆藏严重失衡。多数音乐院校图书馆、档案馆拥有大量珍贵的纸质乐谱、音像资料等非数字化档案资源,但受制于经费、技术等诸多因素,数字化进程难以跟上时代发展的步伐,无法满足数字人文研究对数据的规模化需求。其次,当前音乐档案部门对资源的语义描述不充分,导致其缺乏深层知识挖掘。目前音乐档案的标引与揭示,主要停留在作品题名、创作者、演奏者等外显信息的层面,对音乐内容本身如音符、旋律、节奏、情感等隐性特征缺乏深入的语义表达,更谈不上运用数据挖掘、机器学习等技术去实现基于内容的知识发现。最后,关于音乐档案资源的编目元数据缺乏语义化,促使多源数据整合面临诸多困难。例如,从元数据应用的角度看,国内音乐档案的元数据方案主要采用MARC、DC等通用格式,在表现音乐档案的专业性特征方面尚有不足,导致多源音乐档案资源的元数据在命名、结构等方面差异较大,缺乏基于统一本体框架的标准化表示,阻碍了多源数据的关联融合。
2 音乐档案知识组织体系的设计与实现
随着数字人文的发展与音乐档案数字化进程的推进,传统的音乐档案知识组织模式难以适应数字环境下海量多源异构音乐资源的融合与深度价值挖掘。因此,亟须综合运用人工智能、大数据分析、知识图谱等数字人文领域极具代表性的现代信息处理技术,构建集资源整合、信息抽取、知识挖掘为一体的音乐档案知识组织新范式。本节从技术应用与功能实现层面,重点探讨音乐档案知识组织系统的总体设计思路与关键任务。
2.1 梳理体系设计总体思路
面向数字人文研究的音乐档案知识组织体系应具备海量数据整合、知识关联发现、用户交互响应、智能分析决策等多方面核心理念。因此,在系统设计过程中,需要以应用需求为牵引,以技术创新为支撑,对音乐档案异构数据、领域知识进行系统梳理、语义提取与关联融合,搭建起由本体、分类、词表、主题等构成的音乐知识框架,进而为面向用户服务的搜索、推荐、可视化与共享功能的知识服务夯实基础。
2.2 确定目标用户和任务场景
数字人文研究具有问题导向鲜明、实践为主的特点。因此,音乐档案知识组织体系的构建,必须立足于真实的研究问题与应用场景,以用户需求为中心,开展精准化的档案资源需求分析。首先,根据音乐类数字人文研究中的典型任务场景,归纳出音乐学者、艺术家、档案工作者、普通大众等主要用户角色;其次,运用质性研究方法深入挖掘各类用户在音乐知识获取及利用中的行为特征、兴趣偏好、知识需求,构建用户画像,对其中的问题、任务、资源、工具、情境等关键要素进行定义,形成音乐知识服务的典型应用场景库。最后,充分考虑用户差异化需求与多元应用场景,确定知识组织活动的目标指向、过程导向和方法选择。
2.3 建立本体和词汇表
本体作为数字人文研究中对某个特定领域知识的典型形式化表示,是音乐档案知识组织与服务的概念基础。因此,亟须遵循本体构建的一般方法,融合音乐学、档案学的学科特点,构建反映音乐档案领域核心概念、关系的领域本体。首先,采用自顶向下与自底向上相结合的策略,参考并借鉴CIDOC-CRM、FRBRoo等通用文化遗产本体,设计通用本体框架。其次,采用命名实体识别、关系抽取等自然语言处理技术,从海量音乐档案文本中准确定位核心实体(如作品、作曲家、演奏者等),进而构建面向应用的扩展本体。最后,发挥领域专家的作用,开展本体的人工审核、修订,保障其准确性、权威性和一致性,涵盖音乐作品、创作者、流派、演出、唱片等核心品类,为音乐档案知识组织提供统一的概念表示框架[4]。
2.4 构建音乐资源的语义描述体系
音乐档案资源蕴含丰富的显性知识与隐性知识,如何利用新一代信息处理技术准确理解并关联其中的语义信息,是当前音乐类档案资源知识组织面临的首要问题。以生成式人工智能为代表的新一代人工智能技术为音乐类多模态资源的语义描述与信息提取提供了新的思路。例如,首先运用以BERT为首的预训练模型通过高质量训练语料进行领域内模型训练,能够对音乐档案资源的非结构化文本进行深层语义表征学习,自动提取其中的核心概念、关键词和语义结构,形成音乐资源的多维语义特征;其次,借助迁移学习和知识蒸馏等前沿技术,将通用语义模型应用到音乐专业语料的表征训练中,能够显著提升模型对音乐专业语义的理解和表达能力,同时挖掘出音乐实体间的隐性关联,如同时期作曲家的创作风格相似性等,极大地扩展了语义知识的广度和深度;最后,针对音乐资源中存在的非语义属性的语义化表达,可运用深度神经网络模型如CNN、LSTM等对海量音乐评论数据进行情感分析,自动识别音乐不同片段所表达的情感倾向(如欢快、悲伤),并生成相应的情感标签,为音乐类文本数据的分析提供智能决策。多源异构数据的融合语义分析,使得音乐资源的隐性语义得以显性化表达,并通过与显性语义知识的关联,极大地丰富了音乐档案资源知识组织的维度和深度。
2.5 构建领域知识图谱
数字人文环境下,知识图谱是实现音乐档案资源语义关联、揭示隐性知识的关键,通过构建覆盖音乐档案领域的知识图谱,能够充分整合多维音乐资源,实现多维知识的关联融合与智能应用。首先,经过本体构建、分类标引、语义梳理,音乐档案数据已初步具备语义化表示的基础,需要运用语义网技术,以RDF三元组为数据模型,以本体类属性为语义基础,将结构化的音乐元数据、非结构化音乐文本中识别的实体、语义关系进行规范化表示。其次,引入表示学习等机器学习技术,可以将知识图谱中的实体、关系学习用低维向量表示,并通过张量分解、转换模型等预测实体间的隐性关系,进一步增强图谱的关联广度、深度。在图数据库的支持下,以更加灵活、高效的方式组织音乐档案资源及其复杂语义关联,并支持图算法驱动的知识推理、语义搜索等智能化服务。新一代人工智能、大数据分析等现代信息技术的更新迭代为音乐档案资源知识组织注入了新的活力,推动其从传统的资源整合走向智慧化的知识创生。
2.6 建立知识共享平台
数字人文的发展绝不仅限于海量档案资源的数字化进程,更在于实现全域的协同化与共享化。因此,音乐档案不仅需要完成知识组织体系的构建,还需要着眼于打通知识生产、流通、再生产的全链条,搭建开放、协同、创新的音乐知识共享平台。具体来讲,平台的建设首先应秉持开放获取理念,以知识链接为牵引,推动多源异构音乐数据与组织化知识的共享互通。一是遵循语义出版、开放获取的数据发布原则,以RDF、JSON-LD等标准格式将本体、分类、知识图谱等知识组织成果通过API链接等方式共享开放;二是运用Schema.org标记、Microdata嵌入等语义注释技术,实现平台内音乐档案资源与外部开放数据资源的互联互通,使本平台知识组织单元能够被其他数字人文平台更方便地获取和利用。知识共享平台的构建,将进一步唤醒久存的音乐档案资源,在开放链接中释放音乐知识的无限潜能,最终建成一个学者乐享、大众参与、机构协同的音乐档案知识供给与服务新生态[5]。
参考文献
[1]赖茂生.数智时代的知识组织[J].科技情报研究,2024(2):1-10.
[2]单永刚.音乐院校文献资源的整合及知识组织研究[J].大学图书情报学刊,2020(5):95-99.
[3]刘琉,王露露,孔德民.音乐类非物质文化遗产建档的应用方向研究:基于传承与传播的关系辨析[J].档案学研究,2020(2):90-97.
[4]白斌.数字创意视阈下的非物质音乐文化遗产档案建设[J].山西档案,2018(4):136-138.
[5]杨媛.数字人文视域下图书馆音乐资源平台建设研究[J].图书馆工作与研究,2022(7):89-96.
【基金项目】河南省高等教育教学改革研究与实践重大项目“职业教育美育浸润行动特色路径创新探索与实践”(项目编号:2024SJGLX0635)。
【作者简介】赵季若(1985—),女,汉族,河南开封人,开封文化艺术职业学院讲师 ,硕士,研究方向:音乐教育。