发布时间:2024-11-14 18:45:28被阅览数:146 次信息来源:《山西档案》
作者:杜霞
摘要:人工智能技术的快速发展正深刻影响和重塑企业档案管理的理念、模式与流程。聚焦人工智能在企业档案管理中的应用,详细梳理人工智能技术在档案管理领域发展现状的基础上,深入剖析了大数据、大模型、知识图谱等前沿技术在档案收集、整理、保管、利用等环节的典型应用场景。研究表明,人工智能驱动下企业档案管理呈现出主动治理、开放融合、精准服务等新特征,未来“档案馆+AI”的深度融合模式将成为引领行业发展的新趋势。面向智能时代,档案工作应以开放心态拥抱人工智能,以创新勇气驾驭人工智能,推动人工智能在档案领域的深度应用和融合创新,从而为档案事业的高质量发展注入强劲动力。
关键词:企业档案管理;人工智能技术;应用场景;管理模式创新
随着大数据、人工智能等现代信息技术的快速发展,企业的经营管理、生产制造、研发创新等活动产生了海量异构数据,呈现出数据驱动、智能赋能的发展趋势。《“十四五”全国档案事业发展规划》明确提出,要全面加快数字转型和智能升级,强调“加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,推动数字档案馆(室)建设优化升级”[1]。同时还指出,要“主动融入数字经济、数字社会、数字政府建设,推动档案全面纳入国家大数据战略”,“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用”[2]。企业档案作为机构运行和发展过程中形成并积累的具有保存价值的各种载体的历史记录,蕴含着丰富的知识资源,不仅为企业决策提供参考依据,也为企业文化传承提供历史见证。然而,由于企业档案数量庞大、种类繁多、内容复杂,传统的管理模式效率低下且智能化水平不足,因此亟待引入人工智能技术变革档案管理方式,激活档案数据要素,释放企业档案价值[3]。
人工智能赋能企业档案管理,推动档案业务流程优化与再造,是实现档案治理现代化的重要举措和关键路径。通过机器学习、知识图谱、自然语言处理等人工智能技术在档案采集、整理、保管、利用等环节的创新应用,能够显著提升档案管理的自动化、智能化水平,节约人力成本,提高工作效率。同时,智能技术还能深入挖掘档案数据的潜在价值,促进企业知识资产化管理,为企业决策注入数据支撑和知识服务,为企业创新发展和数字化转型注入新动能。开展人工智能技术在企业档案管理中的应用研究,对于推动档案事业与人工智能的融合发展,提升企业档案管理水平,助力企业高质量发展具有显著意义。
1 人工智能技术在档案管理领域的发展现状
1.1 档案业务数字化、智能化转型趋势
在现代信息技术迅猛发展与广泛应用的时代背景下,档案管理领域正经历从传统手工操作向数字化、智能化的转型升级[4]。一方面,电子文件、数字档案的大量涌现,推动档案载体形态从纸质化向数字化转变,工作重心也从实体管理转向数据治理。另一方面,人工智能、大数据分析等技术在档案采集、整理、编目、检索等各环节的渗透应用,驱动档案管理从手工作业向自动化、智能化升级。
各级档案部门积极顺应数字化浪潮,加快数字档案馆建设步伐,推动档案数字化加工和信息资源的开发利用。同时,以人工智能为代表的新兴技术与档案管理深度融合,为破解档案管理中的难点和痛点提供新思路、新方法。例如,机器视觉、光学字符识别 (OCR) 技术应用于档案扫描、识别与全文建库;知识图谱用于构建档案语义关联网络;自然语言处理、语音识别等用于档案内容的深度理解和智能检索;而区块链技术则为档案数据的存证提供可信环境。人工智能赋能档案管理成为新的业务增长点和转型发展方向[5]。
1.2 人工智能技术在档案管理中的探索应用
以自然语言处理为核心的大模型技术和以知识表示为特色的知识图谱,是当前人工智能领域的两大热点前沿。大模型通过海量语料预训练形成通用语言模型,具备语言理解、知识学习与推理等能力,代表系统有GPT-4、ERNIE、CPM等。而知识图谱则采用图数据结构,以实体、关系、属性三元组形式表征领域概念、层级及关联,广泛应用于智能问答、个性化推荐等领域。近年来,大模型、知识图谱等人工智能技术开始在档案管理领域崭露头角,呈现出“百花齐放、百家争鸣”的创新应用态势[6]。
在档案数字化方面,基于深度学习的端到端文字识别系统,实现了对手写体文字、古籍版本的精准识别,突破了传统OCR技术的局限。在档案整理方面,基于档案业务知识库的人工智能归档系统,通过机器学习电子文件的内容、责任者等关键要素,自动完成类目、保管期限的判断。在档案编目方面,知识图谱用于构建档案资源语义关联网络,通过本体构建、实体链接、关系抽取等先进技术,实现了档案多维度、细粒度描述。此外,档案智能检索系统也引入了语义工程技术,利用自然语言理解能力辅助用户表达查询意图,实现了跨档案库、跨载体的一站式检索。
2 人工智能赋能企业档案管理的应用场景
2.1 档案收集与知识获取
在数智时代,企业内外部业务系统众多,除电子文件外,还不断产生海量的非结构化数据,如邮件、即时通讯记录、音视频资料等。传统的档案收集方式难以应对碎片化、非结构化数据采集的难题。引入以自然语言理解为核心的大模型技术,有望突破档案收集瓶颈。具体而言,大模型能够精准识别并深度分析非结构化数据的语义内容,自动提取其中的关键信息要素,如文种、责任者、保管期限等,初步评估归档价值,实现从企业各业务系统智能采集档案数据。同时,大模型凭借其强大的迁移学习和少样本学习能力,能够快速适应不同企业的多样化档案场景,通过向大模型灌输少量的企业档案知识,即可实现档案数据的规范化、精准化采集。
档案蕴含着丰富的显性和隐性知识,人工智能为档案知识发现提供了新思路。一方面,借助深度学习、知识抽取等技术,能够从海量档案文本中自动识别抽取人名、地名、关键词、主题等档案特征,形成结构化、语义化的档案知识单元。另一方面,采用知识表示技术将档案知识形式化、符号化,通过构建覆盖概念、实体、事件、规则等的档案领域本体,将档案知识组织为计算机可理解、可推理的知识图谱,便于智能档案管理的应用。例如,利用命名实体识别和关系抽取技术,可以从合同档案中抽取缔约双方、签订日期、履约标的等要素,按照本体模型组织形成反映合同要素关联的知识图谱。
2.2 档案整理与知识组织
档案分类是整理环节的核心内容,利用机器学习中的文本分类算法,可实现档案的自动分类。通过特征工程提取档案标题、关键词、摘要等文本特征,并基于支持向量机、朴素贝叶斯等监督学习算法,训练档案分类模型,以对新到档案进行自动分类,在提高效率的同时,保证分类的一致性和准确性。此外,采用主题模型、聚类算法等无监督学习方法,能够从档案文本语义层面自动发现档案主题,进行档案聚类,为档案编目、检索提供新的视角。例如,对企业项目管理档案进行主题聚类,可形成产品设计、工艺优化、试制测试等主题类别,便于项目管理人员归纳总结项目经验。
档案之间、档案与其他信息资源之间存在多维度、多层次的内在联系,但目前缺乏有效手段将这些关联显性化、直观化。运用知识图谱技术,可以建立反映档案资源内在联系的语义网络。以企业人事档案为例,先通过命名实体识别抽取出员工档案中的员工姓名、所属部门、岗位、学历等属性信息,再利用关系抽取技术获取员工之间的上下级、同事等关系,进而构建企业人事知识图谱。基于图谱的链接预测、社团发现等图算法,可进一步发现员工之间的隐性关系,洞察组织网络结构。
2.3 档案保管与知识存储
面对海量的档案数据和档案知识,需要制定集中统一、分层分级的存储管理方案。大数据技术为档案数据仓储与知识库建设提供了新手段。档案数据仓储采用Hadoop、Spark等大数据框架,对分散在不同业务系统的结构化、非结构化档案数据进行ETL(提取、转换、加载)处理,之后统一加载至数据湖进行集中存储管理,为档案大数据分析奠定基础。通过建立主题数据集市,支持灵活的多维数据分析需求,使用户能更深入挖掘档案数据的价值。档案知识库则基于图数据库构建,以RDF(资源描述框架)三元组形式存储档案本体和实例化的实体、关系、属性,并建立基于SPARQL的知识检索查询机制。档案数据仓储与知识库通过本体映射实现链接,促进数据、信息、知识的融合集成。
档案数据的完整性、真实性、安全性至关重要,利用新兴数智技术可为档案数据安全提供新保障。例如,采用区块链技术,将档案的形成、转换、归档等各环节数据上链存证,利用区块链的防篡改特性,确保档案来源可追溯、过程可审计。利用水印、数字签名、数字指纹等技术,对档案副本数据进行确权维权。此外,采用联邦学习、加密计算等隐私保护技术,在不泄露原始数据的前提下,实现跨组织、跨部门的档案数据共享利用,兼顾数据安全和价值释放。
2.4 档案利用与知识服务
融合了自然语言理解和检索模型的智能检索系统,能够准确理解用户复杂的自然语言查询意图,并在知识图谱的支持下,实现跨档案库、跨载体的关联检索。当用户输入自然语言查询时,系统基于大模型理解查询语义,并结合档案知识图谱对查询进行扩展,最终匹配、排序并返回相关档案。同时,还可以利用协同过滤、基于内容的推荐等算法,分析用户档案查阅、借阅行为,结合知识图谱推理,实现个性化档案知识推荐,从被动服务走向主动服务。
AR、VR、三维可视化等新兴技术为档案知识的沉浸式体验、交互式传播提供了可能。通过自然语言生成技术,将档案知识图谱转换为通俗易懂的自然语言表述。运用数字孪生、知识驱动的仿真推演等技术,营造逼真的档案知识情境。例如,利用VR技术重现企业厂房发展历程,用户可在虚拟工厂中查看不同时期的设备、工艺档案。三维可视化技术则能够立体呈现复杂的专利、产品结构档案。档案知识可视化与情境化呈现,拓展了档案利用维度,让档案变得更加鲜活立体。
3 人工智能驱动的企业档案管理模式创新与未来展望
3.1 从被动管理到主动治理的转变
随着人工智能在档案管理中的应用渗透,利用机器学习等技术,可以对业务全过程数据进行实时采集和分析,识别档案线索,实现业务活动与档案管理的同步进行。档案工作重心已从传统的事后管理转向事前谋划、事中管控,通过主动采集、主动感知,防患于未然。同时,通过对档案大数据进行智能分析,洞察企业发展态势和风险隐患,为科学决策提供依据,提升档案的“参谋”作用,推动档案管理从被动接收向主动服务、主动治理转变。
3.2 从封闭利用到开放融合的转变
随着企业数字化转型的深入推进,各类业务系统与管理平台不断涌现,亟须打破“数据孤岛”,实现企业内外数据的互联互通和共享开放。档案部门应树立开放思维,运用大数据、人工智能技术,将档案数据、档案知识服务嵌入企业的业务流程与管理平台,实现与人力资源、财务管理、项目管理、客户服务等系统的无缝衔接。通过开放档案编程接口(API),鼓励第三方开发者、科研院所等外部力量参与档案资源的开发利用,共同孵化新产品、新服务,促进多方共建、多元开发格局的形成。
3.3 从粗放服务到精准服务的转变
在“大数据 + 人工智能”的时代背景下,企业员工对档案服务提出更高要求,期望档案部门能够提供个性化、精准化的知识服务。档案服务应从“以档案为中心”向“以人为中心”的转变,通过构建用户画像、分析用户行为等,精准把握员工需求,主动为其推送相关档案知识。结合具体业务场景,为员工量身定制档案知识服务方案。利用虚拟助手、智能客服等人机交互技术,7×24 小时为员工提供在线咨询、问题解答等服务。对特定主题,可有针对性地生成档案知识专题,编制各类知识产品。通过线上线下相结合的方式,开展丰富多样的档案文化活动,增强员工档案意识与利用能力。
3.4“档案馆 + 人工智能”的融合发展模式构想
人工智能、大数据、区块链、5G等新技术的迭代演进,为企业档案管理效能提升和模式重塑持续赋能。大数据为档案资源的大规模集成、深度关联与智能分析提供支撑,数据驱动将成为档案管理的新范式。区块链技术为档案全生命周期追溯和安全存证提供了可信环境。5G与边缘计算的融合应用促进了多元档案的分布式高效采集,而物联网技术使得档案管理延伸至更广阔的信息空间。
展望未来,企业档案馆在数智赋能的推动下,将实现从实体空间走向数字空间、智能空间,档案馆由档案存储场所升级为企业的知识中心、智慧枢纽,全面向智能化管理与智慧化服务跃迁。人工智能技术将与档案馆管理深度融合,形成“档案馆 + 人工智能”的新型发展模式。档案馆将全面应用物联网、5G等技术,实现档案载体、设备与环境的互联互通和智能感知。通过人工智能优化档案资源配置,提高服务效能。馆藏档案通过知识图谱、大模型等技术进行知识化重组,使档案资源从馆藏状态转变为可计算、可利用、可增值的知识资产。通过开发智慧“档案大脑”,实现多源档案融合、跨媒体档案关联,形成反映企业运行全景的知识中枢。档案大数据与业务数据深度融合,利用机器学习、仿真推演等人工智能技术形成企业发展的数字孪生,用于企业战略规划、经营预测和风险评估,最终建成集实体档案馆、数字档案馆、智慧档案馆为一体的新型档案馆。
参考文献
[1] 杨鹏 , 金波 . 数智时代智慧档案建设的逻辑理路与运行线路 [J]. 档案学通讯,2023(2):48-56.
[2] 金波 , 杨鹏 .“数智”赋能档案治理现代化 : 话语转向、范式变革与路径构筑 [J]. 档案学研究,2022(2):4-11.
[3] 史江,罗紫菡 .“智能 +”时代档案管理方法创新探讨 [J]. 档案学研究,2021(2):54-59.
[4] 刘越男,何思源 , 王强 , 等 . 企业档案与数据资产的协同管理 : 问题与对策 [J]. 档案学研究,2022(6):94-102.
[5] 周丽霞 . 创新驱动档案工作数字化转型 [J]. 山西档案,2022(5):1.
[6] 牛力,金持,黎安润泽 . 大模型在档案工作数智转型中的应用 : 新机遇、新模式和新转变 [J/OL]. 档案学通讯 :1-11[2024-06-18].https://doi.org/10.16113/J.cnki.daxtx.20240511.001.
【基金项目】河南省软科学计划研究项目“创新设计深度赋能河南省人工智能产业强力发展研究”(项目编号:232400410107)。
【作者简介】杜霞(1977—),女,汉族,河南焦作人,郑州升达经贸管理学院副教授,硕士,研究方向:人工智能产业、城市文化品牌建设、设计艺术学。