馆藏档案人名索引数据系统建设实践与探索

发布时间:2024-01-17 15:41:06被阅览数:390 次信息来源:《中国档案》

  文/游伟珊  黎杰

  充分利用档案更好地服务党委政府、服务人民群众是新时代党和国家赋予档案部门的光荣职责,也是档案工作价值的重要体现。为更好地满足人民群众日益多元化、精准化的档案查阅利用需求,广东省佛山市档案局、档案馆着眼服务民生,大胆创新,从整合档案信息资源着手,在全省率先探索馆藏档案人名索引数据系统建设,将档案馆服务民生、服务社会的效能提升到一个新的水平。

  提出“记录一生、服务一生”理念

  一段时间以来,佛山市档案馆民生档案资源建设取得长足进展,馆藏民生档案占馆藏档案总量的比重不断提升,但同时,档案馆民生档案利用需求增长与个人档案信息检索困难的矛盾也日益突出。为切实解决馆藏人名信息检索难题,促进提高民生档案的查全率和查准率,佛山市档案局、档案馆于2012年年底起草《佛山市综合档案馆人名索引数据库著录办法(征求意见稿)》,首次提出建设馆藏档案人名索引数据库。该数据库建设理念如下:将馆藏不同全宗、不同类别涉及人名的档案条目,通过人名索引的形式汇聚、整合、链接在一起,建立“记录一生、服务一生”的人名索引数据库,在数据库的基础上实现对个人档案信息的全面、深度检索。

  以“功成不必在我,功成必定有我”的政绩观推进工作

  工作开展之初,佛山市档案局、档案馆就秉持严谨、负责的态度认真开展人名数据著录及应用工作调研,在经过深入的分析、比较、归纳的基础上,有计划、有步骤地开展人名索引数据库系统建设。

  一是初步开发人名索引数据库功能并开展小规模人名索引著录。虽然国内已有档案部门着手推进人名索引数据库建设与应用,但普遍以小规模探索为主,尚未形成成熟、可参考、可复制的方法。为此,从2012年起,佛山市档案局、档案馆用了近5年时间进行前期摸索,初步开发了人名索引数据库功能,并开展了小规模人名索引著录,对数据库系统的可行性和可靠性进行充分验证。

  二是争取财政支持,有序组织开展大规模馆藏档案人名索引著录工作。相当规模的人名索引著录数据是馆藏档案人名索引检索数据系统及功能得以实现的重要支撑,因此,后台大规模、持续的著录是必须长期坚持的一项基础性工作。佛山市档案局、档案馆牢固树立“功成不必在我,功成必定有我”的政绩观,将馆藏档案人名索引著录工作作为档案馆一项重要的业务基础建设项目去推进,不求一蹴而就,但求久久为功。积极、持续争取市财政支持,并据此科学、有序组织实施馆藏档案人名索引著录工作。2018—2021年,已累计争取到175万元财政资金用于组织开展大规模的馆藏档案人名索引著录工作。截至目前,佛山市档案馆人名索引数据系统已累计形成人名信息70余万条、人名索引信息近250万条。

  三是善于总结经验,不断优化工作方式方法。在馆藏档案人名索引数据系统建设及应用工作推进过程中,人名索引著录工作由第三方机构协助实施,但项目的系统设计、运行机制探索、关键技术研究、阶段性成果评估分析等核心工作都需要自己解决。佛山市档案局、档案馆在系统建设及应用工作推进过程中,积极发挥主体作用,善于总结工作经验,不断优化方式方法,积极解决工作推进过程中遇到的各种困难和问题。如在组织开展的人名索引著录项目中,档案材料中部分繁体、异体、手写人名较难辨认,对著录工作的效率和质量产生了较大影响,为准确、快捷地辨别和确认这些人名,项目小组对相关方式方法进行分析、归纳,编制出工作指引和工作参考资料(如图1所示),将基本的工作方法总结为工作经验,为后续继续开展人名索引著录工作提供有益借鉴。

1.jpg

图1  辨别繁体、异体、手写人名参考资料片段

  创新思路及关键技术突破

  在探索推进馆藏人名索引数据库建设实践过程中,佛山市档案局、档案馆提出很多创新性的思路,并取得关键技术的突破,为馆藏人名索引数据库建设与应用提出清晰可行的思路、方法、路径、措施及现实范例。

  一是创新性开发人名索引数据库功能模块,实现人名索引数据库系统与数字档案馆系统有机融合。项目小组基于佛山市数字档案馆系统研究开发了人名索引数据库功能模块,构建起响应敏捷、链接准确、操作简便、安全保密的人名索引数据库系统。这一开发方式,使得人名索引数据库功能更好地与数字档案馆系统的其他功能进行有机融合、无缝对接,有效避免了系统间的反复切换(如图2所示),大大提升了系统的易用性和兼容性,真正让“人名检索”成为佛山市档案馆查询个人信息的有效、便捷的手段。

2.jpg图2  佛山市档案馆服务台检索方式选择界面截图

  二是通过多级信息链接实现人名索引信息的整合、汇聚和更新。为彻底解决人名信息中缺少身份证号信息或信息不准确导致部分数据“断链”的问题,佛山市档案局、档案馆创新性引入“人名识别码”作为链接媒介,通过“人名—人名索引—文件级目录—全文数据”3级链接,将与人名有关的4种不同类型的数据有机连接在一起,较好地实现了将涉及同一自然人但分布在不同类型、不同全宗中的分散、零碎的档案信息整合和汇聚在一起的目标(如图3所示)。同时,建立了确保“人名—人名索引—文件级目录”始终链接有效的人名索引信息更新机制,始终确保“人名信息”与“人名索引信息”连接有效,杜绝只有人名信息而没有人名索引信息,或者只有人名索引信息而没有人名信息的情况发生;始终确保文件级目录与人名索引信息同步并连通有效,杜绝有人名索引信息而找不到相应文件级目录的情况发生。

3.JPG

图3  佛山市档案馆馆藏档案人名索引数据3级链接关系示意图

  三是提出别具一格的合成“人物摘要”、人名拆分及合并策略,有效解决重名问题。人名索引数据库中的同名现象是客观存在的,据佛山市档案馆对已著录形成的近65万个人名信息进行分析,总体同名率达58.97%。能否有效解决重名索引信息“归类”问题,是决定人名索引著录能否发挥作用的核心问题。佛山市档案局、档案馆通过人工的方式持续补充和更正人名信息、由系统自动合成“人物摘要”信息,再利用“人物摘要”信息对重名信息进行常规鉴别和处置。同时,专门开发“人名查重”“人名合并”等配套功能,通过技术手段帮助解决重名问题,最大限度地减少数据错误,保证人名索引数据的整体质量。

  四是结合实际设置人名索引专题,实现全面著录的人名索引数据库兼具专题著录效果。对所有馆藏档案实施全面人名索引著录并不能一蹴而就,是一项需要久久为功的长远目标。为了能够在推进实现长远目标的同时更早更快体现和发挥项目建设效益,佛山市档案局、档案馆在人名索引信息中设置专题项目,有计划地按专题优先对人名信息较集中、档案利用率较高的馆藏民政部门的婚姻档案、社会保险部门的社保档案、组织部门的干部调配档案等进行人名索引著录。截至目前,已初步建设形成了社保、婚姻、人事调配、任免职、奖励表彰、离退职(休)、职称、复转军人安置、处分、文稿等专题人名数据,使得人名索引数据库项目得以在短期内发挥出独特效用。

  五是制定落实人名管理安全保障机制,切实保护人名隐私。完成相当规模的人名索引著录后,个人在档案馆中保存的出生、上学、就业、入党、升职、表彰、处分、调动、退休、死亡等相关档案的索引信息实现了集中,但高度集中的人名信息客观上导致隐私信息泄漏风险大大增加。为最大限度降低个人隐私信息泄露的风险,佛山市档案局、档案馆想方设法加强人名索引数据库系统开发、管理、著录及查询利用人员的档案安全、职业操守、法律法规纪律教育,从制度规范、技术层面加强防范、堵塞漏洞。如按专题开放人名索引信息的查询权限;限制人名索引信息的导出权限;建立和落实人名信息查询“凡查询必依申请、凡查询必详记录、凡查询必严监督”的机制等。

  2022年7月,经省档案科研工作委员会评审,佛山市档案局、档案馆开展的“馆藏档案人名索引数据库系统建设及应用研究”项目顺利结题。课题虽已顺利结束,但全面开展馆藏档案人名索引标引、著录是一项长期而艰巨的任务,只有进行时,没有完成时。佛山市档案局、档案馆将继续坚持贯彻“以人民为中心”的发展理念,不断探索创新,积极破解制约服务民生难题,以实际行动履行好档案部门的职责使命!

  作者单位:广东省佛山市档案局、佛山市档案馆、佛山市档案中心

  责任编辑:王玥