积极探索生成式人工智能在档案领域的应用之道

发布时间:2024-07-01 19:19:54被阅览数:130 次信息来源:​中国档案报  作者:邓靖宜 张明子

  当前,生成式人工智能正以前所未有的速度和影响力,渗透到人类生活的每一个角落。作为第四次工业革命的标志性技术,其不仅推动了科技的飞速发展,更在经济、社会、文化等多个层面引发深刻变革。在档案领域,它的引入为优化海量数据管理、提高信息检索效率等提供了新途径,通过自动化的档案管理、智能化的检索系统、先进的安全防护等,极大地提升了档案管理的效率和质量,使档案资源得到更好的保存和利用。同时,将档案工作者从繁琐的重复性劳动中解放出来,将更多精力投入到研究、分析和创造性工作中去。此外,还可通过对档案数据的深度挖掘和分析,为历史研究、文化传承、政策制定等提供更加丰富精准的信息支撑。当然,其应用也带来了一些新挑战。如,对档案工作者的职业技能提出更高要求,引发对档案安全的担忧等。档案工作者、技术开发者、政策制定者等各方需共同努力,不断探索生成式人工智能在档案领域的应用之道,共同推动档案事业高质量和可持续发展。

  赋予的机遇

  一方面,助力存档留史。今年1月,加拿大不列颠哥伦比亚大学启动了“InterPARES Trust AI(I Trust AI)”项目,旨在为未来保存当今的数字“文物”,如电脑游戏、TikTok视频等。该项目利用生成式人工智能来整理、分类和管理当今产生的海量社交媒体信息,同时防止AI生成的内容被错误地纳入档案,确保信息的真实性。此外,运用生成式人工智能来验证电子档案的“四性”,确保未来能够使用当下形成的数字信息。这意味着不仅要保存数据,还要确保档案机构拥有适当的硬件和知识来查看和利用这些数据,从而达到留存人类历史的目标。目前,运用生成式人工智能和机器学习技术助力云端存档的实践也多点开花。如,通过对视频内容进行自然语言描述,使其具有更高的可搜索性,用户不再需要通过文件名来搜索视频,而可以使用云端存档系统来精确定位特定的时刻。

  另一方面,助力档案开放。根据美国1966年《信息自由法》,联邦机构必须回应公众的档案开放申请。然而,这一流程可能需要数月甚至数年才能完成。2022年,该国基于《信息自由法》提出的档案开放请求超过92.8万件,创历史新高,且积压请求接近20.7万件,联邦机构面临着越来越大的压力。因此,司法部、疾病控制与预防中心等联邦机构已经尝试或正在测试机器学习模型和算法,用于帮助工作人员在包含数十亿件政府档案的数据库中快速搜索信息,以更迅捷地满足公众的请求。可见,生成式人工智能技术的应用能够提升开放审核效率,减轻档案工作者的负担,满足用户需求的同时助力档案价值实现。

  带来的挑战

  一方面,给档案工作人员带来挑战。美国部分联邦机构将生成式人工智能用于档案开放审核后,该国法律界对此表示担忧,认为档案开放审核人员可能会过度依赖机器,并可能因此而草率作出通常需要深思熟虑才能作出的判断。建议设定明确的标准,并保证这些标准得到执行,且需制定适当的程序来对使用机器算法的决策加以审视,以检查是否有非法隐瞒信息的可能。也有不少人对生成式人工智能的应用持积极态度,认为尽管其功能强大,但档案工作者仍具有不可替代性。他们不仅负责管理和维护档案,还涉及对档案内容的深入理解和专业解读,这是生成式人工智能目前无法完全实现的。此外,档案工作人员作为档案与用户之间的媒介,应用新技术能够使用户更好地理解档案内容及术语。因此,档案工作者既要谨慎,确保技术应用的合规可靠,又要自信主动,继续丰富和提高自身专业知识和能力。

  另一方面,给档案可信和安全带来挑战。生成式人工智能生成的内容应否被视为档案?其在档案工作中的应用是否会导致信息泄漏?这是档案部门应用人工智能技术时应考虑的主要问题。如,今年5月,NARA发布新的政策,禁止员工在其代理网络上使用ChatGPT,原因是担心员工将档案数据输入到生成式人工智能服务商业版本中。一旦输入,不仅可能被用来训练ChatGPT模型,而且相同的数据也可能被用来回复其他用户。据媒体报道,先前有许多事例表明个人身份识别信息和企业专有信息已出现在AI服务中。因此,如果将敏感的、非公开的档案数据输入到大模型中,会带来极大的信息泄漏风险。基于此,NARA作出了此项禁止决定。可见,档案部门应全面评估生成式人工智能技术的潜在风险和挑战,并采取相应的措施来保护档案数据的完整性和机密性。

  结 语

  作为一种强大的工具,生成式人工智能可以显著提升档案管理的效率和质量,帮助档案工作者更好地组织、分类和检索档案内容。同时,可以减轻其重复性劳动,让他们有更多时间专注于更具创造性和研究性的任务。然而,也可能给档案工作带来一些风险,如依赖机器导致误判、档案内容泄漏等。

  面向未来,需要在充分利用生成式人工智能的同时,审慎应对其带来的挑战。应制定明确的标准,确保合规性,建立有效的监督机制,这些都是不可或缺的要素保障。同时,档案工作者必须继续提升自身专业技能,以应对技术变化带来的新需求。同时,要确保生成式人工智能的使用不会危害档案的真实性、完整性、可靠性和安全性。

  总之,档案部门需要与技术开发者、政策制定者等多方合作,共同制定生成式人工智能在档案领域的应用策略,确保技术在推动事业进步的同时,不损害档案工作的核心价值。通过这样的协作,充分发挥技术的潜力,同时确保档案工作的稳定和安全,最终实现档案工作的新突破。

  原载于《中国档案报》2024年7月1日 总第4156期 第三版