发布时间:2024-07-15 19:58:18被阅览数:183 次信息来源:《中国档案》
文/ 杨冬权
一、新质生产力概念的提出
2023年9月,习近平总书记在东北调研时,提出了一个划时代的新概念,叫新质生产力。之后,他又多次强调要发展新质生产力。
新质生产力这个词,在中国的词典中从未出现过,在马克思主义的经典著作中从未出现过,在世界各国的经济学著作和经济学教科书中也从未出现过。因此,这个概念的提出,是对马克思主义的新发展,是对世界经济学理论的新贡献,也是几千年中国文化中的一个新亮点。它是对人类当今以人工智能为突出代表和主要特征的各种新材料、新技术、新工艺、新模式、新业态的一种新总结、新概括、新提炼、新反映,是可以指导中国和人类运用各种新手段获得经济和社会新发展的一种新智慧、新认知、新理论,将指导全体中国人民在发展新质生产力上加油发力,开辟出新质生产力这一新赛道,从而让新质生产力全面地提升和改造传统生产力,逐渐地覆盖传统生产力,使整个社会生产力获得新的更大发展。新质生产力概念,必将把全中国和全人类的生产力水平提高到一个前所未有的新水平。
一石激起千层浪。新质生产力概念提出后,在全国引起强烈反应,科技界、产业界、学术界等各方面响应者风起云涌。2024年的两会上,新质生产力成为会议的主题和代表的热议。会上的政府工作报告,还把过去的“互联网+”的概念,修改为“人工智能+”的概念,突出了人工智能在新质生产力中的地位。当前,新质生产力如同春潮,给中国大地带来了万紫千红。
我理解,新质生产力,主要指的是应用人类最新的科技成果,特别是以语言大模型为代表的人工智能技术,开发各种新的生产要素,形成各种新的经济运营方式,形成新的生产业态,发展新质量的生产力,实现经济的高质量发展。发展新质生产力,是建设中国式现代化、实现中华民族伟大复兴的一个新的有效途径,也是一个新的强劲动力。发展新质生产力,全国各个方面都在行动、都有响应,我们档案战线不应缺席。
在新质生产力中,包括档案在内的数据,是一种新的要素。2020年4月9日,中共中央、国务院在《关于构建更加完善的要素市场化配置体制机制建设的意见》中,就已从国家层面,把数据作为人类社会的一种新型生产资料。也就是说,可以不断挖掘的数据,已经同传统的土地、资本、劳动者、生产工具等一样,成为新的生产要素和新的生产资料。特别是它和其他生产要素的融合,还会大大促进其他要素发挥作用,为其他要素赋能,让其他要素增值,通过对它的挖掘和同其他生产要素的重新组合、重新配置,能够培育出新产业、新业态,使社会生产力得到质的提升。
当然,包括档案在内的数据,并不能自然地成为生产要素,成为新质生产力的一部分,而要利用新质生产力的一个重要部分和突出部分,即人工智能,对它加以挖掘,它才会成为新质生产力的一部分。
为了贯彻落实习总书记关于发展新质生产力的指示精神,有效地为发展新质生产力服务,我认为,我们档案人应当加快建设新质档案馆(室)。
二、什么是新质档案馆(室)
什么是新质档案馆(室)呢?它实际上就是我最近几年一直呼吁建设的智慧档案馆(室),也就是基于档案、用档案喂养出来的智能档案机器人,也叫档案大模型。它的特点,是在全部档案数据化的基础上,运用数据挖掘等人工智能技术,对档案的内容进行“搜索+生成”式的智慧性开发。
从2019年上半年开始,我就在南京提出了“档案数据化”和基于档案数据全方位挖掘或基于对档案所有内容智慧性开发的“智慧档案”的新概念,并把我的概念,同其他人提出的基于档案外表自动化管理的所谓智慧档案作了区隔。2020年,我并在《中国档案》第11期上,发表了《智慧档案馆(室)——我国档案馆(室)建设的新方向》一文,初步阐述了什么是智慧档案馆(室)?为什么现在要建设智慧档案馆(室)?怎样建设智慧档案馆室?这篇文章,也收进了我2023年出版的新书《新时代档案工作新思维》一书中。2023年,我又在《档案与建设》杂志第1期上,发表了《档案强国的必由之路——建设智慧档案馆(室)》一文,进一步阐述智慧档案馆(室)。另外,这几年我也在不少学术场合,呼吁建设智慧档案馆(室)。
我所说的智慧档案馆(室),就是:第一步,先采用各种新的信息识别技术,把档案中的所有文字、图像、声音等,都转化为电脑可以识别和处理的数据,也就是把档案先“数据化”;然后,第二步,再采用最新的数据挖掘技术,或者叫人工智能技术,也叫AI技术,建立档案的语言大模型,让档案中的所有有用信息(主要是名词、数词、量词、动词、形容词等)都产生关联和联系,从而对所有档案数据进行“搜索+生成”式的智慧性开发。
2022年年底,国际信息界产生了一个革命性的新成果,那就是美国发布了ChatGPT,即聊天机器人。它把电子计算机技术,由过去的检索时代,提升到了今后的“搜索+生成”的新时代,正式把人类的互联网时代,推进到了人工智能时代。这是一个质的飞跃,是信息技术的一个跃升,是继电子计算机、互联网之后,信息时代的第三个里程碑,它将给人类带来前所未有的深刻影响。习总书记提出新质生产力,正是在这个技术背景下提出的。
在习总书记新质生产力概念的指导下,我决定把智慧档案馆(室),称之为新质档案馆(室)。2023年12月,我在西北师范大学建议该校建立新的智慧档案馆时,他们让我留言,我就写下了我的期望:“建设新质档案馆——智慧档案馆。”2024年初,我到一些地方讲课,也都是呼吁建设新质档案馆(室)。
新质档案馆(室)的含义是:运用最新的比较成熟的印刷体文字识别、手写体文字识别、语音识别,图像识别等技术,把纸质档案中的文字,录音档案中的声音、照片和声像档案中的图像,全部识别转化成为电脑可以识别和处理的数据,也就是把各种介质的档案全部数据化。然后,接着再继续应用最新的以数字挖掘技术为代表的人工智能技术,也就是通常人们所说的AI技术,对档案数据进行挖掘,让所有的具有检索意义和应用价值的档案数据,产生关联,从而生成新的各方面信息和知识。这样,所有的档案数据,就能变成人的智慧,档案的价值就会扩大和提高千百倍,档案工作的影响就能扩大千百倍,档案工作者借助力于它,就能变成档案的集大成者,变成各个单位乃至社会上最聪明、最有智慧的人,变成领导和社会上离不开的高级参谋、高级助手、真正智囊。
三、为什么要把智慧档案馆(室)称为新质档案馆(室)
我为什么要把智慧档案馆(室)称为新质档案馆(室)呢?因为同现在好多单位已经建成或正在建设的数字档案馆(室)相比,智慧档案馆(室)有着一些本质性的提升或质量上的提高。
第一,从纸质档案的扫描结果来看,数字档案馆(室)对纸质档案的扫描结果只有一个,即一张同档案原件完全相同的电子扫描图像。图像上的每一个字和词,电脑都不能识别和处理,它还是需要人去读、去处理,电脑能够检索的,只有人工著录出来的档案的标题、作者、时间、文种、文号、关键词等。而智慧档案馆(室)的扫描结果却有两个:一个是同档案原件完全一样的电子扫描图像,它供人们查阅档案时利用;另一个是把图像上的每一个字和词,都识别为电脑可以识别处理的数据,它供人们把它导入数据库,并用数据挖掘技术对它进行智慧性开发使用。这两个结果,还可用“左图、右数据”的形式并列在一起,供人们核对和修改使用。
第二,从检索的结果来看,在数字档案馆(室)中,电脑可检索的,只有人工著录进去的档案标题、作者、时间、关键词等信息。而在智慧档案馆(室)中,电脑不但可以检索出档案的每一个字,每一个词,而且还可以让每份档案中的每个字词,同数据库中其他千万份档案中的每个字词,产生联系,生成许多单份档案中所没有的新的信息或新的知识,代替档案人去回答咨询、写出文案、编研档案、展览档案,编网络视频,为领导决策提供档案参考,甚至提出预警.作出预判等。另外,它还可以根据利用者的利用历史和利用喜好,主动向利用者推送相关档案资料,从而开拓人们的眼界,丰富人们的知识,提升人们的智慧。
第三,从档案的数据量看,在数字档案馆(室)中,录音录像档案中的声音,照片和录像档案中的人物、地点等信息,都不能成为电脑可处理的数据;而在智慧档案馆(室)中,它们大多被识别转化成为数据。在智慧档案馆(室)中,数据量会比数字档案馆(室)大大增加。
第四,从档案的利用频率看,在数字档案馆(室)中,档案只是偶尔被直接利用到,而在智慧档案馆(室)中,档案则经常会被间接利用到,会在直接利用档案时,被关联出来、勾连出来、牵扯出来,被间接地利用到,并与其他无数档案共同发挥作用,生成新的知识。因此,在智慧档案馆(室)中,档案的利用频次会大大提高,档案体现出的价值也会大大提高,档案的作用会千百倍地被发挥出来。一个单位(机关、企业、事业单位、社会组织等)的智慧档案室建成后,这个单位的档案员,会成为这个单位知识最广博的人,成为无所不知、无所不晓的人,成为能给领导提供很多咨询、很多决策参考的人,成为能对单位发展提供很多有用分析和建议的人,成为这个单位的“智多星”。
例如,今天一张差旅费发票归档后,档案人根据智慧档案系统的分析,可以告诉领导:今年以来,到今天为止,本单位去哪个省、市出差的人最多,哪个部门出去的人最多,同比和历年对比的增减情况,根据本单位业务发展,应增加或减少去某省、市的出差等。
今天最后一份医院病历档案归档后,档案人根据智慧档案系统的分析,可以马上告诉领导:今天全市各医院看感冒的人最多,已经达到流行季的数量,应发出流感预警,采取措施预防感冒的流行。
医院对病历档案进行了智慧性开发后,医生可以根据系统而进行医疗诊断,看病开方,成为高明的医生。
学校对教学档案进行了智慧性开发后,教师可以根据系统来进行试卷判别,教学辅导,成为高明的老师。
法院对档案进行了智慧开发后,档案人可以根据系统而回答各种法律咨询,可以为判案审案提供参考性意见。
再举一个最典型的案例:一张北京市地图,在数字档案馆(室)中,档案人只知道北京有很多地名;而在智慧档案馆(室)中,档案人还知道每个地名的很多知识,比如,天安门建于何时?有几层?有多高?有多少个厅?过去和现在有过什么陈设?什么时候大修过?什么时候发生过什么重大事件?什么人跟他有过什么关系?从天安门到全国任何地方有多远?乘坐哪种交通工具需要多长时间等等。
仅从以上这几个方面来看,智慧档案馆(室)同数字档案馆(室)相比,完全是一种升维而不只是一种升级。
特别重要的是,在今天,只有建设新质档案馆(室),才能更好地为发展新质生产力服务。因为有了人工智能对数据的挖掘,数据也成为了新质生产力的一部分,成为了新的生产要素。在传统的生产力要素中,劳动者指的是人,而今天的人工智能已经能够代替人的很多体力劳动和脑力劳动,把大量的人力解放了出来,节省了大量的人类劳动时间,大大提高了生产效率。很多工厂的生产线上,智能机器人已经代替了工人;在很多的办公室中,智能机器人也将要代替很多人去绘画、去翻译、去写字、去写文案、去播音、去拍视频、去看病、去当老师或当律师等。在传统档案馆(室)中,搞一个展览,编一个大事记或年鉴,可能需要一个人搞几个月或几年;而在智慧档案馆(室)中,这只要几分钟或几十分钟。在传统的生产要素中,生产资料指的是人们生产过程中所需要的各种资源和工具,而对生产工具的所有记载——档案数据,经过人工智能挖掘后,人们可以更科学地使用生产资料,更广泛地开发生产资料。比如:人工智能对地质图或地质勘探档案进行分析后,可以发现新的矿藏:人工智能对人流、物流数据进行分析后,可以根据情况进行调整,让人流、物流更加顺畅,从而节省生产时间,提高生产效率。所以,在人工智能的挖掘下,包含档案在内的数据,可以对传统生产力的各个要素进行重新配置或重新开发,为它们赋能,让它们升值,甚至可以创造出无数个新的劳动者,让生产力得到大大提高。但是,这里包括档案在内的数据,必须经过人工智能的挖掘,也就是必须在智慧档案馆(室)的条件下,才能充分地发挥作用。在纸质和数字档案馆(室)中,档案数据的作用都不可能得到充分的发挥。因此,只有建设新质档案馆(室)——智慧档案馆(室),档案工作才能更好地为发展新质生产力服务。因此,在发展新质生产力的今天,建不建设智慧档案馆(室),是档案工作要不要和能不能更好服务于发展新质生产力的重要问题。各级档案部门的领导者,都必须清醒地认识到这一点。
过去,从纸质档案馆(室)到数字档案馆(室),那是一种升级。因为它把档案扫描成电子图像,可以在网上传输,实现了档案的远程传输、远程利用,实现了多人同时在线利用同一件档案;它把档案由一个真身,变成了无数个分身,解决了档案的便捷利用问题。
而今天,从数字档案馆(室)到智慧档案馆(室),它把档案由检索其标题和位置,推进到了可以语义搜索其全部信息,即档案中的每一个字和词;特别是进而让各件档案中的相关信息全部产生关联,使人能够从中看出规律,看出变化,看出趋势;它能作出预判,发布预警,提出备选方案,提出工作建议;它能用档案自动生成许多新的知识、新的信息,把档案自动开发成各种产品,自动回答或主动推送各种咨询。如果说,从纸质档案馆(室)到数字档案馆(室),是0到10的升级,那么,从数字档案馆(室)到智慧档案馆(室),则是从11到100的升级,它是一种跃升,是一种质变,是一种升维,而非简单地是一种升级。所以,我们完全有理由把智慧档案馆(室),称作是新质档案馆(室)。
四、为什么要加快建设新质档案馆(室)
今天,建设新质档案馆(室)的技术条件都已具备。
首先,档案数据化的技术,即把纸质档案中的文字、图表,录音档案中的声音,音像和照片档案中的人物和地点,转化为数据的技术,有纸质档案中规范文字的OCR识别技术,有不规范文字的手写字识别技术,和对所有文字进行有声朗读并通过声音识别加以转化的技术,有对录音、录像档案中的声音进行转化的技术,有对照片、录像档案中的人物、场景加以识别的技术等。并且,这些技术都有现成的软件,用起来相当方便。这样,纸质档案、录音档案、录像档案、照片档案,都能进行识别转化。
其次,对档案数据的人工智能挖掘,自从美国的ChatGPT(通用大模型)发布后,国内已开发出上百种通用大模型来,它们都具有搜索已有全部数据,并根据这些数据生成新的知识、新的文本的功能。只要把档案数据输进大模型,再加以学习训练,就可以对所有档案数据进行挖掘、生成和自主推送,建成真正意义上的智慧档案馆(室)。在各种新的技术都已具备的条件下,我们档案人如果不及时运用这些新技术,那么,我们不仅辜负了这个时代,而且下一步我们还会被时代所淘汰,特别是,我们也不能肩负起为发展新质生产力服务的时代使命。
档案数据化,既可以用数字档案馆中的档案数字化图像来进行,也可以用纸质档案、录音档案、照片档案、录像档案原件直接来进行。它们在安全要求上也和数字档案馆(室)相同,没有更特殊的要求。就纸质档案的扫描来说,档案数据化把一页档案扫描成图像并把图像上的每一个字识别转化成电脑可以识别处理的数据,比档案数字化把一页档案扫描成一个图像并著录其标题、作者、文种、时间、关键词来,不但时间更快,而且资金上更省得多。一个地县级档案馆,只要花1000万元左右,就可以建成一个新质的智慧档案馆,这比建成一个数字档案馆要更省钱。在今天,数字档案馆(室)建起来就落后,而智慧档案馆(室)建起来就领先,并能保持至少10年不落后。因此,建设智慧档案馆(室)比建数字档案馆(室)的好处要大得多。各级档案馆(室)都应该加快建设,从根本上扩大档案的价值和作用,提高档案工作的现代化水平,提高档案工作和档案人的地位。
作者单位:国家档案局
责任编辑:王辉