发布时间:2024-02-19 08:47:21被阅览数:731 次信息来源:《中国档案》
文/汪伟民
近年来,国家和浙江省数据战略相继出台,明确数据已演变为数字经济时代的关键生产要素,并日益成为推动人类经济社会发展的“新石油”。基于上述战略背景,嵊州市档案馆和大数据中心积极开展数据要素在县域的探索和实践,针对公共数据存在数据多源、数据不一致、数据不完整、数据不合规等问题,迫切需要开展数据治理的现状,共同谋划建设“个人全生命周期档案”综合智治应用,通过先行先试,为县域公共数据的归集、治理和供给提供了一条可行路径。
背景意义
近年来,中共中央、国务院《关于构建数据基础制度更好发挥数据要素作用的意见》和《浙江省公共数据条例》等国家和省数据战略相继出台。2021年7月,浙江省档案局印发《浙江省档案工作数字化改革方案》,要求运用整体智治理念方法,对全省党政机关档案数字资源、管理系统、数据共享等进行全流程系统性改造,加快档案资源向数字化、数据化转型,推动档案数据向集成共享利用发展,围绕构建数字化决策、执行、服务、监督和评价体系,拓展档案数据智慧服务场景。基于上述国家数据战略背景及浙江省档案工作数字化改革总体要求,嵊州市档案馆认真梳理核心业务,坚持以数字化手段努力破解工作中存在的体制性、机制性堵点难点问题,决定从个人全生命周期数据档案化治理破题,联合大数据中心打造“个人全生命周期档案”综合智治应用。该应用于2022年9月获浙江省档案局批复列入“浙里数字档案”重大应用场景目录,开展试点建设。同时也作为浙江大学的“数据档案化治理基础理论和实践路径研究”国家课题的实证案例。
需求分析
1.“五大需求”
基于个人全生命周期数据档案化治理和应用,主要存在以下五大需求:一是数据治理需求,通过应用探索公共数据治理实践路径,形成数据治理方法论和路线图;二是民生服务需求,提供数据档案化治理后的个人全生命周期数据底座支撑,提高政府民生服务办事效率;三是社会治理需求,梳理构建公民社会关系图谱,为政府社会治理提供数据支持;四是共同富裕需求,为政府相关机构推出一批差别化收入分配激励政策提供数据支持;五是数据要素改革需求,为党委政府领导决策和数据要素市场服务奠定基础。
2.“三张清单”
根据梳理出来的五大需求,经过深入地讨论和交流,逐步形成“重大需求清单”“多跨场景应用清单”和“重大改革清单”三张改革清单。
总体建设方案
1.总体思路
旨在通过对档案学理论的应用,推进公共数据档案化治理和应用。将一体化智能化公共数据平台数据和档案馆藏数据进行有效融合、治理、溯源,通过多源汇聚、多重校验、多表合一等技术,建立一个可信赖的“个人全生命周期档案”数据资源中心,并构建“1+10+N”的个人全生命周期档案综合智治应用框架,即按照出生、教育、工作、置业、出行、婚育、就医、救助、养老、身后等10个人生阶段,打造N个基于个人全生命周期档案数据典型应用场景。
2.系统架构
整个系统的总体架构由基础设施体系、数据资源体系、应用支撑体系、业务应用体系四层组成,并建立了保障运行的政策制度体系、标准规范体系、组织保障体系、网络安全体系(如图所示)。
系统架构图
(1)基础设施
基础设施是整个平台的服务器部署、应用上架、网络访问的基础环境,个人全生命周期档案平台部署在政务网,并通过“浙里办”端提供个人查档出证服务。
(2)数据资源
数据资源有两个方面,一是浙江公共数据平台,数据包括出生、教育、工作等10个人生阶段与个人相关数据;二是档案馆民生类档案数据,包括出生医学证明档案、婚姻档案、学籍档案等9大类数据。
(3)应用支撑
应用支撑主要是指应用基础模块和工具软件,包括元数据管理、权限管理、数据底座等。
(4)核心业务
对接多个核心业务应用,包括数据智治系统、养老服务系统等,同时对接数字化改革总门户应用及党政机关整体智治综合应用、数字政府综合应用、数字经济综合应用、数字社会综合应用、数字法治综合应用、数字文化综合应用等。
(5)“两掌”(前端)
打通“两掌”,在“浙政钉”端主要服务于各单位数据官和联络员,开展数据归集、数据核验、数据加工等操作;在“浙里办”端对接“浙里档案”,为个人查档提供数据支撑。
3.场景设计
通过对“个人全生命周期档案”数据资源的挖掘和分析,打造“惠民办事”“出生智治”“基层治理”“居民健康”“共同富裕”等公共数据应用典型子场景。
(1)“惠民办事”子场景
依托建成的“个人全生命周期数据资源中心”,形成办事信息高速公路,让办事证明通过本平台直接服务于办事部门,今后群众办事不再需要提供证明材料。
(2)“出生智治”子场景
依托建成的“个人全生命周期数据资源中心”,为辅助人口治理、提供办学依据、分析人口出生等社会焦点问题提供数据支撑。
(3)“基层治理”子场景
依托建设的“个人全生命周期的数据资源中心”,建立人员社会关系图谱,记录与个人相关的社会关系及关联人员受教育背景、在职工作等情况,在出现纠纷时可为基层干部寻找问题合适调解人提供数据支撑。
(4)“共同富裕”子场景
通过对个人全生命周期教育、工作、置业等人生阶段的数据治理,深度挖掘数据价值,通过数据和算法了解个人收入分配结构,为企业及百姓帮扶政策提供数据支持,使数字经济成为新时代赋能我国全体人民走向共同富裕的精兵利器。
项目特色亮点
1.数据接引
数据接引通过数据接引系统实现批量、实时多源异构数据的便捷同步或接入,系统可提供完善的数据接入配置、数据汇聚任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台、数据源及应用系统间的数据汇聚需求。主要数据来源:一是系统之外电子数据,可通过人工归集方式上传内容数据平台;二是业务系统产生的数据,可通过中间表和实时接口,将业务系统形成的业务数据凭证、相关附件以及对应的元数据自动归档到内容大数据管理系统;三是纸质材料,通过对数字化扫描件进行OCR字段信息提取形成数据目录,连同扫描件一同上传内容大数据管理系统。
2.“四性”检测
维护数据质量,按照数据源业务的实际情况,在元数据管理子系统中设置元数据方案,以元数据方案为参照对数据的完整性、真实性、安全性、可用性进行“四性”检测。
3.数据校核
建设高质量的个人全生命周期数据档案资源库,数据校核流程按照如下4个阶段进行:一是在控制源头质量的基础上,采用人工智能技术建立多项非结构化数据提取模型,对数据结构化—非结构化一致性验证;二是采用数据算法,对单位内部同类数据交叉校验和单位间数据交叉验证,保障全域数据一致性;三是在每个环节发现问题时,通知源头部门进行核对,逐步将数据治理转为源头治理;四是问题数据在核对完成前打标签,提醒使用部门在应用该数据时提前进行风险防控。
4.数据多表合并
对治理后的数据,通过技术进行数据去重和多表合并,形成统一的高质量的“个人全生命周期数据档案”数据资源库,数据资源库保持来源可溯的数据映射关系,满足数据档案化要求。
取得成效
试点建设项目按照“统一规划、分步实施”的原则来建设,自2022年9月份开始启动实施以来,截至目前已完成130类4114万条数据归集,数据治理808万条,场景建设5个,成效显著。针对项目实施中碰到的实际困难和问题,已按照嵊州市委领导的要求建立了以重要涉民部门分管领导和业务负责人为主体的项目工作专班,实行清单化、项目化管理,并建立月例会、周例会制度。
3月23日,来自中国人民大学、浙江大学、之江实验室、浙江省档案局、浙江省档案馆、浙江省大数据发展中心以及全省档案系统的领导和专家学者汇聚浙江嵊州,共同围绕数据档案化治理的基础理论、法规依据、规范标准、实践经验等方面开展研讨。大家一致认为嵊州市档案馆与嵊州市大数据中心共同谋划的“个人全生命周期档案”综合智治应用,从公共数据资源建设的普遍、共性、痛点问题出发,着重从战略规划、体制机制、法规标准、最佳实践、能力建设五方面去构建数据档案化治理保障与赋能体系,为建设可信赖的公共数据资源体系,体现数据治理重大价值,公共数据档案化治理提供了方法论和路线图。
作者单位:浙江省嵊州市档案馆、嵊州市大数据发展管理中心
责任编辑:王辉