新闻媒体网页归档方法与策略研究

发布时间:2024-08-07 20:13:44被阅览数:255 次信息来源:《山西档案》

  文/郭芳

  摘 要:新闻媒体网页归档是保存新闻资源的重要手段,但是当前领域内实践尚处于起步阶段。在梳理国内外研究现状的基础上,剖析了我国在体制机制、法律政策、关键技术等方面存在的问题,进而从宏观和微观两个层面提出了完善顶层设计、明确责任权利、统一标准规范、创新技术应用、拓展服务利用等优化策略和对策建议,以期推动新闻网页归档工作走向规范化、制度化、常态化。

  关键词: 新闻媒体;网页归档;实践调研;策略研究;档案工作

  在当前信息爆炸的时代背景下,互联网的开放性、信息资源的共享性和技术发展的飞速性为新闻媒体网页资源的规范管理和长期保存带来了新的挑战与机遇。当前,数智时代下的新闻媒体网页资源大多呈现出数据体量庞大、更新速度频繁、组织结构复杂、保存期限不同等特点,这就导致传统档案业务中的信息组织和长期保存方法难以适应当前动态的网络环境,进而暴露出新闻媒体网页归档工作流程缺乏系统性、规范性、持续性等问题,导致大量高价值的数字档案遗产资源濒临消失。因此,亟需从战略和策略层面系统开展新时代下新闻媒体网页的规范归档的理念、方法、路径、机制等研究,这是建立长效档案保存工作机制的有力支撑。

  1  新闻媒体网页归档实践现状

  1.1 国外代表性新闻媒体网页归档项目情况

  纵观网页归档的相关研究,国外对新闻媒体网页归档的实践起步较早。1996 年,美国首次创立的互联网档案馆是世界范围内首个按主题分类、有选择地对具有长远保存价值的网络信息进行捕获、归档、存储、开放利用的机构[1]。目前,该档案馆已积累了上千亿网页,用户可以通过网站时光机(Wayback Machine)检索和访问不同时期的页面资料,以解决网站在维护或关闭时无法查看内容的问题。此后,许多国家的国家图书馆、档案馆主导开展本国重要网站的归档项目,如澳大利亚的PANDORA项目与后续发展的澳大利亚政府网络档案馆,以收集政府网页资源为主要目的,存档对象包括网络新闻、机构官网,以及社交网络或博客等社交媒体平台的资源,形成了多机构协作的资源归档模式。英国自 2004 年起由英国图书馆等机构合作开发了英国政府网页档案(UK Government Web Archive, UKGWA)项目,定期对政府和公共机构网页进行存档,确保公众可以持续访问政府信息,并在近期专门启动了社交媒体网页存档项目,以政府机构的Twitter和YouTube账号为对象,重点采集和保存国家发布的具有重要价值的新闻社交媒体信息[2]。

  1.2 我国新闻媒体网页归档项目进展

  相比之下,我国的新闻媒体网页归档实践起步较晚,主要由科研机构、高校、重点档案馆等少数主体开展探索尝试,尚未形成规模效应和社会影响力。其中,在 2003 年,国家图书馆开展了我国首个网络信息资源存档实验,开启网络信息资源采集与保存试验项目(Web Information Collection and Preservation, WICP);同时,中国web信息博物馆是由北京大学网络实验室开发建设的中国网页历史信息存储与展示系统,旨在收集中国所有静态网页。此外,还有几家档案馆结合地方实际开展了一定的尝试,如宁波市档案局根据国家档案局的决定,与北京市档案局等三家单位一道成为网站网页资源归档试点单位,对党报、政法委等重点单位网站实施归档;宁波市档案馆整合浙江发布、浙江在线等主流媒体网站,尝试开发融媒体档案库[3]。

  综上所述,我国的新闻网页归档实践项目还处在起步探索阶段,无论是规模广度、资源类型,还是管理体系、技术水平等,都还难以适应全媒体时代信息汇聚传播的趋势变化。主要体现在以下几个方面:一是工作统筹不够,不同区域、不同层级、不同部门的归档项目存在数据壁垒,缺乏协同工作机制;二是归档内容的范围难以界定,多局限于重点党政机关网站,对商业网站、自媒体等重要信源的采集不足;三是归档技术路线单一且落后,项目多数基于定向抓取的静态存档模式,对动态网页、音视频、用户交互信息等新一代信息形式的获取和加工能力相对薄弱;四是资源整合度相对较低,难以满足跨站点、跨媒介、跨终端的一站式检索利用需求。因此,在总结国际经验的基础上,本研究呼吁档案部门应立足国情、着眼全局、把握大势,坚持以“问题导向、应用牵引”为理念,在机制、制度、技术、服务等方面加大力度,推动新闻网页归档工作从碎片化走向系统化,从被动响应走向主动服务,促进珍贵网络文化遗产代代相传、永续利用[4]。

  2  新闻媒体网页归档策略提出

  2.1 构建多方协同的管理新模式

  建立跨部门、跨行业的协同管理机制能够促进新闻媒体网页归档工作顺利开展。首先,通过发挥党政机关的统筹协调功能,由中央网信办牵头,同中宣部、国家档案局、国家新闻出版署等多个部委,制定国家层面的总体规划和政策法规,在顶层设计环节加大力度,构建管理新模式;其次,调动社会各组织重点参与,包括重点新闻媒体机构、高校科研院所、互联网公司等,多方借鉴IIPC的经验,创办专门联盟组织负责研究制定技术标准规范、开发通用软硬件工具、开展人员培训交流、探讨知识产权问题等运行机制,为各成员单位提供政策指导和资源支持。最后,在实施路径上,应明确分工、突出归档工作重点,结合中央媒体机构与中央部委网站在国家层面上进行统筹规划,督促地方媒体与政府网站协同参与,对党报、党刊等数字化新闻媒体高质量归档,同时确保高校和科研机构参与相关理论研究和技术攻关。

  2.2 优化归档策略与技术路径

  首先,对于信息发布类、专题报道类、评论互动类、服务功能类等诸多类型的新闻媒体网页要根据不同特征实施差异化收集策略。例如,对于信息发布类新闻应以全量方式的“照相式”存档模式来确保网页的全面性和完整性;对于专题报道可针对重大主题事件实施选择性采集,兼顾广度和深度。同时,新闻媒体网页归档的频次和时机要充分考虑不同网站的技术特点、信息结构等差异,分类施策,避免“一刀切”现象。其次,在网页采集方面,除了借鉴主流爬虫软件与工具之外,需要研发适合我国复杂网络环境的本地化采集工具,尤其要针对深层网页、动态内容等现实任务,加强智能解析和定向抓取能力,这至关重要。最后,档案部门要加强对人工智能、虚拟容器、区块链等前沿技术的跟踪研究,在网页分类组织、知识关联挖掘、全文检索利用、存证溯源等方面开展应用创新。因此,网页归档的技术体系构建应覆盖管理工作的全生命周期,从数据的存储保护到服务的开发利用,建立一整套全流程闭环方案,从而实现对国家新闻网页知识服务平台的构建,实现分布采集、集中存储、统一检索、深度利用的创新性模式,为各类用户提供个性化、精准化档案新型服务。

  2.3 健全法律制度和政策环境

  新闻媒体网页作为重要的社会记忆,具有选择和衡量新闻事实的客观标准,能够满足社会与公众对事实本身的认知需要,所以健全相关法律制度尤为重要。首先,需要明确其档案属性,将相关工作责任制度纳入国家档案法体系,增加互联网信息资源归档的条款,厘清采集、保管、利用等环节的法律责任。同时,制定专门的网页档案管理办法,对归档主体、范围、标准、程序等作出原则性规定。具体实施步骤可以参考图书馆机构的缓存服务,考虑适度放宽版权限制,从而赋予档案机构根据实际需求合理使用网页的法定授权。其次,在技术标准方面,要整合现有的分散标准,加快制定全国统一的、通用的技术标准体系,充实细化采集、编目、检索、长期保存等关键环节的规范内容,实现多机构、跨系统的协同发展。总之,把网页归档作为国家信息化发展和数字治理的重要内容,需要加大财税、金融、人才等各方要素的保障力度,将相关重点实施项目经费列入预算,设立专项资金,从而强化网页档案的社会价值,从学术研究向民生服务开发拓展。

  3  新闻媒体网页归档的推进路径

  3.1 坚持正确方向,把握工作原则

  推进新闻媒体网页归档,必须坚持以习近平新时代中国特色社会主义思想为指导,深入学习贯彻党的二十大精神,立足新发展阶段,践行新发展理念,服务构建新发展格局,着眼国家治理体系和治理能力现代化,着力固根本、扬优势、补短板、强弱项,高质量完成网上舆论引导、网络意识形态建设、网络文化传播等一系列重要任务,为全面建设社会主义现代化国家、实现第二个百年奋斗目标作出档案工作新贡献。同时,新闻媒体网页归档的系统性、复杂性、多样性等特质也决定了在工作中必须坚持一系列基本原则。一是要始终坚持统筹协调、整体推进。在加强顶层设计和战略规划的同时,强化部门协同和上下联动宗旨,集中力量落实各部门网页归档模块的具体工作。二是坚持目标导向、问题导向的核心理念。在新闻媒体网页归档工作中要围绕核心价值观,聚焦主责主业,增强工作的针对性、实效性。三是坚持固本培元、守正创新,不断拓展服务领域、创新服务内容。

  3.2 加强组织领导,健全工作机制

  党的十九届六中全会《中共中央关于党的百年奋斗重大成就和历史经验的决议》强调,必须加强和改进党对档案工作的领导。一方面,档案部门作为网页归档的责任主体,要加快转变职能,从事后接收向事前参与转变,增强大局意识和主动意识。在具体工作中,需要主动向同级党委请示汇报,加强与网信、宣传、保密、新闻出版等部门的工作对接,重视与支持相关业务开展。在归档工作流程中,需要督促指导相关单位从源头规范网页,形成有价值的档案资源,加强事中事后的有效监管。另一方面,要建立多元共治机制,通过政策引导、项目合作、资源共享等方式,调动高校科研院所、行业协会、互联网企业、社会团体等各界力量广泛参与,在人才、技术、经费等方面给予支持。在工作机制方面要加强组织保障,各级档案部门要成立由分管领导任组长、相关处室参加的网页归档工作专班,负责统筹规划和督促落实;还需要细化工作范畴,制定中长期规划、年度工作要点,明确目标任务、时间表、路线图;建立协调机制,加强与纪检监察、人事、财政等部门的工作联动,将网页归档纳入督查督办、绩效考核的重要内容中。同时,各新闻媒体单位要成立内部工作小组,由主要负责人牵头,落实分工责任,配备专职人员;履行主体责任,将网页内容的源头管理、实时采集、定期归档作为重要工作来抓,与中心工作同谋划、同部署、同落实、同考核。

  3.3 深化开发利用,彰显社会价值

  档案事业是服务型、效益型事业,最终要落脚到服务大局、服务社会、服务民生上来。首先,要牢固树立大局意识,主动服务党和国家工作大局。紧扣“十四五”规划纲要确定的战略目标任务,聚焦网信事业、媒体融合、文化建设等重点领域,提供精准支持,当好参谋助手。其次,要坚持以人民为中心的发展思想,努力满足人民群众日益增长的美好生活需要。创新开发传播党的创新理论的生动案例,用档案助力党史学习教育走深走实。丰富爱国主义教育资源,讲好中国共产党的故事、中国人的故事、中国梦的故事。另外,打造网上信息资源库、版本变迁库、辟谣平台等特色产品,服务社会各界的政务办事和民生需求,树立政府公信力。最后,要放眼国际视野,积极服务国家对外工作大局。加强与“一带一路”国家在网页归档领域的交流合作,用档案资源讲好中国故事,传播好中国声音,展现真实、立体、全面的中国形象。

  4  结语

  未来,随着 5G、人工智能、区块链等新一代信息技术的落地应用,新闻生产传播的智能化、沉浸化、碎片化趋势更加明显,网页归档除了要拓展音频、视频、动态页面等多模态的内容抓取之外,还要加强与知识管理、版权确权、智能标引、用户洞察等技术的深度融合[5],进一步提升归档的智能化、精准化水平,更好地服务融媒体时代的内容生产、传播和研究利用。

  参考文献

  [1] 吴倩 , 王运彬 . 网站时光机 : 美国网页存档模式探索 : 以Internet Archive为例[J]. 图书馆 ,2021(7):91-97.

  [2] 曾萨 , 黄新荣 . 网页归档项目对社交媒体文件归档的启示[J]. 图书馆 ,2018(12):22-27,66.

  [3] 谢玉雪 , 郑晓丹 . 我国政府网页归档的问题与策略[J]. 山西档案 ,2021(2):79-88.

  [4] 黄新荣 , 曾萨 . 网页归档推进策略研究 : 基于网页归档生态系统视角[J]. 图书馆学研究 ,2018(16):63-70,16.

  [5] 曹玲 , 颜祥林 . 美国国会图书馆网页归档项目的新动向[J]. 档案学研究 ,2018(2):125-128.

  【作者简介】郭芳(1984—),女,汉族,四川蓬溪人,新疆职业大学副教授,硕士,研究方向:新闻学、传播学、职业教育等。