发布时间:2024-07-10 18:53:41被阅览数:122 次信息来源:中国档案报
近年来,北京市昌平区档案馆加快数字化转型步伐,持续推进数字档案馆建设。应用智能OCR技术,对重要手写体档案进行全文识别,辅以人工校验,生成可进行深度开发利用的档案全文数据。引入人工智能应用,利用卷积神经网络等算法进行表征学习,自动对手写体原文图像进行坐标识别和标注,并使用特征提取算法提高准确性。利用应用平台,将标注后的手写体副本与识别后的全文进行精准贴合,生成标准的双层版式文件,为后续的数据挖掘和开发利用打下基础。目前,已完成超过20万页重要手写体档案的全文识别,并生成了高质量的版式文件。
原载于《中国档案报》2024年7月8日 总第4159期 第二版