Logo 热线
2025年面授班
2025年档案培训面授班 2025年档案培训计划 25年档案高级研修班 2025年档案修裱班
2025年网络班
2025年档案人员岗位培训 2025年档案人才培养高研班 2025年档案职称辅导班 专业档案培训专题
在线试听
文书档案整理试听 人事档案管理试听 工程档案试听 档号编制规则试听
新闻分类
底部
留言咨询
招贤纳士
联系我们
档案管理培训信息网
手机:13241838330
手机:18601298758
固话:010-62700072
传真:010-62700072
邮箱:2087217266@qq.com
总部地址:北京市海淀区彩和坊路8号4层4018
底部
新闻内容 您现在的位置:网站首页 >> 新闻中心 >> 档案快讯 >> 详细信息

浙江杭州 运用“OCR+NLP”技术加速档案数字化成果质检

发布者:  发布时间:2025-07-28  阅读:3165次

近日,浙江省杭州市档案馆《OCR+NLP技术在档案数据化中的研究与实践》荣获国家档案局优秀科技成果三等奖。项目成果可成功运用在档案数字化成果质量检查工作中,较传统模式提升工作效率60%以上。

针对传统的简单计算机程序粗检验和人工抽查细检验的模式无法有效保证质量且进度缓慢的问题,市档案馆联合汉王科技设计和制定针对档案业务的OCR(光学字符识别)新的输出标准规范,确保其适用于NLP(自然语言处理)。通过两大技术的融合,开发基于智能OCR+NLP引擎的自动化数据处理工具,对档案内容进行数据化、标签标引、信息抽取,自动生成档案著录信息后与数字化成果进行比对,减少人工检查的工作量并降低错误率,较传统模式提升工作效率60%以上,为加速档案数字化成果质检打造“杭州样本”。

该项目成功打造出基于人工智能的档案质检模型——结合版面特征和语义特征构建档案识别神经网络模型+图像数据的多源数据要素抽取模型,优化“数据预处理”“图像质检”“图像OCR处理”“AI智能质检”“人工审核”“结果导出”等质检流程。质检模型会根据质检批次号对需整改的档案数据进行第二轮或第三轮复检,直至档案符合进馆要求。在实际应用中,已成功实现17.2万件出生医学证明档案30天内完成全量质检。

通过OCR+NLP技术实现档案数据智能化处理和检索,统一了档案质检标准、规范了档案著录用语、保证了数字化图像质量,最终形成标准化、结构化、有序化的数据资源,并探索建立了杭州市疫情防控知识图谱、政府公文智能解析应用、出生医学证明等专题档案知识库,为档案智能、高效、便捷的“数智化”服务提供标准化接口,为显著提升档案进馆工作质量提供支持。


上一篇: 山东聊城 打造档案文化新体验
下一篇: 中海油首次评选档案“三支人才队伍”

Copyright © 2008-2036 档案管理培训信息网 All Rights Reserved 版本所有
24小时服务热线:13241838330/18601296758固定电话:010-62700072  报名邮箱:
2087217266@qq.com
档案管理基础知识  企业档案管理培训  人事档案管理培训  会计档案管理培训  建设项目档案管理培训  档案室建设
档案管理人员学习交流QQ群 :869546062    档案服务公司QQ联盟群:908606669

档案教育培训总部地址:北京大学南门科城大厦附楼208室
山东地址:山东省济南市槐荫区青岛路与齐州路中建锦绣广场2号楼1209室
适用于18岁以上成人
京ICP备14023321号-6

 


京公网安备 11010802037382号

收缩
  • QQ咨询

  • 档案管理信息网
  • 档案管理信息网
  • 档案管理信息网
  • 电话咨询

  • 18601296758