CN112348022B - 一种基于深度学习的自由格式文档识别方法 - Google Patents

一种基于深度学习的自由格式文档识别方法 Download PDF

Info

Publication number
CN112348022B
CN112348022B CN202011168354.9A CN202011168354A CN112348022B CN 112348022 B CN112348022 B CN 112348022B CN 202011168354 A CN202011168354 A CN 202011168354A CN 112348022 B CN112348022 B CN 112348022B
Authority
CN
China
Prior art keywords
document
template
recognition
identified
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011168354.9A
Other languages
English (en)
Other versions
CN112348022A (zh
Inventor
王文锋
傅启予
韩光祖
秦泽文
邓梁
朱志童
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fubon Huayi Bank Ltd
Original Assignee
Fubon Huayi Bank Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fubon Huayi Bank Ltd filed Critical Fubon Huayi Bank Ltd
Priority to CN202011168354.9A priority Critical patent/CN112348022B/zh
Publication of CN112348022A publication Critical patent/CN112348022A/zh
Application granted granted Critical
Publication of CN112348022B publication Critical patent/CN112348022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及一种基于深度学习的自由格式文档识别方法,包括以下步骤:定义模板,所述模板中包含多个矩形碎片的坐标位置;获取待识别文档;OCR引擎全文识别,以判断待识别文档所属模板;调用模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有矩形碎片及其坐标位置对应在待识别文档中;根据矩形碎片及其坐标位置切割待识别文档,形成多个碎片文件;将多个碎片文件存入数据库,并将多个碎片文件传入消息队列中;OCR引擎继续识别消息队列中的碎片文件,得到识别结果;返回碎片文件和识别结果到数据库;完成识别。本发明通过两次采用OCR引擎进行识别,提高了识别的准确率;还通过提前定义模板及矩形碎片等,从而明确被识别内容的作用和意义。

Description

一种基于深度学习的自由格式文档识别方法
技术领域
本发明涉及识别技术领域,特别涉及一种基于深度学习的自由格式文档识别方法。
背景技术
文档识别任务一般通过一定的图像处理来识别图像中的文本内容。文本识别可应用于许多领域,如信件和包裹的分拣、稿件的编辑和校对、大量统计报表和卡片的汇总与分析、银行支票的处理、商品发票的统计汇总、商品编码的识别、商品仓库的管理,以及文档检索等,综上就是各类证件识别和财务票据处理的办公自动化等。方便用户快速录入信息,提高各行各业的工作效率。
目前关于文本识别方法有多种,例如基于传统图像处理,对字符进行分割,然后单独分类识别,其中一般需要对图像进行灰度化、二值化、阈值分割、归一化、支持向量机(Support Vector Machine,SVM)分类等来完成识别;再例如就是对具体的打印文档OCR识别结果进行自然语言处理,获得想要的信息。虽然OCR识别的适用范围比较通用,但也有它的缺点,处理过程比较复杂且不可见,不能保证输出完全正确。深度学习自然语言处理对于结果正确率的保障极其依赖于训练数据。对于专业文档来说语义是极其复杂的,现在市面上对于法律和财会等专业文档的自然语言处理引擎都不能保证很好的效果,基本上处理正确率能在80%就已经是很高了。
发明人在实施现有识别方法的过程中发现,现有识别方法存在如下缺点:
基于传统图像处理方法往往需要人工针对性的设计一些特征,中间还要穿插一些规则对算法处理不当的地方进行修正,并且对于图像背景复杂、干扰多,字符粘结严重的情况,传统方法处理的效果不是很好。而对具体的打印文档OCR识别结果进行自然语言处理,存在着处理过程比较复杂且不可见,正确率低等缺陷。
并且,目前市场上识别产品的功能主要是能把图片中的文字信息提取出来,但是并不知道提取出来的文字是什么意思。对于信息量巨大的财报或其他打印文档,如果不能准确知道识别的信息的标签,全部识别出来对于具体业务是几乎没有意义的。
因此有必要提供一种基于深度学习的自由格式文档识别方法,以解决现有技术中文档识别正确率低以及不能明确识别文字的标签的问题。
发明内容
本发明的目的在于提供一种基于深度学习的自由格式文档识别方法,以解决现有技术中文档识别正确率低以及不能明确识别文字的标签的问题。
为了解决现有技术中存在的问题,本发明提供了一种基于深度学习的自由格式文档识别方法,包括以下步骤:
定义模板,所述模板中包含多个矩形碎片的坐标位置;
获取待识别文档;
OCR引擎全文识别,以判断所述待识别文档所属模板;
调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;
根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
将所述多个碎片文件存入数据库,并将所述多个碎片文件传入消息队列中;
OCR引擎继续识别消息队列中的碎片文件,得到识别结果;
返回所述碎片文件和识别结果到数据库;
完成识别。
可选的,在所述基于深度学习的自由格式文档识别方法中,各碎片文件均具有各自的UUID。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述碎片文件包括:UUID、命名、坐标位置、编号以及识别引擎。
可选的,在所述基于深度学习的自由格式文档识别方法中,OCR引擎继续识别消息队列中的碎片文件的过程中,采用RCNN模型进行图片文本识别,得到识别结果。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述模板包括:证件类模板、申请书类模板、审批类模板和报表类模板;
各类模板中包括多种模板。
可选的,在所述基于深度学习的自由格式文档识别方法中,定义模板包括以下步骤:
上传具有模板的图片;
定义模板的名称;
在所述图片中画出所有的矩形碎片,并显示所有矩形碎片的坐标位置;
选择各所述矩形碎片的识别引擎;
填写各所述矩形碎片的标签;
完成模板定义。
可选的,在所述基于深度学习的自由格式文档识别方法中,在获取待识别文档之后,OCR引擎全文识别之前,还包括以下步骤:
主动选择对应模板。
可选的,在所述基于深度学习的自由格式文档识别方法中,在OCR引擎全文识别之后,调用所述模板中所有的坐标位置之前,还包括以下步骤:
对所述待识别文档进行预处理;
所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述待识别文档包括:单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。
可选的,在所述基于深度学习的自由格式文档识别方法中,若所述待识别文档不能归属于现有模板中任意一个模板,则不对所述待识别文档进行处理。
本发明相对于现有技术,具有以下优点:
(1)通过先识别待识别文档中的碎片文件及其坐标位置,再识别各碎片文件中的图片内容的方式,实现了异步识别;
(2)通过异步识别待识别文档的方式,解耦了图片输入处理服务和OCR引擎服务,保证了对大批量高并发识别请求的稳定处理,削除了请求高峰,合理分发了请求,另外,异步处理过程缓存了快速度服务的请求,解决了两个服务速度差异的冲突;
(3)通过采用OCR引擎继续识别消息队列中的碎片文件,提高了识别的准确率;
(4)通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;
(5)可用于自动识别、提取和存储自由格式文档中的文本内容;
(6)节省人工录入成本。
附图说明
图1为本发明实施例提供的识别待识别文档的流程图;
图2为本发明实施例提供的定义模板的流程图。
具体实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
在下文中,如果本文所述的方法包括一系列步骤,则本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序,且一些所述的步骤可被省略和/或一些本文未描述的其他步骤可被添加到该方法中。
目前市场上识别产品的功能主要是能把图片中的文字信息提取出来,但是并不知道提取出来的文字是什么意思,且识别的准确率不高。对于信息量巨大的财报或其他打印文档,如果不能准确知道识别的信息的标签,全部识别出来对于具体业务是几乎没有意义的。
因此有必要提供一种基于深度学习的自由格式文档识别方法,如图1所示,图1为本发明实施例提供的识别待识别文档的流程图,所述识别方法包括以下步骤:
定义模板,所述模板中包含多个矩形碎片的坐标位置;
获取待识别文档;
OCR引擎全文识别,以判断所述待识别文档所属模板;
调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;
根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
将所述多个碎片文件存入数据库,并将所述多个碎片文件传入消息队列中;
OCR引擎继续识别消息队列中的碎片文件,得到识别结果;
返回所述碎片文件和识别结果到数据库;
完成识别。
本发明通过先识别待识别文档中的碎片文件及其坐标位置,将得到的多个碎片文件传入消息队列中,再依次从消息队列中获取并识别各碎片文件中的图片内容的方式,实现了异步识别;通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;本发明可用于自动识别、提取和存储自由格式文档中的文本内容,使各种打印文档与各业务系统之间所需信息能够快速转换并输入。
在一个实施例中,所述识别方法可以采用前台录入GUI、web管理界面、定义模板模块、OCR引擎(可以为深度学习OCR识别引擎)和处理系统。其中,前台录入GUI和web管理界面用于为定义模板和输入待识别文档提供pdf文档录入界面和接口,识别结果查看和审核功能等。定义模板模块基于golang实现,用于定义模板的特征识别区域的位置和文本信息。OCR引擎和处理系统可以采用RCNN模型进行全文识别并且比对所述待识别文档,从而明确所述待识别文档所属的模板;OCR引擎在文本识别过程中分为两个步骤,首先是采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中,第一步骤用于对待识别文档进行全文识别,速度稍微慢点,返回全部识别结果和识别结果的位置信息;其次是基于RCNN模型进行图片文本识别,得到识别结果,第二步骤用于对于已切图片碎片的直接识别,速度快并且准确度高。采用本发明中的识别方法,识别结果可以达到98%以上的识别准确率,其中仅存在OCR引擎识别带来的误差,其余部分由于已经定义模板,使所有识别流程均是确定的系统处理过程。其中,YOLO目标检测模型的算法详情可以参考论文《You only look once unified real-time object detection》,RCNN模型算法详情可以参考现有技术中RCNN的介绍。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述模板包括:证件类模板、申请书类模板、审批类模板和报表类模板;各类模板中包括多种模板。
进一步的,如图1和2所示,图2为本发明实施例提供的定义模板的流程图,定义模板包括以下步骤:
上传具有模板的图片;
定义模板的名称;
在所述图片中画出所有的矩形碎片,待画出所有目标矩形碎片后,点击编辑模板,计算并显示所有矩形碎片的坐标位置,在此基础上定义任一矩形碎片为特征识别区域;
选择各所述矩形碎片的识别引擎,不同的识别引擎可以调用不同的后台OCR引擎;
填写各所述矩形碎片的标签;
完成模板定义。
模板例如身份证模板、银行系统中存款账户开户申请书模板等等,定义特定的照片识别区域、证件号码识别区域、姓名识别区域、电子邮箱识别区域以及联系方式识别区域等等,从而形成不同模板的不同矩形碎片,选择识别引擎并填写矩形碎片的标签,完成不同模板的定义。
本发明通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;并且使所有识别流程均是确定的系统处理过程,提高识别准确率。
在一个实施例中,在获取待识别文档之后,OCR引擎全文识别之前,还包括以下步骤:主动选择对应模板。若已经明确模板,则可以主动选择模板,在识别过程中,可以再采用RCNN模型进行全文识别核实。若不清楚待识别文档所属模板,则通过RCNN模型进行全文识别比对查找模板。
接着,OCR引擎全文识别,以判断所述待识别文档所属模板。
优选的,在OCR引擎全文识别之后,调用所述模板中所有的坐标位置之前,还包括以下步骤:
对所述待识别文档进行预处理;
所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。优选的,预处理阶段中,可以通过opencv形态学操作获取待识别文档的矩形元素,并由腐蚀和膨胀等操作初步获取待识别文档形态学位置,再通过霍夫变换确定待识别文档直线角度信息,然后通过直线角度信息整体旋转图片以获得纠正的标准图片。此方法主要是为了纠正待识别文档在扫描过程中带入的角度和位置偏移,为之后的待识别文档碎片化做准备。
进一步的,调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;并根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
优选的,各碎片文件均具有各自的UUID,可以理解为本发明将待识别文档中需要的部分切分出来单独识别,并且打上标签,作为需要提取的结果让计算机处理或者存储。优选的,所述碎片文件中包括但不限于:UUID、命名、坐标位置、编号以及识别引擎;所述碎片文件可以存储于数据库中。
优选的,将所述多个碎片文件传入消息队列中,每种或几种不同的业务分别存储在不同的queen中,作为消息队列消息的生产过程。另外本发明可以设置一个程序读取rabbitmq中消息队列的信息,每读取到一个碎片文件的信息,便按照坐标位置重新读取并根据识别引擎发送到下游不同的OCR引擎中,获得识别引擎的返回结果后,最后通过碎片的编号等信息更新此碎片文件的识别结果到数据库。
可选的,在所述基于深度学习的自由格式文档识别方法中,所述待识别文档包括:单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。
可选的,在所述基于深度学习的自由格式文档识别方法中,若所述待识别文档不能归属于现有模板中任意一个模板,则不对所述待识别文档进行处理。优选的,可以将不能识别的待识别文档重新定义为一个新的模板存储的数据库中,以便后续能识别更多的文档。
本发明相对于现有技术,具有以下优点:
(1)通过先识别待识别文档中的碎片文件及其坐标位置,再识别各碎片文件中的图片内容的方式,实现了异步识别;
(2)通过异步识别待识别文档的方式,解耦了图片输入处理服务和OCR引擎服务,保证了对大批量高并发识别请求的稳定处理,削除了请求高峰,合理分发了请求,另外,异步处理过程缓存了快速度服务的请求,解决了两个服务速度差异的冲突;
(3)通过采用OCR引擎继续识别消息队列中的碎片文件,提高了识别的准确率;
(4)通过提前定义矩形碎片及其坐标位置,从而明确了被识别内容的作用和意义;
(5)可用于自动识别、提取和存储自由格式文档中的文本内容;
(6)节省人工录入成本。
上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。

Claims (10)

1.一种基于深度学习的自由格式文档识别方法,其特征在于,包括以下步骤:
前台录入GUI用于定义模板,所述模板中包含多个矩形碎片的坐标位置;
web管理界面用于输入待识别文档,提供pdf文档录入界面和接口;
获取待识别文档;
OCR引擎全文识别,以判断所述待识别文档所属模板;
调用所述模板中所有矩形碎片的坐标位置,采用YOLO目标检测模型将模板中所有的矩形碎片及其坐标位置对应在所述待识别文档中;
根据所述矩形碎片及其坐标位置切割所述待识别文档,形成多个碎片文件;
将所述多个碎片文件存入数据库,并将所述多个碎片文件传入消息队列中;
OCR引擎继续识别消息队列中的碎片文件,得到识别结果;识别方式为OCR引擎和处理系统采用RCNN模型进行全文识别;
返回所述碎片文件和识别结果到数据库;
完成识别。
2.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,各碎片文件均具有各自的UUID。
3.如权利要求2所述的基于深度学习的自由格式文档识别方法,其特征在于,所述碎片文件包括:UUID、命名、坐标位置、编号以及识别引擎。
4.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,OCR引擎继续识别消息队列中的碎片文件的过程中,采用RCNN模型进行图片文本识别,得到识别结果。
5.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,所述模板包括:证件类模板、申请书类模板、审批类模板和报表类模板;
各类模板中包括多种模板。
6.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,定义模板包括以下步骤:
上传具有模板的图片;
定义模板的名称;
在所述图片中画出所有的矩形碎片,并显示所有矩形碎片的坐标位置;
选择各所述矩形碎片的识别引擎;
填写各所述矩形碎片的标签;
完成模板定义。
7.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,在获取待识别文档之后,OCR引擎全文识别之前,还包括以下步骤:
主动选择对应模板。
8.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,在OCR引擎全文识别之后,调用所述模板中所有的坐标位置之前,还包括以下步骤:
对所述待识别文档进行预处理;
所述预处理包括旋转纠正、按照特征识别区域切割和/或移动所述待识别文档。
9.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,所述待识别文档包括:单独的图片文档、含多个图片的文档以及同时含文字和图片的文档。
10.如权利要求1所述的基于深度学习的自由格式文档识别方法,其特征在于,若所述待识别文档不能归属于现有模板中任意一个模板,则不对所述待识别文档进行处理。
CN202011168354.9A 2020-10-28 2020-10-28 一种基于深度学习的自由格式文档识别方法 Active CN112348022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011168354.9A CN112348022B (zh) 2020-10-28 2020-10-28 一种基于深度学习的自由格式文档识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011168354.9A CN112348022B (zh) 2020-10-28 2020-10-28 一种基于深度学习的自由格式文档识别方法

Publications (2)

Publication Number Publication Date
CN112348022A CN112348022A (zh) 2021-02-09
CN112348022B true CN112348022B (zh) 2024-05-07

Family

ID=74359289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011168354.9A Active CN112348022B (zh) 2020-10-28 2020-10-28 一种基于深度学习的自由格式文档识别方法

Country Status (1)

Country Link
CN (1) CN112348022B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113192607B (zh) * 2021-04-13 2024-03-26 复旦大学附属中山医院 标注处理方法、装置、计算机设备和存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744884A (zh) * 2013-12-23 2014-04-23 武汉传神信息技术有限公司 一种整理信息碎片的方法及系统
CN104123550A (zh) * 2013-04-25 2014-10-29 魏昊 基于云计算的文本扫描识别方法
CN104639950A (zh) * 2015-02-06 2015-05-20 北京量子伟业信息技术股份有限公司 基于碎片化技术的影像加工系统及方法
CN106250987A (zh) * 2016-07-22 2016-12-21 无锡华云数据技术服务有限公司 一种机器学习方法、装置及大数据平台
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN109558846A (zh) * 2018-11-30 2019-04-02 厦门商集网络科技有限责任公司 基于ocr模板归一化提升自定义模板识别率方法及设备
CN109656733A (zh) * 2018-12-27 2019-04-19 厦门商集网络科技有限责任公司 智能调度多ocr识别引擎的方法及设备
CN109800761A (zh) * 2019-01-25 2019-05-24 厦门商集网络科技有限责任公司 基于深度学习模型创建纸质文档结构化数据的方法和终端
CN110008944A (zh) * 2019-02-20 2019-07-12 平安科技(深圳)有限公司 基于模板匹配的ocr识别方法及装置、存储介质
CN110334585A (zh) * 2019-05-22 2019-10-15 平安科技(深圳)有限公司 表格识别方法、装置、计算机设备和存储介质
CN110751143A (zh) * 2019-09-26 2020-02-04 中电万维信息技术有限责任公司 一种电子发票信息的提取方法及电子设备
CN110942061A (zh) * 2019-10-24 2020-03-31 泰康保险集团股份有限公司 文字识别方法、装置、设备和计算机可读介质
CN111259882A (zh) * 2020-01-14 2020-06-09 平安科技(深圳)有限公司 票据识别的方法、装置及计算机设备
CN111709349A (zh) * 2020-06-11 2020-09-25 杭州尚尚签网络科技有限公司 一种针对带表格合同的ocr识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140046954A1 (en) * 2012-08-07 2014-02-13 3M Innovative Properties Company And A Completed Software tool for creation and management of document reference templates
US11037010B2 (en) * 2019-01-11 2021-06-15 Microsoft Technology Licensing, Llc Compositional model for text recognition
US11586815B2 (en) * 2019-03-14 2023-02-21 Proov Systems Ltd. Method, system and computer program product for generating artificial documents

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123550A (zh) * 2013-04-25 2014-10-29 魏昊 基于云计算的文本扫描识别方法
CN103744884A (zh) * 2013-12-23 2014-04-23 武汉传神信息技术有限公司 一种整理信息碎片的方法及系统
CN104639950A (zh) * 2015-02-06 2015-05-20 北京量子伟业信息技术股份有限公司 基于碎片化技术的影像加工系统及方法
CN106250987A (zh) * 2016-07-22 2016-12-21 无锡华云数据技术服务有限公司 一种机器学习方法、装置及大数据平台
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN109558846A (zh) * 2018-11-30 2019-04-02 厦门商集网络科技有限责任公司 基于ocr模板归一化提升自定义模板识别率方法及设备
CN109656733A (zh) * 2018-12-27 2019-04-19 厦门商集网络科技有限责任公司 智能调度多ocr识别引擎的方法及设备
CN109800761A (zh) * 2019-01-25 2019-05-24 厦门商集网络科技有限责任公司 基于深度学习模型创建纸质文档结构化数据的方法和终端
CN110008944A (zh) * 2019-02-20 2019-07-12 平安科技(深圳)有限公司 基于模板匹配的ocr识别方法及装置、存储介质
CN110334585A (zh) * 2019-05-22 2019-10-15 平安科技(深圳)有限公司 表格识别方法、装置、计算机设备和存储介质
CN110751143A (zh) * 2019-09-26 2020-02-04 中电万维信息技术有限责任公司 一种电子发票信息的提取方法及电子设备
CN110942061A (zh) * 2019-10-24 2020-03-31 泰康保险集团股份有限公司 文字识别方法、装置、设备和计算机可读介质
CN111259882A (zh) * 2020-01-14 2020-06-09 平安科技(深圳)有限公司 票据识别的方法、装置及计算机设备
CN111709349A (zh) * 2020-06-11 2020-09-25 杭州尚尚签网络科技有限公司 一种针对带表格合同的ocr识别方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Joseph Redmon等.You only look once:unified,real-time object detaction.IEEE Xplore.2016,第779-788页. *
Mohamed kerwat等.Detecting knowledge artifacts in scientific document images-comparing deep learing architetures.IEEE xplore.2018,第147-152页. *
刘戈三 主编.电影科技:数字电影技术应用研究.北京:中国电影出版社,2020,第389页. *
姜维 等.基于深度学习的场景文字检测综述.电子学报.2019,第1152-1161页. *
李尚林 ; 王鲁达 ; 刘东 ; .基于CNN的银行卡数字识别方法.图学学报.2020,(01),第84-90页. *
达观数据著.智能RPA实战.北京:机械工业出版社,2020,第76-77页. *

Also Published As

Publication number Publication date
CN112348022A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
US9552516B2 (en) Document information extraction using geometric models
US9626555B2 (en) Content-based document image classification
CN103995904B (zh) 一种影像档案电子资料的识别系统
US20070217715A1 (en) Property record document data validation systems and methods
AU2015203150A1 (en) System and method for data extraction and searching
CN103617415A (zh) 一种自动识别发票的装置和方法
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
CN109271951A (zh) 一种提升记账审核效率的方法及系统
CN110516664A (zh) 票据识别方法、装置、电子设备及存储介质
CN111858977B (zh) 票据信息采集方法、装置、计算机设备和存储介质
CN112418812A (zh) 分布式全链路自动化智能通关系统、方法及存储介质
CN112528954A (zh) 一种证件图像文字提取方法
CN112348022B (zh) 一种基于深度学习的自由格式文档识别方法
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
CN112036330A (zh) 一种文本识别方法、文本识别装置及可读存储介质
KR20180126352A (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
US20070217691A1 (en) Property record document title determination systems and methods
CN111104853A (zh) 图像信息录入方法、装置、电子设备及存储介质
TWM575887U (zh) 智能會計帳務系統
CN115223183A (zh) 一种信息提取方法、装置及电子设备
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN114443834A (zh) 一种证照信息提取的方法、装置及存储介质
CN113935296A (zh) 一种使用滑动模板技术进行纸质银行流水信息提取的方法
CN110751140A (zh) 字符批量识别方法、装置和计算机设备
CN115640952B (zh) 一种数据导入上传的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant