CN111444793A - 基于ocr的票据识别方法、设备、存储介质及装置 - Google Patents

基于ocr的票据识别方法、设备、存储介质及装置 Download PDF

Info

Publication number
CN111444793A
CN111444793A CN202010176527.5A CN202010176527A CN111444793A CN 111444793 A CN111444793 A CN 111444793A CN 202010176527 A CN202010176527 A CN 202010176527A CN 111444793 A CN111444793 A CN 111444793A
Authority
CN
China
Prior art keywords
bill
template
identification area
area positioning
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010176527.5A
Other languages
English (en)
Inventor
孟波川
黄煦
李建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Acer Beijing Information Technology Co ltd
Original Assignee
Acer Beijing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Acer Beijing Information Technology Co ltd filed Critical Acer Beijing Information Technology Co ltd
Priority to CN202010176527.5A priority Critical patent/CN111444793A/zh
Publication of CN111444793A publication Critical patent/CN111444793A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

公开了一种基于OCR的票据识别方法、设备、存储介质及装置。方法包括:采集多个不同票据的票面特征,基于票面特征获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板;将每个识别区域定位模板与票据类别及所属单位信息进行关联,建立票据模板库;识别用户上传的票据图片的票据类别及所属单位信息,并基于识别结果通过精确匹配方法或模糊匹配方法从票据模板库中匹配对应的识别区域定位模板;基于匹配到的识别区域定位模板对票据图片进行裁切处理,获得票据图片中对应多个不同区域票据字段的多个图像切片;通过OCR自动识别算法识别每个图像切片中的字段。有效提高识别精确度与效率。

Description

基于OCR的票据识别方法、设备、存储介质及装置
技术领域
本发明涉及数据处理领域,更具体地,涉及一种基于OCR的票据识别方法、设备、存储介质及装置。
背景技术
OCR(Optical Character Recognition,光学字符识别)是模式识别领域中重要的研究方向。近年来,随着移动设备的快速更新迭代,以及移动互联网的快速发展,使得OCR有更为广泛的应用场景,从以往的扫描文件的字符识别,到现在应用到自然场景中图片文字的识别,如识别身份证、银行卡、门牌、票据及各类网络图片中的文字。
大型企业、机构、医院体检、保险行业等都有海量的票据需要进行信息的采集、录入以及电子化存档。目前票据数字化管理程度还比较低,常采用的手动录入、人工建档的方式劳动强度大、效率低且成本开支大,而且容易出错。虽然目前能利用机器学习方法基于OCR技术进行票据识别,但识别精度不高,这样就会造成票据多种信息的错误,无法快速建档,提高工作效率。
因此,有必要开发一种基于OCR的票据识别方法及系统。
发明内容
本发明提出了一种基于OCR的票据识别方法、设备、存储介质及装置,其能够通过建立的票据模板库,在票据识别过程中将票据图片匹配对应的识别区域定位模板对关键字段所在区域进行裁切,然后再对切片图像中的字段进行精准识别,进而提高识别精确度与效率。
根据本发明的一种基于OCR的票据识别方法,包括:
采集多个不同票据的票面特征,基于每个票据的所述票面特征获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板;
将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联,并建立包括多个识别区域定位模板的票据模板库;
识别用户上传的票据图片的票据类别及所属单位信息,并基于识别结果通过精确匹配方法或模糊匹配方法从所述票据模板库中匹配对应的识别区域定位模板;
基于匹配到的识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中对应多个不同区域票据字段的多个图像切片;
通过OCR自动识别算法识别每个所述图像切片中的字段。
可选地,将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联包括:
将每个识别区域定位模板与对应票据的票据类别及所属单位信息的全部字段以及所述票据类别及所属单位信息中的关键字进行关联。
可选地,识别用户上传的票据图片的票据类别及所属单位信息包括:
判断用户上传的票据图片的票据类别及所属单位信息所在位置中的字段是否清晰,若清晰则识别所述票据类别及所属单位信息的全部字段,若不清晰则识别所述票据类别及所属单位信息的部分字段。
可选地,基于识别结果通过精确匹配方法或模糊匹配方法从所述票据模板库中匹配对应的识别区域定位模板包括:
基于所述全部字段通过字符精确匹配算法直接从所述票据模板库中检索与所有识别区域定位模板关联的票据类别及所属单位信息的所述全部字段,进而匹配对应的识别区域定位模板;或者,
基于所述关键字通过字符模糊匹配算法从所述票据模板库中检索与全部识别区域定位模板关联的票据类别及所属单位信息的所述关键字,进而匹配对应的识别区域定位模板。
可选地,所述识别区域定位模板包括对应所述票据图片的中多个必要的票据字段所在位置的多个框选识别区域。
可选地,基于匹配到的识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中对应多个不同区域票据字段的多个图像切片包括:
基于所述识别区域定位模板中的所述多个框选识别区域对所述票据图片进行裁切处理,以获得与所述多个框选识别区域一一对应的多个图像切片。
可选地,通过OCR自动识别算法识别每个所述图像切片中的字段包括:
对所述切片图像中的票据字段进行字段信息识别提取,同时将识别提取出的字段信息进行结构化数据输出。
本发明还提出一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的基于OCR的票据识别方法。
本发明还提出一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行上述的基于OCR的票据识别方法。
本发明还提出一种基于OCR的票据识别装置,包括:
模板建立模块,用于采集多个不同票据的票面特征,基于每个票据的所述票面特征获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板;以及,
用于将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联,并建立包括多个识别区域定位模板的票据模板库;
模板匹配模块,用户识别用户上传的票据图片的票据类别及所属单位信息,并基于识别结果通过精确匹配方法或模糊匹配方法从所述票据模板库中匹配对应的识别区域定位模板;
裁切处理模块,用于基于匹配到的识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中对应多个不同区域票据字段的多个图像切片;
OCR自动识别模块,用于通过OCR自动识别算法识别每个所述图像切片中的字段。
本发明的有益效果为:
基于采集的票据图片中的票面特征,获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板,进而建立包括对应多种票据的识别区域定位模板的票据模板库,并将票据的类型及所属单位信息关联,在模板匹配阶段识别用户上传票据图像的类别及所属单位信息中的字段信息,并基于识别结果在票据模板库中进行精确匹配或模糊匹配套取对应的识别区域定位模板,然后在票据识别过程中将票据图片匹配对应的识别区域定位模板对必要的票据字段所在区域进行裁切,再对切片图像中的字段进行精准识别,进而提高识别精确度与效率。
本发明的方法和装置具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的,或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述,这些附图和具体实施方式共同用于解释本发明的特定原理。
附图说明
通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了根据本发明的基于OCR的票据识别方法的步骤的流程图。
具体实施方式
下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
图1示出了根据本发明的基于OCR的票据识别方法的步骤的流程图。
如图1所示,根据本发明的一种基于OCR的票据识别方法,包括:
采集多个不同票据的票面特征,基于每个票据的票面特征获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板;
将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联,并建立包括多个识别区域定位模板的票据模板库;
识别用户上传的票据图片的票据类别及所属单位信息,并基于识别结果通过精确匹配方法或模糊匹配方法从票据模板库中匹配对应的识别区域定位模板;
基于匹配到的识别区域定位模板对票据图片进行裁切处理,以获得票据图片中对应多个不同区域票据字段的多个图像切片;
通过OCR自动识别算法识别每个图像切片中的字段。
具体地,基于采集的票据图片中的票面特征,获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板,进而建立包括对应多种票据的识别区域定位模板的票据模板库,并将票据的类型及所属单位信息关联,在模板匹配阶段识别用户上传票据图像的类别及所属单位信息中的字段信息,并基于识别结果在票据模板库中进行精确匹配或模糊匹配套取对应的识别区域定位模板,然后在票据识别过程中将票据图片匹配对应的识别区域定位模板对必要的票据字段所在区域进行裁切,再对切片图像中的字段进行精准识别,进而提高识别精确度与效率。
其中,将每个识别区域定位模板与对应票据的票据类别及所属单位信息的全部字段以及票据类别及所属单位信息中的关键字进行关联具体为:将每个识别区域定位模板与对应票据的票据类别及所属单位信息的全部字段以及所述票据类别及所属单位信息中的关键字进行关联。其中,票据类别具体为票据的种类、领域等,如商业保险报销单、医保报销单、医院报销发票以及保险公司理赔报销单据等,所属单位信息即票据上企业单位、医院等的全称或盖在票据上的财务印章中的单位全称,关键字可以包括省、市、县区等地区关键词,以及单位全称中的关键词,如XX医院、XX保险等,本领域技术人员可以根据具体的票据类别和所属单位信息的全称进行具体设置,此处不再赘述。其中,必要的票据字段包括医院或保险公司的名称字段、用户名字段、金额字段、药品的名称字段、日期字段等。
在一个示例中,可以开发票据识别服务平台并提供票据识别业务,通过主动收集合作方(各地的医院、保险公司等)的各种类型的票据进行票面特征数据采集,确定不同单位的票据信息的分布特征,并建立对应不同票据的识别区域定位模板,同时将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联,从而建立票据模板库。用户需要进行票据识别时,将拍摄或扫描的票据图片按照指定格式上传票据图像文件。系统自动识别票据的类别及所属单位信息,并基于模板关联的类别及所属单位信息在票据模板库中检索、匹配与该票据对应的识别区域定位模板。
在另一个示例中,也可以通过人工(操作员)对上传的单据类别和所属单位(医院、保险公司等)进行判断,若属于非受理业务对应的票据,或者票据对应的所属单位并未建立相关的识别区域定位模板,可以发出退单信息。如果出现所属单位的票据(发票等)未建模,则创建建模任务,可以在一段时间后(如下一个工作日)即可处理新增单位的业务。
在一个示例中,票据图片匹配识别区域定位模板的过程为:
(1)首先判断用户上传的票据图片的票据类别及所属单位信息所在位置中的字段是否清晰,若清晰则识别票据类别及所属单位信息的全部字段,若不清晰则识别票据类别及所属单位信息的部分字段;
(2)基于全部字段通过现有的字符精确匹配算法直接从票据模板库中检索与所有识别区域定位模板关联的票据类别及所属单位信息的全部字段,进而匹配对应的识别区域定位模板;或者,基于关键字通过现有的字符模糊匹配算法从票据模板库中检索与全部识别区域定位模板关联的票据类别及所属单位信息的关键字,进而匹配对应的识别区域定位模板。
进一步地,在本实施例中,除建立票据模板库以外,还可以建立项目分类库、ICD编码库、药品库、诊疗库、手术编码库、医院库、全国医保库、保险规则库等以实现后台数据库支撑,基于上述数据库能够对于OCR识别结果进行最终的逻辑审核和数据校正。OCR机器识别可以基于采集的海量票据数据作为神经网络的训练样本,实现基于OCR的AI智能识别。
在一个示例中,识别区域定位模板包括对应票据图片的中多个必要的票据字段所在位置的多个框选识别区域。
具体地,通过识别区域定位模板能够对票据图片的中多个必要的票据字段所在位置进行框选,从而只对框选区域内的必要的票据字段信息进行提取,相较于传统的无模板的OCR识别方法,利用模板框选必要的票据字段能够减少人工智能OCR识别算法的计算量并提高精确度和识别效率。
在一个示例中,基于匹配到的识别区域定位模板对票据图片进行裁切处理,以获得票据图片中对应多个不同区域票据字段的多个图像切片包括:
基于识别区域定位模板中的多个框选识别区域对票据图片进行裁切处理,以获得与多个框选识别区域一一对应的多个图像切片。对切片图像中的票据字段进行字段信息识别提取,同时将识别提取出的字段信息进行结构化数据输出。
具体地,在该步骤中,若用户上传的票据图像出现倾斜歪曲,可以通过现有的图像校正算法进行校正,以使票据图片的整体以及多个必要的票据字段能够与对应的识别区域定位模板中的多个框选识别区域一一对应。之后,基于识别区域定位模板中的多个框选识别区域对票据图片进行裁切处理,以获得与多个框选识别区域一一对应的多个图像切片,并使每个图像切片与对应的一个框选识别区域的字段属性进行关联,以此能够将图像切片中的字段与字段属性相对应,从而提高字段提取的准确性。
需要说明的是,本发明方案中的OCR自动识别算法、字符精确匹配算法以及字符模糊匹配算法均为现有技术,本领域技术人员容易实现,此处不再赘述。
本发明实施例还提出一种电子设备,电子设备包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的基于OCR的票据识别方法。
本发明实施例还提出一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行上述的基于OCR的票据识别方法。
本发明实施例还提出一种基于OCR的票据识别装置,包括:
模板建立模块,用于采集多个不同票据的票面特征,基于每个票据的票面特征获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板;以及,
用于将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联,并建立包括多个识别区域定位模板的票据模板库;
模板匹配模块,用户识别用户上传的票据图片的票据类别及所属单位信息,并基于识别结果通过精确匹配方法或模糊匹配方法从票据模板库中匹配对应的识别区域定位模板;
裁切处理模块,用于基于匹配到的识别区域定位模板对票据图片进行裁切处理,以获得票据图片中对应多个不同区域票据字段的多个图像切片;
OCR自动识别模块,用于通过OCR自动识别算法识别每个图像切片中的字段,然后将识别出的票据字段信息进行结构化数据输出。
上述实施例通过建立对应每个票据的识别区域定位模板,并建立包括对应多种票据的识别区域定位模板的票据模板库,基于类型及所属单位信息与模板进行关联,在模板匹配阶段识别用户上传票据图像的类别及所属单位信息中的字段信息,通过将识别结果在票据模板库中进行精确匹配或模糊匹配套取对应的识别区域定位模板,然后在票据识别过程中将票据图片匹配对应的识别区域定位模板对必要的票据字段所在区域进行裁切,再对切片图像中的字段进行精准识别,能够有效提高识别精确度与效率。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

Claims (10)

1.一种基于OCR的票据识别方法,其特征在于,包括:
采集多个不同票据的票面特征,基于每个票据的所述票面特征获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板;
将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联,并建立包括多个识别区域定位模板的票据模板库;
识别用户上传的票据图片的票据类别及所属单位信息,并基于识别结果通过精确匹配方法或模糊匹配方法从所述票据模板库中匹配对应的识别区域定位模板;
基于匹配到的识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中对应多个不同区域票据字段的多个图像切片;
通过OCR自动识别算法识别每个所述图像切片中的字段。
2.根据权利要求1所述的基于OCR的票据识别方法,其特征在于,将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联包括:
将每个识别区域定位模板与对应票据的票据类别及所属单位信息的全部字段以及所述票据类别及所属单位信息中的关键字进行关联。
3.根据权利要求2所述的基于OCR的票据识别方法,其特征在于,识别用户上传的票据图片的票据类别及所属单位信息包括:
判断用户上传的票据图片的票据类别及所属单位信息所在位置中的字段是否清晰,若清晰则识别所述票据类别及所属单位信息的全部字段,若不清晰则识别所述票据类别及所属单位信息的部分字段。
4.根据权利要求2所述的基于OCR的票据识别方法,其特征在于,基于识别结果通过精确匹配方法或模糊匹配方法从所述票据模板库中匹配对应的识别区域定位模板包括:
基于所述全部字段通过字符精确匹配算法直接从所述票据模板库中检索与所有识别区域定位模板关联的票据类别及所属单位信息的所述全部字段,进而匹配对应的识别区域定位模板;或者,
基于所述关键字通过字符模糊匹配算法从所述票据模板库中检索与全部识别区域定位模板关联的票据类别及所属单位信息的所述关键字,进而匹配对应的识别区域定位模板。
5.根据权利要求1所述的基于OCR的票据识别方法,其特征在于,
所述识别区域定位模板包括对应所述票据图片的中多个必要的票据字段所在位置的多个框选识别区域。
6.根据权利要求1所述的基于OCR的票据识别方法,其特征在于,基于匹配到的识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中对应多个不同区域票据字段的多个图像切片包括:
基于所述识别区域定位模板中的所述多个框选识别区域对所述票据图片进行裁切处理,以获得与所述多个框选识别区域一一对应的多个图像切片。
7.根据权利要求1所述的基于OCR的票据识别方法,其特征在于,通过OCR自动识别算法识别每个所述图像切片中的字段包括:
对所述切片图像中的票据字段进行字段信息识别提取,同时将识别提取出的字段信息进行结构化数据输出。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一所述的基于OCR的票据识别方法。
9.一种非暂态计算机可读存储介质,其特征在于,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1-7任一所述的基于OCR的票据识别方法。
10.一种基于OCR的票据识别装置,其特征在于,包括:
模板建立模块,用于采集多个不同票据的票面特征,基于每个票据的所述票面特征获取每个票据中必要的票据字段、票据类别及所属单位信息的所在位置,建立对应每个票据的识别区域定位模板;以及,
用于将每个识别区域定位模板与对应票据的票据类别及所属单位信息进行关联,并建立包括多个识别区域定位模板的票据模板库;
模板匹配模块,用户识别用户上传的票据图片的票据类别及所属单位信息,并基于识别结果通过精确匹配方法或模糊匹配方法从所述票据模板库中匹配对应的识别区域定位模板;
裁切处理模块,用于基于匹配到的识别区域定位模板对所述票据图片进行裁切处理,以获得所述票据图片中对应多个不同区域票据字段的多个图像切片;
OCR自动识别模块,用于通过OCR自动识别算法识别每个所述图像切片中的字段。
CN202010176527.5A 2020-03-13 2020-03-13 基于ocr的票据识别方法、设备、存储介质及装置 Pending CN111444793A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010176527.5A CN111444793A (zh) 2020-03-13 2020-03-13 基于ocr的票据识别方法、设备、存储介质及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010176527.5A CN111444793A (zh) 2020-03-13 2020-03-13 基于ocr的票据识别方法、设备、存储介质及装置

Publications (1)

Publication Number Publication Date
CN111444793A true CN111444793A (zh) 2020-07-24

Family

ID=71652314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010176527.5A Pending CN111444793A (zh) 2020-03-13 2020-03-13 基于ocr的票据识别方法、设备、存储介质及装置

Country Status (1)

Country Link
CN (1) CN111444793A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991456A (zh) * 2019-12-05 2020-04-10 北京百度网讯科技有限公司 票据识别方法及装置
CN111860450A (zh) * 2020-08-03 2020-10-30 理光图像技术(上海)有限公司 票证识别装置以及票证信息管理系统
CN111931780A (zh) * 2020-08-10 2020-11-13 福建博思软件股份有限公司 一种会计凭证智能管理方法及设备
CN111931664A (zh) * 2020-08-12 2020-11-13 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN112329757A (zh) * 2020-10-20 2021-02-05 安诚迈科(北京)信息技术有限公司 票据信息脱敏采集方法、装置及系统
CN112508011A (zh) * 2020-12-02 2021-03-16 上海逸舟信息科技有限公司 一种基于神经网络的ocr识别方法及设备
CN112989990A (zh) * 2021-03-09 2021-06-18 平安科技(深圳)有限公司 医疗票据识别方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100023778A1 (en) * 2008-07-28 2010-01-28 Jerry Hauck Ticket Authorized Secure Installation And Boot
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN105787418A (zh) * 2014-12-24 2016-07-20 远光软件股份有限公司 原始凭证智能识别及识别信息自动生成单据的方法和装置
US20180101749A1 (en) * 2015-04-13 2018-04-12 Grg Banking Equipment Co., Ltd. Value bill identifying method
CN109214382A (zh) * 2018-07-16 2019-01-15 顺丰科技有限公司 一种基于crnn的票据信息识别算法、设备及存储介质
CN109344838A (zh) * 2018-11-02 2019-02-15 长江大学 发票信息自动快速识别方法、系统以及装置
CN109426814A (zh) * 2017-08-22 2019-03-05 顺丰科技有限公司 一种发票图片特定板块的定位、识别方法、系统、设备
CN109977907A (zh) * 2019-04-04 2019-07-05 厦门商集网络科技有限责任公司 基于票据识别的费用报销方法及其系统
CN110427853A (zh) * 2019-07-24 2019-11-08 北京一诺前景财税科技有限公司 一种智能票据信息提取处理的方法
CN110866495A (zh) * 2019-11-14 2020-03-06 杭州睿琪软件有限公司 票据图像识别方法及装置和设备、训练方法和存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100023778A1 (en) * 2008-07-28 2010-01-28 Jerry Hauck Ticket Authorized Secure Installation And Boot
CN105787418A (zh) * 2014-12-24 2016-07-20 远光软件股份有限公司 原始凭证智能识别及识别信息自动生成单据的方法和装置
US20180101749A1 (en) * 2015-04-13 2018-04-12 Grg Banking Equipment Co., Ltd. Value bill identifying method
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN109426814A (zh) * 2017-08-22 2019-03-05 顺丰科技有限公司 一种发票图片特定板块的定位、识别方法、系统、设备
CN109214382A (zh) * 2018-07-16 2019-01-15 顺丰科技有限公司 一种基于crnn的票据信息识别算法、设备及存储介质
CN109344838A (zh) * 2018-11-02 2019-02-15 长江大学 发票信息自动快速识别方法、系统以及装置
CN109977907A (zh) * 2019-04-04 2019-07-05 厦门商集网络科技有限责任公司 基于票据识别的费用报销方法及其系统
CN110427853A (zh) * 2019-07-24 2019-11-08 北京一诺前景财税科技有限公司 一种智能票据信息提取处理的方法
CN110866495A (zh) * 2019-11-14 2020-03-06 杭州睿琪软件有限公司 票据图像识别方法及装置和设备、训练方法和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991456A (zh) * 2019-12-05 2020-04-10 北京百度网讯科技有限公司 票据识别方法及装置
CN111860450A (zh) * 2020-08-03 2020-10-30 理光图像技术(上海)有限公司 票证识别装置以及票证信息管理系统
CN111931780A (zh) * 2020-08-10 2020-11-13 福建博思软件股份有限公司 一种会计凭证智能管理方法及设备
CN111931664A (zh) * 2020-08-12 2020-11-13 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN111931664B (zh) * 2020-08-12 2024-01-12 腾讯科技(深圳)有限公司 混贴票据图像的处理方法、装置、计算机设备及存储介质
CN112329757A (zh) * 2020-10-20 2021-02-05 安诚迈科(北京)信息技术有限公司 票据信息脱敏采集方法、装置及系统
CN112508011A (zh) * 2020-12-02 2021-03-16 上海逸舟信息科技有限公司 一种基于神经网络的ocr识别方法及设备
CN112989990A (zh) * 2021-03-09 2021-06-18 平安科技(深圳)有限公司 医疗票据识别方法、装置、设备及存储介质
CN112989990B (zh) * 2021-03-09 2023-08-04 平安科技(深圳)有限公司 医疗票据识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111444793A (zh) 基于ocr的票据识别方法、设备、存储介质及装置
CN109034727B (zh) 自助电子政务处理方法
CN111444795A (zh) 票据数据识别方法、电子设备、存储介质及装置
CN112182246B (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
CN111444792B (zh) 票据识别方法、电子设备、存储介质及装置
CN110705515A (zh) 一种基于ocr文字识别的医院纸质档案归档方法及系统
US11087409B1 (en) Systems and methods for generating accurate transaction data and manipulation
CN114117171A (zh) 一种基于赋能思维的工程档案智能收整方法及系统
CN111858977B (zh) 票据信息采集方法、装置、计算机设备和存储介质
CN112927776A (zh) 一种面向医学检验报告的人工智能自动解读系统
CN105183950B (zh) 一种基于移动终端查阅工程图纸的方法及系统
CN117114514A (zh) 一种基于大数据的人才信息分析管理方法、系统及装置
CN112214557B (zh) 数据匹配分类方法及装置
CN116343210B (zh) 档案数字化的管理方法及装置
CN116311299A (zh) 表格的结构化数据识别方法、装置及系统
CN115719289A (zh) 一种房屋数据的处理方法、装置、设备及介质
CN112364790B (zh) 基于卷积神经网络的机场工作单信息识别方法及系统
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质
CN111241955B (zh) 一种票据信息提取方法及系统
CN113657373A (zh) 一种文书自动编目方法
CN112348022A (zh) 一种基于深度学习的自由格式文档识别方法
CN116595238B (zh) 一种基于rfid技术的用户档案数据分析处理方法
CN116664066B (zh) 一种管理企业计划收入与实际收入的方法及系统
CN111427916B (zh) 一种数据模拟方法和装置
CN115577099B (zh) 一种污染地块边界识别方法、系统、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination