CN111291741B - 单据识别方法、装置、计算机设备和存储介质 - Google Patents

单据识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111291741B
CN111291741B CN202010399997.8A CN202010399997A CN111291741B CN 111291741 B CN111291741 B CN 111291741B CN 202010399997 A CN202010399997 A CN 202010399997A CN 111291741 B CN111291741 B CN 111291741B
Authority
CN
China
Prior art keywords
text
image
coordinate position
recognized
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010399997.8A
Other languages
English (en)
Other versions
CN111291741A (zh
Inventor
熊肇煜
化成君
任伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiping Finance Technology Services Shanghai Co ltd
Original Assignee
Taiping Finance Technology Services Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiping Finance Technology Services Shanghai Co ltd filed Critical Taiping Finance Technology Services Shanghai Co ltd
Priority to CN202010399997.8A priority Critical patent/CN111291741B/zh
Publication of CN111291741A publication Critical patent/CN111291741A/zh
Application granted granted Critical
Publication of CN111291741B publication Critical patent/CN111291741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Abstract

本申请涉及计算机技术领域,特别是涉及一种单据识别方法、装置、计算机设备和存储介质。所述方法包括:获取单据图像;对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,待识别图像包括单据图像中的打印信息;对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置;基于单据图像中非打印信息的模板文件,得到待识别文本中非参考文本相对于参考文本的相对坐标位置;基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。采用本方法能够提升单据识别准确性。

Description

单据识别方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种单据识别方法、装置、计算机设备和存储介质。
背景技术
在保险理赔过程中,存在大量与被保险人就医相关的单据图像,而保险公司收到这些单据图像后,需要通过人工将单据上的信息录入至数据库进行结构化存储,以便于后续的使用。
在传统方式中,用户可以自定义固定的识别模板,然后通过固定的识别模板对单据图像进行识别。
但是,由于单据多是机打图像,在打印的时候存在打印串行等问题,从而通过固定的识别模板对单据图像进行识别所得到的单据数据会存在大量的问题,识别准确性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升单据识别准确性的单据识别方法、装置、计算机设备和存储介质。
一种单据识别方法,所述方法包括:
获取单据图像;
对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,待识别图像包括单据图像中的打印信息;
对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置;
获取待识别文本中非参考文本相对于参考文本的相对坐标位置;
基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别之前,还包括:
获取非参考文本的长宽尺寸;
基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果,包括:
基于相对坐标位置以及参考坐标位置,得到非参考文本的绝对坐标位置;
根据非参考文本的绝对坐标位置以及长宽尺寸,确定非参考文本在待识别图像中的目标区域;
对目标区域进行文本识别,得到非参考文本的识别结果;
遍历待识别文本中的非参考文本,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,获取待识别文本中非参考文本相对于参考文本的相对坐标位置之前,方法还包括:
获取对应单据图像的单据模板;
获取待识别文本中非参考文本相对于参考文本的相对坐标位置,包括:
从对应单据图像的单据模板中获取待识别文本中非参考文本相对于参考文本的相对坐标位置。
在其中一个实施例中,对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,包括:
根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果;
对二分类结果进行二值转换,得到单据图像中待识别文本的待识别图像。
在其中一个实施例中,根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果,包括:
对单据图像进行图像色彩的转换,得到对应单据图像中各像素点的色彩参数;
基于预设阈值以及色彩参数,对单据图像的各像素点进行分类,得到单据图像中待识别文本与背景的二分类结果。
在其中一个实施例中,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果之后,还包括:
按照预先设置的存储要求,对识别结果进行结构化存储。
一种单据识别装置,所述装置包括:
单据图像获取模块,用于获取单据图像;
前景提取模块,用于对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,待识别图像包括单据图像中的打印信息;
参考文本识别模块,用于对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置;
相对坐标位置获取模块,用于获取待识别文本中非参考文本相对于参考文本的相对坐标位置;
非参考文本识别模块,用于基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,上述装置还包括:
尺寸获取模块,用于在非参考文本识别模块基于相对坐标位置以及参考坐标位置,对非参考文本进行识别之前,获取非参考文本的长宽尺寸;
非参考文本识别模块,包括:
绝对坐标位置生成子模块,用于基于相对坐标位置以及参考坐标位置,得到非参考文本的绝对坐标位置;
目标区域确定模块,用于根据非参考文本的绝对坐标位置以及长宽尺寸,确定非参考文本在待识别图像中的目标区域;
文本识别子模块,用于对目标区域进行文本识别,得到非参考文本的识别结果;
遍历子模块,用于遍历待识别文本中的非参考文本,得到单据图像中待识别文本的识别结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
上述单据识别方法、装置、计算机设备和存储介质,通过获取单据图像,然后对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,并对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置,进一步获取待识别文本中非参考文本相对于参考文本的相对坐标位置,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。从而,可以通过对单据图像进行前景提取,得到单据图像中待识别文本的图像,可以减少背景内容的干扰,提升识别的准确性。并且根据识别待识别图像得到的参考文本的参考坐标位置以及获取的相对坐标位置确定各非参考文本的坐标,并对非参考文本进行识别,可以准确对非参考文本进行定位,可以进一步提升识别的准确性。
附图说明
图1为一个实施例中单据识别方法的应用场景图;
图2为一个实施例中单据识别方法的流程示意图;
图3为一个实施例中单据图像的示意图;
图4为一个实施例中待识别图像的示意图;
图5为另一个实施例中单据识别方法的流程示意图;
图6为一个实施例中单据识别装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的单据识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。具体地,终端102采集单据图像,然后通过网络发送给服务器104。服务器104获取到单据图像后,对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,然后服务器104对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置,进一步,服务器104获取待识别文本中非参考文本相对于参考文本的相对坐标位置,并基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。其中,终端102可以但不限于具有图像采集功能的是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种单据识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,获取单据图像。
其中,单据图像是指各种不同的发票、票据等图像。对于医疗保险业务中,单据图像可以是被保险人就医相关的票据图像,例如,治疗收费票据等,如图3所示。
具体地,保险公司在获取被保险人的单据后,可以通过图像扫描、拍照等方式进行单据图像的采集,然后通过网络发送给服务器,以使服务器获取到该单据图像。
步骤S204,对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,待识别图像包括单据图像中的打印信息。
其中,单据图像包括背景部分以及前景部分。背景部分是指单据印刷过程中所印制的标准框架信息,如单据的表格框架,印制的“业务流水号”“某某市理疗门诊收费票据”“医疗机构类型”等标准字样。前景部分是指在打印过程中打印的打印信息,如“实时结算”字样、交易流水号信息、被保险人姓名、性别、卡号、以及具体的年月日时间等信息。
待识别文本是指单据图像中,前景部分的文本内容,待识别图像中包括单据图像中的打印信息。
具体地,服务器可以对获取的单据图像进行打印信息的前景提取,得到单据图像中前景部分的内容,并生成单据中待识别文本的待识别图像,如图4所示。
步骤S206,对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置。
其中,参考文本是指待识别对象中用于作为参考部分的文本内容,例如,对于门诊收费票据中,位于单据左上位置的“实时结算”字样,通常为不变的内容,且是在打印过程中生成的文本内容,则服务器可以将该“实时结算”字样作为参考文本。
具体地,服务器可以通过对待识别图像进行参考文本的文本识别,以得到参考文本在待识别图像中的参考坐标位置。
可选地,服务器在对待识别图像进行参考文本的识别,还可以对待识别图像进行图像尺寸的调整,以得到符合实际尺寸要求的图像,从而在识别时,可以提升识别的准确性。
步骤S208,获取待识别文本中非参考文本相对于参考文本的相对坐标位置。
其中,非参考文本是指打印的内容中除去参考文本部分的文本内容,例如,交易流水号信息、被保险人姓名、性别、卡号、以及具体的年月日时间等信息等。
在本实施例中,在同一种票据中,打印的参考文本与各非参考文本之间的相对坐标位置是固定的,例如,参考文本与被保险人姓名之间的相对坐标位置是固定的,参考文本与性别之间的相对坐标位置也是固定的。服务器可以分别获取待识别文本中各非参考文本相对于参考文本的相对坐标位置,以进行后续的处理。
步骤S210,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。
具体地,服务器可以根据参考文本的参考坐标位置以及非参考文本相对于参考文本的相对坐标位置,即可准确对待识别文本进行定位,然后对非参考文本进行文本的识别,得到单据图像中各待识别文本的识别结果。
上述单据识别方法中,通过获取单据图像,然后对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,并对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置,进一步获取待识别文本中非参考文本相对于参考文本的相对坐标位置,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。从而,可以通过对单据图像进行前景提取,得到单据图像中待识别文本的图像,可以减少背景内容的干扰,提升识别的准确性。并且根据识别待识别图像得到的参考文本的参考坐标位置以及获取的相对坐标位置确定各非参考文本的坐标,并对非参考文本进行识别,可以准确对非参考文本进行定位,可以进一步提升识别的准确性。
在其中一个实施例中,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别之前,还可以包括:获取非参考文本的长宽尺寸。
其中,非参考文本的长宽尺寸是指在待识别图像中,非参考文本所占图像区域的尺寸,例如,待识别文本“男”在待识别图像中的长宽尺寸为h*h。
具体地,服务器可以从对应单据的模板文件中获取各非参考文本的长宽尺寸。其中,模板文件与单据对应,一种类型的单据对应一种类型的模板。模板文件中存储了单据中各待识别对象的实际长宽尺寸,如待识别文本“男”的长宽尺寸为h*h,参考文本“实时结算”的长宽尺寸为4h*h。
在本实施例中,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果,可以包括:基于相对坐标位置以及参考坐标位置,得到非参考文本的绝对坐标位置;根据非参考文本的绝对坐标位置以及长宽尺寸,确定非参考文本在待识别图像中的目标区域;对目标区域进行文本识别,得到非参考文本的识别结果;遍历待识别文本中的非参考文本,得到单据图像中待识别文本的识别结果。
具体地,参考图5,服务器确定参考文本的参考坐标位置(即锚点位置)以及非参考文本相对于参考文本的相对坐标位置后,可以对非参考文本的绝对坐标位置进行计算,即计算需获取信息的绝对位置。
在本实施例中,继续参考图4,参考文本“实时结算”的参考坐标位置为(X,Y),待识别文本“男”相对于参考文本“实时结算”的相对坐标位置为(8h,4h),其中,8h为X方向的相对距离,4h为Y方向的相对距离,则服务器可以得到待识别文本“男”的绝对坐标位置为(X+8h,Y+4h)。
进一步,服务器根据绝对坐标位置为(X+8h,Y+4h),以及长宽尺寸h*h,可以得到待识别文本“男”在待识别图像中的目标区域,即坐标(X+8h,Y+4h)、(X+9h,Y+4h)、(X+8h,Y+5h)、(X+9h,Y+5h)确定的矩形区域。
然后服务器可以对该目标区域进行文本识别,得到识别结果,即得到待识别文本“男”。
同理,服务器遍历待识别图像中姓名、日期、卡号等所有待识别文本,以得到单据图像中所有待识别文本的识别结果。
上述实施例中,通过基于相对坐标位置以及参考坐标位置,得到非参考文本的绝对坐标位置,然后根据非参考文本的绝对坐标位置以及长宽尺寸,确定非参考文本在待识别图像中的目标区域,然后对目标区域进行文本识别,从而可以准确对非参考文本所在区域进行定位,以提升识别的准确性。
在其中一个实施例中,获取待识别文本中非参考文本相对于参考文本的相对坐标位置之前,上述方法还可以包括:获取对应单据图像的单据模板。
其中,单据模板是与单据存在一一对应关系的模板,模板中确定了单据中各个待识别文本之间的相对关系。在本实施例中,一种类型的单据对应一种类型的单据模板。
在本实施例中,获取待识别文本中非参考文本相对于参考文本的相对坐标位置,可以包括:从对应单据图像的单据模板中获取待识别文本中非参考文本相对于参考文本的相对坐标位置。
具体地,服务器在获取单据模板后,可以根据需要识别非参考文本的名称,从单据模板中获取对应非参考文本相对于参考文本的坐标位置,例如,从单据模板中获取待识别文本性别相对于参考文本“实时计算”之间的相对坐标位置为(8h,4h)。
上述实施例中,通过从单据模板中获取待识别文本中非参考文本相对于参考文本的相对坐标位置,可以使得获取的相对坐标位置较为准确,可以提升后续处理的准确性。
在其中一个实施例中,对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,可以包括:根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果;对二分类结果进行二值转换,得到单据图像中待识别文本的待识别图像。
如前所述,单据图像包括背景部分以及前景部分。在本实施例中,单据图像为彩色图像,即RGB图像,服务器可以根据单据图像的图像色彩,对单据图像进行前景的提取。
具体地,服务器可以根据图像色彩,对单据图像进行前景部分以及背景部分进行分类,得到单据图像中前景部分以及背景部分,即得到单据图像中待识别文本以及背景的两分类结果。
进一步,服务器通过将背景部分设置为0,将待识别文本部分设置为1,以实现对二分类结果的单据图像进行二值转换,得到仅包含待识别文本的待识别图像。然后,服务器可以对得到的待识别图像进行参考文本以及非参考文本的识别。
在本实施例中,服务器对参考文本以及非参考文本的识别可以通过光学字符识别(Optical Character Recognition,OCR)的方式进行,或者也可以其他方式,本申请对此不作限制。
上述实施例中,通过对图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果,然后对二分类结果进行二值转换,使得生成的待识别图像中仅包括需要识别的待识别文本的信息,可以提升识别的准确性。
在其中一个实施例中,根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果,可以包括:对单据图像进行图像色彩的转换,得到对应单据图像中各像素点的色彩参数;基于预设阈值以及色彩参数,对单据图像的各像素点进行分类,得到单据图像中待识别文本与背景的二分类结果。
如前所述,单据图像可以是彩色图像,即RGB图像。其中,R、G、B分别代表红、绿、蓝三个通道的颜色。
具体地,继续参考图5,服务器可以通过对单据图像进行图像色彩的转换,得到单据图像中各像素点的色彩参数,即得到各像素点的色调(H)、饱和度(S)、明度(V)。
在本实施例中,服务器可以通过六角锥体模型(Hexcone Model),对单据图像进行图像色彩的转换,以得到单据图像中各像素点的色彩参数。
进一步,服务器在得到对应单据图像中各像素点的色彩参数后,可以设置色彩参数的预设阈值,以对各像素点进行分类。例如,服务器设置H、S、V三个通道的预设阈值为(230,255,130),低于该阈值的像素点为一类,高于该阈值的像素点为一类,得到单据图像中待识别文本与背景的二分类结果。
上述实施例中,通过对单据图像进行图像色彩的转换,得到各像素点的色彩参数,然后根据色彩参数进行像素点的分类,从而,可以根据色彩参数对各像素点进行准确分类,提升分类结果的准确性,进而可以提升后续识别的准确性。
在其中一个实施例中,基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果之后,还可以包括:按照预先设置的存储要求,对识别结果进行结构化存储。
其中,存储要求是指对识别结果进行存储的要求,可以与后续数据的应用相关联。
具体地,服务器可以获取预先设置的存储要求,将识别得到待识别文本存储数据库中,以进行结构化的存储。例如,按照姓名、性别、日期等顺序进行结构化的存储。
在本实施例中,数据库的存储结构可以与存储要求相对应,即存储要求中要求存储哪些数据,则数据库的存储结构则与各存储数据相对应。
上述实施例中,通过将识别得到的识别结果,按照预先设置的存储要求进行结构化存储,从而,后续可以直接获取结构化的数据并使用,减少了后续的处理操作,减少后续的处理流程。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种单据识别装置,包括:单据图像获取模块100、前景提取模块200、参考文本识别模块300、相对坐标位置获取模块400和非参考文本识别模块500,其中:
单据图像获取模块100,用于获取单据图像。
前景提取模块200,用于对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,待识别图像包括单据图像中的打印信息。
参考文本识别模块300,用于对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置。
相对坐标位置获取模块400,用于获取待识别文本中非参考文本相对于参考文本的相对坐标位置。
非参考文本识别模块500,用于基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,上述装置还可以包括:
尺寸获取模块,用于在非参考文本识别模块500基于相对坐标位置以及参考坐标位置,对非参考文本进行识别之前,获取非参考文本的长宽尺寸。
非参考文本识别模块500可以包括:
绝对坐标位置生成子模块,用于基于相对坐标位置以及参考坐标位置,得到非参考文本的绝对坐标位置。
目标区域确定模块,用于根据非参考文本的绝对坐标位置以及长宽尺寸,确定非参考文本在待识别图像中的目标区域。
文本识别子模块,用于对目标区域进行文本识别,得到非参考文本的识别结果。
遍历子模块,用于遍历待识别文本中的非参考文本,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,上述装置还可以包括:
单据模板获取模块,用于在相对坐标位置获取模块400获取待识别文本中非参考文本相对于参考文本的相对坐标位置之前,获取对应单据图像的单据模板。
相对坐标位置获取模块400用于从对应单据图像的单据模板中获取待识别文本中非参考文本相对于参考文本的相对坐标位置。
在其中一个实施例中,前景提取模块200可以包括:
分类子模块,用于根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果。
二值转换子模块,用于对二分类结果进行二值转换,得到单据图像中待识别文本的待识别图像。
在其中一个实施例中,分类子模块可以包括:
转换单元,用于对单据图像进行图像色彩的转换,得到对应单据图像中各像素点的色彩参数。
分类单元,用于基于预设阈值以及色彩参数,对单据图像的各像素点进行分类,得到单据图像中待识别文本与背景的二分类结果。
在其中一个实施例中,上述装置还可以包括:
存储模块,用于非参考文本识别模块500基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果之后,按照预先设置的存储要求,对识别结果进行结构化存储。
关于单据识别装置的具体限定可以参见上文中对于单据识别方法的限定,在此不再赘述。上述单据识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储单据图像、待识别图像、单据模板以及识别结果等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种单据识别方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取单据图像;对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,待识别图像包括单据图像中的打印信息;对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置;获取待识别文本中非参考文本相对于参考文本的相对坐标位置;基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,处理器执行计算机程序时实现基于相对坐标位置以及参考坐标位置,对非参考文本进行识别之前,还可以实现如下步骤:获取非参考文本的长宽尺寸。处理器执行计算机程序时实现基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果,可以包括:基于相对坐标位置以及参考坐标位置,得到非参考文本的绝对坐标位置;根据非参考文本的绝对坐标位置以及长宽尺寸,确定非参考文本在待识别图像中的目标区域;对目标区域进行文本识别,得到非参考文本的识别结果;遍历待识别文本中的非参考文本,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,处理器执行计算机程序时实现获取待识别文本中非参考文本相对于参考文本的相对坐标位置之前,还可以实现如下步骤:获取对应单据图像的单据模板。处理器执行计算机程序时实现获取待识别文本中非参考文本相对于参考文本的相对坐标位置,可以包括:从对应单据图像的单据模板中获取待识别文本中非参考文本相对于参考文本的相对坐标位置。
在其中一个实施例中,处理器执行计算机程序时实现对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,可以包括:根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果;对二分类结果进行二值转换,得到单据图像中待识别文本的待识别图像。
在其中一个实施例中,处理器执行计算机程序时实现根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果,可以包括:对单据图像进行图像色彩的转换,得到对应单据图像中各像素点的色彩参数;基于预设阈值以及色彩参数,对单据图像的各像素点进行分类,得到单据图像中待识别文本与背景的二分类结果。
在其中一个实施例中,处理器执行计算机程序时实现基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果之后,还可以实现如下步骤:按照预先设置的存储要求,对识别结果进行结构化存储。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取单据图像;对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,待识别图像包括单据图像中的打印信息;对待识别图像进行参考文本的识别,得到参考文本的参考坐标位置;获取待识别文本中非参考文本相对于参考文本的相对坐标位置;基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,计算机程序被处理器执行时实现基于相对坐标位置以及参考坐标位置,对非参考文本进行识别之前,还可以实现如下步骤:获取非参考文本的长宽尺寸。计算机程序被处理器执行时实现基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果,可以包括:基于相对坐标位置以及参考坐标位置,得到非参考文本的绝对坐标位置;根据非参考文本的绝对坐标位置以及长宽尺寸,确定非参考文本在待识别图像中的目标区域;对目标区域进行文本识别,得到非参考文本的识别结果;遍历待识别文本中的非参考文本,得到单据图像中待识别文本的识别结果。
在其中一个实施例中,计算机程序被处理器执行时实现获取待识别文本中非参考文本相对于参考文本的相对坐标位置之前,还可以实现如下步骤:获取对应单据图像的单据模板。计算机程序被处理器执行时实现获取待识别文本中非参考文本相对于参考文本的相对坐标位置,可以包括:从对应单据图像的单据模板中获取待识别文本中非参考文本相对于参考文本的相对坐标位置。
在其中一个实施例中,计算机程序被处理器执行时实现对单据图像中的打印信息进行前景提取,得到单据图像中待识别文本的待识别图像,可以包括:根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果;对二分类结果进行二值转换,得到单据图像中待识别文本的待识别图像。
在其中一个实施例中,计算机程序被处理器执行时实现根据图像色彩对单据图像进行分类,得到单据图像中待识别文本与背景的二分类结果,可以包括:对单据图像进行图像色彩的转换,得到对应单据图像中各像素点的色彩参数;基于预设阈值以及色彩参数,对单据图像的各像素点进行分类,得到单据图像中待识别文本与背景的二分类结果。
在其中一个实施例中,计算机程序被处理器执行时实现基于相对坐标位置以及参考坐标位置,对非参考文本进行识别,得到单据图像中待识别文本的识别结果之后,还可以实现如下步骤:按照预先设置的存储要求,对识别结果进行结构化存储。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种单据识别方法,其特征在于,所述方法包括:
获取单据图像,所述单据图像为医疗保险相关的单据图像,所述单据图像包括背景部分以及前景部分,背景部分是指单据印刷过程中所印制的标准框架信息,前景部分是指在打印过程中打印的打印信息,所述打印过程中打印的打印信息与印刷过程中所印制的标准框架信息存在串行;
对所述单据图像中的打印信息进行前景提取,得到所述单据图像中待识别文本的待识别图像,所述待识别图像包括所述单据图像中的打印信息,所述打印信息是对单据进行打印填写时所填写的信息,所述打印填写时所填写的信息为标准文本格式的文本内容;
对所述待识别图像进行参考文本的识别,得到所述参考文本的参考坐标位置,所述参考文本为打印信息中不变的文本内容;
获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置,所述非参考文本为打印信息中除去参考文本的文本内容;
获取所述非参考文本的长宽尺寸;
基于所述相对坐标位置以及所述参考坐标位置,对所述非参考文本进行识别,得到所述单据图像中待识别文本的识别结果,包括:基于所述相对坐标位置以及所述参考坐标位置,得到所述非参考文本的绝对坐标位置;根据所述非参考文本的绝对坐标位置以及所述长宽尺寸,确定所述非参考文本在所述待识别图像中的目标区域;对所述目标区域进行文本识别,得到所述非参考文本的识别结果;遍历所述待识别文本中的非参考文本,得到所述单据图像中待识别文本的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置之前,所述方法还包括:
获取对应所述单据图像的单据模板;
所述获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置,包括:
从对应所述单据图像的单据模板中获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置。
3.根据权利要求1所述的方法,其特征在于,所述对所述单据图像中的打印信息进行前景提取,得到所述单据图像中待识别文本的待识别图像,包括:
根据图像色彩对所述单据图像进行分类,得到所述单据图像中待识别文本与背景的二分类结果;
对所述二分类结果进行二值转换,得到所述单据图像中待识别文本的待识别图像。
4.根据权利要求3所述的方法,其特征在于,所述根据图像色彩对所述单据图像进行分类,得到所述单据图像中待识别文本与背景的二分类结果,包括:
对所述单据图像进行图像色彩的转换,得到对应所述单据图像中各像素点的色彩参数;
基于预设阈值以及所述色彩参数,对所述单据图像的各像素点进行分类,得到所述单据图像中待识别文本与背景的二分类结果。
5.根据权利要求1所述的方法,其特征在于,所述基于所述相对坐标位置以及所述参考坐标位置,对所述非参考文本进行识别,得到所述单据图像中待识别文本的识别结果之后,还包括:
按照预先设置的存储要求,对所述识别结果进行结构化存储。
6.一种单据识别装置,其特征在于,所述装置包括:
单据图像获取模块,用于获取单据图像,所述单据图像为医疗保险相关的单据图像,所述单据图像包括背景部分以及前景部分,背景部分是指单据印刷过程中所印制的标准框架信息,前景部分是指在打印过程中打印的打印信息,所述打印过程中打印的打印信息与印刷过程中所印制的标准框架信息存在串行;
前景提取模块,用于对所述单据图像中的打印信息进行前景提取,得到所述单据图像中待识别文本的待识别图像,所述待识别图像包括所述单据图像中的打印信息,所述打印信息是对单据进行打印填写时所填写的信息,所述打印填写时所填写的信息为标准文本格式的文本内容;
参考文本识别模块,用于对所述待识别图像进行参考文本的识别,得到所述参考文本的参考坐标位置,所述参考文本为打印信息中不变的文本内容;
相对坐标位置获取模块,用于获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置,所述非参考文本为打印信息中除去参考文本的文本内容;
尺寸获取模块,用于获取所述非参考文本的长宽尺寸;
非参考文本识别模块,用于基于所述相对坐标位置以及所述参考坐标位置,对所述非参考文本进行识别,得到所述单据图像中待识别文本的识别结果;所述非参考文本识别模块包括:绝对坐标位置生成子模块,用于基于所述相对坐标位置以及所述参考坐标位置,得到所述非参考文本的绝对坐标位置;目标区域确定模块,用于根据所述非参考文本的绝对坐标位置以及所述长宽尺寸,确定所述非参考文本在所述待识别图像中的目标区域;文本识别子模块,用于对所述目标区域进行文本识别,得到所述非参考文本的识别结果;遍历子模块,用于遍历所述待识别文本中的非参考文本,得到所述单据图像中待识别文本的识别结果。
7.根据权利要求6所述的装置,其特征在于,还包括:
单据模板获取模块,用于在所述相对坐标位置获取模块获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置之前,获取对应所述单据图像的单据模板;
所述相对坐标位置获取模块用于从对应所述单据图像的单据模板中获取所述待识别文本中非参考文本相对于所述参考文本的相对坐标位置。
8.根据权利要求6所述的装置,其特征在于,所述前景提取模块包括:
分类子模块,用于根据图像色彩对所述单据图像进行分类,得到所述单据图像中待识别文本与背景的二分类结果;
二值转换子模块,用于对所述二分类结果进行二值转换,得到所述单据图像中待识别文本的待识别图像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN202010399997.8A 2020-05-13 2020-05-13 单据识别方法、装置、计算机设备和存储介质 Active CN111291741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010399997.8A CN111291741B (zh) 2020-05-13 2020-05-13 单据识别方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010399997.8A CN111291741B (zh) 2020-05-13 2020-05-13 单据识别方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111291741A CN111291741A (zh) 2020-06-16
CN111291741B true CN111291741B (zh) 2020-11-03

Family

ID=71021075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010399997.8A Active CN111291741B (zh) 2020-05-13 2020-05-13 单据识别方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111291741B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633278A (zh) * 2020-12-31 2021-04-09 北京市商汤科技开发有限公司 表单处理方法、装置和系统、介质及计算机设备
CN113192607B (zh) * 2021-04-13 2024-03-26 复旦大学附属中山医院 标注处理方法、装置、计算机设备和存储介质
CN113449716B (zh) * 2021-05-27 2024-02-13 众安在线财产保险股份有限公司 字段定位与分类方法、文本图像识别方法、装置、设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6300663B2 (ja) * 2014-06-23 2018-03-28 株式会社日立情報通信エンジニアリング 光学文字認識装置及び光学文字認識方法
CN105528604B (zh) * 2016-01-31 2018-12-11 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN105654072B (zh) * 2016-03-24 2019-03-01 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
CN108345880B (zh) * 2018-01-26 2021-07-27 金蝶软件(中国)有限公司 发票识别方法、装置、计算机设备和存储介质
CN109902737A (zh) * 2019-02-25 2019-06-18 厦门商集网络科技有限责任公司 一种票据分类方法及终端
CN110008933B (zh) * 2019-04-18 2022-02-11 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法
CN110348346A (zh) * 2019-06-28 2019-10-18 苏宁云计算有限公司 一种票据分类识别方法及系统
CN110728198B (zh) * 2019-09-20 2021-02-19 北京三快在线科技有限公司 图像处理方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN111291741A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN109492643B (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN111291741B (zh) 单据识别方法、装置、计算机设备和存储介质
CN110569850B (zh) 字符识别模板匹配方法、装置和文本识别设备
WO2020232872A1 (zh) 表格识别方法、装置、计算机设备和存储介质
CN108345880B (zh) 发票识别方法、装置、计算机设备和存储介质
WO2020147445A1 (zh) 翻拍图像识别方法、装置、计算机设备和计算机可读存储介质
CN110781877B (zh) 一种图像识别方法、设备及存储介质
CN110569341B (zh) 配置聊天机器人的方法、装置、计算机设备和存储介质
CN111191568B (zh) 翻拍图像识别方法、装置、设备及介质
CN111476227A (zh) 基于ocr的目标字段识别方法、装置及存储介质
CN111275685B (zh) 身份证件的翻拍图像识别方法、装置、设备及介质
CN110728687B (zh) 文件图像分割方法、装置、计算机设备和存储介质
CN111914597B (zh) 一种文档对照识别方法、装置、电子设备和可读存储介质
WO2020258491A1 (zh) 通用字符识别方法、装置、计算机设备和存储介质
CN110705233A (zh) 基于文字识别技术的笔记生成方法、装置和计算机设备
CN110675940A (zh) 病理图像标注方法、装置、计算机设备及存储介质
CN110866457A (zh) 一种电子保单的获得方法、装置、计算机设备和存储介质
CN110889341A (zh) 基于ai的表单图像识别方法、装置、计算机设备和存储介质
CN111814716A (zh) 印章去除方法、计算机设备和可读存储介质
CN110942067A (zh) 文本识别方法、装置、计算机设备和存储介质
CN111241974B (zh) 票据信息获取方法、装置、计算机设备和存储介质
CN114332883A (zh) 发票信息识别方法、装置、计算机设备及存储介质
CN110909733A (zh) 基于ocr图片识别的模版定位方法、装置和计算机设备
CN111814539B (zh) 基于红外光和紫外光的文字识别方法、装置和计算机设备
CN112257718A (zh) 一种关于放射科胶片的文本识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant