CN107346580A - 票据信息识别方法及装置 - Google Patents
票据信息识别方法及装置 Download PDFInfo
- Publication number
- CN107346580A CN107346580A CN201610293318.2A CN201610293318A CN107346580A CN 107346580 A CN107346580 A CN 107346580A CN 201610293318 A CN201610293318 A CN 201610293318A CN 107346580 A CN107346580 A CN 107346580A
- Authority
- CN
- China
- Prior art keywords
- character
- character string
- picture
- pixel
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/2008—Testing patterns thereon using pre-processing, e.g. de-blurring, averaging, normalisation or rotation
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Image Processing (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种票据信息识别方法及装置,属于图像处理技术领域。本发明通过获取票据图像,该票据图像为待识别的票据图像,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,该像素值由多种颜色分量组成,确定该票据图像中的噪点区域,基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像,基于该第一预处理图像,对该票据图像中的信息进行识别,如此,在对该票据图像进行识别之前,通过消除票据图像中的噪点区域,来增加票据信息的可识别性,提高了票据信息识别的效率。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种票据信息识别方法及装置。
背景技术
在实际生活中,通常会有各种各样的票据,例如,银行汇票、现金支票等等。在使用该类票据的过程中,有时需要用户将该类票据中的票据信息存储到终端上,例如,对于银行的汇票管理员来说,如果需要将银行汇票的票据信息存储到终端上,则需要该汇票管理员在该终端上手动输入该票据信息。因此,为了提高操作的便捷性,用户往往希望可以通过终端对该类票据中的票据信息进行识别。
在现有技术中,对于票据信息识别的过程可以包括:终端通过诸如扫描仪等之类的设备对票据进行扫描,得到票据图像,并对该票据图像进行去黑边、纠偏以及灰度化等预处理,得到预处理图像,之后,该终端基于该预处理图像,对该票据中的票据信息进行识别。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:在对票据信息进行识别的过程中,当该票据上有类似印章之类对票据信息的识别造成干扰的噪点区域时,上述提供的票据信息识别方法将无法进行票据信息的识别,此时,需要人工手动处理该票据,如此,导致票据信息识别效率较低。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种票据信息识别方法及装置。所述技术方案如下:
一方面,提供了一种票据信息识别方法,所述方法包括:
获取票据图像,所述票据图像为待识别的票据图像;
基于所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,所述像素值由多种颜色分量组成;
确定所述票据图像中的噪点区域;
基于所述背景颜色,对所述噪点区域的颜色进行处理,得到第一预处理图像;
基于所述第一预处理图像,对所述票据图像中的信息进行识别。
另一方面,提供了一种票据信息识别装置,所述装置包括:
获取模块,用于获取票据图像,所述票据图像为待识别的票据图像;
第一确定模块,用于基于所述获取模块所获取的所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,所述像素值由多种颜色分量组成;
第二确定模块,用于确定所述票据图像中的噪点区域;
处理模块,用于基于所述第一确定模块所确定的所述背景颜色,对所述第二确定模块所确定的所述噪点区域的颜色进行处理,得到第一预处理图像;
识别模块,用于基于经所述处理模块处理后所得到的所述第一预处理图像,对所述票据图像中的信息进行识别。
本发明实施例提供的技术方案带来的有益效果是:终端通过获取待识别的票据图像,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,其中,该像素值由多种颜色分量组成,进一步地,终端确定该票据图像中对票据信息的识别造成干扰的噪点区域,基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像,并基于该第一预处理图像,对该票据图像中的信息进行识别,如此,在对该票据图像进行识别之前,通过消除票据图像中的噪点区域,来增加票据信息的可识别性,提高了票据信息识别的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种票据信息识别方法的流程图。
图2A是根据另一示例性实施例示出的一种票据信息识别方法的流程图。
图2B是图2A实施例所涉及的一种票据图像中票据表格的示意图。
图2C是图2A实施例所涉及的一种票据图像模板中票据表格的示意图。
图2D是图2A实施例所涉及的一种票据图像中票据表格的示意图。
图3是根据一示例性实施例示出的一种票据信息识别装置的结构示意图。
图4是根据一示例性实施例示出的一种第一确定模块320的结构示意图。
图5是根据一示例性实施例示出的一种第二确定模块330的结构示意图。
图6是根据一示例性实施例示出的一种识别模块350的结构示意图。
图7是根据另一示例性实施例示出的一种识别模块350的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是根据一示例性实施例示出的一种票据信息识别方法的流程图,该票据信息识别方法可以包括如下几个步骤:
步骤101:获取票据图像,该票据图像为待识别的票据图像。
步骤102:基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,该像素值由多种颜色分量组成。
步骤103:确定该票据图像中的噪点区域。
步骤104:基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像。
步骤105:基于该第一预处理图像,对该票据图像中的信息进行识别。
在本发明实施例中,终端通过获取待识别的票据图像,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,其中,该像素值由多种颜色分量组成,进一步地,终端确定该票据图像中对票据信息的识别造成干扰的噪点区域,基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像,并基于该第一预处理图像,对该票据图像中的信息进行识别,如此,在对该票据图像进行识别之前,通过消除票据图像中的噪点区域,来增加票据信息的可识别性,提高了票据信息识别的效率。
可选地,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,包括:
对于该多种颜色分量中的每种颜色分量,从该票据图像中每个像素点的像素值中,获取属于该颜色分量的色彩参数;
基于获取的色彩参数,生成该颜色分量的色彩数组;
统计指定色彩参数在该色彩数组中出现的次数,该指定色彩参数为该色彩数组包括的色彩参数中的任一色彩参数;
当统计的次数为该色彩数组中元素个数的一半时,将该指定色彩参数确定为该色彩数组的中位数;
将多个色彩数组的中位数所对应的颜色确定为该票据图像的背景颜色,该多个色彩数组与该多种颜色分量一一对应。
可选地,确定该票据图像中的噪点区域,包括:
从该票据图像包括的像素点中,获取像素值位于指定像素值范围内的像素点;
将获取的像素点所在的区域和该票据图像中指定位置的区域确定为该票据图像中的噪点区域。
可选地,基于该第一预处理图像,对该票据图像中的信息进行识别,包括:
确定该第一预处理图像包括的多个字符串的位置;
对于该多个字符串中的每个字符串,基于该字符串的位置,从该第一预处理图像中切割出该字符串图像;
对该字符串图像进行切割,得到多张字符图像;
对于该多张字符图像中的每张字符图像,对该字符图像进行识别,得到该字符图像中的字符;
按照该多张字符图像在该字符串图像中的顺序,将该多张字符图像中的字符组成该票据图像中的信息。
可选地,确定该第一预处理图像包括的多个字符串的位置,包括:
对该第一预处理图像进行灰度化以及二值化处理,得到第二预处理图像;
基于该第二预处理图像包括的多行像素点的灰度值,确定多个第一个数,该多个第一个数中的每个第一个数为该第二预处理图像中每行像素点中灰度值为第一数值的像素点个数;
基于该第二预处理图像包括的多列像素点的灰度值,确定多个第二个数,该多个第二个数中的每个第二个数为该第二预处理图像中每列像素点中灰度值为该第一数值的像素点个数;
对于该多个字符串中的每个字符串,从存储的票据图像模板中,获取多个指定比例值,该多个指定比例值分别用于指示该字符串所在表格单元中每个边界与票据图像包括的票据表格中对应方向上的指定边界之间的距离,该指定边界为第一顶点所在的边界,该第一顶点为该票据表格的任一顶点;
基于该多个第一个数、该多个第二个数以及该多个指定比例值,确定该字符串在该第一预处理图像中的位置。
可选地,基于该多个第一个数、该多个第二个数以及该多个指定比例值,确定该字符串在该第一预处理图像中的位置,包括:
基于该多个第一个数和该多个第二个数,确定所述第一顶点坐标和该票据表格的各个边界长度;
基于该票据表格的各个边界长度和该多个指定比例值,确定该字符串所在表格单元中每个边界与该票据表格中对应边界之间的距离;
基于该第一顶点坐标和该字符串所在表格单元中每个边界与该票据表格中对应边界之间的距离,确定该字符串在该第一预处理图像中的位置。
可选地,基于该第一顶点坐标和该字符串所在表格单元中每个边界与该票据表格中对应边界之间的距离,确定该字符串在该第一预处理图像中的位置,包括:
确定框选该字符串的最小框选区域,该最小框选区域的形状与该票据表格的形状相同;
确定该字符串所在表格单元的每个边界与该最小框选区域中对应边界之间的距离;
基于该字符串所在表格单元在该第一预处理图像中的位置,以及该字符串所在表格单元的每个边界与该最小框选区域中对应边界之间的距离,确定该最小框选区域在该第一预处理图像中的位置;
将该最小框选区域在该第一预处理图像中的位置确定为该字符串在该第一预处理图像中的位置。
可选地,对该字符串图像进行切割,得到多张字符图像之前,还包括:
基于存储的票据图像模板,确定该字符串对应的语义,该票据图像模板至少用于记录该多个字符串中每个字符串对应的语义;
相应地,该对该字符串图像进行切割,得到多张字符图像,包括:
基于该字符串图像包括的多列像素点的灰度值,确定多个第三个数,该多个第三个数中的每个第三个数为该字符串图像中每列像素点中灰度值为该第一数值的像素点个数;
基于该多个第三个数、指定空白阈值和指定切割长度,确定该字符串图像中每个字符的切割位置;
基于该每个字符的切割位置,将该字符串图像切割成多张字符图像。
可选地,基于该多个第三个数、指定空白阈值和指定切割长度,确定该字符串图像中每个字符的切割位置,包括:
对于该字符串图像中的每个字符,基于该多个第三个数和指定切割长度,确定该字符的起始位置和结束位置;
基于该多个第三个数和指定波动长度,判断该起始位置与该结束位置之间是否存在空白位置;
当该起始位置与该结束位置之间存在空白位置时,从该起始位置与该空白位置之间的多列像素点对应的第三个数中,选择大于或等于该指定空白阈值的第三个数;
基于选择的第三个数,将与该空白位置最近的一列像素点所在的位置确定为该字符的切割位置。
可选地,基于该多个第三个数和指定切割长度,确定该字符的起始位置和结束位置,包括:
按照该字符串图像包括的多列像素点从前到后的顺序,从该多个第三个数中,确定首次出现大于或等于该指定空白阈值的第三个数;
将确定的第三个数所在一列像素点的位置确定为该字符的起始位置;
将该起始位置之后且与该起始位置之间距离该指定切割长度的位置确定为该字符的结束位置。
可选地,基于该多个第三个数和指定波动长度,判断该起始位置与该结束位置之间是否存在空白位置,包括:
基于该指定波动长度,获取该结束位置之后的至少一列像素点,该结束位置之后的至少一列像素点为该结束位置之后且与该结束位置距离最近的至少一列像素点,且该结束位置之后的至少一列像素点在该字符串图像中占用的长度为该指定波动长度;
当该结束位置之后的至少一列像素点对应的第三个数均大于或等于该指定空白阈值时,基于该指定波动长度,获取该结束位置之前的至少一列像素点,该结束位置之前的至少一列像素点为该结束位置之前且与该结束位置距离最近的至少一列像素点,且该结束位置之前的至少一列像素点在该字符串图像中占用的长度为该指定波动长度;
如果该结束位置之前的至少一列像素点对应的第三个数中存在小于该指定空白阈值的第三个数,则确定该起始位置与该结束位置之间存在空白位置,否则,确定该起始位置与该结束位置之间不存在空白位置。
可选地,基于该指定波动长度,获取该结束位置之后的至少一列像素点之后,还包括:
如果该结束位置之后的至少一列像素点对应的第三个数均小于该指定空白阈值,则基于该结束位置之后的至少一列像素点对应的第三个数,将该结束位置之后且与该结束位置最近的一列像素点所在的位置确定为该空白位置。
可选地,对该字符图像进行识别,得到该字符图像中的字符,包括:
基于存储的票据图像模板,确定该字符串对应的语义,该票据图像模板至少用于记录该多个字符串中每个字符串对应的语义;
基于该字符串对应的语义,确定字符集;
对该字符图像进行识别,得到多个候选字符;
基于该字符集和该多个候选字符,确定该字符图像中的字符。
可选地,基于该字符集和该多个候选字符,确定该字符图像中的字符,包括:
对于该多个候选字符中的每个候选字符,如果该候选字符存在于该字符集中,则将该候选字符确定为该字符图像中的字符;
如果该多个候选字符均不存在于该字符集中,则将第一指定字符确定为该字符图像中的字符。
可选地,对该字符图像进行识别,得到多个候选字符之后,还包括:
分别确定该多个候选字符与该字符图像中的字符之间的相似度;
相应地,该基于该字符集和该多个候选字符,确定该字符图像中的字符,包括:
如果该多个候选字符中的至少两个候选字符存在于该字符集中,则从该至少两个候选字符中,选择相似度最大的候选字符;
将选择的候选字符确定为该字符图像中的字符。
可选地,基于该字符集和该多个候选字符,确定该字符图像中的字符之前,还包括:
如果该字符串对应的语义为指定语义且该字符图像为该字符串图像中指定位上的字符图像,则在该字符集中添加第二指定字符。
上述所有可选技术方案,均可按照任意结合形成发明的可选实施例,本发明实施例对此不再一一赘述。
图2是根据另一示例性实施例示出的一种票据信息识别方法的流程图,本实施例以该票据信息识别方法由终端执行来进行举例说明,该票据信息识别方法可以包括如下几个步骤:
步骤201:获取票据图像,该票据图像为待识别的票据图像。
在实际应用过程中,在对票据中的信息进行识别之前,终端需要获取该票据的票据图像。其中,终端可以通过诸如扫描仪等之类的扫描设备来获取该票据图像,具体地,扫描仪对票据进行扫描,得到票据图像,终端即可获取该票据图像。其中,该扫描设备可以通过有线网络或者无线网络与与终端之间建立通信连接。
步骤202:基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,该像素值由多种颜色分量组成。
由于在实际应用过程中,票据上可能会印有印章,比如红色印章等,而该印章通常又可能印在票据的信息上,如此会影响终端对该票据图像中信息的识别,这里,将该类对票据图像中信息的识别造成影响的区域称为噪点区域,为了能够提高票据信息识别的效率,需要对该噪点区域进行处理。在发明本实施例中,可以基于该票据图像的背景颜色,来对该票据图像的噪点区域进行处理,因此,这里需要确定该票据图像的背景颜色。
其中,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色的具体实现过程可以包括:对于该多种颜色分量中的每种颜色分量,从该票据图像中每个像素点的像素值中,获取属于该颜色分量的色彩参数,基于获取的色彩参数,生成该颜色分量的色彩数组,统计指定色彩参数在该色彩数组中出现的次数,该指定色彩参数为该色彩数组包括的色彩参数中的任一色彩参数,当统计的次数为该色彩数组中元素个数的一半时,将该指定色彩参数确定为该色彩数组的中位数,将多个色彩数组的中位数所对应的颜色确定为该票据图像的背景颜色,该多个色彩数组与该多种颜色分量一一对应。
其中,上述多种颜色分量可以包括红色分量、绿色分量和蓝色分量,当然,该多种颜色分量还可以包括其它多种颜色分量,本发明实施例对此不做限定。
为了便于理解,本发明实施例以该多种颜分量包括红色分量、绿色分量和蓝色分量来进行举例说明,即像素点的像素值可以表示为(R,G,B),其中,R、G、B分别为红色分量、绿色分量和红色分量所对应的色彩参数。
其中,终端获取该票据图像中每个像素点的像素值,即终端获取每个像素点所对应的红色分量、绿色分量和蓝色分量。对于红色分量、绿色分量和蓝色分量中的每种颜色分量,终端从每个像素点的像素值中获取该颜色分量的色彩参数,比如,对于红色分量来说,终端获取每个像素点中的R值,如此,即可得到红色分量对应的多个色彩参数R。
基于所得到的多个色彩参数,终端生成该颜色分量的色彩数组。例如,若第一个像素点的像素值为(127,64,32),第二个像素点的像素值为(255,64,16),以此类推,第n个像素点的像素值为(255,64,64),则红色分量对应的色彩数组为[127,255,……,255],同理,终端还可以得到绿色分量对应的色彩数组[64,64,……,64],以及蓝色分量对应的色彩数组[32,16,……,64]。
进一步地,终端确定三个色彩数组中每个色彩数组的中位数,其中,确定该色彩数组的中位数的实现过程可以包括:按照从前至后的顺序,终端对该色彩数组进行遍历,并统计每个色彩参数在该色彩数组中出现的次数,如果某个色彩参数在该色彩数组中出现的次数等于该色彩数组中元素个数的一半时,则将该色彩参数确定为该色彩数组的中位数。例如,按照从前至后的顺序,对上述红色分量对应的色彩数组进行遍历,如果检测到色彩参数127在该色彩数组中出现的次数等于n/2时,则将该色彩参数127确定为该红色分量对应的色彩数组的中位数。
同理,对于上述三种颜色分量中的绿色分量和蓝色分量,也可以通过上述同样的方式来分别确定该绿色分量和蓝色分量所对应的色彩数组的中位数。如此,即可得到三个中位数,终端将该三个中位数所对应的颜色确定为票据图像的背景颜色。
例如,如果终端确定红色分量对应的色彩数组的中位数为127,绿色分量对应的色彩数组的中位数127,蓝色分量对应的色彩数组的中位数为127,则终端将(127,127,127)所对应的颜色确定为该票据图像的背景颜色。
需要说明的是,本发明实施例仅是以基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色来进行说明,在另一实施例中,还可以通过其它方式来确定该票据图像的背景颜色,本发明实施例对此不做限定。
步骤203:确定该票据图像中的噪点区域。
终端确定该票据图像的背景颜色后,还需要确定需要对票据图像中的哪些区域进行处理,即确定该票据图像中的噪点区域。其中,终端从该票据图像包括的像素点中,获取像素值位于指定像素值范围内的像素点,将获取的像素点所在的区域和该票据图像中指定位置的区域确定为该票据图像中的噪点区域。
其中,该指定像素值范围可以由多个色彩参数确定,例如,如果该多种颜分量包括红色分量、绿色分量和蓝色分量,则该指定像素值范围可以通过R,G,B三个色彩参数来确定。且该指定像素值范围可以包括一个像素值范围,也可以包括多个像素值范围,当该指定像素值范围包括多个像素值范围时,说明票据图像中有多种不同颜色的噪点区域,即当终端检测到票据图像中包括该多种不同颜色中任一种颜色时,将该颜色所对应的区域确定为噪点区域。
另外,该指定像素点范围可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,上述指定位置可以由用户根据实际需求自定义设置,也可以由终端默认设置,例如,该指定位置可以是指该票据图像的票据表格以外的四周,本发明实施例对此不做限定。
步骤204:基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像。
终端确定了该噪点区域之后,即可对该噪点区域进行处理。其中,基于该背景颜色,对该噪点区域的颜色进行处理可以包括如下任一种可能的实现方式:
第一种方式:终端将该噪点区域的颜色直接设置为该背景颜色。其中,将该噪点区域的颜色直接设置为该背景颜色的实现方式可以包括:对于噪点区域中多个像素点中的每个像素点,将该像素点的像素值中的多个色彩参数分别设置为背景颜色中所对应的色彩参数。
例如,若该噪点区域的像素值对应的多个色彩参数为(255,0,0),背景颜色的像素值对应的多个色彩参数为(127,127,127),则对于该噪点区域中的多个像素点中的每个像素点,将该像素点的像素值对应的色彩参数设置为(127,127,127),即将该噪点区域的颜色设置为背景颜色。
第二种方式:基于该背景颜色,终端将该噪点区域进行颜色处理,即将该噪点区域的颜色设置为该背景颜色。其中,终端基于该背景颜色中多种颜色分量所对应的色彩参数,选取一个像素值,以使得对于该噪点区域中多个像素点中的每个像素点,将该像素点的像素值中的多个色彩参数与所选取的像素值中的多个色彩参数分别对应求和后,得到背景颜色的像素值所对应的多个色彩参数。
例如,若该噪点区域的像素值对应的多个色彩参数为(105,105,105),背景颜色的像素值对应的多个色彩参数为(127,127,127),则终端选取一个像素值(22,22,22),对于该噪点区域中的多个像素点中的每个像素点,将该像素点的像素值中的多个色彩参数与该选取的像素值中的多个色彩参数分别对应求和,得到背景颜色的像素值所对应的多个色彩参数(127,127,127),如此,即可将该噪点区域的颜色设置为背景颜色。
第三种方式:基于该背景颜色,终端可以通过上述任一种可能的实现方式,将该噪点区域的颜色处理成与该背景颜色相近的颜色。也就是说,基于该背景颜色中多种颜色分量所对应的色彩参数,终端可以通过上述任一种可能的实现方式,对于该噪点区域中多个像素点中的每个像素点,将该像素点的像素值所对应的多个色彩参数分别处理成与该背景颜色的像素值所对应的多个色彩参数相近的值。
例如,若该噪点区域的像素值对应的多个色彩参数为(105,105,105),背景颜色的像素值对应的多个色彩参数为(127,127,127),则可以通过上述第一种可能的实现方式,对于该噪点区域中的多个像素点中的每个像素点,将该像素点的像素值所对应的多个色彩参数直接设置为(128,128,128),即将该噪点区域的颜色处理成与该背景颜色相近的颜色。
进一步地,终端对该票据图像中的噪点区域进行预处理之后,即可基于预处理后所得到的该第一预处理图像,对该票据图像中的信息进行识别。其中,基于该第一预处理图像,对该票据图像中的信息进行识别具体可以包括如下步骤205至步骤209。
步骤205:确定该第一预处理图像包括的多个字符串的位置。
该票据图像中的信息通常以字符串的形式存在,且该票据图像中可以包括多个字符串,比如,该多个字符串可以分别为用户姓名、银行卡号和身份证号等,为了能够将该多个字符串中的每个字符串识别出来,需要确定该多个字符串在该第一预处理图像中的位置。
具体地,终端对该第一预处理图像进行灰度化以及二值化处理,得到第二预处理图像,基于该第二预处理图像包括的多行像素点的灰度值,确定多个第一个数,该多个第一个数中的每个第一个数为该第二预处理图像中每行像素点中灰度值为第一数值的像素点个数,基于该第二预处理图像包括的多列像素点的灰度值,确定多个第二个数,该多个第二个数中的每个第二个数为该第二预处理图像中每列像素点中灰度值为该第一数值的像素点个数,对于该多个字符串中的每个字符串,从存储的票据图像模板中,获取多个指定比例值,该多个指定比例值分别用于指示该字符串所在表格单元中每个边界与票据图像包括的票据表格中对应方向上的指定边界之间的距离,该指定边界为第一顶点所在的边界,该第一顶点为该票据表格的任一顶点,基于该多个第一个数、该多个第二个数以及该多个指定比例值,确定该字符串在该第一预处理图像中的位置。
其中,对第一预处理图像进行灰度化以及二值化处理后,在所得到的第二预处理图中每个像素点的灰度值可以为0或255,即上述第一数值可以是0,也可以是255,如此,整个第二预处理图像中呈现出明显的黑白效果,以便终端确定该第二预处理图像中每行或每列像素点的灰度值。进一步地,基于该第二预处理图像包括的多行或多列像素点的灰度值,终端可以通过统计每行灰度值为第一数值的像素点个数,得到多个第一个数,比如,如果该第一数值为255,则通过统计每行像素点中灰度值为255的像素点个数,即得到多个第一个数。同理,终端也可以通过统计每列灰度值为第一数值的像素点个数,得到多个第二个数。其中,灰度化处理以及二值化处理的实现方式可以参见现有技术,本发明实施例对此不做详细描述。
其中,终端上可以预先存储票据图像模板,该票据图像模板记录了多个指定比例值,例如,请参见图2B,在该票据表格21中,第一顶点为(x1,y1),则针对表格单元22来说,为了便于理解,这里可以通过如下方式来描述该多个指定比例值,即多个指定比例值可以描述为:表格单元22的左边界到票据表格左边界的距离占该票据表格宽度的比例,记为pleft,表格单元22的右边界到票据表格左边界的距离占该票据表格宽度的比例,记为pright,表格单元22的上边界到票据表格上边界的距离占该票据表格高度的比例,记为ptop,以及表格单元22的下边界到票据表格左边界的距离占该票据表格高度的比例,记为pbottom,即在该图2B中,该多个指定比例值分别对应于m/w1,、n/w1、k/h1以及g/h1。
其中,上述基于该多个第一个数、该多个第二个数以及该多个指定比例值,确定该字符串在该第一预处理图像中的位置的具体实现过程可以包括:基于该多个第一个数和该多个第二个数,确定第一顶点坐标和该票据表格的各个边界长度,基于该票据表格的各个边界长度和该多个指定比例值,确定该字符串所在表格单元中每个边界与该票据表格中对应边界之间的距离,基于该第一顶点坐标和该字符串所在表格单元中每个边界与该票据表格中对应边界之间的距离,确定该字符串在该第一预处理图像中的位置。
其中,基于该多个第一个数和该多个第二个数,确定第一顶点坐标和该票据表格的各个边界长度的具体实现方式可以包括:终端从该第二预处理图像的任一顶点开始,对上述多个第一个数和多个第二个数进行遍历,当检测到该多个第一个数中的某个第一个数的值大于或等于第一指定数值时,确定检测到该票据图像中票据表格的上边界或下边界,同理,当检测到该多个第二个数中的某个第二个数的值大于或等于第二指定数值时,确定检测到该票据图像中票据表格的左边界或右边界,基于该多个边界,终端即可确定该票据表格的第一顶点,且基于遍历所移动的像素点个数可以确定该第一顶点的坐标。
其中,该第一指定数值可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,该第二指定数值可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,当检测到该多个第一个数中的某个第一个数的值大于或等于第一指定数值时,确定检测到该票据图像中票据表格的上边界或下边界,其原因在于,与文字相比较,该票据表格的上边界或下边界占某行像素点的个数通常会比较多,也即,与其它行相比较,该票据表格上边界和下边界所在行对应的第一个数通常比较大,因此,可以通过第一指定数值来确定该票据表格的上边界和下边界,即当检测到该多个第一个数中的某个第一个数的值大于或等于第一指定数值时,确定检测到该票据图像中票据表格的上边界或下边界。
对于当检测到该多个第二个数中的某个第二个数的值大于或等于第二指定数值时,确定检测到该票据图像中票据表格的左边界或右边界也是同样的原理,这里不再赘述。
另外,基于同样的原理,确定该票据表格的第一顶点坐标后,分别通过续遍历第一个数和第二个数,即可以确定该票据表格的高度和宽度。具体地,为例便于理解,以该第一顶点为该票据表格的左上顶角为例进行说明,当确定该第一顶点坐标后,以该第一顶点所在列为起始列,继续向右遍历第二个数,当再次检测到该多个第二个数中的某个第二个数大于或等于第二指定数值时,可以确定检测到票据表格的右边界,且基于从该第一顶点向右遍历第二个数所移动的像素点个数,即确定该票据表格的宽度w。按照同样的方式,以该第一顶点所在行为起始行,通过从该票据表格的第一顶点向下遍历第一个数,即可确定该票据表格的高度h。
其中,当确定了该票据表格的各个边界长度时,基于该票据表格的各个边界长度和该多个指定比例值,即可确定该字符串所在表格单元中每个边界与该票据表格中对应边界之间的距离。
例如,以该表格单元包括四个边界为例进行说明,该字符串所在表格单元中左边界与该票据表格中左边界之间的距离为w*pleft,该字符串所在表格单元中右边界与该票据表格中左边界之间的距离为w*pright,该字符串所在表格单元中上边界与该票据表格中上边界之间的距离为h*ptop,该字符串所在表格单元中下边界与该票据表格中上边界之间的距离为h*bottom。其中,w表示该票据表格的宽度,h表示该票据表格的高度。需要说明的是,上述“*”代表相乘的意思。
在上述实现方式中,由于每个字符串对应于一个表格单元,因此,通过确定该字符串所在的表格单元在该预处理图像中的位置,即可确定该字符串的位置,也就是说,可以将该表格单元在该第一预处理图像中的位置确定为该字符串在该第一预处理图像中的位置。
在另一种可能的实现方式中,很可能该字符串未打印在该表格单元中,在这种情况下,仅基于该表格单元,无法准确的确定该字符串的实际位置,因此,为了能够更精确的切割出字符串,还需要进一步来确定该字符串的实际位置。
也即,上述基于该第一顶点坐标和该字符串所在表格单元中每个边界与该票据表格中对应边界之间的距离,确定该字符串在该第一预处理图像中的位置具体可以包括:确定框选该字符串的最小框选区域,该最小框选区域的形状与该票据表格的形状相同,确定该字符串所在表格单元的每个边界与该最小框选区域中对应边界之间的距离,基于该字符串所在表格单元在该第一预处理图像中的位置,以及该字符串所在表格单元的每个边界与该最小框选区域中对应边界之间的距离,确定该最小框选区域在该第一预处理图像中的位置,将该最小框选区域在该第一预处理图像中的位置确定为该字符串在该第一预处理图像中的位置。
例如,请参考图2C,该最小框选区域是指该图2C中的23,该字符串所在表格单元是指该图2C中的24,其中,该字符串所在表格单元的每个边界与该最小框选区域中对应边界之间的距离是指图2C中的t1、t2、t3和t4,当确定了该字符串所在表格单元的每个边界与该最小框选区域中对应边界之间的距离,就可以确定该最小框选区域的各个边界在该第一预处理图像中的位置。
例如,若该最小框选区域的形状为矩形,则以确定该最小框选区域的左边界在该第一预处理图像中位置为例来进行说明,其中,该最小框选区域的左边界在该第一预处理图像中位置可以通过如下公式来确定:
rleft=(x0+t1)+w*pleft;
其中,rleft代表最小框选区域的左边界在该第一预处理图像中的横坐标,x0代表票据表格的第一顶点的横坐标,t1代表该字符串所在表格单元的左边界与该最小框选区域中左边界之间的距离,w代表票据表格的宽度,pleft代表该字符串所在表格单元中左边界与该票据表格中左边界之间的距离占该票据表格宽度的比例。
按照类似的方式,可以确定该最小框选区域的其它边界在该第一预处理图像中的坐标位置,如此,即可确定该最小框选区域在该第一预处理图像中的位置,并将该最小框选区域在该第一预处理图像中的位置确定为该字符串在该第一预处理图像中的位置。如此,即可精确地将该字符串从该第一预处理图像中切割出来。
当然,需要说明的是,上述确定该最小框选区域在该第一预处理图像中的位置,并将该最小框选区域确定为字符串在该第一预处理图像中的位置不仅适用于字符串被打印到表格单元外的情况,当然也适用于字符串被打印在该表格单元内的情况,当该字符串被打印在该表格单元内时,通过确定该最小框选区域,可以更精确地定位该字符串在该第一预处理图像中的位置,从而提高了切割该字符串的准确性。
步骤206:对于该多个字符串中的每个字符串,基于该字符串的位置,从该第一预处理图像中切割出该字符串,得到字符串图像。
终端确定了该字符串在第一预处理图像中的位置,即可沿着该字符串所在区域的多个边界,从该第一预处理图像中切割出该字符串。并且,通过类似地切割方法,终端即可将该多个字符串中的每个字符串从该第一预处理图像中切割出来。
步骤207:对该字符串图像进行切割,得到多张字符图像。
终端将该字符串图像从该票据图像中切割出来后,即可对该字符串图像进行进一步的切割,以得到该字符串图像中的多个字符图像。具体地,终端基于该字符串图像包括的多列像素点的灰度值,确定多个第三个数,该多个第三个数中的每个第三个数为该字符串图像中每列像素点中灰度值为该第一数值的像素点个数,基于该多个第三个数、指定空白阈值和指定切割长度,确定该字符串图像中每个字符的切割位置,基于该每个字符的切割位置,将该字符串图像切割成多张字符图像。
进一步地,在基于该字符串图像包括的多列像素点的灰度值,确定多个第三个数之前,终端对该字符串图像进行灰度化和二值化处理,并基于进行灰度化和二值化处理后的字符串图像,终端可以通过统计每列像素点中灰度值为该第一数值的像素点个数的方式,来确定该多个第三个数。
其中,指定空白阈值可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,指定切割长度可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,基于该多个第三个数、指定空白阈值和指定切割长度,确定该字符串中每个字符的切割位置的具体实现过程可以包括:对于该字符串中的每个字符,基于该多个第三个数和指定切割长度,确定该字符的起始位置和结束位置,基于该多个第三个数和指定波动长度,判断该起始位置与该结束位置之间是否存在空白位置,当该起始位置与该结束位置之间存在空白位置时,从该起始位置与该空白位置之间的多列像素点对应的第三个数中,选择大于或等于该指定空白阈值的第三个数,基于选择的第三个数,将与该空白位置最近的一列像素点所在的位置确定为该字符的切割位置。
其中,基于该多个第三个数和指定切割长度,确定该字符的起始位置和结束位置的具体实现过程可以包括:按照该字符串图像包括的多列像素点从前到后的顺序,从该多个第三个数中,确定首次出现大于或等于该指定空白阈值的第三个数,将确定的第三个数所在一列像素点的位置确定为该字符的起始位置,将该起始位置之后且与该起始位置之间距离该指定切割长度的位置确定为该字符的结束位置。
其中,如果第三个数大于或等于该指定空白阈值,说明在该列像素点上有字出现,因此,当检测到首次出现大于或等于该指定空白阈值的第三个数时,终端可以确定该第三个数所在一列像素点的位置即为该字符的起始位置,例如,请参考图2D,按照该字符串图像“张三”包括的多列像素点从前到后的顺序,从该多个第三个数中,确定首次出现大于或等于该指定空白阈值的第三个数所在一列像素点的位置为a,即该位置为该字符的起始位置。且,将该起始位置之后且与该起始位置之间距离该指定切割长度的位置确定为该字符的结束位置,请参考图2D,d点即为该结束位置。
其中,基于该多个第三个数和指定波动长度,判断该起始位置与该结束位置之间是否存在空白位置的具体实现过程可以包括:基于该指定波动长度,获取该结束位置之后的至少一列像素点,该结束位置之后的至少一列像素点为该结束位置之后且与该结束位置距离最近的至少一列像素点,且该结束位置之后的至少一列像素点在该字符串图像中占用的长度为该指定波动长度,当该结束位置之后的至少一列像素点对应的第三个数均大于或等于该指定空白阈值时,基于该指定波动长度,获取该结束位置之前的至少一列像素点,该结束位置之前的至少一列像素点为该结束位置之前且与该结束位置距离最近的至少一列像素点,且该结束位置之前的至少一列像素点在该字符串图像中占用的长度为该指定波动长度,如果该结束位置之前的至少一列像素点对应的第三个数中存在小于该指定空白阈值的第三个数,则确定该起始位置与该结束位置之间存在空白位置,否则,确定该起始位置与该结束位置之间不存在空白位置。
其中,基于该字符的结束位置,按照指定波动长度,判断该结束位置后的至少一列像素点对应的第三个数是否大于或等于指定空白阈值,如果该第三个数大于或等于指定空白阈值,说明可能切割到了该字符的后一个字符,在这种情况下,需要重新定位切割位置,即终端基于当前的结束位置,寻找该字符与该结束位置之间的空白位置,以避免切割该字符后的一个字符,请参考图2D,c点即为该空白位置。
进一步地,当确定了该空白位置后,如果将该空白位置确定为切割位置,很可能导致切割出的字符图像中包括一部分空白图像,因此,为了能够更精确的将该字符切割出来,当找到该字符起始位置与结束位置之间的空白位置后,还需要基于该空白位置,继续向前寻找一个最合适的切割位置,即,获取该字符起始位置与该空白位置之间大于或等于指定空白阈值的至少一个第三个数,选择该至少一个第三个数中所在列像素点的位置距离该空白位置最近的第三个数,将该第三个数所在列像素点的位置确定为切割位置。请参考图2D,b点即为该切割位置。
其中,指定波动长度可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,基于该指定波动长度,获取该结束位置之后的至少一列像素点之后,若该结束位置之后的至少一列像素点对应的第三个数均小于该指定空白阈值,则基于该结束位置之后的至少一列像素点对应的第三个数,将该结束位置之后且与该结束位置最近的一列像素点所在的位置确定为该空白位置。
在实际应用过程中,针对字符串的语义不同,字符所占用的像素点个数也不同,导致在切割过程中所涉及的切割参数也不同,比如,指定切割长度、指定波动长度均不同,例如,对于汉字和数字来说,汉字占用的像素点个数可能比数字所占用像素点的个数多,如此可能导致汉字所对应的指定切割长度要大于数字所对应的指定切割长度。因此,在一种可能的实现方式中,在对该字符串图像进行切割之前,还可以判断该字符所对应的语义。也即,基于存储的票据图像模板,确定该字符串对应的语义,该票据图像模板至少用于记录该多个字符串中每个字符串对应的语义。
需要说明的是,基于该字符串对应的语义,终端来确定对应的切割参数,在对汉字或数字进行切割时,仅仅是切割参数有差异,而切割过程是相同的,因此,可以不对汉字或数字的切割过程做详细划分。
步骤208:对于该多张字符图像中的每张字符图像,对该字符图像进行识别,得到该字符图像中的字符。
其中,为了能够减小识别过程中的工作量,终端可以基于字符串所对应的语义不同,来确定该字符串语义所对应的字符集,即终端基于存储的票据图像模板,确定该字符串对应的语义,该票据图像模板至少用于记录该多个字符串中每个字符串对应的语义,基于该字符串对应的语义,确定字符集,对该字符图像进行识别,得到多个候选字符,基于该字符集和该多个候选字符,确定该字符图像中的字符。
其中,终端可以将该字符图像发送至OCR(optical Character Recognition,光学字符识别)模块中,该OCR模块会对该字符图像进行识别,得到该字符图像对应的多个候选字符,进一步地,终端将该多个候选字符与字符集进行匹配,以确定该字符图像中的字符。其中,OCR模块对该字符图像的识别方法可以参考现有技术,本发明实施例对此不做详细描述。
其中,基于该字符集和该多个候选字符,确定该字符图像中的字符的具体过程可以包括:对于该多个候选字符中的每个候选字符,如果该候选字符存在于该字符集中,则将该候选字符确定为该字符图像中的字符,如果该多个候选字符均不存在于该字符集中,则将第一指定字符确定为该字符图像中的字符。
其中,如果该多个候选字符均不存在于该字符集中,说明未识别出该票据图像中的字符,为了不影响后续将字符组成字符串的顺序,可以将该第一指定字符确定为该字符图像中的字符。
其中,第一指定字符可以由用户根据实际需求自定义设置,也可以由终端默认设置,例如,该第一指定字符可以为“#”,本发明实施例对此不做限定。
在一种可能的实现方式中,可能存在多个候选字符中的至少两个候选字符存在于该字符集中,此时,需要作进一步的判断,以确定将该至少两个候选字符中的哪一个候选字符确认为字符图像中的字符。具体地,终端分别确定该多个候选字符与该字符图像中的字符之间的相似度,如果该多个候选字符中的至少两个候选字符存在于该字符集中,则从该至少两个候选字符中,选择相似度最大的候选字符,将选择的候选字符确定为该字符图像中的字符。
在另一种可能的实现方式中,如果该字符串对应的语义为指定语义且该字符图像为该字符串图像中指定位上的字符图像,则在该字符集中添加第二指定字符。
其中,指定语义可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,该指定位可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
其中,该第二指定字符可以由用户根据实际需求自定义设置,也可以由终端默认设置,本发明实施例对此不做限定。
例如,该指定语义为“合计大写”,在这种情况下,在该字符串中可能包括第二指定字符“整”字,且该指定位可能是指该字符串的最后一位,这种情况下,在对该字符串进行识别时,如果是对该字符串中除最后一位的其它位上的字符进行识别时,该字符集中可以不包括有第二指定字符“整”,而只有当对该字符串的最后一位进行识别时,将该“整”字添加到字符集中,如此,不仅减小了字符的匹配量,还提高了识别的准确性。
步骤209:按照该多张字符图像在该字符串图像中的顺序,将该多张字符图像中的字符组成该票据图像中的信息。
终端将每张字符图像中的字符识别出来后,按照该多张字符图像在该字符串图像中的先后顺序,将该多个字符组成字符串,并将该字符串确定为该字符串图像中的信息,也即,该字符串即为该票据图像中的信息,如此,即实现了对票据图像中信息的识别。
在本发明实施例中,终端通过获取待识别的票据图像,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,其中,该像素值由多种颜色分量组成,进一步地,终端确定该票据图像中对票据信息的识别造成干扰的噪点区域,基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像,并基于该第一预处理图像,对该票据图像中的信息进行识别,如此,在对该票据图像进行识别之前,通过消除票据图像中的噪点区域,来增加票据信息的可识别性,提高了票据信息识别的效率。
图3是根据一示例性实施例示出的一种票据信息识别装置的结构示意图,该票据信息识别装置可以由软件、硬件或者两者的结合实现。该票据信息识别装置可以包括:
获取模块310,用于获取票据图像,所述票据图像为待识别的票据图像;
第一确定模块320,用于基于所述获取模块310所获取的所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,所述像素值由多种颜色分量组成;
第二确定模块330,用于确定所述票据图像中的噪点区域;
处理模块340,用于基于所述第一确定模块320所确定的所述背景颜色,对所述第二确定模块330所确定的所述噪点区域的颜色进行处理,得到第一预处理图像;
识别模块350,用于基于经所述处理模块340处理后所得到的所述第一预处理图像,对所述票据图像中的信息进行识别。
在本发明实施例中,终端通过获取待识别的票据图像,基于该票据图像中每个像素点的像素值,确定该票据图像的背景颜色,其中,该像素值由多种颜色分量组成,进一步地,终端确定该票据图像中对票据信息的识别造成干扰的噪点区域,基于该背景颜色,对该噪点区域的颜色进行处理,得到第一预处理图像,并基于该第一预处理图像,对该票据图像中的信息进行识别,如此,在对该票据图像进行识别之前,通过消除票据图像中的噪点区域,来增加票据信息的可识别性,提高了票据信息识别的效率。
请参考图4至图7,可选地,所述第一确定模块320包括:
获取单元320a,用于对于所述多种颜色分量中的每种颜色分量,从所述票据图像中每个像素点的像素值中,获取属于所述颜色分量的色彩参数;
生成单元320b,用于基于所述获取单元320a所获取的色彩参数,生成所述颜色分量的色彩数组;
统计单元320c,用于统计指定色彩参数在所述生成单元320b所生成的所述色彩数组中出现的次数,所述指定色彩参数为所述色彩数组包括的色彩参数中的任一色彩参数;
第一确定单元320d,用于当所述统计单元320c所统计的次数为所述色彩数组中元素个数的一半时,将所述指定色彩参数确定为所述色彩数组的中位数;
第二确定单元320e,用于将多个色彩数组的中位数所对应的颜色确定为所述票据图像的背景颜色,所述多个色彩数组与所述多种颜色分量一一对应。
可选地,所述第二确定模块330包括:
获取单元330a,用于从所述票据图像包括的像素点中,获取像素值位于指定像素值范围内的像素点;
第三确定单元330b,用于将所述获取单元330a所获取的像素点所在的区域和所述票据图像中指定位置的区域确定为所述票据图像中的噪点区域。
可选地,所述识别模块350包括:
第四确定单元350a,用于确定所述第一预处理图像包括的多个字符串的位置;
第一切割单元350b,用于对于所述多个字符串中的每个字符串,基于所述第四确定单元350a所确定的所述字符串的位置,从所述第一预处理图像中切割出所述字符串,得到字符串图像;
第二切割单元350c,用于对经所述第一切割单元350b切割所得到的所述字符串图像进行切割,得到多张字符图像;
识别单元350d,用于对于经第二切割单元350c切割所得到的所述多张字符图像中的每张字符图像,对所述字符图像进行识别,得到所述字符图像中的字符;
组成单元350e,用于按照所述多张字符图像在所述字符串图像中的顺序,将由所述识别单元350d识别所得到的所述多张字符图像中的字符组成所述票据图像中的信息。
可选地,所述第四确定单元350a用于:
对所述第一预处理图像进行灰度化以及二值化处理,得到第二预处理图像;
基于所述第二预处理图像包括的多行像素点的灰度值,确定多个第一个数,所述多个第一个数中的每个第一个数为所述第二预处理图像中每行像素点中灰度值为第一数值的像素点个数;
基于所述第二预处理图像包括的多列像素点的灰度值,确定多个第二个数,所述多个第二个数中的每个第二个数为所述第二预处理图像中每列像素点中灰度值为所述第一数值的像素点个数;
对于所述多个字符串中的每个字符串,从存储的票据图像模板中,获取多个指定比例值,所述多个指定比例值分别用于指示所述字符串所在表格单元中每个边界与票据图像包括的票据表格中对应方向上的指定边界之间的距离,所述指定边界为第一顶点所在的边界,所述第一顶点为所述票据表格的任一顶点;
基于所述多个第一个数、所述多个第二个数以及所述多个指定比例值,确定所述字符串在所述第一预处理图像中的位置。
可选地,所述第四确定单元350a用于:
基于所述多个第一个数和所述多个第二个数,确定所述第一顶点坐标和所述票据表格的各个边界长度;
基于所述票据表格的各个边界长度和所述多个指定比例值,确定所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离;
基于所述第一顶点坐标和所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离,确定所述字符串在所述第一预处理图像中的位置。
可选地,所述第四确定单元350a用于:
确定框选所述字符串的最小框选区域,所述最小框选区域的形状与所述票据表格的形状相同;
确定所述字符串所在表格单元的每个边界与所述最小框选区域中对应边界之间的距离;
基于所述字符串所在表格单元在所述第一预处理图像中的位置,以及所述字符串所在表格单元的每个边界与所述最小框选区域中对应边界之间的距离,确定所述最小框选区域在所述第一预处理图像中的位置;
将所述最小框选区域在所述第一预处理图像中的位置确定为所述字符串在所述第一预处理图像中的位置。
可选地,所述识别模块350还包括:
第五确定单元350f,用于基于存储的票据图像模板,确定所述字符串对应的语义,所述票据图像模板至少用于记录所述多个字符串中每个字符串对应的语义;
相应地,所述第二切割单元350c还用于:
基于所述字符串图像包括的多列像素点的灰度值,确定多个第三个数,所述多个第三个数中的每个第三个数为所述字符串图像中每列像素点中灰度值为所述第一数值的像素点个数;
基于所述多个第三个数、指定空白阈值和指定切割长度,确定所述字符串图像中每个字符的切割位置;
基于所述每个字符的切割位置,将所述字符串图像切割成多张字符图像。
可选地,所述第二切割单元350c用于:
对于所述字符串图像中的每个字符,基于所述多个第三个数和指定切割长度,确定所述字符的起始位置和结束位置;
基于所述多个第三个数和指定波动长度,判断所述起始位置与所述结束位置之间是否存在空白位置;
如果所述起始位置与所述结束位置之间存在空白位置,则从所述起始位置与所述空白位置之间的多列像素点对应的第三个数中,选择大于或等于所述指定空白阈值的第三个数;
基于所选择的第三个数,将与所述空白位置最近的一列像素点所在的位置确定为所述字符的切割位置。
可选地,所述第二切割单元350c用于:
按照所述字符串图像包括的多列像素点从前到后的顺序,从所述多个第三个数中,确定首次出现大于或等于所述指定空白阈值的第三个数;
将所述确定的第三个数所在一列像素点的位置确定为所述字符的起始位置;
将所述起始位置之后且与所述起始位置之间距离所述指定切割长度的位置确定为所述字符的结束位置。
可选地,所述第二切割单元350c还用于:
基于所述指定波动长度,获取所述结束位置之后的至少一列像素点,所述结束位置之后的至少一列像素点为所述结束位置之后且与所述结束位置距离最近的至少一列像素点,且所述结束位置之后的至少一列像素点在所述字符串图像中占用的长度为所述指定波动长度;
如果所述结束位置之后的至少一列像素点对应的第三个数均大于或等于所述指定空白阈值,则基于所述指定波动长度,获取所述结束位置之前的至少一列像素点,所述结束位置之前的至少一列像素点为所述结束位置之前且与所述结束位置距离最近的至少一列像素点,且所述结束位置之前的至少一列像素点在所述字符串图像中占用的长度为所述指定波动长度;
如果所述结束位置之前的至少一列像素点对应的第三个数中存在小于所述指定空白阈值的第三个数,则确定所述起始位置与所述结束位置之间存在空白位置,否则,确定所述起始位置与所述结束位置之间不存在空白位置。
可选地,所述第二切割单元350c还用于:
如果所述结束位置之后的至少一列像素点对应的第三个数均小于所述指定空白阈值,则基于所述结束位置之后的至少一列像素点对应的第三个数,将所述结束位置之后且与所述结束位置最近的一列像素点所在的位置确定为所述空白位置。
可选地,所述识别单元350d用于:
基于存储的票据图像模板,确定所述字符串对应的语义,所述票据图像模板至少用于记录所述多个字符串中每个字符串对应的语义;
基于所述字符串对应的语义,确定字符集;
对所述字符图像进行识别,得到多个候选字符;
基于所述字符集和所述多个候选字符,确定所述字符图像中的字符。
可选地,所述识别单元350d用于:
对于所述多个候选字符中的每个候选字符,如果所述候选字符存在于所述字符集中,则将所述候选字符确定为所述字符图像中的字符;
如果所述多个候选字符均不存在于所述字符集中,则将第一指定字符确定为所述字符图像中的字符。
可选地,所述识别单元350d还用于:
分别确定所述多个候选字符与所述字符图像中的字符之间的相似度;
相应地,所述识别单元350d用于:
在所述多个候选字符中的至少两个候选字符存在于所述字符集中时,从所述至少两个候选字符中,选择相似度最大的候选字符;
将选择的候选字符确定为所述字符图像中的字符。
可选地,所述识别单元350d还用于:
如果所述字符串对应的语义为指定语义且所述字符图像为所述字符串图像中指定位上的字符图像,则在所述字符集中添加第二指定字符。
需要说明的是:上述实施例提供的票据信息识别装置在实现票据信息识别方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的票据信息识别装置与票据信息识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (32)
1.一种票据信息识别方法,其特征在于,所述方法包括:
获取票据图像,所述票据图像为待识别的票据图像;
基于所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,所述像素值由多种颜色分量组成;
确定所述票据图像中的噪点区域;
基于所述背景颜色,对所述噪点区域的颜色进行处理,得到第一预处理图像;
基于所述第一预处理图像,对所述票据图像中的信息进行识别。
2.如权利要求1所述的方法,其特征在于,所述基于所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,包括:
对于所述多种颜色分量中的每种颜色分量,从所述票据图像中每个像素点的像素值中,获取属于所述颜色分量的色彩参数;
基于获取的色彩参数,生成所述颜色分量的色彩数组;
统计指定色彩参数在所述色彩数组中出现的次数,所述指定色彩参数为所述色彩数组包括的色彩参数中的任一色彩参数;
当统计的次数为所述色彩数组中元素个数的一半时,将所述指定色彩参数确定为所述色彩数组的中位数;
将多个色彩数组的中位数所对应的颜色确定为所述票据图像的背景颜色,所述多个色彩数组与所述多种颜色分量一一对应。
3.如权利要求1所述的方法,其特征在于,所述确定所述票据图像中的噪点区域,包括:
从所述票据图像包括的像素点中,获取像素值位于指定像素值范围内的像素点;
将获取的像素点所在的区域和所述票据图像中指定位置的区域确定为所述票据图像中的噪点区域。
4.如权利要求1所述的方法,其特征在于,所述基于所述第一预处理图像,对所述票据图像中的信息进行识别,包括:
确定所述第一预处理图像包括的多个字符串的位置;
对于所述多个字符串中的每个字符串,基于所述字符串的位置,从所述第一预处理图像中切割出所述字符串,得到字符串图像;
对所述字符串图像进行切割,得到多张字符图像;
对于所述多张字符图像中的每张字符图像,对所述字符图像进行识别,得到所述字符图像中的字符;
按照所述多张字符图像在所述字符串图像中的顺序,将所述多张字符图像中的字符组成所述票据图像中的信息。
5.如权利要求4所述的方法,其特征在于,所述确定所述第一预处理图像包括的多个字符串的位置,包括:
对所述第一预处理图像进行灰度化以及二值化处理,得到第二预处理图像;
基于所述第二预处理图像包括的多行像素点的灰度值,确定多个第一个数,所述多个第一个数中的每个第一个数为所述第二预处理图像中每行像素点中灰度值为第一数值的像素点个数;
基于所述第二预处理图像包括的多列像素点的灰度值,确定多个第二个数,所述多个第二个数中的每个第二个数为所述第二预处理图像中每列像素点中灰度值为所述第一数值的像素点个数;
对于所述多个字符串中的每个字符串,从存储的票据图像模板中,获取多个指定比例值,所述多个指定比例值分别用于指示所述字符串所在表格单元中每个边界与所述票据图像包括的票据表格中对应方向上的指定边界之间的距离,所述指定边界为第一顶点所在的边界,所述第一顶点为所述票据表格的任一顶点;
基于所述多个第一个数、所述多个第二个数以及所述多个指定比例值,确定所述字符串在所述第一预处理图像中的位置。
6.如权利要求5所述的方法,其特征在于,所述基于所述多个第一个数、所述多个第二个数以及所述多个指定比例值,确定所述字符串在所述第一预处理图像中的位置,包括:
基于所述多个第一个数和所述多个第二个数,确定所述第一顶点坐标和所述票据表格的各个边界长度;
基于所述票据表格的各个边界长度和所述多个指定比例值,确定所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离;
基于所述第一顶点坐标和所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离,确定所述字符串在所述第一预处理图像中的位置。
7.如权利要求6所述的方法,其特征在于,所述基于所述第一顶点坐标和所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离,确定所述字符串在所述第一预处理图像中的位置,包括:
确定框选所述字符串的最小框选区域,所述最小框选区域的形状与所述票据表格的形状相同;
确定所述字符串所在表格单元的每个边界与所述最小框选区域中对应边界之间的距离;
基于所述字符串所在表格单元在所述第一预处理图像中的位置,以及所述字符串所在表格单元的每个边界与所述最小框选区域中对应边界之间的距离,确定所述最小框选区域在所述第一预处理图像中的位置;
将所述最小框选区域在所述第一预处理图像中的位置确定为所述字符串在所述第一预处理图像中的位置。
8.如权利要求4所述的方法,其特征在于,所述对所述字符串图像进行切割,得到多张字符图像之前,还包括:
基于存储的票据图像模板,确定所述字符串对应的语义,所述票据图像模板至少用于记录所述多个字符串中每个字符串对应的语义;
相应地,所述对所述字符串图像进行切割,得到多张字符图像,包括:
基于所述字符串图像包括的多列像素点的灰度值,确定多个第三个数,所述多个第三个数中的每个第三个数为所述字符串图像中每列像素点中灰度值为所述第一数值的像素点个数;
基于所述多个第三个数、指定空白阈值和指定切割长度,确定所述字符串图像中每个字符的切割位置;
基于所述每个字符的切割位置,将所述字符串图像切割成多张字符图像。
9.如权利要求8所述的方法,其特征在于,所述基于所述多个第三个数、指定空白阈值和指定切割长度,确定所述字符串图像中每个字符的切割位置,包括:
对于所述字符串图像中的每个字符,基于所述多个第三个数和指定切割长度,确定所述字符的起始位置和结束位置;
基于所述多个第三个数和指定波动长度,判断所述起始位置与所述结束位置之间是否存在空白位置;
当所述起始位置与所述结束位置之间存在空白位置时,从所述起始位置与所述空白位置之间的多列像素点对应的第三个数中,选择大于或等于所述指定空白阈值的第三个数;
基于选择的第三个数,将与所述空白位置最近的一列像素点所在的位置确定为所述字符的切割位置。
10.如权利要求9所述的方法,其特征在于,所述基于所述多个第三个数和指定切割长度,确定所述字符的起始位置和结束位置,包括:
按照所述字符串图像包括的多列像素点从前到后的顺序,从所述多个第三个数中,确定首次出现大于或等于所述指定空白阈值的第三个数;
将确定的第三个数所在一列像素点的位置确定为所述字符的起始位置;
将所述起始位置之后且与所述起始位置之间距离所述指定切割长度的位置确定为所述字符的结束位置。
11.如权利要求9所述的方法,其特征在于,所述基于所述多个第三个数和指定波动长度,判断所述起始位置与所述结束位置之间是否存在空白位置,包括:
基于所述指定波动长度,获取所述结束位置之后的至少一列像素点,所述结束位置之后的至少一列像素点为所述结束位置之后且与所述结束位置距离最近的至少一列像素点,且所述结束位置之后的至少一列像素点在所述字符串图像中占用的长度为所述指定波动长度;
当所述结束位置之后的至少一列像素点对应的第三个数均大于或等于所述指定空白阈值时,基于所述指定波动长度,获取所述结束位置之前的至少一列像素点,所述结束位置之前的至少一列像素点为所述结束位置之前且与所述结束位置距离最近的至少一列像素点,且所述结束位置之前的至少一列像素点在所述字符串图像中占用的长度为所述指定波动长度;
如果所述结束位置之前的至少一列像素点对应的第三个数中存在小于所述指定空白阈值的第三个数,则确定所述起始位置与所述结束位置之间存在空白位置,否则,确定所述起始位置与所述结束位置之间不存在空白位置。
12.如权利要求11所述的方法,其特征在于,所述基于所述指定波动长度,获取所述结束位置之后的至少一列像素点之后,还包括:
如果所述结束位置之后的至少一列像素点对应的第三个数均小于所述指定空白阈值,则基于所述结束位置之后的至少一列像素点对应的第三个数,将所述结束位置之后且与所述结束位置最近的一列像素点所在的位置确定为所述空白位置。
13.如权利要求4所述的方法,其特征在于,所述对所述字符图像进行识别,得到所述字符图像中的字符,包括:
基于存储的票据图像模板,确定所述字符串对应的语义,所述票据图像模板至少用于记录所述多个字符串中每个字符串对应的语义;
基于所述字符串对应的语义,确定字符集;
对所述字符图像进行识别,得到多个候选字符;
基于所述字符集和所述多个候选字符,确定所述字符图像中的字符。
14.如权利要求13所述的方法,其特征在于,所述基于所述字符集和所述多个候选字符,确定所述字符图像中的字符,包括:
对于所述多个候选字符中的每个候选字符,如果所述候选字符存在于所述字符集中,则将所述候选字符确定为所述字符图像中的字符;
如果所述多个候选字符均不存在于所述字符集中,则将第一指定字符确定为所述字符图像中的字符。
15.如权利要求13所述的方法,其特征在于,所述对所述字符图像进行识别,得到多个候选字符之后,还包括:
分别确定所述多个候选字符与所述字符图像中的字符之间的相似度;
相应地,所述基于所述字符集和所述多个候选字符,确定所述字符图像中的字符,包括:
如果所述多个候选字符中的至少两个候选字符存在于所述字符集中,则从所述至少两个候选字符中,选择相似度最大的候选字符;
将选择的候选字符确定为所述字符图像中的字符。
16.如权利要求13-15任一权利要求所述的方法,其特征在于,所述基于所述字符集和所述多个候选字符,确定所述字符图像中的字符之前,还包括:
如果所述字符串对应的语义为指定语义且所述字符图像为所述字符串图像中指定位上的字符图像,则在所述字符集中添加第二指定字符。
17.一种票据信息识别装置,其特征在于,所述装置包括:
获取模块,用于获取票据图像,所述票据图像为待识别的票据图像;
第一确定模块,用于基于所述获取模块所获取的所述票据图像中每个像素点的像素值,确定所述票据图像的背景颜色,所述像素值由多种颜色分量组成;
第二确定模块,用于确定所述票据图像中的噪点区域;
处理模块,用于基于所述第一确定模块所确定的所述背景颜色,对所述第二确定模块所确定的所述噪点区域的颜色进行处理,得到第一预处理图像;
识别模块,用于基于经所述处理模块处理后所得到的所述第一预处理图像,对所述票据图像中的信息进行识别。
18.如权利要求17所述的装置,其特征在于,所述第一确定模块包括:
获取单元,用于对于所述多种颜色分量中的每种颜色分量,从所述票据图像中每个像素点的像素值中,获取属于所述颜色分量的色彩参数;
生成单元,用于基于所述获取单元所获取的色彩参数,生成所述颜色分量的色彩数组;
统计单元,用于统计指定色彩参数在所述生成单元所生成的所述色彩数组中出现的次数,所述指定色彩参数为所述色彩数组包括的色彩参数中的任一色彩参数;
第一确定单元,用于当所述统计单元所统计的次数为所述色彩数组中元素个数的一半时,将所述指定色彩参数确定为所述色彩数组的中位数;
第二确定单元,用于将多个色彩数组的中位数所对应的颜色确定为所述票据图像的背景颜色,所述多个色彩数组与所述多种颜色分量一一对应。
19.如权利要求17所述的装置,其特征在于,所述第二确定模块包括:
获取单元,用于从所述票据图像包括的像素点中,获取像素值位于指定像素值范围内的像素点;
第三确定单元,用于将所述获取单元所获取的像素点所在的区域和所述票据图像中指定位置的区域确定为所述票据图像中的噪点区域。
20.如权利要求17所述的装置,其特征在于,所述识别模块包括:
第四确定单元,用于确定所述第一预处理图像包括的多个字符串的位置;
第一切割单元,用于对于所述多个字符串中的每个字符串,基于所述第四确定单元所确定的所述字符串的位置,从所述第一预处理图像中切割出所述字符串,得到字符串图像;
第二切割单元,用于对经所述第一切割单元切割所得到的所述字符串图像进行切割,得到多张字符图像;
识别单元,用于对于经第二切割单元切割所得到的所述多张字符图像中的每张字符图像,对所述字符图像进行识别,得到所述字符图像中的字符;
组成单元,用于按照所述多张字符图像在所述字符串图像中的顺序,将由所述识别单元识别所得到的所述多张字符图像中的字符组成所述票据图像中的信息。
21.如权利要求20所述的装置,其特征在于,所述第四确定单元用于:
对所述第一预处理图像进行灰度化以及二值化处理,得到第二预处理图像;
基于所述第二预处理图像包括的多行像素点的灰度值,确定多个第一个数,所述多个第一个数中的每个第一个数为所述第二预处理图像中每行像素点中灰度值为第一数值的像素点个数;
基于所述第二预处理图像包括的多列像素点的灰度值,确定多个第二个数,所述多个第二个数中的每个第二个数为所述第二预处理图像中每列像素点中灰度值为所述第一数值的像素点个数;
对于所述多个字符串中的每个字符串,从存储的票据图像模板中,获取多个指定比例值,所述多个指定比例值分别用于指示所述字符串所在表格单元中每个边界与所述票据图像包括的票据表格中对应方向上的指定边界之间的距离,所述指定边界为第一顶点所在的边界,所述第一顶点为所述票据表格的任一顶点;
基于所述多个第一个数、所述多个第二个数以及所述多个指定比例值,确定所述字符串在所述第一预处理图像中的位置。
22.如权利要求21所述的装置,其特征在于,所述第四确定单元用于:
基于所述多个第一个数和所述多个第二个数,确定所述第一顶点坐标和所述票据表格的各个边界长度;
基于所述票据表格的各个边界长度和所述多个指定比例值,确定所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离;
基于所述第一顶点坐标和所述字符串所在表格单元中每个边界与所述票据表格中对应边界之间的距离,确定所述字符串在所述第一预处理图像中的位置。
23.如权利要求22所述的装置,其特征在于,所述第四确定单元用于:
确定框选所述字符串的最小框选区域,所述最小框选区域的形状与所述票据表格的形状相同;
确定所述字符串所在表格单元的每个边界与所述最小框选区域中对应边界之间的距离;
基于所述字符串所在表格单元在所述第一预处理图像中的位置,以及所述字符串所在表格单元的每个边界与所述最小框选区域中对应边界之间的距离,确定所述最小框选区域在所述第一预处理图像中的位置;
将所述最小框选区域在所述第一预处理图像中的位置确定为所述字符串在所述第一预处理图像中的位置。
24.如权利要求20所述的装置,其特征在于,所述识别模块还包括:
第五确定单元,用于基于存储的票据图像模板,确定所述字符串对应的语义,所述票据图像模板至少用于记录所述多个字符串中每个字符串对应的语义;
相应地,所述第二切割单元还用于:
基于所述字符串图像包括的多列像素点的灰度值,确定多个第三个数,所述多个第三个数中的每个第三个数为所述字符串图像中每列像素点中灰度值为所述第一数值的像素点个数;
基于所述多个第三个数、指定空白阈值和指定切割长度,确定所述字符串图像中每个字符的切割位置;
基于所述每个字符的切割位置,将所述字符串图像切割成多张字符图像。
25.如权利要求24所述的装置,其特征在于,所述第二切割单元用于:
对于所述字符串图像中的每个字符,基于所述多个第三个数和指定切割长度,确定所述字符的起始位置和结束位置;
基于所述多个第三个数和指定波动长度,判断所述起始位置与所述结束位置之间是否存在空白位置;
如果所述起始位置与所述结束位置之间存在空白位置,则从所述起始位置与所述空白位置之间的多列像素点对应的第三个数中,选择大于或等于所述指定空白阈值的第三个数;
基于所选择的第三个数,将与所述空白位置最近的一列像素点所在的位置确定为所述字符的切割位置。
26.如权利要求25所述的装置,其特征在于,所述第二切割单元用于:
按照所述字符串图像包括的多列像素点从前到后的顺序,从所述多个第三个数中,确定首次出现大于或等于所述指定空白阈值的第三个数;
将所述确定的第三个数所在一列像素点的位置确定为所述字符的起始位置;
将所述起始位置之后且与所述起始位置之间距离所述指定切割长度的位置确定为所述字符的结束位置。
27.如权利要求25所述的装置,其特征在于,所述第二切割单元还用于:
基于所述指定波动长度,获取所述结束位置之后的至少一列像素点,所述结束位置之后的至少一列像素点为所述结束位置之后且与所述结束位置距离最近的至少一列像素点,且所述结束位置之后的至少一列像素点在所述字符串图像中占用的长度为所述指定波动长度;
如果所述结束位置之后的至少一列像素点对应的第三个数均大于或等于所述指定空白阈值,则基于所述指定波动长度,获取所述结束位置之前的至少一列像素点,所述结束位置之前的至少一列像素点为所述结束位置之前且与所述结束位置距离最近的至少一列像素点,且所述结束位置之前的至少一列像素点在所述字符串图像中占用的长度为所述指定波动长度;
如果所述结束位置之前的至少一列像素点对应的第三个数中存在小于所述指定空白阈值的第三个数,则确定所述起始位置与所述结束位置之间存在空白位置,否则,确定所述起始位置与所述结束位置之间不存在空白位置。
28.如权利要求27所述的装置,其特征在于,所述第二切割单元还用于:
如果所述结束位置之后的至少一列像素点对应的第三个数均小于所述指定空白阈值,则基于所述结束位置之后的至少一列像素点对应的第三个数,将所述结束位置之后且与所述结束位置最近的一列像素点所在的位置确定为所述空白位置。
29.如权利要求20所述的装置,其特征在于,所述识别单元用于:
基于存储的票据图像模板,确定所述字符串对应的语义,所述票据图像模板至少用于记录所述多个字符串中每个字符串对应的语义;
基于所述字符串对应的语义,确定字符集;
对所述字符图像进行识别,得到多个候选字符;
基于所述字符集和所述多个候选字符,确定所述字符图像中的字符。
30.如权利要求29所述的装置,其特征在于,所述识别单元用于:
对于所述多个候选字符中的每个候选字符,如果所述候选字符存在于所述字符集中,则将所述候选字符确定为所述字符图像中的字符;
如果所述多个候选字符均不存在于所述字符集中,则将第一指定字符确定为所述字符图像中的字符。
31.如权利要求29所述的装置,其特征在于,所述识别单元还用于:
分别确定所述多个候选字符与所述字符图像中的字符之间的相似度;
相应地,所述识别单元用于:
在所述多个候选字符中的至少两个候选字符存在于所述字符集中时,从所述至少两个候选字符中,选择相似度最大的候选字符;
将选择的候选字符确定为所述字符图像中的字符。
32.如权利要求29-31任一权利要求所述的装置,其特征在于,所述识别单元还用于:
如果所述字符串对应的语义为指定语义且所述字符图像为所述字符串图像中指定位上的字符图像,则在所述字符集中添加第二指定字符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610293318.2A CN107346580B (zh) | 2016-05-05 | 2016-05-05 | 票据信息识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610293318.2A CN107346580B (zh) | 2016-05-05 | 2016-05-05 | 票据信息识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107346580A true CN107346580A (zh) | 2017-11-14 |
CN107346580B CN107346580B (zh) | 2019-11-05 |
Family
ID=60253755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610293318.2A Active CN107346580B (zh) | 2016-05-05 | 2016-05-05 | 票据信息识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107346580B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108777021A (zh) * | 2018-05-18 | 2018-11-09 | 北京大账房网络科技股份有限公司 | 一种基于扫描仪混扫的票据识别方法及系统 |
CN109543554A (zh) * | 2018-10-30 | 2019-03-29 | 深圳怡化电脑股份有限公司 | 票据检测方法、装置、终端及计算机可读存储介质 |
CN111091499A (zh) * | 2018-10-24 | 2020-05-01 | 方正国际软件(北京)有限公司 | 一种移动终端图像修正的方法及装置 |
CN111461062A (zh) * | 2020-04-23 | 2020-07-28 | 国网吉林省电力有限公司 | 一种票据图像文本信息的结构化抽取方法 |
CN111950555A (zh) * | 2020-08-17 | 2020-11-17 | 北京字节跳动网络技术有限公司 | 文本识别方法、装置、可读介质及电子设备 |
CN112085885A (zh) * | 2020-09-24 | 2020-12-15 | 理光图像技术(上海)有限公司 | 票证识别装置以及票证信息管理系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040165773A1 (en) * | 1998-02-06 | 2004-08-26 | Fujitsu Limited | Color image processing apparatus and pattern extracting apparatus |
CN1313963C (zh) * | 2004-03-10 | 2007-05-02 | 富士通株式会社 | 字符识别装置和字符识别方法 |
US20120051633A1 (en) * | 2010-08-31 | 2012-03-01 | Korea University Research And Business Foundation | Apparatus and method for generating character collage message |
CN102446274A (zh) * | 2010-09-30 | 2012-05-09 | 汉王科技股份有限公司 | 带有下划线的文本图像预处理方法和装置 |
CN103208004A (zh) * | 2013-03-15 | 2013-07-17 | 北京英迈杰科技有限公司 | 票据信息区域自动识别和提取方法及设备 |
-
2016
- 2016-05-05 CN CN201610293318.2A patent/CN107346580B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040165773A1 (en) * | 1998-02-06 | 2004-08-26 | Fujitsu Limited | Color image processing apparatus and pattern extracting apparatus |
CN1313963C (zh) * | 2004-03-10 | 2007-05-02 | 富士通株式会社 | 字符识别装置和字符识别方法 |
US20120051633A1 (en) * | 2010-08-31 | 2012-03-01 | Korea University Research And Business Foundation | Apparatus and method for generating character collage message |
CN102446274A (zh) * | 2010-09-30 | 2012-05-09 | 汉王科技股份有限公司 | 带有下划线的文本图像预处理方法和装置 |
CN103208004A (zh) * | 2013-03-15 | 2013-07-17 | 北京英迈杰科技有限公司 | 票据信息区域自动识别和提取方法及设备 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108777021A (zh) * | 2018-05-18 | 2018-11-09 | 北京大账房网络科技股份有限公司 | 一种基于扫描仪混扫的票据识别方法及系统 |
CN108777021B (zh) * | 2018-05-18 | 2020-08-28 | 北京大账房网络科技股份有限公司 | 一种基于扫描仪混扫的票据识别方法及系统 |
CN111091499A (zh) * | 2018-10-24 | 2020-05-01 | 方正国际软件(北京)有限公司 | 一种移动终端图像修正的方法及装置 |
CN111091499B (zh) * | 2018-10-24 | 2023-05-23 | 方正国际软件(北京)有限公司 | 一种移动终端图像修正的方法及装置 |
CN109543554A (zh) * | 2018-10-30 | 2019-03-29 | 深圳怡化电脑股份有限公司 | 票据检测方法、装置、终端及计算机可读存储介质 |
CN109543554B (zh) * | 2018-10-30 | 2020-11-13 | 深圳怡化电脑股份有限公司 | 票据检测方法、装置、终端及计算机可读存储介质 |
CN111461062A (zh) * | 2020-04-23 | 2020-07-28 | 国网吉林省电力有限公司 | 一种票据图像文本信息的结构化抽取方法 |
CN111461062B (zh) * | 2020-04-23 | 2023-12-19 | 国网吉林省电力有限公司 | 一种票据图像文本信息的结构化抽取方法 |
CN111950555A (zh) * | 2020-08-17 | 2020-11-17 | 北京字节跳动网络技术有限公司 | 文本识别方法、装置、可读介质及电子设备 |
CN111950555B (zh) * | 2020-08-17 | 2024-02-09 | 北京字节跳动网络技术有限公司 | 文本识别方法、装置、可读介质及电子设备 |
CN112085885A (zh) * | 2020-09-24 | 2020-12-15 | 理光图像技术(上海)有限公司 | 票证识别装置以及票证信息管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107346580B (zh) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107346580A (zh) | 票据信息识别方法及装置 | |
CN109886974B (zh) | 一种印章去除方法 | |
US7853074B2 (en) | Multi-color dropout for scanned document | |
US9881438B2 (en) | Method and system for printing stock anti-counterfeiting by means of feature image | |
CN105095892A (zh) | 基于图像处理的学生文档管理系统 | |
KR100542365B1 (ko) | 영상 화질 개선 장치 및 그 방법 | |
JP5830338B2 (ja) | 帳票認識方法および帳票認識装置 | |
US7387355B2 (en) | High-image-quality halftone process | |
CN106407919A (zh) | 基于图像处理的文本分离方法及装置和图像形成设备 | |
CN104156703B (zh) | 基于色彩纹理的车牌定位方法及系统 | |
CN108171229A (zh) | 一种空心粘连验证码的识别方法及系统 | |
CN107145888A (zh) | 视频字幕实时翻译方法 | |
EP1403812B1 (en) | Electronic color dropout utilizing spatial context to enhance accuracy | |
CN106355743A (zh) | 纸币的版本识别方法及装置 | |
JP3669394B2 (ja) | カラー画像処理装置 | |
US20020136456A1 (en) | Image process apparatus, image process method and storage medium | |
CN111191716A (zh) | 一种印刷图片的分类方法及装置 | |
JP3955467B2 (ja) | 画像処理プログラム及び画像処理装置 | |
CN109241821A (zh) | 一种彩色激光打印复印文件类别鉴别方法 | |
JP2000022943A (ja) | 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体 | |
CN108230535B (zh) | 一种纸币的面向识别方法及装置 | |
JP2016181111A (ja) | 画像処理装置、及び画像処理プログラム | |
JP3126597B2 (ja) | 筆記具判別装置 | |
JPH09238256A (ja) | 画像処理方法及び画像処理装置 | |
CN117830303B (zh) | 一种网评图像检测方法、系统、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |