CN110738119A - 一种票据识别方法、装置、设备及可读介质 - Google Patents
一种票据识别方法、装置、设备及可读介质 Download PDFInfo
- Publication number
- CN110738119A CN110738119A CN201910871456.8A CN201910871456A CN110738119A CN 110738119 A CN110738119 A CN 110738119A CN 201910871456 A CN201910871456 A CN 201910871456A CN 110738119 A CN110738119 A CN 110738119A
- Authority
- CN
- China
- Prior art keywords
- image
- target image
- target
- bill
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种票据识别方法,所述方法针对复写票据,所述方法包括:获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;根据所述正面图像确定待识别的第一目标图像区域;根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;对所述目标图像进行识别以确定票据识别结果。本发明提高了复写票据的识别的准确率和效率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种票据识别方法、装置、设备及可读介质。
背景技术
在日常生活中的如购物交易、海关申报等的场景中,办理这些业务所对应的发票是很重要的凭证和记录文件,因而需要对各种类型的发票等票据的目标内容(如流水号或证件号等)进行识别,以进行后续的管理和追溯。
与此同时,上述这类发票通常是采用多联复写式的预印票据利用针式打印机进行套打。现有技术中大多数针对这类发票的识别通常是通过目标内容与背景的图像颜色的差异进行识别。
而这样的缺陷在于这类票据中包含的预印票据的框线与后来打印上的目标文字信息的颜色可能较为相近,从而识别出目标内容在票据信息以外还会包含一定程度的预印的格式及背景文字等。同时,这种基于颜色域筛选的方法无法识别和去除复写打印票据中可能存在的噪点,这些都导致了票据识别的准确率和效率较低。
发明内容
基于此,有必要针对上述问题,提出一种不基于票据的颜色进行识别,并能够有效去除复写票据存在噪声干扰的票据识别方法、装置、计算机设备及可读介质。
一种票据识别方法,其特征在于,所述方法包括:
获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
根据所述正面图像确定待识别的第一目标图像区域;
根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
对所述目标图像进行识别以确定票据识别结果。
一种票据识别装置,其特征在于,所述装置包括:
获取单元:用于获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
第一确定单元:用于根据所述正面图像确定待识别的第一目标图像区域;
第二确定单元:用于根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
识别单元:用于对所述目标图像进行识别以确定票据识别结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
根据所述正面图像确定待识别的第一目标图像区域;
根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
对所述目标图像进行识别以确定票据识别结果。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
根据所述正面图像确定待识别的第一目标图像区域;
根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
对所述目标图像进行识别以确定票据识别结果。
在本发明实施例中,先获取待识别的复写票据的正面图像和与正面图像按照预设关系映射的反面图像,先根据所述正面图像确定出待识别的第一目标图像区域,根据正面图像中第一目标图像区域进行转置变化等操作确定出反面图像中对应的第二目标图像区域,最后获取与这个第二目标图像区域对应的图像作为目标图像并对所述目标图像进行识别以确定票据识别结果。
相较于现有技术中在票据前景与背景颜色较为相近时,识别出目标待识别区域的准确率较低,同时无法排除复写票据所易包含的噪声所造成的准确率和效率较低的问题,本发明实施例利用了复写票据所特有的正反两面图像上都包含有票据相关文字信息,同时反面图像噪声较少的特点,通过获取待识别票据的正面和反面图像进行目标区域的定位和识别结果的确定,由此提高了票据识别的准确率和效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1示出了一个实施例中票据识别方法的流程图;
图2示出了一个实施例中确定第一目标图像区域的流程图;
图3示出了一个实施例中确定第二目标图像区域的流程图;
图4示出了一个实施例中对第一目标边缘坐标进行校准的流程图;
图5示出了一个实施例中确定票据识别结果的流程图;
图6示出了一个实施例中票据识别装置的结构框图;
图7示出了一个实施例中计算机设备的内部结构图;
图8示出了一个实施例中第二目标图像区域对应的图像;
图9示出了一个实施例中第二目标图像区域反向二值化处理后对应的目标图像。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种票据识别方法,在一个实施例中,本发明可以基于一终端设备包括手机、PC等计算机终端设备等,而在可选的实施例中还可以基于一个系统,上述系统由数据获取终端与数据处理服务器组成,以完成对目标票据的识别。
参考图1,本发明实施例提供了一种票据识别方法。
图1示出了一个实施例中票据识别方法的流程图。本发明中所述的票据识别方法至少包括如图1所示的步骤S1022-S1028,以下进行详细介绍。
首先,在对具体的票据识别过程进行具体说明之前,针对复写票据的一些特性进行简要的说明,以使得本发明提出的票据识别方法的实施过程更容易理解以及本发明的好处更为明显。
在日常生活中,海关缴款书、各种税项(如消费税、所得税等)对应的发票、银行交易回执单等各类型的票据中往往在票据的预设位置都会存在包含有预设图案的预先印刷好的固定格式区域,这些预印区域的信息一般是用于提示因后续操作(如缴税、购买、存款等)而在票据上打印和填充的信息所对应的属性及功能等。
具体的,这些预印的背景内容可以如在增值税发票中的以票据上表格栏的抬头及标题形式存在的如“收款单位”、“缴款单位”、“税号”、“税款金额”、“缴款日期”等预先在票据上打印好的文字,以及可选的在票据正上方或右下角等预设位置预印的如税务部门官方印章等图案。
而为了实现对票据中目标信息(即与预印区域对应的后续打印的前景票据信息),需要首先实现待检测票据的图像前景与背景的分离,即将原有的预印文字与图像内容与需要识别的后续印刷上的特定票据信息区别开来,以此确定出票据所包含的前景区域并针对其进行进一步的识别。
同时,更进一步需要说明的是,区别于其他也存在预印区域但为普通打印类型的票据(如银行支票、交易单存根等),诸如缴税款通知书、医院缴费凭证等多联复写式票据,这些含有预印区域的复写票据通常利用针式打印机进行套打。而这些复写票据采用上述打印的原因在于以一次打印产生多联且票据内容相同的票据(仅在如票据纸张以及油墨的颜色等介质参数上存在不同),而多联票据就便于不同的各参与方(如税务部门及医院等官方、缴税人及就诊者等实施主体)进行分别留存和记录管理。
因而要实现多联复写这一功能,基于需要采用与普通印刷材料(借助压力间接地使染色物质转移而取得印刷效果)不同的复写纸,复写纸显色的原理在于:在外力作用下,使微胶囊中的力敏色素和油溶液溢出与显色剂接触后发生染色反应,从而起到复写的作用。
因而,由于复写纸的显色单元对压力的敏感性,容易出现由于外界划痕、刮擦、用力按压等非打印行为在票据上造成的无关图像噪点,这些噪点都会对票据信息的识别造成干扰。
综上所述,本发明针对上述复写票据的两方面特性对票据识别的影响提出了对应的解决办法,以高效且准确地对复写票据进行内容的识别,下面结合实施例进行具体介绍。
在步骤S1022中,获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据。
此处获取正面图像的同时也获取反面图像的作用在于:结合前述对复写票据的介质特性的介绍,复写票据的反面也对应含有票据正面所打印上的信息(区别于普通印刷品只有一面存在信息),却相应地减少了很多正面按压与划蹭、复写打印时纸张粘连等所造成的图像噪点。
而且更重要的是,复写票据的反面图像并不存在票据正面的预印区域,只包含有后续打印上的特定的票据信息,因此可以直接获取对应区域的文字信息进行识别。
具体的,在一个可选的实施例中,可以通过预设的图像采集装置(如CIS图像扫描仪)同时采集正面与反面图像,以此提高识别效率。另外,可选的待识别的票据可以是如海关进口增值税缴款书等多联表格以及票据。
在步骤S1024中,根据所述正面图像确定待识别的第一目标图像区域。
首先,此处的第一目标图像区域是待识别票据的正面图像所包含的目标文字图像区域,如可以是各类型票据中的预印表格中后续打印填充的信息图像区域。
另外,需要说明的是,由于采集装置以及采集环境的差异和影响,在可选的实施例中,在根据正面图像进行第一目标图像区域的确定之前,还可以先对正面图像进行包括灰度化、二值化和/或去除噪点在内的图像预处理过程,以提高后续步骤中第二目标图像区域定位以及目标内容识别的准确和高效。
具体的确定第一目标图像区域的过程可以包括如图2示出的步骤S1032-S1034。图2示出了一个实施例中确定第一目标图像区域的流程图。
在步骤S1032中,利用霍夫变换提取出所述正面图像的目标直线特征。
首先,此处的目标直线特征是用于指代正面图像中预印区域(如预印表格的框线)所对应的图形特征,下面再对霍夫变换进行简要介绍。
霍夫变换(Hough Transform)是一个特征提取技术,其可用于隔离图像中特定形状的特征。其运用两个坐标空间之间的变换将在一个空间中具有相同形状的曲线或直线映射到另一个坐标空间的一个点上形成峰值,从而把检测任意形状的问题转化为统计峰值问题。
利用霍夫变换检测直线的原理在于:利用图像空间中的每条直线在参数空间中都对应着单独一个点来表示,同时,图像空间中的直线上任何一部分线段在参数空间对应的是同一个点。
举例说明,图像空间x-y中的点A和点B在参数空间k-b中对应的直线相交于一点,也就是说AB两点所确定的直线,在参数空间中对应着唯一一点,此点的坐标值也就是直线AB的参数。
在理论上,一个点对应无数条直线或者说任意方向的直线,但在实际应用中,我们必须限定直线的数量(即有限数量的方向)才能够进行计算。因此,我们将直线的方向θ离散化为有限个等间距的离散值,参数ρ也就对应离散化为有限个值,于是参数空间不再是连续的,而是被离散量化为一个个等大小网格单元。
在将图像空间(直角坐标系)中每个像素点坐标值变换到参数空间(极坐标系)后,这些所得值会落在某个网格内,使该网格单元的累加计数器加1。当图像空间中所有的像素都经过霍夫变换后,对网格单元进行检查,累加计数值最大的网格,其坐标值(ρ0,θ0)就对应图像空间中所求的直线。
以上就是霍夫直线检测算法要做的,通过检测图像中每个像素点在参数空间对应曲线之间的交点,如果交于一点的曲线的数量超过了阈值,那就可以认为这个交点(ρ,θ)在图像空间中对应一条直线。
在步骤S1034中,根据所述目标直线特征确定所述第一目标图像区域。
结合上一步骤中的介绍,通过将提取出的正面图像的目标直线特征与预设阈值进行比较,根据大于预设阈值的目标直线特征确定预印区域对应的直线形状,从而根据这些直线进一步确定出对应的预印区域,将预印区域作为背景确定出前景作为此处的第一目标图像区域。
需要说明的是,在可选的实施例中,上述经过对正面图像进行霍夫变换所提取的除了直线特征(用于构成预设表格的直线框)以外,还可以是如圆形、椭圆形等其他预设类型的图形特征。针对这些图形也需要进行筛选的原因在于,在某些类型的复写票据中,除了预印表格的框架所对应的直线以外,在票据预设位置还可能会存在如机构印章或防伪符号、指示符号等圆形或椭圆的预印形状特征,因而这些预设图案也需要作为背景图像被筛选出来。
在步骤S1026中,根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像。
具体的,步骤S1026中确定第二目标图像区域的过程还可以包括如图3示出的步骤S1042-S1046。图3示出了一个实施例中确定第二目标图像区域的流程图。
在步骤S1042中,获取所述第一目标图像区域的第一目标边缘坐标。
需要特别说明的是,考虑到票据的信息填充的格式特征,在可选的实施例中,上述确定出的第一目标图像区域可以是待识别票据所包含的各个待识别子区域。
如,在待识别票据为“A市海关进口增值税专用缴款书”的实施例中,在通过前述步骤得出了正面图像所包含的整个表格区域后,可以根据其直线特征更进一步地将表格区域划分出包含的对应的各个子表格区域作为具体的前述第一目标图像区域,具体可以如“收款单位”、“缴款单位(人)”、“税款金额”、“税号”这些预印的抬头信息所对应的表格区域等。
而且,更进一步地,针对这些子表格区域还可以进一步地被分割为更具体的目标区域(直到目标区域中不再包含预设的表征背景的直线形状),如前述“缴款单位(人)”的子表格区域还可以分割为“名称”、“账号”、“开户银行”这三个目标区域,这样的精准定位就可以在后续步骤中对应地更准确和快速地识别出各个目标区域包含的文字信息。
在步骤S1044中,根据所述第一目标边缘坐标作预设的转置变换得到第二目标边缘坐标。
首先,基于正面图像与反面图像的镜像翻转关系,此处的预设转置变换可以将第一目标图像左右变换,以此得到在反面图像中对应的第二目标边缘坐标。
另外,由于利用霍夫变换进行直线检测的优点在于对图像中直线的殘缺部分、噪声以及其它共存的非直线结构不敏感,因而其抗干扰能力强,所以节省了对图像区域边缘进行平滑和去噪的过程,从而也进一步地提高了票据图像识别的效率。
与此同时,考虑到在复写票据的多联套打打印过程中,由于多联预先粘连的纸张在因打印针头移动和出墨受力的情况下,可能会出现纸张位置偏移,从而导致票据所打印上的文字与预印的表格区域出现一定的偏移和错位,票据信息并不是完全的正中填充,从而导致在根据目标区域进行文字的识别与截取的图像有信息缺失,因此在可选的实施例中,还可以针对第一目标图像区域做一个偏移的兼容和校准过程。这个打印过程中目标区域的偏移校准过程具体可以包括图4中示出的步骤S1052-S1054。图4示出了一个实施例中对第一目标边缘坐标进行校准的流程图。
在步骤S1052中,获取所述第一目标图像区域的连通域信息,根据所述连通域信息确定目标图像偏移信息。
在一个可选的实施例中,可以采用八连通算法对第一目标图像区域中的连通域进行标注,再根据标注出的连通域个数、连通域面积、连通域周长等连通域信息与预设阈值的数值关系(如是否存在面积和/或周长过小的连通域,是则判定为是前景图像和背景表格之间偏移所导致的文字字符截取不全),判断第一目标图像区域中是否存在文字字符图像与预印区域之间的偏移。
在步骤S1054中,根据所述目标图像偏移信息对所述第一目标边缘坐标进行校准。
具体的校准过程可以是根据连通域信息判断目标图像区域所存在的偏移方向,如在第一目标图像区域的左侧出现了连通域信息不符合阈值的情况,从而可以将第一目标边缘坐标整体向右平移预设的数值,在可选的实施例中,进行上述校准过程数次即可。
继续结合图3进行说明,在步骤S1046中,根据所述第二目标边缘坐标确定所述反面图像中的第二目标图像区域。
具体的经过上述步骤处理后所确定出的第二目标图像区域可以参考如图8所示出。图8示出了一个实施例中第二目标图像区域对应的图像。
另外,在将第二目标区域对应的图像翻转成符合人的文字阅读和信息识别习惯的正面正向图像作为待识别的目标图像后,在进行其包含的票据文字等信息进行识别之前,还可以对目标图像进行一个反向二值化处理。
这是因为前述步骤中所获取的反向图像可能为黑底白字或者灰度值深浅不一的图像,为了识别出其中的文字信息,需要对其进行一个统一的二值化,而此处的反向二值化处理顾名思义即将目标图像中的灰度值为0或者255的像素点的灰度值进行灰度互换。
例如,可以设置一定的灰度阈值如50,而在上述方向二值化的过程中,将灰度值小于50的像素点的灰度统一处理为0,反之,将灰度值高于该阈值的像素点的灰度统一处理为255,从而达到了将复写票据的反向图像调整为标准的白底黑字,以便于后续文字信息的提取的目的。
在一个具体的实施例中,经过上述反向二值化处理后得到的目标图像可以参考如图9。图9示出了一个实施例中第二目标图像区域反向二值化处理后对应的目标图像。
在步骤S1028中,对所述目标图像进行识别以确定票据识别结果。
这个识别过程可以包括图5中示出的步骤S1062-S1064。图5示出了一个实施例中确定票据识别结果的流程图。
在步骤S1062中,将所述目标图像输入预设的文字识别模型,获取所述文字识别模型的输出结果。
首先,视不同应用场景的需要,在一个可选的实施例中,此处的文字识别模型可以是一个预先训练完毕的文字识别引擎,该文字识别引擎可以按照预设的算法针对输入的待识别图像进行OCR(Optical Character Recognition,光学字符识别),以此确定出上述待识别图像包含的文字信息和对应的认证信息等。
同时,该文字识别引擎可以包括如下功能模块:图像输入模块:读取预设格式的文件,如本发明中的目标图像;图像预处理模块:如对图像进行二值化,噪声去除,倾斜较正等。
另外,在可选的应用场景中,上述文字识别引擎还可以包括如字符切割模块:用于处理因字符粘连、断笔造成字符难以简单切割的问题;字符特征提取模块:用于对字符图像提取多维的特征用于后面的特征匹配模式识别算法;用于字符识别模块:用于将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符的算法等进一步进行文字识别与分析的模块。
当然可选的,文字识别模型也可以是一个小型的用于文字识别的接收预设格式的图像为输入,以识别出的目标文字信息为输出的机器学习模型。
同时,在可选的实施例中,本发明不对目标图像中可识别出的目标对象的内容及形式做限制。即在可选的实施例中也可以是针对目标图像中的预设类型的图像(如个人印章、如“合格”、“批准”等标准字符图案)进行识别。
在步骤S1064中,根据所述输出结果确定所述目标图像对应的票据识别结果。
结合前述步骤中的举例,识别引擎的输出结果可以是与目标区域如“金额”、“税号”、“账号”、“开户银行”对应的识别结果如“100000元”、“4579002798269832”、“1623839238”、“M人民银行”等目标文字信息。
需要说明的是,在确定了针对待识别图像中的每个目标区域的识别结果,还可以根据这些目标区域的识别结果进一步确定出与待识别票据所对应的预设属性或参数,并据此对待识别票据进行存档或者属性关联等管理操作。
例如,可以是根据上述识别出的结果“金额”、“税号”分别为“100000元”、“4579002798269832”按照预设的加密和转换算法生成对应的唯一标识号如“X0891023938”以对该识别票据进行管理。
图6为一个实施例中票据识别装置的结构框图。
参考图6所示,根据本发明的一个实施例的票据识别装置1070,包括:获取单元1072、第一确定单元1074、第二确定单元1076、识别单元1078。
其中,获取单元1072:用于获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据。
第一确定单元1074:用于根据所述正面图像确定待识别的第一目标图像区域。
第二确定单元1076:用于根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像。
识别单元1078:用于对所述目标图像进行识别以确定票据识别结果。
图7示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器和识别模块、通信模块。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现本票据识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行本票据识别方法。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
根据所述正面图像确定待识别的第一目标图像区域;
根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
对所述目标图像进行识别以确定票据识别结果。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
根据所述正面图像确定待识别的第一目标图像区域;
根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
对所述目标图像进行识别以确定票据识别结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种票据识别方法,其特征在于,所述方法包括:
获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
根据所述正面图像确定待识别的第一目标图像区域;
根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
对所述目标图像进行识别以确定票据识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述正面图像确定第一目标图像区域,包括:
利用霍夫变换提取出所述正面图像的目标直线特征;
根据所述目标直线特征确定所述第一目标图像区域。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,包括:
获取所述第一目标图像区域的第一目标边缘坐标;
根据所述第一目标边缘坐标作预设的转置变换得到第二目标边缘坐标;
根据所述第二目标边缘坐标确定所述反面图像中的第二目标图像区域。
4.根据权利要求1所述的方法,其特征在于,在根据所述第一目标边缘坐标作预设的转置变换得到第二目标边缘坐标之前,还包括:
获取所述第一目标图像区域的连通域信息,根据所述连通域信息确定目标图像偏移信息;
根据所述目标图像偏移信息对所述第一目标边缘坐标进行校准。
5.根据权利要求1所述的方法,其特征在于,所述获取与所述第二目标图像区域对应的图像作为目标图像,包括:
对所述反面目标图像区域对应的图像进行镜像翻转处理,将所述镜像翻转处理之后的图像作为所述目标图像。
6.根据权利要求1所述的方法,其特征在于,在对所述目标图像进行识别得到对应的票据识别结果之前,包括:
对所述目标图像进行反向二值化处理。
7.根据权利要求1所述的方法,其特征在于,所述对所述目标图像进行识别以确定票据识别结果,包括:
将所述目标图像输入预设的文字识别模型,获取所述文字识别模型的输出结果;
根据所述输出结果确定所述目标图像对应的票据识别结果。
8.一种票据识别装置,其特征在于,所述装置包括:
获取单元:用于获取待识别票据的正面图像与反面图像,所述待识别票据为复写票据;
第一确定单元:用于根据所述正面图像确定待识别的第一目标图像区域;
第二确定单元:用于根据所述第一目标图像区域确定所述反面图像中对应的第二目标图像区域,获取与所述第二目标图像区域对应的图像作为目标图像;
识别单元:用于对所述目标图像进行识别以确定票据识别结果。
9.一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910871456.8A CN110738119B (zh) | 2019-09-16 | 2019-09-16 | 一种票据识别方法、装置、设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910871456.8A CN110738119B (zh) | 2019-09-16 | 2019-09-16 | 一种票据识别方法、装置、设备及可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110738119A true CN110738119A (zh) | 2020-01-31 |
CN110738119B CN110738119B (zh) | 2022-07-01 |
Family
ID=69267982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910871456.8A Active CN110738119B (zh) | 2019-09-16 | 2019-09-16 | 一种票据识别方法、装置、设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110738119B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414914A (zh) * | 2020-02-21 | 2020-07-14 | 深圳追一科技有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN111753842A (zh) * | 2020-06-28 | 2020-10-09 | 中国银行股份有限公司 | 票据文本区域检测方法及装置 |
CN111814780A (zh) * | 2020-07-08 | 2020-10-23 | 重庆农村商业银行股份有限公司 | 一种票据图像处理方法、装置、设备及存储介质 |
CN112199997A (zh) * | 2020-09-07 | 2021-01-08 | 青岛海信移动通信技术股份有限公司 | 一种终端及工具处理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN203882372U (zh) * | 2014-04-08 | 2014-10-15 | 刘尧远 | 金融票据图像识别分类装置 |
CN105139009A (zh) * | 2015-07-10 | 2015-12-09 | 安徽清新互联信息科技有限公司 | 一种基于边缘特征的信用卡卡号识别方法 |
CN105247541A (zh) * | 2013-03-12 | 2016-01-13 | 谷歌公司 | 改进的从卡的数字图像中提取金融账户信息 |
CN106875546A (zh) * | 2017-02-10 | 2017-06-20 | 大连海事大学 | 一种增值税发票的识别方法 |
CN109657673A (zh) * | 2017-10-11 | 2019-04-19 | 阿里巴巴集团控股有限公司 | 图像识别方法和终端 |
CN109993160A (zh) * | 2019-02-18 | 2019-07-09 | 北京联合大学 | 一种图像矫正及文本与位置识别方法及系统 |
-
2019
- 2019-09-16 CN CN201910871456.8A patent/CN110738119B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105247541A (zh) * | 2013-03-12 | 2016-01-13 | 谷歌公司 | 改进的从卡的数字图像中提取金融账户信息 |
CN203882372U (zh) * | 2014-04-08 | 2014-10-15 | 刘尧远 | 金融票据图像识别分类装置 |
CN105139009A (zh) * | 2015-07-10 | 2015-12-09 | 安徽清新互联信息科技有限公司 | 一种基于边缘特征的信用卡卡号识别方法 |
CN106875546A (zh) * | 2017-02-10 | 2017-06-20 | 大连海事大学 | 一种增值税发票的识别方法 |
CN109657673A (zh) * | 2017-10-11 | 2019-04-19 | 阿里巴巴集团控股有限公司 | 图像识别方法和终端 |
CN109993160A (zh) * | 2019-02-18 | 2019-07-09 | 北京联合大学 | 一种图像矫正及文本与位置识别方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414914A (zh) * | 2020-02-21 | 2020-07-14 | 深圳追一科技有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN111753842A (zh) * | 2020-06-28 | 2020-10-09 | 中国银行股份有限公司 | 票据文本区域检测方法及装置 |
CN111753842B (zh) * | 2020-06-28 | 2024-02-27 | 中国银行股份有限公司 | 票据文本区域检测方法及装置 |
CN111814780A (zh) * | 2020-07-08 | 2020-10-23 | 重庆农村商业银行股份有限公司 | 一种票据图像处理方法、装置、设备及存储介质 |
CN111814780B (zh) * | 2020-07-08 | 2023-05-26 | 重庆农村商业银行股份有限公司 | 一种票据图像处理方法、装置、设备及存储介质 |
CN112199997A (zh) * | 2020-09-07 | 2021-01-08 | 青岛海信移动通信技术股份有限公司 | 一种终端及工具处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110738119B (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738119B (zh) | 一种票据识别方法、装置、设备及可读介质 | |
US7312902B2 (en) | Background data recording and use with document processing | |
CN107944452A (zh) | 一种圆形印章文字识别方法 | |
CN103995904B (zh) | 一种影像档案电子资料的识别系统 | |
CN109344904B (zh) | 生成训练样本的方法、系统及存储介质 | |
CN112101367A (zh) | 文本识别方法、图像识别分类方法、文档识别处理方法 | |
US9270852B2 (en) | Image processing apparatus | |
JP4913184B2 (ja) | 本人確認書類真贋判定装置、本人確認書類真贋判定方法およびプログラム | |
CN112528998B (zh) | 证件图像处理方法、装置、电子设备及可读存储介质 | |
US20210074109A1 (en) | Verification of an article provided with a security element | |
CN107463074A (zh) | 成像方法及成像装置 | |
TW200540728A (en) | Text region recognition method, storage medium and system | |
CN112699646A (zh) | 数据处理方法、装置、设备及介质 | |
Uddin et al. | Image-based approach for the detection of counterfeit banknotes of Bangladesh | |
CN111462388A (zh) | 一种票据检验方法、装置、终端设备及存储介质 | |
CN103748866A (zh) | 取证鉴定系统和方法 | |
US11188747B2 (en) | System and method for masking text within images | |
TWM574294U (zh) | 一種基於行動載具之智能理賠系統 | |
CN111598099B (zh) | 图像文本识别性能的测试方法、装置、测试设备及介质 | |
Van Beusekom et al. | Document signature using intrinsic features for counterfeit detection | |
CN101266663A (zh) | 一种银行手写票据的数码化方法、系统及数码票据 | |
CN112541744A (zh) | 开户数据处理方法、装置、计算机设备及存储介质 | |
JP2019032645A (ja) | 書類管理装置、書類管理方法、および、書類管理装置用のプログラム | |
CN112101356A (zh) | 一种图片中特定文本的定位方法、装置及存储介质 | |
CN105608659A (zh) | 一种人民调解综合平台及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |