CN111753842B

CN111753842B - 票据文本区域检测方法及装置

Info

Publication number: CN111753842B
Application number: CN202010598358.4A
Authority: CN
Inventors: 廖旺胜; 庄恩瀚; 李昀; 李乐
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2020-06-28
Filing date: 2020-06-28
Publication date: 2024-02-27
Anticipated expiration: 2040-06-28
Also published as: CN111753842A

Abstract

本发明公开了一种票据文本区域检测方法及装置，其中方法包括：获得票据图像；对所述票据图像进行霍夫变换，确定票据图像边缘数据；根据所述票据图像边缘数据，对所述票据图像进行矫正；对矫正后的票据图像进行连通区域检测；根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。本发明有效提高检测率和泛化能力，节省资源占用，提升客户体验。

Description

票据文本区域检测方法及装置

技术领域

本发明涉及模式检测技术领域，尤其涉及票据文本区域检测方法及装置。

背景技术

随着智能移动设备的普及和创新型银行的落地，银行很多传统柜面业务，例如票据录入圈存，在线上进行。其中涉及对票据中的各种栏位进行文本区域检测。

传统OCR通常采用模式检测的方式，当前OCR检测通常采用深度学习的方法。现有模式检测只需要一份标准样本，但是海外票据样式多而杂，更有客户定制样式，存在检测率低以及泛化能力差的问题；而虽然深度学习的方法检测率高以及通用性强，但需要海量样本对模型进行训练，票据属于金融凭证，涉及客户隐私，无法获得海量的样本数据，在样本量不足的情况下会产生训练不足的情况，且深度学习在移动端占用资源过大，导致客户体验不好。

发明内容

本发明实施例提供一种票据文本区域检测方法，用以检测票据文本区域，保证检测率和泛化能力，节省资源占用，提升客户体验，该方法包括：

获得票据图像；

对所述票据图像进行霍夫变换，确定票据图像边缘数据；

根据所述票据图像边缘数据，对所述票据图像进行矫正；

对矫正后的票据图像进行连通区域检测；

根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。

本发明实施例提供一种票据文本区域检测装置，用以检测票据文本区域，保证检测率和泛化能力，节省资源占用，提升客户体验，该装置包括：

图像获得模块，用于获得票据图像；

边缘数据确定模块，用于对所述票据图像进行霍夫变换，确定票据图像边缘数据；

矫正模块，用于根据所述票据图像边缘数据，对所述票据图像进行矫正；

连通区域检测模块，用于对矫正后的票据图像进行连通区域检测；

文本区域检测模块，用于根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。

本发明实施例还提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述票据文本区域检测方法。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有执行上述票据文本区域检测方法的计算机程序。

相对于现有技术中通过模式检测和深度学习检测票据文本区域的方案而言，本发明实施例通过获得票据图像；对所述票据图像进行霍夫变换，确定票据图像边缘数据；根据所述票据图像边缘数据，对所述票据图像进行矫正；对矫正后的票据图像进行连通区域检测；根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。本发明实施例在确定票据图像边缘数据后对票据图像进行矫正，从而有效提高检测率和泛化能力，对矫正后的票据图像进行连通区域检测，并结合浅层神经网络模型进行票据文本区域检测，无需海量样本进行训练，可以有效节省资源占用，提升客户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本发明实施例中票据文本区域检测方法示意图；

图2为本发明实施例中票据文本区域检测装置结构图；

图3为本发明实施例中票据文本区域检测装置结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

首先，对本申请实施例中涉及的名词进行介绍：

OCR：光学字符识别(Optical Character Recognition，OCR)，泛指图像文字识别，即从图像视频中自动识别文字内容，属于AI计算机视觉的一个重要分支。

MICR码：磁墨水字符识别码(Magnetic ink character recognition code，MICR)，一种应用于银行票据，专门用于识别银行号、银行账号等票据信息的特殊字体。

为了检测票据文本区域，提高检测率和泛化能力，节省资源占用，提升客户体验，本发明实施例提供一种票据文本区域检测方法，如图1所示，该方法可以包括：

步骤101、获得票据图像；

步骤102、对所述票据图像进行霍夫变换，确定票据图像边缘数据；

步骤103、根据所述票据图像边缘数据，对所述票据图像进行矫正；

步骤104、对矫正后的票据图像进行连通区域检测；

步骤105、根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。

由图1所示可以得知，本发明实施例通过获得票据图像；对所述票据图像进行霍夫变换，确定票据图像边缘数据；根据所述票据图像边缘数据，对所述票据图像进行矫正；对矫正后的票据图像进行连通区域检测；根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。本发明实施例在确定票据图像边缘数据后对票据图像进行矫正，从而有效提高检测率和泛化能力，对矫正后的票据图像进行连通区域检测，并结合浅层神经网络模型进行票据文本区域检测，无需海量样本进行训练，可以有效节省资源占用，提升客户体验。

具体实施时，获得票据图像。

实施例中，首先获得票据图像，判断图片的清晰度是否合格，例如可以预先设定一个清晰度阈值，将图片的清晰度数据与该清晰度阈值进行比对，如果清晰度数据超过阈值则可以继续进行处理，如果没有超过阈值则需要重新上传票据图像。

具体实施时，对所述票据图像进行霍夫变换，确定票据图像边缘数据。

实施例中，票据文本区域检测方法还包括：获得票据图像之后，对所述票据图像进行预处理，所述预处理包括：去噪处理，灰度化处理，二值化处理其中之一或任意组合；

对所述票据图像进行霍夫变换，确定票据图像边缘数据，包括：对预处理后的票据图像进行霍夫变换，确定票据图像边缘数据。

本实施例中，票据图像的去噪处理可以采用均值滤波器，自适应维纳滤波器，中值滤波器，形态学噪声滤除器进行去噪，也可以对票据图像进行小波去噪。票据图像的灰度化处理可以采用分量法，最大值法，平均值法或加权平均法。票据图像的二值化处理是将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中，二值图像占有非常重要的地位，首先，图像的二值化有利于图像的进一步处理，使图像变得简单，而且数据量减小，能凸显出感兴趣的目标的轮廓。其次，要进行二值图像的处理与分析，首先要把灰度图像二值化，得到二值化图像。所有灰度大于或等于阈值的像素被判定为属于特定物体，其灰度值为255表示，否则这些像素点被排除在物体区域以外，灰度值为0，表示背景或者例外的物体区域。

实施例中，对所述票据图像进行霍夫变换，确定票据图像边缘数据，包括：对所述票据图像进行霍夫变换，获得多个直线段簇；对所述多个直线段簇进行合并，确定票据图像边缘数据。

本实施例中，具体的，对票据图像进行霍夫变换之后可以获得多个直线段簇，对多个直线段簇进行合并，确定票据图像边缘数据。霍夫变换是一种特征检测，被广泛应用在图像分析、电脑视觉以及数位影像处理。霍夫变换是用来辨别找出物件中的特征，例如：线条。给定一个物件、要辨别的形状的种类，会在参数空间中执行投票来决定物体的形状，而这是由累加空间里的局部最大值来决定。霍夫变换算法使用累加器二维矩阵，来侦测图片中使否有直线可以用方程式r＝xcosθ+ycosθ来描述。累加器二维矩阵的维度等于未知的参数的总数，举例来说，要寻找是否有一条直线，他的参数空间的变数总共有两个r和θ，因此累加器二维矩阵的维度是2。而这个累加器二维矩阵，一个维度代表经过量化的r，另一个维度则是代表量化的θ，因此每一个矩阵的元素的值是可以用该元素表示的直线的数量总和，因此矩阵元素的最大值的意义是该张图片里出现该元素代表的直线的信心最大。对于每一个像素(x,y)与其邻近的点，算法会依据一些证据来判断是否有一条直线通过该像素(x,y)与其邻近的点，如果有，算法就会把该条直线的参数(r,θ)所对应到的累加器二维矩阵里的元素增加1，最后在选出累加器二维矩阵里大于阀值的一些局部最大值，就可能找到真地存在于图片上的直线，在其他状况下，不使用阀值改用其他的技巧可以让算法的表现更好。然而，霍夫变换只能求得线的参数，无法求得该条线的长度，所以必须在霍夫变换完的下一步将线条配对到图上的线条。而霍夫变换的误差来源，可能是图片的不完美(噪声、遗漏像素)，使得边缘侦测器的侦测出错误的边界。

具体实施时，根据所述票据图像边缘数据，对所述票据图像进行矫正。

实施例中，根据所述票据图像边缘数据，对所述票据图像进行矫正，包括：根据所述票据图像边缘数据，以及MICR码或预先建立的可选方向模型对所述票据图像进行矫正，其中，可选方向模型根据文本区域方向，票据直线方向或logo标识预先建立。

本实施例中，得到票据图像边缘数据之后，可以对图像进行剪裁，去除与票据内容无关的背景，对于直线边缘检测出来的矩形，可能存在0度、90度、180度、270度的不同方向，需要结合MICR码或预先建立的可选方向模型对票据图像进行矫正。MICR码也即磁性号码，是将0-9的数字以及四个符号用磁性油墨印刷或用磁性色带打印在支票或其他票券正面的特定位置，以供磁性阅读机识别。磁性号码的应用是为提高票据处理的效率，在世界上有两种常用字体系统，一种是CMC-7即欧洲通用的符号，而另一种是E-13B，是美国国家标准规格，也是我国所采用的字体。可选方向模型是根据文本区域方向，票据直线方向或logo标识预先建立。

具体实施时，对矫正后的票据图像进行连通区域检测。

实施例中，对所述票据图像进行矫正之后，对矫正后的票据图像进行连通区域检测，可以得到一系列的候选连通区域。连通区域是对二值图像进行处理的，即该图像只有黑(0)和白(255)两种颜色，这里假设目标为白色，背景为黑色。标记算法首先对二值图像进行一次完整的扫描，标记所有目标像素点的同时，得到并记录等价标记对。等价标记对的产生是由于扫描次序的不同，导致开始时认为是两个不同的连通区域，后来随着扫描的深入，又发现这两个区域是连通的。所以，需要记录等价对以表明它们隶属于同一个连通区域，以便第一次扫描结束后进行修正。标记算法首先对二值图像的每一个像素进行8连通区域的标记。如果出现不同连通标记的相邻像素，还需要考虑记录等价对的问题。

具体实施时，根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。

实施例中，识别每个连通区域检测得到的候选连通区域，找出目标区域的标志，最后利用浅层神经网络模型所有连通区域进行二分类识别，合并目标区域内的连通区域，确定目标区域。浅层神经网络可以实现二分类算法，判断联通区域是否属于文本区域，该浅层神经网络由卷积神经网络CNN组成，包含卷积层、最大池化层、全连接层和Dropout层等，输入联通区域检测结果图片，输出[0.0,1.0]范围结果，然后对结果进行分类，从而达到筛选联通区域检测的效果。

基于同一发明构思，本发明实施例还提供了一种票据文本区域检测装置，如下面的实施例所述。由于这些解决问题的原理与票据文本区域检测方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

图2为本发明实施例中票据文本区域检测装置的结构图，如图2所示，该装置包括：

图像获得模块201，用于获得票据图像；

边缘数据确定模块202，用于对所述票据图像进行霍夫变换，确定票据图像边缘数据；

矫正模块203，用于根据所述票据图像边缘数据，对所述票据图像进行矫正；

连通区域检测模块204，用于对矫正后的票据图像进行连通区域检测；

文本区域检测模块205，用于根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。

一个实施例中，如图3所示，图2所述的票据文本区域检测装置还包括：

预处理模块206，用于获得票据图像之后，对所述票据图像进行预处理，所述预处理包括：去噪处理，灰度化处理，二值化处理其中之一或任意组合；

所述边缘数据确定模块202进一步用于：对预处理后的票据图像进行霍夫变换，确定票据图像边缘数据。

一个实施例中，所述边缘数据确定模块202进一步用于：

对所述票据图像进行霍夫变换，获得多个直线段簇；

对所述多个直线段簇进行合并，确定票据图像边缘数据。

一个实施例中，所述矫正模块203进一步用于：根据所述票据图像边缘数据，以及MICR码或预先建立的可选方向模型对所述票据图像进行矫正，其中，可选方向模型根据文本区域方向，票据直线方向或logo标识预先建立。

综上所述，本发明实施例通过获得票据图像；对所述票据图像进行霍夫变换，确定票据图像边缘数据；根据所述票据图像边缘数据，对所述票据图像进行矫正；对矫正后的票据图像进行连通区域检测；根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立。本发明实施例在确定票据图像边缘数据后对票据图像进行矫正，从而有效提高检测率和泛化能力，对矫正后的票据图像进行连通区域检测，并结合浅层神经网络模型进行票据文本区域检测，无需海量样本进行训练，可以有效节省资源占用，提升客户体验。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种票据文本区域检测方法，其特征在于，包括：

获得票据图像；

对所述票据图像进行霍夫变换，确定票据图像边缘数据；

根据所述票据图像边缘数据，对所述票据图像进行矫正；

对矫正后的票据图像进行连通区域检测；其中，连通区域是对二值图像进行处理的；标记算法首先对二值图像进行一次完整的扫描，标记所有目标像素点的同时，得到并记录等价标记对；其中，等价标记对的产生是由于扫描次序的不同，导致开始时认为是两个不同的连通区域，后来随着扫描的深入，又发现这两个区域是连通的；

根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立；

其中，根据所述票据图像边缘数据，对所述票据图像进行矫正，包括：根据所述票据图像边缘数据，以及MICR码或预先建立的可选方向模型对所述票据图像进行矫正，其中，可选方向模型根据文本区域方向，票据直线方向或logo标识预先建立。

2.如权利要求1所述的票据文本区域检测方法，其特征在于，还包括：获得票据图像之后，对所述票据图像进行预处理，所述预处理包括：去噪处理，灰度化处理，二值化处理其中之一或任意组合；

3.如权利要求1所述的票据文本区域检测方法，其特征在于，对所述票据图像进行霍夫变换，确定票据图像边缘数据，包括：

对所述票据图像进行霍夫变换，获得多个直线段簇；

对所述多个直线段簇进行合并，确定票据图像边缘数据。

4.一种票据文本区域检测装置，其特征在于，包括：

图像获得模块，用于获得票据图像；

连通区域检测模块，用于对矫正后的票据图像进行连通区域检测；其中，连通区域是对二值图像进行处理的；标记算法首先对二值图像进行一次完整的扫描，标记所有目标像素点的同时，得到并记录等价标记对；其中，等价标记对的产生是由于扫描次序的不同，导致开始时认为是两个不同的连通区域，后来随着扫描的深入，又发现这两个区域是连通的；

文本区域检测模块，用于根据连通区域检测的结果和预先建立的浅层神经网络模型，进行票据文本区域检测，所述浅层神经网络模型根据连通区域检测历史结果预先建立；

其中，所述矫正模块进一步用于：根据所述票据图像边缘数据，以及MICR码或预先建立的可选方向模型对所述票据图像进行矫正，其中，可选方向模型根据文本区域方向，票据直线方向或logo标识预先建立。

5.如权利要求4所述的票据文本区域检测装置，其特征在于，还包括：

预处理模块，用于获得票据图像之后，对所述票据图像进行预处理，所述预处理包括：去噪处理，灰度化处理，二值化处理其中之一或任意组合；

所述边缘数据确定模块进一步用于：对预处理后的票据图像进行霍夫变换，确定票据图像边缘数据。

6.如权利要求4所述的票据文本区域检测装置，其特征在于，所述边缘数据确定模块进一步用于：

对所述票据图像进行霍夫变换，获得多个直线段簇；

对所述多个直线段簇进行合并，确定票据图像边缘数据。

7.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至3任一所述方法。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有执行权利要求1至3任一所述方法的计算机程序。