CN109389110A

CN109389110A - 一种区域确定方法及装置

Info

Publication number: CN109389110A
Application number: CN201811184533.4A
Authority: CN
Inventors: 罗熹之
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2018-10-11
Filing date: 2018-10-11
Publication date: 2019-02-26
Anticipated expiration: 2038-10-11
Also published as: CN109389110B

Abstract

本发明实施例提供了一种区域确定方法及装置，涉及图像识别技术领域，其中，上述方法包括：对待识别图像进行形态学梯度化计算，得到第一梯度图；分别将第一梯度图的每一个像素行输入至区域检测模型中，得到各个像素行在待识别图像中对应的像素行位于包含字符的图像区域的第一概率；计算第一梯度图中各连续第一预设数量个像素行的第一概率的和值；确定所得到的最大和值对应的第一预设数量个像素行在待识别图像中对应的区域，作为第一区域；根据第一区域，确定包含字符的图像区域。应用本发明实施例提供的方案确定区域时，能够提高所确定出的、包含字符的图像区域的准确度。

Description

一种区域确定方法及装置

技术领域

本发明涉及图像识别技术领域，特别是涉及一种区域确定方法及装置。

背景技术

在对图像进行识别时，往往需要从图像中识别出各种各样的信息，例如，识别出图像中包含的数字、字母等字符。以银行卡图像为例，可以从银行卡图像中识别银行卡号。

具体的，从银行卡图像中识别银行卡号时，需要先在上述图像中，确定记录银行卡号的图像区域，也就是，确定包含字符的图像区域。现有技术中，确定上述图像区域时，可以采用基于二值化的水平投影算法确定上述图像区域。具体步骤包括：对上述银行卡图像进行二值化处理，得到黑白两色的二值图像；统计上述二值图像的每一像素行中颜色为白色或黑色的像素点分布；根据统计结果，确定上述图像区域。

发明人在实现本发明的过程中发现，现有技术至少存在如下问题：由于银行卡的卡面上往往会包含内容丰富的复杂图案，对上述银行卡图像进行二值化处理后，这些复杂图案的纹理也会和卡号一并保留下来，进而对确定上述图像区域带来影响，使得所确定出的、包含字符的图像区域的准确度较低。

发明内容

本发明实施例的目的在于提供一种区域确定方法及装置，以提高所确定出的、包含字符的图像区域的准确度。具体技术方案如下：

本发明实施例提供一种区域确定方法，包括：

对待识别图像进行形态学梯度化计算，得到第一梯度图；

分别将所述第一梯度图的每一个像素行输入至区域检测模型中，得到各个像素行在所述待识别图像中对应的像素行位于包含字符的图像区域的第一概率，其中，所述区域检测模型为：预先使用第一样本梯度图中每一个像素行对预设的神经网络模型进行训练得到的二分类神经网络模型，所述第一样本梯度图为：对第一样本图像进行形态学梯度化计算得到的梯度图；

计算所述第一梯度图中各连续第一预设数量个像素行的第一概率的和值；

确定所得到的第一概率的最大和值对应的第一预设数量个像素行在所述待识别图像中对应的区域，作为第一区域；

根据所述第一区域，确定包含字符的图像区域。

本发明的一种实现方式中，所述对待识别图像进行形态学梯度化计算，得到第一梯度图，包括：

获得待识别图像的灰度分量图像和色度分量图像；

分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算，得到灰度分量梯度图和色度分量梯度图；

对所述灰度分量梯度图和所述色度分量梯度图进行差运算，得到第一梯度图。

本发明的一种实现方式中，在所述分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算，得到灰度分量梯度图和色度分量梯度图之后，所述方法还包括：

分别将所述灰度分量梯度图的每一个像素行输入至所述区域检测模型中，得到各个像素行在所述待识别图像中对应的像素行位于包含字符的图像区域的第二概率；

计算所述灰度分量梯度图中各连续第一预设数量个像素行的第二概率的和值；

确定所得到的第二概率的最大和值对应的第一预设数量个像素行在所述待识别图像中对应的区域，作为第二区域；

所述根据所述第一区域，确定包含字符的图像区域，包括：

将所述第一区域和所述第二区域分别划分为高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域；

分别将每一子区域输入至置信度模型中，得到该子区域为单字符图像区域的置信度，其中，所述置信度模型为：预先使用第二样本梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的多个单字符图像区域对预设的神经网络模型进行训练得到的二分类神经网络模型，所述第二样本梯度图为：对第二样本图像进行形态学梯度化计算得到的梯度图；

分别计算所述第一区域与所述第二区域所包含子区域的置信度的和值，将置信度的和值较大的区域确定为包含字符的图像区域。

本发明的一种实现方式中，采用以下方式训练得到所述区域检测模型：

获取包含字符的第一样本图像；

对所述第一样本图像进行形态学梯度化计算，得到第一样本梯度图；

将所述第一样本梯度图中与字符像素行对应的像素行作为正样本像素行，将所述第一样本梯度图中与非字符像素行对应的像素行作为负样本像素行，其中，所述字符像素行为：所述第一样本图像中字符所在区域中的像素行，所述非字符像素行为：所述第一样本图像中字符所在区域外、且与字符所在区域等大小的区域中的像素行；

采用所述正样本像素行和所述负样本像素行对预设的神经网络模型进行训练，得到用于检测图像中像素行是否位于包含字符的图像区域的二分类神经网络模型，作为所述区域检测模型。

本发明的一种实现方式中，所述对所述第一样本图像进行形态学梯度化计算，得到第一样本梯度图，包括：

分别获得所述第一样本图像的灰度分量和色度分量，作为第一灰度样本图和色度样本图；

分别对所述第一灰度样本图和所述色度样本图进行形态学梯度化计算，得到第一灰度梯度样本图和色度梯度样本图；

对所述第一灰度梯度样本图和所述色度梯度样本图进行差运算，得到第一样本梯度图。

本发明的一种实现方式中，采用以下方式训练得到所述置信度模型：

获取包含字符的第二样本图像；

获得所述第二样本图像的灰度分量，作为第二灰度样本图；

对所述第二灰度样本图进行形态学梯度化计算，得到第二灰度梯度样本图；

对所述第二灰度梯度样本图进行直方图均衡化处理，得到第二样本梯度图；

将第三区域划分成多个高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域，作为正样本区域，其中，所述第三区域为：所述第二样本梯度图中与所述第二样本图像中包含字符的图像区域相对应的区域；

将第四区域划分成多个高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域，作为负样本区域，其中，所述第四区域为：在所述第二样本梯度图中，在所述第三区域外且与第三区域等大小的区域；

采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练，得到用于检验区域是否是包含字符的图像区域的二分类神经网络模型，作为所述置信度模型。

本发明的一种实现方式中，所述对所述灰度分量梯度图和所述色度分量梯度图进行差运算，得到第一梯度图，包括：

对所述色度分量梯度图进行二值化处理，得到色度分量二值图；

确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值，得到第一梯度图，其中，所述第一预设像素值为：所表示的梯度值小于预设阈值的像素值，所述第一像素点为：与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点，所述第二预设像素值为：所述色度分量二值图中背景像素点的像素值。

本发明实施例还提供一种区域确定装置，包括：

梯度图获得模块，用于对待识别图像进行形态学梯度化计算，得到第一梯度图；

第一概率获得模块，用于分别将所述第一梯度图的每一个像素行输入至区域检测模型中，得到各个像素行在所述待识别图像中对应的像素行位于包含字符的图像区域的第一概率，其中，所述区域检测模型为：预先使用第一样本梯度图中每一个像素行对预设的神经网络模型进行训练得到的二分类神经网络模型，所述第一样本梯度图为：对第一样本图像进行形态学梯度化计算得到的梯度图；

第一和值计算模块，用于计算所述第一梯度图中各连续第一预设数量个像素行的第一概率的和值；

第一区域确定模块，用于确定所得到的第一概率的最大和值对应的第一预设数量个像素行在所述待识别图像中对应的区域，作为第一区域；

第二区域确定模块，用于根据所述第一区域，确定包含字符的图像区域。

本发明的一种实现方式中，所述梯度图获得模块，包括：

图像获得子模块，用于获得待识别图像的灰度分量图像和色度分量图像；

第一梯度图获得子模块，用于分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算，得到灰度分量梯度图和色度分量梯度图；

第二梯度图获得子模块，用于对所述灰度分量梯度图和所述色度分量梯度图进行差运算，得到第一梯度图。

本发明的一种实现方式中，所述装置还包括：

第二概率获得模块，用于在所述第一梯度图获得子模块分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算，得到灰度分量梯度图和色度分量梯度图之后，分别将所述灰度分量梯度图的每一个像素行输入至所述区域检测模型中，得到各个像素行在所述待识别图像中对应的像素行位于包含字符的图像区域的第二概率；

第二和值计算模块，用于计算所述灰度分量梯度图中各连续第一预设数量个像素行的第二概率的和值；

第三区域确定模块，用于确定所得到的第二概率的最大和值对应的第一预设数量个像素行在所述待识别图像中对应的区域，作为第二区域；

所述第二区域确定模块，包括：

区域划分子模块，用于将所述第一区域和所述第二区域分别划分为高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域；

置信度获得子模块，用于分别将每一子区域输入至置信度模型中，得到该子区域为单字符图像区域的置信度，其中，所述置信度模型为：预先使用第二样本梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的多个单字符图像区域对预设的神经网络模型进行训练得到的二分类神经网络模型，所述第二样本梯度图为：对第二样本图像进行形态学梯度化计算得到的梯度图；

区域确定子模块，用于分别计算所述第一区域与所述第二区域所包含子区域的置信度的和值，将置信度的和值较大的区域确定为包含字符的图像区域。

本发明的一种实现方式中，所述第一概率获得模块包括以下子模块，用于训练得到所述区域检测模型：

第一图像获取子模块，用于获取包含字符的第一样本图像；

第三梯度图获得子模块，用于对所述第一样本图像进行形态学梯度化计算，得到第一样本梯度图；

像素行获得子模块，用于将所述第一样本梯度图中与字符像素行对应的像素行作为正样本像素行，将所述第一样本梯度图中与非字符像素行对应的像素行作为负样本像素行，其中，所述字符像素行为：所述第一样本图像中字符所在区域中的像素行，所述非字符像素行为：所述第一样本图像中字符所在区域外、且与字符所在区域等大小的区域中的像素行；

第一模型获得子模块，用于采用所述正样本像素行和所述负样本像素行对预设的神经网络模型进行训练，得到用于检测图像中像素行是否位于包含字符的图像区域的二分类神经网络模型，作为所述区域检测模型。

本发明的一种实现方式中，所述第三梯度图获得子模块，包括：

第一图像获得单元，用于分别获得所述第一样本图像的灰度分量和色度分量，作为第一灰度样本图和色度样本图；

第二图像获得单元，用于分别对所述第一灰度样本图和所述色度样本图进行形态学梯度化计算，得到第一灰度梯度样本图和色度梯度样本图；

第一梯度图获得单元，用于对所述第一灰度梯度样本图和所述色度梯度样本图进行差运算，得到第一样本梯度图。

本发明的一种实现方式中，所述置信度获得子模块包括以下单元，用于训练得到所述置信度模型：

图像获取单元，用于获取包含字符的第二样本图像；

第三图像获得单元，用于获得所述第二样本图像的灰度分量，作为第二灰度样本图；

第四图像获得单元，用于对所述第二灰度样本图进行形态学梯度化计算，得到第二灰度梯度样本图；

第五图像获得单元，用于对所述第二灰度梯度样本图进行直方图均衡化处理，得到第二样本梯度图；

第一区域划分单元，用于将第三区域划分成多个高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域，作为正样本区域，其中，所述第三区域为：所述第二样本梯度图中与所述第二样本图像中包含字符的图像区域相对应的区域；

第二区域划分单元，用于将第四区域划分成多个高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域，作为负样本区域，其中，所述第四区域为：在所述第二样本梯度图中，在所述第三区域外且与第三区域等大小的区域；

模型获得单元，用于采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练，得到用于检验区域是否是包含字符的图像区域的二分类神经网络模型，作为所述置信度模型。

本发明的一种实现方式中，所述第二梯度图获得子模块，包括：

第六图像获得单元，用于对所述色度分量梯度图进行二值化处理，得到色度分量二值图；

第二梯度图获得单元，用于确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值，得到第一梯度图，其中，所述第一预设像素值为：所表示的梯度值小于预设阈值的像素值，所述第一像素点为：与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点，所述第二预设像素值为：所述色度分量二值图中背景像素点的像素值。

本发明实施例还提供一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的区域确定方法的步骤。

在本发明实施的又一方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述任一所述的区域确定方法的步骤。

在本发明实施的又一方面，本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的区域确定方法。

本发明实施例提供的区域确定方法及装置，可以先将形态学梯度化的待识别图像的像素行输入到预先训练得到的二分类神经网络模型中，得到待识别图像中的像素行位于包含字符的图像区域的概率，再计算各连续预设数量个像素行的概率和值，然后将概率和值最大的连续预设数量个像素行所在的区域确定为包含字符的图像区域。本发明实施例提供的方案中，不再采用二值化这种丢失图像信息较多的处理方式，而是使用经过大量样本训练过的神经网络模型，对形态学梯度化的图像进行检测。字符和背景图案的差别特征作为样本对神经网络进行训练，使得模型能够有效的区分需要识别的字符和背景图案，从而提高所确定出的、包含字符的图像区域的准确度。当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的区域确定方法的一种流程示意图；

图2为本发明实施例提供的银行卡图像形态学梯度化处理效果图；

图3为本发明实施例提供的区域确定方法的另一种流程示意图；

图4为本发明实施例提供的区域检测模型训练方法的一种流程示意图；

图5为本发明实施例提供的置信度模型训练方法的一种流程示意图；

图6为本发明实施例提供的区域确定装置的一种结构示意图；

图7为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

本发明实施例提供了一种区域确定方法及装置，下面先对本发明实施例中涉及的概念进行说明。

形态学梯度化计算是指按照以下步骤对图像进行处理得到差值图像的过程：

分别对图像进行膨胀和腐蚀的形态学处理，然后用膨胀后的图像减去腐蚀后的图像，得到差值图像。

在对图像进行膨胀和腐蚀的形态学处理时，可以选用3×3的卷积核作为特征检测器。

神经网络模型：由大量的、简单的处理单元广泛地互相连接而形成的复杂网络系统。其中，针对一个参数值为离散的两种情况的参数，输出为该参数某一种取值的概率的神经网络模型，为二分类神经网络模型。

下面通过具体实施例，对本发明实施例提供的区域确定方法进行详细说明。

参见图1，图1为本发明实施例提供的区域确定方法的一种流程示意图，包括如下步骤：

步骤S101、对待识别图像进行形态学梯度化计算，得到第一梯度图。

待识别图像中包含字符，待识别图像可以为灰度图像，也可以为彩色图像。图2为本发明实施例提供的银行卡图像形态学梯度化处理效果图，图2中的左图为待识别图像的灰度图。在图2中，右上和右下为采用不同的方式得到的第一梯度图，右上的梯度图为直接形态学梯度化得到的，右下的梯度图为进行减弱背景图案干扰处理得到的。

对待识别图像进行形态学梯度化计算时，在一种实现方式中，可以先获取待识别图像的灰度分量图，再对灰度分量图进行形态学梯度化计算，得到第一梯度图；在另一种实现方式中，将待识别图像分为灰度分量和色度分量，分别进行形态学梯度化计算，再对得到的两种梯度图进行差运算，得到第一梯度图。

本发明实施例仅仅以上述得到第一梯度图的方式为例进行说明，并不对本发明构成限定。

步骤S102、分别将第一梯度图的每一个像素行输入至区域检测模型中，得到各个像素行在待识别图像中对应的像素行位于包含字符的图像区域的第一概率。

区域检测模型为：预先使用第一样本梯度图中每一个像素行对预设的神经网络模型进行训练得到的二分类神经网络模型。

第一样本梯度图为：对第一样本图像进行形态学梯度化计算得到的梯度图，其中，第一样本图像可以为灰度图像，也可以为彩色图像。

第一概率为所输入的像素行在待识别图像中所对应的像素行位于包含字符的图像区域的概率，数值可以介于0和1之间。

输入至区域检测模型的像素行可以由第三预设数量个像素组成，第三预设数量可以取值为240或300等数值。如果第一梯度图的像素行，其像素数量大于第三预设数量，可以对第一梯度图进行缩小处理，使得第一梯度图的宽度为第三预设数量个像素；如果第一梯度图的像素行，其像素数量小于第三预设数量，可以使用像素将像素行补全，补全所用的像素的像素值为：所表示的梯度值小于预设阈值的像素值。如果在第一梯度图中，从白色到黑色所表示的梯度值依次由大到小，那么在第一梯度图的像素行的像素数量小于第三预设数量时，可以使用像素值表示为黑色的像素将该像素行补全成像素数量为第三预设数量的像素行。

步骤S103、计算第一梯度图中各连续第一预设数量个像素行的第一概率的和值。

第一预设数量表示所确定的包含字符的图像区域高多少个像素，第一预设数量可以取值27或30等。如果将连续第一预设数量个像素行作为一组像素行，那么各连续第一预设数量个像素行表示：可以重复选中像素行的多组连续第一预设数量个像素行；连续表示：一组像素行中的各个像素行两两相邻。

例如，第一预设数量的取值为27时，第一梯度图中各连续27个像素行可以表示为：第1行到第27行、第2行到第28行、第3行到第29行……

步骤S104、确定所得到的第一概率的最大和值对应的第一预设数量个像素行在待识别图像中对应的区域，作为第一区域。

步骤S105、根据第一区域，确定包含字符的图像区域。

一种实现方式中，可以直接将第一区域确定为包含字符的图像区域；另一种实现方式中，可以将第一区域与其他区域作比较，选取合适的区域，确定为包含字符的图像区域。

本实施例提供的区域确定方法，可以先将形态学梯度化的待识别图像的像素行输入到预先训练得到的二分类神经网络模型中，得到待识别图像中的像素行位于包含字符的图像区域的概率，再计算各连续预设数量个像素行的概率和值，然后将概率和值最大的连续预设数量个像素行所在的区域确定为包含字符的图像区域。本实施例提供的方案中，不再采用二值化这种丢失图像信息较多的处理方式，而是使用经过大量样本训练过的神经网络模型，对形态学梯度化的图像进行检测。字符和背景图案的差别特征作为样本对神经网络进行训练，使得模型能够有效的区分需要识别的字符和背景图案，从而提高所确定出的、包含字符的图像区域的准确度。

本发明的一种实现方式中，上述步骤S102中，对待识别图像进行形态学梯度化计算，得到第一梯度图时，可以先获得待识别图像的灰度分量图像和色度分量图像；再分别对灰度分量图像和色度分量图像进行形态学梯度化计算，得到灰度分量梯度图和色度分量梯度图；然后对灰度分量梯度图和色度分量梯度图进行差运算，得到第一梯度图。

如图2所示，本实现方式得到的第一梯度图为图2中的右下图。

基于上述待识别图像所采用的色度空间，可以获取不止一张色度分量图像，每张色度分量图像表示上述待识别图像在一种色度上的分量。对待识别图像进行形态学梯度化计算后，得到多张色度分量梯度图，然后对灰度分量梯度图和多张色度分量梯度图进行差运算，得到第一梯度图。如何对灰度分量梯度图和多张色度分量梯度图进行差运算，在后续实施例中详述，这里暂不赘述。

在获得待识别图像的灰度分量图像和色度分量图像时，可以采用YCbCr色彩空间模型，获取待识别图像的Y分量作为灰度分量图像，获取待识别图像的Cb分量和Cr分量作为两张色度分量图像。

本实现方式中，将待识别图像分为灰度分量和色度分量，分别进行形态学梯度化计算，再对得到的两种梯度图进行差运算。形态学梯度化得到的梯度图反应了图像中的图案边缘，对于想要识别的内容的色彩不够丰富，而背景图案色彩丰富的情况，本实现方式可以减弱背景图案对于确定包含字符的图像区域的干扰，提高所确定出的区域的准确度。

基于上述实现方式，本发明的另一种实现方式中，对灰度分量梯度图和色度分量梯度图进行差运算，得到第一梯度图时，可以先对色度分量梯度图进行二值化处理，得到色度分量二值图；再确定灰度分量梯度图中第一像素点的像素值为第一预设像素值，得到第一梯度图。

第一预设像素值为：所表示的梯度值小于预设阈值的像素值。

第一像素点为：与色度分量二值图中像素值为第二预设像素值的像素点相对应的、灰度分量梯度图中的像素点。

第二预设像素值为：色度分量二值图中背景像素点的像素值。

在确定灰度分量梯度图中第一像素点的像素值为第一预设像素值时，如果第一像素点的像素值原本就为第一预设像素值，那么不改变像素值，如果第一像素点的像素值不为第一预设像素值，那么将第一像素点的像素值改变为第一预设像素值。

如果在形态学化计算得到灰度分量梯度图和色度分量梯度图时，使用白色表示梯度值大，使用黑色表示梯度值小，使用灰色表示在黑白两色的梯度值之间的话，第一预设像素值可以为使得像素呈现黑色的像素值。

由色度分量梯度图二值化得到的色度分量二值图，其中的像素点只有两种像素值：一种表示原本的色度分量梯度图中的梯度值较大，一种表示原本的色度分量梯度图中的梯度值较小，表示色度分量梯度图中的梯度值较大的像素点表示的是为了方便识别而需要去除的背景图案，所以，表示原本的色度分量梯度图中的梯度值较大的像素值为第二预设像素值。

色度分量二值图和灰度分量梯度图均由待识别图像经过图像处理得到，如果得到色度分量二值图和灰度分量梯度图的图像处理过程，均没有改变图像的尺寸，那么与色度分量二值图中的像素点相对应的、灰度分量梯度图中的像素点，为像素点坐标相同的像素点；如果得到色度分量二值图和灰度分量梯度图的图像处理过程，按照一定规则改变了图像的尺寸，那么与色度分量二值图中的像素点相对应的、灰度分量梯度图中的像素点，为像素点坐标按照上述规则相对应的像素点。

如果色度分量图像有多张图像，每一张图像对应不同色度分量，那么色度分量梯度图和色度分量二值图，都有多张且每一张对应不同的色度分量。这种情况下，第一像素点为：与任何一张色度分量二值图中像素值为第二预设像素值的像素点相对应的、灰度分量梯度图中的像素点。对于灰度分量梯度图中的像素点，与其相对应的多张色度分量二值图中像素点中，只要有一个像素点的像素值为第二预设像素值，就将灰度分量梯度图中的该像素点，确定为第一预设像素值。

例如：在灰度分量梯度图中，第一预设像素值可以为0，其所表示的颜色可以为黑色；在Cb分量二值图和Cr分量二值图中，第二预设像素值可以为1，其所表示的颜色可以为白色，其中，Cb分量二值图和Cr分量二值图均为色度分量二值图，而且图的尺寸和灰度分量梯度图相同；所以，本实施例中，对灰度分量梯度图和色度分量梯度图进行差运算，可以包括如下步骤：

步骤A、分别确定Cb分量二值图和Cr分量二值图中像素值为1的点的坐标，作为第一坐标和第二坐标；

步骤B、在灰度分量梯度图中，将坐标为第一坐标和第二坐标的像素点的像素值确定为0。

本实现方式中，通过二值化选中色度分量梯度图中表示背景的像素点，确定其在灰度分量梯度图中对应的像素点的像素值为表示梯度低的像素值，从而完成灰度分量梯度图和色度分量梯度图之间的差运算。

图3所示为本发明实施例提供的区域确定方法的另一种流程示意图，具体包括如下步骤：

步骤S301、获得待识别图像的灰度分量图像和色度分量图像。

步骤S302、分别对灰度分量图像和色度分量图像进行形态学梯度化计算，得到灰度分量梯度图和色度分量梯度图。

步骤S303、对灰度分量梯度图和色度分量梯度图进行差运算，得到第一梯度图。

步骤S304、分别将第一梯度图的每一个像素行输入至区域检测模型中，得到各个像素行在待识别图像中对应的像素行位于包含字符的图像区域的第一概率。

步骤S305、计算第一梯度图中各连续第一预设数量个像素行的第一概率的和值。

步骤S306、确定所得到的最大和值对应的第一预设数量个像素行在待识别图像中对应的区域，作为第一区域。

上述步骤S301-S306所提及的内容已在前述各个实施例中进行详细说明，这里不再赘述。

步骤S307、分别将灰度分量梯度图的每一个像素行输入至区域检测模型中，得到各个像素行在待识别图像中对应的像素行位于包含字符的图像区域的第二概率。

本步骤的区域检测模型与步骤S304的区域检测模型相同，直接将灰度分量梯度图的像素行输入至区域检测模型。输入至区域检测模型的像素行可以由第三预设数量个像素组成，第三预设数量可以取值为240或300等数值。如果灰度分量梯度图的像素行，其像素数量大于第三预设数量，可以对灰度分量梯度图进行缩小处理，使得灰度分量梯度图的宽度为第三预设数量个像素；如果灰度分量梯度图的像素行，其像素数量小于第三预设数量，可以使用像素将像素行补全，补全所用的像素的像素值为：所表示的梯度值小于预设阈值的像素值。如果在灰度分量梯度图中，从白色到黑色所表示的梯度值依次由大到小，那么在第一梯度图的像素行的像素数量小于第三预设数量时，可以使用像素值表示为黑色的像素将该像素行补全成像素数量为第三预设数量的像素行。

步骤S308、计算灰度分量梯度图中各连续第一预设数量个像素行的第二概率的和值。

计算第二概率的和值的方法与图1的步骤S103中计算第一概率的和值的方法相同。

步骤S309、确定所得到的第二概率的最大和值对应的第一预设数量个像素行在待识别图像中对应的区域，作为第二区域。

如图2所示，右下图在第一梯度图上标注了所识别到的银行卡号的位置，右下图中画出的多个矩形位于第一区域内，右上图在灰度分量梯度图上标注了所识别到的银行卡号的位置，右上图中画出多个矩形位于第二区域内。

以下步骤为计算并比较第一区域和第二区域为包含字符的图像区域的置信度，如果第二区域和第一区域完全相同，那么可以直接将这个区域作为包含字符的图像区域，不需要再计算置信度了。

步骤S310、将第一区域和第二区域分别划分为高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域。

如果在从待识别图像得到第一梯度图和灰度分量梯度图的过程中，图的尺寸都没有变化，那么第一概率的最大和值在待识别图像中对应的区域所对应的第一区域，和第二概率的最大和值在待识别图像中对应的区域所对应的第二区域，高度均为第一预设数量。

第一预设数量可以取值为27或30等数值，第二预设数量可以取值为19或20等数值。如果第一区域或第二区域的高度大于第一预设数量个像素，可以对第一梯度图或灰度分量梯度图进行缩小处理，使得第一梯度图或灰度分量梯度图的高度为第一预设数量个像素；如果第一区域或第二区域的高度小于第一预设数量个像素，可以使用像素将子区域的高度补全，补全所用的像素的像素值为所表示的梯度值小于预设阈值的像素值。如果在第一梯度图或灰度分量梯度图中，从白色到黑色所表示的梯度值依次由大到小，那么在第一区域或第二区域的高度小于第一预设数量个像素时，可以使用像素值表示为黑色的像素将第三区域和第四区域补全高度为第一预设数量个像素的区域。

将第一区域或第二区域的高度确定为第一预设数量个像素后，可以从左到右每隔第三预设数量个像素划分为一个子区域，划分到最右侧，对于宽度不足第三预设数量的部分，不将其划分为子区域。

步骤S311、分别将每一子区域输入至置信度模型中，得到该子区域为单字符图像区域的置信度。

置信度模型为：预先使用第二样本梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的多个单字符图像区域对预设的神经网络模型进行训练得到的二分类神经网络模型。

第二样本梯度图为：对第二样本图像进行形态学梯度化计算得到的梯度图。

置信度的取值可以为0到1之间的数值。

步骤S312、分别计算第一区域与第二区域所包含子区域的置信度的和值，将置信度的和值较大的区域确定为包含字符的图像区域。

如果第一区域与第二区域所包含子区域的置信度的和值相等，那么可以将经过减弱背景图案干扰处理得到的第一区域确定为包含字符的图像区域。

本实施例提供的方案中，先分别采用两种不同的预处理，得到灰度梯度图和减弱背景图案干扰的第一梯度图，再基于灰度梯度图和第一梯度图分别确定出可能包含字符的第一区域和第二区域，然后将置信度较大的区域确定为包含字符的图像区域。确定包含字符的图像区域时，使用灰度梯度图和使用减弱背景图案干扰的第一梯度图，各有优劣。分别用两种方式确定得到区域，再通过测试挑选效果好的那一个作为最终确定的区域，可以提高所确定出的区域的准确度。

图4所示为本发明实施例提供的区域检测模型训练方法的一种流程示意图，应用上述区域检测模型可以得到一个像素行位于包含字符的图像区域的概率，其训练方法具体包括如下步骤：

步骤S401、获取包含字符的第一样本图像。

上述第一样本图像可以为灰度图像，也可以为彩色图像。

步骤S402、对第一样本图像进行形态学梯度化计算，得到第一样本梯度图。

处理第一样本图像得到第一样本梯度图的方式可以与步骤S101处理待识别图像得到第一梯度图的方式相同。

步骤S403、将第一样本梯度图中与字符像素行对应的像素行作为正样本像素行，将第一样本梯度图中与非字符像素行对应的像素行作为负样本像素行。

字符像素行为：第一样本图像中字符所在区域中的像素行。

非字符像素行为：第一样本图像中字符所在区域外、且与字符所在区域等大小的区域中的像素行。

正样本像素行可以是标注输出结果为1的训练样本，负样本像素行可以是标注输出结果为0的训练样本。

作为样本的像素行可以由第三预设数量个像素组成，第三预设数量可以取值为240或300等数值。如果作为样本的像素行，其像素数量大于第三预设数量，可以对第一样本梯度图进行缩小处理，使得第一样本梯度图的宽度为第三预设数量个像素；如果作为样本的像素行，其像素数量小于第三预设数量，可以使用像素将像素行补全，补全所用的像素的像素值为：所表示的梯度值小于预设阈值的像素值。如果在第一样本梯度图中，从白色到黑色所表示的梯度值依次由大到小，那么在样本像素行的像素数量小于第三预设数量时，可以使用像素值表示为黑色的像素将该像素行补全成像素数量为第三预设数量的像素行。

步骤S404、采用正样本像素行和负样本像素行对预设的神经网络模型进行训练，得到用于检测图像中像素行是否位于包含字符的图像区域的二分类神经网络模型，作为区域检测模型。

将上述像素行作为模型的输入，将表征上述像素行为正样本像素行或负样本像素行的标注作为模型的输出，通过对预设的神经网络模型的调试，确定模型参数的取值，完成对模型的训练。

本发明的一种实现方式中，上述预设的神经网络模型可以是采用CAFFE(Convolution Architecture for Fast Feature Embedding，快速特征嵌入的卷积架构)构建的模型。

为了检测第一梯度图的像素行是否位于包含字符的图像区域，本发明实施例提供了一种二分类神经网络模型的训练方法，可以将第一梯度图的像素行输入至训练得到的模型中，得到该像素行在待识别图像中对应的像素行位于包含字符的图像区域的概率。使用经过包含字符的图像训练过的神经网络模型来检测，能够有效的区分需要识别的字符和背景图案。

本发明的一种实现方式中，上述步骤S402中，对第一样本图像进行形态学梯度化计算，得到第一样本梯度图时，可以先分别获得第一样本图像的灰度分量和色度分量，作为第一灰度样本图和色度样本图；再分别对第一灰度样本图和色度样本图进行形态学梯度化计算，得到第一灰度梯度样本图和色度梯度样本图；然后对第一灰度梯度样本图和色度梯度样本图进行差运算，得到第一样本梯度图。

对于需要减弱色彩相对丰富的背景图案的干扰的情况，可以在训练得到区域检测模型的过程中，对训练样本同样做减弱背景图案干扰的处理，训练样本的具体方法和上述实施例中处理待识别图像的方法相同。

本实现方式中，将第一样本图像分为灰度分量和色度分量，分别进行形态学梯度化计算，再对得到的梯度图进行差运算，可以减弱色彩相对丰富的背景图案的干扰。使用区域检测模型时，向上述模型所输入的图像是减弱色彩相对丰富的背景图案的干扰的图像，所以在训练区域检测模型时，使用减弱色彩相对丰富的背景图案的干扰的图像，有助于提升训练得到的模型的性能。

图5所示为本发明实施例提供的置信度模型训练方法的一种流程示意图，应用上述置信度模型可以得到一个区域为单字符图像区域的置信度，其训练方法具体包括如下步骤：

步骤S501、获取包含字符的第二样本图像。

上述第二样本图像可以为灰度图像，也可以为彩色图像。

步骤S502、获得第二样本图像的灰度分量，作为第二灰度样本图。

步骤S503、对第二灰度样本图进行形态学梯度化计算，得到第二灰度梯度样本图。

步骤S504、对第二灰度梯度样本图进行直方图均衡化处理，得到第二样本梯度图。

步骤S505、将第三区域划分成多个高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域，作为正样本区域；将第四区域划分成多个高度为第一预设数量个像素点、宽度为第二预设数量个像素点的子区域，作为负样本区域。

第三区域为：第二样本梯度图中与第二样本图像中包含字符的图像区域相对应的区域。

第四区域为：在第二样本梯度图中，在第三区域外且与第三区域等大小的区域。

正样本区域可以是标注输出结果为1的训练样本，负样本区域可以是标注输出结果为0的训练样本。

第一预设数量可以取值为27或30等数值，第二预设数量可以取值为19或20等数值。如果第三区域和第四区域的高度大于第一预设数量个像素，可以对第二样本梯度图进行缩小处理，使得第二样本梯度图的高度为第一预设数量个像素；如果第三区域和第四区域的高度小于第一预设数量个像素，可以使用像素将子区域的高度补全，补全所用的像素的像素值为所表示的梯度值小于预设阈值的像素值。如果在第二梯度图中，从白色到黑色所表示的梯度值依次由大到小，那么在第三区域和第四区域的高度小于第一预设数量个像素时，可以使用像素值表示为黑色的像素将第三区域和第四区域补全高度为第一预设数量个像素的区域。

将第三区域和第四区域的高度确定为第一预设数量个像素后，可以从左到右每隔第三预设数量个像素划分为一个子区域，划分到最右侧，对于宽度不足第三预设数量的部分，不将其划分为子区域。

步骤S506、采用正样本区域和负样本区域对预设的神经网络模型进行训练，得到用于检验区域是否是包含字符的图像区域的二分类神经网络模型，作为置信度模型。

将上述区域作为模型的输入，将表征上述区域为正样本区域或负样本区域的标注作为模型的输出，通过对预设的神经网络模型的调试，确定模型参数的取值，完成对模型的训练。

本发明的一种实现方式中，上述预设的神经网络模型可以是采用CAFFE构建的模型。

为了检验之前步骤得到的图像区域是否为包含字符的图像区域，本发明实施例提供了一种二分类神经网络模型的训练方法，可以将第一区域和第二区域划分出的子区域输入至训练得到的模型中，得到该子区域为单字符图像区域的置信度。使用经过包含字符的图像训练过的神经网络模型来检测，能够有效的区分需要识别的字符和背景图案。

基于同一发明构思，根据本发明上述实施例提供的区域确定方法，相应地，本发明实施例还提供了一种区域确定装置，其结构示意图如图6所示，具体包括：

梯度图获得模块601，用于对待识别图像进行形态学梯度化计算，得到第一梯度图；

第一概率获得模块602，用于分别将所述第一梯度图的每一个像素行输入至区域检测模型中，得到各个像素行在所述待识别图像中对应的像素行位于包含字符的图像区域的第一概率，其中，所述区域检测模型为：预先使用第一样本梯度图中每一个像素行对预设的神经网络模型进行训练得到的二分类神经网络模型，所述第一样本梯度图为：对第一样本图像进行形态学梯度化计算得到的梯度图；

第一和值计算模块603，用于计算所述第一梯度图中各连续第一预设数量个像素行的第一概率的和值；

第一区域确定模块604，用于确定所得到的第一概率的最大和值对应的第一预设数量个像素行在所述待识别图像中对应的区域，作为第一区域；

第二区域确定模块605，用于根据所述第一区域，确定包含字符的图像区域。

本发明实施例提供的区域确定装置，可以先将形态学梯度化的待识别图像的像素行输入到预先训练得到的二分类神经网络模型中，得到待识别图像中的像素行位于包含字符的图像区域的概率，再计算各连续预设数量个像素行的概率和值，然后将概率和值最大的连续预设数量个像素行所在的区域确定为包含字符的图像区域。本发明实施例提供的方案中，不再采用二值化这种丢失图像信息较多的处理方式，而是使用经过大量样本训练过的神经网络模型，对形态学梯度化的图像进行检测。字符和背景图案的差别特征作为样本对神经网络进行训练，使得模型能够有效的区分需要识别的字符和背景图案，从而提高所确定出的、包含字符的图像区域的准确度。

本发明的一种实现方式中，所述梯度图获得模块601，包括：

本发明的一种实现方式中，所述装置还包括：

所述第二区域确定模块605，包括：

本实现方式中，先分别采用两种不同的预处理，得到灰度梯度图和减弱背景图案干扰的第一梯度图，再基于灰度梯度图和第一梯度图分别确定出可能包含字符的第一区域和第二区域，然后将置信度较大的区域确定为包含字符的图像区域。确定包含字符的图像区域时，使用灰度梯度图和使用减弱背景图案干扰的第一梯度图，各有优劣。分别用两种方式确定得到区域，再通过测试挑选效果好的那一个作为最终确定的区域，可以提高所确定出的区域的准确度。

本发明的一种实现方式中，所述第一概率获得模块602包括以下子模块，用于训练得到所述区域检测模型：

第一图像获取子模块，用于获取包含字符的第一样本图像；

为了检测第一梯度图的像素行是否位于包含字符的图像区域，本实现方式提供了一种二分类神经网络模型的训练方法，可以将第一梯度图的像素行输入至训练得到的模型中，得到该像素行在待识别图像中对应的像素行位于包含字符的图像区域的概率。使用经过包含字符的图像训练过的神经网络模型来检测，能够有效的区分需要识别的字符和背景图案。

图像获取单元，用于获取包含字符的第二样本图像；

基于同一发明构思，根据本发明上述实施例提供的区域确定方法，相应地，本发明实施例还提供了一种电子设备，如图7所示，包括处理器701、通信接口702、存储器703和通信总线704，其中，处理器701，通信接口702，存储器703通过通信总线704完成相互间的通信，

存储器703，用于存放计算机程序；

处理器701，用于执行存储器703上所存放的程序时，实现上述实施例中任一区域确定方法的步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例提供的区域确定电子设备，可以先将形态学梯度化的待识别图像的像素行输入到预先训练得到的二分类神经网络模型中，得到待识别图像中的像素行位于包含字符的图像区域的概率，再计算各连续预设数量个像素行的概率和值，然后将概率和值最大的连续预设数量个像素行所在的区域确定为包含字符的图像区域。本发明实施例提供的方案中，不再采用二值化这种丢失图像信息较多的处理方式，而是使用经过大量样本训练过的神经网络模型，对形态学梯度化的图像进行检测。字符和背景图案的差别特征作为样本对神经网络进行训练，使得模型能够有效的区分需要识别的字符和背景图案，从而提高所确定出的、包含字符的图像区域的准确度。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一区域确定方法的步骤。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一区域确定方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种区域确定方法，其特征在于，所述方法包括：

对待识别图像进行形态学梯度化计算，得到第一梯度图；

根据所述第一区域，确定包含字符的图像区域。

2.根据权利要求1所述的方法，其特征在于，所述对待识别图像进行形态学梯度化计算，得到第一梯度图，包括：

获得待识别图像的灰度分量图像和色度分量图像；

3.根据权利要求2所述的方法，其特征在于，在所述分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算，得到灰度分量梯度图和色度分量梯度图之后，所述方法还包括：

所述根据所述第一区域，确定包含字符的图像区域，包括：

4.根据权利要求1-3中任一项所述的方法，其特征在于，采用以下方式训练得到所述区域检测模型：

获取包含字符的第一样本图像；

5.根据权利要求4所述的方法，其特征在于，所述对所述第一样本图像进行形态学梯度化计算，得到第一样本梯度图，包括：

6.根据权利要求3所述的方法，其特征在于，采用以下方式训练得到所述置信度模型：

获取包含字符的第二样本图像；

获得所述第二样本图像的灰度分量，作为第二灰度样本图；

7.根据权利要求2或3所述的方法，其特征在于，所述对所述灰度分量梯度图和所述色度分量梯度图进行差运算，得到第一梯度图，包括：

8.一种区域确定装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，所述梯度图获得模块，包括：

10.根据权利要求9所述的装置，其特征在于，所述装置还包括：

所述第二区域确定模块，包括：

11.根据权利要求8-10中任一项所述的装置，其特征在于，所述第一概率获得模块包括以下子模块，用于训练得到所述区域检测模型：

第一图像获取子模块，用于获取包含字符的第一样本图像；

12.根据权利要求11所述的装置，其特征在于，所述第三梯度图获得子模块，包括：

13.根据权利要求10所述的装置，其特征在于，所述置信度获得子模块包括以下单元，用于训练得到所述置信度模型：

图像获取单元，用于获取包含字符的第二样本图像；

14.根据权利要求9或10所述的装置，其特征在于，所述第二梯度图获得子模块，包括：

15.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-7任一所述的方法步骤。