CN109726722A - 一种字符分割方法及装置 - Google Patents
一种字符分割方法及装置 Download PDFInfo
- Publication number
- CN109726722A CN109726722A CN201811577593.2A CN201811577593A CN109726722A CN 109726722 A CN109726722 A CN 109726722A CN 201811577593 A CN201811577593 A CN 201811577593A CN 109726722 A CN109726722 A CN 109726722A
- Authority
- CN
- China
- Prior art keywords
- character
- distribution
- image
- discreet
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
本发明实施例提供了一种字符分割方法及装置,涉及图像识别领域,其中,上述方法包括:确定待分割图像中字符的编组方式,作为第一编组方式;统计待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量;获得编组方式为第一编组方式的每一字符排布中字符像素点的第一预估数量分布;确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布;按照第二预估数量分布对应的字符排布对待分割图像进行字符分割。应用本发明实施例提供的方案进行字符分割时,能够提高字符分割的准确度。
Description
技术领域
本发明涉及图像识别技术领域,特别是涉及一种字符分割方法及装置。
背景技术
在识别图像中所包含的数字、字母等字符时,往往需要先确定包含字符的图像区域,再对上述图像区域进行字符分割,确定单个字符所在区域,然后逐一对单个字符所在区域进行字符识别。其中,进行字符分割时,一般按照预设的尺寸对上述图像区域进行分割,将分割得到的各个区域作为单个字符所在区域。
以银行卡图像为例,在现有技术中,从银行卡的图像中识别银行卡号时,可以先确定银行卡号所在的区域,再采用设置有字符预设尺寸的字符分割模板,从上述区域中逐一确定卡号中的每一个数字所在的区域,然后对每一个数字进行识别,得到银行卡号的识别结果。错误的字符分割会导致单个卡号数字的识别结果与真实情况大相径庭,银行卡号字符的分割精度直接关系到字符识别的准确度,是银行卡号识别成功与否的关键因素之一。
发明人在实现本发明的过程中发现,现有技术至少存在如下问题:在实际应用场景中,不同银行卡的卡号数字大小不同,卡号数字之间间距不同;对于相同类型的银行卡,如果拍摄的方式不同,所得到的银行卡图像上的卡号数字大小、卡号数字之间间距也会不同;如果拍摄银行卡时卡面没有正对着镜头,卡面和正对镜头的位置之间存在偏角,同一银行卡图像中的不同的卡号数字的大小也会不同。现有技术中,采用预设尺寸对图像进行分割的方法,不能适应复杂多变的实际应用场景,导致字符分割得到的单个字符所在区域准确度低,从而影响识别的准确度。
发明内容
本发明实施例的目的在于提供一种字符分割方法及装置,以实现提高字符分割的准确度。具体技术方案如下:
本发明实施例提供一种字符分割方法,包括:
确定待分割图像中字符的编组方式,作为第一编组方式;
统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;
获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,其中,每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同;
确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,其中,所述第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布;
按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割。
本发明的一种实现方式中,所述获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,包括:
按照以下方式获得每一字符排布中字符像素点的第一预估数量分布:
获得字符排布中字符的字符宽度,作为第一宽度,并获得字符排布中字符的字符组间距,作为第一间距;
基于所述第一宽度,确定单个字符中字符像素点的第三预估数量分布,其中,所述第三预估数量分布为:预设的预估数量分布集内宽度为所述第一宽度的第一图像的像素单元中字符像素点的数量分布,所述预估数量分布集为:与每一第二分布差异度最小的分布所构成的集合,所述第二分布为:所述第一图像的像素单元中字符像素点的数量分布,各个第一图像为:分别包含备选字符集中每一字符的、预设宽度的图像;
按照所述第一编组方式,依次对所述第三预估数量分布和无字符分布进行组合,将组合结果作为字符排布的第一预估数量分布,其中,所述无字符分布为:宽度为所述第一间距的无字符图像的像素单元中字符像素点的数量分布。
本发明的一种实现方式中,所述获得字符排布中字符的字符组间距,作为第一间距,包括:
获得用于表示字符组间距与字符宽度之间比例关系的第一数值;
计算所述第一宽度和所述第一数值的乘积,得到字符排布中字符的字符组间距,作为第一间距。
本发明的一种实现方式中,所述确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,包括:
按照以下表达式计算所获得的每一第一预估数量分布与第一分布之间的差异度:
其中,D表示一第一预估数量分布与所述第一分布之间的差异度,i表示像素单元的标号,n表示像素单元的数量,yi表示第一预估数量分布中第i个元素的数值,xi表示所述第一分布中第i个像素单元中字符像素点的数量;
确定计算得到的差异度中最小差异度对应的第一预估数量分布,作为第二预估数量分布。
本发明的一种实现方式中,在所述确定待分割图像中字符的编组方式之前,所述方法还包括:
获得待进行字符识别的图像的灰度分量图像和色度分量图像;
分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图;
对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像。
本发明的一种实现方式中,所述对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像,包括:
对所述色度分量梯度图进行二值化处理,得到色度分量二值图;
确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值,得到待分割图像,其中,所述第一预设像素值为:所表示的梯度值小于第一预设阈值的像素值,所述第一像素点为:与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点,所述第二预设像素值为:所述色度分量二值图中背景像素点的像素值。
本发明的一种实现方式中,在所述分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图之后,所述方法还包括:
统计所述灰度分量梯度图的每一像素单元中字符像素点的数量,作为第二像素点数量;
在所述获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布之后,所述方法还包括:
确定所获得第一预估数量分布中与第三分布之间差异度最小的第一预估数量分布,作为第四预估数量分布,其中,所述第三分布为:由所述第二像素点数量确定的字符像素点数量的分布;
按照所述第四预估数量分布对应的字符排布对所述灰度分量梯度图进行字符分割,得到第一分割区域;
在所述按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割之后,所述方法还包括:
分别将每一第一分割区域和每一第二分割区域输入至置信度模型中,得到每一第一分割区域、每一第二分割区域为单字符区域的置信度,其中,各个第二分割区域为:按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割得到的区域,所述置信度模型为:预先使用样本区域对预设的神经网络模型进行训练得到的、用于检测区域是否为单字符区域的二分类神经网络模型,所述样本区域为:对样本图像进行形态学梯度化计算得到的梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的区域;
计算各个第一分割区域的置信度的和值,并计算各个第二分割区域的置信度的和值;
将计算得到的和值中最大和值对应的分割区域确定为所述待进行字符识别的图像的字符分割结果。
本发明的一种实现方式中,采用以下方式训练得到所述置信度模型:
获取包含字符的样本图像;
对所述样本图像的灰度分量进行形态学梯度化计算,得到样本梯度图;
将第一图像区域划分成高度为第一预设数量个像素点、宽度为第二预设数量个像素点的单字符区域,作为正样本区域,其中,所述第一图像区域为:所述样本梯度图中与所述样本图像中包含字符的图像区域相对应的区域;
在样本图像中对各个正样本区域进行偏移处理得到负样本区域;
采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练,得到用于检测区域是否是为单字符区域的二分类神经网络模型,作为所述置信度模型。
本发明实施例还提供一种字符分割装置,包括:
编组方式确定模块,用于确定待分割图像中字符的编组方式,作为第一编组方式;
第一数量统计模块,用于统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;
分布获得模块,用于获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,其中,每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同;
第一分布确定模块,用于确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,其中,所述第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布;
图像分割模块,用于按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割。
本发明的一种实现方式中,所述分布获得模块包括:宽度获得子模块、第一分布确定子模块和分布获得子模块;
所述宽度获得子模块、所述第一分布确定子模块和所述分布获得子模块用于获得每一字符排布中字符像素点的第一预估数量分布;
所述宽度获得子模块,用于获得字符排布中字符的字符宽度,作为第一宽度,并获得字符排布中字符的字符组间距,作为第一间距;
所述第一分布确定子模块,用于基于所述第一宽度,确定单个字符中字符像素点的第三预估数量分布,其中,所述第三预估数量分布为:预设的预估数量分布集内宽度为所述第一宽度的第一图像的像素单元中字符像素点的数量分布,所述预估数量分布集为:与每一第二分布差异度最小的分布所构成的集合,所述第二分布为:所述第一图像的像素单元中字符像素点的数量分布,各个第一图像为:分别包含备选字符集中每一字符的、预设宽度的图像;
所述分布获得子模块,用于按照所述第一编组方式,依次对所述第三预估数量分布和无字符分布进行组合,将组合结果作为字符排布的第一预估数量分布,其中,所述无字符分布为:宽度为所述第一间距的无字符图像的像素单元中字符像素点的数量分布。
本发明的一种实现方式中,所述宽度获得子模块包括:
数值获得单元,用于获得用于表示字符组间距与字符宽度之间比例关系的第一数值;
乘积计算单元,用于计算所述第一宽度和所述第一数值的乘积,得到字符排布中字符的字符组间距,作为第一间距。
本发明的一种实现方式中,所述第一分布确定模块包括:
差异度计算子模块,用于按照以下表达式计算所获得的每一第一预估数量分布与第一分布之间的差异度:
其中,D表示一第一预估数量分布与所述第一分布之间的差异度,i表示像素单元的标号,n表示像素单元的数量,yi表示第一预估数量分布中第i个元素的数值,xi表示所述第一分布中第i个像素单元中字符像素点的数量;
第二分布确定子模块,用于确定计算得到的差异度中最小差异度对应的第一预估数量分布,作为第二预估数量分布。
本发明的一种实现方式中,所述装置还包括:
图像获得模块,用于获得待进行字符识别的图像的灰度分量图像和色度分量图像;
第一梯度图获得模块,用于分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图;
第二梯度图获得模块,用于对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像。
本发明的一种实现方式中,所述第二梯度图获得模块包括:
第一图像获得子模块,用于对所述色度分量梯度图进行二值化处理,得到色度分量二值图;
第二图像获得子模块,用于确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值,得到待分割图像,其中,所述第一预设像素值为:所表示的梯度值小于第一预设阈值的像素值,所述第一像素点为:与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点,所述第二预设像素值为:所述色度分量二值图中背景像素点的像素值。
本发明的一种实现方式中,所述装置还包括:
第二数量统计模块,用于在所述第一梯度图获得模块得到灰度分量梯度图和色度分量梯度图之后,统计所述灰度分量梯度图的每一像素单元中字符像素点的数量,作为第二像素点数量;
第二分布确定模块,用于在所述分布获得模块获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布之后,确定所获得第一预估数量分布中与第三分布之间差异度最小的第一预估数量分布,作为第四预估数量分布,其中,所述第三分布为:由所述第二像素点数量确定的字符像素点数量的分布;
区域获得模块,用于按照所述第四预估数量分布对应的字符排布对所述灰度分量梯度图进行字符分割,得到第一分割区域;
置信度获得模块,用于在所述图像分割模块按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割之后,分别将每一第一分割区域和每一第二分割区域输入至置信度模型中,得到每一第一分割区域、每一第二分割区域为单字符区域的置信度,其中,各个第二分割区域为:按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割得到的区域,所述置信度模型为:预先使用样本区域对预设的神经网络模型进行训练得到的、用于检测区域是否为单字符区域的二分类神经网络模型,所述样本区域为:对样本图像进行形态学梯度化计算得到的梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的区域;
和值计算模块,用于计算各个第一分割区域的置信度的和值,并计算各个第二分割区域的置信度的和值;
结果确定模块,用于将计算得到的和值中最大和值对应的分割区域确定为所述待进行字符识别的图像的字符分割结果。
本发明的一种实现方式中,所述置信度获得模块包括以下子模块,用于训练得到所述置信度模型:
第三图像获得子模块,用于获取包含字符的样本图像;
梯度图获得子模块,用于对所述样本图像的灰度分量进行形态学梯度化计算,得到样本梯度图;
区域划分子模块,用于将第一图像区域划分成高度为第一预设数量个像素点、宽度为第二预设数量个像素点的单字符区域,作为正样本区域,其中,所述第一图像区域为:所述样本梯度图中与所述样本图像中包含字符的图像区域相对应的区域;
区域获得子模块,用于在样本图像中对各个正样本区域进行偏移处理得到负样本区域;
模型获得子模块,用于采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练,得到用于检测区域是否是为单字符区域的二分类神经网络模型,作为所述置信度模型。
本发明实施例还提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的字符分割方法的步骤。
在本发明实施的又一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的字符分割方法的步骤。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的字符分割方法。
本发明实施例提供的字符分割方法及装置,可以先确定字符编组方式,并统计待分割图像的像素单元中字符像素点的数量,再获得每一字符排布中字符像素点的预估数量分布,然后确定预估数量分布中与所统计的数量组成分布的差异度最小的预估数量分布,最后按照该预估数量分布对应的字符排布对待分割图像进行字符分割。本发明实施例提供的方案中,将图像中存在字符的特征转化成字符像素点数量分布数据,通过待分割图像转化成的字符像素点数量分布与不同的字符分割参数所对应的预估数量分布进行比较,确定差异最小的字符分割参数,和按照默认分割参数直接进行字符分割的现有技术相比,提高了字符分割的准确度。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的字符分割方法的一种流程示意图;
图2a为本发明实施例提供的一种银行卡图像;
图2b为本发明实施例提供的银行卡图像的字符分割示意图;
图3为本发明实施例提供的字符分割方法的另一种流程示意图;
图4为本发明实施例提供的字符分割方法的又一种流程示意图;
图5为本发明实施例提供的第一分割区域和第二分割区域对比图;
图6为本发明实施例提供的置信度模型训练方法的一种流程示意图;
图7为本发明实施例提供的字符分割装置的一种结构示意图;
图8为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
本发明实施例提供了一种字符分割方法及装置,下面先对本发明实施例中涉及的概念进行说明。
单字符区域:表示单个字符所在的区域。在识别图像中的字符时,往往需要对图像中的字符区域进行字符分割,确定单个字符所在区域,然后再逐一对单个字符所在区域进行字符识别。
字符像素点数量的分布:图像中各个像素单元的字符像素点数量的离散分布,可以表示为数组的形式,也可以表示为向量的形式。
编组方式:对于多个字符,连续排列在一起的字符的数量和不连续排列的字符被隔开的情况。
以银行卡的卡号为例,假设,银行卡的卡号包含16个字符,则其编组方式可以为:4-4-4-4,每4个字符连续排列在一起,连续排列的字符串被1个字符的宽度隔开,具体表现为:6200 0000 0000 0000;假设银行卡的卡号包含19个字符,则其编组方式可以为:6-13,每4个字符连续排列在一起,连续排列的字符串被1个字符的宽度隔开,具体表现为:6200000000000000000。
形态学梯度化计算:分别对图像进行膨胀和腐蚀的形态学处理,然后用膨胀后的图像减去腐蚀后的图像,得到差值图像。在对图像进行膨胀和腐蚀的形态学处理时,可以选用3×3的卷积核作为特征检测器。
下面通过具体实施例,对本发明实施例提供的字符分割方法进行详细说明。
参见图1,图1为本发明实施例提供的字符分割方法的一种流程图,包括如下步骤:
步骤S101、确定待分割图像中字符的编组方式,作为第一编组方式。
上述待分割图像可以是一个完整的图像,也可以是一个图像中字符所在的图像区域,上述待分割图像可以为拍摄得到的图像,也可以为对待进行字符识别的图像进行字符分割前预处理后得到的图像。
确定待分割图像中字符的编组方式可以采用基于二值化的水平投影算法,具体步骤可以包括:对待分割图像进行二值化处理;统计所得到的二值图的每一像素列中颜色为白色或黑色的像素点分布;根据统计结果,确定第一编组方式。
在一些应用场景中,字符的编组方式是固定的,例如识别汽车车牌图像时,汽车车牌上的字符编组方式的固定的,对于此类待分割图像,可以直接获取预设的编组方式,作为第一编组方式。
在另一些应用场景中,待分割图像中字符的编组方式与待分割图像中字符的数量相对应,可以先确定上述字符数量,再根据该图像中包含的字符的设定确定出该图像中字符的编组方式。
例如:待进行字符识别的图像为中国银联银行卡的图像,并且包含字符的图像区域为银行卡的卡号区域。当确定出银行卡号的数字数量为16时,可以根据中国银联银行卡号的规律,直接确定银行卡号的编组方式为4-4-4-4,每4个数字连续排列在一起,连续排列的数字串被一个空白区域隔开。当确定出银行卡号的数字数量为18时,可以根据中国银联银行卡号的规律,直接确定银行卡号的编组方式为6-6-6,每6个数字连续排列在一起,连续排列的数字串被一个空白区域隔开。
步骤S102、统计待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量。
上述像素单元可以是像素行,也可以是像素列。上述字符像素点为:属于字符的像素点。如果待分割图像为字符的边缘图像时,上述字符像素点为表示字符边缘的像素点;如果待分割图像为非边缘图像时,上述字符像素点为表示表征字符的全部像素点。
步骤S103、获得编组方式为第一编组方式的每一字符排布中字符像素点的第一预估数量分布。
每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同。字符组间距为相邻的字符组之间的距离,字符组间距可以用像素点的数量来表示。上述字符排布直接决定了要如何对待分割图像进行字符分割。
获取上述字符排布的方式包括但不限于:
(1)直接获取预先设定好的字符排布;
(2)在预先设定的尺寸范围选取不同的尺寸,根据所选取的尺寸得到字符排布。
第一预估数量分布为:预估字符按照第一预估数量分布所对应的字符排布时,其所在图像区域内的每一像素单元中字符像素点的数量。获取第一预估数量分布的方式包括但不限于:
(1)直接获取预先设定好的第一预估数量分布;
(2)获取预先设定好单个字符的预估数量分布,根据所对应的字符排布和字符组间距,组合在一起得到第一预估数量分布,其中,单个字符的预估数量分布表示,一个单字符的图像区域内的每一像素单元中字符像素点的数量。
步骤S104、确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布。
第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布。
计算预估数量分布与第一分布之间差异度时,可以先计算预估数量分布和第一分布中相对应的元素的差值,再将所得到的的差值的绝对值求和,作为差异度;也可以计算预估数量分布和第一分布中每一个相对应的元素的平方和,作为差异度。
一种实现方式中,各个第一预估数量分布和第一分布均为经过归一化处理的分布,使用经过归一化处理的分布来计算差异度,可以避免由于图像尺寸不同导致的字符像素点数量不匹配的情况的发生。消除掉图像尺寸对于字符像素点数量的影响,可以更好的通过字符像素点数量的分布来体现字符像素所组成的形状。
第一预估数量分布和第一分布均为离散分布,因为第一预估数量分布中的元素个数不一定和第一分布中的元素个数相等,所以可以先比较第一预估数量分布中的元素个数和第一分布中的元素个数,将元素个数少的分布,用预设数值补充到和另一个分布的元素个数相等。预设数值可以为0,对于经过归一化处理过的分布,预设数值也可以为0.3或0.5。
步骤S105、按照第二预估数量分布对应的字符排布对待分割图像进行字符分割。
如图2b所示,图2b中的每一白色框表示一个单字符区域。
本发明实施例提供的字符分割方法,可以先确定字符编组方式,并统计待分割图像的像素单元中字符像素点的数量,再获得每一字符排布中字符像素点的预估数量分布,然后确定预估数量分布中与所统计的数量组成分布的差异度最小的预估数量分布,最后按照该预估数量分布对应的字符排布对待分割图像进行字符分割。本发明实施例提供的方案中,将图像中存在字符的特征转化成字符像素点数量分布数据,通过待分割图像转化成的字符像素点数量分布与不同的字符分割参数所对应的预估数量分布进行比较,确定差异最小的字符分割参数,和按照默认分割参数直接进行字符分割的现有技术相比,提高了字符分割的准确度。
本发明的一种实现方式中,上述步骤S104中确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布时,可以先按照以下表达式计算所获得的每一第一预估数量分布与第一分布之间的差异度,再确定计算得到的差异度中最小差异度对应的第一预估数量分布:
其中,D表示一第一预估数量分布与第一分布之间的差异度,i表示像素单元的标号,n表示像素单元的数量,yi表示第一预估数量分布中第i个元素的数值,xi表示第一分布中第i个像素单元中字符像素点的数量。
本实现方式中,计算预估数量分布和第一分布中相对应的元素的差值,再将所得到的的差值的绝对值求和,可以简单直接并且线性化的得到第一预估数量分布与第一分布之间的差异度。
本发明的一种实现方式中,在上述步骤S101之前,可以先获得待进行字符识别的图像的灰度分量图像和色度分量图像;再分别对灰度分量图像和色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图;然后对灰度分量梯度图和色度分量梯度图进行差运算,得到待分割图像。
如图2a和图2b所示,图2a为银行卡图像的灰度分量图像,图2b为应用本实现方式得到的银行卡图像的字符分割结果。
基于上述待进行字符识别的图像所采用的色度空间,可以获取不止一张色度分量图像,每张色度分量图像表示上述待进行字符识别的图像在一种色度上的分量。对待进行字符识别的图像进行形态学梯度化计算后,得到多张色度分量梯度图,然后对灰度分量梯度图和多张色度分量梯度图进行差运算,得到待分割图像。如何对灰度分量梯度图和多张色度分量梯度图进行差运算,在后续实施例中详述,这里暂不赘述。
在获得待进行字符识别的图像的灰度分量图像和色度分量图像时,可以采用YCbCr色彩空间模型,获取待进行字符识别的图像的Y分量作为灰度分量图像,获取待进行字符识别的图像的Cb分量和Cr分量作为两张色度分量图像。
本实现方式中,将待进行字符识别的图像分为灰度分量和色度分量,分别进行形态学梯度化计算,再对得到的两种梯度图进行差运算。形态学梯度化得到的梯度图反应了图像中的图案边缘,对于想要识别的内容的色彩不够丰富,而背景图案色彩丰富的情况,本实现方式可以减弱背景图案对于确定单字符区域的干扰,提高字符分割的准确度。
基于上述实现方式,本发明的另一种实现方式中,对灰度分量梯度图和色度分量梯度图进行差运算,得到待分割图像时,可以先对色度分量梯度图进行二值化处理,得到色度分量二值图;再确定灰度分量梯度图中第一像素点的像素值为第一预设像素值,得到待分割图像。
第一预设像素值为:所表示的梯度值小于预设阈值的像素值。
第一像素点为:与色度分量二值图中像素值为第二预设像素值的像素点相对应的、灰度分量梯度图中的像素点。
第二预设像素值为:色度分量二值图中背景像素点的像素值。
在确定灰度分量梯度图中第一像素点的像素值为第一预设像素值时,如果第一像素点的像素值原本就为第一预设像素值,那么不改变像素值,如果第一像素点的像素值不为第一预设像素值,那么将第一像素点的像素值改变为第一预设像素值。
如果在形态学化计算得到灰度分量梯度图和色度分量梯度图时,使用白色表示梯度值大,使用黑色表示梯度值小,使用灰色表示在黑白两色的梯度值之间的话,第一预设像素值可以为使得像素呈现黑色的像素值。
由色度分量梯度图二值化得到的色度分量二值图,其中的像素点只有两种像素值:一种表示原本的色度分量梯度图中的梯度值较大,一种表示原本的色度分量梯度图中的梯度值较小,表示色度分量梯度图中的梯度值较大的像素点表示的是为了方便识别而需要去除的背景图案,所以,表示原本的色度分量梯度图中的梯度值较大的像素值为第二预设像素值。
色度分量二值图和灰度分量梯度图均由待进行字符识别的图像经过图像处理得到,如果得到色度分量二值图和灰度分量梯度图的图像处理过程,均没有改变图像的尺寸,那么与色度分量二值图中的像素点相对应的、灰度分量梯度图中的像素点,为像素点坐标相同的像素点;如果得到色度分量二值图和灰度分量梯度图的图像处理过程,按照一定规则改变了图像的尺寸,那么与色度分量二值图中的像素点相对应的、灰度分量梯度图中的像素点,为像素点坐标按照上述规则相对应的像素点。
如果色度分量图像有多张图像,每一张图像对应不同色度分量,那么色度分量梯度图和色度分量二值图,都有多张且每一张对应不同的色度分量。这种情况下,第一像素点为:与任何一张色度分量二值图中像素值为第二预设像素值的像素点相对应的、灰度分量梯度图中的像素点。对于灰度分量梯度图中的像素点,与其相对应的多张色度分量二值图中像素点中,只要有一个像素点的像素值为第二预设像素值,就将灰度分量梯度图中的该像素点,确定为第一预设像素值。
例如:在灰度分量梯度图中,第一预设像素值可以为0,其所表示的颜色可以为黑色;在Cb分量二值图和Cr分量二值图中,第二预设像素值可以为1,其所表示的颜色可以为白色,其中,Cb分量二值图和Cr分量二值图均为色度分量二值图,而且图的尺寸和灰度分量梯度图相同;所以,本实施例中,对灰度分量梯度图和色度分量梯度图进行差运算,可以包括如下步骤:
步骤A1:分别确定Cb分量二值图和Cr分量二值图中像素值为1的点的坐标,作为第一坐标和第二坐标;
步骤A2:在灰度分量梯度图中,将坐标为第一坐标和第二坐标的像素点的像素值确定为0。
本实现方式中,通过二值化选中色度分量梯度图中表示背景的像素点,确定其在灰度分量梯度图中对应的像素点的像素值为表示梯度低的像素值,从而完成灰度分量梯度图和色度分量梯度图之间的差运算。
图3所示为本发明实施例提供的字符分割方法的另一种流程示意图,具体包括如下步骤:
步骤S301、确定待分割图像中字符的编组方式,作为第一编组方式。
步骤S302、统计待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量。
步骤S303、在预设范围内选取字符排布。
选取之前未选取过的一字符排布。上述预设范围可以由字符宽度的范围和字符组间距的范围构成。一种实现方式中,可以按照固定的宽度间隔,以从小到大或从大到小的顺序,分别从字符宽度的范围和字符组间距的范围中选取不同的字符宽度或不同的字符组间距,得到不同的字符排布。
步骤S304、获得该字符排布中字符的字符宽度,作为第一宽度,并获得该字符排布中字符的字符组间距,作为第一间距。
步骤S305、基于第一宽度,确定单个字符中字符像素点的第三预估数量分布。
上述第三预估数量分布为:预设的预估数量分布集内宽度为第一宽度的第一图像的像素单元中字符像素点的数量分布。
上述预估数量分布集为:与每一第二分布差异度最小的分布所构成的集合,预估数量分布集中的每一个分布对应着一个字符宽度,可以在进行字符分割之前,通过对作为样本的各个第一图像进行处理得到。
上述第二分布为:第一图像的像素单元中字符像素点的数量分布。上述像素单元可以是像素行,也可以是像素列,但需要和步骤S302中的像素单元相同,也就是说,如果步骤S302中的像素单元为像素列,需要采用对像素列进行处理的预估数量分布集进行字符分割,如果步骤S302中的像素单元为像素行,需要采用对像素行进行处理的预估数量分布集进行字符分割。
各个第一图像为:分别包含备选字符集中每一字符的、预设宽度的图像,上述备选字符集为:所需要分割的字符所属的字符集,例如,待分割图像为银行卡图像,需要进行字符分割的字符为银行卡号时,备选字符集为:数集{0,1,2,3,4,5,6,7,8,9};需要进行字符分割的字符为不包含标点的英文词语时,备选字符集为26个英文字母。
考虑到不同字体或不同印刷方式中,相同字符的图像的差别,各个第一图像可以为预设字体或预设印刷方式的、分别包含备选字符集中每一字符的、预设宽度的图像,其中,上述预设字体或预设印刷方式与待分割图像中的字符的字体或印刷方式相一致。
步骤S306、按照第一编组方式,依次对第三预估数量分布和无字符分布进行组合,将组合结果作为字符排布的第一预估数量分布。
上述无字符分布为:宽度为第一间距的无字符图像的像素单元中字符像素点的数量分布。无字符分布可以为每个元素数值为0的、元素个数为第一间距的像素点数量的离散数值分布。
一种实现方式中,可以按照字符的阅读顺序,依次对第三预估数量分布和无字符分布进行组合。如果字符的阅读顺序为从左到右,那么上述步骤S302和步骤S305中的像素单元为像素列,本步骤中按照从左到右的方式进行组合,如果字符的阅读顺序为从上到下,那么上述步骤S302和步骤S305中的像素单元为像素行,本步骤中按照从上到下的方式进行组合。
步骤S307、判断预设范围内的字符排布是否都被选取过,如果没有都被选取过,进入步骤303,如果都被选取过,进入步骤308。
步骤S308、确定第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布。
步骤S309、按照第二预估数量分布对应的字符排布对待分割图像进行字符分割。
本实施例提供的方案中,采用了预先得到的预估数量分布集,用于获得每一字符排布中字符像素点的预估数量分布。预估数量分布集提供了综合了每一个可能出现的字符在所选取的字符宽度下的字符像素点数量分布,将从预估数量分布集所选取的、与所选取的字符宽度相对应的第三预估数量分布,按照第一编组方式组合成待分割的字符的预估数量分布,可以作为一个字符排布的标准,与准确的预估数量分布作比较,可以准确的确定字符排布,从而可以提升字符分割的准确度。
本发明的一种实现方式中,上述步骤S304中获得该字符排布中字符的字符组间距,作为第一间距时,可以先获得用于表示字符组间距与字符宽度之间比例关系的第一数值,再计算第一宽度和第一数值的乘积,得到字符排布中字符的字符组间距,作为第一间距。
可以在上述步骤S303中选取字符排布时,在由字符宽度的范围和第一数值的范围中选取字符宽度和第一数值,然后再通过将第一宽度和第一数值相乘,获取第一间距。
本实现方式中,不直接选取字符组间距,而是通过选取第一数值再与第一宽度相乘得到所选取的字符组间距。因为字符组间隔是用于隔开字符的,其宽度和字符宽度有相关性,字符较宽的时候,字符组间距一般也较宽,字符较窄的时候字符组间距一般也较窄,所以不直接选取字符组间距,而是选取字符组间距与字符宽度的比值,可以通过较少的所选取的数量,就能够预估待分割图像中字符组间距可能的取值,缩小了预估取值的范围,节省了计算资源。
图4所示为本发明实施例提供的字符分割方法的又一种流程示意图,具体包括如下步骤:
步骤S401、获得待进行字符识别的图像的灰度分量图像和色度分量图像。
步骤S402、分别对灰度分量图像和色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图。
步骤S403、对灰度分量梯度图和色度分量梯度图进行差运算,得到待分割图像。
步骤S404、确定待分割图像中字符的编组方式,作为第一编组方式。
上述步骤S401-S404所提及的内容已在前述各个实施例中进行详细说明,这里不再赘述。
步骤S405、分别统计待分割图像和灰度分量梯度图的每一像素单元中字符像素点的数量,作为第一像素点数量和第二像素点数量。
本步骤中获得第一像素点数量和第二像素点数量的方式与图1的步骤S102相同。
步骤S406、获得编组方式为第一编组方式的每一字符排布中字符像素点的第一预估数量分布。
本步骤中的字符排布、第一预估数量分布、获得字符排布的方式以及获得第一预估数量分布的方式,与图1的步骤S103相同。
步骤S407、在所获得第一预估数量分布中,分别确定与第一分布之间差异度最小的第一预估数量分布、与第三分布之间差异度最小的第一预估数量分布,作为第二预估数量分布和第四预估数量分布。
上述第一分布为:由第一像素点数量确定的字符像素点数量的分布,上述第三分布为:由第二像素点数量确定的字符像素点数量的分布。
本步骤中确定第二预估数量分布和第四预估数量分布的方式与图1的步骤S104相同。
步骤S408、按照第四预估数量分布对应的字符排布对灰度分量梯度图进行字符分割,得到第一分割区域,按照第二预估数量分布对应的字符排布对灰度分量梯度图进行字符分割,得到第二分割区域。
图5为本发明实施例提供的第一分割区域和第二分割区域对比图,如图5所示,左图中的每一白色框为一第一分割区域,右图中每一白色框为一第二分割区域。
步骤S409、分别将每一第一分割区域和每一第二分割区域输入至置信度模型中,得到每一第一分割区域、每一第二分割区域为单字符区域的置信度。
上述置信度模型为:预先使用样本区域对预设的神经网络模型进行训练得到的、用于检测区域是否为单字符区域的二分类神经网络模型。
上述样本区域为:对样本图像进行形态学梯度化计算得到的梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的区域。
置信度可以为0到1闭区间内的数值。
步骤S410、计算各个第一分割区域的置信度的和值,计算各个第二分割区域的置信度的和值。
步骤S411、将计算得到的和值中最大和值对应的分割区域确定为待进行字符识别的图像的字符分割结果。
如果各个第一分割区域的置信度的和值与各个第二分割区域的置信度的和值相等,那么可以将经过减弱背景图案干扰处理得到的第二分割区域确定为待进行字符识别的图像的字符分割结果。
本实施例提供的方案中,先分别对待进行字符识别的图像采用两种不同的预处理,得到灰度梯度图和减弱背景图案干扰的待分割图像,再对灰度梯度图和待分割图像分别进行字符分割,得到第一分割区域和第二分割区域,然后将置信度的和值较大的分割区域确定为字符分割结果。对待进行字符识别的图像进行字符分割时,使用灰度梯度图和使用减弱背景图案干扰的待分割图像,各有优劣。分别用两种方式进行字符分割,再通过检测挑选效果好的那一个作为最终确定的字符分割结果,可以提高字符分割的准确度。
图6所示为本发明实施例提供的的置信度模型训练方法的一种流程示意图,具体包括如下步骤:
步骤S601、获取包含字符的样本图像。
上述样本图像可以为灰度图像,也可以为彩色图像。
步骤S602、对样本图像的灰度分量进行形态学梯度化计算,得到样本梯度图。
样本图像可以为灰度图像,也可以为彩色图像。如果样本图像为灰度图像时,可以直接对样本进行形态学梯度化计算,得到样本梯度图;如果样本图像为彩色图像时,可以先获得样本图像的灰度图,再对该灰度图进行形态学梯度化计算,得到样本梯度图。
一种实现方式中,可以对形态学梯度化计算的结果进行直方图均衡化处理,获得样本梯度图,这样可以增加所获得的样本梯度图的对比度。
步骤S603、将第一图像区域划分成高度为第一预设数量个像素点、宽度为第二预设数量个像素点的单字符区域,作为正样本区域。
上述第一图像区域为:样本梯度图中与样本图像中包含字符的图像区域相对应的区域。
第一预设数量可以取值为27或30等数值,第二预设数量可以取值为19或20等数值。如果第一图像区域的高度大于第一预设数量个像素,可以对样本梯度图在高度方向上进行缩小处理,使得第一图像区域的高度为第一预设数量个像素。如果第一图像区域划分出来的单字符区域宽度不为第二预设数量,可以对划分得到的图像在宽度方向上进行放大或缩小的处理,使得所得到的的单字符区域的宽度为第二预设数量。
步骤S604、在样本图像中对各个正样本区域进行偏移处理得到负样本区域。
负样本区域的尺寸和正样本区域相同,偏移量可以为3个像素点或4个像素点等等,偏移方向可以是宽度方向,也可以是高度方向,还可以是与宽度方向和高度方向均由一定偏角的其他方向。
步骤S605、采用正样本区域和负样本区域对预设的神经网络模型进行训练,得到用于检测区域是否是为单字符区域的二分类神经网络模型,作为置信度模型。
采用正样本区域和负样本区域对预设的神经网络模型进行训练时,可以将正样本区域或负样本区域输入至上述预设的神经网络模型,该神经网络模型对样本区域进行检测,得到该区域是否是为单字符区域的结果,然后将此结果与该区域是正样本区域还是负样本区域的分类进行对比,根据对比结果调整神经网络模型的模型参数,使得调整参数后的神经网络模型检测出的区域的分类向该该区域是正样本区域还是负样本区域的分类靠拢。
本发明的一种实现方式中,上述预设的神经网络模型可以是采用CAFFE(Convolution Architecture for Fast Feature Embedding,快速特征嵌入的卷积架构)构建的模型。
为了检测所获得的区域是否为单字符区域,本发明实施例提供了一种神经网络模型的训练方法,可以将每一第一分割区域和每一第二分割区域分布输入至训练得到的模型中,得到这样区域为单字符区域的置信度。使用字符分割后的样本区域训练过的神经网络模型来检测,能够有效的辨别第一分割区域和第二分割区域中哪一种分割的更准确。
基于同一发明构思,根据本发明上述实施例提供的字符分割方法,相应地,本发明实施例还提供了一种字符分割装置,其结构示意图如图7所示,具体包括:
编组方式确定模块701,用于确定待分割图像中字符的编组方式,作为第一编组方式;
第一数量统计模块702,用于统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;
分布获得模块703,用于获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,其中,每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同;
第一分布确定模块704,用于确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,其中,所述第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布;
图像分割模块705,用于按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割。
本发明实施例提供的字符分割装置,可以先确定字符编组方式,并统计待分割图像的像素单元中字符像素点的数量,再获得每一字符排布中字符像素点的预估数量分布,然后确定预估数量分布中与所统计的数量组成分布的差异度最小的预估数量分布,最后按照该预估数量分布对应的字符排布对待分割图像进行字符分割。本发明实施例提供的方案中,将图像中存在字符的特征转化成字符像素点数量分布数据,通过待分割图像转化成的字符像素点数量分布与不同的字符分割参数所对应的预估数量分布进行比较,确定差异最小的字符分割参数,和按照默认分割参数直接进行字符分割的现有技术相比,提高了字符分割的准确度。
本发明的一种实现方式中,所述分布获得模块703包括:宽度获得子模块、第一分布确定子模块和分布获得子模块;
所述宽度获得子模块、所述第一分布确定子模块和所述分布获得子模块用于获得每一字符排布中字符像素点的第一预估数量分布;
所述宽度获得子模块,用于获得字符排布中字符的字符宽度,作为第一宽度,并获得字符排布中字符的字符组间距,作为第一间距;
所述第一分布确定子模块,用于基于所述第一宽度,确定单个字符中字符像素点的第三预估数量分布,其中,所述第三预估数量分布为:预设的预估数量分布集内宽度为所述第一宽度的第一图像的像素单元中字符像素点的数量分布,所述预估数量分布集为:与每一第二分布差异度最小的分布所构成的集合,所述第二分布为:所述第一图像的像素单元中字符像素点的数量分布,各个第一图像为:分别包含备选字符集中每一字符的、预设宽度的图像;
所述分布获得子模块,用于按照所述第一编组方式,依次对所述第三预估数量分布和无字符分布进行组合,将组合结果作为字符排布的第一预估数量分布,其中,所述无字符分布为:宽度为所述第一间距的无字符图像的像素单元中字符像素点的数量分布。
本实施例提供的方案中,采用了预先得到的预估数量分布集,用于获得每一字符排布中字符像素点的预估数量分布。预估数量分布集提供了综合了每一个可能出现的字符在所选取的字符宽度下的字符像素点数量分布,将从预估数量分布集所选取的、与所选取的字符宽度相对应的第三预估数量分布,按照第一编组方式组合成待分割的字符的预估数量分布,可以作为一个字符排布的标准,与准确的预估数量分布作比较,可以准确的确定字符排布,从而可以提升字符分割的准确度。
本发明的一种实现方式中,所述宽度获得子模块包括:
数值获得单元,用于获得用于表示字符组间距与字符宽度之间比例关系的第一数值;
乘积计算单元,用于计算所述第一宽度和所述第一数值的乘积,得到字符排布中字符的字符组间距,作为第一间距。
本实现方式中,不直接选取字符组间距,而是通过选取第一数值再与第一宽度相乘得到所选取的字符组间距。因为字符组间隔是用于隔开字符的,其宽度和字符宽度有相关性,字符较宽的时候,字符组间距一般也较宽,字符较窄的时候字符组间距一般也较窄,所以不直接选取字符组间距,而是选取字符组间距与字符宽度的比值,可以通过较少的所选取的数量,就能够预估待分割图像中字符组间距可能的取值,缩小了预估取值的范围,节省了计算资源。
本发明的一种实现方式中,所述第一分布确定模块704包括:
差异度计算子模块,用于按照以下表达式计算所获得的每一第一预估数量分布与第一分布之间的差异度:
其中,D表示一第一预估数量分布与所述第一分布之间的差异度,i表示像素单元的标号,n表示像素单元的数量,yi表示第一预估数量分布中第i个元素的数值,xi表示所述第一分布中第i个像素单元中字符像素点的数量;
第二分布确定子模块,用于确定计算得到的差异度中最小差异度对应的第一预估数量分布,作为第二预估数量分布。
本实现方式中,计算预估数量分布和第一分布中相对应的元素的差值,再将所得到的的差值的绝对值求和,可以简单直接并且线性化的得到第一预估数量分布与第一分布之间的差异度。
本发明的一种实现方式中,所述装置还包括:
图像获得模块,用于获得待进行字符识别的图像的灰度分量图像和色度分量图像;
第一梯度图获得模块,用于分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图;
第二梯度图获得模块,用于对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像。
本实现方式中,将待进行字符识别的图像分为灰度分量和色度分量,分别进行形态学梯度化计算,再对得到的两种梯度图进行差运算。形态学梯度化得到的梯度图反应了图像中的图案边缘,对于想要识别的内容的色彩不够丰富,而背景图案色彩丰富的情况,本实现方式可以减弱背景图案对于确定单字符区域的干扰,提高字符分割的准确度。
本发明的一种实现方式中,所述第二梯度图获得模块包括:
第一图像获得子模块,用于对所述色度分量梯度图进行二值化处理,得到色度分量二值图;
第二图像获得子模块,用于确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值,得到待分割图像,其中,所述第一预设像素值为:所表示的梯度值小于第一预设阈值的像素值,所述第一像素点为:与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点,所述第二预设像素值为:所述色度分量二值图中背景像素点的像素值。
本实现方式中,通过二值化选中色度分量梯度图中表示背景的像素点,确定其在灰度分量梯度图中对应的像素点的像素值为表示梯度低的像素值,从而完成灰度分量梯度图和色度分量梯度图之间的差运算。
本发明的一种实现方式中,所述装置还包括:
第二数量统计模块,用于在所述第一梯度图获得模块得到灰度分量梯度图和色度分量梯度图之后,统计所述灰度分量梯度图的每一像素单元中字符像素点的数量,作为第二像素点数量;
第二分布确定模块,用于在所述分布获得模块获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布之后,确定所获得第一预估数量分布中与第三分布之间差异度最小的第一预估数量分布,作为第四预估数量分布,其中,所述第三分布为:由所述第二像素点数量确定的字符像素点数量的分布;
区域获得模块,用于按照所述第四预估数量分布对应的字符排布对所述灰度分量梯度图进行字符分割,得到第一分割区域;
置信度获得模块,用于在所述图像分割模块按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割之后,分别将每一第一分割区域和每一第二分割区域输入至置信度模型中,得到每一第一分割区域、每一第二分割区域为单字符区域的置信度,其中,各个第二分割区域为:按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割得到的区域,所述置信度模型为:预先使用样本区域对预设的神经网络模型进行训练得到的、用于检测区域是否为单字符区域的二分类神经网络模型,所述样本区域为:对样本图像进行形态学梯度化计算得到的梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的区域;
和值计算模块,用于计算各个第一分割区域的置信度的和值,并计算各个第二分割区域的置信度的和值;
结果确定模块,用于将计算得到的和值中最大和值对应的分割区域确定为所述待进行字符识别的图像的字符分割结果。
本实施例提供的方案中,先分别对待进行字符识别的图像采用两种不同的预处理,得到灰度梯度图和减弱背景图案干扰的待分割图像,再对灰度梯度图和待分割图像分别进行字符分割,得到第一分割区域和第二分割区域,然后将置信度的和值较大的分割区域确定为字符分割结果。对待进行字符识别的图像进行字符分割时,使用灰度梯度图和使用减弱背景图案干扰的待分割图像,各有优劣。分别用两种方式进行字符分割,再通过检测挑选效果好的那一个作为最终确定的字符分割结果,可以提高字符分割的准确度。
本发明的一种实现方式中,所述置信度获得模块包括以下子模块,用于训练得到所述置信度模型:
第三图像获得子模块,用于获取包含字符的样本图像;
梯度图获得子模块,用于对所述样本图像的灰度分量进行形态学梯度化计算,得到样本梯度图;
区域划分子模块,用于将第一图像区域划分成高度为第一预设数量个像素点、宽度为第二预设数量个像素点的单字符区域,作为正样本区域,其中,所述第一图像区域为:所述样本梯度图中与所述样本图像中包含字符的图像区域相对应的区域;
区域获得子模块,用于在样本图像中对各个正样本区域进行偏移处理得到负样本区域;
模型获得子模块,用于采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练,得到用于检测区域是否是为单字符区域的二分类神经网络模型,作为所述置信度模型。
为了检测所获得的区域是否为单字符区域,本发明实施例提供了一种神经网络模型的训练方法,可以将每一第一分割区域和每一第二分割区域分布输入至训练得到的模型中,得到这样区域为单字符区域的置信度。使用字符分割后的样本区域训练过的神经网络模型来检测,能够有效的辨别第一分割区域和第二分割区域中哪一种分割的更准确。
基于同一发明构思,根据本发明上述实施例提供的字符分割方法,相应地,本发明实施例还提供了一种电子设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信,
存储器803,用于存放计算机程序;
处理器801,用于执行存储器803上所存放的程序时,实现上述实施例中任一字符分割方法的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的字符分割电子设备,可以先确定字符编组方式,并统计待分割图像的像素单元中字符像素点的数量,再获得每一字符排布中字符像素点的预估数量分布,然后确定预估数量分布中与所统计的数量组成分布的差异度最小的预估数量分布,最后按照该预估数量分布对应的字符排布对待分割图像进行字符分割。本发明实施例提供的方案中,将图像中存在字符的特征转化成字符像素点数量分布数据,通过待分割图像转化成的字符像素点数量分布与不同的字符分割参数所对应的预估数量分布进行比较,确定差异最小的字符分割参数,和按照默认分割参数直接进行字符分割的现有技术相比,提高了字符分割的准确度。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一字符分割方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一字符分割方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (17)
1.一种字符分割方法,其特征在于,包括:
确定待分割图像中字符的编组方式,作为第一编组方式;
统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;
获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,其中,每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同;
确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,其中,所述第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布;
按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割。
2.根据权利要求1所述的方法,其特征在于,所述获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,包括:
按照以下方式获得每一字符排布中字符像素点的第一预估数量分布:
获得字符排布中字符的字符宽度,作为第一宽度,并获得字符排布中字符的字符组间距,作为第一间距;
基于所述第一宽度,确定单个字符中字符像素点的第三预估数量分布,其中,所述第三预估数量分布为:预设的预估数量分布集内宽度为所述第一宽度的第一图像的像素单元中字符像素点的数量分布,所述预估数量分布集为:与每一第二分布差异度最小的分布所构成的集合,所述第二分布为:所述第一图像的像素单元中字符像素点的数量分布,各个第一图像为:分别包含备选字符集中每一字符的、预设宽度的图像;
按照所述第一编组方式,依次对所述第三预估数量分布和无字符分布进行组合,将组合结果作为字符排布的第一预估数量分布,其中,所述无字符分布为:宽度为所述第一间距的无字符图像的像素单元中字符像素点的数量分布。
3.根据权利要求2所述的方法,其特征在于,所述获得字符排布中字符的字符组间距,作为第一间距,包括:
获得用于表示字符组间距与字符宽度之间比例关系的第一数值;
计算所述第一宽度和所述第一数值的乘积,得到字符排布中字符的字符组间距,作为第一间距。
4.根据权利要求1所述的方法,其特征在于,所述确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,包括:
按照以下表达式计算所获得的每一第一预估数量分布与第一分布之间的差异度:
其中,D表示一第一预估数量分布与所述第一分布之间的差异度,i表示像素单元的标号,n表示像素单元的数量,yi表示第一预估数量分布中第i个元素的数值,xi表示所述第一分布中第i个像素单元中字符像素点的数量;
确定计算得到的差异度中最小差异度对应的第一预估数量分布,作为第二预估数量分布。
5.根据权利要求1-4项中任一所述的方法,其特征在于,在所述确定待分割图像中字符的编组方式之前,所述方法还包括:
获得待进行字符识别的图像的灰度分量图像和色度分量图像;
分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图;
对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像。
6.根据权利要求5所述的方法,其特征在于,所述对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像,包括:
对所述色度分量梯度图进行二值化处理,得到色度分量二值图;
确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值,得到待分割图像,其中,所述第一预设像素值为:所表示的梯度值小于第一预设阈值的像素值,所述第一像素点为:与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点,所述第二预设像素值为:所述色度分量二值图中背景像素点的像素值。
7.根据权利要求5所述的方法,其特征在于,在所述分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图之后,所述方法还包括:
统计所述灰度分量梯度图的每一像素单元中字符像素点的数量,作为第二像素点数量;
在所述获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布之后,所述方法还包括:
确定所获得第一预估数量分布中与第三分布之间差异度最小的第一预估数量分布,作为第四预估数量分布,其中,所述第三分布为:由所述第二像素点数量确定的字符像素点数量的分布;
按照所述第四预估数量分布对应的字符排布对所述灰度分量梯度图进行字符分割,得到第一分割区域;
在所述按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割之后,所述方法还包括:
分别将每一第一分割区域和每一第二分割区域输入至置信度模型中,得到每一第一分割区域、每一第二分割区域为单字符区域的置信度,其中,各个第二分割区域为:按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割得到的区域,所述置信度模型为:预先使用样本区域对预设的神经网络模型进行训练得到的、用于检测区域是否为单字符区域的二分类神经网络模型,所述样本区域为:对样本图像进行形态学梯度化计算得到的梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的区域;
计算各个第一分割区域的置信度的和值,并计算各个第二分割区域的置信度的和值;
将计算得到的和值中最大和值对应的分割区域确定为所述待进行字符识别的图像的字符分割结果。
8.根据权利要求7所述的方法,其特征在于,采用以下方式训练得到所述置信度模型:
获取包含字符的样本图像;
对所述样本图像的灰度分量进行形态学梯度化计算,得到样本梯度图;
将第一图像区域划分成高度为第一预设数量个像素点、宽度为第二预设数量个像素点的单字符区域,作为正样本区域,其中,所述第一图像区域为:所述样本梯度图中与所述样本图像中包含字符的图像区域相对应的区域;
在样本图像中对各个正样本区域进行偏移处理得到负样本区域;
采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练,得到用于检测区域是否是为单字符区域的二分类神经网络模型,作为所述置信度模型。
9.一种字符分割装置,其特征在于,包括:
编组方式确定模块,用于确定待分割图像中字符的编组方式,作为第一编组方式;
第一数量统计模块,用于统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;
分布获得模块,用于获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,其中,每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同;
第一分布确定模块,用于确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,其中,所述第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布;
图像分割模块,用于按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割。
10.根据权利要求9所述的装置,其特征在于,所述分布获得模块包括:宽度获得子模块、第一分布确定子模块和分布获得子模块;
所述宽度获得子模块、所述第一分布确定子模块和所述分布获得子模块用于获得每一字符排布中字符像素点的第一预估数量分布;
所述宽度获得子模块,用于获得字符排布中字符的字符宽度,作为第一宽度,并获得字符排布中字符的字符组间距,作为第一间距;
所述第一分布确定子模块,用于基于所述第一宽度,确定单个字符中字符像素点的第三预估数量分布,其中,所述第三预估数量分布为:预设的预估数量分布集内宽度为所述第一宽度的第一图像的像素单元中字符像素点的数量分布,所述预估数量分布集为:与每一第二分布差异度最小的分布所构成的集合,所述第二分布为:所述第一图像的像素单元中字符像素点的数量分布,各个第一图像为:分别包含备选字符集中每一字符的、预设宽度的图像;
所述分布获得子模块,用于按照所述第一编组方式,依次对所述第三预估数量分布和无字符分布进行组合,将组合结果作为字符排布的第一预估数量分布,其中,所述无字符分布为:宽度为所述第一间距的无字符图像的像素单元中字符像素点的数量分布。
11.根据权利要求10所述的装置,其特征在于,所述宽度获得子模块包括:
数值获得单元,用于获得用于表示字符组间距与字符宽度之间比例关系的第一数值;
乘积计算单元,用于计算所述第一宽度和所述第一数值的乘积,得到字符排布中字符的字符组间距,作为第一间距。
12.根据权利要求9所述的装置,其特征在于,所述第一分布确定模块包括:
差异度计算子模块,用于按照以下表达式计算所获得的每一第一预估数量分布与第一分布之间的差异度:
其中,D表示一第一预估数量分布与所述第一分布之间的差异度,i表示像素单元的标号,n表示像素单元的数量,yi表示第一预估数量分布中第i个元素的数值,xi表示所述第一分布中第i个像素单元中字符像素点的数量;
第二分布确定子模块,用于确定计算得到的差异度中最小差异度对应的第一预估数量分布,作为第二预估数量分布。
13.根据权利要求9-12项中任一所述的装置,其特征在于,所述装置还包括:
图像获得模块,用于获得待进行字符识别的图像的灰度分量图像和色度分量图像;
第一梯度图获得模块,用于分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图;
第二梯度图获得模块,用于对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像。
14.根据权利要求13所述的装置,其特征在于,所述第二梯度图获得模块包括:
第一图像获得子模块,用于对所述色度分量梯度图进行二值化处理,得到色度分量二值图;
第二图像获得子模块,用于确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值,得到待分割图像,其中,所述第一预设像素值为:所表示的梯度值小于第一预设阈值的像素值,所述第一像素点为:与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点,所述第二预设像素值为:所述色度分量二值图中背景像素点的像素值。
15.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第二数量统计模块,用于在所述第一梯度图获得模块得到灰度分量梯度图和色度分量梯度图之后,统计所述灰度分量梯度图的每一像素单元中字符像素点的数量,作为第二像素点数量;
第二分布确定模块,用于在所述分布获得模块获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布之后,确定所获得第一预估数量分布中与第三分布之间差异度最小的第一预估数量分布,作为第四预估数量分布,其中,所述第三分布为:由所述第二像素点数量确定的字符像素点数量的分布;
区域获得模块,用于按照所述第四预估数量分布对应的字符排布对所述灰度分量梯度图进行字符分割,得到第一分割区域;
置信度获得模块,用于在所述图像分割模块按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割之后,分别将每一第一分割区域和每一第二分割区域输入至置信度模型中,得到每一第一分割区域、每一第二分割区域为单字符区域的置信度,其中,各个第二分割区域为:按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割得到的区域,所述置信度模型为:预先使用样本区域对预设的神经网络模型进行训练得到的、用于检测区域是否为单字符区域的二分类神经网络模型,所述样本区域为:对样本图像进行形态学梯度化计算得到的梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的区域;
和值计算模块,用于计算各个第一分割区域的置信度的和值,并计算各个第二分割区域的置信度的和值;
结果确定模块,用于将计算得到的和值中最大和值对应的分割区域确定为所述待进行字符识别的图像的字符分割结果。
16.根据权利要求15所述的装置,其特征在于,所述置信度获得模块包括以下子模块,用于训练得到所述置信度模型:
第三图像获得子模块,用于获取包含字符的样本图像;
梯度图获得子模块,用于对所述样本图像的灰度分量进行形态学梯度化计算,得到样本梯度图;
区域划分子模块,用于将第一图像区域划分成高度为第一预设数量个像素点、宽度为第二预设数量个像素点的单字符区域,作为正样本区域,其中,所述第一图像区域为:所述样本梯度图中与所述样本图像中包含字符的图像区域相对应的区域;
区域获得子模块,用于在样本图像中对各个正样本区域进行偏移处理得到负样本区域;
模型获得子模块,用于采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练,得到用于检测区域是否是为单字符区域的二分类神经网络模型,作为所述置信度模型。
17.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811577593.2A CN109726722B (zh) | 2018-12-20 | 2018-12-20 | 一种字符分割方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811577593.2A CN109726722B (zh) | 2018-12-20 | 2018-12-20 | 一种字符分割方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109726722A true CN109726722A (zh) | 2019-05-07 |
CN109726722B CN109726722B (zh) | 2020-10-02 |
Family
ID=66296312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811577593.2A Active CN109726722B (zh) | 2018-12-20 | 2018-12-20 | 一种字符分割方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109726722B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461126A (zh) * | 2020-03-23 | 2020-07-28 | Oppo广东移动通信有限公司 | 文本行中的空格识别方法、装置、电子设备及存储介质 |
CN112308056A (zh) * | 2019-07-26 | 2021-02-02 | 深圳怡化电脑股份有限公司 | 票据特征区域的获取方法、装置、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104616009A (zh) * | 2015-02-13 | 2015-05-13 | 广州广电运通金融电子股份有限公司 | 一种字符切割识别方法 |
CN105354574A (zh) * | 2015-12-04 | 2016-02-24 | 山东博昂信息科技有限公司 | 一种车号识别方法及装置 |
CN105868758A (zh) * | 2015-01-21 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 图像中文本区域检测方法、装置及电子设备 |
CN106599896A (zh) * | 2016-11-08 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种字符分割方法和装置、及元件检测方法和装置 |
-
2018
- 2018-12-20 CN CN201811577593.2A patent/CN109726722B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105868758A (zh) * | 2015-01-21 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 图像中文本区域检测方法、装置及电子设备 |
CN104616009A (zh) * | 2015-02-13 | 2015-05-13 | 广州广电运通金融电子股份有限公司 | 一种字符切割识别方法 |
CN105354574A (zh) * | 2015-12-04 | 2016-02-24 | 山东博昂信息科技有限公司 | 一种车号识别方法及装置 |
CN106599896A (zh) * | 2016-11-08 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种字符分割方法和装置、及元件检测方法和装置 |
WO2018086233A1 (zh) * | 2016-11-08 | 2018-05-17 | 广州视源电子科技股份有限公司 | 一种字符分割方法和装置、及元件检测方法和装置 |
Non-Patent Citations (1)
Title |
---|
章卫祥: ""一种基于梯度域的彩色图像转灰度图像的方法"", 《影像技术》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308056A (zh) * | 2019-07-26 | 2021-02-02 | 深圳怡化电脑股份有限公司 | 票据特征区域的获取方法、装置、设备和存储介质 |
CN111461126A (zh) * | 2020-03-23 | 2020-07-28 | Oppo广东移动通信有限公司 | 文本行中的空格识别方法、装置、电子设备及存储介质 |
WO2021190155A1 (zh) * | 2020-03-23 | 2021-09-30 | Oppo广东移动通信有限公司 | 文本行中的空格识别方法、装置、电子设备及存储介质 |
CN111461126B (zh) * | 2020-03-23 | 2023-08-18 | Oppo广东移动通信有限公司 | 文本行中的空格识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109726722B (zh) | 2020-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740606B (zh) | 一种图像识别方法及装置 | |
CN112036395B (zh) | 基于目标检测的文本分类识别方法及装置 | |
CN102667810B (zh) | 数字图像中的面部识别 | |
US4837842A (en) | Character and pattern recognition machine and method | |
CN107209942B (zh) | 对象检测方法和图像检索系统 | |
CN111429482A (zh) | 目标跟踪方法、装置、计算机设备和存储介质 | |
CN112288758A (zh) | 一种电力设备红外与可见光图像配准方法 | |
CN109389110B (zh) | 一种区域确定方法及装置 | |
CN110704652A (zh) | 基于多重注意力机制的车辆图像细粒度检索方法及装置 | |
CN115375917B (zh) | 一种目标边缘特征提取方法、装置、终端及存储介质 | |
CN109726722A (zh) | 一种字符分割方法及装置 | |
CN117557784B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
Wang et al. | Local defect detection and print quality assessment | |
CN110472607A (zh) | 一种船舶跟踪方法及系统 | |
CN111553361B (zh) | 一种病理切片标签识别方法 | |
CN103136536A (zh) | 对象检测系统和方法、图像的特征提取方法 | |
US7386172B2 (en) | Image recognition method | |
CN108229498B (zh) | 一种拉链片识别方法、装置及设备 | |
KR102405168B1 (ko) | 데이터 셋 생성 방법 및 장치, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램 | |
Li-pi et al. | Image registration based on Hausdorff distance | |
CN114708230A (zh) | 基于图像分析的车架质量检测方法、装置、设备及介质 | |
CN103136524A (zh) | 能够抑制检测结果冗余的对象检测系统和方法 | |
CN106845479B (zh) | 一种基于对比色矩形特征的小尺寸车牌检测方法 | |
CN105868789B (zh) | 一种基于图像区域内聚测度的目标发现方法 | |
CN115965581B (zh) | 一种复制-粘贴篡改图像检测方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |