CN105631449B - 一种图片分割方法、装置及设备 - Google Patents

一种图片分割方法、装置及设备 Download PDF

Info

Publication number
CN105631449B
CN105631449B CN201510967136.4A CN201510967136A CN105631449B CN 105631449 B CN105631449 B CN 105631449B CN 201510967136 A CN201510967136 A CN 201510967136A CN 105631449 B CN105631449 B CN 105631449B
Authority
CN
China
Prior art keywords
pixel
picture
block
symbol guide
gray value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510967136.4A
Other languages
English (en)
Other versions
CN105631449A (zh
Inventor
徐礼锋
张观侣
胡楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510967136.4A priority Critical patent/CN105631449B/zh
Publication of CN105631449A publication Critical patent/CN105631449A/zh
Application granted granted Critical
Publication of CN105631449B publication Critical patent/CN105631449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种图片分割方法、装置及设备,用以解决现有的图片识别过程中,图片分割设备对图片中的字符分割效果较差的问题,该方法为:图片分割设备对获取的原始图片进行二值化处理、去噪处理,生成第二图片;针对预设的每个符号模板,在第二图片中,筛选出与该符号模板像素相似度最高的图片块,该图片块的和该符号模板大小相同,在确定该图片块与该符号模板的像素相似度大于设定相似度阈值时,将该图片块作为待分割字符块;根据确定的所有待分割字符块的偏移量、每个待分割字符块对应的符号模板的大小,对第二图片进行分割。这样,图片分割设备可以提高分割图片的准确率,提高图片的分割效率。

Description

一种图片分割方法、装置及设备
技术领域
本发明涉及通信技术领域,尤其涉及一种图片分割方法、装置及设备。
背景技术
随着计算机技术的发展,在很多情境下,需要对图片中的内容进行识别,在图片中的内容为字符时,通常对图片中的字符进行分割,然后再进行识别。下面仅以验证码图片为例。
为了进一步提高互联网系统的安全性,通常验证码图片中字符会较难辨认,然而,这也导致合法用户也无法正常识别,因此,在图片识别过程中,首先图片分割设备需要对验证码图片中的字符进行分割,然后图片识别设备对分割的每个字符分别进行识别,其中,图片分割设备可以集成在所述图片识别设备中,也可以是单独的物理存在。
正确地对验证码图片中字符进行分割是验证码识别的前提条件,现有的分割方法包括:竖直投影法、连通图分割算法等。其中,
竖直投影法,图片分割设备将验证码图片经过二值化和去噪处理后,分别向X轴和Y轴投影,其中,投影值即为在该轴方向上的黑色像素点的个数,最终该图片分割设备根据相邻波谷的位置来确定单个字符在该轴上的位置范围,从而进行分割;
连通图分割算法,图片分割设备利用每个字符或字符的一部分构成连通区域的特性,将这些连通的区域分割开,从而将单个字符提取出来。
上述传统的分割方法均需要验证码图片中字符彼此之间不粘连、不重叠,这样才能正确地分割验证码图片中的字符,进而正确地识别每个字符。
然而,为了提高互联网系统的安全性,验证码图片中字符发生粘连、重叠以及噪声的概率增加,这样,导致在图片识别过程中图片分割设备对原始图片中的字符分割效果较差,进而导致图片识别设备无法正确识原始图片中的字符。
发明内容
本申请提供一种图片分割方法、装置及设备,用以解决现有技术中在图片识别过程中,图片分割设备对图片中的字符分割效果较差的问题。
第一方面,本申请的实施例提供一种图片分割方法,包括:
图片分割设备从网页页面或其他设备中获取原始图片,并对所述原始图片进行二值化处理,生成第一图片,该第一图片为黑白图片;所述图片分割设备在对所述第一图片进行去噪处理,生成第二图片;
所述图片分割设备通过符号模板与所述第二图片的图片块的匹配,在预设的多个符号模板中,筛选出与所述第二图片中的一个图片块的像素相似度大于设定相似度阈值的符号模板,与筛选出的符号模板对应的图片块为待分割字符块;每个待分割字符块与对应的符号模板的大小相同;
所述图片分割设备确定每个待分割字符块的偏移量(即待分割字符块在所述第二图片中的位置信息),以及确定每个待分割字符块对应的符号模板的大小;
所述图片分割设备根据所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。这样,图片识别设备可以采用多种方法识别每个待识别字符块,例如神经网络、支持向量机等方法。
通过上述方式,图片分割设备通过预设的符号模板与待分割的图片进行匹配,由于符号模板与待分割字符块的像素相似度大于设定相似度阈值,因此,筛选出的符号模板中的字符与对应的待分割字符块中的字符相同;进一步的,所述图片分割设备可以通过待分割字符块的偏移量以及对应的符号模板的大小,准确的对待分割图片进行分割,提高了对图片进行分割的效率,进而增强了图片识别设备在图片识别时的识别效率。
在一个可能的设计中,所述图片分割设备对所述原始图片进行二值化处理时,可以通过如下方式实现:
所述图片分割设备采用加权平均法、平均值法或者最大值法等,将所述原始图片进行灰度化处理,再识别每个像素点的灰度值,将灰度值超过设定灰度阈值的像素点的灰度值设置为255,并将灰度值未超过所述设定灰度阈值的像素点的灰度值设置为0。
通过上述方式,所述图片分割设置可以将原始图片处理为黑白图片,即图片中的像素点的取值只能为0或255,以利于提高对所述二值化处理后的图片进行去噪处理和符号模板匹配的效率。
在一个可能的设计中,所述图片分割设备对所述第一图片进行去噪处理时,可以通过如下方式实现:
所述图片分割设备确定所述第一图片中的每个连通区域,并
确定所述第一图片中每个连通区域中像素点的个数;
所述图片分割设备将像素点的个数小于设定像素点数目阈值的连通区域中每个像素点的灰度值设置为255。
通过上述方式,所述图片分割设备可以将像素点的个数低于设定像素点数目阈值的连通取值设置为白色(背景色),使面积较小的噪声消失,从而达到对所述第一图片去噪的效果。
在一个可能的设计中,所述图片分割设备确定所述第一图片中的任意一个连通区域时,可以通过如下方式实现:
所述图片分割设备遍历所述第一图片,在遍历到灰度值为0的像素点后,对该像素点设置一标记;
所述图片分割设备继续将该被标记的像素点8个邻域的像素点中,灰度值为0的像素点设置所述标记;
所述图片分割设备重复执行上述步骤,直至在所述第一图片中,被标记的像素点8个领域的像素点中,灰度值为0的像素点均被标记。
通过上述方式,所述图片分割设备可以准确的确定每个连通区域,避免所述第一图片中的像素点划分至错误的连通区域。
在一个可能的设计中,所述图片分割设备确定的每个所述图片块与该符号模板的像素相似度,符合下述公式:
其中,di,j为该图片块与该符号模板的像素相似度,i为该图片块在横轴方向的偏移量,j为该图片块在纵轴方向的偏移量,M为该符号模板的横轴方向的像素点的个数,N为该符号模板的纵轴方向的像素点的个数,Sm,n为该符号模板中坐标为(m,n)的像素点的灰度值,Tm+i,n+j为该图片块中坐标为(m,n)的像素点的灰度值。
通过上述方式,所述图片分割设备准确的确定每个所述图片块与该符号模板的像素相似度,即该图片块中灰度值与该符号模板中对应位置的像素点的灰度值相同的所有像素点,占该图片块中总像素点的数目的比例。
在一个可能的设计中,当所述第二图片与该符号模板的纵轴方向的像素点的个数相同时,j=0。
第二方面,本申请的实施例提供一种图片分割装置,该图片分割装置包括:获取单元、第一处理单元、第二处理单元,以及分割单元,其中,
获取单元,获取原始图片,例如从网页页面或其他设备中获取所述原始图片;
第一处理单元,对所述原始图片进行二值化处理,生成第一图片,并对所述第一图片进行去噪处理,生成第二图片;
第二处理单元,针对预设的每个符号模板,执行以下操作:
遍历所述第二图片,在所述第二图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度;
在所述至少一个图片块中,筛选出与该符号模板的像素相似度最高的图片块;并在判定筛选出的图片块与该符号模板的像素相似度大于设定相似度阈值时,将筛选出的图片块确定为待分割字符块;
确定所述待分割字符块的偏移量,以及该符号模板的大小,其中,所述偏移量为所述待分割字符块的边缘与所述第二图片的相应边缘之间的像素点的个数;
分割单元,根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。
第三方面,本申请的实施例提供一种图片分割设备,包括:收发器、处理器、总线以及存储器,收发器、处理器以及存储器通过总线相互连接,其中,
收发器,获取原始图片;
处理器,实现第一方面中图片分割方法,具有第二方面中图片分割装置的功能;
存储器中存放程序以及预设的符号模板等,所述处理器通过执行该程序,实现上述方法。
采用本申请提供的图片分割方法,图片分割设备通过预设的符号模板与待分割的图片进行匹配,由于符号模板与待分割字符块的像素相似度大于设定相似度阈值,因此,筛选出的符号模板中的字符与对应的待分割字符块中的字符相同;进一步的,所述图片分割设备可以通过待分割字符块的偏移量以及对应的符号模板的大小,准确的对待分割图片进行分割,提高了对图片进行分割的效率,进而增强了图片识别设备在图片识别时的识别效率。
附图说明
图1为本发明实施例提供的一种图片分割方法的流程图;
图2为本发明实施例提供的一种对验证码图片进行去噪的示意图;
图3为本发明实施例提供的一种对验证码图片进行分割的示意图;
图4为本发明实施例提供的一种图片分割装置的结构示意图;
图5为本发明实施例提供的一种图片分割设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供一种图片分割方法、装置及设备,用以解决现有技术在图片识别过程中,图片分割设备对图片中的字符分割效果较差的问题。其中,本发明所述方法和装置基于同一发明构思,由于方法及装置解决问题的原理相似,因此装置与方法的实施可以相互参见,重复之处不再赘述。
本发明实施例中,图片分割设备对获取的原始图片进行二值化处理以及去噪处理,生成第二图片;针对预设的每个符号模板,在所述第二图片中,筛选出与该符号模板像素相似度最高的图片块,该图片块的和该符号模板大小相同,在确定该图片块与该符号模板的像素相似度大于设定相似度阈值时,将该图片块作为待分割字符块;根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。这样,针对任何图片(例如包含的字符粘连、重叠,或者包含较大噪声的图片),图片分割设备可以通过符号模板匹配,提高分割图片的准确率,从而提高对图片进行分割的效率,进而增强了图片识别设备对图片的识别效率。
参阅图1所示,本发明实施例提供的一种图片分割方法,适用于图片分割设备,该图片分割设备可以集成在图片识别设备中,也可以是单独的物理存在。该方法的处理流程包括:
步骤101:获取原始图片,对所述原始图片进行二值化处理,生成第一图片,并对所述第一图片进行去噪处理,生成第二图片。
所述原始图片可以为验证码图片或者其他图片,本发明仅以验证码图片为例。
可选的,对所述原始图片进行二值化处理,包括:
将所述原始图片进行灰度化处理;
确定灰度化处理后的所述原始图片中的每个像素点的灰度值;
针对每个像素点,当该像素点的灰度值超过设定灰度阈值时,将该像素点的灰度值设置为255;当该像素点的灰度值未超过所述设定灰度阈值时,将该像素点的灰度值设置为0。
其中,所述设定灰度阈值的取值可以根据具体场景设定,也可以通过最大类间方差法(OTSU)算法等获得。
一般情况下,图片分割设备获取的原始图片为彩色图片,即,原始图片中的每个像素的颜色有红(red,R)、绿(green,G)、蓝(blue,B)3个分量决定,每个分量的取值区间为[0,255],传统的,将所述原始图片进行灰度化处理,具有多种方式,例如加权平均法、平均值法以及最大值法等,本发明对此不做限定。
通过上述论述可知,对所述原始图片进行二值化处理,生成的第一图片中,每个像素的灰度值为0或255,即所述第一图片为黑白图片。
可选的,对所述第一图片进行去噪处理,包括:
确定所述第一图片中每个连通区域中像素点的个数,其中,任意一个连通区域中每个像素点的灰度值为0,该连通区域中的任一个像素点与该连通区域中的至少一个其他像素点相邻,且与该连通区域中的任一个像素点相邻的灰度值为0的像素点均位于该连通区域内;
筛选出像素点的个数小于设定像素点数目阈值的连通区域;
将筛选出的连通区域中每个像素点的灰度值设置为255。
其中,可选的,确定所述第一图片中的任意一个连通区域,包括以下步骤:
A,遍历所述第一图片,在遍历到灰度值为0的像素点后,对该像素点设置一标记;
B,继续遍历该被标记的像素点8个邻域的像素点,将8个邻域的像素点中,灰度值为0的像素点设置所述标记;
C,重复执行步骤B,直至在所述第一图片中,被标记的像素点8个领域的像素点中,灰度值为0的像素点均被标记。
通常,当所述原始图片为验证码图片时,在对所述原始图片进行二值化处理后的所述第一图片中包含多个噪声,这些噪声会对降低后续图片识别设备的识别效率,降低识别的准确率,然而,每个噪声在所述第一图片中的面积较小,即每个噪声形成的连通区域中像素点的个数较少;相对于噪声,所述第一图片中的字符的面积较大,即每个字符形成的连通区域中像素点的个数较多。因此,像素点的个数小于设定像素点数目阈值的连通区域,为噪声形成的,而像素点的个数大于或等于设定像素点数目阈值的连通区域,通常为字符形成的。因此,通过所述设定像素点数目阈值,可以筛选出噪声形成的连通区域。因此,通过上述步骤,将所述第一图片中像素点的个数小于设定像素点数目阈值的连通区域的灰度值设置为255,这样,可以去除所述第一图片中的噪声。
步骤102:针对预设的每个符号模板,执行以下操作:遍历所述第二图片,在所述第二图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度;在所述至少一个图片块中,筛选出与该符号模板的像素相似度最高的图片块;并在判定筛选出的图片块与该符号模板的像素相似度大于设定相似度阈值时,将筛选出的图片块确定为待分割字符块;确定所述待分割字符块的偏移量,以及该符号模板的大小,其中,所述偏移量为所述待分割字符块的边缘与所述第二图片的相应边缘之间的像素点的个数。
在执行步骤102时,遍历所述第二图片,可以按照从左至右、从右至左、从上到下以及从下到上中任意一种顺序遍历,本发明对此不做限定,当所述第二图片横轴方向的像素点的个数大于或等于纵轴方向的像素点的个数,或者确定所述第二图片中字符为左右排列时,可选的,可以按照从左至右或从右至左的顺序遍历,这样,可以提高图片分割设备的工作效率;当所述第二图片纵轴方向的像素点的个数大于横轴方向的像素点的个数,或者确定所述第二图片中字符为上下排列时,可选的,可以按照从上到下或从下到上的顺序遍历,提高图片分割设备的工作效率;当所述第二图片横轴方向的像素点的个数大于或等于纵轴方向的像素点的个数,且所述第二图片的纵轴方向的像素点的个数大于符号模板的纵轴方向的像素点的个数时,可选的,可以先按照从左到右,同时从上到下的顺序遍历。
可选的,每个所述图片块与该符号模板的像素相似度,符合下述公式:
其中,di,j为该图片块与该符号模板的像素相似度,i为该图片块在横轴方向的偏移量,j为该图片块在纵轴方向的偏移量,M为该符号模板的横轴方向的像素点的个数,N为该符号模板的纵轴方向的像素点的个数,Sm,n为该符号模板中坐标为(m,n)的像素点的灰度值,Tm+i,n+j为该图片块中坐标为(m,n)的像素点的灰度值。通过以上公式可知,一个图片块与一个符号模板的像素相似度,即为该图片块中灰度值与该符号模板中对应位置的像素点的灰度值相同的所有像素点,占该图片块中总像素点的数目的比例。
其中,在上述公式中,当所述第二图片与该符号模板的纵轴方向的像素点的个数相同时,j=0。
所述相似度阈值为判定图片块中的字符与符号模板中的字符是否相同的经验值。在步骤102中,由于针对每个符号模板均会筛选出一个对应的像素相似度最高的图片块,然而,该图片块中的字符却不一定为对应的符号模板中的字符,因此,需要判定筛选出的与任一个符号模板的像素相似度最高的图片块中的字符是否与该符号模板中的字符相同,因此,通过所述相似度阈值来判定,所述相似度阈值可以根据具体应用场景具体设定。
步骤103:根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。
其中,每个待分割字符块对应的符号模板的大小为该符号模板的横轴方向的像素点个数,以及该符号模板的纵轴方向的像素点的个数,根据任一个待分割字符块的偏移量,以及所述待分割字符块对应的符号模板的大小,可以在所述第二图片中确定所述待分割字符块的位置,因此,所述分割设备可以根据所述待分割字符块的位置,对所述第二图片进行分割,生成一个待识别字符块。
在步骤103后,将所述第二图片进行分割,生成多个待识别字符块,图片识别设备可以通过机器学习的神经网络、支持向量机等方法对每个待识别字符块进行识别。
采用本发明上述实施例中的图片分割方法,图片分割设备对获取的原始图片进行二值化处理以及去噪处理,生成第二图片;针对预设的每个符号模板,在所述第二图片中,筛选出与该符号模板像素相似度最高的图片块,该图片块的和该符号模板大小相同,在确定该图片块与该符号模板的像素相似度大于设定相似度阈值时,将该图片块作为待分割字符块;根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。这样,针对任何图片(例如包含的字符粘连、重叠,或者包含较大噪声的图片),图片分割设备均可以通过符号模板匹配,提高分割图片的准确率,从而提高对图片进行分割的效率,进而增强了后续图片识别设备对图片的识别效率。
例如,图片分割设备获取原始验证码图片后,对所述原始验证码图片进行二值化处理,生成的第一验证码图片,如图2中的上方的验证码图片所示;
所述图片分割设备对所述第一验证码图片进行去噪处理,确定所述第一验证码图片中每个连通区域中像素点的个数,将像素点的个数小于设定像素点数目阈值的连通区域中的像素点的灰度值设置为0,生成第二验证码图片,如图2中的下方的验证码图片所示;
假设预设的多个符号模板中的字符分别为“加”、“减”、“乘”、“除”和“等”,每个符号模板与所述第二验证码图片的纵轴方向的像素点的个数相同;所述图片分割设备针对每个符号模板,执行:从左到右所述第二验证码图片,在所述第二验证码图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度,筛选出于该符号模板的像素相似度最高的图片块;判定字符为“加”的符号模板与对应的图片块的像素相似度大于设定相似度阈值90%,以及判定字符为“等”的符号模板与对应的图片块的像素相似度也大于所述相似度阈值,判定字符为“加”和“等”两个符号模板对应的图片块为待分割字符块,其他符号模板对应的图片块舍弃;
所述图片分割设备确定字符为“加”的符号模板对应的待分割字符块的偏移量为x,所述图片分割设备确定字符为“等”的符号模板对应的待分割字符块的偏移量为y,其中,所述偏移量为待分割字符块的左边缘与所述第二验证码图片的左边缘之间的像素点的个数;
所述图片分割设备确定字符为“加”、“等”的符号模板的大小——字符为“加”的符号模板的宽度为a,字符为“等”的符号模板的宽度为b,其中,符号模板的宽度为符号模板的横轴方向的像素点的个数;
由于每个符号模板与所述第二验证码图片的纵轴方向的像素点的个数相同,因此,确定的每个待分割字符块的偏移量均为该待分割字符块的横轴方向的偏移量,且在确定符号模板的大小时,仅可以确定符号模板的宽度;
所述图片分割设备根据所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二验证码图片进行分割,生成多个待识别字符块:
所述图片分割设备从左至右遍历所述第二验证码图片,如图3上方图片所示,确定首个灰度值为0的像素点在横轴方向的位置为第p个像素点,并确定最后一个灰度值为0的像素点在横轴方向的位置为第q个像素点,那么,所述第二验证码图片中第一个字符在横轴方向的像素点区间为[p,x],第二个字符在横轴方向的像素点区间为[x,x+a],第三个字符在横轴方向的像素点区间为[x+a,y],第四个字符在横轴方向的像素点区间为[y,y+b],第五个字符在横轴方向的像素点区间为[y+b,q];所述图片分割设备可以根据每个字符的像素点区间,对所述第二验证码图片进行分割,如图3所示,得到下方的待识别字符块;
图片识别设备可以采用传统的识别技术对每个待识别字符块进行识别。
基于以上实施例,本发明还提供了一种图片分割装置,该图片分割装置为图片识别设备中的分割模块,或者与图片识别装置均独立存在,该图片分割装置用于实现如图1所示的图片分割方法,参阅图4所示,所述图片分割装置400包括:获取单元401、第一处理单元402、第二处理单元403,以及分割单元404,其中,
获取单元401,用于获取原始图片;
第一处理单元402,用于对所述原始图片进行二值化处理,生成第一图片,并对所述第一图片进行去噪处理,生成第二图片;
第二处理单元403,用于针对预设的每个符号模板,执行以下操作:
遍历所述第二图片,在所述第二图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度;
在所述至少一个图片块中,筛选出与该符号模板的像素相似度最高的图片块;并在判定筛选出的图片块与该符号模板的像素相似度大于设定相似度阈值时,将筛选出的图片块确定为待分割字符块;
确定所述待分割字符块的偏移量,以及该符号模板的大小,其中,所述偏移量为所述待分割字符块的边缘与所述第二图片的相应边缘之间的像素点的个数;
分割单元404,用于根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。
可选的,所述第一处理单元402,在对所述原始图片进行二值化处理时,具体用于:
将所述原始图片进行灰度化处理;
确定灰度化处理后的所述原始图片中的每个像素点的灰度值;
针对每个像素点,当该像素点的灰度值超过设定灰度阈值时,将该像素点的灰度值设置为255;当该像素点的灰度值未超过所述设定灰度阈值时,将该像素点的灰度值设置为0。
可选的,所述第一处理单元402,在对所述第一图片进行去噪处理时,具体用于:
确定所述第一图片中每个连通区域中像素点的个数,其中,任意一个连通区域中每个像素点的灰度值为0,该连通区域中的任一个像素点与该连通区域中的至少一个其他像素点相邻,且与该连通区域中的任一个像素点相邻的灰度值为0的像素点均位于该连通区域内;
筛选出像素点的个数小于设定像素点数目阈值的连通区域;
将筛选出的连通区域中每个像素点的灰度值设置为255。
可选的,所述第二处理单元403,确定的每个所述图片块与该符号模板的像素相似度,符合下述公式:
其中,di,j为该图片块与该符号模板的像素相似度,i为该图片块在横轴方向的偏移量,j为该图片块在纵轴方向的偏移量,M为该符号模板的横轴方向的像素点的个数,N为该符号模板的纵轴方向的像素点的个数,Sm,n为该符号模板中坐标为(m,n)的像素点的灰度值,Tm+i,n+j为该图片块中坐标为(m,n)的像素点的灰度值。
可选的,当所述第二图片与该符号模板的纵轴方向的像素点的个数相同时,j=0。
采用本发明实施例提供的图片分割装置,图片分割装置对获取的原始图片进行二值化处理以及去噪处理,生成第二图片;针对预设的每个符号模板,在所述第二图片中,筛选出与该符号模板像素相似度最高的图片块,该图片块的和该符号模板大小相同,在确定该图片块与该符号模板的像素相似度大于设定相似度阈值时,将该图片块作为待分割字符块;根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。这样,针对任何图片(例如包含的字符粘连、重叠,或者包含较大噪声的图片),图片分割装置可以通过符号模板匹配,提高分割图片的准确率,从而提高对图片进行分割的效率,进而增强了后续图片识别设备在图片识别时的识别效率。
需要说明的是,本发明实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。在本申请的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明还提供了一种图片分割设备,用于实现如图1所示的图片分割方法,以及图4所示的图片分割装置的功能,若该图片分割设备在将图片分割后,还可以实现图片识别功能时,则该图片分割设备也称为图片识别设备。参阅图5所示,所述图片分割设备500中包括:收发器501、处理器502、总线503以及存储器504,其中,
收发器501、处理器502以及存储器504通过总线503相互连接;总线503可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
所述收发器501,用于获取原始图片。
所述处理器502,用于实现如图1所示的图片分割方法,包括:
获取原始图片,对所述原始图片进行二值化处理,生成第一图片,并对所述第一图片进行去噪处理,生成第二图片;
针对预设的每个符号模板,执行以下操作:
遍历所述第二图片,在所述第二图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度;
在所述至少一个图片块中,筛选出与该符号模板的像素相似度最高的图片块;并在判定筛选出的图片块与该符号模板的像素相似度大于设定相似度阈值时,将筛选出的图片块确定为待分割字符块;
确定所述待分割字符块的偏移量,以及该符号模板的大小,其中,所述偏移量为所述待分割字符块的边缘与所述第二图片的相应边缘之间的像素点的个数;
根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。
可选的,对所述原始图片进行二值化处理,包括:
将所述原始图片进行灰度化处理;
确定灰度化处理后的所述原始图片中的每个像素点的灰度值;
针对每个像素点,当该像素点的灰度值超过设定灰度阈值时,将该像素点的灰度值设置为255;当该像素点的灰度值未超过所述设定灰度阈值时,将该像素点的灰度值设置为0。
可选的,对所述第一图片进行去噪处理,包括:
确定所述第一图片中每个连通区域中像素点的个数,其中,任意一个连通区域中每个像素点的灰度值为0,该连通区域中的任一个像素点与该连通区域中的至少一个其他像素点相邻,且与该连通区域中的任一个像素点相邻的灰度值为0的像素点均位于该连通区域内;
筛选出像素点的个数小于设定像素点数目阈值的连通区域;
将筛选出的连通区域中每个像素点的灰度值设置为255。
可选的,每个所述图片块与该符号模板的像素相似度,符合下述公式:
其中,di,j为该图片块与该符号模板的像素相似度,i为该图片块在横轴方向的偏移量,j为该图片块在纵轴方向的偏移量,M为该符号模板的横轴方向的像素点的个数,N为该符号模板的纵轴方向的像素点的个数,Sm,n为该符号模板中坐标为(m,n)的像素点的灰度值,Tm+i,n+j为该图片块中坐标为(m,n)的像素点的灰度值。
可选的,当所述第二图片与该符号模板的纵轴方向的像素点的个数相同时,j=0。
该图片分割设备500还可以包括存储器504,用于存放程序,符号模板等。具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。存储器504可能包含随机存取存储器(random access memory,RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。所述处理器502执行存储器504所存放的应用程序,实现上述功能,从而实现如图1所示的图片分割方法。
综上所述,采用本发明实施例提供的图片分割方法、装置及设备,图片分割设备对获取的原始图片进行二值化处理以及去噪处理,生成第二图片;针对预设的每个符号模板,在所述第二图片中,筛选出与该符号模板像素相似度最高的图片块,该图片块的和该符号模板大小相同,在确定该图片块与该符号模板的像素相似度大于设定相似度阈值时,将该图片块作为待分割字符块;根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。这样,针对任何图片(例如包含的字符粘连、重叠,或者包含较大噪声的图片),图片分割设备可以通过符号模板匹配,提高分割图片的准确率,从而提高对图片进行分割的效率,进而增强了后续图片识别设备在图片识别时的识别效率。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种图片分割方法,其特征在于,包括:
获取原始图片,对所述原始图片进行二值化处理,生成第一图片,并对所述第一图片进行去噪处理,生成第二图片;其中,对所述第一图片进行去噪处理,包括:确定所述第一图片中每个连通区域中像素点的个数,其中,任意一个连通区域中每个像素点的灰度值为0,该连通区域中的任一个像素点与该连通区域中的至少一个其他像素点相邻,且与该连通区域中的任一个像素点相邻的灰度值为0的像素点均位于该连通区域内;筛选出像素点的个数小于设定像素点数目阈值的连通区域;将筛选出的连通区域中每个像素点的灰度值设置为255;其中,确定所述第一图片中的任意一个连通区域,包括:遍历所述第一图片,在遍历到灰度值为0的像素点后,对该像素点设置一标记;重复执行继续遍历该被标记的像素点8个邻域的像素点,将8个邻域的像素点中,灰度值为0的像素点设置所述标记,直至在所述第一图片中,被标记的像素点8个领域的像素点中,灰度值为0的像素点均被标记;
针对预设的每个符号模板,执行以下操作:
遍历所述第二图片,在所述第二图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度;
在所述至少一个图片块中,筛选出与该符号模板的像素相似度最高的图片块;并在判定筛选出的图片块与该符号模板的像素相似度大于设定相似度阈值时,将筛选出的图片块确定为待分割字符块;
确定所述待分割字符块的偏移量,以及该符号模板的大小,其中,所述偏移量为所述待分割字符块的边缘与所述第二图片的相应边缘之间的像素点的个数;
根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。
2.如权利要求1所述的方法,其特征在于,对所述原始图片进行二值化处理,包括:
将所述原始图片进行灰度化处理;
确定灰度化处理后的所述原始图片中的每个像素点的灰度值;
针对每个像素点,当该像素点的灰度值超过设定灰度阈值时,将该像素点的灰度值设置为255;当该像素点的灰度值未超过所述设定灰度阈值时,将该像素点的灰度值设置为0。
3.如权利要求1-2任一项所述的方法,其特征在于,每个所述图片块与该符号模板的像素相似度,符合下述公式:
其中,di,j为该图片块与该符号模板的像素相似度,i为该图片块在横轴方向的偏移量,j为该图片块在纵轴方向的偏移量,M为该符号模板的横轴方向的像素点的个数,N为该符号模板的纵轴方向的像素点的个数,Sm,n为该符号模板中坐标为(m,n)的像素点的灰度值,Tm+i,n+j为该图片块中坐标为(m,n)的像素点的灰度值。
4.如权利要求3所述的方法,其特征在于,当所述第二图片与该符号模板的纵轴方向的像素点的个数相同时,j=0。
5.一种图片分割装置,其特征在于,包括:
获取单元,用于获取原始图片;
第一处理单元,用于对所述原始图片进行二值化处理,生成第一图片,并对所述第一图片进行去噪处理,生成第二图片;其中,所述第一处理单元,在对所述第一图片进行去噪处理时,具体用于:确定所述第一图片中每个连通区域中像素点的个数,其中,任意一个连通区域中每个像素点的灰度值为0,该连通区域中的任一个像素点与该连通区域中的至少一个其他像素点相邻,且与该连通区域中的任一个像素点相邻的灰度值为0的像素点均位于该连通区域内;筛选出像素点的个数小于设定像素点数目阈值的连通区域;将筛选出的连通区域中每个像素点的灰度值设置为255;其中,确定所述第一图片中的任意一个连通区域,包括:遍历所述第一图片,在遍历到灰度值为0的像素点后,对该像素点设置一标记;重复执行继续遍历该被标记的像素点8个邻域的像素点,将8个邻域的像素点中,灰度值为0的像素点设置所述标记,直至在所述第一图片中,被标记的像素点8个领域的像素点中,灰度值为0的像素点均被标记;
第二处理单元,用于针对预设的每个符号模板,执行以下操作:
遍历所述第二图片,在所述第二图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度;
在所述至少一个图片块中,筛选出与该符号模板的像素相似度最高的图片块;并在判定筛选出的图片块与该符号模板的像素相似度大于设定相似度阈值时,将筛选出的图片块确定为待分割字符块;
确定所述待分割字符块的偏移量,以及该符号模板的大小,其中,所述偏移量为所述待分割字符块的边缘与所述第二图片的相应边缘之间的像素点的个数;
分割单元,用于根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。
6.如权利要求5所述的装置,其特征在于,所述第一处理单元,在对所述原始图片进行二值化处理时,具体用于:
将所述原始图片进行灰度化处理;
确定灰度化处理后的所述原始图片中的每个像素点的灰度值;
针对每个像素点,当该像素点的灰度值超过设定灰度阈值时,将该像素点的灰度值设置为255;当该像素点的灰度值未超过所述设定灰度阈值时,将该像素点的灰度值设置为0。
7.如权利要求5-6任一项所述的装置,其特征在于,所述第二处理单元,确定的每个所述图片块与该符号模板的像素相似度,符合下述公式:
其中,di,j为该图片块与该符号模板的像素相似度,i为该图片块在横轴方向的偏移量,j为该图片块在纵轴方向的偏移量,M为该符号模板的横轴方向的像素点的个数,N为该符号模板的纵轴方向的像素点的个数,Sm,n为该符号模板中坐标为(m,n)的像素点的灰度值,Tm+i,n+j为该图片块中坐标为(m,n)的像素点的灰度值。
8.如权利要求7所述的装置,其特征在于,当所述第二图片与该符号模板的纵轴方向的像素点的个数相同时,j=0。
9.一种图片分割设备,其特征在于,包括:
收发器,用于获取原始图片;
处理器,用于对所述原始图片进行二值化处理,生成第一图片,并对所述第一图片进行去噪处理,生成第二图片;其中,对所述第一图片进行去噪处理,包括:确定所述第一图片中每个连通区域中像素点的个数,其中,任意一个连通区域中每个像素点的灰度值为0,该连通区域中的任一个像素点与该连通区域中的至少一个其他像素点相邻,且与该连通区域中的任一个像素点相邻的灰度值为0的像素点均位于该连通区域内;筛选出像素点的个数小于设定像素点数目阈值的连通区域;将筛选出的连通区域中每个像素点的灰度值设置为255;其中,确定所述第一图片中的任意一个连通区域,包括:遍历所述第一图片,在遍历到灰度值为0的像素点后,对该像素点设置一标记;重复执行继续遍历该被标记的像素点8个邻域的像素点,将8个邻域的像素点中,灰度值为0的像素点设置所述标记,直至在所述第一图片中,被标记的像素点8个领域的像素点中,灰度值为0的像素点均被标记;
针对预设的每个符号模板,执行以下操作:
遍历所述第二图片,在所述第二图片中确定与该符号模板大小相同的至少一个图片块,并确定每个所述图片块与该符号模板的像素相似度;
在所述至少一个图片块中,筛选出与该符号模板的像素相似度最高的图片块;并在判定筛选出的图片块与该符号模板的像素相似度大于设定相似度阈值时,将筛选出的图片块确定为待分割字符块;
确定所述待分割字符块的偏移量,以及该符号模板的大小,其中,所述偏移量为所述待分割字符块的边缘与所述第二图片的相应边缘之间的像素点的个数;
根据确定的所有待分割字符块的偏移量,以及每个待分割字符块对应的符号模板的大小,对所述第二图片进行分割,生成多个待识别字符块。
CN201510967136.4A 2015-12-21 2015-12-21 一种图片分割方法、装置及设备 Active CN105631449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510967136.4A CN105631449B (zh) 2015-12-21 2015-12-21 一种图片分割方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510967136.4A CN105631449B (zh) 2015-12-21 2015-12-21 一种图片分割方法、装置及设备

Publications (2)

Publication Number Publication Date
CN105631449A CN105631449A (zh) 2016-06-01
CN105631449B true CN105631449B (zh) 2019-06-28

Family

ID=56046362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510967136.4A Active CN105631449B (zh) 2015-12-21 2015-12-21 一种图片分割方法、装置及设备

Country Status (1)

Country Link
CN (1) CN105631449B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886996A (zh) * 2017-02-10 2017-06-23 九次方大数据信息集团有限公司 基于数学运算验证码图像的分割方法和装置
CN107610145B (zh) * 2017-07-26 2020-08-14 同济大学 一种基于自适应阈值和模板匹配的自动胰腺分割方法
CN107688809B (zh) * 2017-08-28 2019-08-27 深圳壹账通智能科技有限公司 验证码识别方法、装置、计算机设备及计算机存储介质
CN109615660A (zh) * 2018-11-21 2019-04-12 吉利汽车研究院(宁波)有限公司 对车辆全景画面进行标定的方法及装置
CN111091128B (zh) * 2019-12-18 2023-09-22 北京数衍科技有限公司 字符图片分类方法、装置和电子设备
CN112191055B (zh) * 2020-09-29 2021-12-31 武穴市东南矿业有限公司 一种矿山机械用具有空气检测结构的降尘装置
CN112507910B (zh) * 2020-12-15 2023-01-17 平安银行股份有限公司 基于像素变形的图形识别方法、系统、电子装置及存储介质
CN112507921B (zh) * 2020-12-16 2024-03-19 平安银行股份有限公司 基于目标区域的图形搜索方法、系统、电子装置及存储介质
CN113158928B (zh) * 2021-04-27 2023-09-19 浙江云奕科技有限公司 一种基于图像识别的混凝土试块防造假方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050029161A (ko) * 2005-02-15 2005-03-24 한국정보통신대학교 산학협력단 공간 인터랙션 장치를 이용한 물체 인식 시스템 및 그 방법
CN101383003B (zh) * 2008-10-31 2010-09-15 江西赣粤高速公路股份有限公司 车辆号牌实时精确识别方法
CN103236056B (zh) * 2013-04-22 2016-05-25 中山大学 基于模板匹配的图像分割方法
CN104408454B (zh) * 2014-06-30 2017-10-17 电子科技大学 基于弹性模板匹配算法的车牌字符分割方法

Also Published As

Publication number Publication date
CN105631449A (zh) 2016-06-01

Similar Documents

Publication Publication Date Title
CN105631449B (zh) 一种图片分割方法、装置及设备
CN109670500B (zh) 一种文字区域获取方法、装置、存储介质及终端设备
US8509536B2 (en) Character recognition device and method and computer-readable medium controlling the same
CN107832767A (zh) 集装箱箱号识别方法、装置及电子设备
CN104217221A (zh) 基于纹理特征的书画作品检测方法
CN103729632A (zh) 一种基于连通区域滤波的圆形Mark点的定位方法
CN108197644A (zh) 一种图像识别方法和装置
CN111882568B (zh) 火灾图像边缘提取处理方法、终端及系统
CN112150371B (zh) 图像降噪方法、装置、设备及存储介质
CN107545223B (zh) 图像识别方法及电子设备
CN110136069A (zh) 文本图像矫正方法、装置与电子设备
CN112634301A (zh) 设备区域图像提取方法及装置
CN109522768A (zh) Qr码的识别方法及装置
CN106599891A (zh) 一种基于尺度相位谱显著性的遥感图像兴趣区快速提取方法
CN112634288A (zh) 设备区域图像分割方法及装置
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN106384071A (zh) 一种二维码扫描识别处理方法及装置
CN106331746A (zh) 用于识别视频文件中的水印位置的方法和装置
Agrawal et al. Stroke-like pattern noise removal in binary document images
Wicht et al. Camera-based sudoku recognition with deep belief network
CN111126248A (zh) 一种遮挡下的车辆识别方法及装置
CN107680246B (zh) 一种纸币图案中的曲线边界定位方法及设备
CN109035285B (zh) 图像边界确定方法及装置、终端及存储介质
CN107766865A (zh) 池化方法、物体检测方法、装置、系统及计算机可读介质
CN110598575B (zh) 表格版面分析与提取方法及相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220215

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee after: Huawei Cloud Computing Technologies Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221216

Address after: 518129 Huawei Headquarters Office Building 101, Wankecheng Community, Bantian Street, Gangqu District, Shenzhen, Guangdong

Patentee after: Huawei Cloud Computing Technologies Co.,Ltd.

Address before: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee before: Huawei Cloud Computing Technologies Co.,Ltd.

TR01 Transfer of patent right