CN107038445A - 一种针对中文字符验证码的二值化和分割方法 - Google Patents

一种针对中文字符验证码的二值化和分割方法 Download PDF

Info

Publication number
CN107038445A
CN107038445A CN201710076581.0A CN201710076581A CN107038445A CN 107038445 A CN107038445 A CN 107038445A CN 201710076581 A CN201710076581 A CN 201710076581A CN 107038445 A CN107038445 A CN 107038445A
Authority
CN
China
Prior art keywords
character
image
point
identifying code
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710076581.0A
Other languages
English (en)
Other versions
CN107038445B (zh
Inventor
武星
裴孟齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Zhongdun Technology Co ltd
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201710076581.0A priority Critical patent/CN107038445B/zh
Publication of CN107038445A publication Critical patent/CN107038445A/zh
Application granted granted Critical
Publication of CN107038445B publication Critical patent/CN107038445B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

本发明涉及一种针对中文字符验证码的二值化和分割方法,目的在于对中文字符图像进行有效的前背景分割。本方法主要利用了高斯平滑滤波、形态学重建与Mean Shift聚类方法,首先,对图像进行灰度化以及除噪。对获取到的验证码图像进行灰度化,并针对图像噪声情况应用不同去噪方法,得到适合识别文字的字符图像。其次,对图像进行二值化,将前景的字符和背景分割开,进而定位表示字符的像素点。再次,对字符点进行聚类。对原始图像中的字符像素点应用Mean Shift聚类方法,得到这些字符的聚类。经过聚类调整后,处于同一聚类点的字符像素点将看作是表示同一字符。由此得到验证码图像中的每一个字符的像素点表示,即字符分割完毕。

Description

一种针对中文字符验证码的二值化和分割方法
技术领域
本发明涉及一种过滤二维字符验证码中背景噪声的方法,更具体地说,是一种针对中文字符验证码的二值化和分割方法。
背景技术
字符验证码被广泛应用于互联网服务中,作为判断网络请求是否来自合法用户的工具,从而防范机器的大量自动请求,保障网站服务器的稳定运行。字符验证码是目前最常被使用的一类验证码。该类验证码通常需要用户完成一个文字识别任务,用户需要正确识别出由计算机图像技术生成的字符图像中的各个字符以通过验证。为了提高机器识别验证码的难度,该类验证码的图像中通常会伴随有噪点、干扰线等作为干扰,字符本身通常会经过旋转、对称、仿射等变换。此外,一些验证码开始采用中文字符作为待识别字符。由于中文字符的笔划较多,线条结构较为复杂,使得传统方法难以有效地将字符前景与干扰背景分割开来。
字符类验证码识别的一般流程为:获取图像,图像预处理,字符分割,字符特征提取,字符识别。其中,验证码图像的预处理主要是对图像进行前背景分割:噪点、干扰线等被分为背景,进而将其过滤掉;字符被分为前景,以备特征提取和识别。
现有的字符类验证码识别中,预处理时通常借助大津法得到全局二值化阈值。这种方法不适用于存在背景渐变的验证码。此外,现有的识别方法对字符的分割主要采用竖直投影方法、基于连通区域分析的方法等。基于竖直投影的方法基于验证码中字符呈水平分布这一假设对图像进行字符分割。如果验证码中字符之间存在较密集的粘连,或是字符的分布不是水平时,这种方法很难从统计出的垂直投影直方图中估计出字符间隙,最终无法有效分割字符。基于连通区域分析的方法利用验证码中同一字符笔画的连通性,对图像进行字符分割。这种方法不适合分割中文字符验证码,汉字字符中,一个字符可能包含多个连通域。
发明内容
本发明的目的在于提供一种针对中文字符验证码的二值化和分割方法,利用高斯平滑滤波、形态学重建与Mean Shift聚类方法,能够对中文字符图像进行有效的前背景分割。
为实现上述目的,本发明采用如下技术方案:
一种针对中文字符验证码的二值化和分割方法,具体操作步骤如下:
(1)对获取到的原始验证码图像灰度化;
(2)对灰度图像进行去噪和二值化;去噪时,针对不同图像噪声情况应用不同去噪方法;
(3)定位前景字符点;统计前景、背景像素点数量,取数量较多的一类为背景点,数量较少的一类为前景点;
(4)对字符点进行聚类;针对待识别验证码图像的特点,选择不同的数据维度利用Mean Shift方法进行聚类;
(5)聚类调整:聚类后,对于分布比较分散的聚类,进一步对其进行聚类,得到更小更紧密的聚类;经过聚类调整后,处于同一个聚类点的字符像素点将看作是表示同一个字符,由此得到验证码图像中的每一个字符的像素点表示,即字符分割完毕。
所述步骤(2)中的针对不同图像噪声情况应用不同去噪方法,具体为:如果干扰线较粗或较密,或是验证码背景存在渐变,则运用核大小为1.0的高斯平滑和形态学重建方法;如果图像中字符与背景颜色对比度不强,则运用核大小为0.3的高斯平滑和形态学重建方法;如果干扰线较少,且背景无渐变,字符和背景对比度较高,则不进行去噪。
所述步骤(4)中的Mean Shift方法进行聚类,是对具体待识别验证码特点确定样本点数据维度的;如果原始验证码图像是灰度图像,或者是前景字符颜色统一的彩色图像,则取灰度图像的前景点像素在图像中的行列位置(r,c)以及该像素灰度值v作为待聚类数据点(r,c,v);如果原始验证码图像是彩色图像,而前景字符颜色不统一,则将原始图像转换到lab色彩空间,并取前景点像素在图像中的行列位置(r,c)以及该像素lab色彩值(l,a,b)作为待聚类数据点(r,c,l,a,b)。
与现有技术相比,本发明具有如下突出的优点:
(1)基于高斯滤波和形态学重建的去噪和二值化过程,使得对存在背景渐变的验证码能进行有效的二值化;
(2)去噪过程是自适应的。根据不同图像的特点实行不同的去噪策略,使本方法适用于更多模式的验证码识别;
(3)字符分割过程是自适应的。根据图像中背景和字符的颜色分布特点,选择不同特征作为分割依据。
(4)字符分割过程不限制字符数量。由于本方法分割前无需对字符数量进行估计因而可以分割任意个数的字符;
(5)字符分割过程对字符分布容忍性较强。由于本方法分割后对聚类结果进行进一步调整,因此分布较为密集的多个字符将被进一步分割为单独的字符,如此可以得到更加准确的字符分割结果。
附图说明
图1为本发明一种针对中文字符验证码的二值化和分割方法的流程图。
图2为本发明一种针对中文字符验证码的二值化和分割方法中图像去噪过程的流程图。
图3为本发明一种针对中文字符验证码的二值化和分割方法中确定Mean Shift聚类数据维度以及Mean Shift聚类过程的流程图。
具体实施方式
下面结合附图,对本发明的具体实施例做进一步的说明。
如图1所示,一种针对中文字符验证码的二值化和分割方法,具体操作步骤如下:
(1)对获取到的原始验证码图像灰度化,并将图像的像素值线性映射到[0,1]区间。
(2)对灰度图像进行除噪和二值化。如果图像中干扰线较多或较粗,或是存在渐变背景,则对图像分别进行没有高斯平滑的形态学重建和使用高斯平滑的形态学重建,然后将两次重建结果进行逐像素的或运算,得到去噪后的图像。其中,高斯平滑的核大小为1.0。如果图像中字符与背景颜色对比度不强,同样应用上述去噪过程,不过要选用大小为0.3的高斯核进行高斯平滑。如果图像中干扰线较少,则不进行除噪操作。对去噪后的图像应用大津法(一种通过最大化类间方差确定二值化阈值的方法),得到二值字符图像,如图2所示。
上述形态学重建的具体操作是,灰度图像作为重建的掩模图像I,将灰度图像每个像素点灰度值减去0.4作为重建的种子图像J,掩模图像和种子图像的值域为{0,1,…,N-1}。由种子图像J对掩模图像I按照下式进行灰度重建:
其中,Tk(·)表示对某灰度图像以阈值k进行二值化得到的二值图像。
(3)定位表示字符的前景点。对得到的二值字符图像统计其前、背景点像素数量,取数量较多的一类为背景点,数量较少的一类为前景点,即表示字符的像素点。也就是说,如果上一步中得到的二值字符图像中前景点比背景点多,则将前背景互换。
(4)对字符点聚类。使用Mean Shift方法(一种统计迭代的核密度估计方法,这里用于聚类)对字符点进行聚类。聚类之前需要确定要聚类的数据点维数。如果原始验证码图像是灰度图像,或者是前景字符颜色统一的彩色图像,则取灰度图像的前景点像素在图像中的行列位置(r,c)以及该像素灰度值v作为待聚类数据点(r,c,v);如果原始验证码图像是彩色图像,而前景字符颜色不统一,则将原始图像转换到lab色彩空间,并取前景点像素在图像中的行列位置(r,c)以及该像素lab色彩值(l,a,b)作为待聚类数据点(r,c,l,a,b)。确定了聚类数据点后,将这些数据点作为Mean Shift方法的输入,进行聚类,如图3所示。聚类得到一些聚类中心点,以及各个像素点对于这些聚类中心的归属情况。每一类有若干像素点,每个字符像素点都将被分配至某一类,这些像素点在颜色空间和位置空间上都比较相近。
(5)聚类调整。对于比较分散的聚类,进一步对这一类点进行聚类,得到更小更紧密的聚类。经过聚类调整后,处于同一个聚类点的字符像素点将看作是表示同一个字符,由此得到验证码图像中的每一个字符的像素点表示,即字符分割完毕。

Claims (3)

1.一种针对中文字符验证码的二值化和分割方法,其特征在于,具体操作步骤如下:
(1)对获取到的原始验证码图像灰度化;
(2)对灰度图像进行去噪和二值化;去噪时,针对不同图像噪声情况应用不同去噪方法;
(3)定位前景字符点;统计前景、背景像素点数量,取数量较多的一类为背景点,数量较少的一类为前景点;
(4)对字符点进行聚类;针对待识别验证码图像的特点,选择不同的数据维度利用MeanShift方法进行聚类;
(5)聚类调整:聚类后,对于分布比较分散的聚类,进一步对其进行聚类,得到更小更紧密的聚类;经过聚类调整后,处于同一个聚类点的字符像素点将看作是表示同一个字符,由此得到验证码图像中的每一个字符的像素点表示,即字符分割完毕。
2.根据权利要求1所述的针对中文字符验证码的二值化和分割方法,其特征在于,所述步骤(2)中的针对不同图像噪声情况应用不同去噪方法,具体为:如果干扰线较粗或较密,或是验证码背景存在渐变,则运用核大小为1.0的高斯平滑和形态学重建方法;如果图像中字符与背景颜色对比度不强,则运用核大小为0.3的高斯平滑和形态学重建方法;如果干扰线较少,且背景无渐变,字符和背景对比度较高,则不进行去噪。
3.根据权利要求1所述的针对中文字符验证码的二值化和分割方法,其特征在于,所述步骤(4)中的Mean Shift方法进行聚类,是对具体待识别验证码特点确定样本点数据维度的;如果原始验证码图像是灰度图像,或者是前景字符颜色统一的彩色图像,则取灰度图像的前景点像素在图像中的行列位置(r, c)以及该像素灰度值v作为待聚类数据点(r, c,v);如果原始验证码图像是彩色图像,而前景字符颜色不统一,则将原始图像转换到lab色彩空间,并取前景点像素在图像中的行列位置(r, c)以及该像素lab色彩值(l, a, b)作为待聚类数据点(r, c, l, a, b)。
CN201710076581.0A 2017-02-13 2017-02-13 一种针对中文字符验证码的二值化和分割方法 Active CN107038445B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710076581.0A CN107038445B (zh) 2017-02-13 2017-02-13 一种针对中文字符验证码的二值化和分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710076581.0A CN107038445B (zh) 2017-02-13 2017-02-13 一种针对中文字符验证码的二值化和分割方法

Publications (2)

Publication Number Publication Date
CN107038445A true CN107038445A (zh) 2017-08-11
CN107038445B CN107038445B (zh) 2021-01-12

Family

ID=59534335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710076581.0A Active CN107038445B (zh) 2017-02-13 2017-02-13 一种针对中文字符验证码的二值化和分割方法

Country Status (1)

Country Link
CN (1) CN107038445B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210462A (zh) * 2019-07-02 2019-09-06 北京工业大学 一种基于卷积神经网络的仿生海马认知地图构建方法
CN110363195A (zh) * 2019-06-18 2019-10-22 深圳壹账通智能科技有限公司 图形验证码识别方法、装置、可读存储介质及终端设备
CN110889415A (zh) * 2019-12-05 2020-03-17 上海交通大学 用于不同反光率表面的压印序列号字符分割方法
CN111178352A (zh) * 2019-12-13 2020-05-19 中国建设银行股份有限公司 一种验证码字符识别的方法和装置
CN111401137A (zh) * 2020-02-24 2020-07-10 中国建设银行股份有限公司 证件栏位识别的方法和装置
CN112966238A (zh) * 2021-03-09 2021-06-15 西安邮电大学 基于中文字符的身份认证方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398894A (zh) * 2008-06-17 2009-04-01 浙江师范大学 机动车车牌自动识别方法及其实现装置
US8009928B1 (en) * 2008-01-23 2011-08-30 A9.Com, Inc. Method and system for detecting and recognizing text in images
CN102254303A (zh) * 2011-06-13 2011-11-23 河海大学 遥感图像分割方法及遥感图像检索方法
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法
CN103020634A (zh) * 2011-09-26 2013-04-03 北京大学 用于验证码识别的分割方法和装置
CN103136753A (zh) * 2013-02-25 2013-06-05 哈尔滨工业大学 一种基于均值漂移算法和数学形态学的深度图分割方法
CN103258198A (zh) * 2013-04-26 2013-08-21 四川大学 一种表格文档图像中字符提取方法
CN104657726A (zh) * 2015-03-18 2015-05-27 哈尔滨工程大学 一种铁路油罐车车辆编号的识别方法
CN105095890A (zh) * 2014-04-25 2015-11-25 广州市动景计算机科技有限公司 图像中字符分割方法及装置
CN105404885A (zh) * 2015-10-28 2016-03-16 北京工业大学 一种二维字符图形验证码复杂背景噪音干扰去除方法
CN105426843A (zh) * 2015-11-19 2016-03-23 安徽大学 一种单镜头下掌静脉和掌纹图像采集装置及图像增强和分割方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8009928B1 (en) * 2008-01-23 2011-08-30 A9.Com, Inc. Method and system for detecting and recognizing text in images
CN101398894A (zh) * 2008-06-17 2009-04-01 浙江师范大学 机动车车牌自动识别方法及其实现装置
CN102254303A (zh) * 2011-06-13 2011-11-23 河海大学 遥感图像分割方法及遥感图像检索方法
CN103020634A (zh) * 2011-09-26 2013-04-03 北京大学 用于验证码识别的分割方法和装置
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法
CN103136753A (zh) * 2013-02-25 2013-06-05 哈尔滨工业大学 一种基于均值漂移算法和数学形态学的深度图分割方法
CN103258198A (zh) * 2013-04-26 2013-08-21 四川大学 一种表格文档图像中字符提取方法
CN105095890A (zh) * 2014-04-25 2015-11-25 广州市动景计算机科技有限公司 图像中字符分割方法及装置
CN104657726A (zh) * 2015-03-18 2015-05-27 哈尔滨工程大学 一种铁路油罐车车辆编号的识别方法
CN105404885A (zh) * 2015-10-28 2016-03-16 北京工业大学 一种二维字符图形验证码复杂背景噪音干扰去除方法
CN105426843A (zh) * 2015-11-19 2016-03-23 安徽大学 一种单镜头下掌静脉和掌纹图像采集装置及图像增强和分割方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LUC VINCENT 等: "Morphological Grayscale Reconstruction in Image Analysis:Applications and Efficient Algorithms", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 *
RAFAQAT HUSSAIN 等: "Segmentation of connected characters in text-basedCAPTCHAs for intelligent character recognition", 《SPRINGER》 *
何坤 等: "改进全变分的图像去噪", 《电子科技大学学报》 *
李凯胜: "中文验证码识别技术研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
郑阳洋: "数据挖掘技术在烟草企业CRM中的研究与应用", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363195A (zh) * 2019-06-18 2019-10-22 深圳壹账通智能科技有限公司 图形验证码识别方法、装置、可读存储介质及终端设备
WO2020253119A1 (zh) * 2019-06-18 2020-12-24 深圳壹账通智能科技有限公司 图形验证码识别方法、装置、可读存储介质及终端设备
CN110210462A (zh) * 2019-07-02 2019-09-06 北京工业大学 一种基于卷积神经网络的仿生海马认知地图构建方法
CN110889415A (zh) * 2019-12-05 2020-03-17 上海交通大学 用于不同反光率表面的压印序列号字符分割方法
CN110889415B (zh) * 2019-12-05 2023-04-21 上海交通大学 用于不同反光率表面的压印序列号字符分割方法
CN111178352A (zh) * 2019-12-13 2020-05-19 中国建设银行股份有限公司 一种验证码字符识别的方法和装置
CN111401137A (zh) * 2020-02-24 2020-07-10 中国建设银行股份有限公司 证件栏位识别的方法和装置
CN112966238A (zh) * 2021-03-09 2021-06-15 西安邮电大学 基于中文字符的身份认证方法
CN112966238B (zh) * 2021-03-09 2023-06-06 西安邮电大学 基于中文字符的身份认证方法

Also Published As

Publication number Publication date
CN107038445B (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
CN107038445A (zh) 一种针对中文字符验证码的二值化和分割方法
Yu et al. A novel license plate location method based on wavelet transform and EMD analysis
US20190188528A1 (en) Text detection method and apparatus, and storage medium
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
WO2017041488A1 (zh) 指纹纹线点的识别方法及装置
CN104978578A (zh) 手机拍照文本图像质量评估方法
CN111899292A (zh) 文字识别方法、装置、电子设备及存储介质
CN110245600B (zh) 自适应起始快速笔画宽度无人机道路检测方法
CN112991536B (zh) 一种专题地图地理面要素自动提取和矢量化方法
CN111784675A (zh) 物品纹理信息处理的方法、装置、存储介质及电子设备
CN113888536B (zh) 一种基于计算机视觉的印刷品重影检测方法及系统
CN114387591A (zh) 车牌识别方法、系统、设备及存储介质
Malik et al. An efficient skewed line segmentation technique for cursive script OCR
US20160125253A1 (en) Method and apparatus for image matching
Wang et al. Image sharpening detection based on difference sets
CN110427909B (zh) 一种移动端驾驶证检测方法、系统及电子设备和存储介质
CN115033721A (zh) 基于大数据的图像检索方法
Kumar et al. An efficient approach for automatic number plate recognition for low resolution images
Saddami et al. Improvement of binarization performance using local otsu thresholding.
US20150086113A1 (en) System and Method for Detection and Segmentation of Touching Characters for OCR
CN103617423A (zh) 基于色彩参数的图像拆分识别方法
CN110728276B (zh) 一种车牌识别方法及装置
CN110059695A (zh) 一种基于垂直投影的字符分割方法及终端
CN116543373A (zh) 基于区块链的直播视频大数据智能分析和优化方法及系统
Rajithkumar et al. Template matching method for recognition of stone inscripted Kannada characters of different time frames based on correlation analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240613

Address after: Tian'an Smart City 2-104, No. 228 Linghu Avenue, Xin'an Street, Xinwu District, Wuxi City, Jiangsu Province, 214000

Patentee after: Wuxi ZHONGDUN Technology Co.,Ltd.

Country or region after: China

Address before: 200444 No. 99, upper road, Shanghai, Baoshan District

Patentee before: Shanghai University

Country or region before: China