CN103020634A - 用于验证码识别的分割方法和装置 - Google Patents

用于验证码识别的分割方法和装置 Download PDF

Info

Publication number
CN103020634A
CN103020634A CN2011102877211A CN201110287721A CN103020634A CN 103020634 A CN103020634 A CN 103020634A CN 2011102877211 A CN2011102877211 A CN 2011102877211A CN 201110287721 A CN201110287721 A CN 201110287721A CN 103020634 A CN103020634 A CN 103020634A
Authority
CN
China
Prior art keywords
image
identifying code
pixel
bunch
code image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102877211A
Other languages
English (en)
Inventor
秦晓
吴於茜
康凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Peking University Founder Group Co Ltd
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd filed Critical Peking University
Priority to CN2011102877211A priority Critical patent/CN103020634A/zh
Publication of CN103020634A publication Critical patent/CN103020634A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种用于验证码识别的分割方法,包括:获取验证码图像;对验证码图像进行聚类处理,得到多个类簇图像;从多个类簇图像中筛选得到目标图像。本发明还提供了一种用于验证码识别的分割装置,包括:获取模块,用于获取验证码图像;聚类模块,用于对验证码图像进行聚类处理,得到多个类簇图像;筛选模块,用于从多个类簇图像中筛选得到目标图像。本发明改善了验证码分割效果。

Description

用于验证码识别的分割方法和装置
技术领域
本发明涉及计算机图像处理技术领域,具体而言,涉及一种用于验证码识别的分割方法和装置。 
背景技术
随着互联网技术的迅速发展,在为人们上网提供便利的同时也给黑客们提供了更广阔的操作空间,在线破解对网络安全的威胁越来越大。为了确保用户提交的请求是在线进行的正常操作,防止自动化程序的恶意行为,越来越多的网站如论坛类网站都采用了验证码技术,以保证服务器系统的稳定、用户信息的安全以及互联网的正常使用。 
验证码是为区别对方到底是人还是计算机程序而设置的一种验证措施。其用途广泛,如可以防止Blog里的垃圾回复,保护网站注册,保护Email地址不被机器爬虫收集,在线调查,避免字典攻击等等。国内外很多网站的论坛在注册、登录或发帖部分都采用了验证码技术。验证码的另一个主要应用场所是电子邮件类网站,用来辅助预防和阻止垃圾邮件群发。总之,验证码技术在互联网中的使用已经非常普遍。 
验证码有如下的特点:主要由数字、字母、汉字组成,有时还会出现韩文或日文,内容呈现随机性;可能由数字、字母或汉字的一种或几种组合而成,内容组合也呈现出随机性;验证码图片的颜 色多种多样,有的是彩色图片,有的则为黑白图片,呈现出颜色的随机性;验证码中包含2、4等不确定数量的字符,呈现出字符长度的随机性;验证码中存在干扰信息,而且这些干扰项是变化多样的,呈现出干扰信息的随机性;验证码中的字符位置多变,呈现出字符位置的随机性。 
相关技术的验证码分割的方法主要包含以下几个步骤: 
1、图像灰度化。选取一种灰度化算法,对图像进行灰度化处理,使图像中每个像素的R、G、B值相等,变成灰色。 
2、图像二值化处理。采用自适应阈值法或者指定阈值法选取阈值,对于灰度化后的图像的每个像素的像素值进行二值化处理,取值0或者1,即图像的像素仅显示为黑白两种颜色。 
3、图像梯度锐化处理。使图像中模糊的像素清晰化,同时也可以起到一定的去噪效果。图像锐化的方法有很多,如微分法、高通滤波法等。其中,一种锐化方法为Roberts梯度算子锐化法。定义如下: 
设原始图像上的像素为f(x,y)。 
定义f(x,y)在(x,y)处的梯度矢量为: 
G[f(i,j)]=|f(i,i)-f(i+1,j)|+|f(i,j)-f(i,j+1)| 
设一个判定阈值为Δ,变化后的图像g(x,y)定义为: 
g ( x , y ) = G [ f ( x , y ) ] ( G [ f ( x , y ) ] ≥ Δ ) f ( x , y ) ( G [ f ( x , y ) ] ≤ Δ )
4、图像去噪处理,去除图像中的干扰信息,保留图像中的有效信息。噪声的添加对网络安全具有一定的维护作用,同时噪声信息也给验证码识别造成了一定的障碍。 
5、字符分割,此步骤即为真正意义上的分割。惯用的分割方法为投影法,此方法的特点是算法较为简单,但容易产生分割错误。 
上述方法的缺点在于:虽然前期的预处理工作如灰度化、二值化、梯度锐化等操作有利于验证码的分割,但由于分割算法仅利用了验证码中字符的投影信息,经过一系列预处理操作后,很可能造成字符的像素信息出现严重缺失,字符之间往往存在粘连现象,将不利于后续识别工作的进行。 
发明内容
本发明旨在提供一种用于验证码识别的分割方法和装置,以解决相关技术的字符粘连的问题。 
在本发明的实施例中,提供了一种用于验证码识别的分割方法,包括:获取验证码图像;对验证码图像进行聚类处理,得到多个类簇图像;从多个类簇图像中筛选得到目标图像。 
在本发明的实施例中,提供了一种用于验证码识别的分割装置,包括:获取模块,用于获取验证码图像;聚类模块,用于对验证码图像进行聚类处理,得到多个类簇图像;筛选模块,用于从多个类簇图像中筛选得到目标图像。 
本发明上述实施例的用于验证码识别的分割方法和装置采用了聚类思想,从而解决了现有分割方案的字符粘连现象,改善了验证码分割效果。 
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: 
图1示出了根据本发明实施例的用于验证码识别的分割方法的流程图; 
图2示出了根据本发明优选实施例的聚类运算的流程图; 
图3示出了根据本发明优选实施例的筛选过程的流程图; 
图4示出了根据本发明优选实施例的归一化处理的流程图; 
图5-图11示出了根据本发明优选实施例的分割方法处理过程中的验证码图像; 
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。 
图1示出了根据本发明实施例的用于验证码识别的分割方法的流程图,包括: 
步骤S10,获取验证码图像; 
步骤S20,对验证码图像进行聚类处理,得到多个类簇图像; 
步骤S30,从多个类簇图像中筛选得到目标图像。 
相关技术在字符分割之前进行了预处理工作如灰度化、二值化、梯度锐化等操作,这使得很可能造成字符的像素信息出现严重缺失,字符之间往往存在粘连现象。而本实施例采用聚类处理,有效地利用了验证码中的信息,既能减少有用信息的损失,同时也能降低噪声的干扰,从而改善了验证码分割效果。 
优选地,步骤S10包括: 
从网页中提取包含验证码的图片,例如保存为.bmp或者.jpg格式; 
将图片转换为点阵数据格式,得到验证码图像。将图像转化为点阵数组的形式,便于下面聚类操作的进行。 
优选地,步骤S20包括: 
在验证码图像中选取一个像素作为聚类中心; 
确定验证码图像的每个像素的颜色值与聚类中心的颜色值的距离; 
以距离执行聚类运算,得到多个类簇图像。 
相关技术丢弃了像素的颜色信息,而在本优选实施例中,充分利用了像素的颜色信息,从而提高了分割效果。 
优选地,以距离执行聚类运算包括: 
扫描验证码图像中的像素; 
如果当前的像素的距离不大于阈值,则将当前的像素添加到当前的聚类中心的类簇集合中; 
否则,将当前的像素作为一个新的聚类中心; 
循环执行上述步骤,直到扫描完验证码图像中的所有像素; 
将像素个数大于预设值的像素集合保存为类簇图像。 
上述循环算法很容易通过计算机编程来实现。 
图2示出了根据本发明优选实施例的聚类运算的流程图,验证码图像中所有的像素的集合为Point[i],簇的集合为Cluster[k],初始时Cluster集合为空,本方法包括: 
步骤S102,从图像中随机选取一像素,作为初始的中心像素Initial,使Cluster[0]=Initial,并根据经验设置一个阈值threshold; 
步骤S104,对于图像中的某一像素Point[i],计算Point[i]与Cluster[k]的距离distance; 
步骤S106,判断distance是否大于threshold; 
步骤S108,若距离值distance大于阈值threshold,则将此像素添加到所属的簇内; 
步骤S110,否则将产生一个新类簇,并将此像素添加到新的类簇内; 
步骤S112,判断是否已扫描完验证码图像中的所有点(即像素),如果未扫描完,则回到步骤S104,使得不断产生新的类簇,某一类簇内像素的集合也在扩展,直到扫描完图像中的所有的像素 为止,对于所有的类簇图像,按照簇类像素的个数的多少挑选出有限数量的簇,并保存所有簇中的像素形成的类簇图像。在这些簇中,有的簇包含了验证码图像中的字符,有的簇则包含了图像中的噪音信息。 
上述聚类算法属于K-means(k平均)聚类,k平均聚类发明于1956年,该算法最常见的形式是采用被称为劳埃德算法(Lloyd algorithm)的迭代式改进探索法。劳埃德算法首先把输入像素分成k个初始化分组,可以是随机的或者使用一些启发式数据。然后计算每组的中心像素,根据中心像素的位置把对象分到离它最近的中心,重新确定分组。继续重复不断地计算中心并重新分组,直到收敛,即对象不再改变分组(中心像素位置不再改变)。 
优选地,本方法还包括步骤S114,对得到的类簇图像进行二值化处理,即颜色值大于特定值的像素设置为黑色像素,其他像素设置为白色像素,这可以方便后续的筛选处理。 
优选地,步骤S30包括:将多个类簇图像中宽度小于验证码图像的第一百分比,且高度小于验证码图像的第二百分比的类簇图像,确定为目标图像。该筛选方法比较简单,很容易得到验证码图像中的有效字符。 
优选地,调整第一百分比和第二百分比的值,使得目标图像的个数为预定个数且所述目标图像包含所述验证码。例如,Type样本验证码图像包含4个字符,假设初步设置第一百分比为1/3,设置第二百分比为1/4,得到的目标图像为2个,则显然第一百分比和第二百分比设置得太小,可以调整第一百分比和第二百分比的值为1/2,调整第二百分比的值为2/3,如果得到目标图像的个数为4个,则说明调整得比较合适。 
图3示出了根据本发明优选实施例的筛选过程的流程图,包括: 
步骤S202,取一个类簇图像,求取其中图像的水平方向的左右边界的差值|w|; 
步骤S204,判断|w|是否大于验证码图像宽度的1/2,如果是,则忽略该类簇图像,回到步骤S202,对下一个类簇图像进行处理; 
步骤S206,如果|w|不大于验证码图像宽度的1/2,则求取其中图像的垂直方向的上下边界的差值|h|; 
步骤S208,判断|h|是否大于验证码图像高度的2/3,如果是,则忽略该类簇图像,回到步骤S202,对下一个类簇图像进行处理; 
步骤S210,如果|h|不大于验证码图像的2/3,则保存此类簇图像为目标图像; 
步骤S212,判断是否已经扫描完所有类簇图像,如果没有处理完,则回到步骤S202,对下一个类簇图像进行处理,否则结束。 
优选地,本方法还包括:以多个目标图像的最左边界线的值从小到大,将多个目标图像排序;对各个目标图像进行膨胀和腐蚀处理;去除各个目标图像的左右边界和上下边界之外的区域;对去除处理之后的各个目标图像进行大小变换处理,使得各个目标图像的大小一致。本优选实施例使得分割得到的目标图像进行了归一化处理,从而便于后续处理。 
图4示出了根据本发明优选实施例的归一化处理的流程图,包括: 
步骤S302,对上述的Type个图像依次进行膨胀和腐蚀处理,膨胀操作主要针对于字符而进行的,腐蚀则主要是针对于噪音而进行的;膨胀处理的目的在于使图像中断断续续的像素粘连在一起,使字符趋于平滑和完整;腐蚀处理的目的在于将图像中孤立的像素或者粘连性相对较小的线去除,可以一定程度地起到图像去噪的效果; 
步骤S304,对于上述Type个目标图像,求取每个图像中所包含的字符在垂直方向上的左右分割线,记做Left和Right; 
步骤S306,以Left和Right为左右两边界将图像进行切分; 
步骤S308,对于上述Type个目标图像,求取每个图像中所包含的字符在水平方向上的上下分割线,记做Above和Below; 
步骤S310,以Above和Below为上下两边界将图像进行切分; 
步骤S312,可以设置图像的Height为13、Width为12,按照此尺度对图像进行归一化处理,使图像具有统一的标准和分布性; 
步骤S314,得到最终的字符分割图像。 
优选地,本方法还可在对验证码图像进行聚类处理之前,对验证码图像进行去噪处理,从而尽量去掉图像中可能产生干扰的噪音信息,保留有用信息。 
图5-图11示出了根据本发明优选实施例的分割方法处理过程中的验证码图像,字符图像生成的具体步骤如下: 
从网页中提取包含验证码的图片,如图5所示。需要说明的是,该图为彩图,图中各个字符为不同的颜色,背景为渐变的灰色,出于出版的缘故,本图只能表示为黑白色。 
对该图片进行聚类处理,以每个像素的RGB值为计算对象,依据图像中的像素点与聚类中心的颜色距离进行K-means聚类,产生多个类簇图像。初始状态时,随机选取图像中一点作为聚类质心,不断产生新的类簇,同时也不断扩展类簇内点的集合。聚类后的结果如图6所示,总共得到13个类簇图像。从图中可以看出:聚类后的图像中,有些图像包含很多的噪音信息,其中只有4幅图像是有效的类簇图像。 
依据验证码图片中字符的位置信息,从类簇图像中筛选出Type个目标图像,这些目标图像中恰好包含了验证码中的Type个字符。在此筛选出4幅目标图像。其中利用的位置信息主要包含:图像中字符的宽度小于图像宽度的1/2,字符的高度小于图像高度的2/3。不满足条件的图像将被剔除,如图7所示。 
求取每幅图像中字符的最左边界线,并依据最左边界线的大小对Type个图像进行排序,此操作的主要目的是保证字符在验证码中的原始排列顺序。排序后的结果如图8所示。 
对Type个字符图像依次进行膨胀和腐蚀处理,去除噪音信息,平滑字符。对于Type个字符图像,分别求取左右两边界,并根据求得的边界值对图像进行切割,如图9所示。 
对于Type个图像,分别求取上下两边界,并根据求得的边界值对图像进行切割,如图10所示。 
统一图片尺度,对图像进行归一化处理。图片的统一尺度为:Height=13;Width=12。归一化后的结果如图11所示。 
去噪处理的方法可以包括以下步骤: 
1、首先针对图像的边界进行处理,扫描到的像素为边界像素时,将此像素算作噪声像素,进行白化处理,即将此像素的RGB值都设置为255。 
2、对于某一像素,可以形成以该像素为中心的9宫格,计算此像素周围与其相邻接的所有的像素的个数; 
3、将所有邻接像素的个数与某一初始值相比较,确定此像素是否为噪声像素。此处初始值的选取是按照经验值选取的。 
4、若此像素为噪声像素,则将此像素进行白化处理。否则,扫描后续像素。 
5、重复上述过程,直至扫描完图像中的所有像素。 
图12示出了根据本发明实施例的用于验证码识别的分割装置的示意图,包括: 
获取模块10,用于获取验证码图像; 
聚类模块20,用于对验证码图像进行聚类处理,得到多个类簇图像; 
筛选模块30,用于从多个类簇图像中筛选得到目标图像。 
优选地,筛选模块包括:选取模块,用于在验证码图像中选取一个像素作为聚类中心;距离模块,用于确定验证码图像的每个像素的颜色值与聚类中心的颜色值的距离;运算模块,用于以距离执行聚类运算,得到多个类簇图像。 
从以上的描述中可以看出,本发明改善了验证码图像的分割效果。 
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。 
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。 

Claims (10)

1.一种用于验证码识别的分割方法,其特征在于,包括:
获取验证码图像;
对所述验证码图像进行聚类处理,得到多个类簇图像;
从所述多个类簇图像中筛选得到目标图像。
2.根据权利要求1所述的方法,其特征在于,获取验证码图像包括:
从网页中提取包含验证码的图片;
将所述图片转换为点阵数据格式,得到所述验证码图像。
3.根据权利要求1所述的方法,其特征在于,对所述验证码图像进行聚类处理包括:
在所述验证码图像中选取一个像素作为聚类中心;
确定所述验证码图像的每个像素的颜色值与所述聚类中心的颜色值的距离;
以所述距离执行聚类运算,得到所述多个类簇图像。
4.根据权利要求3所述的方法,其特征在于,以所述距离执行聚类运算包括:
扫描所述验证码图像中的像素;
如果当前的所述像素的所述距离不大于阈值,则将当前的所述像素添加到当前的聚类中心的像素集合中;否则,将当前的所述像素作为一个新的聚类中心;
循环执行上述步骤,直到扫描完所述验证码图像中的所有像素;
将像素个数大于预设值的所述像素集合保存为所述类簇图像。
5.根据权利要求1所述的方法,其特征在于,从所述多个类簇图像中筛选得到目标图像包括:
将所述多个类簇图像中宽度小于所述验证码图像的第一百分比,且高度小于所述验证码图像的第二百分比的类簇图像,确定为所述目标图像。
6.根据权利要求5所述的方法,其特征在于,调整所述第一百分比和所述第二百分比的值,使得所述目标图像的个数为预定个数且所述目标图像包含所述验证码。
7.根据权利要求6所述的方法,其特征在于,还包括:
以所述多个目标图像的最左边界线的值从小到大,将所述多个目标图像排序;
对各个所述目标图像进行膨胀和腐蚀处理;
去除各个所述目标图像的左右边界和上下边界之外的区域;
对去除处理之后的各个所述目标图像进行大小变换处理,使得各个所述目标图像的大小一致。
8.根据权利要求1所述的方法,其特征在于,还包括以下至少一个步骤:
在对所述验证码图像进行聚类处理之前,对所述验证码图像进行去噪处理;
在从所述多个类簇图像中筛选得到目标图像之前,对所述多个类簇图像进行二值化处理。
9.一种用于验证码识别的分割装置,其特征在于,包括:
获取模块,用于获取验证码图像;
聚类模块,用于对所述验证码图像进行聚类处理,得到多个类簇图像;
筛选模块,用于从所述多个类簇图像中筛选得到目标图像。
10.根据权利要求9所述的装置,其特征在于,所述筛选模块包括:
选取模块,用于在所述验证码图像中选取一个像素作为聚类中心;
距离模块,用于确定所述验证码图像的每个像素的颜色值与所述聚类中心的颜色值的距离;
运算模块,用于以所述距离执行聚类运算,得到所述多个类簇图像。
CN2011102877211A 2011-09-26 2011-09-26 用于验证码识别的分割方法和装置 Pending CN103020634A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102877211A CN103020634A (zh) 2011-09-26 2011-09-26 用于验证码识别的分割方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102877211A CN103020634A (zh) 2011-09-26 2011-09-26 用于验证码识别的分割方法和装置

Publications (1)

Publication Number Publication Date
CN103020634A true CN103020634A (zh) 2013-04-03

Family

ID=47969224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102877211A Pending CN103020634A (zh) 2011-09-26 2011-09-26 用于验证码识别的分割方法和装置

Country Status (1)

Country Link
CN (1) CN103020634A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103312512A (zh) * 2013-06-07 2013-09-18 深圳第七大道网络技术有限公司 一种图片验证码的生成方法及装置、身份验证方法及装置
CN104021376A (zh) * 2014-06-05 2014-09-03 北京乐动卓越科技有限公司 验证码识别方法和装置
CN105187443A (zh) * 2015-09-28 2015-12-23 上海斐讯数据通信技术有限公司 一种测试web验证码的系统及方法
CN105740863A (zh) * 2014-12-08 2016-07-06 阿里巴巴集团控股有限公司 信息处理方法及装置
CN106033508A (zh) * 2015-03-20 2016-10-19 深圳市腾讯计算机系统有限公司 空心字符验证码生成方法、装置和系统
CN107038445A (zh) * 2017-02-13 2017-08-11 上海大学 一种针对中文字符验证码的二值化和分割方法
CN110147851A (zh) * 2019-05-29 2019-08-20 北京达佳互联信息技术有限公司 图像筛选方法、装置、计算机设备及存储介质
CN110910400A (zh) * 2019-10-29 2020-03-24 北京三快在线科技有限公司 图像处理方法、装置、存储介质及电子设备
CN113536270A (zh) * 2021-07-26 2021-10-22 网易(杭州)网络有限公司 一种信息验证的方法、装置、计算机设备及存储介质
CN117011855A (zh) * 2023-10-08 2023-11-07 深圳市豪斯莱科技有限公司 一种字符串图像切割识别方法、系统和可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872416A (zh) * 2010-05-06 2010-10-27 复旦大学 对道路图像进行车牌识别的方法和系统
CN101944177A (zh) * 2010-08-30 2011-01-12 深圳市多赢软件技术有限公司 一种验证码识别方法
CN102136064A (zh) * 2011-03-24 2011-07-27 成都四方信息技术有限公司 一种图像文字识别系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872416A (zh) * 2010-05-06 2010-10-27 复旦大学 对道路图像进行车牌识别的方法和系统
CN101944177A (zh) * 2010-08-30 2011-01-12 深圳市多赢软件技术有限公司 一种验证码识别方法
CN102136064A (zh) * 2011-03-24 2011-07-27 成都四方信息技术有限公司 一种图像文字识别系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103312512B (zh) * 2013-06-07 2016-03-02 深圳第七大道网络技术有限公司 一种图片验证码的生成方法及装置、身份验证方法及装置
CN103312512A (zh) * 2013-06-07 2013-09-18 深圳第七大道网络技术有限公司 一种图片验证码的生成方法及装置、身份验证方法及装置
CN104021376A (zh) * 2014-06-05 2014-09-03 北京乐动卓越科技有限公司 验证码识别方法和装置
CN104021376B (zh) * 2014-06-05 2017-11-21 北京乐动卓越科技有限公司 验证码识别方法和装置
CN105740863A (zh) * 2014-12-08 2016-07-06 阿里巴巴集团控股有限公司 信息处理方法及装置
CN106033508A (zh) * 2015-03-20 2016-10-19 深圳市腾讯计算机系统有限公司 空心字符验证码生成方法、装置和系统
CN105187443B (zh) * 2015-09-28 2018-03-06 上海斐讯数据通信技术有限公司 一种测试web验证码的系统及方法
CN105187443A (zh) * 2015-09-28 2015-12-23 上海斐讯数据通信技术有限公司 一种测试web验证码的系统及方法
CN107038445A (zh) * 2017-02-13 2017-08-11 上海大学 一种针对中文字符验证码的二值化和分割方法
CN110147851A (zh) * 2019-05-29 2019-08-20 北京达佳互联信息技术有限公司 图像筛选方法、装置、计算机设备及存储介质
CN110910400A (zh) * 2019-10-29 2020-03-24 北京三快在线科技有限公司 图像处理方法、装置、存储介质及电子设备
CN113536270A (zh) * 2021-07-26 2021-10-22 网易(杭州)网络有限公司 一种信息验证的方法、装置、计算机设备及存储介质
CN113536270B (zh) * 2021-07-26 2023-08-08 网易(杭州)网络有限公司 一种信息验证的方法、装置、计算机设备及存储介质
CN117011855A (zh) * 2023-10-08 2023-11-07 深圳市豪斯莱科技有限公司 一种字符串图像切割识别方法、系统和可读存储介质

Similar Documents

Publication Publication Date Title
CN103020634A (zh) 用于验证码识别的分割方法和装置
Jia et al. Degraded document image binarization using structural symmetry of strokes
US20190188528A1 (en) Text detection method and apparatus, and storage medium
CN107609549B (zh) 一种自然场景下证件图像的文本检测方法
CN107967475B (zh) 一种基于窗口滑动和卷积神经网络的验证码识别方法
CN106875546B (zh) 一种增值税发票的识别方法
CN107093172B (zh) 文字检测方法及系统
CN101122953B (zh) 一种图片文字分割的方法
Bloomberg Multiresolution morphological approach to document image analysis
CN103034848B (zh) 一种表单类型的识别方法
CN107122777A (zh) 一种基于视频文件的车辆分析系统及分析方法
CN104298982A (zh) 一种文字识别方法及装置
CN104252620A (zh) 字符粘连的图形验证码识别方法
CN103577818A (zh) 一种图像文字识别的方法和装置
CN110298376A (zh) 一种基于改进b-cnn的银行票据图像分类方法
CN108009538A (zh) 一种汽车发动机缸体序列号智能识别方法
CN107066952A (zh) 一种车道线检测方法
CN110414506B (zh) 基于数据增广和卷积神经网络的银行卡卡号自动识别方法
CN107784469A (zh) 一种基于无人机航拍图像技术的仓库货物盘点方法
CN108038482A (zh) 一种汽车发动机缸体序列号视觉智能识别系统
Liu et al. Efficient modeling of spam images
CN110427909B (zh) 一种移动端驾驶证检测方法、系统及电子设备和存储介质
Shi et al. Image enhancement for degraded binary document images
CN104834926B (zh) 一种字符区域提取方法及系统
CN109740607A (zh) 字符图像的残缺区域检测和残缺字符图像恢复方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130403