CN105447508A - 一种字符图像验证码识别的方法及系统 - Google Patents

一种字符图像验证码识别的方法及系统 Download PDF

Info

Publication number
CN105447508A
CN105447508A CN201510761049.3A CN201510761049A CN105447508A CN 105447508 A CN105447508 A CN 105447508A CN 201510761049 A CN201510761049 A CN 201510761049A CN 105447508 A CN105447508 A CN 105447508A
Authority
CN
China
Prior art keywords
character
image
uproar
making
except
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510761049.3A
Other languages
English (en)
Inventor
董启文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd
Priority to CN201510761049.3A priority Critical patent/CN105447508A/zh
Publication of CN105447508A publication Critical patent/CN105447508A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种字符图像验证码识别的方法及系统,该方法包括:获取字符图像;对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别;该方法具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。

Description

一种字符图像验证码识别的方法及系统
技术领域
本发明涉及图像处理领域,特别涉及一种字符图像验证码识别的方法及系统。
背景技术
验证码的识别经过长时间的发展,其识别方法可分为三大类:以统计特征为基础的识别方法、以结构特征为基础的识别方法和以人工智能领域的多种机器学习方法相结合为基础的识别方法。
其中,以统计特征为基础的识别方法使用该类字符里具有良好区分性和一定稳定性的统计特征为标准模板特征向量。目前使用最多的统计特征主要是字符的投影特征序列,此外还有位置相关的和频域相互变换的特征。该方法需要针对某一种验证码来建立较标准的模板库,这样才会对该类验证码识别率较高,因而其适应性不够好,抗形变性较差。
以结构特征为基础的识别方法的本质是字符到结构空间的映射,实际识别中无须样本空间的建立,一般情况下不同的字符有其独特的结构特征集合,这些集合不应完全重合,将提取出的待识别字符特征所属的集合对应的字符作为识别结果。该类方法提前不需要相关的参数知识,只要验证码的结构比较固定,识别效果就会又好又快,且具有一定的适应性。
以人工智能领域的多种机器学习方法相结合为基础的识别方法使用机器学习算法建立的模型对采集的样本进行训练学习,获得稳定的参数后即可对新的待识别样本进行识别,这类方法有较强的鲁棒性和适应性,抗噪性较好且可移植。
综上所述,当前的识别方法主要以传统的诸如结构统计、概率甚至集合方法之类的确定性理论为基础来对验证码进行识别,这都导致其不足以来应对这些数据的不确定性,因而可能会对识别准确性和可靠性产生直接影响。因此,如何高效、可靠的对字符图像验证码进行识别是一个需要解决的问题。
发明内容
本发明的目的是提供一种字符图像验证码识别的方法及系统,该方法及系统具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
为解决上述技术问题,本发明提供一种字符图像验证码识别的方法,包括:
获取字符图像;
对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;
对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;
将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别。
其中,训练所述二维隐马尔科夫模型包括:
构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进行路径初始化,对预定参数进行重估计;
获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处理,得到每个字符图像的特征观察矩阵;
依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入;
对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率;
使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率;
比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出概率结果一致时,得到二维隐马尔科夫模型。
其中,对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪,包括:
将所述字符图像进行灰度处理,得到灰度图像;
利用大津法将所述灰度图像进行二值化处理,得到二值字符图像;
利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图像。
其中,对除噪后的二值字符图像进行字符分割,得到单个字符区域图像,包括:
将除噪后的二值字符图像进行水平方向上的投影;
选取投影中的空白区域的中心点作为分割点对除噪后的二值字符图像进行分割;
当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除噪后的二值字符图像进行分割。
其中,依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵,包括:
将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素的子块,其中,各子块之间有2像素重叠;
利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像;
获取变换后图像的左上角的2×2矩阵作为特征观察矩阵。
本发明提供一种字符图像验证码识别的系统,包括:
获取模块,用于获取字符图像;
二值化模块,用于对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;
分割模块,用于对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
特征观察矩阵模块,用于依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;
识别模块,用于将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别。
其中,包括训练模块,其中,所述训练模块包括:
构建单元,用于构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进行路径初始化,对预定参数进行重估计;
输入获取单元,用于获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处理,得到每个字符图像的特征观察矩阵;依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入;
从状态解码单元,用于对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率;
主状态解码单元,用于使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率;
比较单元,用于比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出概率结果一致时,得到二维隐马尔科夫模型。
其中,所述二值化模块包括:
灰度单元,用于将所述字符图像进行灰度处理,得到灰度图像;
二值化单元,用于利用大津法将所述灰度图像进行二值化处理,得到二值字符图像;
除噪单元,用于利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图像。
其中,所述分割模块包括:
水平投影单元,用于将除噪后的二值字符图像进行水平方向上的投影;选取投影中的空白区域的中心点作为分割点对除噪后的二值字符图像进行分割;
最短路径单元,用于当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除噪后的二值字符图像进行分割。
其中,所述特征观察矩阵模块包括:
切分单元,用于将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素的子块,其中,各子块之间有2像素重叠;
变换单元,用于利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像;
特征观察矩阵单元,用于获取变换后图像的左上角的2×2矩阵作为特征观察矩阵。
本发明所提供的字符图像验证码识别的方法及系统,该方法包括:获取字符图像;对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别;
该方法利用二维离散余弦变换与二维隐马尔科夫模型相结合的方法对字符图像验证码进行识别,提高了字符图像识别效果,且具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的字符图像验证码识别的方法的流程图;
图2为本发明实施例所提供的将原始彩色图片转化后的灰度图像的示意图;
图3为本发明实施例所提供的将灰度图像转化为二值字符图像后的示意图;
图4为本发明实施例所提供的将二值字符图像利用连通域滤波法除噪后的示意图;
图5为本发明实施例所提供的将二值字符图像利用最短路径法进行分割后的示意图;
图6为本发明实施例所提供的二维隐马尔科夫模型的示意图;
图7为本发明实施例所提供的训练二维隐马尔科夫模型的流程图;
图8为本发明实施例所提供的字符图像验证码识别的系统的结构框图。
具体实施方式
本发明的核心是提供一种字符图像验证码识别的方法及系统,该方法及系统具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的字符图像验证码识别的方法的流程图;该方法可以包括:
s100、获取字符图像;
其中,这里并不对获取字符图像的具体方式进行限定,只需要具有一个字符图像即可。
s110、对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;
其中,这里对字符图像的处理要根据获取的字符图像的特点进行,若获取的字符图像为灰度图像,则可以直接对其进行二值化处理,得到二值字符图像;若获取的字符图像为彩色字符图像,则首先将该彩色字符图像转化为灰度图像,在对该灰度图像进行二值化处理,得到二值字符图像。这里并不会二值化的具体算法和彩色图像转化为灰度图像的具体方式进行限定。只需要满足最后可以根据加载的字符图像得到二值字符图像即可。下面仅举出一个具体例子进行说明。
例如:若加载的字符图像为彩色字符图像,则可以首先获取每个像素的颜色,利用RGB形式进行表示,其中,RGB分别代表红色、绿色、蓝色分量。
彩色字符图像转为灰度图像可以使用如下的灰度变换公式:
Y=0.299R+0.587G+0.114B,其中R、G、B分别为像素点颜色的红色、绿色、蓝色分量。Y为得到的灰度图像;图2为将原始彩色图片转化为灰度后的图片。
将灰度图像转化为二值图像的方式:
可以采用阈值将灰度图像转换成二值图像,阈值的选取可以采用大津法(OSTU),即选择使得两类样本间方差最大的灰度值作为阈值。利用该方法对图2进行二值化转换,转换后如图3所示。
对二值字符图像进行除噪的方法很多,可以根据实际情况中图像的噪声特点进行选取,常用的除噪方法可以包括:连通域滤波,高斯滤波,超级曲线滤波等,其中,连通域滤波:去除连通域面积小于一定临界值的区域;高斯滤波:对图像进行傅立叶变换,采用高斯滤波器,之后对图像进行傅立叶反变换;超级曲线滤波:检测图像中存在的连续光滑长曲线并进行过滤。
例如对图3中的二值字符图像利用连通域滤波法去除图像中的噪点,取连通域面积临界值为5,结果如图4所示。
s120、对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
其中,要准确识别字符图像中的字符,需要对字符图像进行字符分割,即将字符图片切分,使得每个子图仅包含单个字符。采用水平投影和最短路径相结合的方法进行分割。分割后获得单个字符区域图像。
可选的,对除噪后的二值字符图像进行字符分割,得到单个字符区域图像可以包括:
将除噪后的二值字符图像进行水平方向上的投影;
选取投影中的空白区域的中心点作为分割点对除噪后的二值字符图像进行分割;
但是当除噪后的二值字符图像存在粘连字符时,可以采用最短路径法对除噪后的二值字符图像进行分割。例如对图4中的二值字符图像利用最短路径法进行分割后的示意图如图5所示。
s130、依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;
其中,特征提取的方式很多,这里使用二维离散余弦变换分别对分割后的单个字符图像进行特征提取。首先需要对单个字符区域图像进行切分,切分的大小可以根据用户进行确定。例如:将图像沿水平和垂直方向分割成若干长宽各为4像素的子块,各块之间有2像素的重叠。对每个子块进行二维离散余弦变换,取变换矩阵左上角的2×2矩阵元素作为特征观察矩阵。
s140、将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别。
其中,这里利用训练好的二维隐马尔科夫模型作为识别工具,根据特征观察矩阵对字符进行识别,得到识别结果即获得识别字符。
其中,可以在水平和垂直方向分别构建一维隐马尔科夫模型,并根据字符训练样本对模型进行训练,从而构建二维隐马尔科夫模型。
基于上述技术方案,本发明实施例提供的字符图像验证码识别的方法,克服自动化程序中验证码识别方法对于复杂字符图片验证码(存在噪音、字符粘连、倾斜、旋转、变形等)无法识别的缺陷。利用二维离散余弦变换与二维隐马尔科夫模型相结合的方法对字符图像验证码进行识别,提高了字符图像识别效果,且具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
可选的,上述技术方案中对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪可以包括:
将所述字符图像进行灰度处理,得到灰度图像;
利用大津法将所述灰度图像进行二值化处理,得到二值字符图像;
利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图像。
基于上述技术方案,对字符图片构建二维隐马尔科夫模型:水平方向上是一个一维的隐马尔科夫模型,而对于水平方向上的每一个状态,对应着垂直方向的一个一维隐马尔科夫模型。图6所示为一示例二维隐马尔科夫模型,以水平方向为主状态,垂直方向为从状态。具体训练过程,请参考图7,训练所述二维隐马尔科夫模型可以包括:
s200、构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进行路径初始化,对预定参数进行重估计;
s210、获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处理,得到每个字符图像的特征观察矩阵;
s220、依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入;
s230、对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率;
s240、使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率;
s250、比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出概率结果一致时,得到二维隐马尔科夫模型。
其中,重复上述步骤230和步骤240,直到二维隐马尔科夫模型达到稳定状态时结束。
基于上述实施例,可选的,依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵可以包括:
将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素的子块,其中,各子块之间有2像素重叠;
利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像;
获取变换后图像的左上角的2×2矩阵作为特征观察矩阵。
其中,上述过程具体为:每个字符图片在水平和垂直方向上分割成长宽各为4像素的子块,各块之间有2像素重叠。对每个子块进行离散余弦变换。设子块对应的图像为f(x,y),子块的图像大小为M×N(本例中M=4,N=4),则离散余弦变换后的图像为:
F ( u , v ) = a ( u ) a ( v ) Σ x = 0 M - 1 Σ y = 0 N - 1 f ( x , y ) cos [ π 2 M ( 2 x + 1 ) u ] cos [ π 2 N ( 2 y + 1 ) v ]
其中u=0,1,2,...M-1;v=0,1,2,...N-1,且
a ( u ) = 1 / M , u = 0 2 / M , u = 1 , 2 , ... , M - 1
a ( v ) = 1 / N , v = 0 2 / N , v = 1 , 2 , ... , M - 1
离散余弦变换后,取变换后图像左上角的2×2矩阵作为特征观察矩阵。
基于上述技术方案,本发明实施例提供的字符图像验证码识别的方法,利用二维离散余弦变换与二维隐马尔科夫模型相结合的方法对字符图像验证码进行识别,提高了字符图像识别效果,且具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
本发明实施例提供了字符图像验证码识别的方法,上述方法具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
下面对本发明实施例提供的字符图像验证码识别的系统进行介绍,下文描述的字符图像验证码识别的系统与上文描述的字符图像验证码识别的方法可相互对应参照。
请参考图8,图8为本发明实施例所提供的字符图像验证码识别的系统的结构框图;该系统可以包括:
获取模块100,用于获取字符图像;
二值化模块200,用于对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;
分割模块300,用于对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
特征观察矩阵模块400,用于依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;
识别模块500,用于将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别。
优选的,该系统包括训练模块,其中,所述训练模块包括:
构建单元,用于构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进行路径初始化,对预定参数进行重估计;
输入获取单元,用于获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处理,得到每个字符图像的特征观察矩阵;依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入;
从状态解码单元,用于对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率;
主状态解码单元,用于使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率;
比较单元,用于比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出概率结果一致时,得到二维隐马尔科夫模型。
可选的,所述二值化模块200包括:
灰度单元,用于将所述字符图像进行灰度处理,得到灰度图像;
二值化单元,用于利用大津法将所述灰度图像进行二值化处理,得到二值字符图像;
除噪单元,用于利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图像。
可选的,所述分割模块300包括:
水平投影单元,用于将除噪后的二值字符图像进行水平方向上的投影;选取投影中的空白区域的中心点作为分割点对除噪后的二值字符图像进行分割;
最短路径单元,用于当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除噪后的二值字符图像进行分割。
可选的,所述特征观察矩阵模块400包括:
切分单元,用于将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素的子块,其中,各子块之间有2像素重叠;
变换单元,用于利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像;
特征观察矩阵单元,用于获取变换后图像的左上角的2×2矩阵作为特征观察矩阵。
其中,上述过程具体为:每个字符图片在水平和垂直方向上分割成长宽各为4像素的子块,各块之间有2像素重叠。对每个子块进行离散余弦变换。设子块对应的图像为f(x,y),子块的图像大小为M×N(本例中M=4,N=4),则离散余弦变换后的图像为:
F ( u , v ) = a ( u ) a ( v ) Σ x = 0 M - 1 Σ y = 0 N - 1 f ( x , y ) cos [ π 2 M ( 2 x + 1 ) u ] cos [ π 2 N ( 2 y + 1 ) v ]
其中u=0,1,2,...M-1;v=0,1,2,...N-1,且
a ( u ) = 1 / M , u = 0 2 / M , u = 1 , 2 , ... , M - 1
a ( v ) = 1 / N , v = 0 2 / N , v = 1 , 2 , ... , M - 1
离散余弦变换后,取变换后图像左上角的2×2矩阵作为特征观察矩阵。
基于上述技术方案,本发明实施例提供的字符图像验证码识别的方法,利用二维离散余弦变换与二维隐马尔科夫模型相结合的方法对字符图像验证码进行识别,提高了字符图像识别效果,且具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
基于上述技术方案,本发明实施例提供的字符图像验证码识别的系统,根据字符图像的二维结构特点引入合适的二维隐马尔可夫模型;然后结合图像处理及识别的一系列流程,包括预处理中涉及到的图像去噪和分割技术,构建一套较为有效和准确的基于隐马尔可夫模型的验证码识别系统。该验证该识别模型不仅具有良好的适应性和有效性,还能高效的完成识别。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的字符图像验证码识别的方法及系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种字符图像验证码识别的方法,其特征在于,包括:
获取字符图像;
对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;
对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;
将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别。
2.如权利要求1所述的方法,其特征在于,训练所述二维隐马尔科夫模型包括:
构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进行路径初始化,对预定参数进行重估计;
获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处理,得到每个字符图像的特征观察矩阵;
依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入;
对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率;
使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率;
比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出概率结果一致时,得到二维隐马尔科夫模型。
3.如权利要求1所述的方法,其特征在于,对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪,包括:
将所述字符图像进行灰度处理,得到灰度图像;
利用大津法将所述灰度图像进行二值化处理,得到二值字符图像;
利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图像。
4.如权利要求3所述的方法,其特征在于,对除噪后的二值字符图像进行字符分割,得到单个字符区域图像,包括:
将除噪后的二值字符图像进行水平方向上的投影;
选取投影中的空白区域的中心点作为分割点对除噪后的二值字符图像进行分割;
当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除噪后的二值字符图像进行分割。
5.如权利要求4所述的方法,其特征在于,依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵,包括:
将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素的子块,其中,各子块之间有2像素重叠;
利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像;
获取变换后图像的左上角的2×2矩阵作为特征观察矩阵。
6.一种字符图像验证码识别的系统,其特征在于,包括:
获取模块,用于获取字符图像;
二值化模块,用于对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;
分割模块,用于对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
特征观察矩阵模块,用于依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;
识别模块,用于将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别。
7.如权利要求6所述的系统,其特征在于,包括训练模块,其中,所述训练模块包括:
构建单元,用于构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进行路径初始化,对预定参数进行重估计;
输入获取单元,用于获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处理,得到每个字符图像的特征观察矩阵;依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入;
从状态解码单元,用于对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率;
主状态解码单元,用于使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率;
比较单元,用于比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出概率结果一致时,得到二维隐马尔科夫模型。
8.如权利要求6所述的系统,其特征在于,所述二值化模块包括:
灰度单元,用于将所述字符图像进行灰度处理,得到灰度图像;
二值化单元,用于利用大津法将所述灰度图像进行二值化处理,得到二值字符图像;
除噪单元,用于利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图像。
9.如权利要求8所述的系统,其特征在于,所述分割模块包括:
水平投影单元,用于将除噪后的二值字符图像进行水平方向上的投影;选取投影中的空白区域的中心点作为分割点对除噪后的二值字符图像进行分割;
最短路径单元,用于当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除噪后的二值字符图像进行分割。
10.如权利要求9所述的系统,其特征在于,所述特征观察矩阵模块包括:
切分单元,用于将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素的子块,其中,各子块之间有2像素重叠;
变换单元,用于利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像;
特征观察矩阵单元,用于获取变换后图像的左上角的2×2矩阵作为特征观察矩阵。
CN201510761049.3A 2015-11-10 2015-11-10 一种字符图像验证码识别的方法及系统 Pending CN105447508A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510761049.3A CN105447508A (zh) 2015-11-10 2015-11-10 一种字符图像验证码识别的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510761049.3A CN105447508A (zh) 2015-11-10 2015-11-10 一种字符图像验证码识别的方法及系统

Publications (1)

Publication Number Publication Date
CN105447508A true CN105447508A (zh) 2016-03-30

Family

ID=55557667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510761049.3A Pending CN105447508A (zh) 2015-11-10 2015-11-10 一种字符图像验证码识别的方法及系统

Country Status (1)

Country Link
CN (1) CN105447508A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446897A (zh) * 2016-09-09 2017-02-22 浪潮软件股份有限公司 一种空心验证码的识别方法
CN107067006A (zh) * 2017-04-20 2017-08-18 金电联行(北京)信息技术有限公司 一种服务于数据采集的验证码识别方法及系统
CN107273890A (zh) * 2017-05-26 2017-10-20 亿海蓝(北京)数据技术股份公司 针对字符组合的图形验证码识别方法及装置
CN108446704A (zh) * 2018-03-29 2018-08-24 哈尔滨理工大学 一种粘连字符验证码分割与识别方法
CN109101974A (zh) * 2018-08-06 2018-12-28 北京京东金融科技控股有限公司 针对线状干扰的去噪方法和去噪装置
CN109189683A (zh) * 2018-08-28 2019-01-11 中金金融认证中心有限公司 一种用于app测试中验证码自动输入的方法及系统
CN110533003A (zh) * 2019-09-06 2019-12-03 兰州大学 一种穿线法车牌数字识别算法及设备
CN110765442A (zh) * 2019-09-30 2020-02-07 奇安信科技集团股份有限公司 一种识别验证图片中验证码的方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129560A (zh) * 2010-01-18 2011-07-20 富士通株式会社 字符识别的方法和设备
US20120134591A1 (en) * 2010-11-30 2012-05-31 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129560A (zh) * 2010-01-18 2011-07-20 富士通株式会社 字符识别的方法和设备
US20120134591A1 (en) * 2010-11-30 2012-05-31 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑小飞: "基于隐马尔可夫模型的验证码识别方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446897A (zh) * 2016-09-09 2017-02-22 浪潮软件股份有限公司 一种空心验证码的识别方法
CN107067006A (zh) * 2017-04-20 2017-08-18 金电联行(北京)信息技术有限公司 一种服务于数据采集的验证码识别方法及系统
CN107273890A (zh) * 2017-05-26 2017-10-20 亿海蓝(北京)数据技术股份公司 针对字符组合的图形验证码识别方法及装置
CN108446704A (zh) * 2018-03-29 2018-08-24 哈尔滨理工大学 一种粘连字符验证码分割与识别方法
CN109101974A (zh) * 2018-08-06 2018-12-28 北京京东金融科技控股有限公司 针对线状干扰的去噪方法和去噪装置
CN109101974B (zh) * 2018-08-06 2020-09-01 京东数字科技控股有限公司 针对线状干扰的去噪方法和去噪装置
CN109189683A (zh) * 2018-08-28 2019-01-11 中金金融认证中心有限公司 一种用于app测试中验证码自动输入的方法及系统
CN110533003A (zh) * 2019-09-06 2019-12-03 兰州大学 一种穿线法车牌数字识别算法及设备
CN110533003B (zh) * 2019-09-06 2022-09-20 兰州大学 一种穿线法车牌数字识别方法及设备
CN110765442A (zh) * 2019-09-30 2020-02-07 奇安信科技集团股份有限公司 一种识别验证图片中验证码的方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN105447508A (zh) 一种字符图像验证码识别的方法及系统
CN102930277B (zh) 一种基于识别反馈的字符图像验证码识别方法
CN109117848B (zh) 一种文本行字符识别方法、装置、介质和电子设备
US10817741B2 (en) Word segmentation system, method and device
US11475681B2 (en) Image processing method, apparatus, electronic device and computer readable storage medium
CN110598686B (zh) 发票的识别方法、系统、电子设备和介质
US9239948B2 (en) Feature descriptor for robust facial expression recognition
CN107292311A (zh) 一种基于神经网络的字符粘连验证码的识别方法
CN111178355B (zh) 印章识别方法、装置和存储介质
CN104424457A (zh) 一种非线性扭曲情况下的二维码识别方法
CN112418216A (zh) 一种复杂自然场景图像中的文字检测方法
CN105469026A (zh) 针对文档图像的水平和垂直线检测和移除
CN111681256A (zh) 图像边缘检测方法、装置、计算机设备和可读存储介质
CN110738030A (zh) 表格重建方法、装置、电子设备及存储介质
CN108171229B (zh) 一种空心粘连验证码的识别方法及系统
CN113159045A (zh) 一种结合图像预处理与卷积神经网络的验证码识别方法
CN108460388B (zh) 定位标志的检测方法、装置及计算机可读存储介质
CN115862030A (zh) 清除图像中文本的算法模型及其构建方法、装置及应用
CN112052907A (zh) 基于图像边缘信息的目标检测方法、装置及存储介质
CN113468905B (zh) 图形码识别方法、装置、计算机设备和存储介质
Saddami et al. Improvement of binarization performance using local otsu thresholding.
CN110969640A (zh) 视频图像的分割方法、终端设备以及计算机可读存储介质
CN117274999A (zh) 印章弯曲文本识别方法、系统、电子设备及存储介质
CN111539312A (zh) 一种从图像中抽取表格的方法
KR102026280B1 (ko) 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160330

RJ01 Rejection of invention patent application after publication