CN107292307B - 一种倒置汉字验证码自动识别方法及系统 - Google Patents

一种倒置汉字验证码自动识别方法及系统 Download PDF

Info

Publication number
CN107292307B
CN107292307B CN201710599718.0A CN201710599718A CN107292307B CN 107292307 B CN107292307 B CN 107292307B CN 201710599718 A CN201710599718 A CN 201710599718A CN 107292307 B CN107292307 B CN 107292307B
Authority
CN
China
Prior art keywords
image
character
verification code
sample image
label information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710599718.0A
Other languages
English (en)
Other versions
CN107292307A (zh
Inventor
路松峰
罗立志
王同洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201710599718.0A priority Critical patent/CN107292307B/zh
Publication of CN107292307A publication Critical patent/CN107292307A/zh
Application granted granted Critical
Publication of CN107292307B publication Critical patent/CN107292307B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种倒置汉字验证码自动识别方法及系统,所述方法包括:对待识别验证码图像进行处理得到目标验证码图像,由目标验证码图像中每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;生成与目标验证码图像对应的标签信息,标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;将标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由倒置汉字自动识别模型将神经元的output个数设置为与标签信息的长度一致;使用交叉熵之和作为已训练的倒置汉字自动识别模型的损失函数,对损失函数进行训练,直至损失函数收敛,输出识别结果。可实现对倒置汉字验证码的自动识别。

Description

一种倒置汉字验证码自动识别方法及系统
技术领域
本发明属于自动识别技术领域,更具体地,涉及一种倒置汉字验证码自动识别方法及系统。
背景技术
随着互联网的高速发展,网络在给人们的生活带来极大便利的同时,其安全问题也日益突出。网络验证码作为一项广泛使用的验证手段,对网络安全起到了重要的作用。
目前,对于字符型验证码的识别主要就是对于文字的识别,主要流程如下:准备原始图片素材;图片预处理,字符切割,图片尺寸归一化;图片字符标记;字符图片特征提取;生成特征和标记对应的训练数据集;训练特征标记数据生成识别模型;使用识别模型预测新的未知图片集。
然而,传统的验证码识别技术是对验证码中出现的字符进行识别,比如数字,字母等。而没有关于如何对倒置中文字符的识别。
发明内容
针对现有技术的以上缺陷或改进需求,本发明的目的在于提供了一种倒置汉字验证码自动识别方法及系统,由此解决传统的验证码识别技术不能识别倒置中文字符的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种倒置汉字验证码自动识别方法,包括:
对待识别验证码图像进行处理得到目标验证码图像,获取所述目标验证码图像中每个字符的左右边界,根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
生成与所述目标验证码图像对应的标签信息,其中,所述标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致,其中,每个output均为一个二分类分类器;
使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数,对所述损失函数进行训练,直至所述损失函数收敛,输出识别结果,其中,所述交叉熵的个数与output个数相同。
优选地,所述已训练的倒置汉字自动识别模型的训练方法为:
对测试样本图像中的各样本图像分别进行处理,获取处理后的各样本图像中每个字符的左右边界,由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像;
分别生成与各样本图像对应的标签信息,其中,每张样本图像的标签信息采用二进制表示,0表示对应样本图像中的单字符图像中的字符正常,1表示对应样本图像中的单字符图像中的字符倒置;
依次将每张样本图像的标签信息的长度作为参数传递给训练模型,由所述训练模型根据输入的标签信息的长度设置神经元的output个数,其中,每个output均为一个二分类分类器;
使用交叉熵之和作为所述训练模型的损失函数,对所述训练模型进行训练,直至所述训练模型的输出正确率满足预设正确率要求,保存所述训练模型。
优选地,所述训练模型为2维卷积神经网络模型,所述2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层。
优选地,所述2维卷积神经网络模型的参数为,输入为验证码图像中的字符个数,卷积核数量为M,对每个输入提取M维特征,卷积核的大小为N*N,channel值为L,边界处理方式padding值为SAME,池化函数采用平均池化avg_pool,使用C*C池化,即将C*C的色块降为边界处理方式padding值为SAME。
优选地,M取值为32,N取值为5,L取值为1,C取值为2。
按照本发明的另一方面,提供了一种倒置汉字验证码自动识别系统,包括:
字符分割模块,用于对待识别验证码图像进行处理得到目标验证码图像,获取所述目标验证码图像中每个字符的左右边界,根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
标签信息生成模块,用于生成与所述目标验证码图像对应的标签信息,其中,所述标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
输入模块,用于将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致,其中,每个output均为一个二分类分类器;
识别模块,用于使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数,对所述损失函数进行训练,直至所述损失函数收敛,输出识别结果,其中,所述交叉熵的个数与output个数相同。
优选地,所述字符分割模块,还用于对测试样本图像中的各样本图像分别进行处理,获取处理后的各样本图像中每个字符的左右边界,由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像;
所述标签信息生成模块,还用于分别生成与各样本图像对应的标签信息,其中,每张样本图像的标签信息采用二进制表示,0表示对应样本图像中的单字符图像中的字符正常,1表示对应样本图像中的单字符图像中的字符倒置;
所述输入模块,还用于依次将每张样本图像的标签信息的长度作为参数传递给训练模型,由所述训练模型根据输入的标签信息的长度设置神经元的output个数,其中,每个output均为一个二分类分类器;
模型训练模块,用于使用交叉熵之和作为所述训练模型的损失函数,对所述训练模型进行训练,直至所述训练模型的输出正确率满足预设正确率要求,保存所述训练模型。
优选地,所述训练模型为2维卷积神经网络模型,所述2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层。
优选地,所述2维卷积神经网络模型的参数为,输入为验证码图像中的字符个数,卷积核数量为M,对每个输入提取M维特征,卷积核的大小为N*N,channel值为L,边界处理方式padding值为SAME,池化函数采用平均池化avg_pool,使用C*C池化,即将C*C的色块降为边界处理方式padding值为SAME。
优选地,M取值为32,N取值为5,L取值为1,C取值为2。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:通过对验证码图像进行分割得到各单字符图像,然后用二进制序列区分倒置与正常的字符,可以准确的区分倒置与正常字符;通过将生成的含有验证码图像中字符特性的标签信息的长度作为已训练的倒置汉字自动识别模型的输入,可以实现对倒置汉字验证码的自动识别;通过分割后的测试样本图像对构建的训练模型进行训练得到倒置汉字自动识别模型,可以自动识别出汉字验证码中的倒字,减少人工的操作,实现自动化过程。
附图说明
图1是本发明实施例公开的一种倒置汉字验证码自动识别方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示为本发明实施例公开的一种倒置汉字验证码自动识别方法的流程示意图,在图1所示的方法中,包括以下步骤:
S1、对待识别验证码图像进行处理得到目标验证码图像,获取目标验证码图像中每个字符的左右边界,根据每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
作为一种可选的实施方式,在步骤S1中,对待识别验证码图像进行处理可以采用以下方式:
将待识别验证码图像进行预处理,主要包括对图像进行灰度化、二值化、抑噪等技术。
1、图像的灰度化
RGB系统中一个颜色值由3个分量组成,这样的图像称为彩色图像,RGB系统称为颜色空间模型。常见的颜色空间模型还有HSI、CMYK等。如果一幅图像的颜色空间是一维的(一个颜色值只有一个颜色分量),则这幅图像就是一副灰度图。在位图图像中,一般以R=G=B来显示灰度图像。
常用的灰度化方法有以下三种:
g(x,y)=0.11×R(x,y)+0.59×G(x,y)+0.3×B(x,y) (2.2)
g(x,y)=min(R(x,y),G(x,y),B(x,y)) (2.3)
其中,公式(2.1)的方法来源于I色彩空间中I分量的计算公式,公式(2.2)来源于NTSC色彩空间中Y分量的计算公式。公式(2.3)是基于采用保留最小亮度(黑色)的方法。
RGB彩色图像可以看成是由3副单色的灰度图像构成的,可以直接取RGB通道中的任一个通道得到灰度化图像,如g(x,y)=B(x,y),前提是图像中目标像素的亮度信息主要分布在B通道上,否则灰度化结果将是亮度信息的大量丢失。灰度图像又叫亮度图像,由归一化的取值表示亮度,最大取值表示白色,最小取值表示黑色。
以P(x,y)表示图像中一个点,x、y分别是图像的横坐标和纵坐标,R(x,y)表示R通道的颜色分量,G(x,y)表示G通道的颜色分量,B(x,y)表示B通道的颜色分量。点P(x,y)的亮度值用L(x,y)表示。彩色图像的亮度没有严格的定义和计算公式,一般用公式(2.1)来计算,我们记作L1(x,y)。同样的用公式(2.2)计算的亮度值记作L2(x,y),用公式(2.3)计算的亮度值记作L3(x,y)。可以证明:
L3(x,y)≤L1(x,y) (2.4)
L3(x,y)≤L2(x,y) (2.5)
公式(2.1)取RGB通道的平均值,得到的图像相对比较柔和,同时也缩小了目标和背景的平均亮度差,不利于后续的阀值处理。公式(2.2)考虑了人眼对绿色的适应度最强,蓝色次之,红色最差。在处理绿色调和蓝色调的验证码图像时,公式(2.2)的效果令人满意,但在处理红色调的图像时,因为公式中红色的权值很小,灰度化后目标像素和背景像素的亮度差值被严重缩小,效果还不如公式(2.1)。公式(2.3)基于一个前提,那就是有限保留目标像素的亮度信息,利于后续的阀值分割。
2、图像的二值化
一般24位RGB图像的灰度图是8位256个灰度级的,如果把这个灰度级减少到1位2个灰度级,就得到一副二值图,二值图像中的数据全部是0或1。
作为一种可选的实施方式,在对待识别验证码图像进行处理得到目标验证码图像,还需要对目标验证码图像进行分割,其中,字符分割包括从验证码图像中分割出字符区域和把字符区域划分成单个字符两个部分。如果采用统计特征匹配以及神经网络法识别,必须要先分割出单个的字符。简单的分割方法包括等距分割、积分投影分割、交叉点分割、求连通区等。经过字符切割成为一组待检测的字符系列图片。根据图片中字符个数输出相同个数的0,1序列(其中0代表是汉字是正常,1代表汉字是倒置)。分割图片处理步骤,先扫描出每个字符的左右边界,即找出每个字符最左最右的点,根据边界进行裁剪。
S2、生成与目标验证码图像对应的标签信息,其中,标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
S3、将标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由已训练的倒置汉字自动识别模型将神经元的output个数设置为与标签信息的长度一致,其中,每个output均为一个二分类分类器;
S4、使用交叉熵之和作为已训练的倒置汉字自动识别模型的损失函数,对损失函数进行训练,直至损失函数收敛,输出识别结果,其中,交叉熵的个数与output个数相同。
其中,识别结果类似于010100(二进制个数等于字符个数,其中1表示该汉字倒置)。
其中,已训练的倒置汉字自动识别模型的训练方法为:
对测试样本图像中的各样本图像分别进行处理,获取处理后的各样本图像中每个字符的左右边界,由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像;
分别生成与各样本图像对应的标签信息,其中,每张样本图像的标签信息采用二进制表示,0表示对应样本图像中的单字符图像中的字符正常,1表示对应样本图像中的单字符图像中的字符倒置;
依次将每张样本图像的标签信息的长度作为参数传递给训练模型,由训练模型根据输入的标签信息的长度设置神经元的output个数,其中,每个output均为一个二分类分类器;
其中,采用此方式进行参数化以后可以适应不同数量字符的情况,达到更好的通用性。
使用交叉熵之和作为训练模型的损失函数,对训练模型进行训练,直至训练模型的输出正确率满足预设正确率要求,保存训练模型。
优选地,可以采用基于TensorFlow和TF-Slim工具包,对训练模型进行训练,优化器可以选择Adam,最后计算正确率,保存模型,预设正确率要求可以根据需要进行确定。
其中,训练模型为2维卷积神经网络模型,2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层,输出都是0,1序列(0,1的总个数和验证码图像中单个字符个数相同),优选地,可以使用TensorFlow提供的2维卷积神经网络模型。
其中,2维卷积神经网络模型的参数为,输入为验证码图像中的字符个数,卷积核数量为M,对每个输入提取M维特征,卷积核的大小为N*N,channel值为L,边界处理方式padding值为SAME,池化函数采用平均池化avg_pool,使用C*C池化,即将C*C的色块降为边界处理方式padding值为SAME。优选地,M取值为32,N取值为5,L取值为1,C取值为2。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种倒置汉字验证码自动识别方法,其特征在于,包括:
对待识别验证码图像进行处理得到目标验证码图像,获取所述目标验证码图像中每个字符的左右边界,根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
生成与所述目标验证码图像对应的标签信息,其中,所述标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致,其中,每个output均为一个二分类分类器;所述倒置汉字自动识别模型为2维卷积神经网络模型,所述2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层;
使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数,对所述损失函数进行训练,直至所述损失函数收敛,输出识别结果,其中,所述交叉熵的个数与output个数相同。
2.根据权利要求1所述的方法,其特征在于,所述已训练的倒置汉字自动识别模型的训练方法为:
对测试样本图像中的各样本图像分别进行处理,获取处理后的各样本图像中每个字符的左右边界,由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像;
分别生成与各样本图像对应的标签信息,其中,每张样本图像的标签信息采用二进制表示,0表示对应样本图像中的单字符图像中的字符正常,1表示对应样本图像中的单字符图像中的字符倒置;
依次将每张样本图像的标签信息的长度作为参数传递给训练模型,由所述训练模型根据输入的标签信息的长度设置神经元的output个数,其中,每个output均为一个二分类分类器;
使用交叉熵之和作为所述训练模型的损失函数,对所述训练模型进行训练,直至所述训练模型的输出正确率满足预设正确率要求,保存所述训练模型。
3.根据权利要求2所述的方法,其特征在于,所述2维卷积神经网络模型的参数为,输入为验证码图像中的字符个数,卷积核数量为M,对每个输入提取M维特征,卷积核的大小为N*N,channel值为L,边界处理方式padding值为SAME,池化函数采用平均池化avg_pool,使用C*C池化,将C*C的色块降为边界处理方式padding值为SAME。
4.根据权利要求3所述的方法,其特征在于,M取值为32,N取值为5,L取值为1,C取值为2。
5.一种倒置汉字验证码自动识别系统,其特征在于,包括:
字符分割模块,用于对待识别验证码图像进行处理得到目标验证码图像,获取所述目标验证码图像中每个字符的左右边界,根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像;
标签信息生成模块,用于生成与所述目标验证码图像对应的标签信息,其中,所述标签信息采用二进制表示,0表示单字符图像中的字符正常,1表示单字符图像中的字符倒置;
输入模块,用于将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型,由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致,其中,每个output均为一个二分类分类器;所述倒置汉字自动识别模型为2维卷积神经网络模型,所述2维卷积神经网络模型采用多层卷积层加上多层池化层,最后加上一个全连接层;
识别模块,用于使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数,对所述损失函数进行训练,直至所述损失函数收敛,输出识别结果,其中,所述交叉熵的个数与output个数相同。
6.根据权利要求5所述的系统,其特征在于,所述字符分割模块,还用于对测试样本图像中的各样本图像分别进行处理,获取处理后的各样本图像中每个字符的左右边界,由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像;
所述标签信息生成模块,还用于分别生成与各样本图像对应的标签信息,其中,每张样本图像的标签信息采用二进制表示,0表示对应样本图像中的单字符图像中的字符正常,1表示对应样本图像中的单字符图像中的字符倒置;
所述输入模块,还用于依次将每张样本图像的标签信息的长度作为参数传递给训练模型,由所述训练模型根据输入的标签信息的长度设置神经元的output个数,其中,每个output均为一个二分类分类器;
模型训练模块,用于使用交叉熵之和作为所述训练模型的损失函数,对所述训练模型进行训练,直至所述训练模型的输出正确率满足预设正确率要求,保存所述训练模型。
7.根据权利要求6所述的系统,其特征在于,所述2维卷积神经网络模型的参数为,输入为验证码图像中的字符个数,卷积核数量为M,对每个输入提取M维特征,卷积核的大小为N*N,channel值为L,边界处理方式padding值为SAME,池化函数采用平均池化avg_pool,使用C*C池化,即将C*C的色块降为边界处理方式padding值为SAME。
8.根据权利要求7所述的系统,其特征在于,M取值为32,N取值为5,L取值为1,C取值为2。
CN201710599718.0A 2017-07-21 2017-07-21 一种倒置汉字验证码自动识别方法及系统 Expired - Fee Related CN107292307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710599718.0A CN107292307B (zh) 2017-07-21 2017-07-21 一种倒置汉字验证码自动识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710599718.0A CN107292307B (zh) 2017-07-21 2017-07-21 一种倒置汉字验证码自动识别方法及系统

Publications (2)

Publication Number Publication Date
CN107292307A CN107292307A (zh) 2017-10-24
CN107292307B true CN107292307B (zh) 2019-12-17

Family

ID=60102053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710599718.0A Expired - Fee Related CN107292307B (zh) 2017-07-21 2017-07-21 一种倒置汉字验证码自动识别方法及系统

Country Status (1)

Country Link
CN (1) CN107292307B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992527B (zh) * 2017-11-09 2021-01-29 武汉极意网络科技有限公司 数据标记校验方法、服务器及存储介质
CN107886128A (zh) * 2017-11-10 2018-04-06 广东工业大学 一种羽毛球识别方法、系统、介质及设备
CN107967475B (zh) * 2017-11-16 2020-04-14 广州探迹科技有限公司 一种基于窗口滑动和卷积神经网络的验证码识别方法
CN108537115B (zh) * 2018-03-02 2022-01-25 创新先进技术有限公司 图像识别方法、装置及电子设备
CN108572593B (zh) * 2018-04-27 2020-12-18 北京源码矩阵科技有限公司 跨平台卷积神经网络控制系统及方法、信息数据处理终端
CN108764242A (zh) * 2018-05-21 2018-11-06 浙江工业大学 基于深层卷积神经网络的离线手写汉字体识别方法
CN111753575B (zh) * 2019-03-26 2024-10-18 杭州海康威视数字技术股份有限公司 文本识别方法、装置及设备
CN111178162B (zh) * 2019-12-12 2023-11-07 北京迈格威科技有限公司 图像识别方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419817A (zh) * 2010-09-27 2012-04-18 贵州黔驰电力信息技术有限公司 一种基于智能图像识别的自动文档扫描分析处理系统
CN105335754A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 文字识别方法及装置
CN106096602A (zh) * 2016-06-21 2016-11-09 苏州大学 一种基于卷积神经网络的中文车牌识别方法
CN106250756A (zh) * 2016-07-29 2016-12-21 智者四海(北京)技术有限公司 验证码的生成方法、验证方法及相应装置
CN106446897A (zh) * 2016-09-09 2017-02-22 浪潮软件股份有限公司 一种空心验证码的识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8774558B2 (en) * 2010-11-29 2014-07-08 Microsoft Corporation Rectification of characters and text as transform invariant low-rank textures

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419817A (zh) * 2010-09-27 2012-04-18 贵州黔驰电力信息技术有限公司 一种基于智能图像识别的自动文档扫描分析处理系统
CN105335754A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 文字识别方法及装置
CN106096602A (zh) * 2016-06-21 2016-11-09 苏州大学 一种基于卷积神经网络的中文车牌识别方法
CN106250756A (zh) * 2016-07-29 2016-12-21 智者四海(北京)技术有限公司 验证码的生成方法、验证方法及相应装置
CN106446897A (zh) * 2016-09-09 2017-02-22 浪潮软件股份有限公司 一种空心验证码的识别方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
A Low-cost Attack on a Microsoft CAPTCHA;Jeff Yan 等;《School of Computing Science》;20081231;第1-19页 *
A New Segmentation Method for Connected Characters in CAPTCHA;Pengpeng Lu 等;《2015 International Conference on Control, Automation and Information Sciences》;20151031;第128-131页 *
中文文本图像倒置快速检测算法;曾凡锋 等;《计算机工程与设计》;20120930;第33卷(第9期);第3512-3516页 *
卷积神经网络在验证码识别上的应用与研究;刘欢 等;《计算机工程与应用》;20161231;第52卷(第18期);第1-7页 *
基于卷积神经网络的铁路货运网站验证码识别;陈超 等;《指挥信息系统与技术》;20160831;第7卷(第4期);第91-96页 *
基于汉字笔画特征的文本图像倒置判断算法;王景中 等;《计算机技术与发展》;20140531;第24卷(第5期);第129-133页 *
基于神经网络的数字验证码识别研究;吕刚 等;《浙江工业大学学报》;20100831;第38卷(第4期);第433-436页 *

Also Published As

Publication number Publication date
CN107292307A (zh) 2017-10-24

Similar Documents

Publication Publication Date Title
CN107292307B (zh) 一种倒置汉字验证码自动识别方法及系统
CN107622274B (zh) 用于图像处理的神经网络训练方法、装置以及计算机设备
CN108090511B (zh) 图像分类方法、装置、电子设备及可读存储介质
CN108280426B (zh) 基于迁移学习的暗光源表情识别方法及装置
CN109522883A (zh) 一种人脸检测方法、系统、装置及存储介质
CN106127817B (zh) 一种基于通道的图像二值化方法
CN109740572A (zh) 一种基于局部彩色纹理特征的人脸活体检测方法
CN110930296A (zh) 图像处理方法、装置、设备及存储介质
CN118038515B (zh) 一种人脸识别方法
CN112633221A (zh) 一种人脸方向的检测方法及相关装置
CN103530625A (zh) 一种基于数字图像处理的光学字符识别方法
CN108647696B (zh) 图片颜值确定方法及装置、电子设备、存储介质
CN110991434B (zh) 自助终端证件识别方法及装置
US7620246B2 (en) Method and apparatus for image processing
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN113723410B (zh) 一种数码管数字识别方法及装置
US10764471B1 (en) Customized grayscale conversion in color form processing for text recognition in OCR
CN117809053A (zh) 一种基于邻域相对差异性的detr目标检测方法
CN109657544B (zh) 一种人脸检测方法和装置
CN116485992A (zh) 一种复合型三维扫描方法和装置、三维扫描仪
CN108491820B (zh) 图像中肢体表示信息的识别方法、装置及设备、存储介质
CN109766860A (zh) 基于改进的Adaboost算法的人脸检测方法
KR20030091471A (ko) YCrCb 칼라 기반 얼굴 영역 추출 방법
CN111754459B (zh) 基于统计深度特征的染色伪造图像检测方法及电子装置
CN110348530B (zh) 用于识别口红色号的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191217

Termination date: 20200721

CF01 Termination of patent right due to non-payment of annual fee