CN110555462A - 基于卷积神经网络的无固定多字符验证码识别方法 - Google Patents
基于卷积神经网络的无固定多字符验证码识别方法 Download PDFInfo
- Publication number
- CN110555462A CN110555462A CN201910713082.7A CN201910713082A CN110555462A CN 110555462 A CN110555462 A CN 110555462A CN 201910713082 A CN201910713082 A CN 201910713082A CN 110555462 A CN110555462 A CN 110555462A
- Authority
- CN
- China
- Prior art keywords
- character
- neural network
- convolutional neural
- model
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 27
- 238000012795 verification Methods 0.000 title claims description 12
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000005457 optimization Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 230000008034 disappearance Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Abstract
基于卷积神经网络的无固定多字符验证码识别方法,涉及到字符验证码识别方法技术领域。解决传统的字符验证码识别方法存在效率低,无法对相连或重叠字符定位识别,及不定字符数量的图片难处理或无法处理等的技术不足,步骤:(1)图像预处理;(2)特征提取;使用卷积神经网络进行处理;(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。运用多层卷积神经网络对图片进行预处理,提取图片特征信息;再运用概率模型作为优化目标,能够处理图片中无固定长度字符的识别问题,能够处理不定字符数量的图片,提高识别准确率,加快了处理效率和速度。
Description
技术领域
本发明涉及到字符验证码识别方法技术领域。
背景技术
传统的字符验证码识别方法都是对图像机型分步处理,具体处理流程是:待识别的字符验证码图像输入到识别系统中,首先要进行字符的定位,即要根据算法得到图中字符的位置;然后根据位置信息将所有字符分割成单独字符的形式;最后将单独的字符再送入最后的分类器中进行分类识别得到被分割的单独字符图像代表的字符信息进行组合才能得到最后的识别结。
传统的字符验证码识别方法的缺点:
(1)需要对图像进行分步处理,处理效率和速度较慢;
(2)对于一些相连或者重叠的字符,难以对字符进行准确定位;
(3)对于不定字符数量的图片难以处理甚至无法处理。
发明内容
综上所述,本发明的目的在于解决传统的字符验证码识别方法存在效率低,无法对相连或重叠字符定位识别,及不定字符数量的图片难处理或无法处理等的技术不足,而提出一种基于卷积神经网络的无固定多字符验证码识别方法。
为解决本发明所提出的技术问题,采用的技术方案为:
基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:
(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;
(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层提取图片中的局部特征信息;卷积神经网络的池化层减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;
(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。
在(3)字符识别过程中,在给定一张图片的条件下,训练一个序列概率模型;令S表示表示输出的结果序列,X表示输入的图片;目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化;
定义S作为一个包含N个随机变量S1,S2,…,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:
为了使得模型能够识别不定长度的字符,加入了额外的变量L来限制输出序列的长度;
由于概率模型不能直接用图像作为输入,因此,用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征;在这个模型中:
P(S|X)=P(S|H)
模型训练阶段,为了使得logP(S|X)在训练集上最大化,使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则;
在测试阶段,预测:
argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。
本发明的有益效果为:本发明的方法运用多层卷积神经网络对图片进行预处理,提取图片特征信息;再运用概率模型作为优化目标,改模型能够处理图片中无固定长度字符的识别问题,能够处理不定字符数量的图片,提高识别准确率,实现端到端的字符识别,避免了传统方法定位、分割、识别的分步操作,加快了处理效率和速度。
附图说明
图1为本发明的工作流程示意图;
图2为本发明的具体实施例的工作流程示意图。
具体实施方式
以下结合附图和本发明优选的具体实施例对本发明的方法作进一步地说明。参照图1和图2中所示,本发明基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:
(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;对于大量原始的输入图像,难免会存在尺寸不统一的问题,由于本发明所提出的方法只能接受相同大小的输入图像,因此,要对图像的大小进行统一,可以使用缩放、剪裁等方式。此外,由于验证码图片存在大量的噪声,可以提高图片对比度来减小噪声的影响。
(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层的使用能够最大程度地提取图片中的局部特征信息;卷积神经网络的池化层能够减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;
(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。
本发明的方法是在给定一张图片的条件下,训练一个序列概率模型。令S表示表示输出的结果序列,X表示输入的图片。本发明的目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化。
本发明定义S作为一个包含N个随机变量S1,S2,…,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,本发明假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:
为了使得模型能够识别不定长度的字符,本发明所做的是加入了额外的变量L来限制输出序列的长度。
由于概率模型不能直接用图像作为输入,因此,本发明用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征。在这个模型中:
P(S|X)=P(S|H)
模型训练阶段,为了使得logP(S|X)在训练集上最大化,本发明可以使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则。在测试阶段,本发明预测:
argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。
也即是本发明对输入图像首先由卷积神经网络层进行卷积计算,经过多层的卷积、池化、归一化操作最终可以提取到图像的特征信息,将特征信息传递给概率输出层。概率输出层是由多个单层的神经网络构成的,可以将图像特征映射到每个字符的概率上,最终得到概率最大的字符组合就是该图像的识别结果输出。
本发明技术方案:(1)实现端到端的字符识别,避免了传统方法定位、分割、识别的分步操作,加快了处理效率和速度。(2)没有预先设定图像包含字符的个数,通过概率组合得到概率最大字符组合便是识别结果的输出,能够处理不定长字符的图像识别问题。
Claims (2)
1.基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:
(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;
(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层提取图片中的局部特征信息;卷积神经网络的池化层减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;
(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。
2.根据权利要求1所述的基于卷积神经网络的无固定多字符验证码识别方法,其特征在于:在(3)字符识别过程中,在给定一张图片的条件下,训练一个序列概率模型;令S表示表示输出的结果序列,X表示输入的图片;目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化;
定义S作为一个包含N个随机变量S1,S2,...,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:
为了使得模型能够识别不定长度的字符,加入了额外的变量L来限制输出序列的长度;
由于概率模型不能直接用图像作为输入,因此,用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征;在这个模型中:
P(S|X)=P(S|H)
模型训练阶段,为了使得logP(S|X)在训练集上最大化,使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则;
在测试阶段,预测:
argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910713082.7A CN110555462A (zh) | 2019-08-02 | 2019-08-02 | 基于卷积神经网络的无固定多字符验证码识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910713082.7A CN110555462A (zh) | 2019-08-02 | 2019-08-02 | 基于卷积神经网络的无固定多字符验证码识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110555462A true CN110555462A (zh) | 2019-12-10 |
Family
ID=68737019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910713082.7A Pending CN110555462A (zh) | 2019-08-02 | 2019-08-02 | 基于卷积神经网络的无固定多字符验证码识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110555462A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401354A (zh) * | 2020-03-24 | 2020-07-10 | 南京红松信息技术有限公司 | 一种基于端到端自适应的垂直粘连字符的识别方法 |
CN112214750A (zh) * | 2020-10-16 | 2021-01-12 | 上海携旅信息技术有限公司 | 字符验证码的识别方法、系统、电子设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8965112B1 (en) * | 2013-12-09 | 2015-02-24 | Google Inc. | Sequence transcription with deep neural networks |
CN107145885A (zh) * | 2017-05-03 | 2017-09-08 | 金蝶软件(中国)有限公司 | 一种基于卷积神经网络的单字图文字识别方法及装置 |
CN107239786A (zh) * | 2016-03-29 | 2017-10-10 | 阿里巴巴集团控股有限公司 | 一种字符识别方法和装置 |
CN107368831A (zh) * | 2017-07-19 | 2017-11-21 | 中国人民解放军国防科学技术大学 | 一种自然场景图像中的英文文字和数字识别方法 |
CN107967475A (zh) * | 2017-11-16 | 2018-04-27 | 广州探迹科技有限公司 | 一种基于窗口滑动和卷积神经网络的验证码识别方法 |
CN108960245A (zh) * | 2018-07-13 | 2018-12-07 | 广东工业大学 | 轮胎模具字符的检测与识别方法、装置、设备及存储介质 |
CN109086722A (zh) * | 2018-08-06 | 2018-12-25 | 汉王科技股份有限公司 | 混合车牌识别方法、装置、电子设备 |
CN109977980A (zh) * | 2017-12-28 | 2019-07-05 | 航天信息股份有限公司 | 一种验证码识别方法及装置 |
CN109993169A (zh) * | 2019-04-11 | 2019-07-09 | 山东浪潮云信息技术有限公司 | 一种基于端到端的字符型验证码识别方法 |
-
2019
- 2019-08-02 CN CN201910713082.7A patent/CN110555462A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8965112B1 (en) * | 2013-12-09 | 2015-02-24 | Google Inc. | Sequence transcription with deep neural networks |
CN107239786A (zh) * | 2016-03-29 | 2017-10-10 | 阿里巴巴集团控股有限公司 | 一种字符识别方法和装置 |
CN107145885A (zh) * | 2017-05-03 | 2017-09-08 | 金蝶软件(中国)有限公司 | 一种基于卷积神经网络的单字图文字识别方法及装置 |
CN107368831A (zh) * | 2017-07-19 | 2017-11-21 | 中国人民解放军国防科学技术大学 | 一种自然场景图像中的英文文字和数字识别方法 |
CN107967475A (zh) * | 2017-11-16 | 2018-04-27 | 广州探迹科技有限公司 | 一种基于窗口滑动和卷积神经网络的验证码识别方法 |
CN109977980A (zh) * | 2017-12-28 | 2019-07-05 | 航天信息股份有限公司 | 一种验证码识别方法及装置 |
CN108960245A (zh) * | 2018-07-13 | 2018-12-07 | 广东工业大学 | 轮胎模具字符的检测与识别方法、装置、设备及存储介质 |
CN109086722A (zh) * | 2018-08-06 | 2018-12-25 | 汉王科技股份有限公司 | 混合车牌识别方法、装置、电子设备 |
CN109993169A (zh) * | 2019-04-11 | 2019-07-09 | 山东浪潮云信息技术有限公司 | 一种基于端到端的字符型验证码识别方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401354A (zh) * | 2020-03-24 | 2020-07-10 | 南京红松信息技术有限公司 | 一种基于端到端自适应的垂直粘连字符的识别方法 |
CN112214750A (zh) * | 2020-10-16 | 2021-01-12 | 上海携旅信息技术有限公司 | 字符验证码的识别方法、系统、电子设备和存储介质 |
CN112214750B (zh) * | 2020-10-16 | 2023-04-25 | 上海携旅信息技术有限公司 | 字符验证码的识别方法、系统、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109726657B (zh) | 一种深度学习场景文本序列识别方法 | |
CN111950453A (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN106980856B (zh) | 公式识别方法及系统和符号推理计算方法及系统 | |
CN111738169B (zh) | 一种基于端对端网络模型的手写公式识别方法 | |
CN115457531A (zh) | 用于识别文本的方法和装置 | |
CN107784288A (zh) | 一种基于深度神经网络的迭代定位式人脸检测方法 | |
CN110837830B (zh) | 一种基于时空卷积神经网络的图像字符识别方法 | |
CN113221956B (zh) | 基于改进的多尺度深度模型的目标识别方法及装置 | |
CN112233129A (zh) | 基于深度学习的并行多尺度注意力机制语义分割方法及装置 | |
CN114332133A (zh) | 基于改进CE-Net的新冠肺炎CT图像感染区分割方法及系统 | |
CN110598746A (zh) | 一种基于ode求解器自适应的场景分类方法 | |
CN111126155B (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN116310466A (zh) | 基于局部无关区域筛选图神经网络的小样本图像分类方法 | |
CN110555462A (zh) | 基于卷积神经网络的无固定多字符验证码识别方法 | |
CN116563683A (zh) | 一种基于卷积神经网络和多层感知机的遥感影像场景分类方法 | |
CN111898614B (zh) | 神经网络系统以及图像信号、数据处理的方法 | |
CN113743443B (zh) | 一种图像证据分类和识别方法及装置 | |
CN114581789A (zh) | 一种高光谱图像分类方法及系统 | |
CN118097268A (zh) | 一种基于监控场景的长尾目标检测方法 | |
CN111209886A (zh) | 一种基于深度神经网络的快速行人再识别方法 | |
CN114283431B (zh) | 一种基于可微分二值化的文本检测方法 | |
CN110688880A (zh) | 一种基于精简ResNet残差网络的车牌识别方法 | |
CN112699898B (zh) | 一种基于多层特征融合的图像方向识别方法 | |
CN111754459B (zh) | 基于统计深度特征的染色伪造图像检测方法及电子装置 | |
Chen et al. | Design and Implementation of Second-generation ID Card Number Identification Model based on TensorFlow |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191210 |
|
RJ01 | Rejection of invention patent application after publication |