CN110555462A - 基于卷积神经网络的无固定多字符验证码识别方法 - Google Patents

基于卷积神经网络的无固定多字符验证码识别方法 Download PDF

Info

Publication number
CN110555462A
CN110555462A CN201910713082.7A CN201910713082A CN110555462A CN 110555462 A CN110555462 A CN 110555462A CN 201910713082 A CN201910713082 A CN 201910713082A CN 110555462 A CN110555462 A CN 110555462A
Authority
CN
China
Prior art keywords
character
neural network
convolutional neural
model
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910713082.7A
Other languages
English (en)
Inventor
严文辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Suoxinda Data Technology Co Ltd
Original Assignee
Shenzhen Suoxinda Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Suoxinda Data Technology Co Ltd filed Critical Shenzhen Suoxinda Data Technology Co Ltd
Priority to CN201910713082.7A priority Critical patent/CN110555462A/zh
Publication of CN110555462A publication Critical patent/CN110555462A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

基于卷积神经网络的无固定多字符验证码识别方法,涉及到字符验证码识别方法技术领域。解决传统的字符验证码识别方法存在效率低,无法对相连或重叠字符定位识别,及不定字符数量的图片难处理或无法处理等的技术不足,步骤:(1)图像预处理;(2)特征提取;使用卷积神经网络进行处理;(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。运用多层卷积神经网络对图片进行预处理,提取图片特征信息;再运用概率模型作为优化目标,能够处理图片中无固定长度字符的识别问题,能够处理不定字符数量的图片,提高识别准确率,加快了处理效率和速度。

Description

基于卷积神经网络的无固定多字符验证码识别方法
技术领域
本发明涉及到字符验证码识别方法技术领域。
背景技术
传统的字符验证码识别方法都是对图像机型分步处理,具体处理流程是:待识别的字符验证码图像输入到识别系统中,首先要进行字符的定位,即要根据算法得到图中字符的位置;然后根据位置信息将所有字符分割成单独字符的形式;最后将单独的字符再送入最后的分类器中进行分类识别得到被分割的单独字符图像代表的字符信息进行组合才能得到最后的识别结。
传统的字符验证码识别方法的缺点:
(1)需要对图像进行分步处理,处理效率和速度较慢;
(2)对于一些相连或者重叠的字符,难以对字符进行准确定位;
(3)对于不定字符数量的图片难以处理甚至无法处理。
发明内容
综上所述,本发明的目的在于解决传统的字符验证码识别方法存在效率低,无法对相连或重叠字符定位识别,及不定字符数量的图片难处理或无法处理等的技术不足,而提出一种基于卷积神经网络的无固定多字符验证码识别方法。
为解决本发明所提出的技术问题,采用的技术方案为:
基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:
(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;
(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层提取图片中的局部特征信息;卷积神经网络的池化层减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;
(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。
在(3)字符识别过程中,在给定一张图片的条件下,训练一个序列概率模型;令S表示表示输出的结果序列,X表示输入的图片;目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化;
定义S作为一个包含N个随机变量S1,S2,…,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:
为了使得模型能够识别不定长度的字符,加入了额外的变量L来限制输出序列的长度;
由于概率模型不能直接用图像作为输入,因此,用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征;在这个模型中:
P(S|X)=P(S|H)
模型训练阶段,为了使得logP(S|X)在训练集上最大化,使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则;
在测试阶段,预测:
argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。
本发明的有益效果为:本发明的方法运用多层卷积神经网络对图片进行预处理,提取图片特征信息;再运用概率模型作为优化目标,改模型能够处理图片中无固定长度字符的识别问题,能够处理不定字符数量的图片,提高识别准确率,实现端到端的字符识别,避免了传统方法定位、分割、识别的分步操作,加快了处理效率和速度。
附图说明
图1为本发明的工作流程示意图;
图2为本发明的具体实施例的工作流程示意图。
具体实施方式
以下结合附图和本发明优选的具体实施例对本发明的方法作进一步地说明。参照图1和图2中所示,本发明基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:
(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;对于大量原始的输入图像,难免会存在尺寸不统一的问题,由于本发明所提出的方法只能接受相同大小的输入图像,因此,要对图像的大小进行统一,可以使用缩放、剪裁等方式。此外,由于验证码图片存在大量的噪声,可以提高图片对比度来减小噪声的影响。
(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层的使用能够最大程度地提取图片中的局部特征信息;卷积神经网络的池化层能够减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;
(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。
本发明的方法是在给定一张图片的条件下,训练一个序列概率模型。令S表示表示输出的结果序列,X表示输入的图片。本发明的目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化。
本发明定义S作为一个包含N个随机变量S1,S2,…,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,本发明假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:
为了使得模型能够识别不定长度的字符,本发明所做的是加入了额外的变量L来限制输出序列的长度。
由于概率模型不能直接用图像作为输入,因此,本发明用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征。在这个模型中:
P(S|X)=P(S|H)
模型训练阶段,为了使得logP(S|X)在训练集上最大化,本发明可以使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则。在测试阶段,本发明预测:
argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。
也即是本发明对输入图像首先由卷积神经网络层进行卷积计算,经过多层的卷积、池化、归一化操作最终可以提取到图像的特征信息,将特征信息传递给概率输出层。概率输出层是由多个单层的神经网络构成的,可以将图像特征映射到每个字符的概率上,最终得到概率最大的字符组合就是该图像的识别结果输出。
本发明技术方案:(1)实现端到端的字符识别,避免了传统方法定位、分割、识别的分步操作,加快了处理效率和速度。(2)没有预先设定图像包含字符的个数,通过概率组合得到概率最大字符组合便是识别结果的输出,能够处理不定长字符的图像识别问题。

Claims (2)

1.基于卷积神经网络的无固定多字符验证码识别方法,其特征在于所述方法采用如下步骤:
(1)图像预处理;对输入图像的大小进行统一处理和减噪处理;
(2)特征提取;使用卷积神经网络进行处理;其中,卷积神经网络的卷积层提取图片中的局部特征信息;卷积神经网络的池化层减少网络优化参数的数量;卷积神经网络的归一化层防止网络优化过程中发生梯度消失;卷积神经网络的输出层作为特征输入的下一步的字符识别任务中;
(3)字符识别;将提取得到的特征分别作为不同全连接网络的输入,其中一个全连接网络用于判断图片中字符的长度,其余全连接网络分别表示对应位置的字符;最后,将所有概率进行累乘,取概率最大的字符长度和字符组合作为最终的输出。
2.根据权利要求1所述的基于卷积神经网络的无固定多字符验证码识别方法,其特征在于:在(3)字符识别过程中,在给定一张图片的条件下,训练一个序列概率模型;令S表示表示输出的结果序列,X表示输入的图片;目标是训练模型P(S|X),使得在训练集上logP(S|X)的值最大化;
定义S作为一个包含N个随机变量S1,S2,...,SN的集合表示输出序列的元素,定义随机变量L表示输出序列的长度,假设输出序列中各个字符出现的概率都是独立的,因此,模型的概率可以表示为:
为了使得模型能够识别不定长度的字符,加入了额外的变量L来限制输出序列的长度;
由于概率模型不能直接用图像作为输入,因此,用卷积神经网络所提取的特征作为概率模型的输入,用随机变量H表示所提取的特征;在这个模型中:
P(S|X)=P(S|H)
模型训练阶段,为了使得logP(S|X)在训练集上最大化,使用随机梯度下降法进行优化,每个softmax模型可以使用完全相同的反向传播学习规则;
在测试阶段,预测:
argmax阶段可以在线性的时间复杂度下被计算出来,而且每个字符都可以被独立的计算。
CN201910713082.7A 2019-08-02 2019-08-02 基于卷积神经网络的无固定多字符验证码识别方法 Pending CN110555462A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910713082.7A CN110555462A (zh) 2019-08-02 2019-08-02 基于卷积神经网络的无固定多字符验证码识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910713082.7A CN110555462A (zh) 2019-08-02 2019-08-02 基于卷积神经网络的无固定多字符验证码识别方法

Publications (1)

Publication Number Publication Date
CN110555462A true CN110555462A (zh) 2019-12-10

Family

ID=68737019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910713082.7A Pending CN110555462A (zh) 2019-08-02 2019-08-02 基于卷积神经网络的无固定多字符验证码识别方法

Country Status (1)

Country Link
CN (1) CN110555462A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401354A (zh) * 2020-03-24 2020-07-10 南京红松信息技术有限公司 一种基于端到端自适应的垂直粘连字符的识别方法
CN112214750A (zh) * 2020-10-16 2021-01-12 上海携旅信息技术有限公司 字符验证码的识别方法、系统、电子设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8965112B1 (en) * 2013-12-09 2015-02-24 Google Inc. Sequence transcription with deep neural networks
CN107145885A (zh) * 2017-05-03 2017-09-08 金蝶软件(中国)有限公司 一种基于卷积神经网络的单字图文字识别方法及装置
CN107239786A (zh) * 2016-03-29 2017-10-10 阿里巴巴集团控股有限公司 一种字符识别方法和装置
CN107368831A (zh) * 2017-07-19 2017-11-21 中国人民解放军国防科学技术大学 一种自然场景图像中的英文文字和数字识别方法
CN107967475A (zh) * 2017-11-16 2018-04-27 广州探迹科技有限公司 一种基于窗口滑动和卷积神经网络的验证码识别方法
CN108960245A (zh) * 2018-07-13 2018-12-07 广东工业大学 轮胎模具字符的检测与识别方法、装置、设备及存储介质
CN109086722A (zh) * 2018-08-06 2018-12-25 汉王科技股份有限公司 混合车牌识别方法、装置、电子设备
CN109977980A (zh) * 2017-12-28 2019-07-05 航天信息股份有限公司 一种验证码识别方法及装置
CN109993169A (zh) * 2019-04-11 2019-07-09 山东浪潮云信息技术有限公司 一种基于端到端的字符型验证码识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8965112B1 (en) * 2013-12-09 2015-02-24 Google Inc. Sequence transcription with deep neural networks
CN107239786A (zh) * 2016-03-29 2017-10-10 阿里巴巴集团控股有限公司 一种字符识别方法和装置
CN107145885A (zh) * 2017-05-03 2017-09-08 金蝶软件(中国)有限公司 一种基于卷积神经网络的单字图文字识别方法及装置
CN107368831A (zh) * 2017-07-19 2017-11-21 中国人民解放军国防科学技术大学 一种自然场景图像中的英文文字和数字识别方法
CN107967475A (zh) * 2017-11-16 2018-04-27 广州探迹科技有限公司 一种基于窗口滑动和卷积神经网络的验证码识别方法
CN109977980A (zh) * 2017-12-28 2019-07-05 航天信息股份有限公司 一种验证码识别方法及装置
CN108960245A (zh) * 2018-07-13 2018-12-07 广东工业大学 轮胎模具字符的检测与识别方法、装置、设备及存储介质
CN109086722A (zh) * 2018-08-06 2018-12-25 汉王科技股份有限公司 混合车牌识别方法、装置、电子设备
CN109993169A (zh) * 2019-04-11 2019-07-09 山东浪潮云信息技术有限公司 一种基于端到端的字符型验证码识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401354A (zh) * 2020-03-24 2020-07-10 南京红松信息技术有限公司 一种基于端到端自适应的垂直粘连字符的识别方法
CN112214750A (zh) * 2020-10-16 2021-01-12 上海携旅信息技术有限公司 字符验证码的识别方法、系统、电子设备和存储介质
CN112214750B (zh) * 2020-10-16 2023-04-25 上海携旅信息技术有限公司 字符验证码的识别方法、系统、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN109726657B (zh) 一种深度学习场景文本序列识别方法
CN106980856B (zh) 公式识别方法及系统和符号推理计算方法及系统
CN109740679B (zh) 一种基于卷积神经网络和朴素贝叶斯的目标识别方法
CN111738169B (zh) 一种基于端对端网络模型的手写公式识别方法
CN107784288A (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
CN115457531A (zh) 用于识别文本的方法和装置
CN112233129B (zh) 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN110837830B (zh) 一种基于时空卷积神经网络的图像字符识别方法
CN113221956B (zh) 基于改进的多尺度深度模型的目标识别方法及装置
CN114332133A (zh) 基于改进CE-Net的新冠肺炎CT图像感染区分割方法及系统
CN110598746A (zh) 一种基于ode求解器自适应的场景分类方法
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN114626476A (zh) 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置
CN110555462A (zh) 基于卷积神经网络的无固定多字符验证码识别方法
CN114283431B (zh) 一种基于可微分二值化的文本检测方法
CN113743443B (zh) 一种图像证据分类和识别方法及装置
CN110688880A (zh) 一种基于精简ResNet残差网络的车牌识别方法
CN112699898B (zh) 一种基于多层特征融合的图像方向识别方法
CN114298054A (zh) 一种文本识别方法、装置、电子设备及可读存储介质
CN111754459B (zh) 基于统计深度特征的染色伪造图像检测方法及电子装置
CN114581789A (zh) 一种高光谱图像分类方法及系统
CN114708591A (zh) 基于单字连接的文档图像中文字符检测方法
CN114863442A (zh) 基于深度学习的文字识别方法、系统、装置和存储介质
CN113920127A (zh) 一种训练数据集独立的单样本图像分割方法和系统
Chen et al. Design and Implementation of Second-generation ID Card Number Identification Model based on TensorFlow

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination