CN107085730A - 一种字符验证码识别的深度学习方法及装置 - Google Patents

一种字符验证码识别的深度学习方法及装置 Download PDF

Info

Publication number
CN107085730A
CN107085730A CN201710180679.0A CN201710180679A CN107085730A CN 107085730 A CN107085730 A CN 107085730A CN 201710180679 A CN201710180679 A CN 201710180679A CN 107085730 A CN107085730 A CN 107085730A
Authority
CN
China
Prior art keywords
identifying code
deep learning
training
model
code identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710180679.0A
Other languages
English (en)
Inventor
张小彬
潘嵘
费行健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ipin Information Technology Co ltd
Original Assignee
Shenzhen Ipin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ipin Information Technology Co ltd filed Critical Shenzhen Ipin Information Technology Co ltd
Priority to CN201710180679.0A priority Critical patent/CN107085730A/zh
Publication of CN107085730A publication Critical patent/CN107085730A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种字符验证码识别的深度学习方法,该方法包括:步骤1,利用有标注标签的数据训练集来训练模型;步骤2,用训练好的模型来预测新的验证码图片中的文字。本发明实现了一个通用的验证码识别系统方法,在遇到一个新的网站验证码之后,可以通过训练该模型,或者对已经训练好的模型精细调参,得到一个高准确率的识别器,从而破解网站的验证码阻碍,本发明的模型构建简单,且提高了验证码识别的准确率。

Description

一种字符验证码识别的深度学习方法及装置
技术领域
本发明涉及一种字符识别方法,更具体的,涉及一种字符验证码识别的深度学习方法及装置。
背景技术
验证码(CAPTCHA)是一种反向图灵测试技术,常在网站中用于区分人类用户和计算机程序,防止破解密码,刷票,或者是论坛灌水等恶意行为,可以有效保障网站的安全和正常运行。验证码的设计,是利用了人类对于物体、字符的识别极其容易但是对计算机却非常困难的特点。验证码的识别,是人工智能领域一个重要的研究课题。研究验证码的破解方法,可以用来检测验证码安全性,也可以对网站验证码设计者有很大的借鉴作用。
验证码有很多形式,但是最常见的是字符型验证码,即一些随机产生的中英文字符,在旋转和扭曲后,加上一些随机线和噪声点背景的扰动,生成验证码图片。因为验证码的图片和正常的文字图片相比,已经发生了严重的扭曲,所以一般的光学字符识别软件很难正常识别出来其中的文字。
一般的验证码识别流程,如文献[Shujun Li, Roland Schmitz. Breaking e-banking CAPTCHAs. Proceedings of 26th Annual Computer Security ApplicationsConference ACSAC 2010] 中提到的方法,可以大致分为预处理,定位,切分和识别四个步骤。用二值化,背景去噪,去干扰线算法等一系列预处理工作,是为了得到更清晰的图片,便于后续的流程。定位操作是把字符从图片中找出来,切分则是把连续的序列字符,切分成单一的字符,识别则是针对每个单一的字符识别,可以转换成机器学习中的分类任务。如果是传统的分类器,如支持向量机,则还要多一个对图片的特征提取工作。
上述论文中的方法,造成识别率的瓶颈主要是单字切分这一步。由于人工智能技术的发展,简单的验证码很容易被破解,因此验证码的设计也越来越复杂,其中最常见的就是字符之间存在着严重的笔画粘连。如果用简单的垂直投影切分算法,则无法很好地切分出粘连的两个单字符,其他基于切分点的方法又复杂而效果难以尽如人意。此外,把验证码的识别分成独立的单字符来识别,在如中文成语这种带有语义的验证码识别中,就会丢失上下文信息。这些缺点都会很大程度上影响最终的识别效果。
发明内容
本发明的目的,就是为了构建一种把定位、切分和识别结合起来的端到端(End-to-End)的深度学习方法,即直接输入图片,系统会预测整个图片中的序列字符结果。通过有监督训练的方法,训练一个卷积神经网络(Convolutional Neural Network)来做特征提取,用多个联合的Softmax分类器做识别。 较之以前传统的方法,该方法模型搭建简单,准确率也大大提升,且因为是端到端的训练方法,不同的验证码识别思路基本相同,而不需要像原来那样针对性地重新寻找破解思路。
为实现上述目的,本发明提供了一种字符验证码识别的深度学习方法,该方法包括如下步骤:
步骤1,利用有标注标签的数据训练集来训练模型;
步骤2,用训练好的模型来预测新的验证码图片中的文字;
其中,步骤1还包括训练集的收集、模型训练的粒度和交叉验证过程。
更具体的,所述步骤1中所述训练集的收集具体包括:
若深度学习需要大量的有标注数据,则利用爬虫程序,在网站获取若干验证码样本,用打码平台的众包服务标注数据;
若需要的样本数不多,则手动标注数据。
更具体的,所述模型训练的粒度具体包括:粗粒度式地从头训练模型或者在训练好的模型基础上进行精细调参。
更具体的,所述交叉验证具体包括:
通过交叉验证的方法选出最优的一个超参组合,所述超参是指深度学习的超参,包括学习率,权重衰减指数,Dropout概率等。
更具体的,所述步骤1中利用有标注的数据来训练模型具体包括:
将所述有标注标签的数据训练集图片输入到卷积神经网络(CNN)中;
对所述图片进行特征提取;
将提取出的所述特征输入到输出变量模型中进行训练,得出最优的超参组合。
根据本发明的另一方面,还提供了一种字符验证码识别的深度学习装置, 该装置包括:
模型训练模块,利用有标注标签的数据训练集来训练模型;
预测模块,用训练好的模型来预测新的验证码图片中的文字;
其中,模型训练模块还包括训练集收集模块、模型训练的粒度模块和交叉验证模块。
更具体的,所述训练集收集模块具体用于:
若深度学习需要大量的有标注数据,则利用爬虫程序,在网站获取若干验证码样本,用打码平台的众包服务标注数据;
若需要的样本数不多,则手动标注数据。
更具体的,所述模型训练的粒度模块具体包括:粗粒度式地从头训练模型或者在训练好的模型基础上进行精细调参。
更具体的,所述交叉验证模块具体用于:
通过交叉验证的方法选出最优的一个超参组合,所述超参是指深度学习的超参,包括学习率,权重衰减指数,Dropout概率等。
更具体的,所述模型训练模块利用有标注的数据来训练模型具体包括:
将所述有标注标签的数据训练集图片输入到卷积神经网络(CNN)中;
对所述图片进行特征提取;
将提取出的所述特征多个联合的Softmax分类器中进行训练,得出最优的超参组合。
本发明模型搭建简单,大大提高了验证码识别的准确率 ,且因为是端到端的训练方法,不同的验证码识别思路基本相同,而不需要像原来那样针对性地重新寻找破解思路。
模型的设计和实现都是端到端的结构,设计和实现都较为清晰简单,优于传统的定位、切分和识别的单独流程组合设计,提高了模型识别的准确率。面对新类型的验证码识别任务,不需要额外重新设计系统算法。此外,CNN模型可以提供强大的特征提取功能,分类器性能大大提高,基本可以达到人类水平的识别率。如果需要实时的大量的验证码识别,可以很方便地嵌入网络服务器系统中。利用GPU的高效并行计算性能,可以极大提高识别的速度。
本发明的附加方面和优点将在下面的描述部分中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了根据本发明一种字符验证码识别的深度学习方法的流程图;
图2示出了本发明一实施例模型训练的流程图;
图3示出了本发明一实施例的全卷积神经网络模型结构示意图;
图4所示为本发明一实施例简化的模型训练过程示意图;
图5示出了本发明一种字符验证码识别的深度学习装置框架图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明一种字符验证码识别的深度学习方法的流程图。
如图1所示,根据本发明的一种字符验证码识别的深度学习方法,包括:
步骤1,利用有标注标签的数据训练集来训练模型;
步骤2,用训练好的模型来预测新的验证码图片中的文字;
其中,步骤1还包括训练集的收集、模型训练的粒度和交叉验证过程。
如图2所示,为本发明一实施例模型训练的流程图,主要有下面几个步骤需要详细阐述:
(1)训练集的收集
由于深度学习需要大量的有标注标签的数据,因而需要收集训练集。可以利用爬虫程序,去网站定点下载验证码样本,用打码平台的众包服务标注数据。而如果是只需要精调参,需要的样本数不多的话,也可以自己手动标注。
(2)模型训练的粒度
模型的训练有两种粒度,一种是粗粒度式地从头训练模型;另一种则是在训练好的模型基础上进行精细调参(fine-turn)。
精调参在这里有两个用途,一个是用于提高验证码识别的准确率。因为打码的花费和时间考虑,开始时拿到的标签数量有限,即使用了数据增强(data-argument)之类的方法,也无法得到较高准确率的模型。因而,我们采用去网站不断爬取新的验证码,同时利用目前的模型进行验证码识别,如果识别的结果通过了验证,那么就保存该样本,更大的训练集可以此增量积累更大的训练集。然后在该训练集上做精调参,就可以得到更高准确率的模型。
另一种用途是可以做迁移学习(transfer learning)。即如果要识别的验证码类型和之前已经训练完成的验证码类型相似,可以直接用少量数据(如100-1000张)在原来的模型上作进一步训练就可以得到很好的效果,这大大减少了标注标签的成本。
(3)交叉验证
深度学习的超参(hyperparameter)很多,如学习率,权重衰减指数,Dropout概率等,可以通过交叉验证的方法选出最优的一个超参组合。即在训练的过程中,分离出一个较小的验证集,用验证集的准确率来衡量模型的泛化能力好坏。
图3示出了本发明一实施例的卷积神经网络模型结构示意图。
如图3所示,该模型的原理非常简单易懂,但是效果却非常强大。该模型将图片通过一系列的卷积、非线性修正、池化层(采样)、全连接层,然后得到一个输出层。可以形式化定义如下:给定输入图片X,输出为变长序列S,模型的目标是学习一个模型,在训练集上最大化条件概率logP(S|X)。输出S为一些变量的集合,包括预测输出序列长度的变量L,和大小为N的序列。其中,N代表模型能处理的序列的最大长度。最后要预测的概率可以用所有变量的乘积,即用下列公式计算:
,
例如N=5时,表示模型最多可以预测5位数字。L的取值范围是0,1,2,3,4,5,5+,共7个取值。可以分别预测五个数字。结果只取前L位数。L=5+时,只取前5位数。
图4所示为本发明一实施例简化的模型训练过程,首先,将图片X输入到CNN中,得到特征H后,输入到L和中。为了训练该模型,我们可以用一般的随机梯度下降法在训练集上进行最大似然估计。虽然L和每个都会接上一个Softmax分类器,但是在计算梯度下降的时候,可以用和单个孤立的Softmax分类器一样的反向传播算法。当然,那些i>L的不用算入损失值,也不用反向传播。
图5示出了本发明一种字符验证码识别的深度学习装置框架图。
如图5所示,该装置包括:
模型训练模块,利用有标注标签的数据训练集来训练模型;
预测模块,用训练好的模型来预测新的验证码图片中的文字;
其中,模型训练模块还包括训练集收集模块、模型训练的粒度模块和交叉验证模块。
更具体的,所述训练集收集模块具体用于:
若深度学习需要大量的有标注数据,则利用爬虫程序,在网站获取若干验证码样本,用打码平台的众包服务标注数据;
若需要的样本数不多,则手动标注数据。
更具体的,所述模型训练的粒度模块具体包括:粗粒度式地从头训练模型或者在训练好的模型基础上进行精细调参。
更具体的,所述交叉验证模块具体用于:
通过交叉验证的方法选出最优的一个超参组合,所述超参是指深度学习的超参,包括学习率,权重衰减指数,Dropout概率等。
更具体的,所述模型训练模块利用有标注的数据来训练模型具体包括:
将所述有标注标签的数据训练集图片输入到卷积神经网络(CNN)中;
对所述图片进行特征提取;
将提取出的所述特征多个联合的Softmax分类器中进行训练,得出最优的超参组合。
本发明实现了一个通用的验证码识别系统方法,在遇到一个新的网站验证码之后,可以通过训练该模型,或者对已经训练好的模型精细调参,得到一个高准确率的识别器,从而破解网站的验证码阻碍,可以为爬虫程序之类的软件提供服务。
在本说明书的描述中,术语“一个实施例”的描述意指结合该实施例或示例描述的具体特征、结构或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种字符验证码识别的深度学习方法,其特征在于,该方法包括如下步骤:
步骤1),利用有标注标签的数据训练集来训练模型;
步骤2),用训练好的模型来预测新的验证码图片中的文字;
其中,步骤1)还包括训练集的收集、模型训练的粒度和交叉验证过程。
2.根据权利要求1所述的一种字符验证码识别的深度学习方法,其特征在于,所述步
骤1)中所述训练集的收集具体包括:
若深度学习需要大量的有标注数据,则利用爬虫程序,在网站获取若干验证码样本,用打码平台的众包服务标注数据;
若需要的样本数不多,则手动标注数据。
3.根据权利要求1所述的一种字符验证码识别的深度学习方法,其特征在于,所述模型训练的粒度具体包括:粗粒度式地从头训练模型或者在训练好的模型基础上进行精细调参。
4.根据权利要求1所述的一种字符验证码识别的深度学习方法,其特征在于,所述交叉验证具体包括:
通过交叉验证的方法选出最优的一个超参组合,所述超参是指深度学习的超参,包括学习率,权重衰减指数,Dropout概率等。
5.根据权利要求1所述的一种字符验证码识别的深度学习方法,其特征在于,所述步骤1)中利用有标注的数据来训练模型具体包括:
将所述有标注标签的数据训练集图片输入到卷积神经网络(CNN)中;
对所述图片进行特征提取;
将提取出的所述特征输入到输出变量模型中进行训练,得出最优的超参组合。
6.一种字符验证码识别的深度学习装置,其特征在于,该装置包括:
模型训练模块,利用有标注标签的数据训练集来训练模型;
预测模块,用训练好的模型来预测新的验证码图片中的文字;
其中,模型训练模块还包括训练集收集模块、模型训练的粒度模块和交叉验证模块。
7.根据权利要求6所述的一种字符验证码识别的深度学习装置,其特征在于:所述训
练集收集模块具体用于:
若深度学习需要大量的有标注数据,则利用爬虫程序,在网站获取若干验证码样本,用打码平台的众包服务标注数据;
若需要的样本数不多,则手动标注数据。
8.根据权利要求6所述的一种字符验证码识别的深度学习装置,其特征在于,所述模型训练的粒度模块具体包括:粗粒度式地从头训练模型或者在训练好的模型基础上进行精细调参。
9.根据权利要求6所述的一种字符验证码识别的深度学习装置,其特征在于,所述交叉验证模块具体用于:
通过交叉验证的方法选出最优的一个超参组合,所述超参是指深度学习的超参,包括学习率,权重衰减指数,Dropout概率等。
10.根据权利要求6所述的一种字符验证码识别的深度学习装置,其特征在于,所述模型训练模块利用有标注的数据来训练模型具体包括:
将所述有标注标签的数据训练集图片输入到卷积神经网络(CNN)中;
对所述图片进行特征提取;
将提取出的所述特征多个联合的Softmax分类器中进行训练,得出最优的超参组合。
CN201710180679.0A 2017-03-24 2017-03-24 一种字符验证码识别的深度学习方法及装置 Pending CN107085730A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710180679.0A CN107085730A (zh) 2017-03-24 2017-03-24 一种字符验证码识别的深度学习方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710180679.0A CN107085730A (zh) 2017-03-24 2017-03-24 一种字符验证码识别的深度学习方法及装置

Publications (1)

Publication Number Publication Date
CN107085730A true CN107085730A (zh) 2017-08-22

Family

ID=59614944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710180679.0A Pending CN107085730A (zh) 2017-03-24 2017-03-24 一种字符验证码识别的深度学习方法及装置

Country Status (1)

Country Link
CN (1) CN107085730A (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295022A (zh) * 2017-08-23 2017-10-24 四川长虹电器股份有限公司 一种基于人机识别的客户端认证方法
CN107992527A (zh) * 2017-11-09 2018-05-04 武汉极意网络科技有限公司 数据标记校验方法、服务器及存储介质
CN108154148A (zh) * 2018-01-22 2018-06-12 厦门美亚商鼎信息科技有限公司 训练样本的人工合成方法及基于该样本的验证码识别方法
CN108345641A (zh) * 2018-01-12 2018-07-31 深圳壹账通智能科技有限公司 一种爬取网站数据的方法、存储介质和服务器
CN108920929A (zh) * 2018-05-07 2018-11-30 深圳壹账通智能科技有限公司 验证图处理方法、装置、计算机设备和存储介质
CN108932533A (zh) * 2018-07-12 2018-12-04 北京木瓜移动科技股份有限公司 识别模型构建方法及装置、字符识别方法及装置
CN109063456A (zh) * 2018-08-02 2018-12-21 浙江大学 图像型验证码的安全性检测方法及系统
CN109214383A (zh) * 2018-07-17 2019-01-15 北京陌上花科技有限公司 一种图像识别方法及装置
CN109284686A (zh) * 2018-08-23 2019-01-29 国网山西省电力公司计量中心 一种摄像头自动俯仰拍照的标签识别方法
CN109508746A (zh) * 2018-11-16 2019-03-22 西安电子科技大学 基于卷积神经网络的脉冲星候选体识别方法
CN109523611A (zh) * 2018-11-28 2019-03-26 百度在线网络技术(北京)有限公司 验证码图片生成方法和装置
CN109711136A (zh) * 2017-10-26 2019-05-03 武汉极意网络科技有限公司 存储设备、验证码图片生成方法和装置
CN109933975A (zh) * 2019-03-20 2019-06-25 山东浪潮云信息技术有限公司 一种基于深度学习的验证码识别方法及系统
CN109933969A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 验证码识别方法、装置、电子设备及可读存储介质
CN109993169A (zh) * 2019-04-11 2019-07-09 山东浪潮云信息技术有限公司 一种基于端到端的字符型验证码识别方法
CN110009057A (zh) * 2019-04-16 2019-07-12 四川大学 一种基于深度学习的图形验证码识别方法
CN110399894A (zh) * 2018-04-25 2019-11-01 百度在线网络技术(北京)有限公司 用于匹配图片中实体的方法和装置
CN110414592A (zh) * 2019-07-24 2019-11-05 西安工业大学 一种基于多任务学习的数字验证码识别方法
CN110414633A (zh) * 2019-07-04 2019-11-05 东南大学 用于手写字体识别的系统及识别方法
CN110909807A (zh) * 2019-11-26 2020-03-24 深圳市信联征信有限公司 基于深度学习的网络验证码识别方法、装置及计算机设备
CN111143213A (zh) * 2019-12-24 2020-05-12 北京数衍科技有限公司 软件自动化测试方法和装置及电子设备
CN111259366A (zh) * 2020-01-22 2020-06-09 支付宝(杭州)信息技术有限公司 一种基于自监督学习的验证码识别器的训练方法和装置
CN111460426A (zh) * 2020-04-02 2020-07-28 武汉大学 基于对抗演化框架的抗深度学习文本验证码生成系统及方法
CN111797908A (zh) * 2020-06-18 2020-10-20 浪潮金融信息技术有限公司 针对印刷体字符识别的深度学习模型的训练集生成方法
WO2020215573A1 (zh) * 2019-04-22 2020-10-29 平安科技(深圳)有限公司 验证码的识别方法、装置、计算机设备和存储介质
CN112732591A (zh) * 2021-01-15 2021-04-30 杭州中科先进技术研究院有限公司 一种缓存深度学习的边缘计算架构

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104966097A (zh) * 2015-06-12 2015-10-07 成都数联铭品科技有限公司 一种基于深度学习的复杂文字识别方法
US20160148074A1 (en) * 2014-11-26 2016-05-26 Captricity, Inc. Analyzing content of digital images
CN105654129A (zh) * 2015-12-30 2016-06-08 成都数联铭品科技有限公司 一种光学文字序列识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160148074A1 (en) * 2014-11-26 2016-05-26 Captricity, Inc. Analyzing content of digital images
CN104966097A (zh) * 2015-06-12 2015-10-07 成都数联铭品科技有限公司 一种基于深度学习的复杂文字识别方法
CN105654129A (zh) * 2015-12-30 2016-06-08 成都数联铭品科技有限公司 一种光学文字序列识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘智 等: "构建多尺度深度卷积神经网络行为识别模型", 《光学精密工程》 *
刘欢 等: "卷积神经网络在验证码识别上的应用与研究", 《计算机工程与应用》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295022A (zh) * 2017-08-23 2017-10-24 四川长虹电器股份有限公司 一种基于人机识别的客户端认证方法
CN109711136A (zh) * 2017-10-26 2019-05-03 武汉极意网络科技有限公司 存储设备、验证码图片生成方法和装置
CN107992527A (zh) * 2017-11-09 2018-05-04 武汉极意网络科技有限公司 数据标记校验方法、服务器及存储介质
CN107992527B (zh) * 2017-11-09 2021-01-29 武汉极意网络科技有限公司 数据标记校验方法、服务器及存储介质
CN109933969B (zh) * 2017-12-15 2021-05-07 腾讯科技(深圳)有限公司 验证码识别方法、装置、电子设备及可读存储介质
CN109933969A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 验证码识别方法、装置、电子设备及可读存储介质
CN108345641A (zh) * 2018-01-12 2018-07-31 深圳壹账通智能科技有限公司 一种爬取网站数据的方法、存储介质和服务器
CN108345641B (zh) * 2018-01-12 2021-02-05 深圳壹账通智能科技有限公司 一种爬取网站数据的方法、存储介质和服务器
CN108154148A (zh) * 2018-01-22 2018-06-12 厦门美亚商鼎信息科技有限公司 训练样本的人工合成方法及基于该样本的验证码识别方法
CN110399894A (zh) * 2018-04-25 2019-11-01 百度在线网络技术(北京)有限公司 用于匹配图片中实体的方法和装置
CN108920929A (zh) * 2018-05-07 2018-11-30 深圳壹账通智能科技有限公司 验证图处理方法、装置、计算机设备和存储介质
CN108920929B (zh) * 2018-05-07 2022-03-01 深圳壹账通智能科技有限公司 验证图处理方法、装置、计算机设备和存储介质
CN108932533A (zh) * 2018-07-12 2018-12-04 北京木瓜移动科技股份有限公司 识别模型构建方法及装置、字符识别方法及装置
CN109214383A (zh) * 2018-07-17 2019-01-15 北京陌上花科技有限公司 一种图像识别方法及装置
CN109063456A (zh) * 2018-08-02 2018-12-21 浙江大学 图像型验证码的安全性检测方法及系统
CN109063456B (zh) * 2018-08-02 2021-10-08 浙江大学 图像型验证码的安全性检测方法及系统
CN109284686A (zh) * 2018-08-23 2019-01-29 国网山西省电力公司计量中心 一种摄像头自动俯仰拍照的标签识别方法
CN109508746A (zh) * 2018-11-16 2019-03-22 西安电子科技大学 基于卷积神经网络的脉冲星候选体识别方法
CN109523611B (zh) * 2018-11-28 2023-05-09 百度在线网络技术(北京)有限公司 验证码图片生成方法和装置
CN109523611A (zh) * 2018-11-28 2019-03-26 百度在线网络技术(北京)有限公司 验证码图片生成方法和装置
CN109933975A (zh) * 2019-03-20 2019-06-25 山东浪潮云信息技术有限公司 一种基于深度学习的验证码识别方法及系统
CN109993169A (zh) * 2019-04-11 2019-07-09 山东浪潮云信息技术有限公司 一种基于端到端的字符型验证码识别方法
CN110009057A (zh) * 2019-04-16 2019-07-12 四川大学 一种基于深度学习的图形验证码识别方法
WO2020215573A1 (zh) * 2019-04-22 2020-10-29 平安科技(深圳)有限公司 验证码的识别方法、装置、计算机设备和存储介质
CN110414633A (zh) * 2019-07-04 2019-11-05 东南大学 用于手写字体识别的系统及识别方法
CN110414592A (zh) * 2019-07-24 2019-11-05 西安工业大学 一种基于多任务学习的数字验证码识别方法
CN110909807A (zh) * 2019-11-26 2020-03-24 深圳市信联征信有限公司 基于深度学习的网络验证码识别方法、装置及计算机设备
CN111143213A (zh) * 2019-12-24 2020-05-12 北京数衍科技有限公司 软件自动化测试方法和装置及电子设备
CN111259366A (zh) * 2020-01-22 2020-06-09 支付宝(杭州)信息技术有限公司 一种基于自监督学习的验证码识别器的训练方法和装置
CN111460426A (zh) * 2020-04-02 2020-07-28 武汉大学 基于对抗演化框架的抗深度学习文本验证码生成系统及方法
CN111797908A (zh) * 2020-06-18 2020-10-20 浪潮金融信息技术有限公司 针对印刷体字符识别的深度学习模型的训练集生成方法
CN111797908B (zh) * 2020-06-18 2022-08-09 浪潮金融信息技术有限公司 针对印刷体字符识别的深度学习模型的训练集生成方法
CN112732591A (zh) * 2021-01-15 2021-04-30 杭州中科先进技术研究院有限公司 一种缓存深度学习的边缘计算架构

Similar Documents

Publication Publication Date Title
CN107085730A (zh) 一种字符验证码识别的深度学习方法及装置
CN109005145B (zh) 一种基于自动特征抽取的恶意url检测系统及其方法
CN113596007B (zh) 一种基于深度学习的漏洞攻击检测方法和设备
CN108259494A (zh) 一种网络攻击检测方法及装置
CN106599160B (zh) 一种内容规则库管理系统及其编码方法
CN112989348B (zh) 攻击检测方法、模型训练方法、装置、服务器及存储介质
CN110909531B (zh) 信息安全的甄别方法、装置、设备及存储介质
CN110830489B (zh) 基于内容抽象表示的对抗式欺诈网站检测方法及系统
CN111866004B (zh) 安全评估方法、装置、计算机系统和介质
CN113141360B (zh) 网络恶意攻击的检测方法和装置
CN108718306A (zh) 一种异常流量行为判别方法和装置
CN112989414A (zh) 基于宽度学习的移动业务数据脱敏规则生成方法
CN113918936A (zh) Sql注入攻击检测的方法以及装置
CN111224998B (zh) 一种基于极限学习机的僵尸网络识别方法
CN116564315A (zh) 一种声纹识别方法、装置、设备及存储介质
CN112199954A (zh) 基于语音语义的疾病实体匹配方法、装置及计算机设备
Maneriker et al. SYSML: StYlometry with Structure and Multitask Learning: Implications for Darknet forum migrant analysis
Yan et al. Cross-site scripting attack detection based on a modified convolution neural network
CN113037729B (zh) 基于深度学习的钓鱼网页层次化检测方法及系统
CN114826681A (zh) 一种dga域名检测方法、系统、介质、设备及终端
CN117938430A (zh) 基于Bert模型的Webshell检测方法
CN110704611B (zh) 基于特征解交织的非法文本识别方法及装置
Zhen et al. Chinese Cyber Threat Intelligence Named Entity Recognition via RoBERTa-wwm-RDCNN-CRF.
CN115473734A (zh) 基于单分类和联邦学习的远程代码执行攻击检测方法
CN111860661B (zh) 基于用户行为的数据分析方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170822