CN112989312A

CN112989312A - 验证码的识别方法、装置、电子设备和存储介质

Info

Publication number: CN112989312A
Application number: CN202011372546.1A
Authority: CN
Inventors: 刘阳
Original assignee: Beijing Jindi Technology Co Ltd
Current assignee: Beijing Jindi Technology Co Ltd
Priority date: 2020-11-30
Filing date: 2020-11-30
Publication date: 2021-06-18
Anticipated expiration: 2040-11-30
Also published as: CN112989312B

Abstract

本公开的实施例提供了验证码的识别方法和装置、计算机可读存储介质和电子设备。该方法包括：采集当前业务的验证码的图像，建立图像集合；针对图像集合中每张图像进行标注，得到的标注信息可诠释对应图像中每个目标图标所属类别和在图像中的位置，以及每个点击图标所属类别和在图像中的位置；神经网络模型通过图像集合中的图像和对应标注信息进行深度学习；利用深度学习后的神经网络模型对待识别的验证码进行识别。本发明通过深度学习模型实现验证码的定位和分类识别能力，可以有效提升验证码的识别效率及准确度，且提升安全性。

Description

验证码的识别方法、装置、电子设备和存储介质

技术领域

本发明涉及图像识别技术领域，尤其涉及验证码的识别方法、装置、电子设备和存储介质。

背景技术

随着网络的快速发展，验证码技术在网络安全方面起到了越来越重要的作用，在验证码识别的安全测试中，需要快速进行验证码的通过来实现高速的数据采集能力，但由于验证码的复杂程度越来越高，由最简单的数字验证码，到字符验证码，滑动验证码，再到更为复杂的字符点选验证码和Icon图标点选验证码等，特别是Icon图标点选验证码，对于识别要求相对较高， Icon图标具有和背景图更强的融合能力，和更复杂的识别干扰，在验证码识别过程中识别难度大，过程复杂。而现有技术往往是针对较为简单的字符验证码进行校验识别，对于复杂性相对较高的验证码，如Icon图标验证码的识别因难度较大通常效率较低且准确度不高。

发明内容

本公开的目的在于提供验证码的识别方法、装置、电子设备和存储介质，进而至少在一定程度上解决现有技术中复杂验证码识别效率较低且准确度不高的技术问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的第一方面，验证码的识别方法，包括：

采集验证码的图像，建立图像集合；每张图像中都显示有至少一个目标图标和至少一个点击图标；每个目标图标唯一对应一个点击图标；

针对图像集合中每张图像进行标注，得到的标注信息可诠释对应图像中每个目标图标所属类别和在图像中的位置，以及每个点击图标所属类别和在图像中的位置；同一图像中唯一对应的目标图标和点击图标的类别相同；

神经网络模型通过图像集合中的图像和对应标注信息进行深度学习；深度学习后的神经网络模型可识别每张图像中每个目标图标和点击图标的所属类别和在图像中的位置；

利用深度学习后的神经网络模型对待识别的验证码进行识别。

在本公开的示例性实施例中，所述神经网络模型通过图像集合中的图像和对应标注信息进行深度学习，具体包括：

根据图像集合中标注过的图像，构建数据集；所述数据集中每条数据都包括一张图像和对应的标注信息；

从数据集中提取训练集，并将训练集输入至神经网络模型进行训练，从而调整神经网络模型的普通参数；

通过评价值对神经网络模型的训练结果进行评价；

当评价值满足预设条件后，停止训练，保存当前训练后的神经网络模型。

进一步，所述根据图像集合中标注过的图像，构建数据集，之后还包括：

将数据集中的各数据进行格式转换，得到神经网络模型可辨认处理的数据集。

进一步，所述从数据集中提取训练集，并将训练集输入至神经网络模型进行训练，之后还包括：

从数据集中提取验证集，所述验证集与训练集无交集；

在神经网络模型的训练过程中利用验证集调整神经网络模型的超参数。

进一步，所述保存当前训练后的神经网络模型，之后还包括：

从数据集中提取测试集，所述测试集与训练集和验证集无交集；

将测试集输入至保存后的神经网络模型进行测试；

通过评价指标对测试结果进行评价；

当评价指标达到预设阈值后，当前神经网络模型完成深度学习。

进一步，所述利用深度学习后的神经网络模型对待识别的验证码进行识别，具体包括：

将待识别验证码的图像输入至深度学习后的神经网络模型，输出该图像的标注信息；

根据待识别验证码图像的标注信息，在该图像中按照目标图标的位置顺序，依次点击各目标图标唯一对应的点击图标。

根据本公开的第二方面，提供验证码的识别装置，其特征在于，包括：神经网络模型；

采集单元，用于采集当前业务的验证码的图像，建立图像集合；每张图像中都显示有至少一个目标图标和至少一个点击图标；每个目标图标唯一对应一个点击图标；

标注单元，用于针对图像集合中每张图像进行标注，得到的标注信息可诠释对应图像中每个目标图标所属类别和在图像中的位置，以及每个点击图标所属类别和在图像中的位置；同一图像中唯一对应的目标图标和点击图标的类别相同；

学习单元，用于使神经网络模型通过图像集合中的图像和对应标注信息进行深度学习；深度学习后的神经网络模型可识别每张图像中每个目标图标和点击图标的所属类别和在图像中的位置；

识别单元，用于利用深度学习后的神经网络模型对待识别的验证码进行识别。

在本公开的示例性实施例中，所述学习单元，具体用于：

通过评价值对神经网络模型的训练结果进行评价；

根据本公开的第三方面，提供一种电子设备，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行上述的验证码的识别方法。

根据本公开的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述的验证码的识别方法。

由上述技术方案可知，本公开示例性实施例中的信息处理方法及装置、计算机可读存储介质、电子设备至少具备以下优点和积极效果：

本公开实施例中的的验证码的识别方法和装置，通过深度学习模型实现验证码的定位和分类识别能力，实现了对验证码的有效识别，且提升安全性。

本公开应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的方法流程示意图；

图2为本发明实施例的装置结构示意图；

图3为本发明实施例中验证码的图片示意图；

图4为本发明实施例的电子设备的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施例使得本公开将更加全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、装置、步骤等。在其它情况下，不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。符号“/”一般表示前后关联对象是一种“或”的关系。

在本公开中，除非另有明确的规定和限定，“连接”等术语应做广义理解，例如，可以是电连接或可以互相通讯；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本公开中的具体含义。

请参考图1所示，本发明实施例所述的验证码的识别方法，包括：

101、采集验证码的图像，建立图像集合；每张图像中都显示有至少一个目标图标和至少一个点击图标；每个目标图标唯一对应一个点击图标；

在进行网页信息访问、网站登录等互联网应用场景中都需要通过验证码的验证以保证系统安全性，或者在具有获取大量数据的需求时需要进行验证码测试业务，以保证后续数据获取的可行性。

针对当前测试业务，首先需要搜集大量的验证码的图像，建立图像集合。在本实施例中，如图3所示，每张验证码的图像上都有多个目标图标和对应的点击图标。用户根据目标图标的位置顺序，依次点击同类别的点击图标后，才能通过当前验证码。

以验证码为Icon图标验证码为例，图3的目标图标为左下角的四个小图标，按照由左至右的顺序，类别依次为：网球、船、博士帽、手套；图3的点击图标为分布在图3中间对的四个大图标，类别与目标图标一一对应，同样分为：网球、船、博士帽、手套。

针对图3所示的验证码，如果需要通过该验证码，则需要跟根据坐下角的四个小图标，按照：网球、船、博士帽、手套这样的顺序，依次点击在图 3中间的四个大图标。

102、针对图像集合中每张图像进行标注，得到的标注信息可诠释对应图像中每个目标图标所属类别和在图像中的位置，以及每个点击图标所属类别和在图像中的位置；同一图像中唯一对应的目标图标和点击图标的类别相同；

在图3中，以第一个目标图标为例，该图标的标注信息包含其类别和位置：“网球，(a1，b1)”。目标图标和点击图标的标注信息中，在图像中的位置用坐标进行表示。

103、神经网络模型通过图像集合中的图像和对应标注信息进行深度学习；深度学习后的神经网络模型可识别每张图像中每个目标图标和点击图标的所属类别和在图像中的位置；具体地：

1031、根据图像集合中标注过的图像，构建数据集；所述数据集中每条数据都包括一张图像和对应的标注信息；

将图片和其标注信息合并成一条数据，存储至数据集中作为一条数据。

1032、将数据集中的各数据进行格式转换，得到神经网络模型可辨认处理的数据集；

待数据集构建完成后，将每条数据的格式进行转换，通过程序转换为深度学习模型可识别的数据格式。

1033、从数据集中提取训练集，并将训练集输入至神经网络模型进行训练，从而调整神经网络模型的普通参数；

训练集作用是用来拟合模型，通过设置分类器的参数，训练神经网络模型。

在本实施例中，选用Darknet作为神经网络模型框架，是yolo模型实现的主流框架，不仅可以实现对目标的位置检测，同时可以对预测目标的类别。

在本实施例中，还可以利用Keras构建神经网络模型。Keras是一个用 Python编写的开源神经网络库，能够在TensorFlow、Theano或PlaidML之上运行，是一个较为高效的模型前端。

1034、从数据集中提取验证集，所述验证集与训练集无交集；

验证集作用是当通过训练集训练出多个模型后，为了能找出效果最佳的模型，使用各个模型对验证集数据进行预测，并记录模型准确率。选出效果最佳的模型所对应的参数，即用来调整模型参数。

1035、在神经网络模型的训练过程中利用验证集调整神经网络模型的超参数；

对于一个神经网络模型来说，其参数可以分为普通参数和超参数。普通参数就是可以被梯度下降所更新的，也就是训练集所更新的参数。另外，还有超参数的概念，比如网络层数、网络节点数、迭代次数、学习率等等，这些参数不在梯度下降的更新范围内，多数情况下还是根据验证集来调整。

基于训练集和验证集的数据，使用Darknet框架模型训练Icon图像中各图标(包括目标图标和电机图标)的位置和类别，修改模型为多分类网络模型配置。基于各图像的标注信息，进行深度学习模型训练。神经网络模型在训练过程中，会根据标注信息进行参数拟合，随着训练的迭代，会较多的参数去拟合当前验证码的特征，达到识别验证码的目的。

另外，使用Keras时，神经网络模型使用Keras的孪生网络来实现目标图标和点击图标的匹配。孪生网络是单样本学习中的重要网络模型，针对类别中样本较少的图像分类和识别有较好的效果。使用Keras的Sequential顺序模型进行CNN网络的组合来实现孪生网络模型，基于转换之后的标注数据信息，进行深度学习模型训练。神经网络模型在训练过程中，会根据标注数据进行参数拟合，最后输出为匹配的目标图标和点击图标的相似度作为结果。

1036、通过评价值对神经网络模型的训练结果进行评价；

1037、当评价值满足预设条件后，停止训练，保存当前训练后的神经网络模型；

在本实施例中，评价值包括：平均损失(loss)值和准确率(acc)值。神经网络模型训练过程中，使用平均loss值和acc值作为训练效果评价，当模型平均loss值不在降低，acc值接近1的情况下，到达模型训练效果，保存当前神经网络模型。

1038、从数据集中提取测试集，所述测试集与训练集和验证集无交集；

1039、将测试集输入至保存后的神经网络模型进行测试；

10310、通过评价指标对测试结果进行评价；

10311、当评价指标达到预设阈值后，当前神经网络模型完成深度学习。

通过训练集和验证集得出最优模型后，使用测试集进行模型预测。用来衡量该最优模型的性能和分类能力。即可以把测试集当做从来不存在的数据集，当已经确定模型参数后，使用测试集进行模型性能评价。

在本实施例中，使用测试集进行模型性能测试，使用准确率、召回率和 mAP作为模型测试评价指标。

104、利用深度学习后的神经网络模型对待识别的验证码进行识别；具体地：

1041、将待识别验证码的图像输入至深度学习后的神经网络模型，输出该图像的标注信息；

以图3为例，将图3所示验证码图像输入至深度学习后的神经网络模型后，输出如下信息：

目标图标：“网球，(a1，b1)”、“船，(a2，b2)”、“博士帽，(a3，b3)”、 “手套，(a4，b4)”；

点击图标：“网球，(A1，B1)”、“手套，(A4，B4)”、“博士帽，(A3， B3)”、“船，(A2，B2)”。

1042、根据待识别验证码图像的标注信息，在该图像中按照目标图标的位置顺序，依次点击各目标图标唯一对应的点击图标。

根据上述的输出信息，来完成验证码的点击操作。

完成深度学习的神经网络模型部署成服务，通过调用返回目标的坐标和类别，达到验证码点选验证码的定位和分类识别能力。

一般情况下，深度网络模型只需要完成一次深度学习的过程。如果在测试的时候，可能会出现含有新类型图标的图片。如果含有新类型图标的图片出现多达一定量的时候，会影响当前神经网络模型的输出准确率。此时，将包含新类型图标的图片搜集后，针对新图片对深度网络模型进行迁移训练即可，使深度网络模型具有对新图片识别的功能。

下面举出实例来详细说明本实施例的技术方案：

S101、验证码数据采集：

在测试过程中同步的收集到验证码图像信息，将Icon图形验证码图像进行保存，组成待训练图片集合。

S201、数据标注：

对采集的验证码图像进行数据标注，利用标注工具，在图像中标注Icon 大图标和Icon小图标在验证码中的位置和分类，相同图标类别保持一致，用于深度学习模型训练和识别。保留所有的类别信息和类别信息。

S202、数据格式转换：

将采集的标注位置和类别信息进行数据格式转换，通过程序转换为深度学习模型可识别的数据格式，分别划分训练数据集合、验证数据集合和测试数据集合。

S301a、模型训练：

Darknet是最早的目标检测模型框架，是yolo模型实现的主流框架，不仅可以实现对目标的位置检测，同时可以对预测目标的类别。基于训练集合和验证集合数据，使用Darknet框架模型训练Icon图标的位置检测和分类，修改模型为多分类网络模型配置，基于转换之后的标注数据信息，进行深度学习模型训练。模型在训练过程中，会根据标注数据进行参数拟合，随着训练的迭代，会较多的参数去拟合当前Icon的特征，达到识别Icon的目的。

S301b、模型训练：

Keras是一个用Python编写的开源神经网络库，能够在TensorFlow、 Theano或PlaidML之上运行，是一个较为高效的模型前端。神经网络模型使用Keras的孪生网络来实现目标图标和点击图标的匹配。孪生网络是单样本学习中的重要网络模型，针对类别中样本较少的图像分类和识别有较好的效果。使用Keras的Sequential顺序模型进行CNN网络的组合来实现孪生网络模型，基于转换之后的标注数据信息，进行深度学习模型训练。模型在训练过程中，会根据标注数据进行参数拟合，最后输出为匹配的目标图标和点击图标的相似度作为结果。

S401、模型评价：

模型训练过程中，使用平均loss值和acc值作为训练效果评价，当模型平均loss不在降低，acc值接近1的情况下，到达模型训练效果，保存模型。使用测试集合进行模型性能测试，使用准确率、召回率和mAP作为模型测试评价指标。

S501、模型应用：

训练好的模型部署成服务，通过调用返回目标的坐标和类别，达到Icon 点选验证码的定位和分类识别能力。

如图2所示，本实施例所述的验证码的识别装置，包括：神经网络模型 21；

采集单元22，用于采集当前业务的验证码的图像，建立图像集合；每张图像中都显示有至少一个目标图标和至少一个点击图标；每个目标图标唯一对应一个点击图标；

标注单元23，用于针对图像集合中每张图像进行标注，得到的标注信息可诠释对应图像中每个目标图标所属类别和在图像中的位置，以及每个点击图标所属类别和在图像中的位置；同一图像中唯一对应的目标图标和点击图标的类别相同；

学习单元24，用于使神经网络模型通过图像集合中的图像和对应标注信息进行深度学习；深度学习后的神经网络模型可识别每张图像中每个目标图标和点击图标的所属类别和在图像中的位置；

识别单元25，用于利用深度学习后的神经网络模型对待识别的验证码进行识别。

所述学习单元24，具体用于：

通过评价值对神经网络模型的训练结果进行评价；

所述学习单元24，还用于：

从数据集中提取验证集，所述验证集与训练集无交集；

所述学习单元24，还用于：

将测试集输入至保存后的神经网络模型进行测试；

通过评价指标对测试结果进行评价；

所述识别单元25，具体用于：

本实施例实现端对端的验证码定位和分类识别，即输入一张图片，依次直接输出各图标的位置和类别，无需进行先位置定位，再分类识别的多过程方式。同时深度学习模型可以实现更快、更准、纠错能力更强的模型输出能力。

本实施例中，通过深度学习模型实现验证码的定位和分类识别能力，可以有效提升验证码的识别效率及准确度，且提升安全性。同时通过位置的定位和类别的识别在线上业务可到达90％以上的准确率，为测试工程师的对于网站点选验证方式安全性的测试和评价带来极大的方便。

本公开实施例提供的验证码的识别装置中的各个模块、单元和子单元的具体实现可以参照上述验证码的识别方法中的内容，在此不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块、单元和子单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块、单元和子单元的特征和功能可以在一个模块、单元和子单元中具体化。反之，上文描述的一个模块、单元和子单元的特征和功能可以进一步划分为由多个模块、单元和子单元来具体化。

如图4所示，示例电子设备50包括用于执行软件例程的处理器501尽管为了清楚起见示出了单个处理器，但是电子设备50也可以包括多处理器系统。处理器501连接到通信基础设施502，用于与电子设备50的其他组件进行通信。通信基础设施502可以包括例如通信总线、交叉开关或网络。

电子设备50还包括诸如随机存取存储器(Random Access Memory，RAM) 之类的存储器，所述存储器可包括主存储器503和辅助存储器510。辅助存储器510可以包括，例如硬盘驱动器511和/或可移动存储驱动器512，可移动存储驱动器512可以包括软盘驱动器，磁带驱动器，光盘驱动器等。可移动存储驱动器512以常规方式对可移动存储单元513进行读取和/或写入。可移动存储单元513可以包括由可移动存储驱动器512读取和写入的软盘、磁带、光盘等。相关领域技术人员可以理解，可移动存储单元513包括其上存储有计算机可执行程序代码指令和/或数据的计算机可读存储介质。

在一种可选实施方式中，辅助存储器510可以额外包括或选择性包括用于允许将计算机程序或其他指令加载到电子设备50中的其他类似装置。这样的装置可以包括例如可移动存储单元521和接口520。可移动存储单元521 和接口520的示例包括：程序卡带(cartridge)和卡带接口(例如可在视频游戏控制台设备中找到的程序卡带和卡带接口)、可移动存储芯片(例如EPROM或 PROM)和相关联的插槽、以及其他可移动存储单元521和允许软件和数据从可移动存储单元521传输到电子设备50的接口520。

电子设备50还包括至少一个通信接口540。通信接口540允许软件和数据经由通信路径541在电子设备50和外部设备之间传输。在本发明的各种实施例中，通信接口540允许数据在电子设备50和诸如公共数据或私有数据通信网络之类的数据通信网络之间传输。通信接口540可用于在不同的电子设备50之间交换数据，这些电子设备50形成互连的计算机网络的一部分。通信接口540的示例可以包括调制解调器、网络接口(诸如以太网卡)、通信端口、具有相关电路的天线等等。通信接口540可以是有线的或者可以是无线的。经由通信接口540传输的软件和数据为信号形式，该信号可以是能够被通信接口540接收的电、磁、光或其他信号。这些信号经由通信路径541被提供给通信接口。

如图4所示，电子设备50还包括显示器接口531和音频接口532，显示器接口531执行用于将图像渲染到关联的显示器530的操作，音频接口532 用于执行通过关联的扬声器533播放音频内容的操作。

在本申请文件中，术语“计算机程序产品”部分程度上可以指代：可移动存储单元513、可移动存储单元521、安装在硬盘驱动器511中的硬盘、或承载着软件通过通信路径541(无线链路或电缆)到通信接口540的载波。计算机可读存储介质是指将记录的指令和/或数据提供给电子设备50以执行和/或处理的任何非暂时的有形的存储介质。这种存储介质的示例包括软盘、磁带、CD-ROM、DVD、蓝光TM光盘、硬盘驱动器、ROM或集成电路、 USB存储器、磁光盘、或诸如PCMCIA卡之类的计算机可读卡等等，这些部件无论是在电子设备50的内部还是外部均可。瞬态或非有形计算机可读传输介质也可以参与向电子设备50提供软件、应用程序、指令和/或数据，这种传输介质的示例包括无线电或红外传输信道、到另一台计算机或另一个联网设备的网络连接、以及包括电子邮件传输和记录在网站上的信息等的互联网或内联网。

计算机程序(也被称为计算机程序代码)存储在主存储器503和/或辅助存储器510中。也可以经由通信接口540来接收计算机程序。此类计算机程序在被执行时使电子设备50能够执行本文所讨论的实施例的一个或多个特征。在各种实施例中，计算机程序在被执行时，使处理器501能够执行上述实施例的特征。因此，此类计算机程序代表计算机系统50的控制器。

软件可以存储在计算机程序产品中，并使用可移动存储驱动器512、硬盘驱动器511或接口520加载到电子设备50中。替代地，可以通过通信路径 541将计算机程序产品下载到计算机系统50。该软件在由处理器501执行时促使电子设备50执行本文描述的实施例的功能。

应该理解，图4的实施例仅以示例的方式给出。因此，在一些实施例中，可以省略电子设备50的一个或多个特征。而且，在一些实施例中，电子设备50的一个或多个特征可以被组合在一起。另外，在一些实施例中，电子设备50的一个或多个特征可以被分成一个或多个组成部分。

可以理解的是，图4所示的要素起到了提供执行以上实施例中所描述的服务器的各种功能和操作的途径的作用。

在一种实施方式中，服务器通常可以被描述为包括至少一个处理器和至少一个包括计算机程序代码的存储器的物理设备。所述至少一个存储器和计算机程序代码被配置为与所述至少一个处理器一起促使所述物理设备执行必要的操作。

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现图1所示方法的功能。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被电子设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备 (可以是个人计算机，服务器，或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

以上结合具体实施例描述了本发明的基本原理，但是，需要指出的是，在本发明中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本发明为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。

可能以许多方式来实现本发明的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本发明的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本发明实施为记录在记录介质中的程序，这些程序包括用于实现根据本发明的方法的机器可读指令。因而，本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

本发明的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用，并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims

1.一种验证码的识别方法，其特征在于，包括：

2.根据权利要求1所述的验证码的识别方法，其特征在于，所述神经网络模型通过图像集合中的图像和对应标注信息进行深度学习，具体包括：

通过评价值对神经网络模型的训练结果进行评价；

3.根据权利要求2所述的验证码的识别方法，其特征在于，所述根据图像集合中标注过的图像，构建数据集，之后还包括：

4.根据权利要求2所述的验证码的识别方法，其特征在于，所述从数据集中提取训练集，并将训练集输入至神经网络模型进行训练，之后还包括：

从数据集中提取验证集，所述验证集与训练集无交集；

5.根据权利要求4所述的验证码的识别方法，其特征在于，所述保存当前训练后的神经网络模型，之后还包括：

将测试集输入至保存后的神经网络模型进行测试；

通过评价指标对测试结果进行评价；

6.根据权利要求1所述的验证码的识别方法，其特征在于，所述利用深度学习后的神经网络模型对待识别的验证码进行识别，具体包括：

7.一种验证码的识别装置，其特征在于，包括：神经网络模型；

8.根据权利要求7所述的验证码的识别装置，其特征在于，所述学习单元，具体用于：

通过评价值对神经网络模型的训练结果进行评价；

9.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1～6中任意一项所述的验证码的识别方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1～6中任意一项所述的验证码的识别方法。