CN111178352A - 一种验证码字符识别的方法和装置 - Google Patents
一种验证码字符识别的方法和装置 Download PDFInfo
- Publication number
- CN111178352A CN111178352A CN201911284188.6A CN201911284188A CN111178352A CN 111178352 A CN111178352 A CN 111178352A CN 201911284188 A CN201911284188 A CN 201911284188A CN 111178352 A CN111178352 A CN 111178352A
- Authority
- CN
- China
- Prior art keywords
- picture
- verification code
- character
- identifying
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012795 verification Methods 0.000 title claims abstract description 139
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000010801 machine learning Methods 0.000 claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 239000003086 colorant Substances 0.000 claims description 25
- 238000013145 classification model Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007635 classification algorithm Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种验证码字符识别的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;从所述第二验证码图片中截取相同尺寸的单个字符图片;利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。该实施方式能够提高字符位置不固定,字符有一定倾斜度且背景具有干扰的验证码的精度,减少了识别此类验证码的计算成本。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种验证码字符识别的方法和装置。
背景技术
在企业管理中,流程自动化包括对网站的访问常常应用到企业的业务当中,有些网页的登录设置有验证码,这就对验证码自动识别的精度提出了比较高的要求;在众多种类的验证码中,一种字符位置不固定字符有一定倾斜度且背景具有干扰的验证码较为常见,目前识别此类验证码的方案中主要在除去相关的干扰后借助光学识别来识别字符,或者通过深度学习算法利用构建神经网络模型来识别字符。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
利用光学识别程序识别验证码的方式,对于字符有一定程度的倾斜以及字符位置不定的形式,识别的精度比较低;利用深度学习的方法由于前期需要大量的样本数据以及较长时间进行模型训练,计算成本较大,计算速度较慢。
发明内容
有鉴于此,本发明实施例提供一种验证码字符识别的方法和装置,能够利用计算像素的方式识别出验证码图片中的字符,并提取出每一个字符图片,利用机器学习算法,根据单个字符图片识别验证码图片中的验证码字符,提高了识别字符位置不固定,字符有一定倾斜度且背景具有干扰的验证码的精度,减少了识别此类验证码的计算成本。
为实现上述目的,根据本发明实施例的一个方面,提供了一种验证码字符识别的方法,其特征在于,包括:获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;从所述第二验证码图片中截取相同尺寸的单个字符图片;利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
可选地,所述验证码字符识别的方法,其特征在于,
所述预定义规则包括对所述第一验证码图片中的颜色进行处理得到包含两种颜色的所述第二验证码图片。
可选地,所述验证码字符识别的方法,其特征在于,
所述预定义规则还包括获取所述第一验证码图片中不同颜色对应的像素总数,根据所述像素总数确定所述第一验证码图片中验证码字符的颜色,根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
可选地,所述验证码字符识别的方法,其特征在于,
确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片,所述单个字符图片中包含的字符具有倾斜度。
可选地,所述验证码字符识别的方法,其特征在于,
获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
为实现上述目的,根据本发明实施例的第二方面,提供了一种验证码字符识别的装置,其特征在于,包括:验证码图片处理模块、验证码字符提取模块和验证码字符识别模块;其中,验证码图片处理模块,用于获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;所述验证码字符提取模块,用于从所述第二验证码图片中截取相同尺寸的单个字符图片;所述验证码字符识别模块用于利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
可选地,所述验证码字符识别的装置,其特征在于所述预定义规则包括对所述第一验证码图片中的颜色进行处理得到包含两种颜色的所述第二验证码图片。
可选地,所述验证码字符识别的装置,其特征在于,所述预定义规则还包括获取所述第一验证码图片中不同颜色对应的像素总数,根据所述像素总数确定所述第一验证码图片中验证码字符的颜色;根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
可选地,所述验证码字符识别的装置,其特征在于,确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片,所述单个字符图片中包含的字符具有倾斜度。
可选地,所述验证码字符识别的装置,其特征在于,获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片的识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
为实现上述目的,根据本发明实施例的第三方面,提供了一种验证码字符识别的服务器,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述1-5的方法中任一所述的方法。
为实现上述目的,根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如上述视一种验证码字符识别的方法中任一所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;从所述第二验证码图片中截取相同尺寸的单个字符图片;利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。由此可以看出,提高了识别字符位置不固定,字符一定程度倾斜且背景具有干扰的验证码的精度,减少了识别此类验证码的计算成本。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是本发明一个实施例提供的一种验证码字符识别的方法的流程示意图;
图2是本发明一个实施例提供的一种彩色验证码图片的示意图;
图3是本发明一个实施例提供的一种处理后的验证码图片的示意图;
图4是本发明一个实施例提供的一种截取单个字符图片的流程示意图;
图5是本发明一个实施例提供的一种验证码字符识别的系统的结构示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
如图1所示,本发明实施例提供了一种验证码字符识别的方法,该方法可以包括以下步骤:
步骤S101:获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片。
具体地,获取包含验证码的彩色第一验证码图片可以通过人工导入的方式,或者利用requests.get()的方法来从网页中获取,本发明对获取彩色验证码图片的方式不做限定。
具体地,以图2所示的彩色验证码图片举例说明,如图2所示,彩色验证码图片中可以包含有彩色背景和彩色干扰图像,其中,验证码字符为同种颜色,字符位置可以不确定,字符可以有不同宽度,且可以有倾斜度;可以理解的是,所述倾斜度是指字符可以偏离垂直的角度的显示,图2即为包含验证码的彩色第一验证码图片。如图2所示,图中包含的验证码字符3、J、4、G显示为不同宽度,并且字符有倾斜度。
进一步地,所述预定义规则包括对所述第一验证码图片中的颜色进行处理得到包含两种颜色的所述第二验证码图片。
进一步地,所述预定义规则还包括获取所述第一验证码图片中不同颜色对应的像素总数,根据所述像素总数确定所述第一验证码图片中验证码字符的颜色,根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
具体地,获取所述第一验证码图片中每种颜色的像素总数,即通过统计第一验证码图片中不同颜色的像素值的数量,形成一个数据集合,例如数据集合为List=[M1,M2,M3,M4,…,Mn],其中所述数据集合中颜色像素值的数量为从大到小排列,即M1代表数量最大的像素值。
根据上述像素的数据集合List,假设一个彩色验证码图片中包含的字符个数为4个或者多于4个,那么确定验证码图片中字符的颜色可以有如下方式:
先取M1判断是不是验证码中字符的颜色,判断方法如下:
1)首先判断M1是不是背景颜色,有两种方法;
方法一:从上到下或者从下到上,从左到右或者从右到左扫描图片像素,连续扫描,如果扫描到图片宽度阈值或者高度阈值,都是M1所指示的颜色,那么M1为背景颜色;所述宽度阈值或者高度阈值可以通过实验或者统计设定,比如,图片宽度的三分之一,本发明对上述阈值不做设定。
方法二:计算M1占所有像素总和的百分比,如果不小于百分比阈值,则M1为背景颜色,比如,其中百分比阈值可以为50%-90%中的任意一个,可以根据经验设定,本发明对该百分比阈值不做限定。
2)如果M1所指示的颜色不是背景色,从上到下,从左到右扫描图片像素,比如如图2显示的验证码示例图中的字符“4”,扫描到第一个M1像素值的时候记录下其位置,比如记为(x,y),以该位置为基点向下移动四分之一图片高度到达(x,y1)位置,如果在(x,y1)位置的周围都能找到一定数量的M1颜色的像素值,并且在整个原始图片中存在不止一种这样的情况,例如,对文稿中图2验证码示例图中的字符“3”,“J”,“G"也存在类似的这种情况,那么我们就可以确定M1颜色所对应的颜色就是字符颜色。
3)如果M1不是字符颜色,在像素数据集合List=[M1,M2,M3,M4,…,MN]中按顺序选其他数据继续查找,直到找到为止。
进一步地,在确定彩色第一验证码图片中验证码字符的颜色之后,根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色所述第二验证码图片,例如,将第一验证码图片中验证码字符颜色处理为黑色,同时将验证码字符以外的区域处理为白色,实现的方法比如利用pixdata[x,y]=(255,255,255)将与验证码字符不同的其他颜色像素值置为白色,显而易见地,同理可以将验证码字符的颜色设置成黑色,进而这样完成了第一验证码图片中背景的去干扰,得到第二验证码图片,即得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片,如图3所示,图3为一个示例第二验证码图片的示意图。
即,根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
步骤S102:从所述第二验证码图片中提取相同尺寸的单个字符图片。
具体地,从所述第二验证码图片中提取相同尺寸的单个字符图片,包括确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片。其中,所述单个字符图片包含的字符具有倾斜度,通过如图4所述的示例流程图举例说明确定用于截取所述单个字符图片的模板的尺寸以及获取相同尺寸的单个字符图片。
步骤S103:利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
具体地,获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
经过步骤S101-步骤S102,获取相同尺寸的单个字符图片,将多个单个字符图片作为样本形成字符库,比如,建立以字符命名的文件夹,并人工或者自动分拣提取的字符图片放到对应的文件夹中,形成训练字符库;进一步地,使用机器学习的分类算法,例如朴素贝叶斯分类算法、支持向量机算法、人工神经网络算法等进行字符库训练,形成用于对所述第一验证码图片识别的分类模型,并利用训练好的分类模型识别所述第一验证码图片的所述验证码字符,本发明对机器学习的分类算法不做限定。
图4是一种截取验证码单个字符图片的流程示意图,包括如下步骤,如图4所示:
具体地,为了获取完整的单个字符图片,需要确定所使用的模板和合适的模板尺寸用来截取单个字符图片,在本示例的步骤S401-步骤S405中,以矩形作为模板的形状,以矩形的宽度和高度作为模板的尺寸,以确定合适的高度和宽度范围为例说明确定截取字符的模板的尺寸;模板的形状可以是圆形、椭圆、多边形、不规则封闭图形等,本发明对截取单个字符图片的模板的形状不做限定;即,确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片。
步骤S401:逐一获取字符宽度,取字符宽度集合中{w1,w2,w3,…,wN}中的宽度最大值。
具体地,在第二验证码图片中,利用像素扫描算法确定每个字符的宽度,如图3的示意图所示,不同字符以及不同的倾斜度可以展示不同的宽度,例如,字符3的宽度为w1,存储每个字符宽度到字符宽度集合中,例如集合为{w1,w2,w3,…,wN}。
进一步地,取集合中宽度的最大值;可以理解的是,以矩形作为模板的形状为例,需要确定截取单个字符图片所需的矩形模板的宽度和高度作为模板的尺寸,可以理解的是,取验证码图片中字符宽度的最大值作为矩形模板的宽度。
步骤S402:设置字符图片高度系数值为L,并生成截取字符所用的高度和宽度的模板。
如步骤S401描述,设已经获取的模板宽度为W,在确定模板宽度的基础上进一步确定截取高度的高度系数值L,设所述第二验证码图片的宽度为H,进一步生成截取字符所用的高度和宽度的模板;
具体地,设置L的取值范围为[0,1],采取基二分查找法确定L值方法,例如先初始化L的值为0.5,以宽度为W高度为0.5*H生成模板,进一步如步骤S404所描述。
步骤S403:用模板的尺寸截取字符,进行单个字符切割提取。
例如用步骤S402所确定的模板范围截取每一个字符,并检查每一个截取后的单个字符图片中的字符是否完整以及背景色范围大小,比如白色背景色的大小,进一步判断是否满足字符提取效果,如果满足执行步骤S405,如果不满足执行步骤S404。
步骤S404:修改字符高度系数的大小,基于二分查找法L值确定方法就可以完成字符提取效果的动态调整。
具体地,字符高度系数即为模板的高度系统,当需要修改L的情况下,分别设置L的值为0和0.5的中间值0.25,以宽度为W高度为0.25*H生成模板;并设置L的值为0.5和1.0的中间值0.75,以宽度为W高度为0.75生成模板;比较上述两种模板的效果,选取截取效果最好的L值,假设上述截取效果最好对应的L值为0.75,那么将继续取0.5-0.75的中间的L值,0.75-1.0之间的L值继续进行框选,经过多次二分查找法以后确定满足条件的模块尺寸。
通过上述所描述的步骤S401-步骤S404,实现了从所述第二验证码图片中截取相同尺寸的单个字符图片。
步骤S405:保存单个字符图片。具体地,获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
如图5所示,本发明实施例提供了一种验证码字符识别的装置500,包括:验证码图片处理模块501、验证码字符提取模块502和验证码字符识别模块503;其中,所述验证码图片处理模块501,用于获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;所述验证码字符提取模块502,用于从所述第二验证码图片中截取相同尺寸的单个字符图片;所述验证码字符识别模块503,用于利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
可选地,所述验证码图片处理模块501,包括所述预定义规则包括对所述第一验证码图片中的颜色进行处理得到包含两种颜色的所述第二验证码图片。
可选地,所述验证码图片处理模块501,包括所述预定义规则还包括获取所述第一验证码图片中不同颜色对应的像素总数,根据所述像素总数确定所述第一验证码图片中验证码字符的颜色;根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
可选地,所述验证码字符提取模块502,用于确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片,所述单个字符图片中包含的字符具有倾斜度。
可选地,所述验证码字符识别模块503,用于获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片的识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
本发明实施例还提供了一种验证码字符识别的服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例提供的方法。
本发明实施例还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例提供的方法。
图6示出了可以应用本发明实施例的验证码字符识别的方法或验证码字符识别的装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如网页浏览器应用、搜索类应用、即时通信工具和邮箱客户端等。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的企业网站提供支持的后台管理服务器。后台管理服务器可以对接收到的验证码进行识别处理,并将处理结果反馈给终端设备。
需要说明的是,本发明实施例所提供的验证码字符识别的方法一般由服务器605执行,相应地,验证码字符识别的装置一般设置于服务器605中。
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块和/或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块和/或单元也可以设置在处理器中,例如,可以描述为:一种处理器包括验证码图片处理模块、验证码字符提取模块和验证码字符识别模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,验证码图片处理模块还可以被描述为“根据验证码字符的颜色,处理第一验证码图片得到第二验证码图片的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;从所述第二验证码图片中截取相同尺寸的单个字符图片;利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
根据本发明实施例的技术方案,能够提高字符位置不固定,字符一定程度倾斜且背景具有干扰的验证码识别的精度,减少了识别此类验证码的计算成本。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (12)
1.一种验证码字符识别的方法,其特征在于,包括:
获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;
从所述第二验证码图片中截取相同尺寸的单个字符图片;
利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
2.根据权利要求1所述的方法,其特征在于,
所述预定义规则包括对所述第一验证码图片中的颜色进行处理得到包含两种颜色的所述第二验证码图片。
3.根据权利要求2所述的方法,其特征在于,
所述预定义规则还包括获取所述第一验证码图片中不同颜色对应的像素总数,根据所述像素总数确定所述第一验证码图片中验证码字符的颜色,根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
4.根据权利要求1所述的方法,其特征在于,
确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片,所述单个字符图片中包含的字符具有倾斜度。
5.根据权利要求1-4任一所述的方法,其特征在于,
获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
6.一种验证码字符识别的装置,其特征在于,包括:验证码图片处理模块、验证码字符提取模块和验证码字符识别模块;其中,
所述验证码图片处理模块,用于获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;
所述验证码字符提取模块,用于从所述第二验证码图片中截取相同尺寸的单个字符图片;
所述验证码字符识别模块,用于利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
7.根据权利要求6所述的装置,其特征在于,所述预定义规则包括对所述第一验证码图片中的颜色进行处理得到包含两种颜色的所述第二验证码图片。
8.根据权利要求7所述的装置,其特征在于,所述预定义规则还包括获取所述第一验证码图片中不同颜色对应的像素总数,根据所述像素总数确定所述第一验证码图片中验证码字符的颜色;根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
9.根据权利要求6所述的装置,其特征在于,确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片,所述单个字符图片中包含的字符具有倾斜度。
10.根据权利要求6-9任一所述的装置,其特征在于,
获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片的识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
11.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911284188.6A CN111178352A (zh) | 2019-12-13 | 2019-12-13 | 一种验证码字符识别的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911284188.6A CN111178352A (zh) | 2019-12-13 | 2019-12-13 | 一种验证码字符识别的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111178352A true CN111178352A (zh) | 2020-05-19 |
Family
ID=70656351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911284188.6A Pending CN111178352A (zh) | 2019-12-13 | 2019-12-13 | 一种验证码字符识别的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111178352A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308062A (zh) * | 2020-11-23 | 2021-02-02 | 浙江卡易智慧医疗科技有限公司 | 一种复杂背景图像中的医疗影像访问号识别方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930277A (zh) * | 2012-09-19 | 2013-02-13 | 上海珍岛信息技术有限公司 | 一种基于识别反馈的字符图像验证码识别方法 |
US20150131908A1 (en) * | 2013-07-16 | 2015-05-14 | Tencent Technology (Shenzhen) Company Limited | Character recognition method and device |
CN106650398A (zh) * | 2017-01-03 | 2017-05-10 | 深圳博十强志科技有限公司 | 移动平台的验证码识别系统及识别方法 |
CN107038445A (zh) * | 2017-02-13 | 2017-08-11 | 上海大学 | 一种针对中文字符验证码的二值化和分割方法 |
CN107292311A (zh) * | 2017-08-10 | 2017-10-24 | 河南科技大学 | 一种基于神经网络的字符粘连验证码的识别方法 |
CN108206917A (zh) * | 2017-12-29 | 2018-06-26 | 中兴通讯股份有限公司 | 图像处理的方法及装置、存储介质、电子装置 |
CN109858542A (zh) * | 2019-01-25 | 2019-06-07 | 广州云测信息技术有限公司 | 一种字符识别方法和装置 |
CN110363195A (zh) * | 2019-06-18 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 图形验证码识别方法、装置、可读存储介质及终端设备 |
-
2019
- 2019-12-13 CN CN201911284188.6A patent/CN111178352A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930277A (zh) * | 2012-09-19 | 2013-02-13 | 上海珍岛信息技术有限公司 | 一种基于识别反馈的字符图像验证码识别方法 |
US20150131908A1 (en) * | 2013-07-16 | 2015-05-14 | Tencent Technology (Shenzhen) Company Limited | Character recognition method and device |
CN106650398A (zh) * | 2017-01-03 | 2017-05-10 | 深圳博十强志科技有限公司 | 移动平台的验证码识别系统及识别方法 |
CN107038445A (zh) * | 2017-02-13 | 2017-08-11 | 上海大学 | 一种针对中文字符验证码的二值化和分割方法 |
CN107292311A (zh) * | 2017-08-10 | 2017-10-24 | 河南科技大学 | 一种基于神经网络的字符粘连验证码的识别方法 |
CN108206917A (zh) * | 2017-12-29 | 2018-06-26 | 中兴通讯股份有限公司 | 图像处理的方法及装置、存储介质、电子装置 |
CN109858542A (zh) * | 2019-01-25 | 2019-06-07 | 广州云测信息技术有限公司 | 一种字符识别方法和装置 |
CN110363195A (zh) * | 2019-06-18 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 图形验证码识别方法、装置、可读存储介质及终端设备 |
Non-Patent Citations (2)
Title |
---|
杨杰: "常用验证码的识别方法", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/47703273》 * |
王晓波等: "基于MODI的验证码识别系统设计与实现", 《北京信息科技大学学报(自然科学版)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308062A (zh) * | 2020-11-23 | 2021-02-02 | 浙江卡易智慧医疗科技有限公司 | 一种复杂背景图像中的医疗影像访问号识别方法 |
CN112308062B (zh) * | 2020-11-23 | 2022-08-23 | 浙江卡易智慧医疗科技有限公司 | 一种复杂背景图像中的医疗影像访问号识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108038880B (zh) | 用于处理图像的方法和装置 | |
CN108304562B (zh) | 一种搜题方法、搜题装置及智能终端 | |
CN108182457B (zh) | 用于生成信息的方法和装置 | |
CN110895811A (zh) | 一种图像篡改检测方法和装置 | |
CN107818323A (zh) | 用于处理图像的方法和装置 | |
CN109241930B (zh) | 用于处理眉部图像的方法和装置 | |
CN112967191B (zh) | 图像处理方法、装置、电子设备和存储介质 | |
CN110619253B (zh) | 身份识别的方法和装置 | |
CN113902899A (zh) | 训练方法、目标检测方法、装置、电子设备以及存储介质 | |
CN111311619A (zh) | 一种实现滑块验证的方法和装置 | |
CN111178352A (zh) | 一种验证码字符识别的方法和装置 | |
CN109522429B (zh) | 用于生成信息的方法和装置 | |
CN109523564B (zh) | 用于处理图像的方法和装置 | |
CN108304840B (zh) | 一种图像数据处理方法以及装置 | |
CN115719444A (zh) | 图像质量确定方法、装置、电子设备和介质 | |
JP2012003358A (ja) | 背景判別装置、方法及びプログラム | |
CN114663418A (zh) | 图像处理的方法及装置、存储介质及电子设备 | |
CN111783572B (zh) | 一种文本检测方法和装置 | |
CN110889470A (zh) | 用于处理图像的方法和装置 | |
CN108921792B (zh) | 用于处理图片的方法和装置 | |
CN113761249A (zh) | 一种确定图片类型的方法和装置 | |
CN112016348A (zh) | 一种人脸真伪识别方法和装置 | |
CN112580762A (zh) | 动态二维码及其识别方法和识别装置 | |
CN111401137A (zh) | 证件栏位识别的方法和装置 | |
CN111311604A (zh) | 用于分割图像的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220926 Address after: 25 Financial Street, Xicheng District, Beijing 100033 Applicant after: CHINA CONSTRUCTION BANK Corp. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200519 |