CN106650398B - 移动平台的验证码识别系统及识别方法 - Google Patents

移动平台的验证码识别系统及识别方法 Download PDF

Info

Publication number
CN106650398B
CN106650398B CN201710000865.1A CN201710000865A CN106650398B CN 106650398 B CN106650398 B CN 106650398B CN 201710000865 A CN201710000865 A CN 201710000865A CN 106650398 B CN106650398 B CN 106650398B
Authority
CN
China
Prior art keywords
verification code
mobile platform
module
value
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710000865.1A
Other languages
English (en)
Other versions
CN106650398A (zh
Inventor
张博
熊琦松
李十子
毕文波
谭颖骞
胡剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Boshgame Technology Co ltd
Original Assignee
Shenzhen Boshgame Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Boshgame Technology Co ltd filed Critical Shenzhen Boshgame Technology Co ltd
Priority to CN201710000865.1A priority Critical patent/CN106650398B/zh
Publication of CN106650398A publication Critical patent/CN106650398A/zh
Application granted granted Critical
Publication of CN106650398B publication Critical patent/CN106650398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/36User authentication by graphic or iconic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种移动平台的验证码识别系统及识别方法,识别系统包括:移动平台验证码截取模块:用于将原始验证码图片从移动平台截取至验证码识别系统;验证码降噪模块:用于将原始验证码图片通过中值滤波算法进行降噪,得到二次验证码图片;验证码二值化模块:用于将二次验证码图片转化为黑白二色的图片,并切割成多个验证码子块;验证码识别核心模块:用于识别出切割好的验证码子块,并得出验证码代表的字符串,将字符串代表的算式值计算出来;自主学习模块:用于对最优可能的字符进行猜测性尝试,若对猜测值能正确通过,则自动将猜测值记录到自主学习数据库中。本发明能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验。

Description

移动平台的验证码识别系统及识别方法
技术领域
本发明涉及验证码识别领域,特别涉及一种移动平台的验证码识别系统及识别方法。
背景技术
全自动区分计算机和人类的公开图灵测试(Completely Automated PublicTuring test to tell Computers and Humans Apart,简称CAPTCHA)俗称验证码,是一种区分用户是计算机或人的公共全自动程序。在CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。
CAPTCHA目前广泛用于网站的留言板,许多留言板为防止有人利用计算机程序大量在留言板上张贴广告或其他垃圾消息,因此会放置CAPTCHA要求留言者必须输入图片上所显示的数字或是算术题才可以完成留言。而为了避免被计算机程序以暴力法大量尝试交易,一些网络上的交易系统(如订票系统、网络银行)也会有CAPTCHA的机制。
传统的验证码的生成方式较为简单,目前各平台使用的验证码技术从增加干扰点、线,到扭曲、变形验证码中的字符,更甚至通过点击答案图片、拖动图片拼图的方式来防止验证码被机器识别,阻止其他恶性行为的发生。在现有的自动化测试是,移动平台提供的接口模块包含验证码功能,而现有技术在对移动平台提供的接口所包含的验证码进行识别时,其识别较慢,严重影响用户的体验。
另外,目前各网站基本都使用了验证码识别技术,该验证码识别技术可以有效地阻止计算机直接进入网站系统,为用户的信息安全提供了强大的保障。但有时也存在着阻碍自动化测试的普通验证码,这一类验证码的结构较为简单,却对自动化测试产生了较大的阻碍,在不得关闭服务器的验证码功能以及探寻到万能验证码的情况下,如何解决验证码的自动识别问题,成了自动化测试最大的瓶颈。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验的移动平台的验证码识别系统及识别方法。
本发明解决其技术问题所采用的技术方案是:构造一种移动平台的验证码识别系统,包括:
移动平台验证码截取模块:用于将原始验证码图片从移动平台截取至所述移动平台的验证码识别系统,做进一步的处理操作;
验证码降噪模块:与所述移动平台验证码截取模块连接,用于将截取到的所述原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;
验证码二值化模块:与所述验证码降噪模块连接,用于将所述二次验证码图片转化为黑白二色的图片,并按照预先设定的截取框大小将所述黑白二色的图片切割成多个验证码子块;
验证码识别核心模块:与所述验证码二值化模块连接,用于根据总像素含量、像素匹配度、线段拐角匹配度以及自主学习模块产生的学习库比较法,识别出切割好的所述验证码子块,并得出验证码代表的字符串,将所述字符串代表的算式值计算出来;
自主学习模块:与所述验证码识别核心模块连接,用于当所述验证码识别核心模块无法通过算法和学习库比较法得出结果时,根据得到的总像素含量值、像素匹配度和线段拐角匹配度中最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则所述移动平台的验证码识别系统自动将所述猜测值记录到自主学习数据库中。
在本发明所述的移动平台的验证码识别系统中,所述验证码的个数为5块。
本发明还涉及一种利用上述移动平台的验证码识别系统进行验证码的识别方法,包括如下步骤:
A)验证码截取模块将移动平台产生的原始验证码图片截取下来,并保存验证码的输入位置和提交按钮的位置;
B)使用验证码降噪模块对所述原始验证码图片进行中值滤波,得到二次验证码图片;
C)采用验证码二值化模块计算所述二次验证码图片中的整体像素平均值,根据所述整体像素平均值设定阈值,将低于所述阈值的部分设定为黑色,将高于所述阈值的部分设定为白色,并将二值化后得到的黑白二色的图片按照预先设定的截取框切割成多个验证码子块;
D)采用验证码识别核心模块对每一个所述验证码子块所代表的字符进行识别;
E)将识别得到的结果值自动填入到所述验证码的输入位置,并自动点击所述提交按钮,判断所述移动平台返回的状态是否为成功,如是,进行后续的自动化测试;否则,调用第三方人工识别,得出正确结果后经由同步器将其同步至自主学习数据库。
在本发明所述的识别方法中,所述步骤D)进一步包括:
D1)对于每一个所述验证码子块,先计算出原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b,并根据所述原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b计算出原图黑色像素匹配率r1=a/x和学习库黑色像素匹配率r2=a/y;执行步骤D2)或D3);
D2)若a大于b,且r1>0.6,则令b=a,β=r1,α=r2;其中,α为最大学习图匹配率,β为最大原图匹配率;若|y-x|≤4,且r1≥0.7,r2≥0.8,或者|y-x|>4且r1≥0.6,r2≥0.6,则认为学习图为原图的一个解;
D3)若a不大于b,则根据b、α和β计算出加权平均值(b*0.5+α*0.25+β*0.25),选择加权平均值最高者作为猜测字符,得到最终的字符串计算式,测算出结果值并返回。
在本发明所述的识别方法中,对于包含猜测字符的,在测算出的结果值的末尾设置一个标识位,当所述标识位的值为False时,表示所述测算出的结果值为猜测结果。
在本发明所述的识别方法中,对于标识位为False的猜测结果,将所述猜测结果自动填入到所述验证码的输入位置,并自动点击所述提交按钮,当移动平台返回的状态为成功时,则经由所述同步器将所述猜测结果存入所述自主学习数据库,当移动平台返回的状态为失败时,则调用第三方人工识别,得出正确结果后,经由所述同步器将正确结果同步至所述自主学习数据库。
在本发明所述的识别方法中,所述验证码子块的个数为5块。
实施本发明的移动平台的验证码识别系统及识别方法,具有以下有益效果:由于对截取到的原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;然后将二次验证码图片转化为黑白二色的图片,并切割成多个验证码子块;对切割好的验证码子块进行识别,得出验证码代表的字符串,对最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则自动将猜测值记录到自主学习数据库中;本发明能解决简单旋转、放大缩小的字符验证码图片的识别,对于计算式会进行自动运算,得出正确结果并返回,自身具备自主学习的优点,对于未正确识别过的字符,会进行猜测,第三方验证码若通过,会将本次猜测结果保存到自主学习数据库,如此一来,随着程序的运行时间越久,整体识别验证码的正确率将会越来越高,所以其能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明移动平台的验证码识别系统及识别方法一个实施例中的结构示意图;
图2为所述实施例中进行验证码的识别方法的流程图;
图3为所述实施例中采用验证码识别核心模块对每一个所述验证码子块所代表的字符进行识别的具体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明移动平台的验证码识别系统及识别方法实施例中,其移动平台的验证码识别系统的结构示意图如图1所示。图1中,该移动平台的验证码识别系统包括移动平台验证码截取模块1、验证码降噪模块2、验证码二值化模块3、验证码识别核心模块4和自主学习模块5;其中,移动平台验证码截取模块1用于将原始验证码图片从移动平台截取至移动平台的验证码识别系统,做进一步的处理操作;验证码降噪模块2与移动平台验证码截取模块1连接,用于将截取到的原始验证码图片通过中值滤波算法进行降噪处理,去除掉干扰点和线后,得到二次验证码图片;验证码二值化模块3与验证码降噪模块2连接,用于将二次验证码图片转化为黑白二色的图片,并按照预先设定的截取框大小将黑白二色的图片切割成多个验证码子块;本实施例中,将黑白二色的图片切割成5个验证码子块,当然,在实际应用中,验证码子块的个数可根据具体情况进行相应调整。
本实施例中,验证码识别核心模块4与验证码二值化模块3连接,用于根据总像素含量、像素匹配度、线段拐角匹配度以及自主学习模块5产生的学习库比较法,识别出切割好的验证码子块,并得出验证码代表的字符串,将该字符串代表的算式值计算出来;自主学习模块5与验证码识别核心模块4连接,用于当且仅当验证码识别核心模块4无法通过算法和学习库比较法得出结果时,根据算法得到的总像素含量值、像素匹配度和线段拐角匹配度中最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则移动平台的验证码识别系统自动将猜测值记录到自主学习数据库中。随着不断地自主学习,该移动平台的验证码识别系统的识别准确率将会不断提高。
由于本发明的验证码识别系统对截取到的原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;然后将二次验证码图片转化为黑白二色的图片,并切割成多个验证码子块;对切割好的验证码子块进行识别,得出验证码代表的字符串,对最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则自动将猜测值记录到自主学习数据库中;本发明的验证码识别系统能解决简单旋转、放大缩小的字符验证码图片的识别,对于计算式会进行自动运算,得出正确结果并返回,自身具备自主学习的优点,对于未正确识别过的字符,会进行猜测,第三方验证码若通过,会将本次猜测结果保存到自主学习数据库,如此一来,随着程序的运行时间越久,整体识别验证码的正确率将会越来越高,所以其能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验。
本实施例还涉及一种利用上述移动平台的验证码识别系统进行验证码的识别方法,其流程图如图2所示。图2中,该进行验证码的识别方法包括如下步骤:
步骤S01验证码截取模块将移动平台产生的原始验证码图片截取下来,并保存验证码的输入位置和提交按钮的位置:本步骤中,验证码截取模块将移动平台产生的原始验证码图片截取下来,并保存验证码的输入位置和提交按钮的位置。
步骤S02使用验证码降噪模块对原始验证码图片进行中值滤波,得到二次验证码图片:本步骤中,使用验证码降噪模块对原始验证码图片进行中值滤波,去除掉干扰点和线后,得到二次验证码图片。
步骤S03采用验证码二值化模块计算二次验证码图片中的整体像素平均值,根据整体像素平均值设定阈值,将低于阈值的部分设定为黑色,将高于阈值的部分设定为白色,并将二值化后得到的黑白二色的图片按照预先设定的截取框切割成多个验证码子块:本步骤中,采用验证码二值化模块计算二次验证码图片中的整体像素平均值,根据整体像素平均值设定阈值,具体是收集主体验证码符号采用的像素的RGB值,计算出阈值,根据阈值对二次验证码图片进行二值化处理,即将低于阈值的部分设定为黑色,将高于阈值的部分设定为白色。然后将二值化后得到的黑白二色的图片按照预先设定的截取框切割成多个验证码子块。本实施例中,将黑白二色的图片切割成5个验证码子块,当然,在实际应用中,验证码子块的个数可根据具体情况进行相应调整。
步骤S04采用验证码识别核心模块对每一个验证码子块所代表的字符进行识别:本步骤中,采用验证码识别核心模块对每一个验证码子块所代表的字符进行识别,关于如何进行识别,后续会进行详细描述。
步骤S05将识别得到的结果值自动填入到验证码的输入位置,并自动点击提交按钮,判断移动平台返回的状态是否为成功:本步骤中,将识别得到的结果值自动填入到上述步骤S01中保留的验证码的输入位置,并自动点击提交按钮,然后判断移动平台返回的状态是否为成功,如果判断的结果为是,则执行步骤S07;否则,执行步骤S06。
步骤S06调用第三方人工识别,得出正确结果后经由同步器将其同步至自主学习数据库:如果上述步骤S05的判断结果为否,即移动平台返回的状态为失败,则执行本步骤。本步骤中,调用第三方人工识别,得出正确结果后经由同步器将本次的正确结果同步至自主学习数据库,用于以后的验证码识别,提高识别的准确率。
步骤S07进行后续的自动化测试:如果上述步骤S05的判断结果为是,即移动平台返回的状态为成功,则执行本步骤。本步骤中,进行后续的自动化测试。
由于本发明的识别方法对截取到的原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;然后将二次验证码图片转化为黑白二色的图片,并切割成多个验证码子块;对切割好的验证码子块进行识别,得出验证码代表的字符串,对最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则自动将猜测值记录到自主学习数据库中;本发明的识别方法能解决简单旋转、放大缩小的字符验证码图片的识别,对于计算式会进行自动运算,得出正确结果并返回,自身具备自主学习的优点,对于未正确识别过的字符,会进行猜测,第三方验证码若通过,会将本次猜测结果保存到自主学习数据库,如此一来,随着程序的运行时间越久,整体识别验证码的正确率将会越来越高,所以其能对移动平台提供的接口所包含的验证码进行快速自动识别、提升用户的体验。
对于本实施例而言,上述步骤S04还可进一步细化,其细化后的流程图如图3所示。图3中,该步骤S04进一步包括:
步骤S41对于每一个验证码子块,先计算出原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b,并根据原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b计算出原图黑色像素匹配率r1=a/x和学习库黑色像素匹配率r2=a/y:本步骤中,对于每一个验证码子块,先计算出原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b,并根据上述四个参数(即原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b)计算出原图黑色像素匹配率r1=a/x和学习库黑色像素匹配率r2=a/y,其中,r1为原图黑色像素匹配率,r2为学习库黑色像素匹配率。执行完本步骤,执行步骤S42或步骤S43。
步骤S42若a大于b,且r1>0.6,则令b=a,β=r1,α=r2;若|y-x|≤4,且r1≥0.7,r2≥0.8,或者|y-x|>4且r1≥0.6,r2≥0.6,则认为学习图为原图的一个解:本步骤中,若a大于b,且r1>0.6,则可以认定学习图是极接近原图的一个解,更新当前学习图中匹配的黑色像素个数的最大值b,则令b=a,更新最大原图匹配率β,令β=r1,更新最大学习图匹配率α,令α=r2。进一步地,若y减去x的绝对值小于等于4,即|y-x|≤4,且r1≥0.7,r2≥0.8,或者y减去x的绝对值大于4,|y-x|>4且r1≥0.6,r2≥0.6,则认为学习图为原图的一个解。
步骤S43若a不大于b,则根据b、α和β计算出加权平均值(b*0.5+α*0.25+β*0.25),选择加权平均值最高者作为猜测字符,得到最终的字符串计算式,测算出结果值并返回:本步骤中,若a不大于b,则根据现有的参数b、α和β,计算出加权平均值(b*0.5+α*0.25+β*0.25),选择加权平均值最高者作为猜测字符,得到最终的字符串计算式,然后测算出结果值并返回,值得一提的是,还将测算出的结果值保存到结果数组中。
本实施例中,对于包含猜测字符的,在测算出的结果值的末尾设置一个标识位,当标志位的值为True时,读取数据库中保存的验证码的输入位置,将测算出的结果值填入,并读取提交按钮的位置,自动点击提交按钮,上传到移动平台进行校验。
当该标识位的值为False时,表示测算出的结果值为猜测结果。对于标识位为False的猜测结果,读取数据库中保存的验证码的输入位置,将猜测结果自动填入到验证码的输入位置,读取提交按钮的位置,并自动点击提交按钮。上传到移动平台进行校验,当移动平台返回的状态为成功时,则经由同步器将猜测结果存入自主学习数据库,当移动平台返回的状态为失败时,则调用第三方人工识别,得出正确结果后,经由同步器将该正确结果同步至自主学习数据库,用于以后的验证码识别,提高识别的准确率。
总之,本发明通过识别算法和自主学习库的设计模式,能解决自动化测试中的阻碍问题,消除自动化测试存在的瓶颈,能解决简单旋转、放大缩小的字符验证码图片的识别,对于计算式会进行自动运算,得出正确结果并返回,自身具备自主学习的优点,对于未正确识别过的字符,会进行猜测,第三方验证码若通过,会将本次猜测结果保存到自主学习数据库,随着程序的运行时间越来越久,整体识别验证码的准确率将会越来越高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种移动平台的验证码识别系统,其特征在于,包括:
移动平台验证码截取模块:用于将原始验证码图片从移动平台截取至所述移动平台的验证码识别系统,做进一步的处理操作;
验证码降噪模块:与所述移动平台验证码截取模块连接,用于将截取到的所述原始验证码图片通过中值滤波算法进行降噪处理,得到二次验证码图片;
验证码二值化模块:与所述验证码降噪模块连接,用于将所述二次验证码图片转化为黑白二色的图片,并按照预先设定的截取框大小将所述黑白二色的图片切割成多个验证码子块;
验证码识别核心模块:与所述验证码二值化模块连接,用于对于每一个所述验证码子块,先计算出原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b,并根据所述原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b计算出原图黑色像素匹配率r1=a/x和学习库黑色像素匹配率r2=a/y;若a大于b,且r1>0.6,则令b=a,β=r1,α=r2;其中,α为最大学习图匹配率,β为最大原图匹配率;若|y-x|≤4,且r1≥0.7,r2≥0.8,或者|y-x|>4且r1≥0.6,r2≥0.6,则认为学习图为原图的一个解;若a不大于b,则根据b、α和β计算出加权平均值(b*0.5+α*0.25+β*0.25),选择加权平均值最高者作为猜测字符,得到最终的字符串计算式,将字符串代表的算式值计算出来;
自主学习模块:与所述验证码识别核心模块连接,用于当所述验证码识别核心模块无法通过算法和学习库比较法得出结果时,根据得到的总像素含量值、像素匹配度和线段拐角匹配度中最优可能的字符进行猜测性尝试,若移动平台接收到计算好的猜测值并能正确通过,则所述移动平台的验证码识别系统自动将所述猜测值记录到自主学习数据库中。
2.根据权利要求1所述的移动平台的验证码识别系统,其特征在于,所述验证码子块的个数为5块。
3.一种利用如权利要求1所述的移动平台的验证码识别系统进行验证码的识别方法,其特征在于,包括如下步骤:
A)验证码截取模块将移动平台产生的原始验证码图片截取下来,并保存验证码的输入位置和提交按钮的位置;
B)使用验证码降噪模块对所述原始验证码图片进行中值滤波,得到二次验证码图片;
C)采用验证码二值化模块计算所述二次验证码图片中的整体像素平均值,根据所述整体像素平均值设定阈值,将低于所述阈值的部分设定为黑色,将高于所述阈值的部分设定为白色,并将二值化后得到的黑白二色的图片按照预先设定的截取框切割成多个验证码子块;
D1)对于每一个所述验证码子块,先计算出原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b,并根据所述原图的总黑色像素数x、学习库比对图的总黑色像素数y、匹配的黑色像素个数a和当前学习图中匹配的黑色像素个数的最大值b计算出原图黑色像素匹配率r1=a/x和学习库黑色像素匹配率r2=a/y;执行步骤D2)或D3);
D2)若a大于b,且r1>0.6,则令b=a,β=r1,α=r2;其中,α为最大学习图匹配率,β为最大原图匹配率;若|y-x|≤4,且r1≥0.7,r2≥0.8,或者|y-x|>4且r1≥0.6,r2≥0.6,则认为学习图为原图的一个解;
D3)若a不大于b,则根据b、α和β计算出加权平均值(b*0.5+α*0.25+β*0.25),选择加权平均值最高者作为猜测字符,得到最终的字符串计算式,测算出结果值并返回;
E)将识别得到的结果值自动填入到所述验证码的输入位置,并自动点击所述提交按钮,判断所述移动平台返回的状态是否为成功,如是,进行后续的自动化测试;否则,调用第三方人工识别,得出正确结果后经由同步器将其同步至自主学习数据库。
4.根据权利要求3所述的方法,其特征在于,对于包含猜测字符的,在测算出的结果值的末尾设置一个标识位,当所述标识位的值为False时,表示所述测算出的结果值为猜测结果。
5.根据权利要求4所述的方法,其特征在于,对于标识位为False的猜测结果,将所述猜测结果自动填入到所述验证码的输入位置,并自动点击所述提交按钮,当移动平台返回的状态为成功时,则经由所述同步器将所述猜测结果存入所述自主学习数据库,当移动平台返回的状态为失败时,则调用第三方人工识别,得出正确结果后,经由所述同步器将正确结果同步至所述自主学习数据库。
6.根据权利要求3所述的方法,其特征在于,所述验证码子块的个数为5块。
CN201710000865.1A 2017-01-03 2017-01-03 移动平台的验证码识别系统及识别方法 Active CN106650398B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710000865.1A CN106650398B (zh) 2017-01-03 2017-01-03 移动平台的验证码识别系统及识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710000865.1A CN106650398B (zh) 2017-01-03 2017-01-03 移动平台的验证码识别系统及识别方法

Publications (2)

Publication Number Publication Date
CN106650398A CN106650398A (zh) 2017-05-10
CN106650398B true CN106650398B (zh) 2023-04-14

Family

ID=58838308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710000865.1A Active CN106650398B (zh) 2017-01-03 2017-01-03 移动平台的验证码识别系统及识别方法

Country Status (1)

Country Link
CN (1) CN106650398B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862314B (zh) * 2017-10-25 2021-04-20 武汉楚锐视觉检测科技有限公司 一种喷码识别方法和识别装置
CN108563559A (zh) * 2018-03-12 2018-09-21 平安普惠企业管理有限公司 一种验证码的测试方法、装置、终端设备及存储介质
CN109086591A (zh) * 2018-06-11 2018-12-25 平安科技(深圳)有限公司 验证码识别方法、装置、计算机设备及存储介质
CN109284600A (zh) * 2018-08-08 2019-01-29 贵阳朗玛信息技术股份有限公司 一种用于识别验证码的方法及装置
CN109032955B (zh) * 2018-09-07 2021-06-25 郑州云海信息技术有限公司 一种ui自动化测试方法、装置、设备及可读存储介质
CN109523557B (zh) * 2018-10-11 2023-06-16 南宁因果科技有限公司 一种图像语义分割标注方法、装置及存储介质
CN111311619A (zh) * 2018-12-12 2020-06-19 北京京东尚科信息技术有限公司 一种实现滑块验证的方法和装置
CN109635549A (zh) * 2018-12-13 2019-04-16 郑州云海信息技术有限公司 一种自动化测试中验证的方法及装置
CN110490056A (zh) * 2019-07-08 2019-11-22 北京三快在线科技有限公司 对包含算式的图像进行处理的方法和装置
CN111178352A (zh) * 2019-12-13 2020-05-19 中国建设银行股份有限公司 一种验证码字符识别的方法和装置
CN111460426B (zh) * 2020-04-02 2023-06-20 武汉大学 基于对抗演化框架的抗深度学习文本验证码生成系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379091A (zh) * 2012-04-16 2013-10-30 上海博路信息技术有限公司 一种随机验证码
WO2016124066A1 (zh) * 2015-02-05 2016-08-11 北京京东尚科信息技术有限公司 一种图片验证码生成方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379091A (zh) * 2012-04-16 2013-10-30 上海博路信息技术有限公司 一种随机验证码
WO2016124066A1 (zh) * 2015-02-05 2016-08-11 北京京东尚科信息技术有限公司 一种图片验证码生成方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Optical character recognition system based on a novel fuzzy descriptive features";Y. Alginahi等;《 Proceedings 7th International Conference on Signal Processing, 2004. Proceedings. ICSP "04. 2004.》;20050627;第1-4页 *
"基于字符型验证码破解算法研究";张晓菲等;《北京电子科技学院学报》;20161231;第50-77页 *

Also Published As

Publication number Publication date
CN106650398A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN106650398B (zh) 移动平台的验证码识别系统及识别方法
CN107256428B (zh) 数据处理方法、数据处理装置、存储设备及网络设备
CN108366052A (zh) 验证短信的处理方法及系统
CN110703977A (zh) H5网页的输入键盘实现方法、装置、设备及存储介质
CN109194689A (zh) 异常行为识别方法、装置、服务器及存储介质
CN113128241A (zh) 文本识别方法、装置及设备
Hwang et al. A spelling based CAPTCHA system by using click
CN111178147A (zh) 屏幕破碎分级方法、装置、设备及计算机可读存储介质
CN114005019B (zh) 一种翻拍图像识别方法及其相关设备
CN111291666A (zh) 游戏直播视频识别方法、装置、电子设备及存储介质
CN111145202A (zh) 模型生成方法、图像处理方法、装置、设备及存储介质
CN111177725A (zh) 一种检测恶意刷点击操作的方法、装置、设备及存储介质
CN113705164A (zh) 一种文本处理方法、装置、计算机设备以及可读存储介质
CN113377972A (zh) 多媒体内容推荐方法、装置、计算设备和存储介质
KR101854804B1 (ko) 텍스트와 연관된 개체명을 결정하기 위한 사용자 인증 서비스 제공 및 학습 데이터 구축 방법
CN107016316B (zh) 一种条形码的识别方法和装置
CN113868401A (zh) 数字人的交互方法、装置、电子设备及计算机存储介质
CN112131374B (zh) 文本的识别方法、装置和服务器
CN113822521A (zh) 题库题目的质量检测方法、装置及存储介质
CN112580762A (zh) 动态二维码及其识别方法和识别装置
CN112055013A (zh) 一种自动化认证方法、装置、设备和存储介质
CN112597529A (zh) 多媒体内容处理方法和装置、存储介质和电子设备
CN111259216A (zh) 一种信息识别方法、装置及设备
CN110995940A (zh) 骚扰访客识别方法、装置、电子设备及介质
JP5145287B2 (ja) 入力誤り警告装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant