CN112035821A - 图形验证码识别方法、装置、计算机设备及存储介质 - Google Patents
图形验证码识别方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112035821A CN112035821A CN202010921075.9A CN202010921075A CN112035821A CN 112035821 A CN112035821 A CN 112035821A CN 202010921075 A CN202010921075 A CN 202010921075A CN 112035821 A CN112035821 A CN 112035821A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- verification code
- pixel
- verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/36—User authentication by graphic or iconic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了图形验证码识别方法、装置、计算机设备及存储介质。方法包括:根据图像处理规则对所输入的验证码图像进行数值化提取得到样本库,从来自管理服务器的待识别图像中确定目标像素,从目标像素中分割得到包含单个字符的字符图像,对字符图像进行数值化得到与每一字符图像对应的字符特征,根据匹配规则获取样本库中与字符特征相匹配的验证码信息,将包含验证码信息的验证信息反馈至管理服务器。本发明基于图像识别技术,涉及人工智能技术领域,可得到采用数值化形式进行存储的样本库,并基于样本库对待识别图像进行识别以得到验证码信息,相比采用字符图片进行图像验证码识别,可大幅减少样本库占用的存储空间,并提高待识别图像的识别效率。
Description
技术领域
本发明涉及图像识别技术领域,属于智慧城市图像识别相关的应用场景,尤其涉及一种图形验证码识别方法、装置、计算机设备及存储介质。
背景技术
大型企业在程序开发过程中会涉及对程序进行测试,在对程序进行登录测试等环节需根据所提供的图形验证码输入对应的验证码信息,可通过图像识别技术对图形验证码中所包含的验证码字符进行识别以获取对应的验证码信息。然而现有的图形验证码识别方法需在字符库内存储大量的字符图片,并通过字符图片匹配的方式完成对图形验证码的识别,这一识别方法导致字符库需大量的存储空间,且图片匹配的过程中需耗费大量时间,影响了对图形验证码进行识别的效率。因此,现有的技术方法中对验证图像进行识别时存在识别效率不高的问题。
发明内容
本发明实施例提供了一种图形验证码识别方法、装置、计算机设备及存储介质,旨在解决现有技术方法对验证图像进行识别时所存在的识别效率不高的问题。
第一方面,本发明实施例提供了一种图形验证码识别方法,其包括:
若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征;
若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素;
根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像;
根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征;
根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符;
将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
第二方面,本发明实施例提供了一种图形验证码识别装置,其包括:
样本库构建单元,用于若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征;
目标像素确定单元,用于若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素;
字符图像获取单元,用于根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像;
字符特征获取单元,用于根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征;
验证码信息获取单元,用于根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符;
验证信息反馈单元,用于将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的图形验证码识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的图形验证码识别方法。
本发明实施例提供了一种图形验证码识别方法、装置、计算机设备及存储介质。根据图像处理规则对所输入的验证码图像进行数值化提取得到样本库,从来自管理服务器的待识别图像中确定对应的目标像素,从目标像素中分割得到包含单个字符的字符图像,对字符图像进行数值化得到与每一字符图像对应的字符特征,根据匹配规则获取样本库中与字符特征相匹配的验证码信息,将包含验证码信息的验证信息反馈至管理服务器。通过上述方法,可得到采用数值化形式进行存储的样本库,并基于所得到的样本库对待识别图像进行识别以得到验证码信息,相比采用字符图片进行图像验证码识别,可大幅减少样本库所需占用的存储空间,并提高对图形验证码进行识别的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的图形验证码识别方法的流程示意图;
图2为本发明实施例提供的图形验证码识别方法的应用场景示意图;
图3为本发明实施例提供的图形验证码识别方法的使用效果图;
图4为本发明实施例提供的图形验证码识别方法的子流程示意图;
图5为本发明实施例提供的图形验证码识别方法的另一子流程示意图;
图6为本发明实施例提供的图形验证码识别方法的另一子流程示意图;
图7为本发明实施例提供的图形验证码识别方法的另一子流程示意图;
图8为本发明实施例提供的图形验证码识别方法的另一子流程示意图;
图9为本发明实施例提供的图形验证码识别方法的另一子流程示意图;
图10为本发明实施例提供的图形验证码识别装置的示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1及图2,图1是本发明实施例提供的图形验证码识别方法的流程示意图,图2为本发明实施例提供的图形验证码识别方法的应用场景示意图。该图形验证码识别方法应用于用户终端10中,该方法通过安装于用户终端10中的应用软件进行执行,用户终端10与至少一台管理服务器20进行通信,用户可将验证码图像集输入用户终端10并创建得到样本库,若接收到来自任意一台管理服务器20的待识别图像,用户终端10可通过样本库对待识别图像进行识别以获取得到对应的包含验证码信息的验证信息并反馈至管理服务器20,即可完成对待识别图像进行识别的过程。用户终端10即是用于执行图形验证码识别方法以对待识别图像进行识别获取验证码信息的终端设备,例如台式电脑、笔记本电脑、平板电脑或手机等,管理服务器20即为可发送待识别图像至用户终端10的企业终端。如图1所示,该方法包括步骤S110~S160。
S110、若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征。
若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含与多个验证字符及与每一验证字符对应的字符模板特征。其中,用户即为用户终端的使用者,用户可以是企业中对程序进行登录测试的测试人员,用户为了对来自管理服务器的待识别图像进行识别,需先输入验证码图像集以构建样本库,并通过所构建的样本库对待识别图像进行准确识别。所述图像处理规则包括像素判断规则及数值化规则,验证码图像集中包含多个验证码图像,以及与该验证码图像相匹配的一个验证字符,验证码图像即为一张包含验证字符的图像,验证字符即为该图像中所包含的一个具体字符信息,验证字符可以是通过人工方式对包含验证字符的图像进行识别所得到的字符信息,验证字符可以是大写字母、小写字母、阿拉伯数字及汉字中的一种或多种。具体的,一个验证字符在验证码图像集可包含一张相匹配的图像,一个验证字符也可对应多张图像,各种字体对某一个验证字符进行书写的方式各不相同。
例如,验证字符“五”与多种字体之间对应多张图像,则每一张图像与一种字体相对应,每一张图像中均为以一种字体书写“五”所得到的图像信息,则可将与“五”与多种不同字体对应的多张图像均添加至验证码图像集中;增加与验证字符相匹配的图像的数量可显著提高对待识别验证图像进行识别的准确度。
样本库即为存储用于识别待识别验证图像的样本信息,样本库中包含多个验证字符,以及与每一验证字符相匹配的一个或多个字符模板特征。
例如,对与“五”这一验证字符对应的四张图像分别进行数值化,每一张图像均可得到对应的一个字符模板特征,则最终可得到与“五”对应的四个字符模板特征,也即是所得到的样本库中包含与“五”这一验证字符对应的四个字符模板特征。
根据图像处理规则中的像素判断规则可获取与每一验证码图像对应的有效像素,根据有效像素的位置信息裁剪得到与有效像素对应的有效图像,根据数值化规则对有效图像中所包含的有效像素进行数值化,得到与每一验证码图像对应的字符模板特征,字符模板特征即为用于体现有效像素特征的数值信息,的字符模板特征进行对应并存储,即可得到样本库。
在一实施例中,如图4所示,步骤S110包括子步骤S111、S112和S113。
S111、根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素。
根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素。所述像素判断规则中包括灰度化规则及灰度阈值,验证码图像中包含若干个像素,每个像素在该图像中包含对应的像素值,像素所对应的像素值即为与该图像对应的图像信息。像素判断规则即为对每一像素的像素值进行判断的规则信息,根据验证码图像中所包含像素的像素值及像素判断规则即可确定与该图像对应的有效像素。具体的,若验证码图像为彩色图像,则该彩色图像中每一像素点在RGB对应的红(R)、绿(G)、蓝(B)三个颜色通道上分别对应一个像素值;若验证码图像为灰度图像,则该灰度图像中每一像素点在黑色这一颜色通道上对应一个像素值,像素值均采用非负整数进行表示,其取值范围为[0,255],以黑色这一颜色通道为例,若某一像素的像素值为0则表示该像素的颜色为黑色,若某一像素的像素值为255则表示该像素的颜色为白色,像素值为其他数值则表明该像素的颜色为介于白色与黑色之间的一个具体灰度。
在一实施例中,如图5所示,步骤S111包括子步骤S1111、S1112和S1113。
S1111、根据所述灰度化规则对每一个所述验证码图像进行灰度化以得到与每一所述验证码图像相匹配的灰度图像;S1112、对所述灰度图像中所包含像素的灰度值是否大于所述灰度阈值进行判断,以获取灰度值不大于所述灰度阈值的像素;S1113、对所述灰度值不大于灰度阈值的每一像素是否孤立进行判断,以将孤立的像素从所述灰度值不大于灰度阈值的像素中剔除以得到所述有效像素。
若验证码图像不为灰度图像,可通过灰度化规则对该图像进行灰度化处理,以得到对应的灰度图像,灰度化规则可将每一像素点在RGB对应的像素值转换为在黑色这一颜色通道上对应一个像素值;若验证码图像为灰度图像,则无需进行灰度化处理。图3为本发明实施例提供的图形验证码识别方法的使用效果图,进行灰度化处理后所得到的灰度图像如图3-(a)所示。判断灰度图像中每一像素的像素值是否大于灰度阈值,获取所有不大于灰度阈值的像素,例如,若灰度阈值为80,则可对每一像素的像素值进行判断以获取像素值不大于80的像素;由于可从图像中识别得到的有效信息均为多个像素相连接而形成的像素区块,因此可将图像中多个像素相连接而形成的像素区块作为有效像素,具体的,对所得到的不大于灰度阈值的每一像素是否孤立进行判断,也即是对每一像素是否与像素值不大于灰度阈值的其他像素相连,若相连,则判断结果为该像素不孤立;若不相连,则判断结果为该像素孤立,将孤立的像素剔除即可得到有效像素,所得到的有效像素对应的图像如图3-(b)所示。
S112、根据每一所述图像中有效像素的位置信息提取包含所述有效像素的有效图像。
根据每一所述图像中有效像素的位置信息提取包含所述有效像素的有效图像。具体的,图像中每一有效像素在该图像中的坐标值即为有效像素的位置信息,根据有效像素的位置信息即可从图像中提取得到包含有效像素的有效图像,所得到的有效图像如图3-(c)所示。
在一实施例中,步骤S112包括子步骤:根据一个所述图像中有效像素的位置信息确定所述有效像素的矩形边界;根据所述矩形边界从有效像素中提取得到对应的矩形图像;对所述矩形图像进行二值化以得到仅包含黑色和白色的有效图像。
根据图像中有效像素的位置信息确定与有效像素对应的一个矩形边界,矩形边界即为根据有效像素中最外围的有效像素的坐标值确定的矩形框,根据该矩形边界从有效像素中提取得到矩形图像,矩形图像中包含所有有效像素,对矩形图像进行二值化,将所有有效像素变更为黑色,将矩形图像中的其他像素变更为白色,也即是所得到的有效图像中仅包含黑色及白色两种颜色。
S113、根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征。
根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征。根据数值化规则即为对有效图像进行数值化的规则信息,对有效图像进行数值化后即可得到与该有效图像对应的字符模板特征,字符模板特征即为通过数值对验证码图像的特征进行量化表示的特征信息,字符模板特征包括尺寸数组及坐标数组,尺寸数组用于表示有效图像的尺寸,坐标数组可用于表示有效图像中每一有效像素的坐标值。
在一实施例中,如图6所示,步骤S113包括子步骤S1131、S1132和S1133。
S1131、获取一张所述有效图像的尺寸信息,根据所述数值化规则生成与所述尺寸信息对应的尺寸数组;S1132、获取所述有效图像中所有有效像素的坐标信息,根据所述数值化规则及所述坐标信息生成与每一所述有效像素对应的坐标数组;S1133、将所述尺寸数组与所有所述坐标数组作为与所述有效图像对应的一验证码图像的字符模板特征。
例如,某一有效图像的尺寸信息为:长25像素,宽15像素,则得到与该有效图像对应的尺寸数组为{25,15};有效图像中某一有效像素位于第3行第7列,则得到与该有效像素对应的坐标数组为{3,7}。
S120、若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素。
若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素。用户通过用户终端登录网页或邮箱的过程中,管理服务器会下发待识别图像至用户终端,待识别图像即为需进行识别的图形验证码,图形验证码由一个或多个验证码字符,可根据图像处理规则中的像素判断规则对待识别图像中的像素进行判断并获取对应的目标像素,像素判断规则中包括灰度化规则及灰度阈值。
在一实施例中,步骤S120包括子步骤:根据所述灰度化规则对所述待识别图像进行灰度化以得到与所述待识别图像相匹配的待识别灰度图像;对所述待识别灰度图像中所包含像素的灰度值是否大于所述灰度阈值进行判断,以获取灰度值大于所述灰度阈值的像素;对所述灰度值大于灰度阈值的每一像素是否孤立进行判断,以将孤立的像素从所述灰度值大于灰度阈值的像素中剔除得到以所述目标像素。具体的,从待识别图像中获取对应的目标像素的方法与从验证码图像中获取对应的有效像素的方法相同,在此不展开进行说明。
S130、根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像。
根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像。具体的,根据目标像素中每一像素的位置信息,即可从目标像素中分割得到包含单个字符的分割图像,根据图像调整规则对该分割图像进行调整,即可得到仅包含单个字符的字符图像,也即是根据目标像素中所包含字符的数量,即可得到与字符数量相同的多个字符图像。
在一实施例中,如图7所示,步骤S130包括子步骤S131、S132和S133。
S131、根据所述目标像素中每一像素的位置信息获取所述目标像素中多个像素相连接而形成的像素区块;每一所述像素区块中均包含一个字符。
根据所述目标像素中每一像素的位置信息获取所述目标像素中多个像素相连接而形成的像素区块;每一所述像素区块中均包含一个字符。由于单个字符均是由多个像素相连接而形成的像素区块,因此根据目标像素的位置信息,将有多个像素相连接的像素区块作为与一个字符对应的像素区块。
S132、根据所述像素区块在所述目标像素中所处的位置提取得到与每一像素区块对应的分割图像。
根据所述像素区块在所述目标像素中所处的位置提取得到与每一像素区块对应的分割图像。具体的,根据某一个像素区块在目标像素中所处的为位置即可确定与该像素区块对应的一个矩形边界,矩形边界即为根据该像素区块中最外围的像素的坐标值确定的矩形框,根据该矩形边界从目标像素中提取得到与一个与该像素区块对应的分割图像。
S133、根据所述图像调整规则对所述分割图像进行调整以得到与每一所述分割图像对应的字符图像。
根据所述图像调整规则对所述分割图像进行调整以得到与每一所述分割图像对应的字符图像。具体的,可根据所得到的分割图像的尺寸等特征信息,对分割图像进行调整以得到与每一分割图像对应的字符图像具体的,图像调整规则包括放大、缩小、裁剪及旋转中的一种或多种,调整后的字符图像即为满足图像调整规则的图像。
S140、根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征。
根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征。根据数值化规则即为对字符图像中所包含的字符像素进行数值化的规则信息,对一个字符图像进行数值化后即可得到与该字符图像对应的字符特征,字符特征即为通过数值对字符图像的特征进行量化表示的特征信息,字符特征也包括尺寸数组及坐标数组,尺寸数组用于表示字符图像的尺寸,坐标数组可用于表示字符图像中每一字符像素的坐标值。
在一实施例中,步骤S140包括子步骤:获取一张所述字符图像的尺寸信息,根据所述数值化规则生成与所述尺寸信息对应的尺寸数组;获取所述字符图像中所有字符像素的坐标信息,根据所述数值化规则及所述坐标信息生成与每一所述字符像素对应的坐标数组;将所述尺寸数组与所有所述坐标数组作为与所述字符图像对应的字符特征。
从字符图像中获取对应的字符特征的方法与从有效图像中获取对应的字符模板特征的方法相同,在此不展开进行说明。
S150、根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符。
根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符。具体的,待识别图像中所包含的字符图像的数量即与验证码信息中验证字符的数量相等,每一字符图像对应一个字符特征,可根据匹配规则获取样本库中与每一字符特征对应的一个验证字符,将所得到的验证字符进行组合后即可得到与待识别图像对应的验证码信息。
在一实施例中,如图8所示,步骤S150包括子步骤S151和S152。
S151、根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符。
根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符。所述匹配规则中包括尺寸阈值、像素密度计算公式及密度阈值,尺寸阈值即是用于判断字符特征的尺寸比值与字符模板特征的尺寸比值是否相匹配的阈值信息,尺寸比值可根据尺寸数组中的数值计算得到,若字符特征的尺寸比值与字符模板特征的尺寸比值之间的差值不大于尺寸阈值,则两者相匹配,否则两者不相匹配;像素密度计算公式即是用于获取字符特征或字符模板特征进行计算以获取对应像素密度的计算公式,若字符特征对应的像素密度较大,则表明该字符特征所对应的字符图像中单位面积内所包含的字符像素较多,反之则表明该字符特征所对应的字符图像中单位面积内所包含的字符像素较少;密度阈值即是用于判断字符特征的像素密度是否与字符模板特征的像素密度是否相匹配的阈值信息,若字符特征的像素密度与字符模板特征的像素密度之间的差值不大于密度阈值,则两者相匹,否则两者不相匹配。
根据上述方法筛选得到符合条件的字符模板特征组合为与一个字符特征对应的第二特征集,计算第二特征集中每一字符模板特征与该字符特征之间的匹配度,并筛选得到一个与字符特征匹配度最高的字符模板特征,并进一步获取该字符模板特征的验证字符作为该字符特征的验证字符。根据上述方式可获取到与每一字符特征对应的一个验证字符。
在一实施例中,如图9所示,步骤S151包括子步骤S1511、S1512、S1513和S1514。
S1511、根据所述尺寸阈值获取所述样本库中尺寸比值与一个所述字符特征的尺寸比值相匹配的字符模板特征以得到第一特征集。
例如,某一字符特征的尺寸数组为{25,15},样本库中某一字符模板特征的尺寸数组为{20,10},尺寸阈值为0.3;该字符特征的尺寸比值为1.6667,该字符模板特征的尺寸比值为2,两者的尺寸比值的差值为0.3333,大于尺寸阈值,则该字符模板特征不与该字符特征相匹配。
S1512、根据所述像素密度计算公式计算所述字符特征的第一像素密度及所述第一特征集中每一字符模板特征的第二像素密度。
计算像素密度以字符特征为例进行说明,获取该字符特征中所包含的坐标数组的数量,并除以尺寸数组中数值的乘积,即可得到该字符特征的像素密度。像素密度计算公式可表示为:
M=N/(C1×C2) (1);
其中,M为字符特征的像素密度,N为该字符特征中坐标数组的数量,C1为该字符特征中尺寸数组的第一个数值,C2为该字符特征中尺寸数组的第二个数值。
若一字符特征的尺寸数组为{25,15},该组分特征中坐标数组的数量为60,则对应的像素密度M=60/(25×15)=0.16。计算字符模板特征的像素密度的方式与上述方式相同。
S1513、判断所述第一像素密度与所述每一所述第二像素密度之间的差值是否小于所述密度阈值,以获取差值小于所述密度阈值的字符模板特征作为第二特征集。
S1514、计算所述字符特征与所述第二特征集中的每一字符模板特征之间的匹配度,获取所述第二特征集中匹配度最高的一个字符模板特征对应的验证字符作为与所述字符特征对应验证字符。
具体的,将字符特征中每一坐标数组的数值除以该字符特征的尺寸数组,得到与每一坐标数组对应的矢量数组,例如,某一字符特征的尺寸数组为{25,15},其中某一坐标数组为{3,7},则计算得到与该坐标数组对应的一个矢量数组为{3/25,7/15},也即是{0.12,0.4667}。以同样方式获取第二特征集中每一字符模板特征的矢量数组,获取一个字符模板特征的矢量数组与该字符特征的矢量数组相重合的数组数量,将相重合的数组数量除以该字符特征的矢量数组所得到的计算结果,作为该字符模板特征与该字符特征之间的匹配度。根据上述方法计算第二特征集中每一字符模板特征与该字符特征之间的匹配度,并获取匹配度最高的一个字符模板特征所对应的验证字符作为与该字符特征对应验证字符。
S152、根据所述字符特征的顺序对所述验证字符进行组合以得到与所述字符特征对应的验证码信息。
根据所述字符特征的顺序对所述验证字符进行组合以得到与所述字符特征对应的验证码信息。对待识别图像进行分割后所得到的字符图像有一定的顺序,字符图像的顺序与所述字符特征的顺序相同,即可根据字符特征的顺序对与每一字符特征相对应的一个验证字符进行组合,以得到包含以既定顺序排列的多个验证字符所组成的验证码信息。
例如,对某一待识别图像进行识别后所得到的验证码信息为“T4bP”。
S160、将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。待识别图像还包含一个与该待识别图像对应的标识信息,标识信息即可对每一待识别图像进行唯一标识,用户终端可将与待识别图像对应的标识信息及所得到的验证码信息进行组合,以得到对应的验证信息并反馈至管理服务器,管理服务器接收到验证信息后即可获取与该验证信息中的标识信息相匹配的目标验证码,以根据目标验证码对该验证信息中的验证码信息进行验证。
本申请中的技术方法可应用于智慧政务/智慧城管/智慧社区/智慧安防/智慧物流/智慧医疗/智慧教育/智慧环保/智慧交通等包含图形验证码识别的应用场景中,从而推动智慧城市的建设。
在本发明实施例所提供的图形验证码识别方法中,根据图像处理规则对所输入的验证码图像进行数值化提取得到样本库,从来自管理服务器的待识别图像中确定对应的目标像素,从目标像素中分割得到包含单个字符的字符图像,对字符图像进行数值化得到与每一字符图像对应的字符特征,根据匹配规则获取样本库中与字符特征相匹配的验证码信息,将包含验证码信息的验证信息反馈至管理服务器。通过上述方法,可得到采用数值化形式进行存储的样本库,并基于所得到的样本库对待识别图像进行识别以得到验证码信息,相比采用字符图片进行图像验证码识别,可大幅减少样本库所需占用的存储空间,并提高对图形验证码进行识别的效率。
本发明实施例还提供一种图形验证码识别装置,该图形验证码识别装置用于执行前述图形验证码识别方法的任一实施例。具体地,请参阅图10,图10是本发明实施例提供的图形验证码识别装置的示意性框图。该图形验证码识别装置可以配置于用户终端中。
如图10所示,图形验证码识别装置100包括样本库构建单元110、目标像素确定单元120、字符图像获取单元130、字符特征获取单元140、验证码信息获取单元150和验证信息反馈单元160。
样本库构建单元110,用于若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征。
在一实施例中,所述样本库构建单元110包括子单元有效像素确定单元、有效图像获取单元及数值化处理单元。
有效像素确定单元,用于根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素;有效图像获取单元,用于根据每一所述图像中有效像素的位置信息提取包含所述有效像素的有效图像;数值化处理单元,用于根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征。
在一实施例中,所述有效像素确定单元包括子单元:灰度图像获取单元、灰度值判断单元及像素剔除单元。
灰度图像获取单元,用于根据所述灰度化规则对每一个所述验证码图像进行灰度化以得到与每一所述验证码图像相匹配的灰度图像;灰度值判断单元,用于对所述灰度图像中所包含像素的灰度值是否大于所述灰度阈值进行判断,以获取灰度值不大于所述灰度阈值的像素;像素剔除单元,用于对所述灰度值不大于灰度阈值的每一像素是否孤立进行判断,以将孤立的像素从所述灰度值不大于灰度阈值的像素中剔除以得到所述有效像素。
在一实施例中,所述有效图像获取单元包括子单元:矩形边界确定单元、矩形图像提取单元及二值化处理单元。
矩形边界确定单元,用于根据一个所述图像中有效像素的位置信息确定所述有效像素的矩形边界;矩形图像提取单元,用于根据所述矩形边界从有效像素中提取得到对应的矩形图像;二值化处理单元,用于对所述矩形图像进行二值化以得到仅包含黑色和白色的有效图像。
在一实施例中,所述数值化处理单元包括子单元:尺寸数组生成单元、坐标数组生成单元及字符模板特征获取单元。
尺寸数组生成单元,用于获取一张所述有效图像的尺寸信息,根据所述数值化规则生成与所述尺寸信息对应的尺寸数组;坐标数组生成单元,用于获取所述有效图像中所有有效像素的坐标信息,根据所述数值化规则及所述坐标信息生成与每一所述有效像素对应的坐标数组;字符模板特征获取单元,用于将所述尺寸数组与所有所述坐标数组作为与所述有效图像对应的一验证码图像的字符模板特征。
目标像素确定单元120,用于若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素。
字符图像获取单元130,用于根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像。
在一实施例中,所述字符图像获取单元130包括子单元:像素区块获取单元、分割图像获取单元及图像调整单元。
像素区块获取单元,用于根据所述目标像素中每一像素的位置信息获取所述目标像素中多个像素相连接而形成的像素区块;每一所述像素区块中均包含一个字符;分割图像获取单元,用于根据所述像素区块在所述目标像素中所处的位置提取得到与每一像素区块对应的分割图像;图像调整单元,用于根据所述图像调整规则对所述分割图像进行调整以得到与每一所述分割图像对应的字符图像。
字符特征获取单元140,用于根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征。
验证码信息获取单元150,用于根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符。
在一实施例中,所述验证码信息获取单元150包括子单元:验证字符匹配单元及验证字符组合单元。
验证字符匹配单元,用于根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符;验证字符组合单元,用于根据所述字符特征的顺序对所述验证字符进行组合以得到与所述字符特征对应的验证码信息。
在一实施例中,所述验证字符匹配单元包括子单元:第一特征集获取单元、像素密度获取单元、第二特征集获取单元及验证字符确定单元。
第一特征集获取单元,用于根据所述尺寸阈值获取所述样本库中尺寸比值与一个所述字符特征的尺寸比值相匹配的字符模板特征以得到第一特征集;像素密度获取单元,用于根据所述像素密度计算公式计算所述字符特征的第一像素密度及所述第一特征集中每一字符模板特征的第二像素密度;第二特征集获取单元,用于判断所述第一像素密度与所述每一所述第二像素密度之间的差值是否小于所述密度阈值,以获取差值小于所述密度阈值的字符模板特征作为第二特征集;验证字符确定单元,用于计算所述字符特征与所述第二特征集中的每一字符模板特征之间的匹配度,获取所述第二特征集中匹配度最高的一个字符模板特征对应的验证字符作为与所述字符特征对应验证字符。
验证信息反馈单元160,用于将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
在本发明实施例所提供的图形验证码识别装置应用上述图形验证码识别方法,根据图像处理规则对所输入的验证码图像进行数值化提取得到样本库,从来自管理服务器的待识别图像中确定对应的目标像素,从目标像素中分割得到包含单个字符的字符图像,对字符图像进行数值化得到与每一字符图像对应的字符特征,根据匹配规则获取样本库中与字符特征相匹配的验证码信息,将包含验证码信息的验证信息反馈至管理服务器。通过上述方法,可得到采用数值化形式进行存储的样本库,并基于所得到的样本库对待识别图像进行识别以得到验证码信息,相比采用字符图片进行图像验证码识别,可大幅减少样本库所需占用的存储空间,并提高对图形验证码进行识别的效率。
上述图形验证码识别装置可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。
参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行图形验证码识别方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行图形验证码识别方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征;若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素;根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像;根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征;根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符;将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
在一实施例中,处理器502在执行若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库的步骤时,执行如下操作:根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素;根据每一所述图像中有效像素的位置信息提取包含所述有效像素的有效图像;根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征。
在一实施例中,处理器502在执行根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素的步骤时,执行如下操作:根据所述灰度化规则对每一个所述验证码图像进行灰度化以得到与每一所述验证码图像相匹配的灰度图像;对所述灰度图像中所包含像素的灰度值是否大于所述灰度阈值进行判断,以获取灰度值不大于所述灰度阈值的像素;对所述灰度值不大于灰度阈值的每一像素是否孤立进行判断,以将孤立的像素从所述灰度值不大于灰度阈值的像素中剔除以得到所述有效像素。
在一实施例中,处理器502在执行根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征的步骤时,执行如下操作:获取一张所述有效图像的尺寸信息,根据所述数值化规则生成与所述尺寸信息对应的尺寸数组;获取所述有效图像中所有有效像素的坐标信息,根据所述数值化规则及所述坐标信息生成与每一所述有效像素对应的坐标数组;将所述尺寸数组与所有所述坐标数组作为与所述有效图像对应的一验证码图像的字符模板特征。
在一实施例中,处理器502在执行根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像的步骤时,执行如下操作:根据所述目标像素中每一像素的位置信息获取所述目标像素中多个像素相连接而形成的像素区块;每一所述像素区块中均包含一个字符;根据所述像素区块在所述目标像素中所处的位置提取得到与每一像素区块对应的分割图像;根据所述图像调整规则对所述分割图像进行调整以得到与每一所述分割图像对应的字符图像。
在一实施例中,处理器502在执行根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息的步骤时,执行如下操作:根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符;根据所述字符特征的顺序对所述验证字符进行组合以得到与所述字符特征对应的验证码信息。
在一实施例中,处理器502在执行根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符的步骤时,执行如下操作:根据所述尺寸阈值获取所述样本库中尺寸比值与一个所述字符特征的尺寸比值相匹配的字符模板特征以得到第一特征集;根据所述像素密度计算公式计算所述字符特征的第一像素密度及所述第一特征集中每一字符模板特征的第二像素密度;判断所述第一像素密度与所述每一所述第二像素密度之间的差值是否小于所述密度阈值,以获取差值小于所述密度阈值的字符模板特征作为第二特征集;计算所述字符特征与所述第二特征集中的每一字符模板特征之间的匹配度,获取所述第二特征集中匹配度最高的一个字符模板特征对应的验证字符作为与所述字符特征对应验证字符。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征;若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素;根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像;根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征;根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符;将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
在一实施例中,所述若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库的步骤,包括:根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素;根据每一所述图像中有效像素的位置信息提取包含所述有效像素的有效图像;根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征。
在一实施例中,所述根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素的步骤,包括:根据所述灰度化规则对每一个所述验证码图像进行灰度化以得到与每一所述验证码图像相匹配的灰度图像;对所述灰度图像中所包含像素的灰度值是否大于所述灰度阈值进行判断,以获取灰度值不大于所述灰度阈值的像素;对所述灰度值不大于灰度阈值的每一像素是否孤立进行判断,以将孤立的像素从所述灰度值不大于灰度阈值的像素中剔除以得到所述有效像素。
在一实施例中,所述根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征的步骤,包括:获取一张所述有效图像的尺寸信息,根据所述数值化规则生成与所述尺寸信息对应的尺寸数组;获取所述有效图像中所有有效像素的坐标信息,根据所述数值化规则及所述坐标信息生成与每一所述有效像素对应的坐标数组;将所述尺寸数组与所有所述坐标数组作为与所述有效图像对应的一验证码图像的字符模板特征。
在一实施例中,所述根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像的步骤,包括:根据所述目标像素中每一像素的位置信息获取所述目标像素中多个像素相连接而形成的像素区块;每一所述像素区块中均包含一个字符;根据所述像素区块在所述目标像素中所处的位置提取得到与每一像素区块对应的分割图像;根据所述图像调整规则对所述分割图像进行调整以得到与每一所述分割图像对应的字符图像。
在一实施例中,所述根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息的步骤,包括:根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符;根据所述字符特征的顺序对所述验证字符进行组合以得到与所述字符特征对应的验证码信息。
在一实施例中,所述根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符的步骤,包括:根据所述尺寸阈值获取所述样本库中尺寸比值与一个所述字符特征的尺寸比值相匹配的字符模板特征以得到第一特征集;根据所述像素密度计算公式计算所述字符特征的第一像素密度及所述第一特征集中每一字符模板特征的第二像素密度;判断所述第一像素密度与所述每一所述第二像素密度之间的差值是否小于所述密度阈值,以获取差值小于所述密度阈值的字符模板特征作为第二特征集;计算所述字符特征与所述第二特征集中的每一字符模板特征之间的匹配度,获取所述第二特征集中匹配度最高的一个字符模板特征对应的验证字符作为与所述字符特征对应验证字符。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种图形验证码识别方法,其特征在于,包括:
若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征;
若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素;
根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像;
根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征;
根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符;
将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
2.根据权利要求1所述的图形验证码识别方法,其特征在于,所述图像处理规则包括像素判断规则及数值化规则,所述根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,包括:
根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素;
根据每一所述图像中有效像素的位置信息提取包含所述有效像素的有效图像;
根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征。
3.根据权利要求2所述的图形验证码识别方法,其特征在于,所述像素判断规则包括灰度化规则及灰度阈值,所述根据所述验证码图像集中每一验证码图像的图像信息及像素判断规则确定与每一所述图像对应的有效像素,包括:
根据所述灰度化规则对每一个所述验证码图像进行灰度化以得到与每一所述验证码图像相匹配的灰度图像;
对所述灰度图像中所包含像素的灰度值是否大于所述灰度阈值进行判断,以获取灰度值不大于所述灰度阈值的像素;
对所述灰度值不大于灰度阈值的每一像素是否孤立进行判断,以将孤立的像素从所述灰度值不大于灰度阈值的像素中剔除以得到所述有效像素。
4.根据权利要求2所述的图形验证码识别方法,其特征在于,所述根据所述数值化规则对每一所述有效图像进行数值化以得到与每一所述验证码图像对应的字符模板特征,包括:
获取一张所述有效图像的尺寸信息,根据所述数值化规则生成与所述尺寸信息对应的尺寸数组;
获取所述有效图像中所有有效像素的坐标信息,根据所述数值化规则及所述坐标信息生成与每一所述有效像素对应的坐标数组;
将所述尺寸数组与所有所述坐标数组作为与所述有效图像对应的一验证码图像的字符模板特征。
5.根据权利要求1所述的图形验证码识别方法,其特征在于,所述根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像,包括:
根据所述目标像素中每一像素的位置信息获取所述目标像素中多个像素相连接而形成的像素区块;每一所述像素区块中均包含一个字符;
根据所述像素区块在所述目标像素中所处的位置提取得到与每一像素区块对应的分割图像;
根据所述图像调整规则对所述分割图像进行调整以得到与每一所述分割图像对应的字符图像。
6.根据权利要求1所述的图形验证码识别方法,其特征在于,所述根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,包括:
根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符;
根据所述字符特征的顺序对所述验证字符进行组合以得到与所述字符特征对应的验证码信息。
7.根据权利要求6所述的图形验证码识别方法,其特征在于,所述匹配规则中包括尺寸阈值、像素密度计算公式及密度阈值,所述根据所述匹配规则获取所述样本库中与每一所述字符特征对应的一个验证字符,包括:
根据所述尺寸阈值获取所述样本库中尺寸比值与一个所述字符特征的尺寸比值相匹配的字符模板特征以得到第一特征集;
根据所述像素密度计算公式计算所述字符特征的第一像素密度及所述第一特征集中每一字符模板特征的第二像素密度;
判断所述第一像素密度与所述每一所述第二像素密度之间的差值是否小于所述密度阈值,以获取差值小于所述密度阈值的字符模板特征作为第二特征集;
计算所述字符特征与所述第二特征集中的每一字符模板特征之间的匹配度,获取所述第二特征集中匹配度最高的一个字符模板特征对应的验证字符作为与所述字符特征对应验证字符。
8.一种图形验证码识别装置,其特征在于,包括:
样本库构建单元,用于若接收到用户所输入的验证码图像集,根据预置的图像处理规则对所述验证码图像集中包含的所有验证码图像进行数值化提取以得到与验证码图像集对应的样本库,所述样本库中包含多个验证字符及与每一验证字符对应的字符模板特征;
目标像素确定单元,用于若接收到来自管理服务器的待识别图像,根据所述图像处理规则中的像素判断规则确定与所述待识别图像对应的目标像素;
字符图像获取单元,用于根据预置的图像调整规则及所述目标像素的位置信息从所述目标像素中分割得到包含单个字符的字符图像;
字符特征获取单元,用于根据所述图像处理规则中的数值化规则对每一所述字符图像中的字符像素进行数值化以得到与每一所述字符图像对应的字符特征;
验证码信息获取单元,用于根据预置的匹配规则及所述字符特征获取所述样本库中与所述字符特征相匹配的验证码信息,所述验证码信息中包含至少一个所述验证字符;
验证信息反馈单元,用于将所述待识别图像的标识信息与所述验证码信息的组合作为与所述待识别图像对应的验证信息反馈至所述管理服务器。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的图形验证码识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的图形验证码识别方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010921075.9A CN112035821A (zh) | 2020-09-04 | 2020-09-04 | 图形验证码识别方法、装置、计算机设备及存储介质 |
PCT/CN2020/131758 WO2021159802A1 (zh) | 2020-09-04 | 2020-11-26 | 图形验证码识别方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010921075.9A CN112035821A (zh) | 2020-09-04 | 2020-09-04 | 图形验证码识别方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112035821A true CN112035821A (zh) | 2020-12-04 |
Family
ID=73591436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010921075.9A Pending CN112035821A (zh) | 2020-09-04 | 2020-09-04 | 图形验证码识别方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112035821A (zh) |
WO (1) | WO2021159802A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529004A (zh) * | 2020-12-08 | 2021-03-19 | 平安科技(深圳)有限公司 | 智能图像识别方法、装置、计算机设备及存储介质 |
CN115223293A (zh) * | 2022-07-14 | 2022-10-21 | 深圳诺博医疗科技有限公司 | 用于耗材柜的取用验证方法、装置、系统及设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114943063B (zh) * | 2022-03-04 | 2023-04-07 | 杭州京胜航星科技有限公司 | 一种基于互联网的电子印章生成与识别系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722729A (zh) * | 2011-03-22 | 2012-10-10 | 柯尼卡美能达美国研究所有限公司 | 通过用字符的形状特征来比较字符而检测文档变化的方法 |
CN105117704A (zh) * | 2015-08-25 | 2015-12-02 | 电子科技大学 | 一种基于多特征的文本图像一致性比较方法 |
CN107067006A (zh) * | 2017-04-20 | 2017-08-18 | 金电联行(北京)信息技术有限公司 | 一种服务于数据采集的验证码识别方法及系统 |
CN108563559A (zh) * | 2018-03-12 | 2018-09-21 | 平安普惠企业管理有限公司 | 一种验证码的测试方法、装置、终端设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021376B (zh) * | 2014-06-05 | 2017-11-21 | 北京乐动卓越科技有限公司 | 验证码识别方法和装置 |
CN105844205B (zh) * | 2015-01-15 | 2019-05-31 | 新天科技股份有限公司 | 基于图像处理的字符信息识别方法 |
CN107273890A (zh) * | 2017-05-26 | 2017-10-20 | 亿海蓝(北京)数据技术股份公司 | 针对字符组合的图形验证码识别方法及装置 |
CN110363195A (zh) * | 2019-06-18 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 图形验证码识别方法、装置、可读存储介质及终端设备 |
CN111274957A (zh) * | 2020-01-20 | 2020-06-12 | 阳光人寿保险股份有限公司 | 网页页面验证码识别方法、装置、终端和计算机存储介质 |
-
2020
- 2020-09-04 CN CN202010921075.9A patent/CN112035821A/zh active Pending
- 2020-11-26 WO PCT/CN2020/131758 patent/WO2021159802A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722729A (zh) * | 2011-03-22 | 2012-10-10 | 柯尼卡美能达美国研究所有限公司 | 通过用字符的形状特征来比较字符而检测文档变化的方法 |
CN105117704A (zh) * | 2015-08-25 | 2015-12-02 | 电子科技大学 | 一种基于多特征的文本图像一致性比较方法 |
CN107067006A (zh) * | 2017-04-20 | 2017-08-18 | 金电联行(北京)信息技术有限公司 | 一种服务于数据采集的验证码识别方法及系统 |
CN108563559A (zh) * | 2018-03-12 | 2018-09-21 | 平安普惠企业管理有限公司 | 一种验证码的测试方法、装置、终端设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529004A (zh) * | 2020-12-08 | 2021-03-19 | 平安科技(深圳)有限公司 | 智能图像识别方法、装置、计算机设备及存储介质 |
WO2022121218A1 (zh) * | 2020-12-08 | 2022-06-16 | 平安科技(深圳)有限公司 | 智能图像识别方法、装置、计算机设备及存储介质 |
CN115223293A (zh) * | 2022-07-14 | 2022-10-21 | 深圳诺博医疗科技有限公司 | 用于耗材柜的取用验证方法、装置、系统及设备 |
CN115223293B (zh) * | 2022-07-14 | 2023-06-02 | 深圳诺博医疗科技有限公司 | 用于耗材柜的取用验证方法、装置、系统及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2021159802A1 (zh) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106529380B (zh) | 图像的识别方法及装置 | |
CN112529004A (zh) | 智能图像识别方法、装置、计算机设备及存储介质 | |
US10803338B2 (en) | Method and device for recognizing the character area in a image | |
CN112035821A (zh) | 图形验证码识别方法、装置、计算机设备及存储介质 | |
CN110084135B (zh) | 人脸识别方法、装置、计算机设备及存储介质 | |
CN108876871B (zh) | 基于圆拟合的图像处理方法、装置与计算机可读存储介质 | |
CN107292307B (zh) | 一种倒置汉字验证码自动识别方法及系统 | |
CN110866529A (zh) | 字符识别方法、装置、电子设备及存储介质 | |
CN108255555A (zh) | 一种系统语言切换方法及终端设备 | |
CN113313680B (zh) | 一种结直肠癌病理图像预后辅助预测方法及系统 | |
CN112651953A (zh) | 图片相似度计算方法、装置、计算机设备及存储介质 | |
CN113987429A (zh) | 基于水印嵌入的神经网络模型的版权验证方法 | |
CN111191651A (zh) | 单证图片识别方法、装置、计算机设备及存储介质 | |
CN111027545A (zh) | 卡证图片标志检测方法、装置、计算机设备及存储介质 | |
CN111507957A (zh) | 身份证图片转换方法、装置、计算机设备及存储介质 | |
CN108268868B (zh) | 身份证图像的倾斜值获取方法及装置、终端、存储介质 | |
CN111489347B (zh) | 营业执照图片质量检测方法、装置、计算机设备及存储介质 | |
CN113269752A (zh) | 一种图像检测方法、装置终端设备及存储介质 | |
CN109145879B (zh) | 一种打印字体识别的方法、设备及存储介质 | |
CN111274145A (zh) | 关系结构图生成方法、装置、计算机设备及存储介质 | |
CN113033562A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
JP6546385B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
CN113409187B (zh) | 漫画风格图像的转换方法、装置、计算机设备及存储介质 | |
CN111626313A (zh) | 一种特征提取模型训练方法、图像处理方法及装置 | |
CN110751158B (zh) | 一种治疗床显示器中的数字识别方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |