CN107967475A - 一种基于窗口滑动和卷积神经网络的验证码识别方法 - Google Patents
一种基于窗口滑动和卷积神经网络的验证码识别方法 Download PDFInfo
- Publication number
- CN107967475A CN107967475A CN201711138425.9A CN201711138425A CN107967475A CN 107967475 A CN107967475 A CN 107967475A CN 201711138425 A CN201711138425 A CN 201711138425A CN 107967475 A CN107967475 A CN 107967475A
- Authority
- CN
- China
- Prior art keywords
- character
- neural networks
- convolutional neural
- monocase
- window sliding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明针对传统的英文字母+数字+汉字验证码图片,提供一种基于窗口滑动和卷积神经网络的验证码识别方法。首先收集使用少量验证码图片,降噪后抠验证码需要识别的字符集,将每个字符集进行旋转、扭曲,增加背景噪音,然后针对这些字符集利用卷积神经网络,每个字符训练得到一个单字符分类器。最后对需要识别的验证码图片,预处理后进行连通域分割,针对每个连通域,进行窗口滑动,利用之前训练的单字符分类器进行分类,得到识别最终结果。该方法能有效解决因为验证码重叠及字符随机抖动过大难以切割的问题。而且采取少量验证码图片后抠图,自主生成相关训练集的方法,大大降低了采集和标注数据的成本。
Description
技术领域
本发明涉及计算机视觉、图像处理研究领域,特别涉及一种基于窗口滑动和卷积神经网络的验证码识别方法。
背景技术
验证码,通常是指将一串随机产生的数字或符号,生成一幅图片,图片里加上一些干扰,例如随机画数条直线,画一些点(防止OCR),由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。一般注册用户ID的地方以及各大论坛都要输入验证码。
之所以设置验证码,主要是为了自动区分当前用户是计算机还是人,从而防止恶意破解密码、刷票、论坛灌水等,也能够有效防止某个黑客对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试。
虽然设置验证码可以提高系统的安全性,但是针对实际生产系统中的软件,由于需要进行自动化测试或者其他需要,如果每一次测试都人工输入验证码,将大大降低测试的效率,不能满足实际的需要。
传统的验证码自动识别方法主要包括图片降噪预处理、切割、规范化、识别四个步骤,其中难点在于难以有效切割验证码图片,进而导致后续识别失败,为此,研究一种高效准确的验证码识别方法具有重要的实用价值。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于窗口滑动和卷积神经网络的验证码识别方法,该方法能有效解决因为验证码重叠及字符随机抖动过大难以切割的问题,具有人工成本低、识别效果好、时间复杂度低的优点。
本发明的目的通过以下的技术方案实现:一种基于窗口滑动和卷积神经网络的验证码识别方法,包括步骤:
S1:收集需要破解的验证码数据样本,对每张样本图片进行二值化和预处理;
S2:从预处理后的图片中抠出字符,得到相应的字符集;针对字符集中的每个字符,进行不同参数的形状变形,以及添加不同的背景噪声,进而扩充得到该字符对应的训练数据集;
S3:将每个字符对应的训练数据集分别进行卷积神经网络训练,每个字符训练得到一个单字符分类器;
S4:对待识别的验证码图片先进行二值化和预处理,然后进行连通域分割,针对每个连通域,进行窗口滑动,利用S3训练的所有单字符分类器进行分类,取单字符分类器输出概率最大的字符作为最终识别结果。
优选的,所述步骤S1中,采用ostu二值化算法实现二值化,采用基于数学形态学腐蚀膨胀的开操作的方法对验证码图片进行降噪处理。达到去除干扰性、干扰点、去除小于一定面积的干扰区域的效果。
优选的,所述步骤S2中,扩充得到该字符对应的训练数据集,包括但不限于加噪点、线条,对字符进行平移、扩放、缩放、旋转等操作。
优选的,所述步骤S3中,进行卷积神经网络训练的步骤是:
利用每个字符对应的训练数据集,搭建基于LeNet结构的X个卷积层、Y个全连接层的深度学习神经网络模型,采用自适应估计adam算法作为优化算法,模型输出的激活函数为sigmoid,使用交叉熵cross_entropy作为代价函数,进行网络模型的训练,确保单字符分类器准确率达到预设值。
优选的,所述步骤S4中,针对预处理后的待识别的验证码图片,具体执行下述步骤:
(4-1)先对图片进行二值化和预处理,然后基于连通域算法得到k个连通域,过滤连通域内面积小于预设值的噪音区域;
(4-2)判断k是否等于需要识别的字符个数,如果是则执行步骤(4-3),否则执行步骤(4-4);
(4-3)直接利用S3训练的单字符分类器(cnn)模型,分别对每个连通域规范化大小后进行分类识别,取字符分类器输出概率最大的字符作为最终识别结果;
(4-4)对每个连通域进行窗口滑动,并调用单字符分类器识别每个窗口的结果,对概率值结果矩阵使用贪心算法得到最终识别结果。
更进一步的,步骤(4-1)中的连通域算法采用seed-filling或two-pass连通区域检测算法。
更进一步的,步骤(4-3)中,对每个连通域规范化大小的步骤是:
(4-3-1)预设每个单字符分类器输入图片的规格,设为H×I;
(4-3-2)把每个连通域用与图像的边平行的最小矩形框切割出来,得到连通块;
(4-3-3)按长边缩放成H个像素点大小并等比例缩放短边;
(4-3-4)连通块按H×I居中摆放并填补空白区域。
更进一步的,步骤(4-4)中,设定单字符分类器个数为N,对于每一个连通块内部,滑动窗口,每移动1个像素位,运行N个单字符分类器得到N个结果;所有连通域内部滑动窗口的结果拼接起来,得到一个N*M的概率值结果矩阵A,其中M为所有连通域的滑动窗口数总和;对概率值结果矩阵A使用贪心算法,具体过程如下:
(4-4-1)对A的每一列求最大值,并映射回该最大值所归属的字符,则得到M个预测字符的预测序列P,及其对应的概率序列Q;
(4-4-2)建立候选预测序列P’和Q’,其内容为P中所有不连续出现的字符,具体的,如果P中某两个相邻字符是相同的,且他们两是同属一个连通域,则删除第二个字符,Q’中保留概率最大值,最终,得到P’将满足上述描述的字符不连续出现的条件;
(4-4-3)使用贪心算法,按Q’的概率值大到小选择所需预测的P’中的字符,不断选择直到满足所需预测的目标数为止,得到候选结果后,按P’中的下标作为排序,得到模型最终输出结果。
本发明与现有技术相比,具有如下优点和有益效果:
针对传统的英文字母+数字+汉字的验证码图片,本发明提出一种基于窗口滑动和深度学习卷积神经网络的验证码识别方法,该方法可以在少量数据集上通过不同参数的形状变形,以及添加不同的背景噪声自动生成相关样本,建立每个字符对应的训练数据集,不需要太多的标注数据集,人工成本低。另外,通过窗口滑动进行结果统计分析得到最终结果,识别效果好。采用了基于连通域切割的方法,减少了窗口滑动范围,有效降低了时间复杂度。
附图说明
图1是本发明方法的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
参见图1,本实施例一种基于窗口滑动和卷积神经网络的验证码识别方法的步骤是:
S1:收集需要破解的验证码数据样本,对每张样本图片进行二值化和预处理。
二值化可采用传统的ostu二值化算法,otsu算法是日本学者Otsu于1979年提出一种对图像进行二值化处理的高效算法。首先算法将自动选择合适的阈值;然后基于该阈值对图像上所有像素进行二值化处理。自动选择合适的阈值的过程,是枚举所有可能的阈值,对每一种阈值计算二值化后的黑白图计算类间方差。类间方差g=w0*w1*(u0-u1)*(u0-u1),其中值为0的类别的平均灰度为u0,占图像比例为w0,值为1的类别的平均灰度为u1,占图像比例为w1。枚举结束后,选择最大类间方差时的阈值作为最终阈值。
预处理可采用基于数学形态学腐蚀膨胀的开操作的方法,本实施例具体是对图像先进行腐蚀操作,再进行膨胀操作。腐蚀操作是使用基础的5个像素点的十字结构S,逐像素扫描全图像,若某个像素块A跟S的交集完全属于A,那么该点保留,否则去除。膨胀操作,与腐蚀操作相反的,扫描全图像上每一个像素,对每一个像素进行结构S的扩展,即原图中的1个像素点扩展为结构S中的5个像素点。
当然,在实际应用中,也可采用其他的二值化以及预处理方法,目的是准确提取每个字符,以建立后续的训练数据集。
S2:从预处理后的图片中抠出字符,这里可以是人工手动完成,也可以是采用现有算法准确提取出,进而得到相应的字符集。
针对字符集中的每个字符,可以采用加噪点、线条,对字符进行平移、扩放、缩放、旋转等操作,来扩充得到该字符对应的训练数据集。
S3:利用每个字符对应的训练数据集,搭建基于LeNet结构的X个卷积层、Y个全连接层的深度学习神经网络模型,采用自适应估计adam算法作为优化算法,模型输出的激活函数为sigmoid,使用交叉熵cross_entropy作为代价函数,进行网络模型的训练,确保单字符分类器准确率达到预设值,这样每个字符训练得到一个单字符分类器。
S4:在对待识别的验证码图片进行处理时,执行下述步骤:
(4-1)先对图片进行二值化和预处理,然后采用seed-filling算法进行连通域检测,该算法的原理是:设置所有点为未检测点,然后开始枚举图像中所有尚未检测的点,以当前枚举的点开始第k个连通域的检测,以点为seed节点向上下左右四个方向递归扩展该节点所在的连通域,扩展的点标注为已检测。等所有点都标记为已检测,则算法结束。
得到所有连通域后,再把包含像素点数少于一定阈值的连通域(认为是噪声)删除。
在实际应用中也可采用two-pass算法进行连通区域检测。这里不再详述。
(4-2)判断k是否等于需要识别的字符个数,如果是则执行步骤(4-3),否则执行步骤(4-4)。
(4-3)由于需要识别的字符个数等于检测的连通区域个数,因此无需窗口滑动,直接对每个连通区域进行字符检测即可。
单字符分类器输入,都是规定好的,例如是48×48。在将连通区域进行识别前,先对其进行规范化大小,步骤是:1、把连通块用与图像的边平行的最小矩形框切割出来,2、按长边缩放成48个像素点大小并等比例缩放短边,3、连通块按48×48居中摆放并填补空白区域。
然后将规格化大小后的连通块输入到各个单字符分类器中,取其中输出概率最大的字符作为最终识别结果。
(4-4)由于需要识别的字符个数不等于检测的连通区域个数,说明出现了字符粘连等情况,一个连通区域内或有多个字符,为了准确识别,本实施例提供进行窗口滑动,在窗口滑动的同时调用单字符分类器识别每个窗口的结果。
设定单字符分类器个数为N,对于每一个连通块内部,滑动窗口,每移动1个像素位,运行N个单字符分类器得到N个结果;所有连通域内部滑动窗口的结果拼接起来,得到一个N*M的概率值结果矩阵A,其中M为所有连通域的滑动窗口数总和。
对概率值结果矩阵A使用贪心算法,具体过程如下:
(4-4-1)对A的每一列求最大值,并映射回该最大值所归属的字符,则得到M个预测字符的预测序列P,及其对应的概率序列Q;
(4-4-2)建立候选预测序列P’和Q’,其内容为P中所有不连续出现的字符,具体的,如果P中某两个相邻字符是相同的,且他们两是同属一个连通域,则删除第二个字符,Q’中保留概率最大值,最终,得到P’将满足上述描述的字符不连续出现的条件;
(4-4-3)使用贪心算法,按Q’的概率值大到小选择所需预测的P’中的字符,不断选择直到满足所需预测的目标数为止,得到候选结果后,按P’中的下标作为排序,得到模型最终输出结果。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (8)
1.一种基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,包括步骤:
S1:收集需要破解的验证码数据样本,对每张样本图片进行二值化和预处理;
S2:从预处理后的图片中抠出字符,得到相应的字符集;针对字符集中的每个字符,进行不同参数的形状变形,以及添加不同的背景噪声,进而扩充得到该字符对应的训练数据集;
S3:将每个字符对应的训练数据集分别进行卷积神经网络训练,每个字符训练得到一个单字符分类器;
S4:对待识别的验证码图片先进行二值化和预处理,然后进行连通域分割,针对每个连通域,进行窗口滑动,利用S3训练的所有单字符分类器进行分类,取单字符分类器输出概率最大的字符作为最终识别结果。
2.根据权利要求1所述的基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,所述步骤S1中,采用ostu二值化算法实现二值化,采用基于数学形态学腐蚀膨胀的开操作的方法对验证码图片进行降噪处理。
3.根据权利要求1所述的基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,所述步骤S2中,扩充得到该字符对应的训练数据集,包括但不限于加噪点、线条,对字符进行平移、扩放、缩放、旋转操作。
4.根据权利要求1所述的基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,所述步骤S3中,进行卷积神经网络训练的步骤是:
利用每个字符对应的训练数据集,搭建基于LeNet结构的X个卷积层、Y个全连接层的深度学习神经网络模型,采用自适应估计adam算法作为优化算法,模型输出的激活函数为sigmoid,使用交叉熵cross_entropy作为代价函数,进行网络模型的训练,确保单字符分类器准确率达到预设值。
5.根据权利要求4所述的基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,所述步骤S4中,针对预处理后的待识别的验证码图片,具体执行下述步骤:
(4-1)先对图片进行二值化和预处理,然后基于连通域算法得到k个连通域,过滤连通域内面积小于预设值的噪音区域;
(4-2)判断k是否等于需要识别的字符个数,如果是则执行步骤(4-3),否则执行步骤(4-4);
(4-3)直接利用S3训练的单字符分类器(cnn)模型,分别对每个连通域规范化大小后进行分类识别,取字符分类器输出概率最大的字符作为最终识别结果;
(4-4)对每个连通域进行窗口滑动,并调用单字符分类器识别每个窗口的结果,对概率值结果矩阵使用贪心算法得到最终识别结果。
6.根据权利要求5所述的基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,步骤(4-1)中的连通域算法采用seed-filling或two-pass连通区域检测算法。
7.根据权利要求5所述的基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,步骤(4-3)中,对每个连通域规范化大小的步骤是:
(4-3-1)预设每个单字符分类器输入图片的规格,设为H×I;
(4-3-2)把每个连通域用与图像的边平行的最小矩形框切割出来,得到连通块;
(4-3-3)按长边缩放成H个像素点大小并等比例缩放短边;
(4-3-4)连通块按H×I居中摆放并填补空白区域。
8.根据权利要求5所述的基于窗口滑动和卷积神经网络的验证码识别方法,其特征在于,步骤(4-4)中,设定单字符分类器个数为N,对于每一个连通块内部,滑动窗口,每移动1个像素位,运行N个单字符分类器得到N个结果;所有连通域内部滑动窗口的结果拼接起来,得到一个N*M的概率值结果矩阵A,其中M为所有连通域的滑动窗口数总和;对概率值结果矩阵A使用贪心算法,具体过程如下:
(4-4-1)对A的每一列求最大值,并映射回该最大值所归属的字符,则得到M个预测字符的预测序列P,及其对应的概率序列Q;
(4-4-2)建立候选预测序列P’和Q’,其内容为P中所有不连续出现的字符,具体的,如果P中某两个相邻字符是相同的,且他们两是同属一个连通域,则删除第二个字符,Q’中保留概率最大值,最终,得到P’将满足上述描述的字符不连续出现的条件;
(4-4-3)使用贪心算法,按Q’的概率值大到小选择所需预测的P’中的字符,不断选择直到满足所需预测的目标数为止,得到候选结果后,按P’中的下标作为排序,得到模型最终输出结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711138425.9A CN107967475B (zh) | 2017-11-16 | 2017-11-16 | 一种基于窗口滑动和卷积神经网络的验证码识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711138425.9A CN107967475B (zh) | 2017-11-16 | 2017-11-16 | 一种基于窗口滑动和卷积神经网络的验证码识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107967475A true CN107967475A (zh) | 2018-04-27 |
CN107967475B CN107967475B (zh) | 2020-04-14 |
Family
ID=62001140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711138425.9A Active CN107967475B (zh) | 2017-11-16 | 2017-11-16 | 一种基于窗口滑动和卷积神经网络的验证码识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107967475B (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647683A (zh) * | 2018-04-28 | 2018-10-12 | 浙江大学 | 一种基于频域加噪的字符对抗验证码生成方法和系统 |
CN108763915A (zh) * | 2018-05-18 | 2018-11-06 | 百度在线网络技术(北京)有限公司 | 建立验证码生成模型以及生成验证码的方法、装置 |
CN108875745A (zh) * | 2018-08-09 | 2018-11-23 | 同程网络科技股份有限公司 | 组合验证码的分割识别方法及其系统 |
CN108932533A (zh) * | 2018-07-12 | 2018-12-04 | 北京木瓜移动科技股份有限公司 | 识别模型构建方法及装置、字符识别方法及装置 |
CN109086772A (zh) * | 2018-08-16 | 2018-12-25 | 成都市映潮科技股份有限公司 | 一种扭曲粘连字符图片验证码的识别方法及系统 |
CN109101810A (zh) * | 2018-08-14 | 2018-12-28 | 电子科技大学 | 一种基于ocr技术的文字验证码识别方法 |
CN109145922A (zh) * | 2018-09-10 | 2019-01-04 | 成都品果科技有限公司 | 一种自动抠图系统 |
CN109189683A (zh) * | 2018-08-28 | 2019-01-11 | 中金金融认证中心有限公司 | 一种用于app测试中验证码自动输入的方法及系统 |
CN109598270A (zh) * | 2018-12-04 | 2019-04-09 | 龙马智芯(珠海横琴)科技有限公司 | 扭曲文字的识别方法及装置、存储介质及处理器 |
CN109933975A (zh) * | 2019-03-20 | 2019-06-25 | 山东浪潮云信息技术有限公司 | 一种基于深度学习的验证码识别方法及系统 |
CN110008680A (zh) * | 2019-04-03 | 2019-07-12 | 华南师范大学 | 基于对抗样本的验证码生成系统及方法 |
CN110348450A (zh) * | 2019-07-15 | 2019-10-18 | 中国工商银行股份有限公司 | 用于图像验证码的安全评估方法、装置和计算机系统 |
CN110490056A (zh) * | 2019-07-08 | 2019-11-22 | 北京三快在线科技有限公司 | 对包含算式的图像进行处理的方法和装置 |
CN110516592A (zh) * | 2019-08-26 | 2019-11-29 | 广东世纪晟科技有限公司 | 一种基于手写数字字符的识别方法 |
CN110532762A (zh) * | 2019-09-02 | 2019-12-03 | 四川长虹电器股份有限公司 | 一种获取验证码图片进行登录爆破测试的方法 |
CN110555462A (zh) * | 2019-08-02 | 2019-12-10 | 深圳索信达数据技术有限公司 | 基于卷积神经网络的无固定多字符验证码识别方法 |
CN110782423A (zh) * | 2019-10-29 | 2020-02-11 | 华侨大学 | 一种实木锯材线扫相机图像自动拼接及抠图方法 |
CN110796146A (zh) * | 2019-10-11 | 2020-02-14 | 上海上湖信息技术有限公司 | 一种银行卡卡号识别方法、模型训练方法及装置 |
CN111259366A (zh) * | 2020-01-22 | 2020-06-09 | 支付宝(杭州)信息技术有限公司 | 一种基于自监督学习的验证码识别器的训练方法和装置 |
CN111352827A (zh) * | 2018-12-24 | 2020-06-30 | 中移信息技术有限公司 | 一种自动化测试的方法及装置 |
CN111401139A (zh) * | 2020-02-25 | 2020-07-10 | 云南昆钢电子信息科技有限公司 | 基于字符图像智能识别获得矿山井下设备位置的方法 |
CN111461979A (zh) * | 2020-03-30 | 2020-07-28 | 招商局金融科技有限公司 | 验证码图像去噪识别方法、电子装置及存储介质 |
CN111507353A (zh) * | 2020-04-17 | 2020-08-07 | 新分享科技服务(深圳)有限公司 | 一种基于文字识别的中文字段检测方法及系统 |
CN112686266A (zh) * | 2021-01-11 | 2021-04-20 | 安徽希施玛数据科技有限公司 | 一种验证码识别方法及装置 |
CN116758562A (zh) * | 2023-08-22 | 2023-09-15 | 杭州实在智能科技有限公司 | 通用文本验证码识别方法及系统 |
CN117725943A (zh) * | 2024-02-06 | 2024-03-19 | 浙江码尚科技股份有限公司 | 基于数图处理的点阵码识别方法及系统 |
CN117912037A (zh) * | 2024-03-20 | 2024-04-19 | 杭州汇萃智能科技有限公司 | 一种ocr模型后处理方法、系统及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080010278A1 (en) * | 2006-07-06 | 2008-01-10 | Lukas Kencl | Substring detection system and method |
EP2166488A2 (en) * | 2008-09-18 | 2010-03-24 | Xerox Corporation | Handwritten word spotter using synthesized typed queries |
CN105184312A (zh) * | 2015-08-24 | 2015-12-23 | 中国科学院自动化研究所 | 一种基于深度学习的文字检测方法及装置 |
CN106529525A (zh) * | 2016-10-14 | 2017-03-22 | 上海新同惠自动化系统有限公司 | 一种中日文手写字符的识别方法 |
CN107067006A (zh) * | 2017-04-20 | 2017-08-18 | 金电联行(北京)信息技术有限公司 | 一种服务于数据采集的验证码识别方法及系统 |
CN107292307A (zh) * | 2017-07-21 | 2017-10-24 | 华中科技大学 | 一种倒置汉字验证码自动识别方法及系统 |
-
2017
- 2017-11-16 CN CN201711138425.9A patent/CN107967475B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080010278A1 (en) * | 2006-07-06 | 2008-01-10 | Lukas Kencl | Substring detection system and method |
EP2166488A2 (en) * | 2008-09-18 | 2010-03-24 | Xerox Corporation | Handwritten word spotter using synthesized typed queries |
CN105184312A (zh) * | 2015-08-24 | 2015-12-23 | 中国科学院自动化研究所 | 一种基于深度学习的文字检测方法及装置 |
CN106529525A (zh) * | 2016-10-14 | 2017-03-22 | 上海新同惠自动化系统有限公司 | 一种中日文手写字符的识别方法 |
CN107067006A (zh) * | 2017-04-20 | 2017-08-18 | 金电联行(北京)信息技术有限公司 | 一种服务于数据采集的验证码识别方法及系统 |
CN107292307A (zh) * | 2017-07-21 | 2017-10-24 | 华中科技大学 | 一种倒置汉字验证码自动识别方法及系统 |
Non-Patent Citations (4)
Title |
---|
AYAN KUMAR BHUNIA 等: "Text recognition in scene image and video frame using Color Channel selection", 《MULTIMEDIA TOOLS AND APPLICATIONS》 * |
YI-CHAO WU 等: "Improving handwritten Chinese text recognition using neural network language models and convolutional neural network shape models", 《PATTERN RECOGNITION》 * |
YOJIRO TONOUCHI 等: "A Hybrid Approach to Detect Texts in Natural Scenes by Integration of a Connected-Component Method and a Sliding-Window Method", 《COMPUTER VISION-ACCV 2014 WORKSHOPS》 * |
李翌昕 等: "文本检测算法的发展与挑战", 《信号处理》 * |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647683A (zh) * | 2018-04-28 | 2018-10-12 | 浙江大学 | 一种基于频域加噪的字符对抗验证码生成方法和系统 |
CN108763915A (zh) * | 2018-05-18 | 2018-11-06 | 百度在线网络技术(北京)有限公司 | 建立验证码生成模型以及生成验证码的方法、装置 |
CN108932533A (zh) * | 2018-07-12 | 2018-12-04 | 北京木瓜移动科技股份有限公司 | 识别模型构建方法及装置、字符识别方法及装置 |
CN108875745A (zh) * | 2018-08-09 | 2018-11-23 | 同程网络科技股份有限公司 | 组合验证码的分割识别方法及其系统 |
CN108875745B (zh) * | 2018-08-09 | 2021-11-19 | 同程网络科技股份有限公司 | 组合验证码的分割识别方法及其系统 |
CN109101810A (zh) * | 2018-08-14 | 2018-12-28 | 电子科技大学 | 一种基于ocr技术的文字验证码识别方法 |
CN109101810B (zh) * | 2018-08-14 | 2021-07-06 | 电子科技大学 | 一种基于ocr技术的文字验证码识别方法 |
CN109086772A (zh) * | 2018-08-16 | 2018-12-25 | 成都市映潮科技股份有限公司 | 一种扭曲粘连字符图片验证码的识别方法及系统 |
CN109189683A (zh) * | 2018-08-28 | 2019-01-11 | 中金金融认证中心有限公司 | 一种用于app测试中验证码自动输入的方法及系统 |
CN109145922A (zh) * | 2018-09-10 | 2019-01-04 | 成都品果科技有限公司 | 一种自动抠图系统 |
CN109145922B (zh) * | 2018-09-10 | 2022-03-29 | 成都品果科技有限公司 | 一种自动抠图系统 |
CN109598270B (zh) * | 2018-12-04 | 2020-05-05 | 龙马智芯(珠海横琴)科技有限公司 | 扭曲文字的识别方法及装置、存储介质及处理器 |
CN109598270A (zh) * | 2018-12-04 | 2019-04-09 | 龙马智芯(珠海横琴)科技有限公司 | 扭曲文字的识别方法及装置、存储介质及处理器 |
CN111352827A (zh) * | 2018-12-24 | 2020-06-30 | 中移信息技术有限公司 | 一种自动化测试的方法及装置 |
CN109933975A (zh) * | 2019-03-20 | 2019-06-25 | 山东浪潮云信息技术有限公司 | 一种基于深度学习的验证码识别方法及系统 |
CN110008680A (zh) * | 2019-04-03 | 2019-07-12 | 华南师范大学 | 基于对抗样本的验证码生成系统及方法 |
CN110490056A (zh) * | 2019-07-08 | 2019-11-22 | 北京三快在线科技有限公司 | 对包含算式的图像进行处理的方法和装置 |
CN110348450A (zh) * | 2019-07-15 | 2019-10-18 | 中国工商银行股份有限公司 | 用于图像验证码的安全评估方法、装置和计算机系统 |
CN110555462A (zh) * | 2019-08-02 | 2019-12-10 | 深圳索信达数据技术有限公司 | 基于卷积神经网络的无固定多字符验证码识别方法 |
CN110516592A (zh) * | 2019-08-26 | 2019-11-29 | 广东世纪晟科技有限公司 | 一种基于手写数字字符的识别方法 |
CN110532762A (zh) * | 2019-09-02 | 2019-12-03 | 四川长虹电器股份有限公司 | 一种获取验证码图片进行登录爆破测试的方法 |
CN110796146A (zh) * | 2019-10-11 | 2020-02-14 | 上海上湖信息技术有限公司 | 一种银行卡卡号识别方法、模型训练方法及装置 |
CN110782423A (zh) * | 2019-10-29 | 2020-02-11 | 华侨大学 | 一种实木锯材线扫相机图像自动拼接及抠图方法 |
CN110782423B (zh) * | 2019-10-29 | 2023-03-24 | 华侨大学 | 一种实木锯材线扫相机图像自动拼接及抠图方法 |
CN111259366A (zh) * | 2020-01-22 | 2020-06-09 | 支付宝(杭州)信息技术有限公司 | 一种基于自监督学习的验证码识别器的训练方法和装置 |
CN111401139A (zh) * | 2020-02-25 | 2020-07-10 | 云南昆钢电子信息科技有限公司 | 基于字符图像智能识别获得矿山井下设备位置的方法 |
CN111401139B (zh) * | 2020-02-25 | 2024-03-29 | 云南昆钢电子信息科技有限公司 | 基于字符图像智能识别获得矿山井下设备位置的方法 |
CN111461979A (zh) * | 2020-03-30 | 2020-07-28 | 招商局金融科技有限公司 | 验证码图像去噪识别方法、电子装置及存储介质 |
CN111461979B (zh) * | 2020-03-30 | 2023-04-18 | 招商局金融科技有限公司 | 验证码图像去噪识别方法、电子装置及存储介质 |
CN111507353A (zh) * | 2020-04-17 | 2020-08-07 | 新分享科技服务(深圳)有限公司 | 一种基于文字识别的中文字段检测方法及系统 |
CN111507353B (zh) * | 2020-04-17 | 2023-10-03 | 新分享科技服务(深圳)有限公司 | 一种基于文字识别的中文字段检测方法及系统 |
CN112686266A (zh) * | 2021-01-11 | 2021-04-20 | 安徽希施玛数据科技有限公司 | 一种验证码识别方法及装置 |
CN116758562B (zh) * | 2023-08-22 | 2023-12-08 | 杭州实在智能科技有限公司 | 通用文本验证码识别方法及系统 |
CN116758562A (zh) * | 2023-08-22 | 2023-09-15 | 杭州实在智能科技有限公司 | 通用文本验证码识别方法及系统 |
CN117725943A (zh) * | 2024-02-06 | 2024-03-19 | 浙江码尚科技股份有限公司 | 基于数图处理的点阵码识别方法及系统 |
CN117725943B (zh) * | 2024-02-06 | 2024-06-04 | 浙江码尚科技股份有限公司 | 基于数图处理的点阵码识别方法及系统 |
CN117912037A (zh) * | 2024-03-20 | 2024-04-19 | 杭州汇萃智能科技有限公司 | 一种ocr模型后处理方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107967475B (zh) | 2020-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107967475A (zh) | 一种基于窗口滑动和卷积神经网络的验证码识别方法 | |
CN108446700B (zh) | 一种基于对抗攻击的车牌攻击生成方法 | |
CN109410184B (zh) | 基于稠密对抗网络半监督学习的直播色情图像检测方法 | |
CN107808358B (zh) | 图像水印自动检测方法 | |
CN111368764B (zh) | 一种基于计算机视觉与深度学习算法的虚假视频检测方法 | |
CN107889111A (zh) | 基于深层类神经网络的骚扰电话识别方法和装置 | |
CN110414367B (zh) | 一种基于gan和ssn的时序行为检测方法 | |
CN109359550B (zh) | 基于深度学习技术的满文文档印章提取与去除方法 | |
CN113011357A (zh) | 基于时空融合的深度伪造人脸视频定位方法 | |
CN106295501A (zh) | 基于唇部运动的深度学习身份识别方法 | |
Kaur et al. | Review of various steganalysis techniques | |
CN113033567B (zh) | 一种融合分割网络和生成网络的甲骨拓片图像字符训练方法 | |
CN109003275A (zh) | 焊缝缺陷图像的分割方法 | |
CN105404885A (zh) | 一种二维字符图形验证码复杂背景噪音干扰去除方法 | |
CN106650696A (zh) | 一种基于奇异值分解的手写电气元件符号识别方法 | |
CN109389116A (zh) | 一种字符检测方法及装置 | |
CN103325123A (zh) | 一种基于自适应神经模糊推理系统的图像边缘检测方法 | |
Shi et al. | Image enhancement for degraded binary document images | |
CN111461135B (zh) | 利用卷积神经网络集成的数字图像局部滤波取证方法 | |
CN110349119B (zh) | 基于边缘检测神经网络的路面病害检测方法和装置 | |
CN109740569B (zh) | 基于编码器-解码器的手指静脉成像时残缺信息复原方法 | |
CN106530199B (zh) | 基于窗口式假设检验的多媒体综合隐写分析方法 | |
CN109409224A (zh) | 一种自然场景火焰检测的方法 | |
Kohmura et al. | Determining optimal filters for binarization of degraded characters in color using genetic algorithms | |
CN115424250A (zh) | 一种车牌识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |