CN110443249A - 基于投影方式的图片切割模型 - Google Patents
基于投影方式的图片切割模型 Download PDFInfo
- Publication number
- CN110443249A CN110443249A CN201910657151.7A CN201910657151A CN110443249A CN 110443249 A CN110443249 A CN 110443249A CN 201910657151 A CN201910657151 A CN 201910657151A CN 110443249 A CN110443249 A CN 110443249A
- Authority
- CN
- China
- Prior art keywords
- picture
- text
- carried out
- cutting
- axis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
Abstract
本发明提供一种基于投影方式的图片切割模型:包括以下步骤:1)、图片预处理,得到预处理成功后的图片;2)、确定预处理成功后的图片的坐标原点;3)、对预处理成功后的图片进行基于Y轴投影切割,得到Y轴投影切割后的图片;4)、对Y轴投影切割后的图片进行基于X轴投影切割,得到文字的有效区域图片;5)、根据文字的有效区域图片进行图片生成,得到文字图片;6)、识别文字图片中的文字。本发明可以将降噪处理后的图片进行切割分块,得到每个独立的文字模块,剔除图片中无效的干扰信息。提高图片文字识别的成功率,进而提升验证码点击破解成功率。
Description
技术领域
本发明涉及一种验证码破解的方法,具体涉及一种基于投影方式的图片切割模型。
背景技术
在现阶段的网络时代,数据的影响力已经越来越大,公司的核心竞争力更多的是数据的竞争力。如何获取大量的有效数据成为各大公司竞相追逐的目标,现有技术中,爬虫是采集数据的有效可靠的方式,但是为了保证公司的自身利益,都会设置验证码来进行反爬设置。图片文字验证码是常见的验证码形式,需要有精确的点击目标文字坐标方可完成验证。在使用爬虫采集数据的过程中往往都会遇到验证码的阻碍,从而大大降低了数据爬取的效率,甚至导致不可爬取。
在图片文字点击验证码破解过程中,需要确定到一张图片中的某个特定的文字坐标,然后在点击方可完成验证码验证过程。如果点击坐标错误的话,那么图片都会重新刷新,点击错误次数多了的话,甚至会出现封IP的情况,这就要求点击的坐标需要尽量准确。这就要求图片的切割算法够准确,将图片的有效文字信息摘选出来,过滤掉图片中的无效信息(图片中的留白部分)。现阶段对于多行多列的文字图片未能形成有效的切割,照成识别率成功率很低。
验证码:验证码(CAPTCHA)是“Completely Automated Public Turing test totell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。
CN109344838A-发票信息自动快速识别方法、系统以及装置”:“对二值化图像的符号外区域进行横向切割,将二值化图像向y轴投影,取投影宽度最大的一段确定为字符横向切割的长度,并按此长度将图像进行横向切割,去除符号外区域;对横向切割后的二值化图像进行纵向切割,将横向切割后的图像向x轴投影,利用数字之间的间隙,将每个字符进行纵向切割,因此最终分别将每个字符切割下来。”这就对图片存在一定的要求;如果图片中的文字是多行多列的并且行与行之间是连接的,则无法获取到对应的切割的长度。
“CN108171104A-一种文字检测方法及装置”中:对待检测图像中的候选文字像素点进行横向投影切割和纵向投影切割,将非文字行和非文字列置空,以去除其中的非文字区域,得到包括文字的多个矩形框,具体可以进行多次横向投影切割和纵向投影切割,以去除尽可能多的非文字区域。
因此,需要对现有技术进行改进。
发明内容
本发明要解决的技术问题是提供一种高效的基于投影方式的图片切割模型。
为解决上述技术问题,本发明提供一种基于投影方式的图片切割模型:包括以下步骤:
1)、图片预处理,得到预处理成功后的图片;
2)、确定预处理成功后的图片的坐标原点;
3)、对预处理成功后的图片进行基于Y轴投影切割,得到Y轴投影切割后的图片;
4)、对Y轴投影切割后的图片进行基于X轴投影切割,得到文字的有效区域图片;
5)、根据文字的有效区域图片进行图片生成,得到文字图片;
6)、识别文字图片中的文字。
作为对本发明基于投影方式的图片切割模型的改进:
步骤1)包括以下步骤:
1.1)、对原图进行灰度化处理,得到灰度化处理后的图片;
1.2)、对灰度化处理后的图片进行二值化处理,得到二值化处理后的图片;
1.3)、对二值化处理后的图片进行降噪,得到预处理成功后的图片;
作为对本发明基于投影方式的图片切割模型的进一步改进:
在步骤2)中:以预处理成功后的图片的左上角作为二维坐标的原点。
作为对本发明基于投影方式的图片切割模型的进一步改进:
步骤3)为:预处理成功后的图片根据该图片的宽和高循环遍历每个像素点,将其投影在Y轴上,从里面找出来像素为黑色的像素区域,形成一个或者多个连续的区域像素块,然后根据得到的区域像素块进行切割,得到Y轴投影切割后的图片。
作为对本发明基于投影方式的图片切割模型的进一步改进:
步骤4)为:Y轴投影切割后的图片根据该图片的宽和高循环遍历每个像素点,将其投影在X轴上,从里面找出来像素为黑色的像素区域,也就是文字的区域,形成一个或者多个连续的区域像素块,然后根据得到的区域像素块进行切割,得到文字的有效区域图片。
本发明基于投影方式的图片切割模型的技术优势为:
本发明可以将降噪处理后的图片进行切割分块,得到每个独立的文字模块,剔除图片中无效的干扰信息。提高图片文字识别的成功率,进而提升验证码点击破解成功率。本发明为图片文字点击验证码破解提供有效的文字切割算法和模型,可以进行验证码破解,从而为数据爬取提供便利。
CN109344838A-发票信息自动快速识别方法、系统以及装置:此专利是从Y轴切割之后得到投影宽度最大的一段距离作为图片切割时的长度,这就对图片存在一定的要求;如果图片中的文字是多行多列的并且行与行之间是连接的,则无法获取到对应的切割的长度。而本发明是根据图像在Y轴的投影的黑色像素点,遍历之后根据自设定的像素之间的间隔阈值确定切割时的位置,然后完成对应的切割。
CN108171104A-一种文字检测方法及装置:此专利提供的是按照投影方式将图片中的无效区域数据剔除,进而得出的是有效区域的文字;而本发明则是直接从图片中提取出有效区域的数据,然后完成切割使用的方式不同。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1为本发明基于投影方式的图片切割模型的流程示意图;
图2为实施例1中各个步骤处理所得的图片。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此。
实施例1、基于投影方式的图片切割模型,如图1-2所示,包括基于Y轴投影切割、基于X轴投影切割和图片生成等。
具体包括以下步骤:
1)、图片预处理,得到预处理成功后的图片;
二维坐标原点确定;将预处理成功后的图片的左上角作为二维坐标的原点。
1.1)、对原图进行灰度化处理,得到灰度化处理后的图片;
1.2)、对灰度化处理后的图片进行二值化处理,得到二值化处理后的图片;
1.3)、对二值化处理后的图片进行降噪,得到预处理成功后的图片(此时为白底黑字的图像);
2)、坐标原点确定:一般将预处理成功后的图片的左上角作为二维坐标的原点。即预处理成功后的图片的左上角的坐标为(0,0)。
3)、基于Y轴投影切割:预处理成功后的图片根据该图片的宽和高循环遍历每个像素点,将其投影在Y轴上,从里面找出来像素为黑色的像素区域,也就是文字的区域,形成一个或者多个连续的区域像素块,然后根据得到的区域像素块进行切割,得到预处理成功后的图片中所有在水平方向中的文字图片块,作为得到Y轴投影切割后的图片。
4)、基于X轴投影切割:将步骤3)得到的Y轴投影切割后的图片根据该图片的宽和高循环遍历每个像素点,将其投影在X轴上,从里面找出来像素为黑色的像素区域,也就是文字的区域,形成一个或者多个连续的区域像素块,然后根据得到的区域像素块进行切割,得到得到X轴投影切割后的图片文字的有效像素区域集合,作为文字的有效区域图片;
5)、图片生成:按照步骤4)得到的有效区域图片进行图片生成,使用工具类生成对应的图片文件保存下来即可,得到图片切割后所得的文字图片,即完成图片的切割。
6)、在图片切割后所得的文字图片之后,就可以使用图片识别工具进行对应的图片识别了。当然由于文字图片的变形程度不同在识别的准确率是存在差异化。可以使用人工智能加上机器学习,训练出大量的样本以提升识别的准确率。在正确识别出对应的文字之后,根据之前对应的切割图片的对应区域进行模拟浏览器点击操作即可完成验证码的操作。图片识别使用现有技术。
在本发明中:
预处理图片指的是:将原图经过灰度化,二值化和降噪处理之后的形成的白底黑字的图片。
投影文字:基于X轴和Y轴的二维坐标进行投影,也就是将图片的信息分别映射到X轴和Y轴上面,然后进行对应的操作。
图片切割所得的文字:图片划分成每个独立的单元且只保留有效信息,彼此之间互不影响。
最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。
Claims (5)
1.基于投影方式的图片切割模型,其特征在于:包括以下步骤:
1)、图片预处理,得到预处理成功后的图片;
2)、确定预处理成功后的图片的坐标原点;
3)、对预处理成功后的图片进行基于Y轴投影切割,得到Y轴投影切割后的图片;
4)、对Y轴投影切割后的图片进行基于X轴投影切割,得到文字的有效区域图片;
5)、根据文字的有效区域图片进行图片生成,得到文字图片;
6)、识别文字图片中的文字。
2.根据权利要求1所述的基于投影方式的图片切割模型,其特征在于:
步骤1)包括以下步骤:
1.1)、对原图进行灰度化处理,得到灰度化处理后的图片;
1.2)、对灰度化处理后的图片进行二值化处理,得到二值化处理后的图片;
1.3)、对二值化处理后的图片进行降噪,得到预处理成功后的图片。
3.根据权利要求2所述的基于投影方式的图片切割模型,其特征在于:
在步骤2)中:以预处理成功后的图片的左上角作为二维坐标的原点。
4.根据权利要求3所述的基于投影方式的图片切割模型,其特征在于:
步骤3)为:预处理成功后的图片根据该图片的宽和高循环遍历每个像素点,将其投影在Y轴上,从里面找出来像素为黑色的像素区域,形成一个或者多个连续的区域像素块,然后根据得到的区域像素块进行切割,得到Y轴投影切割后的图片。
5.根据权利要求4所述的基于投影方式的图片切割模型,其特征在于:
步骤4)为:Y轴投影切割后的图片根据该图片的宽和高循环遍历每个像素点,将其投影在X轴上,从里面找出来像素为黑色的像素区域,也就是文字的区域,形成一个或者多个连续的区域像素块,然后根据得到的区域像素块进行切割,得到文字的有效区域图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910657151.7A CN110443249A (zh) | 2019-07-19 | 2019-07-19 | 基于投影方式的图片切割模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910657151.7A CN110443249A (zh) | 2019-07-19 | 2019-07-19 | 基于投影方式的图片切割模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110443249A true CN110443249A (zh) | 2019-11-12 |
Family
ID=68430981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910657151.7A Pending CN110443249A (zh) | 2019-07-19 | 2019-07-19 | 基于投影方式的图片切割模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110443249A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650736A (zh) * | 2016-09-28 | 2017-05-10 | 浪潮软件集团有限公司 | 一种基于深度学习的汉字识别系统的实现方法 |
CN109409378A (zh) * | 2018-10-17 | 2019-03-01 | 北京信息科技大学 | 一种纳西东巴经书的数字化处理方法 |
-
2019
- 2019-07-19 CN CN201910657151.7A patent/CN110443249A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650736A (zh) * | 2016-09-28 | 2017-05-10 | 浪潮软件集团有限公司 | 一种基于深度学习的汉字识别系统的实现方法 |
CN109409378A (zh) * | 2018-10-17 | 2019-03-01 | 北京信息科技大学 | 一种纳西东巴经书的数字化处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107967475B (zh) | 一种基于窗口滑动和卷积神经网络的验证码识别方法 | |
US5764799A (en) | OCR method and apparatus using image equivalents | |
RU2001107822A (ru) | Распознавание знаков | |
CN105654072A (zh) | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 | |
JP2001092919A (ja) | 2次元バーコードのねじれ角決定法 | |
CN109934227A (zh) | 图像文字识别系统和方法 | |
JP2007048000A (ja) | 指紋画像認識システム、指紋画像認識方法、及びプログラム | |
CN107862327B (zh) | 一种基于多特征的安全缺陷识别系统和方法 | |
CN109948621B (zh) | 一种基于图片验证码的图像处理与字符分割方法 | |
CN104392229A (zh) | 基于笔画片段方向分布特征的笔迹识别方法 | |
CN106940804B (zh) | 建筑工程物料管理系统表单数据自动录入方法 | |
CN108171229A (zh) | 一种空心粘连验证码的识别方法及系统 | |
TWI423145B (zh) | 指紋圖像檢測方法 | |
RU2436156C1 (ru) | Способ разрешения противоречивых выходных данных из системы оптического распознавания символов (ocr), где выходные данные включают в себя более одной альтернативы распознавания изображения символа | |
CN114581932A (zh) | 一种图片表格线提取模型构建方法及图片表格提取方法 | |
JP3906197B2 (ja) | パターン識別方法及びパターン識別装置及びプログラム | |
CN108717544A (zh) | 一种基于智能图像分析的报纸样稿文字自动检测方法 | |
CN110443249A (zh) | 基于投影方式的图片切割模型 | |
KR102602167B1 (ko) | 딥러닝 기반의 mlcc 적층 얼라인먼트 검사 시스템 및 방법 | |
US6009194A (en) | Methods, systems and computer program products for analyzing information in forms using cell adjacency relationships | |
CN109002821A (zh) | 一种基于连通域和切线斜率的网银盾数字识别方法 | |
JP4867894B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
JP2613959B2 (ja) | 指紋紋様分類装置 | |
CN110532739B (zh) | 一种基于频繁模式挖掘的多线程程序抄袭检测方法 | |
Entacher et al. | Towards an automated generation of tree ring profiles from CT-images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191112 |