CN104200204A - 一种图片处理装置及方法 - Google Patents
一种图片处理装置及方法 Download PDFInfo
- Publication number
- CN104200204A CN104200204A CN201410443188.7A CN201410443188A CN104200204A CN 104200204 A CN104200204 A CN 104200204A CN 201410443188 A CN201410443188 A CN 201410443188A CN 104200204 A CN104200204 A CN 104200204A
- Authority
- CN
- China
- Prior art keywords
- array
- character
- matching rate
- partial content
- origin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明提供一种图片识别装置,包括图片预处理模块、字符模板管理模块、字符识别模块以及字符消除模块,图片预处理模块对输入的原始图片进行二值化处理;字符模板管理模块将各单个字符模板进行二值化处理;字符识别模块从字符模板管理模块中获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;字符消除模块,从数组A中消除已识别的部分内容。本发明还提供一种图片识别方法。本发明识别方法及装置对图片的识别正确率高,尤其是对字符粘连的图片,同时本发明计算量小,消耗处理性能少,处理速度快。
Description
【技术领域】
本发明涉及一种图片处理装置及方法。
【背景技术】
现有的图片识别技术主要采用先将图片进行切割,然后对切割后的图片进行识别的方法,其计算量大,需要消耗较大的处理性能。不仅如此,采用图片切割的方式进行图片识别,对于字符粘连的图片,切割不准确,识别准确率低,不适合在生产过程中应用。
公布号为CN103605957A,公布日为2014.2.26的发明专利《一种图片识别方法及装置》公开了一种图片识别方法,包括以下步骤:获取需要识别的图片;对所述图片进行整体轮廓识别,并生成轮廓识别信息;对所述图片进行色彩识别,并生成色彩识别信息;将所述轮廓识别信息和色彩识别信息与识别库中的识别信息比对,进行图片识别。该发明专利的识别方法就是一种采用整理识别,再色彩识别的方法,存在计算机处理量大,消耗较大处理性能的问题。
【发明内容】
本发明要解决的技术问题之一,在于提供一种图片处理装置,其可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题,同时还可以解决传统识别方法计算量大,需要消耗较大处理性能的问题。
本发明通过技术方案一解决上述技术问题之一:
技术方案一:
一种图片识别装置,包括:
图片预处理模块,对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;
字符模板管理模块,从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
字符识别模块,从字符模板管理模块中获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
字符消除模块,从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则字符识别模块继续识别,若是输出原始图片的总体识别结果。
进一步地,所述字符识别模块具体执行如下步骤:
步骤A:以数组A的左上角数字为原点,将该原点坐标定义为P0(0,0);
步骤B:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为本次识别内容的起始坐标P(X,Y),执行步骤C,如果没有扫描到字符点,表示对数组A识别结束,跳转字符消除模块的步骤F;
步骤C:从字符模板管理模块获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标P(X,Y),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标P(X,Y),当所有数组Bi均比对完成后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转字符消除模块处理,执行步骤D;
所述字符消除模块具体执行如下步骤:
步骤D:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新写入至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤E:将原点坐标更新为P0(X+D,M),跳转至字符识别模块,执行步骤B;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转至字符识别模块,执行步骤B;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤F;
步骤F:识别结束,输出原始图片的总体识别结果。
进一步地,为了更好地识别粘连字符图片,所述字符识别模块具体执行如下步骤:
步骤AA:以数组A的左上角数字为原点,将该原点坐标定义为Q0(0,0);
步骤BB:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为中心坐标Q(X,Y),以中心坐标Q(X,Y)为中心分别向上、向下、向左、向右偏移,生成四个坐标Q1(X1,Y1)、Q2(X2,Y2)、Q3(X3,Y3)、Q4(X4,Y4),将该四个坐标作为四个起始坐标,然后执行步骤CC,如果没有扫描到字符点,表示对数组A识别结束,跳转字符消除模块的步骤FF;
步骤CC:从字符模板管理模块获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标Q1(X1,Y1),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q1(X1,Y1),当所有数组Bi均与起始坐标Q1(X1,Y1)比对完成后,从数组A中选取以Q2(X2,Y2)为起始坐标的部分内容,同样地,所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q2(X2,Y2),以此类推,依次完成以Q3(X3,Y3)、Q4(X4,Y4)为起始坐标选取的部分与集合B中各数组Bi的比对;然后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转字符消除模块处理,执行步骤DD;
所述字符消除模块具体执行如下步骤:
步骤DD:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤EE:将原点坐标更新为P0(X+D,M),跳转至字符识别模块,执行步骤BB;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转至字符识别模块,执行步骤BB;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤FF;
步骤FF:识别结束,输出原始图片的总体识别结果。
进一步地,所述图片预处理模块中,对输入的原始图片进行二值化处理后,还进行除噪处理。
所述字符模板管理模块中,将各单个字符模板进行二值化处理后,还进行除噪处理。
本发明要解决的技术问题之二,在于提供一种图片处理装置,其可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题,同时还可以解决传统识别方法计算量大,需要消耗较大处理性能的问题。
本发明通过技术方案二解决上述技术问题之二:
技术方案二:
一种图片识别方法,包括如下步骤:
步骤10、对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;
步骤20、从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
步骤30、获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
步骤40、从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则跳转步骤30继续识别,若是,输出原始图片的总体识别结果。
进一步地,所述步骤30具体为:
步骤31:以数组A的左上角数字为原点,将该原点坐标定义为P0(0,0);
步骤32:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为本次识别内容的起始坐标P(X,Y),执行步骤33,如果没有扫描到字符点,表示对数组A识别结束,跳转步骤43;
步骤33:获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标P(X,Y),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标P(X,Y),当所有数组Bi均比对完成后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转步骤41;
所述步骤40具体为:
步骤41:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新写入至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤42:将原点坐标更新为P0(X+D,M),跳转执行步骤32;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转执行步骤32;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤F;
步骤43:识别结束,输出原始图片的总体识别结果。
进一步地,为了更好地识别粘连字符图片,所述步骤30具体为
步骤301:以数组A的左上角数字为原点,将该原点坐标定义为Q0(0,0);
步骤302:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为中心坐标Q(X,Y),以中心坐标Q(X,Y)为中心分别向上、向下、向左、向右偏移,生成四个坐标Q1(X1,Y1)、Q2(X2,Y2)、Q3(X3,Y3)、Q4(X4,Y4),将该四个坐标作为四个起始坐标,然后执行步骤303,如果没有扫描到字符点,表示对数组A识别结束,跳转执行步骤403;
步骤303:获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标Q1(X1,Y1),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q1(X1,Y1),当所有数组Bi均与起始坐标Q1(X1,Y1)比对完成后,从数组A中选取以Q2(X2,Y2)为起始坐标的部分内容,同样地,所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q2(X2,Y2),以此类推,依次完成以Q3(X3,Y3)、Q4(X4,Y4)为起始坐标选取的部分与集合B中各数组Bi的比对;然后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转执行步骤401;
所述步骤40具体为:
步骤401:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤402:将原点坐标更新为P0(X+D,M),跳转执行步骤302;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转执行步骤302;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤403;
步骤403:识别结束,输出原始图片的总体识别结果。
进一步地,所述步骤10中,对输入的原始图片进行二值化处理后,还进行除噪处理;
所述步骤20中,从图片库中逐一分析出单个字符的模版,将各单个字符模板进行二值化处理后,还进行除噪处理。
本发明具有如下优点:
本发明通过将原始图片进行二值化处理,再将单个字符模板也进行二值化处理,使得识别过程是通过数组与数组间的比对,可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题同时,大大降低了计算机的计算量及消耗的处理性能。另外,本发明还通过向上、向下、向左、向右偏移起始坐标的方法,多次比对,解决字符粘连图片中字符相互交织一起而无法识别的问题。在本发明可以很好的识别具有粘连字符特性的图片,识别准确率接近100%。利用本发明的成果,可以很好的解决WEB自动测试工具因无法识别粘连字符图片不能填写验证码的问题;网络数据抓取、分析的过程中,可以通过本发明的技术将网络中保存为图片格式的电话号码等信息转换为计算机可以批量处理的数据,从而进行数据挖掘等深入应用。
【附图说明】
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明一种图片识别装置的示意图。
图2为本发明一种图片识别方法的流程示意图。
【具体实施方式】
请参阅图1,对本发明一种图片识别装置的两实施例进行详细说明。
实施例一、
一种图片识别装置,包括:
图片预处理模块,对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;通过二值化处理,可以去除原始图片中的颜色信息,仅留下字符的轮廓信息,大大减少了输入信息量,提高处理效率。在对原始图片进行二值化处理后,还进行除噪处理;
字符模板管理模块,从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理,再进行除噪处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
字符识别模块,从字符模板管理模块中获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
具体地,所述字符识别模块执行如下步骤:
步骤A:以数组A的左上角数字为原点,将该原点坐标定义为P0(0,0);
步骤B:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为本次识别内容的起始坐标P(X,Y),执行步骤C,如果没有扫描到字符点,表示对数组A识别结束,跳转字符消除模块的步骤F;需要说明的是,第一次执行步骤时,原点坐标为P0(0,0),但循环后再次执行本步骤时,原点坐标值由步骤E决定;
步骤C:从字符模板管理模块获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标P(X,Y),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标P(X,Y),当所有数组Bi均比对完成后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转字符消除模块处理,执行步骤D;
字符消除模块,从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则字符识别模块继续识别,若是输出原始图片的总体识别结果;
具体地,所述字符消除模块执行如下步骤:
步骤D:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新写入至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;当待消除块中为1的字符点与匹配率最高的数组Bi中相对应位置的数字也为1时,表示该点已被识别过,所以异或结果为0,将0写入数组A中对应位置;
步骤E:将原点坐标更新为P0(X+D,M),跳转至字符识别模块,执行步骤B;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转至字符识别模块,执行步骤B;需要说明的是,X+D第一次超过数组A的横坐标最大值,纵坐标M加1,P0的横坐标初始化为0;X+D第二次超过数组A的横坐标最大值时,当前纵坐标M再加1,P0的横坐标初始化为0,即X+D每超过一次数组A的横坐标最大值,纵坐标更新为当前纵坐标M值再加1,即扫描的原点P跳到下一行的最左边,满足从左到右,从上到下的扫描原则;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤F;
步骤F:识别结束,输出原始图片的总体识别结果。
由于本发明一种图片识别装置不需要对原始图片进行字符切分动作,因此不会因切割精准度差而导致识别错误,本发明通过二值化处理技术先整体识别原始图片,然后再逐一把要识别的字符在图片中消除,识别正确率高,且大大减少计算量,提升处理性能。
实施例二、
本实施例较实施例一的不同之处在于,本实施例能更好地识别粘连字符图片,其识别正确率接近100%,具体过程如下:
一种图片识别装置,包括:
图片预处理模块,对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;通过二值化处理,可以去除原始图片中的颜色信息,仅留下字符的轮廓信息,大大减少了输入信息量,提高处理效率。在对原始图片进行二值化处理后,还进行除噪处理;
字符模板管理模块,从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
字符识别模块,从字符模板管理模块中获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
具体地,所述字符识别模块执行如下步骤:
步骤AA:以数组A的左上角数字为原点,将该原点坐标定义为Q0(0,0);
步骤BB:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为中心坐标Q(X,Y),以中心坐标Q(X,Y)为中心分别向上、向下、向左、向右偏移,生成四个坐标Q1(X1,Y1)、Q2(X2,Y2)、Q3(X3,Y3)、Q4(X4,Y4),将该四个坐标作为四个起始坐标,然后执行步骤CC,如果没有扫描到字符点,表示对数组A识别结束,跳转字符消除模块的步骤FF;
步骤CC:从字符模板管理模块获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标Q1(X1,Y1),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q1(X1,Y1),当所有数组Bi均与起始坐标Q1(X1,Y1)比对完成后,从数组A中选取以Q2(X2,Y2)为起始坐标的部分内容,同样地,所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q2(X2,Y2),以此类推,依次完成以Q3(X3,Y3)、Q4(X4,Y4)为起始坐标选取的部分与集合B中各数组Bi的比对;然后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转字符消除模块处理,执行步骤DD;
字符消除模块,从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则字符识别模块继续识别,若是输出原始图片的总体识别结果;
具体地,所述字符消除模块执行如下步骤:
步骤DD:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤EE:将原点坐标更新为P0(X+D,M),跳转至字符识别模块,执行步骤BB;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转至字符识别模块,执行步骤BB;需要说明的是,X+D第一次超过数组A的横坐标最大值,纵坐标M加1,P0的横坐标初始化为0;X+D第二次超过数组A的横坐标最大值时,当前纵坐标M再加1,P0的横坐标初始化为0,即X+D每超过一次数组A的横坐标最大值,纵坐标更新为当前纵坐标M值再加1,即扫描的原点P跳到下一行的最左边,满足从左到右,从上到下的扫描原则;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤FF;
步骤FF:识别结束,输出原始图片的总体识别结果。
本实施例较实施例一带来的更优效果是:由于本发明不需要对原始图片进行字符切分动作,因此在处理粘连字符时,正确率接近100%。
请参阅图2,对本发明一种图片识别方法的两实施例进行详细说明。
实施例三、
一种图片识别方法,包括如下步骤:
步骤10、对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;通过二值化处理,可以去除原始图片中的颜色信息,仅留下字符的轮廓信息,大大减少了输入信息量,提高处理效率。在对原始图片进行二值化处理后,还进行除噪处理;
步骤20、从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理后,再进行除噪处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
步骤30、获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
所述步骤30具体为:
步骤31:以数组A的左上角数字为原点,将该原点坐标定义为P0(0,0);
步骤32:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为本次识别内容的起始坐标P(X,Y),执行步骤33,如果没有扫描到字符点,表示对数组A识别结束,跳转步骤43;
步骤33:获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标P(X,Y),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标P(X,Y),当所有数组Bi均比对完成后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转步骤41;
步骤40、从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则跳转步骤30继续识别,若是,输出原始图片的总体识别结果;
所述步骤40具体为:
步骤41:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新写入至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤42:将原点坐标更新为P0(X+D,M),跳转执行步骤32;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转执行步骤32;需要说明的是,X+D第一次超过数组A的横坐标最大值,纵坐标M加1,P0的横坐标初始化为0;X+D第二次超过数组A的横坐标最大值时,当前纵坐标M再加1,P0的横坐标初始化为0,即X+D每超过一次数组A的横坐标最大值,纵坐标更新为当前纵坐标M值再加1,即扫描的原点P跳到下一行的最左边,满足从左到右,从上到下的扫描原则;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤F;
步骤43:识别结束,输出原始图片的总体识别结果。
由于本发明一种图片识别方法,不需要对原始图片进行字符切分动作,因此不会因切割精准度差而导致识别错误,本发明通过二值化处理技术先整体识别原始图片,然后再逐一把要识别的字符在图片中消除,识别正确率高,且大大减少计算量,提升处理性能。
实施例四、
本实施例较实施例三的不同之处在于,本实施例能更好地识别粘连字符图片,其识别正确率接近100%,具体过程如下:
一种图片识别方法,包括如下步骤:
步骤10、对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;通过二值化处理,可以去除原始图片中的颜色信息,仅留下字符的轮廓信息,大大减少了输入信息量,提高处理效率。在对原始图片进行二值化处理后,还进行除噪处理;
步骤20、从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
步骤30、获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
所述步骤30具体为
步骤301:以数组A的左上角数字为原点,将该原点坐标定义为Q0(0,0);
步骤302:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为中心坐标Q(X,Y),以中心坐标Q(X,Y)为中心分别向上、向下、向左、向右偏移,生成四个坐标Q1(X1,Y1)、Q2(X2,Y2)、Q3(X3,Y3)、Q4(X4,Y4),将该四个坐标作为四个起始坐标,然后执行步骤303,如果没有扫描到字符点,表示对数组A识别结束,跳转执行步骤403;
步骤303:获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标Q1(X1,Y1),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q1(X1,Y1),当所有数组Bi均与起始坐标Q1(X1,Y1)比对完成后,从数组A中选取以Q2(X2,Y2)为起始坐标的部分内容,同样地,所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q2(X2,Y2),以此类推,依次完成以Q3(X3,Y3)、Q4(X4,Y4)为起始坐标选取的部分与集合B中各数组Bi的比对;然后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转执行步骤401;
步骤40、从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则跳转步骤30继续识别,若是,输出原始图片的总体识别结果;
所述步骤40具体为:
步骤401:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤402:将原点坐标更新为P0(X+D,M),跳转执行步骤302;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转执行步骤302;需要说明的是,X+D第一次超过数组A的横坐标最大值,纵坐标M加1,P0的横坐标初始化为0;X+D第二次超过数组A的横坐标最大值时,当前纵坐标M再加1,P0的横坐标初始化为0,即X+D每超过一次数组A的横坐标最大值,纵坐标更新为当前纵坐标M值再加1,即扫描的原点P跳到下一行的最左边,满足从左到右,从上到下的扫描原则;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤403;
步骤403:识别结束,输出原始图片的总体识别结果。
本实施例较实施例一带来的更优效果是:由于本发明不需要对原始图片进行字符切分动作,因此在处理粘连字符时,正确率接近100%。
本发明具有如下优点:
本发明通过将原始图片进行二值化处理,再将单个字符模板也进行二值化处理,使得识别过程是通过数组与数组间的比对,可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题同时,大大降低了计算机的计算量及消耗的处理性能。另外,本发明还通过向上、向下、向左、向右偏移起始坐标的方法,多次比对,解决字符粘连图片中字符相互交织一起而无法识别的问题。利用本发明的成果,可以很好的解决WEB自动测试工具因无法识别粘连字符图片不能填写验证码的问题;网络数据抓取、分析的过程中,可以通过本发明的技术将网络中保存为图片格式的电话号码等信息转换为计算机可以批量处理的数据,从而进行数据挖掘等深入应用。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (8)
1.一种图片识别装置,其特征在于,包括:
图片预处理模块,对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;
字符模板管理模块,从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
字符识别模块,从字符模板管理模块中获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
字符消除模块,从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则字符识别模块继续识别,若是输出原始图片的总体识别结果。
2.根据权利要求1所述的一种图片识别装置,其特征在于:
所述字符识别模块具体执行如下步骤:
步骤A:以数组A的左上角数字为原点,将该原点坐标定义为P0(0,0);
步骤B:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为本次识别内容的起始坐标P(X,Y),执行步骤C,如果没有扫描到字符点,表示对数组A识别结束,跳转字符消除模块的步骤F;
步骤C:从字符模板管理模块获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标P(X,Y),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标P(X,Y),当所有数组Bi均比对完成后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转字符消除模块处理,执行步骤D;
所述字符消除模块具体执行如下步骤:
步骤D:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新写入至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤E:将原点坐标更新为P0(X+D,M),跳转至字符识别模块,执行步骤B;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转至字符识别模块,执行步骤B;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤F;
步骤F:识别结束,输出原始图片的总体识别结果。
3.根据权利要求1所述的一种图片识别装置,其特征在于:为了更好地识别粘连字符图片,所述字符识别模块具体执行如下步骤:
步骤AA:以数组A的左上角数字为原点,将该原点坐标定义为Q0(0,0);
步骤BB:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为中心坐标Q(X,Y),以中心坐标Q(X,Y)为中心分别向上、向下、向左、向右偏移,生成四个坐标Q1(X1,Y1)、Q2(X2,Y2)、Q3(X3,Y3)、Q4(X4,Y4),将该四个坐标作为四个起始坐标,然后执行步骤CC,如果没有扫描到字符点,表示对数组A识别结束,跳转字符消除模块的步骤FF;
步骤CC:从字符模板管理模块获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标Q1(X1,Y1),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q1(X1,Y1),当所有数组Bi均与起始坐标Q1(X1,Y1)比对完成后,从数组A中选取以Q2(X2,Y2)为起始坐标的部分内容,同样地,所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q2(X2,Y2),以此类推,依次完成以Q3(X3,Y3)、Q4(X4,Y4)为起始坐标选取的部分与集合B中各数组Bi的比对;然后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转字符消除模块处理,执行步骤DD;
所述字符消除模块具体执行如下步骤:
步骤DD:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤EE:将原点坐标更新为P0(X+D,M),跳转至字符识别模块,执行步骤BB;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转至字符识别模块,执行步骤BB;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤FF;
步骤FF:识别结束,输出原始图片的总体识别结果。
4.根据权利要求1所述的一种图片识别装置,其特征在于:所述图片预处理模块中,对输入的原始图片进行二值化处理后,还进行除噪处理。
所述字符模板管理模块中,将各单个字符模板进行二值化处理后,还进行除噪处理。
5.一种图片识别方法,其特征在于,包括如下步骤:
步骤10、对输入的原始图片进行二值化处理,将原始图片转化为由数字0、1组成的数组A,其中0表示背景,1表示构成字符的点,以下简称字符点;
步骤20、从图片库中逐一分析出单个字符的模版,且将各单个字符模板进行二值化处理,一单个字符模板生成一对应的数组Bi(i为≥1的自然数),将全部的单个字符模板的数组Bi表示为集合B={B1,B2,B3…Bi};
步骤30、获取集合B,并将所述集合B中的各数组Bi逐一与数组A中的部分内容进行比对,所述部分内容为数组A的全部内容的一部分,每次比对的结果都会输出一个匹配率,最终将匹配率最高的数组Bi所代表的字符作为本次识别的结果输出;
步骤40、从数组A中消除已识别的部分内容,然后判断数组A中的全部内容是否都已识别,若否,则跳转步骤30继续识别,若是,输出原始图片的总体识别结果。
6.根据权利要求5所述的一种图片识别方法,其特征在于,
所述步骤30具体为:
步骤31:以数组A的左上角数字为原点,将该原点坐标定义为P0(0,0);
步骤32:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为本次识别内容的起始坐标P(X,Y),执行步骤33,如果没有扫描到字符点,表示对数组A识别结束,跳转步骤43;
步骤33:获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标P(X,Y),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标P(X,Y),当所有数组Bi均比对完成后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转步骤41;
所述步骤40具体为:
步骤41:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点逐一与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新写入至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤42:将原点坐标更新为P0(X+D,M),跳转执行步骤32;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转执行步骤32;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤F;
步骤43:识别结束,输出原始图片的总体识别结果。
7.根据权利要求5所述的一种图片识别方法,其特征在于,为了更好地识别粘连字符图片,所述步骤30具体为
步骤301:以数组A的左上角数字为原点,将该原点坐标定义为Q0(0,0);
步骤302:以原点坐标为扫描的起始点,按照从左到右,从上到下的方式扫描数组A,以扫描到的第一个字符点作为中心坐标Q(X,Y),以中心坐标Q(X,Y)为中心分别向上、向下、向左、向右偏移,生成四个坐标Q1(X1,Y1)、Q2(X2,Y2)、Q3(X3,Y3)、Q4(X4,Y4),将该四个坐标作为四个起始坐标,然后执行步骤303,如果没有扫描到字符点,表示对数组A识别结束,跳转执行步骤403;
步骤303:获取集合B,并从数组A中选取部分内容,所述部分内容的左上角坐标为起始坐标Q1(X1,Y1),且所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q1(X1,Y1),当所有数组Bi均与起始坐标Q1(X1,Y1)比对完成后,从数组A中选取以Q2(X2,Y2)为起始坐标的部分内容,同样地,所述部分内容的大小与要比对的数组Bi的大小相同;将选取的部分内容与集合B中各数组Bi逐一比对,每比对一次,记录匹配率及对应起始坐标Q2(X2,Y2),以此类推,依次完成以Q3(X3,Y3)、Q4(X4,Y4)为起始坐标选取的部分与集合B中各数组Bi的比对;然后,将匹配率最高的数组Bi所对应的单个字符模板作为本次识别的结果输出,跳转执行步骤401;
所述步骤40具体为:
步骤401:消除已识别的内容,具体为,将数组A中与匹配率最高的数组Bi进行匹配的部分内容定义为待消除块,所述待消除块的左上角坐标为与最高匹配率对应的起始坐标,将所述待消除块中为1的字符点与匹配率最高的数组Bi中相对应位置的数字进行异或操作,并将异或结果更新至数组A中对应的位置,这样就可以消除待消除块中已经被识别过的字符点;
步骤402:将原点坐标更新为P0(X+D,M),跳转执行步骤302;所述D为匹配率最高的数组Bi的宽度;所述P0的纵坐标M的初始值为0;
当X+D超过数组A的横坐标最大值一次,则纵坐标M加1,且P0的横坐标初始化为0,而后跳转执行步骤302;
当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值,跳转步骤403;
步骤403:识别结束,输出原始图片的总体识别结果。
8.根据权利要求5所述的一种图片识别方法,其特征在于,所述步骤10中,对输入的原始图片进行二值化处理后,还进行除噪处理;
所述步骤20中,从图片库中逐一分析出单个字符的模版,将各单个字符模板进行二值化处理后,还进行除噪处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410443188.7A CN104200204B (zh) | 2014-09-02 | 2014-09-02 | 一种图片处理装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410443188.7A CN104200204B (zh) | 2014-09-02 | 2014-09-02 | 一种图片处理装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104200204A true CN104200204A (zh) | 2014-12-10 |
CN104200204B CN104200204B (zh) | 2017-10-03 |
Family
ID=52085494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410443188.7A Active CN104200204B (zh) | 2014-09-02 | 2014-09-02 | 一种图片处理装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104200204B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104616009A (zh) * | 2015-02-13 | 2015-05-13 | 广州广电运通金融电子股份有限公司 | 一种字符切割识别方法 |
CN105426890A (zh) * | 2015-11-09 | 2016-03-23 | 成都数之联科技有限公司 | 一种字符扭曲粘连的图形验证码识别方法 |
CN109284600A (zh) * | 2018-08-08 | 2019-01-29 | 贵阳朗玛信息技术股份有限公司 | 一种用于识别验证码的方法及装置 |
CN109816640A (zh) * | 2019-01-08 | 2019-05-28 | 南京富士通南大软件技术有限公司 | 一种基于图片对比的产品校验方法 |
CN109829489A (zh) * | 2019-01-18 | 2019-05-31 | 刘凯欣 | 一种基于多层特征的文物碎片重组方法及装置 |
CN110069915A (zh) * | 2019-03-12 | 2019-07-30 | 杭州电子科技大学 | 一种基于轮廓提取的九宫格图形验证码识别方法 |
CN112019925A (zh) * | 2020-10-29 | 2020-12-01 | 蘑菇车联信息科技有限公司 | 视频水印识别处理方法及装置 |
CN112817716A (zh) * | 2021-01-28 | 2021-05-18 | 厦门树冠科技有限公司 | 一种视觉检测处理方法及系统 |
CN114079724A (zh) * | 2020-07-31 | 2022-02-22 | 北京小米移动软件有限公司 | 起跳抓拍方法、装置及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6738518B1 (en) * | 2000-05-12 | 2004-05-18 | Xerox Corporation | Document image decoding using text line column-based heuristic scoring |
CN101196994A (zh) * | 2007-12-26 | 2008-06-11 | 腾讯科技(深圳)有限公司 | 图片内容识别方法及识别系统 |
JP2008243016A (ja) * | 2007-03-28 | 2008-10-09 | Oki Electric Ind Co Ltd | 文字認識方法、文字認識プログラムおよび文字認識装置 |
CN102663377A (zh) * | 2012-03-15 | 2012-09-12 | 华中科技大学 | 一种基于模板匹配的字符识别方法 |
CN102915437A (zh) * | 2011-08-02 | 2013-02-06 | 腾讯科技(深圳)有限公司 | 文本信息识别方法及系统 |
-
2014
- 2014-09-02 CN CN201410443188.7A patent/CN104200204B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6738518B1 (en) * | 2000-05-12 | 2004-05-18 | Xerox Corporation | Document image decoding using text line column-based heuristic scoring |
JP2008243016A (ja) * | 2007-03-28 | 2008-10-09 | Oki Electric Ind Co Ltd | 文字認識方法、文字認識プログラムおよび文字認識装置 |
CN101196994A (zh) * | 2007-12-26 | 2008-06-11 | 腾讯科技(深圳)有限公司 | 图片内容识别方法及识别系统 |
CN102915437A (zh) * | 2011-08-02 | 2013-02-06 | 腾讯科技(深圳)有限公司 | 文本信息识别方法及系统 |
CN102663377A (zh) * | 2012-03-15 | 2012-09-12 | 华中科技大学 | 一种基于模板匹配的字符识别方法 |
Non-Patent Citations (1)
Title |
---|
徐剑峰: "电能表表号点状数字识别算法研究", 《中国优秀硕士学位论文全文数据库工程科技II辑》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10430681B2 (en) | 2015-02-13 | 2019-10-01 | Grg Banking Equipment Co., Ltd. | Character segmentation and recognition method |
CN104616009B (zh) * | 2015-02-13 | 2018-05-18 | 广州广电运通金融电子股份有限公司 | 一种字符切割识别方法 |
CN104616009A (zh) * | 2015-02-13 | 2015-05-13 | 广州广电运通金融电子股份有限公司 | 一种字符切割识别方法 |
CN105426890A (zh) * | 2015-11-09 | 2016-03-23 | 成都数之联科技有限公司 | 一种字符扭曲粘连的图形验证码识别方法 |
CN105426890B (zh) * | 2015-11-09 | 2018-12-18 | 成都数之联科技有限公司 | 一种字符扭曲粘连的图形验证码识别方法 |
CN109284600A (zh) * | 2018-08-08 | 2019-01-29 | 贵阳朗玛信息技术股份有限公司 | 一种用于识别验证码的方法及装置 |
CN109816640A (zh) * | 2019-01-08 | 2019-05-28 | 南京富士通南大软件技术有限公司 | 一种基于图片对比的产品校验方法 |
CN109816640B (zh) * | 2019-01-08 | 2023-05-12 | 南京富士通南大软件技术有限公司 | 一种基于图片对比的产品校验方法 |
CN109829489A (zh) * | 2019-01-18 | 2019-05-31 | 刘凯欣 | 一种基于多层特征的文物碎片重组方法及装置 |
CN110069915A (zh) * | 2019-03-12 | 2019-07-30 | 杭州电子科技大学 | 一种基于轮廓提取的九宫格图形验证码识别方法 |
CN110069915B (zh) * | 2019-03-12 | 2021-04-13 | 杭州电子科技大学 | 一种基于轮廓提取的九宫格图形验证码识别方法 |
CN114079724A (zh) * | 2020-07-31 | 2022-02-22 | 北京小米移动软件有限公司 | 起跳抓拍方法、装置及存储介质 |
CN112019925A (zh) * | 2020-10-29 | 2020-12-01 | 蘑菇车联信息科技有限公司 | 视频水印识别处理方法及装置 |
CN112019925B (zh) * | 2020-10-29 | 2021-01-22 | 蘑菇车联信息科技有限公司 | 视频水印识别处理方法及装置 |
CN112817716A (zh) * | 2021-01-28 | 2021-05-18 | 厦门树冠科技有限公司 | 一种视觉检测处理方法及系统 |
CN112817716B (zh) * | 2021-01-28 | 2024-02-09 | 厦门树冠科技有限公司 | 一种视觉检测处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104200204B (zh) | 2017-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104200204A (zh) | 一种图片处理装置及方法 | |
CN111695553B (zh) | 表格识别方法、装置、设备和介质 | |
CN104182750B (zh) | 一种在自然场景图像中基于极值连通域的中文检测方法 | |
JP2019520615A (ja) | 損害賠償請求書類の文字認識方法、装置、サーバ及び記憶媒体 | |
US10438083B1 (en) | Method and system for processing candidate strings generated by an optical character recognition process | |
CN105678292A (zh) | 基于卷积及递归神经网络的复杂光学文字序列识别系统 | |
CN103488983A (zh) | 一种基于知识库的名片ocr数据修正方法和系统 | |
CN105678300A (zh) | 一种复杂图像文字序列识别方法 | |
CN105208275B (zh) | 一种支持流数据片内实时处理的系统 | |
CN105260751A (zh) | 一种文字识别方法及其系统 | |
JP7278321B2 (ja) | 画像におけるテーブル抽出方法、画像におけるテーブル抽出装置、電子機器、コンピュータ読み取り可能な記憶媒体、テーブル抽出モジュールの訓練方法及びコンピュータプログラム | |
CN107766854B (zh) | 一种基于模板匹配实现快速页码识别的方法 | |
CN104636322A (zh) | 一种文本复制的方法及装置 | |
CN104063701B (zh) | 基于surf词汇树和模板匹配的快速电视台台标识别系统及其实现方法 | |
CN103559512B (zh) | 一种文字识别输出方法及系统 | |
CN109871813A (zh) | 一种实时图像跟踪方法及系统 | |
CN113205047A (zh) | 药名识别方法、装置、计算机设备和存储介质 | |
CN102314252B (zh) | 一种手写字符串的字符切分方法和装置 | |
CN103679918A (zh) | 一种基于dsp的高速纸币冠字号码提取及识别方法 | |
CN105677718A (zh) | 文字检索方法及装置 | |
CN104036227A (zh) | 一种生成电子乐谱的方法和移动终端 | |
CN103176651A (zh) | 一种手写信息快速采集方法 | |
TW201933179A (zh) | 影像數據擷取方法及影像數據擷取裝置 | |
CN101930593B (zh) | 单一物体影像萃取系统及方法 | |
CN106127202A (zh) | 一种图片中字符识别的方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 350000 12, 89 Avenue, Wufeng street, Gulou District, Fuzhou, Fujian. Patentee after: China Electric fufu Mdt InfoTech Ltd Address before: 350000 12, 89 Avenue, Wufeng street, Gulou District, Fuzhou, Fujian. Patentee before: Fujian Fushitong Information Software Co.,Ltd. |