CN104200204A

CN104200204A - 一种图片处理装置及方法

Info

Publication number: CN104200204A
Application number: CN201410443188.7A
Authority: CN
Inventors: 赖祥芳; 周龙驱
Original assignee: Fujian Fujitsu Communication Software Co Ltd
Current assignee: China Electric fufu Mdt InfoTech Ltd
Priority date: 2014-09-02
Filing date: 2014-09-02
Publication date: 2014-12-10
Anticipated expiration: 2034-09-02
Also published as: CN104200204B

Abstract

本发明提供一种图片识别装置，包括图片预处理模块、字符模板管理模块、字符识别模块以及字符消除模块，图片预处理模块对输入的原始图片进行二值化处理；字符模板管理模块将各单个字符模板进行二值化处理；字符识别模块从字符模板管理模块中获取集合B，并将所述集合B中的各数组B_i逐一与数组A中的部分内容进行比对，每次比对的结果都会输出一个匹配率，最终将匹配率最高的数组B_i所代表的字符作为本次识别的结果输出；字符消除模块，从数组A中消除已识别的部分内容。本发明还提供一种图片识别方法。本发明识别方法及装置对图片的识别正确率高，尤其是对字符粘连的图片，同时本发明计算量小，消耗处理性能少，处理速度快。

Description

一种图片处理装置及方法

【技术领域】

本发明涉及一种图片处理装置及方法。

【背景技术】

现有的图片识别技术主要采用先将图片进行切割，然后对切割后的图片进行识别的方法，其计算量大，需要消耗较大的处理性能。不仅如此，采用图片切割的方式进行图片识别，对于字符粘连的图片，切割不准确，识别准确率低，不适合在生产过程中应用。

公布号为CN103605957A，公布日为2014.2.26的发明专利《一种图片识别方法及装置》公开了一种图片识别方法，包括以下步骤：获取需要识别的图片；对所述图片进行整体轮廓识别，并生成轮廓识别信息；对所述图片进行色彩识别，并生成色彩识别信息；将所述轮廓识别信息和色彩识别信息与识别库中的识别信息比对，进行图片识别。该发明专利的识别方法就是一种采用整理识别，再色彩识别的方法，存在计算机处理量大，消耗较大处理性能的问题。

【发明内容】

本发明要解决的技术问题之一，在于提供一种图片处理装置，其可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题，同时还可以解决传统识别方法计算量大，需要消耗较大处理性能的问题。

本发明通过技术方案一解决上述技术问题之一：

技术方案一：

一种图片识别装置，包括：

图片预处理模块，对输入的原始图片进行二值化处理，将原始图片转化为由数字0、1组成的数组A，其中0表示背景，1表示构成字符的点，以下简称字符点；

字符模板管理模块，从图片库中逐一分析出单个字符的模版，且将各单个字符模板进行二值化处理，一单个字符模板生成一对应的数组B_i(i为≥1的自然数)，将全部的单个字符模板的数组B_i表示为集合B＝{B₁，B₂，B₃…B_i}；

字符识别模块，从字符模板管理模块中获取集合B，并将所述集合B中的各数组B_i逐一与数组A中的部分内容进行比对，所述部分内容为数组A的全部内容的一部分，每次比对的结果都会输出一个匹配率，最终将匹配率最高的数组B_i所代表的字符作为本次识别的结果输出；

字符消除模块，从数组A中消除已识别的部分内容，然后判断数组A中的全部内容是否都已识别，若否，则字符识别模块继续识别，若是输出原始图片的总体识别结果。

进一步地，所述字符识别模块具体执行如下步骤：

步骤A：以数组A的左上角数字为原点，将该原点坐标定义为P₀(0，0)；

步骤B：以原点坐标为扫描的起始点，按照从左到右，从上到下的方式扫描数组A，以扫描到的第一个字符点作为本次识别内容的起始坐标P(X，Y)，执行步骤C，如果没有扫描到字符点，表示对数组A识别结束，跳转字符消除模块的步骤F；

步骤C：从字符模板管理模块获取集合B，并从数组A中选取部分内容，所述部分内容的左上角坐标为起始坐标P(X，Y)，且所述部分内容的大小与要比对的数组B_i的大小相同；将选取的部分内容与集合B中各数组B_i逐一比对，每比对一次，记录匹配率及对应起始坐标P(X，Y)，当所有数组B_i均比对完成后，将匹配率最高的数组B_i所对应的单个字符模板作为本次识别的结果输出，跳转字符消除模块处理，执行步骤D；

所述字符消除模块具体执行如下步骤：

步骤D：消除已识别的内容，具体为，将数组A中与匹配率最高的数组B_i进行匹配的部分内容定义为待消除块，所述待消除块的左上角坐标为与最高匹配率对应的起始坐标，将所述待消除块中为1的字符点逐一与匹配率最高的数组B_i中相对应位置的数字进行异或操作，并将异或结果更新写入至数组A中对应的位置，这样就可以消除待消除块中已经被识别过的字符点；

步骤E：将原点坐标更新为P₀(X+D，M)，跳转至字符识别模块，执行步骤B；所述D为匹配率最高的数组B_i的宽度；所述P₀的纵坐标M的初始值为0；

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转至字符识别模块，执行步骤B；

当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值，跳转步骤F；

步骤F：识别结束，输出原始图片的总体识别结果。

进一步地，为了更好地识别粘连字符图片，所述字符识别模块具体执行如下步骤：

步骤AA：以数组A的左上角数字为原点，将该原点坐标定义为Q₀(0，0)；

步骤BB：以原点坐标为扫描的起始点，按照从左到右，从上到下的方式扫描数组A，以扫描到的第一个字符点作为中心坐标Q(X，Y)，以中心坐标Q(X，Y)为中心分别向上、向下、向左、向右偏移，生成四个坐标Q₁(X₁，Y₁)、Q₂(X₂，Y₂)、Q₃(X₃，Y₃)、Q₄(X₄，Y₄)，将该四个坐标作为四个起始坐标，然后执行步骤CC，如果没有扫描到字符点，表示对数组A识别结束，跳转字符消除模块的步骤FF；

步骤CC：从字符模板管理模块获取集合B，并从数组A中选取部分内容，所述部分内容的左上角坐标为起始坐标Q₁(X₁，Y₁)，且所述部分内容的大小与要比对的数组B_i的大小相同；将选取的部分内容与集合B中各数组B_i逐一比对，每比对一次，记录匹配率及对应起始坐标Q₁(X₁，Y₁)，当所有数组B_i均与起始坐标Q₁(X₁，Y₁)比对完成后，从数组A中选取以Q₂(X₂，Y₂)为起始坐标的部分内容，同样地，所述部分内容的大小与要比对的数组B_i的大小相同；将选取的部分内容与集合B中各数组B_i逐一比对，每比对一次，记录匹配率及对应起始坐标Q₂(X₂，Y₂)，以此类推，依次完成以Q₃(X₃，Y₃)、Q₄(X₄，Y₄)为起始坐标选取的部分与集合B中各数组B_i的比对；然后，将匹配率最高的数组B_i所对应的单个字符模板作为本次识别的结果输出，跳转字符消除模块处理，执行步骤DD；

所述字符消除模块具体执行如下步骤：

步骤DD：消除已识别的内容，具体为，将数组A中与匹配率最高的数组B_i进行匹配的部分内容定义为待消除块，所述待消除块的左上角坐标为与最高匹配率对应的起始坐标，将所述待消除块中为1的字符点逐一与匹配率最高的数组B_i中相对应位置的数字进行异或操作，并将异或结果更新至数组A中对应的位置，这样就可以消除待消除块中已经被识别过的字符点；

步骤EE：将原点坐标更新为P₀(X+D，M)，跳转至字符识别模块，执行步骤BB；所述D为匹配率最高的数组B_i的宽度；所述P₀的纵坐标M的初始值为0；

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转至字符识别模块，执行步骤BB；

当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值，跳转步骤FF；

步骤FF：识别结束，输出原始图片的总体识别结果。

进一步地，所述图片预处理模块中，对输入的原始图片进行二值化处理后，还进行除噪处理。

所述字符模板管理模块中，将各单个字符模板进行二值化处理后，还进行除噪处理。

本发明要解决的技术问题之二，在于提供一种图片处理装置，其可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题，同时还可以解决传统识别方法计算量大，需要消耗较大处理性能的问题。

本发明通过技术方案二解决上述技术问题之二：

技术方案二：

一种图片识别方法，包括如下步骤：

步骤10、对输入的原始图片进行二值化处理，将原始图片转化为由数字0、1组成的数组A，其中0表示背景，1表示构成字符的点，以下简称字符点；

步骤20、从图片库中逐一分析出单个字符的模版，且将各单个字符模板进行二值化处理，一单个字符模板生成一对应的数组B_i(i为≥1的自然数)，将全部的单个字符模板的数组B_i表示为集合B＝{B₁，B₂，B₃…B_i}；

步骤30、获取集合B，并将所述集合B中的各数组B_i逐一与数组A中的部分内容进行比对，所述部分内容为数组A的全部内容的一部分，每次比对的结果都会输出一个匹配率，最终将匹配率最高的数组B_i所代表的字符作为本次识别的结果输出；

步骤40、从数组A中消除已识别的部分内容，然后判断数组A中的全部内容是否都已识别，若否，则跳转步骤30继续识别，若是，输出原始图片的总体识别结果。

进一步地，所述步骤30具体为：

步骤31：以数组A的左上角数字为原点，将该原点坐标定义为P₀(0，0)；

步骤32：以原点坐标为扫描的起始点，按照从左到右，从上到下的方式扫描数组A，以扫描到的第一个字符点作为本次识别内容的起始坐标P(X，Y)，执行步骤33，如果没有扫描到字符点，表示对数组A识别结束，跳转步骤43；

步骤33：获取集合B，并从数组A中选取部分内容，所述部分内容的左上角坐标为起始坐标P(X，Y)，且所述部分内容的大小与要比对的数组B_i的大小相同；将选取的部分内容与集合B中各数组B_i逐一比对，每比对一次，记录匹配率及对应起始坐标P(X，Y)，当所有数组B_i均比对完成后，将匹配率最高的数组B_i所对应的单个字符模板作为本次识别的结果输出，跳转步骤41；

所述步骤40具体为：

步骤41：消除已识别的内容，具体为，将数组A中与匹配率最高的数组B_i进行匹配的部分内容定义为待消除块，所述待消除块的左上角坐标为与最高匹配率对应的起始坐标，将所述待消除块中为1的字符点逐一与匹配率最高的数组B_i中相对应位置的数字进行异或操作，并将异或结果更新写入至数组A中对应的位置，这样就可以消除待消除块中已经被识别过的字符点；

步骤42：将原点坐标更新为P₀(X+D，M)，跳转执行步骤32；所述D为匹配率最高的数组B_i的宽度；所述P₀的纵坐标M的初始值为0；

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转执行步骤32；

步骤43：识别结束，输出原始图片的总体识别结果。

进一步地，为了更好地识别粘连字符图片，所述步骤30具体为

步骤301：以数组A的左上角数字为原点，将该原点坐标定义为Q₀(0，0)；

步骤302：以原点坐标为扫描的起始点，按照从左到右，从上到下的方式扫描数组A，以扫描到的第一个字符点作为中心坐标Q(X，Y)，以中心坐标Q(X，Y)为中心分别向上、向下、向左、向右偏移，生成四个坐标Q₁(X₁，Y₁)、Q₂(X₂，Y₂)、Q₃(X₃，Y₃)、Q₄(X₄，Y₄)，将该四个坐标作为四个起始坐标，然后执行步骤303，如果没有扫描到字符点，表示对数组A识别结束，跳转执行步骤403；

步骤303：获取集合B，并从数组A中选取部分内容，所述部分内容的左上角坐标为起始坐标Q₁(X₁，Y₁)，且所述部分内容的大小与要比对的数组B_i的大小相同；将选取的部分内容与集合B中各数组B_i逐一比对，每比对一次，记录匹配率及对应起始坐标Q₁(X₁，Y₁)，当所有数组B_i均与起始坐标Q₁(X₁，Y₁)比对完成后，从数组A中选取以Q₂(X₂，Y₂)为起始坐标的部分内容，同样地，所述部分内容的大小与要比对的数组B_i的大小相同；将选取的部分内容与集合B中各数组B_i逐一比对，每比对一次，记录匹配率及对应起始坐标Q₂(X₂，Y₂)，以此类推，依次完成以Q₃(X₃，Y₃)、Q₄(X₄，Y₄)为起始坐标选取的部分与集合B中各数组B_i的比对；然后，将匹配率最高的数组B_i所对应的单个字符模板作为本次识别的结果输出，跳转执行步骤401；

所述步骤40具体为：

步骤401：消除已识别的内容，具体为，将数组A中与匹配率最高的数组B_i进行匹配的部分内容定义为待消除块，所述待消除块的左上角坐标为与最高匹配率对应的起始坐标，将所述待消除块中为1的字符点与匹配率最高的数组B_i中相对应位置的数字进行异或操作，并将异或结果更新至数组A中对应的位置，这样就可以消除待消除块中已经被识别过的字符点；

步骤402：将原点坐标更新为P₀(X+D，M)，跳转执行步骤302；所述D为匹配率最高的数组B_i的宽度；所述P₀的纵坐标M的初始值为0；

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转执行步骤302；

当X+D为数组A的横坐标最大值且M为数组A的纵坐标最大值，跳转步骤403；

步骤403：识别结束，输出原始图片的总体识别结果。

进一步地，所述步骤10中，对输入的原始图片进行二值化处理后，还进行除噪处理；

所述步骤20中，从图片库中逐一分析出单个字符的模版，将各单个字符模板进行二值化处理后，还进行除噪处理。

本发明具有如下优点：

本发明通过将原始图片进行二值化处理，再将单个字符模板也进行二值化处理，使得识别过程是通过数组与数组间的比对，可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题同时，大大降低了计算机的计算量及消耗的处理性能。另外，本发明还通过向上、向下、向左、向右偏移起始坐标的方法，多次比对，解决字符粘连图片中字符相互交织一起而无法识别的问题。在本发明可以很好的识别具有粘连字符特性的图片，识别准确率接近100％。利用本发明的成果，可以很好的解决WEB自动测试工具因无法识别粘连字符图片不能填写验证码的问题；网络数据抓取、分析的过程中，可以通过本发明的技术将网络中保存为图片格式的电话号码等信息转换为计算机可以批量处理的数据，从而进行数据挖掘等深入应用。

【附图说明】

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明一种图片识别装置的示意图。

图2为本发明一种图片识别方法的流程示意图。

【具体实施方式】

请参阅图1，对本发明一种图片识别装置的两实施例进行详细说明。

实施例一、

一种图片识别装置，包括：

图片预处理模块，对输入的原始图片进行二值化处理，将原始图片转化为由数字0、1组成的数组A，其中0表示背景，1表示构成字符的点，以下简称字符点；通过二值化处理，可以去除原始图片中的颜色信息，仅留下字符的轮廓信息，大大减少了输入信息量，提高处理效率。在对原始图片进行二值化处理后，还进行除噪处理；

字符模板管理模块，从图片库中逐一分析出单个字符的模版，且将各单个字符模板进行二值化处理，再进行除噪处理，一单个字符模板生成一对应的数组B_i(i为≥1的自然数)，将全部的单个字符模板的数组B_i表示为集合B＝{B₁，B₂，B₃…B_i}；

具体地，所述字符识别模块执行如下步骤：

步骤B：以原点坐标为扫描的起始点，按照从左到右，从上到下的方式扫描数组A，以扫描到的第一个字符点作为本次识别内容的起始坐标P(X，Y)，执行步骤C，如果没有扫描到字符点，表示对数组A识别结束，跳转字符消除模块的步骤F；需要说明的是，第一次执行步骤时，原点坐标为P₀(0，0)，但循环后再次执行本步骤时，原点坐标值由步骤E决定；

字符消除模块，从数组A中消除已识别的部分内容，然后判断数组A中的全部内容是否都已识别，若否，则字符识别模块继续识别，若是输出原始图片的总体识别结果；

具体地，所述字符消除模块执行如下步骤：

步骤D：消除已识别的内容，具体为，将数组A中与匹配率最高的数组B_i进行匹配的部分内容定义为待消除块，所述待消除块的左上角坐标为与最高匹配率对应的起始坐标，将所述待消除块中为1的字符点逐一与匹配率最高的数组B_i中相对应位置的数字进行异或操作，并将异或结果更新写入至数组A中对应的位置，这样就可以消除待消除块中已经被识别过的字符点；当待消除块中为1的字符点与匹配率最高的数组B_i中相对应位置的数字也为1时，表示该点已被识别过，所以异或结果为0，将0写入数组A中对应位置；

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转至字符识别模块，执行步骤B；需要说明的是，X+D第一次超过数组A的横坐标最大值，纵坐标M加1，P₀的横坐标初始化为0；X+D第二次超过数组A的横坐标最大值时，当前纵坐标M再加1，P₀的横坐标初始化为0，即X+D每超过一次数组A的横坐标最大值，纵坐标更新为当前纵坐标M值再加1，即扫描的原点P跳到下一行的最左边，满足从左到右，从上到下的扫描原则；

步骤F：识别结束，输出原始图片的总体识别结果。

由于本发明一种图片识别装置不需要对原始图片进行字符切分动作，因此不会因切割精准度差而导致识别错误，本发明通过二值化处理技术先整体识别原始图片，然后再逐一把要识别的字符在图片中消除，识别正确率高，且大大减少计算量，提升处理性能。

实施例二、

本实施例较实施例一的不同之处在于，本实施例能更好地识别粘连字符图片，其识别正确率接近100％，具体过程如下：

一种图片识别装置，包括：

具体地，所述字符识别模块执行如下步骤：

具体地，所述字符消除模块执行如下步骤：

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转至字符识别模块，执行步骤BB；需要说明的是，X+D第一次超过数组A的横坐标最大值，纵坐标M加1，P₀的横坐标初始化为0；X+D第二次超过数组A的横坐标最大值时，当前纵坐标M再加1，P₀的横坐标初始化为0，即X+D每超过一次数组A的横坐标最大值，纵坐标更新为当前纵坐标M值再加1，即扫描的原点P跳到下一行的最左边，满足从左到右，从上到下的扫描原则；

步骤FF：识别结束，输出原始图片的总体识别结果。

本实施例较实施例一带来的更优效果是：由于本发明不需要对原始图片进行字符切分动作，因此在处理粘连字符时，正确率接近100％。

请参阅图2，对本发明一种图片识别方法的两实施例进行详细说明。

实施例三、

一种图片识别方法，包括如下步骤：

步骤10、对输入的原始图片进行二值化处理，将原始图片转化为由数字0、1组成的数组A，其中0表示背景，1表示构成字符的点，以下简称字符点；通过二值化处理，可以去除原始图片中的颜色信息，仅留下字符的轮廓信息，大大减少了输入信息量，提高处理效率。在对原始图片进行二值化处理后，还进行除噪处理；

步骤20、从图片库中逐一分析出单个字符的模版，且将各单个字符模板进行二值化处理后，再进行除噪处理，一单个字符模板生成一对应的数组B_i(i为≥1的自然数)，将全部的单个字符模板的数组B_i表示为集合B＝{B₁，B₂，B₃…B_i}；

所述步骤30具体为：

步骤40、从数组A中消除已识别的部分内容，然后判断数组A中的全部内容是否都已识别，若否，则跳转步骤30继续识别，若是，输出原始图片的总体识别结果；

所述步骤40具体为：

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转执行步骤32；需要说明的是，X+D第一次超过数组A的横坐标最大值，纵坐标M加1，P₀的横坐标初始化为0；X+D第二次超过数组A的横坐标最大值时，当前纵坐标M再加1，P₀的横坐标初始化为0，即X+D每超过一次数组A的横坐标最大值，纵坐标更新为当前纵坐标M值再加1，即扫描的原点P跳到下一行的最左边，满足从左到右，从上到下的扫描原则；

步骤43：识别结束，输出原始图片的总体识别结果。

由于本发明一种图片识别方法，不需要对原始图片进行字符切分动作，因此不会因切割精准度差而导致识别错误，本发明通过二值化处理技术先整体识别原始图片，然后再逐一把要识别的字符在图片中消除，识别正确率高，且大大减少计算量，提升处理性能。

实施例四、

本实施例较实施例三的不同之处在于，本实施例能更好地识别粘连字符图片，其识别正确率接近100％，具体过程如下：

一种图片识别方法，包括如下步骤：

所述步骤30具体为

所述步骤40具体为：

当X+D超过数组A的横坐标最大值一次，则纵坐标M加1，且P₀的横坐标初始化为0，而后跳转执行步骤302；需要说明的是，X+D第一次超过数组A的横坐标最大值，纵坐标M加1，P₀的横坐标初始化为0；X+D第二次超过数组A的横坐标最大值时，当前纵坐标M再加1，P₀的横坐标初始化为0，即X+D每超过一次数组A的横坐标最大值，纵坐标更新为当前纵坐标M值再加1，即扫描的原点P跳到下一行的最左边，满足从左到右，从上到下的扫描原则；

步骤403：识别结束，输出原始图片的总体识别结果。

本发明具有如下优点：

本发明通过将原始图片进行二值化处理，再将单个字符模板也进行二值化处理，使得识别过程是通过数组与数组间的比对，可以避免传统识别方法因字符切分不准确导致识别错误、不能识别的问题同时，大大降低了计算机的计算量及消耗的处理性能。另外，本发明还通过向上、向下、向左、向右偏移起始坐标的方法，多次比对，解决字符粘连图片中字符相互交织一起而无法识别的问题。利用本发明的成果，可以很好的解决WEB自动测试工具因无法识别粘连字符图片不能填写验证码的问题；网络数据抓取、分析的过程中，可以通过本发明的技术将网络中保存为图片格式的电话号码等信息转换为计算机可以批量处理的数据，从而进行数据挖掘等深入应用。

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

Claims

1.一种图片识别装置，其特征在于，包括：

2.根据权利要求1所述的一种图片识别装置，其特征在于：

所述字符识别模块具体执行如下步骤：

所述字符消除模块具体执行如下步骤：

步骤F：识别结束，输出原始图片的总体识别结果。

3.根据权利要求1所述的一种图片识别装置，其特征在于：为了更好地识别粘连字符图片，所述字符识别模块具体执行如下步骤：

所述字符消除模块具体执行如下步骤：

步骤FF：识别结束，输出原始图片的总体识别结果。

4.根据权利要求1所述的一种图片识别装置，其特征在于：所述图片预处理模块中，对输入的原始图片进行二值化处理后，还进行除噪处理。

5.一种图片识别方法，其特征在于，包括如下步骤：

6.根据权利要求5所述的一种图片识别方法，其特征在于，

所述步骤30具体为：

所述步骤40具体为：

步骤43：识别结束，输出原始图片的总体识别结果。

7.根据权利要求5所述的一种图片识别方法，其特征在于，为了更好地识别粘连字符图片，所述步骤30具体为

所述步骤40具体为：

步骤403：识别结束，输出原始图片的总体识别结果。

8.根据权利要求5所述的一种图片识别方法，其特征在于，所述步骤10中，对输入的原始图片进行二值化处理后，还进行除噪处理；