CN109543686A

CN109543686A - 基于自适应多阈值的字符识别预处理二值化方法

Info

Publication number: CN109543686A
Application number: CN201811242923.2A
Authority: CN
Inventors: 朱德利; 杨雨浓; 杨德刚; 万辉
Original assignee: Chongqing Normal University
Current assignee: Chongqing Normal University
Priority date: 2018-10-24
Filing date: 2018-10-24
Publication date: 2019-03-29
Anticipated expiration: 2038-10-24
Also published as: CN109543686B

Abstract

本发明提供的一种基于自适应多阈值的字符识别预处理二值化方法，包括步骤：S1：获得原始图像中每个像素点的二值化标准阈值；S2：对原始图像进行优化，得到优化后的图像；S3：获取优化后图像的积分图数表；S4：计算原始图像的各像素点的二值化标准阈值；S5：获得原始图像中每个像素点的松弛因子ξ；S6：求每个像素点的二值化标准阈值与松弛因子的乘积，得到每个像素点的二值化松弛阈值；S7：运用二值化松弛阈值原始图像进行二值化处理；本发明解决移动终端字符识别应用中光照不均匀，环境不可控导致的识别效果不佳的问题，减小了计算松弛因子的时间开销，提高了对需进行字符识别的图像的二值化预处理的效率和精度。

Description

基于自适应多阈值的字符识别预处理二值化方法

技术领域

本发明涉及字符识别领域，具体涉及一种基于自适应多阈值的字符识别预处理二值化方法。

背景技术

随着移动互联网在社会生活各个层面的快速推进，对移动终端应用能快速而又准确的进行字符识别的需求越来越多。二值化是字符识别前不可或缺的预处理过程。二值化的效果直接决定了字符的分割、特征提取和模式识别的准确性。然而移动终端应用环境具有较大的不确定性，在移动环境下获取图像时通常不可避免的会受到灯光、人影或其他不同物体的阴影的影响。在这样的环境影响下，采集到的图像和与实际图像相比会有较大的差异。亮度不可控对待识别的图像二值化效果有较大的副作用，从而直接影响了字符识别的准确度。

二值化是以一定的规则将灰度图像分成背景和前景两个部分。由于在字符识别应用中的重要性，二值化方法得到了国内外学者的广泛研究，产生了许多方法。常用的方法有全局阈值法和局部阈值法。其中全局阈值法是整个图像只有一个阈值，包括直方图双峰法、最大类间方差法、最小误差阈值法等；局部阈值方法允许一张图像有多个阈值，包括阈值差值法、水线阈值法、基于小波的多阈值方法等。为解决相关应用问题，近年来在该领域产生了一些新的方法。段锁林等人提出了一种多窗口图像二值化算法,采用多窗口模板分别对图像进行简单二值化处理，对不同窗口处理下获得的二值图进行综合判断,最终确定每个像素点的值。从飞等人提出利用数学形态学理论，采用改进的Sauvola算法对非均匀光照图像进行二值化进行并行优化。李真等人使用改进的同态滤波和自适应灰度变换法相结合的方法对图像做增强处理，然后再使用OTSU算法对图像进行二值化。熊炜等人利用最小均值法灰度化和双边滤波去噪进行预处理，然后通过形态学闭操作估计出图像背景，最后采用增广路算法求得最优二值图像。吴锐等人提出了一种基于谱聚类的图像二值化方法。潘梅森根据SOFM的聚类确定图像第一阈值作为循环迭代的初始值，对整幅图像进行循环迭代得到第二阈值,使用第二阈值对原始图像进行二值化。国外对字符识别中的二值化也有较多的研究。Sezgin和Sankur提出对图像选定某一固定阈值，并将此阈值与各像素值进行比较来获得二值化图像的方法。日本学者大津提出如果前景和背景之间的类间方差越大，就说明构成图像的两个部分之间的差别越大，当部分目标被错分为背景或部分背景被错分为目标，都会导致两部分差别变小，当所取阈值的分割使类间方差最大时就意味着错分概率最小。

然而，以上这些固定阈值的算法往往不能很好的适应光照的变化。因此为处理文档光照不均，学者们提出了一些自适应的二值化方法，但大部分的现有算法对字符的二值化处理还是比较粗糙。而Derek Bradley首先把积分图方法引入到二值化计算中，提出以W×W为模板的矩形区域的二维平滑值来代替一维加权值，对光照不均的情况下图像的二值化取得了较大的突破，但其处理结果还是会产生字迹笔画断笔、字迹浓淡不均等问题，对移动终端所在的复杂应用环境的适应能力还有待改进。

因此，需要提出一种新的基于自适应多阈值的字符识别预处理二值化方法。

发明内容

有鉴于此，本发明的目的是提供一种基于自适应多阈值的字符识别预处理二值化方法，通过一定尺寸的滑窗来获取像素点的正常阈值，引入松弛因子来评价当前点的光照变化情况，并根据前置点的权重值计算综合确定前景划分的松弛阈值，解决移动终端字符识别应用中光照不均匀，环境不可控导致的识别效果不佳的问题，并通过优化的获取积分图的方法，减小了计算松弛因子的时间开销，提高了对需进行字符识别的图像的二值化预处理的效率和精度，降低了后续精确识别字符的开销，提高字符识别的精度。

本发明提供一种基于自适应多阈值的字符识别预处理二值化方法，包括步骤：

S1：获得原始图像中每个像素点的二值化标准阈值；所述原始图像为包含有字符图像的灰度图像；

S2：对原始图像进行优化，得到优化后的图像；

S3：获取优化后图像的积分图数表；

S4：根据积分图数表中像素点的积分图值，计算原始图像的各像素点的二值化标准阈值；

S5：根据各像素点的二值化标准阈值，获得原始图像中每个像素点的松弛因子ξ；

S6：求每个像素点的二值化标准阈值与松弛因子的乘积，得到每个像素点的二值化松弛阈值；

S7：将原始图像中的每个像素点的像素值与二值化松弛阈值进行大小比较，若像素值大于二值化松弛阈值，将该像素点值置0；若像素值小于或等于二值化松弛阈值，将该像素点像素值置255，得到用于经预处理后的二值化图像。

进一步，所述步骤S2包括在原始图像中的左侧和上侧分别新增像素值全为0的一列和一行像素点，得到优化后的图像。

进一步，所述步骤S3具体包括：

S31：在优化后的图像中，选取位置为(2，2)的点作为遍历起点，将遍历起点作为当前遍历点；其中，点的行和是位于该点左侧与该点在同一行内的所有点的像素值和；

S32：求当前遍历点(x,y)左侧第2个像素点(x-2,y)的行和与当前遍历点左侧第1个像素点(x-1,y)的像素点值的和，得到当前遍历点左侧第1个像素点(x-1,y)的行和；其中，点的行和是位于该点左侧与该点在同一行内的所有点的像素值和；

求当前遍历点(x,y)左侧第2个像素点(x-2,y)的行和与当前遍历点(x,y)左侧第1个像素点(x-1,y)的像素点值的和的计算公式为：

RowSum(x-1,y)＝RowSum(x-2,y)+image(x-1,y) (1)

其中，image(x-1,y)表示当前遍历点(x,y)左侧第1个像素点(x-1,y)的像素点值；RowSum(x-2,y)表示当前遍历点(x,y)左侧第2个像素点(x-2,y)的行和；RowSum(x-1,y)表示当前遍历点(x,y)左侧第1个像素点(x-1,y)的行和。

S33：求当前遍历点(x,y)上侧第1个像素点(x,y-1)的积分图值与当前遍历点左侧第1个像素点(x-1,y)的行和的和，得到当前遍历点的积分图值；

求当前遍历点上侧第1个像素点(x,y-1)的积分图值与当前遍历点左侧第1个像素点(x-1,y)的行和的和的计算公式为：

I(x,y)＝I(x,y-1)+RowSum(x-1,y) (2)

其中，I(x,y-1)表示当前遍历点上侧第1个像素点(x,y-1)的积分图值；I(x,y)表示当前遍历点(x,y)的积分图值；

S34：按照预先设定的遍历顺序规则，将当前遍历点移动到下一点，返回步骤S32；其中，所述遍历顺序规则为：

从上至下逐行遍历优化后的图像中原始图像对应位置的像素点；

在遍历奇数行像素点时，从左到右依次遍历该行的像素点；

在遍历偶数行像素点时，从右到左依次遍历该行的像素点；

S35：重复步骤S32至S34，直到优化后的图像中原始图像对应位置的每个像素点都被遍历。

进一步，所述步骤S4具体如下：

S41：将原始图像中的像素点分为正常像素点和边缘像素点；在原始图像中所述正常像素点为左侧、右侧、上侧和下侧的像素点个数均大于或等于H的像素点；所述边缘像素点为左侧、右侧、上侧和下侧中至少有一侧的像素点个数小于H的像素点；其中，H为奇数，且3≤H≤7；

S42：计算正常像素点的二值化标准阈值，具体如下：

在原始图像中，设置以正常像素点为中心的像素尺寸为H×H的滑窗；

计算滑窗覆盖的所有像素点像素值的均值，将该均值作为该正常像素点的二值化标准阈值；

S43：获得边缘像素点的二值化标准阈值，具体如下：

将与边缘像素点距离最近且不覆盖该边缘像素点的H×H滑窗覆盖的所有像素点像素值的均值作为该边缘像素点的二值化标准阈值；

边缘像素点与H×H的滑窗的距离是指边缘像素点与H×H的滑窗的中心点的距离。

进一步，所述步骤S42中计算滑窗覆盖的所有像素点像素值的均值的公式为：

其中，Avg(x,y)表示正常像素点(x，y)的滑窗覆盖的所有像素点像素值的均值；Sum(x,y)表示正常像素点(x，y)的滑窗覆盖的所有像素点像素值的和。

进一步，所述Sum(x,y)的计算公式为：

Sum(x,y)＝I(x-1,y-1)-I(x-1,y+1)-I(x+1，y-1)+I(x+1,y+1)(3-2)

其中，I(x-1,y-1)表示点(x-1，y-1)的积分图值；I(x-1,y+1)表示点(x-1,y+1)的积分图值；I(x+1，y-1)表示点(x+1，y-1)的积分图值；I(x+1,y+1)表示点(x+1,y+1)的积分图值。

进一步，所述步骤S5具体包括：

若在原始图像中当前像素点左侧无像素点，则当前像素点的松弛因子ξ＝1；

若在原始图像中当前像素点左侧至少有1个像素点，则选取当前像素点的影响像素点值带入松弛因子计算模型，计算当前像素点的松弛因子；

所述松弛因子计算模型为：

其中，ξ为当前像素点的松弛因子，n为当前像素点左侧影响像素点的总行数，1≤n≤3；C_i为当前像素点左侧第i列所有影响像素点二值化标准阈值的均值；λ_i为当前像素点左侧第i列影响像素点二值化标准阈值的均值的阈值权重；C为当前像素点的二值化标准阈值；

若在原始图像中当前像素点左侧有1个像素点，则n＝1，表示有1列的影响像素点，其中，第1列影响像素点包括当前像素点(x，y)的左邻点(x-1，y)；

若在原始图像中当前像素点左侧有2个像素点，则n＝2，表示有2列的影响像素点，其中，第1列影响像素点包括当前像素点(x，y)左侧第1个像素点(x-1，y)；第2列影响像素点包括当前像素点(x，y)左侧第2个像素点(x-2，y)；

若在原始图像中当前像素点左侧至少有3个像素点，则n＝3，表示有3列的影响像素点，其中，第1列影响像素点包括当前像素点(x，y)左侧第1个像素点(x-1，y)；第2列影响像素点包括当前像素点(x，y)左侧第2个像素点(x-2，y)；第3列影响像素点包括当前像素点(x，y)左侧第3个像素点(x-3，y)。

进一步，当n＝1时，若在原始图像中该左邻点(x-1，y)有上邻点(x-1，y-1)，则所述第1列影响像素点还包括像素点(x-1，y-1)；

当n＝2时，若在原始图像中当前像素点(x，y)左侧第2个像素点(x-2，y)有上邻点(x-2，y-1)，则所述第1列影响像素点还包括像素点(x-1，y-1)，所述第2列影响像素点还包括像素点(x-2，y-1)；

当n＝3时，若在原始图像中当前像素点(x，y)左侧第3个像素点(x-3，y)有上邻点(x-3，y-1)，则所述第1列影响像素点还包括像素点(x-1，y-1)，所述第2列影响像素点还包括像素点(x-2，y-1)，所述第3列影响像素点还包括像素点(x-3，y-1)。

进一步，当n＝1时，若在原始图像中该左邻点(x-1，y)有下邻点(x-1，y+1)，则所述第1列影响像素点还包括该像素点(x-1，y+1)；

当n＝2时，若在原始图像中当前像素点(x，y)左侧第2个像素点有下邻点(x-2，y+1)，则所述第1列影响像素点还包括像素点(x-1，y+1)，所述第2列影响像素点还包括像素点(x-2，y+1)；

当n＝3时，若在原始图像中当前像素点(x，y)左侧第3个像素点有下邻点(x-3，y+1)，则所述第1列影响像素点还包括像素点(x-1，y+1)，所述第2列影响像素点还包括像素点(x-2，y+1)，所述第3列影响像素点还包括像素点(x-3，y+1)。

进一步，当n＝1时，λ_i＝1。

当n≥2时，采用高斯函数对λ_i进行确定，具体如下：

采用高斯函数的一维形式，高斯函数的一维形式具体如下：

其中，μ是x的均值，σ是x的方差。

将当前像素点作为高斯函数(7-1)式的原点，即令(7-1)式中μ等于0，σ取1，将(7-1)式变化为

将当前像素点左侧每行的影响像素点中与当前像素点在同一行中的像素点按照其在(7-2)式的正态曲线的位置来分配权重，具体如下：

当n＝2时，λ₁为(7-2)式的正态曲线中μ取[-1,1]的分布概率；λ₂＝1-λ₁；

当n＝3时，λ₁为(7-2)式的正态曲线中μ取[-1,1]的分布概率λ₂为(7-2)式的正态曲线中μ取[-2,-1)∪(1,2]的分布概率；λ₃＝1-λ₁-λ₂。

本发明的有益效果：本发明通过一定尺寸的滑窗来获取像素点的正常阈值，引入松弛因子来评价当前点的光照变化情况，并根据前置点的权重值计算综合确定前景划分的松弛阈值，解决移动终端字符识别应用中光照不均匀，环境不可控导致的识别效果不佳的问题，并通过优化的获取积分图的方法，减小了计算松弛因子的时间开销，提高了对需进行字符识别的图像的二值化预处理的效率和精度，降低了后续精确识别字符的开销，提高字符识别的精度。

附图说明

下面结合附图和实施例对本发明作进一步描述：

图1为本发明的流程图；

图2为遍历顺序规则示意图；

图3为积分图的示意图；

图4为(7-2)式正态曲线的示意图；

图5为阴影为不规则图形的原始图像；

图6为采用固定阈值法对阴影不规则图形的图像进行字符识别预处理的二值化处理效果图；

图7为采用基本全局阈值法对阴影不规则图形的图像进行字符识别预处理的二值化处理效果图；

图8为采用Otsu方法对阴影不规则图形的图像进行字符识别预处理的二值化处理效果图；

图9为采用现有的积分图二值化法对阴影不规则图形的图像进行字符识别预处理的二值化处理效果图；

图10为本文方法对阴影不规则图形的图像进行字符识别预处理的二值化处理效果图；

图11为多层次的光照图像的原始图像；

图12为采用固定阈值法对多层次的光照图像进行字符识别预处理的二值化处理效果图；

图13为采用基本全局阈值法对多层次的光照图像进行字符识别预处理的二值化处理效果图；

图14为采用Otsu方法对多层次的光照图像进行字符识别预处理的二值化处理效果图；

图15为采用现有的积分图二值化法对多层次的光照图像进行字符识别预处理的二值化处理效果图；

图16为本文方法对多层次的光照图像进行字符识别预处理的二值化处理效果图；

图17为线性光线变化图像的原始图像；

图18为采用固定阈值法对线性光线变化图像进行字符识别预处理的二值化处理效果图；

图19为采用基本全局阈值法对线性光线变化图像进行字符识别预处理的二值化处理效果图；

图20为采用Otsu方法对线性光线变化图像进行字符识别预处理的二值化处理效果图；

图21为采用现有的积分图二值化法对线性光线变化图像进行字符识别预处理的二值化处理效果图；

图22为本文方法对线性光线变化图像进行字符识别预处理的二值化处理效果图；

具体实施方式

如图1所示，本发明提供的一种基于自适应多阈值的字符识别预处理二值化方法，包括步骤：

S2：对原始图像进行优化，得到优化后的图像；

S3：获取优化后图像的积分图数表；

S6：求每个像素点的二值化标准阈值与松弛因子的乘积，得到每个像素点的二值化松弛阈值；所述二值化松弛阈值的计算公式如下：

TS＝C*ξ (5)

其中，ξ为当前像素点的松弛因子，T为当前像素点的二值化标准阈值，TS为当前像素点的二值化松弛阈值。

S7：将原始图像中的每个像素点的像素值与二值化松弛阈值进行大小比较，若像素值大于二值化松弛阈值，将该像素点值置0；若像素值小于或等于二值化松弛阈值，将该像素点像素值置255，得到用于经预处理后的二值化图像。本实施例中，经预处理后的二值化图像用于后续的字符识别，有效排除了光照对原始图像的影响，降低了后续根据该经预处理后的二值化图像精确识别字符的开销，提高字符识别的精度。经预处理后的二值化图像并未进行字符识别，只是在进行字符识别之前先排除光照对原始图像的影响，以提高后续字符识别的精度和效率。本实施例中，如果当前像素点比当前影响像素点的整体光照情况更亮，则提升正常阈值ξ；反之，则在二值化松弛阈值的基础上降低ξ以适应相对更暗的光照环境。通过上述方法，引入松弛因子来评价当前点的光照变化情况，并根据前置点的权重值计算综合确定前景划分的松弛阈值，解决移动终端字符识别应用中光照不均匀，环境不可控导致的识别效果不佳的问题，提高了对需进行字符识别的图像的二值化预处理的效率和精度，降低了后续精确识别字符的开销，提高字符识别的精度。

本实施例中，所述步骤S2包括在原始图像中的左侧和上侧分别新增像素值全为0的一列和一行像素点，得到优化后的图像。

积分图是指在原图像的基础上衍生出的一个新图像。新图像的像素值是取原图像左上侧的全部像素值的累加和，可用(6)式表示。整体思路是先计算整幅图像的累加表。然后再一次循环通过加单的加减获得以某个像素为中心的累加值。

其中，I(x_n,y_n)表示像素点(x_n,y_n)的积分图值，image(x,y)表示像素点(x,y)的像素值。

根据积分图的定义可知，积分图反应的是原图中当前位置左上角所有像素之和，这里是的累加和是不包括这个像素点像素本身的，则原始图像中的第一行和第1列的左上角无其他像素点，则不能计算原始图像中的第一行和第1列的像素点的积分图值。利用步骤S2对原始图像进行优化，则对于原始图像的第一行和第1列的所有像素点，其对应位置的积分图像素值全为0，即对应在优化后的图像中I(2,y)＝0，I(x,2)＝0，方便了后续在优化后的图像中对原始图像中各像素点积分图值的计算。其中，I(2,y)表示在优化后的图像中像素点(2,y)的积分图值，即优化后的图像中第2行像素点的积分图值；I(x,2)＝0，表示在优化后的图像中像素点(2,y)的积分图值，即优化后的图像中第2列像素点的积分图值；

本实施例中，所述步骤S3具体包括：

S31：在优化后的图像中，选取位置为(2，2)的点作为遍历起点，将遍历起点作为当前遍历点；其中，点的行和是位于该点左侧与该点在同一行内的所有点的像素值和；由于步骤S2通过在原始图像的第一行和第1列增加全0的像素点，则遍历迭代求优化后的图像中原始图像对应位置像素点积分图值时，针对于遍历起点(2，2)，其积分图值为I(2,2)＝0。

RowSum(x-1,y)＝RowSum(x-2,y)+image(x-1,y) (1)

I(x,y)＝I(x,y-1)+RowSum(x-1,y) (2)

S34：按照预先设定的遍历顺序规则，将当前遍历点移动到下一点，返回步骤S32；其中，如图2所示，所述遍历顺序规则为：

从上至下逐行遍历优化后的图像中原始图像对应位置的像素点，即排除优化后的图像中第一行和第1列的像素点；

在遍历奇数行像素点时，从左到右依次遍历该行的像素点；本实施例中，当遍历到当前奇数行的最右侧像素点时，将该最右侧像素点下侧的第一个像素点，作为下一遍行的起始遍历点；

在遍历偶数行像素点时，从右到左依次遍历该行的像素点；本实施例中，当遍历到当前偶数行的最左侧像素点时，将该最左侧像素点下侧的第一个像素点，作为下一遍行的起始遍历点；图2中带箭头的线表示遍历顺序。

S35：重复步骤S32至S34，直到优化后的图像中原始图像对应位置的每个像素点都被遍历。本实施例中，利用(1)式和(2)式，通过累加迭代得到各像素点的积分图值，避免了在求各像素点的积分图值时，对像素点左侧和上侧的像素点值重复积分，降低了时间复杂度，减小了时间开销。

本实施例中，所述步骤S4具体如下：

S41：将原始图像中的像素点分为正常像素点和边缘像素点；在原始图像中所述正常像素点为左侧、右侧、上侧和下侧的像素点个数均大于或等于H的像素点；所述边缘像素点为左侧、右侧、上侧和下侧中至少有一侧的像素点个数小于H的像素点；其中，H为奇数，且3≤H≤7；本实施例中，像素点的左侧和右侧分别是指与像素点在图像同一行的左侧和右侧；像素点的上侧和下侧分别是指与像素点在图像同一列的上侧和下侧；

S42：计算正常像素点的二值化标准阈值，具体如下：

S43：获得边缘像素点的二值化标准阈值，具体如下：

边缘像素点与H×H的滑窗的距离是指边缘像素点与H×H的滑窗的中心点的距离。本实施例中，考虑识别字符的精度，将H取3。

本实施例中，所述步骤S42中计算滑窗覆盖的所有像素点像素值的均值的公式为：

本实施例中，在积分图的辅助下，可以不用再次扫描图像即可计算任意区域的像素值和，减小了求原始图像中任意区域的像素值和的时间开销。如图3所示，设点(u,v)、(x,v)、(u,y)、(x,y)四个点的积分图值分别为I(u,v)、I(x,v)、I(u,y)、I(x,y)，则区域D的像素值和Sum(D)的计算公式为

Sum(D)＝[Sum(A)+Sum(B)+Sum(C)+Sum(D)]-[Sum(A)+Sum(B)]-[(Sum(A)+Sum(C)]+Sum(A)

＝I(u,v)-I(x,v)-I(u,y)+I(x,y) (3-3)

其中，Sum(D)、Sum(A)、Sum(B)和Sum(C)分别表示图3中区域D、区域A、区域B和区域C的像素值和，I(u,v)、I(x,v)、I(u,y)和I(x,y)分别表示图3中像素点(u,v)、(x,v)、(u,y)和(x,y)的积分图值。

根据(3-3)可得Sum(x,y)的计算公式，所述Sum(x,y)的计算公式为：

Sum(x,y)＝I(x-1,y-1)-I(x-1,y+1)-I(x+1，y-1)+I(x+1,y+1) (3-2)

其中，I(x-1,y-1)表示点(x-1，y-1)的积分图值，即正常像素点(x，y)的滑窗的左上点的积分图值；I(x-1,y+1)表示点(x-1,y+1)的积分图值，即正常像素点(x，y)的滑窗的左下点的积分图值；I(x+1，y-1)表示点(x+1，y-1)的积分图值，即正常像素点(x，y)的滑窗的右上点的积分图值；I(x+1,y+1)表示点(x+1,y+1)的积分图值，即正常像素点(x，y)的滑窗的右下点的积分图值。

本实施例中，所述步骤S5具体包括：

所述松弛因子计算模型为：

其中，ξ为当前像素点的松弛因子，n为当前像素点左侧影响像素点的总行数，1≤n≤3；C_i为当前像素点左侧第i列所有影响像素点二值化标准阈值的均值，所述影响像素点二值化标准阈值的均值为影响像素点二值化标准阈值的简单算术平均数；λ_i为当前像素点左侧第i列影响像素点二值化标准阈值的均值的阈值权重；C为当前像素点的二值化标准阈值；

若在原始图像中当前像素点左侧有1个像素点，则n＝1，表示有1列的影响像素点，其中，第1列影响像素点包括当前像素点(x，y)的左邻点(x-1，y)；则C₁为像素点(x-1，y)的二值化标准阈值C(x-1，y)。

若在原始图像中当前像素点左侧有2个像素点，则n＝2，表示有2列的影响像素点，其中，第1列影响像素点包括当前像素点(x，y)左侧第1个像素点(x-1，y)；第2列影响像素点包括当前像素点(x，y)左侧第2个像素点(x-2，y)；则C₁为像素点(x-1，y)的二值化标准阈值C(x-1，y)；C₂为像素点(x-2，y)的二值化标准阈值C(x-2，y)。其中，所述影响像素点表示其亮度对判断当前像素点有影响的像素点。

若在原始图像中当前像素点左侧至少有3个像素点，则n＝3，表示有3列的影响像素点，其中，第1列影响像素点包括当前像素点(x，y)左侧第1个像素点(x-1，y)；第2列影响像素点包括当前像素点(x，y)左侧第2个像素点(x-2，y)；第3列影响像素点包括当前像素点(x，y)左侧第3个像素点(x-3，y)；则C₁为像素点(x-1，y)的二值化标准阈值C(x-1，y)；C₂为像素点(x-2，y)的二值化标准阈值C(x-2，y)；C₃为像素点(x-3，y)的二值化标准阈值C(x-3，y)。此时只考虑当前像素点左侧与当前像素点在同一行的影响像素点亮度对判断当前像素点是否为字符像素点的影响。

进一步，当n＝1时，若在原始图像中该左邻点(x-1，y)有上邻点(x-1，y-1)，则所述第1列影响像素点还包括像素点(x-1，y-1)；则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y-1)表示像素点(x-1,y-1)的二值化标准阈值。

当n＝2时，若在原始图像中当前像素点(x，y)左侧第2个像素点(x-2，y)有上邻点(x-2，y-1)，则所述第1列影响像素点还包括像素点(x-1，y-1)，所述第2列影响像素点还包括像素点(x-2，y-1)；则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y-1)表示像素点(x-1,y-1)的二值化标准阈值，C(x-2,y)表示像素点(x-2，y)的二值化标准阈值，C(x-2,y-1)表示像素点(x-2,y-1)的二值化标准阈值。

当n＝3时，若在原始图像中当前像素点(x，y)左侧第3个像素点(x-3，y)有上邻点(x-3，y-1)，则所述第1列影响像素点还包括像素点(x-1，y-1)，所述第2列影响像素点还包括像素点(x-2，y-1)，所述第3列影响像素点还包括像素点(x-3，y-1)；则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y-1)表示像素点(x-1,y-1)的二值化标准阈值，C(x-2,y)表示像素点(x-2，y)的二值化标准阈值，C(x-2,y-1)表示像素点(x-2,y-1)的二值化标准阈值，C(x-3,y)表示像素点(x-3，y)的二值化标准阈值，C(x-3,y-1)表示像素点(x-3,y-1)的二值化标准阈值。此时考虑到当前像素点左侧与当前像素点在同一行以及位于当前像素点上侧第一行的影响像素点亮度对判断当前像素点是否为字符像素点的影响，增加了影响像素点在行方向上的维度，提高了松弛因子衡量衡量当前像素点受光照影响的精度。

进一步，当n＝1时，若在原始图像中该左邻点(x-1，y)有下邻点(x-1，y+1)，则所述第1列影响像素点还包括该像素点(x-1，y+1)；此时出现两种情况：情况1.1：在原始图像中该左邻点(x-1，y)无上邻点，则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y+1)表示像素点(x-1,y+1)的二值化标准阈值；情况1.2：在原始图像中该左邻点(x-1，y)有上邻点(x-1，y-1)，则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y+1)表示像素点(x-1,y+1)的二值化标准阈值，C(x-1,y-1)表示像素点(x-1,y-1)的二值化标准阈值；

当n＝2时，若在原始图像中当前像素点(x，y)左侧第2个像素点有下邻点(x-2，y+1)，则所述第1列影响像素点还包括像素点(x-1，y+1)，所述第2列影响像素点还包括像素点(x-2，y+1)；此时出现两种情况：情况2.1：在原始图像中当前像素点(x，y)左侧第2个像素点(x-2，y)无上邻点，则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y+1)表示像素点(x-1,y+1)的二值化标准阈值，C(x-2,y)表示像素点(x-2，y)的二值化标准阈值，C(x-2,y+1)表示像素点(x-2,y+1)的二值化标准阈值；情况2.2：在原始图像中当前像素点(x，y)左侧第2个像素点(x-2，y)有上邻点(x-2，y-1)，则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y+1)表示像素点(x-1,y+1)的二值化标准阈值，C(x-2,y)表示像素点(x-2，y)的二值化标准阈值，C(x-2,y+1)表示像素点(x-2,y+1)的二值化标准阈值，C(x-1,y-1)表示像素点(x-1,y-1)的二值化标准阈值，C(x-2,y-1)表示像素点(x-2,y-1)的二值化标准阈值；

当n＝3时，若在原始图像中当前像素点(x，y)左侧第3个像素点有下邻点(x-3，y+1)，则所述第1列影响像素点还包括像素点(x-1，y+1)，所述第2列影响像素点还包括像素点(x-2，y+1)，所述第3列影响像素点还包括像素点(x-3，y+1)；此时出现两种情况：情况3.1：在原始图像中当前像素点第3个像素点(x-3，y)无上邻点，则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y+1)表示像素点(x-1,y+1)的二值化标准阈值，C(x-2,y)表示像素点(x-2，y)的二值化标准阈值，C(x-2,y+1)表示像素点(x-2,y+1)的二值化标准阈值，C(x-3,y)表示像素点(x-2，y)的二值化标准阈值，C(x-3,y+1)表示像素点(x-3,y+1)的二值化标准阈值；情况3.2：在原始图像中当前像素点(x，y)左侧第3个像素点(x-3，y)有上邻点

(x-3，y-1)，则其中，C(x-1,y)表示像素点(x-1，y)的二值化标准阈值，C(x-1,y+1)表示像素点(x-1,y+1)的二值化标准阈值，C(x-2,y)表示像素点(x-2，y)的二值化标准阈值，C(x-2,y+1)表示像素点(x-2,y+1)的二值化标准阈值，C(x-1,y-1)表示像素点(x-1,y-1)的二值化标准阈值，C(x-2,y-1)表示像素点(x-2,y-1)的二值化标准阈值；C(x-3,y)表示像素点(x-3，y)的二值化标准阈值，C(x-3,y+1)表示像素点(x-3,y+1)的二值化标准阈值，C(x-3,y-1)表示像素点(x-3,y-1)的二值化标准阈值。情况1.1、2.1和3.1考虑到当前像素点左侧与当前像素点在同一行以及位于当前像素点下侧第一行的影响像素点亮度对判断当前像素点是否为字符像素点的影响，增加了影响像素点在行方向上的维度，提高了松弛因子衡量衡量当前像素点受光照影响的精度。情况1.2、2.2和3.2考虑到当前像素点左侧与当前像素点在同一行、位于当前像素点上侧第一行以及位于当前像素点下侧第一行的影响像素点亮度对判断当前像素点是否为字符像素点的影响，考虑到影响像素点在行方向上的三行维度的影响，避免片面参考局部区域的亮度影响而使整个松弛因子衡量精度降低，提高了松弛因子衡量衡量当前像素点受光照影响的精度。

(4-1)式中λ_i为当前像素点左侧第i列影响像素点二值化标准阈值的均值的阈值权重，用于衡量当前像素点左侧第i列影响像素点的亮度对当前像素点的影响程度的大小，可通过采集样本图像进行统计估计，根据经验设定，采用泊松分布获得，采用二项分布获得或采用正太分布获得。

本实施例中，当n＝1时，λ_i＝1。

当n≥2时，由于图像是连续的，越靠近当前像素点的点集，与当前像素点的光照相关性越强，综合考虑，本文采用高斯函数对λ_i进行确定，具体如下：

采用高斯函数的一维形式，高斯函数的一维形式具体如下：

其中，μ是x的均值，σ是x的方差。

本文方法中使用当前像素点的左侧每行的影响像素点的二值化标准阈值评估光照变化情况，并获取当前像素点的松弛阈值，故计算平均值的时候，中当前像素点就是高斯函数的原点，即令(7-1)中μ等于0，σ按照标准正态分布假设取1，将(7-1)式变化为

所述(7-2)式即为λ_i的分布函数。

当n＝2时，λ₁为(7-2)式的正态曲线中μ取[-1,1]的分布概率，为了方便计算将λ₁四舍五入取0.7；λ₂＝1-λ₁＝0.3；。

如图4所示，当n＝3时，λ₁为(7-2)式的正态曲线中μ取[-1,1]的分布概率，为了方便计算将λ₁四舍五入取0.68；λ₂为(7-2)式的正态曲线中μ取[-2,-1)∪(1,2]的分布概率，为了方便计算将λ₂四舍五入取0.27；λ₃＝1-λ₁-λ₂＝0.05。

对本文方法进行分析，具体如下：

为了证明本文算法在移动终端环境下字符识别的效果，使用Lenovo ZUK Z2Pro的移动终端设备在不规则阴影、多层次光照、线性光线变化等实际应用环境下采集图像。在Android操作系统中编写程序进行文字识别精度和速度的验证。图像的二值化处理算法采用NDK配合JNI模式用C++语言进行实现。统一ct OCR识别引擎的API获得文字识别的结果。Lenovo ZUK Z2Pro的配置的CPU为四核高通骁龙820(MSM8996)，主频是2.15GHz，带高通Adreno530的GPU，RAM容量为6GB。

采用固定阈值法、基本全局阈值法、Otsu方法、现有的积分图二值化法、本文方法分别对阴影为不规则图形的图像、多层次的光照图像和线性光线变化图像进行字符识别预处理的二值化处理。其中，固定阈值法中固定阈值T＝128，现有的积分图二值化法为文献(Derek Bradley,Gerhard Roth.Adaptive Thresholding using the Integral graph[J].Journal of Graphics Gpu&Game Tools,2007,12(2):13-21.)记载的算法。

其中，图5至图10分别为阴影为不规则图形的原始图像(灰度图)、采用固定阈值法、基本全局阈值法、Otsu方法、现有的积分图二值化法和本文方法对阴影为不规则图形的图像进行字符识别预处理的二值化处理效果图；

其中，图11至图16分别为多层次的光照图像的原始图像(灰度图)、采用固定阈值法、基本全局阈值法、Otsu方法、现有的积分图二值化法和本文方法对多层次的光照图像进行字符识别预处理的二值化处理效果图；

其中，图17至图22分别为线性光线变化图像的原始图像(灰度图)、采用固定阈值法、基本全局阈值法、Otsu方法、现有的积分图二值化法和本文方法对线性光线变化图像进行字符识别预处理的二值化处理效果图；

从处理结果的视觉效果方面来看，由于移动环境下光线的各种不同变化，使用常规的二值化方法都不能获得满意的效果。如在其中图5至图10用手机拍摄菜单进行字符识别的应用场景下，固定阈值法、基本全局阈值法、Otsu方法等都是针对图像全局使用的单阈值，由于光线的不规则，这些方法都不可避免的把不规则阴影当成前景，或者把有用的文字图像信息过滤掉。现有的积分图二值化法和本文的方法由于都是使用的多阈值，能较好的提取各种环境下的文字信息。但由于现有的积分图二值化法获取区域阈值时没有考虑周边像素点的亮度变化情况，处理结果中的文字部分容易出现细微的断笔，尤其是对其中图11至图16所示的多层次光照和其中图17至图22所示的线性光线变化环境下的文字信息的提取不够精细，多层次光照环境下容易对背景噪音的去除不是很理想。本文的方法使用了多阈值来自适应不同的应用场景，同时考虑到了相连像素点的光线变化关系，获得了较上述方法更好的效果。

使用Gatos(参见文献：B.Gatos,I.Pratikakis,S.Perantonis.Adaptivedegraded document image binarization.Pattern Recognit.2006,39(3)：317–327.)提出的二值化效果评价方法，在像素级别上对二值化前景和背景判断的准确性进行判断，使用召回率R和准确率P两个指标来定量分析。用C_tp表示算法得到的前景像素点分割结果与真实前景对象相符的像素点个数；C_fn表示本该为目标物体的像素而被错分割为背景部分的像素点个数；C_fp表示本该为背景部分而被错分割为目标物体的像素点个数。则算法的召回率和准确率的计算公式分别用(8-1)式和(8-2)式计算。

分别经过上述方法在不同环境下结果图像的像素点按照前景和背景判定进行计数，然后分别定量计算求取平均值，可以得到不同算法召回率和准确率比较结果如表1所示。

表1不同二值化算法的召回率和准确率比较

同光照条件下的图片使用不同的二值化算法处理的后的结果被送往OCR系统，然后将OCR识别的结果和原文字比较。对二值化后的图像统一调用。Tesseract 4.0的原生OCR识别引擎，从文字识别的准确率来分析不同算法的在实际环境中应用效果区别，如表2所示。

表2结果图像在Tesseract OCR引擎中的识别准确率

从统计结果可以看出，在适应移动终端应用中的不同环境方面，本文的方法较优。现有的积分图二值化法的结果与本文算法结果最为接近，但是其结果图像的背景仍然存在部分噪声，尤其体现在现有的积分图二值化法的处理结果会产生字迹笔画断笔、字迹浓淡不均等问题。而其他常规的二值化方法，尤其是全局阈值的二值化方法，对移动终端所在的复杂应用环境的适应能力不如本文所采用的算法。

通过上述实验分析可得：本文提出一种基于积分图快速计算方法的多阈值自适应二值化方法来解决移动终端字符识别应用中光照不均匀，环境不可控导致的识别效果不佳的问题。该方法通过一定尺度的滑窗来获取像素点的正常阈值，引入松弛因子来评价当前点的光照变化情况，并根据前置点的权重值计算综合确定前景划分的松弛阈值，在不规则阴影、多层次光照、线性光线变化等环境下识别字符预处理的准确率，高于其他预处理算法。试验结果表明本文的算法在移动终端环境的复杂光照背景下能取得相对较好的字符识别效果，具有较强的环境自适应能力和鲁棒性，能满足移动终端字符识别应用的图像预处理要求。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于自适应多阈值的字符识别预处理二值化方法，其特征在于：包括步骤：

S2：对原始图像进行优化，得到优化后的图像；

S3：获取优化后图像的积分图数表；

2.根据权利要求1所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：所述步骤S2包括在原始图像中的左侧和上侧分别新增像素值全为0的一列和一行像素点，得到优化后的图像。

3.根据权利要求2所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：所述步骤S3具体包括：

S32：求当前遍历点(x,y)左侧第2个像素点(x-2,y)的行和与当前遍历点左侧第1个像素点(x-1,y)的像素点值的和，得到当前遍历点左侧第1个像素点(x-1，y)的行和；其中，点的行和是位于该点左侧与该点在同一行内的所有点的像素值和；

求当前遍历点(x，y)左侧第2个像素点(x-2，y)的行和与当前遍历点(x，y)左侧第1个像素点(x-1，y)的像素点值的和的计算公式为：

RowSum(x-1，y)＝RowSum(x-2，y)+image(x-1，y) (1)

其中，image(x-1，y)表示当前遍历点(x，y)左侧第1个像素点(x-1，y)的像素点值；RowSum(x-2，y)表示当前遍历点(x，y)左侧第2个像素点(x-2，y)的行和；RowSum(x-1，y)表示当前遍历点(x，y)左侧第1个像素点(x-1，y)的行和。

S33：求当前遍历点(x，y)上侧第1个像素点(x，y-1)的积分图值与当前遍历点左侧第1个像素点(x-1，y)的行和的和，得到当前遍历点的积分图值；

求当前遍历点上侧第1个像素点(x，y-1)的积分图值与当前遍历点左侧第1个像素点(x-1，y)的行和的和的计算公式为：

I(x，y)＝I(x，y-1)+RowSum(x-1，y) (2)

其中，I(x，y-1)表示当前遍历点上侧第1个像素点(x，y-1)的积分图值；I(x，y)表示当前遍历点(x，y)的积分图值；

在遍历奇数行像素点时，从左到右依次遍历该行的像素点；

在遍历偶数行像素点时，从右到左依次遍历该行的像素点；

4.根据权利要求3所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：所述步骤S4具体如下：

S42：计算正常像素点的二值化标准阈值，具体如下：

S43：获得边缘像素点的二值化标准阈值，具体如下：

5.根据权利要求4所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：所述步骤S42中计算滑窗覆盖的所有像素点像素值的均值的公式为：

其中，Avg(x，y)表示正常像素点(x，y)的滑窗覆盖的所有像素点像素值的均值；Sum(x，y)表示正常像素点(x，y)的滑窗覆盖的所有像素点像素值的和。

6.根据权利要求5所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：所述Sum(x，y)的计算公式为：

Sum(x，y)＝I(x-1，y-1)-I(x-1，y+1)-I(x+1，y-1)+I(x+1，y+1) (3-2)

其中，I(x-1，y-1)表示点(x-1，y-1)的积分图值；I(x-1，y+1)表示点(x-1，y+1)的积分图值；I(x+1，y-1)表示点(x+1，y-1)的积分图值；I(x+1，y+1)表示点(x+1，y+1)的积分图值。

7.根据权利要求1所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：所述步骤S5具体包括：

所述松弛因子计算模型为：

8.根据权利要求7所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：当n＝1时，若在原始图像中该左邻点(x-1，y)有上邻点(x-1，y-1)，则所述第1列影响像素点还包括像素点(x-1，y-1)；

9.根据权利要求8所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：当n＝1时，若在原始图像中该左邻点(x-1，y)有下邻点(x-1，y+1)，则所述第1列影响像素点还包括该像素点(x-1，y+1)；

10.根据权利要求7所述基于自适应多阈值的字符识别预处理二值化方法，其特征在于：当n＝1时，λ_i＝1。

当n≥2时，采用高斯函数对λ_i进行确定，具体如下：

采用高斯函数的一维形式，高斯函数的一维形式具体如下：

其中，μ是x的均值，σ是x的方差。