CN103761520A

CN103761520A - 基于笔划宽度的文档图像无参二值化方法

Info

Publication number: CN103761520A
Application number: CN201310654770.3A
Authority: CN
Inventors: 陈强; 陆圣陶; 汪青; 王玉萍
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2013-12-05
Filing date: 2013-12-05
Publication date: 2014-04-30
Anticipated expiration: 2033-12-05
Also published as: CN103761520B

Abstract

本发明公开了一种基于笔划宽度的文档图像无参二值化方法，属于图像处理技术领域。该方法首先对输入的文档图像进行去噪预处理，并通过图像的灰度范围内的各个灰度等级得到一系列的二值化结果，然后通过给定的笔划宽度生成该笔划宽度下的最优二值化结果，最后通过厚笔划像素在目标像素中所占的比重变化确定最佳的笔划宽度和最终的二值化结果。实验结果表明，本发明中所给出的二值化算法在不需要设置参数的情况下能够自动的二值化文档图像，且二值化的结果具有较高的鲁棒性和分割精度，对文档的智能化自动处理具有重要意义。

Description

基于笔划宽度的文档图像无参二值化方法

技术领域

本发明涉及一种图像二值化处理的方法，特别是一种基于笔划宽度的文档图像无参全自动二值化方法。

背景技术

文档图像二值化对于文档的自动化分析具有重要的意义，因为二值化效果的好坏将直接决定后续的识别过程。文档图像二值化是一个经典而富有挑战性的问题，目前已出现了很多种不同的方法，其中基于阈值的方法可以分为两类：全局和局部阈值。其中全局阈值方法以Otsu方法为主，包括各种对该方法的改进，如修改判别准则，着重强调目标区域的灰度同质性，而忽略背景区域的多样性等。

笔划作为文档图像中的重要因素，对于文档图像的二值化具有重要影响。如利用笔划宽度的一致性，出现了几种文档图像二值化方法，主要包括：（1）利用形状信息生成全局阈值，（2）利用笔划宽度自适应地生成局部阈值，（3）基于笔划模型从灰度文档图像中抽取字符。

现有的基于笔划宽度的文档图像二值化方法存在如下缺陷：（1）笔划的宽度估计方法不具有旋转不变性，或需要事先人为设定；（2）需要训练，不是无监督的方法；（3）是有参的方法，需要针对不同的图像设置不同的参数。

发明内容

本发明的目的在于提供一种基于笔划宽度的文档图像无参全自动二值化方法。

实现本发明的目的的技术解决方案为：一种基于笔划宽度的文档图像无参二值化方法，包括以下步骤：

步骤1、对文档图像进行采集；

步骤2、采用高斯滤波对采集到的文档图像进行去噪处理；其中高斯滤波的公式为：

g (x, y) = \frac{1}{{2 πσ}^{2}} e^{- (x^{2} + y^{2}) / ({2 σ}^{2})}

式中，g(x,y)为高斯滤波函数，(x,y)为图像坐标，σ为标准偏差。高斯滤波的窗口大小优选为3×3，标准偏差σ优选为1。

步骤3、根据文档图像所在的灰度范围生成二值化结果；具体为：

采用文档图像的阈值区间（I_min，I_max）内的每个灰度值生成对应的二值化结果，其中I_min和I_max分别表示文档图像的灰度最小值和最大值。

步骤4、根据笔划半径选择最佳的二值化结果，所述初始笔划半径为1；具体为：

步骤4-1、确定文本和背景像素的个数，Nt和Nb，具体过程如下：

（1）采用形态学闭运算得到厚目标区域TcO_k：

{TcO}_{k} = (B_{i} &CirclePlus; S_{k}) &CircleTimes; S_{k}, k = 1,2

其中

和

分别表示形态学膨胀和腐蚀操作，S_k表示半径为w+k-1的圆盘形结构元，w为笔划半径，B_i为二值化文档图像；

（2）确定细目标区域TnO_k，所用公式为：

{TnO}_{k} = B_{i} \ {TcO}_{k} = {x : x &Element; B_{i}, x &NotElement; {TcO}_{k}}, k = 1,2

文本区域Tr为细目标区域TnO₁与厚目标限制区域Mo相连的区域，其中Mo=M∩TnO₂={x:x∈M,x∈TnO₂}，模板

背景区域为

Br = B_{i} \ Tr = {x : x &Element; B_{i}, x &NotElement; Tr},

则Nt和Nb分别为文本区域Tr和背景区域Br内的像素个数；

步骤4-2、确定文本和背景像素个数的差异ΔN_i，所述公式为：

ΔN_i=Nt_i-Nb_i，i的取值为[1，I_max-I_min)；

步骤4-3、取最大差异ΔN对应的文档图像作为当前笔划宽度下的二值化结果输出。

步骤5、确定厚笔划像素占目标笔划像素比重的变化量Δr，所述厚笔划是指笔划半径大于当前笔划半径的笔划；具体步骤为：

步骤5-1、确定厚笔划像素在目标像素中所占的比重

其中nFt_j和nF_j分别表示步骤4输出二值化结果中厚笔划像素和目标像素的个数；

步骤5-2、确定厚笔划像素占目标笔划像素比重的变化量Δr_j：

Δr_j=r_j-r_j-1，j的取值为[1，w_max)。

步骤6、对当前比划半径进行判断，如果当前笔划半径小于最大笔划半径w_max，则笔划半径加1，然后转到步骤4，否则执行步骤7；

步骤7、取最大变化量Δr所对应的笔划宽度和二值化结果作为最终的输出。

本发明与现有技术相比，其显著优点为：(1)本发明的基于笔划宽度的文档图像无参二值化方法中，笔划宽度的估计具有旋转不变性；（2）本发明给出的方法不需要训练，是无监督的方法；（3）本发明是无参的，不需要设置参数。

下面结合附图对本发明作进一步详细描述。

附图说明

图1是本发明基于笔划宽度的文档图像无参二值化方法的流程图。

图2是针对给定的笔划半径选择最佳的二值化结果的流程图。

图3是计算厚笔划像素占目标笔划像素比重的变化量的流程图。

图4是一幅实际受污染的文档图像。

图5是采用阈值80得到的二值化结果图。

图6是在给定笔划半径为4时所对应的文本区域。

图7是在给定笔划半径为4时所对应的背景区域。

图8是给定笔划半径为4时文本和背景像素个数差异随阈值的变化曲线图。

图9是厚笔划像素占目标笔划像素比重随给定笔划半径变化的情况图。

具体实施方式

结合图1，本发明的基于HD-OCT视网膜图像的自动脉络膜层分割方法包括以下步骤：

步骤1、对文档图像进行采集；

g (x, y) = \frac{1}{{2 πσ}^{2}} e^{- (x^{2} + y^{2}) / ({2 σ}^{2})}

式中，g(x,y)为高斯滤波函数，(x,y)为图像坐标，标准偏差σ为1，高斯滤波的窗口大小为3×3。

（1）采用形态学闭运算得到厚目标区域TcO_k：

{TcO}_{k} = (B_{i} &CirclePlus; S_{k}) &CircleTimes; S_{k}, k = 1,2

其中和

（2）确定细目标区域TnO_k，所用公式为：

{TnO}_{k} = B_{i} \ {TcO}_{k} = {x : x &Element; B_{i}, x &NotElement; {TcO}_{k}}, k = 1,2

背景区域为

Br = B_{i} \ Tr = {x : x &Element; B_{i}, x &NotElement; Tr},

则Nt和Nb分别为文本区域Tr和背景区域Br内的像素个数；

ΔN_i=Nt_i-Nb_i，i的取值为[1，I_max-I_min)；

步骤5-1、确定厚笔划像素在目标像素中所占的比重

其中nFt_j和nF_j分别表示厚笔划像素和目标像素在步骤4输出二值化结果中的个数；

Δr_j=r_j-r_j-1，j的取值为[1，w_max)。

下面结合实施例对本发明做进一步详细的说明：

本系统发明以文档图像作为输入，采用图像处理手段对输入图像中的文本区域进行自动分割。

本实施例的流程如图1所示，图4给出了一幅实际受污染的文档图像。为了便于后续的处理，首先对输入图像进行去噪处理，然后采用文档图像的阈值区间内的每个灰度值生成对应的二值化结果，图5为采用阈值80得到的二值化结果。针对给定的笔划半径，确定每幅二值化图像中所对应的文本区域和背景区域。如图6和图7分别为图5在给定笔划半径为4时所对应的文本区域和背景区域，通过统计图6和图7中的目标（及黑色）像素个数就得到文本和背景像素的个数，从而可以计算得到文本和背景像素个数的差异。取最大差异ΔN对应的文档图像作为当前给定笔划宽度下的二值化结果输出。图8为当给定笔划半径为4时文本和背景像素个数差异随阈值的变化曲线图，图中给出了7幅不同阈值处（由曲线上的圆圈标记）所对应的二值化结果。从图8可知：对于图4，在给定笔划半径为4时，阈值28所对应的二值化结果能够得到最大的文本和背景像素个数差ΔN，即当前给定笔划半径下的输出二值化结果。然后计算每个给定笔划半径下输出二值化图像中厚笔划（笔划半径大于给定笔划半径）像素占目标笔划像素比重的变化量Δr。图9为厚笔划像素占目标笔划像素比重随给定笔划半径变化的情况图，图中给出了所有9个给定笔划半径下所对应的比重值和最佳的二值化结果图，所述w_max的取值为10。从图9可知：对图4而言，当给定笔划半径为5时，厚笔划像素占目标笔划像素比重最大，即给定笔划半径5所对应的二值化结果为最终的二值化结果输出，同时5也是最终估计得到的文档图像4所对应的最佳笔划半径。最终的二值化结果图中包含了尽可能多的文本像素，同时包含了尽可能少的背景像素。

由上可知，本发明的方法不需要设置参数的情况下能够自动的二值化文档图像，且二值化的结果具有较高的鲁棒性和分割精度，对文档的智能化自动处理具有重要意义。

Claims

1.一种基于笔划宽度的文档图像无参二值化方法，其特征在于，包括以下步骤：

步骤1、对文档图像进行采集；

步骤2、采用高斯滤波对采集到的文档图像进行去噪处理；

步骤3、根据文档图像所在的灰度范围生成二值化结果；

步骤4、根据笔划半径选择最佳的二值化结果，所述初始笔划半径为1；

步骤5、确定厚笔划像素占目标笔划像素比重的变化量Δr，所述厚笔划是指笔划半径大于当前笔划半径的笔划；

2.根据权利要求1所述的基于笔划宽度的文档图像无参二值化方法，其特征在于，步骤2采用高斯滤波对采集到的文档图像进行去噪处理，其中高斯滤波的公式为：

g (x, y) = \frac{1}{{2 πσ}^{2}} e^{- (x^{2} + y^{2}) / ({2 σ}^{2})}

式中，g(x,y)为高斯滤波函数，(x,y)为图像坐标，σ为标准偏差。

3.根据权利要求1所述的基于笔划宽度的文档图像无参二值化方法，其特征在于，步骤3中根据文档图像所在的灰度范围生成二值化结果具体为：

4.根据权利要求1所述的基于笔划宽度的文档图像无参二值化方法，其特征在于，步骤4根据笔划半径选择最佳的二值化结果，具体为：

（1）采用形态学闭运算得到厚目标区域TcO_k：

{TcO}_{k} = (B_{i} &CirclePlus; S_{k}) &CircleTimes; S_{k}, k = 1,2

其中

和

（2）确定细目标区域TnO_k，所用公式为：

{TnO}_{k} = B_{i} \ {TcO}_{k} = {x : x &Element; B_{i}, x &NotElement; {TcO}_{k}}, k = 1,2

背景区域为

Br = B_{i} \ Tr = {x : x &Element; B_{i}, x &NotElement; Tr},

则Nt和Nb分别为文本区域Tr和背景区域Br内的像素个数；

ΔN_i=Nt_i-Nb_i，i的取值为[1，I_max-I_min)；

5.根据权利要求1所述的基于笔划宽度的文档图像无参二值化方法，其特征在于，步骤5确定厚笔划像素占目标笔划像素比重的变化量Δr的具体步骤为：

步骤5-1、确定厚笔划像素在目标像素中所占的比重

Δr_j=r_j-r_j-1，j的取值为[1，w_max)。

6.根据权利要求2所述的基于笔划宽度的文档图像无参二值化方法，其特征在于，高斯滤波的窗口大小为3×3，标准偏差σ为1。