CN106384114B

CN106384114B - 一种基于支持向量机的自适应图像二值化方法

Info

Publication number: CN106384114B
Application number: CN201610842687.2A
Authority: CN
Inventors: 卢迪; 林凯
Original assignee: Harbin University of Science and Technology
Current assignee: Harbin University of Science and Technology
Priority date: 2016-09-22
Filing date: 2016-09-22
Publication date: 2019-09-27
Anticipated expiration: 2036-09-22
Also published as: CN106384114A

Abstract

本发明提供了一种基于支持向量机的自适应图像二值化方法，属于图像处理技术领域。所述方法包括：通过预定图像二值化方法对随机选取的降质文档图像进行处理，并对所述降质文档图像按选取的图像二值化方法进行归类；确定通过每种图像二值化方法处理的降质文档图像的灰度直方图，并提取所述灰度直方图的特征属性；将所述特征属性作为特征向量，并将所述特征向量对应的图像二值化方法作为标签建立训练样本；基于支持向量机对所述训练样本进行训练并建立二值化自适应选择模型。本发明针对不同的降质文档图像，在现有的预定图像二值化方法中选择最佳二值化方法，从而达到理想的图像二值化效果。

Description

一种基于支持向量机的自适应图像二值化方法

技术领域

本发明涉及一种基于支持向量机的自适应图像二值化方法，属于图像处理技术领域。

背景技术

文档图像二值化作为光学字符识别(OCR)预处理的关键过程，其二值化效果影响着字符的识别率。虽然目前的技术人员已经对文档图像二值化方法进行大量的研究，但是在实际应用中由于文档图像容易受到多种降质因素，如图像中存在光照不均、阴影、严重透背以及胶粘痕迹等的影响，就会需要通过大量的人为处理来对不同降质文档图像选择合适的二值化方法，因此无法实现自适应选择二值化方法，导致在图像处理领域对降质文档图像快速、自动、准确提取字符依旧是一个难点。

发明内容

本发明提供了一种基于支持向量机的自适应图像二值化方法，以解决现有技术中无法对不同降质文档图像实现自适应选择二值化方法的问题，为此本发明提出如下的技术方案：

一种基于支持向量机的自适应图像二值化方法，包括：

通过预定图像二值化方法对随机选取的降质文档图像进行处理，并对所述降质文档图像按选取的图像二值化方法进行归类；

确定通过每种图像二值化方法处理的降质文档图像的灰度直方图，并提取所述灰度直方图的特征属性；

将所述特征属性作为特征向量，并将所述特征向量对应的图像二值化方法作为标签建立训练样本；

基于支持向量机对所述训练样本进行训练并建立二值化自适应选择模型。

本发明的有益效果是：针对不同的降质文档图像，在现有的预定图像二值化方法中选择最佳二值化方法，从而达到理想的图像二值化效果；应用本实施方式算法处理图像，具有较好的自适应能力，对于不同的降质文档图像，能够自动有效的选择最佳二值化方法，通过调节支持向量机的参数，其自动选择最佳二值化方法的准确率可达到81.81％，不仅能够较好的实现图像二值化方法的自适应，也能够输出较佳效果的二值图像。

附图说明

图1为本发明提出的基于支持向量机的自适应图像二值化方法的流程图；

图2为实施例一提出的基于支持向量机的自适应图像二值化方法的流程图；

图3(a)为随机选取的降质文档图像中Kapur处理效果最佳的降质文档图像之一；

图3(b)为用Kapur二值化图像；

图4(a)为随机选取的降质文档图像中Kittler处理效果最佳的降质文档图像之一；

图4(b)为用Kittler二值化图像；

图5(a)为随机选取的降质文档图像中Kapur处理效果最佳的降质文档图像之一；

图5(b)为用Kapur二值化图像。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

结合图1所示，本具体实施方式提供的基于支持向量机的自适应图像二值化方法包括：

步骤11，通过预定图像二值化方法对随机选取的降质文档图像进行处理，并对所述降质文档图像按选取的图像二值化方法进行归类。

可选的，对随机选取的降质文档图像进行处理，及对降质文档图像按选取的图像二值化方法进行归类的过程包括：

随机选取预定数量的不同类型的降质文档图像以及选取多种预定的降质文档图像二值化方法，并按预定顺序对选取的图像二值化方法标记标签；

通过选取的图像二值化方法分别对每一幅降质图像进行图像二值化处理，计算每种图像二值化方法处理后的F-measure值：

PR和RC分别表示准确率以及召回率，以所述F-measure值作为图像二值化处理效果评价标准对所述降质文档图像进行归类。

其中，按预定顺序对选取的图像二值化方法标记标签包括：按自然数从小到大的顺序对选取的图像二值化方法标记标签；以F-measure值作为图像二值化处理效果评价标准对降质文档图像进行归类包括：按照F-measure值越大则效果越佳的标准对降质文档图像进行归类。

步骤12，确定通过每种图像二值化方法处理的降质文档图像的灰度直方图，并提取所述灰度直方图的特征属性。

可选的，确定灰度直方图并提取特征属性的过程包括：

通过以下计算式通过每种图像二值化方法处理的降质文档图像的灰度直方图：

H(i)表示灰度直方图，i表示灰度级，n_i和N分别表示降质文档图像灰度级i的像素点的个数和整幅图像总的像素点数。

其中，通过灰度直方图可提取以下的直方图属性特征值：

均值：方差偏度峰度能量熵

步骤13，将所述特征属性作为特征向量，并将所述特征向量对应的图像二值化方法作为标签建立训练样本。

可选的，将特征属性作为特征向量，并将特征向量对应的图像二值化方法作为标签建立训练样本的过程包括：

通过以下公式对所述特征属性进行归一化处理：

其中，y_max和y_min分别表示特征属性的最大值和最小值；

对经过所述归一化处理后的预定数量的特征属性作为特征向量，对应的最佳二值化处理方法作为标签，建立所述训练样本。

步骤14，基于支持向量机对所述训练样本进行训练并建立二值化自适应选择模型。

在一可选实施例中，所述方法还包括：

提取预定降质文档图像的灰度直方图特征；

将所述灰度直方图特征代入所述二值化自适应选择模型，并从所述预定图像二值化方法中自适应选取适合所述预定降质文档图像的图像二值化方法；

将通过选取的图像二值化方法输出二值化图像。

下面通过具体的实施例对本发明提出的基于支持向量机的自适应图像二值化方法进行详细说明。

实施例一

结合图2所示，所述的光控式声光双控报警器包括：

随机选取一定数量不同类型的降质文档图像，通过多种现有的图像二值化方法对其进行处理；根据图像二值化后F-measure值最佳原则对降质文档图像按所选取的图像二值化方法进行归类；

通过分析每种图像二值化方法下所处理降质文档图像的灰度直方图，提取灰度直方图的特征属性；

根据支持向量机分类原理，以选取的特征属性值作为特征向量，其对应的图像二值化方法为标签，建立训练样本；基于支持向量机对这些训练样本的训练，构建二值化自适应选择模型；

输入降质文档图像，提取图像灰度直方图特征，代入构建的支持向量机分类器，在选取的多种图像二值化方法中自适应选择适合该降质文档图像的最佳图像二值化方法，输出二值化图像。

在对降质文档图像按所选取的图像二值化方法进行归类的过程中，可随机选取一定数量不同类型的降质文档图像以及多种现有的降质文档图像二值化方法，按顺序以1,2,3…，N对所选取的二值化方法标记标签，运用选取的这些二值化方法分别对每一幅降质图像进行图像二值化处理，计算每一种图像二值化方法处理后的F-measure值：

其中，PR和RC分别代表准确率以及召回率，以F-measure值作为图像二值化处理效果评价标准(其值越大代表处理效果越佳)，若对于第n种图像二值化方法处理的F-measure值最高，则将该幅降质文档图像按标签n进行归类。

在通过分析每种图像二值化方法下所处理降质文档图像的灰度直方图的过程中，可计算分类后的每一个标签下降质文档图像的灰度直方图H(i)，i为灰度级。

其中，n_i和N分别是降质文档图像灰度级i的像素点的个数和整幅图像总的像素点数。通过灰度直方图提取以下直方图的属性特征值：

均值：

方差：

偏度：

峰度：

能量：

熵：

在建立训练样本的过程中，根据支持向量机分类原理，构建SVM分类器：通过提取每一种图像二值化方法下降质文档图像灰度直方图的特征属性值，由于特征值之间的数据尺度不统一，需要先对数据进行归一化，归一化公式如下：

其中，y_max和y_min分别表示样本特征属性的最大值和最小值。以归一化后的6个特征属性值作为特征向量，对应的最佳图像二值化处理方法作为标签，构建训练样本，基于支持向量机对构建的训练样本进行训练。

仿真结果分析

仿真选择的是四种全局阈值方法，训练样本为DIBCO图像集50幅降质图像中随机选取的28幅降质图像，剩余的22幅图像作为测试样本。图3(a)，图4(a)，图5(a)是随机选取的28幅降质图像训练样本中的3幅，图3(b)，图4(b)，图5(b)为3种图像二值化方法中最佳的图像二值化方法处理的结果。

通过调节支持向量机的参数，对输入测试的22幅降质图像，准确自适应选择最佳的图像二值化方法的有18幅降质图像，其自适应的选择最佳图像二值化方法准确率能达到81.81％，说明本实施方式算法可以很好的实现图像二值化方法的自适应，也同时说明应用本实施方式算法能够输出最佳效果的二值图像。

本具体实施方式是对本发明的技术方案进行清楚、完整地描述，其中的实施例仅仅是本发明的一部分实施例，而并不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有经过创造性劳动的前提下所获得的所有其它实施方式都属于本发明的保护范围。

Claims

1.一种基于支持向量机的自适应图像二值化方法，其特征在于，包括：

2.根据权利要求1所述的基于支持向量机的自适应图像二值化方法，其特征在于，所述方法还包括：

提取预定降质文档图像的灰度直方图特征；

通过选取的图像二值化方法输出二值化图像。

3.根据权利要求1所述的基于支持向量机的自适应图像二值化方法，其特征在于，通过预定图像二值化方法对随机选取的降质文档图像进行处理，并对所述降质文档图像按选取的图像二值化方法进行归类包括：

其中，PR和RC分别表示准确率以及召回率，以所述F-measure值作为图像二值化处理效果评价标准对所述降质文档图像进行归类。

4.根据权利要求3所述的基于支持向量机的自适应图像二值化方法，其特征在于，按预定顺序对选取的图像二值化方法标记标签包括：

按自然数从小到大的顺序对选取的图像二值化方法标记标签。

5.根据权利要求4所述的基于支持向量机的自适应图像二值化方法，其特征在于，以所述F-measure值作为图像二值化处理效果评价标准对所述降质文档图像进行归类包括：

按照所述F-measure值越大则效果越佳的标准对所述降质文档图像进行归类。

6.根据权利要求1所述的基于支持向量机的自适应图像二值化方法，其特征在于，确定通过每种图像二值化方法处理的降质文档图像的灰度直方图，并提取所述灰度直方图的特征属性包括：

通过以下计算式计算每种图像二值化方法处理的降质文档图像的灰度直方图：

其中，H(i)表示灰度直方图，i表示灰度级，n_i和N分别表示降质文档图像灰度级i的像素点的个数和整幅图像总的像素点数。

7.根据权利要求6所述的基于支持向量机的自适应图像二值化方法，其特征在于，通过所述灰度直方图提取以下的直方图属性特征值：

均值：方差偏度峰度能量熵

8.根据权利要求1所述的基于支持向量机的自适应图像二值化方法，其特征在于，将所述特征属性作为特征向量，并将所述特征向量对应的图像二值化方法作为标签建立训练样本包括：

通过以下公式对所述特征属性进行归一化处理：

其中，y_max和y_min分别表示特征属性的最大值和最小值；