CN102063628B

CN102063628B - 双面盲文点字的提取方法

Info

Publication number: CN102063628B
Application number: CN 201110008215
Authority: CN
Inventors: 李�杰; 王丽荣; 闫晓光; 尹佳; 张超; 邹稷; 王晓丽
Original assignee: Changchun University
Current assignee: Changchun University
Priority date: 2011-01-14
Filing date: 2011-01-14
Publication date: 2012-10-03
Anticipated expiration: 2031-01-14
Also published as: CN102063628A

Abstract

双面盲文点字的提取方法，涉及图像处理与模式识别技术领域，它解决了现有双面盲文的点字难于提取的问题，提供一种双面盲文点字的提取方法，该方法为：步骤一、采用扫描仪对纸介双面盲文进行扫描，获得双面盲文扫描图像；步骤二、对步骤一获得的双面盲文扫描图像进行灰度化处理并进行灰度调节去除图像背景，获得处理后的扫描图像；步骤三、将正负两类训练样本输入SVM决策器进行训练，然后将步骤二处理后的扫描图像输入所述SVM决策器，实现盲文点字的提取。本发明有效的提高了算法的速度，并为特殊教育事业及其盲人群体提供了便利。本发明广泛应用于图像处理领域。

Description

双面盲文点字的提取方法

技术领域

本发明涉及图像处理与模式识别技术领域，具体涉及一种基于支持向量机(Support Vector Machine简称SVM)的双面盲文点字提取方法。

背景技术

盲人及视障人群数量众多、个性突出，是一个特别需要帮助的社会群体。近年来，“为有特殊需求的弱势人群提供信息无障碍服务”已被作为一项重要建设的社会文明，写入了我国相关的法律法规中。盲文识别作为一项造福于盲人及视障人群的应用技术，近年来也取得了快速的发展。当前的盲文识别主要是以单面盲文为识别对象，以图像处理技术为基础进行的，技术也日趋成熟。图像处理(Image Processing)，是用计算机对图像进行分析，以达到所需结果的技术。图像处理一般指对数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组进行分析处理，主要包括图像压缩，增强和复原，匹配、描述和识别三个部分。

模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。

支持向量机是Corinna Cortes和Vapnik等于1995年首先提出的，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性（即对特定训练样本的学习精度）和学习能力（即无错误地识别任意样本的能力）之间寻求最佳折衷，以期获得最好的推广能力，该方法在回归和模式识别领域具有良好的应用价值和发展前景。

但是，目前的盲文印刷材料包括书籍等均为双面打印，即纸张的正反两面均有盲文点字，同一面既有凸点又有凹点，而盲文及盲文识别的关键是凸点，这为盲文识别的发展带来了极大的技术挑战。

发明内容

本发明为解决现有双面盲文的点字难于提取的问题，提供一种双面盲文点字的提取方法。

双面盲文点字的提取方法，该方法由以下步骤实现：

步骤一、采用扫描仪对纸介双面盲文进行扫描，获得双面盲文扫描图像；

步骤二、对步骤一获得的双面盲文扫描图像进行灰度化处理并进行灰度调节去除图像背景，获得处理后的扫描图像，所述的进行灰度调节去除图像背景是指：采用一定大小的图像小块的灰度值与该小块图像平均灰度值的差减法去除图像背景；

步骤三、将正负两类训练样本输入SVM决策器进行训练，然后将步骤二处理后的扫描图像输入所述SVM决策器，实现盲文点字的提取，具体的提取方法为：SVM决策器训练完成后，输入处理后的扫描图进行识别提取，SVM决策器找出输入盲文图像的分类超平面，可准确的对输入盲文图像进行样本分类，若有凸点则输出0，若凹点则输出1，把被测图像转换成二值图像；

所述SVM决策器进行训练的过程包括训练和测试：

训练过程：首先对样本图像进行灰度化处理，采用凸规划问题求解，计算图像的最优分类超平面；

测试过程：对最优分类超平面进行分类测试训练样本，设定训练样本用公式（1）表示为：

{x_i,y_i},i=1,...m，y_i∈{-1,1},x_i∈Rⁿ （1）

其中x_i是训练样本，每个训练样本都是包含有n个数据的向量；m为训练样本的个数；n、m均为正整数；y_i是训练样本x_i的分类标签，采用SVM非线性可分的分类决策公式，测试出输入训练样本的归类，经过求解原始问题用公式（2）和公式（3）表示：

\min_{ω, b} J (ω) \frac{1}{2} {| | ω | |}^{2} - - - (2)

约束条件：y_i(ω·Φ(x_i)+b)≥1，i=1,2,...,n （3）

其中，ω是n维训练样本向量，J(ω)为目标函数，Φ(x_i)为训练样本集的特征向量x_i，i=1,2,...,n通过映射Φ映射到高维空间的函数，b为超平面函数的偏移量；

引入合适的核函数K(x_i·x)，可得分类决策公式，所述分类决策用公式（4）表示；

f (x) = sgn (g (x)) = sgn (Σ_{i = 1}^{n} y_{i} α_{i}^{*} K (x_{i} \cdot x) + b) - - - (4)

其中，sgn(·)为符号函数，K(x_i·x)为核函数；

sgn (t) = \{\begin{matrix} 0 & t < 0, \\ 1 & t &GreaterEqual; 0 . \end{matrix},

为最优解，x为样本向量，x_i为训练样本向量，b为超平面函数的偏移量；

最后，采用SVM非线性可分的分类决策公式（4），即可测试出输入新图像中的样本归类，把凸点提取出来，完成SVM的盲文样本训练。

本发明的原理：本发明针对扫描仪扫描的双面盲文图像，灰度化处理并进行灰度调节去除背景，再选择正负两类样本对SVM决策器进行学习训练，所述的SVM决策器是通过一个最优的超平面来分离双面盲文图像中的两类目标点。为了建立这个超平面，采用两类样本去对SVM进行训练。在样本送到SVM进行训练之前，对双面盲文图进行灰度化处理，然后应用凸规划问题求解，从训练样本中计算出最优分类超平面，这个过程称之为SVM训练过程。然后输入盲文图像，SVM决策器即可找出一个最佳的超平面，使两类样本目标尽可能的分离到超平面的两侧，再根据实际情况输出我们需要的样本点。本发明方法为纸介双面盲文的识别提供了理论依据，特别为特殊教育事业及其盲人群体提供了便利。本发明应用支持向量机的方法进行双面盲文凸凹点字的分类识别。

本发明的有益效果：本发明采用支持向量机的方法进行双面盲文点字的提取，有效提高了算法了速度为特殊教育事业及其盲人群体提供了便利。

附图说明

图1为本发明所述的双面盲文点字的提取方法流程图；

图2为本发明所述的双面盲文点字的提取方法的原理图；

图3中（a）、（b）分别为本发明所述的双面盲文点字的提取方法中提取前的双面盲文图像与提取后的效果图。

具体实施方式

具体实施方式一、结合图1至图3说明本实施方式，双面盲文点字的提取方法，该方法由以下步骤实现：

步骤二、对步骤一获得的双面盲文扫描图像进行灰度化处理并进行灰度调节去除图像背景，获得处理后的扫描图像；

步骤三、将正负两类训练样本输入SVM决策器进行训练，然后将步骤二处理后的扫描图像输入所述SVM决策器，实现盲文点字的提取；

所述SVM决策器进行训练的过程包括训练和测试：

训练过程：把SVM的样本学习过程，称为SVM训练；首先对样本图像进行灰度化处理，采用凸规划问题求解，计算图像的最优分类超平面；

测试过程：把SVM通过最优分类超平面决策样本归属的过程成为SVM测试。经过训练和测试两个过程后，SVM决策器才能正常工作；

通过最优分类超平面对测试样本进行分类，即测试输入的新数据属于哪一类目标点。

具体过程：假设训练样本用公式（1）表示为：

{x_i,y_i},i=1，...m,y_i∈{一1,1},x_i∈Rⁿ （1）

其中x_i是训练样本，每个训练样本都是包含有n个数据的向量；m为训练样本的个数；n、m均为正整数；y_i是训练样本x_i的分类标签。

经过求解原始问题用公式（2）和公式（3）表示：

\min_{ω, b} J (ω) = \frac{1}{2} {| | ω | |}^{2} - - - (2)

约束条件：y_i(ω·Φ(x_i)+b)≥1，i=1,2,...,n （3）

其中，ω是n维训练样本向量，J(ω)为目标函数，Φ(x_i)为训练样本集的特征向量x_i，i=1,2,...,n通过映射Φ映射到高维空间的函数；

引入合适的核函数K(x_i·x)，可得分类决策公式（4）：

f (x) = sgn (g (x)) = sgn (Σ_{i = 1}^{n} y_{i} α_{i}^{*} K (x_{i} \cdot x) + b) - - - (4)

其中，sgn(·)为符号函数，

sgn (t) = \{\begin{matrix} 0 & t < 0, \\ 1 & t &GreaterEqual; 0 . \end{matrix},

为原始问题的最优解，b为超平面函数的偏移量。

最后，采用SVM非线性可分的分类决策公式（4），即可测试出输入新图像中的样本归类，把凸点提取出来。完成SVM的盲文样本训练后，SVM将对训练样本特征有一个准确的记忆。

结合图2，SVM决策器训练测试完成，即可输入盲文图像进行识别提取，SVM决策器即可找出输入图像的分类超平面，可准确的对图像进行样本分类，若有凸点则输出0，若凹点则输出1，即把被测图像转换成二值图像。图3即为提取前后的效果说明图。

本实施方式中步骤二所述的进行灰度调节去除图像背景是指：采用一定大小的图像小块的灰度值与该小块图像平均灰度值的差减法去除图像背景。

Claims

1.双面盲文点字提取方法，其特征是，该方法由以下步骤实现：

步骤三、将正负两类训练样本输入SVM决策器进行训练，然后将步骤二处理后的扫描图像输入所述SVM决策器，实现盲文点字的提取，具体的提取方法为：SVM决策器训练完成后，输入处理后的扫描图像进行识别提取，SVM决策器找出输入盲文图像的分类超平面，可准确的对输入盲文图像进行样本分类，若有凸点则输出0，若凹点则输出1，把被测图像转换成二值图像；

所述SVM决策器进行训练的过程包括训练和测试：

{x_i,y_i},i=1，...m,y_i∈{-1,1},x_i∈Rⁿ （1）

\min_{ω, b} J (ω) = \frac{1}{2} {| | ω | |}^{2} - - - (2)

约束条件：y_i(ω·Φ(x_i)+b)≥1，i=1,2,...,n （3）

f (x) = sgn (g (x)) = sgn (Σ_{i = 1}^{n} y_{i} α_{i}^{*} K (x_{i} \cdot x) + b) - - - (4)

其中，sgn(·)为符号函数，K(x_i·x)为核函数；

sgn (t) = \{\begin{matrix} 0 & t < 0, \\ 1 & t &GreaterEqual; 0 . \end{matrix},

2.根据权利要求1所述的双面盲文点字的提取方法，其特征在于，所述正负两类训练样本中正训练样本为图像中的凸点，负训练样本为图像的凹点及背景，所述凸点输出为0，凹点输出为1。