CN102063628B - 双面盲文点字的提取方法 - Google Patents
双面盲文点字的提取方法 Download PDFInfo
- Publication number
- CN102063628B CN102063628B CN 201110008215 CN201110008215A CN102063628B CN 102063628 B CN102063628 B CN 102063628B CN 201110008215 CN201110008215 CN 201110008215 CN 201110008215 A CN201110008215 A CN 201110008215A CN 102063628 B CN102063628 B CN 102063628B
- Authority
- CN
- China
- Prior art keywords
- image
- braille
- training sample
- svm
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
双面盲文点字的提取方法,涉及图像处理与模式识别技术领域,它解决了现有双面盲文的点字难于提取的问题,提供一种双面盲文点字的提取方法,该方法为:步骤一、采用扫描仪对纸介双面盲文进行扫描,获得双面盲文扫描图像;步骤二、对步骤一获得的双面盲文扫描图像进行灰度化处理并进行灰度调节去除图像背景,获得处理后的扫描图像;步骤三、将正负两类训练样本输入SVM决策器进行训练,然后将步骤二处理后的扫描图像输入所述SVM决策器,实现盲文点字的提取。本发明有效的提高了算法的速度,并为特殊教育事业及其盲人群体提供了便利。本发明广泛应用于图像处理领域。
Description
技术领域
本发明涉及图像处理与模式识别技术领域,具体涉及一种基于支持向量机(Support Vector Machine简称SVM)的双面盲文点字提取方法。
背景技术
盲人及视障人群数量众多、个性突出,是一个特别需要帮助的社会群体。近年来,“为有特殊需求的弱势人群提供信息无障碍服务”已被作为一项重要建设的社会文明,写入了我国相关的法律法规中。盲文识别作为一项造福于盲人及视障人群的应用技术,近年来也取得了快速的发展。当前的盲文识别主要是以单面盲文为识别对象,以图像处理技术为基础进行的,技术也日趋成熟。图像处理(Image Processing),是用计算机对图像进行分析,以达到所需结果的技术。图像处理一般指对数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组进行分析处理,主要包括图像压缩,增强和复原,匹配、描述和识别三个部分。
模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
支持向量机是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力,该方法在回归和模式识别领域具有良好的应用价值和发展前景。
但是,目前的盲文印刷材料包括书籍等均为双面打印,即纸张的正反两面均有盲文点字,同一面既有凸点又有凹点,而盲文及盲文识别的关键是凸点,这为盲文识别的发展带来了极大的技术挑战。
发明内容
本发明为解决现有双面盲文的点字难于提取的问题,提供一种双面盲文点字的提取方法。
双面盲文点字的提取方法,该方法由以下步骤实现:
步骤一、采用扫描仪对纸介双面盲文进行扫描,获得双面盲文扫描图像;
步骤二、对步骤一获得的双面盲文扫描图像进行灰度化处理并进行灰度调节去除图像背景,获得处理后的扫描图像,所述的进行灰度调节去除图像背景是指:采用一定大小的图像小块的灰度值与该小块图像平均灰度值的差减法去除图像背景;
步骤三、将正负两类训练样本输入SVM决策器进行训练,然后将步骤二处理后的扫描图像输入所述SVM决策器,实现盲文点字的提取,具体的提取方法为:SVM决策器训练完成后,输入处理后的扫描图进行识别提取,SVM决策器找出输入盲文图像的分类超平面,可准确的对输入盲文图像进行样本分类,若有凸点则输出0,若凹点则输出1,把被测图像转换成二值图像;
所述SVM决策器进行训练的过程包括训练和测试:
训练过程:首先对样本图像进行灰度化处理,采用凸规划问题求解,计算图像的最优分类超平面;
测试过程:对最优分类超平面进行分类测试训练样本,设定训练样本用公式(1)表示为:
{xi,yi},i=1,...m,yi∈{-1,1},xi∈Rn (1)
其中xi是训练样本,每个训练样本都是包含有n个数据的向量;m为训练样本的个数;n、m均为正整数;yi是训练样本xi的分类标签,采用SVM非线性可分的分类决策公式,测试出输入训练样本的归类,经过求解原始问题用公式(2)和公式(3)表示:
约束条件:yi(ω·Φ(xi)+b)≥1,i=1,2,...,n (3)
其中,ω是n维训练样本向量,J(ω)为目标函数,Φ(xi)为训练样本集的特征向量xi,i=1,2,...,n通过映射Φ映射到高维空间的函数,b为超平面函数的偏移量;
引入合适的核函数K(xi·x),可得分类决策公式,所述分类决策用公式(4)表示;
其中,sgn(·)为符号函数,K(xi·x)为核函数; 为最优解,x为样本向量,xi为训练样本向量,b为超平面函数的偏移量;
最后,采用SVM非线性可分的分类决策公式(4),即可测试出输入新图像中的样本归类,把凸点提取出来,完成SVM的盲文样本训练。
本发明的原理:本发明针对扫描仪扫描的双面盲文图像,灰度化处理并进行灰度调节去除背景,再选择正负两类样本对SVM决策器进行学习训练,所述的SVM决策器是通过一个最优的超平面来分离双面盲文图像中的两类目标点。为了建立这个超平面,采用两类样本去对SVM进行训练。在样本送到SVM进行训练之前,对双面盲文图进行灰度化处理,然后应用凸规划问题求解,从训练样本中计算出最优分类超平面,这个过程称之为SVM训练过程。然后输入盲文图像,SVM决策器即可找出一个最佳的超平面,使两类样本目标尽可能的分离到超平面的两侧,再根据实际情况输出我们需要的样本点。本发明方法为纸介双面盲文的识别提供了理论依据,特别为特殊教育事业及其盲人群体提供了便利。本发明应用支持向量机的方法进行双面盲文凸凹点字的分类识别。
本发明的有益效果:本发明采用支持向量机的方法进行双面盲文点字的提取,有效提高了算法了速度为特殊教育事业及其盲人群体提供了便利。
附图说明
图1为本发明所述的双面盲文点字的提取方法流程图;
图2为本发明所述的双面盲文点字的提取方法的原理图;
图3中(a)、(b)分别为本发明所述的双面盲文点字的提取方法中提取前的双面盲文图像与提取后的效果图。
具体实施方式
具体实施方式一、结合图1至图3说明本实施方式,双面盲文点字的提取方法,该方法由以下步骤实现:
步骤一、采用扫描仪对纸介双面盲文进行扫描,获得双面盲文扫描图像;
步骤二、对步骤一获得的双面盲文扫描图像进行灰度化处理并进行灰度调节去除图像背景,获得处理后的扫描图像;
步骤三、将正负两类训练样本输入SVM决策器进行训练,然后将步骤二处理后的扫描图像输入所述SVM决策器,实现盲文点字的提取;
所述SVM决策器进行训练的过程包括训练和测试:
训练过程:把SVM的样本学习过程,称为SVM训练;首先对样本图像进行灰度化处理,采用凸规划问题求解,计算图像的最优分类超平面;
测试过程:把SVM通过最优分类超平面决策样本归属的过程成为SVM测试。经过训练和测试两个过程后,SVM决策器才能正常工作;
通过最优分类超平面对测试样本进行分类,即测试输入的新数据属于哪一类目标点。
具体过程:假设训练样本用公式(1)表示为:
{xi,yi},i=1,...m,yi∈{一1,1},xi∈Rn (1)
其中xi是训练样本,每个训练样本都是包含有n个数据的向量;m为训练样本的个数;n、m均为正整数;yi是训练样本xi的分类标签。
经过求解原始问题用公式(2)和公式(3)表示:
约束条件:yi(ω·Φ(xi)+b)≥1,i=1,2,...,n (3)
其中,ω是n维训练样本向量,J(ω)为目标函数,Φ(xi)为训练样本集的特征向量xi,i=1,2,...,n通过映射Φ映射到高维空间的函数;
引入合适的核函数K(xi·x),可得分类决策公式(4):
最后,采用SVM非线性可分的分类决策公式(4),即可测试出输入新图像中的样本归类,把凸点提取出来。完成SVM的盲文样本训练后,SVM将对训练样本特征有一个准确的记忆。
结合图2,SVM决策器训练测试完成,即可输入盲文图像进行识别提取,SVM决策器即可找出输入图像的分类超平面,可准确的对图像进行样本分类,若有凸点则输出0,若凹点则输出1,即把被测图像转换成二值图像。图3即为提取前后的效果说明图。
本实施方式中步骤二所述的进行灰度调节去除图像背景是指:采用一定大小的图像小块的灰度值与该小块图像平均灰度值的差减法去除图像背景。
Claims (2)
1.双面盲文点字提取方法,其特征是,该方法由以下步骤实现:
步骤一、采用扫描仪对纸介双面盲文进行扫描,获得双面盲文扫描图像;
步骤二、对步骤一获得的双面盲文扫描图像进行灰度化处理并进行灰度调节去除图像背景,获得处理后的扫描图像,所述的进行灰度调节去除图像背景是指:采用一定大小的图像小块的灰度值与该小块图像平均灰度值的差减法去除图像背景;
步骤三、将正负两类训练样本输入SVM决策器进行训练,然后将步骤二处理后的扫描图像输入所述SVM决策器,实现盲文点字的提取,具体的提取方法为:SVM决策器训练完成后,输入处理后的扫描图像进行识别提取,SVM决策器找出输入盲文图像的分类超平面,可准确的对输入盲文图像进行样本分类,若有凸点则输出0,若凹点则输出1,把被测图像转换成二值图像;
所述SVM决策器进行训练的过程包括训练和测试:
训练过程:首先对样本图像进行灰度化处理,采用凸规划问题求解,计算图像的最优分类超平面;
测试过程:对最优分类超平面进行分类测试训练样本,设定训练样本用公式(1)表示为:
{xi,yi},i=1,...m,yi∈{-1,1},xi∈Rn (1)
其中xi是训练样本,每个训练样本都是包含有n个数据的向量;m为训练样本的个数;n、m均为正整数;yi是训练样本xi的分类标签,采用SVM非线性可分的分类决策公式,测试出输入训练样本的归类,经过求解原始问题用公式(2)和公式(3)表示:
约束条件:yi(ω·Φ(xi)+b)≥1,i=1,2,...,n (3)
其中,ω是n维训练样本向量,J(ω)为目标函数,Φ(xi)为训练样本集的特征向量xi,i=1,2,...,n通过映射Φ映射到高维空间的函数,b为超平面函数的偏移量;
引入合适的核函数K(xi·x),可得分类决策公式,所述分类决策用公式(4)表示;
最后,采用SVM非线性可分的分类决策公式(4),即可测试出输入新图像中的样本归类,把凸点提取出来,完成SVM的盲文样本训练。
2.根据权利要求1所述的双面盲文点字的提取方法,其特征在于,所述正负两类训练样本中正训练样本为图像中的凸点,负训练样本为图像的凹点及背景,所述凸点输出为0,凹点输出为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110008215 CN102063628B (zh) | 2011-01-14 | 2011-01-14 | 双面盲文点字的提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110008215 CN102063628B (zh) | 2011-01-14 | 2011-01-14 | 双面盲文点字的提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102063628A CN102063628A (zh) | 2011-05-18 |
CN102063628B true CN102063628B (zh) | 2012-10-03 |
Family
ID=43998897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110008215 Expired - Fee Related CN102063628B (zh) | 2011-01-14 | 2011-01-14 | 双面盲文点字的提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102063628B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446885A (zh) * | 2016-09-21 | 2017-02-22 | 北京联合大学 | 纸介盲文识别方法和系统 |
CN107886808B (zh) * | 2017-11-03 | 2021-03-09 | 中国科学院计算技术研究所 | 一种盲文方辅助标注方法及系统 |
CN108062886A (zh) * | 2017-11-03 | 2018-05-22 | 中国科学院计算技术研究所 | 盲文点交互式标注方法及系统 |
CN108052955B (zh) * | 2017-11-03 | 2021-03-05 | 中国科学院计算技术研究所 | 一种高精度盲文识别方法及系统 |
CN107958261B (zh) * | 2017-11-03 | 2020-12-04 | 中国科学院计算技术研究所 | 一种盲文点检测方法及系统 |
CN110705556B (zh) * | 2019-09-18 | 2023-04-25 | 佛山职业技术学院 | 一种盲文转化仪、转化方法及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1599385A (zh) * | 2003-09-16 | 2005-03-23 | 乐金电子(中国)研究开发中心有限公司 | 移动通信终端的盲文识别装置与方法 |
CN101183430A (zh) * | 2007-12-13 | 2008-05-21 | 中国科学院合肥物质科学研究院 | 一种基于模块神经网络sn9701矩阵列的手写体数字自动识别方法 |
CN101840648A (zh) * | 2010-04-28 | 2010-09-22 | 长春大学 | 自动盲文阅卷系统 |
-
2011
- 2011-01-14 CN CN 201110008215 patent/CN102063628B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1599385A (zh) * | 2003-09-16 | 2005-03-23 | 乐金电子(中国)研究开发中心有限公司 | 移动通信终端的盲文识别装置与方法 |
CN101183430A (zh) * | 2007-12-13 | 2008-05-21 | 中国科学院合肥物质科学研究院 | 一种基于模块神经网络sn9701矩阵列的手写体数字自动识别方法 |
CN101840648A (zh) * | 2010-04-28 | 2010-09-22 | 长春大学 | 自动盲文阅卷系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102063628A (zh) | 2011-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102063628B (zh) | 双面盲文点字的提取方法 | |
Lawgali et al. | HACDB: Handwritten Arabic characters database for automatic character recognition | |
CN106203492A (zh) | 一种图像隐写分析的系统及方法 | |
CN108805833B (zh) | 基于条件对抗网络的字帖二值化背景噪声杂点去除方法 | |
CN103258217A (zh) | 一种基于增量学习的行人检测方法 | |
CN101303730A (zh) | 基于分类器集成的人脸识别系统及其方法 | |
CN103902964A (zh) | 一种人脸识别方法 | |
Babu et al. | Handwritten digit recognition using structural, statistical features and k-nearest neighbor classifier | |
Mohapatra et al. | Classification performance analysis of mnist dataset utilizing a multi-resolution technique | |
CN101655911B (zh) | 基于免疫抗体网络的模式识别方法 | |
CN106650696A (zh) | 一种基于奇异值分解的手写电气元件符号识别方法 | |
AlKhateeb et al. | Word-based handwritten Arabic scripts recognition using DCT features and neural network classifier | |
Indira et al. | Classification and Recognition of Printed Hindi Characters Using Artificial Neural Networks | |
Antony et al. | Haar features based handwritten character recognition system for Tulu script | |
Gayathri et al. | Off-line handwritten character recognition using Hidden Markov Model | |
CN110298331B (zh) | 一种人证比对方法 | |
CN107103289B (zh) | 利用笔迹轮廓特征来进行笔迹鉴别的方法及系统 | |
Ajao et al. | Yoruba handwriting word recognition quality evaluation of preprocessing attributes using information theory approach | |
Halder et al. | Individuality of Bangla numerals | |
Kır et al. | The Application of optical character recognition for mobile device via artificial neural networks with negative correlation learning algorithm | |
CN110427973B (zh) | 一种面向歧义标注样本的分类方法 | |
Desai et al. | An approach for text recognition from document images | |
Tan et al. | Multiscale region projection method to discriminate between printed and handwritten text on registration forms | |
Sadri et al. | A new system for recognition of handwritten persian bank checks | |
Peng et al. | Text separation from mixed documents using a tree-structured classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121003 Termination date: 20140114 |