CN102622610A - 一种基于分类器集成的手写维文字符识别方法 - Google Patents

一种基于分类器集成的手写维文字符识别方法 Download PDF

Info

Publication number
CN102622610A
CN102622610A CN2012100557266A CN201210055726A CN102622610A CN 102622610 A CN102622610 A CN 102622610A CN 2012100557266 A CN2012100557266 A CN 2012100557266A CN 201210055726 A CN201210055726 A CN 201210055726A CN 102622610 A CN102622610 A CN 102622610A
Authority
CN
China
Prior art keywords
chinese character
dimension
dimension chinese
letter value
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100557266A
Other languages
English (en)
Other versions
CN102622610B (zh
Inventor
李静
卢朝阳
戴笑来
许亚美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201210055726.6A priority Critical patent/CN102622610B/zh
Publication of CN102622610A publication Critical patent/CN102622610A/zh
Application granted granted Critical
Publication of CN102622610B publication Critical patent/CN102622610B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种基于分类器集成的手写维文字符识别方法,属于模式识别领域,该方法首先对手写维文字符进行预处理,接着利用方向线素提取维文字符的特征向量,然后分别使用MQDF分类器和BP神经网络分类器对维文字符特征向量分类,对分类识别的结果即MQDF置信值集和BP神经网络置信值集进行集成,具体是通过两个置信值的加权和实现集成,得到最终置信值集,选择最大的置信值作为识别结果。本发明使用了两种分类器,并将结果集成,提高了识别率,本发明具有算法性能好、实时性强、可靠性高、识别率高的优点,主要应用于移动平台即手机上实现手写维文识别,为维文的信息化处理奠定了基础,为维文的文化交流开辟了新的方法和应用途径。

Description

一种基于分类器集成的手写维文字符识别方法
技术领域
本发明属于模式识别中的文字识别技术领域,主要涉及手写体识别领域,特别是涉及手写维文字符识别领域,具体是一种基于分类器集成的手写维文字符识别方法,用于在移动平台即手机上实现维文字符的手写输入。
背景技术
维吾尔文是新疆维吾尔民族交际和工作的主要文字之一,属阿尔泰语系突厥语族,是一种粘连的拼音文字。现行的维吾尔文共有32个字母,其中有8个元音字母,24个辅音字母,根据在单词中的位置不同,每个字母有前连式、后连式、双连式、单立式等2~8种书写形式,总共有128个字符。从形体上看,维吾尔文字符采用自右向左、自上向下的手写方式,沿着一条水平线即基线书写的部分称为主体部分,在维文识别过程中用主体部分来辨别字符的主要形态,除基线以外的符号、点等称为附加部分,附加部分是区分相似字符的依据。
维吾尔文由维吾尔单词组成,每个单词由几个到十几个维吾尔字符组成,字符沿着基线相连书写。研究维吾尔文字符的处理和识别有助于提升新疆少数民族地区的文化交流、信息交流和科技经济的发展。在市场上,维吾尔文印刷体文字识别系统已经广泛的应用于维吾尔文信息处理的各个领域,如办公自动化、出版印刷业等多种方面。但是,维吾尔文手写技术的研究还处于初步探索阶段。目前,手写维文识别方面的研究和成果均较少,在中国申请的专利也较少,中国专利申请号2010102041177.5的发明申请是西安电子科技大学卢朝阳等提出的一种手写体维吾尔文字符识别方法,该申请提出了128类的手写体维文字符识别的方法,其首先提出了一种识别手写维文字符的方法,奠定了手写维文字符识别的基础,该方法针对128类维文字符先建立维文字符部件库和部件字典,是维文字符特征提取和识别的基础,然后对单个部件提取时分方向特征,最后以加权距离融合函数综合各部件特征,用以识别整个字符。该发明申请首先完整的建立了一种手写维文字符识别的方法,开创了手写维文字符识别的领域,但其手写维文字符识别算法的最高识别率为84.23%,识别率不高。
目前,128类的维文单字符识别的研究还较少,识别率普遍较低。如何将维吾尔文字符特定的书写规则与分类识别算法有效结合起来,以及将不同分类器集成,是手写体维文识别一个亟待解决的问题。
发明内容
本发明的目的是克服现有技术存在的识别率较低的技术问题,提供一种识别率较高和识别时间较短的基于分类器集成的手写维文字符识别方法,该方法采用不同的分类器进行分类,并对不同的分类器进行集成,与使用单分类器的方法相比,其平均识别率有了显著的提高。
为实现发明目的,本发明采用的技术方案说明如下:
本发明是一种基于分类器集成的手写维文字符识别方法:对手写维文字符的识别过程包括:
步骤1对采集到的手写维文字符进行预处理,去除采集维文字符过程中附加的噪声,得到规范化的维文字符;
步骤2提取维文字符的特征向量,将规范化的维文字符从对象空间映射到特征空间,得到维文字符的方向线素,即维文字符的特征向量;
步骤3分别使用MQDF(Modified Quadratic Discriminant Function,修正的二次分类函数)分类器和BP(Back Propagation,后向传播)神经网络分类器对维文字符特征向量分类识别,得到分类识别结果,MQDF分类器的分类结果是置信值集1和BP神经网络分类器的分类结果是置信值集2;
步骤4对两种分类识别的结果置信值集1和置信值集2进行集成,计算128个维文字符中每个候选字符的两个置信值的加权和,确定最大的加权和值,得到最终的分类识别结果。
本发明采用一种统计的方法,首先对维文字符进行预处理,去除由于手写所带来的噪声,接着提取维文字符的特征向量,并将特征向量分别输入MQDF分类器和BP神经网络分类器进行分类,最后对分类识别的结果集成,得到最终的识别结果并给出候选集。
本发明的实现还在于:手写维文字符预处理过程包括:
1.1裁剪手写维文字符图像,去除维文字符图像中不包含文字轨迹点的区域,留下包含文字轨迹点的区域;
1.2对裁剪后的维文字符进行归一化处理,将大小不同的维文字符图像归一化为大小相同的图像;
1.3对归一化后的维文字符图像进行轨迹点重采样,每隔几个点进行采样,若原图像中存在象素点比较紧密而归一化处理后象素点比较稀疏的地方则补象素点;
1.4对重采样后的维文字符图像进行滤波,得到规范化的维文字符。
本发明首先对维文字符图像进行裁剪,以图像中的文字为边界,将其中不包括文字信息的部分去除,只保留包含文字的矩形区域。接着将裁剪后的图像进行归一化处理,将裁剪后大小不一样的维文字符图像转换为大小一样的维文字符图像。然后将归一化后的图像进行轨迹点重采样,减少由于归一化带来的字符拉伸、延展的畸变。最后将重采样后的维文图像进行滤波,降低图像的噪声。
本发明的实现还在于:维文字符特征向量提取的过程包括:
2.1使用弹性网格对规范化的维文字符图像进行划分;
2.2计算每个网格内的象素点的方向线素,并计算出每个网格的方向象素;
2.3将维文字符的网格降维,并计算出降维后的维文字符每个网格的方向象素;
2.4对所有网格的方向线素进行合并,用合并后的方向线素表示维文字符的方向线素,即维文字符的特征向量。
本发明特征提取过程中首先使用弹性网格分割维文图像。又计算网格内的每个象素的方向线素,并计算每个网格的方向线素。将所有网格的方向线素合并,得到维文字符的方向线素。
本发明的实现还在于:使用MQDF分类器和BP神经网络分类器进行分类的过程包括:
3.1对115套的128类维文字符库进行划分,将其中的60套作为训练样本库,剩余的55套作为识别样本库,115套128类手写维文字符库是基于移动终端即手机平台采集的由维吾尔族人手写的字符库;
3.2使用MQDF分类器对60套训练样本库训练,得到128类维文字符的平均MQDF确信度;
3.3将待识别维文字符的特征向量应用于MQDF分类器,得到对应的候选字符集1,候选字符集1有128个候选字符;
3.4对待识别维文字符的MQDF候选字符集1进行概率处理,转化为候选字符集1对应的后验概率,就是候选的置信值集1,置信值集1有128个置信值;
3.5使用BP神经网络分类器对115套的128类维文字符库进行划分,对其中的60套训练样本库训练,得到神经网络分类器的系数;
3.6将待识别维文字的特征向量应用于BP神经网络分类器,得到对应的候选字符集2,候选字符集2有128个候选字符;
3.7对待识别维文字符的BP神经网络候选字符集2进行概率处理,转化为候选集对应的后验概率,就是候选的置信值集2,置信值集2有128个置信值。
本发明采用了不同的分类器分别对手写维文字符的特征向量进行分类,采用的MQDF分类器和BP神经网络分类器复杂度低,易于实现。分类过程能充分考虑特征向量在特征空间中分布的特点,具有较好的鲁棒性和较高的识别率。
本发明的实现还在于:对分类识别结果集成的过程包括:
4.1通过实验确定128个维文字符中每个候选字符的两个置信值(即MQDF的置信值和BP神经网络的置信值)的加权和的权重系数γk
4.2根据得到的加权和的权重系数γk,计算128个维文字符中每个候选字符的两个置信值(MQDF的置信值和BP神经网络的置信值)的加权和gi(x)=γ1p1(wi/x)+γ2p2(wi/x),得到每个字符最终的置信值,128个维文字符的置信值形成最终的置信值集,式中p1(wi/x)表示MQDF分类器对特征向量x所属类别wi的概率估计,p2(wi/x)表示BP神经网络对特征向量x所属类别wi的概率估计;
4.3根据最终置信值集中128个置信值大小,选定最大的置信值对应的字符,确定为待识别字符的识别结果。
本发明采用的分类器集成方法复杂度低,易于实现。相对于独立分类器,分类器的集成可以充分利用各个独立分类器的优点,能有效提高维文字符的识别率。
与现有技术相比,本发明具有如下的优点:
(1)本发明复杂度低,实现较简单,具有较好的鲁棒性。
(2)本发明有效利用了不同分类器的优点,对不同分类器的集成就是集合不同分类器的优点,提高了手写维文字符识别的平均识别率。
(3)本发明平均识别时间较短,达到了实用价值。
附图说明:
图1为本发明的算法示意图;
图2为BP神经网络的结构示意图;
图3为128个维文字符示意图;
图4为手写维文字符的部分样本;
图5为权值矩阵采样过程示意图;
图6为三种算法的平均识别率曲线图。
具体实施方式:
为了使本发明的技术方案更加清楚,下面结合附图对本发明作进一步的说明。
本发明是使用移动终端即手机平台采集的由维吾尔族人手写的字符库,在个人电脑上(处理器Intel酷睿2双核T6400,内存2GB,主频2GHZ)进行了维文字符识别的实验。本发明手写维吾尔文字符识别方法是基于128类维文字符,128类维文字符参照图3。
实施例1
本发明一种基于分类器集成的手写维文字符识别方法,参见图1:对手写维文字符识别过程包括:
步骤1对采集到的手写维文字符进行预处理,去除采集维文字符过程中附加的噪声,得到规范化的维文字符。维文字符预处理过程包括:
1.1裁剪手写维文字符图像,去除维文字符图像中不包含文字轨迹点的区域,留下包含文字轨迹点的区域。
1.2对裁剪后的维文字符进行归一化处理,将大小不同的维文字符图像归一化为大小相同的图像。
1.3对归一化后的维文字符图像进行轨迹点重采样,每隔几个点进行采样,本例中每隔3点采样,若原图像中存在象素点比较紧密而归一化处理后象素点比较稀疏的地方则补象素点。
1.4对重采样后的维文字符图像进行滤波,得到规范化的维文字符。
步骤2提取维文字符的特征向量,将规范化的维文字符从对象空间映射到特征空间,得到维文字符的方向线素,即维文字符的特征向量。维文字符特征向量提取的过程包括:
2.1使用弹性网格对规范化的维文字符图像进行划分;
2.2计算每个网格内的象素点的方向线素,并计算出每个网格的方向象素;
2.3将维文字符的网格降维,并计算出降维后的每个网格的方向象素;
2.4对所有网格的方向线素进行合并,用合并后的方向线素表示维文字符的方向线素,即维文字符的特征向量。
步骤3分别使用MQDF分类器和BP神经网络分类器对维文字符特征向量分类识别,得到分类识别结果,MQDF分类器的分类结果是置信值集1,BP神经网络分类器的分类结果是置信值集2。使用MQDF分类器和BP神经网络分类器进行分类的过程包括:
3.1对115套的128类维文字符库进行划分,将其中的60套作为训练样本库,剩余的55套作为识别样本库,115套128类手写维文字符库是基于移动终端即手机平台采集的由维吾尔族人手写的字符库。
3.2使用MQDF分类器对60套训练样本库训练,得到128类维文字符的平均MQDF确信度。
3.3将待识别维文字符的特征向量应用于MQDF分类器,得到对应的候选字符集1,候选字符集1有128个候选字符。
3.4对待识别维文字符的MQDF候选字符集1进行概率处理,转化为候选字符集1对应的后验概率,就是候选的置信值集1,置信值集1有128个置信值。
本发明采用的MQDF分类器易于实现,分类过程能充分考虑特征向量在特征空间中分布的特点。
3.5使用BP神经网络分类器对115套的128类维文字符库进行划分,对其中的60套训练样本库训练,得到神经网络分类器的系数。
3.6将待识别维文字的特征向量应用于BP神经网络分类器,得到对应的候选字符集2,候选字符集2有128个候选字符。
3.7对待识别维文字符的BP神经网络候选字符集2进行概率处理,转化为候选集对应的后验概率,就是候选的置信值集2,置信值集2有128个置信值。
本发明采用的BP神经网络分类器结构简单,具有较好的鲁棒性和较高的识别率。
步骤4对两种分类识别的结果置信值集1和置信值集2进行集成,计算128个维文字符中每个候选字符的两个置信值的加权和,选择最大的加权和值作为最终的分类识别结果。对分类识别结果集成的过程包括:
4.1通过实验确定128个维文字符中每个候选字符的两个置信值(即MQDF的置信值和BP神经网络的置信值)的加权和的权重系数γk,取γ1=0.1,γ2=0.9。
4.2根据得到的加权和的权重系数γk,计算128个维文字符中每个候选字符的两个置信值的加权和gi(x)=γ1p1(wi/x)+γ2p2(wi/x),得到每个字符最终的置信值,128个维文字符的置信值形成最终的置信值集。因为本发明采用了两个分类器,所以128个维文字符中每个候选字符均有两个置信值,其中有MQDF的置信值和BP神经网络的置信值,式中p1(wi/x)表示MQDF分类器对特征向量x所属类别wi的概率估计,p2(wi/x)表示BP神经网络对特征向量x所属类别wi的概率估计。
4.3根据最终置信值集中128个置信值大小,选定最大的置信值的字符,确定为待识别字符的识别结果。
本发明使用了两种分类器,并将结果集成,提高了识别率。
实施例2
基于分类器集成的手写维文字符识别方法同实施例1,结合具体识别过程对本发明做更详细的说明。本发明的算法如图1所示,主要包括5个部分:预处理、特征提取、MQDF分类器、BP神经网络分类器、分类器集成。
第一部分,预处理。维文字符的预处理由四个部分组成,分别是裁剪、归一化、轨迹点重采样、滤波。
(1)将手机上采集的手写维文字符的轨迹点保存下来,形成维文字符图像,如图4所示,图4中前三行均为手写维文字符,第四行为该维文字符的对应印刷体。
对采集的维文字符图像进行裁剪,将图像中不包含文字信息的区域去除掉,只保留图像中包含文字信息的矩形区域。
(2)对裁剪后的图像做归一化处理,将大小不同的p×Q的字符图像归一化为大小相同的N×N的字符图像,其中P、Q为图像的行列数,P、Q取值由于手写的随意性具有不确定性,N为图像归一化后的行列数,本例中N=64,其实质就是对图像平移和缩放。
(3)将大小相同的64×64的字符图像进行轨迹点重采样,即在图像中每隔几个点进行采样,本例中每隔4点采样,若原图像中存在象素点比较紧密而归一化处理后象素点比较稀疏的地方则补象素点,若图像中无上述现象,则不作补象素点处理。
(4)将重采样后的字符图像进行滤波,滤波采用字符象素点的前后3点加权平均的方法,以减少了由于书写抖动等原因带来的噪声。
第二部分,特征提取。本发明提取的特征向量是方向线素特征向量,其过程如下:
(1)使用8×8的弹性网格将维文字符图像划分成8×8的网格,根据笔画密度函数来划分,笔画密度大的区域网格密,笔画密度小的区域网格疏。
(2)计算每个网格内的象素点的方向线素。给定一个轨迹点Pj,它的方向特征
Figure BSA00000678628200081
其向坐标中的每隔45度的8个方向上进行垂直投影,只有两个方向上有投影值,其余方向上都是0,则8个方向上的值组成的向量就是轨迹点Pj的方向线素,方向线素特征向量的维数为8。对网格内的所有点的方向线素求平均,得到每个网格的方向线素。
(3)将维文字符的网格降维,并计算出降维后的维文字符网格的方向象素。将8×8的网格扩展为9×9的网格,对8×8网格分别补充一行和一列,将原来网格的最后一行和最后一列的特征向量赋给其后面新增加的行和列。使用权值采样矩阵 1 2 1 2 4 2 1 2 1 对9×9网格的特征向量进行加权和,将其变为4×4的网格,并得到4×4网格的每个网格的特征向量,采样过程如图5所示。将4×4=16个网格的特征向量相连合并成一个16×8=128维的方向线素特征向量,即为维文字符的特征向量。
第三部分,MQDF分类器。MQDF分类器使用修正的二次判别函数
Figure BSA00000678628200083
其中,x为待识别维文字符的特征向量,μM是整个维文字符样本集的均值向量,λii≥λi+1)和
Figure BSA00000678628200084
是特征向量x的协方差矩阵∑M的第i个特征值和其对应的特征向量,h2=80,k=5。
(1)对于采集到的115套的128类的维文字符库,将其中的60套作为训练样本,剩余的55套作为识别样本。115套128类手写维文字符库是基于移动终端即手机平台采集的由维吾尔族人手写的字符库,是西安电子科技大学维文字符识别研究的基础。
(2)训练样本训练的过程是:分别对60套的128类字符中的待识别字符的特征向量求MQDF的值g(x),对于每个类就有60个g(x)值,对其求平均得到每个类的平均g(x)值,即平均MQDF确信值,对于维文有128类字符,则也有128个平均MQDF确信值。
(3)识别样本识别的过程是:分别对55套的128类字符的特征向量求MQDF的值g(x),将这个值与128类字符的平均MQDF确信值进行比较,得到待识别字符相对于128个字符中的每个字符的距离值d1(i),i=1,…,128,距离最小的为最佳识别结果。
(4)使用后验概率公式
Figure BSA00000678628200091
i=1,…,128,其中x为待识别维文字符的特征向量,d1(i)为对于MQDF分类器,x到类wi,i=1,…,128中心的距离,p1(wi/x)表示MQDF分类器对x所属类别的概率估计,求得待识别字符相对于128个字符中的每个字符的后验概率值,就是相对应的置信值,所有128个置信值组成的集合就是置信值集1。
第四部分,BP神经网络分类器。BP神经网络如图2所示,其通过输入训练样本x对神经网络进行训练,即通过权值修正函数对神经网络权值系数w进行修正,使神经网络得到确定的权值系数w。
(1)对于采集到的115套的128类的维文字符库,将其中的60套作为训练样本,剩余的55套作为识别样本。
(2)训练样本训练的过程是:分别对60套的128类字符的特征向量x输入到BP神经网络的输入端,得到输出值y,输出值y与已知的期望值d的误差为e=d-y,已知的期望值d有128个,通过权值修正函数w=w+□w,□w为权值系数修正量,调整神经网络的权值系数w,这是一次训练过程,经过反复的多次训练多次调整权值系数w,最终确定神经网络的权值系数w,如图2所示。
(3)识别样本识别的过程是:分别将55套的128类字符中的待识别字符的特征向量x输入到权值系数w已确定的神经网络,得到神经杨洛的输出值y,计算神经网络的输出值y与已知的128个字符中的每个字符的期望输出值d的距离,得到待识别字符相对于128个字符中的每个字符的距离值d2(i),i=1,…,128,距离值最小的为最佳识别结果。
(4)使用后验概率公式
Figure BSA00000678628200101
i=1,…,128,其中x为待识别维文字符的特征向量,d2(i)为对于BP神经网络分类器,x到类wi,i=1,…128中心的距离,p2(wi/x)表示BP神经网络对x所属类别的概率估计,求得待识别字符相对于128个字符中的每个字符的后验概率值,就是相对应的置信值,所有128个置信值组成的集合就是置信值集2。
第五部分,分类器集成。分类器的集成就是综合考虑使用不同分类器得到的置信值集,对MQDF分类器和BP神经网络分类器的置信值进行集成,得到集成的置信值,置信值最大的为最佳识别结果。
(1)计算待识别字符的128个维文字符中的每个字符的两个置信值(MQDF的置信值和BP神经网络的置信值)的加权和gi(x)=γ1p1(wi/x)+γ2p2(wi/x),γ1为MQDF的置信值的权重系数,γ2为BP神经网络的置信值的权重系数,且γ1=0.2,γ2=0.8,得到待识别字符最终的置信值集,最终的置信值集有128个置信值。
(2)根据待识别字符的最终的置信值集中的128个置信值大小,确定待识别字符的识别结果,置信值最大的为最佳识别结果,同时也是第1候选,置信值大小为前两个的为第2候选,置信值大小为前十个的为第10候选,以此类推。
实施例3
基于分类器集成的手写维文字符识别方法同实施例1-2,本发明所述的手写维吾尔文字符识别系统的性能,可通过如下实验测试进一步说明。
本实验测试是在处理器为Intel酷睿2双核T6400,内存2GB,主频2GHZ的个人电脑上完成的。实验采用西安电子科技大学智能信号处理与模式识别实验室的手写维吾尔文字符集,字符集数据的采集是使用移动终端手机平台,由维吾尔族人书写,没有任何书写限制,保证了样本的准确性和实用价值,该字符集含有128个字符类,每个字符类有115套,选取其中的60套作为训练样本,剩下的55套作为识别样本,部分样本参照图示4。。
实验采用三种算法,每种算法的特征向量均为方向线素特征向量,方向线素特征提取方法参考文献A Study On the Use of 8-Directional Features For Online HandwrittenChinese Character Recognition(Zhen-Long Bai and Qiang Huo,Proceedings Of The 2005Eight International Conference On Document Analysis And Recognition,2005),第一种算法采用MQDF分类器,MQDF参考文献Modified Quadratic Discriminant Functions AndThe Application To Chinese Character Recognition(Fumitaka Kimura,IEEE TransactionsOn PatternAnalysis And Machine Intelligence,1987),第二种算法采用BP神经网络分类器,BP神经网络参考文献Neural Networks(Simon Haykin),第三种算法采用本发明所提出的MQDF分类器与BP神经网络分类器集成的算法。三种算法对所有识别样本的平均识别率如图6所示,MQDF分类器的平均识别率为86.76%,BP神经网络分类器的平均识别率为84.73%,MQDF和BP神经网络分类器集成的平均识别率为90.81%。
根据本发明基于分类器集成的维文字符识别方法,已成功实现了维文字符识别系统,正如图6所示,对比算法一,算法二和算法三的平均识别率可知,在相同的提取特征的方法下,本发明使用基于分类器集成的算法三比使用单分类器的算法一提高了4.05%,比算法二提高了6.08%。本发明所采用的分类器集成的方法平均识别率较高,识别结果比较可靠,同时也为维文字符的单词识别奠定了坚实的基础。
实施例4
基于分类器集成的手写维文字符识别方法同实施例1-2
表1列出了本发明基于分类器集成的手写维文字符识别方法的候选平均识别率,手写维文字符的平均识别时间为15.6ms/字符。
表1本发明算法的候选平均识别率
  第1候选   第3候选   第5候选   第10候选
  平均识别率   90.81%   94.43%   97.35%   99.22%
上述实验可知,本发明手写维吾尔文字符识别系统的第1候选平均识别率为90.81%,第10候选平均识别率为99.22%,平均识别时间为15.6ms/字符,算法性能达到了实用要求。
综上,本发明的基于分类器集成的手写维文字符识别方法,首先通过裁剪、归一化、轨迹点重采样、滤波方法对手写维文字符预处理,接着利用方向线素提取维文字符的特征向量,然后分别使用MQDF分类器和BP神经网络分类器对维文字符特征向量进行分类,对分类识别的结果即MQDF置信值集和BP神经网络置信值集进行集成,具体是通过两个置信值的加权和实现集成,得到最终置信值集,选择最大的置信值作为识别结果。其过程如图1所示。本发明具有算法性能好、实时性强、可靠性高、识别率高等优点,主要应用于移动平台即手机上实现手写维文识别,为维文的信息化处理提供了一种新的方法,开辟了新的应用途径。

Claims (5)

1.一种基于分类器集成的手写维文字符识别方法,其特征在于:识别过程包括:
步骤1对采集到的手写维文字符进行预处理,去除采集维文字符过程中附加的噪声,得到规范化的维文字符;
步骤2提取维文字符的特征向量,将规范化的维文字符从对象空间映射到特征空间,得到维文字符的方向线素,即维文字符的特征向量;
步骤3分别使用MQDF分类器和BP神经网络分类器对维文字符特征向量分类识别,得到分类识别结果,MQDF分类器的分类结果是置信值集1和BP神经网络分类器的分类结果是置信值集2;
步骤4对两种分类识别的结果置信值集1和置信值集2进行集成,计算128个维文字符中每个候选字符的两个置信值的加权和,选择最大的加权和值作为最终的分类识别结果。
2.根据权利要求1所述的基于分类器集成的手写维文字符识别方法,其特征在于:
维文字符预处理过程包括:
1.1裁剪手写维文字符图像,去除维文字符图像中不包含文字轨迹点的区域,留下包含文字轨迹点的区域;
1.2对裁剪后的维文字符进行归一化处理,将大小不同的维文字符图像归一化为大小相同的图像;
1.3对归一化后的维文字符图像进行轨迹点重采样,每隔几个点进行采样,若原图像中存在象素点比较紧密而归一化处理后象素点比较稀疏的地方则补象素点;
1.4对重采样后的维文字符图像进行滤波,得到规范化的维文字符。
3.根据权利要求2所述的基于分类器集成的手写维文字符识别方法,其特征在于:
维文字符特征向量提取的过程包括:
2.1使用弹性网格对规范化的维文字符图像进行划分;
2.2计算每个网格内的象素点的方向线素,并计算出每个网格的方向象素;
2.3将维文字符的网格降维,并计算出降维后的维文字符每个网格的方向象素;
2.4对所有网格的方向线素进行合并,用合并后的方向线素表示维文字符的方向线素,即维文字符的特征向量。
4.根据权利要求3所述的基于分类器集成的手写维文字符识别方法,其特征在于:
使用MQDF分类器和BP神经网络分类器进行分类的过程包括:
3.1对115套的128类维文字符库进行划分,将其中的60套作为训练样本库,剩余的55套作为识别样本库,115套128类手写维文字符库是基于移动终端即手机平台采集的由维吾尔族人手写的字符库;
3.2使用MQDF分类器对60套训练样本库训练,得到128类维文字符的平均MQDF确信度;
3.3将待识别维文字符的特征向量应用于MQDF分类器,得到对应的候选字符集1,候选字符集1有128个候选字符;
3.4对待识别维文字符的MQDF候选字符集1进行概率处理,转化为候选字符集1对应的后验概率,就是候选的置信值集1,置信值集1有128个置信值;
3.5使用BP神经网络分类器对115套的128类维文字符库进行划分,对其中的60套训练样本库训练,得到神经网络分类器的系数;
3.6将待识别维文字的特征向量应用于BP神经网络分类器,得到对应的候选字符集2,候选字符集2有128个候选字符;
3.7对待识别维文字符的BP神经网络候选字符集2进行概率处理,转化为候选集对应的后验概率,就是候选的置信值集2,置信值集2有128个置信值。
5.根据权利要求4所述的基于分类器集成的手写维文字符识别方法,其特征在于:
对分类识别结果集成的过程包括:
4.1通过实验确定128个维文字符中每个候选字符的两个置信值(即MQDF的置信值和BP神经网络的置信值)的加权和的权重系数γk
4.2根据得到的加权和的权重系数γk,计算128个维文字符中每个候选字符的两个置信值(MQDF的置信值和BP神经网络的置信值)的加权和gi(x)=γ1p1(wi/x)+γ2p2(wi/x),得到每个字符最终的置信值,128个维文字符的置信值形成最终的置信值集,式中p1(wi/x)表示MQDF分类器对特征向量x所属类别wi的概率估计,p2(wi/x)表示BP神经网络对特征向量x所属类别wi的概率估计;
4.3根据最终置信值集中128个置信值大小,选定最大的置信值对应的字符,确定为待识别字符的识别结果。
CN201210055726.6A 2012-03-05 2012-03-05 一种基于分类器集成的手写维文字符识别方法 Expired - Fee Related CN102622610B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210055726.6A CN102622610B (zh) 2012-03-05 2012-03-05 一种基于分类器集成的手写维文字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210055726.6A CN102622610B (zh) 2012-03-05 2012-03-05 一种基于分类器集成的手写维文字符识别方法

Publications (2)

Publication Number Publication Date
CN102622610A true CN102622610A (zh) 2012-08-01
CN102622610B CN102622610B (zh) 2014-04-02

Family

ID=46562520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210055726.6A Expired - Fee Related CN102622610B (zh) 2012-03-05 2012-03-05 一种基于分类器集成的手写维文字符识别方法

Country Status (1)

Country Link
CN (1) CN102622610B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745213A (zh) * 2014-02-28 2014-04-23 中国人民解放军63680部队 基于lvq神经网络的光学字符识别方法
CN103885607A (zh) * 2012-12-19 2014-06-25 新疆信息产业有限责任公司 基于嵌入式系统的维吾尔文连写判断与存储方法
CN104463101A (zh) * 2014-11-06 2015-03-25 科大讯飞股份有限公司 用于文字性试题的答案识别方法及系统
CN104504373A (zh) * 2014-12-18 2015-04-08 电子科技大学 一种用于fmri数据的特征选择方法
CN106127266A (zh) * 2016-08-29 2016-11-16 大连民族大学 手写满文字母识别方法
CN106250926A (zh) * 2016-07-29 2016-12-21 华东师范大学 一种二次判别函数分类器存储空间的压缩方法
CN106355200A (zh) * 2016-08-29 2017-01-25 大连民族大学 手写满文字母识别装置
CN106408002A (zh) * 2016-08-29 2017-02-15 大连民族大学 手写满文字母识别的系统
CN106650820A (zh) * 2016-12-30 2017-05-10 山东大学 一种手写电气元器件符号与标准电气元器件符号的匹配识别方法
CN107480682A (zh) * 2017-08-25 2017-12-15 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN108288078A (zh) * 2017-12-07 2018-07-17 腾讯科技(深圳)有限公司 一种图像中字符识别方法、装置和介质
CN108364006A (zh) * 2018-01-17 2018-08-03 超凡影像科技股份有限公司 基于多模式深度学习的医学图像分类装置及其构建方法
CN108764036A (zh) * 2018-04-24 2018-11-06 西安电子科技大学 一种手写体藏文字丁识别方法
CN109766559A (zh) * 2019-01-11 2019-05-17 沈阳舞指科技有限公司 一种手语识别翻译系统及其识别方法
CN109800763A (zh) * 2019-02-09 2019-05-24 鲁东大学 一种基于深度学习的手写中文识别方法
CN110555431A (zh) * 2019-09-10 2019-12-10 杭州橙鹰数据技术有限公司 一种图像识别的方法和装置
CN111652332A (zh) * 2020-06-09 2020-09-11 山东大学 基于二分类的深度学习手写中文字符识别方法及系统
CN113971805A (zh) * 2021-12-22 2022-01-25 深圳市迪博企业风险管理技术有限公司 一种结合机器视觉和语义分析的智能阅卷评分方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630367A (zh) * 2009-07-31 2010-01-20 北京科技大学 基于多分类器的手写体字符识别拒识方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630367A (zh) * 2009-07-31 2010-01-20 北京科技大学 基于多分类器的手写体字符识别拒识方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱龙华等: "基于组合特征的多分类器集成的脱机手写体彝文字体识别", 《云南民族大学学报自然科学版》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885607A (zh) * 2012-12-19 2014-06-25 新疆信息产业有限责任公司 基于嵌入式系统的维吾尔文连写判断与存储方法
CN103745213A (zh) * 2014-02-28 2014-04-23 中国人民解放军63680部队 基于lvq神经网络的光学字符识别方法
CN104463101A (zh) * 2014-11-06 2015-03-25 科大讯飞股份有限公司 用于文字性试题的答案识别方法及系统
CN104463101B (zh) * 2014-11-06 2017-08-25 科大讯飞股份有限公司 用于文字性试题的答案识别方法及系统
CN104504373A (zh) * 2014-12-18 2015-04-08 电子科技大学 一种用于fmri数据的特征选择方法
CN106250926A (zh) * 2016-07-29 2016-12-21 华东师范大学 一种二次判别函数分类器存储空间的压缩方法
CN106127266A (zh) * 2016-08-29 2016-11-16 大连民族大学 手写满文字母识别方法
CN106355200A (zh) * 2016-08-29 2017-01-25 大连民族大学 手写满文字母识别装置
CN106408002A (zh) * 2016-08-29 2017-02-15 大连民族大学 手写满文字母识别的系统
CN106650820B (zh) * 2016-12-30 2020-04-24 山东大学 一种手写电气元器件符号与标准电气元器件符号的匹配识别方法
CN106650820A (zh) * 2016-12-30 2017-05-10 山东大学 一种手写电气元器件符号与标准电气元器件符号的匹配识别方法
CN107480682A (zh) * 2017-08-25 2017-12-15 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN107480682B (zh) * 2017-08-25 2020-01-17 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN108288078A (zh) * 2017-12-07 2018-07-17 腾讯科技(深圳)有限公司 一种图像中字符识别方法、装置和介质
CN108364006A (zh) * 2018-01-17 2018-08-03 超凡影像科技股份有限公司 基于多模式深度学习的医学图像分类装置及其构建方法
CN108364006B (zh) * 2018-01-17 2022-03-08 超凡影像科技股份有限公司 基于多模式深度学习的医学图像分类装置及其构建方法
CN108764036A (zh) * 2018-04-24 2018-11-06 西安电子科技大学 一种手写体藏文字丁识别方法
CN109766559A (zh) * 2019-01-11 2019-05-17 沈阳舞指科技有限公司 一种手语识别翻译系统及其识别方法
CN109766559B (zh) * 2019-01-11 2023-09-05 沈阳舞指科技有限公司 一种手语识别翻译系统及其识别方法
CN109800763A (zh) * 2019-02-09 2019-05-24 鲁东大学 一种基于深度学习的手写中文识别方法
CN110555431A (zh) * 2019-09-10 2019-12-10 杭州橙鹰数据技术有限公司 一种图像识别的方法和装置
CN111652332A (zh) * 2020-06-09 2020-09-11 山东大学 基于二分类的深度学习手写中文字符识别方法及系统
CN113971805A (zh) * 2021-12-22 2022-01-25 深圳市迪博企业风险管理技术有限公司 一种结合机器视觉和语义分析的智能阅卷评分方法

Also Published As

Publication number Publication date
CN102622610B (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
CN102622610B (zh) 一种基于分类器集成的手写维文字符识别方法
Chacko et al. Handwritten character recognition using wavelet energy and extreme learning machine
US10163019B1 (en) Arabic handwriting recognition system and method
US8391613B2 (en) Statistical online character recognition
Pal et al. Handwritten Bangla compound character recognition using gradient feature
CN1333366C (zh) 基于统计结构特征的联机手写汉字识别方法
CN108805076B (zh) 环境影响评估报告书表格文字的提取方法及系统
CN104899601A (zh) 一种手写维吾尔文单词识别方法
CN101866417A (zh) 一种手写体维吾尔字符识别方法
CN101807258A (zh) 基于核标度切维数约简的合成孔径雷达图像目标识别方法
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
Dai Nguyen et al. Recognition of online handwritten math symbols using deep neural networks
Ashlin Deepa et al. A novel nearest interest point classifier for offline Tamil handwritten character recognition
Moni et al. Modified quadratic classifier and directional features for handwritten Malayalam character recognition
CN101452357B (zh) 一种手写字符输入方法及系统
Chen et al. Offline handwritten digits recognition using machine learning
Keshari et al. Hybrid mathematical symbol recognition using support vector machines
Mali et al. Indian sign language recognition using SVM classifier
CN103942572A (zh) 一种基于双向压缩数据空间维度缩减的面部表情特征提取方法和装置
CN106295478A (zh) 一种图像特征提取方法和装置
Zhang et al. Hybrid feature extraction and feature selection for improving recognition accuracy of handwritten numerals
CN112200216A (zh) 汉字识别方法、装置、计算机设备和存储介质
Jubair et al. A simplified method for handwritten character recognition from document image
CN101604378B (zh) 一种用于联机手写汉字识别的汉字笔画特征串行提取方法
Kumar et al. MDP feature extraction technique for offline handwritten Gurmukhi character recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140402

Termination date: 20200305