CN107067046B - 基于混合特征提取的手写数字识别方法 - Google Patents

基于混合特征提取的手写数字识别方法 Download PDF

Info

Publication number
CN107067046B
CN107067046B CN201611078514.4A CN201611078514A CN107067046B CN 107067046 B CN107067046 B CN 107067046B CN 201611078514 A CN201611078514 A CN 201611078514A CN 107067046 B CN107067046 B CN 107067046B
Authority
CN
China
Prior art keywords
handwritten
recognition
features
feature
digit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611078514.4A
Other languages
English (en)
Other versions
CN107067046A (zh
Inventor
王蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute of Technology
Original Assignee
Nanjing Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute of Technology filed Critical Nanjing Institute of Technology
Priority to CN201611078514.4A priority Critical patent/CN107067046B/zh
Publication of CN107067046A publication Critical patent/CN107067046A/zh
Application granted granted Critical
Publication of CN107067046B publication Critical patent/CN107067046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供一种基于混合特征提取的手写数字识别方法,首先采用温度阵列手写数字输入终端进行手写数字信息的采集,并通过预处理去掉首尾的无效帧;然后根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取静态特征;得到包括静态特征和动态特征的混合特征向量,归一化处理后,进行特征选择,得到反映手写数字本质特征的特征向量;将这些特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。本发明不仅能够有效抑制环境噪声对识别结果的影响,同时对不同人、不同手写笔顺的手写数字识别能够达到较高的正确识别率。

Description

基于混合特征提取的手写数字识别方法
技术领域
本发明涉及一种基于混合特征提取的手写数字识别方法。
背景技术
随着智能手机、平板电脑等手持设备的广泛应用,手写输入作为一种更便捷的人机交互方式,越来越得到人们的青睐,联机手写识别技术得到了快速发展。而手写数字缺乏上下文联系,给识别带来了更大的困难。
对手写数字进行识别,首先要对从手写输入装置获取的手写数字信息进行预处理,然后再进行特征提取,最后进行特征分类。其中特征提取和分类是最重要的环节,而特征提取的好坏决定了识别正确率的高低。
目前常用的特征提取算法有如下几种:
统计特征提取和结构特征提取(1.Das N,Reddy J M,Sarkar R,et al.Astatistical-topological feature combination for recognition of handwrittennumerals[J].Applied Soft Computing,2012,12(8):2486-2495.2.Babu U R,Chintha AK,Venkateswarlu Y.Handwritten Digit Recognition Using Structural,StatisticalFeatures and K-nearest Neighbor Classifier[J].International Journal ofInformation Engineering and Electronic Business(IJIEEB),2014,6(1):62.);统计特征对图像细节和噪声不敏感,但是对一些精细结构不能有效提取;结构特征能把握数字固有的笔画结构,但是对数字结构的变动较为敏感,对于不同的手写字形不能给出较满意的分离效果。
静态特征提取和动态特征提取(3.Hafsa,W.,Kherallah,M.,Ben Jemaa,M.,BenAmara,E N.,2004.A hybrid approach of neural networks/hidden markov model foron-line recognition of the Arabic digits[C]//IEEE Internat.Conf.on SCS’04.Mounastir,Tunisie,pp.137–141.4.Kherallah,M.,Haddad L.,Alimi M.A.,MiticheA.On-line Handwritten Digit Recognition Based on Traj ectory and VelocityModeling[J].Pattern Recognition Letters,2008,29:580-594.);静态特征对数字笔划书写先后顺序不敏感,但容易受到局部噪声的影响;动态特征对噪声和数字的细小变形不敏感,但书写顺序的不同会造成误识别。
局部特征提取和全局特征提取(5.Dixon R S,Dolfing J G,Meier U,etal.Integrating Stroke-distribution Information into Spatial FeatureExtraction for Automatic Handwriting Recognition:U.S.Patent 20,140,363,082[P].2014-12-11.6.Nibaran Das,Ram Sarkar,Subhadip Basu,et al.A geneticalgorithm based region sampling for selection of local features inhandwritten digit recognition application[J].Applied Soft Computing.2012,12(5):1592-1606 7.Minoru Mori;Seiichi Uchida;Hitoshi Sakano.Global Feature forOnline Character Recognition[J].Pattern Recognition Letters 2014,35,142-148.)等。局部特征能够把握数字局部笔划、形状等的特点,但易受到噪声的干扰;全局特征考虑了手写数字的非马尔可夫特征,并且对局部噪声不敏感,但书写顺序、书写习惯的不同会影响全局特征的正确提取。传统的特征提取算法一般是提取手写数字的某类特征,一旦对某个数字的某类特征提取失败,将会得到错误的分类结果。
发明内容
本发明的目的是提供一种基于混合特征提取的手写数字识别方法,对一种温度阵列手写数字输入终端数据进行采集和识别,从而实现在线手写数字识别的方法,能够有效抑制环境噪声对在线识别产生的影响,同时避免了不同手写者、不同手写比划顺序等造成的误识别或拒识别,解决现有技术中存在的上述问题。
本发明的技术解决方案是:
一种基于混合特征提取的手写数字识别方法,包括以下步骤,
S1、手写数字信息获取,对温度阵列手写数字输入终端进行手写数字信息的数据采集、预处理,随着手写数字的书写,采用温度阵列手写数字输入终端采集到的数据帧的值的分布随之变化,判断落笔时刻和起笔时刻,消除无效数据帧;
S2、手写数字混合特征提取,根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取反映手写数字结构、比划特征等的静态特征;由此得到包括静态特征和动态特征的混合特征向量;
S3、手写数字特征选择,对步骤S2得到的动态特征和静态特征进行分析,对特征向量归一化处理后,采用主分量分析法进行特征选择,选择能反映手写数字本质特征的主分量,构成手写数字的特征向量;
S4、手写数字识别,将步骤S3得到手写数字的特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。
进一步地,步骤S1中,基于温度阵列手写数字输入终端的手写数字信息的获取与预处理,具体步骤如下:
S11、计算机通过串口采集温度阵列输入终端的手写输入数据帧,并根据数据帧中温度的变化特征,去掉落笔前和起笔后的无效帧;
S12、当一个数字书写完成后,将得到的多帧数据进行去噪处理,然后加权平均,得到一个手写数字的静态数据帧。
进一步地,步骤S2中,动态特征提取步骤如下:
首先,建立手写数字动态特征库,并给出每个特征的定义;
其次,建立手写数字动态特征识别规则库;
再次,用测试样本集对识别规则库进行测试,根据测试结果对特征和规则进行调整,直到满意的测试结果为止;
最后,根据测试结果得出最优的动态特征。
进一步地,步骤S2中,提取了手写数字的六个动态特征,分别为:
特征一:起笔点与落笔点之间的距离;
特征二:起笔点到落笔点的矢量方向;
特征三:每个笔划矢量角度的代数和;
特征四:相邻两笔划矢量的夹角;
特征五:相邻两笔划矢量夹角绝对值的最大值;
特征六:所有笔划矢量旋转方向的变化次数。
进一步地,步骤S2中,采用粗网格特征提取方法提取手写数字的温度分布特征,即静态特征,首先对一个数字的多帧数据进行求和平均,然后把平均数据帧中的矩阵分成几个局部小区域,把每个小区域上的点阵密度作为描述特征,即统计每个小区域中图像像素所占百分比作为特征数据。
进一步地,步骤S3进行手写数字特征选择,具体为:
假设xi为第i个输入样本,用列向量表示,输入样本为
X=(x1,x2,…,xN) (1)
S31、计算输入样本中所有的混合特征向量的平均向量;
Figure BDA0001165403970000031
其中,N为输入样本的样本数量;
S32、计算输入样本中每个特征向量与平均向量的向量差;
Figure BDA0001165403970000041
S33、计算输入样本中特征向量的协方差矩阵;
Figure BDA0001165403970000042
式中,D=[d1,d2,…,di…,dN],i为1到N间的一个整数;T表示向量转置;
S34、采用奇异值分解方法计算测试样本特征向量协方差矩阵的非零特征值λj,及其对应的特征向量uj,j为1到r间的一个整数由此得到特征子空间为
U=[u1,u2,…,uj,…,ur] (4)
式中,r为选择的主特征向量的数目;
S35、将训练样本或测试样本投影到特征子空间,即可得到被选择的特征向量:
Pi=UTdi (5)。
进一步地,步骤S4中,手写数字识别的具体步骤如下:
首先,设置支持向量机SVM分类器的参数;
其次,选择训练样本集,用于支持向量机SVM分类器的训练,得到支持向量机SVM模型;
再次,采用测试样本集用训练得到的支持向量机SVM模型进行分类,得到测试分类结果,即最终的识别结果。
进一步地,对测试分类结果进行评估,包括对正确识别率和识别时间的评估,从而得到对识别方法的优劣判断:正确识别率越高,识别方法越好;识别时间越短,识别方法越好。
进一步地,步骤S4中,采用一对一法实现多类支持向量机SVM分类器,具体为:在任意两类样本之间设计一个支持向量机SVM分类器,对k个类别的样本设计k(k-1)/2个支持向量机SVM分类器。
本发明的有益效果是,与现有技术相比,本发明不仅能够有效抑制环境噪声对在线识别产生的影响,同时避免了不同手写者、不同手写比划顺序等造成的误识别或拒识别,对不同人、不同手写笔顺的手写数字识别能够达到较高的正确识别率。
附图说明
图1是本发明实施例基于混合特征提取的手写数字识别方法的流程示意图。
图2是实施例中温度传感阵列的说明示意图。
图3是实施例中基于温度阵列手写输入终端得到的数据帧颜色分布示意图,颜色越红表示温度越高,颜色越蓝表示温度越低,其中,(a)为数字1的数据帧颜色分布示意图,(b)为数字7的数据帧颜色分布示意图。
图4是实施例中手写数字轨迹示意图。
图5是实施例中基于动态特征的手写数字识别规则示意图。
图6是实施例中不同参数下的支持向量机SVM分类器的识别率结果图,横坐标为惩罚因子,纵坐标为核函数参数,二位颜色分布图表示分类器识别率,其中,(a)为基于静态特征的支持向量机SVM分类器识别率,(b)为基于动态特征的支持向量机SVM分类器识别率,(c)为基于混合特征的支持向量机SVM分类器识别率。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例的基于混合特征提取的手写数字识别方法,首先根据手写过程中手指尖与温度阵列手写数字输入终端接触引起的温度变化特征,对采集到的数据帧进行预处理,去除落笔前和起笔后的无效帧。接下来收集了大量的测试样本,对动态特征的提取进行反复实验,得到能反映不同数字书写特征的六个动态特征。采用粗网格特征提取方法提取手写数字的温度分布特征,即静态特征。该特征对噪声有较强的容忍度,特别是对数字部分笔划的形变和孤立的噪声点不敏感。实施例进一步针对温度阵列手写输入终端,提出了基于混合特征的支持向量机SVM分类器,该过程通过对训练集数据进行反复训练和参数选择,得到具有高分类正确率和强泛化能力的支持向量机SVM模型。采用测试数据集对支持向量机SVM分类器进行测试,得到具有高的测试正确率的混合特征支持向量机SVM分类器。
实施例
结合图1,一种基于混合特征提取的手写数字识别方法,包括以下步骤:
第一步,手写数字信息获取。即对温度阵列手写数字输入终端进行数据采集、预处理等。根据温度阵列输入终端传感器的特点,随着手写数字的书写,采集到的数据帧的值的分布随之变化,判断落笔时刻和起笔时刻,消除无效数据帧。
温度阵列手写数字输入终端采用基于温度传感器阵列的手写数字输入终端,进行手写数字的数据采集。如图2所示,采用温度传感阵列,阵列大小为8×16作为手写输入终端,当手指接触输入终端,接触点的温度开始升高,随着手指移动,不同位置或区域的温度传感器的温度随之升高,由此得到一序列的具有不同温度分布的数据帧,如图3所示。
第二步,手写数字混合特征提取。混合特征包括动态特征和静态特征。
动态特征是表示手写数字过程中指尖的运动特征。选择了代表不同数字的手写比划特点的六个特征作为动态特征。
在手写数字输入过程中,根据连续帧的温度变化,提取指尖运动轨迹,如图4所示,在此基础上进行动态特征的提取,如表1所示。
表1基于温度传感阵列的手写数字动态特征
特征数 物理意义 特征符号
1 手写数字起笔点与落笔点之间的距离; f<sub>1</sub>
2 手写数字起笔点到落笔点的矢量方向; f<sub>2</sub>
3 手写数字中每个笔划矢量角度的代数和; f<sub>3</sub>
4 手写数字中相邻两笔划矢量的夹角; f<sub>4</sub>
5 手写数字中相邻两笔划矢量夹角绝对值的最大值; f<sub>5</sub>
6 手写数字中所有笔划矢量旋转方向的变化次数; f<sub>6</sub>
并建立基于动态特征的手写数字识别规则,如表2、表3和图5所示,根据该规则,对训练数据集进行分类。根据分类效果选择最终的动态特征。
表2基于动态特征的识别规则前项内容
Figure BDA0001165403970000061
Figure BDA0001165403970000071
表3基于动态特征的手写数字分类规则表
Figure BDA0001165403970000072
采用粗网格特征提取方法提取手写数字的温度分布特征,即静态特征。首先对一个数字的多帧数据进行求和平均。然后把平均数据帧中的矩阵分成几个局部小区域,把每个小区域上的点阵密度作为描述特征,即统计每个小区域中图像像素所占百分比作为特征数据。粗网格特征对噪声有较强的容忍度,特别是对数字部分笔划的形变和孤立的噪声点不敏感,并且有利于识别率的提高。这里实施例采用5×5的网格进行特征提取,得到25×1的静态特征向量。
第三步,手写数字特征选择,即对第二步得到的动态特征和静态特征进行分析,选择能反映手写数字本质特征的主分量。采用主分量分析法,选择具有代表性的手写数字特征,得到降维的向量空间。具体为:
假设xi为第i个输入样本,用列向量表示,输入样本为
X=(x1,x2,…,xN) (1)
S31、计算输入样本中所有的混合特征向量的平均向量;
Figure BDA0001165403970000081
其中,N为输入样本的样本数量;
S32、计算输入样本中每个特征向量与平均向量的向量差;
Figure BDA0001165403970000082
S33、计算输入样本中特征向量的协方差矩阵;
Figure BDA0001165403970000083
式中,D=[d1,d2,…,di…,dN],i为1到N间的一个整数;T表示向量转置;
S34、采用奇异值分解方法计算测试样本特征向量协方差矩阵的非零特征值λj,及其对应的特征向量uj,j为1到r间的一个整数由此得到特征子空间为
U=[u1,u2,…,uj,…,ur] (4)
式中,r为选择的主特征向量的数目;
S35、将训练样本或测试样本投影到特征子空间,即可得到被选择的特征向量:
Pi=UTdi (5)。
第四步,手写数字识别,即手写数字分类器的训练和分类。选择训练数据集对支持向量机SVM分类器进行训练,输入为选择后的混合特征向量,输出为实际的数字。在训练过程中通过调节支持向量机SVM分类器的参数包括惩罚因子和核函数参数,得到不同的训练精度,如图6所示,最后得到分类器的最优参数范围,建立支持向量机SVM模型。对支持向量机SVM模型,采用测试数据进行测试分类,测试分类结果是最终的识别结果。
基于温度传感阵列的手写数字特征分类是一种非线性可分的多元(10个类别:数字0-9)分类问题。基本支持向量机SVM只针对两类分类问题,为了实现多类分类,实施例采用一对一法实现多类支持向量机SVM分类器,其做法是在任意两类样本之间设计一个支持向量机SVM分类器,因此k个类别的样本就需要设计k(k-1)/2个支持向量机SVM分类器,本实施例中需要构造45个支持向量机SVM分类器。当对一个未知样本进行分类时,最后得票最多的类别即为该未知样本的类别。当训练样本量很大时,支持向量机SVM分类器计算量会很大,为了减小其计算量,实施例采用了Piatt的序列最小优化算法即SMO算法。
手写数字识别的具体步骤如下:首先,设置支持向量机SVM分类器的参数;其次,选择训练样本集,用于支持向量机SVM分类器的训练,得到支持向量机SVM模型;再次,采用测试样本集用训练得到的支持向量机SVM模型进行分类。
最后,对测试分类结果进行评估,包括对正确识别率和识别时间的评估,从而得到对识别方法的优劣判断:正确识别率越高,识别方法越好;识别时间越短,识别方法越好。将基于混合特征的手写数字识别方法与基于动态特征的手写数字识别方法、基于静态特征的手写数字识别方法进行比较,得到图6、表4、表5所示的识别结果。
表4基于混合特征的识别方法在不同分类器参数下的识别率
Figure BDA0001165403970000091
表5三种识别方法的处理时间表
识别方法* 预处理时间(秒) 特征提取时间(秒) 分类时间(秒) 总的处理时间(秒)
SVM1 0.01384 0.01503 0.001056 0.02993
SVM2 0.01378 0.00036 0.000834 0.01497
SVM3 0.01397 0.01504 0.001137 0.03015
*注:SVM1是基于静态特征的识别方法;SVM2是基于动态特征的识别方法;SVM3是基于混合特征的识别方法。
由图6可以看出,相比于基于动态特征或静态特征的手写数字识别方法,基于混合特征的手写数字识别方法在分类参数相同的情况,具有较高的识别率,并且在识别率高于99%时分类器参数的选择范围更广,因此该识别方法具有更高的识别稳定性和泛化能力。
由表4可以看出,当分类器的参数满足以下条件:惩罚因子C〉1.48,核函数参数γ>0.01时,基于混合特征的手写数字识别方法的正确识别率大于95%;当分类器的参数满足以下条件:惩罚因子C〉1.48,核函数参数γ>0.1时,基于混合特征的手写数字识别方法的正确识别率达到100%。
由表5可以看出,基于混合特征的手写数字识别方法的处理时间与基于静态特征的手写数字识别方法的处理时间相当,但正确识别率较高;基于混合特征的手写数字识别方法的处理时间大于基于动态特征的手写数字识别方法的处理时间,但基于混合特征的手写数字识别方法的正确识别率远远高于基于动态特征的手写数字识别方法。

Claims (6)

1.一种基于混合特征提取的手写数字识别方法,其特征在于:包括以下步骤,
S1、手写数字信息获取,对温度阵列手写数字输入终端进行手写数字信息的采集、预处理,随着手写数字的书写,通过温度阵列手写数字输入终端采集到的数据帧的值的分布随之变化,判断落笔时刻和起笔时刻,消除无效数据帧;其中,基于温度阵列手写数字输入终端的手写数字信息的获取与预处理,具体步骤如下:
S11、计算机通过串口采集温度阵列手写数字输入终端的手写输入数据帧,并根据数据帧中温度的变化特征,去掉落笔前和起笔后的无效帧;
S12、当一个数字书写完成后,将得到的多帧数据进行去噪处理,然后加权平均,得到一个手写数字的静态数据帧;
S2、手写数字混合特征提取,根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取反映手写数字结构、比划特征的静态特征;由此得到包括静态特征和动态特征的混合特征向量;
步骤S2中,动态特征提取步骤如下:首先,建立手写数字动态特征库,并给出每个特征的定义;其次,建立手写数字动态特征识别规则库;再次,用测试样本集对识别规则库进行测试,根据测试结果对特征和规则进行调整,直到测试样本正确识别率达到98%为止;最后,根据测试结果得出最优的动态特征;
步骤S2中,提取手写数字的六个动态特征,分别为:特征一:起笔点与落笔点之间的距离;特征二:起笔点到落笔点的矢量方向;特征三:每个笔划矢量角度的代数和;特征四:相邻两笔划矢量的夹角;特征五:相邻两笔划矢量夹角绝对值的最大值;特征六:所有笔划矢量旋转方向的变化次数;
S3、手写数字特征选择,对步骤S2得到的动态特征和静态特征进行分析,对混合特征向量归一化处理后,采用主分量分析法进行特征选择,选择能反映手写数字本质特征的主分量,构成手写数字的特征向量;
S4、手写数字识别,将步骤S3得到手写数字的特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。
2.如权利要求1所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S2中,采用粗网格特征提取方法提取手写数字的温度分布特征,即静态特征,首先对一个数字的多帧数据进行求和平均,然后把平均数据帧中的矩阵分成几个局部小区域,把每个小区域上的点阵密度作为描述特征,即统计每个小区域中图像像素所占百分比作为特征数据。
3.如权利要求1所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S3进行手写数字特征选择,具体为:
假设xi为第i个输入样本,用列向量表示,输入样本为
X=(x1,x2,…,xN) (1)
S31、计算输入样本中所有的混合特征向量的平均向量;
Figure FDA0002442187020000021
其中,N为输入样本的样本数量;
S32、计算输入样本中每个特征向量与平均向量的向量差;
Figure FDA0002442187020000022
S33、计算输入样本中特征向量的协方差矩阵;
Figure FDA0002442187020000023
式中,D=[d1,d2,…,di…,dN],i为1到N间的一个整数;T表示向量转置;
S34、采用奇异值分解方法计算测试样本特征向量协方差矩阵的非零特征值λj,及其对应的特征向量uj,j为1到r间的一个整数由此得到特征子空间为
U=[u1,u2,…,uj,…,ur] (4)
式中,r为选择的主特征向量的数目;
S35、将训练样本或测试样本投影到特征子空间,即可得到被选择的特征向量:
Pi=UTdi (5)。
4.如权利要求1所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S4中,手写数字识别的具体步骤如下:
首先,设置支持向量机SVM分类器的参数;在训练过程中通过调节支持向量机SVM分类器的参数包括惩罚因子和核函数参数,得到不同的训练精度;当分类器的参数满足以下条件:惩罚因子C〉1.48,核函数参数γ>0.01时,基于混合特征的手写数字识别方法的正确识别率大于95%;当分类器的参数满足以下条件:惩罚因子C〉1.48,核函数参数γ>0.1时,基于混合特征的手写数字识别方法的正确识别率达到100%;
其次,选择训练样本集,用于支持向量机SVM分类器的训练,得到支持向量机SVM模型;
再次,采用测试样本集用训练得到的支持向量机SVM模型进行分类,得到测试分类结果,即最终的识别结果。
5.如权利要求4所述的基于混合特征提取的手写数字识别方法,其特征在于:对测试分类结果进行评估,包括对正确识别率和识别时间的评估,从而得到对识别方法的优劣判断:正确识别率越高,识别方法越好;识别时间越短,识别方法越好。
6.如权利要求1-4任一项所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S4中,采用一对一法实现多类支持向量机SVM分类器,具体为:在任意两类样本之间设计一个支持向量机SVM分类器,对k个类别的样本设计k(k-1)/2个支持向量机SVM分类器。
CN201611078514.4A 2016-11-29 2016-11-29 基于混合特征提取的手写数字识别方法 Active CN107067046B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611078514.4A CN107067046B (zh) 2016-11-29 2016-11-29 基于混合特征提取的手写数字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611078514.4A CN107067046B (zh) 2016-11-29 2016-11-29 基于混合特征提取的手写数字识别方法

Publications (2)

Publication Number Publication Date
CN107067046A CN107067046A (zh) 2017-08-18
CN107067046B true CN107067046B (zh) 2020-09-04

Family

ID=59618896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611078514.4A Active CN107067046B (zh) 2016-11-29 2016-11-29 基于混合特征提取的手写数字识别方法

Country Status (1)

Country Link
CN (1) CN107067046B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002803B (zh) * 2018-07-24 2021-09-24 武汉大学 一种基于智能手表的握笔姿势检测和汉字笔顺识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1624712A (zh) * 2004-12-09 2005-06-08 上海交通大学 基于核函数的手写数字识别方法
JP5352757B2 (ja) * 2006-08-14 2013-11-27 有限会社Kiteイメージ・テクノロジーズ 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体
CN101364271B (zh) * 2008-05-09 2011-05-11 东莞市正欣科技有限公司 手写汉字笔画的识别方法和识别装置

Also Published As

Publication number Publication date
CN107067046A (zh) 2017-08-18

Similar Documents

Publication Publication Date Title
Tang et al. Text-independent writer identification via CNN features and joint Bayesian
CN101482920B (zh) 一种手写字符识别方法及系统
Swethalakshmi et al. Online handwritten character recognition of Devanagari and Telugu characters using support vector machines
Parui et al. Online handwritten Bangla character recognition using HMM
CN108664975B (zh) 一种维吾尔文手写字母识别方法、系统及电子设备
Chitlangia et al. Handwriting analysis based on histogram of oriented gradient for predicting personality traits using SVM
Fazilov et al. State of the art of writer identification
Dai Nguyen et al. Recognition of online handwritten math symbols using deep neural networks
CN101477426A (zh) 一种识别手写输入的方法及系统
Basha et al. A novel approach for optical character recognition (OCR) of handwritten Telugu alphabets using convolutional neural networks
Mori et al. Global feature for online character recognition
Ahmed et al. Recognition of Urdu Handwritten Alphabet Using Convolutional Neural Network (CNN).
Das et al. Bangla handwritten character recognition using extended convolutional neural network
Gnanasivam et al. Handwritten Tamil character recognition using convolutional neural network
Mridha et al. A thresholded Gabor-CNN based writer identification system for Indic scripts
Basha et al. Comparative Analysis of CNN-Based Frameworks for Handwritten Arabic Numerals Recognition
Arafat et al. Two stream deep neural network for sequence-based Urdu ligature recognition
CN101477425A (zh) 一种识别手写字符输入的方法及系统
Dara et al. Telugu handwritten isolated characters recognition using two dimensional fast Fourier transform and support vector machine
Lakshmi et al. Analysis of Telugu palm leaf character recognition using 3D feature
Dargan et al. Handwriting-based gender classification using machine learning techniques
CN107067046B (zh) 基于混合特征提取的手写数字识别方法
Cecotti Hierarchical k-nearest neighbor with GPUs and a high performance cluster: Application to handwritten character recognition
Kumar et al. RWIL: robust writer identification for Indic language
Houtinezhad et al. Off-line signature verification system using features linear mapping in the candidate points

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant