CN105139036A - 一种基于稀疏编码的手写体数字识别方法 - Google Patents

一种基于稀疏编码的手写体数字识别方法 Download PDF

Info

Publication number
CN105139036A
CN105139036A CN201510551089.5A CN201510551089A CN105139036A CN 105139036 A CN105139036 A CN 105139036A CN 201510551089 A CN201510551089 A CN 201510551089A CN 105139036 A CN105139036 A CN 105139036A
Authority
CN
China
Prior art keywords
training set
test case
dictionary
matrix
sparse coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510551089.5A
Other languages
English (en)
Other versions
CN105139036B (zh
Inventor
张海仙
章毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201510551089.5A priority Critical patent/CN105139036B/zh
Publication of CN105139036A publication Critical patent/CN105139036A/zh
Application granted granted Critical
Publication of CN105139036B publication Critical patent/CN105139036B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2552Combination of methods, e.g. classifiers, working on different input data, e.g. sensor fusion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种基于稀疏编码的手写体数字识别方法,用于解决现有手写邮政编码由于每个人写字习惯的不同而导致的识别效率低的问题。本发明包括1)读入训练集,将训练集组成一个字典;2)读入测试例,对测试例进行特征提取;3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;4)通过分类器进行分类识别。本发明在用测试集的各个列的线性来表示测试例的时候充分利用了训练集每一个元素的性质,因此能够提高手写体邮政编码的识别正确率,提高邮件分拣的速度。

Description

一种基于稀疏编码的手写体数字识别方法
技术领域
本发明属于字体识别技术,具体涉及一种基于稀疏编码的手写体数字识别方法。
背景技术
随着互联网和经济的高速发展,选择网上购物和银行卡支付的人越来越多,电子商务的业务量大增,人们对物流的需求也随之增加。因此,如何大量邮件进行正确而高效的分拣变得至关重要。现在邮政部门大多采用电子设备来帮助完成分拣工作,邮件的自动分拣通常是通过计算机对邮件上六位数的邮政编码进行分类得以实现。虽然邮政编码只有十个数字,但由于每个人的手写体会因个人写字习惯的不同有很大的差异,所以手写数字的识别对于邮件的自动分拣非常重要。
手写体数字在统计报表、邮政编码、各种票据上都可以见到,它的电子识别有着广阔的应用前景。
稀疏编码作为近年来的计算机领域的一个研究热点,在人脸识别等分类问题上已经有十分良好的表现。充实的理论基础和大量应用成果都说明稀疏编码有足够潜力解决手写体识别问题。手写体的研宄涉及数字图像的处理、人工智能、模式识别、特征提取、组合数学等多个颖域,现在已经取得了一些成绩。很多手机和平板电脑都能支持手写输入,但由于技术原因是还常会出现手写体不能识别或者识别错误的情况,这使得还只能限于人们要求不高的生活和娱乐方面,要想在工业和财务、物流上大规模使用还需要做更多的研究工作。
本申请正是要提供一种基于稀疏编码的手写体数字识别方法,具有识别正确率高,能够提高了手写数字的录入速度,提高识别效率。
发明内容
本发明为了解决现有手写邮政编码由于每个人写字习惯的不同而导致的识别效率低的问题,而提供一种基于稀疏编码的手写体数字识别方法,具有识别效率高的问题,能够准确的识别不同人书写的数字,提高识别效率。
本发明为解决上述技术问题所采用的技术方案是:
一种基于稀疏编码的手写体数字识别方法,其特征在于,包括以下步骤,
1)读入训练集,将训练集组或一个字典;
2)读入测试例,对测试例进行特征提取;
3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;
4)通过分类器进行分类识别。
所述的读入训练集的方法为将手写体数据库中的含有0-9的训练集以图像的形式录入系统中,每张图片的灰度为8,每张图片大小为28*28。
所述的将训练集组成一个字典的方法为:将每个训练集的图片数据作为一列,然后把这些列全部接顺序拼接起来,经特征提取之后即是所需要的字典;采用随机映射对训练集进行图片特征提取;随机映射算法最主要的部分就是用于降维的矩阵的生成,利用ri,j=randomGaussian产一个降维用的矩阵Rk×d,该矩阵的元素满足高斯分布;同时使用式子进行降维,其中Rk×d矩阵使用Matlab的randn(k,d)函数来产生,该函数的功能正是产生一个高斯分布的k×d大小的随机矩阵;在生成Rk×d矩阵后对于字典使用Rk×d进行特征提取;将训练集的字典Xd×N维数降至k表示降维后的维度,系统实现时k作为一个变量,以方便后面的实验,调整k的大小,通过实验得到一个合适的k,让识别正确率比时间取得一个合适的值,最终再确定k的取值。
对于测试例采用随机映射对测试例进行图片特征提取。
所述的通过稀疏编码算法将测试例用训练集字典进行稀疏表达为:将训练集作为字典矩阵A,把测试例作为y,然后求解y=Ax的稀疏解,对测试例y进行稀疏表达;具体为将每个训练集的数据作为一个列向量Vi∈Rm,那么训练集可以表示为A=[V1,V2…Vn]∈Rm×n,A为训练集的字典矩阵,将特证提取后的测试例作为列向量y∈Rm,解y=Ax,x∈Rn这个欠定性方程组,并且满足min||x||0,即min||x||0s.t.Ax=y,根据BP原理l1范数约束与l0范数约束有等效的解,因此min||x||1s.t.Ax=y;解出来的x∈Rn向量表示训练集对测试例的表示,即训练集的线性组合表达出测试例y。
所述采用分类器进行分类识别的方法为:采用式子对测试例进行分类:
定义已知A矩阵和向量 x x 1 . . . x n ;
定义Vi=[A1,i…Am,i]T,也就是训练集里面的第i个数据的向量,那么选t这个数字的所有训练集的列向量定义为Mt=[Vi…Vj],其中[i..j]表示t这个数字的所有训练样本的图像的列向量的编号;定义其中对于相同的t的的[i..j]范围和Mt相同;那么要求出最小的一个这个测试例就是数字t。
与现有技术相比,本发明具有以下有益效果:
本发明的基于稀疏编码的手写体数字识别方法,在用测试集的各个列的线性来表示测试例的时候充分利用了训练集每一个元素的性质,因此能够提高手写体数字的识别正确率,识别的速度。
具体实施方式
下面结合实施例对本发明作进一步的描述,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域的普通技术人员在没有做出创造性劳动前提下所获得的其他所用实施例,都属于本发明的保护范围。
本发明的基于稀疏编码的手写体数字识别方法,包括以下步骤,
1)读入训练集,将训练集组成一个字典;
2)读入测试例,对测试例进行特征提取;
3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;
4)通过分类器进行分类识别。
所述的读入训练集的方法为将手写体数据库中的含有0-9的训练集以图像的形式录入系统中,每张图片的灰度为8,每张图片大小为28*28。
所述的将训练集组成一个字典的方法为:将每个训练集的图片数据作为一列,然后把这些列全部按顺序拼接起来,经特征提取之后即是所需要的字典;对于这些列向量按顺序拼接,使用Matlab的reshape()函数即可。
采用随机映射对训练集进行图片特征提取;随机映射(RandomProjection,RP)主要是将给定的m×n大小的矩阵X[26]。将它的数据维度降到低维(r维,r<<d)的子空间,通过一组随机项来确定这个映射。
X m × r R P = X m × n R n × r
随机降维的思想基于Johnson-Lindenstrauss引理,对于任意0<ε<1和整数n,设r是一个正整数,并且r满足:
r ≥ 4 ( ϵ 2 2 - ϵ 3 3 ) - r ln n
对于在Rd中间的n个点的集合W,有这么一个映射f:Rd->Rr,对所有u,v∈W:
(1-ε)||u-v||2≤||f(u)-f(v)||2≤(1+ε)||u-v||2
J-L引理说明了高维的欧几里得空间可以映射到一个维的子空间,此映射让点间距对于任意0<ε<1能近似的保留,而且此映射可以在多项式时间内找到。J-L引理简单地说就是在一个百万维空间里的任意一万个点,一定可以被放入一个几十维的子空间里。
随机映射对于一个m×n的矩阵,可以降维到m×r的大小,时间复杂度为O(m×n×r)。如果原始矩阵是一个比较大的稀疏的矩阵,随机映射降维的时间复杂度可以进一步减少到O(c×m×r),其中c<n,c为行非零元素个数的平均值[27]
随机映射算法最主要的部分就是用于降维的矩阵的生成,利用ri,j=randomGaussian产一个降维用的矩阵Rk×d,该矩阵的元素满足高斯分布;同时使用式子进行降维,其中Rk×d矩阵使用Matlab的randn(k,d)函数来产生,该函数的功能正是产生一个高斯分布的k×d大小的随机矩阵;在生成Rk×d矩阵后对于字典使用Rk×d进行特征提取;将训练集的字典Xd×N维数降至k表示降维后的维度,测试时k作为一个变量,以方便后面的实验,调整k的大小,通过实验得到一个合适的k,让识别正确率比时间取得一个合适的值,最终再确定k的取值。在进行分类识别的时候,需要求出最小的一个因此调整k的大小,从而求出最小的一个
对于测试例采用随机映射对测试例进行图片特征提取。
所述的通过稀疏编码算法将测试例用训练集字典进行稀疏表达为:将训练集作为字典矩阵A,把测试例作为y,然后求解y=Ax的稀疏解,对测试例y进行稀疏表达;具体为将每个训练集的数据怍为一个列向量Vi∈Rm,那么训练集可以表示为A=[V1,V2…Vn]∈Rm×n,A为训练集的字典矩阵,将特证提取后的测试例作为列向量y∈Rm,解y=Ax,x∈Rn这个欠定性方程组,并且满足min||x||0,即min||x||0s.t.Ax=y,根据BP原理l1范数约束与l0范数约束有等效的解,因此min||x||1s.t.Ax=y;解出来的x∈Rn向量表示训练集对测试例的表示,即训练集的线性组合表达出测试例y。
所述采用分类器进行分类识别的方法为:采用式子对测试例进行分类;
定义已经A矩阵和向量 x x 1 . . . x n ;
定义Vi=[A1,i…Am,i]T,也就是训练集里面的第i个数据的向量,那么选t这个数字的所有训练集的列向量定义为Mt=[Vi…Vj],其中[i..j]表示t这个数字的所有训练样本的图像的列向量的编号;定义其中对于相同的t的的[i..j]范围和Mt相同;那么要求出最小的一个这个测试例就是数字t。

Claims (6)

1.一种基于稀疏编码的手写体数字识别方法,其特征在于,包括以下步骤,
1)读入训练集,将训练集组成一个字典;
2)读入测试例,对测试例进行特征提取;
3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;
4)通过分类器进行分类识别。
2.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,读入训练集的方法为将手写体数据库中的含有0-9的训练集以图像的邢式录入系统中,每张图片的灰度为8,每张图片大小为28*28。
3.根据权利要求2所述的基于稀疏编码的手写体数字识别方法,其特征在于,将训练集组成一个字典的步骤为:将每个训练集的图片数据作为一列,然后把这些列全部按顺序拼接起来,经特征提取之后即是所需要的字典;采用随机映射对训练集进行图片特征提取;随机映射算法用于降维的矩阵的生成,利用ri,j=randomGaussian产一个降维用的矩阵Rk×d,该矩阵的元素满足高斯分布;同时使用式子进行降维,其中Rk×d矩阵使用Matlab的randn(k,d)函数来产生,该函数的功能正是产生一个高斯分布的k×d大小的随机矩阵;在生成Rk×d矩阵后对于字典使用Rk×d进行特征提取;将训练集的字典Xd×N维数降至k表示降维后的维度。
4.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,对于测试例采用随机映射对测试例进行图片特征提取。
5.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,稀疏编码算法为,将训练集作为字典矩阵A,把测试例作为y,然后求解y=Ax的稀疏解,对测试例y进行稀疏表达;具体方法为将每个训练集的数据作为一个列向量Vi∈Rm,那么训练集可以表示为A=[V1,V1...Vn]∈Rm×n;将特证提取后的测试例作为列向量y∈Rm,解y=Ax,x∈Rn这个欠定性方程组,并且满足min||x||0,即min||x||0s.t.Ax=y,根据BP原理l1范数约束与l0范数约束有等效的解,因此min||x||1s.t.Ax=y;解出来的x∈Rn向量表示训练集对测试例的表示,即训练集的线性组合表达出测试例y。
6.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,所述采用分类器进行分类识别的方法为:采用式子对测试例进行分类;
定义已经A矩阵和向量
定义Vi=[A1,i…Am,i]T,也就是训练集里面的第i个数据的向量,那么选t这个数字的所有训练集的列向量定义为Mt=[Vi...Vj],其中[i..j]表示t这个数字的所有训练样本的图像的列向量的编号;定义其中对于相同的t的的[i..j]范围和Mt相同;那么要求出最小的一个这个测试例就是数字t。
CN201510551089.5A 2015-06-19 2015-09-01 一种基于稀疏编码的手写体数字识别方法 Active CN105139036B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510551089.5A CN105139036B (zh) 2015-06-19 2015-09-01 一种基于稀疏编码的手写体数字识别方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2015103465611 2015-06-19
CN201510346561 2015-06-19
CN201510551089.5A CN105139036B (zh) 2015-06-19 2015-09-01 一种基于稀疏编码的手写体数字识别方法

Publications (2)

Publication Number Publication Date
CN105139036A true CN105139036A (zh) 2015-12-09
CN105139036B CN105139036B (zh) 2018-10-19

Family

ID=54724379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510551089.5A Active CN105139036B (zh) 2015-06-19 2015-09-01 一种基于稀疏编码的手写体数字识别方法

Country Status (1)

Country Link
CN (1) CN105139036B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909895A (zh) * 2017-02-17 2017-06-30 华南理工大学 一种基于随机投影多核学习的手势识别方法
CN107122768A (zh) * 2017-05-31 2017-09-01 吉林大学 一种三维笔式识别预处理方法
WO2019232872A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写字模型训练方法、汉字识别方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373519A (zh) * 2007-08-20 2009-02-25 富士通株式会社 字符识别装置和方法
CN102509110A (zh) * 2011-10-24 2012-06-20 中国科学院自动化研究所 基于成对约束的在线词典再加权对图像进行分类的方法
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373519A (zh) * 2007-08-20 2009-02-25 富士通株式会社 字符识别装置和方法
CN102509110A (zh) * 2011-10-24 2012-06-20 中国科学院自动化研究所 基于成对约束的在线词典再加权对图像进行分类的方法
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909895A (zh) * 2017-02-17 2017-06-30 华南理工大学 一种基于随机投影多核学习的手势识别方法
CN106909895B (zh) * 2017-02-17 2020-09-22 华南理工大学 一种基于随机投影多核学习的手势识别方法
CN107122768A (zh) * 2017-05-31 2017-09-01 吉林大学 一种三维笔式识别预处理方法
WO2019232872A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写字模型训练方法、汉字识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN105139036B (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN110084239B (zh) 降低离线手写数学公式识别时网络训练过拟合的方法
CN103996057B (zh) 基于多特征融合的实时手写体数字识别方法
US20180137349A1 (en) System and method of character recognition using fully convolutional neural networks
CN108509881A (zh) 一种无切分的脱机手写汉字文本识别方法
CN107844740A (zh) 一种脱机手写、印刷汉字识别方法及系统
CN101359373B (zh) 退化字符的识别方法和装置
CN107871101A (zh) 一种人脸检测方法及装置
CN106022363B (zh) 一种适用于自然场景下的中文文字识别方法
CN108320374B (zh) 一种基于图像指纹的多国纸币冠字号字符识别方法
CN110188762B (zh) 中英文混合商户门店名称识别方法、系统、设备及介质
CN103164701B (zh) 手写体数字识别方法及装置
Chaabouni et al. Fractal and multi-fractal for arabic offline writer identification
CN102147863B (zh) 一种网络动画中的文字定位及识别方法
CN111597958B (zh) 一种高度自动化的票据分类方法及系统
Malakar et al. A holistic approach for handwritten Hindi word recognition
CN106611174A (zh) 一种非常见字体的ocr识别方法
CN108198324B (zh) 一种基于图像指纹的多国纸币币种识别方法
CN106650748A (zh) 一种基于卷积神经网络的汉字识别方法
CN109614866A (zh) 基于级联深度卷积神经网络的人脸检测方法
CN106503694A (zh) 基于八邻域特征的数字识别方法
CN105139036A (zh) 一种基于稀疏编码的手写体数字识别方法
CN104992166A (zh) 一种基于鲁棒度量的手写体识别方法与系统
CN111340032A (zh) 一种基于金融领域应用场景的字符识别方法
Liu et al. Wagon number recognition based on the YOLOv3 detector
CN104899551B (zh) 一种表单图像分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant