CN105139036A - 一种基于稀疏编码的手写体数字识别方法 - Google Patents
一种基于稀疏编码的手写体数字识别方法 Download PDFInfo
- Publication number
- CN105139036A CN105139036A CN201510551089.5A CN201510551089A CN105139036A CN 105139036 A CN105139036 A CN 105139036A CN 201510551089 A CN201510551089 A CN 201510551089A CN 105139036 A CN105139036 A CN 105139036A
- Authority
- CN
- China
- Prior art keywords
- training set
- test case
- dictionary
- matrix
- sparse coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000012360 testing method Methods 0.000 claims abstract description 46
- 239000011159 matrix material Substances 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 19
- 238000002474 experimental method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2552—Combination of methods, e.g. classifiers, working on different input data, e.g. sensor fusion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种基于稀疏编码的手写体数字识别方法,用于解决现有手写邮政编码由于每个人写字习惯的不同而导致的识别效率低的问题。本发明包括1)读入训练集,将训练集组成一个字典;2)读入测试例,对测试例进行特征提取;3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;4)通过分类器进行分类识别。本发明在用测试集的各个列的线性来表示测试例的时候充分利用了训练集每一个元素的性质,因此能够提高手写体邮政编码的识别正确率,提高邮件分拣的速度。
Description
技术领域
本发明属于字体识别技术,具体涉及一种基于稀疏编码的手写体数字识别方法。
背景技术
随着互联网和经济的高速发展,选择网上购物和银行卡支付的人越来越多,电子商务的业务量大增,人们对物流的需求也随之增加。因此,如何大量邮件进行正确而高效的分拣变得至关重要。现在邮政部门大多采用电子设备来帮助完成分拣工作,邮件的自动分拣通常是通过计算机对邮件上六位数的邮政编码进行分类得以实现。虽然邮政编码只有十个数字,但由于每个人的手写体会因个人写字习惯的不同有很大的差异,所以手写数字的识别对于邮件的自动分拣非常重要。
手写体数字在统计报表、邮政编码、各种票据上都可以见到,它的电子识别有着广阔的应用前景。
稀疏编码作为近年来的计算机领域的一个研究热点,在人脸识别等分类问题上已经有十分良好的表现。充实的理论基础和大量应用成果都说明稀疏编码有足够潜力解决手写体识别问题。手写体的研宄涉及数字图像的处理、人工智能、模式识别、特征提取、组合数学等多个颖域,现在已经取得了一些成绩。很多手机和平板电脑都能支持手写输入,但由于技术原因是还常会出现手写体不能识别或者识别错误的情况,这使得还只能限于人们要求不高的生活和娱乐方面,要想在工业和财务、物流上大规模使用还需要做更多的研究工作。
本申请正是要提供一种基于稀疏编码的手写体数字识别方法,具有识别正确率高,能够提高了手写数字的录入速度,提高识别效率。
发明内容
本发明为了解决现有手写邮政编码由于每个人写字习惯的不同而导致的识别效率低的问题,而提供一种基于稀疏编码的手写体数字识别方法,具有识别效率高的问题,能够准确的识别不同人书写的数字,提高识别效率。
本发明为解决上述技术问题所采用的技术方案是:
一种基于稀疏编码的手写体数字识别方法,其特征在于,包括以下步骤,
1)读入训练集,将训练集组或一个字典;
2)读入测试例,对测试例进行特征提取;
3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;
4)通过分类器进行分类识别。
所述的读入训练集的方法为将手写体数据库中的含有0-9的训练集以图像的形式录入系统中,每张图片的灰度为8,每张图片大小为28*28。
所述的将训练集组成一个字典的方法为:将每个训练集的图片数据作为一列,然后把这些列全部接顺序拼接起来,经特征提取之后即是所需要的字典;采用随机映射对训练集进行图片特征提取;随机映射算法最主要的部分就是用于降维的矩阵的生成,利用ri,j=randomGaussian产一个降维用的矩阵Rk×d,该矩阵的元素满足高斯分布;同时使用式子进行降维,其中Rk×d矩阵使用Matlab的randn(k,d)函数来产生,该函数的功能正是产生一个高斯分布的k×d大小的随机矩阵;在生成Rk×d矩阵后对于字典使用Rk×d进行特征提取;将训练集的字典Xd×N维数降至k表示降维后的维度,系统实现时k作为一个变量,以方便后面的实验,调整k的大小,通过实验得到一个合适的k,让识别正确率比时间取得一个合适的值,最终再确定k的取值。
对于测试例采用随机映射对测试例进行图片特征提取。
所述的通过稀疏编码算法将测试例用训练集字典进行稀疏表达为:将训练集作为字典矩阵A,把测试例作为y,然后求解y=Ax的稀疏解,对测试例y进行稀疏表达;具体为将每个训练集的数据作为一个列向量Vi∈Rm,那么训练集可以表示为A=[V1,V2…Vn]∈Rm×n,A为训练集的字典矩阵,将特证提取后的测试例作为列向量y∈Rm,解y=Ax,x∈Rn这个欠定性方程组,并且满足min||x||0,即min||x||0s.t.Ax=y,根据BP原理l1范数约束与l0范数约束有等效的解,因此min||x||1s.t.Ax=y;解出来的x∈Rn向量表示训练集对测试例的表示,即训练集的线性组合表达出测试例y。
所述采用分类器进行分类识别的方法为:采用式子对测试例进行分类:
定义已知A矩阵和向量
定义Vi=[A1,i…Am,i]T,也就是训练集里面的第i个数据的向量,那么选t这个数字的所有训练集的列向量定义为Mt=[Vi…Vj],其中[i..j]表示t这个数字的所有训练样本的图像的列向量的编号;定义其中对于相同的t的的[i..j]范围和Mt相同;那么要求出最小的一个这个测试例就是数字t。
与现有技术相比,本发明具有以下有益效果:
本发明的基于稀疏编码的手写体数字识别方法,在用测试集的各个列的线性来表示测试例的时候充分利用了训练集每一个元素的性质,因此能够提高手写体数字的识别正确率,识别的速度。
具体实施方式
下面结合实施例对本发明作进一步的描述,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域的普通技术人员在没有做出创造性劳动前提下所获得的其他所用实施例,都属于本发明的保护范围。
本发明的基于稀疏编码的手写体数字识别方法,包括以下步骤,
1)读入训练集,将训练集组成一个字典;
2)读入测试例,对测试例进行特征提取;
3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;
4)通过分类器进行分类识别。
所述的读入训练集的方法为将手写体数据库中的含有0-9的训练集以图像的形式录入系统中,每张图片的灰度为8,每张图片大小为28*28。
所述的将训练集组成一个字典的方法为:将每个训练集的图片数据作为一列,然后把这些列全部按顺序拼接起来,经特征提取之后即是所需要的字典;对于这些列向量按顺序拼接,使用Matlab的reshape()函数即可。
采用随机映射对训练集进行图片特征提取;随机映射(RandomProjection,RP)主要是将给定的m×n大小的矩阵X[26]。将它的数据维度降到低维(r维,r<<d)的子空间,通过一组随机项来确定这个映射。
随机降维的思想基于Johnson-Lindenstrauss引理,对于任意0<ε<1和整数n,设r是一个正整数,并且r满足:
对于在Rd中间的n个点的集合W,有这么一个映射f:Rd->Rr,对所有u,v∈W:
(1-ε)||u-v||2≤||f(u)-f(v)||2≤(1+ε)||u-v||2
J-L引理说明了高维的欧几里得空间可以映射到一个维的子空间,此映射让点间距对于任意0<ε<1能近似的保留,而且此映射可以在多项式时间内找到。J-L引理简单地说就是在一个百万维空间里的任意一万个点,一定可以被放入一个几十维的子空间里。
随机映射对于一个m×n的矩阵,可以降维到m×r的大小,时间复杂度为O(m×n×r)。如果原始矩阵是一个比较大的稀疏的矩阵,随机映射降维的时间复杂度可以进一步减少到O(c×m×r),其中c<n,c为行非零元素个数的平均值[27]。
随机映射算法最主要的部分就是用于降维的矩阵的生成,利用ri,j=randomGaussian产一个降维用的矩阵Rk×d,该矩阵的元素满足高斯分布;同时使用式子进行降维,其中Rk×d矩阵使用Matlab的randn(k,d)函数来产生,该函数的功能正是产生一个高斯分布的k×d大小的随机矩阵;在生成Rk×d矩阵后对于字典使用Rk×d进行特征提取;将训练集的字典Xd×N维数降至k表示降维后的维度,测试时k作为一个变量,以方便后面的实验,调整k的大小,通过实验得到一个合适的k,让识别正确率比时间取得一个合适的值,最终再确定k的取值。在进行分类识别的时候,需要求出最小的一个因此调整k的大小,从而求出最小的一个
对于测试例采用随机映射对测试例进行图片特征提取。
所述的通过稀疏编码算法将测试例用训练集字典进行稀疏表达为:将训练集作为字典矩阵A,把测试例作为y,然后求解y=Ax的稀疏解,对测试例y进行稀疏表达;具体为将每个训练集的数据怍为一个列向量Vi∈Rm,那么训练集可以表示为A=[V1,V2…Vn]∈Rm×n,A为训练集的字典矩阵,将特证提取后的测试例作为列向量y∈Rm,解y=Ax,x∈Rn这个欠定性方程组,并且满足min||x||0,即min||x||0s.t.Ax=y,根据BP原理l1范数约束与l0范数约束有等效的解,因此min||x||1s.t.Ax=y;解出来的x∈Rn向量表示训练集对测试例的表示,即训练集的线性组合表达出测试例y。
所述采用分类器进行分类识别的方法为:采用式子对测试例进行分类;
定义已经A矩阵和向量
定义Vi=[A1,i…Am,i]T,也就是训练集里面的第i个数据的向量,那么选t这个数字的所有训练集的列向量定义为Mt=[Vi…Vj],其中[i..j]表示t这个数字的所有训练样本的图像的列向量的编号;定义其中对于相同的t的的[i..j]范围和Mt相同;那么要求出最小的一个这个测试例就是数字t。
Claims (6)
1.一种基于稀疏编码的手写体数字识别方法,其特征在于,包括以下步骤,
1)读入训练集,将训练集组成一个字典;
2)读入测试例,对测试例进行特征提取;
3)通过稀疏编码算法将测试例用训练集字典进行稀疏表达;
4)通过分类器进行分类识别。
2.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,读入训练集的方法为将手写体数据库中的含有0-9的训练集以图像的邢式录入系统中,每张图片的灰度为8,每张图片大小为28*28。
3.根据权利要求2所述的基于稀疏编码的手写体数字识别方法,其特征在于,将训练集组成一个字典的步骤为:将每个训练集的图片数据作为一列,然后把这些列全部按顺序拼接起来,经特征提取之后即是所需要的字典;采用随机映射对训练集进行图片特征提取;随机映射算法用于降维的矩阵的生成,利用ri,j=randomGaussian产一个降维用的矩阵Rk×d,该矩阵的元素满足高斯分布;同时使用式子进行降维,其中Rk×d矩阵使用Matlab的randn(k,d)函数来产生,该函数的功能正是产生一个高斯分布的k×d大小的随机矩阵;在生成Rk×d矩阵后对于字典使用Rk×d进行特征提取;将训练集的字典Xd×N维数降至k表示降维后的维度。
4.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,对于测试例采用随机映射对测试例进行图片特征提取。
5.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,稀疏编码算法为,将训练集作为字典矩阵A,把测试例作为y,然后求解y=Ax的稀疏解,对测试例y进行稀疏表达;具体方法为将每个训练集的数据作为一个列向量Vi∈Rm,那么训练集可以表示为A=[V1,V1...Vn]∈Rm×n;将特证提取后的测试例作为列向量y∈Rm,解y=Ax,x∈Rn这个欠定性方程组,并且满足min||x||0,即min||x||0s.t.Ax=y,根据BP原理l1范数约束与l0范数约束有等效的解,因此min||x||1s.t.Ax=y;解出来的x∈Rn向量表示训练集对测试例的表示,即训练集的线性组合表达出测试例y。
6.根据权利要求1所述的基于稀疏编码的手写体数字识别方法,其特征在于,所述采用分类器进行分类识别的方法为:采用式子对测试例进行分类;
定义已经A矩阵和向量
定义Vi=[A1,i…Am,i]T,也就是训练集里面的第i个数据的向量,那么选t这个数字的所有训练集的列向量定义为Mt=[Vi...Vj],其中[i..j]表示t这个数字的所有训练样本的图像的列向量的编号;定义其中对于相同的t的的[i..j]范围和Mt相同;那么要求出最小的一个这个测试例就是数字t。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510551089.5A CN105139036B (zh) | 2015-06-19 | 2015-09-01 | 一种基于稀疏编码的手写体数字识别方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2015103465611 | 2015-06-19 | ||
CN201510346561 | 2015-06-19 | ||
CN201510551089.5A CN105139036B (zh) | 2015-06-19 | 2015-09-01 | 一种基于稀疏编码的手写体数字识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105139036A true CN105139036A (zh) | 2015-12-09 |
CN105139036B CN105139036B (zh) | 2018-10-19 |
Family
ID=54724379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510551089.5A Expired - Fee Related CN105139036B (zh) | 2015-06-19 | 2015-09-01 | 一种基于稀疏编码的手写体数字识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105139036B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909895A (zh) * | 2017-02-17 | 2017-06-30 | 华南理工大学 | 一种基于随机投影多核学习的手势识别方法 |
CN107122768A (zh) * | 2017-05-31 | 2017-09-01 | 吉林大学 | 一种三维笔式识别预处理方法 |
WO2019232872A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写字模型训练方法、汉字识别方法、装置、设备及介质 |
CN114298248A (zh) * | 2022-01-25 | 2022-04-08 | 重庆医科大学 | 一种单层Bp神经网络的等效方程组模型构造方法 |
CN114298248B (zh) * | 2022-01-25 | 2024-09-03 | 重庆医科大学 | 一种单层Bp神经网络的等效方程组模型构造方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373519A (zh) * | 2007-08-20 | 2009-02-25 | 富士通株式会社 | 字符识别装置和方法 |
CN102509110A (zh) * | 2011-10-24 | 2012-06-20 | 中国科学院自动化研究所 | 基于成对约束的在线词典再加权对图像进行分类的方法 |
CN103324923A (zh) * | 2013-07-11 | 2013-09-25 | 上海理工大学 | 基于稀疏表示的手写字符识别方法 |
-
2015
- 2015-09-01 CN CN201510551089.5A patent/CN105139036B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373519A (zh) * | 2007-08-20 | 2009-02-25 | 富士通株式会社 | 字符识别装置和方法 |
CN102509110A (zh) * | 2011-10-24 | 2012-06-20 | 中国科学院自动化研究所 | 基于成对约束的在线词典再加权对图像进行分类的方法 |
CN103324923A (zh) * | 2013-07-11 | 2013-09-25 | 上海理工大学 | 基于稀疏表示的手写字符识别方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909895A (zh) * | 2017-02-17 | 2017-06-30 | 华南理工大学 | 一种基于随机投影多核学习的手势识别方法 |
CN106909895B (zh) * | 2017-02-17 | 2020-09-22 | 华南理工大学 | 一种基于随机投影多核学习的手势识别方法 |
CN107122768A (zh) * | 2017-05-31 | 2017-09-01 | 吉林大学 | 一种三维笔式识别预处理方法 |
WO2019232872A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写字模型训练方法、汉字识别方法、装置、设备及介质 |
CN114298248A (zh) * | 2022-01-25 | 2022-04-08 | 重庆医科大学 | 一种单层Bp神经网络的等效方程组模型构造方法 |
CN114298248B (zh) * | 2022-01-25 | 2024-09-03 | 重庆医科大学 | 一种单层Bp神经网络的等效方程组模型构造方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105139036B (zh) | 2018-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103996057B (zh) | 基于多特征融合的实时手写体数字识别方法 | |
CN101447017B (zh) | 一种基于版面分析的选票快速识别统计方法及系统 | |
CN101359373B (zh) | 退化字符的识别方法和装置 | |
CN106022363B (zh) | 一种适用于自然场景下的中文文字识别方法 | |
CN107871101A (zh) | 一种人脸检测方法及装置 | |
CN102722713B (zh) | 一种基于李群结构数据的手写体数字识别方法及系统 | |
Chowdhury et al. | Online handwriting recognition using Levenshtein distance metric | |
CN111597958B (zh) | 一种高度自动化的票据分类方法及系统 | |
CN106446954A (zh) | 一种基于深度学习的字符识别方法 | |
CN108320374B (zh) | 一种基于图像指纹的多国纸币冠字号字符识别方法 | |
Malakar et al. | A holistic approach for handwritten Hindi word recognition | |
CN106611174A (zh) | 一种非常见字体的ocr识别方法 | |
CN110084327B (zh) | 基于视角自适应深度网络的票据手写数字识别方法及系统 | |
CN114898327B (zh) | 一种基于轻量化深度学习网络的车辆检测方法 | |
CN103258210A (zh) | 一种基于字典学习的高清图像分类方法 | |
CN102663401A (zh) | 一种图像特征提取和描述方法 | |
CN106650748A (zh) | 一种基于卷积神经网络的汉字识别方法 | |
CN109614866A (zh) | 基于级联深度卷积神经网络的人脸检测方法 | |
CN110188762A (zh) | 中英文混合商户门店名称识别方法、系统、设备及介质 | |
CN105139036A (zh) | 一种基于稀疏编码的手写体数字识别方法 | |
CN102360436B (zh) | 一种基于部件的联机手写藏文字符的识别方法 | |
CN103020167A (zh) | 一种计算机中文文本分类方法 | |
CN109345684A (zh) | 一种基于gmdh-svm的多国纸币冠字号识别方法 | |
CN103617609A (zh) | 基于图论的k-means非线性流形聚类与代表点选取方法 | |
CN106981067A (zh) | 一种基于全卷积网络的纹理分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181019 |