CN110110700A - 一种基于加权稀疏表示分类的手写汉字识别方法 - Google Patents
一种基于加权稀疏表示分类的手写汉字识别方法 Download PDFInfo
- Publication number
- CN110110700A CN110110700A CN201910418156.4A CN201910418156A CN110110700A CN 110110700 A CN110110700 A CN 110110700A CN 201910418156 A CN201910418156 A CN 201910418156A CN 110110700 A CN110110700 A CN 110110700A
- Authority
- CN
- China
- Prior art keywords
- chinese character
- rarefaction representation
- training sample
- vector
- handwritten chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Abstract
本发明提供一种基于加权稀疏表示分类的手写汉字识别方法,包含步骤:S1、建立训练样本集A={Ai}i∈[1,k],Ai为从选取的手写汉字库中提取的第i类特征向量,k为所述手写汉字库中提取的特征向量类别总数;S2、建立测试向量y,y为从待识别手写汉字中提取的特征向量,计算y在A上的稀疏表示向量S3、计算A中每个特征向量的权重,通过所述权重重构优化稀疏表示向量为稀疏表示向量S4、计算训练样本集A的每类特征向量对y的重构残差,判断y对应A中特征向量的类别,实现识别手写汉字。本发明通过计算A中每个特征向量的权重,优化y在A上的稀疏表示向量,提高了对手写汉字识别精度。
Description
技术领域
本发明涉及光学字符识别技术,特别涉及一种手写汉字的自动识别方法。
背景技术
OCR(光学字符识别Optical Character Recognition)是指利用电子设备(例如扫描仪或数码相机)获取纸上的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。OCR技术广泛应用于录入和处理银行票据、文字资料、档案卷宗、文案等,可代替人的手工录入,节省大量人力。通常以最终识别率、识别速度作为评测OCR技术的重要依据。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。
手写汉字识别技术属于OCR领域。显然识别手写汉字要把识别手写英文难上很多。第一,英文字符的分类少,总共62个字符(26个英文字母的大小写再加十个阿拉伯数字),而中文总共50,000多汉字,常用的就有3000多;第二,相同的汉字有多种字体,不同字体的书写方式有较大区别;第三每个人的书写风格也各不相同,实际的书写效果不利于机器识别。因此在过去的几十年中人们采用了许多办法去改进识别的精确度和稳定性。
近年来,受压缩感知理论影响,人们将稀疏表示引入模式识别问题中,提出了稀疏表示分类算法(Sparse Representation-based Classification,SRC),如今该算法已广泛应用于图形的分类识别。在手写汉字识别过程中,有的学者在学习字典的同时进行分类器训练,然后用得到的分类器对图像稀疏编码进行分类。也有学者,在获得多个指定类字典的前提下,根据测试样本在不同类字典下的重构误差进行分类,取得了比较好的分类效果。但是现有技术中,通过稀疏表示分类器识别手写汉字时,由于未能考虑到样本局部性,即没有考虑到测试样本和每一个训练样本之间有相似性的特点,影响了识别精度。
发明内容
本发明的目的是提供一种基于加权稀疏表示分类的手写汉字识别方法,通过该方法能够快速识别手写汉字,并提高识别的准确率。
为了达到上述目的,本发明提供一种基于加权稀疏表示分类的手写汉字识别方法,包含步骤:
S1、选取手写汉字库,提取所述手写汉字库中所有汉字的特征向量并分类,建立训练样本集A=[Ai]i∈[1,k];
其中Ai为A中的第i类训练样本,也即是从手写汉字库中提取的第i类特征向量,i∈[1,k];k为从手写汉字库中提取的特征向量类别总数;一类特征向量作为一类训练样本;m为Ai的维数,ni为Ai中特征向量的个数;Vi,j∈Rm×1为一个训练样本,也即是从手写汉字库中提取的一个特征向量,j∈[1,ni];
S2、通过提取待识别手写汉字的特征向量y,将y作为测试样本;其中y∈Rm×1,m为y的维数;求解y在A下的稀疏表示向量 为n维向量;
S3、计算A中每个训练样本的权重,通过所述权重重构优化稀疏表示向量为稀疏表示向量 为n维向量;
S4、计算Ai对y的重构残差ri(y),根据ri(y)判断y对应的训练样本类别,实现识别手写汉字。
所述步骤S2中,为满足下述公式的解:
其中ε为误差的容限度,||·||1表示求L1范数,||·||2表示求L2范数,x0为满足||y-Ax0||2≤ε的解。
所述步骤S3中,具体包含:
S31、计算测试样本y到训练样本Vi,j的欧氏距离,d(y,Vi,j)=||y-Vi,j||2 S,其中i∈[1,k],j∈[1,ni],S为幂指数;
S32、计算训练样本Vi,j的权重值其中
S33、通过Wi,j生成权重对角矩阵W′,其中diag(·)为对角矩阵构造函数;
S34、重构稀疏表示向量为
所述步骤S4中,具体包含:
S41、计算Ai对y的重构残差ri(y):
其中i∈[1,k],为将中不与第i类训练样本对应的元素设为0之后所得的n维向量;
S42、若rp(y)=min{r1(y),...,rk(y)},p∈[1,k],则判断y属于第p类训练样本,实现识别手写汉字。
所述手写汉字库为中科院自动化所提供的脱机手写汉字样本库CASIA-HWDB1.0。
所述步骤S1和S2中通过LBP图像检测算法提取手写汉字库和待识别手写汉字的特征向量。
与现有技术相比,本发明的基于加权稀疏表示分类的手写汉字识别方法,首先计算出测试样本对于训练样本的稀疏表示向量,其次利用训练样本与测试样本之间的欧式距离设定权重的对角矩阵,重构原有的稀疏表示向量。提高了手写汉字的识别精度,获得了更好的识别效果。并且本发明中,通过e的负指数函数来构造权重的对角矩阵,极大地简化了权重的对角矩阵,加快了重构原有稀疏表示向量的速度,提高了对手写汉字的识别速度。
附图说明
为了更清楚地说明本发明技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:
图1为本发明的基于加权稀疏表示分类的手写汉字识别方法步骤示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于加权稀疏表示分类的手写汉字识别方法,包含步骤:
S1、选取手写汉字库,通过LBP图像检测算法提取所述手写汉字库中所有汉字的特征向量并分类,建立训练样本集A=[Ai]i∈[1,k];所述手写汉字库为中科院自动化所提供的脱机手写汉字样本库CASIA-HWDB1.0。
其中Ai为A中的第i类训练样本,也即是从手写汉字库中提取的第i类特征向量,i∈[1,k];k为从手写汉字库中提取的特征向量类别总数;一类特征向量作为一类训练样本;m为Ai的维数,ni为Ai中特征向量的个数,Vi,j∈Rm(j∈[1,ni])为一个训练样本,也即是从手写汉字库中提取的一个特征向量;
S2、通过LBP图像检测算法提取待识别手写汉字的特征向量y,将y作为测试样本;其中y∈Rm×1,m为y的维数;通过L1范数求解y在A下的稀疏表示向量 为满足下述公式的解:
其中ε为误差的容限度,||·||1表示求L1范数,||·||2表示求L2范数,x0为满足||y-Ax0||2≤ε的解。
采用L1范数求解y在A下的稀疏表示向量的原因如下所示:
理想状态中y可使用训练样本A中的某一类训练样本Ai线性表出,且y与其他类比的训练样本线性无关。既可以将y表示为
其中αi,j∈R,j∈[1,ni];
也可通过所有k个种类的训练样本来表示y:
y=Ax0∈Rm (3)
在理想的条件下,x0为稀疏向量,公式(3)中,x0中的每个元素对应一个训练样本。在x0里面,除去对应于第i类训练样本的元素以外,其他的元素都是0。然而在通常情况下,公式(3)的解不是唯一的。为了解决这个问题,通常选择L2范数下的解作为公式(3)的解。满足下式:
但是是稠密的,L2范数的解有太多的非零元素,而且这些非零元素在每一类训练样本所对应的系数中都存在,这一点对与根据找出y所对应的训练样本类别是非常不利的。所以我们需要公式(3)的解一定要拥有尽可能少的非零项,从而使其显得足够稀疏。因此便将求解公式(3)转化成求解L0范数下y=Ax0的解 满足公式(5):
公式(5)中我们所求的是L0范数,也就是向量里非零元素的个数。向量越稀疏,那么对后续的分类识别就会越有利。但由于L0范数很难优化求解(NP难问题),而L1范数是L0范数的最优凸近似,所以L0范数最小化问题便可转求解L1范数下y=Ax0的解 满足公式(6):
由于现实问题中图像容易受到噪声影响,所以常常设置误差的容限度ε,因此将公式(6)调整为公式(1)。
S3、计算A中每个训练样本的权重,通过所述权重重构优化稀疏表示向量为稀疏表示向量具体包含:
S31、计算测试样本y到训练样本Vi,j的欧氏距离:
d(y,Vi,j)=||y-Vi,j||2 S (7)
其中i∈[1,k],j∈[1,ni],S为幂指数;S可根据实际的训练样本来设置;
S32、计算训练样本Vi,j的权重
其中通过使用e的负指数函数容易得出权重Wi,j∈(0,1],并且会使很多权重接近于0。
S33、通过Wi,j生成权重对角矩阵W′,
diag(·)为对角矩阵构造函数;其中
除对角线元素外,W′的其他元素均为0。
S34、重构稀疏表示向量为
S4、计算Ai对y的重构残差ri(y),i∈[1,k]
中的每个元素对应一个训练样本,为将中不与第i类训练样本对应的元素设为0之后所得的n维向量;
在本应用实施例中,如下所示,
则
各类别训练样本对测试样本的重构残差可以来展现测试样本和各类别中的训练样本的逼近程度。重构残差计算结果越小,就说明这类训练样本在测试样本的重构工作中贡献越大,所以最终测试样本将判定为重构贡献最大的那个类别,即重构残差最小的那个类别。
因此若rp(y)=min{r1(y),...,rk(y)},p∈[1,k],则判断y属于第p类训练样本,实现识别手写汉字。
所述步骤S1和S3中通过LBP图像检测算法提取手写汉字库和待识别手写汉字的特征向量。
以下是本发明的方法在HWDB1.0手写汉字库中与现有技术中的PCA(PrincipalComponent Analysis,主成分分析)、LDA(Linear Discriminant Analysis,线性判别分析)方法的对比。很明显,与现有技术相比,本发明的方法对于手写汉字的识别率更高。在每类训练样本个数为8时,本发明的方法识别手写汉字的最大识别率可以达到93.7%,即使在每类2个训练样本时,本发明的识别率也达到了77.3%。本发明的方法对于手写汉字具有很好的识别效果。
表1
与现有技术相比,本发明的基于加权稀疏表示分类的手写汉字识别方法,首先计算出测试样本对于训练样本的稀疏表示向量,其次利用训练样本与测试样本之间的欧式距离设定权重,重构原有的稀疏表示向量。提高了手写汉字的识别精度,获得了更好的识别效果。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (6)
1.一种基于加权稀疏表示分类的手写汉字识别方法,其特征在于,包含步骤:
S1、选取手写汉字库,提取所述手写汉字库中所有手写汉字的特征向量并分类,建立训练样本集A=[Ai]i∈[1,k];
其中Ai为A中的第i类训练样本,也即是从手写汉字库中提取的第i类特征向量,i∈[1,k];k为从手写汉字库中提取的特征向量类别总数;一类特征向量作为一类训练样本;m为Ai的维数,ni为Ai中特征向量的个数;Vi,j∈Rm×1为一个训练样本,也即是从手写汉字库中提取的一个特征向量,j∈[1,ni],
S2、通过提取待识别手写汉字的特征向量y,将y作为测试样本;其中y∈Rm,m为y的维数;求解y在A下的稀疏表示向量 为n维向量,的每个元素对应一个A中的训练样本;
S3、计算A中每个训练样本的权重,通过所述权重重构优化稀疏表示向量为稀疏表示向量 为n维向量,的每个元素对应一个A中的训练样本;
S4、计算Ai对y的重构残差ri(y),根据ri(y)判断y对应的训练样本类别,实现识别手写汉字。
2.如权利要求1所述的基于加权稀疏表示分类的手写汉字识别方法,其特征在于,所述步骤S2中,为满足下述公式的解:
其中ε为误差的容限度,||·||1表示求L1范数,||·||2表示求L2范数,x0为满足||y-Ax0||2≤ε的解。
3.如权利要求1所述的基于加权稀疏表示分类的手写汉字识别方法,其特征在于,所述步骤S3中,具体包含:
S31、计算测试样本y到训练样本Vi,j的欧氏距离,d(y,Vi,j)=||y-Vi,j||2 S,其中i∈[1,k],j∈[1,ni],S为幂指数;
S32、计算训练样本Vi,j的权重值其中
S33、通过Wi,j生成权重对角矩阵W′,其中diag(·)为对角矩阵构造函数;
S34、重构稀疏表示向量为
4.如权利要求1所述的基于加权稀疏表示分类的手写汉字识别方法,其特征在于,所述步骤S4中,具体包含:
S41、计算Ai对y的重构残差ri(y),i∈[1,k]:
其中,为将中不与第i类训练样本对应的元素设为0之后所得的n维向量;
S42、若rp(y)=min{r1(y),...,rk(y)},p∈[1,k],则判断y属于第p类训练样本,实现识别手写汉字。
5.如权利要求1所述的基于加权稀疏表示分类的手写汉字识别方法,其特征在于,所述手写汉字库为中科院自动化所提供的脱机手写汉字样本库CASIA-HWDB1.0。
6.如权利要求1所述的基于加权稀疏表示分类的手写汉字识别方法,其特征在于,所述步骤S1和S2中通过LBP图像检测算法提取手写汉字库和待识别手写汉字的特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910418156.4A CN110110700A (zh) | 2019-05-20 | 2019-05-20 | 一种基于加权稀疏表示分类的手写汉字识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910418156.4A CN110110700A (zh) | 2019-05-20 | 2019-05-20 | 一种基于加权稀疏表示分类的手写汉字识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110110700A true CN110110700A (zh) | 2019-08-09 |
Family
ID=67491083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910418156.4A Pending CN110110700A (zh) | 2019-05-20 | 2019-05-20 | 一种基于加权稀疏表示分类的手写汉字识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110700A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761531A (zh) * | 2014-01-20 | 2014-04-30 | 西安理工大学 | 基于形状轮廓特征的稀疏编码车牌字符识别方法 |
CN108875459A (zh) * | 2017-05-08 | 2018-11-23 | 武汉科技大学 | 一种基于稀疏系数相似的加权稀疏表示人脸识别方法及系统 |
CN109190627A (zh) * | 2018-08-03 | 2019-01-11 | 钟祥博谦信息科技有限公司 | 一种基于稀疏表示的车牌识别方法 |
CN109670559A (zh) * | 2018-12-07 | 2019-04-23 | 北京锐安科技有限公司 | 手写汉字的识别方法、装置、设备和存储介质 |
-
2019
- 2019-05-20 CN CN201910418156.4A patent/CN110110700A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761531A (zh) * | 2014-01-20 | 2014-04-30 | 西安理工大学 | 基于形状轮廓特征的稀疏编码车牌字符识别方法 |
CN108875459A (zh) * | 2017-05-08 | 2018-11-23 | 武汉科技大学 | 一种基于稀疏系数相似的加权稀疏表示人脸识别方法及系统 |
CN109190627A (zh) * | 2018-08-03 | 2019-01-11 | 钟祥博谦信息科技有限公司 | 一种基于稀疏表示的车牌识别方法 |
CN109670559A (zh) * | 2018-12-07 | 2019-04-23 | 北京锐安科技有限公司 | 手写汉字的识别方法、装置、设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
张军,张曼雪: ""基于压缩感知的手写汉字识别研究"", 《西安航空学院学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pal et al. | Off-line handwritten character recognition of devnagari script | |
Liwicki et al. | IAM-OnDB-an on-line English sentence database acquired from handwritten text on a whiteboard | |
Plamondon et al. | Online and off-line handwriting recognition: a comprehensive survey | |
Pal et al. | Handwritten Bangla compound character recognition using gradient feature | |
Guillevic et al. | Cursive script recognition applied to the processing of bank cheques | |
Kaur et al. | A comprehensive survey on word recognition for non-Indic and Indic scripts | |
Hansen | A Matlab Project in Optical Character Recognition (OCR) | |
Rushiraj et al. | Handwritten character recognition of Odia script | |
CN110188750A (zh) | 一种基于深度学习的自然场景图片文字识别方法 | |
Mozaffari et al. | IfN/Farsi-Database: a database of Farsi handwritten city names | |
US8340428B2 (en) | Unsupervised writer style adaptation for handwritten word spotting | |
Mozaffari et al. | ICDAR 2009 handwritten Farsi/Arabic character recognition competition | |
Inunganbi et al. | Recognition of handwritten Meitei Mayek script based on texture feature | |
Jena et al. | Implementation of linear discriminant analysis for Odia numeral recognition | |
Antony et al. | Haar features based handwritten character recognition system for Tulu script | |
Almohri et al. | A real-time DSP-based optical character recognition system for isolated Arabic characters using the TI TMS320C6416T | |
Halder et al. | Individuality of isolated Bangla characters | |
CN110110700A (zh) | 一种基于加权稀疏表示分类的手写汉字识别方法 | |
Nguyen et al. | Preparation of an unconstrained vietnamese online handwriting database and recognition experiments by recurrent neural networks | |
CN110210582A (zh) | 一种基于局部协作表示分类的手写汉字识别方法 | |
VELEK et al. | Vector-to-image transformation of character patterns for on-line and off-line recognition | |
Hebert et al. | Writing type and language identification in heterogeneous and complex documents | |
Srihari et al. | Writer verification of arabic handwriting | |
Maheshwari et al. | Offline handwriting recognition with emphasis on character recognition: A comprehensive survey | |
Sharma et al. | Feature Extraction and Image Recognition of Cursive Handwritten English Words Using Neural Network and IAM Off‐Line Database |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190809 |
|
RJ01 | Rejection of invention patent application after publication |