CN109784266B - 一种多模型超图的手写汉字识别算法 - Google Patents
一种多模型超图的手写汉字识别算法 Download PDFInfo
- Publication number
- CN109784266B CN109784266B CN201910021582.4A CN201910021582A CN109784266B CN 109784266 B CN109784266 B CN 109784266B CN 201910021582 A CN201910021582 A CN 201910021582A CN 109784266 B CN109784266 B CN 109784266B
- Authority
- CN
- China
- Prior art keywords
- samples
- points
- hypergraph
- stroke
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000000605 extraction Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 8
- 238000002474 experimental method Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract 2
- 230000004927 fusion Effects 0.000 abstract 1
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 101100533306 Mus musculus Setx gene Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种多模型超图的手写汉字识别算法,包括:特征提取、构建普通超图、构建稀疏超图、样本成对约束和融合稀疏表示与成对约束理论的超图学习。基于超图的学习模型是一种非常重要的直推式半监督学习方法,在已有的直推式半监督学习算法中,超图学习方法能获得较好的性能。
Description
技术领域
本发明涉及汉字识别算法技术领域,尤其是涉及一种多模型超图的手写汉字识别算法。
背景技术
目前,地质调查的野外工作是数据的重要来源,这部分人工记录的原始地质资料在地质大数据中占有相当大的比例,其蕴含着大量有价值的信息,但出于技术原因,这部分数据中的信息无法利用,成为了“暗数据”。汉字识别技术主要分为印刷体识别和手写体识别两大类。手写汉字的随意性大,比印刷体难识别。手写汉字识别根据数据采集的方式又可分为联机识别和脱机识别。在联机识别中,计算机能获得输入字符的笔画顺序,因此比脱机识别获得的信息更多,更容易识别。再加上拍照或扫描的过程中,不同的光照、分辨率、纸张等都会带来干扰。因此,脱机手写汉字识别远比联机识别要难。
发明内容
本发明的目的在于提供一种多模型超图的手写汉字识别算法。
为实现上述目的,本发明采用以下内容:
一种多模型超图的手写汉字识别算法,包括:特征提取:利用8重交叉验证方法,即在每一次实验中,把所有标记数据与非标记数据分别分成8等份,选取其中1份作为训练样本集,剩下的7份为测试样本集。然后重复8次,每一个样本都有机会成为训练样本,取均值作为性能评估;构建普通超图:距离其最近的若干样本所组成的集合为一条超边;构建稀疏超图:把稀疏优化思想应用于流形聚类,依据流形聚类假设,数据样本集可能采样于多个子流形,每个子流形的维度不一定相同,利用稀疏表示求解方法可解得每个子流形聚类;样本成对约束:成对约束包含两个约束:必须连接约束和不能连接约束;利用训练样本的标记信息,必须连接约束表示,标记信息相同的样本或者说同类样本通过学习后,其类别信念必须相近;而不能连接约束规定不同类的样本通过学习后,其类别信念相距越远越好;融合稀疏表示与成对约束理论的超图学习。
优选的是,所述特征提取包括结构特征和统计特征;所述结构特征包括质心特征、笔划特征、笔划特征点和几何特征;所述统计特征包括方向特征、网格特征和Gabor特征。
优选的是,所述质心特征是文本笔划分布的体现,将二值图像转化成点阵形式,再依据质心计算公式求出水平质心与垂直质心;所述笔划特征由横、竖、撇、捺四种基本笔划构成,对单字分别提取这四种基本笔划,统计出各自的数量;所述笔划特征点主要有端点、折点、歧点与交点,端点是笔划的起点或终点,折点是笔划方向出现显著变化的点,歧点是三叉点,交点是四叉点,按序对二值图像进行扫描,统计出各笔划特征点的个数;所述几何特征是计算包含文本块的最小矩形的长宽比值。
优选的是,所述方向特征是文本块的方向角度;所述网格特征是把包含文本块的最小矩形平均分成若干行若干列,每个单元格中文字像素点的个数统计;Gabor特征是在网格基础上计算Gabor变换后的对应能量表示。
本发明具有以下优点:
本系统设计一种多模型的超图学习算法来识别手写汉字块,根据训练样本间距离关系构建样本关系阵,再以样本的稀疏表示参数为样本间的关系紧密性权重构建另一个样本关系阵,最后以样本约束法则为基础,以标记样本间的关系权重构建标记样本间的关系阵,融合这几个关系矩阵成为多模型的超图学习框架。通过迭代学习,找出最优的手写汉字块类别归属,在手写汉字块的实验中表现出一定的优势。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明。
图1是本发明的一种多模型超图的手写汉字识别算法的流程图。
图2是本发明的模型结构示意图。
图3和图4是本发明的实施例示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例对本发明做进一步的说明。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
如图1至4所示,一种多模型超图的手写汉字识别算法包括:
特征提取:收集68个志愿者手写的64遍“网络基础”的文本块图像;利用8重交叉验证方法,即在每一次实验中,把所有标记数据与非标记数据分别分成8等份,选取其中1份作为训练样本集,剩下的7份为测试样本集。然后重复8次,每一个样本都有机会成为训练样本,取均值作为性能评估;实验首先对每个文本块进行特征分析,志愿者在写文字时没有限定写法,对字体、字号、粗细、字间距、高低等不作要求,完全按照其真实的写法;结构特征包含质心特征、笔划特征、笔划特征点、几何特征;质心特征(2D,2维向量)是文本笔划分布的体现,将二值图像转化成点阵形式,再依据质心计算公式求出水平质心与垂直质心;笔划特征(4D)由横、竖、撇、捺四种基本笔划构成,对单字分别提取这四种基本笔划,统计出各自的数量;笔划特征点(4D)主要有端点、折点、歧点与交点,端点是笔划的起点或终点,折点是笔划方向出现显著变化的点,歧点是三叉点,交点是四叉点,按序对二值图像进行扫描,统计出各笔划特征点的个数;几何特征(1D)是计算包含文本块的最小矩形的长宽比值;统计特征包含方向特征、网格特征、Gabor特征等;方向特征(1D)是文本块的方向角度;网格特征(30D)是把包含文本块的最小矩形平均分成若干行若干列,每个单元格中文字像素点的个数统计,本文实验时分成3行10列共30个单元格;Gabor特征(30D)是在网格基础上计算Gabor变换后的对应能量表示;最后组合这些多种特征为文本块的72维的特征向量。
构建普通超图:距离其最近的若干样本所组成的集合为一条超边;设定图G=(X,E),所有样本x构成样本集X,和所有的超边e集合构成边集E,每一条超边包含了若干个样本,边的权重是该边中所有样本间的距离平均值;设定矩阵Dv、De和W对角线元素分别表示相应样本所在的边数、超边中样本的个数和超边的权值,设定邻接阵H,矩阵元素表示两样本间的连接关系;根据文献(D.Zhou,J.Huang,and B.Scholkopf,"Learning withhypergraphs:Clustering,classification,and embedding,”in Proc.NeuralInf.Process.Syst.,Vancouver'BC,Canada,2006,pp.1601-1608)其目标函数如下:
构建稀疏超图:把稀疏优化思想应用于流形聚类,依据流形聚类假设,数据样本集可能采样于多个子流形,每个子流形的维度不一定相同,利用稀疏表示求解方法可解得每个子流形聚类;假定数据集是采样于一个包含n个独立子流形的统一空间里,相当于这个数据集包含n类样本,通过求解目标函数可以获得块稀疏解,每一块中的非零元素对应一个子流形;相近样本的稀疏表示也相近,并且可以被同子流形中相近的样本线性表示,稀疏系数对应着样本间的相关性或权值;而稀疏超图学习是基于稀疏字典上的稀疏系数空间,相当于原样本特征空间映射后的空间;有了这种映射,可以避免原样本空间中,不同的特征表示尺度不一的问题。迭代学习超边的权值,最终达到一个稳定状态;
w=[w1,w2,…,wd]T.x和w表示同一个数据点,前一个是基于空间域,另一个是基于∑域。我们的目标是求解出基于∑的稀疏系数,即w包含尽量少的非零元素;根据文献(J.Wright,A.Yang,A.Ganesh,S.Sastry,and Y.Ma.Robust face recognition viasparse representation[J].IEEE Transactions on PatternAnalysis andMachineIntelligence,31(2),2009),这个稀疏解可以通过以下目标函数式求解得到:
假定数据集是采样于一个包含k个独立子空间的统一空间里,相当于这个数据集包含k类,根据文献(J.Wright,A.Yang,A.Ganesh,S.Sastry,and Y.Ma.Robust facerecognition via sparse representation[J].IEEE Transactions on PatternAnalysis and Machine Intelligence,31(2),2009),可以获得块稀疏解,每一块中的非零元素对应一个子空间;相近的样本的稀疏表示也相近,和可以被同子空间中相近的点线性表示,稀疏系数对应着样本间的相关性或权值;
根据求解后的稀疏表示,构建稀疏超图,样本相应的稀疏表示参数如果是非零值,表示两样本间相关,该参数表示相关性的紧密程度,邻接关系阵A为:
min fLsfT (5)
样本成对约束:成对约束包含两个约束:必须连接约束和不能连接约束;利用训练样本的标记信息,必须连接约束表示,标记信息相同的样本或者说同类样本通过学习后,其类别信念必须相近;而不能连接约束规定不同类的样本通过学习后,其类别信念相距越远越好;这里结合这两个约束进超图学习模型中以增强学习能力;
设定fi为xi的学习之后类别信念,C+表示与xi同类的样本集,C-表示与xi不同类的样本集,必须连接约束可以表示为:
和不能连接约束表示为:
结合这两个约束为成对约束,表示为:
其中N+表示C+中样本的数量;fi=[fi,f1 C+,…,fN+ C+,f1 C-,…,fN- C-],表示类别信念块;每一个块信念fi对应一个坐标序列,通过选择序列Si所有的信念块能够组合在一起为f,即fi=fSi.;Li表示局部几何信息;其中是一个基于成对约束的拉普拉斯矩阵。
融合稀疏表示与成对约束理论的超图学习:在普通超图中融入稀疏表示与成对约束理论成为一种新的结合学习算法,本系统称之为多模型超图学习模型(CSP),目标函数为:
r>1。为解决这个目标函数,我们利用一种迭代求解的方法[15],先初始化β=[1/3,1/3,1/3],固定β利用拉葛日乘法更新f
然后固定f,最小化表达式(11),可以计算出β为:
这个学习模型通过两到三次迭代后收敛。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。
Claims (4)
1.一种多模型超图的手写汉字识别方法,其特征在于,包括:
特征提取:收集68个志愿者手写的64遍“网络基础”的文本块图像;利用8重交叉验证方法,即在每一次实验中,把所有标记数据与非标记数据分成8等份,选取其中1份作为训练样本集,剩下的7份为测试样本集,然后重复8次,每一个样本都有机会成为训练样本,取均值作为性能评估;实验首先对每个文本块进行特征分析,志愿者在写文字时没有限定写法,对字体、字号、粗细、字间距、高低不作要求,完全按照其真实的写法;所述特征提取包括结构特征和统计特征,其中,结构特征包含质心特征、笔划特征、笔划特征点、几何特征;
构建普通超图:距离其最近的若干样本所组成的集合为一条超边;设定图G=(X,E),所有样本x构成样本集X,和所有的超边e集合构成边集E,每一条超边包含了若干个样本,边的权重是该边中所有样本间的距离平均值;设定矩阵Dv、De和W对角线元素分别表示相应样本所在的边数、超边中样本的个数和超边的权值,设定邻接阵H,矩阵元素表示两样本间的连接关系;
构建稀疏超图:把稀疏优化思想应用于流形聚类,依据流形聚类假设,数据样本集可能采样于多个子流形,每个子流形的维度不一定相同,利用稀疏表示求解方法可解得每个子流形聚类;
样本成对约束:成对约束包含两个约束,必须连接约束和不能连接约束;利用训练样本的标记信息,必须连接约束表示,标记信息相同的样本或者同类样本通过学习后,其类别信念必须相近;而不能连接约束规定不同类的样本通过学习后,其类别信念相距越远越好,融合稀疏表示与成对约束理论的超图学习:在普通超图模型中融入稀疏表示与成对约束理论成为一种新的结合学习算法,本系统称之为多模型超图学习模型,
设定xi、xj与xk为样本,fi、fj、fk分别为xi、xj与xk的学习之后类别信念即对应的类别归属权值向量,C+表示同一类的所有样本集合,C-表示不同类的所有样本集合,必须连接约束表示为:
和不能连接约束表示为:
结合这两个约束为成对约束,表示为:
其中N+表示C+中样本的数量,T表示转置;表示类别信念矩阵;每一个块信念对应一个坐标序列,通过选择坐标序列Si将所有的信念块组合在一起为类别信念矩阵即Li表示局部几何信息;是一个基于成对约束的拉普拉斯矩阵,
其中βi为组合系数,L=β1Lc+β2Ls+β3Lp。
2.根据权利要求1所述的一种多模型超图的手写汉字识别方法,其特征在于,所述统计特征包括方向特征、网格特征和Gabor特征。
3.根据权利要求2所述的一种多模型超图的手写汉字识别方法,其特征在于,所述质心特征是文本笔划分布的体现,将二值图像转化成点阵形式,再依据质心计算公式求出水平质心与垂直质心;所述笔划特征由横、竖、撇、捺四种基本笔划构成,对单字分别提取这四种基本笔划,统计出各自的数量;所述笔划特征点主要有端点、折点、歧点与交点,端点是笔划的起点或终点,折点是笔划方向出现显著变化的点,歧点是三叉点,交点是四叉点,按序对二值图像进行扫描,统计出各笔划特征点的个数;所述几何特征是计算包含文本块的最小矩形的长宽比值。
4.根据权利要求2所述的一种多模型超图的手写汉字识别方法,其特征在于,所述方向特征是文本块的方向角度;所述网格特征是把包含文本块的最小矩形平均分成若干行若干列,每个单元格中文字像素点的个数统计;Gabor特征是在网格基础上计算Gabor变换后的对应能量表示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910021582.4A CN109784266B (zh) | 2019-01-09 | 2019-01-09 | 一种多模型超图的手写汉字识别算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910021582.4A CN109784266B (zh) | 2019-01-09 | 2019-01-09 | 一种多模型超图的手写汉字识别算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109784266A CN109784266A (zh) | 2019-05-21 |
CN109784266B true CN109784266B (zh) | 2021-12-03 |
Family
ID=66499309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910021582.4A Expired - Fee Related CN109784266B (zh) | 2019-01-09 | 2019-01-09 | 一种多模型超图的手写汉字识别算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784266B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210582A (zh) * | 2019-06-17 | 2019-09-06 | 上海海事大学 | 一种基于局部协作表示分类的手写汉字识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902988A (zh) * | 2014-04-21 | 2014-07-02 | 梁爽 | 一种基于Modular积图与最大团的草图形状匹配方法 |
CN106203291A (zh) * | 2016-07-01 | 2016-12-07 | 昆明理工大学 | 一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法 |
CN107145826A (zh) * | 2017-04-01 | 2017-09-08 | 浙江大学 | 基于双约束度量学习和样本重排序的行人再识别方法 |
CN107480627A (zh) * | 2017-08-08 | 2017-12-15 | 华中科技大学 | 行为识别方法、装置、存储介质和处理器 |
CN107844802A (zh) * | 2017-10-19 | 2018-03-27 | 中国电建集团成都勘测设计研究院有限公司 | 基于无人机低空遥感和面向对象分类的水土保持监测方法 |
CN108960296A (zh) * | 2018-06-14 | 2018-12-07 | 厦门大学 | 一种基于连续潜在语义分析的模型拟合方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3020000B1 (en) * | 2013-07-09 | 2022-04-27 | 3M Innovative Properties Company | Systems and methods for note content extraction and management using segmented notes |
-
2019
- 2019-01-09 CN CN201910021582.4A patent/CN109784266B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902988A (zh) * | 2014-04-21 | 2014-07-02 | 梁爽 | 一种基于Modular积图与最大团的草图形状匹配方法 |
CN106203291A (zh) * | 2016-07-01 | 2016-12-07 | 昆明理工大学 | 一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法 |
CN107145826A (zh) * | 2017-04-01 | 2017-09-08 | 浙江大学 | 基于双约束度量学习和样本重排序的行人再识别方法 |
CN107480627A (zh) * | 2017-08-08 | 2017-12-15 | 华中科技大学 | 行为识别方法、装置、存储介质和处理器 |
CN107844802A (zh) * | 2017-10-19 | 2018-03-27 | 中国电建集团成都勘测设计研究院有限公司 | 基于无人机低空遥感和面向对象分类的水土保持监测方法 |
CN108960296A (zh) * | 2018-06-14 | 2018-12-07 | 厦门大学 | 一种基于连续潜在语义分析的模型拟合方法 |
Non-Patent Citations (4)
Title |
---|
Learning with Hypergraphs: Clustering,Classification, and Embedding;Dengyong Zhou 等;《MIT Press》;20071230;第1601-1608页 * |
Online and Offline Handwritten Chinese Character Recognition___A Comprehensive Study and New Benchmark;XuYao Zhang等;《arxiv》;20160618;第1-21页 * |
Robust Face Recognition via Sparse Representation;John Wright等;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20081226;第210-227页 * |
Segmentation of Cursive Handwritten Words using Hypergraph;P. Samrajya Lakshmi 等;《Tencon 2006-2006 IEEE Region Conference》;20061117;第1-4页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109784266A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hanmandlu et al. | Fuzzy model based recognition of handwritten numerals | |
Van der Maaten et al. | Visualizing data using t-SNE. | |
Huang et al. | Analysis and synthesis of 3D shape families via deep‐learned generative models of surfaces | |
Mane et al. | Visualizing and understanding customized convolutional neural network for recognition of handwritten Marathi numerals | |
Cecotti | Active graph based semi-supervised learning using image matching: application to handwritten digit recognition | |
CN102982343B (zh) | 手写数字识别的增量式模糊支持向量机方法 | |
Dhande et al. | Character recognition for cursive english handwriting to recognize medicine name from doctor's prescription | |
Obaidullah et al. | Numeral script identification from handwritten document images | |
CN109784266B (zh) | 一种多模型超图的手写汉字识别算法 | |
Ramesh et al. | Recognition of Kannada handwritten words using SVM classifier with convolutional neural network | |
Islam et al. | Geometry and statistics-preserving manifold embedding for nonlinear dimensionality reduction | |
Sharma et al. | Isolated handwritten digit recognition using adaptive unsupervised incremental learning technique | |
Montazer et al. | Farsi/Arabic handwritten digit recognition using quantum neural networks and bag of visual words method | |
CN116778339A (zh) | 局部视图辅助判别高光谱波段选择方法及系统 | |
Xia et al. | Oil tank extraction in high-resolution remote sensing images based on deep learning | |
Arivazhagan et al. | Recognition of handwritten characters using deep convolution neural network. | |
CN104573727A (zh) | 一种手写体数字图像降维方法 | |
Bharambe | Recognition of offline handwritten mathematical expressions | |
Bria et al. | Deep Transfer Learning for writer identification in medieval books | |
Patil et al. | Isolated handwritten Devnagri numeral recognition using HMM | |
Li et al. | Feature extraction and identification of handwritten characters | |
Wang et al. | A Recognition Method of the Similarity Character for Uchen Script Tibetan Historical Document Based on DNN | |
Husnain et al. | Urdu Handwritten Characters Data Visualization and Recognition Using Distributed Stochastic Neighborhood Embedding and Deep Network | |
Jameel et al. | Improved handwritten offline urdu characters recognition system using machine learning techniques | |
Kasim et al. | Fuzzy C means for image batik clustering based on spatial features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211203 |