CN101004793A - 基于高维空间凸锥构造的手写体文字识别方法 - Google Patents

基于高维空间凸锥构造的手写体文字识别方法 Download PDF

Info

Publication number
CN101004793A
CN101004793A CN 200610129816 CN200610129816A CN101004793A CN 101004793 A CN101004793 A CN 101004793A CN 200610129816 CN200610129816 CN 200610129816 CN 200610129816 A CN200610129816 A CN 200610129816A CN 101004793 A CN101004793 A CN 101004793A
Authority
CN
China
Prior art keywords
sample
class
convex cone
training sample
lambda
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610129816
Other languages
English (en)
Other versions
CN100461205C (zh
Inventor
李春利
惠康华
于倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Civil Aviation University of China
Original Assignee
Civil Aviation University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Civil Aviation University of China filed Critical Civil Aviation University of China
Priority to CNB200610129816XA priority Critical patent/CN100461205C/zh
Publication of CN101004793A publication Critical patent/CN101004793A/zh
Application granted granted Critical
Publication of CN100461205C publication Critical patent/CN100461205C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

基于高维空间凸锥构造的手写体文字识别方法。包括:训练样本的预处理;根据训练样本,计算一类样本之间及各类样本之间的几何关系,提取出每一类样本的几何特征点;根据一类训练样本的几何特征点,分别构造此类样本的凸锥覆盖;针对每一类训练样本,根据此类训练样本的凸锥覆盖,判断识别样本数据所属的类别。本发明给出了任意类别样本在高维空间单位球面上的几何分布图,并可得到任意类别样本的n维空间几何形态图,而且它是唯一的,即类别和位置是相互对应的;算法是严格递增的。由于此方法在构造过程中,没有对象和对象阈值等属性的假设前提,因此在模式识别的其它分支,如图像识别、语音识别及数据挖掘、人工智能等领域均具有广泛的适用性。

Description

基于高维空间凸锥构造的手写体文字识别方法
【技术领域】:
本发明属于基于计算机的模式识别技术领域,特别是指一种基于高维空间凸锥构造的手写体字符识别方法。
【背景技术】:
一个典型的基于计算机的模式识别系统,通常采取如下过程:数据的采集及预处理,特征生成、特征提取或选择,分类器设计和分类决策等,其中数据的采集及预处理的方法取决于特征生成提取及分类器设计方法。常用的模式识别方法有:聚类分析,统计模式识别,结构模式识别,神经网络,支持向量机等方法。
最为直观的模式识别方法是聚类分析方法,它的目标是用某种相似性度量的方法,将各类别数据组织到一起,但是针对于不同的识别对象相似性规则如何确定,实际上这是一个和特征提取与选择一样困难的问题。
在统计模式识别方法中,给出了一些确定相似性规则的方法,如根据模式所测得的特征向量Xi=(xi1,xi2,...,xin),i=1,2,...,M,根据模式之间的距离函数来判别分类,其中,M为样本点数,n为样本特征数。
在结构模式识别方法中,先抽取笔段或基本笔画作为基元,由这些基元再构成子模式,由子模式的组合来描述模式的过程,如经典的基元(primitive)表示法。
但在手写体数据中,由于民族,习惯的差别,在写法上有许多细节上的差别,造成抽取笔画等基元比较困难。通常,为了抽取笔画需要将原始点阵图象进行细化处理,但是细化算法不仅速度慢,而且容易产生伪笔画段,给准确抽取基元造成了困难,也就是说:结构模式识别方法对于较复杂的识别问题,还没有解决识别对象的表示问题。
我们利用上述模式识别方法,解决识别问题时,实际效果远不能令人满意,原因在于,上述方法存在如下问题:
1.在特征生成、特征提取或选择过程中,我们实际上是定义一个映射f:
f∶X→Y                   (1)
其中X∈Rn,Y∈BRm,m<<n,m,n∈N+,Rn为样本n维数据空间,Rm为m维样本特征数据空间,N+为非负自然数集。这样我们就实现了高维样本数据X∈Rn到低维Y∈BRm特征空间的降维过程。
如在结构模式识别方法中,抽取基元的过程就是一个降维的过程,由于链码的长度不同,所表示的特征向量所在的空间处于不同的空间中,即R1,R2,...,Rm
在统计模式识别方法中,特征向量的个数,聚类分析中聚类中心的个数,就是上述映射特征数据空间Rm的维数。
对于耦合性低的样本进行分类识别,上述特征提取过程在理论上和试验上是成立的,如图1a、b、c)。
但是对于高耦合的样本进行分类识别,目前在理论上或者试验上,我们还不能够充分的说明上述特征提取过程的充分性,即对于任意的Y∈BRm特征向量,我们找到的原象集合XARn,都是待识别的同一类样本。这其中的原因在于,复杂的特征提取过程,使得映射f是一个非线性影射或是一个集值影射,求出原象集合XARn本身就是一个非常困难的问题(图2a、b、c)。
2.在提取特征向量比较困难的情况下,我们给出了:直接利用样本数据,训练分类器的方法,如神经网络(见Oliveira L.S.,Morita M.,and Sabourin R.,Feature Selection foro Ensembles Applied to HandwritingRecognition,International Journal on Document Analysis and Recognition(IJDAR),2006,18(4):262-279)或支持向量机方法(SVM)(见J.X.Dong,Adam Krzyza,C.Y.Suen.Local learning framework for handwritten characterrecognition.和LN Teow and JF Loe.Robust vision-based features and classification schemes for of-line handwritten digitrecognition.Pattern Recognition,2002,35(11):2355:2364)等方法。其中,在任何一个神经网络计算过程中,首先需要确定一些神经元,每个神经元指定一个“感知函数”(或活化函数)。这相当于定义函数空间BRm上的“基函数”
Figure A20061012981600061
对于线性结构的神经网络,神经网络训练过程,相当于求解分类器函数的“基函数” 表示问题,即求
Figure A20061012981600063
的系数λi,i=1,2...,M,其中
Figure A20061012981600064
对于非线性结构的神经网络训练过程,相当于求解分类器函数的如下“基函数”表示问题,
H ( X ) = Σ i = 1 L μ i ψ i ( X ) , X ∈ R m - - - ( 3 )
其中
Figure A20061012981600066
在(2)式中,若实际分类器函数H(X)∈S,既是基函数所扩张成闭子空间中元素,则(2)式有精确解,既可以准确求出系数λi,=1,2,...,M;若H(X)S,则我们就只能按照某种度量,近似求出近似解H(X)的系数λi,i=1,2,...,M,常用的就是欧氏度量近似解。
在(3)式中,比较复杂,但是也分为H(X)属于或不属于S两种晴况,对于S的空间结构问题,我们在(Chun-li Li,Ming-gen Cui.How to solve the equation AuBu+Cu=f.AppliedMathematics and Computation,133(2):643-653及Chun-li Li,Ming-gen Cui.The exact solutionfor solving a class nonlinear operator equations in the reproducing kernel space.AppliedMathematics and Computation,19(1):14-17)两文中说明了,对于如下形式的非线性问题,
Σ i = 1 n Π j = 1 m A ij ( u ( x ) ) = f ( x ) - - - ( 4 )
它等价于高维再生核空间中的线性问题。
正因为在再生核空间中,线性和非线性问题的可以相互转化,支持向量机方法(SVM)对于某些非线性问题的解决具有非常好的效果。但是对于高耦合的手写体文字识别问题来说,SVM方法也是只能够在形如(4)式的情况下,给出分类器函数H(X)的精确表示。
对于能够利用“基函数” 给出分类器函数H(X)精确表示的问题,在(2)、(3)式中,还存在一个问题:若“基函数”
Figure A20061012981600073
数目或者 { ψ i } i = 1 i = L 的项比较多,则(2)、(3)式计算过程中,到什么条件下终止能够保证问题求解的精度。
【发明内容】:
本发明的目的是解决传统模式识别近似方法中特征提取的非唯一性,分类器设计过程中基函数选取标准模糊性及分类器计算的精度等问题,提供一种基于高维空间凸锥构造的手写体文字识别方法。此方法对于模式识别、人工智能等领域中相关问题的解决具有一般指导意义。
本发明提供的基于高维空间凸锥构造的手写体文字识别方法包括如下步骤:
a)已知手写体训练样本数据的预处理;
b)根据已知手写体训练样本数据,计算一类样本之间及各类样本之间的几何关系,提取出每一类样本的几何特征点;
c)根据一类训练样本的几何特征点,分别构造此类样本的凸锥覆盖,进而构造全部类别的凸锥集合;
d)针对每一类训练样本,根据此类训练样本的凸锥集合,识别未知样本数据所属的类别。
本发明方法的具体过程:
其中上述a)所述的已知训练样本的预处理方法,是指针对单个已知训练样本尺寸为M×N的图像数据(aij)M×N进行适当的小波变换,其中所使用的小波变换是指针对于图像压缩效果较好的常用离散小波变换,如Daubechies,Morlet或Meyer等。
将上述小波变换后的二维图像数据(bij)l×l转化为一维向量的形式:x=(x1,x2,…,xm)∈Rm,然后按照内积空间中的距离‖x‖把向量单位化,即 x ~ = x / | | x | | 。在单位化过程中,可以选择的距离公式有: | | x | | 2 = ( Σ i = 1 m x i 2 ) 1 / 2 (欧式距离)。
所有的单位化之后的训练样本数据 x ~ ∈ R m 按照类别分别构成训练样本集ΩiRm,i=1,...,C,这里C为样本类别数(即待识别文字总数量),所有单位化之后的训练样本构成集合
Ω = U i = 1 C Ω i ⊆ R m .
上述预处理过程首先解决了,不同尺寸的图像数据举位化到维数为m的空间中,在m维空间中不同的样本在视觉上是完全可以分类的(如图3),从而不同类别样本在m维空间中是相互分离的,不会出现图2中在低维空间里不同类别的样本重叠在一起的现象,同时避免了特征提取过程的不充分性,因此可以在m维空间构造出分类器函数;其次,上述预处理过程消除了训练样本的冗余性,并且能够保证预处理过程不改变样本的类别,如图4中第4行为原始样本,1-3行和5-7行样本是第4行样本经过长度等比例缩放之后的样本。
其中上述b)所述的在降维后的数据空间中,按照以上所采用的距离公式计算训练样本的几何属性值,包括:
1)计算某个样本x到第i类Ωi训练样本集的距离:
d i ( x , Ω i ) = min y ∈ Ω i { d ( x , y ) } , i = 1,2 , L , C ;
2)计算第i类训练样本的边界点集:
Γii)={x|d(x,y)=d(y,Ωi),x∈Ωi,y∈Ωj,j=1,...,C};i=1,...,C;
3)计算第i类和第j类样本的对偶点对集:
D(Ωi,Ωj)={(x,y)|(d(x,y)=d(x,Ωj)=d(y,Ωi),x∈Ωi,y∈Ωj};
4)计算第i类样本x和第j类样本y两类间对偶点对分隔点:
Z=αx+βy,α,β>0,α+β=1
其中(x,y)∈D(Ωi,Ωj,),对于Rm空间中连续分类器函数f(x)∈L2(Rm)满足f(Z)=0。
5)计算第i类样本x和第j类样本y两类间对偶点对分隔点Z点的最优法向量PΩ,满足:
max < P &Omega; , &Sigma; i = 1 n x i > , &Omega; = { x 1 , x 2 , . . . , x n } &SubsetEqual; R m , P &Omega; &Element; R m
而且<PΩ,Z>=0,PΩ∈Rm
上述c)所述的凸锥构造算法的流程如图6,其中凸锥理论相关性质,参见文献[Jean BaptisteHiriart-Urruty and Claude Lemarechal.Fundamentals of Convex Analysis.Springer,Heidelberg,2001],凸锥构造算法如下:
令全部训练样本集合为ΩRm,首先构造第i类样本集合ΩiΩRm的凸锥。
1)计算对偶点对集D(R1 0,E0),其中R1 0=Qi,E0=Ω-R1 0
2)计算满足min d(D(R1 0,E0))的对偶点对(x0,y0)∈D(R1 0,E0);
3)计算对偶点对(x0,y0)的对偶点对分隔点Z0
4)计算对偶点对分隔点Z0的最优法向量PR10
5)计算
R 1 k = { x | &lang; R R 1 k - 1 , x &rang; > 0 , x &Element; R 1 k - 1 } , E k = { y | &lang; P R 1 k - 1 , y &rang; > 0 , y &Element; E k - 1 } ,
对于任意x∈R1 k满足
&lang; P R 1 k , &lambda;x - Z k &rang; = &lambda; &lang; P R 1 k , x &rang; > 0 , &lambda; > 0 , k = 1,2 , . . . , N ,
其中由N个平面 &lang; P R 1 k , x - Z k &rang; = 0 , k = 1,2 , . . . , N 组成一个凸锥
&Lambda; 1 = { x | &lang; P R 1 k , x &rang; > 0 , k = 1,2 , . . . , N } .
6)当Ek≠Φ(空集)时,返回1)继续;否则,继续计算7)。
7)计算R2 0=Ωi-R1 0,继续算法1-6)步骤,直到Rk 0=Φ,终止。
按照步骤7),我们依次得到第i类的凸锥集 &Lambda; i = { &Lambda; i 1 , &Lambda; i 2 , . . . , &Lambda; i K } .
按照上面算法,同理可以得到每一类的凸锥集。
其中上述d)所述的凸锥识别手写体文字识别步骤如下:
1)待识别样本x的预处理,即把向量x单位化;
2)若x∈Λi l,则判断样本x属于第i类。
其中所述的凸锥识别手写体文字识别流程图,如图7。
本发明的优点及效果:
l、本发明给出了任意类别样本在高维空间单位球上的几何分布图。由于我们对样本进行了小波变换,保证图像类别不发生变化,在单位化过程中,图像变化如图4,类别也没有发生变化,那么当空间的维数固定为n时,相当于绘出了n维空间单位球上每一类别的高维几何分布图。这样,按照此方法,实际上我们能够得到,任意类别样本的n维空间几何形态图,而且它是唯一的,即类别和位胃是相互对应的;
2、算法是严格递增的。当存在误识的样本时,洗明此样本所在的n维空间单位球上,存在此类别未被标注的区域,只要利用凸锥构造法,继续深入的描绘此区域,这样此类别的n维空间几何形态图得到了进一步的精细刻画,再次判断识别时就不会误识此区域的样本;
3、由于此方法在构造过程中,没有对象和对象阈值等属性的假设前提。因此在模式识别的其它分支,如图像识别、语音识别及数据挖掘、人工智能等领域均具有广泛的适用性。
【附图说明】:
图1是部分耦合性低的样本数字0,3,8在二维空间中的分布图,a是数字0,b是数字3,c是数字8(每一子图中的“*”点分别代表0,3,8类的每一个样本,“0”点代表其它类的样本);
图2是部分高耦合的样本数字0,3,8在二维空间中的分布,a是数字0,b是数字3,c是数字8(每一子图中的“*”点分别代表0,3,8类的每一个样本,“0”点代表其它类的样本);
图3是NIST SD19数据库中数字0-9中每一类前10个降维为1024后的手写体数字样例图;
图4是手写体数字样本0-9进行小波变换后图像变化示意图(Y表示相对于图4中原始样本向量长度的倍数);
图5是部分手写体数字样本1,3,9在三维单位球面上一个凸锥的结构图,a是数字1,b是数字3,c是数字9(各色三角平面是凸锥的构成平面;每一子图的圆点分别代表1,3,9类的每一个样本,方点代表其它每类的样本在此局部区域中每一类的聚类中心点);
图6是手写体文字凸锥构造流程图;
图7是凸锥法手写体文字识别流程图;
图8是手写体数字原始样例图;
图9是手写体数字分割样例图;
图10是图9中分割后的数字利用Daubechies小波降维为1024后的样例图。
【具体实施方式】:
实施例1:
针对手写体数字识别问题,本发明方法的具体实施步骤如下:
第一步凸锥的构造
美国国家标准技术研究所(NIST-National Institute of Standards andTechnology)NIST SD19数据库已收录了各民族、各年龄、各种职业等人员的手写体数字及字符,本文利用美国NIST SD19数据库中的数字0-9作为训练样本,取数据库中每类第1到第20000个样本,共计200,000个训练样本,在PC机上利用本发明的上述识别方法进行构造每一类别凸锥簇平面集,构造流程如图6,对于NIST SD19数据库中的每一类,得到的每一类凸锥簇结构如表1(计算过程略)。
表1  0-9类数字凸锥簇结构
类别 0 1 2 3 4 5 6 7 8 9
凸锥簇中凸锥个数 117  52  177  207  156  187  78  115  239  161
最多平面数 304  330  216  312  112  222  147  143  380  217
最少平面数 9  7  11  13  8  8  9  9  19  12
由表1可以看出,每一个凸锥由许多平面组成,且这些平面全部经过原点,图5,给出了部分手写体数字样本1,3,9在三维单位球面上一个凸锥的结构图。
第二步手写体数字识别
1如图8手写体数字样例,利用常规的方法,对图8进行分割(如图9),利用Daubechies小波降维为1024,得到可用于识别的手写体数字,如图10;
2从头到尾取图10中处理后的所有数字,按照图7识别算法流程,得到每一个数字的识别结果,分别处在表2中的每一类别凸锥中,正确率为100%,见表2。
表2  数字样例实验结果
样本 2 2 6 9 9 0 7 8 8 3 7 5 4 3 4
    所在的凸锥簇 2 2 6 9 9 0 7 8 8 3 7 5 4 3 4
    所在簇的凸锥序号 34 108 23 87 112 56 74 134 142 51 20 67 98 42 12
为了进一步说明此方法的有效性,我们使用美国数据库NIST SD19中所有样本进行测试,实验结果如表3:
表3NIST SD19数据库实验结果
  类别   0   1   2   3   4   5   6   7   8   9
  识别样本数   40363   44704   40072   41112   39154   36606   39937   41893   39579   39533
  训练样本   20000   20000   20000   20000   20000   20000   20000   20000   20000   20000
  训练样本错误识别 0 0 0 0 0 0 0 0 0 0
  识别样本错误识别   1308   744   2814   3086   973   2112   476   1228   2746   2979
  识别样本正确识别率(%) 97.5 98.6 93.08 93.0 97.5 94.2 98.8 97.1 93.1 92.5
由表3可以看出,对于训练样本,按照凸锥构造方法,可以给出准确的训练样本的空间分布,从而可以100%的识别它们。
表3中误识样本包括拒识样本和错误识别样本,对于拒识样本,表3中数据说明我们使用的美国NIST SD19数据库中200,000个样本还不能充分表达0-9数字在高维空间(1024维)中的分布,因此需要增加在此误识区域的训练样本;对于错误识别样本,表3中数据说明我们使用的200,000个样本,还没有精细的刻画出错误识别样本所在空间中凸锥的形状。上述问题的解决,可以利用误识样本,进一步按照上述算法生成新的凸锥或者进一步刻画不精确的凸锥,从而达到完全识别。

Claims (5)

1、一种基于高维空间凸锥构造的手写体文字识别方法,其特征在于该方法包括如下步骤:
a)已知手写体训练样本数据的预处理;
b)根据已知手写体训练样本数据,计算一类样本之间及各类样本之间的几何关系,提取出每一类样本的几何特征点;
c)根据一类训练样本的几何特征点,分别构造此类样本的凸锥覆盖,进而构造全部类别的凸锥集合;
d)针对每一类训练样本,根据此类训练样本的凸锥集合,判断识别样本数据所属的类别。
2、根据权利要求1所述的基于高维空间凸锥构造的手写体文字识别方法,其特征在于:其中a)所述的手写体训练样本数据的预处理方法是指:针对单个已知训练样本尺寸为M×N的图像数据(aij)M×N进行小波变换,使得图像数据降维,而在视觉上仍能分辨出训练样本数据所属类别的图像数据(bij)l×l,l=64,32,16;将上述小波变换后的二维图像数据(bij)l×l转化为一维向量的形式:x=(x1,x2,…,xm)∈Rm,然后按照内积空间Rm中的距离||x||=<x,x>1/2,其中<·,·>表示内积空间的内积,把向量x单位化,即 x ~ = x / | | x | | , 其中||x||定义为: | | x | | 2 = ( &Sigma; i = 1 m x i 2 ) 1 / 2 , 表示向量的长度;所有的单位化之后的训练样本数据 首先按照类别分别构成训练样本集ΩiRm,i=1,...,C,这里C为样本类别数,然后将所有单位化之后的训练样本构成集合
Figure A2006101298160002C4
3、根据权利要求1所述的基于高维空间凸锥构造的手写体文字识别方法,其特征在于:其中b)所述的计算一类样本之间及各类样本之间的几何关系,提取出每一类样本的几何特征点是指:在降维后的数据空间中,按照权利要求2中所采用的距离公式计算第i类训练样本集Ωi,i=1,...,C的几何特征的属性值,包括:
1)计算某个样本x到第i类Ωi训练样本集的距离:
d i ( x , &Omega; i ) = min y &Element; &Omega; i { d ( x , y ) } , i = 1,2 , . . . , C ;
2)计算第i类训练样本的边界点集:
Гii)={x|d(x,y)=d(y,Ωi),x ∈Ωi,y∈Ωj,j=1,...,C},i=1,...,C;
3)计算第i类和第j类样本的对偶点对集:
D(Ωi,Ωj)={(x,y)|d(x,y)=d(x,Ωj)=d(y,Ωi),x∈Ωi,y∈Ωj};
4)计算第i类样本x和第j类样本y两类间对偶点对分隔点:
Z=αx+βy,α,β>0,α+β=1
其中(x,y)∈ D(Ωi,Ωj),对于Rm空间中连续分类器函数f(x)∈L2(Rm)满足f(Z)=0;
5)计算第i类样本x和第j类样本y两类间对偶点对分隔点Z点的最优法向量PΩ,满足:
max < P &Omega; , &Sigma; i = 1 n x i > , &Omega; = { x 1 , x 2 , . . . , x n } &SubsetEqual; R m , P &Omega; &Element; R m
而且<PΩ,Z>=0,PΩ∈Rm
4、根据权利要求1所述的基于高维空间凸锥构造的手写体文字识别方法,其特征在于,c)中所述的凸锥的构造方法是:令全部训练样本集合为ΩRm,首先构造第i类样本集合ΩiΩRm的凸锥:
1)计算对偶点对集D(R1 0,E0),其中 R 1 0 = &Omega; i , E 0 = &Omega; - R 1 0 ;
2)计算满足mind(D(R1 0,E0))的对偶点对 ( x 0 , y 0 ) &Element; ( R 1 0 , E 0 ) ;
3)算对偶点对(x0,y0)的对偶点对分隔点Z0
4)计算对偶点对分隔点Z0的最优法向量PR10
5)计算
R 1 k = { x | &lang; P R 1 k - 1 , x &rang; > 0 , x &Element; R 1 k - 1 } , E k = { y | &lang; P R 1 k - 1 , y &rang; > 0 , y &Element; E k - 1 } ,
对于任意 满足:
&lang; P R 1 k , &lambda;x - Z k &rang; = &lambda; &lang; P R 1 k , x &rang; > 0 , &lambda; > 0 , k = 1,2 , . . . , N ,
其中,由N个平面 &lang; P R 1 k , x - Z k &rang; = 0 , k = 1,2 , . . . , N 组成一个凸锥:
&Lambda; 1 = { x | &lang; P R 1 k , x &rang; > 0 , k = 1,2 , . . . , N } ;
6)当Ek≠Φ(空集)时,返回1);
7)计算 R 2 0 = &Omega; i - R 1 0 , 继续算法1-6)步骤,直到 R k 0 = &Phi; , 终止;
按照步骤7),我们依次得到第i类的凸锥集合 &Lambda; i = { &Lambda; i 1 , &Lambda; i 2 , . . . , &Lambda; i k } ;
同理,按照上面算法,得到全部类别的凸锥集合。
5、根据权利要求1所述的基于高维空间凸锥构造的手写体文字识别方法,其特征在于,其中1d)所述的判断识别未知样本数据所属类别的步骤如下:
1)待识别样本x的预处理,即把向量x单位化;
2)若
Figure A2006101298160004C7
则判断样本x属于第i类,i=1,2,……C。
CNB200610129816XA 2007-01-08 2007-01-08 基于高维空间凸锥构造的手写体文字识别方法 Expired - Fee Related CN100461205C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200610129816XA CN100461205C (zh) 2007-01-08 2007-01-08 基于高维空间凸锥构造的手写体文字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200610129816XA CN100461205C (zh) 2007-01-08 2007-01-08 基于高维空间凸锥构造的手写体文字识别方法

Publications (2)

Publication Number Publication Date
CN101004793A true CN101004793A (zh) 2007-07-25
CN100461205C CN100461205C (zh) 2009-02-11

Family

ID=38703917

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200610129816XA Expired - Fee Related CN100461205C (zh) 2007-01-08 2007-01-08 基于高维空间凸锥构造的手写体文字识别方法

Country Status (1)

Country Link
CN (1) CN100461205C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373519B (zh) * 2007-08-20 2011-01-19 富士通株式会社 字符识别装置和方法
CN107506799A (zh) * 2017-09-01 2017-12-22 北京大学 一种基于深度神经网络的开集类别发掘与扩展方法与装置
CN108416390A (zh) * 2018-03-16 2018-08-17 西北工业大学 基于二维卷积降维的手写字体识别方法
CN110210478A (zh) * 2019-06-04 2019-09-06 天津大学 一种商品外包装文字识别方法
US11164025B2 (en) 2017-11-24 2021-11-02 Ecole Polytechnique Federale De Lausanne (Epfl) Method of handwritten character recognition confirmation

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9904889B2 (en) 2012-12-05 2018-02-27 Applied Brain Research Inc. Methods and systems for artificial cognition

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW338815B (en) * 1995-06-05 1998-08-21 Motorola Inc Method and apparatus for character recognition of handwritten input
JP2001060248A (ja) * 1999-08-23 2001-03-06 Yoshinobu Takeuchi 手書き文字認識方法
US7379596B2 (en) * 2003-10-24 2008-05-27 Microsoft Corporation System and method for personalization of handwriting recognition

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373519B (zh) * 2007-08-20 2011-01-19 富士通株式会社 字符识别装置和方法
CN107506799A (zh) * 2017-09-01 2017-12-22 北京大学 一种基于深度神经网络的开集类别发掘与扩展方法与装置
CN107506799B (zh) * 2017-09-01 2020-04-24 北京大学 一种基于深度神经网络的开集类别发掘与扩展方法与装置
US11164025B2 (en) 2017-11-24 2021-11-02 Ecole Polytechnique Federale De Lausanne (Epfl) Method of handwritten character recognition confirmation
CN108416390A (zh) * 2018-03-16 2018-08-17 西北工业大学 基于二维卷积降维的手写字体识别方法
CN110210478A (zh) * 2019-06-04 2019-09-06 天津大学 一种商品外包装文字识别方法

Also Published As

Publication number Publication date
CN100461205C (zh) 2009-02-11

Similar Documents

Publication Publication Date Title
Zois et al. Offline signature verification and quality characterization using poset-oriented grid features
AU2004271639B2 (en) Systems and methods for biometric identification using handwriting recognition
US7724958B2 (en) Systems and methods for biometric identification using handwriting recognition
Burrow Arabic handwriting recognition
CN100461205C (zh) 基于高维空间凸锥构造的手写体文字识别方法
US20090324107A1 (en) Systems and methods for image recognition using graph-based pattern matching
Mouchere et al. Icfhr 2012 competition on recognition of on-line mathematical expressions (crohme 2012)
Ribas et al. Handwritten digit segmentation: a comparative study
CN105224937B (zh) 基于人体部件位置约束的细粒度语义色彩行人重识别方法
CN104715254A (zh) 一种基于2d和3d sift特征融合的一般物体识别方法
CN103093240A (zh) 书法字识别方法
CN103473545B (zh) 一种基于多特征的文本图像相似度度量方法
CN103077389A (zh) 一种结合字符级分类和字符串级分类的文本检测和识别方法
Fazilov et al. State of the art of writer identification
CN103810484B (zh) 基于打印字库分析的打印文件鉴别方法
Aouadi et al. Word extraction and recognition in arabic. handwritten Text
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
CN112651323B (zh) 一种基于文本行检测的中文手写体识别方法及系统
Okawa et al. Offline writer verification based on forensic expertise: Analyzing multiple characters by combining the shape and advanced pen pressure information
Suen et al. Analysis of errors of handwritten digits made by a multitude of classifiers
CN102902984B (zh) 基于局部一致性的遥感影像半监督投影降维方法
Al-Maadeed et al. Automatic handedness detection from off-line handwriting
Simistira et al. A system for recognition of on-line handwritten mathematical expressions
Rusinol et al. CVC-UAB's Participation in the Flowchart Recognition Task of CLEF-IP 2012.
Ferri et al. Point selection: A new comparison scheme for size functions (with an application to monogram recognition)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090211

Termination date: 20120108