CN101160592B - 手写字符识别方法和手写字符识别系统 - Google Patents
手写字符识别方法和手写字符识别系统 Download PDFInfo
- Publication number
- CN101160592B CN101160592B CN2006800125797A CN200680012579A CN101160592B CN 101160592 B CN101160592 B CN 101160592B CN 2006800125797 A CN2006800125797 A CN 2006800125797A CN 200680012579 A CN200680012579 A CN 200680012579A CN 101160592 B CN101160592 B CN 101160592B
- Authority
- CN
- China
- Prior art keywords
- angle
- sequence
- character
- broken line
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
- G06V30/347—Sampling; Contour coding; Stroke extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
在进行联机手写字符识别等手写字符识别时,对显著的变形、转动等转换进行处理,另外即使对楷书等一笔写成的输入也可进行简单且高性能的字符识别。因此本发明按每个笔画用参数表现来捕获输入的手写字符,并按每个笔画进行折线近似,将该折线近似的各折线作为从始点起到终点的向量求出,将成为基准的轴与各折线所成的角度作为折线角序列求出,并求出所得到的折线角的顶点的外角序列,将外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列,分层且分割地提取该求出的各序列的全局特征、及根据涡旋夹角序列进行了分割的各曲线部分中的局部特征、次局部特征,通过将该提取结果与预先准备的识别对象字符的模板进行比较,进行字符识别。
Description
技术领域
本发明涉及一种进行联机手写字符识别的手写字符识别方法和手写字符识别系统、实现该识别方法的手写字符识别程序以及保存该程序的存储介质。
背景技术
以往,提出并实际应用了很多字符识别系统,关于其基本原理有两个观点,一个是构造解析的观点,另一个是模式匹配的观点,前者一般应用于该识别系统简单因而输入限制较强的情况即笔画数、笔顺固定或者使任一个固定的对象中,另一方面后者应用于使笔画数、笔顺两者自由的情况或与其接近的情况。
作为构造解析的观点,如電子通信学会論文誌,56-D,5,pp.312-319,“手書き数字·片仮名字符のオンライン実時間認識”、日本特许厅公布的特开昭59-131972号公报中所记载那样,有称为基本笔划(stroke)方式的方式,将笔划分类为简单笔划(4种)、复合笔划(7种)并由识别自动装置进行识别,虽然简单,但是在作成字典、处理连笔字、简写字时存在问题,在其发展性上存在问题。
模式匹配法大体分为两种方法。一种是如電子情報通信学会論文誌,J63-D,2,pp.153-160,“ストロ一クの点近似による手書き字符のオンライン認識”中所记载那样,用少数的点来近似笔划并将它们作为特征点,还估计笔在端点上的运动方向并将它们也作为特征点,构成特征向量。字典分解为笔划,它们同样具有特征向量,取得输入向量与对各范畴的每个所准备的特征向量之间的对应,对取得对应的字典计算距离,提供最小距离的字典名是被识别的字符名,基本上相对于笔顺、笔画数是自由的。
还存在一种模式匹配法,作为特征点的对应方式的原论文,有记载在電子通信学会論文PRL74-20中的“Rubber StringMatching法による手書き字符認識”,另外有如日本特许厅公布的特开昭57-45679号公报以及特开平8-24942号公报中所说的通过DP(Dynamic Programming:动态规划)方式将输入字符与字典的特征点向量进行对应的方法,它正成为手写字符的联机识别的主流。
此外,最近将联机字符识别技术应用于联机中。
其中,存在至今为止积累的OCR技术,它也可以使用于联机字符识别中。
如果从该观点看OCR技术,主流是方向特征匹配。对此有庞大的文献,基本的考虑方法例如作为原论文在[電子情報通信学会論文誌,J62-D,3,pp.217-224,“文字認識のための相関法の一改良”]中。该方法与构造解析的方法的根本的不同点在于,特征一般被分配到n×m的格子平面上,将该平面上的特征分布作为最终的输入字符的表现,将n×m例如从左角向右进行扫描,设为n×m维的向量。关于识别,计算标准方向特征向量与输入字符方向特征向量的内积(类似度),将其值最大的标准方向特征向量的范畴名设为答复。此时,特别是在变形明显的手写字符中进行高度非线性标准化的预处理。需要该处理是因为该方法将n×m的格子平面设为基本框架。该方法的优点如下:由于一般能够应用向量空间、特别是定义了内积的希尔伯特空间论,因此引用高度的识别理论。另外从实用性来讲,抗噪声强。但是,抹杀了难得的联机最大的优点即分割的容易性。在联机中例如在相同的位置上无论写几个字符,机器都能够识别。另外,对于特别明显的变形,即使进行高度的非线性标准化也不够,例如在转动变形中需要相当高度的、相当大的计算量的标准化。在[S.Mori,H.Nishida,H.Yamada,Optical CharacterRecognition,Wiley]的第3章中有详细的记述。
另外,作为以上的特征,例如也可以取曲率。根据该观点,在[電子情報通信学会論文誌,J62-D,3,pp.217-224,“文字認識のための相関法の一改良”]中特别是笔记体的“g”、“y”、以及阿拉伯数字“9”在手写字符中容易被弄错,因此命名为转动特征,求出弯曲部分的切线角度差,进行适当的量子化,用以往的方向特征向量和局部转动特征向量来表现字符,求出汇总了这些向量的全特征向量,并进行模糊处理(这实际上是在格子平面上进行)。提出了关于各个范畴求出模糊全特征标准向量来进行类似度计算并给出答复的方法。另外,在构造解析的观点上,笔记体的“g”、“y”和阿拉伯数字“9”大不相同。这是因为将上部的构造视为积极的(positive)。但是在特征匹配中,在内积的过程中混合成一个标量,因此将上部构造视为消极的(negative),由于三个字符都有强的直线构造,因此被该直线掩盖。因此特意准备了局部特征面。但是,如后面所述,在本方法中不是局部而是全局地求出以上称为转动特征的特征,以一贯的形式自然简单地表现。因而,能够非常简单地识别以上三种字符。
对于图形、放置在物流系统中的物体、军事中的飞机等广泛的对象需要转动中不变的识别系统。
因而,从以往就进行研究,现在也仍然发表了很多论文。关于到1990年为止的研究,在森俊二,坂倉栂子合著的图像识别的基础(II)中详细地记述着,另外到1999年为止的研究在S.Mori,H.Nishida,H.Yamada著Optical Character Recognition中有详细的记述,该研究的主流是矩法(moment method),组合高次的矩使得抵消相位角,另外有称为傅立叶描述子的傅立叶变换法的应用,这反映最近的PC变得非常高速,虽然促进了研究本身,但是作为实用尚未出现在市场,但是另一方面与该潮流不同,如情報処理学会論文誌第27卷第5号:1986年5月,“画素,筆順,回転,区切りによらないオンライン手書き図形認識方式”中所记载那样用直线线段、弧的序列来近似对象,并用它们的相对角度变化来表现,取得与字典相同表现的对象(输入图形)对应,用各个角度变化的差的绝对值之和来测量相互间的距离而作为转动不变的方式,但是在论文本身中记述了不擅长锐角的检测的缺点。
所谓的匹配方式是放置了字符的二维平面上的特征(例如笔划的方向)匹配。另外在联机手写字符识别中是所谓的DP(Dynamic Programming)匹配、又称柔性串匹配。前者对二维上的特征分布进行向量表现,将字符间的距离定义为这些向量的内积,作为定义了内积的向量空间上的识别问题,用统计方法进行字符识别。后者扩展简单的重合匹配,通过使输入字符适应性地、灵活地匹配标准字符,从而进行字符识别。
对这种方法,一直以来研究通常称为构造解析方法的字符识别法。这也可应用于一般图形,是很好的方法,但是需要对象的、具体地说是字符笔划的符号化,进行利用符号的匹配。但是,在进行该符号化时存在问题,由于符号化而失去灵活性,另外没有机械地进行设计,研究、开发停滞不前。例如上述的[電子通信学会論文誌,56-D,5,pp.312-319,“手書き数字·片仮名文字のオンライン実時間認識”]的发表是在过去的1973年。在该阶段,将联机字符的右转和左转作为特征而使用,但是这些序列全部被符号化。由输入模式的X-坐标值的增减来检测它们,用11个符号来表现。这种符号表现缺乏灵活性,作为实际特别的情况只能使用一部分。之后,在1981年在构造解析性方法中引入由電子通信学会論文誌,J64-D,8,p705-712,“形の代数的構造表現”提供统一观点的代数思想,在1992年利用IEEE Trans.on Pattern Analysis and Machine Intelligence Vol.14,No.5,pp.1029-1058,“Algebraic Des cription of Curve Structure”构建了实用的代数系统,但仍然是符号表现。这样,构造解析方法停留在符号表现水准上。为了突破这个障碍,不设为符号而必须设为模拟的情形本身在学会上经常说起,但是至今为止还没有发现该模拟化的具体的方法。
然而,上述的以往技术中存在如下所述的基本问题。
构造解析虽然简单,但是没有灵活性,基本模式的界限成为问题,离散且不灵活,制作字典花费工夫和时间。
模式匹配法、特别是DP方式其处理繁重。
模式匹配法还包括联机识别,主要目的在于仅仅是读、即将输入字符强行地应用于字典,不能观察原因结果的对应,有时导致难以理解的误读,而设计者也不清楚其原因的情况并不罕见。
发明内容
本发明基本上属于上述的构造解析方法,然而克服了至今为止的问题点,提供灵活的构造解析方法的基础,因此目的在于避免符号化的问题并模拟地表现构造,从而进行与标准之间的灵活且简单的匹配。
为了达到上述目的,第1发明的特征在于,在识别联机的手写字符的手写字符识别方法中,其特征在于,对各笔画的每一个笔画利用参数表现来捕获输入的手写字符,对各笔画的每一个笔画进行折线近似,将上述折线近似的各折线作为从始点到终点的向量而求出,将成为基准的轴与上述各折线所成的角度作为折线角序列而求出,求出所得到的折线的角顶点的外角序列,将上述外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列,分层且分割地提取上述求出的各序列的全局特征与涡旋夹角序列的各项涡旋夹角区域内的局部特征或者次局部特征,通过将该提取结果与预先准备的模板进行比较,进行字符识别。
另外,第2发明的特征在于,在第1发明的字符识别方法中,在由上述涡旋夹角序列构成的曲线环的前后,将各项分割为前涡旋夹角、后涡旋夹角,从而进行识别处理。
另外,第3发明的特征在于,在第1发明的字符识别方法中,上述识别对象字符的模板是从学习数据中决定了各特征的上限下限范围和各序列要素的数据。
另外,第4发明的特征在于,在第1发明的字符识别方法中,作为上述折线近似表现,使用将折线的长度作为要素的序列、用折线全长进行了标准化的长度序列以及将始点、顶点、终点作为要素的坐标序列,求出端长比、中间长、中间最大长、上述长度序列的要素的分布、始点终点间距离的特征。
另外,第5发明的特征在于,在第1发明的字符识别方法中,求出某个决定的区间内的折线的加权平均角和外角序列的边界点的值、始点/终点/边界点两两之间的距离以及边界点之间的距离的特征。
另外,第6发明的特征在于,在第1发明的字符识别方法中,在由涡旋夹角序列的各项涡旋夹角区域内、涡旋夹角区域间的特征构成的部分多维特征空间上,由各学习数据构成识别平面,进行字符间的识别。
另外,第7发明的特征在于,在第1发明的字符识别方法中,从涡旋夹角序列的各要素的外角序列和与其相当的长度序列中,取长度序列为一个轴,取外角序列的累积角为另一个轴,通过进行线性插值来构成图表,构成累积角特征函数来求出全局弯曲状况的特征,其中所述累积角特征函数作为离该要素的始点的距离的函数连续求出涡旋夹角,另外与其相反作为涡旋夹角的函数连续求出距离。
另外,第8发明的特征在于,在第1发明的字符识别方法中,通过求出直线群彼此的交点,定量地求出多个笔画间的位置关系,所述直线群包含各笔画的代表折线的延长线或者折线集合的延长线。
另外,第9发明的特征在于,在第4发明的字符识别方法中,在上述标准化的序列内,忽略规定长度以下的折线。
另外,第10发明的特征在于,在第1发明的字符识别方法中,在涡旋夹角序列的各项涡旋夹角区域内,利用上述折线角序列的相邻的折线角的变化的模式或者累积角特征函数,将对象字符分解成多个分区,将该分区或边界点的特征利用在与识别对象字符的比较中。
另外,第11发明的特征在于,在第1发明的字符识别方法中,将与由上述涡旋夹角序列的各项构成的曲线的涡旋夹角的一半对应的曲线上的点作为中点而求出,在其前后分割各项内的曲线,求出从各分割折线群中提取的前角分散和后角分散,提高识别精确度。
另外,第12发明的特征在于,在识别联机手写字符的手写字符识别系统中,具备:
输入单元,其联机地输入手写字符;
折线近似单元,其对各笔画的每一个笔画利用参数表现来捕获由上述输入单元输入的数据,对各笔画的每一个笔画进行折线近似;
处理单元,其将由上述折线近似单元折线近似的各折线作为从始点到终点的向量而求出,将成为基准的轴与上述各折线所成的角度作为折线角序列而求出,并求出上述折线的角顶点的外角序列,将上述外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列;以及
识别单元,其分层且分割地提取由上述处理单元求出的各序列的全局特征和涡旋夹角序列的各项涡旋夹角区域内的局部特征或者次局部特征,将该提取结果与预先准备的识别对象字符的模板进行比较,从而进行字符识别。
第13发明的特征在于,在识别联机手写字符的手写字符识别程序中,具备:
对各笔画的每一个笔画利用参数表现来捕获输入的手写字符、并对各笔画的每一个笔画进行折线近似的步骤;
将上述折线近似的各折线作为从始点到终点的向量求出、将成为基准的轴与上述各折线所成的角度作为折线角序列求出的步骤;
求出所得到的折线的角顶点的外角序列的步骤;
将上述外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列的步骤;以及
分层且分割地提取上述求出的各序列的全局特征和涡旋夹角序列的各项涡旋夹角区域内的局部特征或者次局部特征、并将该提取结果与预先准备的识别对象字符的模板进行比较从而进行字符识别的步骤。
第14发明的特征在于,在通过使规定的运算处理装置安装所存储的程序从而可进行联机手写字符识别的存储介质中,
作为存储在存储介质中的程序,具备:
对各笔画的每一个笔画利用参数表现来捕获输入的手写字符、并对各笔画的每一个笔画进行折线近似的步骤;
将上述折线近似的各折线作为从始点到终点的向量求出、将成为基准的轴与上述各折线所成的角度作为折线角序列求出的步骤;
求出所得到的折线的角顶点的外角序列的步骤;
将上述外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列的步骤;以及
分层且分割地提取上述求出的各序列的全局特征和涡旋夹角序列的各项涡旋夹角区域内的局部特征或者次局部特征、并将该提取结果与预先准备的识别对象字符的模板进行比较从而进行字符识别的步骤。
根据这样的本发明,能够避免符号化的问题,模拟地表现构造,进行与标准之间的灵活且简单的匹配。另外进行构造解析,因此必然能够合适地描述对象,从人的视觉上来看原因结果的对应明确。因而,可进行字符等对象的形状的评价,可设定正确的否定范围,可提供具有更接近人的能力的识别系统。
附图说明
图1是表示本发明的一个实施方式的系统例的结构图。
图2是表示本发明的一个实施方式的字符识别整体的处理例的流程图。
图3是表示本发明的一个实施方式的特征点检测处理例的流程图。
图4是表示本发明的一个实施方式的识别处理例的流程图。
图5是表示本发明的一个实施方式的各笔画和折线近似的例的说明图。
图6是表示本发明的一个实施方式的折线角的说明图。
图7是表示本发明的一个实施方式的折线角和外角的说明图。
图8A和图8B是表示本发明的一个实施方式的涡旋夹角的说明图。
图9A和图9B是表示本发明的一个实施方式的同一涡旋夹角内的分割的说明图。
图10是表示本发明的一个实施方式的长度序列的说明图。
图11A和图11B是表示本发明的一个实施方式的涡旋夹角的例子的说明图。
图12A~图12C是表示本发明的一个实施方式的涡旋夹角的正/负分解的例子(2的例)的说明图。
图13A~图13C是表示本发明的一个实施方式的涡旋夹角的正/负分解的例(7的例)的说明图。
图14是表示本发明的一个实施方式的涡旋夹角内的始端、终端、中间的说明图。
图15是表示本发明的一个实施方式的两端角差的说明图。
图16A~图16C是表示本发明的一个实施方式的滤波的说明图。
图17是表示本发明的一个实施方式的累积角特征函数的例子(U的例)的说明图。
图18是表示本发明的一个实施方式的累积角特征函数的例子(J的例)的说明图。
图19A~图19D是表示本发明的一个实施方式的前端部分的曲率的例子的说明图。
图20是表示本发明的一个实施方式的抽象图形地图的例子的说明图。
图21是表示本发明的一个实施方式的涡旋夹角序列的例子的说明图。
图22是表示本发明的一个实施方式的准虚交叉点(準虚交差点)的例子的说明图。
图23是表示本发明的一个实施方式的虚交叉点(虚の交差点)的例子的说明图。
图24是表示本发明的一个实施方式的实交叉点(実交差点)的例子的说明图。
图25是表示本发明的一个实施方式的交差的折线的例子的说明图。
图26是表示本发明的一个实施方式的准虚交叉点的例子的说明图。
图27是表示本发明的一个实施方式的加权平均角的算出例的说明图。
图28A和图28B是表示本发明的一个实施方式的中点检测例的说明图。
图29A和图29B是表示本发明的一个实施方式的中间检测例的说明图。
图30是表示本发明的一个实施方式的距离和频率的例子的说明图。
图31是表示本发明的一个实施方式的二维距离分布的例子的说明图。
图32是表示手写字符Z的例子的说明图。
图33、图33A、图33B是用于说明本发明的一个实施方式的分割/极点的说明图。
图34是用于说明本发明的一个实施方式的框架构造的说明图。
图35A和图35B是用于说明本发明的一个实施方式的框架构造的说明图。
图36A、图36B、图36C、图36D是用于说明本发明的一个实施方式的框架构造的说明图。
附图标记说明
1:纸;1a:运笔;2:笔;3:输入处理部;4:折线近似部;5:预处理部;6:特征提取部;7:识别部;8:识别结果输出部。
具体实施方式
以下,参照附图说明本发明的实施方式的例子。
在本例中应用于进行联机手写字符识别的系统中,在图1中示出了将各处理部设为硬件结构的情况的结构例。此外,如图1所示也可以将各处理部设为单独的处理部,但也可以设为用共同的运算处理部来执行各处理部的结构,或者在个人计算机装置等通用的运算处理装置中安装将本例的手写字符识别进行了程序化的程序来进行同样的手写字符识别。
另外,在下面的说明中,用下面的表1所示的用语来定义本例中的手写字符识别所需的各个概念。
[表1]
用语的定义
用语 | 定义 | 记载例 |
折线角 | 从由各折线的始点起向x轴的正方向牵出的水平线逆时针旋转而测量的折线的角度 | θ |
折线角序列 | 在一个笔划内存在的折线角的序列 | (θ1,θ2...θn) |
折线外角 | 前后折线角之差。其中在该差的绝对值超过180度的情况下①差为正的情况下,差-360度②差为负的情况下360度 | Δ |
用语 | 定义 | 记载例 |
折线外角序列(Δ序列) | 在一个笔划内存在的折线外角的序列 | (Δ1,Δ2,...Δn-1) |
涡旋夹角 | 连续的同符号的折线外角之和 | Θ |
涡旋夹角序列 | 在一个笔划内存在的涡旋夹角序列 | (Θ1,Θ2,...Θn) |
前涡旋夹角 | 在涡旋夹角序列的某一个要素内存在交叉点的情况下,从始端到该交叉点为止的涡旋夹角 | preΘ |
后涡旋夹角 | 在涡旋夹角序列的某一个要素内存在交叉点的情况下,从该交叉点到终端为止的涡旋夹角 | postΘ |
长度序列 | 将折线的标准化了的长度设为要素的序列 | |
部分长度序列 | 利用Δ序列正/负的边界来分割的长度序列 | |
部分Δ序列 | 利用Δ序列正/负的边界来分割的Δ序列 | |
始端 | 折线序列或Δ序列的起始要素 | |
终端 | 折线序列或Δ序列的结束要素 | |
始端长 | 长度序列的始端的标准化了的长度 | l<sub>start</sub> |
终端长 | 长度序列的终端的标准化了的长度 | l<sub>end</sub> |
中间长 | 在长度序列中处于始端和终端之间的要素的长度之和 | |
长度序列端长之比(端长比) | 始端长/终端长 | l<sub>start</sub>/l<sub>end</sub> |
用语 | 定义 | 记载例 |
长度序列端的最大长 | 在长度序列中处于始端和终端之间的要素的最大长 | Max{l<sub>start</sub>,l<sub>end</sub>} |
长度序列端间的中间长之和 | 中间长之和 | |
中间最大长 | 中间长之中的最大长 | |
Δ序列的最大值 | Δ序列的要素的最大值 | MaxΔ |
端的Δ值之比 | Δ序列的最初要素和最后要素之比 | Δ端比 |
两端角差 | 在长度序列中提取其两端的折线并虚拟地连接了它们的情况下的两者的Δ值 | |
累积角特征函数 | 由长度序列和Δ序列制作的线性插值函数中,参数是长度,函数值是角度(涡旋夹角)。其反函数的参数是角度(涡旋夹角),函数值是长度。它被称为累积长特征函数。归纳两者称为累积特征函数。 | |
α度始端长 | 在Δ序列中从始端开始前进,弯曲了α度的点的离始点的距离。实际上从累积长特征函数求出。 | |
α度终端长 | 在Δ序列中从终端开始前进,弯曲了α度的点的离终点的距离。实际上从累积长特征函数求出。 | |
α度长度比 | Min{α度始端长、α度终端长}/Max{α度始端长、α度终端长} | |
λ长始端度 | 在长度序列中从始端开始前进,λ长的点的从始点起的涡旋夹角 | |
λ长终端度 | 在长度序列中从终端开始前进,λ长的点的从终点起的涡旋夹角 | |
λ长度比 | Min{λ长始端度、λ长终端度}/Max{λ长始端度、λ长终端度} | |
用语 | 定义 | 记载例 |
涡旋夹角的中点 | 在包含对象字符的凸点或凹点的涡旋夹角中,与将对象涡旋夹角的二分之一设为α的α度长最接近的顶点 | |
前折线群 | 以中点为分叉点,从对象涡旋夹角的始点到分叉点为止的折线群 |
用语 | 定义 | 记载例 |
后折线群 | 以中点为分叉点,从对象涡旋夹角的分叉点到终点为止的折线群 | |
前总长 | 前折线群的总长 | |
后总长 | 后折线群的总长 | |
加权平均角 | 在前后折线群中,用{l(1)×θ(1)+l(2)×θ(2)+...l(n)×θ(n)}÷N求出的角度。l(n)是折线序列,θ(n)是各序列,N是前后各个总长。 | θ(pre)是前折线群的加权平均角、θ(pro)是后折线群的加权平均角 |
两端平均夹角差 | (θ(pre)+180)-θ(pro) | θ<sub>sp</sub> |
前后折线群的角分散 | 前折线群的角分散={(θ(1)-θ(pre))<sup>2</sup>×l(1)+(θ2-θ(pre))<sup>2</sup>×l(2)+...(θn-θ(pre))<sup>2</sup>×l(n)}÷Nl(n)是折线序列,θ(n)是各序列,N是前后各个总长。(后折线群的情况下利用θ(pro))。 | |
折线群的平衡 | Min(前总长、后总长)/Max(前总长、后总长) | |
前端部的曲率 | 例如是用于区分U、V的特征量,是前端部的曲率。实际是将问题处的涡旋夹角除以前端部的长度的比值。 | |
抽象图形地图 | 是将字符作为一般图形来捕获并利用在其基本转动中不变的特征进行分类而得到的。这是用涡旋夹角进行了分层,在每个层次中以基本特征配置有特征图形。因此可以俯瞰图形。利用它可进行可靠的识别。 | |
普通交叉点 | 一定不在实线上的交叉点的总称 | |
虚交叉点 | 可在两个线段的延长线上的假想交叉点 | |
次虚交叉点 | 是两个线段的交叉点,交叉点在其中之一的线段上或端点上,在另一个线段的延长线上。 |
说明图1所示的结构,通过在纸1上用笔2写字符,在笔2侧检测该纸1上的运笔(笔迹)1a。例如通过笔2中内置的照相机来进行该运笔1a的检测。或者,也可以从加速度传感器等检测笔2本身的运动。并且,还可以设为如下结构:不是在笔侧进行检测,而是由一些面板构成纸1侧从而能够电气地检测笔迹。总之,在本例的情况下是联机手写字符识别,因此是可判断随时间经过引起的笔迹变化的结构。
通过这些处理检测出的笔迹的数据被送到输入处理部3,进行用于检测字符信息的输入处理。输入的数据被发送到之后的折线近似部4、预处理部5、特征提取部6、识别部7、识别结果输出部8,在各个处理部中进行对应的处理,最终在识别结果输出部8中进行被识别的字符的显示、被识别的字符代码的输出等输出处理。
图2的流程图示出了本例的字符识别的整个处理例。以下,按照图2进行说明,从输入处理部3输入的字符/图形模式(步骤S11)在折线近似部4中被折线近似(步骤S12)。根据该近似,作为将视各折线为向量时的长度、方位角、相邻的折线的方位角的差设为要素的向量而表现输入模式(步骤S13)。另外,从方向角之差的向量表现求出同符号的角的差的和,包括符号作为一个要素而求出在此命名为涡旋夹角的向量表现。根据该结果,在预处理部5中校正非常短的点状模式、非常短的折线、以及值非常小的方位角的差的成分(步骤S14)。接着,在特征提取部6中根据状况从折线近似表现中提取特征(步骤S15),根据该特征的提取结果进行字符识别(步骤S16),输出字符识别结果(步骤S17)。
在此,参照图3的流程图说明步骤S15中的字符识别处理的详细例子。首先,检查笔划数(步骤S21)。在此,分类为笔划数是1的情况和是多个的情况。当笔划数是多个时,进行普通交叉点检测(步骤S22)。然后,用涡旋夹角表现分类为要素数是1的情况和是多个的情况(步骤S23)。当涡旋夹角表现中要素数是多个时,进行涡旋夹角的正(+)负(-)的分解(步骤S24)。
而且,检查是否有交叉(步骤S25)。在有交叉的情况下,作为涡旋夹角前后分解处理,以交叉点为界将一个涡旋夹角要素分解为三个部分(步骤S26)。具体地说,是由交叉而形成的环的部分、从始端到交叉点为止的部分、以及从交叉点到终端为止的部分这3个部分。
而且,为了根据字符/图形的模式而更简单且有效地求出特征,作为预处理2进行得到更简洁的折线近似表现的处理(步骤S27)。另外,作为长度-Δ偏差检测,检查长度序列向量、Δ序列向量的要素的一致性(步骤S28),并将其利用于识别。
然后提取各涡旋夹角区域内的局部特征(步骤29),进而提取次局部特征(步骤30),设定字符整体的框架构造,进行分层且分割的处理(步骤31)。
另一方面,当进行以上的特征提取时,通过图2的步骤S16的识别处理,使用基于树构造的决定树来简洁且高速地进行识别。即,如图4所示,使用抽象图形地图来进行树结构的识别(步骤S32),在接近的形状的情况下,使用基于特征空间上的函数/向量空间的小维(small dimensional)空间上的识别法,来进行识别(步骤S33)。
接着参照图5以后的图详细说明在各个阶段的具体的处理。在此,为了说明本发明的原理,作为最容易理解原理的例子,主要说明对0,1,2...9的阿拉伯数字进行字符识别的例子。
首先,说明涡旋夹角的检测。
关于本例中的对象字符曲线的表现,首先进行从观测装置得到的字符的笔划的折线近似。关于折线近似本身,已有很多研究。使用其中的合适的方法。此处例如设想1972年发表的U.E.Ramer的方法。该方法是简单明了的方法,可以说是最著名的方法。因此从被折线近似的笔画/笔划开始说明。
首先,如图5所示,第一,被折线近似的笔画/笔划成为如下的向量显示:从开始写的始点开始,其最初折线的终端作为方向显示而用箭头来表示。图5的左侧是用笔写的笔划本身,图5的右侧是折线近似的结果。与最初的折线的向量显示连接的折线也同样地向量显示,依次进行向量显示,最后在笔画/笔划的终端结束。
在此,如图6所示,从由各折线的始点向x轴(水平轴)的正方向拉长的水平线,向逆时针方向测量各折线角。因而从原点朝上的折线的角是+90度。朝下的折线是-90度。从原点朝向x轴的负方向的折线是180度或-180度。在此,两者是一致的。因而,角θ的范围是从-180度到+180度。此外,在下面的说明中,在表示角度的情况下有时省略作为单位的[度]而仅示出数字。
接着,从该折线角求出顶点的折线外角。具体地说,例如如图7所示,当将x轴与最初的向量所成的角度设为折线角θ1、下面依次将x轴与各向量所成的折线角设为θ2,θ3,...时,最初的外角Δ1为Δ1=θ1-θ2,用前后的折线角的差来求出。其次的外角Δ2为Δ2=θ2-θ3。以下同样地,如图7所示,作为折线的角顶点的外角序列,求出((θ1-θ2),(θ2-θ3),...(θn-1-θn)),将其简单地表示为(Δ1,Δ2,..Δm)。这些外角根据曲线的写法是右转还是左转而成为+或-的量,将这些连续的同符号的外角的和作为涡旋夹角序列而显示为(Θ1,Θ2,...Θp)。在这里的计算中必须注意的是角的主值是180至-180,实际上±180表示同一角。因而,在求出差且其绝对值超过了180时,Δ为正时将该值设为Δ-360。Δ为负时将该值设为360-|Δ|。
此外,在此也可以作为折线的角顶点的外角序列而求出((θ2-θ1),(θ3-θ2),...(θn-θn-1)),并将其简单地显示为(Δ1,Δ2,..Δm)。这样显示的一方作为符号系具有统一性,但是在此作为局限于将右转的符号设为+的情形的例子。
图8A、图8B示出了该涡旋夹角的意思。该“S”字型的字符最初是逆时针旋转而形成向左敞开的接着顺时针旋转而形成向右敞开的这样,“S”在符号表现中具有或者的构造。到此为止一直将它称为准相位特征。在此将它作为连续量而表现。此外的终端部的向量和的始端部的向量重叠。
在图7中示出了涡旋夹角序列的计算方法。在图7中粗线表示逆时针旋转的向左凸(向右凹)的部分。这样,将“3”简单地表现为其涡旋夹角序列(+142,-140,+149)。
另外,关于之前难以进行相互识别的笔记体的“g”和“y”、以及数字“9”的识别,表示利用了涡旋夹角序列的识别的容易度。三个字符的涡旋夹角序列的项数都是2。将其表现为(Θ1,Θ2)。因此各字符具有如下的涡旋夹角范围。
笔记体“g”
条件1:-320<Θ1≤-190
条件2:300<Θ2<400
笔记体“y”
条件1:-170<Θ1≤-70
条件2:300<Θ2<400
“9”
条件1:-500<Θ1≤-150
条件2:100<Θ2<250
因此,通过构成条件1&条件2的逻辑式,能够容易地分离识别这三个字符。此外,这些是转动不变的,因此实际上需要对它进行纠正的方向特征,但是可知很简单。
下面作为具体例主要说明关于手写字符中最重要的阿拉伯数字的识别处理。首先,该“3”作为大致的结构,具有顺时针旋转、逆时针旋转、最后顺时针旋转、符号上成为(+,-,+)的构造,形成由三个涡旋夹角Θ1、Θ2、Θ3构成的涡旋夹角序列(Θ1,Θ2,Θ3)。在数字的情况下,除此之外基本上没有具有该构造的数字。因而,例如如果作为“3”的模板,假设90<Θ1<300 &-150<Θ2<-30 & 90<Θ3<300,则能够吸收该类型的相当大的变形,能够正确地识别对象。
此外,折线近似的结果不仅是这种涡旋夹角序列,还得到长度序列的数据。图10是说明了长度序列的图。在此,将折线总长度设为1.0,得到对各折线(向量)的长度进行了标准化的值。具体地说,如图10所示,当设折线近似为向量v0~v5时,如图10的下侧所示,将全体的长度设为1.0,对各向量v0~v5的长度进行标准化,将各个值的集合设为长度序列。在图10的例子中,设长度序列:0.12,0.13,0.13,0.10,0.30,0.22而用小数点以下两位的数值来表示。可知各长度的合计为1,是标准化了的值。
接着,说明使用涡旋夹角进行字符识别的原理。通过使用涡旋夹角,可构成虽粗略但对变形识别能力强的识别系统,但是具体地说,必须对它设定各种约束条件。在此,最好是涡旋夹角序列的要素为1个的最简单的情况。这在符号上以(+)或(-)来表现。
分别包含
(+):“1”,“2”,“3”,“7”,“9”
(-):“0”,“1”,“4”,“6”。
在此具有环的“2”、“3”、“4”虽然不是手写的标准型,但是必须识别这种程度的变形字符。关于环在后面叙述。另外,考虑噪声,为了安全将“1”放到两者中。首先,考虑属于(+)的数字。
首先,最简单的是仅用涡旋夹角来区分它们。在此,将“7”简单化而识别没有钩的欧美式“7”。另外与此相关地将“1”设为标准型“|”。
“1”:+0<|Θ|<+30
“2”:+280<Θ<+600
“3”:+400<Θ<+700
“7”:+90<Θ<+180
“9”:+280<Θ<+400
根据这些,仅用涡旋夹角,可识别“1”、“7”。另外,还可识别“3”。
但是,上述条件中排除作为“2”的极端变形的如“α”那样的形状(以如该α那样的形状在从始点到环的交叉点的线段中没有凹处)。为了处理这种变形,对环部分进行如下所述的解析。
具体地说,是需要考虑极端变形的识别对象字符“2”、“3”、“9”,对这些字的解析方针进行说明,例如“1”、“7”的涡旋夹角分别不超过30度、180度、即意味着它们分别是缓和的L型、U型。相反地,粗略地说其它字符表示超过L的一半+U即45+180=225的情形。这样可直观地进行利用数值的设计。但是精确来讲环能够以180+α的涡旋夹角而出现,但是实际上几乎不会出现这种面积接近0的异常的环。
因此,进行涡旋夹角的交叉分解。
作为涡旋夹角的交叉分解,在此考虑识别对象字符“2”、“3”、“9”的分离。首先,如图9A所示,在“2”中在“2”的环上部涡旋夹角过大,导致作为“2”的整体而使涡旋夹角成为600度左右。因此,为了解决这种问题,考虑同一符号的涡旋夹角的分割。这是在环的交叉点处分为上部和下部的涡旋夹角以及环的涡旋夹角。即,在图9的例子中,是如图9A所示的从起始折线的向量v0到进入环的交叉的折线v4为止的涡旋夹角(前涡旋夹角/preΘ)和如图9B所示的从环出来的交叉的折线的向量v7到终端折线的向量v8为止的涡旋夹角(后涡旋夹角/postΘ)。此外,由向量v4~v7形成的环的涡旋夹角在这里没有什么意义,因此在这里排除它,在字符识别中不使用。即使向量v0~v4的前涡旋夹角变大,只要向量v7~v8的涡旋夹角小、例如设为90以下,则即使存在作为整体的涡旋夹角在“2”和“3”处重叠的情形,也可区分两者。
这样,在环形成处进行交叉分解,例如在“2”和“3”的情况下决定如下的涡旋夹角的允许范围。
“2”:+280<Θ<+450-->+300<Θ<+700 & 0≤postΘ<90 & CROSS
“3”:+400<Θ<+700-->+400<Θ<+700 & 100≤postΘ & CROSS
在此,postΘ意味着后涡旋夹角。另外,当然在此设想“2”、“3”都具有交叉点(CROSS)的情形。将前涡旋夹角表示为preΘ。此外,此处在“2”和“3”之间取否定区域。此外,下面记述在此使用的交叉特征。
下面是识别对象字符“2”、“3”和“9”之间的分离,仅观察涡旋夹角就可知“9”与“2”、“3”重叠。但是如上所述,存在“2”、“3”一定有交叉、“9”中没有交叉的简单的解决方法。但是,考虑自由手写字符的变形时是不可行的。在图11中示出了该例。图11A是“2”的例,图11B是“9”的例。在任一个情况下都产生交叉,但是能够利用下面所示的条件来进行识别。即,“9”是前涡旋夹角,preΘ小。在这种情况下是0。之前排除了“2”的极端变形“α”也是这个原因。在这种情况下,前涡旋夹角为0。
“2”:+280<Θ<+700 & 0≤postΘ<90 & 30≤postΘ & CROSS
“3”:+400<Θ<+700 & 100≤postΘ & 30≤postΘ & CROSS
“9”:+300<Θ<+400 & {NO_CROSS|0≤postΘ<10}
接着,说明涡旋夹角的+-分解。
在上述的例子中是在一个涡旋夹角内的分割,但是当与涡旋夹角序列对应地分割成各个部分长度序列、部分Δ序列而在各部分中进行下面所述的几何特征时是有效的。因此,记述分割成该部分的处理。这是有弯曲处的“7”字的例子。长度序列、Δ序列、涡旋夹角序列如下。在图13中示出了原图形(图13A)和折线近似的图形的Δ序列、涡旋夹角序列(图13B、图13C)。此外,图12(原图形:图12A,Δ序列:图12B,涡旋夹角序列:图12C)为了比较而示出了“2”字的例子,在后面记述图12、图13的比较。
图13所示的“7”字的各序列如下。
长度序列:0.38 0.17 0.14 0.32
Δ序列:+121.29-19.17-19.72
涡旋夹角序列:+121.29-38.89
从图可知,由最初的长度序列0.38、0.17形成涡旋夹角序列的第1项Θ1,由长度序列0.17、0.14、0.32构成第2项Θ2。在此,具有长度0.17的第2折线属于两者。该折线部分是Δ序列的符号的分叉线。即,这是边界线,是重叠(共同)部分。这样也可以根据涡旋夹角序列的+-而使长度序列、Δ序列分离,分别解析构造。为了比较而在图12中示出容易与有弯曲处的“7”弄错的平缓的曲线形状的“2”的例子。图12所示的“2”字的各序列如下。
长度序列:0.14 0.09 0.36 0.21 0.08 0.12
角度序列:-2.05 -35.54 -113.31 -94.29 -47.49 -12.80
Δ序列:+33.49 +77.77 -19.02 -46.80 -34.69
涡旋夹角序列:+111.26 -100.51
在这种情况下,长度序列0.14、0.09、0.36形成涡旋夹角序列的第1项Θ1,后半的0.36、0.21、0.08、0.12形成涡旋夹角序列的第2项Θ2。这样,只要观察第二负部分的长度序列,就明确该两者“7”和“2”的差异。当将其排列时,“7”的第2(-)部分的长度序列是0.17、0.14、0.32,“2”的第2(-)部分的长度序列是0.36、0.21、0.08、0.12,利用后面记述的端长比(始端长/终端长),“7”对“2”成为0.53对3.00,可知该特征是分离两者的关键。这是将如下的视觉上的特性作为数值来表现的:相对于“7”的下部几乎直线地向下垂,在“2”中下部是弯曲的。
此外,在图14中示出了在这里对涡旋夹角中的始端、终端、中间的本例中的定义。如图14所示当设一个涡旋夹角由多个折线构成时,将该多个折线的始端折线的标准化了的长度设为始端长,并表示为始端长lstart。另外,将终端折线的标准化了的长度设为终端长,并表示为终端长lend。如图14所示,始端Δ值及终端Δ值是与构成涡旋夹角的相邻的折线之间的外角。中间折线是处于始端折线与终端折线之间的各个折线。
接着说明几何特征提取。
当考虑字符的各种变形时,仅用这些模板是不够的,必须加强它们。记述为此的普通方法。到此为止,除了有弯曲的“7”和“2”的区别之外,仅用角度来规定了形状。这在专业用语中称为准相位特征。但是,实际上除此之外几何特征也是必不可少的。这两者的微妙的结合体是字符的形状。在这点上,特别是阿拉伯数字具有确实精练的形状的体系。
因此,首先求出
折线顶点坐标序列:(xs,ys),(x1,y1),(x2,y2),...(xe,ye);
折线长序列:(l1,l2,l3,...,ln)。
通常这些要素用全体长度来标准化。
例如,在识别对象字符“1”的情况下,实际上折线长序列是序列(l1)或序列(l1,l2)。关于倾向,例如需要始点的角θ进入±25度的限制。
这样,标准化了的以下的特征是有效的。
1.长度序列端长的比(端长比):lstart/lend。
2.长度序列端的最大长:Max{lstart,lend}。
3.长度序列端间的中间长的和:∑n=2 n=end-1ln。
4.中间最大长(长度序列端的中间长之中的最大长)。
另一方面,以Δ序列的最大值MaxΔ表示角的或者有棱角的特征,由该值可知角的大致状况。观察角的平衡时,表示为端的Δ值之比Δ端比,由该值可知大体情形。关于“U”和“V”的区别,只要写得正确,仅仅用这2个信息就可推测是哪一个。例如,如果长度序列端的最大长≤0.6、且长度序列端间的中间长的和的值<0.2、且端长比>0.8、且Δ端比>0.7,则可以说是明确的“V”。
但是,这是将当前成为问题的对象的涡旋夹角为90≤|Θ|<150作为前提。该涡旋夹角的分层是非常重要的方案,关于它另外记述。另外,上面记述的判断特别是在折线数等于3时尤其有效。此外,在作为下一层次的150≤|Θ|<180中,“U”和“V”共存。在这种情况下,需要更明确的特征,如果取得U或V的两端的折线,虚拟地连接它们并求出两者的Δ值,则能够将它视为对象字符的开放角度。将其命名为两端角差。例如如图15所示,两端角差是涡旋夹角的始端折线与终端的折线形成的角度。在图15中,为了说明,将终端的折线进行平行移动从而示出了两端角差。
例如,如上所述,使用端长比和Δ端比的特征,使对象逼近U或V,然后观察两端角差的绝对值的值,如果该值超过155度则是“U”,如果是155度以下则是“V”。但是“U”、“V”问题不是这么简单的。在更微妙的情况下,需要稍微高级的方法。关于这个在后面进行记述。
当归纳以上角特征时是:
1.MaxΔ,
2.Δ端比,
3.两端角差。
接着说明预处理的例子。这里的预处理有预处理1和预处理2,预处理1例如相当于图2的流程图的步骤S14中的处理,预处理2例如相当于图3的流程图的步骤S27中的处理。
如果在提取上述特征时对长度序列、Δ序列进行适当的预处理,则效率非常高。因此,下面包括噪声处理进行叙述。
预处理1
首先是噪声处理,一个是除去非常小的点的处理。这不是对标准化了的长度而是对原来的物理长度设置适当的阈值从而除去点状噪声。接着,特别是在联机字符中容易产生但有时导致在线的终端出现小的钩状的极端弯曲。由于它对前面所述的涡旋夹角影响很大,因此将其除去,从主涡旋夹角减去作为噪声产生的Δ值。此时使用的阈值取决于笔画的复杂度。仅在曲线的两端进行该噪声处理。
预处理2
长度序列的始端长从l(s)开始,如果l(s)、l(s+1)间的Δ(s)<20,则设为l(s)=l(s)+l(s+1)。同样地,如果与l(1)、l(2)对应的|Δ(s)|<20,则设为l(2)=l(2)+l(3)。如果不满足|Δ(i)|<20的条件,则不进行任何操作而进入一个步骤之前。将其持续到l(e)。作为结果可得到新的长度序列。这里的最大问题是阈值的值。经验上,如果阈值取10,则几乎没有所谓的副作用。当20时取决于状况。必须选择使用方法。此外,在后面叙述避免这个问题的更普通的特征提取法。
在Δ序列中,最好仅对始端、终端进行。即,在长度序列的始端、终端中,当执行了l(s)=l(s)+l(s+1)或l(e)=l(e)+l(e-1)时,设Δ(s)=Δ(s)+Δ(s+1)或Δ(e)=Δ(e)+Δ(e-1),之后不继续进行该处理。除此之外,例如在“7”中有时右边的长的曲线部分微小地弯曲。这是Δ值,是10左右的值。但是涡旋夹角序列的项数增加1个,影响较大。因此,考虑还校正这种Δ序列从而提高处理效率的方法。
此外,与此相关地,实际上关于Ramer方法,由于将直线和曲线的误差视为两者的最大误差长,因此通过对它进行调节,可进行曲线整体的噪声处理。
接着说明本例中进行的滤波处理。
这是在进入正式的识别之前观察容易知道的输入特性而提前取出这种模式的处理。近似折线表现形式上复杂。如果事先取得这种模式,则后面的处理会变得简单。在此将这种处理称为滤波处理。具体地说,有判断“圆”的处理。举出具体例进行说明。在此是进行如下处理的例子:在画出不闭合的曲线的情况下,根据该曲线的状态,视为画出了圆。
图16A是原来的图形,在图16B中示出了其折线近似。在图16B中加入标准化了的长度序列的值。图16C是对相同的折线加入了Δ值的图。在图接近圆的情况下,长度、Δ值都具有相同的值。
因此,这种情况下的长度序列、Δ序列如下。
长度序列:0.08 0.05 0.11 0.10 0.05 0.12 0.13 0.12 0.07 0.06 0.12
Δ序列:+26.65 +28.10 +31.43 +29.36 +34.08 +35.84 +44.61+34.14 +23.78 +35.17
这里的长度序列、Δ序列是进行了噪声处理之后、或用小的阈值例如10进行了预处理后的结果。在滤波处理中到是原始数据好。在此要注意的是长度序列、Δ序列的要素的值变动较少。这就是“圆”的特征。在简单地观察该要素的相同性时,只要观察长度序列、Δ序列的最大值即可。
在长度序列中,最大值是0.13,在Δ序列中是44.61。是涡旋夹角+323.16的14%。另外,长度序列、Δ序列的标准偏差值分别是σ(Len)=0.0292、σ(Δ)=5.5714。另外,纵横比(宽度/高度)=1.05。
另一方面,作为形式上看成是圆的样本例,有
长度序列:0.10 0.11 0.14 0.05 0.08 0.06 0.09 0.13 0.10 0.09 0.06
Δ序列:-28.25 -28.07 -25.85 -33.17 -33.19 -30.04 -35.81-21.80 -23.20 -49.40
涡旋夹角序列:-308.78,
长度序列、Δ序列的标准偏差值分别是:
σ(Len)=0.0272
σ(Δ)=7.4841
纵横比(宽度/高度)=0.71。
从现在起可将长度序列、Δ序列的标准偏差值、纵横比作为特征量而使用。但是如该例,实际上标准偏差值不如期待得那么好。实际上,长度序列的σ(Len)是0.0272,比最初的“圆”样本小,σ(Δ)=7.4841且相当大,两种标准偏差值缺乏平衡。另外,计算量也大。只有在判断为具有圆之后才能使用纵横比。在该圆的条件成立之后是简单、很好的特征,这里也可以使用它。例如,用涡旋夹角分为层次,制作如下的条件。
[1;(最大长≤0.15)&(最大Δ值≤46)&(前端部的涡旋夹角≤125)&(270≤|涡旋夹角|<300)&0.80≤纵横比(宽度/高度)≤1.20]]→“弱圆1”
[2;(最大长≤0.15)&(最大Δ值≤48)&(前端部的涡旋夹角≤130)&(300≤|涡旋夹角|<320)&0.80≤纵横比(宽度/高度)≤1.20]]→“弱圆2”
[3;(最大长≤0.15)&(最大Δ值≤50)&(前端部的涡旋夹角≤135)&(320≤|涡旋夹角|<360)&0.80≤纵横比(宽度/高度)≤1.20]]→“弱圆3”。
在此,不是简单地设为“圆”而设为“弱圆”是考虑了在实际手写中难以画出正确的圆的情况,从而设定上面的条件来定义了表示接近圆的状态的“弱圆1”、“弱圆2”、“弱圆3”。由此,估计大致是圆的图案满足该条件。对于图16的输入的结果是[6-弱-○-3]。另一方面,上述的例子不能以纵横比最终判断为“圆”。
接着说明累积角特征函数。
如上所述,特征容易受到阈值的影响。例如,在
长度序列:0.23 0.28 0.09 0.14 0.12 0.14
Δ序列:+11.54 +73.01 +42.89 +7.37 +20.12
中,当用阈值20来进行预处理时,由于在开头部分Δ值是11.54而在20以下,因此进行预处理,始端长成为0.51。但是,在终端Δ值为20.12、比阈值稍微大,因此不进行预处理,端长比成为0.14/0.51=0.27。因此,如果端长比&MaxΔ为(<0.5)&(>45),则导致与“L”的条件一致。实际上该输入字符是明显的V。
为了解决这个问题,从长度序列和Δ序列考虑对Δ的长度的累积角函数。在图17中示出了对该长度序列、Δ序列的折线近似的累积角函数。然而,这是阶段函数(虚线的图表),具有阈值问题。因此,制作简单的线性插值函数。将其表示在图17中。其简单地将各阶段的角用线连接。通过该简单的插值,阶段函数成为连续函数。并且是单调增加函数。该插值函数需要制作顺方向和逆方向的两种。用两个表来示出了各自所使用的长度序列、Δ序列。这在该简单的插值法中,如果注意观察图9的函数图表,在最后的阶段插值的直线是水平。即,在此严格来讲不能唯一地求出反函数。例如考虑取阶段的步幅的一半对其进行直线插值等,使得确实没有这种情形,但是关于性能使用了顺方向、逆方向的两个函数的一方更严格。正确地说,在对长度来讲至少在一半[0,0.5]中大部分都能可靠地使用。在实际的应用中,这样只使用参数的值域的一半为止。在该“U”的例子中,由于大致对称,因此这两个顺方向和逆方向的函数一致。如果使用它,则例如在尤其成为问题的区分U和V的问题等中加入该反函数即涡旋夹角90而求出弯曲了这么多的长度。求出其在该图表中提供y轴上的90度的X轴的长度。这成为将该累积角特征函数逆使用的例子。利用从图中的90度的水平线与函数的曲线(实线)相交的地方向X轴上画垂直线而得到的该X轴上的点的值0.448,来提供该x轴上的值。另一方面,用虚线表示逆方向函数,在这种情况下与90度完全对应的长度同样是0.448,完全一致。该例是尽量对称地写的“U”的例子,其结果表示该方法的高精确度。
这表示该图形是对称的,同时表示具有U的典型形状。例如在“V”的情况下,90始端长超过中心点,从而与90终端长产生重叠。它们的比是Min{90始端长,90终端长}除以Max{90始端长,90终端长},在“U”的情况下成为1.0。将该比称为90度长度比。此外,上面的例子是实际的例子。如该例子所示,能够用简单的插值来进行相当正确的计算。这种计算能够用任意的α度来求出。因此,一般用α度长(涡旋夹角)显示。这里的参数不能超过全体涡旋夹角。如果观察全局的对称性,则作为参数取总涡旋夹角/2。
另一方面,还可提供该顺序函数即长度而求出涡旋夹角。实际上这就是前面说明的累积角特征函数的简单使用方法。例如,在“6”中环被打开而微小地弯曲时,能够非常有效地使用,但是在此作为极端的例子参照图18具体考虑输入字符“J”。此外,该字符的形状是上面没有水平方向的条的J字。在此作为例子,将作为参数的长度设想为0.3。
在该图18的例子的情况下,顺方向函数(实线)和逆方向函数(虚线)大不相同。这正是反映了字符“J”的形状。在这种情况下,可求出顺方向即从始点前进了0.3的点上的涡旋夹角,与此相反根据逆方向函数同样地可求出从终点同样前进了0.3的点上的涡旋夹角,分别是10.00度、112.88度,两者之比是λ长度比(0.30)=0.09,定量地示出了两端的弯曲极端不同的情形。
此外,在该计算中必须注意的是在例如以下所示的两个折线的例子中,当
长度序列:0.38 0.62
Δ序列:+31.08
时,如果λ长度的函数的参数超过0.38,则没有对应的Δ序列项。在这种情况下成为如下的结果。
λ长度比(0.25)=0.61(20.45)(12.53)
λ长度比(0.30)=0.61(24.54)(15.04)
λ长度比(0.35)=0.61(28.63)(17.55)
λ长度比(0.45)=计算错误。
实际上,在折线数为2或3的情况下,也可以不使用这些累积角特征函数,但是在折线数少的情况下需要注意。实际上不会使该λ长度函数的参数超过0.5而使用。另外能够容易检查产生该计算错误的情况。经验上,参数为0.30左右最有效。
此外,在图17、图18中示出的是直线插值的一例,除此之外考虑各种。该例是从始端开始的情况的例子,在从终端观察该插值函数的情况下是不能使用的,在这种情况下从终端开始以相同的程序新求出插值函数。因此如果取它们的中间,则插值函数成为强单调增加函数(这里的“强”是一定增加的意思),可使用于两者。但是在此不采用它。
接着,为了区分“U”和“V”这样的类似字符,如何表现其前端的弯曲状况是进行几何特征提取时非常重要的事情。作为用于解决该问题的方法,在本例中可应用利用了涡旋夹角的(1)中点检测的平衡、角度特性的提取、(2)前端部曲率这两种方法。下面记述这两个方法。
首先,从利用中点检测的平衡、角度特性的提取开始说明。这是如下的方法:以中点为分叉点,将成为对象的涡旋夹角分割成前后两个,在被分割的各个部分中求出特征,整体上评价它们并进行判断。
这里所说的“中点”是在包含对象字符的凸点至凹点的涡旋夹角中将对象涡旋夹角的二分之一设为α的α度长(从始端侧和终端侧双方求出)。能够利用上述的累积角特征函数来求出它。
具体地说,从始点开始测量而求出弯曲了(涡旋夹角/2)的点“α度(涡旋夹角/2)始点”、相反地从终点开始测量而求出弯曲了(涡旋夹角/2)的点“α度(涡旋夹角/2)终点”,求出以下的模拟的α度(涡旋夹角/2)的中心点。即、
中点=((1-(α度(涡旋夹角/2)终点))-(α度(涡旋夹角/2)始点))/2+(α度(涡旋夹角/2)始点)
(这是沿着从始点的折线而标准化了的长度)。
由上述计算求出的中点是模拟值,因此为了方便而采取如下方法:将最接近中点的折线的顶点设为分叉点,分成其前后的折线群。将这些折线群命名为前折线群、后折线群。求出这些部分长的总长而将它们命名为前总长、后总长。
首先,为了提取对象字符的角度特性,分别求出关于前折线群、后折线群的加权平均角。如果将折线群内的折线序列设为l(1)、l(2)、...l(n)、将角度序列设为θ(1)、θ(2)、...θ(n)、将前后总长设为N=l(1)+l(2)+...l(n),则如下求出加权平均角。
加权平均角=[l(1)×θ(1)+l(2)×θ(2)+...l(n)×θ(n)]÷N
将形成前后加权平均角的角度设为两端平均夹角差(=θsp),提供为如下。
Θsp=(θ(pre)+180)-θ(pro)
(θ(pre)是前折线群的加权平均角,θ(pro)是后折线群的加权平均角)
另外,作为观察前折线群和后折线群的直线性的具体的方法,观察角度的分散值。即、
前折线群的角分散
=[(θ(1)-θ(pre))2×l(1)+(θ2-θ(pre))2×l(2)..+(θn-θ(pre))2×l(n)]÷N
(后折线群的角分散值也相同)
分散值为较大的数值,因此,将其除以100。由于目的是比较,因此即使这样也没问题。
此外,在加权平均角时,有需要注意的地方。
折线的方位角的值域是-180≤θ≤180,-180和180表示同一角。该约束在表示各个折线的二维平面上的方位是可以的,但是导入求出它们的平均的这种运算时有时成为问题。即,因为存在即使如图27那样角折线群的始端的折线角以负开始的情况下终端的符号也成为正的事例,在这种情况下不能求出合适的加权平均值。因而,在此调整求出折线角时的原则,在与始端的符号相同的方向上测量折线角。此外,这是数学上在里曼平面上测量角度的方法。该平面是如下的面:通过剪取使裂缝进入从-∞到原点为止的直线,使第3象限的面在三维空间上向下延长,使第2象限的面向上延长,从而成为螺旋状。
接着,如下定义从中点分叉的折线群的长度的平衡。
平衡的定义:Min(前总长,后总长)/Max(前总长,后总长)在下面示出以上的几何特征的具体例,首先,说明将图28A中的对象字符“U”如图28B所示折线近似的情况。以下给出其表现。
3:长度序列:0.29 0.19 0.08 0.15 0.29(192.81)
3:角度序列:-35.68 -82.65 -140.71 -177.71 154.49
3:Δ序列:46.97 58.06 37.00 27.80
3:涡旋夹角序列:169.84
3:顶点列表:0:(836,47)1:(875,75)2:(879,106)3:(868,115)4:(843,116)5:(799,95)
中点=((1-0.47)-0.41)/2+0.41=0.47
(从长度序列可知是处于顶点(1)与顶点(2)之间的点)
到顶点(2)的距离:0.48-0.47=0.01(利用长度序列)
到顶点(1)的距离:0.47-0.29=0.18(同上)
因而,将最接近中点的顶点2:(879,106)作为分叉点而选择。
前加权平均角:-54.27
后加权平均角:-187.3
前加权平均角的直线与后加权平均角的直线的夹角θsp为θsp=(θ(pre)+180)-θ(pro)=(-54.27+180)-(-187.3)=313.0。但是其从方位角的值域脱离,因此为了变换它而从360减去时成为47度,可知相差很大。
前折线群、后折线群的直线性可由各个前角分散、后角分散观察。将这些提供为如下。
前角分散:253.25/0.48/100=5.27
后角分散:280.4/0.52/100=5.39
前折线群、后折线群的长度的平衡以如下提供:
平衡:Min(前总长,后总长)/Max(前总长,后总长)=0.48/0.52=0.92。
与此相对,在图29A以及图29B示出“V”的例子。
长度序列:0.34 0.14 0.13 0.39(205.98)
角度序列:-56.06 -79.11 170.13 152.02
Δ序列:23.06 110.75 18.11
涡旋夹角:151.92
顶点列表:0:(660,61)1:(695,93)2:(700,119)3:(677,115)4:(613,81)
中点:0.47
顶点:2
前加权平均角:-62.78
后加权平均角:156.54
前角分散:1.09
后角分散:0.61
θsp=39.32
平衡:0.92。
如果比较上述“U”和“V”的中点检测的角度特性、平衡,则θsp为47度对39度、前角分散+后角分散为10.66对1.70、平衡为0.92对0.92。可知特别是在分散中出现U、V的明显的差异。通过观察该分散的差异,能够用少量的掩模来对应于相当的变形。另一方面,平衡中没有差。这是因为两者都是对称的。该值是变动的,当平衡例如为0.5左右时成为“j”的一个笔画。
此外,求出该中点而分割曲线的方法不限于孤立的一个涡旋夹角图形。一般,在涡旋夹角序列的各项曲线的范围内可进行相同的处理。例如可将“2”和“Z”的差异视为另外将一笔画写出的“w”和“ω”的差异可视为“w”=“V”+“V”、“ω”=“U”+“U”,因此在各涡旋夹角区域中可求出中点而进行上述的处理。
另外,在正确书写了字符的情况下,中点与微分中的极点相同。因此,可使用它。但是,上面的中点是更普通的。另外,可以作为简单地从两端开始标准化了的距离0.5的点而求出中点,但是这仅在对称图形中有效。
接着,说明前端部的曲率。
这例如是用于观察U和V的前端的弯曲而区分两者的特征,是利用涡旋夹角和预处理的简单的方法。使用图19所示的例来对它进行说明。图19A是U的原来的图形,在图19C中与长度序列一并示出折线近似的例子。图19B是V的原来的图形,在图19D中与长度序列一并示出折线近似的例子。
首先求出前端部的涡旋夹角。在以下示出的“V”的例子中,从λ长度比(0.30)=0.59(11.63)(6.90)得出从两端起0.3长度的涡旋夹角,即11.63是从始端到0.3为止的涡旋夹角,6.90是从终端到0.3为止的涡旋夹角。因此,将该和11.63+6.90=18.53从该字符的全体涡旋夹角中减去。即为124.98-18.53=106.45。
这是前端部的涡旋夹角。当参照下面的例子将其除以前端部的长度0.03时,得出该前端的弯曲状况(如曲率那样)。为了方便,使长度100倍之后再除。因而,成为106.45/3=35.48。
当它较大时判断为V,当较小时判断为U。此外,长度使用预处理后的长度序列(阈值20)。在此,长度在插值的累积角特征函数中是1.00-2×0.30=0.4,在预处理中明确得出前端部的长度时最好使用它。但是一般是0.4,因此该值在样本中共用。因此,仅用前端部的涡旋夹角就可评价前端的弯曲,但是取中间长的和并求出上述的曲率更有效。在U的情况下的例子也进行同样的计算。在这种情况下,前端部的长度从预处理后的长度序列(阈值20)成为0.09+0.12+0.11+0.09=0.41。将V的前端部的曲率35.48、角度(106.45)与U的这些值、曲率2.16、角度(88.68)进行比较,从而将前端部的尖部明确地作为数值而表现。
例:V的情况,前端部的曲率(角度):35.48,(106.45)
长度序列:0.41 0.10 0.03 0.10 0.37
涡旋夹角序列:+124.98
预处理后的长度序列(阈值20):0.51 0.03 0.47
参数:
λ长度比(0.30)=0.59(11.63)(6.90)
前端部的曲率(0.30)=35.48(前端部的涡旋夹角=106.45)
例:U的情况,前端部的曲率(角度):2.16(88.68)
长度序列:0.27 0.09 0.12 0.11 0.09 0.32
涡旋夹角序列:-172.23
预处理后的长度序列(阈值20):0.27 0.09 0.12 0.11 0.09 0.32
参数:
λ长度比(0.30)=0.84(45.49)(38.06)
前端部的曲率(0.30)=2.16(前端部的涡旋夹角=88.68)。
通常,该累积角特征函数是单调函数,在其意思上与其它的函数相比非常简单。二维图形的一部分具体地说在涡旋夹角序列中的项数为1个的情况下虽然被分层但作为简单的单调函数而表现,这是很有意义的。如果该单调函数是线性,则形状根据涡旋夹角而与“弧”、“半圆”、“圆”连续地接近于涡旋夹角为360度的“圆”。如果接近单位函数、上升的点接近中心,则根据涡旋夹角从敞开的“V”以180度变为楔型。另外,随着从中心偏离,逐渐成为√型。另外随着在中心附近其上升变得缓和,从V型变成U型。当从中心偏离时成为J型。也可以这样在数学上构成图形模型。另外,当对线性插值进行多项式近似时,例如如果用三次花键函数来近似,则可进行二阶为止的微分,可进一步解析累积角特征函数。例如含有钝角的三角形具有两个二阶微分的峰值。也可计算曲率,并可正确地计算微小的特性。这种思想在抽象图形地图的形成中也有用。在涡旋夹角序列中的项数为2个的情况下,累积角特征函数的空间成为两个累积角特征函数的积区间。以下也同样。这样,将复杂的图形用该单调函数的组合来简洁地表现。
接着说明如下的方法:在涡旋夹角序列的各项的涡旋夹角区域内,利用折线角序列的相邻折线角的变化的模式或者累积角特征函数来将对象字符分解成多个分区,将该区分或边界点利用在与识别对象字符的比较中。
首先作为具体的事例,考虑“1”→“L”→“U”→“0”→“6”的变化。如果用涡旋夹角定量地表现,则是“1=0”→“L=90”→“U=180”→“0=270”→“6=360”。但是用这个不能反映内部构造。另一方面,利用符号可将这些内部构造表现为
举例图33的“6”。首先根据相邻折线的角度变化检测边界点(凹极点或者凸极点)(相当于点3、点6、点8)。利用始点、终点、以及这些边界点,将图33的“6”分割为以下部分。
从点3至点8的部分:“∪型”部分
从点8至终点12的部分:“∩型”部分
这样分割对象字符,使各个分区与符号表现相对应,由此可识别“1”、“L”、“U”、“0”、“6”。
此外,上述例中的边界点与普通X-Y坐标系中的所谓的微分凹凸极点一致,但是一般更需要考虑转动。例如如图33A所示,在普通的X-Y坐标系中点1是微分凹极点,但是当设为使其转动的图33B的形状时,相同的点1不是凹极点。为了处理这样的转动,一般需要使用累积角特征函数来求出边界点。例如如果是L型则将接近α度长(90)的顶点作为边界点而检测,如果是U型则将接近α度长(180)的顶点作为边界点而检测,并进行分割。这与一般地求出中点的情形对应。
接着说明如下方法:根据涡旋夹角序列分割各笔画的曲线,在被分割的各曲线部分中求出局部特征、次局部特征,分层地且分割表现对象。
作为具体的事例,首先考虑“m”。图34中的“m”的涡旋夹角数是6个。当使其表现为符号时,是∩+V+∩+V+∩+L。在涡旋夹角序列的各涡旋夹角区域中,从左起赋予项编号,求出各涡旋夹角区域中的极点特征(凹极点或凸极点),对它们如凸1(属于第1涡旋夹角的凸极点)、凹2(属于第2涡旋夹角的凹极点)那样赋予编号。将这些凹凸极点、始点、终点间的位置关系称为“顶点配置”。通过该顶点配置,规定又称为对象字符的骨格的“框架构造”。
例如,在该“m”的事例中,始点、凸1、凸3、凸5的各点的高度大致排列为一列,另外凸2、凸4、凸6、终点的各点与底边的高度大致一致。利用这种顶点配置的特征,规定“m”的框架构造。如果观察图35A的“h”和图35B的“n”的比较,则该框架构造的特征的差异是一目了然的。或者,还有如下的方法:不仅关注对象字符的高度,还关注横宽,并规定各凸点间、各凹点间的位置关系,或规定纵横比。
另外,例如在如图36A那样的“6”和如图36B那样的“0”、即两者都是相同的构造的情况下,也能够利用框架构造来有效地识别两者。这两者能够通过观察边界点(点1和点2)间的距离(d1,d2)来识别“6”和“0”。在这种情况下,也能够通过使用利用了累积角特征函数的普通边界点(极点)的检测方法,应用于如图36C的“6”和如图36D的“0”那样任意转动的对象中。
另外,作为求出被分割的各曲线部分中的局部特征并分层且分割表现对象的例子,举出上述“m”的涡旋夹角区域2和涡旋夹角区域4中的最小Δ值。它定量地表示存在于“m”的∩∩之间的尖的楔形的尖锐度。是最小Δ(涡旋夹角区域2)值、最小Δ(涡旋夹角区域4)值为钩的特征。此外,“m”在X轴上的映像是“w”,虽然框架构造相同,但是最小Δ(涡旋夹角区域2)值、最小Δ(涡旋夹角区域4)值被解除,已经不是关键特征,涡旋夹角区域3的最大Δ值成为关键特征。
这样,将若干复杂的形状也用涡旋夹角序列来分割,根据这些局部、准局部的特征将对象分层且分割表现。另外,如上所述,如m的∩V ∩V ∩L那样的所谓的准相位的符号表现被连续地表现,可具有连续地变化为如w的∪∧∪∧∪Γ那样的“w”的一个变形的表现。
接着,说明转动问题。原来的本方式是转动不变的,但是写得标准的字符并不是转动不变的。因此,需要规定成为字符的轴的假想线段的角。到此为止记述的例如加权平均角就是起这个作用。通过将该角范围取得较大,能够对±45度左右的转动的变动进行对象的识别。
接着说明图4的流程图所示的图形要素地图。
这不是仅将对象设想为特定的字符集合例如阿拉伯数字、英文大写,而是为了将普通字符、图形作为整体而获取从而构建无误读的读取系统而考虑的。具体地说,利用涡旋夹角对普通图形的模式进行分层,在各层中利用上述特征进行分割。这样,包含各层次中无间隙的所谓的具有意义的或具有特征的形状而进行列举。由于没有间隙,因此还包括异常的形状。这里的图形与转动、大小无关。因而从字符来讲成为元要素图形。
该图形要素地图的整个构造是如图20所示的典型的层次构造即树构造。之所以能够这么做,是因为如上所述特征非常简单。在最初的路径水平-0、其次的水平-1中,用涡旋夹角序列项数进行分类,但是在此作为基础图形,详细记述最大的成为基础的涡旋夹角序列项数为1的情况。在水平2中,在涡旋夹角范围内构成角节点。
节点1,|Θ|<20,
节点2,20≤|Θ|<50,
节点3,50≤|Θ|<90,
节点4,90≤|Θ|<180,
节点5,180≤|Θ|<270,
节点6,270≤|Θ|<360,
节点7,360≤|Θ|。
这部分树中最简单的是节点1、|Θ|<20,进入该范围的图形是“直线”。作为字符、符号,有“1”、“-”、“/”、“\”。在此由于是转动不变,因此不区分这些而以命名为“直线”的元要素图形来代表。将该层次设为0层次。表示为“0-直线”。
其次的层是节点2、20≤|Θ|<50。下面在图20中详细说明该分类。这样在该层次1中包含“1-弱L1””、“1-弱L2’”、“1-弱<1””、“1-弱<2’”、“1-弱弧1”、“1-弱弧2’”、“1-弱弧3’”这7个要素图形。而且,没有除此之外的图形。这些是全部。
在该层中相当于实际的字符、符号的少,例如“1-弱L1””是打入的“-”。另外,实际上这些代替上述的“1”、“-”、“/”、“\”而频繁出现。
如上所述,制作各层来进行,在图21中示出了作为它们的结果的图形。图21示出了层次1、层次2、层次3、层次4的例子。各层次的图形不限于该例。
接着说明多笔画的位置关系。
到此为止仅处理了一个笔画的字符,在此考察由多个笔画构成的字符。
在此,当利用抽象图形的概念时,如以下的例子,通过对图象形,能够非常简单地识别多笔画的字符。但是完全转动不变。抽象图形例如以700度以下的涡旋夹角对几乎所有的变形给出答复。特别是“弧”有效。可将弱弧作为直线来处理。另一方面,当涡旋夹角变大时,由于它的独立性较高,因此关系变得更简单。例如,如果由两个笔画构成的对象图形分别作为“直线”和“3”而被识别,则该结合唯一地成为“B”。当然,有时存在如“D”、“P”那样需要详细的位置关系的情况,因此必须求出它。关于它在下面记述。此处使用例子说明上述的情形。
以下的例如图22所示,在弯曲垂直线而写出的“H”中识别为弧、直线、弧。仅从这个已经能够估计是“H”。根据该识别结果来进行位置关系时效率非常高。
1:Result:[弱弧3]
2:Result:[直线]
3:Result:[弱弧3]
因此,从笔画的运笔信息例如可知,在普通的写法中1画、3画是从上往下大致垂直地写,2画是从右向左写的。因此,仅用这些各笔画分别独立的信息来容易估计写出的字符是“H”。因此,其次的阶段是获知定量的这三个笔画的位置关系。
因此考虑的就是普通交叉点的概念及其推导法。
首先,说明该方法。在图22中示出了字符“H”,在这种情况下该水平线不与处于该水平线的两侧的垂直线相交/接触。但是该三个笔画清楚地构成字符“H”。这是因为在该水平线的延长线上还近距离地存在垂直线。在这种情况下,用周知的解析几何的公式可求出端点与垂直线的距离。但是复杂。使水平线延长而作为交点来求出的方式巧妙且具有统一性。同样地,在图23中示出了相当于“口”的一部分的形状,只要不延长右侧的垂直线和水平线的每一个,就不相交/接触。在为了参考而示出的图24中示出了正交的两个笔画,人们根据它来将假想角落的点图形化。在此,如该图24所示将实际相交的点称为实交叉点。
在图22、图23的例中也考虑假想交叉点,在此将它们称为普通交叉点。将普通交叉点内的不在实线上的如图23那样的交叉点称为虚交叉点,将在如图22的一个笔画的实线上的情况称为次虚交叉点。下面叙述求出这些普通交叉点的具体方法。
参照图22进行说明。求出线段1-2与线段3-4的次虚交叉点。在此,将点1、点2的位置向量设为P1、P2,将点3、点4的位置向量设为P3、P4。当将线段P1、P2和线段P3、P4的取0~1的值的参数设为λ、λ’时,分别表示为(1-λ)P1+λP2和(1-λ’)P3+λ’P4。使这两个式联立。即,是(1-λ)P1+λP22=(1-λ’)P3+λ’P4。
如果λ、λ’可求得取0~1的值的参数,则可求得交叉点。在实际求解它时,例如如果将P1表现为(x1,y1)T((x1,y1)T是(x1,y1)的转置),对x轴、y轴建立式,则建立将λ、λ’设为未知数的联立方程式,可求出λ、λ’。
具体地说,是
-λ(x1-x2)+λ’(x3-x4)=x3-x1
-λ(y1-y2)+λ’(y3-y4)=y3-y1。
当将线段1-2的P1设为(x1,y1)T、将P2设为(x2,y2)T时,具体地说
(x1,y1)T=(0,4)T,(x2,y2)T=(4,4)T,
线段3-4的P3是(x3,y3)T=(2,3)T,P4是(x4,y4)T=(2,0)T。
x1=0,x2=4,x3=2,x4=2,y1=4,y2=4,y3=3,y4=0
通过将这些代入上面的式,得到λ=0.5,λ’=-0.33。
在此,λ’是负值。这意味着在线段3-4的方向与逆方向、4->3方向上,在线段的延长了约33%处两线段相交。
例如,
“H”(次虚交叉点的例子:图22)
位置关系
1-2;0.50,-0.11
1-3;-3.26,-3.28
2-3;1.34,0.49
该第一行表示如下:笔划1与笔划2在次虚交叉点上交叉,该点正好处于笔划1的中间点0.50,从笔划2的始端离开0.11。此外,在此长度的数值以各自的笔划长进行了标准化。第2行表示如下:笔划1和笔划3大致平行,该交叉点是虚交叉点,并处于字符上部的离开相当远的地方。第3行表示如下:笔划2和笔划3在次虚交叉点上交叉,该点处于从笔划2的终端离开0.34的右侧、在笔划3的大致中间点0.49上。“口”(虚交叉点的例子:图23)位置关系
1-2:-0.19,-0.27
这表示笔划1与笔划2在虚交叉点上交叉。
当笔划1和笔划2在这些始点上沿线延长时,分别在离开0.19、0.27的点上交叉。即,这可视作假想的拐角点。
“T”(实交叉点的例子:图24)
1-2:0.50,0.14
笔划2是常有的情形,表示从笔划1的正中心突出0.14。将它表示在图27中。通过这样求出上述的普通交叉点,能够简洁且定量地得到多个笔画的位置关系。因而,能够容易识别如上所述的多个笔画的字符。
此外,如图25所示,有时不能简单地选择设想为交叉的两个折线。此时,如果以“H”的例如笔画(笔划)1的折线集合、笔画3的折线集合来机械地构成联立方程式并求解,则该图的情况下是7次,能够机械地求出提供实交叉点的折线对。优先考虑效率,如果例如笔画1的两端的折线短,则暂时排除它们,另外也可以排除笔画3的终端的折线。如果这样,成为4次联立方程式,从而简单化。此外在次虚交叉点的情况下,也能够从λ值求出最接近的折线。在图26中示出了排列有多个交叉点的情况。这样,能够定量地求出笔画的位置关系,在笔画数多的汉字等中非常有效。
接着说明如下的方法:根据各学习数据,在由涡旋夹角序列的各部分的各特征构成的部分小维特征空间上构成识别平面,特别是进行形状接近的字符间的识别。
作为具体的事例,有可知与“U”-“V”问题相同的微小的问题的“2”-“Z”问题。实际上可知例如使用3次花键函数等的高级方法,通过使用该方法,能够非常简单地解决该问题。
首先,“2”和“Z”的涡旋夹角数都是3,但是重要的是第1涡旋夹角部分。因此,仅用第1涡旋夹角可大致分离两者。如果用实际收集的样本数据来观察它,则得到以下的统计量。
特征量 平均 分散 标准偏差 样本数
Θ(s):2 209.406 1227.281 35.033 100
Θ(s):Z 126.961 74.530 8.633 111
注:“Θ(s)”是最初的涡旋夹角
因此定义以下的简单的距离。
d(Θ(s),[2])=|Θ(s)-Θ(s)[2]的平均|
d(Θ(s),[Z])=|Θ(s)-Θ(s)[Z]的平均|
图30示出了利用该定义的各数据的分布。当由d(Θ(s),[Z])的轴观察时,距离为20,“Z”的所有数据是该距离以下,但是3个“2”的数据进入“Z”中。整体上看,从两者的分布来看距离的阈值为35左右是妥当的。但是,当这样设定时,7个“2”的数据进入。
因此,在涡旋夹角区域1的范围内观察其它特征。例如,观察进入某一折线角度范围内的折线的长度的平均。此外,平均线长[-60,60]是进入从角度范围-60度至60度范围内的折线的平均长(利用与上述相同的样本、样本数)
特征量 平均 分散 标准偏差
“2”的平均线长[-60,60] 0.112 0.001 0.029
“2”的平均线长[-60,-145] 0.197 0.002 0.043
“z”的平均线长[-60,60] 0.255 0.002 0.040
“z”的平均线长[-60,-145] 0.415 0.009 0.092
因此,定义以下的简单的距离。
d(AveLeng1,[2])=|平均线长[-60,60]-平均线长[-60,60]的[2的平均]|
d(AveLeng1,[2])=|平均线长[-60,-145]-平均线长[-60,60]的[2的平均]|
当观察利用该定义的二维距离分布时,成为如图31所示,“2”的所有数据存在于左下的原点(0,0)、(0.1,0)、(0,0.15)、(0.1,0.15)的矩形内(粗线的显示内),一个“Z”的数据都不包括。并且整体上“2”和“Z”的集合相互分离。
这样,在小维(在2和Z的事例中是二维)的特征空间上根据各学习数据可进行微妙形状的区分。构成部分小维的各特征不限于上述平均线长,根据比较的字符/图形等的特征而可采用各种特征。
在此,与2-Z的识别相关联地说明评价的问题。“z”经常像图32那样写成带有钩。关于这种数据,实际上涡旋夹角一下子增大,不能用上述的方案来区分两者。但是,例如可将前端的钩作为独特的表现、即作为前端部的较大的Δ值、较短的前端长而确定。如上所述,将它作为噪声而进行预处理是容易的,但是与它相比一般采取允许这种装饰的方式。而且,同定其表现之后,排除其装饰部分而可进行如上所述的识别。这是形状的评价和识别真正成为一体的好例子。
能够进行该处理是构造解析的优点,另外也是该表现法的长处。
此外,如最初在实施方式的说明中说明的那样,本发明的手写字符识别不限于图1所示的处理结构,只要是进行实质上相同的手写字符识别的结构,就能够以各种装置、系统的结构进行识别处理。例如,也可以将本发明的手写字符识别进行程序化(软件)而安装到通用的个人计算机装置中。可将手写字符识别程序存储到各种存储介质中,并发布。
另外,在图1的示例中,是在笔侧进行笔迹的检测的例子,但是也可以在用笔写字符的面板侧进行笔迹的检测,根据该检测进行字符识别。
在此,将联机字符作为对象,但是通过适当的细线化、或轮廓追踪等,也可以对联机字符进行字符识别。
并且,在上述的实施方式中,主要将进行数字、字母的识别的情况作为例子,但是本发明的手写字符识别基本上可应用于任何语言的字符识别中。
Claims (12)
1.一种字符识别方法,是识别联机手写字符的手写字符识别方法,其特征在于,
对各笔画的每一个笔画利用参数表现来捕获输入的手写字符,对各笔画的每一个笔画进行折线近似,
将上述折线近似的各折线作为从始点到终点的向量而求出,将成为基准的轴与上述各折线所成的角度作为折线角序列而求出,
求出所得到的折线的角顶点的外角序列,
将上述外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列,
分层且分割地提取上述求出的各序列的全局特征和根据涡旋夹角序列而分割的各曲线部分中的局部特征或者次局部特征,通过将该提取结果与预先准备的识别对象字符的模板进行比较,从而进行字符识别。
2.根据权利要求1所述的字符识别方法,其特征在于,
在由上述涡旋夹角序列构成的曲线环的前后,将各项分割为前涡旋夹角、后涡旋夹角,从而进行识别处理。
3.根据权利要求1所述的字符识别方法,其特征在于,
上述识别对象字符的模板是从学习数据中决定了各特征的上限下限范围和各序列要素的数据。
4.根据权利要求1所述的字符识别方法,其特征在于,
作为上述折线近似表现,使用将折线的长度作为要素的序列、用折线全长进行了标准化的长度序列以及将始点、顶点、终点作为要素的坐标序列,求出端长比、中间长、中间最大长、上述长度序列的要素的分布、始点终点间距离的特征。
5.根据权利要求1所述的字符识别方法,其特征在于,
求出某个决定的区间内的折线的加权平均角和外角序列的边界点的值、始点/终点/边界点两两之间的距离以及边界点之间的距离的特征。
6.根据权利要求1所述的字符识别方法,其特征在于,
在由涡旋夹角序列的各项涡旋夹角区域内、涡旋夹角区域间的特征构成的部分多维特征空间上,由各学习数据构成识别平面,进行字符间的识别。
7.根据权利要求1所述的字符识别方法,其特征在于,
从涡旋夹角序列的各要素的外角序列和与其相当的长度序列中,取长度序列为一个轴,
取外角序列的累积角为另一个轴,通过进行线性插值来构成图表,构成累积角特征函数求出全局弯曲状况的特征,其中所述累积角特征函数作为离该要素的始点的距离的函数连续求出涡旋夹角,另外与其相反作为涡旋夹角的函数连续求出距离。
8.根据权利要求1所述的字符识别方法,其特征在于,
通过求出直线群彼此的交点,定量地求出多个笔画间的位置关系,所述直线群包含各笔画的代表折线的延长线或者折线集合的延长线。
9.根据权利要求4所述的字符识别方法,其特征在于,
在上述标准化的序列内,忽略规定长度以下的折线。
10.根据权利要求7所述的字符识别方法,其特征在于,
在涡旋夹角序列的各项涡旋夹角区域内,利用上述折线角序列的相邻折线角的变化的模式或者累积角特征函数,将对象字符分解成多个分区,将该分区或边界点的特征利用在与识别对象字符的比较中。
11.根据权利要求1所述的字符识别方法,其特征在于,
将与由上述涡旋夹角序列的各项构成的曲线的涡旋夹角的一半对应的曲线上的点作为中点而求出,在其前后分割各项内的曲线,求出从各分割折线群中提取的前角分散和后角分散,提高识别精确度。
12.一种字符识别系统,是识别联机手写字符的手写字符识别系统,该字符识别系统的特征在于,具备:
输入单元,其联机地输入手写字符;
折线近似单元,其对各笔画的每一个笔画利用参数表现来捕获由上述输入单元输入的数据,对各笔画的每一个笔画进行折线近似;
处理单元,其将由上述折线近似单元折线近似的各折线作为从始点到终点的向量而求出,将成为基准的轴与上述各折线所成的角度作为折线角序列而求出,并求出上述折线的角顶点的外角序列,将上述外角序列的正或负的相同符号连续的同符号的外角之和作为涡旋夹角序列;以及
识别单元,其分层且分割地提取由上述处理单元求出的各序列的全局特征和涡旋夹角序列的各项涡旋夹角区域内的局部特征或者次局部特征,将该提取结果与预先准备的识别对象字符的模板进行比较,从而进行字符识别。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005038224 | 2005-02-15 | ||
JP038224/2005 | 2005-02-15 | ||
PCT/JP2006/303104 WO2006088222A1 (ja) | 2005-02-15 | 2006-02-15 | 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101160592A CN101160592A (zh) | 2008-04-09 |
CN101160592B true CN101160592B (zh) | 2010-05-19 |
Family
ID=36916617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800125797A Expired - Fee Related CN101160592B (zh) | 2005-02-15 | 2006-02-15 | 手写字符识别方法和手写字符识别系统 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8290274B2 (zh) |
EP (1) | EP1852806A1 (zh) |
JP (1) | JP4092371B2 (zh) |
KR (1) | KR20070112454A (zh) |
CN (1) | CN101160592B (zh) |
WO (1) | WO2006088222A1 (zh) |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8050500B1 (en) * | 2006-07-06 | 2011-11-01 | Senapps, LLC | Recognition method and system |
JP5352757B2 (ja) * | 2006-08-14 | 2013-11-27 | 有限会社Kiteイメージ・テクノロジーズ | 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR20100124426A (ko) * | 2009-05-19 | 2010-11-29 | 삼성전자주식회사 | 아날로그 입력 가능한 컴퓨팅 기기에서 손 글씨 저장 장치 및 방법 |
JP5233839B2 (ja) * | 2009-05-20 | 2013-07-10 | 株式会社リコー | 情報抽出装置、情報抽出方法、情報抽出プログラム、及び記憶媒体 |
US9448706B2 (en) * | 2009-07-29 | 2016-09-20 | Synopsys, Inc. | Loop removal in electronic design automation |
US20120169643A1 (en) | 2009-09-09 | 2012-07-05 | Sharp Kabushiki Kaisha | Gesture determination device and method of same |
KR101085699B1 (ko) | 2010-02-17 | 2011-11-23 | 고려대학교 산학협력단 | 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 |
TWI581131B (zh) * | 2010-06-15 | 2017-05-01 | 陞達科技股份有限公司 | 分析二維軌跡以產生至少一非線性指標之方法以及使用該方法之觸控模組 |
US8363947B2 (en) | 2010-07-31 | 2013-01-29 | International Business Machines Corporation | Handwritten character recognition based on frequency variations in characters |
CN102385707A (zh) * | 2010-08-30 | 2012-03-21 | 阿里巴巴集团控股有限公司 | 一种数字图像识别的方法、装置及爬虫服务器 |
US8723819B2 (en) * | 2010-09-27 | 2014-05-13 | Sentelic Corporation | Method for analyzing two-dimensional track to generate at least one non-linear index and touch control module using the same |
US9014477B2 (en) * | 2011-10-27 | 2015-04-21 | King Abdulaziz City for Science and Technology (KACST) | Method and apparatus for automatically identifying character segments for character recognition |
KR101191702B1 (ko) | 2011-12-30 | 2012-10-16 | 주식회사 한글과컴퓨터 | 자유선 인식 기반 도형 입력 장치 및 방법 |
KR101251465B1 (ko) * | 2012-01-10 | 2013-04-05 | 주식회사 한글과컴퓨터 | 자유선 입력 보정 장치 및 방법 |
CN104205126B (zh) * | 2012-03-23 | 2018-06-08 | 微软技术许可有限责任公司 | 对手写字符的无旋转识别 |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
CN105579319B (zh) * | 2013-03-12 | 2018-02-16 | 罗伯特·博世有限公司 | 用于识别车载信息系统中的手写手势的系统和方法 |
JP6125333B2 (ja) * | 2013-05-31 | 2017-05-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
US9851880B2 (en) * | 2014-03-14 | 2017-12-26 | Adobe Systems Incorporated | Image rotation based on touch gestures |
WO2015141260A1 (ja) * | 2014-03-17 | 2015-09-24 | 株式会社河合楽器製作所 | 手書き音楽記号認識装置およびプログラム |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US20160110599A1 (en) * | 2014-10-20 | 2016-04-21 | Lexmark International Technology, SA | Document Classification with Prominent Objects |
US9582727B2 (en) * | 2015-01-16 | 2017-02-28 | Sony Corporation | Text recognition system with feature recognition and method of operation thereof |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10109219B2 (en) * | 2015-04-16 | 2018-10-23 | Robert Bosch Gmbh | System and method for automated sign language recognition |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10318128B2 (en) * | 2015-09-30 | 2019-06-11 | Adobe Inc. | Image manipulation based on touch gestures |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
CN105809160B (zh) * | 2016-03-03 | 2019-04-05 | 成都康赛信息技术有限公司 | 一种基于交点数判定手写数字的方法 |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10095938B2 (en) | 2016-12-30 | 2018-10-09 | MorphoTrak, LLC | Multi-stage tattoo matching techniques |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10671844B2 (en) * | 2017-06-02 | 2020-06-02 | Apple Inc. | Handwritten text recognition |
US10679092B2 (en) * | 2017-07-06 | 2020-06-09 | MorphoTrak, LLC | Fast curve matching for tattoo recognition and identification |
JP6542407B1 (ja) * | 2018-02-16 | 2019-07-10 | 株式会社東芝 | 読取システム、読取方法、プログラム、及び記憶媒体 |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
CN109101973B (zh) * | 2018-08-06 | 2019-12-10 | 掌阅科技股份有限公司 | 文字识别方法、电子设备、存储介质 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
CN109978903B (zh) * | 2019-03-13 | 2021-04-16 | 浙江大华技术股份有限公司 | 一种标识点识别方法、装置、电子设备及存储介质 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN110516655B (zh) * | 2019-09-04 | 2023-04-18 | 中国地质调查局西安地质调查中心 | 一种汉字图像笔画处理方法及系统 |
KR102149105B1 (ko) * | 2019-09-18 | 2020-08-27 | 세종대학교산학협력단 | 혼합현실 기반 3차원 스케치 장치 및 방법 |
US11270104B2 (en) * | 2020-01-13 | 2022-03-08 | Apple Inc. | Spatial and temporal sequence-to-sequence modeling for handwriting recognition |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11372518B2 (en) | 2020-06-03 | 2022-06-28 | Capital One Services, Llc | Systems and methods for augmented or mixed reality writing |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US20230343125A1 (en) * | 2021-02-01 | 2023-10-26 | Boe Technology Group Co., Ltd. | Handwriting Recognition Method and Apparatus, Handwriting Recognition System and Interactive Display |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55138172A (en) * | 1979-04-17 | 1980-10-28 | Fujitsu Ltd | Online character feature extractor |
JPS60221887A (ja) * | 1984-04-18 | 1985-11-06 | Oki Electric Ind Co Ltd | オンライン文字認識処理装置 |
JPS6282486A (ja) * | 1985-10-08 | 1987-04-15 | Hitachi Ltd | オンライン手書き図形認識装置 |
JP3192468B2 (ja) * | 1992-04-16 | 2001-07-30 | パイオニア株式会社 | オンライン手書き文字認識装置及び認識方法 |
JP2000163514A (ja) * | 1998-09-25 | 2000-06-16 | Sanyo Electric Co Ltd | 文字認識方法、文字認識装置および記憶媒体 |
DE10337831A1 (de) * | 2003-08-18 | 2005-03-24 | Sick Ag | Verfahren zur optischen Erkennung von alphanumerischen Zeichen |
-
2006
- 2006-02-15 JP JP2006525406A patent/JP4092371B2/ja not_active Expired - Fee Related
- 2006-02-15 US US11/816,266 patent/US8290274B2/en not_active Expired - Fee Related
- 2006-02-15 CN CN2006800125797A patent/CN101160592B/zh not_active Expired - Fee Related
- 2006-02-15 KR KR1020077018616A patent/KR20070112454A/ko not_active Application Discontinuation
- 2006-02-15 EP EP06714244A patent/EP1852806A1/en not_active Withdrawn
- 2006-02-15 WO PCT/JP2006/303104 patent/WO2006088222A1/ja active Application Filing
Non-Patent Citations (2)
Title |
---|
JP昭55-138172A 1980.10.28 |
JP昭60-221887A 1985.11.06 |
Also Published As
Publication number | Publication date |
---|---|
JP4092371B2 (ja) | 2008-05-28 |
EP1852806A1 (en) | 2007-11-07 |
US20090136136A1 (en) | 2009-05-28 |
US8290274B2 (en) | 2012-10-16 |
CN101160592A (zh) | 2008-04-09 |
KR20070112454A (ko) | 2007-11-26 |
JPWO2006088222A1 (ja) | 2008-07-10 |
WO2006088222A1 (ja) | 2006-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101160592B (zh) | 手写字符识别方法和手写字符识别系统 | |
JP4787275B2 (ja) | セグメント化ベースの認識 | |
EP1105833B1 (en) | Character recognition | |
Priya et al. | Online and offline character recognition: A survey | |
US7349576B2 (en) | Method, device and computer program for recognition of a handwritten character | |
Nguyen et al. | A database of unconstrained Vietnamese online handwriting and recognition experiments by recurrent neural networks | |
CA2178959C (en) | Method of splitting handwritten input | |
CN109685052A (zh) | 文本图像处理方法、装置、电子设备及计算机可读介质 | |
KR20060049081A (ko) | 계층적 리스트 및 아웃라인을 파싱하기 위한 방법 및시스템 | |
JP2012008791A (ja) | 帳票認識装置及び帳票認識方法 | |
SE519014C2 (sv) | Metod och anordning för igenkänning av ett handskrivet mönster | |
CN104794485A (zh) | 一种识别书写字的方法及装置 | |
ITRM940338A1 (it) | Procedimento ed apparecchio per il riconoscimento dei caratteri | |
CN115620312A (zh) | 跨模态字符笔迹验证方法、系统、设备及存储介质 | |
JP4958236B2 (ja) | 手書きパターンを認識するための方法及び装置 | |
Laviola Jr | Mathematical sketching: a new approach to creating and exploring dynamic illustrations | |
CN101364271B (zh) | 手写汉字笔画的识别方法和识别装置 | |
CN115984875A (zh) | 一种硬笔楷书临摹作品的笔画相似性评价方法及系统 | |
Nguyen et al. | Robust and real-time stroke order evaluation using incremental stroke context for learners to write Kanji characters correctly | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
US10452941B2 (en) | Self-correction recognition method and device for valuable document recognition device | |
CN101894154A (zh) | 一种图像文档关键图案的提取方法 | |
JP5352757B2 (ja) | 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体 | |
JP3977473B2 (ja) | 手書き文字認識方法及び手書き文字認識装置 | |
Subha Rajam et al. | Design and development of tamil sign alphabets using image processing with right hand palm to aid deaf-dumb people |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100519 Termination date: 20170215 |