CN1204817A - 联机手写输入字符的识别方法及装置、执行该方法的记录媒体 - Google Patents

联机手写输入字符的识别方法及装置、执行该方法的记录媒体 Download PDF

Info

Publication number
CN1204817A
CN1204817A CN 98105284 CN98105284A CN1204817A CN 1204817 A CN1204817 A CN 1204817A CN 98105284 CN98105284 CN 98105284 CN 98105284 A CN98105284 A CN 98105284A CN 1204817 A CN1204817 A CN 1204817A
Authority
CN
China
Prior art keywords
character
stroke
dictionary
handwriting characters
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 98105284
Other languages
English (en)
Inventor
山川烈
小田原丰志
稻川直裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsui High Tec Inc
Original Assignee
Mitsui High Tec Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsui High Tec Inc filed Critical Mitsui High Tec Inc
Priority to CN 98105284 priority Critical patent/CN1204817A/zh
Publication of CN1204817A publication Critical patent/CN1204817A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

联机手写输入字符的识别方法,将联机采样的手写输入字符的普通笔划、过渡笔划、和/或s-e笔划与先前在一个字典中登录的字典字符进行比较,根据比较结果识别与手写输入字符相对应的字符。另外,当字典中与输入字符最为相似的某个字符与一个预先在一个字典中登录的字符相对应时,利用该相应的字符的特征来识别该手写输入字符。

Description

联机手写输入字符的识别方法及装置、 执行该方法的记录媒体
本发明涉及根据输入字符的笔划或使用相关的模糊存储器、对于联机手写输入字符的识别方法及装置,以及用于执行该方法的记录媒体。
手写输入字符的识别方法可以根据所用的算法大致分为脱机识别法和联机识别法。脱机识别法是,例如,用一个OSR对一个已经写完的字符进行识别;联机识别法是在书写字符的过程中,检出下笔书写的笔迹信息,进行实时识别。
在联机字符识别的过程中,对书写字符时的手写字迹的信息(即方向信息)进行抽样;然后将该方向信息与过去在字典中登录的方向信息进行互相比较,再将与字典中最相似的字符作为识别结果输出。
图24是在一种手写输入字符的常规联机识别系统中对于一笔笔划按照16个方向进行编码的示例图。
例如,一笔笔划的手写输入字符‘Z’就按照图24(b)中所示的16个方向编成图24(c)所示的、用一个码串表示的16-方向码。将手写字符的方向码串与一个汉字字典中登录的字符方向码进行比较,通过比较来识别字符(参见日本机械工程学会志,99卷,926期,11-14页(1996年1月号))。
然而,当设定的识别目标是汉字、日文的平假名、片假名、数码、西文字母(大写和小写)和符号时,由于字符的实际笔划的方向信息非常相似,这种常规联机字符的识别方法便遇到一个问题。再者,在这种常规的手写输入字符的联机识别方法中,由于是将笔划划分成有待于变换成16个方向码的16个方向,凡是不在16个方向上的笔划就不能用其中的方向表示;因而有碍于进一步做更精确的识别。
本发明的目的是要达到对联机手写输入字符进行更为精确地的识别的目的。
本发明的第一个联机手写输入字符的识别方法的特征在于其中包括下列步骤:将从手写输入字符联机采取的样本中的普通笔划、过渡笔划、和/或s-e笔划和先前已经登录在字典中的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较,根据比较结果识别出与手写输入字符相对应的字符。
本发明的第二个联机手写输入字符的识别方法的特征在于其中包括下列步骤:将从手写输入字符联机采取的样本中的普通笔划、过渡笔划、和/或s-e笔划和先前已经登录在字典中的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较;当字典字符中有一个与预置字符相对应的最为相似的字符时,根据相应字符的特征,对上述手写输入字符进行确认。
在上述的第一及第二方法中,能够将联机采样所得的手写输入字符的笔划数据和与之相对应的字典字符在字典中进行登录。
此外,本发明的第一种联机手写输入字符的识别装置的特征在于其中包括:将联机采样的手写输入字符样本中的普通笔划、过渡笔划、和/或s-e笔划和先前已经登录在字典中的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较用的装置;以及根据比较结果对上述手写输入字符进行识别用的装置。
此外,有一种用来执行第一方法中用的计算机可读记录媒体,其中录有:用于将联机采样的手写输入字符中的普通笔划、过渡笔划、和/或s-e笔划和先前已经登录在字典中的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较用的过程;以及一种根据比较结果允许执行上述手写输入字符的识别过程用的程序。
根据以上所述的本发明,通过将联机采样的手写输入字符中的普通笔划、过渡笔划、和/或s-e笔划和先前已经登录在字典中的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较;并且根据比较结果识别和手写输入字符相对应的字符,就有可能对于仅只采用普通笔划的方法难以识别的字符进行高精确度的识别。
本发明的第三个联机手写输入字符的识别方法的特征在于其中包括下列步骤:将一个联机采取的手写输入字符样本中的一个普通笔划分解为多个组分矢量;将每个矢量转换成一个包括多个方向的从属关系梯度的模糊矢量;将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较;根据比较结果识别与上述手写输入字符相应的字符。
本发明的第四个联机手写输入字符的识别方法的特征在于其中包括下列步骤:将从一个联机采样的手写输入字符的普通笔划、过渡笔划、和/或s-e笔划的样本进行分解,将得出的多个组分矢量中的每个矢量转换成包括多方向的从属关系梯度的模糊矢量;将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较;根据比较结果识别与上述手写输入字符相应的字符。
在上述第三及第四方法中,可以列举下列各实施例:
(1)将一个手写输入字符的普通笔划分解为至少有32个单元的组分矢量。
(2)当从字典中已经检出一个与手写输入字符最为相似的字符之后,且当检出的字符与预置字符相对应时,利用相应字符的特征对上述手写输入字符进行确认,并将确认结果输出。
(3)将联机采样所得的手写输入字符的普通笔划以及与之相对应的字典字符在字典中进行登录。
本发明的第二种联机手写输入字符的识别装置的特征在于其中包括:字符输入装置;对于利用上述字符输入设备所写的字符进行联机采样用的装置;将手写输入字符的一笔普通笔划分解为多个组分矢量用的装置;将每个组分矢量转换成一个包括多个方向的从属关系梯度的模糊矢量用的装置;将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较用的装置;根据比较结果识别上述手写输入字符用的装置。
此外,还有一种用来执行第三方法用的计算机可读记录媒体,其中录有:将联机采样的手写输入字符的一笔普通笔划分解为多个组分矢量用的过程;将每个组分矢量转换成一个包括多个方向的从属关系梯度的模糊矢量用的过程;将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较用的过程;以及一种根据比较结果允许执行上述手写输入字符的识别过程用的程序。
根据以上所述的本发明,通过将联机采样的手写输入字符的一笔普通笔划分解为多个组分矢量,将每个组分矢量转换成一个包括多个方向的从属关系梯度的模糊矢量,将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较,并且根据比较结果对与手写输入字符相应的字符进行识别,因而就能够利用模糊矢量族连续和精细地表示手写笔迹的角度信息,所以能够达到对联机手写输入字符进行高准确度的识别。除此以外,通过将上述识别方法与采用过渡笔划和s-e笔划的分辨方式配合使用,所以识别率得以进一步提高。
图1(a)和图1(b)是一个普通笔划的示例图。
图2是在本发明中使用的一种过渡笔划的示例图。
图3(a)和图3(b)是表示两种互不相同的过渡笔划图。
图4是本发明所用的一种起-止笔划(s-e笔划)的示例图。
图5(a)和图5(b)是本发明所用的s-e笔划的示例图。
图6是表示一个手写输入字符的输入方法的一个例子的示例图。
图7是表示一个手写输入字符是由一串小点构成的示例图。
图8是表示不同尺寸的手写输入字符的示例图。
图9是表示一个组分矢量的绝对角度θ的示例图。
图10表示一个组分矢量的绝对角度θ和从属关系梯度之间的关系的从属关系函数的示例图。
图11是在方向为‘0’时一个组分矢量和从属关系梯度之间的关系的示例图。
图12是在方向为‘1’时一个组分矢量和从属关系梯度之间的关系的示例图。
图13是在方向为‘2’时一个组分矢量和从属关系梯度之间的关系的示例图。
图14是在方向为‘3’时一个组分矢量和从属关系梯度之间的关系的示例图。
图15是表示本发明的手写输入字符识别系统的一个流程图。
图16是表示本发明的手写输入字符识别系统的一个流程图。
图17是为取得同样相似测度的途径的示例图。
图18是一种特殊规则的示例图。
图19是一种特殊规则的示例图。
图20是一种特殊规则的示例图。
图21是一种特殊规则的示例图。
图22是表示采用不相似测度计算法的字符识别方法的流程图。
图23是表示用来执行本发明所用的计算机的结构框图。
图24所示是相关技术的一种联机手写输入字符的笔划的16个方向译码的示例图。
图25所示是表示当模糊矢量采用两个方向、三个方向和五个方向时,绝对角度θ和从属关系梯度之间的关系的从属关系函数示例图。
图1(a)是在本发明中所用的手写输入字符的一个普通笔划的示例图。
一个普通笔划是当用笔接触在纸上写字时,在笔的运动写出的连续方向信息中检出的手写笔迹。在一个手写字符中,例如平假名、片假名、西文字母、汉字和符号等,除了只有一笔笔划的字符之外,每个字符都包括多笔笔划,而每一个笔划都有一条手写笔迹。表示笔在书写每一个笔划时的手写笔迹的信息称之为“普通笔划”;在每个手写字符中普通笔划的个数与该字符的笔划数目相等。当书写一个字符时,在开始之初是一个点,由此开始,随同笔的移动方向的改变,逐渐形成一个字符。而方向改变的方式就是每个字符的特征。因此,利用组分矢量表示普通笔划1-3来识别字符就是一种非常有效的办法。
图1(b)所示的组分矢量表示在书写手写输入字符的过程中笔的移动,手写输入字符的所有普通笔划都可以分解成表示方向信息的组分矢量。虽然可以采用以下所述的模糊矢量法作为将一个笔划分解成多个矢量的系统,但并不限于此,还可以采用16个方向码的常规方法。
在采用模糊矢量的系统中,由于‘组分矢量“的总数是在表示形成手写字符中的书写字迹单元的最小数目,所以,为了从手写笔迹中检出信息,还需要用一个大于手写字符笔划数的一个数目。根据一个字符分解的个数就应该是一个二的倍数这样的事实,借以便于进行数字处理,以及汉字最大的笔划数是30划,所以最好是采用32作为最小的单元数。当将单个的手写字符的组分矢量一律设定为32时,由多笔笔划组成的一个字符的每一笔笔划的组分矢量就要按照32/(笔划数)算出。这就是说,组分矢量不会因为总笔划的长度而有所改变,但是每一笔笔划的组分矢量个数却肯定是由笔划的划数确定的。在这样的情况下,就产生了要用十进制的小数来表示组分矢量个数的问题。为了避免这样的问题,就要在程序中进行下述的处理。
现以一个由三笔笔划形成的手写输入字符“H“为例。当将总计为32的三个整数分配给他们之间时,如果将每笔笔划的组分矢量计算到十进制小数位,则得出:32/3=10.667。然后,分别将32/3乘以1、2、3,并将结果舍入成整数,则:
(32/3)×1=10.667≈11
(32/3)×2=21.333≈21
(32/3)×3=32
于是,矢量个数按下列方式分配:
分给第一笔笔划:11个矢量,由第1至第11,
分给第二笔笔划:10个矢量,由第12至第21(21-11=10),
分给第三笔笔划:11个矢量,由第22至第32(32-21=11)。
图2是在本发明中使用的一种过渡笔划的示例图。
过渡笔划是在书写字符的过程中从笔离开纸时的浮动移动方向中检出的组分矢量。虽然许多手写输入字符都能够按照普通笔划进行识别,但是其中有的却不能采用这种方法进行识别。这种不可识别字符中有的纵然具有同样的普通笔划,但是形态却有所不同。这就是说,该手写字符具有不能够仅只用普通笔划表示的字符特征。当采用过渡笔划与普通笔划配合时,与仅只采用普通笔划相比,对于手写输入字符的识别率就有所提高。当一个字符的笔划多于一划时,就有过渡笔划存在,它是由每一笔笔划的终点起到下一笔笔划的起点为止的想象笔划的方向信息构成的。当某些字符的普通笔划相同时,采用过渡笔划的方向信息与之相配合,与仅只采用普通笔划相比,其识别率就有所提高。过渡笔划的笔数可以用‘笔划个数-1’个数表示。在图2所示三划字符‘H’的情况下,共有:
从第一笔的终点起、到第二笔起点为止的过渡笔划的组分矢量a;以及
从第二笔的终点起、到第三笔起点为止的过渡笔划的组分矢量b。
图3(a)及图3(b)是表示两种互不相同的过渡笔划图。
现以‘F’和‘I’为例,从第一笔到第三笔两者的普通笔划的组分矢量完全相同。第一过渡笔划a的方向相同,第二过渡笔划b的方向却完全不同。因此,‘F’和‘I’就可以根据在第二笔的不同之处加以区别。于是,通过利用书写字符的笔在空中移动的不同的特征,就有可能进行字符的识别。
图4是本发明所用的一种起-止笔划(s-e笔划)的示例图。
一个手写输入字符的s-e笔划是从第一笔笔划的起点开始、到每一笔后续笔划的起点和终点。例如图4中所示的“H”,共有:
从第一笔笔划的起点到第二笔笔划的起点的s-e笔划的一个矢量:c;
从第一笔笔划的起点到第二笔笔划的终点的s-e笔划的一个矢量:d;
从第一笔笔划的起点到第三笔笔划的起点的s-e笔划的一个矢量:e;
从第一笔笔划的起点到第三笔笔划的终点的s-e笔划的一个矢量:f;
在识别难以识别的一个手写输入字符时,只有利用多笔普通笔划或者利用普通笔划和过渡笔划两者方能成功。例如,虽然在图5(a)和图5(b)中所示的汉字字符的普通笔划和过渡笔划全都相同,难以识别;但是,当采用增加s-e笔划作为表示从该字符的起点到每笔笔划的起点和终点的方向信息的组分矢量时,由于这两个字符的s-e笔划在方向上有很的大的差别,所以就能够进行明确的识别。
现对本发明采用一种模糊联想记忆法来识别一种联机手写输入字符的识别方法加以说明。
在图6所示的个人计算机的CRT 13上显示的、由利用鼠标器12写出的手写输入的字符构成的线条看起来像是连续的;但是,实际上却是如图7所示,是由一串小点形成的。由于这些小点的数据都是坐标数据,其中包括点与点之间的距离数据,也就是字符尺寸的信息。因此,纵然所写的是同样的一个字符,但是由于写字的人不同以及写字的环境不同,这些字符的尺寸也各不相同。一个字符有不同的尺寸的示例如图8所示。在手写输入字符的识别过程中,纵然字符的尺寸不同,相同的字符当然应输出相同的识别结果。即使字符的尺寸不同,为了推导出同样的识别结果,就需要将坐标数据转换为角度数据。达到这种目的的方法见以下所述。
由一串小点构成的手写输入字符区分为多个(在本实施例中为32个)段,以便全部用32点替代。然后计算由相邻小点连成的直线的绝对角度。根据小点的坐标数据按照ΔX和ΔY(参阅图9)算出由两个小点连成的直线。具有方向性的直线就是组分矢量,利用下列(1)至(4)式导出其绝对角度θ:θ=   arctan ︳ΔY/ΔX ︳(ΔX>0,ΔY>0)...(1)θ=180°- arctan ︳ΔY/ΔX ︳(ΔX<0,ΔY<0)...(2)θ=180°+ arctan ︳ΔY/ΔX ︳(ΔX<0,ΔY<0)...(3)θ=360°- arctan ︳ΔY/ΔX ︳(ΔX>0,ΔY>0)...(4)
然后将算出的角度分为模糊矢量(如角度为0°:‘0’;如角度为90°:‘1’;如角度为180°:‘2’;如角度为270°:‘3’)。该模糊矢量用四个方向的从属关系梯度表示角度θ(这个变量用μ表示)按照下列等式(5)及(6)计算,然后查表1求算从属关系梯度:
μA=1-θ/90°    ...(5)
μB=θ/90°      ...(6)
表1
                 梯度角度     μ0     μ1     μ2     μ3
    O≤θ≤9O°     μA     μB     O     O
    90°<θ≤180°     0     μB     μA     0
    180°<θ≤270°     0     0     μB     μA
    270°<θ≤360°     μA     0     0     μB
表示四个方向的从属关系梯度和θ之间的关系的函数称为从属关系函数,见图10所示。图10中用虚线表示的部分为重复部分。连续表示的函数是处于0°-360°范围以内。由一个组分矢量算出的四个模糊矢量的示例图见图11-图14所示。
图11所示是在方向为‘0’时一个组分矢量和从属关系梯度之间的关系。标阴影线的部分表示是从属关系函数为0时的部分,其中θ=315°,μ0(315°)=0.5。
图12-图14是以同样的方式分别表示当方向为‘1’,‘2’,‘3’时组分矢量和从属关系梯度之间的关系。标阴影线的部分表示是从属关系为0时的部分。其中θ=315°,μ1(315°)=0,μ2(315°)=0,μ3(315°)=0.5。
图15和图16是表示本发明的手写输入字符识别系统的流程图。
步1,
开始起动程序。
步2,
查明待输入的手写字符在字典中是否已经有登录。
步3,
如果已有登录,输入手写输入字符,作为一个输入字符。
步4,
如果在字典中尚未登录,输入手写输入字符,作为一个有待在字典中登录的字符。
步5,从手写输入字符的普通笔划、过渡笔划、和s-e笔划检出与其相对应的组分矢量。
步6,
将每个组分矢量转换成包括四个从属关系梯度的一个模糊矢量。
根据等式(1)-(4)求出四个从属关系梯度μ0,μ1,μ2,μ3;根据等式(5)-(6)按照表1所列,求出绝对角度θ。
通过上述过程,从一个组分矢量输出四个从属关系梯度μ0,μ1,μ2,μ3;并且将从属关系梯度μ0,μ1,μ2,μ3的所有图形全部储存在存储器中。
步7,
以字典中的与手写输入字符的笔划相同的字符为目标,将步6中求出的手写输入字符从属关系梯度与字典中所有字符的从属关系梯度进行匹配,从而计算输入字符和字典字符之间的相似测度。
在执行字符识别时,所用的是二维表示的模糊矢量所形成的面积之比。相似测度S是通过下列过程求出的。首先从下列公式求出所有组分矢量的相似测度SC S C = ∑ 1 = υ 3 min ( μ ri , μ oi ) ∑ 1 = υ 3 max ( μ ri , μ oi ) - - - - - - - - - - ( 7 )
式中μT0,μT1,μT2,μT3分别表示输入字符组分矢量的从属关系梯度;μD0,μD1,μD2,μD3分别表示字典字符组分矢量的从属关系梯度。
在上述公式中,max是表示两个数值相比取其大者,min是表示两个数值相比取其小者。
然后利用下式求算每一笔划的相似测度。普通笔划的相似测度用下列公式计算: S OR = ∑ i = 1 32 S COR 32 - - - - - - - - ( 8 ) 式中,SCOR表示普通笔划组分矢量的相似测度。过渡笔划的相似测度STR用下列公式计算: S TR = ∑ i = 1 D - 1 S CTR D - 1 - - - - - - - - ( 9 )
式中,SCTR表示普通笔划组分矢量的相似测度;D表示笔划的划数。
s-e笔划的相似测度SSE用下列公式计算: S SE = ∑ i = 1 ( D - 1 ) × 2 S CSE ( D - 1 ) × 2 - - - - - - - - ( 10 )
式中,SCSE表示s-e笔划组分矢量的相似测度。
相似测度S是每笔笔划的相似测度的加权平均值。按照混合比例(W1∶W2∶W3),每笔笔划的加权系数可以按照图17所示在步10中变换。 S = W 1 × S OR + W 2 × S TR + W 3 × S SE W 1 + W 2 + W 3 - - - - - - - - ( 11 )
步8,
将步7中所做的相似测度计算对字典的全部字符实施,并将结果分配到字典的全部字符。
步9,
从中选出步8中的最大相似测度。
步10,
从字典中检出最大相似测度,并将最大相似测度的字符作为一个答案输出(第1侯选字符)。
步11,
当做到步10所得的第1侯选字符由于笔划特别相似而易于错认为另一字符(例如‘0’和‘6’),不论按照相似性检出的结果如何,都要遵照一种特殊规则做出确定。
步12,
图18-图21是特殊规则的示例图。图18所示是遇到‘0’和‘6’的情况,如果从终点到起点的高度h2大于字符高度h1的1/4,则将其认作‘6’;如果小于1/4,则将其认作‘0’。
图19所示是遇到‘P’‘D’和‘b’的情况,如果从第1笔的起点到第2笔起点的高度h2大于字符高度h1,则将其认作‘b’;如果从第1笔的终点到第2笔的终点的高度h4大于字符高度的1/10,则将其认作‘P’,否则将字符认作‘D’。
图20所示是遇到‘9’和‘a’的情况。根据这样的情况,如果从起点到终点(沿水平方向的)距离w1大于+8个小点(向右的方向为正),则将字符认作‘a’;如果小于8个小点,则将字符认作‘9’。另外,如果将从起点到终点的垂直方向的距离除以从起点到终点的水平方向的距离的值大于15,则将字符认作‘9’。
图21所示是遇到‘n’和‘h’的情况。根据这样的情况,如果将从起点到终点的垂直方向的距离h1除以从起点到终点的水平方向的距离w1的值大于1.5,则将字符认作‘h’;如果小于1.5,则将字符认作‘n’。
因此,对于汉字、平假名、片假名、西文字母(大写和小写)和符号可以采用多种多样的识别方法。
步13,
手写输入字符是否和输出结果相符,由视觉观察确定。
步14,当手写输入字符在字典数据中找不到时,确定是否将该字符进行登录。
步15,如果要进行登录,用键盘输入准确的字符。
步16,通过自动写入,将输入字符数据(模糊矢量组)和待登录的字符进行登录。
在以上的实施例中说明了将一个手写输入字符的组分矢量转换成一个有四个方向的模糊矢量;还可以将组分矢量转换成一个至少有两个方向的矢量。图25中所示表示绝对角度θ关系的从属关系函数是用两个方向、三个方向、和五个方向表示的函数。
此外,在上述实施例中的字符识别方法是通过相似测度比较的方法进行的,但是,也可以通过非相似测度比较的方法进行。图22所示是一种恰当的方法。
截止步6为止,是使用与采用相似测度进行计算的同样的方法。
步7′
以与手写输入字符的笔划相同的字典中的字符为目标,求算出一个字典字符的模糊矢量组的从属关系梯度与输入字符的模糊矢量组的从属关系梯度之间的非相似测度。由此算出的非相似测度就是表示差别的程度,如果接近于零,两者更为相似。作为非相似测度,有汉明(Hamming)距离,是两组从属关系梯度之差的整数值;有欧几里得(Euclidean)距离,是每个从属关系梯度的距离;或者是DP适配。
步8′
以所有字典字符的非相似测度为计算对象进行计算,将计算得的非相似测度分配给字典字符。
步9′
从字典字符中选出非相似测度最小的字符。
步10′
将具有最小非相似测度的字典字符作为答案输出(第1侯选字符)。
从步11起,采用与采用相似测度的算法同样的方法。
图23所示是按照本发明的字符识别所用设备的示例图。
图23是用于执行上述图15及图16中所述过程的计算机结构图。设备中包括一个记录媒体(FD,HD,辅助存储器等等)11,其中记录了一个手写输入字符识别程序和一个字典字符数据文件;一个用来输入手写输入字符的输入设备(一个鼠标器、或者一个手写垫板和键盘)12;一个显示器(CTR)13,用来在上面显示输入字符和识别为输入字符的字典字符;一个主存储器14,用来暂时储存手写输入字符的笔划数据,字典字符的笔划数据,以及每个字典字符的相似测度;一个CPU15,用来执行,例如,将笔划数据变换为模糊矢量组数据的运算、相似测度的计算等等;一个输入/输出控制器16,用来控制设备之间的数据传输和发送程序命令。
可以用一台通用个人计算机作为记录媒体11、输入设备12、存储器14、显示器13、CPU15和输入/输出控制器16之用。一个通用的程序,例如,PASCAL可以作为该程序之用。再者,当采用一个手写垫板作为输入设备12使用时,可以使用一个个人计算机用的、能够联机输入坐标的通用输入垫板。
为了识别字符在设备中执行的字符识别过程如下所列:
(1)从作为记录媒体11用的硬盘上将手写字符识别程序读在存储器14中,程序开始运作。
(2)按住鼠标器的左键、移动鼠标器,将手写输入字符输入到显示器13上光标所指的输入字符的范围内。
此时,在按住鼠标器左键的情况下鼠标器所做的移动被输入到CRT13上,与此同时,由按鼠标左键形成的鼠标光标的坐标位置数据、由按鼠标左键的计次算出的笔划划数、以及表示由开始及结束磕鼠标左键的起点和终点坐标数据都被存入存储器14中。
在采用手写垫板作为输入设备时,当笔触接触垫板的坐标位置、通过笔与垫板的接触过程的计次算出的笔划数、以及表示笔开始和结束接触的落点坐标数据都被存储在存储器14中。
(3)按鼠标器的右键,使有关识别的程序部分运作。
(4)根据笔划数的数据算出每笔普通笔划的组分矢量个数;根据起点和终点坐标数据算出每笔起点和终点的坐标数据的地址;每笔笔划除以组分矢量个数算出普通笔划的32个组分矢量的ΔX和ΔY;算出每个组分矢量的绝对角度θ,将其存入存储器。
另外,根据存储器中所存的起点和终点的坐标数据算出过渡笔划和s-e笔划组分矢量的绝对角度θ;将结果存入存储器中。
以上所述的计算以及以后所述的计算都是利用该手写输入字符识别程序在CPU 15中进行的。
(5)根据存在存储器14中的每个组分矢量的绝对角度θ算出每个组分矢量的四个模糊梯度,将每个组分矢量的模糊矢量组和笔划数数据存入存储器中。
(6)从硬盘上存储的字典字符数据文件中/读出与手写输入字符同样笔划的字典字符以及有关的模糊矢量组,将其存入存储器14中。
(7)算出存在存储器14中的每个字典字符的模糊矢量组与存储器14中所存的手写输入字符的模糊矢量组之间差别的相似测度,将算出的结果分配到相应的字典字符,并将由此得出的数据存入存储器14。
(8)将存在存储器14中的字典字符按照相似测度的降序在CPU15中排序,并且按照相似测度的降序存入存储器14。
(9)从存在存储器中的字典字符排序结果中选出最前面的一个作为第一侯选字符,然后查明该第一侯选字符是否与存在存储器中的手写字符识别规则中的某个特殊规则适用的字符相对应。
(10)只有在第一侯选字符与适用于一个特殊规则的字符相应时,方才将该第一侯选字符作为识别结果在CRT上显示。
(11)当第一侯选字符与适用一个特殊规则的字符相应时,根据包括在手写输入字符识别程序中的特殊规则程序,利用储存在存储器中的坐标数据、笔划数据、起点和终点坐标数据、和X方向Y方向的坐标数据中的最小和最大值算出第一侯选字符,并将由此算出的第一侯选字符存入存储器,同时也在CRT上作为结果显示。
(12)用键盘或鼠标器输入一条确认该字符的命令,由此确该字符。

Claims (12)

1.一种联机手写输入字符的识别方法,包括以下步骤:
将联机采样的手写输入字符的普通笔划、过渡笔划、和/或s-e笔划和先前在字典中已经登录的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较;
根据比较结果识别出与该手写输入字符相对应的字符。
2.一种联机手写输入字符的识别方法,其中包括下列步骤:
将联机采样的的手写输入字符的普通笔划、过渡笔划、和/或s-e笔划和先前在字典中已经登录的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较;
当字典字符中有一个与预置字符相对应的最为相似的字符时,根据相应字符的特征,对上述手写输入字符进行标识。
3.如权利要求1或2中记载的一种联机手写输入字符的识别方法,其中联机采样的的手写输入字符的笔划数据和与其相对应的字典字符都被登录在字典之中。
4.一种联机手写输入字符的识别装置,其中包括:
一种字符输入设备;
对于利用上述字符输入设备所写的字符进行联机采样的装置;
将手写输入字符样本中的普通笔划、过渡笔划、和/或s-e笔划和先前已经登录在字典中的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较用的装置;
根据比较结果对上述手写输入字符进行识别用的装置。
5.一种计算机可读记录媒体,其中录有:
用于将联机采样的手写输入字符的普通笔划、过渡笔划、和/或s-e笔划和先前已经登录在字典中的字符的普通笔划、过渡笔划、和/或s-e笔划进行比较用的过程;
一种根据比较结果允许执行上述手写输入字符的识别过程用的程序。
6.一种联机手写输入字符的识别方法,其中包括下列步骤:
将一个联机采样的手写输入字符的一个普通笔划分解为多个组分矢量;
将每个矢量转换成一个包括多个方向的从属关系梯度的模糊矢量;
将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较;
根据比较结果对上述手写输入字符进行识别。
7.一种联机手写输入字符的识别方法,其中包括下列步骤:
将从一个联机采样的手写输入字符的普通笔划、过渡笔划、和/或s-e笔划进行分解而得出的多个组分矢量中的每个矢量转换成包括多方向的从属关系梯度的模糊矢量;
将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较;
根据比较结果对上述手写输入字符进行识别。
8.如权利要求6或7中记载的一种联机手写输入字符的识别方法,其中将一个手写输入字符的普通笔划分解为至少有32个单元的组分矢量。
9.如权利要求6或7或8中记载的一种联机手写输入字符的识别方法,其中:当从字典中已经检出一个与手写输入字符最为相似的字符之后,且当检出的字符与预置字符相对应时,利用相应字符的特征对上述手写输入字符进行确认。
10.如权利要求6至9中任一项记载的一种联机手写输入字符的识别方法,其中:将联机采样的手写输入字符的笔划数据以及与之相对应的字典字符在字典中进行登录。
11.一种联机手写输入字符的识别装置,其中包括:
一个字符输入设备;
对于利用上述字符输入设备所写的字符进行联机采样的装置;
将手写输入字符的普通笔划分解为多个组分矢量用的装置;
将每个组分矢量转换成一个包括多个方向的从属关系梯度的模糊矢量用的装置;
将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较用的装置;
根据比较结果对上述手写输入字符进行确认用的装置。
12.一种计算机可读记录媒体,其中录有:
将手写输入字符的普通笔划分解为多个组分矢量用的过程;
将每个组分矢量转换成一个包括多个方向的从属关系梯度的模糊矢量用的过程;
将作为算出的模糊矢量集之用的模糊矢量组与以前在一个字典中登录的每个字典字符的模糊矢量组进行比较用的过程;
一种根据比较结果允许执行上述手写输入字符的识别过程用的程序。
CN 98105284 1997-07-02 1998-02-27 联机手写输入字符的识别方法及装置、执行该方法的记录媒体 Pending CN1204817A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 98105284 CN1204817A (zh) 1997-07-02 1998-02-27 联机手写输入字符的识别方法及装置、执行该方法的记录媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP177447/97 1997-07-02
JP177448/97 1997-07-02
CN 98105284 CN1204817A (zh) 1997-07-02 1998-02-27 联机手写输入字符的识别方法及装置、执行该方法的记录媒体

Publications (1)

Publication Number Publication Date
CN1204817A true CN1204817A (zh) 1999-01-13

Family

ID=5218747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 98105284 Pending CN1204817A (zh) 1997-07-02 1998-02-27 联机手写输入字符的识别方法及装置、执行该方法的记录媒体

Country Status (1)

Country Link
CN (1) CN1204817A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1333366C (zh) * 2005-04-01 2007-08-22 清华大学 基于统计结构特征的联机手写汉字识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1333366C (zh) * 2005-04-01 2007-08-22 清华大学 基于统计结构特征的联机手写汉字识别方法

Similar Documents

Publication Publication Date Title
CN1035904C (zh) 手写体识别中基线、行距和字高的估算
CN1177407A (zh) 基于速度的手写体识别方法和系统
CN1207664C (zh) 对语音识别结果中的错误进行校正的方法和语音识别系统
CN1207660C (zh) 手写签名鉴定方法和设备
CN1096652C (zh) 一种图像处理方法和一种图像处理装置
JP2667954B2 (ja) 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法
CN1023916C (zh) 简繁五笔字根汉字输入系统
JP4504702B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
CN1655147A (zh) 用于搜索数字墨水查询的设备和方法
CN1190205A (zh) 表意字符的递增输入方法
CN1625741A (zh) 可以通过手写检索查询来检索的电子文件管理系统
CN1371504A (zh) 签名识别系统和方法
CN1701323A (zh) 使用笔迹特征合成的数字笔迹数据库搜索
KR19990022352A (ko) 필기 입력의 문자 인식 방법 및 장치
JPH0139154B2 (zh)
CN1180369C (zh) 输入字符串的设备和方法
CN1834992A (zh) 检测文档图像中的字符的方向
CN1122022A (zh) 手写体匹配技术
CN1707512A (zh) 用于缩放为手写识别而输入的手写字符的方法和设备
CN1252634C (zh) 用于识别在输入区上手动描划字符的方法和设备
CN1324068A (zh) 基于部首样式的草体汉字手写注释的检索
CN1041773C (zh) 由字符图象直方图0-1图形表示识别字符的方法和装置
CN1549192A (zh) 手写字体的计算机识别与自动输入方法
CN1204817A (zh) 联机手写输入字符的识别方法及装置、执行该方法的记录媒体
CN1117338C (zh) 一种无笔画顺序的手写字符辨识系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication