CN1155129A - 在线文字识别方法及在线文字识别装置 - Google Patents

在线文字识别方法及在线文字识别装置 Download PDF

Info

Publication number
CN1155129A
CN1155129A CN96121613A CN96121613A CN1155129A CN 1155129 A CN1155129 A CN 1155129A CN 96121613 A CN96121613 A CN 96121613A CN 96121613 A CN96121613 A CN 96121613A CN 1155129 A CN1155129 A CN 1155129A
Authority
CN
China
Prior art keywords
mentioned
stroke
font
grapholect
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN96121613A
Other languages
English (en)
Other versions
CN1093965C (zh
Inventor
川又武典
小川勇
冈野祐一
龟代泰三
河村彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN1155129A publication Critical patent/CN1155129A/zh
Application granted granted Critical
Publication of CN1093965C publication Critical patent/CN1093965C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)

Abstract

本发明采用有输入文字的书写信息的输入单元,按照书写文字的大体形状特征从存储在字形字库中的标准文字选出多个类似度高的候选文字的字形识别单元,根据上述书写文字的各笔划特征就上述字形识别单元所选出的候选文字进行考虑到笔序的对应命名的笔序对应命名识别单元,根据上述书写文字的各笔划特征就上述字形识别单元所选出的候选文字进行考虑到划数的对应命名识别的划数命名识别单元,以及,显示上述笔序对应命名识别单元或上述划数对应命名识别单元的识别结果的显示单元。

Description

在线文字识别方法及 在线文字识别装置
本发明涉及对手写文字进行高精度识别的在线文字识别方法及装置。
在以往的在线文字识别装置中,有通过吸取笔序变动识别文字的在线文字识别装置和通过吸取笔序变动吸取识别文字的在线文字识别装置。以下分别就各种在线文字识别装置进行说明。
已有技术例1:
在通过吸取笔序变动吸取识别文字的已有在线文字识别装置中,是在字库的标准字型的所有笔划与输入字型的所有笔划之间,求取笔划的各自组合的距离,通过在标准字型的各笔划中对距离最小的输入字型笔划作对应命名、就输入字型的笔划变动进行相应处理(日本专利申请昭54-061146),或将笔序变更方法等信息预先存入标准字型中,根据存入内容,限制输入字型与标准字型笔划的对应命名,以减轻对应命名的处理量(日本专利公开昭57-178579)。
例如,图26是表示在日本专利公开昭57-178579中所公开的吸取笔序变动的已有的在线文字识别装置的构成的方框图。
图26中,1为计算输入字型笔划与标准字型笔划的距离的字型匹配装置,2为预先存储各个文字的标准字型的笔划顺序的标准字型存储装置,3为存储着笔序组合方法等的笔序组合存储装置,4为根据笔序组合存储装置3的信息变更存储在标准字型存储装置2中的标准字型的笔划顺序的标准字型再形成装置,5为根据字型匹配装置1输出的距离确定识别结果的识别装置。
以下,对使用图26的已有例子的在线文字识别装置的动作进行说明。
首先,在字型匹配装置1中进行输入字型信息X输入。输入字型信息X,在n划的文字时由n条笔划构成,若设定各笔划的笔序为X1,X2,…Xn,则在多元矢量空间中表示成
             X=(X1,X2,…Xn)。
另外,若设存储在标准字型存储装置2中的用n划构成的标准字型为SK(K表示标准字型的分类名),SK的各种笔划的笔划顺序为SK1,SK2,…SKn,则标准字型SK在多元矢量空间中表示成
            SK=(SK1,SK2,……SKn)
接着,字型匹配装置1计算标准字型SK与输入字型X的距离,但是因为输入字型X不一定是以正确的笔序记入,所以只是简单地将输入字型X的各要素与标准字型要素顺序对应命名,不能正确地识别用与标准字型的笔序不同的笔序记入的文字。
另外,标准字型再形成装置4根据存储在笔序组合存储装置3的笔序组合信息,转换笔序形成标准字型SKm(m=1,2,…,p),顺序输送到字型匹配装置1中。这里,p这标准字型的笔序变动的组合总数。
接着,字型匹配装置1对由标准字型再形成装置4依次送来的标准字型,利用下式求出其与输入字型X的距离Pxkm。
      Pxkm=|X1-Skm1|+|X2-Skm2|+……+|Xn-Skmn|
然后,识别装置5对由字型匹配装置1送来的P个距离内识别出最小距离,以该最小距离作为输入字型X与标准字型Sk的距离Pxk。对存储在标准字型储存装置中的所有类目内具有n划的标准字型进行以上处理,最后将最小距离的的类目作为识别结果输出。
已有技术例2
在通过吸取划数变动识别文字的已有在线文字识别装置中,有以输入字型的笔划的多个特征点与标准字型的笔划特征点进行DP匹配、进行特征眯的对应命名以便形成最小距离命名(专利公开昭62-62394),或者,为了提高字划数变动字型的识别精度,将笔划连接方法记述于标准字型中(专利公开昭60-79485,专利公开昭60-136783)等等。
例如,图28是在专利公开昭62-62394中说明的吸取字划数变动进行吸取的原有的在线文字识别装置的构成框图。图27是用来说明吸取字划数变动的原有的在线文字识别装置的识别顺序。
图27(a)表示标准字型,图27(b)表示输入字型。图27(c)(D)是说明标准字型的各笔划与输入字型的各笔划的对应命名。
图27中,30~39表示输入字型的笔划,10~21表示标准字型的笔划。
而在图28中,40为字划数检测部,41是字库地址发生部,42为字库,43为特征抽出部,44是DP匹配部,46为判定部,47是范围指定部。
以下,用图27、28对吸取划数变动的原来在线文字识别装置的动作进行说明。
首先,将输入字型输入字划数检测部40及特征抽出部43,抽出划数及各笔划的特征点。用字划数检测部40,相对输入字型字划数n,将应对照的字划数范围(n+α)~(n-β)输给字库42。在图27(b)所示的「系」字的情况下,因为n=5,所以设α=2,β=1的字划数范围为7划~4划。
图27(b)那样的输入字型为5划,形成10个特征点,而标准字型为6划,形成12个特征点。但是,如果简单地从头进行对应命名,则遗留了如图27(c)那样没有进行对应命名的特征数,由于没有进行正确地笔划对应命名,结果距离数值变大。
因此,在本已有技术例子中,采用了DP(动态编程)匹配,对划数不同的按距离最小进行对应命名。在这里,如下进行具体的DP匹配。
将输入字型的各特征点表示如下:
             A=a1,a2,……,ai,…aI
而标字库的标准字型的特征点表示如下:
             B=b1,b2,…,bj,…,bJ
这时,ai,bj的距离d(i,j)可如下求出。设d(i,j)=|ai-bj|则(1)     i=1,j=1时,
      g(1,1)=d(1,1)(2)     i=1,j≠1时
      g(1,j)=g(1,j-1)+d(1,j)(3)     i≠1,j=1时
      g(i,1)=g(i-1,1)+d(i,1)(4)     其它情况
Figure A9612161300101
由上述的递推公式求出g(I,J)(初始条件),用下式求出A的特征点列与B的特征点列的距离S(A,B)。然后,将其距离最小者作为识别结果。
     S(A,B)=1/(I+J)*g(I,J)
DP匹配部44将上述字划数范围的标准字型依次从字库42读出,用上述DP匹配方法求出输入字型的特征点与标准字型的特征点的距离并输送到判定部46。判定部46将上述距离内距离最小者的文字作为识别结果输出。
本例中,即使是图27(b)那样的输入字型,如图27(d)那样地正确进行特征点的对应命名,比图27(c)的对应命名的距离小。
如上说明的,就标准字型与输入字型的所有组合计算距离,吸取笔序变动的已有技术例1那样的在线文字识别装置,要对所有组合计算距离,计算量大,进行实时识别有困难。
另外,记述标准字型中笔序对应命名方法的已有技术例1那样的在线文字识别装置,只能对预先准备在标准字型中的笔序变动进行处理,为了提高对应命名精度要对应地设定许多笔序,而有使字库变大的问题。
另外,在原有技术例1的对应笔序变动的装置中,可对应笔序变动而不能对应划数变动,有使连在一起的字等的识别精度下降的问是。
同样,在用DP匹配进行划数不同字型的对应命名的已有技术例2那样的在线文字识别装置中,为了求出1个标准字型n划与输入字型m划的距离,必须进行n×m的距离计算,要对(m+d)~(n-β)的划数范围的所有标准字型进行这样计算。在这里,若考虑输入11划的文字作为输入文字的场合,则m=11,例如设定α=1,β=1,则必须就10划到13画的标准字型进行距离计算。即使限定在JIS第1水准文字中的场合,10划有289个字要作289×10×11=31790次的距离计算,11划有300个字要作300×11×11=36300次的距离计算,12划有297个字要作297××12×11=39204次的距离计算,13划有242个字要作242×13×11=34606次的距离计算。为此,合计要作141900次的距离计算,计算量非常多,实时识别有困难。
而且,在字库中具有结合方法等信息的已有技术例2那样的在线文字识别装置,要具有各个文字每一笔划的连接方法信息,形成字库有困难。且字库容量地必定很大。而且,因为不能对应预先没有准备好的连续的字,就存在有识别精度降低的问题。
另外,已有技术例2的对应划数变动的文字识别装置,只能对应划数变动而不能对应笔序变动,有对笔序发生变异的文字识别精度降低的问题。
而且用上述已有技术例1,2的文字识别装置,积极地利用文字的笔划信息进行识别,但对于一些连笔字或笔序变化的文字,虽然文字整体形状美丽,但难以高精度读取。
不管文字的质量,为了进行识别处理,即使在比较小的地书写的场合,也需要和污染书写的文字相同的处理时间,为了使识别精度提高,对于要复杂地处理的所有文字,还有识别时间长的问题。
本发明目的在于为解决有关问题,获得一种既实现高精度识别,又可能高速识别的在线文字识别方法及在线文字识别装置。
具体地说,以通过减少笔序对应命名识别的计算量,进行高速、高精度的识别为第1目的。
另外,通过减少划数对应命名识别的计算量,进行高速、高精度的识别为第2目的。
还有,除能高速识别外,同时还能对笔序变动及划数变动进行相应处理,进行高精度的识别、此为第3个目的。
第4个目的是,即使是书写文字的笔序与标准文字的笔序不同的场合,也能进行精度优良的识别。
作为第5个目的,是关于正确解释可能性高的文字对应于较柔软的笔序变动,关于正确解释可能较低的文字不过分进行笔序变动,都能以高速高精度地进行识别。
第6个是在字型识别的识别结果良好场合将识别结果高速输出。
另外,由于在实际书写不能实现对应付名、要防止识别率变劣,此为第7目的。
为实现以上目的,第一点发明的在线文字识别方法包括有:
伴随文字的书写动作输入该书写信息的书写信息输入步骤;
从上述书写信息抽出表示上述所书写文字的整体形状的特征,根据表示上述整体形状的特征从字库选出多个类似于上述所书写文字的标准文字的字型识别步骤;
从上述书写信息抽出表示构成上述所书写文字的笔划特征的第一笔划特征,考虑上述所书写文字的笔序根据上述第一笔划特征进行上述所书写文字的笔划与上述字形识别步骤中所选出的标准文字的笔划的对应命名,算出上述字型识别步骤中选出的多个标准文字相对上述书写文字的类似度的笔序对应命名识别步骤,以及,
根据上述笔序对应命名识别步骤中算出的所说类似度,输出上述字型识别步骤中所选出标准文字的第一输出步骤。
这里,书写信息输入步骤相当于后述实施方式的将文字写入标牌等的步骤(图2有S1)。而第一笔划特征则相当于后面实施方式中的从字笔划的起点到终点的方向,笔划的外接矩形的宽,高度等。上述字型识别步骤中选出的多个标准文字的对上述书写文字的类似度相当于后面实施方式的标准文字与书写文字的距离等。
第二点发明的在线文字识别方法,包括有:
伴随文字书写动作输入该书写信息的书写信息输入步骤;
从上述书写信息抽出表示上述所书写文字整体形状的特征,根据表示上述整体形状的特征从字库选出多个类似于上述书写文字的标准文字的字形识别步骤;
从上述书写信息抽出表示构成上述书写文字的笔划特征的第二笔划特征,根据上述第二笔划特征,考虑上述书写文字划数进行上述书写文字笔划与上述字形识别步骤中所选出标准文字的笔划的对应命名,算出上述字形识别步骤中选出的多个标准文字相对上述书写文字的类似度的划数对应命名识别步骤,以及
根据上述划数对应命名识别步骤中算出的上述类似度,输出上述字形识别步骤中选出的标准文字的第2输出步骤。
其中,第二笔划特征相当于后述实施方式中的笔划宽度,高度等。
第三点发明的在线文字识别方法,包括有:
伴随文字书写动作输入其书写信息的书写信息输入步骤;
从上述书写信息抽出表示上述书写文字的整体形状的特征,根据表示上述整体的特征从字库选出多个类似于上述书写文字的标准文字的字形识别步骤;
从上述书写信息抽出表示构成上述书写文字笔划特征的第一笔划的特征,根据上述第一笔划特征,考虑上述书写文字笔序进行上述书写文字的笔划与上述字形识别步骤中选出的标准文字的笔划的对应命名,算出上述字形识别步骤选出的多个标准文字相对上述书写文字的类似度的笔序对应命名识别步骤;
通过将上述笔序对应识别步骤中算出的类似度与预定值进行比较,判别是否输出上述标准文字的第一判别步骤;
在上述第一判别步骤中判别为输出时,根据上述笔序对应命名识别步骤中算出的上述类似度输出上述字形识别步骤中选择的标准文字的第一输出步骤;
在上述第一判别步骤中判别为不输出时,从上述书写信息抽出表示构成上述书写文字的笔划特征的第二笔划特征,根据上述第二笔划特征考虑上述书写文字划数进行上述书写文字笔划与上述字形识别步骤中选出的标准文字相对笔划的对应命名,算出上述字形识别步骤中选出的多个标准文字的上述书写文字的类似度的划数对应命名识别步骤;以及
根据上述划数对应命名识别步骤中算出的上述类似度,输出在上述字形识别步骤中选出的标准文字的第二输出步骤。
其中,第一判别步骤相当于后面的实施方式的由笔序优先输出机构55的有无输出的判定(图2的S4)。
第四点发明的在线文字识别方法,是在第一或第三点发明的在线文字识别方法的上述笔序对应命名识别步骤中,根据上述第二笔划特征按上述书写文字的笔序进行在上述书写文字的笔划与上述字形识别步骤中选出的标准文字笔划的对应命名,不能进行上述对应命名时变更对应命名笔划顺序进行再次对应命名。
第五点发明的在线文字识别方法是在第四点发明所在线文字识别方法中,用上述字形识别步骤算出相对上述书写文字的上述选出标准文字的类似度,用上述笔序对应命名识别步骤,根据上述字形识别步骤中算出的上述标准文字的类似度多次进行变更上述笔划顺序的对应命名。
第六点发明在线文字识别方法是在第三点发明的的在线文字识别方法中,还有在上述字形识别步骤之后,通过将对上述书写文字的上述字形识别步骤中算出的标准文字的类似度与预定值进行比较,判断是否输出上述标准文字的第2判别步骤;以及,在上述第二判别判骤中判别为输出时,根据上述字形识别步骤中算出的上述类似度,输出上述字形识别步骤中选出的标准文字的第三输出步骤,
在上述第二判别步骤中判别为不输出时,实行上述笔序对应命名识别步骤。
其中,第二判别步骤相当于后面实施方式的用字形优先输出机构110的输出有无的判定(图18的S3)。
另外,第七点发明在线文字识别方法,是在第二点发明的在线文字识别方法中,
上述划数对应命名识别步骤由DP匹配步骤与类似度算出步骤构成,
上述DP匹配步骤从上述书写信息抽出表示构成上述书写文字的笔划的特征的第二笔划特征,利用DP匹配基于上述第二笔划特征进行上述书写文字笔划与由上述字形识别步骤选出的标准文字笔划的对应命名,
上述类似度算出步骤从上述DP匹配步骤中经对应命名的笔划抽出上述书写文字的笔划与上述标准文字的笔划一一对应的稳定笔划,对上述稳定笔划算出相对于上述字形识别步骤中选出的标准文字的上述书写文字的类似度,
上述第二输出步骤根据上述类似度计算步骤中算出的上述类似度输出在上述字形识别步骤中选出的标准文字。
其中,类似度算出步骤相当于后面实施方式的用稳定笔划检测机构132的检测(图22的S51)。
第八点发明的在线文字识别装置,包括:
伴随文字书写动作输入该书写信息的书写信息输入单元;
由上述书写信息抽出表示上述书写文字整体形状的特征,根据上述表示整体形状的特征从字库选出多个类似于上述书写文字的标准文字的字型识别单元;
由上述书写信息抽出表示构成上述书写文字的笔划的特征的第一笔划特征,根据第一笔划特征考虑上述书写文字笔序进行上述书写文字笔划与由上述字形识别单元选出的标准文字的笔划的对应命名,算出由上述字形识别单元选出的多个标准文字相对上述书写文字的类似度的笔序对应命名识别单元;以及
根据上述笔序对应使名识别单元中算出的上述类似度输出在上述字形识别单元中选出的标准文字的第一输出单元。
其中,书写信息输入单元相当于后面实施例的输入单元50。而第一输出单元相当于后面实施例中的显示单元58。
第九点发明的在线文字识别装置,包括:
伴随文字书写动作输入其书写信息的书写信息输入单元;
由上述书写信息抽出表示上述书写文字整体形状的特征,根据表示上述整体形状的特征从字库选出多个类似于上述书写文字的标准文字的字形识别单元;
由上述书写信息抽出表示构成上述书写文字笔划特征的第二笔划的特征,根据上述第二笔划特征考虑上述书写文字划数进行上述书写文字的笔划与上述字形识别单元中选出的标准文字的笔划的对应命名,算出上述字形识别单元中选出的多个标准文字相对上述书写文字的类似度的划数对应命名识别单元;以及
根据上述划数对应命名识别单元中算出的上述类似度输出在上述字形识别单元中选出的标准文字的第二输出单元。
其中,第二输出单元相当于后面实施例中的显示单元58。
第十点发明的在线文字识别装置,包括:
伴随文字书写动作输入其书写信息的书写信息输入单元;
从上述书写信息抽出表示上述书写文字整体形状的特征,根据上述表示整体形状的特征从字库选出多个类似于上述书写文字的字形识别单元;
从上述书写信息抽出表示构成上述书写文字的笔划的特征的第一笔划特征,根据上述第一笔划特征考虑上述书写文字笔序,进行上述书写文字笔划与上述字形识别单元中选出的标准文字的笔划的对应命名,算出上述字形识别单元中选出的多个标准文字相对上述书写文字的类似度的笔序对应命名识别单元;
通过将上述笔序对应命名识别单元中算出的类似度与预定值进行比较,判别是否输出上述标准文字的第一判别单元;
在上述第一判别单元中判别为输出时,根据上述笔序对应命名识别单元中算出的上述类似度输出在上述字形识别单元中选出的标准文字的第一输出单元;和
在上述第一判别单元中判别为不输出时,从上述书写信息抽出表示构成上述书写文字的笔划特征的第二笔划特征,根据上述第二笔划特征考虑上述书写文字划数进行上述书写文字笔划与在上述字形识别单元中选出的标准文字笔划的对应命名,算出上述字形识别单元中选出的多个标准文字相对上述书写文字的类似度的划数对应命名识别单元;以及
根据上述划数对应命名识别单元算出的上述类似度,输出上述字形识别单元中选出的标准文字的第二输出单元。
其中,第一判别单元相当于后面实施例中的笔序优先输出单元55。
另外,第11点发明的在线文字识别,是在第9个发明的在线文字识别装置中,
上述的划数对应命名单元由DP匹配单元与类似度计算单元构成;
上述DP匹配单元从上述书写信息抽出表示构成上述书写文字的笔划特征的第二笔划特征,根据上述第二笔划特征通过DP匹配对上述书写文字笔划与上述字形识别单元中选出的标准文字笔划进行对应命名;
上述类似度计算单元从上述DP匹配单元中经过经命名的笔划,抽出上述书写文字的笔划与上述标准文字的笔划一一对应的稳定笔划,就上述稳定笔划算出上述字形识别单元中选出的标准文字相对上述书写文字的类似度;
上述第二输出单元根据上述类似度算出单元中算出的上述类似度,输出上述字形识别单元中选出的标准文字。
其中,类似度算出单元相当于后面实施例中的稳定笔划检测单元132。
第12点发明的在线文字识别装置,是在第10点发明的在线文字识别装置中,包括有:
通过对上述书写文字的上述字形识别单元中算出的标准文字的类似度与预定值进行比较,判别是否输出上述标准文字的第二判别单元;
在上述第二判别单元中判别为输出时,根据上述字形识别单元中算出的上述类似度输出在上述字形识别单元中选出的标准文字的第三输出单元;
上述笔序对应命名识别单元,在第二判断单元中判别不输出时进行处理。
下面,参照附图说明发明的实施方式。附图中:
图1为表示实施方式1的在线文字识别装置的构成图;
图2是表示实施方式1的控制单元59动作的流程图;
图3是表示在实施方式1的输入单元50中书写的输入字形的图;
图4表示实施方式1的字形识别单元52动作的流程图;
图5是表示实施方式1的字形识别单元52的分配方向代码的种类的图;
图6是表示实施方式1的进行方向代码分配处理后的输入字形图;
图7是实施方式1的方向代码区域分割,在各区域中每一方向的代码计数的图;
图8是表示实施方式1的笔序对应命名识别单元54动作的流程图;
图9是表示实施方式1的笔序对应命名识别单元54分配笔划方向、假想的笔划方向时的方向的图;
图10是用实施方式1的笔序对应命名识别单元54表示输入字形的第一笔划的笔划特征的图;
图11为用实施方式1的笔序对应命名识别单元54表示进行笔划对应命名的法则的图;
图12为表示实施方式1的笔划特征字库中的文字「  」的标准字形的笔划排列的图;
图13为表示实施方式1的文字「  」用不同笔序记入的输入字形的图;
图14是表示实施方式1的笔序对应命名识别单元54的输入字形的笔序变更的过程的图;
图15是表示实施方式1的为了说明划数对应命名识别单元57动作的连笔字的输入字形的图;
图16是表示实施方式1的划数对应命名识别单元57的标准字形与输入字形的对应命名结果的图;
图17是实施方式2在线文字识别装置的构成图;
图18为表示实施例2的控制单元59的动作流程的流程图;
图19表示实施方式3的在线文字识别装置的构成图;
图20为说明实施方式3的控制单元59的动作流程的流程图;
图21为实施方式4的在线文字识别装置的构成图;
图22为说明实施方式4的控制单元59动作流程的流程图;
图23为说明实施方式4的DP匹配单元130的输入字形与标准字形的DP匹配结果的距离成最小的路径的图;
图24为说明实施方式4的DP匹配单元130的输入字形与标准字形的实际书写不能进行对应命名时的路径的图;
图25是表示用实施方式4的稳定笔划检测单元132检测出的稳定笔划的对应命名的图;
图26为表示原有技术例1的在线文字识别装置的构成图;
图27是表示原有技术例2的输入字形、标准字形和其对应命名结果的图;
图28是表示原有技术例2的在线文字识别装置的构成图;
实施方式1
本实施方式的在线文字识别装置是通过字形识别抽出备用文字,就该备用文字进行笔序对应命名识别,再进行划数对应命名识别,以下参照图1~16进行说明。
图1是本实施方式的在线文字识别装置的构成图。
图1中,50为输入标牌等的书写信息的输入单元,51为预先存储不依赖于各个文字的划数、笔序的文字的总体形状特征的字形字库。
52是通过与从前述输入单元50所得的书写信息抽出不依赖于划数、笔序没有的总体形状特征的前述字形字库51比较,进行识别的字形识别单元。所谓不依赖于划数、笔序的文字的总体形状特征容候后述。
53是预先贮存着各个文字的划数,笔序,及构成文字的每一笔划的笔划特征的笔划特征字库。
在本说明书中,所谓笔划就是构成某一文字的各种各样的字划。
54是从前述输入单元50所得的书写信息抽出输入的笔划特征,通过考虑笔序对存储在前述笔划特征字库53中的各个文字的特征对应命名进行识别的笔序对应命名识别单元。
55是根据前述笔序对应命名识别单元54所得识别结果信息,确定是否将前述识别结果作为最终识别结果输出的笔序优先输出单元。
57是考虑划数对输入字形的笔划特征与前述笔划特征字库53的标准字形的笔划进行对应命名识别的划数对应命名识别单元。
58是显示笔序对应命名识别单元54的识别结果或划数对应命名识别单元57的识别结果的显示单元。
59是控制文字识别装置内的各单元50~57的处理动作的控制单元,它分别连接到各个单元50~57。
以下,用图2对本实施方式的在线文字识别装置的动作进行说明。
图2是表示本实施方式的在线文字识别装置的控制单元59的处理过程的流程图。
作为本实施方式的说明,对输入文字
Figure A9612161300191
时的文字识别程序进行说明。
首先,在步骤S1,控制单元59指令输入单元50获得输入字形。输入字形是包含有随着写入到输入单元50的动作的输入过程信息。这种信息为书写信息。
图3是说明输入单元50所书写输入字形
Figure A9612161300192
的图,60~66是按时间先后输入的笔划顺序。60~66的顺序表示写入笔划的输入顺序也即笔序。本例中用七划书写,所以是由7条笔划构成。
因此,在S1中,作为书写信息获得7条笔划60~66。
接着进入步骤S2,控制单元59发出指令,将输入字形的笔划顺序送入字形识别单元52,进行字形识别。
本例中,将图3的输入字形的笔划60~66送入字形识别单元52,字形识别单元52从输入字形的笔划60~66抽出与划数、笔序无关的文字总体形状特征,进行识别。
用图4作详细说明字形识别单元52的识别处理的步骤S2的过程。
图4是表示字形识别单元52的处理过程的流程图。
首先,在图4的步骤S11,字形识别单元52就输入字形的各笔划将4种方向代码分配在多种取样的各点上。
4种方向代码是示于图5的4种方向代码,具体地有垂直(V)70,水平(H)71,斜右上(R)72,斜左上(L)73的方向代码。
在各个方向中将以箭头的方向为中心直到虚线的范围视作同一方向。
就一条笔划多点取样,将各点分配到前述4种方向代码的任一个。
但是,通常的采样点由于书写速度偏差和采样速率无一定间隔,点不一定是紧密排列的。
因而,若将方向代码分配到其原来各点,即使相同字形的文字,因书写速度使方向代码数也会产生偏差。另外,因文字大小也产生点数不同,因此,要使大小适当规一化并在点间进行补插使点数规一化。
就经规一化的各点求出从现在点到下一总的方向,通过判定该方向是否相当于图5的任一方向,将方向代码分配于各点上。这里,因为笔划的终点不存在下一点,分配与前点同一方向。进行输入字形各笔划60~66大小的规一化,补插处理,将方向代码分配到各点的结果示于图6。
图6(a)是分配了水平方向代码(H)的结果,图6(b)是分配了垂直方向代码(H)的结果。该例的字形,因不存在斜右上(R),斜左上(L)的方向,省略了这些方向。
接着,进入图4的步骤S12,将整个字分割成4×4个区域,对各区域每种方向代码进行计数。
图7为将整个文字分割成4×4个区域,计算各区域内的方向代码数的图解。
图7(c)是对图6(a)的水平方向代码进行计算的结果、图7(d)是对图6(b)的垂直方向代码进行计算的结果。
因此,从输入字形抽出了4个方向的方向代码特征F沿各方向表示成4×4的16维矢量。
            F=(FH,FV,FR,FL)
            FH=FH1,FH2,…,FH16
            FV=FV1,FV2,…,FV16
            FR=FR1,FR2,…,FR16
            FL=FL1,FL2,…,FL16
FH1,FH2,…,FH16表示4×4的区域内的方向代码的计算数。对FV,FR,FL也有同样含义。
接着进入图4的S13,求出预先存入字形字库的各个字的标准字形的方向代码分布特征与输入字形的特征的距离D。
标准字形的方向代码的分布特征可以S作如下表示:
            S=(SH,SV,SR,SL)
            SH=SH1,SH2,……,SH16
            SV=SV1,SV2,……,SV16
            SR=SR1,SR2,……,SR16
            SL=SL1,SL2,……,SL16
这里,输入字形与标准字形的距离可表示如下。
            D=(DH,DV,DR,DL)
            DH=|FH1-SH1|+|FH2-SH2|+……+|FH16-SH16|
            DV=|FV1-SV1|+|FV2-SV2|+……+|FV16-SV16|
            DR=|FR1-SR1|+|FR2-SR2|+……+|FR16-SR16|
            DL=|FL1-SL1|+|FL2-SL2|+……+|FL16-SL16|
由上式,求出字形字库中的标准字形与输入字形的距离,从距离小的依次输出50个作为识别结果的候选文字。
以上,图4的步骤S11~S13的处理,是不依赖于与划数、笔序的文字整体形状特征的识别处理。
选出50个候选文字之后,移至图2的步骤S3。
接着进入图2的S2,控制单元59发出指令将由字形识别单元52所得的50个候选文字送至笔序对应命名识别单元54,以便进行笔序对应命名识别。
用图8对笔序对应命名识别单元54的动作进行详细说明。
图8是说明笔序对应命名识别单元54的动作流程图。
首先,笔序对应命名识别单元54进入图8的步骤S20,从输入字形抽出各笔划的笔划特征。
作为笔划特征抽出各笔划的每一笔划形状特征,笔划从始点到终点方向,笔划外接矩形的宽度,笔划外接矩形高度,假想笔划的方向,假想笔划外接矩形宽度,假想笔划外接矩形高度共7种。
笔划的外接矩形就是相对于笔划进行外接的矩形。
假想笔划就是连接现笔划的终点与下一笔划始点的直线。在最终笔划时,下一笔划为最初的笔划。假想笔划的外接矩形就是将假想笔划作为对角线的矩形。
而且,各笔划的方向用图9所示的8个方向量子化。另外,对于宽度、高度是将文字整体的外接矩形的宽、高度各自设为100的规一化值。图10表示就输入字形的第一划66抽出7种笔划特征的例子。
接着,将输入字形的笔划与由字形识别单元52得到的50个候选文字的笔划特征字库中的标准字形笔划进行比较,因为  在笔序对应命名识别单元只进行笔序的对应命名,所以若输入字形的划数与标准字形的划数不一致,就不能对应命名。
在此,因为在字形识别单元52中没有利用划数的信息,因此候选文字中含有各种各样划数的文字。因而,首先在S21进行输入字形与标准字形的划数比较。划数不一致时,S21为「No」,则不进行与现候选文字的标准字形相对应命名,而进行与下一文字的对应命名。在S21一致的场合,即成「YES」进入S22。
在S22,用笔划特征字库53的标准字母的笔划特征与输入字形的笔划特征进行对应命名。这里,标准字形为如图12那样的正确的笔序或多数人的书写笔序的笔划特征。另外,笔划彼此是否对应命名的判定,参照后述的对应命名规则进行对应命名检定。
图11说明对应命名规则的例子。例中记述有对各种笔划形状进行检测定的特征,就其特征进行输入字形与标准字形的检定。例如,在模划彼此的对应命名的检定中,只就模划笔划的重要特征的笔划宽进行检定。
这里,就方向的检定而言,在方向的差为+-2以上时判定为不对应命名。
对文字整体的外接矩形的宽高各为100,宽、高的差在70以上时,对宽、高的检定就判定为不对应命名。但是,基准不一样,短的笔划相互间对应命名的场合与长的笔划相互间对应命名的场合相比方向不稳定,因此要扩大对应命名的许可范围。
另外,对于假想笔划的方向、宽度、高度,因表示笔划间位置关系为尺度,所以不就笔划形状进行检定。这里,上述的对应命名在对应命名成功时进行,对应命名失败了的场合或所有笔划已经对应命名时,进入S23。
接着在S23,在输入字形的笔划之内,就所有笔划检查对应命名是否成功,已全部对应时进入S26,中间对应命名失败时则进入S24。在本例中,因输入字形是以正确的笔序写入的,所有笔划都对应命名,就进入S26。
接着在S26,就所有笔划计算输入字形的笔划特征与标准字形的笔划特征的距离,对每个特征规一化后,对各特征的距离加权后最终求出与现标准字形的距离。加权可以预先设定以提高识别率,或通过划数等改变权重。
但是,在距离计算时不使用笔划形状。
这里,从笔划方向规一化后的距离Dd、笔划宽度规一化后的距离Dw、笔划高度规一化后的距离Dn、假想笔划宽度规一化后的距离Dvw、假想笔划高度规一化后距离Dvh、假笔划方向规一化后的距离Dvd求得与校准字形的距离D。
D=(Wd×Dd+Ww×Dw+Wn×Dh+Wvw×Dvw+Wvh×Dvh+Wvd×Dvd)这里,Wd表示笔划方向权重、Ww表示笔划宽度权重,Wh为笔划高度权重,Wvw为假想笔划宽度权重,Wvh为假想笔划高度权重,Wvd为假想笔划方向权重。这些加权有如下关系。
Wd+Ww+Wh+Wvw+Wvh+Wvd=1
此权重是为提高识别率预先设定的。另外,这种加权也可根据要识别文字划数来变更设定。
以下,对在S23中对应命名失败情况下的动作进行说明。设将图13那样的文字
Figure A9612161300241
按与标准字形不同的笔序写入。这时,输入字形的第二划91与标准字形的第二划81同为竖划,判定在笔划的高度的检定中不对应命名。因此,在到第二划的对应命名结束了的阶段,进入S24。
接着在S24,判断出输入字形的笔序不同,就对应命名失败了的输入字形的笔划,通过与依次未在对应命名中使用的输入字形的笔划(若要进行与现标准字形的第K划的对应命名,则在至标准字形的第K-1划的对应命名中所使用过的输入笔划以外的笔划中,进行第K划的对应命名)调换,进行笔序排列更换。
但是,只有在最终笔划不对应命名时,或就现正进行对应命名的标准字形的笔划不存在未使用的笔划时,才能判断至此的对应命名有无错误,同样,只有将前一笔划的对应命名作为不对应命名,才能对未使用的输入笔划进行对应命名。
本例中,如图14(a)那样,将不对对应命名的笔划91与下一笔划92调换。
接着进入S25,将至今的输入笔划的复算次数(笔序调换次数)与预定的复算次数上限进行比较,在没有越出时变成「No」,回到S22,再次从不对应命名的标准字形的笔划开始对应命名。
在S22排列起来的输入笔划92,不与标准字形的第二划的笔划81对应命名,与前次同样,标准字形的第二划的笔划对应命名失败,进入S24。
在S24,下一未使用的输入笔划93正好在第二划,在标准字形的第二划的对应命名失败后的输入笔划91,92返回到原先的输入字形的笔序。
图14(b)表示移动后的输入笔划排列。
反复上述处理,直至最后所有的笔划对应命名的笔序的调换过程示于图14(c)~(f)。本例中,经6次复算对应命名成功,与用正确地笔序书写的场合一同进入S26,进行与标准字形距离的计算。另外,随着上述笔序调换,在变更了笔序的输入笔划中,再计算出表示笔划间位置关系的假想笔划的方向、宽、高。
就由字形识别单元52所得的全部识别候选文字完成了上述对应命名后,进入图2的S4。
在S4,控制单元59将在笔序对应命名识别单元54对应命名成功了的文字中最小距离的文字的距离送入笔序优先输出单元55。
在笔序优先输出单元55,将对应命名成功了的文字的距离与预先确定的阈值进行比较,若判定距离比阈值小时则将结果输出,将判定距离比阈值大时则结果不输出。
控制单元59,若在判断出笔序优先输出单元55进行输出时,在将文字识别单元52中选出的50个文字内,从由笔序对应命名识别单元54算出的距离小的文字开始依次将一定个数送到显示单元58,在显示单元58上显示出文字。
在图3的输入字形及图13的输入字形的情况下,共同的笔序的对应命名成功,所得的距离比阈值小得多,判定笔序优先输出单元55进行输出,将笔序对应命名识别单元54的识别结果作为最终结果输出。
若判断出为笔序优先输出单元55不输出的场合,则进入图2的S5。下面,为了说明图2的S5的动作,就图15那样的将文字
Figure A9612161300251
用六划书写成字形的场合进行讨论。
用六划书写的图15的输入字形,因在笔划特征字库53中只有7划的字的标准字形,不能用笔序对应命名识别单元54作与图15的输入字形的对应命名。
因而,即使假定与其它的六划文字的对应命名成功,也因变成为不同的文字对应命名,与输入字形的距离很大,笔序优先输出单元55判定因不是比阈值小的值,在图2的S4没有输出,进入S5。
在S5,划数对应命名识别单元57就文字识别单元52中选出的50个文字,利用与原有技术例2同样的DP匹配,进行划数不同者的对应命名使距离变为最小。
将输入字形的笔划表示如下,
A=a1,a2,…,ai,…,aI(I为输入字形划数)字库的标准字形的笔划表示如下,
B=b1,b2,…,bj,…,bJ(J为标准字形划数)则ai,bj的距离d(i,j)可按如下算出。
d(i,j)=|wai-wbj|+|Hai-Hbj|
这里,W为笔划的宽,H为笔划的高。
设定d(i,j)=|ai-bj|
(1)在i=1,j=1时
       g (1,1)=d(1,1)
(2)    i=1,j≠1时
       g(1,j)=g(1,j-1)+d(1,j)
(3)    i≠1,j=1时
       g(i,1)=g(i-1,1)+d(i,1)
(4)    其它情况
Figure A9612161300261
由上面表示的递推式求出g(i,j)(初始条件),用下式求出A的笔划列与B的笔划列的距离S(A,B)。
      S(A,B)=I/(I+J)*g(I,J)就字形识别单元52所得的50个识别结果的候选文字进行上述的DP匹配,距离S(A,B)从最小的开始依次作为识别结果对显示单元58输出。
显示单元58将从由DP匹配算出的距离最小的文字开始,顺序将文字显示出来。
本例中,通过DP匹配,将图15的输入字形与图12的标准字形的笔划排列作图16那样的对应命名,可正确地识别。
另外,在本实施方式中,作为字形识别单元52的特征虽然是使用方向代码特征,但是也可以是将从文字外接矩形直至正面接触到文字笔划的面积作为特征的周边分布特征,或笔划的线密度等反映文字整体的字形特征。
还有,在本实施方式中,作为代向代码特征被分割成4×4个区域,但也可根据字库容量,识别能力改变区域的分割数量。
还有,在本实施方式中,作为从字形识别单元52输出的候选文字数固定有50个,但也可根据字形识别单元52的识别能力变更该值。
另外,本实施方式中,从字形识别单元52向笔序变动对应命名识别单元54与划数对应命名识别单元57输出同样数量的候选文字,但也可根据各个识别单元的识别能力变更变更输出候选文字数。
下面就本实施方式的在线文字识别装置的效果作说明。
若采用上述的本实施方式,只就通过文字的大体特征识别结果的候选文字,进行通过笔序对应命外识别,通过划数对应命名的识别,不用字形不类似的文字的特征进行对应命名,因此,可实现高速且高精度地识别。
具体说来,在进行手写文字识别时,在以JIS第二水准的一部分文字为对象的场合,需要有对4000种文字进行高速识别,若从开始就对约4000个字进行笔序对应命名或划数对应命名,实际上要花费的处理时间说来,是有困难的。在这里,在本实施方式中,用字形识别单元52对文字识别作第一步处理,利用文字的大体特征高速地压缩了在第二阶段进行笔序对应命名识别或划数对应命名识别的文字。
而且,因为输出字形类似的文字作为候选文字,从而使用户提高了对误识别时的印象,也提高了包含在识别候选文字中的正确文字的比率。
另外,由于在笔序对应命名识别单元54中通过多个特征严密地进行笔划的对应命名,所以可高精度的识别遵守划数书写文字,就是对于连笔字等标准字形不存在的发生划数变动的输入字形,可以正确地送入划数对应命名识别单元57,使连笔字也可得到高精度识别。
作为本实施方式的文字显示,有以笔序优先输出单元55的识别结果显示的情况和以划数对应命名识别单元57的识别结果显示的情况。
因而,对显示单元58的输出由两个阶段形成。因此,在确定为笔序优先输出单元55输出的场合,因为可在前一阶段显示,所以能使识别时间提前。
另外,在本实施方式中,虽然是在第一项进行字形识别,第二项进行笔序对应命名识别,第三项进行划数对应命名识别,但在比连笔字更重视笔序的场合,在此笔序更重视连笔的场合等,也可根据情况改变第二项以后的识别顺序。
因此,作为文字识别顺序,可考虑为如下方式。
A:字形识别→划数对应命名识别→笔序对应命名识别
B:字形识别→笔序对应命名识别
C:字形识别→划数对应命名识别。实施方式2
本实施方式的在线文字识别装置,通过字形识别判定是否输出由这形识别抽出的候选文字,在判定为不输出场合进行笔序对应命名识别,划数对应命名识别。以下参照图17,图18进行说明。
图17中,50~50是与实施方式1同样的设备,说明从略。
110是根据由字形识别单元52所得的识别候选文字的信息,判定是否输出字形识别单元52的识别候选文字的字形优先输出单元。
以下,用图18对实施方式的在线文字识别装置的动作进行说明。
图18表示本实施方式的在线文字识别装置的控制单元59的处理过程的流程图。
至S2的处理与实施方式1方式,说明省略。
完成S1,S2处理后,控制单元59将由字形识别单元52所得的50个识别候选文字中最小距离的文字送入字形优先输出单元110。
接着进入图18的S30,字形优先输出单元110判定是否将字形识别单元52的识别结果输出。判定,对于由字形识别单元52送来的最小距离的文字,求出输出字形与标准字形的类似度(例如规一化距离),在该类似度比预先为各文字准备的阈值大时判定为输出结果,在小的场合判为不输出结果。
设输入字形向量为f,标准字形向量为g,则类似度按以下公式求出。
       S(f,g)=(f、g)/‖f‖·‖g‖
这里,文字A的阈值根据文字A的字形字库51中的标准字形与包含识别对象的所有文字字形的书写字形中的文字A以外的书写字形的方向代码特征求出类似度,对最大的类似度(最靠近文字A的标准字形的,文字A以外的字形的类似度)进行设定。这样,字形类似的文字不存在的文字A的阈值变为小的值,字形识别单元52的结果原封不动地输出的比率增大。
另外,由于字形类似的文字存在的文字阈值变大,所输出的部分变小,则可由详细的笔划特征进行识别。
若在S30判定为字形优先输出单元110将结果输出的场合,则从由S2算出的距离小者开始顺序显示由字形识别单元52所得的50个识别候选文字。
若在S30判定为字形优先输出单元110不将结果输出的场合,则就由字形识别单元52所得的50个识别候选文字进行与实施方式1同样的S3以后的处理。
另外,在本实施方式中,字形优先输出单元110的输出判定,作为类似度虽然采用规一化距离,但也可以用欧几里得距离或马哈赖诺毕斯距离等。
以下就本实施方式的在线文字识别装置的效果进行说明。
本实施方式的在线文字识别装置,在不存在字形类似的文字时,输出字形识别单元52的识别结果的比率增大,可能获得不受笔序变,划数变动,及文字的局部变形的左右的高精度识别。另外,在输出定形识别单元52识别结果的场合可能得到很高速的识别。
而且,如果采用本实施方式,对于非常仔细书写的文字,由字形识别单元得到高的识别精度,不进行笔序对应命名识别而以高速度显示,因此,和通常人们识别的场合同样,能迅速地识别仔细书写的文字,提高给用户的印象。
而且在本实施方式的在线文字识别装置中,在进行第一阶段的字形识别的结果的可靠性高的场合,由于是显示本阶段识别结果,因此可能高速的识别比较仔细书写的文字。
实施例方式3
本实施方式在线文字识别装置,就通过字形识别抽出的候选文字中正确解析文字可能性高的文字,对笔序对应命名识别的复算次数进行多次设定,以下参照图19~图20进行说明。
图19中,50~59,110是与前面实施方式相同的设备,对其说明省略。120是对输入字形与标准字形的笔划的对应命名进行加权的笔序对应命名识别单元。
本实施方式的在线文字识别装置的动作用图20进行说明。
图20是本实施方式的在线文字识别装置的控制单元59的处理过程的流程图。
图20中,至S30的处理与实施方式2相同,说明省略。
进行S1,S2,S3的处理,进入S40。在S40,控制单元59将与实施方式1同样地由字形识别单元52所得到的50个候选文字送入加权笔序对应命名识别单元120,加权笔序对应命名识别单元120进行输入字形与标准字形的笔划的对应命名识别。
详细的笔划对应命名操作与图8的实施方式1的操作相同,但是S25的笔序的排列调换次数(复算次数),在实施方式1,就字形识别单元52所得的候选文字是完全相同的,反之,在本实施方式中,则根据字形识别单元52的候选文字的顺序(从距离小者开始依次排列的顺序)而改变。
具体说来,在字形识别单元52的识别结果的候选文字之内,排列位次高的文字即为正确解答文字的可能性高的文字,复算次数的阈值就越大,位次低的文字即为正确解答文字的可能性低的文字,复算次数的阈值就越小。
如果采用本实施方式,对正确解答可能性低的文字,减少了笔序排更更换的数量,不必进行上述的对应命名,所以可高速识别,而且能减少因正确解答可能性低的文字的必要的上述的笔序调换而引起的错误识别。
实施方式4
本实施方式的在线文字识别装置,是在划数对应命名识别时,抽出输入字形与标准字形一一对应的稳定点,就稳定点进行各笔划的对应命名,以下,参照图21~图25进行说明。
图21中,50~59与实施方式1,110与实施方式2,120与实施方式3均为相同的设备,说明省略。
130为DP匹配单元,131为笔划对应命名检定单元,132为稳定笔划对应命名单元。
参照图22对本实施方式的在线文字识别装置的动作进行说明。
图22是表示本实施方式的在线文字识别装置的控制单元59的处理过程的流程图。
图22中,至S4的动作与前面实施方式1~3相同,说明省略,只就S50以后的动作进行说明。
首先,在S4判定为笔序优先输出单元55无输出时,控制单元59将字形识别单元52所得识别结果的候选文字50个都送至DP匹配单元130。
然后,在S50,控制单元59对DP匹配单元130作出指示,就字形识别单元52所得的识别结果的50个候选文字,进行输入字形与标准字形的对应命名。
在此,笔划对应命名检定单元131检定DP匹配单元130的对应命令路径,对不对应命名加以补偿,以防止选择该路径。
就DP匹配单元130的对应命名的路径,以图15的输入字形与图12的标准字形的对应命名为例进行说明。图15的输入字形与图12的标准字形作如图16那样地将应命名,其对应命名的路径以二维呈现在图23。
图23中,横轴为标准字形的笔划排列,纵轴为输入字形的笔划排列。图中粗线是DP匹配的对应命名路径。
图24的正确对应命名场合当然无问题,但是还有要进行图24那样的对应命名的地方。
图24表示在DP匹配单元130的输入字形与标准字形的实际书写中进行不对应命名地方的路径。
图24的对应命名情况是与输入字形的第三划的笔划与标准字形的第三、第四、第五划对应。这样的对应状态称为笔划的结合,表示本来采用二划记载的所有笔划记成一划连笔状态。
而且,标准字形的第五划与输入字形的第三划及第四划对应命名。这样的状态称为笔划分离,表示本来用一划记载的整个笔划现在用二划分开记载。
即,标准字形的第五划笔划的结合与分离同时发生。因为一般的文字书写并不发生这样的现象,所以通过笔划对应命名检定单元131来防止不对应命名。
即,笔划对应命名检定单元131在DP单元130进行DP匹配时,就从横到竖路径及从竖到横路径等通常的书写中不对应命名,通过对其所选择路径时的距离值加以极大的补偿而防止选择该路径。
接着进入S51,控制单元59使在DP匹配单元130上所得路径信息送至稳定笔划检定单元132。所谓路径信息就是如图23至图25所示的用线表现各笔划的对应的信息。
稳定笔划检定单元132在路径上的各点在前后路径为斜向路径时将该点作为稳定点抽出。但是在路径起始点正后方的路径为斜向时,在路径的终点正前方为斜路径时为稳定点。
图25表示用稳定笔划检测单元132抽出的稳定点。
图25中,在图15的输入字形与图12的标准字形的对应命名结果的路径中,将稳定笔划抽出单元132所抽出的稳定点用O表示。本例中抽出5个稳定点。
接着,稳定笔划检定单元132,对抽出的稳定点进行输入字形与标准字形笔划的于一一对应命名,用笔序对应命名识别单元54使用过的7个特片对笔划命名进行检定。
这个对应命名,在判断出在稳定点的笔划之中是一个也没有对应命名时,则判定DP匹配中的对应命名失败,进入下一字形识别单元52的候选文字的对应命名。
图25的例中,就输入字形的笔划之内结合着笔划102以外的笔划,进行与标准字形的笔划的对应命名的检定,由于进行正确对应命名,所以判定对应命名成功。
就文字识别单元52的所有50个候选文字进行以上的处理,将从对应命名成功的文字之内距离最小的文字开始顺序的一定个数作为最终的识别结果输出。
现在就本实施方式的在线文字识别装置的效果进行说明。
若采用以上的本实施方式,关于DP匹配时的对应命名,由于对实际书写中控制路径,以便不发生不对应命名,因此可实现高精度的识别。
另外,如果采用本实施方式,就DP匹配结果一一对应的笔划,用多个特征对笔划的对应命名进行检定,所以能防止错误的对应命名,可实现高精度的识别。
本发明由于有上述那样的构成,而有以下效果。
第一点发明因为就字形识别步骤中选出的标准文字进行笔序对应命名识别,可减少进行笔序对应名识别的标准文字数量,而能作高速高精度的识别。
第二点发明因为就字形识别步骤中选出的标准文字进行划数对应命名识别,可减少进行划数对应命名识别的标准文字数量,而能作高速高精度的识别。
第三点发明因为有通过将在笔序对应命名识别步骤中所算出的类似度与预定值进行比较判断是否输出标准文字的第一判别步骤,以及在上述第一判别步骤中判别为输出时,根据上述笔序对应命名识别步骤中算出的上述类似度输出字形识别步骤中选出的标准文字的第一输出步骤,所以在笔序对应命名识别步骤的识别结果良好的场合可将识别结果高速输出。
第四点发明由于以上述书写文字的笔序进行书写文字的笔划与上述标准文字的笔划的对应命名,在不能作上述对应命名时变更对应命名笔划的顺序再次进行对应命名,因此,即使上述书写文字笔序与标准文字笔序不同也能高精度进行识别。
第五个点发明因为以在字形识别步骤中算出的类似度相应的次数进行变更笔序对应命名识别步骤的笔划顺序的对应命名,所以可使正确解析可能性高的文字对应较柔顺地序序变动,使正确解析可能性低的文字不怎么进行笔序变动,而可高速高精度的识别。
第六点发明因为有在字形识别步骤之后有通过将相对上述书写文字的上述字形识别步骤中所选出的标准文字的类似度与预定值进行比较,判断是否输出上述标准文字的第二判别步骤,
以及,在上述第二判别步骤中判别为输出时,根据上述字形识别步骤中算出的上述类似度输出上述标准文字的第三输出步骤,所以,在字形识别步骤的识别结果良好的场合,可将识别高速输出。
第七点发明由于从在DP匹配中对应命名的笔划,抽出书写文字的笔划与标准文字的笔划一一对应的稳定笔划,就上述稳定笔划有算出相对于上述书写文字的上述标准文字的类似度的稳定笔划检出步骤,所以能防止在实际书写中因不对应命名而引起的识别率恶化。
第八点发明因为就字形识别单元中选出的标准文字进行笔序对应命名识别,可减少进行笔序对应命名识别的标准文字数量,可高速高精度的识别。
第九点发明因就字形识别单元中选出的标准文字进行划数对应命名识别,可减少进行划数对应命名识别的标准文字数量,而能以高速高精度地进行识别。
第十点发明因有通过将在笔序对应命名识别单元中算出的类似度与预定值进行比较判断是否输出标准文字的第一判别单元,以及,在上述第1判单元中判别为输出时,根据上述笔序对应命名识别单元中所算出的上述类似度在字形识别单元中选出的标准文字的第一输出单元,所以在笔序对应命名识别单元中识别结果良好的场合可将识别结果高速输出。
第十一发明因有在DP匹配单元中从对应命名的笔划中,抽出书写文字的笔划与标准文字的笔划一一对应的稳定笔划并就上述稳定笔划算出相对上述书写文字的上述标准文字的类似度的稳定笔划检出单元,所以能防止在实际书写中因不对应命名而引起的识别率恶化。
第十二点发明因有通过将文字识别单元中选出的标准文字相对于上述书写文字的类似度与预定值进行比较,判断是否输出上述标准文字的第二判别单元,以及
在上述第二判别单元中判别为输出时,根据上述字形识别单元中所算出的上述类似度输出上述标准文字的第三输出单元,因此,在上述字形识别单元的识别结果良好的场合,能将识别结果高速地输出。

Claims (12)

1.一种在线文字识别方法,其特征在于具有以下步骤:
伴随文字的书写动作输入该书写信息的书写信息输入步骤,
从上述书写信息抽出表示上述书写文字的整体形状的特征,根据表示上述整体形状的特征从字库选出多个类似于上述书写文字的标准文字的字形识别步骤,
从上述书写信息抽出说明构成上述书写文字的笔划的特征的第一笔划特征,根据上述第一笔划特征,考虑上述书写文字的笔序地进行从上述书写文字笔划与在上述字形识别步骤中选出的标准文字笔划的对应命名,算出在上述字形识别步骤中所选出的多个标准文字的相对上述书写文字的类似度的笔序对应命名识别步骤,以及
根据上述笔序对应命名识别步骤中所算出的上述类似度输出在上述字形识别步骤中所选出标准文字的第一输出步骤。
2.一种在线文字识别方法,其特征在于具有以下步骤:
伴随文字的书写动作输入其书写信息的书写信息输入步骤,
从上述书写信息抽出说明上述书写文字的整体形状特征,根据说明上述整体形状的特征从字库选出多个类似于上述书写文字的标准文字的字形识别步骤,
从上述书写信息抽出说明构成上述书写文字的笔划的特征的第二笔划特征,根据上述第二笔划特征,考虑上述书写文字划数地进行上述书写文字笔划与在上述字形识别步骤中选出的标准文字的笔划的对应命名,算出上述字形识别步骤中选出的多个标准文字相对于上述书写文字的类似度的划数对应命名识别步骤,以及
根据上述划数对应命名识别步骤中算出的上述类似度输出在上述字形识别步骤中所选出标准文字的第二输出步骤。
3.一种在线文字识别方法,其特征在于包括有以下步骤:
随文字的书写动作输入其书写信息的书写信息输入步骤,
从上述书写信息抽出说明上述书写文字整体特征,根据说明上述整体形状的特征从字库选出多个类似于上述书写文字的标准文字的字形识别步骤,
从上述书写信息抽出说明构成上述书写文字笔划特征的第一笔划的特征,根据上述第一笔划特征,考虑上述书写文字笔序地进行上述书写文字的笔划与上述字形识别步骤中选出的标准文字的笔划的对应命名,算出上述字形识别步骤中选出的多个标准文字相对上述书写文字的类似度的笔序对应命名识别步骤,
通过将上述笔序对应命名识别步骤中算出的类似度与预定值进行比较,判别是否输出上述标准文字的第一判别步骤,
在上述第一判别步骤中判别为输出时,根据上述笔序对应命名识别步骤中算出的类似度输出上述字形识别步骤中选出的标准文字的第一输出步骤,
在上述第一判别步骤中判别为不输出时,从上述书写信息抽出表示构成上述书写文字的笔划的特征的第二笔划特征,根据上述第二笔划特征,考虑上述书写文字划数地进行上述书写文字笔划与上述字形识别步骤中选出的标准文字的笔划的对应命名,算出上述字形识别步骤中选出的多个标准文字相对于上述书写文字的类似度的划数对应命名识别步骤,以及
根据上述划数对应识别步骤中算出的上述类似度输出上述字形识别步骤中选出的标准文字的第二输出步骤。
4.按权利要求1或3记载的文字识别方法,其特征在于,上述笔序对应命名识别步骤根据上述第二笔划特征,按上述书写文字笔序进行上述书写文字笔划与在上述字形识别步骤中选出的标准文字的笔划的对应命名,在上述对应命名不能进行的,变更对应命名的笔划顺序再次进行对应命名。
5.按权利要求4记载的在线文字识别方法,其特征在于,上述字形识别步骤,算出相对于上述书写文字的上述选出的标准文字的类似度,
上述笔序对应命名识别步骤,根据上述字形识别步骤中算出的上述标准文字的类似度的次数,进行变更上述笔划顺序的对应命名。
6.按权利要求3记载的在线文字识别方法,其特征在于,具有通过在上述字形识别步骤后,将相对于上述书写文字的上述字形识别步骤中算出的标准文字的类似度与预定值进行比较,判别是否输出上述标准文字的第二判别步骤,和在上述第二判别步骤中判别为输出时,根据上述字形识别步骤中算出的上述类似度输出在上述字形识别步骤中选出的标准文字的第三输出步骤,
在上述第二判断步骤中判别为不输出时,进行上述笔序对应命名识别步骤。
7.按权利要求2记载的在线文字识别方法,其特征在于,上述划数对应命名识别步骤由DP匹配步骤及类似度算出步骤构成,
上述DP匹配步骤从上述书写信息抽出表示构成上述书写文字的笔划的特征的第二笔划特征,根据第二笔划特征,通过DP匹配进行上述书写文字笔划与在上述字形识别步骤中选出的标准文字的笔划的对应命名,
上述类似度算出步骤,从在上述DP匹配步骤中对应命名了的笔划,抽出上述书写文字的笔划与上述标准文字的笔划一一对应的稳定笔划,就上述稳定笔划算出上述字形识别步骤中选出的标准文字相对于上述书写文字的类似度,
上述第二输出步骤根据在上述类似度算出步骤中算出的上述类似度输出上述字形识别步骤中所选择的标准文字。
8.一种在线文字识别装置,其特征在于包括有:
随文字书写动作输入其书写信息的书写信息输入单元,
从上述书写信息抽出表示上述书写文字的整体形状的特征,根据表示上述整体形状特征从字库选出多个类似于上述书写文字的标准文字的字形识别单元,
从上述书写文字信息抽出表示构成上述书写文字的笔划的特征的第一笔划特征,根据上述第一笔划特征,考虑上述书写文字笔序地进行上述书写文字笔划与由上述字形识别单元选出的标准文字笔划的对应命名,算出由上述字形识单元选出的多个标准文字相对于上述书写文字的类似度的笔序对应命名识别单元,以及
根据上述笔序对应命名识别单元中算出的上述类似度输出上述字形识别单元中选出的标准文字的第一输出单元。
9.一种在线文字识别装置,其特征在于包括有:
随文字书写动作输入其书写信息的书写信息输入单元,
从上述书写信息抽出表示上述书写文字的整体形状的特征,根据上述表示整体形状的特征从字库中选出多个类似于上述书写文字的标准文字的字形识别单元,
从上述书写信息抽出表示构成上述书写文字的笔划特征的第二笔划特征,根据上述第二笔划特征,考虑上述书写文字划数地进行上述书写文字笔划与上述字形识别单元中选出的标准文字笔划的对应命名,算出上述字形识别单元中所选出的多个标准文字相对于上述书写文字的类似度的划数对应识别单元,
根据上述划数对应命名识别单元中所算出的上述类似度输出上述字形识别单元中选出的标准文字的第二输出单元。
10.一种在线文字识别装置,其特征在于包括有:
随文字的书写动作输入其书写信息的书写信息输入单元,
从上述书写信息抽出表示上述书写文字整体形状特征,根据上述表示整体形状的特征从字库选出多个类似于上述书写文字的标准文字的字形识别单元,
从上述书写信息抽出表示构成上述书写文字的笔划的特征的第一笔划特征,根据上述第一笔划特征考虑上述书写文字的笔序地进行上述书写文字笔划与上述字形识别单元中选出的标准文字笔划的对应命名,算出上述字形识别单元中选出的多个标准文字的相对于上述书写文字的类似度的笔序对应命名识别单元,
通过将上述笔序对应命名识别单元中算出的类似度与预定值比较,判别是否输出上述标准文字的第一判别单元,
在上述第一判别单元中判别输出时,根据上述笔序对应命名识别单元中算出的上述类似度输出在上述字形识别单元中选出的标准文字的第一输出单元,
在上述第一判别单元中判别为不输出时,从上述书写信息抽出表示构成上述书写文字的笔划的特征的第二笔划特征,根据上述第二笔划特征考虑上述书写文字的划数地进行上述书写文字笔划与上述字形识别单元中选出的标准文字的笔划的对应命名,算出上述字形识别单元中选出的多个标准文字的相对上述书写文字的类似度的划数对应命名识别单元,
根据上述划数对应命名识别单元中算出的上述类似度输出上述字形识别单元中选出的标准文字的第二输出单元。
11.按照权利要求9记载的在线文字识别装置,其特征在于:
上述划数对应命名识别单元由DP匹配单元与类似度计算单元构成;
上述DP匹配单元从上述书写信息抽出表示构成上述书写文字的笔划的特征的第2笔划特征,根据上述第二笔划特征,利用DP匹配进行上述书写文字笔划与上述字形识别单元中选出的标准文字的笔划的对应命名;
上述类似度计算单元从上述DP匹配单元中对应命名了的笔划,抽出上述书写文字笔划与上述标准文字笔划一一对应的稳定笔划,就上述稳定笔划算出上述字形识别单元中选出的标准文字的相对于上述书写文字的类似度;
上述第二输出单元,根据上述类似度计算中算出的上述类似度输出在上类字形识别单元中选出的标准文字。
12.按权利要求10记载的在线文字识别装置,其特征在于,具有
通过将相对于上述书写文字在上述字形识别单元中算出的标准文字的类似度与预定值进行比较,判别是否输出上述标准文字的第二判别单元,以及
在上述第二判别单元中判别为输出时,根据上述字形识别单元中算出的上类似类度输出上述字形识别单元中选出的标准文字的第三输出单元,
上述笔序对应命名识别单元,在上述第二判别单元中判别为无输出的场合进行处理。
CN96121613A 1996-01-16 1996-11-13 在线文字识别方法及在线文字识别装置 Expired - Fee Related CN1093965C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP4760/96 1996-01-16
JP00476096A JP3360513B2 (ja) 1996-01-16 1996-01-16 オンライン文字認識方法およびオンライン文字認識装置

Publications (2)

Publication Number Publication Date
CN1155129A true CN1155129A (zh) 1997-07-23
CN1093965C CN1093965C (zh) 2002-11-06

Family

ID=11592855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96121613A Expired - Fee Related CN1093965C (zh) 1996-01-16 1996-11-13 在线文字识别方法及在线文字识别装置

Country Status (4)

Country Link
JP (1) JP3360513B2 (zh)
KR (1) KR100236247B1 (zh)
CN (1) CN1093965C (zh)
TW (1) TW315446B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100382098C (zh) * 2006-09-08 2008-04-16 华南理工大学 手写汉字首末笔段的联机提取方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0887753B1 (en) 1996-11-15 2007-10-24 Toho Business Management Center Business management system
KR20010002230A (ko) * 1999-06-12 2001-01-15 김항준 온라인 한글 인식을 위한 은닉 마르코프 모델의 구성방법
JP4817297B2 (ja) * 2006-02-10 2011-11-16 富士通株式会社 文字検索装置
KR101457456B1 (ko) * 2008-01-28 2014-11-04 삼성전자 주식회사 개인 폰트 생성 장치 및 방법
KR101679744B1 (ko) 2009-11-10 2016-12-06 삼성전자주식회사 단말기에서 데이터 처리 방법 및 그를 수행하는 장치
CN102375994B (zh) * 2010-08-10 2013-05-29 广东因豪信息科技有限公司 书写汉字笔顺正确性检测及还原的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57178579A (en) * 1981-04-27 1982-11-02 Nippon Telegr & Teleph Corp <Ntt> Online recognition system for handwritten character
JPS61198385A (ja) * 1985-02-27 1986-09-02 Oki Electric Ind Co Ltd 文字認識方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100382098C (zh) * 2006-09-08 2008-04-16 华南理工大学 手写汉字首末笔段的联机提取方法

Also Published As

Publication number Publication date
KR100236247B1 (ko) 1999-12-15
KR970059977A (ko) 1997-08-12
JPH09198466A (ja) 1997-07-31
TW315446B (zh) 1997-09-11
CN1093965C (zh) 2002-11-06
JP3360513B2 (ja) 2002-12-24

Similar Documents

Publication Publication Date Title
CN1159673C (zh) 从图像中提取管理信息的设备与方法
CN1225484A (zh) 地址识别设备和方法
CN1159704C (zh) 信号分析装置
CN1151456C (zh) 特征文字序列抽取及相似文书检索方法和装置
CN1331449A (zh) 用于将粘着法构成的文本或文档分段成词的字符串划分或区分的方法及相关系统
CN1161687C (zh) 手写体匹配技术
CN1237502C (zh) 生成声音模型的方法、装置和生成声音模型的计算机程序
CN1091906C (zh) 模式识别方法和系统以及模式数据处理系统
CN1734445A (zh) 用于对话的方法、装置和程序及其中存储程序的存储介质
CN1842702A (zh) 声音合成装置和声音合成方法
CN1846232A (zh) 使用加权信息的对象姿态估计和匹配系统
CN1271564C (zh) 信号处理设备
CN1910601A (zh) 限制条件解决方法、限制条件解决装置、以及限制条件解决系统
CN1151573A (zh) 声音识别方法,信息形成方法,声音识别装置和记录介质
CN1934570A (zh) 文本挖掘装置和其方法以及程序
CN1471078A (zh) 字识别设备、字识别方法和字识别程序
CN1093965C (zh) 在线文字识别方法及在线文字识别装置
CN1604032A (zh) 逆模型计算装置和逆模型计算方法
CN1761996A (zh) 采用合并词典的语音识别系统及方法
CN1284300C (zh) 概率运算元件、其驱动方法和使用它的识别处理装置
CN1545683A (zh) 数据转换装置、数据转换方法、学习装置、学习方法、程序和记录介质
CN1684515A (zh) 信息处理设备和方法,记录介质和程序
CN1296231A (zh) 地名表示词典生成方法和地名表示词典生成装置
CN1276337C (zh) 计算机汉字编码输入方法
CN1068127C (zh) 文字信息处理方法和装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee