CN1201207A - 在线文字识别装置 - Google Patents
在线文字识别装置 Download PDFInfo
- Publication number
- CN1201207A CN1201207A CN98105119A CN98105119A CN1201207A CN 1201207 A CN1201207 A CN 1201207A CN 98105119 A CN98105119 A CN 98105119A CN 98105119 A CN98105119 A CN 98105119A CN 1201207 A CN1201207 A CN 1201207A
- Authority
- CN
- China
- Prior art keywords
- line segment
- mentioned
- dictionary
- stroke
- literal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0354—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
- G06F3/03545—Pens or stylus
Landscapes
- Character Discrimination (AREA)
Abstract
提供一种在线文字识别装置,它具有:特征抽出部2,通过对从输入部1输入的文字模块上的坐标点进行折线近似得到各线段,抽出与该各线段有关方向、长度和特征点;特征点对应部3,进行从输入文字模块中得到的线段与字典内文字的线段的对应并算出线段对应距离;指定区间特征抽出部4,将区间的特征信息作为对应笔划特征抽出,该区间由与字典内文字的特征点组对应的输入文字模块上的特征点组决定;特征对照部5,利用算出的对应笔划特征的距离和线段对应距离算出候补文字。
Description
本发明涉及使用笔输入式计算机书写文字并输入的在线文字识别装置,特别是涉及谋求提高连笔字的文字识别率的在线文字识别装置。
在以使用笔和书写板作为输入装置向笔输入式计算机输入文字代码作为主要技术的在线文字识别技术中,对于用楷书写成的文字,利用众所周知的基本笔划方式(预先定义几种笔划形状作为基本笔划,使用基本笔划的组合去表现文字)或其它种种识别方式,可以进行高精度的识别。但是,目前对连笔字的识别能力与楷书相比还不理想。因此,从过去开始一直在进行连笔字的在线文字识别方式的研究。例如,电子通信学会论文志J66-D No.5、第593~600页记载的“不依赖笔划数和笔顺而通过选择性的笔划组合来实现在线文字识别”。下面,将它作为先有例1。在先有例1中,对于输入模块和字典,使笔划(从起笔到收笔的坐标系的单位)数少的笔划与笔划数多的笔划一一对应,不能由笔划数多的笔划对应的笔划与已经对应了的笔划有选择性地结合,使用DP(Dynamic Programing)选配技术计算结合后的字典和输入模块的坐标点间的距离,然后输出候补文字,由此,可以识别连笔字。对于DP选配技术,因为有例如“模块识别”(船久保登著:共立出版)第62页上的叙述,故在此不再详细说明。在先有例1中,将坐标点作为DP选配的特征参数使用,但另外也有使用图18所示的沿运笔方向等分割的坐标点间的方向成分(方向代码)的方法。
在图18中,将输入模块作为全部连在一起的状态处理,使笔划就象是沿运笔方向一笔写下来的一样,以适当的宽度将笔划近似相等地分割开例如用图19所示的8个方向代码去近似表示图18的各分割点间(al、a2、a3、a4、…a21)的方向成分,将该方向成分作为DP选配的特征使用,这样,也可以进行连笔字的识别。
此外,在使用基本笔划的方法中,有作成与连笔字对应的字典的识别方法,或者在字典中有笔划的分解信息、使输入模块和字典中的字的笔划数相同的分解笔划的方法。
例如,作为使用了基本笔划的先有例,有特开平2-10473。下面,将它作为先有例2。在此,就该先有例2说明其结构和动作。
图20是表示先有例2的在线文字识别装置的基本结构的方框结构图。在图20中,示出坐标输入装置21、输入坐标输入装置21的输出的基本线段识别电路22、输入基本线段识别电路22的输出并依次输出的线段代码输出电路23、线段代码缓冲器24、判别电路29再识别时将笔划的线段依次分解的线段分解电路25、控制电路26、将线段代码输出电路23的输出与字典存储部28的输出进行比较的比较电路27、输入比较电路27的输出并进行文字的识别的判别电路29和将存储的字典数据依次向比较电路27送出的字典存储部28。
在供给从坐标输入装置21输出的坐标点的时间序列信息的基本线段识别电路22中,对笔划进行折线近似,将各折线(线段)的方向成分用图19所示的8个方向代码表示。接着,使用图21所示的方向代码列和基本笔划对应表去判定输入的笔划属于哪一个基本笔划。
下面,使用图22的模块说明先有例2的动作。在图22中,按线段101、102、103、104、105的顺序记入笔划。对各笔划进行折线近似,若沿笔顺用8方向代码去表示,则变成{(1),(6),(7),(1,7),(1)}。使用图21所示的基本笔划表可以得到它的基本笔划列{(1),(3),(4),(7),(1)}。
图22的文字模块是用5个笔划记入的,所以,在比较电路27中,与字典中的5笔划字进行对照处理,在判别电路29中进行候补文字判别。结果,与字典内的文字‘石’一致,输出该文字代码。
下面,使用图23连笔字模块说明动作。在图23中,按线段106、107、108、109的顺序记入。对图23的连笔字模块,同样可以使用基本线段识别电路22得到基本笔划列{(1),(3),(4),(21)}。因笔划数是4,故比较电路27将其与字典中的4笔划字进行比较。这时,当字典存储部28内没有‘石’的4笔划字时,判别电路29不能输出文字。因此,返回控制电路26,使用线段分解电路25依次分解笔划。将分解笔划和分解规则预先登录在字典存储部28中,在此,使用图24所示的规则将基本笔划(21)分割成(7),(1),进而,使笔划数变成5。结果,输入模块的基本笔划列被修正为{(1),(3),(4),(7),(1)},比较电路27将其与字典存储部28内的5笔划字进行对照,结果与字典内的文字‘石’一致,判别电路29输出该结果。
如果按照先有例1虽然可以识别连笔字,但是,例如,在将输入模块(b)与图25所示那样的字典字模块(a)进行对照时,如图25(c)所示,因位置偏差或变形引起对应坐标点间的距离加大,结果,与字典字的距离加大,存在容易出现误读的问题。
此外,当象图18所示那样使用方向代码作为DP选配所用的特征参量时,虽然可以识别连笔字,而且不容易出现图25所示那样的位置偏差,但对于运笔方向相似的同类文字,例如,‘伎’和‘仮’、‘却’和‘劫、或‘村’和‘杖’等文字,存在容易出现误读的问题。
此外,在识别字形扭曲、与字典字的对应部分的方向差大的文字时,与字形整齐的模块相比,通过输入模块与字典字的的DP选配所得到的性能指标值变大,结果,存在容易误读成别的文字的问题。
进而,例如,象图26所示那样,具有‘钩’‘拐’成分的字(a)和没有‘钩’‘拐’成分的(即、没有对应的成分)字典字(b)的整合距离变大,存在容易误读的问题。对此,例如考虑过忽视笔划的起始点和终点附近的转折成分(例如,连续的直线的角度差小于90度的起始点或终点的线段)的方向代码、或采用加权等方法,但是不能判别起始点、终点附近的转折成分究竟是书写时的抖动还是未意识到的文字本身所具有的特征。因此,存在不能简单地忽视笔划的起始点、终点附近的成分的问题
另一方面,使用基本笔划等的笔划特征进行识别的方法,若字典字与输入模块的笔划数不一致则不能计算距离,为了与连笔字对应,有必要预先将连笔字的模块登录到字典中,或者在字典的文字模块中对每一个文字将容易连接的部分记下来。即,在先有例2中,如果在分解字典中不存在输入模块的连起来的笔划的分解规则,就不能分解笔划,出现误识别。对此,为了处理所有文字的各种各样的连接笔划,必需要有相当大的字典容量进而,例如,即使采用不使用分解字典、而将具有多个方向代码的笔划分解成各方向代码的方法去解决上述问题,对连笔写成的笔划部分,有时除了本来作为笔划表现出来的实笔划之外还包含用楷书不能表现的假想笔划。图27示出了这样的例子。图27的输入模块(a)与字典字(b)相比,正确的笔划数是另外还具有作为假想笔划的成分30和31。因此,简单地以直线成分分解的直线代码列不一定与只具有实笔划特征参数的字典字一致,所以,存在误识别的情况,存在不能简单地用方向代码进行分割的问题。
本发明是为了解决上述问题而提出的,其目的在于提供一种在线文字识别装置,防止因输入文字模块中的预想不到的成分引起的识别率的降低,谋求提高连笔字的识别率。
为了达到上述目的,与本发明的第1方面有关的在线文字识别装置是,在以文字模块的坐标点数据列作为输入、输出与该输入文字模块对应的文字代码的在线文字识别装置中,具有:输入记述上述输入文字模块时笔划上的坐标点数据列的输入装置;特征抽查装置,对包含在输入到上述输入装置的坐标点数据列中的按时间顺序排列的坐标点进行折线近似,将这样得到的各直线部分作为线段,抽出各线段的特征信息和作为各线段端点的特征点;字典存储装置,预先存储字典,该字典对每一个文字都装有构成文字的线段的特征信息和特征点;特征点对应装置,将根据上述字典中记述的各文字的特征信息和上述从特征抽出装置抽出的特征信息构成上述字典内的各文字的线段与从上述输入文字模块中得到的线段进行对应,并计算线段对应时的距离;指定区间特征抽出装置,将区间特征信息作为对应笔划特征抽出,该区间特征信息由与上述字典指定的笔划上的特征点组对应的上述输入文字模块的笔划上的特征点组来决定;特征对照装置,将由上述指定区间特征抽出装置抽出的对应笔划特征与上述字典内的特征信息进行对照,并计算对应笔划特征的距离;和将从上述特征对照装置得到的候补文字代码输出的输出装置,上述特征对照装置根据算出的对应笔划特征的距离和由上述特征点对应装置算出的线段对应的距离去特定与上述字典内的上述输入文字模块对应的文字。
与本发明的第2方面有关的在线文字识别装置是,在本发明的第1方面中,上述特征抽出装置在相邻线段的走向近似时将其作为1个线段进行结合
与本发明的第3方面有关的在线文字识别装置是,在本发明的第1方面中,上述特征点对应装置将上述输入文字模块的坐标点分别与上述字典内的文字的各笔划的起始点和终点一一对应,上述指定区间特征抽出装置把与上述起始点对应的上述输入文字模块的特征点和与上述终点对应的上述输入文字模块的特征点作为特征点组。
与本发明的第4方面有关的在线文字识别装置是,在本发明的第1方面中,上述特征对照装置在特定上述字典内的文字时,对上述对应笔划特征的距离和上述线段对应的距离进行加权。
与本发明的第5方面有关的在线文字识别装置是,在本发明的第1方面中,与上述各线段有关的信息包括各线段的方向和长度,上述特征点对应装置根据上述特征抽出装置算出的各线段的方向和长度算出对应的各线段的值,再根据该值算出线段对应的距离。
与本发明的第6方面有关的在线文字识别装置是,在本发明的第5方面中,上述特征点对应装置使某些线段不和另一些线段对应,这些线段是与作为构成上述字典中的文字的部分表现出来的笔划对应的线段,而另一些线段是与在构成上述输入文字模块的笔划中没有表现出来的部分对应的线段。
与本发明的第7方面有关的在线文字识别装置是,在本发明的第5方面中,上述字典存储装置存储字典,该字典将非方向信息添加到与指定的线段有关的特征信息中,上述特征点对应装置将根据添加了非方向信息的线段算出的值作为恒定值。
与本发明的第8方面有关的在线文字识别装置是,在本发明的第7方面中,将非方向信息添加到与某些线段有关的特征信息中,这些线段被认为是在构成上述字典内的文字的线段中与输入文字模块对照其方向杂乱无章的线段。
与本发明的第9方面有关的在线文字识别装置是,在本发明的第7方面中,上述特征点对应装置将根据添加了非方向信息的线段算出的值作为0。
与本发明的第10方面有关的在线文字识别装置是,在本发明的第7方面中,上述特征点对应装置对从与添加了非方向信息的线段对应的上述输入文字模块中得到的线段数设定上限。
图1是示出了本发明的在线文字识别装置的实施形态1的方框结构图。
图2是示出了与实施形态1中使用的字典中存储的文字‘家’有关的信息的内容例的图。
图3是示出了与实施形态1中使用的字典中存储的文字‘琢’有关的信息的内容例的图。
图4是示出了实施形态1的文字识别处理的流程图。
图5是示出了在实施形态1的文字识别处理中特征抽出部进行的处理的流程图。
图6的(a)是示出了实施形态1中使用的16方向代码的例子的图,(b)是示出了设定了DP选配所用的值的表格的图。
图7是示出了实施形态1中对输入模块进行特征抽出处理后的模块的图。
图8是以表格的形式示出了实施形态1中通过对输入模块进行特征抽出处理抽出的特征的图。
图9是示出了与字典内的文字‘家’的起始点和终点对应的输入模块的坐标点的图。
图10是示出了输入模块相对字典内的文字‘家’的对应笔划特征的图。
图11是示出了与字典内的文字‘琢’的起始点和终点对应的输入模块的坐标点的图。
图12是示出了输入模块相对字典内的文字‘琢’的对应笔划特征的图。
图13是示出了文字模块变动大的部分的例子的图。
图14是示出了字典内的文字‘木’的线段字典的内容例的图。
图15是示出了图13(d)所示的文字‘木’的线段特征的图。
图16是示出了使用非方向代码的文字‘木’的线段字典的图。
图17是用于说明实施形态2对非方向代码的对应个数的限制的图。
图18是示出了先有例中使用方向代码的识别方式的特征的图。
图19是示出了8方向代码的例子的图。
图20是示出了先有例2的在线文字识别装置的基本结构的方框结构图。
图21是示出了方向代码列和笔划代码的对应表的图。
图22是示出了为说明先有例2的动作而使用的文字‘石’的输入模块的图。
图23是示出了为说明先有例2的动作而使用的文字‘石’的输入模块的图。
图24是示出了连笔字笔划的分解规则的图。
图25是示出了先有例1中距离计算时的位置偏差的影响的图。
图26是示出了包含‘钩’‘拐’的输入模块和不包含‘钩’‘拐’的字典字的例子的图。
图27是示出了连笔字中用假想笔划表现时的例子的图。
下面,根据附图说明本发明的最佳实施形态。
实施形态1
图1是示出了本发明的在线文字识别装置的实施形态1的方框结构图。本实施形态的在线文字识别装置由输入部1、特征抽出部2、特征点对应部3、指定区间特征抽出部4、特征对照部5、字典存储部6和输出部7构成。输入部1是作为输入装置而设的,当将用户用笔在书写板等上输入的文字数据(输入文字模块)记述下来时,用来输入笔划上的坐标点数据列。特征抽出部2是作为特征抽出装置而设的,将通过对包含输入到输入部1的坐标点数据列的按时间顺序排列的坐标点进行折线近似得到的各直线部分作为线段,抽出与该各线段有关的特征信息和作为各线段端点的特征点。特征点对应部3是作为特征点对应装置而设的,根据字典中记述的各文字的特征信息和从特征抽出部2抽出的特征信息将从输入文字模块得到的线段与构成字典内各文字的线段进行对应,算出线段对应距离。指定区间特征抽出部4是作为指定区间特征抽出装置而设的,将由与字典指定的笔划上的特征点组对应的输入文字模块的笔划上的特征点组决定的区间的特征信息作为对应笔划特征抽出。特征对照部5是作为特征对照装置而设的,将由指定区间特征抽出部4抽出的对应笔划特征与字典内的特征信息进行对照,算出对应笔划特征的距离。字典存储部6是作为字典存储装置而设的,预先存储上述字典。在本实施形态的字典中,对每一个文字,将与构成文字的线段有关的特征信息和特征点存储起来。输出部7是作为输出装置而设的,输出特征对照部5得到的候补文字代码。
图2是以表格的形式示出了与字典中的文字‘家’有关的信息的图。图3是以表格的形式示出了与字典中的文字‘琢’有关的信息的图。字典存储部6存储的包含在字典中的内容和特征是文字代码、作为线段特征信息的方向代码和线段长度、笔划的外接矩形宽度、以及笔划的外接矩形高度。对于笔划之外的假想笔划,也将线段的方向代码和线段长度保存下来。再有,所谓笔划是指从落笔到起笔的坐标列的单位,但是,在这里,该笔划是指实笔划,而将从某个笔划的终点(起笔位置)连结下一个笔划的起始点(落笔位置)的笔划称之为虚笔划。对于实笔划,伴随1个笔划可能保存多个线段,而对于虚笔划,伴随1个笔划只有1个线段。在图2、图3中,将具有多个线段的笔划的从起始点到终点的方向在括号内表示出来。此外,虽然在图2、图3中没有示出,还将识别各线段是实笔划还是虚笔划的笔划识别代码保存下来。
图4是本实施形态的文字识别处理的流程图,图5是示出特征抽出部2的处理的流程图。图6(a)是16方向的代码例,图6(b)是示出设定了DP选配所用的值的表格的图。再有,在本实施形态中,构成字典内各文字的线段和从输入文字模块得到的线段的对应是由DP选配进行的。
其次,根据图4的流程图说明本实施形态的识别处理的流程。
首先,输入部1得到用户用笔在书写板上记入的手写文字数据的按时间顺序排列的坐标列(步骤100)。接着,特征抽出部2进行前处理和特征抽出(步骤101),使用图5所示流程图说明该处理的详细情况。
特征抽出部2对输入坐标列将连续的坐标点间的距离与基准宽度进行比较,进行距离没有超过基准宽度的点的筛选处理(步骤201)。在本实施形态中,对从筛选后的坐标点到下一个坐标点、即按时间顺序排列的坐标点进行折线近似,将这样得到的各直线部分称之为线段。接着抽出线段的方向代码(步骤202)。在实笔划之外,对虚笔划也抽出线段方向代码。这里,使用图6(a)所示的16方向代码来抽出方向代码列。而且,进行线段的结合处理(步骤203)。在此,当相邻的线段的方向近似时,具体地说,当相邻线段间的方向差是±1时,将这些线段结合起来,再计算结合后的线段方向代码。例如,在方向代码8的线段之后接着是方向代码9的线段时,将该两个线段结合作为方向代码8的单一线段。只是,对虚线段不进行结合处理。接着,算出结合后的线段长度(步骤204)。线段长度以筛选处理所用的基准宽度的多少倍来表示。在本实施形态中,作为特征信息抽出表示线段方向的方向代码和长度。将上述特征抽出处理后的输入模块示于图7。此外,以表格的形式示出的抽出的特征示于图8。
下面,再返回图4,特征点对应部3从字典取出1个文字数据(步骤102)。在该例中,从字典中取出图2所示的‘家’字。接着,特征点对应部3根据DP选配在输入模块和字典内的文字‘家’之间进行线段对应(步骤103)。如下面所示那样进行DP选配。
若将输入模块的线段表示成Si={Si(1)、Si(2)、…Si(i)、…Si(i)}、字典的线段表示成Sd={Sd(1)、Sd(2)、…Sd(j)、…Sd(j)},则执行
[式1]
下面,将该式作为式1。再有,函数min是求最小值的函数。这里,使用
下面,将该式作为式2。在式1中,d[i+1][j+1]表示从起始点到Si(i+1)、Sd(j+1)对应值的累积。在式2中,D[Si(i+1)][Sd(j+1)]表示线段Si(i+1)和线段Sd(j+1)的对应值。a[Si(i+1),Sd(j+1)]是由线段Si(i+1)和线段Sd(j+1)的方向差决定的值。这里,Si(i+1)和Sd(j+1)是线段Si(i+1),Sd(j+1)的线段长度。此外,在这里虽未图示,但还保存给出最小值的对应路径表。
对式1进行递推计算,最终变成计算
dist dp=d[l][∫]/(l+∫)
下面,将该式作为式3。将该式3作为与字典的DP选配值(线段对应的距离)。式3中的dist是用于求DP选配值的函数(distance)。再有,该DP选配使用上述‘模块识别’(船久保登著:共立出版)中记载的方法。
这里,因为连笔字与用正确的笔划写成的字相比笔划数减少了,所以,在将连笔字模块的笔划和线段与正确笔划的字典字对应时,对于输入模块有时会有多个字典字的成分与其对应。但是,通常,字典字的实笔划或实线段不会成为输入模块的虚笔划。因此,有必要使某些线段不和另一些线段对应,这些线段是与作为构成字典中的文字的部分表现出来的笔划对应的线段,而另一些线段是与在构成输入文字模块的笔划中没有表现出来的部分对应的线段。所以,在线段的DP选配时计算输入模块的假想笔划和字典字的实笔划成分时,对D[Si(i)][Sd(j)]的值赋予较大的罚(penalty)距离,以便不易这些线段对应,由此阻止了实际上不可能有的对应。因此,即使是连笔字也可以更可靠地防止文字的误认。当然,也可以使用其他的方法来不使上述线段对应。
用式1~3和图6计算图2所示的‘家’的字典特征和图8所示的输入模块的特征的对应,从而得到dist dp=682。
其次,在图4中,特征点对应部3使用从步骤103得到的未图示的路径表得到与字典字笔划的起始点和终点对应的输入模块的坐标点(步骤104)。图9示出与字典内的文字‘家’的笔划的起始点和终点对应的输入模块的坐标点。接下来,指定区间特征抽出部4进行输入模块的对应点间的特征抽出(步骤105)。在此,将与图9所示的‘家’的各笔划的起始点和终点对应的点组作为特征点组,将与构成该特征点组的起始点对应的输入文字模块的特征点(起始点)和与该终点对应的输入文字模块的特征点(终点)作为输入文字模块中的特征点组。而且,从夹在该输入文字模块的特征点组中间的坐标点列求出文字输入模块的起始点、终点间的外接矩形宽度、外接矩形高度和起始点到终点的方向,此外,还求出各特征点组间的假想笔划(从与终点对应的点开始到与下一个笔划的起始点对应的点的矢量)的方向和距离。下面,将这些特征称为对应笔划特征。其结果示于图10。
下面,特征对照部5进行字典字的笔划特征和输入模块的对应笔划特征的对照(步骤106)。对应笔划特征的对照例如使用(外接矩形宽度的差)+(外接矩形高度的差)+(起始点到终点的方向差)+(假想笔划的方向差)+(假想笔划的长度差)进行计算。当输入模块中不存在与字典字对应的假想笔划时,不进行这部分的计算。在图2和图10的特征之间进行上述计算,得到与字典字‘家’的对应笔划特征的距离dist st。
其次,特征对照部5判断是否存在对照的字典字(步骤107)。当存在字典内的其他文字时,返回步骤102,进行与下一个文字的对照。这时,存在其他文字,与图3的字典字‘琢’进行对照。特征点对应部3在步骤102和103中进行与上述同样的处理,得到‘琢’的DP选配的值dist do=674。同样,特征点对应部3执行步骤104,求出输入模块与文字‘琢’的笔划的起始点和终点对应的坐标点。其结果示于图11。
其次,指定区间特征抽出部4执行步骤105,与字典字‘家’一样抽出对应笔划特征。其结果示于图12。而且,特征对照部5参照图12所示的笔划特征和图3的字典字进行计算,得到笔划特征的距离dist st=233。
重复进行上述动作直到参照以上流程的文字在字典中不存在为止,若文字不存在,输出部7进行识别结果的分类工作(步骤108)。结果的分类是分别对各字典字求出式
dist all=α×dist dp+β×dist st (α,β是加权系数)下面,将该式作为式4。现在,令α=1,β=1则变成
dist all「家」=682+93=775
dist a1l「琢」=674+223=897通过按dist all递增进行分类,‘家’成为第1候补文字,‘琢’成为第2候补文字。最后,输出部7输出‘家’和‘琢’并结束(步骤109)。
上述处理的结果,‘家’成为最终的识别结果。若只看DP选配的结果,‘琢’是第1候补文字,但通过并用对应笔划特征来算出候补文字就可以得到正确的解。
如上所述,若按照本实施形态,通过并用DP选配和对应笔划特征来进行识别处理,即使没有保持与连笔字对应的字典数据也能识别不成字形的连笔字模块。
再有,在实施形态1中,将输入文字模块与字典中所有的文字进行选配,但是,也可以使用少数特征进行大分类,对大分类的结果进行DP选配计算,从而计算对应笔划特征。此外,在上述例中,虽然令α=1,β=1使DP选配和对应笔划特征的加权相等,但该值并不限于此。此外,最终距离计算式(式4)是取对DP选配的结果和对应笔划特征的结果进行加权后的值的和,但是,也可以这样做,例如,使用对应笔划特征进行分类,当第1候补文字的距离大于某一值时,只采用DP选配的结果重新分类,不是将选定第1候补文字等简单地作为系数处理,而是附加其他的计算方法或条件等进行加权后再得到正确的解。
进而,线段的对应虽然使用了DP选配法,但是,并不限于DP选配,也可以使用逐次近似法或其他方法。此外,对于对应笔划特征,使用对应部分的宽度、高度、从起始点到终点的方向和假想笔划的宽度、方向进行了说明,但也可以代之以抽出其他特征、例如基本笔划。
实施形态2
下面,使用实施形态1已使用过的图6和图13、图14、图15以及图16说明实施形态1的DP选配中抑制因文字模块的变动而引起的值的上升的方法。图13是示出了包含变动大的部分的文字例子的图,图14是示出了文字‘木’的线段字典的内容例的图,图15是示出了图13(d)的线段特征的图,图16是示出了使用非方向代码的文字‘木’的线段字典的图。
象实施形态1那样,在使用线段的方向代码和线段长度进行DP选配时,有因人为因素在某些输入文字的某些笔划中出现‘钩’的情况,或者在文字模块的某一笔划的终点和下一个笔划的起始点距离近的情况等,这时线段或假想笔划的方向代码变动很大。在图13(a)~(c)所示的文字中,图中○内部分的假想笔划的方向差当使用16方向代码时在模块间成为8,从而成为增大DP选配值的原因。此外,对于象图13(d)所示那样,对具有‘钩’的模块,当字典字中没有‘钩’时,DP选配值变大,若在同一文字中这样的笔划存在多处,有时,会产生误读成其他文字的结果。
本实施形态的特征是,为了防止这种情况,对因人为因素或文字模块而方向差相差很大的部分不计算方向差,而只使用笔划的长度信息进行计算,通过预先设定这样的线段来回避该问题。
例如,象图15那样抽出图13(d)模块的线段方向代码列和线段长度,如图14所示,示出‘木’的字典的线段方向代码列和线段长度。在线段特征的DP选配时,当禁止输入模块的假想笔划和字典字的实笔划对应时,在图14和图15中,因笔划数都是4划故根据笔顺使笔划一一对应。即,图15的输入笔划的第2划的方向代码{9,13}与字典字的第2划的方向代码{9}对应,输入模块的第2划的‘钩’部的线段和字典的对应值,若使用式2和图6(b)进行计算,则值=方向差4×线段长度的和=20×(7+1)=160。
与此对应,图16示出本实施形态的应付方向代码变动的特征字典的例子。在本实施形态中,将非方向信息添加到指定线段的特征信息中,这些线段是被认为如前因所述输入的文字模块容易因人而异和‘钩’等的方向凌乱的且有时方向代码变化很大的线段。在本实施形态中,使用非方向代码序号作为非方向信息。在图6(a)的16方向代码中,假设将非方向代码序号设定为17,保存图16的第2划。方向代码是17的线段的线段计算定义为将方向差作为0进行DP选配,图16的第2笔划和图15的第2笔划的值的计算与图14的情况一样,计算DP选配,利用式5进行计算。与图14的情况一样,对于第2笔划的对应结果、字典字{9,17}和输入模块{9,13},{9}和{9}、{17}和{13}对应,式5的{17}和{13}的值的计算变成方向差0×(1+1)=0,若再加上{9}和{9}的值的计算0×(7+7)=0,则以笔划为单位的值必然是恒定值0。这样,通过使用非方向代码,与图14的字典字的值160相比,DP选配的值小,结果与字典字的距离变小,可以防止误识别。
但是,进行与非方向代码的DP选配时,存在不能象预期那样进行对应的情况。下面用图17来说明这种情况。现在,假定进行图17(a)的折线和图17(b)的字典字的DP选配。图17(a)具有5个线段11-15,图17(b)具有2个线段16、17。若使用图6(a),各线段的方向代码分别是,线段11是9,线段12是5,线段13是9,线段14是5,线段15是9,此外,线段16是9,线段17是非方向代码17。再有,线段长度全是1。这里,使用式1和式2进行图17(a)和17(b)的对应。开始,线段11和线段16对应,其值是方向差0×(1+1)=0。其次,由式1线段12和线段16的方向差是4,所以,从图6(b)和式2得出值是20×(1+1)=40,线段11和线段17因为是与非方向代码对应,故其值为0,线段12和线段17也因为是与非方向代码对应,故其值也为0,将值最小的线段11和线段17或线段12和线段17对应。进行同样的计算,剩下的线段13、14、15全部与线段17对应,其值分别为0。结果,利用式3,图17(a)和(b)的线段对应值为0/(5+2)=0。
结果,意味着图17(a)和(b)是相同的,成为错误的对应,如果允许这样的对应,虽然包含非方向代码,但有时会全部识别为形状不相似的文字。为了防止出现这样的情况,在本实施形态中,对从与添加了非方向代码的线段对应的输入文字模块中得到的线段的个数设定上限。
例如,当设定与非方向代码对应的上限数为1时,图17(a)和(b)的值,线段11~15与线段16对应,线段15与线段17对应。图17(a)和(b)的值成为(线段11和线段16的值=)0+(线段12和线段16的值=)40+(线段13和线段16的值=)0+(线段14和线段16的值=)40+(线段15和线段16的值=)0+(线段15和线段17的值=)0=80,与刚才的值0相比得到了预期的值。
再有,在上述实施形态中,忽视了‘钩’等线段,使其方向差为0,从而,根据方向代码是17的线段算出的值为0,但是,也可以应用使值取0以外的恒定值、设定方向差使其不为0等情况。
再有,在上述例中,使用了式1~3作为DP选配对应点的计算式,但不限于此,也可以使用其他数学式。
若按照本发明,通过对容易误认的连笔字或运笔方向相似的文字并用线段对应和对应笔划特征进行文字识别处理,可以比较细致地进行文字检测,结果,可以高精度地进行文字识别。此外,只要是同一笔顺,不管文字在哪一部分连续,可以只用1种字典进行识别,没有必要对不同的连笔字分别设置对应的字典。因此,例如,对于不成字形的连笔字模块,不用保存与连笔字对应的字典数据也能识别,可以得到减少制作字典的工作量和字典容量等的种种附带效果。
此外,因为当通过计算进行最终的文字识别时可以设定线段对应和对应笔划特征的加权系数,所以可以提供更正确的文字识别处理。
此外,不使某些线段与另一些线段对应,这些线段是与作为构成字典中的文字的部分表现出来的笔划对应的线段,而另一些线段是与构成输入文字模块的笔划中没有表现出来的部分对应的线段,所以,即使是连笔字也可以比较可靠地防止文字的误认。
此外,因设有添加了非方向信息的字典,故在算出线段对应的距离时,其结果可以不因‘钩’、‘拐’等文字部分的变动而产生很大的变动,结果,可以进行高精度的文字识别。
此外,因对从与添加了非方向信息的线段对应的输入文字模块中得到的线段的个数设定了上限,故可以进行更高精度的文字识别。
Claims (10)
1、一种在线文字识别装置,以文字模块的坐标点数据列作为输入、输出与该输入文字模块对应的文字代码,其特征在于,具有:
输入记述上述输入文字模块时笔划上的坐标点数据列的输入装置;
特征抽出装置,对包含在输入到上述输入装置的坐标点数据列中的按时间顺序排列的坐标点进行折线近似,将这样得到的各直线部分作为线段,抽出各线段的特征信息和作为各线段端点的特征点;
字典存储装置,预先存储字典,该字典对每一个文字都装有构成文字的线段的特征信息和特征点;
特征点对应装置,将根据上述字典中记述的各文字的特征信息和上述从特征抽出装置抽出的特征信息构成上述字典内的各文字的线段与从上述输入文字模块中得到的线段进行对应,并计算线段对应时的距离;
指定区间特征抽出装置,将区间特征信息作为对应笔划特征抽出,该区间特征信息由与上述字典指定的笔划上的特征点组对应的上述输入文字模块的笔划上的特征点组来决定;
特征对照装置,将由上述指定区间特征抽出装置抽出的对应笔划特征与上述字典内的特征信息进行对照,并计算对应笔划特征的距离;和
输出从上述特征对照装置得到的候补文字代码的输出装置,
上述特征对照装置根据算出的对应笔划特征的距离和由上述特征点对应装置算出的线段对应的距离去特定与上述字典内的上述输入文字模块对应的文字。
2、权利要求1记载的在线文字识别装置,其特征在于,上述特征抽出装置在相邻线段的走向近似时将其作为1个线段进行结合。
3、权利要求1记载的在线文字识别装置,其特征在于,上述特征点对应装置将上述输入文字模块的坐标点分别与上述字典内的文字的各笔划的起始点和终点一一对应,
上述指定区间特征抽出装置把与上述起始点对应的上述输入文字模块的特征点和与上述终点对应的上述输入文字模块的特征点作为特征点组。
4、权利要求1记载的在线文字识别装置,其特征在于,上述特征对照装置在特定上述字典内的文字时,对上述对应笔划特征的距离和上述线段对应的距离进行加权。
5、权利要求1记载的在线文字识别装置,其特征在于,与上述各线段有关的信息中包括各线段的方向和长度,
上述特征点对应装置根据上述特征抽出装置算出的各线段的方向和长度算出对应的各线段的值,再根据该值算出线段对应的距离。
6、权利要求5记载的在线文字识别装置,其特征在于,上述特征点对应装置使某些线段不和另一些线段对应,这些线段是与作为构成上述字典中的文字的部分表现出来的笔划对应的线段,而另一些线段是与在构成上述输入文字模块的笔划中没有表现出来的部分对应的线段。
7、权利要求5记载的在线文字识别装置,其特征在于,上述字典存储装置存储字典,该字典将非方向信息添加到与指定的线段有关的特征信息中,
上述特征点对应装置将根据添加了非方向信息的线段算出的值作为恒定值。
8、权利要求7记载的在线文字识别装置,其特征在于,将非方向信息添加到与某些线段有关的特征信息中,这些线段被认为是在构成上述字典内的文字的线段中与输入文字模块对照其方向杂乱无章的线段。
9、权利要求7记载的在线文字识别装置,其特征在于,上述特征点对应装置将根据添加了非方向信息的线段算出的值作为0。
10、权利要求7记载的在线文字识别装置,其特征在于,上述特征点对应装置对从与添加了非方向信息的线段对应的上述输入文字模块中得到的线段数设定上限。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04864897A JP3657077B2 (ja) | 1997-03-04 | 1997-03-04 | オンライン文字認識装置 |
JP48648/97 | 1997-03-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1201207A true CN1201207A (zh) | 1998-12-09 |
CN1096043C CN1096043C (zh) | 2002-12-11 |
Family
ID=12809190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98105119A Expired - Fee Related CN1096043C (zh) | 1997-03-04 | 1998-03-02 | 在线文字识别装置 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP3657077B2 (zh) |
KR (1) | KR100301216B1 (zh) |
CN (1) | CN1096043C (zh) |
TW (1) | TW399187B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101973A (zh) * | 2018-08-06 | 2018-12-28 | 掌阅科技股份有限公司 | 文字识别方法、电子设备、存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4817297B2 (ja) * | 2006-02-10 | 2011-11-16 | 富士通株式会社 | 文字検索装置 |
US20080049969A1 (en) * | 2006-08-25 | 2008-02-28 | Jason David Koziol | Methods And Systems For Generating A Symbol Identification Challenge For An Automated Agent |
-
1997
- 1997-03-04 JP JP04864897A patent/JP3657077B2/ja not_active Expired - Fee Related
-
1998
- 1998-01-22 TW TW087100891A patent/TW399187B/zh not_active IP Right Cessation
- 1998-02-25 KR KR1019980005891A patent/KR100301216B1/ko not_active IP Right Cessation
- 1998-03-02 CN CN98105119A patent/CN1096043C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101973A (zh) * | 2018-08-06 | 2018-12-28 | 掌阅科技股份有限公司 | 文字识别方法、电子设备、存储介质 |
CN109101973B (zh) * | 2018-08-06 | 2019-12-10 | 掌阅科技股份有限公司 | 文字识别方法、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
TW399187B (en) | 2000-07-21 |
JPH10247221A (ja) | 1998-09-14 |
KR19980079762A (ko) | 1998-11-25 |
JP3657077B2 (ja) | 2005-06-08 |
KR100301216B1 (ko) | 2001-11-30 |
CN1096043C (zh) | 2002-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jain et al. | Document representation and its application to page decomposition | |
Awal et al. | First experiments on a new online handwritten flowchart database | |
CN1162803C (zh) | 票单类判别装置和方法 | |
CN1218274C (zh) | 在线手写文字模式识别编辑装置及方法 | |
EP1239406B1 (en) | Device and method for character recognition and for recognition of mathematical expressions | |
CN1207664C (zh) | 对语音识别结果中的错误进行校正的方法和语音识别系统 | |
CN101866417B (zh) | 一种手写体维吾尔字符识别方法 | |
Pradeep et al. | Neural network based handwritten character recognition system without feature extraction | |
CN1163841C (zh) | 在线手写中文字识别装置 | |
CN102663378B (zh) | 连笔手写字符的识别方法 | |
CN1488120A (zh) | 用于识别手写字符的方法、装置和计算机程序 | |
CN1019698B (zh) | 手写字符识别装置及方法 | |
CN1260524A (zh) | 手写汉字自动分割和识别方法以及使用该方法的系统 | |
CN112651323B (zh) | 一种基于文本行检测的中文手写体识别方法及系统 | |
CN1484810A (zh) | 用于识别在输入区上手动描划字符的方法和设备 | |
CN1279796A (zh) | 字符识别装置 | |
CN1096043C (zh) | 在线文字识别装置 | |
Rahiman et al. | A detailed study and analysis of ocr research in south indian scripts | |
Xiu et al. | Offline handwritten arabic character segmentation with probabilistic model | |
CN1029534C (zh) | 自由书写联机手写汉字识别方法及其系统 | |
Naik et al. | Recognizing offline handwritten mathematical expressions (ME) based on a predictive approach of segmentation using K-NN classification | |
Ramakrishnan et al. | Development of OHWR system for Kannada | |
Kassis et al. | Learning free line detection in manuscripts using distance transform graph | |
AlKhateeb | Word based off-line handwritten Arabic classification and recognition. Design of automatic recognition system for large vocabulary offline handwritten Arabic words using machine learning approaches. | |
Shirali-Shahreza et al. | Persian/Arabic text font estimation using dots |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20021211 |