CN1201955A - 文字识别装置及文字识别方法 - Google Patents

文字识别装置及文字识别方法 Download PDF

Info

Publication number
CN1201955A
CN1201955A CN98108373A CN98108373A CN1201955A CN 1201955 A CN1201955 A CN 1201955A CN 98108373 A CN98108373 A CN 98108373A CN 98108373 A CN98108373 A CN 98108373A CN 1201955 A CN1201955 A CN 1201955A
Authority
CN
China
Prior art keywords
stroke
mentioned
feature
straight line
rectilinear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98108373A
Other languages
English (en)
Other versions
CN1093966C (zh
Inventor
川又武典
依田文夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN1201955A publication Critical patent/CN1201955A/zh
Application granted granted Critical
Publication of CN1093966C publication Critical patent/CN1093966C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

目的在于高精度且高速识别文字。由输入单元1输入手写文字(输入图形),由笔划提取单元2提取构成输入手写文字的笔划特征,由笔划分类单元4根据该特征将笔划分类为直线笔划、非直线笔划和后继字笔画,将由直线笔划对应连接单元5、非直线笔划对应连接单元7和后继字笔划对应连接单元8进行分类的各笔划的特征和笔划特征辞典3中存储的识别对象文字(标准图形)的笔划特征对应连接,由文字评价单元10根据该结果识别手写文字。

Description

文字识别装置及文字识别方法
本发明涉及读取用笔在输入板上所写的手写文字并对手写体进行文字识别,涉及一种文字识别装置及文字识别方法,该方法是将手写文字分成构成文字的各笔划,根据分类的笔划的特征来识别所识别的对象文字。
先有的吸收笔顺变化及画数变化二者的在线手写文字识别装置以特征点串记述手写文字的笔划,笔划结合是根据按笔顺进行的假定,使用过剩对应解除型和不足对应解除型的两个互补的最优对应连接算法,通过使包括笔顺·画数变化的手写文字图形的笔划和由笔顺·画数合乎标准的楷体表示的标准文字图形的笔划一一对应来吸收笔顺变化,对于未对应的笔划,利用在前后笔划结合时的距离最小的对应连接来吸收画数变化,进行文字识别(由笔划对应连接进行的在线手写汉字识别,NTT R & D第45卷第11期,1996)。
例如,图34是表示先有例中所示的吸收笔顺·画数变化的先有装置的结构框图。图34中,201是输入用笔在输入板上所写的手写文字即输入图形的输入单元,202是进行输入图形的样本化和位置大小等规范化的前处理单元,203是将构成输入图形的各笔划以等间隔刻上的点作为特征点提取的特征点提取单元,204是存储了由以标准笔顺·画数所写的多个楷体文字制作的平均文字图形即标准图形的标准图形字典,205是计算输入图形的笔划和标准图形的笔划的笔划间距离的笔划间距离计算单元,206是利用两种互补的搜索算法使输入图形的笔划与标准图形的笔划一一对应连接而吸收笔顺变化的笔划一一对应连接单元,207是通过将标准图形中未对应的笔划与前后笔划结合来吸收画数变化的选择笔画结合单元,208是根据对应连接结果来计算图形间距离的图形间距离计算单元,209是控制各单元的控制单元。
使用图34的框图说明先有例的动作。首先,控制单元209指示输入单元201取得输入图形。
接着,控制单元209将由输入单元201输入的输入图形送到前处理单元202,进行样本化和位置大小的标准化。
控制单元209将前处理后的输入图形送到特征点提取单元203,将输入图形变换成以等间隔在输入图形的各笔划上刻的特征点串。
控制单元209将输入图形的特征点串送往一一对应笔画连接单元206。一一对应笔画连接单元206以笔划数少的一方的笔划为基准,将输入图形和标准图形字典204的标准图形进行对应连接,使各特征点没有过剩的对应连接(过剩对应解除型的对应连接算法)。
接着,一一对应笔划连接单元206以笔划数多的一方的笔划为基准,将输入图形和标准图形字典204的标准图形进行对应连接,使各特征点没有不足的对应连接(不足对应解除型的对应连接算法)。
在由上述两种对应连接的算法所得的对应连接的结果中,将距离小的结果作为由一一对应笔划连接单元206最终得到的结果。
这里,在对应连接时由笔划间距离计算单元205计算的距离中,采用将始点间及终点间的距离之和被二除所得的值即端点匹配距离,以及使点数少的一方的笔划的点从点数多的一方的笔划开头的点开始顺序地对应连接、算出点间距离的和后乘以点数比的值的部分匹配。
接着,选择的笔划结合单元207使由一一对应笔划连接单元206对应连接的笔划与笔划多的一方的笔顺一致后改变行。对一一对应笔划连接单元206未对应连接的笔划,根据「按照笔顺生成笔划结合」的假设来进行笔划结合。
具体地说,对于比由一一对应笔划连接单元206对应连接的笔划的开头笔划先书写的未对应的笔画,依笔顺顺序与开头笔划结合。同样,对比最终笔划还后写的未对应的笔划,依笔划顺序与最终笔划结合。其他未对应笔划存在于由一一对应笔划连接单元206对应连接的笔划的任意笔划间,所以,将未对应的笔划与前后的笔划暂时结合,通过使两个笔划间的距离为最小的地方断开来分成两个笔划。
这里,在选择的笔划结合单元207中,以等间隔去掉点数多的一方的笔划的点,使之与点数少的一方的点数一致后对应连接,计算点间距离的和,使用用点数少的一方的点数除得的值即整体匹配距离。然而,为了高速处理,在大分类处理中使用端点匹配距离。
最后,根据对应连接的结果,对结合笔划进行适当的距离规范化,计算最终的距离,将距离最小的文字作为识别结果。
在以上说明的吸收现有例的笔顺·画数变化的文字识别装置中,使用以等间隔对手写文字的各笔划刻的特征点串来计算笔划间距离,所以,存在着由撇捺等噪声成分和笔划变形、位置偏移引起的特征点的坐标值的偏移影响笔划距离、成为误读原因的问题。
还有,在汉字等笔画多的文字中,各笔划多由简单的直线笔画构成,所以,笔划中的特征点即使不包括重要信息也没有关系,由于用特征点值进行对应连接,因此,在对应连接时要花费时间,存在着容易受坐标值偏移影响的问题。
另外,划数变化吸收时,为了减少计算量,而使用「按照笔顺生成笔划结合」的假设,在划数变化不产生按照笔顺的变化时,存在不能对应的问题。
本发明系为解决上述问题而完成的,其目的在于提供这样的文字识别装置与文字识别方法,即能够完全地进行笔顺·笔画变化的手写文字的笔划与笔划特征辞典的笔划对应连接,难以受笔划局部变形和位置偏移的影响,实现高精度的识别,还能够高速地进行文字识别。
有关本发明的第一方面,包括:输入单元,在线输入手写文字;笔划特征辞典,对多个识别对象文字,预先存储构成各识别对象文字的直线笔划及非直线笔划的特征;笔划特征提取单元,从由上述输入单元输入的上述手写文字提取构成该手写文字的笔划的特征;笔划分类单元,根据由笔划特征提取单元提取的特征,将上述手写文字的各笔画分类为上述直线笔划、上述非直线笔划或不可与构成上述识别对象文字的笔划对应连接的连续字笔划的某一个;直线笔划对应连接单元,进行由该笔划分类单元分类的直线笔划的特征与上述笔划特征辞典中存储的构成识别对象文字的直线笔划的特征的对应连接;非直线笔划对应连接单元,进行由该笔划分类单元分类的非直线笔划的特征与上述笔划特征辞典中存储的构成识别对象文字的非直线笔划的特征的对应连接;后继字笔划对应连接单元,将由上述笔划分类单元分类的后继字笔划分为上述直线笔划或上述非直线笔划,进行该分割的直线笔划或非直线笔划的特征与上述笔划特征辞典中存储的构成识别对象文字的直线笔划或非直线笔划的特征的对应连接;文字评价单元,根据由上述直线笔划对应连接单元、上述非直线笔划对应连接单元或上述后继字笔划对应连接单元所得的对应连接结果,识别上述手写文字。
有关本发明的第二方面,还包括笔划对应连接确定单元,根据由上述笔划特征提取单元提取的特征,确定上述手写文字的各笔划的存在区;上述直线笔划对应连接单元、上述非直线连接笔划对应连接单元或上述后继字笔划对应连接单元进行与由上述可对应连接区确定单元确定的各笔划存在区对应的、构成存储在上述笔划特征辞典中的识别对象文字的直线笔划或非直线笔划的特征的对应连接。
有关本发明的第三方面,上述非直线笔划对应连接单元对由上述直线笔划对应连接单元对应连接的上述识别文字进行对应连接。
有关本发明的第四方面,上述后续字笔划对应连接单元对由上述直线笔划对应连接单元或上述非直线笔划对应连接单元对应连接的上述识别对象文字进行对应连接。
有关本发明的第五方面,包括:在线输入手写文字的输入步骤;从由上述输入步骤输入的上述手写文字提取构成该手写文字的笔划的特征的笔划特征提取步骤;根据由该笔划特征提取步骤提取的特征,将上述手写体文字的各笔划分类成上述直线笔划、上述非直线笔划及不可与构成上述识别对象文字的笔划对应连接的后继字笔划中的一个的笔划分类步骤;进行由该笔划分类步骤分类的直线笔划特征与构成上述笔划特征辞典中存储的识别对象文字的直线笔划的特征的对应连接的直线笔划对应连接步骤;进行由上述笔划分类步骤分类的非直线笔划的特征与构成上述笔划特征辞典中存储的识别对象文字的非直线笔划的特征的对应连接的非直线笔划对应连接步骤;将由上述笔划分类步骤分类的后继字笔划分割成上述直线笔划或上述非直线笔划、进行将该分割的直线笔划或非直线笔划的特征与构成上述笔划特征辞典中存储的识别对象文字的直线笔划或非直线笔划的特征对应连接的后继字笔划对应连接步骤;以及根据上述直线笔划对应连接步骤、上述非直线笔划对应连接步骤或上述后继字笔划对应连接步骤所得的对应连接结果识别上述手写文字的文字评价步骤。
有关本发明的第六方面,包括根据由上述笔划特征提取步骤提取的特征确定上述手写文字的各笔划的存在区的笔划可对应连接区确定步骤;
上述直线笔划连接步骤、上述非直线笔划连接步骤或上述后继字笔划对应连接步骤进行与上述可对应连接区确定步骤确定的各笔划的存在区对应的、构成存储在与各笔划的存在区相对应的上述笔划特征辞典中的识别对象文字的直线笔划或非直线笔划的特征的对应连接。
有关本发明的第七方面,上述非直线笔划对应连接步骤对由上述直线笔划对应步骤对应连接的上述识别对象文字进行对应连接。
有关本发明的第八方面,上述后继字笔划对应连接步骤对由上述直线笔划对应步骤或上述非直线笔划对应连接步骤对应连接的上述识别对象文字进行对应连接。
图1是实施例1的文字识别装置的结构图。
图2是表示实施例1的文字识别装置的处理流程的流程图。
图3是表示实施例1的输入单元1中写入的输入图形”亞”的示意图。
图4是表示实施例1的由笔划特征提取单元2提取的输入图形的笔划特征的示意图。
图5是表示将实施例1的笔划特征中的笔划方向、虚拟笔划方向量化为16个方向用的分配图。
图6是表示实施例1的笔划分类单元的处理流程的流程图。
图7是表示实施例1的笔划分类单元求取方向分量分布时使用的8个方向分量分布图。
图8是表示实施例1的直线笔划对应连接装置5的处理流程的流程图。
图9是表示实施例1的笔划可对应连接区确定单元6在直线笔划的对应连接时使用的区域分割图。
图10是表示实施例1的笔划可对应连接区确定单元6使用的对应连接区域确定用的信息图。
图11是表示实施例1的输入笔划可对应连接区的图。
图12是表示实施例1的笔划特征辞典中的文字”亞”的标准图形的笔划串图。
图13是表示实施例1的笔划特征辞典中的文字”亞”的标准图形中的笔划特征图。
图14是表示根据实施例1的直线笔划对应连接单元5、非直线笔划对应连接单元7、后继字笔划对应连接单元8中使用的笔划形状而可否对应连接的图。
图15是表示实施例1的直线笔划对应连接单元5中的候选笔划的一览形态图。
图16是表示实施例1的非直线笔划对应连接单元7的处理流程的流程图。
图17是表示实施例1的后继字笔划对应连接单元8的处理流程的流程图。
图18是表示实施例1的笔划可对应连接区确定装置6在直线笔划以外的对应连接情况下使用的区域划分图。
图19是表示实施例1的输入图形的各笔划存在于笔划可对应连接区确定装置6中使用的哪个区中的图。
图20是表示实施例1的步骤S54的详细处理流程的流程图。
图21是表示实施例1的标准图形的笔划的特征点的图。
图22是表示以一定的间隔对实施例1的输入图形的笔划进行取样的取样点的图。
图23是表示实施例1的标准图形的特征点和输入图形的取样点的对应连接结果的图。
图24是表示使实施例1的输入图形与标准图形的笔划一致而分解的笔划的图。
图25是表示由实施例1的输入单元1写的文字“言”的各笔划的图。
图26是表示实施例1的输入图形的各笔划存在于笔划可对应连接区确定单元6中使用的哪个区中的图。
图27是表示实施例1的笔划特征辞典3中的文字“言”的标准图形的图。
图28是表示实施例1的局部笔划的对应连接的详细处理流程的流程图。
图29是表示实施例1的输入图形的后继字笔划的分解候选点的图。
图30是表示实施例1的局部笔划的图。
图31是表示图28中步骤S 72的处理的详细流程的流程图。
图32是表示由图30中的局部笔划获得的分解笔划的图。
图33是表示由局部笔划获得的分解笔划的图。
图34是现有的在线文字识别装置的结构图。
(实施例1)
下面,参照附图说明实施例一。
图1是本发明的文字识别装置的结构图。
图中,1是向输入板型的输入装置中手写输入文字的输入单元;2是从输入单元1输入的手写文字中提取构成手写文字的笔划的特征的笔划特征提取单元;3是对多个识别对象文字预先存储按照正确的笔顺书写的各识别对象文字即构成标准图形的直线笔划及非直线笔划的笔划特征的笔划特征辞典;4是根据笔划特征提取单元2提取的特征,将手写文字的各笔划分类为直线笔划、非直线笔划、后继字笔划之一的笔划分类单元;5是进行由上述笔划分类单元4分类的直线笔划的特征与构成笔划特征辞典3中存储的标准图形的直线笔划的特征的对应连接的直线笔划对应连接单元;6是根据由笔划特征提取单元2提取的特征确定手写文字的各笔划的存在区的笔划可对应连接区域确定单元;7是进行由笔划分类单元4分类的非直线笔划的特征与构成笔划特征辞典3中存储的标准图形的非直线笔划的特征的对应连接的非直线笔划对应连接单元;8是将用笔划分类单元分类的后继字笔划分割为直线笔划或非直线笔划,并进行该分割的直线笔划或非直线笔划的特征同构成笔划特征辞典3中存储的标准图形的直线笔划或非直线笔划特征的对应连接的后继字笔划对应连接单元;9是根据后继字笔划制作局部笔划的局部笔划制作单元。
10是根据由直线笔划对应连接单元5、非直线笔划对应连接单元7、后继字笔划对应连接单元8得的对应连接结果计算文字的评价值、识别手写文字的文字识别单元,11是控制各单元的控制单元。
图2是表示图1所示文字识别单元的处理流程的流程图。
使用表示图2中的文字识别单元的处理流程的流程图来说明处理顺序的例子。
首先,在步骤S1,由输入单元1用笔将文字写入输入板型的输入装置中。
图3是表示向输入单元1输入的手写文字的输入图形”亞”的图,60-65是按时间顺序输入的笔划。在该例中,进行笔顺和画数都不规范的书写,由六个笔划构成。
进到步骤S2,由笔划特征提取单元2提取构成手写文字的输入图形的各笔划的特征。在该例中,提取图3中的输入图形的笔划60-65的笔划特征。
图4是由笔划特征提取单元2提取的输入图形的笔划特征,示出了从图3中的输入图形的笔划60-65得到的笔划特征。在该笔划特征中,为了在16方向上量化图5所示的笔划而利用进行方向配置的16方向分布图来计算笔划方向及将一个笔划与下一笔划实际连接时未书写的假想笔划的方向。
接着,进到步骤S3,笔划分类单元4按其形状来对输入图形的笔划进行分类。
图6是表示笔划分类单元4的处理流程的流程图。使用图6的流程图来详细说明笔划分类单元4的动作。
首先,在图6的步骤S10中,笔划分类单元4从开头笔划开始依次判断当前的笔划是否为直线笔划,在是直线笔划的情况下进到步骤S11,在此外的情况下进到步骤S13。在图3的输入图形中,根据图4的笔划特征的形状而将五个笔划60、61、62、63、65判断为直线笔划,进入到步骤S11。
在步骤S11,笔划分类单元4提取笔划的方向成分分布。笔划的方向分布由用直线连接以适当间隔将输入笔划采样的点而成的各直线的方向分布来计算。这里,在笔划分类单元4计算方向分布时,使用图7所示的8方向成分分布。
进到步骤S12,笔划分类单元4检查所求的方向成分是否只在一定的方向上,只在一定的方向时,进入步骤S15,判定为直线笔划,除此之外就进到步骤S13。在图3的输入图形的例中,由于所有直线笔划都只具有一定方向上的成分,所以,进到步骤S15,判定为是直线笔划。
在方向成分不是只在一定方向时,在步骤S13,笔划分类单元对具有多个方向成分的直线笔划及直线之外的笔划检查是否为笔划特征辞典3中存在的笔划形状,在是辞典中不存在的笔划的情况下,进到步骤S16,判定为后继字笔划。在是辞典中存在的笔划的情况下,进入步骤S14,判定为非直线笔划。在图3的输入图形的例中,由于未知的笔划64是辞典中不存在的笔划,所以,进入步骤S16,判定为是后继字笔画。
接着,进入图2的步骤S4,控制单元11将在笔划分类单元4中判定为直线笔划的笔划送到直线笔划对应连接单元5,进行输入图形的直线笔划与笔划特征辞典3的标准图形的直线图笔划的对应连接。在图3所示的输入图形的例中,将直线笔划60、61、62、63、65送到直线笔划对应连接单元5。
图8是表示直线笔划对应连接单元的处理流程的流程图。使用图8的流程图来说明直线笔划对应连接单元5的动作。
首先,直线笔划对应连接单元5在步骤S21中根据长度而将各直线笔划分成三种(长、中、短)。笔划的长度由笔划始点和终点的欧几里德距离来求取。在本例中,将长笔划定义为大于70,将短笔划定义为小于30,将中间笔划定义为其中间值。根据图4的输入图形的笔划特征所示的输入笔划的长度信息,将笔划60、61、62、65分类为长笔划,将笔划63分类为短笔划。
进入步骤S22,直线笔划对应连接单元5根据笔划方向、笔划的始终点坐标及笔划的长度,由笔划可对应连接区确定单元6确定笔划的存在区。
图9是表示在直线笔划的对应连接中使用的区域分割的一例。这里,示出了利用由外接矩形将文字在水平方向、垂直方向分割成四份的区域来确定笔划的存在区的情况例。
图10是表示在笔划可对应连接确定单元6中使用的区域确定用的信息。图10中的笔划的方向表示用图5的16方向分布图将从笔划的始点到终点的方向量化的值。例如,对图10的水平直线笔划来说,笔划方向表示有与4、5、6、12、13、14方向的标准图形的水平笔划对应连接的可能性。还有,区1中存在的水平直线笔划表示有可与区1、区2中存在的水平直线笔划对应连接的可能性。
如图10所示,笔划可对应连接区确定单元6判断为在与输入图形的笔划方向垂直的方向上的距离变化少、比较稳定,一直到相邻区为止都是存在区。但是,在跨过多个区的情况下,与该多个区域相邻的区域都成为存在区。
图11表示对图3的输入图形的笔划的存在区及可对应连接区。
进入步骤S23,直线笔划对应连接单元5对输入图形的笔划确定成为对应连接对象的笔划特征辞典3的标准图形的笔划。
图12是表示笔划特征辞典3中存储的文字”亞”的标准图形的笔划的图。图13是笔划特征辞典3中存储的图12的标准图形的笔划特征。
作为可对应连接的条件,有用1)笔划的形状条件、2)笔划的长度条件、3)笔划的可对应连接区的条件这三个条件确定成为对应连接对象的标准图形的笔划。
图14是表示是否可根据笔划形状进行对应连接的图,是确定可否与在直线笔划对应连接单元5、非直线笔划对应连接单元7、后继字笔划对应连接单元8使用的笔划形状进行对应连接的图。
具体地说,笔划的形状条件是图14所示的对应关系,即输入图形的笔划形状和标准图形的笔划形状,连接“○”的对应连接作为可对应连接,连接“×”的作为不可对应连接。
还有,笔划的长度条件是长笔划可以和长笔划或中间笔划对应连接,中间笔划可以和长笔划及短笔划对应连接,短笔划可以和中间笔划或短笔划对应连接。还有,笔划可对应连接区的条件使用笔划可对应连接区确定单元6的结果。
在该例中,对图12的标准图形,将图13的笔划特征存储在笔划特征辞典3中。根据该笔划特征,对输入图形的各笔划确定可对应连接的标准图形的笔划。
在本实施例中,对图3的输入图形的各笔划,确定可对应连接的标准图形的笔划。
图15是表示根据笔划形状条件、笔划的可对应连接区条件及笔划的长度条件归纳的可对应连接的标准图形的笔划的情况的图。这里,按照各条件进行的归纳只是将至此归纳的内容作为对象依次进行。
根据图15,笔划60被归纳到笔划70和73中,笔划61被归纳到笔划74、75中,笔划62被归纳到笔划75中,笔划63被归纳到笔划71中,笔划65被归纳到笔划73、76中。这里,对归纳成一个的笔划,不存在此外的对应,归纳成一个的标准笔划不能在其他输入笔划的对应连接中使用。这里,由于笔划71、75被归纳成一个,所以,从其他输入笔划的候选笔划中除去笔划71、75。因此,笔划61被归纳到笔划74中,最后,只存在笔划60、笔划65两个候选笔划。
接着,进入步骤S24,直线笔划对应连接单元5对输入图形的笔划详细地进行与标准图形的候选笔划的对应连接,对应连接成功的结果作为全部直线笔划的对应连接结果。
这里,在详细对应连接的检验中,对笔划方向、笔划宽度、笔划高度及笔划的始终点的坐标值,将其与预先确定的对应连接的阈值进行比较,检验是否可对应连接以及在哪里连接。此时,在输入笔划与标准图形的连续笔划对应连接时,也使用虚拟笔划的对应连接结果检验对应连接。
另外,为吸收输入图形的笔划变化,即使在输入图形与标准图形的笔顺不同时,也对可与各输入图形的笔划对应连接的标准图形的笔划的全部候选笔划进行对应连接。
具体地说,用图4的输入图形的笔划特征与图13的标准图形的笔划特征进行比较。
在该例中,对输入图形的笔划61、62、63,已经对应连接的候选被归纳到一个中,由于任何笔划都能正确对应连接,所以,对应连接成功。对笔划60、65,由于存在两个候选,所以,对各输入图形的笔划分别对应连接标准图形的候选笔划。即,对输入图形的笔划60对应连接标准图形的笔划70及笔划73,对笔划65对应连接笔划73及笔划76。
首先,对输入图形的笔划60的对应连接处理进行说明。进行笔划60与标准图形的笔划70、73的对应连接。这里,在笔划60与笔划73对应连接的情况下,始终点的Y坐标值的差变大。还有,如果使用表示笔划间的位置关系的虚拟笔划检验对应连接结果的话,则由图13可知,在笔划73的情况下,指向下一笔划74的虚拟笔划的方向为“16”。在笔划60的情况下,与辞典中的标准笔划74对应连接的输入图形的笔划为笔划61,笔划60的虚拟笔划方向成为从笔划60的终点到笔划61的始点的方向,故为“13”。因此,虚拟笔划的方向差为16-13=3。
另一方面,在笔划60与笔划70的对应连接中,始终点坐标值的差减小,虚拟笔划的方向之差减小(对应连接结果的距离减小),是正确的对应连接。
接着,进行笔划65与标准图形的笔划73、76的对应连接。在笔划65与笔划73对应连接的情况下,始终点的坐标值的差(笔划特征的差)变大。另一方面,在笔划65与笔划76对应连接的情况下,笔划特征的差减小,成为正确的对应连接。
结果,直线笔划的对应连接是输入图形的笔划60与标准图形的笔划70对应连接,笔划61与笔划74对应连接,笔划62与笔划75对应连接,笔划63与笔划71对应连接,笔划65与笔划76对应连接,归纳成一种对应连接。
如该例所示,利用上述对应连接处理,输入图形的笔划的笔顺即使与标准图形的笔顺不同,也能对应连接。
进到步骤S25中,直线笔划对应连接单元5在输入图形的直线笔划与标准图形的任一笔划对应的情况下,进入到步骤S27,对应连接为可(OK),在存在未对应的笔划(哪怕只有1个)的情况下,进入到步骤S28,与当前标准图形的对应连接为“不可”(NG)。
在本例中,所有输入图形的直线笔划与标准图形的笔划进行了正确的对应连接。
接着,进到图2的步骤S5中,控制单元11检验直线笔划对应连接结果,在对应连接为“不可”的情况下,进到步骤S8,进行与下一标准图形的对应连接。另外,在对应连接成功的情况下,进到步骤S6中,进行与非直线笔划的对应连接。
图16是表示非直线笔划对应连接单元7的处理流程的流程图。使用图16的所示的流程图,详细说明非直线笔划对应连接单元7的动作。
在步骤S30中,非直线笔划对应连接单元7与直线笔划的情况相同,对非直线笔划,由笔划可对应连接区确定单元6确定与输入图形的笔划对应连接的标准图形的笔划。该对应连接和直线笔划对应连接相同,使用图10的区域确定用的信息图。
这里,输入图形的非直线笔划与标准图形的笔划的对应连接只限于在由上述直线笔划对应连接单元5对应连接的直线笔划存在的标准图形中进行。
进到步骤S31,非直线笔划对应连接单元7除输入图形的笔划形状之外,还进行与标准图形的该笔划的对应连接。
首先,对标准图形的可与在步骤S30的处理中所求的输入图形的各笔划对应连接的笔划,根据笔划形状进行对应连接的检验。笔划形状的对应连接规则使用表示可否进行与图14的笔划形状对应的对应连接的图。
接着,判断为是可对应连接的笔划与直线笔划同样地进行详细的笔划对应连接的检验。
进到步骤S32中,非直线笔划对应连接单元7断定输入图形的笔划为与标准图形的笔划的某一个对应连接时,进到步骤S34,判定为对应连接成功。这里,未对应连接时,看作没有与标准图形的笔划一致的笔划,进到步骤S33中,判断为后续字笔划。
进到步骤S35,非直线笔划对应连接单元7对所有的非直线笔划研究是否进行了对应连接,若没进行就进到步骤S30,进行下一个的非直线笔划的对应连接。还有,在全部对应连接都结束了的情况下,非直线笔划对应连接单元7的对应连接结束。
接着,进到图2的步骤S7,控制单元11由后继字笔划对应连接单元8进行后继字笔划的对应连接。
图17是表示后继字笔划对应连接单元8的处理流程的流程图。下面,使用图17的流程图说明后继字笔划对应连接单元8的动作。
首先,在步骤S50中,后继字笔划对应连接单元8由笔划可对应连接区确定单元6确定输入图形的后继字笔划可对应连接区,求取可与输入图形的后继字笔划对应连接的标准图形的笔划候选。
这里,输入图形的后继字笔划对应连接只限于对由上述直线笔划对应连接单元5和上述非直线笔划对应连接单元7对应连接的直线笔划及非直线笔划存在的标准图形进行。
图18是表示笔划可对应连接区确定单元6在直线笔划之外的对应连接时使用的区域分割的一例的图。笔划可对应连接区确定单元6在图10的用于可对应连接区确定的信息图中所示的笔划之外时,使用图18的区域分割确定笔划可对应连接区。笔划可对应连接区将直到输入图形的笔划的外接矩形所含的区域的一个外侧的区域作为对象。在图3的输入图形的例中,笔划64被判断为后继字笔划,不是图10所示的笔划形状,所以,首先确定包含笔划64的区域。
图19是用图18的区域分割图3的输入图形、求取笔划64的外接矩形80的例子,是表示输入图形的各笔划存在于笔划可对应连接区确定单元6使用的区域的何处的图。由该图可知,笔划64的外接矩形80包含于区域A~H中,笔划的可对应连接区为区域A~L。
接着,后继字笔划对应连接单元8求取确定的可对应连接区中存在的标准图形的笔划。在图12所示标准图形的笔划例的情况下,区域A~L中包括的是笔划70、71、72、73共四个,但是,其中利用直线笔划对应连接单元5和非直线笔划对应连接单元7与输入笔划一一对应连接的标准图形的笔划由于对应连接已确定,所以除去。因此,在本例中,由于笔划70、71由直线笔划对应连接单元确定,所以被除去。结果,笔划72、73被选作候选笔划。
进到步骤S57,后继字笔划对应连接单元8检验是否对所有后继字笔划确定了可对应连接区,若确定了就进到步骤S51,未确定就返回步骤S50。
在图3的输入图形中,由于后继字笔划只有一个,所以,进到步骤S51,确定由输入图形的后继字笔划的开始笔划和结束笔划构成的标准图形的候选笔划。
具体地说,首先,对输入图形的后继字笔划的始终点,用图18的区域分割求取其始终点存在的区域,将直到存在区域的外侧的区域作为可对应连接区。
接着,由与输入图形的后继字笔划的始点存在的可对应连接区对应的标准图形的笔划将包括始点的笔划作为开始笔划的候选来选择。同样,由与输入的后继字笔划的终点存在的可对应连接区对应的标准图形的笔划将包括终点的笔划作为结束笔划的候选来选择。
在图19所示例的情况下,由于输入图形的后继字笔划64的始点存在于区域A,所以,始点的可对应连接区域为区域A、B、E、F。由于在步骤S50的处理所求的标准图形的候选即笔划72、73的始点都包含在该区域中,所以,开始笔划的候选为笔划72、73两个。同样,由于后继的笔划64的终点存在于区域H,所以,可对应连接区为区域C、D、G、H、K、L。这样,终点笔划的候选也为笔划72、73。
进到步骤S52,后继字笔划对应连接单元8检查步骤S51所求的始终点候选的合计笔划数(其中,同一笔划不重复计数)是否小于3,在小于3的情况下,进到步骤S54,在大于3的情况下,进到步骤S53。在图3的后继字笔划的情况下,由于候选笔划数为2,所以,进到步骤S54。
在步骤S54,进行输入图形的后继字笔划与标准图形的候选笔划的对应连接。图20是表示步骤S54的对应连接处理的流程图。使用图20的流程图,详细说明后继字笔划的对应连接。
首先,在步骤S60中,后继字笔划对应连接单元8确定标准图形的候选笔划的笔顺。这里,在步骤S60中,标准图形的候选笔划数一定归纳为三个以下。由于后继字笔划最小二个笔划构成,所以,标准图形的笔划候选为3个时的笔顺组合成为3C2×P2+P3=12种。
同样,标准图形的候选笔划为2个时为2种。
由于最坏情况下是12种,所以是实际时间足可处理的组合,但还由以下两个制约条件来限制组合数。
1)受由步骤S51确定的开始笔划的候选、结束笔划的候选制约
2)受不能删除的笔划的制约
这里,所谓不能删除,是指只与当前输入图形的笔划候选对应的标准图形的笔划。由于在步骤S50的处理中确定可与各输入图形的笔划对应连接的标准图形笔划的候选,所以,删除笔划能够利用该信息来确定。
在输入图形的笔划64的情况下,存在两个候选笔划数,任一笔划都成为开始笔划、结束笔划的候选,由于没有删除笔划,故有两种笔划。在该例中,首先与笔划72、73的笔顺进行对应连接。
进到步骤S61,后继字笔划对应连接单元8进行输入图形的后继字笔划与标准图形的笔划的对应连接。对应连接以特征点值来进行,标准图形的笔划特征点信息在直线笔划时只有始点和终点存在特征点,在直线笔划之外时,在始点、终点及笔划的弯曲点附近都存在特征点,所以,也使用存储在笔划特征辞典3中的该特征点。还有,输入图形的笔划特征点信息成为前处理后由适当间隔表现的采样点。
由图13的标准图形的笔划特征知道,笔划72的特征点信息存在始点、笔划中的特征点和终点三点,笔划73的特征点信息存在始点和终点两点。因而,标准图形的笔划特征点存在五点。图21中的“○”表示所获得的标准图形的笔划特征点。还有,图22中的“○”表示输入图形的后继字笔划64的特征点。
接着,后继字笔划对应连接单元8进行输入图形的笔划特征点与标准图形的笔划特征点的距离最小的对应连接。一般地,输入图形的笔划A与标准图形的笔划B的对应连接通过给出从输入图形的笔划A的特征点的元素串的集合{0,1,……I}向标准图形的笔划B的特征点的元件串的集合{0,1,……J}的映射ω:{0,1,2,……I}→{0,1,2,……J}(式1)来确定。
这里,ω是使笔划A与笔划B的两个端点一致的映射,满足ω(0)=0,ω(1)=J(即,始点、终点一致),是构成元素的顺序不允许反转的单调映射,所以称之为伸缩映射。还有,假设笔划A的第i个元素为ai、笔划B的第j个元素为bj、ai和bj的距离d(ai,bj)为特征点ai和bj间的欧几里德距离、笔划A的第i个元素到笔划B的第j个元素的累计距离为g(i,j),则递归公式为
g(i,j)=d(ai,bi)+min{g(i-1,k)|0≤k≤j}    (式2)
其中g(0、0)=d(a0,b0),g(0,j)=∞(j>0时)成立。
这样,能够用动态规划法求取输入图形的笔划A与标准图形的笔划B的对应连接距离g(I,J)。这里,若记录得出min{g(i-1),k|0≤k≤j}的k值,就得到了特征点间的最佳对应连接信息。就是说,可知标准图形的笔划的各特征点与输入图形的后继字笔划的哪个特征点对应。
如果用动态规划法进行图21的标准图形的笔划的特征点与图22的输入图形的笔划特征点(采样点)的对应连接,则得到对应连接的评价值与图23的箭头所示的对应连接结果。
进到步骤S62,后继字笔划对应连接单元8根据所得的对应连接结果,用笔划特征提取单元2求取分断笔划的笔划特征。为求得笔划特征,首先用与标准图形的笔划的始终点对应连接的特征点分断输入图形的后继字笔划,将始终点所夹的笔划作为分断笔划来提取。
其次,用笔划特征提取单元2提取分断笔划的笔划特征。图24是根据输入图形的笔划64求出分断笔划130、131的例。
进到步骤S63,后继字笔划对应连接单元8对当前的候选笔划的所有的笔顺,检查与输入图形的后继字笔划的对应连接。检查的结果是不利用全部笔划组合进行对应连接时,进到步骤S60,对其他笔顺进行对应连接。
在输入图形的笔划64的情况下,进到步骤S60,按笔划73、72的笔顺进行对应连接。对应连接处理和笔划72、73的情况相同,故省略说明。
这里是笔划72、73的笔顺的情况,但由于输入图形的笔划特征点与标准图形的笔划特征点的距离变小,所以,能够作为正确的部分笔划的对应连接结果来采用。
如果所有笔顺连接都结束,就进到图17的步骤S56,后继字笔划对应连接单元8对当前输入图形的后继字笔划,检查是否对所有后继字笔划进行了对应连接,在结束了对应连接的情况下,结束后继字笔划对应连接单元8的处理,进到图2的步骤S8。在对应连接没结束时,返回到图17的步骤S51。在图3的输入图形中,由于后继字笔划只有一个,所以,条件满足,进到步骤S8。
在步骤S8中,控制单元11检查是否对笔划特征辞典3的所有标准图形进行匹配,在结束时进到步骤S9,在没结束时进到步骤S4,进行与下一标准图形的对应连接。
对图3的输入图形,由于与所有标准图形的对应连接结束,所以,进入步骤S9。
在步骤S9中,控制单元11将直线笔划对应连接单元5、非直线笔划对应连接单元7、后继字笔划对应连接单元8所得的对应连接结果送给文字评价单元10。
文字评价单元10根据所送来的对应连接结果,求取文字的评价值,选择距离最小的识别对象文字(标准图形)作为最终的识别结果。
文字的评价值D由下式3求取。
D=(Wd×Dd+Ww×Dw+Wh×Dh+Wvw×Dvw+Wvh×Dvh+Wvd×Dvd)/k                         (式3)
这里,笔划方向正规化后的距离用Dd表示,笔划宽度正规化后的距离用Dw表示,笔划高度方向正规化后的距离用Dh表示,假想笔划宽度正规化后的距离用Dvw表示,假想笔划高度正规化后的距离用Dvh表示,假想笔划方向正规化后的距离用Dvd表示,Wd表示笔划方向的数,Ww表示笔划宽度的数,Wh表示笔划高度的数,Wvw表示假想笔划宽度的数,Wvh表示假想笔划高度的数,Wvb表示假想笔划方向的数,k表示当前标准图形的画数。还有,Wd+Ww+Wh+Wvw+Wvh+Wvd=1。
但是,在直线笔划、非直线笔划及后继字笔划的对应连接结果存在多个的情况下,考虑不产生与输入图形的任一笔划都不对应连接的未对应标准图形的笔划和一个标准图形的笔划与多个输入图形的笔划对应的矛盾。
接着,对部分笔划提取单元9进行说明。图25是包括用四划书写七划的文字“言”的输入图形的例子。
下面,以图25的输入图形为例,说明部分笔划提取单元9的动作。在本例中,笔划141、142、143是利用直线笔划对应连接单元5和非直线笔划对应连接单元7对应连接的,省略其说明。
笔划140是后继字笔划,故进入图2的步骤S7,由后继字笔划对应连接单元8进行对应连接。
首先,进到图17的步骤S50,后继字笔划对应连接单元8由笔划可对应连接区确定单元6确定输入图形的后继字笔划的可对应连接区,求取可与后继字笔划对应连接的标准图形的笔划候选。
笔划可对应连接区域确定单元6使用图18的区域分割信息确定可对应连接区。可对应连接区域将到包括输入图形的笔划的外接矩形的区域的外侧的区域作为对象。图26是对图25的输入图形进行如图18所示的区域分割的例子。由图26可知,笔划140的外接矩形144包括区域A~L。结果,笔划140的笔划可对应连接区域是全部区域A~P。
后继字笔划对应连接单元8求取在确定的对应连接区存在的标准图形的笔划。图27是文字“言”的标准图形,是在区域A~P中所含的是所有笔划,但由于其中利用直线笔划对应连接单元5和非直线笔划对应连接单元7与输入图形的笔划一一对应连接的标准图形笔划的对应连接已经确定,所以将其除去。在本例中,由于笔划154、155由直线笔划对应连接单元5确定,笔划155由非直线笔划对应连接单元7确定,所以,将其除去。结果,选择笔划150、151、152、153这四个作为候选笔划。
接着,进入图17的步骤S57,后继字笔划对应连接单元8检查是否对所有的后继字笔划确定了可对应连接区;如果确定了就进到步骤S51,如果未确定就进到步骤S50。在图25的输入图形中,由于后继字笔划只存在一个,所以,进到步骤S51,确定由后继字笔划的开始笔划、结束笔划构成的标准图形的候选笔划。
由图26,由于输入图形的笔划140的始点存在于区域B中,所以,可对应连接区域成为区域A、B、C、D、F、G,始点包括在该区域中的标准图形的笔划150、151、152成为开始笔划的候选。同样,笔划152、153成为结束笔划的候选。
进到步骤S52,后继字笔划对应连接单元8检查标准图形的笔划候选数,但在本例中,由于候选字笔划数为4,所以,进到步骤S53。
在步骤S53中,后继字笔划对应连接单元8由部分笔划提取单元9从输入图形的后继字笔划提取部分笔划。
使用图28所示的流程图说明部分笔划提取单元9的动作。
在步骤S70中,部分笔划提取单元9将输入图形的笔划的弯曲点作为部分笔划的分断候选点提取,将部分笔划的始点作为输入图形的笔划的始点。
图29是表示输入图形的后继字笔划的分断点候选的图。在图29中,160~165是输入图形的笔划140的部分笔划分断候选点,160是部分笔划的始点,167是部分笔划的终点。
进到步骤S71,部分笔划提取单元9从输入图形的笔划终点逆向寻找分断点,求取从当前部分的笔划始点到分断点的笔划的候选笔划数小于3的分断点,将该分断点作为部分笔划的终点。在图29的例中,从始点166到分断点候选点160、161、162、163、164、165的部分笔划被首先选中,该部分笔划存在于区域A、B、C、D、E、F、G、I、J、K中,所以,可对应连接区域是全部区域,候选笔数4仍为4个,所以,进到分断候选点165的前一分断候选点164。同样,沿始点方向将顺序分断点移动,求取部分笔划,提取其候选笔划。在本例中,由于从始点166到分断候选点160、161、162的部分笔划的候选笔划数为3,所以,选择该笔划作为部分笔划。
进到步骤S72,后继字笔划对应连接单元8进行所得的部分笔划与候选笔划的对应连接。
图31是表示步骤S72的处理流程的流程图。使用图31的流程图说明步骤S72的处理。
在步骤S80中,利用部分笔划的外接矩形与各候选笔划的外接矩形计入可对应连接的候选。具体地说,在用规定的阈值展开部分笔划的外接矩形的区域中选择包括外接矩形的候选笔划。图30的180是展开的部分笔划的外接矩形。在本例中,将候选笔划150、151、152中的笔划152从候选中除去。
进到步骤S81,后继字笔划对应连接单元8与候选笔划数小于3的情况相同,确定标准图形的候选笔划的笔顺。
这里,在当前部分笔划包括输入图形的后继字笔划的始点时或包括开始笔划的候选、终点的情况下,笔顺组合的确定也使用结束笔划的候选即信息。当前的部分笔划的候选笔划数存在两个,任一笔划都满足开始笔划的条件,所以,成为两种笔顺。
这里,首先进行笔划150、151的笔顺的对应连接。
进到步骤S82,后继字笔划对应连接单元8进行部分笔划和标准图形的候选笔划的对应连接。对应连接的方法和图20的步骤S61相同(与上述后继字笔划对应连接时相同)。在图20的步骤S61中,笔划150、151都是直线笔划,各自的始点和终点都成为特征点,利用动态规范求取部分笔划的特征点。
进到步骤S83,后继字笔划对应连接单元8根据所得的对应连接结果分断部分笔划,由笔划特征提取单元2求取该分断的笔划的笔划特征。图32是从图30的部分笔划求取分断笔划190、191的例子。
进到步骤S84,后继字笔划对应连接单元8对当前的候选笔划的全部笔顺检查是否进行了与输入图形的部分笔划的对应连接。检查结果是没对所有组合进行时,进到步骤S81,对其他笔顺进行对应连接。
在本例中,进到步骤S81,进行笔划151、150的其他笔顺的对应连接。对应连接处理和笔划150、151的情况相同,故省略说明。这里,笔划150、151的笔顺的情况是输入图形的笔划特征点与标准图形的笔划特征点的距离减少,所以,被采用来作为正确的部分笔划的对应连接结果。
接着,进到图28的步骤S73,后继字笔划对应连接单元8判断当前的后继字笔划的对应连接是否结束,在结束时进到步骤S75,在没结束时进到步骤S74。
在图29的例中,由于是没有结束,所以进到步骤S74。在步骤S74中,将当前的部分笔划的终点作为下一个部分笔划的始点。在这里,图29的分断候选点162成为下一个部分笔划的始点。
进到步骤S71,后继字笔划对应连接单元8使用部分笔划提取单元9制作下一部分笔划。具体地说,对新的部分笔划,部分笔划提取单元9从部分笔划的终点反向求取分断点,求取从当前的部分笔划的始点到分断点的笔划的候选笔划数小于3的分断点,将该分断点作为部分笔划的终点。
在图29的例中,由于将已确定的笔划150、151从候选去除去,所以,笔划152、153任一个都作为候选。因而,选择由分断候选点162、163、164、165和部分笔划的终点167构成的其余所有的部分笔划。
进到步骤S72,后继字笔划对应连接单元8进行所得的部分笔划与候选笔划的对应连接。
使用图31的流程图说明部分笔划对应连接的动作。
在步骤S80中,利用部分笔划的外接矩形与各候选笔划的外接矩形插入可对应连接的候选。在本例中,候选笔划152、153成为两方都满足条件的对应连接的对象。
接着,进到步骤S81,后继字笔划对应连接单元8确定笔顺。由于当前的部分笔划的候选笔划数存在两个,任一笔划都满足结束笔划的条件,所以,成为两种笔划。
这里,首先进行接笔划152、153的笔顺的对应连接。
进入步骤S82,后继字笔划对应连接单元8进行部分笔划与标准图形的候选笔划的对应连接。对应连接的方法与图20的步骤S61相同,由于笔划152、153都是直线笔划,所以,各始终点都是特征点,用动态规范法进行与部分笔划的特征点的对应连接。
这里,由于当前的部分笔划的始点162和到该点为止的部分笔划的终点一致,所以,存在着在其间存在实际上在笔划和笔划间没有书写的假想笔划成分的情形。因此,进行将分断候选点162作为始点的对应连接和将下一个分断候选点163作为始点的对应连接,将距离小的一种作为最终结果。在本例中,选择将分断候选点163作为始点的对应连接。
进到步骤S83,后继字笔划对应连接单元8从所得的对应连接结果分断部分笔划,用笔划特征提取单元2求取其笔划特征。图33是从部分笔划求取分断笔划192、193的例子。
进到步骤S84,后继字笔划对应连接单元8对当前的候选笔划检查是否对所有笔顺都进行了与输入图形的部分笔划的对应连接。当检查结果是没有对所有组合进行的情况下,进到步骤S81,进行对其他笔顺的对应连接。
在本例中,进行步骤S81,以笔划153、152的笔顺进行对应连接,对应连接处理和笔顺152、153的情况相同,故省略说明。这里是笔顺152、153的笔顺的情况,但由于输入图形的笔划特征和标准图形的笔划特征点的距离减少,所以,被采用来作为正确的部分笔划的对应连接结果。
接着,进到图28的步骤S73,后继字笔划对应连接单元8判断当前的后继字笔划的对应连接是否结束,结束时就进到步骤75,没结束时就进到步骤S74。在本例中,由于已经结束,所以进到步骤S75。
在步骤S75中,后继字笔划对应连接单元8根据各个部分笔划的对应连接结果求取后继字笔划的对应连接结果。这里,由于在各个部分笔划中对应连接两个标准图形的笔划,所以,把将两者按部分笔划的顺序排列的笔划作为最终的后继字笔划采用。
在本例的情况下,在标准图形的笔划中没有对应连接的笔划虽然存在,但在没对应连接的笔划存在的情况下,包括没有对应连接的笔划后进行与连接了连续的部分笔划的笔划的对应连接、对应连接的距离变小时,采用该笔划。此时,在各个部分笔划间插入的标准图形的笔划数只有一个。
利用上述处理,从后继字笔划提取部分笔划的笔划对应连接结束,由文字评价单元10计算最终的文字的评价值,确定识别结果。
还有,在本实施例中,在后继字笔划的对应连接中使用的是特征点的坐标信息,但也可以以一定间距对笔划进行采样、使用该采样点间的方向码进行对应连接。
还有,在本实施例中,为确定笔划可对应连接区,使用的是将文字分割成4×1、1×4、4×4的区域(分别表示水平方向×垂直方向的分割区域),但分割数可以是任意的数。
还有,在本实施例中,将后继字笔划的分断候选点作为弯曲点,但也可使用按一定间隔采样的点。
如上,根据本实施例,对于没有接着书写的笔划,只由笔划特征进行对应连接,只对未对应连接的笔划使用细的特征点信息进行对应连接,并且只使用笔划的特征进行最终评价,所以,可高速地进行文字识别,同时能够对文字变形实现强识别方式。
还有,不只是没有接着书写的笔划,对于接着书写的笔划也进行笔顺的对应连接,也可以高精度地进行文字识别。
还有,对于接着书写的笔划,分割成部分笔划后进行对应连接,所以,处理时间不增加就可进行考虑了笔顺变化的对应连接。
还有,将手写文字即输入笔划分类为直线笔划、非直线笔划或后继字笔划,按直线笔划对应连接、非直线笔划对应连接、后继字笔划对应连接的顺序进行对应连接,对于各个对应连接中对应连接失败的标准图形,由于不进行此后的对应连接处理,所以,不进行与不同于正解的标准图形的对应连接,能够进行效率高的对应连接处理,可高速地进行文字识别。
还有,由于按笔划的始点、终点值的特征点进行后继字笔划的对应连接,所以,对应连接能够高速进行,并且可将笔划特征辞典的容量抑制得小。
本发明如上所述那样构成,所以,实现了下面所述的效果。
在本发明的第一或第五方向中,根据在输入板上书写的手写文字(输入图形)的笔划形状,将笔划分类为直线笔划、非直线笔划和后继字笔划,将各笔划的特征和标准图形(识别对象文字)的笔划特征对应连接,即使是对笔顺、画数变化的输入图形,也能够高速且高精度地进行文字识别。
第二或第六方面由于确定输入图形的各笔划的存在区,将与各笔划的存在区对应的标准图形的笔划与输入图形的笔划对应连接,所以,能够高速地进行文字识别。
第三或第七方面由直接笔划对应连接来对对应连接的标准图形进行输入图形的非直线笔划和标准图形的笔划对应连接,所以,能够高速地进行文字识别。
第四或第八方面由直线笔划对应连接、非直线笔划对应连接来对对应连接的标准图形进行输入图形的后继字笔划和标准图形的笔划的对应连接,所以,能够高速地进行文字识别。

Claims (8)

1.一种文字识别装置,其特征在于,包括:
输入单元,在线输入手写文字;
笔划特征辞典,对多个识别对象文字,预先存储构成各识别对象文字的直线笔划及非直线笔划的特征;
笔划特征提取单元,从由上述输入单元输入的上述手写文字提取构成该手写文字的笔划的特征;
笔划分类单元,根据由笔划特征提取单元提取的特征,将上述手写文字的各笔画分类为上述直线笔划、上述非直线笔划或不可与构成上述识别对象文字的笔划对应连接的连续字笔划的某一个;
直线笔划对应连接单元,进行由该笔划分类单元分类的直线笔划的特征与上述笔划特征辞典中存储的构成识别对象文字的直线笔划的特征的对应连接;
非直线笔划对应连接单元,进行由该笔划分类单元分类的非直线笔划的特征与上述笔划特征辞典中存储的构成识别对象文字的非直线笔划的特征的对应连接;
后继字笔划对应连接单元,将由上述笔划分类单元分类的后继字笔划分为上述直线笔划或上述非直线笔划,进行该分割的直线笔划或非直线笔划的特征与上述笔划特征辞典中存储的构成识别对象文字的直线笔划或非直线笔划的特征的对应连接;
文字评价单元,根据由上述直线笔划对应连接单元、上述非直线笔划对应连接单元或上述后继字笔划对应连接单元所得的对应连接结果,识别上述手写文字。
2.权利要求1记载的文字识别装置,其特征在于:还包括笔划对应连接确定单元,根据由上述笔划特征提取单元提取的特征,确定上述手写文字的各笔划的存在区;
上述直线笔划对应连接单元、上述非直线连接笔划对应连接单元或上述后继字笔划对应连接单元进行与由上述可对应连接区确定单元确定的各笔划存在区对应的、构成存储在上述笔划特征辞典中的识别对象文字的直线笔划或非直线笔划的特征的对应连接。
3.权利要求1记载的文字识别装置,其特征在于:上述非直线笔划对应连接单元对由上述直线笔划对应连接单元对应连接的上述识别文字进行对应连接。
4.权利要求1记载的文字识别装置,其特征在于:上述后续字笔划对应连接单元对由上述直线笔划对应连接单元或上述非直线笔划对应连接单元对应连接的上述识别对象文字进行对应连接。
5.一种文字识别装置的文字识别方法,其中文字识别装置包括对多个识别对象文字预先存储构成各识别对象文字的直线笔划及非直线笔划的特征的笔划特征辞典,其特征在于,包括:
在线输入手写文字的输入步骤;
从由上述输入步骤输入的上述手写文字提取构成该手写文字的笔划的特征的笔划特征提取步骤;
根据由该笔划特征提取步骤提取的特征,将上述手写体文字的各笔划分类成上述直线笔划、上述非直线笔划及不可与构成上述识别对象文字的笔划对应连接的后继字笔划中的一个的笔划分类步骤;
进行由该笔划分类步骤分类的直线笔划特征与构成上述笔划特征辞典中存储的识别对象文字的直线笔划的特征的对应连接的直线笔划对应连接步骤;
进行由上述笔划分类步骤分类的非直线笔划的特征与构成上述笔划特征辞典中存储的识别对象文字的非直线笔划的特征的对应连接的非直线笔划对应连接步骤;
将由上述笔划分类步骤分类的后继字笔划分割成上述直线笔划或上述非直线笔划、进行将该分割的直线笔划或非直线笔划的特征与构成上述笔划特征辞典中存储的识别对象文字的直线笔划或非直线笔划的特征对应连接的后继字笔划对应连接步骤;
以及根据上述直线笔划对应连接步骤、上述非直线笔划对应连接步骤或上述后继字笔划对应连接步骤所得的对应连接结果识别上述手写文字的文字评价步骤。
6.权利要求5记载的文字识别方法,其特征在于,包括根据由上述笔划特征提取步骤提取的特征确定上述手写文字的各笔划的存在区的笔划可对应连接区确定步骤;
上述直线笔划连接步骤、上述非直线笔划连接步骤或上述后继字笔划对应连接步骤进行与上述可对应连接区确定步骤确定的各笔划的存在区对应的、构成存储在与各笔划的存在区相对应的上述笔划特征辞典中的识别对象文字的直线笔划或非直线笔划的特征的对应连接。
7.权利要求5记载的文字识别方法,其特征在于:上述非直线笔划对应连接步骤对由上述直线笔划对应步骤对应连接的上述识别对象文字进行对应连接。
8.权利要求5记载的文字识别方法,其特征在于:上述后继字笔划对应连接步骤对由上述直线笔划对应步骤或上述非直线笔划对应连接步骤对应连接的上述识别对象文字进行对应连接。
CN98108373A 1997-06-05 1998-05-13 文字识别装置及文字识别方法 Expired - Fee Related CN1093966C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP147634/97 1997-06-05
JP14763497A JP3419251B2 (ja) 1997-06-05 1997-06-05 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
CN1201955A true CN1201955A (zh) 1998-12-16
CN1093966C CN1093966C (zh) 2002-11-06

Family

ID=15434776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98108373A Expired - Fee Related CN1093966C (zh) 1997-06-05 1998-05-13 文字识别装置及文字识别方法

Country Status (4)

Country Link
JP (1) JP3419251B2 (zh)
KR (1) KR100299725B1 (zh)
CN (1) CN1093966C (zh)
TW (1) TW385414B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827192A (zh) * 2018-08-08 2020-02-21 夏普株式会社 书籍电子化装置以及书籍电子化方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100930802B1 (ko) * 2007-06-29 2009-12-09 엔에이치엔(주) 이미지를 이용한 브라우저 제어 방법 및 시스템
US8094941B1 (en) * 2011-06-13 2012-01-10 Google Inc. Character recognition for overlapping textual user input

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827192A (zh) * 2018-08-08 2020-02-21 夏普株式会社 书籍电子化装置以及书籍电子化方法
CN110827192B (zh) * 2018-08-08 2024-07-26 夏普株式会社 书籍电子化装置以及书籍电子化方法

Also Published As

Publication number Publication date
KR19990006359A (ko) 1999-01-25
KR100299725B1 (ko) 2001-11-30
JPH10334187A (ja) 1998-12-18
CN1093966C (zh) 2002-11-06
TW385414B (en) 2000-03-21
JP3419251B2 (ja) 2003-06-23

Similar Documents

Publication Publication Date Title
CN1161687C (zh) 手写体匹配技术
CN1171162C (zh) 基于字符分类检索字符串的装置和方法
CN1140878C (zh) 字符识别方法,修正方法及字符识别装置
CN1156791C (zh) 模式识别设备与方法
CN1158627C (zh) 用于字符识别的方法和装置
CN1235177C (zh) 手写签名认证程序、方法和装置
CN1177407A (zh) 基于速度的手写体识别方法和系统
CN1174332C (zh) 转换表达方式的方法和装置
CN1664846A (zh) 基于统计结构特征的联机手写汉字识别方法
CN1669052A (zh) 使用三维物体模型的图像匹配系统、图像匹配方法以及图像匹配程序
CN1701324A (zh) 用于分类文档的系统,方法和软件
CN1945599A (zh) 图像处理装置,图像处理方法和计算机程序产品
CN1818927A (zh) 指纹识别方法与系统
CN1215457C (zh) 语句识别装置和方法
CN1151465C (zh) 利用候选表进行分类的模式识别设备及其方法
CN1794266A (zh) 生物特征融合的身份识别和认证方法
CN100336056C (zh) 基于成熟工艺文档的工艺术语提取、规律分析和重用方法
CN1251130C (zh) 多字体多字号印刷体藏文字符识别方法
CN1041773C (zh) 由字符图象直方图0-1图形表示识别字符的方法和装置
CN1200387C (zh) 基于单个字符的统计笔迹鉴别和验证方法
CN1093966C (zh) 文字识别装置及文字识别方法
CN1790377A (zh) 反白字符识别、快速准确的块分类方法和文本行生成方法
CN1255685A (zh) 一种无笔画顺序的手写字符辨识系统
CN1848137A (zh) 增强字符行图像的方法、设备和存储介质
CN1095142C (zh) 手写文字输入方法及装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20021106