CN100533470C - 对手写字符进行解码的设备及方法 - Google Patents

对手写字符进行解码的设备及方法 Download PDF

Info

Publication number
CN100533470C
CN100533470C CNB028204743A CN02820474A CN100533470C CN 100533470 C CN100533470 C CN 100533470C CN B028204743 A CNB028204743 A CN B028204743A CN 02820474 A CN02820474 A CN 02820474A CN 100533470 C CN100533470 C CN 100533470C
Authority
CN
China
Prior art keywords
character
model
segmentation
input
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028204743A
Other languages
English (en)
Other versions
CN1571979A (zh
Inventor
乔纳森·利·纳珀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Silverbrook Research Pty Ltd
Original Assignee
Silverbrook Research Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Silverbrook Research Pty Ltd filed Critical Silverbrook Research Pty Ltd
Publication of CN1571979A publication Critical patent/CN1571979A/zh
Application granted granted Critical
Publication of CN100533470C publication Critical patent/CN100533470C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Electronic Switches (AREA)
  • Vending Machines For Individual Products (AREA)

Abstract

本发明公开一种能够识别手写字符的方法,包括以下步骤:比较步骤,将某一输入的字符依次与一系列的存储字符模型中的一个进行比较。所述比较步骤进一步包括以下步骤:分割步骤,根据字符模型的分割模式,将某一个输入字符分解成一个或者多个部分;评估步骤,根据这一个或者多个部分与字符模型中的对应部分的分割模型,对这一个或者多个部分进行评估,产生一个分值,该分值表示这一个或者多个部分与分割模型的一致性程度;针对一系列字符模型中的多个字母模型重复所述比较步骤;选择分值最高的字符模型,并把输入字符作为与该字符模型最相关的字符。

Description

对手写字符进行解码的设备及方法
技术领域
本发明涉及一种对计算机或者其它处理设备中的手写数据输入进行解释和解码的方法,具体的涉及一种笔迹识别的方法,该方法涉及在适用时将各个字符分解成一个或者多个基元子划。
背景技术
本说明书中提到的任何现有技术不是也不应被认为是对这些现有技术构成了公知知识的一部分的一种承认或者是任何形式的暗示。
现有技术处理设备,例如手持计算机,用来对基于手写数据输入的用户指令解码。其它设备迫使用户使用伪手写体的格式输入数据。掌上电脑就是一例,它使用的专用输入格式是涂鸦。该输入格式允许用户在触摸屏上按预定动作移动塑料触笔将数据输入手持计算机,在触摸屏上,每一个字符有一个关联的“划”,在很多情况下,与一个实际的字符相象。
这些系统的优点是可携带设备太小而不具备一个可用大小的键盘,但为了输入数据,需要用户学习人造“语言”。
由于用户的手写字体是千差万别的,因而提供不同用户的手写的计算机自动识别有很多问题。这导致计算设备中的商业可行的手写识别系统的最小运用。因此,就迫切需要提供一种系统,能够解释不同用户的手写而不必强迫用户必须遵照特定设备预期的输入风格改变自己书写风格。
大多数模式或字符识别系统都是将一输入信号进行某种分段来辨认数据的基本基元(fundamental primitive),以减小输入噪声水平。执行分段还为了缩减特征提取期间使用的信息量,并实现对输入信号的更抽象的特征使用模式识别。
在手写识别系统中预处理期间,经常将各个划分成多个子划基元。然后把基元传递到特征提取模块或者直接用于模式分类。在草书或者连笔体的识别系统中,单个划可能表示不止一个字母,因而分段被用于识别潜在的字母分段点。
研究界已经提出了一些分段技术,包括基于人体运动系统(humanmotor system)特征的一些简单方法。例如,在曲率最大、关键点和速率极值处或者这些技术的组合(例如,寻找曲率最大和速率最小的重合点)分段。其它的研究中建议使用颤搐姿态检测(ballistic gesturedetection),划的独立组件分析,和用于划分段的常规性和奇异性的概念。
虽然上述过程使用手写生成作为分段的基础,其它技术是基于感知过程的。字母可视解码的关键在于感知基元的局部关联位置,因而,位置极值点在对字母形状的识别中起到很重要的作用。基于感知的分段标准包括x极值和y极值、尖端和划交叉。
划分段在某种情况下能提高手写识别系统的准确度,然而也是识别误差的一个主要根源。当选择分段点时,大多数基于运动的划分段算法设有某种数值阈,这会导致不良形成的划的不一致分割。图2b)表示的是写的很糟糕的字母a的基于曲率极值的不正确的分段。
在此例中,使用划分段把“a”的圆形体与更线性的茎(stem)分开或分段,茎顶部的曲率极值点被用作一个分段点。图2a)显示的是正确的分段点(由叉号表示的)。然而,在图2b)中的圆形体中有一个曲率极值,并缺少了标识字母茎起点的期望的尖端,导致对划的不正确分段。
速度也可以用于分段,因为手写是由一系列的颤搐性的动作产生的(也就是说从起点加速到顶点速度,然后在目标点减速)。高速度的区段通常是直的,而低速通常在曲率极值处出现。然而,速度也经受阈设置的问题,另外,用户在写一划时可能停顿,导致无效的分段点。如图3所示,字母a的采样点是由方块表示的。采样点之间的距离可以推断出笔的速度(假设采样速率是恒定的),因此距离大表示速度快,样本离的近表示笔速度较慢。例如低速(和高曲率)区域可以被看作是茎顶部尖内的样本的聚合,在茎底部的小勾内也是如此。然而,还有另一个低速区域(在圆形区域左侧),是作者在下笔时犹豫而产生的。因此即使字母‘a’写的清晰完好,基于速度的分段仍可能产生不一致的结果。
感知分段技术,例如把Y极值作为分段点,通常不经受阈设置的问题,因为不需要一个数值来判断一个点是否是一个局部极值。然而,这些技术都也会经受不一致的分段的困扰。在图4a)中,字母‘a’的分段,如图中叉号所示,位于起笔附近的Y极值。然而第二个字母‘a’,如图4b)所示,虽显然与第一个是同一个字母,在这个位置上就不包括Y极值,由于划趋平。
大多数其它的分段算法都受此问题困扰,且尤其受书写不良的字母的影响。由于划分段不易实现且易出错的特性,很多系统都不尝试任何类型的划分段,并简单的对用户提供的原始的没有经过分段的划直接处理。那些确实执行划分段的系统通常实施一些弹性匹配过程来最小化不一致的分段的影响。
香港大学计算机科学系于1998年3月技术报告HKUST-CS98-07的“Elastic Structural Matching For Recognizing Online HandwrittenAlphanumeric Characters”公开了利用曲线极值将划分成多个线段。然而,他们注明“由于不良质量的书写,一个平滑的划有可能被分成多个段”,这就会导致不正确的分段的发生。为了解决这个问题,他们使用了一套规则试图检测无效的分段,把不正确分段的子划重新组合成新的一划。
世界科技出版公司1999年机器感知及人工智能系列中的《手写体识别的进展》(Advances In Handwriting Recognition)34卷第153-162页的“Handwritten Word Recognition-The Approach Proved ByPractice”公开了在商用光学读检验系统中的利用在垂直速度中的过零点来对手写连笔划进行分段。然后,将子划对照将在弹性匹配识别器中使用的基元元素集匹配。
世界科技出版公司1999年机器感知及人工智能系列中的《手写体识别的进展》(Advances In Handwriting Recognition)34卷第225-234页的“Global Methods for Stroke-Segmentation”公开了基于等值曲线拟合离线图像的划的分段。在这种方法中,首先使用立方b-splines将曲线近似,在曲率极值点作分段切割。
1993年10月13-16日,在NC的达累姆的《关于模糊理论和技术的第二届国际会议记录》(Proceedings of the 2th InternationalConference on Fuzzy Theory and Technology)的“A Fuzzy OnlineHandwriting Recognition System:FOHRES,”一文讲授使用模糊逻辑来表示笔速和方向连同一组语言变量以形成用于划分段的模糊逻辑规则集。分段后的划被用作用于模糊特征提取的基元。
1997年8月18-20日,在德国乌尔姆举行的第四届国际文档分析与识别会议(4th International Conference Document Analysis andRecognition,ICDAR)上,“Recognizing Letters in Online HandwritingUsing Hierarchical Fuzzy Inference”公布将划以水平切线在尖和点处分成部分划集(Pstrokes)。该算法使用角平滑系统(而不是通常使用的点位置平滑)不会扭曲笔轨迹中不连续的部分(例如,尖部)。
世界科技出版公司于1996年9月2-5日在英国的科尔彻斯特出版的《手写体识别的进展》(Advances In Handwriting Recognition)一书的第169-176页的“Detection Of Extreme Points of OnlineHandwritten Scripts”公开了一个鲁棒的局部曲率极值检测算法,该算法是基于手写识别delta对数正态理论,所述delta对数正态理论由1995年的《两年一次的第七届国际书法协会记录》(Proceedings of the 7thBiennial Conference of the International Graphonomics Society)的126-127页的“A Delta Lognormal Model for HandwritingGeneration,”公开。他们公布了使用角信号密度计算和一阶交叉点以把划分段成基元成分。
1997年8月18-20日,在德国乌尔姆举行的第四届国际文档分析与识别会议(4th International Conference Document Analysis andRecognition,ICDAR)上,“Perceptual Model of Handwriting DrawingApplication to the Handwriting Segmentation Problem”公布了基于检测可感知锚点集的建模和分段的方法。基本上,是找“突变”点,这些点被定义成不连续点,如提笔、急转,尖端,和“可感知”点,其包括拐点,X和Y极值,和划的交叉点。
美国专利6,275,611介绍了一种字符识别系统,该系统在“局部角变化最大且超过设置的阈”的点对划进行分段。也可参见2001年8月14日的“Handwriting Recognition Device,Method and Alphabet,WithStrokes Grouped Into Stroke Sub-Structures”。美国专利5,740,273公开了该分段算法的全文。同样地,美国专利5,889,889公开了依靠探测“通过此标准以及由提笔识别为突然方向变化”的点的手写字符识别器中的划分段的性能。其公布了设计上为了压缩和重构,以参数形式表示手写输入的系统中同样的分段过程,其用于在“角和尖部,方向突然变化的地方”对划进行分段。也参见美国专利6,044,174。
在美国专利6,137,908中描述的过程识别Y极值,作为用于识别的划预处理过程。在这些极值之间的中间点也被提取出来,作为“框架(frame)”存储,为在识别系统中所使用。
同样地,美国专利5,610,996公开了使用一系列弧作为用于识别的基元,其中“弧起始和终结于样本文本上的Y极值点”。该文件还公开了使用替选的分段方案,如X极值和组合的X-Y极值。
美国专利4,024,500公开了使用X和Y极值把连笔分成字符(而不是颤搐的子划基元)。
美国专利5,854,855教授了使用速度轮廓来对划进行分段,并“在手写输入中将子划的边界与所选择的最小速度相关联”。
美国专利5,577,135公开了在Y极值将划分段,产生一系列的上和下划,这些划被使用在隐藏Markov模型(HMM)识别系统中。在美国专利5,878,164中介绍的另一HMM识别系统中,“根据限定的边界条件(如提笔或者尖端)将划分成字母或者子字符基元”。
每一个引用的现有技术都试图介绍一种新技术,用来解决识别手写输入文本的问题。每一种技术可能会有一些改进,但是都没有任何一个提供一个鲁棒的系统能够解决上述所有问题。
发明内容
广义地讲,本发明提供了一种执行书写字符识别的方法,包括将一给出的输入字符顺序地与一系列存储的字符模型之一比较,比较步骤进一步包括下列步骤:依照与当前字符模型相关联的分段方案,将该输入字符分解成一个或者多个段;对照与当前字符模型相关联的分段模型,评估所述一个或者多个段,评估会生成一个分值,该分值用来衡量与模型的一致性程度;对于一系列字符模型中的多个模型重复所述比较步骤;选择赋予了最高分值的字符模型,将该输入字符分类为与该字符模型相关联的字符。
优选的,识别的字符是字母、数字或者标点符号中的一个。
优选的,执行将输入字符分解成一个或者多个段的步骤,每一个段的最小长度,据下列公式得出:
l min = λ Σ i = 2 n | | p i - p i - 1 | |
其中
1min=段的最小长度
pi=点i的坐标值
n=在一划中的点数
λ=最小长度阈
优选的,如果依据与目前字符模型相关联的分段方案不能将该给出的输入字符分段,就拒绝以当前字符模型作为对于所述给出的输入字符的可能匹配。
优选的,评估过程分配分值,该分值给予与理想情况的较接近的一致性。
优选的,评估过程使用了模糊逻辑规则。
优选的,每一个字模型与多个分段方案有关联,以便于识别同一个字符的不同书写形式。
优选的,用于将输入字符分解成一个或者多个段的不同的规则可以根据不同字符模型而定义。
还提供了一种设备,该设备包括一个输入表面,其响应于触笔在其上的移动而产生输入刺激;存储器;处理器,用于接收所述输入刺激和处理所述输入刺激,所述处理器适于执行本发明广义形式所述的方法。
公开了用于手写字符识别的划分段过程。依据评估过的模型改变分段算法会产生可用于特征提取和分类的划基元的一致而鲁棒的集合。也描述了使用此分段过程的一个模糊逻辑分类器的例子。
附图说明
通过下列描述将使本发明显而易见,仅通过举例的方式,这些实施例是优选的但不是限制性的,下述是对附图进行说明,其中:
图1表示本发明一个实施例,图中示出一个处理系统被设置用来根据本发明进一步的实施例接收并处理用户输入;
图2a)和2b)表示一个很好形成的字母a和不良形成的字母a;
图3表示如何将速度分段用于解释字母“a”,和与此相关联的其它问题;
图4a)和4b)表示使用y轴极值来对字母“a”进行解码的问题;
图5表示的是字母“a”的分段;
图6表示的是字母“b”的分段;
图7表示的是字母“B”的分段;
图8a)、8b)和8c)表示字母“B”的三种不同的分段;
图9表示的是字母“E”的分段;
图10表示的是基于以度表示的线取向的模糊分组成员关系;和
图11a)-d)表示的是使用在字符识别中的通用划基元的选择。
具体实施方式
为了更好地理解本发明的主题,通过以下的适于书面描述的方式和附加的权利要求方式来阐述本发明。
下面的例子提供对本发明实施例的更详细的描述。这些例子仅仅是为了举例,并不限制本发明的范围。
本发明提供了一种用于执行手写字符识别的方法。同时也提供了一个用于实施该方法的设备。在附图中,为说明本发明的特征,用数字编号贯穿附图来标识不同的部分。
本发明具体实施例中描述的方法可以使用图1中的处理系统来实现。
尤其是,处理系统10通常包括至少一个处理器20,一个存储器21,一个输入设备22,如图形输入板和/或触摸屏,输出设备23,如显示器,这些设备通过如图1中所示的总线24耦合在一起。如图所示还提供了一个外部接口25,用于将处理系统10与存储介质11(如数据库)相耦合,另外,还可能需要一个触笔,以允许用户将文本输入到系统10。
使用中,处理系统适应于实现将模型和规则数据存放在数据库11中,并且/或者能对数据库11检索。其使处理器实现经输入设备22接收手写数据,处理手写数据并将其与存储在存储介质上的数据比较。这些依次使得处理系统能够识别手写文本中的字符。因此,应理解处理系统10可以是任意形式的处理系统,如计算机,便携机、服务器、专用硬件以及类似物。
现在详细描述一下处理系统10的操作。
在此描述一个用于手写字符识别的划分段的特定模型方案,包括特定模型算法的例子。也给出了优化该过程的技术。
很显然,就现有技术而言,上面描述的划分段试探法不能总是产生一致的分段点,这是由于手写输入中极端的易变性。问题部分是由于字母识别独立于分段过程而操作。这就意味着退化的形式会产生不正确的结果,而且这些分段失败在分类器中还很难检测和校正,其中分类器试图将单个字符与所述段联系起来。
由于笔迹的模糊,根据局部上下文,一个图形符号可能会表示不同的意思;例如,基于句法或者语义上的信息(如字典或者字符语法)对模糊不清的字母的解释可能是不同的。同样地,包括单独字母的各个划和子划需要用上下文来解释,以确保能够正确理解其含义。
本发明具体实施例中使用了模型特定的划分段,延迟对手写划的分段,允许其与分类过程融合。这样就会导致更多的由分段过程使用的字母模型所期望的有关分段点的类型的信息。对划进行分段所用的度量基于来自正在识别的系列的当前字符的预期结构,因而不使用单一的全局通用的分段过程。
每一个字母原型(prototype),异形字或者字符模型与输入进行比较,输入的划将会被分段,其根据任何可识别关键点的技术,导致更加一致的到基元的划的分解。另外,为一特定字母模型找到期望的分段点的分段处理的失败,就意味着不需要再对此模型进行分析,能够实现有效地剔除与一般输入的结构不匹配的模型。
在实践中,用户使用触笔输入一字符,处理器运行程序来执行本发明的实施例,首先检验输入字母是否是“a”,试图按照对字母“a”所预期的对输入进行分段。然后对照一些或所有可能的数据录入继续检验输入,例如,′b′-′z′,对每一个尝试评分。通过这种方法,具有最接近的匹配的结果被列为输入字母。在后面会介绍一个适合的评分方案。
对于每一个字母可能有若干模型以考虑特定字母可能书写的不同方式。例如,有些人可能将字母“z”写得象侧着的大写的字母“N”,而有些人写得看起来象数字“3”。
需要注意的是,虽然每一个字母模型潜在需要执行一个分段过程,很多模型使用相同或者相似的分段点,意味着可以将这些点缓存起来用以减少分段处理的开销。例如,字母“y”和“g”都有相似的尾部段,这些相似的悬垂尾部段就可以如上所述被缓存。
识别从一些简单的以从信号除掉噪声的预处理开始。包括一些技术,如采样点平滑(如果采样过程有噪声的话),和去除来自划起点和终点的钩,否则会使识别过程混乱。点可被规格化,其通过去除重复的点或者重新采样,以保证样本间的最小距离。
笔迹分类器中定义的每一个字母模型定义了一个分段过程,该过程在输入划上执行。分段产生分段点集,用来把划分成一系列的子划。该算法一次适用一个划。为了避免划产生的子段过小而在结构上无关,基于划全长计算子划的最小长度:
l min = λ Σ i = 2 n | | p i - p i - 1 | |
其中
pi=点i的坐标值
n=划中点的个数
λ=最小长度阈(经验上设为.05)
分段对样本进行算法迭代直到识别一个由当前字母模型定义的潜在分段点。如果找不到正确的点,算法返回一个失败,表明输入与字母模型所期望的结构不一致。否则,如果通过在该点对划进行分段而生成的两个子划比1min大,就在该点对该划进行分段,并继续处理该划剩余部分。如果每一个子划都小于1min,就忽略该分段点,并继续处理。当所有分段点都正确识别后,过程结束,并向识别器指示分段成功。
值得注意的是,字母模型可以使用手写字母预期结构表明的任意分段技术,一些模型可能不需要任何的划分段。例如,用于‘c’和‘o’的简单的模型可以与输入直接简单匹配,不需要试图把划降成子划基元。通常,通过这些单一的颤搐姿态分段不能导出任何信息,实现与未分段的划进行匹配,能避免由传统分段技术产生的问题(例如,依赖作者的风格,平滑速度曲率轮廓能够在任意点引发分段)。
下面的这些例子列举了各种模型的分段过程。如图5所示,关键点30和关键点32用于为一笔写成的异形字母‘a’的分段。
假设模型期望在字母茎32的顶部对划进行分段,分段算法先搜索第一个Y最小值30,然后试图找到Y最大值。如果找到了Y最大值32,就把该点标记为一个分段点。值得注意的是,Y最小值30不是用来分段的,只是确保能正确地找到Y最大值32。没有最初的搜索Y最小值30,就有可能使找到的Y最大值不正确(如图4b)所示)。另外值得注意的一点是,此过程能够使上述有关图1到图3中的所有例子找到正确的分段点。
作为一个反例,假设用户输入一个手写‘c’,与上述定义的‘a’的模型匹配,虽然找到了Y最小值,随后的对Y最大值的查找会失败。终点将不会与分段点匹配。因而,分段过程失败,表明输入不与通常的模型结构匹配,就使模型从潜在的匹配列表中去除。
而上述分段过程在很多字母模型上都工作良好,其它的模型将需要不同的算法。一个简单的例子,图6表示对于字母‘b’模型的分段。
对这一笔写成的异形字母‘b’进行分段,找到第一个Y最小值40,将其作为分段点,产生一垂直线子划,曲线‘o’形的子划。图7中给出了一个更加复杂的分段过程。
以上给出字母‘B’的单划模型,第一个分段点发现于第一个Y最小值50。随后,找到Y最大值52,然后是一个Y最小值54,作为第二个分段点。图8示出分段后的字母。
结果是最初垂直的线性子划如图8a)所示,接着是曲线‘p’子划如图8b)所示,后面是“侧着的-u”子划如图8c)所示。此分段方法对曲率和速度的变化是鲁棒的,对多种不同的书写风格产生一致的分段。另一方面,现有技术中使用的全局分段过程产生手写字母非常不一致的分段,如对前述一例,依赖于笔划的曲率的度和一致性速度。
使用X和Y轴极值并不能将所有的字母模型一致地分段。例如,图9中的两划异形字母‘E’的分段。
使用X最小值检测分段点60和分段点62是不成功的,尤其如果字母有某些旋转或者棱角,使用Y最小值也不一定能产生正确的分段。对于该异形字,在第一笔中最高的角变化的两个点可用于分段。值得注意的是,不需要使用角阈来找这些点,因通过对在每一个点的曲率值进行排序就能很容易地找到曲率的两个最高点。可能还有更复杂的处理;例如,确保分段点能够产生大致等长度的子划。总的,为了确保一致地得到正确的分段点,可执行基于输入划的任何结构特征的任意复杂的模型特定分段。
上述对于字母“a”的分段过程对于所有的在一个曲线区域后是尖端、随后是一个向下的划(如,‘d’,‘g’,‘u’,‘y’等的异形字)的字母模型都适用。总之,当与相似的结构模型进行匹配时,可存储发现的子划以备晚些使用。进一步,如果在分类前将子划转化成特征表示,可将特征向量存储起来以防止重复的特征提取。
许多可用的划分段技术需要子划的距离和曲率信息。为了避免每次执行划分段时都重新计算这些值,可以创建一个辅助数据结构,通过存储划中每一点的距离和曲率的值缓存这些值。
下面举例描述如何通过在手写字符识别中使用以实现模型特定的划分段。虽然使用基于模糊逻辑分类器的例子,技术人员很显然能够将此技术与能够使用划分段的任何分类器类型一起使用,该过程很容易合并到结构化的(如弹性匹配)和统计的分类器中。
一种对手写字符的不精确度和风格变化进行建模的方法是使用模糊逻辑,其允许定义一个不精确定义的规则集。模糊逻辑分类器通过为模糊模型分配一个输入信号的成员关系度来工作,其依靠特征与描述模型的模糊规则的匹配程度。在1998年的关于图案识别的国际会议(International Conference on Pattern Recognition,ICPR’98)上提出的第1121-1123页的"A New Fuzzy Geometric Representation forOn-Line Isolated Character Recognition"一文;和1997年出版的《图案识别》的第30卷第10期第1591-1604页的“Fuzzy Feature Descriptionof Handwriting Patterns”一文进一步描述了用于手写字符识别适宜的模糊逻辑分类器。
举例来说,定义直线的模糊逻辑规则可能包括下列集合:垂直线(VL),水平线(HL),正斜线(PS)和负斜线(NS)。显然,大多数线不会与限制的集合完全匹配,通常对于这些集合中多于一个的集合有一个成员关系度。因此,模糊逻辑定义了一个逻辑集的概念,其中成员关系是渐变的而不是离散的。图10列举了一个直线的可能的组成员关系函数集,以规格化的取向定义(以度)。
图10显示了一系列钟形曲线。例如,标号为VL的曲线,表示垂直线,定义一个线集,当与一个真水平线比较时,角度的范围从略低于45°到略高于135°,最接近90°的权值较高。相似的曲线如所示水平线(HL),正斜线(PS)和负斜线(NS)。
本例中模糊逻辑分类器由定义各个字母模型的规则集构成。根据这些规则将划和子划基元与同类的划形状进行比较。规则还包括相关的位置信息用来区分相似基元组成的字母。使用的语言基元包括如图11a)中的象‘o’的曲线(OC),图11b)中的象“c”的曲线(CC),如11c)图中的象“d”的曲线(DC),和图11d)中的到右侧的垂直曲线(RVC)。
对每一个子划,基于对划结构的简单分析,计算其在这些基元集中的成员关系度,使用下列信息:绝对划曲率,就划边界框而论的起点和终点的位置,起点和终点间线的方向。
位置基元是左(LEFT)、右(RIGHT)、顶(TOP)、中(CENTRE)和底(BOTTOM),用来表示在字母边界框中划的位置,也使用上述的直线基元(VL,HL,PS,NS)。一些典型的规则例为:
规则‘a’:(OC|CC)& LEFT & CENTRE,(VL|RVC)& RIGHT
规则‘b’:VL & LEFT,(OC|DC)& RIGHT & BOTTOM
规则‘c’:CC
规则‘d’:(OC|CC)& LEFT & BOTTOM,VL & RI GHT
.
.
.
上述规则中,符号‘|’表示模糊或(OR),符号‘&’表示模糊与(AND),圆括号表示的逻辑优先级最高,逗号表示使用模糊AND的子划组成(例如,逗号左边的表达式使用第一子划评估,右边的表达式使用第二子划评估,使用模糊AND将结果组合)。
举例来说,第一规则如下:字母“a”是一个象‘o’的曲线或者左边象‘c’的曲线且在字母中垂直对中,随后到右侧有一个垂直线或者垂直曲线,位于字母的右侧。
这些规则描述了每一个字母模型的基元是如何组合的,不能表示划是如何被分解为基元的。为此,每一个规则与一个模型特定的分段规则关联,在规则被评估之前,对所述输入划执行该规则:
规则‘a’:MINY→MAXY
规则‘b’:MINY
规则‘c’:
规则‘d’:MAXY→MINY
.
.
.
规则‘k’:MINY,MAXY,MINX
.
.
.
MAXY表示查找下一个Y最大值。MINY表示查找下一个Y最小值符号“→”表示先发现的是在左边定义的点,但是不用来分段;发现它是为确保后续点能正确定位。值得注意的是,模型‘c’的分类仅需要单个划,因此不需要对该模型进行分段。所示模型‘k’为包括以给出的顺序发现的多个分段点的规则实例。
一旦使用特定模型规则进行划分段,子划通过在通用划类中的成员关系度进行分类。这些成员关系值用来评估结构规则,用来表示输入与字母模型的匹配程度。每一个字母模型同样被评估,输入根据具有最高模糊成员关系值的模型进行分类。
总之,按照每一个规则对每一个输入进行测试,预期输入字符与被测试的字符一样,每一个规则进一步地定义了所采用的分段方法。如果因为输入字符与通过规则被测试字符不一致,对于一个特殊字符模型不能执行分段,那么在分类时会对该尝试附上零分或者很低分值。
广义上说,本发明包括在应用的说明书中引用或者表示的部分、元素和特征,单独地或者共同地,两个或者多个所述部分、元素或者特征的任何或者所有组合,以及在此提到的特定数字在与本发明相关的领域存在已知等价例,这些已知知识与本发明是融为一体的即使是分别提出的。
尽管上面对优选实施方式进行了详细地描述,但明显的,本领域的普通技术人员仍然可以在不脱离下述请求保护的本发明范围的情况下,做出各种改变、替换和更改。

Claims (9)

1、一种对输入字符进行书写字符识别的方法,包括以下步骤:
(a)对于多个字符模型中的每一个:
(i)根据与该字符模型相关联的分段方案,将输入字符分解成一个或者多个段;以及
(ii)根据与当前字符模型相关联的段模型,评估所述一个或者多个段,以使该评估产生表示与所述模型一致性程度的分值;以及
(b)选出产生最高分值的字符模型,并将输入字符分类为与所述字符模型相关联的字符。
2、如权利要求1所述的方法,其特征在于,用于识别的字符是字母、数字或者标点符号中的一个。
3、如权利要求1或2所述的方法,其特征在于,进行将输入字符分解为一个或者多个段的步骤,以使每个段具有由下列公式得出的最小长度:
l min = λ Σ i = 2 n | | p i - p i - 1 | |
其中
1min=段的最小长度
pi=点i的坐标
n=划中的点的个数
λ=最小长度阈
4、如权利要求1所述的方法,其特征在于,若根据与当前字符模型相关联的分段方案不能将所述给定的输入字符进行分段,就拒绝以当前字符模型作为对于所述给定的输入字符的可能匹配。
5、如权利要求1所述的方法,其特征在于,所述评估过程分配分值,该分值给予与理想情况的较接近的一致性。
6、如权利要求5所述的方法,其特征在于,所述评估过程使用模糊逻辑规则。
7、如权利要求1所述的方法,其特征在于,每一个字符模型可与多个分段方案相关联,以便于识别同一个字符的不同形式。
8、如权利要求1所述的方法,其特征在于,将输入字符分解成一个或者多个段所遵循的不同规则可针对不同的字符模型而定义。
9、一种用于执行手写字符识别的设备,包括:
输入表面,用来响应于触笔在其上的移动而产生输入字符;
第一装置,其中限定有多个用于限定分段方案的字符模型,用于根据与所述多个字符模型中的每个字符模型相关联的分段方案,将所述输入字符分解成一个或者多个段;以及
第二装置,其中限定有规则集,用于:
根据与所述多个字符模型中的所述每个字符模型相关联的段模型,评估所述一个或者多个段,以使该评估产生表示与所述模型的一致性程度的分值;以及
选出产生最高分值的字符模型,并将输入字符分类为与所述字符模型相关联的字符。
CNB028204743A 2001-10-15 2002-10-15 对手写字符进行解码的设备及方法 Expired - Fee Related CN100533470C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AUPR8245 2001-10-15
AUPR8245A AUPR824501A0 (en) 2001-10-15 2001-10-15 Methods and systems (npw003)
PCT/AU2002/001393 WO2003034325A1 (en) 2001-10-15 2002-10-15 A method and apparatus for decoding handwritten characters

Publications (2)

Publication Number Publication Date
CN1571979A CN1571979A (zh) 2005-01-26
CN100533470C true CN100533470C (zh) 2009-08-26

Family

ID=3832070

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028204743A Expired - Fee Related CN100533470C (zh) 2001-10-15 2002-10-15 对手写字符进行解码的设备及方法

Country Status (12)

Country Link
US (6) US7359551B2 (zh)
EP (1) EP1444642B1 (zh)
JP (1) JP4274941B2 (zh)
KR (1) KR100651762B1 (zh)
CN (1) CN100533470C (zh)
AT (1) ATE386989T1 (zh)
AU (3) AUPR824501A0 (zh)
CA (1) CA2463230C (zh)
DE (1) DE60225170T2 (zh)
IL (1) IL161383A0 (zh)
WO (1) WO2003034325A1 (zh)
ZA (1) ZA200402925B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030202097A1 (en) 2000-10-26 2003-10-30 Autoliv Development Ab Night vision arrangement
AUPR824501A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw003)
US7995095B2 (en) 2001-10-18 2011-08-09 Autoliv Development Ab Night vision device for a vehicle
US20050281467A1 (en) * 2003-01-24 2005-12-22 Stahovich Thomas F Recognizing multi-stroke symbols
AU2003900865A0 (en) * 2003-02-26 2003-03-13 Silverbrook Research Pty Ltd Methods, systems and apparatus (NPW010)
CN100405389C (zh) * 2004-08-06 2008-07-23 摩托罗拉公司 从划线标记识别字符的方法和装置
US20090300554A1 (en) * 2008-06-03 2009-12-03 Nokia Corporation Gesture Recognition for Display Zoom Feature
KR101080255B1 (ko) * 2009-07-21 2011-11-08 (주)펜앤프리 필기 패턴에 따른 필기 정보 입력 장치 및 필기 정보 입력 방법
CN101916378B (zh) * 2010-07-20 2013-01-09 青岛海信网络科技股份有限公司 易混淆字符的识别方法及装置
US8363947B2 (en) 2010-07-31 2013-01-29 International Business Machines Corporation Handwritten character recognition based on frequency variations in characters
US8768062B2 (en) * 2010-11-09 2014-07-01 Tata Consulting Services Limited Online script independent recognition of handwritten sub-word units and words
US20120281919A1 (en) * 2011-05-06 2012-11-08 King Abdul Aziz City For Science And Technology Method and system for text segmentation
CN102968265B (zh) * 2011-09-01 2015-12-16 晨星软件研发(深圳)有限公司 将触控点转换为输入文字的方法及触控装置
US11195057B2 (en) 2014-03-18 2021-12-07 Z Advanced Computing, Inc. System and method for extremely efficient image and pattern recognition and artificial intelligence platform
US11914674B2 (en) 2011-09-24 2024-02-27 Z Advanced Computing, Inc. System and method for extremely efficient image and pattern recognition and artificial intelligence platform
US11074495B2 (en) 2013-02-28 2021-07-27 Z Advanced Computing, Inc. (Zac) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
US8873813B2 (en) 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
US8311973B1 (en) 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers
US9916538B2 (en) 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US8959082B2 (en) 2011-10-31 2015-02-17 Elwha Llc Context-sensitive query enrichment
US9082005B2 (en) * 2012-03-19 2015-07-14 Disney Enterprises, Inc. Smart scribbles for sketch segmentation
JP5284523B1 (ja) * 2012-09-05 2013-09-11 株式会社東芝 情報処理システム、プログラムおよび情報処理システムの処理方法
US9330331B2 (en) 2013-11-11 2016-05-03 Wipro Limited Systems and methods for offline character recognition
US9286527B2 (en) 2014-02-20 2016-03-15 Google Inc. Segmentation of an input by cut point classification
US9384403B2 (en) 2014-04-04 2016-07-05 Myscript System and method for superimposed handwriting recognition technology
US9524440B2 (en) * 2014-04-04 2016-12-20 Myscript System and method for superimposed handwriting recognition technology
US20160154555A1 (en) * 2014-12-02 2016-06-02 Lenovo (Singapore) Pte. Ltd. Initiating application and performing function based on input
CN104537347A (zh) * 2014-12-25 2015-04-22 安徽寰智信息科技股份有限公司 一种基于云端分析和模型匹配的唇形识别文字输入方法
US10402734B2 (en) * 2015-08-26 2019-09-03 Google Llc Temporal based word segmentation
CN105512692B (zh) * 2015-11-30 2019-04-09 华南理工大学 基于blstm的联机手写数学公式符号识别方法
US10163004B2 (en) * 2017-03-30 2018-12-25 Konica Minolta Laboratory U.S.A., Inc. Inferring stroke information from an image
US10748031B1 (en) * 2019-05-22 2020-08-18 Read-Ink Corporation Handwriting recognition systems and methods
CN110503101A (zh) * 2019-08-23 2019-11-26 北大方正集团有限公司 字形评价方法、装置、设备及计算机可读存储介质
CN110866499B (zh) * 2019-11-15 2022-12-13 爱驰汽车有限公司 手写文本识别方法、系统、设备及介质
KR102581822B1 (ko) * 2023-04-18 2023-09-26 (주)핸듀 교육용 프로그램에서 문자를 인식하는 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
US5841902A (en) * 1994-09-27 1998-11-24 Industrial Technology Research Institute System and method for unconstrained on-line alpha-numerical handwriting recognition
EP0953933A2 (en) * 1998-04-30 1999-11-03 Motorola, Inc. Text recognizer and method using non-cumulative character scoring in a forward search
US6256410B1 (en) * 1998-07-30 2001-07-03 International Business Machines Corp. Methods and apparatus for customizing handwriting models to individual writers

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3755780A (en) * 1971-06-28 1973-08-28 Pattern Analysis & Recognition Method for recognizing characters
JPS51115718A (en) * 1975-02-24 1976-10-12 Pioneer Electronic Corp Bi-directional catv system
US4345245A (en) * 1979-11-26 1982-08-17 Eltra Corporation Method and apparatus for arranging segmented character groups in a digital typesetter
US4837842A (en) * 1986-09-19 1989-06-06 Holt Arthur W Character and pattern recognition machine and method
US4864618A (en) 1986-11-26 1989-09-05 Wright Technologies, L.P. Automated transaction system with modular printhead having print authentication feature
US5051736A (en) 1989-06-28 1991-09-24 International Business Machines Corporation Optical stylus and passive digitizing tablet data input system
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
US5852434A (en) 1992-04-03 1998-12-22 Sekendur; Oral F. Absolute optical position determination
US5477012A (en) 1992-04-03 1995-12-19 Sekendur; Oral F. Optical position determination
US5491758A (en) * 1993-01-27 1996-02-13 International Business Machines Corporation Automatic handwriting recognition using both static and dynamic parameters
JP2682416B2 (ja) 1993-12-24 1997-11-26 日本電気株式会社 図形認識装置
US5745599A (en) * 1994-01-19 1998-04-28 Nippon Telegraph And Telephone Corporation Character recognition method
DE4407998C2 (de) * 1994-03-10 1996-03-14 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
US7103460B1 (en) * 1994-05-09 2006-09-05 Automotive Technologies International, Inc. System and method for vehicle diagnostics
US20050192727A1 (en) * 1994-05-09 2005-09-01 Automotive Technologies International Inc. Sensor Assemblies
US5652412A (en) 1994-07-11 1997-07-29 Sia Technology Corp. Pen and paper information recording system
US5652414A (en) * 1994-08-18 1997-07-29 Otis Elevator Company Elevator active guidance system having a coordinated controller
DE19581757T1 (de) * 1994-09-09 1997-08-21 Motorola Inc Verfahren und System zum Erkennen einer Grenze zwischen Zeichen in einem handgeschriebenen Text
US5661506A (en) 1994-11-10 1997-08-26 Sia Technology Corporation Pen and paper information recording system using an imaging pen
JP3445680B2 (ja) 1995-03-10 2003-09-08 シャープ株式会社 手書き認識装置
US5706364A (en) * 1995-04-28 1998-01-06 Xerox Corporation Method of producing character templates using unsegmented samples
JPH0935001A (ja) 1995-07-21 1997-02-07 Oki Electric Ind Co Ltd 筆記文字認識方法および認識装置
US6081261A (en) 1995-11-01 2000-06-27 Ricoh Corporation Manual entry interactive paper and electronic document handling and processing system
US5692073A (en) 1996-05-03 1997-11-25 Xerox Corporation Formless forms and paper web using a reference-based mark extraction technique
US5713478A (en) * 1996-10-23 1998-02-03 Habisohn; Chris X. Method for deactivating swing control with a timer
US6518950B1 (en) 1997-10-07 2003-02-11 Interval Research Corporation Methods and systems for providing human/computer interfaces
US6092065A (en) * 1998-02-13 2000-07-18 International Business Machines Corporation Method and apparatus for discovery, clustering and classification of patterns in 1-dimensional event streams
WO1999050751A1 (en) 1998-04-01 1999-10-07 Xerox Corporation Routing document identifiers
US6249605B1 (en) * 1998-09-14 2001-06-19 International Business Machines Corporation Key character extraction and lexicon reduction for cursive text recognition
US6964374B1 (en) 1998-10-02 2005-11-15 Lucent Technologies Inc. Retrieval and manipulation of electronically stored information via pointers embedded in the associated printed material
CN1145872C (zh) * 1999-01-13 2004-04-14 国际商业机器公司 手写汉字自动分割和识别方法以及使用该方法的系统
US6658151B2 (en) * 1999-04-08 2003-12-02 Ricoh Co., Ltd. Extracting information from symbolically compressed document images
US6678415B1 (en) * 2000-05-12 2004-01-13 Xerox Corporation Document image decoding using an integrated stochastic language model
US7336827B2 (en) * 2000-11-08 2008-02-26 New York University System, process and software arrangement for recognizing handwritten characters
JP4136316B2 (ja) * 2001-01-24 2008-08-20 富士通株式会社 文字列認識装置
AUPR824501A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw003)
US7672507B2 (en) * 2004-01-30 2010-03-02 Hewlett-Packard Development Company, L.P. Image processing methods and systems
US7089099B2 (en) * 2004-07-30 2006-08-08 Automotive Technologies International, Inc. Sensor assemblies

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
US5841902A (en) * 1994-09-27 1998-11-24 Industrial Technology Research Institute System and method for unconstrained on-line alpha-numerical handwriting recognition
EP0953933A2 (en) * 1998-04-30 1999-11-03 Motorola, Inc. Text recognizer and method using non-cumulative character scoring in a forward search
US6256410B1 (en) * 1998-07-30 2001-07-03 International Business Machines Corp. Methods and apparatus for customizing handwriting models to individual writers

Also Published As

Publication number Publication date
DE60225170D1 (de) 2008-04-03
AU2002333064B2 (en) 2006-07-20
US7359551B2 (en) 2008-04-15
WO2003034325A1 (en) 2003-04-24
ATE386989T1 (de) 2008-03-15
CA2463230A1 (en) 2003-04-24
CN1571979A (zh) 2005-01-26
US20100189352A1 (en) 2010-07-29
US20110293181A1 (en) 2011-12-01
JP2005505868A (ja) 2005-02-24
AU2006225217A1 (en) 2006-10-26
KR20050036864A (ko) 2005-04-20
US7848574B2 (en) 2010-12-07
US20110052066A1 (en) 2011-03-03
IL161383A0 (en) 2004-09-27
US20050175241A1 (en) 2005-08-11
DE60225170T2 (de) 2009-03-05
AUPR824501A0 (en) 2001-11-08
CA2463230C (en) 2009-07-28
JP4274941B2 (ja) 2009-06-10
US20120328195A1 (en) 2012-12-27
ZA200402925B (en) 2005-02-23
US20080144938A1 (en) 2008-06-19
US7697761B2 (en) 2010-04-13
AU2006225217B2 (en) 2008-02-28
KR100651762B1 (ko) 2006-12-01
US8280168B2 (en) 2012-10-02
EP1444642A4 (en) 2006-07-26
EP1444642B1 (en) 2008-02-20
US8009914B2 (en) 2011-08-30
EP1444642A1 (en) 2004-08-11

Similar Documents

Publication Publication Date Title
CN100533470C (zh) 对手写字符进行解码的设备及方法
CA2534617C (en) Handwritten word recognition based on geometric decomposition
Al-Helali et al. Arabic online handwriting recognition (aohr) a survey
AU2002333064A1 (en) A method and apparatus for decoding handwritten characters
EP1897034A2 (en) Handwriting recognition using neural networks
Zeki The segmentation problem in arabic character recognition the state of the art
Chowdhury et al. Online handwriting recognition using Levenshtein distance metric
CN105023029B (zh) 一种联机手写藏文音节识别方法及装置
CN102360436B (zh) 一种基于部件的联机手写藏文字符的识别方法
Xiao et al. On-line handwritten Chinese character recognition directed by components with dynamic templates
Blanchard et al. On-line handwritten documents segmentation
Niels Dynamic time warping
Lin et al. Table detection in online ink notes
Kang et al. Design of an interface on PDA for Korean
Jun et al. On-line cursive korean character recognition by using curvature models
Al-Helali Online Arabic Text Recognition Using Statistical Techniques
Zeki Keynote: The segmentation problem in Arabic character recognition: the state of the art
Srihari et al. Written Language Input
Kim et al. On-line recognition of cursive Hangul characters by modeling extended graphemes
ZA200507772B (en) Written character recognition using character models
Kim et al. Matching Algorithm for Hangul Recognition Based on PDA
Plamondon ÉTAPES DE DÉVELOPPEMENT D'UN BLOC-NOTES ÉLECTRONIQUE
Nahar Off-line Arabic Hand-WritingRecognition Using Artificial Neural Networkwith Genetics Algorithm
KR19990042025A (ko) 식별력있는 한글 자소 설계와 이를 이용한 필기 인식방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090826

Termination date: 20121015