CN1163842C - 字符识别 - Google Patents

字符识别 Download PDF

Info

Publication number
CN1163842C
CN1163842C CNB998101370A CN99810137A CN1163842C CN 1163842 C CN1163842 C CN 1163842C CN B998101370 A CNB998101370 A CN B998101370A CN 99810137 A CN99810137 A CN 99810137A CN 1163842 C CN1163842 C CN 1163842C
Authority
CN
China
Prior art keywords
character
curve
template
desired method
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB998101370A
Other languages
English (en)
Other versions
CN1315024A (zh
Inventor
���ɡ�������
噶纳·斯帕
�������ɭ
里卡德·伯塞尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zi Decuma AB
Original Assignee
Decuma AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Decuma AB filed Critical Decuma AB
Publication of CN1315024A publication Critical patent/CN1315024A/zh
Application granted granted Critical
Publication of CN1163842C publication Critical patent/CN1163842C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Holo Graphy (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种用于识别字符的方法,该方法包括以下步骤:检测字符联合,预处理该字符联合,包括将预处理的字符联合与一个或多个模板符号进行比较,及应用一个决策规则以便或者抛弃一个模板符号或者确定该模板符号包括于字符联合内。预处理字符联合的步骤包括以下步骤:将字符联合表示为一条或多条曲线,及将所述一条或多条曲线实现参数化,及相对于不同变换类别来形成所述一条或多条曲线的一个或多个形状。进行比较的步骤包括以下步骤:形成一个或多个几何接近度量度,及为每个形状确定在所述形状与模板符号的相应地确定的形状之间的所述几何接近度量度的值。最后,应用一个决策规则的步骤包括以下步骤:考虑到所述值后选择一个或多个模板符号。

Description

字符识别
技术领域
本发明涉及一种进行字符识别的方法。在这个关于数量的中性复合词中“字符”系指单独的字符例如字母和数字,也包括数个字符的组合例如词。此处当然包括一般使用的字符和虚构字符。
技术背景
存在多个已知的用于识别字符尤其是用于识别手写字符的方法,后者要求对字符进行特别好的解释。已知方法中一些方法基于对形成手写字符的每一笔画的检测。将几何特性例如每个笔画或笔画的一部分的方向、倾斜和角度加以确定并且与所存已知字符的相应数据进行比较。认为所写字符是其几何特性最能对应于所写字符的几何特性的所存储字符。几何特性涉及覆盖所用书写面的xy座标系统。这类已知方法公开于例如US-5,481,625和US-5,710,916中。这类方法的一个问题是它们对旋转敏感。例如,如果人们在书写面的对角线上书写,该方法难于正确地确定正在写哪一个字符。
US-5,537,489公开了一种方法,通过将字符归一化来将它们预处理。将所写字符采样,及将每个字符表示为一对座标。不是仅只比较座标平面中的字符,而是确定一种变换,用于最好地将所写字符调整至模型字符。也间接地考虑以上方法所无法处理的旋转和一定类型的变形。使用变换来将所写字符归一化。具体地,字符的归一化如下进行:将字符平移以使其中心点处于座标原点,也即模型字符的中心点,此后将字符改变尺寸和旋转以使它以最好的可能方式对应于模型字符。
此方法的一个缺点是归一化要求计算能力以及在任何情况下都必须确定所写字符最像哪一个模型字符来选择模型字符。
US-5,768,420中公开了的确能处理旋转的另一个方法。在此已知方法中使用一个称为“正切比”的比例来描述曲线识别。通过沿着一条曲线例如一个字符的一部分选择一系列点对来将曲线映射,其中每一点对上的两个点的正切线以一定角度相交。计算自相交点至该点对上相应点的距离之比,因而识别该曲线。此方法原理上对平移、改变尺寸和旋转不敏感。然而,这在许多方面受限制。首先,它不允许识别那些两点的正切线不在确定的角度相交的曲线形状。在一般情况下一个字符的至少有些部分会包括这类相对于所选相交角度而言的无法确定的曲线形状。这减低该方法的可靠性。
发明内容
本发明的一个目的是提供一种识别字符方法,它不具有以上所述缺点并且在很大程度上接受手写字符的个别字体和打印字符的不寻常字体,同时还易于使用有限计算能力来实施。
本发明提供一种用于识别字符的方法包括以下步骤:-检测一个字符联合,-将字符联合进行预处理,-将预处理的字符联合与一个或多个模板符号进行比较,及-应用一个决策规则以便或者抛弃一个模板符号或者决定将该模板符号包括于字符联合之内,将字符联合进行预处理的步骤包括以下步骤:-将字符联合表示为一条或多条曲线,及-将所述一条或多条曲线实现参数化,该方法的特征在于将字符联合进行预处理的步骤还包括相对于不同变换类型来形成所述一条或多条曲线的一个或多个形状的步骤,其中所述变换类型中的至少一个类型下的变换是所有投射变换所构成的组的一个子组,所述子组包括非等大变换,并且其中所述一个或多个形状相对于所述变换类型是不变的,进行比较的步骤包括以下步骤:-形成一个或多个几何接近度量度,-为每个形状确定在所述形状与模板符号的相应地确定的形状之间的所述几何接近度量度的值,应用一个决策规则的步骤包括以下步骤:-考虑到所述值后选择一个或多个模板符号。
根据本发明,如权利要求书中所定义的“模板符号”系指从单独字符的一部分到复合词或其他复杂字符中的每个内容,其中字符的一部分例如是一段圆弧或一段笔画而字符是一个字母或数字。类似地,名词“字符联合”系指从单独字符到数个字符的复合中的每个内容。在以下实施例的描述中能明显地看出所提名词的扩展意义。
下面将在实施例中参照附图更详细地描述本发明及其进一步的优点。
附图说明
图1显示包括手写字符的字符联合的例子,用于阐述根据本发明的方法的优选实施例中的某些步骤,
图2和3显示包括手写字符的字符联合的不同变换的例子,
图4显示包括数个字符的字符联合的识别例子,及
图5显示用于实现该方法的设备的实施例。
具体实施方式
根据本发明,字符识别方法包括一系列主要步骤:
a)检测字符联合,
b)预处理字符联合,
c)将预处理的字符联合与一个或多个模板符号进行比较,及
d)使用一个决策规则以便判断模板符号中是否有任何一个包括于字符联合中。
根据优选实施例,可根据以下的描述来执行不同的主要步骤。该实施例优选地设想为用于识别书写于压力敏感显示器上的字符联合,该压力敏感显示器可在市场上买到。应该注意到,本发明也可与识别手写字符联合同样地用于识别来源于硬拷贝并且扫描入计算机的打印字符。下面将描述特别适合于识别打印的扫描的字符联合的实施例。在此实施例的步骤的以下描述中,为简化起见,假设字符联合包括一个字符。
在步骤a)中,与在压力敏感显示器上书写字符的同时每隔一定时间间隔检测字符上的点。因此获得一个点排序序列。在步骤b)中执行以下操作。通过在点与点之间进行插入运算,生成字符的曲线表示。曲线表示包括一条或多条通过点序列的曲线。检测笔的任何抬起动作以便阻止在抬起笔的空间内进行插入运算。插入运算结果得到那些考虑为包含一条或多条曲线的字符例如“t”、“”和“s”。每条曲线或曲线的复合可以全面地看作一个不可分的几何单位。这意味着例如根据本发明的方法以许多方式对完整的字符进行运算(全局字符解释)。每一点表示为两个座标,它们标示在有限的显示平面上该点的位置。下面称为x1的一个座标标示横向位置以及下面称为x2的第二座标标示垂直方向位置。该曲线可以方便地参数化为Φ(t)=(Φ1(t),Φ2(t)),a≤t≤b,其中为简化起见,a=0和b=1并且根据任何合适的参数化规则在n个点t1<t2...<tn处采样。开始时圆弧长度用作优选地执行参数化操作所依据的规则,这意味着这些点的位置是等距的。应该注意到,由于书写者的书写速度不规则,这与初始座标样本不同。使用圆弧长度可看作参数化的标准化,这便于在下面与以相应方式参数化的和采样的模板符号进行比较。对于某些类别的变换,可能需要重新参数化,这将在下面说明。
为将字符与模板符号比较,必须形成一种表示以便允许进行定量比较。允许与预先定义的模板符号有某些差别,即,例如即使相对于其形状而言在一定程度上与模板符号不同,但“a”仍然解释为“a”。根据本发明,使用根据不同变换的定义。取决于对灵活性和正确性的要求,预先使用不同类别的变换,这些类别包括一种或多种类别的变换,例如平移、旋转、改变尺寸、修剪和翻转。这阐述于图2和3中。图2显示方框2a内手写的“a”。其他三个字符已经经受过不同仿射变换。包括仿射变换的变换类别允许旋转、修剪、翻转、改变尺寸和平移。相对于方框2a内的字符而言,方框2b和2c内的字符已经经受过平移、旋转、改变尺寸和修剪。方框2d内的字符已经经受过平移、翻转、旋转和改变尺寸。
图3阐述只包括改变尺寸、旋转和平移的正类似性变换。根据本发明的方法的这个实施例,容许的差别限于正类似性变换。这意味着一个书写字符或字符一部分通过改变尺寸、旋转和平移的合适组合可以成为与模板符号相对应,因而可解释为由该模板符号所代表的同一字符或字符一部分。该对应关系不必是完全的,这将在以下说明。
通过形成参数化曲线的不变量所提供的表示对于本发明是优选的。根据本发明的有用的不变量应该允许使解释接近于人们对具体字符所作解释。这意味着人们要求以高精确度正确地解释的那些字符,也即解释为书写者认为是他或她所书写的那些字符,应该能由根据本发明的方法来正确地和以高精确度来解释。因此重要的是所构作的不变量应该以很好的平衡方式成为选择性的。根据本发明的不变量因而在以下定义的基础上构成。如果φ是一条根据以上所述的参数化曲线,及G是曲线的一组变换,则集合d(Φ)={ψ|ψ=g(Φ),g ∈G}及其等效的重写称为Φ的形状。熟悉技术的人知道该定义允许使用许多可能的不变量,但它们的共同点是它们将曲线如上所述地作为不可分单位来处理。
根据本发明的实施例,对应于正类似性变换组的形状由s(Φ)=linhull({(Φ1,Φ2),(-Φ2,Φ1),(1,0),(0,1)})给出,即从参数化曲线Φ中构作的线性空间。如熟悉技术的人所知道的,s(Φ)恰好是d(Φ)的等效的释义。实际上,此形状的使用意味着所有能够通过正类似性变换来彼此进行变换的参数化曲线具有与形状的空间相同的线性空间。
相反,根据本发明的另一个实施例,允许实现仿射变换。然后在重写之后该形状由s(Φ)=linhull(Φ1,Φ2,1)给出,这在例如R.Berthilsson在Dept.of Mathematics,Lund Institutte of Technology 1997的Technical Report“仿射形状的扩展”一文中有更详细的描述。
在步骤c)中,所写字符的形状与若干个模板符号的相应地形成的形状进行比较。在本发明的这个实施例中,作为开始步骤,如下提供模板符号:由一个用户在显示器上用手写出他或她可能需要的全部字符,一次写一个,根据以上所述的步骤a)和b)将它们处理并且作为模板符号存储起来。如上所述,每个模板符号包括一条或多条曲线,这些曲线代表字符一部分或一个完整字符,实际上这意味着可能需要数个模板符号来构作一个字符。然而相反,如以下将要讨论的,一个模板符号也能表示数个字符的序列。
根据本发明,一种比较形状的方法是使用接近度的几何量度。可以分别对以上根据优选实施例和根据选代的实施例所形成的形状使用一种形状的几何接近度量度μ,它们包括可能的参数化曲线S的空间之内的各线性子空间。这类几何接近度量度的例子是:
            μ=‖(I-Ps(φ)Ps(ψ)HS
其中HS代表Hilbert-Schmidt范数及I是单位矩阵。
在定义中,s(Φ)和s(ψ)代表这类线性子空间。Ps(Φ)和Ps(ψ)还分别代表在s(Φ)和s(ψ)上的正交投影。HS代表Hilbert-Schmidt范数及I是单位矩阵。几何接近度量度μ的计算包括选择一个标量积。
两个具有Rn上的值的函数Φ(t)和ψ(t)的标量积的一般例子是:
Σ k = 0 l ∫ d k φ ( t ) dt k · d k ψ ( t ) dt k dm k
其中dmk是正Radon量度及·代表Rn上的标量积。
由于每条采样的曲线包括多个点,每个点有两个座标,所以在对形状进行比较性处理时使用矩阵表示是方便的。下面描述使用矩阵表示来描述曲线及构作几何接近度量度的步骤并在算上如下执行。
我们将待检测的字符的曲线命名为ψ(t)=(ψ1(t),ψ2(t)),0≤t≤1,及模板符号的曲线命名为φ(t)=(Φ1(t),Φ2(t),0≤t≤1。通过在时间点0=t1<t2...<tn=1上将曲线采样,可以形成以下矩阵
M 1 = φ 1 ( t 1 ) - φ 2 ( t 1 ) 1 0 φ 1 ( t 2 ) - φ 2 ( t 2 ) 1 0 . . . . . . . . . . . . φ 1 ( t n ) - φ 2 ( t n ) 1 0 φ 2 ( t 1 ) φ 1 ( t 1 ) 0 1 φ 2 ( t 2 ) φ 1 ( t 2 ) 0 1 . . . . . . . . . . . . φ 2 ( t n ) φ 1 ( t n ) 0 1
M 2 = ψ 1 ( t 1 ) - ψ 2 ( t 1 ) 1 0 ψ 1 ( t 2 ) - ψ 2 ( t 2 ) 1 0 . . . . . . . . . . . . ψ 1 ( t n ) - ψ 2 ( t n ) 1 0 ψ 2 ( t 1 ) ψ 1 ( t 1 ) 0 1 ψ 2 ( t 2 ) ψ 1 ( t 2 ) 0 1 . . . . . . . . . . . . ψ 2 ( t n ) ψ 1 ( t n ) 0 1
按照熟悉技术的人所知道的方式将矩阵实行QR分解,以使M1=Q1R1和M2=Q2R2,其中Q1和Q2是正交矩阵及R1和R2是上半三角矩阵。在给定参数化和采样的条件下,矩阵Q1和Q2分别代表所检测字符和模板符号的形状。
可以如下构作几何接近度量度μ:
μ ( Q 1 , Q 2 ) = | | Q 2 - Q 1 Q 1 T Q 2 | | F 2
其中范数    ‖·‖F    标示Frobenius范数。在以上标量积的一般例子中,当I=0和dm0是区间[0,1]上的通常Lebesgue量度时,可以确切地获得此几何接近度量度。标量积的选择影响该方法的性能。
在确定所检测字符的形状与模板符号的所有联合或子联合的形状之间的接近量度度的值之后,执行步骤d)。在此步骤中,将每个值与为每个模板符号定义的个别接受度限额进行比较。那些其接近量度度值小于它们的相应接受度限额的模板符号被认为是所写字符的似乎真实的解释。在这些似乎真实的解释中选择其值最小的模板符号。相反,如果没有一个值小于其接受度限额,则进行细化确定。所有模板符号的接受度限额也可以是一个相同值。使用单独的接受度限额的优点是在对应关系的情况下较复杂字符例如“@”会有相当高的接近量度度值,而在对应关系的情况下较简单字符例如“1”一般具有低接近量度度值。有可能使用其他不变量,下面将描述它们中的一部分。
理论上,当使用正类似性变换从彼此之中获得曲线以及Φ和ψ是同一曲线的参数化时,接近量度度必须满足μ(s(Φ),s(ψ))=0。由于人们在书写时并不严格地遵循模板符号所允许的类似性变换,所以应该将接受度限额选择为大于零。
因此,一方面将接受度限额确定为>0,另一方面,当没有小于接受度限额的值时不进行解释,犹如书写字符在模板符号中不具有等效字符那样。作为替代,根据本实施例实行重新参数化,因为参数化在相当大的程度上影响最后结果。曲线ψ的优选的重新参数化意味着使用一对一函数γ:[0,1]→[0,1]将它合在一起。例如γ(t)=1-t能够满足它,这意味着字符是在反方向内书写的。根据以下最小化问题的解来确定实行何种重新参数化
min γ μ ( s ( φ ) , s ( ψ o γ ) )
其中对于以上已经描述过的所有γ实行最小化运算。
然后重复以上所述各步骤并且获得新的接近量度度值。如果没有一个是低于其接受度限额的,则将该书写字符抛弃并且将此点通知用户,例如请求他或她重新书写字符。如果希望在重新参数化之后加速接近量度度的确定过程,则可以从第一次确定中选择一组最小的例如三个最小的接近度值,并且在第二次确定中只与那些包括于该组内的模板符号进行比较。在某些情况下,除将所有模板符号都加以考虑的情况之外,这可以在第二次确定中就产生最后结果。
几何接近度量度μ不只得到字符的不同解释之间的排序顺序,而且也给出两个字符如何类似的量度。这带来一个可能性,即也可使用本方法来分别证实和识别签字(此处将首字母看作签字)。然而,在此种使用中,弧长参数化不是优选的参数化类型,因为它排除书写时的动态信息。而在此使用中这类信息是有价值的。当然还有其他更合适的变量。
迄今为止已经描述的优选实施例基于以下事实:存在合适的书写字符可与之比较的模板符号。此外针对一个字符进行了描述。正常情况下这不是单独的字符而是写在显示器上的具有完整词的草书。从用户的观点看,希望能够书写草书,这对方法要求很多。
上下文中的一个问题是字符联合可能包含多个字符组合。要求用户按照模板符号来书写所有可能的字符或词是不合理的。
与此同时,如果能够避免对书写形状的限制是有利的。如果将用户严格地限制,例如只许用户一个时间内书写一个字符以使以上所述的情况始终存在,则能使情况相对地清楚,但这并不是用户友好的。根据本发明,允许用户书写草书。因此难于知道例如曲线中何处字符开始和结束。用于标示字符的起点和终点的各点命名为转折点,以及寻找可能的转折点将给识别问题增加复杂性。用以下方式根据本发明方法的实施例来解决此问题的复杂性。应该指出,在此实施例中用相同方式实行以上步骤。以下的描述主要涉及将字符联合进行预处理的步骤以及比较步骤。
如果在一个词之内的每个字符之后抬起笔,这点可以加以利用。每次抬起笔产生一个断点,可以由在空间上或时间上相对地远离的两个点来检测断点。自然地,是在弧长参数化之前进行这个检测的。此处字符联合包含n条曲线。可将断点看作似乎真实的转折点来将两个字符彼此区别开。这将注意力集中于其中在书写包含于字符内的数个笔画时在它们之间抬起笔的那些字符。通过检测断点用数个曲线来表示这一字符。每条曲线可以使用重新改变尺寸的弧长来进行参数化,这意味着每条曲线包含同样数量的采样点。假设l1,l2,...,ln是曲线以及sk是曲线l至k的组成部分。将曲线s1,s2,…,sk的复合与模板符号的数据库进行比较,其中k是包括于任何模板符号中的曲线的最大序号。假设sk1是给出一个或多个对应关系的曲线中的最长组成部分,即当将它与模板符号比较时,它给出一个或多个低于一个或多个接受度限额的接近度量度值。即使sk1对应于一个或多个模板符号,仍然不能肯定这能给出正确的解释。因而根据本方法的这个实施例执行似乎真实性测试,这将在下面描述。如果解释不是似乎真实的,则将sk1缩短至给出对应关系的曲线中的次长组成部分sk2。再一次执行似乎真实性测试。
如果对于任何sk没有一个解释是似乎真实的,则选择s1的最好解释。余下的曲线也作相应处理。就连写字体而言,仅只断点是不够用作似乎真实转折点的,但在曲线内还可能有转折点。应该注意到,事实上以上寻找转折点的过程是在将所有书写字符的组成部分重新参数化之后进行的。
除其他因素之外,“似乎真实性测试”一词覆盖所谓可信度集合。现在通过图4举例,在以上分别对包含数个字符的字符联合和包含数条曲线的字符的识别处理中将可信度集合用作似乎真实性测试。
假设书写字符是“ta”(英文中的“eat”),即根据图4a来书写的完整词。通过检测断点及使用重新改变尺寸的弧长来实现重新参数化,将“”识别,下一个轮到“t”。水平以及垂直笔画可以解释为一个“1”,即“t”可以解释为“11”。根据图4b,模板符号与相关连的可信度集合一起存储,其中所示模板符号“1”和“t”具有相应的可信度集合,如阴影所示。假设“t”的垂直笔画可解释为模板符号“1”。可以在生成形状的类别中确定用于在垂直笔画中传输模板符号的变换a:R2→R2。如果将a加于可信度集合上,则得到图4c的结果。下一条曲线即水平笔画是在可信度集合中,这是禁止的,因此将该解释定为不真实的。熟悉技术的人能够意识到,可信度集合不必只由直线笔画来识别,它可以具有更为一般的外观。可以将另一个包含第一集合的可信度集合连至每个模板符号。如果下一条曲线也在第二可信度集合之外,则解释为犹如下一个字符是新词中的第一个字符。
另一个选代的似乎真实性测试意味着对在可信度集合的描述中确定的变换进行研究。如果该变换在一定范围之外,则将该解释定为不真实的。这种范围可用于例如确定,相对于先前解释过的字符旋转多少而言,该变换可以将字符旋转多少。也可排除多余的变形。例如,为将“S”与“s”区别开,可以针对先前已经解释过的符号的放大来计算该变换的放大。
以上所述的根据本发明的方法的实施例只能看作非限制性例子,因此有可能在所附权利要求书中定义的本发明范围内在以上所述实施例之外作出许多修改。以下是许多进一步修改的例子。
作为以上所述的重新参数化的选代例子,可以直接在第一次确定的接近度量度的最小值的基础上作出决定。
其他修改的例子是选择另一个接近度量度,对接受度限额选择不同值以便要求对不同用户的一定适应性,选择不同类型的重新参数化和不同类型的形状,例如仿射形状。
至于就不同类型的形状而言,作为选代,可以对每个字符联合平行地使用两个或多个形状。这意味着为每个字符联合提供数个不变量并且在以下步骤中平行地进行处理。这提供更高正确度和更快识别过程。
实际上,可以将根据本发明的方法使用于例如电子笔记本和类似设备中,以及用于移动电话中而具有通过可写窗口通信的增强型可能性。
可以使用市场上现成的用于算术计算的编程语言例如C、C++或FORTRAN将根据本发明的方法以计算机程序的形式实施于计算机中,或者如下所述地用作根据本发明的专门构造的设备。在这两种情况下,都将模板符号作为数据库存储起来。如果需要,可以改变数据库。
如图5中所示,一个用于实现本方法的设备的实施例包括一个压力敏感显示器52,一个具有检测器56的显示通信单元54,一个控制单元58,一个存储器控制单元60,一个存储器单元62和一个处理单元64。显示通信单元54,控制单元58,存储器控制单元60和处理单元64通过总线66在单元之间通信并且传输数据、地址和控制信号。将字符联合书写于显示器52上,并且由检测器56进行检测从而提供点的排序序列。在存储器单元62内存储模板符号和检测的字符联合。依靠处理单元执行计算操作,这些操作包括将点序列解释为一条或多条曲线,每条曲线的参数化,将字符的预处理联合与模板符号进行比较以及应用决策规则。在存储器单元60中也存储用于执行该方法的软件。控制单元48运行程序并且通过显示通信单元54和显示器52与用户通信。
该设备也适用于可选的设置,除其他因素之外,这些设置可能包括选择形状,选择接近度量度,选择参数化和选择决策规则。这些选择操作是通过显示器52执行的。
以上的描述是主要基于以下事实:字符书写在显示器上并且在它们书写的同时对它们进行检测。一个选代的例子是字符早已书写于一张纸上,然后检测例如扫描这些字符。这涉及手写字符以及打印字符。因此,检测操作包括读取(扫描)纸上字符的操作而不是识别显示的书写的操作。有利的是通过边界检测将读取的数据变换为所述点的排序序列。当然这也是本发明范围内的一种修改。在此实施例中,预处理包括在所述边界检测和参数化的基础上形成一条或多条特性曲线,例如字符的一条或多条边界曲线。当如此定义了边界曲线之后,以下步骤与以上所述的优选实施例中步骤相同。
可以用许多不同方式选择决策规则。以上所述的决策规则的一个改变是选择其接近度量度值低于接受度限额的所有模板符号。随后可以根据以上所述类型的任何细化决定来进一步处理模板符号。也可以与另一个用于指出最为似乎真实的选代内容的选择方法合并。这一方法的例子是使用字符的统计学特性,用于标示文本中存在单独字符或字符组合的概率。
此外,用于确定接受度限额的一个选代方法是将模板符号合成为组,并且将相同限额使用于一个组内。
根据本发明的方法的可靠性在于它能够识别有相当变形的字符及能够管理草书。数据库内容并不关键,但原则上一组单独的字符已经足够。然而,为以高正确度识别不同字体和手写字符,为每个字符存储数个变量是有利的,这些变量包括处于合适的和允许的变换类别之外的变形。存储一定字符组合可能是有利的,例如能够更安全地将连在一起的两个1即“11”与“u”区别开。

Claims (15)

1.一种用于识别字符的方法包括以下步骤:
-检测一个字符联合,
-将字符联合进行预处理,
-将预处理的字符联合与一个或多个模板符号进行比较,及
-应用一个决策规则以便或者抛弃一个模板符号或者决定将该模板符号包括于字符联合之内,将字符联合进行预处理的步骤包括以下步骤:
-将字符联合表示为一条或多条曲线,及
-将所述一条或多条曲线实现参数化,该方法的特征在于将字符联合进行预处理的步骤还包括相对于不同变换类型来形成所述一条或多条曲线的一个或多个形状的步骤,其中所述变换类型中的至少一个类型下的变换是所有投射变换所构成的组的一个子组,所述子组包括非等大变换,并且其中所述一个或多个形状相对于所述变换类型是不变的,
进行比较的步骤包括以下步骤:
-形成一个或多个几何接近度量度,
-为每个形状确定在所述形状与模板符号的相应地确定的形状之间的所述几何接近度量度的值,
应用一个决策规则的步骤包括以下步骤:
-考虑到所述值后选择一个或多个模板符号。
2.如权利要求1中所要求的方法,其特征在于检测一个字符联合的步骤包括将字符联合表示为一组点的步骤,以及将字符联合表示为一条或多条曲线的步骤包括以下步骤:
-根据所述一组点生成一个点的排序序列,及
-在点之间实行插入操作以便生成所述一条或多条曲线。
3.如权利要求1所要求的方法,其特征在于参数化步骤包括以下步骤:
-根据参数化规则来设置一个逼近该曲线的函数,及
-在多个等距点处将该函数采样。
4.如利要求3中所要求的方法,其特征在于参数化规则是该曲线的一段弧长。
5.如利要求1所要求的方法,对于在其上直接书写字符的显示器上所显示的字符联合进行检测,该方法的特征在于检测的步骤是在书写期间执行的。
6.如权利要求1所要求的方法,其特征在于按照来源于一个扫描器的数据数量对字符联合进行检测。
7.如权利要求6所要求的方法,其特征在于将字符联合进行预处理的步骤包括对字符联合进行边界检测。
8.如利要求1所要求的方法,其特征在于应用一个决策规则的步骤包括以下步骤:确定所述接近度量度的值的接受度限额以及只当至少一个与模板符号相关的值是在所述接受度限额之内时才选择一个模板符号。
9.如权利要求8所要求的方法,其特征在于将单独的接受度限额赋予每个模板符号。
10.如权利要求8所要求的方法,其特征在于至少两个模板符号具有同一个接受度限额。
11.如权利要求8所要求的方法,其特征在于如果参数化曲线的形状与模板符号之间的所述接近度量度的所有值都在接受度限额之外,则将参数化曲线重新进行参数化以便模板符号与重新参数化曲线的形状之间的相应接近度量度的一个或多个值减少。
12.如权利要求8所要求的方法,其特征在于根据只允许类似性变换这一事实来确定接受度限额。
13.如权利要求1所要求的方法,其特征在于应用一个决策规则的步骤包括执行所选模板符号的似乎真实性测试。
14.如权利要求13所要求的方法,其特征在于似乎真实性测试是基于可信度集合之上的。
15.使用如以前权利要求中任何一项所要求的方法来证实或识别签字。
CNB998101370A 1998-08-26 1999-08-25 字符识别 Expired - Lifetime CN1163842C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9802832-7 1998-08-26
SE98028327 1998-08-26
SE9802832A SE514377C2 (sv) 1998-08-26 1998-08-26 Teckenigenkänning

Publications (2)

Publication Number Publication Date
CN1315024A CN1315024A (zh) 2001-09-26
CN1163842C true CN1163842C (zh) 2004-08-25

Family

ID=20412341

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998101370A Expired - Lifetime CN1163842C (zh) 1998-08-26 1999-08-25 字符识别

Country Status (14)

Country Link
US (2) US6711290B2 (zh)
EP (1) EP1105833B1 (zh)
JP (1) JP4580554B2 (zh)
KR (1) KR100615124B1 (zh)
CN (1) CN1163842C (zh)
AT (1) ATE331994T1 (zh)
AU (1) AU749849B2 (zh)
CA (1) CA2341266C (zh)
DE (1) DE69932167T2 (zh)
HK (1) HK1038975A1 (zh)
IL (2) IL141294A0 (zh)
RU (1) RU2001107822A (zh)
SE (1) SE514377C2 (zh)
WO (1) WO2000013131A1 (zh)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7750891B2 (en) 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US7286115B2 (en) * 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system
US7821503B2 (en) 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
AU5299700A (en) * 1999-05-27 2000-12-18 America Online, Inc. Keyboard system with automatic correction
US7030863B2 (en) 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US20040037463A1 (en) * 2002-01-28 2004-02-26 Calhoun Christopher L. Recognizing multi-stroke symbols
US8238718B2 (en) * 2002-06-19 2012-08-07 Microsoft Corporaton System and method for automatically generating video cliplets from digital video
US8583440B2 (en) * 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
SE0202446D0 (sv) 2002-08-16 2002-08-16 Decuma Ab Ideon Res Park Presenting recognised handwritten symbols
CN100429716C (zh) * 2002-08-19 2008-10-29 皇家飞利浦电子股份有限公司 用于检测记录载体上的异常的扫描设备和方法
US20050281467A1 (en) * 2003-01-24 2005-12-22 Stahovich Thomas F Recognizing multi-stroke symbols
CN1305003C (zh) 2003-09-29 2007-03-14 摩托罗拉公司 用户界面上的书写标记识别
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
JP2008516638A (ja) * 2004-05-14 2008-05-22 カーディマ・インコーポレイテッド 補強部材を備えた除去プローブ
US8095364B2 (en) * 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7623685B2 (en) * 2004-08-20 2009-11-24 The Regents Of The University Of Colorado Biometric signatures and identification through the use of projective invariants
US20060227066A1 (en) * 2005-04-08 2006-10-12 Matsushita Electric Industrial Co., Ltd. Human machine interface method and device for automotive entertainment systems
US20060227065A1 (en) * 2005-04-08 2006-10-12 Matsushita Electric Industrial Co. Ltd. Human machine interface system for automotive application
KR100787134B1 (ko) * 2005-08-05 2007-12-21 한국정보통신주식회사 정규화된 전자서명 인쇄 장치
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
KR100825209B1 (ko) * 2005-11-17 2008-04-25 김진우 서명 데이터의 암호화장치 및 암호화방법
US7587378B2 (en) * 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
TW200809660A (en) * 2006-03-01 2008-02-16 Zi Decuma Ab A method for additive character recognition and an apparatus thereof
US7580925B2 (en) 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
US20080154576A1 (en) * 2006-12-21 2008-06-26 Jianchao Wu Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities
US8225203B2 (en) * 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8201087B2 (en) * 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8299943B2 (en) 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
JP2009199102A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 文字認識プログラム、文字認識装置及び文字認識方法
US20090245646A1 (en) * 2008-03-28 2009-10-01 Microsoft Corporation Online Handwriting Expression Recognition
US8917935B2 (en) 2008-05-19 2014-12-23 Microsoft Corporation Detecting text using stroke width based text detection
US20100166314A1 (en) * 2008-12-30 2010-07-01 Microsoft Corporation Segment Sequence-Based Handwritten Expression Recognition
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
CN101763516B (zh) * 2010-01-15 2012-02-29 南京航空航天大学 一种基于拟合函数的文字识别方法
US8310461B2 (en) 2010-05-13 2012-11-13 Nuance Communications Inc. Method and apparatus for on-top writing
DE202010007896U1 (de) 2010-06-07 2010-10-07 Benyoucef, Dirk, Dr.-Ing. Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern
DE102010023557A1 (de) 2010-06-07 2011-12-08 Dirk Benyoucef Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern
TWI478074B (zh) * 2010-12-01 2015-03-21 Inst Information Industry 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
US10061997B2 (en) 2011-04-11 2018-08-28 Apple Inc. Handwriting capture techniques
CN103324925A (zh) * 2012-03-22 2013-09-25 佳能株式会社 用于获得用于手写字符识别的字符数据的方法和装置
US10748031B1 (en) 2019-05-22 2020-08-18 Read-Ink Corporation Handwriting recognition systems and methods

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3614736A (en) 1968-05-21 1971-10-19 Ibm Pattern recognition apparatus and methods invariant to translation, scale change and rotation
US3636513A (en) 1969-10-17 1972-01-18 Westinghouse Electric Corp Preprocessing method and apparatus for pattern recognition
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
US5333209A (en) * 1992-03-24 1994-07-26 At&T Bell Laboratories Method of recognizing handwritten symbols
JPH05290221A (ja) 1992-04-15 1993-11-05 Pioneer Electron Corp オンライン手書文字認識装置
CA2097095A1 (en) 1992-07-29 1994-01-30 Frank William Sinden Method of normalizing handwritten symbols
WO1994004992A1 (en) * 1992-08-20 1994-03-03 Communication Intelligence Corporation A method for dynamic reconstruction of handwritten data
JP3113769B2 (ja) * 1993-10-15 2000-12-04 株式会社日本デジタル研究所 文字認識装置
US5745599A (en) 1994-01-19 1998-04-28 Nippon Telegraph And Telephone Corporation Character recognition method
US5768420A (en) * 1994-01-21 1998-06-16 Lucent Technologies Inc. Method and apparatus for handwriting recognition using invariant features
US5699456A (en) * 1994-01-21 1997-12-16 Lucent Technologies Inc. Large vocabulary connected speech recognition system and method of language representation using evolutional grammar to represent context free grammars
US5710916A (en) 1994-05-24 1998-01-20 Panasonic Technologies, Inc. Method and apparatus for similarity matching of handwritten data objects
US5854855A (en) * 1994-09-09 1998-12-29 Motorola, Inc. Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
JPH08163270A (ja) * 1994-12-05 1996-06-21 Nippon Telegr & Teleph Corp <Ntt> 無声電話通信端末装置
JP3454335B2 (ja) * 1995-07-17 2003-10-06 日本電信電話株式会社 オンライン手書き文字認識方法及びその装置
JPH0962773A (ja) * 1995-08-19 1997-03-07 Ricoh Co Ltd 文字認識装置
JPH0957204A (ja) * 1995-08-24 1997-03-04 Toshiba Corp 郵便物の宛先自動読取システム
US5828772A (en) * 1995-12-27 1998-10-27 Lucent Technologies Inc. Method and apparatus for parametric signature verification using global features and stroke-direction codes
JP3534537B2 (ja) * 1996-05-10 2004-06-07 日本電信電話株式会社 形状マッチング方法および装置
US6208757B1 (en) * 1996-10-11 2001-03-27 Lucent Technologies Inc. Method and apparatus for reconstructing handwritten symbols from parametric representations thereof
US6044174A (en) * 1996-10-11 2000-03-28 Lucent Technologies Inc. Method and apparatus for parametric representation of handwritten symbols
US5889889A (en) * 1996-12-13 1999-03-30 Lucent Technologies Inc. Method and apparatus for machine recognition of handwritten symbols from stroke-parameter data
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning

Also Published As

Publication number Publication date
CA2341266C (en) 2009-05-19
SE514377C2 (sv) 2001-02-19
EP1105833B1 (en) 2006-06-28
HK1038975A1 (zh) 2002-04-04
DE69932167D1 (de) 2006-08-10
SE9802832L (sv) 2000-02-27
CN1315024A (zh) 2001-09-26
WO2000013131A1 (en) 2000-03-09
AU5890799A (en) 2000-03-21
AU749849B2 (en) 2002-07-04
US7139430B2 (en) 2006-11-21
JP4580554B2 (ja) 2010-11-17
DE69932167T2 (de) 2006-11-23
IL141294A0 (en) 2002-03-10
IL141294A (en) 2007-02-11
RU2001107822A (ru) 2003-02-20
SE9802832D0 (sv) 1998-08-26
CA2341266A1 (en) 2000-03-09
US6711290B2 (en) 2004-03-23
US20010026639A1 (en) 2001-10-04
KR100615124B1 (ko) 2006-09-11
KR20010090435A (ko) 2001-10-18
ATE331994T1 (de) 2006-07-15
EP1105833A1 (en) 2001-06-13
JP2002523844A (ja) 2002-07-30
US20040234129A1 (en) 2004-11-25

Similar Documents

Publication Publication Date Title
CN1163842C (zh) 字符识别
WO2019104879A1 (zh) 表格类图像的信息识别方法、电子装置及可读存储介质
US7298903B2 (en) Method and system for separating text and drawings in digital ink
US7945097B2 (en) Classifying digital ink into a writing or a drawing
US20180101726A1 (en) Systems and Methods for Optical Character Recognition for Low-Resolution Documents
US7630551B2 (en) Method and system for line extraction in digital ink
US7630962B2 (en) Electronic filing system searchable by a handwritten search query
US20030215145A1 (en) Classification analysis of freeform digital ink input
US7184591B2 (en) Systems and methods for adaptive handwriting recognition
CN1607540A (zh) 检测以墨水输入的手绘对象的系统和方法
CN109685052A (zh) 文本图像处理方法、装置、电子设备及计算机可读介质
CN1324068A (zh) 基于部首样式的草体汉字手写注释的检索
EP1654610B1 (en) Method and system for identifying multiple questionnaire pages
CN1202669A (zh) 在线字符识别系统
CN116524527A (zh) 一种表格图像文本识别方法及系统
CN110826393B (zh) 钻孔柱状图信息自动提取方法
Tang et al. Online chemical symbol recognition for handwritten chemical expression recognition
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
TWI773444B (zh) 影像識別系統與方法
Chaudhuri et al. An approach for processing mathematical expressions in printed document
CN114612919A (zh) 一种票据信息处理系统及方法、装置
JPH04336686A (ja) 手書文字認識装置
CN1145494A (zh) 识别字符或图形的方法和系统
AU2003201200A1 (en) An electronic filing system searchable by a handwritten search query
AU2004214901A1 (en) Line extraction in digital ink

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination
PB01 Publication
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ZI DECUMA AB

Free format text: FORMER OWNER: DECUMA AB

Effective date: 20050916

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20050916

Address after: Longde, Sweden

Patentee after: ZI Decuma AB

Address before: Longde, Sweden

Patentee before: Decuma AB

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1038975

Country of ref document: HK

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20040825