CN101128838A - 辨认图 - Google Patents

辨认图 Download PDF

Info

Publication number
CN101128838A
CN101128838A CNA2006800063184A CN200680006318A CN101128838A CN 101128838 A CN101128838 A CN 101128838A CN A2006800063184 A CNA2006800063184 A CN A2006800063184A CN 200680006318 A CN200680006318 A CN 200680006318A CN 101128838 A CN101128838 A CN 101128838A
Authority
CN
China
Prior art keywords
segment
sequence
handwritten patterns
point
segment candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800063184A
Other languages
English (en)
Other versions
CN101128838B (zh
Inventor
J·施特恩比
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zi Decuma AB
Original Assignee
Zi Decuma AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zi Decuma AB filed Critical Zi Decuma AB
Publication of CN101128838A publication Critical patent/CN101128838A/zh
Application granted granted Critical
Publication of CN101128838B publication Critical patent/CN101128838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Abstract

用来确定手写图形的至少一个候选辨认结果的一种方法包括,在所述手写图形中选择可能的分割点用来分割并辨认所述手写图形。所述方法还包括,将手写图形片断与模板进行比较。所述比较返回候选片断,该候选片断构成了所述手写图形片断的可能的辨认结果。所述方法还包括,形成候选片断序列的表示,所述表示包括对应着分割点的数据块,其中,数据块包括对与随后分割点对应的数据块的所引。所述索引包括候选片断的信息。所述方法还包括,将所述候选片断序列的表示与字典进行比较,找到对应着所述字典中允许的符号序列的候选片断序列,以及将这些允许的符号序列中的至少一个符号序列返回,作为所述手写图形的候选辨认结果。

Description

辨认图
技术领域
本发明涉及到手写图形的辨认,其中该手写图形包含一条或多条曲线,并表示多个符号。本发明特别涉及到确定所述手写图形的候选辨认结果。
发明背景
今天,手写正在变成越来越普及的输入数据到数据处理单元,特别是到手机和个人数字助理(Personal Digital Assistant,PDAs)中的方法。为了处理所输入的数据,必须辨认和解释笔迹。大多数辨认笔迹的现有方法要求将要输入的字符被一个一个地写,并被一个一个地认。这种方法的一个例子在US 4,731,857中给出,但是最有名的是由Palm,Inc.制造的Graffiti
为了加速数据的输入,希望允许使用草书。然而,草书笔迹的辨认比单独字符的辨认要复杂得多。草书笔迹辨认中复杂性的增加是源于连起来的字符的分割问题,即源于手写图形中从一个字符到另一个字符的过渡的识别问题。因此,草书笔迹辨认中的误差可以以两个层次出现,这使得清晰的顺序辨认系统的构造大大地复杂化了。
辨认草书笔迹的方法通常受到这样的问题的困扰,即在相邻字符之间有许多可能的分割方法,这构成了手写图形的可能分割的组合方式的剧增。
所以,目前大多数的商用系统使用复杂的统计系统,采用神经网络和隐马尔可夫模型,同时带有集成的字典。这种系统的例子见P.Neskovicand L.Cooper,″Neural network-based context driven recognition ofon-line cursive script(基于神经网络的在线草书手迹的情景导向辨认方法)″,Seventh International Workshop on Frontiers in HandwritingRecognition Proceedings,p.352-362,September 2000和M.Schenkel andI.Guyon,″On-line cursive script recognition using time delay networksand hidden markov models″(使用延时网络和隐马尔可夫模型的在线草书手迹的辨认方法),Machine Vision and Applications,Vol.8,pages215-223,1995。这些系统的一个主要缺点是,它们非常大而且要求有很大的训练集。此外,它们高度依赖于所用的字典。
通常可以使用字典通过评估手写图形不同的辨认结果是正确的的可能性来改善辨认结果。因此,手写图形的辨认结果可以与字典进行比较,字典中不存在的结果就被去掉。这就提高了将正确的辨认结果呈示给用户的可能性。在D.Y.Chen,J.Mao and K.M.Mohiuddin,“An efficientalgorithm for matching a lexicon with a segmentation graph”(将分割图与词典进行匹配的有效算法),Proceedings of the Fifth InternationalConference on Document Analysis and Recognition,pages 543-546,1999的文章中,发表了一种将字典与候选分割进行比较的方法。然而,当字典的大小增加时,这种方法变得比较慢。另一种方法发表在S.Lucas,“Efficient best-first dictionary search given graph-based input(基于图进行输入时的有效的最佳优先字典搜索)”,15th International Conference onPattern Recognition,vol.1,pages 434-437,2000。这种方法给出了一个更加有效的办法去检索存在于字典中的最佳辨认结果。通过计算路径代数可以实现这种字典检索,这似乎要求首先建立手写图形的分割。
在WO 02/37933中,发表了一种使用字典进行手写单词辨认的方法。这种方法产生一个解释图,该图包含顶点和边,顶点表示分割点,边表示分割点之间的片断的解释。在分割点上执行搜索过程,以便构造所述图,从而确定单词的辨认。所述搜索过程这样进行,回顾前面的分割点来确定是否在图中放置边/片断。因此,在每个顶点处,可以存储若干单词级的猜测。此外,为了修整猜测名单,可以与字典进行匹配。对于每个被允许的字符集,搜索过程在每个分割点处需要确定在图中放置一条对应着字符集的边/片断是否可行。这要求进行很多计算以便执行搜索过程,因此,该方法较慢。
本发明的总结
本发明的一个目标是,提供一种用于辨认草书笔迹的改善了的方法。本发明的另一个目标是,提供一种不需要广泛学习并且不需要很大的处理能力的方法。本发明还有一个目标是,以快捷方式使用字典,用来提高手写笔迹的辨认。
上述目标中至少一些可以由权利要求书中的独立项所述的方法、装置和计算机程序产品来实现。在从属权利要求中阐明了本发明的特定的实施例。
因此,本发明提供一种方法,用来确定手写图形的至少一个候选辨认结果,其中该手写图形包括一条或多条曲线并表示多个符号。所述方法包括,在所述手写图形中选择可能的分割点,用来分割所述手写图形,并将所述手写图形的这些片断辨认为符号。所述方法还包括,将所述手写图形片断与表示至少一个符号或者符号的一部分的模板进行比较,其中,所述手写图形片断对应着从第一分割点到第二分割点的可能的分割点序列。所述比较返回与模板相关的候选片断,其构成了所述手写图形片断的可能的辨认结果,其中每个候选片断与所述模板和所述手写图形片断之间的匹配的度量相关。所述方法还包括,形成候选片断序列的表示。所述表示包括对应着所述手写图形中的分割点的数据块,其中,数据块包括对与随后分割点相对应的数据块的索引,所述索引包括候选片断的信息以及所述分割点之间的手写图形片断的相关度量。所述方法还包括,将所述候选片断序列的表示与字典进行比较,其中,所述字典被表示为符号序列,序列中的符号保持有对允许的随后的符号的索引。所述方法还包括,找到对应着所述字典中允许的符号序列的候选片断序列,以及将这些允许的符号序列中的至少一个符号序列返回,作为所述手写图形的候选辨认结果。
本发明也提供一种用于确定手写图形的至少一个候选辨认结果的装置,其中该手写图形包括一条或多条曲线并表示多个符号,所述装置包括:在所述手写图形中选择可能的分割点,以用来分割所述手写图形,并将所述手写图形的这些片断辨认为符号的部件;将所述手写图形片断与表示至少一个符号或者符号的一部分的模板进行比较的部件,其中,所述手写图形片断对应着从第一可能分割点到第二可能分割点的一个分割点序列,所述比较返回与模板相关的候选片断,该候选片断构成了所述手写图形片断的可能的辨认结果,每个候选片断与所述模板和所述手写图形片断之间的匹配的度量相关;形成候选片断序列的表示的部件,所述表示包括对应着所述手写图形中的分割点的数据块,其中,数据块保持对随后的分割点的索引,所述索引持有候选片断的信息以及所述分割点之间的手写图形片断的相关度量;将所述候选片断序列的表示与字典进行比较的部件,所述字典被表示为符号序列,其中,序列中的符号保持对被允许的随后的符号的索引;找到对应着所述字典中允许的符号序列的候选片断序列的部件;以及将这些允许的符号序列中的至少一个作为所述手写图形的候选辨认结果返回的部件。
本发明也提供一种可以直接加载到数据处理单元的内存中的计算机程序产品,包括用于执行上述方法的软件代码部分。
由于有本发明,可以快速地辨认表示几个符号的手写图形。通过使用可能的分割点来进行分割和辨认,计算过程将同时把手写图形分隔开并把图形与模板进行匹配。因此,将手写图形与模板进行比较的过程是很快的。
已经认识到,根据一些标准,通过选择有限数目的可能分割点,可以只用与这些可能的分割点相关的信息来辨认手写图形的片断。因此,已经认识到,不需要使用神经网络或隐马尔可夫模型来辨认草书笔迹。取而代之的是,选择可能的分割点并使用这些可能的分割点来辨认手写图形中的符号。
可能的分割点的选择从探测到的序列中去掉了大量的点。因此,选择便于处理的数量的点,这就限制了将点的序列与模板进行比较时所需要的计算量。已经认识到,对于辨认手写图形来说,所探测到的点的序列中的一大部分信息是冗余的。所以,去掉大量的点几乎不影响正确辨认手写图形的可能性。另外,由于在辨认过程中使用了有限数目的点,可以使用几个模板来辨认同一个符号。因此,模板可以表示异形字,即书写同一符号时的不同形状或风格。
此外,由于可能的分割点被用作特性来辨认片断,故所述候选片断序列的表示通过考虑上游的分割点以便产生对下游的点的索引来构成。有利的是,通过在分割点序列中向前看,可以因此将所述候选片断序列与字典进行比较。因此,可以掠过分割点序列,用有关允许序列的信息来很快更新候选片断序列。
可以将手写图形的可能分割与字典进行比较,以便挑选出存在于字典中的手写图形的候选辨认结果。由于候选片断序列是用分割点之间的索引来表示的,而这种索引包含了后面的候选片断的信息,所以具有相同起始符号的序列共享其起始符号的表示。通过顺序地检查在字典中是否有任何的单词具有相应的初始符号来将候选片断序列与字典进行比较。一旦发现序列中的符号在字典中没有对应物时,就可以去掉这个序列,不需要将该序列中其余的候选片断与字典进行比较了。事实上,具有表示相同前缀的相同初始候选片断的所有序列都可以被去掉,因为它们共享表示。
如这里所使用的,术语“符号”应该被解释为具有特定意义的任何的形式,诸如字符、拉丁文、汉字或任何其它种类、字符之间之前之后的连字、数字、或任何标点符号。模板用来表示符号或符号的一部分。然而,可以有一个或多个模板被用来表示手写图形中没有特定意义的噪声或不规则性。这种模板可以用来识别手写图形中对该图形中所写信息没有贡献的部分。此外,术语“手写图形”应该被解释为由人所书写的特定形式的符号或符号序列。
术语“可能的分割点序列”应该被解释为从第一分割点到第二分割点的序列,其中,所述第一分割点是已经被识别为与模板的开头相匹配的可能的分割点,所述第二分割点是已经被识别为与模板的末尾相匹配的可能的分割点。所述可能的分割点序列包括在所述第一分割点和第二分割点之间的所有可能的分割点。
“对与随后分割点对应的数据块的索引”可以是对分割点序列中的下一个分割点的索引,也可以是对分割点序列中较后的分割点的索引。因此,通过选择不同的分割点,可以产生与手写图形的不同片断相匹配的不同的候选片断序列。
使用候选片断序列与所述手写图形间的匹配的累积度量来确定所述候选辨认结果间的排名顺序。在所有的分割点都被分析之后,累积度量被分配给最后的分割点,它与已经与手写图形匹配了的模板序列或候选片断序列相关。因此,很容易使用分配给最后分割点的信息来获得手写图形的可能的候选辨认结果。
匹配的度量可以是手写图形特性与相应的模板特性之间差异的计算得到的距离值。因此,探测到手写图形的合适的特性,将之与相应的模板特性进行比较,并计算距离值。距离值越低,手写图形和模板的匹配就越好。
构成候选片断序列的表示包括构成一个辨认图,该图具有节点和边,其中每个节点表示一个可能的分割点,每条边表示沿着分割点序列从一个节点到另一个节点的一条路径,所述路径对应着手写图形中的可能符号,并与对应着候选片断和手写图形片断间的匹配的至少一个度量相联系。
通过构成一个图,可以通过分步的方式组织候选片断序列与字典的比较。这意味着,可以获得对要进行的比较的良好控制。此外,可以有效地使用该图,因为该图可以只用这样一些可能的分割点来构造,这些可能的分割点实际上已经被识别为手写图形的可能片断的分割点。此外,节点可以存储不同路径的匹配的累积度量,这些路径沿着贯穿图中的边通向该节点。籍此,在图中的每个节点中可以容易地找到对应着候选片断序列的匹配的累积度量。
一个表示的构成可以包括只允许确定数目的候选片断结束在一个节点中。这限制了保留下来与字典进行比较的不同候选片断序列的数目。所允许的候选片断可以是具有最佳匹配度量的候选片断。因此,只有那些与手写图形具有最佳匹配度量的候选片断被保留下来了。
在每个节点结束的候选片断的被确定的数目可以被调整,以便控制将候选片断序列的表示与字典进行比较速度。辨认图的大小可以通过调整允许的候选片断的数目来控制。因此,将候选片断序列的表示与字典进行比较所需的时间也可以被控制。通过计算允许有多少候选片断以便满足与字典进行比较所需最大允许时间,可以确定候选片断的数目。因此,在进行了手写图形与模板的比较之后可以决定候选片断的允许数目。
所述辨认图的形成包括去掉对应着相同节点间的相同符号序列的路径副本。候选片断序列可以包括对应着手写图形的不同分割的两个或更多相同序列。当构成辨认图时,这种副本可以被去掉,只保留那些具有最佳匹配度量的序列。在辨认图中不需要有副本,因为在与字典进行比较时,这些副本给出相同的结果。去掉副本可以加速辨认图和字典之间的比较。
所述字典可以被表示为一个Trie图(字典树图)。这可以使辨认图和字典之间的比较快速而有效。
Trie图以适宜的规则方式来表示单词。Trie图中任何一个节点的所有后代都具有与该节点相关的共同的前缀。因此,候选片断序列的表示与字典的比较可以包括逐点遍历所述辨认图的节点,将这些节点与所述Trie图中的节点进行比较。一个候选片断序列只需要与Trie图中的一条路径匹配,这使得比较过程非常快。
所述比较可以包括,产生从表示候选片断的所述辨认图中的边到所述Trie图中相应节点的索引。这可使候选片断序列中的位置与Trie图中的相应位置联系起来。因此,几个候选片断序列可以同时与Trie图比较,因为可以很快地为每个候选片断序列检索出来Trie图中的位置。
在逐点遍历所述辨认图中的节点期间,一旦候选片断序列在所述Trie图中没有对应,就去掉该候选片断序列。此外,具有相同前缀的所有候选片断序列可以同时被去掉。
所述辨认图中的节点与所述Trie图中的节点的比较可以包括,对候选片断序列的其余部分中符号的可能数目到所述Trie图中后续符号的允许数目进行检查。通过检查是否有一个单词其长度或符号数目对应着候选片断序列的长度,序列如果没有具有相应长度的单词,则在辨认图与Trie图的比较过程的早期阶段中就被去掉。
对应着所述字典中一个不完整的符号序列的候选片断序列是允许的。可以利用这一点来产生被截短的单词的候选辨认结果。此外,当手写图形被辨认为字典中的一个被截短的单词时,可以将完整的单词作为候选辨认结果呈示出来。这就允许用户将长单词截短,但从返回的辨认结果中可以得到正确完整的单词。
通过将候选片断与字典中的非对应符号进行匹配,并对与该候选片断相关的度量进行处罚,可以对在候选片断序列中导致候选片断丢失的所述手写图形中被省略了的片断进行辨认。结果,可以用字典来发现手写图形中缺失的符号。
所述手写图形可以以草书笔迹来书写。所述方法可以方便地用于草书写就的手写图形的辨认,因为所述方法能够分割手写图形并辨认片断。然而,所述方法也可以用于辨认以打印体或者以草书和打印体的任何组合或混合形式写就的手写图形。
所述手写图形可以被在线探测。这意味着,辨认可以在实时中进行。手写图形的辨认可以进行得如此之快,以至于令人讨厌的用户等待时间被缩减了。所以,可以进行在线辨认。
附图的简短描述
下面将参考附图通过例子来进一步详细地描述本发明,在这些图中,
图1是一个用于辨认手写图形的方法的流程图,
图2是手写图形的一个例子,示出了所选择的分割点,这些分割点要用于手写图形与模板的比较,
图3是一个用于将手写图形与模板进行比较的方法的流程图,
图4是一个图表,被形成来用于确定模板和手写图形之间的距离值,
图5是一个用于将辨认图与字典进行比较的方法的流程图,
图6是辨认图的一个例子,该辨认图由手写图形可能的辨认结果构成,
图7是字典的一个例子,
图8是根据本发明的实施例所述的用于辨认手写图形的装置的示意图。
优选实施例的详细描述
参考图1,现在来描述辨认手写图形的方法。首先,在步骤102中,探测手写图形。通常,用户在一块压敏屏上用针笔书写手写图形,由此,通过以规则的间隔对针笔的位置进行取样就可以探测笔迹。这样,就获得了点的时序。可以用几种其它方法来探测笔迹,诸如,使用能探测例如在笔和书写面之间形成的电连接的传感器,或者使用能探测笔的移动的传感器来探测笔迹。也可以通过对写有手写图形的纸进行扫描来探测手写图形。然后,将笔迹作为书写面上的点的序列来探测,其中,所述序列依赖于这些点彼此之间所处的位置,即,点的空间序列。
在步骤104中,在探测手写图形时所产生的点的序列中选择适当的分割点,这些点在下文中被称作核心点。核心点的选择是为了减小手写图形的容量,即减少图形中的一笔所含采样点的数目。然而,核心点的选择要使得手写图形能够被正确地辨认出来。
图2显示了一个手写图形10,该图形构成了瑞典语单词“ek”。在图2中,也指出了所选择的核心点12,并且每隔一个核心点编一个号码。从图2中可以明显看到,这个草书的单词的前半部分看起来像字母“d”。问题是,如果辨认方法在那个“d”的终点处将该单词分割成两个字母段,那么这两部分都不包含所要写的单词中的字母。所以很清楚,当对草书的笔迹进行分割时,辨认方法需要考虑多于一种的分割可能性。所以,选择几个核心点12作为合适的点,来指示手写图形10中两个字符之间的一个分割。因此,选择核心点12以识别手写图形10被正确地分割为单独的符号或字符。然而,核心点12也用来辨认手写图形10的片断。
核心点12的选择不应该扔掉任何实际的分割点。然而,用来确定手写图形10的可能分割的核心点12其数目应该这样来选择,要尽可能使核心点12的数目减少。因此,核心点12的选择使用一些选择标准。
所选核心点12的数目受手写图形10的一条或多条曲线的形状的限制。这意味着,所述曲线的形状决定了所选核心点的数目。这样,如果所述曲线的形状比较简单则可选择较少几个核心点12,而对于复杂的曲线则选择较多的核心点。
所选核心点的数目可以被限制为能保持所述一条或多条曲线的方向改变信息的那些点。因此,只有曲线弯曲或转弯处的那些点被用作核心点。这样,即使只使用了有限数目的核心点12,也能使核心点12描述一条或多条曲线的形状。
根据本优选实施例,使用下面的选择标准。第一个选择标准在与主书写方向正交的方向上抽取局部极点。我们分别用北(N)核心点和南(S)核心点来表示这些点。在图2的手写图形中,用圆圈来标记N和S核心点。每对N-S点用处于其之间的一到三个其它的点来补充。后取的这些点基于两个其它的标准来选择,一个曲率标准和一个锐度标准。我们称这些额外的点为中间(M)核心点。在图2的手写图形10中,用星号标记这些M核心点。曲率标准确定手写图形10是否明显地偏离两个相邻核心点之间的直线。然后,在最偏离该直线的地方选择一个M核心点。锐度标准确定手写图形是否有一个急转弯。然后,在这个位置处选择一个M核心点。通过在每个探测到的点处计算手写图形10的导数来决定锐度标准是否被满足。在有急转弯的地方,导数的值就很大。可以用锐度标准和曲率标准在一对N-S核心点之间选择几个M核心点。如果根据锐度标准或曲率标准没有发现所感兴趣的点,那么选择对应着N和S核心点之间曲线长度之半的中间点作为M核心点。
在步骤106中,所述方法还包括在每个核心点处或在其附近确定手写图形的特性。可以想象,可以直接使用所抽取的核心点12的坐标值来进行辨认。然而,核心点12的周围也包含着手写图形10的一些形状信息。为了将这个额外的形状信息包括进来,根据本优选实施例,对每个核心点确定一组共五个特性。根据核心点12是如何选择的,从一个标签组中为每个核心点12赋予一个标签。这里,使用了三个标签N、S和M。核心点12的这个标签构成了将核心点序列与模板进行匹配的基础。此外,所述特性包括指向核心点12的方向矢量以及从核心点12指出的方向矢量、核心点12的y坐标值,即在与主书写方向正交的方向上的值、以及沿着与主书写方向平行的x坐标方向从该核心点12到前面最靠右的核心点的带符号的距离dx。此外,可以确定在该核心点12处笔是被抬起了还是被按下了。这个特性经常指出一个分割点,但也可以指出一个符号中的两个笔画间的中断。所以,这个特性可以用来辨认那些允许笔在所述核心点12处被抬起或按下的符号。
在步骤108中,将手写图形10中所选核心点12的被确定的特性与模板相比较,以便发现用于辨认手写图形10的一个或几个候选符号。模板在数据库中提供,由顺序的核心点的特性来表示。因此,所确定的特性直接与模板的特性进行匹配。所述数据库可以包含代表同一符号的若干异形字的几个模板,从而即使用户具有不同的书写风格也能辨认出图形。此外,所述数据库包含代表连字的模板,连字是指通常将两个字符连接在一起的笔画,该笔画不是实际字符的一部分。草书单词中间部分的所有字符会有连字,而在单词开头的字符可以有也可以没有连字。草书单词也可以以连字结束。一些模板可以表示包含了连字在内的字符。这可以方便地用于字符“e”、“r”、“c”、“x”和“s”的模板。
现在参考图3和图4来描述手写图形10中所选择的核心点12的特性与模板的比较。核心点12被认为是手写图形10的可能的分割点。此外,从第一个可能的分割点到第二个可能的分割点的核心点12序列被认为是手写图形中的一个可能符号的表示。因此,将这些核心点12序列的特性与模板进行比较。
所选择的核心点12代表了可以与模板进行比较的较多数目的不同的核心点12序列。为了构造所述比较,对核心点12依次进行分析。从第一个核心点12开始,将任何可能的核心点12序列与模板进行匹配。在步骤110中,与一个模板相匹配的一个序列的末尾核心点12作为一个图中的一个节点被存储。这样,与模板相关的候选片断就被挑选出来,作为由核心点12的序列所表示的手写图形10的片断的可能的辨认结果。在步骤112中,给出核心点序列和候选片断之间匹配的度量的一个距离值被存储在所述节点中,代表了所述第一个核心点和所述节点之间的一条路径。当从第一个核心点起始的所有可能的核心点12序列与模板匹配后,从作为所述图中的节点存储的核心点12开始进行进一步的匹配。将模板与进一步的核心点序列之间的距离值加到所述第一个距离值中,而所述第一距离值被存储在了所述进一步的核心点序列的起始节点中。因此,在所述图中的节点处存储了一个累积距离值。这样,就为所有的核心点12形成了一个无环图,并且该图中最后的核心点保存有沿着边贯穿该图的不同路径的累积距离值的信息。此刻,在步骤114中,候选片断序列就被确定为手写图形10的可能的辨认结果,并被表示为沿着边贯穿该图的路径。作为演示用的候选辨认结果将要返回给用户的沿着边贯穿该图的所选路径可以通过与字典的比较来确定,如下面所进一步详细描述的那样。
在图4中显示了一个图20,它表示图2中的手写图形10与模板的匹配。图20包含用编号的圆圈来表示的节点22以及节点之间的边24。如所看到的,有几条路径贯穿该图,代表了对该手写图形的不同分割。因此,手写图形10与模板的匹配同时定义了手写图形10可能的分割,并产生了所分割的手写图形10与候选片断序列之间的相似性的度量。
手写图形中的一个核心点与模板中的一个点之间的距离值是这些点的特性之间的差异的绝对值的加权求和。核心点序列和模板之间的距离值是单独的点之间的距离值的求和。然而,构成图中节点的核心点的距离应该只被计算一次。因此,构成节点的核心点与模板之间的距离可以被赋予延伸到节点或离开节点的路径,并反映了核心点和对应着延伸到和离开节点的路径的两个模板之间的平均距离。
然而,可以不接受特定的候选片断序列。这有助于校正手写图形10中的信息不正确的情形。然而,通过否决不可能或者不可靠的候选片断序列,这种作法也可以用来改善辨认结果。例如,可以否决两个连字构成的序列。此外,可以为特定的候选片断序列的累积距离值赋予一个权重。这意味着,并不完全否决那些包含了不可靠的模板序列的辨认结果,但这些辨认结果被赋予一个权重,使其更难具有最小的累积距离值。
此时,已经确定了手写图形10的若干不同的可能的辨认结果,如图4所示。为了挑选出手写图形10的最可靠的辨认结果,将图20中的候选片断序列与字典进行比较。下面将参考图5-7描述与字典进行比较的实施例。
为了与字典进行比较,在步骤120中,可以形成一个辨认图40来表示不同的可能的候选片断序列。现在参考图6描述辨认图40。图6显示了辨认图40的一个例子,用来辨认图2所示的手写图形10。辨认图40的构造方式非常像用于辨认手写图形10的片断的图20。然而,包含在辨认图40中的信息可以简化。例如,图20可以包括那些不适合整个手写图形的分割点。当形成辨认图40时,这些分割点和不完整的候选片断序列就可以被去掉。此外,图20可以包括能产生相同候选片断序列的不同的分割。在形成辨认图时,这些候选片断序列的副本也可以被去掉。
辨认图40由节点42构成,这些节点表示在手写图形10与模板对比后被确认为是可能的分割点的那些分割点。节点42在图6中显示为编号的圆圈,其编号是根据节点42所表示的核心点12的编号进行编号的。一个节点42具有对其后的节点的索引,在节点42之间是手写图形片断的候选片断信息。节点42的索引用边44来表示。边44包含候选片断的符号信息以及候选片断与手写图形片断相匹配的距离值信息,如图6中的白框所示。每个节点42也可以包括源于节点42的候选片断的最小和最大数目(未显示)。辨认图40可以被构造为只允许有限数目的候选片断进入节点。设置进入节点42的候选片断的最大允许数可以限制辨认图40的大小,以便限制辨认图40与字典进行比较的处理时间。或者,只允许保留那些距离值在一个阈值之下的候选片断。辨认图40也可以用于快速返回与手写图形匹配得最好的候选片断序列,而不考虑使用字典。可以通过将允许进入节点的候选片断的最大数目设置为1来实现这一点。然后,辨认图40就只包含具有最小距离值的候选片断序列。
在图7中,显示了字典50的一个简化例子。所显示的字典50只包括几个单词,但却指出了字典50的当前的优选结构。字典50形成为一个Trie(字典树)图。图50包含了表示符号的节点52。节点52用边54来连接,使得所允许的符号序列构成贯穿图50的串。根节点表示一个空串,使得所有的符号序列都共享这个根节点。表示序列中的最后一个符号的节点在图3中被标为灰色。每个节点52也可以包括从该节点52往后的符号的最小和最大数目信息(未显示)。
在步骤122中,通过逐步地将辨认图40的节点42与字典50进行比较来实现辨认图40与字典50的比较。从第一个辨认图节点开始,通过检查在字典50中是否有一个单词是以同样的符号开始的来确定源自该节点的边的候选片断的有效性。然后,用有效符号的信息来对源自所述第一个辨认图节点的边进行更新,就是说,保留那些在字典50中有对应的候选片断,而去掉其它的候选片断。在图6中,边的更新信息被示于灰色标记的框内。也可以就字典50中的节点来对所述边进行更新,而这些节点与辨认图40中候选片断序列中的各个位置相对应。然后对遍及辨认图40中的所有节点42继续进行比较,去掉所有那些在字典50中没有对应的候选片断序列。对于每个辨认图节点42,源自该节点的边的候选片断的有效性,通过检查在字典50中源自一个节点的边中是否有一个对应符号来确定,该节点被进入所述辨认图节点的边所索引。
利用候选片断序列中符号的最小和最大数目信息,有效性检查也可以包括检查单词的这些长度边界是否被字典50中的相关节点所满足。如果所述长度边界不被满足,那么可以去掉这些候选片断序列。
此外,为了控制时间复杂性,可以为辨认图40中每个节点42设置查询Trie图50次数的上限。因此,可以对时间复杂性进行控制。然而风险是,初始匹配很差的候选片断序列会被去掉。
当辨认图40的所有节点都被分析后,辨认图40的最后的节点将持有手写图形10的最佳候选辨认结果的信息,这是在字典中也是存在的。在步骤124中,手写图形10的候选辨认结果可以被返回,以呈示给用户。具有最小累积距离值的候选辨认结果可以被呈示给用户,作为手写图形的一个解释。或者,将若干候选辨认结果呈示给用户,使得用户可以选择正确的解释。
现在参考图8,描述用于辨认手写图形的一种装置30。所述装置30包含探测器32,用于将手写图形记录为点的序列。探测器32可以由一种压敏屏来实现,用户可以在其上进行书写。装置30还包括分析器34,用来对所探测到的手写图形进行分析。分析器34可以由运行在计算机中央处理单元中的程序来实现。分析器34包含选择手写图形的核心点的工具以及在核心点处或在其附近确定手写图形的特性的工具。装置30还包括数据库36,该数据库包含表示核心点的特性的模板。分析器34还包括对手写图形核心点序列的特性与模板之间的距离值进行计算的工具。分析器34被安排来形成一个图,用来在结构上比较手写图形和模板。分析器34还被安排来形成一个辨认图,该图表示构成手写图的形可能的辨认结果的候选片断序列。装置30还包括字典38,该字典包含Trie图,该图表示被允许的单词或符号序列。分析器34还被安排来将辨认图与字典进行比较,用来确定与手写图形有最佳匹配的符号序列。这些可能的辨认结果可以在显示器上呈现,结果的显示可以与压敏屏分离,也可以与输入手写图形的压敏屏结合在一起。
根据另一个实施例,在实现上述方法和装置时可以对手写图形中的附加符号给予特殊的考虑。在本申请的描述中,术语附加符号被解释为符号附近或符号上的一个记号或笔画,其中,在一些情形中该记号或笔画指明带有该记号或笔画的符号是另一个符号,不同于不带该记号或笔画的符号,例如,ê和e、
Figure A20068000631800212
和a、和o、t和l,而在一些情形中,该记号或笔画是符号的一个特性,其中,没有该附加符号时,该符号仍然可以被解释为正确的符号,例如,i和j。在草书的笔迹中,许多附加符号是在单词的其余部分被写完后才加上的。附加符号对于辨认是很重要的。一个原因是,草书单词中的许多片断可以与没有附加符号的符号匹配,例如,没有点的“i”可以被解释为另一个字符的一部分。
对于基于将草书单词分解为按时间排序的字符片断的方法所进行的分割,例如,本申请中前面所描述的方法,为了能进行正确的辨认,考虑附加字符是很重要的。
在利用附加字符信息的一个实施例中,有关附加字符的信息作为一个特性被分配到核心点的子集中,如图1中的步骤106。因此,涉及附加字符的信息存在于核心点中,并由此被用在辨认过程中,作为一个能影响可能的符号与模板的比较结果的因素。
在手写图形中,附加字符可以被识别为一个不连接的连字线,即,不与任何片断相连并被识别为一个连字的笔画。
被分配给核心点子集中的核心点的特性所使用的特征可以是附加符号的位置,即,x坐标和y坐标、从特定核心点到该附加符号的绝对距离、在x方向从核心点到该附加符号的距离、在y方向从核心点到该附加符号的距离、附加符号的长度、附加符号的形状等等。被分配给核心点的与附加符号相关的特性可以只包括上述特征之一,或者包括多个特征的组合。
分配了附加符号的核心点子集可以这样安排,使得它只包含标记为N和M的核心点12。比起包含所有核心点的情形这样能使所述方法更快捷。
附加字符特性可以被用在对核心点12的序列分析中,用来对序列分析中当前节点22的距离值进行处罚。例如,如果为当前节点22的建议符号,即候选符号,为“i”,并且附加符号相当靠近与节点22相关的核心点12,那么该节点22就被给予一个相当小的处罚。于是核心点12与附加符号之间较大的距离会导致较大的处罚。
与应该具有附加符号的候选符号所丢失的附加符号所获得的处罚相对应的值可以被设置为最大处罚,这样一个最大处罚可以被给予到附加符号的距离超过一个特定值的候选符号。附加符号特性在序列分析期间的使用可以使附加符号在图20形成期间影响图20的累积距离值。这一点是特别令人感兴趣的,因为字符“i”和“j”,由于其结构上的简单性,当没考虑附加符号时,会导致潜在的风险,即其它字符/符号的一部分被错误地解释为“i”或“j”。因此,借助于上述方案,优先采用这样的路径,该路径包括“i”和/或“j”作为候选符号并有附加符号位于该候选符号的初始核心点附近一个合适的距离内。在序列分析期间附加符号特性的使用也可以用于其它的符号或字符。
根据一个实施例,在辨认过程中使用关于附加符号信息的方法可以为每个核心点12确定最近的附加符号点,所述每个核心点12具有N或M标记,并且如上所述将附加符号特性与每个这样的核心点相联系。根据另一个实施例,所述最近的附加符号点的特性被分配给具有N或M标记的每个核心点12,其中所述最近的附加符号点在所述核心点附近一个预定距离内。在分配了附加符号特性后,在表示手写图形10的分割的图20的构造过程中,与一个包含附加符号的符号,即候选符号,相匹配的分割可以由一个值来处罚,该值与到所述分割的起始N或M核心点的距离相关。在不是所有的所需N和M核心点都被分配了附加符号特性的实施例中,最大处罚给予这样的节点,该节点应该具有附加符号,并且其中附加符号特性没有分配给候选符号的N或M核心点。
此外,对于从所述分割图中沿着边的一条路径所得到的在明显不需要的地方具有附加符号的候选单词,在将这样的一个单词与字典匹配后可以对之进行处罚。在本申请中,字典的使用在上面给出了描述。可以用来决定候选单词是否在明显不需要的地方包含了附加符号的一个方法是,检查该候选单词是否包含了太多的附加符号。通过比较候选单词中所含附加符号的数目和产生该候选单词的路径中所识别出的附加符号的数目,然后对候选单词中多余的附加符号进行处罚,可以实现这一点。
例如:
处罚=因子·(A-B);对于A-B>0的情况
处罚=0;对于A-B<0的情况
A=附加符号的最大数目(候选单词)
(A=max_number_of_diacritics(候选单词))
B=附加符号被观察到的数目(产生候选单词的路径)
(B=observed_no._of_diacritics(产生候选单词的路径))
通过对未连接的连字线,即对没有连接到任何片断并被识别为连字的笔画的数目进行计数,可以获得在产生候选单词的路径中所观察到的附加符号的数目。
根据另一个实施例,通过在所得到的候选单词和产生该候选单词的路径之间进行附加字符匹配检查,可以对未使用的附加符号进行处罚。通过比较候选单词中所含附加符号的数目和产生该候选单词的路径中所识别出的附加符号的数目,然后对候选单词中失去的附加符号进行处罚,可以实现这一点。
例如:
处罚=因子·(B-A);对于B-A>0的情况
处罚=0;对于B-A<0的情况
A =附加符号的数目(候选单词)
(A=number_of_diacritics(候选单词))
B=附加符号被观察到的数目(产生候选单词的路径)
(B=observed_no._of_diacritics(产生候选单词的路径))
通过使用这种方案,系统能够例如将单词“blind”辨认为blind,即使在手写文本的字符“i”更像字母“e”,从而产生了单词“blend”,甚至圆点在某种程度上被错放了地方的情形中也是这样。
应该强调,这里所描述的优选实施例绝不是限制性的,并且在由附属权利要求书所界定的保护范围之内,许多别的实施例也是可能的。

Claims (20)

1.一种方法,用来确定手写图形的至少一个候选辨认结果,其中该手写图形包括一条或多条曲线并表示多个符号,所述方法包括:
在所述手写图形中选择可能的分割点,用来分割所述手写图形并将所述手写图形的这些被分割片断辨认为符号,
将所述手写图形的片断与表示符号或者符号的一部分的模板进行比较,其中,所述手写图形的片断对应着从第一分割点到第二分割点的可能的分割点序列,所述比较得到与模板相关的候选片断,该候选片断构成了对所述手写图形的所述片断的可能的辨认结果,每个候选片断与所述模板和所述手写图形的所述片断之间的匹配的度量相关,
形成候选片断序列的表示,所述表示包括对应着所述手写图形中的分割点的数据块,其中,数据块包括对与随后分割点相对应的数据块的索引,所述索引包括候选片断的信息以及所述分割点之间的所述手写图形的片断的相关的度量,
将所述候选片断序列的表示与字典进行比较,所述字典被表示为符号序列,其中,序列中的符号保持对被允许的随后的符号的索引,
找到对应着所述字典中被允许的符号序列的候选片断序列,以及
将这些被允许的符号序列中的至少一个返回,作为所述手写图形的候选辨认结果。
2.根据权利要求1所述的方法,其中,将所述候选片断序列的表示与字典的比较包括在所述分割点序列中向前看。
3.根据权利要求1或2所述的方法,其中,使用候选片断序列与所述手写图形间的匹配的累积度量来确定各所述候选辨认结果间的排名顺序。
4.根据前述权利要求中的任何一个权利要求所述的方法,其中,所述构成所述候选片断序列的表示包括构成一个辨认图,该辨认图具有节点和边,其中每个节点表示一个可能的分割点,每条边表示沿着分割点序列从一个节点到另一个节点的一条路径,所述路径对应着所述手写图形中的可能符号,并与对应着候选片断和所述手写图形的所述片断间的匹配的至少一个度量相联系。
5.根据权利要求4所述的方法,其中,所述的表示的形成包括只允许确定数目的候选片断在一个节点结束。
6.根据权利要求5所述的方法,其中,所述确定的数目可以被调整,以便控制将候选片断序列的所述表示与所述字典进行比较速度。
7.根据权利要求5或6所述的方法,其中,所述允许的候选片断为具有最佳匹配度量的候选片断。
8.根据权利要求4-7中的任何一个权利要求所述的方法,其中,所述辨认图的形成包括去掉对应着相同节点间的相同符号序列的路径的副本。
9.根据权利要求4-8中的任何一个权利要求所述的方法,其中,所述字典被表示为一个字典树图。
10.根据权利要求9所述的方法,其中,所述候选片断序列的表示与字典的所述比较包括,逐点遍历所述辨认图的节点,将这些节点与所述字典树图中的节点进行比较。
11.根据权利要求10所述的方法,其中,所述比较包括,产生从所述辨认图中表示候选片断的边到所述Trie图中相应节点的索引。
12.根据权利要求10或11所述的方法,其中,在逐点遍历所述辨认图中的节点期间,一旦候选片断序列在所述Trie图中没有对应部分,就去掉该候选片断序列。
13.根据权利要求10-12中的任何一个权利要求所述的方法,其中,在所述辨认图中的节点与所述Trie图中的节点之间进行的所述比较包括,对所述候选片断序列的其余部分中的符号的可能数目到所述Trie图中后续符号的允许数目进行检查。
14.根据前述权利要求中的任何一个权利要求所述的方法,其中,对应着所述字典中一个不完整的符号序列的候选片断序列是允许的。
15.根据前述权利要求中的任何一个权利要求所述的方法,其中,通过将候选片断与所述字典中的非对应符号进行匹配,并对与该候选片断相关的度量进行处罚,从而辨认在所述候选片断序列中导致候选片断丢失的所述手写图形中被省略了的片断。
16.根据前述权利要求中的任何一个权利要求所述的方法,其中,匹配的所述度量是所述手写图形的特性与所述模板的相应特性之间差异的计算得到的距离值。
17.根据前述权利要求中的任何一个权利要求所述的方法,其中,所述手写图形以草书笔迹来书写。
18.根据前述权利要求中的任何一个权利要求所述的方法,其中,所述手写图形被在线探测。
19.一种用于确定手写图形的至少一个候选辨认结果的装置,其中该手写图形包括一条或多条曲线并表示多个符号,所述装置包括:
在所述手写图形中选择可能的分割点的部件,用来分割所述手写图形并将所述手写图形的这些被分割的片断辨认为符号,
将所述手写图形的片断与表示符号或者符号的一部分的模板进行比较的部件,其中,所述手写图形的片断对应着从第一可能分割点到第二可能分割点的一个分割点序列,所述比较针对模板给出候选片断,该候选片断构成了所述手写图形的所述片断的可能的辨认结果,每个候选片断与所述模板和所述手写图形的所述片断之间的匹配的度量相关,
形成候选片断序列的表示的部件,所述表示包括对应着所述手写图形中的分割点的数据块,其中,数据块保持有对随后的分割点的索引,所述索引保持有候选片断的信息以及所述分割点之间的所述手写图形的片断的相关度量,
将所述候选片断序列的所述表示与字典进行比较的部件,所述字典被表示为符号序列,其中,序列中的符号保持有对被允许的随后的符号的索引,
找到对应着所述字典中被允许的符号序列的候选片断序列的部件,以及
给出这些被允许的符号序列中的至少一个以作为对所述手写图形的候选辨认结果的部件。
20.一种可以直接加载到数据处理单元的内存中的计算机程序产品,包括用于执行根据权利要求1-18中的任何一个权利要求所述的方法的软件代码部分。
CN2006800063184A 2005-02-28 2006-02-24 辨认图 Active CN101128838B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
SE0500465 2005-02-28
SE0500465-0 2005-02-28
SE05004650 2005-02-28
PCT/SE2006/000241 WO2006091156A1 (en) 2005-02-28 2006-02-24 Recognition graph

Publications (2)

Publication Number Publication Date
CN101128838A true CN101128838A (zh) 2008-02-20
CN101128838B CN101128838B (zh) 2011-11-16

Family

ID=36927695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800063184A Active CN101128838B (zh) 2005-02-28 2006-02-24 辨认图

Country Status (8)

Country Link
US (1) US7756335B2 (zh)
EP (1) EP1854048A1 (zh)
JP (1) JP5071914B2 (zh)
KR (1) KR20070110399A (zh)
CN (1) CN101128838B (zh)
RU (1) RU2007135945A (zh)
TW (1) TWI321294B (zh)
WO (1) WO2006091156A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114963A (zh) * 2021-09-24 2022-09-27 中国劳动关系学院 基于卷积神经网络的智能流媒体视频大数据分析方法

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7286115B2 (en) 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US7750891B2 (en) 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US7030863B2 (en) 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
WO2000074240A1 (en) 1999-05-27 2000-12-07 America Online Keyboard system with automatic correction
US7821503B2 (en) 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
US8583440B2 (en) 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7907756B2 (en) * 2005-01-31 2011-03-15 Siemens Medical Solutions Usa, Inc. System and method for validating an image segmentation algorithm
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
US7587378B2 (en) 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
US7580925B2 (en) 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
WO2008066441A1 (en) 2006-12-01 2008-06-05 Zi Decuma Ab Method for character recognition
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
US8225203B2 (en) 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8201087B2 (en) * 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
JP4940973B2 (ja) * 2007-02-02 2012-05-30 富士通株式会社 論理構造認識処理プログラム、論理構造認識処理方法および論理構造認識処理装置
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8299943B2 (en) 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
US8020119B2 (en) * 2007-12-14 2011-09-13 Microsoft Corporation Engine support for parsing correction user interfaces
US8532342B2 (en) * 2008-02-12 2013-09-10 Certusview Technologies, Llc Electronic manifest of underground facility locate marks
US8672225B2 (en) 2012-01-31 2014-03-18 Ncr Corporation Convertible barcode reader
US8270666B2 (en) 2008-02-12 2012-09-18 Certusview Technologies, Llc Searchable electronic records of underground facility locate marking operations
CA2707246C (en) 2009-07-07 2015-12-29 Certusview Technologies, Llc Automatic assessment of a productivity and/or a competence of a locate technician with respect to a locate and marking operation
US20110103713A1 (en) * 2008-03-12 2011-05-05 Hans Christian Meyer Word length indexed dictionary for use in an optical character recognition (ocr) system
US8634645B2 (en) * 2008-03-28 2014-01-21 Smart Technologies Ulc Method and tool for recognizing a hand-drawn table
US8902251B2 (en) 2009-02-10 2014-12-02 Certusview Technologies, Llc Methods, apparatus and systems for generating limited access files for searchable electronic records of underground facility locate and/or marking operations
US8572193B2 (en) 2009-02-10 2013-10-29 Certusview Technologies, Llc Methods, apparatus, and systems for providing an enhanced positive response in underground facility locate and marking operations
KR101080254B1 (ko) * 2009-06-02 2011-11-08 (주)펜앤프리 터치스크린을 이용한 필기 입력 방법 및 이를 이용한 필기 입력 장치
US8310461B2 (en) 2010-05-13 2012-11-13 Nuance Communications Inc. Method and apparatus for on-top writing
WO2012033602A1 (en) 2010-08-11 2012-03-15 Steven Nielsen Methods, apparatus and systems for facilitating generation and assessment of engineering plans
CN102385707A (zh) * 2010-08-30 2012-03-21 阿里巴巴集团控股有限公司 一种数字图像识别的方法、装置及爬虫服务器
US20120281919A1 (en) * 2011-05-06 2012-11-08 King Abdul Aziz City For Science And Technology Method and system for text segmentation
US10254952B2 (en) 2012-09-26 2019-04-09 Google Llc Progress display of handwriting input
US9026428B2 (en) 2012-10-15 2015-05-05 Nuance Communications, Inc. Text/character input system, such as for use with touch screens on mobile phones
US20150371100A1 (en) * 2014-06-23 2015-12-24 Xerox Corporation Character recognition method and system using digit segmentation and recombination
US9600548B2 (en) 2014-10-10 2017-03-21 Salesforce.Com Row level security integration of analytical data store with cloud architecture
US10101889B2 (en) 2014-10-10 2018-10-16 Salesforce.Com, Inc. Dashboard builder with live data updating without exiting an edit mode
US9767145B2 (en) * 2014-10-10 2017-09-19 Salesforce.Com, Inc. Visual data analysis with animated informational morphing replay
US10049141B2 (en) 2014-10-10 2018-08-14 salesforce.com,inc. Declarative specification of visualization queries, display formats and bindings
US9449188B2 (en) 2014-10-10 2016-09-20 Salesforce.Com, Inc. Integration user for analytical access to read only data stores generated from transactional systems
JP6401288B2 (ja) * 2014-11-06 2018-10-10 国立研究開発法人科学技術振興機構 流れパターンの正規表現作成方法、正規表現作成装置、および、コンピュータが実行可能なプログラム
TWI560641B (en) * 2015-09-03 2016-12-01 Magic Power Co Ltd A handwriting grading system and the method thereof
US10115213B2 (en) 2015-09-15 2018-10-30 Salesforce, Inc. Recursive cell-based hierarchy for data visualizations
US10089368B2 (en) 2015-09-18 2018-10-02 Salesforce, Inc. Systems and methods for making visual data representations actionable
US10332628B2 (en) * 2016-09-30 2019-06-25 Sap Se Method and system for control of an electromechanical medical device
US10311047B2 (en) 2016-10-19 2019-06-04 Salesforce.Com, Inc. Streamlined creation and updating of OLAP analytic databases
US10514841B2 (en) * 2018-04-30 2019-12-24 Microsoft Technology Licensing, Llc Multi-layered ink object
TWI676919B (zh) * 2018-08-02 2019-11-11 義守大學 一種電腦化寫字評估與訓練方法
US11604961B2 (en) 2019-04-30 2023-03-14 International Business Machines Corporation Scalable model serving

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4611346A (en) * 1983-09-29 1986-09-09 International Business Machines Corporation Method and apparatus for character recognition accommodating diacritical marks
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JPH01316890A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd オンライン手書文字認識方式
US5029223A (en) * 1990-02-02 1991-07-02 International Business Machines Corporation Constraint driven-on line recognition of handwritten characters and symbols
US5727081A (en) * 1991-12-31 1998-03-10 Lucent Technologies Inc. System and method for automated interpretation of input expressions using novel a posteriori probability measures and optimally trained information processing networks
CN1025764C (zh) * 1992-05-12 1994-08-24 浙江大学 字符识别方法
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
ATE206834T1 (de) * 1993-12-01 2001-10-15 Motorola Inc Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung
IL109268A (en) * 1994-04-10 1999-01-26 Advanced Recognition Tech Method and system for image recognition
US5687254A (en) * 1994-06-06 1997-11-11 Xerox Corporation Searching and Matching unrecognized handwriting
US6137908A (en) * 1994-06-29 2000-10-24 Microsoft Corporation Handwriting recognition system simultaneously considering shape and context information
EP0691623B1 (en) * 1994-07-04 2001-10-04 Hewlett-Packard Company, A Delaware Corporation Scribble matching
US6125207A (en) * 1995-06-05 2000-09-26 Motorola, Inc. Encoded facsimile communication with a selective system and method therefor
US6453070B1 (en) * 1998-03-17 2002-09-17 Motorola, Inc. Diacritical processing for unconstrained, on-line handwriting recognition using a forward search
US6285786B1 (en) * 1998-04-30 2001-09-04 Motorola, Inc. Text recognizer and method using non-cumulative character scoring in a forward search
US6249605B1 (en) * 1998-09-14 2001-06-19 International Business Machines Corporation Key character extraction and lexicon reduction for cursive text recognition
AU3907300A (en) * 1999-03-19 2000-10-09 Raf Technology, Inc. Rollup functions for efficient storage, presentation, and analysis of data
WO2002037933A2 (en) * 2000-11-08 2002-05-16 New York University System, process and software arrangement for recognizing handwritten characters
JP3490703B2 (ja) * 2001-03-23 2004-01-26 ライズ株式会社 アウトラインフォント情報に基づく文字処理方法及びその方法をコンピュータシステムに実行させるためのコンピュータプログラムを記録したコンピュータ読取り可能な記録媒体
US7174043B2 (en) * 2003-02-25 2007-02-06 Evernote Corp. On-line handwriting recognizer
SE528063C2 (sv) * 2004-11-12 2006-08-22 Zi Decuma Ab Metod och anordning för segmenteringsbaserad igenkänning
KR101145986B1 (ko) * 2005-02-28 2012-05-21 지 데쿠마 아베 세그먼트화-기반 인식

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114963A (zh) * 2021-09-24 2022-09-27 中国劳动关系学院 基于卷积神经网络的智能流媒体视频大数据分析方法

Also Published As

Publication number Publication date
US7756335B2 (en) 2010-07-13
WO2006091156A1 (en) 2006-08-31
TW200703129A (en) 2007-01-16
CN101128838B (zh) 2011-11-16
RU2007135945A (ru) 2009-04-10
JP5071914B2 (ja) 2012-11-14
EP1854048A1 (en) 2007-11-14
JP2008532176A (ja) 2008-08-14
TWI321294B (en) 2010-03-01
KR20070110399A (ko) 2007-11-16
US20060239560A1 (en) 2006-10-26

Similar Documents

Publication Publication Date Title
CN101128838B (zh) 辨认图
CN101128837A (zh) 基于分割的辨认方法
Awal et al. First experiments on a new online handwritten flowchart database
EP0564827B1 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
US20010033694A1 (en) Handwriting recognition by word separation into sillouette bar codes and other feature extraction
Saba et al. Online versus offline Arabic script classification
CN100541522C (zh) 用于识别手写图形的方法和设备
Perwej The bidirectional long-short-term memory neural network based word retrieval for Arabic documents
CN112837332B (zh) 创意设计的生成方法、装置、终端、存储介质
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
Singh et al. Online handwritten Gurmukhi words recognition: An inclusive study
Vankadaru et al. Text Identification from Handwritten Data using Bi-LSTM and CNN with FastAI
Prasad et al. Trends in handwriting recognition
Lay et al. On-line Chinese character recognition with effective candidate radical and candidate character selections
JP3675511B2 (ja) 手書き文字認識方法及び装置
Palacios et al. Feedback-based architecture for reading courtesy amounts on checks
KR0126800B1 (ko) 한글필기체 온라인 문자인식 장치 및 방법
Javed Investigation into a segmentation based OCR for the Nastaleeq writing system
Suen et al. Farsi script recognition: a survey
JP7095450B2 (ja) 情報処理装置、文字認識方法、および文字認識プログラム
Hoque et al. An efficient fuzzy method for Bangla handwritten numerals recognition
Arifoğlu Historical document analysis based on word matching
Biswas et al. Content Independent Writer Identification Using Occurrences of Writing Styles for Bangla Handwritings
Xie On the recognition of handwritten mathematical symbols
Martinovska et al. Methodologies for recognition of old Slavic Cyrillic characters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant