TWI321294B - Method and device for determining at least one recognition candidate for a handwritten pattern - Google Patents

Method and device for determining at least one recognition candidate for a handwritten pattern Download PDF

Info

Publication number
TWI321294B
TWI321294B TW095106603A TW95106603A TWI321294B TW I321294 B TWI321294 B TW I321294B TW 095106603 A TW095106603 A TW 095106603A TW 95106603 A TW95106603 A TW 95106603A TW I321294 B TWI321294 B TW I321294B
Authority
TW
Taiwan
Prior art keywords
segment
pattern
sequence
candidate
points
Prior art date
Application number
TW095106603A
Other languages
English (en)
Other versions
TW200703129A (en
Inventor
Jakob Sternby
Original Assignee
Zi Decuma Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zi Decuma Ab filed Critical Zi Decuma Ab
Publication of TW200703129A publication Critical patent/TW200703129A/zh
Application granted granted Critical
Publication of TWI321294B publication Critical patent/TWI321294B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Description

九、發明說明:
n 明所屬^-技系舒領J 發明領域 本發明係有關辨識一包含一或多數曲線而代表若干符 號之手寫圖案的技術。本發明尤係有關決定該手寫圖案之 辨識候選者的方法。 發明背景 今曰,手寫已變成一種逐漸普遍之用來將資料輸入資 料管理單元的方法,尤其是在行動電話及個人數位助理 (PDA)中。為了處理所輸入的資料,該手寫筆跡必須能被辨 識及解譯。大部份用來辨識手寫筆跡的現有方法須要該等 被輸入的文字一個一個地逐字寫出,並被分開地辨認。該 方法之一例係被提供於US 4731857專利案中,但最著名的 是由 Palm, Inc.所生產的 Graffiti8。 為能加速資料的輸入,最好能夠容許不工整的草寫字 跡。但是,辨認草寫字跡會比個別文字的辨識更複雜甚多。 草寫字跡的複雜度提高係因為片段連接的文字會產生問 題’即要辨認該手寫圖案中由一字轉變為另/字之處十分 困難。故草寫字跡之辨識的錯誤將會幾達兩倍左右,此則 會大大地複雜化一清晰的連續辨識系統之構造。 用來辨識潦草字跡的方法通常會有如下的問題’即在 相鄰各字之間存有許多可能的片段會形成一爭寫筆跡之可 能片段的組合延伸部。 1321294 因此目前大部份的市售系統皆使用複雜的統計系統, 其係利用神經網路和隱藏的markov模型並具有整合的字 庫。該等系統之一些前例曾被揭示於:P. Neskovic與L. Cooper的 “Neural network-based context driven recognition 5 of on-line cursive script” 中(Seventh International Workshop on Frontiers in Handwriting Recognition Proceedings, p. 352〜362,September 2000);及 M. Schenkel與 I. Guyon 的 “On-line cursive script recognition using time delay networks and hidden markov models,’ 中(Machine Vision and 10 Applications, vol. 8, p. 215-223, 1995)。該等系統之一主要 缺點係它們會較大且需要較大的周邊設施。此外,它們會 高度倚賴所用的字庫。
一字庫可被用來評估該手寫圖案之各種不同辨識是否 正確的可能性,而得改善辨識的結果。即,一手寫圖案的 15 辨識結果可被比對於一字庫,而來刪除未存在於該字庫中 者。此將可增進一正確的辨識結果得被呈現於一使用者的 可能性。在D.Y. Chen,J. Mao及K.M. Mohiuddin之“An efficient algorithm for matching a lexicon with a segmentation graph”,Proceedings of the Fifth International 20 conference on Document Analysis and Recagnition, p. 543~546, 1999,的資料中,乃揭露一種比對字庫與分段候選 者的方法。但是,若該字庫的規模增大時,則該方法會較 ’ 1¾。另一種方法曾被揭於 S. Lucas,之 “Efficient best-first dictionary search given graph-based input”,15th International 6 1321294
Conference on Pattern Recognition, vol. 1, p. 434.437^ 2000,的資料中。該方法係提供一種更有效率的方法來找 出存在於字庫中的最佳辨識結果。該字庫的蒐尋係藉運算 一路徑代數而來達成,因此其必須先構建該手寫圖案的分 5 段。 在WO 02/37933專利中係揭露一種使用字庫來辨識手
寫字的方法。該方法會造成一種解譯圖表,其包含有代表 分段點的頂點,以及端線等係代表各分段點之間的線段之 解譯。一蒐尋程序會施加於該等分段點而來構建該圖表, 10以便決定一字的辨識結果。該蒐尋程序的進行會回顧先前 的分段點,而來決定是否要置設一端線/線段於該圖表 中。故,在各頂點處’一系列的字形假設將會被儲存。且 15 20 故此 為了修整該假設列表’將會進行與一字庫的匹配。針對每 一認可的字體分類,該蒐尋程序在每一分段點處皆須要決 定:是否適宜置放一對應於該字體分類的端線/線段在該 圖表中。此乃需要繁重的運算才能執行該蒐尋程序, 方法會比較慢。
【明内J 發明概要 本發明之一目的係為提供一種可辨識草寫字跡的 方法。本發明的另一目的係為提供一種方法,复^ 一个需要繁 目的 複的學習,且不須很大的處理能力。本發明之又另 係為以一種快速的方法使用一字庫來改善手寫辨識結果 至少某些上述目的能利用如申請專利範圍之各揭立項 7 —1的方法裝置、及電腦程式產品來達成。本發明的特 疋實施例亦會被示於各附屬項的申請專利範圍中。 故’本發明提供一種用以為一包含一或多數曲線而代 5表眾多符號的手寫圖案決定至少—辨識候選者的方法。該 5 =法包括··選出該手寫圖案中之可能的分段點,以用來分 圖案及將該圓案之各片段辨認成-符號。該方法更包 ^該手寫®案的片段比對於代表至少—符號或—符號之 &部份的樣板,其中該圖案之一片段係相當於由一第—分 奴點至一第二分段點的一序列可能分段點。該比對會回報 10若干片段候選者’它們係對應於形成該圖案中各片段之可 月b辨識結果的樣板’且各片段候選者賦具一該樣板與該圖 案片段的匹配測量值。該方法更包含形成一該等片段候選 者之序列的代表圖。該代表圖含有對應於該圖案中之各分 段點的資料方格,其中—資料方格含有對應於後續分段點 15之資料方格的參考附註,而該附註包含分段候選者的資訊 及在分段點之間的圖案片段之相關測量值。該方法更包含 比對該片段候選者序列的代表圖於一字庫,其中該字庫係 呈現許多符號序列’而在-序列中之—符號會保有對所認 可後續符號的參考指示。該方法更包含找出對應於該字庫 20中所認<之符號序列的片段候選者序列,並回覆至少—兮 等所認町之符號序列來作為該手寫圖案的辨識候選者。 本發明亦提供-種用以決定一手寫圖案之至少一辨識 候選者的裝置,該圖案包含一或多數曲線並代表若干符 號,該装釁包含·—裝置能選出在該手寫圖案中之可能的 8 分段點,以用來分段該圖案及將該圖案片段辨識成符號; 〜装置可比對該等圖案片段與代表至少一符號或一符號之 〜部份的樣板,其中一圖案片段相當於由一第一可能分段 點至一第二可能分段點的一序列分段點,該比對會回報對 應於形成該圖案各片段的可能辨識結果之樣板的片段候選 者,各片段候選者皆賦具該樣板與該圖案片段的匹配測量 值;一裝置可形成一該等片段候選者順序的代表圖,該代 表圖含有對應於該圖案中之各分段點的資料方格,其中一 資钭方格會有對後續分段點的參考附註,該附註具有片段 候選者的資訊,及該等分段點之間的圖案片段之相關測量 值;一裝置可比對該片段候選者順序代表圖於一字庫,該 字庳係被示為許多符號序列,而在一序列中之一符號保有 對所認可之後續符號的參考指示;一裝置可找出對應於該 字庠中所認可之符號序列的片段候選者序列;一裝置可回 復至少一該等認可的符號序列,來作為該手寫圖案的辨識 候選者。 本發明亦提供一種電腦程式產品,其可直接載入一資 料皆理單元的内部記憶體中,而包含軟體碼部份能執行上 迷之方法。 藉由本發明,一代表若干符號的手寫圖案乃可被快速 辨識。藉著利用可供分段及辨認的可能分段點,其運算 會同時地分解該手寫圖案並匹配該圖案與樣板。故該 手寫圖案與樣板的比對過程會非常快速。 已知依據某些標準來選擇一有限數目之可能的分段 1321294 點,則該手寫圖案的片段將可僅使用有關這些可能的分段 點之資訊來被辨認。故,其乃可不必使用神經網路或隱藏 的markov模型來辨認潦草的筆跡。取而代之地,可能的分 段點將會被選出,並被用來辨識該手寫圖案中的符號。 5 可能的分段點之選擇將會由受測序列中刪除大量的 點。故,一可控數目的點會被選出,此將可減少用來比對 各點序列與樣板所需的運算工作。已知在受測之點序列中 的一大部份資訊對辨識該手寫圖案乃是冗贅的。因此,刪 除大量的點幾乎不會影響正確辨識該手寫圖案的可能性。 10 又,因僅只有限數目的點會被用於辨識,故某些樣板可被 用來辨認相同的符號。因此,該等樣板乃可代表數種筆勢, 即寫出相同符號之不同外觀或樣態者。 而且,由於可能的分段點會被用作為辨認片段的特 徵,故該等分段候選者序列之代表圖可盯住後續分段點來 15 形成,以造成對後續點的參註。較好是,該等片段候選者 的序列比對於一字庫係藉檢核各分段點的順序來為之。 故,該序列分段點乃可被迅速掠過,且該等片段候選者的 順序將能被以有關所認可序列的資訊來更新。 該手寫圖案的可能片段可被比對於一字庫,而來選出 20 已存在於該字庫中之該手寫圖案的辨識候選者。由於該等 片段候選者的順序係以各含有後續片段候選者資訊的分段 點之間的附註來呈現,故具有相同起始符號的序列將會共 用它們起始的代表圖。一序列的片段候選者會與一字庫比 對,而來依序地檢核在該字庫中是否有任何字具有對應的 10 起始符號。當一序列中之一符號被檢出在該字庫中並沒有 對應部份時,該序列將會立即被刪除,且無須再比對該序 列中之其餘片段候選者於該字庫。事實上,所有具有相同 起始片段候選者(代表同一字首)的序列皆可被刪除,因為它 們會共用代表圖。 於此所述之“符號,,應指任何具有一特定意義的標 記,例如一字母、拉丁文、中文或其它種類的文字,一在 該等文字之間、之前或之後的連結線,一數字,或任何標 點符號等《該等樣板會被設成代表一符號或一符號的一部 份。但,亦可有一或多數樣板被設成代表該手寫圖案中的 雜訊或不規則物,而沒有特定的意義。該等樣板可被用來 辨说 、該手寫圖案中無干於被寫入該圖案内之資訊的部份。 又,所述之手寫圖案”係指由一個人寫下之一符號或一 序列符號的特定形式。 所謂可能分段點的順序”係指由一第一分段點(其 為' 一已被確遇匹配 '--樣板開頭的可能分段點)至·一第二分 段點(其為一已被確認匹配一樣板末端之可能分段點)的順 序。該等可能分段點的序列會含括該第—分段點與第二分 段點之間的所有可能分段點。 一 對應於後續分段點的資料方格附註”係可為一針 對該分段點序列中之下一分段點’或對—稍後分段點的參 考註記。故,匹配該手寫圖案之不同片段的不同片段候選 者序列乃可藉選擇不同的分段點而來形成。 一序列片段候選者與S玄手寫圖案之間的匹配累計測量 值係可用來決定該等辨識候選者的順位排序。當所有分段 白已被分析之後,累計測量值會被指定於最後的分段 ’’ ’其係對應於已與該手寫圖案匹配的樣板或片段候選者 序列。故,4t 知配給最後分段點的資訊將可容易地被用來獲 b手寫圖案的可能辨識候選者。 t 匹配測量值乃可為手寫圖案之特徵與該樣板的對應 寺徵間之偏差的計算距離值。故,該手寫圖案的適當特徵 曰被檢出並比對於該樣板的對應特徵,且一距離值會被算 5玄距離值愈低則該手寫圖案與該樣板之間的匹配兪 10佳。 形成該片段候選者序列的代表圖可包括形成一具有節 點和端線的辨識圖’其中各節點係代表一可能分段點,而 各端線代表沿一序列分段點由一節點至另一節點的路徑, 5亥路徑係對應於該手寫圖案中的可能符號,並會賦具至少 15 —測量值對應於一片段候選者與該圖案片段之間的匹配程 度》 藉著形成一圖表,該等片段候選者序列與字庫的比對 乃能以逐步方式來進行。此將可使被執行的比對獲得良好 的控制。且,該圖表能被有效地使用’因為該圖表僅使用 20 實際上已被辨認為該圖案之可能片段的分段點。又,該等 節點會儲存沿著端線通過該圖表導至該節點之不同路徑的 匹配累計測量值,故對應於片段候選者序列的匹配累計測 置值可容易地在該圖表之各節點中找到。 製成一代表圖可包括容許一預定數目的片段候選者終 12 1321294 5 10 15 20 止於一節點。此將會限制被保 段候選者序列的數目。所認可的於…子庫比對之不同片 匹配測量值的片段候選者。故,矣選者係為具有最佳 案之最佳匹配值的片段候選者才^那些具有與該手寫圖 終止於各節狀片段候選者二=° 制比對片段候選者序列代表圖如 目可被調絲控 表的大小可藉調整所容許之片予^逮度。該辨識圖 故,將片皮;^丨L又候選者的數目來控制。 文將片#又候選者序列之代表圖 亦能被控制。片段㈣者㈣ 庫‘的時間 係、可错計算多少g j;L # 者能被容許以符合-料完成 X候選 時間而來蚊。故,所容許的==之比對的最長容許 圖案與樣板的比對已經進行之後才來夬〜 ^手寫 =胃除對應‘同節點間之相同 符诡序列的重複路徑。該等片段候選者序列可能包含二或 更序列對應於該手寫圖案的不同分段。當該辨識 圖表形成時,該等複似序列會被删除,而只有那些具有最 姐配測量值的序列會被保留。在該辨識圖表中並不須有 複似者’因為該等複似者當比對於該字庫時將會有相同的 結果。故赚複似者可加賴__字庫之_比對。 該字庫可被呈顯為一Tr_。此乃能促成該辨識圖與字 庫間之一非常快速且有效率的比對。 該⑽圖能以一適當的順序來呈現字。在該Tde圖中 任-節點賴錢續料具有1具該節關共同字首。 故,片段候選者序列之代表圖與一字庫的比對可包括逐步 之 13 1321294 地通過該辨識圖表之各節點,並比對該等節點與該Trie圖中 的節點。一序列的片段候選者只須匹配於該Trie圖中之一路 徑,故會使該比對非常快速。 該比對可包括由該辨識圖中的端線造成代表一片段候 5 選者的參註來對應該Trie圖中的節點。此可使該等片段候選 者序列中之一位置能匹配該Trie圖中的對應位置。故,數個 片段候選者序列可以同時地比對於該Trie圖,因為在Trie圖 φ 中的該位置能為每一個片段候選者序列來被迅速地找出》 當一片段候選者序列於逐步通過該辨識圖令的節點 1〇 時’若在該Trie圖中沒有相對應部份,則會立即被刪除。且, 、 所有賦具相同字首的片段候選者序列皆可被同時地删除。 - 在辨識圖中的節點與Trie圖中之節點的比對可包括將 在其餘片段候選者序列中的可能符號數目核對於該Trie圖 中之被谷許的後續符號數目。藉著檢核某一長度的字(或符 15 號的數目)是否對應於片段候選者的長度,則該等不具有對 # 應長度的字之序列將能在比對該辨識圖與Trie圖的過程之 一早期階段即被刪除。 —對應於該字庫中之不完整符號序列的片段候選者序 列亦可被允許。其可用來形成戴短字的辨識候選者。又, 2〇 假使該手寫圖案係被辨認為該字庫中之一截短字,則其完 整的字會被呈現為一辨識候選者。此將可容使用者裁短長 字來輪入’而在辨識結果中得到正確的完整字。 於手寫圖案中之省略一片段而在片段候選者序歹中造 成—漏失片段的候選者,乃可藉匹配一片段候選者於哕字 14 庫中之_ ο ^ 對應符號,並添加一補償於該片段候選者的測 值而來辨識。因此該字庫可被用來找出該手寫圖案中 、— 的缺漏符號。 5 ^忒手寫圖案可被寫成潦草筆跡。該方法能被有利地用 辨識-潦草筆跡的手寫圖案’因為該方法能夠分段點該 敕寫圖案並辨識該等片段。但是,該方法亦可用來辨識工 整寫入或任何潦草與工整字跡混合的手寫圖案。 斜寫圖案可被線上檢測。此令其辨識能在瞬時來進 行。該手寫圖案的辨識可被迅速地執行,而縮減令使用者 10 厭煩的等待時間。因此,線上辨識乃是可行的。 圖式簡單說明 ' 本發明現將參照所附圖式舉例來更詳細說明,其中. : 第1圖係為一用來辨識手寫圖案之方法的流程圖; 第2圖為一手寫圖案之例其中示出所擇的分段點可用 15 來比對該手寫圖案與樣板; 第3圖為一用來比對手寫圖案與樣板之方法的流程圖. • 第4圖為一已被形成來判斷樣板與手寫圖案之間距值 的曲線圖表; 第5圖為一用來比對一辨識圖表與一字庫之方法的流 20 程圖; 第6圖為一辨識圖表正由該手寫圖案之可能辨識結果 來形成之例; 第7圖為一字庫之例;及 第8圖為本發明一實施例之用來辨識手寫圖案的裝置 之示意圖。 15 25 1321294 【實施方式3 較佳實施例之詳細說明 請參閱第1圖,一種用來辨識一手寫圖案的方法現將被 描述。首先,該手寫圖案會被檢測,即步驟102。通常,一 5 使用者得以一尖筆在一壓力敏感式螢幕上來寫入該手寫圖 案,而該筆跡會被以規則時序取樣該筆尖的位置來檢測。 以此方式,該各點的順時序列乃可被獲得。該筆跡亦得以 某些其它方法來檢測,例如使用某些感測器其能檢出被形 成於一筆與書寫表面之間電連接,或能檢測出一筆的移動 10 者。又,該手寫圖案亦可藉掃描一已被寫上該圖案的紙而 來檢出。如此,該筆跡會被檢出形如一書寫表面上的一序 列點,其中的順序係取決於該各點的相互定位,即該各點 的空間順序。 現在,可能在分段點(以下稱為核心點)會在當檢測該手 15 寫圖案時所造成的該序列點中來被選出,如步驟104。該等 核心點會被選出而得縮減該手寫圖案的大小,即在該圖案 中之一筆劃被取樣點的數目。但,該等核心點應要被選成 可選成可使該手寫圖案能被正確地辨識。 第2圖示出一手寫圖案10形成一瑞典字“ek”。在第2圖 20 中,所擇的核心點12亦被示出,且每間次相隔的核心點會 被編號。由第2圖中可看出該草寫字的第一部份具有字母 “d”的外觀。問題是若該辨識方法在該“(Γ的端點將該字分 成兩個片段,則其兩者皆不會含有該字真正的字母。因此 顯然該辨識方法在分段潦草筆跡時必須考慮不止一種的分 16 1321294 段可此性。故而’若干的核心點12會被選出作為能夠代表 該圖案ίο中二個字之間的可能分段點。即’該等核心點12 會被選出以將該手寫圖案10正確分段成個別的符號或文 字。但是’該等核心點12亦能被用來辨識該圖案10之各片 5 段。 核心點12的選擇應不可漏掉任何實際的分段點。但 是’形成該圖案10之可能分段處的核心點12數目,應要以 一種能夠儘量減少核心點12數目的方式來選擇。因此該等 核心點12的選擇會使用某些選擇標準。 10 有許多被選擇的核心點12得以該手寫圖案10之一或多 數曲線的形狀來限制。此即表示該等曲線的形狀會規制被 選擇的核心點12數目。以此方式,若該等曲線的形狀較簡 單則可選擇較少數目的核心點12,而較複雜的曲線會選出 較多數目的核心點。 15 被選擇的核心點12數目亦可被限制於保有一或多數曲 線之方向變化資訊的點。故,只有在該曲線彎曲或轉彎處 的點會被用來作為核心點。此令該等核心點12能被用來描 出曲線的形狀,雖然只使用有限數目的核心點12。 依據本發明的較佳實施例,以下的選擇標準將會被使 20用。第一種選擇標準係選取在一垂直於主書寫方向的方向 中之最遠端點。吾人將這些點分別設定為北(N)和南(S)核心 點。於第2圖的手寫圖案1〇中,該等n和s核心點皆被以圓圈 標示。每一對N-S點皆又被以位在其間的額外一至三個點來 補充。這些補充點係以另外兩種標準來選擇,即一曲率與 17 1321294 一銳度標準。吾人稱此等額外附加點為中間(Μ)核心點。在 第2圖的手寫圖案10中,該等]^核心點係以星號來標示。該 曲率標準會判斷該圖案1 〇是否充分地偏離一介於二相鄰核 心點間之一直線。嗣,一河核心點會被選在最偏離該直線 5的位置處。該銳度標準則會判斷該圖案是否造成一尖銳的 迴轉。嗣,一Μ核心點會被選在該位置。該銳度標準是否 符合的判定,係藉算出該圖案10在各受測點的偏差而來作 成。在造成尖銳轉彎處,其偏差會被視為一大值。該等銳 度與曲率標準可被用來選擇一對N_s核心之間的數個厘核 10心點。假使依據銳度和曲率標準未能找出適當的點,則對 應於該N與S核心點間之曲線一半長度的中間點,將會被選 作為Μ核心點。 該方法更包含判斷在各核心點處或其附近之該手寫圖 案的特徵,如步驟106。其係可使用所選取之各核心點12的 15座標值來直接辨識。但是,一核心點12的附近亦含有該圖 案10之形狀的某些資訊。為能含括此額外的形狀資訊每 一核心點之一組5個特徵會被依本較佳實施例來判斷。各核 ‘“點12 a會依據其如何被選出而由一標籤組來賦予一標 籤。其中’該三種標籤N,S,Μ將會被使用。此等核心點 20 12的;^籤會構成用來匹配核心點序列與樣板的基礎。又, ^等特徵會包含朝向及遠離該核心點12的向量’該核心點 12的y座標值,即在垂直於主書寫方向的方向之值,而該指 定距離dX為由該核心點12沿平行於主書寫方向至前一核心 •點之朝右最遠的X座標。且,其亦可判斷一筆是否已被提起 18 1321294 或壓著在該核心點12上。此特徵時常會代表一分段點,但 亦可能代表一符號中之二筆劃間的中斷處。因此,該特徵 可被用來辨識能容許一筆被提起或壓著在核心點12上的符 號。 5 邊圖案1 〇之所擇核心點12被判定的特徵嗣會與樣板比 對’如步驟108 ’來找出一或數候選者以供辨識該手寫圖案 10。該等樣板係設在一資料庫中,且會呈顯許多序列核心 點的特徵。故,所判斷的特徵可直接與樣板的特徵比對匹 配。該資料庫可包含若干樣板代表相同符號的不同筆勢, 10 以便即使在使用者具有不同的書寫態樣時亦能辨識圖案。 又’該資料庫亦包含代表連線的樣板,即典型會將二字連 在一起但並非該實際字體的一部份之筆劃。所有在該等草 寫文字中間的字母皆會具有連線,而在一字開頭的字母則 可能會有或可能沒有該連線。草寫文字亦可能終結於一連 15 線。某些樣板可代表一含有連線的字母。此較好係被使用 於字母“e”、“r”、“c”、“X”、s”的樣板。 現請參閱第3及4圖,一手寫圖案10之所擇核心點12與 樣板的特徵比對將會被說明。該等核心點12係被視為該手 寫圖案10的可能分段點《且,由一第一可能分段點至一第 20 二可能分段點的核心點12順序將會被視為該手寫圖案中之 一可能符號的代表。故,該等核心點12序列的特徵會被比 對於樣板。 所選出的核心點12會呈顯一較大數量之可比對於樣板 的不同核心點12序列。為能完成比對,該等核心點12會被 19 1321294 依序來分析。由第一個核心點12開始,任何可能的核心點 12序列皆會與樣板匹配。匹配一樣板之一序列的最後核心 點12會被儲存作為一圖表中之一節點,如步驟11〇。以此方 式’對應於樣板的片段候選者可被選出作為該等核心點12 序列所代表之該圖案10的片段之可能辨識結果。一可提供 該核心點序列與片段候選者之間的四配程度之距離值會被 儲存在該節點中,其代表第一核心點與該節點間之一路 徑,見步驟112。而當由該第一核心點開始之所有可能的核 10 心點12序列皆已被匹配於樣板後,進_步的匹配會由已被 儲存作為該圖表中之節點的核心點12來開始進行。現在, 在樣板與另-序列核心點之間的距離值會被加諸於儲存在 。玄另序列核心點之起始節點的第一距離值中。故,一累 計距離值讀儲存在該圖表㈣點處1此方式,一非循 15 環圖表將會針對所有的核心來形成,且在該圖表中的 =後核心點將會保有通過該圖表之不同路徑的累計距離值 '^ S各片心候選者的序列已被判定作為該手寫圖 可能辨識結果,即步驟114,並會代表穿過該圖表之 20 〗S破呈顯給制者料韻候選結果的所擇 路徑,乃可觀對於—字庫㈣被以减 在第4圖中,—固圭 牵; 表20係被示出代表第2圖中的手寫圖 的圓圈及2配°該圖表2G包含節點22等被標示成編號 =穿=24等介於各節點之間。如圖中所示,其中 圖安10二二表的路徑代表該手寫圖案的不同分段。該 木10與樣板的匹配會同時限定該圖案_可能分段,並 20 1321294 造成該分段的手寫圖案ι〇與一序列片段候選者之間的相似 測量值。 在該手寫圖案中之一核心點與該等樣板中之一點間的 距雄值係為該各點之特徵差異的絕對值之一加權總和。一 5序列核心點與一樣板之間的距離值即為個別諸點之間的距 離值之和。但是,形成該圖表中之節點的核心點距離應只 被計算一次。故,形成該節點的核心點與該等樣板之間的 距離乃可被指定於一導至該節點或由該節點引出的路徑, 並反應出一介於該核心點與對應於導至該節點及由該節點 10 引出路徑之二樣板間的平均距離。 但是,某些特定的片段候選者序列可能會被摒除。此 將有助於補彳貞S亥手寫圖案中的資訊不正確的情況。伸 是,其亦可被用來拒絕不可能或不大可能的候選者而改善 辨識結果。例如,-序列的兩個連線將會被排除。又,二 U對某些特定的片段候選者序列,一加權將會配予該累計距 離值。此乃表示包含某些不大可能之樣板的辨識結果並不 會被完全地拒絕,但會被賦予一加權而使其更難以令該等 辨識結果具有最小的累計距離值。 該手寫圖案1G之許多不同的可能辨識結果現已被決 定,如第4圖所示。為選出該圖案1〇之最有可能的辨識;吉 果,在該圖表20中的片段候選者順序會被比對於一字庫。。 現請參閱第5〜7圖,-進行比對於字庫的實施例將會被說 明。 為進行與字庫的比對,一辨識圖4〇會被形成來代表該 21 等片段候選者的各種不同可能順序’如步驟120。請參閱第 ㈣’該辨識圖40將會被說明。第6圖示出一被造成用來辨 °’。第2圖所示之手寫圖案1G的辨識圖40之例。該辨識圖40係 以十刀類似則述用以辨識該手寫圖案川之各片段的圖表 5之方式來作成。但是,包含於該辨識圖中的資訊可較 減乂例如’在圖表2G中可能包括並不符合整體手寫圖案 的刀4又點。6亥等分段點及不完整的片段候選者序列在當形 成該辨認圖40時乃可被略除。且,該圖表20可能包含會形 成相同片段候選者序列之不同的分段點。這些類似冗複的 10片段候選者序列在形成該辨識圖時亦可被略除。 該辨識圖40係由節點42等所構成,它們代表在比對該 圖案10與樣板時已被認定為可能的分段點者。該等節點42 在第6圖中係被示為編號的圓圈,其係依據該節點42所代表 的核心點12之號碼來標示。一具有對後續節點之參考指示 15的節』42會具有该手寫圖案之各節點42間的線段之片段候 選者為資訊。該等節點42的參考參註會由端線料來呈顯。 /等柒線44含有片段候選者之符號的資訊,以及匹配該片 段候選者與該圖案之片段所得的距離值,如第^圖中之方格 内所不。各節點42亦可包含-最小及最大數目的片段候選 2〇者(未示出)’它們係由該節點42所衍生。該辨識圖40亦可被 構建成只容許有限數目的片段候選者納入一節點4 2中。設 定該等片段候選者納入一節點42的最大容許數目,將可限 制該辨識圖40的大小,俾在比對該辨識圖4〇與字庫時能夠 限制其處理時間。或者,只有某些所具距離值低於一臨界 22 1321294 值的片段候選者會被允許。該辨識圖40亦可用來快速地回 報最匹配該手寫圖案的片段候選者序列,而不必再參酌字 庫。此乃可藉將該容許納入一節點之最大片段候選者數目 設為1而來達成。如此,則該辨識圖40將只會包含具有最小 5 距離值的片段候選者序列。 在第7圖中,一字庫5〇的簡化例乃被示出。該所示字庫 50只包含少數的字,但代表該字庫5〇目前最佳的結構。該 字庫50係被形成一 Trie圖。該圖50包含節點52等代表符號。 該等節點52係被端線54連接,而使所容許的符號序列形如 ίο穿過該圖5〇的串線。該根基節點代表一空的串線,因此所 有的符號序列皆會共用該根基節點。代表一序列中之最後 符號的節點係被標示於第3圖的方格中。該各節點52亦可包 含由該節點5 2衍生之一最小及最大符號數目的資訊(未示 出)。 15 該辨識圖40會藉逐步比較該辨識圖40之各節點42與字 庫50,而來與該字庫5〇比對,如步驟122。從辨識圖的第一 個節點開始,由此節點伸出之各端線的線段候選者之正確 性係可藉檢核該字庫5〇中是否有一個字以相同符號開始而 來決定。嗣,由該第一節點伸出之各端線會被以該等確認 2〇符號的資訊來更新,其若係在該字庫50中具有一對應符號 的線段候選者將會被保留’而其它的線段候選者則會被刪 除。該等端線的更新資料係被示於第6圖的方格内。該等端 線亦會參照該字庫50中對應於該辨熾圖4〇中之線段候選者 顺序之各位置的㊉點來更新。該比对萌會通過該辨識圖 23 1321294 中的所有節點42來繼續進行’而剛除所有在該字庫如乃 有對應符號的線段候選者序列。針對該辨識_每二沒 42 ’由此節點伸出之各端線的線段候選者之正確性,:點 檢核該字庫5〇中由該節點伸出之蠕線比對於識辨識圖節= 5是否有一對應符號而來決定。 … 利用在一序列線段候選者中的符號之最小及最大數目 的資訊,該正確性檢核亦可包括檢核一字中的長度界限1 否吻合該字庫50中的相關節點。若該等長度界限不能吻 合,則該序列線段候選者會被刪除。 10 又,為了控制時間繁複性,該辨識圖40中之每一節點 42比對於該Trie圖50的數目之上限將會被設定。如此將可 獲得對時間冗長性的控制。但是,其亦會有一風險即—開 始匹配不良的線段候選者序列將會被刪除。 當該辨識圖40的所有節點皆已被分析之後,該辨識圖 15 4 0的最後節點將會保有該手寫圖案1 〇之最佳辨識候選者的 資訊’其亦會呈現在一字庫中。該手寫圖案10的辨識候選 者現將會被回覆,即步驟124 ’俾呈顯於使用者。具有最小 累計距離值的辨識候選者會以該手寫圖案之一解譯結果呈 現於該使用者。或者,眾多的辨識候選者亦可同時呈現給 20 使用者,以便使用者選出正確的解譯。 現請參閱第8圖,,用來辨識一手寫圖案的裝置30將會 被說明。該裝置30包含一檢測器32能以一序列的點來記錄 一手寫圖案。該檢測器32可形成一壓敏式螢幕其上能供使 用者書寫。該裝置30更包含一分析器34以分析受測的手寫 24 1321294 圖案。該分析器34可形成一能在電腦之中央處理單元運作 的程式。該分析器34包含能選擇該手寫圖案之核心點的裝 置,及能判定該手寫圖案在該等核心點處或其附近之特徵 的裝置。該裝置30更包含一資料庫36含有樣板等可代表各 5 核心點的特徵。該分析器34更包含能計算該手寫圖案之一 序列核心點特徵與該等樣板之間的距離值。該分析器34係 可造成一結構性比對該手寫圖案與樣板的圖表。該分析器 34亦可造成一辨識圖呈顯出形成該手寫圖案之可能辨識結 果的多組線段候選者序列。該裝置30更包含一字庫38含有 10 一Trie圖表代表認許的字或各序列符號。該分析器34亦能比 對該辨識圖與字庫來決定最匹配該手寫圖案的序列符號。 該等可能的辨識結果會被呈現在一顯示器上,其可與供該 手寫圖案寫入的壓敏式螢幕分開或合併。 依據另一實施例,該手寫圖案的癥記可利用前述的方 15 法和裝置來給予特殊的考量。在本文内容中,所謂的“癥 記”(diacritics)係被詮釋為一靠近或相交一符號的記號或 筆劃,其中該記號或筆劃在某些情況下係代表具有該記號 或筆劃的符號與沒有該記號或筆劃的符號是不同的兩個符 號,例如g和e,a和a,ϋ和〇,t和1等;而在某些情況下則係 20 為該符號之一特徵,其中若該符號沒有該癥記時仍可被解 譯為正確的符號,例如i和j。在草寫筆跡中當該字的其餘部 份被寫完之後,將可能有許多的癥記會被劃出。該等癥記 對辨識是很重要的。其原因係在一草寫字中恐有許多線段 會匹配一沒有癥記的符號,例如若“i”沒有一點則可能被解 25 1321294 譯成另一字母的一部份。 , 某些能將草寫字分解成依時序分類的字母片段之分段 式方法,例如在本案中於前所述的方法’考量該等癍記而 來正破辨識乃是很重要的。 5 在一利用癥記資訊的實施例中,有關該等癥記的資訊 會被如一特徵來指定於一小組的核心點,如第1圖中的步驟 106。因此’有關該等癥記的資訊會被呈現在該核心點中, ^ 且在辨識時可被使用而成為一種會影響比對可能符號與樣 板之結果的因素。 10 在該手寫圖案中,一癥記可能會被辨認成一未連接的 連結線,即,一未連接於任何線段的筆劃,而被認為是一 連結線。 可被作為指定於該小組核心點之各點的特徵係可為該 癥退的位置,如x和y座標,由該特定核心點至該癥記的絕 十距離由S亥核心點至該癥記沿X方向的距離,由該核心點 至该癥記沿y方向的距離,該癥記的長度,該癥記的形狀等 等。有關被指定於該等核心點之癥記的特徵可僅包括上述 之特徵,或包含多個特徵的組合。 被指定該等癥記的該小組核心點係可被設定為只含有 k不1^或1^的核心點。此乃能使該方法比含有全部核心點者 更為快逮。 15 20 ' 在该等核心點12的順序分析時,亦可使用該等癥記特 1來補償該節點22的距離值。例如,若該節點22被建議(即 候選)的忽^。占 才就係為“i”,並有一癥記係合理地靠近於對應該節 26 1321294 點22的核心點12,則該節點22可具有一較小的補償。在該 核心點12與癥記之間的較大距離則會造成較大的補償。一 最大的補償可被設成一值,其係對應於一本應具有一癥記 但却未見有該癥記之候選者的補償,而如此之一最大的補 5 償會被賦予該等與癥記之距離超過一預定值的候選者。在 該順序分析時使用癥記特徵乃令其能使該等癥記在形成圖 表20時來影響該圖表20的累計距離值。此對字母“i”和“j”會 特別有利,因為它們的結構較簡單;若該癥記未被考慮, 則會造成一潛在風險即有部份的其它字母/符號會被錯誤 10 地解譯成“i”和“j”。因此,利用上述含有“i”及/或“j”的路 徑作為候選者,並具有一癥記位在離該候選者之最先核心 點一合理距離内者將會較佳。在順序分析時使用癥記特徵 亦可被實施於其它符號或字母。 依據一實施例,在該辨識過程中使用有關癥記之資訊 15 的方法,乃可如前述地針對具有標籤N或Μ並附有一癥記之 各核心點12來決定最靠近癥記點。依據另一實施例,該最 近癥記點的特徵會被指定於每一具有標籤Ν或Μ的核心 點,且該最近癥記點係在離該核心點一預定距離處。在指 定癥記特徵之後,當構建代表該手寫圖案10之分段的圖表 20 20時,匹配於一候選符號的分段會含有一癥記可被補償一 值,其係有關於離該分段之初始Ν或Μ核心點的距離。在並 非所有Ν和Μ核心點皆須被指定一癥記特徵的實施例中,一 最大補償將會配予一被假設具有一癥記的節點,其中該候 選者的Ν和Μ核心點係未被指定一癥記特徵者。 27 1321294 又,由該分段圖表中之一路徑所造成的候選字,若其 顯而易見並不須有癥記,則在匹配該候選字與一字庫之後 亦可被補償。使用一字庫已在先前說明過。一種可用來決 定該候選字是否包含它們顯然不必要的癥記之方法係檢查 5 該候選字是否包含太多的癥記。此係可藉比對包含在該候 選字中的癥記數目與在造成該候選字之路徑中所確認的癥 記數目,然後補償該候選字的過多癥記而來達成。 例如: 補償=因數x(A-B);其中Α-Β>0 10 補償=0;其中Α-Β<0 A =癥記的最大數目(在候選字中者) B =觀察到的癥記數目(在造成候選字的路徑中者) 在造成候選字之路徑中所看到的癥記數目,乃可藉計 算未連接的連線,即未連接於任何線段而被辨認為連結線 15 的筆劃而來獲得。 依據又另一實施例,未使用的癥記亦可藉進行所造成 的候選字與造成該候選字的路徑之間的癥記匹配檢核而來 被補償。此係可藉比較該候選字中所含的癥記數目與造成 該候選字之路徑中被確認的癥記數目,然徵補償該候選字 20 中的消失癥記而來達成。 例如: 補償=因數x(B-A);其中Β-Α>0 補償=〇 ;其中Β-Α<0 A=癥記的數目(在候選字中者) 28 1321294 B =觀察到的癥記數目(在造成候選字的路徑中者) 藉著使用此方法,該系統乃能例如將“blind”字辨認為 “blind”,即使若該書寫的“i”字體較近似的字母“e”而可能形 成“blend”字,或者若該點(、)稍微被誤植時。 5 應請暸解上述的較佳實施例並無限制之意,並有許多 變化實施例可能含括於以下申請專利範圍所界定的保護範 圍内。 I:圖式簡單說明】 第1圖係為一用來辨識手寫圖案之方法的流程圖; 10 第2圖為一手寫圖案之例其中示出所擇的分段點可用 來比對該手寫圖案與樣板; 第3圖為一用來比對手寫圖案與樣板之方法的流程圖; 第4圖為一已被形成來判斷樣板與手寫圖案之間距值 的曲線圖表, 15 第5圖為一用來比對一辨識圖表與一字庫之方法的流 程圖; 第6圖為一辨識圖表正由該手寫圖案之可能辨識結果 來形成之例; 第7圖為一字庫之例;及 20 第8圖為本發明一實施例之用來辨識手寫圖案的裝置 之示意圖。 【主要元件符號說明】 10…手寫圖案 20...圖表 12…核心點 22,42,52...節點 29 1321294 24,44,54…端線 30.. .辨識裝置 32.. .檢測器 34.. .分析器 36.. .資料庫 38,50...字庫 40...辨識圖 102〜108…各辨識步驟 110〜114,120〜124. ·.各比對步驟
30

Claims (1)

1321294 第95106603號專利申請案申請專利範圍修正本,切f/x頁 5 十、申請專利範圍: 1. 一種用以決定一手寫圖案之至少一辨識候選者的方 法,該圖案含有一或多數曲線而代表眾多符號,該方法 包含: 選出該手寫圖案中的可能分段點,以用來分段該手 寫圖案並將該等圖案片段辨認成符號,其中該選出可能 分段點包含選取在一垂直於一主書寫方向的方向中之 • 最遠端點及選擇至少一位在各對最遠端點間的核心 點,該至少一核心點係依據一曲率標準與一銳度標準來 10 選擇,其中該曲率標準判斷該手寫圖案是否充分地偏離 一介於二相鄰核心點間之一直線且其中該銳度標準判 斷該手寫圖案是否造成一尖銳的迴轉; 將該等圖案片段比對於代表一符號或一符號之一 部份的樣板,其中各圖案片段係對應於由一第一分段點 15 至一第二分段點之一序列可能分段點,該比對會回報匹 拳 配於某些樣板的片段候選者,該等樣板係形成該等圖案 片段的可能辨識結果,而各片段候選者會賦具一該樣板 與圖案片段的匹配測量值; 製成該等片段候選者序列的代表圖,該代表圖包含 20 對應於該手寫圖案中之各分段點的資料方格,其中該資 料方格會含有對應於後續分段點之資料方格的附註,而 該附註含有片段候選者的資訊及該圖案片段與分段點 之間的匹配測量值; 比對該等片段候選者序列的代表圖於一字庫,該字 31 了321294 庫係呈顯許多符號序列,而在一序列中之一符號存有被 認可之後續符號的附註; 找出對應於該字庫中被認可符號序列的片段候選 者序列;及 5 回覆至少一該等被認可的符號序列作為該手寫圖 案之一辨識候選者。 2. 如申請專利範圍第1項之方法’其中該等片段候選者序 列之代表圖與一字庫的比對包括檢核分段點的順序。 3. 如申請專利範圍第1項之方法,其中一序列片段候選者 ίο 與該手寫圖案之間的匹配累計測量值會被用來決定該 等辨識候選者的順位排序。 15 20 4. 如申請專利範圍第1項之方法,其中製成該等片段候選 者的代表圖乃包括製成-具有節點和端線的辨識圖 表’該各節點代表-可能的分段點,而各端線代表沿一 序列分段點由-節點至另—節點之—路徑,該路徑對應 於該手寫圖案中之—可能符號,並賦具至少—測量㈣ 應於-片段候選人與該圖案片段之間的匹配好里, 5. 如申請專利範圍第4項之方法,其中製成 括只容許-狀數㈣諸_纽切圖係包 6. 如申請專利範圍第5項之方法 . 整來押制u 、該預疋數目可被調 度來控制比對該片段候選者序列代表圖與該字庫的速 片段候選 如申請專利範圍第5項之方法,其中所容許的 者為具有最佳匹配測量值的片段候選者。 32 7. 1321294
8. 如申請專利範圍第4項之方法,其中製成該辨識圖表乃 包括刪除對應於相同節點間之相同符號序列的冗複路 徑。 9. 如申請專利範圍第4項之方法,其中該字庫係形成一Trie 5 圖。 10. 如申請專利範圍第9項之方法,其中該片段候選者序列 之代表圖與字庫的比對係包括逐步通過該辨識圖表之 各節點,並將該等節點相較於該Trie圖中的節點。 11. 如申請專利範圍第10項之方法,其中該比對包括造成由 10 該辨識圖表中代表一片段候選者的端線至該Trie圖中之 對應節點的參考附註。 12. 如申請專利範圍第10項之方法,其中當逐步通過該辨識 圖表中的節點時,若一片段候選者序列在該Trie圖中沒 有對應部份,則立即會被刪除。 15 13.如申請專利範圍第10項之方法,其中比對該辨識圖表中 之節點與該Trie圖中之節點係包括檢核其餘片段候選者 序列中之可能的符號數目與該Trie圖中所容許的後續符 號數目。 14. 如申請專利範圍第1項之方法,其中對應於該字庫中之 20 一不完整符號序列的片段候選者序列是可容許的。 15. 如申請專利範圍第1項之方法,其中會在該片段候選者 序列中造成一消失片段候選者之該手寫圖案中的省略 片段,係藉將一片段候選者匹配於該字庫中之一非對應 符號,並添加一補償值於該片段候選者所賦具的測量值 33 1321294 卜修正爾 P>- - _ j - —·严此 iwt=-^· I ι·γ J 5 • 而來辨識。 16. 如申請專利範圍第1項之方法,其中該匹配測量值係為 該手寫圖案的特徵與該樣板的對應特徵間之偏差的計 算距離值。 17. 如申請專利範圍第1項之方法,其中該手寫圖案係被寫 成潦草字跡。 18. 如申請專利範圍第1項之方法,其中該手寫圖案係被線 上檢測。 19. 一種用以決定一手寫圖案之至少一辨識候選者的裝 10 r 置,該圖案包含一或多數曲線並代表眾多符號,而該裝 置包含: 一裝置能選出該手寫圖案中之可能的分段點,以用 來分段點手寫圖案並將該等圖案片段辨認成符號,其中 該選出可能分段點包含選取在一垂直於一主書寫方向 15 的方向中之最遠端點及選擇至少一位在各對最遠端點 • 間的核心點,該至少一核心點係依據一曲率標準與一銳 度標準來選擇,其中該曲率標準判斷該手寫圖案是否充 分地偏離一介於二相鄰核心點間之一直線且其中該銳 度標準判斷該手寫圖案是否造成一尖銳的迴轉; 20 一裝置可比對該等圖案片段與代表一符號或一符 號之一部份的樣板,其中一圖案片段對應於由一第一可 能分段點至一第二可能分段點之一序列分段點,該比對 會回報匹配於形成該等圖案片段之可能辨識結果的樣 板之片段候選者,而各片段候選者係賦具一該樣板與圖 34 1321294 __ 日修正替換頁 案片段的匹配測量值; 一裝置能製成該等片段候選者序列的代表圖,該代 表圖含有對應於該手寫圖案中之各分段點的資料方 格,其中該資料方格會含有後續分段點的參考附註,而 5 該附註含有片段候選者的資訊及該圖案片段與分段點 之間的匹配測量值; 一裝置可比對該等片段候選者序列的代表圖於一 字庫,該字庫係呈顯許多符號序列,而在一序列中之一 符號存有所認可之後續符號的附註; 10 一裝置能找出對應於該字庫中被認可符號序列的 片段候選者序列;及 一裝置能回覆至少一該等被認可的符號序列作為 該手寫圖案之一辨識候選者。
35
TW095106603A 2005-02-28 2006-02-27 Method and device for determining at least one recognition candidate for a handwritten pattern TWI321294B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0500465 2005-02-28

Publications (2)

Publication Number Publication Date
TW200703129A TW200703129A (en) 2007-01-16
TWI321294B true TWI321294B (en) 2010-03-01

Family

ID=36927695

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095106603A TWI321294B (en) 2005-02-28 2006-02-27 Method and device for determining at least one recognition candidate for a handwritten pattern

Country Status (8)

Country Link
US (1) US7756335B2 (zh)
EP (1) EP1854048A1 (zh)
JP (1) JP5071914B2 (zh)
KR (1) KR20070110399A (zh)
CN (1) CN101128838B (zh)
RU (1) RU2007135945A (zh)
TW (1) TWI321294B (zh)
WO (1) WO2006091156A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI560641B (en) * 2015-09-03 2016-12-01 Magic Power Co Ltd A handwriting grading system and the method thereof

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
WO2000074240A1 (en) 1999-05-27 2000-12-07 America Online Keyboard system with automatic correction
US7286115B2 (en) 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
US7750891B2 (en) 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US7821503B2 (en) 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
US7030863B2 (en) 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US8583440B2 (en) 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7907756B2 (en) * 2005-01-31 2011-03-15 Siemens Medical Solutions Usa, Inc. System and method for validating an image segmentation algorithm
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
US7587378B2 (en) 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
US7580925B2 (en) * 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
CN101611417B (zh) 2006-12-01 2012-07-04 Zi德库玛股份公司 用于字符识别的方法
US7907783B2 (en) * 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
US8225203B2 (en) 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8201087B2 (en) * 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
JP4940973B2 (ja) * 2007-02-02 2012-05-30 富士通株式会社 論理構造認識処理プログラム、論理構造認識処理方法および論理構造認識処理装置
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8299943B2 (en) 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
US8020119B2 (en) * 2007-12-14 2011-09-13 Microsoft Corporation Engine support for parsing correction user interfaces
US8672225B2 (en) 2012-01-31 2014-03-18 Ncr Corporation Convertible barcode reader
CA2707246C (en) 2009-07-07 2015-12-29 Certusview Technologies, Llc Automatic assessment of a productivity and/or a competence of a locate technician with respect to a locate and marking operation
US8290204B2 (en) 2008-02-12 2012-10-16 Certusview Technologies, Llc Searchable electronic records of underground facility locate marking operations
US8532342B2 (en) 2008-02-12 2013-09-10 Certusview Technologies, Llc Electronic manifest of underground facility locate marks
WO2009113869A1 (en) * 2008-03-12 2009-09-17 Lumex As A word length indexed dictionary for use in an optical character recognition (ocr) system.
US8634645B2 (en) * 2008-03-28 2014-01-21 Smart Technologies Ulc Method and tool for recognizing a hand-drawn table
US8902251B2 (en) 2009-02-10 2014-12-02 Certusview Technologies, Llc Methods, apparatus and systems for generating limited access files for searchable electronic records of underground facility locate and/or marking operations
US8572193B2 (en) 2009-02-10 2013-10-29 Certusview Technologies, Llc Methods, apparatus, and systems for providing an enhanced positive response in underground facility locate and marking operations
KR101080254B1 (ko) * 2009-06-02 2011-11-08 (주)펜앤프리 터치스크린을 이용한 필기 입력 방법 및 이를 이용한 필기 입력 장치
US8310461B2 (en) 2010-05-13 2012-11-13 Nuance Communications Inc. Method and apparatus for on-top writing
US8977558B2 (en) 2010-08-11 2015-03-10 Certusview Technologies, Llc Methods, apparatus and systems for facilitating generation and assessment of engineering plans
CN102385707A (zh) * 2010-08-30 2012-03-21 阿里巴巴集团控股有限公司 一种数字图像识别的方法、装置及爬虫服务器
US20120281919A1 (en) * 2011-05-06 2012-11-08 King Abdul Aziz City For Science And Technology Method and system for text segmentation
US10254952B2 (en) 2012-09-26 2019-04-09 Google Llc Progress display of handwriting input
US9026428B2 (en) 2012-10-15 2015-05-05 Nuance Communications, Inc. Text/character input system, such as for use with touch screens on mobile phones
US20150371100A1 (en) * 2014-06-23 2015-12-24 Xerox Corporation Character recognition method and system using digit segmentation and recombination
US10101889B2 (en) 2014-10-10 2018-10-16 Salesforce.Com, Inc. Dashboard builder with live data updating without exiting an edit mode
US9767145B2 (en) * 2014-10-10 2017-09-19 Salesforce.Com, Inc. Visual data analysis with animated informational morphing replay
US9449188B2 (en) 2014-10-10 2016-09-20 Salesforce.Com, Inc. Integration user for analytical access to read only data stores generated from transactional systems
US9600548B2 (en) 2014-10-10 2017-03-21 Salesforce.Com Row level security integration of analytical data store with cloud architecture
US10049141B2 (en) 2014-10-10 2018-08-14 salesforce.com,inc. Declarative specification of visualization queries, display formats and bindings
EP3217303A4 (en) * 2014-11-06 2018-06-20 Japan Science And Technology Agency Regular expression creation method and regular expression creation device of flow pattern, and computer-executable program
US10115213B2 (en) 2015-09-15 2018-10-30 Salesforce, Inc. Recursive cell-based hierarchy for data visualizations
US10089368B2 (en) 2015-09-18 2018-10-02 Salesforce, Inc. Systems and methods for making visual data representations actionable
US10332628B2 (en) * 2016-09-30 2019-06-25 Sap Se Method and system for control of an electromechanical medical device
US10311047B2 (en) 2016-10-19 2019-06-04 Salesforce.Com, Inc. Streamlined creation and updating of OLAP analytic databases
US10514841B2 (en) * 2018-04-30 2019-12-24 Microsoft Technology Licensing, Llc Multi-layered ink object
TWI676919B (zh) * 2018-08-02 2019-11-11 義守大學 一種電腦化寫字評估與訓練方法
US11604961B2 (en) 2019-04-30 2023-03-14 International Business Machines Corporation Scalable model serving
CN113850186A (zh) * 2021-09-24 2021-12-28 中国劳动关系学院 基于卷积神经网络的智能流媒体视频大数据分析方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4611346A (en) * 1983-09-29 1986-09-09 International Business Machines Corporation Method and apparatus for character recognition accommodating diacritical marks
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JPH01316890A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd オンライン手書文字認識方式
US5029223A (en) * 1990-02-02 1991-07-02 International Business Machines Corporation Constraint driven-on line recognition of handwritten characters and symbols
US5727081A (en) * 1991-12-31 1998-03-10 Lucent Technologies Inc. System and method for automated interpretation of input expressions using novel a posteriori probability measures and optimally trained information processing networks
CN1025764C (zh) * 1992-05-12 1994-08-24 浙江大学 字符识别方法
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
EP0686291B1 (en) * 1993-12-01 2001-10-10 Motorola, Inc. Combined dictionary based and likely character string handwriting recognition
IL109268A (en) * 1994-04-10 1999-01-26 Advanced Recognition Tech Method and system for image recognition
US5687254A (en) * 1994-06-06 1997-11-11 Xerox Corporation Searching and Matching unrecognized handwriting
US6137908A (en) * 1994-06-29 2000-10-24 Microsoft Corporation Handwriting recognition system simultaneously considering shape and context information
DE69428527T2 (de) * 1994-07-04 2002-05-08 Hewlett Packard Co Kritzlervergleich
US6125207A (en) * 1995-06-05 2000-09-26 Motorola, Inc. Encoded facsimile communication with a selective system and method therefor
US6453070B1 (en) * 1998-03-17 2002-09-17 Motorola, Inc. Diacritical processing for unconstrained, on-line handwriting recognition using a forward search
US6285786B1 (en) * 1998-04-30 2001-09-04 Motorola, Inc. Text recognizer and method using non-cumulative character scoring in a forward search
US6249605B1 (en) * 1998-09-14 2001-06-19 International Business Machines Corporation Key character extraction and lexicon reduction for cursive text recognition
US6597809B1 (en) * 1999-03-19 2003-07-22 Raf Technology, Inc. Rollup functions for efficient storage presentation and analysis of data
US7336827B2 (en) * 2000-11-08 2008-02-26 New York University System, process and software arrangement for recognizing handwritten characters
JP3490703B2 (ja) * 2001-03-23 2004-01-26 ライズ株式会社 アウトラインフォント情報に基づく文字処理方法及びその方法をコンピュータシステムに実行させるためのコンピュータプログラムを記録したコンピュータ読取り可能な記録媒体
US7174043B2 (en) * 2003-02-25 2007-02-06 Evernote Corp. On-line handwriting recognizer
SE528063C2 (sv) * 2004-11-12 2006-08-22 Zi Decuma Ab Metod och anordning för segmenteringsbaserad igenkänning
CN101128837A (zh) * 2005-02-28 2008-02-20 Zi德库玛股份公司 基于分割的辨认方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI560641B (en) * 2015-09-03 2016-12-01 Magic Power Co Ltd A handwriting grading system and the method thereof

Also Published As

Publication number Publication date
CN101128838B (zh) 2011-11-16
TW200703129A (en) 2007-01-16
JP2008532176A (ja) 2008-08-14
US20060239560A1 (en) 2006-10-26
KR20070110399A (ko) 2007-11-16
WO2006091156A1 (en) 2006-08-31
CN101128838A (zh) 2008-02-20
RU2007135945A (ru) 2009-04-10
EP1854048A1 (en) 2007-11-14
US7756335B2 (en) 2010-07-13
JP5071914B2 (ja) 2012-11-14

Similar Documents

Publication Publication Date Title
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
JP4787275B2 (ja) セグメント化ベースの認識
JP5522408B2 (ja) パターン認識装置
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
EP1564675A1 (en) Apparatus and method for searching for digital ink query
US9711117B2 (en) Method and apparatus for recognising music symbols
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
JP4817297B2 (ja) 文字検索装置
JP6146209B2 (ja) 情報処理装置、文字認識方法、及びプログラム
TWI303783B (en) Method and device for recognition of a handwritten pattern, and computer program product
JP2007213416A (ja) 手書き文字列検索装置、手書き文字列検索方法及びプログラム
Singh et al. Online handwritten Gurmukhi words recognition: An inclusive study
JPWO2014068770A1 (ja) データ抽出方法、データ抽出装置及びそのプログラム
KR20220132536A (ko) 필기에서의 수학 검출
JP6812804B2 (ja) 文字認識装置、文字認識プログラム及び文字認識方法
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
KR20160073146A (ko) 혼동행렬을 이용한 필기인식 단어 보정 방법 및 장치
JP2020013460A (ja) 情報処理装置、文字認識方法、および文字認識プログラム
JPH09106433A (ja) 文字認識処理装置
JP2002222389A (ja) 追加テンプレートの作成方法、追加テンプレートの作成をコンピュータにより実現させるプログラムおよびocr認識辞書作成装置