TWI303783B - Method and device for recognition of a handwritten pattern, and computer program product - Google Patents

Method and device for recognition of a handwritten pattern, and computer program product Download PDF

Info

Publication number
TWI303783B
TWI303783B TW094137814A TW94137814A TWI303783B TW I303783 B TWI303783 B TW I303783B TW 094137814 A TW094137814 A TW 094137814A TW 94137814 A TW94137814 A TW 94137814A TW I303783 B TWI303783 B TW I303783B
Authority
TW
Taiwan
Prior art keywords
core
point
points
sequence
handwritten
Prior art date
Application number
TW094137814A
Other languages
English (en)
Other versions
TW200630898A (en
Inventor
Anders Holtsberg
Jakob Sternby
Original Assignee
Zi Decuma Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zi Decuma Ab filed Critical Zi Decuma Ab
Publication of TW200630898A publication Critical patent/TW200630898A/zh
Application granted granted Critical
Publication of TWI303783B publication Critical patent/TWI303783B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/17Image acquisition using hand-held instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

1303783 九、發明說明: 【發明所屬之技術領成】 發明領域 本發明是關於辨識一手寫圖形的一種方法,該圖形包 5含一個或多個表示複數個符號的曲線。 L先前冬奸]j 發明背景 今曰’對於輸入資料到資料處理單元,手寫變成一種 > 日益流行的方法,尤其對於行動電話和個人數位助理 10 (personal digital assistant,PDA)。為 了處理輸入的資料, 手寫必須被辨識和翻譯(interpreted)。用於辨識手寫的大多 數現有方法要求字元(character)以逐一寫入的方式被輸入 且被個別辨識。該種方法的一範例在美國專利4,731,857中 被提供’但最著名的是Palm Inc·製造的Graffiti®。 15 為了加速輸入資料’允許連續手寫(cursive handwriting) > 的方式是被期望的。然而,辨識連續手寫比辨識個別字元 複雜的多。連續手寫辨識之複雜性的增長歸因於分段 (segment)連接在一起的字元,即在手寫圖形(handwriting pattern)内識別一個字元到另一個的轉換。連續手寫辨識中 20 的錯誤因此接近兩個階層(level),其使一種清楚的(iucid) 連續辨識系統的結構變得非常複雜。 辨識連續手寫的方法通常遇到一些問題:在鄰近字元 之間存在很多可能的分段(segmentati〇n),該等鄰近字元形 成一手寫圖形的可能分段的組合展開。 5 1303783 因此,現在大多數的商業系統使用複雜的統計系統 (statistical system),該等系統利用具有綜合字典的神經網路 (neural network)和隱藏式馬可夫模型(hidden markov model)。該種系統的範例在以下論文中被提出,P.Neskovic 5 和 L.Cooper 的 “Neural network-based context driven recognition of on-line cursive script59 5 Seventh International Workshop on Frontiers in Handwriting Recognition ,p.352-362,2000年9 月,以及M.Schenkel和 I.Guyon 的 “On-line cursive script recognition using time 10 delay networks and hidden markov models95 ^ Machine Vision flW ,vol· 8,p.215-223,1995。該等系統的一 主要阻礙(setback)是其等較大且要求大量的訓練校正。此 外,其等非常依賴於被使用的字典。 I:發明内容3 15 發明概要 本發明的一個目的是提供連續手寫辨識的改良方法。 本發明的另一目的是提供快速分段和辨識手寫圖形的一種 方法。本發明更進一步的目的是提供一種方法,該方法不 要求廣泛學習(extensive learning)也不需要強大的處理能力 20 (power) 〇 依據申請專利範圍的獨立項(independent claim),藉由 一方法、一裝置和一電腦程式產品,至少一些上述目的被 獲得。本發明的具體實施例在申請專利範圍的依附項 (dependent claim)被闡明。 1303783 因此,本發明提供辨識手寫圖形的一種方法,該手寫 圖形包含一個或多個表示複數個符號(symbol)的曲線。該方 法包含沿著手寫圖形之-個或多個曲線的點序列檢測手寫 圖形,以及在點序列中選擇核心點(core—·該等核心 5點被選擇用於分段該手寫圖形和辨識該手寫圖形的該等片 段(segments)以使之成為符號。該方法更進一步包含在每一 核心點上或在每-核心點鄰近處決定一個或多個曲線的特 徵’以及比較手寫圖形和範本(template),其中,每一範本 表示至少-個符號或-符號的一部分。該比較包含以下步 10驟:按步依次分析核心點,其中,該等核心點表示可能的 分段點,從-個第-可能分段點到一個第二可能分段點間 的核心點序列表不可能的符號,該分析藉由以下步驟被執 行,藉由比較核心點序列的特徵和該範本及計算一距離值 (distance value),該等核心點序列可以開始於第一核心點或 15 一先前(Previous)核心點序列的最後核心點,以及藉由指定 (assign) —累積的距離值給在匹配之核心點序列泗扣比以 sequence 〇f core p〇ints)中的最後核心點,該累積的距離值 是被指定給序列中第一核心點的一距離值和該被計算的距 離值之和。藉此,對於所有連續核心點,一最小累積距離 20值被指定給最後核心點,且對應於匹配的範本序列(a sequence of matched templates),該等匹配範本表示複數個 符號以作為手寫圖形的一可能辨識結果。 本發明還提供用於辨識一手寫圖形的設備,該手寫圖 形包含一個或多個表示複數個符號的曲線,該設備包含: 1303783 用於沿著該手寫圖形的一個或多個曲線的點序列 sequence of points)檢測該手寫圖形的裝置;用於在該點序 列中選擇核心點的裝置(其中,該等核心點被選擇以用於分 段該手寫圖形以及觸手寫圖形的料諸歧之成為符 5號);用於在每-核心點上或在每—核心點鄰近處決定一個 或多個曲線之特徵的裝置;用於比較該手寫圖形和範本的 裝置,每一範本表示至少一個符號或符號的一部分,用於 比較的该裝置被安排為:按步依次(stepwise)分析該等核心 點,其中,該等核心點表示可能的分段點且從一個第一 10可能分段點到-個第二可能分段點間的核心點序列表示可 能的符號,該分析藉由以下步驟被執行,藉由比較核心點 序列的特徵與該等範本及計算-距離值,該等核心點可以 開始於第-核心點或先前核心點序列的最後核心點,以及 藉由指定-累積距離值給匹配之核心點序列中的最後核心 15點,該累積距離值是被指定給序列中第—核心點的一距離 值和該被計算的距離值之和,藉此,對於所有連續的核心 點,—最小累積距離值被指定給最後核心點且對應於4 配範本序列,該範本序列表示複數個符號以作為手寫圖形 的一可能辨識結果。 20 本發明還提供—電腦程式產品,可直接裁人-資料處 理早凡的内部記憶體中,該產品包含用於執行上述所定義 之方法的軟體碼諸(SGft請e eGde _ons)。 由於本發明,表示多個符號的一手寫圖形可被快速辨 識。藉由使用用於分段和辨識的核心點,計算將同時分離 1303783 δ亥手寫圖形以及匹配遠圖形和範本。因此,比較手寫圖形 和範本的過程非常快。在所有核心點被分析後,累積距離 值被指定給最後核心點且與範本序列有關,該等範本序列 已經與手寫圖形匹配。因此,指定給最後核心點的資訊可 5 被容易用於獲得手寫圖形之可能的辨識結果。 本發明的一見解是一有限數目的核心點被使用,因為 僅需要選擇出在手寫圖形中識別分段點所需要的核心點。 因此,可瞭解到,為了辨識連續手寫,並不要求使用神經 網路或隱藏式馬可夫模型。而是,可能是分段點的核心點 10 被選擇,以及相同的核心點被用於辨識手寫圖形内的符號。 核心點的選擇放棄(discard)了被檢測之序列中的大量 點。因此,易管理的核心點數目被選擇,其減少了用於比 較核心點序列和範本所需要的計算工作。已瞭解到對於辨 識手寫圖形,被檢測之點序列中的很多資訊部分是多餘 15的。因此,放棄大量點幾乎不影響正確辨識手寫圖形的可 能性。同樣,由於有限數目的點被用於辨識,多個範本可 被用於辨識相同的符號。因此,範本可表示異形字 (allograph),即:以不同的外觀(appearance)或風格蚩寫相 同的符號。 20 有利地,在手寫符號中僅有構成可能分段點的核心點 被選擇。無疑其縮減將被分析的核心點數,因此該方法是 快速的。 此處所使用的措辭:“符號(symbol),,應該被解釋為具有 -具體意義的任何形式,如一字元(拉丁文、中文或其他任 1303783 何種類)、一在字元之間、之前或之後的連字(ligatuj^、一 數字或任何標點符號(punctuation mark)。更進_步,彳庄_ ‘‘手寫圖形(handwritten pattern)”應該被解釋為一個人堂寫 的一符號或符號序列的具體形式。 5 10 15 20 依據一實施例,藉由形成一具有節點和連接到節點的 弧線(arches)的圖表(graph),比較被執行,其中,备—^ 、 一節點 表示對應於手寫圖形中兩個符號之間的一可能分段點的一 核心點,每一弧線表示沿著核心點序列從一節點到另一笏 點的一路徑,該路徑對應於手寫圖形中的一可能符號,藉 由比較核心點序列的特徵和該範本,指定至少一個距離值 給每-路徑’以及透過圖表,決定具有最小?'積距離值且 從第-節關最後節點的至少祕徑,該路徑對應於匹配 範本序列(a sequence of matched templates),且匹配範本序 列表示手寫圖形的一可能辨識結果。 藉由形成一圖表,連續核心點的按步分析可被構成。 其意味著將被執行之計算的—良好控制被獲得,以及累積 距離的結果可被結構地儲存以連接節點和弧線。更進一 步,圖表可被有效使用,因為由於大量點在選擇核心點時 被放棄,圖表的大小容易被處理。 多個可能的辨識結果可被決定,在對應於圖表之路徑 下’且該科徑具有低於—臨界值的累積輯值。其意味 著手寫圖神範柄比較可返回衫作為手寫_之辨識 結果的候選者(candidate)。該等候選者可以以多種不同方式 被處理。對應於最小的累積距離值的最佳候選者可被呈現 10 1303783 (present)給一使用者。 被呈現。料,多㈣者被祕,魏候選者可 ^ 夭遠者可最初就被呈現。 精由順序地加入 “點為節點,圖表可被形成,且复 Ύ夺日疋至少一距雜姓y '、 卜如 值給每一路徑在圖表形成期間## 打。在圖表被形成04 # mi破執 要求的計算被執行。其意味著 一被形成,可能的細 +香圃表 』月匕的辨識結果就可從圖表被獲得。 指定牵少足巨 值包含指定每一路徑最短距離值,1 對應於最符合核心值其 序列之特徵的範本。其意味著依據被 使用的特徵,圖表她θ ^ 10 的資訊。 、、心疋保留(h〇ld)最符合核心點序列之範本 的首勃,。 破選擇的核心點數目由該-個或多個曲線的形狀限 制。其意味著曲線的形狀支配著被選擇的核心點數。因此, *曲線形狀p|單時,少量的核心點可被選擇,反之,對於 -複_曲線’大量核心點被選擇。 被k擇的核心點數被限於保留該一個或多個曲線方向 改卢交之貧訊的點。因此,僅有曲線是彎曲(bend)或轉向 (ίυ_)的點被用作是核心點。這使得即使在使用有限的核 沾數目下核%、點仍可用來描述該一個或多個曲線的形 狀。 20 核心點的選擇包含選擇該-個或多個曲線在一方向 (與手寫圖形的-主要書寫方向正交)上之局部極值點 extr置Ρ〇_。謗等被選擇的核心點經常對應於可能的分 段點。因此、亥選揮準則挑選一組核心點,該組核心點具 有保留分段點的主要部分的一充分可能性。更進一步,該 11 1303783 等局部極值點對於符號形狀是重要的且因此也適合用於辨 識。 依據本發明一實施例,藉由選擇每一對局部極值點之 間的一個到三個核心點,核心點組(藉由選擇局部極值點產 5 生的)被擴充(extend)。藉由使用其他準則,該等更進一步的 核心點被選擇。該種核心點組適合用於分段和辨識由拉丁 文字元組成的一手寫圖形。
核心點的選擇可包含選擇複數個滿足下面情形的點: 在該等點中一個或多個曲線之導數(derivative)的絕對值超 10過一臨界值。其意味著在該曲線或該等曲線作出一急轉向 處(sharp turn)核心點被選擇。其對辨識—符號提供有用資 訊’且更進一步挑選出可能的分段點。 15
20 核心點的選擇可包含選擇-滿足下面情形的H 在該核心財,-個或0曲線與—直線(位於兩個鄰近核 心點之間)間的偏移(deviation)超過一臨界值。立 /、意味著指 述該一個或多個曲線之曲率的一核心點祜、 ”瓜砥擇。因此曲 或多個曲線形狀上的資訊被保存,該資訊對於辨〆 " 的。以該方式被選擇的核心點也具有較大可铲 〆疋有用 核心點的選擇可包含上述選擇準則的任竹纟八、A 用更進一步能選擇出可能分段點的選擇準則。ϋ或可使 特徵的決定可包含決定核心點的 (coordinate),該y座標定義與主要書寫方向正交 的 y座標 -方向中 的位置。其主要對於大小不同的字元之辨 辦織疋有用的。 特徵的決定可包含決定出朝向核心點 _ .、、、的一曲線方向和 12 1303783 來自核心點的一曲線方向。其給出曲線形狀上的資訊且因 此在比較一手寫圖形和一範本時非常有用。 特徵的決疋可包含決定出與之前(preVi〇US)核心點的X 座標位移(displacement),該X座標定義與主要書寫方向平行 5的一方向中的位置。其意味著核心點彼此相關。因此,— 範本不需要為了與核心點序列正確匹配而被移位。
已發現決定出與具有X座標最高值的先前核心點間的又 座標位移尤其是適合的。 10 15 20 特徵的決定可包含決定-支筆在核心點中是提起_ up)或是壓下(press down)。該特徵經常暗示一分段點,但 也暗示-符號中兩筆劃⑽Qke)之間的—中斷。因 此’該特徵可被用於辨識符號,該等符號允許筆在核心畔 被提起或壓下。 人 不口軏本的一點之間的距離值 可被計算’且叫心關每—特徵和在範本之點間的距 =相重和被計算。因此,根據辨識特徵的重要性,決定 出的特徵可被給料同的權重。此外,所有特徵都影 (contribute to)該距離值。 手寫圖形可與範本比較,其中 符號的不同外顴。> 1 π 〇 數個軌本表不相同 _ π Γ 不相同符號的她範本提供可供辨識 的不同異形字⑽〇抑phs卜此外辨識 目的#m _ 馮乾本僅破有限數 ai,t 因此當具有易#理大小之範本的-資料庫 才可以儲存非常大量的範本。 、 手寫圓形的可能辨識結果可與-字典C)比 13 1303783 ^意味著藉由比較手寫圖形和範本所決定出的候選 。,可错由與一字典比較而被更進一步評估。因此,將被 呈現給使用者的候選者可以是’例如 離值的候選去h 5選奸目 疋—候選者,其是存在於字典中的複數候 B /、有最小累積距離值的候選者。然而,更進—步利 用子典的評估對於獲得可能辨識值不是必要的。因此,手 、=形和範本的比較在不使用字典的情況下可給出辨識 10 總是正確翻譯出手寫圖形並不是本發明的初步目的。 口此’當手寫圖形缺少―些資訊或包含錯誤資訊時,如當 手寫圖形中的—字70被遺漏(left⑽)時或當手寫圖形被拼 錯時,該方法並不獨立識別。不過,其提供—堅固⑽id) 的基礎以補充其他上下文以及串起⑽ing)匹配常式 —)’以致使不能僅藉由檢查手寫_本身而被正確 辨識的字也可被辨識。 此外’匹配之範本的特殊序列不被允許。其在補償手 寫圖形中資訊不正確的情況下可以是有用的。不過,藉由 拒絕不可能或不太可能的候選者,其還可被用於改良觸 結果。例如,兩個連字(Iig咖re)的序列不被允許。 20 #於符合範本的特殊序列,一權重可被給予該累積距 誠。其意味著包含不可能範本序列的辨識結果不完全被 錢,可能被舒-權重以使得該等辨識結果更難以具有 最小的累積距離值。 手寫圖形可以以連續書寫方式被書寫。該方法尤其適 14 1303783 用於在連續書寫中辨識手寫圖形。不過,當符號被個別書 寫時’本發明也可被用於辨識手寫圖形。尤其是本發明不 要求手寫圖形在一筆劃中被書寫。 圖式簡單說明 5 #由參考_中範例的方式,本發明被更進-步詳細 描述,其中: 第1圖是本發明一實施例的方法流程圖,該方法用於辨 識一手寫圖形; 第2圖是表示被選之核心點的一手寫圖形的範例,該等 10核心點被用於比較該手寫圖形和範本; 第3圖是用於比較一手寫圖形和範本的方法流程圖; 第4圖疋已被形成的一圖表,用於決定範本和手寫圖形 之間的距離值; 第5圖是本發明一實施例用於辨識一手寫圖形的裝置 15 的示意圖。 I:實施方式】 較佳實施例之詳細說明 參考第1圖,用於辨識一手寫圖形的方法現在將被描 述。首先,在步驟102中手寫圖形被檢測。通常,一使用者 20 以一尖筆(stylus)在一感壓螢幕上(pressure-sensitive screen) 書寫手寫圖形,因此藉由規則間隔(regular interval)取樣尖 筆的位置,手寫被檢測。因此,一時序(time-sequence)點被 獲得。手寫可以以多種其他方式被檢測,如藉由使用感測 器檢測,如在一支筆和一書寫表面之間形成的一電子連 15 1303783 接,或感測器檢測一支筆的移動。同樣,藉由掃描一紙張(手 寫圖形被書寫在其上),手寫圖形可被檢測。然後,該手寫 圖形可以以在一書寫表面上的點序列被檢測,其中,該序 列取決於點被放置在何處(相對於其他點),即點的空間序 5 列。 現在,在步驟104,當檢測手寫圖形時,在產生的點序 列之間的複數核心點被選擇。該等核心點被選擇以減少手 寫圖形的維度(dimensionality),即在圖形中一筆劃的取樣點 數。然而該等核心點必須被適當選擇,從而使手寫圖形可 10 被正確辨識。 第2圖顯示形成瑞典字“ek”的一手寫圖形10。在第2圖 中,被選擇的核心點12也被標示出且每一個其他核心點被 編號。從第2圖顯然可知該連寫字的第一部分有字母“d”的 外觀。問題是,如果辨識方法在“d”的末端點分割該字為兩 15 個字母片段,該等兩個字母片段都不包含想要的字的字 母。因此很清楚的是,當分段連續手寫時,辨識方法需要 考慮多於一種分段的可能性。因此,多個核心點12是被選 為可能的點,該些點是表示手寫圖形10中介於兩個字元間 的分段,因此,該等核心點12被選擇以識別手寫圖形10的 20 正確分段以使之成為個別符號或字元。不過,該等核心點 12也被用於辨識手寫圖形10的分段。 核心點12的選擇不應該丟棄(throw away)任何實際的 分段點。然而,定義手寫圖形10之潛在分段處的核心點12 數目應該以某種方式被選擇,以保持核心點12的數目盡可 16 1303783 旎下降。因此核心點12的選擇使用一些選擇準則。 本發明一較佳實施例中,以下選擇準則被使用。第一 選擇準則抽取出(extract)與一主要書寫方向正交之方向中 的極值點(extreme points)。以北(N)核心點和南(S)核心點分 5別代表該等點。在第2圖的手寫圖形1〇中,N和S核心點被圓 圈標記。每一對N-S點已被位於其等之間額外的一個到三個 點補充(complement)。後者的點(latter points)被兩個更進一 步的準則選擇’該等準則是一曲率(curvature)和一銳度 (sharpness)準則。我們稱呼額外的點為中間(middle)核心點 10 (M)。在第2圖的手寫圖形1〇中,μ核心點被星形(star)標記。 曲率準則決定手寫圖形10是否嚴重偏離兩個鄰近核心點之 間的一直線。然後,在最偏離直線的位置上一 Μ核心點被 選擇。銳度準則決定手寫圖形是否作出一急轉向(sharp turn)。然後,在該位置上一μ核心點被選擇。藉由在每一 15 被檢測點中計算手寫圖形10的導數(derivative),銳度準則 是否滿足的決定被作出。在一急轉向被產生,導數假設為 大的值。銳度和曲率準則可被用於在一對N_s核心點之間選 擇多個Μ核心點。 在步驟106,該方法更進一步包含在每一核心點上或在 2〇 母一核心點附近決定手寫圖形的特徵。可以想到的是直接 使用抽取出之核心點12的座標值來達到辨識目的。然而, 一核心點12的周圍也包含手寫圖形1〇之形狀的一些資訊。 為了包括該額外的形狀資訊,本發明之較佳實施例中,每 一核心點的一組五個特徵被決定。依據其如何被選擇,該 17 1303783 每一核心點12被給予一標記組中的一標記。此處三個標記 N、S和Μ被使用。核心點12的該標記形成用於比對(match) 核心點序列(sequences)和範本(templates)的基礎。此外,該 等特徵包含朝向和遠離(out from)核心點12的方向向量、核 • 5 心點12的y座標值(即正交於主要書寫方向之方向中的值), 和一個沿著X座標(平行主要書寫方向)並從該核心點12到最 靠近右邊(furthest to the right)的前一(previous)核心點的帶 符號(signed)距離dx。 在步驟108,手寫圖形10中由被選擇之核心點12決定出 10的特徵現在與範本比較,用於尋找辨識該手寫圖形1〇的一 候選者(candidate)或複數候選者。在一資料庫中範本被提供 且由連續核心點的特徵表示(represent)。因此,決定出的特 徵與範本之特徵直接比對。該資料庫可包含表示相同符號 之異形字(allographs)的多個範本,以在即使使用者具有不 15同風格的筆跡下辨識圖形。此外,該資料庫包含表示連字 • (ligature)(即通常結合兩個字元且不是實際字元之_部分的 筆劃)的範本。在連寫字中間的所有字元具有連字,而在一 個子開始的字元可能或可能沒有具有一個連字。連寫字也 可終止於一連字。一些範本可表示包括一連字的一字元。 20其有利於用於字元“e”、“r,,、“c,,、“x,,和“s,,的範本。 現在參考第3圖和第4圖,一手寫圖形丨〇之被選擇的核 心點12的特徵與範本的比較將被描述。該等核心點12被認 為是手寫圖形10的潛在分段點。此外,從一第一潛在分段 點到一第二潛在分段點的核心點序列12被認為是手寫圖形 18 1303783 中-潛在符號的表示。因此,該等核心點序列12的特徵與 範本相比較。 被選擇的核心點12表示與範本比較的相對大量的不同 核心點序列12。為構成該比較,該等核心點12被依次分析。 5開始於第一核心點12,任何可能的核心點序列12與範本比 車乂在步驟110’匹配(match)一範本的序列之末端核心點u 在一圖表中被儲存為一節點(n〇de)。在步驟112,一距離值 (給出核心點序列和範本間之比較的測量)被儲存在節點 中,代表第一核心點和該節點之間的一路徑(path)。當從第 10 一核心點的所有可能的核心點序列12已與範本比較,更進 一步的比較在核心點12的開始被作出,該等核心點在圖表 中被儲存為節點。現在,範本和更進一步的核心點序列之 間的距離值被加到第一距離值(被儲存在更進一步核心點 序列的開始節點中)。因此,一累積距離值(cumulative 15 distance value)被儲存在圖表中的節點上。因此,對於所有 的核心點12 —非循環(acyclic)圖表被形成,且圖表中的最後 核心點對於經過圖表的不同路徑保留累積距離值的資訊。 然後,在步驟114,藉由選擇圖表中且表示範本序列的一路 徑,手寫圖形10的可能辨識結果被返回。該被選擇的路徑 20可以是具有最小累積距離值的路徑,但也可以是代表存在 於一字典中的範本序列的另一路徑。 在第4圖中,表示第2圖之手寫圖形1〇和範本之比較結 果的一圖表20被顯示。該圖表包含以編號圓圈表示的節點 22和節點之間的弧線24。如圖所示,在圖表中存在多個表 19 1303783
厂、手寫圖形之不同分段的路徑。因此手寫圖形10和範本的 /車x同時定義出手寫圖形ίο的可能分段,以及產生在分段 ,、手寫圖形和範本序列之間相似(resemblance)的測量。 在手寫圖形的一核心點和範本的一核心點之間的距離 值疋這些點之特徵的差值取絕對值後的加權和。在核心點 序列和一範本之間的距離值是個別點之間距離值的和。然 而’形成圖表中節點的核心點之距離應該僅被計算一次。 口此’形成節點的核心點和範本之間的距離可被指定給 (aSSign)到該節點或來自該節點的一路徑,且反映了(reflect) 核心點和範本之間的一平均距離,該範本對應於到該節點 或來自該節點的路徑。 現在參考第5圖,用於辨識一手寫圖形的一設備30將被 描述。該設備30包含用於記錄一手寫圖形為點序列的一檢 測器32。該檢測器32可以以一感壓螢幕被實現,在該感壓 15 螢幕上一使用者可書寫。該設備30更進一步包含用於分析 被檢測之手寫圖形的一分析器34。該分析器34可以以執行 在電腦中央處理單元上的一程式被實現。該分析器34包含 用於選擇手寫圖形之核心點的裝置,和用於在核心點上或 鄰近該核心點決定手寫圖形之特徵的裝置。該設備30更進 20 —步包含一資料庫36,該資料庫36包含以核心點之特徵表 示的範本。該分析器34更進一步包含用於計算手寫圖形之 核心點序列的特徵和範本之間的距離值的裝置。該分析器 34被安排以形成在結構上比較手寫圖形和範本的一圖表, 以及產生手寫圖形的至少一個可能辨識結果。該可能辨識 20 1303783 結果可在一顯示器上被顯示,該顯示器可與感壓螢幕分開 或與感壓螢幕(在該感壓螢幕上手寫圖形被輸入)組合在一 起。 需要強調的是,此處描述的較佳實施例決不限制本發 5 明的範圍,且很多其他實施例可能仍在由附加的申請專利 範圍定義的保護範圍内。 【圖式簡單說明】 第1圖是本發明一實施例的方法流程圖,該方法用於辨 識一手寫圖形; 10 第2圖是表示被選之核心點的一手寫圖形的範例,該等 核心點被用於比較該手寫圖形和範本; 第3圖是用於比較一手寫圖形和範本的方法流程圖; 第4圖是已被形成的一圖表,用於決定範本和手寫圖形 之間的距離值; 15 第5圖是本發明一實施例用於辨識一手寫圖形的裝置 的示意圖。 【主要元件符號說明】 102〜108-步驟 24-弧線 110〜114-步驟 30-設備 10-手寫圖形 32-檢測器 12-核心點 34-分析器 20-圖表 36-貢料庫 22-節點 21

Claims (1)

1303783
15
20 卜7年?月)。日修正替換頁 十、申請專利範圍: 第94137814號申請案申請專利範圍修正本97 〇7 3〇 1· 一種用於辨識手寫圖形的方法,該手寫圖形包含表示複 數個符號的-個或多個曲線,該方法包含以下步驟: 沿著該手寫圖形的該_個或多個曲線的點檢 測該手寫圖形, 選擇在該點序列間的複數核心點,其中,該等校心 點被選擇以用於分段該手寫圖形以及辨識該手寫圖形 的該等片段以使之成為符號, …〇 7 在每一核心點或在每一核心點的鄰近處決定該一 個或多個曲線的特徵, 比較該手寫圖形和複數範本,每一範本代表至少一 符號或一符號的一部分,該比較步驟包含以下步驟: 按步依次分析該等核^點,其中,該等核心點 表示可能的分段點,且從一個第一可能分段點到一 個第二可能分段點間的核心點序列表示可能符 號,該分析藉由以下步驟被執行: 比較該等核心點序列之特徵和該等範本以及 計算一距離值,該等核心點序列可以開始於第一校 心點或一先前核心點序列的最後核心點,以及 指定一累積距離值給在匹配之核心點序列中的 最後核心點’邊累積距離值是被指定給序列中兮第 一核心點的一距離值和該被計算出之距離值的和, 藉此對於所有連續核心點,一最小的累積距離值被 指定給該最後核心點且對應於一匹配之範本序列,該範 22 25 1303783 本序列表示複數個符號且是該手寫圖形的可能辨識結 果。 2. 如申請專利範圍第1項所述之方法,其中,藉由以下步 驟該比較步驟被執行·· 5 形成具有複數節點和具有連接該等節點之弧線的 一圖表,其中,每一節點表示一核心點,該核心點對應 於在該手寫圖形中兩個符號之間的一可能分段點,且每 一弧線表示沿著核心點序列從一節點到另一節點的一 路徑,該路徑對應於該手寫圖形中的一可能符號, 10 藉由比較該等核心點序列之特徵和該等範本,指定 至少一個距離值給每一路徑,以及 透過該圖表決定至少一具有最小累積距離值的路 徑,且該路徑是從第一節點到最後節點,該路徑對應於 匹配之範本序列,該等序列表示複數個符號且是該手寫 15 圖形的一可能辨識結果。 3. 如申請專利範圍第2項所述之方法,其中,根據圖表的 該等路徑,多個可能辨識結果被決定,該等路徑具有低 於一臨界值的累積距離值。 4. 如申請專利範圍第2項所述之方法,其中,藉由順序增 20 加核心點作為節點,該圖表被形成,且其中,該指定至 少一個距離值給每一路徑在該圖表形成期間被執行。 5. 如申請專利範圍第2項所述之方法,其中,該指定至少 一個距離值包含指定每一路徑對應到該範本的最短距 離值,且該範本是最符合該核心點序列的特徵。 23 1303783 6·如申請專利範圍第i項所述之方法,其中,被選擇的_ 些核心點是被該-個或多個曲線的形狀限制。 7·如中料利範圍第6項所述之方法,其中,該等被選擇 的核心點疋被限制為保有該一個或多個曲線方向 之資訊的點。 匕如申請專利範圍第i項所述之方法,其中,轉兮等核 心點的步驟包含在-與該手寫圖形的主要書寫方向^ 交的方向下,選擇複數位於該—個或多個㈣之局部極 值的點。 10 15 20 9. 如申請專利範圍第i項所述之方法,其中,選擇該等核 心點的步驟包含選擇複數點,且在該等點中該—個❹ 個曲線之導數的絕對值超過一臨界值。 10. 如申請專利範圍第!項所述之方法,其中,選神等核 心點的步驟包含選擇—個核心點,且在該核心點中,」 個或多個曲線與一位於兩個鄰近核心點間的直線之間 的偏移超過一臨界值。 如申請專利範圍第i項所述之方法,其中,決定該特徵 的步驟包含歧_<_痛標,該⑽私義在與— 主要書寫方向正交的_方向上的_位置。 12.如申凊專利範圍第!項所述之方法,其中,決定該特徵 的步驟包含決定該曲線朝向該核心點的方向和該曲線 來自該核心點的方向。 7 13·如申請專利範圍第!項所述之方法,其中,決定該特徵 包3决疋與-切核^點的χ座標位移,該X座標 24 !303783 頁 14:申義與-主要書寫方向平行的.二方向上的位置。 .如申請專利範㈣項所述之方法,其中 的步驟包含決定-支筆在該心點是提起或是下壓。 睛專利範圍第!項所述之方法,其中,在該手寫圖 μ ▲的核。點和—範本的—點之間的距離值被計 該距離值是以該核心、點的每-特徵和該範本的點之 間的一距離權重和被計算的。 16·^請專利範圍第1項所述之方法,其中,該手寫圖形 10 "#本比|乂其中’複數個範本表示相同符號的不同外 觀。 17.如申請專利範_項所述之方法,其中,該手寫圖形 的可能辨識結果與一字典比較。 18=申請專利範圍W項所述之方法,其中,特殊的匹配 範本序列不被允許。 15 α如Μ專利範圍第i項所述之方法,其中,對於特殊的 • 匹配範本序列,該累積距離值被給予一權重。 20·如申請專利範圍第1項所述之方法,其中,該手寫圖形 以連續書寫方式被書寫。 21.-種用於_手寫圖形的設備,該手寫_包含表示複 20 數個符號的一個或多個曲線,該設備包含·· 用於沿著該手寫圖形的該一個或多個曲線的點序 列檢測該手寫圖形的裝置, 用於在該點序列中選擇核心點的裝置,其中,該等 核心點被選擇用於分段該手寫圖形以及辨識該手寫圖 25 1303783 形的該等片段以使其成為符號, 用於在每一核心點上或鄰近每一核心點處決定該 一個或多個曲線之特徵的裝置, 用於比較該手寫圖形和複數範本的裝置,每一範本 表示至少一符號或一符號的一部分,用於比較的該裝置 被安排以用於··
10
20 按步依次分析該等核心點,其中,該等核心點 表示可能的分段點,且從一個第一可能分段點到一 個第二可能分段點間的核心點序列表示可能的符 號,藉由以下步驟該分析被執行: 比較該等核心點序列的特徵和該等範本且計 算一距離值,該等核心點序列可以開始於該第一核 心點或一先前核心點序列的最後核心點,以及 指定一累積距離值給在匹配之核心點序列中 的最後核心點,該累積距離值是被指定給該序列中 第一核心點的距離值和該被計算出之距離值的和, 藉此所有連續核心點的一最小累積距離值被指定 給該最後核心點,且對應於一匹配範本序列,該匹配範 本序列表示複數個符號且是該手寫圖形的可能辨識結 果。 22. —種電腦程式產品,可直接載入到一資料處理單元的内 部記憶體,包含用於執行申請專利範圍第1-20項中任一 項所述之方法的軟體碼片段。 26 1303783 七、指定代表圖: -(一)本案指定代表圖為:第(1 )圖。 (二)本代表圖之元件符號簡單說明: 102〜108-步驟 八、本案若有化學式時,請揭示最能顯示發明特徵的化學式:
TW094137814A 2004-11-12 2005-10-28 Method and device for recognition of a handwritten pattern, and computer program product TWI303783B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0402773A SE528063C2 (sv) 2004-11-12 2004-11-12 Metod och anordning för segmenteringsbaserad igenkänning

Publications (2)

Publication Number Publication Date
TW200630898A TW200630898A (en) 2006-09-01
TWI303783B true TWI303783B (en) 2008-12-01

Family

ID=33488236

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094137814A TWI303783B (en) 2004-11-12 2005-10-28 Method and device for recognition of a handwritten pattern, and computer program product

Country Status (10)

Country Link
US (1) US7580573B2 (zh)
EP (1) EP1815395B1 (zh)
JP (1) JP4958236B2 (zh)
KR (1) KR20070090188A (zh)
CN (1) CN100541522C (zh)
AT (1) ATE501486T1 (zh)
DE (1) DE602005026844D1 (zh)
SE (1) SE528063C2 (zh)
TW (1) TWI303783B (zh)
WO (1) WO2006052180A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI426424B (zh) * 2009-06-02 2014-02-11 Pnf Co Ltd 具有觸控螢幕之手寫輸入裝置及其方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006091156A1 (en) * 2005-02-28 2006-08-31 Zi Decuma Ab Recognition graph
US20070263932A1 (en) * 2006-05-12 2007-11-15 Waterloo Maple Inc. System and method of gesture feature recognition
US20110248910A1 (en) * 2010-04-13 2011-10-13 Thien Van Pham Method for comparing two continuous computer generated lines generated by the movements of a computer mouse or a digitizer tablet
KR101176409B1 (ko) 2010-05-25 2012-08-28 장경호 사용자 영문 필기체 필적 구현 시스템
CN102810058B (zh) * 2011-05-31 2016-02-03 鸿富锦精密工业(深圳)有限公司 量测编程坐标系刷新系统及方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01316890A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd オンライン手書文字認識方式
JP2781898B2 (ja) * 1991-07-30 1998-07-30 株式会社セブンファースト 画像彫刻方法
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
US5812697A (en) * 1994-06-10 1998-09-22 Nippon Steel Corporation Method and apparatus for recognizing hand-written characters using a weighting dictionary
IL110137A (en) * 1994-06-27 2000-06-29 Advanced Recognition Tech Handwriting recognition system
JP2845149B2 (ja) * 1994-12-28 1999-01-13 日本電気株式会社 手書文字入力装置および手書文字入力方法
US5757959A (en) * 1995-04-05 1998-05-26 Panasonic Technologies, Inc. System and method for handwriting matching using edit distance computation in a systolic array processor
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
WO2002037933A2 (en) * 2000-11-08 2002-05-16 New York University System, process and software arrangement for recognizing handwritten characters
EP1709587B1 (de) 2004-01-30 2007-11-07 Baumer Optronic GmbH Bildverarbeitungssystem

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI426424B (zh) * 2009-06-02 2014-02-11 Pnf Co Ltd 具有觸控螢幕之手寫輸入裝置及其方法

Also Published As

Publication number Publication date
KR20070090188A (ko) 2007-09-05
US20060110041A1 (en) 2006-05-25
SE528063C2 (sv) 2006-08-22
JP4958236B2 (ja) 2012-06-20
WO2006052180A1 (en) 2006-05-18
ATE501486T1 (de) 2011-03-15
EP1815395A1 (en) 2007-08-08
CN100541522C (zh) 2009-09-16
JP2008520035A (ja) 2008-06-12
EP1815395B1 (en) 2011-03-09
DE602005026844D1 (de) 2011-04-21
US7580573B2 (en) 2009-08-25
CN101057250A (zh) 2007-10-17
TW200630898A (en) 2006-09-01
SE0402773L (sv) 2006-05-13
SE0402773D0 (sv) 2004-11-12

Similar Documents

Publication Publication Date Title
JP4787275B2 (ja) セグメント化ベースの認識
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
US5333209A (en) Method of recognizing handwritten symbols
JP5897725B2 (ja) ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体
US7369702B2 (en) Template-based cursive handwriting recognition
TWI303783B (en) Method and device for recognition of a handwritten pattern, and computer program product
WO2008012824A1 (en) Online arabic handwriting recognition
SE519014C2 (sv) Metod och anordning för igenkänning av ett handskrivet mönster
JP7450868B2 (ja) タッチベースユーザインターフェース入力におけるジェスチャーストローク認識
JP2019508770A (ja) デジタルインクを美しくするためのシステム及び方法
JPH08161429A (ja) 文字を認識するための方法および装置
JP5344338B2 (ja) プログラム、情報記憶媒体及び文字列認識装置
Tolentino et al. Recognition of air-drawn alphanumeric characters by applying slope orientation sequence matching algorithm using leap motion controller
K Jabde et al. A Comprehensive Literature Review on Air-written Online Handwritten Recognition
JP7095450B2 (ja) 情報処理装置、文字認識方法、および文字認識プログラム
Lee et al. On-line cursive script recognition using an island-driven search technique
EP4086744A1 (en) Gesture stroke recognition in touch-based user interface input
JPH0719278B2 (ja) 手書き文字認識方法
JPH05174192A (ja) 文字認識装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees