JP2008520035A - 手書きパターンを認識するための方法及び装置 - Google Patents

手書きパターンを認識するための方法及び装置 Download PDF

Info

Publication number
JP2008520035A
JP2008520035A JP2007541134A JP2007541134A JP2008520035A JP 2008520035 A JP2008520035 A JP 2008520035A JP 2007541134 A JP2007541134 A JP 2007541134A JP 2007541134 A JP2007541134 A JP 2007541134A JP 2008520035 A JP2008520035 A JP 2008520035A
Authority
JP
Japan
Prior art keywords
core
points
handwritten pattern
point
core point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007541134A
Other languages
English (en)
Other versions
JP4958236B2 (ja
Inventor
スターンビイ、ヤコブ
ホルツベルグ、アンデルス
Original Assignee
ザイ デクマ アクチボラゲット
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザイ デクマ アクチボラゲット filed Critical ザイ デクマ アクチボラゲット
Publication of JP2008520035A publication Critical patent/JP2008520035A/ja
Application granted granted Critical
Publication of JP4958236B2 publication Critical patent/JP4958236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/17Image acquisition using hand-held instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

手書きパターンを認識するための方法は、手書きパターンの検出された点の列の中で中核点を選択することを含む。中核点は、手書きパターンを区切り、認識する際に使用するために選択される。本方法は、各中核点の特徴を決定すること、及び、手書きパターンをテンプレートと比較することをさらに含む。比較することは、最初の中核点、又は前の列の最後の中核点で開始する中核点の列の特徴を前記テンプレートと突き合わせ、距離値を計算すること、及び、中核点の合致した列内の最後の中核点に累積距離値を割り当てることによって、中核点を順次、1段ずつ解析することを含み、それによって、最小の累積距離値が、最後の中核点に割り当てられ、手書きパターンの考えられ得る認識結果を表す、合致したテンプレートの列に対応する。

Description

本発明は、複数の記号を表す1つ又は複数の曲線を含む手書きパターンを認識するための方法に関する。
今日、手書きは、データをデータ処理用ユニットに、特に携帯電話や携帯情報端末(PDA)に入力するための、ますます一般向きの方法になりつつある。入力されたデータを処理するために、その手書きを認識し解釈しなければならない。手書きを認識するための、大多数の既存の方法は、入力しようとする文字が1つずつ書かれ、別々に認識されることを必要とする。そのような方法の一例が米国特許第4731857号で提供されているが、最も有名なものは、Palm,Inc.によって製造されたGraffiti(登録商標)である。
データの入力を速めるために、筆記体手書きが可能になることが望ましい。しかし、筆記体手書きの認識は、それぞれ独立した文字の認識よりはるかに複雑である。筆記体手書き認識について複雑さが増大するのは、連結された文字を区切る、すなわち、手書きパターン内で、ある文字から別の文字への移行を識別するという問題に負うものである。したがって、筆記体手書き認識における誤りは、明晰な逐次認識システムの構築を非常に複雑にする2つのレベルで起こる。
筆記体手書きを認識するための方法には、一般に、隣接する文字間で、多数の考えられ得る区切りがあり、手書きパターンの考えられ得る区切りの組合せが爆発的に増大する問題がある。
したがって、今日、大抵の市販のシステムは、ニューラル・ネットワーク及び隠れマルコフ・モデルを、一体化された辞書と共に使用して、複雑な統計システムを使用する。そのようなシステムの例は、P.Neskovic及びL.Cooper「Neural network−based context driven recognition of on−line cursive script」Seventh International Workshop on Frontiers in Handwriting Recognition Proceedings、352〜362頁、2000年9月、並びにM.Schenkel及びI.Guyon「On−line cursive script recognition using time delay networks and hidden markov models」Machine Vision and Applications、vol.8、215〜223頁、1995年に提示されている。これらのシステムの主な欠点(setback)は、大規模であり、大規模な訓練セットを必要とすることである。さらに、使用される辞書に非常に依存する。
本発明の一目的は、筆記体手書き認識のための改善された方法を提供することである。本発明の他の目的は、手書きパターンを迅速に区切り認識する方法を提供することである。本発明の他の目的は、大量の学習を必要としない、また大きな処理パワーを必要としない方法を提供することである。
上記の目的のうち少なくともいくつかは、独立請求項による方法、装置、コンピュータプログラム製品によって達成される。本発明の特定の実施例は、従属請求項で述べられる。
本発明は、複数の記号を表す1つ又は複数の曲線を含む手書きパターンを認識するための方法を提供する。本方法は、手書きパターンの1つ又は複数の曲線に沿った点の列として手書きパターンを検出すること、及び、点の列の中で中核点を選択することを含む。中核点は、手書きパターンを区切り、手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択される。本方法は、各中核点部で、又はその付近で1つ又は複数の曲線の特徴を決定すること、及び、手書きパターンをテンプレートと比較することをさらに含み、各テンプレートが、少なくとも1つの記号、又は記号の一部を表す。比較することは、中核点を順次、1段ずつ解析することを含み、中核点が、考えられ得る区切り点を表し、第1の考えられ得る区切り点から第2の考えられ得る区切り点までの中核点の列が、考えられ得る記号を表し、前記解析することが、最初の中核点、又は中核点の前の列の最後の中核点で開始する中核点の列の特徴を前記テンプレートに突き合わせ、距離値を計算すること、及び、中核点の合致した列内の最後の中核点に、その列内の最初の中核点に割り当てられた距離値と計算された距離値との和である累積距離値を割り当てることによって実施される。それによって、すべての順次中核点についての最小の累積距離値が、最後の中核点に割り当てられ、複数の記号を手書きパターンの考えられ得る認識結果として表す、合致したテンプレートの列に対応する。
本発明はまた、複数の記号を表す1つ又は複数の曲線を含む手書きパターンを認識するための装置において、手書きパターンの1つ又は複数の曲線に沿った点の列として手書きパターンを検出するための手段と、点のその列の中で中核点を選択するための手段であって、前記中核点が、手書きパターンを区切り、手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択される、手段と、各中核点部で、又はその付近で1つ又は複数の曲線の特徴を決定するための手段と、手書きパターンをテンプレートと比較するための手段であって、各テンプレートが少なくとも1つの記号、又は記号の一部を表す、手段とを備える装置であって、前記比較するための手段が、中核点を順次、1段ずつ解析するように構成され、中核点が、考えられ得る区切り点を表し、第1の考えられ得る区切り点から第2の考えられ得る区切り点までの中核点の列が、考えられ得る記号を表し、前記解析することが、最初の中核点、又は中核点の前の列の最後の中核点で開始する中核点の列の特徴を前記テンプレートに突き合わせ、距離値を計算すること、及び、中核点の合致した列内の最後の中核点に、その列内の最初の中核点に割り当てられた距離値と計算された距離値との和である累積距離値を割り当てることによって実施され、それによって、すべての順次中核点についての最小の累積距離値が、最後の中核点に割り当てられ、複数の記号を手書きパターンの考えられ得る認識結果として表す、合致したテンプレートの列に対応する、装置を提供する。
本発明はまた、データ処理ユニットの内部メモリ内に直接ロード可能なコンピュータプログラム製品であって、上記で定義した方法を実施するためのソフトウェアコード部分を備えるコンピュータプログラム製品を提供する。
本発明によれば、いくつかの記号を表す手書きパターンが迅速に認識される可能性がある。区切りと認識の両方のために中核点を使用することにより、計算では、手書きパターンが分離され、同時にそのパターンがテンプレートと突き合わされる。それによって、手書きパターンをテンプレートと比較するプロセスが非常に迅速になる。中核点すべてが解析された後で、累積距離値が、最後の中核点に割り当てられ、手書きパターンと合致したテンプレートの列に関連付けられることになる。したがって、最後の中核点に割り当てられた情報は、手書きパターンの考えられ得る認識結果を得るために、容易に使用することができる。
限られた数の中核点を使用可能であることが本発明の洞察である。というのは、手書きパターン内で区切り点を識別するために必要とされる中核点を選択することが必要とされるにすぎないからである。したがって、筆記体手書きを認識するためにニューラル・ネットワーク又は隠れマルコフ・モデルを使用することが必要とされないことが理解(realized)されている。その代わりに、考えられ得る区切り点である中核点が選択され、同じ中核点が、手書きパターン内で記号を認識するために使用される。
中核点を選択することにより、多数の点が、検出された列から廃棄される。したがって、管理可能な数の中核点が選択され、それにより、中核点の列をテンプレートと比較するために必要とされる計算量が抑えられる。点の検出された列内の大部分の情報は、手書きパターンを認識するのに余分であることが理解されている。したがって、多数の点を廃棄しても、手書きパターンを正しく認識する可能性はほとんど影響を受けないことになる。また、認識の際に限られた数の点が使用されるため、いくつかのテンプレートを、同じ記号を認識するために使用することができる。したがって、テンプレートは、異書体、すなわち同じ記号を書き表す、異なる外観又はスタイルを表す可能性がある。
有利には、手書き記号内の考えられ得る区切り点を構成する中核点だけが選択される。これは、解析される中核点の数を確実に抑え、それによって本方法は高速である。
本明細書では、「記号」という用語は、ラテン文字、漢字、又は任意の他の種類の文字など、特定の意味を有する任意の形態、文字間、文字の前、又は文字の後の連結線、数、或いは任意の句読点と解釈すべきである。さらに、「手書きパターン」という用語は、人によって書かれたある記号、又は記号の列の特定の形態と解釈すべきである。
一実施例によれば、比較することは、ノードと、ノードを接続する弓形とを有するグラフを形成することによって実施され、各ノードは、手書きパターン内の2つの記号間の考えられ得る区切り点に対応する中核点を表し、各弓形は、中核点の列に沿って、あるノードから別のノードまでの経路を表し、前記経路は、手書きパターン内の考えられ得る記号に対応し、さらに、中核点の列の特徴を前記テンプレートと突き合わせることによって少なくとも1つの距離値を各経路に割り当てること、及び、少なくとも、最小の累積距離値を有する最初のノードから最後のノードまでの、グラフを通る経路を決定することによって実施され、前記経路が、手書きパターンの考えられ得る認識結果を表す合致したテンプレートの列に対応する。
グラフを形成することにより、中核点を順次、1段ずつ解析することを構造化することができる。これは、実施しようとする計算が良好に制御され、累積距離の結果をノード及び弓形に関連して構造的に記憶させることができることを意味する。さらに、このグラフは効果的に使用される可能性がある。というのは、中核点を選択する際に多数の点が廃棄されるので、そのサイズのグラフは容易に処理されるからである。
いくつかの考えられ得る認識結果が、閾値未満の累積距離値を有する、グラフを通る経路に対応して決定される可能性がある。これは、手書きパターンをテンプレートと比較したことにより、いくつかの候補が手書きパターンの認識結果として返される可能性があることを意味する。これらの候補は、いくつかの異なるやり方で処理され得る。最小の累積距離値に対応する最良の候補が、ユーザに提示される可能性がある。この候補が拒絶された場合、他の候補が提示される可能性がある。別法として、いくつかの候補が最初に提示される可能性がある。
グラフは、中核点をノードとして順次追加することによって形成することができ、前記少なくとも1つの距離値を各経路に割り当てることは、グラフの形成中に実施される。必要とされる計算は、グラフが形成されるとき実施される。これは、グラフが形成されたとき直ちに、考えられ得る認識結果がグラフから得られる可能性があることを意味する。
少なくとも1つの距離値を割り当てることは、中核点のその列の特徴に最も良く合致するテンプレートに対応する最も小さい距離値を各経路に割り当てることを含む。これは、グラフが、使用されている特徴に従って中核点のその列に最も良く合致するテンプレートの情報を常に保持することを意味する。
選択される中核点の数は、前記1つ又は複数の曲線の形状によって制限される可能性がある。これは、曲線の形状により、選択される中核点の数が決まることを意味する。このようにして、曲線の形状が単純である所で、より少ない数の中核点が選択され、複雑な形状の場合、より多くの数の中核点が選択される可能性がある。
選択される中核点の数は、前記1つ又は複数の曲線の方向変化の情報を保持する点に制限される可能性がある。したがって、曲線が曲げられている、又は向きを変えられている点だけが中核点として使用される。これにより、たとえ限られた数の中核点が使用されていても、中核点で1つ又は複数の曲線の形状を説明することが可能になる。
中核点を選択することは、手書きパターンの主筆記方向に対して直交する方向で前記1つ又は複数の曲線の局所的な末端点である点を選択することを含むことができる。これらの選択された中核点は、しばしば考えられ得る区切り点に対応する可能性がある。したがって、この選択基準により、区切り点の主要部分を保持する可能性が高い中核点の1セットが拾い出される。さらに、これらの局所的な末端点は、記号の形状にとって有意であり、したがって、認識の際に使用するのに適したものでもある。
本発明の一実施例によれば、局所的な末端点を選択することによって作成された中核点のそのセットが、局所的な末端点の各対間で1つから3つの中核点を選択することによって拡張される。これらのさらなる中核点は、他の基準を使用することによって選択される。中核点のそのような1セットは、ラテン文字からなる手書きパターンを区切り、認識する際に使用するのに適したものである。
中核点を選択することは、1つ又は複数の曲線の微分の絶対値が閾値を超える点を選択することを含むことができる。これは、その1つ又は複数の曲線が急に向きを変える所で、中核点が選択されることを意味する。これにより、記号を認識するための有用な情報が得られ、考えられ得る区切り点がさらに拾い出される。
中核点を選択することは、2つの隣接する中核点間の直線から1つ又は複数の曲線が逸脱する偏差が閾値を超える所で中核点を選択することを含むことができる。これは、1つ又は複数の曲線の曲率を説明する中核点が選択されることを意味する。したがって、その1つ又は複数の曲線の形状に関する情報が保存され、これは認識するために有用である。このようにして選択された中核点はまた、区切り点である可能性も高い。
中核点を選択することは、上記の選択基準の任意の組合せを含むことも、考えられ得る区切り点を選択することになる他の選択基準を使用することもできる。
特徴を決定することは、中核点のy座標を決定することを含むことができ、前記y座標は、主筆記方向に対して直交する方向で、ある位置を定義する。これは、主にサイズが異なる文字間で区別する際に有用である。
特徴を決定することは、中核点に向かう曲線の方向、及び中核点からの曲線の方向を決定することを含むことができる。これにより、曲線の形状に関する情報が得られ、したがって、これは手書きパターンをテンプレートと比較する際に非常に有用である。
特徴を決定することは、前の中核点からのx座標変位を決定することを含むことができ、前記x座標は、主筆記方向と平行な方向で、ある位置を定義する。これは、中核点が互いに関連することを意味する。それによって、テンプレートは、一連の中核点と正しく突き合わせるために変位させることを必要としない。
x座標の最高値を有する、前の中核点からのx座標変位を決定することが特に好適であることが判明している。
特徴を決定することは、中核点内でペンが持ち上げられているか、それとも押し下げられているか判定することを含むことができる。この特徴は、しばしば区切り点を示すが、記号内の2ストローク間の中断をも示す可能性がある。したがって、この特徴は、中核点内でペンが持ち上げられる、又は押し下げられることを許す記号を認識するために使用される可能性がある。
手書きパターン内の中核点とテンプレートの点との間の距離値は、中核点の各特徴とテンプレートの点との間の距離の加重和として計算される可能性がある。したがって、決定される特徴は、認識するためのそれらの重要性に従って、異なる重みを与えられる可能性がある。さらに、すべての特徴が、距離値に貢献する。
手書きパターンは、テンプレートと比較することができ、複数のテンプレートが、同じ記号の異なる外観を表す。同じ記号を表すその複数のテンプレートは、認識するために異なる異書体が可能であることを規定する。さらに、テンプレートは限られた数の特徴によって表されるだけであるため、管理可能なサイズのテンプレートのデータベースを有しながら、非常に大量のテンプレートを記憶することが可能である。
手書きパターンの考えられ得る認識結果は、辞書と比較することができる。これは、手書きパターンをテンプレートと比較することによって決定された候補が、辞書と比較されることによってさらに評価され得ることを意味する。それによって、ユーザに提示される候補は、たとえば、最小の累積距離値を有する候補、又は辞書内に存在する候補の中で最小の累積距離値を有する候補となる可能性がある。しかし、辞書を使用するこのさらなる評価は、考えられ得る認識結果を得るために必要なものではない。したがって、手書きパターンをテンプレートと比較することにより、辞書を使用することなしに認識結果が得られることになる。
手書きパターンによって意図されているものを常に正しく解釈することが本発明の予備目的(preliminary aim)ではない。したがって、本方法は、手書きパターンに何らかの情報が欠けている、又は誤った情報を含んでいるとき、たとえば、手書きパターン内である文字が脱落しているとき、又は手書きパターンが誤って綴られているとき、独立に識別するものではない。しかし、手書きパターンそれ自体を調べることだけで正しく認識することが可能でない単語もまた認識することができるように、ルーチンに合致する他の文脈及び文字列で埋め合わせるための確かな根拠(solid base)を提供する。
さらに、合致したテンプレートの特定の列を許可しないことができる。これは、手書きパターン内の情報が正しくない状況を補償する際に有用となる可能性がある。しかし、不可能な、又は可能性が低い候補を拒絶することによって認識結果を改善するために使用されてもよい。たとえば、一連の2つの連結線は、許可されない可能性がある。
合致したテンプレートの特定の列について、累積距離値に重みを与えることができる。これは、テンプレートの、可能性が低い列を含む認識結果が、完全に拒絶されず、これらの認識結果が最小の累積距離値を有することをより困難にするために重みが与えられる可能性があることを意味する。
手書きパターンは、筆記体筆記で書かれる可能性がある。本方法は、筆記体筆記における手書きパターンを認識するのに特に適している。しかし、本方法は、記号がそれぞれ独立して書かれる所で、手書きパターンを認識するためにも使用される可能性がある。特に、本方法は、手書きパターンが1ストロークで書かれることを必要としない。
次に、本発明について、添付の図面を参照して、例示としてさらに詳しく述べる。
次に、図1を参照して、手書きパターンを認識するための方法について述べる。最初に、手書きパターンが検出される(ステップ102)。典型的には、ユーザは、スタイラスを用いて、圧力検知画面上で手書きパターンを書くことができ、それによって、手書きは、スタイラスの位置を規則的な間隔でサンプリングすることによって検出される。このようにして、時系列(time−sequence)の点が得られる。手書きは、たとえばペンと、ペンの移動を検出する筆記表面又はセンサとの間で形成される電気的な接続を検出するセンサを使用することによってなど、いくつかの他のやり方で検出することができる。また、手書きパターンは、手書きパターンが書かれている紙を走査することによって検出することができる。次いで、手書きは、筆記表面上の一連の点として検出することができ、その列は、点が互いに関連してどこに配置されるか、すなわち点の空間系列(spatial sequence)に基づくものである。
次に、手書きパターンを検出したとき作成された点の列の中で中核点が選択される(ステップ104)。中核点は、手書きパターンの次元の数(dimensionality)、すなわちパターン内のあるストロークの、サンプリングされた点の数を削減するために選択される。しかし、中核点は、手書きパターンが正しく認識され得るように選択すべきである。
図2は、スウェーデン語の単語「ek」を形成する手書きパターン10を示す。図2では、選択された中核点12もまた示されており、中核点が1つ置きに採番されている。図2から、この筆記体の単語の第1の部分が文字「d」の外観を有する可能性があることは明らかである。問題は、認識方法によって、その「d」の終点部で単語が2つの文字セグメントに区切られた場合、これらのどちらも、意図されていた単語の文字を含まないことになることである。したがって、認識方法は、筆記体手書きを区切るとき、2つ以上の区切りの可能性を考慮することを必要とする。したがって、2つの文字間で手書きパターン10における区切りを示す、考えられ得る点として、いくつかの中核点12が選択される。したがって、中核点12は、手書きパターン10をそれぞれ独立した記号又は文字にする正しい区切りを識別するために選択される。しかし、中核点12は、手書きパターン10のセグメントを認識するためにも使用される。
中核点12の選択は、どんな実際の区切り点も無駄にすべきではない。しかし、手書きパターン10の潜在的な区切りを画定する中核点12の数は、可能な限り中核点12の数を抑えるようなやり方で選択すべきである。したがって、中核点12の選択では、いくつかの選択基準が使用される。
本好ましい実施例によれば、以下の選択基準が使用される。第1の選択基準は、主筆記方向に対して直交する方向で末端点を抽出する。本発明者らは、これらの点を、それぞれ北(N)中核点及び南(S)中核点によって示す。図2における手書きパターン10では、N中核点及びS中核点は、円によってマークされている。N−S点の各対は、間にある追加の1つから3つの点によって補足されている。これらの文字点は、2つのさらなる基準、すなわち曲率及び鋭さによって選択されている。本発明者らは、この追加の点を中間(M)中核点と呼ぶ。図2における手書きパターン10では、M中核点は、星によってマークされている。曲率基準は、手書きパターン10が、2つの隣接する中核点間の直線から著しく逸脱するかどうか判定する。次いで、直線から最も逸脱する位置で、M中核点が選択される。鋭さの基準は、手書きパターンが急に向きを変えるかどうか判定する。次いで、この点でM中核点が選択される。鋭さの基準が満たされるかどうかが、検出された各点内で手書きパターン10の微分を計算することによって判断される。急に向きが変わる所で、微分が大きな値をとる。鋭さの基準及び曲率基準は、1対のN−S中核点間でいくつかのM中核点を選択するために使用される可能性がある。
本方法は、各中核点部で、又はその付近で手書きパターンの特徴を決定することをさらに含む(ステップ106)。抽出された中核点12の座標値を、認識目的のために直接使用することが考えられる。しかし、中核点12の周囲もまた、手書きパターン10の形状の何らかの情報を含む。この追加の形状情報を含めるために、本好ましい実施例に従って、各中核点について5つの特徴のセットが決定される。各中核点12は、どのように選択されたかによるラベル・セットからラベルが与えられる。ここでは、3つのラベルN、S、Mが使用される。中核点12のこのラベルは、中核点列をテンプレートに突き合わせるために使用される基礎を形成する。さらに、これらの特徴は、中核点12に向かう、またそこから出る方向ベクトルと、中核点12のy座標値、すなわち主筆記方向に対して直交する方向にある値と、主筆記方向に平行なx座標に沿った、中核点12から、右に最も遠い前の中核点までの符号付き距離dxとを備える。
次に、手書きパターン10を認識するための1つ又は複数の候補を見出すために、手書きパターン10の選択された中核点12の決定された特徴がテンプレートと比較される(ステップ108)。テンプレートは、データベース内で提供され、順次中核点の特徴によって表される。したがって、決定された特徴は、テンプレートの特徴と直接突き合わせられる。たとえユーザが筆記の様々なスタイルを有していてもパターンを認識するために、データベースは、同じ記号の異書体を表すいくつかのテンプレートを備えることができる。さらに、データベースは、連結線、すなわち一般に2つの文字を共に結合し、かつ実際の文字の一部でないストロークを表すテンプレートを備える。手書き単語の途中の文字すべてが連結線を有することになり、一方、単語の開始部の文字は、連結線を有する可能性も、有していない可能性もある。手書き単語はまた、連結線で終わる可能性がある。いくつかのテンプレートは、連結線が含まれた文字を表すことができる。これは、文字「e」「r」「c」「x」「s」のテンプレートに使用されることが有利である可能性がある。
次に図3及び図4を参照して、手書きパターン10の選択された中核点12の特徴をテンプレートと比較することについて述べる。中核点12は、手書きパターン10の潜在的な区切り点と見なされる。さらに、第1の潜在的な区切り点から第2の潜在的な区切り点までの中核点12の列は、手書きパターン内の潜在的な記号を表すものと見なされる。したがって、中核点12の列の特徴が、テンプレートと比較される。
選択された中核点12は、テンプレートと比較することができる中核点12の比較的多数の異なる列を表す。比較を構築するために、中核点12が順次解析される。最初の中核点12で開始して、中核点12の任意の考えられ得る列がテンプレートと突き合わされる。テンプレートに合致する列の最後の中核点12が、ノードとしてグラフ内で格納される(ステップ110)。中核点のその列とテンプレートとの合致の尺度を与える距離値がそのノード内で格納され、最初の中核点とそのノードの間の経路を表す(ステップ112)。最初の中核点からの中核点12の考えられ得る列すべてがテンプレートと突き合わされたとき、グラフ内でノードとして格納されている中核点12で開始して、さらに突き合わせが行われる。次に、テンプレートと中核点のさらなる列との間の距離値が、中核点のそのさらなる列の開始ノード部で格納されている第1の距離値に加算される。したがって、累積距離値がグラフ内の複数のノード部で格納される。このようにして、中核点12すべてについて非輪状グラフが形成され、グラフ内の最後の中核点は、グラフを通る様々な経路について累積距離値の情報を保持することになる。次いで、手書きパターン10の考えられ得る認識結果が、テンプレートの列を表す、グラフを通る経路を選択することによって返される可能性がある(ステップ114)。選択された経路は、最小の累積距離値を有する経路である可能性があるが、辞書内に存在するテンプレートの列を表す別の経路である可能性もある。
図4では、グラフ20が示されており、図2における手書きパターン10の、テンプレートに対する合致を表す。このグラフは、採番された円として表されたノード22と、ノード間の弓形24とを備える。見てとれるように、手書きパターンの様々な区切りを表す、グラフを通るいくつかの経路がある。したがって、手書きパターン10をテンプレートと突き合わせることにより、手書きパターン10の考えられ得る区切りが画定され、同時に、区切られた手書きパターン10とテンプレートの列との相似性の尺度が生成される。
手書きパターン内の1つの中核点とテンプレート内の1点との間の距離値は、点の特徴間の差の絶対値の加重和である。中核点の列とテンプレートとの間の距離値は、個々の点間の距離値の和である。しかし、グラフ内でノードを形成する中核点の距離は、1回だけ計算すべきである。したがって、ノードを形成する中核点とテンプレートとの間の距離は、そのノードへの経路、又はそのノードからの経路に割り当てられる可能性があり、その中核点と、そのノードへの経路、及びそのノードからの経路に対応する両テンプレートとの間の平均距離を反映する。
次に図5を参照して、手書きパターンを認識するための装置30について述べる。装置30は、手書きパターンを点の列として記録するための検出器32を備える。検出器32は、ユーザがその上で書くことができる圧力検知画面として実装することができる。装置30は、検出された手書きパターンを解析するための解析器34をさらに備える。解析器34は、コンピュータの中央処理装置上で動作するプログラムとして実装することができる。解析器34は、手書きパターンの中核点を選択するための手段と、それらの中核点部で、又はそれらの付近で手書きパターンの特徴を決定するための手段とを備える。装置30は、中核点の特徴として表されるテンプレートを備えるデータベース36をさらに備える。解析器34は、手書きパターンの中核点の列の特徴とテンプレートとの間の距離値を計算するための手段をさらに備える。解析器34は、手書きパターンをテンプレートと構造的に比較するためのグラフを形成し、手書きパターンの少なくとも1つの考えられ得る認識結果を生成するように構成される。この考えられ得る認識結果は、ディスプレイ上で提示させることができ、このディスプレイは、圧力検知画面とは別個のものであっても、手書きパターンが入力された圧力検知画面と一体のものであってもよい。
本明細書で述べられている好ましい実施例は、決して限定するものではないこと、また、添付の特許請求の範囲によって規定される保護の範囲内で、多数の代替の実施例が可能であることを強調すべきである。
本発明の一実施例による手書きパターンを認識するための方法の流れ図である。 手書きパターンをテンプレートと比較するために使用される、選択された中核点を示す手書きパターンの一実施例の図である。 手書きパターンをテンプレートと比較するための方法の流れ図である。 テンプレートと手書きパターンの間の距離値を決定するために形成されたグラフのチャートである。 本発明の一実施例による手書きパターンを認識するための装置の概略図である。

Claims (22)

  1. 複数の記号を表す1つ又は複数の曲線を含む手書きパターンを認識するための方法において、
    前記手書きパターンの前記1つ又は複数の曲線に沿った点の列として前記手書きパターンを検出すること、
    前記手書きパターンを区切り、前記手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択される中核点を、点の前記列の中で選択すること、
    各中核点部で、又はその付近で前記1つ又は複数の曲線の特徴を決定すること、
    各テンプレートが少なくとも1つの記号、又は記号の一部を表すテンプレートと前記手書きパターンを比較することを含む方法であって、前記比較することが、
    前記中核点を順次、1段ずつ解析することを含み、前記中核点が、考えられ得る区切り点を表し、第1の考えられ得る区切り点から第2の考えられ得る区切り点までの中核点の列が、考えられ得る記号を表し、前記解析することが、
    最初の中核点、又は中核点の前の列の最後の中核点で開始する中核点の列の前記特徴を前記テンプレートと突き合わせ、距離値を計算すること、及び、
    中核点の前記合致した列内の最後の中核点に、前記列内の前記最初の中核点に割り当てられた距離値と前記計算された距離値との和である累積距離値を割り当てることによって実施され、
    それによって、すべての順次中核点についての最小の累積距離値が、最後の中核点に割り当てられ、複数の記号を前記手書きパターンの考えられ得る認識結果として表す、合致したテンプレートの列に対応する、方法。
  2. 前記比較することが、
    ノードと、前記ノードを接続する弓形とを有するグラフを形成することによって実施され、各ノードが、前記手書きパターン内の2つの記号間の考えられ得る区切り点に対応する中核点を表し、各弓形が、中核点の列に沿って、あるノードから別のノードまでの経路を表し、前記経路が、前記手書きパターン内の考えられ得る記号に対応し、さらに、
    中核点の前記列の前記特徴を前記テンプレートに突き合わせることによって少なくとも1つの距離値を各経路に割り当てること、及び、
    少なくとも、最小の累積距離値を有する最初のノードから最後のノードまでの、前記グラフを通る前記経路を決定することによって実施され、前記経路が、複数の記号を前記手書きパターンの考えられ得る認識結果として表す合致したテンプレートの列に対応する、請求項1に記載の方法。
  3. いくつかの考えられ得る認識結果が、閾値未満の累積距離値を有する、前記グラフを通る経路に対応して決定される、請求項2に記載の方法。
  4. 前記グラフが、中核点をノードとして順次追加することによって形成され、前記少なくとも1つの距離値を各経路に割り当てることが、前記グラフの形成中に実施される、請求項2又は3に記載の方法。
  5. 前記少なくとも1つの距離値を割り当てることが、中核点の前記列の前記特徴に最も良く合致する前記テンプレートに対応する最も小さい距離値を各経路に割り当てることを含む、請求項2から4までのいずれか一項に記載の方法。
  6. 選択される中核点の数が、前記1つ又は複数の曲線の形状によって制限される、請求項1から5までのいずれか一項に記載の方法。
  7. 選択される中核点の前記数が、前記1つ又は複数の曲線の方向変化の情報を保持する点に制限される、請求項6に記載の方法。
  8. 前記中核点を選択することが、前記手書きパターンの主筆記方向に対して直交する方向で前記1つ又は複数の曲線の局所的な末端点である点を選択することを含む、請求項1から7までのいずれか一項に記載の方法。
  9. 前記中核点を選択することが、前記1つ又は複数の曲線の微分の絶対値が閾値を超える点を選択することを含む、請求項1から8までのいずれか一項に記載の方法。
  10. 前記中核点を選択することが、2つの隣接する中核点間の直線から前記1つ又は複数の曲線が逸脱する偏差が閾値を超える所で中核点を選択することを含む、請求項1から9までのいずれか一項に記載の方法。
  11. 前記特徴を決定することが、前記中核点のy座標を決定することを含み、前記y座標が、主筆記方向に対して直交する方向で、ある位置を定義する、請求項1から10までのいずれか一項に記載の方法。
  12. 前記特徴を決定することが、前記中核点に向かう前記曲線の方向、及び前記中核点からの前記曲線の方向を決定することを含む、請求項1から11までのいずれか一項に記載の方法。
  13. 前記特徴を決定することが、前の中核点からのx座標変位を決定することを含み、前記x座標が、主筆記方向と平行な方向で、ある位置を定義する、請求項1から12までのいずれか一項に記載の方法。
  14. 前記特徴を決定することが、前記中核点内でペンが持ち上げられているか、それとも押し下げられているか判定することを含む、請求項1から13までのいずれか一項に記載の方法。
  15. 前記手書きパターン内の中核点とテンプレートの点との間の前記距離値が、前記中核点の各特徴と前記テンプレートの前記点との間の前記距離の加重和として計算される、請求項1から14までのいずれか一項に記載の方法。
  16. 前記手書きパターンが、テンプレートと比較され、複数のテンプレートが、同じ記号の異なる外観を表す、請求項1から15までのいずれか一項に記載の方法。
  17. 前記手書きパターンの前記考えられ得る認識結果が、辞書と比較される、請求項1から16までのいずれか一項に記載の方法。
  18. 前記合致したテンプレートの特定の列が許可されない、請求項1から17までのいずれか一項に記載の方法。
  19. 前記合致したテンプレートの特定の列について、前記累積距離値に重みが与えられる、請求項1から18までのいずれか一項に記載の方法。
  20. 前記手書きパターンが、筆記体筆記で書かれる、請求項1から19までのいずれか一項に記載の方法。
  21. 複数の記号を表す1つ又は複数の曲線を含む手書きパターンを認識するための装置において、
    前記手書きパターンの前記1つ又は複数の曲線に沿った点の列として前記手書きパターンを検出するための手段と、
    点の前記列の中で中核点を選択するための手段であって、前記中核点が、前記手書きパターンを区切り、前記手書きパターンのこれらのセグメントを記号として認識する際に使用するために選択される、手段と、
    各中核点部で、又はその付近で前記1つ又は複数の曲線の特徴を決定するための手段と、
    前記手書きパターンをテンプレートと比較するための手段であって、各テンプレートが少なくとも1つの記号、又は記号の一部を表す、手段とを備える装置であって、前記比較するための手段が、
    前記中核点を順次、1段ずつ解析するように構成され、中核点が、考えられ得る区切り点を表し、第1の考えられ得る区切り点から第2の考えられ得る区切り点までの中核点の列が、考えられ得る記号を表し、前記解析することが、
    最初の中核点、又は中核点の前の列の最後の中核点で開始する中核点の列の前記特徴を前記テンプレートと突き合わせ、距離値を計算すること、及び、
    中核点の前記合致した列内の最後の中核点に、前記列内の最初の中核点に割り当てられた距離値と前記計算された距離値との和である累積距離値を割り当てることによって実施され、
    それによって、すべての順次中核点についての最小の累積距離値が、最後の中核点に割り当てられ、複数の記号を前記手書きパターンの考えられ得る認識結果として表す、合致したテンプレートの列に対応する、装置。
  22. データ処理ユニットの内部メモリ内に直接ロード可能なコンピュータプログラム製品であって、請求項1から20までのいずれか一項に記載の方法を実施するためのソフトウェアコード部分を備えるコンピュータプログラム製品。
JP2007541134A 2004-11-12 2005-10-21 手書きパターンを認識するための方法及び装置 Active JP4958236B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0402773A SE528063C2 (sv) 2004-11-12 2004-11-12 Metod och anordning för segmenteringsbaserad igenkänning
SE0402773-6 2004-11-12
PCT/SE2005/001571 WO2006052180A1 (en) 2004-11-12 2005-10-21 Method and device for recognition of handwritten patterns

Publications (2)

Publication Number Publication Date
JP2008520035A true JP2008520035A (ja) 2008-06-12
JP4958236B2 JP4958236B2 (ja) 2012-06-20

Family

ID=33488236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007541134A Active JP4958236B2 (ja) 2004-11-12 2005-10-21 手書きパターンを認識するための方法及び装置

Country Status (10)

Country Link
US (1) US7580573B2 (ja)
EP (1) EP1815395B1 (ja)
JP (1) JP4958236B2 (ja)
KR (1) KR20070090188A (ja)
CN (1) CN100541522C (ja)
AT (1) ATE501486T1 (ja)
DE (1) DE602005026844D1 (ja)
SE (1) SE528063C2 (ja)
TW (1) TWI303783B (ja)
WO (1) WO2006052180A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101176409B1 (ko) 2010-05-25 2012-08-28 장경호 사용자 영문 필기체 필적 구현 시스템

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1854048A1 (en) * 2005-02-28 2007-11-14 ZI Decuma AB Recognition graph
US20070263932A1 (en) * 2006-05-12 2007-11-15 Waterloo Maple Inc. System and method of gesture feature recognition
KR101080254B1 (ko) * 2009-06-02 2011-11-08 (주)펜앤프리 터치스크린을 이용한 필기 입력 방법 및 이를 이용한 필기 입력 장치
US20110248910A1 (en) * 2010-04-13 2011-10-13 Thien Van Pham Method for comparing two continuous computer generated lines generated by the movements of a computer mouse or a digitizer tablet
CN102810058B (zh) * 2011-05-31 2016-02-03 鸿富锦精密工业(深圳)有限公司 量测编程坐标系刷新系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01316890A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd オンライン手書文字認識方式
WO2002037933A2 (en) * 2000-11-08 2002-05-16 New York University System, process and software arrangement for recognizing handwritten characters

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2781898B2 (ja) 1991-07-30 1998-07-30 株式会社セブンファースト 画像彫刻方法
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
US5812697A (en) * 1994-06-10 1998-09-22 Nippon Steel Corporation Method and apparatus for recognizing hand-written characters using a weighting dictionary
IL110137A (en) * 1994-06-27 2000-06-29 Advanced Recognition Tech Handwriting recognition system
JP2845149B2 (ja) 1994-12-28 1999-01-13 日本電気株式会社 手書文字入力装置および手書文字入力方法
US5757959A (en) * 1995-04-05 1998-05-26 Panasonic Technologies, Inc. System and method for handwriting matching using edit distance computation in a systolic array processor
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
US7978914B2 (en) 2004-01-30 2011-07-12 Baumer Optronic Gmbh Image processing system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01316890A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd オンライン手書文字認識方式
WO2002037933A2 (en) * 2000-11-08 2002-05-16 New York University System, process and software arrangement for recognizing handwritten characters

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101176409B1 (ko) 2010-05-25 2012-08-28 장경호 사용자 영문 필기체 필적 구현 시스템

Also Published As

Publication number Publication date
TWI303783B (en) 2008-12-01
US20060110041A1 (en) 2006-05-25
SE0402773L (sv) 2006-05-13
WO2006052180A1 (en) 2006-05-18
JP4958236B2 (ja) 2012-06-20
KR20070090188A (ko) 2007-09-05
EP1815395A1 (en) 2007-08-08
DE602005026844D1 (de) 2011-04-21
EP1815395B1 (en) 2011-03-09
US7580573B2 (en) 2009-08-25
SE528063C2 (sv) 2006-08-22
CN100541522C (zh) 2009-09-16
ATE501486T1 (de) 2011-03-15
SE0402773D0 (sv) 2004-11-12
CN101057250A (zh) 2007-10-17
TW200630898A (en) 2006-09-01

Similar Documents

Publication Publication Date Title
JP4787275B2 (ja) セグメント化ベースの認識
JP5071914B2 (ja) 認識グラフ
US8180160B2 (en) Method for character recognition
KR100297482B1 (ko) 수기입력의문자인식방법및장치
CN100412861C (zh) 用于搜索数字墨水查询的设备和方法
US9711117B2 (en) Method and apparatus for recognising music symbols
EP0564827A2 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
JP4958236B2 (ja) 手書きパターンを認識するための方法及び装置
EP2138959B1 (en) Word recognizing method and word recognizing program
Premaratne et al. Lexicon and hidden Markov model-based optimisation of the recognised Sinhala script
JP6735775B2 (ja) 重畳手書き入力認識技術のためのシステム及び方法
JP7095450B2 (ja) 情報処理装置、文字認識方法、および文字認識プログラム
JP2014092817A (ja) 文字認識装置及びプログラム
Lee et al. On-line cursive script recognition using an island-driven search technique
JP2671984B2 (ja) 情報認識装置
KR970000276B1 (ko) 필기체 문자인식방법
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템
Kim et al. Matching algorithm for hangul recognition based on PDA
JPS63213094A (ja) オンライン文字確認装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081008

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110819

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110902

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20111006

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20120124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120315

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150330

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4958236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250