JPS6115287A - 手書き文字認識方法 - Google Patents

手書き文字認識方法

Info

Publication number
JPS6115287A
JPS6115287A JP60045008A JP4500885A JPS6115287A JP S6115287 A JPS6115287 A JP S6115287A JP 60045008 A JP60045008 A JP 60045008A JP 4500885 A JP4500885 A JP 4500885A JP S6115287 A JPS6115287 A JP S6115287A
Authority
JP
Japan
Prior art keywords
character
stroke
characters
recognition
strokes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60045008A
Other languages
English (en)
Other versions
JPH0610829B2 (ja
Inventor
チヤールズ・カーソン・タツパート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS6115287A publication Critical patent/JPS6115287A/ja
Publication of JPH0610829B2 publication Critical patent/JPH0610829B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 以下の順序で本発明を説明する。
A 産業上の利用分野 B 開示の概要 C従来技術 D 発明が解決しようとする問題点 E 問題点を解決するための手段(第1図)F 作用 G 実施例 G1 ランオン文字(第2図) G2 本発明の主要手順(第1図) G3 多重認識サブルーチン(第3図)G4 多重分類
サブルーチン(第4図)G5 処理ワード例(第5、第
6図) H発明の効果 〔A 産業上の利用分野〕 本発明は文字認識分野、特に隣接した個々の文字を結合
、セグメントで続は書きした(以下う/オン/ru・n
−on  と呼ぶ)手書き文字を認識するシステムに係
る。
〔B 開示の概要〕
本発明は、セグメンテーションおよび認識ステップを一
体化した体系によりワードを処理する方法を開示する。
この方法は3ステツプの手順で実行される。第1のステ
ップで、セグメンテーション試行可能点が引出される。
この動作により、はぼすべての真のセグメンテーション
点が表示され、しかも余分な、すなわち真でないセグメ
ンテーション点が含まれることが保証される。第2のス
テップで、文字として無理のない、すべてのセグメント
の組合せが文字レコグナイザに送られ、格付けされた選
択ならびに対応する得点が得られる。
最後に第3のステップで、認識結果の分類と組合せが行
なわれ、中長の累積得点を得る文字列が最良のワード選
択として得られる。特定のワード選択の場合、対応する
文字セグメンテーションがある。これは単に、選択され
た文字を生じるセグメント組合せである。この認識体系
では、最初の文字セグメンテーションは畢終的なもので
はないので高度の正確さはなくてもよく、シかも、真の
セグメンテーション点を含捷せるようにする制約が少な
くて済む。
〔C従来技術〕
手書き文字を入力として利用する認識システムで考慮す
べき重要なことは個々の文字の認識である。個々の文字
は、隣接する文字を結合(ランオン、run−on)す
るセグメントで続は書きされることがある。このような
認識システムにおける主要な問題はワードから文字への
セグメンテーションである。これは文字に作用する認識
アルゴリズムに向いていることがある。ワード全体を認
識する手法も可能であるが、極めて非実際的である。
ランオン手書き文字は、結合されている手書き文字であ
る、すなわち、これらの文字は互いに接触またはオーバ
ラップしていることがある。通常、隣接する文字のみが
接触またはオーバラップして表示されるけれども、もつ
々離れた文字もこのような特徴を帯びることがある。例
えば、tの横線交差はたまに幾つかの隣接文字にオーバ
ラップすることがある。・・ンドプリント(手書き印刷
字体)はしばし・ばこのようなランオン特性を生じるの
で、通常は、接触およびオーバラップ文字によって特徴
づけられる。また、筆記体文字はランオン手書き文字と
みなされ、個々の文字は、合手による連結により接触す
るものとみなされる。更に、筆記体文字はオーバラップ
できる。・・ンドプリントの場合のように、このような
オーバラップは通常、隣接する文字に関連し、このよう
なオーバラップが比較的高い頻度で生じる場合の例とし
て”t″がある。
自動認識手順でランオン手書き文字の認識が難しい理由
は、文字は互いに容易にまたは正確に分離できないから
である。文字を互いにセグメントに分割するためには何
らかの認識が必要であり、文字を認識するためにはセグ
メンテーションが必要である。それ故、これらのセグメ
ンテーションと認識の2つのプロセスは独立せず、深い
相互関係にある。にもかかわらず、この領域では従来、
先ず文字セグメンテーション手順、次いで文字認識手順
の開発が、#′!は別々に行なわれていたのである。こ
のような方法はセグメンテーション/認識順手法と呼ば
れる。
筆記体文字を読取る方法および装置に関連する米国特許
第3111.646号では、発明を実施するアルゴリズ
ムおよびハードウェアは、筆跡自身がよく釣合いのとれ
たものであることを前提としている。従って、セグメン
テーションアルゴリズムが過度に限定的である。特に、
このアルゴリズムでは、ディセンダ(下り@)の底部か
らアセンダ(上わ線)の頂点までのすべての線を含む全
体の高さを4つの部分に分割することにより、認識シス
テムで使用する種々の領域(ゾーン)が決められるので
、入力は非常によく釣合いをとって、筆跡が傾斜したり
、基線から離れたりしないようにする必要がある。しか
しながら、手書き文字は極めて多様である。実際、上り
線と下り線の高さは、ひとえに書き手のスタイルの問題
であるので、千差万別である。上り線または下り線の高
さの絶対値は、書き手の手書きスタイルにとってそれほ
ど重要ではない。従って、釣合いがよくとれた手書き文
字の定義は典型的な手書き文字例にあるような特徴とは
異なる。前記米国特許第3111646号のセグメンテ
ーションアルゴリズムの動作では、筆記文字のすべての
線が記憶レジスタに送られ、セグメンテーション点は、
最初に、主としてO軸交差数に基づいた平均文字幅の決
定によって決められる。
このような方法には、入力筆記文字が制限を受けるほか
、いくつかの欠点がある。例えば、この手法では、入力
は非常によく釣合いがとれていることが必要である、す
なわち書き手は一貫してほぼ同じ文字幅を維持する必要
がある。更に、この手法は連続的ではない、すなわち、
先ず線を構成する文字がセグメントに分割され、次いで
認識が試みられる。実際のシステムでは、セグメンテー
ションと認識は′°実時間″で実行することが重要であ
る。すなわち、操作中のシステムは、文字形成後できる
だけ早く結果を表示すべきである。連結して書込まれた
筆記文字を処理する場合には、セグメンテーション自身
が極めて困難な問題である。合手の形式は、結合されて
いる2つの文字の全体的な前後関係だけではなく、疲労
や、書込む際の身体的な条件(坐っているか立っている
か等により個々の書き手の手書き文字は変化することが
ある)のような個々の一般的な要素によっても左右され
る。従来の技術には筆記体文字のセグメンテーション体
系の例が含せれている。
筆記体の手書き文字の文字セグメンテーションの手法に
関連した米国特許第3334399号、同第33058
32号および同第4024500号によるシステムはす
べて、はぼ文字の連続体で定義される合手に基づいてい
る。
IBM技術開示誌(TDB)第24巻第6号(2897
〜2902頁)に、文字基本型のセットに対する未知の
文字の融通性のある一致に基づいて分離して書かれた文
字を認識するシステムが記載されている。この/ステム
への入力は、電子タブレット上の針先を動的にトレース
することにより生じる点データである。このような融通
凱のある一致システムにより、処理は、筆跡が文字に分
割された後に、文字ごとに実行される。前記TDBに開
示された認識手法は、文字が十分な間隔を置いて書込捷
れ認識前に分離が可能であることを仮定している。従っ
て、そのアルゴリズムは前述のセグメンテーション/認
識順手法に等しい。この体系を利用した認識は、文字が
結合する場合には実行できない。セグメンテーション/
認識順手法を用いる他の方法が、米国特許第37131
00号および同第3784982号に開示されている。
〔D 発明が解決しようとする問題点〕書込まれた文字
を処理する従来の手法は、ランオンの手書き文字を処理
する場合に適切なセグメンテーションシステムを定義す
るのには役立たない。ランオン文字の問題はハンドプリ
ント文字を処理する場合の典型的なものである。本発明
は、特にこのような手書き文字用の文字レコグナイザな
らびに活字体文字を利用するものに関連する。
本発明は、文字がランオン−1fCtt、オーバシップ
する場合に、1つの文字の終りと次の文字の始めを認識
または決定する問題を解決するアルゴリズムを利用する
点で従来の技術とは異なる。本発明が用いる方法は、文
字がオーバラップすることがあるけれども、各文字は分
離して書かれ、次の文字が開始する前に終了するものと
仮定している。各文字はストローク端で終了するから、
本発明は最初は文字によりセグメントに分割しようとは
試みないが、それよりもむしろ、すべてのストローク端
を可能な文字セグメンテーション点とみなす。
従って、2ストロ一ク以上から成る文字のために余分な
検査が行なわれても、潜在的な文字セグメンテーション
点が見落されることはない。
本発明は、”事大ス)ローフ″として定義される指定さ
れた最大数までのストローク列の、レコグナイザサブン
ステムによる処理を可能にする。
可能性のある各セグメンテーション点で、前の“′量大
ストローク”数のストロークまで、前のストローク、2
つ前のストローク等が、可能性を認識するため、レコグ
ナイザに送られる。認識手順の間にレコグナイザは一定
の入力データストリングについて可能性のあるいくつか
の候補を生成する。
これらは分類され二者択一的に検査される。この分類な
らびに二者択一的検査に゛°最良累積得点″′の手法を
用いて最良のワード候補が生成される。
レコグナイザは複数の最良ワード候補を供給するが、あ
る文字ストリングは有効なワードの一部分にはなり得な
い。本発明に従って、無効な最良ワード候補は、辞書索
引の使用により認識プロセスから削除できるっ更に、曖
昧さが生じ、レコグナイザが前後関係処理によらずに明
確に選択できない場合には、構文法および意味論上の処
理技術が使甲できる。
〔E 問題点を解決するための手段〕
本発明の方法は: (a)  現在のセグメンテー/ヨン点の指標を初期設
定し、 (b)  手書き文字のストロークを受取り前記指標を
増加するか、または処理すべきストロークがそれ以上存
在しない場合は前記方法を終了し、(c)  前記指標
に対応するセグメンテーション屯で終了するストローク
列を認識検査し、 (d)  前記認識検査の結果を分類して文字選択の可
能性を格付けし、 (f、)  すべてのストロークが処理される壕で前記
ステップ(b)〜(d)を反復する ステップで構成される。
〔F 作用〕
本発明による方法は、1回に1つの手書きワードを、ワ
ードを処理する範囲内で操作し、セグメンテーションと
認識のステップを組合わせて一体化した体系にすること
である。この体系による処理の前にワードは分離される
ものと仮定する。この分離はいくつかの方法で実行でき
る。例えば、空間的なセグメンタはワードのスペーソン
グに基づいてワードを分離できる。一般に、このような
ワードのセグメンテーションは、ワード内の文字のセグ
メンテーションに較べて容易であることが認められてい
る。ワードを分離するのに使用できるもう1つの方法は
、書き手がワードとワードの間で一時停止し、ワードを
時間的にセグメントすることである。本発明で極めて重
要な点は、量初に手書きワードをセグメントに分割し、
次いで一体化された文字セグメンテーションおよび認蹄
動作をワード単位で実行することである。
ワードを処理する範囲内で、セグメンテーションおよび
認識ステップは一体化した体系に組合わされる。これは
基本的には3ステツプからなる手順で行なわれる。第1
のステップで、セグメンテーション試行可能点が引出さ
れる。この動作により、はぼすべての真のセグメンテー
/ヨン点が表示され、しかも、トレードオフにより、余
分な、すなわち真でないセグメンテーション点も同様に
取得できることが保証される。第2のステップで、文字
として無理のない、すべてのセグメントの組合せが文字
レコグナイザに送られ、格付けされた選択ならびに対応
する得点が得られる。第3のステップで、認識結果の分
類と組合せが行なわれ、最良の累積得点を得る文字列が
最良のワード選択として得られる。特定のワード選択の
場合、対応する文字セグメンテーションがある。これは
単に、選択された文字を生じるセグメント組合せである
〔G 実施例〕
本発明によって認識されるランオンのハンドプリント文
字の例を第2図に示す。図示のように、いくつかの文字
が隣接する他の文字とオーバラップしている。従来のセ
グメンテーションの方法では、手書きの筆記体文字であ
るか、または分離した文字であるかにかかわらず、ラン
オン文字の場合には処理できない。本発明に従って、手
書き文字は、1つ以上のストロークから成る文字として
定義される5ストロークは、書込み面のペンダウン(書
き始め)の位置からペンアップ(書き終り)の位置捷で
の筆跡と定義されている。一般に、入力装置は、I B
 M/T D B第24巻第6号2897〜・2902
頁に開示されているような従来から知られている電子ペ
ンおよびタブレットの形式である。本発明に従って、望
識システムはワード内のすべてのストロークの端を可能
性のある文字セグメンテーション点とみなしている。従
って、筆記文字を判読する手法と異なり、本発明は個々
のストロークの検査結果の累積を組合せて認識を行ない
、該ワードの最適の文字列を得る。個々のストロークに
関連して利用される認誦手順は前述のIBM/TDBに
示されている。
その結果、本発明に従って、文字自身がオーバラップす
ることがあっても、各文字は分離して書込捷れ、かつ各
文字は次の文字が開始する前に終了するものと仮定する
。ワードが終了してから書き手が前に戻って一= i 
11の点を打ったり、1”の短かい横線を引いたりする
書き方と異なり、手書き文字は一般に一度に1字ずつ終
了する。従って、各文字は分離して書込まれ、しかも各
文字は次の文字が開始する前に完全に終了する。手書き
文字の各文字はストローク端によって終了するから、本
発明はすべてのストローク端を、可能な文字セグメンテ
ーション点とみなす。従って、文字セグメンテーション
点を見落すことはない、とはいっても、2ストロ一ク以
上から成る文字の場合、余分な点があることが分る。レ
コグナイザは、前述のIBM/TDBの場合のように、
複数文字からなる原型を利用する。文字によってはいく
つかのストロークを含むものがあるので、種々のストロ
ーク列がレコグナイザに送られなければならない。
本発明は最大ストローク数までのストローク列を可能に
する。本明細書で°“最大ストローク°″として示され
る最大数は、あらかじめ決められており、ストローク列
のセツティングはレコグナイザで処理される。′°最大
ストローク″として用いられる数は、使用するアルファ
ベントの文字の最大ストローク数になるようにセットさ
れる。従って、可能な各セグメンテーション点で、先行
する゛°最大ストローク”数1で、前のストローク、前
の2ストローク、等がレコグナイザに送られる。それ故
、本システムは、認識中のアルファベントに応じて可変
である。次に1 レコグナイザの候補文字および得点が
分類され、最良の累積得点を生じる候補文字の列が、最
良得点候補として出力される。
このように、本発明に従って、得点は候補と原型の間の
差として決定される。
G2 本発明の主  1  1図 第1図は本発明による主要手順の流れ図である。
現在のストローク数はlで制御される。これは現在のセ
グメンテーション点の指標でもある。ストロークごとに
、セグメンテーション点は該ストロークの最後の座標点
である。初期指標カウント設定ステップ1で、ストロー
ク指標゛°l″′がOに初期設定され、手順が開始され
る。ストローク判定ステップ2で、ワードのもう1つの
ストロークが要求され、若し、ワードにそれ以上のスト
ロークがないなら、処理は終了する。さもなければ、指
標カウント増加ステップ3で、ストローク指標が1増加
する。次に、多重認識サブルーチン4で、第3図に示す
ように、ストローク1で終了する種々のストローク列の
認識が実行される。
多重分類サブルーチン5で、第4図に示すように、いく
つかの認識結果が分類される。多重分類サブルーチン5
の後に、次のストロークを受取り、セグメンテーション
点の指標を増加し、前記サブルーチンを呼出すことによ
り、処理は反復して続行され、ワードのセグメンテーシ
ョン点ごとにプロセスが反復される。処理が終了すると
、ワード選択は、前記サブルーチンによって生成された
最後のリストにある文字ストリングを選択するだけであ
る。
G3 多重認識サブルーチン(第3図)第3図により多
重認識サブルーチンの動作を説明する。文字レコグナイ
ザに送られるストロークの番号は”J″によって制御さ
れる。°J”は最初、ステップ31でOにセットされ、
ステップ32で1増加され、ステップ33で、ストロー
ク数がプリセットされた最大ストロークを越えるかどう
かを判定する。若し、J”が最大ストロークを越えるか
、または、J”が′°1”を越えるなら、処理は終了し
、第1図の主要手順のプログラムに戻り、次のステップ
の多重分類サブルーチンが実行される。
第3図のステップ34で分離認識サブルーチンが呼出さ
れ、ストローク(i−J+1)からストローク(i)ま
での°°」″ストロークの列が処理される。このサブル
ーチンはIBM/TDB第24巻第6号、2897〜2
902頁に開示されている。
分離認識サブルーチンは1番目のストロークで終るjス
トロークの列を処理する。それによって、このサブルー
チンから候補文字のリストと候補選択数の得点が得られ
る。候補選択数は第3図のパ最大選択″に示されている
。従って、ステップ35で、マトリックスが形成され、
認識結果は、候補文字のアレイパ認識名″、ならびに候
補文字に対応する得点のアレイ″認識得点″により決め
られる。第3図のサブルーチンは、最大ストロークまで
のすべてのストローク列が処理されるまで処理が続行す
るように反復される。
G4 多重分類サプルーチ/(第4図)第4図により多
重分類サブルーチンを説明する。
このサブルーチンにより、処理の続行につれて累積得点
が生成される。従って、各ストロークに続いて、該スト
ロークまでの、該スi・ローフを含む最良の文字列が選
択される。指標” J ”を使用して、多重認識サブル
ーチンにょる°j″の処理の認識結果がアクセスされる
。指標Jは、ステップ41でOに初期設定され、ステッ
プ42で1増加されてから、ステップ43で、プリセン
トされた最大ストロークを越えているかどうかを判定す
る。
若し、Jが′°最大ストローク゛′を越えているか、ま
たはJが1を越えているなら、処理は終了し、第1図の
主要手順のプログラムに戻る。ステップ44で、ポイン
タpは、ストローク(i−j)までの、ストローク(i
−j )を含む累積認識結果のリストの最上部にセット
される。リスト上のデータ項目は、゛認識名″と呼ばれ
る文字列、“認識得点″′と呼ばれる累積得点、ならび
に次の項目を指すポインタ” pNEXT ”から成る
。ステップ55で、ポインタpがOかどうかを検査し、
若し0なら、ステップ42に戻り、Jを1増加して処理
を反復する。若しpが0ではないなら、リスト(1)を
構築する処理を続行する。選択指標(k)はステップ4
6でOに初期設定され、ステップ47で1増加される。
ステップ48で、kが最大選択よりも小さく、かつ現在
の認識得点が拒絶しきい値よりも小さいかどうかを判定
する。若し、kが最大選択よりも小さく、かつ現在の認
識得点が拒絶しきい値よりも小さいなら、ステップ49
で新しい項目を生成し、認識得点を増加することにより
リスト(i)に挿入する。さもなければ、pをp N 
EXTにセットし、処理はステップ45に戻る。
本発明では、種々の手法を利用してンステムの記憶容量
を節約する。例えば、第4図の多重分類サブルーチンに
よって生成され、リストに保持される項目数は、所望の
ワード選択数と同数しか必要としない。また、生成され
るリストの数はセグメンテーション点(ストローク)の
数に等しいけれども、前の最大ストロークのリストしか
必要としない。従って、ストロークを処理する手順が進
むにつれて、それ以前の事大ストロークのリストは削除
される。
更に、辞書索引および構文洗上ならびに意味論上の処理
を用いて、有効ワードが存在しない文字連鎖選択を削除
できる。このように、項目は、生成の都度検査し、該項
目に表示されている文字組合せを用いて有効ワードを生
成できるかどうかを判定する。この手法により、必要な
記憶容量は最小化できる。
第5図のワード” R,U N ”および第6図のワー
ド’TOGETHER”は本発明による処理例である。
第5図は、第2図のランオンワード’RUN”の計算機
表示である。この場合、文字″(J”と文字” N ”
がオーベラノブしていることが分る。それについて、ワ
ード“I(U N ”の認識出力を表わす下記の第1表
により説明する。
第5図に示すように、ワードRUNは6ストロークから
なる。ストローク1は垂直に下方に向う線である。スト
ローク1は第1表の渚上段に示されている。レコグナイ
ザは、Lに90V iに142の得点を側車てている。
ストo−り75X1つしかないものとすれば、2つの候
補文字および関連得点が多重分類サブルーチンの出力と
してプリントアウトされる。
第5図のストローク2Vi右回りの半分の環である。ス
トローク2を考慮しながら、本システムはストローク2
だけの分類とストローク1および2の組合せの分類を行
なう。事大ストローク限度甘での先行するストローク列
の分類は、分類されたストローク列の直前のストローク
の終了後に決定される事良文字ストリング選択により評
価きれる。
この特定の例では、最大ストローク限度は、ストローク
4.5および6に示すように4である。次いで、多重分
類サブルーチンは、最低の累積得点を考慮して候補文字
を示す。動作は、例えば、スドロークロの後で、第5図
に示すような琳−のストローク自身を考慮して、■と認
識されるかもしねないが、ストローク5および6のスト
ローク列はN、!:認識される。現在の最良の文字スト
リング選択は、取得されfC畢低の累積得点を表わす。
例えば、ストローク4では、RU列は、累積得点222
を有するストローク3に関連するR選択と、ストローク
4で得点123を有するU選択の組合せで、累積得点3
45を生じる。次いでこれは、多重分類サブルーチンに
より、その点に対する最良の文字ストリングであると評
価される。ストローク6では、ワードRUNは、ストロ
ーク4で累積得点345に関連するRUと、ストローク
5〜6で、得点147によって認識されfcNの組合せ
であると評価され、累積得点492を生じる。
第1表に示すように、ス)ロークロに続く最良のワード
選択はRUN、RUNV等である。第1表では、表を簡
拳にするため、ストローク列の認識選択の表示は3に制
限し、最良の文字列の表示は5に制限している。本/ス
テムは、実際にはこれ以上の情報を保持できる。捷だ、
本実施例では、アルファベットは、大文字と小文字でプ
リント文字に制限される。
本発明による文字認識体系のもう1つの使用列を第6図
に示す、第6図のワード”TOGETHER”は、ラン
オン形式の活字体文字で、隣接文字Tと0、ならびにE
とTがオーバラップしている。このワードは20ストロ
ークで形成されている。これらのストロークの各々は、
ワードRUNの場合と同様に、下記の第2表に示すよう
に分析される。
本例の場合、辞書索引手法および構文法ならびに意味論
を利用したプロセスにより、いくつかの文字候補ストリ
ングは無効文字組合せとして削除されることは明白であ
る。
従って、本明細書に説明されているように、本発明は、
融通性のある一致手法を、オーバラップまたはランオン
特性を有する手書きの活字体文字に独特に使用できる。
本発明の方法は、文字がオーバラップしていることがあ
っても、各文字は分離して書かれ、次の文字を開始する
的に終了しているものと仮定することにより、文字がラ
ンオンまたはオーバラップしている場合でも、1つの文
字の終了、ならびに次の文字の開始を認識すなわち決定
する問題を解決する。プリント文字はストローク端で終
了するように定義されているので、本発明はすべてのス
トローク端を、可能な文字セグメンテーション点とみな
す。従って、潜在的な文字セグメンテーション点が見落
されることはない。しかしながら、ワードTOGETH
ER,”の例では、2ストロ一ク以上を含む文字につい
て特別の検査が行なわれることは明らかである。従って
、これらの個々のセグメントの検査では、最終的なワー
ドにほぼ無関係ないくつかのストローク組合せが生じる
。本発明では、辞書索引手法の使用により処理時間を最
小化し、無効な文字ス) IJソング削除して処理時間
と記憶容量を減少できる。
本発明は、”最大ストローク”で示された特定の量大値
までのストローク列のレコグナイザによる処理を可能に
する。手書きの英語アルファベットによる前述の2つの
例では、最大ストロークは4にセットされている。しか
しながら、この数は使用するアルファベットにより変更
できることは明白である。従って、各々の潜在的なセグ
メンテーション点で、現在のストローク、現在のストロ
ークと前のストロークの組合せ、現在のストロークと前
の2つのストロークの組合せ等、最大ストロークまでの
検査が行なわれる。各々の組合せはレコグナイザに送ら
れ、可蛙性のある文字が認識される。次いで本発明は最
良の累積得点の手法を使用して最良のワード候補のリス
トを作成する。
セグメントが処理されるごとに、これらの最良のワード
候補が維持される。
前述のアルゴリズムでは、各文字は次の文字を開始する
前に終了するものと仮定するが、この制約を緩和するこ
ともできる。通常の手書きのプリント文字または筆記体
文字では、文字は常に次の文字の開始前に終了するとは
限らない。時には、いわゆる遅延ストロークがある。遅
延ストロークは、その文字の前の1つ寸たけ複数のスト
ロークのすぐ後に続かないストロークである。例えば、
筆記体で書かれたワード’city”は3つのストロー
クを有する:第1のストロークはワードの主体の部分、
第2のストロークは1の点、第3のストo−りは1の横
線である。この例で、第2および第3のストロークは遅
延している。にもかかわらず、一般にこれらのストロー
クを自動的に再配列することが可能で、その結果生じた
ストローク列は、各文字が次の文字を開始する前に終了
するように書いた場合に得られるストローク列と同じに
なるっこのようなストローク再配列の例は、■BM/T
DB第26巻第12号、6616〜6617頁(198
4年5月2日)に開示されている。
このようなストローク再配列により、各文字を次の文字
の開始前に終了するという制約を除去できる。
更に、本発明では、レコグナイザは、いくつかのセグメ
ンテーションを持つことにより、辞書索引および構文洗
上ならびに意味論上のプロセスのような手順による次の
評価で代りのワード選択を与える。これは、このような
高いレベルの処理なしには明確な選択が可能ではない程
度に曖昧さがある場合に特に重要である。
例えば、筆記体文字の場合、そして、活字体文字の場合
もある程度同様に、前後関係なしにはd”と”’cl”
を区別できないことがしばしばある。
本明細書に開示された手順は、ランオンの分離して書か
れた文字に有効に動作することが示されている。図示の
例では、入力は大文字のハンドプリント文字しか含んで
いない。
レコグナイザは、R,UNの例の場合、大文字と小文字
の両方の原型を持っていたが、TOGBTHERの例の
場合は大文字の原型しか持っていなかった。本発明の方
法は、小文字の活字体文字の入力にも、大文字と小文字
を混合して入力するのにも同様に使用できる。事実、小
文字のノ・ンドプリント文字は、文字当りのストローク
が少ないので、本発明の方法による処理が容易になる。
更に、本発明の方法は、句切り記号を加えて拡張された
アルファベットにも使用できる。
本発明の方法は筆記体の手書き文字にも使用できるうそ
のためには、ストローク内で可能性のあるセグメンテー
ションを生じる予備セグメンテー7ヨ7手順を付加する
だけでよい。それによって、真のセグメンテーション点
が、余分なセグメンテーション点を得ることのために見
落されることは数多にない、その結果生じた°ストロー
クセグメント”はハンドプリント文字のストロークの処
理と同様に、本発明の方法により処理される。“ストロ
ーク゛′の概念は″ストロークセグメント″の概念に拡
張するだけでよい。
〔H発明の効果〕
本発明のり繊体系の主要な利点の1つは、最初の文字セ
グメンテーションが最終的なものではないので高閲の正
確さはなくてもよく、しかも、真のセグメンテーション
点を含捷せるようにする制約が少なくて済むことである
【図面の簡単な説明】
第1図は本発明の主要手順を示す流れ図、第2図は本発
明に従って認識されるランオンの・・ンドプリント文字
の例を示す図、第3図は第1図に示された多重認識サブ
ルーチンの流れ図、第4図は第1図に示された多重分類
サブルーチンの流れ図、第5図はワード”RUN’′の
ストローク列を示す図、第6図はワード’ T OG 
E T HE )L ”のストローク列を示す図である
。 1・・・初期指標カウント設定ステップ、2 ・・・ス
トローク判定ステップ、3・・指標カウント増加ステッ
プ、4  ・多重認識サブルーチン、5・・・多重分類
サブルーチン。 出願人  インターナシフナル1ビジネス・マンーンズ
拳コーボレー/ヨン復代理人 弁理士  篠   1)
  文   雄第1図 手害さランオン文字の例 第2図 多重誌、1@サブ°ルー千ン 第8図 ワードII l:1UNIIのストローク列第6図

Claims (1)

  1. 【特許請求の範囲】 互いに接触またはオーバラップすることがある手書きの
    文字を認識する方法であつて、 (a)現在のセグメンテーシヨン点の指標を初期設定し
    、 (b)手書き文字のストロークを受取つて前記指標を増
    加するか、または処理すべきストロークがそれ以上存在
    しない場合は前記方法を終了し、(c)前記指標に対応
    するセグメンテーシヨン点で終了するストローク列を認
    識検査し、 (d)前記認識検査の結果を分類して文字選択の可能性
    を格付けし、 (e)すべてのストロークが処理されるまで前記ステッ
    プ(b)〜(d)を反復する ステップを含むことを特徴とする手書き文字認識方法。
JP60045008A 1984-06-29 1985-03-08 手書き文字認識方法 Expired - Fee Related JPH0610829B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62625484A 1984-06-29 1984-06-29
US626254 1996-03-29

Publications (2)

Publication Number Publication Date
JPS6115287A true JPS6115287A (ja) 1986-01-23
JPH0610829B2 JPH0610829B2 (ja) 1994-02-09

Family

ID=24509600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60045008A Expired - Fee Related JPH0610829B2 (ja) 1984-06-29 1985-03-08 手書き文字認識方法

Country Status (4)

Country Link
EP (1) EP0166271B1 (ja)
JP (1) JPH0610829B2 (ja)
CA (1) CA1222055A (ja)
DE (1) DE3584913D1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6370269B1 (en) 1997-01-21 2002-04-09 International Business Machines Corporation Optical character recognition of handwritten or cursive text in multiple languages
JP2012234512A (ja) * 2011-05-06 2012-11-29 King Abdulaziz City For Science & Technology (Kacst) テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JP3017740B2 (ja) * 1988-08-23 2000-03-13 ソニー株式会社 オンライン文字認識装置およびオンライン文字認識方法
JP2847715B2 (ja) * 1988-08-30 1999-01-20 ソニー株式会社 文字認識装置及び文字認識方法
EP0539158A2 (en) * 1991-10-21 1993-04-28 Canon Kabushiki Kaisha Method and apparatus for character recognition
GB2289565A (en) * 1994-05-10 1995-11-22 Ibm Character recognition
WO2004079526A2 (en) * 2003-02-28 2004-09-16 Gannon Technologies Group Systems and methods for source language word pattern matching
CN111383505B (zh) * 2020-03-04 2021-11-09 南京大学 一种基于笔交互的电路教学系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4365235A (en) * 1980-12-31 1982-12-21 International Business Machines Corporation Chinese/Kanji on-line recognition system
JPH0789363B2 (ja) * 1983-05-25 1995-09-27 株式会社東芝 文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6370269B1 (en) 1997-01-21 2002-04-09 International Business Machines Corporation Optical character recognition of handwritten or cursive text in multiple languages
JP2012234512A (ja) * 2011-05-06 2012-11-29 King Abdulaziz City For Science & Technology (Kacst) テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム

Also Published As

Publication number Publication date
EP0166271B1 (en) 1991-12-18
DE3584913D1 (de) 1992-01-30
EP0166271A3 (en) 1988-09-07
CA1222055A (en) 1987-05-19
EP0166271A2 (en) 1986-01-02
JPH0610829B2 (ja) 1994-02-09

Similar Documents

Publication Publication Date Title
US4731857A (en) Recognition system for run-on handwritten characters
US6956969B2 (en) Methods and apparatuses for handwriting recognition
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US6956968B1 (en) Database engines for processing ideographic characters and methods therefor
Aparna et al. Online handwriting recognition for Tamil
US7302099B2 (en) Stroke segmentation for template-based cursive handwriting recognition
US7369702B2 (en) Template-based cursive handwriting recognition
KR100487386B1 (ko) 부수 모델에 기초한 초서체 한자 수기 주석의 검색법
TWI437448B (zh) 手寫東亞字元之字根式hmm模型化
JPH0844826A (ja) 手書き入力照合方法
JPH05217025A (ja) オンライン手書き文字認識装置および方法
JP4649512B2 (ja) 文字列検索方法およびその装置
JPS6115287A (ja) 手書き文字認識方法
Ataer et al. Retrieval of ottoman documents
Saabni et al. Hierarchical on-line arabic handwriting recognition
Tappert An adaptive system for handwriting recognition
KR0126800B1 (ko) 한글필기체 온라인 문자인식 장치 및 방법
JP2671985B2 (ja) 情報認識方法
KR970000276B1 (ko) 필기체 문자인식방법
JP2505417B2 (ja) パタ−ン認識装置
Yin et al. Lexicon-driven recognition of one-stroke character strings in visual gesture
KR940001048B1 (ko) 온라인 필기체문자인식방법
Yamasaki Automatic allograph categorization based on stroke clustering for online handwritten Japanese character recognition
Yamasaki Writing box free recognition of online handwritten Japanese characters
Beigi et al. On-Line Unconstrained Handwriting Recognition Based on Probabilistic Techniques

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees