JPS6115287A

JPS6115287A - 手書き文字認識方法

Info

Publication number: JPS6115287A
Application number: JP60045008A
Authority: JP
Inventors: チヤールズ・カーソン・タツパート
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1984-06-29
Filing date: 1985-03-08
Publication date: 1986-01-23
Anticipated expiration: 2009-02-09
Also published as: EP0166271B1; DE3584913D1; EP0166271A3; CA1222055A; JPH0610829B2; EP0166271A2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】以下の順序で本発明を説明する。

Ａ　産業上の利用分野Ｂ　開示の概要Ｃ従来技術Ｄ　発明が解決しようとする問題点Ｅ　問題点を解決するための手段（第１図）Ｆ　作用Ｇ　実施例Ｇ１　ランオン文字（第２図）Ｇ２　本発明の主要手順（第１図）Ｇ３　多重認識サブルーチン（第３図）Ｇ４　多重分類
サブルーチン（第４図）Ｇ５　処理ワード例（第５、第
６図）Ｈ発明の効果〔Ａ　産業上の利用分野〕本発明は文字認識分野、特に隣接した個々の文字を結合
、セグメントで続は書きした（以下う／オン／ｒｕ・ｎ
−ｏｎ　　と呼ぶ）手書き文字を認識するシステムに係
る。

〔Ｂ　開示の概要〕

本発明は、セグメンテーションおよび認識ステップを一
体化した体系によりワードを処理する方法を開示する。

この方法は３ステツプの手順で実行される。第１のステ
ップで、セグメンテーション試行可能点が引出される。

この動作により、はぼすべての真のセグメンテーション
点が表示され、しかも余分な、すなわち真でないセグメ
ンテーション点が含まれることが保証される。第２のス
テップで、文字として無理のない、すべてのセグメント
の組合せが文字レコグナイザに送られ、格付けされた選
択ならびに対応する得点が得られる。

最後に第３のステップで、認識結果の分類と組合せが行
なわれ、中長の累積得点を得る文字列が最良のワード選
択として得られる。特定のワード選択の場合、対応する
文字セグメンテーションがある。これは単に、選択され
た文字を生じるセグメント組合せである。この認識体系
では、最初の文字セグメンテーションは畢終的なもので
はないので高度の正確さはなくてもよく、シかも、真の
セグメンテーション点を含捷せるようにする制約が少な
くて済む。

〔Ｃ従来技術〕

手書き文字を入力として利用する認識システムで考慮す
べき重要なことは個々の文字の認識である。個々の文字
は、隣接する文字を結合（ランオン、ｒｕｎ−ｏｎ）す
るセグメントで続は書きされることがある。このような
認識システムにおける主要な問題はワードから文字への
セグメンテーションである。これは文字に作用する認識
アルゴリズムに向いていることがある。ワード全体を認
識する手法も可能であるが、極めて非実際的である。

ランオン手書き文字は、結合されている手書き文字であ
る、すなわち、これらの文字は互いに接触またはオーバ
ラップしていることがある。通常、隣接する文字のみが
接触またはオーバラップして表示されるけれども、もつ
々離れた文字もこのような特徴を帯びることがある。例
えば、ｔの横線交差はたまに幾つかの隣接文字にオーバ
ラップすることがある。・・ンドプリント（手書き印刷
字体）はしばし・ばこのようなランオン特性を生じるの
で、通常は、接触およびオーバラップ文字によって特徴
づけられる。また、筆記体文字はランオン手書き文字と
みなされ、個々の文字は、合手による連結により接触す
るものとみなされる。更に、筆記体文字はオーバラップ
できる。・・ンドプリントの場合のように、このような
オーバラップは通常、隣接する文字に関連し、このよう
なオーバラップが比較的高い頻度で生じる場合の例とし
て”ｔ″がある。

自動認識手順でランオン手書き文字の認識が難しい理由
は、文字は互いに容易にまたは正確に分離できないから
である。文字を互いにセグメントに分割するためには何
らかの認識が必要であり、文字を認識するためにはセグ
メンテーションが必要である。それ故、これらのセグメ
ンテーションと認識の２つのプロセスは独立せず、深い
相互関係にある。にもかかわらず、この領域では従来、
先ず文字セグメンテーション手順、次いで文字認識手順
の開発が、＃′！は別々に行なわれていたのである。こ
のような方法はセグメンテーション／認識順手法と呼ば
れる。

筆記体文字を読取る方法および装置に関連する米国特許
第３１１１．６４６号では、発明を実施するアルゴリズ
ムおよびハードウェアは、筆跡自身がよく釣合いのとれ
たものであることを前提としている。従って、セグメン
テーションアルゴリズムが過度に限定的である。特に、
このアルゴリズムでは、ディセンダ（下り＠）の底部か
らアセンダ（上わ線）の頂点までのすべての線を含む全
体の高さを４つの部分に分割することにより、認識シス
テムで使用する種々の領域（ゾーン）が決められるので
、入力は非常によく釣合いをとって、筆跡が傾斜したり
、基線から離れたりしないようにする必要がある。しか
しながら、手書き文字は極めて多様である。実際、上り
線と下り線の高さは、ひとえに書き手のスタイルの問題
であるので、千差万別である。上り線または下り線の高
さの絶対値は、書き手の手書きスタイルにとってそれほ
ど重要ではない。従って、釣合いがよくとれた手書き文
字の定義は典型的な手書き文字例にあるような特徴とは
異なる。前記米国特許第３１１１６４６号のセグメンテ
ーションアルゴリズムの動作では、筆記文字のすべての
線が記憶レジスタに送られ、セグメンテーション点は、
最初に、主としてＯ軸交差数に基づいた平均文字幅の決
定によって決められる。

このような方法には、入力筆記文字が制限を受けるほか
、いくつかの欠点がある。例えば、この手法では、入力
は非常によく釣合いがとれていることが必要である、す
なわち書き手は一貫してほぼ同じ文字幅を維持する必要
がある。更に、この手法は連続的ではない、すなわち、
先ず線を構成する文字がセグメントに分割され、次いで
認識が試みられる。実際のシステムでは、セグメンテー
ションと認識は′°実時間″で実行することが重要であ
る。すなわち、操作中のシステムは、文字形成後できる
だけ早く結果を表示すべきである。連結して書込まれた
筆記文字を処理する場合には、セグメンテーション自身
が極めて困難な問題である。合手の形式は、結合されて
いる２つの文字の全体的な前後関係だけではなく、疲労
や、書込む際の身体的な条件（坐っているか立っている
か等により個々の書き手の手書き文字は変化することが
ある）のような個々の一般的な要素によっても左右され
る。従来の技術には筆記体文字のセグメンテーション体
系の例が含せれている。

筆記体の手書き文字の文字セグメンテーションの手法に
関連した米国特許第３３３４３９９号、同第３３０５８
３２号および同第４０２４５００号によるシステムはす
べて、はぼ文字の連続体で定義される合手に基づいてい
る。

ＩＢＭ技術開示誌（ＴＤＢ）第２４巻第６号（２８９７
〜２９０２頁）に、文字基本型のセットに対する未知の
文字の融通性のある一致に基づいて分離して書かれた文
字を認識するシステムが記載されている。この／ステム
への入力は、電子タブレット上の針先を動的にトレース
することにより生じる点データである。このような融通
凱のある一致システムにより、処理は、筆跡が文字に分
割された後に、文字ごとに実行される。前記ＴＤＢに開
示された認識手法は、文字が十分な間隔を置いて書込捷
れ認識前に分離が可能であることを仮定している。従っ
て、そのアルゴリズムは前述のセグメンテーション／認
識順手法に等しい。この体系を利用した認識は、文字が
結合する場合には実行できない。セグメンテーション／
認識順手法を用いる他の方法が、米国特許第３７１３１
００号および同第３７８４９８２号に開示されている。

〔Ｄ　発明が解決しようとする問題点〕書込まれた文字
を処理する従来の手法は、ランオンの手書き文字を処理
する場合に適切なセグメンテーションシステムを定義す
るのには役立たない。ランオン文字の問題はハンドプリ
ント文字を処理する場合の典型的なものである。本発明
は、特にこのような手書き文字用の文字レコグナイザな
らびに活字体文字を利用するものに関連する。

本発明は、文字がランオン−１ｆＣｔｔ、オーバシップ
する場合に、１つの文字の終りと次の文字の始めを認識
または決定する問題を解決するアルゴリズムを利用する
点で従来の技術とは異なる。本発明が用いる方法は、文
字がオーバラップすることがあるけれども、各文字は分
離して書かれ、次の文字が開始する前に終了するものと
仮定している。各文字はストローク端で終了するから、
本発明は最初は文字によりセグメントに分割しようとは
試みないが、それよりもむしろ、すべてのストローク端
を可能な文字セグメンテーション点とみなす。

従って、２ストロ一ク以上から成る文字のために余分な
検査が行なわれても、潜在的な文字セグメンテーション
点が見落されることはない。

本発明は、”事大ス）ローフ″として定義される指定さ
れた最大数までのストローク列の、レコグナイザサブン
ステムによる処理を可能にする。

可能性のある各セグメンテーション点で、前の“′量大
ストローク”数のストロークまで、前のストローク、２
つ前のストローク等が、可能性を認識するため、レコグ
ナイザに送られる。認識手順の間にレコグナイザは一定
の入力データストリングについて可能性のあるいくつか
の候補を生成する。

これらは分類され二者択一的に検査される。この分類な
らびに二者択一的検査に゛°最良累積得点″′の手法を
用いて最良のワード候補が生成される。

レコグナイザは複数の最良ワード候補を供給するが、あ
る文字ストリングは有効なワードの一部分にはなり得な
い。本発明に従って、無効な最良ワード候補は、辞書索
引の使用により認識プロセスから削除できるっ更に、曖
昧さが生じ、レコグナイザが前後関係処理によらずに明
確に選択できない場合には、構文法および意味論上の処
理技術が使甲できる。

〔Ｅ　問題点を解決するための手段〕

本発明の方法は：（ａ）　　現在のセグメンテー／ヨン点の指標を初期設
定し、（ｂ）　　手書き文字のストロークを受取り前記指標を
増加するか、または処理すべきストロークがそれ以上存
在しない場合は前記方法を終了し、（ｃ）　　前記指標
に対応するセグメンテーション屯で終了するストローク
列を認識検査し、（ｄ）　　前記認識検査の結果を分類して文字選択の可
能性を格付けし、（ｆ、）　　すべてのストロークが処理される壕で前記
ステップ（ｂ）〜（ｄ）を反復するステップで構成される。

〔Ｆ　作用〕

本発明による方法は、１回に１つの手書きワードを、ワ
ードを処理する範囲内で操作し、セグメンテーションと
認識のステップを組合わせて一体化した体系にすること
である。この体系による処理の前にワードは分離される
ものと仮定する。この分離はいくつかの方法で実行でき
る。例えば、空間的なセグメンタはワードのスペーソン
グに基づいてワードを分離できる。一般に、このような
ワードのセグメンテーションは、ワード内の文字のセグ
メンテーションに較べて容易であることが認められてい
る。ワードを分離するのに使用できるもう１つの方法は
、書き手がワードとワードの間で一時停止し、ワードを
時間的にセグメントすることである。本発明で極めて重
要な点は、量初に手書きワードをセグメントに分割し、
次いで一体化された文字セグメンテーションおよび認蹄
動作をワード単位で実行することである。

ワードを処理する範囲内で、セグメンテーションおよび
認識ステップは一体化した体系に組合わされる。これは
基本的には３ステツプからなる手順で行なわれる。第１
のステップで、セグメンテーション試行可能点が引出さ
れる。この動作により、はぼすべての真のセグメンテー
／ヨン点が表示され、しかも、トレードオフにより、余
分な、すなわち真でないセグメンテーション点も同様に
取得できることが保証される。第２のステップで、文字
として無理のない、すべてのセグメントの組合せが文字
レコグナイザに送られ、格付けされた選択ならびに対応
する得点が得られる。第３のステップで、認識結果の分
類と組合せが行なわれ、最良の累積得点を得る文字列が
最良のワード選択として得られる。特定のワード選択の
場合、対応する文字セグメンテーションがある。これは
単に、選択された文字を生じるセグメント組合せである
。

〔Ｇ　実施例〕

本発明によって認識されるランオンのハンドプリント文
字の例を第２図に示す。図示のように、いくつかの文字
が隣接する他の文字とオーバラップしている。従来のセ
グメンテーションの方法では、手書きの筆記体文字であ
るか、または分離した文字であるかにかかわらず、ラン
オン文字の場合には処理できない。本発明に従って、手
書き文字は、１つ以上のストロークから成る文字として
定義される５ストロークは、書込み面のペンダウン（書
き始め）の位置からペンアップ（書き終り）の位置捷で
の筆跡と定義されている。一般に、入力装置は、Ｉ　Ｂ
　Ｍ／Ｔ　Ｄ　Ｂ第２４巻第６号２８９７〜・２９０２
頁に開示されているような従来から知られている電子ペ
ンおよびタブレットの形式である。本発明に従って、望
識システムはワード内のすべてのストロークの端を可能
性のある文字セグメンテーション点とみなしている。従
って、筆記文字を判読する手法と異なり、本発明は個々
のストロークの検査結果の累積を組合せて認識を行ない
、該ワードの最適の文字列を得る。個々のストロークに
関連して利用される認誦手順は前述のＩＢＭ／ＴＤＢに
示されている。

その結果、本発明に従って、文字自身がオーバラップす
ることがあっても、各文字は分離して書込捷れ、かつ各
文字は次の文字が開始する前に終了するものと仮定する
。ワードが終了してから書き手が前に戻って一＝　ｉ　
１１の点を打ったり、１”の短かい横線を引いたりする
書き方と異なり、手書き文字は一般に一度に１字ずつ終
了する。従って、各文字は分離して書込まれ、しかも各
文字は次の文字が開始する前に完全に終了する。手書き
文字の各文字はストローク端によって終了するから、本
発明はすべてのストローク端を、可能な文字セグメンテ
ーション点とみなす。従って、文字セグメンテーション
点を見落すことはない、とはいっても、２ストロ一ク以
上から成る文字の場合、余分な点があることが分る。レ
コグナイザは、前述のＩＢＭ／ＴＤＢの場合のように、
複数文字からなる原型を利用する。文字によってはいく
つかのストロークを含むものがあるので、種々のストロ
ーク列がレコグナイザに送られなければならない。

本発明は最大ストローク数までのストローク列を可能に
する。本明細書で°“最大ストローク°″として示され
る最大数は、あらかじめ決められており、ストローク列
のセツティングはレコグナイザで処理される。′°最大
ストローク″として用いられる数は、使用するアルファ
ベントの文字の最大ストローク数になるようにセットさ
れる。従って、可能な各セグメンテーション点で、先行
する゛°最大ストローク”数１で、前のストローク、前
の２ストローク、等がレコグナイザに送られる。それ故
、本システムは、認識中のアルファベントに応じて可変
である。次に１　レコグナイザの候補文字および得点が
分類され、最良の累積得点を生じる候補文字の列が、最
良得点候補として出力される。

このように、本発明に従って、得点は候補と原型の間の
差として決定される。

Ｇ２　本発明の主　　１　　１図第１図は本発明による主要手順の流れ図である。

現在のストローク数はｌで制御される。これは現在のセ
グメンテーション点の指標でもある。ストロークごとに
、セグメンテーション点は該ストロークの最後の座標点
である。初期指標カウント設定ステップ１で、ストロー
ク指標゛°ｌ″′がＯに初期設定され、手順が開始され
る。ストローク判定ステップ２で、ワードのもう１つの
ストロークが要求され、若し、ワードにそれ以上のスト
ロークがないなら、処理は終了する。さもなければ、指
標カウント増加ステップ３で、ストローク指標が１増加
する。次に、多重認識サブルーチン４で、第３図に示す
ように、ストローク１で終了する種々のストローク列の
認識が実行される。

多重分類サブルーチン５で、第４図に示すように、いく
つかの認識結果が分類される。多重分類サブルーチン５
の後に、次のストロークを受取り、セグメンテーション
点の指標を増加し、前記サブルーチンを呼出すことによ
り、処理は反復して続行され、ワードのセグメンテーシ
ョン点ごとにプロセスが反復される。処理が終了すると
、ワード選択は、前記サブルーチンによって生成された
最後のリストにある文字ストリングを選択するだけであ
る。

Ｇ３　多重認識サブルーチン（第３図）第３図により多
重認識サブルーチンの動作を説明する。文字レコグナイ
ザに送られるストロークの番号は”Ｊ″によって制御さ
れる。°Ｊ”は最初、ステップ３１でＯにセットされ、
ステップ３２で１増加され、ステップ３３で、ストロー
ク数がプリセットされた最大ストロークを越えるかどう
かを判定する。若し、Ｊ”が最大ストロークを越えるか
、または、Ｊ”が′°１”を越えるなら、処理は終了し
、第１図の主要手順のプログラムに戻り、次のステップ
の多重分類サブルーチンが実行される。

第３図のステップ３４で分離認識サブルーチンが呼出さ
れ、ストローク（ｉ−Ｊ＋１）からストローク（ｉ）ま
での°°」″ストロークの列が処理される。このサブル
ーチンはＩＢＭ／ＴＤＢ第２４巻第６号、２８９７〜２
９０２頁に開示されている。

分離認識サブルーチンは１番目のストロークで終るｊス
トロークの列を処理する。それによって、このサブルー
チンから候補文字のリストと候補選択数の得点が得られ
る。候補選択数は第３図のパ最大選択″に示されている
。従って、ステップ３５で、マトリックスが形成され、
認識結果は、候補文字のアレイパ認識名″、ならびに候
補文字に対応する得点のアレイ″認識得点″により決め
られる。第３図のサブルーチンは、最大ストロークまで
のすべてのストローク列が処理されるまで処理が続行す
るように反復される。

Ｇ４　多重分類サプルーチ／（第４図）第４図により多
重分類サブルーチンを説明する。

このサブルーチンにより、処理の続行につれて累積得点
が生成される。従って、各ストロークに続いて、該スト
ロークまでの、該スｉ・ローフを含む最良の文字列が選
択される。指標”　Ｊ　”を使用して、多重認識サブル
ーチンにょる°ｊ″の処理の認識結果がアクセスされる
。指標Ｊは、ステップ４１でＯに初期設定され、ステッ
プ４２で１増加されてから、ステップ４３で、プリセン
トされた最大ストロークを越えているかどうかを判定す
る。

若し、Ｊが′°最大ストローク゛′を越えているか、ま
たはＪが１を越えているなら、処理は終了し、第１図の
主要手順のプログラムに戻る。ステップ４４で、ポイン
タｐは、ストローク（ｉ−ｊ）までの、ストローク（ｉ
−ｊ　）を含む累積認識結果のリストの最上部にセット
される。リスト上のデータ項目は、゛認識名″と呼ばれ
る文字列、“認識得点″′と呼ばれる累積得点、ならび
に次の項目を指すポインタ”　ｐＮＥＸＴ　”から成る
。ステップ５５で、ポインタｐがＯかどうかを検査し、
若し０なら、ステップ４２に戻り、Ｊを１増加して処理
を反復する。若しｐが０ではないなら、リスト（１）を
構築する処理を続行する。選択指標（ｋ）はステップ４
６でＯに初期設定され、ステップ４７で１増加される。

ステップ４８で、ｋが最大選択よりも小さく、かつ現在
の認識得点が拒絶しきい値よりも小さいかどうかを判定
する。若し、ｋが最大選択よりも小さく、かつ現在の認
識得点が拒絶しきい値よりも小さいなら、ステップ４９
で新しい項目を生成し、認識得点を増加することにより
リスト（ｉ）に挿入する。さもなければ、ｐをｐ　Ｎ　
ＥＸＴにセットし、処理はステップ４５に戻る。

本発明では、種々の手法を利用してンステムの記憶容量
を節約する。例えば、第４図の多重分類サブルーチンに
よって生成され、リストに保持される項目数は、所望の
ワード選択数と同数しか必要としない。また、生成され
るリストの数はセグメンテーション点（ストローク）の
数に等しいけれども、前の最大ストロークのリストしか
必要としない。従って、ストロークを処理する手順が進
むにつれて、それ以前の事大ストロークのリストは削除
される。

更に、辞書索引および構文洗上ならびに意味論上の処理
を用いて、有効ワードが存在しない文字連鎖選択を削除
できる。このように、項目は、生成の都度検査し、該項
目に表示されている文字組合せを用いて有効ワードを生
成できるかどうかを判定する。この手法により、必要な
記憶容量は最小化できる。

第５図のワード”　Ｒ，Ｕ　Ｎ　”および第６図のワー
ド’ＴＯＧＥＴＨＥＲ”は本発明による処理例である。

第５図は、第２図のランオンワード’ＲＵＮ”の計算機
表示である。この場合、文字″（Ｊ”と文字”　Ｎ　”
がオーベラノブしていることが分る。それについて、ワ
ード“Ｉ（Ｕ　Ｎ　”の認識出力を表わす下記の第１表
により説明する。

第５図に示すように、ワードＲＵＮは６ストロークから
なる。ストローク１は垂直に下方に向う線である。スト
ローク１は第１表の渚上段に示されている。レコグナイ
ザは、Ｌに９０Ｖ　ｉに１４２の得点を側車てている。

ストｏ−り７５Ｘ１つしかないものとすれば、２つの候
補文字および関連得点が多重分類サブルーチンの出力と
してプリントアウトされる。

第５図のストローク２Ｖｉ右回りの半分の環である。ス
トローク２を考慮しながら、本システムはストローク２
だけの分類とストローク１および２の組合せの分類を行
なう。事大ストローク限度甘での先行するストローク列
の分類は、分類されたストローク列の直前のストローク
の終了後に決定される事良文字ストリング選択により評
価きれる。

この特定の例では、最大ストローク限度は、ストローク
４．５および６に示すように４である。次いで、多重分
類サブルーチンは、最低の累積得点を考慮して候補文字
を示す。動作は、例えば、スドロークロの後で、第５図
に示すような琳−のストローク自身を考慮して、■と認
識されるかもしねないが、ストローク５および６のスト
ローク列はＮ、！：認識される。現在の最良の文字スト
リング選択は、取得されｆＣ畢低の累積得点を表わす。

例えば、ストローク４では、ＲＵ列は、累積得点２２２
を有するストローク３に関連するＲ選択と、ストローク
４で得点１２３を有するＵ選択の組合せで、累積得点３
４５を生じる。次いでこれは、多重分類サブルーチンに
より、その点に対する最良の文字ストリングであると評
価される。ストローク６では、ワードＲＵＮは、ストロ
ーク４で累積得点３４５に関連するＲＵと、ストローク
５〜６で、得点１４７によって認識されｆｃＮの組合せ
であると評価され、累積得点４９２を生じる。

第１表に示すように、ス）ロークロに続く最良のワード
選択はＲＵＮ、ＲＵＮＶ等である。第１表では、表を簡
拳にするため、ストローク列の認識選択の表示は３に制
限し、最良の文字列の表示は５に制限している。本／ス
テムは、実際にはこれ以上の情報を保持できる。捷だ、
本実施例では、アルファベットは、大文字と小文字でプ
リント文字に制限される。

本発明による文字認識体系のもう１つの使用列を第６図
に示す、第６図のワード”ＴＯＧＥＴＨＥＲ”は、ラン
オン形式の活字体文字で、隣接文字Ｔと０、ならびにＥ
とＴがオーバラップしている。このワードは２０ストロ
ークで形成されている。これらのストロークの各々は、
ワードＲＵＮの場合と同様に、下記の第２表に示すよう
に分析される。

本例の場合、辞書索引手法および構文法ならびに意味論
を利用したプロセスにより、いくつかの文字候補ストリ
ングは無効文字組合せとして削除されることは明白であ
る。

従って、本明細書に説明されているように、本発明は、
融通性のある一致手法を、オーバラップまたはランオン
特性を有する手書きの活字体文字に独特に使用できる。

本発明の方法は、文字がオーバラップしていることがあ
っても、各文字は分離して書かれ、次の文字を開始する
的に終了しているものと仮定することにより、文字がラ
ンオンまたはオーバラップしている場合でも、１つの文
字の終了、ならびに次の文字の開始を認識すなわち決定
する問題を解決する。プリント文字はストローク端で終
了するように定義されているので、本発明はすべてのス
トローク端を、可能な文字セグメンテーション点とみな
す。従って、潜在的な文字セグメンテーション点が見落
されることはない。しかしながら、ワードＴＯＧＥＴＨ
ＥＲ，”の例では、２ストロ一ク以上を含む文字につい
て特別の検査が行なわれることは明らかである。従って
、これらの個々のセグメントの検査では、最終的なワー
ドにほぼ無関係ないくつかのストローク組合せが生じる
。本発明では、辞書索引手法の使用により処理時間を最
小化し、無効な文字ス）　ＩＪソング削除して処理時間
と記憶容量を減少できる。

本発明は、”最大ストローク”で示された特定の量大値
までのストローク列のレコグナイザによる処理を可能に
する。手書きの英語アルファベットによる前述の２つの
例では、最大ストロークは４にセットされている。しか
しながら、この数は使用するアルファベットにより変更
できることは明白である。従って、各々の潜在的なセグ
メンテーション点で、現在のストローク、現在のストロ
ークと前のストロークの組合せ、現在のストロークと前
の２つのストロークの組合せ等、最大ストロークまでの
検査が行なわれる。各々の組合せはレコグナイザに送ら
れ、可蛙性のある文字が認識される。次いで本発明は最
良の累積得点の手法を使用して最良のワード候補のリス
トを作成する。

セグメントが処理されるごとに、これらの最良のワード
候補が維持される。

前述のアルゴリズムでは、各文字は次の文字を開始する
前に終了するものと仮定するが、この制約を緩和するこ
ともできる。通常の手書きのプリント文字または筆記体
文字では、文字は常に次の文字の開始前に終了するとは
限らない。時には、いわゆる遅延ストロークがある。遅
延ストロークは、その文字の前の１つ寸たけ複数のスト
ロークのすぐ後に続かないストロークである。例えば、
筆記体で書かれたワード’ｃｉｔｙ”は３つのストロー
クを有する：第１のストロークはワードの主体の部分、
第２のストロークは１の点、第３のストｏ−りは１の横
線である。この例で、第２および第３のストロークは遅
延している。にもかかわらず、一般にこれらのストロー
クを自動的に再配列することが可能で、その結果生じた
ストローク列は、各文字が次の文字を開始する前に終了
するように書いた場合に得られるストローク列と同じに
なるっこのようなストローク再配列の例は、■ＢＭ／Ｔ
ＤＢ第２６巻第１２号、６６１６〜６６１７頁（１９８
４年５月２日）に開示されている。

このようなストローク再配列により、各文字を次の文字
の開始前に終了するという制約を除去できる。

更に、本発明では、レコグナイザは、いくつかのセグメ
ンテーションを持つことにより、辞書索引および構文洗
上ならびに意味論上のプロセスのような手順による次の
評価で代りのワード選択を与える。これは、このような
高いレベルの処理なしには明確な選択が可能ではない程
度に曖昧さがある場合に特に重要である。

例えば、筆記体文字の場合、そして、活字体文字の場合
もある程度同様に、前後関係なしにはｄ”と”’ｃｌ”
を区別できないことがしばしばある。

本明細書に開示された手順は、ランオンの分離して書か
れた文字に有効に動作することが示されている。図示の
例では、入力は大文字のハンドプリント文字しか含んで
いない。

レコグナイザは、Ｒ，ＵＮの例の場合、大文字と小文字
の両方の原型を持っていたが、ＴＯＧＢＴＨＥＲの例の
場合は大文字の原型しか持っていなかった。本発明の方
法は、小文字の活字体文字の入力にも、大文字と小文字
を混合して入力するのにも同様に使用できる。事実、小
文字のノ・ンドプリント文字は、文字当りのストローク
が少ないので、本発明の方法による処理が容易になる。

更に、本発明の方法は、句切り記号を加えて拡張された
アルファベットにも使用できる。

本発明の方法は筆記体の手書き文字にも使用できるうそ
のためには、ストローク内で可能性のあるセグメンテー
ションを生じる予備セグメンテー７ヨ７手順を付加する
だけでよい。それによって、真のセグメンテーション点
が、余分なセグメンテーション点を得ることのために見
落されることは数多にない、その結果生じた°ストロー
クセグメント”はハンドプリント文字のストロークの処
理と同様に、本発明の方法により処理される。“ストロ
ーク゛′の概念は″ストロークセグメント″の概念に拡
張するだけでよい。

〔Ｈ発明の効果〕

本発明のり繊体系の主要な利点の１つは、最初の文字セ
グメンテーションが最終的なものではないので高閲の正
確さはなくてもよく、しかも、真のセグメンテーション
点を含捷せるようにする制約が少なくて済むことである
。

【図面の簡単な説明】

第１図は本発明の主要手順を示す流れ図、第２図は本発
明に従って認識されるランオンの・・ンドプリント文字
の例を示す図、第３図は第１図に示された多重認識サブ
ルーチンの流れ図、第４図は第１図に示された多重分類
サブルーチンの流れ図、第５図はワード”ＲＵＮ’′の
ストローク列を示す図、第６図はワード’　Ｔ　ＯＧ　
Ｅ　Ｔ　ＨＥ　）Ｌ　”のストローク列を示す図である
。１・・・初期指標カウント設定ステップ、２　・・・ス
トローク判定ステップ、３・・指標カウント増加ステッ
プ、４　　・多重認識サブルーチン、５・・・多重分類
サブルーチン。出願人　　インターナシフナル１ビジネス・マンーンズ
拳コーボレー／ヨン復代理人　弁理士　　篠　　　１）
　　文　　　雄第１図手害さランオン文字の例第２図多重誌、１＠サブ°ルー千ン第８図ワードＩＩ　ｌ：１ＵＮＩＩのストローク列第６図

Claims

【特許請求の範囲】互いに接触またはオーバラップすることがある手書きの
文字を認識する方法であつて、（ａ）現在のセグメンテーシヨン点の指標を初期設定し
、（ｂ）手書き文字のストロークを受取つて前記指標を増
加するか、または処理すべきストロークがそれ以上存在
しない場合は前記方法を終了し、（ｃ）前記指標に対応
するセグメンテーシヨン点で終了するストローク列を認
識検査し、（ｄ）前記認識検査の結果を分類して文字選択の可能性
を格付けし、（ｅ）すべてのストロークが処理されるまで前記ステッ
プ（ｂ）〜（ｄ）を反復するステップを含むことを特徴とする手書き文字認識方法。