JP3208340B2

JP3208340B2 - 続け書きテキストを認識する方法

Info

Publication number: JP3208340B2
Application number: JP32963796A
Authority: JP
Inventors: アブドゥール・ナズール・アルカルミ; シャンシャール・エス・サィン; バルドゥ・サァン・ソール
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1995-12-28
Filing date: 1996-12-10
Publication date: 2001-09-10
Anticipated expiration: 2016-12-10
Also published as: JPH09218923A; CA2166248A1; CA2166248C

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、続け書きテキスト
の光学式文字認識（ＯＣＲ）の分野に関する。より具体
的には、本発明は、複数の言語のいずれかで筆記または
印刷されているテキストであって、アルファベットの文
字が、数は少ないものの、単語の中のそれらの位置に依
存して異なる形状をとり、さらに、それらの左側、右側
または両側で隣接する文字に接続していたり、いずれの
側でもまったく接続していなかったりするテキストのＯ
ＣＲに関する。本発明はさらに、続け書き書体によって
表記されたある言語から別の言語への変換に関する。本
発明の方法は、認識の前に単語を文字にセグメント化し
ようとはしない。逆に、最初から最後までストロークも
しくは筆跡をたどったのち、初めて、単語（例えば英語
の手書きの場合）またはサブ単語もしくは単語（例えば
アラビア語を含む多くの言語の続け書き表記の場合）中
の文字の認識を試みる。本発明の重要な特徴は、サブ単
語が複数の言語で存在し、既存のテキストがいくつかの
言語を含むおそれがあることを認識すること、例えば、
引用部分がテキストの主要言語とは異なる言語で書かれ
ているという一般的な事象を認識することにある。

【０００２】

【従来の技術】文字セグメント化に関する従来技術の例
は、下記の米国特許である。

【０００３】１９７７年５月１７日に付与された「Segm
entation Mechanism for Cursive Script Character Re
cognition Systems」と題する第４，０２４，５００号

【０００４】１９８７年３月３１日に付与された「Syst
em and Method for Segmentation and Recognition of
Patterns」と題する第４，６５４，８７３号

【０００５】１９９１年３月１９日に付与された「Fast
Spatial Segmenter for Handwritten Characters」と
題する第５，００１，７６５号

【０００６】１９９２年３月３１日に付与された「Segm
entation Process for Machine Reading of Handwritte
n Information」と題する第５，１０１，４３９号

【０００７】１９９２年５月５日に付与された「Appara
tus for Converting Handwritten Characters Onto Fin
ely Shaped Characters of Common Size and Pitch, Al
igned in an Inferred Direction」と題する第５，１１
１，５１４号

【０００８】１９９２年９月２９日に付与された「Meth
od for Recognizing Handwritten Characters Using Sh
ape and Context Analysis」と題する第５，１５１，９
５０号

【０００９】１９８８年９月２０日に付与された「Meth
od of Optical Character Recognition」と題する米国
特許第４，７７３，０９８号では、指向性ベクトル値を
文字の輪郭決定に割り当てることにより、個々の文字を
認識している。

【００１０】１９９０年９月２５日に付与された「Char
acter Recognition Apparatus Having Means for Compr
essing Features Data」と題する米国特許第４，９５
９，８７０号では、ヒストグラム値である成分を有する
特徴ベクトルを抽出、圧縮したのち、記憶された標準文
字の圧縮特徴ベクトルと突き合わせている。

【００１１】１９９０年１２月１８日に付与された「Co
de Sequence Matching Method andApparatus」と題する
米国特許第４，９７９，２２６号は、文字認識のため
の、入力パターンからのコード列の抽出および基準コー
ド列との比較を教示している。

【００１２】１９７１年９月２８日に付与された「Char
acter Recognition by Linear Traverse」と題する米国
特許第３，６０９，６８５号は、文字の形状を細線化し
て、線の一つの集合によって表されるようにし、それを
番号付きの指向性ベクトルの組み合わせに変換し、指向
性ベクトルの集合を簡約して冗長な連続する同一要素を
除く文字認識を教示している。

【００１３】１９９１年９月１７日に付与された「Meth
od of Handwriting Recognition」と題する米国特許第
５，０５０，２１９号は、次のように要約されている。

【００１４】「所定の規準を手書き筆跡もしくはその筆
跡の要素に適用して、この筆跡もしくはそれらの要素の
いくつかの特徴を決定し、そのようにして決定した特徴
を、既知の手書きの要素を表す特徴と比較し、それらの
特徴の比較が所定の結果を出すならば、筆跡の一つの要
素を手書きの一つの既知の要素と同定することからなる
手書き文字認識方法において、規準を筆跡要素に当ては
めることにより、一連の所定の操作段階を所定の特徴に
したがって設定することを特徴とする方法」

【００１５】

【発明が解決しようとする課題】公知の従来技術のいず
れも、すべての文字が認識されたのちベクトルが未使用
のまま残る、内部的に接続されたテキスト筆跡の単位を
扱う方法または一つの文書または一つの頁の中で多数の
言語の出現を扱う方法を教示してはいない。

【００１６】

【課題を解決するための手段】内部的に接続されたテキ
スト筆跡のコード化された単位を一つの面における一連
の方向（ベクトル列）として使用しながら、単位をサブ
単語として認識し、テキスト筆跡中のすべてのベクトル
を使用して、認識される文字または言語の断片を作りだ
し、ベクトル列を、一つまたは複数の言語固有規則に照
らして検査すると、より効率な文字認識が達成されるこ
とが見いだされた。

【００１７】さらに、入力テキストを認識エンジンに提
示する前にそれを構成文字にセグメント化しないなら
ば、認識の前でかつテキスト画像の取得ならびにノイズ
軽減およびろ過の後での前処理の量が減ることが見いだ
された。したがって、テキスト画像に固有の自然なセグ
メント化（単語およびサブ単語の間の空間による）が固
守され、利用される。

【００１８】本明細書中「サブ単語」とは、続け書きテ
キスト中の切れ目によって区切られている、すなわち、
連続する文字が連字記号によって結ばれていない、単語
の内部的に接続された部分をいう。サブ単語は、長いと
きには単語全体であることもでき、短いときには１文字
であることもでき、さらには、例えば、文字が二次的特
徴を含むならば、その文字の一部であることもできる。

【００１９】本発明は、同時係属中のカナダ国特許出願
第２１３９０９４号に記載のような、平面的指向性ベク
トルの列からなる取得されたテキスト画像を、認識エン
ジンにより、内部的に接続されたサブ単語の塊で分析
し、続け書きテキストを解析し、連続するサブ単語を認
識するごとに文字マーカを入れ、テキストの接続された
サブ単語を認識した後に未使用のベクトルが残るなら
ば、ベクトル列中の各ベクトルがテキストの文字の認識
に寄与するまで、文字マーカを一度に１ベクトルずつ前
または後に動かすことによってそのテキストを再解析す
る中間ステップを有する、複数言語の文字を含み得る公
知の光学式文字認識方法に対する改良を提供する。認識
エンジンはさらに、第一の言語固有規則を使用し、第一
の言語固有規則中の項目をチェックし終わったのち、特
定のサブ単語が認識されないならば、そのサブ単語が認
識されるまで、そのサブ単語を第二の言語固有規則と比
較する。

【００２０】本発明はさらに、複数の言語の一つ以上で
書かれた続け書きテキストを、走査された画像から認識
するための装置であって、指向性ベクトル列中のすべて
のベクトルが認識に寄与した場合にのみ、そのベクトル
列を文字として認識するための手段と、指向性ベクトル
列中のすべてのベクトルが認識に寄与するまでそのベク
トル列を再解析するための手段と、少なくとも二つの言
語固有辞書と、指向性ベクトル列を言語固有辞書と比較
するための手段とを含む装置を提供する。方法のステッ
プを実行するためにコンピュータを制御するためのコー
ドは、適当な媒体、例えば磁気記憶ディスケットまたは
プログラム可能読出し専用メモリにプログラムすること
ができる。

【００２１】本発明はさらに、複数の言語の一つ以上で
書かれた続け書きテキストを、走査された画像から認識
するための、指向性ベクトル列中の各ベクトルが少なく
とも一つの言語固有規則からのテキストの文字の認識に
寄与するまで文字マーカを一度に１ベクトルずつ動かす
ことにより、指向性ベクトルの列を再解析するステップ
を含む方法を実行するためにコンピュータによって実行
可能であるプログラム・コードを含むコンピュータ使用
可能媒体を提供する。このようなコードの記憶に適した
媒体の例は、磁気的にコード化されたディスク、光学的
にコード化されたディスク（ある形態は一般にＣＤ−Ｒ
ＯＭと呼ばれる）、固定ディスク・ドライブならびにＥ
ＰＲＯＭ、ＥＥＰＲＯＭおよびフラッシュ・メモリ・カ
ードをはじめとするプログラム可能読出し専用メモリで
ある。そのようなコードは、適当な形態、例えば二進化
形態で、局所的もしくは広域的なネットワークまたは共
用の電子的伝送ネットワーク、例えばインターネットに
載せて容易に伝送することができる。

【００２２】本発明はさらに、複数の言語の一つ以上で
書かれた続け書きテキストを、走査された画像から認識
するためのプログラム・コード手段を含むコンピュータ
使用可能媒体を含むコンピュータ・プログラム製品であ
って、コードが、コンピュータをしてテキスト筆跡をベ
クトルとしてコード化させるためのコード手段と、ベク
トル列中のすべてのベクトルが認識に寄与した場合にの
み、そのベクトル列を文字として認識するための手段
と、文字マーカを移動させることによってベクトル列を
再解析するための手段と、一つ以上の言語固有規則を設
けるための手段と、ベクトル列の各要素を規則と比較す
るための手段と、第一の規則で一致がみられないなら
ば、ベクトル列の各要素を第二の言語固有規則と比較す
るための手段とを含むコンピュータ・プログラム製品を
提供する。このコンピュータ・プログラム製品は、コー
ドを記憶し、記憶されたコードを伝送するのに適した好
都合な製品、例えば磁気的もしくは光学的にコード化さ
れたディスクまたはＥＰＲＯＭ、ＥＥＰＲＯＭもしくは
フラッシュ・メモリ・カードをはじめとするプログラム
可能読出し専用メモリであることができる。

【００２３】本発明のシステムは、第一の文字の言語を
認識したならば、その第一の言語の辞書を、その言語に
おいて一致をみることができなくなるまで使用し続け
る。そののち、認識可能な文字を見いだすまで、別の言
語において認識を試みる。したがって、セグメント化の
前の言語および書かれたテキストの認識は、非決定性で
あり、テキストそのものによって指図される。

【００２４】好ましくは、平面的指向性ベクトルの列
は、当該技術に公知の方法にしたがって処理することよ
って、すなわち、以下のようなデジタル化テキスト画像
のノイズ軽減およびろ過によって得られる。

【００２５】（ａ）テキスト画像をその必須骨格まで細
線化もしくは骨格化する（とりわけ、例えば、T. Wakay
amにより「A case line tracing algorithm based on m
aximal square moving」と題する論文（IEEE Transacti
ons on Pattern Recognitionand Machine Intelligenc
e, VOL PAMI-L1, No. 1, pp. 68-74）で教示された方法
による）。（ｂ）デジタル化した画像の逐次データ流により、細線
化した画像を、筆跡の方向の流れを表す指向性ベクトル
に変換する（例えば、「フリーマン・コード」により、
指向性ベクトルを骨格の各要素に割り当てる）。（ｃ）少なくとも一つの簡約規則を指向性ベクトルの列
に適用して、その長さを減らし、単語もしくはサブ単語
の簡約表示を生成する。好ましい実施態様における一つ
の簡単な簡約規則は、同一の指向性ベクトルの直後の指
向性ベクトルを捨てるように規定している。この規則
は、ベクトル列に帰納的に適用することができ、それを
相当に簡約する。

【００２６】ひとたび上記の中間前処理ステップが適用
されたならば、指向性ベクトル列の言語に応じた同定が
始まる。例えば、第一の辞書中の言語の言語固有文法規
則は、そのもっとも簡約された指向性ベクトル列によっ
て各アルファベット文字を定義する参照テーブルを含む
であろう。さらなる言語固有規則が、いずれかの側で接
続性を制限することもできるし、文字の二次的特徴、例
えば点（アラビア語の場合）またはアクセント符号（フ
ランス語の場合）を指定することもできる。したがっ
て、所与の言語について最適な文法規則に到達するまで
にいくらかの実験が必要になることが明らかである。文
法規則は、個々の書き手の癖に対する備えを含むことも
できる。例えば、人によってはアルファベットの一部を
筆記体で書き、いくつかの文字を活字体で書く。英語の
肉筆では「ｒ」や「ｓ」は一般に活字体で書かれる。第
二の例は、書き手によっては「ｔ」を書く際、水平方向
のストロークを垂直方向のストロークと交差させず、そ
れにより、さらなるサブ単語を作り出す場合である。も
う一つの実施態様では、本発明は、以下に説明する方法
でアクセスされる第二の言語固有規則を提供する。

【００２７】

【発明の実施の形態】図１を参照すると、前処理の準備
ができたアラビア語の単語「ＲＩＪＡＬ」の骨格が示さ
れている。当然ながら、この単語は、実際には、画像マ
トリックスの要素を表すデータ流として提供される。図
１から見てとれるように、この単語は４個の独立したサ
ブ単語を有している。第一のサブ単語１０は、単にアラ
ビア語文字「Ｒａ」であり、第二のサブ単語は、２個の
文字「Ｇｅｅｍ」および「Ａｌｅｆ」１１であり、第三
のサブ単語は文字「Ｌａｍ」１２であり、第四のサブ単
語は、二次的な特徴（ＳＦ）１３であって、サブ単語１
１における「Ｇｅｅｍ」の下の「点」である。

【００２８】図２に示す指向性ベクトル（１〜８）を図
１のサブ単語に当てはめる結果、第一のサブ単語１０に
ついて下記のようなベクトル列が得られる。

【００２９】５５５５５５５６６６６６６６７７７７７７７７

【００３０】図２を参照すると、より微細な解像を得る
ためには、８個以上、例えば１６個、３２個またはそれ
以上の指向性ベクトルを用いることが有利であるかもし
れない。しかし、８方向でも円の形を近似することが可
能であり、これが大部分の用途に求められる最少数であ
る。同一の指向性ベクトルの二個目以降を捨てるという
簡約規則の例を適用することにより、順次、上記ベクト
ル列は次のように簡約される。

【００３１】（５、６、７、＄）ここで、＄記号はサブ単語の終わりを意味する。

【００３２】同様にして、図１の単語全体が下記のコー
ド化文字列に簡約される。

【００３３】（５、６、７、＄）、（３、４、３、７、
８、１、＄）、（ＳＦ）、（５、６、７、８、１、＄）

【００３４】この文字列が図３の状態機械に加えられ、
この状態機械が、「Ｓｔａｒｔ」から、ｑ０からｑ１
（５）へ、ｑ１からｑ２ｑ（６）へ、そしてｑ２からｑ
３（７）への遷移を進む。第一のサブ単語１０はｑ３で
終了し、ベクトル「５、６、７」が文字「Ｒａ」と同定
され、かつ、「＄」の前に指向性ベクトルが残らないの
で、ｑ３状態は決定性の「受理状態」である。

【００３５】したがって、最初の文字列は、第一のサブ
単語１０を１個の文字（Ｒａ）と同定する。第二の文字
列（ｑ４からｑ９に進むことによって得られる）は、２
個の文字からなるもう一つのサブ単語１１である。（Ｓ
Ｆ）は、二次的特徴の存在を示す。本システムは、文字
列がシステム・スタックにプッシュされたとき、その文
字列を受理しようとする。文字列「３、４、３、７」は
１個の文字であり、他の文字列「８、１」は別の文字で
ある。以下にスタック処理シーケンスを記す。

【００３６】＊３＊４３＊３４３＊７３４３；（１個の文字を受理）；＊Ａ＊８Ａ＊１８Ａ＊＄１８Ａ；（第二の文字を受理）、「Ａ」
は、その前のベクトル列（すなわち、その前の文字）の
受理を示すマーカである。

【００３７】第三のサブ単語１２は興味深いものであ
る。この第三の文字列は１個の文字を表すものである
が、２個の文字列（５、６、７）、（８、１）に分割す
ることができる。スタック処理は次のようになる。

【００３８】ベクトル列注解＊５前のマーカに続く第一のベクトル＊５、６第二のベクトル＊５、６、７第三のベクトル＊Ａ文字を認識し、受理マーカを挿入＊Ａ、８サブ単語の終わりが認識を確認

【００３９】このように、第一の言語固有文法規則を参
照すると、（５、６、７）の文字列は、その左側で他の
文字に接続することができない別個の文字（「ａｌｅ
ｆ」）であるという結果になった。（８、１）の文字列
もまた別個の文字であるが、処理が終了したとき、スタ
ックが空ではない。したがって、何か続くものがある。
よって、この結果を受理することはできない。その場
合、システムは、前に解析した文字列を適応的に拡張し
て（５、６、７、８、１）にし、その新たな文字列を認
識しようと試みる。これで、この第三のサブ単語の正し
い解釈が得られる。

【００４０】このように、本方法は、個々の文字の認識
の前に、適用された要素を適応的に解析し、言語の自然
な空間的解析に従う。

【００４１】このように、各単語およびサブ単語は、指
向性ベクトルの列に変形される。認識プロセスは、この
リストの要素が、本明細書では非決定性有限オートマト
ンと呼ぶ状態機械に送られたときに始まる。非決定性有
限オートマトンは、この指向性ベクトル列を、初期状態
から最終状態まで進行する（このベクトル列に基づく）
事前に定義された遷移状態が存在する場合に、また、そ
のような場合にのみ受理する。これが非決定性状態機械
であるという事実が、入力されたベクトル列に依存して
すべての入力を受理する融通性につながる。非決定性有
限オートマトンから構成された決定性有限状態機械を有
することは異例なことではない。しかし、この場合、そ
のような決定性有限オートマトンは、２のＱ乗（Ｑは機
械における状態の数である）という多数の状態を含むで
あろう。しかし、これらの状態すべてを使用する必要は
ない。これは、非決定性有限オートマトンの内部で利用
される。

【００４２】これが意味することは、非決定性有限オー
トマトンが、所与のアルファベットで形成されるすべて
の可能な単語を、たとえ形成されるそのような「単語」
のいくつかが無意味であり、よって受理できないとして
も、包含するということである。これは、例えば辞書の
使用によって扱うことができる。認識は、走査されたの
ち細線化されて指向性ベクトルを生成する画像に基づく
ため、非決定性有限オートマトンの生成規則は、システ
ムに対し、この形成を受理するか拒否するかのいずれか
を許す。文字列を拒否する可能性は理解することができ
る。しかし、文字列を拒否する前に非決定性有限オート
マトンが試みることは、その文字列をフォーマットし直
して、より多数または少数の入力要素を用いてその文字
列を受理することができないかどうかを調べることであ
る。非決定性有限オートマトンのこの適応性が、非決定
性有限オートマトンを、認識エンジンとして、またその
認識速度において、非常に強力なものにする。

【００４３】図４および５は、図３に示す非決定性有限
オートマトンのアプローチを具現化するための高レベル
・フローチャートを示す。このフローチャートは、一つ
以上の言語固有文法規則を使用する際の本発明の方法を
特に説明する。規則は、好都合な媒体、例えば固定ディ
スク・ドライブに記憶し、アクセスすることができる。
アラビア語の場合のこのような規則の例（疑似コードで
記載）を以下に記す。

【００４４】 /*Grammer Rules - Arabic*/ /*TOKENS.*/ <punctuator>=>OP SEARCH <number>=>NO SEARCH <eof> /*KEYWORDS.*/ UpwardOneDot UpwardTwoDots UpwardThreeDots DownwardOneDot DownwardTwoDots DownwardThreeDots One Two Three Four Five Six Seven Eight /*PUNCTUATORS.*/ .$# /*TERMINALS.*/ /*1 2 3 4 5 6 7 8*/ /*NONTERMINALS.*/ Input ->File<eof> File ->SubWordSequence ->File SubWordSequence SubWordSequence ->FeatureVector SubWordSequence ->SecondaryFeature SubWordSequence ->CharacterSequence Separator ->CharacterSequence PinSequence ->CharacterSequence SubWordSequence CharacterSequence（アラビア語アルファベット２８文字） ->Alef ->Ba ->Ta ->Tha ->Geem ->Hah ->Kha ->Dal ->Thal ->Ra ->Za ->Seen ->Sheen ->Tae ->Thae ->Sad ->Dhad ->Kaf ->Lam ->Meem ->Noon ->Ha ->Waw ->Ya ->Eain ->Ghain ->Ghaf ->Fa （簡約された文字骨格の定義） Alef ->8,1,$ Lam ->5,6,7,8,1,$ Ba ->5,6,7,8,1, SecondaryFeature1,$ Ta ->5,6,7,8,1, SecondaryFeature2,$ Tha ->5,6,7,8,1, SecondaryFeature3,$ Geem ->3,4,3,6,7, SecondaryFeature1,$ Hah ->3,4,3,6,7,$ Kha ->3,4,3,6,7, SecondaryFeature4,$ Dal ->4,6,7,$, Thal ->4,6,7,SecondaryFeature4,$ Ra ->5,6,7,$ Za ->5,6,7,SecondaryFeature4,$ Seen ->5,6,7,8,4,7,8,4,7,$ ->5,6,7,8,4,7,8,4,7,5,6,7,8,1,$ Sheen ->5,6,7,8,4,7,8,4,7, SecondaryFeature3,$ ->5,6,7,8,4,7,8,4,7,5,6,7,8,1,SecondaryFeature3,$ Tae -> ．．．（以下同様） SecondaryFeature ->DownwardOneDot PinSequence ->8,6 /*END.*/

【００４５】当業者にとって、言語固有辞書を形成する
各言語固有規則が、各文字の少なくとも一つの表示を含
み、その表示を近似するベクトル列が特定の文字として
認識されうるようにしなければならないことが明白であ
ろう。場合によっては、１個以上の文字の代替表示を言
語固有規則に設けて、異なる書き手の筆記スタイルが紙
面上で所与の文字を表す種々の書き方を受け入れること
もできる。例えば、英語では、小文字の「ｒ」は、人に
よっては、ほとんどタイプされた文字の形に活字体で書
くこともあるし、人によっては、ゴシック体または黒字
体で筆記することもある。このように、いずれのスタイ
ルの書き方も、文字「ｒ」として認識されるであろう。
以下、英単語「ｅａｔ」を処理する方法を例示する。

【００４６】ひとたび「ｅａｔ」が走査され、骨格化さ
れたならば、以下のベクトル列が現れる。

【００４７】2,4,6,7,5,4,3,2,2,3,4,8,7,6,5,4,3,1,5,
3,2,1,5,3,7,5,4,3,EOF

【００４８】このベクトル列は、この例では偶然に完全
な単語であるわずか１個のサブ単語を表すものであるこ
とに注意すること。認識スキームが始まると、最初の文
字、すなわち「ｅ」が解析され、最初のベクトル列
（２、４、６、７）をあいまいに文字「０」と同定する
ことができる。しかし、次のベクトル列（５、４、３、
２）は認識されず、したがって、文字「ｅ」を得ること
ができる。ベクトル列が続くにつれ、あいまいさは増大
する。簡約および言語の規則に依存して、第二のベクト
ル列（２、３、４、８、７、６、５、４、３、１、５）
を「ａ」、「ｕ」または「ｏ」のいずれかと同定するこ
とができる。このような状況は通常、言語規則を充実さ
せることにより、１個以上のベクトル列を追加して文字
を同定することによって扱われる。多大なあいまいさを
呈する続け書きテキストに対しては、このような手順は
通常である。

【００４９】第二の言語におけるテキストを扱うため
に、本発明は、アラビア語の規則によって上記に例示し
た第一の言語固有規則と動作において類似している、第
二の言語固有規則を設ける。第一の言語固有規則と同
様、これらの規則は、いかなる好都合な媒体に記憶して
もよい。これらは、好都合かつ効率的な手段または方
法、例えばそれらの一部または全部を、本方法を実行す
るのに使用されるコンピュータの動作メモリにロードす
ることにより、検査ステップに取り込むことができる。
第二の言語固有規則は、オペレータが導入することもで
きるし、コンピューティング・システムが自動的に提供
することもできる。オペレータが、所与のテキスト中に
どの言語が使用されるのかを調査から知っている場合、
オペレータの介入が貴重であるかもしれない。その場
合、オペレータは、システムが言語固有規則を検査のた
めに取り込む順序を選択することができる。例えば、オ
ペレータが、主なテキストがアラビア語で書かれてお
り、しかも英語での引用が含まれていることを知ってい
るならば、アラビア語を第一の言語固有規則として選択
し、英語を第二の言語固有規則として選択することがで
きる。あるいはまた、システムをそのままにして、言語
固有規則に対して無作為に検査させ、場合によっては、
成果のあった規則のリストを何らかの好都合な手段によ
って保持させることもできる。

【００５０】図４を参照すると、本発明の方法は、「Ｓ
ｔａｒｔ」１０１から、前処理されたベクトル列をもっ
て始まる。第一のステップ１０２は、適当な記憶媒体か
ら言語固有規則を検索することである。検索される第一
の言語固有規則が、認識されるテキスト中で遭遇する可
能性がもっとも高い規則であるようにシステムを設定す
ることが有利である。しかし、上述したように、システ
ムは、多数の言語固有規則を用いることができるため、
オペレータは、特定の言語固有規則を事前に選択する必
要はない。好ましくは、一つの言語固有規則がデフォル
トとしてシステムに設けられる。次に、システムは、ス
テップ１０３で、前処理されたベクトル列から次のベク
トルを取得し、それをアプリケーション・スタックに置
く。さらにステップ１０４で、システムは、スタック上
のベクトル列を言語固有規則と比較し、判定ステップ１
０５でそのベクトル列が文字として認識されたならば、
ステップ１０６で受理マーカをスタックに置き、先に進
む。判定ステップ１０５でベクトル列が文字として認識
されないならば、受理マーカはスタックに置かれない。
いずれの場合にも、次にシステムは、判定ステップ１０
７で、好ましい実施態様では上記のように＄によって示
されるサブ単語の終わりを検査する。サブ単語の終わり
に達していなければ、システムは、ステップ１０３に戻
り、次のベクトルを取得し、それをアプリケーション・
スタックに置く。サブ単語の終わりに達しているなら
ば、システムは、判定ステップ１０８で、すべてのベク
トル列が認識されたかどうか、すなわち、サブ単語の終
わりの直前に受理マーカがあるかどうかを判定する。
「Ｙｅｓ」ならば、システムは、入力の終わりに達した
かどうかをチェックし、達していなければ、ステップ１
０３の入り口点に戻る。入力の終わりに達しているなら
ば、ステップ１１０で処理が終了する。

【００５１】次に図５を参照する。図４のステップ１０
８ですべてのベクトル列が認識されてはいないならば、
システムは、図５に１１１として示す入り口点Ｗに進
む。ステップ１１２で、システムは、受理マーカをベク
トル１個分だけ先に移す。例えば、ベクトル列が「５、
６、７、Ａ、８、１、＄」であるならば、受理マーカを
移動すると、列「５、６、７、８、Ａ、１、＄」が生成
される。ステップ１１３で、スタック上のベクトル列が
一番上から受理マーカの直前の位置まで再解析される。
あるいはまた、検査中のベクトル列が最新の受理マーカ
に続くベクトル列であるならば、そのベクトル列は、前
の受理マーカから現在位置、すなわち、アプリケーショ
ン・スタックに置かれた最後のベクトルまで再解析され
る。判定ステップ１１４で、システムは、ベクトル列が
認識されたかどうか、すなわち、サブ単語の終わりの直
前に受理マーカがあるかどうかを検査する。答えが「Ｙ
ｅｓ」ならば、ステップ１１５でその文字が受理され、
システムは、図４のステップ１０９への入り口点である
ポイントＺに戻る。

【００５２】判定ステップ１１４での答えが「Ｎｏ」な
らば、システムは、判定ステップ１１６で、特定の言語
固有規則の可能なすべての組み合わせをチェックしたか
どうかを検査する。チェックすべき組み合わせが残って
いれば、システムは、ステップ１１１への入り口点に戻
る。他方、第一の言語固有規則中のすべての組み合わせ
を検査し、チェックし終わっているならば、システム
は、判定ステップ１１７で、利用可能な言語固有規則を
すべて参照したかどうかを判定する。すべてを参照して
はいない、すなわち、検査を試みるべきさらなる言語固
有規則があるならば、システムは、ステップ１１８で、
次の言語固有規則を検索し、図４のステップ１０４への
入り口点であるＸに戻る。参照すべきさらなる言語固有
規則がないならば、ステップ１１９で、認識されないベ
クトル列が好都合な記号、例えばアスタリスク記号
（＊）によって示され、システムは、ステップ１２０
で、デフォルトの言語固有規則に戻り、図４のステップ
１０９への入り口点であるＺに進む。

【００５３】第一の言語固有規則に対して検査したのち
ベクトルが残ったならば、本発明は、第二の言語固有規
則に対して、認識されていない残りのベクトルの最初の
ものから出発し、以前と同様にベクトルを１個ずつ加え
ることにより、検査を始める。突き合わせが見いだされ
ると、上記に論じたように、文字マーカを挿入し、より
多くのベクトルを、好ましくは第二の言語固有規則に対
する検査に加える。検査は、利用できる言語固有規則の
いずれに照らしても実施することができる。しかし、後
続のベクトル列中に見いだされる可能性がもっとも高い
言語が前のベクトル列の言語であるため、まず、ベクト
ル列に対して突き合うことがもっとも最近に見いだされ
た言語固有規則に照らして検査することが有利であるか
もしれない。

【００５４】言語固有規則における言語のいずれかが、
テキストの他の部分とは異なる方向、例えば右から左の
方向に現れるテキストを使用しているならば、突き合わ
せが見いだされるまで、第二の言語固有規則が逆方向に
使用される。例えば、英文テキスト中にヘブライ語での
引用が見いだされるならば、ベクトル列は、英語におけ
る突き合わせを見いだすことなく、いくつかのベクトル
を蓄積する。これは、未使用のサブ単語中のベクトルの
すべてを有するサブ単語の終わりに達する。したがっ
て、第一の言語固有規則は突き合わせがないままチェッ
クし終わり、突き合わせを求めて第二の言語固有規則が
チェックされる。例えば、第二の言語固有規則が偶然に
ヘブライ語であるならば、言語固有規則の一つは「右か
ら左に読む」ということであろう。この規則は、突き合
わせが見いだされるまで、ベクトルを読み込み順序で逆
にする。文字がサブ単語中のその位置に依存していくつ
かの形態を有することができる言語においては、効率を
考慮して、まず、サブ単語の終わりの形態を検査に選択
することが有利である。テキスト中を右に、すなわち後
方に移動するさらなるベクトルが一度に１個ずつベクト
ル列に導入される。あるいはまた、システムは、テキス
トに沿って元の方向に、例えば次の行にスキップし、ど
こで引用が終わるかを判断するまで、第二の言語固有規
則に照らして検査することもできる。引用が終わった地
点で、検査は、第二の言語固有規則が導入された地点ま
で逆方向に進み、右から左に読まれる言語のテキストの
全部分を認識したところで、システムは、第一の言語が
再開し、第一の言語固有規則が検索され、その後の検査
に使用されるところまで元の方向に先にスキップするこ
とができる。

【００５５】本方法の利点は、フォント独立性であるこ
と、書き手がどこで筆記を中断したかにかかわらずその
手書きを認識すること、言語固有規則に含まれるデータ
によってだけ限定されるタイプセットまたは重なった文
字、例えば飾り文字を扱うことを含む。

【００５６】

【図面の簡単な説明】

【図１】本発明の方法が適用される例であるアラビア語
の単語「ＲＩＪＡＬ」の骨格を示す図である。

【図２】骨格化した単語もしくはサブ単語を指向性ベク
トルの列にコード化するのに使用することができる８方
向の指向性ベクトルを示す図である。

【図３】図１に示すコード化された単語「ＲＩＪＡＬ」
を処理するための非決定性状態機械の状態を示す図であ
る。

【図４】本発明が言語固有規則を呼び出し、複数の言語
固有規則を利用して、ある言語固有規則が適用される各
言語の草書体テキストを認識する方法を示す高レベル・
フローチャートである。

【図５】本発明が言語固有規則を呼び出し、複数の言語
固有規則を利用して、ある言語固有規則が適用される各
言語の草書体テキストを認識する方法を示す高レベル・
フローチャートである。

【符号の説明】

１０第一のサブ単語１１第二のサブ単語１２第三のサブ単語１３二次的な特徴

───────────────────────────────────────────────────── フロントページの続き (72)発明者シャンシャール・エス・サィンアメリカ合衆国ミネソタ州ローチェスター 1507−34 ストリート (72)発明者バルドゥ・サァン・ソールカナダ国オンタリオ州マークハムブルーベルドライブ 37 (56)参考文献特開平４−296989（ＪＰ，Ａ) 特開平３−48379（ＪＰ，Ａ) 特開昭63−308690（ＪＰ，Ａ) 特開昭62−210595（ＪＰ，Ａ) 特開昭62−198993（ＪＰ，Ａ) 特開昭62−92090（ＪＰ，Ａ) 特開昭61−15287（ＪＰ，Ａ) 米国特許5151950（ＵＳ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/46 - 9/72 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】認識エンジンとして非決定性有限オートマ
トンを用いて、走査された画像から一つまたは複数の言
語で書かれた続け書きテキストを認識する方法であっ
て、（ａ）続け書きテキスト中の切れ目によって区切られて
いる単語の内部的に接続された部分の単位を一つの面に
おける指向性ベクトルの列としてコード化するステップ
と、（ｂ）最初に第一の言語固有規則を用いて、前記指向性
ベクトル列中のすべてのベクトルが文字列の認識に寄与
するまで前記指向性ベクトル列を再解析するステップ
と、（ｃ）可能な再解析をすべて行っても、前記指向性ベク
トル列中のすべてのベクトルが文字列の認識に寄与しな
い場合には、次に第二の言語固有規則を用いて前記指向
性ベクトル列を解析するステップと、を含むことを特徴とする、前記方法。