JP3208340B2 - 続け書きテキストを認識する方法 - Google Patents
続け書きテキストを認識する方法Info
- Publication number
- JP3208340B2 JP3208340B2 JP32963796A JP32963796A JP3208340B2 JP 3208340 B2 JP3208340 B2 JP 3208340B2 JP 32963796 A JP32963796 A JP 32963796A JP 32963796 A JP32963796 A JP 32963796A JP 3208340 B2 JP3208340 B2 JP 3208340B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- character
- word
- vector
- vector sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
Description
の光学式文字認識(OCR)の分野に関する。より具体
的には、本発明は、複数の言語のいずれかで筆記または
印刷されているテキストであって、アルファベットの文
字が、数は少ないものの、単語の中のそれらの位置に依
存して異なる形状をとり、さらに、それらの左側、右側
または両側で隣接する文字に接続していたり、いずれの
側でもまったく接続していなかったりするテキストのO
CRに関する。本発明はさらに、続け書き書体によって
表記されたある言語から別の言語への変換に関する。本
発明の方法は、認識の前に単語を文字にセグメント化し
ようとはしない。逆に、最初から最後までストロークも
しくは筆跡をたどったのち、初めて、単語(例えば英語
の手書きの場合)またはサブ単語もしくは単語(例えば
アラビア語を含む多くの言語の続け書き表記の場合)中
の文字の認識を試みる。本発明の重要な特徴は、サブ単
語が複数の言語で存在し、既存のテキストがいくつかの
言語を含むおそれがあることを認識すること、例えば、
引用部分がテキストの主要言語とは異なる言語で書かれ
ているという一般的な事象を認識することにある。
は、下記の米国特許である。
entation Mechanism for Cursive Script Character Re
cognition Systems」と題する第4,024,500号
em and Method for Segmentation and Recognition of
Patterns」と題する第4,654,873号
Spatial Segmenter for Handwritten Characters」と
題する第5,001,765号
entation Process for Machine Reading of Handwritte
n Information」と題する第5,101,439号
tus for Converting Handwritten Characters Onto Fin
ely Shaped Characters of Common Size and Pitch, Al
igned in an Inferred Direction」と題する第5,11
1,514号
od for Recognizing Handwritten Characters Using Sh
ape and Context Analysis」と題する第5,151,9
50号
od of Optical Character Recognition」と題する米国
特許第4,773,098号では、指向性ベクトル値を
文字の輪郭決定に割り当てることにより、個々の文字を
認識している。
acter Recognition Apparatus Having Means for Compr
essing Features Data」と題する米国特許第4,95
9,870号では、ヒストグラム値である成分を有する
特徴ベクトルを抽出、圧縮したのち、記憶された標準文
字の圧縮特徴ベクトルと突き合わせている。
de Sequence Matching Method andApparatus」と題する
米国特許第4,979,226号は、文字認識のため
の、入力パターンからのコード列の抽出および基準コー
ド列との比較を教示している。
acter Recognition by Linear Traverse」と題する米国
特許第3,609,685号は、文字の形状を細線化し
て、線の一つの集合によって表されるようにし、それを
番号付きの指向性ベクトルの組み合わせに変換し、指向
性ベクトルの集合を簡約して冗長な連続する同一要素を
除く文字認識を教示している。
od of Handwriting Recognition」と題する米国特許第
5,050,219号は、次のように要約されている。
跡の要素に適用して、この筆跡もしくはそれらの要素の
いくつかの特徴を決定し、そのようにして決定した特徴
を、既知の手書きの要素を表す特徴と比較し、それらの
特徴の比較が所定の結果を出すならば、筆跡の一つの要
素を手書きの一つの既知の要素と同定することからなる
手書き文字認識方法において、規準を筆跡要素に当ては
めることにより、一連の所定の操作段階を所定の特徴に
したがって設定することを特徴とする方法」
れも、すべての文字が認識されたのちベクトルが未使用
のまま残る、内部的に接続されたテキスト筆跡の単位を
扱う方法または一つの文書または一つの頁の中で多数の
言語の出現を扱う方法を教示してはいない。
スト筆跡のコード化された単位を一つの面における一連
の方向(ベクトル列)として使用しながら、単位をサブ
単語として認識し、テキスト筆跡中のすべてのベクトル
を使用して、認識される文字または言語の断片を作りだ
し、ベクトル列を、一つまたは複数の言語固有規則に照
らして検査すると、より効率な文字認識が達成されるこ
とが見いだされた。
示する前にそれを構成文字にセグメント化しないなら
ば、認識の前でかつテキスト画像の取得ならびにノイズ
軽減およびろ過の後での前処理の量が減ることが見いだ
された。したがって、テキスト画像に固有の自然なセグ
メント化(単語およびサブ単語の間の空間による)が固
守され、利用される。
キスト中の切れ目によって区切られている、すなわち、
連続する文字が連字記号によって結ばれていない、単語
の内部的に接続された部分をいう。サブ単語は、長いと
きには単語全体であることもでき、短いときには1文字
であることもでき、さらには、例えば、文字が二次的特
徴を含むならば、その文字の一部であることもできる。
第2139094号に記載のような、平面的指向性ベク
トルの列からなる取得されたテキスト画像を、認識エン
ジンにより、内部的に接続されたサブ単語の塊で分析
し、続け書きテキストを解析し、連続するサブ単語を認
識するごとに文字マーカを入れ、テキストの接続された
サブ単語を認識した後に未使用のベクトルが残るなら
ば、ベクトル列中の各ベクトルがテキストの文字の認識
に寄与するまで、文字マーカを一度に1ベクトルずつ前
または後に動かすことによってそのテキストを再解析す
る中間ステップを有する、複数言語の文字を含み得る公
知の光学式文字認識方法に対する改良を提供する。認識
エンジンはさらに、第一の言語固有規則を使用し、第一
の言語固有規則中の項目をチェックし終わったのち、特
定のサブ単語が認識されないならば、そのサブ単語が認
識されるまで、そのサブ単語を第二の言語固有規則と比
較する。
書かれた続け書きテキストを、走査された画像から認識
するための装置であって、指向性ベクトル列中のすべて
のベクトルが認識に寄与した場合にのみ、そのベクトル
列を文字として認識するための手段と、指向性ベクトル
列中のすべてのベクトルが認識に寄与するまでそのベク
トル列を再解析するための手段と、少なくとも二つの言
語固有辞書と、指向性ベクトル列を言語固有辞書と比較
するための手段とを含む装置を提供する。方法のステッ
プを実行するためにコンピュータを制御するためのコー
ドは、適当な媒体、例えば磁気記憶ディスケットまたは
プログラム可能読出し専用メモリにプログラムすること
ができる。
書かれた続け書きテキストを、走査された画像から認識
するための、指向性ベクトル列中の各ベクトルが少なく
とも一つの言語固有規則からのテキストの文字の認識に
寄与するまで文字マーカを一度に1ベクトルずつ動かす
ことにより、指向性ベクトルの列を再解析するステップ
を含む方法を実行するためにコンピュータによって実行
可能であるプログラム・コードを含むコンピュータ使用
可能媒体を提供する。このようなコードの記憶に適した
媒体の例は、磁気的にコード化されたディスク、光学的
にコード化されたディスク(ある形態は一般にCD−R
OMと呼ばれる)、固定ディスク・ドライブならびにE
PROM、EEPROMおよびフラッシュ・メモリ・カ
ードをはじめとするプログラム可能読出し専用メモリで
ある。そのようなコードは、適当な形態、例えば二進化
形態で、局所的もしくは広域的なネットワークまたは共
用の電子的伝送ネットワーク、例えばインターネットに
載せて容易に伝送することができる。
書かれた続け書きテキストを、走査された画像から認識
するためのプログラム・コード手段を含むコンピュータ
使用可能媒体を含むコンピュータ・プログラム製品であ
って、コードが、コンピュータをしてテキスト筆跡をベ
クトルとしてコード化させるためのコード手段と、ベク
トル列中のすべてのベクトルが認識に寄与した場合にの
み、そのベクトル列を文字として認識するための手段
と、文字マーカを移動させることによってベクトル列を
再解析するための手段と、一つ以上の言語固有規則を設
けるための手段と、ベクトル列の各要素を規則と比較す
るための手段と、第一の規則で一致がみられないなら
ば、ベクトル列の各要素を第二の言語固有規則と比較す
るための手段とを含むコンピュータ・プログラム製品を
提供する。このコンピュータ・プログラム製品は、コー
ドを記憶し、記憶されたコードを伝送するのに適した好
都合な製品、例えば磁気的もしくは光学的にコード化さ
れたディスクまたはEPROM、EEPROMもしくは
フラッシュ・メモリ・カードをはじめとするプログラム
可能読出し専用メモリであることができる。
認識したならば、その第一の言語の辞書を、その言語に
おいて一致をみることができなくなるまで使用し続け
る。そののち、認識可能な文字を見いだすまで、別の言
語において認識を試みる。したがって、セグメント化の
前の言語および書かれたテキストの認識は、非決定性で
あり、テキストそのものによって指図される。
は、当該技術に公知の方法にしたがって処理することよ
って、すなわち、以下のようなデジタル化テキスト画像
のノイズ軽減およびろ過によって得られる。
線化もしくは骨格化する(とりわけ、例えば、T. Wakay
amにより「A case line tracing algorithm based on m
aximal square moving」と題する論文(IEEE Transacti
ons on Pattern Recognitionand Machine Intelligenc
e, VOL PAMI-L1, No. 1, pp. 68-74)で教示された方法
による)。 (b)デジタル化した画像の逐次データ流により、細線
化した画像を、筆跡の方向の流れを表す指向性ベクトル
に変換する(例えば、「フリーマン・コード」により、
指向性ベクトルを骨格の各要素に割り当てる)。 (c)少なくとも一つの簡約規則を指向性ベクトルの列
に適用して、その長さを減らし、単語もしくはサブ単語
の簡約表示を生成する。好ましい実施態様における一つ
の簡単な簡約規則は、同一の指向性ベクトルの直後の指
向性ベクトルを捨てるように規定している。この規則
は、ベクトル列に帰納的に適用することができ、それを
相当に簡約する。
されたならば、指向性ベクトル列の言語に応じた同定が
始まる。例えば、第一の辞書中の言語の言語固有文法規
則は、そのもっとも簡約された指向性ベクトル列によっ
て各アルファベット文字を定義する参照テーブルを含む
であろう。さらなる言語固有規則が、いずれかの側で接
続性を制限することもできるし、文字の二次的特徴、例
えば点(アラビア語の場合)またはアクセント符号(フ
ランス語の場合)を指定することもできる。したがっ
て、所与の言語について最適な文法規則に到達するまで
にいくらかの実験が必要になることが明らかである。文
法規則は、個々の書き手の癖に対する備えを含むことも
できる。例えば、人によってはアルファベットの一部を
筆記体で書き、いくつかの文字を活字体で書く。英語の
肉筆では「r」や「s」は一般に活字体で書かれる。第
二の例は、書き手によっては「t」を書く際、水平方向
のストロークを垂直方向のストロークと交差させず、そ
れにより、さらなるサブ単語を作り出す場合である。も
う一つの実施態様では、本発明は、以下に説明する方法
でアクセスされる第二の言語固有規則を提供する。
ができたアラビア語の単語「RIJAL」の骨格が示さ
れている。当然ながら、この単語は、実際には、画像マ
トリックスの要素を表すデータ流として提供される。図
1から見てとれるように、この単語は4個の独立したサ
ブ単語を有している。第一のサブ単語10は、単にアラ
ビア語文字「Ra」であり、第二のサブ単語は、2個の
文字「Geem」および「Alef」11であり、第三
のサブ単語は文字「Lam」12であり、第四のサブ単
語は、二次的な特徴(SF)13であって、サブ単語1
1における「Geem」の下の「点」である。
1のサブ単語に当てはめる結果、第一のサブ単語10に
ついて下記のようなベクトル列が得られる。
ためには、8個以上、例えば16個、32個またはそれ
以上の指向性ベクトルを用いることが有利であるかもし
れない。しかし、8方向でも円の形を近似することが可
能であり、これが大部分の用途に求められる最少数であ
る。同一の指向性ベクトルの二個目以降を捨てるという
簡約規則の例を適用することにより、順次、上記ベクト
ル列は次のように簡約される。
ド化文字列に簡約される。
8、1、$)、(SF)、(5、6、7、8、1、$)
この状態機械が、「Start」から、q0からq1
(5)へ、q1からq2q(6)へ、そしてq2からq
3(7)への遷移を進む。第一のサブ単語10はq3で
終了し、ベクトル「5、6、7」が文字「Ra」と同定
され、かつ、「$」の前に指向性ベクトルが残らないの
で、q3状態は決定性の「受理状態」である。
単語10を1個の文字(Ra)と同定する。第二の文字
列(q4からq9に進むことによって得られる)は、2
個の文字からなるもう一つのサブ単語11である。(S
F)は、二次的特徴の存在を示す。本システムは、文字
列がシステム・スタックにプッシュされたとき、その文
字列を受理しようとする。文字列「3、4、3、7」は
1個の文字であり、他の文字列「8、1」は別の文字で
ある。以下にスタック処理シーケンスを記す。
は、その前のベクトル列(すなわち、その前の文字)の
受理を示すマーカである。
る。この第三の文字列は1個の文字を表すものである
が、2個の文字列(5、6、7)、(8、1)に分割す
ることができる。スタック処理は次のようになる。
照すると、(5、6、7)の文字列は、その左側で他の
文字に接続することができない別個の文字(「ale
f」)であるという結果になった。(8、1)の文字列
もまた別個の文字であるが、処理が終了したとき、スタ
ックが空ではない。したがって、何か続くものがある。
よって、この結果を受理することはできない。その場
合、システムは、前に解析した文字列を適応的に拡張し
て(5、6、7、8、1)にし、その新たな文字列を認
識しようと試みる。これで、この第三のサブ単語の正し
い解釈が得られる。
の前に、適用された要素を適応的に解析し、言語の自然
な空間的解析に従う。
向性ベクトルの列に変形される。認識プロセスは、この
リストの要素が、本明細書では非決定性有限オートマト
ンと呼ぶ状態機械に送られたときに始まる。非決定性有
限オートマトンは、この指向性ベクトル列を、初期状態
から最終状態まで進行する(このベクトル列に基づく)
事前に定義された遷移状態が存在する場合に、また、そ
のような場合にのみ受理する。これが非決定性状態機械
であるという事実が、入力されたベクトル列に依存して
すべての入力を受理する融通性につながる。非決定性有
限オートマトンから構成された決定性有限状態機械を有
することは異例なことではない。しかし、この場合、そ
のような決定性有限オートマトンは、2のQ乗(Qは機
械における状態の数である)という多数の状態を含むで
あろう。しかし、これらの状態すべてを使用する必要は
ない。これは、非決定性有限オートマトンの内部で利用
される。
トマトンが、所与のアルファベットで形成されるすべて
の可能な単語を、たとえ形成されるそのような「単語」
のいくつかが無意味であり、よって受理できないとして
も、包含するということである。これは、例えば辞書の
使用によって扱うことができる。認識は、走査されたの
ち細線化されて指向性ベクトルを生成する画像に基づく
ため、非決定性有限オートマトンの生成規則は、システ
ムに対し、この形成を受理するか拒否するかのいずれか
を許す。文字列を拒否する可能性は理解することができ
る。しかし、文字列を拒否する前に非決定性有限オート
マトンが試みることは、その文字列をフォーマットし直
して、より多数または少数の入力要素を用いてその文字
列を受理することができないかどうかを調べることであ
る。非決定性有限オートマトンのこの適応性が、非決定
性有限オートマトンを、認識エンジンとして、またその
認識速度において、非常に強力なものにする。
オートマトンのアプローチを具現化するための高レベル
・フローチャートを示す。このフローチャートは、一つ
以上の言語固有文法規則を使用する際の本発明の方法を
特に説明する。規則は、好都合な媒体、例えば固定ディ
スク・ドライブに記憶し、アクセスすることができる。
アラビア語の場合のこのような規則の例(疑似コードで
記載)を以下に記す。
各言語固有規則が、各文字の少なくとも一つの表示を含
み、その表示を近似するベクトル列が特定の文字として
認識されうるようにしなければならないことが明白であ
ろう。場合によっては、1個以上の文字の代替表示を言
語固有規則に設けて、異なる書き手の筆記スタイルが紙
面上で所与の文字を表す種々の書き方を受け入れること
もできる。例えば、英語では、小文字の「r」は、人に
よっては、ほとんどタイプされた文字の形に活字体で書
くこともあるし、人によっては、ゴシック体または黒字
体で筆記することもある。このように、いずれのスタイ
ルの書き方も、文字「r」として認識されるであろう。
以下、英単語「eat」を処理する方法を例示する。
れたならば、以下のベクトル列が現れる。
3,2,1,5,3,7,5,4,3,EOF
な単語であるわずか1個のサブ単語を表すものであるこ
とに注意すること。認識スキームが始まると、最初の文
字、すなわち「e」が解析され、最初のベクトル列
(2、4、6、7)をあいまいに文字「0」と同定する
ことができる。しかし、次のベクトル列(5、4、3、
2)は認識されず、したがって、文字「e」を得ること
ができる。ベクトル列が続くにつれ、あいまいさは増大
する。簡約および言語の規則に依存して、第二のベクト
ル列(2、3、4、8、7、6、5、4、3、1、5)
を「a」、「u」または「o」のいずれかと同定するこ
とができる。このような状況は通常、言語規則を充実さ
せることにより、1個以上のベクトル列を追加して文字
を同定することによって扱われる。多大なあいまいさを
呈する続け書きテキストに対しては、このような手順は
通常である。
に、本発明は、アラビア語の規則によって上記に例示し
た第一の言語固有規則と動作において類似している、第
二の言語固有規則を設ける。第一の言語固有規則と同
様、これらの規則は、いかなる好都合な媒体に記憶して
もよい。これらは、好都合かつ効率的な手段または方
法、例えばそれらの一部または全部を、本方法を実行す
るのに使用されるコンピュータの動作メモリにロードす
ることにより、検査ステップに取り込むことができる。
第二の言語固有規則は、オペレータが導入することもで
きるし、コンピューティング・システムが自動的に提供
することもできる。オペレータが、所与のテキスト中に
どの言語が使用されるのかを調査から知っている場合、
オペレータの介入が貴重であるかもしれない。その場
合、オペレータは、システムが言語固有規則を検査のた
めに取り込む順序を選択することができる。例えば、オ
ペレータが、主なテキストがアラビア語で書かれてお
り、しかも英語での引用が含まれていることを知ってい
るならば、アラビア語を第一の言語固有規則として選択
し、英語を第二の言語固有規則として選択することがで
きる。あるいはまた、システムをそのままにして、言語
固有規則に対して無作為に検査させ、場合によっては、
成果のあった規則のリストを何らかの好都合な手段によ
って保持させることもできる。
tart」101から、前処理されたベクトル列をもっ
て始まる。第一のステップ102は、適当な記憶媒体か
ら言語固有規則を検索することである。検索される第一
の言語固有規則が、認識されるテキスト中で遭遇する可
能性がもっとも高い規則であるようにシステムを設定す
ることが有利である。しかし、上述したように、システ
ムは、多数の言語固有規則を用いることができるため、
オペレータは、特定の言語固有規則を事前に選択する必
要はない。好ましくは、一つの言語固有規則がデフォル
トとしてシステムに設けられる。次に、システムは、ス
テップ103で、前処理されたベクトル列から次のベク
トルを取得し、それをアプリケーション・スタックに置
く。さらにステップ104で、システムは、スタック上
のベクトル列を言語固有規則と比較し、判定ステップ1
05でそのベクトル列が文字として認識されたならば、
ステップ106で受理マーカをスタックに置き、先に進
む。判定ステップ105でベクトル列が文字として認識
されないならば、受理マーカはスタックに置かれない。
いずれの場合にも、次にシステムは、判定ステップ10
7で、好ましい実施態様では上記のように$によって示
されるサブ単語の終わりを検査する。サブ単語の終わり
に達していなければ、システムは、ステップ103に戻
り、次のベクトルを取得し、それをアプリケーション・
スタックに置く。サブ単語の終わりに達しているなら
ば、システムは、判定ステップ108で、すべてのベク
トル列が認識されたかどうか、すなわち、サブ単語の終
わりの直前に受理マーカがあるかどうかを判定する。
「Yes」ならば、システムは、入力の終わりに達した
かどうかをチェックし、達していなければ、ステップ1
03の入り口点に戻る。入力の終わりに達しているなら
ば、ステップ110で処理が終了する。
8ですべてのベクトル列が認識されてはいないならば、
システムは、図5に111として示す入り口点Wに進
む。ステップ112で、システムは、受理マーカをベク
トル1個分だけ先に移す。例えば、ベクトル列が「5、
6、7、A、8、1、$」であるならば、受理マーカを
移動すると、列「5、6、7、8、A、1、$」が生成
される。ステップ113で、スタック上のベクトル列が
一番上から受理マーカの直前の位置まで再解析される。
あるいはまた、検査中のベクトル列が最新の受理マーカ
に続くベクトル列であるならば、そのベクトル列は、前
の受理マーカから現在位置、すなわち、アプリケーショ
ン・スタックに置かれた最後のベクトルまで再解析され
る。判定ステップ114で、システムは、ベクトル列が
認識されたかどうか、すなわち、サブ単語の終わりの直
前に受理マーカがあるかどうかを検査する。答えが「Y
es」ならば、ステップ115でその文字が受理され、
システムは、図4のステップ109への入り口点である
ポイントZに戻る。
らば、システムは、判定ステップ116で、特定の言語
固有規則の可能なすべての組み合わせをチェックしたか
どうかを検査する。チェックすべき組み合わせが残って
いれば、システムは、ステップ111への入り口点に戻
る。他方、第一の言語固有規則中のすべての組み合わせ
を検査し、チェックし終わっているならば、システム
は、判定ステップ117で、利用可能な言語固有規則を
すべて参照したかどうかを判定する。すべてを参照して
はいない、すなわち、検査を試みるべきさらなる言語固
有規則があるならば、システムは、ステップ118で、
次の言語固有規則を検索し、図4のステップ104への
入り口点であるXに戻る。参照すべきさらなる言語固有
規則がないならば、ステップ119で、認識されないベ
クトル列が好都合な記号、例えばアスタリスク記号
(*)によって示され、システムは、ステップ120
で、デフォルトの言語固有規則に戻り、図4のステップ
109への入り口点であるZに進む。
ベクトルが残ったならば、本発明は、第二の言語固有規
則に対して、認識されていない残りのベクトルの最初の
ものから出発し、以前と同様にベクトルを1個ずつ加え
ることにより、検査を始める。突き合わせが見いだされ
ると、上記に論じたように、文字マーカを挿入し、より
多くのベクトルを、好ましくは第二の言語固有規則に対
する検査に加える。検査は、利用できる言語固有規則の
いずれに照らしても実施することができる。しかし、後
続のベクトル列中に見いだされる可能性がもっとも高い
言語が前のベクトル列の言語であるため、まず、ベクト
ル列に対して突き合うことがもっとも最近に見いだされ
た言語固有規則に照らして検査することが有利であるか
もしれない。
テキストの他の部分とは異なる方向、例えば右から左の
方向に現れるテキストを使用しているならば、突き合わ
せが見いだされるまで、第二の言語固有規則が逆方向に
使用される。例えば、英文テキスト中にヘブライ語での
引用が見いだされるならば、ベクトル列は、英語におけ
る突き合わせを見いだすことなく、いくつかのベクトル
を蓄積する。これは、未使用のサブ単語中のベクトルの
すべてを有するサブ単語の終わりに達する。したがっ
て、第一の言語固有規則は突き合わせがないままチェッ
クし終わり、突き合わせを求めて第二の言語固有規則が
チェックされる。例えば、第二の言語固有規則が偶然に
ヘブライ語であるならば、言語固有規則の一つは「右か
ら左に読む」ということであろう。この規則は、突き合
わせが見いだされるまで、ベクトルを読み込み順序で逆
にする。文字がサブ単語中のその位置に依存していくつ
かの形態を有することができる言語においては、効率を
考慮して、まず、サブ単語の終わりの形態を検査に選択
することが有利である。テキスト中を右に、すなわち後
方に移動するさらなるベクトルが一度に1個ずつベクト
ル列に導入される。あるいはまた、システムは、テキス
トに沿って元の方向に、例えば次の行にスキップし、ど
こで引用が終わるかを判断するまで、第二の言語固有規
則に照らして検査することもできる。引用が終わった地
点で、検査は、第二の言語固有規則が導入された地点ま
で逆方向に進み、右から左に読まれる言語のテキストの
全部分を認識したところで、システムは、第一の言語が
再開し、第一の言語固有規則が検索され、その後の検査
に使用されるところまで元の方向に先にスキップするこ
とができる。
と、書き手がどこで筆記を中断したかにかかわらずその
手書きを認識すること、言語固有規則に含まれるデータ
によってだけ限定されるタイプセットまたは重なった文
字、例えば飾り文字を扱うことを含む。
の単語「RIJAL」の骨格を示す図である。
トルの列にコード化するのに使用することができる8方
向の指向性ベクトルを示す図である。
を処理するための非決定性状態機械の状態を示す図であ
る。
固有規則を利用して、ある言語固有規則が適用される各
言語の草書体テキストを認識する方法を示す高レベル・
フローチャートである。
固有規則を利用して、ある言語固有規則が適用される各
言語の草書体テキストを認識する方法を示す高レベル・
フローチャートである。
Claims (1)
- 【請求項1】認識エンジンとして非決定性有限オートマ
トンを用いて、走査された画像から一つまたは複数の言
語で書かれた続け書きテキストを認識する方法であっ
て、 (a)続け書きテキスト中の切れ目によって区切られて
いる単語の内部的に接続された部分の単位を一つの面に
おける指向性ベクトルの列としてコード化するステップ
と、 (b)最初に第一の言語固有規則を用いて、前記指向性
ベクトル列中のすべてのベクトルが文字列の認識に寄与
するまで前記指向性ベクトル列を再解析するステップ
と、 (c)可能な再解析をすべて行っても、前記指向性ベク
トル列中のすべてのベクトルが文字列の認識に寄与しな
い場合には、次に第二の言語固有規則を用いて前記指向
性ベクトル列を解析するステップと、 を含むことを特徴とする、前記方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CA002166248A CA2166248C (en) | 1995-12-28 | 1995-12-28 | Optical character recognition of handwritten or cursive text |
| CA2166248 | 1995-12-28 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09218923A JPH09218923A (ja) | 1997-08-19 |
| JP3208340B2 true JP3208340B2 (ja) | 2001-09-10 |
Family
ID=4157248
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP32963796A Expired - Fee Related JP3208340B2 (ja) | 1995-12-28 | 1996-12-10 | 続け書きテキストを認識する方法 |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP3208340B2 (ja) |
| CA (1) | CA2166248C (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7724957B2 (en) * | 2006-07-31 | 2010-05-25 | Microsoft Corporation | Two tiered text recognition |
| US8194983B2 (en) * | 2010-05-13 | 2012-06-05 | Hussein Khalid Al-Omari | Method and system for preprocessing an image for optical character recognition |
| US8218875B2 (en) * | 2010-06-12 | 2012-07-10 | Hussein Khalid Al-Omari | Method and system for preprocessing an image for optical character recognition |
| CN102880874B (zh) * | 2012-09-29 | 2016-04-13 | 重庆新媒农信科技有限公司 | 字符识别方法和字符识别器 |
| JP6655331B2 (ja) | 2015-09-24 | 2020-02-26 | Dynabook株式会社 | 電子機器及び方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5151950A (en) | 1990-10-31 | 1992-09-29 | Go Corporation | Method for recognizing handwritten characters using shape and context analysis |
-
1995
- 1995-12-28 CA CA002166248A patent/CA2166248C/en not_active Expired - Fee Related
-
1996
- 1996-12-10 JP JP32963796A patent/JP3208340B2/ja not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5151950A (en) | 1990-10-31 | 1992-09-29 | Go Corporation | Method for recognizing handwritten characters using shape and context analysis |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH09218923A (ja) | 1997-08-19 |
| CA2166248A1 (en) | 1997-06-29 |
| CA2166248C (en) | 2000-01-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6370269B1 (en) | Optical character recognition of handwritten or cursive text in multiple languages | |
| US10846523B2 (en) | System and method of character recognition using fully convolutional neural networks with attention | |
| JP3272842B2 (ja) | プロセッサベースの判定方法 | |
| US5029223A (en) | Constraint driven-on line recognition of handwritten characters and symbols | |
| Hu et al. | Writer independent on-line handwriting recognition using an HMM approach | |
| JP3664550B2 (ja) | 文書検索方法及び装置 | |
| US5438630A (en) | Word spotting in bitmap images using word bounding boxes and hidden Markov models | |
| US5862251A (en) | Optical character recognition of handwritten or cursive text | |
| EP1630723A2 (en) | Spatial recognition and grouping of text and graphics | |
| WO2018090011A1 (en) | System and method of character recognition using fully convolutional neural networks | |
| EP0602956A2 (en) | Text recognition | |
| Kim et al. | Bankcheck recognition using cross validation between legal and courtesy amounts | |
| Bilgin Tasdemir | Printed Ottoman text recognition using synthetic data and data augmentation: EF Bilgin Tasdemir | |
| Husain et al. | A multi-tier holistic approach for Urdu Nastaliq recognition | |
| JP3208340B2 (ja) | 続け書きテキストを認識する方法 | |
| Procter et al. | Cursive handwriting recognition using hidden Markov models and a lexicon-driven level building algorithm | |
| US6094484A (en) | Isomorphic pattern recognition | |
| EP0602955B1 (en) | Text recognition | |
| Sharma et al. | Gujarati script recognition | |
| Reul et al. | Automatic Semantic Text Tagging on Historical Lexica by Combining OCR and Typography Classification: A Case Study on Daniel Sander's Wörterbuch der Deutschen Sprache | |
| Pourreza et al. | Sub-word based Persian OCR using auto-encoder features and cascade classifier | |
| Kim et al. | A segmentation and recognition strategy for handwritten phrases | |
| Alhubaiti et al. | Typefaces and ligatures in printed Arabic text: a deep learning-based OCR perspective | |
| Shinde et al. | Text Extraction from Document Images using CNN and LSTM | |
| Keo et al. | State-of-the-Art Khmer Text Recognition Using Deep Learning Models |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070706 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080706 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080706 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090706 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100706 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110706 Year of fee payment: 10 |
|
| LAPS | Cancellation because of no payment of annual fees |