JP2899356B2

JP2899356B2 - 文字認識装置

Info

Publication number: JP2899356B2
Application number: JP2102578A
Authority: JP
Inventors: 明子鈴木
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1990-04-18
Filing date: 1990-04-18
Publication date: 1999-06-02
Anticipated expiration: 2014-06-02
Also published as: JPH04687A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、文字認識装置に関する。

〔従来の技術〕

一般に文字認識においては、前処理として、入力文字
画像のサイズの正規化を行う。この文字サイズ正規化の
基本的な手法として、第５図に示すように画素を一定の
間隔で抽出し、その他の画素を捨てることによって入力
文字画像よりサイズの小さい正規化文字画像を生成する
間引き正規化と、第６図に示すように、一定間隔内の画
素の論理和（OR）をとることによって、入力文字画像よ
りサイズの小さい正規化文字画像を生成するOR正規化が
ある。

しかし、間引き正規化によれば細い線分の消失または
“かすれ”が起こりやすく、またOR正規化によれば細い
空白の“潰れ”が起こりやすく、これにより誤認識が生
じやすい。

このような問題に関しては、入力文字画像中の線分の
細い部分を検出し、この部分に少なくとも１画素を追加
してから間引き正規化を行うことにより、線分の消失ま
たは“かすれ”を防ぐ手法（特開昭60−126780号）や、
入力文字画像をそのままOR正規化した画像と、入力文字
画像を水平、垂直の各方向へ１画素分ずらしてOR正規化
した画像の論理積をとることで、文字内の空白の“潰
れ”を防ぐ手法（特開昭60−110086号）も提案されてい
る。

しかし、いずれの手法も正規化サイズの２倍より大き
な文字画像に適用しようとすると、処理が複雑化すると
ともに十分な効果が得られないなどの問題がある。

また、パターンマッチング等の手法により文字の認識
を行う場合、フォントの相違や入力原稿のコピー処理等
による字形の変化等によって誤認識が生じることがあ
る。そこで、認識結果の下位候補との距離の差などの情
報を用いて誤認識を判定したり、文字画像を濃度（２値
化閾値）を変えて読み取って認識し、それぞれの濃度に
対する認識結果の相違を用いて誤認識の判定を行う方法
などが提案されている。

しかし、距離の差は文字の複雑さによって、その基準
が大きく異なること、また、濃度の違う画像を得るには
処理時間及びメモリの負担が大きいという問題がある。

〔発明が解決しようとする課題〕

本発明の目的は、漢字OCR等において、複数の画像の
読込みや異なる濃度レベルでの２値化処理の手間をなく
し、且つ、比較的単純な基準を用いることで簡単に認識
結果の確からしさを算出できるようにして、比較的簡単
な処理でもって高い認識率の達成を可能にすることにあ
る。

〔課題を解決するための手段〕

本発明による文字認識装置は、入力文字画像に対し線
分の細め処理をその強さを変えて施し、それぞれの細め
処理後の文字画像を論理和演算により正規化して一つの
入力文字画像に対し複数の正規化文字画像を生成する正
規化処理部と、該正規化処理部により得られた各入力文
字画像の複数の正規化文字画像のそれぞれについて文字
認識を行う文字認識部と、該文字認識部により各入力文
字画像に対して得られた複数の認識結果から、例えば多
数決によって最終的な認識結果を選択する認識結果判定
部とを具備することを特徴とする。

〔作用〕

本発明によれば、線分の細め処理をしてから論理和演
算による正規化すなわちOR正規化を行うので、細め処理
の強さが適切であれば、OR正規化の弱点である細い空白
の潰れを減らし、かつ線分の“かすれ”や消失が生じに
くいというOR正規化の長所を保存することができる。

この最適な細め処理の強さは文字画像のサイズ、読取
り濃度、読取りスキャナの特性、フォントの種類等によ
って異なるが、これらは予め予想できない場合が多いの
で、入力原稿に応じて細め処理の強さを自動的に最適化
しようとすると、面倒な処理が必要となる。

本発明では、複数の正規化画像の各認識結果を同一の
入力画像から得ることにより、複数の画像の読込みや異
なるレベルでの２値化処理の手間が省略でき、また、各
認識結果より多数決等の単純な基準によって最終的な認
識結果を決定するので、比較的簡単な処理でもって高精
度の認識が可能である。

〔実施例〕

第１図は本発明の一実施例に係る文字認識装置のブロ
ック図である。

原画像入力部１（ファイル、スキャナ等）から入力し
た原稿の画像データより、文字切出し部２で１文字分の
文字画像を切出し、入力文字画像として画像メモリ３内
の文字画像バッファ４に格納すると同時に、その文字サ
イズ等の情報を正規化処理部５へ渡す。

正規化処理部５においては、細め処理制御部６の制御
の下で、例えば３種類の違った強さの細め処理を入力文
字画像に施した文字画像を細め処理部７で求め、各細め
処理文字画像に対しOR処理部８で論理和演算を施すこと
により、一つの入力文字画像に対して３個の正規化文字
画像を生成し、これを画像メモリ３内の正規化画像バッ
ファ９に格納する。

文字認識部10では、各正規化後文字画像について文字
認識を実行し、各々の認識結果（本実施例では３個）を
認識結果判定部11へ渡す。

認識結果判定部11では、渡された認識結果より多数決
によって最終的な認識結果を決定する。また、その認識
結果の確からしさを例えば次式［確からしさ（％）］＝［同じ結果の個数］÷［全結果数］×100 で計算する。そして、最終的な認識結果と確からしさの
情報を出力する。

細め処理部７の内部処理について第２図及び第３図に
より説明する。この処理は上から下、下から上、左から
右、右から左、の４方向から可能である。

第２図は上から下への方向の処理の説明図である。上
から下へ画素を見ていき、その方向へ黒画素が２個以上
重なっている部分では、その一番上の黒画素を白画素に
置き換える（黒画素を１個削る）。この例では、↓印の
部分の一番上の黒画素が消されるが、○印の部分の黒画
素は１個だけであるので消さない。

第３図は下から上への方向の処理の説明図である。こ
の場合、下から上へ黒画素が２個以上重なっている部分
（↑印の部分）では一番上の黒画素を消すが、○印の部
分では黒画素が１個であるので消さずに残す。このよう
な処理により、線分のとぎれを発生させずに、横方向の
線分を細めることができる。

左右方向の細め処理も同様であり、線分のとぎれを発
生させずに、縦方向の線分を細めることができる。

このような処理を、細め処理制御部の制御下で必要な
細め処理の強さになるまで方向別に繰り返した結果が細
め処理画像としてOR処理部８へ送られることになる。

例えば細め処理制御部６では、文字切出し部２より与
えられた文字サイズ情報より、Ｎ＝縦方向文字画像サイズ／正規化画像サイズを計算
し、細め処理部７で縦方向に内部処理をＮ回行った結果を
１回目の細め処理文字画像としてOR処理部８へ渡し、次
に横方向にのみ内部処理をＮ回行った結果を２回目の細
め処理文字画像としてOR処理部８へ渡し、縦方向及び横
方向にそれぞれＮ回の内部処理を行った結果を３回目の
細め処理文字画像としてOR処理部８へ渡すように制御を
行う。

なお、細め処理部７の内部処理は、上から下への処理
と下から上への処理を交互に行う。左右方向の処理も同
様に交互に行う。このように反対方向の処理を交互に行
うと、細め処理による画像の歪みの影響を分散させる効
果がある。

この場合、例えば第４図（ａ）の“間”の文字画像に
対し、縦方向の細め処理を１回以上、横方向の細め処理
を１回以上、縦と横方向の細め処理を１回以上それぞれ
行った画像は、第４図（ｂ），（ｃ）及び（ｄ）に示す
ような画像となる。そして、これらの細め処理画像のOR
正規化画像に対する認識結果がそれぞれ“間",“問",
“間”となったとすると、多数決により最終的に認識結
果は“間”に決定され、その確からしさは66.6％とな
る。

なお、細め処理の方向を変化させず（横方向だけ、縦
方向だけ、あるいは縦横両方向）、その方向の削除する
ドット数（細め処理部７の内部処理回数）の増減によ
り、細め処理の強さを変えることもできる。

〔発明の効果〕

以上の説明から明らかなように、本発明によれば、複
数の画像の読込みや読取り濃度あるいは２値化閾値を変
えて文字画像の入力を繰り返すというような処理時間や
メモリの増加を招く処理を必要とせずに、また入力原稿
の文字の太さやフォントの違い等を意識せずに、より高
い精度の文字認識が可能となり、また単純な基準（認識
結果の相違あるいは同じ認識結果の個数）によって認識
結果の確からしさの情報を得ることができる。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロック図、第２図は上から下への方向の細め処理の説明図、第３図は下から上への方向の細め処理の説明図、第４図は入力文字画像と細め処理画像の例を示す図、第
５図は間引き正規化の説明図、第６図はOR正規化の説明
図である。１…原画像入力部、２…文字切出し部、３…画像メモ
リ、４…文字画像バッファ、５…正規化処理部、６…細
め処理制御部、７…細め処理部、８…OR処理部、９…正
規化画像バッファ、10…文字認識部、11…認識結果判定
部。

Claims

(57)【特許請求の範囲】

【請求項１】入力文字画像に対し線分の細め処理をその
強さを変えて施し、それぞれの細め処理後の文字画像を
論理和演算により正規化して一つの入力文字画像に対し
複数の正規化文字画像を生成する正規化処理部と、該正
規化処理部により得られた各入力文字画像の複数の正規
化文字画像のそれぞれについて文字認識を行う文字認識
部と、該文字認識部により各入力文字画像に対して得ら
れた複数の認識結果から最終的な認識結果を選択する認
識結果判定部とを具備する文字認識装置。
【請求項２】認識結果判定部は、一つの入力文字画像に
対して生成された複数の正規化文字画像のそれぞれの認
識結果より多数決により最終的な認識結果を選択するこ
とを特徴とする請求項（１）記載の文字認識装置。