JP2899356B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP2899356B2 JP2899356B2 JP2102578A JP10257890A JP2899356B2 JP 2899356 B2 JP2899356 B2 JP 2899356B2 JP 2102578 A JP2102578 A JP 2102578A JP 10257890 A JP10257890 A JP 10257890A JP 2899356 B2 JP2899356 B2 JP 2899356B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- character image
- processing
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置に関する。
一般に文字認識においては、前処理として、入力文字
画像のサイズの正規化を行う。この文字サイズ正規化の
基本的な手法として、第5図に示すように画素を一定の
間隔で抽出し、その他の画素を捨てることによって入力
文字画像よりサイズの小さい正規化文字画像を生成する
間引き正規化と、第6図に示すように、一定間隔内の画
素の論理和(OR)をとることによって、入力文字画像よ
りサイズの小さい正規化文字画像を生成するOR正規化が
ある。
画像のサイズの正規化を行う。この文字サイズ正規化の
基本的な手法として、第5図に示すように画素を一定の
間隔で抽出し、その他の画素を捨てることによって入力
文字画像よりサイズの小さい正規化文字画像を生成する
間引き正規化と、第6図に示すように、一定間隔内の画
素の論理和(OR)をとることによって、入力文字画像よ
りサイズの小さい正規化文字画像を生成するOR正規化が
ある。
しかし、間引き正規化によれば細い線分の消失または
“かすれ”が起こりやすく、またOR正規化によれば細い
空白の“潰れ”が起こりやすく、これにより誤認識が生
じやすい。
“かすれ”が起こりやすく、またOR正規化によれば細い
空白の“潰れ”が起こりやすく、これにより誤認識が生
じやすい。
このような問題に関しては、入力文字画像中の線分の
細い部分を検出し、この部分に少なくとも1画素を追加
してから間引き正規化を行うことにより、線分の消失ま
たは“かすれ”を防ぐ手法(特開昭60−126780号)や、
入力文字画像をそのままOR正規化した画像と、入力文字
画像を水平、垂直の各方向へ1画素分ずらしてOR正規化
した画像の論理積をとることで、文字内の空白の“潰
れ”を防ぐ手法(特開昭60−110086号)も提案されてい
る。
細い部分を検出し、この部分に少なくとも1画素を追加
してから間引き正規化を行うことにより、線分の消失ま
たは“かすれ”を防ぐ手法(特開昭60−126780号)や、
入力文字画像をそのままOR正規化した画像と、入力文字
画像を水平、垂直の各方向へ1画素分ずらしてOR正規化
した画像の論理積をとることで、文字内の空白の“潰
れ”を防ぐ手法(特開昭60−110086号)も提案されてい
る。
しかし、いずれの手法も正規化サイズの2倍より大き
な文字画像に適用しようとすると、処理が複雑化すると
ともに十分な効果が得られないなどの問題がある。
な文字画像に適用しようとすると、処理が複雑化すると
ともに十分な効果が得られないなどの問題がある。
また、パターンマッチング等の手法により文字の認識
を行う場合、フォントの相違や入力原稿のコピー処理等
による字形の変化等によって誤認識が生じることがあ
る。そこで、認識結果の下位候補との距離の差などの情
報を用いて誤認識を判定したり、文字画像を濃度(2値
化閾値)を変えて読み取って認識し、それぞれの濃度に
対する認識結果の相違を用いて誤認識の判定を行う方法
などが提案されている。
を行う場合、フォントの相違や入力原稿のコピー処理等
による字形の変化等によって誤認識が生じることがあ
る。そこで、認識結果の下位候補との距離の差などの情
報を用いて誤認識を判定したり、文字画像を濃度(2値
化閾値)を変えて読み取って認識し、それぞれの濃度に
対する認識結果の相違を用いて誤認識の判定を行う方法
などが提案されている。
しかし、距離の差は文字の複雑さによって、その基準
が大きく異なること、また、濃度の違う画像を得るには
処理時間及びメモリの負担が大きいという問題がある。
が大きく異なること、また、濃度の違う画像を得るには
処理時間及びメモリの負担が大きいという問題がある。
本発明の目的は、漢字OCR等において、複数の画像の
読込みや異なる濃度レベルでの2値化処理の手間をなく
し、且つ、比較的単純な基準を用いることで簡単に認識
結果の確からしさを算出できるようにして、比較的簡単
な処理でもって高い認識率の達成を可能にすることにあ
る。
読込みや異なる濃度レベルでの2値化処理の手間をなく
し、且つ、比較的単純な基準を用いることで簡単に認識
結果の確からしさを算出できるようにして、比較的簡単
な処理でもって高い認識率の達成を可能にすることにあ
る。
本発明による文字認識装置は、入力文字画像に対し線
分の細め処理をその強さを変えて施し、それぞれの細め
処理後の文字画像を論理和演算により正規化して一つの
入力文字画像に対し複数の正規化文字画像を生成する正
規化処理部と、該正規化処理部により得られた各入力文
字画像の複数の正規化文字画像のそれぞれについて文字
認識を行う文字認識部と、該文字認識部により各入力文
字画像に対して得られた複数の認識結果から、例えば多
数決によって最終的な認識結果を選択する認識結果判定
部とを具備することを特徴とする。
分の細め処理をその強さを変えて施し、それぞれの細め
処理後の文字画像を論理和演算により正規化して一つの
入力文字画像に対し複数の正規化文字画像を生成する正
規化処理部と、該正規化処理部により得られた各入力文
字画像の複数の正規化文字画像のそれぞれについて文字
認識を行う文字認識部と、該文字認識部により各入力文
字画像に対して得られた複数の認識結果から、例えば多
数決によって最終的な認識結果を選択する認識結果判定
部とを具備することを特徴とする。
本発明によれば、線分の細め処理をしてから論理和演
算による正規化すなわちOR正規化を行うので、細め処理
の強さが適切であれば、OR正規化の弱点である細い空白
の潰れを減らし、かつ線分の“かすれ”や消失が生じに
くいというOR正規化の長所を保存することができる。
算による正規化すなわちOR正規化を行うので、細め処理
の強さが適切であれば、OR正規化の弱点である細い空白
の潰れを減らし、かつ線分の“かすれ”や消失が生じに
くいというOR正規化の長所を保存することができる。
この最適な細め処理の強さは文字画像のサイズ、読取
り濃度、読取りスキャナの特性、フォントの種類等によ
って異なるが、これらは予め予想できない場合が多いの
で、入力原稿に応じて細め処理の強さを自動的に最適化
しようとすると、面倒な処理が必要となる。
り濃度、読取りスキャナの特性、フォントの種類等によ
って異なるが、これらは予め予想できない場合が多いの
で、入力原稿に応じて細め処理の強さを自動的に最適化
しようとすると、面倒な処理が必要となる。
本発明では、複数の正規化画像の各認識結果を同一の
入力画像から得ることにより、複数の画像の読込みや異
なるレベルでの2値化処理の手間が省略でき、また、各
認識結果より多数決等の単純な基準によって最終的な認
識結果を決定するので、比較的簡単な処理でもって高精
度の認識が可能である。
入力画像から得ることにより、複数の画像の読込みや異
なるレベルでの2値化処理の手間が省略でき、また、各
認識結果より多数決等の単純な基準によって最終的な認
識結果を決定するので、比較的簡単な処理でもって高精
度の認識が可能である。
第1図は本発明の一実施例に係る文字認識装置のブロ
ック図である。
ック図である。
原画像入力部1(ファイル、スキャナ等)から入力し
た原稿の画像データより、文字切出し部2で1文字分の
文字画像を切出し、入力文字画像として画像メモリ3内
の文字画像バッファ4に格納すると同時に、その文字サ
イズ等の情報を正規化処理部5へ渡す。
た原稿の画像データより、文字切出し部2で1文字分の
文字画像を切出し、入力文字画像として画像メモリ3内
の文字画像バッファ4に格納すると同時に、その文字サ
イズ等の情報を正規化処理部5へ渡す。
正規化処理部5においては、細め処理制御部6の制御
の下で、例えば3種類の違った強さの細め処理を入力文
字画像に施した文字画像を細め処理部7で求め、各細め
処理文字画像に対しOR処理部8で論理和演算を施すこと
により、一つの入力文字画像に対して3個の正規化文字
画像を生成し、これを画像メモリ3内の正規化画像バッ
ファ9に格納する。
の下で、例えば3種類の違った強さの細め処理を入力文
字画像に施した文字画像を細め処理部7で求め、各細め
処理文字画像に対しOR処理部8で論理和演算を施すこと
により、一つの入力文字画像に対して3個の正規化文字
画像を生成し、これを画像メモリ3内の正規化画像バッ
ファ9に格納する。
文字認識部10では、各正規化後文字画像について文字
認識を実行し、各々の認識結果(本実施例では3個)を
認識結果判定部11へ渡す。
認識を実行し、各々の認識結果(本実施例では3個)を
認識結果判定部11へ渡す。
認識結果判定部11では、渡された認識結果より多数決
によって最終的な認識結果を決定する。また、その認識
結果の確からしさを例えば次式 [確からしさ(%)] =[同じ結果の個数]÷[全結果数]×100 で計算する。そして、最終的な認識結果と確からしさの
情報を出力する。
によって最終的な認識結果を決定する。また、その認識
結果の確からしさを例えば次式 [確からしさ(%)] =[同じ結果の個数]÷[全結果数]×100 で計算する。そして、最終的な認識結果と確からしさの
情報を出力する。
細め処理部7の内部処理について第2図及び第3図に
より説明する。この処理は上から下、下から上、左から
右、右から左、の4方向から可能である。
より説明する。この処理は上から下、下から上、左から
右、右から左、の4方向から可能である。
第2図は上から下への方向の処理の説明図である。上
から下へ画素を見ていき、その方向へ黒画素が2個以上
重なっている部分では、その一番上の黒画素を白画素に
置き換える(黒画素を1個削る)。この例では、↓印の
部分の一番上の黒画素が消されるが、○印の部分の黒画
素は1個だけであるので消さない。
から下へ画素を見ていき、その方向へ黒画素が2個以上
重なっている部分では、その一番上の黒画素を白画素に
置き換える(黒画素を1個削る)。この例では、↓印の
部分の一番上の黒画素が消されるが、○印の部分の黒画
素は1個だけであるので消さない。
第3図は下から上への方向の処理の説明図である。こ
の場合、下から上へ黒画素が2個以上重なっている部分
(↑印の部分)では一番上の黒画素を消すが、○印の部
分では黒画素が1個であるので消さずに残す。このよう
な処理により、線分のとぎれを発生させずに、横方向の
線分を細めることができる。
の場合、下から上へ黒画素が2個以上重なっている部分
(↑印の部分)では一番上の黒画素を消すが、○印の部
分では黒画素が1個であるので消さずに残す。このよう
な処理により、線分のとぎれを発生させずに、横方向の
線分を細めることができる。
左右方向の細め処理も同様であり、線分のとぎれを発
生させずに、縦方向の線分を細めることができる。
生させずに、縦方向の線分を細めることができる。
このような処理を、細め処理制御部の制御下で必要な
細め処理の強さになるまで方向別に繰り返した結果が細
め処理画像としてOR処理部8へ送られることになる。
細め処理の強さになるまで方向別に繰り返した結果が細
め処理画像としてOR処理部8へ送られることになる。
例えば細め処理制御部6では、文字切出し部2より与
えられた文字サイズ情報より、 N=縦方向文字画像サイズ/正規化画像サイズを計算
し、 細め処理部7で縦方向に内部処理をN回行った結果を
1回目の細め処理文字画像としてOR処理部8へ渡し、次
に横方向にのみ内部処理をN回行った結果を2回目の細
め処理文字画像としてOR処理部8へ渡し、縦方向及び横
方向にそれぞれN回の内部処理を行った結果を3回目の
細め処理文字画像としてOR処理部8へ渡すように制御を
行う。
えられた文字サイズ情報より、 N=縦方向文字画像サイズ/正規化画像サイズを計算
し、 細め処理部7で縦方向に内部処理をN回行った結果を
1回目の細め処理文字画像としてOR処理部8へ渡し、次
に横方向にのみ内部処理をN回行った結果を2回目の細
め処理文字画像としてOR処理部8へ渡し、縦方向及び横
方向にそれぞれN回の内部処理を行った結果を3回目の
細め処理文字画像としてOR処理部8へ渡すように制御を
行う。
なお、細め処理部7の内部処理は、上から下への処理
と下から上への処理を交互に行う。左右方向の処理も同
様に交互に行う。このように反対方向の処理を交互に行
うと、細め処理による画像の歪みの影響を分散させる効
果がある。
と下から上への処理を交互に行う。左右方向の処理も同
様に交互に行う。このように反対方向の処理を交互に行
うと、細め処理による画像の歪みの影響を分散させる効
果がある。
この場合、例えば第4図(a)の“間”の文字画像に
対し、縦方向の細め処理を1回以上、横方向の細め処理
を1回以上、縦と横方向の細め処理を1回以上それぞれ
行った画像は、第4図(b),(c)及び(d)に示す
ような画像となる。そして、これらの細め処理画像のOR
正規化画像に対する認識結果がそれぞれ“間",“問",
“間”となったとすると、多数決により最終的に認識結
果は“間”に決定され、その確からしさは66.6%とな
る。
対し、縦方向の細め処理を1回以上、横方向の細め処理
を1回以上、縦と横方向の細め処理を1回以上それぞれ
行った画像は、第4図(b),(c)及び(d)に示す
ような画像となる。そして、これらの細め処理画像のOR
正規化画像に対する認識結果がそれぞれ“間",“問",
“間”となったとすると、多数決により最終的に認識結
果は“間”に決定され、その確からしさは66.6%とな
る。
なお、細め処理の方向を変化させず(横方向だけ、縦
方向だけ、あるいは縦横両方向)、その方向の削除する
ドット数(細め処理部7の内部処理回数)の増減によ
り、細め処理の強さを変えることもできる。
方向だけ、あるいは縦横両方向)、その方向の削除する
ドット数(細め処理部7の内部処理回数)の増減によ
り、細め処理の強さを変えることもできる。
以上の説明から明らかなように、本発明によれば、複
数の画像の読込みや読取り濃度あるいは2値化閾値を変
えて文字画像の入力を繰り返すというような処理時間や
メモリの増加を招く処理を必要とせずに、また入力原稿
の文字の太さやフォントの違い等を意識せずに、より高
い精度の文字認識が可能となり、また単純な基準(認識
結果の相違あるいは同じ認識結果の個数)によって認識
結果の確からしさの情報を得ることができる。
数の画像の読込みや読取り濃度あるいは2値化閾値を変
えて文字画像の入力を繰り返すというような処理時間や
メモリの増加を招く処理を必要とせずに、また入力原稿
の文字の太さやフォントの違い等を意識せずに、より高
い精度の文字認識が可能となり、また単純な基準(認識
結果の相違あるいは同じ認識結果の個数)によって認識
結果の確からしさの情報を得ることができる。
第1図は本発明の一実施例を示すブロック図、 第2図は上から下への方向の細め処理の説明図、 第3図は下から上への方向の細め処理の説明図、 第4図は入力文字画像と細め処理画像の例を示す図、第
5図は間引き正規化の説明図、第6図はOR正規化の説明
図である。 1…原画像入力部、2…文字切出し部、3…画像メモ
リ、4…文字画像バッファ、5…正規化処理部、6…細
め処理制御部、7…細め処理部、8…OR処理部、9…正
規化画像バッファ、10…文字認識部、11…認識結果判定
部。
5図は間引き正規化の説明図、第6図はOR正規化の説明
図である。 1…原画像入力部、2…文字切出し部、3…画像メモ
リ、4…文字画像バッファ、5…正規化処理部、6…細
め処理制御部、7…細め処理部、8…OR処理部、9…正
規化画像バッファ、10…文字認識部、11…認識結果判定
部。
Claims (2)
- 【請求項1】入力文字画像に対し線分の細め処理をその
強さを変えて施し、それぞれの細め処理後の文字画像を
論理和演算により正規化して一つの入力文字画像に対し
複数の正規化文字画像を生成する正規化処理部と、該正
規化処理部により得られた各入力文字画像の複数の正規
化文字画像のそれぞれについて文字認識を行う文字認識
部と、該文字認識部により各入力文字画像に対して得ら
れた複数の認識結果から最終的な認識結果を選択する認
識結果判定部とを具備する文字認識装置。 - 【請求項2】認識結果判定部は、一つの入力文字画像に
対して生成された複数の正規化文字画像のそれぞれの認
識結果より多数決により最終的な認識結果を選択するこ
とを特徴とする請求項(1)記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2102578A JP2899356B2 (ja) | 1990-04-18 | 1990-04-18 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2102578A JP2899356B2 (ja) | 1990-04-18 | 1990-04-18 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04687A JPH04687A (ja) | 1992-01-06 |
JP2899356B2 true JP2899356B2 (ja) | 1999-06-02 |
Family
ID=14331112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2102578A Expired - Fee Related JP2899356B2 (ja) | 1990-04-18 | 1990-04-18 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2899356B2 (ja) |
-
1990
- 1990-04-18 JP JP2102578A patent/JP2899356B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04687A (ja) | 1992-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7054485B2 (en) | Image processing method, apparatus and system | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
US5563403A (en) | Method and apparatus for detection of a skew angle of a document image using a regression coefficient | |
US6574375B1 (en) | Method for detecting inverted text images on a digital scanning device | |
JP3308032B2 (ja) | スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置 | |
US4757551A (en) | Character recognition method and system capable of recognizing slant characters | |
JP2940936B2 (ja) | 表領域識別方法 | |
US6185341B1 (en) | Image processing using vector data to reduce noise | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
JP2899356B2 (ja) | 文字認識装置 | |
EP0476873B1 (en) | Method of and apparatus for separating image regions | |
JP3058489B2 (ja) | 文字列抽出方法 | |
KR940020246A (ko) | 문서인식장치의 영역분할 방법 | |
JP2020154449A (ja) | 画像処理装置及びプログラム | |
JP2003281469A (ja) | 文書画像処理方法 | |
JPH0540848A (ja) | 文書画像の領域抽出方法 | |
EP0446630A2 (en) | Method and apparatus for segmenting characters in an amount field on a financial document | |
JP2789647B2 (ja) | 線画像認識方法 | |
JPH0581475A (ja) | 文字領域抽出方法 | |
JP2613211B2 (ja) | 画像入力装置 | |
JP2875285B2 (ja) | 画像正規化方法 | |
JP3277977B2 (ja) | 文字認識方法 | |
JP3210224B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090312 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |