JP2743378B2 - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JP2743378B2 JP2743378B2 JP63108737A JP10873788A JP2743378B2 JP 2743378 B2 JP2743378 B2 JP 2743378B2 JP 63108737 A JP63108737 A JP 63108737A JP 10873788 A JP10873788 A JP 10873788A JP 2743378 B2 JP2743378 B2 JP 2743378B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- black
- white
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 17
- 238000010586 diagram Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- RRLHMJHRFMHVNM-BQVXCWBNSA-N [(2s,3r,6r)-6-[5-[5-hydroxy-3-(4-hydroxyphenyl)-4-oxochromen-7-yl]oxypentoxy]-2-methyl-3,6-dihydro-2h-pyran-3-yl] acetate Chemical compound C1=C[C@@H](OC(C)=O)[C@H](C)O[C@H]1OCCCCCOC1=CC(O)=C2C(=O)C(C=3C=CC(O)=CC=3)=COC2=C1 RRLHMJHRFMHVNM-BQVXCWBNSA-N 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Character Input (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、紙面上に書かれた文字を画像として入力す
ることにより、文字画像から文字領域を捜し出し、コー
ド番号に変換する文字認識方法に関する。
ることにより、文字画像から文字領域を捜し出し、コー
ド番号に変換する文字認識方法に関する。
文字認識装置は、紙面上に書かれた文字をたとえばス
キャナ等の入力装置によって画像として記憶装置に入力
し、取り込まれた画像データより自動的に文字位置を捜
し出し、該捜し出された文字位置のデータを辞書となる
文字データと比較して、該文字画像がどういう文字であ
るのかを判断し、キャラクターコードに置き換えて出力
するものである。一般に入力文字画像から文字位置を捜
し出す場合は次の手順をとる。通常入力画像は複数行同
時に入力される。したがって、該入力画像より各行を切
り出さなければならない。この時、行方向の周辺分布を
とり、周辺分布で黒画素の固まりを文字行と判断し行の
切り出しを行う。次に、行方向と垂直方向の周辺分布を
とり、行方向と同様に黒画素の固まりを文字位置と判断
し、文字位置が決定される。この後、前記決定された文
字位置のデータ(例えば周辺特徴 電子通信学会論文
誌′82 Vol.J65−D NO.8P.P.1026〜1033、メッシュ特徴
研究実用化報告第34巻第1号 P.P.47〜58)を辞書とし
て持っている文字データと比べ一番近いものを捜し出す
ことによって文字の認識を行っており、これらの文字切
り出しの方法から認識に至るすべての方法は白地に黒文
字といった通常文字異画像を対象としたものである。
キャナ等の入力装置によって画像として記憶装置に入力
し、取り込まれた画像データより自動的に文字位置を捜
し出し、該捜し出された文字位置のデータを辞書となる
文字データと比較して、該文字画像がどういう文字であ
るのかを判断し、キャラクターコードに置き換えて出力
するものである。一般に入力文字画像から文字位置を捜
し出す場合は次の手順をとる。通常入力画像は複数行同
時に入力される。したがって、該入力画像より各行を切
り出さなければならない。この時、行方向の周辺分布を
とり、周辺分布で黒画素の固まりを文字行と判断し行の
切り出しを行う。次に、行方向と垂直方向の周辺分布を
とり、行方向と同様に黒画素の固まりを文字位置と判断
し、文字位置が決定される。この後、前記決定された文
字位置のデータ(例えば周辺特徴 電子通信学会論文
誌′82 Vol.J65−D NO.8P.P.1026〜1033、メッシュ特徴
研究実用化報告第34巻第1号 P.P.47〜58)を辞書とし
て持っている文字データと比べ一番近いものを捜し出す
ことによって文字の認識を行っており、これらの文字切
り出しの方法から認識に至るすべての方法は白地に黒文
字といった通常文字異画像を対象としたものである。
しかしながら、通常目にする文字画像は、白地に黒文
字といったものばかりでなく、黒地あるいは黒に近い暗
い地に白などの明るい文字というものもかなり多く、こ
のような文字画像を入力した場合の文字の切り出し、認
識は不可能である。また、白黒反転文字を認識しようと
した場合、文字切り出しの判断は白の固まりを文字領域
と判断した後、反転文字用に作成された文字画像データ
と比較しなければならず、文字画像データとしての辞書
の量が倍になる。また、反転文字かどうかの判断は、外
部から何らかの方法で入力しなければならず、このよう
な方法での反転文字の認識は非常に非効率的で、また、
メモリの無駄である。そこで、本発明はこのような課題
を解決するもので、その目的とするところは、白地に黒
文字といった通常文字は当然のこと、黒地に白文字とい
った白黒反転文字を通常の操作により認識可能な文字読
認識装置及び該認識方法を提供することにある。
字といったものばかりでなく、黒地あるいは黒に近い暗
い地に白などの明るい文字というものもかなり多く、こ
のような文字画像を入力した場合の文字の切り出し、認
識は不可能である。また、白黒反転文字を認識しようと
した場合、文字切り出しの判断は白の固まりを文字領域
と判断した後、反転文字用に作成された文字画像データ
と比較しなければならず、文字画像データとしての辞書
の量が倍になる。また、反転文字かどうかの判断は、外
部から何らかの方法で入力しなければならず、このよう
な方法での反転文字の認識は非常に非効率的で、また、
メモリの無駄である。そこで、本発明はこのような課題
を解決するもので、その目的とするところは、白地に黒
文字といった通常文字は当然のこと、黒地に白文字とい
った白黒反転文字を通常の操作により認識可能な文字読
認識装置及び該認識方法を提供することにある。
また、特開昭61−190681号には原画から二値画像とそ
の反転画像の2つの画像で認識しそれぞれの画から文字
を認識する文字認識方法が記載されているが、この方法
だとメモリ数が倍となる、認識速度が速くなる等の問題
があるが、本発明はかかる問題も解消することを目的と
する。
の反転画像の2つの画像で認識しそれぞれの画から文字
を認識する文字認識方法が記載されているが、この方法
だとメモリ数が倍となる、認識速度が速くなる等の問題
があるが、本発明はかかる問題も解消することを目的と
する。
本発明の文字認識方法は、文書画像を入力し、前記入
力画像から文字を抽出し、前記文字を認識する文字認識
方法において、 前記入力画像が、二値の一方の値を地とし他方の値を
文字としているか、前記他方の値を地とし前記一方の値
を文字としているかを判断し、前記他方の値を地とし前
記一方の値を文字としている場合には前記一方の値を地
とし前記他方の値を文字とするよう反転させ、いずれの
場合も前記一方の値を地とし前記他方の値を文字とした
後、前記文字認識をおこなうことを特徴とする。
力画像から文字を抽出し、前記文字を認識する文字認識
方法において、 前記入力画像が、二値の一方の値を地とし他方の値を
文字としているか、前記他方の値を地とし前記一方の値
を文字としているかを判断し、前記他方の値を地とし前
記一方の値を文字としている場合には前記一方の値を地
とし前記他方の値を文字とするよう反転させ、いずれの
場合も前記一方の値を地とし前記他方の値を文字とした
後、前記文字認識をおこなうことを特徴とする。
この際、二値が黒、白なら、例えば、入力画像が白地
に黒文字か、黒地に白文字かを判断し、前記入力画像が
黒地に白文字の場合は前記入力画像を反転させ白地に黒
文字とした後、文字認識をおこなう。
に黒文字か、黒地に白文字かを判断し、前記入力画像が
黒地に白文字の場合は前記入力画像を反転させ白地に黒
文字とした後、文字認識をおこなう。
また、二値の値のどちらが地でありどちらが文字であ
るかは前記二値画素数の数から判断することができる。
るかは前記二値画素数の数から判断することができる。
地か文字かの判断は、入力画像の一部の領域の二値画
素数から判断することができる。
素数から判断することができる。
入力画像の一部の領域は1/16〜1/8の領域のような小
さな領域で足りる。
さな領域で足りる。
以下の実施例は、二値画像として黒、白の二値画像と
した場合を例にしたものである。
した場合を例にしたものである。
以下本発明について実施例に基づいて詳細に説明す
る。
る。
本発明の文字認識装置は、第1のブロック図に示す様
に、CPU1、画像入力装置2、認識文字表示装置3、ROM
4、RAM5により構成されている。また、本発明の文字認
識装置の動作は第2図のブロック図に示す様に、画像入
力手段6、入力された画像が白地に黒文字であるか、黒
地に白文字であるかを判断し、黒地に白文字である場合
には画像を白黒反転する画像反転手段7、画像中から文
字列を抽出する文字列抽出手段8、文字列から文字を抽
出する文字抽出手段9、抽出された文字を認識する文字
認識手段10、該認識文字を表示する認識結果表示手段11
とからなっている。
に、CPU1、画像入力装置2、認識文字表示装置3、ROM
4、RAM5により構成されている。また、本発明の文字認
識装置の動作は第2図のブロック図に示す様に、画像入
力手段6、入力された画像が白地に黒文字であるか、黒
地に白文字であるかを判断し、黒地に白文字である場合
には画像を白黒反転する画像反転手段7、画像中から文
字列を抽出する文字列抽出手段8、文字列から文字を抽
出する文字抽出手段9、抽出された文字を認識する文字
認識手段10、該認識文字を表示する認識結果表示手段11
とからなっている。
以下、入力文字画像が、白地に黒文字の場合、黒地に
白文字の場合によらない本発明の文字認識装置の動作を
第4図に示すフローチャートに基づいて説明する。
白文字の場合によらない本発明の文字認識装置の動作を
第4図に示すフローチャートに基づいて説明する。
画像入力手段6においては、画像入力装置2によっ
て、文字画像がRAM5に読み込まれる、該RAM5に読み込ま
れたデータは、白地に黒文字のデータ12なのか、黒地に
白文字のデータBなのか分かっていない。このまま、文
字列抽出手段8において文字の抽出を行おうとすると、
行方向の周辺分布を計算して、黒画素の領域を拾うの
で、行の抽出は不可能である。本発明は、ここで、画像
反転手段7(反転処理手段16)を設けてある。該反転処
理手段16においては、入力画像12(13)の白画素数と黒
画素数の計算を行う。もしも、入力画像が白地に黒文字
であれば殆どの場合黒画素数よりも白画素数の方が多く
なるし、黒地に白文字であれば殆どの場合白画素数より
も黒画素数の方が多くなる。したがって、第3図14にお
いて白画素数と黒画素数を比較し、入力画像が12である
のか、13であるのかを判断する。入力画像が12であれ
ば、14−1において何もせずに反転処理後画像15とし、
入力画像が13であれば、14−2において、白画素と黒画
素とを反転し、反転処理後画像15とする。こうして得ら
れた画像15は、白地に黒文字であるため、以後の認識処
理は通常の認識処理でよく、文字認識手段10において、
新たに黒地に白文字用の文字データをROM4中に持つ必要
が無く、単位メモリあたりの認識可能な文字の量が増え
る。また、本発明の白地に黒文字か、黒地に白文字かの
判断は、入力画像すべての白画素、黒画素の数を計算す
れば確実であるが、入力画像の1/16〜1/8の領域のみの
画素数の計算で判断しても、殆ど判断を誤ることはな
い。
て、文字画像がRAM5に読み込まれる、該RAM5に読み込ま
れたデータは、白地に黒文字のデータ12なのか、黒地に
白文字のデータBなのか分かっていない。このまま、文
字列抽出手段8において文字の抽出を行おうとすると、
行方向の周辺分布を計算して、黒画素の領域を拾うの
で、行の抽出は不可能である。本発明は、ここで、画像
反転手段7(反転処理手段16)を設けてある。該反転処
理手段16においては、入力画像12(13)の白画素数と黒
画素数の計算を行う。もしも、入力画像が白地に黒文字
であれば殆どの場合黒画素数よりも白画素数の方が多く
なるし、黒地に白文字であれば殆どの場合白画素数より
も黒画素数の方が多くなる。したがって、第3図14にお
いて白画素数と黒画素数を比較し、入力画像が12である
のか、13であるのかを判断する。入力画像が12であれ
ば、14−1において何もせずに反転処理後画像15とし、
入力画像が13であれば、14−2において、白画素と黒画
素とを反転し、反転処理後画像15とする。こうして得ら
れた画像15は、白地に黒文字であるため、以後の認識処
理は通常の認識処理でよく、文字認識手段10において、
新たに黒地に白文字用の文字データをROM4中に持つ必要
が無く、単位メモリあたりの認識可能な文字の量が増え
る。また、本発明の白地に黒文字か、黒地に白文字かの
判断は、入力画像すべての白画素、黒画素の数を計算す
れば確実であるが、入力画像の1/16〜1/8の領域のみの
画素数の計算で判断しても、殆ど判断を誤ることはな
い。
以上の様に入力画像の白画素と黒画素の数を計算し、
白地に黒文字の画像なのか、黒地に白文字の画像なのか
を判断した後、黒地に白文字の画像である場合、画像の
白画素と黒画素を反転し、白地に黒文字の文字画像とす
るので、通常の認識で白黒反転文字の認識が可能とな
る。また、自動的に反転の判断を行うので、操作上は全
く今までの文字認識装置と変わらず、機能のみを向上さ
せることが可能である。
白地に黒文字の画像なのか、黒地に白文字の画像なのか
を判断した後、黒地に白文字の画像である場合、画像の
白画素と黒画素を反転し、白地に黒文字の文字画像とす
るので、通常の認識で白黒反転文字の認識が可能とな
る。また、自動的に反転の判断を行うので、操作上は全
く今までの文字認識装置と変わらず、機能のみを向上さ
せることが可能である。
また本実施例は、入力画像が、白黒の二値の場合につ
いて述べたが、該方法は、二値に限ったものではなく、
階調をもったデータであっても、階調の統計をとって、
反転文字であれば、階調を反転させる(2つの補数をと
る)ことによって同様の機能を持つ文字認識装置の提供
が可能となる。
いて述べたが、該方法は、二値に限ったものではなく、
階調をもったデータであっても、階調の統計をとって、
反転文字であれば、階調を反転させる(2つの補数をと
る)ことによって同様の機能を持つ文字認識装置の提供
が可能となる。
以上述べた様に本発明によれば、文字認識装置におい
て、入力画像が白地に黒文字か、黒地に白文字かの判断
を画素の統計をとることによって自動的に行い、黒地に
白文字の場合は、白黒反転を行うので、通常の認識手段
で、黒地に白文字、白地に黒文字の認識を可能とした。
また、このような文字認識装置は従来のものと比べて、
使用用途が拡がったものとなり、便利さの向上を実現し
たものとなる。
て、入力画像が白地に黒文字か、黒地に白文字かの判断
を画素の統計をとることによって自動的に行い、黒地に
白文字の場合は、白黒反転を行うので、通常の認識手段
で、黒地に白文字、白地に黒文字の認識を可能とした。
また、このような文字認識装置は従来のものと比べて、
使用用途が拡がったものとなり、便利さの向上を実現し
たものとなる。
また、特開昭61−190681のように、原画をそのまま、
及び反転の両方の画像にし、両者の画像からそれぞれ文
字認識をしそれぞれの文字認識の結果から最終的な文字
を選択する方法は、メモリー数が倍になる、処理速度が
遅くなる等、不都合が多いだけでなく、文字認識精度上
問題があるが、本発明の方法によれば文字認識精度が極
めて向上する。これは、上記方法は一見すると文字認識
精度がよいように見えるが、文字認識は主々雑多な文字
認識(字形を多少くずしたものを含めると極めて多種類
となり無限に近い)をしなくてはならず、そのような場
合、ある文字は反転文字と認識され、ある文字は反転し
ない文字と認識されることが多く、文字認識精度が極め
て悪くなるのに対し、本発明の場合には文字認識をする
時点では反転文字群かそうでない文字群かがあらかじめ
判断されているため、そのような不都合はなく、実際に
文字認識をしたところ、極めて文字認識率が向上した。
このようにすることにより上記方法は文字形に沿ってメ
モリーを増加させなければならず、また増加させれば増
加させる程、一群の文字群中の文字が反転文字、反転し
ない文字の両者が入り混じったものとなるという、不都
合が生じるが本発明はそのような不都合は生ぜず、極め
て簡単かつ正確、迅速な文字認識をおこなうことが可能
となる。
及び反転の両方の画像にし、両者の画像からそれぞれ文
字認識をしそれぞれの文字認識の結果から最終的な文字
を選択する方法は、メモリー数が倍になる、処理速度が
遅くなる等、不都合が多いだけでなく、文字認識精度上
問題があるが、本発明の方法によれば文字認識精度が極
めて向上する。これは、上記方法は一見すると文字認識
精度がよいように見えるが、文字認識は主々雑多な文字
認識(字形を多少くずしたものを含めると極めて多種類
となり無限に近い)をしなくてはならず、そのような場
合、ある文字は反転文字と認識され、ある文字は反転し
ない文字と認識されることが多く、文字認識精度が極め
て悪くなるのに対し、本発明の場合には文字認識をする
時点では反転文字群かそうでない文字群かがあらかじめ
判断されているため、そのような不都合はなく、実際に
文字認識をしたところ、極めて文字認識率が向上した。
このようにすることにより上記方法は文字形に沿ってメ
モリーを増加させなければならず、また増加させれば増
加させる程、一群の文字群中の文字が反転文字、反転し
ない文字の両者が入り混じったものとなるという、不都
合が生じるが本発明はそのような不都合は生ぜず、極め
て簡単かつ正確、迅速な文字認識をおこなうことが可能
となる。
第1図に本発明の文字認識装置のブロック図。 第2図に本発明の認識手段のブロック図。 第3図に本発明の文字の反転を示した図。 第4図に本発明の文字反転の判断のフローチャートを示
す。 1……CPU 2……画像入力装置 3……認識結果表示装置 4……ROM 5……RAM 6……画像入力手段 7……画像反転手段 8……文字列抽出手段 9……文字抽出手段 10……文字認識手段 11……認識文字表示手段 12、13……入力画像 14……反転処理 15……反転処理後画像 16……反転処理手段
す。 1……CPU 2……画像入力装置 3……認識結果表示装置 4……ROM 5……RAM 6……画像入力手段 7……画像反転手段 8……文字列抽出手段 9……文字抽出手段 10……文字認識手段 11……認識文字表示手段 12、13……入力画像 14……反転処理 15……反転処理後画像 16……反転処理手段
Claims (2)
- 【請求項1】文書画像を入力し、前記入力画像が、二値
の一方を地とし他方の値を文字としているか、前記他方
の値を地とし前記一方の値を文字としているかを判断
し、前記他方の値を地とし前記一方の値を文字としてい
る場合には前記一方の値を地とし前記他方の値を文字と
するよう反転させ、いずれの場合も前記一方の値を地と
し前記他方の値を文字とした後、前記入力画像から前記
文字を抽出し文字認識を行う文字認識方法において、地
か文字かの判断は前記入力画像の一部の領域の二値画素
数から判断することを特徴とする文字認識方法。 - 【請求項2】前記入力画像の一部の領域は前記入力画像
の1/16乃至1/8の領域であることを特徴とする請求項1
記載の文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63108737A JP2743378B2 (ja) | 1988-04-30 | 1988-04-30 | 文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63108737A JP2743378B2 (ja) | 1988-04-30 | 1988-04-30 | 文字認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01279385A JPH01279385A (ja) | 1989-11-09 |
| JP2743378B2 true JP2743378B2 (ja) | 1998-04-22 |
Family
ID=14492246
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63108737A Expired - Lifetime JP2743378B2 (ja) | 1988-04-30 | 1988-04-30 | 文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2743378B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4322041B2 (ja) * | 2003-04-25 | 2009-08-26 | シャープ株式会社 | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS522337A (en) * | 1975-06-24 | 1977-01-10 | Nec Corp | Slice level deciding equipment |
| JPS5762466A (en) * | 1980-10-03 | 1982-04-15 | Canon Inc | Original reader |
| JPS5960580A (ja) * | 1982-09-29 | 1984-04-06 | Fujitsu Ltd | 画像処理方式 |
| JPS62147584A (ja) * | 1985-12-23 | 1987-07-01 | Toshiba Corp | 文字読取装置 |
-
1988
- 1988-04-30 JP JP63108737A patent/JP2743378B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH01279385A (ja) | 1989-11-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0843275A2 (en) | Pattern extraction apparatus and method for extracting patterns | |
| US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
| US4901365A (en) | Method of searching binary images to find search regions in which straight lines may be found | |
| JPH0424781A (ja) | 文書処理装置 | |
| JP2740335B2 (ja) | 自動セル属性判定機能を有する表読取装置 | |
| JP2743378B2 (ja) | 文字認識方法 | |
| JPH08180068A (ja) | 電子ファイリング装置 | |
| JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
| US5361204A (en) | Searching for key bit-mapped image patterns | |
| JP3122476B2 (ja) | 自動文書清書装置 | |
| JP2867531B2 (ja) | 文字サイズ認識装置 | |
| JP3095470B2 (ja) | 文字認識装置 | |
| JP2865611B2 (ja) | 文字の特徴抽出方法及びその装置並びに文字認識方法及びその装置 | |
| JPH0679348B2 (ja) | 行切り出し方法 | |
| JP2954218B2 (ja) | 画像処理方法及び装置 | |
| JP3502130B2 (ja) | 表認識装置および表認識方法 | |
| JPS6343788B2 (ja) | ||
| JPH06139277A (ja) | 電子辞書装置 | |
| JP2926842B2 (ja) | 文字切出し回路 | |
| JP2972443B2 (ja) | 文字認識装置 | |
| JP4129320B2 (ja) | 画像処理装置及び記録媒体 | |
| JPH08263591A (ja) | 文字認識装置及び方法 | |
| JPH02166583A (ja) | 文字認識装置 | |
| JPS6089290A (ja) | パタ−ン認識方法 | |
| JP2963042B2 (ja) | 文字認識結果表示方法及び文字認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080206 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090206 Year of fee payment: 11 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090206 Year of fee payment: 11 |