JPH0916715A - 文字認識装置および方法 - Google Patents
文字認識装置および方法Info
- Publication number
- JPH0916715A JPH0916715A JP7165125A JP16512595A JPH0916715A JP H0916715 A JPH0916715 A JP H0916715A JP 7165125 A JP7165125 A JP 7165125A JP 16512595 A JP16512595 A JP 16512595A JP H0916715 A JPH0916715 A JP H0916715A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- threshold value
- character recognition
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 印字濃度の異なる多様な字形の文字を高精度
に読み取る。 【構成】 入力された多値画像を予め設定された閾値で
2値化処理部20により2値化し、その2値化画像を文
字切出し部30で1文字ごとに切出す。1文字分の文字
画像に対して、文字認識部40で文字認識が行こなわれ
る。一方、1文字ごとに切り出された2値化文字画像に
おける黒点数を黒点数計数部60で計数する。そして、
文字認識の結果と黒点数の計数結果により、多値画像を
2値化しなおす必要があるかどうかを再2値化判定部7
0で判定し、必要がある場合には、前述の閾値とは異な
る閾値を閾値変更部80で設定し、その新たな閾値を用
いて再2値化処理部90により再度多値画像を2値化す
る。
に読み取る。 【構成】 入力された多値画像を予め設定された閾値で
2値化処理部20により2値化し、その2値化画像を文
字切出し部30で1文字ごとに切出す。1文字分の文字
画像に対して、文字認識部40で文字認識が行こなわれ
る。一方、1文字ごとに切り出された2値化文字画像に
おける黒点数を黒点数計数部60で計数する。そして、
文字認識の結果と黒点数の計数結果により、多値画像を
2値化しなおす必要があるかどうかを再2値化判定部7
0で判定し、必要がある場合には、前述の閾値とは異な
る閾値を閾値変更部80で設定し、その新たな閾値を用
いて再2値化処理部90により再度多値画像を2値化す
る。
Description
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置および方
法に関し、特に、多様な濃度で記入または印刷された多
様な形状の文字を読み取ることを可能とする文字認識装
置および方法に関する。
法に関し、特に、多様な濃度で記入または印刷された多
様な形状の文字を読み取ることを可能とする文字認識装
置および方法に関する。
【0002】
【従来の技術】文字認識装置において、スキャナからの
多値濃度の画像(以下、多値画像とする)を適正な閾値
(濃度)で2値化することによって得られる文字画像を
読み取る技術は非常に重要なものである。例えば、様々
な場所で印字された伝票を回収して読み取る場合、伝票
には、新品のインクリボンを用いて印字されたような濃
い印字や、また、かろうじて人間が識別できる程度の薄
い印字等、様々な濃度の印字がなされる。そして、この
印字文字の濃度差は、文字の形状の多様さとともに、文
字認識の性能を劣化させる主要な原因となっていた。固
定した閾値により2値画像を得る場合、実際には、同形
状の文字であっても、普通の濃度で印字されている場合
と、非常に濃く印字されている場合とでは、図8(a)
および図8(b)や、図9(a)および図9(b)に示
すように全く異なる文字画像が得られることになる。し
たがって、印字濃度の相違が原因で、認識結果は全く異
なるものとなってしまい、誤認識を引き起こしていた。
多値濃度の画像(以下、多値画像とする)を適正な閾値
(濃度)で2値化することによって得られる文字画像を
読み取る技術は非常に重要なものである。例えば、様々
な場所で印字された伝票を回収して読み取る場合、伝票
には、新品のインクリボンを用いて印字されたような濃
い印字や、また、かろうじて人間が識別できる程度の薄
い印字等、様々な濃度の印字がなされる。そして、この
印字文字の濃度差は、文字の形状の多様さとともに、文
字認識の性能を劣化させる主要な原因となっていた。固
定した閾値により2値画像を得る場合、実際には、同形
状の文字であっても、普通の濃度で印字されている場合
と、非常に濃く印字されている場合とでは、図8(a)
および図8(b)や、図9(a)および図9(b)に示
すように全く異なる文字画像が得られることになる。し
たがって、印字濃度の相違が原因で、認識結果は全く異
なるものとなってしまい、誤認識を引き起こしていた。
【0003】このような文字画像の濃度の変化に対応す
るために用いられる技術が、例えば、特開平4−148
293号公報や特開平4−309194号公報に開示さ
れている。
るために用いられる技術が、例えば、特開平4−148
293号公報や特開平4−309194号公報に開示さ
れている。
【0004】特開平4−148293号公報に開示され
た従来の技術は、紙面全体の濃度分布に基づいて、文字
部分の濃度とその他の濃度の境界を検出し、その境界濃
度を最適閾値として設定するというものであった。
た従来の技術は、紙面全体の濃度分布に基づいて、文字
部分の濃度とその他の濃度の境界を検出し、その境界濃
度を最適閾値として設定するというものであった。
【0005】また、特開平4−309194号公報に開
示された従来の技術は、印字濃度の異なる文字パターン
を予め複数の辞書に登録しておき、認識時に印字濃度を
検出し、検出された印字濃度に応じて最適な辞書を選択
することにより、様々な印字濃度の文字を認識するとい
うものであった。
示された従来の技術は、印字濃度の異なる文字パターン
を予め複数の辞書に登録しておき、認識時に印字濃度を
検出し、検出された印字濃度に応じて最適な辞書を選択
することにより、様々な印字濃度の文字を認識するとい
うものであった。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
技術のうち、特開平4−148293号公報に記載の方
法では、濃度分布を利用しているために、処理時間が非
常にかかるという問題点があった。さらに、紙面全体の
濃度分布を利用しているために、例えば、非ドロップア
ウトカラーで印字された記入枠を有する帳票を読取対象
とした場合には、適当な2値化閾値が得られないという
問題点があった。
技術のうち、特開平4−148293号公報に記載の方
法では、濃度分布を利用しているために、処理時間が非
常にかかるという問題点があった。さらに、紙面全体の
濃度分布を利用しているために、例えば、非ドロップア
ウトカラーで印字された記入枠を有する帳票を読取対象
とした場合には、適当な2値化閾値が得られないという
問題点があった。
【0007】また、特開平4−309194号公報に記
載の方法では、例えば、図8(b)に示すような文字画
像「6」を認識する場合には、印字濃度が濃い場合の辞
書が選択されることになるが、その文字画像に対して
「6」と「8」とを十分に区別することが非常に困難で
あった。同様に、図9(b)に示す文字画像は、文字
「4」がつぶれたものであるが、単に、印字濃度ごとに
最適な辞書を用いるだけでは、この文字画像に対して
「4」と「6」とを十分に区別することができなかっ
た。
載の方法では、例えば、図8(b)に示すような文字画
像「6」を認識する場合には、印字濃度が濃い場合の辞
書が選択されることになるが、その文字画像に対して
「6」と「8」とを十分に区別することが非常に困難で
あった。同様に、図9(b)に示す文字画像は、文字
「4」がつぶれたものであるが、単に、印字濃度ごとに
最適な辞書を用いるだけでは、この文字画像に対して
「4」と「6」とを十分に区別することができなかっ
た。
【0008】以上のように、従来の技術では、処理効率
および認識精度の点で多くの問題点を残していた。
および認識精度の点で多くの問題点を残していた。
【0009】
【課題を解決するための手段】上記問題点を解決するた
めに、本発明の文字認識装置は、読取対象の多値画像を
入力する画像入力手段と、得られた多値画像を予め定め
られた第1の閾値で2値化して2値画像を得る2値化手
段と、その2値画像を、1文字ずつ切り出して文字画像
を得る文字切出し手段と、文字画像の特徴を示す値を特
徴量として検出する特徴量検出手段と、予め参照パター
ンが登録されるとともに、各参照パターンごとに前記特
徴量の許容範囲が登録される格納手段と、文字画像を前
述の格納手段に予め登録された参照パターンと照合する
ことにより文字認識を行うとともに、その文字認識の判
定結果を与えた参照パターンに付加された許容範囲を得
る文字認識手段と、特徴量と許容範囲とを比較すること
によって、文字画像に対し、第1の閾値と異なる閾値で
再度2値化すべきか否かを判定する判定手段と、多値画
像のうち文字画像を含む領域を、第1の閾値と異なる第
2の閾値を用いて再度2値化して2値画像を得る再2値
化手段とを備えるものである。特徴量としては、文字画
像の黒点数や、輪郭長を適用する。本発明は、このよう
に構成することにより、文字の潰れやかすれの具合を文
字認識の結果および文字の黒点数や輪郭長等の特徴量に
基づいて計測し、その計測結果にしたがって、容易にか
つ高精度に最適な再2値化のための閾値を設定すること
ができる。
めに、本発明の文字認識装置は、読取対象の多値画像を
入力する画像入力手段と、得られた多値画像を予め定め
られた第1の閾値で2値化して2値画像を得る2値化手
段と、その2値画像を、1文字ずつ切り出して文字画像
を得る文字切出し手段と、文字画像の特徴を示す値を特
徴量として検出する特徴量検出手段と、予め参照パター
ンが登録されるとともに、各参照パターンごとに前記特
徴量の許容範囲が登録される格納手段と、文字画像を前
述の格納手段に予め登録された参照パターンと照合する
ことにより文字認識を行うとともに、その文字認識の判
定結果を与えた参照パターンに付加された許容範囲を得
る文字認識手段と、特徴量と許容範囲とを比較すること
によって、文字画像に対し、第1の閾値と異なる閾値で
再度2値化すべきか否かを判定する判定手段と、多値画
像のうち文字画像を含む領域を、第1の閾値と異なる第
2の閾値を用いて再度2値化して2値画像を得る再2値
化手段とを備えるものである。特徴量としては、文字画
像の黒点数や、輪郭長を適用する。本発明は、このよう
に構成することにより、文字の潰れやかすれの具合を文
字認識の結果および文字の黒点数や輪郭長等の特徴量に
基づいて計測し、その計測結果にしたがって、容易にか
つ高精度に最適な再2値化のための閾値を設定すること
ができる。
【0010】さらに、特徴量と許容範囲との比較結果に
応じて、新たに設定される第2の閾値を所望の値に設定
することにより、最適な2値化閾値をより早く設定する
ことができる。
応じて、新たに設定される第2の閾値を所望の値に設定
することにより、最適な2値化閾値をより早く設定する
ことができる。
【0011】さらに、本発明は、読取対象の多値文字画
像を最適な第3の閾値で2値化して得られたパターンが
参照パターンとして登録される標準パターン用辞書と、
その多値文字画像を第3の閾値よりも大きな閾値で2値
化して得られたパターンが参照パターンとして登録され
る薄パターン用辞書と、その多値文字画像を第3の閾値
よりも小さな閾値で2値化して得られたパターンが参照
パターンとして登録される濃パターン用辞書とを含む少
なくとも3種の辞書を備えた文字辞書を用い、1文字ご
とに切り出された文字画像を格納手段に予め登録された
参照パターンと照合することにより文字認識を行うとと
もに、その文字認識の判定結果を与えた参照パターンが
前述のいずれの辞書に登録されたものなのかを検出し、
その検出結果を濃度情報(標準情報、濃情報および薄情
報)として得る文字認識手段と、その濃度情報に基づい
て、文字画像に対し、第1の閾値と異なる閾値で再度2
値化すべきか否かを判定する判定手段と、多値画像のう
ち文字画像を含む領域を、第1の閾値と異なる第2の閾
値を用いて再度2値化して2値画像を得る再2値化手段
とを備えるものである。
像を最適な第3の閾値で2値化して得られたパターンが
参照パターンとして登録される標準パターン用辞書と、
その多値文字画像を第3の閾値よりも大きな閾値で2値
化して得られたパターンが参照パターンとして登録され
る薄パターン用辞書と、その多値文字画像を第3の閾値
よりも小さな閾値で2値化して得られたパターンが参照
パターンとして登録される濃パターン用辞書とを含む少
なくとも3種の辞書を備えた文字辞書を用い、1文字ご
とに切り出された文字画像を格納手段に予め登録された
参照パターンと照合することにより文字認識を行うとと
もに、その文字認識の判定結果を与えた参照パターンが
前述のいずれの辞書に登録されたものなのかを検出し、
その検出結果を濃度情報(標準情報、濃情報および薄情
報)として得る文字認識手段と、その濃度情報に基づい
て、文字画像に対し、第1の閾値と異なる閾値で再度2
値化すべきか否かを判定する判定手段と、多値画像のう
ち文字画像を含む領域を、第1の閾値と異なる第2の閾
値を用いて再度2値化して2値画像を得る再2値化手段
とを備えるものである。
【0012】
【実施例】次に、本発明の文字認識装置の実施例につい
て図面を参照して詳細に説明する。
て図面を参照して詳細に説明する。
【0013】本発明の第1の実施例は、入力された多値
画像を予め設定された閾値で2値化し、その2値化画像
を1文字ごとに切出した後、その1文字分の文字画像に
対して、文字認識を行う。一方、1文字ごとに切り出さ
れた2値化画像は、2次元メッシュ構造を有しており、
文字部分が黒点、背景が白点として構成されている。そ
して、その2値化画像を構成する黒点部分のメッシュ数
を計数する。そして、文字認識の結果と黒点数の計数結
果により、多値画像を2値化しなおす必要があるかどう
かを判定し、必要がある場合には、前述の閾値とは異な
る閾値で、再度多値画像を2値化する。2値化された文
字画像を文字認識するとともに、前述と同様に文字画像
の黒点数を計数し、文字認識結果と黒点数の計数結果に
応じて、再度、2値化しなおす必要があるか否かを判定
する。以上の処理を、2値化しなおす必要がないと判定
されるまで繰り返し行い、最終的な文字認識結果を入力
画像の読取結果として出力するというものである。この
ように、本実施例は、文字の潰れやかすれの具合を文字
認識の結果および文字の黒点数等の特徴量に基づいて計
測し、その計測結果にしたがって、容易にかつ高精度に
最適な再2値化のための閾値を設定することができる。
画像を予め設定された閾値で2値化し、その2値化画像
を1文字ごとに切出した後、その1文字分の文字画像に
対して、文字認識を行う。一方、1文字ごとに切り出さ
れた2値化画像は、2次元メッシュ構造を有しており、
文字部分が黒点、背景が白点として構成されている。そ
して、その2値化画像を構成する黒点部分のメッシュ数
を計数する。そして、文字認識の結果と黒点数の計数結
果により、多値画像を2値化しなおす必要があるかどう
かを判定し、必要がある場合には、前述の閾値とは異な
る閾値で、再度多値画像を2値化する。2値化された文
字画像を文字認識するとともに、前述と同様に文字画像
の黒点数を計数し、文字認識結果と黒点数の計数結果に
応じて、再度、2値化しなおす必要があるか否かを判定
する。以上の処理を、2値化しなおす必要がないと判定
されるまで繰り返し行い、最終的な文字認識結果を入力
画像の読取結果として出力するというものである。この
ように、本実施例は、文字の潰れやかすれの具合を文字
認識の結果および文字の黒点数等の特徴量に基づいて計
測し、その計測結果にしたがって、容易にかつ高精度に
最適な再2値化のための閾値を設定することができる。
【0014】図1は、本実施例の文字認識装置の構成を
示すブロック図であり、画像入力部10は、多値画像を
入力するものである。多値画像の形式は、各画素につい
て濃度情報を有している画像であり、スキャナから光学
的に入力された信号であっても、予めファイル装置等の
記憶手段に記憶しておいた画像データを読み出したもの
であってもかまわない。ここで、前者の場合には、画像
入力部10として、光学スキャナを、また、後者の場合
には、ファイルデータ読出装置を適用することになる。
示すブロック図であり、画像入力部10は、多値画像を
入力するものである。多値画像の形式は、各画素につい
て濃度情報を有している画像であり、スキャナから光学
的に入力された信号であっても、予めファイル装置等の
記憶手段に記憶しておいた画像データを読み出したもの
であってもかまわない。ここで、前者の場合には、画像
入力部10として、光学スキャナを、また、後者の場合
には、ファイルデータ読出装置を適用することになる。
【0015】2値化処理部20は、画像入力部10で入
力された多値画像を予め設定された閾値で2値化する。
この閾値は、画像入力部や、濃度補正処理等に依存する
ものであり、実験的に設定されるものである。
力された多値画像を予め設定された閾値で2値化する。
この閾値は、画像入力部や、濃度補正処理等に依存する
ものであり、実験的に設定されるものである。
【0016】文字切出し部30は、2値化処理部20に
より2値化された2値画像から、1文字ずつの文字画像
を切り出すものである。帳票OCRのように予め読取位
置が定まっている場合には、与えられた読取位置を示す
座標から直接文字画像を切り出す。また、文書OCRに
おけるページ画像やカメラ入力の画像などの場合には、
読取対象部分を解析により自動的に抽出して、文字画像
を切り出す。これらの文字切出し方法は、本発明の本質
ではなく、既に、開示されている多くの従来技術から、
入力画像の形成等により適宜適切な方法を選択して実行
すればよいものである。なお、本実施例では、各読取対
象の文字画像の2値画像の切出し位置を文字切出し部3
0内のメモリに格納しておく。この文字画像の切出し位
置は、後述される再2値化処理部90における処理で使
用される。
より2値化された2値画像から、1文字ずつの文字画像
を切り出すものである。帳票OCRのように予め読取位
置が定まっている場合には、与えられた読取位置を示す
座標から直接文字画像を切り出す。また、文書OCRに
おけるページ画像やカメラ入力の画像などの場合には、
読取対象部分を解析により自動的に抽出して、文字画像
を切り出す。これらの文字切出し方法は、本発明の本質
ではなく、既に、開示されている多くの従来技術から、
入力画像の形成等により適宜適切な方法を選択して実行
すればよいものである。なお、本実施例では、各読取対
象の文字画像の2値画像の切出し位置を文字切出し部3
0内のメモリに格納しておく。この文字画像の切出し位
置は、後述される再2値化処理部90における処理で使
用される。
【0017】文字認識部40は、文字辞書50に格納さ
れている参照パターンと、文字切出し部30により1文
字ごとに切り出された文字画像とを照合するものであ
る。本実施例では、文字画像が文字辞書50内のどの参
照パターンを利用して認識されたかがわかればよいた
め、その具体的な手法は、多数提案されている従来の技
術の文字認識方法のいずれでもかまわない。ただし、文
字認識部40では、文字画像の変形を許容できる度合
い、つまり、読み取ることが可能な文字画像の変形の度
合い(以下、変形吸収能力)を高く設定しておく。こう
すると、2値化処理部20で多値画像を2値化する際に
使用された閾値が不適当な値であって、2値化して得ら
れる文字画像が変形していたとしても、その文字画像を
文字辞書50内のいずれかの参照パターンを利用して認
識することが可能となる。つまり、図8(b)に示す文
字画像が「6」の参照パターンにより判定されることも
あれば、「8」の参照パターンにより判定されることも
ある。この際、文字認識における変形吸収能力を高く設
定したことにより、誤認識の発生率が高くなるが、後述
するように、本実施例では、閾値を変更して再2値化処
理を行った後、再度、文字認識を行うように構成されて
いるため、変形吸収能力を高く設定することによる認識
率の低減は、最終的な文字画像の読取結果には反映され
ない。
れている参照パターンと、文字切出し部30により1文
字ごとに切り出された文字画像とを照合するものであ
る。本実施例では、文字画像が文字辞書50内のどの参
照パターンを利用して認識されたかがわかればよいた
め、その具体的な手法は、多数提案されている従来の技
術の文字認識方法のいずれでもかまわない。ただし、文
字認識部40では、文字画像の変形を許容できる度合
い、つまり、読み取ることが可能な文字画像の変形の度
合い(以下、変形吸収能力)を高く設定しておく。こう
すると、2値化処理部20で多値画像を2値化する際に
使用された閾値が不適当な値であって、2値化して得ら
れる文字画像が変形していたとしても、その文字画像を
文字辞書50内のいずれかの参照パターンを利用して認
識することが可能となる。つまり、図8(b)に示す文
字画像が「6」の参照パターンにより判定されることも
あれば、「8」の参照パターンにより判定されることも
ある。この際、文字認識における変形吸収能力を高く設
定したことにより、誤認識の発生率が高くなるが、後述
するように、本実施例では、閾値を変更して再2値化処
理を行った後、再度、文字認識を行うように構成されて
いるため、変形吸収能力を高く設定することによる認識
率の低減は、最終的な文字画像の読取結果には反映され
ない。
【0018】黒点数計数部60は、文字切出し部30に
より1文字ごとに切り出された文字画像における黒点数
を計数するものである。2値画像の黒点を1、白点を0
とし、文字切出し部30から送出される文字画像中の1
の数を計数する処理であり、周知技術であるため、詳細
な説明は省略する。
より1文字ごとに切り出された文字画像における黒点数
を計数するものである。2値画像の黒点を1、白点を0
とし、文字切出し部30から送出される文字画像中の1
の数を計数する処理であり、周知技術であるため、詳細
な説明は省略する。
【0019】再2値化判定部70は、文字認識部40か
ら送られる情報と黒点数計数部60から送られる文字画
像の黒点数とに基づいて、閾値を変えて、再度、2値化
処理を行うか否かを判定する。
ら送られる情報と黒点数計数部60から送られる文字画
像の黒点数とに基づいて、閾値を変えて、再度、2値化
処理を行うか否かを判定する。
【0020】閾値変更部80は、再2値化判定部70
で、再2値化を行う必要があると判定された場合に、再
2値化判定部70から送られる情報に基づいて2値化処
理部20で用いられた閾値とは異なる新たな閾値を設定
し、その変更後の閾値を再2値化処理部90に送出す
る。
で、再2値化を行う必要があると判定された場合に、再
2値化判定部70から送られる情報に基づいて2値化処
理部20で用いられた閾値とは異なる新たな閾値を設定
し、その変更後の閾値を再2値化処理部90に送出す
る。
【0021】再2値化処理部90は、文字切出し部30
で既に算出されている1文字ごとの切出し位置を参照し
て、多値画像のうち再2値化が必要である判定された文
字画像を含む領域を閾値変更部80により変更された新
たな閾値を用いて2値化する。
で既に算出されている1文字ごとの切出し位置を参照し
て、多値画像のうち再2値化が必要である判定された文
字画像を含む領域を閾値変更部80により変更された新
たな閾値を用いて2値化する。
【0022】次に、本実施例の動作について図1、図2
および図3を参照して説明する。図2は、本実施例で用
いられる文字辞書の登録内容を示す図であり、図3は、
図1における閾値変更部の構成を示すブロック図であ
る。なお、画像入力部10で多値画像が入力されてか
ら、文字切出し部30で文字切出し処理が行われるまで
の処理は、周知慣用技術であるため、説明は省略する。
および図3を参照して説明する。図2は、本実施例で用
いられる文字辞書の登録内容を示す図であり、図3は、
図1における閾値変更部の構成を示すブロック図であ
る。なお、画像入力部10で多値画像が入力されてか
ら、文字切出し部30で文字切出し処理が行われるまで
の処理は、周知慣用技術であるため、説明は省略する。
【0023】本実施例では、図2に示すような文字辞書
50を用いる。この文字辞書50には、格納される各参
照パターン51ごとに、その参照パターンを利用して認
識される文字画像の黒点の計数値として許容される範囲
52が予め登録されている。そして、文字認識部40か
ら、文字画像の認識結果とともに、認識する際に用いら
れた参照パターンに応じた黒点計数値の許容範囲が再2
値化判定部70に送出される。再2値化判定部70で
は、黒点数計数部60から送られる文字画像の黒点計数
値と文字認識部40から送られる黒点計数値の許容範囲
とが比較される。そして、黒点計数部60から送られる
黒点計数値が黒点数の許容範囲内に入れば、文字認識部
40から送られる認識結果が最終的な読取結果として出
力される。また、黒点計数部60から送られる黒点計数
値が前述の許容範囲内に入らなければ、再度、2値化が
必要であると判定されるとともに、黒点計数値と許容範
囲の大小関係が閾値変更部80に出力される。なお、文
字認識部40において、文字画像をいずれの参照パター
ンを利用しても認識できなかった場合には、再2値化判
定部70は、認識不能信号を閾値変更部80に出力す
る。
50を用いる。この文字辞書50には、格納される各参
照パターン51ごとに、その参照パターンを利用して認
識される文字画像の黒点の計数値として許容される範囲
52が予め登録されている。そして、文字認識部40か
ら、文字画像の認識結果とともに、認識する際に用いら
れた参照パターンに応じた黒点計数値の許容範囲が再2
値化判定部70に送出される。再2値化判定部70で
は、黒点数計数部60から送られる文字画像の黒点計数
値と文字認識部40から送られる黒点計数値の許容範囲
とが比較される。そして、黒点計数部60から送られる
黒点計数値が黒点数の許容範囲内に入れば、文字認識部
40から送られる認識結果が最終的な読取結果として出
力される。また、黒点計数部60から送られる黒点計数
値が前述の許容範囲内に入らなければ、再度、2値化が
必要であると判定されるとともに、黒点計数値と許容範
囲の大小関係が閾値変更部80に出力される。なお、文
字認識部40において、文字画像をいずれの参照パター
ンを利用しても認識できなかった場合には、再2値化判
定部70は、認識不能信号を閾値変更部80に出力す
る。
【0024】再2値化判定部70から黒点計数値と許容
範囲の大小関係が出力されると、閾値変更部80におけ
る変更方向設定部81では、閾値の変更方向が設定され
る。つまり、黒点計数値が許容範囲よりも大きい場合に
は、閾値を大きくする(言い換えれば、2値化文字画像
を薄くする)方向に閾値変更方向が設定される。逆に、
黒点計数値が許容範囲よりも小さい場合には、閾値を小
さくする(言い換えれば、2値化文字画像を濃くする)
方向に閾値変更方向が設定される。
範囲の大小関係が出力されると、閾値変更部80におけ
る変更方向設定部81では、閾値の変更方向が設定され
る。つまり、黒点計数値が許容範囲よりも大きい場合に
は、閾値を大きくする(言い換えれば、2値化文字画像
を薄くする)方向に閾値変更方向が設定される。逆に、
黒点計数値が許容範囲よりも小さい場合には、閾値を小
さくする(言い換えれば、2値化文字画像を濃くする)
方向に閾値変更方向が設定される。
【0025】設定された閾値の変更方向は、比較部82
により、前回の閾値の変更方向と比較される。前回の閾
値の変更方向は、履歴記憶部84に記憶されている。比
較部82により、閾値の変更方向が、前回のものと逆方
向、例えば、前回、閾値を大きくする方向に変更したに
もかかわらず、今回、閾値を小さくする方向に変更する
ように設定されている場合には、この文字画像は読取不
能であると判定される。一方、閾値の変更方向が、前回
のものと同一方向である場合には、そのまま、閾値の変
更方向を閾値設定部83に送出する。また、はじめての
閾値変更処理の場合にも、同様に、変更方向設定部81
で設定された閾値の変更方向が閾値設定部83に送出さ
れる。この際、今回の閾値の変更方向は、履歴記憶部8
4に格納される。
により、前回の閾値の変更方向と比較される。前回の閾
値の変更方向は、履歴記憶部84に記憶されている。比
較部82により、閾値の変更方向が、前回のものと逆方
向、例えば、前回、閾値を大きくする方向に変更したに
もかかわらず、今回、閾値を小さくする方向に変更する
ように設定されている場合には、この文字画像は読取不
能であると判定される。一方、閾値の変更方向が、前回
のものと同一方向である場合には、そのまま、閾値の変
更方向を閾値設定部83に送出する。また、はじめての
閾値変更処理の場合にも、同様に、変更方向設定部81
で設定された閾値の変更方向が閾値設定部83に送出さ
れる。この際、今回の閾値の変更方向は、履歴記憶部8
4に格納される。
【0026】閾値設定部83では、比較部82から送ら
れる閾値の変更方向および履歴記憶部84から読み出さ
れる今回の閾値とに基づいて、新たな閾値が設定され
る。そして、新たに設定された閾値は、履歴記憶部84
に格納される。こうして、設定された閾値が、再2値化
処理部90に送出され、再2値化処理部90により、そ
の新たな閾値を用いて、画像入力部10から送出される
多値画像が2値化される。この際、既に説明したとお
り、文字切出し部30からの文字切出し位置情報を参照
することにより、多値画像のうち再2値化が必要である
と判定された文字画像を含む領域だけが再2値化される
ことになる。なお、閾値設定部83による閾値の設定の
際、最大濃度レベルと等しい閾値をさらに大きくするよ
うに変更する場合や、最小濃度レベルと等しい閾値をさ
らに小さくするように変更する場合には、その文字画像
は、読取不能であると判定される。
れる閾値の変更方向および履歴記憶部84から読み出さ
れる今回の閾値とに基づいて、新たな閾値が設定され
る。そして、新たに設定された閾値は、履歴記憶部84
に格納される。こうして、設定された閾値が、再2値化
処理部90に送出され、再2値化処理部90により、そ
の新たな閾値を用いて、画像入力部10から送出される
多値画像が2値化される。この際、既に説明したとお
り、文字切出し部30からの文字切出し位置情報を参照
することにより、多値画像のうち再2値化が必要である
と判定された文字画像を含む領域だけが再2値化される
ことになる。なお、閾値設定部83による閾値の設定の
際、最大濃度レベルと等しい閾値をさらに大きくするよ
うに変更する場合や、最小濃度レベルと等しい閾値をさ
らに小さくするように変更する場合には、その文字画像
は、読取不能であると判定される。
【0027】再2値化判定部70から認識不能信号が送
出されると、閾値変更部80における読出部85によ
り、履歴記憶部84に格納されている今回の閾値および
その際の閾値の変更方向が読み出され、それらが閾値設
定部83に送出される。閾値設定部83は、読み出され
た今回の閾値を、前回の変更方向と同一方向に修正して
新たな閾値を設定する。ここで、読出部85に読み出さ
れた今回の閾値が、予め設定された初期値であり、閾値
変更方向を示すデータが存在しない場合には、閾値設定
部83により、最小の濃度レベルに近い値もしくは最大
の濃度レベルに近い値が新たな閾値として設定される。
そして、その新たな閾値とともに、閾値変更方向とし
て、最小の濃度レベルに近い値が設定された場合には閾
値を大きくする方向が、また、最大の濃度レベルに近い
値が設定された場合には閾値を小さくする方向が履歴記
憶部84に格納され、以降の閾値の変更設定処理の際に
用いられる。そして、既に説明したとおり、閾値設定部
83で設定された新たな閾値を用いて、再2値化処理部
90により、多値画像が2値化される。なお、前述のと
おり、閾値設定部83による閾値の設定の際、最大濃度
レベルと等しい閾値をさらに大きくするように変更する
場合や、最小濃度レベルと等しい閾値をさらに小さくす
るように変更する場合には、その文字画像は、読取不能
と判定される。
出されると、閾値変更部80における読出部85によ
り、履歴記憶部84に格納されている今回の閾値および
その際の閾値の変更方向が読み出され、それらが閾値設
定部83に送出される。閾値設定部83は、読み出され
た今回の閾値を、前回の変更方向と同一方向に修正して
新たな閾値を設定する。ここで、読出部85に読み出さ
れた今回の閾値が、予め設定された初期値であり、閾値
変更方向を示すデータが存在しない場合には、閾値設定
部83により、最小の濃度レベルに近い値もしくは最大
の濃度レベルに近い値が新たな閾値として設定される。
そして、その新たな閾値とともに、閾値変更方向とし
て、最小の濃度レベルに近い値が設定された場合には閾
値を大きくする方向が、また、最大の濃度レベルに近い
値が設定された場合には閾値を小さくする方向が履歴記
憶部84に格納され、以降の閾値の変更設定処理の際に
用いられる。そして、既に説明したとおり、閾値設定部
83で設定された新たな閾値を用いて、再2値化処理部
90により、多値画像が2値化される。なお、前述のと
おり、閾値設定部83による閾値の設定の際、最大濃度
レベルと等しい閾値をさらに大きくするように変更する
場合や、最小濃度レベルと等しい閾値をさらに小さくす
るように変更する場合には、その文字画像は、読取不能
と判定される。
【0028】再2値化処理部90で再度、2値化され得
られた文字画像は、再び文字認識部40で文字認識され
る。以上の処理が、個々の文字画像ごとに、読取結果が
出力されるか、または、読取不能と判定されるまで繰り
返される。
られた文字画像は、再び文字認識部40で文字認識され
る。以上の処理が、個々の文字画像ごとに、読取結果が
出力されるか、または、読取不能と判定されるまで繰り
返される。
【0029】前述の文字辞書50に登録される各参照パ
ターンごとの黒点数の許容範囲は、予め実験により決定
される最適な範囲が設定される。つまり、実際に文字の
読み取りを行い、参照パターンごとに正読された場合の
2値文字画像の黒点数の分布と、正読されなかった場合
の黒点数の分布とを作成し、その黒点数の分布に基づい
て、誤読や読取不能が極力発生しないような黒点数の範
囲を設定する。
ターンごとの黒点数の許容範囲は、予め実験により決定
される最適な範囲が設定される。つまり、実際に文字の
読み取りを行い、参照パターンごとに正読された場合の
2値文字画像の黒点数の分布と、正読されなかった場合
の黒点数の分布とを作成し、その黒点数の分布に基づい
て、誤読や読取不能が極力発生しないような黒点数の範
囲を設定する。
【0030】また、閾値を変更する際の変更幅は、濃度
の階調の設定、入力機器や画像補正の性質等に応じて適
宜設定すればよいが、例えば、黒点数計数部60から再
2値化判定部70に送られる黒点数と黒点数の許容範囲
との近さに応じて動的に変化させてもよい。つまり、黒
点数計数部60から送られる黒点数が、許容範囲の上限
の1〜1.5倍までであれば、変更幅を1階調の濃度レ
ベルとし、黒点数が、許容範囲の上限の1.5倍〜2倍
までであれば、変更幅を2階調の濃度レベルとする。ま
た、黒点数が、許容範囲の下限の1倍〜1/2倍までで
あれば、変更幅を1階調の濃度レベルとし、許容範囲の
下限の1/2〜1/3倍までであれば、変更幅を2階調
の濃度レベルとする。
の階調の設定、入力機器や画像補正の性質等に応じて適
宜設定すればよいが、例えば、黒点数計数部60から再
2値化判定部70に送られる黒点数と黒点数の許容範囲
との近さに応じて動的に変化させてもよい。つまり、黒
点数計数部60から送られる黒点数が、許容範囲の上限
の1〜1.5倍までであれば、変更幅を1階調の濃度レ
ベルとし、黒点数が、許容範囲の上限の1.5倍〜2倍
までであれば、変更幅を2階調の濃度レベルとする。ま
た、黒点数が、許容範囲の下限の1倍〜1/2倍までで
あれば、変更幅を1階調の濃度レベルとし、許容範囲の
下限の1/2〜1/3倍までであれば、変更幅を2階調
の濃度レベルとする。
【0031】なお、再2値化処理部90において、前回
の閾値よりも小さい、つまり、文字画像が濃くなる方向
に再2値化処理が行われた場合、文字切出し枠よりも2
値化された文字画像が大きくなってしまう場合がある。
そこで、文字切出し部30で取得された文字切出し枠と
中心が同じで面積を大きくした枠を設定し、その枠内で
再2値化された文字画像の外接矩形を再度設定する等の
処理を行う。
の閾値よりも小さい、つまり、文字画像が濃くなる方向
に再2値化処理が行われた場合、文字切出し枠よりも2
値化された文字画像が大きくなってしまう場合がある。
そこで、文字切出し部30で取得された文字切出し枠と
中心が同じで面積を大きくした枠を設定し、その枠内で
再2値化された文字画像の外接矩形を再度設定する等の
処理を行う。
【0032】さらに、文字辞書50には、参照パターン
のみを登録しておき、参照パターンに対応する黒点数の
許容範囲は、再2値化判定部70内に設けるテーブルに
格納しておいてもよい。つまり、文字認識部60は、文
字認識処理で判定結果を与えた参照パターンを再2値化
判定部70に送出し、再2値化判定部70は、前述のテ
ーブルを参照して、得られた参照パターンに対応した黒
点数の許容範囲を得るように構成してもよい。
のみを登録しておき、参照パターンに対応する黒点数の
許容範囲は、再2値化判定部70内に設けるテーブルに
格納しておいてもよい。つまり、文字認識部60は、文
字認識処理で判定結果を与えた参照パターンを再2値化
判定部70に送出し、再2値化判定部70は、前述のテ
ーブルを参照して、得られた参照パターンに対応した黒
点数の許容範囲を得るように構成してもよい。
【0033】次に、本発明の第2の実施例について図4
を参照して説明する。
を参照して説明する。
【0034】本実施例は、前述の第1の実施例における
再2値化判定部における再2値化の判定基準として、2
値化された文字画像における黒点数に変えて、文字画像
の輪郭長を用いるものであり、全体の処理自体は、第1
の実施例と同様であるため、重複部分の説明は省略す
る。
再2値化判定部における再2値化の判定基準として、2
値化された文字画像における黒点数に変えて、文字画像
の輪郭長を用いるものであり、全体の処理自体は、第1
の実施例と同様であるため、重複部分の説明は省略す
る。
【0035】図4は、本実施例の構成を示すブロック図
であり、図1に示す第1の実施例の構成における黒点数
計数部60の変わりに、文字画像の輪郭長を計測する輪
郭長計測部100が設けられ、さらに、各参照パターン
ごとに許容される輪郭長の範囲が登録された文字辞書5
3が設けられている。輪郭長計測部100では、輪郭追
跡アルゴリズムを用いて正確に文字画像の輪郭長を計測
することができる。輪郭追跡アルゴリズムは、ラン追跡
や3×3のマスクによる追跡が広く知られており、周知
慣用技術であるため説明は省略する。
であり、図1に示す第1の実施例の構成における黒点数
計数部60の変わりに、文字画像の輪郭長を計測する輪
郭長計測部100が設けられ、さらに、各参照パターン
ごとに許容される輪郭長の範囲が登録された文字辞書5
3が設けられている。輪郭長計測部100では、輪郭追
跡アルゴリズムを用いて正確に文字画像の輪郭長を計測
することができる。輪郭追跡アルゴリズムは、ラン追跡
や3×3のマスクによる追跡が広く知られており、周知
慣用技術であるため説明は省略する。
【0036】文字認識部41では、文字切出し部30か
ら送出される文字画像を文字辞書53内の参照パターン
を用いて文字認識し、その認識結果とともに、用いた参
照パターンに対応した輪郭長の許容範囲が再2値化判定
部71に送出される。再2値化判定部71では、輪郭長
計測部100から送られる文字画像の輪郭長と文字認識
部41から送られる輪郭長の許容範囲とが比較され、そ
の比較結果に基づいて、再2値化の必要性が判定され
る。その他の処理は、第1の実施例とほとんど同様であ
るため説明を省略する。
ら送出される文字画像を文字辞書53内の参照パターン
を用いて文字認識し、その認識結果とともに、用いた参
照パターンに対応した輪郭長の許容範囲が再2値化判定
部71に送出される。再2値化判定部71では、輪郭長
計測部100から送られる文字画像の輪郭長と文字認識
部41から送られる輪郭長の許容範囲とが比較され、そ
の比較結果に基づいて、再2値化の必要性が判定され
る。その他の処理は、第1の実施例とほとんど同様であ
るため説明を省略する。
【0037】文字画像の輪郭長は、情報量が黒点数に比
べて多いために、これを再2値化の判定基準として用い
ることにより、よりきめ細かな再2値化の判断および閾
値の設定を行うことが可能となる。
べて多いために、これを再2値化の判定基準として用い
ることにより、よりきめ細かな再2値化の判断および閾
値の設定を行うことが可能となる。
【0038】なお、第1の実施例および第2の実施例で
は、再2値化の判定基準である文字画像の特徴量として
黒点数または輪郭長を用いたが、同様の効果を発揮する
他の文字画像の特徴量を適用してもよいことは言うまで
もない。
は、再2値化の判定基準である文字画像の特徴量として
黒点数または輪郭長を用いたが、同様の効果を発揮する
他の文字画像の特徴量を適用してもよいことは言うまで
もない。
【0039】次に、本発明の第3の実施例について図5
を参照して説明する。
を参照して説明する。
【0040】前述の第1および第2の実施例では、印字
文字のように規格がはっきりしている場合の読取には有
効であるが、読取対象が手書き文字や大きさが非常にば
らついている印字文字である場合には、文字画像の大き
さが大きく変化してしまうため、精度よく認識できない
こともある。そこで、本実施例では、1文字ごとに切り
出された文字画像を正規化する手段を設けることによ
り、文字画像の大きさのばらつきによる認識率の低下を
防止するというものである。
文字のように規格がはっきりしている場合の読取には有
効であるが、読取対象が手書き文字や大きさが非常にば
らついている印字文字である場合には、文字画像の大き
さが大きく変化してしまうため、精度よく認識できない
こともある。そこで、本実施例では、1文字ごとに切り
出された文字画像を正規化する手段を設けることによ
り、文字画像の大きさのばらつきによる認識率の低下を
防止するというものである。
【0041】図5は、本実施例の構成を示すブロック図
であり、本実施例の構成の大部分が前述の第1の実施例
の構成と同様であるため、重複部分の説明は省略する。
正規化部120は、文字切出し部30により1文字ごと
に切り出された各文字画像の特徴量(例えば、黒点数や
輪郭長)を一定範囲内の値にするように、文字切出し部
30から送られる文字画像の大きさ正規化する。正規化
の方法は、文字画像の外接矩形の大きさを各文字画像ご
とに一定にする方法、各文字画像ごとに外接矩形の縦横
比を変化させずにその面積を一定にする方法および各文
字画像ごとの1次モーメントや2次モーメントを一定に
する方法等を使用することができる。文字認識部40
は、正規化された文字画像を文字認識し、また、黒点数
計数部60は、正規化された文字画像の黒点数を計数す
る。その他の処理は、前述の第1の実施例と同様であ
る。なお、黒点数計数部60および文字辞書50の代わ
りに第2の実施例における輪郭長計測部100および文
字辞書53を用いてもかまわないことは言うまでもな
い。
であり、本実施例の構成の大部分が前述の第1の実施例
の構成と同様であるため、重複部分の説明は省略する。
正規化部120は、文字切出し部30により1文字ごと
に切り出された各文字画像の特徴量(例えば、黒点数や
輪郭長)を一定範囲内の値にするように、文字切出し部
30から送られる文字画像の大きさ正規化する。正規化
の方法は、文字画像の外接矩形の大きさを各文字画像ご
とに一定にする方法、各文字画像ごとに外接矩形の縦横
比を変化させずにその面積を一定にする方法および各文
字画像ごとの1次モーメントや2次モーメントを一定に
する方法等を使用することができる。文字認識部40
は、正規化された文字画像を文字認識し、また、黒点数
計数部60は、正規化された文字画像の黒点数を計数す
る。その他の処理は、前述の第1の実施例と同様であ
る。なお、黒点数計数部60および文字辞書50の代わ
りに第2の実施例における輪郭長計測部100および文
字辞書53を用いてもかまわないことは言うまでもな
い。
【0042】次に、本発明の第4の実施例について図6
および図7を参照して説明する。
および図7を参照して説明する。
【0043】本実施例は、文字認識の際に用いられる参
照パターンに付加された濃度情報(「濃」、「標準」お
よび「薄」の3種類)に基づいて、再2値化の必要性を
判定するというものである。
照パターンに付加された濃度情報(「濃」、「標準」お
よび「薄」の3種類)に基づいて、再2値化の必要性を
判定するというものである。
【0044】図6は、本実施例の構成を示すブロック図
であり、文字辞書54は、図7に示すように、標準参照
パターン用辞書541、濃参照パターン用辞書542お
よび薄参照パターン用辞書543を備えている。この文
字辞書54の作成方法について説明する。文字を入力し
て得られた多値画像から、その文字を読み取るのに最適
な2値化閾値で2値化して得られるパターンを標準参照
パターン用辞書541に登録する。また、その最適な2
値化閾値よりも濃い閾値(濃度レベルとしては小さい閾
値)でその多値画像を2値化して得られるパターンを濃
参照パターン用辞書542に登録する。また、その最適
な2値化閾値よりも薄い閾値(濃度レベルとしては大き
い閾値)でその多値画像を2値化して得られるパターン
を薄参照パターン用辞書543に登録する。このよう
に、同一の文字を入力して得られた多値画像を3種類の
閾値で2値化して得られる3つの参照パターンを閾値の
濃度別にそれぞれ登録する。
であり、文字辞書54は、図7に示すように、標準参照
パターン用辞書541、濃参照パターン用辞書542お
よび薄参照パターン用辞書543を備えている。この文
字辞書54の作成方法について説明する。文字を入力し
て得られた多値画像から、その文字を読み取るのに最適
な2値化閾値で2値化して得られるパターンを標準参照
パターン用辞書541に登録する。また、その最適な2
値化閾値よりも濃い閾値(濃度レベルとしては小さい閾
値)でその多値画像を2値化して得られるパターンを濃
参照パターン用辞書542に登録する。また、その最適
な2値化閾値よりも薄い閾値(濃度レベルとしては大き
い閾値)でその多値画像を2値化して得られるパターン
を薄参照パターン用辞書543に登録する。このよう
に、同一の文字を入力して得られた多値画像を3種類の
閾値で2値化して得られる3つの参照パターンを閾値の
濃度別にそれぞれ登録する。
【0045】文字認識部42は、文字切出し部30から
送出される文字画像を文字辞書54の参照パターンを用
いて認識するとともに、用いた参照パターンが標準参照
パターン用辞書541、濃参照パターン用辞書542ま
たは薄参照パターン用辞書543のいずれの辞書に登録
されているものなのかを検出する。この際、使用する辞
書を限定するのではなく、3つの辞書に登録された全て
の参照パターンと文字画像とが照合される。そして、文
字の認識結果とともに、参照パターンが登録されていた
辞書の濃度情報(「標準濃度」、「濃い濃度」または
「薄い濃度」のいずれか)が再2値化判定部72に出力
される。
送出される文字画像を文字辞書54の参照パターンを用
いて認識するとともに、用いた参照パターンが標準参照
パターン用辞書541、濃参照パターン用辞書542ま
たは薄参照パターン用辞書543のいずれの辞書に登録
されているものなのかを検出する。この際、使用する辞
書を限定するのではなく、3つの辞書に登録された全て
の参照パターンと文字画像とが照合される。そして、文
字の認識結果とともに、参照パターンが登録されていた
辞書の濃度情報(「標準濃度」、「濃い濃度」または
「薄い濃度」のいずれか)が再2値化判定部72に出力
される。
【0046】再2値化判定部72では、文字認識部42
から送られた濃度情報に基づいて、再2値化の必要性が
判定される。文字認識部42から濃度情報として「標準
濃度」が出力された場合に限り、再2値化の必要性がな
いと判定され、濃度情報と同時に文字認識部42から出
力された認識結果が最終的な読取結果として出力され
る。これに対し、文字認識部42から送られた濃度情報
が、「濃い濃度」または「薄い濃度」である場合には、
再2値化が必要であると判定され、その濃度情報が閾値
変更部86に出力される。
から送られた濃度情報に基づいて、再2値化の必要性が
判定される。文字認識部42から濃度情報として「標準
濃度」が出力された場合に限り、再2値化の必要性がな
いと判定され、濃度情報と同時に文字認識部42から出
力された認識結果が最終的な読取結果として出力され
る。これに対し、文字認識部42から送られた濃度情報
が、「濃い濃度」または「薄い濃度」である場合には、
再2値化が必要であると判定され、その濃度情報が閾値
変更部86に出力される。
【0047】閾値変更部86では、基本的には、図1に
示す第1の実施例における閾値変更部80と同様の処理
が実行される。第1の実施例では、閾値変更部80は、
再2値化判定部70から出力される黒点計数値とその許
容範囲との大小関係に基づいて、新たな閾値が設定され
るが、本実施例では、閾値変更部86は、再2値化判定
部72から出力される「濃い濃度」または「薄い濃度」
の濃度情報に基づいて、新たな閾値が設定される。ここ
で、閾値変更部86では、「濃い濃度」の濃度情報が供
給された場合には、第1の実施例における黒点計数値が
許容範囲よりも大きい場合と同様の処理が実行される。
つまり、元の閾値を薄くする方向(閾値の濃度レベルを
大きくする方向)に変更して得られる閾値が再2値化の
ための新たな閾値として設定される。一方、「薄い濃
度」の濃度情報が供給された場合には、第1の実施例に
おける黒点計数値が許容範囲よりも小さい場合と同様の
処理が実行される。つまり、元の閾値を濃くする方向
(閾値の濃度レベルを小さくする方向)に変更して得ら
れる閾値が再2値化のための新たな閾値として設定され
る。そして、再2値化処理部90は、閾値変更部86で
変更された新たな閾値を用いて画像入力部10から送出
される多値画像を2値化し、2値化して得られる文字画
像を文字認識部42に供給する。なお、本実施例におい
て、特に説明していない部分の動作は、前述の第1の実
施例の動作と同様である。
示す第1の実施例における閾値変更部80と同様の処理
が実行される。第1の実施例では、閾値変更部80は、
再2値化判定部70から出力される黒点計数値とその許
容範囲との大小関係に基づいて、新たな閾値が設定され
るが、本実施例では、閾値変更部86は、再2値化判定
部72から出力される「濃い濃度」または「薄い濃度」
の濃度情報に基づいて、新たな閾値が設定される。ここ
で、閾値変更部86では、「濃い濃度」の濃度情報が供
給された場合には、第1の実施例における黒点計数値が
許容範囲よりも大きい場合と同様の処理が実行される。
つまり、元の閾値を薄くする方向(閾値の濃度レベルを
大きくする方向)に変更して得られる閾値が再2値化の
ための新たな閾値として設定される。一方、「薄い濃
度」の濃度情報が供給された場合には、第1の実施例に
おける黒点計数値が許容範囲よりも小さい場合と同様の
処理が実行される。つまり、元の閾値を濃くする方向
(閾値の濃度レベルを小さくする方向)に変更して得ら
れる閾値が再2値化のための新たな閾値として設定され
る。そして、再2値化処理部90は、閾値変更部86で
変更された新たな閾値を用いて画像入力部10から送出
される多値画像を2値化し、2値化して得られる文字画
像を文字認識部42に供給する。なお、本実施例におい
て、特に説明していない部分の動作は、前述の第1の実
施例の動作と同様である。
【0048】なお、濃度情報を、「極薄濃度」、「薄濃
度」、「標準濃度」、「濃濃度」、「極濃濃度」のごと
く、さらに細かく設定してもよく、この場合は、文字辞
書54内に設けられる辞書の数も増えることになる。
度」、「標準濃度」、「濃濃度」、「極濃濃度」のごと
く、さらに細かく設定してもよく、この場合は、文字辞
書54内に設けられる辞書の数も増えることになる。
【0049】
【発明の効果】以上説明したように、本発明によれば、
文字認識の結果および2値化文字画像の黒点計数値また
は輪郭長に基づいて、閾値を変更しての再2値化を行う
か否かを判定し、最終的に、最適な閾値を用いて、多値
画像を2値化しているために、読取対象の濃度の変化が
大きい場合でも、参照パターンのフォント数等を限定す
ることなく、正確に読み取ることができる。特に、輪郭
長を再2値化の判定基準として用いることにより、読取
精度を向上させることができる。
文字認識の結果および2値化文字画像の黒点計数値また
は輪郭長に基づいて、閾値を変更しての再2値化を行う
か否かを判定し、最終的に、最適な閾値を用いて、多値
画像を2値化しているために、読取対象の濃度の変化が
大きい場合でも、参照パターンのフォント数等を限定す
ることなく、正確に読み取ることができる。特に、輪郭
長を再2値化の判定基準として用いることにより、読取
精度を向上させることができる。
【0050】さらに、第3の実施例では、文字画像を正
規化した後、その文字画像の黒点計数値や輪郭長を計測
するように構成しているために、手書き文字や大きさの
一定しない印字文字も、高精度に読み取ることができ
る。
規化した後、その文字画像の黒点計数値や輪郭長を計測
するように構成しているために、手書き文字や大きさの
一定しない印字文字も、高精度に読み取ることができ
る。
【0051】さらに、第4の実施例は、H/W等、繰り
返し処理の方が有効な形態では、本発明を効率よく実現
することができる。
返し処理の方が有効な形態では、本発明を効率よく実現
することができる。
【図1】本発明の第1の実施例の構成を示すブロック図
である。
である。
【図2】図1における文字辞書に格納された内容を示す
図である。
図である。
【図3】図1における閾値変更部の構成を示すブロック
図である。
図である。
【図4】本発明の第2の実施例の構成を示すブロック図
である。
である。
【図5】本発明の第3の実施例の構成を示すブロック図
である。
である。
【図6】本発明の第4の実施例の構成を示すブロック図
である。
である。
【図7】図6における文字辞書の内容を示すブロック図
である。
である。
【図8】文字画像の一例であり、(a)は、通常の濃度
で印字された文字の場合を示し、(b)は、(a)の文
字とは異なる濃度で印字された文字の場合を示す。
で印字された文字の場合を示し、(b)は、(a)の文
字とは異なる濃度で印字された文字の場合を示す。
【図9】文字画像の他の例であり、(a)は、通常の濃
度で印字された文字の場合を示し、(b)は、(a)の
文字とは異なる濃度で印字された文字の場合を示す。
度で印字された文字の場合を示し、(b)は、(a)の
文字とは異なる濃度で印字された文字の場合を示す。
10 画像入力部 20 2値化処理部 30 文字切出し部 40、41、42 文字認識部 50、53、54 文字辞書 51 参照パターン 52 黒点数許容範囲 541 標準参照パターン用辞書 542 濃参照パターン用辞書 543 薄参照パターン用辞書 60 黒点数計数部 70、71、72 再2値化判定部 80、86 閾値変更部 81 変更方向設定部 82 比較部 83 閾値設定部 84 履歴記憶部 85 読出部 90 再2値化処理部 100 輪郭長計測部 110 正規化部
Claims (10)
- 【請求項1】 読取対象の多値画像を入力する画像入力
手段と、 前記多値画像を予め定められた第1の閾値で2値化して
2値画像を得る2値化手段と、 前記2値画像を、1文字ずつ切り出して文字画像を得る
文字切出し手段と、 前記文字画像の2値化の際の閾値に依存する特徴を示す
値を特徴量として検出する特徴量検出手段と、 前記文字画像を格納手段に予め登録された参照パターン
と照合することにより文字認識を行う文字認識手段と、 前記特徴量と前記文字認識で判定結果を与えた前記参照
パターンに付加された前記特徴量の許容範囲とに基づい
て、前記文字画像に対し、前記第1の閾値と異なる閾値
で再度2値化すべきか否かを判定する判定手段と、 前記判定手段の判定に応じて、前記多値画像のうち少な
くとも前記文字画像を含む領域を、前記第1の閾値と異
なる第2の閾値を用いて再度2値化して2値画像を得る
再2値化手段とを備えることを特徴とする文字認識装
置。 - 【請求項2】 前記特徴量検出手段は、 前記文字画像における黒点数を計数する手段であること
を特徴とする前記請求項1に記載の文字認識装置。 - 【請求項3】 前記特徴量検出手段は、 前記文字画像における輪郭長を計測する手段であること
を特徴とする前記請求項1に記載の文字認識装置。 - 【請求項4】 前記再2値化手段は、 前記特徴量と前記許容範囲との比較結果に基づいて、前
記第2の閾値を設定する閾値設定手段を含むことを特徴
とする前記請求項1に記載の文字認識装置。 - 【請求項5】 前記閾値設定手段は、 前記特徴量と前記許容範囲の上限値または下限値との差
に応じて、前記第1の閾値と前記第2の閾値との変更幅
を設定する手段を備えることを特徴とする前記請求項4
に記載の文字認識装置。 - 【請求項6】 前記文字画像の大きさを正規化する手段
を備え、 前記文字認識手段は、正規化された前記文字画像を認識
するものであり、 前記特徴量検出手段は、正規化された前記文字画像の特
徴量を検出するものであることを特徴とする前記請求項
5に記載の文字認識装置。 - 【請求項7】 読取対象の多値画像を入力する画像入力
手段と、 前記多値画像を予め定められた第1の閾値で2値化して
2値画像を得る2値化手段と、 前記2値画像を、1文字ずつ切り出して文字画像を得る
文字切出し手段と、 予め参照パターンが登録されるとともに、各参照パター
ンごとに濃度情報が登録される格納手段と、 前記文字画像を前記格納手段に予め登録された参照パタ
ーンと照合することにより文字認識を行うとともに、そ
の文字認識の判定結果を与えた前記参照パターンに付加
された前記濃度情報を得る文字認識手段と、 前記濃度情報に基づいて、前記文字画像に対し、前記第
1の閾値と異なる閾値で再度2値化すべきか否かを判定
する判定手段と、 前記判定手段の判定に応じて、前記多値画像のうち前記
文字画像を含む領域を、前記第1の閾値と異なる第2の
閾値を用いて再度2値化して2値画像を得る再2値化手
段とを備えることを特徴とする文字認識装置。 - 【請求項8】 前記格納手段は、 読取対象の多値文字画像を最適な第3の閾値で2値化し
て得られたパターンが参照パターンとして登録される標
準パターン用辞書と、 前記多値文字画像を前記第3の閾値よりも大きな閾値で
2値化して得られたパターンが参照パターンとして登録
される薄パターン用辞書と、 前記多値文字画像を前記第3の閾値よりも小さな閾値で
2値化して得られたパターンが参照パターンとして登録
される濃パターン用辞書とを含む少なくとも3種の辞書
を備え、 前記文字認識手段は、 文字認識の判定結果を与えた参照パターンが前記いずれ
の辞書に登録されたものかを検出し、その検出結果を濃
度情報として出力することを特徴とする前記請求項7に
記載の文字認識装置。 - 【請求項9】 前記再2値化手段は、 前記濃度情報に基づいて、前記第2の閾値を設定する閾
値設定手段を備えることを特徴とする前記請求項8に記
載の文字認識装置。 - 【請求項10】 読取対象の多値画像を入力するステッ
プと、 前記多値画像を予め定められた第1の閾値で2値化して
2値画像を得るステップと、 前記2値画像を、1文字ずつ切り出して文字画像を得る
ステップと、 前記文字画像の2値化の際の閾値に依存する特徴を示す
値を特徴量として検出するステップと、 前記文字画像を格納手段に予め登録された参照パターン
と照合することにより文字認識を行うステップと、 前記特徴量と前記文字認識で判定結果を与えた前記参照
パターンに付加された前記特徴量の許容範囲とに基づい
て、前記文字画像に対し、前記第1の閾値と異なる閾値
で再度2値化すべきか否かを判定するステップと、 前記判定手段の判定に応じて、前記多値画像のうち少な
くとも前記文字画像を含む領域を、前記第1の閾値と異
なる第2の閾値を用いて再度2値化して2値画像を得る
ステップとを含むことを特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7165125A JP2812256B2 (ja) | 1995-06-30 | 1995-06-30 | 文字認識装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7165125A JP2812256B2 (ja) | 1995-06-30 | 1995-06-30 | 文字認識装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0916715A true JPH0916715A (ja) | 1997-01-17 |
JP2812256B2 JP2812256B2 (ja) | 1998-10-22 |
Family
ID=15806392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7165125A Expired - Fee Related JP2812256B2 (ja) | 1995-06-30 | 1995-06-30 | 文字認識装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2812256B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8200016B2 (en) | 2007-04-27 | 2012-06-12 | Nidec Sankyo Corporation | Method and apparatus for character string recognition |
US8401299B2 (en) | 2008-11-23 | 2013-03-19 | Nidec Sankyo Corporation | Character line recognition method and character line recognition device |
JP2013073439A (ja) * | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
CN103716529A (zh) * | 2012-09-28 | 2014-04-09 | 卡西欧计算机株式会社 | 阈值设定装置、被摄体检测装置、阈值设定方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5617487A (en) * | 1979-07-20 | 1981-02-19 | Matsushita Electric Ind Co Ltd | Character read system |
JPH0535921A (ja) * | 1991-07-26 | 1993-02-12 | Sumitomo Metal Ind Ltd | 文字照合装置及びそのための方法 |
-
1995
- 1995-06-30 JP JP7165125A patent/JP2812256B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5617487A (en) * | 1979-07-20 | 1981-02-19 | Matsushita Electric Ind Co Ltd | Character read system |
JPH0535921A (ja) * | 1991-07-26 | 1993-02-12 | Sumitomo Metal Ind Ltd | 文字照合装置及びそのための方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8200016B2 (en) | 2007-04-27 | 2012-06-12 | Nidec Sankyo Corporation | Method and apparatus for character string recognition |
US8401299B2 (en) | 2008-11-23 | 2013-03-19 | Nidec Sankyo Corporation | Character line recognition method and character line recognition device |
JP2013073439A (ja) * | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
CN103716529A (zh) * | 2012-09-28 | 2014-04-09 | 卡西欧计算机株式会社 | 阈值设定装置、被摄体检测装置、阈值设定方法 |
JP2014071620A (ja) * | 2012-09-28 | 2014-04-21 | Casio Comput Co Ltd | 閾値設定装置、被写体検出装置、閾値設定方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2812256B2 (ja) | 1998-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
EP2003600A2 (en) | Method and apparatus for recognizing characters in a document image | |
JPH05314315A (ja) | 光学文字認識用画像データ処理方法 | |
WO1991017519A1 (en) | Row-by-row segmentation and thresholding for optical character recognition | |
EP0680005B1 (en) | Speed and recognition enhancement for OCR using normalized height/width position | |
US8200016B2 (en) | Method and apparatus for character string recognition | |
JP2812256B2 (ja) | 文字認識装置および方法 | |
JPH0256688A (ja) | 文字切出し装置 | |
JPH02293989A (ja) | 文字認識装置 | |
JPH08272902A (ja) | 異字体異品質文字の認識方法 | |
JP3835652B2 (ja) | 文書画像の日本語英語判定方法および記録媒体 | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JP2894111B2 (ja) | 光学式活字文字認識装置における認識結果の総合判定方式 | |
JPS5949671A (ja) | 光学的文字読取装置 | |
JP3127413B2 (ja) | 文字認識装置 | |
JP4079333B2 (ja) | 文書画像の日本語英語判定方法および記録媒体 | |
JPH096909A (ja) | 文字読取装置 | |
JPH0632074B2 (ja) | 正規化方法 | |
JP3277977B2 (ja) | 文字認識方法 | |
JPH09120432A (ja) | 文字認識方法、文字読取装置 | |
JP3361905B2 (ja) | 光学的文字読取装置 | |
JPH1166240A (ja) | 文書認識方法および文書認識装置 | |
Ziaratban et al. | Content-independent farsi font recognition based on dynamic most-frequent connected components | |
JPH10285397A (ja) | 画像2値化方法および記録媒体 | |
JP2000113101A (ja) | 文字切り出し方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980707 |
|
LAPS | Cancellation because of no payment of annual fees |