JP3210224B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3210224B2 JP3210224B2 JP27867495A JP27867495A JP3210224B2 JP 3210224 B2 JP3210224 B2 JP 3210224B2 JP 27867495 A JP27867495 A JP 27867495A JP 27867495 A JP27867495 A JP 27867495A JP 3210224 B2 JP3210224 B2 JP 3210224B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- unit
- binary image
- pattern
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】
【発明の属する技術分野】この発明は、文書等を2値化
して得られた2値画像イメージから、文字認識を行う文
字認識装置に関する。
して得られた2値画像イメージから、文字認識を行う文
字認識装置に関する。
【0002】
【従来の技術】従来より、文字認識装置として、2値化
した文字パタンから特徴抽出を行い、得られた特徴を予
め用意した標準パタンの特徴(認識辞書)と照合して文
字認識を行うものが知られている。
した文字パタンから特徴抽出を行い、得られた特徴を予
め用意した標準パタンの特徴(認識辞書)と照合して文
字認識を行うものが知られている。
【0003】その場合、文書等を2値化する方法とし
て、局所的濃淡に応じた閾値により2値化する方法、お
よび固定閾値により2値化する方法がある。写真等の濃
淡画像を持つ文書等を2値化する場合には、局所的濃淡
に応じて閾値を変えることにより濃淡画像を白黒2階調
で表現し、濃淡画像の中間調を擬似的に2階調で表現す
る方が、閾値を固定にして2値化する場合に比べ良好な
画像が得られる。
て、局所的濃淡に応じた閾値により2値化する方法、お
よび固定閾値により2値化する方法がある。写真等の濃
淡画像を持つ文書等を2値化する場合には、局所的濃淡
に応じて閾値を変えることにより濃淡画像を白黒2階調
で表現し、濃淡画像の中間調を擬似的に2階調で表現す
る方が、閾値を固定にして2値化する場合に比べ良好な
画像が得られる。
【0004】
【発明が解決しようとする課題】しかしながら、文字・
線画像を局所的濃淡に応じて閾値を変えることにより2
値化すると、図4(A)および(B)に示すように文字
パタンを構成する線画中に凸凹が多くなり、図5(A)
および(B)に示す閾値を固定にして2値化した文字パ
タンに比べ文字・線画の画質が劣化する。
線画像を局所的濃淡に応じて閾値を変えることにより2
値化すると、図4(A)および(B)に示すように文字
パタンを構成する線画中に凸凹が多くなり、図5(A)
および(B)に示す閾値を固定にして2値化した文字パ
タンに比べ文字・線画の画質が劣化する。
【0005】このため、文字認識装置で、図4(A),
(B)および図5(A),(B)のような画質の異なる
文字パタンの文字認識を行う場合、2値化法の違いによ
る画質の影響で文字パタンの特徴にばらつきが生じ、場
合によっては誤読、不読の原因になるという問題があっ
た。
(B)および図5(A),(B)のような画質の異なる
文字パタンの文字認識を行う場合、2値化法の違いによ
る画質の影響で文字パタンの特徴にばらつきが生じ、場
合によっては誤読、不読の原因になるという問題があっ
た。
【0006】そこで、この発明は、上記の問題点を解決
するため、文字パタンの2値化法に関わらず、精度良く
文字認識を行うことが可能な文字認識装置を提供するこ
とにある。
するため、文字パタンの2値化法に関わらず、精度良く
文字認識を行うことが可能な文字認識装置を提供するこ
とにある。
【0007】
【課題を解決するための手段】この発明の文字認識装置
によれば、2値画像イメージを格納するイメージ記憶部
と、2値画像イメージから1文字単位の文字パタンを切
り出す文字切出し部と、文字パタンを認識する文字認識
部とを具える文字認識装置において、イメージ記憶部に
格納されている2値画像イメージが、局所的濃淡に応じ
た閾値により2値化されたものであるのか、固定閾値に
より2値化されたものであるのかを判別する2値画像判
別部と、2値画像判別部によって得られる判別結果に応
じ、それぞれの2値化方法に応じて設けられた認識辞書
を選択する辞書切換部とを具え、文字認識部を、辞書切
換部により選択された認識辞書を用いて、文字パタンを
認識する構成としたことを特徴とする。以下、この文字
認識装置を、第1の文字認識装置と称する場合がある。
によれば、2値画像イメージを格納するイメージ記憶部
と、2値画像イメージから1文字単位の文字パタンを切
り出す文字切出し部と、文字パタンを認識する文字認識
部とを具える文字認識装置において、イメージ記憶部に
格納されている2値画像イメージが、局所的濃淡に応じ
た閾値により2値化されたものであるのか、固定閾値に
より2値化されたものであるのかを判別する2値画像判
別部と、2値画像判別部によって得られる判別結果に応
じ、それぞれの2値化方法に応じて設けられた認識辞書
を選択する辞書切換部とを具え、文字認識部を、辞書切
換部により選択された認識辞書を用いて、文字パタンを
認識する構成としたことを特徴とする。以下、この文字
認識装置を、第1の文字認識装置と称する場合がある。
【0008】また、この発明の他の文字認識装置によれ
ば、2値画像イメージを格納するイメージ記憶部と、2
値画像イメージから1文字単位の文字パタンを切り出す
文字切出し部と、文字パタンの特徴量を抽出する特徴抽
出部と、抽出された特徴量を予め用意されている複数の
標準文字パタンの特徴量と照合して文字パタンを認識す
る識別部とを具える文字認識装置において、イメージ記
憶部に格納されている2値画像イメージが、局所的濃淡
に応じた閾値により2値化されたものであるのか、固定
閾値により2値化されたものであるのかを判別する2値
画像判別部を具え、特徴抽出部は、文字パタンから線幅
wを検出する線幅計算部と、文字パタンを複数の方向に
走査し、複数の走査方向における黒ビットの連続する長
さSと線幅wとの間でS≧N・w(Nは2値画像判別部
での判別結果に応じ決められる値)を満足する黒ビット
群を取り出すことにより複数の走査方向成分ごとのスト
ローク成分をあらわすサブパターンを抽出するサブパタ
ーン抽出部とを具え、2値画像判別部によって得られる
判別結果に応じてサブパターンを抽出する構成としたこ
とを特徴とする。以下、この文字認識装置を、第2の文
字認識装置と称する場合がある。
ば、2値画像イメージを格納するイメージ記憶部と、2
値画像イメージから1文字単位の文字パタンを切り出す
文字切出し部と、文字パタンの特徴量を抽出する特徴抽
出部と、抽出された特徴量を予め用意されている複数の
標準文字パタンの特徴量と照合して文字パタンを認識す
る識別部とを具える文字認識装置において、イメージ記
憶部に格納されている2値画像イメージが、局所的濃淡
に応じた閾値により2値化されたものであるのか、固定
閾値により2値化されたものであるのかを判別する2値
画像判別部を具え、特徴抽出部は、文字パタンから線幅
wを検出する線幅計算部と、文字パタンを複数の方向に
走査し、複数の走査方向における黒ビットの連続する長
さSと線幅wとの間でS≧N・w(Nは2値画像判別部
での判別結果に応じ決められる値)を満足する黒ビット
群を取り出すことにより複数の走査方向成分ごとのスト
ローク成分をあらわすサブパターンを抽出するサブパタ
ーン抽出部とを具え、2値画像判別部によって得られる
判別結果に応じてサブパターンを抽出する構成としたこ
とを特徴とする。以下、この文字認識装置を、第2の文
字認識装置と称する場合がある。
【0009】第1および第2の文字認識装置によれば、
2値画像判別部を、イメージ記憶部に格納されている、
所定領域単位の2値画像イメージが、局所的濃淡に応じ
た閾値により2値化されたものであるのか、固定閾値に
より2値化されたものであるのかを判別する構成とする
のが良い。さらに、2値画像判別部を、2値画像イメー
ジを任意の大きさを持つ観測窓を用いて走査し、走査に
より得られる計数に基づく評価値に応じて、2値画像イ
メージが、局所的濃淡に応じた閾値により2値化された
ものであるのか、固定閾値により2値化されたものであ
るのかを判別する構成とするのが良い。
2値画像判別部を、イメージ記憶部に格納されている、
所定領域単位の2値画像イメージが、局所的濃淡に応じ
た閾値により2値化されたものであるのか、固定閾値に
より2値化されたものであるのかを判別する構成とする
のが良い。さらに、2値画像判別部を、2値画像イメー
ジを任意の大きさを持つ観測窓を用いて走査し、走査に
より得られる計数に基づく評価値に応じて、2値画像イ
メージが、局所的濃淡に応じた閾値により2値化された
ものであるのか、固定閾値により2値化されたものであ
るのかを判別する構成とするのが良い。
【0010】また、第2の文字認識装置によれば、特徴
抽出部は、さらにサブパターン抽出部で抽出した各サブ
パターンについてm×n(m,nは1以上の正の整数)
の部分領域に分割し、各サブパターンごとの各部分領域
内の黒ビットの数と線幅とを用いて特徴量としての特徴
マトリクスを作成する特徴マトリクス抽出部を具えるも
のとするのが良い。
抽出部は、さらにサブパターン抽出部で抽出した各サブ
パターンについてm×n(m,nは1以上の正の整数)
の部分領域に分割し、各サブパターンごとの各部分領域
内の黒ビットの数と線幅とを用いて特徴量としての特徴
マトリクスを作成する特徴マトリクス抽出部を具えるも
のとするのが良い。
【0011】第1の文字認識装置の構成によれば、2値
画像イメージの種類に対応した最適な認識辞書を選択
し、その最適な認識辞書を用いて、文字パタンを認識す
ることができる。また、第2の文字認識装置の構成によ
れば、2値画像イメージの種類に対応した最適な処理を
することができる。従って、いずれの文字認識装置の場
合も、文字パタンの2値化法に関わらず、精度良く文字
認識を行うことが可能な文字認識装置が実現できる。
画像イメージの種類に対応した最適な認識辞書を選択
し、その最適な認識辞書を用いて、文字パタンを認識す
ることができる。また、第2の文字認識装置の構成によ
れば、2値画像イメージの種類に対応した最適な処理を
することができる。従って、いずれの文字認識装置の場
合も、文字パタンの2値化法に関わらず、精度良く文字
認識を行うことが可能な文字認識装置が実現できる。
【0012】
【発明の実施の形態】以下、図面を参照して、この発明
の文字認識装置の各実施の形態について説明する。ただ
し、説明に用いる各図は、この発明を理解出来る程度に
概略的に示してあり、説明に用いる各図において同様な
構成成分については同一の番号を付し、その重複する説
明を省略する場合もある。
の文字認識装置の各実施の形態について説明する。ただ
し、説明に用いる各図は、この発明を理解出来る程度に
概略的に示してあり、説明に用いる各図において同様な
構成成分については同一の番号を付し、その重複する説
明を省略する場合もある。
【0013】1.第1の実施の形態 第1の実施の形態(以下、単に第1の形態と称する場合
がある。)の文字認識装置の構成を説明する。図1は第
1の形態の文字認識装置の構成を示すブロック図であ
り、併せて画像記録媒体との接続関係を示している。図
1に示す様に、第1の形態の文字認識装置100は、イ
メージ記憶部10と、文字切出し部20と、文字認識部
30とを具え、さらに2値画像判別部40と、辞書切換
部50とを具える。なお、第1の形態の文字認識装置1
00では、認識辞書として、局所的濃淡に応じた閾値に
より2値化した文字パタンの認識に最適なディザ画像用
辞書部60xと、固定閾値により2値化した文字パタン
の認識に最適な単純2値画像用辞書部60yとを具え
る。
がある。)の文字認識装置の構成を説明する。図1は第
1の形態の文字認識装置の構成を示すブロック図であ
り、併せて画像記録媒体との接続関係を示している。図
1に示す様に、第1の形態の文字認識装置100は、イ
メージ記憶部10と、文字切出し部20と、文字認識部
30とを具え、さらに2値画像判別部40と、辞書切換
部50とを具える。なお、第1の形態の文字認識装置1
00では、認識辞書として、局所的濃淡に応じた閾値に
より2値化した文字パタンの認識に最適なディザ画像用
辞書部60xと、固定閾値により2値化した文字パタン
の認識に最適な単純2値画像用辞書部60yとを具え
る。
【0014】イメージ記憶部10は、文字、線画および
濃淡画像が混在する文書等の2値画像イメージを格納し
た画像記録媒体70から2値画像イメージを読み込み、
その2値画像イメージを格納する。2値画像イメージ
は、イメージ記憶部10のメモリ上に、例えば文字・線
画を構成する画素を「1」(以下、黒画素と称する場合
もある。)、文字・線画の背景となる画素を「0」(以
下、白画素と称する場合もある。)として格納される。
また、イメージ記憶部10のメモリ上には、X−Y座標
を仮想的に設定し、この座標系で現される画素をメモリ
上から読み出すことが出来るようにしている。
濃淡画像が混在する文書等の2値画像イメージを格納し
た画像記録媒体70から2値画像イメージを読み込み、
その2値画像イメージを格納する。2値画像イメージ
は、イメージ記憶部10のメモリ上に、例えば文字・線
画を構成する画素を「1」(以下、黒画素と称する場合
もある。)、文字・線画の背景となる画素を「0」(以
下、白画素と称する場合もある。)として格納される。
また、イメージ記憶部10のメモリ上には、X−Y座標
を仮想的に設定し、この座標系で現される画素をメモリ
上から読み出すことが出来るようにしている。
【0015】文字切出し部20は、イメージ記憶部10
のメモリ上のアドレスに基づいて、イメージ記憶部10
のメモリ上に格納されている2値画像イメージから1文
字単位の文字パタンを切り出す。そして、1文字単位の
文字パタンを文字認識部30に送る。
のメモリ上のアドレスに基づいて、イメージ記憶部10
のメモリ上に格納されている2値画像イメージから1文
字単位の文字パタンを切り出す。そして、1文字単位の
文字パタンを文字認識部30に送る。
【0016】2値画像判別部40は、イメージ記憶部1
0から2値画像イメージを読み込み、イメージ記憶部1
0に格納されている2値画像イメージが、局所的濃淡に
応じた閾値により2値化されたものであるのか、固定閾
値により2値化されたものであるのかを判別する。その
詳細な説明は、後述する動作の説明において行う。そし
て、判別結果を辞書切換部50に送る。
0から2値画像イメージを読み込み、イメージ記憶部1
0に格納されている2値画像イメージが、局所的濃淡に
応じた閾値により2値化されたものであるのか、固定閾
値により2値化されたものであるのかを判別する。その
詳細な説明は、後述する動作の説明において行う。そし
て、判別結果を辞書切換部50に送る。
【0017】辞書切換部50は、2値画像判別部40に
よって得られる判別結果を受け取り、その判別結果に応
じて、文字認識を行う際に用いる認識辞書として、ディ
ザ画像用辞書部60xか、単純2値画像用辞書部60y
のいずれか一方を選択する。そして、選択した認識辞書
を文字認識部30と接続する。
よって得られる判別結果を受け取り、その判別結果に応
じて、文字認識を行う際に用いる認識辞書として、ディ
ザ画像用辞書部60xか、単純2値画像用辞書部60y
のいずれか一方を選択する。そして、選択した認識辞書
を文字認識部30と接続する。
【0018】文字認識部30は、文字切出し部20によ
って切り出された文字パタンを受け取り、辞書切換部5
0により選択された認識辞書を用いて、文字パタンを認
識する。そして、文字認識結果を出力する。
って切り出された文字パタンを受け取り、辞書切換部5
0により選択された認識辞書を用いて、文字パタンを認
識する。そして、文字認識結果を出力する。
【0019】以下、図2に示す文字認識手順の流れ図を
用いて、第1の形態の文字認識装置100についてその
動作と共にさらに説明する。
用いて、第1の形態の文字認識装置100についてその
動作と共にさらに説明する。
【0020】先ず、文字、線画および濃淡画像が混在す
る文書等の画像記録媒体70から2値画像イメージを読
み込む(ステップ11(以下、ステップをSで表
す。))。第1の形態の文字認識装置100では、イメ
ージ記憶部10が2値画像イメージを読み込み、イメー
ジ記憶部10のメモリ上に、例えば、文字・線画を構成
する画素を「1」(黒画素)、文字・線画の背景となる
画素を「0」(白画素)として格納する。
る文書等の画像記録媒体70から2値画像イメージを読
み込む(ステップ11(以下、ステップをSで表
す。))。第1の形態の文字認識装置100では、イメ
ージ記憶部10が2値画像イメージを読み込み、イメー
ジ記憶部10のメモリ上に、例えば、文字・線画を構成
する画素を「1」(黒画素)、文字・線画の背景となる
画素を「0」(白画素)として格納する。
【0021】次に、イメージ記憶部10に格納されてい
る2値画像イメージから1文字単位の文字パタンを切り
出す(S12)。第1の形態の文字認識装置100で
は、2値画像イメージがイメージ記憶部10に格納され
ると、文字切出し部20がイメージ記憶部10のメモリ
上のアドレスに基づいて、1文字単位の文字パタンを切
り出す。
る2値画像イメージから1文字単位の文字パタンを切り
出す(S12)。第1の形態の文字認識装置100で
は、2値画像イメージがイメージ記憶部10に格納され
ると、文字切出し部20がイメージ記憶部10のメモリ
上のアドレスに基づいて、1文字単位の文字パタンを切
り出す。
【0022】文字パタンを切り出すステップ(S12)
と平行して、2値化法を判別するステップ(S13)、
および認識辞書を選択するステップ(S14)を行う。
以下、これらのステップについて説明する。
と平行して、2値化法を判別するステップ(S13)、
および認識辞書を選択するステップ(S14)を行う。
以下、これらのステップについて説明する。
【0023】先ず、イメージ記憶部10に格納されてい
る2値画像イメージが、局所的濃淡に応じた閾値により
2値化されたものであるのか、固定閾値により2値化さ
れたものであるのかを判別する(S13)。第1の形態
の文字認識装置100では、2値画像イメージがイメー
ジ記憶部10に格納されると、2値画像判別部40がイ
メージ記憶部10から2値画像イメージを読み込み、イ
メージ記憶部10に格納されている2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する。
る2値画像イメージが、局所的濃淡に応じた閾値により
2値化されたものであるのか、固定閾値により2値化さ
れたものであるのかを判別する(S13)。第1の形態
の文字認識装置100では、2値画像イメージがイメー
ジ記憶部10に格納されると、2値画像判別部40がイ
メージ記憶部10から2値画像イメージを読み込み、イ
メージ記憶部10に格納されている2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する。
【0024】2値化法の判別方法の一例として、図3に
示す3行3列の観測窓を用いて、読み込まれた2値画像
イメージを走査して行う方法がある。この場合、a0 領
域が2値画像イメージを構成するすべての画素を覗くよ
うに、3×3の観測窓をラスタ走査する。その際、3×
3の観測窓を構成するa0 領域からa8 領域の各重み付
けをa0 =a1 =a3 =a5 =a7 =1、a2 =a4 =
a6 =a8 =−1と設定する。例えば、a1 領域から検
出される画素が「1」(黒画素)の時は、カウント値を
a1 ×1、すなわち1つ増加させ、a2 領域から検出さ
れる画素が「1」(黒画素)の時はカウント値をa2 ×
1、すなわち1つ減少させることにより計数Q1を求め
る。ただし、計数Q1の初期値は0とする。また、3×
3の観測窓を走査する際に、観測窓a0 から検出される
画素が「1」(黒画素)の時、前記カウント値とは別の
カウント値を1つ増加させることにより黒画素の総数A
1を求める。ただし、黒画素の総数A1の初期値は0と
する。さらに2値画像イメージを構成する最も外側の画
素をa0 領域で検出できるように、3×3の観測窓を走
査する際には、2値画像イメージのさらに外側に「0」
(白画素)が存在するとみなし計数Q1を求める。計数
Q1および総数A1から、下記の(1)式を用いて評価
値D1を算出する。ここで、Kは任意の整数とする。
示す3行3列の観測窓を用いて、読み込まれた2値画像
イメージを走査して行う方法がある。この場合、a0 領
域が2値画像イメージを構成するすべての画素を覗くよ
うに、3×3の観測窓をラスタ走査する。その際、3×
3の観測窓を構成するa0 領域からa8 領域の各重み付
けをa0 =a1 =a3 =a5 =a7 =1、a2 =a4 =
a6 =a8 =−1と設定する。例えば、a1 領域から検
出される画素が「1」(黒画素)の時は、カウント値を
a1 ×1、すなわち1つ増加させ、a2 領域から検出さ
れる画素が「1」(黒画素)の時はカウント値をa2 ×
1、すなわち1つ減少させることにより計数Q1を求め
る。ただし、計数Q1の初期値は0とする。また、3×
3の観測窓を走査する際に、観測窓a0 から検出される
画素が「1」(黒画素)の時、前記カウント値とは別の
カウント値を1つ増加させることにより黒画素の総数A
1を求める。ただし、黒画素の総数A1の初期値は0と
する。さらに2値画像イメージを構成する最も外側の画
素をa0 領域で検出できるように、3×3の観測窓を走
査する際には、2値画像イメージのさらに外側に「0」
(白画素)が存在するとみなし計数Q1を求める。計数
Q1および総数A1から、下記の(1)式を用いて評価
値D1を算出する。ここで、Kは任意の整数とする。
【0025】 D1=(K×Q1)/A1・・・・・・・・(1) 局所的濃淡に応じた閾値により2値化した文字パタンで
ある、図4(A)に示す『1』および図4(B)に示す
『愛』では、文字パタンを構成する線画中に凹凸が多い
ため評価値D1が大きい。また、固定閾値により2値化
した文字パタンである、図5(A)に示す『1』および
図5(B)に示す『愛』では、文字パタンを構成する線
画がなめらかであるため評価値D1が小さい。このこと
を利用して2値化法を判別する。例えば、任意の値を基
準値として設定し、評価値D1と比較することにより、
局所的濃淡に応じた閾値により2値化した2値画像イメ
ージか、または固定閾値により2値化した2値画像イメ
ージのいずれであるかの判別が可能になる。2値化法の
判別方法はこれに限定されず任意の方法で行うことがで
きる。
ある、図4(A)に示す『1』および図4(B)に示す
『愛』では、文字パタンを構成する線画中に凹凸が多い
ため評価値D1が大きい。また、固定閾値により2値化
した文字パタンである、図5(A)に示す『1』および
図5(B)に示す『愛』では、文字パタンを構成する線
画がなめらかであるため評価値D1が小さい。このこと
を利用して2値化法を判別する。例えば、任意の値を基
準値として設定し、評価値D1と比較することにより、
局所的濃淡に応じた閾値により2値化した2値画像イメ
ージか、または固定閾値により2値化した2値画像イメ
ージのいずれであるかの判別が可能になる。2値化法の
判別方法はこれに限定されず任意の方法で行うことがで
きる。
【0026】次に、2値画像判別部40によって得られ
る判別結果に応じて、文字認識を行う際に用いる認識辞
書を選択する(S14)。第1の形態の文字認識装置1
00では、辞書切換部50が、2値画像判別部40によ
って得られる判別結果を受け取り、その判別結果に応じ
て、文字認識を行う際に用いる認識辞書として、ディザ
画像用辞書部60xまたは単純2値画像用辞書部60y
のいずれか一方を選択する。すなわち、イメージ記憶部
10に格納されている2値画像イメージが局所的濃淡に
応じた閾値により2値化した2値画像イメージの場合に
は、ディザ画像用辞書部60xを選択し、イメージ記憶
部10に格納されている2値画像イメージが固定閾値に
より2値化した2値画像イメージの場合には、単純2値
画像用辞書部60yを選択する。
る判別結果に応じて、文字認識を行う際に用いる認識辞
書を選択する(S14)。第1の形態の文字認識装置1
00では、辞書切換部50が、2値画像判別部40によ
って得られる判別結果を受け取り、その判別結果に応じ
て、文字認識を行う際に用いる認識辞書として、ディザ
画像用辞書部60xまたは単純2値画像用辞書部60y
のいずれか一方を選択する。すなわち、イメージ記憶部
10に格納されている2値画像イメージが局所的濃淡に
応じた閾値により2値化した2値画像イメージの場合に
は、ディザ画像用辞書部60xを選択し、イメージ記憶
部10に格納されている2値画像イメージが固定閾値に
より2値化した2値画像イメージの場合には、単純2値
画像用辞書部60yを選択する。
【0027】文字パタンを切り出すステップ(S1
2)、および認識辞書を選択するステップ(S14)の
後、辞書切換部50により選択された認識辞書を用い
て、文字切出し部20によって切り出された文字パタン
を認識する(S15)。第1の形態の文字認識装置10
0では、文字認識部30が、辞書切換部50により接続
された認識辞書を用いて、文字切出し部20から受け取
った1文字単位の文字パタンを認識する。
2)、および認識辞書を選択するステップ(S14)の
後、辞書切換部50により選択された認識辞書を用い
て、文字切出し部20によって切り出された文字パタン
を認識する(S15)。第1の形態の文字認識装置10
0では、文字認識部30が、辞書切換部50により接続
された認識辞書を用いて、文字切出し部20から受け取
った1文字単位の文字パタンを認識する。
【0028】最後に、文字認識結果を出力する(S1
6)。第1の形態の文字認識装置100では、文字認識
部30が文字認識結果を出力する。
6)。第1の形態の文字認識装置100では、文字認識
部30が文字認識結果を出力する。
【0029】これまでの説明から理解できるように、第
1の形態の文字認識装置100によれば、2値画像イメ
ージの種類に対応した最適な認識辞書を選択し、その最
適な認識辞書を用いて、文字パタンを認識する。このた
め、文字パタンの2値化法に関わらず、精度良く文字認
識を行うことが可能となる。
1の形態の文字認識装置100によれば、2値画像イメ
ージの種類に対応した最適な認識辞書を選択し、その最
適な認識辞書を用いて、文字パタンを認識する。このた
め、文字パタンの2値化法に関わらず、精度良く文字認
識を行うことが可能となる。
【0030】2.第2の実施の形態 第2の実施の形態(以下、単に第2の形態と称する場合
がある。)の文字認識装置の構成を説明する。図6は第
2の形態の文字認識装置の構成を示すブロック図であ
り、併せて画像記録媒体との接続関係を示している。図
6に示す様に、第2の形態の文字認識装置200は、イ
メージ記憶部10と、文字切出し部20と、文字認識部
30とを具え、さらに2値画像判別部40aと、辞書切
換部50とを具える。なお、第2の形態の文字認識装置
200では、認識辞書として、局所的濃淡に応じた閾値
により2値化した文字パタンの認識に最適なディザ画像
用辞書部60xと、固定閾値により2値化した文字パタ
ンの認識に最適な単純2値画像用辞書部60yとを具え
る。これらの構成成分のうち、イメージ記憶部10、文
字切出し部20、文字認識部30、辞書切換部50、デ
ィザ画像用辞書部60xおよび単純2値画像用辞書部6
0yは第1の形態の文字認識装置100と同様な構成成
分であるので、これらに関する重複説明を省略する。そ
こで、ここでは第1の形態の文字認識装置100と相違
する構成成分である2値画像判別部40aについて説明
する。
がある。)の文字認識装置の構成を説明する。図6は第
2の形態の文字認識装置の構成を示すブロック図であ
り、併せて画像記録媒体との接続関係を示している。図
6に示す様に、第2の形態の文字認識装置200は、イ
メージ記憶部10と、文字切出し部20と、文字認識部
30とを具え、さらに2値画像判別部40aと、辞書切
換部50とを具える。なお、第2の形態の文字認識装置
200では、認識辞書として、局所的濃淡に応じた閾値
により2値化した文字パタンの認識に最適なディザ画像
用辞書部60xと、固定閾値により2値化した文字パタ
ンの認識に最適な単純2値画像用辞書部60yとを具え
る。これらの構成成分のうち、イメージ記憶部10、文
字切出し部20、文字認識部30、辞書切換部50、デ
ィザ画像用辞書部60xおよび単純2値画像用辞書部6
0yは第1の形態の文字認識装置100と同様な構成成
分であるので、これらに関する重複説明を省略する。そ
こで、ここでは第1の形態の文字認識装置100と相違
する構成成分である2値画像判別部40aについて説明
する。
【0031】2値画像判別部40aは、イメージ記憶部
に格納されている、所定領域単位の2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する。例えば、文字切出し部20によって切り出
された文字パタンを読み込み、文字切出し部20におい
て切り出された文字パタンが、局所的濃淡に応じた閾値
により2値化されたものであるのか、固定閾値により2
値化されたものであるのかを判別する。
に格納されている、所定領域単位の2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する。例えば、文字切出し部20によって切り出
された文字パタンを読み込み、文字切出し部20におい
て切り出された文字パタンが、局所的濃淡に応じた閾値
により2値化されたものであるのか、固定閾値により2
値化されたものであるのかを判別する。
【0032】以下、図7に示す文字認識手順の流れ図を
用いて、第2の形態の文字認識装置200についてその
動作と共にさらに説明する。なお、図7に示す、2値画
像イメージを読み込むステップ(S21)、文字パタン
を切り出すステップ(S22)、認識辞書を選択するス
テップ(S24)、文字パタンを認識するステップ(S
25)、および文字認識結果を出力するステップ(S2
6)は、第1の形態の文字認識装置100の動作と同様
なステップである。このため、ここでは第1の形態の文
字認識装置100の動作と相違するステップ、およびそ
のステップに対応する第2の形態に示す文字認識装置2
00の動作を中心に説明する。
用いて、第2の形態の文字認識装置200についてその
動作と共にさらに説明する。なお、図7に示す、2値画
像イメージを読み込むステップ(S21)、文字パタン
を切り出すステップ(S22)、認識辞書を選択するス
テップ(S24)、文字パタンを認識するステップ(S
25)、および文字認識結果を出力するステップ(S2
6)は、第1の形態の文字認識装置100の動作と同様
なステップである。このため、ここでは第1の形態の文
字認識装置100の動作と相違するステップ、およびそ
のステップに対応する第2の形態に示す文字認識装置2
00の動作を中心に説明する。
【0033】画像記録媒体70から2値画像イメージを
読み込む(S21)。
読み込む(S21)。
【0034】次に、イメージ記憶部10に格納されてい
る2値画像イメージから1文字単位の文字パタンを切り
出す(S22)。
る2値画像イメージから1文字単位の文字パタンを切り
出す(S22)。
【0035】次に、文字切出し部20において切り出さ
れた文字パタンが、局所的濃淡に応じた閾値により2値
化されたものであるのか、固定閾値により2値化された
ものであるのかを判別する(S23)。第2の形態の文
字認識装置200では、2値画像判別部40aが文字切
出し部20において切り出された文字パタンを読み込
む。そして、文字切出し部20において切り出された文
字パタンが、局所的濃淡に応じた閾値により2値化され
たものであるのか、固定閾値により2値化されたもので
あるのかを判別する。例えば、第1の形態の2値画像判
別部40と同様にして、文字切出し部20において切り
出された文字パタンが、局所的濃淡に応じた閾値により
2値化されたものであるのか、固定閾値により2値化さ
れたものであるのかを判別することが出来る。
れた文字パタンが、局所的濃淡に応じた閾値により2値
化されたものであるのか、固定閾値により2値化された
ものであるのかを判別する(S23)。第2の形態の文
字認識装置200では、2値画像判別部40aが文字切
出し部20において切り出された文字パタンを読み込
む。そして、文字切出し部20において切り出された文
字パタンが、局所的濃淡に応じた閾値により2値化され
たものであるのか、固定閾値により2値化されたもので
あるのかを判別する。例えば、第1の形態の2値画像判
別部40と同様にして、文字切出し部20において切り
出された文字パタンが、局所的濃淡に応じた閾値により
2値化されたものであるのか、固定閾値により2値化さ
れたものであるのかを判別することが出来る。
【0036】次に、2値画像判別部40aによって得ら
れる判別結果に応じて、文字認識を行う際に用いる認識
辞書を選択する(S24)。
れる判別結果に応じて、文字認識を行う際に用いる認識
辞書を選択する(S24)。
【0037】次に、辞書切換部50により選択された認
識辞書を用いて、文字切出し部20において切り出され
た文字パタンを認識する(S25)。最後に、文字認識
結果を出力する(S26)。
識辞書を用いて、文字切出し部20において切り出され
た文字パタンを認識する(S25)。最後に、文字認識
結果を出力する(S26)。
【0038】2値化法を判別するステップ(S23)、
認識辞書を選択するステップ(S24)、文字パタンを
認識するステップ(S25)、および文字認識結果を出
力するステップ(S26)を繰り返すことにより、イメ
ージ記憶部10に格納されているすべての文字パタンを
認識することが出来る。
認識辞書を選択するステップ(S24)、文字パタンを
認識するステップ(S25)、および文字認識結果を出
力するステップ(S26)を繰り返すことにより、イメ
ージ記憶部10に格納されているすべての文字パタンを
認識することが出来る。
【0039】以上のことから、第2の形態の文字認識装
置200によれば、第1の形態の文字認識装置100と
同じ効果が得られる。さらに、第2の形態の文字認識装
置200によれば、2値化法の判別を文字パタンごとに
行うため、イメージ記憶部10に格納されている文字パ
タンとして、局所的濃淡に応じた閾値により2値化した
文字パタンおよび固定閾値により2値化した文字パタン
が混在している場合にも、精度良く文字認識を行うこと
が可能である。また、2値画像イメージ全体の2値化法
を判別する場合に比べて処理時間を短縮することが可能
である。
置200によれば、第1の形態の文字認識装置100と
同じ効果が得られる。さらに、第2の形態の文字認識装
置200によれば、2値化法の判別を文字パタンごとに
行うため、イメージ記憶部10に格納されている文字パ
タンとして、局所的濃淡に応じた閾値により2値化した
文字パタンおよび固定閾値により2値化した文字パタン
が混在している場合にも、精度良く文字認識を行うこと
が可能である。また、2値画像イメージ全体の2値化法
を判別する場合に比べて処理時間を短縮することが可能
である。
【0040】3.第3の実施の形態 第3の実施の形態(以下、単に第3の形態と称する場合
がある。)の文字認識装置の構成を説明する。図8は第
3の形態の文字認識装置の構成を示すブロック図であ
り、併せて画像記録媒体との接続関係を示している。図
8に示す様に、第3の形態の文字認識装置300は、イ
メージ記憶部10と、文字切出し部20aと、特徴抽出
部80と、識別部90とを具え、さらに2値画像判別部
40bを具える。これらの構成成分のうち、イメージ記
憶部10、文字切出し部20a、および2値画像判別部
40bは第1の形態の文字認識装置100と同様な構成
成分である。ただし、文字切出し部20aによって切り
出された文字パタンおよび2値画像判別部40bによっ
て得られる判別結果(評価値D1)は、特徴抽出部80
に送られる。ここでは第1の形態の文字認識装置100
と相違する構成成分である特徴抽出部80、および識別
部90について説明する。
がある。)の文字認識装置の構成を説明する。図8は第
3の形態の文字認識装置の構成を示すブロック図であ
り、併せて画像記録媒体との接続関係を示している。図
8に示す様に、第3の形態の文字認識装置300は、イ
メージ記憶部10と、文字切出し部20aと、特徴抽出
部80と、識別部90とを具え、さらに2値画像判別部
40bを具える。これらの構成成分のうち、イメージ記
憶部10、文字切出し部20a、および2値画像判別部
40bは第1の形態の文字認識装置100と同様な構成
成分である。ただし、文字切出し部20aによって切り
出された文字パタンおよび2値画像判別部40bによっ
て得られる判別結果(評価値D1)は、特徴抽出部80
に送られる。ここでは第1の形態の文字認識装置100
と相違する構成成分である特徴抽出部80、および識別
部90について説明する。
【0041】特徴抽出部80は、2値画像判別部40b
によって得られる判別結果(評価値D1)に応じて文字
切出し部20aによって切り出された文字パタンの特徴
量を抽出する。そして、特徴量を識別部90に送る。図
9は、この実施の形態の特徴抽出部80の構成を示すブ
ロック図である。この実施の形態では、図9に示す様
に、パターンレジスタ81と、線幅計算部82と、文字
枠検出部83と、4つのサブパターン抽出部84、8
5、86、87と、特徴マトリクス抽出部88とで構成
してある。これら各構成成分の詳細な説明は後の動作説
明において行なうが、その概要は次の通りである。
によって得られる判別結果(評価値D1)に応じて文字
切出し部20aによって切り出された文字パタンの特徴
量を抽出する。そして、特徴量を識別部90に送る。図
9は、この実施の形態の特徴抽出部80の構成を示すブ
ロック図である。この実施の形態では、図9に示す様
に、パターンレジスタ81と、線幅計算部82と、文字
枠検出部83と、4つのサブパターン抽出部84、8
5、86、87と、特徴マトリクス抽出部88とで構成
してある。これら各構成成分の詳細な説明は後の動作説
明において行なうが、その概要は次の通りである。
【0042】先ず、パターンレジスタ81は、文字切出
し部20aによって切り出された文字パタンを格納する
ためのものである。このパターンレジスタ81は、その
上にX−Y座標を仮想的に設定し、この座標系で現され
る任意の位置の画素を読み出すことができるものとして
ある。また、線幅計算部82は、前記パターンレジスタ
81に格納されている文字パタンからその線幅を検出す
るためのものである。また、文字枠検出部83は、パタ
ーンレジスタ81に格納されている文字パタンの文字枠
を検出するためのものである。また、サブパターン抽出
部84〜87はパターンレジスタ81に格納されている
文字パタンを複数の方向に走査し、各走査方向成分毎の
ストローク成分を表わす複数のサブパターンを抽出する
もので、この実施の形態では垂直、水平、右斜めおよび
左斜めの各走査方向毎のサブパターン抽出部で構成して
ある。ただし、各サブパターン抽出部は、詳細は後の動
作説明において説明するが、各方向成分毎のストローク
成分(具体的には文字パタンにおける黒ビットの量)の
抽出量を2値画像判別部40bの判別結果(評価値D
1)に応じ調整する構成としてある。こうすることで、
特徴抽出部80で抽出する特徴量(この場合は特徴マト
リクス)を2値画像判別部40bの判別結果(評価値D
1)に応じ異ならせている。また、特徴マトリクス抽出
部88は、パターンレジスタ81に格納された文字パタ
ンに対応する領域を各サブパターンについてm×n
(m,nは1以上の整数で、m=nを含む)の部分領域
に分割し、各サブパターン毎の各部分領域内の黒ビット
の数と線幅計算部82で検出した線幅wとを用いて特徴
量としての特徴マトリクスを抽出するものである。
し部20aによって切り出された文字パタンを格納する
ためのものである。このパターンレジスタ81は、その
上にX−Y座標を仮想的に設定し、この座標系で現され
る任意の位置の画素を読み出すことができるものとして
ある。また、線幅計算部82は、前記パターンレジスタ
81に格納されている文字パタンからその線幅を検出す
るためのものである。また、文字枠検出部83は、パタ
ーンレジスタ81に格納されている文字パタンの文字枠
を検出するためのものである。また、サブパターン抽出
部84〜87はパターンレジスタ81に格納されている
文字パタンを複数の方向に走査し、各走査方向成分毎の
ストローク成分を表わす複数のサブパターンを抽出する
もので、この実施の形態では垂直、水平、右斜めおよび
左斜めの各走査方向毎のサブパターン抽出部で構成して
ある。ただし、各サブパターン抽出部は、詳細は後の動
作説明において説明するが、各方向成分毎のストローク
成分(具体的には文字パタンにおける黒ビットの量)の
抽出量を2値画像判別部40bの判別結果(評価値D
1)に応じ調整する構成としてある。こうすることで、
特徴抽出部80で抽出する特徴量(この場合は特徴マト
リクス)を2値画像判別部40bの判別結果(評価値D
1)に応じ異ならせている。また、特徴マトリクス抽出
部88は、パターンレジスタ81に格納された文字パタ
ンに対応する領域を各サブパターンについてm×n
(m,nは1以上の整数で、m=nを含む)の部分領域
に分割し、各サブパターン毎の各部分領域内の黒ビット
の数と線幅計算部82で検出した線幅wとを用いて特徴
量としての特徴マトリクスを抽出するものである。
【0043】識別部90は、特徴抽出部80によって抽
出された特徴量を受け取り、予め用意されている複数の
標準文字パタンの特徴量と照合して、文字切出し部20
aによって切り出された文字パタンを識別する。そし
て、文字認識結果を出力する。
出された特徴量を受け取り、予め用意されている複数の
標準文字パタンの特徴量と照合して、文字切出し部20
aによって切り出された文字パタンを識別する。そし
て、文字認識結果を出力する。
【0044】以下、図10に示す文字認識手順の流れ図
を用いて、第3の形態の文字認識装置300についてそ
の動作と共にさらに説明する。なお、図10に示す、2
値画像イメージを読み込むステップ(S31)、文字パ
タンを切り出すステップ(S32)、2値化法を判別す
るステップ(S33)は、第1の形態の文字認識装置1
00の動作と同様なステップである。このため、ここで
は第1の形態の文字認識装置100の動作と相違するス
テップ、およびそのステップに対応する第3の形態に示
す文字認識装置300の動作を中心に説明する。
を用いて、第3の形態の文字認識装置300についてそ
の動作と共にさらに説明する。なお、図10に示す、2
値画像イメージを読み込むステップ(S31)、文字パ
タンを切り出すステップ(S32)、2値化法を判別す
るステップ(S33)は、第1の形態の文字認識装置1
00の動作と同様なステップである。このため、ここで
は第1の形態の文字認識装置100の動作と相違するス
テップ、およびそのステップに対応する第3の形態に示
す文字認識装置300の動作を中心に説明する。
【0045】先ず、画像記録媒体70から2値画像イメ
ージを読み込む(S31)。次に、イメージ記憶部10
に格納されている2値画像イメージから1文字単位の文
字パタンを切り出す(S32)。
ージを読み込む(S31)。次に、イメージ記憶部10
に格納されている2値画像イメージから1文字単位の文
字パタンを切り出す(S32)。
【0046】文字を切り出すステップ(S32)と平行
して、2値化法を判別するステップ(S33)を行う。
すなわち、イメージ記憶部10に格納されている2値画
像イメージが、局所的濃淡に応じた閾値により2値化さ
れたものであるのか、固定閾値により2値化されたもの
であるのかを判別する。
して、2値化法を判別するステップ(S33)を行う。
すなわち、イメージ記憶部10に格納されている2値画
像イメージが、局所的濃淡に応じた閾値により2値化さ
れたものであるのか、固定閾値により2値化されたもの
であるのかを判別する。
【0047】文字を切り出すステップ(S32)、およ
び2値化法を判別するステップ(S33)の後、2値画
像判別部40bによって得られる判別結果に応じて文字
切出し部20aによって切り出された文字パタンの特徴
量を抽出する(S34)。第3の形態の文字認識装置3
00では、特徴抽出部80が、2値画像判別部40bに
よって得られる判別結果(評価値D1)を受け取り、そ
の判別結果(評価値D1)に応じて、文字切出し部20
aによって切り出された文字パタンの特徴量を抽出す
る。
び2値化法を判別するステップ(S33)の後、2値画
像判別部40bによって得られる判別結果に応じて文字
切出し部20aによって切り出された文字パタンの特徴
量を抽出する(S34)。第3の形態の文字認識装置3
00では、特徴抽出部80が、2値画像判別部40bに
よって得られる判別結果(評価値D1)を受け取り、そ
の判別結果(評価値D1)に応じて、文字切出し部20
aによって切り出された文字パタンの特徴量を抽出す
る。
【0048】より詳細に説明すると、2値画像判別部4
0bにおいて2値化法の判別が終了すると、特徴抽出部
80は、その判別結果(評価値D1)を受け取る。ま
た、文字切出し部20aによって切り出された文字パタ
ンを受け取り、パターンレジスタ81に格納する。文字
パタンがパターンレジスタ81に格納されると、線幅計
算部82は、この文字パタンの線幅を検出する。これを
この実施の形態では次の様に行う。線幅計算部82は、
周知のフィルタ回路と同様にシフトレジスタ構成となっ
ており、この文字パタンについて2×2の窓のすべてが
黒ビットとなる点の総数Q2と全黒ビット数A2とを計
数し、そして下記の周知の近似式(2)を用いて線幅w
を計算する。一般に、局所的濃淡に応じた閾値により2
値化した文字パタンである、図4(A)に示す『1』お
よび図4(B)に示す『愛』では、文字パタンを構成す
る線画中に凹凸が多いためQ2が小さくなり、そのため
線幅wが小さくなる傾向がある。また、固定閾値により
2値化した文字パタンである、図5(A)に示す『1』
および図5(B)に示す『愛』では、文字パタンを構成
する線画がなめらかであるためQ2が大きくなり、その
ため線幅wが大きくなる傾向がある。
0bにおいて2値化法の判別が終了すると、特徴抽出部
80は、その判別結果(評価値D1)を受け取る。ま
た、文字切出し部20aによって切り出された文字パタ
ンを受け取り、パターンレジスタ81に格納する。文字
パタンがパターンレジスタ81に格納されると、線幅計
算部82は、この文字パタンの線幅を検出する。これを
この実施の形態では次の様に行う。線幅計算部82は、
周知のフィルタ回路と同様にシフトレジスタ構成となっ
ており、この文字パタンについて2×2の窓のすべてが
黒ビットとなる点の総数Q2と全黒ビット数A2とを計
数し、そして下記の周知の近似式(2)を用いて線幅w
を計算する。一般に、局所的濃淡に応じた閾値により2
値化した文字パタンである、図4(A)に示す『1』お
よび図4(B)に示す『愛』では、文字パタンを構成す
る線画中に凹凸が多いためQ2が小さくなり、そのため
線幅wが小さくなる傾向がある。また、固定閾値により
2値化した文字パタンである、図5(A)に示す『1』
および図5(B)に示す『愛』では、文字パタンを構成
する線画がなめらかであるためQ2が大きくなり、その
ため線幅wが大きくなる傾向がある。
【0049】 w=1/{1−(Q2/A2)}・・・・・(2) また、垂直サブパターン抽出部84は、パターンレジス
タ81について垂直走査を行い、線幅計算部の結果wを
パラメータとして、走査方向の黒ビットの連続する長さ
Sが下記の関係式(3)を満足しない黒ビット部分を削
除することにより、垂直サブパターン(以下、「VS
P」と略称することもある。)を得る。
タ81について垂直走査を行い、線幅計算部の結果wを
パラメータとして、走査方向の黒ビットの連続する長さ
Sが下記の関係式(3)を満足しない黒ビット部分を削
除することにより、垂直サブパターン(以下、「VS
P」と略称することもある。)を得る。
【0050】 S≧N・w・・・・・・・・・・・・・・・(3) なお、(3)式中のNは2値画像判別部40bによって
得られる判別結果(評価値D1)に応じ決められる値で
ある。この実施の形態では、各サブパターン抽出部84
〜87の各々が、2値画像判別部40bによって得られ
る判別結果に基づきこのNを選択する構成としている。
具体的には、評価値D1が大きい、局所的濃淡に応じた
閾値により2値化した文字パタンの場合は、Nを大きい
値に選択する。また、評価値D1が小さい、固定閾値に
より2値化した文字パタンの場合は、Nを小さい値に選
択する。このようにNを2値画像判別部40bによって
得られる判別結果(評価値D1)に応じ変えるため、局
所的濃淡に応じた閾値により2値化した文字パタンおよ
び固定閾値により2値化した文字パタンに関わらず、安
定したサブパターンが得られる。
得られる判別結果(評価値D1)に応じ決められる値で
ある。この実施の形態では、各サブパターン抽出部84
〜87の各々が、2値画像判別部40bによって得られ
る判別結果に基づきこのNを選択する構成としている。
具体的には、評価値D1が大きい、局所的濃淡に応じた
閾値により2値化した文字パタンの場合は、Nを大きい
値に選択する。また、評価値D1が小さい、固定閾値に
より2値化した文字パタンの場合は、Nを小さい値に選
択する。このようにNを2値画像判別部40bによって
得られる判別結果(評価値D1)に応じ変えるため、局
所的濃淡に応じた閾値により2値化した文字パタンおよ
び固定閾値により2値化した文字パタンに関わらず、安
定したサブパターンが得られる。
【0051】垂直サブパターン84の動作と同様に、水
平サブパターン抽出部85は水平走査により水平サブパ
ターン(HSP)を、右斜めサブパターン抽出部86は
右斜め45°走査によって右斜めサブパターン(RS
P)を、左斜めサブパターン抽出部87は左斜め45°
走査によって左斜めサブパターン(LSP)をそれぞれ
抽出する。片仮名「ホ」の文字パタンから上記の様に抽
出されるVSP、HSP、RSPおよびLSPを、この
「ホ」の文字パターンと共に図11(A)〜(E)にそ
れぞれ示した。
平サブパターン抽出部85は水平走査により水平サブパ
ターン(HSP)を、右斜めサブパターン抽出部86は
右斜め45°走査によって右斜めサブパターン(RS
P)を、左斜めサブパターン抽出部87は左斜め45°
走査によって左斜めサブパターン(LSP)をそれぞれ
抽出する。片仮名「ホ」の文字パタンから上記の様に抽
出されるVSP、HSP、RSPおよびLSPを、この
「ホ」の文字パターンと共に図11(A)〜(E)にそ
れぞれ示した。
【0052】また、文字枠検出部83はパターンレジス
タ81内の文字パタンに外接する文字枠に対応する領域
を検出しこの結果を特徴マトリクス抽出部88に送る。
この場合の検出された文字枠は図11(A)〜(E)に
おいて破線で示す矩形となる。なお、文字枠検出は、例
えば、パターンレジスタ81内を走査して黒ビットが出
現する境界枠を検出することで行える。
タ81内の文字パタンに外接する文字枠に対応する領域
を検出しこの結果を特徴マトリクス抽出部88に送る。
この場合の検出された文字枠は図11(A)〜(E)に
おいて破線で示す矩形となる。なお、文字枠検出は、例
えば、パターンレジスタ81内を走査して黒ビットが出
現する境界枠を検出することで行える。
【0053】また、特徴マトリクス抽出部88は、パタ
ーンレジスタ81における文字枠に対応する領域を垂
直、水平、右斜め、左斜めの各サブパターンについてm
×nの領域に分割する。図12はm=n=5とし、図1
1(B)に示した上記「ホ」の垂直サブパターンを分割
した例である。さらに、特徴マトリクス抽出部88は、
このように分割した各領域の黒ビット数Bijをそれぞれ
計数し、そして線幅wを使用して下記の(4)式により
線長を示す特徴Lijを計算して、ここではm×n×4次
元の特徴マトリクスを作成する。ここで、Bij、Lijに
おけるiは特徴マトリクスの各構成要素における水平方
向の要素、jは同じく垂直方向の要素を示す記号であ
る。
ーンレジスタ81における文字枠に対応する領域を垂
直、水平、右斜め、左斜めの各サブパターンについてm
×nの領域に分割する。図12はm=n=5とし、図1
1(B)に示した上記「ホ」の垂直サブパターンを分割
した例である。さらに、特徴マトリクス抽出部88は、
このように分割した各領域の黒ビット数Bijをそれぞれ
計数し、そして線幅wを使用して下記の(4)式により
線長を示す特徴Lijを計算して、ここではm×n×4次
元の特徴マトリクスを作成する。ここで、Bij、Lijに
おけるiは特徴マトリクスの各構成要素における水平方
向の要素、jは同じく垂直方向の要素を示す記号であ
る。
【0054】 Lij=Bij/w・・・・・・・・・・・・・(4) なお、このように得られた特徴マトリクスに対し一般に
は正規化処理を行い、最終的なm×n×4の正規化特徴
マトリクス(すなわち文字パタンの特徴量)を得る。こ
の正規化は、典型的には、VSP特徴マトリクスについ
ては文字枠のy軸方向の長さΔYで、HSP特徴マトリ
クスについては同x軸方向の長さΔXで、RSPおよび
LSPの各特徴マトリクスについては{(ΔX)2 +
(ΔY)2}1/2 でそれぞれ正規化することで行なえ
る。
は正規化処理を行い、最終的なm×n×4の正規化特徴
マトリクス(すなわち文字パタンの特徴量)を得る。こ
の正規化は、典型的には、VSP特徴マトリクスについ
ては文字枠のy軸方向の長さΔYで、HSP特徴マトリ
クスについては同x軸方向の長さΔXで、RSPおよび
LSPの各特徴マトリクスについては{(ΔX)2 +
(ΔY)2}1/2 でそれぞれ正規化することで行なえ
る。
【0055】次に、特徴抽出部80によって抽出された
特徴量を予め用意されている複数の標準文字パタンの特
徴量と照合して、文字切出し部20aによって切り出さ
れた文字パタンを識別する(S35)。第3の形態の文
字認識装置では、識別部90が、特徴量としての特徴マ
トリクスを受け取る。そして、予め用意されている複数
の標準文字パタンの特徴量いわゆる標準文字マスク(f
m)と、特徴マトリクス抽出部38で作成した特徴マト
リクス(fi)との間に、周知の下記(5)式で与えら
れる距離D2、すなわちm×n×4次元特徴空間におけ
る2つのベクトルの差分ベクトルの長さが最少の値を与
える標準マスクを識別する。
特徴量を予め用意されている複数の標準文字パタンの特
徴量と照合して、文字切出し部20aによって切り出さ
れた文字パタンを識別する(S35)。第3の形態の文
字認識装置では、識別部90が、特徴量としての特徴マ
トリクスを受け取る。そして、予め用意されている複数
の標準文字パタンの特徴量いわゆる標準文字マスク(f
m)と、特徴マトリクス抽出部38で作成した特徴マト
リクス(fi)との間に、周知の下記(5)式で与えら
れる距離D2、すなわちm×n×4次元特徴空間におけ
る2つのベクトルの差分ベクトルの長さが最少の値を与
える標準マスクを識別する。
【0056】 D2={Σ(fm−fi)2 }1/2 ・・・・(5) 最後に、文字認識結果を出力する(S36)。第3の形
態の文字認識装置300では、識別部90が標準マスク
のカテゴリー名を文字名出力、すなわち文字認識結果と
して出力する。
態の文字認識装置300では、識別部90が標準マスク
のカテゴリー名を文字名出力、すなわち文字認識結果と
して出力する。
【0057】これまで説明した様に、第3の形態の文字
認識装置300によれば、局所的濃淡に応じた閾値によ
り2値化した文字パタン、および固定閾値により2値化
した文字パタンに対応した最適なサブパターンが得られ
るように、2値画像判別部40bによって得られる判別
結果(評価値D1)に応じて、Nの値を選択する。この
ため、文字パタンの2値化法に関わらず、精度良く文字
認識を行うことが可能となる。
認識装置300によれば、局所的濃淡に応じた閾値によ
り2値化した文字パタン、および固定閾値により2値化
した文字パタンに対応した最適なサブパターンが得られ
るように、2値画像判別部40bによって得られる判別
結果(評価値D1)に応じて、Nの値を選択する。この
ため、文字パタンの2値化法に関わらず、精度良く文字
認識を行うことが可能となる。
【0058】4.第4の実施の形態 第4の実施の形態(以下、単に第4の形態と称する場合
がある。)の文字認識装置の構成を説明する。図13は
第4の形態の文字認識装置装置の構成を示すブロック図
であり、併せて画像記録媒体との接続関係を示してい
る。図13に示す様に、第4の形態の文字認識装置40
0は、イメージ記憶部10と、文字切出し部20aと、
特徴抽出部80と、識別部90とを具え、さらに2値画
像判別部40cを具える。これらの構成成分のうち、イ
メージ記憶部10および文字切出し部20aは第1の形
態の文字認識装置100と同様な構成成分であり、2値
画像判別部40cは第2の形態の文字認識装置200と
同様な構成成分であり、特徴抽出部80および識別部9
0は第3の形態の文字認識装置300と同様な構成成分
である。ただし、文字切出し部20aによって切り出さ
れた文字パタンおよび2値画像判別部40cによって得
られる判別結果(評価値D1)は、特徴抽出部80に送
られる。
がある。)の文字認識装置の構成を説明する。図13は
第4の形態の文字認識装置装置の構成を示すブロック図
であり、併せて画像記録媒体との接続関係を示してい
る。図13に示す様に、第4の形態の文字認識装置40
0は、イメージ記憶部10と、文字切出し部20aと、
特徴抽出部80と、識別部90とを具え、さらに2値画
像判別部40cを具える。これらの構成成分のうち、イ
メージ記憶部10および文字切出し部20aは第1の形
態の文字認識装置100と同様な構成成分であり、2値
画像判別部40cは第2の形態の文字認識装置200と
同様な構成成分であり、特徴抽出部80および識別部9
0は第3の形態の文字認識装置300と同様な構成成分
である。ただし、文字切出し部20aによって切り出さ
れた文字パタンおよび2値画像判別部40cによって得
られる判別結果(評価値D1)は、特徴抽出部80に送
られる。
【0059】以上のことから、第4の形態の文字認識装
置400によれば、第3の形態の文字認識装置300と
同じ効果が得られる。さらに、第4の形態の文字認識装
置400によれば、第2の形態の文字認識装置200と
同様に、2値化法の判別を文字パタンごとに行うため、
イメージ記憶部10に格納されている文字パタンとし
て、局所的濃淡に応じた閾値により2値化した文字パタ
ンおよび固定閾値により2値化した文字パタンが混在し
ている場合にも、精度良く文字認識を行うことが可能で
ある。また、2値画像イメージ全体の2値化法を判別す
る場合に比べて処理時間を短縮することが可能である。
置400によれば、第3の形態の文字認識装置300と
同じ効果が得られる。さらに、第4の形態の文字認識装
置400によれば、第2の形態の文字認識装置200と
同様に、2値化法の判別を文字パタンごとに行うため、
イメージ記憶部10に格納されている文字パタンとし
て、局所的濃淡に応じた閾値により2値化した文字パタ
ンおよび固定閾値により2値化した文字パタンが混在し
ている場合にも、精度良く文字認識を行うことが可能で
ある。また、2値画像イメージ全体の2値化法を判別す
る場合に比べて処理時間を短縮することが可能である。
【0060】この発明は上述した各実施の形態に限定さ
れるものではないことは明らかである。例えば、各実施
の形態において、2値画像イメージとして、局所的濃淡
に応じた閾値により2値化したイメージおよび固定閾値
により2値化したイメージを用いる場合について説明し
たが、これに限らず、2値で表現された画像イメージで
あれば、その2値化法は問わない。
れるものではないことは明らかである。例えば、各実施
の形態において、2値画像イメージとして、局所的濃淡
に応じた閾値により2値化したイメージおよび固定閾値
により2値化したイメージを用いる場合について説明し
たが、これに限らず、2値で表現された画像イメージで
あれば、その2値化法は問わない。
【0061】また、第1および第2の形態の文字認識装
置において、2種類の認識辞書を具える場合について説
明したが、2値化法を判別し、その判別結果に基づいて
認識辞書を選択できる場合であれば、認識辞書の数は問
わない。
置において、2種類の認識辞書を具える場合について説
明したが、2値化法を判別し、その判別結果に基づいて
認識辞書を選択できる場合であれば、認識辞書の数は問
わない。
【0062】
【発明の効果】上述した説明から明らかなように、この
発明の文字認識装置によれば、イメージ記憶部と、文字
切出し部と、文字認識部とを具える文字認識装置におい
て、イメージ記憶部に格納されている2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する2値画像判別部と、2値画像判別部によって
得られる判別結果に応じ、それぞれの2値化方法に応じ
て設けられた認識辞書を選択する辞書切換部とを具え、
文字認識部を、辞書切換部により選択された認識辞書を
用いて、文字パタンを認識するものとした。このため、
2値画像イメージの種類に対応した最適な認識辞書を選
択し、その最適な認識辞書を用いて、文字パタンを認識
することができる。従って、文字パタンの2値化法に関
わらず、精度良く文字認識を行うことが可能な文字認識
装置が実現できる。
発明の文字認識装置によれば、イメージ記憶部と、文字
切出し部と、文字認識部とを具える文字認識装置におい
て、イメージ記憶部に格納されている2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する2値画像判別部と、2値画像判別部によって
得られる判別結果に応じ、それぞれの2値化方法に応じ
て設けられた認識辞書を選択する辞書切換部とを具え、
文字認識部を、辞書切換部により選択された認識辞書を
用いて、文字パタンを認識するものとした。このため、
2値画像イメージの種類に対応した最適な認識辞書を選
択し、その最適な認識辞書を用いて、文字パタンを認識
することができる。従って、文字パタンの2値化法に関
わらず、精度良く文字認識を行うことが可能な文字認識
装置が実現できる。
【0063】また、この発明の他の文字認識装置によれ
ば、イメージ記憶部と、文字切出し部と、特徴抽出部
と、識別部とを具える文字認識装置において、イメージ
記憶部に格納されている2値画像イメージが、局所的濃
淡に応じた閾値により2値化されたものであるのか、固
定閾値により2値化されたものであるのかを判別する2
値画像判別部を具え、特徴抽出部を、2値画像判別部に
よって得られる判別結果に応じ抽出する特徴量を異なら
せる構成とした。このため、2値画像イメージの種類に
対応した最適な処理をすることができる。従って、文字
パタンの2値化法に関わらず、精度良く文字認識を行う
ことが可能な文字認識装置が実現できる。
ば、イメージ記憶部と、文字切出し部と、特徴抽出部
と、識別部とを具える文字認識装置において、イメージ
記憶部に格納されている2値画像イメージが、局所的濃
淡に応じた閾値により2値化されたものであるのか、固
定閾値により2値化されたものであるのかを判別する2
値画像判別部を具え、特徴抽出部を、2値画像判別部に
よって得られる判別結果に応じ抽出する特徴量を異なら
せる構成とした。このため、2値画像イメージの種類に
対応した最適な処理をすることができる。従って、文字
パタンの2値化法に関わらず、精度良く文字認識を行う
ことが可能な文字認識装置が実現できる。
【図1】第1の形態の文字認識装置の構成を示すブロッ
ク図である。
ク図である。
【図2】第1の形態の文字認識手順の流れ図である。
【図3】観測窓の説明図である。
【図4】(A)および(B)は、は局所的濃淡に応じた
閾値により2値化した文字パタンである。
閾値により2値化した文字パタンである。
【図5】(A)および(B)は、固定閾値により2値化
した文字パタンである。
した文字パタンである。
【図6】第2の形態の文字認識装置の構成を示すブロッ
ク図である。
ク図である。
【図7】第2の形態の文字認識手順の流れ図である。
【図8】第3の形態の文字認識装置の構成を示すブロッ
ク図である。
ク図である。
【図9】特徴抽出部の構成を示すブロック図である。
【図10】第3の形態の文字認識手順の流れ図である。
【図11】(A)〜(E)はサブパターンの抽出例の説
明図である。
明図である。
【図12】文字枠の分割例の説明図である。
【図13】第4の形態の文字認識装置の構成を示すブロ
ック図である。
ック図である。
10:イメージ記憶部 20,20a:文字切出し部 30:文字認識部 40,40a,40b,40c:2値画像判別部 50:辞書切換部 80:特徴抽出部 81:パターンレジスタ 82:線幅計算部 83:文字枠検出部 84〜87:サブパターン抽出部 88:特徴マトリクス抽出部 90:識別部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 伊東 晃治 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平4−119488(JP,A) 特開 昭63−269267(JP,A) 特開 昭62−154079(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/38 - 9/68 JICSTファイル(JOIS)
Claims (5)
- 【請求項1】 2値画像イメージを格納するイメージ記
憶部と、該2値画像イメージから1文字単位の文字パタ
ンを切り出す文字切出し部と、該文字パタンを認識する
文字認識部とを具える文字認識装置において、 前記イメージ記憶部に格納されている2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する2値画像判別部と、該2値画像判別部によっ
て得られる判別結果に応じ、それぞれの2値化方法に応
じて設けられた認識辞書を選択する辞書切換部とを具
え、 前記文字認識部を、前記辞書切換部により選択された認
識辞書を用いて、前記文字パタンを認識する構成とした
ことを特徴とする文字認識装置。 - 【請求項2】 2値画像イメージを格納するイメージ記
憶部と、該2値画像イメージから1文字単位の文字パタ
ンを切り出す文字切出し部と、該文字パタンの特徴量を
抽出する特徴抽出部と、該抽出された特徴量を予め用意
されている複数の標準文字パタンの特徴量と照合して該
文字パタンを認識する識別部とを具える文字認識装置に
おいて、 前記イメージ記憶部に格納されている2値画像イメージ
が、局所的濃淡に応じた閾値により2値化されたもので
あるのか、固定閾値により2値化されたものであるのか
を判別する2値画像判別部を具え、 前記特徴抽出部は、前記文字パタンから線幅wを検出す
る線幅計算部と、前記文字パタンを複数の方向に走査
し、該複数の走査方向における黒ビットの連続する長さ
Sと前記線幅wとの間でS≧N・w(Nは前記2値画像
判別部での判別結果に応じ決められる値)を満足する黒
ビット群を取り出すことにより前記複数の走査方向成分
ごとのストローク成分をあらわすサブパターンを抽出す
るサブパターン抽出部とを具え、 前記2値画像判別部によって得られる判別結果に応じて
前記サブパターンを抽出する構成としたことを特徴とす
る文字認識装置。 - 【請求項3】 請求項1または2に記載の文字認識装置
において、 前記2値画像判別部を、前記イメージ記憶部に格納され
ている、所定領域単位の2値画像イメージが、局所的濃
淡に応じた閾値により2値化されたものであるのか、固
定閾値により2値化されたものであるのかを判別する構
成としたことを特徴とする文字認識装置。 - 【請求項4】 請求項1または2に記載の文字認識装置
において、 前記2値画像判別部を、前記2値画像イメージを任意の
大きさを持つ観測窓を用いて走査し、該走査により得ら
れる計数に基づく評価値に応じて、前記2値画像イメー
ジが、局所的濃淡に応じた閾値により2値化されたもの
であるのか、固定閾値により2値化されたものであるの
かを判別する構成としたことを特徴とする文字認識装
置。 - 【請求項5】 請求項2に記載の文字認識装置におい
て、 前記特徴抽出部は、さらに前記サブパターン抽出部で抽
出した各サブパターンについてm×n(m,nは1以上
の正の整数)の部分領域に分割し、前記各サブパターン
ごとの各部分領域内の黒ビットの数と前記線幅とを用い
て前記特徴量としての特徴マトリクスを作成する特徴マ
トリクス抽出部を具えることを特徴とする文字認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27867495A JP3210224B2 (ja) | 1995-10-26 | 1995-10-26 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27867495A JP3210224B2 (ja) | 1995-10-26 | 1995-10-26 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09120435A JPH09120435A (ja) | 1997-05-06 |
JP3210224B2 true JP3210224B2 (ja) | 2001-09-17 |
Family
ID=17600592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27867495A Expired - Fee Related JP3210224B2 (ja) | 1995-10-26 | 1995-10-26 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3210224B2 (ja) |
-
1995
- 1995-10-26 JP JP27867495A patent/JP3210224B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09120435A (ja) | 1997-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US7751648B2 (en) | Image processing apparatus, image processing method, and computer program | |
US5280367A (en) | Automatic separation of text from background in scanned images of complex documents | |
EP1392047B1 (en) | Digital document processing for image enhancement | |
JPH05314315A (ja) | 光学文字認識用画像データ処理方法 | |
EP0482187A1 (en) | Row-by-row segmentation and thresholding for optical character recognition (system and method) | |
US7151859B2 (en) | Method and system for correcting direction or orientation of document image | |
JP3210224B2 (ja) | 文字認識装置 | |
JPH02293989A (ja) | 文字認識装置 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JPH08221512A (ja) | 画像処理装置及びその方法 | |
JP7543014B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JP2789647B2 (ja) | 線画像認識方法 | |
JP2877548B2 (ja) | 文書画像の属性判別方法 | |
JP2002157552A (ja) | 光学式文字読取装置 | |
JPH05128306A (ja) | 文章画像の属性判別方法 | |
JP2902904B2 (ja) | 文字認識装置 | |
JP2902905B2 (ja) | 文字認識装置 | |
JP3277977B2 (ja) | 文字認識方法 | |
JP3103387B2 (ja) | 濃淡画像の適応2値化方法 | |
JPH11175659A (ja) | 文字認識装置 | |
JPH02166583A (ja) | 文字認識装置 | |
JPH05282489A (ja) | 文章画像の属性判別方法 | |
JPH10233930A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010703 |
|
LAPS | Cancellation because of no payment of annual fees |