JP2994985B2 - 文字認識方法及び文字認識装置 - Google Patents
文字認識方法及び文字認識装置Info
- Publication number
- JP2994985B2 JP2994985B2 JP7103996A JP10399695A JP2994985B2 JP 2994985 B2 JP2994985 B2 JP 2994985B2 JP 7103996 A JP7103996 A JP 7103996A JP 10399695 A JP10399695 A JP 10399695A JP 2994985 B2 JP2994985 B2 JP 2994985B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- angle
- cutout
- pattern
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】本発明は、読み取った文字を認識
する文字認識方法及び文字認識装置に関するものであ
る。
する文字認識方法及び文字認識装置に関するものであ
る。
【0002】
【従来の技術】従来、用紙に印刷あるいは手書きされた
文字を読み取り、その文字を認識する認識装置が知られ
ている(特開平6−4703号公報、特開昭64−78
395号公報、特開平5−108882号公報等)。読
み取り部のCCD(固体撮像素子)等にて読み取られた
文字の画像データは、2値化回路により2値画像データ
に変換され、この2値画像から文字領域を切り出し、さ
らに切り出した文字領域をマトリクス状(例えば8×
8)の小領域に分割する。そして、各小領域を対応させ
て文字領域全体が正方形となる例えば8×8の規格領域
に変換することにより正規化し、この正規化した規格領
域の各小領域に対して黒画素の比率(=黒画素の面積/
小領域の面積)である濃度値を求め、文字領域中の濃度
値の分布をその文字図形の特徴として特徴抽出してい
た。そして、特徴抽出後の文字領域を、予め用意された
辞書中の文字パターン領域と濃度値分布の比較演算処理
を行うことにより文字認識が行われる。
文字を読み取り、その文字を認識する認識装置が知られ
ている(特開平6−4703号公報、特開昭64−78
395号公報、特開平5−108882号公報等)。読
み取り部のCCD(固体撮像素子)等にて読み取られた
文字の画像データは、2値化回路により2値画像データ
に変換され、この2値画像から文字領域を切り出し、さ
らに切り出した文字領域をマトリクス状(例えば8×
8)の小領域に分割する。そして、各小領域を対応させ
て文字領域全体が正方形となる例えば8×8の規格領域
に変換することにより正規化し、この正規化した規格領
域の各小領域に対して黒画素の比率(=黒画素の面積/
小領域の面積)である濃度値を求め、文字領域中の濃度
値の分布をその文字図形の特徴として特徴抽出してい
た。そして、特徴抽出後の文字領域を、予め用意された
辞書中の文字パターン領域と濃度値分布の比較演算処理
を行うことにより文字認識が行われる。
【0003】手書き文字は必ずしも用紙の縦横方向に沿
って正確に書かれているとは限らず、若干傾いて書かれ
ている場合がある。また、読み取り対象となる文字も、
著しく傾いた斜字があったり、文字間隔が充分とられて
おらず隣接文字が互いに接近している場合もある。ま
た、用紙が読み取り方向に対して斜めに供給される場合
もある。
って正確に書かれているとは限らず、若干傾いて書かれ
ている場合がある。また、読み取り対象となる文字も、
著しく傾いた斜字があったり、文字間隔が充分とられて
おらず隣接文字が互いに接近している場合もある。ま
た、用紙が読み取り方向に対して斜めに供給される場合
もある。
【0004】これらの場合、読み取られた文字列を一文
字ずつに切り出す際に、読み取り方向(用紙の供給方
向)と平行には文字が切り出せないことが起こるため、
文字列から文字を切り出す角度を求める必要が生じる。
字ずつに切り出す際に、読み取り方向(用紙の供給方
向)と平行には文字が切り出せないことが起こるため、
文字列から文字を切り出す角度を求める必要が生じる。
【0005】通常、文字列の投影をとり、その投影のヒ
ストグラムの分布から文字の切り出し方向を求める。す
なわち、図8(a)に示すように、読み取り方向と直交
する水平方向(すなわち走査方向)を投影基準線SLの
傾斜角0°の状態とし、投影基準線SLを種々の角度に
傾斜させながら、投影基準線SLに対する文字列Rの投
影ヒストグラムを求める。そして、そのヒストグラムの
値が1画素以上となる連続領域hが最も多く現れ、且つ
投影基準線SLの傾斜角ができるだけ小さくなる条件を
文字毎に求め、文字毎に求められたその傾斜角に傾斜し
た投影基準線SLに対して直交する方向に文字が切り出
される。
ストグラムの分布から文字の切り出し方向を求める。す
なわち、図8(a)に示すように、読み取り方向と直交
する水平方向(すなわち走査方向)を投影基準線SLの
傾斜角0°の状態とし、投影基準線SLを種々の角度に
傾斜させながら、投影基準線SLに対する文字列Rの投
影ヒストグラムを求める。そして、そのヒストグラムの
値が1画素以上となる連続領域hが最も多く現れ、且つ
投影基準線SLの傾斜角ができるだけ小さくなる条件を
文字毎に求め、文字毎に求められたその傾斜角に傾斜し
た投影基準線SLに対して直交する方向に文字が切り出
される。
【0006】
【発明が解決しようとする課題】例えば図8(a)に示
す文字列Rのように「7」と「4」が近接する場合、投
影基準線が水平(θ=0°)のとき、その投影ヒストグ
ラムが3つの領域hに分かれ、傾斜角−θのとき、その
投影ヒストグラムは4つの領域hに分かれる。そのた
め、「1」と「2」は読み取り方向に真っ直ぐ切り取ら
れ、「7」と「4」は傾斜角−θ°に傾斜した投影基準
線SLに対して直交するように切り出される。つまり、
図8(a)中の破線で示す切り出し角でそれぞれの文字
Lが切り出される。
す文字列Rのように「7」と「4」が近接する場合、投
影基準線が水平(θ=0°)のとき、その投影ヒストグ
ラムが3つの領域hに分かれ、傾斜角−θのとき、その
投影ヒストグラムは4つの領域hに分かれる。そのた
め、「1」と「2」は読み取り方向に真っ直ぐ切り取ら
れ、「7」と「4」は傾斜角−θ°に傾斜した投影基準
線SLに対して直交するように切り出される。つまり、
図8(a)中の破線で示す切り出し角でそれぞれの文字
Lが切り出される。
【0007】図8(b)に示すように、切り出された文
字Lに対してその切り出し方向に沿って外接する四角形
で囲まれた領域が文字領域40として取り出され、図8
(c)に示すように、この文字領域40が規格サイズの
正方形領域に変換されることにより文字の正規化が行わ
れる。このとき、図8(c)に示すように、斜めに切り
出された「7」や「4」の文字Lは、その正規化後のパ
ターン形状が大きく(悪く)変形する。
字Lに対してその切り出し方向に沿って外接する四角形
で囲まれた領域が文字領域40として取り出され、図8
(c)に示すように、この文字領域40が規格サイズの
正方形領域に変換されることにより文字の正規化が行わ
れる。このとき、図8(c)に示すように、斜めに切り
出された「7」や「4」の文字Lは、その正規化後のパ
ターン形状が大きく(悪く)変形する。
【0008】このように正規化後のパターン形状が大き
く変形すると、その後のパターン認識による文字認識処
理でそのパターンに類似するパターンを辞書に見つけら
れず、識別不能となることが起こり得る。
く変形すると、その後のパターン認識による文字認識処
理でそのパターンに類似するパターンを辞書に見つけら
れず、識別不能となることが起こり得る。
【0009】また、図8(c)に示す「7」のパターン
が「1」のパターンに類似しているように、斜めに切り
出された文字Lの正規化後のパターンPが、他の文字の
パターンに類似することも起こり得る。この場合、認識
辞書による文字の識別が不能となったり、「7」が誤っ
て「1」と判定される虞れがある。これらの不具合は、
文字が斜めに切り出される、前記のように読み取り対象
文字が斜字であったり、用紙が斜めに供給された場合に
も起こる。用紙が斜めに供給された場合、図9に示すよ
うに文字列Rが読み取り方向に対して斜めに読み取られ
てしまい、同図破線で示す切り出し角で文字Lが斜めに
切り出される。このように文字が斜めに切り出される頻
度は少なくはなく、そのため文字の識別不能や識別ミス
が起こる可能性が多分にあった。
が「1」のパターンに類似しているように、斜めに切り
出された文字Lの正規化後のパターンPが、他の文字の
パターンに類似することも起こり得る。この場合、認識
辞書による文字の識別が不能となったり、「7」が誤っ
て「1」と判定される虞れがある。これらの不具合は、
文字が斜めに切り出される、前記のように読み取り対象
文字が斜字であったり、用紙が斜めに供給された場合に
も起こる。用紙が斜めに供給された場合、図9に示すよ
うに文字列Rが読み取り方向に対して斜めに読み取られ
てしまい、同図破線で示す切り出し角で文字Lが斜めに
切り出される。このように文字が斜めに切り出される頻
度は少なくはなく、そのため文字の識別不能や識別ミス
が起こる可能性が多分にあった。
【0010】本発明は上記問題点を解決するためになさ
れたものであって、その目的は、接近して書かれた文字
や斜字、用紙が斜めに供給されたことなどにより、文字
が斜めに切り出され、正規化後の文字パターンが悪く変
形しても、文字を正しく識別することができる文字認識
方法及び文字認識装置を提供することにある。
れたものであって、その目的は、接近して書かれた文字
や斜字、用紙が斜めに供給されたことなどにより、文字
が斜めに切り出され、正規化後の文字パターンが悪く変
形しても、文字を正しく識別することができる文字認識
方法及び文字認識装置を提供することにある。
【0011】
【課題を解決するための手段】上記問題点を解決するた
め請求項1に記載の発明では、読み取り文字列から文字
を切り出すその読み取り方向に対する切り出し角を、当
該文字の特徴量の一つとして文字認識するようにした。
め請求項1に記載の発明では、読み取り文字列から文字
を切り出すその読み取り方向に対する切り出し角を、当
該文字の特徴量の一つとして文字認識するようにした。
【0012】請求項2に記載の発明では、読み取り文字
列から文字を切り出すその読み取り方向に対する切り出
し角と、該切り出し角で切り出した文字の正規化後の文
字パターンから作成した文字特徴情報とを、当該文字の
特徴量として文字認識するようにした。
列から文字を切り出すその読み取り方向に対する切り出
し角と、該切り出し角で切り出した文字の正規化後の文
字パターンから作成した文字特徴情報とを、当該文字の
特徴量として文字認識するようにした。
【0013】請求項3に記載の発明では、文字を読み取
る読み取り手段と、前記読み取り手段により読み取られ
た文字列から文字を切り出す切り出し角を求めるととも
に、該切り出し角で前記文字を切り出す文字切り出し手
段と、前記文字切り取り手段により切り出された文字を
正規化する文字正規化手段と、前記文字切り出し手段に
より求められた前記文字の切り出し角と、前記文字正規
化手段による正規化後の文字パターンから作成した文字
特徴情報とを特徴量として当該文字を識別する文字認識
手段とを備えた。
る読み取り手段と、前記読み取り手段により読み取られ
た文字列から文字を切り出す切り出し角を求めるととも
に、該切り出し角で前記文字を切り出す文字切り出し手
段と、前記文字切り取り手段により切り出された文字を
正規化する文字正規化手段と、前記文字切り出し手段に
より求められた前記文字の切り出し角と、前記文字正規
化手段による正規化後の文字パターンから作成した文字
特徴情報とを特徴量として当該文字を識別する文字認識
手段とを備えた。
【0014】請求項4に記載の発明では、前記文字認識
手段を、前記切り出し角の情報と前記文字特徴情報とを
入力する入力層を備えるニューラルネットワーク型文字
認識手段とした。
手段を、前記切り出し角の情報と前記文字特徴情報とを
入力する入力層を備えるニューラルネットワーク型文字
認識手段とした。
【0015】請求項5に記載の発明では、前記文字認識
手段は、文字識別の基準となる文字のパターン情報を記
憶する辞書を備え、前記文字正規化手段による正規化後
の文字パターンから作成した文字特徴情報と、前記辞書
に記憶されたパターン情報との類似度の判定を、当該文
字の前記切り出し角の情報を判定要素に入れて行うとと
もに、その類似度の最も高い文字を識別結果として出力
するようにした。
手段は、文字識別の基準となる文字のパターン情報を記
憶する辞書を備え、前記文字正規化手段による正規化後
の文字パターンから作成した文字特徴情報と、前記辞書
に記憶されたパターン情報との類似度の判定を、当該文
字の前記切り出し角の情報を判定要素に入れて行うとと
もに、その類似度の最も高い文字を識別結果として出力
するようにした。
【0016】請求項6に記載の発明では、前記請求項3
〜請求項5に記載の文字認識装置をファクシミリ装置に
備えた。
〜請求項5に記載の文字認識装置をファクシミリ装置に
備えた。
【0017】
【作用】請求項1に記載の発明によれば、読み取り文字
列から文字を切り出すその読み取り方向に対する切り出
し角が、文字の特徴量の一つとされて文字が文字認識さ
れる。そのため、文字の切り出し角に起因して文字認識
のための前処理で文字の特徴量が悪く変更されても、そ
の切り出し角が特徴量として取り入れられることにより
識別すべき文字が絞り込まれ、文字を正しく識別するこ
とが可能となる。
列から文字を切り出すその読み取り方向に対する切り出
し角が、文字の特徴量の一つとされて文字が文字認識さ
れる。そのため、文字の切り出し角に起因して文字認識
のための前処理で文字の特徴量が悪く変更されても、そ
の切り出し角が特徴量として取り入れられることにより
識別すべき文字が絞り込まれ、文字を正しく識別するこ
とが可能となる。
【0018】請求項2に記載の発明によれば、読み取り
文字列から文字を切り出すその読み取り方向に対する切
り出し角と、その切り出し角で切り出された文字の正規
化後の文字パターンから作成された文字特徴情報とが特
徴量となってその識別対象である文字が認識される。そ
のため、文字の切り出し角に起因して文字の正規化後の
パターンが悪く変形されても、その切り出し角が特徴量
として取り入れられることにより識別すべき文字が絞り
込まれ、文字を正しく識別することが可能となる。
文字列から文字を切り出すその読み取り方向に対する切
り出し角と、その切り出し角で切り出された文字の正規
化後の文字パターンから作成された文字特徴情報とが特
徴量となってその識別対象である文字が認識される。そ
のため、文字の切り出し角に起因して文字の正規化後の
パターンが悪く変形されても、その切り出し角が特徴量
として取り入れられることにより識別すべき文字が絞り
込まれ、文字を正しく識別することが可能となる。
【0019】請求項3に記載の発明によれば、読み取り
手段により読み取られた文字列から、文字切り出し手段
により求められた切り出し角で文字が切り出され、その
切り出された文字は文字正規化手段により正規化され
る。この正規化により、読み取り方向に対して斜めに切
り出された文字が、文字認識に不都合な文字パターンに
悪く変形される場合があるが、その文字の正規化後の文
字パターンから作成された文字特徴情報と、切り出し角
の情報とが特徴量とされて文字認識手段による文字識別
処理が行われるので、その文字パターンの正規化時の変
形が考慮された正しい識別結果が得られる。そのため、
文字の識別正解率が向上するとともに、文字の識別不能
が解消される。
手段により読み取られた文字列から、文字切り出し手段
により求められた切り出し角で文字が切り出され、その
切り出された文字は文字正規化手段により正規化され
る。この正規化により、読み取り方向に対して斜めに切
り出された文字が、文字認識に不都合な文字パターンに
悪く変形される場合があるが、その文字の正規化後の文
字パターンから作成された文字特徴情報と、切り出し角
の情報とが特徴量とされて文字認識手段による文字識別
処理が行われるので、その文字パターンの正規化時の変
形が考慮された正しい識別結果が得られる。そのため、
文字の識別正解率が向上するとともに、文字の識別不能
が解消される。
【0020】請求項4に記載の発明によれば、ニューラ
ルネットワーク型文字認識手段の入力層に、切り出し角
の情報と文字特徴情報とが入力されると、文字の切り出
し角にかかわらず、その出力層からは正しい認識結果が
得られる。
ルネットワーク型文字認識手段の入力層に、切り出し角
の情報と文字特徴情報とが入力されると、文字の切り出
し角にかかわらず、その出力層からは正しい認識結果が
得られる。
【0021】請求項5に記載の発明によれば、前記文字
認識手段により、文字正規化手段による正規化後の文字
パターンから作成された文字特徴情報と、辞書に記憶さ
れたパターン情報との類似度の判定が、その識別対象文
字の切り出し角の情報を判定要素に入れて行われ、その
類似度の最も高い文字が識別結果として出力される。
認識手段により、文字正規化手段による正規化後の文字
パターンから作成された文字特徴情報と、辞書に記憶さ
れたパターン情報との類似度の判定が、その識別対象文
字の切り出し角の情報を判定要素に入れて行われ、その
類似度の最も高い文字が識別結果として出力される。
【0022】請求項6に記載の発明によれば、前記請求
項3〜請求項5に記載の文字認識装置を備えたファクシ
ミリ装置が提供される。
項3〜請求項5に記載の文字認識装置を備えたファクシ
ミリ装置が提供される。
【0023】
【実施例】以下、本発明を具体化した一実施例について
図1〜図7に従って説明する。本実施例では、文字認識
装置がファクシミリ装置に適用されている。
図1〜図7に従って説明する。本実施例では、文字認識
装置がファクシミリ装置に適用されている。
【0024】図1にファクシミリ装置1の電気的構成を
示す。同図に示すように、ファクシミリ装置1は、用紙
挿入部1aに用紙挿入用ローラ2を備え、その挿入口に
は用紙検知器3及びCCD(Charge Coupled Device )
4が配設されている。CCD4は2値化回路5,画像メ
モリ6を介して制御部7に接続されており、この制御部
7には、用紙検知器3,用紙挿入用ローラ2を駆動する
モータ8を駆動制御するモータ駆動回路9,入力部1
0,表示部11を駆動する表示制御回路12,トーンダ
イヤル部13,モデム14が接続されている。トーンダ
イヤル部13及びモデム14は、電話回線に接続された
NCU(網制御装置)15に接続されている。
示す。同図に示すように、ファクシミリ装置1は、用紙
挿入部1aに用紙挿入用ローラ2を備え、その挿入口に
は用紙検知器3及びCCD(Charge Coupled Device )
4が配設されている。CCD4は2値化回路5,画像メ
モリ6を介して制御部7に接続されており、この制御部
7には、用紙検知器3,用紙挿入用ローラ2を駆動する
モータ8を駆動制御するモータ駆動回路9,入力部1
0,表示部11を駆動する表示制御回路12,トーンダ
イヤル部13,モデム14が接続されている。トーンダ
イヤル部13及びモデム14は、電話回線に接続された
NCU(網制御装置)15に接続されている。
【0025】また、制御部7は、文字切り出し処理部1
6,正規化処理部17,文字認識部18,メモリ19,
電話番号管理処理部20,FAX符号化処理部21を備
えている。
6,正規化処理部17,文字認識部18,メモリ19,
電話番号管理処理部20,FAX符号化処理部21を備
えている。
【0026】用紙検知器3は、例えば光学式センサから
なり、用紙挿入部1aに用紙Pが挿入されたことを検知
するもので、この用紙検知器3からの検知信号は制御部
7に出力される。
なり、用紙挿入部1aに用紙Pが挿入されたことを検知
するもので、この用紙検知器3からの検知信号は制御部
7に出力される。
【0027】CCD4は多数の固体撮像素子より構成さ
れ、用紙Pに記載された文字の光学像に応じたアナログ
画像信号ASを発生するもので、このCCD4にて発生
された画像信号ASは2値化回路5に出力される。
れ、用紙Pに記載された文字の光学像に応じたアナログ
画像信号ASを発生するもので、このCCD4にて発生
された画像信号ASは2値化回路5に出力される。
【0028】2値化回路5は、CCD4から順次入力さ
れるアナログ画像信号ASを、白黒2値のデジタル画像
信号(以下、2値画像信号という)IDに変換するもの
で、この2値化回路5にて変換された2値画像信号ID
は画像メモリ6に出力される。
れるアナログ画像信号ASを、白黒2値のデジタル画像
信号(以下、2値画像信号という)IDに変換するもの
で、この2値化回路5にて変換された2値画像信号ID
は画像メモリ6に出力される。
【0029】画像メモリ6は、RAM(ランダムアクセ
スメモリ)により構成され、2値化回路5から入力され
る2値画像信号IDを、制御部7からのアドレス信号に
応じたメモリ領域に画像データとして読み出し可能に記
憶するものである。
スメモリ)により構成され、2値化回路5から入力され
る2値画像信号IDを、制御部7からのアドレス信号に
応じたメモリ領域に画像データとして読み出し可能に記
憶するものである。
【0030】制御部7は用紙検知器3から検知信号に基
づき、CCD4に読み取り速度を制御する読み取りタイ
ミング信号を出力するとともに、この読み取りタイミン
グ信号に同期してモータ8が駆動されるようにモータ駆
動回路9に駆動制御信号を出力する。
づき、CCD4に読み取り速度を制御する読み取りタイ
ミング信号を出力するとともに、この読み取りタイミン
グ信号に同期してモータ8が駆動されるようにモータ駆
動回路9に駆動制御信号を出力する。
【0031】入力部10は、電話番号を入力する番号入
力キーやFAX送信キーなどを備え、入力部10からの
キー入力データは制御部7に入力される。表示部11
は、例えば液晶表示装置(LCD)からなり、入力部1
0から制御部7に入力された番号入力データや、制御部
7にて読み取り認識された電話番号を表示するもので、
制御部7により表示制御回路12を介して駆動制御され
る。入力部10及び表示制御部12は電話番号管理処理
部20に接続されている。
力キーやFAX送信キーなどを備え、入力部10からの
キー入力データは制御部7に入力される。表示部11
は、例えば液晶表示装置(LCD)からなり、入力部1
0から制御部7に入力された番号入力データや、制御部
7にて読み取り認識された電話番号を表示するもので、
制御部7により表示制御回路12を介して駆動制御され
る。入力部10及び表示制御部12は電話番号管理処理
部20に接続されている。
【0032】電話番号管理処理部20は、文字認識部1
8及び入力部10から入力される電話番号データを記憶
する記憶部と、入力部10からの入力データに基づきそ
の記憶部に対して処理を施す処理部とからなる。この電
話番号管理処理部20は、入力部10から番号確認モー
ド時に入力された番号データを表示部11に表示すると
ともに、そのとき表示部11に表示中の電話番号に対応
する記憶部の電話番号データを番号データに基づき修正
する。また、入力部10の送信キーが操作された操作信
号に基づき、そのとき表示部11に表示中の電話番号に
対応する電話番号データを、記憶部から読出してトーン
ダイヤル部13に転送する。
8及び入力部10から入力される電話番号データを記憶
する記憶部と、入力部10からの入力データに基づきそ
の記憶部に対して処理を施す処理部とからなる。この電
話番号管理処理部20は、入力部10から番号確認モー
ド時に入力された番号データを表示部11に表示すると
ともに、そのとき表示部11に表示中の電話番号に対応
する記憶部の電話番号データを番号データに基づき修正
する。また、入力部10の送信キーが操作された操作信
号に基づき、そのとき表示部11に表示中の電話番号に
対応する電話番号データを、記憶部から読出してトーン
ダイヤル部13に転送する。
【0033】トーンダイヤル部13は、電話番号管理処
理部20から転送された電話番号データに応じてプッシ
ュ回線対応のトーン信号を発生するもので、トーンダイ
ヤル部13により発生されるトーン信号はNCU15に
送信される。
理部20から転送された電話番号データに応じてプッシ
ュ回線対応のトーン信号を発生するもので、トーンダイ
ヤル部13により発生されるトーン信号はNCU15に
送信される。
【0034】NCU15は、制御部7からの制御信号に
基づき電話回線に対するトーンダイヤル部13とモデム
14との接続を選択的に切り換えるとともに、電話回線
が相手先のファクシミリ装置と接続されたことを確認す
る。
基づき電話回線に対するトーンダイヤル部13とモデム
14との接続を選択的に切り換えるとともに、電話回線
が相手先のファクシミリ装置と接続されたことを確認す
る。
【0035】FAX符号化処理部21は、入力部10か
らのFAX送信キーの操作信号に基づき画像メモリ6か
ら順次読出される画像データを、FAX送信するための
符号化信号に変換する符号化処理を行う。このFAX符
号化処理部21にて符号化された符号化信号は、電話回
線接続後にモデム14,NCU15を介して電話回線か
ら接続回線先に送信される。
らのFAX送信キーの操作信号に基づき画像メモリ6か
ら順次読出される画像データを、FAX送信するための
符号化信号に変換する符号化処理を行う。このFAX符
号化処理部21にて符号化された符号化信号は、電話回
線接続後にモデム14,NCU15を介して電話回線か
ら接続回線先に送信される。
【0036】また、制御部7は、用紙Pの先頭の所定領
域に書かれた電話番号(又はFAX番号)を読み取った
画像データを、画像メモリ6から入力し、文字切り出し
処理部16,正規化処理部17,文字認識部18による
文字認識処理を行う。
域に書かれた電話番号(又はFAX番号)を読み取った
画像データを、画像メモリ6から入力し、文字切り出し
処理部16,正規化処理部17,文字認識部18による
文字認識処理を行う。
【0037】文字切り出し部16は、画像メモリ6から
入力された2値画像データに黒画素で現れる文字列Rか
ら文字Lを切り出す切り出し処理を行う。文字切り出し
部16は、文字列Rの画素を投影基準線SLに投影させ
た投影ヒストグラムの分布により文字の切り出し方向を
判定する。
入力された2値画像データに黒画素で現れる文字列Rか
ら文字Lを切り出す切り出し処理を行う。文字切り出し
部16は、文字列Rの画素を投影基準線SLに投影させ
た投影ヒストグラムの分布により文字の切り出し方向を
判定する。
【0038】図4に示すように、投影基準線SLは読み
取り方向に直交する水平線(図4の左右方向)に一致す
る状態を傾斜角0°とし、−3θ°から3θ°までθず
つの角度間隔で合計7つの傾斜角Θ(=−3θ°,−2
θ°,−θ°,0°,θ°,2θ°,3θ°)が設定さ
れている。投影基準線SLの傾斜角Θを、−3θ°から
3θ°までθずつ変化させながら、その投影基準線SL
に対して文字列Rの投影ヒストグラムが求められ、その
ヒストグラムの値が1画素以上となる連続領域hが分裂
を起こす傾斜角Θのうち、0°に一番近い傾斜角Θがそ
の文字Lの傾斜角Θとされる。例えば図4の例では、文
字「1」と「2」の傾斜角Θ=0°、文字「7」と
「4」の傾斜角Θ=θ°とされる。文字Lは文字毎の傾
斜角Θに基づき、その傾斜角に傾斜した投影基準線SL
に対して直交するように切り出されるようになってい
る。
取り方向に直交する水平線(図4の左右方向)に一致す
る状態を傾斜角0°とし、−3θ°から3θ°までθず
つの角度間隔で合計7つの傾斜角Θ(=−3θ°,−2
θ°,−θ°,0°,θ°,2θ°,3θ°)が設定さ
れている。投影基準線SLの傾斜角Θを、−3θ°から
3θ°までθずつ変化させながら、その投影基準線SL
に対して文字列Rの投影ヒストグラムが求められ、その
ヒストグラムの値が1画素以上となる連続領域hが分裂
を起こす傾斜角Θのうち、0°に一番近い傾斜角Θがそ
の文字Lの傾斜角Θとされる。例えば図4の例では、文
字「1」と「2」の傾斜角Θ=0°、文字「7」と
「4」の傾斜角Θ=θ°とされる。文字Lは文字毎の傾
斜角Θに基づき、その傾斜角に傾斜した投影基準線SL
に対して直交するように切り出されるようになってい
る。
【0039】また、文字L毎に求められた傾斜角Θは、
3ビットの2値信号としてメモリ19に記憶されるよう
になっている。すなわち、傾斜角Θの値が−3θ°から
3θ°まで順番に「000」「001」「010」…
「110」に変換され、この3ビット値「A1 A2 A3
」(A1 A2 A3 =0or1)が2値信号の傾斜信号A
1,A2 ,A3 としてメモリ19に記憶される。
3ビットの2値信号としてメモリ19に記憶されるよう
になっている。すなわち、傾斜角Θの値が−3θ°から
3θ°まで順番に「000」「001」「010」…
「110」に変換され、この3ビット値「A1 A2 A3
」(A1 A2 A3 =0or1)が2値信号の傾斜信号A
1,A2 ,A3 としてメモリ19に記憶される。
【0040】正規化処理部17は、文字切り出し部16
により一文字分ずつ切り出された領域内の画素の連接情
報に基づき、切り出された文字Lに対してその切り出し
方向に傾斜して外接する四角形の長辺に等しい長さを一
辺とする文字Lの外接正方形もしくは外接菱形で囲まれ
た領域を文字領域30(図5に示す)として設定する。
文字領域30は、その外周をなす縦横二辺と平行に8×
8のマトリクス状の小領域に分割され、その各小領域が
図6に示す8×8の規格サイズの規格領域31の各小領
域31aに対応するように、正方形の規格領域31に変
換されて正規化される。
により一文字分ずつ切り出された領域内の画素の連接情
報に基づき、切り出された文字Lに対してその切り出し
方向に傾斜して外接する四角形の長辺に等しい長さを一
辺とする文字Lの外接正方形もしくは外接菱形で囲まれ
た領域を文字領域30(図5に示す)として設定する。
文字領域30は、その外周をなす縦横二辺と平行に8×
8のマトリクス状の小領域に分割され、その各小領域が
図6に示す8×8の規格サイズの規格領域31の各小領
域31aに対応するように、正方形の規格領域31に変
換されて正規化される。
【0041】また、正規化後の規格領域31の各小領域
31aに対して黒画素の比率(=黒画素の面積/小領域
の面積)である濃度値C(0≦C≦1)が求められ、規
格領域31中の濃度値Cの分布が求められる。濃度値C
は各小領域31a毎にデジタル信号である濃度信号S1
〜S64に変換され、文字認識部18に出力されるように
なっている。
31aに対して黒画素の比率(=黒画素の面積/小領域
の面積)である濃度値C(0≦C≦1)が求められ、規
格領域31中の濃度値Cの分布が求められる。濃度値C
は各小領域31a毎にデジタル信号である濃度信号S1
〜S64に変換され、文字認識部18に出力されるように
なっている。
【0042】文字認識部18は、図2に示すニューラル
ネットを形成するニューロコンピュータ22を備え、入
力層23,中間層24,出力層25から構成される。図
2に示すように、入力層23は、正規化処理部17から
入力される濃度信号S1 〜S64と、メモリ19に蓄積さ
れた3ビットの傾斜角信号A1 ,A2 ,A3 とが入力さ
れる67個の入力部23aを備えている。
ネットを形成するニューロコンピュータ22を備え、入
力層23,中間層24,出力層25から構成される。図
2に示すように、入力層23は、正規化処理部17から
入力される濃度信号S1 〜S64と、メモリ19に蓄積さ
れた3ビットの傾斜角信号A1 ,A2 ,A3 とが入力さ
れる67個の入力部23aを備えている。
【0043】文字認識部18は、傾斜角Θが考慮されて
設計されている。すなわち、中間層24と入力層23の
結合係数、及び、中間層24と出力層25の結合係数
は、予め種々の文字パターンを、−3θ°から3θ°ま
でθ°ずつその傾斜をずらしながら入力し、学習させた
結果の値が用いられている。これらの結合係数は、電話
番号に使用される数字及び記号の文字パターンLが、書
体(斜字,癖字,印刷字など)の違い等を含め学習済み
である。
設計されている。すなわち、中間層24と入力層23の
結合係数、及び、中間層24と出力層25の結合係数
は、予め種々の文字パターンを、−3θ°から3θ°ま
でθ°ずつその傾斜をずらしながら入力し、学習させた
結果の値が用いられている。これらの結合係数は、電話
番号に使用される数字及び記号の文字パターンLが、書
体(斜字,癖字,印刷字など)の違い等を含め学習済み
である。
【0044】また、出力層25は、識別すべき文字の
数、すなわち電話番号に使用される数字及び記号に対応
する13個の出力部25aが設けられている。出力層2
5の出力部25aには、入力層23の各入力部23aに
入力された濃度信号S1 〜S64及び傾斜角信号A1 〜A
3 に基づき中間層24を介した演算処理結果が出力され
る。文字認識部18は、出力層25からの各出力値X1
〜X13が所定値以上の値となった出力部25aに対応す
る文字(数字,記号)を識別結果として判定する。文字
認識部18で認識された文字(数字,記号)は、電話番
号管理処理部20に出力されるようになっている。
数、すなわち電話番号に使用される数字及び記号に対応
する13個の出力部25aが設けられている。出力層2
5の出力部25aには、入力層23の各入力部23aに
入力された濃度信号S1 〜S64及び傾斜角信号A1 〜A
3 に基づき中間層24を介した演算処理結果が出力され
る。文字認識部18は、出力層25からの各出力値X1
〜X13が所定値以上の値となった出力部25aに対応す
る文字(数字,記号)を識別結果として判定する。文字
認識部18で認識された文字(数字,記号)は、電話番
号管理処理部20に出力されるようになっている。
【0045】次に上記のように構成されたファクシミリ
装置1の作用を説明する。まず、ファクシミリ装置1に
て送信する用紙Pの所定領域に送信先の電話番号(又は
FAX番号)を印刷もしくは手書きにより記載し、電話
番号が記載された側を先頭にして用紙Pを用紙挿入部1
aの挿入口に挿入する。
装置1の作用を説明する。まず、ファクシミリ装置1に
て送信する用紙Pの所定領域に送信先の電話番号(又は
FAX番号)を印刷もしくは手書きにより記載し、電話
番号が記載された側を先頭にして用紙Pを用紙挿入部1
aの挿入口に挿入する。
【0046】用紙Pを検知した用紙検知器3からの検知
信号を入力すると、制御部7は読み取りタイミング信号
を出力してCCD4を作動させるとともに、モータ駆動
回路9を介してモータ8を読み取りタイミング信号に同
期するよう駆動し、ローラ2の回転により用紙Pが所定
速度で先頭の所定領域だけ送り込まれる。
信号を入力すると、制御部7は読み取りタイミング信号
を出力してCCD4を作動させるとともに、モータ駆動
回路9を介してモータ8を読み取りタイミング信号に同
期するよう駆動し、ローラ2の回転により用紙Pが所定
速度で先頭の所定領域だけ送り込まれる。
【0047】CCD4から読み取られたアナログ画像信
号ASは、2値化回路5により2値画像信号IDに変換
されて画像メモリ6に蓄積され、さらに画像メモリ6に
蓄積された画像データは、文字切り出し処理部16に順
次に転送される。
号ASは、2値化回路5により2値画像信号IDに変換
されて画像メモリ6に蓄積され、さらに画像メモリ6に
蓄積された画像データは、文字切り出し処理部16に順
次に転送される。
【0048】文字切り出し処理部16では、用紙Pの先
頭所定領域から読み取られた2値画像データの画素に対
して、画素が投影される投影基準線SLの傾斜角Θを−
3θから3θまでθずつ変化させながら、それぞれの投
影ヒストグラムが求められ、そのヒストグラムの値が1
画素以上となる連続領域hが最多に分かれる最も小さい
傾斜角Θが各文字毎に求められる。そして、各文字Lは
その傾斜角Θに応じて投影基準線SLに対して直交する
ように切り出される。
頭所定領域から読み取られた2値画像データの画素に対
して、画素が投影される投影基準線SLの傾斜角Θを−
3θから3θまでθずつ変化させながら、それぞれの投
影ヒストグラムが求められ、そのヒストグラムの値が1
画素以上となる連続領域hが最多に分かれる最も小さい
傾斜角Θが各文字毎に求められる。そして、各文字Lは
その傾斜角Θに応じて投影基準線SLに対して直交する
ように切り出される。
【0049】例えば、文字列Rが全ての文字Lが読み取
り方向に平行に切り出されるように読み取られた場合に
は、文字Lは全て読み取り方向に切り出され、傾斜角Θ
=0°、すなわち「011」(図3参照)の傾斜信号A
1 〜A3 が文字切り出し処理部16からメモリ19に出
力される。そして、切り出された文字Lの文字領域30
が正規化処理部17により正規化された規格領域31に
おいてその文字パターンPは、正規化により悪く変形さ
れることなくほぼ元のパターン形状に正規化される。そ
して、その正規のパターンPの濃度信号S1 〜S64と、
傾斜角0°に対応する「001」の傾斜信号A1 〜A3
が入力層3に入力され、その出力層25から識別結果が
出力される。電話番号データとして電話番号管理処理部
20に出力される。
り方向に平行に切り出されるように読み取られた場合に
は、文字Lは全て読み取り方向に切り出され、傾斜角Θ
=0°、すなわち「011」(図3参照)の傾斜信号A
1 〜A3 が文字切り出し処理部16からメモリ19に出
力される。そして、切り出された文字Lの文字領域30
が正規化処理部17により正規化された規格領域31に
おいてその文字パターンPは、正規化により悪く変形さ
れることなくほぼ元のパターン形状に正規化される。そ
して、その正規のパターンPの濃度信号S1 〜S64と、
傾斜角0°に対応する「001」の傾斜信号A1 〜A3
が入力層3に入力され、その出力層25から識別結果が
出力される。電話番号データとして電話番号管理処理部
20に出力される。
【0050】また、例えば図4に示す文字列「127
4」が画像データに含まれていたとすると、この文字列
Rに対して、各傾斜角Θ(−3θ〜3θ)に配置した投
影基準線SLに対して投影ヒストグラムが求められる。
文字列R中の「7」と「4」が近接しているため、投影
基準線SLが水平(Θ=0°)のときやΘ=θ°のとき
にはヒストグラムの連続領域hの数が3個であり、これ
に対してΘ=−θ°のとき連続領域hの数が4個にな
る。しかもこの傾斜角Θが領域hの数が4個に分裂する
最小(但し、絶対値)の傾斜角であるので、この傾斜角
Θ=−θ°が文字「7」と「4」の切り出し角度とされ
る。
4」が画像データに含まれていたとすると、この文字列
Rに対して、各傾斜角Θ(−3θ〜3θ)に配置した投
影基準線SLに対して投影ヒストグラムが求められる。
文字列R中の「7」と「4」が近接しているため、投影
基準線SLが水平(Θ=0°)のときやΘ=θ°のとき
にはヒストグラムの連続領域hの数が3個であり、これ
に対してΘ=−θ°のとき連続領域hの数が4個にな
る。しかもこの傾斜角Θが領域hの数が4個に分裂する
最小(但し、絶対値)の傾斜角であるので、この傾斜角
Θ=−θ°が文字「7」と「4」の切り出し角度とされ
る。
【0051】また、文字列R中の「1」と「2」は、θ
=0°ですでに2つの領域hに分裂しているため、読み
取り方向と平行に切り出されることになる。この傾斜角
Θの値は、傾斜角信号A1〜A3としてメモリ19に蓄
積される。この場合、文字「1」と「2」に対してはθ=
0°に対応する「011」が、文字「7」と「4」に対
してはΘ=−θ°に対応する「010」(図3参照)が
メモリ19に蓄積されることになる。
=0°ですでに2つの領域hに分裂しているため、読み
取り方向と平行に切り出されることになる。この傾斜角
Θの値は、傾斜角信号A1〜A3としてメモリ19に蓄
積される。この場合、文字「1」と「2」に対してはθ=
0°に対応する「011」が、文字「7」と「4」に対
してはΘ=−θ°に対応する「010」(図3参照)が
メモリ19に蓄積されることになる。
【0052】そして、ヒストグラムの値が1画素以上の
連続領域hを一文字分の領域とし、文字毎に求められた
傾斜角Θに応じて投影基準線SLに対して直交するよう
に文字Lが図5(a)に示す破線のように切り出され
る。
連続領域hを一文字分の領域とし、文字毎に求められた
傾斜角Θに応じて投影基準線SLに対して直交するよう
に文字Lが図5(a)に示す破線のように切り出され
る。
【0053】次に正規化処理部17では、この一文字分
ずつ切り出された文字パターンLの画素の連接情報に基
づき文字Lの切り出し方向に外接する四角形がとられ、
その外接四角形の長辺を一辺とする図5(b)に示す外
接正方形もしくは外接菱形に囲まれた領域が文字領域3
0とされる。
ずつ切り出された文字パターンLの画素の連接情報に基
づき文字Lの切り出し方向に外接する四角形がとられ、
その外接四角形の長辺を一辺とする図5(b)に示す外
接正方形もしくは外接菱形に囲まれた領域が文字領域3
0とされる。
【0054】次に、図5(c)に示すように、この文字
領域30が規格サイズの規格領域31に変換されて文字
パターンLが正規化される。このとき、斜めに切り出さ
れた文字「7」「4」は、この正規化により、図5
(c)及び図6に示すように元のパターン形状と異なっ
て変形される。この規格領域31に対して、図6に示す
8×8に分割された小領域31a毎に、黒画素の濃度値
(黒画素の面積/小領域の面積)比率)Cが求められる
とともに、各濃度値Cに対応するは濃度信号S1 〜S64
が文字認識部18に出力される。
領域30が規格サイズの規格領域31に変換されて文字
パターンLが正規化される。このとき、斜めに切り出さ
れた文字「7」「4」は、この正規化により、図5
(c)及び図6に示すように元のパターン形状と異なっ
て変形される。この規格領域31に対して、図6に示す
8×8に分割された小領域31a毎に、黒画素の濃度値
(黒画素の面積/小領域の面積)比率)Cが求められる
とともに、各濃度値Cに対応するは濃度信号S1 〜S64
が文字認識部18に出力される。
【0055】文字認識部18には、一文字分ずつ順番に
その濃度信号S1 〜S64が入力され、それに同期してメ
モリ19からその文字に対応する傾斜信号A1 〜A3 が
入力される。ここで5(c)に示す「1」「2」のパタ
ーンPの濃度信号S1 〜S64にはそれぞれ「011」の
傾斜信号A1 〜A3 が入力層23の各入力部23aに入
力され、図5(c)の「7」「4」のパターンPの濃度
信号S1 〜S64にはそれぞれ「010」の傾斜信号A1
〜A3 が同期して入力される。
その濃度信号S1 〜S64が入力され、それに同期してメ
モリ19からその文字に対応する傾斜信号A1 〜A3 が
入力される。ここで5(c)に示す「1」「2」のパタ
ーンPの濃度信号S1 〜S64にはそれぞれ「011」の
傾斜信号A1 〜A3 が入力層23の各入力部23aに入
力され、図5(c)の「7」「4」のパターンPの濃度
信号S1 〜S64にはそれぞれ「010」の傾斜信号A1
〜A3 が同期して入力される。
【0056】入力層23の各入力部23aから入力され
た入力信号S1 〜S64,A1 〜A3に基づき中間層24
を介して文字の識別演算処理が行われ、その演算処理結
果が出力層25の各出力部25aから出力される。各出
力部25aからの出力値のうち所定値以上の値をとる一
つの出力部25aに対応する数字又は記号が識別結果と
される。この処理が読み取られた各文字Lに対して順次
に行われ、用紙Pの所定領域に記載された電話番号(又
はFAX番号)が文字認識される。
た入力信号S1 〜S64,A1 〜A3に基づき中間層24
を介して文字の識別演算処理が行われ、その演算処理結
果が出力層25の各出力部25aから出力される。各出
力部25aからの出力値のうち所定値以上の値をとる一
つの出力部25aに対応する数字又は記号が識別結果と
される。この処理が読み取られた各文字Lに対して順次
に行われ、用紙Pの所定領域に記載された電話番号(又
はFAX番号)が文字認識される。
【0057】ここで、中間層24と入力層23の結合係
数、及び、中間層24と出力層25の結合係数は、予め
種々の文字パターンを、−3θ°から3θ°までθ°ず
つその傾斜をずらしながら入力し、学習させた結果の値
を用いる。そのため、文字パターンが読み取り方向に対
して斜めに切り出され、その正規化により文字パターン
Pが元の文字パターンから識別しずらいパターン形状に
悪く変形されていても、その文字は正しく識別される。
数、及び、中間層24と出力層25の結合係数は、予め
種々の文字パターンを、−3θ°から3θ°までθ°ず
つその傾斜をずらしながら入力し、学習させた結果の値
を用いる。そのため、文字パターンが読み取り方向に対
して斜めに切り出され、その正規化により文字パターン
Pが元の文字パターンから識別しずらいパターン形状に
悪く変形されていても、その文字は正しく識別される。
【0058】文字認識部18により文字認識された電話
番号データは、電話番号管理処理部20に記憶されると
ともに、表示制御回路12を介して表示部11に表示さ
れる。表示部11に表示された電話番号を確認して間違
いがなければ、入力部10の送信キーを操作してFAX
送信を開始させる。このとき、送信キーが操作されるこ
とにより、電話番号管理処理部20に記憶された電話番
号データはトーンダイヤル部13に転送される。トーン
ダイヤル部13では電話番号データに応じたプッシュ回
線対応のトーン信号が発生されてNCU15を介して電
話回線へ送信される。
番号データは、電話番号管理処理部20に記憶されると
ともに、表示制御回路12を介して表示部11に表示さ
れる。表示部11に表示された電話番号を確認して間違
いがなければ、入力部10の送信キーを操作してFAX
送信を開始させる。このとき、送信キーが操作されるこ
とにより、電話番号管理処理部20に記憶された電話番
号データはトーンダイヤル部13に転送される。トーン
ダイヤル部13では電話番号データに応じたプッシュ回
線対応のトーン信号が発生されてNCU15を介して電
話回線へ送信される。
【0059】そして、送信先のファクシミリ装置と電話
回線が接続されると、CCD4及びモータ8が再び駆動
され、用紙Pが所定領域まで読み取られた続きから読み
取りが開始される。CCD4から読み取られた画像デー
タは2値化回路5にて2値化されて画像メモリ6に一時
蓄積され、順次にFAX符号化処理部21にて符号化信
号に変換される。このとき、NCU15はモデム14に
接続が切り換えられており、FAX符号化処理部21に
て符号化された符号化信号はモデム14及びNCU15
を介して電話回線に送信される。なお、文字認識されて
表示部11に表示された電話番号に間違いがあれば、入
力部10の番号入力キーにてその番号を修正した後、送
信キーを操作する。
回線が接続されると、CCD4及びモータ8が再び駆動
され、用紙Pが所定領域まで読み取られた続きから読み
取りが開始される。CCD4から読み取られた画像デー
タは2値化回路5にて2値化されて画像メモリ6に一時
蓄積され、順次にFAX符号化処理部21にて符号化信
号に変換される。このとき、NCU15はモデム14に
接続が切り換えられており、FAX符号化処理部21に
て符号化された符号化信号はモデム14及びNCU15
を介して電話回線に送信される。なお、文字認識されて
表示部11に表示された電話番号に間違いがあれば、入
力部10の番号入力キーにてその番号を修正した後、送
信キーを操作する。
【0060】以上詳述したように本実施例のファクシミ
リ装置1によれば、文字が読み取り方向に対して斜めに
切り出されたことにより、その正規化後のパターンPが
元のパターンから悪く変形されても、その文字切り取り
時の傾斜角Θ、すなわち傾斜信号A1 〜A3 が、そのパ
ターンPの濃度信号とともに文字認識処理に反映され
る。従って、正規化後に悪く変形された「7」のパター
ンそれだけでは文字判定不能であっても、このパターン
Pがそのように変形された傾斜角Θの要素を文字判定に
加味することにより、それらの条件を満足する一つの文
字が認識結果として絞り込まれる。従って、隣接文字が
互いに近接する文字や斜字、さらに用紙が斜めに供給さ
れてもとにより、文字が斜めに切り出されることになっ
ても、文字を正しく識別することができる。
リ装置1によれば、文字が読み取り方向に対して斜めに
切り出されたことにより、その正規化後のパターンPが
元のパターンから悪く変形されても、その文字切り取り
時の傾斜角Θ、すなわち傾斜信号A1 〜A3 が、そのパ
ターンPの濃度信号とともに文字認識処理に反映され
る。従って、正規化後に悪く変形された「7」のパター
ンそれだけでは文字判定不能であっても、このパターン
Pがそのように変形された傾斜角Θの要素を文字判定に
加味することにより、それらの条件を満足する一つの文
字が認識結果として絞り込まれる。従って、隣接文字が
互いに近接する文字や斜字、さらに用紙が斜めに供給さ
れてもとにより、文字が斜めに切り出されることになっ
ても、文字を正しく識別することができる。
【0061】また、ニューロコンピュータ22により文
字認識処理を行う構成としたので、入力層23に傾斜信
号A1 〜A3 の入力部23aが少し増える他は、基準と
なる文字のパターンをその切り出し角毎に学習させるソ
フト的な変更だけで済すませることができる。そのた
め、その学習させる文字のパターン数が増えても辞書の
ようにその記憶容量が非常に増えることがない。
字認識処理を行う構成としたので、入力層23に傾斜信
号A1 〜A3 の入力部23aが少し増える他は、基準と
なる文字のパターンをその切り出し角毎に学習させるソ
フト的な変更だけで済すませることができる。そのた
め、その学習させる文字のパターン数が増えても辞書の
ようにその記憶容量が非常に増えることがない。
【0062】なお、この実施例では、ニューラルネット
ワーク型文字認識部として、3層の階層型ニューラルネ
ットワークを示したが、当然、本願はこれに限定される
わけではない。ニューラルネットワーク型パターン認識
に関しては、特開平4−177485号、特開平4−2
60987号、特開平6−44409号公報及び多くの
文献等にも記載される周知の技術なので詳細は割愛し
た。
ワーク型文字認識部として、3層の階層型ニューラルネ
ットワークを示したが、当然、本願はこれに限定される
わけではない。ニューラルネットワーク型パターン認識
に関しては、特開平4−177485号、特開平4−2
60987号、特開平6−44409号公報及び多くの
文献等にも記載される周知の技術なので詳細は割愛し
た。
【0063】また、この実施例では、正規化処理部の出
力をそのまま文字認識部に入力したが、当然、これは、
特徴抽出を行ってから入力してもよい。特徴抽出に関し
ては、特開平5−282496号、特開平5−2581
11号、特開平5−342186号、特開平5−324
838号公報等に特徴抽出または前処理として説明さ
れ、周知の技術なので説明は割愛する。
力をそのまま文字認識部に入力したが、当然、これは、
特徴抽出を行ってから入力してもよい。特徴抽出に関し
ては、特開平5−282496号、特開平5−2581
11号、特開平5−342186号、特開平5−324
838号公報等に特徴抽出または前処理として説明さ
れ、周知の技術なので説明は割愛する。
【0064】また、この実施例では、文字認識部をニュ
ーロコンピュータとしたが、実際は、当然、ニューロチ
ップで実現してもよいし、この文字認識部だけでなく制
御部を含めてマイクロコンピュータによりプログラムに
より実現してもよい。
ーロコンピュータとしたが、実際は、当然、ニューロチ
ップで実現してもよいし、この文字認識部だけでなく制
御部を含めてマイクロコンピュータによりプログラムに
より実現してもよい。
【0065】なお、本発明は上記実施例に限定されるも
のではなく、以下のように実施してもよい。 (1)図7に示すように、文字認識装置18をニューロ
コンピュータ22ではなく、書体(斜め文字、癖字な
ど)等の違い毎のパターンの図形特徴(濃度分布)を記
憶した辞書26に予め用意されたパターンと正規化後の
パターンの濃度値の分布を特徴抽出して類似度判定する
ことにより文字認識する構成とし、文字の切り出し角に
起因して正規化後の文字パターンが辞書26に基く類似
度判定により、一つに絞り切れなかった場合、メモリ1
9から傾斜信号Aに基き候補の文字のうちから識別文字
を判定するようにしてもよい。例えば、図6に示すパタ
ーンPについて、文字認識部18による辞書26に基く
類似度判定をした結果、例えば、候補として「1」と
「7」が類似度が高い文字として絞られた場合、メモリ
19からの傾斜信号Aが「011」すなわち傾斜角Θ=
0°であれば、「1」が識別結果とされ、傾斜信号Aが
「010」すなわち傾斜角Θ=−θ°であれば、「7」
が識別結果とされるようにする。この構成によっても、
斜め文字や読み取り時の紙面の回転ずれによる正規化後
のパターンの変形に起因して文字が識別困難となること
を解消することができる。また、傾斜信号Aを2値信号
でないデジタル信号としてもよい。
のではなく、以下のように実施してもよい。 (1)図7に示すように、文字認識装置18をニューロ
コンピュータ22ではなく、書体(斜め文字、癖字な
ど)等の違い毎のパターンの図形特徴(濃度分布)を記
憶した辞書26に予め用意されたパターンと正規化後の
パターンの濃度値の分布を特徴抽出して類似度判定する
ことにより文字認識する構成とし、文字の切り出し角に
起因して正規化後の文字パターンが辞書26に基く類似
度判定により、一つに絞り切れなかった場合、メモリ1
9から傾斜信号Aに基き候補の文字のうちから識別文字
を判定するようにしてもよい。例えば、図6に示すパタ
ーンPについて、文字認識部18による辞書26に基く
類似度判定をした結果、例えば、候補として「1」と
「7」が類似度が高い文字として絞られた場合、メモリ
19からの傾斜信号Aが「011」すなわち傾斜角Θ=
0°であれば、「1」が識別結果とされ、傾斜信号Aが
「010」すなわち傾斜角Θ=−θ°であれば、「7」
が識別結果とされるようにする。この構成によっても、
斜め文字や読み取り時の紙面の回転ずれによる正規化後
のパターンの変形に起因して文字が識別困難となること
を解消することができる。また、傾斜信号Aを2値信号
でないデジタル信号としてもよい。
【0066】(2)前記実施例では切り出し角を傾斜角
Θとしたが、切り出し角に対応する値であれば次元は角
度でなくてもよい。例えば、ベクトルで示された切り出
し方向であってもよい。
Θとしたが、切り出し角に対応する値であれば次元は角
度でなくてもよい。例えば、ベクトルで示された切り出
し方向であってもよい。
【0067】(3)前記実施例では切り出し角としての
傾斜角Θを7種類設定したが、その数は必要に応じて適
宜変更してもよい。 (4)前記実施例では、電話番号に使用される数字及び
記号を文字認識の対象文字としたが、ひらがな、カタカ
ナ、英字、漢字などその他の文字を認識対象文字に含ま
れていてもよい。
傾斜角Θを7種類設定したが、その数は必要に応じて適
宜変更してもよい。 (4)前記実施例では、電話番号に使用される数字及び
記号を文字認識の対象文字としたが、ひらがな、カタカ
ナ、英字、漢字などその他の文字を認識対象文字に含ま
れていてもよい。
【0068】(5)ファクシミリ装置に限定されず、本
発明をその他の装置に適用することができる。
発明をその他の装置に適用することができる。
【0069】
【発明の効果】以上詳述したように請求項1に記載の発
明によれば、文字の切り出し角に起因して文字認識のた
めの前処理で文字の特徴量が悪く変更されても、その切
り出し角が特徴量として取り入れられることにより識別
すべき文字が絞り込まれ、文字を正しく識別することが
できる。
明によれば、文字の切り出し角に起因して文字認識のた
めの前処理で文字の特徴量が悪く変更されても、その切
り出し角が特徴量として取り入れられることにより識別
すべき文字が絞り込まれ、文字を正しく識別することが
できる。
【0070】請求項2及び請求項3に記載の発明によれ
ば、文字の切り出し角に起因して正規化後の文字パター
ンが悪く変形されても、その切り出し角が特徴量として
取り入れられることにより識別すべき文字が絞り込ま
れ、文字を正しく識別することができる。
ば、文字の切り出し角に起因して正規化後の文字パター
ンが悪く変形されても、その切り出し角が特徴量として
取り入れられることにより識別すべき文字が絞り込ま
れ、文字を正しく識別することができる。
【0071】請求項4に記載の発明によれば、文字認識
手段を、切り出し角の情報と前記文字特徴情報とを入力
する入力層を備えたニューラルネットワーク型文字認識
手段としたので、入力層に切り出し角の情報と文字特徴
情報とを入力すると、文字の切り出し角にかかわらず、
その出力層から正しい認識結果を得ることができる。
手段を、切り出し角の情報と前記文字特徴情報とを入力
する入力層を備えたニューラルネットワーク型文字認識
手段としたので、入力層に切り出し角の情報と文字特徴
情報とを入力すると、文字の切り出し角にかかわらず、
その出力層から正しい認識結果を得ることができる。
【0072】請求項5に記載の発明によれば、文字認識
を辞書による類似度の判定により行う場合でも、認識対
象文字の正規化後のパターン情報と、辞書に記憶された
パターン情報との類似度の判定に、その認識対象文字の
切り出し角の情報が判定要素として取り入れられるの
で、正しい識別結果を得ることができる。
を辞書による類似度の判定により行う場合でも、認識対
象文字の正規化後のパターン情報と、辞書に記憶された
パターン情報との類似度の判定に、その認識対象文字の
切り出し角の情報が判定要素として取り入れられるの
で、正しい識別結果を得ることができる。
【0073】請求項6に記載の発明によれば、前記請求
項3〜請求項5に記載の文字認識装置による効果を有す
るファクシミリ装置を提供することができる。
項3〜請求項5に記載の文字認識装置による効果を有す
るファクシミリ装置を提供することができる。
【図1】一実施例のファクシミリ装置のブロック図。
【図2】文字認識部のブロック図。
【図3】ニューラルネット型文字認識部の説明図。
【図4】文字列の投影ヒストグラム図。
【図5】切り出し文字の正規化過程を示す説明図。
【図6】正規化後の文字パターン図。
【図7】別例の制御部を示すブロック図。
【図8】従来技術における切り出し文字の正規化過程を
示す説明図。
示す説明図。
【図9】同じく文字の切り出し説明図。
1…ファクシミリ装置、4…文字認識装置を構成すると
ともに読み取り手段としてのCCD、5…文字認識装置
を構成する2値化回路、6…文字認識装置を構成する画
像メモリ、16…文字認識装置を構成するとともに文字
切り出し手段としての文字切り出し処理部、17…文字
認識装置を構成するとともに文字正規化手段としての正
規化処理部、18…文字認識装置を構成するとともに文
字認識手段としての文字認識部、19…文字認識装置を
構成するメモリ、22…ニューラルネットワーク型文字
認識手段としてのニューロコンピュータ、23…入力
層、26…文字認識装置を構成する辞書、30…文字領
域、A1 〜A3 …切り出し角としての傾斜信号、R…文
字列。
ともに読み取り手段としてのCCD、5…文字認識装置
を構成する2値化回路、6…文字認識装置を構成する画
像メモリ、16…文字認識装置を構成するとともに文字
切り出し手段としての文字切り出し処理部、17…文字
認識装置を構成するとともに文字正規化手段としての正
規化処理部、18…文字認識装置を構成するとともに文
字認識手段としての文字認識部、19…文字認識装置を
構成するメモリ、22…ニューラルネットワーク型文字
認識手段としてのニューロコンピュータ、23…入力
層、26…文字認識装置を構成する辞書、30…文字領
域、A1 〜A3 …切り出し角としての傾斜信号、R…文
字列。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 堀井 洋 大阪府守口市京阪本通2丁目5番5号 三洋電機株式会社内 (72)発明者 田中 淳司 鳥取県鳥取市南吉方3丁目201番地 鳥 取三洋電機株式会社内 (56)参考文献 特開 平3−250280(JP,A) 特開 平6−162270(JP,A) 特開 平5−22555(JP,A) 特開 平4−304069(JP,A) 特開 平3−90981(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 - 9/82
Claims (6)
- 【請求項1】 読み取り文字列から1文字を切り出すそ
の読み取り方向に対する切り出し角を、当該文字の特徴
量の一つとして文字認識する文字認識方法。 - 【請求項2】 読み取り文字列から1文字を切り出すそ
の読み取り方向に対する切り出し角を第1の特徴量とし
て、該切り出し角で切り出した文字パターンに対して正
規化処理を施した後の文字パターンから作成した文字特
徴情報を第2の特徴量として、当該文字を文字認識する
文字認識方法。 - 【請求項3】 文字列を読み取る読み取り手段(4)
と、 前記読み取り手段(4)により読み取られた文字列から
文字を切り出す切り出し角を求めると共に、該切り出し
角で前記文字を切り出す文字切り出し手段(16)と、 前記文字切り出し手段(16)により切り出された文字
を正規化する文字正規化手段(17)と、 前記文字切り出し手段(16)により求められた前記文
字の切り出し角を第1の特徴量として、前記文字正規化
手段(17)による正規化後の文字パターンから作成し
た文字特徴情報を第2の特徴量として当該文字を識別す
る文字認識手段(18、22、26)とを備えた文字認
識装置。 - 【請求項4】 前記文字認識手段(18、22、26)
は、前記切り出し角の情報と前記文字特徴情報とを入力
する入力層(23)を備えるニューラルネットワーク型
文字認識手段であることを特徴とする請求項3に記載の
文字認識装置。 - 【請求項5】 前記文字認識手段(18、22、26)
は、文字識別の基準となる文字のパターン情報を記憶す
る辞書(26)を備え、前記文字正規化手段(17)に
よる正規化後の文字パターンから作成した文字特徴情報
と、前記辞書(26)に記憶されたパターン情報との類
似度の判定を、当該文字の前記切り出し角の情報を判定
要素に入れて行うとともに、その類似度の最も高い文字
を識別結果として出力する請求項3に記載の文字認識装
置。 - 【請求項6】 前記請求項3〜請求項5に記載の文字認
識装置を備えたファクシミリ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7103996A JP2994985B2 (ja) | 1995-04-27 | 1995-04-27 | 文字認識方法及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7103996A JP2994985B2 (ja) | 1995-04-27 | 1995-04-27 | 文字認識方法及び文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08297719A JPH08297719A (ja) | 1996-11-12 |
JP2994985B2 true JP2994985B2 (ja) | 1999-12-27 |
Family
ID=14368913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7103996A Expired - Fee Related JP2994985B2 (ja) | 1995-04-27 | 1995-04-27 | 文字認識方法及び文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2994985B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6760589B2 (ja) * | 2015-10-30 | 2020-09-23 | 株式会社シーイーシー | 画像処理装置および画像処理方法 |
-
1995
- 1995-04-27 JP JP7103996A patent/JP2994985B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08297719A (ja) | 1996-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101160950B (zh) | 图像处理装置和图像处理方法 | |
EP0472313B1 (en) | Image processing method and apparatus therefor | |
JPH1044513A (ja) | コード印刷装置及びそれに適用されるコード印刷媒体 | |
US7016538B2 (en) | Image processor for detecting specified pattern | |
JP2994985B2 (ja) | 文字認識方法及び文字認識装置 | |
US6983077B2 (en) | Image processor | |
JP3086653B2 (ja) | 文字認識方法及び文字認識装置 | |
JP2963042B2 (ja) | 文字認識結果表示方法及び文字認識装置 | |
JP4206605B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラムを記録した記録媒体 | |
JP2865611B2 (ja) | 文字の特徴抽出方法及びその装置並びに文字認識方法及びその装置 | |
JPH0296885A (ja) | 画像処理装置 | |
JPH06274691A (ja) | 文字認識装置 | |
JP2581809B2 (ja) | 文字切出し装置 | |
JP2005301713A (ja) | 帳票画像の地紋除去方法及び装置 | |
JPH0916716A (ja) | 文字認識方法及び文字認識装置並びに文字正規化方法及び文字正規化装置 | |
JP4218541B2 (ja) | 情報埋込み装置および情報検証装置、ならびにその情報検証方法 | |
JPH10257327A (ja) | 画像データ処理装置 | |
ANTONACOPOULOS | Automatic reading of Braille documents | |
JP4105376B2 (ja) | 図形検出回路 | |
JP2789647B2 (ja) | 線画像認識方法 | |
JP3381803B2 (ja) | 傾き角検出装置 | |
JP4206606B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラムを記録した記録媒体 | |
JP2957774B2 (ja) | 行方向判定装置 | |
JPH0258185A (ja) | ファクシミリ文字認識方式 | |
JPH10233930A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071022 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081022 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081022 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091022 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |