JP3093330B2 - 文字認識の前処理方法、文字認識方法及び文字認識装置 - Google Patents

文字認識の前処理方法、文字認識方法及び文字認識装置

Info

Publication number
JP3093330B2
JP3093330B2 JP03155474A JP15547491A JP3093330B2 JP 3093330 B2 JP3093330 B2 JP 3093330B2 JP 03155474 A JP03155474 A JP 03155474A JP 15547491 A JP15547491 A JP 15547491A JP 3093330 B2 JP3093330 B2 JP 3093330B2
Authority
JP
Japan
Prior art keywords
character
processing
image
character image
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03155474A
Other languages
English (en)
Other versions
JPH04354084A (ja
Inventor
敏文 山合
元 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03155474A priority Critical patent/JP3093330B2/ja
Publication of JPH04354084A publication Critical patent/JPH04354084A/ja
Application granted granted Critical
Publication of JP3093330B2 publication Critical patent/JP3093330B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識の前処理方
法、文字認識方法及び文字認識装置に関する。
【0002】
【従来の技術】文字認識装置もしくはシステムにおいて
は、文字画像の潰れ(文字線分間の空白部の縮小)は認
識率を悪化させる要因となる。特に輪郭追跡等によって
文字線分の輪郭部分から特徴を抽出する文字認識アルゴ
リズムの場合、文字画像の潰れがあると安定した特徴量
を抽出できず、認識率が著しく悪化する。
【0003】従来、このような文字画像の潰れを減らす
ために、文字認識の前処理の段階で、文字画像に対し文
字線分を細める処理(細め処理)を施す方法が採られて
いる。この細め処理は、例えば文字画像を縦方向あるい
は横方向にスキャンし、空白部に続いて2個以上の黒画
素が存在する場合に、空白部に隣接する黒画素を白画素
に変換する操作を、必要な方向について必要な回数繰り
返すか、あるいは文字画像と、それを1画素分だけ縦方
向または横方向に相対的にずらした文字画像との論理積
演算を、必要な方向に必要回数繰り返すことにより行な
われている。
【0004】また、文字認識装置もしくはシステムにお
いては、文字認識の前処理の段階で、文字画像に対し、
そのサイズを一定に揃えるためのサイズ正規化処理が一
般に施される。このサイズ正規化処理後の文字画像に対
し細め処理を施す方法も提案されている。例えば特開昭
60−147889号公報には、サイズ正規化前の文字
画像の文字線幅、拡大率、サイズ正規化後の文字画像の
文字線幅を測定して線幅補正量を求め、この線幅補正量
に従ってサイズ正規化後の文字画像に対し細め処理(あ
るいは太め処理)を施す方法が開示されている。また、
特開昭63−280390号公報に、文字画像の黒画素
数と輪郭長を測定し、これらより文字線幅を計算し、計
算値を標準パターンの文字線幅と比較することにより、
細め処理あるいは太め処理を選択して文字画像に施す方
法が開示されている。
【0005】
【発明が解決しようとする課題】前述のように、従来は
基本的に文字線幅に着目し、細め処理によって文字画像
の潰れの減少あるいは防止を達成しようとしている。し
かし、細め処理では、間に十分な幅の空白部が存在する
文字線分も細められてしまうため、処理による文字画像
の歪みが大きい。また細め処理は、所望の文字線幅とな
るように複数回繰り返された場合、文字画像の歪みはさ
らに増加する。このような文字画像の歪みは認識率に悪
影響を与えるため、できる限り小さくする必要がある。
また、文字線分の輪郭部の特徴を抽出する場合、文字線
分の間に2画素幅以上の空白部が確保されるならば安定
な特徴抽出が可能であるから、細め処理により、文字画
像を歪ませてまで必要以上に空白部を拡大したのでは認
識率を上げるためには逆効果となる虞がある。
【0006】前記特開昭60−147889号公報に開
示された方法は、正規化前の文字線幅を基準として正規
化後の文字線幅を補正し、文字線幅を安定化させること
を意図している。しかし、前述のような細め処理による
文字画像の歪みは避けられない。さらに、入力文字画像
のサイズが正規化後のサイズに比べ極端に大きい、ある
いは小さい場合に対応が難しい。前記特開昭63−28
0390号公報に開示された方法についても同様である
が、さらに、黒画素数と輪郭長を計測して数値計算によ
り文字線幅を求める処理に相当の時間を要する。
【0007】本発明の目的は、文字認識の前処理方法あ
るいは文字認識方法または装置において、以上の如き
来の細め処理の諸問題点を改善することにある。
【0008】
【課題を解決するための手段】請求項1の発明は、文字
画像を縦方向または横方向に走査し、1画素幅の白部に
隣接する2画素幅以上の黒部を検出し、該検出した2画
素幅以上の黒部のうちの白部に接する1画素を白画素に
変換して、1画素幅の白部を拡張することを特徴とす
る。この文字画像について、2画素幅以上の黒部の、1
画素幅白部に隣接する1画素を白画素に変換する処理を
空白部拡張処理と称すことにする
【0009】請求項2の発明は、入力された文字画像に
サイズを正規化する処理を施し、該処理後の正規化文字
画像に対して、空白部拡張処理を施すことを特徴とす
【0010】請求項3の発明は、入力された文字画像に
対しサイズの正規化処理を施し、該処理後の正規化文字
画像に対し線分の細め処理を施す文字認識の前処理方法
において、該正規化文字画像より文字線分との交差数を
検出し、該交差数に基づき、該正規化文字画像に対する
細め処理の方向及び実行するか否かの制御を行なうこと
を特徴とする。
【0011】請求項4の発明は、入力された文字画像に
対しサイズを正規化する処理を施し、該処理後の正規化
文字画像に対し線分を細める細め処理を施す文字認識の
前処理方法において、該正規化文字画像より横方向及び
縦方向への黒画素のヒストグラムを検出し、該ヒストグ
ラムに基づき、該正規化文字画像に対する細め処理の方
向及び実行するか否かの制御を行なうことを特徴とす
る。
【0012】請求項5の発明は、入力された文字画像に
対しサイズを正規化する処理を施し、該処理後の正規化
文字画像に対し線分の細め処理を施す文字認識の前処理
方法において、該処理後の正規化文字画像の黒画素数を
検出し、該黒画素数が一定値以上の場合にのみ該正規化
画像に対し、線分の細め処理を施すことを特徴とする。
【0013】請求項6の発明は、請求項3,4または5
記載の発明による文字認識の前処理方法において、上記
細め処理の代わりに、空白部拡張処理を制御すること
を特徴とする。
【0014】請求項7の発明は、入力された文字画像に
対し線分の細め処理を施し、該細め処理後の文字画像に
対しサイズの正規化処理を施す文字認識の前処理方法に
おいて、該入力文字画像の黒画素数と総画素数の比を検
出し、該比に基づき該細め処理を施す回数を制御するこ
とを特徴とする。
【0015】請求項8の発明による文字認識方法は、入
力された文字画像に対し、請求項1、2、3、4、5、
6または7記載の前処理を施してから文字認識を行なう
ことを特徴とする。
【0016】請求項9の発明の文字認識装置は、文書等
の画像を入力する画像入力手段と、該画像入力手段から
の入力画像より文字画像を切り出す文字切り出し手段
と、該文字切り出し手段により切り出された文字画像に
対し請求項1、2、3、4、5、6または7記載の前処
理を施す前処理手段と、該前処理手段により処理された
文字画像の文字認識を行なう認識手段とを具備すること
を特徴とする。
【0017】
【作用】請求項1の発明によれば、文字線分間に、可能
である限り最低2画素幅の空白部を確保することができ
るため、輪郭追跡等の文字線分の輪郭部分から特徴を抽
出する認識アルゴリズムにおいて、特徴量を安定かつ高
精度に抽出可能となり、認識率を向上できる。また、文
字線分間の2画素幅以上の空白部については、その隣接
画素の白画素への変換は行なわれないため、従来の細め
処理による方法に比べ、処理による文字画像の歪みが少
ない。さらに、本発明の空白部拡張処理は、単純なマス
クを用いた処理として、容易に高速化することができ
る。
【0018】請求項2の発明によれば、請求項1の発明
と同様の利益が得られるが、さらに、文字画像のサイズ
を正規化した後に、空白部拡張処理を行なうため、この
空白部拡張処理に要する時間は入力文字画像のサイズに
よらず一定となり、入力文字画像のサイズが大きい場合
にも前処理を高速化することができる。
【0019】文字線分の間隔のつまり具合は方向によっ
て異なることが多いため、細め処理、あるいは空白部
大処理の有効性も方向により差異がある。また、文字線
分の間隔が十分に大きい文字画像に対しては、そのよう
な処理による効果は小さい。請求項3、4または5の発
明あるいは請求項6の発明によれば、文字線分との交差
数、黒画素のヒストグラム、黒画素数などに基づいて細
め処理や空白部拡張処理を制御することにより、文字画
像の文字線分のつまり具合に適応させて、効果の大きい
方向について細め処理あるいは空白部拡張処理を実行さ
せ、あるいは効果の少ない方向の処理あるいは無用な処
理を排除することができるため、前処理を効率化でき
る。また、細め処理または空白部拡張処理の方向あるい
は抑止の制御のために、従来のように文字線幅を検出す
る複雑な処理を行なう必要がなくなり、これは前処理の
高速化に有利である。また、正規化後に細め処理または
空白部拡張処理を行なうため、入力文字画像のサイズが
大きい場合にも処理量が増加しない。
【0020】細め処理を施してからサイズ正規化を行な
う前処理方法において、細め処理の回数を不足すると潰
れの改善効果が不十分となり、逆に細め処理回数が過大
であると文字画像の歪みが増大するという悪影響があ
る。請求項7の発明によれば、入力文字画像の潰れ具合
に応じて細め処理の回数を適切に制御することによっ
て、細め処理による十分な効果を達成し、かつ余分な処
理による処理時間の増加と悪影響を排除できる。
【0021】請求項8の発明によれば、以上の説明から
明らかなように、効果的かつ効率的な前処理によって、
文字線分の輪郭部の特徴量を安定かつ高精度に抽出し、
高い認識率を達成できる。
【0022】請求項9の発明によれば、以上の説明から
明らかな如く、文字画像の歪みに強く、かつ処理が効率
的かつ高速の文字認識装置を実現できる。
【0023】
【実施例】以下、図面を用い本発明の実施例を説明す
る。
【0024】〔実施例1〕 図1は本実施例に係る文字認識装置のブロック図であ
る。文書画像100(ファイル、スキャナ等から入力さ
れる)に対し、文字切り出し部102は文字切り出しを
行なって、文字画像を1文字ずつ入力する。この入力文
字画像は画像メモリ104内の文字画像バッファ106
に格納される。また文字切り出し部102は、文字画像
のサイズ等の切り出し情報を前処理部108へ渡す。
【0025】前処理部108は文字画像に対して文字認
識の前処理を実行する部分であり、サイズ正規化部11
0と空白部拡張処理部112からなる。サイズ正規化部
110は、文字画像バッファ106より文字画像を読み
込み、公知の縮小あるいは拡大の方法によって、文字画
像を一定のサイズ(正規化サイズ)に整えるサイズ正規
化を行なう。通常、サイズ正規化処理により文字画像は
縮小される。サイズ正規化部110により処理された文
字画像(正規化文字画像)は画像メモリ104内の正規
化画像バッファ114に格納される。空白部拡張処理部
112は、正規化画像バッファ114上の正規化文字画
像に対して空白部拡張処理を施すが、この処理の内容は
後述する。この空白部拡張処理を施された後の正規化画
像バッファ114上の文字画像が文字認識部116に入
力し、文字線分の輪郭の特徴量が抽出され、標準文字パ
ターンの特徴量と比較されることにより認識される。
【0026】空白部拡張処理は、正規化文字画像の縦方
向と横方向の両方あるいは一方について実行される。縦
方向に関しては、上から下へ向かう処理と下から上へ向
かう処理のいずれかによって行なわれる。横方向に関し
ては、左から右へ向かう処理と右から左へ向かう処理の
いずれかによって行なわれる。
【0027】上から下へ向かう空白部拡張処理の場合、
正規化文字画像を上端より下端へスキャンし、図2に示
すマスクパターン120と合致する画素の集合を探索す
る。1画素幅の空白部を挟む横方向文字線分で、少なく
とも下側の文字線分の線幅が2画素以上の部分で、この
マスクパターン120と合致するので、マスクパターン
120のCビットに対応する画素、すなわち下側文字線
分の空白部に隣接する黒画素を白画素に変換する。同様
の処理を正規化文字画像の全体に施すことにより、横方
向文字線分間に、可能である限り最低2画素幅の空白部
を確保することができる。
【0028】図3に示す左側の画像122に対して上か
ら下への空白部拡張処理を施すと、右側の画像124が
得られる。この画像124中のハッチングを施した画素
が黒画素から変換された白画素である。この例からも、
横方向の文字線分間の空白部が最低2画素幅に拡張され
ることが理解されるであろう。
【0029】図4は、上から下への空白部拡張処理のフ
ロー図である。ただし、図5に示すように座標がとられ
る。step2からstep9が、縦方向の1ライン分
について上端(y=start)から下端(y=en
d)へ順次スキャンしながらマスクパターン120との
合致する画素集合を探索し、合致したときに注目する画
素の白画素への変換を行なう処理部分である。step
9で1ラインのスキャンの終了を判定すると、step
10でスキャンラインを一つ右に移動させ、同様の処理
を繰り返す。
【0030】下から上へ向かう空白部拡張処理の場合、
正規化文字画像を下端から上端へ向かってスキャンし、
図6に示すマスクパターン126との合致を探索する。
そして、マスクパターン126と合致した部分で、マス
クパターン126のCビットに対応する黒画素を白画素
へ変換する。この処理によっても、例えば図7に示す左
側の画像128は右側の画像130変換される。画像1
30のハッチングを施された画素が、黒画素から変換さ
れた白画素である。この例から明らかなように、下から
上への空白部拡張処理によっても、横方向線分間の1画
素幅の空白部は、可能である限り2画素幅に拡張され
る。
【0031】左から右への空白部拡張処理の場合、正規
化文字画像を左端から右端へスキャンし、図8に示すマ
スクパターン132との合致を探索し、合致した部分で
マスクパターン132のCビットに対応する黒画素を白
画素へ変換する。右から左への空白部拡張処理の場合、
正規化文字画像を右端から左端へスキャンして図9に示
すマスクパターン134との合致を探索し、合致した部
分でマスクパターン134のCビットに対応した黒画素
を白画素へ変換する。このような横方向の空白部拡張処
理により、縦方向の文字線分の間の1画素幅の空白部
が、可能である限り2画素幅に拡張される。
【0032】このように文字線分間に、可能である限り
最低2画素幅の空白部が確保されるため、文字認識部1
16において文字線輪郭部の特徴量を安定かつ高精度に
抽出することができ、認識率を上げることができる。ま
た、拡張されるのは1画素幅の空白部のみであって、2
画素幅以上の空白部は拡張されないため、文字線分の輪
郭黒画素の白画素への変換を均等に行なう細め処理の場
合に比べ、処理による文字画像の歪みが少なく、これも
認識率の向上につながる。また、空白部拡張処理を正規
化文字画像に対して行なうため、その処理量は文字切り
出しにより入力される文字画像のサイズに拘らず一定で
あり、入力文字画像のサイズが大きい場合でも処理速度
が低下しない。
【0033】〔実施例2〕 図10は本実施例に係る文字認識装置のブロック図であ
る。前記実施例1との構成上の違いは、前処理部108
Aのみである。この前処理部108Aは、文字画像バッ
ファ106に入力された文字画像を一定サイズに正規化
して正規化画像バッファ114に格納するサイズ正規化
部110と、この正規化文字画像に細め処理を施す細め
処理部150、正規化文字画像の文字線分の詰まり具合
に関する特徴量を検出する特徴検出部151、この特徴
量に基づいて細め処理を行なうか否か、及び細め処理の
方向を制御する細め処理制御部152よりなる。
【0034】細め処理部150による細め処理は、基本
的には、画像を上から下もしくは下から上へ、左から右
もしくは右から左へスキャンし、白画素の次に黒画素が
2個以上連続している部分で、当該白画素に隣接する黒
画素を白画素へ変換する処理である。あるいは、画像を
横方向または縦方向に1画素分ずらして論理積をとるこ
とによって、縦方向または横方向の文字線分を細める処
理である。この細め処理を実行するか否か、並びに実行
する方向は細め処理制御部152によって制御される。
【0035】特徴検出部151は、図11のフロー図に
示すように、正規化文字画像に対し、横方向及び縦方向
の文字線との交差数LRn,UDnを求める(step
20)。具体的には、図12に示すように、正規化画像
バッファ114上の正規化文字画像に対し、その外接枠
の3箇所で、縦方向、横方向のそれぞれについてスキャ
ンし、白画素から黒画素への変化回数、すなわち文字線
との交差数をカウントする。そして、縦方向について求
めた交差数の最大値を、当該方向を代表する交差数UD
nとし、また横方向について求めた交差数の最大値を当
該方向を代表する交差数LRnとする。図12の例で
は、UDn=6、LRn=4となる。
【0036】このようにして求められる交差数は対応方
向についての文字線分の詰まり具合のパラメータである
ので、細め処理制御部152は、各方向の交差数から各
方向の細め処理の必要度を判定できる。本実施例では次
のような判定を行なう。
【0037】まず“UDn>TH1 かつ LRn>T
H1 ”の条件を判定し(step21)、この条件が
成立する場合は縦方向及び横方向の細め処理を実行させ
るように細め処理部150を制御する(step2
2)。TH1は判定のための閾値である。
【0038】step21で条件不成立の場合、“UD
n<TH2 かつ LRn<TH2”の条件を判定し
(step23)、条件成立のときは、両方向とも文字
線分が空いているため細め処理が不要であるとして文字
線分細め処理を実行させない。なお、TH2はTH1よ
り小さい閾値である。
【0039】step23で条件不成立の場合、”UD
n≧LRn”の条件判定を行ない(step23)、条
件成立のときは縦方向のみの細め処理を細め処理部15
0に指示し(step25)、条件不成立のときは横方
向のみの細め処理を細め処理部150に指示する(st
ep26)。
【0040】このように、縦方向及び横方向について細
め処理の必要性もしくは有効性を判断し、細め処理を制
御するため、無駄な細め処理を排除して処理時間を短縮
できるとともに、無駄な細め処理による文字画像の歪み
を回避することができる。また、各方向の細め処理の必
要性を判断するために用いる文字線との交差数を求める
処理は、文字線幅等を求める処理に比べ簡単で処理量が
少なく、この処理による前処理時間の増加を避けられ
る。
【0041】〔実施例3〕 本実施例に係る文字認識装置は図10に示す構成である
が、特徴検出部151と細め処理制御部152の処理内
容は図13に示す如きであって前記実施例2の場合と異
なる。
【0042】すなわち、特徴検出部151は、サイズ正
規化部110によるサイズ正規化処理と同時に、正規化
文字画像に対し横方向と縦方向について黒画素のヒスト
グラムPY,PXを検出する(step30)。ただ
し、図14に示すように、正規化文字画像160を上下
左右に2分割し、横方向については左半分の領域に対す
るヒストグラムPY1と右半分領域に対するヒストグラ
ムPY2を求める。縦方向についても同様に、上半分の
領域に対するヒストグラムPX1と下半分の利用域に対
するヒストグラムPX2を求める。
【0043】次に、ヒストグラムグラムPY1,PY
2,PX1,PX2の、ある閾値を越えるピークの個数
をカウントし、PY1,PY2のピーク数の大きいほう
の値を、横方向について代表するピーク数PYnとし、
同様にPX1,PX2のピーク数の大きいほうの値を縦
方向について代表するピーク数PXnとする(step
31)。図14に示した例では、PYn=6、PXn=
4となる。PXnが大きいほど横方向文字線分が混み合
っていることを意味し、またPXnが大きいほど縦方向
文字線分が混み合っていることを意味している。
【0044】細め処理制御部152は、“PXn>TH
3 かつ PYn>TH3”の条件を判定し(step
32)、条件成立のときは縦方向及び横方向の両方につ
いて細め処理部150に細め処理を実行させる(ste
p33)。ここでTH3は文字線分の詰まり具合の判定
閾値である。
【0045】step32で条件不成立の場合、“PX
n<TH4 かつ PYn<YH4”の条件を判定し
(step34)、条件成立のときは細め処理部150
に細め処理を実行させない。TH4は文字線分の空き具
合を判定する閾値である。
【0046】step34で条件不成立の場合、“PX
n>PYn”の条件判定を行ない(step35)、条
件成立のときは横方向のみの細め処理を細め処理部15
0に指示し(step36)、条件不成立のときは縦方
向のみの細め処理を指示する(step37)。
【0047】なお、漢字等では、文字線分の密度が場所
によってばらつく場合が多いが、潰れは文字線分の密度
の大きい部分で発生しやすいため、密度の高い部分での
潰れを防止するように、細め処理を制御すべきである。
本実施例では、図14に示したように画像を分割してヒ
ストグラムを測定し、各分割領域のピーク数の大きいほ
うの値を各方向の細め処理の要否の判断基準とすること
により、文字線分の密度のばらつきが大きい文字画像に
対しても、適切に細め処理を制御できる。
【0048】本実施例においても、前記実施例2と同様
の効果が得られることは明らかである。
【0049】〔実施例4〕 本実施例に係る文字認識装置は図10に示す構成である
が、特徴検出部151と細め処理制御部152に関して
前処理部108Aの処理内容が前記実施例2の場合と異
なる。図15は本実施例における前処理のフロー図であ
る。
【0050】すなわち、サイズ正規化部110による正
規化処理(step40)と同時に、特徴検出部151
は正規化文字画像の黒画素数をカウントする(step
41)。この黒画素数が大きいほど、文字線が全体とし
て混み合っており潰れが発生しやすい。
【0051】正規化及び黒画素数カウントが終了する
と、細め処理制御部152は、カウントされた黒画素数
と、正規化文字画像の総画素数(正規化サイズで決まる
固定値である)との比を計算し、この比と予め定められ
た閾値との比較判定を行なう(step42)。なお、
黒画素数を直接用いて同様の比較判定を行なうことも可
能であるが、比を用いるほうが比較判定の処理が容易で
ある。そして、この比が閾値を越える場合にのみ、細め
処理部150で縦方向及び横方向の細め処理を実行させ
る(step43)。
【0052】本実施例によれば、細め処理の実行を方向
別に制御できないことを除けば前記実施例2または前記
実施例3と同様の効果を得られ、また細め処理のための
特徴検出の処理はさらに簡単である。
【0053】〔実施例5〕 図16は本実施例に係る文字認識装置のブロック図であ
る。前記実施例1との構成上の違いは、前処理部108
Bのみである。この前処理部108Bは、前記実施例1
におけるものと同一のサイズ正規化部110、空白部拡
張処理部112に加えて、空白部拡張処理の方向あるい
は実行の有無を制御する空白部拡張処理制御部171
と、この空白部拡張処理のための特徴を正規化文字画像
より検出する特徴検出部172とを有する。
【0054】特徴検出部172は、前記実施例2におい
て特徴抽出部151(図10)により検出されたものと
同一の交差数を正規化文字画像より検出する。空白部拡
張処理制御部171は、この交差数に基づき、前記実施
例2における細め処理制御部152と同一の判定アルゴ
リズム(図12)に従って、空白部拡張処理部112に
よる空白部拡張処理の実行、非実行の制御並びに処理方
向を制御する。
【0055】本実施例によれば、空白部拡張処理による
効果に加え前記実施例2と同様の効果を得ることができ
る。
【0056】〔実施例6〕 本実施例に係る文字認識装置は図16に示す構成である
が、特徴検出部172と空白部拡張処理制御部171に
関して前処理部108Bの処理内容が前記実施例5の場
合と異なる。
【0057】すなわち、特徴検出部172は、前記実施
例3の特徴検出部151と同様に正規化画像の横方向と
縦方向について黒画素のヒストグラムのピーク数PY
n,PXn(図14参照)を検出する。そして空白部拡
張処理制御部171は、前記実施例3の細め処理制御部
152と同様のアルゴリズムにより(図13参照)、各
方向のピーク数に基づき空白部拡張処理の実行、非実
行、処理方向の制御を行なう。
【0058】本実施例によれば、前記実施例5と同様の
効果を達成できることは明らかである。
【0059】〔実施例7〕 本実施例は、特徴検出部172と空白部拡張処理制御部
171に関して前処理部108Bの処理内容が前記実施
例5の場合と異なる。すなわち、特徴検出部172は、
前記実施例4の特徴抽出部151と同様に正規化文字画
像の黒画素数をカウントする。そして空白部拡張処理制
御部171は、前記実施例4の細め処理制御部152と
同様に(図15参照)、黒画素数と総画素数の比がある
閾値を越えた場合にのみ、縦方向及び横方向に対する空
白部拡張処理を実行させ、当該比が閾値以下の場合には
空白部拡張処理を実行させない。
【0060】本実施例によれば、空白部拡張処理の効果
に加え前記実施例4と同様の効果を得ることができる。
【0061】〔実施例8〕 図17は本実施例に係る文字認識装置のブロック図であ
る。前記各実施例との構成上の違いは、前処理部108
Cのみである。また、この前処理部108Cにおいて
は、図18のフロー図に明らかなように細め処理とサイ
ズ正規化の順序が逆になっている。
【0062】すなわち、前処理部108Cにおいて、文
字画像バッファ106上の入力文字画像の黒画素数を特
徴検出部181でカウントする(step50)。この
処理が終了すると、細め処理制御部182で、特徴検出
部181により検出された黒画素数と入力文字画像の総
画素数(文字切り出し部102より与えられるサイズ情
報より計算される)との比を求め、この比に応じて細め
処理の回数を設定する(step51)。すなわち、当
該比が大きいほど文字線が混み合っているので、細め処
理回数を増加させる。
【0063】次に細め処理部150により、この設定さ
れた回数分の細め処理を、文字画像バッファ106上の
画像に対して、縦方向及び横方向につき実行する(st
ep52)。なお、2回以上の細め処理を行なう場合、
縦方向であれば、上から下への処理と下から上への処理
を交互に行ない、横方向であれば左から右への処理と右
から左上の処理を交互に行なうようにすると、細め処理
による文字画像の歪みの増加を抑制できる効果がある。
【0064】最後にサイズ正規化部110において、細
め処理が施された文字画像を文字画像バッファ106よ
り読み込み正規化処理を施し、一定のサイズに正規化し
た文字画像を正規化画像バッファ114に格納する(s
tep53)。
【0065】本実施例においては、入力文字画像に対し
て細め処理を施すが、黒画素数と総画素数の比に基づい
て、細め処理回数を必要最小限の回数に制御することが
できるため、入力文字画像のサイズが大きい場合にも細
め処理の時間の増加を抑えることができるとともに、入
力文字画像のサイズの大小にかかわらず文字認識部11
6に対し輪郭部の特徴量を安定に抽出可能な文字画像を
提供できる。
【0066】
【発明の効果】請求項1の発明によれば、空白部拡張処
理によって、文字画像中の文字線分間に、可能である限
り最低2画素幅の空白部を確保することができ、また、
文字線分間の2画素幅以上の空白部については拡張され
ないため、細め処理による方法に比べ、処理による文字
画像の歪みを減らすことができ、よって輪郭追跡等の文
字線分の輪郭部分から特徴を抽出する認識アルゴリズム
において、特徴量を安定かつ高精度に抽出し高い認識率
を達成できるようになる。また、空白部拡張処理は単純
なマスクを用いた高速に実行できるため、前処理の高速
化も容易である。
【0067】請求項2の発明によれば、入力された文字
画像のサイズを正規化した後に、空白部拡張処理を施す
ため、請求項1の発明と同様の利益が得られるほかに、
入力文字画像のサイズの大小によらず空白部拡張処理の
時間は一定となり、入力文字画像のサイズが大きい場合
にも前処理時間が極端に増加することがない。
【0068】請求項3の発明によれば、入力文字画像に
サイズの正規化処理を施してから線分の細め処理を施す
が、正規化文字画像より検出した文字線分との交差数に
基づき、文字線分のつまり具合に適応させて、効果の大
きい方向について細め処理を実行させ、あるいは効果の
少ない方向の処理あるいは無用な処理を排除することが
できるため、前処理を効率化できる。また、このような
適応的制御のために、従来のように文字線幅を検出する
複雑な処理を行なう必要がなく、これも前処理の高速化
に有利である。また、正規化後に細め処理を行なうた
め、入力文字画像のサイズが大きい場合にも処理量が増
加しない。
【0069】請求項4の発明によれば、正規化文字画像
の横方向及び縦方向への黒画素のヒストグラムに基づ
き、請求項3の発明と同様に、字線分のつまり具合に適
応させて細め処理を制御することができ、また、このヒ
ストグラムの検出は短時間で可能であるとともに、正規
化文字画像に対して細め処理を行なうため、効率的な前
処理が可能となる。また、入力文字画像のサイズが大き
い場合にも処理量が増加しない。
【0070】請求項5の発明によれば、正規化文字画像
の黒画素数に基づき、正規化文字画像に対する細め処理
を必要な場合にのみ実行させることができるため、請求
項3または4記載の発明と同様に効率的な前処理が可能
である。
【0071】請求項6の発明によれば、正規化文字画像
に対し空白部拡張処理を用い、この空白部拡張処理の方
向、あるいは実行の有無を請求項3、4または5記載の
発明と同様に文字線分の詰まり具合に適応させて制御す
るため、請求項3、4または5の発明と同様の効果に加
えて請求項1の発明による効果を得ることができる。
【0072】請求項7の発明によれば、入力文字画像に
細め処理を施してからサイズの正規化処理を施すが、入
力文字画像の黒画素数と総画素数の比に基づき、入力文
字画像の潰れ具合に応じて細め処理の回数を適切に制御
することにより、細め処理の十分な効果を達成し、かつ
余分な細め処理による悪影響や処理時間の増加を回避で
きる。
【0073】請求項8の発明によれば、入力文字画像
を、文字線分の輪郭部の特徴量を安定かつ高精度に抽出
可能な文字画像に処理してから文字認識を行なうため、
文字の輪郭部の特徴を抽出する認識アルゴリズムの場合
に高い認識率を達成できるとともに、前処理を効率的か
つ高速に行なうことができるため、処理全体の高速化が
容易である。
【0074】請求項9の発明によれば、以上の説明から
明らかな如く、文字画像の歪みに強く、かつ処理が効率
的かつ高速の文字認識装置を実現できる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置の構成の一例を示す
ブロック図である。
【図2】上から下へ向かっての空白部拡張処理に用いら
れるマスクパターンを示す図である。
【図3】上から下へ向かっての空白部拡張処理を施す前
の画像と施した後の画像を示す図である。
【図4】上から下へ向かっての空白部拡張処理のフロー
図である。
【図5】図4に関連した座標の説明図である。
【図6】下から上へ向かっての空白部拡張処理に用いら
れるマスクパターンを示す図である。
【図7】下から上へ向かっての空白部拡張処理を施す前
の画像と施した後の画像を示す図である。
【図8】左から右へ向かっての空白部拡張処理に用いら
れるマスクパターンを示す図である。
【図9】右から左へ向かっての空白部拡張処理に用いら
れるマスクパターンを示す図である。
【図10】本発明に係る文字認識装置の構成の他の例を
示すブロック図である。
【図11】文字線との交差数に基づく細め処理または空
白部拡張処理の制御を説明するフロー図である。
【図12】交差数の検出を説明する図である。
【図13】黒画素のヒストグラムに基づく細め処理また
は空白部拡張処理の制御を説明するフロー図である。
【図14】黒画素のヒストグラムとそのピーク数の検出
を説明する図である。
【図15】黒画素数に応じて細め処理または空白部拡張
処理を制御する前処理のフロー図である。
【図16】本発明に係る文字認識装置の構成の別の例を
示すブロック図である。
【図17】本発明に係る文字認識装置の構成のもう一つ
の例を示すブロック図である。
【図18】図17に示す構成における前処理のフロー図
である。
【符号の説明】 100 文書画像 102 文字切り出し部 104 画像メモリ 106 文字画像バッファ 108,108a,108B,108C 前処理部 110 サイズ正規化部 112 空白部拡張処理部 114 正規化画像バッファ 116 文字認識部 150 細め処理部 151 特徴検出部 152 細め処理制御部 171 空白部拡張処理制御部 172 特徴検出部 181 特徴検出部 182 細め処理制御部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/42 G06K 9/44 G06T 5/30 JICSTファイル(JOIS)

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字画像に対して、該文字画像を縦方向
    または横方向に走査し、1画素幅の白部に隣接する2画
    素幅以上の黒部を検出し、該検出した2画素幅以上の黒
    部のうちの白部に接する1画素を白画素に変換して、1
    画素幅の白部を拡張する、空白部拡張処理を施すことを
    特徴とする文字認識の前処理方法。
  2. 【請求項2】 入力された文字画像に対しサイズの正規
    化処理を施し、該正規化処理後の正規化文字画像に対し
    て、空白部拡張処理を施すことを特徴とする請求項1記
    載の文字認識の前処理方法。
  3. 【請求項3】 入力された文字画像に対しサイズの正規
    化処理を施し、該正規化処理後の正規化文字画像に対し
    線分の細め処理を施す文字認識の前処理方法において、
    該正規化文字画像より文字線分との交差数を検出し、該
    交差数が一定値以上の場合に該正規化画像に対し線分の
    細め処理を施すことを特徴とする文字認識の前処理方
    法。
  4. 【請求項4】 入力された文字画像に対しサイズの正規
    化処理を施し、該正規化処理後の正規化文字画像に対し
    線分の細め処理を施す文字認識の前処理方法において、
    該正規化文字画像より横方向及び縦方向への黒画素のヒ
    ストグラムを検出し、該ヒストグラムのピーク個数が一
    定値以上の場合に該正規化画像に対し線分の細め処理を
    施すことを特徴とする文字認識の前処理方法。
  5. 【請求項5】 入力された文字画像に対しサイズの正規
    化処理を施し、該正規化処理後の正規化文字画像に対し
    線分の細め処理を施す文字認識の前処理方法において、
    該正規化処理後の正規化文字画像の黒画素数を検出し、
    該黒画素数が一定値以上の場合に該正規化画像に対し線
    分の細め処理を施すことを特徴とする文字認識の前処理
    方法。
  6. 【請求項6】 請求項3,4または5記載の文字認識の
    前処理方法において、細め処理に代え、請求項1記載の
    空白部拡張処理を用いることを特徴とする文字認識の前
    処理方法。
  7. 【請求項7】 入力された文字画像に対し線分の細め処
    理を施し、該細め処理後の文字画像に対しサイズの正規
    化処理を施す文字認識の前処理方法において、該入力文
    字画像の黒画素数と総画素数の比を検出し、該比に基づ
    き該細め処理を施す回数を制御することを特徴とする文
    字認識の前処理方法。
  8. 【請求項8】 入力された文字画像に対し、請求項1、
    2、3、4、5、6または7記載の前処理を施してから
    文字認識を行なうことを特徴とする文字認識方法。
  9. 【請求項9】 文書等の画像を入力する画像入力手段
    と、該画像入力手段からの入力画像より文字画像を切り
    出す文字切り出し手段と、該文字切り出し手段により切
    り出された文字画像に対し請求項1、2、3、4、5、
    6または7記載の前処理を施す前処理手段と、該前処理
    手段により処理された文字画像の文字認識を行なう認識
    手段とを具備する文字認識装置。
JP03155474A 1991-05-31 1991-05-31 文字認識の前処理方法、文字認識方法及び文字認識装置 Expired - Fee Related JP3093330B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03155474A JP3093330B2 (ja) 1991-05-31 1991-05-31 文字認識の前処理方法、文字認識方法及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03155474A JP3093330B2 (ja) 1991-05-31 1991-05-31 文字認識の前処理方法、文字認識方法及び文字認識装置

Publications (2)

Publication Number Publication Date
JPH04354084A JPH04354084A (ja) 1992-12-08
JP3093330B2 true JP3093330B2 (ja) 2000-10-03

Family

ID=15606843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03155474A Expired - Fee Related JP3093330B2 (ja) 1991-05-31 1991-05-31 文字認識の前処理方法、文字認識方法及び文字認識装置

Country Status (1)

Country Link
JP (1) JP3093330B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015154844A (ja) * 2014-02-20 2015-08-27 有限会社タツミ工機 杖の先端構造

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015154844A (ja) * 2014-02-20 2015-08-27 有限会社タツミ工機 杖の先端構造

Also Published As

Publication number Publication date
JPH04354084A (ja) 1992-12-08

Similar Documents

Publication Publication Date Title
EP1146478B1 (en) A method for extracting titles from digital images
US7054485B2 (en) Image processing method, apparatus and system
US7062099B2 (en) Image processing method and apparatus using self-adaptive binarization
JP2940936B2 (ja) 表領域識別方法
JP2008210387A (ja) 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム
JP3093330B2 (ja) 文字認識の前処理方法、文字認識方法及び文字認識装置
NL1000934C2 (nl) Automatische typering van rasterbeelden onder gebruikmaking van dichtheidssegmentering.
US20060269132A1 (en) Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window
JP3150762B2 (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
KR940020246A (ko) 문서인식장치의 영역분할 방법
JP3462960B2 (ja) 画像処理方法
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP3585143B2 (ja) 文字列抽出方法および装置
JP7277879B2 (ja) ナンバプレート認識プログラム及びナンバプレート認識装置
Thaker et al. Preprocessing and Segregating Offline Gujarati Handwritten Datasheet for Character Recognition
KR950011065B1 (ko) 문자 인식방법
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP3277977B2 (ja) 文字認識方法
JPH04291479A (ja) 罫線認識方法及び表処理方法
JP3923104B2 (ja) 表処理方法および表処理装置
JP3030814B2 (ja) ノイズ成分除去方法及びノイズ成分除去プログラムを記録した記録媒体
JP2670074B2 (ja) 車両番号認識装置
JPH09167228A (ja) 画像変換方法及び装置、並びに、それらを利用した画像整形方法及び装置、並びに、それらを利用したシステム
JPH02166583A (ja) 文字認識装置
JPH04156691A (ja) 画像領域抽出方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees