JP2840485B2

JP2840485B2 - 画像処理方法及び装置

Info

Publication number: JP2840485B2
Application number: JP3178228A
Authority: JP
Inventors: 哲臣田中
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1991-07-18
Filing date: 1991-07-18
Publication date: 1998-12-24
Anticipated expiration: 2013-12-24
Also published as: JPH0546810A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は画像処理方法及び装置、
特に入力した画像情報に対応して大きさを正規化するこ
とに特徴のある画像処理方法及び装置に関するものであ
る。

【０００２】

【従来の技術】図１４は文字認識装置の概略構成を示す
ブロック図である。１１はＣＣＤ等の画像読み取り装置
からの画像を入力する画像入力部、１２は入力された画
像から文字領域を分離する文字領域判別部、１３は文字
領域内の文字を判別出来る大きさに分割して切り出す文
字切り出し部、１４は切り出された文字パターンの特徴
を抽出する特徴抽出部。ここで、特徴を抽出する文字パ
ターンは、一定の大きさに正規化されたものを用いる。
１５は特徴抽出部１４の特徴抽出と対応して予め文字と
特徴とを関連づけて記憶する辞書部、１６は特徴抽出部
１４からの特徴と辞書部１５からの特徴とを比較して、
例えばその距離等から文字を判別して候補を選び出すマ
ッチング部、１７は判別文字を文字コードで出力する文
字コード出力部である。

【０００３】従来の文字認識装置における特徴抽出部１
４は図１５のように構成されている。Ａは入力端であ
り、文字切り出し部１３より文字パターンと大きさの情
報とが入力される。３１は正規化部であり、図４に示す
ように各文字画像はＮ×Ｎの大きさに正規化される。３
２はスムージング部であり、図５に示すように正規化画
像の各画素に３×３のフィルタをかけ、正規化によるひ
ずみを小さくする。３３は特徴ベクトルカウント部であ
り、図６に示すようにＮ×Ｎの正規化画像を４×４のブ
ロックに分割し、各ブロックの２×２のマスクにより方
向指数１〜４のヒストグラムをとる。Ｂは出力端であ
り、カウント部３３で得られた方向指数を特徴ベクトル
としてマッチング部１６に出力する。制御部３４は各段
の入出力制御を行う。

【０００４】

【発明が解決しようとしている課題】しかしながら、上
記従来例では、正規化部３１において文字パターンの大
小に関係なく一定の大きさＮ×Ｎに正規化されてしまう
ため、変倍率が大きい場合に特徴ベクトルが大きくひず
んでしまう。具体的に説明すると、図３（ａ）に示すよ
うな３×３の画素があるとする。この原画像の方向指数
は、方向指数１が０，方向指数２が２，方向指数３が
０，方向指数４が２となる。これを図３（ｂ）のように
１２×１２に正規化すると、方向指数１が１８，方向指
数２が２，方向指数３が１８，方向指数４が２となり、
原画像の特徴を表わさなくなる。これにスムージング処
理を加えた場合が図３（ｃ）であり、方向指数１が６，
方向指数２が８，方向指数３が６，方向指数４が８とな
り改善はされるが、さらに変倍率が高くなるとひずみが
大きすぎ、しだいにスムージング等では補正出来なくな
る。

【０００５】逆に、原画像が図３（ｂ）であり変倍率が
１の場合は、スムージングが特徴ベクトルのひずみを大
きくしてしまう。つまり、図３（ａ）は小さいひし形、
図３（ｂ）は十字形という全く異なる画像によって得ら
れる特徴ベクトルが同じパターンになってしまう。ま
た、縮小の場合にもひずみが生じてしまう。

【０００６】すなわち、拡大するほどななめ方向成分が
消えて縦、横成分が増え、逆に縮小するほど縦、横成分
が消えてななめ成分が増える。これは、いかなるスムー
ジングを行なっても補正しきれない。

【０００７】本発明は、前記従来の欠点を除去し、正規
化やスムージング等の処理による特徴ベクトルの劣化を
なくし、高い認識率を有する文字認識装置を提供する。

【０００８】

【課題を解決する為の手段】上記課題を解決する為に、
本発明は入力した画像情報から切り出した文字画像のサ
イズに応じて、予め定められている複数の正規化サイズ
から適切な正規化サイズを選択し、前記文字画像を前記
選択した正規化サイズの画像に正規化し、前記正規化さ
れた文字画像から文字の特徴データを抽出し、前記選択
された正規化サイズに対して予め定められている係数で
前記抽出した特徴データを補正し、前記補正後の特徴デ
ータを用いて前記文字画像を認識する画像処理方法及び
装置を提供する。

【０００９】上記課題を解決する為に、本発明は、好ま
しくは入力した文字画像のサイズが、予め定められてい
る複数の正規化サイズの一つに一致する場合には、当該
入力した文字画像から特徴の抽出を行う。上記課題を解
決する為に、本発明は、好ましくは特徴データの補正に
用いる係数は、選択された正規化サイズと、予め定めら
れている基準正規化サイズとの比によって定まる値とす
る。上記課題を解決する為に、本発明は、好ましくは画
像情報をスキャナにより入力する。上記課題を解決する
為に、本発明は、好ましくは文字認識した結果を表示器
に表示する。

【００１０】

【実施例】図１は本実施例の基本構成を示すブロック図
である。１００は後述する図８、図９等に示すフローチ
ャートの演算、判断、制御を行う処理装置（ＣＰＵ）。
１０１は文字、記号等の入力や位置を指示する為のカー
ソル、誤認識した時の修正の指示等を行う為のキーボー
ド（Ｋ．Ｂ．）。１０２はポインティングデバイス
（Ｐ．Ｄ．）。１０３は文字を認識する際に用いる辞書
や、後述する図等に示すフローチャートのプログラムを
格納するリード・オンリー・メモリ（ＲＯＭ）。１０４
はスキャナ１０８により読みとられたデータを記憶する
メモリ。１０５はスキャナ１０８により読みとられたデ
ータから候補となる単語等をみつけ、各々の相違度を計
算する識別計算部。１０６は処理途中及び結果を表示す
る例えばＣＲＴ。１０７はスキャナ１０８のインターフ
ェイス（ＳＣＡＮＩ／Ｆ）。１０８は画像情報を読み
とるスキャナである。

【００１１】図２は本実施例の特徴抽出部の構成を示す
ブロック図である。Ａは従来例同様の文字画像および文
字切り情報入力端、１は入力端Ａからの文字切り情報を
受けて分類し、サイズ情報を発生する正規化サイズ分類
部、２は制御部５からの制御信号により正規化サイズを
変えて入力端Ａからの文字画像を正規化する文字画像正
規化部、３は文字画像正規化部２で得られた正規化画像
に対してブロック化を行い、ブロックごとの方向指数を
カウントする方向指数カウント部、４は方向指数カウン
ト部３で得られた方向指数を画像正規化サイズに応じて
変倍し、特徴ベクトルを出力するベクトル正規化部、Ｂ
は得られたベクトルを次段のマッチング部に出力する特
徴ベクトル出力端である。５は図示しないＣＰＵ、ＲＯ
Ｍ、ＲＡＭから成り全体の制御を行う制御部である。

【００１２】まず、入力端Ａより、前出の図３の（ａ）
および（ｂ）の画像がそれぞれ入力されたとする。正規
化サイズＩとして３、正規化サイズＩＩとして１２を持
っていたとすると、正規化サイズ分類部１では、図３
（ａ）の画像はサイズＩ、図３（ｂ）の画像はサイズＩ
Ｉと分類し、サイズ情報を後述の制御部５へ送る。文字
画像正規化部２では制御部５よりの制御信号と入力端よ
りの文字画像および文字切り情報とを受け、サイズを変
えて画像の正規化を行ない、正規化された文字パターン
を方向指数カウント部３に出力する。本例の場合、各画
像サイズに等しい正規化サイズがあるため、図３
（ａ）、（ｂ）の画像がそのまま出力される。

【００１３】方向指数カウント部３は正規化文字パター
ンを受けて方向指数をカウントする。ここで、説明の簡
略化のためブロック分割しないとすると、図３（ａ）の
画像の方向指数は、方向指数１が０，方向指数２は２，
方向指数３は０，方向指数４は２となり、図３（ｂ）の
画像の方向指数はそれぞれ１８，２，１８，２となる。
次に、ベクトル正規化部４において、基準値に対する比
で方向指数カウント部３で求められた方向指数を正規化
する。各正規化サイズに対する方向指数（２×２のマス
ク）の個数は、（サイズ＋１）²となる。これをブロッ
ク分割した場合は各ブロック当り｛（サイズ＋１）／ブ
ロック分割数｝²個の方向指数となる。ここで、４×４
のときはブロック分割数には４がはいる。通常は（正規
化サイズ＋１）をブロック分割数のｎ倍（ｎは自然数）
に選ぶとブロック分割しやすくなる。よって、正規化サイズ＝ｎ×（ブロック分割数）−１（ｎ＝１，２，３，…）となる。正規化サイズをこれを
基準に複数選べば、ブロック分解しやすいためハード化
もしやすい。

【００１４】説明を簡略化するため、ブロック分割数を
１×１とすると、サイズＩでは１６，サイズＩＩでは１
６９となる。ここで、仮に基準値を１６９（サイズＩ
Ｉ）とすると、サイズＩの係数は１６９／１６，サイズ
ＩＩの係数は１６９／１６９となる。

【００１５】得られた係数を、それぞれの方向指数にか
けることによって、図３（ａ）の画像の特徴ベクトル
は、それぞれ０，１０．６，０，１０．６となり、図３
（ｂ）の画像では１８，２，１８，２となる。このよう
に、本実施例では原画像に近い比率の特徴ベクトルを得
ることが出来る。得られた特徴ベクトルを出力端Ｂより
マッチング部１６に出力する。制御部５はサイズのコン
トロールと各段の入出力制御を行なう。

【００１６】次に図７の本実施例の構成図と図８に示す
フローチャートを用いて本実施例の処理について説明す
る。なお、このフローチャートに示す処理は、ＲＯＭ１
０３のプログラムに従い、ＣＰＵ１００の制御のもと処
理される。

【００１７】図７においてＡはユーザからの指示を伝え
るインターフェース部であり、７１は処理する文書の画
像を入力する手段であるところのスキャナであり読み込
みの解像度を変える能力を持つ。７２は文字の切り出し
部でありＡからの指示を受け７１に対して画像入力と読
み込みの解像度をコマンドで与え７１より画像を受け取
り文字の切り出し処理をする。７３は特徴抽出部であり
７２で切り出された文字画像を正規化し特徴データを特
徴ベクトルとして抽出する。７４は識別処理部であり、
７３で得られた特徴ベクルトと予め記憶された各文字の
特徴データとマッチングがなされ最も距離値が近い文字
から候補文字として、文字パターンを文字コードに変換
する。Ｂは７４の出力部であり、得られた文字コードを
出力する。

【００１８】図８のフローチャートにおいて、まずＡよ
りユーザの処理開始の指示と処理する文書内の文字の大
きさが文字切り出し部７２に伝えられる（Ｓ１）。７２
の文字切り出し部はその文字の大きさと特徴抽出部７３
の正規化サイズから最適な読み込み解像度を算出し（Ｓ
２）、解像度と読み込みの命令を７１へ与える（Ｓ
３）。画像入力部７１は指示された解像度で文書の読み
込みを行い（Ｓ４）、７２へ読み込んだ画像を返す。７
２はその画像に対して文字の切り出し処理をして（Ｓ
５）切り出した文字画像を７３へ伝える。以下、７３で
は特徴抽出処理（Ｓ６）、７４では識別処理（Ｓ７）が
なされて結果が文字コードとしてＢより出力される。

【００１９】次に、図８のフローチャートに示す処理の
応用として、オペレータから文字の大きさの指定がなく
ても処理できる方法を説明する。この方法は図９のフロ
ーチャートで示すが、まず文字のサイズをある大きさＰ
１と仮定してＰ１の大きさの文字に適した解像度で入力
し、その入力した画像情報から本当の文字の大きさＰ２
を導出し、それに適した処理をしようとするものであ
る。

【００２０】図９のフローチャートに従って順に説明す
ると、まずＡより処理開始の指示が文字切り出し部２に
伝えられ、文字切り出し部２は最も多く使われる文字の
大きさＰ１（例えば１２ポイント）に適した解像度での
読み込みの命令を画像入力部７１に伝える。画像入力部
７１は指示された解像度で画像を入力し（Ｓ１０）、画
像情報を文字切り出し部７２に送り、文字の切り出しを
行なう（Ｓ１１）。切り出された文字の大きさＰ２を導
出し（Ｓ１２）、Ｐ１＝Ｐ２か判断する（Ｓ１３）。Ｐ
１＝Ｐ２ならばそのまま入力した画像情報の特徴抽出と
識別処理（Ｓ１９）を行なう。Ｓ１３でＰ１≠Ｐ２と判
断されたらＰ１とＰ２の値から最適な解像度とする為の
変倍率を算出し（Ｓ１４）、変倍率を画像入力部１に指
示して画像を再度入力する（Ｓ１６）。そして最適な解
像度で再入力された画像から文字を切り出し（Ｓ１
７）、特徴抽出（Ｓ１８）、識別処理（Ｓ１９）をして
結果が文字コードとしてＢより出力される。

【００２１】（実施例２）図１０、図１１は先に説明し
た実施例にぼかし処理部６が加わった例である。

【００２２】ぼかし処理とは、例えば４×４ブロックの
特徴ベクトルを求めるために、一度方向指数カウント部
３において７×７ブロックで方向指数をカウントし、そ
の７×７をガウスフィルタ（尚、図１３（ａ）にガウス
フィルタの例を示す）をかけることによって、４×４ブ
ロックの特徴ベクトルを求める処理である。

【００２３】（実施例３）図１２は先に説明した実施例
のベクトル正規化部４をベクトル正規化とぼかし処理と
を同時に実行するベクトル正規化ぼかし処理部７に置き
代えた例である。

【００２４】ぼかし処理とは、図１３（ａ）に示すよう
な係数をもつフィルタ処理である。そこで、本実施例で
は、図１３（ｂ）〜（ｄ）のようにこのフィルタ係数に
各ベクトル正規化係数をかけたテーブルを各正規化サイ
ズごとに持つことで、実施例２のようにベクトル正規化
とぼかしとの処理を１回の処理ですますことが出来る。

【００２５】尚、上記実施例は、図１６の（ａ）〜
（ｃ）に示すように、ホストコンピュータとスキャナと
キーボード等の入力部とが全部独立していても、組込ま
れていても実施可能であることは言うまでもない。

【００２６】本発明は、複数の嬉々から構成されるシス
テムに適用しても良いし、１つの機器から成る装置に適
用しても良いし、システム或いは装置にプログラムを供
給することによって達成される場合にも適用できること
は言うまでもない。本発明により、正規化やスムージン
グ等の処理による特徴ベクトルの劣化をなくし、ひいて
は高い認識率を得ることができる。すなわち、文字画像
の大きさによらず、原文字画像に近い特徴ベクトルが得
られる為、認識率が向上する。更に、正規化サイズをブ
ロック分けの倍数で選定すると正規化サイズがほぼ固定
な為、ハード化しやすく高速化しやすい。

【００２７】

【発明の効果】以上説明したように、本発明によれば、
処理対象とする文字画像のサイズと正規化サイズとの違
いの大きさによる正規化時の文字画像の歪みを減少させ
ることができ、更に正規化した文字画像から抽出した特
徴データの補正を予め定められた固有の係数で行えるの
で、ハード化する場合に構成を簡略化することができ
る。

【００２８】以上説明したように、本発明によれば、処
理対象とする文字画像のサイズに適したサイズの画像に
正規化するので、正規化時に大きく変倍することによる
文字画像の歪みを減少させることができ、ひいてはその
画像から抽出する特徴データを原文字画像に近いデータ
とすることができる。

【００２９】以上説明したように、本発明によれば、正
規化された文字画像から抽出した特徴データの補正を、
その正規化サイズに対して予め定められている係数で行
うので、適切な補正の係数の判断が容易かつ確実とな
り、更には補正のタイプを絞り込めてハード化する場合
に複雑な構成をとらなくても良くなる。

【図面の簡単な説明】

【図１】本実施例の画像処理装置の構成図。

【図２】本実施例の構成を示す第１の図。

【図３】正規化とスムージングによる従来の課題を説明
する図。

【図４】正規化処理を説明する図。

【図５】スムージング処理を説明する図。

【図６】方向指数を説明する図。

【図７】本実施例の構成を示す第２の図。

【図８】本実施例の処理を示す第１のフローチャート。

【図９】本実施例の処理を示す第２のフローチャート。

【図１０】本実施例の構成を示す第３の図。

【図１１】本実施例の構成を示す第４の図。

【図１２】本実施例の構成を示す第５の図。

【図１３】フィルタ係数を説明する図。

【図１４】従来の画像処理装置の構成図。

【図１５】従来の特徴抽出部の構成図。

【図１６】本発明を実施するシステム例示図。

Claims

(57)【特許請求の範囲】

【請求項１】入力した画像情報から切り出した文字画
像のサイズに応じて、予め定められている複数の正規化
サイズから適切な正規化サイズを選択し、前記文字画像を前記選択した正規化サイズの画像に正規
化し、前記正規化された文字画像から文字の特徴データを抽出
し、前記選択された正規化サイズに対して予め定められてい
る係数で前記抽出した特徴データを補正し、前記補正後の特徴データを用いて前記文字画像を認識す
ることを特徴とする画像処理方法。
【請求項２】前記入力した文字画像のサイズが、前記
予め定められている複数の正規化サイズの一つに一致す
る場合には、当該入力した文字画像から前記特徴の抽出
を行うことを特徴とする請求項１に記載の画像処理方
法。
【請求項３】前記係数は、前記選択された正規化サイ
ズと、予め定められている基準正規化サイズとの比によ
って定まる値とすることを特徴とする請求項１に記載の
画像処理方法。
【請求項４】前記画像情報をスキャナにより入力する
ことを特徴とする請求項１に記載の画像処理方法。
【請求項５】前記文字認識した結果を表示器に表示す
ることを特徴とする請求項１に記載の画像処理方法。
【請求項６】入力した画像情報から切り出した文字画
像のサイズに応じて、予め定められている複数の正規化
サイズから適切な正規化サイズを選択する正規化サイズ
選択手段と、前記文字画像を、前記正規化サイズ選択手段により選択
した正規化サイズの画像に正規化する正規化手段と、前記正規化手段により正規化された文字画像から文字の
特徴データを抽出する特徴抽出手段と、前記正規化サイズ選択手段により選択された正規化サイ
ズに対して予め定められている係数で前記抽出した特徴
データを補正する特徴データ補正手段と、前記特徴データ補正手段により補正された特徴データを
用いて前記文字画像を認識する認識手段とを有すること
を特徴とする画像処理装置。
【請求項７】前記入力した文字画像のサイズが、前記
予め定められている複数の正規化サイズの一つに一致す
る場合には、前記特徴抽出手段は当該入力した文字画像
から前記特徴の抽出を行うことを特徴とする請求項６に
記載の画像処理装置。
【請求項８】前記補正手段による補正に用いる係数
は、前記選択された正規化サイズと、予め定められてい
る基準正規化サイズとの比によって定まる値とすること
を特徴とする請求項６に記載の画像処理装置。
【請求項９】前記画像情報を入力するスキャナを備え
ることを特徴とする請求項６に記載の画像処理装置。
【請求項１０】前記文字認識した結果を表示する表示
器を備えることを特徴とする請求項６に記載の画像処理
装置。