JP2840485B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JP2840485B2
JP2840485B2 JP3178228A JP17822891A JP2840485B2 JP 2840485 B2 JP2840485 B2 JP 2840485B2 JP 3178228 A JP3178228 A JP 3178228A JP 17822891 A JP17822891 A JP 17822891A JP 2840485 B2 JP2840485 B2 JP 2840485B2
Authority
JP
Japan
Prior art keywords
image
normalized
size
character
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3178228A
Other languages
English (en)
Other versions
JPH0546810A (ja
Inventor
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3178228A priority Critical patent/JP2840485B2/ja
Priority to EP91307004A priority patent/EP0471472B1/en
Priority to DE69129284T priority patent/DE69129284T2/de
Publication of JPH0546810A publication Critical patent/JPH0546810A/ja
Priority to US08/317,841 priority patent/US5715336A/en
Application granted granted Critical
Publication of JP2840485B2 publication Critical patent/JP2840485B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像処理方法及び装置、
特に入力した画像情報に対応して大きさを正規化するこ
とに特徴のある画像処理方法及び装置に関するものであ
る。
【0002】
【従来の技術】図14は文字認識装置の概略構成を示す
ブロック図である。11はCCD等の画像読み取り装置
からの画像を入力する画像入力部、12は入力された画
像から文字領域を分離する文字領域判別部、13は文字
領域内の文字を判別出来る大きさに分割して切り出す文
字切り出し部、14は切り出された文字パターンの特徴
を抽出する特徴抽出部。ここで、特徴を抽出する文字パ
ターンは、一定の大きさに正規化されたものを用いる。
15は特徴抽出部14の特徴抽出と対応して予め文字と
特徴とを関連づけて記憶する辞書部、16は特徴抽出部
14からの特徴と辞書部15からの特徴とを比較して、
例えばその距離等から文字を判別して候補を選び出すマ
ッチング部、17は判別文字を文字コードで出力する文
字コード出力部である。
【0003】従来の文字認識装置における特徴抽出部1
4は図15のように構成されている。Aは入力端であ
り、文字切り出し部13より文字パターンと大きさの情
報とが入力される。31は正規化部であり、図4に示す
ように各文字画像はN×Nの大きさに正規化される。3
2はスムージング部であり、図5に示すように正規化画
像の各画素に3×3のフィルタをかけ、正規化によるひ
ずみを小さくする。33は特徴ベクトルカウント部であ
り、図6に示すようにN×Nの正規化画像を4×4のブ
ロックに分割し、各ブロックの2×2のマスクにより方
向指数1〜4のヒストグラムをとる。Bは出力端であ
り、カウント部33で得られた方向指数を特徴ベクトル
としてマッチング部16に出力する。制御部34は各段
の入出力制御を行う。
【0004】
【発明が解決しようとしている課題】しかしながら、上
記従来例では、正規化部31において文字パターンの大
小に関係なく一定の大きさN×Nに正規化されてしまう
ため、変倍率が大きい場合に特徴ベクトルが大きくひず
んでしまう。具体的に説明すると、図3(a)に示すよ
うな3×3の画素があるとする。この原画像の方向指数
は、方向指数1が0,方向指数2が2,方向指数3が
0,方向指数4が2となる。これを図3(b)のように
12×12に正規化すると、方向指数1が18,方向指
数2が2,方向指数3が18,方向指数4が2となり、
原画像の特徴を表わさなくなる。これにスムージング処
理を加えた場合が図3(c)であり、方向指数1が6,
方向指数2が8,方向指数3が6,方向指数4が8とな
り改善はされるが、さらに変倍率が高くなるとひずみが
大きすぎ、しだいにスムージング等では補正出来なくな
る。
【0005】逆に、原画像が図3(b)であり変倍率が
1の場合は、スムージングが特徴ベクトルのひずみを大
きくしてしまう。つまり、図3(a)は小さいひし形、
図3(b)は十字形という全く異なる画像によって得ら
れる特徴ベクトルが同じパターンになってしまう。ま
た、縮小の場合にもひずみが生じてしまう。
【0006】すなわち、拡大するほどななめ方向成分が
消えて縦、横成分が増え、逆に縮小するほど縦、横成分
が消えてななめ成分が増える。これは、いかなるスムー
ジングを行なっても補正しきれない。
【0007】本発明は、前記従来の欠点を除去し、正規
化やスムージング等の処理による特徴ベクトルの劣化を
なくし、高い認識率を有する文字認識装置を提供する。
【0008】
【課題を解決する為の手段】上記課題を解決する為に、
本発明は入力した画像情報から切り出した文字画像のサ
イズに応じて、予め定められている複数の正規化サイズ
から適切な正規化サイズを選択し、前記文字画像を前記
選択した正規化サイズの画像に正規化し、前記正規化さ
れた文字画像から文字の特徴データを抽出し、前記選択
された正規化サイズに対して予め定められている係数で
前記抽出した特徴データを補正し、前記補正後の特徴デ
ータを用いて前記文字画像を認識する画像処理方法及び
装置を提供する。
【0009】上記課題を解決する為に、本発明は、好ま
しくは入力した文字画像のサイズが、予め定められてい
る複数の正規化サイズの一つに一致する場合には、当該
入力した文字画像から特徴の抽出を行う。上記課題を解
決する為に、本発明は、好ましくは特徴データの補正に
用いる係数は、選択された正規化サイズと、予め定めら
れている基準正規化サイズとの比によって定まる値とす
る。上記課題を解決する為に、本発明は、好ましくは画
像情報をスキャナにより入力する。上記課題を解決する
為に、本発明は、好ましくは文字認識した結果を表示器
に表示する。
【0010】
【実施例】図1は本実施例の基本構成を示すブロック図
である。100は後述する図8、図9等に示すフローチ
ャートの演算、判断、制御を行う処理装置(CPU)。
101は文字、記号等の入力や位置を指示する為のカー
ソル、誤認識した時の修正の指示等を行う為のキーボー
ド(K.B.)。102はポインティングデバイス
(P.D.)。103は文字を認識する際に用いる辞書
や、後述する図等に示すフローチャートのプログラムを
格納するリード・オンリー・メモリ(ROM)。104
はスキャナ108により読みとられたデータを記憶する
メモリ。105はスキャナ108により読みとられたデ
ータから候補となる単語等をみつけ、各々の相違度を計
算する識別計算部。106は処理途中及び結果を表示す
る例えばCRT。107はスキャナ108のインターフ
ェイス(SCAN I/F)。108は画像情報を読み
とるスキャナである。
【0011】図2は本実施例の特徴抽出部の構成を示す
ブロック図である。Aは従来例同様の文字画像および文
字切り情報入力端、1は入力端Aからの文字切り情報を
受けて分類し、サイズ情報を発生する正規化サイズ分類
部、2は制御部5からの制御信号により正規化サイズを
変えて入力端Aからの文字画像を正規化する文字画像正
規化部、3は文字画像正規化部2で得られた正規化画像
に対してブロック化を行い、ブロックごとの方向指数を
カウントする方向指数カウント部、4は方向指数カウン
ト部3で得られた方向指数を画像正規化サイズに応じて
変倍し、特徴ベクトルを出力するベクトル正規化部、B
は得られたベクトルを次段のマッチング部に出力する特
徴ベクトル出力端である。5は図示しないCPU、RO
M、RAMから成り全体の制御を行う制御部である。
【0012】まず、入力端Aより、前出の図3の(a)
および(b)の画像がそれぞれ入力されたとする。正規
化サイズIとして3、正規化サイズIIとして12を持
っていたとすると、正規化サイズ分類部1では、図3
(a)の画像はサイズI、図3(b)の画像はサイズI
Iと分類し、サイズ情報を後述の制御部5へ送る。文字
画像正規化部2では制御部5よりの制御信号と入力端よ
りの文字画像および文字切り情報とを受け、サイズを変
えて画像の正規化を行ない、正規化された文字パターン
を方向指数カウント部3に出力する。本例の場合、各画
像サイズに等しい正規化サイズがあるため、図3
(a)、(b)の画像がそのまま出力される。
【0013】方向指数カウント部3は正規化文字パター
ンを受けて方向指数をカウントする。ここで、説明の簡
略化のためブロック分割しないとすると、図3(a)の
画像の方向指数は、方向指数1が0,方向指数2は2,
方向指数3は0,方向指数4は2となり、図3(b)の
画像の方向指数はそれぞれ18,2,18,2となる。
次に、ベクトル正規化部4において、基準値に対する比
で方向指数カウント部3で求められた方向指数を正規化
する。各正規化サイズに対する方向指数(2×2のマス
ク)の個数は、(サイズ+1)2となる。これをブロッ
ク分割した場合は各ブロック当り{(サイズ+1)/ブ
ロック分割数}2個の方向指数となる。ここで、4×4
のときはブロック分割数には4がはいる。通常は(正規
化サイズ+1)をブロック分割数のn倍(nは自然数)
に選ぶとブロック分割しやすくなる。よって、 正規化サイズ=n×(ブロック分割数)−1 (n=1,2,3,…)となる。正規化サイズをこれを
基準に複数選べば、ブロック分解しやすいためハード化
もしやすい。
【0014】説明を簡略化するため、ブロック分割数を
1×1とすると、サイズIでは16,サイズIIでは1
69となる。ここで、仮に基準値を169(サイズI
I)とすると、サイズIの係数は169/16,サイズ
IIの係数は169/169となる。
【0015】得られた係数を、それぞれの方向指数にか
けることによって、図3(a)の画像の特徴ベクトル
は、それぞれ0,10.6,0,10.6となり、図3
(b)の画像では18,2,18,2となる。このよう
に、本実施例では原画像に近い比率の特徴ベクトルを得
ることが出来る。得られた特徴ベクトルを出力端Bより
マッチング部16に出力する。制御部5はサイズのコン
トロールと各段の入出力制御を行なう。
【0016】次に図7の本実施例の構成図と図8に示す
フローチャートを用いて本実施例の処理について説明す
る。なお、このフローチャートに示す処理は、ROM1
03のプログラムに従い、CPU100の制御のもと処
理される。
【0017】図7においてAはユーザからの指示を伝え
るインターフェース部であり、71は処理する文書の画
像を入力する手段であるところのスキャナであり読み込
みの解像度を変える能力を持つ。72は文字の切り出し
部でありAからの指示を受け71に対して画像入力と読
み込みの解像度をコマンドで与え71より画像を受け取
り文字の切り出し処理をする。73は特徴抽出部であり
72で切り出された文字画像を正規化し特徴データを特
徴ベクトルとして抽出する。74は識別処理部であり、
73で得られた特徴ベクルトと予め記憶された各文字の
特徴データとマッチングがなされ最も距離値が近い文字
から候補文字として、文字パターンを文字コードに変換
する。Bは74の出力部であり、得られた文字コードを
出力する。
【0018】図8のフローチャートにおいて、まずAよ
りユーザの処理開始の指示と処理する文書内の文字の大
きさが文字切り出し部72に伝えられる(S1)。72
の文字切り出し部はその文字の大きさと特徴抽出部73
の正規化サイズから最適な読み込み解像度を算出し(S
2)、解像度と読み込みの命令を71へ与える(S
3)。画像入力部71は指示された解像度で文書の読み
込みを行い(S4)、72へ読み込んだ画像を返す。7
2はその画像に対して文字の切り出し処理をして(S
5)切り出した文字画像を73へ伝える。以下、73で
は特徴抽出処理(S6)、74では識別処理(S7)が
なされて結果が文字コードとしてBより出力される。
【0019】次に、図8のフローチャートに示す処理の
応用として、オペレータから文字の大きさの指定がなく
ても処理できる方法を説明する。この方法は図9のフロ
ーチャートで示すが、まず文字のサイズをある大きさP
1と仮定してP1の大きさの文字に適した解像度で入力
し、その入力した画像情報から本当の文字の大きさP2
を導出し、それに適した処理をしようとするものであ
る。
【0020】図9のフローチャートに従って順に説明す
ると、まずAより処理開始の指示が文字切り出し部2に
伝えられ、文字切り出し部2は最も多く使われる文字の
大きさP1(例えば12ポイント)に適した解像度での
読み込みの命令を画像入力部71に伝える。画像入力部
71は指示された解像度で画像を入力し(S10)、画
像情報を文字切り出し部72に送り、文字の切り出しを
行なう(S11)。切り出された文字の大きさP2を導
出し(S12)、P1=P2か判断する(S13)。P
1=P2ならばそのまま入力した画像情報の特徴抽出と
識別処理(S19)を行なう。S13でP1≠P2と判
断されたらP1とP2の値から最適な解像度とする為の
変倍率を算出し(S14)、変倍率を画像入力部1に指
示して画像を再度入力する(S16)。そして最適な解
像度で再入力された画像から文字を切り出し(S1
7)、特徴抽出(S18)、識別処理(S19)をして
結果が文字コードとしてBより出力される。
【0021】(実施例2)図10、図11は先に説明し
た実施例にぼかし処理部6が加わった例である。
【0022】ぼかし処理とは、例えば4×4ブロックの
特徴ベクトルを求めるために、一度方向指数カウント部
3において7×7ブロックで方向指数をカウントし、そ
の7×7をガウスフィルタ(尚、図13(a)にガウス
フィルタの例を示す)をかけることによって、4×4ブ
ロックの特徴ベクトルを求める処理である。
【0023】(実施例3)図12は先に説明した実施例
のベクトル正規化部4をベクトル正規化とぼかし処理と
を同時に実行するベクトル正規化ぼかし処理部7に置き
代えた例である。
【0024】ぼかし処理とは、図13(a)に示すよう
な係数をもつフィルタ処理である。そこで、本実施例で
は、図13(b)〜(d)のようにこのフィルタ係数に
各ベクトル正規化係数をかけたテーブルを各正規化サイ
ズごとに持つことで、実施例2のようにベクトル正規化
とぼかしとの処理を1回の処理ですますことが出来る。
【0025】尚、上記実施例は、図16の(a)〜
(c)に示すように、ホストコンピュータとスキャナと
キーボード等の入力部とが全部独立していても、組込ま
れていても実施可能であることは言うまでもない。
【0026】本発明は、複数の嬉々から構成されるシス
テムに適用しても良いし、1つの機器から成る装置に適
用しても良いし、システム或いは装置にプログラムを供
給することによって達成される場合にも適用できること
は言うまでもない。本発明により、正規化やスムージン
グ等の処理による特徴ベクトルの劣化をなくし、ひいて
は高い認識率を得ることができる。すなわち、文字画像
の大きさによらず、原文字画像に近い特徴ベクトルが得
られる為、認識率が向上する。更に、正規化サイズをブ
ロック分けの倍数で選定すると正規化サイズがほぼ固定
な為、ハード化しやすく高速化しやすい。
【0027】
【発明の効果】以上説明したように、本発明によれば、
処理対象とする文字画像のサイズと正規化サイズとの違
いの大きさによる正規化時の文字画像の歪みを減少させ
ることができ、更に正規化した文字画像から抽出した特
徴データの補正を予め定められた固有の係数で行えるの
で、ハード化する場合に構成を簡略化することができ
る。
【0028】以上説明したように、本発明によれば、処
理対象とする文字画像のサイズに適したサイズの画像に
正規化するので、正規化時に大きく変倍することによる
文字画像の歪みを減少させることができ、ひいてはその
画像から抽出する特徴データを原文字画像に近いデータ
とすることができる。
【0029】以上説明したように、本発明によれば、正
規化された文字画像から抽出した特徴データの補正を、
その正規化サイズに対して予め定められている係数で行
うので、適切な補正の係数の判断が容易かつ確実とな
り、更には補正のタイプを絞り込めてハード化する場合
に複雑な構成をとらなくても良くなる。
【図面の簡単な説明】
【図1】本実施例の画像処理装置の構成図。
【図2】本実施例の構成を示す第1の図。
【図3】正規化とスムージングによる従来の課題を説明
する図。
【図4】正規化処理を説明する図。
【図5】スムージング処理を説明する図。
【図6】方向指数を説明する図。
【図7】本実施例の構成を示す第2の図。
【図8】本実施例の処理を示す第1のフローチャート。
【図9】本実施例の処理を示す第2のフローチャート。
【図10】本実施例の構成を示す第3の図。
【図11】本実施例の構成を示す第4の図。
【図12】本実施例の構成を示す第5の図。
【図13】フィルタ係数を説明する図。
【図14】従来の画像処理装置の構成図。
【図15】従来の特徴抽出部の構成図。
【図16】本発明を実施するシステム例示図。

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力した画像情報から切り出した文字画
    像のサイズに応じて、予め定められている複数の正規化
    サイズから適切な正規化サイズを選択し、 前記文字画像を前記選択した正規化サイズの画像に正規
    化し、 前記正規化された文字画像から文字の特徴データを抽出
    し、 前記選択された正規化サイズに対して予め定められてい
    る係数で前記抽出した特徴データを補正し、 前記補正後の特徴データを用いて前記文字画像を認識す
    ることを特徴とする画像処理方法。
  2. 【請求項2】 前記入力した文字画像のサイズが、前記
    予め定められている複数の正規化サイズの一つに一致す
    る場合には、当該入力した文字画像から前記特徴の抽出
    を行うことを特徴とする請求項1に記載の画像処理方
    法。
  3. 【請求項3】 前記係数は、前記選択された正規化サイ
    ズと、予め定められている基準正規化サイズとの比によ
    って定まる値とすることを特徴とする請求項1に記載の
    画像処理方法。
  4. 【請求項4】 前記画像情報をスキャナにより入力する
    ことを特徴とする請求項1に記載の画像処理方法。
  5. 【請求項5】 前記文字認識した結果を表示器に表示す
    ることを特徴とする請求項1に記載の画像処理方法。
  6. 【請求項6】 入力した画像情報から切り出した文字画
    像のサイズに応じて、予め定められている複数の正規化
    サイズから適切な正規化サイズを選択する正規化サイズ
    選択手段と、 前記文字画像を、前記正規化サイズ選択手段により選択
    した正規化サイズの画像に正規化する正規化手段と、 前記正規化手段により正規化された文字画像から文字の
    特徴データを抽出する特徴抽出手段と、 前記正規化サイズ選択手段により選択された正規化サイ
    ズに対して予め定められている係数で前記抽出した特徴
    データを補正する特徴データ補正手段と、 前記特徴データ補正手段により補正された特徴データを
    用いて前記文字画像を認識する認識手段とを有すること
    を特徴とする画像処理装置。
  7. 【請求項7】 前記入力した文字画像のサイズが、前記
    予め定められている複数の正規化サイズの一つに一致す
    る場合には、前記特徴抽出手段は当該入力した文字画像
    から前記特徴の抽出を行うことを特徴とする請求項6に
    記載の画像処理装置。
  8. 【請求項8】 前記補正手段による補正に用いる係数
    は、前記選択された正規化サイズと、予め定められてい
    る基準正規化サイズとの比によって定まる値とすること
    を特徴とする請求項6に記載の画像処理装置。
  9. 【請求項9】 前記画像情報を入力するスキャナを備え
    ることを特徴とする請求項6に記載の画像処理装置。
  10. 【請求項10】 前記文字認識した結果を表示する表示
    器を備えることを特徴とする請求項6に記載の画像処理
    装置。
JP3178228A 1990-08-03 1991-07-18 画像処理方法及び装置 Expired - Fee Related JP2840485B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP3178228A JP2840485B2 (ja) 1991-07-18 1991-07-18 画像処理方法及び装置
EP91307004A EP0471472B1 (en) 1990-08-03 1991-07-31 Image processing method and apparatus therefor
DE69129284T DE69129284T2 (de) 1990-08-03 1991-07-31 Gerät und Verfahren zur Bildverarbeitung
US08/317,841 US5715336A (en) 1990-08-03 1994-10-04 Character recognition method and apparatus that re-inputs image data at a second resolution derived from the character size and a selected normalization size

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3178228A JP2840485B2 (ja) 1991-07-18 1991-07-18 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH0546810A JPH0546810A (ja) 1993-02-26
JP2840485B2 true JP2840485B2 (ja) 1998-12-24

Family

ID=16044835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3178228A Expired - Fee Related JP2840485B2 (ja) 1990-08-03 1991-07-18 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP2840485B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3307075B2 (ja) * 1994-04-06 2002-07-24 キヤノン株式会社 撮影装置

Also Published As

Publication number Publication date
JPH0546810A (ja) 1993-02-26

Similar Documents

Publication Publication Date Title
US5557689A (en) Optical word recognition by examination of word shape
US7054485B2 (en) Image processing method, apparatus and system
EP0543593B1 (en) Method for determining boundaries of words in text
JP3259993B2 (ja) 語形測定方法及び画像信号処理方法
US20010014182A1 (en) Image processing apparatus
US6055332A (en) Handwritten character and symbol processing apparatus and medium which stores control program of handwritten character and symbol processing apparatus
US5715336A (en) Character recognition method and apparatus that re-inputs image data at a second resolution derived from the character size and a selected normalization size
JP2840485B2 (ja) 画像処理方法及び装置
JP3462960B2 (ja) 画像処理方法
JP3548234B2 (ja) 文字認識方法及び装置
JPH0490083A (ja) 文字認識装置
JP2675303B2 (ja) 文字認識方法
JP2803709B2 (ja) 文字認識装置及び文字認識方法
JPS63150783A (ja) 文字認識装置
KR950011065B1 (ko) 문자 인식방법
JPH07182509A (ja) 図形認識装置
JPS63150785A (ja) 文字認識装置
JPS63150786A (ja) 文字認識装置
JPH02166583A (ja) 文字認識装置
JPH0535856A (ja) 指紋特徴抽出装置
JP3277977B2 (ja) 文字認識方法
JPH0737086A (ja) 静止画像抽出装置
JPS63150784A (ja) 文字認識装置
JPH08320912A (ja) 画像切り出し方法
JPH0490084A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees