JP4458429B2 - カラー画像認識方法および装置 - Google Patents

カラー画像認識方法および装置 Download PDF

Info

Publication number
JP4458429B2
JP4458429B2 JP2006230955A JP2006230955A JP4458429B2 JP 4458429 B2 JP4458429 B2 JP 4458429B2 JP 2006230955 A JP2006230955 A JP 2006230955A JP 2006230955 A JP2006230955 A JP 2006230955A JP 4458429 B2 JP4458429 B2 JP 4458429B2
Authority
JP
Japan
Prior art keywords
color image
vector quantization
image signal
input color
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006230955A
Other languages
English (en)
Other versions
JP2006344242A (ja
Inventor
道義 立川
利夫 宮沢
明彦 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2006230955A priority Critical patent/JP4458429B2/ja
Publication of JP2006344242A publication Critical patent/JP2006344242A/ja
Application granted granted Critical
Publication of JP4458429B2 publication Critical patent/JP4458429B2/ja
Expired - Lifetime legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、カラー画像および白黒画像から特定画像を抽出して認識するカラー画像認識方法および装置に関する。
カラー画像を処理する製品、例えばカラー複写機、カラープリンタ、カラースキャナ、カラー画像通信機器などは、今後ますます増加するものと予想される。カラー画像は、ハードウェアの進歩、特にメモリの低価格化および大容量化、通信コストの低下などにより、以前に比べて利用しやすくなってきたものの、カラー画像データはそのデータ量が膨大(例えば、A3サイズで96Mバイト)であるため、2値画像と同じような処理ができないのが現状である。
特に、画像認識(特定画像の認識、OCRなど)などの複雑な処理を要する技術においては、処理量が膨大になり、カラー画像における画像認識は実現がより困難である。
特開平4−180348号公報 特開昭55−162177号公報
従来、特定のカラー画像を識別する方法として、例えば、画像を構成する各絵柄部分は固有の色空間上での分布を持っているので、各絵柄部分に現われる固有の色空間上での分布を特定し、この特定された特徴と同一の特徴を有する画像部分を抽出する方法がある(特許文献1を参照)。しかし、この方法では、色空間中での拡がりが同じ画像については、その内部での色の分布が異なっていても識別することができず、つまり色空間の拡がりが同じであれば、拡がりの中での色の分布が異なる画像をも特定の画像として誤検出する可能性がある。
また一方、認識処理に必要な対象物の抽出方法として種々の方法が提案されているが、例えば画像から黒連結の矩形を抽出し、予め設定された閾値と比較することにより、文字の矩形と線図形の矩形とを判定する画像抽出方法がある(特許文献2を参照)。この方法は、抽出された線図形をさらに詳細に水平罫線、垂直罫線、表、囲み枠などのように識別するものではなく、また回転した対象物の抽出に対応できない。
本発明の第1の目的は、カラー画像の認識処理を行う際に、画像認識に必要な情報量を確保しつつ、データ量を圧縮して対象物を高精度に認識するカラー画像認識方法および装置を提供することにある。
本発明の第2の目的は、カラー画像の認識処理を行う際に、画像認識に必要な情報量を確保しつつ、データ量をテーブル変換によって変換圧縮することにより、効率的にデータ圧縮を行い、対象物を高精度かつ高速に認識するカラー画像認識方法および装置を提供することにある。
本発明の第3の目的は、認識対象原稿のカラー画像が裏写りした場合の影響を抑制して、認識対象とされる画像情報のみにベクトル量子化を施すことにより、認識率と処理速度を向上させたカラー画像認識方法および装置を提供することにある。
本発明の第4の目的は、コードブックとの距離が所定の閾値より大きい場合に、ベクトル量子化値を割り当てないことにより、認識精度と処理速度を向上させたカラー画像認識方法および装置を提供することにある。
本発明の第5の目的は、入力画像中から対象物の画像領域を高精度に抽出するカラー画像認識方法および装置を提供することにある。
本発明の第6の目的は、抽出された対象物に対して、カラー画像の認識処理を行う際に、画像認識に必要な情報量を確保しつつ、データ量を圧縮して対象物を高精度に認識するカラー画像認識方法および装置を提供することにある。
本発明は、入力カラー画像信号を複数の領域に分割する分割工程と、前記分割された領域内の入力カラー画像信号から特徴量を抽出する特徴量抽出工程と、前記抽出された特徴量を、予め作成されたコードブックと比較することによりベクトル量子化し、前記入力カラー画像信号のベクトル量子化値を生成するベクトル量子化工程とからなるベクトル量子化処理工程と、前記入力カラー画像信号から黒連結成分の外接矩形を抽出する矩形抽出工程と、前記抽出された外接矩形の内、高さ、幅が所定の範囲内にある矩形を所定形状の対象物として判定する判定工程とからなる対象物抽出工程と、前記対象物抽出工程が前記所定形状の対象物を抽出したとき、前記生成された入力カラー画像信号のベクトル量子化値を参照して、前記所定形状の対象物の範囲に相当するベクトル量子化値のヒストグラムを作成するヒストグラム作成工程と、前記作成された所定形状の対象物のヒストグラムと辞書とを照合することにより、前記入力カラー画像信号中に、前記辞書に登録された対象物が存在するか否かを判定処理するマッチング工程とを備え、前記ベクトル量子化処理工程と前記対象物抽出工程を並列に実行することを最も主要な特徴とする。
請求項2記載の発明では、前記入力画像信号中から所定形状の対象物を抽出する処理は、前記入力された2値画像信号から黒連結成分の外接矩形を抽出し、該抽出された外接矩形と黒連結成分との接点情報に基づいて、前記対象物を抽出する処理であることを特徴としている。
請求項3記載の発明では、前記抽出される対象物は、所定の辺長を有する矩形であることを特徴としている。
請求項4記載の発明では、前記抽出される対象物は、スキャンラインに対して傾いている対象物を含むことを特徴としている。
請求項5記載の発明では、前記入力画像信号がカラー画像信号であるとき、前記カラー画像信号から明度を求め、該明度と複数の閾値とを比較することにより複数の2値画像を生成し、該複数の2値画像からそれぞれ前記外接矩形を抽出することを特徴としている。
請求項6記載の発明では、前記抽出される第1の外接矩形と、第2の外接矩形との包含関係を調べ、一方の外接矩形が他方の外接矩形を含むとき、一方の外接矩形と黒連結成分との接点情報に基づいて、前記対象物を抽出することを特徴としている。
請求項7記載の発明では、入力カラー画像信号から特定画像を認識する第1の処理手段と、前記入力カラー画像信号から所定形状の対象物を抽出する第2の処理手段と、前記対象物の抽出結果に応じて、前記対象物について認識処理する手段とを備え、前記第1の処理手段と第2の処理手段を並列に実行することを特徴としている。
以上、説明したように、本発明によれば、以下のような効果が得られる。
(1)対象物から特徴を抽出後にベクトル量子化しているので、認識対象物の情報量が失われることなく、処理データ量を圧縮することができると共に辞書をコンパクトに構成することができ、さらに特定画像を精度よく認識することができる。
(2)特徴量を圧縮しているので、より一層処理データ量を圧縮することができる。
(3)入力画像データから抽出された特徴量を圧縮処理後にベクトル量子化しているので、カラー画像認識に必要な情報量を保持しつつ処理データ量が削減され、処理速度が向上するとともに高精度に画像認識処理を行うことができる。
(4)マッチングを行う際に、得られたヒストグラム情報と設定された閾値とを比較する閾値処理により、マッチング処理の変更を行っているので、画像認識に必要な処理時間が短縮され、効率的なカラー画像認識処理を行うことができる。
(5)辞書とのマッチングを行う際に、算出された距離と設定された閾値とを比較しているので、認識精度をより一層向上させることができる。
(6)矩形対象物の抽出処理を、外接矩形と黒連結成分との接点情報に基づいて行っているので、画像中の対象物が存在する部分を高精度に抽出することができる。
(7)画像中の対象物が回転していても高精度に抽出することができる。
(8)背景が白地または黒地の場合でも対象物を正確に抽出することができ、また白地における外接矩形と黒地における外接矩形の包含関係を調べているので、重複した抽出処理を行う必要がない。
(9)対象物の抽出処理とカラー画像のベクトル量子化処理を並列的に行い、抽出された対象物について認識処理しているので、カラー画像中の特定画像を高速かつ高精度に認識することができる。また、カラー画像をベクトル量子化しているので、認識対象物の情報量が失われることなく、処理データ量を圧縮することができる。
以下、発明の実施の形態について図面により詳細に説明する。
実施例1:
図1は、本発明の実施例1の構成を示す。図1において、入力されたカラー画像信号(RGB)1から得られたカラー画像を小領域(メッシュ)に分割するメッシュ分割部2と、小領域内のカラー画像データから特徴量を抽出する特徴量抽出部3と、抽出した特徴量を格納する特徴量メモリ4と、抽出した特徴量を予め作成してあるコードブック5と比較することによりベクトル量子化を行うベクトル量子化部6と、ベクトル量子化値を保持するベクトル量子化値メモリ7と、該メモリと識別対象物の辞書9とを照合して認識処理を行う認識部8と、メモリ管理やマッチング処理の距離計算などの全体の画像認識処理における各段階の制御を行う制御部10とから構成されている。
入力カラー画像信号RGBを予め定められた小領域(メッシュ)に分割する。分割された小領域(メッシュ)毎に、入力カラー画像信号RGBの特徴量を抽出する。本実施例では、その特徴量として色度ヒストグラムを用いる。すなわち、特徴量抽出部3では、入力カラー画像信号RGBを以下に示す色度Pr、Pgに変換し、予め定められた小領域(メッシュ)毎に色度Pr、Pgの値のヒストグラムを作成し、特徴量メモリ4に格納する。このように、色度変換されたカラー画像は、色合い情報だけを持つので、照明むらが除去されて対象物を抽出する場合などに有効となる。
図2は、原画像を小領域(メッシュ)に分割した図を示し、この例では、小領域は64画素×64画素のサイズである。
Pr=256*R/(R+G+B)
Pg=256*G/(R+G+B)
ここで、R、G、Bは入力された各8ビットのカラー画像信号である。なお、Pr、Pgを256倍しているのはPr、Pgも8ビットで表現するためである。
また、上記した例では、r,gの色度ヒストグラムを特徴量としたが、本発明はこれに限定されるものではなく、bの色度ヒストグラムを用いてもよいし、色度の他に、カラー画像信号(RGB)、色相、彩度などの特徴量を用いることができる。
図3は、小領域内の色度ヒストグラムを、コードブックを参照してベクトル量子化する例を示す図である。
図3において、11は、特徴量メモリ4に格納された小領域内の色度ヒストグラム(Hi)を示す。i=0〜255の次元におけるH(i)はPrを表し、i=256〜511の次元におけるH(i)はPgを表す。また、12は、予め作成されたコードブック(C0、C1、C2...)の内容を示す。
ここで、コードブックは、識別対象物あるいは一般の原稿を多数入力し、同様の条件で色度ヒストグラムのデータを大量に作成し、これらをクラスタリングすることで代表的な色度ヒストグラム(コードブック)を求めて作成する。
ベクトル量子化部6では、この色度ヒストグラム(Hi)11と、コードブックの内容12とをマッチングして距離(DCj)を算出し、その距離(一般には、ユークリッド距離の2乗として定義された2乗ひずみ測度)が最小であるコードブックのコード(Cj)を、その小領域のベクトル量子化値(VQ値)としてベクトル量子化値メモリ7に保持する。
図4は、入力画像のベクトル量子化値(VQ値)の例を示す。各桝目は、前述した一つの小領域に対応し、各桝目内の数値はベクトル量子化値(VQ値)である。そして、これらのベクトル量子化値(VQ値)についてヒストグラムを作成する。
図5は、画像認識時における入力画像のベクトル量子化値のヒストグラムと辞書のベクトル量子化値のヒストグラムとのマッチングを説明する図である。図において13は、作成されたベクトル量子化値のヒストグラム例を示す。また、14は、識別対象物の辞書内容を示し、入力画像と同様に、ベクトル量子化値ヒストグラムで表現されて予め作成されている。図の場合は、例えば、識別対象物A,B,C..(コードブック数が64)のベクトル量子化値ヒストグラムが格納されている。
認識部8では、入力画像のベクトル量子化値ヒストグラム13と、辞書のベクトル量子化値ヒストグラム14とマッチングして距離(DTk)を算出し、距離(DTk)が最小となる識別対象(k)を、認識対象のカラー画像と判定する。
このように、本発明はカラー画像をベクトル量子化してから辞書と照合しているので、従来技術である特許文献1における問題点が解決される。
実施例2:
上記した実施例1では全画素を用いて色度ヒストグラムを作成しているが、これでは処理量が膨大になる。そこで、実施例2では、図6に示すように、色度ヒストグラムを求める画素をM画素間隔で間引いて行う。間引きの方法としては、例えば8画素間隔でサンプルして色度を求める画素を選択する方法を採る。また、M画素間隔で間引くとき、周囲の画素の画素値の平均を求め、この値を該間引き画素値としてもよい(この処理によって雑音が軽減される)。
実施例3:
実施例1において、色度ヒストグラム作成時に、r、g各8ビットでヒストグラムを作成すると、512次元の特徴量になり、メモリ容量も増大し、マッチング処理にも時間がかかる。
そこで、本実施例では、例えば以下のような変換を行って、特徴量次元を64次元に圧縮してから前述したと同様の処理を行う。
Pr’=0 (Pr≦64)
=(Pr−64)/4 (64<Pr≦192)
=31 (192<Pr)
Pg’=32 (Pg≦64)
=(Pg−64)/4+32 (64<Pg≦192)
=63 (192<Pg)
実施例4:
図7は、本発明の実施例4の構成を示す。この実施例4の構成は、図1の構成に変換圧縮テーブル15を付加して、データ量をテーブル変換によって変換圧縮する。つまり本実施例4は、実施例3のように変換式による演算処理を行うことなく効率的にデータ圧縮するものである。変換圧縮テーブル15は、後述するように、特徴量抽出部3によって抽出された特徴量を変換圧縮する。また、特徴量メモリ4は圧縮された特徴量を保持し、ベクトル量子化部6は圧縮された特徴量を予め作成してあるコードブック5と比較することによりベクトル量子化を行う点が、図1の構成と若干異なる。他の構成要素は図1で説明したものと同様であるので説明を省略する。
実施例1と同様に、入力カラー画像信号は、図2に示すように小領域(メッシュ)に分割され、小領域毎に入力カラー画像信号の特徴量が抽出される。本実施例では、特徴量として入力カラー画像信号RGBの色度信号を用いる。すなわち、特徴量抽出部3では、小領域(メッシュ)毎に入力カラー画像信号のRGBの色度信号を抽出して、変換圧縮テーブル15を参照することによって、特徴量を変換圧縮し、圧縮されたRGBの色度信号毎に小領域(メッシュ)内の色度ヒストグラムを作成して、特徴量メモリ4に結果を格納する。
図8は、小領域内の特徴量を変換圧縮してヒストグラムを生成する図である。変換圧縮テーブル15は、入力される各色度信号を変換特性に従って変換出力する。例えば、入力信号の値が255であるとき、その出力値が15として変換圧縮処理される。このように圧縮された特徴量のヒストグラムは特徴量メモリ4に生成される。このように、特徴量の変換圧縮によってメモリ容量の増加が抑制され、マッチング処理が高速化される。
図8に戻り、入力される各色度信号(R、G、B)は、変換圧縮テーブル15によってR’、G’、B’に変換圧縮されて出力される。この例では、R’、G’、B’はそれぞれ0から15の値をとる。そして、G’に16を加算し、B’に32を加算して、0から47の次元(図の横軸)で色度ヒストグラムH(i)16を作成する。すなわち、小領域内の色度ヒストグラムH(i)16において、次元i=0〜15のH(i)は圧縮変換されたR信号つまりR’信号の度数を表し、次元i=16〜31のH(i)は圧縮変換されたG信号つまりG’信号の度数を表し、次元i=32〜47のH(i)は圧縮変換されたB信号つまりB’信号の度数を表している。
なお、上記した実施例において、特徴量のヒストグラムの次元の総数(この例では48次元)は、変換圧縮テーブルによる圧縮の度合いに応じて決定されるもので、適宜変更可能である。また、入力カラー画像信号のRGBの色度信号からヒストグラムを作成しているが、本発明はこれに限定されるものではなく、入力カラー画像信号を変換処理したYMC信号やLab信号を特徴量として、変換圧縮処理とヒストグラム生成処理を行うようにしてもよい。
図9は、小領域内の色度ヒストグラムを、コードブックを参照してベクトル量子化する例を示す図であり、17は、特徴量メモリ4に格納された小領域内の色度ヒストグラム(Hi)を示し、18は、予め作成されたコードブック5(C0、C1、C2...)の内容を示す。前述した図3と異なる点は、ヒストグラムの次元数が圧縮されている点である。
ここで、コードブック5は、識別対象物あるいは一般の原稿を多数入力し、同様の条件で色度ヒストグラムのデータを大量に作成し、これらをクラスタリングすることで代表的な色度ヒストグラム(コードブック)を求めて作成する。
ベクトル量子化部6では、処理対象の小領域の色度ヒストグラム(Hi)17と、コードブックの内容18とをマッチングして距離(DCj)を算出し、その距離(一般には、ユークリッド距離の2乗として定義された2乗ひずみ測度)が最小であるコードブックのコード(Cj)を、その小領域のベクトル量子化値
(VQ値)として割り当て、ベクトル量子化値メモリ7に保持する。
入力画像のベクトル量子化値(VQ値)の例は、実施例1で説明した図4の場合と同様であり、ベクトル量子化値メモリ7には各小領域のベクトル量子化値(VQ値)が保持されていて、入力画像のベクトル量子化値(VQ値)についてヒストグラムが作成される。そして、実施例1の図5で説明したと同様にして識別対象物の辞書が構成され、認識部8では、入力画像のベクトル量子化値ヒストグラム13と、辞書のベクトル量子化値ヒストグラム14とマッチングして距離(DTk)を算出し、距離(DTk)が最小となる識別対象(k)を、認識対象のカラー画像と判定する。
実施例5:
上記した実施例4では、入力画像の全ての画素に対して特徴量のヒストグラムを作成してコードブックとの比較処理を行っている。本実施例5は、小領域毎に生成された特徴量のヒストグラム情報に基づいてコードブックとの比較処理を変更して、画像認識に必要のない地肌部(背景部)やノイズ画像の認識処理を制御するもので、これにより認識率と処理速度の向上を図る。
一般に、画像認識に必要のない地肌部(背景部)は、小領域内の濃度がほぼ一定であることから、小領域毎に生成された特徴量のヒストグラムの度数は特定部分に集中していて、度数分布の幅は狭く度数の最大値が大きくなる傾向にある。そこで、本実施例では、ヒストグラムの度数の最大値が予め設定した閾値を超えた場合に、濃度が一様な画像のベタ部領域であると判定して、ベクトル量子化値に0を割り当て、認識対象とされる画像情報のみにベクトル量子化を施す。他の実施態様としては、ヒストグラムの度数が予め設定した閾値を超えた場合にコードブックとの比較処理を行わないように構成してもよい。
また、原稿をスキャナなどで読み取って得られる画像のハイライト部においては、原稿用紙の裏側の画像が裏写りする場合がある。このような裏写りによる画像ノイズを除く、ハイライト部の画像データの特徴量は、多くの場合一様であることから、その特徴量のヒストグラムは特定部分に集中して大きなピークを持ち、また度数の最大値が大きくなり、度数の分布の幅が狭くなる傾向にある。そこで、本実施例では、ヒストグラムの度数分布の情報が、予め設定したヒストグラム特性を備えていると判定された場合には、小領域の特徴量ヒストグラムから予め設定したヒストグラム特性を除去してコードブックとの比較を行って、ベクトル量子化値を割り当てる。これにより、画像ノイズによる影響が抑止され、認識対象とされる画像情報のみにベクトル量子化が施される。
なお、本実施例5では特徴量のヒストグラム情報として、度数の最大値と度数の分布幅を採用しているが、これに限定されるものではなく、認識対象とする画像の特徴量ヒストグラムの特性を分析して設定されるヒストグラム情報であればよい。
実施例6:
上記した実施例4におけるコードブックは、認識対象画像を多数入力し、同様の条件で色度ヒストグラムのデータを大量に作成し、これらをクラスタリングすることによって作成しているので、入力画像が認識対象の画像以外の場合には、どのコードブックからも距離が離れる場合がある。
本実施例6では、認識対象画像をコードブックと比較してベクトル量子化値を割り当てる際に、比較した距離が所定の閾値よりも大きいとき、ベクトル量子化値を割り当てないように構成する。これにより、マッチングした結果、識別候補がない場合には速やかに入力カラー画像に認識対象の画像が存在しないと判定できるようになる。
実施例7:
本実施例7は、実施例1、4において辞書とのマッチングを行う際、有効距離の閾値を設定しておき、求めた距離と閾値との比較を行い、距離が閾値以下ならばその辞書内の識別対象物を識別候補にするが、閾値より大きい場合には、識別候補にしないようにする。これにより、マッチングした結果、識別候補がない場合には入力カラー画像に認識対象の画像が存在しないと判定できるようになる。
実施例8:
本実施例8は、実施例7における前記閾値を各識別対象物毎に設定し、求めた距離と各識別対象物毎の閾値の比較を行い、距離が閾値以下ならばその識別対象物を識別候補にするが、閾値より大きい場合にはその識別対象物を識別候補にしないようにする。これにより、複数の対象物を識別する際に、対象物の特性を活かしたマッチング処理が可能になる。より具体的にいえば、ある対象物kが対象物k以外の原稿jと間違え易い場合には、この対象物kの閾値を低くすることで、対象物kと原稿jとを高精度に識別することができ、誤認識を防止することが可能となる。
実施例9:
図10は、本発明の対象物抽出方法に係る実施例9の構成を示す。図10において、2値画像信号21から黒連結成分の外接矩形を抽出する矩形抽出部22と、抽出された矩形データを格納する矩形メモリ23と、予め設定された閾値と抽出矩形の幅、高さを比較し、抽出すべき対象物が長方形か否かを判定する候補矩形判定部24と、候補矩形データを格納する候補矩形メモリ25と、対象物が回転しているか否かを判定する回転判定部26と、対象物の短辺、長辺を測定する辺長測定部27と、短辺、長辺の長さと予め設定された閾値とを比較して対象物か否かを判定する対象物判定部28と、対象物矩形データを格納する対象物矩形メモリ29と、全体を制御する制御部30とから構成されている。
図11は、本発明の対象物抽出および画像認識の処理フローチャートである。この処理フローチャートにおいて、本発明の対象物抽出方法に係る処理はステップ101からステップ108であり、まず対象物の抽出方法について、以下説明する。
入力画像から2値画像を生成し(ステップ101)、矩形抽出部22は、2値画像から黒連結成分の外接矩形を抽出する(ステップ102)。矩形抽出方法としては、例えば本出願人が先に提案した方式(特願平3−341889、同4−267313、同4−160866)などを用いればよい。
図12は、入力画像201から抽出された外接矩形202を示す。本発明では、外接矩形202の4頂点の座標(Xs,Ys)、(Xe,Ye)、(Xs,Ye)、(Xe,Ys)と、黒連結成分(対象物)203と外接矩形202との接点座標(Xu,Ys)、(Xe,Yr)、(Xs,Yl)、(Xb,Ye)を同時に抽出する。
次いで、候補矩形判定部24では、抽出された外接矩形の高さ、幅が予め与えられた高さ、幅の範囲内にあるか否かを判定し(ステップ103)、高さ、幅の何れかが範囲外であれば、対象物でないと判定する(ステップ113)。なお、このようなサイズによる対象物の候補判定方法については、前掲した本出願による方式を用いればよい。続いて、候補矩形判定部24では、抽出すべき対象物が長方形であるか否かをチェックする(ステップ104)。これは例えば、候補矩形判定部24内に予め抽出すべき対象物として長方形データが設定されているものとする。
対象物が長方形であるものについて、回転判定部26は、対象物がスキャンラインに対して回転しているか否かを判定する(ステップ105)。図13は、回転の判定を説明する図であり、301は候補矩形、302は対象物である。この回転判定は、対象物302が長方形の場合、三角形AとB、三角形CとDの合同を判定し、もしどちらか一方でも合同でないと判定された場合には回転していないと判定する。また、図13に示すように、長方形の対角線D1,D2の長さ(この長さは矩形データの座標から計算する)を比較し、その差が大きければ菱形と判定し、対象物302が回転していないと判定する。
次いで、辺長測定部27では、回転していると判定された長方形について、図13のS1、S2の長さを計算し(矩形データの座標から計算する)、それぞれを短辺、長辺の長さとする(ステップ106)。一方、ステップ104で長方形でないと判定されたもの、ステップ105で回転していないと判定されたものについては、外接矩形の高さを短辺、幅を長辺の長さとする(ステップ107)。そして、短辺、長辺の長さが予め与えられた対象物の短辺、長辺の長さの範囲にあるか否かを判定し、何れか一方でも範囲外ならば対象物ではないと判定し、この条件に合うものを抽出すべき対象物と判定する(ステップ108)。以下の処理(ステップ109以降)については、後述する。
なお、上記した実施例において、矩形抽出部22の前に、入力された2値画像に対して例えば8×8画素を1画素に変換するような画像圧縮部を設け、圧縮された画像から矩形を抽出するように構成を変更することも可能である。
実施例10:
本実施例10では、入力画像をカラー画像信号(R,G,B)とし、以下のような明度(L)を求め、所定の閾値(Th1)以下の明度を持つ画素を黒とし、閾値(Th1)より大きい画素を白とするような2値画像を作成してから、実施例1と同様の処理を行う。
L=R+G+B
L≦Th1ならば黒画素
L>Th1ならば白画素
本実施例は、対象物以外の部分(背景)が白地の場合に対象物を抽出するのに有効な方式となる。つまり例えば、白紙(あるいは淡い地肌の用紙)に対象物を載せてスキャナなどで画像を読み取るような場合に有効な方式となる。
実施例11:
本実施例11では、入力画像をカラー画像信号(R,G,B)とし、以下のような明度(L)を求め、所定の閾値(Th2)以上の明度を持つ画素を黒とし、閾値(Th2)より小さい画素を白とするような2値画像を作成してから、実施例1と同様の処理を行う。
L=R+G+B
L≧Th2ならば黒画素
L<Th2ならば白画素
本実施例は、銀板のような圧板を持つスキャナなどで入力した時に、対象物以外の部分(背景)が黒地になる場合に対象物を抽出するのに有効な方式となる。このように、実施例10、11によれば、原稿を押える蓋をした状態で画像を取り込んでも、また蓋を開けた状態で画像を取り込んでも何れにも対応できる。なお、上記実施例における対象物とは、スキャナに載せた原稿全体から抽出される場合、あるいは原稿中のある特定領域から抽出される場合の何れでもよい。
また、上記実施例10、11において、明度以外に、カラー画像信号(RGB)、色相、彩度などを対象とすることもできる。さらに、実施例10、11において、Th1≦L≦Th2ならば黒画素、上記以外ならば白画素のように、所定範囲内を黒画素としてもよい。
図14は、実施例10、11の構成を示す。実施例9(図10)と異なる点は、カラー画像信号(RGB)34から2値画像を生成する2値画像生成部31が設けられた点と、実施例10で作成された2値画像を格納するメモリ32と、実施例11で作成された2値画像を格納するメモリ33が設けられた点である。そして、背景が白地の場合にも黒地の場合にも対応できるように、実施例10および11をそれぞれ実行し、矩形抽出部22で外接矩形を抽出する。この抽出された各外接矩形を外接矩形1、2とすると、候補矩形判定部24において、これら外接矩形1、2の包含関係を判定し、例えば外接矩形1が外接矩形2を完全に含むとき、外接矩形1のみから対象物を抽出する。
実施例12:
図15は、実施例12の全体構成を示す。図において、対象物抽出部42がカラー画像信号41から対象物を抽出して、対象物矩形メモリ43に格納する部分は、前述した図14に示す構成と全く同一のものである。
本実施例では、カラー画像信号41をベクトル量子化するベクトル量子化部44と、ベクトル量子化値を格納するベクトル量子化値メモリ45と、対象物抽出部42で抽出された対象物と予め作成された辞書とのマッチングを行い対象物か否かを判定する対象物認識部46が設けられている。
図16は、実施例12の詳細構成を示す。まず、対象物抽出部51の構成から説明すると、対象物抽出部51は図14に示す要素から構成され、対象物が抽出されると、対象物認識部61に対して起動信号53を出力する。また抽出された対象物のデータが対象物矩形メモリ52に格納され、対象物認識部61に対して起動信号53と共に、対象物の範囲データ54が出力される。
ベクトル量子化処理部55は、実施例1で説明したと同様に、入力されたカラー画像信号(RGB)から得られたカラー画像を小領域(メッシュ)に分割するメッシュ分割部56と、小領域内のカラー画像データから特徴量(色度ヒストグラム)を抽出する特徴量抽出部57と、作成された色度ヒストグラムと予め作成してあるコードブック59と比較することによりベクトル量子化を行うベクトル量子化部58から構成されている。ベクトル量子化された入力カラー画像はベクトル量子化値メモリ60に保持される。
入力カラー画像をベクトル量子化して、処理対象の小領域のベクトル量子化値(VQ値)を割り当てて、ベクトル量子化値メモリ60に保持するまでの処理は、前述した実施例1と同様であるので、その説明を省略する。
さて、対象物認識部61のヒストグラム作成部62では、上記したベクトル量子化値(前述した図4)からベクトル量子化値のヒストグラムを作成する。すなわち、入力画像のベクトル量子化値(VQ値)について、対象物の範囲内にあるVQ値のヒストグラムを作成する(図11のステップ109)。図17は、対象物が回転している場合における、対象物の範囲内にあるベクトル量子化値のヒストグラム作成を説明する図である。
前述したように対象物が抽出されると対象物認識部61の起動時に、対象物抽出部51から対象物認識部61に対して、対象物の範囲データ54が渡されるので、図17の対象物のエッジ501の直線データとベクトル量子化値メモリ60の座標とを比較して包含関係を判定し、対象物の範囲内に完全に含まれる小領域(図17の黒い部分で示す領域)について、ベクトル量子化値のヒストグラムを作成する。対象物が回転していない場合は、外接矩形の範囲データとベクトル量子化値メモリの座標とを比較して包含関係を判定し、外接矩形の範囲内の小領域について、ベクトル量子化値のヒストグラムを作成する。
そして、実施例1の図5で説明したと同様に、対象物認識部61では、抽出対象物のベクトル量子化値ヒストグラム13と、辞書のベクトル量子化値ヒストグラム14とをマッチング部63でマッチングして距離(DTk)を算出し、距離(DTk)が最小となる識別対象(k)を、抽出対象物であると認識し、従って入力画像中に対象物が存在していると判定する(ステップ110、111)。
辞書との照合の結果、マッチングしていないときは、入力画像中に対象物がないと判定され(ステップ113)、抽出されたすべての矩形について同様の処理を行う(ステップ112)が、入力画像中に対象物が存在していると判定されたときは、未処理の矩形があっても処理を終了する。
本実施例は、入力カラー画像データに対して、矩形抽出とベクトル量子化を並列的に行うとともに、矩形抽出の処理が完了した矩形から順次サイズ判定を行い、対象物と判定された矩形に対して認識処理しているので、リアルタイム処理が可能になる。
本発明の実施例1の構成を示す。 原画像を小領域に分割した図を示す。 小領域内の色度ヒストグラムを、コードブックを参照してベクトル量子化する例を示す図である。 入力画像のベクトル量子化値(VQ値)の例を示す図である。 認識時における入力画像のベクトル量子化値ヒストグラムと辞書のベクトル量子化値ヒストグラムとのマッチングを説明する図である。 特徴抽出時におけるサンプリング点を示す図である。 本発明の実施例4の構成を示す。 小領域内の特徴量を変換圧縮してヒストグラムを生成する図である。 入力画像の特徴量ヒストグラムとコードブックとのマッチングを説明する図である。 本発明の対象物抽出方法に係る実施例9の構成を示す。 本発明の対象物抽出および画像認識の処理フローチャートである。 入力画像から抽出された外接矩形を示す。 回転の判定を説明する図である。 実施例10、11の構成を示す図である。 実施例12の全体構成を示す図である。 実施例12の詳細構成を示す図である。 対象物が回転している場合における、対象物の範囲内にあるベクトル量子化値のヒストグラム作成を説明する図である。
符号の説明
1 カラー画像信号
2 メッシュ分割部
3 特徴量抽出部
4 特徴量メモリ
5 コードブック
6 ベクトル量子化部
7 ベクトル量子化値メモリ
8 認識部
9 辞書
10 制御部

Claims (2)

  1. 入力カラー画像信号を複数の領域に分割する分割工程と、前記分割された領域内の入力カラー画像信号から特徴量を抽出する特徴量抽出工程と、前記抽出された特徴量を、予め作成されたコードブックと比較することによりベクトル量子化し、前記入力カラー画像信号のベクトル量子化値を生成するベクトル量子化工程とからなるベクトル量子化処理工程と、
    前記入力カラー画像信号から黒連結成分の外接矩形を抽出する矩形抽出工程と、前記抽出された外接矩形の内、高さ、幅が所定の範囲内にある矩形を所定形状の対象物として判定する判定工程とからなる対象物抽出工程と、
    前記対象物抽出工程が前記所定形状の対象物を抽出したとき、前記生成された入力カラー画像信号のベクトル量子化値を参照して、前記所定形状の対象物の範囲に相当するベクトル量子化値のヒストグラムを作成するヒストグラム作成工程と、前記作成された所定形状の対象物のヒストグラムと辞書とを照合することにより、前記入力カラー画像信号中に、前記辞書に登録された対象物が存在するか否かを判定処理するマッチング工程とを備え、
    前記ベクトル量子化処理工程と前記対象物抽出工程を並列に実行することを特徴とするカラー画像認識方法。
  2. 入力カラー画像信号を複数の領域に分割する分割手段と、前記分割された領域内の入力カラー画像信号から特徴量を抽出する特徴量抽出手段と、前記抽出された特徴量を、予め作成されたコードブックと比較することによりベクトル量子化し、前記入力カラー画像信号のベクトル量子化値を生成するベクトル量子化手段とからなるベクトル量子化処理手段と、
    前記入力カラー画像信号から黒連結成分の外接矩形を抽出する矩形抽出手段と、前記抽出された外接矩形の内、高さ、幅が所定の範囲内にある矩形を所定形状の対象物として判定する判定手段とからなる対象物抽出手段と、
    前記対象物抽出手段が前記所定形状の対象物を抽出したとき、前記生成された入力カラー画像信号のベクトル量子化値を参照して、前記所定形状の対象物の範囲に相当するベクトル量子化値のヒストグラムを作成するヒストグラム作成手段と、前記作成された所定形状の対象物のヒストグラムと辞書とを照合することにより、前記入力カラー画像信号中に、前記辞書に登録された対象物が存在するか否かを判定処理するマッチング手段とを備え、
    前記ベクトル量子化処理手段と前記対象物抽出手段を並列に実行することを特徴とするカラー画像認識装置。
JP2006230955A 1993-12-10 2006-08-28 カラー画像認識方法および装置 Expired - Lifetime JP4458429B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006230955A JP4458429B2 (ja) 1993-12-10 2006-08-28 カラー画像認識方法および装置

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP31069493 1993-12-10
JP31069693 1993-12-10
JP1859194 1994-02-15
JP5228694 1994-03-23
JP2006230955A JP4458429B2 (ja) 1993-12-10 2006-08-28 カラー画像認識方法および装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003198874A Division JP2004005715A (ja) 1993-12-10 2003-07-18 カラー画像認識方法および装置

Publications (2)

Publication Number Publication Date
JP2006344242A JP2006344242A (ja) 2006-12-21
JP4458429B2 true JP4458429B2 (ja) 2010-04-28

Family

ID=37641108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006230955A Expired - Lifetime JP4458429B2 (ja) 1993-12-10 2006-08-28 カラー画像認識方法および装置

Country Status (1)

Country Link
JP (1) JP4458429B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5581574B2 (ja) 2008-07-09 2014-09-03 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4935960B2 (ja) * 2009-03-13 2012-05-23 日本電気株式会社 画像識別子抽出装置
CN102349092B (zh) 2009-03-13 2015-08-12 日本电气株式会社 图像签名提取设备
KR101355299B1 (ko) * 2009-04-14 2014-01-23 닛본 덴끼 가부시끼가이샤 이미지 시그니처 추출 장치

Also Published As

Publication number Publication date
JP2006344242A (ja) 2006-12-21

Similar Documents

Publication Publication Date Title
EP1158453B1 (en) Image extraction method and apparatus, and image recognition method and apparatus, for extracting/recognizing specific image from input image signal
JP3345350B2 (ja) 文書画像認識装置、その方法、及び記録媒体
US6373981B1 (en) Method and apparatus for segmenting data to create mixed raster content planes
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP3373008B2 (ja) 画像像域分離装置
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
US8548241B2 (en) Enhanced multilayer compression of image files using OCR systems
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP4458429B2 (ja) カラー画像認識方法および装置
EP0933719A2 (en) Image processing method and apparatus
EP0949580B1 (en) Classification-driven thresholding of a normalized grayscale image
US6487311B1 (en) OCR-based image compression
JP3496893B2 (ja) カラー画像認識方法および装置
JP4217969B2 (ja) 画像処理装置及びプログラム
JP2004005715A (ja) カラー画像認識方法および装置
RU2571510C2 (ru) Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении
EP0715274B1 (en) An optical character recognition apparatus and a method for selecting an operational mode thereof
JPH07160886A (ja) 対象物抽出方法およびカラー画像認識方法
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JP3113769B2 (ja) 文字認識装置
JPH09204525A (ja) 画像像域分離装置及びその方法
JPH07262373A (ja) カラー画像認識方法
JP4193687B2 (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091021

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130219

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130219

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140219

Year of fee payment: 4

EXPY Cancellation because of completion of term