JP3496893B2 - カラー画像認識方法および装置 - Google Patents

カラー画像認識方法および装置

Info

Publication number
JP3496893B2
JP3496893B2 JP20167594A JP20167594A JP3496893B2 JP 3496893 B2 JP3496893 B2 JP 3496893B2 JP 20167594 A JP20167594 A JP 20167594A JP 20167594 A JP20167594 A JP 20167594A JP 3496893 B2 JP3496893 B2 JP 3496893B2
Authority
JP
Japan
Prior art keywords
color image
histogram
vector
value
codebook
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP20167594A
Other languages
English (en)
Other versions
JPH07311848A (ja
Inventor
道義 立川
利夫 宮澤
明彦 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP20167594A priority Critical patent/JP3496893B2/ja
Publication of JPH07311848A publication Critical patent/JPH07311848A/ja
Application granted granted Critical
Publication of JP3496893B2 publication Critical patent/JP3496893B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、カラー画像および白黒
画像から特定画像を抽出して認識するカラー画像認識方
法および装置に関する。
【0002】
【従来の技術】カラー画像を処理する製品、例えばカラ
ー複写機、カラープリンタ、カラースキャナ、カラー画
像通信機器などは、今後ますます増加するものと予想さ
れる。カラー画像は、ハードウェアの進歩、特にメモリ
の低価格化および大容量化、通信コストの低下などによ
り、以前に比べて利用しやすくなってきたものの、カラ
ー画像データはそのデータ量が膨大(例えば、A3サイ
ズで96Mバイト)であるため、2値画像と同じような
処理ができないのが現状である。
【0003】特に、画像認識(特定画像の認識、OCR
など)などの複雑な処理を要する技術においては、処理
量が膨大になり、カラー画像における画像認識は実現が
より困難である。
【0004】
【発明が解決しようとする課題】従来、特定のカラー画
像を識別する方法として、例えば、画像を構成する各絵
柄部分は固有の色空間上での分布を持っているので、各
絵柄部分に現われる固有の色空間上での分布を特定し、
この特定された特徴と同一の特徴を有する画像部分を抽
出する方法がある(特開平4−180348号公報を参
照)。しかし、この方法では、色空間中での拡がりが同
じ画像については、その内部での色の分布が異なってい
ても識別することができず、つまり色空間の拡がりが同
じであれば、拡がりの中での色の分布が異なる画像をも
特定の画像として誤検出する可能性がある。
【0005】また一方、認識処理に必要な対象物の抽出
方法として種々の方法が提案されているが、例えば画像
から黒連結の矩形を抽出し、予め設定された閾値と比較
することにより、文字の矩形と線図形の矩形とを判定す
る画像抽出方法がある(特開昭55−162177号公
報を参照)。この方法は、抽出された線図形をさらに詳
細に水平罫線、垂直罫線、表、囲み枠などのように識別
するものではなく、また回転した対象物の抽出に対応で
きない。
【0006】本発明の第1の目的は、カラー画像の認識
処理を行う際に、画像認識に必要な情報量を確保しつ
つ、データ量を圧縮して対象物を高精度に認識するカラ
ー画像認識方法および装置を提供することにある。
【0007】本発明の第2の目的は、カラー画像の認識
処理を行う際に、画像認識に必要な情報量を確保しつ
つ、データ量をテーブル変換によって変換圧縮すること
により、効率的にデータ圧縮を行い、対象物を高精度か
つ高速に認識するカラー画像認識方法および装置を提供
することにある。
【0008】本発明の第3の目的は、認識対象原稿のカ
ラー画像が裏写りした場合の影響を抑制して、認識対象
とされる画像情報のみにベクトル量子化を施すことによ
り、認識率と処理速度を向上させたカラー画像認識方法
および装置を提供することにある。
【0009】本発明の第4の目的は、コードブックとの
距離が所定の閾値より大きい場合に、ベクトル量子化値
を割り当てないことにより、認識精度と処理速度を向上
させたカラー画像認識方法および装置を提供することに
ある。
【0010】本発明の第5の目的は、入力画像中から対
象物の画像領域を高精度に抽出する対象物抽出方法を提
供することにある。
【0011】本発明の第6の目的は、抽出された対象物
に対して、カラー画像の認識処理を行う際に、画像認識
に必要な情報量を確保しつつ、データ量を圧縮して対象
物を高精度に認識するカラー画像認識方法および装置
提供することにある。
【0012】
【課題を解決するための手段】前記各目的を達成するた
めに、請求項1記載の発明では、入力されたカラー画像
信号を複数の領域に分割し、該分割された領域内のカラ
ー画像から特徴量を抽出し、該抽出された特徴量を圧縮
してヒストグラムを生成し、該ヒストグラムを予め作成
されたコードブックと比較することによりベクトル量子
化し、前記カラー画像のベクトル量子化された値と識別
対象物の辞書とを照合することにより、前記カラー画像
を認識処理するカラー画像認識方法であって、前記ヒス
トグラムの情報を基に、前記コードブックとの比較処理
を変更制御することを特徴としている。
【0013】請求項記載の発明では、前記ヒストグラ
ムの度数または度数分布幅が所定の値を超えたとき、所
定のベクトル量子化値を与えることを特徴としている。
【0014】請求項記載の発明では、前記ヒストグラ
ムの度数または度数分布幅が所定の値を超えたとき、前
記コードブックとの比較処理を行わないことを特徴とし
ている。
【0015】請求項記載の発明では、前記ヒストグラ
ムとコードブックとの比較の結果、比較した距離が所定
の値より大きいときベクトル量子化しないことを特徴と
している。
【0016】請求項記載の発明では、入力されたカラ
ー画像信号を複数の領域に分割する手段と、該分割され
た領域内のカラー画像から特徴量を抽出する手段と、該
抽出された特徴量を圧縮してヒストグラムを生成する手
段と、該ヒストグラムを予め作成されたコードブックと
比較することによりベクトル量子化する手段と、前記カ
ラー画像のベクトル量子化された値と識別対象物の辞書
とを照合することにより、前記カラー画像を認識処理す
る手段とを備えたカラー画像認識装置であって、前記ヒ
ストグラムの情報を基に、前記コードブックとの比較処
理を変更制御することを特徴としている。
【0017】請求項記載の発明では、入力カラー画像
信号を複数の領域に分割し、該分割された領域内のカラ
ー画像から特徴量を抽出し、該抽出された特徴量を、予
め作成されたコードブックと比較することによりベクト
ル量子化し、前記カラー画像のベクトル量子化された値
を生成し、前記入力カラー画像信号から抽出された所定
形状の対象物の範囲に相当する該ベクトル量子化値を参
照して該ベクトル量子化値のヒストグラムを作成し、該
作成された対象物のヒストグラムと辞書とを照合するこ
とにより、前記対象物を認識処理することを特徴として
いる。
【0018】請求項記載の発明では、入力カラー画像
信号を複数の領域に分割する手段と、該分割された領域
内のカラー画像から特徴量を抽出する手段と、該抽出さ
れた特徴量を、予め作成されたコードブックと比較する
ことによりベクトル量子化する手段と、前記カラー画像
のベクトル量子化された値を生成する手段と、前記入力
カラー画像信号から抽出された所定形状の対象物の範囲
に相当する該ベクトル量子化値を参照して該ベクトル量
子化値のヒストグラムを作成する手段と、該作成された
対象物のヒストグラムと辞書とを照合することにより、
前記対象物を認識処理する手段とを備えたことを特徴と
している。
【0019】
【作用】第1の実施例においては、入力されたカラー画
像信号RGBはメッシュ分割部で小領域(メッシュ)に
分割される。特徴量抽出部では、分割された小領域毎
に、入力カラー画像信号RGBの色度ヒストグラムを作
成して、特徴量メモリに格納する。識別対象物の色度ヒ
ストグラムを予め作成して、コードブックに格納してお
く。そして、ベクトル量子化部では、特徴量メモリの色
度ヒストグラムと、コードブックとの距離を算出し、そ
の距離が最小であるコードブックのコードを、その小領
域のベクトル量子化値としてベクトル量子化値メモリに
保持する。辞書には、識別対象物について予めベクトル
量子化値ヒストグラムを求めて格納しておく。認識部で
は、入力画像のベクトル量子化値ヒストグラムと、辞書
のベクトル量子化値ヒストグラムとの距離を算出し、入
力カラー画像が識別対象であるか否かを判定する。これ
により、データ量を圧縮できるとともに、高精度に対象
物を認識することが可能となる。
【0020】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。 〈実施例1〉 図1は、本発明の実施例1の構成を示す。図1におい
て、入力されたカラー画像信号(RGB)1から得られ
たカラー画像を小領域(メッシュ)に分割するメッシュ
分割部2と、小領域内のカラー画像データから特徴量を
抽出する特徴量抽出部3と、抽出した特徴量を格納する
特徴量メモリ4と、抽出した特徴量を予め作成してある
コードブック5と比較することによりベクトル量子化を
行うベクトル量子化部6と、ベクトル量子化値を保持す
るベクトル量子化値メモリ7と、該メモリと識別対象物
の辞書9とを照合して認識処理を行う認識部8と、メモ
リ管理やマッチング処理の距離計算などの全体の画像認
識処理における各段階の制御を行う制御部10とから構
成されている。
【0021】入力カラー画像信号RGBを予め定められ
た小領域(メッシュ)に分割する。分割された小領域
(メッシュ)毎に、入力カラー画像信号RGBの特徴量
を抽出する。本実施例では、その特徴量として色度ヒス
トグラムを用いる。すなわち、特徴量抽出部3では、入
力カラー画像信号RGBを以下に示す色度Pr、Pgに
変換し、予め定められた小領域(メッシュ)毎に色度P
r、Pgの値のヒストグラムを作成し、特徴量メモリ4
に格納する。このように、色度変換されたカラー画像
は、色合い情報だけを持つので、照明むらが除去されて
対象物を抽出する場合などに有効となる。
【0022】図2は、原画像を小領域(メッシュ)に分
割した図を示し、この例では、小領域は64画素×64
画素のサイズである。
【0023】 Pr=256*R/(R+G+B) Pg=256*G/(R+G+B) ここで、R、G、Bは入力された各8ビットのカラー画
像信号である。なお、Pr、Pgを256倍しているの
はPr、Pgも8ビットで表現するためである。
【0024】また、上記した例では、r,gの色度ヒス
トグラムを特徴量としたが、本発明はこれに限定される
ものではなく、bの色度ヒストグラムを用いてもよい
し、色度の他に、カラー画像信号(RGB)、色相、彩
度などの特徴量を用いることができる。
【0025】図3は、小領域内の色度ヒストグラムを、
コードブックを参照してベクトル量子化する例を示す図
である。
【0026】図3において、11は、特徴量メモリ4に
格納された小領域内の色度ヒストグラム(Hi)を示
す。i=0〜255の次元におけるH(i)はPrを表
し、i=256〜511の次元におけるH(i)はPg
を表す。また、12は、予め作成されたコードブック
(C0、C1、C2...)の内容を示す。
【0027】ここで、コードブックは、識別対象物ある
いは一般の原稿を多数入力し、同様の条件で色度ヒスト
グラムのデータを大量に作成し、これらをクラスタリン
グすることで代表的な色度ヒストグラム(コードブッ
ク)を求めて作成する。
【0028】ベクトル量子化部6では、この色度ヒスト
グラム(Hi)11と、コードブックの内容12とをマ
ッチングして距離(DCj)を算出し、その距離(一般
には、ユークリッド距離の2乗として定義された2乗ひ
ずみ測度)が最小であるコードブックのコード(Cj)
を、その小領域のベクトル量子化値(VQ値)としてベ
クトル量子化値メモリ7に保持する。
【0029】図4は、入力画像のベクトル量子化値(V
Q値)の例を示す。各桝目は、前述した一つの小領域に
対応し、各桝目内の数値はベクトル量子化値(VQ値)
である。そして、これらのベクトル量子化値(VQ値)
についてヒストグラムを作成する。
【0030】図5は、画像認識時における入力画像のベ
クトル量子化値のヒストグラムと辞書のベクトル量子化
値のヒストグラムとのマッチングを説明する図である。
図において13は、作成されたベクトル量子化値のヒス
トグラム例を示す。また、14は、識別対象物の辞書内
容を示し、入力画像と同様に、ベクトル量子化値ヒスト
グラムで表現されて予め作成されている。図の場合は、
例えば、識別対象物A,B,C..(コードブック数が
64)のベクトル量子化値ヒストグラムが格納されてい
る。
【0031】認識部8では、入力画像のベクトル量子化
値ヒストグラム13と、辞書のベクトル量子化値ヒスト
グラム14とマッチングして距離(DTk)を算出し、
距離(DTk)が最小となる識別対象(k)を、認識対
象のカラー画像と判定する。
【0032】このように、本発明はカラー画像をベクト
ル量子化してから辞書と照合しているので、従来技術で
ある特開平4−180348号公報における問題点が解
決される。
【0033】〈実施例2〉 上記した実施例1では全画素を用いて色度ヒストグラム
を作成しているが、これでは処理量が膨大になる。そこ
で、実施例2では、図6に示すように、色度ヒストグラ
ムを求める画素をM画素間隔で間引いて行う。間引きの
方法としては、例えば8画素間隔でサンプルして色度を
求める画素を選択する方法を採る。また、M画素間隔で
間引くとき、周囲の画素の画素値の平均を求め、この値
を該間引き画素値としてもよい(この処理によって雑音
が軽減される)。
【0034】〈実施例3〉実施例1において、色度ヒス
トグラム作成時に、r、g各8ビットでヒストグラムを
作成すると、512次元の特徴量になり、メモリ容量も
増大し、マッチング処理にも時間がかかる。
【0035】そこで、本実施例では、例えば以下のよう
な変換を行って、特徴量次元を64次元に圧縮してから
前述したと同様の処理を行う。
【0036】 Pr’=0 (Pr≦64) =(Pr−64)/4 (64<Pr≦192) =31 (192<Pr) Pg’=32 (Pg≦64) =(Pg−64)/4+32 (64<Pg≦192) =63 (192<Pg) 〈実施例4〉 図7は、本発明の実施例4の構成を示す。この実施例4
の構成は、図1の構成に変換圧縮テーブル15を付加し
て、データ量をテーブル変換によって変換圧縮する。つ
まり本実施例4は、実施例3のように変換式による演算
処理を行うことなく効率的にデータ圧縮するものであ
る。変換圧縮テーブル15は、後述するように、特徴量
抽出部3によって抽出された特徴量を変換圧縮する。ま
た、特徴量メモリ4は圧縮された特徴量を保持し、ベク
トル量子化部6は圧縮された特徴量を予め作成してある
コードブック5と比較することによりベクトル量子化を
行う点が、図1の構成と若干異なる。他の構成要素は図
1で説明したものと同様であるので説明を省略する。
【0037】実施例1と同様に、入力カラー画像信号
は、図2に示すように小領域(メッシュ)に分割され、
小領域毎に入力カラー画像信号の特徴量が抽出される。
本実施例では、特徴量として入力カラー画像信号RGB
の色度信号を用いる。すなわち、特徴量抽出部3では、
小領域(メッシュ)毎に入力カラー画像信号のRGBの
色度信号を抽出して、変換圧縮テーブル15を参照する
ことによって、特徴量を変換圧縮し、圧縮されたRGB
の色度信号毎に小領域(メッシュ)内の色度ヒストグラ
ムを作成して、特徴量メモリ4に結果を格納する。
【0038】図8は、小領域内の特徴量を変換圧縮して
ヒストグラムを生成する図である。変換圧縮テーブル1
5は、入力される各色度信号を変換特性に従って変換出
力する。例えば、入力信号の値が255であるとき、そ
の出力値が15として変換圧縮処理される。このように
圧縮された特徴量のヒストグラムは特徴量メモリ4に生
成される。このように、特徴量の変換圧縮によってメモ
リ容量の増加が抑制され、マッチング処理が高速化され
る。
【0039】図8に戻り、入力される各色度信号(R、
G、B)は、変換圧縮テーブル15によってR’、
G’、B’に変換圧縮されて出力される。この例では、
R’、G’、B’はそれぞれ0から15の値をとる。そ
して、G’に16を加算し、B’に32を加算して、0
から47の次元(図の横軸)で色度ヒストグラムH
(i)16を作成する。すなわち、小領域内の色度ヒス
トグラムH(i)16において、次元i=0〜15のH
(i)は圧縮変換されたR信号つまりR’信号の度数を
表し、次元i=16〜31のH(i)は圧縮変換された
G信号つまりG’信号の度数を表し、次元i=32〜4
7のH(i)は圧縮変換されたB信号つまりB’信号の
度数を表している。
【0040】なお、上記した実施例において、特徴量の
ヒストグラムの次元の総数(この例では48次元)は、
変換圧縮テーブルによる圧縮の度合いに応じて決定され
るもので、適宜変更可能である。また、入力カラー画像
信号のRGBの色度信号からヒストグラムを作成してい
るが、本発明はこれに限定されるものではなく、入力カ
ラー画像信号を変換処理したYMC信号やLab信号を
特徴量として、変換圧縮処理とヒストグラム生成処理を
行うようにしてもよい。
【0041】図9は、小領域内の色度ヒストグラムを、
コードブックを参照してベクトル量子化する例を示す図
であり、17は、特徴量メモリ4に格納された小領域内
の色度ヒストグラム(Hi)を示し、18は、予め作成
されたコードブック5(C0、C1、C2...)の内
容を示す。前述した図3と異なる点は、ヒストグラムの
次元数が圧縮されている点である。
【0042】ここで、コードブック5は、識別対象物あ
るいは一般の原稿を多数入力し、同様の条件で色度ヒス
トグラムのデータを大量に作成し、これらをクラスタリ
ングすることで代表的な色度ヒストグラム(コードブッ
ク)を求めて作成する。
【0043】ベクトル量子化部6では、処理対象の小領
域の色度ヒストグラム(Hi)17と、コードブックの
内容18とをマッチングして距離(DCj)を算出し、
その距離(一般には、ユークリッド距離の2乗として定
義された2乗ひずみ測度)が最小であるコードブックの
コード(Cj)を、その小領域のベクトル量子化値(V
Q値)として割り当て、ベクトル量子化値メモリ7に保
持する。
【0044】入力画像のベクトル量子化値(VQ値)の
例は、実施例1で説明した図4の場合と同様であり、ベ
クトル量子化値メモリ7には各小領域のベクトル量子化
値(VQ値)が保持されていて、入力画像のベクトル量
子化値(VQ値)についてヒストグラムが作成される。
そして、実施例1の図5で説明したと同様にして識別対
象物の辞書が構成され、認識部8では、入力画像のベク
トル量子化値ヒストグラム13と、辞書のベクトル量子
化値ヒストグラム14とマッチングして距離(DTk)
を算出し、距離(DTk)が最小となる識別対象(k)
を、認識対象のカラー画像と判定する。
【0045】〈実施例5〉 上記した実施例4では、入力画像の全ての画素に対して
特徴量のヒストグラムを作成してコードブックとの比較
処理を行っている。本実施例5は、小領域毎に生成され
た特徴量のヒストグラム情報に基づいてコードブックと
の比較処理を変更して、画像認識に必要のない地肌部
(背景部)やノイズ画像の認識処理を制御するもので、
これにより認識率と処理速度の向上を図る。
【0046】一般に、画像認識に必要のない地肌部(背
景部)は、小領域内の濃度がほぼ一定であることから、
小領域毎に生成された特徴量のヒストグラムの度数は特
定部分に集中していて、度数分布の幅は狭く度数の最大
値が大きくなる傾向にある。そこで、本実施例では、ヒ
ストグラムの度数の最大値が予め設定した閾値を超えた
場合に、濃度が一様な画像のベタ部領域であると判定し
て、ベクトル量子化値に0を割り当て、認識対象とされ
る画像情報のみにベクトル量子化を施す。他の実施態様
としては、ヒストグラムの度数が予め設定した閾値を超
えた場合にコードブックとの比較処理を行わないように
構成してもよい。
【0047】また、原稿をスキャナなどで読み取った得
られる画像のハイライト部においては、原稿用紙の裏側
の画像が裏写りする場合がある。このような裏写りによ
る画像ノイズを除く、ハイライト部の画像データの特徴
量は、多くの場合一様であることから、その特徴量のヒ
ストグラムは特定部分に集中して大きなピークを持ち、
また度数の最大値が大きくなり、度数の分布の幅が狭く
なる傾向にある。そこで、本実施例では、ヒストグラム
の度数分布の情報が、予め設定したヒストグラム特性を
備えていると判定された場合には、小領域の特徴量ヒス
トグラムから予め設定したヒストグラム特性を除去して
コードブックとの比較を行って、ベクトル量子化値を割
り当てる。これにより、画像ノイズによる影響が抑止さ
れ、認識対象とされる画像情報のみにベクトル量子化が
施される。
【0048】なお、本実施例5では特徴量のヒストグラ
ム情報として、度数の最大値と度数の分布幅を採用して
いるが、これに限定されるものではなく、認識対象とす
る画像の特徴量ヒストグラムの特性を分析して設定され
るヒストグラム情報であればよい。
【0049】〈実施例6〉 上記した実施例4におけるコードブックは、認識対象画
像を多数入力し、同様の条件で色度ヒストグラムのデー
タを大量に作成し、これらをクラスタリングすることに
よって作成しているので、入力画像が認識対象の画像以
外の場合には、どのコードブックからも距離が離れる場
合がある。
【0050】本実施例6では、認識対象画像をコードブ
ックと比較してベクトル量子化値を割り当てる際に、比
較した距離が所定の閾値よりも大きいとき、ベクトル量
子化値を割り当てないように構成する。これにより、マ
ッチングした結果、識別候補がない場合には速やかに入
力カラー画像に認識対象の画像が存在しないと判定でき
るようになる。
【0051】〈実施例7〉 本実施例7は、実施例1、4において辞書とのマッチン
グを行う際、有効距離の閾値を設定しておき、求めた距
離と閾値との比較を行い、距離が閾値以下ならばその辞
書内の識別対象物を識別候補にするが、閾値より大きい
場合には、識別候補にしないようにする。これにより、
マッチングした結果、識別候補がない場合には入力カラ
ー画像に認識対象の画像が存在しないと判定できるよう
になる。
【0052】〈実施例8〉 本実施例8は、実施例7における前記閾値を各識別対象
物毎に設定し、求めた距離と各識別対象物毎の閾値の比
較を行い、距離が閾値以下ならばその識別対象物を識別
候補にするが、閾値より大きい場合にはその識別対象物
を識別候補にしないようにする。これにより、複数の対
象物を識別する際に、対象物の特性を活かしたマッチン
グ処理が可能になる。より具体的にいえば、ある対象物
kが対象物k以外の原稿jと間違え易い場合には、この
対象物kの閾値を低くすることで、対象物kと原稿jと
を高精度に識別することができ、誤認識を防止すること
が可能となる。
【0053】〈実施例9〉 図10は、本発明の対象物抽出方法に係る実施例9の構
成を示す。図10において、2値画像信号21から黒連
結成分の外接矩形を抽出する矩形抽出部22と、抽出さ
れた矩形データを格納する矩形メモリ23と、予め設定
された閾値と抽出矩形の幅、高さを比較し、抽出すべき
対象物が長方形か否かを判定する候補矩形判定部24
と、候補矩形データを格納する候補矩形メモリ25と、
対象物が回転しているか否かを判定する回転判定部26
と、対象物の短辺、長辺を測定する辺長測定部27と、
短辺、長辺の長さと予め設定された閾値とを比較して対
象物か否かを判定する対象物判定部28と、対象物矩形
データを格納する対象物矩形メモリ29と、全体を制御
する制御部30とから構成されている。
【0054】図11は、本発明の対象物抽出および画像
認識の処理フローチャートである。この処理フローチャ
ートにおいて、本発明の対象物抽出方法に係る処理はス
テップ101からステップ108であり、まず対象物の
抽出方法について、以下説明する。
【0055】入力画像から2値画像を生成し(ステップ
101)、矩形抽出部22は、2値画像から黒連結成分
の外接矩形を抽出する(ステップ102)。矩形抽出方
法としては、例えば本出願人が先に提案した方式(特願
平3−341889、同4−267313、同4−16
0866)などを用いればよい。
【0056】図12は、入力画像201から抽出された
外接矩形202を示す。本発明では、外接矩形202の
4頂点の座標(Xs,Ys)、(Xe,Ye)、(X
s,Ye)、(Xe,Ys)と、黒連結成分(対象物)
203と外接矩形202との接点座標(Xu,Ys)、
(Xe,Yr)、(Xs,Yl)、(Xb,Ye)を同
時に抽出する。
【0057】次いで、候補矩形判定部24では、抽出さ
れた外接矩形の高さ、幅が予め与えられた高さ、幅の範
囲内にあるか否かを判定し(ステップ103)、高さ、
幅の何れかが範囲外であれば、対象物でないと判定する
(ステップ113)。なお、このようなサイズによる対
象物の候補判定方法については、前掲した本出願による
方式を用いればよい。続いて、候補矩形判定部24で
は、抽出すべき対象物が長方形であるか否かをチェック
する(ステップ104)。これは例えば、候補矩形判定
部24内に予め抽出すべき対象物として長方形データが
設定されているものとする。
【0058】対象物が長方形であるものについて、回転
判定部26は、対象物がスキャンラインに対して回転し
ているか否かを判定する(ステップ105)。図13
は、回転の判定を説明する図であり、301は候補矩
形、302は対象物である。この回転判定は、対象物3
02が長方形の場合、三角形AとB、三角形CとDの合
同を判定し、もしどちらか一方でも合同でないと判定さ
れた場合には回転していないと判定する。また、図13
に示すように、長方形の対角線D1,D2の長さ(この
長さは矩形データの座標から計算する)を比較し、その
差が大きければ菱形と判定し、対象物302が回転して
いないと判定する。
【0059】次いで、辺長測定部27では、回転してい
ると判定された長方形について、図13のS1、S2の
長さを計算し(矩形データの座標から計算する)、それ
ぞれを短辺、長辺の長さとする(ステップ106)。一
方、ステップ104で長方形でないと判定されたもの、
ステップ105で回転していないと判定されたものにつ
いては、外接矩形の高さを短辺、幅を長辺の長さとする
(ステップ107)。そして、短辺、長辺の長さが予め
与えられた対象物の短辺、長辺の長さの範囲にあるか否
かを判定し、何れか一方でも範囲外ならば対象物ではな
いと判定し、この条件に合うものを抽出すべき対象物と
判定する(ステップ108)。以下の処理(ステップ1
09以降)については、後述する。
【0060】なお、上記した実施例において、矩形抽出
部22の前に、入力された2値画像に対して例えば8×
8画素を1画素に変換するような画像圧縮部を設け、圧
縮された画像から矩形を抽出するように構成を変更する
ことも可能である。
【0061】〈実施例10〉 本実施例10では、入力画像をカラー画像信号(R,
G,B)とし、以下のような明度(L)を求め、所定の
閾値(Th1)以下の明度を持つ画素を黒とし、閾値
(Th1)より大きい画素を白とするような2値画像を
作成してから、実施例1と同様の処理を行う。
【0062】 L=R+G+B L≦Th1ならば黒画素 L>Th1ならば白画素 本実施例は、対象物以外の部分(背景)が白地の場合に
対象物を抽出するのに有効な方式となる。つまり例え
ば、白紙(あるいは淡い地肌の用紙)に対象物の載せて
スキャナなどで画像を読み取るような場合に有効な方式
となる。
【0063】〈実施例11〉 本実施例11では、入力画像をカラー画像信号(R,
G,B)とし、以下のような明度(L)を求め、所定の
閾値(Th2)以上の明度を持つ画素を黒とし、閾値
(Th2)より小さい画素を白とするような2値画像を
作成してから、実施例1と同様の処理を行う。
【0064】 L=R+G+B L≧Th2ならば黒画素 L<Th2ならば白画素 本実施例は、銀板のような圧板を持つスキャナなどで入
力した時に、対象物以外の部分(背景)が黒地になる場
合に対象物を抽出するのに有効な方式となる。このよう
に、実施例10、11によれば、原稿を押える蓋をした
状態で画像を取り込んでも、また蓋を開けた状態で画像
を取り込んでも何れにも対応できる。なお、上記実施例
における対象物とは、スキャナに載せた原稿全体から抽
出される場合、あるいは原稿中のある特定領域から抽出
される場合の何れでもよい。
【0065】また、上記実施例10、11において、明
度以外に、カラー画像信号(RGB)、色相、彩度など
を対象とすることもできる。さらに、実施例10、11
において、Th1≦L≦Th2ならば黒画素、上記以外
ならば白画素のように、所定範囲内を黒画素としてもよ
い。
【0066】図14は、実施例10、11の構成を示
す。実施例9(図10)と異なる点は、カラー画像信号
(RGB)34から2値画像を生成する2値画像生成部
31が設けられた点と、実施例10で作成された2値画
像を格納するメモリ32と、実施例11で作成された2
値画像を格納するメモリ33が設けられた点である。そ
して、背景が白地の場合にも黒地の場合にも対応できる
ように、実施例10および11をそれぞれ実行し、矩形
抽出部22で外接矩形を抽出する。この抽出された各外
接矩形を外接矩形1、2とすると、候補矩形判定部24
において、これら外接矩形1、2の包含関係を判定し、
例えば外接矩形1が外接矩形2を完全に含むとき、外接
矩形1のみから対象物を抽出する。
【0067】〈実施例12〉 図15は、実施例12の全体構成を示す。図において、
対象物抽出部42がカラー画像信号41から対象物を抽
出して、対象物矩形メモリ43に格納する部分は、前述
した図14に示す構成と全く同一のものである。
【0068】本実施例では、カラー画像信号41をベク
トル量子化するベクトル量子化部44と、ベクトル量子
化値を格納するベクトル量子化値メモリ45と、対象物
抽出部42で抽出された対象物と予め作成された辞書と
のマッチングを行い対象物か否かを判定する対象物認識
部46が設けられている。
【0069】図16は、実施例12の詳細構成を示す。
まず、対象物抽出部51の構成から説明すると、対象物
抽出部51は図14に示す要素から構成され、対象物が
抽出されると、対象物認識部61に対して起動信号53
を出力する。また抽出された対象物のデータが対象物矩
形メモリ52に格納され、対象物認識部61に対して起
動信号53と共に、対象物の範囲データ54が出力され
る。
【0070】ベクトル量子化処理部55は、実施例1で
説明したと同様に、入力されたカラー画像信号(RG
B)から得られたカラー画像を小領域(メッシュ)に分
割するメッシュ分割部56と、小領域内のカラー画像デ
ータから特徴量(色度ヒストグラム)を抽出する特徴量
抽出部57と、作成された色度ヒストグラムと予め作成
してあるコードブック59と比較することによりベクト
ル量子化を行うベクトル量子化部58から構成されてい
る。ベクトル量子化された入力カラー画像はベクトル量
子化値メモリ60に保持される。
【0071】入力カラー画像をベクトル量子化して、処
理対象の小領域のベクトル量子化値(VQ値)を割り当
てて、ベクトル量子化値メモリ60に保持するまでの処
理は、前述した実施例1と同様であるので、その説明を
省略する。
【0072】さて、対象物認識部61のヒストグラム作
成部62では、上記したベクトル量子化値(前述した図
4)からベクトル量子化値のヒストグラムを作成する。
すなわち、入力画像のベクトル量子化値(VQ値)につ
いて、対象物の範囲内にあるVQ値のヒストグラムを作
成する(図11のステップ109)。図17は、対象物
が回転している場合における、対象物の範囲内にあるベ
クトル量子化値のヒストグラム作成を説明する図であ
る。
【0073】前述したように対象物が抽出されると対象
物認識部61の起動時に、対象物抽出部51から対象物
認識部61に対して、対象物の範囲データ54が渡され
るので、図17の対象物のエッジ501の直線データと
ベクトル量子化値メモリ60の座標とを比較して包含関
係を判定し、対象物の範囲内に完全に含まれる小領域
(図17の黒い部分で示す領域)について、ベクトル量
子化値のヒストグラムを作成する。対象物が回転してい
ない場合は、外接矩形の範囲データとベクトル量子化値
メモリの座標とを比較して包含関係を判定し、外接矩形
の範囲内の小領域について、ベクトル量子化値のヒスト
グラムを作成する。
【0074】そして、実施例1の図5で説明したと同様
に、対象物認識部61では、抽出対象物のベクトル量子
化値ヒストグラム13と、辞書のベクトル量子化値ヒス
トグラム14とをマッチング部63でマッチングして距
離(DTk)を算出し、距離(DTk)が最小となる識
別対象(k)を、抽出対象物であると認識し、従って入
力画像中に対象物が存在していると判定する(ステップ
110、111)。
【0075】辞書との照合の結果、マッチングしていな
いときは、入力画像中に対象物がないと判定され(ステ
ップ113)、抽出されたすべての矩形について同様の
処理を行う(ステップ112)が、入力画像中に対象物
が存在していると判定されたときは、未処理の矩形があ
っても処理を終了する。
【0076】本実施例は、入力カラー画像データに対し
て、矩形抽出とベクトル量子化を並列的に行うととも
に、矩形抽出の処理が完了した矩形から順次サイズ判定
を行い、対象物と判定された矩形に対して認識処理して
いるので、リアルタイム処理が可能になる。
【0077】
【発明の効果】以上、説明したように、本発明によれ
ば、以下のような効果が得られる。 (1) 対象物から特徴を抽出後にベクトル量子化してい
るので、認識対象物の情報量が失われることなく、処理
データ量を圧縮することができると共に辞書をコンパク
トに構成することができ、さらに特定画像を精度よく認
識することができる。
【0078】(2)特徴量を圧縮しているので、より一
層処理データ量を圧縮することができる。
【0079】(3)入力画像データから抽出された特徴
量を圧縮処理後にベクトル量子化しているので、カラー
画像認識に必要な情報量を保持しつつ処理データ量が削
減され、処理速度が向上するとともに高精度に画像認識
処理を行うことができる。
【0080】(4)マッチングを行う際に、得られたヒ
ストグラム情報と設定された閾値とを比較する閾値処理
により、マッチング処理の変更を行っているので、画像
認識に必要な処理時間が短縮され、効率的なカラー画像
認識処理を行うことができる。
【0081】(5)辞書とのマッチングを行う際に、算
出された距離と設定された閾値とを比較しているので、
認識精度をより一層向上させることができる。
【0082】(6)矩形対象物の抽出処理を、外接矩形
と黒連結成分との接点情報に基づいて行っているので、
画像中の対象物が存在する部分を高精度に抽出すること
ができる。
【0083】(7)画像中の対象物が回転していても高
精度に抽出することができる。
【0084】(8)背景が白地または黒地の場合でも対
象物を正確に抽出することができ、また白地における外
接矩形と黒地における外接矩形の包含関係を調べている
ので、重複した抽出処理を行う必要がない。
【0085】(9)対象物の抽出処理とカラー画像のベ
クトル量子化処理を並列的に行い、抽出された対象物に
ついて認識処理しているので、カラー画像中の特定画像
を高速かつ高精度に認識することができる。また、カラ
ー画像をベクトル量子化しているので、認識対象物の情
報量が失われることなく、処理データ量を圧縮すること
ができる。
【図面の簡単な説明】
【図1】本発明の実施例1の構成を示す。
【図2】原画像を小領域に分割した図を示す。
【図3】小領域内の色度ヒストグラムを、コードブック
を参照してベクトル量子化する例を示す図である。
【図4】入力画像のベクトル量子化値(VQ値)の例を
示す図である。
【図5】認識時における入力画像のベクトル量子化値ヒ
ストグラムと辞書のベクトル量子化値ヒストグラムとの
マッチングを説明する図である。
【図6】特徴抽出時におけるサンプリング点を示す図で
ある。
【図7】本発明の実施例4の構成を示す。
【図8】小領域内の特徴量を変換圧縮してヒストグラム
を生成する図である。
【図9】入力画像の特徴量ヒストグラムとコードブック
とのマッチングを説明する図である。
【図10】本発明の対象物抽出方法に係る実施例9の構
成を示す。
【図11】本発明の対象物抽出および画像認識の処理フ
ローチャートである。
【図12】入力画像から抽出された外接矩形を示す。
【図13】回転の判定を説明する図である。
【図14】実施例10、11の構成を示す図である。
【図15】実施例12の全体構成を示す図である。
【図16】実施例12の詳細構成を示す図である。
【図17】対象物が回転している場合における、対象物
の範囲内にあるベクトル量子化値のヒストグラム作成を
説明する図である。
【符号の説明】 1 カラー画像信号 2 メッシュ分割部 3 特徴量抽出部 4 特徴量メモリ 5 コードブック 6 ベクトル量子化部 7 ベクトル量子化値メモリ 8 認識部 9 辞書 10 制御部
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 特願平6−52286 (32)優先日 平成6年3月23日(1994.3.23) (33)優先権主張国 日本(JP) (56)参考文献 特開 平7−262373(JP,A) 特開 昭64−12371(JP,A) 特開 昭61−70859(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 - 7/60 G06T 1/00

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力されたカラー画像信号を複数の領域
    に分割し、該分割された領域内のカラー画像から特徴量
    を抽出し、該抽出された特徴量を圧縮してヒストグラム
    を生成し、該ヒストグラムを予め作成されたコードブッ
    クと比較することによりベクトル量子化し、前記カラー
    画像のベクトル量子化された値と識別対象物の辞書とを
    照合することにより、前記カラー画像を認識処理する
    ラー画像認識方法であって、前記ヒストグラムの情報を
    基に、前記コードブックとの比較処理を変更制御するこ
    とを特徴とするカラー画像認識方法。
  2. 【請求項2】 前記ヒストグラムの度数または度数分布
    幅が所定の値を超えたとき、所定のベクトル量子化値を
    与えることを特徴とする請求項記載のカラー画像認識
    方法。
  3. 【請求項3】 前記ヒストグラムの度数または度数分布
    幅が所定の値を超えたとき、前記コードブックとの比較
    処理を行わないことを特徴とする請求項記載のカラー
    画像認識方法。
  4. 【請求項4】 前記ヒストグラムとコードブックとの比
    較の結果、比較した距離が所定の値より大きいときベク
    トル量子化しないことを特徴とする請求項記載のカラ
    ー画像認識方法。
  5. 【請求項5】 入力されたカラー画像信号を複数の領域
    に分割する手段と、該分割された領域内のカラー画像か
    ら特徴量を抽出する手段と、該抽出された特徴量を圧縮
    してヒストグラムを生成する手段と、該ヒストグラムを
    予め作成されたコードブックと比較することによりベク
    トル量子化する手段と、前記カラー画像のベクトル量子
    化された値と識別対象物の辞書とを照合することによ
    り、前記カラー画像を認識処理する手段とを備えたカラ
    ー画像認識装置であって、前記ヒストグラムの情報を基
    に、前記コードブックとの比較処理を変更制御すること
    を特徴とするカラー画像認識装置。
  6. 【請求項6】 入力カラー画像信号を複数の領域に分割
    し、該分割された領域内のカラー画像から特徴量を抽出
    し、該抽出された特徴量を、予め作成されたコードブッ
    クと比較することによりベクトル量子化し、前記カラー
    画像のベクトル量子化された値を生成し、前記入力カラ
    ー画像信号から抽出された所定形状の対象物の範囲に相
    当する該ベクトル量子化値を参照して該ベクトル量子化
    値のヒストグラムを作成し、該作成された対象物のヒス
    トグラムと辞書とを照合することにより、前記対象物を
    認識処理することを特徴とするカラー画像認識方法。
  7. 【請求項7】 入力カラー画像信号を複数の領域に分割
    する手段と、該分割された領域内のカラー画像から特徴
    量を抽出する手段と、該抽出された特徴量を、予め作成
    されたコードブックと比較することによりベクトル量子
    化する手段と、前記カラー画像のベクトル量子化された
    値を生成する手段と、前記入力カラー画像信号から抽出
    された所定形状の対象物の範囲に相当する該ベクトル量
    子化値を参照して該ベクトル量子化値のヒストグラムを
    作成する手段と、該作成された対象物のヒストグラムと
    辞書とを照合することにより、前記対象物を認識処理す
    る手段とを備えたことを特徴とするカラー画像認識装
    置。
JP20167594A 1993-12-10 1994-08-26 カラー画像認識方法および装置 Expired - Lifetime JP3496893B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20167594A JP3496893B2 (ja) 1993-12-10 1994-08-26 カラー画像認識方法および装置

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP31069693 1993-12-10
JP5-310694 1993-12-10
JP31069493 1993-12-10
JP5-310696 1993-12-10
JP1859194 1994-02-15
JP6-18591 1994-02-15
JP6-52286 1994-03-23
JP5228694 1994-03-23
JP20167594A JP3496893B2 (ja) 1993-12-10 1994-08-26 カラー画像認識方法および装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003198874A Division JP2004005715A (ja) 1993-12-10 2003-07-18 カラー画像認識方法および装置

Publications (2)

Publication Number Publication Date
JPH07311848A JPH07311848A (ja) 1995-11-28
JP3496893B2 true JP3496893B2 (ja) 2004-02-16

Family

ID=27520045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20167594A Expired - Lifetime JP3496893B2 (ja) 1993-12-10 1994-08-26 カラー画像認識方法および装置

Country Status (1)

Country Link
JP (1) JP3496893B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7257268B2 (en) * 2003-02-28 2007-08-14 Aperio Technologies, Inc. Systems and methods for image pattern recognition
KR100920918B1 (ko) * 2008-12-29 2009-10-12 주식회사 넥스파시스템 Cb물체감지 알고리즘을 이용한 물체추적시스템 및 그 시스템을 사용한 물체추적방법

Also Published As

Publication number Publication date
JPH07311848A (ja) 1995-11-28

Similar Documents

Publication Publication Date Title
US6181820B1 (en) Image extraction method and apparatus and image recognition method and apparatus for extracting/recognizing specific images from input image signals
US6307962B1 (en) Document data compression system which automatically segments documents and generates compressed smart documents therefrom
JP3373008B2 (ja) 画像像域分離装置
US6373981B1 (en) Method and apparatus for segmenting data to create mixed raster content planes
US7542615B2 (en) Image area extraction method, image reconstruction method using the extraction result and apparatus thereof
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
JP3353968B2 (ja) 画像処理装置
US20010053248A1 (en) Image processing apparatus and method and medium
JP2000175051A (ja) デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法
US20060170979A1 (en) Method and apparatus for applying edge enhancement based on image characteristics
JP4458429B2 (ja) カラー画像認識方法および装置
KR20220088832A (ko) 인감스캐너를 이용한 인감대사 지원 방법
EP1457927A2 (en) Device and method for detecting blurring of image
JP3496893B2 (ja) カラー画像認識方法および装置
US6487311B1 (en) OCR-based image compression
JP4217969B2 (ja) 画像処理装置及びプログラム
JPH06164939A (ja) 画像信号の符号化装置
JP2004005715A (ja) カラー画像認識方法および装置
JPH07160886A (ja) 対象物抽出方法およびカラー画像認識方法
EP0715274B1 (en) An optical character recognition apparatus and a method for selecting an operational mode thereof
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JPH09204525A (ja) 画像像域分離装置及びその方法
JP3030126B2 (ja) 画像処理方法
JPH07262373A (ja) カラー画像認識方法
JPH06350861A (ja) 画像種別の自動判別方法及び装置並びにその判別用の閾値の決定方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071128

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081128

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081128

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091128

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101128

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131128

Year of fee payment: 10

EXPY Cancellation because of completion of term