JPH07311848A - カラー画像認識方法および対象物抽出方法 - Google Patents
カラー画像認識方法および対象物抽出方法Info
- Publication number
- JPH07311848A JPH07311848A JP6201675A JP20167594A JPH07311848A JP H07311848 A JPH07311848 A JP H07311848A JP 6201675 A JP6201675 A JP 6201675A JP 20167594 A JP20167594 A JP 20167594A JP H07311848 A JPH07311848 A JP H07311848A
- Authority
- JP
- Japan
- Prior art keywords
- color image
- extracted
- histogram
- vector
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
Abstract
圧縮して認識する。 【構成】 メッシュ分割部2は、入力カラー画像信号1
を小領域(メッシュ)に分割する。特徴量抽出部3は、
分割された小領域毎に、入力カラー画像信号RGBの特
徴量(色度ヒストグラム)を抽出し、特徴量メモリ4に
格納する。ベクトル量子化部6では、特徴量メモリ4の
色度ヒストグラムと、コードブック5との距離を算出
し、その距離が最小であるコードブックのコードを、そ
の小領域のベクトル量子化値(VQ値)としてベクトル
量子化値メモリ7に保持する。認識部8では、入力画像
のベクトル量子化値ヒストグラムと、辞書のベクトル量
子化値ヒストグラムとの距離を算出し、入力カラー画像
が識別対象物であるか否かを判定する。
Description
画像から特定画像を抽出して認識するカラー画像認識方
法および対象物抽出方法に関する。
ー複写機、カラープリンタ、カラースキャナ、カラー画
像通信機器などは、今後ますます増加するものと予想さ
れる。カラー画像は、ハードウェアの進歩、特にメモリ
の低価格化および大容量化、通信コストの低下などによ
り、以前に比べて利用しやすくなってきたものの、カラ
ー画像データはそのデータ量が膨大(例えば、A3サイ
ズで96Mバイト)であるため、2値画像と同じような
処理ができないのが現状である。
など)などの複雑な処理を要する技術においては、処理
量が膨大になり、カラー画像における画像認識は実現が
より困難である。
像を識別する方法として、例えば、画像を構成する各絵
柄部分は固有の色空間上での分布を持っているので、各
絵柄部分に現われる固有の色空間上での分布を特定し、
この特定された特徴と同一の特徴を有する画像部分を抽
出する方法がある(特開平4−180348号公報を参
照)。しかし、この方法では、色空間中での拡がりが同
じ画像については、その内部での色の分布が異なってい
ても識別することができず、つまり色空間の拡がりが同
じであれば、拡がりの中での色の分布が異なる画像をも
特定の画像として誤検出する可能性がある。
方法として種々の方法が提案されているが、例えば画像
から黒連結の矩形を抽出し、予め設定された閾値と比較
することにより、文字の矩形と線図形の矩形とを判定す
る画像抽出方法がある(特開昭55−162177号公
報を参照)。この方法は、抽出された線図形をさらに詳
細に水平罫線、垂直罫線、表、囲み枠などのように識別
するものではなく、また回転した対象物の抽出に対応で
きない。
処理を行う際に、画像認識に必要な情報量を確保しつ
つ、データ量を圧縮して対象物を高精度に認識するカラ
ー画像認識方法を提供することにある。
処理を行う際に、画像認識に必要な情報量を確保しつ
つ、データ量をテーブル変換によって変換圧縮すること
により、効率的にデータ圧縮を行い、対象物を高精度か
つ高速に認識するカラー画像認識方法を提供することに
ある。
ラー画像が裏写りした場合の影響を抑制して、認識対象
とされる画像情報のみにベクトル量子化を施すことによ
り、認識率と処理速度を向上させたカラー画像認識方法
を提供することにある。
距離が所定の閾値より大きい場合に、ベクトル量子化値
を割り当てないことにより、認識精度と処理速度を向上
させたカラー画像認識方法を提供することにある。
象物の画像領域を高精度に抽出する対象物抽出方法を提
供することにある。
に対して、カラー画像の認識処理を行う際に、画像認識
に必要な情報量を確保しつつ、データ量を圧縮して対象
物を高精度に認識するカラー画像認識方法を提供するこ
とにある。
めに、請求項1記載の発明では、入力されたカラー画像
信号を複数の領域に分割し、該分割された領域内のカラ
ー画像から特徴量を抽出し、該抽出された特徴量を予め
作成されたコードブックと比較することによりベクトル
量子化し、前記カラー画像のベクトル量子化された値と
識別対象物の辞書とを照合することにより、前記カラー
画像を認識処理することを特徴としている。
から選択した画素を用いて特徴量を求めることを特徴と
している。
特徴量を所定の変換式により変換圧縮した後に、前記コ
ードブックと比較することを特徴としている。
ー画像信号を複数の領域に分割し、該分割された領域内
のカラー画像から特徴量を抽出し、該抽出された特徴量
を圧縮してヒストグラムを生成し、該ヒストグラムを予
め作成されたコードブックと比較することによりベクト
ル量子化し、前記カラー画像のベクトル量子化された値
と識別対象物の辞書とを照合することにより、前記カラ
ー画像を認識処理することを特徴としている。
ムの情報を基に、前記コードブックとの比較処理を変更
制御することを特徴としている。
ムの度数または度数分布幅が所定の値を超えたとき、所
定のベクトル量子化値を与えることを特徴としている。
ムの度数または度数分布幅が所定の値を超えたとき、前
記コードブックとの比較処理を行わないことを特徴とし
ている。
ムとコードブックとの比較の結果、比較した距離が所定
の値より大きいときベクトル量子化しないことを特徴と
している。
クトル量子化された値と識別対象物の辞書との距離を計
算し、該距離と所定の閾値との比較結果に基づいて前記
カラー画像中に識別対象物が含まれているか否かを認識
することを特徴としている。
値を識別すべき対象物毎に設定し、識別対象物の特性に
合わせた認識処理を行うことを特徴としている。
中から所定形状の対象物を抽出する対象物抽出方法にお
いて、該入力された2値画像信号から黒連結成分の外接
矩形を抽出し、該抽出された外接矩形と黒連結成分との
接点情報に基づいて、前記対象物を抽出することを特徴
としている。
る対象物は、所定の辺長を有する矩形であることを特徴
としている。
る対象物は、スキャンラインに対して傾いている対象物
を含むことを特徴としている。
信号がカラー画像信号であるとき、該カラー画像信号か
ら明度を求め、該明度と複数の閾値とを比較することに
より複数の2値画像を生成し、該複数の2値画像からそ
れぞれ前記外接矩形を抽出することを特徴としている。
る第1の外接矩形と、第2の外接矩形との包含関係を調
べ、一方の外接矩形が他方の外接矩形を含むとき、一方
の外接矩形と黒連結成分との接点情報に基づいて、前記
対象物を抽出することを特徴としている。
像信号から特定画像を認識する処理と、該入力カラー画
像信号から所定形状の対象物を抽出する処理を並列に実
行し、該対象物の抽出結果に応じて、該対象物について
認識処理することを特徴としている。
像信号を複数の領域に分割し、該分割された領域内のカ
ラー画像から特徴量を抽出し、該抽出された特徴量を、
予め作成されたコードブックと比較することによりベク
トル量子化し、前記カラー画像のベクトル量子化された
値を生成し、前記入力カラー画像信号から抽出された所
定形状の対象物の範囲に相当する該ベクトル量子化値を
参照して該ベクトル量子化値のヒストグラムを作成し、
該作成された対象物のヒストグラムと辞書とを照合する
ことにより、前記対象物を認識処理することを特徴とし
ている。
像信号RGBはメッシュ分割部で小領域(メッシュ)に
分割される。特徴量抽出部では、分割された小領域毎
に、入力カラー画像信号RGBの色度ヒストグラムを作
成して、特徴量メモリに格納する。識別対象物の色度ヒ
ストグラムを予め作成して、コードブックに格納してお
く。そして、ベクトル量子化部では、特徴量メモリの色
度ヒストグラムと、コードブックとの距離を算出し、そ
の距離が最小であるコードブックのコードを、その小領
域のベクトル量子化値としてベクトル量子化値メモリに
保持する。辞書には、識別対象物について予めベクトル
量子化値ヒストグラムを求めて格納しておく。認識部で
は、入力画像のベクトル量子化値ヒストグラムと、辞書
のベクトル量子化値ヒストグラムとの距離を算出し、入
力カラー画像が識別対象であるか否かを判定する。これ
により、データ量を圧縮できるとともに、高精度に対象
物を認識することが可能となる。
的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
図1において、入力されたカラー画像信号(RGB)1
から得られたカラー画像を小領域(メッシュ)に分割す
るメッシュ分割部2と、小領域内のカラー画像データか
ら特徴量を抽出する特徴量抽出部3と、抽出した特徴量
を格納する特徴量メモリ4と、抽出した特徴量を予め作
成してあるコードブック5と比較することによりベクト
ル量子化を行うベクトル量子化部6と、ベクトル量子化
値を保持するベクトル量子化値メモリ7と、該メモリと
識別対象物の辞書9とを照合して認識処理を行う認識部
8と、メモリ管理やマッチング処理の距離計算などの全
体の画像認識処理における各段階の制御を行う制御部1
0とから構成されている。
た小領域(メッシュ)に分割する。分割された小領域
(メッシュ)毎に、入力カラー画像信号RGBの特徴量
を抽出する。本実施例では、その特徴量として色度ヒス
トグラムを用いる。すなわち、特徴量抽出部3では、入
力カラー画像信号RGBを以下に示す色度Pr、Pgに
変換し、予め定められた小領域(メッシュ)毎に色度P
r、Pgの値のヒストグラムを作成し、特徴量メモリ4
に格納する。このように、色度変換されたカラー画像
は、色合い情報だけを持つので、照明むらが除去されて
対象物を抽出する場合などに有効となる。
割した図を示し、この例では、小領域は64画素×64
画素のサイズである。
像信号である。なお、Pr、Pgを256倍しているの
はPr、Pgも8ビットで表現するためである。
トグラムを特徴量としたが、本発明はこれに限定される
ものではなく、bの色度ヒストグラムを用いてもよい
し、色度の他に、カラー画像信号(RGB)、色相、彩
度などの特徴量を用いることができる。
コードブックを参照してベクトル量子化する例を示す図
である。
格納された小領域内の色度ヒストグラム(Hi)を示
す。i=0〜255の次元におけるH(i)はPrを表
し、i=256〜511の次元におけるH(i)はPg
を表す。また、12は、予め作成されたコードブック
(C0、C1、C2...)の内容を示す。
いは一般の原稿を多数入力し、同様の条件で色度ヒスト
グラムのデータを大量に作成し、これらをクラスタリン
グすることで代表的な色度ヒストグラム(コードブッ
ク)を求めて作成する。
グラム(Hi)11と、コードブックの内容12とをマ
ッチングして距離(DCj)を算出し、その距離(一般
には、ユークリッド距離の2乗として定義された2乗ひ
ずみ測度)が最小であるコードブックのコード(Cj)
を、その小領域のベクトル量子化値(VQ値)としてベ
クトル量子化値メモリ7に保持する。
Q値)の例を示す。各桝目は、前述した一つの小領域に
対応し、各桝目内の数値はベクトル量子化値(VQ値)
である。そして、これらのベクトル量子化値(VQ値)
についてヒストグラムを作成する。
クトル量子化値のヒストグラムと辞書のベクトル量子化
値のヒストグラムとのマッチングを説明する図である。
図において13は、作成されたベクトル量子化値のヒス
トグラム例を示す。また、14は、識別対象物の辞書内
容を示し、入力画像と同様に、ベクトル量子化値ヒスト
グラムで表現されて予め作成されている。図の場合は、
例えば、識別対象物A,B,C..(コードブック数が
64)のベクトル量子化値ヒストグラムが格納されてい
る。
値ヒストグラム13と、辞書のベクトル量子化値ヒスト
グラム14とマッチングして距離(DTk)を算出し、
距離(DTk)が最小となる識別対象(k)を、認識対
象のカラー画像と判定する。
ル量子化してから辞書と照合しているので、従来技術で
ある特開平4−180348号公報における問題点が解
決される。
を用いて色度ヒストグラムを作成しているが、これでは
処理量が膨大になる。そこで、実施例2では、図6に示
すように、色度ヒストグラムを求める画素をM画素間隔
で間引いて行う。間引きの方法としては、例えば8画素
間隔でサンプルして色度を求める画素を選択する方法を
採る。また、M画素間隔で間引くとき、周囲の画素の画
素値の平均を求め、この値を該間引き画素値としてもよ
い(この処理によって雑音が軽減される)。
トグラム作成時に、r、g各8ビットでヒストグラムを
作成すると、512次元の特徴量になり、メモリ容量も
増大し、マッチング処理にも時間がかかる。
な変換を行って、特徴量次元を64次元に圧縮してから
前述したと同様の処理を行う。
この実施例4の構成は、図1の構成に変換圧縮テーブル
15を付加して、データ量をテーブル変換によって変換
圧縮する。つまり本実施例4は、実施例3のように変換
式による演算処理を行うことなく効率的にデータ圧縮す
るものである。変換圧縮テーブル15は、後述するよう
に、特徴量抽出部3によって抽出された特徴量を変換圧
縮する。また、特徴量メモリ4は圧縮された特徴量を保
持し、ベクトル量子化部6は圧縮された特徴量を予め作
成してあるコードブック5と比較することによりベクト
ル量子化を行う点が、図1の構成と若干異なる。他の構
成要素は図1で説明したものと同様であるので説明を省
略する。
は、図2に示すように小領域(メッシュ)に分割され、
小領域毎に入力カラー画像信号の特徴量が抽出される。
本実施例では、特徴量として入力カラー画像信号RGB
の色度信号を用いる。すなわち、特徴量抽出部3では、
小領域(メッシュ)毎に入力カラー画像信号のRGBの
色度信号を抽出して、変換圧縮テーブル15を参照する
ことによって、特徴量を変換圧縮し、圧縮されたRGB
の色度信号毎に小領域(メッシュ)内の色度ヒストグラ
ムを作成して、特徴量メモリ4に結果を格納する。
ヒストグラムを生成する図である。変換圧縮テーブル1
5は、入力される各色度信号を変換特性に従って変換出
力する。例えば、入力信号の値が255であるとき、そ
の出力値が15として変換圧縮処理される。このように
圧縮された特徴量のヒストグラムは特徴量メモリ4に生
成される。このように、特徴量の変換圧縮によってメモ
リ容量の増加が抑制され、マッチング処理が高速化され
る。
G、B)は、変換圧縮テーブル15によってR’、
G’、B’に変換圧縮されて出力される。この例では、
R’、G’、B’はそれぞれ0から15の値をとる。そ
して、G’に16を加算し、B’に32を加算して、0
から47の次元(図の横軸)で色度ヒストグラムH
(i)16を作成する。すなわち、小領域内の色度ヒス
トグラムH(i)16において、次元i=0〜15のH
(i)は圧縮変換されたR信号つまりR’信号の度数を
表し、次元i=16〜31のH(i)は圧縮変換された
G信号つまりG’信号の度数を表し、次元i=32〜4
7のH(i)は圧縮変換されたB信号つまりB’信号の
度数を表している。
ヒストグラムの次元の総数(この例では48次元)は、
変換圧縮テーブルによる圧縮の度合いに応じて決定され
るもので、適宜変更可能である。また、入力カラー画像
信号のRGBの色度信号からヒストグラムを作成してい
るが、本発明はこれに限定されるものではなく、入力カ
ラー画像信号を変換処理したYMC信号やLab信号を
特徴量として、変換圧縮処理とヒストグラム生成処理を
行うようにしてもよい。
コードブックを参照してベクトル量子化する例を示す図
であり、17は、特徴量メモリ4に格納された小領域内
の色度ヒストグラム(Hi)を示し、18は、予め作成
されたコードブック5(C0、C1、C2...)の内
容を示す。前述した図3と異なる点は、ヒストグラムの
次元数が圧縮されている点である。
るいは一般の原稿を多数入力し、同様の条件で色度ヒス
トグラムのデータを大量に作成し、これらをクラスタリ
ングすることで代表的な色度ヒストグラム(コードブッ
ク)を求めて作成する。
域の色度ヒストグラム(Hi)17と、コードブックの
内容18とをマッチングして距離(DCj)を算出し、
その距離(一般には、ユークリッド距離の2乗として定
義された2乗ひずみ測度)が最小であるコードブックの
コード(Cj)を、その小領域のベクトル量子化値(V
Q値)として割り当て、ベクトル量子化値メモリ7に保
持する。
例は、実施例1で説明した図4の場合と同様であり、ベ
クトル量子化値メモリ7には各小領域のベクトル量子化
値(VQ値)が保持されていて、入力画像のベクトル量
子化値(VQ値)についてヒストグラムが作成される。
そして、実施例1の図5で説明したと同様にして識別対
象物の辞書が構成され、認識部8では、入力画像のベク
トル量子化値ヒストグラム13と、辞書のベクトル量子
化値ヒストグラム14とマッチングして距離(DTk)
を算出し、距離(DTk)が最小となる識別対象(k)
を、認識対象のカラー画像と判定する。
画像の全ての画素に対して特徴量のヒストグラムを作成
してコードブックとの比較処理を行っている。本実施例
5は、小領域毎に生成された特徴量のヒストグラム情報
に基づいてコードブックとの比較処理を変更して、画像
認識に必要のない地肌部(背景部)やノイズ画像の認識
処理を制御するもので、これにより認識率と処理速度の
向上を図る。
景部)は、小領域内の濃度がほぼ一定であることから、
小領域毎に生成された特徴量のヒストグラムの度数は特
定部分に集中していて、度数分布の幅は狭く度数の最大
値が大きくなる傾向にある。そこで、本実施例では、ヒ
ストグラムの度数の最大値が予め設定した閾値を超えた
場合に、濃度が一様な画像のベタ部領域であると判定し
て、ベクトル量子化値に0を割り当て、認識対象とされ
る画像情報のみにベクトル量子化を施す。他の実施態様
としては、ヒストグラムの度数が予め設定した閾値を超
えた場合にコードブックとの比較処理を行わないように
構成してもよい。
られる画像のハイライト部においては、原稿用紙の裏側
の画像が裏写りする場合がある。このような裏写りによ
る画像ノイズを除く、ハイライト部の画像データの特徴
量は、多くの場合一様であることから、その特徴量のヒ
ストグラムは特定部分に集中して大きなピークを持ち、
また度数の最大値が大きくなり、度数の分布の幅が狭く
なる傾向にある。そこで、本実施例では、ヒストグラム
の度数分布の情報が、予め設定したヒストグラム特性を
備えていると判定された場合には、小領域の特徴量ヒス
トグラムから予め設定したヒストグラム特性を除去して
コードブックとの比較を行って、ベクトル量子化値を割
り当てる。これにより、画像ノイズによる影響が抑止さ
れ、認識対象とされる画像情報のみにベクトル量子化が
施される。
ム情報として、度数の最大値と度数の分布幅を採用して
いるが、これに限定されるものではなく、認識対象とす
る画像の特徴量ヒストグラムの特性を分析して設定され
るヒストグラム情報であればよい。
ードブックは、認識対象画像を多数入力し、同様の条件
で色度ヒストグラムのデータを大量に作成し、これらを
クラスタリングすることによって作成しているので、入
力画像が認識対象の画像以外の場合には、どのコードブ
ックからも距離が離れる場合がある。
ックと比較してベクトル量子化値を割り当てる際に、比
較した距離が所定の閾値よりも大きいとき、ベクトル量
子化値を割り当てないように構成する。これにより、マ
ッチングした結果、識別候補がない場合には速やかに入
力カラー画像に認識対象の画像が存在しないと判定でき
るようになる。
において辞書とのマッチングを行う際、有効距離の閾値
を設定しておき、求めた距離と閾値との比較を行い、距
離が閾値以下ならばその辞書内の識別対象物を識別候補
にするが、閾値より大きい場合には、識別候補にしない
ようにする。これにより、マッチングした結果、識別候
補がない場合には入力カラー画像に認識対象の画像が存
在しないと判定できるようになる。
ける前記閾値を各識別対象物毎に設定し、求めた距離と
各識別対象物毎の閾値の比較を行い、距離が閾値以下な
らばその識別対象物を識別候補にするが、閾値より大き
い場合にはその識別対象物を識別候補にしないようにす
る。これにより、複数の対象物を識別する際に、対象物
の特性を活かしたマッチング処理が可能になる。より具
体的にいえば、ある対象物kが対象物k以外の原稿jと
間違え易い場合には、この対象物kの閾値を低くするこ
とで、対象物kと原稿jとを高精度に識別することがで
き、誤認識を防止することが可能となる。
出方法に係る実施例9の構成を示す。図10において、
2値画像信号21から黒連結成分の外接矩形を抽出する
矩形抽出部22と、抽出された矩形データを格納する矩
形メモリ23と、予め設定された閾値と抽出矩形の幅、
高さを比較し、抽出すべき対象物が長方形か否かを判定
する候補矩形判定部24と、候補矩形データを格納する
候補矩形メモリ25と、対象物が回転しているか否かを
判定する回転判定部26と、対象物の短辺、長辺を測定
する辺長測定部27と、短辺、長辺の長さと予め設定さ
れた閾値とを比較して対象物か否かを判定する対象物判
定部28と、対象物矩形データを格納する対象物矩形メ
モリ29と、全体を制御する制御部30とから構成され
ている。
認識の処理フローチャートである。この処理フローチャ
ートにおいて、本発明の対象物抽出方法に係る処理はス
テップ101からステップ108であり、まず対象物の
抽出方法について、以下説明する。
101)、矩形抽出部22は、2値画像から黒連結成分
の外接矩形を抽出する(ステップ102)。矩形抽出方
法としては、例えば本出願人が先に提案した方式(特願
平3−341889、同4−267313、同4−16
0866)などを用いればよい。
外接矩形202を示す。本発明では、外接矩形202の
4頂点の座標(Xs,Ys)、(Xe,Ye)、(X
s,Ye)、(Xe,Ys)と、黒連結成分(対象物)
203と外接矩形202との接点座標(Xu,Ys)、
(Xe,Yr)、(Xs,Yl)、(Xb,Ye)を同
時に抽出する。
れた外接矩形の高さ、幅が予め与えられた高さ、幅の範
囲内にあるか否かを判定し(ステップ103)、高さ、
幅の何れかが範囲外であれば、対象物でないと判定する
(ステップ113)。なお、このようなサイズによる対
象物の候補判定方法については、前掲した本出願による
方式を用いればよい。続いて、候補矩形判定部24で
は、抽出すべき対象物が長方形であるか否かをチェック
する(ステップ104)。これは例えば、候補矩形判定
部24内に予め抽出すべき対象物として長方形データが
設定されているものとする。
判定部26は、対象物がスキャンラインに対して回転し
ているか否かを判定する(ステップ105)。図13
は、回転の判定を説明する図であり、301は候補矩
形、302は対象物である。この回転判定は、対象物3
02が長方形の場合、三角形AとB、三角形CとDの合
同を判定し、もしどちらか一方でも合同でないと判定さ
れた場合には回転していないと判定する。また、図13
に示すように、長方形の対角線D1,D2の長さ(この
長さは矩形データの座標から計算する)を比較し、その
差が大きければ菱形と判定し、対象物302が回転して
いないと判定する。
ると判定された長方形について、図13のS1、S2の
長さを計算し(矩形データの座標から計算する)、それ
ぞれを短辺、長辺の長さとする(ステップ106)。一
方、ステップ104で長方形でないと判定されたもの、
ステップ105で回転していないと判定されたものにつ
いては、外接矩形の高さを短辺、幅を長辺の長さとする
(ステップ107)。そして、短辺、長辺の長さが予め
与えられた対象物の短辺、長辺の長さの範囲にあるか否
かを判定し、何れか一方でも範囲外ならば対象物ではな
いと判定し、この条件に合うものを抽出すべき対象物と
判定する(ステップ108)。以下の処理(ステップ1
09以降)については、後述する。
部22の前に、入力された2値画像に対して例えば8×
8画素を1画素に変換するような画像圧縮部を設け、圧
縮された画像から矩形を抽出するように構成を変更する
ことも可能である。
像をカラー画像信号(R,G,B)とし、以下のような
明度(L)を求め、所定の閾値(Th1)以下の明度を
持つ画素を黒とし、閾値(Th1)より大きい画素を白
とするような2値画像を作成してから、実施例1と同様
の処理を行う。
対象物を抽出するのに有効な方式となる。つまり例え
ば、白紙(あるいは淡い地肌の用紙)に対象物の載せて
スキャナなどで画像を読み取るような場合に有効な方式
となる。
像をカラー画像信号(R,G,B)とし、以下のような
明度(L)を求め、所定の閾値(Th2)以上の明度を
持つ画素を黒とし、閾値(Th2)より小さい画素を白
とするような2値画像を作成してから、実施例1と同様
の処理を行う。
力した時に、対象物以外の部分(背景)が黒地になる場
合に対象物を抽出するのに有効な方式となる。このよう
に、実施例10、11によれば、原稿を押える蓋をした
状態で画像を取り込んでも、また蓋を開けた状態で画像
を取り込んでも何れにも対応できる。なお、上記実施例
における対象物とは、スキャナに載せた原稿全体から抽
出される場合、あるいは原稿中のある特定領域から抽出
される場合の何れでもよい。
度以外に、カラー画像信号(RGB)、色相、彩度など
を対象とすることもできる。さらに、実施例10、11
において、Th1≦L≦Th2ならば黒画素、上記以外
ならば白画素のように、所定範囲内を黒画素としてもよ
い。
す。実施例9(図10)と異なる点は、カラー画像信号
(RGB)34から2値画像を生成する2値画像生成部
31が設けられた点と、実施例10で作成された2値画
像を格納するメモリ32と、実施例11で作成された2
値画像を格納するメモリ33が設けられた点である。そ
して、背景が白地の場合にも黒地の場合にも対応できる
ように、実施例10および11をそれぞれ実行し、矩形
抽出部22で外接矩形を抽出する。この抽出された各外
接矩形を外接矩形1、2とすると、候補矩形判定部24
において、これら外接矩形1、2の包含関係を判定し、
例えば外接矩形1が外接矩形2を完全に含むとき、外接
矩形1のみから対象物を抽出する。
体構成を示す。図において、対象物抽出部42がカラー
画像信号41から対象物を抽出して、対象物矩形メモリ
43に格納する部分は、前述した図14に示す構成と全
く同一のものである。
トル量子化するベクトル量子化部44と、ベクトル量子
化値を格納するベクトル量子化値メモリ45と、対象物
抽出部42で抽出された対象物と予め作成された辞書と
のマッチングを行い対象物か否かを判定する対象物認識
部46が設けられている。
まず、対象物抽出部51の構成から説明すると、対象物
抽出部51は図14に示す要素から構成され、対象物が
抽出されると、対象物認識部61に対して起動信号53
を出力する。また抽出された対象物のデータが対象物矩
形メモリ52に格納され、対象物認識部61に対して起
動信号53と共に、対象物の範囲データ54が出力され
る。
説明したと同様に、入力されたカラー画像信号(RG
B)から得られたカラー画像を小領域(メッシュ)に分
割するメッシュ分割部56と、小領域内のカラー画像デ
ータから特徴量(色度ヒストグラム)を抽出する特徴量
抽出部57と、作成された色度ヒストグラムと予め作成
してあるコードブック59と比較することによりベクト
ル量子化を行うベクトル量子化部58から構成されてい
る。ベクトル量子化された入力カラー画像はベクトル量
子化値メモリ60に保持される。
理対象の小領域のベクトル量子化値(VQ値)を割り当
てて、ベクトル量子化値メモリ60に保持するまでの処
理は、前述した実施例1と同様であるので、その説明を
省略する。
成部62では、上記したベクトル量子化値(前述した図
4)からベクトル量子化値のヒストグラムを作成する。
すなわち、入力画像のベクトル量子化値(VQ値)につ
いて、対象物の範囲内にあるVQ値のヒストグラムを作
成する(図11のステップ109)。図17は、対象物
が回転している場合における、対象物の範囲内にあるベ
クトル量子化値のヒストグラム作成を説明する図であ
る。
物認識部61の起動時に、対象物抽出部51から対象物
認識部61に対して、対象物の範囲データ54が渡され
るので、図17の対象物のエッジ501の直線データと
ベクトル量子化値メモリ60の座標とを比較して包含関
係を判定し、対象物の範囲内に完全に含まれる小領域
(図17の黒い部分で示す領域)について、ベクトル量
子化値のヒストグラムを作成する。対象物が回転してい
ない場合は、外接矩形の範囲データとベクトル量子化値
メモリの座標とを比較して包含関係を判定し、外接矩形
の範囲内の小領域について、ベクトル量子化値のヒスト
グラムを作成する。
に、対象物認識部61では、抽出対象物のベクトル量子
化値ヒストグラム13と、辞書のベクトル量子化値ヒス
トグラム14とをマッチング部63でマッチングして距
離(DTk)を算出し、距離(DTk)が最小となる識
別対象(k)を、抽出対象物であると認識し、従って入
力画像中に対象物が存在していると判定する(ステップ
110、111)。
いときは、入力画像中に対象物がないと判定され(ステ
ップ113)、抽出されたすべての矩形について同様の
処理を行う(ステップ112)が、入力画像中に対象物
が存在していると判定されたときは、未処理の矩形があ
っても処理を終了する。
て、矩形抽出とベクトル量子化を並列的に行うととも
に、矩形抽出の処理が完了した矩形から順次サイズ判定
を行い、対象物と判定された矩形に対して認識処理して
いるので、リアルタイム処理が可能になる。
発明によれば、対象物から特徴を抽出後にベクトル量子
化しているので、認識対象物の情報量が失われることな
く、処理データ量を圧縮することができると共に辞書を
コンパクトに構成することができ、さらに特定画像を精
度よく認識することができる。
を圧縮しているので、より一層処理データ量を圧縮する
ことができる。
ータから抽出された特徴量を圧縮処理後にベクトル量子
化しているので、カラー画像認識に必要な情報量を保持
しつつ処理データ量が削減され、処理速度が向上すると
ともに高精度に画像認識処理を行うことができる。
ッチングを行う際に、得られたヒストグラム情報と設定
された閾値とを比較する閾値処理により、マッチング処
理の変更を行っているので、画像認識に必要な処理時間
が短縮され、効率的なカラー画像認識処理を行うことが
できる。
とのマッチングを行う際に、算出された距離と設定され
た閾値とを比較しているので、認識精度をより一層向上
させることができる。
形対象物の抽出処理を、外接矩形と黒連結成分との接点
情報に基づいて行っているので、画像中の対象物が存在
する部分を高精度に抽出することができる。
対象物が回転していても高精度に抽出することができ
る。
景が白地または黒地の場合でも対象物を正確に抽出する
ことができ、また白地における外接矩形と黒地における
外接矩形の包含関係を調べているので、重複した抽出処
理を行う必要がない。
象物の抽出処理とカラー画像のベクトル量子化処理を並
列的に行い、抽出された対象物について認識処理してい
るので、カラー画像中の特定画像を高速かつ高精度に認
識することができる。また、カラー画像をベクトル量子
化しているので、認識対象物の情報量が失われることな
く、処理データ量を圧縮することができる。
を参照してベクトル量子化する例を示す図である。
示す図である。
ストグラムと辞書のベクトル量子化値ヒストグラムとの
マッチングを説明する図である。
ある。
を生成する図である。
とのマッチングを説明する図である。
成を示す。
ローチャートである。
の範囲内にあるベクトル量子化値のヒストグラム作成を
説明する図である。
Claims (17)
- 【請求項1】 入力されたカラー画像信号を複数の領域
に分割し、該分割された領域内のカラー画像から特徴量
を抽出し、該抽出された特徴量を予め作成されたコード
ブックと比較することによりベクトル量子化し、前記カ
ラー画像のベクトル量子化された値と識別対象物の辞書
とを照合することにより、前記カラー画像を認識処理す
ることを特徴とするカラー画像認識方法。 - 【請求項2】 前記カラー画像から選択した画素を用い
て特徴量を求めることを特徴とする請求項1記載のカラ
ー画像認識方法。 - 【請求項3】 前記抽出された特徴量を所定の変換式に
より変換圧縮した後に、前記コードブックと比較するこ
とを特徴とする請求項1記載のカラー画像認識方法。 - 【請求項4】 入力されたカラー画像信号を複数の領域
に分割し、該分割された領域内のカラー画像から特徴量
を抽出し、該抽出された特徴量を圧縮してヒストグラム
を生成し、該ヒストグラムを予め作成されたコードブッ
クと比較することによりベクトル量子化し、前記カラー
画像のベクトル量子化された値と識別対象物の辞書とを
照合することにより、前記カラー画像を認識処理するこ
とを特徴とするカラー画像認識方法。 - 【請求項5】 前記ヒストグラムの情報を基に、前記コ
ードブックとの比較処理を変更制御することを特徴とす
る請求項4記載のカラー画像認識方法。 - 【請求項6】 前記ヒストグラムの度数または度数分布
幅が所定の値を超えたとき、所定のベクトル量子化値を
与えることを特徴とする請求項5記載のカラー画像認識
方法。 - 【請求項7】 前記ヒストグラムの度数または度数分布
幅が所定の値を超えたとき、前記コードブックとの比較
処理を行わないことを特徴とする請求項5記載のカラー
画像認識方法。 - 【請求項8】 前記ヒストグラムとコードブックとの比
較の結果、比較した距離が所定の値より大きいときベク
トル量子化しないことを特徴とする請求項4記載のカラ
ー画像認識方法。 - 【請求項9】 前記照合時にベクトル量子化された値と
識別対象物の辞書との距離を計算し、該距離と所定の閾
値との比較結果に基づいて、前記カラー画像中に識別対
象物が含まれているか否かを認識することを特徴とする
請求項1または4記載のカラー画像認識方法。 - 【請求項10】 前記所定の閾値を識別すべき対象物毎
に設定し、識別対象物の特性に合わせた認識処理を行う
ことを特徴とする請求項9記載のカラー画像認識方法。 - 【請求項11】 入力画像信号中から所定形状の対象物
を抽出する対象物抽出方法において、該入力された2値
画像信号から黒連結成分の外接矩形を抽出し、該抽出さ
れた外接矩形と黒連結成分との接点情報に基づいて、前
記対象物を抽出することを特徴とする対象物抽出方法。 - 【請求項12】 前記抽出される対象物は、所定の辺長
を有する矩形であることを特徴とする請求項11記載の
対象物抽出方法。 - 【請求項13】 前記抽出される対象物は、スキャンラ
インに対して傾いている対象物を含むことを特徴とする
請求項11または12記載の対象物抽出方法。 - 【請求項14】 前記入力画像信号がカラー画像信号で
あるとき、該カラー画像信号から明度を求め、該明度と
複数の閾値とを比較することにより複数の2値画像を生
成し、該複数の2値画像からそれぞれ前記外接矩形を抽
出することを特徴とする請求項11記載の対象物抽出方
法。 - 【請求項15】 前記抽出される第1の外接矩形と、第
2の外接矩形との包含関係を調べ、一方の外接矩形が他
方の外接矩形を含むとき、一方の外接矩形と黒連結成分
との接点情報に基づいて、前記対象物を抽出することを
特徴とする請求項14記載の対象物抽出方法。 - 【請求項16】 入力カラー画像信号から特定画像を認
識する処理と、該入力カラー画像信号から所定形状の対
象物を抽出する処理を並列に実行し、該対象物の抽出結
果に応じて、該対象物について認識処理することを特徴
とするカラー画像認識方法。 - 【請求項17】 入力カラー画像信号を複数の領域に分
割し、該分割された領域内のカラー画像から特徴量を抽
出し、該抽出された特徴量を、予め作成されたコードブ
ックと比較することによりベクトル量子化し、前記カラ
ー画像のベクトル量子化された値を生成し、前記入力カ
ラー画像信号から抽出された所定形状の対象物の範囲に
相当する該ベクトル量子化値を参照して該ベクトル量子
化値のヒストグラムを作成し、該作成された対象物のヒ
ストグラムと辞書とを照合することにより、前記対象物
を認識処理することを特徴とするカラー画像認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20167594A JP3496893B2 (ja) | 1993-12-10 | 1994-08-26 | カラー画像認識方法および装置 |
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31069693 | 1993-12-10 | ||
JP5-310696 | 1993-12-10 | ||
JP31069493 | 1993-12-10 | ||
JP5-310694 | 1993-12-10 | ||
JP6-18591 | 1994-02-15 | ||
JP1859194 | 1994-02-15 | ||
JP6-52286 | 1994-03-23 | ||
JP5228694 | 1994-03-23 | ||
JP20167594A JP3496893B2 (ja) | 1993-12-10 | 1994-08-26 | カラー画像認識方法および装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003198874A Division JP2004005715A (ja) | 1993-12-10 | 2003-07-18 | カラー画像認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07311848A true JPH07311848A (ja) | 1995-11-28 |
JP3496893B2 JP3496893B2 (ja) | 2004-02-16 |
Family
ID=27520045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20167594A Expired - Lifetime JP3496893B2 (ja) | 1993-12-10 | 1994-08-26 | カラー画像認識方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3496893B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100920918B1 (ko) * | 2008-12-29 | 2009-10-12 | 주식회사 넥스파시스템 | Cb물체감지 알고리즘을 이용한 물체추적시스템 및 그 시스템을 사용한 물체추적방법 |
JP2011040073A (ja) * | 2003-02-28 | 2011-02-24 | Aperio Technologies Inc | 画像パターン認識システム及び方法 |
-
1994
- 1994-08-26 JP JP20167594A patent/JP3496893B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011040073A (ja) * | 2003-02-28 | 2011-02-24 | Aperio Technologies Inc | 画像パターン認識システム及び方法 |
KR100920918B1 (ko) * | 2008-12-29 | 2009-10-12 | 주식회사 넥스파시스템 | Cb물체감지 알고리즘을 이용한 물체추적시스템 및 그 시스템을 사용한 물체추적방법 |
Also Published As
Publication number | Publication date |
---|---|
JP3496893B2 (ja) | 2004-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6181820B1 (en) | Image extraction method and apparatus and image recognition method and apparatus for extracting/recognizing specific images from input image signals | |
JP3373008B2 (ja) | 画像像域分離装置 | |
US6373981B1 (en) | Method and apparatus for segmenting data to create mixed raster content planes | |
US6865290B2 (en) | Method and apparatus for recognizing document image by use of color information | |
US6307962B1 (en) | Document data compression system which automatically segments documents and generates compressed smart documents therefrom | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
TWI426774B (zh) | 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法 | |
US20010053248A1 (en) | Image processing apparatus and method and medium | |
US8411937B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
JP2000175051A (ja) | デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法 | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
US6282314B1 (en) | Image processing method and apparatus which iteratively divides image data into sub-regions | |
EP0933719B1 (en) | Image processing method and apparatus | |
JP4458429B2 (ja) | カラー画像認識方法および装置 | |
KR20090065099A (ko) | 디지털 영상 특징 관리 시스템 및 그 방법 | |
JP3496893B2 (ja) | カラー画像認識方法および装置 | |
US6487311B1 (en) | OCR-based image compression | |
JP4217969B2 (ja) | 画像処理装置及びプログラム | |
KR20030091471A (ko) | YCrCb 칼라 기반 얼굴 영역 추출 방법 | |
JP2004005715A (ja) | カラー画像認識方法および装置 | |
EP0715274B1 (en) | An optical character recognition apparatus and a method for selecting an operational mode thereof | |
JPH07160886A (ja) | 対象物抽出方法およびカラー画像認識方法 | |
JPH08123901A (ja) | 文字抽出装置及び該装置を用いた文字認識装置 | |
JPH09204525A (ja) | 画像像域分離装置及びその方法 | |
JPH07262373A (ja) | カラー画像認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071128 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081128 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081128 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091128 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101128 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121128 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131128 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term |