JP3921015B2 - 画像解析装置及び方法並びにプログラム記録媒体 - Google Patents

画像解析装置及び方法並びにプログラム記録媒体 Download PDF

Info

Publication number
JP3921015B2
JP3921015B2 JP27017599A JP27017599A JP3921015B2 JP 3921015 B2 JP3921015 B2 JP 3921015B2 JP 27017599 A JP27017599 A JP 27017599A JP 27017599 A JP27017599 A JP 27017599A JP 3921015 B2 JP3921015 B2 JP 3921015B2
Authority
JP
Japan
Prior art keywords
feature amount
image
wavelet transform
frequency band
wavelet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP27017599A
Other languages
English (en)
Other versions
JP2001092973A (ja
JP2001092973A5 (ja
Inventor
晃平 村尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP27017599A priority Critical patent/JP3921015B2/ja
Priority to US09/634,911 priority patent/US6728406B1/en
Publication of JP2001092973A publication Critical patent/JP2001092973A/ja
Publication of JP2001092973A5 publication Critical patent/JP2001092973A5/ja
Application granted granted Critical
Publication of JP3921015B2 publication Critical patent/JP3921015B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering

Description

【0001】
【産業上の利用分野】
本発明は、自動的に画像の特徴を抽出する画像解析装置および方法並びに画像特徴量抽出プログラムを格納したコンピュータ可読のプログラム記録媒体に関し、特に、ウェーブレット変換の各周波数域の係数を利用して画像のレイアウト、形状、テクスチャの特徴量を抽出する画像解析装置および方法並びに画像特徴量ならびにプログラム記録媒体に関する。
【0002】
【従来の技術】
現在、インターネットの普及に伴なうデジタル画像の広範な利用により、個人のデジタルライブラリからインターネットプロバイダの検索サービスや公共のデジタルライブラリ等で、画像内容に基づく類似画像の検索がデジタル画像の広まりと共に注目されている。この類似画像検索のためには、画像から特徴量を抽出して画像検索に利用することが考えられている。
【0003】
画像の特徴量については、色、テクスチャ、形状などに注目して多くの研究が今までに取り組まれている。例えば色の特徴量については、次の文献1によるヒストグラムが最も簡便に特徴量として使われている。
【0004】
[文献1]M. Ortega et al. IEEE Trans. Knowledge and Data Engineering,vol.10, no.6, pp905-925, 1998.
しかし、色のヒストグラム等による特徴量だけでは、画像内の空間的な情報が欠落しているため、画像をブロック化したレイアウトの特徴量も使われることが多い。テクスチャに関しては、無数の研究があり、自己回帰モデルや周波数解析などに基づくものがある。また最近はウエーブレット変換を用いたものが良い性能を示すという報告もある。
【0005】
形状に関する特徴量については、エッジの検出が基本として広く使われている。エッジ検出は変位に対して敏感すぎるため、様々な工夫が必要となる。
【0006】
【発明が解決しようとする課題】
しかしながら、このような従来の画像検索等のための特徴抽出にあっては、レイアウトや形状やテクスチャといった項目別に専用のアルゴリズムを用いて特徴量を抽出していたため、キー画像からレイアウト、形状、テクスチャといった各項目毎に特徴抽出を行わなければならず、これでは画像検索に時間がかかりずぎるという問題がある。
【0007】
一方、ウエーブレット変換を用いた高速な画像検索が次の文献2及び文献3にある。
【0008】
[文献2]C. E. Jacobs et al. Computer Graphics Proceedings, Annual
Conference Series, pp.277-286, 1995
[文献3]E. J. Stollnitz et al. "Wavelets for Computer Graphics",
Morgan Kaufmann Publishers, Inc. 1996
しかし、これらのウエーブレット変換を用いた画像検索は、画像全体をウエーブレット変換して各周波数帯域の全体を特徴量としているため、キー画像に全体として類似する画像しか検索することができず、キー画像のもつレイアウトや形状やテクスチャといった個別の特徴を把えて類似する画像を検索するといった柔軟な検索ができない難点がある。
【0009】
本発明は、画像の特徴抽出が高速にでき、更に、レイアウトや形状やテクスチャといった特徴を個別的に抽出可能な柔軟性の高い特徴抽出ができる画像解析装置及び方法並びに画像特徴量抽出プログラムを格納したコンピュータ可読のプログラム記録媒体を提供することを目的とする。
【0010】
また本発明は、サイズが異なっても中身の同じ画像を同じものと認識できるスケール不変性とカラー画像とグレースケール画像が混在しても検索可能な特徴抽出ができる画像解析装置及び方法並びに画像特徴量抽出プログラムを格納したコンピュータ可読のプログラム記録媒体を提供することを目的とする。
【0011】
【課題を解決するための手段】
図1は本発明の原理説明図である。本発明の画像解析装置は、図1(A)(B)のように、グレースケール画像又はカラー画像を入力してウエーブレット変換を施すウエーブレット変換部22と、ウエーブレット変換後の各周波数帯域の係数に基づいて、画像のレイアウト、形状およびテクスチャの各々に分けて特徴量を抽出する特徴量抽出部(24,26,28)とを備える。
【0012】
このためレイアウト、形状、テクスチャの特徴量が無関係なアルゴリズムによって抽出されてきた従来例に比べ、本発明はウエーブレット変換を利用してレイアウト、形状、テクスチャの各特徴量を抽出するアルゴリズムを統一したことによって、異なるカテゴリの特徴量を高速に抽出することができる。
【0013】
また本発明のウエーブレット変換部22は、ウエーブレット変換したデータの最低周波数帯域のサイズが所定サイズ以下となるように分解回数決定部20で分解回数を決定して多重解像度解析のウエーブレット変換を行う。このように本発明は、ウエーブレット変換の多重解像度性を利用しているので画像のサイズに依存することのなく特徴量を抽出することができ、サイズが異なっても内容の一致する画像を類似するものとして捉えることができるスケール不変性をもつ。
【0014】
本発明の特徴量抽出部は、図1(A)のように、グレースケールの画像で特徴抽出ができることが基本であり、このためウエーブレット変換後の図1(C)のデータ構造における最低周波数帯域LLの係数に基づいてレイアウトの特徴量を求めるレイアウト特徴量抽出部24と、ウエーブレット変換後の2番目に低い周波数帯域HL0,LH0,HH0の係数に基づいて形状の特徴量を求める形状特徴量抽出部26と、ウエーブレット変換後の最低周波数帯域LLを除く各周波数帯域HLn,LHn,HHn(但し,n=0,1、一般にはn=0,1,2,・・・)の平均と分散に基づいてテクスチャの特徴量を求めるテクスチャ特徴量抽出部28とを備える。
【0015】
また本発明がカラー画像を扱う場合には、図1(B)のように、ウエーブレット変換部22は、RGB/YUV変換部32でRGB色空間のカラー画像を入力した場合、入力RGBカラー画像をYUV空間のカラー画像に変換した後にウエーブレット変換を施す。
【0016】
カラー画像の場合、レイアウトについては色の分布に依存するため、レイアウト特徴量抽出部24は、ウエーブレット変換における最も粗い解像度部分の色の扱いだけを考えれば良く、従ってウエーブレット変換後の最低周波数帯域LLの係数を人間の感性にマッチする他の色空間の色表現に変換してレイアウトの特徴量を求める。
【0017】
また形状とテクスチャの特徴量には色の概念はないので、色空間としてYUVを用いた場合、最も信号量が集中するので輝度成分Yの特徴量を取り出す。即ち、形状特徴量抽出部26は、ウエーブレット変換後の2番目に低い周波数帯域HL0,LH0,HH0の係数を構成するYUV成分の内の輝度値Yのみを用いて形状の特徴量を求める。
【0018】
更に、テクスチャ特徴量抽出部28は、ウエーブレット変換後の各周波数帯域HLn,LHn,HHn(n=0,1,2,・・・)の係数を構成するYUV成分の内の輝度値Yのみの平均と分散に基づいてテクスチャの特徴量を求める。
【0019】
レイアウト特徴量抽出部24は、ウエーブレット変換後の最低周波数帯域LLの係数を、人間の間隔に沿ったHSV色空間、Lab色空間、又はマンセル色空間の色表現に変換してレイアウトの特徴量を求める。
【0020】
またレイアウト特徴量抽出部24は、ウエーブレット変換後の最低周波数帯域を予め定めた所定サイズに正規化する。これによってサイズが異なっても中身の同じ画像を同じものと認識できるスケール不変性が確保される。具体的には、レイアウト特徴量抽出部24は、ウエーブレット変換後の最低周波数帯域LLの短い方の辺を予め定めた長さとなるように補間してサイズを正規化する。
【0021】
形状特徴量抽出部26は、ウエーブレット変換後の2番目に低い周波数帯域の係数が配置される3つの帯域HL0,LH0,HH0につき、各係数の絶対値を求めると共に各帯域の相対的に同じ位置の係数を平均して1つの帯域の係数にまとめる。これによってレイアウト特徴量と形状特徴量は同じデータ量となる。
【0022】
テクスチャ特徴量抽出部28は、ウエーブレット変換後の最低周波数帯域LLを除く輪郭縦成分の各周波数帯域HL0,HL1の係数の平均と分散を成分とするベクトル、輪郭横成分LH0,LH1の各周波数帯域の係数の平均と分散を成分とするベクトル、及び輪郭斜め成分HH0,HH1の各周波数帯域の係数の平均と分散を成分とするベクトルをテクスチャ特徴量として生成する。
【0023】
本発明の画像解析装置は、ウエーブレット変換後の周波数帯域の係数に基づいて求めたレイアウト特徴量、形状特徴量、及びテクスチャ特徴量の各値を1バイト長に納まるように量子化し、データ量を低減して高速化を図る。
【0024】
更に画像解析装置は、特徴量抽出部(24,26,28)で抽出された画像のレイアウト特徴量、形状特徴量及びテクスチャ特徴量について、2つの画像間の類似度を各々算出すると共に、各類似度に重み付けを行なって2つの画像間の総合的な類似度を算出する類似度算出部を設ける。
【0025】
このレイアウト、形状又はテクスチャの特徴量の類似度に対しては、重みを変えれば、目的に応じた柔軟性の高い検索ができる。例えば、形状特徴量の類似度だけを有効にすれば、形状が似ていて白黒が反転したポスター、車種が同じで色違いの車などの画像を検索することができる。また、テクスチャ特徴量の類似度の重みだけを有効にすれば、生地の折り目の粗さの類似した画像や、鉱物や化石の表面の類似した画像を取り出すことができる。
【0026】
また、本発明は、画像解析方法を提供するものであり、グレースケール画像又はカラー画像を入力してウエーブレット変換を施し、ウエーブレット変換後の各周波数帯域の係数に基づいて、画像のレイアウト、形状およびテクスチャの各々に分けて特徴量を抽出することを特徴とする。
【0027】
即ち、本発明の画像解析方法は、グレースケール画像の特徴量抽出を基本とし、ウエーブレット変換後の最低周波数帯域の係数に基づいてレイアウトの特徴量を求め、ウエーブレット変換後の2番目に低い周波数帯域の係数に基づいて形状の特徴量を求め、更に、ウエーブレット変換後の最低周波数帯域を除く各周波数帯域の平均と分散に基づいてテクスチャの特徴量を求める。
【0028】
また本発明の画像解析方法は、カラー画像を入力した場合、RGB色空間の入力カラー画像をYUV空間のカラー画像に変換した後にウエーブレット変換を施した後、ウーブレット変換後の最低周波数帯域の係数を人間の感性にマッチする他の色空間の色表現に変換してレイアウトの特徴量を求め、ウエーブレット変換後の2番目に低い周波数帯域の係数を構成するYUV成分の内の輝度値Yのみを用いて形状の特徴量を求め、更に、ウエーブレット変換後の各周波数帯域の係数を構成するYUV成分の内の輝度値Yのみの平均と分散に基づいてテクスチャの特徴量を求める。この画像解析方法の詳細は、画像解析装置の場合と同じになる。
【0029】
更に、本発明は、画像特徴量抽出プログラムを格納したコンピュータ可読のプログラム記録媒体を提供するものである。このプログラム記録媒体は、グレースケール画像又はカラー画像を入力してウエーブレット変換を施し、ウエーブレット変換後の各周波数帯域の係数に基づいて、画像のレイアウト、形状およびテクスチャの各々に分けて特徴量を抽出する画像特徴量抽出プログラムを格納している。
【0030】
即ち、プログラム記録媒体に格納した画像特徴量抽出プログラムは、ウエーブレット変換後の最低周波数帯域の係数に基づいてレイアウトの特徴量を求め、ウエーブレット変換後の2番目に低い周波数帯域の係数に基づいて形状の特徴量を求め、更に、ウエーブレット変換後の最低周波数帯域を除く各周波数帯域の平均と分散に基づいてテクスチャの特徴量を求める。
【0031】
またプログラム記録媒体に格納した画像特徴量抽出プログラムは、カラー画像を入力した場合、RGB色空間の入力カラー画像をYUV空間のカラー画像に変換した後にウエーブレット変換を施し、ウエーブレット変換後の最低周波数帯域の係数を人間の感性にマッチするHSV等の他の色空間の色表現に変換してレイアウトの特徴量を求め、またウエーブレット変換後の2番目に低い周波数帯域の係数を構成するYUV成分の内の輝度値Yのみを用いて形状の特徴量を求め、更に、ウエーブレット変換後の各周波数帯域の係数を構成するYUV成分の内の輝度値Yのみの平均と分散に基づいてテクスチャの特徴量を求める。
【0032】
この画像特徴量抽出プログラムを格納したコンビュータ可読のプログラム記録媒体についても、その詳細は、画像解析装置の場合と同じになる。
【0033】
【発明の実施の形態】
図2は、本発明の画像解析装置が使用される類似画像検索システムのブロック図である。この類似画像検索システムは、特徴量抽出部10、類似度算出部12及び画像メモリ14で構成される。特徴量抽出部10は本発明の画像解析装置を構成するもので、グレースケール画像特徴量抽出部16とカラー画像特徴量抽出部18を備えている。
【0034】
画像メモリ14には類似画像検索のために入力されたキー画像50と候補画像60の特徴量が格納されている。またキー画像50と候補画像60のそれぞれについて、特徴量抽出部10で抽出されたレイアウト特徴量52,62、形状特徴量54,64及びテクスチャ特徴量56,66のそれぞれが格納されている。
【0035】
この内、候補画像60のレイアウト特徴量62、形状特徴量64及びテクスチャ特徴量66は、予め準備されたデータベースから読込まれた特徴量データであり、このデータベースを作成する際の特徴抽出にも本発明がそのまま適用されている。
【0036】
類似度算出部12は、キー画像50と候補画像60のそれぞれについて、特徴量抽出部10で抽出されたレイアウト特徴量、形状特徴量,テクスチャ特徴量について類似度を算出して総合的に判断する。
【0037】
図3は、図2の類似画像検索システムの処理動作のフローチャートである。実際の類似画像検索にあっては、検索対象となる各画像の特徴量を本発明に従って抽出して格納した特徴量のデータベースを準備している。例えばサーバ上に特徴量のデータベースを構築し、クライアントからのキー画像の提供による類似画像の検索要求を受けた際に、サーバ上でキー画像の特徴量を抽出し、データベースから抽出しておいた画像の特徴量とを比較して類似を判断し、結果をクライアントに表示させるようになる。
【0038】
まずステップS1でキー画像とデータベース内の特徴量のデータを入力する。この場合、入力するキー画像はグレースケール画像であってもよいしカラー画像であってもよい。次にステップS2で、入力した画像がカラー画像か否かチェックする。
【0039】
グレースケール画像であればステップS3に進み、グレースケール画像特徴量抽出部16の処理によってグレースケール画像特徴量抽出処理を行う。カラー画像であればステップS4に進み、カラー画像特徴量抽出部18によってカラー画像特徴量抽出処理を行う。
【0040】
続いてステップSに進み、類似度算出部12でキー画像とデータベースから入力している候補画像の特徴量との類似度算出処理を行う。本発明にあっては、この類似度の算出処理はキー画像と候補画像のレイアウト特徴量、形状特徴量,テクスチャ特徴量のそれぞれについて行うもので、必要に応じていずれかの特徴量に重み付けを行った類似度算出を行い、算出結果を合わせ、総合的に画像の類似度を判断する。
【0041】
図4は、図2の特徴量抽出部10に設けているグレースケール画像特徴量抽出部16の機能ブロック図である。このグレースケール画像特徴量抽出部16は、分解回数決定部20−1、ウエーブレット変換部22−1、レイアウト特徴量抽出部24−1、形状特徴量抽出部26−1及びテクスチャ特徴量抽出部28−1で構成される。
【0042】
この図4のグレースケール画像特徴量抽出部16の機能をプログラム構造として見ると、分解回数決定部20−1に対応した画像のサイズ情報から解像度の分解回数を決定する関数、ウエーブレット変換部22−1に対応したウエーブレット変換によって解像度分解を行う関数、及びレイアウト特徴量抽出部24−1、形状特徴量抽出部26−1及びテクスチャ特徴量抽出部28−2に対応したウエーブレット変換後のデータからレイアウト、形状、テクスチャの各特徴量を取り出す関数から構成されることになる。
【0043】
図5は、図4のグレースケール画像特徴量抽出処理のフローチャートである。この処理にあっては、ステップS1でグレースケールの画像を入力し、ステップS2でウエーブレット変換における分解回数Kを決定する。この分解回数の決定は画像サイズに依存して動的に決定し、ウエーブレット変換後のデータ構造における最低周波数帯域LLのサイズが予め定めた一定サイズ以下となるまで分解する。この分解回数決定処理は、後の説明で更に明らかにされる。
【0044】
続いてステップS3でウエーブレット変換によって分解回数Kに応じた多重解像度解析(MRA)を行う。続いてウエーブレット変換後のデータを対象に、ステップS4,S5,S6でそれぞれテクスチャ特徴量抽出、形状特徴量抽出及びレイアウト特徴量抽出の特徴量抽出処理を行い、ステップS7で特徴量データを出力する。
【0045】
ステップS4のレイアウト特徴量抽出は、ウエーブレット変換後の最低周波数帯域の係数に基づいてレイアウトの特徴量を求める。ステップS5の形状特徴量抽出は、ウエーブレット変換後の2番目に低い周波数帯域の係数に基づいて形状の特徴量を求める。更に、ステップS6のテクスチャ特徴量抽出にあっては、ウエーブレット変換後の最低周波数帯域を除く各周波数帯域の平均と分散に基づいてテクスチャの特徴量を求める。
【0046】
図6は、図2の特徴量抽出部10に設けたカラー画像特徴量抽出部18の機能ブロック図である。図6のカラー画像特徴量抽出部18は、RGB/YUV変換部32、分解回数決定部20−2、ウエーブレット変換部22−2、YUV/HSV変換部34、レイアウト特徴量抽出部24−2、形状特徴量抽出部26−2及びテクスチャ特徴量抽出部28−2で構成される。
【0047】
このカラー画像特徴量抽出部18で処理対象とするカラー画像は例えばRGB色空間のRGBカラー画像データ36であり、図4のグレースケール画像特徴量抽出部16における1成分の画像データに対しRGBの3成分の画像データを処理する点が相違する。
【0048】
図7は、図6のカラー画像特徴量抽出処理のフローチャートである。ステップS1でRGBのRGBカラー画像データを入力すると、ステップS2でRGB色空間からYUV色空間への色表現の変換を行う。次にステップS3でウエーブレット変換を行う分解回数Kを決定する。この分解回数の決定は図5のグレースケール画像の場合と同じ処理となる。
【0049】
次にステップS4でウエーブレット変換を分解回数Kに従って行う。このウエーブレット変換にあっては、YUVの3成分のそれぞれについて行う。次にステップS5,S6,S7において、ウエーブレット変換後のデータを対象にテクスチャ特徴量抽出、形状特徴量抽出及びレイアウト特徴量抽出の特徴量抽出処理を行い、次にステップS8で特徴量データを出力する。
【0050】
ステップS5のレイアウト特徴量抽出にあっては、カラー画像の場合、レイアウトについての色の分布が重要となり、ウエーブレット変換後の最低周波数帯域に基づいてレイアウトの特徴量を求めるが、この場合、人間の感覚に沿った最適な色空間として知られたHSV色空間に最低周波数帯域のYUV色空間のデータを変換してレイアウト特徴量を抽出する。
【0051】
この実施形態にあっては、レイアウト特徴量抽出のための色空間としてHSV色空間を例にとっているが、人間の感覚にマッチするような他の色空間としてLab色空間やマンセル色空間等に変換してもよい。
【0052】
ここでステップS2のRGB色空間からYUV色空間への変換、及びステップS5におけるYUV色空間からHSV色空間への変換は、次の変換式(1)(2)(3)式を用いればよい。
【0053】
【数1】
Figure 0003921015
【0054】
即ち図7のステップS2にあっては、(1)式によってRGB色空間からYUV色空間に色表現を変換する。またステップS5にあっては、ウエーブレット変換後の最低周波数帯域のYUV色空間のデータを例えば(2)式でRGB色空間に変換した後、(3)式によりHSV色空間に変換する。
【0055】
ステップS6の形状特徴量の抽出は、ウエーブレット変換後の2番目に低い周波数帯域に基づいて形状の特徴量を求めるが、形状の特徴量には色の概念がないことから、色空間としてYUV空間の場合には信号量が最も集中するY成分を用いて形状の特徴量を求める。
【0056】
またステップS7のテクスチャ特徴量抽出にあっては、ウエーブレット変換後の最低周波数帯域を除く各周波数帯域の平均と分散に基づいてテクスチャの特徴量を求めるが、この場合にもテクスチャには色の概念がないことから、YUV色空間における最も信号量が集中するY成分を使用してテクスチャ特徴量を抽出する。
【0057】
ここで図6に示したカラー画像特徴量抽出部18の機能ブロックをプログラム構造として見ると、図4のグレースケール画像特徴量抽出部16の場合と同様、画像のサイズ情報から解像度の分解回数を決定する関数、ウエーブレット変換によって解像度分解を行う関数、変換後のデータからレイアウト、形状、テクスチャの特徴量を取り出す関数に加え、RGB、YUV、HSVの各色空間の間で双方向に自由に変換できる関数から構成されることになる。
【0058】
図8は、図5のステップS2及び図7のステップS3におけるウエーブレット変換を使用した多重解像度解析の分解回数Kを決定するためのアルゴリズムのフローチャートである。この分解回数決定処理にあっては、まずステップS1で、入力したグレースケール画像またはカラー画像の縦画像数と横画像数のうちの小さい方を最小画素数Nとして選択し、またウエーブレット変換フィルタの最大長をMとし、分解回数Kを初期値K=0とする。
【0059】
続いてステップS2に進み、縦または横の最小画素数Nとフィルタ最大長Mを比較し、縦または横画素数Nがフィルタ最大長Mより大きければ、ステップS3で小さい方の縦または横画素数に1を加算して半分のサイズに縮小し、同時に分解回数をK=K+1と1つアップする 。
【0060】
このステップS2,S3の処理を、ステップS2でサイズを分解して縮小した縦または横画素数がフィルタ最大長M以下となるまで繰り返し、そのときの回数をステップS4に進んで分解回数Kとする。
【0061】
この分解回数決定処理のアルゴリズムによって、ウエーブレット変換を用いた多重解像度解析のための分解回数Kは画像サイズに依存して動的に決定され、ウエーブレット変換後の最低周波数帯域LLのサイズが、ある一定値以下となるまで分解されることになる。
【0062】
図9は、図5のステップS3及び図7のステップS4で行われるウエーブレット変換処理のフローチャートである。このウエーブレット変換処理にあっては、ステップS1で分解回数Kを定義すると共にカウンタIをI=0にセットした後、ステップS2で分解回数Kに図8のアルゴリズムで決定した分解回数をセットする。
【0063】
続いてステップS3で分解回数KとカウンタIを比較し、カウンタIが分解回数Kより小さければ、ステップS4でウエーブレットフィルタを使用したウエーブレット変換によって周波数帯域のX方向を2つの帯域に分割し、続いてステップS5でウエーブレット変換により最低周波数帯域のY方向を2つの帯域に分解する。
【0064】
続いてステップS6でカウンタIを1つインクリメントし、ステップS3に戻る。以下、ステップS4,S5の最低周波数帯域のX方向及びY方向のそれぞれについて、ウエーブレット変換によって2つの帯域に分解する処理を繰り返す。
【0065】
図9のウエーブレット変換処理として、この実施形態にあっては例えばスプライン・ウエーブレット・フイルタを使用し、そのフィルタ係数としては例えば図10に示すものからローパスフィルタ係数(スケール関数φ(X)の係数)とハイパスフィルタ係数(ウエーブレット関数ψ(X)の係数)を用いている。
【0066】
図11は、図9のウエーブレット変換処理で得られた周波数帯域データであり、分解回数KをK=2回とした場合のウエーブレット変換後のn=0,1の2階層のデータ構造を例にとっている。
【0067】
この図11のウエーブレット変換後のデータ構造について、本発明によるレイアウト特徴量、形状特徴量及びテクスチャ特徴量の抽出を説明すると次のようになる。
【0068】
まずテクスチャ特徴量の抽出は、ウエーブレット変換後のデータ構造の最低周波数帯域LLに画像全体の大まかな輝度分布が反映されているため、最低周波数帯域LLのデータに基づいてテクスチャ特徴量を取り出す。
【0069】
図12は、図11のウエーブレット変換後のデータ構造を対象とした本発明によるレイアウト特徴量抽出処理のフローチャートである。まずステップS1で最低周波数帯域LL成分のサイズの正規化を行う。最低周波数帯域LL成分のサイズの正規化は、特徴量に基づいて行われる類似度算出でのデータサイズのマッチングのためである。
【0070】
サイズ正規化の方法は、最低周波数帯域LL成分の縦または横のうちの短い方の辺を予め定めた長さ例えば16データ点となるように補間する。ステップS1でサイズ正規化が済むと、ステップS2でカラー画像か否かチェックする。
【0071】
カラー画像であった場合にはステップS3に進み、最低周波数帯域LL成分の色表現をYUV色空間からHSV色空間への色表現に変換する。この変換には前記(2)(3)式を用いる。グレースケール画像の場合はステップS3はスキップする。
【0072】
次にステップS4でデータ量を最小限にし、類似判定の際の参照を高速化するためにデータの量子化を行う。この量子化は、グレースケール画像の場合は1データ点につき1バイトの大きさとなるように最低周波数帯域成分LLの各値を量子化する。またカラー画像の場合はHSVの3成分で構成されるが、同じく類似判定の際の参照を高速化するためHSVのそれぞれにつき量子化ステップを大きくとり、1データ点につきHSVの3成分を合わせて1バイトとなるように量子化する。
【0073】
次に図11のウエーブレット変換後のデータ構造に基づく形状特徴量の抽出を説明する。ウエーブレット変換後のデータ構造において、2番目に周波数が低い1階層目(n=0)の周波数帯域HL0、LH0、HH0の各成分には大まかな輪郭の形状が反映されている。そこで、2番目に周波数の少ない1階層目の周波数帯域HL0、LH0、HH0の成分を用いて形状の特徴量を取り出す。
【0074】
図13は、図11のウエーブレット変換後のデータ構造を対象とした本発明による形状特徴量抽出処理のフローチャートである。まずステップS1でカラー画像か否かチェックし、カラー画像であればステップS2に進み、周波数帯域HL0、LH0、HH0の成分をY成分のみとする。
【0075】
続いてステップS3で周波数帯域HL0、LH0、HH0のY成分を絶対値に置き換える。これは形状の特徴量については周波数帯域HL0、LH0、HH0について、そこに輪郭が存在するか否かであることから絶対値を求めておけばよい。グレースケール画像の場合はステップS2はスキップする。
【0076】
次にステップS4で、形状特徴量「Shape」を定義し、周波数帯域HL0、LH0、HH0の相対的に同じ位置のY成分の値を平均して1つのデータとして保存する。このため形状特徴量は3つの周波数帯域から取り出しているが、ステップS4の処理によりデータの数はレイアウト特徴量と同じになる。
【0077】
続いてステップS5で、1つの帯域にまとめた形状特徴量Shapeの成分について、図12のステップS1の場合と同様、サイズの正規化を行う。続いてステップS6で類似判定の際の参照を高速化するため量子化を行って、1データ点当たり1バイトに収まるようにしておく。
【0078】
次に図11のウエーブレット変換後のデータ構造から求めるテクスチャ特徴量を説明する。このウエーブレット変換後のデータ構造において、周波数帯域HL0,HL1には各周波数帯域ごとの輪郭の縦成分が反映され、周波数帯域LH0,LH1には各周波数帯域ごとの輪郭の横成分が反映され、更に周波数帯域HH0,HH1には各周波数帯域ごとの輪郭の斜め成分が反映されている。
【0079】
そこで周波数帯域の組(HL0、HL1),(LH0、LH1),(HH0、HH1)からテクスチャの特徴量を取り出す。このテクスチャの特徴量については、最低周波数帯域LLを除く各周波数帯域ごとに平均値Aと分散値σを求め、周波数帯域HL方向、LH方向及びHH方向の各方向ごとにベクトルを構成する。例えば階層n番めのHL方向の平均をAn HL、分散をσn HLとすると、各方向のベクトルは次のように定義できる。
【0080】
【数2】
Figure 0003921015
【0081】
図14は、本発明によるテクスチャ特徴量抽出処理のフローチャートである。まず、ステップS1でカラー画像か否かチェックし、カラー画像であればステップS2に進み、周波数帯域HLn,LHn(但しn=0,1,2,・・・)の成分をY成分のみとする。グレースケール画像の場合はステップS2をスキップする。
【0082】
次にステップS3に進み、周波数帯域HLn,LHn,HHnの成分を絶対値に置き換える。次にステップS4で周波数帯域HLn,LHn,HHnの平均値と分散値を求める。そしてステップS5で(4)〜(9)式のように、テクスチャ特徴量を表す特徴ベクトルを構成する。
【0083】
最終的にステップS6で、類似判定の際の参照を高速化するため特徴ベクトルの各成分に量子化を施してデータ量を削減する。
【0084】
図15は、図2の類似画像検索システムに設けている類似度算出部12の機能ブロック図である。図15の類似度算出部12は、レイアウト類似度算出部40、形状類似度算出部42、テクスチャ類似度算出部44、重み付け値設定部46及び総合類似度算出部48で構成される。
【0085】
この類似度算出部12の機能ブロックをプログラム構成として見ると、図2の画像メモリ14のようにキー画像50及び候補画像60について得られたレイアウト、形状、テクスチャの各特徴量ごとに類似度を算出する関数と、レイアウト、形状、テクスチャの各類似度ごとに予め定められた重みを付けて全体の類似度を算出する関数から構成されることになる。
【0086】
図16は、図15の類似度算出処理のフローチャートである。この類似度算出処理は、まずステップS1で図2の特徴量抽出部10により変換されたキー画像と候補画像についてのレイアウト、形状及びテクスチャの各特徴量のデータを読み込む。
【0087】
続いてステップS2,S3,S4のそれぞれで、レイアウト、形状及びテクスチャの各特徴量について2つの画像間の距離xを求め、(1−x)として類似度を算出する。続いてステップS5で、算出されたレイアウト、形状及びテクスチャの各類似度について予め定められた重み付けまたはユーザが指定した重み付けを行い、ステップS6で重み付けの済んだ3つの類似度の加算によって総合類似度を求めて出力する。
【0088】
ここでレイアウト、形状及びテクスチャの各類似度の算出の詳細を説明すると次のようになる。レイアウトの類似度を算出する際には、キー画像と候補画像について求められたレイアウト特徴量のデータ点ごとに2つの画像間の距離を算出する。
【0089】
このレイアウト特徴量にあっては、図11のウエーブレット変換後のデータ構造における最低周波数帯域LLの成分をHSV成分に変換した成分値が与えられており、このHSV成分の数値を用いて2つの画像間の距離を求める。
【0090】
ここで2つの画像のHSV色空間における距離の算出を行う2つのデータ点の成分を(Hi,Si,Vi)及び(Hj,Sj,Vj)とすると、HSV色空間での距離は次式で与えられる。
【0091】
【数3】
Figure 0003921015
【0092】
またキー画像と候補画像のサイズユニットは、ウエーブレット変換後に例えば図11のようにして得られる最低周波数帯域LLの画像の縦横比が異なる場合には、図17のように、例えばキー画像テクスチャ特徴量帯域70と候補画像テクスチャ特徴量帯域72の中心部分を重ね合わせ、重複する部分74についてのみテクスチャ特徴量について距離を求める。
【0093】
図18は、図17のように縦横比が異なる場合の類似度算出のフローチャートであり、図17のように2つの画像の領域を中心部分で重ね合わせて距離を算出するアルゴリズムである。ここで図17の2つの画像特徴領域70,72は、画像A,Bとしている。
【0094】
まずステップS1で画像Aのx方向の長さと画像Bのx方向の長さのうち短い方Minxとし、同じく画像Aのy方向の長さと画像Bのy方向の長さのうちの短い方をMinyとする。続いてステップS2で、図17のように2つの画像を中心に合わせた状態で比較するためのデータ点を選択するため、画像A,Bについてのx方向及びy方向のオフセットを算出する。
【0095】
続いてステップS3で画像AのカウンタIと画像BのカウンタJをそれぞれ0にリセットした後、ステップS4でカウンタI,JがステップS1で選択した画像A,Bのx方向及びy方向の短い方の長さMinx,Miny以上となるまで、ステップS5,S6,S7の処理を繰り返す。
【0096】
ステップS5にあっては、比較を行う画像Aのデータ点Pt Aと比較を行う画像Bのデータ点Pt Bを、それぞれ現在地(I,J)とステップS2で求めたオフセットから算出する。続いてステップS6で画像Aのデータ点Pt A番地のデータと画像Bのデータ点Pt B番地のデータを比較し、レイアウトの類似度を算出する。
【0097】
続いてステップS7でカウンタI,Jを1つずつアップした後、ステップS4で重複領域を越えるまで、ステップS5,S6の類似度の算出処理を繰り返す。
【0098】
この図18の縦横比対応の類似度算出処理は、画像A,Bの縦横比が同じ場合についても、そのまま適用できる。縦横比が同じ場合には、ステップS2におけるオフセットがそれぞれ0となるだけである。
【0099】
また図18はレイアウト特徴量の類似度算出を例にとっているが、図11の2番目に周波数が低い周波数帯域HL0,LH0,HH0をまとめて作った形状の特徴量についても、レイアウト特徴量の場合と同様に適用することができる。
【0100】
またレイアウト特徴量の類似度算出において、キー画像と候補画像の一方がグレースケール画像で他方がカラー画像の場合については、カラー画像のV成分がグレースケール画像の輝度に対応することから、カラー画像のレイアウト特徴量のHSV成分のうちV成分のみを使用してグレースケール画像のレイアウト特徴量との間で距離を求め、類似度を算出する。
【0101】
次に形状特徴量に基づく類似度の算出は、レイアウト特徴量の成分とデータ点の数と配置が同じであることから、レイアウト特徴量に基づく類似度と同じ手順で類似度を算出する。相違点としては、形状特徴量は色成分の区別がない色成分Yのみであることから、キー画像の形状特徴量の輝度成分Yiと候補画像の形状特徴量の輝度成分Yjの距離(Yi−Yj)2 を求めればよい。
【0102】
更にテクスチャ特徴量の類似度の算出は、前記(4)〜(9)式に示したようなキー画像と候補画像についてテクスチャ特徴量として求めたベクトル同士の比較となる。このベクトル同士の比較による距離の算出は各ベクトルのマンハッタン距離を求めればよい。即ち2つのベクトルの距離Lは次式で求められる。勿論、マンハッタン距離以外にベクトル同士の比較を行う適宜の距離演算が適用できる。
【0103】
【数4】
Figure 0003921015
【0104】
図19は、図15においてレイアウト類似度のみを有効とするように重み付けを行った場合の類似画像検索結果の一例である。図19(A)がキー画像74であり、キー画像のレイアウトは青空74−1,地面74−2で2分割され、中央に建物74−3が配置されている。
【0105】
このようなキー画像74に対し、図19(B)(C)(D)の第1候補76,第2候補78,第3候補80について、ウエーブレット変換に基づく最低周波数帯域LLのHSV成分として求めたテクスチャ特徴量について類似度を算出すると、キー画像74に対しアングルが異なる第1候補76の類似度は90%が得られ、キー画像74に対し建物78−3が異なる第2候補78は類似度80%が得られ、更にキー画像74に対し建物80−3が異なる第3候補80は類似度60%となる。
【0106】
図20は、図15において形状類似度のみを有効とする重み付けを行った場合の類似画像検索結果の一例である。図20(A)の電気機関車のキー画像82に対し、図20(B)の第1候補84及び図20(C)の第2候補86について、それぞれのウエーブレット変換で得られた2番目に周波数の低い周波数帯域HL0,LH0,HH0に基づく形状特徴量について類似度を求めると、キー画像82を白黒反転した第1候補84は類似度100%が得られる。またキー画像82に対し中の車両を窓付きとした第2候補86については類似度90%を得ることができる。
【0107】
図21は、図15でテクスチャ類似度のみを有効とする重み付けを行った場合の類似画像検索結果の一例である。図21(A)はキー画像88であり、これに対し図21(B)の第1候補90、図21(C)の第2候補92、・・・、図21(D)の第n候補94との間で類似度を算出する。
【0108】
このようなキー画像88に対する各候補90,92,・・・94にあっては、キー画像88のテクスチャに対し第1候補90が類似度90%、第2候補92が類似度80%、更に第n候補94が類似度5%となっている。
【0109】
このように本発明にあっては、ウエーブレット変換による周波数帯域に基づいてレイアウト、形状及びテクスチャのそれぞれについて固有の特徴量を求め、この特徴量についてキー画像と候補画像との間で類似度を算出し、必要に応じてレイアウト、形状またはテクスチャの各類似度に重み付けを行って総合類似度を求めることで、非常に柔軟性の高い類似画像の検索を高速で行うことができる。
【0110】
更に本発明は図2の本発明による特徴量抽出部10、具体的には図4のグレースケール画像特徴量抽出部16と図6のカラー画像特徴量抽出部18の機能ブロックを実現する関数で構成された画像特徴量抽出プログラムを格納したコンピュータ読取り可能なプログラム記録媒体を提供する。
【0111】
この本発明による画像特徴量抽出プログラムを格納したコンピュータ読取り可能なプログラム記録媒体としては、CD,CD−ROM,DVD,DVD−ROM,MD,FD等の適宜の可搬記録媒体に本発明による画像特徴量抽出プログラムを格納したものを含む。
【0112】
更にまた、図2の特徴量抽出部10に対応した画像特徴量抽出プログラムに加え、図2の類似度算出部12に対応した類似度算出プログラム、具体的には図15の機能ブロックを実現する類似度算出プログラムを合わせて格納したコンピュータ読取り可能な記録媒体を提供することも含む。勿論、類似度算出プログラムを独立に記録した記録媒体であってもよい。
【0113】
更に本発明の画像特徴量抽出プログラムを格納した記録媒体としては、パーソナルコンピュータ等の情報処理装置に対し着脱自在で記録媒体単体で取引される適宜の記録媒体を含むことは勿論である。
【0114】
また本発明は上記の実施形態に限定されず、その目的と利点を損なわない適宜の変形を含む。更に本発明は上記の実施形態に示した数値による限定は受けない。
【0115】
【発明の効果】
以上説明してきたように本発明によれば、ウエーブレット変換の多重解像度解析を利用することによって変換後の各周波数帯域からレイアウト、形状、テクスチャの3種類の特徴量を高速に求めることができる。
【0116】
またウエーブレット変換後のデータから得られるレイアウト、形状、テクスチャは人間の主観に適合した特徴量であり、これらの特徴量に基づく類似度算出結果について適宜の重み付けを行うことで、類似画像を検索する際に高い柔軟性が得られる。
【0117】
またウエーブレット変換を利用したレイアウト、形状、テクスチャの特徴量の抽出にあっては、画像サイズが異なっても中身の同じ画像を同じものとして認識できるスケール不変性が得られ、画像サイズに依存することなく中身の特徴量を適切に抽出することができる。
【0118】
更にカラー画像とグレースケール画像が混在していても形状及びテクスチャ成分は同じ輝度成分であり、レイアウト特徴量はカラー画像については輝度成分のみとしてグレースケール画像のレイアウト特徴量と対比でき、この結果、カラー画像とグレースケール画像が混在していても、本発明で抽出されたレイアウト、形状、テクスチャの各特徴量から類似画像の検索が適切に実現できる。
【0119】
更に本発明のウエーブレット変換を利用して得られたレイアウト、形状、テクスチャといった人間の主観に適合する特徴量から類似度を算出して類似画像を検索するような場合、形状の重みだけを有効にすれば、形状が似ている白黒が反転したポスターや車種が同じで色違いの車等の画像を適切に検索できる。
【0120】
また、テクスチャから算出した類似度の重みだけを有効にしたような場合には、生地の折り目の粗さの類似した画像や鉱物や化石の表面の類似した画像の検索が適切にでき、特徴の種類を適切に選ぶことで柔軟な類似画像の検索が実現できる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の画像解析装置を用いた類似画像検索システムのブロック図
【図3】図2の類似画像検索処理のフローチャート
【図4】本発明の一実施形態である図2のグレースケール画像特徴抽出部の機能ブロック図
【図5】図4のグレースケール画像特徴抽出処理のフローチャート
【図6】本発明の他の実施形態である図2のカラー画像特徴抽出部の機能ブロック図
【図7】図6のカラー画像特徴抽出処理のフローチャート
【図8】図4と図6における分解回数決定処理のフローチャート
【図9】図4と図6におけるフエーブレット変換処理のフローチャート
【図10】図9のウエーブレット変換に使用するフィルタ係数の説明図
【図11】分解回数を2回とした場合のウエーブレット変換帯域の説明図
【図12】図4と図6におけるレイアウト特徴量抽出処理のフローチャート
【図13】図4と図6における形状特徴量抽出処理のフローチャート
【図14】図4と図6におけるテクスチャ特徴量抽出処理のフローチャート
【図15】図2の類似度算出部の機能ブロック図
【図16】図15の類似度算出処理のフローチャート
【図17】サイズの異なるウエーブレット変換帯域の類似度を算出するための帯域の位置合せの説明図
【図18】図17の縦横比対応の類似度算出処理のフローチャート
【図19】レイアウト特徴量のみを用いた類似画像検索結果の説明図
【図20】形状特徴量のみを用いた類似画像検索結果の説明図
【図21】テクスチャ特徴量のみを用いた類似画像検索結果の説明図
【符号の説明】
10:特徴抽出部
12:類似度算出部
14:画像メモリ
16:グレースケール画像特徴量抽出部
18:カラー画像特徴量抽出部
20−1,20−2:分解回数決定部
24,22−1,22−2:ウエーブレット変換部
24,24−1,24−2:レイアウト特徴抽出部
26,26−1,26−2:形状特徴量抽出部
28,28−1,28−2:テクスチャ特徴量抽出部
30:グレースケール画像データ
32:RGB/YUV変換部
34:YUV/HSV変換部
36:カラー画像データ
40:レイアウト類似度算出部
42:形状類似度算出部
44:テクスチャ類似度算出部
50:キー画像
52,62:レイアウト特徴量
54,64:形状特徴量
56,66:テクスチャ特徴量
70:キー画像特徴量領域
72:候補画像特徴量領域
74:類似度算出領域
74,82,88:キー画像
76,78,78,80,84,86,90,92,94:候補画像

Claims (6)

  1. 入力された画像にウェーブレット変換を施すウェーブレット変換手段と、
    前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域から画像内の空間的情報であるレイアウトの特徴量を求めるレイアウト特徴量抽出手段と、
    前記ウェーブレット変換手段によるウェーブレット変換後の2番目に低い周波数帯域の係数が配置される3つの帯域につき、各係数の絶対値を求めると共に各帯域の相対的に同じ位置の係数を平均して1つの帯域の係数にまとめることで形状の特徴量を求める形状特徴量抽出手段と、
    前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域を除く各周波数帯域の平均と分散に基づいてテクスチャの特徴量を求めるテクスチャ特徴量抽出手段と、
    を備え、
    前記特徴量は前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域の短い方の辺を予め定めた長さとなるように補間してサイズを正規化するとともに、
    前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域の係数を、HSV色空間、Lab色空間、又はマンセル色空間のいずれかの色表現に変換して求めることを特徴とする請求項1記載の画像解析装置。
  2. 前記ウェーブレット変換手段は、入力されたRGBカラー空間のカラー画像をYUV空間のカラー画像に変換した後にウェーブレット変換を施し、
    記形状特徴量抽出手段は、前記ウェーブレット変換手段によるウェーブレット変換後の2番目に低い周波数帯域の係数を構成するYUV成分の内の輝度値Yのみを用いて形状の特徴量を求め、
    前記テクスチャ特徴量抽出手段は、前記ウェーブレット変換手段によるウェーブレット変換後の各周波数帯域の係数を構成するYUV成分の内の輝度値Yのみの平均と分散に基づいてテクスチャの特徴量を求める
    ことを特徴とする請求項1記載の画像解析装置。
  3. 前記テクスチャ特徴量抽出手段は、前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域を除く輪郭縦成分の各周波数帯域の係数の平均と分散をベクトル成分とするベクトル、輪郭横成分の各周波数帯域の係数の平均と分散をベクトル成分とするベクトル、及び輪郭斜め成分の各周波数帯域の係数の平均と分散をベクトル成分とするベクトルをテクスチャ特徴量として生成する
    ことを特徴とする請求項1記載の画像解析装置。
  4. 前記レイアウト特徴量抽出手段で抽出されたレイアウト特徴量、前記形状特徴量抽出手段で抽出された形状特徴量及び前記テクスチャ特徴量抽出手段で抽出されたテクスチャ特徴量について2つの画像間の類似度を各々算出すると共に、前記各類似度に重み付けを行なって2つの画像間の総合的な類似度を算出する類似度算出手段
    を更に備えることを特徴とする請求項1記載の画像解析装置。
  5. 画像解析装置が、
    入力された画像にウェーブレット変換を施すウェーブレット変換ステップと、
    前記ウェーブレット変換ステップによるウェーブレット変換後の最低周波数帯域から画像内の空間的情報であるレイアウトの特徴量を求めるレイアウト特徴量抽出ステップと、
    前記ウェーブレット変換ステップによるウェーブレット変換後の2番目に低い周波数帯域の係数が配置される3つの帯域につき、各係数の絶対値を求めると共に各帯域の相対的に同じ位置の係数を平均して1つの帯域の係数にまとめることで形状の特徴量を求める形状特徴量抽出ステップと、
    前記ウェーブレット変換ステップによるウェーブレット変換後の最低周波数帯域を除く各周波数帯域の平均と分散に基づいてテクスチャの特徴量を求めるテスクチャ特徴量抽出ステップと、
    を備え、
    前記特徴量は前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域の短い方の辺を予め定めた長さとなるように補間してサイズを正規化するとともに、
    前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域の係数を、HSV色空間、Lab色空間、又はマンセル色空間のいずれかの色表現に変換して求めることを特徴とする画像解析方法。
  6. 画像解析装置に、
    入力された画像にウェーブレット変換を施すウェーブレット変換ステップと、
    前記ウェーブレット変換ステップによるウェーブレット変換後の最低周波数帯域の短い方の辺を予め定めた長さとなるように補間してサイズを正規化するとともに、前記ウェーブレット変換手段によるウェーブレット変換後の最低周波数帯域の係数を、HSV色空間、Lab色空間、又はマンセル色空間のいずれかの色表現に変換して画像内の空間的情報であるレイアウトのイアウトの特徴量を求めるレイアウト特徴量抽出ステップと、
    前記ウェーブレット変換ステップによるウェーブレット変換後の2番目に低い周波数帯域の係数が配置される3つの帯域につき、各係数の絶対値を求めると共に各帯域の相対的に同じ位置の係数を平均して1つの帯域の係数にまとめることで形状の特徴量を求める形状特徴量抽出ステップと、
    前記ウェーブレット変換ステップによるウェーブレット変換後の最低周波数帯域を除く各周波数帯域の平均と分散に基づいてテクスチャの特徴量を求めるテクスチャ特徴量抽出ステップと、
    を動作させる画像解析プログラムを格納したコンピュータ可読のプログラム記録媒体。
JP27017599A 1999-09-24 1999-09-24 画像解析装置及び方法並びにプログラム記録媒体 Expired - Lifetime JP3921015B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP27017599A JP3921015B2 (ja) 1999-09-24 1999-09-24 画像解析装置及び方法並びにプログラム記録媒体
US09/634,911 US6728406B1 (en) 1999-09-24 2000-08-09 Image analyzing apparatus and method as well as program record medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27017599A JP3921015B2 (ja) 1999-09-24 1999-09-24 画像解析装置及び方法並びにプログラム記録媒体

Publications (3)

Publication Number Publication Date
JP2001092973A JP2001092973A (ja) 2001-04-06
JP2001092973A5 JP2001092973A5 (ja) 2004-12-09
JP3921015B2 true JP3921015B2 (ja) 2007-05-30

Family

ID=17482581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27017599A Expired - Lifetime JP3921015B2 (ja) 1999-09-24 1999-09-24 画像解析装置及び方法並びにプログラム記録媒体

Country Status (2)

Country Link
US (1) US6728406B1 (ja)
JP (1) JP3921015B2 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6477269B1 (en) * 1999-04-20 2002-11-05 Microsoft Corporation Method and system for searching for images based on color and shape of a selected image
KR100406508B1 (ko) * 2000-06-23 2003-11-20 주식회사 코난테크놀로지 컬러영상 처리 시스템 및 그 방법
US7099860B1 (en) * 2000-10-30 2006-08-29 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
US6970860B1 (en) * 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
FR2825224A1 (fr) * 2001-05-22 2002-11-29 Canon Kk Procede et dispositif de compression et ou d'indexation d'images numeriques
WO2004008338A1 (en) * 2002-07-12 2004-01-22 Chroma Energy, Inc. Oil exploration and production pattern recognition template
JP4521747B2 (ja) * 2002-12-13 2010-08-11 シャープ株式会社 物体情報処理装置、画像処理システム、ゲーム装置および画像処理方法
JPWO2004093006A1 (ja) * 2003-04-16 2006-07-06 富士通株式会社 知識発見装置、知識発見プログラムおよび知識発見方法
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2004361987A (ja) * 2003-05-30 2004-12-24 Seiko Epson Corp 画像検索システム、画像分類システム、画像検索プログラム及び画像分類プログラム、並びに画像検索方法及び画像分類方法
TWI255429B (en) * 2003-12-29 2006-05-21 Ind Tech Res Inst Method for adjusting image acquisition parameters to optimize objection extraction
CN1296861C (zh) * 2004-09-10 2007-01-24 倪蔚民 基于图像纹理特征随机度信息的模式识别方法
JP3967367B2 (ja) * 2004-12-07 2007-08-29 松下電器産業株式会社 画像変換方法、装置およびプログラム、テクスチャマッピング方法、装置およびプログラム、並びに、サーバークライアントシステム
JP4645186B2 (ja) * 2004-12-22 2011-03-09 富士ゼロックス株式会社 画像処理装置
US20080175513A1 (en) * 2005-04-19 2008-07-24 Ming-Jun Lai Image Edge Detection Systems and Methods
US7907148B1 (en) 2005-12-07 2011-03-15 Marvell International Ltd. Intelligent color remapping of video data
JP4859025B2 (ja) * 2005-12-16 2012-01-18 株式会社リコー 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
JP3921496B1 (ja) * 2006-03-15 2007-05-30 松下電器産業株式会社 画像変換方法および画像変換装置
US7340098B2 (en) 2006-03-15 2008-03-04 Matsushita Electric Industrial Co., Ltd. Method and apparatus for image conversion
JP4882680B2 (ja) 2006-07-31 2012-02-22 富士ゼロックス株式会社 画像処理システムおよび画像処理プログラム
JP4850652B2 (ja) * 2006-10-13 2012-01-11 キヤノン株式会社 画像検索装置及びその制御方法、プログラム、記憶媒体
KR100886339B1 (ko) * 2007-01-09 2009-03-03 삼성전자주식회사 영상의 속성에 기초한 영상 분류 방법 및 장치
EP2018070A1 (en) * 2007-07-17 2009-01-21 Thomson Licensing Method for processing images and the corresponding electronic device
GB2454213A (en) * 2007-10-31 2009-05-06 Sony Corp Analyzing a Plurality of Stored Images to Allow Searching
GB2454212B (en) * 2007-10-31 2012-08-08 Sony Corp Method and apparatus of searching for images
CN101504717B (zh) * 2008-07-28 2012-07-11 上海高德威智能交通系统有限公司 特征区域的定位方法、车身深浅色与车身颜色的识别方法
CN101686389B (zh) * 2008-09-28 2012-10-03 富士通株式会社 图像下采样方法和系统
US8284450B2 (en) * 2008-10-07 2012-10-09 Xerox Corporation Streak compensation in compressed image paths
EP2175416A1 (en) * 2008-10-13 2010-04-14 Sony Corporation Method and system for image deblurring
US8483433B1 (en) 2009-09-17 2013-07-09 Lockheed Martin Corporation Detection of faint perturbations of interest using statistical models of image texture
JP5664120B2 (ja) * 2010-10-25 2015-02-04 ソニー株式会社 編集装置、編集方法、プログラム、および記録媒体
CN103632156B (zh) * 2013-12-23 2016-06-22 中南大学 基于多尺度邻域相关矩阵的泡沫图像纹理特征提取方法
JP6050284B2 (ja) * 2014-06-20 2016-12-21 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
CN105718882B (zh) * 2016-01-19 2018-12-18 上海交通大学 一种分辨率自适应特征提取与融合的行人重识别方法
CN106779055B (zh) * 2017-01-10 2019-06-21 北京邮电大学 图像特征提取方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1070722A (ja) 1996-05-13 1998-03-10 Fujitsu Ltd ウエーブレット画像圧縮装置およびウエーブレット画像復元装置,並びにプログラム記憶媒体
JP2000048036A (ja) * 1998-07-28 2000-02-18 Canon Inc 画像処理装置およびその方法
US6477269B1 (en) * 1999-04-20 2002-11-05 Microsoft Corporation Method and system for searching for images based on color and shape of a selected image

Also Published As

Publication number Publication date
JP2001092973A (ja) 2001-04-06
US6728406B1 (en) 2004-04-27

Similar Documents

Publication Publication Date Title
JP3921015B2 (ja) 画像解析装置及び方法並びにプログラム記録媒体
Tu et al. A new look at IHS-like image fusion methods
JP3740065B2 (ja) 領域分割された映像の領域特徴値整合に基づいた客体抽出装置およびその方法
Bourennane et al. Improvement of classification for hyperspectral images based on tensor modeling
Kwon et al. Kernel orthogonal subspace projection for hyperspectral signal classification
AU2017201281B2 (en) Identifying matching images
WO2006083023A1 (en) Computer implemented method for extracting integral histogram from sampled data
CN101140325A (zh) 高光谱图像的空间-光谱信息协同提高分辨率的方法
CN114187520B (zh) 一种建筑物提取模型的构建及应用方法
JP3141004B2 (ja) 動画中のオブジェクトを分類する方法
Tseng et al. Wavelet-based multispectral image fusion
US7389005B2 (en) Interpolation of video and audio digital data
Ye et al. Cross-scene hyperspectral image classification based on DWT and manifold-constrained subspace learning
Meenakshisundaram Quality assessment of IKONOS and Quickbird fused images for urban mapping
CN115082337A (zh) 一种基于双重全变分的高光谱混合噪声去除方法
Ge et al. Remote sensing image fusion based on Bayesian linear estimation
CN114463379A (zh) 一种视频关键点的动态捕捉方法及装置
Sarmah et al. A correlation based band selection approach for hyperspectral image classification
Hariharan et al. Performance enhanced hyperspectral and multispectral image fusion technique using ripplet type-II transform and deep neural networks for multimedia applications
KR101200378B1 (ko) 국소 각 위상을 이용한 강건한 텍스처 특징 추출 방법
Gormus et al. Exploiting spatial domain and wavelet domain cumulants for fusion of SAR and optical images
WO2020196918A1 (ja) 画像処理装置、及び画像処理プログラム
JP6539469B2 (ja) 特徴量抽出装置、特徴量抽出方法及び特徴量抽出用プログラム
Das et al. A Comparative Analysis of Image Fusion Techniques for Remote Sensed Images.
Prasad et al. Rotation invariance through structured sparsity for robust hyperspectral image classification

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070216

R150 Certificate of patent or registration of utility model

Ref document number: 3921015

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140223

Year of fee payment: 7

EXPY Cancellation because of completion of term