JP3936822B2 - 静止画像検索装置 - Google Patents
静止画像検索装置 Download PDFInfo
- Publication number
- JP3936822B2 JP3936822B2 JP23317899A JP23317899A JP3936822B2 JP 3936822 B2 JP3936822 B2 JP 3936822B2 JP 23317899 A JP23317899 A JP 23317899A JP 23317899 A JP23317899 A JP 23317899A JP 3936822 B2 JP3936822 B2 JP 3936822B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- luminance
- similarity
- complexity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、計算機および記録媒体を用い、一枚の画像を入力とし画像の全体的な特徴量を利用して検索を行う静止画像検索装置に関する。
【0002】
【従来の技術】
最近、画像の被写体の内容ではなく画像全体の類似性に基づいて画像検索を行う技術が研究されている。フラクタル次元を特徴量として用いる手法(以下、手法1という)、図形の概略形状、周波数特徴、局所相関の各特徴をベクトルとして用いる手法(以下、手法2という)などが提案されている。
【0003】
フラクタル次元は画像の相似性を表す特徴量で、複雑な画像ほど次元は大きく、単純な画像では次元が小さくなるため、画像の複雑さという人間の感性に類似した特徴を表現する特徴量として注目されている。一般に、天然の物体表面や自然の風景などではフラクタル次元は求められるが、ビルなどの街の風景やデザイン画など人工的な物については次元は求められない。手法1では、このような性質を持つフラクタル次元を特徴量としているが、フラクタル次元そのものは情報が少ないため、検索対象画像の種類を限定しなくてはならない。すなわち、デザイン画のみ、自然画のみなど、特定の種類の画像だけを対象としている(林 世紀他、「混合フラクタルモデルに基づく画像特徴量とその画像検索応用における性能評価」、情報処理学会論文誌 Vol.38、No.10(1997−10)、PP.1966−1975、参照)。
【0004】
手法2は、フラクタル次元とは異なる複数の特徴量を用いているものであるが、テザイン画にしぼった上で必要な画像特徴を求めている(大津他、「パターン認識理論と応用」、朝倉書店(1996)、PP.184−186参照)。
【0005】
このように、これまでの画像検索手法は、対象となる画像の種類を限定しており、それに応じた特徴量を利用しているため、用途も限られていた。
【0006】
一方、似ているか似ていないかは検索システムの利用者が判断することであり、何らかの手段で、検索における類似性の判断に利用者の感性や好みを反映させる必要がある。だが、利用者の感性や好みはそれぞれ異なるものであり、一種類の判断基準で類似性を判断したのでは、個人によって似ていると思う利用者もあれば、そう思わない利用者も出てくる。手法3は、このような個人差に対応しようとする手法の代表的なもので、画像特徴ベクトルと各種キーワードとの関係をあらかじめ求めておき、入力画像との類似性を利用者の選んだキーワード軸(意味軸)に沿った類似性とすることで、利用者の望みの類似画像を見いだそうとするものである。しかし、この手法3では、各種キーワードと特徴ベクトルとの関係を求めるために非常に多数(多次元)の特徴を用いて複雑な計算を行う必要があるなど、必ずしも簡便ではない(武者 義則他、「類似画像検索における検索結果の可視化インターフェース ―可視軸として意味軸を用いる方法―」、電子情報通信学会技術報告PRMU99−57(1999−07)、PP.59−64参照)。
【0007】
【発明が解決しようとする課題】
本発明は、上述の点に鑑みてなされたもので、その第1の目的は、画像の種類(テクスチャ、デザイン、自然画像、顔など)を限定すること無く、任意の画像集合(データベース)を利用することを可能にする静止画像検索装置を提供することにある。
【0008】
また、本発明の第2の目的は、上記目的に加えて、ユーザの好みに応じて類似性の判断尺度を変更することを可能とする簡便な構成の静止画像検索装置を提供することにある。
【0015】
【課題を解決するための手段】
上記目的を達成するため、請求項1の発明は、記録媒体中のデータベースである画像集合の各画像から、輝度変化のフラクタル次元を求める際に計算される数値列全体、エッジ量のフラクタル次元を求める際に計算される数値列全体、および輝度分布の分化により求める簡易構図2値情報行列からなる複数種類の特徴量を抽出するデータベース特徴量抽出手段と、使用者が表示された入力画像を参照し、複数の特徴量の類似度計算時における重み分配を選択、決定する特徴量重み決定手段と、参照画像である入力画像から、輝度変化のフラクタル次元を求める際に計算される数値列全体、エッジ量のフラクタル次元を求める際に計算される数値列全体、および輝度分布の分化により求める簡易構図2値情報行列からなる複数種類の特徴量を抽出する参照画像特徴量抽出手段と、前記画像集合の個々の画像に対し、前記データベース特徴量抽出手段で抽出された画像集合の各画像の複数種類の特徴量と、前記参照画像特徴量抽出手段で抽出された前記入力画像の複数種類の特徴量との類似度を、前記特徴量重み決定手段で選択された重み分配に従い、組み合わせて計算する類似度計算手段と、前記画像集合の各画像を、前記類似度計算手段で計算した類似度の高い順に順位付けを行い、所定の順位までのデータベースナンバーおよびその縮小画像を出力・表示する順位決定・結果出力部手段とを具備し、前記データベース特徴量抽出手段は、前記画像集合中の各画像について輝度変化の複雑度に関する特徴量ベクトルの抽出を行う第1の特徴量ベクトル抽出手段と、前記画像集合中の各画像についてエッジ量の複雑度に関する特徴量ベクトルの抽出を行う第2の特徴量ベクトル抽出手段と、前記画像集合中の各画像について画像全体の輝度分布の上下切り分けによる2値構図情報特徴量行列の抽出を行う第3の特徴量ベクトル抽出手段とを含み、前記参照画像特徴量抽出手段は、前記入力画像について輝度変化の複雑度に関する特徴量ベクトルの抽出を行う第4の特徴量ベクトル抽出手段と、前記入力画像についてエッジ量の複雑度に関する特徴量ベクトルの抽出を行う第5の特徴量ベクトル抽出手段と、前記入力画像について画像全体の輝度分布の上下切り分けによる2値構図情報特徴量行列の抽出を行う第6の特徴量ベクトル抽出手段とを含むことを特徴とする。
【0017】
また、前記第1の特徴量ベクトル抽出手段は、前記画像集合中の各画像を一辺数画素の格子で分割し、分割した各格子について輝度変化体積を計算し、該輝度変化体積の数値列を前記輝度変化の複雑度に関する特徴量ベクトルとして出力し、前記第2の特徴量ベクトル抽出手段は、前記画像集合中の各画像についてエッジ量を抽出し、前記画像集合中の各画像を一辺数画素の格子で分割し、分割した全格子の中でエッジ画像を所定の値以上含む格子の数をもとに計算された数値列を前記エッジ量の複雑度に関する特徴量ベクトルとして出力し、前記第3の特徴量ベクトル抽出手段は、前記画像集合中の各画像について画像全体の輝度の平均値、画像内の輝度の最小値、最大値を求め、求めたこれらの値を用いて輝度分布切り分けの下方閾値、上方閾値を設定し、前記各画像を複数個に分割し、分割した各領域全てについての輝度の平均値と前記下方閾値、上方閾値の比較により前記2値構図情報特徴量行列を生成することを特徴とすることができる。
【0019】
また、前記第4の特徴量ベクトル抽出手段は、前記入力画像を一辺数画素の格子で分割し、分割した各格子について輝度変化体積を計算し、該輝度変化体積の数値列を前記輝度変化の複雑度に関する特徴量ベクトルとして出力し、前記第5の特徴量ベクトル抽出手段は、前記入力画像についてエッジ量を抽出し、前記画像集合中の各画像、または前記入力画像を一辺数画素の格子で分割し、分割した全格子の中でエッジ画像を所定の値以上含む格子の数をもとに計算された数値列を前記エッジ量の複雑度に関する特徴量ベクトルとして出力し、前記第6の特徴量ベクトル抽出手段は、前記入力画像について画像全体の輝度の平均値、画像内の輝度の最小値、最大値を求め、求めたこれらの値を用いて輝度分布切り分けの下方閾値、上方閾値を設定し、前記各画像を複数個に分割し、分割した各領域全てについての輝度の平均値と前記下方閾値、上方閾値の比較により前記2値構図情報特徴量行列を生成することを特徴とすることができる。
【0020】
また、前記特徴量重み決定手段は、使用者が呈示された入力画像を参照しながら、複数種類の特徴量のうちどの特徴量へ重みをおく検索が適しているか考察し、類似度計算時の輝度変化の複雑度に関する特徴量に関する類似度、エッジ量の複雑度に関する特徴量に関する類似度、前記データベース特徴量抽出手段と前記参照画像特徴量抽出手段で抽出された前記2値構図情報特徴量行列に関する類似度の少なくとも3種類の類似度への重み分配を数種類呈示された選択肢から選択、決定することを特徴とすることができる。
【0023】
(作用)
本発明では、上記構成により次のような作用を行う。まず、入力画像および記録媒体中の画像集合(データベース)の各画像から、輝度変化のフラクタル次元を求める際に計算される数値列全体、エッジ量のフラクタル次元を求める際に計算される数値列全体、および輝度分布の分化によりもとめる簡易構図2値情報行列など複数種類の特徴量を抽出する。ここで、エッジ画像の抽出方法、および輝度変化・エッジ量のフラクタル計算手法については一般的な画像処理分野における既存の手法を適応することが可能である。次に、入力画像とデータベース各画像についてのそれら複数の特徴量を、使用者が入力画像を参照して選択・決定した重み分配に従って組み合わせて類似度を計算し、その類似度の高い方からある順位までのデータベースナンバーおよびその縮小画像を出力する。その出力を、入力画像と複雑度、構図等が類似していると思われる画像の検索結果として決定する。検索結果として決定したデータベースナンバーおよびその縮小画像の集合は、その順位にしたがってディスプレイに配置・表示する。
【0024】
従って、本発明によれば、入力画像と複雑度、構図等が類似している画像を自動的にデータベースから選択・抽出する静止画像検索において、データベース画像の種類を限定することなく、画像全体の情報を用いて従来よりも多種の画像からなるデータベースに対して同様の検索を行うことが可能となる。
【0025】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0026】
図1に本発明の一実施形態における静止画像検索装置の全体構成を示す。まず、前処理部(データベース特徴量抽出部)100では、記録媒体中の画像集合(データベース)の各画像から輝度変化のフラクタル次元を求める際に計算される数値列全体、エッジ量のフラクタル次元を求める際に計算される数値列全体、および輝度分布の分化により、もとめる簡易構図2値情報行列などの複数種類の特徴量を抽出する。
【0027】
特徴量重み決定部200では、使用者が表示された入力画像(参照画像)を参照し、複数の特徴量の類似度計算時における重み分配を選択、決定する。
【0028】
特徴量重み決定部200と平行して行われる処理として、参照画像特徴量抽出部300で入力画像(参照画像)から輝度変化のフラクタル次元を求める際に計算される数値列全体、エッジ量のフラクタル次元を求める際に計算される数値列全体、および輝度分布の分化によりもとめる簡易構図2値情報行列などの複数種類の特徴量を抽出する。
【0029】
次に、類似度計算部400において、データベースの個々の画像に対し、前処理部100で抽出されたデータベースの各画像の複数種類の特徴量と、参照画像特徴量抽出部300で抽出された入力画像の複数種類の特徴量との類似度を、特徴量重み決定部200で選択された重み分配に従い、組み合わせて計算する。
【0030】
そして最後に、順位決定・結果出力部500において、データベース各画像を類似度計算部400で計算した類似度の高い順に順位付けを行い、ある順位までのデータベースナンバーおよびその縮小画像を出力する。
【0031】
【実施例】
次に、さらに図面を参照して詳細な本発明の一実施例について詳述する。
【0032】
前処理部100では、図2に示すように、データベース101中の各画像i(i=0,1,...,N,Nはデータベース中の画像の枚数)について、特徴量ベクトル1-1、1-2抽出部104で輝度変化の複雑度に関する特徴量ベクトル1-1(=a11[i])、1-2(=a12[i])の抽出を行い、特徴量ベクトル2-1、2-2抽出部105でエッジ量の複雑度に関する特徴量ベクトル2-1(=a21[i])、2-2(=a22[i])の抽出を行い、特徴量ベクトル3-1、3-2抽出部106で画像全体の輝度分布の上下切り分けによる2値構図情報特徴量行列3-1(=IL[i])、3-2(=IH[i])の抽出を行う。
【0033】
図2の特徴量ベクトル1-1、1-2抽出部104の動作を図3を参照して詳述する。
【0034】
特徴量ベクトル1-1の抽出は次のような処理手順で行う。
【0035】
ステップ111; k=0とする。
【0036】
ステップ112、113; 入力画像を一辺r(=2k+1)画素の格子でMk×Nk分割する。
【0037】
ステップ114; その各格子(i,j)(i=0,...,Mk−1,j=0,...,Nk−1)について輝度変化体積v(図4参照)を計算し、その一格子あたりの平均をV1(k)とする。
【0038】
ステップ115、116; k=k+1としステップ112へ戻る。kがある値KTh1へ達したならばステップ117へ進む。
【0039】
ステップ117; 数値列
【0040】
【数1】
a11=(logV1(0),logV1(1),...,logV1(KTh1−1))…(1)
を特徴量ベクトル1-1とする。
【0041】
図4の輝度変化体積において、格子(一辺r)内の四隅画素ABCDの輝度値をそれぞれIa,Ib,Ic,Idとし、その中の最大値をId,最小値をIaとする(図4の(A))。そして、図4の(B)のように、D’D=Id−Ia,C’C=Ic−Ia,B’B=Ib−Ia,D’D⊥面ABCD,C’C⊥面ABCD,B’B⊥面ABCDなる立体D’−C’B’−ABCDを仮定する。この立体の体積をこの格子の「輝度変化体積(仮想体積)」とする。
【0042】
特徴量ベクトル1-2の抽出は次のような処理手順で行う。
【0043】
ステップ121; 入力画像を縦Dx個、横Dy個(Dx×横Dy)に分割する。
【0044】
ステップ122〜133; そのDx,Dy個の各領域(i,j)について,その領域を1枚の画像とみなし、上記の特徴量ベクトルト1の抽出処理と同様の処理を行なう。すなわち、領域(i,j)をr×rの格子でMk×Nk分割し(ステップ126)、その領域の各格子(i,j)(i=0,....,Mk−1,j=0,....,Nk−1)について、上述の輝度変化体積vを計算し、その一格子あたりの平均をV2(I,J,k)とする(ステップ127)。その処理で計算された数値列を
【0045】
【数2】
a1(i,j)=(logV2(i,j,0),logV2(i,j,1),....,logV2(i,j,KTh2−1)) …(2)
とする。
【0046】
ステップ134; 全ての領域(i,j)対するステップ127の処理によって定式(2)で計算された数値列の集合を1次元的に接続した
【0047】
【数3】
a12=(a1(0,0),a1(0,1),....,a1(i,j),....,a1(Dx−1,Dy−1)) …(3)
を特徴量ベクトル1-2とする。
【0048】
図2の特徴量ベクトル2-1-2-2抽出部105の動作を図5を参照して詳述する。
【0049】
特徴量ベクトル2-1の抽出は次のような処理手順で行う。
【0050】
ステップ141; エッジ画像を抽出する。
【0051】
ステップ142; k=0とする。
【0052】
ステップ143、145; 入力画像を一辺r(=2k+1)画素の格子でMk×Nk分割する。
【0053】
ステップ146; 全格子の中で、エッジ画素をある値Eth(=(1/16)r2)をこえて含む格子の数をN1(k)とする。
【0054】
ステップ147、148; k=k+1としステップ143へ戻る。kがある値KTh1へ達したならばステップ149へ移行する。
【0055】
ステップ149; 計算された数値列
【0056】
【数4】
a21=(logN1(0),logN1(1),....,logN1(KTh1−1))…(4)
を特徴量ベクトル2-1とする。
【0057】
特徴量ベクトル2-2の抽出は次のような処理手順で行う。
【0058】
ステップ152; エッジ画像を縦Dx個、横Dy個(Dx×Dy)に分割する。
【0059】
ステップ153〜163; そのDxDy個の各領域(i,j)について,その領域を1枚の画像とみなし、上記の特徴量ベクトル2-1の抽出と同様の処理を行なう。すなわち、分割した領域(i,j)をr×rの格子でMk×Nk分割し(ステップ156)、その領域の各格子(i,j)(i=0,....,Mk-1,j=0,....,Nk-1)の中で、エッジ画像をEth(=(1/16)r2)をこえて含む格子の数をN2(I,J,k)とする(ステップ157)。その処理で計算された数値列を
【0060】
【数5】
a2(i,j)=(logN2(i,j,0),logN2(i,j,1),.....,logN2(i,j,KTh2−1)) …(5)
とする。
【0061】
ステップ164; 全ての領域(i,j)対するステップ157の処理によって上式(5)で計算された数値列の集合を1次元的に接続した
【0062】
【数6】
a22=(a2(0,0),a2(0,1),、,a2(i,j),..,a2(Dx−1,Dy−1)) …(6)
を特徴量ベクトル2-2とする。
【0063】
図2の特徴量行列3-1、3-2抽出部106の動作を図6を参照して詳述する。
【0064】
特徴量行列3-1の抽出は次のような処理手順で行う。
【0065】
ステップ171; 入力画像全体の輝度の平均値Iaveを計算する。また、画像内の輝度の最小値をImin、最大値をImaxとする。
【0066】
輝度分布切り分けの下方閾値を
【0067】
【数7】
IthL=Iave−R(Iave−Imin) …(7)
上方閾値を
【0068】
【数8】
IthH=Iave+R(Imax−Iave) …(8)
とする(0<R<1)。Rは例えば1/3とする。
【0069】
ステップ172; 入力画像を縦M個、横N個に分割する。
【0070】
ステップ173〜179およびステップ183〜189;
分割した各領域(i,j)(i=0,1,...,M−1,j=0,1,...,N−1)全てについて次の処理を行い、2次元M×N行列IL、IHを生成する。
【0071】
【数9】
【0072】
【数10】
ステップ180および190; IL(2次元M×N行列)を特徴量行列3-1,IH(2次元M×N行列)を特徴量行列3-2とする。
【0073】
図2の102〜108で上記のような抽出処理を繰り返し、i=N、即ちデータベース中のファイルの画像を全て処理すると、データベース前画像の特徴量の抽出が完了する(ステップ109)。
【0074】
図1の特徴量重み決定部200の詳細を図7に示す。特徴量重み決定部200においては、使用者がディスプレイ等に呈示された入力画像を参照しながら、複数種類の特徴量のうちどの特徴量へ重みをおく検索が適しているか考察し、類似度計算時の特徴量1-1・1-2に関する類似度、特徴量2-1・2-2に関する類似度、特徴量行列3-1・3-2に関する類似度の3種類の類似度への重み分配(その重みをそれぞれW[1]、W[2]、W[3]とする)を数種類呈示された選択肢から選択、決定する。以下にその選択肢の一例を示す。
【0075】
202: 輝度変化の複雑度、フラクタル性に着目して検索したい(入力画像例:「山」「木」など)場合は、インテンシティ・フラクタル・サーチを選択すると、
⇒W[1]=2/3,W[2]=1/3,W[3]=0
に重み分配される。
【0076】
203: エッジ量の複雑度、フラクタル性に着目して検索したい(入力画像例:「地図」など)場合は、エッジ・フラクタル・サーチを選択すると、
⇒W[1〕=1/3,W[2]=2/3,W[3]=0
に重み分配される。
【0077】
204: 複雑度に着目して検索したいが、輝度変化・エッジ量どちらとはいいにくい場合は、フラクタル・サーチを選択すると、
⇒W[1]=1/2,W[2]=1/2,W[3]=0
に重み分配される。
【0078】
205: 画面いっぱいに広がったテクスチャ画像の検索をしたい場合は、テクスチャー・サーチを選択すると、
⇒W[1]=2/5,W[2]=2/5,W[3]=1/5
に重み分配される。
【0079】
206: 複雑度よりも構図的な特徴を重視して検索をしたい(入力画像例:「空に浮かぶ林檎」など)場合は、ストラクチャー・サーチを選択すると、
⇒W[1]=1/5,W[2]=1/5,W[3]=3/5
に重み分配される。
【0080】
207: 何に着目していいかわからないがとりあえず検索をしたい場合は、ノーマル・サーチを選択すると、
⇒W[1]=1/3,W[2]=1/3,W[3]=1/3
に重み分配される。
【0081】
図1の参照画像特徴量抽出部300の詳細を図8に示す。特徴量重み決定部200の上記の処理と平行して、参照画像特徴量抽出部300においては、入力画像に対して特徴量ベクトル1-1、1-2抽出部301で輝度変化の複雑度に関する特徴量ベクトル1-1(=a’11)、1-2(=a’12)の抽出を行い、特徴量ベクトル2-1、2-2抽出部302でエッジ量の複雑度に関する特徴量ベクトル2-1(=a’21)、2-2(=a’22)の抽出を行い、特徴量ベクトル3-1、3-2抽出部303で画像全体の輝度分布の上下切り分けによる2値構図情報特徴量行列3-1(=I’L)、3-2(=I’H)の抽出を行う。
【0082】
なお、上記特徴量ベクトル1-1、1-2抽出部301は上述の図3の特徴量ベクトル1-1、1-2抽出部104と同様な構成・機能であり、上記特徴量ベクトル2-1、2-2抽出部302は上述の図5の特徴量ベクトル2-1、2-2抽出部105と同様な構成・機能であり、上記特徴量ベクトル3-1、3-2抽出部303は上述の図6の特徴量ベクトル3-1、3-2抽出部106と同様な構成・機能であるので、その詳細な説明は省略する。
【0083】
図1の類似度計算部400の詳細を図9に示す。上述した前処理部(データベース特徴量抽出部)100、特徴量重み決定部200、参照画像特徴量抽出部300のそれぞれの処理の終了に続いて、類似度計算部400において、データベース(画像N枚とする)の全ての画像に対し、前処理部100で抽出した特徴量と、参照画像特徴量抽出部300で抽出した入力画像との特徴量の類似度を、特徴量重み決定部200で選択した重み分配に従って計算する。その処理の詳細は以下の通りである。
【0084】
ステップ401; i=0とする。
【0085】
ステップ402; データベース画像iの特徴量ベクトルa11[i]を選択する。
【0086】
ステップ403; 入力画像の特徴量ベクトルa’11を選択する。
【0087】
ステップ414; 入力画像の特徴量ベクトルa’11とデータベース画像iの特徴量ベクトルa11[i]の類似度を図10の処理手順に従って計算し、その計算結果(0から1の間に正規化)をS11[i]とする。
【0088】
ステップ404、405、415; 同様に入力画像の特徴量ベクトルa’22とデータベース画像iの特徴量ベクトルa12[i]の類似度を図10の処理手順に従って計算し、その計算結果(0から1の間に正規化)をS12[i]とする。ここで特徴量ベクトルの類似度計算手法は、従来のベクトル比較手法が適用可能である。
【0089】
ステップ419;
【0090】
【数11】
S1[i]=0.5(S11[i]+S12[i]) …(11)
とする。このS1[i]が、入力画像とデータベース画像iとの輝度変化の複雑度に関する類似度である。
【0091】
ステップ406、407、416; 入力画像の特微量ベクトルa’21とデータベース画像iの特徴量ベクトルa21[i]の類似度を図10の処理手順に従って計算し、その計算結果(0から1の間に正規化)をS21[i]とする。
【0092】
ステップ408、409、417; 同様に入力画像の特徴量ベクトルa’22とデータベース画像iの特徴量ベクトルa22[i]の類似度を図10の処理手順に従って計算し、その計算結果(0から1の間に正規化)をS22[i]とする。ここでも特徴量ベクトルの類似度計算手法は、従来のベクトル比較手法が適用可能である。
【0093】
ステップ420;
【0094】
【数12】
S2[i]=0.5(S21[i]+S22[i]) …(12)
とする。このS2[i]が、入力画像とデータベース画像iとのエッジ量の複雑度に関する類似度である。
【0095】
ステップ410、411、412、413、418; 入力画像とデータベース画像iとの特徴量行列(構図情報)に関する類似度を図11の処理手順に従って計算する。まずI’LとIL[i]の類似度を近傍要素も考慮した図12の行列類似度計算手法で計算し(=SLL[i](0≦SLL[i]≦1))、同様にI’HとIH[i]の類似度も同じ計算手法で計算する(=SHH[i](0≦SHH[i]≦1))。
【0096】
【数13】
SLLHH[i]=0.5(SLL[i]+SHH[i]) …(13)
とする(0≦SLLHH[i]≦1)。
【0097】
次に、I’LとIH[i]の類似度を上記と同じ図12の行列類似度計算手法で計算し(=SLH[i](0≦SLH[i]≦1))、同様にI’HとIL[i]の類似度も同じ計算手法で計算する(=SHL[i](0≦SH[i]≦1))。
【0098】
【数14】
SLHHL[i]=0.5(SLH[i]十SHL[i]) …(14)
とする(0≦SLHHL[i]≦1)。
【0099】
次に、SLLHH[i]とSLHHL[i]のうち、値の大きい方を入力画像とデータベース画像iとの構図情報行列に関する類似度S3[i]とする。
【0100】
なお、図6の特徴量行列3-1・3-2の抽出部106、303において、輝度分布の上下領域をある閾値で切り分けて構図情報行列を抽出しているが(ステップ175、185参照)、これは“背景”と“物体”を分離する処理である。よって、入力画像とデータベース画像iとが、「背景と物体の濃淡関係が同じで構図が酷似している」場合はSLLHH[i]の値が高くなり、「背景と物体の濃淡関係が逆で構図が酷似している」場合はSLHHL[i]の値が高くなるはずである。
【0101】
ステップ421;
【0102】
【数15】
S[i]=W[1]S1[i]+W[2]S2[i]+W[3]S3[i] …(15)
とする。ここで、W[1],W[2],W[3]は特徴量重み決定部200で決定した重み分配である。このS[i]を入力画像とデータベース画像iとの最終的な類似度とする。
【0103】
ステップ422、423; i=i+1としてステップ402へ戻る。ただし、i=Nとなったら、すなわちデータベース全ての画像について類似計算が完了したら、類似度計算部400での処理を終了する。
【0104】
ここで、上記の行列類似度計算手法について図12を参照して説明する。
【0105】
類似度をとりたい2つの2値M×N行列をI1,I2とする。
【0106】
ステップ461; S12=0.0とする。以下、ステップ464で「I1→I2向きの」類似スコアS12(0≦S12≦MN)を計算する。
【0107】
ステップ464; I1の全ての要素I1[i][j]について、次の処理を行う。
【0108】
・I1[i][j]=1かつI2[i][j]=1の場合 ⇒S12=S12+1.0
・I1[i][j]=1かつI2[i][j]=0かつI2[i][j]の8近傍のどれか=1
の場合 ⇒S12=S12+0.5
・I1[i][j]=0かつI2[i][j]=0の場合 ⇒S12=S12+1.0
・I1[i][j]=0かつI2[i][j]=1かつI2[i][j]の8近傍のどれか=0
の場合 ⇒S12=S12+0.5
ステップ471; S21=0.0とする。以下、ステップ474で「I2→I1向きの」類似スコアS21(0≦S21≦MN)を計算する。
【0109】
ステップ474; I2の全ての要素I2[i][j]について、次の処理を行う。
【0110】
・I2[i][j]=1かつI1[i][j]=1 の場合 ⇒S21=S21+1.0
・I2[i][j]=1かつI1[i][j]=0かつI1[i][j]の8近傍のどれか=1の場合 ⇒S21=S21+0.5
・I2[i][j]=0かつI1[i][j]=0の場合 ⇒S21=S21+1.0
・I2[i][j]=0かつI1[i][j]=1かつI1[i][j]の8近傍のどれか=0の場合 ⇒S21=S21+0.5
ステップ479;
【0111】
【数16】
S=(S12+S21)/2MN(0≦S≦1) …(16)
をI1とI2の類似度とする。
【0112】
図1の順位決定・結果出力部500の詳細を図13に示す。最後に、順位決定・結果出力部500において、類似度の高い順にデータベース画像へ順位をつけ、上位からある順位までのファイルナンバーとその縮小画像を検索結果として出力する(ステップ501〜506)。ここでの、順位付け手法はアルゴリズム解析分野における公知のソーティング手法を用いる。また、画像の縮小手法についても、画像処理分野における従来の公知の画像スケーリング手法を適用する。
【0113】
(他の実施の形態)
なお、本発明の目的は、前述した実施の形態の機能を実現するソフトウエアのプログラムコードを記録した記録媒体(記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し、実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。そのプログラムコードを記録し、またテーブル等の変数データを記録する記録媒体としては、例えばフロッピディスク(FD)、ハードディスク、光ディスク、光磁気ディスク、CD−ROMなどを用いことができる。
【0114】
【発明の効果】
以上説明したように、本発明によれば、従来は検索対象画像(データベース画像)の種類をある程度限定しなければならなかったような、入力画像と複雑度、構図等が類似している画像を自動的にデータベースから選択・抽出する静止画像検索において、データベース画像の種類を限定することなく、従来よりも多種の画像からなるデータベースに対して同様の検索を簡潔な構成で行うことができる。
【図面の簡単な説明】
【図1】本発明による静止画像検索装置の全体構成を示すブロック図である。
【図2】本発明の一実施例における図1の前処理部の機能構成を示すフローチャートである。
【図3】本発明の一実施例における図2および図8の特徴量ベクトル1−1・特徴量ベクトル1−2抽出部の処理の詳細を示すフローチャートである。
【図4】本発明の一実施例における輝度変化体積の概念を示す模式図である。
【図5】本発明の一実施例における図2および図8の特徴量ベクトル2−1・特徴量ベクトル2−2抽出部の処理の詳細を示すフローチャートである。
【図6】本発明の一実施例における図2および図8の特徴量ベクトル3−1・特徴量ベクトル3−2抽出部の処理の詳細を示すフローチャートである。
【図7】本発明の一実施例における図1の特徴量重み決定部の機能構成を示すフローチャートである。
【図8】本発明の一実施例における図1の参照画像特徴量抽出部の機能構成を示すフローチャートである。
【図9】本発明の一実施例における図1の類似度計算部の機能構成を示すフローチャートである。
【図10】本発明の一実施例における図9の点列類似度計算部の処理の詳細を示すフローチャートである。
【図11】本発明の一実施例における図9の特徴量3類似度計算部の処理の詳細を示すフローチャートである。
【図12】本発明の一実施例における図11の行列類似度計算部の処理の詳細を示すフローチャートである。
【図13】本発明の一実施例における図1の順位決定・結果出力部の機能構成を示すフローチャートである。
【符号の説明】
100 前処理部(データベース特徴量抽出部)
104 特徴量ベクトル1−1・特徴量ベクトル1−2抽出部
105 特徴量ベクトル2−1・特徴量ベクトル2−2抽出部
106 特徴量ベクトル3−1・特徴量ベクトル3−2抽出部
200 特徴量重み決定部
201 スイッチ部
300 参照画像特徴量抽出部
301 特徴量ベクトル1−1・特徴量ベクトル1−2抽出部
302 特徴量ベクトル2−1・特徴量ベクトル2−2抽出部
303 特徴量ベクトル3−1・特徴量ベクトル3−2抽出部
400 類似度計算部
415〜417 点列類似度計算部
418 特徴量3類似度計算部
445〜446 行列類似度計算部
500 順位決定・結果出力部
Claims (4)
- 記録媒体中のデータベースである画像集合の各画像から、輝度変化のフラクタル次元を求める際に計算される数値列全体、エッジ量のフラクタル次元を求める際に計算される数値列全体、および輝度分布の分化により求める簡易構図2値情報行列からなる複数種類の特徴量を抽出するデータベース特徴量抽出手段と、
使用者が表示された入力画像を参照し、複数の特徴量の類似度計算時における重み分配を選択、決定する特徴量重み決定手段と、
参照画像である入力画像から、輝度変化のフラクタル次元を求める際に計算される数値列全体、エッジ量のフラクタル次元を求める際に計算される数値列全体、および輝度分布の分化により求める簡易構図2値情報行列からなる複数種類の特徴量を抽出する参照画像特徴量抽出手段と、
前記画像集合の個々の画像に対し、前記データベース特徴量抽出手段で抽出された画像集合の各画像の複数種類の特徴量と、前記参照画像特徴量抽出手段で抽出された前記入力画像の複数種類の特徴量との類似度を、前記特徴量重み決定手段で選択された重み分配に従い、組み合わせて計算する類似度計算手段と、
前記画像集合の各画像を、前記類似度計算手段で計算した類似度の高い順に順位付けを行い、所定の順位までのデータベースナンバーおよびその縮小画像を出力・表示する順位決定・結果出力部手段とを具備し、
前記データベース特徴量抽出手段は、
前記画像集合中の各画像について輝度変化の複雑度に関する特徴量ベクトルの抽出を行う第1の特徴量ベクトル抽出手段と、
前記画像集合中の各画像についてエッジ量の複雑度に関する特徴量ベクトルの抽出を行う第2の特徴量ベクトル抽出手段と、
前記画像集合中の各画像について画像全体の輝度分布の上下切り分けによる2値構図情報特徴量行列の抽出を行う第3の特徴量ベクトル抽出手段とを含み、
前記参照画像特徴量抽出手段は、
前記入力画像について輝度変化の複雑度に関する特徴量ベクトルの抽出を行う第4の特徴量ベクトル抽出手段と、
前記入力画像についてエッジ量の複雑度に関する特徴量ベクトルの抽出を行う第5の特徴量ベクトル抽出手段と、
前記入力画像について画像全体の輝度分布の上下切り分けによる2値構図情報特徴量行
列の抽出を行う第6の特徴量ベクトル抽出手段とを含むことを特徴とする静止画像検索装置。 - 前記第1の特徴量ベクトル抽出手段は、前記画像集合中の各画像を一辺数画素の格子で分割し、分割した各格子について輝度変化体積を計算し、該輝度変化体積の数値列を前記輝度変化の複雑度に関する特徴量ベクトルとして出力し、
前記第2の特徴量ベクトル抽出手段は、前記画像集合中の各画像についてエッジ量を抽出し、前記画像集合中の各画像を一辺数画素の格子で分割し、分割した全格子の中でエッジ画像を所定の値以上含む格子の数をもとに計算された数値列を前記エッジ量の複雑度に関する特徴量ベクトルとして出力し、
前記第3の特徴量ベクトル抽出手段は、前記画像集合中の各画像について画像全体の輝度の平均値、画像内の輝度の最小値、最大値を求め、求めたこれらの値を用いて輝度分布切り分けの下方閾値、上方閾値を設定し、前記各画像を複数個に分割し、分割した各領域全てについての輝度の平均値と前記下方閾値、上方閾値の比較により前記2値構図情報特徴量行列を生成することを特徴とする請求項1に記載の静止画像検索装置。 - 前記第4の特徴量ベクトル抽出手段は、前記入力画像を一辺数画素の格子で分割し、分割した各格子について輝度変化体積を計算し、該輝度変化体積の数値列を前記輝度変化の複雑度に関する特徴量ベクトルとして出力し、
前記第5の特徴量ベクトル抽出手段は、前記入力画像についてエッジ量を抽出し、前記画像集合中の各画像、または前記入力画像を一辺数画素の格子で分割し、分割した全格子の中でエッジ画像を所定の値以上含む格子の数をもとに計算された数値列を前記エッジ量の複雑度に関する特徴量ベクトルとして出力し、
前記第6の特徴量ベクトル抽出手段は、前記入力画像について画像全体の輝度の平均値、画像内の輝度の最小値、最大値を求め、求めたこれらの値を用いて輝度分布切り分けの下方閾値、上方閾値を設定し、前記各画像を複数個に分割し、分割した各領域全てについての輝度の平均値と前記下方閾値、上方閾値の比較により前記2値構図情報特徴量行列を生成することを特徴とする請求項1または2に記載の静止画像検索装置。 - 前記特徴量重み決定手段は、使用者が呈示された入力画像を参照しながら、複数種類の特徴量のうちどの特徴量へ重みをおく検索が適しているか考察し、類似度計算時の輝度変化の複雑度に関する特徴量に関する類似度、エッジ量の複雑度に関する特徴量に関する類似度、前記データベース特徴量抽出手段と前記参照画像特徴量抽出手段で抽出された前記2値構図情報特徴量行列に関する類似度の少なくとも3種類の類似度への重み分配を数種類呈示された選択肢から選択、決定することを特徴とする請求項1ないし3のいずれかに記載の静止画像検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23317899A JP3936822B2 (ja) | 1999-08-19 | 1999-08-19 | 静止画像検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23317899A JP3936822B2 (ja) | 1999-08-19 | 1999-08-19 | 静止画像検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001056820A JP2001056820A (ja) | 2001-02-27 |
JP3936822B2 true JP3936822B2 (ja) | 2007-06-27 |
Family
ID=16950962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23317899A Expired - Fee Related JP3936822B2 (ja) | 1999-08-19 | 1999-08-19 | 静止画像検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3936822B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100375831B1 (ko) * | 2001-03-14 | 2003-03-15 | 한국전자통신연구원 | 영상의 질감도를 기반으로 한 영상 db 브라우징 및 소팅방법 |
JP4963824B2 (ja) * | 2005-11-14 | 2012-06-27 | 学校法人日本大学 | 変化領域抽出装置及び変化領域抽出方法 |
JP4797787B2 (ja) * | 2006-05-16 | 2011-10-19 | 日産自動車株式会社 | 運転シーン変化検出装置、自動車及び運転シーン変化検出方法 |
JP4906900B2 (ja) * | 2009-09-24 | 2012-03-28 | ヤフー株式会社 | 画像検索装置、画像検索方法及びプログラム |
JP5094830B2 (ja) * | 2009-12-16 | 2012-12-12 | ヤフー株式会社 | 画像検索装置、画像検索方法及びプログラム |
-
1999
- 1999-08-19 JP JP23317899A patent/JP3936822B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001056820A (ja) | 2001-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6782395B2 (en) | Method and devices for indexing and seeking digital images taking into account the definition of regions of interest | |
US6690828B2 (en) | Method for representing and comparing digital images | |
CN115578404B (zh) | 一种基于深度学习的肝脏肿瘤图像增强和分割的方法 | |
KR20010055492A (ko) | 영상 히스토그램을 이용한 영상 검색 시스템과 그 방법 | |
JP4374902B2 (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
CN111950612B (zh) | 基于fpn的融合因子的弱小目标检测方法 | |
CN112926652B (zh) | 一种基于深度学习的鱼类细粒度图像识别方法 | |
AU2018202767A1 (en) | Data structure and algorithm for tag less search and svg retrieval | |
CN112132208A (zh) | 图像转换模型的生成方法、装置、电子设备及存储介质 | |
JP3936822B2 (ja) | 静止画像検索装置 | |
CN116721301A (zh) | 目标场景分类模型训练方法、分类方法、设备及存储介质 | |
WO2004047026A1 (ja) | 画像検索プログラム | |
CN114332559A (zh) | 一种基于自适应跨模态融合机制和深度注意力网络的rgb-d显著性目标检测方法 | |
CN114445328A (zh) | 基于改进Faster R-CNN的医学影像脑肿瘤检测方法与系统 | |
CN113205502A (zh) | 一种基于深度学习的绝缘子缺陷检测方法及其系统 | |
Tang et al. | Image retargetability | |
JP2001117936A (ja) | 3次元類似画像検索装置 | |
JP2013008142A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP2001229382A (ja) | 情報蓄積装置,情報検索装置および情報蓄積方法,情報検索方法並びにこれらの方法を記録した記録媒体 | |
CN114581698A (zh) | 一种基于空间交叉注意力机制特征融合的目标分类方法 | |
CN110569790B (zh) | 基于纹理增强卷积网络的居民区要素提取方法 | |
CN113963198A (zh) | 一种高光谱图像分类方法、装置、存储介质及终端 | |
Lippoldt | Efficient colon cancer grading with graph neural networks | |
JP4076310B2 (ja) | 画像検索装置 | |
Mojsilovic et al. | Psychophysical approach to modeling image semantics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061013 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061212 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070116 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070316 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3936822 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140330 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |