JPWO2005096180A1 - 画像検索方法、装置及びプログラムを記録した記録媒体 - Google Patents
画像検索方法、装置及びプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JPWO2005096180A1 JPWO2005096180A1 JP2006511629A JP2006511629A JPWO2005096180A1 JP WO2005096180 A1 JPWO2005096180 A1 JP WO2005096180A1 JP 2006511629 A JP2006511629 A JP 2006511629A JP 2006511629 A JP2006511629 A JP 2006511629A JP WO2005096180 A1 JPWO2005096180 A1 JP WO2005096180A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- search target
- search
- target images
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 145
- 238000011524 similarity measure Methods 0.000 claims abstract description 60
- 238000010276 construction Methods 0.000 claims abstract description 40
- 239000000284 extract Substances 0.000 claims abstract description 11
- 239000000470 constituent Substances 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
たとえば、特許文献1(特開平9−259130号公報)に記載される情報探索方法では、多数の検索対象情報を2次元または3次元の階層空間に配置し、それら検索対象情報を立体的に表示する方法が採用されている。具体的には、検索対象情報の各々について、検索対象画像の色,形,大きさ,種類,内容およびキーワードなどの特徴量が抽出される。前記特徴量から特徴量ベクトルが生成され、この特徴量ベクトルに基づいて各検索対象情報相互間の類似尺度が算出される。多数の検索対象情報は、類似尺度が高くなる程に互いの距離が近くなるように探索空間内に配置され、第1の探索対象層を構成する。この第1の探索対象層から幾つかの検索対象情報を抽出することによって1つ上位の第2の探索対象層が構成され、さらに、第2の探索対象層から幾つかの検索対象情報を抽出することによって1つ上位の第3の探索対象層が構成される。このような検索対象情報の抽出作業を再帰的に実行することにより第1〜第n(nは2以上の整数)の探索対象層が構築される。また、ユーザーが情報を検索する際は、第1〜第nの探索対象層が立体的に表示される。
また、特許文献2(特開平11−175535号公報)に記載される画像検索方法は、画像の特徴量を統計処理して計算される多次元ベクトル空間から1軸,2軸または3軸を選択し、選択した軸の座標空間に画像を縮小して配置し、その結果を表示するものである。
従来の画像検索方法では、検索対象となる多数の画像の特徴量を十分に活かした検索処理が実行されているとは言い難く、効率良く且つ簡便に検索したいというユーザーの要望に応え得る検索方法が求められていた。
第1の発明は、画像検索方法であって、(a)複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するステップと、(b)前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得るステップと、(c)前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、(d)N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索するステップと、を備えることを特徴としている。
第2の発明は、画像検索方法であって、(a)複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するステップと、(b)前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得るステップと、(c)前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、(d)前記ステップ(c)で関連付けがなされた前記検索対象画像群で下位の階層を構築するステップと、(e)前記下位の階層から、M個(Mは2以上の整数)の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するステップと、(f)前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、(g)N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索するステップと、を備え、前記ステップ(e)および(f)を再帰的に実行することにより複数の階層を構築することを特徴としている。
第3の発明は、画像検索装置であって、複数の検索対象画像を蓄積する記憶装置と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築部と、N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索部と、を備えることを特徴としている。
第4の発明は、画像検索装置であって、複数の検索対象画像を蓄積する記憶装置と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築するネットワーク構築部と、N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索部と、を備え、前記ネットワーク構築部は、前記下位の階層から、M個(Mは2以上の整数)の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成する処理と、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける処理とを再帰的に実行することにより複数の階層を構築する、ことを特徴としている。
第5の発明は、画像検索プログラムを記録した記録媒体であって、複数の検索対象画像を記憶装置に記憶させる記憶処理と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築処理と、N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させることを特徴としている。
第6の発明は、画像検索プログラムを記録した記録媒体であって、複数の検索対象画像を記憶装置に記憶させる記憶処理と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築する下位階層構築処理と、N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させるとともに、前記下位の階層から、M個(Mは2以上の整数)の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するとともに、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける上位階層構築処理をコンピュータに再帰的に実行させることにより複数の階層を構築することを特徴としている。
図2は、4分割された静止画像を模式的に示す図であり、
図3は、5分割された静止画像を模式的に示す図であり、
図4は、一連の映像ショットを模式的に示す図であり、
図5は、検索対象画像と特徴量との対応関係を示す図であり、
図6は、データベースのトポロジー(接続形態)を概略的に示す図であり、
図7は、データベースのデータ配列を模式的に示す図であり、
図8は、ネットワーク型データベースの構築処理の手順を示すフローチャートであり、
図9(a)は、新規画像を登録する前のネットワークのデータ配列を示す図、図9(b)は、新規画像を登録した後のネットワークのデータ配列を示す図であり、
図10は、データベースを用いた検索処理の手順を示すフローチャートであり、
図11は、一覧表示処理の手順を示すフローチャートであり、
図12は、表示画面の一例を概略的に示す図であり、
図13は、表示画面の一例を概略的に示す図であり、
図14は、データベースのトポロジーの一例を概略的に示す図であり、
図15は、表示画面の一例を概略的に示す図であり、
図16は、表示画面の一例を概略的に示す図であり、
図17は、表示画面の一例を概略的に示す図であり、
図18は、表示画面の一例を概略的に示す図であり、
図19は、表示画面の一例を概略的に示す図であり、
図20は、階層化処理の手順を概略的に示すフローチャートであり、
図21は、階層化の一手順を説明するためのトポロジーの一例を示す図であり、
図22は、階層化の一手順を説明するためのトポロジーの一例を示す図であり、
図23は、階層化ネットワーク型データベースを模式的に示す図であり、
図24は、階層化ネットワーク型データベースを用いた画像検索処理の手順を示すフローチャートであり、
図25は、階層間移動処理の手順を示すフローチャートであり、
図26は、階層間移動処理の一手順を説明するための図であり、
図27は、階層間移動処理の一手順を説明するための図である。
図1は、本発明に係る実施例の画像検索装置1の構成を概略的に示す機能ブロック図である。画像検索装置1は、信号処理部10,特徴量取得部11,ネットワーク構築部12,メインコントローラ(画像検索部)13,画像合成部14,画像データベース19およびネットワークデータベース20を備えている。これら機能ブロック10〜14,19,20は、制御信号やデータ信号を伝達するバス21を介して相互に接続されている。
また、メインコントローラ13は、ユーザーの指示が入力される操作部16とユーザーインターフェース15を介して接続され、画像合成部14は、出力インターフェース17を介して表示部18と接続されている。表示部18は、静止画像や動画像を表示し得る解像度を持つディスプレイ装置である。操作部16は、ユーザーの入力指示をユーザーインターフェース15を介してメインコントローラ13に与えることができ、具体的には、表示部18の画面上の座標位置を検出するマウスなどのポインティング・デバイスとキーボードとを備えている。操作部16として、表示部18の画面上でユーザーの指などが触れた位置を検知して当該位置に応じた指示をメインコントローラ13に与えるタッチスクリーン、あるいは、ユーザーが発した音声を認識してその結果をメインコントローラ13に与える音声認識装置を採用してもよい。
メインコントローラ13は、機能ブロック10〜14,19,20の動作を制御する機能を有し、各種検索処理を実行する階層選択部13A,画像選択部13Bおよび表示制御部13Cを備えている。メインコントローラ13は、マイクロプロセッサ,制御プログラムなどを格納するROM,RAM,内部バスおよび入出力インターフェースなどを備えた集積回路で構成されればよい。階層選択部13A,画像選択部13Bおよび表示制御部13Cは、マイクロプロセッサで実行されるプログラムまたは一連の命令群で構成されてもよいし、ハードウェアで構成されてもよい。また、本実施例では、前記特徴量取得部11とネットワーク構築部12はそれぞれ独立したハードウェアで構成されているが、この代わりに、メインコントローラ13のマイクロプロセッサで実行されるプログラムまたは一連の命令群で構成されてもよい。
また、特徴量取得部11,ネットワーク構築部12およびメインコントローラ13による検索処理をマイクロプロセッサで実行する画像検索プログラムを、HDD,不揮発性メモリ,光ディスクまたは磁気テープなどの記録媒体に記録しこれを用いてもよい。
前記信号処理部10は、外部からの入力画像信号を取り込み、これを所定のタイミングでバス21を介して画像データベース19に転送する機能を有する。アナログ信号が入力した場合は、信号処理部10は入力画像信号をA/D変換した後に画像データベース19に転送する。入力画像信号の符号化方式としては、JPEG(Joint Photographic Experts Group),GIF(Graphic Interchange Format)およびビットマップなどの静止画像符号化方式,並びに、Motion−JPEG,AVI(Audio Video Interleaving)およびMPEG(Moving Picture Experts Group)などの動画像符号化方式が挙げられる。入力画像信号の供給源としては、たとえば、ムービーカメラ,デジタルカメラ,テレビチューナ,DVDプレーヤ(Digital Versatile Disk Player),コンパクトディスクプレーヤ,ミニディスクプレーヤ,スキャナ,インターネットなどの広域ネットワークが挙げられる。
画像データベース19は、HDDなどの大容量記憶装置において構築され、バス21を介して転送された静止画像および動画像(以下、検索対象画像と称する。)を既存のファイルシステムに従って記録し管理する。後述するように、特徴量取得部11とネットワーク構築部12は、画像データベース19に記録されている検索対象画像群を網の目状に関連付けることによってネットワーク型データベースを構築しこれをネットワークデータベース20に記録する。
特徴量取得部11は、多数の検索対象画像の各々の特徴量を取得する処理(特徴量取得処理)を行う機能ブロックである。具体的には、特徴量取得部11は、画像データベース19に記録されている多数の検索対象画像から、これら検索対象画像に共通の構成要素、たとえば、各画素を構成する一組の色成分あるいはメタデータを抽出する。一組の色成分としては、たとえば、R(赤色),G(緑色)およびB(青色)の色成分の組や、Y(輝度),Cb(色差)およびCr(色差)の色成分の組が挙げられる。メタデータとしては、検索対象画像に付加されている属性,意味内容,取得先もしくは格納場所などの情報が挙げられる。より具体的には、タイ卜ル,記録日時(絶対時間/相対時間),取得場所(緯度/経度/高度),ジャンル,出演者,キーワード,コメント,価格(円/ドル/ユーロ)および画像サイズなどの情報をメタデータとして抽出することができる。
特徴量取得部11は、検索対象画像から抽出した構成要素に基づいて、検索対象画像の各々を特徴付ける複数の特徴値の組すなわち特徴量を算出する。ネットワーク構築部12は、前記特徴量取得部11で算出された特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けることによってネットワーク型データベースを構築する。以下、検索対象画像が静止画像であって、静止画像から抽出された構成要素がR,G,Bの色成分である場合の類似尺度の算出方法について説明する。
特徴量取得部11は、画像データベース19から静止画像を読み出し、この静止画像をM個(Mは2以上の整数)のブロックに分割する。たとえば、図2に示すように静止画像30を4つのブロックB1,B2,B3,B4に分割したり、あるいは、図3に示すように静止画像30を5つのブロックB1,B2,B3,B4,B5に分割したりすることができる。次いで、各ブロックのR成分,G成分,B成分のそれぞれの平均値すなわち特徴値が算出される。
画像データベース19に格納されているk番目(kは1以上の整数)の静止画像中のm+1番目(mは1以上の整数)のブロックにおいて、i番目(iは1以上の整数)のR成分,G成分およびB成分をそれぞれri(k,m),gi(k,m)およびbi(k,m)で表し、m番目ブロックのR成分,G成分およびB成分の平均値をそれぞれ<r(k,m)>,<g(k,m)>および<b(k,m)>で表し、当該ブロックに含まれるR成分,G成分およびB成分の各総数をNで表すとすると、平均値<r(k,m)>,<g(k,m)>および<b(k,m)>は次式(1)で与えられる。
上式(1)は、R成分,G成分,B成分のそれぞれの算術平均値を与えるものであるが、算術平均値の代わりに、R成分,G成分,B成分のそれぞれの幾何平均値,調和平均値または重みづけ平均値を算出してもよい。なお、算術平均値は、2つの数a,bに対して(a+b)/2を与え、幾何平均値は、2つの正数a,bに対して(ab)1/2を与え、調和平均値は、2つの数a,bに対して逆数の算術平均値の逆数(=2ab/(a+b))を与え、そして重み付け平均値は、2つの数a,bに対してa,bそれぞれに係数α,βを乗じて加算した値(=αa+βb)を与える。
次に、上式(1)に示すようにx(k,3m−2),x(k,3m−1),x(k,3m)を定義すると、次式(2)で与えられる3xM次元のベクトル量Xkが構成される。
前記ベクトル量Xkを距離空間(metric space)上の一要素として扱うことによって、2つの検索対象画像間のユークリッド距離を定義することができる。すなわち、p番目(pは1以上の整数)の画像とq番目(qは1以上の整数)の画像との間のユークリッド距離D(p,q)は、次式(3)で定義される。
特徴量取得部11は、上記ベクトル量Xkを当該検索対象画像を特徴付ける固有の特徴量であるとみなし、前記ユークリッド距離D(p,q)を類似尺度として算出する。本実施例では、2つの検索対象画像が互いに類似するほどにユークリッド距離は小さくなり、類似尺度は小さな値をとることとなる。この代わりに、ユークリッド距離の逆数を類似尺度として定義し、2つの検索対象画像が互いに類似するほどに類似尺度が大きな値をとるように構成を変更してもよい。
なお、上記ユークリッド距離の代わりにマンハッタン距離(街路距離)を用いることも可能である。マンハッタン距離D(p,q)は、次式(3A)で定義される。
次に、検索対象画像が複数のフレームからなる動画像であって、各フレームから抽出された構成要素がR,G,Bの色成分である場合の類似尺度の算出方法について説明する。図4に示すように、動画像データは、一連の映像ショットS1,S2,…,SNs(Nsは2以上の整数)から構成されており、各映像ショットは複数のフレームで構成されるものとする。たとえば、最初の映像ショットS1は、連続するn枚(nは2以上の整数)のフレーム301,302,…,30nで構成されている。連続する映像ショットと映像ショットとの間には、フレーム間の相関が著しく小さくなるカット点(シーンチェンジ)Sc,Sc,…が発生する。特徴量取得部11は、各シーンチェンジScを検出することで各映像ショットを識別することができる。
特徴量取得部11は、各映像ショットSk(kは1〜Nsの整数)のフレームをM個(Mは2以上の整数)のブロックB1,B2,…に分割する。たとえば、図4に示すようにフレームを4分割すればよい。次いで、特徴量取得部11は、各ブロックのR成分,G成分,B成分それぞれの平均値を算出し、これら平均値を複数のフレームに亘って平均化することで特徴値を算出する。具体的には、k番目の映像ショットSkにおいて、s番目(sは1〜Nk;Nkは1以上の整数)のフレームのm番目ブロックのi番目のR成分,G成分およびB成分を、それぞれ、r(i,s;k,m),g(i,s;k,m)およびb(i,s;k,m)としたとき、k番目映像ショットSkを特徴付けるm+1番目ブロックの特徴値<R(k,m)>,<G(k,m)>,<B(k,m)>は次式(4)で与えられる。
次に、上式(4)に示すようにx(k,3m−2),x(k,3m−1),x(k,3m)を定義することで、上式(2)で与えられるベクトル量Xkを構成することができる。前記ベクトル量Xk距離空間(metric space)上の要素として扱い、上式(3)に示したように、2つの映像ショット間のユークリッド距離D(p,q)を類似尺度として定義することができる。なお、ユークリッド距離D(p,q)の増加に対して減少する値,たとえば逆数,を類似尺度として定義してもよい。
次に、検索対象画像から抽出された構成要素がメタデータである場合の類似尺度の算出方法について説明する。特徴量取得部11は、メタデータ自体またはメタデータに含まれる情報を特徴量として用いて、検索対象画像間のメタデータの一致率に比例または反比例する値を上記類似尺度として算出する機能を有している。具体的には、メタデータが撮影日時や撮影場所,価格などの数値情報を含む場合は、その数値情報を特徴量Xkとして扱い、p番目画像の特徴量Xpとq番目画像の特徴量Xqとの間の差分を類似尺度D(p,q)として算出することができる。
メタデータがジャンルもしくはキーワードなどの数値表現が難しい情報を含む場合は、ジャンルやキーワードに含まれている数値,たとえば,「面白さ度数90%,興奮度90%」といった客観的な指数を特徴量Xkとして採用し、p番目画像の特徴量Xpとq番目画像の特徴量Xqとの差分を類似尺度D(p,q)として算出することができる。
また、メタデータがタイトル,出演者もしくはコメントなどの数値表現が不可能な符号列を含む場合は、その符号列を特徴量Xkとして用いて、p番目画像の文字列Xpとq番目画像の文字列Xqとの間の一致率または不一致率に比例する値を類似尺度D(p,q)として算出することができる。たとえば、2つの文字列Xp,Xqが一致する場合は類似尺度D(p,q)を”1”に設定し、2つの文字列Xp,Xqが不一致である場合は類似尺度D(p,q)を”0”に設定することができる。あるいは、2つの文字列Xp,Xqが完全に一致する場合は類似尺度D(p,q)を”2”に設定し、2つの文字列Xp,Xqの一部が一致する場合は類似尺度D(p,q)を”1”に設定し、2つの文字列Xp,Xqが完全に一致しない場合は類似尺度D(p,q)を”0”に設定することができる。
特徴量取得部11は、上記特徴量Xkを算出するとともに、当該特徴量Xkを検索対象画像と対応付けてネットワークデータベース20に格納する。図5は、k番目の検索対象画像と特徴量Xkとの対応関係を概略的に示す図である。各検索対象画像はインデックス番号kが付されており、このインデックス番号kに対応する特徴量Xkがネットワークデータベース20に格納されている。ネットワーク構築部12は、図5に示されるような対応テーブルを参照して2つの検索対象画像間の類似尺度D(p,q)を算出する。次いで、ネットワーク構築部12は、類似尺度D(p,q)が次式(5)に示される関係式を満たすか否かを判定し、下記関係式(5)を満たす場合にp番目画像とq番目画像とは相互に類似していると判断し、これら検索対象画像を相互に関連付けることによってネットワーク型データベースを構築しこれをネットワークデータベース20に格納する。
上式(5)中、Rthは類似尺度の閾値である。閾値Rthは、各検索対象画像について平均して5〜10個程度の画像を関連付け可能な値に設定されることが望ましい。また、関連付けられた検索対象画像間の表示リンク距離は全て等しい値に設定される。本実施例では、表示リンク距離は「1」に設定されるが、それに限定されるものではない。
図6は、前記ネットワーク型データベースのトポロジー(接続形態)を概略的に示す図であり、図7は、当該ネットワーク型データベースのデータ配列を概略的に示す図である。図6を参照すると、検索対象画像I1,I2,…は,リンクC1,2,C1,4,…を介して相互に関連付けられている。リンクCp,qは、2つの検索対象画像Ip,Iq間の関連付けを示す接続線であり、各リンクの距離(表示リンク距離)は「1」に設定されている。検索対象画像I1,I2,…は、リンクC1,2,C1,4,…の両端位置(節点)に配置されると考えてもよい。
また、2つの前記検索対象画像間の表示リンク距離は、N個(Nは1以上の整数)のリンクを介して関連付けられている場合は「N」である。さらに言えば、2つの検索対象画像Ip,Iq間の表示リンク距離は、一方の検索対象画像Ipから他方の検索対象画像Iqへ辿る経路のうち最短経路のリンク数と定義され得る。たとえば、検索対象画像I1は、1個の画像I2を介して画像I5と間接的に関連付けられ、2個の画像I2,I5を介して画像I9と関連付けられているため、画像I1と画像I5との間の表示リンク距離は「2」であり、画像I1と画像I9との間の表示リンク距離は「3」である。
図7を参照すると、上記ネットワーク型データベースのデータ配列は、画像配列PAと接続配列CA1,CA2,…との二重配列構造を有している。画像配列PAは、接続配列CA1,CA2,…へのポインタ’1’,’2’,’3’,…を格納する配列であり、接続配列CA1,CA2,…は、検索対象画像I1,I2,…のインデックス番号(以下、画像番号と呼ぶ。)の配列である。画像番号は、各配列において昇順に連続的に並んでいる。xは、画像配列または接続配列の終端を示す記号である。
次に、図8を参照しつつ、ネットワーク型データベースの構築処理の手順を説明する。以下、K個(Kは0以上の整数)の検索対象画像によって既にネットワーク型データベースが構築されており、K+1番目の新規画像IK+1をデータベースに登録する処理について説明する。このとき、図9(a)に示すように、新規画像IK+1の登録前のデータ配列は、接続配列CA1〜CAKと、これら接続配列それぞれへのポインタ’1’,’2’,’3’,…’K’を有する画像配列PAとで構成されている。なお、K=0の場合は、新規データベースを構築する場合に該当する。
図8を参照すると、まず、メインコントローラ13は、信号処理部10から入力した新規画像IK+1を画像データベース19に記録し(ステップS1)、新規画像IK+1をネットワークデータベース20に追加する(ステップS2)。このとき、図9(b)に示すように、新規画像IK+1用の接続配列CAK+1の領域が確保され、画像配列PAに前記接続配列CAK+1へのポインタ’K+1’が追加される。
次に、メインコントローラ13は、特徴量取得部11に新規画像IK+1の特徴量XK+1を算出させる(ステップS3)。このとき、特徴量取得部11は、新規画像IK+1から、R,G,Bの色成分もしくはメタデータなどの構成要素を抽出し、前記構成要素を用いて特徴量XK+1を算出してこれをネットワークデータベース20に記録する。
続くステップS4〜S9で、登録済みの画像I1〜IKと新規画像IK+1との間の関連付け処理が実行される。すなわち、画像番号jが初期値(=1)に設定される(ステップS4)。次いで、特徴量取得部11は、ネットワークデータベース20から、画像データベース19に記録されているj番目画像Ijの特徴量Xjを取得する(ステップS5)。ここで、特徴量取得部11がネットワークデータベース20から特徴量Xjを取得する代わりに、j番目画像Ijの特徴量Xjを新たに算出してもよい。
続いて、ネットワーク構築部12は、特徴量Xj,XK+1を用いて、j番目画像Ijと新規画像IK+1との間の類似尺度D(j,K+1)を算出する(ステップS6)。さらに、ネットワーク構築部12は、類似尺度D(j,K+1)が上記関係式(5)を満たすか否かを判定し(ステップS7)、類似尺度D(j,K+1)がその関係式(5)を満たさないと判定した場合は、ステップS9に処理が移行する。
一方、前記ステップS7において、類似尺度D(j,K+1)が関係式(5)を満たすと判定した場合は、ネットワーク構築部12は、j番目画像Ijと新規画像IK+1とは互いに類似すると判断し、両画像Ij,IK+1を関連付ける(ステップS8)。具体的には、図9(b)に示すように、新規画像IK+1用の接続配列CAK+1にj番目画像Ijの画像番号jが追加され、画像配列PAのポインタ’j’に対応する接続配列CAjに新規画像IK+1の画像番号K+1が追加される。そして、ネットワーク構築部12は、このデータ配列をネットワークデータベース20に記録する。その後、ステップS9に処理が移行する。
ステップS9では、メインコントローラ13が、全ての画像I1〜IKについて処理が終了したか否かを判定し、当該処理が終了しないと判定した場合は、画像番号jをインクリメントして(ステップS12)、上記ステップS5以後の処理を繰り返し実行する。一方、メインコントローラ13は,全ての画像I1〜IKについて処理が終了したと判定した場合(ステップS9)、上記ステップS8で関連付ける画像が1つも無いか否かを判定する(ステップS10)。前記ステップS10で関連付ける画像が1つでも存在したと判定された場合、以上のデータベース構築処理は終了する。一方、前記ステップS10で関連付ける画像が1つも無いと判定された場合は、ネットワーク構築部12は、新規画像1K+1との類似尺度D(j,k+1)の値が最も小さい画像Ijを、新規画像IK+1と関連付ける(ステップS11)。以上でデータベース構築処理は終了する。
次に、図10,図11を参照しつつ、上記ネットワーク型データベースを用いた検索処理を以下に説明する。図10は、画像検索処理の手順を示すフローチャートであり、図11は、図10のフローチャートで使用される一覧表示処理の手順を示すフローチャートである。
まず、操作部16からの入力指示に応じて、メインコントローラ13は、画像の一覧表示処理(図11)を実行する(ステップS20)。図11を参照すると、画像選択部13B(図1)は、表示リンク距離を初期値Rdに設定し(ステップS30)、その後、ネットワークデータベース20を参照し、主画像との表示リンク距離が初期値Rd以下となる画像を副画像として設定する(ステップS31)。ここで、初期値Rdは、操作部16を介してユーザーによって指定され得るが、特に指定が無い場合は、予め登録した値,たとえば「5」に設定される。また、主画像は、ネットワークデータベース20に登録されている画像群の中から任意に選択され得るが、特に指定が無い場合は、画像番号「1」の画像I1が主画像として選択される。
次に、表示制御部13Cは、上記ステップS31で選択した主画像と副画像とを表示部18に一覧形式で1画面に表示させる(ステップS32)。具体的には、表示制御部13Cは、画像データベース19に記録されている主画像と副画像を読み出し、これらをバス21を介して画像合成部14に転送する。画像合成部14は、転送された主画像と副画像の解像度を変換して得たサムネイルサイズの画像群を合成し、出力インターフェース17を介して表示部18に出力する。ここで、サムネイル画像の表示順を主画像とのリンク距離の昇順とすることで主画像と類似尺度が高い副画像を優先して表示するのが好ましい。
図12は、表示部18の表示画面40を概略的に示す図である。表示画面40には、主画像I1が表示され、この主画像I1に類似する副画像I2〜I25が表示されている。全ての副画像を1画面に表示できない場合、ユーザーは、操作部16を入力操作することで次画面選択ボタン41Nを指定して残る副画像群を次画面に一覧表示させることができる。また、ユーザーは、前画面選択ボタン41Bを指定して表示画面を前画面に戻すことも可能である。ここで、主画像と副画像のサムネイル画像を予め生成して画像データベース19に格納しておき、画像合成部14が、高解像度の主画像と副画像とを画像データベース19から読み出す代わりに、サムネイル画像を読み出してもよい。
ユーザーは、目的画像を見つけた場合は、操作部16を入力操作して画面40に表示された画像群の中から所望の目的画像を指定することができる。あるいは、目的画像を発見できない場合、ユーザーは、操作部16を入力操作して目的画像以外の副画像を次の主画像として指定することもできる。画像選択部13Bは、操作部16からの入力指示を検出することにより、目的画像の指定の有無を判定する(ステップS33)。ユーザーが目的画像を指定したとき、画像選択部13Bは目的画像の指定有りと判定して以上の処理を終了させる。一方、ユーザーが目的画像以外の副画像を次の主画像として指定したとき、画像選択部13Bは、目的画像の指定無しと判定し(ステップS33)、指定された副画像を主画像に設定し(ステップS34)、その後、メインルーチン(図10)へ処理を戻す。
メインルーチンのステップS21では、画像選択部13Bは、主画像との表示リンク距離が設定値Rs以下となる画像を副画像として設定する(ステップS21)。その後、表示制御部13Cは、主画像と副画像とを表示部18に一覧形式で表示させる(ステップS22)。ここで、ユーザーは、操作部16を入力操作することでメインコントローラ13が保持する設定値Rsを適宜変更することができる。たとえば、図6に示したデータベースの場合、主画像I1に対して設定値Rsを「1」に設定した場合、画像選択部13Bは、主画像I1との表示リンク距離が「1」以下の画像I1,I3,I4を副画像として設定し、設定値Rsを「3」に設定した場合、画像選択部13Bは、主画像I1との表示リンク距離が「3」以下の画像I1,I3,I4,I5,I6,I7,I8,I9,I10,I11,I12,I13を副画像として設定することとなる。図13は、表示部18の表示画面40の一例を示す図である。表示画面40には、主画像I3が表示されるとともに、主画像I3との表示リンク距離が「1」以内の副画像I1,I2,I5,I6,I7がサムネイルサイズで一覧表示されている。
ユーザーは、操作部16を入力操作して、画面40に表示された画像群から所望の目的画像を指定することができる。画像選択部13Bは、操作部16からの入力指示を検出することにより、目的画像の指定の有無を判定する(ステップS23)。ユーザーが目的画像を指定したとき、画像選択部13Bは目的画像の指定有りと判定して画像検索処理を終了させる。
一方、ユーザーが目的画像を指定せず、その他の指示を入力した場合、画像選択部13Bは目的画像の指定無しと判定し(ステップS23)、その後、入力指示の種類に応じてステップS25またはS26のいずれか一方に処理が移行する(ステップS24)。ここで、入力指示が「一覧表示指示」である場合は、ステップS25の一覧表示処理(図11)が実行され、その後、ステップS21以後の処理が繰り返し実行される。一方、ユーザーが表示画面40の中の副画像の1つを主画像に変更する指示を入力した場合、画像選択部13Bは「継続指示」があったと判定し(ステップS24)、指定された副画像を次の主画像に設定する(ステップS26)。その後、ステップS21以後の処理が繰り返し実行される。
たとえば、ユーザーが副画像I6指定して継続指示を入力した場合、図14に示すように主画像は画像I3から画像I6に変更され、表示画面40は図15に示す画像に変化する。図15に示す表示画面40には、主画像I6が表示されるとともに、主画像I6との表示リンク距離が「1」以内の副画像I3,I5,I10,I11,I12がサムネイルサイズで一覧表示されている。ユーザーは、表示画面40に主画像に指定すべき副画像が存在しない場合は、たとえば、図12に示すように多数のサムネイル画像を一覧表示させることにより(ステップS25)、主画像に指定すべき画像を素早く見つけることができる。
このように、ユーザーは、所望の目的画像を効率良く且つ簡便に検索することができる。また、上記画像検索処理は、主にデータベースのリンク情報のみを使用しているため、複雑な処理をせずに少ない演算量で高速に検索することが可能である。
ところで、図13に示した画面40では、表示領域全体と比べて主画像I3の水平画素数は多く且つその垂直画素数は少ないため、主画像I3は上方に配置され、主画像I3との重複面積が小さくなるように下方の表示領域に副画像I1,I2,…が水平方向に沿って配列させられている。これに対し、図15に示した画面40では、表示領域全体と比べて主画像I6の水平画素数は少なく且つその垂直画素数が多いため、主画像I6は右方に配置され、主画像I6との重複面積が小さくなるように左方の表示領域に副画像I3,I5,…が垂直方向に沿って配列させられている。このように、表示制御部13Cは、主画像と副画像の画像サイズに応じて最適な配列を構成することができる。図13と図15に示した配列の他に、図16〜図19に示す配列も可能である。図中、「M」は主画像を示し、「S」は副画像を示している。
なお、上記の画像検索処理では、表示画面40に表示される副画像は、主画像との表示リンク距離が設定値Rs以下の画像群であったが、この代わりに、主画像との表示リンク距離が設定値Rsあるいは設定値Rsを中心とした所定範囲内の画像を副画像として設定し表示画面40に表示してもよい。たとえば、設定値Rs=3の場合、主画像との表示リンク距離が「3」の画像群のみを表示画面40に表示してもよいし、あるいは表示リンク距離が「2」,「3」,「4」の画像群のみを表示画面40に表示してもよい。
次に、上記ネットワーク型データベース(以下、「ネットワーク」と呼ぶ。)を用いた階層化処理を説明する。ネットワーク構築部12は、図8に示した処理手順で構築したネットワーク(以下、0次階層のネットワークと呼ぶ。)から、上位の階層のネットワークを構築することができる。すなわち、ネットワーク構築部12は、0次階層のネットワークから、N個(Nは1以上の整数)の検索対象画像を介して間接的に相互に関連付けられている検索対象画像群を抽出し、抽出された検索対象画像群で上位の階層に属する画像群を構成する。さらに、ネットワーク構築部12は、前記上位の階層において、前記0次階層で間接的に相互に関連付けられていた検索対象画像間を関連付け、且つ関連付けられた検索対象画像間の表示リンク距離を「1」に設定することにより、1次階層のネットワークを構築する。以上の処理を再帰的に実行することで、さらに上位の階層のネットワークを構築することが可能である。
以下、図20を参照しつつ、ネットワーク構築部12による階層化処理の一実施例を以下に説明する。図20は、階層化処理の手順を概略的に示すフローチャートである。まず、ネットワーク構築部12は、ネットワークデータベース20から0次階層のネットワークを読み込み(ステップS40)、1次階層のネットワークを構築すべく階層番号iを「1」に設定する(ステップS41)。その後、0次階層に属する複数の画像のうち起点画像が1つ選択される(ステップS42)。起点画像としては、操作部16を介してユーザーにより任意の画像が選択され得るが、特に指定が無い場合は、画像番号が最小の画像が選択される。図21は、0次階層のネットワークのトポロジーを概略的に示す図である。この図21では、画像I1が起点画像として選択される。
次に、ネットワーク構築部12は、起点画像を代表画像として設定し(ステップS43)、代表画像に隣接する画像,すなわち代表画像との表示リンク距離が「1」の画像を全て削除する(ステップS44)。たとえば、図21に示すように、代表画像I1に隣接する画像I2,I3,I4が削除される。その後、ネットワーク構築部12は、全画像について処理したか否かを判定し(ステップS45)、全画像について処理したと判定した場合は、ステップS47に処理を移行し、全画像について処理しないと判定した場合は、ステップS46に処理を移行する。
ステップS46では、前記ステップS44で削除された画像に隣接する画像が次の起点画像として選択される(ステップS46)。ここで、起点画像としては、複数の対象画像のうち画像番号が最小の画像が選択され、前の起点画像は再び選択されない。図21では、対象画像は、画像I5,I6,I7,I8であり、これらのうち画像番号が最小の画像I5が起点画像として選択される。続けて、上記ステップS43以後の処理が、ステップS45で全画像について処理が終了したと判定される迄、繰り返し実行される。この結果、図21に例示されるように、太枠で囲まれた画像I1,I5,I10,…が代表画像として設定される。
上記ステップS45で全ての画像について処理が終了したと判定した場合、ネットワーク構築部12は、代表画像群で上位のi次階層の画像群を構成し(ステップS47)、代表画像のうち、i−1次階層において表示リンク距離が「2」の2つの画像を互いに関連付け、且つ関連付けられた2つの画像間の表示リンク距離を全て「1」に設定する(ステップS48)。この結果、i次階層のネットワークが構築される。図22に示す例では、図21に示した太枠で囲まれた代表画像相互間にリンクC1,5,C1,6,C1,7,…が形成される。
次に、ネットワーク構築部12は、階層化処理を終了するか否かを判定し(ステップS49)、階層化処理を終了しないと判定した場合は、階層番号iをインクリメントして(ステップS50)、上記ステップS42以後の処理を繰り返し実行する。一方、階層化処理を終了すると判定した場合、ネットワーク構築部12は、階層化処理を終了し、構築した1次〜L次階層(Lは1以上の整数)のネットワークをネットワークデータベース20に記録する。この結果、図23に示すように、0次〜L次階層のネットワーク500〜50Lが構築されることとなる。
なお、上記ステップS44においては、代表画像に隣接する画像を削除する処理を実行していたが、この代わりに、代表画像との表示リンク距離が「N」(Nは2以上の整数)以下の画像を削除してもよい。
次に、図24と図25を参照しつつ、上記階層化ネットワークを用いた画像検索処理を説明する。図24は、メインコントローラ13による画像検索処理の手順を概略的に示すフローチャートである。
まず、ステップS60では、階層選択部13A(図1)は、ネットワークデータベース20に格納されている0次〜L次階層のネットワークのうち最上位のL次階層のネットワークを検索対象として選択する。この代わりに、最初の検索対象が操作部16を介してユーザーによって選択されてもよい。
次に、表示制御部13Cは、図11に示した画像の一覧表示処理を実行することにより、最上位階層に属する検索対象画像を表示部18に一覧表示させる(ステップS61)。すなわち、表示部18の画面40には、図12に示したように最上位階層に属する主画像と副画像とが一覧形式で表示される。ユーザーは、目的画像を見つけたとき、操作部16を入力操作して目的画像を指定することができる。かかる場合、本検索処理は終了する(図11,ステップS33)。目的画像を発見できないとき、ユーザーは、目的画像以外の画像を次の主画像として指定することができる。かかる場合は、指定した画像が主画像に設定される(図11,ステップS34)。
次のステップS62では、画像選択部13Bは、主画像との表示リンク距離が設定値Rs以下となる画像を副画像として設定する(ステップS62)。その後、表示制御部13Cは、主画像と副画像とを表示部18に一覧形式で表示させる(ステップS63)。ユーザーは、操作部16を入力操作して、画面40に表示された画像群から所望の目的画像を指定することができる。画像選択部13Bは、操作部16からの入力指示を検出することにより、目的画像の指定の有無を判定する(ステップS64)。ユーザーが目的画像を指定したとき、画像選択部13Bは目的画像の指定有りと判定して画像検索処理を終了させる。
一方、ユーザーが目的画像を指定せず、その他の指示を入力した場合、画像選択部13Bは目的画像の指定無しと判定し(ステップS64)、その後、入力指示の種類に応じてステップS66,S67またはS68のいずれかに処理が移行する。ここで、入力指示が「一覧表示指示」である場合は、ステップS66の一覧表示処理(図11)が実行され、その後、ステップS62以後の処理が繰り返し実行される。一方、ユーザーが副画像の1つを主画像に変更する指示を入力した場合、画像選択部13Bは、現在の階層で検索を続行する旨の「継続指示」があったと判定し(ステップS65)、指定された副画像を次の主画像に設定する(ステップS68)。その後、ステップS62以後の処理が繰り返し実行される。
他方、前記入力指示が「概略/詳細検索指示」である場合は、ステップS67の階層間移動処理が実行される。以下、図25のフローチャートを参照しつつ、階層選択部13Aによる階層間移動処理の手順を説明する。なお、図中の符号C1は、接続子を表している。
まず、階層選択部13Aは、ユーザーによる入力指示が「概略検索」または「詳細検索」のいずれであるかを判定する(ステップS70)。「詳細検索」の入力指示があった場合は、現在の階層よりも下位の階層のネットワークが存在するか否かを判定する(ステップS71)。下位の階層が存在しない場合は、メインルーチン(図24)に処理が移行し、ステップS62以後の処理が繰り返し実行される。
一方、前記ステップS71で下位の階層が存在すると判定した場合、階層選択部13Aは、図26に示すように検索対象を現在の階層50k+1(kは0以上の整数)から下位の階層50kへ切り換え(ステップS72)、メインルーチン(図24)に処理を戻す。その後、ステップS62以後の処理が繰り返し実行される。この結果、操作部16の表示画面40には、下位の階層50kに属する主画像と副画像とが表示されるため、ユーザーは、表示画面40を視認しつつ、下位の階層50kに存在するかもしれない目的画像を検索することができる。
上記ステップS70において、入力指示が「詳細検索」であると判定した場合、階層選択部13Aは、現在の階層よりも上位の階層のネットワークが存在するか否かを判定する(ステップS73)。上位の階層が存在しない場合は、メインルーチン(図24)に処理が移行し、ステップS62以後の処理が繰り返し実行される。
一方、前記ステップS73で上位の階層が存在すると判定した場合、階層選択部13Aは、上位の階層50k+1に主画像が存在するか否かを判定する(ステップS74)。図26に例示するように、現在と上位の階層50k,50k+1に主画像Ij存在する場合は、階層選択部13Aは、検索対象を現在の階層50kから上位の階層50k+1に切り換え(ステップS75)、その後、メインルーチン(図24)に処理を移行させる。一方、図27に例示するように、現在の階層50kに存在する主画像Ijが上位の階層50k+1に存在しない場合は、階層選択部13Aは、主画像Ijと隣接する,すなわち主画像Ijとの表示リンク距離が最短で且つ上位の階層にも存在する副画像Ij+1の1つを次の主画像に設定し(ステップS76)、検索対象を現在の階層50kから上位の階層50k+1に切り換え(ステップS75)、その後、メインルーチン(図24)に処理を戻す。その後、ステップS62以後の処理が繰り返し実行される。この結果、操作部16の表示画面40には、上位の階層50k+1に属する主画像と副画像とが表示されるため、ユーザーは、表示画面40を視認しつつ、上位の階層50k+1に存在するかもしれない目的画像を検索することができる。
このように、ユーザーは、階層間を移動しつつ、所望の目的画像を効率良く且つ簡便に検索することができる。また上記画像検索処理は、主にデータベースの階層情報とリンク情報のみを使用しているため、複雑な処理をせずに少ない演算量で高速に検索することが可能である。
以上,本発明に係る実施例の画像検索装置について説明した。上記実施例では、図6に示すようなネットワークのトポロジーは表示部18に表示されないが、ユーザーが目的画像を検索したり主画像を指定したりする場合にそのトポロジーを表示部18に立体的に表示してもよい。
本出願は、日本国特許出願第2004−106037号公報に基づくものであり、当該公報を援用することにより当該公報の開示内容を含むものである。
Claims (34)
- 画像検索方法であって、
(a)複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するステップと、
(b)前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得るステップと、
(c)前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、
(d)N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索するステップと、を備えることを特徴とする画像検索方法。 - 請求項1記載の画像検索方法であって、前記表示リンク距離は、N個の前記リンクを介して関連付けられている2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索方法。
- 請求項2記載の画像検索方法であって、前記ステップ(d)は、
(e)前記複数の検索対象画像のうち、少なくとも1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定するステップと、
(f)前記ステップ(e)の実行後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、
を備えることを特徴とする画像検索方法。 - 画像検索方法であって、
(a)複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するステップと、
(b)前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得るステップと、
(c)前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、
(d)前記ステップ(c)で関連付けがなされた前記検索対象画像群で下位の階層を構築するステップと、
(e)前記下位の階層から、M個(Mは2以上の整数)の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するステップと、
(f)前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、
(g)N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索するステップと、を備え、
前記ステップ(e)および(f)を再帰的に実行することにより複数の階層を構築することを特徴とする画像検索方法。 - 請求項4記載の画像検索方法であって、前記表示リンク距離は、N個の前記リンクを介して関連付けられている2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索方法。
- 請求項5記載の画像検索方法であって、前記ステップ(g)は、
(h)複数の前記階層の中から一の階層を検索対象として選択するステップと、
(i)前記ステップ(h)で選択された前記階層に属する複数の検索対象画像のうち、少なくとも1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定するステップと、
(j)前記ステップ(i)の実行後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、
をさらに備えることを特徴とする画像検索方法。 - 請求項4から請求項6のうちのいずれか1項に記載の画像検索方法であって、
(k)検索対象を下位の階層から上位の階層へ切り換えるステップと、
(m)前記上位の階層において前記主画像が存在しないときは、前記下位の階層において前記主画像との前記表示リンク距離が最短で且つ前記上位の階層に存在する検索対象画像を次の主画像として設定するステップと、
(n)前記ステップ(k)および(m)の実行後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、を備えることを特徴とする画像検索方法。 - 請求項4から請求項7のうちのいずれか1項に記載の画像検索方法であって、
(o)検索対象を上位の階層から下位の階層へ切り換えるステップと、
(p)前記ステップ(o)の実行後に、前記下位の階層において前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、をさらに備えることを特徴とする画像検索方法。 - 請求項1から請求項8のうちのいずれか1項に記載の画像検索方法であって、
前記ステップ(b)は、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける複数の特徴値を算出し、前記複数の特徴値の組を前記検索対象画像の距離空間上のベクトル量として記憶するステップを含み、
前記ステップ(c)は、前記ベクトル量を前記特徴量として用いて前記検索対象画像間の距離を前記類似尺度として算出するステップを含む、ことを特徴とする画像検索方法。 - 請求項9記載の画像検索方法であって、前記距離は、ユークリッド距離であることを特徴とする画像検索方法。
- 請求項9記載の画像検索方法であって、各前記検索対象画像は静止画像であり、前記ステップ(b)は、前記静止画像の各々を複数のブロックに分割し、各前記ブロックから抽出された複数の構成要素に基づいて、前記ブロックの各々について前記複数の特徴値を算出するステップを含む、ことを特徴とする画像検索方法。
- 請求項11記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値であることを特徴とする画像検索方法。
- 請求項9記載の画像検索方法であって、各前記検索対象画像は、連続する複数のフレームからなる動画像であり、前記ステップ(b)は、各前記フレームを複数のブロックに分割し、各前記ブロックから抽出された複数の構成要素に基づいて前記複数の特徴値を算出するステップを含む、ことを特徴とする画像検索方法。
- 請求項13記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値を前記複数のフレームに亘って平均化した値であることを特徴とする画像検索方法。
- 請求項1から請求項8のうちのいずれか1項に記載の画像検索方法であって、前記ステップ(a)は、前記検索対象画像の各々からメタデータを前記構成要素として抽出するステップを含むことを特徴とする画像検索方法。
- 請求項15記載の画像検索方法であって、前記ステップ(c)は、前記メタデータを前記特徴量として用いて、前記検索対象画像間の前記メタデータの一致率に比例または反比例する値を前記類似尺度として算出するステップを含むことを特徴とする画像検索方法。
- 画像検索装置であって、
複数の検索対象画像を蓄積する記憶装置と、
複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、
前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築部と、
N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索部と、
を備えることを特徴とする画像検索装置。 - 請求項17記載の画像検索装置であって、前記表示リンク距離は、N個の前記リンクを介して関連付けられている2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索装置。
- 請求項18記載の画像検索装置であって、前記画像検索部は、
前記複数の検索対象画像のうち、少なくとも1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定する画像選択部と、
前記主画像と前記副画像とが設定された後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させる表示制御部と、
を備えることを特徴とする画像検索装置。 - 画像検索装置であって、
複数の検索対象画像を蓄積する記憶装置と、
複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、
前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築するネットワーク構築部と、
N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索部と、を備え、
前記ネットワーク構築部は、前記下位の階層から、M個(Mは2以上の整数)の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成する処理と、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける処理とを再帰的に実行することにより複数の階層を構築する、ことを特徴とする画像検索装置。 - 請求項20記載の画像検索装置であって、前記表示リンク距離は、N個の前記リンクを介して関連付けられている2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索装置。
- 請求項21記載の画像検索装置であって、前記画像検索部は、
複数の前記階層の中から一の階層を検索対象として選択し、これに属する複数の検索対象画像のうち、少なくとも1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定する画像選択部と、
前記主画像と前記副画像とが設定された後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させる表示制御部と、
を備えることを特徴とする画像検索装置。 - 請求項20から請求項22のうちのいずれか1項に記載の画像検索装置であって、
前記画像検索部は、検索対象を下位の階層から上位の階層へ切り換える階層選択部をさらに備え、
前記階層選択部は、前記上位の階層において前記主画像が存在しないときは、前記下位の階層において前記主画像との前記表示リンク距離が最短で且つ前記上位の階層に存在する検索対象画像を次の主画像として設定した後に前記検索対象を切り換え、
前記表示制御部は、前記階層選択部により前記検索対象が切り換えられた後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させることを特徴とすることを特徴とする画像検索装置。 - 請求項20から請求項23のうちのいずれか1項に記載の画像検索装置であって、
前記画像検索部は、検索対象を上位の階層から下位の階層へ切り換える階層選択部をさらに備え、
前記表示制御部は、前記階層選択部により前記検索対象が切り換えられた後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させることを特徴とする画像検索装置。 - 請求項17から請求項24のうちのいずれか1項に記載の画像検索装置であって、
前記特徴量取得部は、前記複数の構成要素に基づいて前記検索対象画像の各々を特徴付ける複数の特徴値を算出し、前記複数の特徴値の組を前記検索対象画像の距離空間上のベクトル量として記憶し、
前記ネットワーク構築部は、前記ベクトル量を前記特徴量として用いて前記検索対象画像相互間の距離を前記類似尺度として算出することを特徴とする画像検索装置。 - 請求項25記載の画像検索方法であって、前記距離は、ユークリッド距離であることを特徴とする画像検索方法。
- 請求項25記載の画像検索装置であって、各前記検索対象画像は静止画像であり、前記特徴量取得部は、前記静止画像の各々を複数のブロックに分割し、各前記ブロックから抽出された複数の構成要素に基づいて、前記ブロックの各々について前記複数の特徴値を算出することを特徴とする画像検索装置。
- 請求項27記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値であることを特徴とする画像検索装置。
- 請求項25記載の画像検索方法であって、各前記検索対象画像は、連続する複数のフレームからなる動画像であり、前記特徴量取得部は、各前記フレームを複数のブロックに分割し、各前記ブロックから抽出された複数の構成要素に基づいて前記複数の特徴値を算出することを特徴とする画像検索方法。
- 請求項29記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値を前記複数のフレームに亘って平均化した値であることを特徴とする画像検索装置。
- 請求項17から請求項24のうちのいずれか1項に記載の画像検索方法であって、前記特徴量取得部は、前記検索対象画像の各々からメタデータを前記構成要素として抽出することを特徴とする画像検索装置。
- 請求項31記載の画像検索方法であって、前記ネットワーク構築部は、前記メタデータを前記特徴量として用いて、前記検索対象画像間の前記メタデータの一致率に比例または反比例する値を前記類似尺度として算出することを特徴とする画像検索方法。
- 複数の検索対象画像を記憶装置に記憶させる記憶処理と、
複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、
前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築処理と、
N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させることを特徴とする画像検索プログラムを記録した記録媒体。 - 複数の検索対象画像を記憶装置に記憶させる記憶処理と、
複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、
前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築する下位階層構築処理と、
N個(Nは1以上の整数)の前記リンクを介して関連付けられている2つの前記検索対象画像間の表示リンク距離をNとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させるとともに、
前記下位の階層から、M個(Mは2以上の整数)の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するとともに、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける上位階層構築処理をコンピュータに再帰的に実行させることにより複数の階層を構築することを特徴とする画像検索プログラムを記録した記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004106037 | 2004-03-31 | ||
JP2004106037 | 2004-03-31 | ||
PCT/JP2005/005649 WO2005096180A1 (ja) | 2004-03-31 | 2005-03-22 | 画像検索方法、装置及びプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2005096180A1 true JPWO2005096180A1 (ja) | 2008-02-21 |
JP4465534B2 JP4465534B2 (ja) | 2010-05-19 |
Family
ID=35063982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006511629A Active JP4465534B2 (ja) | 2004-03-31 | 2005-03-22 | 画像検索方法、装置及びプログラムを記録した記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20080235184A1 (ja) |
JP (1) | JP4465534B2 (ja) |
WO (1) | WO2005096180A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1755067A1 (en) * | 2005-08-15 | 2007-02-21 | Mitsubishi Electric Information Technology Centre Europe B.V. | Mutual-rank similarity-space for navigating, visualising and clustering in image databases |
JP4802790B2 (ja) * | 2006-03-20 | 2011-10-26 | セイコーエプソン株式会社 | サーバ装置 |
JP4891740B2 (ja) * | 2006-11-22 | 2012-03-07 | 株式会社日立製作所 | コンテンツ検索装置及びコンテンツ検索方法 |
JP5086617B2 (ja) * | 2006-11-27 | 2012-11-28 | シャープ株式会社 | コンテンツ再生装置 |
JP4296521B2 (ja) * | 2007-02-13 | 2009-07-15 | ソニー株式会社 | 表示制御装置、表示制御方法、およびプログラム |
JP4456617B2 (ja) | 2007-04-16 | 2010-04-28 | 富士通株式会社 | 類似分析装置、画像表示装置、および画像表示プログラム |
US7941442B2 (en) * | 2007-04-18 | 2011-05-10 | Microsoft Corporation | Object similarity search in high-dimensional vector spaces |
US7870130B2 (en) * | 2007-10-05 | 2011-01-11 | International Business Machines Corporation | Techniques for identifying a matching search term in an image of an electronic document |
JP5208001B2 (ja) * | 2008-06-09 | 2013-06-12 | ヤフー株式会社 | ベクトルデータ検索装置 |
JP5199939B2 (ja) * | 2009-04-15 | 2013-05-15 | ヤフー株式会社 | 画像検索装置、画像検索方法及びプログラム |
US8774526B2 (en) * | 2010-02-08 | 2014-07-08 | Microsoft Corporation | Intelligent image search results summarization and browsing |
JP5396451B2 (ja) * | 2011-10-12 | 2014-01-22 | 日立コンシューマエレクトロニクス株式会社 | 情報表示装置、および、情報表示方法 |
US9141676B2 (en) * | 2013-12-02 | 2015-09-22 | Rakuten Usa, Inc. | Systems and methods of modeling object networks |
CN107409193A (zh) * | 2014-12-15 | 2017-11-28 | 索尼公司 | 信息处理方法、影像处理装置和程序 |
KR102260631B1 (ko) * | 2015-01-07 | 2021-06-07 | 한화테크윈 주식회사 | 중복 이미지 파일 검색 방법 및 장치 |
JP6977715B2 (ja) * | 2016-04-11 | 2021-12-08 | ソニーグループ株式会社 | 情報処理装置、及び情報処理方法 |
JP7128555B1 (ja) * | 2021-05-19 | 2022-08-31 | 忠久 片岡 | データ照合方法 |
JP6964372B1 (ja) * | 2021-05-19 | 2021-11-10 | 忠久 片岡 | コード生成方法、コード生成装置、プログラム、データ照合方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10124525A (ja) * | 1996-10-23 | 1998-05-15 | Matsushita Electric Ind Co Ltd | 検索装置 |
JP3938815B2 (ja) * | 1998-10-02 | 2007-06-27 | 株式会社リコー | ノード作成方法、画像検索方法及び記録媒体 |
US6941321B2 (en) * | 1999-01-26 | 2005-09-06 | Xerox Corporation | System and method for identifying similarities among objects in a collection |
JP2001325294A (ja) * | 2000-05-17 | 2001-11-22 | Olympus Optical Co Ltd | 類似画像検索方法および類似画像検索装置 |
JP4078085B2 (ja) * | 2001-03-26 | 2008-04-23 | キヤノン株式会社 | 変倍画像生成装置、方法、及びそのコンピュータプログラムとコンピュータ読み取り可能な記憶媒体 |
-
2005
- 2005-03-22 JP JP2006511629A patent/JP4465534B2/ja active Active
- 2005-03-22 WO PCT/JP2005/005649 patent/WO2005096180A1/ja active Application Filing
- 2005-03-22 US US11/547,082 patent/US20080235184A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20080235184A1 (en) | 2008-09-25 |
WO2005096180A1 (ja) | 2005-10-13 |
JP4465534B2 (ja) | 2010-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4465534B2 (ja) | 画像検索方法、装置及びプログラムを記録した記録媒体 | |
TWI361619B (en) | Image managing apparatus and image display apparatus | |
JP3454764B2 (ja) | 内容ベースで映像を検索する検索システム及び検索方法 | |
JP3747589B2 (ja) | 画像特徴量比較装置および画像特徴量比較プログラムを記録した記録媒体 | |
CN101138233B (zh) | 用于选择视听节目部分的方法和设备 | |
JP3780623B2 (ja) | 動画像の記述方法 | |
JP4507991B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN100456294C (zh) | 图像显示控制装置和方法 | |
US8117204B2 (en) | Video browser for navigating linear video on small display devices using a similarity-based navigation hierarchy of temporally ordered video keyframes with short navigation paths | |
JPWO2009072466A1 (ja) | 画像分類装置および画像分類プログラム | |
JP2000276484A (ja) | 画像検索装置、画像検索方法及び画像表示装置 | |
JP2013105309A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2007041964A (ja) | 画像処理装置 | |
JP4197014B2 (ja) | 映像の検索方法および装置 | |
JPH06253255A (ja) | 映像インデックス表示装置 | |
JP4784656B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP4944183B2 (ja) | 情報処理装置および情報処理方法 | |
KR100319160B1 (ko) | 사건구간을기반으로하는동영상검색방법과검색데이타구성방법 | |
JP2001306579A (ja) | 情報検索装置、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2001243236A (ja) | 映像特徴抽出方法、映像特徴抽出装置、映像検索方法、映像検索装置、およびそのプログラムを記録した記録媒体 | |
Chang et al. | A video information system for sport motion analysis | |
JP3997882B2 (ja) | 映像の検索方法および装置 | |
JP2009022018A (ja) | 映像の検索方法および装置 | |
KR100319159B1 (ko) | 내용기반동영상검색데이터구성방법과동영상검색방법 | |
Zeng et al. | Video indexing by motion activity maps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100208 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |