WO2005096180A1

WO2005096180A1 - 画像検索方法、装置及びプログラムを記録した記録媒体

Info

Publication number: WO2005096180A1
Application number: PCT/JP2005/005649
Authority: WO
Inventors: Takeshi Nakamura
Original assignee: Pioneer Corporation
Priority date: 2004-03-31
Filing date: 2005-03-22
Publication date: 2005-10-13
Also published as: US20080235184A1; JP4465534B2; JPWO2005096180A1

Abstract

ＨＤＤなどの記憶装置に蓄積されている多数の画像の中から、ユーザーが所望の画像を効率良く且つ簡便に検索し得る画像検索装置が開示される。この画像検索装置は、複数の検索対象画像を蓄積する記憶装置と、前記複数の検索対象画像の各々から、前記複数の検索対象画像に共通の単数または複数の構成要素を抽出するとともに、前記単数または複数の構成要素を用いて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記類似尺度が所定範囲内であれば前記検索対象画像間をリンクを介して相互に関連付けるネットワーク構築部と、Ｎ個（Ｎは１以上の整数）の前記リンクを介して関連付けられている２つの前記検索対象画像間の表示リンク距離をＮとして算出しつつ画像を検索する画像検索部と、を備える。

Description

明細書

次に示すように国際調査機関が作成した。

画像検索方法、装置及びプログラムを記録した記録媒体

技術分野

本発明は、 HDD (ハードディスクドライブ)などの記憶装置に格納されている多数の画像の中から所望の画像を検索する技術に関する。

背景技術

HDDなどの大容量記憶装置に蓄積されている多数の静止画像あるいは動画像の中から、ユーザーが所望する画像を効率良く検索するために、従来から種々の画像検索方法が提案されている。一般に、この種の方法では、検索対象となる多数の画像の各々から時間情報や色情報などの特徴量を抽出し、これら特徴量に基づいて各画像間の類似尺度を算出し、前記類似尺度を基準として画像を互いに関連付けることによってデータベースが構築される。

たとえば、特許文献 1 (特開平 9一 2591 30号公報）に記載される情報探索方法では、多数の検索対象情報を 2次元または 3次元の階層空間に配置し、それら検索対象情報を立体的に表示する方法が採用されている。具体的には、検索対象情報の各々について、検索対象画像の色，形，大きさ，種類，内容およびキ一ワードなどの特徴量が抽出される。前記特徴量から特徴量ベクトルが生成され、この特徴量べクトルに基づいて各検索対象情報相互間の類似尺度が算出される。多数の検索対象情報は、類似尺度が高くなる程に互いの距離が近くなるように探索空間内に配置され、第 1の探索対象層を構成する。この第 1の探索対象層から幾つかの検索対象情報を抽出することによって 1つ上位の第 2の探索対象層が構成され、さらに、第 2の探索対象層から幾つかの検索対象情報を抽出することによって 1つ上位の第 3の探索対象層が構成される。このような検索対象情報の抽出作業を再帰的に実行することにより第 1〜第 n (nは 2以上の整数)の探索対象層が構築される。また、ユーザーが情報を検索する際は、第 1〜第 nの探索対象層が立体的に表示される。

また、特許文献 2 (特開平 1 1 - 1 75535号公報)に記載される画像検索方法は、画像の特徴量を統計処理して計算される多次元ベクトル空間から 1軸， 2軸または 3軸を選択し、選択した軸の座標空間に画像を縮小して配置し、その結果を表示するものである。

従来の画像検索方法では、検索対象となる多数の画像の特徴量を十分に活かした検索処理が実行されているとは言い難《効率良く且つ簡便に検索したいというユーザ一の要望に応え得る検索方法が求められていた。

発明の開示

以上の状況などに鑑みて本発明の主目的は、 HDDなどの記憶装置に蓄積されている多数の画像の中から、ユーザーが所望の画像を効率良く且つ簡便に検索することを可能にする画像検索方法，画像検索装置および画像検索プログラムを記録した記録媒体を提供することである。

第 1の発明は、画像検索方法であって、（a)複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するステップと、 (b)前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得るステップと、（c)前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、 (d) N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索するステップと、を備えることを特徴としている。

第 2の発明は、画像検索方法であって、（a)複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するステップと、 (b)前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得るステップと、（c)前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、（d)前記ステップ (c)で関連付けがなされた前記検索対象画像群で下位の階層を構築するステップと、（e)前記下位の階層から、 M個（M は 2以上の整数）の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するステップと、（f)前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、 (g) N 個（Nは 1以上の整数)の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索するステップと、を備え、前記ステップ (e)および (f)を再帰的に実行することにより複数の階層を構築することを特徴としている。

第 3の発明は、画像検索装置であって、複数の検索対象画像を蓄積する記憶装置と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築部と、 N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索部と、を備えることを特徴としている。

第 4の発明は、画像検索装置であって、複数の検索対象画像を蓄積する記憶装置と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築するネットワーク構築部と、 N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索部と、を備え、前記ネットワーク構築部は、前記下位の階層から、 M個（Mは 2以上の整数）の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成する処理と、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける処理とを再帰的に実行することにより複数の階層を構築する、ことを特徴としている。

第 5の発明は、画像検索プログラムを記録した記録媒体であって、複数の検索対象画像を記憶装置に記憶させる記憶処理と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築処理と、 N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させることを特徴としている。第 6の発明は、画像検索プログラムを記録した記録媒体であって、複数の検索対象画像を記憶装置に記憶させる記憶処理と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築する下位階層構築処理と、 N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させるとともに、前記下位の階層から、 M個 (Mは 2以上の整数）の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するとともに、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける上位階層構築処理をコンピュータに再帰的に実行させることにより複数の階層を構築することを特徴としている。

図面の簡単な説明

図 1は、本発明に係る実施例の画像検索装置の構成を概略的に示す機能ブロック図であり、

図 2は、 4分割された静止画像を模式的に示す図であり、

図 3は、 5分割された静止画像を模式的に示す図であり、

図 4は、一連の映像ショットを模式的に示す図であり、

図 5は、検索対象画像と特徴量との対応関係を示す図であり、

図 6は、データベースのトポロジー (接続形態）を概略的に示す図であり、

図 7は、データベースのデータ配列を模式的に示す図であり、

図 8は、ネットワーク型データベースの構築処理の手順を示すフローチャートであり、図 9 (a)は、新規画像を登録する前のネットワークのデータ配列を示す図、図 9 (b) は、新規画像を登録した後のネットワークのデータ配列を示す図であり、

図 1 0は、データベースを用いた検索処理の手順を示すフローチャートであり、図 1 1は、一覧表示処理の手順を示すフローチャートであり、

図 1 2は、表示画面の一例を概略的に示す図であり、

図 1 3は、表示画面の一例を概略的に示す図であり、

図 1 4は、データベースのトポロジーの一例を概略的に示す図であり、

図 1 5は、表示画面の一例を概略的に示す図であり、

図 1 6は、表示画面の一例を概略的に示す図であり、

図 1 7は、表示画面の一例を概略的に示す図であり、

図 1 8は、表示画面の一例を概略的に示す図であり、図 1 9は、表示画面の一例を概略的に示す図であり、

図 20は、階層化処理の手順を概略的に示すフローチャートであり、

図 21は、階層化の一手順を説明するためのトポロジーの一例を示す図であり、図 22は、階層化の一手順を説明するためのトポロジーの一例を示す図であり、図 23は、階層化ネットワーク型データべ一スを模式的に示す図であり、

図 24は、階層化ネットワーク型データベースを用いた画像検索処理の手順を示すフローチャートであり、

図 25は、階層間移動処理の手順を示すフ口一チヤ一卜であリ、

図 26は、階層間移動処理の一手順を説明するための図であり、

図 27は、階層間移動処理の一手順を説明するための図である。

発明を実施するための形態

以下、図面を参照しつつ本発明に係る種々の実施例について説明する。

図 1は、本発明に係る実施例の画像検索装置 1の構成を概略的に示す機能ブロック図である。画像検索装置 1は、信号処理部 1 0，特徴量取得部 1 1，ネットワーク構築部 1 2，メインコントローラ（画像検索部） 1 3，画像合成部 1 4,画像データべ一ス 1 9およびネットワークデータべ一ス 20を備えている。これら機能ブロック 1 0〜1 4， 1 9, 20 は、制御信号やデータ信号を伝達するバス 21を介して相互に接続されている。

また、メインコントローラ 1 3は、ユーザーの指示が入力される操作部 1 6とユーザーインターフェース 1 5を介して接続され、画像合成部 1 4は、出力インタ一フェース 1 7を介して表示部 1 8と接続されている。表示部 1 8は、静止画像や動画像を表示し得る解像度を持つディスプレイ装置である。操作部 1 6は、ユーザーの入力指示をユーザ一インターフェース 1 5を介してメインコントローラ 1 3に与えることができ、具体的には、表示部 1 8の画面上の座標位置を検出するマウスなどのポインティング'デバイスとキ —ボードとを備えている。操作部 1 6として、表示部 1 8の画面上でユーザーの指などが触れた位置を検知して当該位置に応じた指示をメインコントローラ 1 3に与えるタツチスクリーン、あるいは、ユーザーが発した音声を認識してその結果をメインコント口ーラ 1 3に与える音声認識装置を採用してもよい。

メインコントローラ 1 3は、機能ブロック 1 0〜 1 4， 1 9, 20の動作を制御する機能を有し、各種検索処理を実行する階層選択部 1 3A，画像選択部 1 3Bおよび表示制御部 1 3Cを備えている。メインコントローラ 1 3は、マイクロプロセッサ，制御プログラムなどを格納する ROM, RAM, 内部バスおよび入出力インタ一フェースなどを備えた集積回路で構成されればよい。階層選択部 13A,画像選択部 1 3Bおよび表示制御部 1 3Cは、マイクロプロセッサで実行されるプログラムまたは一連の命令群で構成されてもよいし、ハードウヱァで構成されてもよい。また、本実施例では、前記特徴量取得部 1 1とネットワーク構築部 1 2はそれぞれ独立したハードウ Iァで構成されているが、この代わりに、メインコントローラ 1 3のマイクロプロセッサで実行されるプログラムまたは一連の命令群で構成されてもよい。

また、特徴量取得部 1 1 ，ネットワーク構築部 1 2およびメインコントローラ 1 3による検索処理をマイクロプロセッサで実行する画像検索プログラムを、 HDD,不揮発性メモリ，光ディスクまたは磁気テープなどの記録媒体に記録しこれを用いてもよい。前記信号処理部 10は、外部からの入力画像信号を取り込み、これを所定のタイミングでバス 21を介して画像データべ一ス 1 9に転送する機能を有する。アナログ信号が入力した場合は、信号処理部 10は入力画像信号を AZD変換した後に画像データべース 1 9に転送する。入力画像信号の符号化方式としては、 J P E G ( Joint Photographic Experts Group) , GIF(Graphic Interchange Format)およぴビッ卜マップなどの静止画像符号化方式，並びに、 Motion— J PEG, AVI (Audio Video Interleaving)および MPEG (Moving Picture Experts Group)などの動画像符号化方式が挙げられる。入力画像信号の供給源としては、たとえば、ムービーカメラ，デジタルカメラ，テレビチューナ， DVDプレーヤ（Digital Versatile Disk Player) ,コンパクトディスクプレーヤ，ミニディスクプレーヤ，スキャナ，インタ一ネットなどの広域ネットワークが挙げられる。

画像データベース 1 9は、 HDDなどの大容量記憶装置において構築され、バス 21 を介して転送された静止画像および動画像（以下、検索対象画像と称する。）を既存のファイルシステムに従って記録し管理する。後述するように、特徴量取得部 1 1とネットワーク構築部 1 2は、画像データベース 1 9に記録されている検索対象画像群を網の目状に関連付けることによってネットワーク型データベースを構築しこれをネットヮークデータベース 20に記録する。

特徴量取得部 1 1は、多数の検索対象画像の各々の特徴量を取得する処理 (特徴量取得処理)を行う機能ブロックである。具体的には、特徴量取得部 1 1は、画像データベース 1 9に記録されている多数の検索対象画像から、これら検索対象画像に共通の構成要素、たとえば、各画素を構成する一組の色成分あるいはメタデータを抽出する。一組の色成分としては、たとえば、 R (赤色）， G (緑色）および B (青色）の色成分の組や、 Y (輝度）， Cb (色差）および CK色差）の色成分の組が挙げられる。メタデータとしては、検索対象画像に付加されている属性，意味内容，取得先もしくは格納場所などの情報が挙げられる。より具体的には、タイトル，記録日時（絶対時間 Z相対時間），取得場所（緯度経度高度），ジャンル，出演者，キーワード，コメント，価格（円 κドル zユーロ）および画像サイズなどの情報をメタデータとして抽出すること力《できる。

特徴量取得部 1 1は、検索対象画像から抽出した構成要素に基づいて、検索対象画像の各々を特徴付ける複数の特徴値の組すなわち特徴量を算出する。ネットヮ一ク構築部 1 2は、前記特徴量取得部 1 1で算出された特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けることによってネットワーク型データべースを構築する。以下、検索対象画像が静止画像であって、静止画像から抽出された構成要素が R, G, Bの色成分である場合の類似尺度の算出方法について説明する。

特徴量取得部 1 1は、画像データベース 1 9から静止画像を読み出し、この静止画像を M個（Mは 2以上の整数）のブロックに分割する。たとえば、図 2に示すように静止画像 30を 4つのブロック B1， B2, B3, B4に分割したり、あるいは、図 3に示すように静止画像 30を 5つのブロック B1 , B2, B3, B4, B5に分割したりすることができる。次いで、各ブロックの R成分， G成分， B成分のそれぞれの平均値すなわち特徴値が算出される。

画像データベース 1 9に格納されている k番目（kは 1以上の整数）の静止画像中の m + 1番目（mは 1以上の整数）のブロックにおいて、 i番目（iは 1以上の整数）の R成分， G成分および B成分をそれぞれ _n (k, m)， _gi (k, m)および b|(k, m)で表し、 m番目ブロックの R成分， G成分および B成分の平均値をそれぞれく Kk， m) >,く g(k， m) >およびく b (k, m) >で表し、当該ブロックに含まれる R成分， G成分および B成分の各総数を Nで表すとすると、平均値く r(k， m) > , <g(k, m) >およびく b (k, m) >は次式（ 1 )で与えられる。

1 Λ

< r(k,m) >=—— > η(κ,ηι) = x(k, 3m - 2)

-1 N

< g{k,m) >=― ^ g_t (k, m) = x(k, 3m一 1)

1 ^N

< b(k,m) >=一 > 6_£ ( ,m) = x(k,3m)

上式（1)は、 R成分， G成分， B成分のそれぞれの算術平均値を与えるものであるが、算術平均値の代わりに、 R成分， G成分， B成分のそれぞれの幾何平均値，調和平均値または重みづけ平均値を算出してもよい。なお、算術平均値は、 2つの数 a， b に対して（a + b)ノ 2を与え、幾何平均値は、 2つの正数 a, bに対して (ab)^1/2を与え、調和平均値は、 2つの数 a， bに対して逆数の算術平均値の逆数（ = 2abZ(a + b)) を与え、そして重み付け平均値は、 2つの数 a, bに対して a, bそれぞれに係数， β を乗じて加算した値（= Qfa+ β b)を与える。

次に、上式（1)に示すように x(k, 3m— 2)， x(k, 3m— 1), x(k, 3m)を定義すると、次式（2)で与えられる 3 X M次元のベクトル量 X_kが構成される。

X_k = {x(k,l),x(k,2),x(k,3),'--,x(k,3m - 2),x(k,3m - l),x(k,3m),

…… _yx(k,3M一 2),x(k,3M ~l),x(k,3M) } (2) 前記ベクトル量 X_kを距離空間（metric space)上の一要素として极ぅことによって、 2 つの検索対象画像間のユークリッド距離を定義することができる。すなわち、 p番目（p は 1以上の整数）の画像と q番目（qは 1以上の整数）の画像との間のユークリッド距離 D(p, q)は、次式（3)で定義される。 Nr

D(p,q) = \\X_P ~ J = {X(P, j)一 x(q, j) ( 3 ) ここで、 Nr = 3M

特徴量取得部 1 1は、上記ベクトル量 x_kを当該検索対象画像を特徴付ける固有の特徴量であるとみなし、前記ユークリッド距離 D (p， q)を類似尺度として算出する。本実施例では、 2つの検索対象画像が互いに類似するほどにユークリッド距離は小さくなり、類似尺度は小さな値をとることとなる。この代わりに、ユークリッド距離の逆数を類似尺度として定義し、 2つの検索対象画像が互いに類似するほどに類似尺度が大きな値をとるように構成を変更してもよい。

なお、上記ユークリッド距離の代わりにマンハッタン距離 (街路距離)を用いることも可能である。マンハッタン距離 D (_P, q)は、次式（3A)で定義される。

D(p,q) = \\X_p ~ X_q\\ ( ³ A)

ここで、 Nr = 3M 次に、検索対象画像が複数のフレームからなる動画像であって、各フレームから抽出された構成要素が R, G, Bの色成分である場合の類似尺度の算出方法について説明する。図 4に示すように、動画像データは、一連の映像ショット Si , S₂，…， S_Ns (Nsは 2以上の整数）から構成されており、各映像ショットは複数のフレームで構成されるものとする。たとえば、最初の映像ショットは、連続する n枚（nは 2以上の整数）のフレーム 30₂, ■■·, 30_πで構成されている。連続する映像ショットと映像ショットとの間には、フレーム間の相関が著しく小さくなるカツ卜点（シーンチェンジ） Sc, Sc, …が発生する。特徴量取得部 1 1は、各シーンチェンジ Scを検出することで各映像シヨットを識別することができる。特徴量取得部 1 1は、各映像ショット S_k(kは 1〜Nsの整数）のフレームを M個（Mは 2以上の整数）のブロック B1， B2,…に分割する。たとえば、図 4に示すようにフレー厶を 4分割すればよし、。次いで、特徴量取得部 11は、各ブロックの R成分， G成分， B 成分それぞれの平均値を算出し、これら平均値を複数のフレームに亘つて平均化することで特徴値を算出する。具体的には、 k番目の映像ショット S_kにおいて、 s番目（s は"!〜 N_k;N_kは 1以上の整数）のフレームの m番目ブロックの i番目の R成分， G成分および B成分を、それぞれ、 i， s;k, m)， g(i, s;k， m)および b(i, s;k, m)としたとき、 k番目映像ショット S_kを特徴付ける m +1番目ブロックの特徴値く R(k, m)>， < G(k， m)>, <B(k, m)>は次式（4)で与えられる。

< G(k,m) >=—— ^ ^_ ,³，' k,^m~) =x{k, m -1) ( 4 )

< B(k,m) >=

次に、上式（4)に示すように x( 3m— 2)， x(k, 3m— 1), x(k, 3m)を定義することで、上式（2)で与えられるベクトル量 X_kを構成することができる。前記ベクトル量 X kを距離空間（metric space)上の要素として扱し、、上式（3)に示したように、 2つの映像ショット間のユークリッド距離 D(_P， q)を類似尺度として定義することができる。なお、ユークリッド距離 D(p, q)の増加に対して減少する値，たとえば逆数，を類似尺度として定義してもよい。

次に、検索対象画像から抽出された構成要素がメタデータである場合の類似尺度の算出方法について説明する。特徴量取得部 11は、メタデータ自体またはメタデータに含まれる情報を特徴量として用いて、検索対象画像間のメタデータの一致率に比例または反比例する値を上記類似尺度として算出する機能を有している。具体的には、メタデータが撮影日時や撮影場所，価格などの数値情報を含む場合は、その数値情報を特徴量 X_kとして扱い、 P番目画像の特徴量 X_Pと q番目画像の特徴量 Xqとの間の差分を類似尺度 D (p, q)として算出することができる。メタデータがジャンルもしくはキーワードなどの数値表現が難しい情報を含む場合は、ジャンルやキーワードに含まれている数値，たとえば，「面白さ度数 90%,興奮度 9 0%Jといった客観的な指数を特徴量 X_kとして採用し、 p番目画像の特徴量 X_pと q番目画像の特徴量 Xqとの差分を類似尺度 D (p, q)として算出することができる。また、メタデータがタイトル，出演者もしくはコメントなどの数値表現が不可能な符号列を含む場合は、その符号列を特徴量 X_kとして用いて、 P番目画像の文字列 X_Pと q番目画像の文字列 Xqとの間の一致率または不一致率に比例する値を類似尺度 D (_P， q )として算出することができる。たとえば、 2つの文字列 X_p, Xqがー致する場合は類似尺度 D (p， q)を¹ Tに設定し、 2つの文字列 X_p， Xqが不一致である場合は類似尺度

D (p， q)を' Ό' 'に設定することができる。あるいは、 2つの文字列 X_p, Xqが完全に一致する場合は類似尺度 D (p， q)を'' 2"に設定し、 2つの文字列 X_p, Xqの一部が一致する場合は類似尺度 D (p, q)を' Ί "に設定し、 2つの文字列 Xp, Xqが完全に一致しない場合は類似尺度 D (p, q)を¹ Ό"に設定することができる。

特徴量取得部 1 1は、上記特徴量 X_kを算出するとともに、当該特徴量 X_kを検索対象画像と対応付けてネットワークデータベース 20に格納する。図 5は、 k番目の検索対象画像と特徴量 X_kとの対応関係を概略的に示す図である。各検索対象画像はインデックス番号 kが付されており、このインデックス番号 kに対応する特徴量 X_kがネットヮークデータベース 20に格納されている。ネットワーク構築部 1 2は、図 5に示されるような対応テーブルを参照して 2つの検索対象画像間の類似尺度 D (p, q )を算出する。次いで、ネットワーク構築部 1 2は、類似尺度 D (p, q)が次式（5)に示される関係式を満たすか否かを判定し、下記関係式（5)を満たす場合に p番目画像と q番目画像とは相互に類似していると判断し、これら検索対象画像を相互に関連付けることによってネットワーク型データベースを構築しこれをネットワークデータベース 20に格納する。

D(p,q)≤Rth ( 5 )

上式（5)中、 Rthは類似尺度の閾値である。閾値 Rthは、各検索対象画像について平均して 5〜1 0個程度の画像を関連付け可能な値に設定されることが望ましい。また、関連付けられた検索対象画像間の表示リンク距離は全て等しい値に設定される。本実施例では、表示リンク距離は「1」に設定されるが、それに限定されるものではない。図 6は、前記ネットワーク型データベースのトポロジー（接続形態）を概略的に示す図であり、図 7は、当該ネットワーク型データベースのデータ配列を概略的に示す図である。図 6を参照すると、検索対象画像 1 1₂,…は，リンク , ₂， C_{1 i 4}, …を介して相互に関連付けられている。リンク C_p， _qは、 2つの検索対象画像 I_p， Iq間の関連付けを示す接続線であり、各リンクの距離 (表示リンク距離）は「1」に設定されている。検索対象画像 1 1₂, …は、リンク c^, c_{1 i 4}, …の両端位置（節点）に配置されると考えてもよい。

また、 2つの前記検索対象画像間の表示リンク距離は、 N個（Nは 1以上の整数）のリンクを介して関連付けられている場合は「N」である。さらに言えば、 2つの検索対象画像 I_p, Iq間の表示リンク距離は、一方の検索対象画像 Ipから他方の検索対象画像 Iq へ迪る経路のうち最短経路のリンク数と定義され得る。たとえば、検索対象画像は、

1個の画像 1₂を介して画像 1₅と間接的に関連付けられ、 2個の画像 1₂, 1₅を介して画像 1₉ と関連付けられているため、画像と画像 1₅との間の表示リンク距離は「2」であり、画像 Iと画像 I₉との間の表示リンク距離は「3」である。

図 7を参照すると、上記ネットワーク型データベースのデータ配列は、画像配列 PAと接続配列 CA , CA₂,…との二重配列構造を有している。画像配列 PAは、接続配列 CAL CA₂, …へのポインタ' 1 '， '2', '3',…を格納する配列であり、接続配列 CA , CA 2,…は、検索対象画像 1 1₂,…のインデックス番号 (以下、画像番号と呼ぶ。）の配列である。画像番号は、各配列において昇順に連続的に並んでいる。 Xは、画像配列または接続配列の終端を示す記号である。

次に、図 8を参照しつつ、ネットワーク型データベースの構築処理の手順を説明する。以下、 K個（Kは 0以上の整数）の検索対象画像によって既にネットワーク型データべースが構築されており、 K + 1番目の新規画像 Ι_Κ+1をデータベースに登録する処理について説明する。このとき、図 9 (a)に示すように、新規画像 Ι_Κ+1の登録前のデータ配列は、接続配列 C^ CAKと、これら接続配列それぞれへのポインタ' 1 '， 'Ζ', '3', -' K'を有する画像配列 ΡΑとで構成されている。なお、 Κ = 0の場合は、新規データべ一スを構築する場合に該当する。

図 8を参照すると、まず、メインコントローラ 1 3は、信号処理部 1 0から入力した新規画像 Ικ+1を画像データベース 1 9に記録し（ステップ S 1 )、新規画像 Ικ₊₁をネットワークデータベース 20に追加する（ステップ S2)。このとき、図 9 (b)に示すように、新規画像 Ι_Κ+1用の接続配列 CA_K+1の領域が確保され、画像配列 PAに前記接続配列 CA_K+1 へのポインタ 'K+ 1 'が追加される。

次に、メインコントローラ 1 3は、特徴量取得部 1 1に新規画像 I_K+1の特徴量 Χ_Κ+1を算出させる（ステップ S3)。このとき、特徴量取得部 1 1は、新規画像 Ι_Κ+1から、 R, G, Β の色成分もしくはメタデータなどの構成要素を抽出し、前記構成要素を用いて特徴量 X_K+1を算出してこれをネットワークデータベース 20に記録する。

続くステップ S4〜 S9で、登録済みの画像〜Ι_Κと新規画像 Ι_κ+1との間の関連付け処理が実行される。すなわち、画像番号 jが初期値（= 1 )【こ設定される (ステップ S4)。次いで、特徴量取得部 1 1は、ネットワークデータベース 20から、画像データベース 1 9に記録されている j番目画像 Ijの特徴量 Xjを取得する（ステップ S5)。ここで、特徴量取得部 1 1がネットワークデータベース 20から特徴量 Xjを取得する代わりに、 j番目画像 Ijの特徴量 Xjを新たに算出してもよい。

続いて、ネットワーク構築部 1 2は、特徴量 Xj, X_K+1を用いて、 j番目画像 Ijと新規画像 I_K+1との間の類似尺度 D (j， K+ 1 )を算出する（ステップ S6)。さらに、ネットワーク構築部 1 2は、類似尺度 D (j, K + 1 )が上記関係式（5)を満たすか否かを判定し (ステツプ S7)、類似尺度 D (j， K+ 1 )がその関係式（5)を満たさないと判定した場合は、ステップ S9に処理が移行する。

一方、前記ステップ S7において、類似尺度 D (j, K+ 1 )が関係式（5)を満たすと判定した場合は、ネットワーク構築部 1 2は、 j番目画像 Ijと新規画像 I_K+1とは互いに類似すると判断し、両画像 Ij， Ι_κ+1を関連付ける（ステップ S8)。具体的には、図 9 (b)に示すように、新規画像 I_K+1用の接続配列 CA_K+1 番目画像 Ijの画像番号 jが追加され、画像配列 PAのポインダ j'に対応する接続配列 CAjに新規画像 Ι_κ+1の画像番号 K+ 1が追加される。そして、ネットワーク構築部 1 2は、このデータ配列をネットワークデータベース 20に記録する。その後、ステップ S9に処理が移行する。

ステップ S9では、メインコントローラ 1 3力全ての画像 ^〜について処理が終了したか否かを判定し、当該処理が終了しないと判定した場合は、画像番号 jをインクリメン卜して（ステップ S1 2)、上記ステップ S5以後の処理を繰り返し実行する。一方、メインコントローラ 1 3は，全ての画像 ^〜について処理が終了したと判定した場合（ステップ S9)、上記ステップ S8で関連付ける画像が 1つも無いか否かを判定する（ステツプ S1 0)。前記ステップ S1 0で関連付ける画像が 1つでも存在したと判定された場合、以上のデータベース構築処理は終了する。一方、前記ステップ S1 0で関連付ける画像力つも無いと判定された場合は、ネットワーク構築部 1 2は、新規画像 Ι_κ+1との類似尺度 D (j， K+ 1 )の値が最も小さい画像 Ijを、新規画像 Ικ₊₁と関連付ける（ステップ S 1 1 )。以上でデータベース構築処理は終了する。

次に、図 1 0, 図 1 1を参照しつつ、上記ネットワーク型データベースを用いた検索処理を以下に説明する。図 1 0は、画像検索処理の手順を示すフローチャートであり、図 1 1は、図 1 0のフローチャートで使用される一覧表示処理の手順を示すフローチヤ一卜である。

まず、操作部 1 6からの入力指示に応じて、メインコントローラ 1 3は、画像の一覧表示処理（図 1 1 )を実行する（ステップ S20)。図 1 1を参照すると、画像選択部 1 3Β (図 1 )は、表示リンク距離を初期値 Rdに設定し（ステップ S30)、その後、ネットワークデ —タベース 20を参照し、主画像との表示リンク距離が初期値 Rd以下となる画像を副画像として設定する（ステップ S31 )。ここで、初期値 Rdは、操作部 1 6を介してユーザ —によって指定され得る力特に指定が無い場合は、予め登録した値，たとえば「5」に設定される。また、主画像は、ネットワークデータベース 20に登録されている画像群の中から任意に選択され得る力特に指定が無い場合は、画像番号「1」の画像が主画像として選択される。

次に、表示制御部 1 3Cは、上記ステップ S31で選択した主画像と副画像とを表示部 1 8に一覧形式で 1画面に表示させる（ステップ S32)。具体的には、表示制御部 1 3C は、画像データベース 1 9に記録されている主画像と副画像を読み出し、これらをバス 21を介して画像合成部 1 4に転送する。画像合成部 1 4は、転送された主画像と副画像の解像度を変換して得たサムネイルサイズの画像群を合成し、出力インターフエ一ス 1 7を介して表示部 1 8に出力する。ここで、サムネイル画像の表示順を主画像とのリンク距離の昇順とすることで主画像と類似尺度が高い副画像を優先して表示するのが好ましい。

図 1 2は、表示部 1 8の表示画面 40を概略的に示す図である。表示画面 40には、主画像が表示され、この主画像 Iに類似する副画像 1₂~1₂₅が表示されている。全ての副画像を 1画面に表示できない場合、ユーザーは、操作部 1 6を入力操作することで次画面選択ボタン 41 Nを指定して残る副画像群を次画面に一覧表示させることカできる。また、ユーザ一は、前画面選択ポタン 41 Bを指定して表示画面を前画面に戻すことも可能である。ここで、主画像と副画像のサムネイル画像を予め生成して画像データベース 1 9に格納しておき、画像合成部 1 4が、高解像度の主画像と副画像とを画像データベース 1 9から読み出す代わりに、サムネイル画像を読み出してもよい。ユーザーは、目的画像を見つけた場合は、操作部 1 6を入力操作して画面 40に表示された画像群の中から所望の目的画像を指定することができる。あるいは、目的画像を発見できない場合、ユーザーは、操作部 1 6を入力操作して目的画像以外の副画像を次の主画像として指定することもできる。画像選択部 1 3Bは、操作部 1 6からの入力指示を検出することにより、目的画像の指定の有無を判定する（ステップ S33)。ユーザーが目的画像を指定したとき、画像選択部 1 3Bは目的画像の指定有りと判定して以上の処理を終了させる。一方、ユーザーが目的画像以外の副画像を次の主画像として指定したとき、画像選択部 1 3Bは、目的画像の指定無しと判定し（ステップ S 33)、指定された副画像を主画像に設定し（ステップ S34)、その後、メインルーチン (図 1 0)へ処理を戻す。

メインルーチンのステップ S21では、画像選択部 1 3Bは、主画像との表示リンク距離が設定値 Rs以下となる画像を副画像として設定する（ステップ S21 )。その後、表示制御部 1 3Cは、主画像と副画像とを表示部 1 8に一覧形式で表示させる（ステップ S22)。ここで、ユーザーは、操作部 1 6を入力操作することでメインコントローラ 1 3が保持する設定値 Rsを適宜変更することができる。たとえば、図 6ί.こ示したデータべ一スの場合、主画像 Iに対して設定値 Rsを「1 Jに設定した場合、画像選択部 1 3Bは、主画像 ^との表示リンク距離が「1」以下の画像 1 1₃, 1₄を副画像として設定し、設定値 Rsを「3」に設定した場合、画像選択部 1 3Bは、主画像との表示リンク距離が「3」以下の画像 In, Ιΐ2, Ι₁₃を副画像として設定することとなる。図 1 3は、表示部 1 8の表示画面 40の一例を示す図である。表示画面 40には、主画像 1₃が表示されるとともに、主画像 1₃との表示リンク距離が「1 J以内の副画像 I , 1₂, 1₅， 1₆, 1₇がサムネイルサイズで一覧表示されている。

ユーザ一は、操作部 1 6を入力操作して、画面 40に表示された画像群から所望の目的画像を指定することができる。画像選択部 1 3Bは、操作部 1 6からの入力指示を検出することにより、目的画像の指定の有無を判定する（ステップ S23)。ユーザーが目的画像を指定したとき、画像選択部 1 3Bは目的画像の指定有りと判定して画像検索処理を終了させる。

一方、ユーザ一が目的画像を指定せず、その他の指示を入力した場合、画像選択部 1 3Bは目的画像の指定無しと判定し (ステップ S23)、その後、入力指示の種類に応じてステップ S25または S26のいずれか一方に処理が移行する（ステップ S24)。ここで、入力指示が「一覧表示指示」である場合は、ステップ S25の一覧表示処理（図 1 1 )が実行され、その後、ステップ S21以後の処理が繰り返し実行される。一方、ュ一ザ一が表示画面 40の中の副画像の 1つを主画像に変更する指示を入力した場合、画像選択部 1 3Bは「継続指示」があったと判定し (ステップ S24)、指定された副画像を次の主画像に設定する（ステップ S26)。その後、ステップ S21以後の処理が繰り返し実行される。

たとえば、ユーザーが副画像 1₆指定して継続指示を入力した場合、図 1 4に示すように主画像は画像 1₃から画像 1₆に変更され、表示画面 40は図 1 5に示す画像に変化する。図 1 5に示す表示画面 40には、主画像 1₆が表示されるとともに、主画像 1₆との表示リンク距離が「1」以内の副画像 I₃， I₅, I₁₀， In , 1₁₂がサムネイルサイズで一覧表示されている。ユーザーは、表示画面 40に主画像に指定すべき副画像が存在しない場合は、たとえば、図 1 2に示すように多数のサムネイル画像を一覧表示させることにより (ステップ S25)、主画像に指定すべき画像を素早く見つけることができる。

このように、ユーザ一は、所望の目的画像を効率良く且つ簡便に検索することができる。また、上記画像検索処理は、主にデータベースのリンク情報のみを使用しているため、複雑な処理をせずに少ない演算量で高速に検索することが可能である。

ところで、図 1 3に示した画面 40では、表示領域全体と比べて主画像 1₃の水平画素数は多く且つその垂直画素数は少ないため、主画像 1₃は上方に配置され、主画像 1₃との重複面積が小さくなるように下方の表示領域に副画像 1 1₂,…が水平方向に沿つて配列させられている。これに対し、図 1 5に示した画面 40では、表示領域全体と比ベて主画像 1₆の水平画素数は少なく且つその垂直画素数が多いため、主画像 1₆は右方に配置され、主画像 1₆との重複面積が小さくなるように左方の表示領域に副画像 1₃, I₅, …が垂直方向に沿って配列させられている。このように、表示制御部 1 3Cは、主画像と副画像の画像サイズに応じて最適な配列を構成することができる。図 1 ³と図 1 5に示した配列の他に、図 1 6〜図 1 9に示す配列も可能である。図中、「M」は主画像を示し、「S」は副画像を示している。

なお、上記の画像検索処理では、表示画面 40に表示される副画像は、主画像との表示リンク距離が設定値 Rs以下の画像群であった力この代わりに、主画像との表示リンク距離が設定値 Rsあるいは設定値 Rsを中心とした所定範囲内の画像を副画像として設定し表示画面 40に表示してもよし、。たとえば、設定値 Rs = 3の場合、主画像との表示リンク距離が「3」の画像群のみを表示画面 40に表示してもよいし、あるいは表示リンク距離が「2」，「3」，「4」の画像群のみを表示画面 40に表示してもよい。次に、上記ネットワーク型データベース（以下、「ネットワーク」と呼ぶ。）を用いた階層化処理を説明する。ネットワーク構築部 1 2は、図 8に示した処理手順で構築したネットワーク（以下、 0次階層のネットワークと呼ぶ。）から、上位の階層のネットワークを構築することができる。すなわち、ネットワーク構築部 1 2は、 0次階層のネットワークから、 N個（Nは 1以上の整数）の検索対象画像を介して間接的に相互に関連付けられている検索対象画像群を抽出し、抽出された検索対象画像群で上位の階層に属する画像群を構成する。さらに、ネットワーク構築部 1 2は、前記上位の階層において、前記 0次階層で間接的に相互に関連付けられていた検索対象画像間を関連付け、且つ関連付けられた検索対象画像間の表示リンク距離を「1」に設定することにより、 1 次階層のネットワークを構築する。以上の処理を再帰的に実行することで、さらに上位の階層のネットワークを構築することが可能である。

以下、図 20を参照しつつ、ネットワーク構築部 1 2による階層化処理の一実施例を以下に説明する。図 20は、階層化処理の手順を概略的に示すフローチャートである。まず、ネットワーク構築部 1 2は、ネットワークデータベース 20から 0次階層のネットヮークを読み込み（ステップ S40)、 1次階層のネットワークを構築すべく階層番号 iを「1」に設定する（ステップ S41 )。その後、 0次階層に属する複数の画像のうち起点画像が 1つ選択される（ステップ S42)。起点画像としては、操作部 1 6を介してユーザーにより任意の画像が選択され得るが、特に指定が無い場合は、画像番号が最小の画像が選択される。図 21は、 0次階層のネットワークのトポロジーを概略的に示す図である。この図 21では、画像 Iが起点画像として選択される。

次に、ネットワーク構築部 1 2は、起点画像を代表画像として設定し (ステップ S43)、代表画像に隣接する画像，すなわち代表画像との表示リンク距離が「1」の画像を全て削除する (ステップ S44)。たとえば、図 21に示すように、代表画像に隣接する画像 1₂, 1₃， 1₄が削除される。その後、ネットワーク構築部 1 2は、全画像について処理したか否かを判定し (ステップ S45)、全画像について処理したと判定した場合は、ステップ S47に処理を移行し、全画像について処理しないと判定した場合は、ステップ S4 6に処理を移行する。

ステップ S46では、前記ステップ S44で削除された画像に隣接する画像が次の起点画像として選択される（ステップ S46)。ここで、起点画像としては、複数の対象画像のうち画像番号が最小の画像が選択され、前の起点画像は再び選択されない。図 2 1では、対象画像は、画像 I₅, I₆, I₇, 1₈であり、これらのうち画像番号が最小の画像 1₅が起点画像として選択される。続けて、上記ステップ S43以後の処理が、ステップ S45 で全画像について処理が終了したと判定される迄、繰り返し実行される。この結果、図 21に例示されるように、太枠で囲まれた画像 I， Ι₅, Ιιο,…が代表画像として設定される。

上記ステップ S45で全ての画像について処理が終了したと判定した場合、ネットヮ —ク構築部 1 2は、代表画像群で上位の i次階層の画像群を構成し（ステップ S47 )、代表画像のうち、 ί—1次階層において表示リンク距離が「2」の 2つの画像を互いに関連付け、且つ関連付けられた 2つの画像間の表示リンク距離を全て「1」に設定する (ステップ S48)。この結果、 i次階層のネットワークが構築される。図 22に示す例では、図 21に示した太枠で囲まれた代表画像相互間にリンク ₅， C_{1 i 6}, C^ y, …が形成される。

次に、ネットワーク構築部 1 2は、階層化処理を終了するか否かを判定し (ステップ S 49)、階層化処理を終了しないと判定した場合は、階層番号 iをインクリメントして（ステツプ S50)、上記ステップ S42以後の処理を繰り返し実行する。一方、階層化処理を終了すると判定した場合、ネットワーク構築部 1 2は、階層化処理を終了し、構築した 1次〜じ欠階層（Lは 1以上の整数）のネットワークをネットワークデータべ一ス 20に記録する。この結果、図 23に示すように、 0次〜じ欠階層のネットワーク 50₀〜50しが構築されることとなる。

なお、上記ステップ S44においては、代表画像に隣接する画像を削除する処理を実行していたが、この代わりに、代表画像との表示リンク距離が「NJ (Nは 2以上の整数）以下の画像を削除してもよい。

次に、図 24と図 25を参照しつつ、上記階層化ネットワークを用いた画像検索処理を説明する。図 24は、メインコントローラ 1 3による画像検索処理の手順を概略的に示すフローチヤ一卜である。

まず、ステップ S60では、階層選択部 1 3A (図 1 )は、ネットワークデータベース 20に格納されている 0次〜じ欠階層のネットワークのうち最上位のし次階層のネットワークを検索対象として選択する。この代わりに、最初の検索対象が操作部 1 6を介してュ一ザ一によつて選択されてもよい。

次に、表示制御部 1 3Cは、図 1 1に示した画像の一覧表示処理を実行することによリ、最上位階層に属する検索対象画像を表示部 1 8に一覧表示させる (ステップ S61 )。すなわち、表示部 1 8の画面 40には、図 1 2に示したように最上位階層に属する主画像と副画像とが一覧形式で表示される。ユーザ一は、目的画像を見つけたとき、操作部 1 6を入力操作して目的画像を指定することができる。かかる場合、本検索処理は終了する（図 1 1，ステップ S33)。目的画像を発見できないとき、ユーザーは、目的画像以外の画像を次の主画像として指定することができる。かかる場合は、指定した画像が主画像に設定される（図 1 1，ステップ S34)。

次のステップ S62では、画像選択部 1 3Bは、主画像との表示リンク距離が設定値 R s以下となる画像を副画像として設定する（ステップ S62)。その後、表示制御部 1 3C は、主画像と副画像とを表示部 1 8に一覧形式で表示させる（ステップ S63)。ユーザ一は、操作部 1 6を入力操作して、画面 40に表示された画像群から所望の目的画像を指定することができる。画像選択部 1 3Bは、操作部 1 6からの入力指示を検出することにより、目的画像の指定の有無を判定する（ステップ S64)。ユーザーが目的画像を指定したとき、画像選択部 1 3Bは目的画像の指定有りと判定して画像検索処理を終了させる。

—方、ユーザーが目的画像を指定せず、その他の指示を入力した場合、画像選択部 1 3Bは目的画像の指定無しと判定し (ステップ S64)、その後、入力指示の種類に応じてステップ S66, S67または S68のいずれかに処理が移行する。ここで、入力指示が「一覧表示指示」である場合は、ステップ S66の一覧表示処理（図 1 1 )が実行され、その後、ステップ S62以後の処理が繰り返し実行される。一方、ユーザーが副画像の 1つを主画像に変更する指示を入力した場合、画像選択部 1 3Bは、現在の階層で検索を続行する旨の「継続指示」があったと判定し（ステップ S65)、指定された副画像を次の主画像に設定する（ステップ S68)。その後、ステップ S62以後の処理が繰り返し実行される。

他方、前記入力指示が「概略詳細検索指示」である場合は、ステップ S67の階層間移動処理が実行される。以下、図 25のフローチヤ一卜を参照しつつ、階層選択部 1 3Aによる階層間移動処理の手順を説明する。なお、図中の符号 C1は、接続子を表している。

まず、階層選択部 1 3Aは、ユーザーによる入力指示が「概略検索」または「詳細検索」のいずれであるかを判定する（ステップ S70)。 Γ詳細検索」の入力指示があった場合は、現在の階層よりも下位の階層のネットワークが存在するか否かを判定する (ステップ S71 )。下位の階層が存在しない場合は、メインルーチン（図 24)に処理が移行し、ステップ S62以後の処理が繰り返し実行される。

—方、前記ステップ S71で下位の階層が存在すると判定した場合、階層選択部 1 3 Aは、図 26に示すように検索対象を現在の階層 50_k+1 (kは 0以上の整数）から下位の階層 50_kへ切り換え（ステップ S72)、メインルーチン（図 24)に処理を戻す。その後、ステップ S62以後の処理が繰り返し実行される。この結果、操作部 1 6の表示画面 40 には、下位の階層 5Q_kに属する主画像と副画像とが表示されるため、ユーザーは、表示画面 40を視認しつつ、下位の階層 50_kに存在するかもしれない目的画像を検索することができる。上記ステップ S70において、入力指示力「詳細検索」であると判定した場合、階層選択部 1 3Aは、現在の階層よりも上位の階層のネットワークが存在するか否かを判定する（ステップ S73)。上位の階層が存在しない場合は、メインルーチン（図 24)に処理が移行し、ステップ S62以後の処理が繰り返し実行される。

—方、前記ステップ S73で上位の階層が存在すると判定した場合、階層選択部 1 3 Aは、上位の階層 50_k+1に主画像が存在するか否かを判定する（ステップ S74)。図 2 6に例示するように、現在と上位の階層 50_k， 50_k+1に主画像 Ijが存在する場合は、階層選択部 1 3Aは、検索対象を現在の階層 50_kから上位の階層 50_k+1に切り換え（ステップ S75)、その後、メインルーチン（図 24)に処理を移行させる。一方、図 27に例示するように、現在の階層 5C ∑存在する主画像 Ijが上位の階層 50_k+1に存在しない場合は、階層選択部 1 3Aは、主画像 Ijと隣接する，すなわち主画像 Ijとの表示リンク距離が最短で且つ上位の階層にも存在する副画像 I_j+1の 1つを次の主画像に設定し（ステップ S76)、検索対象を現在の階層 50_kから上位の階層 50_k+1に切り換え（ステップ S 75)、その後、メインルーチン（図 24)に処理を戻す。その後、ステップ S62以後の処理が繰り返し実行される。この結果、操作部 1 6の表示画面 40には、上位の階層 50 _k+1に属する主画像と副画像とが表示されるため、ユーザ一は、表示画面 40を視認しつつ、上位の階層 50_k+1に存在するかもしれない目的画像を検索することができる。このように、ユーザーは、階層間を移動しつつ、所望の目的画像を効率良く且つ簡便に検索することができる。また上記画像検索処理は、主にデータベースの階層情報とリンク情報のみを使用しているため、複雑な処理をせずに少ない演算量で高速に検索することが可能である。

以上，本発明に係る実施例の画像検索装置について説明した。上記実施例では、図 6に示すようなネットワークのトポロジーは表示部 1 8に表示されないが、ユーザーが目的画像を検索したリ主画像を指定したりする場合にそのトポロジーを表示部 1 8 に立体的に表示してもよい。

本出願は、日本国特許出願第 2004— 1 06037号公報に基づくものであり、当該公報を援用することにより当該公報の開示内容を含むものである。

Claims

請求の範囲

1 .画像検索方法であって、

(a)複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するステップと、

(b)前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得るステップと、

(c)前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、

(d) N個（Nは 1以上の整数)の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索するステップと、を備えることを特徴とする画像検索方法。

2.請求項 1記載の画像検索方法であって、前記表示リンク距離は、 N個の前記リンクを介して関連付けられている 2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索方法。

3.請求項 2記載の画像検索方法であって、前記ステップ (d)は、

(e)前記複数の検索対象画像のうち、少なくとも 1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定するステップと、 (f)前記ステップ (e)の実行後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、

を備えることを特徴とする画像検索方法。

4.画像検索方法であって、

(c)前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、

(d)前記ステップ (c)で関連付けがなされた前記検索対象画像群で下位の階層を構築するステップと、

(e)前記下位の階層から、 M個（Mは 2以上の整数）の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するステップと、

(f)前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるステップと、

(g) N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索するステップと、を備え、前記ステップ (e)および (f)を再帰的に実行することにより複数の階層を構築することを特徴とする画像検索方法。

5.請求項 4記載の画像検索方法であって、前記表示リンク距離は、 N個の前記リンクを介して関連付けられている 2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索方法。

6.請求項 5記載の画像検索方法であって、前記ステップ (g)は、

(h)複数の前記階層の中から一の階層を検索対象として選択するステップと、

(i)前記ステップ (h)で選択された前記階層に属する複数の検索対象画像のうち、少なくとも 1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定するステップと、

(j)前記ステップ G)の実行後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、

をさらに備えることを特徴とする画像検索方法。

7.請求項 4から請求項 6のうちのいずれ力、 1項に記載の画像検索方法であって、 (k)検索対象を下位の階層から上位の階層へ切り換えるステップと、

(m)前記上位の階層において前記主画像が存在しないときは、前記下位の階層において前記主画像との前記表示リンク距離が最短で且つ前記上位の階層に存在する検索対象画像を次の主画像として設定するステップと、 (n)前記ステップ (k)および（m)の実行後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、を備えることを特徴とする画像検索方法。

8.請求項 4から請求項 7のうちのいずれか 1項に記載の画像検索方法であって、 (o)検索対象を上位の階層から下位の階層へ切り換えるステップと、

(P)前記ステップ (o)の実行後に、前記下位の階層において前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させるステップと、をさらに備えることを特徴とする画像検索方法。

9.請求項 1から請求項 8のうちのいずれか 1項に記載の画像検索方法であって、前記ステップ (b)は、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける複数の特徴値を算出し、前記複数の特徴値の組を前記検索対象画像の距離空間上のベクトル量として記憶するステップを含み、

前記ステップ (c)は、前記ベクトル量を前記特徴量として用いて前記検索対象画像間の距離を前記類似尺度として算出するステップを含む、ことを特徴とする画像検索方法。

1 0.請求項 9記載の画像検索方法であって、前記距離は、ユークリッド距離であることを特徴とする画像検索方法。

1 1 .請求項 9記載の画像検索方法であって、各前記検索対象画像は静止画像であり、前記ステップ (b)は、前記静止画像の各々を複数のブロックに分割し、各前記プロックから抽出された複数の構成要素に基づいて、前記ブロックの各々について前記複数の特徴値を算出するステップを含む、ことを特徴とする画像検索方法。

1 2.請求項 1 1記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値であることを特徴とする画像検索方法。

1 3.請求項 9記載の画像検索方法であって、各前記検索対象画像は、連続する複数のフレームからなる動画像であり、前記ステップ (b)は、各前記フレームを複数のブロックに分割し、各前記ブロックから抽出された複数の構成要素に基づいて前記複数の特徴値を算出するステップを含む、ことを特徴とする画像検索方法。

1 4.請求項 1 3記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値を前記複数のフレームに亘つて平均化した値であることを特徴とする画像検索方法。

1 5.請求項 1から請求項 8のうちのいずれか 1項に記載の画像検索方法であって、前記ステップ (a)は、前記検索対象画像の各々からメタデータを前記構成要素として抽出するステップを含むことを特徴とする画像検索方法。

1 6.請求項 1 5記載の画像検索方法であって、前記ステップ (c)は、前記メタデータを前記特徴量として用いて、前記検索対象画像間の前記メタデータの一致率に比例または反比例する値を前記類似尺度として算出するステップを含むことを特徴とする画像検索方法。

1 7.画像検索装置であって、

複数の検索対象画像を蓄積する記憶装置と、

複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、

前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築部と、

N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索部と、を備えることを特徴とする画像検索装置。

1 8.請求項 1 7記載の画像検索装置であって、前記表示リンク距離は、 N個の前記リンクを介して関連付けられている 2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索装置。

1 9.請求項 1 8記載の画像検索装置であって、前記画像検索部は、

前記複数の検索対象画像のうち、少なくとも 1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定する画像選択部と、

前記主画像と前記副画像とが設定された後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させる表示制御部と、を備えることを特徴とする画像検索装置。

20.画像検索装置であって、

複数の検索対象画像を蓄積する記憶装置と、

複数の検索対象画像の各々から、前記複数の検索対窣画像に共通する少なくとも 1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得部と、

前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築するネットヮーク構築部と、

N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索部と、を備え、

前記ネットワーク構築部は、前記下位の階層から、 M個（Mは 2以上の整数）の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成する処理と、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける処理とを再帰的に実行することにより複数の階層を構築する、ことを特徴とする画像検索装置。

21 .請求項 20記載の画像検索装置であって、前記表示リンク距離は、 N個の前記リンクを介して関連付けられている 2つの前記検索対象画像のうちの一方の画像から他方の画像へ巡る経路のうち最短経路の前記リンクの数である、ことを特徴とする画像検索装置。

22.請求項 21記載の画像検索装置であって、前記画像検索部は、

複数の前記階層の中から一の階層を検索対象として選択し、これに属する複数の検索対象画像のうち、少なくとも 1つの画像を主画像に設定し且つ前記主画像を除く画像を副画像に設定する画像選択部と、

23.請求項 20から請求項 22のうちのいずれ力、 1項に記載の画像検索装置であつて、

前記画像検索部は、検索対象を下位の階層から上位の階層へ切り換える階層選択部をさらに備え、

前記階層選択部は、前記上位の階層において前記主画像が存在しないときは、前記下位の階層において前記主画像との前記表示リンク距離が最短で且つ前記上位の階層に存在する検索対象画像を次の主画像として設定した後に前記検索対象を切リ換え、

前記表示制御部は、前記階層選択部により前記検索対象が切り換えられた後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させることを特徴とすることを特徴とする画像検索装置。

24.請求項 20から請求項 23のうちのいずれか 1項に記載の画像検索装置であつて、

前記画像検索部は、検索対象を上位の階層から下位の階層へ切り換える階層選択部をさらに備え、

前記表示制御部は、前記階層選択部により前記検索対象が切り換えられた後に、前記表示リンク距離が設定範囲内にある前記主画像と前記副画像とを同一画面に表示させることを特徴とする画像検索装置。

25.請求項 1 7から請求項 24のうちのいずれか 1項に記載の画像検索装置であつて、

前記特徴量取得部は、前記複数の構成要素に基づいて前記検索対象画像の各々を特徴付ける複数の特徴値を算出し、前記複数の特徴値の組を前記検索対象画像の距離空間上のベクトル量として記憶し、

前記ネットワーク構築部は、前記ベクトル量を前記特徴量として用いて前記検索対象画像相互間の距離を前記類似尺度として算出することを特徴とする画像検索装置。

26.請求項 25記載の画像検索方法であって、前記距離は、ユークリッド距離であることを特徴とする画像検索方法。

27.請求項 25記載の画像検索装置であって、各前記検索対象画像は静止画像であり、前記特徴量取得部は、前記静止画像の各々を複数のブロックに分割し、各前記ブロックから抽出された複数の構成要素に基づいて、前記ブロックの各々について前記複数の特徴値を算出することを特徴とする画像検索装置。

28.請求項 27記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値であることを特徴とする画像検索装置。

29.請求項 25記載の画像検索方法であって、各前記検索対象画像は、連続する複数のフレームからなる動画像であり、前記特徴量取得部は、各前記フレームを複数のブロックに分割し、各前記ブロックから抽出された複数の構成要素に基づいて前記複数の特徴値を算出することを特徴とする画像検索方法。

30.請求項 29記載の画像検索方法であって、前記複数の構成要素は、各画素を構成する一組の色成分からなり、前記特徴値は、各前記ブロック内の前記色成分の平均値を前記複数のフレームに亘つて平均化した値であることを特徴とする画像検索装置

31 .請求項 1 7から請求項 24のうちのいずれ力、 1項に記載の画像検索方法であつて、前記特徴量取得部は、前記検索対象画像の各々からメタデータを前記構成要素として抽出することを特徴とする画像検索装置。

32.請求項 31記載の画像検索方法であって、前記ネットワーク構築部は、前記メタデータを前記特徴量として用いて、前記検索対象画像間の前記メタデータの一致率に比例または反比例する値を前記類似尺度として算出することを特徴とする画像検索方法。

33.複数の検索対象画像を記憶装置に記憶させる記憶処理と、

複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少なくとも 1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、

前記特徴量を用いて前記検索対象画像間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付けるネットワーク構築処理と、

N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させることを特徴とする画像検索プログラムを記録した記録媒体。

34.複数の検索対象画像を記憶装置に記憶させる記憶処理と、複数の検索対象画像の各々から、前記複数の検索対象画像に共通する少な〈とも

1つの構成要素を抽出するとともに、前記構成要素に基づいて前記検索対象画像の各々を特徴付ける特徴量を得る特徴量取得処理と、

前記特徴量を用いて前記検索対象画像相互間の類似尺度を算出し、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付け且つ関連付けがなされた前記検索対象画像群で下位の階層を構築する下位階層構築処理と、

N個（Nは 1以上の整数）の前記リンクを介して関連付けられている 2つの前記検索対象画像間の表示リンク距離を Nとして算出しつつ画像を検索する画像検索処理と、をコンピュータに実行させるとともに、

前記下位の階層から、 M個（Mは 2以上の整数)の前記リンクを介して関連付けられている画像群を抽出し、抽出された前記画像群で前記下位の階層よりも上位の階層に属する検索対象画像群を構成するとともに、前記上位の階層において、前記検索対象画像のうち、前記類似尺度が所定範囲内にある画像をリンクを介して相互に関連付ける上位階層構築処理をコンピュータに再帰的に実行させることにより複数の階層を構築することを特徴とする画像検索プログラムを記録した記録媒体。