JP3586549B2 - 画像検索方法およびその装置 - Google Patents
画像検索方法およびその装置 Download PDFInfo
- Publication number
- JP3586549B2 JP3586549B2 JP33675197A JP33675197A JP3586549B2 JP 3586549 B2 JP3586549 B2 JP 3586549B2 JP 33675197 A JP33675197 A JP 33675197A JP 33675197 A JP33675197 A JP 33675197A JP 3586549 B2 JP3586549 B2 JP 3586549B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- search
- images
- feature amount
- reference image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、画像データをデータベースとして備えている画像データベースから希望の画像を効率よく検索するための方法に関する。
【0002】
【従来の技術】
大量の画像データを有する画像データベースから画像を検索する場合、対象の画像に対して、これを間接的に説明するキーワードを付す等の手法によらないで検索する場合には、検索者の望んでいる想像上の画像に近い画像を検索し、あるいは検索者の曖昧とした検索意図を明確化するために、多様な観点から検索された大量の検索結果の画像を検索者に分りやすく伝えることが重要である。
【0003】
従来、我々は画像検索装置へ検索者の意図を伝えるという観点に立って、キーワード等に代えて、希望画像と類似した画像及び類似しない画像を1つまたは2つ以上指定して参照画像とし、そのそれぞれの画像あるいは必要に応じて参照画像の一部領域を指定しこれから抽出される特徴量の一部または全てを参照画像毎に指定し、それら各特徴量と画像データベースに登録されている検索対象となる被検索画像に予め付与されている各特徴量を用いて総合類似度を算出して出力すべき被検索画像データを得るという画像検索方法を、特願平9−196154において提案した。
【0004】
しかし、画像検索と検索結果の表示を繰り返す中で、検索者の望んでいる想像上の画像に近い画像を検索し、あるいは検索者の曖昧とした検索意図を明確化するためには、1回の試行の中で検索者の検索意図を画像検索システムへ効果的に伝えることの他に、画像検索の結果を検索者へ分りやすく提示することが重要である。
【0005】
後者の、検索結果を検索者へ分りやすく提示する検索システムの提案として、たとえば、特開平5−282375がある。これにおいては、参照画像の属性情報のうち特徴量を持つものを2つ選び、その範囲指定をすることによって検索を行い、その2特徴量を軸とする2次元座標に検索結果の縮小画像を配置することで、ブラウジング表示することが提案されている。また、検索結果のしぼり込みを行うにあたって、次に着目する2次元の属性情報の特徴量の範囲を指定することが提案されている。
【0006】
【発明が解決しようとする課題】
検索者と検索システムとの効果的なインタラクションを行うためには、1回の試行の中で検索者の検索意図を画像検索システムへ効果的に伝えることを踏まえた上で、多様な観点から検索された大量の結果を検索者に分りやすく伝えて、かつ検索者の意図を検索システムへ手軽るに伝える操作性を損なわないようにしなければならない。また逆に、検索者の検索意図が検索結果にどのように反映されたかを検索者へ分りやすく伝えなければならない。例えば、1つの特徴量を表現するベクトルが数十あるいは数百以上もの次元を持っていた場合、複数の特徴量から任意の2次元あるいは3次元を選んで検索のしぼり込みを行う作業を繰り返すのは現実的ではない。検索作業量が多くなるばかりでなく、特徴量としてまとまって理解しやすい意味を持っていても個々のベクトル要素で人に理解しやすい量となっているとは限らないからである。
【0007】
よって、検索者が選んだ参照画像に近い画像の検索を多次元のまま行い、その複数の参照画像の組み合わせと人に理解しやすいまとまった特徴量の指定によって検索意図を表現するのが、検索意図を手軽るな操作性で検索システムへ効果的に伝えるためのよい方法となる。その場合、検索結果としてさまざまな観点からの大量の結果が得られるため、その中から次の検索のための参照画像を選択するためには、これを検索者に分りやすく提示する手段が必要となる。その方法として、検索画像の単なる一覧表示ではなく、一定の序列に従って画像を配置した表示方法が有効である。これは、検索結果だけでなく検索する前の例示画像においても有効となる。また、その表示において、検索者が選択した参照画像がどのような位置付けになっているか示すことで、検索者の検索意図が検索結果へどのように反映されたかを知ることができる。
【0008】
本発明はこのことに着目して、検索結果の画像を一定の序列に従って配置するブラウジング表示画面上で、直接画像指定あるいは領域指定することによって、1つまたは複数の画像を参照画像として選択でき、その場で1つまたは複数の画像に対して特徴量の選択および重みを付与し、画像検索することを提案するものである。また、検索結果を前記ブラウジング表示画面上の縮小画像として表示する際、参照画像も他の結果画像と区別して配置し表示することを提案するものである。また、この手法による検索をサービスとして行うこととして検索者自身がデータの準備をする必要のない画像検索を可能とすることを提案するものである。
【0009】
【課題を解決するための手段】
本発明は、参照画像あるいは任意の例示画像あるいは検索結果画像の特徴量を統計処理して計算される多次元ベクトル空間から1軸または2軸または3軸を任意に選び画像を対応する座標に縮小して配置し検索結果をブラウジング表示し、前記ブラウジング表示画面上で縮小画像の指定あるいは領域指定による複数の縮小画像を指定することで、1つあるいは複数の参照画像を選択し、その場で特徴量の選択や重みを付与し、それら各特徴量と画像データベースに登録されている検索対象となる被検索画像に予め付与されている各特徴量を用いて総合類似度を算出して出力すべき被検索画像データを得ることにより実現できる。
【0010】
【発明の実施の形態】
以下に、本発明の好適な一実施例を添付図を参照して詳細に説明する。
【0011】
図1は本実施例のグラッフィック・ユーザー・インターフェイス(以下、GUIと略称する)を示した模式図である。図の例は、画像から多次元色特徴量(RGB)と多次元微分特徴量(Diff)を抽出し、参照画像あるいは例示画像あるいは検索結果の画像について各特徴量で主成分分析を行い、その最大固有値を持つ固有ベクトルから順に4つまでを選択可能にしたものである。
【0012】
ブラウジング表示画面102のX軸として、X軸特徴量選択ボタン111により多次元色特徴量(RGB)を選択し、X軸主成分選択ボタン112により、その第一主成分が選択されている状態を示すものである。Y軸も同様にしてY軸特徴量選択ボタン110とY軸主成分選択ボタン109により多次元微分特徴量(Diff)の第一主成分が選択されている。図では、選択されているボタンにドットが付されてこの状態を示しているが、この表示は多くのパソコンで行われているボタン表示とするのが見やすい。
【0013】
ここで検索結果画像を表示する画面は多次元固有空間からX軸、 Y軸の特徴量や主成分の選択により任意の空間が設定できる。以下の実施例では、この2軸の設定により決まる空間を可視化空間と称する。
【0014】
ブラウジング表示画面102には、縮小された画像103が、選択した前記2軸に対応する座標に配置されており、そのような画像が多数存在している。画像の表示に際して、軸成分の値が近くて画像が部分的に重なるときは検索の順位の高いものが前面に見えるようになっている。前面の画像によって完全に多い隠されてしまう画像の表示処理は行われない。
【0015】
マウスカーソル114によって画像を直接指定することによって、表示されている縮小画像を直接参照画像に選択したり参照画像から外したりすることができる。そして、ブラウジング表示画面102に参照画像をキーにして選択されて表示された多くの画像のうち、キーとなった参照画像は円マーク104で囲まれ、他の画像と区別できるようにする。また、マウスカーソル114によって破線113で示すように表示画面102の任意の領域を指定することもできて、その中に含まれる縮小画像を参照画像に指定することができる。
【0016】
マウスカーソル114によって画像を選択すると、画像拡大表示部108に拡大表示することができる。図の例は、画像拡大表示部として最大3つの領域を常時表示できるものとされている。縮小画像を順次選択していくと新しく選択された3つが表示され、先に選択された画像はその履歴が残るようになっている。画像拡大表示部108の画像サイズはスクロールバー107によって調整できる。一方、画像拡大表示部108として使用できる表示画面の領域は限られているから、画像サイズを大きくしたときは、画像拡大表示される画像数が減ることになる。
【0017】
画像拡大表示部108の画像に対して、画像内の任意の領域を部分的に指定することができ、かつ、この部分領域は一つに限らず複数指定することができる。指定された部分領域はそれぞれが独立した参照画像として自動的に登録され、ブラウジング表示画面102に円で囲まれた画像として出現する。
【0018】
また、マウスカーソル114によって、ブラウジング表示画面102の任意の座標を指定して、ブラウジング表示画面102のその座標の中心位置を変更することが出来る。例えば、右端、あるいは左端にある画像を表示画面の中央へ、または上端あるいは下端にある画像を表示画面の中央へ、平行移動させることができる。更に、SCALEと表示されているスクロールバー101によって、座標スケールを指数関数的に拡大縮小率を変化させて調節できる。このスケールを拡大すると、ブラウジング表示画面102の中央を中心として放射状に縮小画像が遠ざかっていき、表示される画像数は減少するが、画像の重なりを少なくするようにできる。これによって、ブラウジング表示画面の小領域における画像間の詳細分布を知ることができる。また、この座標スケールを縮小すると、表示画像の集合としての全体の配置を概観することができる。つまり、縮小画像集合の全体の概観と小領域における詳細表示とを、スクロールバー101の調整によって連続的に変えて見ることができる。
【0019】
106はサーチボタンであり、これを押すと参照画像をキーとする検索が行われる。CALC SPACEと表示された105は固有空間計算ボタンであり、これはトグルボタンとなっており、ボタンを押すとサーチボタン106の操作によって行われた検索結果に対して、各画像の可視化空間における配置を計算して、縮小画像をブラウジング表示画面102に表示する。固有空間計算ボタン105をあらかじめ押した状態に設定しておくと、サーチボタン106を押して検索する度に、検索結果から固有空間を計算しなおして、縮小画像を可視化空間へ配置しブラウジング表示画面を更新する。固有空間計算ボタン105を解除しておくと、設定中、最後に計算した固有空間を保存しており、サーチボタン106によって検索された結果はその保存された固有空間における可視化空間において、縮小画像を配置しブラウジング表示画面を更新する。この際、参照画像はブラウジング表示画面の対応する座標に必ず配置されるようになっている。
【0020】
ここでは統計処理として主成分分析を用いたが、原画像にキーワードを付与することが行われていれば、キーワードのような外的基準を持った統計処理として正準相関分析を行うこと、あるいはオーソマックス基準などによる因子分析を行うことも考えられる。
【0021】
また、ブラウジング表示画面において、縮小画像が可視化空間上に一定の序列を持って配置されることになる。その序列は固有空間の軸を特徴量選択ボタン110,111や主成分選択ボタン109,112にて任意に選択することで、検索者の意図に近いものを探すことが簡単にできる。縮小画像が序列を持って配置されるため、似た画像が座標的に近い位置に並ぶことになる。すなわち、次の検索で検索者の意図をより反映させるために、その序列で似た傾向の画像を選択することが、領域指定などで容易にできることを意味する。
【0022】
更に、参照画像が円マークで示されることによって、現在の検索結果で、あるいは次の検索結果でどのような配置に位置付けられているかを検索者に示すことになる。その上、固有空間計算ボタン105を解除しておくことで、以前の固有空間上における現在の検索結果の分布を知ることができる。
【0023】
図2は、領域指定した領域306内の参照画像として選択した円マークを付した全ての縮小画像(代表を305で示す)に対して、同じ特徴量および重みを設定している様子を表わしている。
【0024】
本実施例では、ブラウジング表示画面上にて領域を指定したり、あるいは1個の縮小画像を指定することによって、ポップアップウィンドー307を出現させることができる。ポップアップウィンドー307には、可視化空間の設定に採用された特徴量の数だけ特徴量重みフィールド304が表示されている。特徴量重みフィールド304には、特徴量名301が表示され、テキストフィールド302に直接数値を記入して重みを入力することもできるし、スクロールバー303にて入力することもできる。0以外の値が設定された特徴量は、選択されたものとして、検索時に使用される。
【0025】
図3は、画像データベース205および入力操作・画像表示装置209との関連を含め、画像検索のデータの流れの一実施例を示した模式図である。まず、検索者は例示画像準備ステップ213にて、例示画像を準備する。この例示画像は、検索者が直接入力するものでも良いし、検索者がデータを指定してあらかじめ画像データベース205に用意されているものから得るものとしても良い。検索者がデータを指定するものとすると、例示画像準備ステップ213から必要に応じてトリガーが入力操作・画像表示装置209へ送られ、画像表示や主成分分析のための初期化処理が行われる。同時に画像データベース205に対して、例示画像読み込み要求214が送信される。その後、画像データベース205から例示画像読み込み要求214に対応した例示画像データ210が入力操作・画像表示装置209へ送られ、必要に応じて主成分分析215が行なわれた後、ブラウジング表示画面に縮小画像として配置される。検索者が画像を直接入力する場合には、入力された画像が入力操作・画像表示装置209へ表示される。検索者は、入力操作・画像表示装置209のGUIによって、参照画像の特徴付けステップ200により、参照画像あるいは参照画像の特定領域を指定するとともに、その特徴量を指定し、その重みなどを入力する。図3では、参照画像に付与する特徴量を201で表示し、特徴量の重みを204で示した。ここでは、参照画像から直接特徴抽出するものとしたが、既に何度も画像検索が行われて、参照画像が画像データベース205内に保存されている場合には、あらかじめ格納されている特徴量を使用することができる。画像検索ステップ202では参照画像の特徴量201を入力し、その特徴量に対して画像データベース205の画像特徴量とマッチングを行う。具体的には、画像データベース205へ特徴量読み込み要求211を送信し、一つの被検索画像の特徴量の読込み206を行う。特徴量201と対応する被検索画像の特徴量とマッチングされ、特徴量毎の類似度203を出力する。つぎに、入力操作・画像表示部209のGUIによって付与された参照画像毎の特徴量の重み204を使用して、特徴量の類似度203に重み付けを行い、特徴量の類似度と重みとを総合した総合類似度203’を生成する。それはソートステップ208にて蓄えられる。上記手順を画像データベース205内の検索が終了するまで繰り返す。その後、ソートステップ208で総合類似度に従って並べ替え、検索データとなる。また、必要に応じて、トリガーが入力操作・画像表示装置209へ送られ、初期化処理が行われる。検索データのデータ名は、検索結果画像の読み込み要求212として、画像データベースに送られ、入力操作・画像表示装置209へ画像データ210が送られる。こうして、必要に応じて主成分分析215が行なわれブラウジング表示画面に縮小画像として検索結果が表示される。この結果表示に対して、入力操作を行い画像検索を繰り返すことができる。また、ソートステップ208からの結果出力数は、総合類似度に従って並べた数によって制限する方法もあるし、また総合類似度のしきい値を設定して、それを超えた結果のみ出力する方法もある。
【0026】
ここで総合類似度207を説明する。総合類似度Rは(数1)により定義される。
【0027】
【数1】
【0028】
ここで、iは参照画像を区別する番号、jは特徴量ベクトルの種類を区別する番号である。Wijは参照画像毎の各特徴量に付与された重みであり、値は正や零、負をとりうる。αijは類似度場の広がりを制御するパラメータで「検索の鋭さ」と呼んでおり、値は正か零である。これは分散の逆数の意味を持つ。xjはデータベース内の画像に関する特徴量ベクトル、qijは参照画像の特徴量ベクトルである。参照画像毎の各特徴量において算出される類似度Rijの重みWij付き加算として、総合類似度Rが定義されている。
【0029】
この総合類似度Rを得る(数1)によれば、参照画像毎に指定する特徴量毎に検索者の好みを反映させることができる。すなわち、参照画像の好きな特徴量には正の重みを付与し参照画像の嫌いな特徴量には負の重みを付与するのである。
【0030】
この総合類似度Rの場合、各特徴量の存在する多次元空間上の位置からの距離とその特徴量に付与された重みに応じた類似度場を特徴量空間上にそれぞれ形成し、その類似度場の合成として形成される総合類似度場が、2つの特徴量に付与された重みが正同士ならそれら2つの間に総合類似度場の頂点が生じ、あるいは2つの特徴量に付与された重みが正と負ならば、正の重みを付与された特徴量に対し、負の重みを付与された特徴量と反対側へ総合類似度場の頂点が生じるような性質を持つ。これによって、検索者の想像上の画像に類似な画像、類似していない画像、あるいは検索者の好みの特徴量、嫌いな特徴量を設定し、検索に反映することができる。
【0031】
ところで、類似度とは、(数1)のように似ているもの同士の間では値が大きくなり、そうでないものに対しては小さくなる指標として使用されているが、そのような類似度の替りに似ているもの同士では値が小さくなり、そうでないものでは値が大きくなる距離の指標を採用することもできる。その際には、重みWij付き加算という形式では、前記の類似していない画像あるいは嫌いな特徴量という検索意図を画像検索に反映することができないが、扱いやすい指標であるので通常よく使われる。
【0032】
例えば、総合類似度の代わりに(数2)、(数3)のように総合距離Dを定義できる。総合距離Dは小さいほど近い画像である。
【0033】
【数2】
【0034】
ここで、iは参照画像を区別する番号、jは特徴量ベクトルの種類を区別する番号である。Wijは参照画像毎の各特徴量に付与された重みであり、値は正か零をとりうる。xjはデータベース内の画像に関する特徴量ベクトル、qijは参照画像毎の各特徴量ベクトルである。Nqは参照画像の数、Nfは特徴量の数である。(数2)は重みを考慮したノルムの2乗を参照画像で平均して総合距離Dを算出している。
【0035】
【数3】
【0036】
ここで、iは参照画像を区別する番号、jは特徴量ベクトルの種類を区別する番号である。Wijは参照画像毎の各特徴量に付与された重みであり、値は正か零をとりうる。xjはデータベース内の画像に関する特徴量ベクトル、qijは参照画像毎の各特徴量ベクトルである。Nfは特徴量の数である。第一項は、特徴量重みを考慮して参照画像の中で最も小さいノルムの2乗値を求めており、データベース内の画像からの距離が参照画像のどれかに近ければ近い値が出力されるためOR的な振舞いをする。第二項は、特徴量重みを考慮して参照画像の中で最も大きいノルムの2乗値を求めており、データベース内の画像からの距離が参照画像のどれからも近くなければ近い値が出力されないためAND的な振舞いをする。αは前述のような検索の振舞いを操作するパラメータで、0に近ければ複数の参照画像との距離のAND的な振舞いをし、1に近ければ同様にOR的な振舞いをする。
【0037】
図4、図5は、1回の画像検索方法の流れを説明したPAD図(Problem Analysis Diagram)である。
【0038】
図4は全体の流れを説明したPAD図である。まず、例示画像の表示処理401が行なわれる。これは前回の検索結果を再利用する場合には実行されない。GUI(グラッフィック・ユーザー・インターフェイス)のサーチ入力ループ402でパラメータの入力を続ける。これが終了すると画像検索処理403へ移行し、結果表示処理404にて、必要に応じて固有空間が計算され、縮小画像が対応するブラウジング表示画面上に表示される。402ではイベント入力処理405が行われ、画面上のボタン押下やスケール値の変更などを受けつける。そうして入力されたイベントは、イベント解析処理406にて判定され、それぞれのイベントの処理に移る。イベント処理407では検索者がブラウジング表示画面に提示されている画像の特徴量に重みを付与することで、その画像と重みを付与した特徴量を選択しかつ重みも入手する。イベント処理408では参照画像の領域指定を行う。領域はポインターにて始点と終点を対角とする長方形で指定するのが一般的であるが、一筆書的に自由に領域を指定しても良い。イベント処理409では固有空間を計算しなおしてブラウジング表示画面を更新する。選択画像の拡大表示処理410ではブラウジング表示画面に配置された縮小画像を指定することによって拡大表示部に拡大表示する。この画像は、画像サイズ変更処理411にて変更することができる。また、センタリングの座標指定処理412ではブラウジング表示画面の任意の座標を指定することによって、ブラウジング表示画面の中央へ画面全体を平行移動することができる。同時に、可視化空間のスケール変更処理413によって、ブラウジング表示画面のスケールを変更できる。また可視化空間上で領域指定処理414によって、縮小画像を複数同時に参照画像として選択することができる。固有空間の2軸指定処理415によって、任意の特徴量や主成分をそれぞれX軸、Y軸へ指定することができる。サーチ入力処理416によって、サーチ入力ループ402のループから抜けサーチ処理403に移動する。
【0039】
図5は、画像データベース内の特徴量検索の流れを説明したPAD図である。画像検索処理403では、まず、検索終了まで繰り返すループ501に入り、検索方法が全データへのアクセスする方法ならば全てのデータベース内に登録された画像の特徴量データの全てにアクセスした時点でループを抜ける。あるいは、バイナリサーチなどのように全データにアクセスせずとも検索できる方法であるなら、木構造の末端へ到達した時点でループを抜ける場合もある。処理503にて、画像データベースから1つの画像に関する各特徴量を取りだす。処理504にて全ての指定した参照画像についてループを行い、終了したらループを抜ける。処理506にて処理504で指定した参照画像について、検索者が指定した特徴量と処理503で指定した被検索画像の対応する種類の特徴量に関して類似度Rijをそれぞれ算出する。処理507にて処理506で計算された類似度Rijに検索者によって各特徴量に付与された重みWijを掛け合わせる。処理505にて処理504までで作成された重み付き類似度Rijを加算して総合類似度Rを計算する。処理502の時点では、検索した被検索画像について総合類似度Rが付与されておりそれに従って画像のソートを行う。こうして画像検索が行われる。
【0040】
図6は、本発明による検索をネットワークシステムを利用して行う場合の一実施例としてのクライアント側とサーバ側とのそれぞれの構成および連係関係を示した模式図である。クライアント側とサーバ側との連係は、例えば、画像表示機能を持ったワールドワイドウエブのブラウザを利用した通信機能によれば容易に実現できるから、ここでは、これ以上の説明は省略する。
【0041】
一点鎖線で囲って示す画像検索クライアントシステム607と一点鎖線で囲って示す画像検索サーバーシステム608がネットワーク602で接続された構成をしている。装置601は、図1、2で説明したようなGUIを実装する表示及び入力装置である。GUIにて参照画像の選択や特徴量の指定、その重み入力などが行われる。それらのパラメータは、パラメータなどを入力したり、画面レイアウト情報に従って、例示画像や検索結果の画像を表示する機能を備えている。装置606は、ネットワークサーバー603とネットワーク602を介して通信を行うネットワーククライアントである。GUIで入力された入力パラメータを送信したり、画像データや画面レイアウト情報を受信したりする。装置603は、GUI機能をネットワーク602を介して提供するネットワークサーバーである。具体的には、ネットワークサーバー603で画面レイアウトを作成しそのレイアウト情報をネットワーククライアント606へ送信したり、入力パラメータを受信して、画像検索装置604へ渡したりする。場合によってはGUIを機能させるためのプログラムやデータをネットワーククライアント606へ送信することもある。装置604は、入力パラメータに従って画像検索を行う画像検索装置である。画像データベース605にアクセスして、検索結果をネットワークサーバー603へ渡す。画像検索の詳細は、図1−図5で説明したと同じ手順がネットワーク602を介して行われるという点が異なるだけで、技術的な内容に実質的な差異はない。画像データベース605には画像自体と画像からあらかじめ抽出しておいた画像毎の特徴量が格納されており、画像検索時に画像検索装置604に利用される。
【0042】
図7は、画像検索クライアント・サーバーシステムの通信手順を説明したNSチャートである。まず、画像検索サーバーシステム(以下、Sシステムと略称する)の起動721が行なわれる。Sシステムが初期化722されて、設定ファイルの読み込みなど準備される。画像検索サーバーシステムは、通常の状態では、常時システムの初期化は終了した状態になされてクライアントからのアクセスに備えるものとされる。画像検索クライアントシステム(以下、Cシステムと略称する)の起動701が行われると同様にして初期化702がなされる。クライアントが画像検索を行おうとするとき、 Cシステムからアクセス通信接続処理703にて通信接続要求をSシステムへ送信する。Sシステムでは、通信接続処理723において、通信接続要求のあったCシステムとの間に通信接続を確立する。この中では、接続要求があるまで通信待機したり、Cシステムとの情報のやりとりやGUIのためのプログラムを送信などが行われる。Cシステムの通信接続処理703では、受信した情報を設定したり、GUIのプログラムを実行したりする。以上で画像検索の準備が完了する。この後、CシステムではGUIが起動しはじめ、SシステムではCシステムの要求に対して反応し処理を実行するようになる。最初に、Cシステムの処理704で、例示画像要求を送信し、通信待機処理705となる。通信待機中724であるSシステムが通信を受信すると、まず受信内容の判定を行う。通信内容が、例示画像要求725であるなら、「Y」分岐へ行き処理726で例示画像の送信を行ったのち通信待機処理727となる。「N」分岐の場合、通信内容の別の判定を試みる。Cシステムの通信待機処理705で例示画像を受信すると、例示画像表示処理706でそれを表示する。この状態でCシステムはGUIが完全に起動状態となり、検索者からの入力を受ける準備ができる。次に、処理707で検索者からの入力を受けつける。検索者の画面の操作を通して参照画像の選択、画像毎の特徴量の指定、その重みの付与などを行う。それらのパラメータを処理708にて送信し、通信待機中709となる。Sシステムでは、通信待機処理727の最中に通信を受けると、受信内容の判定を行う。通信内容がパラメータ受信728であるなら、「Y」分岐へ行き処理729にて画像検索を行い、処理730にてその検索結果の画像名や類似度等の送信を行う。処理730ではまた画像レイアウトも作成し、その情報も送信する。「N」分岐の場合、通信内容の別の判定を試みる。Cシステムの通信待機処理709で検索結果を受信すると、それぞれに対応する検索画像データを処理710にて要求し、通信待機中711となる。Sシステムの通信待機中731に通信を受けると、受信内容の判定を行う。通信内容が検索画像要求732であるなら、「Y」分岐へ行き処理733にて検索画像の送信を行う。Cシステムの通信待機処理711で検索画像を受信すると、処理712にて画像レイアウト情報にしたがってレイアウトを表示する。処理713は検索者が検索を終了させるまでループを行い、処理707へ戻って検索をそのまま続けるか、あるいは処理704〜706の例示画像表示処理へ移行する。検索終了だと処理714にて終了処理を行う。Sシステムでは、画像検索サービスが終了するまで処理734にてループを行い通信待機状態724になる。サービス終了の場合は処理725にて終了処理を行う。
【0043】
なお、図6、図7の例では、画像データベース605が画像自体をデータとして持ち、出力も画像を直接出せるものとして説明したが、ワールドワイドウエブのブラウザを利用した通信機能を利用した検索でよく行われているように、画像データベース605は検索結果として得られる画像の所在を示すデータのみを提供できるようにして、検索者がこの画像の所在を示すデータを利用して画像を得るものとすることもできる。このようにしたときは、画像データベース605は小さいものとできる。
【0044】
以上説明したように、本発明の実施例では、以下のように多様な観点での検索が効率よく出来る。
【0045】
(1)複数の画像を参照画像として検索し、複数の検索結果画像を主成分分析によって計算される多次元固有空間から2軸を任意に選び画像を、対応する可視化空間上の座標に縮小表示して配置しブラウジング表示することができる。これによって、複数参照画像と多次元特徴量ベクトルによって多様な観点によって検索された大量の結果を、選択した序列に従って提示することができる。
【0046】
(2)1つの選択した画像から複数の領域を指定し、それぞれの領域を独立な参照画像として検索し、複数の検索結果画像を主成分分析によって計算される多次元固有空間から2軸を任意に選び画像を、対応する可視化空間上の座標に縮小表示して配置しブラウジング表示することができる。これによって、複数の領域と多次元特徴量ベクトルによって多様な観点によって検索された大量の結果を、選択した序列に従って提示することができる。
【0047】
(3)ブラウジング表示画面上に参照画像を配置して、他の検索結果と区別して表示することにより、検索条件である参照画像がどのように検索に反映されたかを検索者へ提示することができる。
【0048】
(4)ブラウジング表示画面上で座標を指定することで、その座標がブラウジング表示画面の中央へ位置するように画面全体を平行移動でき、拡大縮小率を指定することでブラウジング表示画面の中央を中心として表示スケールの拡大縮小を行うことができる。これにより、スケール拡大によって重なった画像を分離する操作とスケール縮小して概観表示をする操作を連続的に行うことができる。
【0049】
(5)ブラウジング表示画面から画像の指定あるいは領域指定によって、1つまたは複数の画像を選択し参照画像とすることができる。これにより、固有空間上の指定した2軸で表現されたブラウジング表示画面上に、序列を持って表示された縮小画像を、検索者が一度に複数選択することができるため、その序列による似た傾向の画像を選択する操作を容易に行うことができる。
【0050】
(6)ブラウジング表示画面から指定した画像あるいは指定した領域に含まれる画像において、特徴量の選択と重みの付与を行うことができる。これにより、固有空間の序列による複数の似た傾向の画像に対し同時に同じ特徴量を指定し、同時に同じ重みを付与できるため、効率的に検索条件の設定を行うことができる。
【0051】
【発明の効果】
本発明は、検索者の望んだ画像を容易に得ることができるから、デザインを利用することを頻繁に行う広告業界や放送業界、あるいはデザインを売ることを目的としたコンテンツサービス業界等において、有効に利用できるのみならず、PC上で動作する個人ベースでホームページやその他のデザインを作成するなどの創造支援アプリケーションにも利用できる。
【図面の簡単な説明】
【図1】本実施例のグラッフィック・ユーザー・インターフェイスを示した模式図。
【図2】固有空間の領域指定により選択した複数画像に対し特徴量を選択して重みを付与するグラフィック・ユーザー・インターフェイスを示した模式図。
【図3】画像検索のデータの流れの一実施例を示した模式図。
【図4】1回の画像検索の全体の流れを説明したPAD図。
【図5】画像検索の全体の流れのうち、画像データベース内の特徴量検索の流れを説明したPAD図。
【図6】本発明による検索をネットワークシステムを利用して行う場合の一実施例としてのクライアント側とサーバ側とのそれぞれの構成および連係関係を示した模式図。
【図7】画像検索クライアント・サーバーシステムの通信手順を説明したNSチャート。
【符号の説明】
101:ブラウジング表示画面のスケールを変更するスクロールバー
102:ブラウジング表示画面
103:例示画像あるいは検索結果の画像
104:参照画像
105:固有空間計算ボタン
106:画像検索開始ボタン
107:拡大画像の拡大率を変更するスクロールバー
108:拡大画像
109:Y軸の主成分選択ボタン
110:Y軸の特徴量選択ボタン
111:X軸の特徴量選択ボタン
112:X軸の主成分選択ボタン
113:領域指定の枠
114:マウスカーソル
201:参照画像の特徴量
202:画像検索部
203:特徴量毎の類似度の流れ
204:特徴量重み
205:画像データベース
206:被検索画像の特徴量の流れ
207:総合類似度合成部
208:総合類似度ソート部
209:入力操作・画像表示部
210:画像データの流れ
211:特徴量読み込み要求
212:検索結果画像の読み込み要求
213:例示画像表示部
214:例示画像の読み込み要求
215:主成分分析をする統計処理部
301:特徴量名
302:特徴量重み入力フィールド
303:特徴量重み入力スクロールバー
304:特徴量重みフィールド
305:領域指定によって参照画像に指定された縮小画像
306:領域指定の枠
307:ポップアップウィンドー
401:例示画像表示処理
402:サーチ入力までループ処理
403:画像データベース内のサーチ処理
404:検索結果の表示処理
405:イベント入力処理
406:イベント解析処理
407:参照画像指定・特徴量指定・重み付与処理
408:参照画像の領域指定処理
409:固有空間の計算処理
410:選択画像の拡大表示処理
411:拡大画像の拡大率変更処理
412:センタリングの座標指定処理
413:可視化空間のスケール変更処理
414:可視化空間の領域指定処理
415:固有空間の2軸指定処理
416:サーチ入力処理
501:検索終了までループ
502:検索結果のソート
503:画像データベースからの特徴量の取り出し
504:全ての参照画像を使用するまでループ
505:総合類似度の算出
506:一つの特徴量の類似度算出
507:一つの特徴量の類似度への重みの積。
Claims (4)
- 検索された複数の画像の特徴量を使用し、
前記特徴量の統計処理によって計算される多次元ベクトルから、1軸または2軸または3軸を任意に選び、
前記検索された複数の画像を前記選ばれた軸に対応する座標に縮小して配置して表示し、
前記表示した画面から画像の指定あるいは領域指定によって、参照画像を1つまたは複数個選択して新たな検索を行うとともに、検索された複数の画像を上記多次元ベクトルの前記選ばれた軸に対応する座標に縮小して配置して表示を更新する、
ことにより上記多次元ベクトルの前記選ばれた軸に対応する座標に対応して新しい参照画像に応じ検索された複数の画像をブラウジング表示することを特徴とする画像検索方法。 - 参照画像の指定を受け、
前記参照画像あるいは前記参照画像の指定された領域の特徴量と画像データベースに登録されている検索の対象となる被検索画像の特徴量とを用いて総合類似度または総合距離を算出し、
前記算出された総合類似度または総合距離に応じた検索結果画像を出力し、
前記検索結果画像から抽出した特徴量を用いて前記統計処理し、
前記検索結果画像をブラウジング表示する、
ことを特徴とする請求項1記載の画像検索方法。 - 任意に選択された複数の画像についても前記特徴量を抽出し、
前記ブラウジング表示を行なう請求項1記載の画像検索方法。 - 検索された複数の画像の特徴量を抽出する手段と、
前記特徴量の統計処理によって計算される多次元ベクトルから、1軸または2軸または3軸を任意に選ぶ手段と、
前記検索された複数の画像を前記選ばれた軸に対応する座標に縮小して配置して表示する手段と、
前記表示した画面から画像の指定あるいは領域指定によって、参照画像を1つまたは複数個選択する手段と、
新たな指定に対応した新たな検索を行うとともに、検索された複数の画像を上記多次元ベクトルの前記選ばれた軸に対応する座標に縮小して配置して表示を更新する手段と、
よりなり、上記多次元ベクトルの前記選ばれた軸に対応する座標に対応して新しい参照画像に応じ検索された複数の画像をブラウジング表示することを特徴とする画像検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33675197A JP3586549B2 (ja) | 1997-12-08 | 1997-12-08 | 画像検索方法およびその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33675197A JP3586549B2 (ja) | 1997-12-08 | 1997-12-08 | 画像検索方法およびその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11175535A JPH11175535A (ja) | 1999-07-02 |
JP3586549B2 true JP3586549B2 (ja) | 2004-11-10 |
Family
ID=18302388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33675197A Expired - Lifetime JP3586549B2 (ja) | 1997-12-08 | 1997-12-08 | 画像検索方法およびその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3586549B2 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3686802B2 (ja) * | 1999-11-08 | 2005-08-24 | 日本電信電話株式会社 | データベース検索方法、装置、およびデータベース検索プログラムを記録した記録媒体 |
JP3457617B2 (ja) * | 2000-03-23 | 2003-10-20 | 株式会社東芝 | 画像検索システムおよび画像検索方法 |
JP4512251B2 (ja) * | 2000-10-06 | 2010-07-28 | ソネットエンタテインメント株式会社 | 検索装置 |
KR20020041898A (ko) * | 2000-11-29 | 2002-06-05 | 구자홍 | 화상 정보 검색 방법 |
JP4363792B2 (ja) * | 2001-03-23 | 2009-11-11 | 富士通株式会社 | 情報検索システムおよび方法 |
US7425963B2 (en) * | 2001-07-16 | 2008-09-16 | Hewlett-Packard Development Company, L.P. | Hierarchical image feature-based visualization |
US7146361B2 (en) | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
JP4579638B2 (ja) * | 2004-10-05 | 2010-11-10 | キヤノン株式会社 | データ検索装置及びデータ検索方法 |
KR100763197B1 (ko) * | 2006-02-06 | 2007-10-04 | 삼성전자주식회사 | 컨텐츠 검색 방법 및 장치 |
JP4958456B2 (ja) * | 2006-03-14 | 2012-06-20 | 学校法人同志社 | 画面の表示方法 |
TW200809764A (en) | 2006-04-24 | 2008-02-16 | Sony Corp | Image processing device, image processing method and program recording medium |
JP4730619B2 (ja) * | 2007-03-02 | 2011-07-20 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US8818979B2 (en) | 2007-05-17 | 2014-08-26 | Valuenex Consulting Inc. | Document retrieving apparatus and document retrieving method |
JP2009123196A (ja) * | 2007-10-22 | 2009-06-04 | Hitachi Kokusai Electric Inc | 画像検索装置 |
JP5237037B2 (ja) * | 2008-10-01 | 2013-07-17 | キヤノン株式会社 | 画像処理装置および画像処理方法、プログラム |
US8335784B2 (en) * | 2009-08-31 | 2012-12-18 | Microsoft Corporation | Visual search and three-dimensional results |
US8775424B2 (en) * | 2010-01-26 | 2014-07-08 | Xerox Corporation | System for creative image navigation and exploration |
JP5598196B2 (ja) * | 2010-09-15 | 2014-10-01 | 株式会社リコー | 情報表示装置、情報表示システム、情報表示方法およびプログラム |
JP5158450B2 (ja) * | 2010-09-29 | 2013-03-06 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
EP2682849A4 (en) * | 2011-03-01 | 2014-12-03 | Pioneer Corp | PICTURE POSITIONING PROCESS, SEARCH PROCESS, DISPLAY CONTROL DEVICE, SERVER, USER DEVICE, COMMUNICATION SYSTEM, IMAGE POSITIONING SYSTEM AND PROGRAM |
JP5408241B2 (ja) * | 2011-12-21 | 2014-02-05 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP6188370B2 (ja) * | 2013-03-25 | 2017-08-30 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | オブジェクト分類方法、装置及びプログラム。 |
JP6058595B2 (ja) * | 2013-07-31 | 2017-01-11 | 富士フイルム株式会社 | 画像検索装置、画像検索方法、プログラムおよび記録媒体 |
JP6414982B2 (ja) * | 2015-08-28 | 2018-10-31 | 富士フイルム株式会社 | 商品画像表示制御装置及び商品画像表示制御方法及びプログラム |
CN107578014B (zh) * | 2017-09-06 | 2020-11-03 | 上海寒武纪信息科技有限公司 | 信息处理装置及方法 |
JP6971112B2 (ja) * | 2017-09-29 | 2021-11-24 | 株式会社Screenホールディングス | 教師データ作成支援装置、分類装置および教師データ作成支援方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612552B2 (ja) * | 1988-01-25 | 1994-02-16 | 日本電気株式会社 | 電子化文書検索装置 |
JPH04348474A (ja) * | 1990-12-28 | 1992-12-03 | Kawasaki Steel Corp | 画像データベースの管理・検索装置 |
JPH05282375A (ja) * | 1992-03-30 | 1993-10-29 | Nippon Telegr & Teleph Corp <Ntt> | 画像検索方法およびシステム |
JPH08329097A (ja) * | 1995-05-30 | 1996-12-13 | Minolta Co Ltd | 画像データ検索装置 |
JP3373086B2 (ja) * | 1995-07-24 | 2003-02-04 | シャープ株式会社 | 情報検索装置 |
JPH09101970A (ja) * | 1995-10-06 | 1997-04-15 | Omron Corp | 画像検索方法および画像検索装置 |
JPH09114853A (ja) * | 1995-10-20 | 1997-05-02 | Omron Corp | 画像検索方法および画像検索装置 |
-
1997
- 1997-12-08 JP JP33675197A patent/JP3586549B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH11175535A (ja) | 1999-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3586549B2 (ja) | 画像検索方法およびその装置 | |
US6275229B1 (en) | Computer user interface for graphical analysis of information using multiple attributes | |
EP1012744B1 (en) | Method and apparatus for graphically representing portions of the world wide web | |
US6434556B1 (en) | Visualization of Internet search information | |
US8214345B2 (en) | Custom constraints for faceted exploration | |
TWI238948B (en) | Visual navigation utilization web technology | |
CN101114301B (zh) | 在计算机系统的数据库中进行导航的方法和系统 | |
CA2202481C (en) | Method and system for executing a guided parametric search | |
US9152624B1 (en) | Systems and methods for visual presentation and navigation of content using data-based image analysis | |
US20030195901A1 (en) | Database building method for multimedia contents | |
JP3148133B2 (ja) | 情報検索装置 | |
US20060119618A1 (en) | Graphical interface for manipulation of 3D models | |
EP1835466A2 (en) | Method and apparatus for geometric data processing and a parts catalog system | |
EP1821253A1 (en) | Parts catalog system, method and program to generate parts catalog and recording medium storing the program | |
US20040177069A1 (en) | Method for fuzzy logic rule based multimedia information retrival with text and perceptual features | |
US20060112142A1 (en) | Document retrieval method and apparatus using image contents | |
WO2004010362A1 (en) | Systems and methods for facilitating internet shopping | |
US20030236778A1 (en) | Drawing search support apparatus and drawing search method | |
JP2001005822A (ja) | 画像表示方法および装置およびこれを利用した検索サービス | |
US20040088291A1 (en) | Retrieval condition setting method and retrieval condition setting apparatus | |
JPH1139332A (ja) | 画像検索方法およびその装置およびこれを利用した検索サービス | |
JP3339937B2 (ja) | データベース検索装置 | |
JPH09138804A (ja) | 画像検索装置 | |
US20020087577A1 (en) | Database building method for multimedia contents | |
KR20010104871A (ko) | 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040301 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040525 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040803 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040809 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070813 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080813 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080813 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090813 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100813 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100813 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110813 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120813 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130813 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |