JP5143773B2 - 画像検索装置 - Google Patents

画像検索装置 Download PDF

Info

Publication number
JP5143773B2
JP5143773B2 JP2009067272A JP2009067272A JP5143773B2 JP 5143773 B2 JP5143773 B2 JP 5143773B2 JP 2009067272 A JP2009067272 A JP 2009067272A JP 2009067272 A JP2009067272 A JP 2009067272A JP 5143773 B2 JP5143773 B2 JP 5143773B2
Authority
JP
Japan
Prior art keywords
image
resolution
similarity
weight
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009067272A
Other languages
English (en)
Other versions
JP2010218479A (ja
Inventor
ゾラン ステイチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009067272A priority Critical patent/JP5143773B2/ja
Publication of JP2010218479A publication Critical patent/JP2010218479A/ja
Application granted granted Critical
Publication of JP5143773B2 publication Critical patent/JP5143773B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クエリ画像に類似する画像を検索するための装置及び方法に関するものである。
画像検索には、大きく分けて、テキストベースの検索手法と、画像ベースの検索手法とが存在する。
テキストベースの画像検索では、ユーザがテキストクエリを指定し、そのテキストクエリに関連するタグを有する画像をシステムが検索する。この手法によれば、テキストクエリと意味的に関連する画像を検索することができる。しかしながら、この手法を実現するには、画像に対してタグを付す必要がある。このタグ付け作業は、通常、人手に頼る必要がある。また、タグ付与の誤りや、入力されたテキストクエリと付与されているタグとの不一致などにより、検索精度が悪くなる可能性がある。
一方、画像ベースの検索手法では、通常、ユーザが指定したクエリ画像の特徴量と、画像DB中の画像の特徴量とを比較し、特徴量が近いものを類似画像として抽出する。この手法では、画像特徴量の抽出や、特徴量どうしの比較をコンピュータで自動的に行うことができるという利点がある。
しかしながら、画像特徴量を用いた類似画像の検索においては、計算そのものは精度良く実行できるが、検索された画像とクエリ画像とが意味的に整合しない可能性がある。例えば、黄色い箱と黄色い自動車のように、特徴量としてよく似た画像であっても、意味的には全く異なる場合がある。また、画像ベースの検索では、クエリ画像からユーザの意図を読み取ることが一般には難しいので、ユーザの意図に沿わない画像が検索される可能性もある。
画像ベースの検索の精度を向上させる手法として、従来から、多重解像度モデル(Multi Resolution Image Similarity Model)を用いた検索手法が提案されている(例えば下記特許文献1参照)。以下、この検索手法の概要を説明する。この手法においては、画像の分割を「解像度」という概念で表す。例えば、解像度2×1であれば、上下2枚に分割されたことを表す。この場合の分割線は、横方向に延びる。また、解像度1×2であれば、左右2枚に分割されたことを表す。この場合の分割線は、縦方向に延びる。分割数をどのように決めるかは、検索目的や、実験的に得られた検索精度に応じて決めることができる。解像度としては、例えば、1×1,2×1,1×2,2×2,3×1,1×3,3×3,4×4,5×5,6×6などのように、適宜に定めることができる。なお、解像度1×1は分割されていない画像である。
そして、各解像度において、クエリ画像と対象画像(DB中の画像)との類似度を計算する。ある解像度での類似度は、分割によって生成された各領域における類似度の和として得ることができる。各領域における類似度は、画像の色や形状やテクスチャなどの特徴量に基づいて、通常の画像類似度と同様にして計算できる。その後、各解像度における類似度の総和を計算することにより、クエリ画像と対象画像との全体としての類似度を得ることができる。
多重解像度モデルを用いた画像検索では、画像における局所的類似度を重視して画像検索を行うことができる。
しかし、多重解像度モデルを用いた画像検索においても、クエリ画像と意味的に関係しない画像を検索する可能性は残る。さらに、ユーザが求める画像を検索できない可能性も残っている。
特開2006−65399号公報
本発明は、前記した状況に鑑みてなされたものである。本発明の主な目的は、クエリ画像を用いた画像検索において、ユーザの検索意図に沿った画像を検索できる検索装置又は検索方法を提供することである。
本発明は、以下のいずれかの項目に記載の構成とされている。
(項目1)
複数の解像度毎の類似度を用いる多重解像度モデルに基づいた画像検索を行う画像検索エンジンに、クエリ画像を提供することによって、前記クエリ画像に類似する複数の画像を含む第1検索結果を取得する画像検索装置において、
前記第1検索結果に含まれる前記画像についての正解及び/又は不正解の指定を受け付けるフィードバック受付部と、
前記正解及び/又は不正解の指定に応じて、前記複数の解像度毎の類似度に対する重みを算出する重み算出部と、
前記算出された重みを用いて、前記クエリ画像と検索された画像との類似度を、前記画像検索エンジンに計算させることによって、前記画像検索エンジンに第2検索結果を取得させる検索制御部と、
前記計算された類似度が高い順序で、前記第2検索結果における画像が配置されている、出力用文書を生成する出力部と
を備えることを特徴とする画像検索装置。
ここで、第2検索結果を取得する処理においては、既に検索された画像を用いて、それらの画像とクエリ画像との類似度を計算することにより行うことができる。あるいは、この処理は、DB中の画像を再検索し、新たに検索された画像を用いて、クエリ画像との類似度を計算することにより行うこともできる。
(項目2)
前記重み算出部は、前記クエリ画像と前記正解が指定された正解画像との類似度が最も高い解像度について、前記類似度に対する重みを、他の解像度での類似度に対する重みよりも相対的に大きくする処理を行う構成となっている
項目1に記載の画像検索装置。
(項目3)
前記重み算出部は、前記クエリ画像と前記不正解が指定された不正解画像との類似度が最も高い解像度について、前記類似度に対する重みを、他の解像度での類似度に対する重みよりも相対的に小さくする処理を行う構成となっている
項目1又は2に記載の画像検索装置。
(項目4)
前記重み算出部は、前記正解が指定された正解画像及び/又は前記不正解が指定された不正解画像の数に応じて、前記解像度における前記類似度に対する重みを算出する構成となっている
項目1〜3のいずれか1項に記載の画像検索装置。
(項目5)
さらに、前記重み算出部は、前記クエリ画像と、前記正解が指定された正解画像及び/又は前記不正解が指定された不正解画像との類似度に応じて、前記解像度における前記類似度に対する重みを算出する構成となっている
項目1〜4のいずれか1項に記載の画像検索装置。
(項目6)
複数の解像度毎の類似度を用いる多重解像度モデルに基づいた画像検索を行う画像検索エンジンに、クエリ画像を提供することによって、前記クエリ画像に類似する複数の画像を含む第1検索結果を取得する画像検索方法において、
前記第1検索結果に含まれる前記画像についての正解及び/又は不正解の指定を受け付けるステップと、
前記正解及び/又は不正解の指定に応じて、前記複数の解像度毎の類似度に対する重みを算出するステップと、
前記算出された重みを用いて、前記クエリ画像と検索された画像との類似度を、前記画像検索エンジンに計算させることによって、前記画像検索エンジンに第2検索結果を取得させるステップと、
前記計算された類似度が高い順序で、前記第2検索結果における画像が配置されている、出力用文書を生成するステップと
を備えることを特徴とする画像検索方法。
(項目7)
項目6に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。
本発明によれば、クエリ画像を用いた画像検索において、ユーザの検索意図に沿った画像を検索できる検索装置又は検索方法を提供することが可能になる。
本発明の第1実施形態に係る画像検索装置を用いた検索システムの概略を示すブロック図である。 第1実施形態の装置を用いた画像検索方法の概略を示すフローチャートである。 第1実施形態の検索装置を用いた検索方法を説明するための説明図である。図(a)は、入力されるクエリ画像の一例を示す。図(b)は、第1検索結果の一例を示す。図(c)は、正解/不正解についてのフィードバックの一例を示す。図(d)は、フィードバックを考慮した第2検索結果の一例を示す。 第1検索結果を取得する場合において、解像度毎の類似度に付される重みの一例を示す説明図である。 第2検索結果を取得する場合において、解像度毎の類似度に付される重みの一例を示す説明図である。 本発明の第2実施形態における画像検索方法の概略を示すフローチャートである。
(第1実施形態の構成)
本発明の第1実施形態に係る画像検索装置を用いた検索システムを、図1に基づいて説明する。この検索システムは、ユーザ端末1と、画像検索装置2と、検索サーバ3と、インターネット4とを主要な要素として備えている。
(ユーザ端末)
ユーザ端末1は、端末本体11と、入力装置12と、表示装置13とを備えている。端末本体11は、CPU(図示せず)を備えており、ユーザ端末1の動作に必要な計算処理を行うようになっている。入力装置12は、ユーザからの指令を受け取るためのものである。入力装置12としては、例えばキーボードやマウスやトラックボールのような装置を用いることができる。本実施形態の入力装置12は、ユーザによってクエリ画像を指定できるようになっている。表示装置13は、ユーザに対して情報を提示するものである。表示装置13としては、例えばLCDやCRTなどのディスプレイを用いることができる。本実施形態の表示装置13は、画像検索装置2で生成したフィードバック用文書を表示するようになっている。
(画像検索装置)
検索装置2は、クエリ受付部21と、フィードバック受付部22と、重み算出部23と、検索制御部24と、出力部25とを備えている。
クエリ受付部21は、ユーザがユーザ端末1に入力したクエリ画像の情報を受け付ける部分である。さらに、クエリ受付部21は、検索サーバ3にクエリ画像を提供することによって、クエリ画像に類似する複数の画像を含む第1検索結果を取得する構成となっている。第1検索結果は、ユーザ端末1を介してユーザに呈示される。これにより、ユーザは、第1検索結果に含まれる画像についての、正解及び/又は不正解の指定を入力できるようになっている(後述)。
フィードバック受付部22は、第1検索結果に含まれる画像についての、ユーザからの正解及び/又は不正解の指定を受け付ける構成となっている。具体的には、フィードバック受付部22は、ユーザ端末1を用いて入力された、正解及び/又は不正解の指定の情報を、ユーザ端末1から受け取るようになっている。
重み算出部23は、ユーザからの正解及び/又は不正解の指定に応じて、複数の解像度毎の類似度に対する重みを算出する構成となっている。ここで、検索サーバ3の検索エンジンは、多重解像度モデルを用いてクエリ画像とDB中の画像との類似度を計算する(後述)。したがって、重み算出部23は、多重解像度モデルにおける、解像度毎の類似度に対する重みを算出するものである。
検索制御部24は、重み算出部23において算出された重みを用いて、クエリ画像と検索された画像との類似度を、検索サーバ3の画像検索エンジンに計算させる。これによって、検索制御部24は、検索サーバ3の画像検索エンジンに第2検索結果を取得させる。
出力部25は、類似度が高い順序で、第2検索結果における画像が配置されている、出力用文書を生成する構成となっている。
(検索サーバ)
検索サーバ3は、検索エンジン31と、インデックスDB32と、画像DB33とから構成されている。
検索エンジン31は、多重解像度モデルに基づいた画像検索を行うものである。多重解像度モデル自体は、従来から知られているので、これについての詳しい説明は省略する。
インデックスDB32は、画像DB33に格納されている画像の検索を高速化するための索引を格納したDBである。画像DB33には、検索対象としての多数の画像が格納されている。画像DB33においては、画像毎にIDが付与されている。また、各IDに対応して、画像の特徴量などの情報が記録されている。これらの各DBの構成も、従来と同様でよいので、これ以上詳しい説明は省略する。
(本実施形態の動作)
次に、本実施形態の画像検索装置を用いた検索方法を、図2〜図5をさらに参照しながら説明する。
(図2のステップSA−1)
まず、ユーザは、ユーザ端末1の入力装置12を用いて、クエリ画像を指定する(図3(a)参照)。指定されたクエリ画像の情報は、インターネット4を介して、画像検索装置2のクエリ受付部21に送られる。
画像検索装置2のクエリ受付部21は、クエリ画像の情報を受け取ると、クエリ画像を、検索サーバ3の検索エンジン31に送る。
(図2のステップSA−2)
ついで、検索サーバ3の検索エンジン31は、多重解像度モデルに基づいて、画像DB中の類似画像を検索する。多重解像度モデルにおいては、既に述べたように、例えば、1×1,2×1,1×2,2×2,3×1,1×3,3×3,4×4,5×5,6×6などのように、複数の解像度について、それぞれ、クエリ画像と対象画像との類似度を求める。そして、検索エンジン31は、解像度毎の類似度を合計することで、全体としての類似度を求め、全体として高い類似度を持つ対象画像を、類似画像として特定する。どの程度まで細かい解像度を用いるかは、検索目的に応じて適宜に設定できる。初回の検索においては、各解像度には重みを付与しない。換言すれば、初回の検索時においては、各解像度における重みは等しいと言うことができる(図4参照)。
これにより、検索サーバ3の検索エンジン31は、類似画像の検索結果を取得することができる。このように取得された検索結果を、この明細書では、第1検索結果と称している。第1検索結果においては、クエリ画像との対象画像との類似度に応じて、ランク付けがされている。つまり、第1検索結果は、類似度のランキングが上位の画像を特定したものである。したがって、第1検索結果は、クエリ画像に類似する複数の画像を含むものとなっている(図3(b)参照)。
(図2のステップSA−3)
ついで、出力部25は、第1検索結果を用いて、フィードバック受け付け用の文書を生成し、ユーザ端末1に送る。ユーザ端末1の表示装置13は、フィードバック受付用文書を表示する。ユーザは、表示装置13を見ながら、入力装置12を用いて、表示されている画像について、正解及び/又は不正解の指定を行うことができる(図3(c)参照)。図3(c)では、符号「○」が正解画像を示し、符号「×」が不正解画像を示している。すなわち、図中で上から1番目と5番目が正解画像、上から2番目が不正解画像となっている。他の画像は、正解にも不正解にも指定されなかったものである。なお、この実施形態では、正解と不正解の両者を指定しているが、一方のみの指定も可能である。また、指定する画像の数は特に制約されない。
(図2のステップSA−4)
ついで、フィードバック受付部22は、前記のようにして指定された正解/不正解についての情報を受け取る。このように、正解画像及び不正解画像についての情報を受け取ることを、この明細書ではフィードバックと称している。
(図2のステップSA−5)
ついで、重み算出部23は、正解/不正解についてのフィードバックに基づいて、解像度毎の類似度に付与される重みを算出する。重み算出方法の一例を以下に詳しく説明する。
(正解ベストマッチ解像度の特定)
重み算出部23は、「フィードバックされた正解画像とクエリ画像との類似度が最も高い解像度」を特定する。この解像度をこの明細書では「正解ベストマッチ解像度」と称する。ここで、正解画像が複数ある場合は、各正解画像について、正解ベストマッチ解像度を特定する。正解ベストマッチ解像度の集合を、正解ベストマッチ解像度集合と称する。
(不正解ベストマッチ解像度の特定)
前記と同様にして、重み算出部23は、「フィードバックされた不正解画像とクエリ画像との類似度が最も高い解像度」を特定する。この解像度をこの明細書では「不正解ベストマッチ解像度」と称する。ここで、不正解画像が複数ある場合は、各不正解画像について、不正解ベストマッチ解像度を特定する。不正解ベストマッチ解像度の集合を、不正解ベストマッチ解像度集合と称する。
(重みの調整)
正解ベストマッチ解像度集合に含まれる解像度については、類似度に対する重みを、他の解像度での類似度に比較して、相対的に高くする。
また、不正解ベストマッチ解像度集合に含まれる解像度については、類似度に対する重みを、他の解像度での類似度に比較して、相対的に低くする。
また、重み算出部23は、正解が指定された正解画像及び/又は不正解が指定された不正解画像の数に応じて、解像度毎の類似度に対する重みを算出することが好ましい。
図5には、調整された重みの例を、符号w〜wを用いて示した。重み調整の具体的な計算例については後述する。
(ステップSA−6)
ついで、検索制御部24は、前記のようにして算出された重みを用いて、クエリ画像と検索された画像との類似度を、画像検索エンジン31に計算させる。これにより、検索制御部24は、画像検索エンジン31に第2検索結果を取得させる。この第2検索結果の取得においては、画像検索エンジン31は、前記したステップSA−2で求めた、解像度毎の類似度を用いることができる。つまり、前記したステップで既に求めた解像度毎の類似度に対して、前記した重みを乗じ、その結果を合計することにより、クエリ画像と対象画像との類似度を新たに求めることができる。この新しい類似度を用いて、第2検索結果における項目(つまり検索された画像)の順位を決定することができる。ただし、解像度毎の類似度として、既に計算されたものを用いる必要はなく、解像度毎の類似度をあらためて算出し、これに対して重み付けを行うことは可能である。
このようにして求められた、クエリ画像と対象画像との類似度は、正解/不正解についてのフィードバックを勘案したものとなっている。したがって、第2検索結果においては、正解画像及びこれに類似する画像の順位を高くし、不正解画像及びこれに類似する画像の順位を低くすることができると期待される。
(図2のステップSA−7)
ついで、出力部25は、前記した重み付けを用いて計算された類似度が高い順序で、第2検索結果における画像が配置されている、出力用文書を生成する。さらに、出力部25は、インターネット4を介して、ユーザ端末1に出力用文書を送る。ユーザ端末1は、表示装置13を用いてユーザに出力文書を呈示する。これにより、ユーザは、正解/不正解の情報に基づいて新たにランク付けされた検索結果を見ることができる。
したがって、本実施形態によれば、クエリ画像を用いた画像検索において、ユーザの検索意図に沿った画像を検索することが可能になるという利点がある。
ついで、解像度毎の重みについての具体的な計算例1及び2を以下に説明する。
(計算例1)
(解像度に対するデフォルトの重み)
以下の例では、4通りの解像度(解像度1〜4)を用いる。これらの解像度は、互いに異なる分割数によるものである。ここで例えば、1×2と2×1は異なる分割数となる。具体的に採用する分割数は、この例では重要ではないので、説明を省略する。
各解像度に対するデフォルトの重みは以下の通りとなる。
デフォルトの解像度と重み = ( 解像度1: W[1]=1.0、 解像度2: W[2]=1.0、 解像度3: W[3]=1.0、 解像度4: W[4]=1.0 )
つまり、いずれの解像度についても、重みを1とする。なお、W[i]は、解像度iについての重みを表す。
この検索による結果(つまり第1検索結果)として、以下の10個の画像を取得したとする。
検索結果 = ( 画像1、 画像2、 画像3、 画像4、 画像5、 画像6、 画像7、 画像8、 画像9、 画像10 )
(正解/不正解についてのフィードバック)
次に、正解/不正解についてのフィードバックをユーザから受け付ける。この例では、フィードバックの結果を以下の通りとする。
フィードバック: 正解画像 = { 画像1、 画像4、 画像5、 画像8 }、 不正解画像 = { 画像2、 画像6 }
(ベストマッチ解像度集合の生成)
ついで、既に説明した正解ベストマッチ解像度集合を生成する。この例では、以下の通りであったとする。
正解ベストマッチ解像度集合 = { 解像度1(画像1)、 解像度1(画像4)、 解像度4(画像5)、 解像度1(画像8) }
つまり、正解画像としての画像1,4,8の場合には、解像度1において、クエリ画像との類似度が最高であった。また、画像5の場合には、解像度4において、クエリ画像との類似度が最高であった。
同様に、不正解ベストマッチ解像度集合を以下のように生成する。
不正解ベストマッチ解像度集合 = { 解像度1(画像2)、 解像度2(画像6)、 解像度2(画像10) }
つまり、不正解画像としての画像2の場合には、解像度1において、クエリ画像との類似度が最高であった。また、画像6及び10の場合には、解像度2において、クエリ画像との類似度が最高であった。
(解像度に対する重みの調整)
解像度に対する重み(W[i])の算出方法を説明する。用いる記号を以下のように準備する。
PK[i]:正解ベストマッチ解像度集合における解像度iの頻度、
NK[i]:不正解ベストマッチ解像度集合における解像度iの頻度、
FW[i]:正解/不正解の指定数に応じて重みを少なくするための係数、
ΔW[i]:初期の重みに対する差分、
W[i]:算出される重み。
すると、解像度1については、以下のようにして重みを算出できる。
・PK[1](正解ベストマッチ解像度集合における解像度1の頻度)= 3
・NK[1](不正解ベストマッチ解像度集合における解像度1の頻度)= 1
・FW[1] = 1 / (PK[1] + NK[1] ) = 1 / (3 + 1) = 1 / 4 = 0.25
・ΔW[1] = (PK[1]−NK[1]) × FW[1] = (3 − 1) × 0.25 = 0.5
・W[1] = W[1] + ΔW[1] = 1.0 + 0.5 = 1.5
つまり、解像度1に対する重みは1.5と算出される。この例では、指定された正解/不正解画像の数に応じて重みを計算しているということができる。また、PK[i]−NK[i]の計算を行うことは、正解の指定による重みを、不正解の指定による重みでキャンセルすることに相当する。
解像度1の場合と同様にして、解像度2に対する重み(W[2])を以下のように算出できる。
・PK[2](正解ベストマッチ解像度集合における解像度2の頻度)= 0
・NK[2](不正解ベストマッチ解像度集合における解像度2の頻度)= 2
・FW[2] = 1 / (PK[2] + NK[2] ) = 1 / (0 + 2) = 0.5
・ΔW[2] = (PK[2]−NK[2]) × FW[2] = (0 − 2) × 0.5 = -1.0
・W[2] = W[2] + ΔW[2] = 1.0 +(-1.0) = 0.0
解像度3に対する重み(W[3])は以下のように算出できる。
・PK[3](正解ベストマッチ解像度集合における解像度3の頻度)= 0
・NK[3](不正解ベストマッチ解像度集合における解像度3の頻度)= 0
・FW[3] = 1 / (PK[3] + NK[3] ) = 1 / (0 + 0) = 0.0 (分母が0の場合は0とみなす)
・ΔW[3] = (PK[3]−NK[3]) × FW[3] = (0 − 0) × 0.0 = 0.0
・W[3] = W[3] + ΔW[3] = 1.0 + 0.0 = 1.0
解像度4に対する重み(W[4])は以下のように算出できる。
・PK[4](正解ベストマッチ解像度集合における解像度4の頻度)= 1
・NK[4](不正解ベストマッチ解像度集合における解像度4の頻度)= 0
・FW[4] = 1 / (PK[4] + NK[4] ) = 1 / (1 + 0) = 1.0
・ΔW[4] = (PK[4]−NK[4]) × FW[4] = (1 − 0) × 1.0 = 1.0
・W[4] = W[4] + ΔW[4] = 1.0 + 1.0 = 2.0
(解像度毎の重み)
前記の調整の結果、解像度毎の重みは以下の通りとなる。
解像度1: W[1]=1.5、 解像度2: W[2]=0.0、 解像度3: W[3]=1.0、 解像度4: W[4]=2.0。
このような計算方法では、フィードバックの数が多いときは、FW[i]の値が小さくなるので、フィードバックによる重みへの影響を減らすことができる。これは、フィードバック数が多いと、一つあたりのフィードバックにおける確信度が低くなるという仮定に基づいている。この手法は、正解と不正解の基準が曖昧な場合に有効であると考えられる。
なお、前記の例では、PK[i]:正解ベストマッチ解像度集合における解像度iの頻度、NK[i]:不正解ベストマッチ解像度集合における解像度iの頻度、とした。しかしながら、頻度に代えて、正解/不正解ベストマッチ解像度集合における正解/不正解画像とクエリ画像との類似度を用いることができる。具体的には、次のように計算できる。
正解ベストマッチ解像度集合の解像度1に対応する画像は、前記の通り、画像1、画像4、画像8とする。この場合、解像度1におけるPK[i]を、
PK[1]=(解像度1における、クエリ画像と画像1の類似度+解像度1における、クエリ画像と画像4の類似度+解像度1における、クエリ画像と画像8の類似度)、
として計算できる。他の解像度においても同様に計算できる。このようにすると、重みの値を細かく設定できるという利点がある。また、この計算も、類似度の和を用いていることから、指定された正解/不正解画像の数を考慮して重み付けを行っていることに相当する。
(計算例2)
(解像度に対するデフォルトの重み)
前記の計算例1では、FW[i](正解/不正解の指定数に応じた重みの変動量を少なくするための係数)を用いていた。これに対して、計算例2では、FW[i]を用いないで重みを計算する。計算例2の説明では、計算例1と共通する部分については説明を簡略化する。
計算例2における解像度1については、以下のようにして重みを算出できる。
・PK[1](正解ベストマッチ解像度集合における解像度1の頻度)= 3
・NK[1](不正解ベストマッチ解像度集合における解像度1の頻度)= 1
・ΔW[1] = PK[1]−NK[1] = 3 − 1 = 2.0
・W[1] = W[1] + ΔW[1] = 1.0 +2.0 = 3.0
つまり、解像度1に対する重みは3.0と算出される。同様にして、解像度2に対する重み(W[2])を以下のように算出できる。
・PK[2](正解ベストマッチ解像度集合における解像度2の頻度)= 0
・NK[2](不正解ベストマッチ解像度集合における解像度2の頻度)= 2
・ΔW[2] = PK[2]−NK[2] = 0 − 2 = -2.0
・W[2] = W[2] + ΔW[2] = 1.0 + -2.0 = -1.0
解像度3に対する重み(W[3])は以下のように算出できる。
・PK[3](正解ベストマッチ解像度集合における解像度3の頻度)= 0
・NK[3](不正解ベストマッチ解像度集合における解像度3の頻度)= 0
・ΔW[3] =PK[3]−NK[3] = 0 − 0 = 0.0
・W[3] = W[3] + ΔW[3] = 1.0 +0.0 = 1.0
解像度4に対する重み(W[4])は以下のように算出できる。
・PK[4](正解ベストマッチ解像度集合における解像度4の頻度)= 1
・NK[4](不正解ベストマッチ解像度集合における解像度4の頻度)= 0
・ΔW[4] =PK[4]−NK[4] = 1 − 0 = 1.0
・W[4] = W[4] + ΔW[4] = 1.0 +1.0 = 2.0
(解像度毎の重み)
前記の調整の結果、解像度毎の重みは以下の通りとなる。
解像度1: W[1]=3.0、 解像度2: W[2]=-1.0、 解像度3: W[3]=1.0、 解像度4: W[4]=2.0。
このような計算方法では、フィードバックの数が多いと、それだけ、重みが大きく変動する傾向になる。これにより、ユーザの意図を一層重視した検索結果を得ることができる。この手法は、正解と不正解の基準が明確な場合に有効であると考えられる。
なお、計算例2においても、計算例1と同じく、PK[i]及び[i]として、頻度に代えて、正解/不正解ベストマッチ解像度集合における正解/不正解画像とクエリ画像との類似度を用いることができる。
(第2実施形態)
以下、本発明の第2実施形態を、図6を主に参照しながら説明する。第2実施形態の説明においては、前記した第1実施形態と共通する構成については、説明を簡略化する。
(図6のステップSB−1〜SB−6)
第2実施形態におけるステップSB−1〜SB−6は、第1実施形態におけるステップSA−1〜SA−6と実質的に同様でよいので、詳しい説明は省略する。これらにステップにより、第2検索結果を取得することができる。
(図6のステップSB−7)
ついで、第2実施形態では、出力部25が、第2検索結果を用いたフィードバック用の文書(図示せず)を生成する。このフィードバック用文書の体裁は、ステップSB−3で生成されるものと同様でよいが、その中身としては、第2検索結果が用いられる。
(図6のステップSB−8)
ついで、フィードバック受付部22は、ユーザから、第2検索結果を用いたフィードバック用文書に対するフィードバックを待つ。フィードバックがあった場合は、ステップSB−5に戻り、正解/不正解の指定に応じて、重み算出部23が重みを再計算する。ここでの処理は、第1実施形態における第1検索結果として、第2検索結果を用いる(つまり第1検索結果の内容を更新する)ことにより、同様に行うことができる。そして、更新後の第1検索結果を用いて、あらたな第2検索結果を生成し、再びフィードバック用文書を生成することができる。フィードバックがある限り、このループを続けることができる。あるいは、フィードバックの回数を制限し、既定回数のループを続けたら、次のステップSB−9に進むように設定することができる。
(図6のステップSB−9)
一方、ステップSB−8におけるフィードバックが無かった場合は、出力部25は、第1実施形態のステップSA−7と同様にして、出力用文書を生成する。ここで、出力用文書には、ステップSB−8でのフィードバックにより更新された第2検索結果が含まれる。
第2実施形態においては、検索結果へのフィードバックを繰り返して行うので、ユーザの意図を一層重視した検索を行うことができる。
前記した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。
なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。
なお、多重解像度モデルの各解像度に対して重みを算出した後にステップSA-6やSB-6で第2検索結果を得る場合において、重み付けが変更された多重解像度モデルを用いて、ステップSA-2で得られた第1検索結果の画像に対して類似度の算出を行って、当該第1検索結果のランキングを更新した結果として、第2検索結果を得ることができる。この場合、例えば、検索サーバにキャッシュメモリを備えて、そのキャッシュメモリに第1検索結果を一時的に格納しておくことで、検索制御部24の検索指示により、第1検索結果に対する類似度の再算出を行える。これにより、この場合、クエリ画像に類似する画像の中からユーザのフィードバックを反映し、類似度の高い画像を得ることができる。また、既に得ている所定数の画像に対して類似度を再計算するため、処理を高速にすることができる。
また、重み付けが変更された多重解像度モデルにより、画像DB33に格納された画像に対して類似度を算出し、再検索を行うことによって、第2検索結果を得ることもできる。この場合、ユーザのフィードバックが加味された解像度毎の重み付けにおいて高い類似度を持つ画像を画像DBから得ることができる。例えば、ステップSA−6やSB−6において第1検索結果で得られなかった新たな検索結果が第2検索結果として得られる可能性もある。
1 ユーザ端末
11 端末本体
12 入力装置
13 表示装置
2 画像検索装置
21 クエリ受付部
22 フィードバック受付部
23 重み算出部
24 検索制御部
25 出力部
3 検索サーバ
31 画像検索エンジン
32 インデックスDB
33 画像DB
4 インターネット

Claims (5)

  1. 多重解像度モデルにおける複数の解像度毎の類似度を算出し、前記解像度毎の類似度を画像単位で合計して得られる合計類似度を用いて画像検索を行う画像検索エンジンに、クエリ画像を提供することによって、前記クエリ画像に類似する複数の画像を含む第1検索結果を取得する画像検索装置であって
    前記第1検索結果に含まれる前記画像についての正解及び/又は不正解の指定を受け付けるフィードバック受付部と、
    前記正解及び/又は不正解の指定に応じて、前記複数の解像度毎の類似度に対する重みを算出する重み算出部と、
    前記複数の解像度毎の類似度に対して算出された前記重みを用いて、前記クエリ画像と検索された画像との間の合計類似度を、前記画像検索エンジンに計算させることによって、前記画像検索エンジンに第2検索結果を取得させる検索制御部と、
    前記重みを用いて計算された合計類似度が高い順序で、前記第2検索結果における画像が配置されている、出力用文書を生成する出力部と
    を備えており、
    さらに、前記重み算出部は、前記複数の解像度毎の重みの算出において、
    前記クエリ画像と前記正解が指定された正解画像との間における、解像度毎の類似度が最も高い解像度での類似度に対する重みを、他の解像度での類似度に対する重みよりも相対的に大きくする処理、及び、
    前記クエリ画像と前記不正解が指定された不正解画像との間における、解像度毎の類似度が最も高い解像度での類似度に対する重みを、他の解像度での類似度に対する重みよりも相対的に小さくする処理のいずれか一方を行う構成となっている
    ことを特徴とする画像検索装置。
  2. 前記重み算出部は、前記正解が指定された正解画像及び/又は前記不正解が指定された不正解画像の数が大きくなるほど、前記解像度での類似度に対する重みを減らす処理を行う構成となっている
    請求項1に記載の画像検索装置。
  3. さらに、前記重み算出部は、前記クエリ画像と、前記正解が指定された正解画像及び/又は前記不正解が指定された不正解画像との類似度に応じて、前記解像度での前記類似度に対する重みを算出する構成となっている
    請求項1又は2に記載の画像検索装置。
  4. 多重解像度モデルにおける複数の解像度毎の類似度を算出し、前記解像度毎の類似度を画像単位で合計して得られる合計類似度を用いて画像検索を行う画像検索エンジンに、クエリ画像を提供することによって、前記クエリ画像に類似する複数の画像を含む第1検索結果を取得する画像検索方法であって
    前記画像検索方法は、フィードバック受付部と、重み算出部と、検索制御部と、出力部とを備える画像検索装置により実行されるものであり、
    さらに、
    前記フィードバック受付部が、前記第1検索結果に含まれる前記画像についての正解及び/又は不正解の指定を受け付けるステップと、
    前記重み算出部が、前記正解及び/又は不正解の指定に応じて、前記複数の解像度毎の類似度に対する重みを算出するステップと、
    前記検索制御部が、前記複数の解像度毎の解像度に対して算出された前記重みを用いて、前記クエリ画像と検索された画像との間の合計類似度を、前記画像検索エンジンに計算させることによって、前記画像検索エンジンに第2検索結果を取得させるステップと、
    前記出力部が、前記重みを用いて計算された合計類似度が高い順序で、前記第2検索結果における画像が配置されている、出力用文書を生成するステップと
    を備えており、
    さらに、
    前記重み算出部が、前記複数の解像度毎の重みを算出するステップは、
    前記クエリ画像と前記正解が指定された正解画像との間における、解像度毎の類似度が最も高い解像度での類似度に対する重みを、他の解像度での類似度に対する重みよりも相対的に大きくする処理を行うステップ、及び、
    前記クエリ画像と前記不正解が指定された不正解画像との間における、解像度毎の類似度が最も高い解像度での類似度に対する重みを、他の解像度での類似度に対する重みよりも相対的に小さくする処理を行うステップのいずれか一方を含んでいる
    ことを特徴とする画像検索方法。
  5. 請求項に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2009067272A 2009-03-19 2009-03-19 画像検索装置 Active JP5143773B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009067272A JP5143773B2 (ja) 2009-03-19 2009-03-19 画像検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009067272A JP5143773B2 (ja) 2009-03-19 2009-03-19 画像検索装置

Publications (2)

Publication Number Publication Date
JP2010218479A JP2010218479A (ja) 2010-09-30
JP5143773B2 true JP5143773B2 (ja) 2013-02-13

Family

ID=42977208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009067272A Active JP5143773B2 (ja) 2009-03-19 2009-03-19 画像検索装置

Country Status (1)

Country Link
JP (1) JP5143773B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5121917B2 (ja) * 2010-12-21 2013-01-16 ヤフー株式会社 画像検索装置、画像検索方法及びプログラム
JP5893318B2 (ja) * 2011-09-28 2016-03-23 キヤノン株式会社 画像検索装置、画像検索方法及びプログラム
WO2014174558A1 (ja) * 2013-04-22 2014-10-30 株式会社日立製作所 サプライヤ検索装置およびサプライヤ検索プログラム
JP6575080B2 (ja) * 2015-03-10 2019-09-18 富士ゼロックス株式会社 画像検索装置及びプログラム
CN110222220B (zh) * 2019-05-06 2024-05-10 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读介质及电子设备
JP7431563B2 (ja) 2019-11-28 2024-02-15 キヤノン株式会社 画像検索装置、画像検索方法、及びプログラム
WO2023225919A1 (zh) * 2022-05-25 2023-11-30 华为技术有限公司 一种视觉搜索方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08137908A (ja) * 1994-11-15 1996-05-31 Canon Inc 画像検索方法及び装置
JP3609225B2 (ja) * 1996-11-25 2005-01-12 日本電信電話株式会社 類似オブジェクト検索装置
JP4605445B2 (ja) * 2004-08-24 2011-01-05 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム

Also Published As

Publication number Publication date
JP2010218479A (ja) 2010-09-30

Similar Documents

Publication Publication Date Title
JP5143773B2 (ja) 画像検索装置
JP5164901B2 (ja) 画像検索装置
US7769771B2 (en) Searching a document using relevance feedback
JP4074366B2 (ja) 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
US8644621B2 (en) Image processing apparatus and image retrieval method
US8429212B1 (en) Training scoring models optimized for highly-ranked results
US8204905B2 (en) Use of data patterns for rapid search of complex rules in a rules-based search engine
US20150170372A1 (en) Systems and methods for initially plotting mathematical functions
US8245148B2 (en) History display apparatus, history display system, history display method, and program
US20070179984A1 (en) Information element processing method and apparatus
US11500884B2 (en) Search and ranking of records across different databases
JP4682030B2 (ja) 図形検索プログラム、該プログラムを記録した記録媒体、図形検索装置、および図形検索方法
JP5010624B2 (ja) 検索装置
US20090249205A1 (en) Display position determination apparatus and method thereof
JP2011203776A (ja) 類似画像検索装置、方法及びプログラム
JP5318503B2 (ja) 画像検索装置
JPH11218806A (ja) データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP5061137B2 (ja) 画像検索装置
US20080148168A1 (en) System and method for facilitating interactive selection and presentation of datasets
JP5061147B2 (ja) 画像検索装置
JP4631587B2 (ja) 書類作成支援装置、書類作成支援プログラムおよび記憶媒体、並びに書類作成支援方法
JP2000099531A (ja) 情報処理装置
JP4344207B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム、および記録媒体
JP3671691B2 (ja) 類似画像検索装置、類似画像検索方法及び記録媒体
US20110238686A1 (en) Caching data obtained via data service interfaces

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120501

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5143773

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350