JP2010108477A - 検索装置 - Google Patents

検索装置 Download PDF

Info

Publication number
JP2010108477A
JP2010108477A JP2009095278A JP2009095278A JP2010108477A JP 2010108477 A JP2010108477 A JP 2010108477A JP 2009095278 A JP2009095278 A JP 2009095278A JP 2009095278 A JP2009095278 A JP 2009095278A JP 2010108477 A JP2010108477 A JP 2010108477A
Authority
JP
Japan
Prior art keywords
data
query
search result
search
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009095278A
Other languages
English (en)
Other versions
JP5199168B2 (ja
Inventor
Stejic Zoran
ゾラン ステイチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009095278A priority Critical patent/JP5199168B2/ja
Publication of JP2010108477A publication Critical patent/JP2010108477A/ja
Application granted granted Critical
Publication of JP5199168B2 publication Critical patent/JP5199168B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】クエリを用いた検索精度を向上させ、かつ、検索速度の低下を低く抑えることが可能な装置ないし手法を提供する。
【解決手段】クエリ受付部1は、検索のためのクエリを受け付ける。データ検索部2は、クエリに関連するデータを、複数の対象データの中から検索することで、第1仮検索結果を得る。フィードバック受付部4は、第1仮検索結果の中における複数の正解データについての、ユーザからの指定を受け付ける。正解投入部5は、複数の正解データをデータ検索部2にそれぞれ投入することにより、各正解データに対応する第2仮検索結果を得る。検索結果統合部9は、各正解データに対応するそれぞれの第2仮検索結果に基づいて、クエリに対する出力用検索結果を取得する。
【選択図】図1

Description

本発明は、クエリ画像に関連する画像検索やクエリワードに関連する文書検索等に関するする技術に関するものである。
特定の画像(つまりクエリ画像)に関連する画像(つまり目的画像)の検索においては、一般に、複数の対象画像の中から、クエリ画像に関連する画像を検索する。例えば、類似画像の検索においては、インデックス化された対象画像の特徴量と、クエリ画像の特徴量との距離(類似度)を算出し、高い類似度の画像を類似画像として出力している。
また、特定の音声(クエリ音声)に関連する音声検索においても、音声データに周波数分析等を行って特徴量を抽出して、その特徴量と、クエリ音声との特徴量との類似度を算出して、高い類似度の音声を類似音声と出力している。
また、テキストのキーワード(テキストクエリ)に対する文書検索においては、文書から生成したインデックスに基づいて、テキストクエリとの関連度の高い文書を検索する。このインデックスは、ウェブ検索分野でのロボット型検索においては、ウェブ上から収集したコンテンツを形態素解析等することより、該コンテンツに含まれるテキストをデータベース化したものである。
このように、画像や音声、文書(テキスト)の検索においては、各種コンテンツからインデックスを作成して、そのインデックスに基づいて関連するコンテンツの検索が行われる。
ところで、画像検索における特徴量は、一般に、多次元のベクトルデータとして表現される。ベクトルデータの次元数を増加させれば、検索精度の向上は期待できるが、計算コストが高くなってしまう。したがって、実際は、ベクトルデータの次元数は制約される。このため、実際の類似画像検索においては、ノイズが多くなってしまい、検索精度が低くなりがちであるという問題がある。
また、例えば類似画像検索において、クエリ画像として、一本の赤い花の画像を入力したとする。使用者の意図としては、色は問わずに、一本の花についての画像を検索したい場合でも、検索エンジンとしては、複数本の赤い花も類似画像と判断することがある。このように、ユーザの検索意図を検索エンジンが自動的に認識することは難しい。
これに対して、下記特許文献1では、検索結果に対して、使用者からのフィードバックを入力し、このフィードバックに基づいて、特徴量への重み付けを更新した上で、類似度を再計算する手法を示している。これによれば、新たに計算された類似度を用いて、使用者の意図を反映した画像検索が可能になる。
特開2006−338313号公報
しかしながら、特徴量に対する重み付けを変更した上で特徴量を再計算することは、検索処理の遅延をもたらす。つまり、このような処理を行う検索装置は、動作が遅いという問題を生じる。
また、特徴量に対する重み付けを変更する処理を実装するためには、一般に、検索エンジン内部の処理アルゴリズムを修正する必要がある。
即ち、一般的に検索を高速に行うためには、特徴量に基づいてインデックス(例えば、R木)を生成しておくが、このインデックスの生成時に、特徴量に対する重み付け(スコア)を設定する。ユーザのフィードバックに基づいて、この重み付けを更新しインデックスを作り直すのはとても時間が掛かり現実的ではなく、リアルタイム性に欠ける。
このため、特徴量に対する重み付けを変更する処理は、実装が事実上難しいという問題があり、文書検索や音声検索においても同様の問題として捉えられる。特に、検索エンジンがAPI(Application Program Interface)により実装されている場合には、その内部処理を変更することが難しいため、前記特許文献1の手法を実装することがさらに困難となる。
本発明は、前記の状況に鑑みてなされたものである。本発明の目的の一つは検索エンジン内部のアルゴリズムを修正することなく、クエリを用いたデータ検索の検索精度を向上させ、かつ、検索速度の低下を低く抑えることが可能な装置ないし手法を提供することである。
本発明は、以下のいずれかの項目に記載の構成とされている。
(項目1)
クエリ受付部と、データ検索部と、フィードバック受付部と、正解投入部と、検索結果統合部とを備えており、
前記クエリ受付部は、検索のためのクエリ画像を受け付けるものであり、
前記データ検索部は、前記クエリ画像に関連する画像を、複数の対象データの中から検索することで、第1仮検索結果を得る構成となっており、
前記フィードバック受付部は、前記第1仮検索結果の中における複数の正解データについての、ユーザからの指定を受け付ける構成となっており、
前記正解投入部は、前記複数の正解データを前記データ検索部にそれぞれ投入することにより、各正解データに対応する第2仮検索結果を得る構成となっており、
前記検索結果統合部は、前記各正解データに対応するそれぞれの第2仮検索結果に基づいて、前記クエリ画像に対する出力用検索結果を取得する構成となっている
ことを特徴とする画像検索装置。
この項目の装置においては、第1仮検索結果における、ユーザからのフィードバックを受け付ける。フィードバックには、複数の正解データすなわち正解画像の指定が含まれる。そして、正解データを用いた再検索結果に基づいて、出力用の検索結果を得る。したがって、この装置によれば、高い検索精度を得ることが可能になる。
また、この装置では、特徴量の計算手法そのものを変更する必要がない。このため、検索エンジン内部における処理アルゴリズムを修正する必要がなく、実装が容易である。
さらに、この装置では、特徴量の重みを再計算するものではないので、特徴量の再計算を不要とすることができる。このため、この装置では、検索動作を高速に行うことが可能になる。
(項目2)
さらに、不正解投入部を備えており、
前記フィードバック受付部は、前記第1仮検索結果の中における不正解データについての、ユーザからの指定を受け付ける構成となっており、
前記不正解投入部は、前記不正解データを前記データ検索部に投入することにより、第3仮検索結果を得る構成となっており、
前記検索結果統合部は、前記第2仮検索結果と前記第3仮検索結果とに基づいて、前記クエリ画像に対する出力用検索結果を取得する構成となっている
ことを特徴とする項目1に記載の画像検索装置。
この項目の発明では、不正解データすなわち不正解画像についてのフィードバックを用いて、不正解画像を用いた再検索を行うことができる。不正解画像を用いた再検索の結果と、正解画像を用いた再検索の結果とを併せて用いることにより、検索精度を向上させることができる。
(項目3)
前記検索結果統合部は、
前記第2仮検索結果に属するデータのうち、前記第3仮検索結果に属するデータを削除するか、又は、低い順位とする構成となっている
ことを特徴とする項目2に記載の画像検索装置。
このような処理を行うことにより、不正解データに基づく検索結果において高い順位のデータを、出力用の検索結果から実質的に除外する(つまり目に触れにくい状態とする)ことができる。よって、検索精度を一層向上することが可能になる。
(項目4)
さらに、正解統合部と、不正解統合部とを備えており、
前記不正解投入部は、複数の不正解データを前記検索部に投入することにより、複数の前記第3仮検索結果を得る構成となっており、
前記正解統合部は、前記各第2仮検索結果を統合して、第4仮検索結果を得る構成となっており、
前記不正解統合部は、前記各第3仮検索結果を統合することによって、第5仮検索結果を得る構成となっており、
前記検索結果統合部は、前記第4仮検索結果と前記第5仮検索結果とを統合することにより、前記クエリ画像に対する前記出力用検索結果を取得する構成となっている
項目2又は3に記載の画像検索装置。
(項目5)
前記不正解統合部は、前記正解統合部とは異なる基準で、前記各第3仮検索結果を統合する構成となっている
項目4に記載の画像検索装置。
(項目6)
さらに検索結果表示部を備えており、
前記検索結果表示部は、第1仮検索結果に属するデータとしての画像を一覧表示することにより、正解データについて、前記ユーザからの指定の入力を促す構成となっている
項目1〜5のいずれか1項に記載のデータ検索装置。
(項目7)
さらに検索結果表示部を備えており、
前記検索結果表示部は、第1仮検索結果に属するデータとしての画像を一覧表示することにより、正解データ及び不正解データのそれぞれについて、前記ユーザからの指定の入力を促す構成となっている
項目2〜5のいずれか1項に記載のデータ検索装置。
(項目8)
前記正解統合部は、前記第2仮検索結果におけるランキング中の順位と、全ランキングにおける出現数とに基づいて、前記第2仮検索結果に属するデータの順位を再付与し、これによって、前記第4仮検索結果を得る構成となっている、
項目4に記載の画像検索装置。
(項目9)
前記不正解統合部は、前記第3仮検索結果におけるランキング中の順位に基づいて、前記第3仮検索結果に属するデータの順位を再付与し、これによって、前記第5仮検索結果を得る構成となっている、
項目4,5,8のいずれかに記載の画像検索装置。
(項目10)
前記検索結果統合部は、前記第4仮検索結果に属するデータのうち、前記第5仮検索結果に属するデータを、削除するか、又は、低い順位とする構成となっている
項目4,5,8,9のいずれかに記載の画像検索装置。
このような処理を行うことにより、不正解データに基づく検索結果において高い順位のデータを、出力用の検索結果から実質的に除外する(つまり目に触れにくい状態とする)ことができる。よって、検索精度を一層向上することが可能になる。
(項目11)
検索のためのクエリ画像を受け付けるステップと、
前記クエリ画像に関連する画像を、複数の対象データの中から検索することで、第1仮検索結果を得るステップと、
前記第1仮検索結果の中における複数の正解データについての、ユーザからの指定を受け付けるステップと、
前記複数の正解データに基づいて関連データをそれぞれ検索することにより、複数の第2仮検索結果を得るステップと、
前記複数の第2仮検索結果に基づいて、前記クエリ画像に対する出力用検索結果を取得するステップと
を備えたことを特徴とする画像検索方法。
(項目12)
項目11に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。
(項目13)
クエリに関連するクエリ関連情報に対する正解又は不正解の指定をユーザから受け付けるフィードバック受付部と、
前記指定された正解又は不正解のデータに基づいた新たなクエリをそれぞれ得て、この新たなクエリに対応するクエリ関連情報を取得する関連情報取得部と、
前記正解又は不正解のデータに基づいた新たなクエリに対応して得られたそれぞれのクエリ関連情報中のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データ毎に付されたランクを統合して、出力用データを生成する統合部と、
を備えることを特徴とする検索装置。
この項目の装置においては、クエリ関連情報に対するユーザの正解又は不正解のフィードバックを受け付け、正解又は不正解のデータに基づいた新たなクエリにより取得されたクエリ関連情報中のデータ毎のランクに基づいて、各データのランクを統合して出力用データを生成する。
このため、ユーザのフィードバックに基づいた高い検索精度を得ることができる。また、検索エンジン内部における処理アルゴリズムを修正する必要がなく、実装が容易である。さらに、検索インデックスを再計算する必要がないので、検索動作を高速に行うことが可能になる。
(項目14)
前記関連情報取得部は、前記正解のデータに基づいて得た新たなクエリに対するクエリ関連情報を取得し、
前記統合部は、前記正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを高めるよう統合して前記出力用データを生成することを特徴とする項目13に記載の検索装置。
この項目の装置においては、正解フィードバックに対応したクエリ関連情報中の共通のデータのランクが高められるため、ユーザの検索意図を加味した出力用データを生成することができる。
(項目15)
前記関連情報取得部は、前記不正解のデータに基づいて得た新たなクエリに対するクエリ関連情報を取得し、
前記統合部は、前記不正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを低めるように統合して前記出力用データを生成することを特徴とする項目13又は14に記載の検索装置。
この項目の装置においては、不正解フィードバックに対応したクエリ関連情報中の共通のデータのランクが低められるため、ユーザの検索意図を加味した出力用データを生成することができる。
(項目16)
前記関連情報取得部は、
前記正解のデータ及び前記不正解のデータに基づいた新たなクエリそれぞれに対するクエリ関連情報をそれぞれ取得し
前記統合部は、前記フィードバック受付部により複数の正解及び不正解の指定が受け付けられた場合に、前記正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを高めるよう統合し、更に、前記不正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを低めるように統合することで前記出力用データを生成することを特徴とする項目13〜15の何れか1項に記載の検索装置。
この項目の装置においては、正解フィードバックに対応したクエリ関連情報中の共通のデータのランクが高められ、不正解フィードバックに対応したクエリ関連情報中の共通のデータのランクが低められるため、ユーザの検索意図を加味した出力用データを生成することができる。
(項目17)
前記クエリ関連情報は、テキストクエリに関連する文書であり、
前記関連情報取得部は、
前記指定された正解又は不正解の文書の中から特徴語を抽出し、この特徴語と前記テキストクエリとの組み合わせを前記新たなクエリとして取得することを特徴とする項目13〜16の何れかに記載の検索装置。
この項目の装置においては、テキストクエリに関連する文書に対してユーザのフィードバックが行われる。このため、ユーザのフィードバックに基づいてランク付けされた文書の出力用データを得ることができる。
(項目18)
前記フィードバック受付部が受け付ける前記クエリ関連情報は、テキストクエリに関連する関連クエリであり、
前記関連情報取得部は、
前記指定された正解又は不正解の関連クエリと前記テキストクエリとを前記新たなクエリとして取得することを特徴とする項目13〜16の何れかに記載の検索装置。
この項目の装置においては、テキストによるクエリに関連する関連クエリに対してユーザのフィードバックが行われる。このため、ユーザのフィードバックに基づいてランク付けされた関連ワードの出力用データを得ることができる。
(項目19)
前記クエリ関連情報は、クエリ画像に類似する画像データであり、
前記関連情報取得部は、
前記指定された正解又は不正解の画像データを新たなクエリとして取得することを特徴とする項目13〜16の何れかに記載の検索装置。
この項目の装置においては、クエリ画像に類似する画像に対してユーザのフィードバックが行われる。このため、ユーザのフィードバックに基づいてランク付けされた画像の出力用データを得ることができる。
本発明によれば、検索エンジン内部のアルゴリズムを修正することなく、クエリを用いた関連データの検索精度を向上させ、かつ、検索速度の低下を低く抑えることが可能な装置ないし手法を提供することができる。
本発明の第1実施形態に係る画像検索装置の基本的な構成を示すブロック図である。 本発明の第1実施形態に係る類似画像検索方法の全体的な流れを概略的に説明するためのフローチャートである。 本発明の第1実施形態に係る画像検索方法を模式的に説明するための説明図である。 本発明の第1実施形態に係る画像検索方法を模式的に説明するための説明図である。 正解データと不正解データの指定を入力するためのユーザインターフェースの一例を示す説明図である。 正解データに基づく仮検索結果を統合する手順を説明するための説明図である。 正解データに基づく仮検索結果を統合する手順を説明するための説明図である。 不正解データに基づく仮検索結果を統合する手順を説明するための説明図である。 不正解データに基づく仮検索結果を統合する手順を説明するための説明図である。 正解データに基づく仮検索結果と不正解データに基づく仮検索結果とを統合して、出力用検索結果を生成する手順を説明するための説明図である。 クエリ画像に基づく検索結果の出力例を示す説明図である。 本発明の第2実施形態に係るウェブ文書検索装置の基本的な構成を示すブロック図である。 本発明の第2実施形態に係るウェブ文書検索方法の全体的な流れを概略的に説明するためのフローチャートである。 本発明の第2実施形態に係る正解データと不正解データの指定を入力するためのユーザインターフェースの一例を示す説明図である。 本発明の第2実施形態に係るクエリワードに基づく検索結果の出力例を示す説明図である。 本発明の第3実施形態に係るウェブ文書検索装置の基本的な構成を示すブロック図である。 本発明の第3実施形態に係るウェブ文書検索方法の全体的な流れを概略的に説明するためのフローチャートである。 本発明の第3実施形態に係る正解データと不正解データの指定を入力するためのユーザインターフェースの一例を示す説明図である。 本発明の第3実施形態に係るクエリワードに基づく検索結果の出力例を示す説明図である。 本発明の総括的した検索装置の基本的な構成を示すブロック図である。
(第1実施形態の装置構成)
本発明の第1実施形態に係る画像検索装置を、添付の図面に基づいて説明する。第1実施形態の装置は、クエリ画像に類似する画像を検索するものである。
第1実施形態の検索装置は、図1に示されるように、クエリ受付部1と、データ検索部2と、検索結果表示部3と、フィードバック受付部4と、正解投入部5と、正解統合部6と、不正解投入部7と、不正解統合部8と、検索結果統合部9と、画像登録部10とを基本的な構成として備えている。
クエリ受付部1は、ユーザが検索のために指定したクエリ画像を受け付けるものである。
データ検索部2は、クエリ画像に類似する画像を、画像登録部10に記録されている複数の対象データ(つまり対象画像)の中から検索することで、第1仮検索結果を得る構成となっている。データ検索部2としては、この実施形態では、いわゆる画像検索エンジンが用いられている。
検索結果表示部3は、データ検索部2における検索結果を表示するものである。検索結果表示部3としては、例えば、LCDやCRTなどの各種のディスプレイを用いることができる。検索結果表示部3としてプリンタを用いることも可能である。要するに、検索結果表示部3としては、検索結果を表示できるものであれば、各種のものを用いることができる。検索結果表示部3は、クエリ画像に基づいて得られた第1仮検索結果の一覧を表示することができる。ユーザは、第1仮検索結果の一覧を見ながら、正解・不正解の指定を行うことができる。
フィードバック受付部4は、クエリ画像に基づいて得られた第1仮検索結果の中における正解データと不正解データの指定を受け付ける構成となっている。
正解投入部5は、指定された正解データをデータ検索部2に投入することにより、正解データに基づく第2仮検索結果を得る構成となっている。複数の正解データをデータ検索部2に投入することにより、複数の第2仮検索結果を得ることができる。
不正解投入部7は、不正解データをデータ検索部2に投入することにより、不正解データに基づく第3仮検索結果を得る構成となっている。複数の不正解データをデータ検索部2に投入することにより、複数の第3仮検索結果を得ることができる。
第1実施形態における前記第2仮検索結果及び前記第3仮検索結果は、いずれも、複数のデータ(つまり画像)を含んでいる。
正解統合部6は、複数の正解画像に基づく複数の第2仮検索結果を統合して、第4仮検索結果を得る構成となっている。
不正解統合部8は、複数の不正解画像に基づく複数の第3仮検索結果を、正解統合部6とは異なる基準で統合することによって、第5仮検索結果を得る構成となっている。
第1実施形態の検索結果統合部9は、正解統合部6で得られた第4仮検索結果と、不正解統合部8で得られた第5仮検索結果とを統合することにより、クエリ画像に対する出力用検索結果を取得する構成となっている。この構成により、第1実施形態の検索結果統合部9は、「正解データに基づく第2仮検索結果と、不正解データに基づく第3仮検索結果とに基づいて、クエリ画像に対する出力用検索結果を取得する構成」となっている。
画像登録部10は、画像DB101と、インデックス部102と、インデックスDB103とを備えている。
画像DB101は、検索対象となる画像のデータを登録しておくものである。登録される画像としては、例えば、インターネット上でのクローリングにより取得された画像である。画像としては、ユーザからの投稿により登録されたものでもよい。登録される画像の取得源は特に制約されない。
インデックス部102は、画像DB101に登録された画像の特徴量を抽出するものである。さらに、この実施形態のインデックス部102は、特徴量を検索するための索引を生成する。
インデックスDB103は、抽出された特徴量や、特徴量の検索のための索引を記憶するものである。
第1実施形態における画像検索装置の詳細は、後述する動作の説明において記載する。
(第1実施形態における類似画像検索方法)
次に、前記した画像検索装置の動作を、図2に示すフローチャートに従って説明する。
(図2のステップSA−1)
まず、クエリ受付部1は、検索のためのクエリ画像をユーザから受け取る。ユーザは、例えばユーザ端末を介して、クエリ受付部1にクエリ画像を送信することができる。ただし、第1実施形態においては、クエリ受付部1が何らかの方法でクエリ画像を特定できればよく、クエリ画像の指定方法は特に制約されない。
クエリ画像を受け取ったクエリ受付部1は、クエリ画像をデータ検索部2に送る。
(図2のステップSA−2)
ついで、データ検索部2は、クエリ画像に基づいて、画像登録部10を検索し、複数の類似画像を取得する。これらの複数の類似画像が、第1実施形態における第1仮検索結果に対応する。第1仮検索結果は、一般に、正解(ユーザの意図に沿った結果)と、不正解(ユーザの意図に沿わない結果)とを含んでいる。
図3(a)には、クエリ画像11を入力して第1仮検索結果21を得る様子を模式的に示す。同様に、図4(a)及び(b)にも、クエリ画像11を入力して第1仮検索結果21を得る例を示す。
データ検索部2は、検索結果表示部3に第1仮検索結果21を送る。
(図2のステップSA−3)
ついで、検索結果表示部3は、第1仮検索結果21を表示する(図4(b)参照)。表示の例を図5に示す。図示の例では、表示画面内でユーザが画像を所定位置にドラッグ&ドロップすることにより、正解画像(正解データ)と不正解画像(不正解データ)をそれぞれ指定できるようになっている。図示の例では、指定されるべき正解データ及び不正解データの数は、任意となっているが、この実施形態の説明においては、複数の正解データ及び不正解データの指定を待って、次の動作が行われる。
(図2のステップSA−4)
ついで、フィードバック受付部4は、ユーザから入力された、正解データと不正解データについての入力結果を受け取る(図4(c)参照)。正解データ及び不正解データの数は、前記したように、いずれも複数となっている。正解データ及び不正解データの数が多いほど、検索精度の向上を期待できるが、計算時間は長くなる。
さらに、フィードバック受付部4は、正解データを正解投入部5に送り、不正解データを不正解投入部7に送る。
(図2のステップSA−5)
ついで、正解投入部5は、複数の正解データをそれぞれデータ検索部2に送る。データ検索部2は、これらの正解データに基づいて、画像登録部10を再検索し、複数の類似画像を、第2仮検索結果22として取得する(図3(b)参照)。再検索は、それぞれの正解データについて行われるので、複数の第2仮検索結果を得ることができる。
さらに、正解投入部5は、得られた各第2仮検索結果22を正解統合部6に送る。
(図2のステップSA−6)
ついで、正解統合部6は、複数の第2仮検索結果22を統合して、第4仮検索結果24を生成する(図3(b)参照)。この生成の手順を、図6及び図7を参照しながら、さらに詳しく説明する。
図6の例では、三つの正解画像が指定されたと仮定する。そして、それぞれの正解画像に対応して、三つの第2仮検索結果22が生成される。正解統合部6は、まず、これらの三つの第2仮検索結果22について、それぞれの正解画像との類似度に応じて、データ検索部2から出力された仮検索結果の再ランキング(順位付け)を行う。ここで、データ検索部2が出力する第2仮検索結果22においては、データ検索部2の機能により、既にランキング(順位付け)が行われている。
図6では、データ検索部2による各ランキング(つまり第2仮検索結果)を、符号R1〜R3を用いて表している。
これらのランキングを前提として、各データのスコアは、例えば以下の式で表すことができる。
Figure 2010108477
ここで、記号の意味は以下の通りである。
Figure 2010108477
ここで、Rank(r,i)を2乗にしているのは、ランキングが低いほど(つまり順位の数が大きいほど)スコアを低くするためである。指数の値は、実験的に定めることができる。
また、Hitcount(i)を乗じることにより、全ランキングに表れる当該画像の総数が多いほど、高いスコアとすることができる。すなわち、この実施形態では、ランキングでの順位と、全ランキングに表れるデータの数(すなわち出現数)とに応じて、スコアを算出することができる。
この実施形態では、ここに説明したように、正解画像に対するランキング(第2仮検索結果)を統合する場合、各正解画像に対応する第2仮検索結果中のランクの順位と出現数とを総合的に考慮して順位の再付与を行うことができる。このように、正解画像のランク(順位)と出現数とを総合的に考慮する理由は、正解事例が同じ傾向を持つ(いわゆる同じクラスに属している)と考えられるからである。したがって、このように総合的に考慮することによって、より正解の度合いが高い画像に高い順位を付することが可能になる。
さらに、正解統合部6は、算出したスコアを基準としてデータをソートする。そして、既定の順位までのデータを、第4仮検索結果として出力することができる。このようにして、正解統合部6は、第2仮検索結果を統合して、第4仮検索結果を得ることができる。ここで既定の順位とは、ユーザあるいは管理者が設定した値でも良いし、何らかのパラメータに基づいて動的に生成された値であっても良い。
以下、スコアについての具体的な計算例を説明する。
Figure 2010108477
上に示したように、例えば画像Cについてのスコアは、0.44となる。なお、前記したアルゴリズムは、正解画像に基づく検索結果についてのものであり、後述するように、不正解画像に基づく検索結果については、この実施形態では、異なる処理を行う。
第2仮検索結果を統合して第4仮検索結果を得る手順を、図7を参照してさらに詳しく説明する。
図7(a)には、図6と同様に、各ランキング(第2仮検索結果)R1〜R3が示されている。これを前提として、各画像を基準として、ランクの数値と出現数(HitCount)をまとめると、図7(b)のような結果となる。そして、各画像についてスコアを算出した結果を、図7(c)に示す。このスコアに基づいて、統合的にランキングされた第4仮検索結果24を得ることができる(図7(d)参照)。
(図2のステップSA−7)
ついで、不正解投入部7は、不正解データをデータ検索部2に送る。データ検索部2は、不正解データに基づいて画像登録部10を検索し、複数の類似画像を第3仮検索結果23として取得する(図3(b)参照)。この実施形態では、複数の不正解データが指定されているので、複数の第3仮検索結果23を得ることができる。
さらに、不正解投入部7は、得られた各第3仮検索結果23を不正解統合部8に送る。
(図2のステップSA−8)
ついで、不正解統合部8は、複数の第3仮検索結果23を統合して、第5仮検索結果25を生成する(図3(b)参照)。この生成の手順を、図8及び図9を参照しながら、さらに詳しく説明する。
図8の例では、三つの不正解画像が指定されたと仮定する。そして、それぞれの正解画像に対応して、三つの第3仮検索結果23が生成される。不正解統合部8は、まず、これらの三つの第3仮検索結果23について、それぞれの不正解画像との類似度に応じて、データ検索部2が出力した仮検索結果の再ランキング(順位付け)を行う。ここで、データ検索部2が出力する第3仮検索結果23に含まれるデータについては、前記した第2仮検索結果22の場合と同様に、データ検索部2の機能により、既に順位付けが行われている。
図8では、データ検索部2による各ランキング(つまり第3仮検索結果)を、符号R1〜R3を用いて表している。
これらのランキングを前提として、統合されたランキングは、以下の式で表される。
Figure 2010108477
ここで、用いる記号の意味は以下の通りである。
Figure 2010108477
統合されたランキングは以下のように表現できる。
統合されたランキング=
(1)Image(R1,1)
(2)Image(R2,1)
(3)Image(R3,1)
(4)Image(R1,2)
(5)Image(R2,2)
(6)Image(R3,2)
(7)Image(R1,3)
(8)Image(R2,3)
(9)Image(R3,3)
(10)...
ランキングの具体例を以下に示す。
I={A,B,C,D,E} R={R1,R2,R3}
Image(R1,1)=B Image(R2,2)=A Image(R3,3)=C
さらに、不正解統合部8は、ランク付けした第3検索結果において、高い順位のデータを優先させる。つまり、同じデータが異なるランクに入っていた場合、高い順位のデータを優先し、低い順位のデータは無視する(図9(b)参照)。
このように、この実施形態では、不正解画像を統合する場合は、出現数を無視し、順位を基準として再ランキングを行う。この理由は、不正解事例の傾向は分散する(いわゆる複数のクラスに属している)と考えられ、その結果、出現数を重視することは不適切と考えられるからである。この実施形態では、正解画像と異なる基凖で不正解画像の順位付けを行うことにより、不正解画像に対する適切な順位付けを行うことができる。
以上により、図9(c)に示されるように、統合されたランキングを得ることができる。このランキングのうち、既定の順位までのデータを、第5仮検索結果として取得することができる。このようにして、不正解統合部8は、第3仮検索結果を統合して、第5仮検索結果を得ることができる。ここで既定の順位とは、前記と同様に、ユーザあるいは管理者が設定した値でも良いし、何らかのパラメータに基づいて動的に生成された値であっても良い。
(図2のステップSA−9)
ついで、検索結果統合部9は、第4仮検索結果24と第5仮検索結果25とを統合して、出力用の検索結果を得る。この統合手順の一例を、図10をさらに参照しながら説明する。
この実施形態では、第4仮検索結果24に属するデータから、第5仮検索結果25に属するデータを削除する(図10参照)。これにより、最終的な出力用検索結果26を得ることができる(図4(d)参照)。
検索結果統合部9は、出力用検索結果26を、検索結果表示部3に送る。
(図2のステップSA−10)
検索結果表示部3は、検索結果統合部9から送られた出力用検索結果26を表示する。このようにして、この実施形態によれば、クエリ画像に基づく検索結果をユーザに呈示することができる。検索結果の出力例を図11に示す。
第1実施形態では、前記したように、第1仮検索結果に対するフィードバックを受け付ける。そして、正解データに基づく再検索結果と、不正解データに基づく再検索結果とを統合し、出力用の検索結果を得る。したがって、この実施形態の装置によれば、高い検索精度を得ることが可能になる。
また、この実施形態の装置では、特徴量の計算手法(すなわち重み付けの値)を変更する必要がない。このため、検索エンジン内部における処理アルゴリズムを修正する必要がなく、実装が容易であるという利点がある。
さらに、この実施形態の装置では、特徴量の再計算を不要とすることができる。このため、この装置では、検索動作を高速に行うことが可能になるという利点もある。
また、検索エンジン内部の処理アルゴリズムを修正せずに、ランキングアルゴリズムの異なる様々な検索エンジンに対しても、簡単にユーザのフィードバックに基づいて、検索結果の順序を並べ替える機能を提供することができる。
また、第1実施形態の正解統合部6は、第2仮検索結果におけるランキング中の順位と、全ランキングにおける出現数とに基づいて、第2仮検索結果に属するデータを順位付けし、これによって、第4仮検索結果を得ている。この処理により、検索精度を一層向上することが可能になる。
さらに、第1実施形態の不正解統合部8は、第3仮検索結果におけるランキング中の順位に基づいて、第3仮検索結果に属するデータを順位付けし、これによって、第5仮検索結果を得ている。この処理により、検索精度を一層向上することが可能になる。
また、第1実施形態の検索結果統合部9は、第4仮検索結果に属するデータのうち、第5仮検索結果に属するデータを削除している。この処理により、不正解データに基づく検索結果において高い順位のデータを、出力用の検索結果から除外することができる。よって、検索精度を一層向上することが可能になる。
なお、前記実施形態では、正解データに基づく第2仮検索結果を統合して第4仮検索結果を得る構成としたが、第4仮検索結果を出力用の検索結果として用いることも可能である。この場合は、ユーザによる不正解データの指定を不要とすることができる。
また、前記実施形態では、不正解データに基づく第3仮検索結果を統合して第5仮検索結果を得ている。しかしながら、不正解データとして指定された画像が一つの場合には、第5仮検索結果の生成は不要になる。この場合は、第4仮検索結果と第3仮検索結果との両方に属するデータの順位を低くすることにより、出力用の検索結果における検索精度を高めることができる。
また、ユーザによりフィードバックされた正解データ及び不正解データを蓄積的に記憶しておき、ステップSA−10の処理後もステップSA−04〜SA−10の処理を繰り返してフィードバックを受け付けることより、検索結果の再ランキングを行うこととしてもよい。これにより、ユーザは、所望の検索結果を得られるまで、検索結果を閲覧しながらフィードバックを行っていくことができる。
(第2実施形態)
次に、本発明の第2実施形態に係る検索装置を説明する。第1実施形態では、正解データと不正解データのフィードバックを類似画像検索の結果(第1仮検索結果)に行わせ、フィードバックされた正解データと不正解データとで再検索を行って、それらの検索結果を統合することで出力用の検索結果を得ていた。
これに対し、第2実施形態では、第1実施形態のデータ処理アルゴリズムを文書(テキスト)の検索に適用・応用することで、文書検索結果に対するユーザフィードバックにより正解データと不正解データのデータに基づくクエリで再ランキングを可能としたものである。
第2実施形態に係る検索装置を、添付の図面に基づいて説明する。第2実施形態の検索装置は、テキストのクエリ(クエリワード)に関連するウェブ文書を検索するものである。尚、下記の第2実施形態では、ウェブ上に公開されている文書(例えばHTMLデータ)を検索対象として説明するが、文書検索の対象とするデータの範囲はウェブ上のものに限られないのは勿論である。
検索装置は、図12に示されるように、クエリ受付部1aと、データ検索部2aと、検索結果表示部3aと、フィードバック受付部4aと、正解投入部5aと、正解統合部6aと、不正解投入部7aと、不正解統合部8aと、検索結果統合部9aと、ウェブ文書登録部10aとを基本的な構成として備えている。尚、第1実施形態において説明した検索装置と同様の機能構成を有するものについては、適宜詳細な説明を省略する。
クエリ受付部1aは、ユーザが検索のために指定したクエリワードを受け付けるものである。
データ検索部2aは、クエリワードに関連するウェブ文書を、ウェブ文書登録部10aに記録されている複数の対象データの中から検索することで、該ウェブ文書のURLやタイトルを有する第1仮検索結果を得る構成となっている。データ検索部2aとしては、この実施形態では、いわゆるロボット型検索エンジンが用いられている。
ウェブ文書登録部10aは、図に示すようにウェブ文書DB101aと、インデックス部102aと、インデックスDB103aとを備えて構成される。ウェブ文書DB101aは、検索対象となるウェブ文書のデータを登録しておくデータベースである。登録されるデータとしては、例えば、インターネット上でのクローリングにより取得されたウェブ文書のURLやタイトル、該ウェブ文書内から抽出した要約文書(スニペット)等である。
インデックス部102aは、ウェブ文書DB101aに登録されたウェブ文書のURLを検索するための索引を生成する。具体的には、収集したウェブ文書に形態素解析等の自然言語処理を施して、固有名詞や特徴的な語句の抽出を行って、それらをインデックスとして生成し、該ウェブ文書のURLとの対応関係と共にインデックスDB103aに記憶する。
検索結果表示部3aは、データ検索部2aにおける検索結果を一覧表示するものである。ユーザは、第1仮検索結果の一覧を見ながら、正解・不正解の指定を行うことができる。フィードバック受付部4aは、クエリワードに基づいて得られた第1仮検索結果の中における正解データと不正解データの指定を受け付ける構成となっている。尚、第2実施形態において、正解データ及び不正解データは、ウェブ文書を特定可能なURLとするが、ウェブ文書そのもののデータ(HTMLデータ)であってもよい。
正解投入部5aは、指定された正解データのURLで示されるウェブ文書から特徴語を抽出してデータ検索部2aに投入することにより、正解データに基づく第2仮検索結果を得る。複数の正解データをデータ検索部2aに投入することにより、複数の第2仮検索結果を得ることができる。第2実施形態において正解投入部5aは、特徴語抽出部51aと、正解特徴語投入部52aとを有して構成される。
特徴語抽出部51aは、正解データとしてフィードバックされたURLで示されるウェブ文書に通信回線網(図示略)を介してアクセスして、該ウェブ文書中から特徴語を抽出する。特徴語は、ウェブ文書に含まれる単語から特徴語抽出処理を行って抽出され、ウェブ文書内の単語について、その出現頻度、出現箇所、文字属性などに応じた重みを値が算出され、上位の重み値を有する単語が抽出する。尚、このウェブ文書からの特徴語の抽出は、例えば、URLで示されるウェブ文書にアクセスすることなく、ウェブ文書DB101aに記憶されたスニペットから抽出することとしてもよい。
正解特徴語投入部52aは、特徴語抽出部51aが抽出した特徴語ぞれぞれとクエリワードとの組み合わせをクエリとしてデータ検索部2aに投入することにより、正解データに基づいた第2仮検索結果を得る構成となっている。
不正解投入部7aは、指定された不正解データのURLで示されるウェブ文書から特徴語を抽出してデータ検索部2aに投入することにより、不正解データに基づく第3仮検索結果を得る構成となっている。複数の不正解データをデータ検索部2aに投入することにより、複数の第3仮検索結果を得ることができる。
第2実施形態において不正解投入部7aは、特徴語抽出部71aと、不正解特徴語投入部72aとを備えて構成される。特徴語抽出部71aは、不正解データとしてフィードバックされたURLで示されるウェブ文書にから特徴語を抽出する。不正解特徴語投入部72aは、特徴語抽出部71aが抽出した特徴語それぞれとクエリワードとの組み合わせをクエリとしてデータ検索部2aに投入する。
第2実施形態における前記第2仮検索結果及び前記第3仮検索結果は、いずれも、複数のデータ(つまりウェブ文書のURL)を含んでいる。
正解統合部6aは、複数の正解データに基づく複数の第2仮検索結果を統合して、第4仮検索結果を得る。不正解統合部8aは、複数の不正解データに基づく複数の第3仮検索結果を、正解統合部6aとは異なる基準で統合することによって、第5仮検索結果を得る。
検索結果統合部9aは、正解統合部6aで得られた第4仮検索結果と、不正解統合部8aで得られた第5仮検索結果とを統合することにより、クエリワードに対する出力用検索結果を取得する。
(第2実施形態におけるウェブ文書の検索方法)
次に、前記した検索装置の動作を、図13に示すフローチャートに従って説明する。
(図13のステップSA−1a)
まず、クエリ受付部1aは、クエリワードをユーザから受け取る。但し、第2実施形態においては、クエリ受付部1aが何らかの方法でクエリワードを特定できればよく、クエリワードの指定方法は特に制約されない。
(図13のステップSA−2a)
ついで、データ検索部2aは、クエリ受付部1aから送られるクエリワードに基づいて、ウェブ文書登録部10aを検索し、複数の検索結果(例えば、ウェブ文書のURLやタイトル)を取得する。これらの複数の検索結果が、第2実施形態における第1仮検索結果に対応する。データ検索部2aは、検索結果表示部3aに第1仮検索結果を送る。
(図13のステップSA−3a)
ついで、検索結果表示部3aは、第1仮検索結果を表示する。第2実施形態における表示例を図14に示す。図示の例では、「東京駅」というクエリワードQ1に対して第1仮検索結果としてリスト化された検索結果L1が表示されている。そして、ユーザが、表示画面内で検索結果L1のタイトルを正解エリアE1と不正解エリアE3の所定位置にドラッグ&ドロップすることにより、正解データ及び不正解データとしてのウェブ文書をそれぞれ指定できるようになっている。
(図13のステップSA−4a)
ついで、フィードバック受付部4aは、ユーザから入力された正解データと不正解データについての入力結果を受け取る。さらに、フィードバック受付部4aは、正解データを正解投入部5aに送り、不正解データを不正解投入部7aに送る。
(図13のステップSA−5a)
ついで、正解投入部5aの正解特徴語投入部52aは、正解データで示されるウェブ文書から特徴語抽出部51aが抽出した特徴語それぞれとクエリワードとの組み合わせをデータ検索部2aに送る。このとき、正解特徴語投入部52aは、ウェブ文書から抽出された特徴語のうちの、クエリワードと一致又は類似する特徴語ついては、その除外してもよい。
例えば、図14においては、2番目の検索結果のウェブ文書から抽出される特徴語の「レストラン」や「クーポン券」といった特徴語とクエリワード「東京駅」との組み合わせた論理積のクエリワード(「東京駅 レストラン」や「東京駅 クーポン券」)をデータ検索部2aに送る。
データ検索部2aは、正解投入部5aから投入されたクエリワードに基づいて、ウェブ文書登録部10aを再検索し、複数の検索結果を第2仮検索結果として取得する。さらに、正解投入部5aは、得られた各第2仮検索結果を正解統合部6aに送る。
(図13のステップSA−6a)
ついで、正解統合部6aは、複数の第2仮検索結果を統合して、第4仮検索結果を生成する。この第4仮検索結果の生成手順は、上述した第1実施形態の類似画像の検索結果に対して行う手順(図6及び7を参照)を、第2実施形態のURLの検索結果に対して行えばよく、その詳細な説明は省略する。
(図13のステップSA−7a)
ついで、不正解投入部7aの特徴語抽出部71aは、特徴語抽出部71aが不正解データで示されるURLのウェブ文書から抽出した特徴語をデータ検索2aに送る。このとき、不正解特徴語投入部72aは、ウェブ文書から抽出された特徴語それぞれとクエリワードとの組み合わせをクエリワードとしてデータ検索部2aに送る。
例えば、図14においては、1番目の検索結果のウェブ文書から抽出される「構内」といった特徴語とクエリワード「東京駅」との組み合わせによる論理積のクエリワード(「東京駅 構内」)をデータ検索部2aに送る。
データ検索部2aは、不正解データから抽出された特徴語に基づいてウェブ文書登録部10aを検索し、複数の検索結果を第3仮検索結果として取得する。さらに、不正解投入部7aは、得られた各第3仮検索結果を不正解統合部8aに送る。
(図13のステップSA−8a)
ついで、不正解統合部8aは、複数の第3仮検索結果を統合して、第5仮検索結果を生成する。この第5仮検索結果の生成手順は、上述した第1実施形態の類似画像の検索結果に対して行う手順(図8及び9を参照)を、第2実施形態のURLの検索結果に対して行えばよく、その詳細な説明は省略する。
(図13のステップSA−9a)
ついで、検索結果統合部9aは、第4仮検索結果と第5仮検索結果とを統合して、出力用の検索結果を得て検索結果表示部3aに送る。この統合手順も第1実施形態と同様に行うことができる。
(図13のステップSA−10a)
検索結果表示部3aは、検索結果統合部9aから送られた出力用検索結果を表示する。図15は、検索結果統合部9aにより統合・生成された検索結果の表示例である。図に示すように、ユーザが正解データとしてフィードバックした「東京駅周辺情報『レストランをご紹介』」や「東京駅の駅弁・お土産・観光情報」のウェブ文書から抽出された特徴語に関連するウェブページが検索結果L3の上位に表示されるようになる。
このようにして、ユーザのフィードバックに基づいた検索結果をユーザに呈示することができる。また、不正解としてフィードバックされた「東京駅構内図」のウェブ文書から抽出された特徴語(例えば「構内」)に関するウェブ文書のランキングが低められる。
以上のように第2実施形態では、ウェブ文書の検索結果である第1仮検索結果に対するフィードバックを受け付ける。そして、正解データに基づく再検索結果と、不正解データに基づく再検索結果とを統合し、出力用の検索結果を得る。このため、クエリワードとインデックスとの関連度の計算手法やデータ検索部2a及びウェブ文書登録部10aの構成を変更する必要がない。したがって、第2実施形態の装置によれば、ウェブ文書の検索においても第1実施形態と同様の効果が得られる。
(第3実施形態)
次に、本発明の第3実施形態に係る検索装置を説明する。第3実施形態に係る検索装置は、第2実施形態と同様にクエリワードに関連するウェブ文書を検索すると共に、そのクエリワードに基づいて関連ワードを検索して表示するものである。
即ち、第3実施形態も第2実施形態と同様に、第1実施形態のデータ処理アルゴリズムを関連ワードの検索に適用・応用することで、関連ワードの検索結果のユーザフィードバックによる再ランキングを可能としたものである。
検索装置は、図16に示されるように、クエリ受付部1bと、データ検索部2bと、検索結果表示部3bと、フィードバック受付部4bと、正解関連ワード投入部5bと、正解統合部6bと、不正解関連ワード投入部7bと、不正解統合部8bと、検索結果統合部9bと、ウェブ文書登録部10bとを基本的な構成として備えている。尚、第1及び第2実施形態において説明した検索装置と同様の機能構成を有するものについては、適宜詳細な説明を省略する。
クエリ受付部1bは、ユーザが検索のために指定したクエリワードを受け付けるものである。
データ検索部2bは、クエリワードに関連するウェブ文書を、ウェブ文書登録部10bに記録されている複数の対象データの中から検索することで、該ウェブ文書のURLやタイトルを有する第1仮検索結果を得る構成となっている。
ウェブ文書登録部10bは、図に示すようにウェブ文書DB101bと、インデックス部102bと、インデックスDB103bと、関連ワードDB104bとを備えて構成される。関連ワードDB104bは、クエリワードに関連した文書検索のためのキーワード群を蓄積したデータベースである。第3実施形態においては、過去のウェブ検索においてクエリワードとして入力されたキーワードを関連キーワードとし、その入力頻度とも共に記憶される。
この関連キーワードは、スペース文字(空白文字)で繋ぎ合わせた複数のキーワードを含む論理積のクエリワード(例えば「東京駅 構内図」「東京駅 構内図 グルメ)や、スペース文字列を使わずに連続表記された一つのクエリワード(例えば「東京駅周辺」)を含む。各関連ワードの入力頻度が、関連ワードの検索結果を表示する際のランキングに用いられる。
データ検索部2bは、関連ワードのような複数のキーワードを有するクエリが投入されると、関連ワード(例えば「東京駅 周辺」)内の各キーワードを含む他の関連ワード(例えば「東京駅 周辺 グルメ」や「東京駅 グルメ 周辺」)を関連ワードDB104bから検索する。
第3実施形態において、データ検索部2bは、クエリワードに関連するウェブ文書の検索を行うと共に、クエリワードを含む関連ワードを関連ワードDB104bの中から検索して、検索結果表示部3bに出力する。この検索された関連ワードも第1仮検索結果として得る。
尚、データ検索部2bは、クエリワードに関連する関連ワードを、クエリワードと関連ワードとの言語的な近さ(類似度)によりランク付けして検索を行い、そのランク付けにより関連ワードの検索結果を出力することとしてもよい。この言語的な近さ(類似度)のランクの算出は、シソーラスに基づいたベクトル空間モデルにより算出可能であり、その他、公知技術を適宜採用可能である。
検索結果表示部3bは、データ検索部2bにおける検索結果を一覧表示する。ユーザは、第1仮検索結果の一覧を見ながら、正解・不正解の指定を行うことができる。フィードバック受付部4bは、クエリワードに基づいて得られた第1仮検索結果としての関連ワード中における正解データと不正解データの指定を受け付ける構成となっている。
正解関連ワード投入部5bは、正解データとしての関連ワードをデータ検索部2bに投入することにより、正解として指定された関連ワードに基づくウェブ文書の検索結果と、該関連ワードに基づいて検索された他の関連ワードとを含む第2仮検索結果を得る。
不正解関連ワード投入部7bは、不正解データとしての関連ワードをデータ検索部2bに投入することにより、不正解として指定された関連ワードに基づくウェブ文書の検索結果と、該関連ワードに基づいて検索された他の関連ワードとを含む第3仮検索結果を得る。
複数の関連ワードをデータ検索部2bに投入することにより、複数の第2仮検索結果及び第3仮検索結果を得ることができる。また、第3実施形態における前記第2仮検索結果及び前記第3仮検索結果は、いずれも、複数のデータ(つまりウェブ文書のURLと関連ワード)を含んでいる。
正解統合部6bは、複数の正解データ(関連データ)に基づく複数の第2仮検索結果を統合して、第4仮検索結果を得る。不正解統合部8bは、複数の不正解データに基づく複数の第3仮検索結果を、正解統合部6bとは異なる基準で統合することによって、第5仮検索結果を得る。
検索結果統合部9bは、正解統合部6bで得られた第4仮検索結果と、不正解統合部8bで得られた第5仮検索結果とを統合することにより、クエリワードに対する出力用検索結果を取得する。
(第3実施形態におけるウェブ文書の検索方法)
次に、第3実施形態における検索装置の動作を、図17に示すフローチャートに従って説明する。尚、図13で説明した第2実施形態でのデータ処理と同様の処理についての説明は適宜割愛する。
(図17のステップSA−1b)
まず、クエリ受付部1bは、クエリワードをユーザから受け取る。
(図17のステップSA−2b1)
ついで、データ検索部2bは、クエリ受付部1bから送られるクエリワードに基づいて、ウェブ文書登録部10bを検索し、文書検索についての複数の検索結果を取得する。
また、データ検索部2bは、クエリワードに基づいて該クエリワードを含む関連ワードを関連ワードDB104bの中から検索して取得する。この関連ワードの検索の際、該関連ワードに対応付けられた検索頻度の昇順に所定数抽出して検索結果として出力する。これらのウェブ文書の検索結果と関連ワードの検索結果とが、第3実施形態における第1仮検索結果に対応し、データ検索部2bは、検索結果表示部3bに第1仮検索結果(ウェブ文書の検索結果と関連ワードの検索結果)を送る。
(図17のステップSA−3b)
ついで、検索結果表示部3bは、第1仮検索結果を表示する。第3実施形態における表示例を図18に示す。図示の例では、「東京駅」というクエリワードQ1に対して第1仮検索結果のリストL1が表示されている。そして、ユーザが、表示画面内で関連ワードの検索結果L5を正解エリアE1と不正解エリアE3の所定位置にドラッグ&ドロップすることにより、正解データ及び不正解データをそれぞれ指定できるようになっている。
(図17のステップSA−4b)
ついで、フィードバック受付部4bは、ユーザから入力された正解データと不正解データについての入力結果を受け取る。さらに、フィードバック受付部4bは、正解データを正解関連ワード投入部5bに送り、不正解データを不正解関連ワード投入部7bに送る。
(図17のステップSA−5b)
ついで、正解関連ワード投入部5bは、正解データとして指定された関連ワードをクエリワードとしてデータ検索部2bに送る。例えば、図18においては、クエリワードの「東京駅」を含む「東京駅 周辺」と「東京駅 グルメ」といった関連ワードをデータ検索部2bに送る。
データ検索部2bは、正解関連ワード投入部5bから投入された関連ワードに基づいて、ウェブ文書DB101bと関連ワードDB104bとを検索して、それぞれの検索結果を第2仮検索結果として取得する。さらに、正解関連ワード投入部5bは、得られた各第2仮検索結果を正解統合部6bに送る。
(図17のステップSA−6b)
ついで、正解統合部6bは、第2実施形態と同様にウェブ検索結果の統合を行うと共に、関連ワードの検索結果を統合して、それぞれを含む第4仮検索結果を生成する。この第4仮検索結果の生成手順は、上述した第1実施形態の類似画像の検索結果に対して行う手順(図6及び7を参照)を、第3実施形態の検索結果に対して行えばよく、その詳細な説明は省略する。
(図17のステップSA−7b)
ついで、不正解関連ワード投入部7bは、不正解データとして指定された関連ワードをクエリワードとしてデータ検索部2bに送る。例えば、図18においては、「東京駅 高速バス」といった関連ワードをデータ検索部2bに送る。
データ検索部2bは、不正解関連ワード投入部7bから投入された関連ワードに基づいてウェブ文書DB101bと関連ワードDB104bとを検索して、それぞれの検索結果を第3仮検索結果として取得する。さらに、不正解関連ワード投入部7bは、得られた各第3仮検索結果を不正解統合部8bに送る。
(図17のステップSA−8b)
ついで、不正解統合部8bは、第2実施形態と同様にウェブ検索結果の統合を行うとともに、関連ワードの検索結果を統合して、それぞれを含む第5仮検索結果を生成する。この第5仮検索結果の生成手順も、上述した第1実施形態の類似画像の検索結果に対して行う手順(図8及び9を参照)を、第3実施形態のURLの検索結果に対して行えばよく、その詳細な説明は省略する。
(図17のステップSA−9b)
ついで、検索結果統合部9bは、第4仮検索結果と第5仮検索結果と含まれるウェブ文書の検索結果と関連ワードの検索結果とをそれぞれ統合して、出力用の検索結果を得て検索結果表示部3bに送る。この統合手順も第1実施形態と同様に行うことができる。
(図17のステップSA−10b)
検索結果表示部3bは、検索結果統合部9bから送られた出力用検索結果を表示する。図19は、検索結果統合部9bにより統合・生成された検索結果の表示例である。図に示すように、ユーザが正解データとしてフィードバックした「東京駅 周辺」や「東京駅 グルメ」に基づいて検索されたウェブ文書が検索結果L7の上位に表示されるようになる。このようにして、ユーザのフィードバックに基づいた検索結果をユーザに呈示することができる。
また、正解データとして指定された関連ワードに含まれる「東京駅」や「周辺」、「グルメ」といったクエリを含む関連ワードが検索され、関連ワードリストL9のようにランキングされて表示される。
第3実施形態では、関連ワードの検索結果を含む第1仮検索結果に対するフィードバックを受け付ける。そして、正解として指定された関連ワードを含む関連ワードの再検索結果と、不正解として指定された関連ワードを含む関連ワードの再検索結果とを統合し、出力用の関連ワードを得る。このため、データ検索部2b及びウェブ文書登録部10bの構成を変更する必要がない。したがって、第3実施形態の装置によれば、関連ワードを用いたフィードバックにおいても第1実施形態と同様の効果が得られる。
また、第3実施形態によれば、最初にユーザが入力したクエリワードを含む関連ワードに対してフィードバックを行うことができる。このため、ユーザは、ウェブ文書の検索結果のタイトルやスニペット等を逐次確認することなく直感的にフィードバックを行うことができる。
なお、第2及び第3実施形態では、正解データに基づく第2仮検索結果を統合して第4仮検索結果を得る構成としたが、第4仮検索結果を出力用の検索結果として用いることも可能である。この場合は、ユーザによる不正解データの指定を不要とすることができる。
また、不正解データに基づく第3仮検索結果を統合して第5仮検索結果を得ている。しかしながら、不正解データとして指定された検索結果が一つの場合には、第5仮検索結果の生成は不要になる。この場合は、第4仮検索結果と第3仮検索結果との両方に属するデータの順位を低くすることにより、出力用の検索結果における検索精度を高めることができる。
(総括)
上述した第1〜第3の実施形態では、画像やウェブ文書の検索結果に対するユーザの正解・不正解のフィードバックに基づいて新たなクエリを抽出してデータ検索部に投入することによりクエリ関連情報(画像検索結果、文書検索結果、関連クエリワード)を取得し、正解データに対応したクエリ関連情報中のデータと、不正解データに対応したクエリ関連情報中のデータとをランクに基づいて統合することによりことにより出力用のクエリ関連情報を得た。
この画像やウェブ文書、関連ワードといった種々のクエリ関連情報に対してフィードバック受け付ける上述した実施形態を包括した検索装置の機能ブロックを図20に示す。
この図によれば、検索装置は、クエリ受付部100(1、1a、1bに対応)と、データ検索部200(2、2a、2bに対応)と、検索結果表示部300(3、3a、3bに対応)と、フィードバック受付部400(4、4a、4bに対応)と、正解投入部500(5、5a、5bに対応)と、正解統合部600(6、6a、6bに対応)と、不正解投入部700(7、7a、7bに対応)と、不正解統合部800(8、8a、8bに対応)と、検索結果統合部900(9、9a、9bに対応)と、クエリ関連情報登録部1000(10、10a、10bに対応)を有して構成される。正解投入部500及び不正解投入部700は、本発明における関連情報取得部に相当する。また、正解統合部600と不正解統合部800は、本発明における統合部に相当する。
上述した各実施形態のように、クエリ受付部100は、画像やクエリワード等の各種コンテンツを検索するためのキーとなるクエリ(検索要求)を受け付け、データ検索部200が、そのクエリに基づいてクエリ関連情報登録部1000内の検索対象のDBを検索する。検索結果表示部300は、データ検索部200により検索された検索結果(クエリ関連情報)の一覧を表示し、フィードバック受付部400によりその検索結果に対するユーザのフィードバックが受け付けられる。
正解投入部500は、フィードバック受付部400により受け付けられた正解データに基づいて新たなクエリ(画像や特徴語や関連ワード)を抽出し、そのクエリをデータ検索部200に投入する。また、不正解投入部700は、フィードバックされた不正解データ基づいて新たなクエリを抽出してデータ検索部200に投入する。
正解統合部600は、正解データに対する仮のクエリ関連情報の統合の際には、図6及び7で画像検索の場合に例示したように、各正解データに対応した第2仮検索結果を得て、各正解データに対応する第2仮検索結果中のランクの順位と出現数とを総合的に考慮して順位の再付与を行う。この順位の再付与は、正解データに対応した検索結果のランク(順位)と出現数とを総合的に考慮して、各検索結果中に出現する同一のランクを統合する。これにより、正解データに対応した各クエリ関連情報中の上位にランク付けされるデータ、総合的に高いランキングとなる。
また、不正解統合部800は、不正解データに対する仮のクエリ関連情報の統合の際には、図8及び9で画像検索の場合に例示したように、各不正解データに対応した第3仮検索結果を得て、各不正解データに対応する各第3仮検索結果中のランク付けが高い順位のデータを優先させる。つまり、同じデータが異なるランクに入っていた場合、高い順位のデータを優先し、低い順位のデータは無視する。このように、不正解データを統合する場合は、出現数を無視し、順位を基準として再ランキングすることで、不正解データに対するクエリ関連情報に適切な順位付けを行うことができる。
そして、検索結果統合部900は、正解統合部600が統合した正解データに対するクエリ関連情報と、不正解統合部800が統合した不正解データに対するクエリ関連情報とを統合して、ユーザのフィードバックを反映した出力用のクエリ関連情報を得る。この検索結果統合部900の統合は、正解統合部600により得られたクエリ関連情報から、不正解統合部800により得られたクエリ関連情報を削除する(相殺させる)。
以上のように、本実施形態によれば、データ検索部200に、ユーザがフィードバックした正解データ及び不正解データに基づいて新たなクエリを抽出してそのクエリ再投入し、正解データに対するクエリ関連情報と、不正解データに対するクエリ関連情報とを統合することで、正解データに対応したクエリ関連情報に含まれるデータのランキングがより高められ、不正解データに対応したクエリ関連情報が削除されるようになる。
また、データ検索部200が有する検索アルゴリズムを修正せずに、正解データ及び不正解データのフィードバックに基づいたクエリ関連情報の再ランキングを行うという本実施形態の機能の実装が容易であり、簡単にクエリ関連情報の表示順序の並び替え機能を提供することができる。また、インデックス(画像の特徴量やウェブ文書中の特徴語)の更新が不要のため、検索動作を高速に行うことが可能になる。
また、正解統合部600は、正解データに基づいたクエリに対するクエリ関連情報におけるランキングと、全ランキングにおける出現数とに基づいて該クエリ関連情報中のデータをランク付けするため、正解データに関連するデータが検索結果の上位となり、検索精度を一層向上することが可能になる。
さらに、不正解統合部800は、不正解データに基づいたクエリに対する検索結果におけるランキング中の順位に基づいて、該検索結果中のデータを順位付けするため、不正解データに関連するデータが検索結果から削除され、検索精度を一層向上することが可能になる。
また、検索結果統合部900は、正解統合部600が統合したデータのうち、不正解統合部800が統合したデータを削除している。この処理により、不正解データに基づくクエリ関連情報において高い順位のデータを、出力用のデータから除外することができる。よって、検索精度を一層向上することが可能になる。
(変形例)
尚、上述した実施形態は、本発明を適用した一例であり、その適用な可能な範囲は上述例に限られない。即ち、本実施形態では、正解データに基づくクエリ関連情報に不正解データに基づくクエリ関連情報を統合して出力用データを得る構成としたが、正解統合部600が統合したクエリ関連情報を出力用データとして用いることも可能である。この場合は、ユーザによる不正解データの指定を不要とすることができる。
また、本実施形態では、不正解データに基づくクエリ関連情報を統合して仮の検索結果を得る構成としているが、不正解データとして指定されたクエリ関連情報が一つの場合には、この仮の検索結果の生成は不要になる。この場合は、正解統合部600が統合したクエリ関連情報中のデータのうち、不正解投入部700により得られたクエリ関連情報と同一のデータ(両方のクエリ関連情報に属するデータ)の順位を低くすることにより、出力用の検索結果における検索精度を高めることができる。
また、第1実施形態と同様に、ユーザによりフィードバックされた正解データ及び不正解データを蓄積的に記憶しておき、フィードバックの受け付けからクエリ抽出、再検索、統合の処理を繰り返すことにより、クエリ関連情報の再ランキングを行って出力用データを更新していくこととしてもよい。これにより、ユーザは、所望のクエリ関連情報を得られるまで、検索結果を閲覧しながらフィードバックを行っていくことができる。
また、本実施形態では、正解統合部600が統合して出力したクエリ関連情報から、不正解統合部800が統合して出力したクエリ関連情報を削除することとして説明したが、次のようにしてもよい。即ち、正解統合部600が統合して出力したクエリ関連情報に属するデータのうち、不正解統合部800が統合して出力したクエリ関連情報に属するデータを低い順位とする。
具体的に、第1実施形態の場合、検索結果統合部9は、第4仮検索結果に属するデータのうち、第5仮検索結果に属するデータを削除した。これに対して、第4仮検索結果に属するデータのうち、第5仮検索結果に属するデータを、低い順位とする。どの程度低い順位とするかは実験的に決定できるが、なるべく、ユーザの目に触れにくい程度にまで順位を落とすことが好ましい。これにより、第1実施形態と同様な効果を得られ、その詳細な説明は省略する。
また、本実施形態において、検索対象とするデータに画像、ウェブ文書(テキスト)、関連ワードを一例として上げて説明したが、音声データや動画データ等の各種コンテンツに適用可能である。
例えば、検索対象を音声データとする音声検索装置に適用することが可能である。具体的には、ユーザの音声入力に対して音声認識処理を施すことでユーザの発声をテキスト化してクエリを生成(音声クエリ)し、そのテキストと同等のテキストが含まれる音声データを検索する音声検索装置に適用することとしてもよい。また、ユーザの音声入力や楽曲等のデジタル音声ファイル(WAVファイルやMp3ファイル)の入力により、そのデジタルの音声データをクエリ(音声クエリ)とし、信号波形の類似する他の音声データを検索する音声検索装置について適用してもよい。尚、音声検索装置に用いる音声認識処理や信号波形の類似度の算出等の音声検索特有の処理ついては、適宜公知技術を採用可能であり、その詳細な説明は省略する。また、音声データを検索対象とした検索処理のアルゴリズムも公知の音声検索を技術に適用すればよい。
また、音声データに予め設定されたタグ(テキスト)に基づいて音声データを検索する音声検索装置に適用も可能である。即ち、ユーザから入力されたテキストクエリに基づいて、そのテキストクエリと一致または部分一致するタグが付された音声データを検索する。この場合は、複数のテキストを組み合わせた検索が可能となり、上述したようなクエリの履歴により関連ワードDBが生成可能であるから、この音声検索装置においても、関連ワードに対するユーザフィードバックを得ることもできる。同様に、画像データに予め設定されたタグに基づいて画像データを検索する画像検索装置に適用可能なことは言うまでもない。
このように、検索対象を音声データとした音声検索装置においても、上述のようなユーザのフィードバックによるクエリ関連情報(検索結果や)の再ランキングを行うことができ、検索エンジンのアルゴリズムを変えることなく、精度の高い検索結果を得られるようになる。
また、上述した実施形態は、画像検索装置や文書検索装置の構成要素としてデータ検索部及びクエリ関連情報登録部(画像登録部やウェブ文書登録部)を有することとして説明したが、それらを別装置することとしてもよい。
即ち、図20の検索装置においては、ユーザインターフェースとして機能するクエリ受付部100、検索結果表示部300及びフィードバック受付部400と、再ランキングに関する処理を行う正解投入部500、正解統合部600、不正解投入部700、不正解統合部800及び検索結果統合部900とを備えて、クエリや検索結果についてのデータ通信を検索サーバ等のデータ検索部200と行うこととしてもよい。このように検索装置を構成することで、上述した実施形態と同様の効果が得られるのは勿論である。
前記した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。
なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。
1 クエリ受付部
2 データ検索部(類似画像検索エンジン)
3 検索結果表示部
4 フィードバック受付部
5 正解投入部
6 正解統合部
7 不正解投入部
8 不正解統合部
9 検索結果統合部
10 画像登録部
11 クエリ画像
21 第1仮検索結果
211・212 正解データ
213 不正解データ
22 第2仮検索結果
23 第3仮検索結果
24 第4仮検索結果
25 第5仮検索結果
26 出力用検索結果

Claims (21)

  1. クエリ受付部と、データ検索部と、フィードバック受付部と、正解投入部と、検索結果統合部とを備えており、
    前記クエリ受付部は、検索のためのクエリ画像を受け付けるものであり、
    前記データ検索部は、前記クエリ画像に関連する画像を、複数の対象データの中から検索することで、第1仮検索結果を得る構成となっており、
    前記フィードバック受付部は、前記第1仮検索結果の中における複数の正解データについての、ユーザからの指定を受け付ける構成となっており、
    前記正解投入部は、前記複数の正解データを前記データ検索部にそれぞれ投入することにより、各正解データに対応する第2仮検索結果を得る構成となっており、
    前記検索結果統合部は、前記各正解データに対応するそれぞれの第2仮検索結果に基づいて、前記クエリ画像に対する出力用検索結果を取得する構成となっている
    ことを特徴とする画像検索装置。
  2. さらに、不正解投入部を備えており、
    前記フィードバック受付部は、前記第1仮検索結果の中における不正解データについての、ユーザからの指定を受け付ける構成となっており、
    前記不正解投入部は、前記不正解データを前記データ検索部に投入することにより、第3仮検索結果を得る構成となっており、
    前記検索結果統合部は、前記第2仮検索結果と前記第3仮検索結果とに基づいて、前記クエリ画像に対する出力用検索結果を取得する構成となっている
    ことを特徴とする請求項1に記載の画像検索装置。
  3. 前記検索結果統合部は、
    前記第2仮検索結果に属するデータのうち、前記第3仮検索結果に属するデータを削除するか、又は、低い順位とする構成となっている
    ことを特徴とする請求項2に記載の画像検索装置。
  4. さらに、正解統合部と、不正解統合部とを備えており、
    前記不正解投入部は、複数の不正解データを前記検索部に投入することにより、複数の前記第3仮検索結果を得る構成となっており、
    前記正解統合部は、前記各第2仮検索結果を統合して、第4仮検索結果を得る構成となっており、
    前記不正解統合部は、前記各第3仮検索結果を統合することによって、第5仮検索結果を得る構成となっており、
    前記検索結果統合部は、前記第4仮検索結果と前記第5仮検索結果とを統合することにより、前記クエリ画像に対する前記出力用検索結果を取得する構成となっている
    請求項2又は3に記載の画像検索装置。
  5. 前記不正解統合部は、前記正解統合部とは異なる基準で、前記各第3仮検索結果を統合する構成となっている
    請求項4に記載の画像検索装置。
  6. さらに検索結果表示部を備えており、
    前記検索結果表示部は、第1仮検索結果に属するデータとしての画像を一覧表示することにより、正解データについて、前記ユーザからの指定の入力を促す構成となっている
    請求項1〜5のいずれか1項に記載の画像検索装置。
  7. さらに検索結果表示部を備えており、
    前記検索結果表示部は、第1仮検索結果に属するデータとしての画像を一覧表示することにより、正解データ及び不正解データのそれぞれについて、前記ユーザからの指定の入力を促す構成となっている
    請求項2〜5のいずれか1項に記載の画像検索装置。
  8. 前記正解統合部は、前記第2仮検索結果におけるランキング中の順位と、全ランキングにおける出現数とに基づいて、前記第2仮検索結果に属するデータの順位を再付与し、これによって、前記第4仮検索結果を得る構成となっている、
    請求項4に記載の画像検索装置。
  9. 前記不正解統合部は、前記第3仮検索結果におけるランキング中の順位に基づいて、前記第3仮検索結果に属するデータの順位を再付与し、これによって、前記第5仮検索結果を得る構成となっている、
    請求項4,5,8のいずれかに記載の画像検索装置。
  10. 前記検索結果統合部は、前記第4仮検索結果に属するデータのうち、前記第5仮検索結果に属するデータを、削除するか、又は、低い順位とする構成となっている
    請求項4,5,8,9のいずれかに記載の画像検索装置。
  11. 検索のためのクエリ画像を受け付けるステップと、
    前記クエリ画像に関連する画像を、複数の対象データの中から検索することで、第1仮検索結果を得るステップと、
    前記第1仮検索結果の中における複数の正解データについての、ユーザからの指定を受け付けるステップと、
    前記複数の正解データに基づいて関連データをそれぞれ検索することにより、複数の第2仮検索結果を得るステップと、
    前記複数の第2仮検索結果に基づいて、前記クエリ画像に対する出力用検索結果を取得するステップと
    を備えたことを特徴とする画像検索方法。
  12. 請求項11に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
  13. クエリに関連するクエリ関連情報に対する正解又は不正解の指定をユーザから受け付けるフィードバック受付部と、
    前記指定された正解又は不正解のデータに基づいた新たなクエリをそれぞれ得て、この新たなクエリに対応するクエリ関連情報を取得する関連情報取得部と、
    前記正解又は不正解のデータに基づいた新たなクエリに対応して得られたそれぞれのクエリ関連情報中のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データ毎に付されたランクを統合して、出力用データを生成する統合部と、
    を備えることを特徴とする検索装置。
  14. 前記関連情報取得部は、
    前記正解のデータに基づいて得た新たなクエリに対するクエリ関連情報を取得し、
    前記統合部は、
    前記正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを高めるよう統合して前記出力用データを生成することを特徴とする請求項13に記載の検索装置。
  15. 前記関連情報取得部は、
    前記不正解のデータに基づいて得た新たなクエリに対するクエリ関連情報を取得し、
    前記統合部は、
    前記不正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを低めるように統合して前記出力用データを生成することを特徴とする請求項13又は14に記載の検索装置。
  16. 前記関連情報取得部は、
    前記正解のデータ及び前記不正解のデータに基づいた新たなクエリそれぞれに対するクエリ関連情報をそれぞれ取得し
    前記統合部は、
    前記フィードバック受付部により複数の正解及び不正解の指定が受け付けられた場合に、前記正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを高めるよう統合し、更に、前記不正解のデータに対応するそれぞれのクエリ関連情報のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データのランクを低めるように統合することで前記出力用データを生成することを特徴とする請求項13〜15の何れか1項に記載の検索装置。
  17. 前記クエリ関連情報は、テキストクエリに関連する文書であり、
    前記関連情報取得部は、
    前記指定された正解又は不正解の文書の中から特徴語を抽出し、この特徴語と前記テキストクエリとの組み合わせを前記新たなクエリとして取得することを特徴とする請求項13〜16の何れかに記載の検索装置。
  18. 前記フィードバック受付部が受け付ける前記クエリ関連情報は、テキストクエリに関連する関連クエリであり、
    前記関連情報取得部は、
    前記指定された正解又は不正解の関連クエリと前記テキストクエリとを前記新たなクエリとして取得することを特徴とする請求項13〜16の何れかに記載の検索装置。
  19. 前記クエリ関連情報は、クエリ画像に類似する画像データであり、
    前記関連情報取得部は、
    前記指定された正解又は不正解の画像データを新たなクエリとして取得することを特徴とする請求項13〜16の何れかに記載の検索装置。
  20. クエリに関連するクエリ関連情報に対する正解又は不正解の指定をユーザから受け付けるフィードバック受付工程と、
    前記指定された正解又は不正解のデータに基づいた新たなクエリをそれぞれ得て、この新たなクエリに対応するクエリ関連情報を取得する関連情報取得工程と、
    前記正解又は不正解のデータに基づいた新たなクエリに対応して得られたそれぞれのクエリ関連情報中のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データ毎に付されたランクを統合して、出力用データを生成する統合工程と、
    をコンピュータが行うことを特徴とする検索方法。
  21. クエリに関連するクエリ関連情報に対する正解又は不正解の指定をユーザから受け付けるフィードバック受付部と、
    前記指定された正解又は不正解のデータに基づいた新たなクエリをそれぞれ得て、この新たなクエリに対応するクエリ関連情報を取得する関連情報取得部と、
    前記正解又は不正解のデータに基づいた新たなクエリに対応して得られたそれぞれのクエリ関連情報中のデータ毎のランクに基づいて、各クエリ関連情報中に出現する同一データ毎に付されたランクを統合して、出力用データを生成する統合部と、
    をコンピュータに機能させることを特徴とするプログラム。
JP2009095278A 2008-09-30 2009-03-17 検索装置 Active JP5199168B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009095278A JP5199168B2 (ja) 2008-09-30 2009-03-17 検索装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008252528 2008-09-30
JP2008252528 2008-09-30
JP2009095278A JP5199168B2 (ja) 2008-09-30 2009-03-17 検索装置

Publications (2)

Publication Number Publication Date
JP2010108477A true JP2010108477A (ja) 2010-05-13
JP5199168B2 JP5199168B2 (ja) 2013-05-15

Family

ID=42297812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009095278A Active JP5199168B2 (ja) 2008-09-30 2009-03-17 検索装置

Country Status (1)

Country Link
JP (1) JP5199168B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156328A (ja) * 2017-03-16 2018-10-04 富士通株式会社 検索支援プログラム、検索支援装置および検索支援方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02125391A (ja) * 1988-08-20 1990-05-14 Fujitsu Ltd 連想整合認識方式
JPH0721198A (ja) * 1993-06-17 1995-01-24 Nippon Telegr & Teleph Corp <Ntt> 画像検索方法
JP2002366575A (ja) * 2001-03-26 2002-12-20 Lg Electronics Inc イメージ検索方法及び検索装置
JP2004192374A (ja) * 2002-12-12 2004-07-08 Ricoh Co Ltd 文書検索装置、プログラムおよび記録媒体
JP2004287532A (ja) * 2003-03-19 2004-10-14 Ricoh Co Ltd 統合型メタ検索装置および方法
JP2006251935A (ja) * 2005-03-08 2006-09-21 Ricoh Co Ltd 文書検索装置、文書検索方法、および文書検索プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02125391A (ja) * 1988-08-20 1990-05-14 Fujitsu Ltd 連想整合認識方式
JPH0721198A (ja) * 1993-06-17 1995-01-24 Nippon Telegr & Teleph Corp <Ntt> 画像検索方法
JP2002366575A (ja) * 2001-03-26 2002-12-20 Lg Electronics Inc イメージ検索方法及び検索装置
JP2004192374A (ja) * 2002-12-12 2004-07-08 Ricoh Co Ltd 文書検索装置、プログラムおよび記録媒体
JP2004287532A (ja) * 2003-03-19 2004-10-14 Ricoh Co Ltd 統合型メタ検索装置および方法
JP2006251935A (ja) * 2005-03-08 2006-09-21 Ricoh Co Ltd 文書検索装置、文書検索方法、および文書検索プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156328A (ja) * 2017-03-16 2018-10-04 富士通株式会社 検索支援プログラム、検索支援装置および検索支援方法

Also Published As

Publication number Publication date
JP5199168B2 (ja) 2013-05-15

Similar Documents

Publication Publication Date Title
US11803596B2 (en) Efficient forward ranking in a search engine
US7769771B2 (en) Searching a document using relevance feedback
JP6058705B2 (ja) 検索方法及び検索システム
US9846744B2 (en) Media discovery and playlist generation
US8713024B2 (en) Efficient forward ranking in a search engine
US20180081880A1 (en) Method And Apparatus For Ranking Electronic Information By Similarity Association
US20140379686A1 (en) Generating and presenting lateral concepts
US7769752B1 (en) Method and system for updating display of a hierarchy of categories for a document repository
US20090070321A1 (en) User search interface
US20080215550A1 (en) Search support apparatus, computer program product, and search support system
KR101393839B1 (ko) 링크된 용어들을 포함하는 활성 요약들을 제공하는 검색시스템
US20080154886A1 (en) System and method for summarizing search results
JP2004126840A (ja) 文書検索方法、プログラムおよびシステム
JP2004326216A (ja) 文書検索装置、方法、プログラム、及び記録媒体
US20110302149A1 (en) Identifying dominant concepts across multiple sources
JPWO2009048130A1 (ja) 文書重要度算出システム、文書重要度算出方法およびプログラム
WO2019009995A1 (en) SYSTEM AND METHOD FOR RESEARCHING MUSIC IN NATURAL LANGUAGE
JP4091146B2 (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20110119250A1 (en) Forward Progress Search Platform
JP5179564B2 (ja) クエリセグメント位置決定装置
JP5199168B2 (ja) 検索装置
JP2005122665A (ja) 電子機器装置、関連語データベースの更新方法、プログラム
JP2007233752A (ja) 検索装置、コンピュータプログラム及び記録媒体
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121009

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5199168

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350