JP2010186214A - Retrieval device - Google Patents

Retrieval device Download PDF

Info

Publication number
JP2010186214A
JP2010186214A JP2009028129A JP2009028129A JP2010186214A JP 2010186214 A JP2010186214 A JP 2010186214A JP 2009028129 A JP2009028129 A JP 2009028129A JP 2009028129 A JP2009028129 A JP 2009028129A JP 2010186214 A JP2010186214 A JP 2010186214A
Authority
JP
Japan
Prior art keywords
search
search result
search engine
engine
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009028129A
Other languages
Japanese (ja)
Other versions
JP5010624B2 (en
Inventor
Stejic Zoran
ゾラン ステイチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009028129A priority Critical patent/JP5010624B2/en
Publication of JP2010186214A publication Critical patent/JP2010186214A/en
Application granted granted Critical
Publication of JP5010624B2 publication Critical patent/JP5010624B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a retrieval method for achieving highly precise retrieval while suppressing the load of an operation in a user. <P>SOLUTION: A query accepting part 11 accepts a query for retrieval, and transmits it to a first retrieval engine 41 and second retrieval engines 42 to 44. The first retrieval engine 41 obtains a first retrieval result on the basis of the query, and the second retrieval engines 42 to 44 obtain a second retrieval result on the basis of the query. A ranking adjusting part 13 changes the ranking of the first retrieval result on the basis of the similarity of the first retrieval result and the second retrieval result. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、クエリに関連するデータを検索する技術に関するものである。特に、本発明は、Web検索に適した検索技術に関するものである。   The present invention relates to a technique for retrieving data related to a query. In particular, the present invention relates to a search technique suitable for Web search.

下記特許文献1には、クエリを用いたWeb検索技術が開示されている。この技術では、クローリングと呼ばれる手法により、予め、Web内に存在する各種の文書(一般にはテキストや画像を含む)が取得され、データベース中に蓄積される。蓄積時には、検索の容易性を考慮した索引付けが行われる。   Patent Document 1 below discloses a Web search technique using a query. In this technique, various types of documents (generally including text and images) existing in the Web are acquired in advance by a technique called crawling and stored in a database. At the time of accumulation, indexing considering the ease of search is performed.

この技術において、ユーザがユーザ端末にクエリを入力すると、検索エンジンは、クエリに基づいて、データベース内を検索し、類似するWeb文書を検索結果としてユーザ端末に返す。   In this technique, when a user inputs a query to the user terminal, the search engine searches the database based on the query and returns a similar Web document to the user terminal as a search result.

さらに、この技術では、一つのクエリに基づいて、異なるカテゴリー(例えばニュース、ディスカッション・グループ、イメージなど)におけるそれぞれの検索結果を取得する。そして、それぞれのカテゴリーにおける検索結果をユーザに提示する。   Further, in this technique, search results in different categories (for example, news, discussion groups, images, etc.) are acquired based on one query. Then, the search result in each category is presented to the user.

この技術においては、ユーザは、興味のあるカテゴリーを指定することにより、当該カテゴリーに属する検索結果にアクセスすることができる。しかしながら、この技術は、各カテゴリーにおける検索結果を統合して表示するものではない。   In this technique, the user can access search results belonging to the category by specifying the category of interest. However, this technology does not display search results in each category in an integrated manner.

一方、下記特許文献2には、複合メディア文書をクエリとして検索を行う技術が記載されている。この技術では、ユーザが指定した複合メディア文書(テキストや画像を含む文書)から特徴を自動的に抽出し、抽出された特徴をキーにしてデータベースを検索する。データベース中に、検索対象となる複合メディア文書と、そこから抽出された特徴とを対応して事前に記録しておくことによって、クエリに類似した複合メディア文書を取得する。   On the other hand, Patent Literature 2 below describes a technique for performing a search using a composite media document as a query. In this technique, features are automatically extracted from a composite media document (a document including text and images) designated by a user, and a database is searched using the extracted features as a key. A composite media document similar to the query is acquired by previously recording in the database the composite media document to be searched and the features extracted therefrom.

しかしながら、様々な情報を持つ複合メディア文書から検索キーを自動的に抽出すると、検索ノイズが増える傾向がある。このため、この技術を実装する場合は、検索ノイズを抑えるための工夫が必要になると考えられる。   However, if a search key is automatically extracted from a composite media document having various information, search noise tends to increase. For this reason, when implementing this technique, it is considered that a device for suppressing search noise is required.

また、一般的なウェブ検索では、文字列が検索キーとして入力される。しかしながら、特許文献2の技術では、各種コンテンツを含む複合メディア文書を検索キーとして入力しなければならない。すると、ユーザは、検索しようとしている文書に類似する複合メディア文書を用意しなければ検索ができず、検索作業が煩雑になる。また、このような複合メディア文書を検索キーとして受け付ける検索装置は、クエリの形態が著しく制約されるために、汎用性に欠ける。   In a general web search, a character string is input as a search key. However, in the technique of Patent Document 2, a composite media document including various contents must be input as a search key. Then, the user cannot perform a search unless preparing a composite media document similar to the document to be searched, and the search operation becomes complicated. Also, a search apparatus that accepts such a composite media document as a search key lacks versatility because the form of the query is significantly restricted.

特表2007−517317号公報(段落0039及び0040)JP-T-2007-517317 (paragraphs 0039 and 0040) 特開2000−148793号公報JP 2000-148793 A

本発明は、前記の状況に鑑みてなされたものである。本発明の目的の一つはユーザにおける操作の負担を低く抑えつつ、ユーザの検索意図に沿った高精度の検索が可能になる検索装置ないし手法を提供することである。   The present invention has been made in view of the above situation. One of the objects of the present invention is to provide a search device or method that enables high-precision search in accordance with a user's search intention while keeping the operation burden on the user low.

本発明は、以下のいずれかの項目に記載の構成とされている。   The present invention is configured as described in any of the following items.

(項目1)
クエリ受付部と、検索結果取得部と、ランキング調整部と、検索結果出力部とを備えており、
前記クエリ受付部は、ユーザ端末から送られた、検索のためのクエリを受け付けて、第1検索エンジンと、第2検索エンジンとにそれぞれ送る構成となっており、
前記第1検索エンジンは、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成する構成となっており、
前記第2検索エンジンは、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成する構成となっており、
前記マルチメディアデータには、画像又は音声が含まれており、
前記検索結果取得部は、前記第1検索エンジンにおける前記第1検索結果と、前記第2検索エンジンにおける前記第2検索結果とをそれぞれ取得する構成となっており、
前記ランキング調整部は、前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出する処理と、算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっており、
前記検索結果出力部は、前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成する処理と、前記表示用文書を前記ユーザ端末に向けて出力する処理とを行う構成となっている
ことを特徴とする検索装置。
(Item 1)
A query reception unit, a search result acquisition unit, a ranking adjustment unit, and a search result output unit;
The query reception unit is configured to receive a query for search sent from a user terminal and send the query to the first search engine and the second search engine, respectively.
The first search engine is configured to generate a ranked first search result by searching a Web document based on the query.
The second search engine is configured to generate a second search result by searching multimedia data based on the query.
The multimedia data includes an image or sound,
The search result acquisition unit is configured to acquire the first search result in the first search engine and the second search result in the second search engine, respectively.
The ranking adjustment unit is configured to calculate a similarity between the first search result from the first search engine and the second search result from the second search engine, and to calculate the similarity according to the calculated similarity. It is configured to perform processing for generating a third search result by changing the ranking in one search result,
The search result output unit displays the first search result ranked by the first search engine in parallel with the third search result whose ranking has been changed by the ranking adjustment unit. A search apparatus comprising: a process for generating a display document; and a process for outputting the display document to the user terminal.

この発明によれば、第1検索エンジンによる第1検索結果に対して、第2検索エンジンによる第2検索結果を用いてランク付けを行うことができる。これにより、この発明では、検索精度の向上が期待でき、しかも、操作者への負担を低く抑えることが可能になる。なお、第2検索エンジンが複数存在することは可能である。   According to the present invention, the first search result obtained by the first search engine can be ranked using the second search result obtained by the second search engine. Thereby, in this invention, the improvement of search accuracy can be expected, and the burden on the operator can be kept low. There can be a plurality of second search engines.

(項目2)
前記第2検索エンジンが複数存在しており、
前記ランキング調整部は、
前記第1検索エンジンによる前記第1検索結果と、前記複数の第2検索エンジンによる複数の前記第2検索結果とのそれぞれの類似度を統合し、かつ、統合された類似度に基づいて前記のランク付けを行う構成となっている
項目1に記載の検索装置。
(Item 2)
A plurality of the second search engines exist,
The ranking adjustment unit
Integrating respective similarities between the first search result by the first search engine and the plurality of second search results by the plurality of second search engines, and based on the integrated similarity The search device according to item 1, wherein the search device is configured to perform ranking.

(項目3)
前記第2検索エンジンは、画像検索エンジン、動画検索エンジン及び商品検索エンジンのいずれか、又は、これらの組み合わせである
項目1又は2に記載の検索装置。
(Item 3)
The search device according to item 1 or 2, wherein the second search engine is any one of an image search engine, a video search engine, and a product search engine, or a combination thereof.

(項目4)
前記ランキング調整部は、
前記第1検索エンジンによる検索結果に含まれるコンテンツの種類に応じて、前記第2検索エンジンによる前記第2検索結果を参照する処理と、
前記第2検索エンジンによる前記第2検索結果との類似度が高い場合に、前記前記第1検索エンジンによる前記第1検索結果のランクを高くする処理と
を行う構成となっている
項目1〜3のいずれか1項に記載の検索装置。
(Item 4)
The ranking adjustment unit
A process of referring to the second search result by the second search engine according to the type of content included in the search result by the first search engine;
When the degree of similarity with the second search result by the second search engine is high, the processing for increasing the rank of the first search result by the first search engine is performed. The search device according to any one of the above.

(項目5)
前記第1検索エンジンによる検索結果には、テキスト、画像及び音声のいずれか又はこれらの組み合わせが含まれている
項目1〜4のいずれか1項に記載の検索装置。
(Item 5)
The search device according to any one of items 1 to 4, wherein the search result by the first search engine includes any one of text, image, and sound, or a combination thereof.

(項目6)
第1検索エンジンと、第2検索エンジンとが、検索のための共通のクエリを受け取るステップと;
前記第1検索エンジンが、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成するステップと;
前記第2検索エンジンが、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成するステップと、
ここで、前記マルチメディアデータには、画像又は音声が含まれており;
前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出するステップと;
算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成するステップと;
前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成するステップと;
前記表示用文書をユーザ端末に向けて出力するステップと を備えたことを特徴とする検索方法。
(Item 6)
A first search engine and a second search engine receiving a common query for search;
The first search engine generating a ranked first search result by searching a web document based on the query;
The second search engine generates a second search result by searching multimedia data based on the query;
Wherein the multimedia data includes images or sounds;
Calculating a similarity between the first search result obtained by the first search engine and the second search result obtained by the second search engine;
Generating a third search result by changing the ranking in the first search result according to the calculated similarity;
Generating a display document for displaying in parallel the first search result ranked by the first search engine and the third search result whose ranking has been changed by the ranking adjustment unit. When;
And a step of outputting the display document to a user terminal.

(項目7)
項目6に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。
(Item 7)
A computer program that causes a computer to execute the steps according to item 6.

このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。   This computer program is stored in an appropriate recording medium (for example, an optical recording medium such as a CD-ROM or a DVD disk, a magnetic recording medium such as a hard disk or a flexible disk, or a magneto-optical recording medium such as an MO disk). Can be stored. This computer program can be transmitted via a communication line such as the Internet.

本発明によれば、ユーザにおける操作の負担を低く抑えつつ、高精度の検索が可能になる検索装置ないし手法を提供することである。   According to the present invention, it is an object of the present invention to provide a search device or method that enables high-precision search while keeping a burden of operation on a user low.

本発明の一実施形態に係る検索装置の基本的な構成を示すブロック図である。It is a block diagram which shows the basic composition of the search device which concerns on one Embodiment of this invention. 図1の検索装置における基本的な動作を説明するためのフローチャートである。3 is a flowchart for explaining a basic operation in the search device of FIG. 1. 図1の検索装置における基本的な動作を説明するための説明図である。It is explanatory drawing for demonstrating the basic operation | movement in the search device of FIG. 図1の検索装置におけるランキング手法を説明するためのフローチャートである。It is a flowchart for demonstrating the ranking method in the search device of FIG. 図1の検索装置におけるランキング手法を説明するための説明図である。It is explanatory drawing for demonstrating the ranking method in the search device of FIG. 図1の検索装置におけるランキング手法を説明するための説明図である。It is explanatory drawing for demonstrating the ranking method in the search device of FIG. 図1の検索装置におけるランキング手法を説明するための説明図である。図(a)は、Web検索エンジンによる検索結果を示す。図(b)は、再ランキングされた検索結果を示す。It is explanatory drawing for demonstrating the ranking method in the search device of FIG. FIG. (A) shows a search result by the Web search engine. Figure (b) shows the reranked search results. マルチメディア類似度の計算に関する変形例1を説明するための説明図である。It is explanatory drawing for demonstrating the modification 1 regarding calculation of a multimedia similarity. マルチメディア類似度の計算に関する変形例2を説明するための説明図である。It is explanatory drawing for demonstrating the modification 2 regarding calculation of a multimedia similarity.

(本実施形態の装置構成)
本発明の一実施形態に係る検索装置を、添付の図面に基づいて説明する。本実施形態の装置は、クエリを用いてWeb検索を行うものである。
(Device configuration of this embodiment)
A search device according to an embodiment of the present invention will be described with reference to the accompanying drawings. The apparatus according to the present embodiment performs a Web search using a query.

本実施形態の検索装置は、検索仲介サーバ1として実装されている(図1参照)。検索仲介サーバ1は、クエリ受付部11と、検索結果取得部12と、ランキング調整部13と、検索結果出力部14とを備えている。   The search device of this embodiment is implemented as a search mediation server 1 (see FIG. 1). The search mediation server 1 includes a query reception unit 11, a search result acquisition unit 12, a ranking adjustment unit 13, and a search result output unit 14.

また、検索仲介サーバ1は、インターネット2に接続されている。また、インターネット2には、検索仲介サーバ1にクエリを送るためのユーザ端末3と、検索を実行するための検索実行サーバ4とがさらに接続されている。なお、インターネット以外のネットワークにより、これらの各ノードを接続することも可能である。   The search mediation server 1 is connected to the Internet 2. Further, a user terminal 3 for sending a query to the search mediation server 1 and a search execution server 4 for executing a search are further connected to the Internet 2. These nodes can be connected by a network other than the Internet.

(検索仲介サーバ1の説明)
検索仲介サーバ1のクエリ受付部11は、ユーザ端末3から送られた、検索のためのクエリを受け付けて、後述する第1検索エンジン(Web検索エンジン)と、第2検索エンジン(他の検索エンジン)とにそれぞれ送る構成となっている。第1検索エンジンは、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成する構成となっている。また、第2検索エンジンは、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成する構成となっている。これらの検索エンジンの詳細は、本実施形態の動作として追って詳しく説明する。なお、本実施形態におけるマルチメディアデータは、画像又は音声が含まれたものとなっている。
(Description of search mediation server 1)
The query acceptance unit 11 of the search mediation server 1 accepts a query for search sent from the user terminal 3, and a first search engine (Web search engine) and a second search engine (other search engines) to be described later. ) And send to each. The first search engine is configured to generate a ranked first search result by searching a Web document based on the query. The second search engine is configured to generate a second search result by searching multimedia data based on the query. Details of these search engines will be described in detail later as operations of the present embodiment. Note that the multimedia data in the present embodiment includes images or sounds.

検索結果取得部12は、第1検索エンジンにおける第1検索結果と、第2検索エンジンにおける第2検索結果とをそれぞれ取得する構成となっている。この検索結果取得部12についても追って詳しく説明する。   The search result acquisition unit 12 is configured to acquire a first search result in the first search engine and a second search result in the second search engine, respectively. The search result acquisition unit 12 will be described in detail later.

ランキング調整部13は、第1検索エンジンによる第1検索結果と、第2検索エンジンによる前記第2検索結果との類似度を算出する処理と、算出された類似度によって、第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっている。これについても追って詳しく説明する。   The ranking adjustment unit 13 calculates the rank in the first search result based on the process of calculating the similarity between the first search result by the first search engine and the second search result by the second search engine, and the calculated similarity. By changing the attachment, the third search result is generated. This will be described in detail later.

検索結果出力部14は、第1検索エンジンによるランク付けがされた第1検索結果と、ランキング調整部によってランク付けが変更された第3検索結果とを並列に表示するための、表示用文書を生成する処理と、表示用文書をユーザ端末3に向けて出力する処理とを行う構成となっている。   The search result output unit 14 displays a display document for displaying in parallel the first search result ranked by the first search engine and the third search result whose ranking has been changed by the ranking adjustment unit. The process of generating and the process of outputting the display document to the user terminal 3 are performed.

(ユーザ端末3の説明)
ユーザ端末3は、ユーザによるクエリの入力を受け付け、入力されたクエリを検索サーバ1に送るためのものである。
(Description of user terminal 3)
The user terminal 3 is for receiving an input of a query by a user and sending the input query to the search server 1.

ユーザ端末3は、端末本体31と、入力部32と、表示部33とを備えている。   The user terminal 3 includes a terminal main body 31, an input unit 32, and a display unit 33.

端末本体31は、CPU、ネットワーク・インタフェース、入出力インタフェースなどを備えており、ユーザ端末3の動作を制御できるようになっている。このような端末本体31としては、通常のパーソナルコンピュータを用いることができる。   The terminal body 31 includes a CPU, a network interface, an input / output interface, and the like, and can control the operation of the user terminal 3. As such a terminal body 31, a normal personal computer can be used.

入力部32は、端末本体31に対してユーザが指令を入力するための部分である。入力部32としては、例えばキーボードやマウスを用いることができる。本実施形態においては、ユーザは、入力部32を使ってクエリを入力することができる。   The input unit 32 is a part for a user to input a command to the terminal main body 31. For example, a keyboard or a mouse can be used as the input unit 32. In the present embodiment, the user can input a query using the input unit 32.

表示部33は、検索仲介サーバ1から返された検索結果(すなわち表示用文書)をユーザに表示できるようになっている。表示部33としては、例えば、各種のディスプレイやプリンタを使用することができる。   The display unit 33 can display the search result (that is, the display document) returned from the search mediation server 1 to the user. As the display unit 33, for example, various displays and printers can be used.

(検索実行サーバの説明)
検索実行サーバ4は、Web検索エンジン41と、画像検索エンジン42と、動画検索エンジン43と、商品検索エンジン44とを備えている。各検索エンジン41〜44は、与えられたクエリに基づいて、検索結果をそれぞれ取得する構成となっている。
(Description of search execution server)
The search execution server 4 includes a Web search engine 41, an image search engine 42, a moving image search engine 43, and a product search engine 44. Each of the search engines 41 to 44 is configured to acquire a search result based on a given query.

Web検索エンジン12は、Web文書の検索を行うものである。Web検索エンジンの具体例としては、Yahoo(登録商標)検索がある。Web検索の一例としては、データベース中に、インデックスが付されたWeb文書を蓄積しておき、クエリとインデックスとの類似度に基づいて、Web文書を検索するものがある。インデックスの例は、Web文書から抽出されたテキストである。   The Web search engine 12 searches for Web documents. A specific example of the Web search engine is Yahoo (registered trademark) search. As an example of Web search, there is a method in which Web documents with indexes are accumulated in a database, and Web documents are searched based on the similarity between a query and an index. An example of an index is text extracted from a Web document.

画像検索エンジン42は、インターネット上にある画像を検索するものである。その具体例としては、Yahoo(登録商標)画像検索がある。画像検索の一例としては、データベース中に、インデックスが付された画像を蓄積しておき、クエリと画像との類似度に基づいて、画像を検索するものがある。インデックスの例は、画像の特徴を表す文言(いわゆるタグないしラベル)である。ただし、画像の特徴量を用いて蓄積画像を検索することも可能である。   The image search engine 42 searches for images on the Internet. A specific example is Yahoo (registered trademark) image search. As an example of the image search, there is a method in which an indexed image is stored in a database and the image is searched based on the similarity between the query and the image. An example of the index is a word (so-called tag or label) representing the feature of the image. However, the stored image can be searched using the feature amount of the image.

動画検索エンジン43は、インターネット上にある動画を検索するものである。その具体例としては、Yahoo(登録商標)動画検索がある。動画検索の一例としては、データベース中に、インデックスが付された動画を蓄積しておき、クエリと動画との類似度に基づいて、動画を検索するものがある。インデックスの例は、動画の特徴を表す文言(いわゆるタグないしラベル)である。ただし、動画を構成する画像や音声の特徴量を用いて蓄積動画を検索することも可能である。   The video search engine 43 searches for videos on the Internet. A specific example is Yahoo (registered trademark) video search. As an example of the moving image search, there is a method in which a moving image with an index is accumulated in a database and the moving image is searched based on the similarity between the query and the moving image. An example of the index is a word (so-called tag or label) representing the feature of the moving image. However, it is also possible to search the stored moving image using the feature amount of the image and sound constituting the moving image.

商品検索エンジン44は、インターネット上にある販売サイト上のテキスト、画像または音声のいずれかを含む情報を検索するものである。その具体例としては、Yahoo(登録商標)商品検索がある。商品検索の一例としては、データベース中に、商品販売用のWeb文書を、インデックスを付した状態で蓄積しておき、クエリとインデックスとの類似度に基づいて、商品販売用のWeb文書を検索するものがある。インデックスの例は、商品販売用のWeb文書から抽出されたテキストである。ただし、商品検索エンジンとしては、商品販売用のWeb文書に含まれる画像や音声情報に基づく検索を行うものであってもよい。   The product search engine 44 searches for information including any of text, images, and sounds on a sales site on the Internet. A specific example is Yahoo (registered trademark) product search. As an example of product search, Web documents for product sales are stored in an indexed state in a database, and Web products for product sales are searched based on the similarity between the query and the index. There is something. An example of the index is text extracted from a Web document for sale of merchandise. However, the product search engine may perform a search based on image or audio information included in a Web document for product sales.

各検索エンジン41〜44は、それぞれ、検索対象となるデータを格納したデータベース411〜441を備えている。各データベース411〜441には、予めインターネット上をクローリングすることによって収集されたデータが格納されている。あるいは、各データベース411〜441には、サービス提供者によって収集されたデータが格納されている。また、各データベース411〜441に格納されたデータには、効率的な検索を行うための索引が付されている。例えば、テキストをクエリとする場合、画像検索用のラベルを、当該画像に対応させた状態で、データベースに登録することが一般に行われている。同様に、検索対象が動画や音声である場合も、このようなラベル付けを行うことができる。このようなデータベース411〜441の構成は、従来の検索エンジンにおけるものと同様でよいので、これ以上詳しい説明は省略する。本実施形態では、Web検索エンジン41が第1検索エンジンの例に相当し、他の検索エンジン42〜44が第2検索エンジンの例に相当している。   Each of the search engines 41 to 44 includes databases 411 to 441 that store data to be searched. Each database 411 to 441 stores data collected by crawling on the Internet in advance. Alternatively, each database 411 to 441 stores data collected by the service provider. The data stored in each of the databases 411 to 441 is provided with an index for performing an efficient search. For example, when text is used as a query, an image search label is generally registered in a database in a state corresponding to the image. Similarly, such labeling can be performed when the search target is a moving image or audio. Since the configuration of such databases 411 to 441 may be the same as that in a conventional search engine, detailed description thereof is omitted. In the present embodiment, the Web search engine 41 corresponds to an example of a first search engine, and the other search engines 42 to 44 correspond to an example of a second search engine.

(ランキング調整部13)
ランキング調整部13は、Web検索エンジン41による第1検索結果に対して、他の検索エンジン42〜44による第2検索結果との類似度によって、第1検索結果におけるランク付けを変更する構成となっている。ランク付けが変更された結果が、本発明における第3検索結果の例に相当する。このようにして、この実施形態では、第1検索エンジンによる第1検索結果と、第2検索エンジンによる第2検索結果との類似度を算出する処理と、算出された類似度によって、第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっている。
(Ranking adjuster 13)
The ranking adjustment unit 13 is configured to change the ranking in the first search result with respect to the first search result by the Web search engine 41 according to the similarity with the second search result by the other search engines 42 to 44. ing. The result of changing the ranking corresponds to an example of the third search result in the present invention. In this way, in this embodiment, the first search is performed based on the process of calculating the similarity between the first search result by the first search engine and the second search result by the second search engine, and the calculated similarity. By changing the ranking in the results, the third search result is generated.

ランキング調整部13についてのさらに詳しい動作は後述する。   More detailed operation of the ranking adjustment unit 13 will be described later.

(本実施形態の動作)
ついで、本実施形態に係る検索仲介サーバ1の動作について、図2及び図3を主に参照しながら説明する。
(Operation of this embodiment)
Next, the operation of the search mediation server 1 according to the present embodiment will be described with reference mainly to FIG. 2 and FIG.

(図2のステップSA−1)
まず、ユーザは、ユーザ端末3の入力部32を用いて、クエリを入力する。クエリとしては、この実施形態では、テキストが用いられている。ユーザ端末3で入力されたクエリは、インターネット2を介して、検索仲介サーバ1のクエリ受付部11に送られる(図3のステップSB−1)。
(Step SA-1 in FIG. 2)
First, the user inputs a query using the input unit 32 of the user terminal 3. In this embodiment, text is used as the query. The query input at the user terminal 3 is sent to the query reception unit 11 of the search mediation server 1 via the Internet 2 (step SB-1 in FIG. 3).

(図2のステップSA−2)
ついで、クエリ受付部11は、検索実行サーバ4の各検索エンジン41〜44にクエリを送る。
(Step SA-2 in FIG. 2)
Next, the query receiving unit 11 sends a query to each search engine 41 to 44 of the search execution server 4.

(図2のステップSA−3)
クエリを受け取った各検索エンジン41〜44は、それぞれの検索アルゴリズムに従って、検索結果を取得する(図3のステップSB−2及びSB−3)。各検索エンジンにおける検索処理は、従来の検索エンジンと同様でよいので、詳しい説明は省略する。
(Step SA-3 in FIG. 2)
The search engines 41 to 44 that have received the query acquire search results according to their search algorithms (steps SB-2 and SB-3 in FIG. 3). Since the search processing in each search engine may be the same as that of a conventional search engine, detailed description is omitted.

これにより、各検索エンジン41〜44における検索に対応して、検索結果のリストを取得することができる。この実施形態では、Web検索エンジン41による検索結果を第1検索結果、他の検索エンジン42〜44による検索結果を第2検索結果と称している。各検索結果は、インターネット2を介して、検索仲介サーバ1の検索結果取得部12に送られる。   Thereby, a list of search results can be acquired corresponding to the search in each of the search engines 41 to 44. In this embodiment, a search result by the Web search engine 41 is referred to as a first search result, and a search result by the other search engines 42 to 44 is referred to as a second search result. Each search result is sent to the search result acquisition unit 12 of the search mediation server 1 via the Internet 2.

(図2のステップSA−4)
検索結果取得部12は、前記の第1検索結果及び第2検索結果を取得した後、これらの検索結果を、ランキング調整部13に送る。ついで、ランキング調整部13は、Web検索エンジン41による第1検索結果に対するランキングを調整する(図3のステップSB−4)。なお、この調整を、「再ランキング」と呼ぶことがある。
(Step SA-4 in FIG. 2)
After acquiring the first search result and the second search result, the search result acquisition unit 12 sends these search results to the ranking adjustment unit 13. Next, the ranking adjustment unit 13 adjusts the ranking for the first search result by the Web search engine 41 (step SB-4 in FIG. 3). This adjustment may be referred to as “re-ranking”.

再ランキングの詳しい手順を、図4〜図7に基づいて、さらに詳しく説明する。   The detailed reranking procedure will be described in more detail with reference to FIGS.

(図4のステップSC−1)
まず、Web検索エンジン41による第1検索結果と、他の検索エンジン42〜44による第2検索結果とのマルチメディア類似度を計算する。
(Step SC-1 in FIG. 4)
First, the multimedia similarity between the first search result by the Web search engine 41 and the second search results by the other search engines 42 to 44 is calculated.

図5には、Web検索エンジン41による第1検索結果のリスト(図(a))と、画像検索エンジン42による第2検索結果のリスト(図(b))と、動画検索エンジン43による第2検索結果のリスト(図(c))と、商品検索エンジン44による第2検索結果のリスト(図(d))とを示している。   FIG. 5 shows a list of first search results by the Web search engine 41 (FIG. 5A), a list of second search results by the image search engine 42 (FIG. 5B), and a second list by the video search engine 43. A list of search results (FIG. (C)) and a list of second search results by the product search engine 44 (FIG. (D)) are shown.

各検索結果のリストでは、図5に示されたように、各検索エンジンのアルゴリズムに従って、ランク付けが行われている。図5では、上位N件(Nは任意の自然数)の検索結果が示されている。Nの値は、各検索エンジンにおいて異なっていても良いし、同じでもよい。   In each search result list, as shown in FIG. 5, ranking is performed according to the algorithm of each search engine. FIG. 5 shows search results for the top N items (N is an arbitrary natural number). The value of N may be different or the same for each search engine.

図5の例では、Web検索エンジンによる第1順位の検索結果(いわゆるWeb文書)には、一つのテキストと、二つの画像が含まれている。第2順位の検索結果(いわゆるWeb文書)には、二つの動画と一つのテキストが含まれている。   In the example of FIG. 5, the first order search result (so-called Web document) by the Web search engine includes one text and two images. The second ranking search result (so-called Web document) includes two moving images and one text.

ここで、Web検索エンジン41による検索リストのうちの一項目が、図6(a)に示されるように、二つの画像と一つの動画をコンテンツとして含むとする。この場合は、含まれるコンテンツに対応して、画像検索エンジン42による検索結果(図6(b))と、動画検索エンジン43による検索結果(図6(c))とが参照される。以下、詳しく説明する。   Here, it is assumed that one item in the search list by the Web search engine 41 includes two images and one moving image as contents, as shown in FIG. In this case, the search result by the image search engine 42 (FIG. 6B) and the search result by the moving image search engine 43 (FIG. 6C) are referred to corresponding to the included content. This will be described in detail below.

まず、画像については、Web検索エンジン41による検索結果に含まれる画像と、画像検索エンジン42による検索結果としての画像との類似度を算出する(図6(d))。具体的には、この実施形態では、Web検索結果におけるそれぞれの画像と、画像検索結果におけるそれぞれの画像との類似度を計算する。そして、得られた最大類似度の平均を、画像類似度として用いる。   First, for the image, the similarity between the image included in the search result by the Web search engine 41 and the image as the search result by the image search engine 42 is calculated (FIG. 6D). Specifically, in this embodiment, the similarity between each image in the Web search result and each image in the image search result is calculated. Then, the average of the obtained maximum similarity is used as the image similarity.

すなわち、この実施形態での画像類似度は、以下のようになる。なお、ここで、Max{}は、最大値を選ぶ関数を意味し、類似度()は、類似度を算出する関数を意味する。   That is, the image similarity in this embodiment is as follows. Here, Max {} means a function for selecting the maximum value, and similarity () means a function for calculating similarity.

画像類似度=[MAX{類似度(画像A,画像1),類似度(画像A,画像2),類似度(画像A,画像3),類似度(画像A,画像4)}+MAX{類似度(画像B,画像1),類似度(画像B,画像2),類似度(画像B,画像3),類似度(画像B,画像4)}]/2。   Image similarity = [MAX {similarity (image A, image 1), similarity (image A, image 2), similarity (image A, image 3), similarity (image A, image 4)} + MAX {similarity Degree (image B, image 1), similarity (image B, image 2), similarity (image B, image 3), similarity (image B, image 4)}] / 2.

同様にして、動画類似度は、以下のようにして算出される(図6(e))。   Similarly, the moving image similarity is calculated as follows (FIG. 6E).

動画類似度=MAX{類似度(動画A,動画1),類似度(動画A,動画2)}。   Movie similarity = MAX {similarity (movie A, movie 1), similarity (movie A, movie 2)}.

なお、各類似度は、既存の計算手法で算出できる。例えば、画像データの場合は、色、形状、テクスチャーといった視覚的な特徴量を画像データから抽出し、類似度を計算する手法が一般的であ。よって、類似度の計算手法についての詳しい説明は省略する(参考文献:"Content-based Multimedia Information Retrieval: State of the Art and Challenges", ACM Transactions on Multimedia Computing, Communications, and Applications, 2(1):1-19, Feb. 2006.)。なお、各類似度の値は、各メディア(例えばテキストや画像などの種類別)での最大類似度に対して正規化されていることが好ましい。   Each similarity can be calculated by an existing calculation method. For example, in the case of image data, a technique of extracting visual feature amounts such as color, shape, and texture from image data and calculating a similarity is common. Therefore, a detailed description of the similarity calculation method is omitted (reference: "Content-based Multimedia Information Retrieval: State of the Art and Challenges", ACM Transactions on Multimedia Computing, Communications, and Applications, 2 (1): 1-19, Feb. 2006.). Each similarity value is preferably normalized with respect to the maximum similarity in each medium (for example, by text or image type).

そして、本実施形態では、マルチメディア類似度を以下のようにして算出する。   In this embodiment, the multimedia similarity is calculated as follows.

マルチメディア類似度=(画像類似度+動画類似度)/2。   Multimedia similarity = (image similarity + moving image similarity) / 2.

つまり、マルチメディア類似度は、得られた各類似度の平均として算出される。このようなマルチメディア類似度の計算を、Web検索エンジンによる各検索結果について行う。検索された項目の中に音声やテキストが含まれる場合も、同様にしてマルチメディア類似度を計算することができる。   That is, the multimedia similarity is calculated as an average of the obtained similarities. Such multimedia similarity calculation is performed for each search result by the Web search engine. Even when speech or text is included in the searched items, the multimedia similarity can be calculated in the same manner.

(図4のステップSC−2)
ついで、ランキング調整部13は、得られたマルチメディア類似度に基づいて、Web検索エンジン41による第1検索結果のランキングを並べ替える。並び替える前の状態を図7(a)に示し、並び替えた後の状態を図7(b)に示す。ランキングを並べ替えた状態は、本発明における第3検索結果に相当する。
(Step SC-2 in FIG. 4)
Next, the ranking adjustment unit 13 rearranges the rankings of the first search results by the Web search engine 41 based on the obtained multimedia similarity. FIG. 7A shows a state before rearrangement, and FIG. 7B shows a state after rearrangement. The state in which the rankings are rearranged corresponds to the third search result in the present invention.

このような処理は、
「ランキング調整部が、第1検索エンジンによる第1検索結果と、第2検索エンジンによる第2検索結果との類似度を算出する処理と、算出された類似度によって、第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成」
の一例に相当する。
Such processing is
“The ranking adjustment unit ranks the first search result according to the process of calculating the similarity between the first search result by the first search engine and the second search result by the second search engine, and the calculated similarity. The process of generating the third search result by changing
It corresponds to an example.

(図2のステップSA−5)
ついで、検索仲介サーバ1における検索結果出力部14は、Web検索エンジン41によるランク付けがされた第1検索結果と、ランキング調整部13によってランク付けが変更された第3検索結果とを並列に表示するための、表示用文書を生成する。表示用文書の生成例が図7に示されている。図7では、図(a)の部分が、第1検索結果に相当し、図(b)の部分が、第3検索結果に相当している。なお、表示用文書には、各項目を取得した元のWebサイトにアクセスするためのリンクやURL(図示せず)を表示することが好ましい。
(Step SA-5 in FIG. 2)
Next, the search result output unit 14 in the search mediation server 1 displays in parallel the first search result ranked by the Web search engine 41 and the third search result whose ranking has been changed by the ranking adjustment unit 13. A display document is generated for this purpose. An example of generating a display document is shown in FIG. In FIG. 7, the part of FIG. 7A corresponds to the first search result, and the part of FIG. 7B corresponds to the third search result. The display document preferably displays a link or URL (not shown) for accessing the original Web site from which each item was acquired.

このように第1検索結果と第3検索結果とを並列して表示することで、ユーザは、検索結果を容易に理解することができる。また、第3検索結果が第1検索結果と対に表示されることで、検索結果がURLやタイトル等で一覧表示された場合に、クエリに関連した画像や音声、動画が含まれてランキングが変動したWebサイトの確認が容易になる。   Thus, by displaying the first search result and the third search result in parallel, the user can easily understand the search result. In addition, since the third search result is displayed in a pair with the first search result, when the search result is displayed as a list by URL, title, or the like, the ranking includes the images, sounds, and videos related to the query. It is easy to check the changed website.

さらに、検索結果出力部14は、生成した表示用文書をユーザ端末3に向けて出力する。ユーザ端末3では、ブラウザなどの適宜なソフトウエアにより、検索仲介サーバ1から送られた表示用文書(つまり検索結果)を表示する。ユーザは、検索結果に付されたURLをクリックするなどの適宜な手段により、所望の情報にアクセスすることができる。   Further, the search result output unit 14 outputs the generated display document toward the user terminal 3. The user terminal 3 displays the display document (that is, the search result) sent from the search mediation server 1 by appropriate software such as a browser. The user can access desired information by an appropriate means such as clicking a URL attached to the search result.

本実施形態では、クエリを各検索エンジンに展開し、同じクエリを用いて、Web検索エンジンによる第1検索結果と、他の検索エンジンによる第2検索結果との類似度に基づいて、出力用の第3検索結果の順位を決定している。しかも、第1検索結果に含まれるマルチメディアデータと、第2検索結果に含まれるマルチメディアデータとの類似度を考慮して、第3検索結果のランキングを調整している。このため、本実施形態によれば、ユーザの検索意図に沿った、精度の良い検索結果を、検索ノイズを低く抑えつつ、取得することができる。   In this embodiment, the query is expanded to each search engine, and the same query is used for output based on the similarity between the first search result by the Web search engine and the second search result by another search engine. The ranking of the third search result is determined. In addition, the ranking of the third search result is adjusted in consideration of the similarity between the multimedia data included in the first search result and the multimedia data included in the second search result. For this reason, according to the present embodiment, it is possible to acquire an accurate search result according to the user's search intention while suppressing search noise to a low level.

また、本実施形態では、クエリを自動的に検索エンジンに展開し、さらに、検索結果の統合も自動的に行うことができるので、ユーザにおける操作の負担を低く抑えることができるという利点もある。   Further, in the present embodiment, the query can be automatically developed in the search engine, and the search results can be automatically integrated, so that there is an advantage that the operation burden on the user can be kept low.

(類似度計算における変形例1)
以下においては、マルチメディア類似度の計算における別の処理手順を、図8を参照して説明する。
(Modification 1 in similarity calculation)
In the following, another processing procedure in the calculation of the multimedia similarity will be described with reference to FIG.

(図8の(a))
まず、前記した実施形態と同様に、Web検索エンジン41による第1検索結果を取得し、その上位K件の結果をリストとしてシステム側で取得する。図示の例では、上位4件までがリストとして取得されている。
((A) of FIG. 8)
First, as in the above-described embodiment, the first search result by the Web search engine 41 is acquired, and the results of the top K items are acquired as a list on the system side. In the illustrated example, up to the top four are acquired as a list.

(図8の(b))
ついで、前記した実施形態と同様に、各検索エンジン42〜44で得た第2検索結果と第1検索結果との類似度を計算する。図8(b)の例では、画像検索結果(第2検索結果)、動画検索結果(第2検索結果)、及び商品検索結果(第2検索結果)と第1検索結果との類似度の計算例がそれぞれ示されている。この例では、第1検索結果において、対応する内容がない場合、「なし」と記載されている。例えば、Web検索結果としての項目(1)では、動画が存在しない(図8(a)参照)ので、「動画類似度」の項目には「なし」と記載されている。
((B) of FIG. 8)
Next, similar to the above-described embodiment, the similarity between the second search result obtained by each of the search engines 42 to 44 and the first search result is calculated. In the example of FIG. 8B, the similarity between the image search result (second search result), the video search result (second search result), and the product search result (second search result) and the first search result is calculated. Each example is shown. In this example, “none” is described when there is no corresponding content in the first search result. For example, in the item (1) as the Web search result, there is no moving image (see FIG. 8A), so “None” is described in the “moving image similarity” item.

(図8の(c))
ついで、各メディア(上記の例では画像・動画・商品)における類似度をランク(順位)に変換する。ここでは、最も高い類似度をランク=1、その次の類似度をランク=2とし、以下同様にランク付けを行う。類似度が「なし」の場合は、本例では、ランクを「K+1」に設定する。なお、「K」は、ウェブ検索結果リスト(つまり第1検索結果)における項目数であり、この例では、K=4である。さらに、各項目について、平均ランクを計算する(図8(c)の右端の欄を参照)。この平均ランクが、マルチメディア類似度に相当すると考えることができる。
((C) in FIG. 8)
Next, the similarity in each medium (image, moving image, product in the above example) is converted into a rank (rank). Here, the highest similarity is rank = 1, the next similarity is rank = 2, and so on. When the similarity is “none”, the rank is set to “K + 1” in this example. “K” is the number of items in the web search result list (that is, the first search result), and in this example, K = 4. Further, an average rank is calculated for each item (see the rightmost column in FIG. 8C). It can be considered that this average rank corresponds to the multimedia similarity.

(図8の(d))
ついで、Web検索結果リストにおける項目を、平均ランクの順にソートする。このソートを、ここでは再ランキングと称している。ランクが低いことは、この例では、高い類似度であることを示している。
((D) in FIG. 8)
Next, the items in the Web search result list are sorted in the order of the average rank. This sort is called re-ranking here. A low rank indicates a high similarity in this example.

このようにして再ランキングされた結果は、マルチメディア類似度に基づくランキングを表しているといえる。この手法の場合は、各メディアとの個別の類似度が高くないWeb検索結果であっても、多くのメディア(画像・動画・商品)を含むことにより、再ランキング後の検索結果リスト(つまり第3検索結果)において、上位となる傾向がある。   It can be said that the result of re-ranking in this way represents the ranking based on the multimedia similarity. In the case of this method, even if the Web search result is not high in individual similarity with each media, the search result list after re-ranking (that is, the first search result) is included by including many media (images, videos, products). (3 search results) tend to be higher.

変形例1の方法では、類似度の正規化を行わなくても、マルチメディア類似度を用いた再ランキングが可能になるという利点がある。   The method of the first modification has an advantage that re-ranking using multimedia similarity can be performed without performing normalization of similarity.

(類似度計算における変形例2)
以下において、マルチメディア類似度の計算におけるさらに別の処理手順を、図9を参照して説明する。
(Modification 2 in similarity calculation)
In the following, still another processing procedure for calculating the multimedia similarity will be described with reference to FIG.

(図9の(a))
まず、前記した変形例1と同様に、Web検索エンジン41による第1検索結果を取得し、その上位K件の結果をリストとしてシステム側で取得する。図示の例では、上位4件までがリストとして取得されている。
((A) of FIG. 9)
First, as in the first modification, the first search result by the Web search engine 41 is acquired, and the results of the top K items are acquired as a list on the system side. In the illustrated example, up to the top four are acquired as a list.

(図9の(b))
ついで、前記した変形例1と同様に、各検索エンジン42〜44で得た第2検索結果との類似度を計算する。
((B) of FIG. 9)
Next, similar to the first modification described above, the similarity with the second search result obtained by each of the search engines 42 to 44 is calculated.

(図9の(c))
ついで、前記した変形例1と同様に、各メディア(上記の例では画像・動画・商品)における類似度をランク(順位)に変換する。ただし、この変形例2では、類似度が「なし」の場合は、ランクも「なし」に設定する。さらに、各項目について、平均ランクを計算する(図9(c)の右端の欄を参照)。この平均ランクが、マルチメディア類似度に相当すると考えることができる。
((C) of FIG. 9)
Next, as in the first modification, the similarity in each medium (image, moving image, product in the above example) is converted into a rank (rank). However, in the second modification, when the similarity is “none”, the rank is also set to “none”. Further, an average rank is calculated for each item (see the rightmost column in FIG. 9C). It can be considered that this average rank corresponds to the multimedia similarity.

(図9の(d))
ついで、Web検索結果リスト(第1検索結果)における項目を、平均ランクの順にソート、すなわち再ランキングする。ランクが低いことは、高い類似度であることを示している。このようにして再ランキングされた結果は、マルチメディア類似度に基づくランキングを表しているといえる。
((D) in FIG. 9)
Next, the items in the Web search result list (first search result) are sorted in the order of the average rank, that is, reranked. A low rank indicates a high degree of similarity. It can be said that the result of re-ranking in this way represents the ranking based on the multimedia similarity.

この変形例2の手法の場合は、多くのメディアを含まなくても、あるメディアに対する類似度が高いウェブページが、再ランキング後の検索結果リスト(第3検索結果)において上位となる傾向がある。   In the case of the method of the second modification, even if many media are not included, a web page having a high similarity to a certain media tends to be higher in the search result list after re-ranking (third search result). .

変形例2の方法においても、類似度の正規化なしで、マルチメディア類似度を用いた再ランキングが可能になるという、変形例1と同様の利点がある。   The method of the second modification also has an advantage similar to that of the first modification in that re-ranking using multimedia similarity is possible without normalizing the similarity.

前記した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。   The operations of the above-described embodiments can be implemented by incorporating appropriate computer software into the computer.

なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。   The contents of the present invention are not limited to the above embodiment. In the present invention, various modifications can be made to the specific configuration within the scope of the claims.

例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。   For example, each component described above may exist as a functional block, and may not exist as independent hardware. As a mounting method, hardware or computer software may be used. Furthermore, one functional element in the present invention may be realized by a set of a plurality of functional elements, and a plurality of functional elements in the present invention may be realized by one functional element.

また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。   Moreover, the functional element may be arrange | positioned in the position physically separated. In this case, the functional elements may be connected by a network. It is also possible to realize functions or configure functional elements by grid computing.

本実施形態では、クエリとしてテキストを用いたが、検索キーとして利用できるものであれば、画像などの他のクエリを用いることが可能である。   In this embodiment, text is used as a query, but other queries such as images can be used as long as they can be used as search keys.

さらに、本実施形態では、Web検索エンジン(第1検索エンジン)以外の第2検索エンジンとして、画像、動画及び商品についての検索エンジンを用いたが、これに代えて、あるいはこれに追加して、音楽、ニュース、ブログ、地図など、他のメディアについての検索エンジンを用いることも可能である。   Furthermore, in the present embodiment, a search engine for images, moving images, and products is used as the second search engine other than the Web search engine (first search engine), but instead of or in addition to this, Search engines for other media such as music, news, blogs and maps can also be used.

1 検索仲介サーバ(検索装置)
11 クエリ受付部
12 検索結果取得部
13 ランキング調整部
14 検索結果出力部
3 ユーザ端末
31 端末本体
32 入力部
33 表示部
4 検索実行サーバ
41 Web検索エンジン(第1検索エンジン)
42 画像検索エンジン(第2検索エンジン)
43 動画検索エンジン(第2検索エンジン)
44 商品検索エンジン(第2検索エンジン)
1 Search mediation server (search device)
DESCRIPTION OF SYMBOLS 11 Query reception part 12 Search result acquisition part 13 Ranking adjustment part 14 Search result output part 3 User terminal 31 Terminal main body 32 Input part 33 Display part 4 Search execution server 41 Web search engine (1st search engine)
42 Image search engine (second search engine)
43 Video search engine (second search engine)
44 Product search engine (second search engine)

Claims (7)

クエリ受付部と、検索結果取得部と、ランキング調整部と、検索結果出力部とを備えており、
前記クエリ受付部は、ユーザ端末から送られた、検索のためのクエリを受け付けて、第1検索エンジンと、第2検索エンジンとにそれぞれ送る構成となっており、
前記第1検索エンジンは、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成する構成となっており、
前記第2検索エンジンは、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成する構成となっており、
前記マルチメディアデータには、画像又は音声が含まれており、
前記検索結果取得部は、前記第1検索エンジンにおける前記第1検索結果と、前記第2検索エンジンにおける前記第2検索結果とをそれぞれ取得する構成となっており、
前記ランキング調整部は、前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出する処理と、算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成する処理とを行う構成となっており、
前記検索結果出力部は、前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成する処理と、前記表示用文書を前記ユーザ端末に向けて出力する処理とを行う構成となっている
ことを特徴とする検索装置。
A query reception unit, a search result acquisition unit, a ranking adjustment unit, and a search result output unit;
The query reception unit is configured to receive a query for search sent from a user terminal and send the query to the first search engine and the second search engine, respectively.
The first search engine is configured to generate a ranked first search result by searching a Web document based on the query.
The second search engine is configured to generate a second search result by searching multimedia data based on the query.
The multimedia data includes an image or sound,
The search result acquisition unit is configured to acquire the first search result in the first search engine and the second search result in the second search engine, respectively.
The ranking adjustment unit is configured to calculate a similarity between the first search result from the first search engine and the second search result from the second search engine, and to calculate the similarity according to the calculated similarity. It is configured to perform processing for generating a third search result by changing the ranking in one search result,
The search result output unit displays the first search result ranked by the first search engine in parallel with the third search result whose ranking has been changed by the ranking adjustment unit. A search apparatus comprising: a process for generating a display document; and a process for outputting the display document to the user terminal.
前記第2検索エンジンが複数存在しており、
前記ランキング調整部は、
前記第1検索エンジンによる前記第1検索結果と、前記複数の第2検索エンジンによる複数の前記第2検索結果とのそれぞれの類似度を統合し、かつ、統合された類似度に基づいて前記のランク付けを行う構成となっている
請求項1に記載の検索装置。
A plurality of the second search engines exist,
The ranking adjustment unit
Integrating respective similarities between the first search result by the first search engine and the plurality of second search results by the plurality of second search engines, and based on the integrated similarity The search device according to claim 1, wherein the search device is configured to perform ranking.
前記第2検索エンジンは、画像検索エンジン、動画検索エンジン及び商品検索エンジンのいずれか、又は、これらの組み合わせである
請求項1又は2に記載の検索装置。
The search device according to claim 1, wherein the second search engine is any one of an image search engine, a video search engine, and a product search engine, or a combination thereof.
前記ランキング調整部は、
前記第1検索エンジンによる検索結果に含まれるコンテンツの種類に応じて、前記第2検索エンジンによる前記第2検索結果を参照する処理と、
前記第2検索エンジンによる前記第2検索結果との類似度が高い場合に、前記前記第1検索エンジンによる前記第1検索結果のランクを高くする処理と
を行う構成となっている
請求項1〜3のいずれか1項に記載の検索装置。
The ranking adjustment unit
A process of referring to the second search result by the second search engine according to the type of content included in the search result by the first search engine;
The process of increasing the rank of the first search result by the first search engine when the degree of similarity with the second search result by the second search engine is high. 4. The search device according to any one of 3 above.
前記第1検索エンジンによる検索結果には、テキスト、画像及び音声のいずれか又はこれらの組み合わせが含まれている
請求項1〜4のいずれか1項に記載の検索装置。
The search device according to any one of claims 1 to 4, wherein the search result by the first search engine includes any one of text, image and sound, or a combination thereof.
第1検索エンジンと、第2検索エンジンとが、検索のための共通のクエリを受け取るステップと;
前記第1検索エンジンが、前記クエリに基づいて、Web文書を検索することにより、ランク付けされた第1検索結果を生成するステップと;
前記第2検索エンジンが、前記クエリに基づいて、マルチメディアデータを検索することにより、第2検索結果を生成するステップと、
ここで、前記マルチメディアデータには、画像又は音声が含まれており;
前記第1検索エンジンによる前記第1検索結果と、前記第2検索エンジンによる前記第2検索結果との類似度を算出するステップと;
算出された前記類似度によって、前記第1検索結果におけるランク付けを変更することによって、第3検索結果を生成するステップと;
前記第1検索エンジンによるランク付けがされた前記第1検索結果と、前記ランキング調整部によってランク付けが変更された前記第3検索結果とを並列に表示するための、表示用文書を生成するステップと;
前記表示用文書をユーザ端末に向けて出力するステップと
を備えたことを特徴とする検索方法。
A first search engine and a second search engine receiving a common query for search;
The first search engine generating a ranked first search result by searching a web document based on the query;
The second search engine generates second search results by searching multimedia data based on the query;
Wherein the multimedia data includes images or sounds;
Calculating a similarity between the first search result obtained by the first search engine and the second search result obtained by the second search engine;
Generating a third search result by changing the ranking in the first search result according to the calculated similarity;
Generating a display document for displaying in parallel the first search result ranked by the first search engine and the third search result whose ranking has been changed by the ranking adjustment unit. When;
And a step of outputting the display document to a user terminal.
請求項6に記載のステップをコンピュータに実行させることを特徴とするコンピュータプログラム。   A computer program for causing a computer to execute the steps according to claim 6.
JP2009028129A 2009-02-10 2009-02-10 Search device Active JP5010624B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009028129A JP5010624B2 (en) 2009-02-10 2009-02-10 Search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009028129A JP5010624B2 (en) 2009-02-10 2009-02-10 Search device

Publications (2)

Publication Number Publication Date
JP2010186214A true JP2010186214A (en) 2010-08-26
JP5010624B2 JP5010624B2 (en) 2012-08-29

Family

ID=42766857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009028129A Active JP5010624B2 (en) 2009-02-10 2009-02-10 Search device

Country Status (1)

Country Link
JP (1) JP5010624B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013012204A (en) * 2012-07-20 2013-01-17 Toshiba Corp Electronic apparatus, information presentation method and information presentation program
JP2014510968A (en) * 2011-02-24 2014-05-01 レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド Electronic document search method and electronic document search graphical display method
JP2014519090A (en) * 2011-05-12 2014-08-07 グーグル・インコーポレーテッド Dynamic image display area and image display in web search results
US9201929B1 (en) 2013-08-09 2015-12-01 Google, Inc. Ranking a search result document based on data usage to load the search result document
KR20170136964A (en) * 2016-06-02 2017-12-12 바이두 유에스에이 엘엘씨 Method and system for dynamically rankings images to be matched with content in response to a search query
JP2017220203A (en) * 2016-06-07 2017-12-14 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC Method and system for evaluating matching between content item and image based on similarity scores

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148793A (en) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> Method and device for similar retrieval of composite media document and storage medium stored with similar retrieval program for composite media document
JP2004220267A (en) * 2003-01-14 2004-08-05 Nippon Telegr & Teleph Corp <Ntt> Image retrieval method and device, image retrieval program, and storage medium recording the program
JP2007034961A (en) * 2005-07-29 2007-02-08 Ricoh Co Ltd Content processor, content processing program and content processing method
JP2007249700A (en) * 2006-03-16 2007-09-27 Ricoh Co Ltd Document management device, document retrieval method, document retrieval program and recording medium
JP2008217600A (en) * 2007-03-06 2008-09-18 Fujitsu Ltd Information retrieval device, information retrieval method, information retrieval program and storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148793A (en) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> Method and device for similar retrieval of composite media document and storage medium stored with similar retrieval program for composite media document
JP2004220267A (en) * 2003-01-14 2004-08-05 Nippon Telegr & Teleph Corp <Ntt> Image retrieval method and device, image retrieval program, and storage medium recording the program
JP2007034961A (en) * 2005-07-29 2007-02-08 Ricoh Co Ltd Content processor, content processing program and content processing method
JP2007249700A (en) * 2006-03-16 2007-09-27 Ricoh Co Ltd Document management device, document retrieval method, document retrieval program and recording medium
JP2008217600A (en) * 2007-03-06 2008-09-18 Fujitsu Ltd Information retrieval device, information retrieval method, information retrieval program and storage medium

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014510968A (en) * 2011-02-24 2014-05-01 レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド Electronic document search method and electronic document search graphical display method
JP2014519090A (en) * 2011-05-12 2014-08-07 グーグル・インコーポレーテッド Dynamic image display area and image display in web search results
JP2013012204A (en) * 2012-07-20 2013-01-17 Toshiba Corp Electronic apparatus, information presentation method and information presentation program
US9201929B1 (en) 2013-08-09 2015-12-01 Google, Inc. Ranking a search result document based on data usage to load the search result document
US9672253B1 (en) 2013-08-09 2017-06-06 Google Inc. Ranking a search result document based on data usage to load the search result document
KR20170136964A (en) * 2016-06-02 2017-12-12 바이두 유에스에이 엘엘씨 Method and system for dynamically rankings images to be matched with content in response to a search query
KR101934449B1 (en) * 2016-06-02 2019-01-03 바이두 유에스에이 엘엘씨 Method and system for dynamically rankings images to be matched with content in response to a search query
JP2017220203A (en) * 2016-06-07 2017-12-14 バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC Method and system for evaluating matching between content item and image based on similarity scores
KR20170138333A (en) * 2016-06-07 2017-12-15 바이두 유에스에이 엘엘씨 Method and system for evaluating and ranking images with content based on similarity scores in response to a search query
KR101932618B1 (en) * 2016-06-07 2018-12-27 바이두 유에스에이 엘엘씨 Method and system for evaluating and ranking images with content based on similarity scores in response to a search query

Also Published As

Publication number Publication date
JP5010624B2 (en) 2012-08-29

Similar Documents

Publication Publication Date Title
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
US8150846B2 (en) Content searching and configuration of search results
US8352396B2 (en) Systems and methods for improving web site user experience
US8429173B1 (en) Method, system, and computer readable medium for identifying result images based on an image query
US20110060717A1 (en) Systems and methods for improving web site user experience
US20090094234A1 (en) Implementing an expanded search and providing expanded search results
US20090094211A1 (en) Implementing an expanded search and providing expanded search results
US8204905B2 (en) Use of data patterns for rapid search of complex rules in a rules-based search engine
US20090125504A1 (en) Systems and methods for visualizing web page query results
AU2007215296B2 (en) Organizing digitized content on the internet through digitized content reviews
WO2008106667A1 (en) Searching heterogeneous interrelated entities
TW201447616A (en) Autosuggestions based on user history
WO2006039002A1 (en) User interfaces for a document search engine
JP5010624B2 (en) Search device
JP2010218181A (en) Image retrieval device
CN109952571B (en) Context-based image search results
JP2007334590A (en) Method, device and program for information ranking, and computer readable recording medium
JP4544047B2 (en) Web image search result classification presentation method and apparatus, program, and storage medium storing program
JP5061137B2 (en) Image search device
JP5127553B2 (en) Information processing apparatus, information processing method, program, and recording medium
US20110264518A1 (en) Learning a ranker to rank entities with automatically derived domain-specific preferences
JP2004259083A (en) Method, server and program for retrieving information
JP5094915B2 (en) Search device
US20150120681A1 (en) System and method for aggregating media content metadata
JP2006164045A (en) Cooccurrence graph creation method, device, program, and storage medium storing program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120529

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120601

R150 Certificate of patent or registration of utility model

Ref document number: 5010624

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350