JP2011044170A - 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム - Google Patents

異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム Download PDF

Info

Publication number
JP2011044170A
JP2011044170A JP2010231558A JP2010231558A JP2011044170A JP 2011044170 A JP2011044170 A JP 2011044170A JP 2010231558 A JP2010231558 A JP 2010231558A JP 2010231558 A JP2010231558 A JP 2010231558A JP 2011044170 A JP2011044170 A JP 2011044170A
Authority
JP
Japan
Prior art keywords
search
list
result
search engine
entries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010231558A
Other languages
English (en)
Other versions
JP5705497B2 (ja
Inventor
Robert L Travis Jr
ロバート エル ジュニア トラヴィス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Inc
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of JP2011044170A publication Critical patent/JP2011044170A/ja
Application granted granted Critical
Publication of JP5705497B2 publication Critical patent/JP5705497B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】各複数のサーチソースからの複数のサーチエンジン結果を1つのサーチエンジン結果へと混合するための方法及びシステムを提供すること。
【解決手段】エントリーの結果リストが各サーチソースから受け取られる。各結果リストは、少なくとも、該リストのエントリーごとに、エントリーの位置、ドキュメントのアドレス及びドキュメントの関連性スコアを含む。少なくとも1つの受け取った結果リストにおける少なくともサブセットのドキュメントの関連性スコアに、決定された変換が適用され、変換されたスコアが発生される。最終的に、各結果リストの部分を合成して、エントリーの混合されたリストを含む混合されたサーチエンジン結果を作成する。エントリーの混合されたリストは、ドキュメントの変換されたスコアに少なくとも部分的に基づいて順序付けされる。
【選択図】図2A

Description

本発明は、インターネットやイントラネットに結合されたサーバーに記憶されたドキュメントのようなドキュメントのコレクションにおいてドキュメントを探索するためのサーチエンジンの分野に係り、より詳細には、本発明は、複数の各サーチエンジンソースからの複数のサーチエンジン結果を混合して、混合されたサーチエンジン結果を発生するための方法及びシステムに係る。
インターネットは、非常に多数のクライアント装置及びサーバー装置の両方を含む大きなコンピュータネットワークである。他のファンクションの中でも、サーバーは、時々、クライアントによりネットワークを経て伝送された要求に応答して、ネットワークを経てクライアント装置へドキュメントを供給する。この要求は、通常、ドキュメントのアドレスを含む。インターネットでは、ユニフォームリソースロケーター(URL)を使用してドキュメントのアドレスを指定することがしばしば行われ、URLは、サーバーと、クライアントが要求するサーバー上の特定のドキュメントとの両方を識別する。ドキュメントは、ネットワークを経て伝送することのできる多数の形式の情報の1つでよく、テキストファイル、ワードプロセスファイル、オーディオクリップ、ビデオクリップ、及び他の形式の電子データを含む。このようにしてインターネットを経てクライアントコンピュータに入手できるようにされるドキュメントのコレクションを、一般に、ワールドワイドウェブ(「ウェブ」)と称する。
インターネットに接続されるコンピュータは、クライアント装置、サーバー装置、又はその両方でよい。インターネットにおける特殊な形式のサーバー装置をサーチエンジンシステムと称する。又、サーチエンジンシステムは、インターネット以外のネットワーク、例えば、会社のイントラネットにも存在する。ウェブからの情報を希望するが、いずれか又は全ての関連ドキュメントのURLに確信がもてないクライアント装置のユーザは、通常、問合せと称する要求をサーチエンジンへ提示する。問合せは、クライアント装置のユーザに関心のある情報の形式を記述する1つ以上の用語(term)を含む。サーチエンジンは、通常、ウェブにドキュメントのデータベースを維持する。各データベースは、ワード又は任意の形式の電子的に記憶できるデータでよいキー用語と、このキー用語を含むドキュメントの対応URLとを含むことができる。より一般的には、キー用語に代わり又はそれに加えて、データベースは、ドキュメントの特徴を記憶してもよい。ある特徴は、ドキュメントのプロパティを直接表わす値であり、例えば、特徴は、ドキュメントの長さである。他の特徴は、ドキュメントと問合せとの間である形式の比較を行えるようにし、問合せにおける所与の用語がドキュメントに現われる頻度が、このような比較の一例として働く。
クライアント装置のユーザにより提示される問合せに応答して、サーチエンジンは、通常、そのデータベースに基づいて、問合せに関連するインデックスにおけるドキュメントのサブセットを決定する。更に、サーチエンジンシステムは、通常、問合せに対するサブセット内の各ドキュメントの関連性を推定し、問合せに対するサブセット内の各ドキュメントの「関連性スコア」を発生するランク付けファンクションを含む。最終的に、このランク付けファンクションは、エントリーの順序付けされたリストを含むサーチエンジン結果を生成する。各エントリーは、サブセットにおけるドキュメントの1つに対応する。エントリーは、対応するドキュメントのURLを含み、したがって、ユーザは、ウェブからのドキュメントと、リスト内のエントリーの位置とを要求することができる。リストは、リストの開始付近の位置をもつドキュメント(即ち数値的に低い位置をもつドキュメント)が高い関連性スコアを有する(即ち、関連性スコアは、リストの開始からその終了に向かって進むにつれて単調に減少する)ように順序付けされる。
ウェブにおけるドキュメントのコンテンツを正確に表わすドキュメントのデータベースを生成することは、困難な問題である。第1に、ウェブには非常に多数のドキュメントがあり、ドキュメントの数は、現在、数十億と推定される。これは、全てのドキュメントに関する情報を記憶できると共に、必要なときにその情報を素早く検索できる単一のデータベースの生成を困難にする。第2に、ウェブにおけるドキュメントのコンテンツは、著しく種々様々である。ドキュメントは、専門の記者から若年の子供まで色々な熟練度をもつ著者により作成され、様々な言語で構成され(時々は異なるアルファベット及びその電子的エンコード機構を使用して)、そしてリクレーション用途から電子商取引まで種々様々な目的で作成される。これは、ドキュメントのどのキー用語及び特徴をデータベースに含ませるかの決定を困難な問題にする。最終的に、ウェブにおけるドキュメントのコンテンツ、及びドキュメント自体の位置が迅速に変化する。この問題を緩和するために種々の「クローリング(crawling)」戦略が使用されており、各々それ自身の利点と欠点を持ち合わせている。したがって、ドキュメントの大きく、多様で且つ経時変化するコレクション(例えば、ウェブにおけるドキュメントのコレクション)に使用するためのサーチエンジンシステムでは、2つ以上のデータベースを使用できるのが効果的である。
ウェブにおいて入手できるドキュメントを正確且つ効率的に特徴付けする単一のデータベースが開発されても、問合せに対するデータベース内の特定ドキュメントの関連性スコアの決定は、困難な問題のままである。ドキュメントの関連性スコアは、サーチエンジン結果における対応エントリーの位置を決定するために使用される。ユーザは、通常、サーチエンジン結果における最初の3つ又は4つのエントリーしか検査せず、したがって、少なくとも非常に関連性のあるドキュメントに対して正確な関連性スコアを決定することが、サーチエンジン結果でユーザを満足させる上で重要なファクタとなる。問合せに対する特定ドキュメントの関連性についてのユーザの認識を、関連性スコアを決定するための単一アルゴリズムにおいて正確に複写することは困難である。このため、サーチエンジンシステムにおいて関連性スコアを決定するのに使用可能な2つ以上の方法をもつことが望ましい。例えば、1つの方法は、単一の言語(例えば、英語)で書かれたドキュメントの関連性スコアを決定するのに良く適したものでよく、そして第2の方法は、第2の言語(例えば、中国語)のドキュメントの関連性スコアを決定するのに最も適したものである。しかしながら、データベース内のドキュメントが両方の言語のコンテンツを含むときには、どちらのランク付けファンクションを使用すべきか判断することが困難となる。別の例として、サーチエンジンシステムは、2つ以上のデータベースを含み、そして各データベースに対して個別のランク付けファンクションをもつことができる。このようにして、各データベースからのドキュメントに対して関連性スコアを決定するために個々のランク付けファンクションを最適化することができる。この形式の最適化を実行するために統計学的及びマシン学習技術が次第に使用されるようになった。したがって、2つ以上のランク付けファンクションから到来するサーチエンジン結果を混合するための方法及びシステムが要望される。
以上の背景から、おそらく異なるデータベース、ランク付けファンクション又はその両方を各々使用している1つ以上のサーチソースからのサーチエンジン結果を合成するための方法及びシステムを案出することが要望される。より詳細には、混合されたサーチエンジンにおける例えば最上位3つのドキュメントの関連性についてのユーザの認識が、いずれかの個々のサーチソースからの最上位3つのドキュメントの関連性についてのユーザの認識より優れているか、又は少なくともそれより劣らないように、混合されたサーチエンジン結果を決定するための方法を案出することが望まれる。
幾つかの実施形態は、複数の各サーチソースからの複数のサーチエンジン結果を1つのサーチエンジン結果へと混合するための方法を提供する。第1に、エントリーの各結果リストが各サーチソースから受け取られる。エントリーの結果リストは、該リストにおけるエントリーごとに、エントリーの位置、ドキュメントのアドレス、及びドキュメントの関連性スコアを含む。次いで、少なくとも1つの受け取った結果リストにおける少なくともサブセットのドキュメントの関連性スコアに、決定された変換が適用されて、変換されたスコアが発生される。最終的に、各結果リストの部分を合成して、混合されたサーチエンジン結果を作成する。混合されたサーチエンジン結果は、エントリーの混合されたリストを含む。各結果リストの合成の一部分として、エントリーの混合されたリストにおけるエントリーが、変換されたスコアに少なくとも一部分基づいて順序付けされる。
幾つかの実施形態は、更に、複数のサーチソースの第1サーチソースに対する変換を決定するための方法を提供する。第1に、クリックレート統計学的データが少なくとも第1サーチソース及び第2サーチソースに対して測定されて記憶される。次いで、第1及び第2サーチソースの各々に対してメリット指数が決定される。メリット指数は、その測定され記憶された統計学的データにより少なくとも一部分決定される。最終的に、第1及び第2のサーチソースに対してメリット指数に基づいて係数のセットが決定される。これら係数は、第1のサーチソースに対する当該関連性スコアの変換を定義する。
幾つかの実施形態は、サーチエンジンシステムを提供する。このサーチエンジンシステムは、複数のサーチソースを備えている。更に、サーチエンジンシステムは、問合せを受け取りそしてサーチ結果を伝送するための少なくとも1つのインターフェイスを有する。又、サーチエンジンシステムは、複数のサーチソースに結合された少なくとも1つのサーチエンジンも備えている。少なくとも1つのサーチエンジンは、受け取った問合せに対応するエントリーの各結果リストを各サーチソースから受け取るように構成される。各結果リストは、少なくとも、リストの各エントリーに対して、エントリーの位置と、ドキュメントのアドレスと、ドキュメントをその受け取った問合せに関連付ける関連性スコアとを備えている。サーチエンジンシステムは、更に、少なくとも1つの受け取った結果リストにおける少なくともサブセットのエントリーの関連性スコアに、決定された変換を適用して、変換されたスコアを発生するように構成された混合モジュールを備えている。この混合モジュールは、更に、各結果リストの少なくとも一部分を合成して、エントリーの混合されたリストを含む混合されたサーチエンジン結果を発生するように構成され、これは、エントリーの混合されたリストを順序付けすることも含む。エントリーの混合されたリストの順序付けは、変換されたスコアにより少なくとも一部分決定される。
幾つかの実施形態において、サーチエンジンシステムは、更に、変換決定モジュールを備えている。この変換決定モジュールは、複数のサーチソースの第1のサーチソースに対する変換を決定するように構成される。第1に、この変換決定モジュールは、第1サーチソース及び第2サーチソースの各々に対してクリックレート統計学的データを測定して記憶する。次いで、変換決定モジュールは、第1及び第2のサーチソースの各々に対してメリット指数を決定する。メリット指数の決定は、測定されて記憶された統計学的データに少なくとも一部分基づいて行われる。最終的に、変換決定モジュールは、第1のサーチソースに対し、第1及び第2のサーチソースのメリット指数に基づき係数のセットを決定する。このように決定された係数のセットは、第1サーチソースに対する変換を定義する。
幾つかの実施形態において、サーチエンジンシステムは、更に、第1サーチソース及び第2サーチソースに対してクリックレート統計学的データを測定して記憶するように構成される。サーチエンジンは、更に、ユーザから問合せを受け取り、混合された結果をユーザへ返送するように構成され、混合された結果は、エントリーのリストを含む。変換決定モジュールは、更に、エントリーのリスト内にあるどのアイテムがユーザにより選択されるか記録するように構成される。サーチエンジンシステムは、更に、終了条件に達するまで、受け取り、返送及び記録を繰り返すように構成される。
本発明の上記特徴及び効果、並びにその付加的な特徴及び効果は、添付図面を参照した本発明の好ましい実施形態の以下の詳細な説明から明確に理解されよう。多数の図面全体にわたり対応する部分が同じ参照番号で示されている。
ネットワーク、1つ以上のクライアントコンピュータ、ワールドワイドウェブ及びサーチエンジンシステムを含むここに開示する方法及びシステムを使用するための考えられる状況を示す図である。 エントリーのリストと、各エントリーに関連して、位置、対応ドキュメントのアドレス、対応ドキュメントの記述、及び関連性スコアとを含むサーチエンジン結果を示す図である。 第1サーチソースからのエントリーの第1リストと、第2サーチソースからのエントリーの第2リストと、エントリーの第1リストの関連性スコアに変換を適用することにより得られた変換されたスコアと、混合されたサーチエンジン結果とを示す図である。 混合モジュールと、変換決定モジュールと、複数のサーチソースと、サーチエンジンと、インターフェイスとを備えたサーチエンジンシステムのブロック図である。 変換を決定する方法を示す図である。 混合されたサーチエンジン結果のエントリーのリストにおけるどのアイテムがユーザにより選択されたかの匿名のレコードを示す図である。 ここに開示するサーチエンジンシステム及び方法を実施することのできるコンピュータシステムを示す図である。
図1Aを参照すれば、ネットワーク環境100において、ネットワーク105は、1つ以上のクライアントコンピュータ104と、サーチエンジンシステム106と、ドキュメント103のコレクション、この場合はワールドワイドウェブ102とを接続する。クライアントコンピュータ104−1は、ネットワーク105を経て問合せ112を提示し、この問合せ112は、サーチエンジンシステム106により受け取られる。サーチエンジンシステム106は、それに応答して、ネットワーク105を経てクライアントコンピュータ104−1へ混合されたサーチエンジン結果114を供給する。
サーチエンジンシステム106を使用するための考えられる状況を説明したが、混合されたサーチエンジン結果114について更に説明する。図1Bを参照すれば、混合されたサーチエンジン結果114エントリー130のリストを含む。各エントリー130は、ネットワーク上の対応ドキュメントに関連付けられる。通常、問合せ112(図1A)に応答して、サーチエンジンシステムは、その問合せ112に強く関連したドキュメントに関連付けられたエントリー130を、混合された結果114の一部分として与える。ユーザによるドキュメントの探索及び検索を容易にするために、各エントリー130は、時々、ドキュメントのURL122を含む。URL122は、例えば、これがハイパーテキストマークアップ言語(HTML)アンカータグの一部分としてユーザに供給される場合に、クライアントコンピュータ104のユーザに見えなくてもよい。他の実施形態では、URL122に代わって又はそれに加えて、エントリー130は、エントリーに関連したドキュメントに対する他の形式のアドレス情報を含んでもよい。関連ドキュメントの関連性を評価する上でユーザを助けるために、各エントリー130は、ドキュメントの簡単な記述128を含んでもよい。例えば、エントリー130は、エントリーに関連したドキュメントに見られる最初の数行のテキストを含んでもよい。
混合されたサーチエンジン結果114におけるエントリーのリスト内の各エントリー130(及びそれに関連したドキュメント)は、リスト内の位置120と、混合された関連性スコア124との両方を有する。位置120は、サーチエンジン結果に明確に含まれてもよいし含まれなくてもよい。位置120が明確に含まれない場合には、リストの他のエントリーに対するエントリーの位置に基づいてそれを決定することができる。混合された関連性スコア124は、エントリー130の位置120を決定する際にサーチエンジンシステムにより使用される。ドキュメントの混合された関連性スコア124は、通常、0から1の範囲、又はそれと同等であるが、0%から100%の範囲の数値をとる。図1Bには10個のエントリーしか示されていないが、混合されたサーチエンジン結果114にはそれより多数の又は少数のエントリーが存在してもよい。
クライアントコンピュータ104−1(図1A)のユーザには、サーチエンジン結果114の視覚描写が与えられ、そしてユーザは、エントリー130上に(即ちクライアントコンピュータのディスプレイの関連領域上に)カーソル126を置いてクリックすることで、ドキュメントに関連したエントリー130をクリックすることにより、見るためのドキュメントを選択することができる。混合されたサーチエンジン結果の一部分としてエントリーが与えられるユーザは、エントリーの「印象」をもったと言える。ユーザがエントリーをクリックすると、エントリーの「クリックスルー」が生じる。
混合されたサーチエンジン結果について説明したが、複数の各サーチソースからの複数のサーチエンジン結果を単一の混合されたサーチエンジン結果114へ混合するプロセスについて説明する。図2Aを参照すれば、好ましい実施形態において、2つのサーチエンジン結果セット260(結果リスト、又は単に「結果」とも称される)が、2つのサーチソースの各々から1つづつ、受け取られる。第1のサーチソースから受け取られるサーチエンジン結果セット260−1は、エントリー262のリストを含む。次いで、各エントリー262は、位置264と、第1サーチソースのデータベースにおけるドキュメントのアドレス266と、関連性スコア268とを含む。同様に、第2のサーチソースからのサーチエンジン結果セット260−2も、エントリー270のリストを含む。各エントリー270は、関連性スコア274を含む。
サーチエンジン結果セット260を単一の混合されたサーチエンジン結果114へ混合する1つの目標は、結果セット260のエントリーの中からユーザにより判断される最も高い関連性のエントリーを含むエントリーのリストを結果114に発生することである。更に、結果114におけるエントリーのリストは、リスト上の位置が高くなるにつれて、エントリーに対応するドキュメントのユーザ認識関連性が低下するか、又は少なくとも上昇しない(即ち、関連性は、リストを下がるように進むにつれて単調に低下する)ように順序付けされるのが望ましい。原理的に、第1の結果セット260−1の関連性スコア268及び第2の結果セット260−2の関連性スコア274を直接使用して、両方の結果セット260からのエントリーをランク付けすることができる。例えば、2つの結果セットの中から最も高い関連性スコアをもつエントリーを選択し、混合された結果に追加し、そしてその発生する結果セットから除去することができる。このプロセスは、混合された結果が所定数のエントリーを含むまで繰り返すことができる。しかしながら、これは、ユーザ認識関連性について順序付けされたエントリーのリストを発生する上で有効でないことがある。例えば、関連性スコア268及び関連性スコア270が匹敵するスケールになく、一方がおそらく0から1の範囲の値をとり、そして他方がおそらく4から100の範囲の値をとることがある。更に、これらスコアは、関連性の決定に異なる基準を使用するランク付けファンクションにより決定され、したがって、直接的に匹敵しないことがある。
この問題を解消するために、サーチエンジンシステムの実施形態では、決定された変換280(その決定については図3を参照して以下に説明する)が第1の結果セット260−1においてエントリー262の関連性スコア268に適用される。例えば、変換280は、エントリー262−1の関連性スコア(0.85の値を有する)をとり、そして0.99の値を有する変換されたスコア272−1を発生する。同様に、変換280は、他の関連性スコア268にも適用されて、変換されたスコア272のセットを発生する。
次いで、結果セット260−1及び結果セット260−2からのエントリーは、第1結果セット260−1の変換されたスコア272及び第2結果セット260−2の関連性スコア274に基づいて合成される。ある実施形態では、第1結果の変換されたスコア及び第2結果の関連性スコアの中から最大のスコアを有するエントリーが選択される。例えば、図2Aにおいて、エントリー262−1は、混合された結果114における第1位置から選択される。というのは、0.99の値を有するエントリー262−1の対応する変換されたスコア272−2は、いずれの関連性スコア274及び他のいずれの変換されたスコア272よりも高い。エントリー262−1は、混合された結果114の第1の位置に入れられる。結果セット114が所定数、この場合は、10個のエントリーを含むまで、次第に低いスコアをもつエントリーが選択されて結果セット114に入れられる。或いは又、結果セット260−1の変換されたスコア272及び結果セット260−2の関連性スコア274に基づいて、第1及び第2のセット260における全エントリーが選択されて結果セット114に入れられる。例えば、エントリー270−1が結果114における第2位置に入れられる。というのは、0.97の値を有する対応する関連性スコア274−1が、他の全ての関連性スコア274、及び変換されたスコア272−1を除く全ての変換されたスコア272より大きいからである。同様に、エントリー262−2が結果114の第3の位置に入れられる。
2つのサーチソースからのサーチエンジン結果の混合について図2Aを参照して説明したが、他の実施形態では、対応的に多数のサーチソースからより多くのサーチエンジン結果が受け取られる。例えば、一実施形態では、5つのサーチソースから5つのサーチエンジン結果を受け取ることができる。ある実施形態では、1つを除く全ての結果セットの関連性スコアに変換が適用され、その後、結果セットがそれらの変換された関連性スコアに基づいて合成される。更に、各結果260は、10個より少数又は多数のエントリーを含んでもよい。同様に、他の実施形態では、混合されたサーチ結果114が10個より少数又は多数のエントリーを含む。混合された結果114におけるエントリーの数は、任意の結果260におけるエントリーの数と同じである必要はない。同様に、結果260は、その全てが、対応する異なる数のエントリーを有してもよい。
混合されたサーチエンジン結果114を発生するプロセスを説明したが、混合されたサーチエンジン結果を発生することのできるサーチエンジンシステムについて説明する。図2Bには、一実施形態によるサーチエンジンシステム106が示されている。このサーチエンジンシステム106は、2つ以上のサーチソース208を備えている。各サーチソース208は、それに関連したランク付けファンクション204及びデータベース206を有している。システム106は、更に、問合せを受け取りそして混合されたサーチエンジン結果114を伝送するためのインターフェイス214も備えている。又、システム106は、2つ以上のサーチソース208に結合されたサーチエンジン220も備えている。サーチエンジン220は、インターフェイス214を経て問合せを受け取ると、対応する問合せ210を1つ以上のサーチソース208へ搬送する。ある実施形態では、問合せ210は、エンジン220により受け取られた問合せと同じでよい。他の実施形態では、エンジン220は、受け取った問合せを、その問合せに関連した適当なデータベース206を有するソース208に伝送するだけでよい。例えば、ある実施形態では、サーチエンジンシステム106が、特定言語(例えば、中国語)の用語を含む問合せを受け取った場合に、エンジン220は、その言語のドキュメントをインデックスしているデータベース(例えば、206−2)を有するソース(例えば、208−2)へ問合せを伝送するだけである。同様に、システム106が第2言語の用語を含む問合せを受け取る場合には、エンジン220は、その第2言語のドキュメントをインデックスするデータベース206を有するソース208へ問合せを通過させるだけである。更に別の実施形態では、エンジン220は、システム106により受け取られた問合せとは異なる問合せ210をソース208へ伝送してもよい。例えば、オリジナルの問合せをサーチエンジン220により再構成して、問合せ210として特定のソース208へ適切に与えられるようにしてもよい。
サーチエンジン220は、サーチソース208に結合され、各ソース208から各結果リスト260を受け取ることができる。結果リスト260は、リスト上の関連位置、リストのサーチソース208のデータベースにおける対応ドキュメントのアドレス、及び対応ドキュメントを問合せ210に関連付ける関連性スコアを各々有するエントリーのリストを含む。典型的な結果リスト260は、図2Aの前記説明に関連して示した。
サーチエンジンシステム106は、更に、混合モジュール202も備えている。この混合モジュール202は、決定された変換を、少なくとも1つの受け取った結果リスト260における少なくともサブセットのエントリーの関連性スコアに適用して、変換されたスコアを発生するように構成される。混合モジュール202は、更に、各結果リスト260の少なくとも一部分を合成して、エントリーの混合されたリストを含む混合されたサーチエンジン結果を発生するように構成され、これは、変換されたスコアに少なくとも一部分基づいてエントリーの混合されたリストを順序付けすることを含む。エントリーの混合されたリストは、次いで、混合されたサーチエンジン結果の一部分又は全部として、インターフェイス214を経て供給される。決定された変換を適用し、結果リスト260の一部分を合成し、そして合成されたサーチエンジン結果を形成するプロセスは、図2Aの説明に関連して上述した。
サーチエンジンシステム106は、任意であるが、変換決定モジュール216を含む。この変換決定モジュール216は、1つ以上のサーチソース208に対する1つ以上の変換を決定するように構成される。サーチソースに対する変換の決定は、図3を参照して以下に説明する。変換は、いったん決定されると、混合モジュール202に与えられる。ある実施形態では、混合モジュール202及び変換決定モジュール216の両方がサーチエンジン220に含まれる。他の実施形態では、混合モジュール202及び/又は任意の変換決定モジュール216が、サーチエンジンシステム106に含まれた他のシステムの一部分でよい。ある実施形態では、サーチソース208及びサーチエンジン220が異なるコンピュータにおいて実施される。これらの実施形態では、問合せ210及び各結果リスト260の通過は、例えば、ネットワーク105(図1A)を経て実行される。
サーチエンジンシステムについて説明したが、変換を決定する方法(ある実施形態では、図2Aの変換決定モジュール216により使用するための)について説明する。図3を参照すれば、変換を決定するための方法300の好ましい実施形態では、第1サーチソース及び第2サーチソースに対するクリックレート統計学的データが、最初に、ステップ302において測定されて記憶される。図4を参照すれば、ある実施形態において、混合されたサーチエンジン結果114(例えば、図1Bに示す)におけるエントリーの1つをユーザがクリックする事象がサーチエンジンシステム106(図2B)により記録される。混合されたサーチエンジン結果114のエントリーの1つをユーザがクリックすると、要求401がサーチエンジンシステム106(例えば、サーチエンジン220の変換決定モジュール216)へ伝送される。要求401は、混合されたサーチエンジン結果114における選択されたエントリーの位置に関する情報を含む。ユーザクリックで要求401がサーチエンジンシステム106へ伝送されるようにするために、結果リストの各アイテムに関連したURLを変更し、ユーザにより選択されたドキュメントをサーバーが記憶するのではなく、アイテムの選択でhttpメッセージ(即ち要求401)がサーチエンジンサーバーへ伝送されるようにする。httpメッセージ(要求)401は、選択されたドキュメントに関連したURLと、結果リストにおける選択されたアイテムの位置とを含む。
要求の受け取りに応答して、サーチエンジン220は、混合された結果114における選択されたエントリーの位置を記録する。更に、サーチエンジン220は、2つ以上の結果リスト(例えば、図2Bの260−1及び260−2)を合成して、混合された結果114を発生するときに、選択されたエントリーが得られたところのサーチソースを記録する。更に、サーチエンジン220は、サーチソースと、混合された結果114における全ての非選択のエントリーの位置とを記録する。この記憶は、例えば、変換決定モジュール216(図2B)により行うことができる。好ましい実施形態では、結果リストがユーザへ伝送されるときに、ユーザに与えられる結果リストに関する情報がログレコードに記録される。ユーザにより選択されたアイテムに関する情報は、第2のログレコードに記録される。第2のログレコードは、第1のログレコードに対する参照又はポインタを含んでもよい。
図4を更に参照すれば、クライアントコンピュータ104−1のユーザは、サーチエンジン結果114から選択されたエントリーに対応するドキュメントを受け取ることが必要である。これを達成するために、サーチエンジンシステム106は、「httpリダイレクト」応答402をクライアントコンピュータ104−1へ伝送して、要求されたドキュメントのURLを指定する。httpリダイレクト402は、クライアントコンピュータ104−1が、そのURLに対応するドキュメントをダウンロードして表示するようにさせる(403、404)。別の実施形態では、サーチエンジンシステム106は、要求されたドキュメントをダウンロードし、次いで、そのドキュメントをクライアントコンピュータ104−1へ伝送することができる。
クライアントコンピュータ104のユーザが混合された結果からエントリーを選択するたびに、混合された結果114のエントリーに関する情報を記録する必要はない。したがって、ある実施形態では、混合された結果からのユーザ選択の記録は、選択された混合された結果114に対してのみ実行され、これは、ランダムに選択されてもよいし又は他のやり方で選択されてもよい。このように、システム104は、混合された結果からエントリーをユーザが選択することにより発生される各要求を処理することにより過剰な負担がかからないようにされる。例えば、システム106は、ユーザによりエントリーが選択されるときに、各100個の結果の中の1つだけが要求401を発生するように、混合された結果114を発生することができる。
ある実施形態では、ユーザが混合されたサーチエンジン結果からエントリーを選択するのに応答して、その選択されたエントリーの位置及びサーチソースが記録される。更に、選択はされないが、混合された結果に存在するエントリーの位置及びソースも、記録される。したがって、これらのデータから、1つ以上のサーチソースにより発生された関連性スコアに適用されるべき変換を決定することが望まれる。ある実施形態では、各サーチソースhと、混合されたサーチ結果における各位置iとに対して、相対的クリック比が決定される。ソースh及び位置iに対する相対的クリック比(RCR)は、ある実施形態では、次の式に基づいて決定される。
Figure 2011044170
但し、CR(i)は、ソースとは独立した位置iにおける結果に対するクリックスルー比である。
Figure 2011044170
但し、「clickthroughs(i)」は、測定インターバル(例えば1日又は数日の期間)中の位置iにおけるユーザによる記録されたクリックスルーの全数であり、そして「impressions(i)」は、位置iにエントリーを含む混合された結果が同じ測定インターバル中にユーザに与えられる全回数である(そして結果は、どのアイテムがユーザにより選択されたかサーバーに通知するように構成される)。上記の式では、CRS(i)は、位置iにおける結果のソースがソースhからのものであるときに位置iにおける結果に対するクリックスルー比である。
Figure 2011044170
但し、「clickthroughs(i,h)」は、ユーザが混合されたサーチ結果から位置iのエントリーを選択した回数で、位置iのエントリーは、サーチソースhから最初に得られたものであり、そして「impressions(i,h)」は、ソースhからの位置iのエントリーを含む混合された結果がユーザに与えられる全回数である(そして結果は、どのアイテムがユーザにより選択されたかサーバーに通知するように構成される)。したがって、RCRは、本質的に、特定ソースからのエントリーが混合された結果における特定位置から選択される相対的頻度に対するプロキシーである。
図3を参照すれば、変換を決定する方法300において、少なくとも第1ソース及び第2ソースに対してメリット指数(figure of merit)が決定される。ソースhに対するメリット指数は、一実施形態では、次の式で決定される。
Figure 2011044170
但し、P(i,h)は、混合された結果における位置i及びソースhに対するインプレッションレート(impression rate)と称される。上記式における加算は、位置1から10まで実行されるが、他の実施形態における加算は、位置1から、位置10より低い又は高い最終位置まで行われてもよい。インプレッションレートP(i,h)は、次の式により決定される。
Figure 2011044170
但し、Impressions(i,h)は、混合された結果がソースhから位置iにエントリーを含む回数である。ソース208(図2B)が、混合された結果へのエントリーを与えるが、これらのエントリーがユーザにより滅多に選択されない(ユーザが他のソースからのエントリーを選択する頻度に対して)場合には、メリット指数F(h)の値がゼロに近くなる。逆に、あるソースが、混合された結果へのエントリーを与えると共に、これらエントリーがユーザにより頻繁に選択される場合には、メリット指数F(h)の値が1以上になる。1より大きな値は、平均より高い割合でユーザが選択することを指示し、そして1より小さな値は、平均より低い割合でユーザが選択することを指示する。したがって、ソースhのメリット指数F(h)は、そのソースからのエントリーが、混合された結果における位置に正しく入れられたというユーザの認識に対するプロキシーとして働く。
最終的に、変換を決定する方法300では、1つ以上の係数セットが、ステップ306において、ソースに対するメリット指数に基づき決定される。特定のソースに対して、係数のセットを使用して、そのソースからの関連性スコアに適用されるべき変換が定義される。例えば、変換は、シフト変換でよく、この場合に、変換は、次の式に基づいて実行される。
TransformedScore=RelevanceScore+b
ここでは、1つの係数bだけを使用して、変換が定義される。このシフト係数の典型的な値は、関連性スコアが約0.0から1.0の範囲のときに、−0.04から0.04の範囲である。他の考えられる変換は、スケーリング変換を含み、この変換は、次の式に基づいて実行される。
TransformedScore=a*RelevanceScore
この場合も、1つの係数aだけを使用して、変換が定義される。このスケーリング係数の典型的な値は、関連性スコアが約0.0から1.0の範囲のときに、0.9から1.1の範囲である。他の考えられる変換は、アフィン変換を含み、この変換は、次の式に基づいて行われる。
TransformedScore=a*RelevanceScore+b
ここでは、2つの係数、即ちスケーリング係数a及びシフト係数bを使用して、変換を定義する。関連性スコアが約0.0から1.0の範囲のときに、スケーリング係数aの典型的な値は、0.9から1.1の範囲であり、そしてシフト係数bの典型的な値は、−0.04から0.04の範囲である。
1つ以上のソースの関連性スコアに適用される変換の係数を決定する1つの目標は、全てのソースに対するメリット指数を等化することである。ある実施形態では、ソースのメリット指数に基づいて変換の係数を決定するために、発見的ルールのセットが適用される。発見的ルールの一形式は、第1メリット指数と第2メリット指数の比が所定の値範囲内にあるときに、第1ソースの関連性スコアに適用されるべき変換の係数が所定の係数値をとることを要求する。例えば、このルールは、第1ソースのメリット指数と第2ソースのメリット指数との比F(1)/F(2)が0.2から0.4であるときに、第2ソースの関連性スコアのシフト変換におけるシフト係数の値が0.04の値をとることを要求する。又、別のルールは、F(1)/F(2)が0.4から0.6であるときに、第2ソースの関連性スコアのシフト変換におけるシフト係数の値が0.02の値をとることを要求する。このように、第1ソースの関連性スコアの変換は、第1及び第2ソースのメリット指数が不必要にオーバーシュートせずに等化する傾向となるように決定される。
他の実施形態では、使用する変換ファンクションは、上述したシフト、スケーリング及びアフィンファンクション以外のファンクションでもよい。特に、他の実施形態は、入手可能なスコア(関連性スコアが変換されているサーチソースからの)及び他のソースからの結果の両方のファンクションである混合変換ファンクションを使用してもよい。換言すれば、ソースAからの結果に適応される変換ファンクションは、ソースAに関連した固定係数だけではなく、他のソースからの又は他のソースに関連したパラメータを伴う複素数ファンクションであってもよい。
好ましい実施形態では、サーチエンジンシステム106は、図5に概略的に示すように、1つ以上のコンピュータシステムを使用して実施される。当業者に明らかなように、大量の問合せを処理するように設計されたサーチエンジンシステムは、図5に示すものより複雑なコンピュータアーキテクチャーを使用してもよい。例えば、サーバーのフロントエンドセットを使用して問合せを受け取り、問合せを実際に処理するバックエンドサーバーのセットの中に問合せを配布することができる。このようなシステムでは、図5に示すシステム106が、バックエンドサーバーの1つとなる。
コンピュータシステムは、通常、1つ以上の中央処理ユニット(CPU)504と、ネットワーク又は他の通信インターフェイス506と、一次及び二次記憶装置510と、これらの要素を相互接続するための1つ以上の通信バス508とを有する。一次及び二次記憶装置510は、高速ランダムアクセスメモリを含むことができると共に、1つ以上の磁気ディスク記憶装置(図示せず)のような不揮発性メモリも含むことができる。一次及び二次記憶装置510は、中央処理ユニット504から離れて位置された大量記憶装置を含むことができる。一次及び二次記憶装置510は、好ましくは、次のものを記憶する。
−種々の基本的システムサービスを取り扱うと共に、ハードウェア従属タスクを遂行するための手順を含むオペレーティングシステム512;
−システム106を種々のクライアントコンピュータ104(図1A)に接続すると共に、おそらく、1つ以上の通信ネットワーク、例えば、インターネット、他のワイドエリアネットワーク、ローカルエリアネットワーク(例えば、ローカルワイヤレスネットワークはクライアントコンピュータ104をシステム106に接続できる)、メトロポリタンエリアネットワーク、等々を経て、他のサーバー又はコンピュータに接続するのに使用されるネットワーク通信モジュール514;
−クライアントコンピュータ104から問合せ112を受け取ると共に、1つ以上のサーチソースから1つ以上の結果リストを発生する(又は受け取る)サーチエンジン220であって、問合せ112に関連したドキュメントに対してサーチソースデータベースをサーチし、そして問合せに関連したドキュメントの関連性スコアを決定するサーチエンジン(又はサーチソースを伴うサーチエンジン);
−本発明の多数の態様を実施するための混合モジュール202;及び
−本発明の多数の態様を実施するための変換決定モジュール216。
混合モジュール202は、実行可能な手順、サブモジュール、テーブル、及び他のデータ構造体を含むことができる。一実施形態において、混合モジュール202は、1つ以上のサーチソースにより与えられる結果リストを合成するための混合ファンクション530を備えている。
変換決定モジュール216は、混合モジュールとは異なるサーバーで実施することができる。というのは、その役割が、時間にわたって平均化されるクリックスルーデータを収集することだからである。新たな変換ファンクション係数は、問合せが処理されるより相当に低い頻度で周期的に決定される。例えば、新たな変換ファンクション係数は、1日に一度又はおそらく数日に一度、計算されて混合モジュール(1つ又は複数)へ配布されてもよい。変換決定モジュール216は、実行可能な手順、サブモジュール、テーブル、及び他のデータ構造体を含むことができる。一実施形態では、変換決定モジュール216は、次のものを含む。
−測定されたクリックレート統計学的データを記憶するためのデータ構造体532;
−係数のセットを決定するための決定ファンクション536であって、おそらく1つ以上の発見的ルールを含む決定ファンクション;及び
−決定された係数セットを記憶するための1つ以上のデータ構造体620。
別の実施形態では、各サーチソースに対して変換ファンクションが定義され、各変換ファンクションには、単位変換(即ち、そのソースに対するスコアを変化させない変換)に関連した1つ以上の係数値が最初に指定される。次いで、種々の変換ファンクションに対する係数値が、上述したように、変換定義モジュールにより収集される情報に基づいて指定される。ある実施では、各サーチソースに対するスコアに対して非単位変換が実行されるように全ての変換ファンクションに係数が指定されてもよい。しかしながら、上述したように、N個のサーチソースからの結果を混合するときには、せいぜいN−1個のサーチソースに対して非単位変換が一般に必要となる。
本発明を完全に理解するために、上記説明では、特定の述語が使用された。しかしながら、当業者であれば、本発明を実施するために特定の細部は必要とされないことが明らかであろう。前記実施形態は、本発明の原理及びその実際の応用を最良に説明するために選択されたもので、当業者であれば、本発明及び種々の実施形態を、意図された特定の用途に適するように種々の変更を加えて、最良に利用することができよう。したがって、以上の開示は、余すところのないものでもないし、又、本発明を、ここに開示する正確な形態に限定するものでもない。前記教示に鑑み、多数の変更や修正が考えられる。
本発明の範囲は、特許請求の範囲及びその等効物により限定されるものとする。

Claims (12)

  1. 各複数のサーチソースからの複数のサーチエンジン結果を1つのサーチエンジン結果へと混合するための方法において、
    各サーチソースからエントリーの各結果リストを受け取るステップであって、各結果リストは、少なくとも、リストの各エントリーに対し、エントリーの位置と、ドキュメントのアドレスと、ドキュメントの関連性スコアとを含むようなステップと、
    少なくとも1つの受け取られた結果リストにおける少なくともサブセットのドキュメントの関連性スコアに、決定された変換を適用して、変換されたスコアを発生するステップと、
    各々の結果リストの少なくとも一部分を合成して、エントリーの混合されたリストを含む混合されたサーチエンジン結果を発生するステップであって、ドキュメントの変換されたスコアに少なくとも一部分基づいてエントリーの混合されたリストを順序付けすることを含むようなステップと、
    を備えた方法。
  2. 前記複数のサーチソースの第1サーチソースに対して前記変換を決定するステップを更に備え、これは、
    前記第1のサーチソース及び第2のサーチソースに対するクリックレート統計学的データを測定して記憶する段階と、
    前記第1及び第2のサーチソースの各々に対するメリット指数を決定する段階であって、該メリット指数を、前記測定されて記憶された統計学的データにより少なくとも一部分決定するような段階と、
    前記第1のサーチソースに対し、前記第1及び第2のサーチソースのメリット指数に基づいて係数のセットを決定する段階であって、該係数のセットは前記第1のサーチソースに対する変換を定義するものであるような段階と、
    によって行う請求項1に記載の方法。
  3. 発見的ルールのセットを適用することにより前記係数のセットを決定する段階を備え、1つ以上の発見的ルールは、第1のメリット指数と第2のメリット指数との比が所定の値範囲内にあるときに、前記変換の係数が所定の係数値をとることを要求するものである、請求項2に記載の方法。
  4. 前記変換は、2つの係数により決定されるアフィン変換である、請求項1に記載の方法。
  5. 前記変換は、1つの係数により決定されるスケーリング変換である、請求項1に記載の方法。
  6. 前記係数は、0.9から1.1の範囲内の値をとる、請求項5に記載の方法。
  7. 前記変換は、1つの係数により決定されるシフト変換である、請求項1に記載の方法。
  8. 前記係数は、−0.04から0.04の範囲の値をとる、請求項7に記載の方法。
  9. クリックレート統計学的データを測定して記憶する前記段階は、
    ユーザから問合せを受け取り、
    混合された結果をユーザに返送し、該混合された結果は、エントリーのリストを含むものであり、
    前記エントリーのリスト内のどのエントリーがユーザにより選択されたか記録し、そして
    終了条件に達するまで、前記受け取り、返送及び記録を繰り返す、
    ということを含む請求項2に記載の方法。
  10. 前記記録することは、ユーザが前記エントリーのリストからアイテムを選択しないかどうか記録することを含む、請求項9に記載の方法。
  11. クリックレート統計学的データを測定して記憶する前記段階は、更に、
    サーチソースと、前記混合された結果における選択されたエントリーに関連した位置とを記録し、前記選択されたエントリーはユーザにより選択され、そして
    サーチソースと、ユーザにより選択されない前記混合された結果におけるエントリーに関連した位置とを記録する、
    ということを含む請求項9に記載の方法。
  12. 前記第1のサーチソースに対するメリット指数を決定する前記段階は、
    複数のサーチソースの各々に対し、前記混合された結果における複数の位置に対する各複数のインプレッション数を決定し、
    第1のサーチソースに対し、前記混合された結果における位置で前記第1のサーチソースに関連したエントリーをユーザが選択した第1の回数を決定し、そして
    前記第1の回数及び前記複数のインプレッション数とに少なくとも一部分基づいて前記第1のサーチソースのメリット指数を決定する、
    ということを含む請求項11に記載の方法。
JP2010231558A 2003-04-25 2010-10-14 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム Expired - Lifetime JP5705497B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/424,171 US7219090B2 (en) 2003-04-25 2003-04-25 Method and system for blending search engine results from disparate sources into one search result
US10/424,171 2003-04-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006513333A Division JP2006524871A (ja) 2003-04-25 2004-04-23 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム

Publications (2)

Publication Number Publication Date
JP2011044170A true JP2011044170A (ja) 2011-03-03
JP5705497B2 JP5705497B2 (ja) 2015-04-22

Family

ID=33299289

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006513333A Pending JP2006524871A (ja) 2003-04-25 2004-04-23 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム
JP2010231558A Expired - Lifetime JP5705497B2 (ja) 2003-04-25 2010-10-14 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006513333A Pending JP2006524871A (ja) 2003-04-25 2004-04-23 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム

Country Status (6)

Country Link
US (1) US7219090B2 (ja)
EP (1) EP1631901A4 (ja)
JP (2) JP2006524871A (ja)
KR (1) KR100778159B1 (ja)
CN (1) CN100432921C (ja)
WO (1) WO2004097570A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012190061A (ja) * 2011-03-08 2012-10-04 Sony Corp 情報処理装置、端末装置、情報提示システム、評価スコアの算出方法、及びプログラム

Families Citing this family (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004036161A2 (en) * 2002-10-18 2004-04-29 Board Of Regents, The University Of Texas System Customizable spectral profiles for filtering
US7403939B1 (en) 2003-05-30 2008-07-22 Aol Llc Resolving queries based on automatic determination of requestor geographic location
US7454417B2 (en) 2003-09-12 2008-11-18 Google Inc. Methods and systems for improving a search ranking using population information
US7505964B2 (en) 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US8521725B1 (en) 2003-12-03 2013-08-27 Google Inc. Systems and methods for improved searching
US8156444B1 (en) 2003-12-31 2012-04-10 Google Inc. Systems and methods for determining a user interface attribute
US7281008B1 (en) * 2003-12-31 2007-10-09 Google Inc. Systems and methods for constructing a query result set
US7925657B1 (en) 2004-03-17 2011-04-12 Google Inc. Methods and systems for adjusting a scoring measure based on query breadth
US7272601B1 (en) 2004-03-31 2007-09-18 Google Inc. Systems and methods for associating a keyword with a user interface area
US8595214B1 (en) 2004-03-31 2013-11-26 Google Inc. Systems and methods for article location and retrieval
US20070282797A1 (en) * 2004-03-31 2007-12-06 Niniane Wang Systems and methods for refreshing a content display
US9009153B2 (en) * 2004-03-31 2015-04-14 Google Inc. Systems and methods for identifying a named entity
US7761439B1 (en) 2004-06-30 2010-07-20 Google Inc. Systems and methods for performing a directory search
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US7363296B1 (en) * 2004-07-01 2008-04-22 Microsoft Corporation Generating a subindex with relevant attributes to improve querying
US7853606B1 (en) 2004-09-14 2010-12-14 Google, Inc. Alternate methods of displaying search results
US7801899B1 (en) * 2004-10-01 2010-09-21 Google Inc. Mixing items, such as ad targeting keyword suggestions, from heterogeneous sources
US7571157B2 (en) 2004-12-29 2009-08-04 Aol Llc Filtering search results
US7818314B2 (en) 2004-12-29 2010-10-19 Aol Inc. Search fusion
US7272597B2 (en) 2004-12-29 2007-09-18 Aol Llc Domain expert search
US7349896B2 (en) * 2004-12-29 2008-03-25 Aol Llc Query routing
US7512633B2 (en) * 2005-07-13 2009-03-31 International Business Machines Corporation Conversion of hierarchically-structured HL7 specifications to relational databases
US7984039B2 (en) * 2005-07-14 2011-07-19 International Business Machines Corporation Merging of results in distributed information retrieval
CN100401295C (zh) * 2005-09-26 2008-07-09 北京金山软件有限公司 一种网络词典检索结果的反馈显示方法及系统
US7779059B2 (en) * 2005-12-22 2010-08-17 Pitney Bowes Software Inc. Geocoding and address hygiene system employing point level and centerline data sets
US20070150342A1 (en) * 2005-12-22 2007-06-28 Law Justin M Dynamic selection of blended content from multiple media sources
US8126874B2 (en) * 2006-05-09 2012-02-28 Google Inc. Systems and methods for generating statistics from search engine query logs
US20080155409A1 (en) * 2006-06-19 2008-06-26 Andy Santana Internet search engine
US7752195B1 (en) 2006-08-18 2010-07-06 A9.Com, Inc. Universal query search results
US8087019B1 (en) 2006-10-31 2011-12-27 Aol Inc. Systems and methods for performing machine-implemented tasks
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9110975B1 (en) 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
KR100723577B1 (ko) * 2006-12-01 2007-05-31 (주)넷피아닷컴 키워드 처리시스템, 키워드 처리방법 및 이를 실행시키기위한 프로그램을 기록한 기록매체
US8086600B2 (en) * 2006-12-07 2011-12-27 Google Inc. Interleaving search results
US7958126B2 (en) * 2006-12-19 2011-06-07 Yahoo! Inc. Techniques for including collection items in search results
KR100896614B1 (ko) * 2007-01-29 2009-05-08 엔에이치엔(주) 검색 시스템 및 방법
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US8694374B1 (en) 2007-03-14 2014-04-08 Google Inc. Detecting click spam
US8359300B1 (en) * 2007-04-03 2013-01-22 Google Inc. System and method for displaying both localized search results and internet search results
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US8359309B1 (en) * 2007-05-23 2013-01-22 Google Inc. Modifying search result ranking based on corpus search statistics
US20090043741A1 (en) * 2007-08-09 2009-02-12 Dohyung Kim Autocompletion and Automatic Input Method Correction for Partially Entered Search Query
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US7792813B2 (en) * 2007-08-31 2010-09-07 Microsoft Corporation Presenting result items based upon user behavior
US20090094224A1 (en) 2007-10-05 2009-04-09 Google Inc. Collaborative search results
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US20090177652A1 (en) * 2008-01-08 2009-07-09 Taptu Ltd. Mobile search service
US8620859B2 (en) * 2008-04-28 2013-12-31 Hewlett-Packard Development Company, L.P. Data processing system and method of evaluating effectiveness of usage of a file system
US9128945B1 (en) 2008-05-16 2015-09-08 Google Inc. Query augmentation
US8745018B1 (en) 2008-07-10 2014-06-03 Google Inc. Search application and web browser interaction
CA2639438A1 (en) * 2008-09-08 2010-03-08 Semanti Inc. Semantically associated computer search index, and uses therefore
US7730061B2 (en) * 2008-09-12 2010-06-01 International Business Machines Corporation Fast-approximate TFIDF
US20100082609A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and method for blending user rankings for an output display
US8392429B1 (en) * 2008-11-26 2013-03-05 Google Inc. Informational book query
US8396865B1 (en) * 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8455990B2 (en) * 2009-02-25 2013-06-04 Conexant Systems, Inc. Systems and methods of tamper proof packaging of a semiconductor device
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US20100268709A1 (en) * 2009-04-21 2010-10-21 Yahoo! Inc., A Delaware Corporation System, method, or apparatus for calibrating a relevance score
US9495460B2 (en) * 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
US20110004608A1 (en) * 2009-07-02 2011-01-06 Microsoft Corporation Combining and re-ranking search results from multiple sources
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US10019518B2 (en) * 2009-10-09 2018-07-10 Excalibur Ip, Llc Methods and systems relating to ranking functions for multiple domains
CN102063432A (zh) 2009-11-12 2011-05-18 阿里巴巴集团控股有限公司 一种检索方法和系统
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8751516B1 (en) * 2009-12-22 2014-06-10 Douglas Tak-Lai Wong Landing page search results
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US8751511B2 (en) * 2010-03-30 2014-06-10 Yahoo! Inc. Ranking of search results based on microblog data
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8306964B2 (en) * 2010-07-20 2012-11-06 Microsoft Corporation Extraction of rich search information from index servers via an alternative asynchronous data path
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
US20120047247A1 (en) * 2010-08-18 2012-02-23 Openwave Systems Inc. System and method for allowing data traffic search
JP2012068696A (ja) * 2010-09-21 2012-04-05 Fuji Xerox Co Ltd 文書管理装置及び文書管理プログラム
US8346792B1 (en) 2010-11-09 2013-01-01 Google Inc. Query generation using structural similarity between documents
US8484202B2 (en) * 2010-12-09 2013-07-09 Microsoft Corporation Optimizing blending algorithms using interleaving
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US20120239681A1 (en) * 2011-03-14 2012-09-20 Splunk Inc. Scalable interactive display of distributed data
US9053087B2 (en) * 2011-09-23 2015-06-09 Microsoft Technology Licensing, Llc Automatic semantic evaluation of speech recognition results
US8880992B2 (en) 2012-01-10 2014-11-04 Google Inc. Method and apparatus for animating transitions between search results
CN107066509B (zh) 2012-04-26 2020-12-04 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器
US10198516B2 (en) * 2012-08-02 2019-02-05 Rule 14 Real-time and adaptive data mining
US10108723B2 (en) * 2012-08-02 2018-10-23 Rule 14 Real-time and adaptive data mining
US10108725B2 (en) * 2012-08-02 2018-10-23 Rule 14 Real-time and adaptive data mining
US10108724B2 (en) * 2012-08-02 2018-10-23 Rule 14 Real-time and adaptive data mining
US10114899B2 (en) * 2012-08-02 2018-10-30 Rule 14 Real-time and adaptive data mining
US10114871B2 (en) * 2012-08-02 2018-10-30 Rule 14 Real-time and adaptive data mining
US10102257B2 (en) * 2012-08-02 2018-10-16 Rule 14 Real-time and adaptive data mining
US10108678B2 (en) * 2012-08-02 2018-10-23 Rule 14 Real-time and adaptive data mining
US10120911B2 (en) * 2012-08-02 2018-11-06 Rule 14 Real-time and adaptive data mining
US10108679B2 (en) * 2012-08-02 2018-10-23 Rule 14 Real-time and adaptive data mining
US10114870B2 (en) * 2012-08-02 2018-10-30 Rule 14 Real-time and adaptive data mining
US10108680B2 (en) * 2012-08-02 2018-10-23 Rule 14 Real-time and adaptive data mining
US10114872B2 (en) * 2012-08-02 2018-10-30 Rule 14 Real-time and adaptive data mining
US10108713B2 (en) * 2012-08-02 2018-10-23 Rule 14 Real-time and adaptive data mining
US10108704B2 (en) * 2012-09-06 2018-10-23 Microsoft Technology Licensing, Llc Identifying dissatisfaction segments in connection with improving search engine performance
US9135307B1 (en) 2012-12-27 2015-09-15 Google Inc. Selectively generating alternative queries
US9183499B1 (en) 2013-04-19 2015-11-10 Google Inc. Evaluating quality based on neighbor features
US9405803B2 (en) * 2013-04-23 2016-08-02 Google Inc. Ranking signals in mixed corpora environments
US10169711B1 (en) * 2013-06-27 2019-01-01 Google Llc Generalized engine for predicting actions
CN104516887B (zh) * 2013-09-27 2019-08-30 腾讯科技(深圳)有限公司 一种网页数据搜索方法、装置和系统
US9430533B2 (en) * 2014-03-21 2016-08-30 Microsoft Technology Licensing, Llc Machine-assisted search preference evaluation
CN103870607A (zh) * 2014-04-08 2014-06-18 北京奇虎科技有限公司 多搜索引擎搜索结果的排序方法及装置
US10268732B2 (en) 2015-06-29 2019-04-23 Google Llc Ranking native applications and native application deep links
US10120951B2 (en) * 2015-08-12 2018-11-06 Samsung Electronics Co., Ltd. Bifurcated search
US10354066B2 (en) 2016-02-26 2019-07-16 Cylance Inc. Retention and accessibility of data characterizing events on an endpoint computer
US10699012B2 (en) 2017-01-11 2020-06-30 Cylance Inc. Endpoint detection and response utilizing machine learning
US10819714B2 (en) * 2017-04-26 2020-10-27 Cylance Inc. Endpoint detection and response system with endpoint-based artifact storage
US10423638B2 (en) 2017-04-27 2019-09-24 Google Llc Cloud inference system
US11269960B2 (en) * 2017-05-15 2022-03-08 Microsoft Technology Licensing, Llc Dynamic search interfaces

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153060A (ja) * 1995-11-30 1997-06-10 Matsushita Electric Ind Co Ltd 情報検索方法およびその装置
WO2003019420A1 (en) * 2001-08-27 2003-03-06 Verity, Inc. Method and apparatus for merging result lists from multiple search engines

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5948061A (en) * 1996-10-29 1999-09-07 Double Click, Inc. Method of delivery, targeting, and measuring advertising over networks
US5987446A (en) * 1996-11-12 1999-11-16 U.S. West, Inc. Searching large collections of text using multiple search engines concurrently
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US6006222A (en) * 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US6078916A (en) * 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
US6182068B1 (en) * 1997-08-01 2001-01-30 Ask Jeeves, Inc. Personalized search methods
US6275820B1 (en) * 1998-07-16 2001-08-14 Perot Systems Corporation System and method for integrating search results from heterogeneous information resources
US6370527B1 (en) * 1998-12-29 2002-04-09 At&T Corp. Method and apparatus for searching distributed networks using a plurality of search devices
US6480837B1 (en) * 1999-12-16 2002-11-12 International Business Machines Corporation Method, system, and program for ordering search results using a popularity weighting
KR20010106590A (ko) * 2000-05-22 2001-12-07 함광선 통신상의 웹사이트 통합 검색방법 및 이 방법을수행하도록 프로그램된 소프트웨어가 저장된 매체
KR100388152B1 (ko) * 2000-06-17 2003-06-18 (주)준맨 광고 서버를 이용한 인터넷상의 광고 방법
US20020069194A1 (en) * 2000-12-06 2002-06-06 Robbins Benjamin Jon Client based online content meta search
KR20020069447A (ko) * 2001-02-26 2002-09-04 신하균 각종 컨텐츠의 사이버 머니를 통합적인 기준 환율로변환시키는 시스템
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US6795820B2 (en) * 2001-06-20 2004-09-21 Nextpage, Inc. Metasearch technique that ranks documents obtained from multiple collections
US7058624B2 (en) * 2001-06-20 2006-06-06 Hewlett-Packard Development Company, L.P. System and method for optimizing search results
CN1389811A (zh) * 2002-02-06 2003-01-08 北京造极人工智能技术有限公司 搜索引擎的智能化搜索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153060A (ja) * 1995-11-30 1997-06-10 Matsushita Electric Ind Co Ltd 情報検索方法およびその装置
WO2003019420A1 (en) * 2001-08-27 2003-03-06 Verity, Inc. Method and apparatus for merging result lists from multiple search engines

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200300258014; 守村 篤 他: 'WWWを対象としたサーチエンジン間統合機能の実現' 電子情報通信学会技術研究報告 第101巻 第191号, 20010710, pp.111-117, 社団法人電子情報通信学会 *
JPN6012046039; 守村 篤 他: 'WWWを対象としたサーチエンジン間統合機能の実現' 電子情報通信学会技術研究報告 第101巻 第191号, 20010710, pp.111-117, 社団法人電子情報通信学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012190061A (ja) * 2011-03-08 2012-10-04 Sony Corp 情報処理装置、端末装置、情報提示システム、評価スコアの算出方法、及びプログラム

Also Published As

Publication number Publication date
KR20060017502A (ko) 2006-02-23
KR100778159B1 (ko) 2007-11-22
JP2006524871A (ja) 2006-11-02
EP1631901A4 (en) 2007-10-31
WO2004097570A2 (en) 2004-11-11
US20040215607A1 (en) 2004-10-28
CN1809803A (zh) 2006-07-26
WO2004097570A3 (en) 2005-01-13
CN100432921C (zh) 2008-11-12
JP5705497B2 (ja) 2015-04-22
EP1631901A2 (en) 2006-03-08
US7219090B2 (en) 2007-05-15

Similar Documents

Publication Publication Date Title
JP5705497B2 (ja) 異なるソースからのサーチエンジン結果を1つのサーチ結果へと混合する方法及びシステム
US7827184B2 (en) System and method for modeling user selection feedback in a search result page
US7603342B2 (en) Method, device and software for querying and presenting search results
JP4991289B2 (ja) 予め定義されたサーチ問合せからサーチ結果へのアクセスを与えるurlで補足されるサーチエンジン
KR101063364B1 (ko) 웹 크롤링 프로세스 동안 웹 사이트에 우선순위를 부여하기위한 시스템 및 방법
US6718324B2 (en) Metadata search results ranking system
US8352467B1 (en) Search result ranking based on trust
US8775396B2 (en) Method and system for searching a wide area network
US7660781B2 (en) Method, apparatus and computer-readable medium for searching and navigating a document database
US6832218B1 (en) System and method for associating search results
US6182065B1 (en) Method and system for weighting the search results of a database search engine
JP4714156B2 (ja) 記事情報を用いて検索ランク付けを改良するための方法およびシステム
US9053158B1 (en) Method for human ranking of search results
US8321400B2 (en) Method, device and software for querying and presenting search results
US7240052B2 (en) Refinement of a search query based on information stored on a local storage medium
US20090043749A1 (en) Extracting query intent from query logs
US20020078045A1 (en) System, method, and program for ranking search results using user category weighting
JP2008071259A (ja) ブックマーク・タグ設定装置
US20060116992A1 (en) Internet search environment number system
JP2010186214A (ja) 検索装置
US20080114786A1 (en) Breaking documents
CA2537270C (en) Method, device and software for querying and presenting search results
JP3604069B2 (ja) 文書間関連度計算装置、その方法およびその記録媒体
US8676790B1 (en) Methods and systems for improving search rankings using advertising data
Van Veen Linking electronic documents and standardisation of URL’s

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120903

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121203

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130104

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130722

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140106

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140109

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20140314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150225

R150 Certificate of patent or registration of utility model

Ref document number: 5705497

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350