JP2007505403A - 母集団情報を用いて探索ランク付けを改善する方法とシステム - Google Patents

母集団情報を用いて探索ランク付けを改善する方法とシステム Download PDF

Info

Publication number
JP2007505403A
JP2007505403A JP2006526320A JP2006526320A JP2007505403A JP 2007505403 A JP2007505403 A JP 2007505403A JP 2006526320 A JP2006526320 A JP 2006526320A JP 2006526320 A JP2006526320 A JP 2006526320A JP 2007505403 A JP2007505403 A JP 2007505403A
Authority
JP
Japan
Prior art keywords
population
determining
search query
search
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006526320A
Other languages
English (en)
Inventor
サイモン トング、
マーク ピアソン、
Original Assignee
グーグル・インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インク filed Critical グーグル・インク
Publication of JP2007505403A publication Critical patent/JP2007505403A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

探索問い合わせの探索ランク付けを、その探索問い合わせに関する問い合わせと関連するデータを用いることによって改善するシステムと方法を説明する。1つの態様では、探索問い合わせが受信され、この探索問い合わせと関連する母集団が決定され、その探索問い合わせと関連する(Webページなどの)項目が決定されて、その母集団と関連するデータに少なくとも部分的に基づいたその項目のランク付け得点が決定される。このようなシステムと方法を実行する際に有用な母集団と関連するデータのアルゴリズムとタイプを説明する。
【選択図】図1

Description

本発明は一般的には探索エンジンに関する。より詳しくは、本発明は、母集団情報を用いて探索ランク付けを改善する方法とシステムに関する。
背景技術
WWWなどのネットワーキングされたコンピュータ環境でまたは個々のコンピュータ中で動作する従来の探索エンジンは、ユーザが探索問い合わせを入力するとそれに応答して探索結果を提供することが可能である。多くの例では、探索結果は、探索エンジンの得点付けやランク付けのシステムや方法にしたがってランク付けされる。たとえば、従来の探索エンジンは、特定の問い合わせに対する探索結果の文書を、キーワードまたは特定の語もしくは句が探索結果中の各々の文書に顕れる回数によって得点またはランク付けする。文書には、たとえば、HTML、XML、XHTMLなどのさまざまなフォーマットを持つWebページと、携帯式文書フォーマット(PDF)ファイルと、ワープロやアプリケーションプログラムの文書ファイルと、がある。他の探索エンジンでは、文書の内容以上のものに基づいて得点付けやランク付けの結果を提供する。たとえば、Sergey BrinとLawrence Pageによる「大規模ハイパーテキスト探索エンジンの解剖学的構造(The Anatomy of a Large−Scale Hypertextual Search Engine)」という題名の項目に記載された1つの周知の方法では、Webページなどの文書に対して、そのWebページのリンク構造に基づいて重要度を割り当てる。他の従来の方法では、特定の問い合わせに対する探索結果におけるより高い得点やランクを、ユーザや顧客を自分のWebサイトにひきつけることを希望している第三者に対して売却する。
一部の例では、特定のロケーションにいるユーザが探索問い合わせを探索エンジンに入力してそのユーザに関連した探索結果を得る。たとえば、日本のユーザは、探索問い合わせを入力して、日本語のWebサイトを含む探索結果を得る。このような問い合わせに応答して、従来の探索エンジンでは信頼性のない探索結果を返送しかねないが、それは、その探索取り合わせに対してユーザにとって関係のあるまたは役に立つ、ユーザのロケーションにしたがって探索結果をランク付けしたり得点したりするためのデータが比較的少ないからである。
従来の探索エンジンでは、この探索エンジンにアクセスするためにどのようなタイプのWebブラウザアプリケーションが用いられるかによってユーザに関連する情報を決定することが可能である。たとえば、ユーザがWebブラウザアプリケーションをインターネットからダウンロードする際に、ユーザには、自身の好みの言語に基づいて特定のバージョン、たとえば日本語バージョンやフランス語バージョンのアプリケーションをダウンロードするオプションがある。ユーザがインターネットを介して探索エンジンにアクセスするためにフランス語バージョンのWebブラウザアプリケーションを用いると、この探索エンジンは、フランス語バージョンのWebブラウザアプリケーションを用いていることを検出すると、それだけでこのユーザはフランスにいるのであろうとしばしば判定する。
他の従来の探索エンジンは、特定のユーザが探索問い合わせで用いた国ドメイン接尾辞によってロケーション情報を得る。たとえば、日本のユーザは、日本語バージョンの探索エンジンを要求する際に、ドメイン名接尾辞”.com”の代わりに国ドメイン接尾辞”co.jp”を持つ探索エンジンのWebアドレスを入力する。このような入力に基づいて、探索エンジンは、ユーザは日本にいるらしいと判定する。
探索エンジンが探索問い合わせに対して2つ以上の探索結果を返送すると、このような探索結果は、これら探索結果と関連する文書に対するリンクのリストとして表示される。ユーザは、これら探索結果の内の1つ以上と関連するWebサイトをブラウズして訪問して、このWebサイトがユーザの探索問い合わせと関連しているかどうか評価する。たとえば、ユーザはマウスや別の入力デバイスを操作して、特定の探索結果のところで「クリック」して、その探索結果と関連するWebサイトを閲覧する。多くの例では、ユーザは、探索結果中に提供されているいくつかのWebサイトをブラウズして訪問して、これらいくつかのWebサイトの各々と関連するリンクのところでクリックしてから、ユーザの探索問い合わせに対応する有用なまたは関連する情報を突き止める。
1つの探索結果集合と関連する複数のWebサイトに対する複数のリンクをクリックすると、時間がかかりかねない。探索エンジンで用いられるランク付けアルゴリズムを改善して、したがって、ユーザに対してより良好な探索結果を提供することが望ましい。
概要
本発明の実施形態は、探索問い合わせに対する探索ランク付けを、この探索問い合わせと関連する母集団情報を用いることによって改善するシステムと方法について記載する。本発明の1つの態様は、探索問い合わせを受信するステップと、この探索問い合わせと関連する母集団を判定するステップとを含む。このような母集団はさまざまな方法で定義され、判定される。本発明の別の態様は、探索問い合わせと関連する項目(Webページなど)を判定するステップと、母集団と関連するデータに少なくとも部分的に基づいて項目のランク付け得点を判定するステップとを含む。母集団情報を用いるさまざまなアルゴリズムがこのようなシステムと方法で適用される。
本発明に関する上記のおよび他の特徴、態様および長所は、次の添付図面を参照して以下の詳細な説明を読めばより良好に理解されるであろう。
詳細な説明
本発明は、母集団情報を用いることによって探索ランク付けを改善する方法とシステムを含む。以下に、本文と添付図面とに解説されているように本発明の例示の実施形態を詳細に参照する。図面全体と以下に説明にわたって、同じ又は同様の部品を参照するのに同じ参照番号を用いる。
本発明によるさまざまなシステムが構築される。図1は、本発明の例示の実施形態が内部で動作する例示のシステムを示す図である。本発明は他のシステムでも動作し、また、実施される。
図1に示すシステム100は、複数のクライアントデバイス102a〜102n、サーバデバイス104およびネットワーク106を含む。図示するネットワーク106はインターネットを含む。イントラネットなどの他のネットワークが用いられる実施形態もある。そのうえ、本発明による方法は1つのコンピュータで動作する。図示するクライアントデバイス102a〜102nはその各々が、プロセッサ110にカップリングされている実施形態中に、ランダムアクセスメモリー(RAM)108などのコンピュータ読み取り可能媒体を含む。プロセッサ110は、メモリー108に記憶されているコンピュータ実行可能プログラム命令の集合を実行する。このようなプロセッサには、マイクロプロセッサ、ASICおよび状態機械が含まれる。このようなプロセッサは、プロセッサによって実行されると、本書に記載するステップをプロセッサに実行させる命令を記憶する媒体、たとえばコンピュータ読み取り可能媒体を含むまたはこれらと通信する。コンピュータ読み取り可能媒体の実施形態には、これに限られないが、タッチセンシティブ入力デバイスと通信するプロセッサなどのプロセッサに対してコンピュータ読み取り可能命令を提供することが可能な電子式、光式、磁気式または他の方式の記憶デバイスや送信デバイスが含まれる。適当な媒体の他の例には、これに限られないが、フロッピディスク、CD−ROM、磁気ディスク、メモリーチップ、ROM、RAM、ASIC、設定済みプロセッサ、あらゆる光媒体、あらゆる磁気テープもしくは他の磁気媒体または、コンピュータが命令を読み取ることが可能な他の何らかの媒体が含まれる。また、有線と無線の双方の方式のルータ、プライベートネットワークもしくはパブリックネットワークまたは他の送信デバイスもしくは送信チャネルを含む他のさまざまな形態のコンピュータ読み取り可能媒体がコンピュータに対して命令を送信または搬送する。これらの命令は、たとえば、C、C++、C#、VisualBasic、JavaおよびJavaScriptを含むなんらかのコンピュータプログラム言語によるコードを含む。
クライアントデバイス102a〜102nはまた、マウス、CD−ROM、キーボード、ディスプレイまたは他の入力デバイスもしくは出力デバイスなどの多くの外部デバイスや内部デバイスが含まれる。クライアントデバイス102a〜102nの例としては、パソコン、ディジタルアシスタンツ、携帯情報端末、携帯電話、モバイル電話、スマート電話、ポケベル、ディジタルタブレット、ラップトップコンピュータ、プロセッサベースのデバイスならびに類似のタイプのシステムおよびデバイスがある。一般的に、クライアントデバイス102a〜102nは、ネットワーク106に接続され、1つ以上のアプリケーションプログラムと対話するなんらかのタイプのプロセッサベースのプラットフォームである。図示するクライアントデバイス102a〜102nには、マイクロソフト社のInternet Explorer(商標)のバージョン6.0、ネットスケープ通信社のNetscape Nagvigator(商標)のバージョン7.1およびアップルコンピュータ社のSafari(商標)のバージョン1.0などのブラウザアプリケーションプログラムを実行するパソコンが含まれる。
クライアントデバイス102a〜102nを介して、ユーザ112a〜112nは、ネットワーク106上で互いに通信したり、ネットワーク106に接続されている他のシステムやデバイスと通信したりすることが可能である。ユーザ112a〜112nは互いに異なったロケーション、国または領域に置くことが可能である。図1に示すように、サーバデバイス104もまたネットワーク106に接続されている。図示する実施形態では、ユーザ112a〜112nは、クライアントデバイス102a〜102nのところから探索問い合わせを生成して、ネットワーク106を介してサーバデバイス104に送信することが可能である。たとえば、1つの国にいるユーザ112aは、テキストによる探索問い合わせ114をクライアントデバイス102aに表示されているWebページの問い合わせフィールド中にタイプする。すると、クライアントデバイス102aは、この探索問い合わせ114を表す関連の探索問い合わせ信号126をネットワーク106を介してサーバデバイス104に送信する。
図示するサーバデバイス104は、Google(商標)探索エンジンなどの探索エンジンアプリケーションプログラムを実行するサーバを含んでいる。クライアントデバイス102a〜102nと類似して、図示するサーバデバイス104は、コンピュータ読み取り可能メモリー118にカップリングされているプロセッサ116を含んでいる。1つのコンピュータシステムとして表されているサーバデバイス104は、コンピュータプロセッサのネットワークとして実現される。サーバデバイス104の例には、サーバ、メインフレームコンピュータ、ネットワーキングされたコンピュータ、プロセッサベースのデバイスならびに類似のタイプのシステムおよびデバイスが含まれる。クライアントプロセッサ110とサーバプロセッサ116は、カリフォルニア州サンタクララ市のインテル社のプロセッサや、イリノイ州のシャウンブルグ市のモトローラ社のプロセッサなどの多くの周知のコンピュータプロセッサの内のどれでもよい。
メモリー118は、探索エンジン124としても知られる探索エンジンアプリケーションプログラムを包含している。探索エンジン124は、ユーザ112a〜112nからの探索問い合わせに応答して関連する情報を突き止める。
サーバデバイス104または関連のデバイスは、前もってネットワーク106を探索してネットワーク106に接続されている他のデバイスやシステムのところに記憶されているWebページなどの項目を突き止めて、メモリー118や別のデータ記憶デバイス中のこの項目にインデックスを付けている。項目には、文書、たとえば、HTML、XML、XHML、携帯式文書フォーマット(PDF)ファイルなどのさまざまなフォーマットを持つWebページならびに、ワープロ、データベースおよびアプリケーションプログラム文書ファイル、オーディオ、ビデオもしくは、(インターネットなどの)ネットワーク、パソコン、または他の計算手段もしくは記憶手段で利用可能である他のどのような情報でも含まれる。本書に説明する実施形態は一般に文書に関連して説明するが、どのようなタイプの項目に対しても実施形態は動作する。
探索エンジン124は、探索問い合わせ114を表す関連の探索問い合わせ信号126に応答して、関連の情報または探索結果132の集合を、探索問い合わせ114の発信元であるクライアントデバイス102a〜102nに対して返送する。
図示する探索エンジン124は、文書ロケータ134とランク付けプロセッサ136と、母集団プロセッサ138とを含んでいる。図示する実施形態では、各々がメモリー118中に常駐するコンピュータコードを含んでいる。文書ロケータ134は、ユーザ112aからの探索問い合わせ114に対する応答である文書の集合を識別する。図示する実施形態では、これは、潜在的な探索問い合わせまたは探索条件にしたがってインデックス付けされている文書のインデックスにアクセスすることによって遂行される。ランク付けプロセッサ136は、探索問い合わせ114および/または別のいずれかの判定基準に対する関連性に基づいて、突き止められたWebページまたは文書の集合を含んでいる探索結果132をランク付けまたは得点付けする。母集団プロセッサ138は、ユーザ112a〜112nと関連する母集団を表すまたは別様にこれに対して対応する母集団信号128などの母集団信号を判定または別様に測定する。なお、文書ロケータ134、ランク付けプロセッサ136および母集団プロセッサ138の他の機能と特徴は以下にさらに説明する。
サーバデバイス104もまた、図示する例中の母集団データベース120である母集団データ記憶エレメントや図示する例中の選択データデータベース122である選択データ記憶エレメントなどの他の記憶エレメントにアクセスする。図示する具体的な選択データベースはクリックスルー式データベースであるが、どのような選択データ記憶エレメントを用いてもよい。データ記憶エレメントには、配列、ハッシュテーブル、リストおよびペアを無制限に含むデータを記憶する方法の内のいずれか1つまたは組み合わせが包含される。他の類似したデータ記憶デバイスもサーバデバイス104からアクセス可能である。母集団データベース120は、ユーザ112a〜112nが探索問い合わせを入力するとそれに関連する母集団情報を記憶する。ユーザ112a〜112nと関連する母集団情報の例には、ユーザ112a〜112nのロケーションに関する情報と、ユーザ112a〜112nが関連する母集団についての情報と、ユーザ112a〜112nが関連するグループについての情報が含まれる。
ユーザのロケーションの例には、これに限られないが、大陸、領域、国、州または市が含まれる。1例として、ユーザのロケーションは、フランス、ドイツ、日本および米国などの国として識別される。
ユーザが関連するロケーションの例には、これに限られないが、性別、人口統計、民族的背景、大陸、領域、国、州、郡または市を含むことが可能である。1例として、ユーザが関連する母集団は、「18歳未満」、「18〜24歳まで」、「25〜34歳まで」、「35〜49歳まで」、「50〜62歳まで」および「63歳以上」などのユーザの年齢幅で識別することが可能である。
ユーザが関連するグループの例には、これに限られないが、性別、人口統計学的グループ、民族的グループ、特徴を共有する人物、興味を共有する人物および所定の選択によって分類された人物を含むことが可能である。1例として、ユーザが関連することが可能なグループは、「古代の鮫の歯を収集することに興味を持つすべての人物」と「古代の鮫の歯には興味を持たないすべての人物」として識別することが可能である。
母集団情報はまた、自己識別タイプデータまたは自動識別タイプデータを含むことが可能である。自己識別タイプデータには、これに限られないが、ユーザ登録データ、ユーザ嗜好データおよびユーザが選択した他のデータが含まれる。1例として、自己識別データとは、ユーザがブラウザアプリケーションプログラムに入力する言語嗜好選択である。自動識別タイプデータには、これに限られないが、ユーザのロケーションのインターネットプロトコルアドレス、ユーザのブラウザアプリケーションプログラムから得られるデフォルトデータ、クッキーおよび、ユーザのアプリケーションプログラムが探索エンジンと対話しているときにこのアプリケーションプログラムから収集された他のデータが含まれる。1例として、自動識別データは、インターネット上のユーザのネットワークアドレスのドメインを含むかまたは、ユーザのブラウザアプリケーションプログラムによって得られるまたはアクセスされる「クッキー」に記憶されている情報である。
探索エンジン124は、母集団情報を判定するまたは別様に命令の集合を実行してユーザ112a〜112nと関連する母集団情報を判定して、母集団タイプの情報を母集団データベース120に記憶する。代替例では、母集団プロセッサ138は母集団情報を判定するまたは別様に命令の集合を実行してユーザ112a〜112nと関連する母集団情報を判定して、母集団タイプの情報を母集団データベース120に記憶する。
本発明は、図1に示すアーキテクチャとは異なったアーキテクチャを有するシステムを含むことに注意すべきである。たとえば、母集団データベース120とプロセッサ138は探索エンジン124の一部ではなく、母集団データの修正や他の動作をオフラインで実行する本発明によるシステムがある。また、母集団プロセッサ138が文書ロケータ134または他のシステムの出力に影響するような実施形態もある。図1に示すシステム100は単に例示であり、図2〜3に示す例示の方法を説明するために用いている。
図示する実施形態では、母集団データベース120は、図2〜3に示すような本発明の例示の方法を実行する以前に収集され記憶されたデータを包含する。図1をさらに参照すると、図示する母集団プロセッサ138は、探索取り合わせを入力し、この探索問い合わせの探索結果を選択するユーザのロケーションを獲得して分析することによって、ユーザ112a〜112nと関連する母集団情報を記録する。たとえば、日本にいるユーザ112aが「舟遊び」などの最初の探索問い合わせをタイプインすると、母集団プロセッサ138はユーザ112aが日本にあるインターネットプロトコルアドレスから探索問い合わせを送信していること、また、ブラウザアプリケーションプログラムの日本語版を用いているものと判定する。さらに、ユーザ112aが探索問い合わせに応答して探索エンジンが返送した特定の探索結果を選択すると、母集団プロセッサ138は、ユーザ112aが特定の文書を日本語で選択するものと判定する。このように、日本にいるユーザ112aが問い合わせ「舟遊び」を入力すると、日本にいるユーザ112aに関連する”boating.co.jp”などの探索結果が返送される。他のタイプの母集団情報も本発明によって判定して母集団データベース120に記憶することが可能である。
別の例として、母集団データベース120は、ユーザが母集団の亜母集団と関連しているという情報を記憶することが可能である。たとえば、母集団プロセッサ138は、世界におけるある領域であるヨーロッパにいるユーザ112aがヨーロッパの国であるルクセンブルグから通信していると判定する。母集団データベース120はまた、ヨーロッパにいる別のユーザがヨーロッパの別の国であるフランスから通信しているという情報を記憶することが可能である。このように、各々のユーザは、「ヨーロッパ」という母集団と関連していると同時に、それぞれの亜母集団、すなわち、「ルクセンブルグ」と「フランス」と関連している。母集団と亜母集団は、これに限られないが、大陸、領域、国、州、郡、市、性別、人口統計学的グループ、民族的グループ、話す言語、ユニバーサルリソースロケータ、インターネットプロトコルアドレス、ドメイン名、インターネットサービスプロバイダ、グループ、特徴を共有する人物、興味を共有する人物および所定の選択によって分類された人物を含むことが可能である。ある母集団に対してさまざまなレベルの亜母集団が存在しえる。たとえば、「パリっ子」は「フランス」の亜母集団であり、「フランス」は「ヨーロッパ」の亜母集団であり、「ヨーロッパ」は「世界」の亜母集団である。亜母集団の情報は、フランスなどの特定のロケーションすなわち母集団からユーザが不十分な回数クリックすれば有用なものとなりえる。しかしながら、フランスは「ヨーロッパ」の亜母集団であるので、「ヨーロッパ」にいるユーザに対応するクリック情報は、フランスにいるユーザからの問い合わせに対するクリック情報を強化する目的で用いることが可能である。一般に、亜母集団に対するクリック情報がわずかしかないまたは存在しない場合、より高いレベルの母集団からの情報をクリック情報を強化する目的で用いることが可能である。
母集団情報と亜母集団情報を判定する際に、母集団プロセッサ138はまた、各々のタイプの情報に対して重み付けすることが可能である。たとえば、母集団プロセッサ138は、ユーザが特定の領域から通信していることに対して、ユーザが特定の国から通信していることに対するより少なく重み付けし、これで、後続の探索問い合わせに対するより良い探索結果が領域情報と国情報から得ることが可能となるようにすることが可能である。このように、ユーザが特定の領域(ヨーロッパ)から通信しているという情報を、ユーザが特定の国(フランス)から通信していることに対するよりも少なく重み付けすることが可能である。母集団タイプのデータに対する他のタイプの重み付けまたは類似の重み付けを本発明によって定義して母集団データベース120に記憶することが可能である。
図示する母集団データベース120は、特定の問い合わせに対するユーザロケーションのリストが包含されている。たとえば、「船遊び」という探索問い合わせに対して、「船遊び」という探索を入力したユーザの判定済みのロケーションなどの母集団情報は記憶されて、「船遊び」という探索問い合わせと関連付けられる。ユーザのロケーションは「フランス」や、「日本」や、「米国」であったりする。このようなロケーションが例示の目的のために用いられる。ロケーションの数が多かったり少なかったり、他の国や、ロケーションや、母集団や、亜母集団が用いることが可能な実施形態もある。
本発明のさまざまな実施形態によって実現される母集団データベースに記憶される情報の例には次のものがある:
Figure 2007505403
上に示した表で、第1のカラムには固有の問い合わせがリストアップされており、第2のカラムにはそれに対応するユーザロケーションがリストアップされている。各々の問い合わせは、ユーザが入力した探索問い合わせを表している。対応するユーザロケーションは、それぞれの問い合わせを入力したユーザの判定済みのロケーションを表している。したがって、上に示した問い合わせ“Q1”に対して、問い合わせ“Q1”を前もって力したユーザの判明済みロケーションとして、「日本」、「フランス」および「米国」が含まれる。この表を本発明によって実現するには、探索エンジン124は、“Q1”のような特定の問い合わせに対して“ロケーション”のカラム中のユーザの判明済みロケーションを見ればよい。ユーザが新たな問い合わせを入力すると、この新たな問い合わせは「問い合わせ」のカラムに挿入される。同様に、この新たな問い合わせに対するユーザのロケーションが判明したら、この新たなロケーションは「ロケーション」という名前の2番目のカラムに挿入される。
図示するクリックスルーデータベース122は、探索問い合わせ114に応答して突き止められた文書のリストからユーザが選択した探索結果などの探索エンジン124からユーザが選択した探索結果132と関連するデータを記憶する。たとえば、ユーザ112aは、クライアントデバイス102a〜102nから、マウスや別の入力デバイスを操作して、探索結果132のWebページまたは文書と関連する1つ以上のURLをクリックして入力情報を入力する。ユーザの「クリック」は、探索結果132中で突き止められた文書をユーザが選択することによって発生する。ある文書をこのように「クリック」するとそれは、特定の探索問い合わせに対して返送される探索結果中にこの文書が存在することと関連する選択としてクリックスルーデータベース122に記憶される。探索結果中からユーザが文書を選択するとそれに関連するこのような他の多くの選択タイプのデータもそこに記憶される。
ユーザがクリックしたものは「クリックスルー」データと呼ばれる。本実施形態では、探索エンジン124は、クリックスルーデータと、探索結果132中で突き止められた文書の各々と関連する他のデータとを測定して記憶する。
クリックスルーデータは一般には探索結果における品質のインジケータである。品質信号またはクリックスルーデータには、これに限られないが、特定のURLもしくは文書が特定のユーザによってクリックされたかどうか、URL、文書もしくはWebページが一人以上のユーザによってどれほど頻繁にクリックされるか、特定のユーザが特定の文書やWebページをどれほど頻繁にクリックするかを含むことが可能である。ユーザ入力や観察タイプのデータなどのクリックスルーデータに類似した他のタイプの品質信号を、クリックスルーデータベース122や類似のデータ記憶デバイスで記憶することが可能である。
クリックスルーデータベース122や他のデータ記憶デバイスに記憶することが可能な探索結果132中で突き詰められた文書に関連する他のデータには、これに限られないが、特定のURL、文書またはWebページがどれほどしばしば探索問い合わせ114に応答して示されたか、特定のロケーションのユーザ112a〜112nによって特定の探索問い合わせ114が何回依頼されたか、特定の母集団のユーザ112a〜112nによって特定の探索問い合わせ114が何回依頼されたか、特定のロケーションのユーザ112a〜112nによって特定の文書が何回選択されたか、特定の母集団のユーザ112a〜112nによって特定の文書が何回選択されたか、特定の探索問い合わせ114に対して特定の文書がユーザ112a〜112nによって何回選択されたか、特定の文書がネットワーク106上に通知された年代または時間およびネットワーク106における特定の文書のソースのアイデンティティを含むことが可能である。
母集団データベース120からの母集団情報と選択データベース(クリックスルーデータベース122として示されている)からの選択データとは、母集団プロセッサ138によって処理して後で使用されるように記憶することが可能である。たとえば、母集団プロセッサ138は特定の探索問い合わせのためのクリックスルーデータを検索する。特定の探索問い合わせ用のこのクリックスルーデータはユーザのロケーションに基づいて割り当てられる。探索エンジン124は、母集団データベース120にコールして、特定の探索問い合わせを入力してこの問い合わせの探索結果の文書を選択するすべてのユーザのロケーション情報を求める。母集団プロセッサ138が、日本、フランスおよび米国という3つのロケーションから通信するユーザが特定の問い合わせ114のための選択データを提出したと判定すると、各々のロケーションからのユーザの各々の集合に対するそれぞれの記号表示を母集団プロセッサ138で定義することが可能である。したがって、日本から通信するユーザを“J”と記号表示し、フランスからのユーザを“F”と記号表示し、米国からのユーザを“US”と記号表示することが可能である。次に、母集団プロセッサ138は、特定の文書集合に対してクリックスルーデータベース122によって収集されたクリック動作の数をそれぞれの記号表示に対してユーザロケーションに基づいて割り当てる。
本発明の実施形態によって実現される母集団データベースに記憶される情報の1例を以下に示す。
Figure 2007505403
図示する母集団データベース120に対して上記された例では、探索問い合わせ“Q”に対して、文書“D”に対するユーザのクリック総数は“101”であった。日本にいるユーザの文書“D”に対するユーザクリック総数は“1”であり、フランスにいるユーザの文書“D”に対するユーザクリック総数は“20”であり、米国にいるユーザの文書“D”に対するユーザクリック総数は“80”であった。
図1に示す実施形態では、サーバ104は母集団データベース120およびクリックスルーデータベース122と通信している。サーバ104はあるプロセスを実行するが、このプロセスによって、2つのデータベース120と122中のデータが用いられて、ユーザ112aからの探索問い合わせ114に応答して提供される探索結果が改善される。
本発明にしたがってさまざまな方法が実行される。本発明による1つの例示の方法は:探索問い合わせを受信するステップと、この探索問い合わせと関連する母集団を決定するステップと、この探索問い合わせと関連する(Webページなどの)項目を決定するステップと、この項目のランク付け得点をこの母集団と関連するデータに少なくとも部分的に基づいて決定するステップと、を含む。このように、この母集団情報を用いて、項目のランク付け得点に影響を与える。この母集団情報は、探索問い合わせおよび/または項目に対して決定された母集団(たとえばグループや亜母集団)の動作を示すのが望ましい。たとえば、この情報は、同じの、類似したまたは関連した問い合わせに対する同じの、類似したまたは関連した母集団によって選択された好ましい項目を示す。
探索問い合わせと関連する第2の項目、第3の項目、第4の項目などのランク付け得点もまた、母集団と関連した情報に少なくとも部分的に基づいて決定される。次に、これらの項目はランク付け得点に基づいて互いに対してランク付けされて、探索問い合わせを提出する人物に対してランク付けされた順序で提示される。この結果、最も関連する項目をユーザに対して最初に提供するようなランク付けとなることが望ましい。
問い合わせと関連する母集団はさまざまな母集団の内の1つ以上であってよい。例としては、これに限られないが、年齢、年齢層、性、人種、第1言語、第2言語、ロケーション、収入、収入層、大陸、領域、国、州、郡、市、性別、民族的グループ、グループ、特徴を共有する人物、興味を共有する人物および所定の選択によって分類された人物などの人口統計学的データと、インターネットサービスプロバイダデータ(またはこれらの内のいずれかに対するありそうなもしくは考えられるデータ)が含まれる。言い換えれば、母集団は、選択されたなんらかの特徴によって決定されたなんらかのグループである。
探索問い合わせと関連する母集団は、さまざまな方法の内の1つ以上の方法で決定される。たとえば、探索問い合わせの送出者と関連する人口統計学的データは、目的とする母集団を決定するために決定され、また、このデータは上記の母集団または他の母集団の内の1つ以上であってよい。たとえば、探索問い合わせの送出者のありそうな地理的ロケーションは、探索問い合わせの送出元であるインターネットプロトコルアドレス、送出者が探索エンジンにアクセスするために入力したアドレスまたは送出者が入力した人口統計学的データを特定することによって判定される。探索問い合わせと関連する母集団もまた、探索問い合わせと関連する人口統計学的データを判定するなどの他の方法で判定される。この動作は、たとえば、探索問い合わせの言語を判定したり、探索問い合わせの前の送出者と関連するデータを判定したりすることによって遂行される。
これから分かるように、探索問い合わせと関連する母集団を判定するステップは、自己識別データ、自動識別データもしくは他のデータまたは、ユーザ登録データ、ユーザ嗜好データおよびユーザ選択データなどの探索問い合わせを送信するユーザに関連する他のデータや情報を判定するステップを含むことがある。たとえば、会員資格を登録したりWebサイトにアクセスしたりする際に、ユーザは登録情報を入力する。ユーザはこのような登録プロセス中に嗜好(たとえば好みの言語)を示したり他の方法で嗜好(Webページやドメインの使用の選択など)を示したりする。自動識別データには、たとえば、IPアドレス、ドメイン、得られたデフォルトデータ、ユーザと関連するアプリケーションまたは他の自動的に調達されたもしくは自動的に提供された情報が含まれる。もちろん、自己識別データと自動識別データ間にはいくぶんかの重複が存在する可能性がある。
母集団と関連するデータ自身も1つ以上の方法で判定される。たとえば、母集団という文脈におけるある項目の選択得点が判定される。例証として、当面の探索問い合わせと関連する母集団のある数のメンバーが、以前に当の項目にクリックしていると判定される。この選択得点は、母集団のメンバーが当の項目に対して持っている相対的な興味を示している。
また、母集団情報を含むことが可能なさまざまなデータが存在する。他の例としては、母集団のメンバーの数、母集団の内で探索問い合わせに対して以前に返送された結果を選択したメンバーの数、母集団の内で探索問い合わせを入力したメンバーの数、母集団の内で探索問い合わせに対する探索結果が示された相手のメンバーの数、選択総得点、および母集団の内で項目を選択したメンバーの総数が含まれる。他にも多くの例がある。
一部の例では、探索問い合わせと関連する2つ以上の母集団を、探索結果を改善するために決定されて用いられる。1つの実施形態では、たとえば、探索問い合わせと関連する第2の母集団を決定するが、項目のランク付け得点の決定はさらに、第2の母集団と関連するデータに少なくとも部分的に基づいて実行される。
本発明の実施形態の上記の態様および他の態様を以下にさらに説明する。本発明の実施形態のこれらの例示の態様は、探索結果を改善するために繰り返されたり反復されたりする。そのうえ、本発明による方法で実施される上記のステップおよび他のステップは、プロセッサと結合しているメモリーやディスクなどのコンピュータ読み取り可能媒体または他のコンピュータ読み取り可能媒体中にプログラムコードという形態で記憶される。
図2〜3に、本発明による例示の方法200を詳細に示す。この例示の方法は例として提供するものであり、本発明による方法を実行するさまざまな方法がある。図2に示す方法200は、さまざまなシステムの内のいずれかによって実行したり別様に遂行したりすることが可能である。方法200を、図1に示すシステム100によって実行する様子を例として以下に説明するが、システム100のさまざまな部品を、図2〜3の例示の方法を説明するに際して参照する。図示する方法200は、母集団情報を用いる探索ランク付けを改善するものである。
図2〜3に示す各々のブロックは、例示の方法200で実行される1つ以上のステップを表している。図2を参照すると、ブロック202において、例示の方法200が開始される。ブロック202の次にブロック204が実行されるが、ここで、母集団データベース120が提供される。これは、たとえば、このようなデータベースを構築したりこのようなデータベースとの通信を確立したりすることによって遂行される。図1を参照して説明したように、母集団データベース120は、探索問い合わせ114および他の探索問い合わせに対する探索結果中で選択された文書の母集団タイプの情報を記憶する。
ブロック204の後に続いてブロック206が実行されるが、ここで、選択データベース、この場合ではクリックスルーデータベース122が提供される。これは、たとえば、このようなデータベースを構築したりこのようなデータベースとの通信を確立したりすることによって遂行される。図1を参照して説明したように、クリックスルーデータベース122は、ユーザ112aからの探索問い合わせ114に応答して提供された、文書のリストやWebページなどの、探索エンジン124によって提供された探索結果132に対するユーザのクリックや入力と関連するデータを記憶する。
ブロック206の後に続いてブロック208が実行されるが、ここで、探索信号という形態を持つ探索問い合わせがサーバによって受信される。図示する実施形態では、ユーザ112aはクライアントデバイス102aから探索問い合わせ114を発生する。クライアントデバイス102a、探索問い合わせ114を表す関連の探索問い合わせ信号216を、ネットワーク106を介してサーバデバイス104に送信する。探索エンジン124は、探索問い合わせ信号126を受信して、探索問い合わせ114を処理する。たとえば、ユーザ112aが探索問い合わせ「舟遊び」をブラウザウアプリケーションプログラムの探索ページの探索フィールドまたは問い合わせフィールドにタイプインすると、クライアント102aは、「舟遊び」というテキストまたは「舟遊び」を他に表示したり指示したりするものを含む探索問い合わせ信号126を送信する。探索エンジン124は、信号126を受信して、「舟遊び」が所望の探索問い合わせ114であると判定する。
ブロック208の後に続いてブロック210が実行されるが、ここで、項目データ、図示するこの場合では、文書データが判定されて受信される。図示する実施形態では、このブロック210で、探索エンジン124は、以前にネットワーク106からインデックス付けされたことのある探索データベース(図示せず)またはメモリー118中の関連文書に対する探索を実行する。探索エンジン124は、ユーザ112aからの探索問い合わせ114を表す探索問い合わせ信号126に応答して文書データを探索データベースまたはメモリー118から受信する。文書データはまた、探索問い合わせ114に対する初期探索結果とも呼ばれる。文書データには、これに限られないが、文書やWebページに対するリンクを提供するユニバーサルリソースロケータ(URL)または、文書もしくはWebページを、ネットワーク106を介してユーザ112aによってそこから検索したり別様にアクセスしたりすることが可能なロケーションを含むことが可能である。文書データは、本明細書の本文全体を通じて、「文書」と呼ばれる場合があることに注意すべきである。代替例では、文書ロケータ134は、探索問い合わせ114を表す探索問い合わせ信号126に応答して文書データを獲得または別様に受信する。
たとえば、図示するブロック210では、図示する探索エンジン124は、「舟遊び」という探索問い合わせに応答して文書のリストを決定する。この文書リストは決定された文書データを含む。「舟遊び」に対する最初の探索結果リストは、15の文書からなるリストを含むことがありえる。図示する実施形態では、文書データのこの初期決定は、従来のように探索エンジンに問い合わせて結果を返送することによって実施される。
ブロック210の後に続いてブロック212が実行されるが、ここで、目的とする項目毎に、母集団信号を決定する。図示する実施形態では、探索エンジン124は、ブロック210で決定された初期探索結果リストの各々の文書に対して母集団関数を用いて母集団信号128を生成する。たとえば、母集団信号は、ブロック210で決定された初期探索結果の中で特定された15の文書の各々に対して決定される。
母集団信号は目的とする項目のランク付けや得点を示しているが、このランク付けや得点は、探索ユーザと同じ母集団グループ中のユーザの相対的興味を表している。たとえば、ユーザ112aの入力と同じ問い合わせ“Q”を実行する際に問い合わせ側のユーザ112aと同じ母集団グループのユーザによって以前に選択された項目は、ユーザがメンバーとはなっていない母集団グループのユーザにしか以前に選択されていない項目よりも高い得点の母集団信号を受信する。しかしながら、単に1例であり、多くの変更例や置換例が用いられる。母集団信号に表されているこのランク付けや得点は、単独でまたは他の得点信号やランク付け信号と組み合わされて用いられて、文書を得点したりランク付けしたりし、また、文書のグループをランク付けして比較して、たとえば、ユーザによって送られた問い合わせに対する探索結果を提供する。
図示する実施形態では、母集団信号は、母集団信号関数によって決定される。この母集団信号関数は、母集団信号を1つ以上の変数に基づいて計算するアルゴリズムを含んでいる。図示する実施形態における母集団信号は、母集団プロセッサ138によって処理される命令の集合を含んでいる。このアルゴリズムはメモリー118に記憶される。
さまざまな母集団信号関数の内のいずれかの1つ以上の関数が本発明のさまざまな実施形態で実現される。母集団信号関数に含まれる変数の例には、無制限に、次のものの内の1つ以上が含まれる:
・ 問い合わせ“q”に対する項目“d”の選択総得点(たとえば、問い合わせ“q”の文脈で探索結果で返送された文書“d”に対してあらゆるユーザがクリックした合計回数または文書“d”を選択した母集団のメンバーの総数)、
・ 問い合わせ“q”に対する項目“d”の選択得点間の関係の選択されたまたは計算された重み(たとえば、探索問い合わせ“q”の文脈における探索結果で返送された文書“d”に対する母集団“pop”のすべてのユーザによるクリック動作の総数)、
・ 母集団“pop”のメンバーの文脈における問い合わせ“q”に対する文書“d”の選択得点(たとえば、問い合わせ“q”に対する探索に対して文書が返送されたときの母集団のメンバーによる文書に対するクリック回数)、
・ クリック信号を信用するために必要とされるデータの量を表す平滑係数(たとえば、問い合わせ“q”に対する探索結果で返送された文書“d”に対するあらゆるユーザのクリック回数の信頼性または信用を表す係数)、
・ 母集団に関係なくあらゆるユーザの文脈における問い合わせ“q”に対する文書“d”の選択得点(たとえば、文書“d”に対するクリック回数)、
・ 母集団に関係なくあらゆるユーザによる文書の集合の選択総得点(たとえば、問い合わせ“q”に対して返送されたあらゆる文書に対するクリック回数)、
・ 母集団“pop”のあらゆるユーザによる文書の集合の選択得点(たとえば、問い合わせ“q”に対して返送されたあらゆる文書に対するクリック回数)、
・ いずれかの問い合わせ“qに対する母集団”pop“のあらゆるユーザによる文書”d“の選択総得点(たとえば、文書”d“に対するクリック回数)、
・ いずれかの問い合わせ“qに対する母集団に関係なくあらゆるユーザによる文書”d“の選択得点(たとえば、文書”d“に対するクリック回数)、
・ 母集団“pop”のユーザによって問い合わせ“q”が入力された回数、
・ 母集団に関係なくあらゆるユーザによって問い合わせ“q”が入力された回数、
・ 母集団のメンバーの数(たとえば、特定の探索問い合わせを入力した、特定の探索問い合わせに対して返送された結果を選択した、または特定の探索問い合わせに対する探索結果を表示された母集団のメンバーの数)、
・ 考慮されている項目の、母集団に基づいた1つ以上の他のランク付け係数もしくは得点および/または他の係数。
他にもさまざまな変数が含まれるが、これらの変数は単なる例である。そのうえ、これらの変数および他の変数は、指定された時間期間、指定されたユーザ数、ある母集団中の自己識別されたまたは自動識別されたユーザの数によって、問い合わせ“Q”を入力したユーザによって、または他の制限や改良によって制限または定義される。母集団データと関連する変数、制限、定義または他のデータは一般に、母集団情報または母集団データと呼ばれる。
母集団信号関数の例を次に示す:
Figure 2007505403
ここで:“S(qi、)”は探索問い合わせ“q”に対する文書“j”の、特定の母集団“P”のユーザの母集団情報とクリックスルーデータと基づいた計算された得点であり、
“#(qj、P)”は探索問い合わせ“q”に対して母集団“pop”のユーザによって文書“d”がクリックされた回数であり、
“μ”は、問い合わせ“q”に対する母集団“P”のユーザによるクリック数などのクリック信号を信用するに必要なデータの量を表す平滑係数であり、
“#(q)”は、問い合わせ“q”に対する母集団に関係なくあらゆるユーザによって文書“d”がクリックされた回数であり、
“#(q)”は、問い合わせ“q”に対する文書“i”に対するユーザがクリックした総数であり、
“#(qi、P)”は、問い合わせ“q”に対する文書“i”の母集団“P”のあらゆるユーザのユーザクリック総数である。
母集団信号の別の例は次の通りである:
Figure 2007505403
ここで:“SH(q)”は、問い合わせ“q”に対して文書“i”が表示された回数であり、
“SH(qi、P)”は、母集団“P”の場合に文書“i”が問い合わせ“q“に対して表示された回数であり、
他の変数は例(1)に関連して説明する。
母集団信号の別の例は次の通りである:
Figure 2007505403
ここで:“μ”は、問い合わせ“q“に対する母集団”P“のユーザによるクリック数などのクリック信号を信用するために必要とされるデータの量を表す平滑係数であり、
“μ”は、問い合わせ“q”に対するあらゆるユーザのクリック数などのクリック信号を信用するために必要とされるデータの量を表す平滑係数であり、
他の変数は例(1)および/または例(2)に関連して説明する。
解説目的で、例(1)のアルゴリズムは図2〜3に示す本発明による例示の方法として実現されている。(1)、(2)および(3)に示す例のほかに他のアルゴリズムが本発明にしたがって用いられるが、アルゴリズム(1)は例を解説するために提供されている。このような他のアルゴリズムは例(1)、(2)および(3)に示す変数の内の一部を含んでいたり、全部を含んでいたり、何も含んでいなかったりする。
図3に、例(1)による図2に示す方法200を実行するサブルーチン212の例を示す。図示するサブルーチン212は、初期探索結果132中で受信された各々の文書に対して母集団信号128を提供する。他の実施形態では、このように分析される文書の数は、受信したすべての文書の数より少ない値に制限される。サブルーチン212の例は次の通りである。
図3を参照すると、例示のサブルーチン212はブロック300から開始される。ブロック300で、探索エンジン124と関連しているカウンタは“1”などの値に設定される。たとえば、母集団プロセッサ138は、関連しているメモリー118中の変数“i”を“1”という初期値に設定することが可能である。カウンタすなわち変数“i”は、サブルーチン212によって処理された文書の数をカウントするが、“i”の現在値は、文書データ中の文書のリスト上のどの文書が操作中であるかを表している。
ブロック300の後に続いてブロック302が実行されるが、ここで、探索エンジン124と関連する別のカウンタが“1”などの値に設定される。たとえば、母集団プロセッサ138は関連するメモリー118中の変数“j”を“1”という初期値に設定することが可能である。カウンタすなわち変数“j”はサブルーチン212によって処理された文書の数をカウントするが、“j”の現在値は、文書データ中の文書のリスト上のどの文書が操作中であるかを表している。
ブロック302の後に続いてブロック304が実行されるが、ここで、問い合わせ側のユーザ112aに対して母集団が決定される。探索エンジン124は母集団、この場合は“P”を決定する。たとえば、探索エンジン124は、探索問い合わせ“Q”を入力するユーザと関連する母集団を決定する。以前に述べたように、自己識別データまたは自動識別データまたは双方の組み合わせを探索エンジン124が利用して、ユーザと関連する母集団を決定することが可能である。本実施形態では、探索エンジン124は、ユーザのインターネットプロトコルアドレスから、ユーザは、母集団“F”と記号表示されるフランスから通信しているらしいと判定し、したがって、探索エンジン124は、問い合わせ“Q”に対して以前に文書“D”を選択したフランスから通信しているユーザの母集団情報をクロスリファレンスする。探索エンジン124は、問い合わせ側ユーザの母集団“P”を決定したら、母集団データベース120にコールして、対応する必要な限りのあらゆる母集団情報を得る。たとえば、探索エンジン124は、母集団データベース120からデータを検索して、フランス、すなわち母集団“F”、にいる合計で“20”のユーザが以前に、探索問い合わせ“Q”に対して特定の文書“D”を選択したことがあるものと判定する。したがって、特定の母集団“P”の母集団情報を探索エンジン124が適用して、本発明にしたがって文書“D”に対する母集団信号を計算することが可能である。
ブロック304の後に続いてブロック306が実行されるが、ここで、分析される文書の数が決定される。ブロック210では、サーバ104は探索問い合わせ114と関連する文書データを検索した。決定されたデータの中には、探索問い合わせ114に応答して文書リストに載っている文書の合計数があった。
この文書数は変数“N”によって特徴付けられる(また、“N”として設定される)。たとえば、すでに述べたように、探索問い合わせ「舟遊び」に対する探索結果は15の文書を有しており、サーバ104は“N”を“15”という値に設定する。
代替実施形態では、特定の問い合わせに対して母集団データベース120または別のデータ記憶デバイスで定義されているまたは別様に記憶されている探索問い合わせに対するいかなる文書合計数も、探索エンジン124または母集団プロセッサ138に対して送信するまたはこれらによって別様に判定することが可能であることに注意すべきである。さらに注意すべきは、特定の探索問い合わせに対する文書の数は、母集団データベース120に前もって記憶されている母集団タイプの情報およびクリックスルーデータベース122に記憶されているクリックスルーデータまたは他のデータ記憶デバイスに記憶されている他の類似したタイプのデータによって異なることがあるということである。
ブロック306の後に続いてブロック308が実行されるが、ここで、変数“M”が決定される。変数“M”は、母集団信号が決定される文書の数を表している。たいていの場合、“M”は変数“N”と同じ値、すなわち、ブロック306で決定された文書数を有するが異なることもある。たとえば、すでに述べたように、探索問い合わせ「舟遊び」に対する探索結果は15の文書を有することがありえるが、この場合、サーバは変数N=15と設定しており、サーバ104もまた“M”を“15”という値に設定する。
ブロック308の後に続いてブロック310が実行されるが、ここでは、平滑係数が決定される。探索エンジン124は、特定の問い合わせに対する特定の母集団のユーザのユーザクリックなどのクリック信号を信用するために必要とされるデータの量を表す平滑係数を決定する。たとえば、母集団プロセッサ138は所定の方程式またはコンピュータ読み取り可能命令の集合を利用して、すべてのユーザまたは特定の問い合わせに対する特定の母集団のユーザのユーザクリックのクリック信号または品質を信用するために必要とされるデータの量を明らかにする平滑係数を決定する。この平滑係数は、特定の母集団のユーザのユーザクリックが非常に少ない場合や特定のソースのユーザクリックが信頼性がないまたは別様に信用するに足らないことが周知であるかまたは別様に感知されるような場合に特には有用である。この場合、平滑係数は、一定値または特定の母集団と関連するデータの重みまたは値に別様に影響を与えることが可能な値に設定することが可能である。ほとんどの場合、平滑係数は、母集団信号関数または母集団プロセッサ138によって処理されるコンピュータ読み取り可能命令の集合に適用される。
たとえば、問い合わせ「舟遊び」に対して、母集団プロセッサ138は、フランスにいるユーザからのユーザクリックの数が不十分である場合に平滑係数を決定する。したがって、上記の表の例の場合には、“Q”が「舟遊び」でありフランスにいるユーザによる20のユーザクリックでは信頼するに足るクリック数としては不十分であれば、平滑係数が決定される。この平滑係数は、サブルーチン212中の上記の母集団信号関数中では“μ”で表される。この係数は、探索問い合わせ「舟遊び」に対するフランス在住のユーザによるクリックの数に対する信頼性または感知された信用を示す。
別の例として、フランス在住のユーザが問い合わせ「クリケット」を発すると、フランス在住のユーザによるユーザクリックの数が不十分であれば、母集団プロセッサ138は平滑係数を決定する。しかしながら、フランスは「ヨーロッパ」の亜母集団であるので、母集団プロセッサ138は「ヨーロッパ」在住のユーザに対応するクリック情報を用いて、フランス在住のユーザからの問い合わせ「クリケット」のクリック情報を強化することが可能である。一般に、亜母集団のクリック情報がまばらであるまたは存在しない場合、より高い母集団レベルからの情報を用いて、クリック情報を強化することが可能である。一部の例では、このようにして用いることが可能な追加のレベルの母集団または亜母集団、すなわち、「パリっ子」は「フランス」の亜母集団であり、「フランス」は「ヨーロッパ」の亜母集団であり、「ヨーロッパ」は「世界」の亜母集団である、が存在する。
場合によっては、一般的な平滑係数を決定することが可能であることに注意すべきである。探索エンジン124は、特定の問い合わせに対する特定の文書へのすべてのユーザによるユーザクリックに対する信頼性または信用を表す一般的平滑係数を決定する。図示する例では、ローカル母集団のユーザのクリックに対する信頼性または信用は一般的母集団のユーザのクリックに対する信頼性または信用と同じであり、上述したように決定された平滑係数を一般的平滑係数として用いることが可能であると仮定される。
さらなる例として、一般的平滑係数は次のように決定することが可能である。母集団プロセッサ138は母集団データベース120または他のデータ記憶デバイスにアクセスして、ユーザクリックデータを検索する。所定の方程式またはコンピュータ読み取り可能命令の集合を用いて、母集団プロセッサ138は、特定の問い合わせに対する探索結果中のすべての文書に対するすべてのユーザによるユーザクリックの数を決定する。これで、一般的平滑係数を、特定の問い合わせに対する探索結果中のすべての文書に対するすべてのユーザによるクリックまたは選択の数として設定することが可能である。
特定の問い合わせに対する特定の文書の平滑係数、値または得点が母集団データベース120に前もって記憶されていれば、母集団プロセッサ138は、特定の問い合わせに対する特定の文書の平滑係数、値または得点を検索する。たとえば、母集団データベース120は、日本在住のたった一人のユーザしか問い合わせ“Q”に対して文書“D”を選択しなかった上記の表での場合のように、探索問い合わせ「舟遊び」に対する探索結果中の文書に対するすべてのユーザによるクリックの数が不十分であることを示したりする。この例では、探索問い合わせ「舟遊び」に対する探索結果中のすべての文書に対するすべてのユーザによるクリックの総数を用いるべきである。こうすれば、上述したように決定された一般的母集団平滑係数をアルゴリズム中で用いて、2つの結果の間を徐々に遷移することが可能である。探索問い合わせ「舟遊び」に対する探索結果中の文書に対するすべてのユーザによるクリックの数を用いるか、母集団情報と選択データとから改善された探索結果が得られるように探索問い合わせ「舟遊び」に対する探索結果中のすべての文書に対するすべてのユーザによるクリックの総数を用いるかを判断することが可能である。
ブロック310の後に続いてブロック312が実行されるが、ここで、特定の問い合わせ“Q”に対する目的とする現行の文書(文書“i”)の場合の、特定の母集団“P”による選択数、この場合はクリック数が判定される。探索エンジン124は、文書“i”が問い合わせ“Q”に対する探索結果中で返送されると、文書“i”に対するクリック数を判定する。たとえば、母集団プロセッサ138は、母集団データベース120または他のデータ記憶デバイスに記憶されている母集団情報と、クリックスルーデータベース122に記憶されているもしくは母集団データベース120と前もって共有されているクリックスルーデータとにアクセスする。母集団プロセッサ138は所定の方程式またはコンピュータ実行可能命令の集合を母集団情報とクリックスルーデータとの一部またはすべてに適応して、“#(q、d、P)”とも呼ばれる探索問い合わせに対する文書への母集団によるクリックの数を決定する。たとえば、問い合わせ“Q”が「舟遊び」であれば、問い合わせ“Q”に対する文書“D”へのフランスでのユーザによるユーザクリック総数が20であったと判定することが可能である。
ブロック312の後に続いてブロック314が実行されるが、ここで、特定の問い合わせ(“Q”)に対する目的とする現行の文書(文書“i”)に対するすべてのユーザによる選択数、この場合ではクリック数、を判定する。探索エンジン124は、文書“i”が問い合わせ“Q”に対する探索結果中で返送されると、文書“i”に対するすべてのユーザによるクリック数を判定する。たとえば、母集団プロセッサ138は、母集団データベース120または他のデータ記憶デバイスに記憶されている母集団情報と、クリックスルーデータベース122に記憶されているもしくは母集団データベース120と前もって共有されているクリックスルーデータとにアクセスする。母集団プロセッサ138は所定の方程式またはコンピュータ実行可能命令の集合を母集団情報とクリックスルーデータとの一部またはすべてに適応して、“#(q、d)”とも呼ばれる探索問い合わせに対する文書への母集団に関係なくすべてのユーザによるクリックの数を決定する。たとえば、問い合わせ“Q”が「舟遊び」であれば、問い合わせ“Q”に対する文書“D”への母集団に関係なくすべてのユーザによるユーザクリック総数が101であったと判定することが可能である。
ブロック314の後に続いて判断ブロック316が実行されるが、ここで、探索問い合わせに対するすべての文書が処理されたかどうか判断される。探索エンジン124は、カウンタすなわちブロック300で“1”という値に初期設定された変数“i”を探索問い合わせ“Q”に対して処理される文書の数にしたがってブロック306である値に設定された変数“N”と比較する。すべての文書が処理されたわけではない場合、カウンタすなわち変数“i”は変数“N”とは等しくならず、「ノー」に分岐してブロック318に行く。代替実施形態では、分析される文書の最大数が設定される。たとえば、“N”は、ブロック306で決定された文書の数未満の最大数に設定される。
ブロック318で、処理された文書数の後を追ってカウンタがインクレメントされる。たとえば、“1”という値に初期設定されたカウンタすなわち変数“i”が、“2”などの次の値にインクレメントされる。すると、サブルーチン212はブロック312に復帰して、次の文書の処理を継続する。次の文書がブロック312〜314によって処理され、ブロック318でカウンタすなわち変数“i”は、すべての文書が処理されて、カウンタすなわち変数“i”が“N”に等しくなるまで、続いてインクレメントされる。このようにして、「舟遊び」に対してすでに提供した例では、探索問い合わせ「舟遊び」に対する探索結果の15の文書のすべてがブロック312〜314で処理される。
文書すべてが処理されたら、判断ブロック318から「イエス」に分岐して、サブルーチン212はブロック320に続く。
ブロック320で、特定の問い合わせ(“Q”)に対するすべての文書(文書“i”)への特定の母集団“P”による選択、この場合ではクリック、の数の合計と、特定の問い合わせ(“Q”)に対するすべての文書(文書“i”)へのすべてのユーザによる選択、この場合ではクリック、の数の合計とが決定される。図示する実施形態では、探索エンジン124は、探索“Q”と関連する文書に対する特定の母集団“P”によるクリックの総数を記述する特定の問い合わせ(“Q”)に対するすべての文書(文書“i”)への特定の母集団“P”による選択、この場合ではクリック、の数の合計を決定する。たとえば、母集団プロセッサ138は、探索問い合わせ“Q”の先行の探索に応答して返送された文書に対する特定の母集団“F”による一部のまたはすべてのユーザのクリックを表す合計値を決定する。これで、この合計値を探索エンジン124または母集団プロセッサ138が母集団信号関数またはコンピュータ実行可能命令集合に対して適用することが可能となる。ブロック312で決定された選択数が、すべての文書“i”に対してブロック320で合計されることに注意すべきである。
さらにそのうえ、探索エンジン124は、探索問い合わせ“Q”と関連する文書に対する母集団に関係なくすべてのユーザによるクリックの総数を記述している特定の問い合わせ(“Q”)へのすべての文書(文書“i”)による選択、この場合はクリック、の数の合計を決定する。たとえば、母集団プロセッサ138は、探索問い合わせ“Q”の先行問い合わせに応答して返送された文書に対する母集団に関係なくすべてのユーザによる一部のまたはすべてのユーザクリックを表している合計値を決定する。これで、この合計値を探索エンジン124または母集団プロセッサ138が母集団信号関数またはコンピュータ実行可能命令集合に対して適用することが可能となる。ブロック314で決定された選択数もまた、すべての文書“i”に対してブロック320で合計されることに注意すべきである。
ブロック320の後に続いてブロック322が実行されるが、ここで、平滑係数が決定される。探索エンジン124は、特定の問い合わせに対する特定の母集団のユーザによるユーザクリックなどのクリック信号を信用するために必要とされるデータの量を表す平滑係数“μ”を決定する。たとえば、母集団プロセッサ138は、特定の問い合わせに対するすべてのユーザによるユーザクリックや特定の母集団のユーザによるユーザクリックなどのクリック信号を信用するために必要とされるデータの量を表す平滑係数を決定するために、所定の方程式またはコンピュータ実行可能命令集合を利用する。この平滑係数は、特定の母集団のユーザのユーザクリックが非常に少ない場合や特定のソースのユーザクリックが信頼性がないまたは別様に信用するに足らないことが周知であるかまたは別様に感知されるような場合に特には有用である。たとえば、上記の表における問い合わせ“Q”の例に適用すると、問い合わせ“Q”に対して文書“D”への日本在住のユーザによるクリックは1つだけであるので、平滑係数“μ”を“10”などの一定値に設定することが可能である。この場合、平滑係数は、特定の母集団と関連するデータの重みまたは値に作用するまたは別様に影響を与えるために用いることが可能である。ほとんどの場合、平滑係数は、母集団信号関数または母集団プロセッサ138によって処理されるコンピュータ読み取り可能命令の集合に適用される。
場合によっては、一般的な平滑係数を決定することが可能であることに注意すべきである。探索エンジン124は、特定の問い合わせに対する特定の文書へのすべてのユーザによるユーザクリックなどのクリック信号を信号するために必要とされるデータの量を表す一般的平滑係数を決定する。図示する例では、ローカル母集団のユーザのクリックを信用するために必要とされるデータの量は一般的母集団のユーザのクリックを信用するために必要とされるデータ量と同じであり、上述したように決定された平滑係数を一般的平滑係数として用いることが可能であると仮定される。
さらなる例として、一般的平滑係数は次のように決定することが可能である。母集団プロセッサ138は母集団データベース120または他のデータ記憶デバイスにアクセスして、ユーザクリックデータを検索する。所定の方程式またはコンピュータ読み取り可能命令の集合を用いて、母集団プロセッサ138は、特定の問い合わせに対する特定の文書へのユーザクリックの数を決定する。
特定の問い合わせに対する特定の文書の平滑係数、値または得点が母集団データベース120に前もって記憶されていれば、母集団プロセッサ138は、特定の問い合わせに対する特定の文書の平滑係数、値または得点を検索する。たとえば、母集団データベース120は、探索問い合わせ「舟遊び」に対する探索結果中の文書に対するすべてのユーザによるクリックの数が不十分であること、したがって、探索問い合わせ「舟遊び」に対する探索結果中の文書に対するすべてのユーザによるクリックの総数を用いるべきであることを示したりする。一般的母集団平滑係数は、2つの結果の間を徐々に遷移することが可能である。探索問い合わせ「舟遊び」に対する探索結果中の文書に対するすべてのユーザによるクリックの数を用いるか、母集団情報と選択データとから改善された探索結果が得られるように探索問い合わせ「舟遊び」に対する探索結果中のすべての文書に対するすべてのユーザによるクリックの総数を用いるかを判断することが可能である。
ブロック322の後に続いてブロック324が実行されるが、ここで、特定の問い合わせ(“Q”)に対する探索結果中で返送された各々の文書(文書“j”)の場合の、すべてのユーザによる選択、この場合はクリック、の数。探索エンジン124は、文書“j”が問い合わせ“Q”に対する探索結果中で返送されると、母集団に関係なく文書“j”に対するクリック数を判定する。たとえば、母集団プロセッサ138は、母集団データベース120または他のデータ記憶デバイスに記憶されている母集団情報と、クリックスルーデータベース122に記憶されているもしくは母集団データベース120と前もって共有されているクリックスルーデータとにアクセスする。母集団プロセッサ138は所定の方程式またはコンピュータ実行可能命令の集合を母集団情報とクリックスルーデータとの一部またはすべてに適応して、“#(q、d)”とも呼ばれる探索問い合わせに対する文書への母集団によるクリックの数を決定する。たとえば、問い合わせ“Q”が「舟遊び」であれば、問い合わせ“Q”に対する文書“D”へのすべてのユーザによるユーザクリック総数が101であったと判定することが可能である。
ブロック324の後に続いてブロック326が実行されるが、ここで、特定の問い合わせ(“Q”)に対する探索結果中で返送された各々の文書(文書“i”)に対する母集団“P”のすべてのユーザによる選択、この場合ではクリック、の数を判定する。探索エンジン124は、文書“j”が問い合わせ“Q”に対する探索結果中で返送されると、文書“j”に対する母集団“P”のすべてのユーザによるクリック数を判定する。たとえば、母集団プロセッサ138は、母集団データベース120または他のデータ記憶デバイスに記憶されている母集団情報と、クリックスルーデータベース122に記憶されているもしくは母集団データベース120と前もって共有されているクリックスルーデータとにアクセスする。母集団プロセッサ138は所定の方程式またはコンピュータ実行可能命令の集合を母集団情報とクリックスルーデータとの一部またはすべてに適応して、“#(q、d、P)”とも呼ばれる探索問い合わせに対する文書への母集団によるクリックの数を決定する。たとえば、問い合わせ“Q”が「舟遊び」であれば、問い合わせ“Q”に対する文書“D”へのフランスという母集団のすべてのユーザによるユーザクリック総数が20であったと判定することが可能である。
ブロック326の後に続いて判断ブロック328が実行されるが、ここで、特定の探索問い合わせに対する文書の母集団信号が決定される。探索エンジン124は、探索結果132中の特定の文書に対する母集団信号128を決定する。たとえば、母集団プロセッサ138は、ある探索問い合わせが特定の母集団のユーザによって尋ねられた回数や、ある探索問い合わせがすべてのユーザによって尋ねられた回数や、特定の母集団のユーザによってある探索問い合わせが尋ねられて、特定の文書がクリックされた回数や、すべての母集団のユーザによってある探索問い合わせが尋ねられて、特定の文書がクリックされた回数や、いずれかの探索問い合わせに対して特定の母集団のユーザが文書をクリックした回数や、いずれかの探索問い合わせに対してすべてのユーザが文書をクリックした回数や、必要であれば、平滑係数や、必要であれば、探索結果中の特定の文書に対する母集団信号128を決定するための母集団クリックの重み、などの多くの係数を用いる。
図示する実施形態では、この母集団信号128を、上に述べたブロック300〜324で決定されたデータと例(1)で示したアルゴリズムとを用いて計算する。問い合わせ「舟遊び」の先行する例に適用すると、母集団プロセッサ138は、探索結果132中の特定の文書の対する母集団信号128を決定する。サブルーチン212で上述したように母集団信号関数中で“S(Q、D)”で表されるような特定の母集団“F”のユーザによるクリックをカウントした後での文書“j”へのユーザクリックの重み付け総数を表す重み付けされた値が母集団プロセッサ138によって決定される。これは、上述のアルゴリズムによって示されるような数学的関数を実行して文書“j”のS(Q、D)“を計算することによって実行される。
ブロック328の後に続いて判断ブロック330が実行されるが、ここで、ある探索問い合わせに対してすべての文書が処理されたかどうか判断される。探索エンジン124は、カウンタすなわちブロック302で“1”という値に初期設定された変数“j”を探索問い合わせに対して処理される文書の数にしたがってある値に設定された変数“M”と比較する。すべての文書が処理されている場合、カウンタすなわち変数“j”は変数“M”と等しく、「イエス」に分岐してブロック332に行く。代替実施形態では、分析される文書の最大数が設定される。たとえば、“M”は、ブロック302で決定された文書の数未満の最大数に設定される。
ブロック332で、サブルーチン212は終了する。
しかしながら、判断ブロック330で、文書のすべてが処理されているわけではなく、カウンタすなわち変数“j”が変数“M”と等しくない場合、「ノー」に分岐してブロック334に行く。
ブロック334で、処理された文書数の後を追ってカウンタがインクレメントされる。たとえば、“1”という値に初期設定されたカウンタすなわち変数“j”が、“2”などの次の値にインクレメントされる。すると、サブルーチン212はブロック324に復帰して、次の文書の処理を継続する。次の文書がブロック324〜328によって処理されて、ブロック334でカウンタすなわち変数“j”は、すべての文書が処理されて、カウンタすなわち変数“j”が“M”に等しくなるまで続いてインクレメントされる。このようにして、「舟遊び」に対してすでに提供した例では、探索問い合わせ「舟遊び」に対する探索結果の15の文書のすべてがブロック324〜328で処理される。
文書すべてが処理されたら、判断ブロック332から「イエス」に分岐して、サブルーチン212はブロック332で終了する。
再度図2を参照すると、サブルーチン212の後に続いてブロック214が実行されるが、ここで、文書毎の母集団信号がランク付けプロセッサに提供される。たとえば、図示する実施形態では、各々の文書“1〜N”に対する得点の計算値“S(Q、D)”が“N”個の母集団信号に含まれる。文書毎の母集団信号128は、ランク付けプロセッサ136に送信されて、他の探索問い合わせに応答して探索結果の以降のランク付けや得点を決定するようにする。ランク付けプロセッサ136は、母集団プロセッサ138からの母集団信号128および/または他の出力を組み込んだランク付けもしくは得点付け機能またはコンピュータ実行可能命令集合を含んでいる。たとえば、サブルーチン212から発生した重み付けされた値はランク付けプロセッサ136に送信されると、このプロセッサは、重み付けされた値などの母集団信号128を利用して、以降の探索結果をランク付けしたり別様に得点付けしたりする。探索エンジン124または別のシステムもしくは方法によって文書毎に生成された他の信号130もまた、以降の探索結果をランク付けまたは得点付けするためにランク付けプロセッサ136に送信することが可能である。
ブロック214の後に続いてブロック216が実行されるが、ここで、探索結果が提供される。ランク付けプロセッサ136は、探索問い合わせ114に応答して探索結果132中にある各々の文書のランクや得点を生成する。重み付けされた値などのブロック214からの母集団信号218を用いて、ランク付けプロセッサ136は、探索結果132中にある1つ以上の文書のランクや得点に作用する。ランク付けプロセッサ136は、母集団信号128と一緒に130と図1に示すような信号などの他の信号を用いて、探索結果132の文書をランク付けしたり別様に得点付けしたりすることに注意すべきである。一部の例では、ランク付けプロセッサ136は、さらに、探索結果132のランクや得点を処理している間に特定の母集団信号128および/または他の信号130を利用すべきであるかどうかを判断することが可能である。
ブロック216の後に続いてブロック218が実行され、ここで方法200は終了する。
本発明の他の実施形態では、方法200を繰り返し利用して、母集団データベース120および/またはクリックスルーデータベース122または他のデータ記憶デバイス中に新たなデータやデータ変更が受信されたり別様に得られたりした場合にはいつでも、新たなまたは更新された母集団信号が決定されたりする。新たなまたは更新された母集団信号が決定されたら、次にこの信号をランク付けプロセッサ136に送信して、探索結果132のランクや得点を変更したり更新したりすることが可能である。
多くの細目を上述したが、これらの細目は本発明の範囲に対する制限と解釈すべきではなく、開示する実施形態の単なる例示と解釈すべきである。当業者は、本発明の範囲内にある他の多くの潜在的な変更例を想像しえるであろう。
本発明の一実施形態によるシステムのブロック図を示す図である。 本発明の一実施形態による方法のフローチャートを示す図である。 図2に示す方法のサブルーチンのフローチャートを示す図である。

Claims (44)

  1. (a)探索問い合わせを受信するステップと、
    (b)前記探索問い合わせと関連する第1の母集団を決定するステップと、
    (c)前記探索問い合わせと関連する第1の項目を決定するステップと、
    (d)前記第1の項目のランク付け得点を前記第1の母集団と関連するデータに少なくとも部分的に基づいて決定するステップと、
    を含む、探索ランク付け得点を決定する方法。
  2. 前記探索問い合わせと関連する前記第1の母集団を決定するステップが、前記探索問い合わせの送出者と関連する人口統計学的データを決定するステップを含む請求項1に記載の方法。
  3. 前記送出者と関連する前記人口統計学的データを決定するステップが、前記送出者のありそうな地理的ロケーションを決定するステップを含む請求項2に記載の方法。
  4. 前記送出者のありそうな地理的ロケーションを決定するステップが、探索問い合わせの送信元であるインターネットプロトコルアドレス、探索エンジンにアクセスするために前記送出者が入力したアドレスおよび前記送出者が入力した人口統計学的データの内の少なくとも1つを決定するステップを含む請求項3に記載の方法。
  5. 前記送出者の前記人口統計学的データを決定するステップが、年齢、年齢層、性、人種、第1言語、第2言語、ロケーション、収入、収入層、大陸、領域、国、州、郡、市、性別、民族的グループ、グループ、特徴を共有する人物、興味を共有する人物、所定の選択によって分類された人物およびインターネットサービスプロバイダデータの内の少なくとも1つを決定するステップを含む請求項2に記載の方法。
  6. 前記探索問い合わせと関連する前記第1の母集団を決定するステップが、前記探索問い合わせと関連する人口統計学的データを決定するステップを含む請求項1に記載の方法。
  7. 前記探索問い合わせと関連する前記人口統計学的データを決定するステップが、前記探索問い合わせの言語を決定するステップと、前記探索問い合わせの前の送出者と関連するデータを決定するステップとの内の少なくとも一方を含む請求項6に記載の方法。
  8. 前記探索問い合わせと関連する前記第1の母集団を決定するステップが、前記探索問い合わせを送信するユーザと関連する自己識別データを決定するステップを含む請求項1に記載の方法。
  9. 前記自己識別データが、ユーザ登録データ、ユーザ嗜好データおよびユーザ選択データの内の少なくとも1つから選択される請求項8に記載の方法。
  10. 前記探索問い合わせと関連する前記第1の母集団を決定するステップが、前記探索問い合わせを送信するユーザと関連する自動識別データを決定するステップを含む請求項1に記載の方法。
  11. 前記自動識別データが、IPアドレス、ドメインおよび、ユーザと関連するアプリケーションから得られるデフォルトデータの内の少なくとも1つを含む請求項10に記載の方法。
  12. 前記第1の母集団と関連するデータが、前記第1の母集団の文脈における第1の項目の選択得点を含む請求項1に記載の方法。
  13. 前記第1の母集団の文脈における前記第1の項目の選択得点が、前記第1の母集団のメンバーによる前記第1の項目に対するクリックの数を含む請求項12に記載の方法。
  14. 前記第1の母集団と関連するデータが、前記第1の母集団のメンバーの数を含む請求項1に記載の方法。
  15. 前記第1の母集団のメンバーの数が、前記第1の母集団の、前記探索問い合わせに対して返送された結果を選択したメンバーの数を含む請求項14に記載の方法。
  16. 前記第1の母集団のメンバーの数が、前記第1の母集団の、前記探索問い合わせを入力したメンバーの数を含む請求項14に記載の方法。
  17. 前記第1の母集団のメンバーの数が、前記第1の母集団の、前記探索問い合わせに対する探索結果が表示されたメンバーの数を含む請求項14に記載の方法。
  18. 前記第1の母集団と関連するデータが選択総得点を含む請求項1に記載の方法。
  19. 前記選択総得点が、前記第1の母集団の、前記第1の項目を選択したメンバーの総数を含む請求項18に記載の方法。
  20. 前記探索問い合わせと関連する第2の母集団を決定するステップをさらに含み、前記第1の項目の第1のランク付け得点を決定するステップがさらに、前記第2の母集団と関連するデータに少なくとも部分的に基づく請求項1に記載の方法。
  21. (e)前記探索問い合わせと関連する第2の項目を決定するステップと、
    (f)前記第2の項目の第2のランク付け得点を、前記第1の母集団と関連するデータに少なくとも部分的に基づいて決定するステップと、
    をさらに含む請求項1に記載の方法。
  22. 前記第1の項目と前記第2の項目を、前記第1のランク付け得点と前記第2のランク付け得点に少なくとも部分的に基づいてランク付けするステップをさらに含む請求項21に記載の方法。
  23. (a)探索問い合わせを受信するプログラムコードと、
    (b)前記探索問い合わせと関連する第1の母集団を決定するプログラムコードと、
    (c)前記探索問い合わせと関連する第1の項目を決定するプログラムコードと、
    (d)前記第1の項目のランク付け得点を前記第1の母集団と関連するデータに少なくとも部分的に基づいて決定するプログラムコードと、
    を含むプログラムコードを包含するコンピュータ読み取り可能媒体。
  24. 前記探索問い合わせと関連する第1の母集団を決定する前記プログラムコードが、前記探索問い合わせの送出者と関連する人口統計学的データを決定するように適用される請求項23に記載のコンピュータ読み取り可能媒体。
  25. 送出者と関連する人口統計学的データを決定するステップが、前記送出者のありそうな地理的ロケーションを決定するステップを含む請求項24に記載のコンピュータ読み取り可能媒体。
  26. 送出者のありそうな地理的ロケーションを決定するステップが、前記探索問い合わせの送信元であるインターネットプロトコルアドレス、探索エンジンにアクセスするために前記送出者が入力したアドレスおよび前記送出者が入力した人口統計学的データの内の少なくとも1つを決定するステップを含む請求項25に記載のコンピュータ読み取り可能媒体。
  27. 送出者の前記人口統計学的データを決定するステップが、年齢、年齢層、性、人種、第1言語、第2言語、ロケーション、収入、収入層、大陸、領域、国、州、郡、市、性別、民族的グループ、グループ、特徴を共有する人物、興味を共有する人物、所定の選択によって分類された人物およびインターネットサービスプロバイダデータの内の少なくとも1つを決定するステップを含む請求項24に記載のコンピュータ読み取り可能媒体。
  28. 前記探索問い合わせと関連する前記第1の母集団を決定するステップが、前記探索問い合わせと関連する人口統計学的データを決定するステップを含む請求項23に記載のコンピュータ読み取り可能媒体。
  29. 前記探索問い合わせと関連する前記人口統計学的データを決定するステップが、前記探索問い合わせの言語を決定するプログラムコードと、前記探索問い合わせの前の送出者と関連するデータを決定するステップとの内の少なくとも一方を含む請求項28に記載のコンピュータ読み取り可能媒体。
  30. 前記探索問い合わせと関連する前記第1の母集団を決定するステップが、前記探索問い合わせを送信するユーザと関連する自己識別データを決定するステップを含む請求項23に記載のコンピュータ読み取り可能媒体。
  31. 前記自己識別データが、ユーザ登録データ、ユーザ嗜好データおよびユーザ選択データの内の少なくとも1つから選択される請求項31に記載のコンピュータ読み取り可能媒体。
  32. 前記探索問い合わせと関連する前記第1の母集団を決定するステップが、前記探索問い合わせを送信するユーザと関連する自動識別データを決定するステップを含む請求項23に記載のコンピュータ読み取り可能媒体。
  33. 前記自動識別データが、IPアドレス、ドメインおよび、ユーザと関連するアプリケーションから得られるデフォルトデータの内の少なくとも1つを含む請求項32に記載のコンピュータ読み取り可能媒体。
  34. 前記第1の母集団と関連するデータが、前記第1の母集団の文脈における前記第1の項目の選択得点を含む請求項23に記載のコンピュータ読み取り可能媒体。
  35. 前記第1の母集団の文脈における前記第1の項目の選択得点が、前記第1の母集団のメンバーによる前記第1の項目に対するクリックの数を含む請求項34に記載のコンピュータ読み取り可能媒体。
  36. 前記第1の母集団と関連するデータが、前記第1の母集団のメンバーの数を含む請求項23に記載のコンピュータ読み取り可能媒体。
  37. 前記第1の母集団のメンバーの数が、前記第1の母集団の、前記探索問い合わせに対して返送された結果を選択したメンバーの数を含む請求項36に記載のコンピュータ読み取り可能媒体。
  38. 前記第1の母集団のメンバーの数が、前記第1の母集団の、前記探索問い合わせを入力したメンバーの数を含む請求項36に記載のコンピュータ読み取り可能媒体。
  39. 前記第1の母集団のメンバーの数が、前記第1の母集団の、前記探索問い合わせに対する探索結果が表示されたメンバーの数を含む請求項36に記載のコンピュータ読み取り可能媒体。
  40. 前記第1の母集団と関連するデータが選択総得点を含む請求項23に記載のコンピュータ読み取り可能媒体。
  41. 前記選択総得点が、前記第1の母集団の、前記第1の項目を選択したメンバーの総数を含む請求項40に記載のコンピュータ読み取り可能媒体。
  42. 前記探索問い合わせと関連する第2の母集団を決定するステップをさらに含み、前記第1の項目の第1のランク付け得点を決定するステップがさらに、前記第2の母集団と関連するデータに少なくとも部分的に基づく請求項23に記載のコンピュータ読み取り可能媒体。
  43. (e)前記探索問い合わせと関連する第2の項目を決定するプログラムコードと、
    (f)前記第2の項目の第2のランク付け得点を、前記第1の母集団と関連するデータに少なくとも部分的に基づいて決定するプログラムコードと、
    をさらに含む請求項23に記載のコンピュータ読み取り可能媒体。
  44. 前記第1の項目と前記第2の項目を、前記第1のランク付け得点と前記第2のランク付け得点に少なくとも部分的に基づいてランク付けするステップをさらに含む請求項43に記載のコンピュータ読み取り可能媒体。
JP2006526320A 2003-09-12 2004-09-10 母集団情報を用いて探索ランク付けを改善する方法とシステム Pending JP2007505403A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/661,741 US7454417B2 (en) 2003-09-12 2003-09-12 Methods and systems for improving a search ranking using population information
PCT/US2004/029618 WO2005029367A1 (en) 2003-09-12 2004-09-10 Methods and systems for improving a search ranking using population information

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011123607A Division JP2011204260A (ja) 2003-09-12 2011-06-01 母集団情報を用いて探索ランク付けを改善する方法とシステム

Publications (1)

Publication Number Publication Date
JP2007505403A true JP2007505403A (ja) 2007-03-08

Family

ID=34273923

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006526320A Pending JP2007505403A (ja) 2003-09-12 2004-09-10 母集団情報を用いて探索ランク付けを改善する方法とシステム
JP2011123607A Pending JP2011204260A (ja) 2003-09-12 2011-06-01 母集団情報を用いて探索ランク付けを改善する方法とシステム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011123607A Pending JP2011204260A (ja) 2003-09-12 2011-06-01 母集団情報を用いて探索ランク付けを改善する方法とシステム

Country Status (8)

Country Link
US (4) US7454417B2 (ja)
EP (1) EP1668550A1 (ja)
JP (2) JP2007505403A (ja)
AU (2) AU2004275275B2 (ja)
BR (1) BRPI0414333A (ja)
CA (1) CA2538597C (ja)
NO (1) NO20061285L (ja)
WO (1) WO2005029367A1 (ja)

Families Citing this family (107)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11341853B2 (en) * 2001-09-11 2022-05-24 Zonar Systems, Inc. System and method to enhance the utility of vehicle inspection records by including route identification data in each vehicle inspection record
US7454417B2 (en) * 2003-09-12 2008-11-18 Google Inc. Methods and systems for improving a search ranking using population information
US7505964B2 (en) 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7249126B1 (en) * 2003-12-30 2007-07-24 Shopping.Com Systems and methods for dynamically updating relevance of a selected item
US8954420B1 (en) * 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US8346777B1 (en) 2004-03-31 2013-01-01 Google Inc. Systems and methods for selectively storing event data
US8099407B2 (en) 2004-03-31 2012-01-17 Google Inc. Methods and systems for processing media files
US8161053B1 (en) 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US7680888B1 (en) 2004-03-31 2010-03-16 Google Inc. Methods and systems for processing instant messenger messages
US7333976B1 (en) 2004-03-31 2008-02-19 Google Inc. Methods and systems for processing contact information
US8631076B1 (en) 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
US8386728B1 (en) 2004-03-31 2013-02-26 Google Inc. Methods and systems for prioritizing a crawl
US7581227B1 (en) 2004-03-31 2009-08-25 Google Inc. Systems and methods of synchronizing indexes
US8275839B2 (en) * 2004-03-31 2012-09-25 Google Inc. Methods and systems for processing email messages
US7412708B1 (en) 2004-03-31 2008-08-12 Google Inc. Methods and systems for capturing information
US7941439B1 (en) * 2004-03-31 2011-05-10 Google Inc. Methods and systems for information capture
US7725508B2 (en) * 2004-03-31 2010-05-25 Google Inc. Methods and systems for information capture and retrieval
US20050234929A1 (en) * 2004-03-31 2005-10-20 Ionescu Mihai F Methods and systems for interfacing applications with a search engine
US7606793B2 (en) * 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7761448B2 (en) * 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US20060200460A1 (en) * 2005-03-03 2006-09-07 Microsoft Corporation System and method for ranking search results using file types
US8713025B2 (en) * 2005-03-31 2014-04-29 Square Halt Solutions, Limited Liability Company Complete context search system
US9002725B1 (en) 2005-04-20 2015-04-07 Google Inc. System and method for targeting information based on message content
US7630976B2 (en) * 2005-05-10 2009-12-08 Microsoft Corporation Method and system for adapting search results to personal information needs
US7962462B1 (en) 2005-05-31 2011-06-14 Google Inc. Deriving and using document and site quality signals from search query streams
US7584177B2 (en) 2005-06-29 2009-09-01 Google Inc. Determination of a desired repository
US20070005588A1 (en) * 2005-07-01 2007-01-04 Microsoft Corporation Determining relevance using queries as surrogate content
US7421429B2 (en) 2005-08-04 2008-09-02 Microsoft Corporation Generate blog context ranking using track-back weight, context weight and, cumulative comment weight
US20070033090A1 (en) * 2005-08-08 2007-02-08 Connors Daniel P Method for substitution of employees in a service engagement
US8639543B2 (en) * 2005-11-01 2014-01-28 International Business Machines Corporation Methods, systems, and media to improve employee productivity using radio frequency identification
US7783632B2 (en) * 2005-11-03 2010-08-24 Microsoft Corporation Using popularity data for ranking
US7949714B1 (en) 2005-12-05 2011-05-24 Google Inc. System and method for targeting advertisements or other information using user geographical information
US8601004B1 (en) * 2005-12-06 2013-12-03 Google Inc. System and method for targeting information items based on popularities of the information items
US9262446B1 (en) 2005-12-29 2016-02-16 Google Inc. Dynamically ranking entries in a personal data book
US8515336B2 (en) * 2006-01-06 2013-08-20 Qualcomm Incorporated Apparatus and methods of selective collection and selective presentation of content
US8635526B2 (en) * 2006-05-25 2014-01-21 Qualcomm Incorporated Target advertisement in a broadcast system
US7624101B2 (en) * 2006-01-31 2009-11-24 Google Inc. Enhanced search results
US8255376B2 (en) 2006-04-19 2012-08-28 Google Inc. Augmenting queries with synonyms from synonyms map
US8762358B2 (en) * 2006-04-19 2014-06-24 Google Inc. Query language determination using query terms and interface language
US8442965B2 (en) 2006-04-19 2013-05-14 Google Inc. Query language identification
US20080104049A1 (en) * 2006-10-25 2008-05-01 Microsoft Corporation Document ranking utilizing parameter varying data
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US20080140641A1 (en) * 2006-12-07 2008-06-12 Yahoo! Inc. Knowledge and interests based search term ranking for search results validation
US8103649B2 (en) * 2007-02-05 2012-01-24 Ntt Docomo, Inc. Search system and search method
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US8694374B1 (en) 2007-03-14 2014-04-08 Google Inc. Detecting click spam
JP5040396B2 (ja) * 2007-03-28 2012-10-03 富士通株式会社 Webページ検索プログラム、方法、及び装置
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US8359309B1 (en) 2007-05-23 2013-01-22 Google Inc. Modifying search result ranking based on corpus search statistics
US8694511B1 (en) * 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US20090106221A1 (en) * 2007-10-18 2009-04-23 Microsoft Corporation Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features
US9348912B2 (en) * 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US8126877B2 (en) * 2008-01-23 2012-02-28 Globalspec, Inc. Arranging search engine results
US8010535B2 (en) * 2008-03-07 2011-08-30 Microsoft Corporation Optimization of discontinuous rank metrics
US8812493B2 (en) * 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US20090271371A1 (en) * 2008-04-28 2009-10-29 Alan Levin Search customization by geo-located proxy of user segment
US8312032B2 (en) * 2008-07-10 2012-11-13 Google Inc. Dictionary suggestions for partial user entries
US8396865B1 (en) * 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8396721B2 (en) * 2009-02-23 2013-03-12 Healthy Communities Institute Corporation Community health system
US20100241514A1 (en) * 2009-03-17 2010-09-23 Microsoft Corporation Automated provision of user feedback
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US20100287177A1 (en) * 2009-05-06 2010-11-11 Foundationip, Llc Method, System, and Apparatus for Searching an Electronic Document Collection
US20100287148A1 (en) * 2009-05-08 2010-11-11 Cpa Global Patent Research Limited Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection
US20100306211A1 (en) * 2009-05-26 2010-12-02 Nokia Corporation Method and apparatus for automatic geo-location search learning
US20100318531A1 (en) * 2009-06-10 2010-12-16 Microsoft Corporation Smoothing clickthrough data for web search ranking
US20100325127A1 (en) * 2009-06-18 2010-12-23 Nokia Corporation Method and apparatus for automatic geo-location and social group indexing
US20110016104A1 (en) * 2009-07-14 2011-01-20 SEO Samba, Corp. Centralized web-based system for automatically executing search engine optimization principles for one, or more website(s)
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US20110029517A1 (en) * 2009-07-31 2011-02-03 Shihao Ji Global and topical ranking of search results using user clicks
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8364679B2 (en) * 2009-09-17 2013-01-29 Cpa Global Patent Research Limited Method, system, and apparatus for delivering query results from an electronic document collection
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US20110082839A1 (en) * 2009-10-02 2011-04-07 Foundationip, Llc Generating intellectual property intelligence using a patent search engine
US20110119250A1 (en) * 2009-11-16 2011-05-19 Cpa Global Patent Research Limited Forward Progress Search Platform
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8515975B1 (en) 2009-12-07 2013-08-20 Google Inc. Search entity transition matrix and applications of the transition matrix
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8983989B2 (en) 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8903794B2 (en) 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US8838587B1 (en) 2010-04-19 2014-09-16 Google Inc. Propagating query classifications
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US20110302149A1 (en) * 2010-06-07 2011-12-08 Microsoft Corporation Identifying dominant concepts across multiple sources
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
WO2012056463A1 (en) * 2010-10-29 2012-05-03 Hewlett-Packard Development Company, L.P. Content recommendation for groups
US20120158705A1 (en) * 2010-12-16 2012-06-21 Microsoft Corporation Local search using feature backoff
US9552430B1 (en) 2010-12-28 2017-01-24 Google Inc. Identifying resource locations
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US9589056B2 (en) * 2011-04-05 2017-03-07 Microsoft Technology Licensing Llc User information needs based data selection
US9128896B2 (en) 2011-12-20 2015-09-08 Bitly, Inc. Systems and methods for identifying phrases in digital content that are trending
US9135344B2 (en) 2011-12-20 2015-09-15 Bitly, Inc. System and method providing search results based on user interaction with content
US9111211B2 (en) 2011-12-20 2015-08-18 Bitly, Inc. Systems and methods for relevance scoring of a digital resource
US9619811B2 (en) 2011-12-20 2017-04-11 Bitly, Inc. Systems and methods for influence of a user on content shared via 7 encoded uniform resource locator (URL) link
US9135211B2 (en) 2011-12-20 2015-09-15 Bitly, Inc. Systems and methods for trending and relevance of phrases for a user
US9582592B2 (en) * 2011-12-20 2017-02-28 Bitly, Inc. Systems and methods for generating a recommended list of URLs by aggregating a plurality of enumerated lists of URLs, the recommended list of URLs identifying URLs accessed by users that also accessed a submitted URL
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US8793246B1 (en) * 2013-03-08 2014-07-29 Fmr Llc Identifying ranking scores for domains of interest
US9183499B1 (en) 2013-04-19 2015-11-10 Google Inc. Evaluating quality based on neighbor features
US20150199347A1 (en) * 2014-01-15 2015-07-16 Microsoft Corporation Promoting documents based on relevance
US9436742B1 (en) 2014-03-14 2016-09-06 Google Inc. Ranking search result documents based on user attributes
US9805142B2 (en) 2014-04-11 2017-10-31 Google Inc. Ranking suggestions based on user attributes
US10425492B2 (en) 2015-07-07 2019-09-24 Bitly, Inc. Systems and methods for web to mobile app correlation
US10990929B2 (en) * 2018-02-27 2021-04-27 Servicenow, Inc. Systems and methods for generating and transmitting targeted data within an enterprise

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539377B1 (en) * 1997-08-01 2003-03-25 Ask Jeeves, Inc. Personalized search methods

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265065A (en) 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5963940A (en) 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6026388A (en) 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5920854A (en) 1996-08-14 1999-07-06 Infoseek Corporation Real-time document collection search engine with phrase indexing
US6138142A (en) 1996-12-20 2000-10-24 Intel Corporation Method for providing customized Web information based on attributes of the requester
US6374237B1 (en) 1996-12-24 2002-04-16 Intel Corporation Data set selection based upon user profile
US7437351B2 (en) * 1997-01-10 2008-10-14 Google Inc. Method for searching media
US6285999B1 (en) * 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6006222A (en) * 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US6185559B1 (en) * 1997-05-09 2001-02-06 Hitachi America, Ltd. Method and apparatus for dynamically counting large itemsets
US6014556A (en) * 1997-07-15 2000-01-11 Ericsson Inc. Method for priority in terminating call setup
FR2766816B1 (fr) * 1997-08-01 1999-08-27 Eurokera Plaque vitroceramique et son procede de fabrication
US6078916A (en) * 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
US6014665A (en) 1997-08-01 2000-01-11 Culliss; Gary Method for organizing information
US6134532A (en) 1997-11-14 2000-10-17 Aptex Software, Inc. System and method for optimal adaptive matching of users to most relevant entity and information in real-time
US6067565A (en) 1998-01-15 2000-05-23 Microsoft Corporation Technique for prefetching a web page of potential future interest in lieu of continuing a current information download
US7124129B2 (en) * 1998-03-03 2006-10-17 A9.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
JP3762835B2 (ja) 1998-05-21 2006-04-05 富士通株式会社 データ分解装置、その方法、及び記録媒体
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6363378B1 (en) 1998-10-13 2002-03-26 Oracle Corporation Ranking of query feedback terms in an information retrieval system
US6480843B2 (en) 1998-11-03 2002-11-12 Nec Usa, Inc. Supporting web-query expansion efficiently using multi-granularity indexing and query processing
US6678681B1 (en) * 1999-03-10 2004-01-13 Google Inc. Information extraction from a database
US6327590B1 (en) 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US7072888B1 (en) 1999-06-16 2006-07-04 Triogo, Inc. Process for improving search engine efficiency using feedback
US6606581B1 (en) * 2000-06-14 2003-08-12 Opinionlab, Inc. System and method for measuring and reporting user reactions to particular web pages of a website
US6754873B1 (en) * 1999-09-20 2004-06-22 Google Inc. Techniques for finding related hyperlinked documents using link-based analysis
US6676681B1 (en) 1999-11-15 2004-01-13 Winease Llc Reusable nasal support devices for animals and methods
US6490575B1 (en) 1999-12-06 2002-12-03 International Business Machines Corporation Distributed network search engine
US6546388B1 (en) 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6615209B1 (en) * 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
AU2001241000A1 (en) 2000-03-07 2001-09-17 Tzunami Inc. System and method for computer searching
US6671681B1 (en) 2000-05-31 2003-12-30 International Business Machines Corporation System and technique for suggesting alternate query expressions based on prior user selections and their query strings
US6182559B1 (en) 2000-06-29 2001-02-06 Chiang Chih-Ming Ash catcher assembly for a charcoal grill
US6529903B2 (en) * 2000-07-06 2003-03-04 Google, Inc. Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
US7136854B2 (en) * 2000-07-06 2006-11-14 Google, Inc. Methods and apparatus for providing search results in response to an ambiguous search query
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US6567103B1 (en) * 2000-08-02 2003-05-20 Verity, Inc. Graphical search results system and method
US20020034292A1 (en) 2000-08-22 2002-03-21 Tuoriniemi Veijo M. System and a method to match demand and supply based on geographical location derived from a positioning system
US6842761B2 (en) * 2000-11-21 2005-01-11 America Online, Inc. Full-text relevancy ranking
US20020078045A1 (en) 2000-12-14 2002-06-20 Rabindranath Dutta System, method, and program for ranking search results using user category weighting
US6658423B1 (en) * 2001-01-24 2003-12-02 Google, Inc. Detecting duplicate and near-duplicate files
US6643649B2 (en) 2001-01-30 2003-11-04 International Business Machines Corporation Utility for cross platform database query
US6526440B1 (en) 2001-01-30 2003-02-25 Google, Inc. Ranking search results by reranking the results based on local inter-connectivity
JP2002259431A (ja) * 2001-02-27 2002-09-13 Casio Comput Co Ltd 情報検索方法、情報検索装置、およびプログラム
US8001118B2 (en) * 2001-03-02 2011-08-16 Google Inc. Methods and apparatus for employing usage statistics in document retrieval
US6850934B2 (en) 2001-03-26 2005-02-01 International Business Machines Corporation Adaptive search engine query
US7188106B2 (en) * 2001-05-01 2007-03-06 International Business Machines Corporation System and method for aggregating ranking results from various sources to improve the results of web searching
US6738764B2 (en) * 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
US20030018707A1 (en) 2001-07-20 2003-01-23 Flocken Philip Andrew Server-side filter for corrupt web-browser cookies
US6824587B2 (en) * 2003-02-14 2004-11-30 Moustafa Abdel Kader Mohamed Method and apparatus for removing contaminants from gas streams
US7340466B2 (en) 2002-02-26 2008-03-04 Kang Jo Mgmt. Limited Liability Company Topic identification and use thereof in information retrieval systems
US7716161B2 (en) * 2002-09-24 2010-05-11 Google, Inc, Methods and apparatus for serving relevant advertisements
US6910032B2 (en) * 2002-06-07 2005-06-21 International Business Machines Corporation Parallel database query processing for non-uniform data sources via buffered access
AU2003297523A1 (en) 2002-12-24 2004-07-22 American Type Culture Collection Systems and methods for enabling a user to find information of interest to the user
US20040119740A1 (en) * 2002-12-24 2004-06-24 Google, Inc., A Corporation Of The State Of California Methods and apparatus for displaying and replying to electronic messages
JP4206915B2 (ja) 2002-12-27 2009-01-14 三菱マテリアル株式会社 パワーモジュール用基板
US7613708B2 (en) * 2003-01-31 2009-11-03 Rieffanaugh Jr Neal King Human credit resource networking method
US7219090B2 (en) 2003-04-25 2007-05-15 Overture Services, Inc. Method and system for blending search engine results from disparate sources into one search result
US7565425B2 (en) 2003-07-02 2009-07-21 Amazon Technologies, Inc. Server architecture and methods for persistently storing and serving event data
US8856163B2 (en) * 2003-07-28 2014-10-07 Google Inc. System and method for providing a user interface with search query broadening
US7440964B2 (en) * 2003-08-29 2008-10-21 Vortaloptics, Inc. Method, device and software for querying and presenting search results
US7505964B2 (en) * 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7454417B2 (en) * 2003-09-12 2008-11-18 Google Inc. Methods and systems for improving a search ranking using population information

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539377B1 (en) * 1997-08-01 2003-03-25 Ask Jeeves, Inc. Personalized search methods

Also Published As

Publication number Publication date
NO20061285L (no) 2006-06-09
AU2010241251A1 (en) 2010-11-25
US20120089600A1 (en) 2012-04-12
WO2005029367A1 (en) 2005-03-31
AU2004275275B2 (en) 2010-08-05
US20110238643A1 (en) 2011-09-29
EP1668550A1 (en) 2006-06-14
CA2538597C (en) 2012-07-31
US7454417B2 (en) 2008-11-18
US20120089586A1 (en) 2012-04-12
BRPI0414333A (pt) 2006-11-07
AU2010241251B2 (en) 2013-08-22
AU2004275275A1 (en) 2005-03-31
US8515951B2 (en) 2013-08-20
CA2538597A1 (en) 2005-03-31
JP2011204260A (ja) 2011-10-13
US20050060310A1 (en) 2005-03-17
US8090713B2 (en) 2012-01-03
US8510294B2 (en) 2013-08-13

Similar Documents

Publication Publication Date Title
CA2538597C (en) Methods and systems for improving a search ranking using population information
US10204138B1 (en) Navigational resources for queries
AU2004275274B2 (en) Methods and systems for improving a search ranking using related queries
US9443022B2 (en) Method, system, and graphical user interface for providing personalized recommendations of popular search queries
CN105956116B (zh) 用于处理将要显示的内容的方法和系统
US20020078045A1 (en) System, method, and program for ranking search results using user category weighting
US9116945B1 (en) Prediction of human ratings or rankings of information retrieval quality
US20120078884A1 (en) Presenting social search results
JP2013522723A (ja) ユーザ固有フィードの推奨
US20120295633A1 (en) Using user's social connection and information in web searching
US20030212594A1 (en) Method, apparatus and article for displaying targeted content on web pages by predicting the group membership of individual visitors
US9183299B2 (en) Search engine for ranking a set of pages returned as search results from a search query
US8996514B1 (en) Mobile to non-mobile document correlation
US8676790B1 (en) Methods and systems for improving search rankings using advertising data
MXPA06002777A (en) Methods and systems for improving a search ranking using population information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100729

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110601

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110818

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20111021

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120828

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120903