JP4950174B2 - 既知の高ランク付けされたクエリを用いたクエリ修正 - Google Patents

既知の高ランク付けされたクエリを用いたクエリ修正 Download PDF

Info

Publication number
JP4950174B2
JP4950174B2 JP2008504089A JP2008504089A JP4950174B2 JP 4950174 B2 JP4950174 B2 JP 4950174B2 JP 2008504089 A JP2008504089 A JP 2008504089A JP 2008504089 A JP2008504089 A JP 2008504089A JP 4950174 B2 JP4950174 B2 JP 4950174B2
Authority
JP
Japan
Prior art keywords
query
indexed
modified
modification
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008504089A
Other languages
English (en)
Other versions
JP2008535090A (ja
JP2008535090A5 (ja
Inventor
ベイリー,デビッド,アール.
バトル,アレクシス,ジェイ.
コーン,デビッド,アリエル
エングルハルト,バーバラ
ナヤク,パンデュラン,ピー.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/094,814 external-priority patent/US7565345B2/en
Priority claimed from US11/096,198 external-priority patent/US7617205B2/en
Priority claimed from US11/095,920 external-priority patent/US20060230005A1/en
Application filed by Google LLC filed Critical Google LLC
Publication of JP2008535090A publication Critical patent/JP2008535090A/ja
Publication of JP2008535090A5 publication Critical patent/JP2008535090A5/ja
Application granted granted Critical
Publication of JP4950174B2 publication Critical patent/JP4950174B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Description

本発明は、一般的な情報検索システムに関する。特に、利用者クエリを修正するためのシステムと方法に関する。
関連出願の相互参照
本出願は、2005年3月29日付特許出願第11/094,814号「多重クエリ修正モデルの統合」,2005年3月30日付特許出願第11/096,198号「クエリ修正モデルのための信頼性の評価」,2005年3月30日付特許出願第11/095,920号「提案された修正クエリの経験的な検証」,2005年11月22日付特許出願第11/285,814号「既知の高ランク付けされたクエリを用いたクエリ修正」に基づく優先権を主張する。また、この参照により本開示に含まれる
・2003年9月30日付特許出願第10/676,571号「関連付けられた言葉群に基づく文書の特徴づけのための方法及び装置」;
・2003年12月15日付特許出願第10/734,584号「大規模設備教育システム及び方法」;
・2003年12月31日付特許出願第10/749,900号「ネットワークブライジングをアシストする方法及びシステム」;
・2004年6月28日付特許出願第10/878,926号「相互関係プロフィールを取得して用いるためのシステム及び方法」;
のそれぞれに関連する。
インターネット・サーチ・エンジンによって例示される情報検索システムは一般に、速く一般に利用者のクエリに関係がある文書を提供することができる。サーチ・エンジンは、クエリへの文書の関連性を定める用語及び文書頻度の、文書間の連結と共にそして用語間のいろいろな統計学的手段を使うかもしれない。ほとんどのサーチエンジンの設計の下にある主技術的な仮定は、ユーザクエリがユーザの望ましい情報目的を正確に表すことである。
実際、ユーザは典型的に良いクエリを立てることが苦手である。しばしば、単一のクエリは望ましい結果を提供しない。そして、ユーザは同じトピックについて頻繁にいくつかの異なったクエリを入力する。これらの多数のクエリは典型的には、推測した実在者の名前、単語の並べ方のバリエーション、単語の数などの、望ましい結果セットに達するまでにクエリの長い鎖を時々形作る、クエリ用語の幅や特定性にばらつきを含む。異なるユーザは広く成功裏にクエリを変更するさまざまな能力をもっていることから、いろいろな自動化されたクエリ修正の方法が提案されている。
最も一般的に、クエリ・リファインメント(絞り込み)は一般的なクエリから自動的にいっそう正確な(すなわち、より狭い)クエリを発生させるのに使用されている。上位結果がユーザの情報ニーズと関連する文書の上位セットを含んでいる過度に広範囲なクエリをユーザが入力するときに、クエリ・リファインメントは主に有用である。例えば、三菱ギャラン自動車の情報を欲しているユーザは、処理結果が自動車会社だけでなく多くのいろいろな三菱の会社を含むけれども、過度に広義のクエリ"三菱"を入力するかもしれない。従って、クエリを洗練することは望ましいであろう(ユーザの具体的な情報要求を割り出すための付加的な用語の前後関係の不足のために困難だけれども)。
しかしながら、正しい修正がクエリを拡張するはずである場合に、過度に特定のクエリをユーザが入力するとき、あるいは最高の結果がユーザの情報ニーズと無関係であるとき、クエリ・リファインメントは有用ではない。例えば、クエリ“三菱ギャラン情報”は用語“情報”のために、よくない結果(この場合、三菱ギャラン自動車についてのあまりに少なすぎる結果)を導き出すかもしれない。この場合、正しい修正は「三菱ギャラン」へクエリを拡張するはずである。従って、クエリ・リファインメントがいくつかの状態で働く間に、他のクエリ修正技術を使うことによってユーザの情報ニーズが最も満たされる状態は多数ある。
別のクエリ修正の方針は、同義語リスト又はユーザの見込みの情報ニーズをつかむためにクエリを拡張するシソーラスを使用する。しかしながら、クエリ・リファインメントと同じように、クエリの拡張はクエリを修正するために常に適切な方法であるとは限らないし、結果の質はクエリ用語の前後関係に非常に依存している。
情報検索システムは、それぞれがそれ自身のクエリ修正方針を実行する1つ以上の異なるクエリ・リバイザを備える、クエリ修正構造を含む。それぞれのクエリ・リバイザは、ユーザクエリの1つ以上の見込みの修正クエリを決定するために、ユーザクエリを評価する。修正サーバは、見込みの修正クエリを取得するために、クエリ・リバイザと相互に作用する。修正サーバはまた、それぞれの見込みの修正クエリのために、1組の調査結果を取得する情報検索システム内の検索エンジンと相互に作用する。修正サーバは、選択された修正クエリそれぞれのための検索結果のサブセットと共に、ユーザに提示された1つ以上の修正クエリを選ぶ。ユーザは、修正クエリのための検索結果の質を観察することが可能であり、その上、1の実施態様に従う修正クエリのための全ての検索結果を取得するために修正クエリの1つを選択することが可能である。
システムと方法は、他のユーザが過去に形作ったクエリのストリングの分析に基づき、ユーザの見込みの情報ニーズをよりいっそう正確につかむためのセションベースのユーザデータを使用する。これを達成するために、修正クエリは多くの個々のユーザセションから集められるデータに基づいて提供される。例えば、そのようなデータはクリックデータ、イクスプリシットユーザデータ、あるいはホバーデータが含まれるであろう。ホバーデータを使用しているユーザフィードバックの記述については、この参照より含まれる2003年12月31日に提出された特許出願第10/749,440号“ネットワークブライジングをアシストする方法及びシステム”を参照のこと。
1の実施態様として、クエリ・ランク・リバイザは、最初のクエリへの修正として、1以上の既知の高ランク付けされたクエリを提案する。初めに、1つのクエリランク(等級:序列)が全てのクエリに割り当てられる。クエリ・ランク・リバイザは、最も高くランク付けされたクエリを既知の高ランクのクエリ(KHRQ: Known Highly-Ranked Query)として識別するための、クエリとそれぞれのクエリランクのテーブルを生成する。KHRQに修正される高い確率(可能性)を持つクエリは近くのクエリ(NQ: Nearby Query)として識別され、それぞれのNQから対応するKHRQへとポインタがストアされ、そしてそのKHRQとNQのクエリは索引付けられる。
所定のクエリのために、クエリ・ランク・リバイザは索引付けされたクエリに関して修正確率を決定する。次に、修正スコア(RS: Revision Score)は、索引付けされたクエリのための修正確率とクエリランクとを使って、それぞれの索引付けされたクエリを予測する。それから、最も高い修正スコアをもつ索引付けされたクエリが変更クエリとして取り出される。インデックスにストアされたポインタを使って、KHRQである変更クエリは候補修正とNQである変更クエリに提供され、対応する既知の高ランクのクエリは候補修正として提供される。
本発明は、種々の図、ダイアグラム、技術情報について次に記載されている。上記図面は、本発明のさまざまな実施例を例示しただけである。当業者であれば、ここで説明する発明の本質から逸脱せずに、図解及び記述された階層構造、方法、機能について他の実施例を用いることが可能であることを、以下の説明から容易に理解するであろう。
システムの概要
図1aは、本発明の一実施例に基づくシステム100を例示する。システム100は、フロントエンドサーバ102、検索エンジン104と関連のコンテンツサーバ106、修正サーバ107、1つ以上のクエリ・リバイザ108を含む。動作中、ユーザはあらゆるタイプのコンピュータ機器、例えば実行中のブラウザアプリケーションやインターネット上で関連するプロトコル(例えば、TCP/IPとHTTP)を通信するのに適した他のアプリケーション上で動作するネットワーク(図示しない例えばインターネット)上の従来のクライアント118を経てシステム100にアクセスする。ただ1つのクライアント118が示されている間、システム100は多くのクライアントで多数の並行セションを支援することができる。1つの実装で、システム100は、高い能力をもつサーバクラスのコンピュータで動作し、そしてクライアント機器118はあらゆるタイプのコンピュータ機器であるかもしれない。サーバ及びクライアントコンピュータのハードウェア特徴の細部は当業者に良く知られており、ここでさらに記述されない。
フロントエンドサーバ102は、クライアント118によって提示された探索クエリを受信する責任がある。フロントエンドサーバ102は、探索クエリに基づき1組の検索結果を検索するためのクエリを求め、フロントエンドサーバ102へその結果を返すサーチエンジン104へそのクエリを提供する。サーチエンジン104は、ユーザの検索クエリに関連する多くの文書を選択するために、1つ以上のコンテンツサーバ106と通信を行う。コンテンツサーバ106は、異なったウェブサイトから索引付けられた(及び/又は検索した)多数の文書を記憶する。代わる代わる、あるいは並行して、コンテンツサーバ106は、種々のウェブサイトに記憶された文書のインデックスを記憶する。ここで“文書”は、あらゆるテキストの原文文書、コンピュータグラフィックのフォーマット、画像、ビデオ、オーディオ、マルチメディア、提示物、ウェブページ(例えばジャバスクリプトでの、組み込まれたハイパーリンクや他のメタデータ、及び/又はプログラム)などを含む、インデックス付け可能なコンテンツのあらゆる形式であると理解される。一実施例において、それぞれの索引付けられた文書は、文書リンク構造に基づき1つのページランクを割り当てられる。ページランクは、クエリ毎に独立した文書の重要性の尺度として役立つ。ページランクの典型的な形式は、この参照より開示に含まれる特許出願第6,285,999号に記述されている。サーチエンジン104は、文書の重要性(例えば、文書内の検索用語の場所や出現頻度)のクエリ毎に独立した1以上の信号は勿論のこと、その文書のページランク(及び/又は他のクエリ毎に独立した文書の重要性の尺度)にも基づいて、それぞれの文書に点数を割り当てる。
フロントエンドサーバ102はまた、修正サーバ107にクエリを提供する。修正サーバ107は、それぞれが異なるクエリ修正方法や1連の方法を実行する1以上のクエリ・リバイザ(reviser: 修正手段)108と連動する。一実施例において、クエリ・リバイザ108は、クエリ・ランク・リバイザ108aを含む。修正サーバ107はそれぞれのリバイザ108にクエリを提供し、それぞれのリバイザ108からの応答内にある1つ以上の見込みの修正クエリ(修正サーバ107によってこの時点で採用されなかったことから、ここで‘見込みの’と呼ぶ)を獲得する。システム構造は、とりわけ多くの異なるクエリ・リバイザ108が使用されることを許可するように、そして新規にクエリ・リバイザ108(一般的なリバイザ108nで示されている)を将来望まれたときに付け加えることができるように明確に設計される。これはシステム100に特別な柔軟性を与え、そしてまたカスタマイズして特定の対象ドメイン(例えば、薬、法律等のようなドメインに用いるリバイザ)、企業(内部情報検索システムのための、特定の事業分野あるいは企業のドメインが明確なリバイザ)、または異なる言語(例えば、特定の言語と方言のためのリバイザ)に適応させることができるようにする。
望ましくは、それぞれの修正クエリは、その修正がよい修正である確率、すなわちその修正クエリがオリジナルのクエリよりもユーザの情報ニーズにより関連する結果をもたらすであろう確率を表す信頼性尺度に関連付けられる。従って、それぞれの見込みの修正クエリは、Rが見込みの修正クエリであって、Cが修正クエリに関連付けられた信頼性尺度であるところの、組(Ri,Ci)によって表すことができる。一実施例において、これらの信頼性尺度は、それぞれのリバイザ108それぞれの修正方法に関してあらかじめ手作業で見積もられる。その尺度は、試験の下でのサンプルクエリと修正クエリの結果の分析から導き出すことができる。他の実施例において、1以上のリバイザ108は1以上のその見込みの修正クエリのために、動的に信頼性尺度を生成するかもしれない(例えば、処理実行時に)。信頼性尺度の割り当ては、他の機材(例えば、修正サーバ107)によって実行されるかもしれないし、そしてクエリ毎に独立したデータとクエリ毎に独立していないデータの両方が考慮されるかもしれない。
修正サーバ107は見込みの修正クエリの1以上(又は全て)を選び、これらを検索エンジン104に提供する。検索エンジン104は、通常のクエリと同じ方法で検索クエリを処理し、提出された修正クエリそれぞれの結果を修正サーバ107に提供する。修正サーバ107は、修正クエリの成果とオリジナルのクエリの成果との比較を含めて、修正クエリそれぞれの結果を評価する。下記に示すように、修正サーバ107は最も良い修正クエリ(又は少なくともオリジナルのクエリにうってつけである修正クエリ)であるとして1以上の修正クエリをその後選択することができる。
修正サーバ107は全ての見込みの修正クエリRを受け取り、最も高い信頼性から最も低い信頼性までの順に、それらに関連付けられた信頼性尺度Cに従ってそれらをソートする。修正サーバ107は見込みの修正クエリのソートされた一覧表を通じて繰り返し、検索結果を取得するために、検索エンジン104へそれぞれの見込みの修正クエリを受け渡す。(もう1つの方法として、修正サーバ107は、例えば閾値以上の信頼性尺度である見込みの修正クエリの一部を最初に選択するかもしれない。)時として一番上の検索結果は、検索方法を実行している間に、あるいは信頼性尺度を評価している際に、検索サーバ107がそのように得られた検索結果を使うことができる場合に、すでに取り出されているかもしれない(例えば、リバイザ108a又は修正サーバ107によって)。
見込みの修正クエリ毎に、修正サーバ107は見込みの修正クエリを選択するのかそれを破棄するのかを決定する。その選択は修正クエリのための上位N個の検索結果を単独で評価すること、及びオリジナルのクエリの検索結果に関して該修正クエリのための上位N個の検索結果を評価すること、の両方によって決めることができる。一般的に、修正クエリは、オリジナルのクエリよりユーザの情報ニーズを正確に反映するより適当である検索結果を作成するべきである。要望どおり多かれ少なかれ結果は処理されるのだけれども、典型的にトップ10の結果が評価される。
一実施例において、見込みの修正クエリは以下の条件が適用できるならば選択される。
i )修正クエリ、少なくとも最小数の検索結果を生成すること。例えば、のパラメータを1にセットすることは、検索結果がない全て修正(及びそれのみ)を破棄するだろう。検索結果の許容できる最小数の一般的な範囲は、1から100である。
ii)修正クエリ、修正の上位の結果群において最小数の"新しい"結果を生成すること或る結果、オリジナルのクエリ又は前選択された修正クエリの上位結果内に生じていないとき、該結果は"新しい"。例えば、のパラメータを2にセットすることは、各選択された修正が、前に選択された修正クエリの上位結果内又はオリジナルのクエリの上位結果内に生じていない少なくとも2つの上位結果を持つことを要求する。この制約は、少なくとも修正の1つが有用であると分かる可能性を最大にして、複数の選択された修正において、結果の相違があることを保証する。例えば、図3に示すように、それぞれの修正クエリのためのトップ3の結果304は、他の結果セットとは異なっている。これは、これらの修正クエリにおおいに関連した検索結果の広範な概観をユーザに与える。
iii)最大数の修正クエリまだ選択されていないこと。換言すれば、最大数の修正クエリ既に選ばれていた場合は、そのとき全ての残りの修正クエリは破棄される。一実施例において、修正クエリの最大は4にセットされる。他の実施例において、修正クエリの最大は2と10の間にセットされる。
前述の選択パラメータの結果は、修正クエリページ300に含まれるであろう選択された修正クエリの1セットである。修正サーバ107はこのページにリンクを構築し、既に述べたようにして、このリンクをフロントエンドサーバ102へ提供する。修正サーバ107は、修正クエリページ300上の修正クエリの順序と様式を決定する。修正クエリは、望ましくは信頼性尺度の順に載せられる(高い順から低い順に)。
フロントエンドサーバ102は、検索結果ページの中にクライアント118から送られた索引付けリンクを含める。ユーザはその結果、オリジナルのクエリのための検索結果の閲覧、あるいは修正クエリページへのリンクの選択、そしてそれによって選択された修正クエリとその関連結果をみることができる。
修正クエリの提示
図2は、クライアント118へ提供されたサンプル結果ページ200を示す図である。この簡単な実施において、検索結果200ページはこのクエリへ結果204と共に[sheets]のオリジナルのクエリ202を盛り込む。1組の修正クエリへのリンク206は、ページ200の下部に盛り込まれる。ユーザはリンク206をクリックして、修正クエリのページにアクセスすることができる。図3に例のページ300を示す。ここでは、修正クエリ[linens],[bedding],「bedsheets」のために、修正クエリリンク302.1,302.2そして302.3によって表されているように、上位3つの修正クエリが示されている。それぞれの修正クエリリンク302の下には、それらのクエリに関してトップ3の検索結果304がある。
オリジナル結果ページ200から分離されたページ300上に修正クエリを提供することには、様々な利点がある。最初に、表示エリアは限定的な資源であり、そして、修正クエリをそれら自身によってリストすることは(関連付けられた結果のプレビューなしで)、可能な限り、ユーザがそれらの結果との関連で修正クエリを見ないという理由であまり望ましくない。別のページ300に修正クエリを掲載することによって、ユーザ自身が修正クエリを選択する前に、情報ニーズを最もよく満たすと思われるどちらかの修正クエリをユーザに選ばせることができるようにして、ユーザは最も良い修正クエリとそれらに関連した最高の結果を参照することができる。単一の(たとえ長くても)ページ上にオリジナルのクエリと修正クエリの結果の両方を含むことができるであろう間、このアプローチは全ての修正クエリを閲覧させるためにユーザにページを下にスクロールさせるか、ページの冒頭の目に見える部分を乱雑にするかのどちらかを必要とするであろう。その代わりに、図2と3に示された好ましい実施態様において、それぞれの修正クエリリンク302をクリックし、選択した修正クエリの全ての検索結果を入手し、ユーザはクエリ修正に対応する結果を参照することができる。多くの場合、このアプローチもまた、自動的に検索結果を取得するために修正されたクエリを使って、また自動的にユーザへそれらを提示すること(例えば、ユーザ選択や相互作用なしで)が望ましい。実施例中において、クエリ修正はクエリ・ランク・リバイザと併せて記述され、この方法の利点は明らかである。「Britney Spears」が高いクエリランクである理由で提案されているクエリであるが、ユーザは望んだ情報を取得しない。それで、選択のためにユーザに結果とクエリを表示することが助けになる。加えて、このアプローチは、どのようにしてよりよいクエリを生成するかをユーザに間接的に教示する付加的な利点を持っている。他の実施例において、修正サーバ107は、オリジナル結果ページ200上で、例えば別個のウィンドウ内にあるいはオリジナル結果ページ200内に、クエリ修正を強制的に示すことができる。
ユーザによりよい結果の理解を手助けするための修正についての付加的な情報(例えば、検索結果304)の表示方法もまた、メイン結果ページ200上を使用することができる。これは、例えばスペリングを訂正する修正の場合と同様に、1つのとても高い品質の修正クエリ(または、僅かな数のとても高い品質の修正)である場合に特に有用である。スペルが訂正済みの修正クエリは、例えば表題,URL,そしてスペル修正提案が良いものであるかどうかをユーザが決定するのに役立つ断片的なトップ結果の付加的な情報と共に、結果ページ200に示されることができる。
他の実施例において、修正サーバ107は全てのクエリ修正を示すかどうかを決定するために、そしてもし示すならば、どのようにしてそれへ修正やリンクを目立つように掲載するかどうかを決定するために信頼性尺度を使用する。この実施例は、以下に論じられる。
クエリ修正
再び図1aに戻って、クエリ・ランク・リバイザ108aの一実施例はすぐに説明される。ランク・リバイザ108aは、過去に他のユーザによって作成されたクエリから、修正の連鎖の解析に基づいてユーザの情報ニーズをよりよく獲得するかもしれない既知の高ランク付けされたクエリを提案するために、多くの適切な方法を使うことができる。一般的に、高ランク付けされたクエリは他のクエリに関連して高い頻度で現れるものであるが、その発生に関連して高い頻度で訂正されるものである。ユーザがただまれにそのようなクエリを修正するだけであることは、クエリにより提供された結果がユーザの情報ニーズに十分に一致することを示唆する。
一実施例において、高ランク付けされたクエリは次のように識別される。初めに、クエリ・ランク・リバイザ108aはログファイル110に記憶されている全てのクエリへ1つのクエリランクを割り当てる。ここで使用されクエリランクは、クエリの発生頻度(QF:Query occurrence Frequency)とそのクエリを含むユーザ満足度(US:User Satisfaction)、例えばQFとUSの積すなわち(QR=QF・US)を使って定義される。一実施例において、ユーザ満足度は修正頻度の逆数(IRF:Inverse Revision Frequency)として評価される。換言すれば、ユーザ満足度は修正頻度が減少するにつれて増大する。一実施例における修正頻度は、クエリが修正された回数をクエリ出現の合計個数で割った数として定義される。したがって、この実施例においてクエリランクはクエリ発生頻度‐修正頻度の逆数(QF‐IRF)として定義され、更に、該クエリランクは、高くランク付けされたクエリは頻繁に出現するが、まれにしか修正されないということを反映している
他の実施例において、ユーザ満足度はクエリの品質によって定義される。一実施例として、クエリのための品質スコア(点数)は、検索結果上のクリックの距離を測定したユーザのクリック動作データから推定される。品質スコアを定義するための1つのそのような方式は、よりこの開示に含まれる2004年6月28日付特許出願第10/878,926号「相互関係の特徴の導出と使用のためのシステムと方法」に記述されているように、相互関係の特徴の使用である。品質スコア演算は、例えばログファイル110に記憶される。品質スコアは、検索結果の最初の選択例えば検索結果上の最初のクリック、の推定された持続時間に基づいている。与えられたクリックの持続時間は、検索結果上で発生した最初とそれに続く選択の時刻のときに時刻から、例えばログファイル110に他のユーザセションクエリデータと共に記憶される時刻から推定される。点数付けは、ユーザが検索結果上で選択/クリックしていない場合の検索結果をゼロのスコアに含み、そして1の品質スコアに接近するより長いクリックと共に、最初のクリックとそれに続くクリックとの間の時間にあてはまるS曲線に沿って続けられる。一実施例において、曲線のための数式は1/(1+e-(X-40s)/10s)、Xはクリックの間の時間であり、0.1の品質スコアに対応する変曲点は20秒であり、0.5の品質スコアに対応するのは40秒であり、0.9の品質スコアに対応するのは60秒である。他の実施例において、異なる曲線がユーザ満足度を示すと思われるクリック時間に従って使用される。例えば、右へ曲線を引き伸ばすことは、短期間クリックとクリックが全くない間の識別を減ずることを犠牲にして、とても長い持続時間でクリックに報いるよりよい仕事をするだろう。関係ないコンテンツ、例えばバナー広告のクリックはクリック解析から除外される。他の実施例において、ただ最初だけでなくてクエリに対する全ての結果クリックが集められる。したがって、この実施例において、クエリランクは品質(Q: Qualityクエリ発生頻度(QF)として定義される。
クエリ発生頻度(QF)は、例えば一実施例によれば時間当たりの頻度のように、単位時間当たりの頻度として定義される。したがって、クエリ発生頻度及び文書頻度の逆数又は品質増加するとき、クエリランクは1に向かって増加する。他の実施例において、クエリ発生頻度は異なった方法で定義されるかもしれない。
次に、クエリ・ランク・リバイザ108aは、クエリとそれぞれのクエリランクのテーブルを作成する。このデータから、クエリ・ランク・リバイザ108aは既知の高ランク付けされたクエリ(KHRQ: Known Highly-Ranked Query)として、全てのクエリの部分集合を認知する。既知の高ランク付けされたクエリは、上記のように、またクエリテーブルにリストされているように、高いクエリランクを持つことが知られているクエリである。他の実施例において、既知の高ランク付けされたクエリはトップXクエリ、例えばトップ5,000のクエリとして定義される。
クエリ・ランク・リバイザ108aはそれから、近くのクエリ(NQ:Nearby Query)を識別する。このNQは、、KHRQへと修正される可能性の強い修正可能性(PR:Possibility of Revision)を持つクエリであり、NQとKHRQとの間の類似度によって評価されるものである。類似度は、意味に関する類似度、構文上の類似度、行動の類似度、あるいはそのどんな組み合わせに基づいてでも決定され得る。一実施例において、類似度は行動の類似度である。他の実施例において、類似度がクエリ間において、例えばそれぞれのクエリのために単語群の中で語句の類似点及び/又は重複するような要素を考慮すると、意味に関する類似度を含む。さらに他の実施例において、類似度はクエリ内において、例えば編集距離、用語の重複、あるいは情報修正に一般的に使われる他の技術のような要素を考慮すると、構文上の類似度を含む。さらに他の実施例において、類似度は意味と構文上の類似度の両方を含む。一実施例において、スコアリング類似度は、より類似したクエリが1のスコアに接近するように、0と1との間であてがわれた類似度スコアを含む。例えば、小さな用語の重複(例えば「When Harry Met Sally」対「Metropolitan Life」)を持つクエリは近い類似度スコア(例えば0.15)を持つのに対して、単語が1つの文字(例えば、「Brittney Spears」対「「Britney Spears」)によってつづりが間違われたクエリは高い類似度スコア(例えば0.95)を持つ。類似度のより素晴らしいタイプが使われる実施例において、パラメータ化された組み合わせ関数、例えば加重された合計が、システムの断定的な正確さを最大限に増加するパラメータとして使用される。
従って、一実施例において、既知の高ランク付けされたクエリの近くのクエリ(NQ)の修正可能性(PR)は、KHRQに対するNQの行動の類似性(BS: Behavioral Similarity)であり、すなわち、該近くのクエリが既知の高ランク付けされたクエリ(KHRQ)へと修正(R: Revision)された回数 (R(NQ,KHRQ))を該近くのクエリのクエリ発生頻度で割ることであり、それぞれがログファイル110データに基づいて判定され、すなわちPR(NQ,KHRQ)=BS(NQ,KHRQ)=R(NQ,KHRQ)/QF(NQ)である近くのクエリが多重的に複数KHRQへ修正される記録を持っているかもしれないときに、この演算はそれぞれのKHRQに対して別々に行われる。一旦PRが決定されると、統計学的に重要なPRを持つクエリは、近くのクエリとしてのそれらの格付けを維持し、より低いPRを持つクエリは他のクエリ(OQ: Other Query)として分類される。全てのKHRQとNQは、それぞれのNQからそれぞれのKHRQのそれぞれまでポインタと共に、インデックス(索引)に記憶される。インデックス内のKHRQとNQは、集合的に索引付けされたクエリ(IQ:indexed query)と呼ばれる、索引付けされたクエリのPRもまたインデックスに記憶される。
図4は、既知の高ランク付けされたクエリ(KHRQ)、近くのクエリ(NQ)と、他のクエリ(OQ)の模範的なグラフ化されたトポロジーを示す。図示のように、高ランク付けされたクエリから離れたクエリの1つのリンクは、通常近くのクエリとして分類される。しかしながら、既知の高ランク付けされたクエリから更に遠くのクエリは、他のクエリとして分類される可能性が高く、すなわち、取るに足りないPR(KHRQ)だけを持つ可能性がある。図示のように、KHRQからの距離が増加するにつれて、PRは減少する。一実施例において、高ランク付けされたクエリと他のクエリとの間の経路の距離は、確率尺度について直接考慮に入れられる。
次に、上述されたバックエンドプロセスの継続時又は処理実行時のどちらかにおいて、クエリ・ランク・リバイザ108aは、所与のクエリ(GQ)が各索引付けされたクエリ(IQ)へとそれぞれ修正される確率を示す該所定のクエリ(GQ)の修正確率(RP: Revision Probability)を測り、これは該所与のクエリ(GQ: Given Query)と各索引付けされたクエリ(IQ)との間の類似度によって測られる。PRについて上述したように、RPは意味に関する類似度、構文上の類似度、行動の類似度、あるいはそのどんな組み合わせに基づいてでも決定され得る。ある場合には、RPはPRと同じ方法で計算され、またある場合には、RPは異なる演算を使うので、ここにおいてRPはKHRQへGQの修正確率を評価するために用いられ、PRはKHRQへのNQの修正可能性を計算するために用いられるバックエンドプロセスとして、RPはログファイル110に記憶された各クエリ毎に計算される。フロントエンドプロセスとして、RPは例えばクライアント118を経由してユーザによって入力され1つのクエリのために計算される。
一実施例において、NQ(RP(GQ,NQ))へのクエリのRPは、NQへのGQの、行動の、意味に関する、そして構文上類似度である。既知の高ランク付けされたクエリへののクエリのRP(これをRP(GQ,KHRQ)で示す)は、直接的にそして間接的にも計算される。直接の部分は、標準的なRP演算を用いる(RP(GQ,KHRQ))。間接的な部分は、KHRQへのポインタを持つすべてのNQにわたる、上述ように定められたRP(GQ,NQ)KHRQへのNQのRP(つまり、RP(NQ,KHRQ))との積の合計として計算される。したがって、KHRQへのGQのRPは、該KHRQについてのすべてのNQ(これをNQsで示す)の間の関係に関して、直接的にも間接的にも計算される。すなわちRP(GQ,KHRQ)=RP(GQ,KHRQ)+ΣNQs[RP(GQ,NQ)・PR(NQ,KHRQ)]である。結果として、RPが低いほど、NQKHRQへと修正される確率が低下する。例えば、RP(GQ,KHRQ)の間接的な特徴が上記の方程式を必要とするであろう状態の例が、図5を参照して目にすることができる。例えば、KHRQ510のGQ(505)のRPに関して、上記の方程式の後半は、NQ1515,NQ2520,NQ3525,NQ4530の演算の合計であるだろう。
次に、クエリ・ランク・リバイザ108aは、各索引付けされたクエリ毎に修正スコア(RS:Revision Score)を計算すべく、(所与のクエリに関する)前記索引付けされたクエリについての前記RP索引付けされたクエリについてのクエリランクとの積を求める。すなわちRS(IQ)=(GQ,IQ)・QR(IQ)である。最も高い修正スコアを持つ索引付けされたクエリは、代替クエリ(AQ)として検索される。一実施例において、トップ10の修正スコアを持つ索引付けされたクエリが検索して取り出される。他の実施例において、トップ100の修正スコアを持つ索引付けされたクエリが検索して取り出される。代替クエリのリストが一度検索されると、既知の高ランク付けされたクエリである代替クエリは候補修正として提供される。近くのクエリである代替クエリのために、対応する既知の高ランク付けされたクエリはインデックスに記憶されたポインタを使って、候補修正として提供される。
上述したように、それぞれの候補修正は、修正がよい修正である確率に相当する信頼性尺度と関連付けできる。クエリ・ランク・リバイザ108aの場合は、候補修正のための代替クエリの修正スコアがそのクエリのための信頼性尺度として用いられる。
その上、これあるいは他のリバイザ108によって既に修正されているクエリは、クエリ・ランク・リバイザ108aによってさらに修正されることができる。
クエリ・ランク・リバイザ108aを使っての既知の高ランク付けされたクエリを提案することについての例が続く。ユーザによって入力された最初のクエリは、[BBQ Skewers]405である。この例で、ユーザはバーベキュー串についての情報に興味がある。クエリ・ランク・リバイザ108aは、索引付けされたクエリに関してクエリの修正確率を計算するか又は検索する。この例のために再び図4を参照すると、4つの索引付けされたクエリが索引付けされたクエリとして用いられる。[Britney Spears]410,KHRQ,そしてそのNQの1つ,[B Spears]420,そして[Williams‐Sonoma]430,KHRQ,そしてそのNQの1つ,[Wooden Skewers]440。NQのために、そのそれぞれのKHRQ(PR)に修正することについてのそれぞれの確率は、インデックスから検索される。索引付けされたクエリ410‐440の修正確率は、
RP([BBQ Skewers],[Britney Spears])=0.11
RP([BBQ Skewers],[B Spears])=0.3(S)×0.8(PR)=0.24
RP([BBQ Skewers],[William Sonoma])=0.05
RP([BBQ Skewers],[Wooden Skewers])=0.95(S)×0.3(PR)=0.285
したがって、KHRQの両方ともが[BBQ Skewers]に関してかなり低い修正確率(RP)を持つ。[B Spears]もまた比較的に低いRPを持つが、[Britney Spears]のために比較的に高いPRを持つ。[Wooden Skewers]は[BBQ Skewers]のために高いRPを持つが、KHRQ[William Sonoma]に関して低いPRを持つ。
次に、クエリ・ランク・リバイザ108aは、上記したのとそれぞれの索引付けされたクエリ410‐440、すなわちRS(IQ)=S(GQ,IQ)×QR(IQ)のためのクエリランクから修正確率の関数として、索引付けされたクエリあたりの修正スコア(RS)を検出する。修正スコアは次のように計算される。
RS([Britney Spears])=0.11×0.93QR([Britney Spears])=0.1023
RS([B Spears])=0.24×0.35QR([B Spears])=0.084
RS([William Sonoma])=0.05×0.75QR([William Sonoma])=0.0375
RS([Wooden Skewers])=0.285×0.36QR([Wooden Skewers])=0.1026
したがって、[B Spears]は[BBQ Skewers]に2番目に類似しているけれども、それは低いクエリランクを持ち、そして最終的には低いRSになる。その上、[William Sonoma]は高いクエリランクを持つが、そのグループの最も低いRSを持つあまりに低いRPである。索引付けされたクエリ410-440のうち2つの最も高いRSは、とても高いクエリランクと低いRPを持つ[Britney Spears]と、low-tomediumなクエリランクを持つがグループのために最も高いRPを持つ[Wooden Skewers]である。この例のために、修正スコアのトップ50パーセントが代替クエリ(AQs)として検索されると仮定する。そのために、[Britney Spears]と[Wooden Skewers]は代替クエリとして検索される。
KHRQである[Britney Spears]は、候補修正クエリとして返される。その上、代替クエリ[Wooden Skewers]のためのKHRQである[William Sonoma]もまた、候補修正クエリとして返される。さらに、候補修正クエリのための信頼性尺度、すなわち関連付けられた代替クエリの修正スコアは、ユーザへ候補修正を提供するか否かを決定するのに使われるから、ユーザは最終的に[William Sonoma]だけを見るかもしれない。結果として、ユーザはユーザが探していた項目(Wooden Skewers)を売る提案されたクエリ[William Sonoma]で終わる。
処理実行時での修正信頼性尺度の発生
今回図1bを参照しながら、この発明に係る情報検索システムの他の実施例を示す。既に記述された図1aの要素に加えて、セション・トラッカー(追跡器)114とリバイザ信頼性評価器112がある。上述したように、クエリ・リバイザ108は、信頼性尺度に修正サーバ107へ提供する1つ以上の修正クエリを提供するかもしれない。修正サーバ107は、考えられうる修正クエリを修正クエリページ300上に包括のために選択する決定を行うために、信頼性尺度を使う。一実施例において、与えられたオリジナルクエリに関して選択されている修正クエリの中で少なくともこれまでのユーザの行動の一部に基づいて、信頼性尺度は処理実行時に導き出される。
図1bの実施例において、フロントエンドサーバ102は、オリジナルクエリと修正クエリ情報と一緒に、セション・トラッカー114にユーザのクリックを介した行動を提供する。セション・トラッカー114は、修正クエリの品質をかたどるためのオリジナルクエリと修正クエリの種々の特徴と一緒に、ユーザによってアクセスされたクエリ修正リンク302、それぞれの修正クエリに関連した結果に関連するそれぞれのユーザクエリを記憶するログファイル110を保存する。含めることが可能な記憶された情報は、例えば
オリジナルクエリのために、
・オリジナルクエリそれ自身
・オリジナルクエリ中のそれぞれの言葉
・オリジナルクエリの長さ
・オリジナルクエリの話題群
・オリジナルクエリのための情報検索スコア、そして
・オリジナルクエリの検索結果数
修正クエリのために、
・修正クエリそれ自身
・修正クエリ中の各単語
・それを生み出す検索技術の識別情報
・修正クエリの長さ
・修正クエリに関連した話題群
・トップ検索結果のための情報検索スコア(例えばページランク)
・修正クエリのために見出された検索結果
・修正クエリリンク302上のクリックの距離、そして
・修正クエリ結果304上のクリックの距離
クエリのための話題群は、適当な話題識別方法を使って識別される。1つの適当な方法は、この参照より含まれる2003年9月30日に提出された特許出願第10/676,571号“関連した言葉に基づいて文書を特徴づけるための方法と装置”に記述されている。
リバイザ信頼性評価器112は、所定のクエリのための成功した修正である修正クエリの見込みを評価するために使われるクエリと修正クエリの特徴に基づく1組のルールを発生するための予測モデル、例えば多重の、論理回帰モデルを使ってログファイル110を解析する。1つの適当な回帰モデルは、この参照より含まれる2003年12月15日に提出された特許出願第10/734,584号“大規模計算機学習システムと方法”に記述されている。リバイザ信頼性評価器112は、ある特定の動作、例えば修正クエリリンク302上でのユーザによる長いクリックが、ユーザのオリジナルの情報ニーズの正確な表現であるとして、ユーザがその修正に満足していることを示すことを前提として作動する。ユーザがページを通して若干の期間、例えば最低60秒間、クリックした状態のままとなっているときに、長いクリックが生じたと判断されうる。修正クエリリンク302上のクリックの距離から、リバイザ信頼性評価器112は、修正クエリとオリジナルクエリの種々の特徴を与えられた長いクリックの見込みを予測するように、予測モデルを訓練することができる。長いクリックの高く予測された見込みを持っている修正クエリは、関連したオリジナルクエリのために、より良い(すなわち、いっそう成功した)修正であると考えられる。
予測モデルの一実施例において、信頼性評価器112は修正クエリに関連する特徴を選択し、ログファイルからクリックデータのようなユーザデータを集めて、特徴とユーザデータを使ってルールを定式化し、予測モデルにそのルールを加える。その上、信頼性評価器112は、ユーザデータを使って追加のルールを定式化することができ、そして選択的にモデルへ追加のルールを加える。
処理実行時に、修正サーバ107はリバイザ信頼性評価器112に、オリジナルクエリと種々のクエリ・リバイザ108から受け取った修正クエリのそれぞれを提供する。リバイザ信頼性評価器112はオリジナルクエリと修正クエリを、前に言及された信頼性尺度として役立つ予測尺度を獲得するための予測モデルに適用する。代わりに、それぞれのクエリ・リバイザ108が予測尺度を獲得し、そして次にこれらの値を修正サーバ107に戻すよう、直接リバイザ信頼性評価器112を呼び出すことができる。描写された実施例は、別個のモジュールとしてリバイザ信頼性評価器112を示すけれども、修正サーバ107が代わりに信頼性評価機能を提供するかもしれない。どちらの場合も、修正サーバ107はユーザに見せられるであろう修正クエリを選択し配列するために、上記のように信頼性尺度を使う。
一実施例において、修正サーバ107は、仮にもクエリ修正を示すべきかどうか、そしてもしそうであるならば、どれくらい目立つようにして修正やリンクをそこへ配置するべきかを決定するために、信頼性尺度を使う。そうするために、修正サーバ107は、前に述べた最初の信頼性尺度か、上述した動的に生成された信頼性尺度のどちらかを使うであろう。例えば、もし最も良い信頼性尺度がしきい値の値以下に下がるならば、これは潜在的な候補修正のいずれも非常に良くないことを示すことができる。この場合には、オリジナル結果ページ200の修正がなされない。他方、もし1つ以上の修正クエリがもう1つのしきい値の値以上の非常に高い信頼性尺度をもっているならば、修正サーバ107はオリジナル結果ページ200上にとても目立つように、例えばページの最上部の近くで特殊の書体で、あるいは何か他の目立つ位置に示されるように、クエリ修正あるいはリンクを修正クエリページ300へ強制することができる。もし、信頼性尺度が2つのしきい値の間であるならば、そのとき修正クエリページ300へのリンクはそれ程目立たない位置(例えばリンク206で示されるような、例えば検索結果ページ200の終わりに)置かれることができる。一実施例において、ユーザへ表示するかどうかあるいはどこに表示するかは、オリジナルクエリを用いたユーザの不満の一部に基づいている。例えば、ゼロや非常に少ない結果、あるいは低い情報修正スコアに基づいている。
上述した方法の手順は、並列に(例えば、クエリ修正に対して結果を得ることと、クエリ修正のために信頼性尺度を計算すること)実行されうるし、及び/又は(例えば、クエリ・リバイザから多重のクエリ修正を受け取ること、その場その場でクエリ修正の並べられたリストを構成すること、全てのクエリ修正を受け取ることよりむしろそれからのクエリ修正のリストを並べかえることに)介在されうる。さらに、上記実施例はクライアント/サーバ検索システムでの環境で記述されているけれども、この発明はその上スタンドアロンマシン(例えばスタンドアロンPC)の部分として実装されうる。これは、(例えばグーグルデスクトップ検索のようなデスクトップ検索アプリケーションの環境で)有用でありうる。
この発明は、1つの可能な実施例に関して詳細な内容について記載されている。当業者は、この発明が他の実施例で実践されるかもしれないことを理解するでしょう。最初に、機器の特定の名前、表現の用語化、その特性、データ階層構造、あるいは他のいかなるプログラミングや機構的な特徴は必須あるいは重要でなく、そして発明を実行するメカニズムやその特徴が異なる名前、フォーマット、あるいはプロトコルをもつかもしれません。さらに、システムはハードウェアとソフトウェアとの組み合わせによって、説明されているように、あるいはもっぱらハードウェア要素内で実行されるかもしれません。また、ここに記述された種々のシステム構成要素間の相関性の特定部分は単に模範的にすぎず、強制的でなく、単一システム構成要素によって実行された機能がその代わりに多重の構成要素によって実行されるかもしれないし、多重の構成要素によって実行された機能がその代わりに単一の構成要素によって実行されるかもしれません。
上記記述の一部分は、アルゴリズムと情報操作の象徴的な説明の点に関して、この発明の特徴を示す。これらのアルゴリズム的な記述と説明は、他の当業者へ彼らの作品の内容を最も効果的に伝えるために、データ処理当業者によって使われる手段である。これらの動作は機能的にあるいは論理的に記述されるとおり、コンピュータプログラムによって実行されると理解される。さらに、それはまた、普遍性の喪失なしで、モジュールとしてあるいは関数の名前によって動作のこれらの取り決めに言及する時には都合がよいと分かる。
上記検討から明らかなように特に明白な検討がない限り、明細書本文を通じて記述された動作と方法は、コンピュータシステム、あるいはコンピュータシステムメモリやレジスタあるいは他のそのような情報記憶装置、伝達装置、あるいは表示装置内で物理的(電気的)な量として表されるデータを操作し変形する、類似の電気的演算素子であることが理解される。このようなコンピュータシステムに内在するハードウェアの詳細な説明は、この情報がコンピュータエンジニアリングの当業者に一般的に知られていることから、ここでは提供されない。
この発明の確かな特徴は、アルゴリズムの形式でここに記述された方法の手順と命令を含む。この発明の動作手順と命令は、ソフトウェア、ファームウェア、ありはハードウェアで実施されることができ、そしてソフトウェアで実施した場合には、リアルタイムネットワークオペレーティングシステムにより用いられる異なるプラットフォームから、常駐して操作されるためにダウンロードされることが指摘されるべきである。
この発明の確かな特徴は、単一のあるいは1つだけの例について記述された。しかしながら、この発明の動作がこの点について限定的でないことは理解される。したがって、1つだけの要素や構成要素への全ての引用は、同様に複数のそのような構成要素についても参照すると解釈されるべきである。同じように、“a”,“an”,“or”,あるいは“the”への引用は、もし明白に規定された別のやり方で表現されていなければ、複数個(pluralities)の引用を含むと解釈されるべきである。最終的に、用語“複数(plurality)”の使用は、検討中のこの発明の一部分にふさわしく、無限のあるいはさもなければ過度な項目の数の範囲にわたるときに、2つ以上の実在物、データの項目、またはその種のほかのものが属することが意味される。
この発明はまた、この点でオペレーションを実行する装置に関連がある。この装置は、必要とされる目的で特別に組み立てられるかもしれないし、あるいは選択的に作動される、又はコンピュータによってアクセスされうる読み取り可能な媒体により構成が変更される、一般的な目的のコンピュータを意味するかもしれない。このようなコンピュータプログラムは限定的ではないが、それぞれがコンピュータシステムバスに連結された、例えばフロッピーディスクを含むあらゆるタイプのディスク、光学式ディスク、CD-ROM、磁性-光学式ディスク、リードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁性あるいは光カード、電気的な命令を記憶することに適したあらゆるタイプのメディアのような、コンピュータが読み取り可能な記憶媒体に記憶されるかもしれない。集積回路設計と映像コーデックの当業者は、この発明が、用途特化集積回路(ASles)を含む、上記機能的であり構造的な記載に基づいた種々のタイプの集積回路で容易に造りあげられることを理解する。さらに、この発明は種々のタイプの映像コーディング装置に組み込まれるかもしれない。
ここに示されたアルゴリズムと動作は、どの特定のコンピュータや他の装置と本質的に関連付けられない。様々な一般的な目的のシステムもやはりここの教示を踏まえてプログラムで用いられるかもしれない、あるいは必要とされた方法手順を実行するためのより専門の装置を組み立てるほうが都合がよいとわかるかもしれない。必要とされるこれらのシステムの多様性の仕組みは、同等の変形物に従って当業者に明白であろう。さらに、この発明は特定のプログラミング言語に関連付けられて記述されない。プログラミング言語の種類はここに記述されたようなこの発明の教示を実装するのに用いられるかもしれないこと、そして特定の言語へのどんな言及でも実施要件の開示とこの発明の最良の形態が規定されていることが分かる。
最後に、明細書に用いられた言語は読みやすさと教育の目的のために主に選択されること、そして発明の主題を描写する又は制限するために選択されなかったかもしれないことは指摘されるべきである。したがって、この発明の開示が説明に役立つものであることが意図されるが、発明の目的を制限するものでない。
本発明の一実施例に係るクエリ修正を提供する情報検索システムの一実施例を示すシステムダイアグラムである。 この発明の一実施例に係るオリジナルユーザクエリのための見本の結果ページの説明図である。 この発明の一実施例に係る見本の修正クエリページの説明図である。 この発明の一実施例に係るグラフ化されたクエリのトポロジーを示す。 この発明の他の実施例に係るグラフ化されたクエリのトポロジーを示す。

Claims (22)

  1. 最初のクエリに応答して既知の高ランク付けされたクエリを自動的に提案するためにサーバコンピュータシステムによって実行される方法であって、
    前記最初のクエリから索引付けされたクエリの修正確率であって、前記最初のクエリと前記索引付けされたクエリとの間の類似度を示す前記修正確率を計算することと、
    前記最初のクエリのための前記修正確率と前記索引付けされたクエリのクエリランクとの関数として該索引付けされたクエリのための修正スコアを計算することと、
    前記最初のクエリの代替クエリとして前記索引付けされたクエリを選択して取り出すことと、
    前記代替クエリが或る既知の高ランク付けされたクエリに修正されることが統計学的に高い確率を持つかどうかを決定することと、
    前記統計学的に高い確率を持つとの決定に基づき、候補修正クエリとして前記既知の高ランク付けされたクエリを同定することと、
    前記候補修正クエリ用の信頼性尺度として、前記索引付けされたクエリのための前記修正スコアを関連付けることと、
    前記信頼性尺度に基づき前記候補修正クエリをランク付けすることと、
    前記最初のクエリのために提案する修正として前記ランク付けされた候補修正クエリを提供することと
    で構成されることを特徴とする方法。
  2. 請求項1に記載された方法であって、前記最初のクエリは以前に修正されたクエリであることを特徴とする方法。
  3. 請求項1に記載された方法であって、前記関数は、前記最初のクエリから前記索引付けされたクエリへの修正確率と前記索引付けされたクエリのクエリランクとの積であることを特徴とする方法。
  4. 請求項1に記載された方法であって、更に、既知の高ランク付けされたクエリとしてクエリを識別することを特徴とする方法。
  5. 請求項4に記載された方法であって、更に、
    クエリに関してクエリ発生頻度を計算することと、
    前記クエリに関してユーザ満足度スコアを計算することと、
    クエリ発生頻度とユーザ満足度スコアの関数として、前記クエリのためのランクを計算することと
    を具備することを特徴とする方法。
  6. 請求項5に記載された方法であって、前記ユーザ満足度スコアは検索結果上でのクリックの長さを推定するユーザクリック動作データによって決定されることを特徴とする方法。
  7. 請求項5に記載された方法であって、前記ユーザ満足度スコアは正頻度の逆数によって決定されることを特徴とする方法。
  8. 請求項7に記載された方法であって、前記正頻度の逆数は前記クエリが修正された回数の逆数を前記クエリのためのクエリ発生頻度で割ったものであることを特徴とする方法。
  9. 請求項1に記載された方法であって、更に、前記索引付けされたクエリを含んで構成されるクエリのインデックスを生成することを特徴とする方法。
  10. 請求項9に記載された方法であって、前記インデックスは該インデックス内のそれぞれのクエリから1以上の既知の高ランク付けされたクエリへのポインタを含むことを特徴とする方法。
  11. 請求項1に記載された方法であって、前記修正確率は前記最初のクエリに関して前記索引付けされたクエリの行動の類似度を含むことを特徴とする方法。
  12. 請求項1に記載された方法であって、前記修正確率は前記最初のクエリに関して前記索引付けされたクエリの意味の類似度を含むことを特徴とする方法。
  13. 請求項1に記載された方法であって、前記修正確率は前記最初のクエリに関して前記索引付けされたクエリの構文上の類似度を含むことを特徴とする方法。
  14. 請求項1に記載された方法であって、更に、
    ユーザセションから作成されたクエリデータを記録することと、
    前記クエリのインデックスを作成するために前記クエリデータを使うことと
    を具備することを特徴とする方法。
  15. 請求項1に記載された方法であって、前記提案する修正は前記信頼性尺度の相対的な強さに依存する場所でユーザに表示されることを特徴とする方法。
  16. 最初のクエリに応答して既知の高ランク付けされたクエリを自動的に提案するためにサーバコンピュータシステムによって実行される方法であって、
    ユーザセションから作成されたクエリデータを記録することと、
    前記ユーザセションの間にクエリのインデックスを作成することと、
    前記最初のクエリから索引付けされたクエリの修正確率であって、前記最初のクエリと前記索引付けされたクエリとの間の類似度を示す前記修正確率を計算することと、
    前記最初のクエリのための前記修正確率と前記索引付けされたクエリのクエリランクとの関数として該索引付けされたクエリのための修正スコアを計算することと、
    前記最初のクエリの代替クエリとして前記索引付けされたクエリを選択して取り出すことと、
    前記代替クエリが或る既知の高ランク付けされたクエリに修正されることが統計学的に高い確率を持つかどうかを決定することと、
    前記統計学的に高い確率を持つとの決定に基づき、候補修正クエリとして前記既知の高ランク付けされたクエリを同定することと、ここで、前記既知の高ランク付けされたクエリを同定することは、
    前記クエリに関してクエリ発生頻度を計算することと、
    前記クエリに関してユーザ満足度スコアを計算することと、ここで、前記ユーザ満足度スコアは検索結果上でのクリックの長さを推定するユーザクリック動作データによって決定され、
    クエリ発生頻度とユーザ満足度スコアの関数として、前記クエリのためのランクを計算することとを含み、
    信頼性尺度として候補修正クエリのための修正スコアを使って前記候補修正クエリをランク付けすることと、
    前記最初のクエリのために提案する修正として前記候補修正クエリを提供することであって、前記提案する修正は前記信頼性尺度の相対的な強さに依存する場所でユーザに表示されるものと
    で構成されることを特徴とする方法。
  17. 最初のクエリに応答して既知の高ランク付けされたクエリを自動的に提案するためにサーバコンピュータシステムコンピュータによって実行されるコンピュータプログラムであって、前記コンピュータに、
    前記最初のクエリから索引付けされたクエリの修正確率であって、前記最初のクエリと前記索引付けされたクエリとの間の類似度を示す前記修正確率を計算する手順と、
    前記最初のクエリのための前記修正確率と前記索引付けされたクエリのクエリランクとの関数として該索引付けされたクエリのための修正スコアを計算する手順と、
    前記最初のクエリの代替クエリとして前記索引付けされたクエリを選択して取り出す手順と、
    前記代替クエリが或る既知の高ランク付けされたクエリに修正されることが統計学的に高い確率を持つかどうかを決定する手順と、
    前記統計学的に高い確率を持つとの決定に基づき、候補修正クエリとして前記既知の高ランク付けされたクエリを同定する手順と、
    前記候補修正クエリ用の信頼性尺度として、前記索引付けされたクエリのための前記修正スコアを関連付ける手順と、
    前記信頼性尺度に基づき前記候補修正クエリをランク付けする手順と、
    前記最初のクエリのために提案する修正として前記ランク付けされた候補修正クエリを提供する手順と
    を実行させるためのコンピュータプログラム。
  18. 既知の高ランク付けされたクエリとしてクエリを識別するためにサーバコンピュータシステムコンピュータによって実行されるコンピュータプログラムであって、前記コンピュータに、
    ユーザセションから作成されたクエリデータを記録する手順と、
    前記ユーザセションの間にクエリのインデックスを作成する手順と、
    前記最初のクエリから索引付けされたクエリの修正確率であって、前記最初のクエリと前記索引付けされたクエリとの間の類似度を示す前記修正確率を計算する手順と、
    前記最初のクエリのための前記修正確率と前記索引付けされたクエリのクエリランクとの関数として該索引付けされたクエリのための修正スコアを計算する手順と、
    前記最初のクエリの代替クエリとして前記索引付けされたクエリを選択して取り出す手順と、
    前記代替クエリが或る既知の高ランク付けされたクエリに修正されることが統計学的に高い確率を持つかどうかを決定する手順と、
    前記統計学的に高い確率を持つとの決定に基づき、候補修正クエリとして前記既知の高ランク付けされたクエリを同定する手順と、ここで、前記既知の高ランク付けされたクエリを同定する手順は、
    前記クエリに関してクエリ発生頻度を計算する手順と、
    前記クエリに関してユーザ満足度スコアを計算する手順と、ここで、前記ユーザ満足度スコアは検索結果上でのクリックの長さを推定するユーザクリック動作データによって決定され、
    クエリ発生頻度とユーザ満足度スコアの関数として、前記クエリのためのランクを計算する手順とを含み、
    信頼性尺度として候補修正クエリのための修正スコアを使って前記候補修正クエリをランク付けする手順と、
    前記候補修正クエリを、前記最初のクエリのために提案する修正として、前記信頼性尺度の相対的な強さに依存する場所にてユーザに表示するよう、提供する手順と
    を実行させることを特徴とするコンピュータプログラム。
  19. 請求項18に記載されたコンピュータプログラムであって、前記ユーザ満足度スコアは品質スコアの関数であることを特徴とするコンピュータプログラム。
  20. 請求項18に記載されたコンピュータプログラムであって、クエリのための前記品質スコアは検索結果上でのクリックの長さを推定するユーザ行動データから予測されることを特徴とするコンピュータプログラム。
  21. 請求項18に記載されたコンピュータプログラムであって、前記クエリランクはクエリ出現頻度とユーザ満足度スコアの関数であることを特徴とするコンピュータプログラム。
  22. 既知の高ランク付けされたクエリとしてクエリに修正クエリを提供するためのシステムであって、
    前記最初のクエリから索引付けされたクエリの修正確率であって、前記最初のクエリと前記索引付けされたクエリとの間の類似度を示す前記修正確率を計算する手段と、
    前記最初のクエリのための前記修正確率と前記索引付けされたクエリのクエリランクとの関数として該索引付けされたクエリのための修正スコアを計算する手段と、
    前記最初のクエリの代替クエリとして前記索引付けされたクエリを選択して取り出す手段と、
    前記代替クエリが或る既知の高ランク付けされたクエリに修正されることが統計学的に高い確率を持つかどうかを決定する手段と、
    前記統計学的に高い確率を持つとの決定に基づき、候補修正クエリとして前記既知の高ランク付けされたクエリを同定する手段と、
    前記候補修正クエリ用の信頼性尺度として、前記索引付けされたクエリのための前記修正スコアを関連付ける手段と、
    前記信頼性尺度に基づき前記候補修正クエリをランク付けする手段と、
    前記最初のクエリのために提案する修正として前記ランク付けされた候補修正クエリを提供する手段と
    を具備することを特徴とするシステム。
JP2008504089A 2005-03-29 2006-03-13 既知の高ランク付けされたクエリを用いたクエリ修正 Active JP4950174B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US11/094,814 US7565345B2 (en) 2005-03-29 2005-03-29 Integration of multiple query revision models
US11/094,814 2005-03-29
US11/095,920 2005-03-30
US11/096,198 2005-03-30
US11/096,198 US7617205B2 (en) 2005-03-30 2005-03-30 Estimating confidence for query revision models
US11/095,920 US20060230005A1 (en) 2005-03-30 2005-03-30 Empirical validation of suggested alternative queries
US11/285,814 US7870147B2 (en) 2005-03-29 2005-11-22 Query revision using known highly-ranked queries
US11/285,814 2005-11-22
PCT/US2006/009076 WO2006104683A2 (en) 2005-03-29 2006-03-13 Query revision using known highly-ranked queries

Publications (3)

Publication Number Publication Date
JP2008535090A JP2008535090A (ja) 2008-08-28
JP2008535090A5 JP2008535090A5 (ja) 2011-12-08
JP4950174B2 true JP4950174B2 (ja) 2012-06-13

Family

ID=37053875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008504089A Active JP4950174B2 (ja) 2005-03-29 2006-03-13 既知の高ランク付けされたクエリを用いたクエリ修正

Country Status (8)

Country Link
US (2) US7870147B2 (ja)
EP (1) EP1869586A4 (ja)
JP (1) JP4950174B2 (ja)
KR (1) KR101269105B1 (ja)
AR (1) AR052956A1 (ja)
AU (2) AU2006229761B2 (ja)
CA (1) CA2603718C (ja)
WO (1) WO2006104683A2 (ja)

Families Citing this family (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002352691A1 (en) * 2001-12-07 2003-06-23 Regenesis, Llc Cleaning article containing hydrophilic polymers
AU2003279992A1 (en) * 2002-10-21 2004-05-13 Ebay Inc. Listing recommendation in a network-based commerce system
US7617205B2 (en) 2005-03-30 2009-11-10 Google Inc. Estimating confidence for query revision models
US8521725B1 (en) 2003-12-03 2013-08-27 Google Inc. Systems and methods for improved searching
US9223868B2 (en) 2004-06-28 2015-12-29 Google Inc. Deriving and using interaction profiles
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7870147B2 (en) * 2005-03-29 2011-01-11 Google Inc. Query revision using known highly-ranked queries
US8200687B2 (en) * 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US8095419B1 (en) * 2005-10-17 2012-01-10 Yahoo! Inc. Search score for the determination of search quality
US8903810B2 (en) * 2005-12-05 2014-12-02 Collarity, Inc. Techniques for ranking search results
US8429184B2 (en) * 2005-12-05 2013-04-23 Collarity Inc. Generation of refinement terms for search queries
KR100776697B1 (ko) * 2006-01-05 2007-11-16 주식회사 인터파크지마켓 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템
EP1826692A3 (en) * 2006-02-22 2009-03-25 Copernic Technologies, Inc. Query correction using indexed content on a desktop indexer program.
US7814112B2 (en) 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms
US8442972B2 (en) * 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
US9519715B2 (en) 2006-11-02 2016-12-13 Excalibur Ip, Llc Personalized search
KR100837334B1 (ko) * 2006-11-29 2008-06-12 엔에이치엔(주) 검색로그의 악용을 방지하는 방법 및 그 장치
CN103020106B (zh) * 2007-01-24 2016-05-18 谷歌公司 混合移动搜索结果
US20080215416A1 (en) * 2007-01-31 2008-09-04 Collarity, Inc. Searchable interactive internet advertisements
US20080201434A1 (en) * 2007-02-16 2008-08-21 Microsoft Corporation Context-Sensitive Searches and Functionality for Instant Messaging Applications
US20080250008A1 (en) * 2007-04-04 2008-10-09 Microsoft Corporation Query Specialization
US8099418B2 (en) * 2007-05-28 2012-01-17 Panasonic Corporation Information search support method and information search support device
US8849831B2 (en) * 2007-06-07 2014-09-30 Datamaxx Applied Technologies, Inc. System and method for efficient indexing of messages in a law enforcement data network
US8051040B2 (en) * 2007-06-08 2011-11-01 Ebay Inc. Electronic publication system
US20080312940A1 (en) * 2007-06-13 2008-12-18 Mdb Capital Group, Llc Imputing Intellectual Property Owned by Subsidiaries During Automated Identification of Owned Intellectual Property
US20080312981A1 (en) * 2007-06-13 2008-12-18 Mdb Capital Group, Llc Automated Identification of Competitors
US8280892B2 (en) 2007-10-05 2012-10-02 Fujitsu Limited Selecting tags for a document by analyzing paragraphs of the document
US9081852B2 (en) * 2007-10-05 2015-07-14 Fujitsu Limited Recommending terms to specify ontology space
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
KR100932842B1 (ko) 2007-12-06 2009-12-21 엔에이치엔(주) 검색랭킹의 품질 평가 방법 및 시스템
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US20090192784A1 (en) * 2008-01-24 2009-07-30 International Business Machines Corporation Systems and methods for analyzing electronic documents to discover noncompliance with established norms
US8280886B2 (en) 2008-02-13 2012-10-02 Fujitsu Limited Determining candidate terms related to terms of a query
EP2090992A3 (en) * 2008-02-13 2011-01-26 Fujitsu Limited Determining words related to a given set of words
US8924421B2 (en) * 2008-02-22 2014-12-30 Tigerlogic Corporation Systems and methods of refining chunks identified within multiple documents
US8145632B2 (en) * 2008-02-22 2012-03-27 Tigerlogic Corporation Systems and methods of identifying chunks within multiple documents
US8001140B2 (en) * 2008-02-22 2011-08-16 Tigerlogic Corporation Systems and methods of refining a search query based on user-specified search keywords
US7933896B2 (en) * 2008-02-22 2011-04-26 Tigerlogic Corporation Systems and methods of searching a document for relevant chunks in response to a search request
US8126880B2 (en) * 2008-02-22 2012-02-28 Tigerlogic Corporation Systems and methods of adaptively screening matching chunks within documents
US9129036B2 (en) * 2008-02-22 2015-09-08 Tigerlogic Corporation Systems and methods of identifying chunks within inter-related documents
US8924374B2 (en) * 2008-02-22 2014-12-30 Tigerlogic Corporation Systems and methods of semantically annotating documents of different structures
US8359533B2 (en) * 2008-02-22 2013-01-22 Tigerlogic Corporation Systems and methods of performing a text replacement within multiple documents
EP2260417A4 (en) * 2008-02-22 2016-08-24 Tigerlogic Corp SYSTEMS AND METHODS FOR IDENTIFYING FRAGMENTS IN MULTIPLE DOCUMENTS
US8078630B2 (en) 2008-02-22 2011-12-13 Tigerlogic Corporation Systems and methods of displaying document chunks in response to a search request
US7937395B2 (en) * 2008-02-22 2011-05-03 Tigerlogic Corporation Systems and methods of displaying and re-using document chunks in a document development application
US8001162B2 (en) * 2008-02-22 2011-08-16 Tigerlogic Corporation Systems and methods of pipelining multiple document node streams through a query processor
US20090228296A1 (en) * 2008-03-04 2009-09-10 Collarity, Inc. Optimization of social distribution networks
US20090248595A1 (en) * 2008-03-31 2009-10-01 Yumao Lu Name verification using machine learning
US9798806B2 (en) * 2008-03-31 2017-10-24 Excalibur Ip, Llc Information retrieval using dynamic guided navigation
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8688694B2 (en) * 2008-04-20 2014-04-01 Tigerlogic Corporation Systems and methods of identifying chunks from multiple syndicated content providers
US9128945B1 (en) 2008-05-16 2015-09-08 Google Inc. Query augmentation
US8803882B2 (en) * 2008-06-06 2014-08-12 Microsoft Corporation Identifying on a graphical depiction candidate points and top-moving queries
US8438178B2 (en) * 2008-06-26 2013-05-07 Collarity Inc. Interactions among online digital identities
US20100100563A1 (en) * 2008-10-18 2010-04-22 Francisco Corella Method of computing a cooperative answer to a zero-result query through a high latency api
US20100114928A1 (en) * 2008-11-06 2010-05-06 Yahoo! Inc. Diverse query recommendations using weighted set cover methodology
US9053197B2 (en) * 2008-11-26 2015-06-09 Red Hat, Inc. Suggesting websites
US8458171B2 (en) * 2009-01-30 2013-06-04 Google Inc. Identifying query aspects
US8601015B1 (en) * 2009-05-15 2013-12-03 Wolfram Alpha Llc Dynamic example generation for queries
US8788524B1 (en) 2009-05-15 2014-07-22 Wolfram Alpha Llc Method and system for responding to queries in an imprecise syntax
US20150006563A1 (en) * 2009-08-14 2015-01-01 Kendra J. Carattini Transitive Synonym Creation
US8392440B1 (en) 2009-08-15 2013-03-05 Google Inc. Online de-compounding of query terms
CN102576368B (zh) * 2009-08-31 2016-03-16 谷歌公司 用于选择和呈现与用户输入相关的回答框作为查询建议的框架
US8380570B2 (en) * 2009-10-27 2013-02-19 Yahoo! Inc. Index-based technique friendly CTR prediction and advertisement selection
US20110145283A1 (en) * 2009-12-10 2011-06-16 International Business Machines Corporation Intelligent mechanism for identifying ontological hypertext and pre-fetching and presenting the target information
US8875038B2 (en) 2010-01-19 2014-10-28 Collarity, Inc. Anchoring for content synchronization
US8301639B1 (en) 2010-01-29 2012-10-30 Google Inc. Location based query suggestion
CN102141990B (zh) * 2010-02-01 2014-02-26 阿里巴巴集团控股有限公司 一种搜索方法和装置
US20110238686A1 (en) * 2010-03-24 2011-09-29 Microsoft Corporation Caching data obtained via data service interfaces
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US20110295897A1 (en) * 2010-06-01 2011-12-01 Microsoft Corporation Query correction probability based on query-correction pairs
US8583674B2 (en) * 2010-06-18 2013-11-12 Microsoft Corporation Media item recommendation
US20110314011A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Automatically generating training data
US8631030B1 (en) 2010-06-23 2014-01-14 Google Inc. Query suggestions with high diversity
US8548981B1 (en) * 2010-06-23 2013-10-01 Google Inc. Providing relevance- and diversity-influenced advertisements including filtering
US9152634B1 (en) 2010-06-23 2015-10-06 Google Inc. Balancing content blocks associated with queries
US20150248698A1 (en) 2010-06-23 2015-09-03 Google Inc. Distributing content items
US8751520B1 (en) 2010-06-23 2014-06-10 Google Inc. Query suggestions with high utility
US9390139B1 (en) 2010-06-23 2016-07-12 Google Inc. Presentation of content items in view of commerciality
JP5406794B2 (ja) * 2010-06-28 2014-02-05 日本電信電話株式会社 検索クエリ推薦装置及び検索クエリ推薦プログラム
US20120011112A1 (en) * 2010-07-06 2012-01-12 Yahoo! Inc. Ranking specialization for a search
US8442987B2 (en) * 2010-08-19 2013-05-14 Yahoo! Inc. Method and system for providing contents based on past queries
US20120059838A1 (en) * 2010-09-07 2012-03-08 Microsoft Corporation Providing entity-specific content in response to a search query
US8346792B1 (en) 2010-11-09 2013-01-01 Google Inc. Query generation using structural similarity between documents
US9251185B2 (en) 2010-12-15 2016-02-02 Girish Kumar Classifying results of search queries
US20120246133A1 (en) * 2011-03-23 2012-09-27 Microsoft Corporation Online spelling correction/phrase completion system
US9507861B2 (en) * 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US8732151B2 (en) 2011-04-01 2014-05-20 Microsoft Corporation Enhanced query rewriting through statistical machine translation
CN102750280A (zh) * 2011-04-19 2012-10-24 国际商业机器公司 用于搜索的计算机处理方法及系统
US20130041878A1 (en) * 2011-08-11 2013-02-14 Microsoft Corporation Autosuggesting an equivalent query
US9734252B2 (en) 2011-09-08 2017-08-15 Wolfram Alpha Llc Method and system for analyzing data using a query answering system
US8612414B2 (en) 2011-11-21 2013-12-17 Google Inc. Grouped search query refinements
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US10311096B2 (en) * 2012-03-08 2019-06-04 Google Llc Online image analysis
WO2013154947A1 (en) 2012-04-09 2013-10-17 Vivek Ventures, LLC Clustered information processing and searching with structured-unstructured database bridge
US8868565B1 (en) * 2012-10-30 2014-10-21 Google Inc. Calibrating click duration according to context
US20140181096A1 (en) * 2012-12-21 2014-06-26 Microsoft Corporation Entity name disambiguation
US9135307B1 (en) * 2012-12-27 2015-09-15 Google Inc. Selectively generating alternative queries
US9116957B1 (en) 2013-03-05 2015-08-25 Google Inc. Substitute term scoring
US10198497B2 (en) * 2013-06-11 2019-02-05 [24]7.ai, Inc. Search term clustering
US9342626B1 (en) * 2013-06-22 2016-05-17 Google Inc. Query suggestions based on entity collections of one or more past queries
US20160085868A1 (en) * 2013-10-06 2016-03-24 Ronald P. Young Digital search filter that presents results focused only on the most relevant solutions
US9460215B2 (en) 2013-12-19 2016-10-04 Facebook, Inc. Ranking recommended search queries on online social networks
EP3474153A1 (en) * 2013-12-19 2019-04-24 Facebook, Inc. Generating card stacks with queries on online social networks
US9984127B2 (en) * 2014-01-09 2018-05-29 International Business Machines Corporation Using typestyles to prioritize and rank search results
US9477782B2 (en) 2014-03-21 2016-10-25 Microsoft Corporation User interface mechanisms for query refinement
WO2015171952A1 (en) * 2014-05-09 2015-11-12 Chu-Cheng Hsieh Methods and systems to identify query recommendations
US9965547B2 (en) * 2014-05-09 2018-05-08 Camelot Uk Bidco Limited System and methods for automating trademark and service mark searches
CN105446982A (zh) * 2014-06-30 2016-03-30 国际商业机器公司 用于管理数据存储系统的方法和装置
US9785715B1 (en) 2016-04-29 2017-10-10 Conversable, Inc. Systems, media, and methods for automated response to queries made by interactive electronic chat
US11334800B2 (en) * 2016-05-12 2022-05-17 International Business Machines Corporation Altering input search terms
US11468050B2 (en) * 2017-11-30 2022-10-11 International Business Machines Corporation Learning user synonyms from sequenced query sessions
RU2718216C2 (ru) 2018-07-03 2020-03-31 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для ранжирования документов на странице результатов поиска
US10503792B1 (en) 2019-05-10 2019-12-10 Georgetown University Cache optimization via topics in web search engines
US11151167B2 (en) 2019-05-10 2021-10-19 Georgetown University Cache optimization via topics in web search engines
EP3905061A1 (en) * 2020-04-30 2021-11-03 Mirriad Advertising PLC Artificial intelligence for content discovery
US20220253470A1 (en) * 2021-02-05 2022-08-11 SparkCognition, Inc. Model-based document search

Family Cites Families (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642502A (en) 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US6006221A (en) 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US5826260A (en) 1995-12-11 1998-10-20 International Business Machines Corporation Information retrieval system and method for displaying and ordering information based on query element contribution
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6006222A (en) 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US5897627A (en) 1997-05-20 1999-04-27 Motorola, Inc. Method of determining statistically meaningful rules
US6014665A (en) 1997-08-01 2000-01-11 Culliss; Gary Method for organizing information
US6078916A (en) 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
US6182068B1 (en) 1997-08-01 2001-01-30 Ask Jeeves, Inc. Personalized search methods
US6311175B1 (en) 1998-03-06 2001-10-30 Perot Systems Corp. System and method for generating performance models of complex information technology systems
US6006225A (en) 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6243076B1 (en) 1998-09-01 2001-06-05 Synthetic Environments, Inc. System and method for controlling host system interface with point-of-interest data
US6411950B1 (en) 1998-11-30 2002-06-25 Compaq Information Technologies Group, Lp Dynamic query expansion
US6542894B1 (en) 1998-12-09 2003-04-01 Unica Technologies, Inc. Execution of multiple models using data segmentation
US6519585B1 (en) 1999-04-27 2003-02-11 Infospace, Inc. System and method for facilitating presentation of subject categorizations for use in an on-line search query engine
US6493702B1 (en) 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US20040236721A1 (en) 2003-05-20 2004-11-25 Jordan Pollack Method and apparatus for distributing information to users
US6718363B1 (en) 1999-07-30 2004-04-06 Verizon Laboratories, Inc. Page aggregation for web sites
GB9925741D0 (en) 1999-10-30 1999-12-29 Ibm Interaction with database reports
US6772150B1 (en) 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
US6732088B1 (en) 1999-12-14 2004-05-04 Xerox Corporation Collaborative searching by query induction
US6981040B1 (en) 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US6397211B1 (en) 2000-01-03 2002-05-28 International Business Machines Corporation System and method for identifying useless documents
US6546388B1 (en) 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6546389B1 (en) 2000-01-19 2003-04-08 International Business Machines Corporation Method and system for building a decision-tree classifier from privacy-preserving data
US6523020B1 (en) 2000-03-22 2003-02-18 International Business Machines Corporation Lightweight rule induction
US6671711B1 (en) 2000-03-31 2003-12-30 Xerox Corporation System and method for predicting web user flow by determining association strength of hypermedia links
KR20020019079A (ko) 2000-04-13 2002-03-09 요트.게.아. 롤페즈 검색 태스크 모델을 가진 검색 엔진 및 대화형 검색태스크 정교화 프로세스
US6701309B1 (en) 2000-04-21 2004-03-02 Lycos, Inc. Method and system for collecting related queries
US20020016736A1 (en) * 2000-05-03 2002-02-07 Cannon George Dewey System and method for determining suitable breaks for inserting content
JP2002013938A (ja) 2000-06-28 2002-01-18 Mazda Motor Corp 情報提供システム、該情報提供システムに用いられるサーバー装置及び車載装置、並びに該車載装置又はコンピュータが読みとり可能なプログラムを記録した記録媒体
US6463430B1 (en) 2000-07-10 2002-10-08 Mohomine, Inc. Devices and methods for generating and managing a database
US6675159B1 (en) 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US20030217052A1 (en) 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US7062488B1 (en) 2000-08-30 2006-06-13 Richard Reisman Task/domain segmentation in applying feedback to command control
AU9124801A (en) 2000-09-28 2002-04-08 Oracle Corp Enterprise web mining system and method
US6678679B1 (en) 2000-10-10 2004-01-13 Science Applications International Corporation Method and system for facilitating the refinement of data queries
US6804662B1 (en) * 2000-10-27 2004-10-12 Plumtree Software, Inc. Method and apparatus for query and analysis
US6856957B1 (en) 2001-02-07 2005-02-15 Nuance Communications Query expansion and weighting based on results of automatic speech recognition
US7194454B2 (en) 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
US7065524B1 (en) 2001-03-30 2006-06-20 Pharsight Corporation Identification and correction of confounders in a statistical analysis
US6714929B1 (en) 2001-04-13 2004-03-30 Auguri Corporation Weighted preference data search system and method
US6738764B2 (en) 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
US7499907B2 (en) 2001-10-12 2009-03-03 Teradata Us, Inc. Index selection in a database system
US7149732B2 (en) 2001-10-12 2006-12-12 Microsoft Corporation Clustering web queries
US8117072B2 (en) 2001-11-13 2012-02-14 International Business Machines Corporation Promoting strategic documents by bias ranking of search results on a web browser
JP2003208538A (ja) 2002-01-11 2003-07-25 Oki Electric Ind Co Ltd 広告配信システム及びその制御用プログラム
AU2003212463A1 (en) * 2002-03-01 2003-09-16 Paul Jeffrey Krupin A method and system for creating improved search queries
US7272122B2 (en) 2002-04-26 2007-09-18 Nokia Corporation Relocation of application-specific functionality during seamless network layer-level handoffs
US7437349B2 (en) * 2002-05-10 2008-10-14 International Business Machines Corporation Adaptive probabilistic query expansion
US7231395B2 (en) 2002-05-24 2007-06-12 Overture Services, Inc. Method and apparatus for categorizing and presenting documents of a distributed database
US6829599B2 (en) * 2002-10-02 2004-12-07 Xerox Corporation System and method for improving answer relevance in meta-search engines
US7383258B2 (en) 2002-10-03 2008-06-03 Google, Inc. Method and apparatus for characterizing documents based on clusters of related words
JP4536358B2 (ja) 2002-12-04 2010-09-01 株式会社リコー 画像形成装置
US6947930B2 (en) * 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7051023B2 (en) 2003-04-04 2006-05-23 Yahoo! Inc. Systems and methods for generating concept units from search queries
US7617202B2 (en) 2003-06-16 2009-11-10 Microsoft Corporation Systems and methods that employ a distributional analysis on a query log to improve search results
WO2005001668A2 (en) 2003-06-29 2005-01-06 Bitpass, Inc. Dynamic indicator for context sensitive real-time communications
US8856163B2 (en) 2003-07-28 2014-10-07 Google Inc. System and method for providing a user interface with search query broadening
US8086619B2 (en) * 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US20050071337A1 (en) 2003-09-25 2005-03-31 International Business Machines Corporation Encryption of query execution details in a database management system
US7617205B2 (en) 2005-03-30 2009-11-10 Google Inc. Estimating confidence for query revision models
US7231399B1 (en) 2003-11-14 2007-06-12 Google Inc. Ranking documents based on large data sets
US20050144158A1 (en) * 2003-11-18 2005-06-30 Capper Liesl J. Computer network search engine
US7689412B2 (en) 2003-12-05 2010-03-30 Microsoft Corporation Synonymous collocation extraction using translation information
US20050149499A1 (en) 2003-12-30 2005-07-07 Google Inc., A Delaware Corporation Systems and methods for improving search quality
US7516118B1 (en) 2003-12-31 2009-04-07 Google Inc. Methods and systems for assisted network browsing
US8676830B2 (en) 2004-03-04 2014-03-18 Yahoo! Inc. Keyword recommendation for internet search engines
KR101222294B1 (ko) * 2004-03-15 2013-01-15 야후! 인크. 사용자 주석이 통합된 검색 시스템 및 방법
US8150825B2 (en) * 2004-03-15 2012-04-03 Yahoo! Inc. Inverse search systems and methods
US7254774B2 (en) 2004-03-16 2007-08-07 Microsoft Corporation Systems and methods for improved spell checking
US7590619B2 (en) 2004-03-22 2009-09-15 Microsoft Corporation Search system using user behavior data
US20050256848A1 (en) 2004-05-13 2005-11-17 International Business Machines Corporation System and method for user rank search
US7293017B2 (en) 2004-07-01 2007-11-06 Microsoft Corporation Presentation-level content filtering for a search result
US7519595B2 (en) 2004-07-14 2009-04-14 Microsoft Corporation Method and system for adaptive categorial presentation of search results
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US7958115B2 (en) 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US7836076B2 (en) 2004-08-20 2010-11-16 Hewlett-Packard Development Company, L.P. Distributing content indices
US20060074883A1 (en) 2004-10-05 2006-04-06 Microsoft Corporation Systems, methods, and interfaces for providing personalized search and information access
US7475340B2 (en) 2005-03-24 2009-01-06 International Business Machines Corporation Differential dynamic content delivery with indications of interest from non-participants
US7870147B2 (en) * 2005-03-29 2011-01-11 Google Inc. Query revision using known highly-ranked queries
US7565345B2 (en) 2005-03-29 2009-07-21 Google Inc. Integration of multiple query revision models
US7636714B1 (en) * 2005-03-31 2009-12-22 Google Inc. Determining query term synonyms within query context
US8266162B2 (en) * 2005-10-31 2012-09-11 Lycos, Inc. Automatic identification of related search keywords

Also Published As

Publication number Publication date
EP1869586A2 (en) 2007-12-26
AR052956A1 (es) 2007-04-11
US8375049B2 (en) 2013-02-12
US20110060736A1 (en) 2011-03-10
JP2008535090A (ja) 2008-08-28
AU2011201142A1 (en) 2011-04-07
US7870147B2 (en) 2011-01-11
AU2006229761B2 (en) 2010-12-23
WO2006104683A3 (en) 2007-11-22
US20060224554A1 (en) 2006-10-05
CA2603718C (en) 2013-05-28
AU2006229761A1 (en) 2006-10-05
EP1869586A4 (en) 2010-02-17
KR101269105B1 (ko) 2013-05-29
AU2011201142B2 (en) 2013-07-11
CA2603718A1 (en) 2006-10-05
WO2006104683A2 (en) 2006-10-05
KR20070118142A (ko) 2007-12-13

Similar Documents

Publication Publication Date Title
JP4950174B2 (ja) 既知の高ランク付けされたクエリを用いたクエリ修正
US9697249B1 (en) Estimating confidence for query revision models
JP4831795B2 (ja) 多数のクエリー修正モデルの統合
JP4638439B2 (ja) ウェブ検索の個人化
KR101171405B1 (ko) 검색 결과에서 배치 내용 정렬의 맞춤화
US7636714B1 (en) Determining query term synonyms within query context
US20070067294A1 (en) Readability and context identification and exploitation
US20050222989A1 (en) Results based personalization of advertisements in a search engine
US20090193007A1 (en) Systems and methods for ranking search engine results
JP2008535090A5 (ja)
US20100317444A1 (en) Using a human computation game to improve search engine performance
AU2011247862B2 (en) Integration of multiple query revision models
AU2012202738A1 (en) Results based personalization of advertisements in a search engine
Field et al. SIR’11: Information Retrieval Over Query Sessions

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090312

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110920

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111021

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20111021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4950174

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250