JP2009528619A - ウェブ検索の適合性を高めるためにウェブ検索のユーザの振舞いをマイニングすること - Google Patents

ウェブ検索の適合性を高めるためにウェブ検索のユーザの振舞いをマイニングすること Download PDF

Info

Publication number
JP2009528619A
JP2009528619A JP2008557273A JP2008557273A JP2009528619A JP 2009528619 A JP2009528619 A JP 2009528619A JP 2008557273 A JP2008557273 A JP 2008557273A JP 2008557273 A JP2008557273 A JP 2008557273A JP 2009528619 A JP2009528619 A JP 2009528619A
Authority
JP
Japan
Prior art keywords
computer
user
user behavior
behavior
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008557273A
Other languages
English (en)
Other versions
JP5247475B2 (ja
JP2009528619A5 (ja
Inventor
イー.アジチテイン エフゲニー
デー.ブリル エリック
ティー.デュマイス スーザン
ジェー.ラグノ ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2009528619A publication Critical patent/JP2009528619A/ja
Publication of JP2009528619A5 publication Critical patent/JP2009528619A5/ja
Application granted granted Critical
Publication of JP5247475B2 publication Critical patent/JP5247475B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ユーザの振舞いの自動的な対話を介して、ユーザの選択を予測するシステム及び方法である。検索エンジンに関連付けられたユーザの振舞いコンポーネントは、ユーザ(例えばウェブ検索ユーザ)の振舞いの集合を自動的に解釈できる。このようなフィードバックコンポーネントはノイズを軽減するユーザの振舞い特性及び(例えばユーザの振舞いコンポーネントから)予測されたモデルを含むことができ、検索結果との観察されたユーザの対話において存在できる(例えば悪意のある及び/又は不合理なユーザの動作)。

Description

WWW(World Wide Web)及びインターネットの人気により、ユーザは大量の情報ソースからほとんど任意のトピックに関する情報を獲得できる。情報を見つけるためにユーザは一般に、情報取り出しのタスクのために様々な検索エンジンを適用する。検索エンジンは、特定の語又は句を含むインターネット上の情報又は他の題材を含むウェブページをユーザが見つけることを可能にする。
一般に、キーワード検索は、コンピュータの能力の限りまで、特定された任意のキーワード及び句に関する任意の情報を有するすべてのウェブサイトを見つけることができる。検索エンジンのサイトは、ユーザがキーワードを入力するためのボックス及び検索を開始するために押すボタンを有する。多くの検索エンジンは、効率的に検索するためにどのようにキーワードを使用するかについてのヒント情報(tips)を有する。典型的には、このようなヒント情報は、余計な関係のない情報が返されず、情報取り出し処理が散らからないように、ユーザが検索用語を狭くして定義するのを助ける。このような用語を手動で狭くすることは、特定の情報を探すときにソートする数千のサイトを受信することを軽減することが出来る。
このような場合において検索トピックは、トピック領域及びサブトピック領域に前もって配置される。たとえば「Yahoo」は、可能性のあるトピック(例えばビジネス、政府、化学など)の階層的に配置された既定のリストを提供し、ユーザはトピックを選択し、その後リスト内のサブトピックをさらに選択する。トピックの既定のリストの別の例は、デスクトップのパーソナルコンピュータのヘルプユーティリティ上で共通であり、ヘルプトピックのリスト及び関連したサブトピックがユーザに提供される。これらの既定された階層は、いくつかの状況において役に立つであろう一方で、ユーザはしばしばこれらの既定のリストの外部及び/又は含まれていない情報を検索/調べる必要がある。従って検索エンジン及び他の検索システムは、所望の情報を見つけるために直接の問い合わせ(クエリ)をユーザに可能にするためにしばしば採用される。それでもなお、ユーザがどのように特定の問い合わせを作成するか又は構築するかは確かでないかもしれないので、ユーザが検索している間に多くの関係のない結果が取り出される。さらに、このようなシステムは普通、問い合わせを継続的に修正することをユーザに要求し、検査するために適度な数の結果を取得するために取り出された検索結果の精度を高める。
検索システムの問い合わせ入力フィールドにおいて語又は句を打ち込み、その後可能性のある候補として数百万の結果を取り出すことは一般的ではない。多数の取り出された候補を理解するために、ユーザは他の語の組み合わせでしばしば試して、リストをさらに狭める。
一般に検索システムは、問い合わせに対する予測された関連性のある結果に従って、結果を順位付ける(rank)であろう。この順位付けは一般に、問い合わせへのウェブページの類似性も、ドキュメントの固有の質も含む多くのパラメータを結合する機能に基づき、しばしばウェブトポロジー情報から推定される。ユーザは一般により低く位置付けられた結果を閲覧しないので、ユーザの検索の経験の質は、位置付け機能の質に直接関係する。
一般に検索システムは、「検索した」トピックがユーザが実際に興味を持っていたトピックの領域又はカテゴリに状況的な関係を有さないか有すかどうかに関わらず、ユーザの問い合わせ入力に関係する全てのトピックをマッチ又は見つけるようとする。例として、天文学に興味を持ったユーザが従来の検索システムに「土星」という問い合わせを入力した場合、関係のないすべてのタイプの結果が、「土星」という語を有する車、自動車販売業者、コンピュータゲーム及び他のサイトに関するものを含んで返される可能性が高い。従来の検索の遂行の他の問題は、検索エンジンは異なるユーザのニーズ及び環境に関わらず全てのユーザに同じように動作することである。したがって、2人のユーザが同じ検索問い合わせを入力する場合、彼らの興味又は特徴、過去の検索履歴、現在のコンピューティングの状況(例えばファイルが開かれている)又は環境的な状況(例えば、使用されている機械、時刻、曜日)に関わらず、彼らは通常同じ結果を取得する。
関連性のある結果をトップに戻すための検索位置付け機能をチューニングすることは、重大な努力を必要とする。現代の検索エンジンに対する一般的なアプローチは、順位付け機能を訓練し、機能パラメータを設定し、手動で順位付けした検索結果の例に基づいて自動的に重み付けすることである。人の注釈者はとらえた関連性に従って問い合わせに対するページのセットを明確に順位付けることができ、異なる順位付けアルゴリズムがチューニングされ評価されうる「黄金のスタンダード」を作成する。しかし明確な人の順位付けは高価で取得が難しく、訓練が完全でなく、準最適な順位付け機能である。
以下は、特許請求された主題のいくつかの態様の基本的な理解を提供するために簡略化された概要を示す。この課題を解決するための手段は、広い概要である。これは鍵となる/重要な要素を特定すること、又は特許請求された主題の範囲を描くことを意図しない。この唯一の目的は、以降で示されるより詳細な説明に先立つものとして、簡略化された形式でいくつかの概念を示すことである。
この主題の新しい部分は、先を争うアイテムに対するユーザの選択を予測するために、ユーザの振舞いの集合について自動的な解釈を容易にするユーザ振舞いコンポーネントを採用することを介して、情報検索システム(information retrieval system)における検索順位付け(ランク)を拡張する。このような選択は、結果の順位付けを改善するなどの様々な目的のためにその後採用できる。ユーザの振舞いコンポーネントは、検索エンジンと対話でき、通常ユーザの振舞い(例えば悪意のある及び/又は不合理なユーザの動作)を伴うノイズを軽減するフィードバック特性を含むことができる。ユーザの振舞いの集合を生かすことにより(例えば各ユーザを個々の専門家として扱うのではなく)、主題の新しい部分は、ノイズを軽減でき、ユーザのフィードバックから関連性のある判断を生成できる。ユーザの振舞いコンポーネントは、ユーザからのフィードバック及び前の問い合わせからの結果との対話を黙示的に又は明確に採用できる。鍵となる振舞いの特性は、結果のタイトル及び説明で見ることにより結果が関連性があるかどうかをユーザが決定するのを助けることが出来る表示特性(presentation feature);ページ上の滞在時間(dwell time)などのブラウジング特性(browsing feature)であり、ドメイン上の平均時間からの差で到達する検索結果の方式(例えば他のリンク)など;問い合わせに対する特定の結果でクリック数などのクリックスルー特性(clickthrough feature)を含む。所与の問い合わせ結果ペアの主題の工夫点は、各特性タイプについて観察され導き出された複数の特性値を提供する。
ユーザ振舞いコンポーネントは、ユーザの振舞いのデータドリブン(data-driven:データ駆動)のモデルを採用できる。例えば、2つのコンポーネント:「バックグランド」コンポーネント、(無差別にクリックするユーザなど)及び「関連性のある」コンポーネント、(問い合わせへの結果の関連性により影響される問い合わせ特有の振舞いなど)、により生成されたかのように、ユーザの振舞いコンポーネントは、ユーザのウェブ検索の振舞いをモデル化できる。
この主題の工夫点のさらなる態様によれば、ユーザの振舞いコンポーネントは、期待されたユーザの振舞いからの差を生成及び/又はモデル化できる。したがって、導き出された特性をコンピューティング(演算)でき、このような導き出された結果は、問い合わせに寄らない情報で、結果に対する期待値からの所与の検索結果について、観察された特性値の差に明確に向けられる。
さらに、主題の工夫点のユーザの振舞いコンポーネントは、ユーザの振舞いを説明するための2つの特性タイプを有し、直接(direct)及び偏差(deviational)という名であり、前者は直接計測された値であり、後者は対応する直接観察された特性についての(問い合わせ独立の)分布全体から予測された期待値からの差である。したがって、問い合わせq及び結果rに対する特性fの観察された値oは、2つのコンポーネントの混合として表現でき、
o(q,r,f)=C(r,f)+rel(q,r,f)
であり、C(r,f)はrに対応する全ての問い合わせにまたがって統合されたfの値についての前の「バックグランド」分布であり、rel(q,r,f)は、問い合わせへの結果の関連性により影響された振舞いの「関係性のある」コンポーネントである。例えば、ユーザの振舞いの関連性の予測は、所与の位置で観察されたクリックスルー周波からのバックグランド分布の減算を介してクリックスルー特性で取得できる。振舞いにおける個々のユーザのバリエーションの影響を軽減するために、主題の工夫点は、全てのユーザにまたがる特性値を平均化でき、各問い合わせ結果ペアについてセション(session)を検索できる。このような集合は、さらなる構造安定性を供給でき、「うるさい(noisy)」ユーザの対話に頼らない。
したがって、問い合わせ結果ペアに対するユーザの振舞いは、直接観察された特性及び導き出された「修正された」特性値の両方を含む特性ベクトルにより表すことができる。様々な機械学習技術もまた、情報検索システム(information retrieval system)に対する順位付けアルゴリズムの訓練と併せて採用できる。例えば明確な人の関連性の判断を、初期的には様々な検索問い合わせについて提供し、それに続く順位付けアルゴリズムを訓練するために採用できる。
関連した態様において、ウェブ検索エンジンと対話するユーザの集約的な振舞いは、未来のユーザの選択を予言するために自動的に解釈でき;従ってシステムをユーザ振舞いパターン、及び最近のユーザ振舞いデータで自動的にシステムを再訓練することにより異なる検索設定を変更するように順応させることができる。
上記及びその関連の達成のために、特許請求された主題のある例示的な態様がここで、以下の詳細な説明及び添付の図面と併せて説明される。これらの態様は主題が実施できる様々な方法を示し、これらの全ては特許請求された主題の範囲内であることを意図する。他の利点及び新規の特徴は、以下の図面と併せて考慮されるとき、以下でより詳細な説明から明らかとなるであろう。
本発明の様々な態様が添付の図面を参照してここで説明され、全体を通して同様の番号は、同様又は対応する要素を示す。しかし、これに関係する添付の図面及び発明を実施するための最良の形態は、開示された特定の形式で特許請求の範囲の主題を限定することを意図しないことを理解されたい。むしろ、意図は特許請求された主題の精神及び範囲内で全ての修正、均等物及び代替物をカバーすることである。
個々で使用される用語である「コンポーネント」「システム」「特性」などは、コンピュータ関連の実体物を意図し、ハードウェア、ハードウェア及びソフトウェアの組み合わせ、ソフトウェア、又は実行におけるソフトウェアである。例えば、コンポーネントは、プロセッサ上で実行中のプロセス、プロセッサ、オブジェクト、実行ファイル、実行のスレッド、プログラム及び/又はコンピュータであることができるが、これらに限定されない。例として、コンピュータ上で実行中のアプリケーション及びコンピュータはコンポーネントであることができる。1又は複数のコンポーネントは、プロセス内及び/又は実行のスレッド内に存在することができ、コンポーネントを1コンピュータ上で及び/又は2以上の分散されたコンピュータ上でローカライズすることができる。
「例示的な」という語は、例としての提供を意味するためにここで使用され、例えば又は例示である。「例示的な」としてここで説明される任意の態様又は設計は、他の態様又は設計上で好適又は利点として解釈される必要はない。
さらに、開示の主題はシステム、方法、装置、又はここで詳細化された態様を実装するために製造するための標準のプログラミング及び/又はエンジニアリング技術を使用する製造項目として実装できる。コンピュータプログラムと言う用語は、ここで使用されるように、任意のコンピュータ可読デバイス、キャリア又はメディアからアクセス可能なコンピュータプログラムを包含することを意図する。例えばコンピュータ可読媒体は、磁気ストレージディスク(例えばハードディスク、フロッピー(登録商標)ディスク、磁気ストライプ)、光ディスク(例えばCD(Compact Disk)、DVD(Digital Versatile disk)…)、スマートカード、フラッシュメモリデバイス(例えばカード、スティック)を含むことができるがこれらに限定はされない。さらに当然のことながら、搬送波は、電子メールを送受信する又はインターネット若しくはLAN(Local Area Network)などのネットワークにアクセスするのに使用される、コンピュータ可読の電子データを搬送するのに使用できる。当然、当業者は、特許請求された主題の範囲又は精神から逸脱することなくこの構成に多くの修正がなされうること認識されたい。
最初に図1に戻り、システム100のブロック図が示されており、主題の工夫点の例示的な態様によって検索エンジンと対話するユーザ振舞いコンポーネントを組み込む。検索エンジン102に関連付けられたユーザ振舞いコンポーネント104は、ユーザ101、103、105(1からNであり、Nは整数)の振舞いの集合を自動的に解釈できる。このようなユーザ振舞いコンポーネント104は、ノイズを軽減するフィードバック特性を含むことが出来、一般的にユーザ振舞いに伴う(例えば悪意のある及び/又は不合理なユーザ動作)。ユーザ101、103、105の振舞いの集合を利用することにより(例えば個々の専門家として個々のユーザを扱わず)、システム100はノイズを軽減でき、ユーザのフィードバックから関連性のある判断を生成できる。
ユーザ振舞いコンポーネント104は、順位付けコンポーネント対話ができる。所与の問い合わせに対して、ユーザ振舞いコンポーネント104は、この問い合わせに対する前に訓練された振舞いモデルから導き出された予測を取り出し、前のユーザについての関連性が現れた結果がより高く順位付けられるように、問い合わせに対する結果を再順序付けする。例えば、所与の問い合わせq、暗黙のスコアISrは、利用可能なユーザの対話特性からそれぞれの結果rについて演算でき、各結果に対して暗黙の順位付けIrという結果となる。合併されたスコアSM(r)は、暗黙のフィードバックIrから取得された順位をr、Orの元の順位と結合することにより、rについて演算できる。
Figure 2009528619
重みwIは、暗黙のフィードバックの関連性のある「重要性」を表す発見的問題解決法であるチューニングされたスケール要素である。この問い合わせ結果を、最終的な順位付けを作るためにSM(r)の値を減らすことにより順序付けることができる。このようなモデルの一特定的な場合は、wIがとても大きい値であるときmクリックされていない結果よりクリックされた結果がより高くなるよう効率的にさせることが挙げられる−ベースラインとして採用される直感的及び効率的な発見的問題解決法。一般に、上述のアプローチは、元のウェブサイト順位付けを作る基礎の特性及び暗黙のフィードバック特性の間に対話がないと想定する。主題の工夫点の他の態様は、以下の詳細で説明されるように、暗黙のフィードバック特性を順位付けプロセスに直接統合することにより、このような想定を緩和する。さらに、より高度化されたユーザの振舞い及び順位付け組み合わせアルゴリズムが採用され、主題の工夫点の範囲内と同様であることは当然である。
図2は、主題の工夫点のさらなる態様を図示し、検索エンジン202は主題の工夫点の態様に従って、訓練モデル204をさらに備える。訓練モデル204は、観察された振舞い特性201及び導き出された振舞い特性203という名で、ユーザの振舞いを説明するための追加のモデルタイプをさらに備えることができる。観察された振舞い特性201は直接測定された値であり、導き出された振舞い特性203は、対応する直接観察された特性に対する全体(問い合わせ独立の)分布から予測された期待された値から導き出される。従って、問い合わせq及び結果rに対する特性fの観察された値は2つのコンポーネントの混合として表現できる:
o(q,r,f)=C(r,f)+rel(q,r,f)
ここでC(r,f)は、rに対応する全ての問い合わせに渡って統合されたfの値の前の「バックグランド」分布であり、rel(q,r,f)は結果の関連性により影響を受けた振舞いのコンポーネントである。例えばユーザの振舞いの関連性の予測は、所与の位置で観察されたクリックスルー周波からバックグランド分布(例えばノイズ)の減算を介して、クリックスルー特性で取得できる。振舞いにおける個々のユーザのバリエーションの影響を軽減するために、主題の工夫点はユーザにまたがる直接の特性値を平均化でき、各問い合わせURLペアのセションを検索する。このようなさらなるロバスト性を供給でき、個々の「うるさい」ユーザ対話によらない。したがって問い合わせURLペアに対するユーザの振舞いは、直接観察された特性及び導き出された「修正された」特性値の両方を含む特性ベクトルにより表現できる。
図3は、主題の工夫点の例示的な態様によって、動作可能なように接続された順位付けコンポーネント310をユーザ振舞いコンポーネント315及び検索エンジン340に組み込むシステム300のブロック図である。典型的には、検索エンジン340は、以下の詳細で説明されるように、コンテンツベースの特性(例えば問い合わせがテキスト若しくはタイトル又はドキュメントのアンカーテキストにどのくらい近く一致するか)、及び問い合わせ独立ページ量特性(例えばドキュメント又はドメインのページランク(PageRank))を含む多数の特性に基づいて、検索結果350を順位付けできる。さらに、検索エンジン340は、このような特性値を結合する特定の順位付け機能をチューニングするための自動的な(又は準自動的な)方法を採用できる。例えば、問い合わせ360を出すユーザが特定の動作を実行すると仮定する。このような動作は、関連性のあるドキュメントを見つけるまでなど、クリックすること、ナビゲートすること、改良した問い合わせを出すことを含むことができる。関連性のあるドキュメントを見つけた上で、ユーザは満足し、振舞いを変更する(たとえばドキュメントを読むこと)。主題の工夫点は、ユーザが取り出された結果に満足するときの検出を可能にする特性の十分なリッチセットを考え出すことを可能にする。このような特性は、出された問い合わせにより、したがって問い合わせ特有である。例えばユーザの特性/動作は、図4を参照して説明されるように、表示特性、ブラウジング特性及びクリックスルー特性に分類できる。
図4は、ユーザブラウジング動作を表示する特性400のテーブルである。表示特性410は、振舞いのいくつか又は全ての態様に影響するものとして(例えばユーザは表示特性に基づいて結果の上でクリックを決定することができる)、ユーザの経験を表示するよう、一般的に設計できる。ユーザの経験のこのような態様をモデル化するために、主題の工夫点は、問い合わせのタイトル及び語における語の重複(TitleOverlap)及び問い合わせ並びに結果概要により共有される語の断片などの特性を採用でき、完全なドキュメントを閲覧するために結果の概要上でクリックするかどうかの決定をするときにユーザによりしばしば考慮される。
同様に、ブラウジング特性420は、ユーザのウェブページ対話の対話をキャプチャ及び定量化できる。例えば主題の工夫点は、問い合わせに対する期待されたページの滞在時間から滞在時間の差を演算でき、ページブラウジング振舞いの内部問い合わせの多様性をモデル化することを可能にする。これは以下の詳細で説明されるように、直接の特性及び導き出された特性の両方をさらに含むことができる。同様にクリックスルー特性430は検索エンジン結果とのユーザ対話の例である。例えばクリックスルー特性は問い合わせ結果ペアに対するクリック数又は期待したクリックの可能性からの差を含むことができる。
図4に図示されるように、クリックスルーは、ウェブ検索エンジンとのユーザの対話の一態様を示す。主題の工夫点は、自動的に導き出された予測ユーザ振舞いモデルを採用できる。従って、所与の問い合わせに対して、各結果を図4のテーブルにおける特性で表現できる。関連性のあるユーザ選択をその後、詳細が上記に説明されたように、学習したユーザ振舞いモデルを使用して予測できる。このようなユーザ振舞いモデルの使用は、検索エンジンが、検索結果と対話する群の堅実さだけでなく、検索結果ページを越えるブラウジング特性を特徴付けるよりリッチな特性からも利益を得ることを可能にする。
図5は、主題の工夫点の態様によって、機械学習コンポーネント535を採用できる自動情報検索システム500を示す。一般的な暗黙のフィードバック解釈戦略は、ユーザ選択のモデルを自動的に学習することを採用できる(例えば発見的問題解決又は洞察力による代わりに)。システム500は、データログ520又は例えばユーザ振舞いコンポーネント515との対話から訓練できる。ログ520のデータは、ローカル又はリモートのデータソースから集めることができ、複数のユーザからの前の検索データ又は動作530に関する情報を含んでいる。訓練の後、順位付けコンポーネント510は、関連性のある結果550として示される未来の検索結果を容易又は高めるために、検索エンジン540と対話できる。例えば1又は複数の新しい検索問い合わせ560は、前の検索データ530からの訓練に一部基づく検索エンジン540及び/又はユーザ振舞いコンポーネント515からの情報により処理できる。一般にシステム500は、検索エンジンの関連性を改善するために様々なデータマイニング技術を採用できる。これは実行時間の分類子(classifiers)に対する高品質の訓練データを生成するために、順位付けコンポーネント510において関連性の分類子を採用することを含み、検索結果550を生成するために、検索エンジン540で採用できる。図6は、ユーザ動作を表す複数のシステム特性と対話するユーザ振舞いコンポーネント610を示す。一態様において、主題の工夫点は、「バックグランド」コンポーネント(例えば、ユーザの振舞いにおける問い合わせ独立ノイズ及び関連性独立ノイズなど)及び「関連性」コンポーネント(例えば、問い合わせへの結果の関連性を示す問い合わせに特有の振舞い)の組み合わせとして、ウェブ検索の振舞いを考慮する。このような編成は、統合されたユーザの振舞いの利益を得ることができ、特性セットは、直接観察された特性だけでなく、問い合わせ特有の導き出された特性に含まれ(各問い合わせに対する観察から直接演算される)、対応する直接観察された特性値に対する問い合わせ独立の分布からの差として演算される。図6に示されるように、クリックスルー特性612、ブラウジング特性614及び表示特性616などの例示的なシステム特性は、ユーザ振舞いコンポーネント610を通して、ウェブ検索結果とのユーザ体を表すために採用できる。さらに、所与の問い合わせ−所与の位置における結果上での期待されたクリック数からのURLペア、に対する観察されたクリックスルー数の差としての特性も考慮される。さらにブラウジング振舞いはモデル化でき、例えば結果がクリックされた後、その後に所与の問い合わせURLペアに対する平均的なページ滞在時間並びに期待された(平均)滞在時間からの差が、このようなモデルのために採用できる。さらに例えば、ウェブ検索のユーザは、結果タイトル、URL及び概要を見ることにより結果が関連性があるかどうかを決定することができ、−多くの場合において元のドキュメントを見ることは一般的に必要である。ユーザ経験のこの態様をモデル化するために、タイトルにおける語及びクエリにおける語を重複するなどの特徴も採用できる。
図7は主題の工夫点の態様によって、ユーザ選択を予測するためにユーザの振舞いを解釈する例示的な方法論700を示す。例示的な方法が様々なイベント及び/または動作の表現の一連のブロックとしてここで例示され説明されている一方で、主題の工夫点はこのようなブロックの例示された順に限定されない。例えば、このような動作又はイベントは、工夫点によるここで例示された順とは別個で、異なる順及び/又は他の動作又はイベントと共に起こり得る。さらに、全ては示されていないがブロック、イベント又は動作は、主題の工夫点による方法論を実装するのに必要とされる。さらに工夫点による例示的な方法及び他の方法が、ここで例示及び説明された方法と関連付けてだけでなく、例示又は説明されていない他のシステム及び装置と関連付けても実装できることは当然である。最初に710で、過去の検索ユーザ振舞いなどの検索エンジンとのユーザ対話に関連したデータが取得できる。続いて720でユーザの振舞いは統合でき、例えば統計の分析技術を採用することによってである。730で機械学習をその後、ユーザ選択モデルを訓練するために採用できる。続いて740でユーザ選択の予測を、未来の問い合わせの結果として供給できる。
図8は主題の工夫点の態様による順位付けの一部としてユーザの振舞いを実装する方法論800を示す。最初に810で、ユーザの振舞いに関連するデータを収集する。このようなユーザの振舞いはその後、820で振舞いモデルを訓練及び/又は自動的に生成するために採用できる。このようなモデル(例えば予測振舞いモデル)はその後、順位付け結果への検索エンジンの一部として組み込まれ、及び/又は830でユーザのフィードバックからの暗黙の関連性のある判断を生成することができる。続いて検索エンジンにより取り出された生成された及び/又は訓練された振舞いのモデル情報の一部に基づく830を、その後に順位付けることができる。
開示された主題の工夫点の様々な態様に対する状況を提供するために、図9及び図10
並びに以下の議論は、開示された主題の様々な態様が実装できる適切な環境の簡単で一般的な説明を提供することを意図する。主題がコンピュータ及び又は複数のコンピュータ上で実行するコンピュータプログラムのコンピュータ実行可能命令の一般的な状況において説明されてきた一方で、当業者は工夫点が他のプログラムモジュールと組み合わせて実行することもできることを理解されたい。一般にプログラムモジュールは、ルーチン、プログラム、コンポーネント、データ構造などを含み、特定のタスクを実行、及び/又は特定の抽象データ型を実装する。さらに、当業者にとって、工夫した方法が、シングルプロセッサ若しくはマルチプロセッサコンピュータシステム、ミニコンピューティングデバイス、メインフレームコンピュータ、並びにパーソナルコンピュータ、ハンドヘルド(携帯)コンピューティングデバイス(PDA(Personal digital assistant)、電話、時計…)、マイクロプロセッサベース又はプログラマブル家庭用電化製品若しくは工業電化製品などを含む他のコンピュータシステム構成で実行できることは当然である。例示された態様は、タスクが通信ネットワークを通してリンクされたリモート処理デバイスにより実行される、分散コンピューティング環境においても実施できる。しかし、工夫点の態様の全てではないかもしれないが一部は、スタンドアロンコンピュータで実施できる。分散コンピューティング環境において、プログラムモジュールを、ローカル及びリモートメモリストレージデバイスの両方に位置付けることができる。
図9を参照して、主題の工夫点の様々な態様を実装するためのコンピュータ912を含む例示的環境910が説明されている。コンピュータ912は、処理ユニット914、システムメモリ916及びシステムバス918を含む。システムバス918は、システムメモリ916を含むがこれに限定されないシステムコンポーネントを、処理ユニット914に結合する。処理ユニット914は様々な利用可能なプロセッサの任意であることができる。デュアルマイクロプロセッサ及び他のマルチプロセッサアーキテクチャが処理ユニット914として採用できる。
システムバス918は、11ビットバス、ISA(Industrial Standard Architecture)、MSA(Micro Channel Architecture)、EISA(Extended ISA)、IDE(Intelligent Drive Electronics)、VLB(VESA Local Bus)、PCI(Peripheral Component Interconnect)、USB(Universal Serial Bus)、AGP(Advanced Graphics Port)、PCMCIA(Personal Computer Memory Card International Association Bus)及びSCSI(Small Computer Systems Interface)を含むがこれらに限定されない様々な利用可能なバスアーキテクチャの任意を使用する、メモリバス若しくはメモリコントローラ、周辺バス又は外部バス及び/又はローカルバスを含む多くの種類のバス構造の任意であることができる。
システムメモリ916は、揮発性メモリ920、不揮発性メモリ922を含む。スタートアップの間などのコンピュータ912内の要素感で情報を伝えるための基本ルーチンを含むBIOS()は、不揮発性メモリ922に格納される。例示としてであり限定ではなく、不揮発性メモリ922は、ROM(read only memory)、PROM(programmable ROM)、EPROM(electrically programmable ROM)、EEPROM(electrically erasable ROM)又はフラッシュメモリを含むことができる。揮発性メモリ920は、RAMを含み、外部のエコーメモリとして動作する。例としてであり限定ではなく、RAMは、SRAM(synchronous RAM)、DRAM(dynamic RAM)、SDRAM(synchronous DRAM)、DDRSFRAM(double data rate SDRAM)、ESDRAM(enhanced SDRAM)、SLDRAM(Synchlink DRAM)及びDRRAM(direct Rambus RAM)などの多くの形式で利用可能である。
コンピュータ912もまた、リムーバブル/リムーバブルでない、揮発性/不揮発性のコンピュータストレージメディアを含む。図9は例えばディスクストレージ924を示すディスクストレージ924は、磁気ディスクドライブ、フロッピー(登録商標)ディスクドライブ、テープドライブ、Jazドライブ、Zipドライブ、LS−60ドライブ、フラッシュメモリカード又はメモリスティックなどのデバイスを含むがこれらに限定されない。さらにディスクストレージ924は、CD−ROM(compact disk ROM)、CD−Rドライブ(CD recordable drive)、CD−RWドライブ(CD rewritable drive)又はDVD−ROM(digital versatile disk ROM)などの光ディスクドライブを含むがこれらに限定されない他のストレージと分離して又は組み合わせて、ストレージメディアを含むことができる。ディスクストレージデバイス924のシステムバス918への接続を容易にするために、リムーバブル又はリムーバブルでないインターフェースは、インターフェース926などで一般に使用できる。
当然のことだが図9は、適切なオペレーティング環境910で説明されるユーザ及び基本のコンピュータリソースの間の中継として動作するソフトウェアを説明する。このようなソフトウェアはオペレーティングシステム928を含む。ディスクストレージ924上に格納できるオペレーティングシステム928は、コンピュータシステム912のリソースを制御及び割り当てるために動作する。システムアプリケーション930は、システムメモリ916又はディスクストレージ924のいずれかに格納されたプログラムモジュール932及びプログラムデータ934を通して、オペレーティングシステム928によりリソースの管理を活用する。当然のことながら、ここで説明される様々なコンポーネントは、様々なオペレーティングシステム又はオペレーティングシステムの組み合わせで実装できる。
ユーザは入力デバイス936を通してコンピュータ912にコマンド又は情報を入力する。入力デバイス936は、マウス、トラックボール、スタイラス(stylus)、タッチパッド、キーボード、マイクロウォン、ジョイスティック、ゲームパッド、衛星放送受信アンテナ(satellite dish)、スキャナ、TVチューナーカード、デジタルカメラ、デジタルビデオカメラ、ウェブカメラなどのポインティングデバイスを含むがこれらに限定されない。これら又は他の入力デバイスは、インターフェースポート938を介してシステムバス918を通して処理ユニット914に接続する。インターフェースポート938は、例えばシリアルポート、パラレルポート、ゲームポート、USB(universal serial bus)を含む。出力デバイス940は、入力デバイス936として同じタイプのポートのいくつかを使用する。従って例えば、USBポートはコンピュータ912への入力、及びコンピュータ912から出力デバイス949への情報の出力を提供するのに使用されるかもしれない。出力アダプタ942は、特別なアダプタを必要とする他の出力デバイス940の間で、モニタ、スピーカー及びプリンタのようないくつかの出力デバイス940があることを示すために提供される。出力アダプタ942は出力デバイス940及びシステムバス918の間の接続手段を提供するビデオカード及びサウンドカードを例示としてであり限定ではなく含む。他のデバイス及び/又はデバイスのシステムは、リモートコンピュータ944などの入力機能及び出力機能の両方を提供する。
コンピュータ912は、リモートコンピュータ944などの1又は複数のリモートコンピュータへの論理的接続を使用するネットワーク環境において動作できる。リモートコンピュータ944は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ワークステーション、電化製品ベースのマイクロプロセッサ、ピアデバイス又は他の一般ネットワークノードなどであることができ、一般にコンピュータ912に関連して説明される多く又は全ての要素を含む。簡潔さの目的のために、メモリストレージデバイス946はリモートコンピュータ944で図示される。リモートコンピュータ944は、ネットワークインターフェース948を通してコンピュータ912に論理的に接続され、その後通信接続950を介して物理的に接続される。ネットワークインターフェース948は、LAN(local-area networks)及びWAN(wide-area networks)などの通信ネットワークを包含する。LAN技術はFDDI(Fiber Distributed Data Interface)、CDDI(Copper Distributed Data Interface)、イーサネット(登録商標)/IEEE802.3、トークンリング/IEEE802.5などの通信ネットワークを含む。WAN技術はポイント・ツー・ポイントリンク、ISDN(Integrated Services Digital Networks)及びそのバリエーション、パケットスイッチングネットワーク、DSL(Digital Subscriber Lines)などのサーキットスイッチングネットワークを含むがこれらに限られない。
通信接続950は、ネットワークインターフェース948をバス918に接続するのに採用されるハードウェア/ソフトウェアのことを言う。通信接続950が内部コンピュータ912内に明確に図示するために示される一方で、コンピュータ912の外部であることもできる。ネットワークインターフェース948への接続のためのハードウェア/ソフトウェア要件は、例としての目的のためでだけであり、通常の電話回線用モデム、ケーブルモデム、DSLモデム、ISDNアダプタ及びイーサーネットカードを含むモデムなどの内部及び外部の技術を含む。
ここで使用されるように「コンポーネント」「システム」などの用語は、コンピュータ関連の実体物を指すことを意図し、ハードウェア、ハードウェア及びソフトウェアの組み合わせ、ソフトウェア、又は実行におけるソフトウェアのいずれかである。例えば、コンポーネントは、プロセッサ上で実行中のプロセス、プロセッサ、オブジェクト、実行ファイル、実行のスレッド、プログラム及び/又はコンピュータであることができるが、これらに限定されない。例として、コンピュータ上で実行中のアプリケーション及びコンピュータはコンポーネントであることができる。1又は複数のコンポーネントは、プロセス内及び/又は実行のスレッド内に存在することができ、コンポーネントを1コンピュータ上で及び/又は分散された2以上のコンピュータ上でローカライズすることができる。「例示的な」という語は、例えば又は例示としての提供を意味するためにここで使用される。「例示的な」としてここで説明される任意の態様又は設計は、他の態様又は設計上で好適又は利点として解釈される必要はない。
さらに、開示された主題はシステム、方法、装置、又はここで詳細化された態様を実装するために製造するための標準のプログラミング及び/又はエンジニアリング技術を使用する製造項目として実装できる。コンピュータプログラムという用語は、ここで使用されるように、任意のコンピュータ可読デバイス、キャリア又はメディアからアクセス可能なコンピュータプログラムを包含することを意図する。例えばコンピュータ可読媒体は、磁気ストレージディスク(例えばハードディスク、フロッピー(登録商標)ディスク、磁気ストライプ)、光ディスク(例えばCD(Compact Disk)、DVD(Digital Versatile disk)…)、スマートカード、フラッシュメモリデバイス(例えばカード、スティック)を含むことができるがこれらに限定はされない。さらに当然のことながら、搬送波を、電子メールを送受信するか又はインターネット若しくはLAN(Local Area Network)などのネットワークにアクセスするのに使用される、コンピュータ可読の電子データを搬送するために採用できる。当然、当業者は、特許請求された主題の範囲又は精神から逸脱することなくこの構成に多くの修正がなされうることを認識されたい。
図10は、主題の工夫点の態様によって、ユーザ振舞いコンポーネントを介してユーザの選択を予測するために採用できるサンプルのコンピューティング環境1000の概念ブロック図である。システム1000は、1又は複数のクライアント1010を含む。クライアント1010はハードウェア及び/又はソフトウェア(例えばスレッド、プロセス、コンピューティングデバイス)であることができる。システム1000は1又は複数のサーバ1030を含むこともできる。サーバ1030も又はハードウェア及び/又はソフトウェア(例えばスレッド、プロセス、コンピューティングデバイス)であることができる。サーバ1030例えばここで説明されるコンポーネントを採用することにより変換を実行するためのスレッドを収容することができる。クライアント1010及びサーバ1030の間の1つの可能性のある通信は、2以上のコンピュータプロセス間で送信されるように適用されたデータパケットの形式であるかもしれない。システム1000は、クライアント1010及びサーバ1030の間の通信を容易にするために採用できる通信フレームワーク1050を含む。クライアント1010は、クライアント1010にローカルに情報を格納するために採用できる1又は複数のクライアントデータストア1060に接続可能である。同様にサーバ1030はサーバ1030にローカルに情報を格納するのに採用できる1又は複数のサーバデータストア1040に接続可能である。
上述されてきた事柄は、様々な例示的な態様を含む。当然、これらの態様を説明する目的のために、すべてのあり得るコンポーネント又は方法論の組み合わせを説明することは不可能だが、当業者は、多くのさらなる組み合わせ及び置換が可能であることを理解されたい。したがって、ここで説明された態様は、添付の特許請求の範囲の精神及び範囲内にある全てのこのような代替、修正及び変形を包含することを意図する。
さらに、明細書又は特許請求の範囲のいずれかで「含む(include)」という用語が使用される限り、特許請求の範囲で暫定的な語として採用されるときに「備える」は解釈されるので、このような用語は「備える(comprising)」という用語と同様の方式で含まれることになることを意図する。
この主題の工夫点の例示的な態様によるユーザ振舞いコンポーネントのブロック図を示す。 この主題の工夫点の態様によって、ユーザ振舞いコンポーネントを組み込み、検索エンジンの訓練モデルと対話するシステムのブロック図を示す。 この主題の工夫点の例示的な態様によって、ユーザ振舞いコンポーネントに動作可能なように接続された順位付けコンポーネント及び検索エンジンを組み込むシステムのブロック図を示す。 この主題の工夫点の態様によって、ユーザのブラウジング動作を表す特性の表を示す。 この主題の工夫点の態様によって、機械学習コンポーネントを採用できる、自動化された情報検索システムを示す図である。 この主題の工夫点の特定の態様によって、ユーザ動作を表す、複数のシステム特性と対話するユーザ振舞いコンポーネントを示す図である。 この主題の工夫点の態様によって、ユーザ選択を予測するためのユーザの振舞いの解釈の例示的な方法論を示す図である。 この主題の工夫点の態様によって、値の順位付けの一部としてユーザの振舞いを実装する方法論を示す図である。 この主題の工夫点の様々な態様を実装するための例示的な環境を示す図である。 この主題の工夫点の様々な態様を実装するために採用できる追加のコンピューティング環境の概念ブロック図を示す。

Claims (20)

  1. 検索結果(350、550)のユーザの選択を予測するためにユーザの振舞い(101、103、105)の集合の自動的な解釈を容易にするユーザ振舞いコンポーネント(104、315、515、610)と、
    返された検索結果(350、550)の関連性及び順位の決定のための前記振舞いの集合を組み込む検索エンジン(102、202、340、540)と
    であるコンピュータ実行可能なコンポーネントを備えることを特徴とするコンピュータ実装のシステム。
  2. 前記ユーザの振舞いは、バックグランドコンポーネント及び関連性コンポーネントをさらに備えることを特徴とする請求項1に記載のコンピュータ実装のシステム。
  3. 機械学習コンポーネントをさらに備えることを特徴とする請求項1に記載のコンピュータ実装のシステム。
  4. 前記ユーザの振舞いコンポーネントは、ユーザの振舞いのデータドリブンモデルをさらに備えることを特徴とする請求項1に記載のコンピュータ実装のシステム。
  5. 前記検索エンジンは、直接観察された特性及び導き出された振舞いの特性を有するユーザ振舞いモデルをさらに備えることを特徴とする請求項4に記載のコンピュータ実装のシステム。
  6. 前の検索データを含むデータログをさらに備えることを特徴とする請求項4に記載のコンピュータ実装のシステム。
  7. 前記検索エンジンは、検索結果を順位付ける順位付けコンポーネントをさらに備えることを特徴とする請求項1に記載のコンピュータ実装のシステム。
  8. 前記振舞いモデルを訓練する機械学習コンポーネントをさらに備えることを特徴とする請求項5に記載のコンピュータ実装のシステム。
  9. 前記モデルは、クリックスルー特性、表示特性、ブラウジング(走査検索)特性をさらに備えることを特徴とする請求項5に記載のコンピュータ実装のシステム。
  10. 検索エンジン(102、202、340、540)との対話の間、ユーザの振舞いを取得するステップと、
    その分析についてのユーザの振舞いを統合するステップと、
    取り出した結果(350、550)に対するユーザの選択を予測するステップと
    であるコンピュータ実行可能な動作を備えたことを特徴とするコンピュータ実装の方法。
  11. ユーザの選択に基づいて取り出した情報を順位付けするステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  12. 前記情報の順位付けのためのモデルを訓練するステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  13. ユーザの振舞いから前記モデルを自動的に生成するステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  14. 取り出された情報とのユーザの対話に関する特性のセットを作り出すステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  15. ユーザの振舞いを組み込むために機械学習を採用するステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  16. ユーザの振舞いを予測するステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  17. 検索結果の順位付けのために、統合されたユーザの振舞いをマイニングするステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  18. ユーザの選択を予測するために、検索結果とのユーザの対話から、直接観察された特性を採用するステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  19. 統合しユーザの振舞いと関連付けられたノイズを軽減するステップをさらに備えたことを特徴とする請求項10に記載のコンピュータ実装の方法。
  20. ユーザからの暗黙のフィードバックを収集する手段(102、202、340、540)と、
    ユーザの選択を予測する手段(104、315、515、610)と
    であるコンピュータ実行可能なコンポーネントを備えることを特徴とするコンピュータ実装のシステム。
JP2008557273A 2006-03-02 2007-02-08 ウェブ検索の適合性を高めるためにウェブ検索のユーザの振舞いをマイニングすること Expired - Fee Related JP5247475B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US77865006P 2006-03-02 2006-03-02
US60/778,650 2006-03-02
US11/457,733 2006-07-14
US11/457,733 US20070208730A1 (en) 2006-03-02 2006-07-14 Mining web search user behavior to enhance web search relevance
PCT/US2007/003530 WO2007106269A1 (en) 2006-03-02 2007-02-08 Mining web search user behavior to enhance web search relevance

Publications (3)

Publication Number Publication Date
JP2009528619A true JP2009528619A (ja) 2009-08-06
JP2009528619A5 JP2009528619A5 (ja) 2013-03-14
JP5247475B2 JP5247475B2 (ja) 2013-07-24

Family

ID=38472589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008557273A Expired - Fee Related JP5247475B2 (ja) 2006-03-02 2007-02-08 ウェブ検索の適合性を高めるためにウェブ検索のユーザの振舞いをマイニングすること

Country Status (9)

Country Link
US (1) US20070208730A1 (ja)
EP (1) EP1997065A4 (ja)
JP (1) JP5247475B2 (ja)
KR (1) KR101366408B1 (ja)
BR (1) BRPI0708397A2 (ja)
CA (1) CA2644440A1 (ja)
MX (1) MX2008011223A (ja)
RU (1) RU2435212C2 (ja)
WO (1) WO2007106269A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102144370B1 (ko) * 2019-11-18 2020-08-13 주식회사 오투오 대화형 정보 검색장치
JP2022105507A (ja) * 2016-04-18 2022-07-14 グーグル エルエルシー 適切なエージェントの自動化アシスタント呼び出し

Families Citing this family (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461059B2 (en) 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7860886B2 (en) * 2006-09-29 2010-12-28 A9.Com, Inc. Strategy for providing query results based on analysis of user intent
US9747349B2 (en) * 2006-10-30 2017-08-29 Execue, Inc. System and method for distributing queries to a group of databases and expediting data access
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9305088B1 (en) * 2006-11-30 2016-04-05 Google Inc. Personalized search results
KR100898456B1 (ko) * 2007-01-12 2009-05-21 엔에이치엔(주) 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US8005643B2 (en) * 2007-06-26 2011-08-23 Endeca Technologies, Inc. System and method for measuring the quality of document sets
US8935249B2 (en) 2007-06-26 2015-01-13 Oracle Otc Subsidiary Llc Visualization of concepts within a collection of information
US8458165B2 (en) * 2007-06-28 2013-06-04 Oracle International Corporation System and method for applying ranking SVM in query relaxation
US7783630B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Tuning of relevancy ranking for federated search
US7783620B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Relevancy scoring using query structure and data structure for federated search
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US20090089311A1 (en) * 2007-09-28 2009-04-02 Yahoo! Inc. System and method for inclusion of history in a search results page
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US7984000B2 (en) 2007-10-31 2011-07-19 Microsoft Corporation Predicting and using search engine switching behavior
US9152699B2 (en) * 2007-11-02 2015-10-06 Ebay Inc. Search based on diversity
US20090119254A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Storing Accessible Histories of Search Results Reordered to Reflect User Interest in the Search Results
US20090119278A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Continual Reorganization of Ordered Search Results Based on Current User Interaction
US7797260B2 (en) * 2008-02-11 2010-09-14 Yahoo! Inc. Automated document classifier tuning including training set adaptive to user browsing behavior
US7836058B2 (en) 2008-03-27 2010-11-16 Microsoft Corporation Web searching
US8069179B2 (en) * 2008-04-24 2011-11-29 Microsoft Corporation Preference judgements for relevance
US20090299964A1 (en) * 2008-05-30 2009-12-03 Microsoft Corporation Presenting search queries related to navigational search queries
US8543592B2 (en) * 2008-05-30 2013-09-24 Microsoft Corporation Related URLs for task-oriented query results
US8639636B2 (en) * 2008-08-15 2014-01-28 At&T Intellectual Property I, L.P. System and method for user behavior modeling
US7979415B2 (en) * 2008-09-04 2011-07-12 Microsoft Corporation Predicting future queries from log data
US8037043B2 (en) 2008-09-09 2011-10-11 Microsoft Corporation Information retrieval system
US8515950B2 (en) * 2008-10-01 2013-08-20 Microsoft Corporation Combining log-based rankers and document-based rankers for searching
US8060456B2 (en) * 2008-10-01 2011-11-15 Microsoft Corporation Training a search result ranker with automatically-generated samples
US9449078B2 (en) * 2008-10-01 2016-09-20 Microsoft Technology Licensing, Llc Evaluating the ranking quality of a ranked list
US8122021B2 (en) * 2008-10-06 2012-02-21 Microsoft Corporation Domain expertise determination
US8126894B2 (en) * 2008-12-03 2012-02-28 Microsoft Corporation Click chain model
US8396865B1 (en) 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8341167B1 (en) 2009-01-30 2012-12-25 Intuit Inc. Context based interactive search
US8577875B2 (en) * 2009-03-20 2013-11-05 Microsoft Corporation Presenting search results ordered using user preferences
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US8073832B2 (en) 2009-05-04 2011-12-06 Microsoft Corporation Estimating rank on graph streams
US9495460B2 (en) * 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
US20100306224A1 (en) * 2009-06-02 2010-12-02 Yahoo! Inc. Online Measurement of User Satisfaction Using Long Duration Clicks
US20100332531A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Batched Transfer of Arbitrarily Distributed Data
US20100332550A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Platform For Configurable Logging Instrumentation
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8082247B2 (en) * 2009-07-30 2011-12-20 Microsoft Corporation Best-bet recommendations
US8135753B2 (en) * 2009-07-30 2012-03-13 Microsoft Corporation Dynamic information hierarchies
US20110029516A1 (en) * 2009-07-30 2011-02-03 Microsoft Corporation Web-Used Pattern Insight Platform
US8392380B2 (en) * 2009-07-30 2013-03-05 Microsoft Corporation Load-balancing and scaling for analytics data
US9020936B2 (en) * 2009-08-14 2015-04-28 Microsoft Technology Licensing, Llc Using categorical metadata to rank search results
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US9576251B2 (en) * 2009-11-13 2017-02-21 Hewlett Packard Enterprise Development Lp Method and system for processing web activity data
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US9009134B2 (en) * 2010-03-16 2015-04-14 Microsoft Technology Licensing, Llc Named entity recognition in query
US9665648B2 (en) * 2010-03-29 2017-05-30 Nokia Technologies Oy Method and apparatus for a user interest topology based on seeded user interest modeling
KR101098871B1 (ko) 2010-04-13 2011-12-26 건국대학교 산학협력단 랭크된 사용자의 피드백 정보에 기반한 컨텐츠 유사도 측정 장치, 방법 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
US20110258032A1 (en) * 2010-04-14 2011-10-20 Microsoft Corporation Search advertisement selection based on user actions
US10204163B2 (en) 2010-04-19 2019-02-12 Microsoft Technology Licensing, Llc Active prediction of diverse search intent based upon user browsing behavior
US8799280B2 (en) 2010-05-21 2014-08-05 Microsoft Corporation Personalized navigation using a search engine
US20110295897A1 (en) * 2010-06-01 2011-12-01 Microsoft Corporation Query correction probability based on query-correction pairs
US8612432B2 (en) 2010-06-16 2013-12-17 Microsoft Corporation Determining query intent
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8825649B2 (en) 2010-07-21 2014-09-02 Microsoft Corporation Smart defaults for data visualizations
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
WO2012034069A1 (en) * 2010-09-10 2012-03-15 Veveo, Inc. Method of and system for conducting personalized federated search and presentation of results therefrom
US8560484B2 (en) * 2010-12-17 2013-10-15 Intel Corporation User model creation
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US9449093B2 (en) * 2011-02-10 2016-09-20 Sri International System and method for improved search experience through implicit user interaction
US9053208B2 (en) 2011-03-02 2015-06-09 Microsoft Technology Licensing, Llc Fulfilling queries using specified and unspecified attributes
US9507861B2 (en) * 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US8732151B2 (en) 2011-04-01 2014-05-20 Microsoft Corporation Enhanced query rewriting through statistical machine translation
JP2013037624A (ja) * 2011-08-10 2013-02-21 Sony Computer Entertainment Inc 情報処理システム、情報処理方法、プログラム及び情報記憶媒体
CA2857517A1 (en) * 2011-12-15 2013-06-20 Yahoo! Inc. Systems and methods involving features of search and/or search integration
US9355095B2 (en) 2011-12-30 2016-05-31 Microsoft Technology Licensing, Llc Click noise characterization model
US20140143250A1 (en) * 2012-03-30 2014-05-22 Xen, Inc. Centralized Tracking of User Interest Information from Distributed Information Sources
US9460237B2 (en) 2012-05-08 2016-10-04 24/7 Customer, Inc. Predictive 411
CN103544150B (zh) * 2012-07-10 2016-03-09 腾讯科技(深圳)有限公司 为移动终端浏览器提供推荐信息的方法及系统
US8996513B2 (en) * 2012-07-24 2015-03-31 Microsoft Technology Licensing, Llc Providing an interface to access website actions
CN103631794B (zh) * 2012-08-22 2019-05-07 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
US10108720B2 (en) * 2012-11-28 2018-10-23 International Business Machines Corporation Automatically providing relevant search results based on user behavior
US9589149B2 (en) 2012-11-30 2017-03-07 Microsoft Technology Licensing, Llc Combining personalization and privacy locally on devices
KR102090269B1 (ko) 2012-12-14 2020-03-17 삼성전자주식회사 정보 검색 방법, 그와 같은 기능을 갖는 디바이스 및 기록 매체
US9824151B2 (en) * 2012-12-27 2017-11-21 Google Inc. Providing a portion of requested data based upon historical user interaction with the data
US20140188889A1 (en) * 2012-12-31 2014-07-03 Motorola Mobility Llc Predictive Selection and Parallel Execution of Applications and Services
US9594837B2 (en) 2013-02-26 2017-03-14 Microsoft Technology Licensing, Llc Prediction and information retrieval for intrinsically diverse sessions
RU2543315C2 (ru) 2013-03-22 2015-02-27 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты)
US10079737B2 (en) 2013-09-13 2018-09-18 Clicktale Ltd. Method and system for generating comparable visual maps for browsing activity analysis
CN104679771B (zh) * 2013-11-29 2018-09-18 阿里巴巴集团控股有限公司 一种个性化数据搜索方法和装置
RU2608886C2 (ru) * 2014-06-30 2017-01-25 Общество С Ограниченной Ответственностью "Яндекс" Ранжиратор результатов поиска
US10042936B1 (en) * 2014-07-11 2018-08-07 Google Llc Frequency-based content analysis
CN104268212A (zh) * 2014-09-23 2015-01-07 北京奇虎科技有限公司 一种互联网产品的发放方法和装置
CN104462377A (zh) * 2014-12-09 2015-03-25 小米科技有限责任公司 提供联系人信息的方法及装置
US10430473B2 (en) 2015-03-09 2019-10-01 Microsoft Technology Licensing, Llc Deep mining of network resource references
US9697286B2 (en) * 2015-03-16 2017-07-04 International Business Machines Corporation Shared URL content update to improve search engine optimization
CN105095357A (zh) * 2015-06-24 2015-11-25 百度在线网络技术(北京)有限公司 一种用于咨询数据处理的方法和装置
RU2637899C2 (ru) 2015-07-16 2017-12-07 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер определения изменений в пользовательском интерактивном взаимодействии со страницей результатов поиска
RU2632138C2 (ru) 2015-09-14 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и сервер ранжирования поисковых результатов на основе параметра полезности
RU2632133C2 (ru) * 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования
RU2632423C2 (ru) * 2015-09-30 2017-10-04 Общество С Ограниченной Ответственностью "Яндекс" Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств
US10055481B2 (en) * 2016-07-20 2018-08-21 LogsHero Ltd. Method and system for automatic event classification
US10803070B2 (en) * 2016-07-29 2020-10-13 International Business Machines Corporation Selecting a content summary based on relevancy
RU2621962C1 (ru) * 2016-08-16 2017-06-08 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
RU2630741C1 (ru) * 2016-12-20 2017-09-12 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
CN107133290B (zh) * 2017-04-19 2019-10-29 中国人民解放军国防科学技术大学 一种个性化信息检索方法与装置
US11842533B2 (en) * 2017-04-26 2023-12-12 Chia-Lin Simmons Predictive search techniques based on image analysis and group feedback
RU2663706C1 (ru) * 2017-07-20 2018-08-08 Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных оценки доверия контенту
RU2689812C2 (ru) * 2017-07-25 2019-05-29 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения ранжированных позиций ненативных элементов с помощью системы ранжирования
RU2757546C2 (ru) * 2017-07-25 2021-10-18 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания персонализированного пользовательского параметра интереса для идентификации персонализированного целевого элемента содержимого
RU2693324C2 (ru) 2017-11-24 2019-07-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер преобразования значения категориального фактора в его числовое представление
RU2692048C2 (ru) 2017-11-24 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для преобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориального фактора
EP3729248A4 (en) * 2017-12-21 2021-12-15 Commonwealth Scientific and Industrial Research Organisation CREATION OF A USER-SPECIFIC USER INTERFACE
JP6560843B1 (ja) * 2018-03-16 2019-08-14 楽天株式会社 検索システム、検索方法、及びプログラム
CN110971659A (zh) * 2019-10-11 2020-04-07 贝壳技术有限公司 推荐消息的推送方法、装置及存储介质
CN113127614A (zh) * 2020-01-16 2021-07-16 微软技术许可有限责任公司 基于隐式相关性反馈来提供qa训练数据以及训练qa模型

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
JP2005208943A (ja) * 2004-01-22 2005-08-04 Denso It Laboratory Inc サービス候補提供システム及びユーザ側通信装置並びにサービス候補提供サーバ

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6272507B1 (en) * 1997-04-09 2001-08-07 Xerox Corporation System for ranking search results from a collection of documents using spreading activation techniques
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6701362B1 (en) * 2000-02-23 2004-03-02 Purpleyogi.Com Inc. Method for creating user profiles
US6792434B2 (en) * 2001-04-20 2004-09-14 Mitsubishi Electric Research Laboratories, Inc. Content-based visualization and user-modeling for interactive browsing and retrieval in multimedia databases
US20030018621A1 (en) * 2001-06-29 2003-01-23 Donald Steiner Distributed information search in a networked environment
KR100438857B1 (ko) * 2001-09-26 2004-07-05 엘지전자 주식회사 사용자 선호도 기반 멀티미디어 검색 시스템
US8117072B2 (en) * 2001-11-13 2012-02-14 International Business Machines Corporation Promoting strategic documents by bias ranking of search results on a web browser
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
US7024404B1 (en) * 2002-05-28 2006-04-04 The State University Rutgers Retrieval and display of data objects using a cross-group ranking metric
CA2397424A1 (en) * 2002-08-09 2004-02-09 Mohammed Lamine Kherfi Content-based image retrieval using positive and negative examples
EP1586058A1 (en) * 2003-01-24 2005-10-19 BRITISH TELECOMMUNICATIONS public limited company Searching apparatus and methods
US20050120003A1 (en) * 2003-10-08 2005-06-02 Drury William J. Method for maintaining a record of searches and results
US7457823B2 (en) * 2004-05-02 2008-11-25 Markmonitor Inc. Methods and systems for analyzing data related to possible online fraud
US7257577B2 (en) * 2004-05-07 2007-08-14 International Business Machines Corporation System, method and service for ranking search results using a modular scoring system
WO2006023765A2 (en) * 2004-08-19 2006-03-02 Claria, Corporation Method and apparatus for responding to end-user request for information
WO2006036781A2 (en) * 2004-09-22 2006-04-06 Perfect Market Technologies, Inc. Search engine using user intent
WO2006042265A2 (en) * 2004-10-11 2006-04-20 Nextumi, Inc. System and method for facilitating network connectivity based on user characteristics

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
JP2005208943A (ja) * 2004-01-22 2005-08-04 Denso It Laboratory Inc サービス候補提供システム及びユーザ側通信装置並びにサービス候補提供サーバ

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022105507A (ja) * 2016-04-18 2022-07-14 グーグル エルエルシー 適切なエージェントの自動化アシスタント呼び出し
JP7362827B2 (ja) 2016-04-18 2023-10-17 グーグル エルエルシー 適切なエージェントの自動化アシスタント呼び出し
KR102144370B1 (ko) * 2019-11-18 2020-08-13 주식회사 오투오 대화형 정보 검색장치

Also Published As

Publication number Publication date
BRPI0708397A2 (pt) 2011-05-31
KR20080114708A (ko) 2008-12-31
US20070208730A1 (en) 2007-09-06
EP1997065A1 (en) 2008-12-03
RU2008135459A (ru) 2010-03-10
RU2435212C2 (ru) 2011-11-27
KR101366408B1 (ko) 2014-03-03
CA2644440A1 (en) 2007-09-20
JP5247475B2 (ja) 2013-07-24
EP1997065A4 (en) 2011-04-13
WO2007106269A1 (en) 2007-09-20
MX2008011223A (es) 2008-11-04

Similar Documents

Publication Publication Date Title
JP5247475B2 (ja) ウェブ検索の適合性を高めるためにウェブ検索のユーザの振舞いをマイニングすること
US10942905B2 (en) Systems and methods for cleansing automated robotic traffic
Sontag et al. Probabilistic models for personalizing web search
Middleton et al. Capturing knowledge of user preferences: ontologies in recommender systems
JP5114380B2 (ja) 検索結果の関連性の再ランク付けおよびその増強
CN1841380B (zh) 用于改进搜索引擎相关性的数据挖掘技术
EP2048605B1 (en) System and method for performing discovery of digital information in a subject area
Venetis et al. On the selection of tags for tag clouds
US7984035B2 (en) Context-based document search
US8375049B2 (en) Query revision using known highly-ranked queries
US8577875B2 (en) Presenting search results ordered using user preferences
US20060253428A1 (en) Performant relevance improvements in search query results
US20060287980A1 (en) Intelligent search results blending
US20080306934A1 (en) Using link structure for suggesting related queries
US20070214131A1 (en) Re-ranking search results based on query log
US20030105589A1 (en) Media agent
Trillo et al. Using semantic techniques to access web data
CN110413763B (zh) 搜索排序器的自动选择
Wang et al. Personalized search: An interactive and iterative approach
Raza et al. Computer Science Review
Broccolo Query log based techniques to improve the performance of a web search engine
Zhao et al. Improve Web Search Ranking by Co-Ranking SVM
Pemmasani et al. Challenges in Web search engines
Jo zed Inf t by E and I

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120813

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20121018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20121018

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20130125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130409

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees