JP5341253B2 - 線形および非線形のランキングモデルを用いるランク付けされた検索結果の生成 - Google Patents

線形および非線形のランキングモデルを用いるランク付けされた検索結果の生成 Download PDF

Info

Publication number
JP5341253B2
JP5341253B2 JP2012516058A JP2012516058A JP5341253B2 JP 5341253 B2 JP5341253 B2 JP 5341253B2 JP 2012516058 A JP2012516058 A JP 2012516058A JP 2012516058 A JP2012516058 A JP 2012516058A JP 5341253 B2 JP5341253 B2 JP 5341253B2
Authority
JP
Japan
Prior art keywords
information items
matching information
ranking
linear
ranking model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012516058A
Other languages
English (en)
Other versions
JP2012530963A5 (ja
JP2012530963A (ja
Inventor
グオ・ニン
シン・フェイ
シエ・ユヘン
ホウ・レイ
チャン・チン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2012530963A publication Critical patent/JP2012530963A/ja
Publication of JP2012530963A5 publication Critical patent/JP2012530963A5/ja
Application granted granted Critical
Publication of JP5341253B2 publication Critical patent/JP5341253B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

[他の出願の相互参照]
本出願は、全ての目的のために参照により本明細書に組み込まれる、発明の名称を“SEARCH RESULT GENERATING METHOD AND INFORMATION SEARCH SYSTEM(検索結果生成方法および情報検索システム)”とする、2009年6月19日に出願された中華人民共和国特許出願番号200910146331.5の優先権を主張する。
本出願は、コンピュータ・アプリケーションの分野に関し、特に、検索結果の生成に関する。
情報検索システムは、ユーザに情報検索サービスを提供することが可能なシステムである。インターネット上で広く利用されている検索エンジンを例にとると、インターネットの分野に適用される検索システムとしての検索エンジンは、ウェブにアクセスするユーザにとって不可欠な支援ツールとなっている。ユーザの視点からすると、検索エンジンは一般的に検索ボックスを含むウェブページを提供し、ユーザは、その検索ボックスにキーワードやその他の検索条件を入力する。キーワードはブラウザを介して検索エンジンに送信され、これに対して、検索エンジンは、ユーザにより入力されたキーワードの内容に適合する情報を返す。
ユーザの同一の検索要求(例えば、情報を検索しているユーザにより入力される検索キーワード)に応えて、検索エンジンは、一般的に、その要求に適合する情報アイテムを検索し、その数は数十から何万件にもなることがある。しかし、ユーザの視点からすると、通常、ユーザの注意は、検索結果の中で上位にランクされた情報に集中する。したがって、特に重要である検索情報をどのようにランク付けするのかということが、検索エンジンを利用するユーザの経験に直接影響を与える。
本発明の様々な実施形態は、以下の詳細な説明および添付の図面において開示される。
検索結果を生成するプロセスの一実施形態を示すフローチャートである。
検索結果を処理するプロセスの他の実施形態を示すフローチャートである。
前処理、第1のランキングプロセス、第2のランキングプロセスの関係および効果を示す図である。
前処理、第1のランキングプロセス、第2のランキングプロセスの関係および効果を示す図である。
前処理、第1のランキングプロセス、第2のランキングプロセスの関係および効果を示す図である。
ランク付けされた検索結果を生成するシステムの実施形態を示すブロック図である。
検索結果を生成するシステムの他の実施形態を示すブロック図である。
本発明は、数多くの方法で実施することが可能であり、それには、プロセス、装置、システム、組成物、コンピュータ読み取り可能な記憶媒体上で実現されるコンピュータプログラム・プロダクトとしての実施、および/または、プロセッサに結合されたメモリに記憶された命令および/またはそれにより提供される命令を実行するように構成されたプロセッサなど、プロセッサとしての実施が含まれる。本明細書では、このような実施の形態、あるいは本発明が取り得るその他の形態を、技術と呼ぶ場合がある。一般的に、開示されるプロセスのステップの順序は、発明の範囲内で変更することができる。特に明記しない限り、タスクを実行するように構成されたものとして記載されるプロセッサまたはメモリなどのコンポーネントは、所与の時間に一時的にそのタスクを実行するように構成された汎用コンポーネント、あるいはそのタスクを実行するように作製された専用コンポーネントとして実現することができる。本明細書において用いられる場合の「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成された1つまたは複数のデバイス、回路、および/または処理コアを指している。
本発明の1つまたは複数の実施形態についての詳細な説明が、以下で、発明の原理を示す添付図面と共に提供される。本発明は、それらの実施形態に関連させて説明されるが、本発明は、いずれの実施形態にも限定されるものではない。本発明の範囲は、請求項によってのみ限定されるものであり、本発明は、多くの代替案、変形、および均等物を包含している。発明についての完全な理解を与えるため、様々な具体的詳細が以下の説明において記載される。これらの詳細は、例示目的で提供されるものであり、本発明は、これら特定の詳細の一部または全部を省いて、請求項に基づき実施することができる。明確にする目的で、発明が不必要に不明瞭になることがないよう、本発明に関連する技術分野で知られている技術的事項については詳細に記載していない。
ランク付けされた検索結果の生成について説明する。一部の実施形態において、検索要求に適合するデータベース内の情報アイテム(例えば、ドキュメント、オブジェクトなど)は、それらの情報アイテムに関連付けられた特徴量を線形結合する線形モデルを用いてランク付けされ、これにより、ランク付けされた結果の第1のセットが得られる。ランク付けされた結果の第1のセットの少なくとも一部は、特徴量を非線形的に結合する非線形モデルを用いて再度ランク付けされ、これにより、ランク付けされた結果の第2のセットが得られる。ランク付けされた結果の第2のセットに基づく検索結果が、ユーザに提供され表示される。一部の実施形態では、オプションとして、情報アイテムは、線形モデルが適用される前に前処理される。
図1は、検索結果を生成するプロセスの一実施形態を示すフローチャートである。プロセス100は、図4の400のようなシステム上で実行することができる。
ステップ101において、検索要求に適合(マッチ)する情報アイテムが検索される(引き出される)。情報アイテムは、データベース内のドキュメント、オブジェクト、あるいは他の適当なアイテムとすることができる。例えば、インターネットベースの検索エンジン環境では、情報アイテムは、ウェブページに相当するものとすることができる。
ユーザは、一般的に、情報を検索するために1つまたは複数の検索条件を入力する。よく使用される検索条件は、検索キーワードである。検索エンジンによっては、さらに、情報が公開された日時、情報の属性など、個々の検索適用要件に応じて、他のタイプの検索条件をサポートすることができる。一部の実施形態では、種々の検索条件が総称して検索要求と呼ばれる。検索エンジンは、検索要求を受け取ると、検索要求に適合する適合情報を検索する。様々に異なる検索適用要件に応じて、様々に異なる種類の情報を検索することができる。例えば、ウェブページ検索で検索される情報はウェブページに関するものであり、エレクトロニック・コマース検索で検索される情報は販売用製品に関するものであり、ドキュメント検索で検索される情報は定期発行物や文書などに関するものである。この例では、適合情報の多様なアイテムが検索される。
ステップ102において、線形ランキングモデルを用いて、適合情報アイテムの少なくとも一部のアイテムをランク付けして、ランク付けされた結果の第1のセットを得る。
この例では、線形ランキングモデルは、適合情報アイテムのスコア付けのために用いられ、これにより、情報アイテムはランク・スコアの降順にソートされる。
線形ランキングモデルは、適合情報の特徴に関連付けられた値(xi)を、重み係数(ai)を用いて線形的に結合するモデルである。線形モデルは、定数あるいは一次項を含んでいる。一部の実施形態において、線形ランキングモデルは数学的に次のように表現される。
y=f(x1,x2, ...,xn)=a11+a22+ ...+ann (1)
上記の例のモデルでは、従属変数yはそれぞれの独立変数と直線関係にあり、モデルの入力パラメータx1,x2, ...,xnは、適合情報の特徴量と呼ばれるもので、ランク付けの際に考慮にすべきファクタを表しており、一方、a1,a2, ...,anは、それぞれの特徴の重み係数を表している。このように、aiは、xiに対応する特徴の、ランク付けにおける重要性を示している。モデルの出力yは、適合情報のランク・スコアを表している。
個々の検索適用要件を考慮して、システムは、適合情報の1つまたは複数の特徴に基づいて、適合情報アイテムのそれぞれのスコア付けを行うことができる。それらの特徴は、以下に例示する、様々に異なる側面に関するものとすることができる。
1)適合情報の中に検索キーワードが出現する回数。一般的に、適合情報アイテムの中に検索キーワードが出現する回数が多いほど、その適合情報アイテムは高いスコアとされる。
2)適合情報の中での検索キーワードの位置。一般的に、検索キーワードが、例えば、タイトル、摘要など、適合情報アイテムの重要なセクションに出現する場合、その適合情報アイテムは、相対的に高いスコアとされる。
3)適合情報に対するユーザフィードバックの数。ユーザフィードバックの数によって、情報アイテムに対するユーザの注目度を示すことができる。一部の実施形態において、検索エンジンは、ユーザフィードバック・ログを読み取ることにより、適合情報アイテムのそれぞれに対応するユーザフィードバックの数を取得し、そして、そのユーザフィードバックの数に基づき、適合情報アイテムのそれぞれにスコア付けを行う。根本となる前提は、より多く注目されている情報アイテムほど高いスコアとされるということである。
4)適合情報のソース。ウェブページ検索において、例えば、適合情報が、大手のポータル・ウェブサイトや公式ウェブサイトを情報源とするものである場合は、相対的に高いスコアとされる。
適合情報の一般的な特徴をほんの少数、上記で列挙したが、適合情報の他の多くの特徴を、代替的または追加的にスコア付けに用いることができる。
一部の実施形態では、ランキングモデルで用いられる特徴の種類および数は、そのモデルと共に決定される。適合情報をランク付けするため、システムは、最初に、それぞれの適合情報アイテムの各特徴量を取得し、つぎに、ランキングモデルに基づいて、それぞれの適合情報アイテムにスコア付けし、そして最後に、ランク・スコアに従って、それぞれの適合情報アイテムをランク付けする。
例えば、線形ランキングモデルで3つの特徴が用いられる実施形態では、ランキングモデルは、y=f(x1,x2,x3)と表される。10件の適合情報アイテムが返されるものとしてある場合、10件の適合情報アイテムに対応する10セットの入力(x1,x2,x3)が取得され、yの10個の値がそれぞれ計算されて、それらの値がランク付けされる。
ステップ103において、ランク付けされた結果の第1のセットの少なくとも一部を、非線形ランキングモデルを用いてさらにランク付けして、ランク付けされた結果の第2のセットを得る。非線形ランキングモデルは、適合情報の特徴に非線形関数を適用してランキング出力を得るモデルである。非線形ランキングモデルに採用される関数は、定数または一次項以外の項を含んでいる。
ユーザの実際的な要求により良く応えるために、適合情報が、非線形的にランク付けされる。様々な検索システムにおいて、適合情報の特徴のそれぞれは、それらから結果として得られるランク・スコアと客観的な対応関係がある。この関係は必ずしも直線関係ではないので、一部の実施形態では、この対応関係を表現して、ユーザの実際の要求により良く応える情報を識別するために、非線形ランキングモデルが構築される。多くの異なる非線形関数により非線形ランキングモデルを表現することが可能であり、それらを経験的に決定することができる。非線形モデルを決定する1つの方法は、学習を実行することであり、これには、多くの検索要求をシステムに入力すること、マシンが生成するランク付けされた結果と実際の要求に対する結果のユーザによるランキングとを収集すること、および、データに基づいて曲線の当てはめを実行することにより非線形ランキングモデルを生成すること、が含まれる。例えば、一部の実施形態において用いられる非線形ランキングモデルは、以下の形のものである。
Figure 0005341253
一部の実施形態では、線形関数に比較して非線形関数の計算複雑性が高いことによって、非線形ランキングモデルを用いたランク付けの処理速度が、同じ条件(すなわち、同じ特徴量、処理される適合情報の数が同じ、など)で線形ランキングモデルを用いた場合よりも遅くなることがある。より高いランク付け速度を達成すると同時に検索の実効性を確保するため、一部の実施形態では、線形ランキングモデルを用いて適合情報をランク付けすることにより、ランク付けされた結果の第1のセットを得た後に、このランク付けされた結果の第1のセットの選択的な一部が、非線形ランキングモデルを用いて処理される。
例えば、最初の線形ランキングモデルを用いて処理される適合情報アイテムの数がN1であると仮定する。第1のランク付けの後に、一般的に、上位にランクされた適合情報は、ユーザが上位ランクの結果であると認めたものと一致していることがあるが、それでもなお、線形ランキングモデルという制約によって、モデルにより生成されたランキング順位とユーザによる実際のランキング順位とは、いくらか食い違う場合がある。このため、ランク付けされた結果の第1のセットは、非線形ランキングモデルを用いてさらにランク付けされる。一部の実施形態において、第1のランク付けによる結果のうち件数N2の上位ランクの適合情報アイテムが、非線形ランキングモデルを用いてランク付けされ、これにより、ランク付けされた結果の第2のセットが得られる。
具体的には、N2は、個々の検索要求に応じて決定される値をとるものとすることができる。ユーザは、一般的に、検索結果の最初の数ページにのみ注目するので、N2は、ページあたりに表示可能な適合情報アイテムの数に応じて、N1に比較して小さい値とすることができる。例えば、N1が1000を超えるときには、N2は200〜400に設定することができる。あるいは、これに代えて、例えばN2対N1の比率を1:10、1:20とするなど、相対比率を用いてN2を決定することができる。その他の適当な選択基準を、他の実施形態において適用することができる。
ステップ104において、ランク付けされた結果の第2のセットに少なくとも部分的に基づいて、検索応答が生成される。ここでは、検索エンジンは、ランク付けされた結果の第2のセットの一部を選択することにより検索応答を生成する。検索応答は出力されて、ユーザに提示される。
本実施形態では、最初に、件数N1の適合情報アイテムが、線形ランキングモデルを用いてランク付けされ、次に、ランク付けされた結果のうち件数N2の上位のものが、非線形ランキングモデルを用いてさらにランク付けされる。線形ランキングモデルの処理速度は確保できるので、最初に線形ランキングモデルを用いて多数(N1)の適合情報アイテムを前処理することができ、そしてN2<N1と設定することで、非線形ランキングモデルを用いて処理されるデータ量を削減することができ、これにより、適合情報のランク付けの処理速度が全体として向上される。
従来のランキング方法の中には、手動で設計されるランキングモデルを採用しているものがあり、このため、特徴のほんの簡単な組み合わせのみの処理に制限される。ランキング学習法は、従来のランキング法よりも多くの特徴が考慮される自動化された方法である。この方法は、データサンプルを用いてランキングモデルを学習させ、これにより、ユーザの実際的な要求をモデルに覚えさせることで、ランク付けされた結果がユーザの実際の要求により良く応えることができるようにする。非線形ランキングモデルは、ユーザにより実際にランク付けされた結果とほぼ一致するランク付けの結果が得られるように学習させることが可能である。
一部の実施形態では、学習させた結果得られる線形および非線形のランキングモデルを、それぞれ第1と第2のランク付けで用いることができる。そのようなモデルは、より多くの特徴を取り込むことによって複雑な計算を伴う傾向があるため、第1のランク付けの前に、オプションとして、処理速度を確保するための前処理ステップが追加される。図2は、検索結果を生成するプロセスの他の実施形態を示すフローチャートである。
ステップ201において、検索要求を受け取り、その検索要求に適合情報アイテムを検索する。
ステップ202では、それらの適合情報アイテムが前処理される。一部の実施形態において、この前処理は、適合情報アイテムの期限切れのもの、および無効なものを除外するフィルタリング処理を含んでいる。一部の実施形態において、前処理は、TF‐IDF(Term Frequency−Inverse document Frequency:語頻度‐逆文書頻度)法、BM25など、何らかのソート技法を用いたソート処理を含んでおり、これらは手動で設計される非常に少ない数の特徴を取り込むランキングモデルを採用するものであるため、高速であるが、ユーザの期待を厳密に追跡するランキングを生成するものではない。
ステップ203では、前処理された適合情報の少なくとも一部が、線形ランキングモデルを用いてランク付けされ、これにより、ランク付けされた結果の第1のセットが得られる。
ステップ204では、ランク付けされた結果の第1のセットが、非線形ランキングモデルを用いてさらにランク付けされ、これにより、ランク付けされた結果の第2のセットが得られる。
ステップ205では、第2のランク付けの結果に少なくとも部分的に基づいて、検索応答が提供される。
一見して明らかなように、ステップ202がステップ203に及ぼす効果は、ステップ203が204に及ぼす効果に類似している。前処理の動作は、線形ランキング処理よりもはるかに高速であるが、それほど高い品質のランキングは生成されない。総件数N0の適合情報アイテムがステップ201で検索され、ステップ202において、前処理を実行する目的で、件数N0の情報の中からN1件の適合情報アイテムが選択されて、線形ランキングモデルを用いて処理されると仮定する。N1はN0よりも小さく、このため、第1のランク付けの処理速度を大幅に向上させることができる。
図3A‐3Cは、前処理、第1のランキングプロセス、第2のランキングプロセスの関係および効果を示す図である。適合情報アイテムは、ユーザによる実際のランキングに基づいて、真に関連性のある適合情報または一般的な適合情報に分類することが可能であると、最初に仮定する。ランク付けは、真に関連性のある適合情報をできる限り上位にランク付けすることを目的としている。図示の例では、黒丸が、真に関連性のある適合情報アイテムを表し、白丸が、一般的な適合情報アイテムを表している。
N0=100と仮定して、総数で5件の真に関連性のある適合情報アイテムが、100件の適合情報アイテム(そのすべてが図示されているわけではない)の中に分散されており、図3Aに示すように、前処理後に、5件すべての真に関連性のある適合情報アイテムがトップ10アイテムに入るようにランク付けされる。
N1=10と仮定して、ランク付けされた結果の第1のセットを図3Bに示している。図示のように、線形ランキングモデルを適用した後に、5件の真に関連性のある適合情報アイテムのうちいくつかが、図3Aのときよりも上位のランクになっている。
N2=6と仮定して、ランク付けされた結果の第2のセットを図3Cに示している。図示のように、非線形ランキングモデルを適用した後に、5件の真に関連性のある適合情報アイテムが、最上位ランクのアイテムとなっている。
上記の例は単なる例示にすぎず、様々な実施形態で、異なる値のN0、N1、およびN2を適用することができる。
一実施形態において、N1は3000に設定される。すなわち、ランク付け前処理された結果の中で上位3000件の適合情報アイテムが、まず以下の線形ランキングモデルを用いてランク付けされる。
1=0.15x1+0.1732x2+0.873x3+0.245x4+0.042x5
ここで、x1からx5は、第1のランク付けにおいて考慮される、適合情報の特徴量を表している。
1は、適合情報のテキストの中に検索キーワードが出現する回数を正規化した値に相当する。モデルから明らかであるように、この値が大きいほど、結果として得られるランク・スコアが高くなる。
2は、適合情報のタイトルの中に検索キーワードが出現する回数を正規化した値に相当する。モデルから分かるように、この値が大きいほど、結果として得られるランク・スコアが高くなる。
3は、適合情報のタイトルの中での検索キーワード間の距離に相当する。ユーザは、情報の検索のために、複数のキーワードを採用することがある。この場合、タイトルの中でのキーワード間の距離が短いほど、ユーザの要求により良く応えるものであるとみなすことができる。x3の値は、つぎのように計算することができる。
1−(キーワード間の距離)/(タイトル内の単語総数)
具体的には、検索キーワード間の距離は、「単語」によって計算される。フレーズやセンテンスは、いずれも、特定の単語分割規則によって、いくつかの「単語」 に分割することができる。例えば、適合ドキュメントのタイトルが“Method for selecting computer CPU and monitor”である場合、これを、単語分割規則により、総数7の単語、すなわち、Method/for/selecting/computer/CPU/and/monitorに分割することができる。ユーザの検索キーワードが、「computer」と「monitor」である場合、これら2つのキーワードは、上記タイトルの中で2つの単語すなわち2の距離で隔てられており、対応するx3の値は、1−(2/7)=5/7となる。
検索キーワードがタイトルに完全に一致する場合、その距離は0であり、x3は1の値をとる。タイトルの中に検索キーワードが全く出現しない場合、x3は0の値をとる。
4は、検索キーワードと、適合情報のタイトルとの間の編集距離に相当する。検索キーワードと、適合情報のタイトルとの類似度も、やはり、適合情報をスコア付けするファクタとみなすことができる。類似度は、「編集距離」として測定することができ、これもやはり、「単語」によって計算される。例えば、ユーザの検索キーワードが「monitor」である場合、これと、タイトル「Method for selecting computer CPU and monitor」との編集距離は6であり、対応するx4の値は、l−(6/7)=l/7である。従って、検索キーワードがタイトルと完全に一致する場合、編集距離は0であり、x4は1の値をとる。検索キーワードがタイトルの中に出現しない場合、編集距離は無限大であり、x4は0の値をとる。
5は、適合情報のテキストの中での検索キーワードのIDF(逆文書頻度)の正規化された値に相当する。
この例では、x1 ...x5は、モデルを用いた計算を容易にするため、([0,1]の区間にあるように)正規化された値である。正規化の方法は、本願の実施形態において制限されない。
ランク付けされた結果の第1のセットは、非線形ランキングモデルを用いてさらにランク付けされ、これにより、ランク付けされた結果の第2のセットが得られる。
一実施形態では、N2は600であると仮定される。すなわち、以下の非線形ランキングモデルを用いて、上位600件の適合情報アイテムで第2のランク付けが行われる。
Figure 0005341253
この例では、非線形ランキングモデルにおいて、x1 ...x5は、適合情報の、線形ランキングモデルで考慮されるものと同じ特徴に対応している。しかしながら、それらは、出力yとの間に非線形関係をなしている。
この例では、用いている線形および非線形のランキングモデルの両方ともが、学習の結果得られるモデルである。本実施形態は、ウェブページ検索、エレクトロニック・コマース検索などへの適用に対応して提案されたものである。上述の技術は、例えば、書籍データベース検索、ドキュメント・データベース検索など、他のタイプの検索にも適用可能である。また、適用の範囲はインターネットの分野に限定されることなく、この技術は、スタンドアロン・コンピュータにおけるローカルエリア・ネットワーク介した検索などに適用することができる。
図4は、ランク付けされた検索結果を生成するシステムの実施形態を示すブロック図である。この例において、システム400は、汎用サーバ、専用デバイス、あるいは、1つまたは複数のプロセッサおよびこのプロセッサに結合されてプロセッサに命令を供給するように構成されたメモリを備える他のハードウェア/ソフトウェア/ファームウェアの組み合わせなど、1つまたは複数のコンピュータ機器を用いて実現することができる。
システムは、ユーザから検索要求を受け取って、その検索要求に適合それぞれの情報アイテムを取り出すように構成された情報検索ユニット410を備える。さらに、情報検索ユニット410により取り出された適合情報アイテムのうちN1件の適合情報アイテムを、線形ランキングモデルを用いてランク付けし、これにより、第1のランク付けによる結果を得るように構成された線形ランキング・ユニット420を備えている。この場合、N1≦取り出された適合情報アイテムの総数、となる。さらに、線形ランキング・ユニット420により得られたランク付けされた結果の第1のセットの中で、上位のN2件の適合情報を、非線形ランキングモデルを用いてランク付けし、これにより、ランク付けされた結果の第2のセットを得るように構成された非線形ランキング・ユニット430を備える。この場合、N2<N1である。線形ランキングモデルの処理速度は確保することができるので、最初に、線形ランキングモデルを用いて、多数(N1)の適合情報アイテムを前処理することができ、そしてN2<N1と設定することで、非線形ランキングモデルを用いて処理されるデータ量を効果的に削減することができ、これにより、適合情報のランク付けの処理速度が全体として向上する。このシステムは、さらに、ランク付けされた結果の第2のセットから検索結果を生成するように構成された結果生成ユニット440を備える。
図5は、検索結果を生成するシステムの他の実施形態である。システム500は、400と類似しているが、適合情報アイテムのそれぞれを前処理するように構成された前処理ユニット411を追加して備えており、これにより、それらの適合情報アイテムのうちN0件の適合情報アイテムが、線形ランキング・ユニット420によりランク付けされる対象になるものとして選択される。前処理ユニット411は、線形ランキング・ユニット420により処理されるデータ量を削減するために用いることができ、これにより、最終的な検索結果にマイナスの影響を及ぼすことなく、システム全体の検索処理速度をさらに向上させる。
上記のユニットは、1つまたは複数の汎用プロセッサ上で実行されるソフトウェア・コンポーネントとして、プログラマブル・ロジック・デバイスおよび/または特定の機能を実行するように設計された特定用途向け集積回路などのハードウェアとして、あるいはそれらの組み合わせにより、実現することができる。一部の実施形態では、ユニットは、ソフトウェア・プロダクトの形態で実現することができ、これらは不揮発性記憶媒体(光ディスク、フラッシュ記憶装置、モバイル・ハードディスクなど)に記憶することが可能であって、本発明の実施形態に記載した方法をコンピュータ機器(パーソナルコンピュータ、サーバ、ネットワーク装置など)に実行させるための多くの命令を含むものである。ユニットは、単一の機器で、あるいは複数の機器に分散させて、実現することができる。ユニットの機能は相互に併合させることができ、あるいは複数のサブユニットにさらに分割することができる。
上記の情報検索システムは、インターネット上での検索のための検索エンジンに適用することができ、さらに、スタンドアロン・コンピュータでのローカルエリア・ネットワークを介した検索のための情報検索システムなどにも適用することができる。
上記のデバイスは、説明の都合上、別々に示すそれぞれのユニットに機能的に分割されたものとして記載している。当然のことながら、それぞれのユニットの機能を、同じ1つまたは複数のソフトウェア・アイテムおよび/またはハードウェア・アイテムで実行することにより本発明を実施することができる。
実施形態の上記説明から分かるように、本出願は、ソフトウェアと基本の汎用ハードウェア・プラットフォームにより実現可能であることを、当業者であれば明確に理解することができる。そのような理解に基づき、従来技術に効果をもたらす本出願の技術的解決法またはその一部は、基本的にソフトウェア・プロダクトの形態で実現することができ、それは、例えばROM/RAM、磁気ディスク、光ディスクなどの記憶媒体に記憶することが可能なものであって、本出願のそれぞれの実施形態または実施形態の一部による方法をコンピュータ機器(パーソナルコンピュータ、サーバ、ネットワーク装置など、とすることができる)に実行させるための多くの命令を含むものである。
本明細書では、それぞれの実施形態を段階的に説明しており、それらの共通または類似の部分は相互参照が可能であり、各実施形態では、他の実施形態との違いに重点を置いている。特にシステムの実施形態は、方法の実施形態と実質的に類似しており、このため簡単に説明しているが、その詳細については、方法の実施形態の説明におけるそのような部分を参照することができる。システムの上記実施形態は単なる例示にすぎず、別々のコンポーネントとして記載しているユニットは物理的に分離したものであっても分離されていないものであってもよく、また、ユニットとして示しているコンポーネントは、物理的ユニットであってもそうでなくてもよく、つまり、同一場所に配置されたものであっても、複数のネットワーク・ユニットに分散されたものであってもよい。実際の実施においては、実施形態の中のモジュールの一部またはすべてを、該実施形態の解決法の目的を達成するように必要に応じて選択することができる。
本出願は、例えば、パーソナルコンピュータ、サーバ・コンピュータ、ハンドヘルドまたはポータブル・デバイス、フラットパネル・デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セットトップボックス、プログラム可能な家庭用電子機器、ネットワークPC、小型コンピュータ、大型コンピュータ、上記システムまたはデバイスのいずれかを含む分散コンピューティング環境など、多くの汎用あるいは専用のコンピュータシステム環境または構成に適用することができる。
本出願は、例えばプログラム・モジュールなどコンピュータにより実行されるコンピュータ実行可能命令という一般的状況の中で説明することができる。一般的に、プログラム・モジュールには、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれ、これは、特定のタスクを実行するものであるか、または特定の抽象データ型を具体化するものである。あるいは、本出願は、分散コンピューティング環境で実現することができ、この場合、タスクは、通信ネットワークを介して接続された遠隔処理装置により実行され、また、プログラム・モジュールは、記憶装置を含むローカルまたは遠隔の電子記憶媒体に配置することができる。
上記の実施形態は、明確な理解を目的として、ある程度詳細に記載したが、本発明は、提示した詳細に限定されるものではない。本発明を実施する多くの代替の方法がある。開示された実施形態は、例示であって、限定するものではない。
適用例1:ランク付けされた検索結果を生成する方法であって、検索要求に適合する複数の適合情報アイテムを受け取ることと、ランク付けされた結果の第1のセットを得るため、第1の複数の特徴量を線形結合する線形ランキングモデルを用いて、前記複数の適合情報アイテムのうち少なくとも一部のアイテムをランク付けすることと、ランク付けされた結果の第2のセットを得るため、第2の複数の特徴量を非線形的に結合する非線形ランキングモデルを用いて、前記ランク付けされた結果の第1のセットの少なくとも一部をランク付けすることと、前記ランク付けされた結果の第2のセットに基づいて、検索応答を提供することと、を含む方法。
適用例2:前記ランク付けされた結果の第1のセットは、前記ランク付けされた結果の第2のセットよりも多数の適合情報アイテムを含んでいる、適用例1に記載の方法。
適用例3:前記複数の適合情報アイテムは、第2の複数の適合情報アイテムであり、前記方法は、前記検索要求を受け取ることと、第1の複数の適合情報アイテムを生成することと、前記第1の複数の適合情報アイテムを前処理することと、前記第1の複数の適合情報アイテムから、前記第2の複数の適合情報アイテムを選択することと、をさらに含む、適用例1に記載の方法。
適用例4:前記第1の複数の適合情報アイテムは、前記第2の複数の適合情報アイテムよりも多数の適合情報アイテムを含んでいる、適用例3に記載の方法。
適用例5:前記線形ランキングモデルは第1のランキング・スコアを出力し、前記非線形ランキングモデルは第2のランキング・スコアを出力する、適用例1に記載の方法。
適用例6:前記線形ランキングモデルにより用いられる前記第1の複数の特徴量の少なくとも一部は、前記非線形ランキングモデルにより用いられる前記第2の複数の特徴量の少なくとも一部と同じものである、適用例1に記載の方法。
適用例7:前記第1の複数の特徴量は、前記適合情報、前記検索要求、またはその両方によって決定される、適用例1に記載の方法。
適用例8:前記非線形ランキングモデルは、学習により決定される、適用例1に記載の方法。
適用例9:ランク付けされた検索結果を生成するためのシステムであって、1つまたは複数のプロセッサであって、検索要求に適合する複数の適合情報アイテムを受け取り、ランク付けされた結果の第1のセットを得るため、第1の複数の特徴量を線形結合する線形ランキングモデルを用いて、前記複数の適合情報アイテムのうち少なくとも一部のアイテムをランク付けし、ランク付けされた結果の第2のセットを得るため、第2の複数の特徴量を非線形的に結合する非線形ランキングモデルを用いて、前記ランク付けされた結果の第1のセットの少なくとも一部をランク付けし、前記ランク付けされた結果の第2のセットに少なくとも部分的に基づいて検索応答を提供する、ように構成された1つまたは複数のプロセッサと、前記1つまたは複数のプロセッサに結合され、プロセッサに命令を供給するように構成された1つまたは複数のメモリと、を備える、システム。
適用例10:前記ランク付けされた結果の第1のセットは、前記ランク付けされた結果の第2のセットよりも多数の適合情報アイテムを含んでいる、適用例9に記載のシステム。
適用例11:前記複数の適合情報アイテムは、第2の複数の適合情報アイテムであり、前記1つまたは複数のプロセッサは、さらに、前記検索要求を受け取り、第1の複数の適合情報アイテムを生成し、前記第1の複数の適合情報アイテムを前処理し、前記第1の複数の適合情報アイテムから、前記第2の複数の適合情報アイテムを選択する、ように構成されている、適用例9に記載のシステム。
適用例12:前記第1の複数の適合情報アイテムは、前記第2の複数の適合情報アイテムよりも多数の適合情報アイテムを含んでいる、適用例11に記載のシステム。
適用例13:前記線形ランキングモデルは第1のランキング・スコアを出力し、前記非線形ランキングモデルは第2のランキング・スコアを出力する、適用例9に記載のシステム。
適用例14:前記線形ランキングモデルにより用いられる前記第1の複数の特徴量の少なくとも一部は、前記非線形ランキングモデルにより用いられる前記第2の複数の特徴量の少なくとも一部と同じものである、適用例9に記載のシステム。
適用例15:前記第1の複数の特徴量は、前記適合情報、前記検索要求、またはその両方によって決定される、適用例9に記載のシステム。
適用例16:前記非線形ランキングモデルは、学習により決定される、適用例9に記載のシステム。

Claims (16)

  1. プロセッサによって実行される、ランク付けされた検索結果を生成する方法であって、
    検索要求に適合する複数の適合情報アイテムを受け取ることと、
    ランク付けされた結果の第1のセットを得るため、第1の複数の特徴量を線形結合する線形ランキングモデルを用いて、前記複数の適合情報アイテムのうち少なくとも一部のアイテムをランク付けすることと、前記線形ランキングモデルは、前記第1の複数の特徴量に対応する重み係数を用いて、前記第1の複数の特徴量を線形的に結合することと、
    ランク付けされた結果の第2のセットを得るため、第2の複数の特徴量を非線形的に結合する非線形ランキングモデルを用いて、前記ランク付けされた結果の第1のセットの少なくとも一部をランク付けすることと、前記非線形ランキングモデルは、前記第2の複数の特徴量に対応する重み係数を用いて、前記第2の複数の特徴量を非線形的に結合することと、
    前記ランク付けされた結果の第2のセットに基づいて、検索応答を提供することと、を含む方法。
  2. 前記ランク付けされた結果の第1のセットは、前記ランク付けされた結果の第2のセットよりも多数の適合情報アイテムを含んでいる、請求項1に記載の方法。
  3. 前記複数の適合情報アイテムは、第2の複数の適合情報アイテムであり、プロセッサによって実行される前記方法は、さらに、
    前記検索要求を受け取ることと、
    第1の複数の適合情報アイテムを生成することと、
    前記第1の複数の適合情報アイテムを前処理することと、
    前記第1の複数の適合情報アイテムから、前記第2の複数の適合情報アイテムを選択することと、を含む、請求項1に記載の方法。
  4. 前記第1の複数の適合情報アイテムは、前記第2の複数の適合情報アイテムよりも多数の適合情報アイテムを含んでいる、請求項3に記載の方法。
  5. 前記線形ランキングモデルは第1のランキング・スコアを出力し、前記非線形ランキングモデルは第2のランキング・スコアを出力する、請求項1に記載の方法。
  6. 前記線形ランキングモデルにより用いられる前記第1の複数の特徴量の少なくとも一部は、前記非線形ランキングモデルにより用いられる前記第2の複数の特徴量の少なくとも一部と同じものである、請求項1に記載の方法。
  7. 前記第1の複数の特徴量は、前記適合情報、前記検索要求、またはその両方によって決定される、請求項1に記載の方法。
  8. 前記非線形ランキングモデルは、学習により決定される、請求項1に記載の方法。
  9. ランク付けされた検索結果を生成するためのシステムであって、
    1つまたは複数のプロセッサであって、
    検索要求に適合する複数の適合情報アイテムを受け取り、
    ランク付けされた結果の第1のセットを得るため、第1の複数の特徴量を線形結合する線形ランキングモデルを用いて、前記複数の適合情報アイテムのうち少なくとも一部のアイテムをランク付けし、前記線形ランキングモデルは、前記第1の複数の特徴量に対応する重み係数を用いて、前記第1の複数の特徴量を線形的に結合し、
    ランク付けされた結果の第2のセットを得るため、第2の複数の特徴量を非線形的に結合する非線形ランキングモデルを用いて、前記ランク付けされた結果の第1のセットの少なくとも一部をランク付けし、前記非線形ランキングモデルは、前記第2の複数の特徴量に対応する重み係数を用いて、前記第2の複数の特徴量を非線形的に結合することと、
    前記ランク付けされた結果の第2のセットに少なくとも部分的に基づいて検索応答を提供する、ように構成された1つまたは複数のプロセッサと、
    前記1つまたは複数のプロセッサに結合され、プロセッサに命令を供給するように構成された1つまたは複数のメモリと、を備える、システム。
  10. 前記ランク付けされた結果の第1のセットは、前記ランク付けされた結果の第2のセットよりも多数の適合情報アイテムを含んでいる、請求項9に記載のシステム。
  11. 前記複数の適合情報アイテムは、第2の複数の適合情報アイテムであり、前記1つまたは複数のプロセッサは、さらに、
    前記検索要求を受け取り、
    第1の複数の適合情報アイテムを生成し、
    前記第1の複数の適合情報アイテムを前処理し、
    前記第1の複数の適合情報アイテムから、前記第2の複数の適合情報アイテムを選択する、ように構成されている、請求項9に記載のシステム。
  12. 前記第1の複数の適合情報アイテムは、前記第2の複数の適合情報アイテムよりも多数の適合情報アイテムを含んでいる、請求項11に記載のシステム。
  13. 前記線形ランキングモデルは第1のランキング・スコアを出力し、前記非線形ランキングモデルは第2のランキング・スコアを出力する、請求項9に記載のシステム。
  14. 前記線形ランキングモデルにより用いられる前記第1の複数の特徴量の少なくとも一部は、前記非線形ランキングモデルにより用いられる前記第2の複数の特徴量の少なくとも一部と同じものである、請求項9に記載のシステム。
  15. 前記第1の複数の特徴量は、前記適合情報、前記検索要求、またはその両方によって決定される、請求項9に記載のシステム。
  16. 前記非線形ランキングモデルは、学習により決定される、請求項9に記載のシステム。
JP2012516058A 2009-06-19 2010-06-15 線形および非線形のランキングモデルを用いるランク付けされた検索結果の生成 Expired - Fee Related JP5341253B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN200910146331.5A CN101930438B (zh) 2009-06-19 2009-06-19 一种搜索结果生成方法及信息搜索系统
CN200910146331.5 2009-06-19
US12/802,816 US8346765B2 (en) 2009-06-19 2010-06-14 Generating ranked search results using linear and nonlinear ranking models
US12/802,816 2010-06-14
PCT/US2010/001720 WO2010147645A1 (en) 2009-06-19 2010-06-15 Generating ranked search results using linear and nonlinear ranking models

Publications (3)

Publication Number Publication Date
JP2012530963A JP2012530963A (ja) 2012-12-06
JP2012530963A5 JP2012530963A5 (ja) 2013-03-14
JP5341253B2 true JP5341253B2 (ja) 2013-11-13

Family

ID=43355159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012516058A Expired - Fee Related JP5341253B2 (ja) 2009-06-19 2010-06-15 線形および非線形のランキングモデルを用いるランク付けされた検索結果の生成

Country Status (5)

Country Link
US (3) US8346765B2 (ja)
EP (1) EP2443546A4 (ja)
JP (1) JP5341253B2 (ja)
CN (1) CN101930438B (ja)
WO (1) WO2010147645A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317599B2 (en) * 2008-09-19 2016-04-19 Nokia Technologies Oy Method, apparatus and computer program product for providing relevance indication
CN101930438B (zh) * 2009-06-19 2016-08-31 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
JP5699743B2 (ja) * 2011-03-30 2015-04-15 カシオ計算機株式会社 検索方法、検索装置、ならびに、コンピュータプログラム
CN102737018A (zh) * 2011-03-31 2012-10-17 北京百度网讯科技有限公司 基于非线性统一权值对检索结果进行排序的方法及装置
JP5737079B2 (ja) * 2011-08-31 2015-06-17 カシオ計算機株式会社 テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法
US20130179418A1 (en) * 2012-01-06 2013-07-11 Microsoft Corporation Search ranking features
CN102810117B (zh) * 2012-06-29 2016-02-24 北京百度网讯科技有限公司 一种用于提供搜索结果的方法与设备
CN103593373B (zh) * 2012-08-16 2018-09-07 北京百度网讯科技有限公司 一种用于搜索结果排序的方法与设备
CN103885979B (zh) * 2012-12-21 2018-06-05 深圳市世纪光速信息技术有限公司 推送信息的方法和装置
US9514191B2 (en) 2013-03-14 2016-12-06 Microsoft Technology Licensing, Llc Visualizing ranking factors for items in a search result list
CN104424291B (zh) * 2013-09-02 2018-12-21 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
US11238056B2 (en) 2013-10-28 2022-02-01 Microsoft Technology Licensing, Llc Enhancing search results with social labels
US9542440B2 (en) 2013-11-04 2017-01-10 Microsoft Technology Licensing, Llc Enterprise graph search based on object and actor relationships
US11645289B2 (en) 2014-02-04 2023-05-09 Microsoft Technology Licensing, Llc Ranking enterprise graph queries
US9870432B2 (en) 2014-02-24 2018-01-16 Microsoft Technology Licensing, Llc Persisted enterprise graph queries
US11657060B2 (en) 2014-02-27 2023-05-23 Microsoft Technology Licensing, Llc Utilizing interactivity signals to generate relationships and promote content
US10757201B2 (en) 2014-03-01 2020-08-25 Microsoft Technology Licensing, Llc Document and content feed
US10169457B2 (en) 2014-03-03 2019-01-01 Microsoft Technology Licensing, Llc Displaying and posting aggregated social activity on a piece of enterprise content
US10255563B2 (en) 2014-03-03 2019-04-09 Microsoft Technology Licensing, Llc Aggregating enterprise graph content around user-generated topics
US10394827B2 (en) 2014-03-03 2019-08-27 Microsoft Technology Licensing, Llc Discovering enterprise content based on implicit and explicit signals
US11809434B1 (en) 2014-03-11 2023-11-07 Applied Underwriters, Inc. Semantic analysis system for ranking search results
US20150356523A1 (en) * 2014-06-07 2015-12-10 ChainID LLC Decentralized identity verification systems and methods
US20160041982A1 (en) * 2014-08-05 2016-02-11 Facebook, Inc. Conditioned Search Ranking Models on Online Social Networks
RU2580516C2 (ru) * 2014-08-19 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер
US10061826B2 (en) 2014-09-05 2018-08-28 Microsoft Technology Licensing, Llc. Distant content discovery
JP6263461B2 (ja) * 2014-09-26 2018-01-17 日立オートモティブシステムズ株式会社 撮像装置
US10387431B2 (en) * 2015-08-24 2019-08-20 Google Llc Video recommendation based on video titles
CN105335493B (zh) * 2015-10-21 2017-08-29 广州神马移动信息科技有限公司 一种分层过滤文档的方法及装置
CN105302898B (zh) * 2015-10-23 2019-02-19 车智互联(北京)科技有限公司 一种基于点击模型的搜索排序方法及装置
US10534780B2 (en) * 2015-10-28 2020-01-14 Microsoft Technology Licensing, Llc Single unified ranker
US10437841B2 (en) * 2016-10-10 2019-10-08 Microsoft Technology Licensing, Llc Digital assistant extension automatic ranking and selection
CN106777088A (zh) * 2016-12-13 2017-05-31 飞狐信息技术(天津)有限公司 快速迭代的搜索引擎排序方法及系统
CN108520002A (zh) * 2018-03-12 2018-09-11 平安科技(深圳)有限公司 数据处理方法、服务器及计算机存储介质
CN110222260A (zh) * 2019-05-21 2019-09-10 深圳壹账通智能科技有限公司 一种搜索方法、装置及存储介质

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6236768B1 (en) * 1997-10-14 2001-05-22 Massachusetts Institute Of Technology Method and apparatus for automated, context-dependent retrieval of information
US6490579B1 (en) * 1998-07-16 2002-12-03 Perot Systems Corporation Search engine system and method utilizing context of heterogeneous information resources
JP3347088B2 (ja) 1999-02-12 2002-11-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連情報検索方法およびシステム
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6249784B1 (en) * 1999-05-19 2001-06-19 Nanogen, Inc. System and method for searching and processing databases comprising named annotated text strings
US6353825B1 (en) * 1999-07-30 2002-03-05 Verizon Laboratories Inc. Method and device for classification using iterative information retrieval techniques
JP2001126074A (ja) * 1999-08-17 2001-05-11 Atl Systems:Kk パターンマッチングによるデータ検索方法及びそのプログラムを記録した記録媒体
US6751612B1 (en) * 1999-11-29 2004-06-15 Xerox Corporation User query generate search results that rank set of servers where ranking is based on comparing content on each server with user query, frequency at which content on each server is altered using web crawler in a search engine
US6560600B1 (en) 2000-10-25 2003-05-06 Alta Vista Company Method and apparatus for ranking Web page search results
US6526440B1 (en) * 2001-01-30 2003-02-25 Google, Inc. Ranking search results by reranking the results based on local inter-connectivity
US20020194166A1 (en) * 2001-05-01 2002-12-19 Fowler Abraham Michael Mechanism to sift through search results using keywords from the results
US6738764B2 (en) 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
CN1335574A (zh) * 2001-09-05 2002-02-13 罗笑南 智能语义搜索方法
US6947924B2 (en) * 2002-01-07 2005-09-20 International Business Machines Corporation Group based search engine generating search results ranking based on at least one nomination previously made by member of the user group where nomination system is independent from visitation system
US7206780B2 (en) 2003-06-27 2007-04-17 Sbc Knowledge Ventures, L.P. Relevance value for each category of a particular search result in the ranked list is estimated based on its rank and actual relevance values
US8600963B2 (en) * 2003-08-14 2013-12-03 Google Inc. System and method for presenting multiple sets of search results for a single query
US7761447B2 (en) 2004-04-08 2010-07-20 Microsoft Corporation Systems and methods that rank search results
US7617176B2 (en) 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
US7698331B2 (en) 2005-01-18 2010-04-13 Yahoo! Inc. Matching and ranking of sponsored search listings incorporating web search technology and web content
US9092458B1 (en) * 2005-03-08 2015-07-28 Irobot Corporation System and method for managing search results including graphics
CN100338610C (zh) * 2005-06-22 2007-09-19 浙江大学 基于链接分析的个性化搜索引擎方法
US7739708B2 (en) * 2005-07-29 2010-06-15 Yahoo! Inc. System and method for revenue based advertisement placement
US7849070B2 (en) 2005-08-03 2010-12-07 Yahoo! Inc. System and method for dynamically ranking items of audio content
US8489614B2 (en) 2005-12-14 2013-07-16 Google Inc. Ranking academic event related search results using event member metrics
WO2007130716A2 (en) * 2006-01-31 2007-11-15 Intellext, Inc. Methods and apparatus for computerized searching
US20070192293A1 (en) 2006-02-13 2007-08-16 Bing Swen Method for presenting search results
US7603350B1 (en) 2006-05-09 2009-10-13 Google Inc. Search result ranking based on trust
US20080028308A1 (en) 2006-07-31 2008-01-31 Black Fin Software Limited Visual display method for sequential data
US8086600B2 (en) * 2006-12-07 2011-12-27 Google Inc. Interleaving search results
US7792883B2 (en) 2006-12-11 2010-09-07 Google Inc. Viewport-relative scoring for location search queries
JP4573358B2 (ja) * 2007-03-23 2010-11-04 日本電信電話株式会社 評判情報検索装置、その方法およびプログラム
KR100892248B1 (ko) * 2007-07-24 2009-04-09 주식회사 디엠에스 플라즈마 반응기의 실시간 제어를 실현하는 종말점 검출장치 및 이를 포함하는 플라즈마 반응기 및 그 종말점 검출방법
US20090037401A1 (en) * 2007-07-31 2009-02-05 Microsoft Corporation Information Retrieval and Ranking
US7779019B2 (en) 2007-10-19 2010-08-17 Microsoft Corporation Linear combination of rankers
US7801876B1 (en) * 2008-01-11 2010-09-21 Google Inc. Systems and methods for customizing behavior of multiple search engines
JP4908630B2 (ja) * 2008-03-14 2012-04-04 矢崎総業株式会社 給電装置のプロテクタ構造
US20090276414A1 (en) 2008-04-30 2009-11-05 Microsoft Corporation Ranking model adaptation for searching
CN101359331B (zh) * 2008-05-04 2014-03-19 索意互动(北京)信息技术有限公司 对搜索结果重新排序的方法和系统
US8060456B2 (en) * 2008-10-01 2011-11-15 Microsoft Corporation Training a search result ranker with automatically-generated samples
US8515950B2 (en) * 2008-10-01 2013-08-20 Microsoft Corporation Combining log-based rankers and document-based rankers for searching
US8620900B2 (en) * 2009-02-09 2013-12-31 The Hong Kong Polytechnic University Method for using dual indices to support query expansion, relevance/non-relevance models, blind/relevance feedback and an intelligent search interface
EP2408249B1 (en) * 2009-03-09 2016-01-06 Nec Corporation Rank estimation apparatus, receiver, communication system, rank estimation method, and program recording medium
US8661030B2 (en) * 2009-04-09 2014-02-25 Microsoft Corporation Re-ranking top search results
CN101930438B (zh) * 2009-06-19 2016-08-31 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
US20110289088A1 (en) * 2010-05-19 2011-11-24 Frank N. Magid Associates, Inc. System and method for ranking content interest
US8600979B2 (en) * 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse

Also Published As

Publication number Publication date
WO2010147645A1 (en) 2010-12-23
US9471643B2 (en) 2016-10-18
US20100325105A1 (en) 2010-12-23
US20140351246A1 (en) 2014-11-27
US8346765B2 (en) 2013-01-01
EP2443546A4 (en) 2014-07-09
US8782040B2 (en) 2014-07-15
CN101930438A (zh) 2010-12-29
EP2443546A1 (en) 2012-04-25
JP2012530963A (ja) 2012-12-06
US20130166544A1 (en) 2013-06-27
CN101930438B (zh) 2016-08-31

Similar Documents

Publication Publication Date Title
JP5341253B2 (ja) 線形および非線形のランキングモデルを用いるランク付けされた検索結果の生成
US8290927B2 (en) Method and apparatus for rating user generated content in search results
JP5913736B2 (ja) キーワードの推薦
US9135350B2 (en) Computer-generated sentiment-based knowledge base
US8332393B2 (en) Search session with refinement
US9589277B2 (en) Search service advertisement selection
US20070208730A1 (en) Mining web search user behavior to enhance web search relevance
US9251249B2 (en) Entity summarization and comparison
US10445376B2 (en) Rewriting keyword information using search engine results
US20040049514A1 (en) System and method of searching data utilizing automatic categorization
US20110302156A1 (en) Re-ranking search results based on lexical and ontological concepts
US20100131495A1 (en) Lightning search aggregate
Sajeev et al. Effective web personalization system based on time and semantic relatedness
Imhof et al. Multimodal social book search
WO2015116108A1 (en) Automated content selection
US10937078B1 (en) Dynamic generation of item description content
Chiang et al. The WT10G Dataset and the Evolution of the Web
Wang et al. Information retrieval with implicitly temporal queries
TWI490712B (zh) Search results generation method and information search system
US20160260151A1 (en) Search engine optimization for category web pages
JP5903370B2 (ja) 情報検索装置、情報検索方法、及びプログラム
Naamha et al. Web Page Ranking Based on Text Content and Link Information Using Data Mining Techniques
US20140081944A1 (en) Web searching method, system, and apparatus
Weiss et al. Information retrieval and text mining
Gupta et al. Disambiguation of User Search Query

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130122

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20130122

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20130227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130807

R150 Certificate of patent or registration of utility model

Ref document number: 5341253

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees