JP2011508340A - 層割り当ての品質の決定 - Google Patents

層割り当ての品質の決定 Download PDF

Info

Publication number
JP2011508340A
JP2011508340A JP2010540687A JP2010540687A JP2011508340A JP 2011508340 A JP2011508340 A JP 2011508340A JP 2010540687 A JP2010540687 A JP 2010540687A JP 2010540687 A JP2010540687 A JP 2010540687A JP 2011508340 A JP2011508340 A JP 2011508340A
Authority
JP
Japan
Prior art keywords
quality
assignment
tier
query
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010540687A
Other languages
English (en)
Other versions
JP5372955B2 (ja
JP2011508340A5 (ja
Inventor
ビレンコ ミハイル
アーサー マンソン マイルズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2011508340A publication Critical patent/JP2011508340A/ja
Publication of JP2011508340A5 publication Critical patent/JP2011508340A5/ja
Application granted granted Critical
Publication of JP5372955B2 publication Critical patent/JP5372955B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本明細書では、ユーザヒストリデータを受信することと、検索可能なデジタルアイテムを階層化ストレージシステムに格納するのに使用される層割り当ての品質の指示を、上記ユーザヒストリデータのサブセットに少なくとも部分的に基づいて生成することとを含む方法を説明する。本明細書では、ユーザヒストリデータを受信する受信コンポーネントを含むシステムも説明する。該システムは、さらに、クエリによる取り出しが可能なるデジタルアイテムを格納するのに使用される層割り当ての品質の指示を決定する品質指示コンポーネントを含み、該品質指示コンポーネントは、ユーザヒストリデータのサブセットに少なくとも部分的に基づいて上記指示を生成し、上記層割り当ては、階層化ストレージシステム内においてデジタルアイテムを格納すべき場所を示す。

Description

本発明は、層割り当ての品質を決定することに関する。
検索エンジン(search engine)は、ユーザがインターネットを利用して情報に素早くアクセスするのを可能にしている。具体的には、ユーザは、クエリを検索エンジンに提示(submit)し、該検索エンジンによって返されるランク付けされた結果(ranked result)を詳細に調べることができる。例えば、ユーザが「Spider」というクエリを検索エンジンに提供すると、該ユーザに、様々なクモ形類節足動物(arachnid)に関するWebページ、自動車に関するWebページ、映画に関するWebページ、Webクローラ(crawler)に関するWebページ、および他のWebページを提供することができる。検索エンジンを使用して、画像、学術論文、ビデオおよび他の情報をクエリの発行者に返すこともできる。
検索エンジンのオペレーションは、World Wide Web上で利用可能な大量の情報(例えば、Webページ)を探し出して、格納するWebクローラの利用も含むことがある。例えば、Webページまたは該Webページに関する情報を、検索エンジンインデックスに格納することができ、クエリを受信したときに該インデックスが(1つまたは複数の検索アルゴリズムとともに)使用される。
従来、検索エンジンインデックスは、異なる層が異なるレベルのパフォーマンスを提供する複数の層(tier)に格納される。検索エンジンインデックスの階層化は、コンピュータアーキテクチャで使用されるメモリ階層に類似しており、該インデックスの全体の記憶容量は、サイズ、スピード、待ち時間(latency)、およびコストにおいて異なる、様々なレベルに分割される。インデックスのより上位の層は典型的に、スピードは速いが、容量は少なくコストが高い。したがって、望ましいことは、検索エンジンの効率を最大にするようにWebページを慎重にインデックス化することである。
Webページを階層化するための使用されている手法の1つは、Webページを配置するインデックスの層を、そのWebページの静的ランク(static rank)など特定のメトリックによって判断される、そのWebページの相対的な重要度(relative importance)の関数として選択することである。具体的には、あるWebページへのリンクの数を使用してそのWebページを配置するインデックスの層を選択することがある。しかしながら、ページの相対的な重要度は必ずしも、該ページが頻繁にアクセスされるかどうかを示すものではなく、したがって、ページの相対的な重要度は、検索エンジンインデックスにおいてWebページをインデックス化するのに最適ではないこともある。しかしながら、どのメトリックスが層に対するWebページの特定の割り振りの品質をキャプチャするかが明確でないため、層の割り当てを評価することは難しい問題である。
以下は、本明細書に詳細に記載されている主題を簡単に要約したものである。この要約は特許請求の範囲に関して限定することは意図されていない。
本明細書では、デジタルアイテム(Webページなど)の階層化に関する様々な技術を説明する。検索エンジン、データベース管理システムなどとのユーザ対話をモニタリングすることができ、そして該ユーザ対話に関するデータを収集することができる。例えば、ユーザによって提示されるクエリ、該クエリに対する応答として提供される検索結果(例えば、デジタルアイテム)、および該検索結果に対するユーザのアクションを、モニタリングして保持しておくことができる。1つの具体例として、ブラウザ上のツールバーを使用してユーザヒストリデータを収集することができる。少なくとも部分的に該ユーザヒストリデータに基づいて、検索可能デジタルアイテムに対する層割り当て(tier assignment)の品質の指示(indication)を生成することができ、ここで、層割り当ては、検索可能デジタルアイテムを複数の層のどの層に割り当てるかを示す。層の品質の指示は、本明細書で詳述される、定義済みの層割り当て品質メトリック(tier assignment quality metric)に合致する値とすることができる。
一例では、品質の指示を、いくつかのパラメータを確認することによって決定することができる。例えば、層割り当ての品質の指示は、観察されたクエリに割り当てられる重み(weight)に少なくとも部分的に基づくものとすることができる。一例では、重みは、クエリの相対的重要度を示すものとすることができ、またクエリの発行の頻度に少なくとも部分的に基づくものとすることもできる。別の例では、層割り当ての品質の指示は、特定のクエリおよび決定されたシステム負荷(system load)(例えば、クエリを受信したときにシステムがどの程度稼働していたか)に関して、デジタルアイテムの取り出しが特定の層で終わる確率に少なくとも部分的に基づくものとすることもできる。この確率は複数の層について決定されることもある。さらに別の例では、層割り当ての品質の指示は、取り出しが特定の層で終了したとき得られる検索結果の品質の指標(measure)に少なくとも部分的に基づくものとすることもできる。NDCG(Normalized Discounted Cumulative Gain)、MAP(Mean Average Precision)、Q−measure、または情報の取り出しの損失もしくは検索結果品質を測定するための他の適切な機構を、層を階層化する指標の決定に関連して使用することができる。
さらに、層割り当ての品質の指示および/またはユーザヒストリデータに少なくとも部分的に基づいて、改善された層割り当て(improved tier assignment)を生成することができる。例えば、層割り当ての品質の指示が定義済み層割り当て品質メトリックに準拠していることがあり、改善された層割り当てを、該メトリックに対して最適化し、または実質的に最適化することがある。さらに、階層化ポリシーは、改善された層割り当てに少なくとも部分的に基づいて更新することができる。階層化ポリシーは、デジタルアイテムを層に割り当てるのに使用されるポリシーであり、デジタルアイテムに対応する様々な特徴、例えば該デジタルアイテムがユーザによってアクセスされた回数、該デジタルアイテムのサイズなどの特徴を考慮することができる。階層化ポリシーを、例えば、機械学習技法(machine learning technique)の使用を通して更新することができる。
本発明の他の態様は、添付図面および説明を読み、理解することにより認識されるであろう。
層割り当ての品質の指示の決定を容易にする例示システムを示す機能ブロック図である。 層割り当ての品質の指示を生成する例示システムを示す機能ブロック図である。 改善された層割り当ての生成を容易にする例示システムを示す機能ブロック図である。 改善された層割り当ての生成を容易にする例示システムを示す機能ブロック図である。 層割り当ての品質の指示を生成する例示方法を示すフロー図である。 層割り当ての品質の指示を生成する例示方法を示すフロー図である。 層割り当て品質メトリックに関して最適化または実質的に最適化された層割り当てを出力する例示方法を示すフロー図である。 階層化ポリシーを更新する例示方法を示すフロー図である。 例示コンピューティングシステムを示す図である。
層割り当ての品質を決定し、改善された層割り当てを生成し、階層化ポリシーを自動的に更新することに関する様々な技術を、図面を参照して説明するが、図面全体を通して同様の参照番号は同様の要素を表している。さらに、例示システムのいくつかの機能ブロックが説明目的のために図示され、説明されているが、当然に理解されるように、ある特定のシステムコンポーネントによって実施されるとして記載される機能は、複数のコンポーネントによって実行されることもある。同様に、例えば、複数のコンポーネントによって実行されるとして記載される機能を、単一のコンポーネントが実行するように構成されることもある。
図1を参照すると、図1には、層割り当ての品質の指示を階層化ストレージシステム(図示せず)に対して出力するのを容易にする例示システム100が図示されている。一例によれば、階層化ストレージシステムは、複数の層を有する検索エンジンインデックスとすることができ、該複数の層において、第1の(最高の)層は、よりコストが高く記憶空間が比較的少量であり得るが、第1の層から取り出されるデジタルアイテムの取り出し時間は他の層(下位の層)から取り出されるデジタルアイテムの取り出し時間よりも短い。第2の層は、第1の層よりも比較的安価であり、記憶空間が第1の層よりも大きいが、取り出し時間は第1の層に対応する取り出し時間に比べてより多くかかる。別の例では、階層化ストレージシステムは、データベース管理システムに関連して使用されるストレージ層を含むことがある。例えば、データベース管理システムで使用されるサーバは、ハードドライブ、ランダムアクセスメモリ、および高速ランダムアクセスメモリを有することがあり、これらの各々を層とすることができる。
システム100は、ユーザヒストリデータ104を含むデータストア102を備えている。ユーザヒストリデータ104は、例えば、ユーザによって発行されたクエリ、該クエリに応答してユーザに提供された検索結果、該検索結果が提供されたことに応答してユーザによって選択された検索結果、および/または他の適切な情報を含むことがある。一例では、検索エンジンとのユーザの対話をモニタリングすることによってユーザヒストリデータ104を累積することができる。例えば、ツールバープラグインをブラウザにインストールし、ブラウザに入力されたクエリ、ならびに該クエリに応答して返された検索結果、特定の検索結果のユーザ選択、およびクエリを提示したあとにユーザに表示されるページのシーケンスを、そのツールバープラグインによって収集することができる。
受信コンポーネント106は、ユーザヒストリデータ104のサブセットを受信する。品質指示(quality indicator)コンポーネント108は、受信コンポーネント106と通信して、該受信コンポーネント106からユーザヒストリデータ104のサブセットを受信する。品質指示コンポーネント108は、層割り当ての品質の指示(indication)110を生成することができ、該層割り当ては、デジタルアイテムが階層化ストレージシステム内のどこに割り当てられるべきかを示す。例えば、品質の指示は、以下で詳述される層割り当て品質メトリックに準拠することができる。さらに、品質指示コンポーネント108のオペレーションを、以下でさらに詳細に説明する。
次に図2を参照して説明すると、図2には品質指示コンポーネント108の例が図示されている。品質指示コンポーネント108は、重み決定コンポーネント202、負荷決定コンポーネント204、層決定コンポーネント206、およびユーティリティ決定コンポーネント208を含む。重み決定コンポーネント202は、品質指示コンポーネント108によって使用される各クエリに割り当てる重みを決定して、階層化ストレージシステムに対応する層割り当ての品質の指示を生成する。一例では、重み決定コンポーネント202によって決定される重みは、(例えば、クエリログから確認される)クエリの発行の頻度に少なくとも部分的に基づくものとすることができる。
負荷決定コンポーネント204は、特定のクエリが検索コンポーネント(例えば、検索エンジン、データベースシステムなど)によって実行されたとき観察されるシステム負荷を決定する。システム負荷は、特定のクエリが処理された間に検索コンポーネントによって処理されるクエリの数、特定のクエリが実行された間に検索結果を取り出すのに費やされた処理サイクルの数、または検索コンポーネントが一般にどの程度「稼働(busy)」していたかに少なくとも部分的に基づくものとすることができる。
層決定コンポーネント206は、ある特定の層が負荷決定コンポーネント204によって決定されたシステム負荷の下、(特定のクエリに関する)デジタルアイテムの検索に最後に検索される層となる確率を決定することができる。通常、あるクエリが検索コンポーネント(例えば、検索エンジン)に入力されると、まず、典型的に下位の層に比べて小さいがアクセス時間と取り出し時間が高速な上位の層において取り出しが実行される。上位の層で取得された結果の数および品質、ならびに現在のシステム負荷に応じて、取り出しが下位の層で実行されることもあり、実行されないこともある。したがって、上述したように、層決定コンポーネント206は、ある特定の層が(決定されたシステム負荷の下で特定のクエリに対する)デジタルアイテムの検索に最後に検索された層となる確率を決定することができる。この確率は階層化ストレージシステム内の層毎に決定することができる。
ユーティリティ決定コンポーネント208は、ある特定の層で取り出しが終了すると、(特定のクエリに対する)検索結果品質の指示を決定するが、任意の適切なメトリックを使用して該検索結果品質の指示を計算することができる。一例では、NDCG(Normalized Discounted Cumulative Gain)を使用して、検索結果品質の指示を決定することができる。別の例では、MAP(Mean Average Precision)を使用して、検索結果品質の指示を決定することができる。さらに別の例では、Q−measureを使用して検索結果品質の指示を決定することができる。したがって、ユーティリティ決定コンポーネント208は、任意の適切な機構/メトリックスを使用して、ある特定の層で取り出しが終了するときの特定のクエリに対する検索結果品質の指示を決定することができることがわかる。
重み決定コンポーネント202によって決定される重み、負荷決定コンポーネント204によって決定されるシステム負荷、層決定コンポーネント206によって決定される確率、およびユーティリティ決定コンポーネント208によって決定される検索結果品質の指示を、品質指示コンポーネント108が使用して、層割り当ての品質の指示を決定することができる。
一例によれば、以下の式を使用して、層割り当て品質メトリックを定義することができ、また以下の式は、品質指示コンポーネント108によって層割り当ての品質の指示を決定するのに使用される。
Figure 2011508340
Figure 2011508340
しかしながら、全ての可能なクエリの数は無限であることが理解されよう。したがって、観察されたクエリQ’のセットは、品質指示コンポーネント108によって、全ての可能なクエリの分布の概算値として使用される。一例では、これらの観察されたクエリQ’を、複数の観察されたクエリを含むデータリポジトリ(例えば、ユーザヒストリデータ)からランダムに選択することができ、この場合、任意のクエリを選択する確率q∈Q’を、検索コンポーネント(例えば、検索エンジン、データベース管理システムなど)によって受信されるランダムクエリを選択する可能性として計算することができる。別の例では、観察されるクエリQ’のセットは、該観察されるクエリQ’が全ての可能なクエリを表すように選択されることもある。例えば、クエリQ’は、ある特定の長さ(ワード数、文字数などを指標とする)を有するクエリの数が閾値を超えないように選択されることがある。さらに、異なる主題に向けられたクエリを選択することができる。さらに別の例では、クエリQ’は、そのようなクエリに関連付けられたユーザデータの量に基づいて選択されることがある。例えば、クエリQ’は、クエリに対する応答として提供される1つまたは複数の検索結果および/または広告にユーザがクリックすることなど、クエリに関連付けられたシーケンシャルのユーザデータを有するクエリに制限されることもある。観察されたクエリのサブセットの選択に適切な任意の手法が、添付の特許請求の範囲の範囲内に含まれるように考慮され、意図されていることを理解されたい。
Figure 2011508340
クエリQ’および対応する結果のセットを用いて、以下のアルゴリズムにより層割り当て品質のメトリックを定義することができ、また、以下のアルゴリズムは、品質指示コンポーネント108によって層割り当ての品質の指示を決定するのに使用される。
Figure 2011508340
Figure 2011508340
Figure 2011508340
特定の例では、ユーティリティ決定コンポーネント208は、以下のアルゴリズムを利用して、t番目の層で取り出しが終了するときの検索結果品質の指標を決定することができる。このアルゴリズムはNDCGの変更(modification)である。
Figure 2011508340
上記(3)において、Nは、正規化係数であり、Rt(q)は、層1から層tに格納されたR(q)内のデジタルアイテムの順序付けされたサブセットであり、rel(d)は、デジタルアイテムdの関連スコア(relevance score)であり、rank(d)は、デジタルアイテムのRt(q)内のランク位置である。なお、rank(d)は、より多くの関連デジタルアイテムがより下位(より深い)層に存在するとき、tに応じて異なることがあり、取り出しが層tを超えていないときは、それらのデジタルアイテムが取り出されないこともある。上述したように、NDCGの変更を使用することは、現在の層割り当てが与えられた特定のクエリに対する検索結果品質の1つの可能な指標にすぎず、取り出される関連結果の比率(proportion)などの他の指標を利用することもできる。
Figure 2011508340
次に図3を参照して説明すると、図3には、階層化ストレージシステムに対する層割り当てを自動的に更新するのを容易にする例示システム300が図示されている。システム300は、複数の層を含むことができる階層化ストレージシステム302を備え、その複数の層の各々を、Webページ、イメージ、ドキュメント、および/または同様のものなど、1つまたは複数のデジタルアイテムを格納するのに使用することができる。検索コンポーネント304は、受信したクエリに少なくとも部分的に基づいて、階層化ストレージシステム302に格納されたデジタルアイテムの検索を実行する。例えば、検索コンポーネント304は、クエリを受信したことに応答して階層化検索インデックスを通して検索するように構成された検索エンジンとすることができる。別の例では、検索コンポーネント304は、クエリの受信に応答してストレージ(例えば、メモリ、ハードドライブ)の階層を検索するのに使用されるデータベース管理システムの一部とすることもできる。さらに別の例では、検索エンジン304は、コンピュータ上のアイテムを検索するのに使用されるデスクトップ検索モジュールとすることもできる。他の検索コンポーネントも意図されている。
データストア102は、検索コンポーネント304から受信することができるユーザヒストリデータ104を保持する。例えば、検索コンポーネント304に提供されたクエリ、検索結果が提供されたあとのユーザアクション、およびクエリに応答してユーザに提供された検索結果のセットを、ユーザヒストリデータ104に格納することができる。受信コンポーネント106は、ユーザヒストリデータ104のサブセットを受信する。上述したように、品質指示コンポーネント108は、層割り当ての品質の指示110を生成することができる。一例では、指示110は、品質指示コンポーネント108によって生成されると、コンピュータ読取可能媒体に格納することもできる。
更新コンポーネント306は、指示100を受信し、該指示110に少なくとも部分的に基づいて、改善された層割り当てを出力することができる。例えば、更新コンポーネント306は、他の可能な層割り当ておよび対応する品質の指示を受信し、最高品質の指示に対応する層割り当てを選択することができる。例えば、更新コンポーネント306は、ヒューリスティック(heuristic)を使用して、(定義された層割り当て品質メトリックに対して)最適な割り当て、または実質的に最適な層割り当てを決定することができる。別の例では、以下で詳述される機械学習技法を、更新コンポーネント306が利用して、改善された層割り当てを出力することができる。次いで、デジタルアイテム310を、改善された層割り当て308に少なくとも部分的に基づいて、階層化ストレージシステム302に割り当てることができる。
Figure 2011508340
Figure 2011508340
可能な層割り当てのセットTを、静的なランク付けスキームのパラメータなど、なんらかの変数によってパラメータ化される代替割り当てのセットまたは割り当てのグループとして定義することができる。次いで、更新コンポーネント306は、機械学習技法を使用して代替割り当てのセットを検索し、当該割り当てのうちの1つを最適または実質的に最適であるとして識別することができる。例えば、更新コンポーネント306は、ニューラルネットワーク、回帰ツリー(regression tree)、ベイジアン(Bayesian)ネットワーク、または任意の他の適切な機械学習技法を使用して、指示110を最適化または実質的に最適化する階層化割り当てを決定することができる。
さらに、更新コンポーネント306は、デジタルアイテム310を階層化ストレージシステム302内の特定の層に割り当てるのに使用される階層ポリシーを、改善された層割り当て308および/またはユーザヒストリデータ104のサブセットに少なくとも部分的に基づいて決定することができる。階層化ポリシーを使用して、デジタルアイテムを格納するときに階層化ストレージシステム302のどの層を使用するかを決定することができる。例えば、階層化ポリシー312は、1つまたは複数のクエリに応答して返されることのある検索可能アイテムの様々な特徴を考慮に入れることができる。このような特徴には、リンク構造から得られる静的ランキング(例えば、デジタルアイテムのページランク)、そのデジタルアイテムを含むドメインのランク、検索エンジン結果の中におけるそのデジタルアイテムの人気(popularity)、あるデジタルアイテムの中の単語の数、あるデジタルアイテムの中のイメージの色のスペクトルなどが含まれ得る。これらの特徴の各々は、更新コンポーネント306によってパラメータ化され得る。言い換えれば、これらの特徴に、対応するデジタルアイテムを階層化ストレージシステム302の層に割り当てるのに階層化ポリシーによって使用される重みを、割り当てることができる。更新コンポーネント306は、機械学習手法を使用して特徴に割り当てるべき重みを学習することができ、階層化ポリシーは、デジタルアイテムを階層化ストレージシステム302の層に割り当てるのに使用されることもある。
次に図4を参照して説明すると、図4には、複数の可能な層割り当てに基づいて層割り当ての更新を容易にする例示システム400が図示されている。システム400は、層割り当ての品質の指示を生成することができる品質指示コンポーネント108を含む。より具体的には、品質指示コンポーネント108は、第1の層割り当てからN番目の層割り当てまでの品質の指示を、少なくとも部分的にユーザヒストリデータ104に基づいて生成することができる。更新コンポーネント306は、(定義された層割り当て品質メトリックに対応する値とすることができる)品質の指示を受信し、結果として得られる改善された層割り当てがいずれの個々の層割り当てよりも高い品質(品質指示コンポーネント108よって決定される)を有するように、複数の異なる層割り当てを組み合わせることができる。更新コンポーネント306は、層割り当て402〜404に対応する品質の指示および/またはユーザヒストリデータ104のサブセットに少なくとも部分的に基づいて、異なる層割り当てを組み合わせることができる。
より詳細には、層割り当てを組み合わせることは、アルゴリズム(4)の特定のインスタンス化とすることができ、この場合、可能な割り当てのセットTは、個々の層割り当ての可能な組み合わせのセットとすることができる。可能な組み合わせのセットを、静的ランキングスキーマのパラメータなどの何らかの変数によってパラメータ化することができる。更新コンポーネント306は、機械学習手法を使用して、定義された層割り当て品質メトリックに対して最適または実質的に最適である個々の層割り当ての組み合わせを決定することができる。さらに、上述したように、更新コンポーネント308は、デジタルアイテムを階層化ストレージシステムの層に割り当てるのに使用される階層化ポリシーを、改善された層割り当て406に少なくとも部分的に基づいて生成し、または更新することができる。
次に図5〜図8を参照して説明すると、様々な例示方法が図示され、記載されている。これらの方法は、順次実行される一連のアクトであるように記載されているが、当然に理解されるように、これらの方法はその順序には制限されない。例えば、一部のアクトが本明細書に記載されているものとは異なる順序で起こることもある。さらに、あるアクトが別のアクトと同時に起こることもある。さらに、一部の例では、本明細書に記載される方法を実装するのにすべてのアクトが必要とされるとは限らない。
さらに、本明細書に記載されているアクトは、1つまたは複数のプロセッサによって実装すること、および/またはコンピュータ読取可能媒体に格納することができるコンピュータ実行可能命令とすることができる。コンピュータ実行可能命令は、ルーチン、サブルーチン、プログラム、実行スレッドなどを含むことがある。さらに、検索エンジンおよび/またはデータベース管理システムにおける層割り当ては、少なくとも部分的に本明細書に記載の方法に基づいて決定することができる。さらに、方法のアクトの結果を、コンピュータ読取可能媒体に格納することができ、および/またはディスプレイデバイス上に表示することなどもできる。
図5を参照して具体的に説明すると、図5には、層割り当ての品質の指示を決定するための例示方法500が図示されている。この方法500は502で開始し、504でユーザヒストリデータを受信する。例えば、ユーザヒストリデータは、ユーザによって発行されたクエリ、クエリに応答してユーザに提供される検索結果、検索結果のユーザ選択、およびクエリを発行したあとにユーザによって参照されたページのシーケンスを含むことができる。ユーザヒストリデータは、ラベル付きデータ(labeled data)を含むこともあり、この場合、クエリに対する検索結果の関連性は、ユーザによって明示的に定義されている。
506において、層割り当ての品質の指示は、ユーザヒストリデータのサブセットに少なくとも部分的に基づいて生成される。方法500は508で完了する。
次に図6を参照して説明すると、図6には、階層化ストレージシステムに対する層割り当ての品質の指示を決定するのを容易にする方法600が図示されている。方法600は602で開始し、604においてクエリに割り当てる重みが決定される。例えば、重みはクエリの発行頻度に応じたものとすることができる。別の例では、1または複数のユーザは明示的に、クエリの相対的重要度を示すようにクエリに重みを割り当てることができる。
606において、クエリに対するシステム負荷の背景(background)が決定される。上述したように、システム負荷は、クエリが処理される時点における、検索エンジンまたはデータベース管理システムなどの検索コンポーネントによって処理されるクエリの数に関連することがある。
608において、検索エンジンが上記システム負荷の下にあるときに、ある特定の層が訪問される最下位の層となる確率が決定される。例えば、この確率は、検索可能デジタルアイテムを格納するのに使用される各層について決定することができる。
610において、クエリに対応するデジタルアイテムを階層化ストレージシステムに格納するのに使用される層割り当てについて、該層割り当ての品質の指示が決定される。品質の指示は、上記重み、上記システム負荷、および上記決定された層の確率に少なくとも部分的に基づいて決定される。一例では、決定された品質の指示を、少なくとも一時的に、コンピュータ読取可能媒体に格納することができる。方法600は612で終了する。
次に図7を参照して説明すると、図7には、(例えば、定義された層割り当て品質メトリックに対して最適化または実質的に最適化される)最適または実質的に最適な層割り当てを決定するための方法700が図示されている。方法700は、702で開始し、704において複数の異なる層割り当てを受信する。706において、ユーザヒストリデータを受信する。上述したように、ユーザヒストリデータは、クエリ、クエリに応答して提供された検索結果、および/またはクエリに応答して提供された検索結果に対するユーザ選択を含むことができる。
708において、複数の異なる層割り当てのサブセットに対する品質の指示を決定する。710において、層割り当ては、結果として得られる組み合わせが全ての個々の層割り当てよりも高い品質の指示を有するように、組み合わされる。方法700は712で終了する。
次に図8を参照して説明すると、図8には、階層化ポリシーの更新を容易にする方法800が図示されている。一例では、階層化ポリシーを使用してデジタルアイテムを検索エンジンインデックスの層に割り当てる検索エンジンが、方法800のアクトを使用して階層化ポリシーを更新することができる。方法800は802で開始し、804においてユーザヒストリデータを受信する。806において、層割り当ての品質の指示を決定する。808において、改善された層割り当てが、ユーザヒストリデータおよび/または806で決定された品質の指示に少なくとも部分的に基づいて決定される。810において、階層化ポリシーが、ユーザヒストリデータおよび改善された層割り当てに少なくとも部分的に基づいて更新される。例えば、改善された層割り当ては、ユーザヒストリデータに関連するデジタルデータを意図していることがあり、階層化ポリシーを使用して、改善された層割り当てでは意図されていなかったデジタルアイテムを特定の層に割り当てることがある。方法800はステップ812で終了する。
次に図9を参照して説明すると、図9には、本明細書に開示されるシステムおよび方法にしたがって使用することができる例示コンピューティングデバイス900のハイレベルの図が示されている。例えば、コンピューティングデバイス900は、検索エンジンシステムにおいて使用されることもある。別の例では、コンピューティングデバイス900は、データベース管理システムにおいて使用されることがある。コンピューティングデバイス900はサーバとすることもあり、または、パーソナルコンピュータ、パーソナルデジタルアシスタントなど、従来からクライアントデバイスと考えられるデバイスとして使用されることもある。コンピューティングデバイス900は、メモリ904に格納された命令を実行する少なくとも1つのプロセッサを含む。命令は、例えば、上述した1つまたは複数のコンポーネントによって実行されるものと記載された機能を実装するための命令とすることができ、あるいは上述の方法の1つまたは複数を実装するための命令とすることもできる。プロセッサ902は、システムバス906を通してメモリにアクセスすることができる。メモリ904は、実行可能命令を格納することに加え、デジタルアイテム、少なくとも層割り当ての一部、1つまたは複数の層割り当ての品質の指示などを格納することもできる。
コンピューティングデバイス900は、さらに、システムバス906を通してプロセッサ902によってアクセス可能なデータストア908を備える。データストア908は、実行可能命令、1つまたは複数の層割り当て、層割り当ての品質の指示、ユーザヒストリデータ、ラベル付けされたデータなどを含むことができる。コンピューティングデバイス900は、外部デバイスがコンピューティングデバイス900と通信できるようにする入力インタフェース910も備える。例えば、入力インタフェース910を使用して、ネットワークを通してユーザからクエリを受信することができる。コンピューティングデバイス900は、コンピューティングデバイス900と1つまたは複数の外部デバイスとのインタフェースをとる出力インタフェースも備える。例えば、コンピューティングデバイス900は、出力インタフェース912を通して検索結果を表示することができる。
さらに、コンピューティングデバイス900は単一のシステムとして図示されているが、当然に理解されるように、コンピューティングシステム900を分散システムとすることができる。したがって、例えば、複数のデバイスがネットワーク接続を通して通信することができ、コンピューティングデバイス900によって実行されるものと記載されているタスクを集約的に実行することもある。
本明細書で使用される「コンポーネント」および「システム」という用語は、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組み合わせを含むように意図されている。したがって、例えば、システムまたはコンポーネントは、プロセス、プロセッサ上で実行されるプロセス、またはプロセッサとすることができる。さらに、コンポーネントまたはシステムを、単一のデバイス上に配置することも、複数のデバイスにわたって分散することもできる。
複数の例は説明の目的のために提供されたものであることに留意されたい。これらの例は、特許請求の範囲の記載を限定するものと解されるものではない。さらに、以上から認識されるように、本明細書に提供された例の順序を変えたとしても、これらの例は依然として特許請求の範囲の範囲内に属するものである。

Claims (20)

  1. ユーザヒストリデータを受信するステップと、
    検索可能なデジタルアイテムを階層化ストレージシステムに格納するのに使用される層割り当ての品質の指示を生成するステップであって、前記指示は、前記ユーザヒストリアイテムに少なくとも部分的に基づいている、ステップと
    を含むことを特徴とする方法。
  2. 前記ユーザヒストリデータは、
    検索エンジンに提供されたクエリと、
    前記クエリに対して検索エンジンによって返された結果と、
    1つまたは複数のユーザによって選択された検索結果内のデジタルアイテムと、
    ユーザが前記クエリを提示したあとに該ユーザによってアクセスされたデジタルアイテムのシーケンスと
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記ユーザヒストリデータは、
    データベース管理システムに入力されるクエリと、
    前記クエリに応答して返される結果と、
    ユーザが前記クエリを提示したあとに該ユーザによってアクセスされたアイテムのシーケンスと
    を含むことを特徴とする請求項1に記載の方法。
  4. 前記階層化ストレージシステムは、検索エンジンインデックスであることを特徴とする請求項1に記載の方法。
  5. 少なくとも部分的に前記ユーザヒストリデータに基づいて、改善された層割り当てを生成するステップをさらに含むことを特徴とする請求項1に記載の方法。
  6. 前記改善された層割り当てを生成するステップは、層割り当て品質メトリックスに関して最適化または実質的に最適化することを含むことを特徴とする請求項5に記載の方法。
  7. 少なくとも部分的に前記改善された層割り当てに基づいて、デジタルアイテムを前記階層化ストレージシステムの層に割り当てるのに使用される階層化ポリシーを更新するステップをさらに含むことを特徴とする請求項5に記載の方法。
  8. 機械学習技法を使用して前記階層化ポリシーをパラメータ化するステップをさらに含むことを特徴とする請求項7に記載の方法。
  9. 前記指示を生成するステップは、
    クエリに割り当てる重みを決定するステップであって、前記重みは、前記クエリの発行頻度を示す、ステップと、
    前記クエリに対するシステム負荷の背景を決定するステップと、
    前記クエリを実行するのに使用される検索エンジンが前記システム負荷の下にあるとき、前記クエリを使用して検索する際に、ある特定の層が訪問される最下位の層となる確率を決定するステップと
    を含むことを特徴とする請求項1に記載の方法。
  10. 前記指示を生成するステップは、
    Figure 2011508340
  11. ユーザヒストリデータ(104)を受信する、受信コンポーネント(106)と、
    クエリを実行することによって取り出すことができるデジタルアイテムを格納するのに使用される層割り当ての品質の指示を決定する、品質指示コンポーネント(108)と
    を備えたシステムであって、前記品質指示コンポーネント(108)は、少なくとも部分的に前記ユーザヒストリデータ(104)のサブセットに基づいて前記指示を生成し、前記層割り当ては、階層化ストレージシステム内においてデジタルアイテムを格納しべぉ場所を示すことを特徴とするシステム。
  12. 前記指示は、検索エンジンインデックスに対する層割り当ての品質を示すことを特徴とする請求項11に記載のシステム。
  13. 少なくとも部分的に前記ユーザヒストリデータに基づいて、改善された層割り当てを生成する更新コンポーネントをさらに備えたことを特徴とする請求項11に記載のシステム。
  14. 前記更新コンポーネントは、複数の層割り当てを組み合わせて前記改善された層割り当てを生成することを特徴とする請求項13に記載のシステム。
  15. 前記更新コンポーネントは、少なくとも部分的に前記改善された層割り当てに基づいて、デジタルアイテムを前記階層化ストレージシステムの層に割り当てるのに使用される階層化ポリシーを更新することを特徴とする請求項13に記載のシステム。
  16. 前記更新コンポーネントは、機械学習技法を使用して前記階層化ポリシーを更新することを特徴とする請求項15に記載のシステム。
  17. 前記更新コンポーネントは、層品質メトリックスに関して層割り当てを最適化または実質的に最適化して前記改善された層割り当てを生成することを特徴とする請求項13に記載のシステム。
  18. 前記品質指示コンポーネントは、
    1つまたは複数のクエリに割り当てる重みであって、前記1つまたは複数のクエリの発行頻度を示す重みを決定する、重み決定コンポーネントと、
    検索エンジンおけるシステム負荷を決定する負荷決定コンポーネントと、
    前記検索エンジンが前記システム負荷の下にあるときに、前記1つまたは複数のクエリを使用する際に、ある特定の層が前記階層化ストレージシステムにおいて訪問される最下位の層となる確率を決定する、層決定コンポーネントと、
    を備えたことを特徴とする請求項11に記載のシステム。
  19. 特定の層で検索の取り出しが終了するときの検索品質の指標を決定する、ユーティリティ決定コンポーネントをさらに備えたことを特徴とする請求項11に記載のシステム。
  20. 現在の階層化ポリシーを使用してデジタルアイテムを検索エンジンインデックスに割り当てる検索エンジンであって、前記現在の階層化ポリシーは、
    ユーザヒストリデータを受信することと、
    層割り当ての品質の指示を出力することと、
    前記受信したユーザヒストリデータと前記層割り当ての品質の指示とに少なくとも部分的に基づいて、改善された層割り当てを決定することと、
    デジタルアイテムを前記検索エンジンインデックスの層に割り当てるのに使用される階層化ポリシーを、前記改善された層割り当てに少なくとも部分的に基づいて更新して、前記現在の階層化ポリシーを作成すること
    を含む複数の動作によって作成されることを特徴とする検索エンジン。
JP2010540687A 2007-12-27 2008-11-10 層割り当ての品質の決定 Active JP5372955B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/964,729 US8024285B2 (en) 2007-12-27 2007-12-27 Determining quality of tier assignments
US11/964,729 2007-12-27
PCT/US2008/082983 WO2009085410A1 (en) 2007-12-27 2008-11-10 Determining quality of tier assignments

Publications (3)

Publication Number Publication Date
JP2011508340A true JP2011508340A (ja) 2011-03-10
JP2011508340A5 JP2011508340A5 (ja) 2012-01-05
JP5372955B2 JP5372955B2 (ja) 2013-12-18

Family

ID=40799712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010540687A Active JP5372955B2 (ja) 2007-12-27 2008-11-10 層割り当ての品質の決定

Country Status (5)

Country Link
US (3) US8024285B2 (ja)
EP (1) EP2248055B1 (ja)
JP (1) JP5372955B2 (ja)
CN (1) CN101911061B (ja)
WO (1) WO2009085410A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090254523A1 (en) * 2008-04-04 2009-10-08 Yahoo! Inc. Hybrid term and document-based indexing for search query resolution
US8615477B2 (en) * 2010-06-08 2013-12-24 Microsoft Corporation Monitoring relationships between digital items on a computing apparatus
US8463036B1 (en) * 2010-09-30 2013-06-11 A9.Com, Inc. Shape-based search of a collection of content
US8700583B1 (en) 2012-07-24 2014-04-15 Google Inc. Dynamic tiermaps for large online databases
US9501506B1 (en) 2013-03-15 2016-11-22 Google Inc. Indexing system
US9483568B1 (en) 2013-06-05 2016-11-01 Google Inc. Indexing system
US10146872B2 (en) * 2014-07-16 2018-12-04 Excalibur Ip, Llc Method and system for predicting search results quality in vertical ranking
US9792286B2 (en) 2014-12-31 2017-10-17 Rovi Guides, Inc. Systems and methods for obtaining customized search results by way of user-specific search indices
US9613108B1 (en) * 2015-12-09 2017-04-04 Vinyl Development LLC Light data integration
US10409824B2 (en) * 2016-06-29 2019-09-10 International Business Machines Corporation System, method and recording medium for cognitive proximates
JP2018197933A (ja) * 2017-05-23 2018-12-13 富士通株式会社 ストレージ制御装置、情報処理システムおよびプログラム
US11947516B1 (en) * 2018-02-22 2024-04-02 Amazon Technologies, Inc. Multi-tier definition management for distributed data stores
US11494359B2 (en) * 2019-03-18 2022-11-08 Sap Se Index and storage management for multi-tiered databases
CN111026962B (zh) * 2019-12-03 2023-09-22 泰康保险集团股份有限公司 层级关系查询响应时间降低方法、服务器和用户前端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005502121A (ja) * 2001-08-31 2005-01-20 アルキヴィオ・インコーポレーテッド 記憶ポリシに基づいてデータを記憶する技法
US20050021530A1 (en) * 2003-07-22 2005-01-27 Garg Pankaj K. Resource allocation for multiple applications
JP2005173876A (ja) * 2003-12-10 2005-06-30 Hitachi Ltd キャッシュサーバ
JP2007521579A (ja) * 2003-12-15 2007-08-02 インターナショナル・ビジネス・マシーンズ・コーポレーション アクション中心のアプローチを用いてネットワークシステムの自律管理を行うシステム及び方法

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3662400A (en) * 1970-04-28 1972-05-09 Hinderstein & Silber Subsidiary document identification system
US4195342A (en) * 1977-12-22 1980-03-25 Honeywell Information Systems Inc. Multi-configurable cache store system
JPH0981630A (ja) 1995-09-13 1997-03-28 Toshiba Corp 評価機能付き情報提供システム
US6272507B1 (en) * 1997-04-09 2001-08-07 Xerox Corporation System for ranking search results from a collection of documents using spreading activation techniques
US6138118A (en) * 1998-07-30 2000-10-24 Telcordia Technologies, Inc. Method and system for reconciling concurrent streams of transactions in a database
US6845370B2 (en) * 1998-11-12 2005-01-18 Accenture Llp Advanced information gathering for targeted activities
US7181459B2 (en) * 1999-05-04 2007-02-20 Iconfind, Inc. Method of coding, categorizing, and retrieving network pages and sites
US6175830B1 (en) * 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method
US6516337B1 (en) * 1999-10-14 2003-02-04 Arcessa, Inc. Sending to a central indexing site meta data or signatures from objects on a computer network
NO313399B1 (no) * 2000-09-14 2002-09-23 Fast Search & Transfer Asa Fremgangsmate til soking og analyse av informasjon i datanettverk
JP2004517402A (ja) * 2000-12-22 2004-06-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ メタデータカテゴリ及び情報ポータルを構築する方法
KR20020069892A (ko) 2001-02-28 2002-09-05 주식회사 인터넷과 꿈 인터넷 사이트의 평가정보 제공방법
US6763351B1 (en) * 2001-06-18 2004-07-13 Siebel Systems, Inc. Method, apparatus, and system for attaching search results
WO2003083643A1 (en) * 2002-03-25 2003-10-09 Morciz Michael Z Accessing deep web information using a search engine
KR100700376B1 (ko) 2002-09-11 2007-03-27 한국과학기술정보연구원 실시간 서지데이터베이스 평가 방법
US7917483B2 (en) * 2003-04-24 2011-03-29 Affini, Inc. Search engine and method with improved relevancy, scope, and timeliness
KR20040098889A (ko) 2003-05-16 2004-11-26 엔에이치엔(주) 웹사이트 검색 서비스 제공 방법 및 그 시스템
US7240064B2 (en) * 2003-11-10 2007-07-03 Overture Services, Inc. Search engine with hierarchically stored indices
US20050198007A1 (en) * 2004-03-02 2005-09-08 Tehuti Networks Ltd. Method, system and algorithm for dynamically managing a connection context database
US7779464B2 (en) * 2004-06-14 2010-08-17 Lionic Corporation System security approaches utilizing a hierarchical memory system
US20070214133A1 (en) * 2004-06-23 2007-09-13 Edo Liberty Methods for filtering data and filling in missing data using nonlinear inference
US7379947B2 (en) * 2004-07-30 2008-05-27 Microsoft Corporation Efficiently ranking web pages via matrix index manipulation and improved caching
US20060015498A1 (en) * 2004-08-13 2006-01-19 Edgar Sarmiento Search engine
US20060150094A1 (en) * 2004-12-31 2006-07-06 Zakir Patrawala Web companion
US7603343B2 (en) * 2005-02-04 2009-10-13 Microsoft Corporation Quality of web search results using a game
US20070027700A1 (en) * 2005-07-29 2007-02-01 Sivajini Ahamparam System and method for global informaiton delivery management through a reporting hiearachy
US7610425B2 (en) * 2005-08-22 2009-10-27 Sun Microsystems, Inc. Approach for managing interrupt load distribution
US7873624B2 (en) * 2005-10-21 2011-01-18 Microsoft Corporation Question answering over structured content on the web
US20070244868A1 (en) * 2005-10-31 2007-10-18 Grubb Michael L Internet book marking and search results delivery
US8229897B2 (en) * 2006-02-03 2012-07-24 International Business Machines Corporation Restoring a file to its proper storage tier in an information lifecycle management environment
US20070239747A1 (en) * 2006-03-29 2007-10-11 International Business Machines Corporation Methods, systems, and computer program products for providing read ahead and caching in an information lifecycle management system
US8065292B2 (en) * 2006-04-17 2011-11-22 Cisco Technology, Inc. Generating an index for a network search engine
US7966324B2 (en) * 2006-05-30 2011-06-21 Microsoft Corporation Personalizing a search results page based on search history

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005502121A (ja) * 2001-08-31 2005-01-20 アルキヴィオ・インコーポレーテッド 記憶ポリシに基づいてデータを記憶する技法
US20050021530A1 (en) * 2003-07-22 2005-01-27 Garg Pankaj K. Resource allocation for multiple applications
JP2005173876A (ja) * 2003-12-10 2005-06-30 Hitachi Ltd キャッシュサーバ
JP2007521579A (ja) * 2003-12-15 2007-08-02 インターナショナル・ビジネス・マシーンズ・コーポレーション アクション中心のアプローチを用いてネットワークシステムの自律管理を行うシステム及び方法

Also Published As

Publication number Publication date
EP2248055B1 (en) 2022-10-26
US9177042B2 (en) 2015-11-03
US20090171867A1 (en) 2009-07-02
JP5372955B2 (ja) 2013-12-18
EP2248055A4 (en) 2012-01-11
EP2248055A1 (en) 2010-11-10
US20110302146A1 (en) 2011-12-08
US20160026715A1 (en) 2016-01-28
US8024285B2 (en) 2011-09-20
CN101911061B (zh) 2013-04-10
WO2009085410A1 (en) 2009-07-09
CN101911061A (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
JP5372955B2 (ja) 層割り当ての品質の決定
US7617208B2 (en) User query data mining and related techniques
AU2015225870B2 (en) System and methods for cleansing automated robotic traffic from sets of usage logs
US9652537B2 (en) Identifying terms associated with queries
US7984004B2 (en) Query suggestion generation
JP5328896B2 (ja) ソーシャルネットワークを活用したクエリーの絞込みおよび提案
US7644075B2 (en) Keyword usage score based on frequency impulse and frequency weight
US10997184B2 (en) System and method for ranking search results
US9317533B2 (en) Adaptive image retrieval database
US20070250500A1 (en) Multi-directional and auto-adaptive relevance and search system and methods thereof
US20130054566A1 (en) Acceleration of ranking algorithms using a graphics processing unit
Brancotte et al. Rank aggregation with ties: Experiments and analysis
US20120158740A1 (en) Caching web documents in two or more caches
US8527564B2 (en) Image object retrieval based on aggregation of visual annotations
Sayed et al. Jointly modeling relevance and sensitivity for search among sensitive content
US20090125503A1 (en) Web page categorization using graph-based term selection
US20190243914A1 (en) Parallel query processing in a distributed analytics architecture
US20110264639A1 (en) Learning diverse rankings over document collections
US20200042506A1 (en) Method and component for classifying resources of a database
US10394826B1 (en) System and methods for searching query data
US9483560B2 (en) Data analysis control
Bansal et al. Ad-hoc aggregations of ranked lists in the presence of hierarchies
CN109213830A (zh) 专业性技术文档的文档检索系统
EP3065102A1 (en) Search engine optimization for category web pages
Zhu et al. Process matching: A structural approach for business process search

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130514

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130712

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130918

R150 Certificate of patent or registration of utility model

Ref document number: 5372955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250