JP4838529B2 - 検索語提案のためのマルチ型データオブジェクトの強化されたクラスタリング - Google Patents
検索語提案のためのマルチ型データオブジェクトの強化されたクラスタリング Download PDFInfo
- Publication number
- JP4838529B2 JP4838529B2 JP2005118052A JP2005118052A JP4838529B2 JP 4838529 B2 JP4838529 B2 JP 4838529B2 JP 2005118052 A JP2005118052 A JP 2005118052A JP 2005118052 A JP2005118052 A JP 2005118052A JP 4838529 B2 JP4838529 B2 JP 4838529B2
- Authority
- JP
- Japan
- Prior art keywords
- clustering
- objects
- type
- type data
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、相互に関係のある異質のオブジェクトデータ型の例示的フレームワーク100を示す。フレームワーク100は、異質のデータオブジェクト/ノードの複数のレイヤ102、ならびに結びつけられたレイヤ間およびレイヤ内データオブジェクトリンク/関係を含む。各レイヤ102−1ないし102−Nは、同一型(均質の)データオブジェクトまたはノードのそれぞれの集合を含む。すなわち、ノード集合Pは、同一データ型のおのおのである1つまたは複数のデータオブジェクトp1ないしpjを含み、ノード集合Uは、同一データ型のおのおのである1つまたは複数のデータオブジェクトu1ないしukを含み、以下同様である。このため、異なるそれぞれのレイヤ102にあるデータオブジェクトの型は、お互いに関して異質である。
・レイヤ102−1は、(複数の)検索クエリデータオブジェクト/(複数の)ノードp1ないしpjを含むマイニングされた(mined)検索クエリである。検索クエリオブジェクトは、(複数の)クエリの語を含み、以下に説明するとおり、クエリログからマイニングされた複数の履歴クエリのそれぞれのクエリを表す。
・レイヤ102−2は、(複数の)Webページデータオブジェクト/(複数の)ノードu1ないしukを含むマイニングされたWebページレイヤである。
・レイヤ102−3は、マイニングされたユーザレイヤであり、(複数の)ユーザ情報オブジェクト/複数のノードw1ないしwmを含む。
・レイヤ102−Nは、それぞれの異なるオブジェクト型x1ないしxoを備えるレイヤ102はあらゆる個数が可能であることの例示を示す。
必要ではないが、本発明は、パーソナルコンピュータによって実行されるコンピュータ実行可能命令(プログラムモジュール)の一般的な文脈で説明する。プログラムモジュールには、一般に、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。本システムおよび方法を上述の文脈で説明するが、以下に説明する動作および操作は、ハードウェアに実装することもできる。
STSモジュール212は、本実装において、検索語提案である、手近なタスクと相互に関係があると決定された複数のマルチ型データオブジェクト(MDO)214をマイニングする。そのような複数のマルチ型データオブジェクト214には、複数の履歴クエリ216のそれぞれのクエリを検索エンジンに送信することによって獲得された検索結果からマイニングされた意味論的文脈(例えば、テキスト、URL、結果タイトル、および各結果の短い説明など)でSTSモジュール212によって高められ、マイニングされた複数の履歴検索クエリ216の(複数の)語、および特定の履歴検索クエリに応答してユーザによって選択されたWebページの集合、ユーザに固有の情報(例えば、ユーザのWebサイトアクセス情報、検索クエリを生成するのに使用されたマシンのIPアドレスなど)、および/または関係のあるマルチ型データオブジェクトの型などの「他のMDO」218を含む。
wij=TFijxlog(N/DFj)
ただし、TFijは、語の頻度(第i番のレコード内のキーワードjの出現回数)を表し、Nは、クエリの語の総数であり、DFjは、キーワードjを含むレコードの数である。
dist(qj,qk)=1−sim(qj,qk)
このような類似測度を、「他のデータ」226のそれぞれの部分として示す。例示的なこのような類似度値を、以下に説明する表1の例示的な提案される語のリスト210の中で示す。
Webサイトの検索エンジン結果を最適化するために実質的に最も関係のある語の集合(検索語提案)を識別するため、STSモジュール212は、複数の履歴クエリ216とは異なる/異質のマルチ型データオブジェクト214をマイニングする。説明の目的のために、これらのマイニングされる複数のオブジェクトを「他のMDO」218と表す。所定の実装において、「他のMDO」218には、例えば、エンドユーザが選択したWebページおよび/またはユーザ固有の情報が含まれ、ただし、ユーザは、履歴クエリ216を検索エンジン228に送信することに関連するユーザである。STSモジュール212は、クエリログ220から、エンドユーザが選択したWebページを抽出する。エンドユーザが選択したWebページは、希薄であることも、そうでないことも可能であり、希薄は平均すると、例えば、履歴クエリ216当たり2から3のWebページになる。STSモジュール212は、(複数の)クエリログ220または他のデータソースからユーザ固有の情報を抽出する。ユーザ固有の情報には、例えば、複数の履歴クエリ216のそれぞれのクエリを送信するのに使用されたマシンのIP(インターネットプロトコル)アドレス、GUID、および/またはWebサイトアクセス情報(例えば、マイクロソフト社のドットネットパスポートの情報)が含まれる。
STSモジュール212は、クラスタリング分析のためにマルチ型の相互に関係のあるデータオブジェクト(MDO214)間の関係を十分に詮索する。複数のマルチ型データオブジェクト214には、n個の異なる型のオブジェクト、X1、X2、...、Xn(例えば、複数の履歴クエリ216および「他のMDO」218)が含まれる。各型のデータオブジェクトXiは、特徴集合Fiで記述される。同一型内の複数のデータオブジェクトは、型内関係、Ri⊆Xi×Xiで相互に関係がある。2つの異なる型からのデータオブジェクトは、型間関係、Rij⊆Xi×Xjを介して関係がある。これらの関係と区別するため、Fiを、データオブジェクトのコンテント特徴(content feature)と呼ぶ。特定のオブジェクトx∈Xiに関して、x.Fiを使用してそのオブジェクトのコンテント特徴を表し、x.Ri⊆Xiおよびx.Rij⊆Xjを使用して、それぞれXiおよびXjの中でそのオブジェクトに関係のあるオブジェクトを表す。マルチ型の相互に関係のあるデータオブジェクトをクラスタリングすることの問題は、各型の複数のオブジェクトXiをKi個のクラスタに分けて、各クラスタ内のデータオブジェクトが高い類似度を有し、異なるクラスタからのオブジェクトが似ていないようにすることである。
S=α・sf+β・sintra+γ・sinter (1)
ただし、sfは、コンテンツ類似度であり、sintraおよびsinterはそれぞれ、型内類似度および型間類似度であり、α、β、およびγは、異なる類似度に対する重みであり、α+β+γ=1である。
・コンテントに関係のある情報、例えば、履歴クエリ216内のリンク、およびユーザが選択した(クリックスルーされた(clicked−thru))Webページに対応するリンク
・例えば、履歴クエリ216内のリンク、およびユーザ固有の情報により決定された、関連するトピックに対するユーザの関心
・例えば、ユーザ固有の情報と選択されたWebページの間のリンクを介して決定された、選択されたWebページに対するユーザの関心
所定の実装において、識別にされたレイヤ内リンク/関係(同一のデータ型のオブジェクト間の関係)は、例えば、以下の1つまたは複数を表す。すなわち、
・以下により詳細に説明する、クエリ内のリンク
・ユーザが選択したWebページ内の内向き/外向きの(directed in/out)ハイパーリンクで示される、推奨される(複数の)Webページ
・例えば、それぞれのユーザの間で識別された関係/リンクで示される人間関係。所定の実装において、この型の関係情報は、ユーザプロファイルの計算された類似度からマイニングされる。ユーザプロファイルには、例えば、人口統計、地理的位置、(複数の)関心などが含まれる。所定の実装において、ユーザプロファイルは、それぞれのユーザが供給するWebサイトアクセス情報を介してアクセスされる。
一部のデータオブジェクトおよびアプリケーションに関して、同一型内の複数のマルチ型データオブジェクト214は、クラスタリングプロセスにおいて異なる重要度を有する可能性がある。通常の実施例には、若干のWebページが権威のあるページであるため、より重要である場合のWebページ/ユーザクラスタリング、および一部のユーザが、アイテムのふさわしさ(belongingness)を決定する際により権威を有するべき場合の、共同フィルタリングなどのためのアイテム/ユーザクラスタリングが含まれる。オブジェクトをノード見なし、オブジェクト間の(複数の)関係をリンクと見なした場合、HITSアルゴリズムなどの従来のリンク分析方法を使用することにより、各データオブジェクトの固有値を計算する。しかし、複数の型のデータオブジェクトが関係する場合、この方法は、異なる型のオブジェクトの重要度が比較できないため、うまく作用しない。
エンドユーザ(例えば、広告主、Webサイト主催者など)から(複数の)語208を受け取ったことに応答して、STSモジュール212は、(複数の)語208を複数の強化された語のクラスタ236の中の語/句のそれぞれの語/句と比較する。複数の強化された語のクラスタ236は、Webページおよびユーザとの語の相互関係に由来する、文脈上で互いに関係するだけでなく、意味上でも互いに関係する複数の語を含むので、(複数の)語208は、複数の関係のある履歴上の文脈、すなわち「意味」の観点から評価される。
高いFOO(出現頻度)のクエリの語222から生成され、強化された語の複数のクラスタ236が、エンドユーザが入力した(複数の)語208と同一の語を含まない場合、STSモジュール212により、高いFOO(出現頻度)のクエリログの語222から生成され、強化された語の複数のクラスタ236から、訓練された分類子238を生成する。強化された語の複数のクラスタ236の中の語は、分類操作に適切なベクトル空間モデルの中で対応するキーワードベクトルを既に有する。さらに、ストップワードの削除および単語のステミング(stemming)(接尾辞削除)により、(複数のクラスタ236が基づく)語のベクトル234の次元が縮小される。所定の実装において、さらなる次元縮小技術、例えば、特徴選択またはパラメータ変更(re−parameterization)を使用することができる。
提案される語のリスト210は、例えば、(複数の)語208に関係があると決定された語、それぞれの(複数の)語と(複数の)語208との類似測度(信頼度値)、およびそれぞれの(複数の)語のFOO(出現頻度)、すなわち、履歴クエリログ内の頻度を含む。関係のある(複数の)語を識別する、類似測度を生成する、およびFOO値を生成するための技術は、上述した。
図3は、検索語提案のためにマルチ型データオブジェクトの強化されたクラスタリングを行うための例示的処理手順300を示す。説明の目的のために、処理手順の操作は、図2の特徴に関連して説明する。(すべての参照符号は、構成要素が最初に導入される図面の番号で始める)。ブロック302では、STS(検索語提案)モジュール212(図2)により、クエリログ220から履歴クエリの語216を収集する。STSモジュール212により、出現頻度の相関的要素として履歴クエリ216を構成する。ブロック304では、STSモジュール212により、高い出現頻度のクエリの語222を検索エンジン228に送信し、対応する検索結果230を受け取る。ブロック306では、STSモジュール212により、おのおのの(複数の)検索結果230からスニペット(snippet)記述を抽出し、そのスニペット記述(抽出された特徴232)を一緒にマージすることにより、複数のMDOベクトル234に基づく語を形成する。それぞれの高い出現頻度のクエリの語222のおのおのに関して、それぞれの語のベクトルが生成される。
図8は、検索語提案のためにマルチ型データオブジェクトの強化されたクラスタリングを行うための、図2におけるシステム200、および図3から図6の方法を完全に、または部分的に実装することができる適切なコンピュータ処理環境800の例を例示する。例示的コンピュータ処理環境800は、適切なコンピュータ処理環境の一例に過ぎず、本明細書で説明するシステムおよび方法の用法または機能の範囲について何ら限定を示唆することを意図するものではない。また、コンピュータ処理環境800は、コンピュータ処理環境800に例示したコンポーネントのいずれの1つ、または組み合わせに関連する依存関係または要件も有するものと解釈してはならない。
検索語提案のためにマルチ型データオブジェクトの強化されたクラスタリングを行うためのシステムおよび方法を、構造上の特徴、および/または方法上の操作もしくは動作に特有の言い回しで説明してきたが、添付の特許請求の範囲において定義する実装は、説明した特定の特徴または動作に必ずしも限定されないことを理解されたい。例えば、マルチ型データオブジェクトの強化されたクラスタリングを、検索語提案のアプリケーションに関して説明したが、マルチ型データオブジェクトの強化されたクラスタリングは、クラスタリングを利用する他の多くの型のアプリケーションにも適用することができる。したがって、特定の特徴および動作を、請求の対象を実装するための例示的形態として開示する。
Claims (22)
- コンピューティングデバイスにより実行される方法であって、
第1の型の少なくとも1つのオブジェクト、および前記第1の型とは異なる第2の型の少なくとも1つのオブジェクトを含むマルチ型データオブジェクトの間の関係を処理ユニットが決定するステップであって、前記関係は、前記マルチ型データオブジェクトの間のレイヤ内関係か、レイヤ間関係かのうち少なくとも1である、ステップと、
前記関係に基づいて前記マルチ型データオブジェクトを繰り返しクラスタリングして強化されたクラスタを前記処理ユニットが生成するステップと、
ユーザから送信される語に関係のある、提案される検索語のリストを、前記強化されたクラスタを利用して前記処理ユニットが生成するステップであって、前記検索語は、前記ユーザから送信される語の受信に応答して生成される、ステップと、
ネットワークインターフェースを介して、前記提案される検索語のリストをユーザへ前記処理ユニットが送信するステップと、
次の
を備えたことを特徴とする方法。 - 前記レイヤ間関係は、コンテントに関係のある情報、関連トピックに対するユーザの関心、および関連Webページに対するユーザの関心のうち少なくとも1つを含むことを特徴とする請求項1に記載の方法。
- 前記レイヤ内関係は、クエリ改良、推奨されるWebページ、およびそれぞれのユーザの間の関係のうち少なくとも1つを含むことを特徴とする請求項1に記載の方法。
- 前記マルチ型データオブジェクトの各々は、選択されたWebページ型およびユーザ情報型のうち少なくとも1つに関係のあることを特徴とする請求項1に記載の方法。
- 前記レイヤ内関係は、前記マルチ型データオブジェクトの関連付けるオブジェクトに対する重要度を示すための第1の重み付けの仕組み、および前記第1の重み付けの仕組みとは異なる第2の重み付けの仕組みを含むことを特徴とする請求項1に記載の方法。
- 前記識別するステップおよび繰り返しクラスタリングするステップは、検索語提案のために実行されることを特徴とする請求項1に記載の方法。
- 前記繰り返しクラスタリングするステップは、第1の反復のクラスタリング結果を前記マルチ型データオブジェクトのすべての関係のあるデータオブジェクトに前記処理ユニットが伝播させるステップを含み、前記関係のあるデータオブジェクトの少なくとも2つは異質のデータの型であり、前記クラスタリング結果により形成される特徴空間は、強化されたクラスタリング操作の第2の反復において前記マルチ型データオブジェクトのそれぞれのオブジェクトのクラスタリングを高めるために使用されることを特徴とする請求項1に記載の方法。
- 前記繰り返しクラスタリングするステップは、前記マルチ型データオブジェクトの個々のオブジェクトの間の類似度を前記処理ユニットが決定するステップを含み、前記類似度はオブジェクト間およびオブジェクト内のコンテンツの類似度、ならびに前記識別された関係の少なくとも1つの間の類似度の少なくとも1つの関数であることを特徴とする請求項1に記載の方法。
- 前記繰り返しクラスタリングするステップは、前記マルチ型データオブジェクトの関係のあるオブジェクトをマージして、前記関係のあるオブジェクトの特徴空間の次元を前記処理ユニットが縮小するステップを含むことを特徴とする請求項1に記載の方法。
- オブジェクト型内および異なるオブジェクト型の間の前記マルチ型データオブジェクトの個々のオブジェクト重要度の相互強化を前記処理ユニットが行うステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記送信される語と前記強化されたクラスタの中のオブジェクトの特徴空間とを比較して、前記提案される検索語を前記処理ユニットが識別するステップ
をさらに備えたことを特徴とする請求項1に記載の方法。 - コンピュータに、
第1の型の少なくとも1つのオブジェクト、および前記第1の型とは異なる第2の型の少なくとも1つのオブジェクトを含む、マルチ型データオブジェクトの間のレイヤ内およびレイヤ間関係の少なくとも1つを決定する手順と、
前記少なくとも1つの関係によって前記マルチ型データオブジェクトを繰り返しクラスタリングすることにより強化されたクラスタ群を生成する手順と、
ユーザから送信される語に関係のある、提案される検索語のリストを、前記強化されたクラスタ群を利用して生成する手順であって、前記提案される検索語は、前記ユーザから送信される語の受信に応答して生成される、手順と、
次の
を実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。 - 前記レイヤ間関係は、コンテントに関係のある情報、関連トピックに対するユーザの関心、および関連Webページに対するユーザの関心のうち1つを含むことを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記レイヤ内関係は、クエリ改良、推奨されるWebページ、およびそれぞれのユーザの間の関係のうち少なくとも1つを含むことを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記マルチ型データオブジェクトのそれぞれは、検索クエリデータオブジェクト型、選択されたWebページ型、およびユーザ情報型のうち少なくとも1つに関係のあることを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記決定された関係のうち少なくとも1つに重みを付けることによって、前記マルチ型データオブジェクトの関連するオブジェクトに対する重要度を示すことを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記識別する手順および繰り返しクラスタリングする手順は、検索語提案のために実行されることを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記繰り返しクラスタリングする手順は、第1の反復のクラスタリング結果を前記マルチ型データオブジェクトのすべての関係のあるデータオブジェクトに伝播させる手順を含み、前記関係のあるデータオブジェクトの少なくとも2つは異質のデータの型であり、前記クラスタリング結果により形成される特徴空間は、強化されたクラスタリング操作の第2の反復において前記マルチ型データオブジェクトのそれぞれのオブジェクトのクラスタリングを高めるために使用されることを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記繰り返しクラスタリングする手順は、前記マルチ型データオブジェクトの個々のオブジェクトの間の類似度を決定する手順を含み、前記類似度は、オブジェクトコンテンツの類似度および前記識別された関係の少なくとも1つの間の類似度の少なくとも1つの関数であることを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記繰り返しクラスタリングする手順は、前記マルチ型データオブジェクトの関係のあるオブジェクトをマージすることによって前記関係のあるオブジェクトの特徴空間の次元を縮小する手順を含むことを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記コンピュータに、オブジェクト型内および異なるオブジェクト型の間で前記マルチ型データオブジェクトの個々のオブジェクトの重要度の相互強化を行う手順をさらに実行させることを特徴とする請求項12に記載のコンピュータ読取可能な記録媒体。
- 前記コンピュータに、前記送信される語と前記強化されたクラスタの中のオブジェクトの特徴空間とを比較して、前記提案される検索語を識別する手順を実行させることを特徴とする請求項12に記載のコンピュータ読取可能な媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/826,159 US7689585B2 (en) | 2004-04-15 | 2004-04-15 | Reinforced clustering of multi-type data objects for search term suggestion |
US10/826,159 | 2004-04-15 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005302043A JP2005302043A (ja) | 2005-10-27 |
JP2005302043A5 JP2005302043A5 (ja) | 2008-05-29 |
JP4838529B2 true JP4838529B2 (ja) | 2011-12-14 |
Family
ID=34939301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005118052A Expired - Fee Related JP4838529B2 (ja) | 2004-04-15 | 2005-04-15 | 検索語提案のためのマルチ型データオブジェクトの強化されたクラスタリング |
Country Status (5)
Country | Link |
---|---|
US (1) | US7689585B2 (ja) |
EP (1) | EP1587012A3 (ja) |
JP (1) | JP4838529B2 (ja) |
KR (1) | KR101043523B1 (ja) |
CN (1) | CN100465954C (ja) |
Families Citing this family (134)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7921068B2 (en) * | 1998-05-01 | 2011-04-05 | Health Discovery Corporation | Data mining platform for knowledge discovery from heterogeneous data types and/or heterogeneous data sources |
US8275673B1 (en) | 2002-04-17 | 2012-09-25 | Ebay Inc. | Method and system to recommend further items to a user of a network-based transaction facility upon unsuccessful transacting with respect to an item |
US7831476B2 (en) | 2002-10-21 | 2010-11-09 | Ebay Inc. | Listing recommendation in a network-based commerce system |
US7836076B2 (en) * | 2004-08-20 | 2010-11-16 | Hewlett-Packard Development Company, L.P. | Distributing content indices |
US8065316B1 (en) * | 2004-09-30 | 2011-11-22 | Google Inc. | Systems and methods for providing search query refinements |
KR100669971B1 (ko) * | 2004-11-24 | 2007-01-16 | 엔에이치엔(주) | 검색 서비스 제공 방법 및 상기 방법을 수행하는 검색시스템 |
US20060122976A1 (en) * | 2004-12-03 | 2006-06-08 | Shumeet Baluja | Predictive information retrieval |
US20060179026A1 (en) | 2005-02-04 | 2006-08-10 | Bechtel Michael E | Knowledge discovery tool extraction and integration |
US20060179069A1 (en) * | 2005-02-04 | 2006-08-10 | Bechtel Michael E | Knowledge discovery tool navigation |
WO2006088780A2 (en) | 2005-02-12 | 2006-08-24 | Teresis Media Management, Inc. | Methods and apparatuses for assisting the production of media works and the like |
US9092523B2 (en) | 2005-02-28 | 2015-07-28 | Search Engine Technologies, Llc | Methods of and systems for searching by incorporating user-entered information |
KR101374651B1 (ko) * | 2005-03-18 | 2014-03-17 | 써치 엔진 테크놀로지스, 엘엘씨 | 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진 |
US8438142B2 (en) | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
US8200687B2 (en) | 2005-06-20 | 2012-06-12 | Ebay Inc. | System to generate related search queries |
US7529744B1 (en) * | 2005-06-30 | 2009-05-05 | Symantec Corporation | Search interface server and storage management |
US9715542B2 (en) * | 2005-08-03 | 2017-07-25 | Search Engine Technologies, Llc | Systems for and methods of finding relevant documents by analyzing tags |
US7801893B2 (en) * | 2005-09-30 | 2010-09-21 | Iac Search & Media, Inc. | Similarity detection and clustering of images |
US8019752B2 (en) * | 2005-11-10 | 2011-09-13 | Endeca Technologies, Inc. | System and method for information retrieval from object collections with complex interrelationships |
US7788131B2 (en) * | 2005-12-15 | 2010-08-31 | Microsoft Corporation | Advertising keyword cross-selling |
US7814040B1 (en) * | 2006-01-31 | 2010-10-12 | The Research Foundation Of State University Of New York | System and method for image annotation and multi-modal image retrieval using probabilistic semantic models |
CN101460942A (zh) * | 2006-03-31 | 2009-06-17 | 依玛奇灵控股有限公司 | 使用感情偏好进行电脑化搜索及匹配的方法及系统 |
US7610255B2 (en) * | 2006-03-31 | 2009-10-27 | Imagini Holdings Limited | Method and system for computerized searching and matching multimedia objects using emotional preference |
US20080033918A1 (en) * | 2006-08-02 | 2008-02-07 | Wilson Jeffrey L | Systems, methods and computer program products for supplemental data communication and utilization |
US8301704B2 (en) * | 2006-09-20 | 2012-10-30 | Facebook, Inc. | Electronic message system recipient recommender |
US7996456B2 (en) * | 2006-09-20 | 2011-08-09 | John Nicholas and Kristin Gross Trust | Document distribution recommender system and method |
US20080071774A1 (en) * | 2006-09-20 | 2008-03-20 | John Nicholas Gross | Web Page Link Recommender |
KR100828560B1 (ko) | 2006-09-22 | 2008-05-13 | 엔에이치엔(주) | 검색 대상과 연관된 단어를 추천하는 방법 및 상기 방법을수행하는 시스템 |
US7783640B2 (en) * | 2006-11-03 | 2010-08-24 | Oracle International Corp. | Document summarization |
US8037051B2 (en) * | 2006-11-08 | 2011-10-11 | Intertrust Technologies Corporation | Matching and recommending relevant videos and media to individual search engine results |
US7926026B2 (en) * | 2006-12-20 | 2011-04-12 | Sap Ag | Graphical analysis to detect process object anomalies |
US7739247B2 (en) * | 2006-12-28 | 2010-06-15 | Ebay Inc. | Multi-pass data organization and automatic naming |
US7849104B2 (en) * | 2007-03-01 | 2010-12-07 | Microsoft Corporation | Searching heterogeneous interrelated entities |
CN101266603B (zh) * | 2007-03-12 | 2010-09-08 | 北京搜狗科技发展有限公司 | 一种网页信息分类方法、系统及应用该分类的服务系统 |
CN101276361B (zh) * | 2007-03-28 | 2010-09-15 | 阿里巴巴集团控股有限公司 | 一种显示相关关键词的方法及系统 |
US20080250008A1 (en) * | 2007-04-04 | 2008-10-09 | Microsoft Corporation | Query Specialization |
US7752201B2 (en) * | 2007-05-10 | 2010-07-06 | Microsoft Corporation | Recommendation of related electronic assets based on user search behavior |
US8037042B2 (en) * | 2007-05-10 | 2011-10-11 | Microsoft Corporation | Automated analysis of user search behavior |
WO2009038822A2 (en) * | 2007-05-25 | 2009-03-26 | The Research Foundation Of State University Of New York | Spectral clustering for multi-type relational data |
US8051040B2 (en) | 2007-06-08 | 2011-11-01 | Ebay Inc. | Electronic publication system |
US20090037440A1 (en) * | 2007-07-30 | 2009-02-05 | Stefan Will | Streaming Hierarchical Clustering |
US8171035B2 (en) | 2007-10-22 | 2012-05-01 | Samsung Electronics Co., Ltd. | Situation-aware recommendation using correlation |
US8166052B2 (en) * | 2007-10-22 | 2012-04-24 | Samsung Electronics Co., Ltd. | Situation recognition for recommendation using merge-split approach |
US8019782B2 (en) * | 2007-10-22 | 2011-09-13 | Samsung Electronics Co., Ltd. | Situation-aware recommendation using limited cluster sizes |
US8019748B1 (en) | 2007-11-14 | 2011-09-13 | Google Inc. | Web search refinement |
US7962507B2 (en) | 2007-11-19 | 2011-06-14 | Microsoft Corporation | Web content mining of pair-based data |
US20100332485A1 (en) * | 2007-11-30 | 2010-12-30 | Nokia Corporation | Ordering of data items |
US20090171929A1 (en) * | 2007-12-26 | 2009-07-02 | Microsoft Corporation | Toward optimized query suggeston: user interfaces and algorithms |
JP2009176072A (ja) * | 2008-01-24 | 2009-08-06 | Nec Corp | 要素集団抽出システム、要素集団抽出方法およびプログラム |
US10269024B2 (en) * | 2008-02-08 | 2019-04-23 | Outbrain Inc. | Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content |
JP5351182B2 (ja) | 2008-02-25 | 2013-11-27 | アティジオ リミテッド ライアビリティ カンパニー | 関心領域についての関連情報の決定 |
US20090240498A1 (en) * | 2008-03-19 | 2009-09-24 | Microsoft Corporation | Similiarity measures for short segments of text |
US20090248669A1 (en) * | 2008-04-01 | 2009-10-01 | Nitin Mangesh Shetti | Method and system for organizing information |
US8112431B2 (en) * | 2008-04-03 | 2012-02-07 | Ebay Inc. | Method and system for processing search requests |
US20120053990A1 (en) * | 2008-05-07 | 2012-03-01 | Nice Systems Ltd. | System and method for predicting customer churn |
US8082278B2 (en) * | 2008-06-13 | 2011-12-20 | Microsoft Corporation | Generating query suggestions from semantic relationships in content |
US20100010982A1 (en) * | 2008-07-09 | 2010-01-14 | Broder Andrei Z | Web content characterization based on semantic folksonomies associated with user generated content |
US20100058202A1 (en) * | 2008-08-28 | 2010-03-04 | Mohamed Rostom | Method system and program product for providing enabling an interactive and social search engine |
US8548797B2 (en) * | 2008-10-30 | 2013-10-01 | Yahoo! Inc. | Short text language detection using geographic information |
KR101026544B1 (ko) * | 2009-05-14 | 2011-04-01 | 주식회사 모임 | 인공지능에 기반한 랭킹 분석 방법, 이를 기록한 기록 매체, 그 장치 |
US8103650B1 (en) * | 2009-06-29 | 2012-01-24 | Adchemy, Inc. | Generating targeted paid search campaigns |
US8341157B2 (en) * | 2009-07-31 | 2012-12-25 | Yahoo! Inc. | System and method for intent-driven search result presentation |
WO2011014979A1 (en) * | 2009-08-04 | 2011-02-10 | Google Inc. | Query suggestions from documents |
US20110040604A1 (en) * | 2009-08-13 | 2011-02-17 | Vertical Acuity, Inc. | Systems and Methods for Providing Targeted Content |
KR101594577B1 (ko) * | 2009-11-19 | 2016-02-16 | 삼성전자주식회사 | 클러스터 질의를 이용한 데이터 스트림 처리 장치 및 방법 |
US20110161091A1 (en) * | 2009-12-24 | 2011-06-30 | Vertical Acuity, Inc. | Systems and Methods for Connecting Entities Through Content |
JP5526900B2 (ja) * | 2010-03-19 | 2014-06-18 | 富士通株式会社 | 管理装置、修正候補出力方法および修正候補出力プログラム |
JP5339491B2 (ja) * | 2010-03-31 | 2013-11-13 | 楽天株式会社 | 検索システム、検索方法、検索プログラム及び記録媒体 |
US20110295897A1 (en) * | 2010-06-01 | 2011-12-01 | Microsoft Corporation | Query correction probability based on query-correction pairs |
US8650191B2 (en) | 2010-08-23 | 2014-02-11 | Vistaprint Schweiz Gmbh | Search engine optimization assistant |
USD709901S1 (en) | 2011-05-31 | 2014-07-29 | Lifescan, Inc. | Display screen with computer icon for blood glucose monitoring |
KR101274419B1 (ko) | 2010-12-30 | 2013-06-17 | 엔에이치엔(주) | 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법 |
CN102646103B (zh) * | 2011-02-18 | 2016-03-16 | 腾讯科技(深圳)有限公司 | 检索词的聚类方法和装置 |
US9026591B2 (en) | 2011-02-28 | 2015-05-05 | Avaya Inc. | System and method for advanced communication thread analysis |
US20140223575A1 (en) * | 2011-04-25 | 2014-08-07 | Alcatel Lucent | Privacy protection in recommendation services |
GB201107251D0 (en) * | 2011-05-03 | 2011-06-15 | Univ Dublin | Netowrk analysis tool |
US20120310690A1 (en) * | 2011-06-06 | 2012-12-06 | Winshuttle, Llc | Erp transaction recording to tables system and method |
US20120323627A1 (en) * | 2011-06-14 | 2012-12-20 | Microsoft Corporation | Real-time Monitoring of Public Sentiment |
US8990208B2 (en) * | 2011-09-22 | 2015-03-24 | Fujitsu Limited | Information management and networking |
US8930393B1 (en) * | 2011-10-05 | 2015-01-06 | Google Inc. | Referent based search suggestions |
US20130166337A1 (en) * | 2011-12-26 | 2013-06-27 | John MacGregor | Analyzing visual representation of data |
US9785704B2 (en) * | 2012-01-04 | 2017-10-10 | Microsoft Technology Licensing, Llc | Extracting query dimensions from search results |
US10438268B2 (en) | 2012-02-09 | 2019-10-08 | Microsoft Technology Licensing, Llc | Recommender system |
US9330082B2 (en) | 2012-02-14 | 2016-05-03 | Facebook, Inc. | User experience with customized user dictionary |
US9235565B2 (en) | 2012-02-14 | 2016-01-12 | Facebook, Inc. | Blending customized user dictionaries |
US20130211915A1 (en) * | 2012-02-14 | 2013-08-15 | Erick Tseng | Advertising Based on Customized User Dictionary |
US9330083B2 (en) | 2012-02-14 | 2016-05-03 | Facebook, Inc. | Creating customized user dictionary |
US10331745B2 (en) * | 2012-03-31 | 2019-06-25 | Intel Corporation | Dynamic search service |
US20140019460A1 (en) * | 2012-07-12 | 2014-01-16 | Yahoo! Inc. | Targeted search suggestions |
US8756241B1 (en) * | 2012-08-06 | 2014-06-17 | Google Inc. | Determining rewrite similarity scores |
JP5928248B2 (ja) * | 2012-08-27 | 2016-06-01 | 富士通株式会社 | 評価方法、情報処理装置およびプログラム |
US20140067368A1 (en) * | 2012-08-29 | 2014-03-06 | Microsoft Corporation | Determining synonym-antonym polarity in term vectors |
US8977622B1 (en) * | 2012-09-17 | 2015-03-10 | Amazon Technologies, Inc. | Evaluation of nodes |
US9020962B2 (en) * | 2012-10-11 | 2015-04-28 | Wal-Mart Stores, Inc. | Interest expansion using a taxonomy |
US9449095B1 (en) * | 2012-12-31 | 2016-09-20 | Google Inc. | Revising search queries |
US9218420B1 (en) * | 2013-02-26 | 2015-12-22 | Google Inc. | Detecting new businesses with unrecognized query terms |
US10496649B1 (en) | 2013-06-22 | 2019-12-03 | Google Llc | Personalized suggestions based on past queries |
CN104699725B (zh) * | 2013-12-10 | 2018-10-09 | 阿里巴巴集团控股有限公司 | 数据搜索处理方法及系统 |
US10296616B2 (en) | 2014-07-31 | 2019-05-21 | Splunk Inc. | Generation of a search query to approximate replication of a cluster of events |
US20160078352A1 (en) * | 2014-09-11 | 2016-03-17 | Paul Pallath | Automated generation of insights for events of interest |
US11755559B1 (en) | 2014-10-09 | 2023-09-12 | Splunk Inc. | Automatic entity control in a machine data driven service monitoring system |
US11200130B2 (en) * | 2015-09-18 | 2021-12-14 | Splunk Inc. | Automatic entity control in a machine data driven service monitoring system |
US9558244B2 (en) * | 2014-10-22 | 2017-01-31 | Conversable, Inc. | Systems and methods for social recommendations |
KR101645361B1 (ko) * | 2014-10-29 | 2016-08-03 | 김윤희 | 전화 번호 안내 이력에서 검색 실패된 키워드를 이용하는 전화 번호 안내 시스템 및 전화 번호 안내 방법 |
US20160171108A1 (en) * | 2014-12-12 | 2016-06-16 | Yahoo! Inc. | Method and system for indexing and providing suggestions |
US10003563B2 (en) | 2015-05-26 | 2018-06-19 | Facebook, Inc. | Integrated telephone applications on online social networks |
US10733247B2 (en) * | 2016-02-18 | 2020-08-04 | Adobe Inc. | Methods and systems for tag expansion by handling website object variations and automatic tag suggestions in dynamic tag management |
US10817519B2 (en) * | 2016-06-06 | 2020-10-27 | Baidu Usa Llc | Automatic conversion stage discovery |
US9645999B1 (en) * | 2016-08-02 | 2017-05-09 | Quid, Inc. | Adjustment of document relationship graphs |
US20170221010A1 (en) * | 2016-08-17 | 2017-08-03 | Stella.Ai, Inc. | System and method for data mining messaging systems to discover references to companies with job opportunities matching a candidate |
CN108073565A (zh) * | 2016-11-10 | 2018-05-25 | 株式会社Ntt都科摩 | 词语规范化的方法和设备及机器翻译方法和设备 |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10706107B2 (en) | 2017-05-30 | 2020-07-07 | Open Text Sa Ulc | Search systems and methods utilizing search based user clustering |
US10883345B2 (en) * | 2017-09-05 | 2021-01-05 | Nec Corporation | Processing of computer log messages for visualization and retrieval |
US11093518B1 (en) | 2017-09-23 | 2021-08-17 | Splunk Inc. | Information technology networked entity monitoring with dynamic metric and threshold selection |
US11159397B2 (en) | 2017-09-25 | 2021-10-26 | Splunk Inc. | Lower-tier application deployment for higher-tier system data monitoring |
US10635703B2 (en) * | 2017-10-19 | 2020-04-28 | International Business Machines Corporation | Data clustering |
US10769141B2 (en) | 2017-10-27 | 2020-09-08 | Microsoft Technology Licensing, Llc | Expanding search queries |
US10747793B2 (en) * | 2017-10-27 | 2020-08-18 | Microsoft Technology Licensing, Llc | Expanding search queries |
US10387473B2 (en) * | 2017-11-09 | 2019-08-20 | Accenture Global Solutions Limited | Real-time data input correction and facilitation of data entry at point of input |
WO2019147365A1 (en) * | 2018-01-24 | 2019-08-01 | Hrl Laboratories, Llc | Multiscale, hierarchical clustering on customer observables using persistent geometric features of co-occurrence simplicial complexes |
US11042896B1 (en) * | 2018-03-12 | 2021-06-22 | Inmar Clearing, Inc. | Content influencer scoring system and related methods |
US10872303B2 (en) | 2018-05-31 | 2020-12-22 | Microsoft Technology Licensing, Llc | Generating semantic representations for organizations and computing peer organization groups |
US11409910B2 (en) | 2018-05-31 | 2022-08-09 | Microsoft Technology Licensing, Llc | Predicting confidential data value insights at organization level using peer organization group |
CN108763536B (zh) * | 2018-05-31 | 2020-04-14 | 阿里巴巴集团控股有限公司 | 数据库访问方法及装置 |
RU2731658C2 (ru) | 2018-06-21 | 2020-09-07 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения |
JP6679683B2 (ja) * | 2018-09-20 | 2020-04-15 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
RU2733481C2 (ru) | 2018-12-13 | 2020-10-01 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система генерирования признака для ранжирования документа |
RU2744029C1 (ru) | 2018-12-29 | 2021-03-02 | Общество С Ограниченной Ответственностью "Яндекс" | Система и способ формирования обучающего набора для алгоритма машинного обучения |
CN110175113B (zh) * | 2019-04-18 | 2023-07-14 | 创新先进技术有限公司 | 业务场景确定方法和装置 |
US11100170B2 (en) * | 2019-11-15 | 2021-08-24 | Microsoft Technology Licensing, Llc | Domain-agnostic structured search query exploration |
KR102425770B1 (ko) * | 2020-04-13 | 2022-07-28 | 네이버 주식회사 | 급상승 검색어 제공 방법 및 시스템 |
CN112650907B (zh) * | 2020-12-25 | 2023-07-14 | 百度在线网络技术(北京)有限公司 | 搜索词的推荐方法、目标模型的训练方法、装置及设备 |
US11676072B1 (en) | 2021-01-29 | 2023-06-13 | Splunk Inc. | Interface for incorporating user feedback into training of clustering model |
US20230252032A1 (en) * | 2022-02-07 | 2023-08-10 | Maplebear Inc. (Dba Instacart) | Accounting for item attributes when selecting items satisfying a query based on item embeddings and an embedding for the query |
Family Cites Families (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03122770A (ja) | 1989-10-05 | 1991-05-24 | Ricoh Co Ltd | キーワード連想文書検索方法 |
US5224206A (en) | 1989-12-01 | 1993-06-29 | Digital Equipment Corporation | System and method for retrieving justifiably relevant cases from a case library |
US5488725A (en) | 1991-10-08 | 1996-01-30 | West Publishing Company | System of document representation retrieval by successive iterated probability sampling |
US5265065A (en) | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
US5442778A (en) * | 1991-11-12 | 1995-08-15 | Xerox Corporation | Scatter-gather: a cluster-based method and apparatus for browsing large document collections |
US5361628A (en) | 1993-08-02 | 1994-11-08 | Ford Motor Company | System and method for processing test measurements collected from an internal combustion engine for diagnostic purposes |
US7251637B1 (en) | 1993-09-20 | 2007-07-31 | Fair Isaac Corporation | Context vector generation and retrieval |
US5576954A (en) | 1993-11-05 | 1996-11-19 | University Of Central Florida | Process for determination of text relevancy |
US5794237A (en) | 1995-11-13 | 1998-08-11 | International Business Machines Corporation | System and method for improving problem source identification in computer systems employing relevance feedback and statistical source ranking |
US5812134A (en) * | 1996-03-28 | 1998-09-22 | Critical Thought, Inc. | User interface navigational system & method for interactive representation of information contained within a database |
US6188776B1 (en) | 1996-05-21 | 2001-02-13 | Interval Research Corporation | Principle component analysis of images for the automatic location of control points |
JP3108015B2 (ja) | 1996-05-22 | 2000-11-13 | 松下電器産業株式会社 | ハイパーテキスト検索装置 |
WO1997049048A1 (en) | 1996-06-17 | 1997-12-24 | Idd Enterprises, L.P. | Hypertext document retrieval system and method |
US6457004B1 (en) | 1997-07-03 | 2002-09-24 | Hitachi, Ltd. | Document retrieval assisting method, system and service using closely displayed areas for titles and topics |
US5987460A (en) | 1996-07-05 | 1999-11-16 | Hitachi, Ltd. | Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency |
GB9701866D0 (en) | 1997-01-30 | 1997-03-19 | British Telecomm | Information retrieval |
US5819258A (en) | 1997-03-07 | 1998-10-06 | Digital Equipment Corporation | Method and apparatus for automatically generating hierarchical categories from large document collections |
US6112202A (en) * | 1997-03-07 | 2000-08-29 | International Business Machines Corporation | Method and system for identifying authoritative information resources in an environment with content-based links between information resources |
US6298351B1 (en) | 1997-04-11 | 2001-10-02 | International Business Machines Corporation | Modifying an unreliable training set for supervised classification |
US6470307B1 (en) | 1997-06-23 | 2002-10-22 | National Research Council Of Canada | Method and apparatus for automatically identifying keywords within a document |
US5845278A (en) | 1997-09-12 | 1998-12-01 | Inioseek Corporation | Method for automatically selecting collections to search in full text searches |
US6003027A (en) | 1997-11-21 | 1999-12-14 | International Business Machines Corporation | System and method for determining confidence levels for the results of a categorization system |
US6421675B1 (en) | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine |
JPH11328724A (ja) | 1998-05-18 | 1999-11-30 | Fuji Photo Film Co Ltd | 3次元光メモリ |
US6006225A (en) | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6742003B2 (en) * | 2001-04-30 | 2004-05-25 | Microsoft Corporation | Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications |
US6189002B1 (en) | 1998-12-14 | 2001-02-13 | Dolphin Search | Process and system for retrieval of documents using context-relevant semantic profiles |
US6598054B2 (en) * | 1999-01-26 | 2003-07-22 | Xerox Corporation | System and method for clustering data objects in a collection |
US6226408B1 (en) | 1999-01-29 | 2001-05-01 | Hnc Software, Inc. | Unsupervised identification of nonlinear data cluster in multidimensional data |
US7225182B2 (en) | 1999-05-28 | 2007-05-29 | Overture Services, Inc. | Recommending search terms using collaborative filtering and web spidering |
US7065500B2 (en) * | 1999-05-28 | 2006-06-20 | Overture Services, Inc. | Automatic advertiser notification for a system for providing place and price protection in a search result list generated by a computer network search engine |
US6711585B1 (en) | 1999-06-15 | 2004-03-23 | Kanisa Inc. | System and method for implementing a knowledge management system |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6556983B1 (en) | 2000-01-12 | 2003-04-29 | Microsoft Corporation | Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space |
US6615209B1 (en) | 2000-02-22 | 2003-09-02 | Google, Inc. | Detecting query-specific duplicate documents |
US7539656B2 (en) | 2000-03-06 | 2009-05-26 | Consona Crm Inc. | System and method for providing an intelligent multi-step dialog with a user |
US6697998B1 (en) | 2000-06-12 | 2004-02-24 | International Business Machines Corporation | Automatic labeling of unlabeled text data |
DE10029644B4 (de) | 2000-06-16 | 2008-02-07 | Deutsche Telekom Ag | Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine |
US6578032B1 (en) | 2000-06-28 | 2003-06-10 | Microsoft Corporation | Method and system for performing phrase/word clustering and cluster merging |
US7490092B2 (en) | 2000-07-06 | 2009-02-10 | Streamsage, Inc. | Method and system for indexing and searching timed media information based upon relevance intervals |
US7027975B1 (en) | 2000-08-08 | 2006-04-11 | Object Services And Consulting, Inc. | Guided natural language interface system and method |
US6950829B2 (en) | 2000-08-23 | 2005-09-27 | General Electric Company | Method for database storing, accessing personnel to service selected assemblies of selected equipment |
US7587428B2 (en) | 2000-10-13 | 2009-09-08 | Microsoft Corporation | Maintaining a relationship between two different items of data |
US6560600B1 (en) | 2000-10-25 | 2003-05-06 | Alta Vista Company | Method and apparatus for ranking Web page search results |
US7305465B2 (en) | 2000-11-15 | 2007-12-04 | Robert Wing | Collecting appliance problem information over network and providing remote technical support to deliver appliance fix information to an end user |
US6772120B1 (en) | 2000-11-21 | 2004-08-03 | Hewlett-Packard Development Company, L.P. | Computer method and apparatus for segmenting text streams |
US7356530B2 (en) | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
JP2002215674A (ja) * | 2001-01-22 | 2002-08-02 | Kddi Corp | Webページ閲覧支援システム、方法及びプログラム |
EP1384155A4 (en) | 2001-03-01 | 2007-02-28 | Health Discovery Corp | SPECTRAL KNIVES FOR LEARNING MACHINES |
US6892193B2 (en) | 2001-05-10 | 2005-05-10 | International Business Machines Corporation | Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities |
US20030065632A1 (en) | 2001-05-30 | 2003-04-03 | Haci-Murat Hubey | Scalable, parallelizable, fuzzy logic, boolean algebra, and multiplicative neural network based classifier, datamining, association rule finder and visualization software tool |
US20030046389A1 (en) | 2001-09-04 | 2003-03-06 | Thieme Laura M. | Method for monitoring a web site's keyword visibility in search engines and directories and resulting traffic from such keyword visibility |
KR20030069640A (ko) * | 2002-02-22 | 2003-08-27 | 이의범 | 계층적 및 개념적 클러스터링에 의한 정보검색 시스템 및그 방법 |
JP2003316819A (ja) | 2002-04-22 | 2003-11-07 | Shinkichi Himeno | オブジェクト分類検索装置及びそれを実行するためのプログラム |
US7167871B2 (en) | 2002-05-17 | 2007-01-23 | Xerox Corporation | Systems and methods for authoritativeness grading, estimation and sorting of documents in large heterogeneous document collections |
JP3918664B2 (ja) | 2002-07-10 | 2007-05-23 | ヤマハ株式会社 | 音響信号処理装置 |
US7136876B1 (en) | 2003-03-03 | 2006-11-14 | Hewlett-Packard Development Company, L.P. | Method and system for building an abbreviation dictionary |
US7225176B2 (en) | 2003-03-26 | 2007-05-29 | Casebank Technologies Inc. | System and method for case-based reasoning |
US20040249808A1 (en) | 2003-06-06 | 2004-12-09 | Microsoft Corporation | Query expansion using query logs |
US20040255301A1 (en) * | 2003-06-13 | 2004-12-16 | Andrzej Turski | Context association schema for computer system architecture |
US7225184B2 (en) | 2003-07-18 | 2007-05-29 | Overture Services, Inc. | Disambiguation of search phrases using interpretation clusters |
US8086619B2 (en) * | 2003-09-05 | 2011-12-27 | Google Inc. | System and method for providing search query refinements |
US7165119B2 (en) | 2003-10-14 | 2007-01-16 | America Online, Inc. | Search enhancement system and method having rankings, explicitly specified by the user, based upon applicability and validity of search parameters in regard to a subject matter |
-
2004
- 2004-04-15 US US10/826,159 patent/US7689585B2/en not_active Expired - Fee Related
-
2005
- 2005-04-13 CN CNB200510078810XA patent/CN100465954C/zh not_active Expired - Fee Related
- 2005-04-15 KR KR1020050031597A patent/KR101043523B1/ko not_active IP Right Cessation
- 2005-04-15 JP JP2005118052A patent/JP4838529B2/ja not_active Expired - Fee Related
- 2005-04-15 EP EP05102987A patent/EP1587012A3/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CN1694101A (zh) | 2005-11-09 |
EP1587012A3 (en) | 2005-12-14 |
CN100465954C (zh) | 2009-03-04 |
KR20060045782A (ko) | 2006-05-17 |
EP1587012A2 (en) | 2005-10-19 |
US7689585B2 (en) | 2010-03-30 |
JP2005302043A (ja) | 2005-10-27 |
US20050234972A1 (en) | 2005-10-20 |
KR101043523B1 (ko) | 2011-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4838529B2 (ja) | 検索語提案のためのマルチ型データオブジェクトの強化されたクラスタリング | |
JP4726528B2 (ja) | マルチセンスクエリについての関連語提案 | |
KR101201037B1 (ko) | 키워드와 웹 사이트 콘텐츠 사이의 관련성 검증 | |
US11392778B2 (en) | Use of statistical flow data for machine translations between different languages | |
US7966305B2 (en) | Relevance-weighted navigation in information access, search and retrieval | |
JP4908214B2 (ja) | サーチクエリのリファインメントを提供するシステム及び方法。 | |
US7698317B2 (en) | Techniques for detecting duplicate web pages | |
KR101005510B1 (ko) | 블로그 문서의 순위 부여 | |
CN100433007C (zh) | 提供搜索结果的方法 | |
US20110125791A1 (en) | Query classification using search result tag ratios | |
Wang et al. | Mining subtopics from text fragments for a web query | |
Yu et al. | Towards high performance text mining: a TextRank-based method for automatic text summarization | |
CN115905489A (zh) | 一种提供招投标信息搜索服务的方法 | |
Song et al. | Transfer understanding from head queries to tail queries | |
Liang et al. | A hybrid recommender systems based on weighted tags | |
Veningston et al. | Semantic association ranking schemes for information retrieval applications using term association graph representation | |
Xu et al. | Generating personalized web search using semantic context | |
AU2021100441A4 (en) | A method of text mining in ranking of web pages using machine learning | |
Wang et al. | An effective content-based recommendation method for Web browsing based on keyword context matching | |
Castillo et al. | Query-log mining for detecting polysemy and spam | |
Gothankar et al. | A Novel Technique for Inferring User Search using Feedback Sessions | |
Ma et al. | Using multi-categorization semantic analysis and personalization for semantic search | |
Campos et al. | Clustering of Web Page Search Results: A Full Text Based Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080415 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080415 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110225 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110525 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110927 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110930 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141007 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |