JP2009532766A - ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬 - Google Patents
ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬 Download PDFInfo
- Publication number
- JP2009532766A JP2009532766A JP2009502850A JP2009502850A JP2009532766A JP 2009532766 A JP2009532766 A JP 2009532766A JP 2009502850 A JP2009502850 A JP 2009502850A JP 2009502850 A JP2009502850 A JP 2009502850A JP 2009532766 A JP2009532766 A JP 2009532766A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- term
- website
- computer
- implemented method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001902 propagating effect Effects 0.000 title description 12
- 238000000034 method Methods 0.000 claims description 78
- 238000012545 processing Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 4
- 230000000644 propagated effect Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 17
- 230000007246 mechanism Effects 0.000 description 13
- 230000009193 crawling Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 241000700605 Viruses Species 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 235000013550 pizza Nutrition 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【選択図】 図4
Description
本発明と一貫した実施形態は、上で図1を参照して説明したもののような例示的な環境100の中で使用されてもよく、または、例示的な環境100とともに使用されてもよい。例えば、このような実施形態は、上で図2を参照して説明したもののような例示的な検索エンジンの中で使用されてもよく、または、例示的な検索エンジンとともに使用されてもよい。本発明と一貫した実施形態が、他の環境の中で使用されてもよく、または、他の環境とともに使用されてもよいことは当然である。
図3は、本発明と一貫した実施形態で、実行してもよい動作と、このような動作によって、発生させてもよい、および/または、使用してもよい情報とのデータフロー図である。一般的に、線340より上の動作は事前に実行される一方で、線230より下の動作はリアルタイムで実行される。しかしながら、本発明と一貫した少なくともいくつかの実施形態では、このことは必須ではない。
図4は、本発明と一貫した方法で、ウェブサイト内情報を関係付ける例示的な方法400のフロー図である。ウェブサイト情報(例えば、ウェブページ、ウェブページコンテンツ、ウェブページメタデータ、イエローページデータ、ドメイン登録データ等)を受け入れる(ブロック410)。正に情報が(直接)関係付けられたウェブページ以外の、そのウェブサイトのウェブページに適している見込のある情報を識別する(ブロック420)。識別された情報が適している見込のある、他の1つ以上の関連するウェブページを識別する(ブロック430)。次に、識別された情報を、識別されたページに関係付けする(ブロック440)。識別された情報を含む検索クエリに対して、修正されたウェブページが、オリジナルのウェブページが持つことになるものよりも高い検索スコアを持つことになるように、修正されたウェブサイト/ウェブページ(例えば、新しく関係付けられた情報を有するウェブページ)情報を記憶し(例えば、後で使用するために記憶デバイス上で保存し)(ブロック450)、その後、方法400は終了する(ノード460)。
図6は、本発明と一貫した方法で、オーソリテイティブなウェブサイト内情報を(例えば、ウェブサイトトポロジーの下に)伝搬させる例示的な方法600のフロー図である。ウェブサイト情報を受け入れる(ブロック610)。その用語に対してウェブサイトがオーソリテイティブと考えられる、所定のウェブページ上で見つけられる用語を、ウェブサイトの所定のウェブページ(例えば、ホームページ)に対して決定する(ブロック620)。このような用語(例えば、単語および/またはフレーズ)は、妥当性検査手続を受けてもよい(ブロック630)。情報源ウェブページに関連するウェブサイトのウェブページ(例えば、ウェブサイトホームページまたはルートページ)を決定する(ブロック640)。1つ以上の例外に該当することに関連するとして決定されたページを除外してもよい(ブロック650)。次に、識別された情報(例えば、オーソリテイティブな用語)を、決定された(および除外されていない)ページに関係付けしてもよい(ブロック660)。次に、修正されたウェブサイトおよび/またはウェブページ情報を保存(例えば記憶)してもよく(ブロック670)、その後、方法600は終了する(ノード680)。
ウェブサイトの高度に記述的な単語(および他の情報)は、ウェブサイトのホームページ上では見つからないことが多いことを、本発明の発明者は理解している。このような高度に記述的な情報を識別し、これをウェブサイトのホーム(またはルート)ページに関係付けることが有用であるだろう。
ジとの(IR目的のために使用されるような)関係付けの強度を決定する際に、信頼度レベルを使用してもよい。すなわち、信頼度レベルを使用して、(a)関係付けを行うか否かと、(b)関係付けの強度とを決定してもよい。
図11は、本発明と一貫した方法で、少なくともいくつかの動作を実行し、少なくともいくつかの情報を記憶するのに使用してもよい装置1100のブロック図である。装置1100は、基本的に1つ以上のプロセッサ1110、1つ以上の入力/出力インターフェイスユニット1130、1つ以上の記憶デバイス1120、ならびに、結合されたエレメント間での情報の通信を容易にするための1つ以上のシステムバスおよび/またはネットワーク1140を含む。1つ以上の入力デバイス1132および1つ以上の出力デバイス1134が、1つ以上の入力/出力インターフェース1130と結合されていてもよい。
本発明と一貫した少なくともいくつかの実施形態は、ウェブサイトが用語に対して“オーソリテイティブ”であるか否かを決定するために、異なる技術を使用してもよい。例えば、検索用語が有名なもの(例えば、登録された商標)である場合、商標オーナのウェブサイトが商標用語に対して“オーソリテイティブ”であるとして考えられてもよい。上で説明したように、証拠のさまざまな情報源を考えてもよく、証拠の統合性を重み付けしてもよい。
ラマダ−>・・・,{ID#1234,5},・・・
ラマダ−>・・・,{ID#1234,25},・・・
したがって、重みは増加されてもよい。
ラマダ−>・・・,{ID#1234,5,ヌル},・・・
ラマダ−>・・・,{ID#1234,5,3},・・・
重み増強を変数として示したが、重み増強は、重みを増強させるか否かを示す単なるバイナリ値であってもよい。本発明と一貫した少なくともいくつかの実施形態では、バイナリ値が重みを増強させるべきことを示す場合でさえも、ある環境(例えば、クエリの要因)では、重みを増強させることを防いでもよく、または、減少させてもよい。
スコア’=スコア*(1+増強*スコア)
ここで、増強とスコアは、1よりも大きい。
セクション4.3.1 例1:オーソリテイティブな情報を下に伝搬
図8は、ウェブサイトのウェブページに対して、オーソリテイティブなウェブサイト内情報を下に伝搬させる例を図示する。(図6の例示的な方法600を想起すべきである。)ラマダのウェブサイト800のホームページ810は、用語“ラマダ”に対してオーソリテイティブであるとして仮定する。例えば、テキスト“ラマダ”を含むリンクの大多数が、Ramada.comウェブサイト上のウェブページをポイントすることを仮定する。(図6のブロック620を想起すべきである。)ユーザがその用語を使用するとき、ユーザは実際に、通常はそのウェブサイトを本当に望むということを確認するために、追加的なチェックを使用して、そのクエリ中の用語を妥当性検査してもよい。
図9は、ウェブサイト900のウェブページ910に対して、高度に記述的なウェブサイト内情報を上に伝搬させる第1の例を図示する。ウェブサイト900は、ヴェトナム料理レストラン“サイゴンII”のためのものである。ウェブサイト900のホーム(またはルート)ウェブページ910は、このレストランの住所を含まないが、ウェブサイト900のより低いウェブページ922は、住所 カリフォルニア州(CA)、どこかの町、大通り123を含むことを仮定する。住所を識別してもよい。(図7の720を想起すべきである。)“カリフォルニア州(CA)、どこかの町、大通り123”は、(例えば、用語“通り”、州の短縮形“CA”、住所のシンタックス等によって、)望ましいレベルの信頼度を有する住所またはロケーションであるとして考えられてもよいことをさらに仮定する。そのホームページ910上にロケーションの名称が出現しないとしても、ウェブサイト900のホームページ910は、(例えば、検索の目的で、)ロケーション“カリフォルニア州、どこかの町、大通り123”に対して信用が与えられてもよい(例えば、これを含むとして取り扱われてもよい)。
図10は、ウェブサイト1000のウェブページ1010に対して、ウェブサイト内情報を上に伝搬させる第2の例を図示する。この例では、ウェブサイト1000は電化製品小売業者ベストバイのためのものである。ホーム(またはルート)ページ1010は、さまざまな製品カテゴリに対応するさまざまなウェブページ1021−1025に対するリンクを含む。そしてまた、これらのウェブページ1021−1025は、特定の製品に対応するさまざまなウェブページ1031−1035に対するリンクを含む。
“テレビジョンおよびビデオゲーム”に対する検索が受け取られたとして仮定する。この例では、ベストバイのためのホームページ1010は、そうでなければ持つことになるものよりも、このようなクエリに対して、より多く関連性があることになるだろう。
上記のことから理解できるように、検索エンジンが、ウェブページについての正に直接の情報(例えば、そのウェブページとその構造上の単語、そのウェブページをポイントするアンカー中の単語、ウェブページのページランク等)を使用する自動化検索エンジンよりもよい検索結果を戻すように、検索エンジンを改善することが有用であるだろう。
Claims (54)
- コンピュータ実現される方法において、
a)ウェブサイトに適している情報を受け入れることと、
b)用語を含む検索クエリを処理する目的で、前記ウェブサイトの第1のウェブページに適しており、前記ウェブサイトの別のウェブページに適している見込のある前記用語を識別することと、
c)前記第1のウェブページとの特定の関係を持つ前記ウェブサイトの第2のウェブページを決定することと、
d)前記識別された用語を前記第2のウェブページに関係付けるべきか否かを決定することと、
e)前記用語を前記第2のウェブページに関係付けるべきであるとして決定された場合、前記識別された用語を含む検索クエリに対して、前記第2のウェブページが、そうでなければ持つことになるものよりも高い検索スコアを持つことになるように、前記識別された用語と前記第2のウェブページとの関係付けを保存することと
を含むコンピュータ実現される方法。 - 前記用語を前記第2のウェブページに関係付けるべきか否かを決定する動作は、
1)第1の組の情報上での第1のテストを使用して、前記用語が前記第2のウェブページに適しているかもしれないか否かを決定することと、
2)前記用語が前記第2のウェブページに適しているかもしれないとして決定された場合、第2の組の情報上での第2のテストを使用して、前記用語を前記第2のウェブページに関係付けるべきか否かを決定することと
を有する、請求項1記載のコンピュータ実現される方法。 - 前記用語を含む検索クエリを処理する目的で、前記ウェブサイトの第1のウェブページに適しており、前記ウェブサイトの別のウェブページに適している見込のある前記用語は、前記特定の関係以外の証拠を使用して識別される、請求項1記載のコンピュータ実現される方法。
- 前記特定の関係は2つのウェブページの間のリンクの存在である、請求項3記載のコンピュータ実現される方法。
- 前記用語を識別する動作は、前記ウェブサイトに強く関係付けられた用語を識別する、請求項1記載のコンピュータ実現される方法。
- 前記用語は検索クエリ用語であり、前記ウェブサイトに強く関係付けられた検索クエリ用語を識別する動作は、過去のユーザ検索クエリと、前記ウェブサイトに対応する検索結果を過去にユーザが選択したことと、を使用する、請求項5記載のコンピュータ実現される方法。
- 前記ウェブサイトに強く関係付けられた用語を識別する動作は、前記用語を含み、前記ウェブサイトの1つ以上のウェブページを参照する、アンカーテキストを使用する、請求項5記載のコンピュータ実現される方法。
- 前記ウェブサイトに強く関係付けられた用語を識別する動作は、(1)企業名としての前記用語と、(2)前記企業のためのホームページとしての前記ウェブサイトのウェブページと、をリストアップするイエローページエントリを使用する、請求項5記載のコンピュータ実現される方法。
- 前記ウェブサイトに強く関係付けられた用語を識別する動作は、(1)商標としての前記用語と、(2)ホームページとしての前記ウェブサイトのウェブページと、をリストアップする商標登録情報を使用する、請求項5記載のコンピュータ実現される方法。
- 前記ウェブサイトに強く関係付けられた用語を識別する動作は、(1)ドメイン名における前記用語と、(2)前記ウェブサイトのホームページと、をリストアップするドメイン名登録情報を使用する、請求項5記載のコンピュータ実現される方法。
- 前記用語が前記第2のウェブページに適しているかもしれないとして決定された場合に、第2の組の情報上での第2のテストを使用して、前記用語を前記第2のウェブページに関係付けるべきか否かを決定する動作は、
−前記第2のウェブページが、あるタイプのページであるか否か決定することと、
−前記第2のウェブページがあるタイプのページである場合、前記用語を前記第2のウェブページに関係付けるべきでないことを決定することと
を有する、請求項2記載のコンピュータ実現される方法。 - 前記あるタイプは、(A)プレスリリースウェブページ、(B)メッセージボードウェブページ、(C)フォーラムウェブページ、および(D)外国語ウェブページからなるウェブページタイプのグループから選択される、請求項11記載のコンピュータ実現される方法。
- 前記用語が前記第2のウェブページに適しているかもしれないとして決定された場合に、第2の組の情報上での第2のテストを使用して、前記用語を前記第2のウェブページに関係付けるべきか否かを決定する動作は、
−前記第2のウェブページと前記第1のウェブページとの間の最短のリンクの数を決定することと、
−前記決定された最短のリンクの数が、予め定められた値よりも多い場合、前記用語を前記第2のウェブページに関係付けるべきでないとして決定することと
を有する、請求項2記載のコンピュータ実現される方法。 - 前記識別された検索クエリ用語を含む検索クエリに対して、前記第2のウェブページが、そうでなければ持つことになるものよりも高い検索スコアを持つように、前記識別された用語と前記第2のウェブページとの関係付けを保存する動作は、前記検索スコアの情報検索成分を増加させる、請求項5記載のコンピュータ実現される方法。
- 前記識別された検索クエリ用語を含む検索クエリに対して、前記第2のウェブページが、そうでなければ持つことになるものよりも高い検索スコアを持つことになるように、前記識別された用語と前記第2のウェブページとの関係付けを保存する動作は、前記検索スコアのページランク成分を増加させる、請求項5記載のコンピュータ実現される方法。
- 前記識別された用語はフレーズである、請求項1記載のコンピュータ実現される方法。
- (f)前記識別された用語を含む検索クエリを受け取ることと、
(g)前記識別された検索用語との保存された関係付けを持っている前記第2のウェブページの前記検索結果スコアを増加させることと
をさらに含む、請求項1記載のコンピュータ実現される方法。 - 前記検索結果スコア増加の大きさは前記第2のウェブページの増加されていない検索結果スコアの関数である、請求項17記載のコンピュータ実現される方法。
- 前記識別された用語は高度に記述的な情報である、請求項1記載のコンピュータ実現される方法。
- 前記高度に記述的な情報はロケーションである、請求項19記載のコンピュータ実現される方法。
- 前記高度に記述的な情報は住所である、請求項19記載のコンピュータ実現される方法。
- 前記高度に記述的な情報は珍しい用語である、請求項19記載のコンピュータ実現される方法。
- 前記珍しい用語はウェブページおよびウェブサイトの収集物のうちで、予め定められた頻度より少なく出現する用語である、請求項22記載のコンピュータ実現される方法。
- 前記高度に記述的な情報は製品カテゴリである、請求項19記載のコンピュータ実現される方法。
- 前記高度に記述的な情報の少なくともいくつかを含む検索クエリに対して、前記第2のウェブページが、そうでなければ持つことになるものよりも高い検索スコアを持つように、前記識別された高度に記述的な情報と前記第2のウェブページとの関係付けを保存する動作は、前記検索スコアの情報検索成分を増加させる、請求項19記載のコンピュータ実現される方法。
- 前記高度に記述的な情報の少なくともいくつかを含む検索クエリに対して、前記第2のウェブページが、そうでなければ持つことになるものよりも高い検索スコアを持つように、前記識別された高度に記述的な情報と前記第2のウェブページとの関係付けを保存する動作は、前記検索スコアのページランク成分を増加させる、請求項19記載のコンピュータ実現される方法。
- 前記高度に記述的な情報は前記ウェブサイトのホームウェブページまたはルートウェブページ上では見つからないものであり、
前記第2のウェブページは前記ウェブサイトのホームウェブページまたはルートウェブページである、請求項19記載のコンピュータ実現される方法。 - 前記識別された用語は高度に記述的な情報であり、前記第2の組の情報上での第2のテストは、
A)前記候補の高度に記述的な情報において、信頼度レベルを決定することと、
B)前記決定された信頼度レベルが予め規定されたしきい値よりも大きいか否かを決定することと
を含み、
前記決定された信頼度が予め定められたしきい値よりも大きいとして決定された場合だけ、前記識別された候補の高度に記述的な情報を、前記第2のウェブページに関係付ける、請求項2記載のコンピュータ実現される方法。 - 前記候補の高度に記述的な情報において、信頼度レベルを決定する動作は、前記候補の高度に記述的な情報が、高度に記述的な情報であるという証拠を解析することを含む、請求項28記載のコンピュータ実現される方法。
- 前記解析される証拠は前記ウェブサイトに適している受け入れられた情報以外の情報源からのものである、請求項29記載のコンピュータ実現される方法。
- 前記候補の高度に記述的な情報が高度に記述的な情報であるという証拠を解析する動作は、訓練された機械学習選別器に対する入力として、前記証拠を適用することを含む、請求項29記載のコンピュータ実現される方法。
- 前記ウェブサイトはトポロジーを持ち、前記第2のウェブページは前記ウェブサイトトポロジーにおいて、前記第1のウェブページよりも高い、請求項1記載のコンピュータ実現される方法。
- 前記第2のウェブページは前記ウェブサイトのルートページまたはホームページである、請求項32記載のコンピュータ実現される方法。
- 前記ウェブサイトはトポロジーを持ち、前記第1のウェブページは前記ウェブサイトトポロジーにおいて、前記第2のウェブページよりも高い、請求項1記載のコンピュータ実現される方法。
- 前記第1のウェブページは前記ウェブサイトのルートページまたはホームページである、請求項34記載のコンピュータ実現される方法。
- コンピュータ実現される方法において、
a)第1のドキュメントに適している用語を識別することと、
b)前記用語を含む検索クエリを処理する目的で、前記識別された用語が、1つ以上の他のドキュメントに適している見込のある情報のクラスに属しているか否かを決定することと、
c)前記用語を含む検索クエリを処理する目的で、前記識別された用語が、1つ以上の他のドキュメントに適している見込のある情報のクラスに属しているとして決定された場合に、
1)前記情報のクラスが、関係を有するドキュメントに適している見込があるように、前記第1のドキュメントとの特定の関係を持つ第2のドキュメントを決定することと、
2)前記識別された用語を前記第2のドキュメントに関係付けるべきか否か決定することと、
3)前記用語を前記第2のドキュメントに関係付けるべきであるとして決定された場合、前記識別された用語を含む検索クエリに対して、前記第2のドキュメントが、そうでなければ持つことになるものよりも高い検索スコアを持つことになるように、前記識別された用語と前記第2のドキュメントとの関係付けを保存することと
を含むコンピュータ実現される方法。 - 前記第1のドキュメントは第1のウェブサイトに属しているウェブページであり、前記第2のウェブページは前記第1のウェブサイト以外のウェブサイトに属している、請求項36記載のコンピュータ実現される方法。
- 前記第1のドキュメントは第1のウェブページであり、前記第1のウェブページと前記第2のウェブページとの前記特定の関係は、前記第1のウェブページから前記第2のウェブページに対するリンクである、請求項36記載のコンピュータ実現される方法。
- 前記第1のドキュメントは第1のウェブページであり、前記第1のウェブページと前記第2のウェブページとの前記特定の関係は、前記第2のウェブページから前記第1のウェブページに対するリンクである、請求項36記載のコンピュータ実現される方法。
- 前記第1のドキュメントに適している用語を識別する動作と、前記用語を含む検索クエリを処理する目的で、前記識別された用語が、1つ以上の他のドキュメントに適している見込のある情報のクラスに属しているか否かを決定する動作は、
前記第1のドキュメントが属するウェブサイトに強く関係付けられている用語を識別する、請求項36記載のコンピュータ実現される方法。 - 前記用語は検索クエリ用語であり、前記第1のドキュメントはウェブサイトに属し、
前記第1のドキュメントに適している用語を識別する動作と、前記用語を含む検索クエリを処理する目的で、前記識別された用語が、1つ以上の他のドキュメントに適している見込のある情報のクラスに属しているか否かを決定する動作は、
過去のユーザ検索クエリと、前記ウェブサイトに対応する検索結果を過去にユーザが選択したことと、を使用して、前記ウェブサイトに強く関係付けられている検索クエリ用語を識別する、請求項36記載のコンピュータ実現される方法。 - 前記第1のドキュメントに適している用語を識別する動作と、前記用語を含む検索クエリを処理する目的で、前記識別された用語が、1つ以上の他のドキュメントに適している見込のある情報のクラスに属しているか否かを決定する動作は、
(1)企業名としての前記用語と、(2)前記企業のためのホームページとしての前記ウェブサイトのウェブページと、をリストアップするイエローページエントリを使用して、前記ウェブサイトに強く関係付けられた用語を識別する、請求項36記載のコンピュータ実現される方法。 - 前記第1のドキュメントに適している用語を識別する動作と、前記用語を含む検索クエリを処理する目的で、前記識別された用語が、1つ以上の他のドキュメントに適している見込のある情報のクラスに属しているか否かを決定する動作は、
(1)商標としての前記用語と、(2)ホームページとしての前記ウェブサイトのウェブページと、をリストアップする商標登録情報を使用して、前記ウェブサイトに強く関係付けられた用語を識別する、請求項36記載のコンピュータ実現される方法。 - 前記第1のドキュメントに適している用語を識別する動作と、前記用語を含む検索クエリを処理する目的で、前記識別された用語が、1つ以上の他のドキュメントに適している見込のある情報のクラスに属しているか否かを決定する動作は、
(1)ドメイン名における前記用語と、(2)前記ウェブサイトのホームページと、をリストアップするドメイン名登録情報を使用して、前記ウェブサイトに強く関係付けられた用語を識別する、請求項36記載のコンピュータ実現される方法。 - (d)前記識別された用語を含む検索クエリを受け取ることと、
(e)前記識別された用語との保存された関係付けを持っている前記第2のドキュメントの前記検索結果スコアを増加させることと
をさらに含む、請求項36記載のコンピュータ実現される方法。 - 前記識別された用語は高度に記述的な情報である、請求項36記載のコンピュータ実現される方法。
- 前記高度に記述的な情報はロケーションである、請求項46記載のコンピュータ実現される方法。
- 前記高度に記述的な情報は住所である、請求項46記載のコンピュータ実現される方法。
- 前記高度に記述的な情報は珍しい用語である、請求項46記載のコンピュータ実現される方法。
- 前記珍しい用語はウェブページおよびウェブサイトの収集物のうちで、予め定められた頻度より少なく出現する用語である、請求項49記載のコンピュータ実現される方法。
- 前記高度に記述的な情報は製品カテゴリである、請求項46記載のコンピュータ実現される方法。
- 前記高度に記述的な情報の少なくともいくつかを含む検索クエリに対して、前記第2のウェブページが、そうでなければ持つことになるものよりも高い検索スコアを持つように、前記識別された高度に記述的な情報と前記第2のウェブページとの関係付けを保存する動作は、前記検索スコアの情報検索成分を増加させる、請求項46記載のコンピュータ実現される方法。
- 装置において、
a)ウェブサイトに適している情報を受け入れる手段と、
b)用語を含む検索クエリを処理する目的で、前記ウェブサイトの第1のウェブページに適しており、前記ウェブサイトの別のウェブページに適している見込のある前記用語を識別する手段と、
c)前記第1のウェブページとの特定の関係を持つ前記ウェブサイトの第2のウェブページを決定する手段と、
d)前記識別された用語と前記第2のウェブページとを関係付けるべきか否かを決定する手段と、
e)前記用語を前記第2のウェブページに関係付けるべきであるとして決定された場合、前記識別された用語を含む検索クエリに対して、前記第2のウェブページが、そうでなければ持つことになるものよりも高い検索スコアを持つことになるように、前記識別された用語と前記第2のウェブページとの関係付けを保存する手段と
を具備する装置。 - (f)前記識別された用語を含む検索クエリを受け取る手段と、
(g)前記識別された検索用語との保存された関係付けを持っている前記第2のウェブページの前記検索結果スコアを増加させる手段と
をさらに具備する請求項53記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/396,301 | 2006-03-31 | ||
US11/396,301 US7933890B2 (en) | 2006-03-31 | 2006-03-31 | Propagating useful information among related web pages, such as web pages of a website |
PCT/US2007/006870 WO2007126628A2 (en) | 2006-03-31 | 2007-03-19 | Propagating useful information among related web pages, such as web pages of a website |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009532766A true JP2009532766A (ja) | 2009-09-10 |
JP5069285B2 JP5069285B2 (ja) | 2012-11-07 |
Family
ID=38560711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009502850A Active JP5069285B2 (ja) | 2006-03-31 | 2007-03-19 | ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬 |
Country Status (8)
Country | Link |
---|---|
US (3) | US7933890B2 (ja) |
EP (1) | EP2013703A4 (ja) |
JP (1) | JP5069285B2 (ja) |
KR (1) | KR101225467B1 (ja) |
CN (1) | CN101454748B (ja) |
AU (2) | AU2007243784B2 (ja) |
CA (1) | CA2647864C (ja) |
WO (1) | WO2007126628A2 (ja) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7966184B2 (en) * | 2006-03-06 | 2011-06-21 | Audioeye, Inc. | System and method for audible web site navigation |
US7480667B2 (en) * | 2004-12-24 | 2009-01-20 | Microsoft Corporation | System and method for using anchor text as training data for classifier-based search systems |
US7657523B2 (en) * | 2006-03-09 | 2010-02-02 | Customerforce.Com | Ranking search results presented to on-line users as a function of perspectives of relationships trusted by the users |
US7933890B2 (en) * | 2006-03-31 | 2011-04-26 | Google Inc. | Propagating useful information among related web pages, such as web pages of a website |
US8219533B2 (en) * | 2007-08-29 | 2012-07-10 | Enpulz Llc | Search engine feedback for developing reliable whois database reference for restricted search operation |
CN101855631B (zh) * | 2007-11-08 | 2016-06-29 | 上海惠普有限公司 | 用于聚焦爬行的导航排名 |
US7991760B2 (en) * | 2008-02-08 | 2011-08-02 | International Business Machines Corporation | Constructing a domain-specific ontology by mining the web |
WO2011024163A1 (en) * | 2009-08-25 | 2011-03-03 | Ben Gurion University Of The Negev Research And Development Authority | Method and system for selecting, retrieving, visualizing and exploring time-oriented data in multiple subject records. |
US8706717B2 (en) * | 2009-11-13 | 2014-04-22 | Oracle International Corporation | Method and system for enterprise search navigation |
US20120260160A1 (en) * | 2009-12-24 | 2012-10-11 | Samsung Electronics Co., Ltd. | Display device for displaying a webpage and display method for same |
US8788583B2 (en) * | 2010-05-13 | 2014-07-22 | International Business Machines Corporation | Sharing form training result utilizing a social network |
US8903800B2 (en) * | 2010-06-02 | 2014-12-02 | Yahoo!, Inc. | System and method for indexing food providers and use of the index in search engines |
US8635205B1 (en) * | 2010-06-18 | 2014-01-21 | Google Inc. | Displaying local site name information with search results |
US8489560B1 (en) * | 2010-09-08 | 2013-07-16 | Conductor, Inc. | System and method for facilitating the management of keyword/universal resource locator (URL) data |
US9135358B2 (en) | 2010-10-20 | 2015-09-15 | Microsoft Technology Licensing, Llc | Result types for conditional data display |
US20120158712A1 (en) * | 2010-12-16 | 2012-06-21 | Sushrut Karanjkar | Inferring Geographic Locations for Entities Appearing in Search Queries |
US8589408B2 (en) | 2011-06-20 | 2013-11-19 | Microsoft Corporation | Iterative set expansion using samples |
JP2013037624A (ja) * | 2011-08-10 | 2013-02-21 | Sony Computer Entertainment Inc | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 |
US9489345B1 (en) * | 2011-09-28 | 2016-11-08 | Harold T. Fogg | System and method for providing products and locations |
FR2989189B1 (fr) * | 2012-04-04 | 2017-10-13 | Qwant | Procede et dispositif de fourniture rapide d'information |
WO2013172821A1 (en) * | 2012-05-15 | 2013-11-21 | Hewlett-Packard Development Company, L.P. | Query processing |
US9626340B2 (en) | 2012-08-28 | 2017-04-18 | Dropbox, Inc. | Bookmarking shared file and folder links |
US9075860B2 (en) | 2012-10-18 | 2015-07-07 | Oracle International Corporation | Data lineage system |
US10810245B2 (en) * | 2013-01-17 | 2020-10-20 | Adobe Inc. | Hybrid method of building topic ontologies for publisher and marketer content and ad recommendations |
US9910860B2 (en) * | 2014-02-06 | 2018-03-06 | International Business Machines Corporation | Split elimination in MapReduce systems |
CN106203088A (zh) * | 2016-06-24 | 2016-12-07 | 北京奇虎科技有限公司 | 信息获取的方法及装置 |
US11475212B2 (en) * | 2017-04-06 | 2022-10-18 | Otsuka Pharmaceutical Development & Commercialization, Inc. | Systems and methods for generating and modifying documents describing scientific research |
CN110598073B (zh) * | 2018-05-25 | 2024-04-26 | 微软技术许可有限责任公司 | 基于拓扑关系图的实体网页链接的获取技术 |
US11372894B2 (en) * | 2018-12-21 | 2022-06-28 | Atlassian Pty Ltd. | Associating product with document using document linkage data |
CN111930750A (zh) * | 2020-08-28 | 2020-11-13 | 支付宝(杭州)信息技术有限公司 | 一种对取证过程视频片段进行存证的方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020174132A1 (en) * | 2001-05-04 | 2002-11-21 | Allresearch, Inc. | Method and system for detecting unauthorized trademark use on the internet |
US20050120006A1 (en) * | 2003-05-30 | 2005-06-02 | Geosign Corporation | Systems and methods for enhancing web-based searching |
Family Cites Families (118)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4021780A (en) * | 1975-09-24 | 1977-05-03 | Narey James O | Ballot tallying system including a digital programmable read only control memory, a digital ballot image memory and a digital totals memory |
US5715208A (en) * | 1995-09-29 | 1998-02-03 | Micron Technology, Inc. | Memory device and method for reading data therefrom |
US6148289A (en) * | 1996-05-10 | 2000-11-14 | Localeyes Corporation | System and method for geographically organizing and classifying businesses on the world-wide web |
US6745194B2 (en) * | 2000-08-07 | 2004-06-01 | Alta Vista Company | Technique for deleting duplicate records referenced in an index of a database |
US5933827A (en) * | 1996-09-25 | 1999-08-03 | International Business Machines Corporation | System for identifying new web pages of interest to a user |
US5991758A (en) * | 1997-06-06 | 1999-11-23 | Madison Information Technologies, Inc. | System and method for indexing information about entities from different information sources |
US5991756A (en) * | 1997-11-03 | 1999-11-23 | Yahoo, Inc. | Information retrieval from hierarchical compound documents |
WO1999030194A1 (fr) * | 1997-12-05 | 1999-06-17 | Sumitomo Electric Industries, Ltd. | Fibre optique a dispersion decalee |
US6735585B1 (en) * | 1998-08-17 | 2004-05-11 | Altavista Company | Method for search engine generating supplemented search not included in conventional search result identifying entity data related to portion of located web page |
US6336105B1 (en) * | 1998-11-16 | 2002-01-01 | Trade Access Inc. | System and method for representing data and providing electronic non-repudiation in a negotiations system |
CA2356947A1 (en) * | 1998-12-23 | 2000-07-06 | Nokia Wireless Routers, Inc. | A unified routing scheme for ad-hoc internetworking |
JP2000285140A (ja) * | 1998-12-24 | 2000-10-13 | Ricoh Co Ltd | 文書処理装置、文書分類装置、文書処理方法、文書分類方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7275061B1 (en) * | 2000-04-13 | 2007-09-25 | Indraweb.Com, Inc. | Systems and methods for employing an orthogonal corpus for document indexing |
US6924828B1 (en) * | 1999-04-27 | 2005-08-02 | Surfnotes | Method and apparatus for improved information representation |
US6836768B1 (en) * | 1999-04-27 | 2004-12-28 | Surfnotes | Method and apparatus for improved information representation |
US7181459B2 (en) * | 1999-05-04 | 2007-02-20 | Iconfind, Inc. | Method of coding, categorizing, and retrieving network pages and sites |
US20050097160A1 (en) * | 1999-05-21 | 2005-05-05 | Stob James A. | Method for providing information about a site to a network cataloger |
US6718363B1 (en) * | 1999-07-30 | 2004-04-06 | Verizon Laboratories, Inc. | Page aggregation for web sites |
US6321228B1 (en) * | 1999-08-31 | 2001-11-20 | Powercast Media, Inc. | Internet search system for retrieving selected results from a previous search |
US8914361B2 (en) * | 1999-09-22 | 2014-12-16 | Google Inc. | Methods and systems for determining a meaning of a document to match the document to content |
US6675205B2 (en) * | 1999-10-14 | 2004-01-06 | Arcessa, Inc. | Peer-to-peer automated anonymous asynchronous file sharing |
US6651058B1 (en) * | 1999-11-15 | 2003-11-18 | International Business Machines Corporation | System and method of automatic discovery of terms in a document that are relevant to a given target topic |
US6434548B1 (en) * | 1999-12-07 | 2002-08-13 | International Business Machines Corporation | Distributed metadata searching system and method |
US6963867B2 (en) * | 1999-12-08 | 2005-11-08 | A9.Com, Inc. | Search query processing to provide category-ranked presentation of search results |
US6691108B2 (en) * | 1999-12-14 | 2004-02-10 | Nec Corporation | Focused search engine and method |
US6691163B1 (en) * | 1999-12-23 | 2004-02-10 | Alexa Internet | Use of web usage trail data to identify related links |
US7058636B2 (en) * | 2000-01-03 | 2006-06-06 | Dirk Coldewey | Method for prefetching recursive data structure traversals |
US6886005B2 (en) * | 2000-02-17 | 2005-04-26 | E-Numerate Solutions, Inc. | RDL search engine |
US6865600B1 (en) * | 2000-05-19 | 2005-03-08 | Napster, Inc. | System and method for selecting internet media channels |
US7013323B1 (en) * | 2000-05-23 | 2006-03-14 | Cyveillance, Inc. | System and method for developing and interpreting e-commerce metrics by utilizing a list of rules wherein each rule contain at least one of entity-specific criteria |
US6636848B1 (en) * | 2000-05-31 | 2003-10-21 | International Business Machines Corporation | Information search using knowledge agents |
US20020078014A1 (en) * | 2000-05-31 | 2002-06-20 | David Pallmann | Network crawling with lateral link handling |
DE10028842A1 (de) * | 2000-06-15 | 2002-01-03 | Ralf Mimoun | Verfahren zur Erzeugung einer Bedienoberfläche für eine Standard-Applikation in einem Browser eines Computernetzwerkes |
US7359951B2 (en) * | 2000-08-08 | 2008-04-15 | Aol Llc, A Delaware Limited Liability Company | Displaying search results |
US7047229B2 (en) * | 2000-08-08 | 2006-05-16 | America Online, Inc. | Searching content on web pages |
US7080073B1 (en) * | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
KR100455439B1 (ko) | 2000-09-21 | 2004-11-08 | (주)하우앤와이 | 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법 |
US20020080187A1 (en) * | 2000-10-02 | 2002-06-27 | Lawton Scott S. | Enhanced method and system for category selection |
US20020065857A1 (en) * | 2000-10-04 | 2002-05-30 | Zbigniew Michalewicz | System and method for analysis and clustering of documents for search engine |
US20020103920A1 (en) * | 2000-11-21 | 2002-08-01 | Berkun Ken Alan | Interpretive stream metadata extraction |
CA2327175A1 (en) * | 2000-11-30 | 2002-05-30 | Ibm Canada Limited-Ibm Canada Limitee | Lightweight user interactive administration framework |
KR20020049164A (ko) * | 2000-12-19 | 2002-06-26 | 오길록 | 유전자 알고리즘을 이용한 카테고리 학습과 단어클러스터에 의한 문서 자동 분류 시스템 및 그 방법 |
US6526440B1 (en) * | 2001-01-30 | 2003-02-25 | Google, Inc. | Ranking search results by reranking the results based on local inter-connectivity |
US7047482B1 (en) * | 2001-02-28 | 2006-05-16 | Gary Odom | Automatic directory supplementation |
US20040205076A1 (en) * | 2001-03-06 | 2004-10-14 | International Business Machines Corporation | System and method to automate the management of hypertext link information in a Web site |
US20020129062A1 (en) * | 2001-03-08 | 2002-09-12 | Wood River Technologies, Inc. | Apparatus and method for cataloging data |
US6938025B1 (en) * | 2001-05-07 | 2005-08-30 | Microsoft Corporation | Method and apparatus for automatically determining salient features for object classification |
US6990494B2 (en) * | 2001-07-27 | 2006-01-24 | International Business Machines Corporation | Identifying links of interest in a web page |
US7096179B2 (en) * | 2001-08-15 | 2006-08-22 | Siemens Corporate Research, Inc. | Text-based automatic content classification and grouping |
US7076483B2 (en) * | 2001-08-27 | 2006-07-11 | Xyleme Sa | Ranking nodes in a graph |
US20030043192A1 (en) * | 2001-08-31 | 2003-03-06 | Schlumberger Technology Corporation | Dynamically modifiable user interface |
US7266765B2 (en) * | 2001-08-31 | 2007-09-04 | Fuji Xerox Co., Ltd. | Detection and processing of annotated anchors |
US7089233B2 (en) * | 2001-09-06 | 2006-08-08 | International Business Machines Corporation | Method and system for searching for web content |
US20020156779A1 (en) * | 2001-09-28 | 2002-10-24 | Elliott Margaret E. | Internet search engine |
US20040205046A1 (en) * | 2001-11-29 | 2004-10-14 | International Business Machines Corporation | Indexing and retrieval of textual collections on PDAS |
US7536404B2 (en) * | 2001-12-13 | 2009-05-19 | Siemens Product Lifecycle Management Software, Inc. | Electronic files preparation for storage in a server |
US6965900B2 (en) * | 2001-12-19 | 2005-11-15 | X-Labs Holdings, Llc | Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents |
US20030115188A1 (en) * | 2001-12-19 | 2003-06-19 | Narayan Srinivasa | Method and apparatus for electronically extracting application specific multidimensional information from a library of searchable documents and for providing the application specific information to a user application |
US7240330B2 (en) * | 2002-02-01 | 2007-07-03 | John Fairweather | Use of ontologies for auto-generating and handling applications, their persistent storage, and user interfaces |
US8229957B2 (en) * | 2005-04-22 | 2012-07-24 | Google, Inc. | Categorizing objects, such as documents and/or clusters, with respect to a taxonomy and data structures derived from such categorization |
US20070038603A1 (en) * | 2005-08-10 | 2007-02-15 | Guha Ramanathan V | Sharing context data across programmable search engines |
US20030208578A1 (en) * | 2002-05-01 | 2003-11-06 | Steven Taraborelli | Web marketing method and system for increasing volume of quality visitor traffic on a web site |
US7231395B2 (en) * | 2002-05-24 | 2007-06-12 | Overture Services, Inc. | Method and apparatus for categorizing and presenting documents of a distributed database |
US7676452B2 (en) * | 2002-07-23 | 2010-03-09 | International Business Machines Corporation | Method and apparatus for search optimization based on generation of context focused queries |
AU2003265847A1 (en) * | 2002-09-03 | 2004-03-29 | X1 Technologies, Llc | Apparatus and methods for locating data |
US20040107365A1 (en) * | 2002-09-04 | 2004-06-03 | Hogg Jim R. | System and method for remote website content management and administration |
US7085755B2 (en) * | 2002-11-07 | 2006-08-01 | Thomson Global Resources Ag | Electronic document repository management and access system |
US7107520B2 (en) * | 2002-11-18 | 2006-09-12 | Hewlett-Packard Development Company, L.P. | Automated propagation of document metadata |
US20050149507A1 (en) * | 2003-02-05 | 2005-07-07 | Nye Timothy G. | Systems and methods for identifying an internet resource address |
US20040205242A1 (en) * | 2003-03-12 | 2004-10-14 | Zhichen Xu | Querying a peer-to-peer network |
US7028029B2 (en) * | 2003-03-28 | 2006-04-11 | Google Inc. | Adaptive computation of ranking |
GB0314782D0 (en) * | 2003-06-25 | 2003-07-30 | Ibm | A searchable personal browsing history |
US7346839B2 (en) | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7281005B2 (en) * | 2003-10-20 | 2007-10-09 | Telenor Asa | Backward and forward non-normalized link weight analysis method, system, and computer program product |
WO2005055073A1 (en) * | 2003-11-27 | 2005-06-16 | Qinetiq Limited | Automated anomaly detection |
US7181447B2 (en) * | 2003-12-08 | 2007-02-20 | Iac Search And Media, Inc. | Methods and systems for conceptually organizing and presenting information |
US7392278B2 (en) * | 2004-01-23 | 2008-06-24 | Microsoft Corporation | Building and using subwebs for focused search |
US7716223B2 (en) * | 2004-03-29 | 2010-05-11 | Google Inc. | Variable personalization of search results in a search engine |
US7343374B2 (en) * | 2004-03-29 | 2008-03-11 | Yahoo! Inc. | Computation of page authority weights using personalized bookmarks |
US7849135B2 (en) * | 2004-04-09 | 2010-12-07 | At&T Mobility Ii Llc | Sharing content on mobile devices |
US7305389B2 (en) * | 2004-04-15 | 2007-12-04 | Microsoft Corporation | Content propagation for enhanced document retrieval |
US7231405B2 (en) * | 2004-05-08 | 2007-06-12 | Doug Norman, Interchange Corp. | Method and apparatus of indexing web pages of a web site for geographical searchine based on user location |
US7251654B2 (en) * | 2004-05-15 | 2007-07-31 | International Business Machines Corporation | System and method for ranking nodes in a network |
WO2007001247A2 (en) * | 2004-06-02 | 2007-01-04 | Yahoo! Inc. | Content-management system for user behavior targeting |
US7836411B2 (en) * | 2004-06-10 | 2010-11-16 | International Business Machines Corporation | Search framework metadata |
AU2005258080A1 (en) * | 2004-06-18 | 2006-01-05 | Pictothink Corporation | Network content organization tool |
WO2006011819A1 (en) * | 2004-07-30 | 2006-02-02 | Eurekster, Inc. | Adaptive search engine |
US20060036966A1 (en) * | 2004-08-10 | 2006-02-16 | Slava Yevdayev | Method and system for presenting links associated with a requested website |
US8078602B2 (en) * | 2004-12-17 | 2011-12-13 | Claria Innovations, Llc | Search engine for a computer network |
US7779001B2 (en) * | 2004-10-29 | 2010-08-17 | Microsoft Corporation | Web page ranking with hierarchical considerations |
US20060149800A1 (en) * | 2004-12-30 | 2006-07-06 | Daniel Egnor | Authoritative document identification |
US20060230039A1 (en) * | 2005-01-25 | 2006-10-12 | Markmonitor, Inc. | Online identity tracking |
US7685197B2 (en) * | 2005-05-05 | 2010-03-23 | Yahoo! Inc. | System and methods for indentifying the potential advertising value of terms found on web pages |
FR2886494B1 (fr) * | 2005-05-24 | 2007-06-29 | Canon Kk | Procede et dispositif d'echange de donnees entre des stations mobiles dans un reseau pair a pair |
US20060294071A1 (en) * | 2005-06-28 | 2006-12-28 | Microsoft Corporation | Facet extraction and user feedback for ranking improvement and personalization |
US7480652B2 (en) * | 2005-10-26 | 2009-01-20 | Microsoft Corporation | Determining relevance of a document to a query based on spans of query terms |
US7792870B2 (en) * | 2005-11-08 | 2010-09-07 | Yahoo! Inc. | Identification and automatic propagation of geo-location associations to un-located documents |
US20070112758A1 (en) * | 2005-11-14 | 2007-05-17 | Aol Llc | Displaying User Feedback for Search Results From People Related to a User |
US7890502B2 (en) * | 2005-11-14 | 2011-02-15 | Microsoft Corporation | Hierarchy-based propagation of contribution of documents |
NO325961B1 (no) * | 2005-12-05 | 2008-08-25 | Holte Bjoern | System, prosess og softwarearrangement for å assistere i navigering på inernett |
US20070192253A1 (en) * | 2006-01-13 | 2007-08-16 | Gogo Mobile, Inc. | Digital content delivery assistance system and method |
US8019763B2 (en) * | 2006-02-27 | 2011-09-13 | Microsoft Corporation | Propagating relevance from labeled documents to unlabeled documents |
JP2007241451A (ja) * | 2006-03-06 | 2007-09-20 | Fuji Xerox Co Ltd | 情報収集支援装置 |
US7933890B2 (en) | 2006-03-31 | 2011-04-26 | Google Inc. | Propagating useful information among related web pages, such as web pages of a website |
US20070276862A1 (en) * | 2006-04-27 | 2007-11-29 | Toutonghi Michael J | Organizing and sharing digital content |
US8627335B2 (en) * | 2006-11-13 | 2014-01-07 | Oracle America, Inc. | Method and apparatus for data space profiling of applications across a network |
US7577550B2 (en) * | 2007-04-30 | 2009-08-18 | Hewlett-Packard Development Company, L.P. | System and method for detecting performance anomalies in a computing system |
US8140301B2 (en) * | 2007-04-30 | 2012-03-20 | International Business Machines Corporation | Method and system for causal modeling and outlier detection |
US7877642B2 (en) * | 2008-10-22 | 2011-01-25 | International Business Machines Corporation | Automatic software fault diagnosis by exploiting application signatures |
US8327443B2 (en) * | 2008-10-29 | 2012-12-04 | Lockheed Martin Corporation | MDL compress system and method for signature inference and masquerade intrusion detection |
JP2011034177A (ja) * | 2009-07-30 | 2011-02-17 | Sony Corp | 情報処理装置および情報処理方法、並びにプログラム |
US20120254333A1 (en) * | 2010-01-07 | 2012-10-04 | Rajarathnam Chandramouli | Automated detection of deception in short and multilingual electronic messages |
US9292493B2 (en) * | 2010-01-07 | 2016-03-22 | The Trustees Of The Stevens Institute Of Technology | Systems and methods for automatically detecting deception in human communications expressed in digital form |
US8504876B2 (en) * | 2010-04-30 | 2013-08-06 | The Mitre Corporation | Anomaly detection for database systems |
US8244743B2 (en) * | 2010-06-08 | 2012-08-14 | Google Inc. | Scalable rendering of large spatial databases |
MX2013011129A (es) * | 2011-03-28 | 2013-10-30 | Ibm | Sistema de deteccion de anomalias, metodo de deteccion de anomalias y programa para los mismos. |
US8838510B2 (en) * | 2011-09-16 | 2014-09-16 | International Business Machines Corporation | Choosing pattern recognition algorithms and data features using a genetic algorithm |
US8856193B2 (en) * | 2011-12-20 | 2014-10-07 | Sap Se | Merge monitor for table delta partitions |
-
2006
- 2006-03-31 US US11/396,301 patent/US7933890B2/en not_active Expired - Fee Related
-
2007
- 2007-03-19 JP JP2009502850A patent/JP5069285B2/ja active Active
- 2007-03-19 CA CA2647864A patent/CA2647864C/en active Active
- 2007-03-19 KR KR1020087026761A patent/KR101225467B1/ko active IP Right Grant
- 2007-03-19 WO PCT/US2007/006870 patent/WO2007126628A2/en active Application Filing
- 2007-03-19 CN CN2007800192230A patent/CN101454748B/zh active Active
- 2007-03-19 AU AU2007243784A patent/AU2007243784B2/en not_active Ceased
- 2007-03-19 EP EP07773258A patent/EP2013703A4/en not_active Withdrawn
-
2011
- 2011-04-20 AU AU2011201819A patent/AU2011201819B2/en active Active
- 2011-04-21 US US13/092,100 patent/US8521717B2/en active Active
-
2013
- 2013-08-15 US US13/968,339 patent/US8990210B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020174132A1 (en) * | 2001-05-04 | 2002-11-21 | Allresearch, Inc. | Method and system for detecting unauthorized trademark use on the internet |
US20050120006A1 (en) * | 2003-05-30 | 2005-06-02 | Geosign Corporation | Systems and methods for enhancing web-based searching |
Also Published As
Publication number | Publication date |
---|---|
KR101225467B1 (ko) | 2013-01-24 |
CN101454748A (zh) | 2009-06-10 |
AU2007243784B2 (en) | 2011-01-20 |
KR20080109061A (ko) | 2008-12-16 |
US8990210B2 (en) | 2015-03-24 |
JP5069285B2 (ja) | 2012-11-07 |
WO2007126628A3 (en) | 2008-09-25 |
US8521717B2 (en) | 2013-08-27 |
US20070233808A1 (en) | 2007-10-04 |
CA2647864A1 (en) | 2007-11-08 |
EP2013703A4 (en) | 2012-05-23 |
US20140052735A1 (en) | 2014-02-20 |
CN101454748B (zh) | 2010-12-08 |
US20110196861A1 (en) | 2011-08-11 |
EP2013703A2 (en) | 2009-01-14 |
AU2007243784A1 (en) | 2007-11-08 |
US7933890B2 (en) | 2011-04-26 |
AU2011201819A1 (en) | 2011-06-09 |
WO2007126628A2 (en) | 2007-11-08 |
AU2011201819B2 (en) | 2013-07-04 |
CA2647864C (en) | 2013-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5069285B2 (ja) | ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬 | |
US11860921B2 (en) | Category-based search | |
JP4350744B2 (ja) | 地域情報検索結果の提供方法およびシステム | |
US8949251B2 (en) | System for and method of identifying closely matching textual identifiers, such as domain names | |
US10268641B1 (en) | Search result ranking based on trust | |
Davison | Recognizing nepotistic links on the web | |
US8972371B2 (en) | Search engine and indexing technique | |
US20090089278A1 (en) | Techniques for keyword extraction from urls using statistical analysis | |
JP2011238273A (ja) | サーチ結果を提供するためのシステムおよび方法 | |
KR20060115488A (ko) | 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버 | |
Liu et al. | Data cleansing for web information retrieval using query independent features | |
KR100909561B1 (ko) | 지역 정보 검색 결과 제공 시스템 | |
Hamdulay et al. | Search engine visibility: the effect of generic top-level domain choice |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110719 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111019 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111026 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111121 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111129 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111219 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120717 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120816 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5069285 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |