JP2010507840A - Dnsセッションデータに基づくノード格付けのための方法およびシステム - Google Patents

Dnsセッションデータに基づくノード格付けのための方法およびシステム Download PDF

Info

Publication number
JP2010507840A
JP2010507840A JP2009533548A JP2009533548A JP2010507840A JP 2010507840 A JP2010507840 A JP 2010507840A JP 2009533548 A JP2009533548 A JP 2009533548A JP 2009533548 A JP2009533548 A JP 2009533548A JP 2010507840 A JP2010507840 A JP 2010507840A
Authority
JP
Japan
Prior art keywords
page
rating
session
host
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009533548A
Other languages
English (en)
Inventor
ティー サリヴァン アレン
Original Assignee
パックスファイアー インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パックスファイアー インコーポレイテッド filed Critical パックスファイアー インコーポレイテッド
Publication of JP2010507840A publication Critical patent/JP2010507840A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0246Traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Abstract

ページおよび/またはホストを、より高速で、かつ関連性のある方法で格付けするためのシステムおよび方法を提供する。ページおよび/またはホストを、セッションデータおよび/またはトラフィックデータに基づいて格付けするためのシステムおよび方法も提供する。本発明によれば、DNSおよび/またはISPのデータを用いてセッションマップを作成することができる。ビジネスを目的としたページおよび/またはホストを格付けするためのシステムおよび方法も提供する。

Description

本願は、米国特許出願第11/550,975号の開示に依拠し、その出願日に基づく優先権を主張するとともに、その全開示内容を引用して本明細書に組み込む。
本発明は、一般に、情報検索システムに関し、より詳細には、収集された一群のノードを格付けするための方法およびシステムに関する。
インターネットは、インターネットプロトコルにより相互にリンクされた個々のコンピュータ(クライアントおよびサーバ等)のグローバルネットワークである。ワールドワイドウェブにより、クライアントプログラムは、ユニフォームリソースロケータ(URL、あるいは、ユニフォームリソースインジケータつまりURIとしても知られる)に基づいて、インターネットからの情報(ウェブページまたはウェブファイル等)を検索することができる。クライアントプログラムの一例としては、ユーザーコンピュータ上で実行されウェブページまたはウェブファイルを探索するのを支援するウェブブラウザがある。各ウェブページまたはウェブファイルは、クライアントプログラムにウェブページまたはウェブファイルを格納するホストサーバを特定させる固有のURLで、関係付けられる。URLは、主として、スキーム、ホスト名またはサーバ名、ポート番号、パスおよび/またはクエリーによって構成される。例えば、ユーザーが、http://example.com/indexと入力した場合、スキームつまりアクセス形式は「http」、ホスト名またはサーバ名は「example.com」、そしてパスは「index」である。時に、ユーザーが自身のローカルブラウザープログラムにあるブラウザーツールバーにクエリーを入力して何か特定のことをリクエストすることがある。あるページのURLを入力する代わりに、ユーザーがページまたはリソースへのハイパーテキストリンクを利用することもある。但し、クライアントコンピュータをサーバに接続してそのページの検索を始めるまでに、URLのホスト名またはサーバ名の部分をIPアドレスに変換しなければならない。ドメインネームサービス(DNS)は、レゾルバおよびネームサーバに依って動作するグローバルインターネットデータベースネットワークであり、ホスト名またはサーバ名を、それらに関係付けられたIPアドレスにマッピングするために用いられる。
このグローバルネットワークでは、各ウェブサイトまたはウェブページは固有のURLを割り当てられ、インターネットプロトコルアドレス、つまりIPアドレスと呼ばれる識別番号と関係付けられる。各ウェブサイトのIPアドレスは、一台以上のDNSサーバ内に格納され、そのサイトを要求するクエリーに順に応答し、そのアドレスを他のコンピュータに提供する。多くの場合、ユーザーは自分の探している情報を含むウェブページのIPアドレスまたはURLを知らないし、そのようなページが存在しているかどうかさえ知らない。この場合、ユーザーは、検索エンジンにキーワードを入力するか、または参照ウェブサイトからそのウェブサイトにリンクさせるのが普通である。キーワード検索を実行するために、ユーザーは、Google(米国及び日本国登録商標)またはYahoo(米国及び日本国登録商標)等のインターネット検索エンジンのサイトを訪れ、ユーザーのクエリーと関連する一つ以上のワードまたはフレーズをタイプ入力することが多い。検索エンジンはキーワード検索に応答して幾つかのURLを返し、リクエストする人はその中から彼の目的に最も適うウェブページを選択するのが普通である。しかし、クエリーに応答して返されるページが膨大な量になることが多く、その場合、ユーザーは、大量の結果全体をソートして対象ページを見付け出す必要がある。例えば、ユーザーが「自動車」という言葉をタイプ入力すると、検索エンジンが返す結果は、自動車メーカーから、自動車販売店、自動車修理店、自動車同好会等に至るまでのウェブサイトの長大なリストとなる可能性がある。このため、関連性に基づいてクエリー結果をさらにソートするためにウェブサイトを「格付け」することが多い。
ウェブページを格付けするための各種の方法が当技術分野で既知である(例えば、特許文献1)。特許文献1(米国特許第6,285,999号)には、ページに付与されたワールドワイドウェブ内のページを格付けするための、クエリーに依存しないモデルが記載されている。この特許は、ウェブの静的リンク構造および繰返し技法を用いた「ページ格付け」アルゴリズム(PageRankアルゴリズム)に関し、Google検索エンジンのページ格付け法の基礎となっている。例えば、繰返しk+1におけるページPiのページ格付けをrk+1(Pi)とすると、ページ格付けアルゴリズムは次式のように表わされる:
Figure 2010507840

上式で、BPiは、Piへバックリンクするページの集合である。(非特許文献1参照)
一般に、ページ格付けは、そのページを指すページ数、つまり「インリンク」数に基づいてそのページの相対的な「人気度」または「重要性」を測る。図で示すと、図1は、6つのページ(ノード1〜6と記す)を表す有向グラフである。図示のノードおよびリンクを用いて、正規化ハイパーリンクマトリックスHを作成し、所与のノードiからノードjまでのリンクの状態を表すことができる。
Figure 2010507840

上記マトリックスで、式1は次のように書き換えることができる:
Figure 2010507840
現実には、ウェブ全体のマトリックスは、常に理想の状態を含むとは限らない巨大なマトリックスとなる。それゆえ、元のページ格付けアルゴリズムに多くの修正がなされた結果、以下の、GoogleマトリックスGで決着している:
Figure 2010507840
従って、各種の変形をすると、ページ格付け法は次のようになる:
Figure 2010507840

Gにべき乗法を適用するとこの式を解くことができる。
べき乗法を用いてウェブのページ格付けを計算するのには長時間を要するのが普通である。ページ格付けの計算に長時間を要するので、ある程度時間間隔をあけて格付けを更新するしかない。従って、開始時の格付け精度をその間隔の最後まで保てないのが普通である。「期限切れの」格付けは、まれにしか変更されないページにはさほど影響を与えないが、頻繁に変更されるページ(ニュースや現在催されているイベントを提供するページ等)では信頼性が低い。
ページ格付けには、他の注目すべき欠点も又幾つか存在している。一例として、ページ格付けには古いページを好む傾向がある。新しいページほど最初のうちは多数のリンクが張られないためである(既存のサイトの一部でない限り)。さらに、ウェブリンクの静的な性質に依存しているので、ページ格付けの値を容易に操作して(例えば、リンクファームを創作して)、検索結果の格付けを上げて広告リンクを稼ぐことができる。例えば、ページ格付けが低いどのページもページ格付けが高いページにリダイレクトできるので、ページ格付けの低いページを、それを指しているページのページ格付けと見なせるようにする。さらに、入ってくるリンクがないページをGoogleホームページにリダイレクトし、次回のページ格付け更新により、新しいページを高位のページ格付けに更新する(これはスプーフィング(なりすまし)と呼ばれ、ページ格付けシステムのもう一つの欠陥である)。これらの弱点および他の弱点は、どの文書がウェブコミュニティにとって実際に高価値をもつかを決定しようとするページ格付けの信頼性に著しい影響を与える。Googleは、リンクファームおよび人為的にページ格付けをつり上げるよう設計された他の手法に対して、積極的にペナルティを課していることが知られている。Googleがリンクファームや他のページ格付け操作ツールをどのように識別しているかは、Googleの企業秘密となっている。
「ページ格付けを計算するためのウェブのブロック構造の活用」(非特許文献2)、および米国特許出願公開第2005/0033742号(特許文献2)において、Kamvarらは、集約方式およびウェブ構造に基づいて、ページ格付けの処理時間を短縮化するための「ブロック格付け」と呼ぶ格付け技法を導入している。開示されたこれらの文書や技法は、必要な繰返し計算回数および繰返し1回あたりの処理量を低下させることを目的とした格付け技法を提供することにより、ページ格付けで生じる諸問題に取り組んでいる。概して、ブロック格付けモデルは、ウェブグラフをkブロックに分割し、ウェブグラフのコンパクト表現に計算を施すことにより、グローバルのページ格付けを近似する。コンパクト表現は、従来の集約方式を用いてホストのページを単一ノードに集約させることにより得られる。後述の非特許文献3および非特許文献4も参照のこと。
Kamvarらによれば、ローカルのページ格付けの値は、「ホスト相互間の」リンクを無視することにより、個々のホスト毎に計算することができる。従って、ブロックJ(Gjj)の「ローカルのページ格付けベクトル」(PageRankベクトル)ljは、ブロックJだけに(他のホストへの相互リンクを無視して)適用されるページ格付けアルゴリズム(PageRankアルゴリズム)による結果として、次のように定義することができる:
Figure 2010507840

上式で、開始ベクトルsJはnJ×1の一様な確率ベクトルであり、パーソナル化ベクトルvJは、ブロックJのルートノードと対応する要素(値は1)を除く他の要素が全てゼロのnJ×1のベクトルである。
ローカルのページ格付けに加えて、各ブロックの相対的な重要性を計算することもできる。従って、ウェブにk個のブロックがあると仮定すると、グラフの各頂点がウェブグラフ内のブロックと対応するブロックグラフBが得られる。二つのブロック間の辺BIJの重み付けは、次式で与えられる:
Figure 2010507840

また、ページ格付けマトリックスLがn×kマトリックスとなるようにマトリックス記法で表すこともでき、その列はローカルのページ格付けベクトルlJとなる:
Figure 2010507840
次いで、マトリックスSが、Lと同一構造をもつn×kマトリックスとなるように定義され、非ゼロの項目は全て1で置換される。従って、k×kのブロックマトリックスBは:
Figure 2010507840

上式で、Bは、ブロックIからブロックJへの遷移確率を表す遷移マトリックスである。次いで、変形したマトリックスにページ格付けアルゴリズムを適用して、ブロック格付けベクトルbを得る:
Figure 2010507840
さらに、Kamvarらによれば、グローバルのページ格付けは、各ブロック内のページのローカルのページ格付けlJと、要素bJがブロックJ毎のブロック格付け(ブロックの相対的な重要性を示す)であるブロック格付けベクトルbとを用いて近似することができる。従って、グローバルのページ格付けは、そのページが含まれるブロックのブロック格付けbJにより重み付けされたローカルのページ格付けljにより近似される。グローバルのページ格付けxは、次のマトリックス記法で近似できる:
Figure 2010507840
ブロック格付けモデルの一つの利点は、Kamvarらが記述しているように、ローカルのページ格付けベクトルの方が速く収束するので、繰返し計算が少なくて済むということにある。さらに、ローカルのページ格付けは、分散処理法または並列処理法、および/または事前計算法で計算することができる。場合によっては、将来、ローカルのページ格付けを再利用して応用することもできる。ブロック格付け近似の主たる欠点は、ホスト相互内のリンクを無視するので、幾つかの情報が圧縮または集約ステップで失われることである。しかし、この近似は、収束するまで拡張と収縮を繰り返すことにより改良することができる。もう一つの欠点は、モデルのブロックになんらかの一様な、またはありのままの地理的区分があるように見えないことであり、従って、そのブロックがどの母集団を代表しているかを決定することが困難となることがある。さらに重要なことに、ブロック格付けモデルは、静的リンクを取り扱うだけでトラフィックフローを考慮していない。ブロック格付けが静的リンクしか用いないので、PageRankが抱えているのと同じ問題を数多く持っている。
上記格付けの方法論は全て、ウェブの静的なリンク構造に基づいて、ページまたはサイトの人気度または関連性を測定する。しかし、このような技法はそのページに関するウェブトラフィック量を考慮していないので、ページの人気度または関連性の真の尺度をもたらさない。
Tomlinは、「ワールドワイドウェブ上のページを格付けするための新しい規範(A New Paradigm for Ranking Pages in the World Wide Web」(2003年)のなかで、トラフィックフローに基づいてページの人気度を測定するための代替法を紹介している(例えば、非特許文献5)。エントロピーに基づく手法を用いて、トラフィックフローが、ワールドワイドウェブ全体、集約したワールドワイドウェブ、またはワールドワイドウェブのサブグラフにおける循環フロー保存条件に従うものとする。トラフィックフローの手法によれば、トラフィック格付けpijは、ページiからページjに入るリンクの全てのウェブトラフィックに対する比率と見なされる(全てのpijの合計=1と仮定する)。次いで、下記の最適化問題を用いてトラフィック格付けモデルのpijを得ることができる。
Figure 2010507840

(「max」はその右に表示する式の値を最大化する意)
従って、PageRankまたはブロック格付けの手法とは対照的に、トラフィックフローモデルは、ノードへの静的なリンク数ではなく、ノードへの、および/またはノードからのトラフィック量に基づいて、ページつまりノードの「人気度」を測る。
「トラフィック格付け」と呼ばれる別のトラフィックフロー技法を、Alexa Internet社が用いている(例えば、非特許文献6)。概して言えば、Alexa社の方法は、数百万人のAlexaツールバーユーザーのインターネットトラフィックを解析することにより(トラフィック格付けは、数ヶ月間のトラフィックデータの集計に基づくのが典型的である)、ウェブサイトのトラフィック格付けを計算する。しかし、この手法の一欠点は、このようなトラフィック格付けは本質的に偏っているので、グローバルのインターネット母集団を代表するサンプルを必ずしも反映していないことである。例えば、Alexaツールバーは、Internet Explorerブラウザとしか連携せず(すなわち、Mozilla、AOL、Netscape等はサポートしない)、Windows(登録商標)オペレーティングシステム上でしか動作しない。さらに、場合によって、トラフィック格付けの計算は、ページ格付け計算より時間を要することがある(特に、大規模になる程)。
以下の文献を本明細書で引用した。これら文献は、米国特許および特許明細書の刊行物を含むが必ずしも限定はしない。上記引用した他の文献と同様に、その全文を引用して本明細書に組み込む。
米国特許第6,285,999号 米国特許出願公開第2005/0033742号
Amy N. Langville and Carl D. Meyer.「Googleのページ格付けおよびその後(Google’s PageRank and Beyond)」P32-33, 95-96, 136-137. Princeton University Press, 2006. Kamvar, S.D., Taher H. Haveliwala, Chirstopher D. Manning, and Gene H. Golub.「ページ格付けを計算するためのウェブのブロック構造の活用(Exploiting the block structure of the Web for computing PageRank) 」Technical Report 2003-17, Stanford University, 2003. Anderi Broder, Farzin Maghoul, Ronny Lempel, and Jan Pedersen. 「グラフ集約によるページ格付けの近似法(Efficient PageRank Approximation via Graph Aggregation)」WWW2004, New York, ACM Press. Gui-Rong Xue, Qiang Yang, Hua-Jun Zeng, Yong Yu and Zheng Chen.「リンク解析のための階層構造の活用(Exploiting the Hierarchical Structure for Link Analysis)」SIGIR 2005, Salvador, Brazil. ACM Press. John A. Tomlin.「ワールドワイドウェブ上のページ格付けのための新しい規範(A new paradigm for ranking pages on the World Wide Web)」In the Twelfth International World Wide Web Conference, New York, 2003. ACM Press. Alexa Internet, Inc.; http://www.alexa.com/prod_serv/traffic_learn_more.html
上記のように、既存のページ格付け技法には既に多くの欠点があり、その上、ISPの運営レベルでサービスタスクを実行する能力に欠けているので、このようなシステムおよび方法の機能性と能力が制限される。検索エンジンは、現在、インターネットの雲のように大きな計算集団の中央部でグローバルに運営されているので、クエリーをそのリクエストの起点に対して解決することができない。従って、検索エンジンが、信頼性の高いビジネスサービスを実施し、マーケットチャンネル追跡、ウェブページ使用量、およびDNS統計等を追跡するのには限りがある。これらのサービスおよび追跡は、現在、ISPが存在するインターネットの局所のみで可能である。
このように、ページ格付けをさらに迅速かつ効率的にする必要性が依然として残っている。加えて、特定のユーザーやユーザーグループ、またはユーザーやユーザーグループの振舞い、との関連性を強めた方法でページ格付けを行う必要性も存在している。さらに、参加しているサービスパートナーおよび/またはISPに、価値のあるセッションデータ、および/または一つ以上のクエリーに対して関連性がさらに高い情報を返す能力、を提供する必要性も依然として残っている。
本発明は、当技術分野で既知の他の方法およびシステムよりも適切で、かつ効率的な、ノード、ページおよび/またはホストを格付けするための方法およびシステムを提供する。本方法およびシステムは、概して、インターネットインフラストラクチャのインターネットサービスプロバイダ(ISP)レベルで適用され、ISPまたはISP群に特有の情報を使用する。そのようなISPには:ユーザーへの静的または動的なIPアドレスを管理する商業ISP;ユーザーへの静的または動的な内部IPアドレスを管理する企業;法人;または組織が含まれる。広義には、本方法およびシステムは、ISPのDNSを調べ、検索シーケンスに対する一つ以上の検索ベクトルを作成するトラフィック格付けを各ISPで行う。本発明が提供する解決策は、拡張可能で効率が高く、かつ実効性がある。一つ以上のISPを通じてサービスを提供することにより、国内またはグローバルの検索エンジンに全面的に頼る必要がなくなる。従って、国内またはグローバルの広告コンテンツプロバイダに全面的に頼る必要もなくなり、広告コンテンツを地理的関連性に基づいてネットワーク(例えば、インターネット)ユーザーに届けることが可能になる。また、ユーザーの振舞いを中心にした検索結果の個人化が可能になる。より高速度とタイムリーさにより、広告コンテンツ等の時間に依存する関連コンテンツをネットワーククエリーに応じて届けることもできる。
第1の観点では、本発明は、DNSデータに基づいてユーザーリクエストを表すセッションマップを作成するための方法を提供する。本発明によれば、セッションマップの情報を用いてページおよび/またはホストを格付けすることができる。言うまでもなく、本明細書で開示される方法およびシステムは、任意の集合および/またはサブ集合;クラスおよび/またはサブクラス;交換および/または延長;親ノードおよび/または子ノード等の格付けに適用できるので、ページおよび/またはホストに限定するという意味はなく、これらは例示にすぎない。一般に、本方法は:a)特定セッションのページリクエストを含むDNSデータを取得するステップ;b)一人以上のユーザーに対して、ページリクエストおよび/またはホストリクエストの一つ以上のシーケンスを、DNSデータに基づいて識別するステップ、およびc)特定セッションのページシーケンスおよび/またはホストシーケンスのセッションマップを作成するステップを含む。好適な実施の形態では、本方法は、ISPを通過するDNSルックアップに基づいて、ISPでのインターネットトラフィックを格付けするステップ、およびクエリーを提出しているユーザーに格付けした検索結果を提供するステップを含む。本方法は、一つ以上のコンピュータプログラム等で構成されるコンピュータソフトウエアにより実装することができる。
別の観点では、本発明は、ページおよび/またはホストを格付けするための方法を提供する。一般には、本方法は:a)特定セッションのページリクエストを含むDNSデータを取得するステップ;b)一人以上のユーザーに対して、ホストリクエストの一つ以上のシーケンスをDNSデータに基づいて識別するステップ、およびc)識別したホストシーケンスに少なくとも一部は基づいてページを格付けするステップを含む。本方法は、ISPを通過するDNSルックアップに基づいて、ISPでのインターネットトラフィックを格付けするステップを含んでもよい。DNSルックアップを用いて各種のウェブサイト、ウェブページ、ホスト等のトラフィック格付けを行うことができる。好適な実施の形態では、本方法は、クエリーを提出しているユーザーに格付けした検索結果を提供するステップをさらに含み、その格付けした検索結果は、格付けに基づいたURLまたはリンクのリストとして表される。本方法は、一つ以上のコンピュータプログラム等で構成されるコンピュータソフトウエアにより実装することができる。
さらに別の観点では、本発明はハードウエアを提供する。そのハードウエアは、概しては、データおよび/またはコンピュータコードを処理するための少なくとも一個のプロセッサを備える。従って、これは典型的にはコンピュータまたは演算装置である。そのハードウエアは、コンピュータハードウエアに適用可能な当技術分野で既知の任意のコンポーネントを適宜備えることができる。例えば、ハードウエアは、Paxfire社(バージニア州Herndon)から入手可能な形態のような、インターネットアプライアンス等のコンピュータでもよい。同様に、ハードウエアは、ISPが所有および/または運用するDNSサーバ等のコンピュータでもよい。
別の観点では、本発明は、ページおよび/またはホストを格付けするためのシステムを提供する。本システムは、概しては、DNSデータに部分的に基づいて検索結果を格付けするために、例えば、ISPを通過するDNSルックアップに基づいてISPでのインターネットトラフィックを格付けするために、またはセッションマップを作成するために、併せて実装できるコンピュータハードウエアおよびコンピュータソフトウエアを備える。必ずしも必要とは限らないが、本システムは、一つのISPが所有および/または運用する一個以上のプロセッサを備えることが多い。典型的な構成では、一台以上のDNSサーバを本システムの一部とする。本システムは、ユーザーが提出した検索に対して、例えば、広告コンテンツのようなものの、内容関連、地理的関連、および/または時間依存または時間関連の結果を伴う格付け結果を提供することもできる。
さらに別の観点では、本発明は、コンピュータプログラム、ファイル、データ等を格納するための格納媒体を提供する。この格納媒体は、コンピュータ情報の長期または短期格納用の既知の任意媒体でよい。実施の形態によっては、格納媒体は携帯式格納媒体であり、コンピュータに挿入し、取り外すことができる。
さらに別の観点では、本発明は、好ましくはインターネット等のネットワークに接続されているコンピュータを用いてビジネスを行う方法を提供する。概しては、ビジネスを行うための本方法は、ネットワーク上のページおよび/またはホストを格付けするステップ;これら格付けされたページおよび/またはホストに基づく検索結果を提供するステップ;およびその結果の受信者、提供者またはその両者に、結果を提供するための料金を請求するステップを含む。ビジネスを行う方法に基づき、ページ格付けが本発明の方法により実行される。
有向ウェブグラフの一部を示す図である。 本発明の一実施の形態を表すフロー図である。 本発明の別の実施の形態を表すフロー図である。 本発明のさらに別の実施の形態を表すフロー図である。 本発明のシステムおよび方法が、どのようにISPレベルで実装されるかを示す図である。
本発明の各種例示の実施の形態を付帯の図面で示し、詳細に参照する。以下の詳細な説明は、本発明の特定の実施の形態について説明するが、本発明をこれら実施の形態に限定すると見なすべきでない。
第1の観点では、本発明は、DNSデータに基づいてセッションマップを作成し、および/またはページやホストを格付けする方法を提供する。全般的には、本方法は:DNSデータを用いてページを格付けする方法を含み、この方法は:特定のセッションのDNSデータを取得するステップ;DNSデータに基づいて一つ以上のホストリクエストシーケンスを識別するステップ;および識別したホストシーケンスに少なくとも一部は基づいてページおよび/またはホストを格付けするステップを含む。例えば、本方法は:a)特定セッションに対するページリクエストを含むDNSデータを取得するステップ;b)一人以上のユーザーに対して、ページリクエストおよび/またはホストリクエストの一つ以上のシーケンスを、DNSデータに基づいて識別するステップ;およびc)特定セッションのページシーケンスおよび/またはホストシーケンスのセッションマップを作成するステップを含んでもよい。実施の形態では、a)一つ以上のISPからDNSデータを取得するステップをさらに含む。実施の形態では、b)ページリクエストを、各ページが格納されているホストへ集約してホストリクエストのシーケンスを形成するステップをさらに含む。さらに別の実施の形態では、本方法は、グローバルのホスト格付けベクトルとローカルのページ格付けベクトルとの組合せに基づいて、グローバルのページ格付けベクトルを近似するステップをさらに含む。
実施の形態では、本方法は、一つ以上のISPを通過するDNSルックアップを用いて、ISPレベルでページおよび/またはホストを格付けする。本方法には、クエリーを提出しているユーザーに、格付けした検索結果を提供するステップも含まれ、その格付けされた検索結果は、格付けに基づいたURLまたはリンクのリストとして提示される。検索結果には、検索クエリーに基づく広告コンテンツを追加して含めてもよい。本方法は、一つ以上のコンピュータプログラム等で構成されるコンピュータソフトウエアにより実装することができる。
一実施の形態によれば、本発明は、ユーザーリクエストの一つ以上のセッションマップを作成する。セッションは、関心のある特定の時間フレームでもよい(例えば、分)。代替として、セッションは時間ベースでなく、一つ以上の既知のユーザーまたはユーザーグループのリクエストに基づいて線引きしてもよい。セッションマップを作成するために、特定のセッションに対するDNSデータ、例えばルックアップデータ等、を取得する。このようなデータには、なかでもIPアドレス、ホスト名およびドメイン名を含む。ウェブサーバープロキシは、以下のデータ、即ち:リクエストされたページのユニフォームリソースロケータ(URL)、タイプ入力されたキーワード、リクエスト時間および/または参照URL等、を取得することができる。さらに、訪問したページのシーケンスを、例えばISPが提供したような、リクエスタのIPアドレスにより決定することができる。ページシーケンスを、例えば各ページが格納されたホストに圧縮し、ホストリクエストのシーケンスを形成することができる。次いで、ホストリクエストのシーケンスから、一つ以上のセッションマップおよび/またはセッションベクトルを形成し、オプションでそれらを用いて、セッション中に訪問したホストおよび/またはページが、それらセッションマップおよび/またはベクトルに既に織り込み済みであると見なして、ホストおよび/またはページの格付け計算を高速化することができる。
他の実施の形態は、追加または代替のステップを含む。例えば、実施の形態によっては、本方法は、ユーザーの振舞いを追跡および/または予測するために、セッションベクトルおよび/またはセッションマップを用いるステップ、および/またはクエリーに答えてユーザーに格付け結果を提供するステップを含む。実施の形態では、ページ格付けの動作は、動的なトラフィックフローモデルおよび/または静的なページ格付けモデルに少なくとも一部は基づいてページを格付けするステップを含み;またはセッション内のホストに対するグローバルのホスト格付けベクトルを計算するステップ、セッション内の各ホストのページに対するローカルのページ格付けベクトルを計算するステップ、およびグローバルのホスト格付けベクトルとローカルのページ格付けベクトルとの組合せに基づいてグローバルのページ格付けベクトルを近似するステップを含む。
別の観点では、本発明は、ページおよび/またはホストを格付けするための方法を提供する。概して、本方法は、ISPを通過するDNSルックアップに基づいて、ISPでのインターネットトラフィックを格付けするステップを含む。従って、本方法は、DNSセッションデータを用いてページを格付けするための方法でもよく、この方法は:a)特定のセッションに対する、ページリクエストのホストを含むDNSデータを取得するステップ;b)そのDNSデータに基づいて、一人以上のユーザーに対して、ホストリクエストの一つ以上のシーケンスを識別するステップ;およびc)ホストの識別されたシーケンスに少なくとも一部は基づいてページを格付けするステップを含む。この方法には、クエリーに応えてユーザーに格付け結果を提供するステップをさらに含めることができる。実施の形態では、c)のステップは、動的なトラフィックフローモデルおよび/または静的なページ格付けモデルに基づいて、ページを格付けするステップを含む。
本方法は、DNSセッションデータを用いてページを格付けする方法でもよく、その場合、この方法は:a)特定のセッションに対する、ページリクエストのホストを含むDNSデータを取得するステップ;b)そのDNSデータに基づいて、一人以上のユーザーに対して、ホストリクエストの一つ以上のシーケンスを識別または関連付けるステップ;c)各ページが格納されているホストにページリクエストを集約させて、ホストリクエストのシーケンスを形成するステップ(DNSを用いて実行できる);およびd)ページおよび/またはホストのリクエストの識別されたシーケンスに基づいて、ページおよび/またはホストを格付けするステップを含む。この方法は、d)のステップの一部として、セッション内のホストに対するグローバルのホスト格付けベクトルを計算するステップ;セッション内の各ホストのページに対するローカルのページ格付けベクトルを計算するステップ;および/またはグローバルのホスト格付けベクトルとローカルのページ格付けベクトルとの組合せに基づいて、グローバルのページ格付けベクトルを近似するステップをさらに含んでもよい。
実施の形態では、本方法は、クエリーを提出しているユーザーに格付けした検索結果を提供するステップを含み、その格付けされた検索結果は、格付けに基づいたURLまたはリンクのリストとして提示される。検索結果には、検索クエリーに基づく広告コンテンツを追加して含めることができる。実施の形態のいかんに関わらず、本方法は、例えば一つ以上のコンピュータプログラム等で構成されるようなコンピュータソフトウエアにより実装してもよい。
さらに別の実施の形態では、一つ以上のISPによる「グローバル」ページ格付けの計算は、一つ以上の他のISPによるページ格付け計算、または一つ以上の他のISPに対するページ格付け計算と組み合せて、より大きな群またはグループに相当するページ格付けを形成することができる。例えば、第1のISP(例えば、Comcast)による「グローバル」ページ格付けは、第2のISP(例えば、Verizon)による「グローバル」ページ格付けと組み合せて、より大きな群(例えば、地理的領域が広い、および/または包括的なユーザーサンプル)のページ格付けを形成することができる。
言うまでもなく、本発明の一つの観点は、コンピュータが本発明の方法の内の一つ以上を実行するための命令を提供するコンピュータプログラムである。本コンピュータプログラムは、任意の適切なコンピュータ言語で書かれてもよく、ソースコードまたはオブジェクトコードの形式でよい。本コンピュータプログラムは、当業者がコンピュータコードで実行されるべきステップを認識できる適切な情報を提供するフロー図、アルゴリズム、またはダイヤグラムで表されてもよい。コンピュータプログラムは、単一のコードユニットでもよく、ルーチン、サブルーチン、モジュール等のマルチユニットを含んでいてもよい。本コンピュータプログラムは、二つ以上の命令セットの形式でもよく、それぞれが本発明の一つ以上の方法を実施するための命令の幾つか、または全てを提供する。本コンピュータプログラムは、単一のハードウエア(例えば、コンピュータ)上の単一ユニットとして全体を実装してもよく、または一台のコンピュータに部分的に実装してよく、一台以上の他のコンピュータに他の部分を実装してもよい。さらに、本コンピュータプログラムを一台以上のコンピュータに格納して、別の、または他のコンピュータ上で実行してもよい。
さらに別の観点では、本発明は、ハードウエアを提供する。概しては、本ハードウエアは、データおよび/またはコンピュータコードを処理するための少なくとも一個のプロセッサを備える。本ハードウエアは、コンピュータハードウエアに適用可能な当技術分野で既知の任意のコンポーネントを適宜備えることができる。本発明のハードウエアで使用する電子コンポーネントおよび接続は、本発明のハードウエア(および、システム)の他の全ての構造要素と同様に、コンピュータ業界で普通に用いられるものである。本明細書で用いる場合、用語「ハードウエア」、「インターネットアプライアンス」、および「装置」は、他に特記しない限り、交換可能に用いられる。従って、インターネットアプライアンスに言及するとき、限定はしないが、意図する目的に役立つDNSサーバまたは類似のコンピュータを含む任意の適切なコンピュータへの参照を含む。
本明細書で使用するとき、プロセッサは、コンピュータシステムのフレームワーク内の情報を処理できる任意のハードウエア、ソフトウエア、またはそのどちらかもしくは両方またはそれ以上の組合せである。プロセッサの例には、限定はしないが、中央処理ユニット(CPU)、回路基板、チップ、ソフトウエア等を含む。マルチプロセッサを用いる場合、直列または並列に接続することができる。すなわち、マルチプロセッサは、そのプロセッサだけが提供する機能であれ、冗長な機能であれ、他のプロセッサと共有する機能であれ、割り当てられた機能を実行でき、その一方で、他のプロセッサは、割り当てられた機能を実行するか、または一個以上の他のプロセッサがその機能を完了させた後だけ、一個以上のプロセッサが動作可能となる。
本発明のインターネットアプライアンスは、概ね、本発明の少なくとも一つの方法を実行するための命令を含む、コンピュータプログラムまたはプログラム群を実行する能力をもつ少なくとも一個のプロセッサを備える。実施の形態では、本装置は、複数のプロセッサを備え、それぞれは、命令の幾つかを実行し、または命令の幾つかもしくは全ての実行を共有する。本装置が、システムの一部となる場合(詳細は後述する)のように、他のハードウエア(本発明のインターネットアプライアンスではないハードウエアを含む)とタスクを共有する場合、各種ハードウエア個体間になんらかの方法で分散された複数のプロセッサがあるのが普通である。実施の形態によっては、インターネットアプライアンスは、状況によってはDNSサーバのこともある単一のハードウエア上に物理的に配置できる一個または二個のプロセッサを備える。実施の形態では、このハードウエアは、既存システムまたはハードウエア個体にプラグインとして実装されるインターネットアプライアンスを備える。インターネットアプライアンスは、インターネットアーキテクチャのレイヤ2、レイヤ3、またはレイヤ4を含む任意のレイヤに実装することができ、例えば、Paxfire社(Herndon、バージニア州)から入手可能な形態のインターネットアプライアンスでもよい。一般大衆に周知のようなコンピュータであることに加えて、ハードウエアは、一般大衆が普通はコンピュータと呼ばない任意の他の形式の演算装置であっても、あるいはその装置を備えてもよい。例えば、ハードウエアは、携帯型の通信装置、情報を格納、検索できる携帯型電子装置等とすることができる。
実施の形態では、本発明は、特定セッションに対するDNSデータを取得するよう構成されたプロセッサ;そのDNSデータに基づいてホストリクエストの一つ以上のシーケンスを識別するよう構成されたプロセッサ;および識別されたホストシーケンスに少なくとも一部は基づいてページおよび/またはホストを格付けするよう構成されたプロセッサを備えるインターネットアプライアンスを提供する。状況によっては、ページおよび/またはホストを格付けするよう構成されるプロセッサは:セッション内のホストに対するグローバルのホスト格付けベクトルを計算し;セッション内の各ホストのページに対するローカルのページ格付けベクトルを計算し;そしてグローバルのホスト格付けベクトルと、ローカルのページ格付けベクトルとの組合せに基づいてグローバルのページ格付けを近似するようさらに構成される。本アプライアンスの一個以上のプロセッサは、トラフィックフローモデルを用いてグローバルのホスト格付けベクトルを計算するような、ページおよび/またはホストの格付けができるようさらに構成されてもよい。
従って、本発明によれば、実施の形態では、インターネットアプライアンスが提供され、その製品は:特定セッションに対するDNSデータを取得するための手段;そのDNSに基づいてホストリクエストの一つ以上のシーケンスを識別するための手段;およびホストの識別されるシーケンスに少なくとも一部は基づいてページおよび/またはホストを格付けするための手段を備える。実施の形態では、本アプライアンスまたは装置は、特定セッションに対するDNSデータを取得するための手段;ページリクエストの一つ以上のシーケンスを識別するための手段;ページリクエストを、各ページが格納されたホストに圧縮、または集約して、ホストリクエストのシーケンスを形成するための手段;および特定セッションに対するホストシーケンスおよび/またはセッションベクトルのセッションマップを作成するための手段を備える。本発明のインターネットアプライアンスは:ホストリクエストの一つ以上のシーケンスから一つ以上のセッションベクトルを作成するための手段;および一つ以上のセッションベクトルからセッションマップを作成するための手段をさらにまたは代替として備えることができる。本発明のインターネットアプライアンスは:セッションベクトルおよび/またはセッションマップに基づいて、ユーザーの振舞いを追跡および/または予測するための手段もさらにまたは代替として含んでもよい。同様に、本インターネットアプライアンスは:動的トラフィックフローおよび/または静的ページ格付けモデルを用いてセッションのページおよび/またはホストを格付けするための手段、および/またはクエリーに応えてユーザーに格付け結果を提供するための手段を実装することができる。
従って、言うまでもなく、本発明の幾つかの実施の形態によれば、インターネットアプライアンスが提供され、そのアプライアンスには:一群のページを各ページが格納されたホストに圧縮、または集約するための手段;トラフィックフローモデルに基づいてグローバルのホスト格付けベクトルを計算するための手段;各ホスト内のその群のページに対するローカルのページ格付けベクトルを計算するための手段;およびグローバルのホスト格付けベクトルと、ローカルのページ格付けベクトルとの組合せに基づいてグローバルのページ格付けを推定するための手段が含まれる。本インターネットアプライアンスは、以下の手段の内の一つ以上の手段:一個以上のプロセッサからDNSルックアップデータを収集または取得するための手段;DNSルックアップデータからページリクエストの一つ以上のシーケンスを識別するための手段;各ページが格納されたホストにページリクエストを圧縮、又は集約したホストリクエストのセッションマップを形成するための手段;およびページ格付けモデル、トラフィックフローモデル、またはそれらの適切な組合せを用いることによりセッションマップ内のページおよび/またはホストを格付けするための手段を備えてもよく、または代替として備えてもよい。例えば、一実施の形態では、本インターネットアプライアンスには:トラフィックフローモデルに基づいてグローバルのホスト格付けベクトルを計算するための手段;ページ格付けモデルを用いて各ホスト内のページに対するローカルのページ格付けベクトルを計算するための手段;およびグローバルのホスト格付けベクトルと、ローカルのページ格付けベクトルとの組合せに基づいてグローバルのページ格付けを推定するための手段が含まれる。
別の観点では、本発明は、ページおよび/またはホストを格付けするためのシステムを提供する。本システムは、一つ以上のISPが所有および/または運用する一個以上のプロセッサからのDNSデータおよび/または格付けを組み合せて、一つ以上の仮想的検索エンジンを形成するための分散システムとしてもよい。概しては、本システムは、ISPを通過するDNSルックアップに基づいてISPでインターネットトラフィックを格付けするために、すなわち、本発明の一つ以上の方法を実装するために、併せて実装することができるコンピュータハードウエアおよびコンピュータソフトウエアを備える。必ずしも必要とは限らないが、本システムは、ISPが所有および/または運用する一個以上のプロセッサを備えることが多い。典型的な構成では、一台以上のDNSサーバを本システムの一部とする。本システムは、ユーザーが提出した検索に対して、コンテンツ関連、地理的関連、および/または時間依存または時間関連の結果を伴う格付け結果を提供することもできる。
本システムの実施の形態によれば、ソフトウエアおよび/またはハードウエアが提供される。本ソフトウエアは、本発明の方法ステップを実装するための一つ以上のコンピュータ読取り可能媒体に格納された命令を備える。好適な実施の形態では、本システムは、少なくとも一つの本発明のインターネットアプライアンスを備え、本システムは、一台以上のISP DNSを含む一つ以上のISPにより実装される。例えば、そのようなシステムを示す図5を参照のこと。これらの実施の形態では、インターネットアプライアンスの各種のハードウエア、ソフトウエア、および機能ユニットを、一台以上のISP DNSサーバ上に、もしくはそのISP DNSサーバとは別のハードウエアにあるプロセッサ上に、または一台以上のISP DNSサーバもしくはプロセッサ上に部分的に、かつ別のハードウエア上に部分的に実装させることができる。特定の実施の形態では、本インターネットアプライアンスは、ISP DNSサーバまたはプロセッサとは別の、ハードウエア上に全体が提供される。一般的なハードウエアと同様に、本発明のインターネットアプライアンスと、ISP DNSサーバまたはプロセッサとは、ケーブル、線材等で物理的に接続することができる。接続は、直接(すなわち、コネクタ以外にハードウエアを介在させずに一方から他方へ)でも間接(すなわち、回路基板、フィルタ等の一つ以上の他のハードウエアデバイスでもよい。他の実施の形態では、接続は物理的でない(例えば、赤外線信号、無線信号、マイクロ波信号、光信号等の電磁エネルギーを介する接続)。特定の実施の形態では、本インターネットアプライアンスは、ISP DNSサーバまたはプロセッサ内に直接実装される(例えば、回路基板をサーバに挿入して)。他の実施の形態では、特定の機能がISPサーバまたはプロセッサ内に直接実装され、一方、他の機能は、一つ以上の他の物理的コンポーネントに物理的または非物理的に実装される。実施の形態では、本インターネットアプライアンスは、ISPレベルでDNSセッションログを格納/生成する少なくとも一つのプロセッサを備える。
本システムおよび方法が動作するレイヤとは無関係に、本システムおよび方法は、必ずしも必要とは限らないが、レジストリまたはISPサーバになんらかの新規のハードウエアまたはソフトウエアを組み込まなくても実装することができ、従って、モジュール式で、非常に適合性があり、一台または多数のサーバに実装し、更新するのが容易かつ経済的である。実施の形態では、本システムおよび方法がレイヤ2で機能する場合のように、本発明のハードウエア、ソフトウエア、およびシステムは、非ASCIIの文字セットを解読できるので、各種のアジア言語等のASCIIがカバーしていない言語で格納されたセッションデータでは有利である。さらに、本発明のインターネットアプライアンスは、部分的にまたは全体的にソフトウエアとして提供できるので、迅速、容易、かつ安価に実装し、維持管理(例えば、更新)することができる。さらに本発明は、任意のブラウザ、オペレーティングシステム等とともに実装してもよい。
本発明のシステム(および方法)の実施の形態では、ユーザーの識別は、特定のDNSリクエストを特定のリクエスタと結び付けるためのリクエスタのIPアドレスにより決定することができる。本発明のシステムおよび方法がISP DNSレイヤにあるか、またはその前にある場合、特に、レイヤ2処理を利用する場合、リクエスタのIPアドレスをマッピングして、メディアアクセスコントロール(MAC)アドレスに結び付けることができる。さらに、特定のIPアドレスをMACアドレスに結び付ける機能により、本発明のシステムおよび方法により提供されるオプトイン/オプトアウト機能を効率化することもできる。さらに、クエリーが特定のIPアドレスから実行されると、ホストシーケンスの識別を含むセッションベクトル|S|をISPレベルで作成することができる。次いで、各種のアルゴリズム(遺伝的アルゴリズム等)を用いてホストのシーケンスを一致させてセッション一致の点数を得る。次にこれら点数を用いて将来訪問するページの確率を予測する。キーワードをホストにマッピングすることにより、その人が探していることのコンセプトマップを構築することができる。
好適な実施の形態では、本発明は、インターネット検索エンジン機能を部分的または全体的にISPサーバマシン内に、またはISPとユーザーとの間もしくはDNSサーバとユーザーとの間に部分的もしくは全体的に置かれる別のサーバとしてインテグレートする。一般的に一台または一個のハードウエアおよびソフトウエアとして本明細書では表しているが、本発明は、何か他の機能ユニットと同一または別のハードウエア上に、それぞれが独立して実行されている機能ユニットとして実装できる。実施の形態では、ISP DNSおよびインターネットアプライアンスは、本発明のシステムおよび方法の一部を実現する機能的プラットフォームである。ISP DNSおよび/またはインターネットアプライアンスは、一台(例えば、サーバ)または複数台のハードウエアを備えることができる。ISP DNSおよび/またはインターネットアプライアンスは、ユーザーのセッションデータが提供する情報を解析し、関連性が高い格付けを提供するためのセッションマップおよびセッションベクトルを作成することができる。
従って、重要な点は、本発明の様々なハードウエアおよびシステムの機能は、ハードウエアおよびソフトウエアにより実装されているが、機能要素で作りあげたプラットフォームであるということである。従って、各プラットフォームは、単一または複数個の異なるハードウエア上で存在できる。さらに、各機能ユニットは、同一の地理的区域に配置されるか、または広範に分散した地理的区域に配置されている単一または複数個の異なるハードウエア上に設けられる。異なるハードウエア上に、直接接続されるか、または一つ以上のハードウエアを介在させて接続される異なる機能を実装することは、当業者には既知である。同様に、異なるハードウエア上に配置されるか、または本システム内に複数のコピーとして存在する異なる機能を制御するためのソフトウエアは本発明の一部であるが、本発明の実施者が様々な要望に基づいて実装できる本方法およびシステムの特定の態様をさらに制御するために実装できる他のソフトウエアを、当業者が並外れたまたは十分な経験がなくても、本発明にインテグレートすることができる。
特定の実施の形態では、本インターネットアプライアンスは、特定のリクエストしているコンピュータまたはISPに関連する格納されているプロファイルに基づいて、顧客特有のコンテンツ、地理関連コンテンツ、および/または時間関連コンテンツを返すことができる。広告パートナー、検索エンジンパートナー、広告ネットワーク、広告ネットワークの販売店等の、参加しているISPパートナーは、特定の顧客に関連するコンテンツ、リクエストしているコンピュータまたはISPの場所に関連するコンテンツ、および/またはクエリーの主題に基づいてコンテンツを返す。これは、参加しているISPパートナーに共通のアプリケーションプログラムインターフェース(API)により実行することができ、または参加しているISPパートナーによって定義することができる。本インターネットアプライアンスは、オプションとして、参加パートナーからのコンテンツと共に格付け結果ページを作成し、送信できる。さらに、ISPに関連する格納されているプロファイル情報に基づくか、またはリクエスタのIPアドレスに基づいて、結果ページをリアルタイムで、および/またはオンザフライで動的に作成することができる。IPアドレスを用いて、既知の個人ユーザーと見なせるまでリクエスタを突き止めることができ、および/またはリクエストしているコンピュータの地理的位置に関する情報を提供することができる。
本発明のハードウエア(例えば、インターネットアプライアンス)の特定アーキテクチャ構成の有利な一特徴は、このハードウエアを汎用ソフトウエアエンジンにできるという点にある。このように、このハードウエアは、本発明のソフトウエアモジュール以外のソフトウエアモジュールを動作させて、このインフラストラクチャーレイヤで他のサービスを配布することができる。例えば、実施の形態では、このハードウエアはDNSサーバでもよく、またはDNSサーバの一部を備えてもよい。好評なのは、このソフトウエアがC++、Java(登録商標)等の従来の言語を用いてプログラム可能ということである。さらに、注意すべきは、このハードウエアが、例示の実施の形態で図示し、説明したハードウエアの個数または配置に限定されないということ、および別の実施の形態では、コンピュータおよびインターネットトラフィックサーバが実行するのが典型的な様々な機能のために実装されるような、他のハードウエアおよびソフトウエアを含めることができることである。本発明のハードウエア、特にインターネットアプライアンスを、理解すべき機能の観点から説明してきたが、言うまでもなく、このハードウエアは、これらおよび他の機能を提供するが、本明細書で説明したそれぞれの実施の形態における機能を全て提供する必要はない。
さらに別の観点では、本発明は、コンピュータプログラム、ファイル、データ等を格納するための格納媒体を提供する。この格納媒体は、コンピュータ情報を長期間または短期間格納するための任意の適切な媒体でよい。実施の形態によっては、この格納媒体は、コンピュータに挿入し、取り外すことができる携帯式格納媒体である。従って、この格納媒体は、磁気式格納媒体、光学式格納媒体等とすることができる。従って、この格納媒体は、コンピュータソフトウエアを格納するのに適したハードディスクドライブ、テープ、フロッピー(登録商標)ディスク、RAM、メモリースティック、CD、DVD、不揮発性メモリーカード、光磁気ディスク等の媒体であってもよい。実施の形態では、DNSサーバまたは他のコンピュータの一部をRAMが構成している。格納媒体には、格納されるコンピュータプログラムまたはその一部が提供することができ、そのコンピュータプログラムまたはその一部には、本発明の方法またはその一部を実行するための命令が含まれる。格納媒体は、本発明に基づく少なくとも一個のハードウエアに、物理的または機能的に接続されることが好ましい。実施の形態では、格納媒体は、本発明のシステムの一部を構成する。
さらに別の観点では、本発明は、好ましくは、インターネット等のネットワークに接続されているコンピュータを用いて、ビジネスを行う方法を提供する。概しては、ビジネスを行う方法は、ネットワーク上のページおよび/またはホストを格付けするステップ;これら格付けされたページおよび/またはホストに基づく検索結果を提供するステップ;およびその結果の受信者、提供者またはその両者に、結果を提供するための料金を請求するステップを含む。多様な実施の形態では、本発明により、ISPが分散型検索エンジンとして機能できるようになる。このような検索エンジンの能力を、本インターネットアプライアンスおよび/またはISP DNSの全体または一部に実装することができる。さらに、リクエストしているコンピュータと地理的に最も近いという高い検索結果の格付けは、ビジネス専用のサーバを維持管理するISPおよび/または企業のようなDNS運営者のビジネス機会および収入を生み出すことになる。従って、この結果は、クエリー主題、クエリー発信点、クエリー発信点の地理的場所、クエリー提出時間、インターネットインフラストラクチャの提供情報、または二つ以上のこれらの組合せに対して非常に関連性が高くなる。
さらに別の実施の形態では、本方法は、広告主が提供する情報はもとよりDNSデータの組合せに基づいてページおよび/またはホストを格付けし、これらの格付けに基づく検索結果を提供する。従って、ビジネスを行う本方法には、広告主、ユーザーおよび/またはISPプロバイダに利益を与えるインターネットを用いて、広告の的を効果的に絞るための方法が含まれる。例えば、リクエスタの場所を用いて、キーワード検索に応じた地理的関連情報を提供することができる。その結果、リクエストしているコンピュータの在る概略の区域、または特定の区域の企業広告だけが、検索結果とともに表示されることになる。結果的に、リクエスタは地理的領域内の企業の広告を見て、広告主は顧客に的を絞った効果的な広告を受け取ることになる。同様に、検索タームと関連するビジネスのローカル企業のウェブページは、国内または世界の他の場所の企業からのウェブページよりずっと高く格付けされる可能性がある。さらに、リクエスタの地理的場所は、効率的に広告の的を絞る際に広告主にとって非常に関心があるが、場所に基づいてより高く格付けされたインターネット検索結果を提供することにより、ユーザーにも利益を与えるので、ユーザーのいる場所において関心のある製品、サービス、またはポイントを検索する場合に重要となる。
実施の形態では、本発明は、コンピュータでビジネスを行うためのシステムおよび方法を提供し:DNSデータを用いて特定ISPに対するページリクエストシーケンスの一つ以上のセッションマップを作成するステップ;一つ以上のセッションマップ内の情報に少なくとも一部は基づいてページを格付けするステップ;およびページ格付けを、一つ以上のISP、参加パートナー、またはその両方からのページ格付けと組み合せるステップを含む。実施の形態では、セッションマップおよび/または対応するセッションベクトルは、一つ以上の参加パートナー、ISP、またはその両方が組み合わされ、および/または合成されて受信され;その情報に基づいて、ページおよび/またはホストの格付けを修正するために用いる。本システムおよび方法の実施の形態では、インターネットアプライアンスのようなコンピュータは、ISPレベルでのホストリクエストのシーケンスの一つ以上のセッションマップおよび/またはセッションベクトルを作成し;セッションマップからの情報に少なくとも一部は基づいてページおよび/またはホストを格付けし;そしてページ格付けを、一つ以上のISP、参加しているパートナー、またはその両方からのページ格付けと組み合せるために存在し、または提供される。
他の実施の形態では、本方法は:ISPから得られた一連のページリクエストの一つ以上のセッションマップを作成するステップ;およびセッションマップからの情報に少なくとも一部は基づいて結果を提供するステップを含み、その結果は、クエリー主題、クエリー発信点、クエリー発信点の地理的場所、クエリーの提出時間、インターネットインフラストラクチャが提供する情報、またはこれらの二つ以上の任意の組合せとの関連性が高い。実施の形態では、ビジネスを行う本方法には、インターネットを用いて広告の的を効果的に絞るための方法が含まれる。
インターネット検索結果を提供するとビジネスが有利になることが多い。しかしながら、多くのインターネットサービスプロバイダ(ISP)はこの価値あるビジネス資産を所有していることに気付いていない。さらに別の実施の形態によれば、本発明は、ISP間でビジネスを行う方法を提供する。一態様では、本発明により、ISPは分散型検索エンジンとして機能できる。このような検索エンジンの能力は、本インターネットアプライアンスおよび/またはISP DNSに、全体的にまたは部分的に実装することができる。さらに、リクエストしているコンピュータと地理的に近い検索結果を格付けすることにより、ビジネス専用のサーバを維持管理しているISPおよび/または企業等のDNS運営者のビジネス機会および収入をこれまで以上に作成することができる。
このように、本発明は、ISPレベルのセッションログを解析するステップ;限定はしないが、正当性、時間、コンテンツ、および/またはセッション発信点の地理的場所を含む各種情報を分析するステップ;および、例えば、地理、要求されるホップ数、コンテンツ、または時間に基づくウェブページの格付けを提供するステップにより、従前の格付け技法の欠点に対して、技術的解決策およびビジネス解決策の両方を提供する。さらに、本ハードウエア(例えば、インターネットアプライアンス)は、ユーザーとISP DNSとの間に設置するか、またはISP DNS内に部分的もしくは全体的に一体化する場合、IPアドレス、ひいてはリクエストしている場所つまり起点を識別することができる。この情報は、地理的に関連するクエリー結果を提供する際、および/または地理的にまたは経路長(すなわち、ホップ数)により定義される最も近い、リクエストされる情報を収容しているサーバにユーザーを接続する際に有用である。この機能は、現行のレジストリレベルで実装されている公知の、使用中のどのシステムも提供できない。
さらに、本システムおよび方法を、分散型で、例えばISPレベルで、実装することによりユーザーのIPアドレスに基づいて、ユーザーの地理的位置を決定することができる。この情報はISPレベルからレジストリレベルへ送信されないので、レジストリレベルでインターネットアプライアンスを実装する場合は利用できない。インターネット上で現在利用可能な検索エンジンは、クエリー内で提出されたキーワードに基づくか、および/またはリンク型解析に基づく関連ウェブサイトおよび広告の識別に苦労する。残念ながら、そのような検索エンジンがクエリーに応えて提供するウェブサイトおよび広告は、ユーザーがウェブサイトからのリクエストに応えて情報を手入力するか、クッキーから転送することにより、自身の位置に関する情報を特別に提供しないかぎり、クエリーを提出している特定ユーザーの地理的場所を考慮しない。従って、例えば、展覧会についてのクエリーに応えて、ワシントンD.C.の市街地に住むユーザーは、テネシー州、メキシコ、日本、インド等の世界中の他のどこかの展覧会に関するページに対する高い格付け結果を受け取ることになる。同様に、購入しようとする自動車の特定モデルの入手性についてのクエリーに応えて、検索エンジンは、所望する結果(すなわち、リクエスタのすぐ近くの区域にある対象自動車を販売する店)を含まない主要自動車メーカーおよび自動車クラブを上位にリストアップする格付け結果を提供するかもしれない。さらに、検索エンジンは、クエリーがなされた時間を考慮しないので、時間関連の結果を意図的に提供することができない。検索エンジンからの結果は、様々なウェブサイトへの訪問回数および/またはリンク数に一部基づいて格付けされるのが典型的なので、大企業や人気企業または大組織や人気組織のサイトは、概して、最高位の格付け結果として表示され、一方、関連性の高い検索結果は、これらの結果に埋もれてしまうことになる。本発明は、これらの欠点を克服し、ISPレベルで生成した結果により強化され、さらにユーザーに適合する検索体験をユーザーに提供する。
図面、特に図2に戻って、DNSデータに基づいてユーザーリクエストのセッションマップを作成するための本発明の実施の形態を説明する。ステップ(20)に示すように、特定セッションのDNSデータは、例えば、一つ以上の参加しているDNS、ISP DNS等から得られる。DNSデータには、なかでも:IPアドレス、およびユニフォームリソースロケータ(URL)のドメインやホストの部分が含まれる。ウェブプロキシには、リクエストされたページのディレクトリのパス名;タイプ入力されたキーワード;リクエスト時間;参照URLまたはIPアドレス等を含めることができる。例えば、一セッションの入力には、関係するタイムスタンプとともに、リクエストページのディレクトリのパス名(http://www.washingtonpost.com/?nav=globetop)を含めることができる。さらに、リクエスタのIPアドレスは既知なので、同一IPアドレスに対して解決済みのページリクエストの一部または全てのシーケンスを、特定セッションに対して探し出すことができる。典型的には、リクエスタに割り当てられたIPアドレス(例えば、動的IPアドレス)は、リクエスタのISPから取得することができる。代替として、個人ユーザーのシーケンスリクエストを識別する代わりに、ユーザーグループに対してシーケンスリクエストを識別してもよい。加えて、ISP DNSは、ユーザーにリクエストされる特定IPアドレスに関する必要な統計値を収集してもよい。このようなシステムまたは方法によれば、ISP DNSは、ISP DNSに対してなされた全てのDNSリクエストについての情報および統計値を収集することもできる。これらの統計値は、コンテンツ関連、地理関連、および/または時間関連の情報を提供する本システムおよび方法のデータベースを構築するために使用することができる。
ステップ(22)に示すように、一人以上のユーザーのページシーケンスが識別される。このページシーケンスは、例えば、各ページが格納されたホストに圧縮されて、ステップ(24)のホストリクエストのシーケンスを形成する。
例えば、http://www.cars.com/go/buyindex.jsp?aff=national;
http://www.cars.com/go/crp/index.jsp;jsessionid=5TDPQKNJIKCCDLAYIJAA5IY?aff=national; およびhttp://www.cars.com/go/advice/index.jspのような同一ホストへのセッション入力は、例えば、www.cars.comで表される単一ノードに全て集約される。別の実施例では、別々のホストに属するセッション入力がそれぞれのホストに集約され、セッションベクトルが形成されて、訪問されるホストのシーケンスを表わす。従って、ユーザーがwww.cars.com、www.autozone.com、次いでwww.autoparts.comを訪問した場合、訪問したサイト:www.cars.com、www.autozone.com、www.autoparts.comのシーケンスを含むセッションベクトルが生成される。次いで、ステップ(26)で、ホストリクエストのシーケンスからセッションマップを形成することができる。有利な点は、セッションマップの情報量が、セッション中に訪問されたページを含むこれらホストだけに低減されるということである。
さらに別の実施の形態に沿って、ページ格付けの効率的な近似を図3で説明する。最初のステップで、一群の収集ページが、各ページが格納されるホストに圧縮または集約されて、圧縮されたホストマップを形成する(ステップ(30))。例えば、訪問されたホスト部の集約により(およびページやホスト内の)リンク間を効果的に無視することにより)、どこのノードが、ページに代わってホストを表すかのグラフが作成される。この方法で、人気のサイトを圧縮したホストマップを視覚化することが容易になる。
ステップ(32)では、その群に対するグローバルのホスト格付けベクトル1x (ここで、 は訪問したホスト数)は、圧縮されたホストマップにトラフィックフローモデルを適用する(例えば、動的に)ことにより得られる。例えば、P(ij)を、ホスト(i)からホスト(j)へのリンクの全てのウェブトラフィックに対する比率であるとする(ホスト(i)からホスト(j)へのリンクがなければ、P(ij)=0)。全トラフィックの合計に対するホスト(i)からホスト(j)へのトラフィックP(ij)の比率が推定される(変数P(ij)の合計は全ホストに対して1となる)。次いで、ホスト(j)に対するトラフィックの比率を、ホスト(j)のトラフィック格付け(または、人気度)の指標として用いる。このように、動的なトラフィックフローモデルを集約したホストマップに適用することにより、関連性が高いグローバルのホスト格付けベクトルを計算することができる。但し、言うまでもなく、グローバルのホスト格付けベクトルは、ページ格付けまたはブロック格付けのような他のモデルを適用しても得られる。
ステップ(36)に示すように、ローカルのページ格付けベクトル1x (ここで、 はホスト(i)のページ数である)は、そのホストに対する静的リンクグラフ(34)に基づいて各ホストに対して計算することができる。各ホストを訪問して、既知の技法によりそのホストに対するページ間の静的リンクグラフを決定してもよい。例えば、ローカルのページ格付けベクトルを効率的に計算するには、ホスト内リンクだけを用いて、そのホスト内リンクを無視する。しかし、さらに計算を高速化するには、特定セッションの間に訪問されるホストを決定し、これらのホストに対するローカルのページ格付けだけを計算する。このように、ページ格付けモデルを訪問されたホストだけに適用することにより、ローカルのページ格付けベクトルを導き出すのに必要な演算量を著しく低減させることができる。さらに、ローカルのページ格付けベクトルは、グローバルのホスト格付けベクトルの計算の前、そのあと、または同時に計算することができる。例えば、ローカルのページ格付けベクトルを、特定ホストに対して予め演算してから、動的に得られるホスト格付けベクトルと組み合せて、グローバルのページ格付けをオンザフライで提供することができる(下記参照)。
ステップ(38)では、グローバルのページ格付けは、グローバルのホスト格付けベクトル1x と、ローカルのページ格付けベクトル1x とを組み合せるだけで、近似させることができる。例えば、グローバルのページ格付けベクトルを近似するために、ホストに対するローカルのページ格付けベクトルに、収集するそのホスト内に存在する確率を乗算し、ホスト格付けベクトルのi番目の要素を得る。トラフィックフローモデルに基づくグローバルのホスト格付けベクトルをローカルのページ格付けベクトルと組み合せた結果、より関連性の高いページ格付けの近似を提供することができる。さらに、グローバルのホスト格付けベクトルおよびローカルのページ格付けベクトルを計算するのに要するページおよび/またはホストの数を制限することにより、計算の複雑さが大幅に低下する。このようにして、グローバルのページまたはホストの格付けベクトルを、動的および/またはオンザフライの場合において、より迅速に計算できる。
図4に、DNSおよび/またはISPのセッションデータを少なくとも部分的に用いて、ページを効率的に格付けする本発明の別の実施の形態を示す。ステップ(40)では、DNS/ISPのデータ(上記したような)が、特定セッションの間に訪問されたページを識別するために取得され、使用される。ステップ(41)では、どこで一つ以上のページリクエストのシーケンスがステップ(22)と同様な方法で識別されるかを示す。ステップ(42)で、そのページが、例えば、各ページが格納されるホストに集約されて、ホストリクエストのシーケンスが得られる。
例えば、http://www.cars.com/go/buyindex.jsp?aff=national;
http://www.cars.com/go/crp/index.jsp; jsessionid=5TDPQKNJIKCCDLAYIJAA5IY?aff=national;およびhttp://www.cars.com/go/advice/index.jspのような同一ホストへのセッション入力は、例えば、www.cars.comで表される単一ノードに集約される。別の実施例では、別々のホストに属するセッション入力がそれぞれのホストに集約され、訪問されるホストのシーケンスを表すセッションベクトルが形成される。従って、ユーザーがwww.cars.com、次いでwww.autozone.com、次いでwww.autoparts.comを訪問した場合、訪問したサイト:www.cars.com、www.autozone.com、www.autoparts.comのシーケンスを含むセッションベクトルが生成される。次いで、ステップ(43)で、識別されたシーケンスからセッションマップを形成することができる。有利な点は、セッションマップの情報量が、セッション中に訪問されたこれらホストだけに低減されるということである。ステップ(44)で、グローバルのホスト格付けベクトルがステップ(32)と同様な技法を用いて計算される。ステップ(45)および(46)では、ローカルのページ格付けベクトルも、上記のステップ(34)および(36)と同様に、グローバルのホスト格付けベクトルの計算の前、計算している間、またはそのあとに計算することができる。最後に、ステップ(47)で、グローバルのページ格付けベクトルが、上記のステップ(38)と同様に近似される。
本発明の好適な実施の形態の上記開示は、図解および説明のために呈示されている。全てを包括していること、または本発明を開示したのと正確に同じ形に限定することは意図していない。本明細書で説明した実施の形態の多くの改変および修正は、上記開示から当業者には明らかである。例えば、より広い観点で本発明の原理をテレフォニー等の他のネットワークシステムに適用することができる。本発明の範囲は、本明細書に付帯のクレームによって、およびこれらの均等物によってのみ定義されるべきである。さらに、本発明の代表的な実施の形態を説明する際に、本明細書は、特定のステップシーケンスとして本発明の方法および/またはプロセスを提示した。しかしながら、本方法またはプロセスは本明細書で説明した特定ステップ順に依らないという点で、本方法またはプロセスは、説明した特定ステップシーケンスに限定してはならない。当業者には言うまでもないが、他のステップシーケンスでも可能である。従って、本明細書で説明したステップの特定順序は、クレームを限定するものと解釈してはならない。加えて、本発明の方法および/またはプロセスに向けたクレームを、記載の順序でステップを実行すると限定してはならず、当業者には言うまでもなく、シーケンスを変更することが可能であり、そして、それは、依然として本発明の精神および範囲内にとどまる。

Claims (30)

  1. DNSデータを用いてページ格付けをするための方法であって:
    特定セッションに対するDNSデータを取得するステップと;
    ホストリクエストの一つ以上のシーケンスをDNSデータに基づいて識別するステップと;
    前記識別したホストシーケンスに少なくとも一部は基づいてページおよび/またはホストを格付けするステップと;を備える、
    方法。
  2. DNSデータを取得するステップが、一つ以上のISPから前記データを取得するステップをさらに備える、
    請求項1の方法。
  3. ホストリクエストの前記一つ以上のシーケンスから一つ以上のセッションベクトルを作成するステップと;
    前記一つ以上のセッションベクトルからセッションマップを作成するステップと;をさらに備える、
    請求項1の方法。
  4. 前記セッションベクトルおよび/またはセッションマップを用いてユーザーの振舞いを追跡および/または予測するステップをさらに備える、
    請求項3の方法。
  5. ページを格付けするステップが、動的なトラフィックフローモデルおよび/または静的なページ格付けモデルに少なくとも一部は基づいてページを格付けするステップを備える、
    請求項1の方法。
  6. ページを格付けするステップが、前記セッション内のホストに対するグローバルのホスト格付けベクトルを計算するステップと;
    前記セッション内の各ホストのページに対するローカルのページ格付けベクトルを計算するステップと;
    前記グローバルのホスト格付けベクトルおよびローカルのページ格付けベクトルの組合せに基づいて、グローバルのページ格付けベクトルを近似するステップと;を備える、
    請求項1の方法。
  7. クエリーに応えて前記格付け結果をユーザーに提供するステップをさらに備える、
    請求項1の方法。
  8. 一つ以上のコンピュータ読取り可能媒体上に格納され、請求項1の方法を実行するための命令を備える、
    コンピュータプログラム。
  9. インターネットアプライアンスであって:
    特定のセッションに対するDNSデータを取得する手段と;
    前記DNSデータに基づいてホストリクエストの一つ以上のシーケンスを識別する手段と;
    前記識別したホストのシーケンスに少なくとも一部は基づいてページおよび/またはホストを格付けする手段と;を備える、
    インターネットアプライアンス。
  10. ホストリクエストの前記一つ以上のシーケンスから一つ以上のセッションベクトルを作成する手段と;
    前記一つ以上のセッションベクトルからセッションマップを作成するための手段と;をさらに備える、
    請求項9のインターネットアプライアンス。
  11. 前記セッションベクトルおよび/またはセッションマップに基づいてユーザーの振舞いを追跡および/または予測する手段をさらに備える、
    請求項10のインターネットアプライアンス。
  12. 動的なトラフィックフローモデルおよび/または静的なページ格付けモデルを用いて、前記セッション内のページおよび/またはホストを格付けする手段をさらに備える、
    請求項9のインターネットアプライアンス。
  13. 前記格付けするための手段は:
    前記セッション内のホストに対するグローバルのホスト格付けベクトル計算する手段と;
    前記セッション内の各ホストのページに対するローカルのページ格付けベクトルを計算する手段と;
    前記グローバルのホスト格付けベクトルおよびローカルのページ格付けベクトルの組合せに基づいてグローバルのページ格付けを近似する手段と;をさらに備える、
    請求項9のインターネットアプライアンス。
  14. 前記グローバルのホスト格付けベクトルを計算する手段がトラフィックフローモデルを用いる、
    請求項13のインターネットアプライアンス。
  15. クエリーに応えて前記格付け結果をユーザーに提供する手段をさらに備える、
    請求項9のインターネットアプライアンス。
  16. インターネットアプライアンスであって:
    特定セッションに対するDNSデータを取得するよう構成されるプロセッサと;
    前記DNSデータに基づいてホストリクエストの一つ以上のシーケンスを識別するよう構成されるプロセッサと;
    前記識別されたホストのシーケンスに少なくとも一部は基づいてページおよび/またはホストを格付けするよう構成されるプロセッサと;を備える、
    インターネットアプライアンス。
  17. 前記ページおよび/またはホストを格付けするよう構成されるプロセッサが:
    前記セッション内のホストに対するグローバルのホスト格付けベクトルを計算し;
    前記セッション内の各ホストのページに対するローカルのページ格付けベクトルを計算し;
    前記グローバルのホスト格付けベクトルおよび前記ローカルのページ格付けベクトルの組合せに基づいて、グローバルのページ格付けを近似するよう;さらに構成される、
    請求項16のインターネットアプライアンス。
  18. 前記ページおよび/またはホストを格付けするよう構成されるプロセッサが、トラフィックフローモデルを用いて前記グローバルのホスト格付けベクトルを計算するようさらに構成される、
    請求項17のインターネットアプライアンス。
  19. 一つ以上のISPによるページを格付けするためのシステムであって:
    前記システムは一つ以上のインターネットアプライアンス;を備え、
    各インターネットアプライアンスは:
    一つ以上のISPからDNSデータを収集および/または取得するよう構成される一個以上のプロセッサと;
    一つ以上のISPからの組み合わされたDNSデータに少なくとも一部は基づいて検索結果を格付けするよう構成される一個以上のプロセッサと;を備える、
    システム。
  20. 一つ以上のISPからのDNSデータを取得しおよび/または組み合せ;
    前記DNSデータを用いてホストリクエストの一つ以上のシーケンスを識別し;
    ホストの前記識別されたシーケンスに少なくとも一部は基づいて、ページおよび/またはホストを格付けするための命令をその上に格納させる;
    コンピュータ読取り可能な格納媒体。
  21. 動的なトラフィックフローモデルおよび/または静的なページ格付けモデルを用いて、ページおよび/またはホストを格付けするための命令をさらに備える、
    請求項20のコンピュータ読取り可能な格納媒体。
  22. ホストリクエストの前記シーケンスから一つ以上のセッションベクトルおよび/またはセッションマップを作成するための命令をさらに備える、
    請求項20のコンピュータ読取り可能な格納媒体。
  23. 前記セッションベクトルおよび/またはセッションマップ内に含まれる情報に少なくとも一部は基づいて、ユーザーの振舞いを追跡および/または予測するための命令をさらに備える、
    請求項22のコンピュータ読取り可能な格納媒体。
  24. 前記一つ以上の識別されたシーケンスと広告主情報との組合せに基づいてページを格付けするための命令をさらに備える、
    請求項20のコンピュータ読取り可能な格納媒体。
  25. コンピュータを用いてビジネスを行うための方法であって、前記方法は:
    一つ以上のISPから特定セッションに対するDNSデータを取得するステップと;
    一つ以上の広告主から情報を取得するステップと;
    一つ以上のISPからのDNSデータおよび/または広告主の情報の組合せに基づいて、前記セッションに対するページおよび/またはホストを格付けするステップと;
    前記格付けしたページおよび/または広告主の情報を提供するための料金を一つ以上の関係者に請求するステップと;を備える、
    方法。
  26. 前記関係者がユーザーであり、前記格付けされた結果がクエリーに応えて提供される、
    請求項25の方法。
  27. 前記料金は、前記格付け結果を提供する料金として、前記ユーザーおよび/または広告主に請求される、
    請求項26の方法。
  28. 前記格付け結果は複数のISPに提供され、その内の幾つかのISPは前記データを提供したISPではないこともある、
    請求項25の方法。
  29. 前記格付け結果に対する料金を、前記データを提供しなかったISPに請求するステップをさらに備える、
    請求項28の方法。
  30. 一つ以上のコンピュータ読取り可能媒体上に格納されたコンピュータプログラムであって、前記プログラムは、請求項25の方法を実行するための命令を備える、
    コンピュータプログラム。
JP2009533548A 2006-10-19 2007-10-19 Dnsセッションデータに基づくノード格付けのための方法およびシステム Withdrawn JP2010507840A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/550,975 US7593935B2 (en) 2006-10-19 2006-10-19 Methods and systems for node ranking based on DNS session data
PCT/US2007/081867 WO2008049093A2 (en) 2006-10-19 2007-10-19 Methods and systems for node ranking based on dns session data

Publications (1)

Publication Number Publication Date
JP2010507840A true JP2010507840A (ja) 2010-03-11

Family

ID=39315132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009533548A Withdrawn JP2010507840A (ja) 2006-10-19 2007-10-19 Dnsセッションデータに基づくノード格付けのための方法およびシステム

Country Status (6)

Country Link
US (2) US7593935B2 (ja)
EP (1) EP2092443A4 (ja)
JP (1) JP2010507840A (ja)
CN (1) CN101563690A (ja)
CA (1) CA2667057C (ja)
WO (1) WO2008049093A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015509627A (ja) * 2012-02-22 2015-03-30 ノキア コーポレイション 適応システム

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7035880B1 (en) 1999-07-14 2006-04-25 Commvault Systems, Inc. Modular backup and retrieval system used in conjunction with a storage area network
US7003641B2 (en) 2000-01-31 2006-02-21 Commvault Systems, Inc. Logical view with granular access to exchange data managed by a modular data and storage management system
US7434219B2 (en) 2000-01-31 2008-10-07 Commvault Systems, Inc. Storage of application specific profiles correlating to document versions
US6658436B2 (en) 2000-01-31 2003-12-02 Commvault Systems, Inc. Logical view and access to data managed by a modular data and storage management system
US7107298B2 (en) 2001-09-28 2006-09-12 Commvault Systems, Inc. System and method for archiving objects in an information store
US7454569B2 (en) 2003-06-25 2008-11-18 Commvault Systems, Inc. Hierarchical system and method for performing storage operations in a computer network
WO2005050381A2 (en) 2003-11-13 2005-06-02 Commvault Systems, Inc. Systems and methods for performing storage operations using network attached storage
US7949714B1 (en) * 2005-12-05 2011-05-24 Google Inc. System and method for targeting advertisements or other information using user geographical information
US10636315B1 (en) 2006-11-08 2020-04-28 Cricket Media, Inc. Method and system for developing process, project or problem-based learning systems within a semantic collaborative social network
WO2008073655A2 (en) * 2006-11-08 2008-06-19 Epals, Inc. Dynamic characterization of nodes in a semantic network
US7734669B2 (en) * 2006-12-22 2010-06-08 Commvault Systems, Inc. Managing copies of data
JP5040396B2 (ja) * 2007-03-28 2012-10-03 富士通株式会社 Webページ検索プログラム、方法、及び装置
US8244737B2 (en) * 2007-06-18 2012-08-14 Microsoft Corporation Ranking documents based on a series of document graphs
US8028090B2 (en) 2008-11-17 2011-09-27 Amazon Technologies, Inc. Request routing utilizing client location information
US7991910B2 (en) 2008-11-17 2011-08-02 Amazon Technologies, Inc. Updating routing information based on client location
US8396838B2 (en) 2007-10-17 2013-03-12 Commvault Systems, Inc. Legal compliance, electronic discovery and electronic document handling of online and offline copies of data
US8019708B2 (en) * 2007-12-05 2011-09-13 Yahoo! Inc. Methods and apparatus for computing graph similarity via signature similarity
US7962597B2 (en) 2008-03-31 2011-06-14 Amazon Technologies, Inc. Request routing based on class
US8601090B1 (en) 2008-03-31 2013-12-03 Amazon Technologies, Inc. Network resource identification
US8447831B1 (en) 2008-03-31 2013-05-21 Amazon Technologies, Inc. Incentive driven content delivery
US8321568B2 (en) 2008-03-31 2012-11-27 Amazon Technologies, Inc. Content management
US7970820B1 (en) 2008-03-31 2011-06-28 Amazon Technologies, Inc. Locality based content distribution
US8606996B2 (en) 2008-03-31 2013-12-10 Amazon Technologies, Inc. Cache optimization
US8769048B2 (en) 2008-06-18 2014-07-01 Commvault Systems, Inc. Data protection scheduling, such as providing a flexible backup window in a data protection system
US8352954B2 (en) 2008-06-19 2013-01-08 Commvault Systems, Inc. Data storage resource allocation by employing dynamic methods and blacklisting resource request pools
US9128883B2 (en) 2008-06-19 2015-09-08 Commvault Systems, Inc Data storage resource allocation by performing abbreviated resource checks based on relative chances of failure of the data storage resources to determine whether data storage requests would fail
US9407681B1 (en) 2010-09-28 2016-08-02 Amazon Technologies, Inc. Latency measurement in resource requests
US8725688B2 (en) 2008-09-05 2014-05-13 Commvault Systems, Inc. Image level copy or restore, such as image level restore without knowledge of data object metadata
US20100070474A1 (en) 2008-09-12 2010-03-18 Lad Kamleshkumar K Transferring or migrating portions of data objects, such as block-level data migration or chunk-based data migration
US20090282038A1 (en) * 2008-09-23 2009-11-12 Michael Subotin Probabilistic Association Based Method and System for Determining Topical Relatedness of Domain Names
US8073940B1 (en) 2008-11-17 2011-12-06 Amazon Technologies, Inc. Managing content delivery network service providers
US8688837B1 (en) 2009-03-27 2014-04-01 Amazon Technologies, Inc. Dynamically translating resource identifiers for request routing using popularity information
US8412823B1 (en) 2009-03-27 2013-04-02 Amazon Technologies, Inc. Managing tracking information entries in resource cache components
US8756341B1 (en) * 2009-03-27 2014-06-17 Amazon Technologies, Inc. Request routing utilizing popularity information
US8521908B2 (en) * 2009-04-07 2013-08-27 Verisign, Inc. Existent domain name DNS traffic capture and analysis
US8782236B1 (en) 2009-06-16 2014-07-15 Amazon Technologies, Inc. Managing resources using resource expiration data
US8397073B1 (en) 2009-09-04 2013-03-12 Amazon Technologies, Inc. Managing secure content in a content delivery network
US8433771B1 (en) 2009-10-02 2013-04-30 Amazon Technologies, Inc. Distribution network with forward resource propagation
US9495338B1 (en) 2010-01-28 2016-11-15 Amazon Technologies, Inc. Content distribution network
CN101895591B (zh) * 2010-07-23 2012-10-31 北京邮电大学 提高可信互联网域名服务健壮性的方法和域名服务器
US8468247B1 (en) 2010-09-28 2013-06-18 Amazon Technologies, Inc. Point of presence management in request routing
US9003035B1 (en) 2010-09-28 2015-04-07 Amazon Technologies, Inc. Point of presence management in request routing
US9712484B1 (en) 2010-09-28 2017-07-18 Amazon Technologies, Inc. Managing request routing information utilizing client identifiers
US10958501B1 (en) 2010-09-28 2021-03-23 Amazon Technologies, Inc. Request routing information based on client IP groupings
US9049229B2 (en) 2010-10-28 2015-06-02 Verisign, Inc. Evaluation of DNS pre-registration data to predict future DNS traffic
US8452874B2 (en) 2010-11-22 2013-05-28 Amazon Technologies, Inc. Request routing processing
US9021198B1 (en) 2011-01-20 2015-04-28 Commvault Systems, Inc. System and method for sharing SAN storage
US8849762B2 (en) 2011-03-31 2014-09-30 Commvault Systems, Inc. Restoring computing environments, such as autorecovery of file systems at certain points in time
US10467042B1 (en) 2011-04-27 2019-11-05 Amazon Technologies, Inc. Optimized deployment based upon customer locality
US9244931B2 (en) 2011-10-11 2016-01-26 Microsoft Technology Licensing, Llc Time-aware ranking adapted to a search engine application
US8843477B1 (en) * 2011-10-31 2014-09-23 Google Inc. Onsite and offsite search ranking results
US8543900B1 (en) 2012-01-11 2013-09-24 Google Inc. Web page associated with a node in a website traffic pattern
US10157184B2 (en) 2012-03-30 2018-12-18 Commvault Systems, Inc. Data previewing before recalling large data files
US10623408B1 (en) 2012-04-02 2020-04-14 Amazon Technologies, Inc. Context sensitive object management
US9154551B1 (en) 2012-06-11 2015-10-06 Amazon Technologies, Inc. Processing DNS queries to identify pre-processing information
US9323577B2 (en) 2012-09-20 2016-04-26 Amazon Technologies, Inc. Automated profiling of resource usage
CN102970391B (zh) * 2012-12-07 2016-09-28 华为技术有限公司 域名查询处理方法、服务器及系统
US10205698B1 (en) 2012-12-19 2019-02-12 Amazon Technologies, Inc. Source-dependent address resolution
US9406289B2 (en) * 2012-12-21 2016-08-02 Jamhub Corporation Track trapping and transfer
US9633216B2 (en) 2012-12-27 2017-04-25 Commvault Systems, Inc. Application of information management policies based on operation with a geographic entity
US9459968B2 (en) 2013-03-11 2016-10-04 Commvault Systems, Inc. Single index to query multiple backup formats
US9294391B1 (en) 2013-06-04 2016-03-22 Amazon Technologies, Inc. Managing network computing components utilizing request routing
US10284439B2 (en) * 2013-12-02 2019-05-07 Google Llc Method for measuring end-to-end internet application performance
US9798596B2 (en) 2014-02-27 2017-10-24 Commvault Systems, Inc. Automatic alert escalation for an information management system
US9648100B2 (en) 2014-03-05 2017-05-09 Commvault Systems, Inc. Cross-system storage management for transferring data across autonomous information management systems
US9823978B2 (en) 2014-04-16 2017-11-21 Commvault Systems, Inc. User-level quota management of data objects stored in information management systems
US9740574B2 (en) 2014-05-09 2017-08-22 Commvault Systems, Inc. Load balancing across multiple data paths
US11249858B2 (en) 2014-08-06 2022-02-15 Commvault Systems, Inc. Point-in-time backups of a production application made accessible over fibre channel and/or ISCSI as data sources to a remote application by representing the backups as pseudo-disks operating apart from the production application and its host
US9852026B2 (en) 2014-08-06 2017-12-26 Commvault Systems, Inc. Efficient application recovery in an information management system based on a pseudo-storage-device driver
US9444811B2 (en) 2014-10-21 2016-09-13 Commvault Systems, Inc. Using an enhanced data agent to restore backed up data across autonomous storage management systems
US10091096B1 (en) 2014-12-18 2018-10-02 Amazon Technologies, Inc. Routing mode and point-of-presence selection service
US10097448B1 (en) 2014-12-18 2018-10-09 Amazon Technologies, Inc. Routing mode and point-of-presence selection service
US10225326B1 (en) 2015-03-23 2019-03-05 Amazon Technologies, Inc. Point of presence based data uploading
US9819567B1 (en) 2015-03-30 2017-11-14 Amazon Technologies, Inc. Traffic surge management for points of presence
US9832141B1 (en) 2015-05-13 2017-11-28 Amazon Technologies, Inc. Routing based request correlation
US9766825B2 (en) 2015-07-22 2017-09-19 Commvault Systems, Inc. Browse and restore for block-level backups
US10097566B1 (en) 2015-07-31 2018-10-09 Amazon Technologies, Inc. Identifying targets of network attacks
US10082937B2 (en) * 2015-09-11 2018-09-25 International Business Machines Corporation Intelligent rendering of webpages
US9774619B1 (en) 2015-09-24 2017-09-26 Amazon Technologies, Inc. Mitigating network attacks
US10270878B1 (en) 2015-11-10 2019-04-23 Amazon Technologies, Inc. Routing for origin-facing points of presence
US10257307B1 (en) 2015-12-11 2019-04-09 Amazon Technologies, Inc. Reserved cache space in content delivery networks
US10348639B2 (en) 2015-12-18 2019-07-09 Amazon Technologies, Inc. Use of virtual endpoints to improve data transmission rates
US10530758B2 (en) * 2015-12-18 2020-01-07 F5 Networks, Inc. Methods of collaborative hardware and software DNS acceleration and DDOS protection
US10296368B2 (en) 2016-03-09 2019-05-21 Commvault Systems, Inc. Hypervisor-independent block-level live browse for access to backed up virtual machine (VM) data and hypervisor-free file-level recovery (block-level pseudo-mount)
US10075551B1 (en) 2016-06-06 2018-09-11 Amazon Technologies, Inc. Request management for hierarchical cache
US10110694B1 (en) 2016-06-29 2018-10-23 Amazon Technologies, Inc. Adaptive transfer rate for retrieving content from a server
US9992086B1 (en) 2016-08-23 2018-06-05 Amazon Technologies, Inc. External health checking of virtual private cloud network environments
US10033691B1 (en) 2016-08-24 2018-07-24 Amazon Technologies, Inc. Adaptive resolution of domain name requests in virtual private cloud network environments
US10469513B2 (en) 2016-10-05 2019-11-05 Amazon Technologies, Inc. Encrypted network addresses
US10831549B1 (en) 2016-12-27 2020-11-10 Amazon Technologies, Inc. Multi-region request-driven code execution system
US10372499B1 (en) 2016-12-27 2019-08-06 Amazon Technologies, Inc. Efficient region selection system for executing request-driven code
US10938884B1 (en) 2017-01-30 2021-03-02 Amazon Technologies, Inc. Origin server cloaking using virtual private cloud network environments
US10838821B2 (en) 2017-02-08 2020-11-17 Commvault Systems, Inc. Migrating content and metadata from a backup system
US10740193B2 (en) 2017-02-27 2020-08-11 Commvault Systems, Inc. Hypervisor-independent reference copies of virtual machine payload data based on block-level pseudo-mount
US10891069B2 (en) 2017-03-27 2021-01-12 Commvault Systems, Inc. Creating local copies of data stored in online data repositories
US10776329B2 (en) 2017-03-28 2020-09-15 Commvault Systems, Inc. Migration of a database management system to cloud storage
US11074140B2 (en) 2017-03-29 2021-07-27 Commvault Systems, Inc. Live browsing of granular mailbox data
US10503613B1 (en) 2017-04-21 2019-12-10 Amazon Technologies, Inc. Efficient serving of resources during server unavailability
CN107239546B (zh) * 2017-06-05 2021-07-06 成都知道创宇信息技术有限公司 一种网页局部内容跟踪与提醒的方法
US11075987B1 (en) 2017-06-12 2021-07-27 Amazon Technologies, Inc. Load estimating content delivery network
US10664352B2 (en) 2017-06-14 2020-05-26 Commvault Systems, Inc. Live browsing of backed up data residing on cloned disks
US10447648B2 (en) 2017-06-19 2019-10-15 Amazon Technologies, Inc. Assignment of a POP to a DNS resolver based on volume of communications over a link between client devices and the POP
US10742593B1 (en) 2017-09-25 2020-08-11 Amazon Technologies, Inc. Hybrid content request routing system
US10795927B2 (en) 2018-02-05 2020-10-06 Commvault Systems, Inc. On-demand metadata extraction of clinical image data
US10592578B1 (en) 2018-03-07 2020-03-17 Amazon Technologies, Inc. Predictive content push-enabled content delivery network
US10761942B2 (en) 2018-03-12 2020-09-01 Commvault Systems, Inc. Recovery point objective (RPO) driven backup scheduling in a data storage management system using an enhanced data agent
US10789387B2 (en) 2018-03-13 2020-09-29 Commvault Systems, Inc. Graphical representation of an information management system
JP6960873B2 (ja) * 2018-03-16 2021-11-05 東京エレクトロン株式会社 半導体製造システム及びサーバ装置
US10862852B1 (en) 2018-11-16 2020-12-08 Amazon Technologies, Inc. Resolution of domain name requests in heterogeneous network environments
US10860443B2 (en) 2018-12-10 2020-12-08 Commvault Systems, Inc. Evaluation and reporting of recovery readiness in a data storage management system
US11025747B1 (en) 2018-12-12 2021-06-01 Amazon Technologies, Inc. Content request pattern-based routing system
US11868414B1 (en) * 2019-03-14 2024-01-09 Snap Inc. Graph-based prediction for contact suggestion in a location sharing system
US11308034B2 (en) 2019-06-27 2022-04-19 Commvault Systems, Inc. Continuously run log backup with minimal configuration and resource usage from the source machine
US11032244B2 (en) * 2019-09-30 2021-06-08 BitSight Technologies, Inc. Systems and methods for determining asset importance in security risk management
US11810089B2 (en) * 2020-01-14 2023-11-07 Snowflake Inc. Data exchange-based platform
CN111831999B (zh) * 2020-07-13 2022-08-19 中国银行股份有限公司 一种聚合多站操作的方法和系统

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285999B1 (en) * 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6278992B1 (en) * 1997-03-19 2001-08-21 John Andrew Curtis Search engine using indexing method for storing and retrieving data
US6195698B1 (en) * 1998-04-13 2001-02-27 Compaq Computer Corporation Method for selectively restricting access to computer systems
US6792458B1 (en) * 1999-10-04 2004-09-14 Urchin Software Corporation System and method for monitoring and analyzing internet traffic
US6675205B2 (en) * 1999-10-14 2004-01-06 Arcessa, Inc. Peer-to-peer automated anonymous asynchronous file sharing
US6647381B1 (en) * 1999-10-27 2003-11-11 Nec Usa, Inc. Method of defining and utilizing logical domains to partition and to reorganize physical domains
US20050105513A1 (en) 2002-10-27 2005-05-19 Alan Sullivan Systems and methods for direction of communication traffic
US20080177994A1 (en) * 2003-01-12 2008-07-24 Yaron Mayer System and method for improving the efficiency, comfort, and/or reliability in Operating Systems, such as for example Windows
US7216123B2 (en) * 2003-03-28 2007-05-08 Board Of Trustees Of The Leland Stanford Junior University Methods for ranking nodes in large directed graphs
US7308643B1 (en) * 2003-07-03 2007-12-11 Google Inc. Anchor tag indexing in a web crawler system
US7599938B1 (en) * 2003-07-11 2009-10-06 Harrison Jr Shelton E Social news gathering, prioritizing, tagging, searching, and syndication method
US7174346B1 (en) * 2003-07-31 2007-02-06 Google, Inc. System and method for searching an extended database
US7254580B1 (en) * 2003-07-31 2007-08-07 Google Inc. System and method for selectively searching partitions of a database
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7594011B2 (en) 2004-02-10 2009-09-22 Narus, Inc. Network traffic monitoring for search popularity analysis
US7812860B2 (en) * 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US7251654B2 (en) * 2004-05-15 2007-07-31 International Business Machines Corporation System and method for ranking nodes in a network
US7437364B1 (en) * 2004-06-30 2008-10-14 Google Inc. System and method of accessing a document efficiently through multi-tier web caching
US7752200B2 (en) * 2004-08-09 2010-07-06 Amazon Technologies, Inc. Method and system for identifying keywords for use in placing keyword-targeted advertisements
US7587412B2 (en) * 2005-08-23 2009-09-08 Ricoh Company, Ltd. Mixed media reality brokerage network and methods of use
US7797299B2 (en) * 2005-07-02 2010-09-14 Steven Thrasher Searching data storage systems and devices
US8452832B2 (en) * 2006-07-27 2013-05-28 Yahoo! Inc. System and method for population-targeted advertising

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015509627A (ja) * 2012-02-22 2015-03-30 ノキア コーポレイション 適応システム
US9811585B2 (en) 2012-02-22 2017-11-07 Nokia Technologies Oy Adaptive system

Also Published As

Publication number Publication date
US8090726B2 (en) 2012-01-03
EP2092443A2 (en) 2009-08-26
CA2667057C (en) 2011-02-22
EP2092443A4 (en) 2010-03-10
WO2008049093A2 (en) 2008-04-24
CA2667057A1 (en) 2008-04-24
WO2008049093A3 (en) 2008-07-31
US20080097980A1 (en) 2008-04-24
US7593935B2 (en) 2009-09-22
CN101563690A (zh) 2009-10-21
US20090319367A1 (en) 2009-12-24

Similar Documents

Publication Publication Date Title
JP2010507840A (ja) Dnsセッションデータに基づくノード格付けのための方法およびシステム
US9659307B2 (en) Cookie derivatives
US9965561B2 (en) Auto-refinement of search results based on monitored search activities of users
CN103221951B (zh) 预测查询建议高速缓存
JP5072160B2 (ja) ワールドワイドウェブのディジタルコンテントの普及を見積もるシステム及び方法
US7890451B2 (en) Computer program product and method for refining an estimate of internet traffic
TWI390421B (zh) 用於估計一資訊封包的性能之方法與裝置
US8135833B2 (en) Computer program product and method for estimating internet traffic
KR100908982B1 (ko) 지능형 정보 제공 시스템 및 방법
US7788130B2 (en) Method and product for offering advertising services
US20090282038A1 (en) Probabilistic Association Based Method and System for Determining Topical Relatedness of Domain Names
US20080183664A1 (en) Presenting web site analytics associated with search results
JP2006146882A (ja) コンテンツ評価
US20080097891A1 (en) Virtual Stock Market Service Based on Search Index
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
KR20150130282A (ko) 실시간 비딩용 지능형 플랫폼
US20150220641A1 (en) Search engine optimization at scale
CN102521249B (zh) 一种基于同质资源的展现方法及设备
US20050182677A1 (en) Method and/or system for providing web-based content
CN108781223A (zh) 用于内容项选择的数据的数据分组传输优化
US8843817B2 (en) System and method for obtaining user information
US20220122119A1 (en) Electronic advertising campaign tracking
JP2003044508A (ja) Url変換サーバシステム、及び実urlサーバ
Schuch et al. A Method for Mobile Download Conversion Rate Measurement based on Device Fingerprinting
WO2015069830A2 (en) Mapping system for not provided keyword in secure search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101019

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20120821