JP4588768B2 - オーバーレイネットワークのノードの最高ワークロードの決定 - Google Patents

オーバーレイネットワークのノードの最高ワークロードの決定 Download PDF

Info

Publication number
JP4588768B2
JP4588768B2 JP2007545468A JP2007545468A JP4588768B2 JP 4588768 B2 JP4588768 B2 JP 4588768B2 JP 2007545468 A JP2007545468 A JP 2007545468A JP 2007545468 A JP2007545468 A JP 2007545468A JP 4588768 B2 JP4588768 B2 JP 4588768B2
Authority
JP
Japan
Prior art keywords
node
information service
list
nodes
workload
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007545468A
Other languages
English (en)
Other versions
JP2008526056A (ja
Inventor
バス・スジョイ
バネルジー・スジャータ
シャーマ・パネット
リー・サング−ジュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2008526056A publication Critical patent/JP2008526056A/ja
Application granted granted Critical
Publication of JP4588768B2 publication Critical patent/JP4588768B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/26Route discovery packet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1029Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1087Peer-to-peer [P2P] networks using cross-functional networking aspects
    • H04L67/1093Some peer nodes performing special functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services

Description

本発明は、包括的には、ネットワークに関する。より詳細には、本発明は、ネットワークのノードのワークロードを分割することに関する。
[背景]
インターネット等の大きなネットワークは、多くのピアツーピアシステムのインフラストラクチャを提供することができ、今や、さまざまなサービスをユーザに提供するのに使用されている。
たとえば、ストリーミングおよびトランスコード等のメディアサービス、航空券の予約およびホテルの予約等の電子商取引のウェブサービス、または、計算およびデータのグリッドコンピューティングサービスが、大きなネットワークを介して利用可能であり得る。
国際公開第2004/086720号 米国特許出願公開第2002/178261号
これらのネットワークサービスを効果的に利用する際の基本的な課題は、インターネット等の大きなネットワークで所望のサービスを効率的に且つ素早く突き止めることである。
サービスを発見する課題は、いくつかの要因によって複雑化されている。
たとえば、ピアツーピアファイル共有システムに使用される集中化(centralized)情報サービス等、このような発見を容易にするための集中化情報サービスが利用された場合、利用可能なサービス数およびユーザ数が増加しても、集中化情報サービスは容易に拡大しない。
加えて、各サービスは、変化し続け、情報サービスにおいて更新を受ける必要がある、たとえば負荷および待ち時間といったいくつかの動的な属性を有する。
所望の更新レートは、集中化情報サービスによって維持することができない。
また、情報サービスを最小のダウンタイムで提供するには、数人のシステムアドミニストレータがメンテナンスを行うことが必要となる場合があり、これは多大な費用を要する。
最後に、情報サービスは、より高速な応答時間のために局所性を考慮すべきである。
たとえば、所望のサービスの要求を含む問い合わせは、その問い合わせを最初に送信するノードの、ネットワークにおける近接したノードへ向けられるべきであり、問い合わせに対する応答として返されるサービスも、問い合わせを行ったノードにネットワークにおいて近接して存在すべきである。
[概要]
一実施の形態によれば、ネットワークのノードは、情報サービスを提供するように動作可能である。
最高ワークロードを有する一組のノードが、オーバーレイネットワークのノードを通じてネットワークの最終宛先へノードのワークロードのリストをルーティングすることによって特定される。
リストを受信した各ノードは、リストにワークロードを含めるか否かを判断する。
実施形態の以下の詳細な説明が添付図面に関して考慮された時に、実施形態のさまざまな特徴は、当該以下の詳細な説明についてより良く理解されるにつれてより十分に認識することができる。
[実施形態の詳細な説明]
簡単にするために且つ例示の目的で、実施形態の原理を説明する。
しかしながら、当業者は、同じ原理が、すべてのタイプのネットワークシステムに等しく適用可能であり、且つ、すべてのタイプのネットワークシステムで実施できること、および、あらゆるこのような変形が、実施形態の真の趣旨および範囲から逸脱しないことを容易に認識するであろう。
その上、以下の詳細な説明では、添付図面が参照される。
添付図面は、特定の実施形態を示している。
実施形態の趣旨および範囲から逸脱することなく、電気的な変更、機械的な変更、論理的な変更、および構造的な変更を実施形態に対して行うことができる。
一実施形態によれば、ネットワークにおいてサービスを発見するための分散情報サービスが提供される。
この情報サービスは、ネットワークを介して利用可能なサービスについての情報をユーザに提供する。
ユーザは、ネットワークを介して利用可能な所望のサービスについての情報を情報サービスに問い合わせる。
情報サービスは、所望のサービスを提供するように動作可能なネットワークのサービスノードのリストで応答することができる。
情報サービスは、利用可能なサービスについての情報を記憶するピアツーピアネットワークの複数の情報サービスノードを含む分散情報サービスである。
ノードが一時的なものである傾向を有する従来のピアツーピアネットワークと異なり、情報サービスノードは、短期間ピアツーピアネットワークに参加するのではなく、長期間ピアツーピアネットワークに留まる可能性が高いピアツーピアアーキテクチャの安定したノードである。
ピアツーピアネットワークは、分散アーキテクチャで情報サービスノードを組織化する一例であり、任意のタイプの分散アーキテクチャを使用できることが当業者には明らかであろう。
情報サービスの分散性によって、情報のすべての問い合わせを取り扱う従来の中央情報レポジトリを使用することに関連するボトルネックが最小にされ、したがって、問い合わせ応答時間が改善される。
ピアツーピアネットワークのオーバーレイネットワークが、ネットワークにおいて利用可能なサービスの発見を容易にするために、分散情報サービスにおけるサービスについての問い合わせおよび情報を効率的にルーティングするのに使用される。
本明細書で使用されるようなサービスは、入力に処理を行い、出力を生成するあらゆる機能を指す。
サービスの例には、トランスコード、言語翻訳、暗号化、画像修復および画像解析、エラー訂正、異なる言語へのコンテンツの変換等が含まれる。
また、1つのサービスは、複数のサービスで構成される場合がある。
たとえば、或るサービスの出力は別のサービスの入力となる場合があり、サービスを構成するのに使用される同じ数の中間サービスについて同様である。
構成されたサービスの一例には、ユーザが特定のエンドユーザデバイスで視聴できるフォーマットでストリーミングビデオを受信できるようなトランスコードサービスに入力されるビデオストリーミングサービスを含むメディアサービスが含まれ得る。
他のタイプのサービスには、コンピューティングサービス、データストレージサービス、およびグリッドコンピューティングサービスが含まれる。
グリッドコンピューティングサービスは、コンピュータ資源の共有を包含することができる。
グリッドコンピューティングサービスによって、たとえば、ユーザは、アプリケーション要件等の仕様に基づいてコンピューティングサービスにアクセスすることが可能になる。
[1.システムの概観]
図1は、ユーザノード110とサービスノード120と情報サービスノード130とを含むネットワーク100を示している。
ネットワーク100の一例には、サービスがユーザに利用可能とされるインターネット等の大規模ネットワークが含まれる。
しかしながら、実施形態は、サービスを提供するより小さなネットワークで実施してもよい。
ユーザノードには、サービスを受信するように動作可能なあらゆるノードが含まれる。
通常、ユーザノードは、ユーザが所望するサービスがネットワーク100において利用可能であるか否か、および、そのサービスが利用可能である場合に、そのサービスを受信するためにどのサービスノードと連絡するかを判断するための問い合わせを情報サービスにサブミットする。
サービスノード120には、サービスを提供するように動作可能なノードが含まれる。
ユーザノードは、情報サービスに問い合わせることによって所望のサービスを提供するように動作可能なサービスノードを特定した後、所望のサービスを提供するサービスノードからサービスを受信する。
ノードとは、ネットワークを介してメッセージを送信および/または受信でき、且つ、通常は或るタイプのデータ処理を実行するように動作可能であるあらゆるデバイスである。
ノードの例には、ルータ、サーバ、およびエンドユーザデバイスが含まれる。
エンドユーザデバイスは、PDA、パーソナルコンピュータ、ラップトップ、および携帯電話等である。
情報サービスは、一実施形態によれば、情報サービスノード130によって提供される。
情報サービスノード130は、ネットワーク100においてサービスの発見を可能にする。
情報サービスノード130は、サービスの発見に加えて、Sujoy Basu他による「Splitting Workload Of A Node」という発明の名称の同時係属中の米国特許出願(代理人整理番号第200500031−1号)に記載されたいくつかの技法を使用して、それらの情報サービスノード間でワークロードをバランスさせ、且つSujoy Basu他による「Routing a Service Query In An Overlay Network」という発明の名称の同時係属中の米国特許出願(代理人整理番号第200406058−1号)に記載されたルーティングを実行する。
これらの米国特許出願の双方は、その全内容が参照により援用される。
上述したように、情報サービスノード130を含む情報サービスは、ネットワーク100におけるサービスの発見に関連する機能を実行する。
2つの重要な機能は、利用可能なサービスについての情報を記憶すること、および利用可能なサービスについての問い合わせに対して応答することを含む。
情報サービスノード130は、ネットワーク100における、図2に示すピアツーピアネットワーク200に設けられる。
ピアツーピアネットワーク200、および、ピアツーピアネットワーク200のオーバーレイネットワーク210は、とりわけ、情報サービスノード130にサービスについての情報を記憶すること、情報サービスノード130間でルーティングを行うこと、および問い合わせに対して応答するために使用される。
図2に示すように、オーバーレイネットワーク210は、基礎と成るピアツーピアネットワーク200をオーバーレイする。
オーバーレイネットワーク210は、ピアツーピアネットワーク200の論理表現であり、以下で詳述するように、サービスを定義するために使用される属性および属性範囲に基づいて、問い合わせおよびサービス情報を効率的にルーティングするように動作可能である。
図2は、ピアツーピアネットワーク200が情報サービスノード130を含むこと、並びに、ユーザノード110およびサービスノード120が必要に応じてピアツーピアネットワーク200の情報サービスノード130と通信することを示す目的で、ネットワーク100の中央に位置する情報サービスノード130、並びに、オーバーレイネットワーク210の周囲に設けられたユーザノード110およびサービスノード120を示している。
待ち時間(たとえば、ユーザノードが問い合わせ応答に対する応答を得るのに要する時間の長さ)を最小にするために、情報サービスノード130は、ネットワーク100のいくつかの異なるエリアに設けてもよい。
[2.属性空間および属性部分空間]
サービスは、さまざまなサービス属性の値を指定することによって特徴付けられる。
たとえば、コンピューティングサービスは、オペレーティングシステムおよびアプリケーション、物理メモリの量、ディスク容量、およびネットワーク帯域幅等の属性の値によって特徴付けられてもよい。
情報サービスは、これらの属性および属性値を追跡する。
各情報サービスノードは、属性の1つまたは複数の一定の一組の値の追跡を担当する。
追跡されるすべての属性の数組の属性値を組み合わせることによって、その情報サービスノードによって追跡される属性部分空間が形成される。
情報サービスノード130により構成される情報サービスは、図3に示す属性空間300を含む。
属性空間300は、ピアツーピアネットワーク100の利用可能なサービスについてのすべての情報を含む。
属性空間300は、情報サービスに記憶された情報の論理表現である。
属性空間300は、情報サービスノード130間に分散される。
図3には、例示の目的で、3つの情報サービスノード130a〜130cのみ示す。
情報サービスノード130のそれぞれには、属性空間300の属性部分空間の担当が割り当てられる。
各属性部分空間は、特定の属性および属性値に関連付けられる。
情報サービスにおいて、サービスは、サービスによって変化する所定の属性および属性値により定義される。
属性および属性値は、情報サービスノード130のそれぞれに割り当てられる。
サービスは、1つの情報サービスノードの1つの属性部分空間内に分類されるように定められ、したがって、そのサービスの属性および属性値が、情報サービスノードの属性部分空間に割り当てられた属性および属性値と一致する場合、そのサービスについての情報は、最終的に、その情報サービスノードに記憶される。
たとえば、属性部分空間は、特定の属性の属性値を含むことができる。
或るサービスが、或る属性部分空間の属性値と交わる1つまたは複数の属性値を使用して定義される場合、そのサービスは、その属性部分空間内に分類することができる。
属性部分空間をさらに説明する一例は以下の通りである。
ネットワーク100におけるすべてのサービスを定義するための所定の属性のリストは、メモリ、ディスク容量、平均負荷、オペレーティングシステム、アプリケーション、サービスアップタイム、および応答時間を含んでもよい。
グリッドコンピューティングサービスは、コンピュータ資源の共有を含んでもよい。
グリッドコンピューティングサービス(たとえばグリッドコンピューティングサービス1)は、共有できるコンピュータ資源に基づいて定義することができる。
グリッドコンピューティングサービス1は、以下の属性値を使用して定義される。
[グリッドコンピューティングサービス1の属性および属性値の表1]
メモリ:1GB,
ディスク容量:2.5〜5GB,
オペレーティングシステム:Linux2.4,
平均負荷:0,
アプリケーション:Maya、Renderman,
サービスアップタイム:99.5%,
応答時間:≦20ms,
図3に示すように、情報サービスノード130aには、メモリ≦1GBの属性値によって定義される属性部分空間が割り当てられている。
グリッドコンピューティングサービス1の広告310は、表1の属性値を含み、情報サービスノード130aに記憶される。
その理由は、情報サービスノード130aが、メモリ属性値≦1GBを有するすべての広告を記憶するからである。
広告は、特定のサービスを定義するために使用される属性および属性値を含む。
ネットワーク100のすべてのサービスを定義するために所定の一組の属性を使用してもよい。
サービスノード120のそれぞれは、その所定の一組の属性における属性のそれぞれについて属性値を測定するかまたは他の方法で決定する。
また、サービスノード120のそれぞれは、それらのノードの広告を情報サービスへ定期的に送信する。
オーバーレイネットワーク210は、広告が分類される属性部分空間を所有する適切な情報サービスノードへ広告を自動的にルーティングする。
グリッドコンピューティングサービス1についての上記に示した属性および属性値は、グリッドコンピューティングサービス1の広告130の情報の一例である。
たとえば、グリッドコンピューティングサービス1を提供するサービスノードは、表1に示すグリッドコンピューティングサービス1の属性値を定期的に測定するかまたは他の方法で決定し、属性値を含む広告310をオーバーレイネットワーク210へ送信して、その広告が分類される属性部分空間を所有する情報サービスノードに記憶する。
図3に示す例では、情報サービスノード130は、グリッドコンピューティングサービス1の広告310を情報サービスノード130aへルーティングした。
その理由は、情報サービスノード130aが、オーバーレイネットワーク210へ送信される、メモリ≦1GB内の属性値を有するサービスについてのすべての情報を記憶するからである。
すなわち、グリッドコンピューティングサービス1は、メモリ=属性の1GBの属性値を使用して定義され、1GBの属性値が交わる。
すなわち、1GBの属性値は、情報サービスノード130aの属性部分空間のメモリ≦1GBの属性範囲に含まれる。
このように、グリッドコンピューティングサービス1は、情報サービスノード130aの属性部分空間内に分類される。
グリッドコンピューティングサービス1について上記に示した属性は、ネットワーク100におけるサービスを定義するために使用される所定の一組の属性の例である。
利用可能なサービスを定義するのに他の属性を使用してもよいことが当業者に明らかであろう。
また、それらのサービスを定義するのに或る所定の一組の属性を使用することもできる。
しかしながら、各サービスは、異なる属性値を有してもよい。
これらの異なる属性値は、定期的に測定されて、対応する属性部分空間を有する情報サービスノードに記憶される。
問い合わせも、同様に、ピアツーピアネットワーク200に記憶される。
たとえば、図2に示すオーバーレイネットワーク210は、メモリ>1GBおよびディスク容量=2GBの属性を有するサービスの要求を含む、図3に示す問い合わせ320を受信する場合がある。
問い合わせ320は、情報サービスノード130bによって所有される属性部分空間に分類される。
したがって、問い合わせ320は、オーバーレイネットワーク210を通じて情報サービスノード130bへルーティングされる。
問い合わせ320は、情報サービスノード130bへ自動的にルーティングされ且つ情報サービスノード130bに記憶され、情報サービスノード130bは、情報サービスノード130bに記憶された広告を探索して、あらゆる一致するものを、サービスを要求したノードへ送信することにより、この問い合わせに応答する。
属性空間300を含むオーバーレイネットワーク210は、範囲問い合わせをサポートする。
範囲問い合わせは、所望のサービスを特定する1つまたは複数の属性範囲を含む。
情報サービスノード130は、オーバーレイネットワーク210を使用して、範囲問い合わせを、属性値の範囲を含む属性部分空間へ、または問い合わせの属性値の範囲と交わる属性部分空間へルーティングするように動作可能である。
加えて、問い合わせは、複数の属性範囲を含むことができ、問い合わせは、属性範囲を含む属性部分空間または属性範囲と交わる属性部分空間を有する2つ以上の情報サービスノードへルーティングすることができる。
[3.情報サービスノード]
図4は、情報サービスノード130b等の情報サービスノードに記憶された情報の一部の一例を示している。
情報サービスノード130bは、ストレージキャッシュ410、オーバーレイルーティング表420、およびレプリカロケーションキャッシュ440を含む。
ストレージキャッシュ410は、ローカルな問い合わせ401およびグローバルな問い合わせ402を記憶する。
また、ストレージキャッシュ410は、ローカルな広告405およびグローバルな広告406も記憶する。
グローバルな問い合わせ402には、オーバーレイネットワーク210を通じて情報サービスノード130bへルーティングされる問い合わせが含まれる。
その理由は、問い合わせは、情報ストレージノード130bによって所有される属性部分空間に分類されるからである。
図3に示す問い合わせ320は、グローバルな問い合わせの一例である。
ローカルな問い合わせ401には、情報サービスノード130bによって受信されるあらゆる問い合わせが含まれる。
たとえば、情報サービスノード130aは、問い合わせを受信して、その問い合わせを、オーバーレイネットワーク210にあるその宛先に向けて転送することができる。
オーバーレイネットワーク210は、問い合わせが分類される属性部分空間を所有する情報サービスノードを含むことができる。
問い合わせをその宛先に向けて転送する前に、問い合わせは、ストレージキャッシュ410にローカルにキャッシュされる。
また、情報サービスノード130bは、問い合わせをその宛先に向けて転送する前に、ストレージキャッシュ410に記憶されたローカルな広告405を探索して、問い合わせと一致するものが何か見つかるか否かを判断する。
一致するものが見つかった場合、情報サービスノード130bは、たとえば、サービスを要求したノードおよび関連するサービスノードへ一致する広告を送信することによって、その問い合わせに応答する。
宛先は、サービスを要求したノードにより近いサービスノードによって提供される、問い合わせと一致するサービスの広告を含む場合があることから、情報サービスノード130bは、問い合わせをその宛先に向けて引き続きルーティングする場合がある。
或いは、情報サービスノード130bは、一致するものがローカルにキャッシュされている場合に、問い合わせを転送しない場合がある。
グローバルな広告406は、オーバーレイネットワーク210を通じて情報サービスノード130bへルーティングされる広告を含む。
その理由は、それらの広告が、情報ストレージノード130bによって所有される属性部分空間に分類されるからである。
図3に示す広告310は、情報サービスノード130aのグローバルな広告の一例である。
ローカルな広告405は、情報サービスノード130aによって受信されたあらゆる広告を含む。
たとえば、情報サービスノード130aは、広告を受信して、その広告をその宛先に向けて転送することができる。
これらの広告は、ストレージキャッシュ410にローカルにキャッシュされ、一致するものがローカルキャッシュに見つかった場合に、問い合わせに対するより高速な応答時間を提供するために探索することができる。
情報サービスノード130bは、オーバーレイルーティング表420も含む。
オーバーレイルーティング表420は、以下のフィールド、すなわち、レベル421、IPアドレス422、確率423、および属性範囲424を含む。
レベル421は、一般に、情報サービスノード130bが自身のワークロードを別の情報サービスと分割した回数に関連付けられている。
情報サービス130bが自身のワークロードを別の情報サービスノードと分割する時、情報サービスノード130bのルーティング表の新たなエントリーが、ルーティング表における既存の最高レベルよりも大きなレベルに作成される。
たとえば、エントリー431および432は、情報サービスノード130bが自身のワークロードを情報サービスノード130cと分割した時にレベル1に作成されたものである。
エントリー433は、情報サービスノード130bがその後自身のワークロードを情報サービスノード130dと分割した時にレベル2に作成されたものである。
ワークロードの分割は、情報サービスノードが、オーバーレイネットワーク210の他の情報サービスノードと比較して高いワークロードを有すると判断された時に行うことができる。
確率423は、情報サービスノードが所望のデータを有する確率を示す。
たとえば、エントリー430は、情報サービスノード130aが、メモリ≦1GBを有する広告を常に記憶していることを示し、エントリー431は、情報サービスノード130cが、ディスク容量≦2GBを有する広告を常に記憶していることを示す。
一方、情報サービスノード130cが、ディスク容量≦5GBを有する広告を記憶している確率は50%である。
ルーティング表にエントリーを生成することおよび確率は、上記で参照により援用された米国特許出願にさらに詳細に記載されている。
ルーティング表420のIPアドレスフィールド422は、特定のエントリーの情報サービスノードの宛先を特定するためのものである。
たとえば、情報サービスノード130bは、広告を受信して、その広告がメモリ属性<1GBを有するものと判断した場合、エントリー430を使用して、その広告をその次の宛先、たとえば情報サービスノード130aへルーティングする。
情報サービスノード130aのIPアドレスは、エントリー430のIPアドレスフィールドに設けることができ、情報サービスノード130bは、IPルーティングを使用して、メッセージをネットワーク200の情報サービスノード130aへ送信する。
レプリカロケーションキャッシュ440は、各サービスノードが連絡を受ける回数および連絡を受けたことがあるサービスノードの待ち時間に関する情報を記憶する。
レプリカとは、情報サービスノードのコピーである。
たとえば、オリジナルの情報サービスノードが、ネットワーク100の或るエリアのユーザノードによって頻繁に連絡されていたと判断された場合、および/または、オリジナルの情報サービスノードからの、問い合わせに対する応答等のメッセージを受信するユーザノードが、情報サービスノードへの長い待ち時間を経験し続けていたと判断された場合、情報サービスノードをネットワーク100の新たなロケーションに複製することができる。
情報サービスノード130bは、レプリカロケーションキャッシュ440の情報を使用して、待ち時間を削減するためにネットワーク100の別のエリアにレプリカを追加するか否かを判断することができる。
[4.ルーティング]
図5は、オーバーレイネットワーク210で問い合わせ501をルーティングする一例を示している。
ユーザノード110aは、問い合わせ501を、オーバーレイネットワーク210の情報サービスノード、たとえば情報サービスノード130aへ送信する。
一例では、ユーザノード110aがオーバーレイネットワーク210において最初に連絡を取る情報サービスノードは、ネットワーク近接性に基づいて選択することができる。
たとえば、ユーザノード110aがピアツーピアネットワーク100に参加する時の初期化ステップの期間中、ユーザノード110aは、ユーザノード110aにネットワークにおいて極めて近接した情報サービスノードのIPアドレスを示すメッセージをその情報サービスノードから受信する。
待ち時間、ホップ数等のネットワークメトリックに基づき測定された距離を使用してノードのロケーション情報を決定する一例は、2004年1月30日に出願されたZhichen Xu他による「Selecting Nodes Close To Another Node In A Network Using Location Information For The Nodes」という発明の名称の米国特許出願第10/767,285号に記載されている。
この米国特許出願は、本出願の譲受人に譲渡されている。
ロケーション情報は、ネットワークの他のノードへのネットワーク近接性を判断するのに使用され、最も近い情報サービスノードを選択するのに使用することができる。
ネットワークのノードの距離およびロケーション情報を決定するための他の技法も使用することができる。
ユーザノード110aが、極めて近接した情報サービスノード、たとえば情報サービスノード130a、を特定した後、ユーザノード110bは、問い合わせ501を情報サービスノード130aへ送信する。
問い合わせ501は、ユーザノード110aが所望するサービスを定義する属性値を含む。
属性値は、範囲の場合も、単一の値の場合もある。この例では、問い合わせ501は以下の属性値を含む。
[問い合わせ501の属性および属性値の表2]
メモリ:2GB,
ディスク容量:10GB,
オペレーティングシステム:Linux2.4,
応答時間:50〜100ms,
情報サービスノード130aは問い合わせ501を受信する。
情報サービスノード130aの属性部分空間は、メモリ≦1GBを含む。
問い合わせ501は、メモリについて2GBの属性値を含む。
この2GBの属性値は、情報サービスノード130aの属性部分空間のメモリ≦1GBの属性範囲に含まれず、したがって、問い合わせ501は、情報サービスノード130aの属性部分空間に分類されない。
情報サービスノード130aは、自身のルーティング表から、問い合わせ501の属性値を含む情報サービスノードを特定する。
たとえば、情報サービスノード130aは、最低レベルのエントリー、たとえばエントリー0から開始して、問い合わせ501の属性値と交わる属性値を含むエントリーを求めて自身のルーティング表を探索する。
レベル0、情報サービスノード130bのIPアドレス、1の確率、およびメモリ>1GBを含むエントリー510が示されている。
エントリー510に基づいて、情報サービスノード130aは、問い合わせ501を情報サービスノード130bへ送信する。
情報サービスノード130bの属性部分空間は、問い合わせ501で指定された50〜100msの応答時間範囲に含まれない応答時間<20msを含む。
したがって、情報サービスノード130dは、自身のルーティング表を探索して、たとえばエントリー511を見つける。
エントリー511は、情報サービスノード130dを特定し、問い合わせ501は、情報サービスノード130dへ送信される。
情報サービスノード130dは、問い合わせ501の属性値を含む属性部分空間を有し、したがって、問い合わせ501は、その属性部分空間に分類される。
情報サービスノード130aは、自身のグローバルキャッシュに記憶されたいずれかの広告が問い合わせを満たすか否かを判断する。
たとえば、サービスは、当該サービスが一致するものであるとみなされるためには、問い合わせ501で指定されたすべての属性値を有することを必要とし得る。
一致するものが見つかった場合、情報サービスノード130aは、たとえばサービスを提供するサービスノードのIPアドレスを含む広告をユーザノード110aへ送信することによって問い合わせ501に応答する。
また、情報サービスノード130aは、広告のために、ユーザノード110aが広告に記載されたサービスを要求していることを示すメッセージを、ユーザノード110aのIPアドレスと共にサービスノードへ送信することもできる。
問い合わせ501も、情報サービスノード130cのグローバルキャッシュに記憶される。
情報サービスノード130aおよび130bは、問い合わせ501を転送する前に、自身のローカルキャッシュに問い合わせ501のコピーを記憶することができる。
また、情報サービスノード130aおよび130bは、問い合わせを転送する前に、自身のローカルキャッシュに記憶されたいずれかの広告が問い合わせ501を満たすか否かを判断することもできる。
一致するものが見つかった場合、情報サービスノード130aは、たとえばサービスを提供するサービスノードのIPアドレスを含む広告をユーザノード110aへ送信することによって問い合わせ501に応答することができる。
また、情報サービスノード130aは、ユーザノード110aが広告のサービスを要求していることを示すメッセージを、ユーザノード110aのIPアドレスと共に、広告に記載されたサービスを提供するサービスノードへ送信することもできる。
図5に関して上述した例では、問い合わせ501は、情報サービスノード130dの属性部分空間に分類されるので、情報サービスノード130dへルーティングされる。
問い合わせ501は、問い合わせ501に一致する広告を含み得る他の情報サービスノードへ引き続きルーティングされる場合がある。
たとえば、別の情報サービスノードは、以下の属性部分空間、すなわち、メモリ>1GB、ディスク容量>5GB、応答時間≧20ms、およびLinux1.0〜2.5を含むオペレーティングシステム、を含む場合がある。
問い合わせ501は、上述した属性部分空間にも分類されることから、情報サービスノード130dは、その属性部分空間を含む情報サービスノードへ問い合わせ501をルーティングすることができる。
したがって、ユーザノード110aは、自身のローカルキャッシュで一致するものを見つけた情報サービスノードを含む複数の情報サービスノードから探索結果を受信する場合があり、ユーザノード110aは、所望のサービスを受信するためのサービスノードを選択することができる。
加えて、オーバーレイネットワーク210は、範囲の問い合わせもサポートすることに留意すべきである。
問い合わせ501は、属性の応答時間について、属性値の範囲50〜100msを含む。
問い合わせ501は、1つまたは複数の範囲を含むことができ、その範囲と交わる情報サービスノードへルーティングされる。
たとえば、属性値50〜100msのいずれかを含む属性部分空間へ問い合わせ501をルーティングすることができる。
図6は、オーバーレイネットワーク210における広告601のルーティングを示している。
広告は、オーバーレイネットワーク210において問い合わせと同様にルーティングされる。
サービスノード120は、自身の属性を定期的に測定して、測定された属性を含む自身の広告をオーバーレイネットワーク210へ送信する。
各広告は、所定の一組の属性における属性ごとに属性値または属性値の範囲を含んでもよい。
所定の一組の属性の一例は、メモリ、ディスク容量、オペレーティングシステム、サービスを提供するサービスノードの平均負荷、アプリケーション、サービスアップタイム、およびサービスを提供する情報サービスノードの応答時間を含む。
図6は、サービスノード120bによって生成された広告601を示している。
広告601は以下のものを含む。
[広告601の属性値の表3]
メモリ:1GB,
ディスク容量:2.5〜5GB,
オペレーティングシステム:Linux2.4,
平均負荷:0,
アプリケーション:Maya、Renderman,
サービスアップタイム:99.5%,
応答時間:≦20ms,
たとえば、情報サービスノード130aは、サービスノード120bに極めて近接しているので、サービスノード120bは、情報サービスノード130aへ広告601を送信することができる。
広告601はメモリ>1GBを有し、且つ、情報サービスノード130aの属性部分空間はメモリ≦1GBを含むので、広告601は、情報サービスノード130aによって所有される属性部分空間に分類されない。
したがって、情報サービスノード130aは、自身のルーティング表のエントリー610から情報サービスノード130bを特定する。
たとえば、情報サービスノード130bは、最低レベルのエントリーから開始して、広告601の属性値と交わる属性値を含むエントリーを求めて自身のルーティング表を探索する。
エントリー610は、情報サービスノード130bを特定し、広告601は、情報サービスノード130bへ送信される。
広告601のディスク容量は5GB以下であるので、広告601は、情報サービスノード130bによって所有される属性部分空間に分類されない。
情報サービスノード130bは、ディスク容量≦5GBの属性値を含む自身のルーティング表のエントリー611から情報サービスノード130cを特定する。
広告601は、情報サービスノード130cの属性部分空間に分類され、情報サービスノード130cに記憶される。
広告601を転送する前に、情報サービスノード130aおよび130bは、広告601を自身のローカルキャッシュに記憶する。
加えて、情報サービスノード130cは、自身のグローバルキャッシュに記憶するために広告601をコピーすることができ、広告601が分類される属性部分空間を含む他の情報サービスノードへ広告601を転送することができる。
[4.上位K個のノードを特定するための分散アルゴリズム]
ワークロードは、図2に示すオーバーレイネットワーク210の情報サービスノード130のそれぞれによって定期的に測定される。
ワークロードは、1つまたは複数のメトリックから計算することができる。
これらのメトリックには、記憶された広告の個数、処理された問い合わせの個数、問い合わせを処理する平均待ち時間、たとえば毎秒処理される問い合わせ等のスループット等が含まれるが、これらに限定されるものではない。
各エポック(epoch)の初めに、情報サービスノード130は交換フェーズに参加する。
各エポックは、交換フェーズおよび/または普及(dissemination)フェーズが実行される期間を含んでもよい。
エポックカウンタまたは次のエポックの開始時刻を上位Kリストに含めてもよい。
エポックカウンタまたは次のエポックの開始時刻は、情報サービスノードが、その情報サービスノードによって受信されたリストが現在のエポックについてのものであるか否かを判断するのに使用することができる。
交換フェーズの期間中、上位K個のノードのリストが、情報サービスノード130で構成されたサービスツリーの上方にルーティングされる。
サービスツリーの最上位にはリーダノードがある。
リーダノードは、事前に選択された情報サービスノードとしてもよい。
上位Kリストは、オーバーレイネットワーク210の情報サービスノード130によって測定された最高ワークロードを含み、オーバーレイネットワーク210の情報サービスノード130のそれぞれを通じて、図7に示すリーダノード710へルーティングされる。
上位Kリストが、情報サービスノード130のそれぞれを通じてルーティングされる時、各情報サービスノードは、自身の測定されたワークロードを上位Kリストの他のワークロードと比較する。
上位Kリストを受信した情報サービスノードのワークロードが、上位Kリストの別のワークロードよりも大きい場合、その情報サービスノードは、自身のワークロードを上位Kリストに含め、場合により、それによりも小さなワークロードは置き換えられる。
上位Kリストは、所定の個数であるK個のワークロードを含むことができる。
したがって、上位Kリストが含むワークロードがK個よりも少ない場合、情報サービスノードは、自身のワークロードを上位Kリストに含める。
また、上位Kリストは、最初に、いくつかの上位Kリストで構成することもできる。
たとえば、情報サービスノード130を含むサービスツリーの各リーフが、上位Kリストを創設する(originate)ことができる。
これらの上位Kリストは、いくつかの上位Kリストを受信する情報サービスノードで結合することができる。
最終的に、リーダノード710が単一の上位Kリストを編集する。
上位Kリストに加えて、オーバーレイネットワークにおけるL最低レベルベクトルおよび最高ルーティング表値も、オーバーレイネットワーク210を通じて伝播される。
最低レベルベクトルは、オーバーレイネットワーク210のL個の最低ルーティング表レベルを含む。
最低レベルベクトルが情報サービスノード130のそれぞれを通じてルーティングされる時、各情報サービスノードは、自身のルーティング表の最高レベルを、最低レベルベクトルの他の値と比較する。
最低レベルベクトルを受信した情報サービスノードのルーティング表の最高レベルが、最低レベルベクトルの別の値よりも小さい場合、その情報サービスノードは、自身の最高レベルを最低レベルベクトルに含め、場合により、それよりも大きな値が置き換えられる。
最低レベルベクトルは、所定の個数であるL個の値を含むことができる。
したがって、最低レベルベクトルが含む値がL個よりも少ない場合、情報サービスノードは、自身の最高レベルを最低レベルベクトルに含める。
また、最低レベルベクトルは、最初に、いくつかの最低レベルベクトルで構成することもできる。
たとえば、情報サービスノード130を含むサービスツリーの各リーフが、最低レベルベクトルを創設することができる。
最低レベルベクトルは、いくつかの最低レベルベクトルを受信する情報サービスノードにおいて結合することができる。
最終的に、リーダノード701がL個の値を含む単一の最低レベルベクトルを編集する。
オーバーレイネットワーク210の情報サービスノード130のルーティング表の最高レベルも、オーバーレイネットワーク210の情報サービスノード130のそれぞれを通じて、図7に示す同じリーダノード701へルーティングされる。
最高レベルが、情報サービスノード130のそれぞれを通じてルーティングされる時、各情報サービスノードは、自身のルーティング表の最高レベルを受信した値と比較する。
情報サービスノードのルーティング表の最高レベルが、受信した値よりも大きい場合、その情報サービスノードは、受信した値を自身の値に置き替える。
情報サービスノード130を含むサービスツリーの各リーフが、その最高レベルを創設することになる。
これらの値は、いくつかの最高レベル値を受信した情報サービスノードにおいて結合することができる。
最終的に、リーダノード701が単一の最高レベルを編集する。
最高ルーティング表レベルは、便宜のための、L最低レベルベクトルに含めることができ、オーバーレイネットワークを通じてL最低レベルベクトルと共に送信することができる。
交換フェーズの期間中、上位Kリストがリーダノード701へルーティングされる時、情報サービスノード130のそれぞれは、IPアドレス等の識別子を上位Kリストに含める。
上位Kリストを受信した情報サービスノードが上位Kリストに自身のワークロードを含めない場合であっても、識別子は含められる。
普及フェーズでは、上位Kリストは、これらの識別子を使用して情報サービスノード130のそれぞれを通じてサービスツリーの下方に送信される。
たとえば、上位Kリストは、各情報サービスノードが上位Kリストを受信した順序とは逆の順序で、情報サービスノード130のそれぞれへ送信される。
また、新たな情報サービスノードが情報サービスに参加する時、その新たな情報サービスノードは、ルーティング表を生成してその新たな情報サービスノードのグローバルキャッシュに広告および問い合わせを記憶することに加えて、最後のエポックにおいて測定されたワークロードを含む上位Kリストを受信する。
交換フェーズおよび普及フェーズを図7に関してさらに示す。
図7は、オーバーレイネットワーク210の情報サービスノード130a〜130dを含むサービスツリーの一部を示している。
リーダノード701は、情報サービスノード130aである。
交換フェーズの期間中、情報サービスノード130a〜130dは、自身のワークロードを測定する。
ワークロードの上位Kリストは、リーフ、たとえば情報サービスノード130dおよび130eからリーダノード701へサービスツリーの上方に送信される。
情報サービスノード130は、上位Kリストのワークロードベクトルおよび最低レベルベクトルを生成して、サービスツリーがどれだけ非対称になっているか、または、サービスツリーがどれだけバランスがとれているかを指定する。
最低レベルベクトルは、サービスツリーのバランスを維持することを試みながら、ワークロード分割のための情報サービスノードを選択するのに使用することができる。
たとえば、オーバーレイネットワーク210の最高(最大)ルーティング表レベルと最低レベルベクトルの最小値との差がしきい値と比較される。
この差がしきい値よりも大きい場合、サービスツリーのバランスの維持を試みて、ワークロード分割用の、最小値を有する情報サービスノードを選択することができる。
図7に示すように、情報サービスノード130dおよび130eは、自身のワークロードを測定し、ワークロードベクトル710および711をそれぞれ生成する。
K個の最高ワークロードを含むオーバーレイネットワーク210のワークロードベクトルが結合されて、上位Kリストが形成される。
各ワークロードベクトルは、少なくとも、情報サービスノードの識別情報および測定されたワークロードを含む。
また、情報サービスノード130dおよび130eは、最低レベルベクトル720および721もそれぞれ生成する。
最低レベルベクトルは、その情報サービスノードのルーティング表における最高レベルを含む。
情報サービスノード130a〜130dの最高レベルの例は、図8A〜図8Dに示され、0、2、1、および2をそれぞれ含む。
最低レベルベクトルは、オーバーレイネットワーク210のL個の最低レベルを含むL最低レベルリストを形成するのに使用される。
L最低レベルリストは、オーバーレイネットワーク210の最高レベルを有する情報サービスノードの情報サービスノードIDおよびルーティング表レベルも含む。
いくつかの上位Kリストは、交換フェーズの期間中に交換することができ、情報サービスノード130b等の中間ノードにおいて結合することができる。
たとえば、ワークロードベクトル710および711は、情報サービスノード130bへ送信された上位Kリストである。
Kが3であると仮定すると、情報サービスノード130bは、ワークロードベクトル710および711と自身のワークロードベクトルとを結合して、上位Kリスト712にする。
上位Kリスト712は、リーダノード701に向けて送信され、情報サービスノード130cおよび/または130aのワークロードが、各情報サービスノードによって受信された上位Kリスト712のワークロードよりも高い場合には、それらの情報サービスノード130cおよび/または130aのワークロードを含めることができる。
また、交換フェーズの期間中、最低レベルベクトル720および721は、情報サービスノード130bへ送信される。
情報サービスノード130bは、(L最低レベルベクトルとも呼ばれる)最低レベルベクトル720および721と自身の最低レベルベクトルとを結合して、L最低レベルリスト722にする。
L最低レベルリストは、リーダノード701に向けて送信され、情報サービスノード130cおよび/または130aのレベルが、L最低レベルリストのレベルよりも低い場合には、それらの情報サービスノードの最高ルーティング表レベルを含めることができる。
加えて、L最低レベルリストは、オーバーレイネットワーク210の最高レベルを有するサービスノードを含む。
最大レベルと、ワークロード分割のために最初に選択された情報サービスノードのレベルとの差をしきい値と比較して、最初に選択された情報サービスノードが、ワークロード分割のために選択されたもののままであるか否かを判断することができる。
この比較は、サービスツリーのバランスを維持するための一技法である。
また、普及フェーズの期間中に上位Kリストをすべての情報サービスノードに普及できるように、交換フェーズの期間中、上位Kリストを受信する情報サービスノードの順序が、情報サービスノード130に記憶される。
たとえば、情報サービスノード130bが普及フェーズの期間中に上位Kリスト712を情報サービスノード130eおよび130dへ送信するように、順序情報730は、IPアドレス等の、情報サービスノード130eおよび130dの識別情報を含む。
順序情報の他の例には、情報サービスノード130bのIPアドレス等、情報サービスノード130cにおける順序情報731、および、情報サービスノード130cのIPアドレス等、情報サービス130aにおける順序情報732が含まれる。
したがって、普及フェーズの期間中、上位Kリスト712は、すべての情報サービスノード130へサービスツリーの下方に送信される。
K最低レベルリストも、普及フェーズの期間中にサービスツリーの下方に送信される。
上位Kリストを送信する情報サービスノードのルーティング表に基づいて上位Kリストをどの情報サービスノードへ送信するかを決定するのに、上位Kルーティングアルゴリズムが使用される。
たとえば、図8A〜図8Dは、情報サービスノード130a〜130dのルーティング表を示している。
上位Kリストをリーダノードへルーティングするために、上位Kリストを受信する情報サービスノードは、対応する分割値未満の範囲を担当する、自身のルーティング表における最大レベルへ上位Kリストを送信する。
上位Kリストの情報は、上位Kリストがリーダノードへルーティングされる所までに判明した上位K個のノードおよびそれらのノードのワークロードを特定する。
たとえば、図8Dの情報サービスノード130dのルーティング表を参照すると、最高レベルまたは最大レベルは、2のレベルを有するエントリー840にある。
エントリー840は、応答時間属性について20msの属性分割値を含む。
応答時間の範囲は応答時間≦20msを含む。
この範囲は、対応する分割値未満、すなわち、20msの分割値よりも小さいので、ノード130bは上位Kリストを受信する次のノードとして特定される。
ノード130dは、上位Kリストをノード130bへ送信する。
情報サービスノード130bは、上位Kリストを受信し、上位Kルーティングアルゴリズムに基づき、図8bに示す情報サービスノード130bのルーティング表のエントリー820を使用して、情報サービスノード130cを、上位Kリストを受信する次の情報サービスノードとして特定する。
情報サービスノード130bは、上位Kリストに自身のワークロードを含め、上位Kリストを情報サービスノード130cへ送信する。
この例では、K=3の値である。
また、情報サービスノード130cは、図7に示すように、情報サービスノード130b、130d、および130eのワークロードも受信する。
情報サービスノード130cのワークロードが、情報サービスノード130b、130d、および130eのワークロードよりも小さい場合、情報サービスノード130cは、自身のワークロードを上位Kリストに含めない。
情報サービスノード130cのルーティング表のエントリー830は、上位Kルーティングアルゴリズムに基づいて、上位Kリストを受信する次のノードとして情報サービスノード130aを特定する。
情報サービスノード130aは、自身のワークロードが上位Kリストの3つのワークロードよりも大きいか否かを判断する。
大きい場合には、情報サービスノード130aは、自身のワークロードを上位Kリストに含める。
また、情報サービスノード130aはリーダノードでもある。
リーダノードは、自身のルーティング表の対応する分割値よりも大きな属性範囲のみを有する情報サービスノードである。
図8Aに示す情報サービスノード130aのルーティング表は、1つのエントリー810を含む。
エントリー810は、1GBの対応する分割値よりも大きな属性範囲を含む。
したがって、情報サービスノード130aのルーティング表は、対応する分割値よりも大きな属性範囲しか含まず、情報サービスノード130aはリーダノードである。
これとは対照的に、情報サービスノード130b〜130dのルーティング表は、エントリー820、830および840等、対応する分割値よりも小さな少なくとも1つの属性範囲を含む。
リーダノードが上位Kリストを受信した後、普及フェーズが開始する。
図7に示すように、リーダノード、たとえば情報サービスノード130aは、上位Kリストを情報サービスノード130cへ送信する。
上位Kリストは、最終的には、たとえば、前に、上位Kリストがリーダノードに向けてサービスツリーの上方にルーティングされた時に情報サービスノードが上位Kリストを受信した順序と逆の順序で、すべての情報サービスノードへ普及される。
上位Kリストは、オーバーレイネットワーク210のK個の最高ワークロードのリストを含む。
本明細書で使用されるようなリストは、ノード間で送信できる1つまたは複数の値のデータ表現を含む。
たとえば、上位Kリストは、オーバーレイネットワーク210の最大のワークロードの値を含む。
これらの値は、情報サービスノード130間で送信される。
上位Kリストは、ワークロードを含むことに加えて、上位Kリストにワークロードを有する情報サービスノードの識別子も含む。
識別子の一例はIPアドレスであるが、他の識別子も使用することができる。
図9は、一実施形態による、交換フェーズのステップを含む方法900を示している。
方法900は、限定ではなく一例として、図1〜図8について説明される。
ステップ901において、上位Kリストが、オーバーレイネットワーク210の情報サービスノード130を通じて、オーバーレイネットワーク210の最終宛先へルーティングされる。
一例では、最終宛先には、図7に示すリーダノード130aが含まれる。
交換フェーズの期間中、図7に示すリーダノード130aは、図2に示すオーバーレイネットワーク210の上位のK個の最高ワークロードを有する情報サービスノードの識別情報を含む上位Kリストを受信する。
リーダノードは、自身のルーティング表の対応する分割値よりも大きな1つまたは複数の属性範囲のみを有するルーティング表を備える情報サービスノードである。
リーダノードは、アドミニストレータが最初に選択することができる。
ロバストな情報サービスノードをリーダノードとして選択することができる。
上位Kリストが最終宛先へルーティングされる際に情報サービスノード130が実行できるステップ902において、上位Kリストを受信した各情報サービスノードは、リストを受信した各ノードのワークロードを含めるか否かを判断する。
たとえば、図7に示すように、情報サービスノード130cは、交換フェーズの期間中、情報サービスノード130bから上位Kリストを受信する。
情報サービスノード130cのワークロードが情報サービスノード130bおよび130dのワークロードよりも小さい場合、情報サービスノード130cは、K=2の場合の上位Kリストに自身のワークロードを含めない。
情報サービスノード130cが、自身のワークロードが上位Kリストの2つのワークロードよりも大きいと判断する場合、情報サービスノード130cのワークロードは、上位Kリストに含められ、上位Kリストは、リーダノード130a等の最終宛先に向けてルーティングされる。
図10は、一実施形態による、情報サービスノード等のノードで実行される上位Kルーティングアルゴリズムの方法1000のフローチャートを示している。
方法1000は、限定ではなく一例として、図1〜図8について説明される。
ステップ1001において、図7に示す情報サービスノード130bは、上位Kリストを受信する。
ステップ1002において、情報サービスノード130bは、自身のワークロードを上位Kリストに含めるか否かを判断する。
たとえば、情報サービスノード130bは、自身のワークロードが上位Kリストの別のワークロードよりも大きい場合、または、上位KリストがK個のワークロードをまだ含んでいない場合に、自身のワークロードを上位Kリストに含める。
たとえば、図7の例を参照すると、K=2の場合、上位Kリストは、情報サービスノード130dの1つのワークロードを含むので、情報サービスノード130bは、自身のワークロードを上位Kリストに含める。
ステップ1003において、情報サービスノード130bは、ピアツーピアオーバーレイネットワーク210のリーダノードに向けてリストを転送する。
たとえば、情報サービスノード130bは、自身のルーティング表から、属性分割値以下の属性範囲を含む最高レベルのエントリーを特定する。
情報サービスノード130bのルーティング表の図8bに示すように、属性分割値以下の属性範囲を含む最高レベルのエントリーは、エントリー820である。
情報サービスノード130cがエントリー820から特定され、上位Kリストは、情報サービスノード130cへ送信される。
図8B〜図8Dに示すルーティング表は、上位Kリストに特定されるような最高ワークロードを有する情報サービスノードのワークロードをバランスさせるのに使用される分割アルゴリズムに基づいて生成することができる。
1つのローカル分割アルゴリズムは、オーバーレイネットワークの第2のノードの少なくとも1つの属性分割値に基づいて、その第2のノードのワークロードを第1のノードと分割することを含むことができる。
第1のノードには、オーバーレイネットワーク210に参加する新たなノードが含まれ得る。
この新たなノードには、分割値に基づいて、属性部分空間が割り当てられる。
実質的には、第2のノードのルーティング表のすべてのエントリーが、第1のノードのルーティング表にコピーされ、第1のノードのルーティング表の少なくとも1つの新たな最高レベルのエントリーが、少なくとも1つの属性分割値に基づいて、第1のノードのルーティング表について生成される。
図11は、オーバーレイネットワーク210の情報サービスノードとして使用できるコンピュータシステム1100の一例示のブロック図を示している。
コンピュータシステム1100は、ソフトウェアを実行するための実行プラットフォームを提供するプロセッサ1102等の1つまたは複数のプロセッサを含む。
プロセッサ1102からのコマンドおよびデータは、通信バス1104により通信される。
また、コンピュータシステム1100は、ランタイム期間中、ソフトウェアが常駐することができるランダムアクセスメモリ(RAM)等のメインメモリ1106および2次メモリ1108も含む。
2次メモリ1108は、たとえば、ソフトウェアのコピーを記憶できるフロッピー(登録商標)ディスケットドライブ、磁気テープドライブ、コンパクトディスクドライブ等を表す、ハードディスクドライブ1110および/または着脱可能ストレージドライブ1112、すなわち不揮発性メモリを含む。
また、2次メモリ1108は、ROM(読み出し専用メモリ)、EPROM(消去可能プログラマブルROM)、EEPROM(電気的消去可能プログラマブルROM)を含むことができる。
ソフトウェアに加えて、ルーティング表、グローバル情報表、並びに、測定されたQoS特性、測定された利用可能帯域幅、およびサービスに必要とされる帯域幅も、メインメモリ1106および/または2次メモリ1108に記憶することができる。
着脱可能ストレージドライブ1112は、既知の方法で着脱可能ストレージユニット1114から読み出しを行い、且つ/または、着脱可能ストレージユニット1114に書き込みを行う。
コンピュータシステム1100とのユーザインターフェースは、キーボード、マウス、スタイラス等の1つまたは複数の入力デバイス1128が用いられる。
ディスプレイアダプタ1122は、通信バス1104およびディスプレイ1120とインターフェースし、プロセッサ1102から表示データを受信し、その表示データをディスプレイ1120の表示コマンドに変換する。
ネットワークインターフェース1130は、図1に示すネットワーク200を介する他のノードとの通信用に設けられている。
方法700、800、および900のステップの1つまたは複数は、メモリ1106および/または1108等のコンピュータ可読媒体に組み込まれるソフトウェアとしてインプリメントすることができ、たとえばプロセッサ1102によってコンピュータシステム1100で実行することができる。
これらのステップは、コンピュータプログラムによって具現化することができる。
コンピュータプログラムは、アクティブおよび非アクティブの双方のさまざまな形で存在し得る。
たとえば、コンピュータプログラムは、ソースコード、オブジェクトコード、実行可能コード、またはステップの一部を実行するための他のフォーマットのプログラム命令で構成されたソフトウェアプログラム(複数可)として存在し得る。
上記のいずれも、コンピュータ可読媒体に具現化することができる。
コンピュータ可読媒体には、圧縮形式または非圧縮形式のストレージデバイスおよび信号が含まれる。
適したコンピュータ可読ストレージデバイスの例には、従来のコンピュータシステムのRAM(ランダムアクセスメモリ)、ROM(読み出し専用メモリ)、EPROM(消去可能プログラマブルROM)、EEPROM(電気的消去可能プログラマブルROM)、および磁気ディスク若しくは磁気テープまたは光ディスク若しくは光テープが含まれる。
コンピュータ可読信号の例は、搬送波を使用して変調されていようといまいと、インターネットまたは他のネットワークを通じてダウンロードされた信号を含めて、コンピュータプログラムをホスティングまたは実行するコンピュータシステムを、アクセスするように構成可能な信号である。
上記の具体例には、CD ROMでのプログラムの配布またはインターネットのダウンロードを介したプログラムの配信が含まれる。
或る意味で、インターネット自体が、抽象的なエンティティとして、コンピュータ可読媒体である。
同じことはコンピュータネットワーク一般にも当てはまる。
したがって、以下に列挙する機能は、上述した機能を実行できるどの電子デバイスによっても実行できることが理解されよう。
例について実施形態を説明してきたが、当業者は、真の精神および範囲から逸脱することなく、説明した実施形態にさまざまな変更を行うことができる。
本明細書で使用された用語および説明は、例示としてのみ述べられており、限定として意図されたものではない。
詳細には、方法は、例によって説明されているが、方法のステップは、示したものとは異なる順序でまたは同時に実行することができる。
当業者は、これらの変形および他の変形が、添付の特許請求の範囲およびその均等物で規定される精神および範囲内において可能であることを認識するであろう。
一実施形態によるネットワークを示す図である。 一実施形態によるピアツーピアネットワークにおけるオーバーレイネットワークを示す図である。 一実施形態による属性空間および属性部分空間を示す図である。 一実施形態による、情報サービスノードに記憶された情報を示す図である。 一実施形態による問い合わせのルーティングを示す図である。 一実施形態による広告のルーティングを示す図である。 一実施形態による交換フェーズおよび普及フェーズを示す図である。 一実施形態による情報サービスノードのルーティング表である。 一実施形態による情報サービスノードのルーティング表である。 一実施形態による情報サービスノードのルーティング表である。 一実施形態による情報サービスノードのルーティング表である。 一実施形態による、交換フェーズのステップを含む方法のフローチャートである。 一実施形態による、上位Kルーティングアルゴリズムの方法のフローチャートである。 一実施形態によるコンピュータシステムを示す図である。
符号の説明
1102・・・プロセッサ,
1106・・・メインメモリ,
1110・・・ハードディスクドライブ,
1112・・・着脱可能ストレージドライブ,
1114・・・着脱可能ストレージユニット,
1118・・・入力デバイス,
1120・・・ディスプレイ,
1122・・・ディスプレイアダプタ,
1130・・・ネットワークインターフェース,

Claims (10)

  1. 情報サービスのためのネットワーク(210)において、互いに通信する複数のノード(130)の内、ワークロードが高い順に予め定められた数のノードを、上位ノードとして決定する方法であって、
    前記複数のノードそれぞれが、
    自己のノードが受信した他の前記ノードのワークロードのリスト(712)に、自己のノードのワークロードを含めるか否かを判断し、
    前記受信したリスト、または、前記判断に基づいて自己のノードのワークロードを含めたリストを、次のノードへルーティングし、
    前記複数のノードのルーティングにおいて、前記リストが最後に送信されるノードとして予め定められた最終宛先のノード(701)が、前記受信したリスト、または、前記判断に基づいて自己のノードのワークロードを含めたリストに含まれるノードを、前記上位ノードとして決定する
    方法。
  2. 前記リスト(712)を次のノードへルーティングすることは、
    属性分割値以下の属性範囲を含む前記リスト(712)を受信したときに、自己のノードのルーティング表において、自己のワークロードの分割回数が最も多いエントリーを特定し、
    前記特定されたエントリーからノードを特定し、
    前記特定されたノードへ前記リスト(712)を送信する
    請求項1に記載の方法。
  3. 前記自己のノードのワークロードを含めるか否かを判断することは、
    自己のノードのワークロードが、前記受信したリスト(712)に含まれる他のノードのワークロードのいずれかよりも高いか否かを判断し、
    自己のノードのワークロードが、前記他のノードのワークロードのいずれかよりも高い場合は、前記受信したリストに、自己のノードのワークロードを追加する
    請求項1に記載の方法。
  4. 前記リスト(712)は、
    所定の個数のワークロード
    を含む
    請求項3に記載の方法。
  5. 前記複数のノードそれぞれは、さらに、
    前記リストを次のノードへルーティングするときに、前記受信したリスト(712)に、自己のノードの識別情報を含める
    請求項1に記載の方法。
  6. 前記ノードが、前記最終宛先のノード(701)である場合に、前記受信したリスト、または、前記判断に基づいて自己のノードのワークロードを含めたリストを、前記識別情報を使用して、前記リストを受信した各ノードへ送信する
    請求項5に記載の方法。
  7. 前記ネットワーク(210)の前記複数のノードのそれぞれは、前記ネットワーク(210)で利用可能なサービスについての情報を記憶するように動作可能であり、前記サービスについての問い合わせに応答するように動作可能である
    請求項1に記載の方法。
  8. ネットワーク(210)の複数のノード(130)それぞれであって、
    前記ネットワーク(210)のノードのワークロードのリスト(712)を受信するように動作可能なインターフェース(1130)と、
    前記受信したリスト(712)に前記ノード(130)のワークロードを含めるか否かを判断し、前記受信したリスト(712)、または、前記判断に基づいて自己のノードのワークロードを含めたリストを、前記ネットワーク(210)の次のルーティング先のノードへ送信し、自己のノードが、前記複数のノードのルーティングにおいて、前記リストが最後に送信されるノードとして予め定められた最終宛先である場合に、前記受信したリスト、または、前記判断に基づいて自己のノードのワークロードを含めたリストに含まれるノードを、前記複数のノード(130)の内、ワークロードが高い順に予め定められた数の上位ノードとして決定するように動作可能な処理回路(1102)と
    を備える
    ネットワークのノード。
  9. 前記処理回路(1102)は、前記リスト(712)を次のルーティング先のノードへ送信するためのルーティング表を生成するようにさらに動作可能である
    請求項8に記載のネットワークのノード。
  10. 前記ノード(130)は、ピアツーピアオーバーレイネットワーク(210)で利用可能な少なくとも1つのサービスの情報を提供するように動作可能な、前記ピアツーピアオーバーレイネットワーク(210)のノードである
    請求項8に記載のネットワークのノード。
JP2007545468A 2004-12-07 2005-10-31 オーバーレイネットワークのノードの最高ワークロードの決定 Expired - Fee Related JP4588768B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/006,068 US7636325B2 (en) 2004-12-07 2004-12-07 Determining highest workloads for nodes in an overlay network
PCT/US2005/039257 WO2006062623A1 (en) 2004-12-07 2005-10-31 Determining highest workloads for nodes in an overlay network

Publications (2)

Publication Number Publication Date
JP2008526056A JP2008526056A (ja) 2008-07-17
JP4588768B2 true JP4588768B2 (ja) 2010-12-01

Family

ID=36574136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007545468A Expired - Fee Related JP4588768B2 (ja) 2004-12-07 2005-10-31 オーバーレイネットワークのノードの最高ワークロードの決定

Country Status (5)

Country Link
US (1) US7636325B2 (ja)
JP (1) JP4588768B2 (ja)
CN (1) CN101116313B (ja)
DE (1) DE112005003037B4 (ja)
WO (1) WO2006062623A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8335760B1 (en) * 2005-02-07 2012-12-18 Hewlett-Packard Development, L. P. Grid computing system to manage utility service content
WO2009121425A2 (en) * 2008-04-03 2009-10-08 Telefonaktiebolaget Lm Ericsson (Publ) Network diagnostics
JP5765950B2 (ja) * 2010-01-28 2015-08-19 トムソン ライセンシングThomson Licensing 票ベクトルに従って、ワイヤレス・コミュニケーション能力を有するピア間のコンテンツ配布を制御するためのデバイス、及び方法
US10110412B2 (en) * 2012-10-17 2018-10-23 Disney Enterprises, Inc. Dynamically allocated computing method and system for distributed node-based interactive workflows
US9300544B2 (en) 2014-02-28 2016-03-29 International Business Machines Corporation Calculating workload closure in networks
JP6485811B2 (ja) * 2016-02-18 2019-03-20 日本電信電話株式会社 ノード装置および経路表管理方法
US11064019B2 (en) * 2016-09-14 2021-07-13 Advanced Micro Devices, Inc. Dynamic configuration of inter-chip and on-chip networks in cloud computing system
EP3804239A4 (en) * 2018-06-05 2022-03-23 Gramboo Inc. DIRECTORY-ASSISTED ROUTING OF CONTENT IN AN INFORMATION-CENTRIC NETWORK
JP6750646B2 (ja) * 2018-06-07 2020-09-02 トヨタ自動車株式会社 車載装置、情報処理方法、および、情報処理プログラム
CN112491717A (zh) * 2019-09-12 2021-03-12 华为技术有限公司 一种服务路由方法及装置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL99923A0 (en) * 1991-10-31 1992-08-18 Ibm Israel Method of operating a computer in a network
JP3522820B2 (ja) * 1994-03-15 2004-04-26 株式会社東芝 分散処理システム
US5774668A (en) * 1995-06-07 1998-06-30 Microsoft Corporation System for on-line service in which gateway computer uses service map which includes loading condition of servers broadcasted by application servers for load balancing
JP3085515B2 (ja) * 1995-07-03 2000-09-11 日本電信電話株式会社 帯域可変通信装置
US6173322B1 (en) * 1997-06-05 2001-01-09 Silicon Graphics, Inc. Network request distribution based on static rules and dynamic performance data
US6003083A (en) * 1998-02-19 1999-12-14 International Business Machines Corporation Workload management amongst server objects in a client/server network with distributed objects
US6691165B1 (en) * 1998-11-10 2004-02-10 Rainfinity, Inc. Distributed server cluster for controlling network traffic
US6820262B1 (en) * 1999-07-22 2004-11-16 Oracle International Corporation Method for computing the degree of parallelism in a multi-user environment
US6389448B1 (en) * 1999-12-06 2002-05-14 Warp Solutions, Inc. System and method for load balancing
JP2001244973A (ja) * 2000-02-28 2001-09-07 Nippon Telegr & Teleph Corp <Ntt> インタネットパケット交換装置
JP2001268094A (ja) * 2000-03-22 2001-09-28 Toshiba Corp ノード装置、同装置を複数備えた情報処理システム、及びパラメータ交換方法
US7346702B2 (en) * 2000-08-24 2008-03-18 Voltaire Ltd. System and method for highly scalable high-speed content-based filtering and load balancing in interconnected fabrics
US6965930B1 (en) * 2000-10-20 2005-11-15 International Business Machines Corporation Methods, systems and computer program products for workload distribution based on end-to-end quality of service
US20020107962A1 (en) * 2000-11-07 2002-08-08 Richter Roger K. Single chassis network endpoint system with network processor for load balancing
US7296268B2 (en) * 2000-12-18 2007-11-13 Microsoft Corporation Dynamic monitor and controller of availability of a load-balancing cluster
JP2002252640A (ja) * 2001-02-23 2002-09-06 Fujitsu Ltd ネットワーク中継装置及び方法並びにシステム
US7272645B2 (en) * 2001-05-25 2007-09-18 Sbc Technology Resources, Inc. Method of improving the reliability of peer-to-peer network downloads
US20030110291A1 (en) * 2001-12-12 2003-06-12 Nokia Corporation Method and device for route searching in a bluetooth ad-hoc network
JP4046562B2 (ja) * 2002-07-10 2008-02-13 富士通株式会社 負荷分散方法
US7353538B2 (en) 2002-11-08 2008-04-01 Federal Network Systems Llc Server resource management, analysis, and intrusion negation
US7197573B1 (en) * 2002-11-18 2007-03-27 Packet Design, Inc. System and method for identifying addresses to modify and the effects thereof
ATE515856T1 (de) * 2003-01-13 2011-07-15 Meshnetworks Inc System und verfahren zur erzielung kontinuierlicherkonnektivität mit einem zugangspunkt oder gateway in einem drahtlosennetzwerk
AU2003271071A1 (en) * 2003-01-21 2004-08-13 Hitachi, Ltd. Communication device, network system, and link generation method
GB0306971D0 (en) 2003-03-26 2003-04-30 British Telecomm Client server model
JP2004320405A (ja) * 2003-04-16 2004-11-11 Matsushita Electric Ind Co Ltd 情報端末検索システム
CN1311665C (zh) * 2003-07-01 2007-04-18 株式会社日立制作所 具有多个分布式回归代理的移动IPv6网络及其负载平衡方法
US7353448B1 (en) * 2003-10-21 2008-04-01 Marvell Semiconductor Israel Ltd. Methods, architectures, circuits and systems for transmission error determination
US7389510B2 (en) * 2003-11-06 2008-06-17 International Business Machines Corporation Load balancing of servers in a cluster
CN1281027C (zh) * 2003-12-04 2006-10-18 上海交通大学 处理超大量用户的协同过滤推荐方法
US20050268102A1 (en) * 2004-05-07 2005-12-01 Downey Kyle F Method and system for secure distribution of content over a communications network

Also Published As

Publication number Publication date
CN101116313B (zh) 2010-10-27
DE112005003037T5 (de) 2007-12-20
WO2006062623A1 (en) 2006-06-15
US7636325B2 (en) 2009-12-22
JP2008526056A (ja) 2008-07-17
DE112005003037B4 (de) 2011-09-08
US20060120391A1 (en) 2006-06-08
CN101116313A (zh) 2008-01-30

Similar Documents

Publication Publication Date Title
JP4679584B2 (ja) オーバーレイネットワークにおけるサービス問い合わせのルーティング
JP4681615B2 (ja) ノードのワークロードの分割
JP4588768B2 (ja) オーバーレイネットワークのノードの最高ワークロードの決定
US8982709B2 (en) Selecting service nodes for an end-to-end service path from a reduced search space
US9160571B2 (en) Requesting a service from a multicast network
US7489653B2 (en) Framework and method for QoS-aware resource discovery in mobile ad hoc networks
EP2491745B1 (en) System and method of utilizing a framework for information routing in large-scale distributed systems using swarm intelligence
US7644167B2 (en) Identifying a service node in a network
US9420513B1 (en) Clustering approach to estimating a network metric for nodes
US20050201278A1 (en) Reconfiguring a multicast tree
CN109348264B (zh) 视频资源共享方法、装置、存储介质及电子设备
KR20180118393A (ko) 분산형 클라우드 컴퓨팅 시스템, 이에 적용되는 장치 및 장치의 동작 방법
Khodaparas et al. A software-defined caching scheme for the Internet of Things
Sacha et al. Decentralising a service-oriented architecture
US20090319645A1 (en) Method, Apparatus, and Computer Program Product for Distributed Information Management
US20100057748A1 (en) Method and Apparatus for Parameterized Promotion and Delivery of Data
Epifâneo et al. Cathode: A consistency-aware data placement algorithm for the edge
WO2021135693A1 (zh) 一种通信方法及设备
US20230012242A1 (en) Intelligent route selection for low latency services
Epifˆanio Cathode: A consistency-aware data placement algorithm for the edge
Kim et al. Delay-aware distributed program caching for IoT-edge networks
Ma et al. DINNRS: A Distributed In-Network Name Resolution System for information-centric networks

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100908

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350