JP2016005275A - 相互接続ネットワークを管理する方法およびシステム - Google Patents

相互接続ネットワークを管理する方法およびシステム Download PDF

Info

Publication number
JP2016005275A
JP2016005275A JP2015118359A JP2015118359A JP2016005275A JP 2016005275 A JP2016005275 A JP 2016005275A JP 2015118359 A JP2015118359 A JP 2015118359A JP 2015118359 A JP2015118359 A JP 2015118359A JP 2016005275 A JP2016005275 A JP 2016005275A
Authority
JP
Japan
Prior art keywords
server
management system
client
interface
snapshot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015118359A
Other languages
English (en)
Other versions
JP6304499B2 (ja
Inventor
ピエール ヴィグネーラス,
Vigneras Pierre
ピエール ヴィグネーラス,
セバスチャン ミケー,
Miquee Sebastien
セバスチャン ミケー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bull SAS
Original Assignee
Bull SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bull SAS filed Critical Bull SAS
Publication of JP2016005275A publication Critical patent/JP2016005275A/ja
Application granted granted Critical
Publication of JP6304499B2 publication Critical patent/JP6304499B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/024Standardisation; Integration using relational databases for representation of network management data, e.g. managing via structured query language [SQL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0806Configuration setting for initial configuration or provisioning, e.g. plug-and-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Environmental & Geological Engineering (AREA)
  • Multimedia (AREA)
  • Small-Scale Networks (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】プロセス間通信を要求に応答する管理システムの形態で提供する。【解決手段】相互接続ネットワークの管理システムのサーバ10であって、相互接続ネットワークのグローバル状態を格納するように構成されたキー値関連データ構造2、管理システムにつながるために構成リクエストに応答して、前記管理ネットワークの構成を通信するように構成された、構成サーバインターフェース3、キー値関連データ構造内の更新を分散するように構成された、公開サーバインターフェース4、更新リクエストに応答して、キー値関連データ構造を更新するように構成された、収集サーバインターフェース5、スナップショットリクエストに応答して、グローバル状態のサブアセンブリのスナップショットを通信するように構成された、スナップショットサーバインターフェースを含む6。【選択図】図3

Description

本発明は、相互接続ネットワークを管理するための管理システムに関する。
ここでいう「相互接続ネットワーク」とは、(InfiniBandネットワークのような)あらゆる専用の計算ネットワーク、あるいはさらに一般的に、あらゆる情報要素の集合体、とりわけ互いに物理的に通信するつながりのある分散プロセッサのことである。
二次ネットワークを利用し、Ethernetタイプのものであってよい管理システムは、この計算ネットワークをアウトオブバンド(out−of−band)方式で管理するように構成される。
しかしながら、スーパーコンピュータのサイズが増大するにつれて、高性能な計算ネットワークのトポロジは濃密になりつつ複雑化している。スーパーコンピュータの相互接続ネットワークの「二次ネットワーク」ともいう専用の管理ネットワークを用いるアウトオブバンド管理は、
− この相互接続ネットワーク内で起こり得るイベント(例えばケーブル、ポート、スイッチまたはノードの故障)に反応し;
− ケーブルまたはスイッチの変更に関連して発生し得るトポロジの修正(理論的なトポロジに対する接続性、適性)を確認し;
− スイッチに組み込まれている修正および更新に応じて新たなルーティングテーブルを計算する
ために、2つ以上のコンポーネントを必要とすることになる。
さらに、スケールアップおよび堅牢性の理由から、上記のそれぞれのタスクは、潜在的に異なる専用マシンから別々のプロセスで実行しなければならない。このようにするために、効果的な通信機構により、これらのコンポーネントが対話をしながら共通のグローバル状態を共通することができる。この機構は、管理システムによって実現されなければならない。メッセージは、スーパーコンピュータの相互接続ネットワークの二次ネットワーク(または管理ネットワーク)上で交換される。管理システムにより、相互接続ネットワークの管理を担うプロセスで、グローバル状態の通信および共有ができ、サブアセンブリは、スーパーコンピュータの相互接続ネットワークの状態(つまり、スーパーコンピュータの相互接続ネットワークを構成する機器の全規定)を表す。
管理ネットワークの異なるマシンに対して実行されるプロセス間の通信を実現するために、この管理ネットワークは、とりわけ、
− 数多くのプロセス(数百あるいは数千)をサポートでき;
− 1つのプロセスをどのような時でも管理システムにつなげるか、あるいは管理システムから除去し(例えば故障や更新という理由で);
− スーパーコンピュータの相互接続ネットワークの最新のグローバル状態を維持し;
− スーパーコンピュータの相互接続ネットワークの結果整合性(英語の「eventual consistency」)のあるグローバル状態を維持し;
− このグローバル状態を「キー値」タイプのテーブル形態で表し;
− このグローバル状態を、管理システムの相互接続された異なるプロセス間で共有し;
− どのような時でも管理システムのそれぞれのプロセスによって相互接続ネットワークのグローバル状態のサブアセンブリさらには統合性を更新でき;
− グローバル状態の更新頻度を管理し(好ましくは、最大で1秒あたり数百回);
− グローバル状態へのアクセスを制限し、いくつかのプロセスがグローバル状態の1つのサブアセンブリのみを見るべきであり/見る必要があり;
− 比較的多数の入力を得られるとしても(一般には数十万)、グローバル状態をランダムアクセスメモリに保持できなければならない。
この点に関して、分散ハッシュテーブルのように状態を共有するシステムが存在する。しかしながら、既存のどの解決策にも、管理システムが応答すべき上記の要求全体を満足させるものはない。この場合、1つの分散ハッシュテーブルで上に記した下2つの規範を提供することはできない。
本発明の目的は、プロセス間通信の機構を前述の要求に応答する管理システムの形態で提供することである。
本発明のもう1つの目的は、分散プロセスを相互接続するためにクライアント/サーバタイプの通信アーキテクチャを提供することである。
本発明のもう1つの目的は、プロセス間通信に基づく相互接続ネットワークの管理システムを提供することである。
本発明のもう1つの目的は、非同期で切断されたプロセス間通信の機構を提供することである。
本発明のもう1つの目的は、スーパーコンピュータの相互接続ネットワークの管理方法を提供することである。
これらの目的のため、本発明は、第1の態様によれば、相互接続ネットワークの管理システムのサーバであって、
− 相互接続ネットワークのグローバル状態を格納するように構成されたキー値関連データ構造;
− 以下の接続インターフェース
○ 管理システムにつながるためにクライアントから来る構成リクエストに応答して、このクライアントに前記管理システムの構成を通信するように構成された、構成サーバインターフェース;
○ 管理システムに接続されたクライアントに、キー値関連データ構造内の更新を分散するように構成された、公開サーバインターフェース;
○ 管理システムに接続されたクライアントプロセスから来る更新リクエストに応答して、キー値関連データ構造を更新するように構成された、収集サーバインターフェース;
○ 管理システムに接続されたクライアントプロセスから来るスナップショットリクエストに応答して、グローバル状態のサブアセンブリのスナップショットをこのクライアントプロセスに通信するように構成され、このグローバル状態がキー値関連データ構造内に格納される、スナップショットサーバインターフェース
を含む、サーバに関する。
相互接続ネットワークの管理システムのサーバは、様々な実施によれば、この場合は以下の項目からなる特徴を備える:
− 構成サーバインターフェースは、公開サーバインターフェースのアドレス、収集サーバインターフェースのアドレス、およびスナップショットサーバインターフェースのアドレスを通信するように構成され;
− キー値関連データ構造は、ハッシュテーブルであり;
− このサーバの実装は、構成リクエスト、更新リクエストまたはスナップショットリクエストに対して反応するために、接続サーバインターフェースのイベントのパラダイムを利用し、この接続サーバインターフェースは、構成サーバインターフェース、収集サーバインターフェースまたはスナップショットサーバインターフェースである。
本発明は、第2の態様によれば、相互接続ネットワークの管理システムのクライアントであって、
− クライアントプロセス;
− 管理システムのサーバから相互接続ネットワークのグローバル状態のサブアセンブリのスナップショットを回収するように構成された、スナップショットクライアントインターフェース;
− 管理システムのサーバから相互接続ネットワークのグローバル状態の更新を受信するように構成された、定期更新予約クライアントインターフェース;
− 管理システムのサーバから管理システムの構成を回収するように構成された、構成クライアントインターフェース;
− プロセスクライアントが相互接続ネットワークのグローバル状態を公開でき、この相互接続ネットワークのグローバル状態が管理システムのサーバによって共有され格納されるための、公開クライアントインターフェース
を含む、クライアント。
相互接続ネットワークの管理システムのクライアントは、さらに、ビジネスプロセスを含み、このビジネスプロセスは、このビジネスプロセスが相互接続ネットワークのグローバル状態の更新を公開できるように、このビジネスプロセスに関連付けられた公開クライアントインターフェースを備えている。
有利には、クライアントプロセスによって公開されたデータは、「キー値」というメッセージ形態のメッセージである。
本発明は、第3の態様によれば、上に記したサーバおよびクライアントを含む相互接続ネットワークを管理するための管理システムに関する。
本発明は、第4の態様によれば、上記に挙げた相互接続ネットワークおよび管理システムを備えるスーパーコンピュータに関する。
スーパーコンピュータは、さらに、
− 相互接続ネットワークのトポロジを確認するように構成されたトポロジ管理プログラム;
− 相互接続ネットワークのネットワーク機器によって送信されたアラームを回収し、その結果、管理システムを更新するように構成された監視モジュール;
− 管理システムから受信したデータのためのルーティングテーブルを計算するように構成されたルーティング計算器
を備える。
本発明のその他の目的および利点は、添付の図面を参照して以下に記載した実施形態の説明文に照らし合わせることで明らかになるであろう。
一実施形態による管理システムのサーバを示す図である。 一実施形態による管理システムのクライアントを示す図である。 一実施形態による管理システムを実施している様子を示す図である。
相互接続ネットワークの本管理システムは、接続インターフェースに応じて異なる通信のパラダイムを実施するクライアント/サーバタイプのネットワークアーキテクチャを利用するものである。
図1を参照すると、管理システムのこのネットワークアーキテクチャのサーバ側(またはサーバの実装)は、管理ネットワークのサーバ10を備えている。
サーバ10は、相互接続ネットワークのグローバル状態を保持するように構成される。このグローバル状態は、スーパーコンピュータの相互接続ネットワークに関する情報を含んでいる。このグローバル状態は、キー値関連データ構造2に格納される。このデータ構造2は、サーバ10のランダムアクセスメモリに格納される。
キー値関連データ構造2は、好ましくはサーバ10のローカルにあるデータコンテナであり、要素を追加、削除および検索するための特定のプロトコルを含む。このキー値関連データ構造2は、1つのキーを1つの値に関連付ける。キーの一意性は、送信プロセスによって保証されなければならない。更新が既存のキーに対して実現された場合、古い値は新しい値によってオーバーレイされる。
一実施形態では、キー値関連データ構造2は、ハッシュテーブルまたは英語で「hashmap」ともいう関連テーブルであり、規定の関連付け機能またはハッシュ機能を有する。有利には、この特定のデータ構造によって、キーに応じた値に高速でアクセスできる。
管理ネットワークのサーバ10は、さらに、
− 管理システムにつながることを希望しているクライアントから来る(1つまたは複数の)構成リクエストを管理するように構成された、構成サーバインターフェース3;
− キー値関連データ構造2内で行われる更新、すなわちキー値関連データ構造2の入力を、管理システムに接続されたクライアントに分散するように構成された、公開サーバインターフェース4;
− 管理システムに接続されたクライアントプロセスから来る更新リクエスト(一般にはキー値というメッセージの形態での更新)を管理するように構成された、収集サーバインターフェース5;
− 管理システムに接続されたクライアントプロセスから来るスナップショットリクエストに応答して、現在の状態、つまりキー値関連データ構造2のアセンブリまたはサブアセンブリのみのスナップショットを送信する(通過周波帯域の使用を制限するため、フィルタリングはサーバ10で行われてよい)ように構成された、スナップショット(または英語の「snapshot」)サーバインターフェース6
を含む。
構成サーバインターフェース3により、管理システムの構成を、相互接続ネットワークのこの管理システムにつながることを希望しているクライアントと通信させることができる。送信された構成は、とりわけ、前述した他の接続インターフェース、すなわち公開サーバインターフェース4、収集サーバインターフェース5、およびスナップショットサーバインターフェース6のアドレス(または「Uniform Resource Locator」を表すURL)を含む。
好ましくは、接続サーバインターフェース3〜6は、ZeroMQソケットである(以下のリンク先:http://zeromq.org/intro:read−the−manualにある文書は、ZeroMQまたはZMQソケットを詳細に示している)。この実施形態により、実際に、リクエスト/応答のパラダイムの問題を回避できる。
ここで注意すべきは、図1に示した管理システムのサーバの実装では、
− 構成サーバインターフェース3は、キー値関連データ構造2と相互作用しない;
− 収集サーバインターフェース5は、このキー値関連データ構造2と書き込みモードで相互作用して、このキー値関連データ構造にキー値の入力を格納する;
− 公開サーバインターフェース4およびスナップショットサーバインターフェース6は、読み出しモードでキー値関連データ構造2と相互作用する。
管理システムのこのサーバの実装は、C言語、Python言語、またはその他のあらゆる適切なプログラミング言語で実現されてよいほか、モノスレッドまたはマルチスレッドモードであってもよい。
サーバ10のモノスレッドの実装では、サーバは、接続サーバインターフェース3、5、6のイベントのパラダイムに基づいて以下のループを実行する。
正しい限り、
「接続サーバインターフェース」に応じて
「構成サーバインターフェース」の場合
構成サーバインターフェースを介して構成データを送信する
「収集サーバインターフェース」の場合
公開サーバインターフェースを介して更新内容を送信する
データ構造2を更新する
「スナップショットサーバインターフェース」の場合
スナップショットサーバインターフェースを介してスナップショットを送信する
「タイムアウトの期限が過ぎた」場合
プレゼンスメッセージを送信する
終了
終了
有利には、接続サーバインターフェース3、5、6のイベントのパラダイムに基づくこの実装により、クライアントプロセス(リクエストまたはアップデート)からのアクションに迅速に反応できる。「〜に応じて(SELON)」という条件命令は、3つの接続サーバインターフェース(構成サーバインターフェース3、収集サーバインターフェース5およびスナップショットサーバインターフェース6)および所定の待ち時間(タイムアウト)を管理する。この条件命令は、接続サーバインターフェース3、5、6のイベントによって起動した1つまたは複数のその接続インターフェースを含むリストに戻る。タイムアウトの期限が過ぎてもイベントが全く起きなかった場合、サーバ10は、管理システムのクライアントにプレゼンスメッセージ(英語では「Heartbeat message」と呼ばれる)を送信する。
接続サーバインターフェース3、5、6が処理される特定の順序により、
− 第一に、クライアントがサーバ10に接続できるとともに、アドレス(URL)を用いて、構成サーバインターフェース3を介してこのクライアントに通信される他の接続サーバインターフェース4〜6を構成でき;
− 第二に、クライアントが自動的に更新を送信(または、英語で「push」)した場合、できるだけ迅速にサーバ10を介してその更新を計算に入れることができるとともに、全クライアント(その更新に由来するものを含む)に対してその更新を公開でき、その更新は、管理システムの他のクライアントでアクションを起こすことができ;
− 第三に、スナップショット(英語で「snapshot」)リクエストは一般に、実行するのに最も時間がかかるため、スナップショットリクエストを最後に処理できる。
有利には、サーバ10のモノスレッドの実装では、データ構造2への同時かつ競合するアクセスおよび/または接続サーバインターフェース3〜6の同時使用を回避するためのロック機構は必要ない。
管理システムのサーバ10は、コマンドとして解釈されてよいキー値タイプの入力を受信して処理する。これらの入力は、管理システムのクライアントから来るものであってよい。有利には、これによって、とりわけデータ構造2がシステムファイルに書き込まれる際に(例えばUnix系システムの場合)、隠れた入力を得ることができる。
図2は、相互接続ネットワークの管理システムのクライアント−サーバアーキテクチャのクライアントまたは「クライアント側」の実装を示す。
ここでいう管理システムのクライアント20とは、一般に、ビジネスコード30を実行するための少なくとも1つのビジネスプロセス31を支持するように構成されているクライアントプロセス21のことである。
相互接続ネットワークの管理システムのクライアント20は、
− 相互接続ネットワークのグローバル状態のスナップショット、または相互接続ネットワークのサブアセンブリを回収するように構成された、スナップショットクライアントインターフェース26;
− 管理システムのサーバから更新を受信するように構成された、定期更新予約クライアントインターフェース24;
− 管理システムのサーバの構成、特にサーバの接続サーバインターフェースのアドレス(URL)を回収するように構成された、構成クライアントインターフェース23;
− クライアントプロセス21およびビジネスコード30のその他の全ビジネスプロセス31が「キー値」というエンティティを用いて、適切な公開クライアントインターフェース25を介してそれぞれの状態の更新(または、さらに一般的には関係データ)を公開できるような複数の公開クライアントインターフェース25。ビジネスコード30はそれ自体のために、公開クライアントインターフェース25が関連付けられている2つ以上のビジネスプロセス31を含んでよい点に注意されたい;
− ビジネスコード30のビジネスプロセス31とクライアントプロセス21との間の通信クライアントインターフェース32
を備える。
クライアントプロセス21は、管理システムのクライアント20から入る通信を管理する。そのために、このクライアントプロセス21は、独自の入力クライアントインターフェース24および26、つまりスナップショットクライアントインターフェース26および定期更新予約クライアントインターフェース24を有する。
公開クライアントインターフェース25により、サーバ側で共有され格納されている相互接続ネットワークのグローバル状態をビジネスプロセス31で更新できる。
図3では、クライアント20は管理システムのサーバ10に接続されている。
サーバ10に接続するために、クライアント20はまず、構成サーバインターフェース3に接続して、管理システムの構成パラメータ全体、とりわけサーバ10の他の接続サーバインターフェース4〜6のアドレス(URL)を受信する。一実施形態では、構成サーバインターフェース3で構成リクエスト(例えばCONFIG?タイプのもの)を受信するとすぐに、サーバ10は(接続インターフェース3と23とのつながりを参照)、
− このリクエストに応答して、構成サーバインターフェース3を介して、3つの他の接続インターフェース4〜6のアドレス(URL)を通信し;
− この構成サーバインターフェース3を介して、構成ステップの終了を示すメッセージ(例えばFin_CONFIGタイプのもの)を送信する。
構成パラメータを受信すると、クライアント20は、相互接続ネットワークの現在のグローバル状態のスナップショット(「snapshot」)を回収するかどうかを決定する(接続インターフェース6と26とのつながりを参照)。回収する場合、
− クライアント20は、スナップショットサーバインターフェース6から、キー値関連データ構造2に格納されている相互接続ネットワークのグローバル状態のスナップショットをリクエストする;
− サーバ10は、クライアント20が定期更新予約を希望している階層を受信するのを待つ(これらの階層は、とりわけ、サーバ10の公開サーバインターフェース4に接続した際に明示された階層とは異なっていてよい)。その後、サーバ10は、スナップショットサーバインターフェース6を使用して、リクエストされた階層状態のスナップショットをクライアント20に送信する;
− サーバ10は、キー値関連データ構造2の現在のリビジョン番号を送信する。
公開サーバインターフェース4に接続して(接続インターフェース4と24とのつながりを参照)更新を受信すること、および収集サーバインターフェース5に接続して(接続インターフェース5と25とのつながりを参照)場合によっては更新(または新たな入力)を送信することがクライアント20の担当であるということになる。
好ましくは、サーバ10によって公開された更新は、タイムスタンプされる。有利には、サーバ側のタイムスタンプ(または英語で「timestamping」)は、各クライアント20でグローバル状態の長期にわたる整合性(「eventual consistency」)を保証する。スナップショットを回収している間に送信された更新が(タイムスタンプがあることにより)受信したスナップショットよりも古い場合、クライアント20はその更新を無視できる点に注意されたい。
クライアント20の接続時間外に、サーバ10は、更新リクエストがある度に反応し、定期にプレゼンス(「heartbeat」)メッセージを送信するように構成される。
収集サーバインターフェース5を介して、更新リクエスト、またはさらに一般的にはコマンドを受信すると、
− このコマンドがサーバ10に関係ない場合または(停止コマンド「shutdown」のような)特別なコマンドではない場合、そのコマンドは、公開サーバインターフェース4を介して他のクライアントに伝送される;
− サーバ10は、その更新リクエストの内容をデータ構造2に適用する。サーバのコマンドメッセージの場合、そのメッセージはまず、データ構造2の全内容を削除するよう要求する「空にする」コマンドと比較される。
「空にする」または「time to live」を表す「ttl」などの入力データの特別フィールドを使用して、サーバ10は、ローカルデータ構造2のこの入力データを削除できる。逆に、入力データがまったく存在しない場合は、入力データはデータ構造2で追加されるか更新される。
サーバ10が受信できるリクエストの例として以下を引用する。
−.bbctrl/_server_kill_:サーバ10から離れるよう要求する(このメッセージはサーバ10によって分散されない);
−.bbctrl/_clear_all_:サーバ10および全クライアントから、データ構造の内容全体を削除するよう要求する(このメッセージはサーバ10によって分散される);
−.bbctrl/_hugz_:サーバからのプレゼンスメッセージ。
ここでの基本のエンティティは、「キー値」というパラダイムに基づくメッセージである。このエンティティは、キーと値とのペアに加えて、このエンティティのシーケンス番号、汎用一意識別子、その発信元のID、またはエンティティの生存時間(「Time to Live」)などのその他の情報を提供する。
これらの情報は、1つまたはそれ以上の複数のデータフレームで送信されてよい。好ましくは、これらの情報は、予約機構用のキーを含む第1のフレーム、および残りの情報(例えばデータ、発信元のID、シーケンス番号)を含む第2のフレームの形で送信される。
好ましくは、収集サーバインターフェース5の探知機が非アクティブ期間を開始する前に、動的な引き継ぎ時間が計算される。
有利には、管理ネットワークのサーバ10の実装により、
− 構成データをクライアントに提供でき;
− 相互接続ネットワークのグローバル状態のスナップショットを、新たに接続された管理システムのクライアントに提供でき;かつ
− 相互接続ネットワークのグローバル状態での更新を、管理システムに接続された全クライアントに伝送できる。
一実施形態では、管理システムは、スーパーコンピュータの相互接続ネットワーク(または計算ネットワーク)を管理するために使用される。そのために、以下のモジュール、
− 相互接続ネットワークのトポロジ(例えば機器の規定または機器の接続図式)の確認を担当するトポロジ管理プログラム;
− スーパーコンピュータのネットワークの様々な機器(とりわけスイッチ)から送信されたアラームを回収し、管理システムを更新するためにそのアラームを関連データ(例えば規定の更新)と相互に関連させることを担当する監視モジュール;
− 管理システムから受信したデータに対してルーティングテーブルの計算を担当するルーティング計算器
が必要であってよい。
上記の追加コンポーネントが始動するとき、トポロジ管理プログラムによって公開されたデータ全体がサーバ10の他のクライアントによって回収され得るように、管理ネットワークのサーバ10はすでに存在している。
有利には、規定の更新は、単一の方法で行われ、集計後、トリガー要素と呼ばれる特別なキーが送信される。ルーティング計算器が新たなルーティングテーブルの計算段階を起動させるのは、このキーを受信したときである。したがって、管理システムのサーバによって送信された様々なタイプのメッセージを容易かつ迅速に区別することが可能である。
− 相互接続ネットワークのグローバル状態の更新;
− アクションを始動させるトリガー要素。
その結果、有利には、効率を上げるためにベントが集計される。特に、ルーティング計算器は、1つの機器の規定が変わるたびにルーティングテーブルを計算することはない。
この点から、キーのプレフィックスに基づく機構により、各クライアントがグローバル状態のサブアセンブリを定期更新予約できるだけでなく、この区別もすることができる。さらに、この機構により、特定のサブアセンブリにあるその他のタイプの情報を管理システムに追加できる。例として、以下のプレフィックスは、管理システム内で使用されてよい:
−@interconnect/:相互接続ネットワークの機器の規定に関する入力全体;
−!declencheurs/:トリガー要素に対応する入力全体;
−/mngt/:相互接続ネットワークの様々な機器への接続情報を含む入力全体;
−.bbctrl/:クライアント側でもサーバ側でも管理システムを制御できる入力全体(例えば1つのコマンドでデータテーブルをすべて消去できる)。
有利には、上記の様々な実施形態では、接続インターフェースに応じて異なる通信パラダイムを使用する。例えば、サーバ10の公開サーバインターフェース4は、「分散」モードで動作し、「マルチキャスト」(クライアント20側の定期更新予約サーバインターフェース24と対称)のプロトコルを使用できる。さらに、クライアント20は、キーの1つまたは複数のプレフィックスを予約でき、これによってこのプレフィックスは、データ構造2に格納されたグローバル状態のサブアセンブリのみを回収できる。

Claims (10)

  1. 相互接続ネットワークの管理システムのサーバであって、
    − 前記相互接続ネットワークのグローバル状態を格納するように構成された、キー値関連データ構造(2);
    − 以下の接続インターフェース(3〜6)
    ○ 前記管理システムにつながるためにクライアント(20)から来る構成リクエストに応答して、前記クライアント(20)に前記管理システムの構成を通信するように構成された、構成サーバインターフェース(3);
    ○ 前記管理システムに接続されたクライアント(20)に、前記キー値関連データ構造内(2)の更新を分散するように構成された、公開サーバインターフェース(4);
    ○ 前記管理システムに接続されたクライアントプロセス(21)から来る更新リクエストに応答して、前記キー値関連データ構造を更新するように構成された、収集サーバインターフェース(5);
    ○ 前記管理システムに接続されたクライアントプロセス(21)から来るスナップショットリクエストに応答して、前記グローバル状態のサブアセンブリのスナップショットを前記クライアントプロセス(21)に通信するように構成され、前記グローバル状態が前記キー値関連データ構造(2)内に格納される、スナップショットサーバインターフェース(6)
    を含む、サーバ(10)。
  2. 前記構成サーバインターフェース(3)は、前記公開サーバインターフェース(4)のアドレス、前記収集サーバインターフェース(5)のアドレス、および前記スナップショットサーバインターフェース(6)のアドレスを通信するように構成される、請求項1に記載のサーバ(10)。
  3. 前記キー値関連データ構造(2)は、ハッシュテーブルである、請求項1または2に記載のサーバ(10)。
  4. 前記サーバの実装は、構成リクエスト、更新リクエストまたはスナップショットリクエストに対して反応するために、接続サーバインターフェースのイベントのパラダイムを利用し、前記接続サーバインターフェースは、前記構成サーバインターフェース(3)、前記収集サーバインターフェース(5)または前記スナップショットサーバインターフェース(6)である、請求項1〜3のうちいずれか一項に記載のサーバ。
  5. 相互接続ネットワークの管理システムのクライアントであって、
    − クライアントプロセス(21);
    − 前記管理システムのサーバから前記相互接続ネットワークのグローバル状態のサブアセンブリのスナップショットを回収するように構成された、スナップショットクライアントインターフェース(26);
    − 前記管理システムのサーバから前記相互接続ネットワークのグローバル状態の更新を受信するように構成された、定期更新予約クライアントインターフェース(24);
    − 前記管理システムのサーバから管前記理システムの構成を回収するように構成された、構成クライアントインターフェース(23);
    − 前記プロセスクライアント(21)が前記相互接続ネットワークのグローバル状態を公開でき、前記相互接続ネットワークのグローバル状態が前記管理システムのサーバによって共有され格納されるための、公開クライアントインターフェース(25)
    を含む、クライアント(20)。
  6. さらに、ビジネスプロセスを含み、該ビジネスプロセスは、該ビジネスプロセスが前記相互接続ネットワークのグローバル状態の更新を公開できるように、前記ビジネスプロセスに関連付けられた公開クライアントインターフェース(25)を備える、請求項5に記載のクライアント。
  7. 公開された前記更新は、「キー値」というメッセージ形態のメッセージである、請求項5または6に記載のクライアント。
  8. 請求項1〜4のうちいずれか一項に記載のサーバおよび請求項5〜7のうちいずれか一項に記載のクライアントを備える相互接続ネットワーク管理するための管理システム。
  9. 相互接続ネットワークおよび請求項8に記載の前記相互接続ネットワークの管理システムを備えるスーパーコンピュータ。
  10. さらに、
    − 前記相互接続ネットワークのトポロジを確認するように構成されたトポロジ管理プログラム;
    − 前記相互接続ネットワークのネットワーク機器によって送信されたアラームを回収し、前記管理システムを更新するように構成された監視モジュール;
    − 前記管理システムから受信したデータのためのルーティングテーブルを計算するように構成されたルーティング計算器
    を備える、請求項9に記載のスーパーコンピュータ。
JP2015118359A 2014-06-13 2015-06-11 相互接続ネットワークを管理する方法およびシステム Expired - Fee Related JP6304499B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1455446A FR3022420B1 (fr) 2014-06-13 2014-06-13 Methodes et systemes de gestion d'un reseau d'interconnexion
FR1455446 2014-06-13

Publications (2)

Publication Number Publication Date
JP2016005275A true JP2016005275A (ja) 2016-01-12
JP6304499B2 JP6304499B2 (ja) 2018-04-04

Family

ID=51862399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015118359A Expired - Fee Related JP6304499B2 (ja) 2014-06-13 2015-06-11 相互接続ネットワークを管理する方法およびシステム

Country Status (5)

Country Link
US (1) US9866437B2 (ja)
EP (1) EP2955875B1 (ja)
JP (1) JP6304499B2 (ja)
ES (1) ES2700929T3 (ja)
FR (1) FR3022420B1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105867837A (zh) * 2015-12-02 2016-08-17 乐视体育文化产业发展(北京)有限公司 一种分布式高速缓存系统中的客户端配置更新方法、设备及系统
CN105871584A (zh) * 2015-12-02 2016-08-17 乐视体育文化产业发展(北京)有限公司 一种键值对数据库中的客户端配置更新方法、设备及系统
US11238176B1 (en) * 2016-06-17 2022-02-01 BigID Inc. System and methods for privacy management
CN108011909B (zh) * 2016-10-28 2020-09-01 北京市商汤科技开发有限公司 通信方法和系统、电子设备和计算机集群
CN112241282B (zh) * 2020-10-27 2024-02-23 上海万向区块链股份公司 基于react项目的全局状态数据管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030140132A1 (en) * 2002-01-22 2003-07-24 Yves-Andre Champagne Method and apparatus for updating network device configuration information in a network management system
JP2004537881A (ja) * 2001-04-27 2004-12-16 ザ ボーイング カンパニー ネットワーク管理のための方法とシステム
US20090276771A1 (en) * 2005-09-15 2009-11-05 3Tera, Inc. Globally Distributed Utility Computing Cloud

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6976093B2 (en) * 1998-05-29 2005-12-13 Yahoo! Inc. Web server content replication
US8437280B2 (en) * 2007-03-22 2013-05-07 Tr Technologies Inc. Distributed synchronous batch reconfiguration of a network
US20130318199A1 (en) * 2012-04-27 2013-11-28 Hervé LE JOUAN Managing data on computer and telecommunications networks
CN104364767A (zh) * 2013-03-15 2015-02-18 莫基移动公司 设备和设置管理平台
CN113419799A (zh) * 2013-04-09 2021-09-21 思杰系统有限公司 使用云同步数据提供本机桌面
US9099162B2 (en) * 2013-10-31 2015-08-04 Oracle International Corporation Media and drive validation in tape libraries
US10742520B2 (en) * 2013-12-31 2020-08-11 Citrix Systems, Inc. Providing mobile device management functionalities
US20150334162A1 (en) * 2014-05-13 2015-11-19 Citrix Systems, Inc. Navigation of Virtual Desktop Content on Devices

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004537881A (ja) * 2001-04-27 2004-12-16 ザ ボーイング カンパニー ネットワーク管理のための方法とシステム
US20030140132A1 (en) * 2002-01-22 2003-07-24 Yves-Andre Champagne Method and apparatus for updating network device configuration information in a network management system
US20090276771A1 (en) * 2005-09-15 2009-11-05 3Tera, Inc. Globally Distributed Utility Computing Cloud

Also Published As

Publication number Publication date
FR3022420B1 (fr) 2018-03-23
US9866437B2 (en) 2018-01-09
JP6304499B2 (ja) 2018-04-04
EP2955875A1 (fr) 2015-12-16
ES2700929T3 (es) 2019-02-20
US20150365284A1 (en) 2015-12-17
FR3022420A1 (fr) 2015-12-18
EP2955875B1 (fr) 2018-10-10

Similar Documents

Publication Publication Date Title
EP3886399A1 (en) Method for invoking server and proxy server
US10642829B2 (en) Distributed and optimized garbage collection of exported data objects
US10439916B2 (en) Client-side fault tolerance in a publish-subscribe system
JP6304499B2 (ja) 相互接続ネットワークを管理する方法およびシステム
US10367852B2 (en) Multiplexed demand signaled distributed messaging
US20080281938A1 (en) Selecting a master node in a multi-node computer system
US7937716B2 (en) Managing collections of appliances
US10503636B2 (en) Concurrent hierarchical dead actor collection in a distributed system
CN107517227B (zh) 用于分布式一致性系统的会话实现方法以及装置
EP3817338A2 (en) Method and apparatus for acquiring rpc member information, electronic device and storage medium
CN103986748A (zh) 实现服务化的方法和装置
CN112804289B (zh) 一种资源同步方法、装置、设备及存储介质
CN113055461B (zh) 一种基于ZooKeeper的无人集群分布式协同指挥控制方法
Banno et al. Interworking layer of distributed MQTT brokers
CN111212135A (zh) 消息订阅方法、装置、系统、电子设备及存储介质
KR20210098219A (ko) 브로커 기반 OPC UA PubSub을 이용한 제조 장비 시스템의 고도화 운용 방법
CN114025005B (zh) 一种数据通讯方法、系统、电子设备及存储介质
CN113472849B (zh) 一种节点的管理方法、系统、设备以及介质
CN116132530A (zh) 一种基于Netty框架应用Raft算法实现MQTT Broker服务器的方法
CN108701035B (zh) 应用属性的管理
US11816095B2 (en) Metrics and events infrastructure
Campos et al. Improving the scalability of DPWS-based networked infrastructures
JP6265473B2 (ja) Webサービスシステム、Webサービスメッセージ仲介方法およびプロキシサーバ
CN114500660B (zh) 请求处理方法、装置、设备及计算机可读存储介质
US20230370332A1 (en) Computer system and communication method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180220

R150 Certificate of patent or registration of utility model

Ref document number: 6304499

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees