JP2013206112A - 計算機システム及びサブシステム管理方法 - Google Patents

計算機システム及びサブシステム管理方法 Download PDF

Info

Publication number
JP2013206112A
JP2013206112A JP2012074203A JP2012074203A JP2013206112A JP 2013206112 A JP2013206112 A JP 2013206112A JP 2012074203 A JP2012074203 A JP 2012074203A JP 2012074203 A JP2012074203 A JP 2012074203A JP 2013206112 A JP2013206112 A JP 2013206112A
Authority
JP
Japan
Prior art keywords
group
micro
management node
subsystem
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012074203A
Other languages
English (en)
Other versions
JP5740652B2 (ja
JP2013206112A5 (ja
Inventor
Masaki Yamada
雅毅 山田
Yuji Ogata
祐次 緒方
Hitoshi Hayakawa
仁 早川
Yuji Tsushima
雄次 對馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012074203A priority Critical patent/JP5740652B2/ja
Priority to US13/728,722 priority patent/US20130262664A1/en
Priority to EP12199512.0A priority patent/EP2645625B1/en
Publication of JP2013206112A publication Critical patent/JP2013206112A/ja
Publication of JP2013206112A5 publication Critical patent/JP2013206112A5/ja
Application granted granted Critical
Publication of JP5740652B2 publication Critical patent/JP5740652B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/505Clust
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】サブシステム(データセンタ)をグループ化する場合、時々刻々と変化するネットワークの品質に基づいて、動的にグループを構成する。
【解決手段】ネットワークを介して接続される複数のサブシステムを備える計算機システムであって、サブシステムの各々は、一以上の計算機と一以上のネットワーク装置とを含み、計算機システムは、サブシステムを管理するサブシステム制御部を備え、サブシステム制御部は、一つ以上のサブシステムから構成されるグループの構築要求を受け付けると、グループ管理ノードとなるサブシステムを選択し、グループ管理ノードとして選択されたサブシステムに、他のサブシステムとの間のネットワーク品質の測定を命令し、ネットワーク品質の測定結果を受信し、受信したネットワーク品質の測定結果に基づいて、前記グループの構成を決定する。
【選択図】図2

Description

本発明は、ネットワークを介してサービスを提供する計算機システムに関する。特に、複数の拠点に分散したサブシステム(データセンタ)をグループ単位で管理するシステム及び方法に関する。
近年のトレンドの一つとしてクラウドコンピューティングが存在する。クラウドコンピューティングでは、ネットワークを介して地理的に散在する複数のデータセンタ(以下DCと記載する)等のサブシステムを接続し、仮想化技術を用いて効率的なサービス提供を実現する。
クラウドコンピューティングにおけるDC等の計算機資源の管理方法についてはさまざま考えられている(例えば、特許文献1参照)。
特許文献1には、ネットワークを介してクラウドを構築するために、クラウドを構成する各DCに対して付与された様々な属性に基づいてグループを構築し、又は、グループを再編することが記載されている。ここで、データセンタの所在地、及びデータセンタが有する計算機資源の種類などが属性として付与される。本技術ではこれらの属性を元にモデル化を行い、グループ化、階層化、並列化などを行う。
一方で、クラウドを構築する場合に、DCのような大規模な施設ではなく、より細かな単位のマイクロDCを用いた分散クラウド技術が存在する。
分散クラウド技術では、既存ICT設備、インテリジェントノード、及びルーティング機能を有するネットワーク装置を利用することによって、マイクロDCを構築する。分散クラウドシステムでは、ネットワーク上に存在する小規模な計算機資源を管理し、当該計算機資源を用いて複数のユーザに対してサービスを提供することを目的とする。
分散クラウドシステムでは、マイクロDCを管理するために階層的な管理構造を用いることを想定している。具体的には、下位の管理ノードが個々のマイクロDCの管理し、上位の管理ノードがシステム全体を監視する。これによって、従来のクラウドコンピューティングと比較して、小規模で多数のICT設備をクラウドに組み込むことを可能にする。
グループ化によるネットワークシステムの管理を実現するための従来の手法の例として、例えば、特許文献2及び特許文献3に記載の技術が知られている。
特許文献2では、階層化された管理構成を自動的に構築するために、自己評価による立候補方式を用いた管理方法が記載されている。特許文献3では、代表サーバの選出に、多数派となるグループ内からサーバを選出することによって階層的な管理構造を構築することが記載されている。
一方、分散クラウドシステムでは、マイクロDC間の通信帯域及び遅延時間などがサービス品質に影響を与える。そのため、ネットワーク品質を考慮したグループの構築及びグループの管理が必要となる。
特開2006−189971号公報 国際公開第01/057685号 特開2011−186609号公報
特許文献1に記載の技術では、DCに付与された属性を用いたグループを構築する方法であり、ネットワーク品質を考慮してグループを構築するものではない。
マイクロDCを用いてグループを構築する場合、マイクロDC間の応答時間及びネットワーク帯域等のネットワーク品質を示すパラメータがグループの構築に重要となる。
しかし、前述したパラメータは、新規ICT設備の追加又はネットワークトラフィック量の増減によって頻繁に変化するため、固定的な属性では管理できず、ネットワークの状態を監視する必要がある。そのため、従来の方法では、ネットワークの状態を考慮したグループの構築、及び、ネットワーク状態に応じたグループの再構築ができなかった。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、ネットワークを介して接続される複数のサブシステムを備える計算機システムであって、前記サブシステムの各々は、第1のプロセッサ、前記第1のプロセッサに接続される第1のメモリ、及び他の装置と通信するための第1のネットワークインタフェースを有する一以上の計算機と、第2のプロセッサ、前記第2のプロセッサに接続される第2のメモリ、及び他の装置と通信するための第2のネットワークインタフェースを有する一以上のネットワーク装置と、を含み、前記計算機システムは、前記サブシステムを管理するサブシステム制御部を備え、前記サブシステム制御部は、サービスを提供するために用いられ、一つ以上の前記サブシステムから構成されるグループの構築要求を受け付けると、前記複数のサブシステムの中からグループ管理ノードとなる前記サブシステムを選択し、前記グループ管理ノードとして選択された前記サブシステムに、他の前記サブシステムとの間のネットワーク品質の測定を命令し、前記ネットワーク品質の測定結果を受信し、前記受信したネットワーク品質の測定結果に基づいて、前記グループの構成を決定し、前記決定されたグループの構成に関する情報を含むグループ構築命令を前記グループ管理ノードに送信することを特徴とする。
本発明によれば、時々刻々と変化するネットワーク品質を考慮したサブシステム(データセンタ)のグループを構築し、階層的にサブシステム(データセンタ)の状態を管理することができる。
本発明の実施形態におけるデータセンタシステムの構成例を示すブロック図である。 本発明の実施形態における概要を示す説明図である。 本発明の実施形態におけるマイクロDCの構成例を示すブロック図である。 本発明の実施形態におけるゲートウェイの構成を説明するブロック図である。 本発明の実施形態におけるゲートウェイの構成を説明するブロック図である。 本発明の実施形態におけるマイクロDC管理テーブルの一例を示す説明図である。 本発明の実施形態におけるグループ管理テーブルの一例を示す説明図である。 本発明の実施形態におけるサービス管理テーブルの一例を示す説明図である。 本発明の実施形態におけるグループメンバ管理テーブルの一例を示す説明図である。 本発明の実施形態におけるサービス管理テーブルの一例を示す説明図である。 本発明の実施形態における管理ノードが実行する処理を説明するフローチャートである。 本発明の実施形態におけるマイクロ管理ノードが実行する処理を説明するフローチャートである。 本発明の実施形態におけるマイクロDCの追加時に管理ノードが実行する処理を説明するフローチャートである。 本発明の実施形態におけるマイクロDCの追加時に管理ノードが実行する処理を説明するフローチャートである。
図1は、本発明の実施形態におけるデータセンタシステムの構成例を示すブロック図である。
本実施形態におけるデータセンタシステムは、複数のノード(サブシステム)から構成される。各ノードは、ネットワークを介して接続される。ネットワークは、WAN及びLAN等が考えられるが、本発明は、ネットワークの種別に限定されない。
本実施形態では、一つのマイクロDCが一つのノードに対応する。また、複数のノードは、管理ノード10及びノード11を含む。ここで、マイクロDCは、一つ以上のサーバ112(図2参照)、インテリジェンスノード、ネットワーク装置及びストレージ装置を備える計算機システムであって、クラウドコンピューティングにおいて計算機資源を提供する計算機システムである。
管理ノード10は、データセンタシステムに含まれる全ノード11を管理するノードである。ノード11は、計算機資源を提供する計算機システムである。
図2は、本発明の実施形態における概要を示す説明図である。
本発明では、管理ノード10が、ノード(マイクロDC)11の中からマイクロ管理ノード12を選択し、当該マイクロ管理ノード12が各ノード(マイクロDC)11との間のネットワーク品質を計測する。マイクロ管理ノード12はノード(マイクロDC)11との間のネットワーク品質の計測結果を管理ノード10に送信し、管理ノード10は受信した計測結果に基づいて、ノード(マイクロDC)11のグループ構成を決定する。
マイクロ管理ノード12は、担当するグループに含まれるノード(マイクロDC)11との間のネットワーク品質及び稼動状態を監視し、監視結果を管理ノード10に送信する。これによって、管理ノード10は、グループ単位にノード(マイクロDC)11を監視することができる。例えば、管理ノード10は、監視結果に基づいて、ネットワーク品質の劣化を検出し、グループの構成を変更する。
グループの構成の変更方法としては、グループからノード(マイクロDC)11を削除し、ノード(マイクロDC)11が所属するグループを変更し、又は、グループに新たなノード(マイクロDC)11を追加する等の方法が考えられる。
前述のように、マイクロ管理ノード12はノード単位で各ノード11の稼動状態及びノード11との間のネットワーク品質を監視し、管理ノード10はグループ単位でノード11の稼動状態及びノードとの間のネットワーク品質を監視する。
図3は、本発明の実施形態におけるマイクロDC11の構成例を示すブロック図である。図3では、マイクロDC11を一例に説明するが、管理ノード10も同一の構成であるものとする。
マイクロDC11は、ゲートウェイ111及びサーバ112から構成される。なお、マイクロDC11は、ストレージ装置等その他の装置を含んでいてもよい。
サーバ112は、所定のサービスを提供する計算機である。サーバ112は、CPU(図示省略)、メモリ(図示省略)、及びI/Oデバイス(図示省略)等の計算機資源を備える。本実施形態では、仮想化技術をサーバ112に適用することによって、計算機資源が割り当てられた仮想計算機がサーバ112上に一つ以上稼動する。
ゲートウェイ111は、マイクロDC11とネットワーク150とを接続する。例えば、ネットワーク150がWANの場合、ゲートウェイ111は、WAN接続回線113を介してWAN(ネットワーク150)と接続される。また、ゲートウェイ111は、サーバ112を接続するスイッチ機能の他に、マイクロDC11を管理する管理機能を備える。
図4及び図5は、本発明の実施形態におけるゲートウェイ111の構成を説明するブロック図である。図4は、通常のマイクロDC11に含まれるゲートウェイ111の構成を示す。図5は、管理ノード10であるマイクロDC11に含まれるゲートウェイ111の構成を示す。
まず、通常のマイクロDC11に含まれるゲートウェイ111の構成について説明する。
ゲートウェイ111は、CPU1111、メモリ1112、クロスバスイッチ1113、及び複数のネットワークインタフェース(NIC)1114を備える。
CPU1111は、メモリ1112に格納されるプログラムを実行する。CPU1111がプログラムを実行することによって、ゲートウェイ111が有する機能を実現できる。
メモリ1112は、CPU1111によって実行されるプログラム及び当該プログラムを実行するために必要な情報を格納する。メモリ1112に格納されるプログラム及び情報については後述する。
クロスバスイッチ1113は、NIC1114への接続を切り替えることによって所定の宛先にパケットを転送する。NIC1114は、ネットワーク150と接続するためのインタフェースである。
ゲートウェイ111は、NIC1114を介してパケットを受信した場合、クロスバスイッチ1113を介してCPU1111にパケットが転送される。CPU1111は、パケットを解析して、メモリ1112に格納されるネットワーク情報等を参照し、受信したパケットの宛先を解決し、クロスバスイッチ1113を介して所定のNIC1114に対してパケットを転送する。
本実施形態では、メモリ1112は、ゲートウェイとしての機能を実現するためのプログラム及び情報の他に、マイクロDC管理部11121及びノード管理部11122を実現するプログラムを格納する。また、メモリ1112は、グループメンバ管理テーブル11123及びサービス管理テーブル11124を格納する。なお、メモリ1112は、他のプログラム及び情報を格納してもよい。
マイクロDC管理部11121は、マイクロDC11内のサーバ112の負荷及び稼動状態を収集し、マイクロDC11内の計算機資源の状態を管理する。
具体的には、マイクロDC管理部11121は、マイクロDC11内のサーバ112と通信するためのパケットを生成し、生成されたパケットをクロスバスイッチ1113及びNIC1114を介してサーバ112に送信する。マイクロDC管理部11121は、サーバ112から負荷及び稼動状態を示す情報を含むパケットを受信した場合、当該情報を各管理テーブルに格納する。
また、マイクロDC管理部11121は、マイクロDC11として提供するサービスの状況及び計算機資源の割り当て等も管理する。
ノード管理部11122は、ネットワークを介して他のマイクロDC11と通信する機能、及びマイクロ管理ノード12としての動作するための機能を有する。
ノード管理部11122は、マイクロDC11間で時刻情報を付与したパケットを送受信することによって、各マイクロDC11におけるラウンドトリップタイム(RTT)、及び時刻同期の揺らぎ等のネットワーク品質を計測する。
また、ノード管理部11122は、マイクロDC11との間のネットワーク品質の計測結果、各マイクロDC11内のサーバ112の負荷及び稼動状態に関する情報、並びに各マイクロDC11におけるサービスの提供状況に関する情報などをマイクロ管理ノード12に送信する。
ノード管理部11122は、マイクロ管理ノード12としての選出された場合、他のマイクロDC11から受信したネットワーク品質の計測結果及びサービスの提供状況に関する情報等を各管理テーブルに記録し、管理ノード10に記録された情報を送信する。
グループメンバ管理テーブル11123は、マイクロ管理ノード12として監視するグループに含まれるマイクロDC11に関する情報を格納する。グループメンバ管理テーブル11123の詳細については、図9を用いて後述する。サービス管理テーブル11124は、グループ内で提供するサービスに関する情報を格納する。サービス管理テーブル11124の詳細については、図10を用いて後述する。
次に、管理ノード10に含まれるゲートウェイ111の構成について説明する。
ゲートウェイ111のハードウェア構成は、ノード11に含まれるゲートウェイ111と同一であるため説明を省略する。管理ノード10に含まれるゲートウェイ111は、メモリ1112にデータセンタ制御部11125が格納される点が異なる。なお、メモリ1112に、マイクロDC管理部11121及びノード管理部11122が格納されてもよい。
データセンタ制御部11125は、マイクロ管理ノード12を選択し、マイクロ管理ノード12から送信されるマイクロDC11との間のネットワーク品質に関する情報に基づいて、グループの構成を決定する。また、データセンタ制御部11125は、マイクロ管理ノード12から送信され、グループに含まれるマイクロDC11との間のネットワーク品質に関する情報に基づいて、グループの構成を変更する。
データセンタ制御部11125は、マイクロDC管理テーブル11126、グループ管理テーブル11127、及びサービス管理テーブル11128を含む。
マイクロDC管理テーブル11126は、データセンタシステムに含まれるマイクロDC11の情報を格納する。マイクロDC管理テーブル11126の詳細については、図6を用いて後述する。
グループ管理テーブル11127は、グループの情報を格納する。グループ管理テーブル11127の詳細については、図7を用いて後述する。
サービス管理テーブル11128は、データセンタシステムを用いて提供されるサービスの情報を格納する。サービス管理テーブル11128の詳細については、図8を用いて後述する。
なお、マイクロDC管理部11121、ノード管理部11122、及びデータセンタ制御部11125が備える機能を専用のハードウェアを用いて実現してもよい。また、管理ノード10は、マイクロDC11に含まれるゲートウェイ111である必要は無く、データセンタ制御部11125を備える計算機又はネットワーク装置であってもよい。
図6は、本発明の実施形態におけるマイクロDC管理テーブル11126の一例を示す説明図である。
マイクロDC管理テーブル11126は、DC名111261、DCアドレス111262、管理機能111263、演算性能111264、稼動情報111265、所属グループ111266、及び属性情報111267を含む。
DC名111261は、管理対象のマイクロDC11の識別子を格納する。
DCアドレス111262は、マイクロDC11のアドレスを格納する。本実施形態では、マイクロDC11を構成するゲートウェイ111のアドレスが格納される。
管理機能111263は、ノード管理部11122を有するか否かを示す情報を格納する。
演算性能111264は、DC名111261に対応するマイクロDC11における演算処理の性能を示す値を格納する。演算処理の性能としては、例えば、計算機資源の性能、ネットワーク帯域、及びサービスを提供可能なユーザ数などが考えられる。
なお、演算処理の性能は、マイクロDC11の構成時に決定される値である。ただし、マイクロDC11の構成が変更された場合等には、当該値は変更される。この場合、マイクロDC11が管理ノード10又はマイクロ管理ノード12に変更後の値を通知する。
稼動情報111265は、DC名111261に対応するマイクロDC11の稼動状態を示す情報を格納する。具体的には、通常のマイクロDC11として稼動する場合には「通常」が格納され、マイクロ管理ノード12として稼動する場合には「管理」が格納される。
所属グループ111266は、DC名111261に対応するマイクロDC11が所属するグループの識別子を格納する。
属性情報111267は、DC名111261に対応するマイクロDC11が有する各種属性情報を格納する。属性情報は、例えば、地理的な情報、ストレージシステムの有無を示す情報、及び特定の機能の有無などを示す情報などが考えられる。
図7は、本発明の実施形態におけるグループ管理テーブル11127の一例を示す説明図である。
グループ管理テーブル11127は、グループ名111271、マイクロ管理ノードアドレス111272、演算性能111273、負荷111274、サービス111275、及び属性情報111276を含む。
グループ名111271は、グループの識別子を格納する。
マイクロ管理ノードアドレス111272は、グループ名111271に対応するグループを管理するマイクロ管理ノード12のアドレスを格納する。本実施形態では、ゲートウェイ111のアドレスが格納される。
演算性能111273は、グループ名111271に対応するグループの演算処理の性能を示す数値を格納する。演算性能111273には、グループに含まれる全てのマイクロDC11の演算処理の性能(演算性能111264)の合計値が格納される。
負荷111274は、グループ名111271に対応するグループにおける現在の負荷を表す情報を格納する。例えば、計算機資源の使用量若しくは使用量、又は、ネットワーク帯域の使用量若しくは使用率などが格納される。当該情報は、各マイクロ管理ノード12から周期的に送信される情報である。
サービス111275は、グループ名111271に対応するグループが提供されるサービスの識別情報を格納する。
属性情報111276は、属性情報111267と同一のものである。なお、属性情報111276には、グループに含まれる全てのマイクロDC11の属性情報111267が統計処理された形式の情報が格納される。
図8は、本発明の実施形態におけるサービス管理テーブル11128の一例を示す説明図である。
サービス管理テーブル11128は、ID111281、サービス名111282、推定負荷111283、提供対象111284、稼動プログラム111285、属性情報111286、及び冗長構成111287を含む。
ID111281は、サービスを一意に識別するための識別子を格納する。サービス名111282、サービスの名称を格納する。
推定負荷111283は、サービス名111282に対応するサービスを提供する場合にマイクロDC11又はグループに対する負荷を表す値を格納する。推定負荷11283に格納される値は、サービス毎に予め設定されているものとする。なお、前述した値は、管理者によって変更することも可能である。
提供対象111284は、サービスを提供するユーザの識別情報を格納する。
稼動プログラム111285は、サービスの提供時に窓口となるアドレス、すなわち、ポートのアドレスを格納する。
属性情報111286は、サービス名111282に対応するサービスを提供するためにマイクロDC11又はグループに必要な属性情報を格納する。
冗長構成111287は、サービスを提供するために冗長化された構成が必要か否かを示す情報を格納する。冗長化された構成が必要な場合には「必要」が格納され、冗長化された構成が必要ない場合には「不要」が格納される。
図9は、本発明の実施形態におけるグループメンバ管理テーブル11123の一例を示す説明図である。
グループメンバ管理テーブル11123は、DC名112301、DCアドレス1113402、負荷112303、演算性能1112303、サービス1112305、時刻同期1112306、RTT1112307、帯域1112308、揺らぎ1112309、及び属性情報1112310を含む。
DC名112301、DCアドレス1113402、演算性能1112303、及び属性情報1112310は、DC名111261、DCアドレス111262、演算性能111264、及び属性情報111267と同一のものである。また、負荷112303は、負荷111274と同一のものである。サービス1112305は、ID111281と同一のものである。
時刻同期1112306、RTT1112307、帯域1112308、及び揺らぎ1112309は、ネットワーク品質を表すパラメータである。
時刻同期1112306は、時刻同期のグループを示す情報を格納する。
RTT1112307、マイクロ管理ノード12とマイクロDC11との間のラウンドトリップタイム(RTT)を格納する。帯域1112308は、マイクロ管理ノード12とマイクロDC11との間の帯域を格納する。揺らぎ1112309は、RTTの揺らぎ又は時刻同期の際の揺らぎを格納する。
図10は、本発明の実施形態におけるサービス管理テーブル11124の一例を示す説明図である。
サービス管理テーブル11124は、ID111241、サービス名111242、推定負荷111243、提供対象111244、稼動プログラム111245、属性情報111246、及び冗長111247を含む。
ID111241、サービス名111242、推定負荷111243、提供対象111244、稼動プログラム111245、属性情報111246、及び冗長111247は、それぞれ、ID111281、サービス名111282、推定負荷111283、提供対象111284、稼動プログラム111285、属性情報111286、及び冗長構成111287と同一のものである。
図11は、本発明の実施形態における管理ノード10が実行する処理を説明するフローチャートである。
以下の説明では、グループが初めて構築される場合を例に説明する。したがって、マイクロDC管理テーブル11126の全てのエントリの所属グループ111266は空欄であり、また、全てのエントリの稼動情報111265には「通常」が格納される。さらに、グループ管理テーブル11127は、空欄のままである。なお、サービス管理テーブル11128には、全ての情報が格納される。
管理ノード10は、処理の開始要求を受け付けると処理を開始する(ステップS100)。なお、開始要求には、少なくとも構築するグループの数及びグループの識別子が含まれる。また、本実施形態では、構築されるグループ毎に提供するサービスが予め設定されているものとする。したがって、開始要求には、グループの識別子とサービスの識別子とが対応づけられた情報も含まれる。
管理ノード10は、受信した開始要求に基づいて、グループ管理テーブル11127を更新する。具体的には、管理ノード10は、構築するグループの数だけエントリを生成し、当該エントリのグループ名111271にグループの識別子を格納し、サービス111275にサービスの識別子を格納する。
管理ノード10は、まず、マイクロDC11の中からマイクロ管理ノード12を選出する(ステップS101)。具体的には、以下のような処理が実行される。
管理ノード10は、マイクロDC管理テーブル11126の管理機能111263を参照して、ノード管理部11122を有するマイクロDC11を特定する。
管理ノード10は、構築するグループの数及びサイズに基づいて、特定されたマイクロDC11の中からマイクロ管理ノード12をグループ数だけ選択し、選出されたマイクロDC11に選出命令を送信する。例えば、グループを三つ構築する場合、管理ノード10は、三つのマイクロ管理ノード12を選出する。
このとき、管理ノード10は、属性情報111267等の情報に基づいて、最適なマイクロ管理ノード12を選択してもよい。例えば、管理ノード10は、配置が分散するように、マイクロ管理ノード12を選出してもよい。
管理ノード10は、選出されたマイクロDC11に対応するエントリの稼動情報111265を「管理」に更新する。また、管理ノード10は、グループ管理テーブル11127のマイクロ管理ノードアドレス111272に、選出されたマイクロDC11のアドレスを格納する。
以上がステップS101の処理である。
次に、管理ノード10は、選出されたマイクロ管理ノード12からネットワーク品質の計測結果を受信する(ステップS103)。
管理ノード10は、受信した計測結果に基づいて、ネットワーク品質が所定の条件を満たすか否かを判定する(ステップS105)。具体的には、以下のような処理が実行される。
管理ノード10は、各マイクロ管理ノード12から受信した計測結果を集計する。管理ノード10は、集計結果及び各管理テーブルに基づいて、計測結果が悪いマイクロDC11が一定数以上存在するか否か、又は、ネットワーク品質が計測されていないマイクロDC11が存在するか否かを判定する。
例えば、RTTの値が所定の閾値より大きい場合には、計測結果が悪いマイクロDC11が存在すると判定される。なお、閾値は、予め設定されているものとする。
計測結果が悪いマイクロDC11が一定数以上存在する場合、又は、ネットワーク品質が計測されていないマイクロDC11が存在する場合、管理ノード10は、ネットワーク品質が所定の条件を満たさないと判定する。一方、計測結果が悪いマイクロDCが一定数以上存在せず、かつ、全てのマイクロDC11に対してネットワーク品質が計測されている場合、管理ノード10は、ネットワーク品質が所定の条件を満たすと判定する。
ネットワーク品質が所定の条件を満たさないと判定された場合、管理ノード10は、計測結果に基づいて、再度、マイクロ管理ノード12を選出し(ステップS113)、ステップS103に戻る。なお、管理ノード10は、マイクロ管理ノード12の設定を解除するため場合、マイクロ管理ノード12に対して解除命令を送信する。
ネットワーク品質が所定の条件を満たすと判定された場合、管理ノード10は、類似する計測結果のマイクロ管理ノード12が存在するか否かを判定する(ステップS107)。これは、同一のマイクロDC11を構成要素とするグループが生成され、グループの管理効率が悪くなるのを避けるためである。
具体的には、管理ノード10は、各マイクロ管理ノード12から受信した計測結果を比較し、類似する計測結果が存在するか否かを判定する。例えば、テーブル形式の情報として計測結果が送信される場合、同一のマイクロDC11との間のRTTの誤差が所定の閾値内に含まれるエントリが一定数以上存在する場合には、類似する計測結果と判定される。
類似する計測結果のマイクロ管理ノード12が存在すると判定された場合、管理ノード10は、再度、マイクロ管理ノード12を選出し(ステップS113)、ステップS103に戻る。
類似する計測結果のマイクロ管理ノード12が存在しないと判定された場合、管理ノード10は、計測結果に基づいて、グループの構成を決定する(ステップS109)。
このとき、管理ノード10は、グループの構成を決定した後、各管理テーブルを以下のように更新する。
管理ノード10は、グループ管理テーブル11127の各エントリの演算性能111273に、当該グループを構成するマイクロDC11の演算性能111264の合計値を格納する。管理ノード10は、グループを構成するマイクロDC11の属性情報111267を集計し、属性情報111276に集計結果を格納する。なお、演算性能111273には、マイクロ管理ノード12からの通知に基づいて修正された値が格納されてもよい。
また、管理ノード10は、マイクロDC管理テーブル11126の所属グループ111266に、当該マイクロDC11が所属するグループの識別子を格納する。
なお、マイクロ管理ノード12に対してクライアントから要求があった場合、マイクロ管理ノード12は、新たに追加されたサービスの識別子を通知する。当該通知を受信した管理ノード10は、サービス111275に通知されたサービスの識別子を追加する。
ステップS109におけるグループの構成の決定方法としては、例えば、以下のような方法が考えられる。
一つの方法としては、マイクロ管理ノード12毎に、当該マイクロ管理ノード12との間のRTTが小さいマイクロDC11から順に割り当てる方法が考えられる。
また、他の方法としては、サービスを考慮した割り当て方法が考えられる。グループ毎に提供するサービスと、サービスの処理負荷の大きさとが予め分かる場合に、当該サービスの提供に必要となる機能(属性)などの構成情報を反映して、マイクロDC11を割り当てる。具体的には、以下のような処理を行う。
管理ノード10は、サービス管理テーブル11124を参照し、推定負荷111283及び属性情報111286に基づいて、サービスを提供するグループに必要な条件を抽出する。
管理ノード10は、要求される条件が厳しいサービスから順に、マイクロDC管理テーブル11126、及び受信した計測結果に基づいて、条件を満たすグループを構成しやすいマイクロ管理ノード12を検索し、当該マイクロ管理ノード12を中心にグループを構成するマイクロDC11を選択する。
管理ノード10は、サービスを提供するために十分な計算機資源を有するグループが構築されると、次に条件の厳しいサービスについて同様の処理を実行する。
なお、既にサービスの提供が決まっているグループが他のサービスも提供するために用いられる場合もある。この場合、既に割り当てられているサービスの処理負荷、属性情報を考慮し、当該グループに対して新たなマイクロDC11を割り当てる。
グループへのマイクロDC11の割り当て状況はマイクロDC管理テーブル11126及びグループ管理テーブル11127に反映される。
全てのサービスについてグループの割り当てが完了した後、管理ノード10は、さらに、どのグループにも割り当てられなかったマイクロDC11を、予備の計算機資源を提供するマイクロDC11として管理し、処理を終了する。
以上が、グループの構成の決定方法の説明である。図11の説明に戻る。
管理ノード10は、グループの構成を決定した後、マイクロ管理ノード12にグループの構築指示を送信する(ステップS111)。
このとき、管理ノード10は、マイクロDC管理テーブル11126からグループを構成するマイクロDC11に関する情報を取得し、サービス管理テーブル11128から各グループが提供するサービスに関する情報を取得する。管理ノード10は、取得された情報を含むグループの構築指示を生成する。なお、グループ構成情報には、少なくともマイクロDC11の名称、マイクロDC11のアドレス、属性情報、サービスの識別子、及び提供対象が含まれる。
図12は、本発明の実施形態におけるマイクロ管理ノード12が実行する処理を説明するフローチャートである。
以下の処理は、マイクロDC11に含まれるゲートウェイ111によって実行される。
ゲートウェイ111は、管理ノード10から選出命令を受信すると、ノード管理部11122を呼び出し、マイクロ管理ノード12として処理を開始する(ステップ201)。以下、マイクロ管理ノード12を主体として処理を記載する。
マイクロ管理ノード12は、計測対象のマイクロDC11との間のネットワーク品質を計測し、計測結果を管理ノード10に通知する(ステップS203、ステップS205)。なお、計測結果には、マイクロ管理ノード12の識別子、計測対象のマイクロDC11の識別子、及びネットワーク品質を示す各種パラメータが含まれる。
ここで、計測対象のマイクロDC11との間のネットワーク品質の計測方法について説明する。
まず、マイクロ管理ノード12は、RTTを計測するために、近傍に存在するマイクロDC11に対してRTT計測パケットをマルチキャスト送信する。RTT計測パケットを受信したマイクロDC11は、PINGと同様に、マイクロ管理ノード12に対して当該パケットの応答を返信する。
このとき、マルチキャスト送信するパケットがIPパケットである場合、マイクロ管理ノード12は、TTL(Time To Live)を小さく設定することによって、ネットワーク上の特定のホップ数以内の範囲に含まれるマイクロDC11にのみパケットが到着するようにできる。すなわち、パケットの生存期間を短く設定することによって、近傍に存在するマイクロDC11にのみRTT計測パケットを送信することができる。
マイクロ管理ノード12は、計測対象のマイクロDC11のアドレスと到着間隔とをRTTの計測結果として記録する。
マイクロ管理ノード12は、RTTの計測処理を複数回実行し、RTTの大きさの揺らぎも併せて計測する。本実施形態では、RTTの計測結果からRTTが小さいマイクロDC11又はRTTの揺らぎが小さいマイクロDC11が、グループを構成するマイクロDC11の候補となる。
マイクロ管理ノード12は、RTTの計測後、候補となるマイクロDC11との間で時刻同期の揺らぎを計測する。
時刻同期の揺らぎの計測については、NTPやIEEE 1588などのネットワークを介した時刻同期プロトコル、及びGPSなどの無線による時刻同期プロトコルを用いて各マイクロDC11の時刻同期が行われている場合、マイクロ管理ノード12は、マイクロDC11との間で時刻情報を含むパケットを互いに送信することによって、時刻同期の差を計測できる。
このとき、マイクロ管理ノード12は、時刻同期のズレの大きさではなく、時刻情報の差分がどれだけ変動するかという情報を記録する。管理ノード10は、マイクロ管理ノード12とマイクロDC11との間の通信経路におけるトラフィックの負荷が原因で発生する遅延時間の変動量を判定するために前述した情報を用いる。
管理ノード10は、前述した差分の変動量が小さいほど、通信経路におけるトラフィック負荷がかかっておらず、遅延が安定していると判定できる。通信の遅延時間が安定していることなどが重視されるサービスの提供時には、管理ノード10は、前述した値を条件としてグループの構成を決定できる。
なお、前述の差分の変動量は時々刻々と変動するため、マイクロ管理ノード12は、グループの構築後も前述した差分の変動量を計測する。
マイクロ管理ノード12は、管理ノード10から解除命令を受信したか否かを判定する(ステップS207)。
管理ノード10から解除命令を受信したと判定された場合、マイクロ管理ノード12は、ノード管理部11122を停止し、処理を終了する。
管理ノード10から解除命令を受信していないと判定された場合、マイクロ管理ノード12は、ネットワーク品質を再計測する必要があるか否かを判定する(ステップS209)。具体的には、管理ノード10から再度選出命令を受信したか否かを判定する。これは、管理ノード10が、マイクロ管理ノード12を再度選出した場合に、改めて、マイクロ管理ノード12として選出されたことを示す。
ネットワーク品質を再計測する必要があると判定された場合、マイクロ管理ノード12は、ステップS203に戻り、同様の処理を実行する。
ネットワーク品質を再計測する必要がないと判定された場合、マイクロ管理ノード12は、グループの構築指示を受信したか否かを判定する(ステップS211)。
グループの構築指示を受信していないと判定された場合、マイクロ管理ノード12は、ステップS209に戻り、同様の処理を実行する。
グループの構築指示を受信したと判定された場合、マイクロ管理ノード12は、受信したグループの構築指示に基づいてグループを生成し、処理を終了する(ステップS213)。具体的には、以下のような処理を実行する。
マイクロ管理ノード12は、受信したグループの構築指示に基づいて、グループメンバ管理テーブル11123及びサービス管理テーブル11124を更新する。
その後、マイクロ管理ノード12は、周期的に、グループに含まれるマイクロDC11との間のネットワーク品質を監視する。ネットワーク品質が劣化することによってサービス品質の維持が困難となった場合、マイクロ管理ノード12は、管理ノード10にサービス品質の維持が困難である旨を通知する。管理ノード10は、前述の通知を受信すると、グループからマイクロDC11を削除し、グループに代替のマイクロDC11を追加し、又は、新たにグループを再構築する。
また、特定のマイクロDC11を用いてサービスを提供する場合、時刻同期を行う場合、又は、冗長構成を組む場合において、マイクロ管理ノード12は、周期的に、特定のマイクロDC11との間のネットワーク品質を監視する。ネットワーク品質が劣化し、特定のマイクロDC11を用いたサービスの品質が維持できない場合、マイクロ管理ノード12は、サービスを提供するためのマイクロDC11の組み合わせを変更する。
また、マイクロ管理ノード12は、ネットワーク品質の計測結果をログとして格納してもよい。これによって、マイクロ管理ノード12は、過去の履歴からネットワーク品質の劣化を検出することができる。
次に、データセンタシステムに、新たなマイクロDC11が追加された場合の処理について説明する。
図13A及び図13Bは、本発明の実施形態におけるマイクロDC11の追加時に管理ノード10が実行する処理を説明するフローチャートである。
管理ノード10は、追加された新規マイクロDC11の情報を取得する(ステップS301)。例えば、ユーザが管理ノード10に対して、新規マイクロDC11の情報を入力する方法が考えられるが、本発明は、新規マイクロDC11の情報の取得方法に限定されない。なお、新規マイクロDC11の情報には、マイクロDC管理テーブル11126を生成するために必要な各種情報が含まれる。
管理ノード10は、マイクロ管理ノード12に対して、新規マイクロDC11のアドレスを通知する(ステップS303)。各マイクロ管理ノード12は、当該アドレスを受信すると、新規マイクロDC11との間のネットワーク品質を計測する。具体的には、各マイクロ管理ノード12は、通知されたアドレス宛にRTT計測パケットを送信してRTT等のネットワーク品質を計測する。
管理ノード10は、各マイクロ管理ノード12から新規マイクロDC11との間のネットワーク品質の計測結果を受信する(ステップS305)。
管理ノード10は、受信した計測結果に基づいて、新規マイクロDC11との間のRTTが一定値以下のマイクロ管理ノード12が存在するか否かを判定する(ステップS307)。
新規マイクロDC11との間のRTTが一定値以下のマイクロ管理ノード12が存在しないと判定された場合、管理ノード10は、グループを再構築するために図11に示す処理を実行し、処理を終了する(ステップS313)。これは、現在のグループ構成では、新規マイクロDC11を追加することができないため、改めて、新規マイクロDC11を含めてグループを構築する必要があるためである。
新規マイクロDC11との間のRTTが一定値以下のマイクロ管理ノード12が存在すると判定された場合、管理ノード10は、グループ管理テーブル11127を参照し、演算性能が不足するグループが存在するか否かを判定する(ステップS309)。例えば、管理ノード10は、演算性能111273の値と、負荷1111274の値との差が所定の閾値以下の場合、演算性能が不足していると判定する。以下、演算性能が不足するグループを対象グループとも記載する。
対象グループが存在しないと判定された場合、管理ノード10は、新規マイクロDC11との間のRTTが最小のマイクロ管理ノード12に、当該マイクロ管理ノード12が管理するグループへの新規マイクロDC11の追加命令を送信し、処理を終了する(ステップS311)。なお、当該追加命令には、新規マイクロDC11の各種情報が格納される。
マイクロ管理ノード12は、受信した追加命令に基づいて、新規マイクロDC11をグループに追加し、グループメンバ管理テーブル11123を更新する。
対象グループが存在すると判定された場合、管理ノード10は、対象グループを管理するマイクロ管理ノード12と新規マイクロDC11との間のRTTが一定値以下であるか否かを判定する(ステップS315)。すなわち、対象グループに新規マイクロDC11を追加できるか否かが判定される。以下、対象グループを管理するマイクロ管理ノード12を対象マイクロ管理ノード12とも記載する。
対象マイクロ管理ノード12と新規マイクロDC11との間のRTTが一定値以下であると判定された場合、すなわち、対象グループに新規マイクロDC11を追加できると判定された場合、管理ノード10は、当該マイクロ管理ノード12に、グループへの新規マイクロDC11の追加命令を送信し、処理を終了する(ステップS327)。
マイクロ管理ノード12と新規マイクロDC11との間のRTTが一定値以下でないと判定された場合、管理ノード10は、新規マイクロDC11との間のRTTが一定値以下のマイクロ管理ノード12に対して、対象グループに追加可能なマイクロDC11が存在するか否かを問い合わせる(ステップS317)。
マイクロ管理ノード12は、当該問い合わせを受け付けると、グループメンバ管理テーブル11123及びサービス管理テーブル11124を参照し、グループから削除可能なマイクロDC11が存在するか否か判定する。例えば、マイクロ管理ノード12は、所定のマイクロDC11を削除した場合の演算性能及び属性情報に基づいて、提供するサービスの品質を維持できるか否かを判定する。
マイクロ管理ノード12は、管理ノード10に削除可能なマイクロDC11のアドレスを含む応答を送信する。
管理ノード10は、対象マイクロ管理ノード12に、削除可能なマイクロDC11のアドレスを含むネットワーク品質の計測指示を送信する(ステップS319)。
対象マイクロ管理ノード12は、計測指示に含まれるアドレスに基づいて、削除可能なマイクロDC11にRTT計測パケット等を送信して、ネットワーク品質を計測する。対象マイクロ管理ノード12は、管理ノード10に計測結果を送信する。
管理ノード10は、受信した計測結果に基づいて、削除可能なマイクロDC11の中に、対象マイクロ管理ノード12との間のRTTが一定値以下のマイクロDC11が存在するか否かを判定する(ステップS321)。以下、削除可能なマイクロDC11のうち、対象マイクロ管理ノード12との間のRTTが一定値以下のマイクロDC11を追加候補マイクロDC11とも記載する。
追加候補マイクロDC11が存在しないと判定された場合、管理ノード10は、ステップS313に進む。
追加候補マイクロDC11が存在すると判定された場合、管理ノード10は、対象マイクロ管理ノード12に、対象グループへの追加候補マイクロDC11の追加命令を送信する(ステップS323)。なお、追加候補マイクロDC11が複数ある場合、RTTが小さいものから順に追加する方法が考えられる。
さらに、管理ノード10は、新規マイクロDC11との間のRTTが一定値以下のマイクロ管理ノード12に、グループからの追加候補マイクロDC11の削除指示と、グループへの新規マイクロDC11の追加命令とを送信し、処理を終了する(ステップS325)。
本実施形態では、管理ノード10及び所定のグループに所属するマイクロDC11は、マイクロ管理ノード12との間で周期的な通信がない場合に、当該マイクロ管理ノード12の障害発生を検出できる。
マイクロDC11がマイクロ管理ノード12の障害発生を検出した場合、マイクロDC11は、管理ノード10に対して、マイクロ管理ノード12との通信ができない旨、すなわち、マイクロ管理ノード12が存在しない旨を通知する。
管理ノード10は、マイクロ管理ノード12と通信ができない場合、又は、マイクロDC11からマイクロ管理ノード12が存在しない旨の通知を受信した場合に、障害が発生したマイクロ管理ノード12が管理するグループに含まれるマイクロDC11の中から新たなマイクロ管理ノード12を選出する。
なお、グループの中にマイクロ管理ノード12の候補となるマイクロDC11が存在しない場合、管理ノード10は、グループを再構築する。
本実施形態では、マイクロ管理ノード12を一つ決定していたが、マイクロ管理ノード12の障害に対応するために、管理ノード10は、グループを構成する時に、代替のマイクロ管理ノード12とするマイクロDC11を設定してもよい。
この場合、グループ管理テーブル11127に代替えマイクロ管理ノードのアドレスを格納するようにすればよい。
ユーザがサービス提供の要求を入力した場合、サービス提供の要求を受け取った窓口となるノードは、要求されたサービスを提供する各グループに当該要求を通知し、応答時間を等のサービス品質を考慮して、接続先のグループを選択する。
本発明の一形態によれば、ネットワーク品質に基づいて、マイクロDC11のグループを適切に構成することができる。これによって、ネットワークを介してクラウドを用いて提供するサービスの品質を維持することが可能となる。
10 管理ノード
11 マイクロDC
12 マイクロ管理ノード
111 ゲートウェイ
112 サーバ
113 WAN接続回線
150 ネットワーク
1111 CPU
1112 メモリ
1113 クロスバスイッチ
1114 NIC
11121 マイクロDC管理部
11122 ノード管理部
11123 グループメンバ管理テーブル
11124 サービス管理テーブル
11125 データセンタ制御部
11126 マイクロDC管理テーブル
11127 グループ管理テーブル
11128 サービス管理テーブル

Claims (14)

  1. ネットワークを介して接続される複数のサブシステムを備える計算機システムであって、
    前記サブシステムの各々は、第1のプロセッサ、前記第1のプロセッサに接続される第1のメモリ、及び他の装置と通信するための第1のネットワークインタフェースを有する一以上の計算機と、第2のプロセッサ、前記第2のプロセッサに接続される第2のメモリ、及び他の装置と通信するための第2のネットワークインタフェースを有する一以上のネットワーク装置と、を含み、
    前記計算機システムは、前記サブシステムを管理するサブシステム制御部を備え、
    前記サブシステム制御部は、
    サービスを提供するために用いられ、一つ以上の前記サブシステムから構成されるグループの構築要求を受け付けると、前記複数のサブシステムの中からグループ管理ノードとなる前記サブシステムを選択し、
    前記グループ管理ノードとして選択された前記サブシステムに、他の前記サブシステムとの間のネットワーク品質の測定を命令し、
    前記ネットワーク品質の測定結果を受信し、
    前記受信したネットワーク品質の測定結果に基づいて、前記グループの構成を決定し、
    前記決定されたグループの構成に関する情報を含むグループ構築命令を前記グループ管理ノードに送信することを特徴とする計算機システム。
  2. 前記サブシステム制御部は、前記複数のサブシステムを管理するためのサブシステム管理情報を保持し、
    前記サブシステム制御部は、
    前記受信したネットワーク品質の測定結果及び前記サブシステム管理情報に基づいて、前記ネットワーク品質が所定の条件を満たさない前記サブシステムが所定数以上存在するか否か、又は、前記ネットワーク品質が計測されていない前記サブシステムが存在するか否かを判定し、
    前記ネットワーク品質が所定の条件を満たさない前記サブシステムが所定数以上存在する、又は、前記ネットワーク品質が計測されていない前記サブシステムが存在すると判定された場合に、前記受信したネットワーク品質の測定結果に基づいて、新たに前記グループ管理ノードを選択することを特徴とする請求項1に記載の計算機システム。
  3. 前記サブシステム制御部は、
    前記各グループ管理ノードから受信したネットワーク品質の測定結果を比較して、類似する前記ネットワーク品質の測定結果が存在するか否かを判定し、
    前記類似するネットワーク品質の測定結果が存在する場合に、新たに前記グループ管理ノードを選択することを特徴とする請求項1又は請求項2に記載の計算機システム。
  4. 前記グループ管理ノードは、前記サブシステム宛にパケットを送信してから、当該サブシステムからの応答を受信するまでの時間であるラウンドトリップタイム、前記ラウンドトリップタイムを複数回計測することによって算出されるラウンドトリップタイムの時間の揺らぎ、及び、ネットワークを介した時刻同期の精度の少なくとも一つ以上を、前記サブシステムとの間の前記ネットワークの品質として計測することを特徴とする請求項1から請求項3のいずれか一つに記載の計算機システム。
  5. 前記グループ管理ノードは、所定のネットワーク範囲に含まれる前記サブシステムとの間の前記ネットワークの品質を計測することを特徴とする請求項4に記載の計算機システム。
  6. 前記グループ管理ノードは、TTLが所定の閾値以下に設定されたIPパケットを用いて、前記所定のネットワーク範囲に含まれる前記サブシステムとの間の前記ネットワーク品質を測定することを特徴とする請求項5に記載の計算機システム。
  7. 前記グループ管理ノードは、
    前記グループに含まれる前記サブシステムを管理するグループ管理情報を保持し、
    前記受信したグループ構築命令に基づいて、前記グループを構築し、前記グループ管理情報を生成し、
    前記グループに含まれる前記サブシステムのネットワーク品質を周期的に計測し、
    前記サブシステム制御部に、前記ネットワーク品質の計測結果を送信し、
    前記サブシステム制御部は、
    前記受信したネットワーク品質の測定結果に基づいて、前記ネットワーク品質が所定の条件を満たさない場合、前記グループの構成を変更することを特徴とする請求項1に記載の計算機システム。
  8. ネットワークを介して接続される複数のサブシステムを備える計算機システムにおけるサブシステム管理方法であって、
    前記サブシステムの各々は、第1のプロセッサ、前記第1のプロセッサに接続される第1のメモリ、及び他の装置と通信するための第1のネットワークインタフェースを有する一以上の計算機と、第2のプロセッサ、前記第2のプロセッサに接続される第2のメモリ、及び他の装置と通信するための第2のネットワークインタフェースを有する一以上のネットワーク装置と、を含み、
    前記計算機システムは、前記サブシステムを管理するサブシステム制御部を備え、
    前記方法は、
    前記サブシステム制御部が、サービスを提供するために用いられ、一つ以上の前記サブシステムから構成されるグループの構築要求を受け付けると、前記複数のサブシステムの中からグループ管理ノードとなる前記サブシステムを選択する第1のステップと、
    前記グループ管理ノードとして選択されたサブシステムが、他の前記サブシステムとの間のネットワーク品質の測定する第2のステップと、
    前記サブシステム制御部が、前記ネットワーク品質の測定結果を受信する第3のステップと、
    前記サブシステム制御部が、前記受信したネットワーク品質の測定結果に基づいて、前記グループの構成を決定する第4のステップと、
    前記サブシステム制御部が、前記決定されたグループの構成に関する情報を含むグループ構築命令を前記グループ管理ノードに送信する第5のステップと、
    を含むことを特徴とするサブシステム管理方法。
  9. 前記サブシステム制御部は、前記複数のサブシステムを管理するためのサブシステム管理情報を保持し、
    前記第4のステップは、
    前記受信したネットワーク品質の測定結果及び前記サブシステム管理情報に基づいて、前記ネットワーク品質が所定の条件を満たさない前記サブシステムが所定数以上存在するか否か、又は、前記ネットワーク品質が計測されていない前記サブシステムが存在するか否かを判定するステップと、
    前記ネットワーク品質が所定の条件を満たさない前記サブシステムが所定数以上存在する、又は、前記ネットワーク品質が計測されていない前記サブシステムが存在すると判定された場合に、前記受信したネットワーク品質の測定結果に基づいて、新たに前記グループ管理ノードを選択するステップと、
    を含むことを特徴とする請求項8に記載のサブシステム管理方法。
  10. 前記第4のステップは、
    前記各グループ管理ノードから受信したネットワーク品質の測定結果を比較して、類似する前記ネットワーク品質の測定結果が存在するか否かを判定するステップと、
    前記類似するネットワーク品質の測定結果が存在する場合に、新たに前記グループ管理ノードを選択するステップと、
    を含むことを特徴とする請求項8又は請求項9に記載のサブシステム管理方法。
  11. 前記グループ管理ノードは、前記サブシステム宛にパケットを送信してから、当該サブシステムからの応答を受信するまでの時間であるラウンドトリップタイム、前記ラウンドトリップタイムを複数回計測することによって算出されるラウンドトリップタイムの時間の揺らぎ、及び、ネットワークを介した時刻同期の精度の少なくとも一つ以上を、前記サブシステムとの間の前記ネットワークの品質として計測することを特徴とする請求項8から請求項10のいずれか一つに記載のサブシステム管理方法。
  12. 前記第2のステップでは、前記グループ管理ノードとして選択されたサブシステムが、所定のネットワーク範囲に含まれる前記サブシステムとの間の前記ネットワークの品質を計測することを特徴とする請求項11に記載のサブシステム管理方法。
  13. 前記第2のステップでは、前記グループ管理ノードが、TTLが所定の閾値以下に設定されたIPパケット用いて、前記所定のネットワーク範囲に含まれる前記サブシステムとの間の前記ネットワーク品質を測定することを特徴とする請求項12に記載のサブシステム管理方法。
  14. 前記グループ管理ノードは、前記グループに含まれる前記サブシステムを管理するグループ管理情報を保持し、
    前記方法は、さらに、
    前記グループ管理ノードが、前記受信したグループ構築命令に基づいて、前記グループを構築し、前記グループ管理情報を生成するステップと、
    前記グループ管理ノードが、前記グループに含まれる前記サブシステムのネットワーク品質を周期的に計測するステップと、
    前記グループ管理ノードが、前記サブシステム制御部に、前記ネットワーク品質の計測結果を送信するステップと、
    前記サブシステム制御部が、前記受信したネットワーク品質の測定結果に基づいて、前記ネットワーク品質が所定の条件を満たさない場合、前記グループの構成を変更するステップと、
    を含むことを特徴とする請求項8に記載のサブシステム管理方法。
JP2012074203A 2012-03-28 2012-03-28 計算機システム及びサブシステム管理方法 Active JP5740652B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012074203A JP5740652B2 (ja) 2012-03-28 2012-03-28 計算機システム及びサブシステム管理方法
US13/728,722 US20130262664A1 (en) 2012-03-28 2012-12-27 Computer system and subsystem management method
EP12199512.0A EP2645625B1 (en) 2012-03-28 2012-12-27 Computer system and subsystem management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012074203A JP5740652B2 (ja) 2012-03-28 2012-03-28 計算機システム及びサブシステム管理方法

Publications (3)

Publication Number Publication Date
JP2013206112A true JP2013206112A (ja) 2013-10-07
JP2013206112A5 JP2013206112A5 (ja) 2014-07-17
JP5740652B2 JP5740652B2 (ja) 2015-06-24

Family

ID=47738960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012074203A Active JP5740652B2 (ja) 2012-03-28 2012-03-28 計算機システム及びサブシステム管理方法

Country Status (3)

Country Link
US (1) US20130262664A1 (ja)
EP (1) EP2645625B1 (ja)
JP (1) JP5740652B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015187585A (ja) * 2014-03-27 2015-10-29 セイコーエプソン株式会社 可動コンテナ型データセンターおよび並列分散処理システム
JP2020533922A (ja) * 2017-09-18 2020-11-19 中国科学院声学研究所Institute Of Acoustics, Chinese Academy Of Sciences クエリ拡張システム及びクエリ拡張方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6107456B2 (ja) * 2013-06-14 2017-04-05 富士通株式会社 構成要件作成プログラム、構成要件作成装置および構成要件作成方法
US10346191B2 (en) * 2016-12-02 2019-07-09 Wmware, Inc. System and method for managing size of clusters in a computing environment
US11595321B2 (en) 2021-07-06 2023-02-28 Vmware, Inc. Cluster capacity management for hyper converged infrastructure updates

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268964A (ja) * 2001-03-07 2002-09-20 Kddi Corp ネットワーク管理における負荷分散制御システム
JP2005079664A (ja) * 2003-08-28 2005-03-24 Sharp Corp Ip電話通話品質通知装置
JP2006509386A (ja) * 2002-12-04 2006-03-16 ファーウェイチーシュヨウシェンゴンス ネットワーク装置のクラスタ管理方法及びその装置
WO2008058570A1 (en) * 2006-11-14 2008-05-22 Telefonaktiebolaget L M Ericsson (Publ) A system and a method relating to network management

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6308163B1 (en) * 1999-03-16 2001-10-23 Hewlett-Packard Company System and method for enterprise workflow resource management
JP3833117B2 (ja) 2000-01-31 2006-10-11 富士通株式会社 サーバ決定方法及び装置
US20040117226A1 (en) * 2001-03-30 2004-06-17 Jaana Laiho Method for configuring a network by defining clusters
US7194002B2 (en) * 2002-02-01 2007-03-20 Microsoft Corporation Peer-to-peer based network performance measurement and analysis system and method for large scale networks
US7359930B2 (en) * 2002-11-21 2008-04-15 Arbor Networks System and method for managing computer networks
US20040267897A1 (en) * 2003-06-24 2004-12-30 Sychron Inc. Distributed System Providing Scalable Methodology for Real-Time Control of Server Pools and Data Centers
US7975035B2 (en) * 2003-12-01 2011-07-05 International Business Machines Corporation Method and apparatus to support application and network awareness of collaborative applications using multi-attribute clustering
US20060015593A1 (en) * 2004-06-17 2006-01-19 International Business Machines Corporation Three dimensional surface indicating probability of breach of service level
JP4570952B2 (ja) 2004-12-28 2010-10-27 富士通株式会社 高速情報処理装置、高速情報処理方法及びそのプログラム
JP4101251B2 (ja) * 2005-05-24 2008-06-18 富士通株式会社 負荷分散プログラム、負荷分散方法、及び負荷分散装置
US7894372B2 (en) * 2005-05-31 2011-02-22 Iac Search & Media, Inc. Topology-centric resource management for large scale service clusters
US7970903B2 (en) * 2007-08-20 2011-06-28 Hitachi, Ltd. Storage and server provisioning for virtualized and geographically dispersed data centers
US8041773B2 (en) * 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
US8954562B2 (en) * 2007-09-28 2015-02-10 Intel Corporation Entropy-based (self-organizing) stability management
GB2459433B (en) * 2008-03-07 2012-06-06 Hewlett Packard Development Co Distributed network connection policy management
US9367257B2 (en) * 2008-09-11 2016-06-14 Microsoft Technology Licensing, Llc Techniques for resource location and migration across data centers
WO2010090561A1 (en) * 2009-02-05 2010-08-12 Telefonaktiebolaget L M Ericsson (Publ) Topological location discovery in an ethernet network
JP5016696B2 (ja) 2010-03-05 2012-09-05 日本電信電話株式会社 高可用性システム、サーバ、高可用性維持方法及びプログラム
US20120060167A1 (en) * 2010-09-08 2012-03-08 Salsburg Michael A Method and system of simulating a data center
US10678602B2 (en) * 2011-02-09 2020-06-09 Cisco Technology, Inc. Apparatus, systems and methods for dynamic adaptive metrics based application deployment on distributed infrastructures
US8856321B2 (en) * 2011-03-31 2014-10-07 International Business Machines Corporation System to improve operation of a data center with heterogeneous computing clouds
US9204207B2 (en) * 2011-11-01 2015-12-01 Plexxi Inc. Hierarchy of control in a data center network
US9535764B2 (en) * 2012-02-15 2017-01-03 Cisco Technology, Inc. Resource allocation mechanism

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268964A (ja) * 2001-03-07 2002-09-20 Kddi Corp ネットワーク管理における負荷分散制御システム
JP2006509386A (ja) * 2002-12-04 2006-03-16 ファーウェイチーシュヨウシェンゴンス ネットワーク装置のクラスタ管理方法及びその装置
JP2005079664A (ja) * 2003-08-28 2005-03-24 Sharp Corp Ip電話通話品質通知装置
WO2008058570A1 (en) * 2006-11-14 2008-05-22 Telefonaktiebolaget L M Ericsson (Publ) A system and a method relating to network management

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015187585A (ja) * 2014-03-27 2015-10-29 セイコーエプソン株式会社 可動コンテナ型データセンターおよび並列分散処理システム
JP2020533922A (ja) * 2017-09-18 2020-11-19 中国科学院声学研究所Institute Of Acoustics, Chinese Academy Of Sciences クエリ拡張システム及びクエリ拡張方法
JP6992168B2 (ja) 2017-09-18 2022-01-13 中国科学院声学研究所 クエリ拡張システム及びクエリ拡張方法

Also Published As

Publication number Publication date
JP5740652B2 (ja) 2015-06-24
US20130262664A1 (en) 2013-10-03
EP2645625B1 (en) 2017-07-26
EP2645625A1 (en) 2013-10-02

Similar Documents

Publication Publication Date Title
US11108677B2 (en) Methods and apparatus for configuring a standby WAN link in an adaptive private network
TWI724106B (zh) 資料中心間的業務流量控制方法、裝置及系統
US10700964B1 (en) Centralized application-layer routing at the edge of an online application service provider network
Liang et al. Scalable and crash-tolerant load balancing based on switch migration for multiple open flow controllers
JP5944537B2 (ja) 通信経路の管理方法
US9461877B1 (en) Aggregating network resource allocation information and network resource configuration information
JP2018504038A (ja) ソフトウェア定義型データセンター、並びにそのためのサービスクラスタスケジューリング方法及びトラフィック監視方法
JP5740652B2 (ja) 計算機システム及びサブシステム管理方法
US20160344582A1 (en) Call home cluster
CN106464516B (zh) 网络管理系统中的事件处理
Thean et al. Container-based MQTT broker cluster for edge computing
US11374820B2 (en) Centralized controller-based dynamic network bandwidth allocation and management
KR101256918B1 (ko) 클라우드 서비스의 확장성과 가용성을 향상시키는 방법 및 그 시스템
EP3280102B1 (en) Optical path allocation method and apparatus
US20050120088A1 (en) Method and apparatus for virtualizing network resources
US20150372895A1 (en) Proactive Change of Communication Models
WO2023207189A1 (zh) 负载均衡方法及系统、计算机存储介质、电子设备
WO2015162619A1 (en) Managing link failures in software defined networks
JP6288633B2 (ja) ネットワーク制御方法
US20230396677A1 (en) Computing power information processing method, first network device, and system
US11777821B2 (en) Systems and methods for performance-aware controller node selection in high availability containerized environment
WO2023198174A1 (en) Methods and systems for predicting sudden changes in datacenter networks
KR20190048324A (ko) 다중 네트워크 기반의 서비스를 제공하는 방법 및 장치
WO2024004102A1 (ja) キューに格納されている性能指標値データに基づく通信システムの状態判定
US9019964B2 (en) Methods and systems for routing application traffic

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140604

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150331

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150401

R150 Certificate of patent or registration of utility model

Ref document number: 5740652

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150