JP2005234931A - リソース探索方法、及び、クラスタマネージャ装置 - Google Patents

リソース探索方法、及び、クラスタマネージャ装置 Download PDF

Info

Publication number
JP2005234931A
JP2005234931A JP2004043983A JP2004043983A JP2005234931A JP 2005234931 A JP2005234931 A JP 2005234931A JP 2004043983 A JP2004043983 A JP 2004043983A JP 2004043983 A JP2004043983 A JP 2004043983A JP 2005234931 A JP2005234931 A JP 2005234931A
Authority
JP
Japan
Prior art keywords
resource
cluster
resource information
search
static
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004043983A
Other languages
English (en)
Other versions
JP3944176B2 (ja
Inventor
Hideki Yoshida
英樹 吉田
Toshio Shirokibara
敏雄 白木原
Tatsunori Kanai
達徳 金井
Nobuo Sakiyama
伸夫 崎山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004043983A priority Critical patent/JP3944176B2/ja
Priority to US10/995,172 priority patent/US20050188191A1/en
Publication of JP2005234931A publication Critical patent/JP2005234931A/ja
Application granted granted Critical
Publication of JP3944176B2 publication Critical patent/JP3944176B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals

Abstract

【課題】クラスタ間リソース融通のためのリソース探索において、探索にかかる通信量と処理量の低減。
【解決手段】各クラスタの静的リソース情報格納手段を読み出し、条件に該当するリソースを持っている一つ以上の候補クラスタを探索する候補クラスタ探索ステップS20と、上記一つ以上の候補クラスタの各動的リソース情報測定手段による測定を行い、条件に該当するリソースを探索する該当リソース探索ステップS30とを備える。
【選択図】 図4

Description

本発明は、クラスタシステムにおけるリソースの融通を行うためのリソース探索方法、及び、クラスタマネージャ装置に関する。
クラスタシステムは、計算機やディスクなどのリソースを一括管理して、必要に応じてアプリケーションへの割り当てを行なうことで、信頼性・処理性能・リソースの利用率などの向上を図るシステムである。そして、クラスタシステムは、クラスタ内の一台または複数台の計算機上でミドルウェアまたはOSの一モジュールとしてクラスタマネージャを動かしてリソースの管理をさせる形態で実現される。
通常のクラスタシステムは、一つのクラスタ内に閉じたリソースの割り当てを行なうものである。しかし近年、処理対象のデータの増大やコスト低減要求によって、一つのクラスタ内だけではリソースが足りない場合に、クラスタ間でリソースの融通を行なうことで、リソース不足に対処したいという要求が現れている。
一般に、アプリケーションを動作させるには、特定のCPUや特定のOSが要求される。計算機などのリソースは、この要求を満たすものでなければ利用できない。そのためクラスタ間でリソース融通を行なう場合、利用可能なリソースを、クラスタをまたがって探索する機構が必要になる。探索の際には、アプリケーションが要求するCPUやOSの種類などのリソースについての情報(リソース情報)を条件として指定する。
この条件の中には、CPUの種類のように条件を満たすか満たさないかに二分される離散的条件と、CPUのクロック数のように最低条件を満たした上でなるべく大きいものがよいといった連続的な条件とがある。これらの情報は、事前に設定ファイルなどの形で記述可能な静的リソース情報である。
これに対し、リソースを借りる側のクラスタとネットワーク的に近い位置にあるリソースといった、リソースを借りる側のクラスタに応じて変化するものや、現在のCPU負荷といった、時間経過によって変化するものもある。これらの情報は、リソース探索の際にその場で測定する必要がある動的リソース情報である。
従来の単一クラスタ内でのリソース探索については、希望する条件を細かく指定し、その条件に該当するリソースをあらゆるリソースの中から探索するという手法が取られている。現在検討されているクラスタ間リソース融通は、上記のような単一クラスタ内でのリソース探索方法をそのままクラスタ間に拡大したものである。具体的には、借りる側のクラスタが希望するリソースの条件を細かく指定して、その条件に該当するリソースをあらゆるクラスタのあらゆるリソースから探索するというものである。
一方、上記動的リソース情報を利用して最適なリソースを探索する方法として、各クラスタの使用状況、及び、ネットワークリソースの使用状況を時間で正規化してパラメータ化し、該当パラメータ値に基づきアプリケーションジョブを振り分けるクラスタ装置を動的に設定するというものがある(例えば、特許文献1参照。)。
特開2002−259353号公報(頁4−頁6、図2、図8)
上述した単一クラスタ内でのリソース探索方法をそのままクラスタ間に拡大したものでは、クラスタをまたがる融通においてリソースの条件を細かく指定し、その条件に該当するあらゆるリソースの情報をあらゆるクラスタについてやりとりするため、通信量や処理量が大きいという問題点があった。特に、上記動的リソース情報を条件としてリソースを探索する場合、リソース探索の際にその場で測定する必要があるため、このような測定をあらゆる探索の際に毎回行うのは、測定のコストが高いという問題点もあった。そのため、事前記述可能な静的リソース情報のみに限定して融通を行うか、それとも高いコストをかけて動的リソース情報までを条件として探索するかの何れかが必要であった。
一方、上記特許文献1には、動的リソース情報だけを利用する技術が記載されており、リソースを借りるクラスタのクラスタノードマネージャ装置がアプリケーションジョブを分配するクラスタを判断するため、他のクラスタの動的リソース情報やネットワークリソースの使用状況の更新が必要となる。これらの情報更新は、各クラスタのノードマネージャ装置において周期的に行われることであるため、通信量や処理量が大きくなるという問題点がある。
従って、本発明は上記問題点を解決するためになされたもので、クラスタ間でのリソースの融通において、リソース探索にかかる通信量と処理量を低減できるリソース探索方法、及び、クラスタマネージャ装置を提供することを目的とする。
上記目的を達成するために、本発明のリソース探索方法は、一つ以上のリソースを有するクラスタを複数備えたコンピュータシステムのリソース探索方法であって、リソース探索される各クラスタに設けられた自クラスタ内の前記リソースに関する静的リソース情報を格納する静的リソース情報格納手段を参照し、静的リソース情報の条件に該当するリソースを持っている一つ以上の候補クラスタを探索する候補クラスタ探索ステップと、前記候補クラスタに設けられた自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段によって測定された値を参照し、動的リソース情報の条件に該当するリソースを探索する該当リソース探索ステップとを備えることを特徴とする。
また、本発明のクラスタマネージャ装置は、一つ以上のリソースを有するクラスタを複数備えたコンピュータシステムのクラスタマネージャ装置であって、自クラスタ内の前記リソースに関する静的リソース情報を格納する静的リソース情報格納手段と、自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段と、リソース探索するクラスタマネージャ装置から受信したクラスタ探索要求に応答して前記静的リソース情報格納手段を参照して静的リソース情報の条件に該当するリソースがあるか否かを探索し、該当するリソースがある場合には候補クラスタの情報を前記リソース探索するクラスタマネージャ装置に通知し、前記リソース探索するクラスタマネージャ装置から受信した該当リソース探索要求に応答して前記静的リソース情報格納手段を参照して前記静的リソース情報の条件に該当するリソースを探索し、そのリソースの中で自クラスタ内の前記動的リソース情報測定手段によって測定した値を参照して動的リソース情報の条件に該当するリソースを探索して前記リソース探索するクラスタマネージャ装置へ送信する処理手段とを備えることを特徴とする。
本発明によれば、クラスタ探索によって絞り込んだクラスタを対象にリソース探索を行うため、クラスタ間リソース融通のためのリソース探索にかかる通信量と処理量を低減することができる。
以下、本発明の実施の形態を、図面を参照しながら説明する。
(第1の実施形態)
図1は、第1の実施形態によるクラスタシステムの全体構成を示す。第1の実施形態のクラスタシステムは複数のクラスタ1、2、…、nとそれを管理する1つのグリッドマネージャ50aが動作する計算機50とを有し、それらがネットワーク40によって接続されている。複数の同様なクラスタ1、2、3、…、nの中で、クラスタ1を中心にクラスタの構成を説明する。
クラスタ1はクラスタマネージャ1aが動作する計算機11とクラスタマネージャ1aによって管理されるリソース12、13を備える。リソース12、13は本実施形態では計算機であって、各クラスタ1、2、…、nには一つ以上のリソースが含まれている。クラスタマネージャ1aは、自クラスタ内のリソースについての静的リソース情報を格納する静的リソース情報格納手段1bと、自クラスタ内のリソースについての動的リソース情報を測定する動的リソース情報測定手段1cとを持つ。これら2つの手段は、クラスタ間融通ではリソースを貸し出せるかどうかを判定する際にのみ利用され、リソースを借りる際には利用されない。本実施形態に示す動作例では、クラスタ1が他のクラスタ2、3、…、nからリソースを借りることを想定しているので、クラスタ1の静的リソース情報格納手段1bと動的リソース情報測定手段1cは利用されない。なお、クラスタマネージャ1aは、図1のようにリソース12、13とは別の計算機上で動作させてもよいし、リソース12又は13の計算機上で動作させてもよい。
クラスタ2、3、…、nの構成も上述したクラスタ1と同様であるので、その説明は省略する。
本実施形態では、相互にリソース融通を行うクラスタ群全体をグリッドと呼ぶ。本実施形態のグリッド100にはグリッドマネージャ50aを有する計算機50が設けられ、クラスタ1、2、…、n間のリソース融通の仲介を行なう。グリッドマネージャ50aは、ミドルウェアまたはOSの一モジュールとして実現される。なお、グリッドマネージャ50aは、図1のようにクラスタ1、2、…、nに属さない独立した計算機上で動作させてもよいし、クラスタに属する計算機で動作させてもよい。
グリッドマネージャ50aは自分が管理する各クラスタ1、2、…、nのクラスタマネージャ1a、2a、…、naへのポインタを保持しており、必要に応じてそのポインタを利用してクラスタマネージャ1a、2a、…、naに接続することができる。ポインタはグリッドマネージャ50aの設定ファイルなどに記述しておいて、グリッドマネージャ50aの計算機50が起動時に読み込んでもよい。または、クラスタ1、2、…、nがグリッド100に参加する際に、クラスタマネージャ1a、2a、…、naがグリッドマネージャ50aに対して参加要求を送信して知らせてもよい。ポインタとしては、たとえばTCP/IPプロトコルの場合はIPアドレスとポート番号が利用できる。
図2には、静的リソース情報格納手段1b、2b、…、nbに格納される静的リソース情報の例を示し、図3には、動的リソース情報測定手段1c、2c、…、ncによって測定される動的リソース情報の例を示す。それぞれの左の列がリソース情報名、右の列が対応する値を示す。
図2の静的リソース情報の例では、CPUの種類、CPUのクロック速度、OSの種類、RAM容量がそれぞれ記述されている。図2は一つのリソースについての記述であって、各リソース12、13、…、n2、n3についてそれぞれこのような静的リソース情報が静的リソース格納手段1b、2b、…、nbに格納されている。そして、リソース12
、13、…、n2、n3はそれぞれ一意な識別子で管理される。一意性の範囲は各クラスタ内であってもよいが、他のクラスタへ融通する際に識別子の変更を行なわずに済ませるためには全クラスタで一意な識別子とした方が望ましい。たとえばTCP/IPプロトコルで接続される計算機であれば、IPアドレスなどを全クラスタで一意な識別子として利用することができる。
図3の動的リソース情報の例では、CPU負荷、自クラスタへのホップ数がそれぞれ記述されている。動的リソース情報については、後で具体的に説明する。
次に、図1乃至図4を参照して、本実施形態のリソース探索方法を説明する。図4、は第1のリソース探索方法の動作を示すフローチャートである。図4の一番左の列は、他のクラスタからリソースを借りるクラスタ1のクラスタマネージャ1aの動作を示しており、その隣の列はグリッドマネージャ50aの動作を示している。グリッドマネージャ50aの右側の複数のクラスタマネージャは自分のリソースをクラスタ1に貸すクラスタ2、3、…、nのクラスタマネージャ2a、3a、…、naの動作を示している。
図4のリソース探索方法は二つのステップ、即ち候補クラスタ探索ステップS20と該当リソース探索ステップS30より成る。まず、候補クラスタ探索ステップS20を説明する。
クラスタ1のクラスタマネージャ1aは、静的リソース情報を設定したクラスタ探索要求をグリッドマネージャ50aに対して発行する。グリッドマネージャ50aは、自分が管理するクラスタのうち、クラスタ探索要求を発行したクラスタ1以外のリソース探索される側のクラスタ2、3、…、nのクラスタマネージャ2a、3a、…、naに前記ポインタを利用してクラスタ探索要求を転送する。
このクラスタ探索要求を受け取ったクラスタマネージャ2a、3a、…、naでは、それぞれの静的リソース情報格納手段2b、3b、…、nbを探索して、自クラスタ内の貸し出し可能なリソースの有無を判定する。この際、クラスタ探索要求の静的リソース情報に該当するリソースが無ければ貸し出し可能なリソースが無いことは勿論であるが、たとえクラスタ探索要求の静的リソース情報に該当するリソースが有っても、そのリソースを自クラスタで利用したいなどの理由でそれを貸し出し可能なリソースとしないとすることもできる。
このような判定の結果、貸し出し可能なリソースが存在するクラスタ2、3のクラスタマネージャ2a、3aは自クラスタが候補クラスタである旨、貸し出し可能なリソースが存在しないクラスタnのクラスタマネージャnaは候補クラスタでない旨の候補クラスタ情報をグリッドマネージャ50aに返す。本実施形態では、例としてクラスタ2、3、nに限定して候補クラスタ探索と該当リソース探索の動作を説明しており、他のクラスタの場合は説明の簡略化のためにその記載を省略している。
次に、グリッドマネージャ50aはクラスタマネージャ2a、3aから受け取った候補クラスタ情報を、クラスタ探索要求を発行したクラスタマネージャ1aに返す。
なお、グリッド100に非常に多くのクラスタが参加している場合で、自クラスタが候補クラスタでない場合には、候補クラスタ情報の送信を省略し、自クラスタが候補クラスタである場合にのみ候補クラスタ情報を送信するようにして、候補クラスタ情報による通信量および処理量を削減してもよい。
なお、図4では候補クラスタ情報はグリッドマネージャ50aを経由してクラスタ探索
要求を発行したクラスタマネージャ1aに送っているが、候補クラスタからクラスタ探索要求を発行したクラスタマネージャ1aへ直接候補クラスタ情報を送る構成としてもよい。
次に、クラスタマネージャ1aは、各クラスタマネージャ2a、3a、…、naからの候補クラスタ情報が揃うのを待つ。グリッド100内のクラスタの数があらかじめ分っていれば、クラスタ数分だけの候補クラスタ情報を待てばよいが、クラスタ数が不明な場合には、一定時間内に受け取った候補クラスタ情報のみを利用するタイムアウト方式なども可能である。特に、自クラスタが候補クラスタでない場合、候補クラスタ情報の送信を省略する方式を採用した場合には、タイムアウト方式が必須となる。
また、一定数の候補クラスタ情報を受け取った時点で待つのを打ち切るという方法を採ることで、全クラスタからの候補クラスタ情報が送られて来るまで待つことや、タイムアウトが生じるまで待つことを止め、高速化を図ることもできる。
なお、グリッドマネージャ50aが個別に候補クラスタ情報を送らず、候補クラスタ情報が揃ってから一括してクラスタ探索要求を発行したクラスタマネージャ1aに送るという方式も可能である。
以上の候補クラスタ探索ステップS20で候補クラスタ情報を受け取ったクラスタマネージャ1aは、該当リソース探索ステップS30に入る。
この該当リソース探索ステップS30の最初にクラスタマネージャ1aは、候補クラスタの全部または一部に対して、リソース探索要求を送信する。図4では、二つのクラスタ2、3が候補クラスタとなっているため、どちらのクラスタへもリソース探索要求が送信されているが、一般には候補クラスタとなっている一部のクラスタのみへリソース探索が送信される。
より多くの候補クラスタに対してリソース探索要求を送信することで、連続的な条件をより満たすリソースを見つけたい場合は、全部または多数の候補クラスタにリソース探索を送信すればよい。しかしながら、リソース探索の送信および処理のコストを重視する場合は、少数の候補クラスタにリソース探索要求を送信すればよい。
このリソース探索要求には、静的リソース情報に加えて、動的リソース情報が含まれる。リソース探索要求を受け取ったクラスタマネージャ2a、3aは、まずリソース探索要求の静的リソース情報を読み出して、クラスタ探索時と同様の方法で静的リソース情報格納手段2b、3bから自クラスタ内の該当するリソースを検索する。更に、クラスタマネージャ2a、3aは該当するリソースについて、自クラスタ内の動的リソース情報測定手段2c、3cによってリソース探索要求の動的リソース情報に記述された条件を満たすかどうかを判定する。
図3の動的条件のうち、CPUの負荷は時間経過によって変化する動的リソース情報である。これは、例えば動的リソース情報測定手段2cがOSに対してシステムコールを発行し、スケジューラ内の現在実行可能なプロセスまたはスレッドの個数、あるいはその一定時間範囲の平均値などを読み出すことによって測定できる。
図3のもう1つの動的条件である自クラスタへのホップ数(経路上のルータの個数)は、どのクラスタへの融通を行なうかによって変化する動的リソース情報である。ホップ数は、リソース探索要求を送信したクラスタマネージャ1aに対して自クラスタマネージャからICMP ECHOパケットを送るといった、既存のネットワーク測定方法を動的リソ
ース情報測定手段1c、2c、…、ncで実現することによって測定することができる。
自クラスタへのホップ数は、ネットワーク的距離を測定するために指定する動的リソース情報であるが、ネットワーク的距離の測定方法としてはこの他に、現在の空き帯域幅、応答時間(round trip time)などもあり、これらを動的リソース情報測定手段1c、2c、…、ncで測定して動的リソース情報として扱うこともできる。
リソース探索要求を受信したクラスタマネージャ2a、3aは、上記の方法で条件を満たすリソースの自クラスタ内での探索を行ない、該当するリソースの静的および動的リソース情報を該当リソース情報としてリソース探索要求を送信したクラスタマネージャ1aに送信する。
該当リソース情報を受け取ったクラスタマネージャ1aでは、該当するリソースのうち一つを選択する。連続的なリソース情報が条件に含まれている場合には、もっとも優れた該当リソース情報のリソースを選択する方法が一般的であるが、早く受け取った該当リソース情報のリソースを選択することや、任意のリソースを不作為に選択することもできる。
したがって、この本実施形態によれば、クラスタ探索によって絞り込んだクラスタを対象にリソース探索を行うため、クラスタ間リソース融通のためのリソース探索にかかる通信量と処理量を低減することができる。
次に、リソース探索方法の変形例について説明する。
図5は、第2のリソース探索方法の動作を示すフローチャートである。図5において、候補クラスタ探索ステップS20は図4の候補クラスタ探索ステップS20と同じであるので、その説明は省略する。
この第2のリソース探索では、該当リソース探索ステップS40が図4の該当リソース探索ステップS30と相違する。具体的には、該当リソース探索ステップS40は、クラスタマネージャ1aからの該当リソース探索要求をグリッドマネージャ50aが受信して、候補クラスタであるクラスタマネージャ2a、3aに配信する。そして、各クラスタマネージャ2a、3aによって探索された該当リソース情報をグリッドマネージャ50aを介してクラスタマネージャ1aに送信する。
図6は、第3のリソース探索方法の動作を示すフローチャートである。この第3のリソース探索方法では、図5の第2のリソース探索方法と同様に該当リソース探索ステップS50にもグリッドマネージャ50aが仲介を行っているが、どのクラスタから融通を行うかの決定にグリッドマネージャ50aが関与することが相違する。即ち、グリッドマネージャ50aがクラスタマネージャ2a、3aからの該当リソース情報を受信すると、その1つを選択してクラスタマネージャ1aに送信する。
上記した第2及び第3のリソース探索方法であっても、図4の第1のリソース探索方法と同様な効果を奏することができる。
(第2の実施形態)
図7は、第2の実施形態に係るクラスタシステムのグリッド200を示す。図7の全体構成は、グリッドマネージャが存在しない点以外、図1と同様である。多数のクラスタからなるグリッドの場合、第1の実施形態のようにリソース探索をグリッドマネージャ50aを経由して行なうと、グリッドマネージャ50aに負荷が集中して処理性能が低下してしまう場合がある。第2の実施形態では、このボトルネックを解消するため、グリッド2
00内にグリッドマネージャを設けず、クラスタマネージャ間の接続によるpeer−to−peer型のリソース探索を行なう。
以下に、第2の実施形態によるリソースの探索方法を、図8を参照して説明する。図8は、本実施形態におけるリソース探索動作を示すフローチャートである。図7と図8において、図1と同じ構成要素には同じ図面符号が付いている。
図8の候補クラスタ探索ステップS60において、リソースを借りる側(即ち、リソースを探索を行う側)のクラスタマネージャ1aは、他のクラスタマネージャ(ここでは、クラスタマネージャ2aとする。)に対して、図2と同様な静的リソース情報を付加してクラスタ探索要求を発行する。クラスタ探索要求を受け取ったクラスタマネージャ2aは、そのクラスタ探索要求を他のいくつかのクラスタマネージャ3aに、更にクラスタマネージャ3aはそのクラスタ探索要求を他のいくつかのクラスタマネージャnaに転送する。各クラスタマネージャ2a、3a、…、naは、静的リソース情報格納手段2b、3b、…、nbを検索して貸し出し可能なリソースがある場合、リソースありの候補クラスタをクラスタマネージャ1aに送信する。これ以後の処理は図4の該当リソース検索ステップS30と同様なステップが実行され、リソース情報の1つが選択される。
クラスタマネージャ1a、2a、…、na間をどのように接続してクラスタ探索要求の発行や転送を行なうかについては、既存のpeer−to−peerシステムの技術が利用できる。例えば、クラスタマネージャ1aが一定数の他のクラスタマネージャ2a、3a、…、naのポインタを保持しておけば、それらのクラスタマネージャ3a、…、naへクラスタ探索要求を発行または転送することができる。無限にクラスタ探索要求が転送されつづける問題を防ぐには、同じクラスタ探索要求を再び受け取った場合にそれを無視する方式や、クラスタ探索要求に生存期間(time to live)を付与しておき、クラスタ探索要求の転送回数に上限を設ける方式が利用できる。
本実施形態についても第1の実施形態と同様、自クラスタが候補クラスタでない場合には候補クラスタ情報の送信を省略し、自クラスタが候補クラスタである場合のみ候補クラスタ情報を送信するようにして、候補クラスタ情報による通信量および処理量を削減してもよい。
以上に説明した第2の実施形態によれば、第1の実施形態と同様な効果を奏する他、グリッドマネージャを設けることなくリソース探索を行なうことができる。このため、多数のクラスタからなるグリッドの場合、グリッドマネージャのボトルネックによる処理性能の低下を低減することができる。
(第3の実施形態)
図9は、第3の実施形態に係るクラスタシステムのグリッド300を示す。
この第3の実施形態では、クラスタ2,3、…、nの静的リソース情報を一括管理し、リソース探索を高速化する。
静的リソース情報は、ハードウェアの増設やOSの入れ替えなどのリソースへの大幅な改変が行なわれた場合にのみ変更される。このため、その変更頻度は低く、何日・何年も変更されないことも多い。そのため、複数のクラスタの静的リソース情報を一括管理することで、個々のクラスタマネージャへの問い合わせを省略して探索を高速化することが可能である。
本実施形態では、複数クラスタ静的リソース情報格納手段50bをグリッドマネージャ50aに配置し、クラスタ1、2、…、nの静的リソース情報格納手段1b、2b、…、
nbと併用する構成としている。
以下に、本実施形態によるリソース探索方法を、図10を参照して説明する。図10は、本実施形態におけるリソース探索方法を示すフローチャートである。図9と図10において、図1と同じ構成要素には同じ図面符号が付いている。
本実施形態では同じ静的リソース情報がクラスタ1、2、…、nの静的リソース情報格納手段1b、2b、…、nbとグリッドマネージャ50aの複数クラスタ静的リソース情報格納手段50bとに重複して格納される。このため、格納手段間で同じ情報の一貫性を確保するために、静的リソース情報の転送が必要になる。静的リソース情報は例えば一定時間ごとにクラスタ1、2、…、nの静的リソース情報格納手段1b、2b、…、nbからグリッドマネージャ50aの複数静的リソース情報格納手段50bに転送される。なお、リソース情報に更新日時を付与しておけば、前回の転送時から更新された情報のみを転送して、更新されていないリソースの転送を省略して転送量や処理量を減らすこともできる。
さらに、複数クラスタ静的リソース情報格納手段50bと静的リソース情報格納手段1b、2b、…、nbとで、単純に情報を重複させるのではなく、詳細なリソース静的リソース情報はクラスタ1、2、…、nの静的リソース情報格納手段1b、2b、…、3bにのみ格納し、複数クラスタ静的リソース情報格納手段50bにはその概要のみを格納する方法もある。
そして、候補クラスタ探索ステップ70では、クラスタマネージャ1aからのクラスタ探索要求をグリッドマネージャ50aが受信すると、複数クラスタ静的リソース情報格納手段50bを検索して貸し出し可能なリソースを見つけ候補クラスタ情報としてクラスタマネージャ1aに送信する。この後の該当リソース探索ステップは図4と同じであるので、その説明は省略する。なお、該当リソース探索ステップは図5のステップS40、図6のステップS50を実行してもよい。
以上説明した第3の実施形態によれば、第1の実施形態と同様な効果を奏する他、複数クラスタ静的リソース情報格納手段をグリッドマネージャに設けることにより、各クラスタへの静的リソースの検索を省略することができる。
(第4の実施形態)
図11は、第4の実施形態に係るクラスタシステムのグリッド400を示す。
第4の実施形態では、例えばグリッドマネージャ50aとクラスタマネージャ1a、2aの中間に上位クラスタマネージャ1000aを設け、その上位クラスタマネージャ1000aに複数クラスタ静的リソース情報格納手段1000bを配置して構成する。他の上位クラスタマネージャ2000a、…、M000aも同じ構成である。この上位クラスタマネージャ1000a、2000a、…、M000aは計算機1000、2000、…、M000内に設けられている。
第3の実施形態の場合、クラスタの数が非常に多くなると、全クラスタの静的リソース情報を一つのグリッドマネージャ50に定期的に転送して一つの複数クラスタ静的リソース情報格納手段50bに格納する処理がボトルネックとなり、処理性能が低下する場合がある。
この問題に対処するため、第4の実施形態ではグリッドとクラスタとの中間に上位クラスタという階層を設け、それぞれ上位クラスタマネージャ1000a、2000a、…、M000aを設置する。図11において、上位クラスタマネージャ1000a、2000
a、…、M000aには複数クラスタ静的リソース情報格納手段1000b、2000b、…、M000bが設けられ、上位クラスタに属する全クラスタのリソースの静的リソース情報が格納されている。上位クラスタマネージャとクラスタとの関係は、第3の実施形態におけるグリッドマネージャとクラスタとの関係と同様である。
グリッドマネージャ50aは、受け取ったクラスタ探索を各上位クラスタマネージャ1000a、2000a、…、M000aに転送する。クラスタ探索を受け取った上位クラスタマネージャ1000a、2000a、…、M000aは、複数クラスタ静的リソース情報格納手段1000b、2000b、…、M000bを用いて自上位クラスタ内の各クラスタに貸し出し可能リソースがあるかどうかを判定し、判定結果を候補クラスタ情報としてクラスタ探索を発行したクラスタマネージャに送る。
この第4の実施形態によれば、第1の実施形態と同様な効果を奏する他、上位クラスタを階層的に設けることにより分散したリソース探索を行なうことができる。
第1の実施形態に係るクラスタシステムの構成を示すブロック図である。 各実施形態に用いられる静的リソース情報の例を示す図である。 各実施形態に用いられる動的リソース情報の例を示す図である。 第1の実施形態に係る第1のリソース探索動作を示すフローチャート。 第1の実施形態の第2のリソース探索動作を示すフローチャート。 第1の実施形態の第3のリソース探索動作を示すフローチャート。 第2の実施形態に係るクラスタシステムの構成を示すブロック図である。 第2の実施形態のリソース探索動作を示すフローチャート。 第3の実施形態に係るクラスタシステムの構成を示すブロック図である。 第3の実施形態のリソース探索の動作を示すフローチャート。 第4の実施形態に係るクラスタシステムの構成を示すブロック図である。
符号の説明
1〜n クラスタ(計算機)
12、13、22、23、32、33、n2、n3 リソース(計算機)
1a〜na クラスタマネージャ
1b〜nb 静的リソース情報格納手段
1c〜nc 動的リソース情報測定手段
11、21、31、n1、50、1000、2000、M000 計算機
50a グリッドマネージャ
50b 複数クラスタ静的リソース情報格納手段
1000a〜M000a 上位クラスタマネージャ
1000b〜M000b 複数クラスタ静的リソース情報格納手段

Claims (13)

  1. 一つ以上のリソースを有するクラスタを複数備えたコンピュータシステムのリソース探索方法であって、
    リソース探索される各クラスタに設けられた自クラスタ内の前記リソースに関する静的リソース情報を格納する静的リソース情報格納手段を参照し、該リソース探索の要求による静的リソース情報の条件に該当するリソースを持っている一つ以上の候補クラスタを探索する候補クラスタ探索ステップと、
    前記候補クラスタに設けられた自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段によって測定された値を参照し、該リソース探索の要求による動的リソース情報の条件に該当するリソースを探索する該当リソース探索ステップと
    を備えることを特徴とするリソース探索方法。
  2. 前記該当リソース探索ステップは、前記動的リソース情報の条件に該当するリソースを探索する前に前記静的リソース情報格納手段を参照し、前記静的リソース情報の条件に該当するリソースを探索することを特徴とする請求項1に記載のリソース探索方法。
  3. 前記静的リソース情報はCPUの種類、CPUのクロック速度、OSの種類及びRAM容量の少なくとも一つ以上を含み、前記動的リソース情報はCPU負荷及び又はネットワーク経路のホップ数を含むことを特徴とする請求項1又は請求項2に記載のリソース探索方法。
  4. リソース探索するクラスタから前記複数のクラスタを管理するグリッドマネージャを介して前記リソース探索される各クラスタへ前記候補クラスタ探索ステップのクラスタ探索要求が発行されることを特徴とする請求項1又は請求項2に記載のリソース探索方法。
  5. リソース探索するクラスタから前記複数のクラスタを管理する上位クラスタマネージャを介して前記リソース探索される各クラスタへ前記候補クラスタ探索ステップのクラスタ探索要求が発行されることを特徴とする請求項1又は請求項2に記載のリソース探索方法。
  6. 一つ以上のリソースを有する複数のクラスタと前記複数のクラスタを管理するグリッドマネージャとを有するコンピュータシステムのリソース探索方法であって、
    リソース探索するクラスタから前記グリッドマネージャを介して送信されたクラスタ探索要求に応じて、リソース探索される各クラスタに設けられた自クラスタ内の前記リソースに関する静的リソース情報を格納する静的リソース情報格納手段を参照し、該リソース探索の要求による静的リソース情報の条件に該当するリソースを持っている一つ以上の候補クラスタを探索する候補クラスタ探索ステップと、
    前記リソース探索するクラスタから直接又は前記グリッドマネージャを介して送信された該当リソース探索要求に応じて、前記候補クラスタの前記静的リソース情報格納手段を参照して前記静的リソース情報の条件に該当するリソースを探索し、そのリソースの中で自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段によって測定された値を参照して、該リソース探索の要求による動的リソース情報の条件に該当するリソースを探索する該当リソース探索ステップと
    を備えることを特徴とするリソース探索方法。
  7. 一つ以上のリソースを有する複数のクラスタと前記複数のクラスタを管理するグリッドマネージャとを有するコンピュータシステムのリソース探索方法であって、
    前記グリッドマネージャに設けられた複数クラスタ静的リソース情報格納手段に前記複
    数のクラスタの静的リソース情報を格納するステップと、
    リソース探索するクラスタからのクラスタ探索要求に応じて、前記グリッドマネージャの前記複数クラスタ静的リソース情報格納手段を参照し、該リソース探索の要求による静的リソース情報の条件に該当するリソースを持っている一つ以上の候補クラスタを探索する候補クラスタ探索ステップと、
    前記リソース探索するクラスタからの該当リソース探索要求に応じて、前記候補クラスタに設けられた静的リソース情報格納手段を参照して前記静的リソース情報の条件に該当するリソースを探索し、そのリソースの中で自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段によって測定された値を参照して、該リソース探索の要求による動的リソース情報の条件に該当するリソースを探索する該当リソース探索ステップと
    を備えることを特徴とするリソース探索方法。
  8. 前記該当リソース探索ステップで複数のリソースが得られた場合、前記リソース探索するクラスタ又は前記グリッドマネージャが1つのリソースを選択することを特徴とする請求項6又は請求項7のリソース探索方法。
  9. 一つ以上のリソースを有するクラスタを複数備えたコンピュータシステムのリソース探索方法であって、
    リソース探索するクラスタからのクラスタ探索要求をリソース探索される各クラスタにシリアルに送信し、前記リソース探索される各クラスタに設けられた自クラスタ内の前記リソースに関する静的リソース情報を格納する静的リソース情報格納手段を参照し、該クラスタ探索探索要求による静的リソース情報の条件に該当するリソースを持っている一つ以上の候補クラスタを探索する候補クラスタ探索ステップと、
    前記リソース探索するクラスタから送信された該当リソース探索要求に応じて、前記候補クラスタの前記静的リソース情報格納手段を参照して前記静的リソース情報の条件に該当するリソースを探索し、そのリソースの中で自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段によって測定された値を参照して、該リソース探索要求による動的リソース情報の条件に該当するリソースを探索する該当リソース探索ステップと
    を備えることを特徴とするリソース探索方法。
  10. 一つ以上のリソースを有するクラスタを複数備えたコンピュータシステムの前記クラスタ間におけるリソース融通を制御するクラスタマネージャ装置であって、
    リソース探索対象の複数のクラスタマネージャ装置に対し静的リソース情報からなるクラスタ探索要求を発行し、前記クラスタ探索要求の条件に該当する一つ以上の候補クラスタ情報を受信する手段と、
    前記候補クラスタの前記クラスタマネージャ装置に対し動的リソース情報を含む該当リソース探索要求を発行し、前記該当リソース探索要求の条件に該当する一つ以上のリソース情報を受信する手段と
    を備えることを特徴とするクラスタマネージャ装置。
  11. 一つ以上のリソースを有するクラスタを複数備えたコンピュータシステムのクラスタマネージャ装置であって、
    自クラスタ内の前記リソースに関する静的リソース情報を格納する静的リソース情報格納手段と、
    自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段と、
    リソース探索するクラスタマネージャ装置から受信したクラスタ探索要求に応答して前記静的リソース情報格納手段を参照して該クラスタ探索要求による静的リソース情報の条
    件に該当するリソースがあるか否かを探索し、該当するリソースがある場合には候補クラスタの情報を前記リソース探索するクラスタマネージャ装置に通知し、前記リソース探索するクラスタマネージャ装置から受信した該当リソース探索要求に応答して前記静的リソース情報格納手段を参照して前記静的リソース情報の条件に該当するリソースを探索し、そのリソースの中で自クラスタ内の前記動的リソース情報測定手段によって測定した値を参照して、該リソース探索要求による動的リソース情報の条件に該当するリソースを探索して前記リソース探索するクラスタマネージャ装置へ送信する処理手段と
    を備えることを特徴とするクラスタマネージャ装置。
  12. 一つ以上のリソースを有する複数のクラスタと前記複数のクラスタを管理するグリッドマネージャとを有するコンピュータシステムのクラスタマネージャ装置であって、
    自クラスタ内の前記リソースに関する静的リソース情報を格納する静的リソース情報格納手段と、
    自クラスタ内の前記リソースに関する動的リソース情報を測定する動的リソース情報測定手段と、
    前記静的リソース情報格納手段に格納された静的リソース情報を定期的に前記グリッドマネージャに送信し、リソース探索するクラスタマネージャ装置と前記グリッドマネージャとの交信により候補クラスタとなった場合に、前記リソース探索するクラスタマネージャ装置から受信した該当リソース探索要求に応答して前記静的リソース情報格納手段を参照して、該リソース探索要求による静的リソース情報の条件に該当するリソースを探索し、そのリソースの中で自クラスタ内の前記動的リソース情報測定手段によって測定した値を参照して動的リソース情報の条件に該当するリソースを探索して前記リソース探索する側のクラスタマネージャ装置へ送信する処理手段と
    を備えることを特徴とするクラスタマネージャ装置。
  13. 前記静的リソース情報格納手段には、CPUの種類、CPUのクロック速度、OSの種類、及びRAM容量の少なくとも一つ以上を含み、前記動的リソース情報は、CPU負荷及び又はネットワーク経路のホップ数を含むことを特徴とする請求項10乃至請求項12のいずれか1項に記載のクラスタマネージャ装置。
JP2004043983A 2004-02-20 2004-02-20 探索要求送信装置およびプログラム Expired - Fee Related JP3944176B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004043983A JP3944176B2 (ja) 2004-02-20 2004-02-20 探索要求送信装置およびプログラム
US10/995,172 US20050188191A1 (en) 2004-02-20 2004-11-24 Resource discovery method and cluster manager apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004043983A JP3944176B2 (ja) 2004-02-20 2004-02-20 探索要求送信装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2005234931A true JP2005234931A (ja) 2005-09-02
JP3944176B2 JP3944176B2 (ja) 2007-07-11

Family

ID=34858033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004043983A Expired - Fee Related JP3944176B2 (ja) 2004-02-20 2004-02-20 探索要求送信装置およびプログラム

Country Status (2)

Country Link
US (1) US20050188191A1 (ja)
JP (1) JP3944176B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006040084A (ja) * 2004-07-29 2006-02-09 Nec Corp 資源情報収集配信方法およびシステム
JP2010282533A (ja) * 2009-06-08 2010-12-16 Mitsubishi Electric Corp 計算機システム、計算機リソース制御方法および計算機リソース制御プログラム
JP2011028408A (ja) * 2009-07-23 2011-02-10 Fujitsu Ltd 仮想マシン移動制御プログラム,仮想マシン移動制御方法および仮想マシン移動制御装置
WO2013018288A1 (ja) * 2011-08-04 2013-02-07 日本電気株式会社 計算機およびリソース検索方法
US8751653B2 (en) 2005-12-28 2014-06-10 Fujitsu Limited System for managing computers and pieces of software allocated to and executed by the computers
JP2015515037A (ja) * 2012-02-15 2015-05-21 アルカテル−ルーセント 機械学習を採用するメディア・コンポーネントをマップするための方法
WO2017109863A1 (ja) * 2015-12-22 2017-06-29 株式会社日立製作所 リソース融通装置、スケジュール管理装置およびリソース融通システム
JP2020510938A (ja) * 2017-03-15 2020-04-09 セールスフォース ドット コム インコーポレイティッド 計算ノード管理プロトコルのためのシステムおよび方法
CN112199188A (zh) * 2019-07-08 2021-01-08 富士通株式会社 非暂态计算机可读记录介质、信息处理的方法和设备
JP7195558B1 (ja) 2022-03-25 2022-12-26 AI inside株式会社 プログラム、サーバ、システム及び方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155393A (ja) * 2004-11-30 2006-06-15 Toshiba Corp サーバ融通装置、サーバ融通方法およびサーバ融通プログラム
FR2925187B1 (fr) * 2007-12-14 2011-04-08 Commissariat Energie Atomique Systeme comportant une pluralite d'unites de traitement permettant d'executer des taches en parallele,en mixant le mode d'execution de type controle et le mode d'execution de type flot de donnees
US9672167B2 (en) * 2013-07-22 2017-06-06 Futurewei Technologies, Inc. Resource management for peripheral component interconnect-express domains
US10210027B1 (en) * 2015-09-17 2019-02-19 EMC IP Holding Company LLC Cluster management
US20180046338A1 (en) 2016-08-12 2018-02-15 Liqid Inc. Disaggregated Fabric-Switched Computing User Interfaces
US10180924B2 (en) 2017-05-08 2019-01-15 Liqid Inc. Peer-to-peer communication for graphics processing units
EP3959860A4 (en) 2019-04-25 2023-01-25 Liqid Inc. MULTI-PROTOCOL COMMUNICATION CONTROL FOR TISSUE
US11442776B2 (en) 2020-12-11 2022-09-13 Liqid Inc. Execution job compute unit composition in computing clusters

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2377649C (en) * 2002-03-20 2009-02-03 Ibm Canada Limited-Ibm Canada Limitee Dynamic cluster database architecture
US7562143B2 (en) * 2004-01-13 2009-07-14 International Business Machines Corporation Managing escalating resource needs within a grid environment
US7406691B2 (en) * 2004-01-13 2008-07-29 International Business Machines Corporation Minimizing complex decisions to allocate additional resources to a job submitted to a grid environment
US7552437B2 (en) * 2004-01-14 2009-06-23 International Business Machines Corporation Maintaining application operations within a suboptimal grid environment

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006040084A (ja) * 2004-07-29 2006-02-09 Nec Corp 資源情報収集配信方法およびシステム
US8751653B2 (en) 2005-12-28 2014-06-10 Fujitsu Limited System for managing computers and pieces of software allocated to and executed by the computers
JP2010282533A (ja) * 2009-06-08 2010-12-16 Mitsubishi Electric Corp 計算機システム、計算機リソース制御方法および計算機リソース制御プログラム
JP2011028408A (ja) * 2009-07-23 2011-02-10 Fujitsu Ltd 仮想マシン移動制御プログラム,仮想マシン移動制御方法および仮想マシン移動制御装置
WO2013018288A1 (ja) * 2011-08-04 2013-02-07 日本電気株式会社 計算機およびリソース検索方法
JP5672386B2 (ja) * 2011-08-04 2015-02-18 日本電気株式会社 計算機およびリソース検索方法
JP2015515037A (ja) * 2012-02-15 2015-05-21 アルカテル−ルーセント 機械学習を採用するメディア・コンポーネントをマップするための方法
US9684706B2 (en) 2012-02-15 2017-06-20 Alcatel Lucent Method for mapping media components employing machine learning
WO2017109863A1 (ja) * 2015-12-22 2017-06-29 株式会社日立製作所 リソース融通装置、スケジュール管理装置およびリソース融通システム
JPWO2017109863A1 (ja) * 2015-12-22 2017-12-21 株式会社日立製作所 リソース融通装置、スケジュール管理装置およびリソース融通システム
US11393050B2 (en) 2015-12-22 2022-07-19 Hitachi, Ltd. Resource accommodation device, schedule management device, and resource accommodation system
JP2020510938A (ja) * 2017-03-15 2020-04-09 セールスフォース ドット コム インコーポレイティッド 計算ノード管理プロトコルのためのシステムおよび方法
JP7113840B2 (ja) 2017-03-15 2022-08-05 セールスフォース ドット コム インコーポレイティッド 計算ノード管理プロトコルのためのシステムおよび方法
CN112199188A (zh) * 2019-07-08 2021-01-08 富士通株式会社 非暂态计算机可读记录介质、信息处理的方法和设备
JP7310378B2 (ja) 2019-07-08 2023-07-19 富士通株式会社 情報処理プログラム、情報処理方法、および情報処理装置
JP7195558B1 (ja) 2022-03-25 2022-12-26 AI inside株式会社 プログラム、サーバ、システム及び方法
WO2023181584A1 (ja) * 2022-03-25 2023-09-28 AI inside株式会社 プログラム、サーバ、システム及び方法
JP2023142469A (ja) * 2022-03-25 2023-10-05 AI inside株式会社 プログラム、サーバ、システム及び方法

Also Published As

Publication number Publication date
US20050188191A1 (en) 2005-08-25
JP3944176B2 (ja) 2007-07-11

Similar Documents

Publication Publication Date Title
JP3944176B2 (ja) 探索要求送信装置およびプログラム
EP2656215B1 (en) Scheduling and management in a personal datacenter
US8087025B1 (en) Workload placement among resource-on-demand systems
US20050188087A1 (en) Parallel processing system
JP4569846B2 (ja) I/oノード制御方式及び方法
US8997109B2 (en) Apparatus and method for managing data stream distributed parallel processing service
US8977756B2 (en) SWAN: achieving high utilization in networks
CN100465901C (zh) 网络系统、管理计算机以及集群管理方法
KR20130118593A (ko) 데이터 분산 서비스를 위한 미들웨어에서 데이터를 처리하기 위한 장치 및 방법
JP2012226427A (ja) リソース管理方法及び計算機システム
CN113382077B (zh) 微服务调度方法、装置、计算机设备和存储介质
CN102360314A (zh) 一种数据中心资源管理系统和方法
JPWO2005116832A1 (ja) 分散処理環境におけるジョブの実行を制御するためのコンピュータシステム、方法及びプログラム
JP2016051446A (ja) 計算機システム、計算機、負荷分散方法及びそのプログラム
JP4097274B2 (ja) リソース探索方法、クラスタシステム、計算機、及び、クラスタ
US10824640B1 (en) Framework for scheduling concurrent replication cycles
EP4323881A1 (en) Geographically dispersed hybrid cloud cluster
Medhi et al. Openflow-based multi-controller model for fault-tolerant and reliable control plane
Adam et al. A service middleware that scales in system size and applications
US9747131B1 (en) System and method for variable aggregation in order for workers in a data processing to share information
JP2005339079A (ja) データベース管理システムにおける処理代行方法
JP5601473B2 (ja) 共有資源管理システム及び共有資源管理方法
Raman et al. GEMS: Gossip-enabled monitoring service for heterogeneous distributed systems
Zhang et al. Towards a scalable and energy-efficient resource manager for coupling cluster computing with distributed embedded computing
Huo et al. Research on performance optimization of virtual data space across WAN

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060606

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070406

LAPS Cancellation because of no payment of annual fees