JPH10507024A

JPH10507024A - 分配されたアプリケーションの負荷分配支援ツール

Info

Publication number: JPH10507024A
Application number: JP8518321A
Authority: JP
Inventors: シトボン，ジエラール; ユルバン，フランソワ; サリバ，テレーズ
Original assignee: ブル・エス・アー
Priority date: 1994-11-30
Filing date: 1995-11-17
Publication date: 1998-07-07
Also published as: EP0715257B1; DE69521271D1; EP0715257A1; US5993038A; FR2727540B1; WO1996017297A1; USRE37811E1; FR2727540A1

Abstract

(57)【要約】各機器に負荷を配分するための、情報処理システム（ＳＩＤ）の機器（ＭＣ０〜ＭＣ３）上で実行されるツール（ＯＲＣ）であって、多数のＤＡＥＭＯＮを備えており、そのうちの一つはマスタ（ＭＳ０）で、その他はエージェント（Ａ１〜Ａ３）であり、マスタ（ＭＳ０）とエージェント（Ａ１〜Ａ３）は、それらが実行されている機器の負荷をそれぞれ計算する手段（ＭＣＣ０〜ＭＣＣ３）と、マスタとエージェントの負荷のデータの記憶手段（ＭＰ０〜ＭＰ３）を有しており、マスタ（ＭＳ０）は、各エージェントの負荷データの収集手段（ＭＲＣ０〜ＭＲＣ３）と、各エージェントに他のエージェントの負荷データを送信する手段（ＭＴＣ０）を備えており、各エージェント（Ａ１〜Ａ３）は、他のエージェントの負荷データを受信する手段（ＭＲＣＣ１〜ＭＲＣＣ３）を備えていることを特徴とするツール。分散型情報処理システムに適用することができる。

Description

【発明の詳細な説明】分配されたアプリケーションの負荷分配支援ツール本発明は、ローカルネットワークにおいて分散された情報処理システムに属する複数の機器上に分配されるアプリケーションの負荷の分配の支援ツールに関するものである。情報処理システムの現在の開発傾向は、たとえば、ローカルタイプのネットワークを介して互いに接続されている多数の機器を結び付けることによってこのようなシステムを形成するといったものである。すべてのユーザは、これらの機器の組の上で、きわめて多種多様なタイプのアプリケーションを実行している。これらのアプリケーションは、それらが処理する問題の実施に必要な情報を提供するサービスに頼っており、そうしたサービスはこれらの機器の全部あるいは一部によって与えられている。実行中のアプリケーションが、通常の実行において特定のサービスの利用を必要とする場合、それは以下の要領で行われる。 − このサービスを提供してくれる機器をまったくアトランダムに選択し、その機器にこのジョブを任せる。 − あるいはまた、あらゆる機器の中からローテーションで選択する。すなわち、常に同じ順番で、次々に必要となるサービスを提供するというジョブを順番に任せる。このように、システムが３台の機器をもっている場合には、時間的に最初に必要なったサービスの提供をＮｏ．１の機器に、二番目に必要となったサービスの提供をＮｏ．２の機器に、三番目に必要となったサービスの提供をＮｏ．３の機器に任せる。その後はまた順番にＮｏ．１、Ｎｏ．２、Ｎｏ．３、Ｎｏ．１というように使用していく。上記のいずれの場合であっても、どの機器のジョブも時間的に最適化されることはなく、その一方で、伝送量と性能に関する各機器の可能性は、最大レベルをはるかに下回る形でしか使用されない。これらの欠点を解消することができる解決策が知られている。その一つは、１９９４年７月１３日に出願されたフランス特許出願第９４０８７６４号において、出願人である当社によって、「多数のサーバを有するオープンな情報処理システム」というタイトルで記載されている方法である。クライアントと呼ばれる中央システムと複数のサーバを結び付けることによって形成されるこのようなシステムにおいては、各サーバは、クライアント上で実行する各アプリケーションに固有の基準にしたがって、固有の負荷と、時間的に予測可能なその推移を計算し、これらの二つのファクタをクライアントに伝送する。クライアントは、定められたアプリケーションがサーバのサービスを要求すると、サービスが行われなければならない時間中に負荷が最も小さいサーバを選択し、そのサーバに、要求されたサービスの提供ジョブを任せる。本発明は、上記の解決策を改良し、一般化したものである。本発明によると、ローカルネットワークにおいて分散された情報処理システムの機器上で実行する分配されたアプリケーションに役立つ、各機器上に負荷を分配するためのツールは、機器上で実行するＤＡＥＭＯＮと呼ばれる多数の情報処理モジュールを有しており、そのうちの一つはマスタと呼ばれ、その他はエージェントと呼ばれ、 − マスタとエージェントはそれぞれ、所定のサンプリングの最初の瞬間に、それらが実行する機器の負荷を計算する手段と、マスタとエージェントの負荷データを記憶する手段を有しており、 − マスタは、 − 所定のサンプリングの第２の瞬間に各エージェントのロードデータを収集する手段と − 各エージェントに他のエージェントの負荷データを送信する手段を備えており、 − 各エージェントは − 他のエージェントの負荷データの受信手段を備えており、 − アプリケーションに最も近いローカルエージェントが、アプリケーションの要求に基づいて、最も負荷が小さい機器を指定し、その結果アプリケーションは必要なサービスの実行をこの機器に要求することを決定することを特徴としている。本発明の他の特徴及び利点は、添付の図面を参照して限定的でない例として示した下記の説明から明らかになるであろう。これらの図は： − 第１図は、本発明による負荷分配支援ツールを備えた分散型情報処理システムを示す図であり、 − 第２図は、本発明による負荷分配支援ツールを構成する各エレメント間でマスタとエージェントの役割を配分するオートマトンを示す図である。１）本発明によるツールの主な特徴Ａ）構造本発明による分散型情報処理システムにおける負荷の分配支援ツールＯＲＣ（ｌｏａｄｂａｌａｎｃｉｎｇｔｏｏｌｋｉｔ）−簡略化するために、以下の本文では「支援ツール」と呼ぶ−の特徴的な各主要エレメントは第１図に示されている。第１図に示すように、何らかのタイプの分散型情報処理システム（ここではＳＩＤと呼ぶ）は、何らかのタイプ及びサイズの４台の情報処理機器ＭＣ０、ＭＣ１、ＭＣ２、ＭＣ３を有している。これらの機器−小型、中型、大型コンピュータは、通常のエレメント、すなわち、ＣＰＵ（中央処理装置）と呼ばれる１台または複数の中央プロセッサ、それらに接続されたメモリ、入出力（Ｉ／Ｏ）装置、ネットワークＲＥへの接続手段を備えている。第１図では、このネットワークは、４台の機器ＭＣ０からＭＣ３間のデータのリンクを表す双方向の矢印で記号的に示されている。いわゆる支援ツールＯＲＣは、マスタＭＳ０と三つのエージェントＡ１、Ａ２、Ａ３を有している。エージェントはすべて、以下に説明する条件によって、マスタとなることもできる。マスタもエージェントも同じように、ＤＡＥＭＯＮという名で技術者に知られている情報処理ツールで構成される。一つのＤＡＥＭＯＮは、一つの問題に答えることができる一つの情報処理ツールであるか、または１台の機器上で実行される単位である。各機器ＭＣ０からＭＣ３の内部では、ＤＡＥＭＯＮＭＳ０、Ａ１、Ａ２、Ａ３がそれぞれ、分割されたメモリＭＰ０、ＭＰ１、ＭＰ２、ＭＰ３に関連付けられている。各メモリは、対応する機器の負荷だけでなくＳＩＤの他の機器の負荷も含んでいる。第１図では、分配されたアプリケーションが機器ＭＣ２上で実行され、その結果、他の機器ＭＣ０、ＭＣ１、ＭＣ３によって提供されるサービスを要求すると仮定している。このアプリケーションはＡＰＵと名付けられる。マスタとエージェントが局在している場所は、ＡＰＵが実行されている場所からは独立している。Ｂ）動作ＳＩＤシステムのあらゆる機器間の通信が確立すると、ＭＳ０がマスタになり、Ａ１、Ａ２、Ａ３がエージェントになると仮定して、ツールＯＲＣの動作のアウトラインは以下のようになる。第１図、特に、一方ではマスタとエージェント間に行き交う情報の流れの方向、もう一方では動作のシーケンスを示す矢印とそれらに付随する丸で囲んだ数字をそれぞれ常に参照する。動作１：各エージェントとマスタは、実行中の機器について、所定のサンプリングの最初の瞬間を構成する一定の時間間隔ｔｉで、その機器の負荷データを収集する。これは、その負荷を構成する各エレメント（ＣＰＵの負荷、関連するメモリの負荷、入出力の負荷、ネットワークの負荷等々）について行われる。各エレメントの最大許容負荷のパーセンテージで表されている各エレメントの負荷から、当該の機器の合計負荷を計算する。これはそれぞれ、ＭＳ０についてはＭＣＣ０、Ａ１についてはＭＣＣ１、Ａ２についてはＭＣＣ２、Ａ３についてはＭＣＣ３といった負荷の計算手段によって実行される。これらの手段は、単に、下記の第２項「各エージェントによる負荷の計算方法」で説明する負荷の計算方法を実施した計算プログラムによって構成されている。これらの手段は、必然的に、マスタとエージェント、ＭＳ０、Ａ１、Ａ２、Ａ３の各々の一部を構成しているので、簡略化するために第１図ではそれら自体は表されていない。当該の機器の合計負荷が計算されると、その結果、前記機器の負荷に関する統計的データ全体、すなわちＤＳＣが得られる。第１図では、わかりやすくするために、エージェントＡ２についてのこの動作しか表されていない。動作２：エージェントは、規則正しい間隔で、ネットワークを介して（Ａ２については、ＭＣ２とＭＣ０の間のリンクＬ２を介して）対応する機器の負荷の統計的データをＭＳ０に送る。動作３：マスタＭＳ０は、実際に、動作２について定められた規則正しい間隔で、つまり所定のサンプリングの第２の瞬間Ｔｉを構成する間隔で、あらゆるエージェントの負荷のあらゆる統計的データと、ＭＳ０に関連する分割されたメモリ、ここではＭＰ０のレベルでの自らの負荷データを集中させる。この集中化は、事実上、負荷データの収集動作である。したがって、これはそれぞれ、ＭＳ０についてはＭＲＣ０、Ａ１についてはＭＲＣ１、Ａ２についてはＭＲＣ２、Ａ３についてはＭＲＣ３といった負荷データの収集手段によって行われる。これらの手段は事実上、マスタ及び各エージェントＡ１からＡ３中に組込まれた収集プログラムであり、簡略化するために、第１図には表されていない。動作４：マスタＭＳ０は、送信手段ＭＴＣ０によって、ネットワークＲＥを介して、すなわち、ＭＣ０とＭＣ１間はＬ１、ＭＣ０とＭＣ２間はＬ２、ＭＣ０とＭＣ３間はＬ３といったリンクを介して、これらの全データを各エージェントＡ１、Ａ２、Ａ３に送信する。ＭＴＣ０はＭＳ０の一部を構成しているので、簡略化するために第１図には表されていない。動作５：各エージェントはこれらの負荷データを受取り、Ａ１についてはＭＰ１、Ａ２についてはＭＰ２、Ａ３についてはＭＰ３といった、関連する分割されたそれぞれのメモリ中でそれらをコピーする。これは、それぞれＡ１からＡ３のための手段ＭＲＣＣ１からＭＲＣＣ３によって実行される。これらの手段はＡ１からＡ３の一部を構成しているので、簡略化するために第１図には表されていない。動作６：アプリケーションＡＰＵは、定められたサービスを受けることが必要になる瞬間に、各機器について推定された負荷をリサーチし、そこからその瞬間に最も負荷の小さい機器を推論し、このサービスを提供するようにその機器に要求するために、実行中の機器の分割されたメモリを検索することになる。２）各エージェントによる負荷の計算方法ＣＰＵ、メモリ、入出力、ネットワークＲＥといったエレメントについての負荷の一例について説明する。ＭＣＣ０からＭＣＣ３の各手段による負荷の計算方法の説明は、本文末尾の付録１に記されている表１から４を参照して行う。これらの表においては負荷はパーセンテージで表されている。エージェント及びマスターについての負荷計算は前記引用の出願に記載されたものと同じである。これを以下に要約して示す。あるエージェント（同様にマスタ）の合計負荷Ｗｔは以下の式によって得ることができる。Ｗｔ＝ｋ１＊Ｗ１＋ｋ２＊Ｗ２＋ｋ３＊Ｗ３＋ｋ４＊Ｗ４この式において： − Ｗ１は、エージェントの中央処理装置の時間における使用のパーセンテージである。 − Ｗ２は、エージェントのメモリの使用のパーセンテージ、すなわち、実際に使用されるメモリ容量とメモリの合計容量の比である。 − Ｗ３は、エージェントによるネットワークの使用パーセンテージ、すなわち、エージェントが送信及び受信した情報数と、ネットワーク上の最大許容伝送量の比である。 − Ｗ４はエージェントによる入出力装置の使用パーセンテージである。 − ｋ１、ｋ２、ｋ３、ｋ４は、中央処理装置、メモリ、ネットワーク、入出力装置の固有重み付け係数である。それらの合計は１になる。またそれらの値は、実行中のアプリケーションの種類、ここでは機器ＭＣ２上のＡＰＵによって左右される。付録１の各表で見ることができるように、時間Ｔの定められたサンプリングの期間ｔ１、ｔ２、ｔ３、ｔ４、ｔ５、ｔ６、ｔ７（実際は、動作１の説明の際に上述した瞬間ｔｉ）において、負荷Ｗ１、Ｗ２、Ｗ３、Ｗ４が測定され、Ｗｔが計算される。表１は、ｔ１からｔ７のすべての瞬間において、いずれかのエージェント、たとえばＡ１によって収集される、対応する機器ＭＣ１に関連する負荷データの一例を示している。これらのデータは、当然のことながら、ＭＳ０に送られる前に、Ａ１が実行中の機器ＭＣ１の分割されたメモリＭＰ１の中に記憶される。したがって、この表においては、たとえばＷ１は瞬間ｔ１において３５、Ｗ２は瞬間ｔ４において６７、Ｗ３は瞬間ｔ６において３８、Ｗ４は瞬間ｔ７について３２であると見ることができ、以下同様である。次に、ＭＣ２上で実行するＡＰＵに関連する計算プログラムＡＰＩは、−動作３を実行した後に、ＭＳ０に結びついたＭＣ０の分割されたメモリＭＰ０中に含まれる各エージェントとマスタの負荷データについて−アプリケーションＡＰＵに対して、対応する機器の固有重み付け係数ｋ１からｋ４を適用する。このとき表２が得られるが、この表は、瞬間ｔ１からｔ７における各機器ＭＣ０からＭＣ４について全体的負荷のデータの値Ｗｔを示している。このように、ＭＣ０については、ＷＴは瞬間ｔ１において５６、ｔ２においては３２、ｔ３については６７等々であると見ることができる。ＭＣ１については、Ｗｔはｔ１においては２３、ｔ２については３４等々であり、他の機器についても同様である。あらゆる機器について、負荷計算の次の段階は、最小２乗法という従来の数学的方法を用いて、外挿によって、瞬間ｔ８＝（ｔ７＋Ｔ）における負荷Ｗｔの値を推定することである。この結果表３が得られる。この表ではたとえば、この瞬間ｔ８におけるＭＣ０からＭＣ３の負荷の推定値は、それぞれ７３、８２、３６、７６であると見ることができる。次に、以下の式に従って、各機器の実際に使用可能な負荷率Ｃ１を得るために、その機器に特有の出力係数Ｃｐを、各機器の合計負荷に適用する。Ｃ１＝（１００−Ｗｔ（推定値））＊Ｃｐ実際に、機器を構成している出力、サイズ、タイプが異なる種々雑多な情報処理環境が考えられることから、各機器の特徴を考慮に入れることが重要である。たとえば、ある機器がほとんど負荷がない場合、しかも同時に、所与の瞬間に、アプリケーションＡＰＵが要求するサービスを実行するための処理能力が不十分である場合には、そのサービスは他の機器によって行われなければならないのは当然である。ここから、負荷を定め、その結果、出力係数Ｃｐのこの影響に対応する存在を定める補正係数が必要となる。所与の機器の係数Ｃｐは、中央処理装置ＣＰＵの出力、メモリの容量、入出力装置の処理能力、等々を合成することによって計算される。機器のハードの構成を変えるたびに、あるいはそのオペレーティングシステムを変更するたびに、この係数は計算し直される。同様に、分散型情報処理システムＳＩＤの一般的コンフィギュレーションが変わるたびに、このシステムのあらゆる機器の係数Ｃｐが再び定められる。Ｃｐが１である場合は、ユーザによって定められた中型タイプの機器に対応する。表４では、各機器ＭＣ０からＭＣ３の各々について使用可能な実際の負荷率Ｃ１の例を見ることができる。このように、ＭＣ０については、推定負荷率が７３で、出力係数Ｃｐが２．５のとき、使用可能な実際の負荷率は６７．５となる。ＭＣ１についてのこれらと同じ数字は、それぞれ、８２、２、３６であり、ＭＣ２とＭＣ３についても同様である。３）マスタＭＳ０の選択方法どの機器であっても、その上で実行するあらゆるＤＡＥＭＯＮがマスタになれるというのが基本的な考え方である。したがって、一方では、どの機器がマスタになるか、またその選択条件を定めることができるメカニズムと、もう一方では、支障が起きた場合にはマスタになる機器を交換する手順を作成することが重要である。選択のメカニズムは、少なくとも一つのＤＡＥＭＯＮが実行中であること、ならびにそのうちの２台のＤＡＥＭＯＮが同時にマスタにはなれない（特に、それらの同じ瞬間に始動する場合）ことを保証しなければならない。このメカニズムは以下の五つの大まかな段階から構成される。第１段階：一つのＤＡＥＭＯＮが始動すると、それはネットワークＲＥ上で使用されているプロトコルに合致した、たとえば、ここで述べている本発明の実施の形態において使用されているプロトコルＴＣＰ−ＩＰに合致した単一識別子ＴＤをつくりだす。この識別子は、イーサネットアドレス（イーサネットは、ここで述べられている実施の形態において使用されるローカルネットワークに関連するプロトコルＴＣＰ−ＩＰの一部であり、当然のことながら、規格化されているので、当業者に良く知られている）と、識別子の送信の瞬間と、ランダムな値によって構成されている。それと同時に、この識別子は中間的状態に置かれ、ネットワークＲＥのあらゆる機器に向けて、このネットワーク上に二つの情報（識別子の現在の状態、ＩＤ）を送る。第２段階：このＤＡＥＭＯＮが、定められた時間間隔Ｔｒの間（約５から１０秒）、他のＤＡＥＭＯＮから同じ情報が来るのを待つ。このＤＡＥＭＯＮがマスタの候補となる。第３段階：他のＤＡＥＭＯＮからの情報を受取るとすぐに、以下のように分析する。 − それらの情報が、事実上マスタである、すなわちＭＳ０とみなされるＤＡＥＭＯＮから来たものである場合には、このＤＡＥＭＯＮはエージェントとみなされる。 − それらの情報が中間状態にあるＤＡＥＭＯＮから来たものである場合には、識別子を比較する。つまり自分の識別子と受取った識別子を比較する。 − 自分の識別子が受取った識別子より小さい場合には、そのＤＡＥＭＯＮはマスタＭＳ０になる権利をもち続ける。 − 自分の識別子が受取った識別子に等しい、またはそれより大きい場合には、そのＤＡＥＭＯＮはマスタの地位を譲る。このとき、前記の二つの情報（自分のＩＤ、自分の状態）を再び送り、改めて、タイマと呼ばれる前記時間間隔Ｔｒの間に、応答を待つ。第４段階：この時間間隔が経過してしまうと、当該のＤＡＥＭＯＮが改めてトライする。これは、メッセージロスを防ぐために、常にネットワークＲＥ上で行うことが可能であり、以下の手順が用いられる。 − 応答の送信及び聴取が５回繰り返される。 − 当該のＤＡＥＭＯＮが、エージェントであることが明らかになった他のＤＡＥＭＯＮの応答を受取った場合には、マスタＭＳ０が存在することを確信し、そのマスタから送られてくる応答を待つ。第５段階：５回繰り返されても、当該のＤＡＥＭＯＮが、他のＤＡＥＭＯＮからいかなる応答も受取らなかった場合には、自分がマスタＭＳ０になることを決定する。三つのエージェントＡ１からＡ３のいずれか一つが、マスタＭＳ０がもはや連絡して来ないと気づいたら、それら三つの中から新しいマスタを選出するためあらゆる段階において上記の手順を開始する。さらに、マスタは定期的に、ＳＩＤシステムのあらゆる機器に対してその存在を知らせる。マスタが他のマスタの存在を検出した場合には、ＩＤが最も小さいマスタによって手順が再開される。第２図は、ＳＩＤの機器上を実行する各ＤＡＥＭＯＮ間におけるマスタとエージェントの役割分配のオートマトンＡＵＴを示しているが、この図によって、上述の第１段階から第５段階の各々の連続性が良く分かるであろう。このオートマトンＡＵＴは以下の五つの状態を有する。 − 状態Ｉ０：当該のＤＡＥＭＯＮが前記の二つの情報（自分のＩＤ、自分の状態）を送信する。これは、第１段階に対応している。 − 状態Ｉ１：前記ＤＡＥＭＯＮが他のＤＡＥＭＯＮからの応答を聴取する。これは第２及び第３段階に対応している。 − 状態Ｉ２：前記ＤＡＥＭＯＮが、定められた時間Ｔｒが経過すること、及びマスタＭＳ０からのありうる応答を待っている。 − 状態Ａ：当該のＤＡＥＭＯＮがエージェントＡ１、Ａ２もしくはＡ３になる。 − 状態Ｍ：当該のＤＡＥＭＯＮがマスタＭＳ０になる。このオートマトンに対応するイベントは、ｅ１からｅ８と名付けられ、以下の通りである。 − ｅ１：当該のＤＡＥＭＯＮが自分のＩＤと自分の状態を伝送し、時間Ｔｒを定めた。 − ｅ２：ＩＤの受信、ローカル識別子ＩＤ（当該のＤＡＥＭＯＮの識別子）が、受取った識別子より小さい。 − ｅ３：ＩＤの受信、ローカル識別子ＩＤ（当該のＤＡＥＭＯＮの識別子）が、受取った識別子と等しい、またはそれより大きい。 − ｅ４：時間Ｔｒが経過した。 − ｅ５：時間Ｔｒが経過し、トライの数が５回以下である。あるいはまた、一つのエージェントが応答してきた。 − ｅ６：マスタが応答してきた。 − ｅ７：時間Ｔｒが経過し、トライ数が５回になったが、いかなるエージェントからも応答がない。 − ｅ８：マスタとの接続がなくなった。 − ｅ９：一つのマスタによって、よりＩＤが高い他のマスタの存在が検出された。

【手続補正書】特許法第１８４条の８第１項【提出日】１９９６年９月２日【補正内容】同様に、ローカルネットワークにおける分散型の情報処理システムの機器上を実行する分配されたアプリケーションに役立ち、それらの機器の各々に負荷を分配するためのツールが知られており、技術文献ＪＯＵＲＮＡＬＯＦＰＡＲＡＬＬＥＬＡＮＤＤＩＳＴＲＩＢＵＴＥＤＣＯＭＰＵＴＩＮＧ、第１８巻、第１号、１９９３年５月、ＤＵＬＵＴＨ、ＭＮＵＳ、ページ１〜１３に記載されている。このツールは、各々が複数の機器を有しているｎ個のノードを有しており、そのうちの唯一つのノードがネットワークのあらゆるノードについての負荷の情報を収集する役割を果たし、その時点から、このタイプの情報の収集についてマスタの資格を与えられ、一方、他のノードはエージェントの資格を与えられる。この文献においては、いずれかのノードの負荷は、待ち行列の内部で当該のノードに依存している機器による処理の待機中のプロセス数として定義された負荷の指数である。ツールは、これらの負荷情報の集中化された収集装置として役立つ。このツールは次に、これらの情報を各ノードのレベルに再分配するが、ノードの各々は他のノードが何をもっているのかは知らないままである。こうした再分配が行われると、各ノードは、最も負荷の小さい機器に、アプリケーションが必要としているサービスの実行を要求することを決定する。請求の範囲１．ローカルネットワーク（ＲＥ）における分散型情報処理システム（ＳＩＤ）の機器（ＭＣ０〜ＭＣ３）上で実行される分配されたアプリケーションＡＰＵに役立ち、それらの機器の各々に負荷を分配するためのツール（ＯＲＣ）であって、それらの機器上で実行されるＤＡＥＭＯＮと呼ばれる多数の情報処理モジュール（ＭＳ０、Ａ１〜Ａ３）を備えており、そのうちの一つはマスタ（ＭＳ０）と呼ばれ、他はエージェント（Ａ１〜Ａ３）と呼ばれ、 − マスタ（ＭＳ０）は、 − 定められたサンプリングの最初の瞬間Ｔｉにおいて、各エージェントの負荷データの収集手段（ＭＲＣ０〜ＭＲＣ３）と、 − 各エージェントに他のエージェントの負荷データを送る手段（ＭＴＣ０）とを備えており、 − アプリケーションに最も近いエージェントが、アプリケーションの要求に基づいて、アプリケーションに対して最も負荷の小さい機器を指定し、それによって、アプリケーションは必要なサービスの実行をこの機器に要求することを決定し、ａ）マスタ（ＭＳ０）とエージェント（Ａ１〜Ａ３）は各々、 − 定められたサンプリングの第２の瞬間ｔｉにおいて、実行している機器の負荷を計算する手段（ＭＣＣ０〜ＭＣＣ３）を有しており、一つの機器の負荷は、該機器及びネットワークを構成するさまざまなハード要素とその処理能力の時間における使用のパーセンテージに応じて計算され、 − さらに、マスタ（ＭＳ０）及びエージェント（Ａ１〜Ａ３）の負荷データの記憶手段（ＭＰ０〜ＭＰ３）を有しており、ｂ）各エージェント（Ａ１〜Ａ３）は、 − 他のエージェントからの負荷データを受取る手段（ＭＲＣＣ１〜ＭＲＣＣ３）を備えていることを特徴とするツール。２．ＤＡＥＭＭＯＮの始動時と、ツール（ＯＲＣ）の実行中にマスタがいなくなった場合に、マスタの存在とその単一性を保証し、ＤＡＥＭＯＮの中から一つのマスタを選択する手段（ＡＵＴ）を備えていることを特徴とする請求の範囲第１項に記載に記載のツール。３．情報処理システムの少なくとも１台の機器に影響を与える故障の際に、アプリケーションに対してツールによって提供されるサービスの継続性を保証することを可能にする手段（ＡＵＴ、ｅ８）を備えていることを特徴とする請求の範囲第１項に記載のツール。４．ＤＡＥＭＯＮの始動時に、各機器のアドレスを回収することができる機器をネットワークから自動的に検出する手段（ＡＵＴ、ｅ１、状態１０）を備えていることを特徴とする請求の範囲第１項に記載のツール。５．ネットワーク（ＲＥ）において分散された情報処理システム（ＳＩＤ）の各機器（ＭＣ０〜ＭＣ３）と、分配されたアプリケーション（ＡＰＵ）とＤＡＥＭＯＮと呼ばれる情報処理モジュール（ＭＳ０、Ａ１、Ａ３）における負荷の分配方法であって、ＤＡＥＭＯＮの一つはマスタ（ＭＳ０）と呼ばれ、その他はエージェント（Ａ１〜Ａ３）と呼ばれ、それらの機器の上で実行され、１）エージェントとマスタ（ＭＳ０、Ａ１〜Ａ３）が、実行する機器について、第２の時間間隔ｔｉにおいて、それらの機器の負荷データを収集し、それらの負荷計算手段（ＭＣＣ０〜ＭＣＣ３）が、前記データとその出力から、その機器の合計負荷を計算する操作、２）エージェント（Ａ１〜Ａ３）が、第２の時間間隔Ｔｉにおいて、対応する機器の負荷データをマスタ（ＭＳ０）に送る操作、３）マスタ（ＭＳ０）が、この同じ第２時期Ｔｉにおいて、各機器の収集手段（ＭＲＣ０〜ＭＲＣ３）を介して、あらゆるエージェントの負荷データと自分の固有のデータを集中させる操作、４）マスタ（ＭＳ０）が、マスタ自身の送信手段（ＭＴＣ０）を介して、各エージェント（Ａ１〜Ａ３）に対してこれらのあらゆるデータを送る操作、５）各エージェント（Ａ１〜Ａ３）が、関連する分割されたエージェントのメモリ（ＭＰ１〜ＭＰ３）中でこれらのあらゆる負荷データをコピーする操作、６）アプリケーション（ＡＰＵ）が、定められたサービスを提供してもらう必要があると判断した瞬間に、それが実行している機器の分割されたメモリ（ＭＰ０〜ＭＰ３）中で、各機器（ＭＣ０〜ＭＣ３）の推定負荷を探し、そこからこの同じ瞬間に最も負荷の小さい機器を推論し、その機器に前記のサービスの提供を要求する操作、を含むことを特徴とする方法。

───────────────────────────────────────────────────── フロントページの続き (72)発明者サリバ，テレーズフランス国、エフ−78180・モンテイニー −ル−ブルトヌー、リユ・ドユ・シヤン− ダボワーヌ、26

Claims

【特許請求の範囲】１．ローカルネットワーク（ＲＥ）における分散型情報処理システム（ＳＩＤ）の機器（ＭＣ０〜ＭＣ３）上で実行される分配されたアプリケーション（ＡＰＵ）に役立ち、それらの機器の各々に負荷を分配するためのツール（ＯＲＣ）であって、それらの機器上を実行するＤＡＥＭＯＮと呼ばれる多数の情報処理モジュール（ＭＳ０、Ａ１〜Ａ３）を備えており、そのうちの一つはマスタ（ＭＳＯ）と呼ばれ、他はエージェント（Ａ１〜Ａ３）と呼ばれ、 − マスタ（ＭＳ０）とエージェント（Ａ１〜Ａ３）は、定められたサンプリングの最初の瞬間ｔｉにおいて、それらが実行されている機器の負荷を計算する手段（ＭＣＣ０〜ＭＣＣ３）と、マスタとエージェントの負荷データの記憶手段（ＭＰ０〜ＭＰ３）とを有しており、 − 前記マスタ（ＭＳ０）は、 − 定められたサンプリングの第２の瞬間Ｔｉにおいて、各エージェントの負荷データを収集する手段（ＭＲＣ０〜ＭＲＣ３）と、 − 各エージェントに他のエージェントの負荷データを送る手段（ＭＴＣ０）とを備えており、 − 各エージェント（Ａ１〜Ａ３）は、 − 他のエージェントからの負荷データを受取る手段（ＭＲＣＣ１〜ＭＲＣＣ３）を備えており、 − アプリケーションに最も近いエージェントが、アプリケーションの要求に基づいて、アプリケーションに対して最も負荷の小さい機器を指定し、それによって、アプリケーションは必要なサービスの実行をこの機器に要求することを決定することを特徴とするツール。２．ＤＡＥＭＭＯＮの始動時と、ツール（ＯＲＣ）の実行中にマスタがいなくなった場合に、マスタの存在とその単一性を保証し、ＤＡＥＭＯＮの中から一つのマスタを選択する手段（ＡＵＴ）を備えていることを特徴とする請求の範囲第１項に記載に記載のツール。３．情報処理システムの少なくとも１台の機器に影響を与える故障の際に、アプリケーションに対してツールによって提供されるサービスの継続性を保証することを可能にする手段（ＡＵＴ、ｅ８）を備えていることを特徴とする請求の範囲第１項に記載のツール。４．ＤＡＥＭＯＮの始動時に、各機器のアドレスを回収することができる機器をネットワークから自動的に検出する手段（ＡＵＴ、ｅ１、状態１０）を備えていることを特徴とする請求の範囲第１項に記載のツール。５．請求の範囲第１項に記載のツールの利用方法であって、１）エージェントとマスタ（ＭＳ０、Ａ１〜Ａ３）が、実行する機器について、第１の時間間隔ｔｉにおいて、それらの機器の負荷データを収集し、負荷計算手段（ＭＣＣ０〜ＭＣＣ３）が、前記データとその出力から、その機器の合計負荷を計算する操作、２）エージェント（Ａ１〜Ａ３）が、第２の時間間隔Ｔｉにおいて、対応する機器の負荷データをマスタ（ＭＳ０）に送る操作、３）マスタ（ＭＳ０）が、この同じ第２時期Ｔｉにおいて、前記の収集手段（ＭＲＣ０〜ＭＲＣ３）を介して、あらゆるエージェントの負荷データと自分の固有のデータを集中させる操作、４）マスタ（ＭＳ０）が、送信手段（ＭＴＣ０）を介して、各エージェント（Ａ１〜Ａ３）に対してこれらのあらゆるデータを送る操作、５）各エージェント（Ａ１〜Ａ３）が、関連する分割されたメモリ（ＭＰ１〜ＭＰ３）中でこれらのあらゆる負荷データをコピーする操作、６）アプリケーション（ＡＰＵ）が、定められたサービスを提供してもらう必要があると判断した瞬間に、それが実行している機器の分割されたメモリ（ＭＰ０〜ＭＰ３）中で、各機器（ＭＣ０〜ＭＣ３）の推定負荷を探し、そこからこの同じ瞬間に最も負荷の小さい機器を推論し、その機器に前記のサービスの提供を要求する操作を含むことを特徴とするツールの利用方法。