JPH10507024A - 分配されたアプリケーションの負荷分配支援ツール - Google Patents

分配されたアプリケーションの負荷分配支援ツール

Info

Publication number
JPH10507024A
JPH10507024A JP8518321A JP51832195A JPH10507024A JP H10507024 A JPH10507024 A JP H10507024A JP 8518321 A JP8518321 A JP 8518321A JP 51832195 A JP51832195 A JP 51832195A JP H10507024 A JPH10507024 A JP H10507024A
Authority
JP
Japan
Prior art keywords
load
master
agent
agents
tool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8518321A
Other languages
English (en)
Inventor
シトボン,ジエラール
ユルバン,フランソワ
サリバ,テレーズ
Original Assignee
ブル・エス・アー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ブル・エス・アー filed Critical ブル・エス・アー
Publication of JPH10507024A publication Critical patent/JPH10507024A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Abstract

(57)【要約】 各機器に負荷を配分するための、情報処理システム(SID)の機器(MC0〜MC3)上で実行されるツール(ORC)であって、多数のDAEMONを備えており、そのうちの一つはマスタ(MS0)で、その他はエージェント(A1〜A3)であり、マスタ(MS0)とエージェント(A1〜A3)は、それらが実行されている機器の負荷をそれぞれ計算する手段(MCC0〜MCC3)と、マスタとエージェントの負荷のデータの記憶手段(MP0〜MP3)を有しており、マスタ(MS0)は、各エージェントの負荷データの収集手段(MRC0〜MRC3)と、各エージェントに他のエージェントの負荷データを送信する手段(MTC0)を備えており、各エージェント(A1〜A3)は、他のエージェントの負荷データを受信する手段(MRCC1〜MRCC3)を備えていることを特徴とするツール。分散型情報処理システムに適用することができる。

Description

【発明の詳細な説明】 分配されたアプリケーションの負荷分配支援ツール 本発明は、ローカルネットワークにおいて分散された情報処理システムに属す る複数の機器上に分配されるアプリケーションの負荷の分配の支援ツールに関す るものである。 情報処理システムの現在の開発傾向は、たとえば、ローカルタイプのネットワ ークを介して互いに接続されている多数の機器を結び付けることによってこのよ うなシステムを形成するといったものである。すべてのユーザは、これらの機器 の組の上で、きわめて多種多様なタイプのアプリケーションを実行している。こ れらのアプリケーションは、それらが処理する問題の実施に必要な情報を提供す るサービスに頼っており、そうしたサービスはこれらの機器の全部あるいは一部 によって与えられている。 実行中のアプリケーションが、通常の実行において特定のサービスの利用を必 要とする場合、それは以下の要領で行われる。 − このサービスを提供してくれる機器をまったくアトランダムに選択し、そ の機器にこのジョブを任せる。 − あるいはまた、あらゆる機器の中からローテーションで 選択する。すなわち、常に同じ順番で、次々に必要となるサービスを提供すると いうジョブを順番に任せる。このように、システムが3台の機器をもっている場 合には、時間的に最初に必要なったサービスの提供をNo.1の機器に、二番目 に必要となったサービスの提供をNo.2の機器に、三番目に必要となったサー ビスの提供をNo.3の機器に任せる。その後はまた順番にNo.1、No.2 、No.3、No.1というように使用していく。 上記のいずれの場合であっても、どの機器のジョブも時間的に最適化されるこ とはなく、その一方で、伝送量と性能に関する各機器の可能性は、最大レベルを はるかに下回る形でしか使用されない。 これらの欠点を解消することができる解決策が知られている。その一つは、1 994年7月13日に出願されたフランス特許出願第9408764号において 、出願人である当社によって、「多数のサーバを有するオープンな情報処理シス テム」というタイトルで記載されている方法である。クライアントと呼ばれる中 央システムと複数のサーバを結び付けることによって形成されるこのようなシス テムにおいては、各サーバは、クライア ント上で実行する各アプリケーションに固有の基準にしたがって、固有の負荷と 、時間的に予測可能なその推移を計算し、これらの二つのファクタをクライアン トに伝送する。クライアントは、定められたアプリケーションがサーバのサービ スを要求すると、サービスが行われなければならない時間中に負荷が最も小さい サーバを選択し、そのサーバに、要求されたサービスの提供ジョブを任せる。 本発明は、上記の解決策を改良し、一般化したものである。 本発明によると、ローカルネットワークにおいて分散された情報処理システム の機器上で実行する分配されたアプリケーションに役立つ、各機器上に負荷を分 配するためのツールは、機器上で実行するDAEMONと呼ばれる多数の情報処 理モジュールを有しており、そのうちの一つはマスタと呼ばれ、その他はエージ ェントと呼ばれ、 − マスタとエージェントはそれぞれ、所定のサンプリングの最初の瞬間に、 それらが実行する機器の負荷を計算する手段と、マスタとエージェントの負荷デ ータを記憶する手段を有しており、 − マスタは、 − 所定のサンプリングの第2の瞬間に各エージェントのロードデータを収 集する手段と − 各エージェントに他のエージェントの負荷データを送信する手段を備え ており、 − 各エージェントは − 他のエージェントの負荷データの受信手段を備えており、 − アプリケーションに最も近いローカルエージェントが、アプリケーション の要求に基づいて、最も負荷が小さい機器を指定し、その結果アプリケーション は必要なサービスの実行をこの機器に要求することを決定する ことを特徴としている。 本発明の他の特徴及び利点は、添付の図面を参照して限定的でない例として示 した下記の説明から明らかになるであろう。 これらの図は: − 第1図は、本発明による負荷分配支援ツールを備えた分散型情報処理シス テムを示す図であり、 − 第2図は、本発明による負荷分配支援ツールを構成する各エレメント間で マスタとエージェントの役割を配分するオー トマトンを示す図である。1)本発明によるツールの主な特徴 A)構造 本発明による分散型情報処理システムにおける負荷の分配支援ツールORC( load balancing toolkit)−簡略化するために、以下の 本文では「支援ツール」と呼ぶ−の特徴的な各主要エレメントは第1図に示され ている。 第1図に示すように、何らかのタイプの分散型情報処理システム(ここではS IDと呼ぶ)は、何らかのタイプ及びサイズの4台の情報処理機器MC0、MC 1、MC2、MC3を有している。これらの機器−小型、中型、大型コンピュー タは、通常のエレメント、すなわち、CPU(中央処理装置)と呼ばれる1台ま たは複数の中央プロセッサ、それらに接続されたメモリ、入出力(I/O)装置 、ネットワークREへの接続手段を備えている。第1図では、このネットワーク は、4台の機器MC0からMC3間のデータのリンクを表す双方向の矢印で記号 的に示されている。 いわゆる支援ツールORCは、マスタMS0と三つのエージェントA1、A2 、A3を有している。エージェントはすべて、 以下に説明する条件によって、マスタとなることもできる。マスタもエージェン トも同じように、DAEMONという名で技術者に知られている情報処理ツール で構成される。一つのDAEMONは、一つの問題に答えることができる一つの 情報処理ツールであるか、または1台の機器上で実行される単位である。 各機器MC0からMC3の内部では、DAEMON MS0、A1、A2、A 3がそれぞれ、分割されたメモリMP0、MP1、MP2、MP3に関連付けら れている。各メモリは、対応する機器の負荷だけでなくSIDの他の機器の負荷 も含んでいる。 第1図では、分配されたアプリケーションが機器MC2上で実行され、その結 果、他の機器MC0、MC1、MC3によって提供されるサービスを要求すると 仮定している。このアプリケーションはAPUと名付けられる。マスタとエージ ェントが局在している場所は、APUが実行されている場所からは独立している 。B)動作 SIDシステムのあらゆる機器間の通信が確立すると、MS 0がマスタになり、A1、A2、A3がエージェントになると仮定して、ツール ORCの動作のアウトラインは以下のようになる。第1図、特に、一方ではマス タとエージェント間に行き交う情報の流れの方向、もう一方では動作のシーケン スを示す矢印とそれらに付随する丸で囲んだ数字をそれぞれ常に参照する。 動作1:各エージェントとマスタは、実行中の機器について、所定のサンプリ ングの最初の瞬間を構成する一定の時間間隔tiで、その機器の負荷データを収 集する。これは、その負荷を構成する各エレメント(CPUの負荷、関連するメ モリの負荷、入出力の負荷、ネットワークの負荷等々)について行われる。各エ レメントの最大許容負荷のパーセンテージで表されている各エレメントの負荷か ら、当該の機器の合計負荷を計算する。これはそれぞれ、MS0についてはMC C0、A1についてはMCC1、A2についてはMCC2、A3についてはMC C3といった負荷の計算手段によって実行される。これらの手段は、単に、下記 の第2項「各エージェントによる負荷の計算方法」で説明する負荷の計算方法を 実施した計算プログラムによって構成されている。これらの手段は、必然的に、 マスタと エージェント、MS0、A1、A2、A3の各々の一部を構成しているので、簡 略化するために第1図ではそれら自体は表されていない。当該の機器の合計負荷 が計算されると、その結果、前記機器の負荷に関する統計的データ全体、すなわ ちDSCが得られる。第1図では、わかりやすくするために、エージェントA2 についてのこの動作しか表されていない。 動作2:エージェントは、規則正しい間隔で、ネットワークを介して(A2に ついては、MC2とMC0の間のリンクL2を介して)対応する機器の負荷の統 計的データをMS0に送る。 動作3:マスタMS0は、実際に、動作2について定められた規則正しい間隔 で、つまり所定のサンプリングの第2の瞬間Tiを構成する間隔で、あらゆるエ ージェントの負荷のあらゆる統計的データと、MS0に関連する分割されたメモ リ、ここではMP0のレベルでの自らの負荷データを集中させる。この集中化は 、事実上、負荷データの収集動作である。したがって、これはそれぞれ、MS0 についてはMRC0、A1についてはMRC1、A2についてはMRC2、A3 についてはMRC3といった負荷データの収集手段によって行われる。これらの 手段は事実上、マスタ及び各エージェントA1からA3中に組込 まれた収集プログラムであり、簡略化するために、第1図には表されていない。 動作4:マスタMS0は、送信手段MTC0によって、ネットワークREを介 して、すなわち、MC0とMC1間はL1、MC0とMC2間はL2、MC0と MC3間はL3といったリンクを介して、これらの全データを各エージェントA 1、A2、A3に送信する。MTC0はMS0の一部を構成しているので、簡略 化するために第1図には表されていない。 動作5:各エージェントはこれらの負荷データを受取り、A1についてはMP 1、A2についてはMP2、A3についてはMP3といった、関連する分割され たそれぞれのメモリ中でそれらをコピーする。これは、それぞれA1からA3の ための手段MRCC1からMRCC3によって実行される。これらの手段はA1 からA3の一部を構成しているので、簡略化するために第1図には表されていな い。 動作6:アプリケーションAPUは、定められたサービスを受けることが必要 になる瞬間に、各機器について推定された負荷をリサーチし、そこからその瞬間 に最も負荷の小さい機器を推論し、このサービスを提供するようにその機器に要 求するた めに、実行中の機器の分割されたメモリを検索することになる。2)各エージェントによる負荷の計算方法 CPU、メモリ、入出力、ネットワークREといったエレメントについての負 荷の一例について説明する。 MCC0からMCC3の各手段による負荷の計算方法の説明は、本文末尾の付 録1に記されている表1から4を参照して行う。これらの表においては負荷はパ ーセンテージで表されている。 エージェント及びマスターについての負荷計算は前記引用の出願に記載された ものと同じである。これを以下に要約して示す。 あるエージェント(同様にマスタ)の合計負荷Wtは以下の式によって得るこ とができる。 Wt=k1*W1+k2*W2+k3*W3+k4*W4 この式において: − W1は、エージェントの中央処理装置の時間における使用のパーセンテー ジである。 − W2は、エージェントのメモリの使用のパーセンテージ、すなわち、実際 に使用されるメモリ容量とメモリの合計容量の 比である。 − W3は、エージェントによるネットワークの使用パーセンテージ、すなわ ち、エージェントが送信及び受信した情報数と、ネットワーク上の最大許容伝送 量の比である。 − W4はエージェントによる入出力装置の使用パーセンテージである。 − k1、k2、k3、k4は、中央処理装置、メモリ、ネットワーク、入出 力装置の固有重み付け係数である。それらの合計は1になる。またそれらの値は 、実行中のアプリケーションの種類、ここでは機器MC2上のAPUによって左 右される。 付録1の各表で見ることができるように、時間Tの定められたサンプリングの 期間t1、t2、t3、t4、t5、t6、t7(実際は、動作1の説明の際に 上述した瞬間ti)において、負荷W1、W2、W3、W4が測定され、Wtが 計算される。 表1は、t1からt7のすべての瞬間において、いずれかのエージェント、た とえばA1によって収集される、対応する機器MC1に関連する負荷データの一 例を示している。これらのデータは、当然のことながら、MS0に送られる前に 、A1が 実行中の機器MC1の分割されたメモリMP1の中に記憶される。 したがって、この表においては、たとえばW1は瞬間t1において35、W2 は瞬間t4において67、W3は瞬間t6において38、W4は瞬間t7につい て32であると見ることができ、以下同様である。 次に、MC2上で実行するAPUに関連する計算プログラムAPIは、−動作 3を実行した後に、MS0に結びついたMC0の分割されたメモリMP0中に含 まれる各エージェントとマスタの負荷データについて−アプリケーションAPU に対して、対応する機器の固有重み付け係数k1からk4を適用する。 このとき表2が得られるが、この表は、瞬間t1からt7における各機器MC 0からMC4について全体的負荷のデータの値Wtを示している。このように、 MC0については、WTは瞬間t1において56、t2においては32、t3に ついては67等々であると見ることができる。MC1については、Wtはt1に おいては23、t2については34等々であり、他の機器についても同様である 。 あらゆる機器について、負荷計算の次の段階は、最小2乗法 という従来の数学的方法を用いて、外挿によって、瞬間t8=(t7+T)にお ける負荷Wtの値を推定することである。 この結果表3が得られる。この表ではたとえば、この瞬間t8におけるMC0 からMC3の負荷の推定値は、それぞれ73、82、36、76であると見るこ とができる。 次に、以下の式に従って、各機器の実際に使用可能な負荷率C1を得るために 、その機器に特有の出力係数Cpを、各機器の合計負荷に適用する。 C1=(100−Wt(推定値))*Cp 実際に、機器を構成している出力、サイズ、タイプが異なる種々雑多な情報処 理環境が考えられることから、各機器の特徴を考慮に入れることが重要である。 たとえば、ある機器がほとんど負荷がない場合、しかも同時に、所与の瞬間に、 アプリケーションAPUが要求するサービスを実行するための処理能力が不十分 である場合には、そのサービスは他の機器によって行われなければならないのは 当然である。ここから、負荷を定め、その結果、出力係数Cpのこの影響に対応 する存在を定める補正係数が必要となる。 所与の機器の係数Cpは、中央処理装置CPUの出力、メモ リの容量、入出力装置の処理能力、等々を合成することによって計算される。機 器のハードの構成を変えるたびに、あるいはそのオペレーティングシステムを変 更するたびに、この係数は計算し直される。同様に、分散型情報処理システムS IDの一般的コンフィギュレーションが変わるたびに、このシステムのあらゆる 機器の係数Cpが再び定められる。Cpが1である場合は、ユーザによって定め られた中型タイプの機器に対応する。 表4では、各機器MC0からMC3の各々について使用可能な実際の負荷率C 1の例を見ることができる。このように、MC0については、推定負荷率が73 で、出力係数Cpが2.5のとき、使用可能な実際の負荷率は67.5となる。 MC1についてのこれらと同じ数字は、それぞれ、82、2、36であり、MC 2とMC3についても同様である。3)マスタMS0の選択方法 どの機器であっても、その上で実行するあらゆるDAEMONがマスタになれ るというのが基本的な考え方である。したがって、一方では、どの機器がマスタ になるか、またその選択条件を定めることができるメカニズムと、もう一方では 、支障が起きた場合にはマスタになる機器を交換する手順を作成するこ とが重要である。 選択のメカニズムは、少なくとも一つのDAEMONが実行中であること、な らびにそのうちの2台のDAEMONが同時にマスタにはなれない(特に、それ らの同じ瞬間に始動する場合)ことを保証しなければならない。 このメカニズムは以下の五つの大まかな段階から構成される。 第1段階:一つのDAEMONが始動すると、それはネットワークRE上で使 用されているプロトコルに合致した、たとえば、ここで述べている本発明の実施 の形態において使用されているプロトコルTCP−IPに合致した単一識別子T Dをつくりだす。この識別子は、イーサネットアドレス(イーサネットは、ここ で述べられている実施の形態において使用されるローカルネットワークに関連す るプロトコルTCP−IPの一部であり、当然のことながら、規格化されている ので、当業者に良く知られている)と、識別子の送信の瞬間と、ランダムな値に よって構成されている。それと同時に、この識別子は中間的状態に置かれ、ネッ トワークREのあらゆる機器に向けて、このネットワーク上に二つの情報(識別 子の現在の状態、ID)を送る。 第2段階:このDAEMONが、定められた時間間隔Trの間(約5から10 秒)、他のDAEMONから同じ情報が来るのを待つ。このDAEMONがマス タの候補となる。 第3段階:他のDAEMONからの情報を受取るとすぐに、以下のように分析 する。 − それらの情報が、事実上マスタである、すなわちMS0とみなされるDA EMONから来たものである場合には、このDAEMONはエージェントとみな される。 − それらの情報が中間状態にあるDAEMONから来たものである場合には 、識別子を比較する。つまり自分の識別子と受取った識別子を比較する。 − 自分の識別子が受取った識別子より小さい場合には、そのDAEMON はマスタMS0になる権利をもち続ける。 − 自分の識別子が受取った識別子に等しい、またはそれより大きい場合に は、そのDAEMONはマスタの地位を譲る。このとき、前記の二つの情報(自 分のID、自分の状態)を再び送り、改めて、タイマと呼ばれる前記時間間隔T rの間に、応答を待つ。 第4段階:この時間間隔が経過してしまうと、当該のDAE MONが改めてトライする。これは、メッセージロスを防ぐために、常にネット ワークRE上で行うことが可能であり、以下の手順が用いられる。 − 応答の送信及び聴取が5回繰り返される。 − 当該のDAEMONが、エージェントであることが明らかになった他のD AEMONの応答を受取った場合には、マスタMS0が存在することを確信し、 そのマスタから送られてくる応答を待つ。 第5段階:5回繰り返されても、当該のDAEMONが、他のDAEMONか らいかなる応答も受取らなかった場合には、自分がマスタMS0になることを決 定する。 三つのエージェントA1からA3のいずれか一つが、マスタMS0がもはや連 絡して来ないと気づいたら、それら三つの中から新しいマスタを選出するためあ らゆる段階において上記の手順を開始する。 さらに、マスタは定期的に、SIDシステムのあらゆる機器に対してその存在 を知らせる。マスタが他のマスタの存在を検出した場合には、IDが最も小さい マスタによって手順が再開される。 第2図は、SIDの機器上を実行する各DAEMON間におけるマスタとエー ジェントの役割分配のオートマトンAUTを示しているが、この図によって、上 述の第1段階から第5段階の各々の連続性が良く分かるであろう。 このオートマトンAUTは以下の五つの状態を有する。 − 状態I0:当該のDAEMONが前記の二つの情報(自分のID、自分の 状態)を送信する。これは、第1段階に対応している。 − 状態I1:前記DAEMONが他のDAEMONからの応答を聴取する。 これは第2及び第3段階に対応している。 − 状態I2:前記DAEMONが、定められた時間Trが経過すること、及 びマスタMS0からのありうる応答を待っている。 − 状態A:当該のDAEMONがエージェントA1、A2もしくはA3にな る。 − 状態M:当該のDAEMONがマスタMS0になる。 このオートマトンに対応するイベントは、e1からe8と名付けられ、以下の 通りである。 − e1:当該のDAEMONが自分のIDと自分の状態を 伝送し、時間Trを定めた。 − e2:IDの受信、ローカル識別子ID(当該のDAEMONの識別子) が、受取った識別子より小さい。 − e3:IDの受信、ローカル識別子ID(当該のDAEMONの識別子) が、受取った識別子と等しい、またはそれより大きい。 − e4:時間Trが経過した。 − e5:時間Trが経過し、トライの数が5回以下である。あるいはまた、 一つのエージェントが応答してきた。 − e6:マスタが応答してきた。 − e7:時間Trが経過し、トライ数が5回になったが、いかなるエージェ ントからも応答がない。 − e8:マスタとの接続がなくなった。 − e9:一つのマスタによって、よりIDが高い他のマスタの存在が検出さ れた。
【手続補正書】特許法第184条の8第1項 【提出日】1996年9月2日 【補正内容】 同様に、ローカルネットワークにおける分散型の情報処理システムの機器上を 実行する分配されたアプリケーションに役立ち、それらの機器の各々に負荷を分 配するためのツールが知られており、技術文献JOURNAL OF PARA LLELAND DISTRIBUTED COMPUTING、第18巻、第 1号、1993年5月、DULUTH、MN US、ページ1〜13に記載され ている。 このツールは、各々が複数の機器を有しているn個のノードを有しており、そ のうちの唯一つのノードがネットワークのあらゆるノードについての負荷の情報 を収集する役割を果たし、その時点から、このタイプの情報の収集についてマス タの資格を与えられ、一方、他のノードはエージェントの資格を与えられる。こ の文献においては、いずれかのノードの負荷は、待ち行列の内部で当該のノード に依存している機器による処理の待機中のプロセス数として定義された負荷の指 数である。 ツールは、これらの負荷情報の集中化された収集装置として役立つ。このツー ルは次に、これらの情報を各ノードのレベルに再分配するが、ノードの各々は他 のノードが何をもっているのかは知らないままである。こうした再分配が行われ ると、各 ノードは、最も負荷の小さい機器に、アプリケーションが必要としているサービ スの実行を要求することを決定する。 請求の範囲 1.ローカルネットワーク(RE)における分散型情報処理システム(SID) の機器(MC0〜MC3)上で実行される分配されたアプリケーションAPUに 役立ち、それらの機器の各々に負荷を分配するためのツール(ORC)であって 、それらの機器上で実行されるDAEMONと呼ばれる多数の情報処理モジュー ル(MS0、A1〜A3)を備えており、そのうちの一つはマスタ(MS0)と 呼ばれ、他はエージェント(A1〜A3)と呼ばれ、 − マスタ(MS0)は、 − 定められたサンプリングの最初の瞬間Tiにおいて、各エージェントの負荷 データの収集手段(MRC0〜MRC3)と、 − 各エージェントに他のエージェントの負荷データを送る手段(MTC0)と を備えており、 − アプリケーションに最も近いエージェントが、アプリケーションの要求に基 づいて、アプリケーションに対して最も負荷の小さい機器を指定し、それによっ て、アプリケーションは必要なサービスの実行をこの機器に要求することを決定 し、 a)マスタ(MS0)とエージェント(A1〜A3)は各々、 − 定められたサンプリングの第2の瞬間tiにおいて、実行している機器の負 荷を計算する手段(MCC0〜MCC3)を有しており、一つの機器の負荷は、 該機器及びネットワークを構成するさまざまなハード要素とその処理能力の時間 における使用のパーセンテージに応じて計算され、 − さらに、マスタ(MS0)及びエージェント(A1〜A3)の負荷データの 記憶手段(MP0〜MP3)を有しており、 b)各エージェント(A1〜A3)は、 − 他のエージェントからの負荷データを受取る手段(MRCC1〜MRCC3 )を備えている ことを特徴とするツール。 2.DAEMMONの始動時と、ツール(ORC)の実行中にマスタがいなくな った場合に、マスタの存在とその単一性を保証し、DAEMONの中から一つの マスタを選択する手段(AUT)を備えていることを特徴とする請求の範囲第1 項に記載に記載のツール。 3.情報処理システムの少なくとも1台の機器に影響を与える故障の際に、アプ リケーションに対してツールによって提供さ れるサービスの継続性を保証することを可能にする手段(AUT、e8)を備え ていることを特徴とする請求の範囲第1項に記載のツール。 4.DAEMONの始動時に、各機器のアドレスを回収することができる機器を ネットワークから自動的に検出する手段(AUT、e1、状態10)を備えてい ることを特徴とする請求の範囲第1項に記載のツール。 5.ネットワーク(RE)において分散された情報処理システム(SID)の各 機器(MC0〜MC3)と、分配されたアプリケーション(APU)とDAEM ONと呼ばれる情報処理モジュール(MS0、A1、A3)における負荷の分配 方法であって、DAEMONの一つはマスタ(MS0)と呼ばれ、その他はエー ジェント(A1〜A3)と呼ばれ、それらの機器の上で実行され、 1)エージェントとマスタ(MS0、A1〜A3)が、実行する機器について 、第2の時間間隔tiにおいて、それらの機器の負荷データを収集し、それらの 負荷計算手段(MCC0〜MCC3)が、前記データとその出力から、その機器 の合計負荷を計算する操作、 2)エージェント(A1〜A3)が、第2の時間間隔Tiにおいて、対応する 機器の負荷データをマスタ(MS0)に送る操作、 3)マスタ(MS0)が、この同じ第2時期Tiにおいて、各機器の収集手段 (MRC0〜MRC3)を介して、あらゆるエージェントの負荷データと自分の 固有のデータを集中させる操作、 4)マスタ(MS0)が、マスタ自身の送信手段(MTC0)を介して、各エ ージェント(A1〜A3)に対してこれらのあらゆるデータを送る操作、 5)各エージェント(A1〜A3)が、関連する分割されたエージェントのメ モリ(MP1〜MP3)中でこれらのあらゆる負荷データをコピーする操作、 6)アプリケーション(APU)が、定められたサービスを提供してもらう必 要があると判断した瞬間に、それが実行している機器の分割されたメモリ(MP 0〜MP3)中で、各機器(MC0〜MC3)の推定負荷を探し、そこからこの 同じ瞬間に最も負荷の小さい機器を推論し、その機器に前記のサービスの提供を 要求する操作、を含むことを特徴とする方法。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 サリバ,テレーズ フランス国、エフ−78180・モンテイニー −ル−ブルトヌー、リユ・ドユ・シヤン− ダボワーヌ、26

Claims (1)

  1. 【特許請求の範囲】 1.ローカルネットワーク(RE)における分散型情報処理システム(SID) の機器(MC0〜MC3)上で実行される分配されたアプリケーション(APU )に役立ち、それらの機器の各々に負荷を分配するためのツール(ORC)であ って、それらの機器上を実行するDAEMONと呼ばれる多数の情報処理モジュ ール(MS0、A1〜A3)を備えており、そのうちの一つはマスタ(MSO) と呼ばれ、他はエージェント(A1〜A3)と呼ばれ、 − マスタ(MS0)とエージェント(A1〜A3)は、定められたサンプリ ングの最初の瞬間tiにおいて、それらが実行されている機器の負荷を計算する 手段(MCC0〜MCC3)と、マスタとエージェントの負荷データの記憶手段 (MP0〜MP3)とを有しており、 − 前記マスタ(MS0)は、 − 定められたサンプリングの第2の瞬間Tiにおいて、各エージェントの 負荷データを収集する手段(MRC0〜MRC3)と、 − 各エージェントに他のエージェントの負荷データを送る手段(MTC0 )とを備えており、 − 各エージェント(A1〜A3)は、 − 他のエージェントからの負荷データを受取る手段(MRCC1〜MRC C3)を備えており、 − アプリケーションに最も近いエージェントが、アプリケーションの要求に 基づいて、アプリケーションに対して最も負荷の小さい機器を指定し、それによ って、アプリケーションは必要なサービスの実行をこの機器に要求することを決 定することを特徴とするツール。 2.DAEMMONの始動時と、ツール(ORC)の実行中にマスタがいなくな った場合に、マスタの存在とその単一性を保証し、DAEMONの中から一つの マスタを選択する手段(AUT)を備えていることを特徴とする請求の範囲第1 項に記載に記載のツール。 3.情報処理システムの少なくとも1台の機器に影響を与える故障の際に、アプ リケーションに対してツールによって提供されるサービスの継続性を保証するこ とを可能にする手段(AUT、e8)を備えていることを特徴とする請求の範囲 第1項に 記載のツール。 4.DAEMONの始動時に、各機器のアドレスを回収することができる機器を ネットワークから自動的に検出する手段(AUT、e1、状態10)を備えてい ることを特徴とする請求の範囲第1項に記載のツール。 5.請求の範囲第1項に記載のツールの利用方法であって、 1)エージェントとマスタ(MS0、A1〜A3)が、実行する機器について 、第1の時間間隔tiにおいて、それらの機器の負荷データを収集し、負荷計算 手段(MCC0〜MCC3)が、前記データとその出力から、その機器の合計負 荷を計算する操作、 2)エージェント(A1〜A3)が、第2の時間間隔Tiにおいて、対応する 機器の負荷データをマスタ(MS0)に送る操作、 3)マスタ(MS0)が、この同じ第2時期Tiにおいて、前記の収集手段( MRC0〜MRC3)を介して、あらゆるエージェントの負荷データと自分の固 有のデータを集中させる操作、 4)マスタ(MS0)が、送信手段(MTC0)を介して、 各エージェント(A1〜A3)に対してこれらのあらゆるデータを送る操作、 5)各エージェント(A1〜A3)が、関連する分割されたメモリ(MP1〜 MP3)中でこれらのあらゆる負荷データをコピーする操作、 6)アプリケーション(APU)が、定められたサービスを提供してもらう必 要があると判断した瞬間に、それが実行している機器の分割されたメモリ(MP 0〜MP3)中で、各機器(MC0〜MC3)の推定負荷を探し、そこからこの 同じ瞬間に最も負荷の小さい機器を推論し、その機器に前記のサービスの提供を 要求する操作を含むことを特徴とするツールの利用方法。
JP8518321A 1994-11-30 1995-11-17 分配されたアプリケーションの負荷分配支援ツール Pending JPH10507024A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR9414386A FR2727540B1 (fr) 1994-11-30 1994-11-30 Outil d'aide a la repartition de la charge d'une application repartie
FR94/14386 1994-11-30
PCT/FR1995/001514 WO1996017297A1 (fr) 1994-11-30 1995-11-17 Outil d'aide a la repartition de la charge d'une application repartie

Publications (1)

Publication Number Publication Date
JPH10507024A true JPH10507024A (ja) 1998-07-07

Family

ID=9469329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8518321A Pending JPH10507024A (ja) 1994-11-30 1995-11-17 分配されたアプリケーションの負荷分配支援ツール

Country Status (6)

Country Link
US (2) US5993038A (ja)
EP (1) EP0715257B1 (ja)
JP (1) JPH10507024A (ja)
DE (1) DE69521271D1 (ja)
FR (1) FR2727540B1 (ja)
WO (1) WO1996017297A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10283211A (ja) * 1997-03-28 1998-10-23 Internatl Business Mach Corp <Ibm> マルチシステム環境のプロセッサ・リソース管理方法

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5862348A (en) * 1996-02-09 1999-01-19 Citrix Systems, Inc. Method and apparatus for connecting a client node to a server node based on load levels
US6078943A (en) * 1997-02-07 2000-06-20 International Business Machines Corporation Method and apparatus for dynamic interval-based load balancing
US6263368B1 (en) * 1997-06-19 2001-07-17 Sun Microsystems, Inc. Network load balancing for multi-computer server by counting message packets to/from multi-computer server
US6134216A (en) * 1997-10-29 2000-10-17 Lucent Technologies Inc. Integrated overload control for overload control for distributed real time systems
US6397252B1 (en) * 1997-12-19 2002-05-28 Electronic Data Systems Corporation Method and system for load balancing in a distributed object system
US6324580B1 (en) * 1998-09-03 2001-11-27 Sun Microsystems, Inc. Load balancing for replicated services
US6327622B1 (en) 1998-09-03 2001-12-04 Sun Microsystems, Inc. Load balancing in a network environment
US7058727B2 (en) 1998-09-28 2006-06-06 International Business Machines Corporation Method and apparatus load balancing server daemons within a server
JP2000172657A (ja) * 1998-12-08 2000-06-23 Fujitsu Ltd 分散処理システム、分散処理方法、その方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体、サーバ装置およびクライアント装置
US6256698B1 (en) * 1999-01-11 2001-07-03 Sony Corporation Method of and apparatus for providing self-sustained even arbitration within an IEEE 1394 serial bus network of devices
EP1022658A1 (de) * 1999-01-21 2000-07-26 Siemens Aktiengesellschaft Lastverteilungsverfahren eines Multiprozessorsystems und Multiprozessorsystem
EP1061710B1 (en) * 1999-06-17 2010-12-08 Level 3 Communications, LLC System and method for integrated load distribution and resource management on internet environment
JP4183871B2 (ja) * 2000-01-26 2008-11-19 株式会社日立製作所 負荷分散方法及び装置
US6542930B1 (en) 2000-03-08 2003-04-01 International Business Machines Corporation Distributed file system with automated file management achieved by decoupling data analysis and movement operations
US6687735B1 (en) 2000-05-30 2004-02-03 Tranceive Technologies, Inc. Method and apparatus for balancing distributed applications
US6789112B1 (en) 2000-05-08 2004-09-07 Citrix Systems, Inc. Method and apparatus for administering a server having a subsystem in communication with an event channel
US6785713B1 (en) 2000-05-08 2004-08-31 Citrix Systems, Inc. Method and apparatus for communicating among a network of servers utilizing a transport mechanism
US6785726B1 (en) 2000-05-08 2004-08-31 Citrix Systems, Inc. Method and apparatus for delivering local and remote server events in a similar fashion
US7050963B2 (en) * 2000-09-12 2006-05-23 Progress Software Corporation Method and apparatus for flash load balancing
EP1229445A1 (de) * 2001-02-02 2002-08-07 Cluster Labs GmbH Verfahren zum Betreiben eines Rechnersystems und Vorrichtung
US7127716B2 (en) * 2002-02-13 2006-10-24 Hewlett-Packard Development Company, L.P. Method of load balancing a distributed workflow management system
US7222245B2 (en) * 2002-04-26 2007-05-22 Hewlett-Packard Development Company, L.P. Managing system power based on utilization statistics
US6996728B2 (en) * 2002-04-26 2006-02-07 Hewlett-Packard Development Company, L.P. Managing power consumption based on utilization statistics
US7426570B2 (en) * 2003-07-25 2008-09-16 Hewlett-Packard Development Company, L.P. Determining placement of distributed application onto distributed resource infrastructure
US20050033809A1 (en) * 2003-08-08 2005-02-10 Teamon Systems, Inc. Communications system providing server load balancing based upon weighted health metrics and related methods
EP1927921A1 (en) * 2003-08-08 2008-06-04 Teamon Systems, Inc. Communications system providing server load balancing based upon weighted health metrics and related method
US20050160276A1 (en) * 2004-01-16 2005-07-21 Capital One Financial Corporation System and method for a directory secured user account
TW200532466A (en) * 2004-02-03 2005-10-01 Sony Corp Information processing device, information processing method, information processing system and information processing program of accessible media
JP2007041720A (ja) * 2005-08-01 2007-02-15 Fujitsu Ltd ジョブステップ実行プログラムおよびジョブステップ実行方法
JP4751265B2 (ja) * 2006-08-01 2011-08-17 株式会社日立製作所 リソース管理システム及びその方法
WO2008021024A2 (en) * 2006-08-13 2008-02-21 Mentor Graphics Corporation Multiprocessor architecture with hierarchical processor organization
US8838779B2 (en) * 2009-11-04 2014-09-16 International Business Machines Corporation Multi-level offload of model-based adaptive monitoring for systems management
JP5874234B2 (ja) * 2011-08-09 2016-03-02 富士通株式会社 機器管理装置、機器管理方法および機器管理プログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63274741A (ja) * 1987-05-01 1988-11-11 Kawasaki Steel Corp 継目無鋼管用オ−ステナイト系ステンレス鋼
JPH0685167B2 (ja) 1988-04-08 1994-10-26 日本電気株式会社 ネットワークジョブ実行監視制御方式
JPH0241535A (ja) 1988-08-02 1990-02-09 Seiichi Miyazaki データ処理装置
JPH0273437A (ja) 1988-09-09 1990-03-13 Mitsubishi Electric Corp マスタダウンラインロード方式
US5339392A (en) * 1989-07-27 1994-08-16 Risberg Jeffrey S Apparatus and method for creation of a user definable video displayed document showing changes in real time data
JPH0423058A (ja) * 1990-05-18 1992-01-27 Fujitsu Ltd マルチメディアデータ転送方法および該方法を用いたシステム
JPH0463771A (ja) * 1990-06-30 1992-02-28 Suzuki Motor Corp 四輪操舵装置
JPH04286681A (ja) * 1991-03-15 1992-10-12 Nippon Soda Co Ltd 記録材料
JPH0573393A (ja) 1991-09-11 1993-03-26 Nec Corp 分散フアイル管理方式
JPH05334161A (ja) 1992-05-28 1993-12-17 Matsushita Electric Ind Co Ltd マルチサーバシステム
US5442789A (en) * 1994-03-31 1995-08-15 International Business Machines Corporation System and method for efficiently loading and removing selected functions on digital signal processors without interrupting execution of other functions on the digital signal processors
US5787160A (en) * 1994-12-08 1998-07-28 Mci Communications Corporation Intelligent routing of special service calls
US5790789A (en) * 1996-08-02 1998-08-04 Suarez; Larry Method and architecture for the creation, control and deployment of services within a distributed computer environment

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10283211A (ja) * 1997-03-28 1998-10-23 Internatl Business Mach Corp <Ibm> マルチシステム環境のプロセッサ・リソース管理方法

Also Published As

Publication number Publication date
EP0715257B1 (fr) 2001-06-13
DE69521271D1 (de) 2001-07-19
EP0715257A1 (fr) 1996-06-05
US5993038A (en) 1999-11-30
FR2727540B1 (fr) 1997-01-03
WO1996017297A1 (fr) 1996-06-06
USRE37811E1 (en) 2002-07-30
FR2727540A1 (fr) 1996-05-31

Similar Documents

Publication Publication Date Title
JPH10507024A (ja) 分配されたアプリケーションの負荷分配支援ツール
Kremien et al. Methodical analysis of adaptive load sharing algorithms
US6330605B1 (en) Proxy cache cluster
US20020087612A1 (en) System and method for reliability-based load balancing and dispatching using software rejuvenation
Adam et al. Service middleware for self-managing large-scale systems
Lu et al. On the performance-driven load distribution for heterogeneous computational grids
CN114666335B (zh) 一种基于数据分发服务dds的分布式系统负载均衡装置
Saravanakumar et al. A novel load balancing algorithm for computational grid
JP4515262B2 (ja) フォールトトレランススキームを動的に切換えるための方法
JP2005501335A (ja) コンピュータ・リソースの負荷をコンピュータの間で分散する方法及びシステム
Johansson On the impact of network latency on distributed systems design
Yagoubi et al. Load balancing strategy in grid environment
Antonis et al. A hierarchical adaptive distributed algorithm for load balancing
JPH09293059A (ja) 分散システム及びその運用管理方法
CN116546028A (zh) 服务请求的处理方法、装置、存储介质及电子设备
CN116107741A (zh) 一种负载均衡调度方法、系统、电子设备及可读存储介质
CN114090256A (zh) 一种基于云计算的应用交付负载管理方法及其系统
Zhu et al. A scheduling framework for web server clusters with intensive dynamic content processing
Bhardwaj et al. A propound method for agent based dynamic load balancing algorithm for heterogeneous P2P systems
Leslie et al. Evaluation of loadsharing algorithms for heterogeneous distributed systems
Lu et al. Buffer and load balancing in locally distributed database systems
CN117149445B (zh) 一种跨集群负载均衡方法及装置、设备及存储介质
CN116055496B (zh) 一种监控数据采集方法、装置、电子设备及存储介质
Zhao et al. Qos-based algorithm for job allocation and scheduling in data grid
Lim et al. Neighbor's load prediction for dynamic load balancing in a distributed computational environment