JPH09120389A - クラスタ型コンピュータのジョブスケジュール方法及び装置 - Google Patents

クラスタ型コンピュータのジョブスケジュール方法及び装置

Info

Publication number
JPH09120389A
JPH09120389A JP7278647A JP27864795A JPH09120389A JP H09120389 A JPH09120389 A JP H09120389A JP 7278647 A JP7278647 A JP 7278647A JP 27864795 A JP27864795 A JP 27864795A JP H09120389 A JPH09120389 A JP H09120389A
Authority
JP
Japan
Prior art keywords
job
union
main memory
usage
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7278647A
Other languages
English (en)
Other versions
JP2940450B2 (ja
Inventor
Hideo Kubo
秀士 久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7278647A priority Critical patent/JP2940450B2/ja
Priority to FR9612990A priority patent/FR2740579B1/fr
Priority to US08/738,047 priority patent/US5881284A/en
Publication of JPH09120389A publication Critical patent/JPH09120389A/ja
Application granted granted Critical
Publication of JP2940450B2 publication Critical patent/JP2940450B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 クラスタ型のコンピュータシステムにおい
て、バッチジョブの動的なスケジュール方式を提供する
ことにより、複数の主記憶共用体間の負荷をバランスさ
せ、常に同程度の負荷状態に保つことにより、スループ
ットを上げ、ジョブの処理時間のばらつきを小さくし、
また、優先度の高い負荷に対する対処が常に可能な状態
に保つ。 【解決手段】 一定時間ごとに各主記憶共用体の資源使
用度合を測定し、これが低使用の状態にあった主記憶共
用体については、新しいジョブのスケジュールをジョブ
選択機構に直ちに要求する。また、ジョブの終了に当た
っては、終了した主記憶共用体が高使用であった場合に
は新しいジョブを要求せず、高使用でなかった場合にの
みジョブのスケジュールを要求する。これによって、各
主記憶共用体の負荷を目標値近辺に常に保つことができ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、クラスタ構成をと
るコンピュータシステムにおいて、主記憶共用体間の負
荷バランスをよくするようなバッチジョブのスケジュー
ル方法及び装置に関する。
【0002】
【従来の技術】近年、コンピュータシステムの構成は、
複数のプロセッサを並列に使用する方向に進みつつあ
る。汎用コンピュータにおいても、複数の、主記憶を共
用するプロセッサ群を何らかの共用記憶装置(大域記憶
装置)で結合したいわゆるクラスタ型の構成をとるよう
になってきている。この構成における主記憶を共用する
プロセッサ群の各々を、主記憶共用体と呼ぶことにす
る。
【0003】図2は本発明が対象とするクラスタ型コン
ピュータのハードウェア構成の一例を示す。複数のプロ
セッサたとえばP11からP1mが一つの主記憶装置S
1を共用して主記憶共用体C1を構成し、複数個のこの
ような主記憶共用体が大域記憶装置Gに結合されて、全
体で一つのクラスタ型コンピュータシステムを構成す
る。また、任意のプロセッサから他の主記憶共用体に属
するプロセッサに直接信号を送るために、信号線とこれ
らの上を送られる信号を交換するためのスイッチXを備
えることもある。主記憶共用体ごとにOSが存在して、
各主記憶共用体は基本的に独立なものとして制御され
る。
【0004】クラスタ型のコンピュータにおいては、主
記憶共用体間の負荷をバランスさせないと、十分な性能
を発揮させることはできない。並列型の構成であって
も、密結合マルチプロセッサの場合には、その内部にお
いてはプロセッサ間の負荷配分は自動的に最適に近く保
たれる。これは、CPUのサービスを待つプロセスの待
ち行列を共用主記憶上に保持し、空きになったCPUが
直ちにサービスを与えるべきプロセスを取りに行く構成
になっており、しかも、典型的には、個々のプロセスは
数ミリ秒ごとにCPUを解放し、また再度確保のために
待ち行列に並ぶ動作を繰り返しているからである。
【0005】しかし、クラスタ型の場合、特にバッチ処
理においては、一度ある主記憶共用体で実行を開始した
ジョブを他の主記憶共用体に移動させることは大きなオ
ーバヘッドを伴うため、主記憶共用体に対する負荷の割
り当ての単位は数分から数十分の処理時間を必要とする
ジョブという単位にならざるを得ず、このジョブを主記
憶共用体あたり数個から数十個並列に割り当てる。この
ジョブの組み合わせが、各主記憶共用体の間でバランス
していることが要求されることになる。しかし、基本的
に、実行待ちの個々のジョブの特性(処理時間の長さ、
CPUに対する負荷の割合など)は予め知ることができ
ない。また、全ての主記憶共用体の、たとえばCPU使
用率を、100%に近いところで揃えるのは、主記憶の
容量さえ許すなら、困難なことではない。十分に多くの
ジョブを全ての主記憶共用体で実行させるようにすれば
よいからである。しかし、実際にはオンラインの処理も
同一システムに共存することが多く、バッチジョブの中
にも優先処理を必要とするものが存在するので、これら
に対するサービスの質が落ちるこの方策は一般には採用
できない。これらの理由から、各主記憶共用体に対する
バッチジョブのスケジュール方法は、クラスタ型システ
ムにおいて極めて重要かつ困難な問題となっている。
【0006】従来からも、疎結合マルチプロセッサと呼
ばれる、独立のOSによって制御される複数のコンピュ
ータ(この各々も主記憶共用体と呼ぶことにする)を、
ディスクを介して結合したシステム形態は存在してい
た。ここでのジョブスケジュールは、米IBM社、MV
S/ESA JES3 Initialization
and Tuning Guide(JES3 Ver
sion5),SC28−1455 Dec.1994
(以下、文献1)に見るようなものである。
【0007】図8を用いて説明する。システムに投入さ
れたジョブはジョブ登録機構6によって受け入れられ、
システムに唯一のジョブ待ち行列5に登録されて実行を
待つ。ジョブ選択機構4は、利用者によって個々のジョ
ブに対して宣言されたジョブクラス及びプライオリティ
に応じて実行待ち状態のジョブを管理しており、各主記
憶共用体Ci上のジョブ実行管理機構8iから来るジョ
ブスケジュール要求を受けて、実行中のジョブ集合、シ
ステム全体としての制約、要求元主記憶共用体のジョブ
クラスごとにて定められている制約、実行待ちの個々の
ジョブのクラス、プライオリティ、などに基づいて、ジ
ョブ待ち行列5から最適なジョブを選択して要求元に渡
している。
【0008】スケジュールの要求元となる各主記憶共用
体には、同時に実行可能なジョブの数の上限が、イニシ
エータの数という形で規定されており、実行中のジョブ
が終了すると次に実行するべきジョブを求めてジョブ選
択機構に要求を出す。ジョブ選択機構は、要求に対して
常にジョブを渡すとは限らない。システム全体としての
実行中ジョブ数の上限などによる制約、あるいは制約に
適合する待ちジョブが存在しないなどの場合があり得る
からである。一方、新たなジョブが到着した場合には、
ジョブ選択機構はいずれかの主記憶共用体で実行可能で
あるか調べ、実行可能な主記憶共用体が存在したらそれ
にジョブを引き渡すことも行う。以上から、原則として
イニシエータの数に相当するだけのバッチジョブが、常
にそれぞれの主記憶共用体に割り当てられていることに
なる。
【0009】また、本発明に最も近いと思われる文献と
して、特開昭61−231656号公報「疎結合マルチ
プロセッサ」(以下、文献2)がある。ここでは、疎結
合マルチプロセッサに新たに「負荷分散制御装置」を導
入している。構成としては、本発明の図3における要求
判断機構3を負荷分散制御装置で置き換えたようなもの
と考えられる。ジョブの登録及び待ち行列の保持につい
ては明確な記述はないが、各主記憶共用体が行うことが
想定されている。各主記憶共用体は一定時間ごとに、各
々自分のCPU及びチャネルの負荷率を測定し、負荷分
散制御装置に通知する。負荷分散制御装置はこれらの負
荷率をそれぞれ積算し、積算値を一定時間ごとに比較
し、その結果CPU、チャネルの負荷率が予め主記憶共
用体ごとに指定されていた値より低い場合には、その主
記憶共用体にその旨通知する。通知を受けた主記憶共用
体は、次のジョブスケジュールの機会には、負荷率の低
いとされた資源を多く使うようなジョブを選択するよう
にする。ここでのジョブスケジュールの機会とは、その
主記憶共用体で実行していたジョブのうち一つのジョブ
が終了することにより、同時実行中のジョブ数が上限値
より低くなったときである。主記憶共用体ごとに、同時
実行中のジョブ数は原則として一定に保たれることにな
る。
【0010】バッチジョブに関する従来知られているス
ケジューリング方式は以上のようなものであり、主記憶
共用体間における負荷バランスという観点からは不十分
なものであった。基本的に各主記憶共用体の上限ジョブ
数によって均衡を取り、その他にはクラスごとのジョブ
数、ジョブごとに予め申告されるCPU負荷、メモリ負
荷に基づくしかなかった。文献1では、走行中のジョブ
による主記憶共用体ごとの資源使用状況の実績を反映し
た動的なスケジュールは不可能であった。文献2では、
主記憶共用体ごとの資源使用状況を測定しこれをスケジ
ュールに反映しようとしているが、同時実行ジョブ数を
動的に変化させていないので、(ジョブの終了を待つた
めに)制御のタイミングが大きく遅れ、また、限定され
た対応しかできず、あまり効果は上がらないものと考え
られる。
【0011】これを改善するために、システムジョブ数
の上限に対して主記憶共用体ごとのジョブ数上限の和が
大きくなるように設定しておき、システム内のジョブが
終了したときに、測定されている資源使用実績に基づい
て、負荷の軽い主記憶共用体に対してジョブをスケジュ
ールすることが考えられる。すなわち、システム内で実
行中のジョブ全体の数は原則として一定であるが、その
時点での資源使用状況の実績に応じて、各主記憶共用体
に割り当てるジョブ数を変化させることにより、負荷を
バランスさせようと言うものである。しかし、この方法
によっても、前述のようにバランスをとることに意味の
ある、たとえばCPU使用率90%以下のレベルで主記
憶共用体の負荷を揃えることは困難である。長時間の平
均として全ての主記憶共用体の使用率をたとえば80%
にすることは、システムジョブ数上限を適切に設定して
おくことによって可能であるが、短期的には主記憶共用
体間で相当なアンバランスが生じている。この原因とし
て、常にシステムジョブ数上限までのジョブを動かして
おくために、主記憶共用体間でアンバランスが生じて
も、いずれか一つのジョブが終了するまで対処できない
ことがあげられる。スケジュール法としては、長期的に
はもちろんとして、短期的にも常に動的に負荷のバラン
スを保ち、かつ、個々の主記憶共用体で見ても資源使用
度合の時間軸上での変動が小さいことが望ましい。
【0012】
【発明が解決しようとする課題】以上述べたように、従
来のスケジュール方法では、主記憶共用体間の負荷をバ
ランスさせる機能は、負荷の状況に応じて動的に働くよ
うになっておらず、主記憶共用体ごとに規定された同時
実行ジョブ数の上限による均衡をベースに、その枠内で
個々のジョブのジョブクラス、実行前に申告されたジョ
ブ特性(、及び場合によってはシステムの負荷状況)な
どに基づいて静的になされていた。このために、長期的
な平均値としてはともかく、短期的にも常に主記憶共用
体の負荷をバランスさせておくということの実現は困難
であり、システムから十分な性能を引き出すことができ
なかった。また、突発的に要求される優先的な処理をい
つでも優先的に実行可能にするために、主記憶共用体ご
との資源使用度合を短期的にも常に、目標とする高すぎ
ない水準に近く保つことによって余裕を確保しておくこ
とが望ましいが、これも困難であった。
【0013】本発明の目的は、このような従来の欠点を
除去して短期的にも主記憶共用体間の負荷を常にバラン
スした状態に保ち、しかも与えられた目標とする資源使
用度合に近いところでバランス状態を保つことを可能に
する、動的なバッチジョブスケジュール方法及び装置を
提供することにある。これによって、許容される条件の
下で最大のスループットを上げ、ジョブの処理時間のば
らつきを小さくし、また、オンライン系その他の優先度
の高い負荷に対して、常に対処が可能な状態に保つこと
ができる。
【0014】
【課題を解決するための手段】本発明に係わる第一のジ
ョブスケジュール方法は、複数の主記憶共用体と大域記
憶機構とから構成され、投入された実行前のジョブを前
記大域記憶機構に待ち行列として格納し、実行するべき
ジョブの選択を行うジョブ選択機構を備えるクラスタ型
コンピュータシステムにおいて、一定時間ごとに各主記
憶共用体における資源の使用度合を測定し、測定された
使用度合に基づいて、各主記憶共用体について低使用で
あるか否かを判定し、低使用と判定した主記憶共用体に
関しては新たなジョブを該主記憶共用体へスケジュール
するようにジョブ選択機構に要求を送り、また、前記主
記憶共用体におけるジョブの実行終了に伴って起動さ
れ、該主記憶共用体の前記測定されている使用度合に基
づいて該主記憶共用体が高使用か否かを判定し、高使用
と判定した場合には新しいジョブのスケジュールは要求
せず、高使用ではないと判定した場合には該主記憶共用
体への新たなジョブのスケジュールをジョブ選択機構に
要求することを特徴とする。
【0015】本発明に係わる第二のジョブスケジュール
方法は、前記資源の使用度合測定において、資源の使用
度合は一定時間ごとに前回測定時から今回までの間の平
均値を測定し、前記低使用、高使用の判定において第一
の閾値とこれより大きい第二の閾値を設け、測定結果の
使用度合が連続して一定回数だけ第一の閾値を下回って
いた場合にのみその主記憶共用体を低使用と判定してス
ケジュールを要求すると共に連続下回り回数を0にリセ
ットし、主記憶共用体におけるジョブの実行終了時に
は、該主記憶共用体の最新の測定値が第二の閾値を上回
っている場合のみ高使用と判定することを特徴とする。
【0016】本発明に係わる第三のジョブスケジュール
方法は、前記資源の使用度合測定において、資源の使用
度合は一定時間ごとに前回測定時から今回までの間の平
均値を測定し、前記低使用、高使用の判定において第一
の閾値とこれより大きい第二の閾値を設け、過去の使用
度合測定結果を総合して得られる使用度合推定値が第一
の閾値を下回っていた場合にのみその主記憶共用体を低
使用と判定してスケジュールを要求し、主記憶共用体に
おけるジョブの実行終了時には、該主記憶共用体の最新
の測定値が第二の閾値を上回っている場合のみ高使用と
判定することを特徴とする。
【0017】本発明に係わる第四のジョブスケジュール
方法は、前記第一の閾値より小さい第0の閾値を設け、
前記資源の使用度合測定値が第0の閾値を下回った場合
には直ちに低使用と判定してその主記憶共用体へのジョ
ブのスケジュールを要求するとともに連続下回り回数を
0にリセットすることを特徴とする。
【0018】本発明に係わる第一のジョブスケジュール
装置は、複数の主記憶共用体と大域記憶機構とから構成
されるクラスタ型コンピュータシステムにおいて、前記
各主記憶共用体における資源の使用度合を測定する機構
と、測定された資源使用度合を記憶しておく機構と、前
記測定の終了に伴って起動され、前記記憶されている使
用度合に基づいて、各主記憶共用体について低使用であ
るか否かを判定し、低使用と判定した主記憶共用体に関
しては新たなジョブを該主記憶共用体へスケジュールす
るようにジョブ選択機構に要求を送り、また、主記憶共
用体におけるジョブの実行終了に伴って起動され、前記
記憶されている使用度合に基づいて該主記憶共用体が高
使用か否かを判定し、高使用と判定した場合には新しい
ジョブのスケジュールは要求せず、高使用ではないと判
定した場合には該主記憶共用体への新たなジョブのスケ
ジュールをジョブ選択機構に要求するジョブ要求判断機
構と、該システムにおいて実行されるべき実行開始前の
ジョブを受け入れ、ジョブ待ち行列に登録するジョブ登
録機構と、前記ジョブ待ち行列を前記大域記憶機構上に
保持するジョブ待ち行列機構と、前記ジョブ要求判断機
構からの要求を受けて前記待ち行列からジョブを選択
し、指定された主記憶共用体上のジョブ実行管理機構に
該ジョブを渡して実行せしめるジョブ選択機構と、前記
主記憶共用体ごとにその上に存在し、前記ジョブ選択機
構から渡されたジョブの実行を管理し、ジョブの実行が
終了するとジョブ要求判断機構にジョブの終了を通知す
るジョブ実行管理機構とからなる。
【0019】本発明に係わる第二のジョブスケジュール
装置は、第一のジョブスケジュール装置における資源の
使用度合測定機構において、資源の使用度合は一定時間
ごとに前回測定時から今回までの間の平均値を測定し、
前記ジョブ要求判断機構において第一の閾値とこれより
大きい第二の閾値を設け、測定結果の使用度合が連続し
て一定回数だけ第一の閾値を下回っていた場合にのみそ
の主記憶共用体を低使用と判定してスケジュールを要求
すると共に連続下回り回数を0にリセットし、主記憶共
用体におけるジョブの実行終了時には、該主記憶共用体
の最新の測定値が第二の閾値を上回っている場合のみ高
使用と判定することを特徴とする。
【0020】本発明に係わる第三のジョブスケジュール
装置は、第一のジョブスケジュール装置における資源の
使用度合測定機構において、資源の使用度合は一定時間
ごとに前回測定時から今回までの間の平均値を測定し、
前記ジョブ要求判断機構において第一の閾値とこれより
大きい第二の閾値を設け、過去の使用度合測定結果を総
合して得られる使用度合推定値が第一の閾値を下回って
いた場合にのみその主記憶共用体を低使用と判定してス
ケジュールを要求し、主記憶共用体におけるジョブの実
行終了時には、該主記憶共用体の最新の測定値が第二の
閾値を上回っている場合のみ高使用と判定することを特
徴とする。
【0021】本発明に係わる第四のジョブスケジュール
装置は、前記ジョブ要求判断機構において、第一の閾値
より小さい第0の閾値を設け、前記資源の使用度合測定
値が第0の閾値を下回った場合には直ちに低使用と判定
してその主記憶共用体へのジョブのスケジュールを要求
するとともに連続下回り回数を0にリセットすることを
特徴とする。
【0022】本発明に係わる第五のジョブスケジュール
装置は、ジョブ選択機構が各主記憶共用体ごとに分散し
て存在し、各々の主記憶共用体のジョブ選択を分担して
実施することを特徴とする。
【0023】本発明に係わる第六のジョブスケジュール
装置は、ジョブ選択機構がシステムに一つだけ存在し、
集中的にその機能を実行することを特徴とする。
【0024】
【発明の実施の形態】本発明においては、処理を実行中
の各主記憶共用体の資源使用度合を測定して記憶し、こ
の測定結果に基づいて、資源使用度合の低い(低使用
の)主記憶共用体については新しいジョブのスケジュー
ルを行い、また、実行中であったジョブの終了に当たっ
ては、終了した主記憶共用体に対して原則として新しい
ジョブをスケジュールするが、その主記憶共用体の資源
使用度合が高い(高使用の)場合にはスケジュールを行
わないことにより、各主記憶共用体の資源使用度合をほ
ぼ一定に保つことができる。これによって、クラスタ型
コンピュータにおけるバッチ処理において、システムを
構成する主記憶共用体間の負荷を動的にバランスさせる
と共に、各主記憶共用体における負荷を、目標として与
えられた一定レベルに保ち、その時間的な変動も小さく
押さえることができる。
【0025】本発明に係わるジョブスケジュール方法及
び装置は、前記ジョブスケジュール方法における高使
用、低使用の判断方法を具体化している。第一の閾値と
これより大きい第二の閾値を設ける。資源使用度合の測
定を一定時間ごとに前回測定時以後の平均値の測定とし
て行い、測定結果の使用度合が連続して一定回数第一の
閾値を下回った場合のみ低使用とする。これにより、一
回だけの短時間の平均値の測定で判断する場合に起こり
やすい、瞬間的な使用度合の低下を低使用と判断する誤
りを防止できる。この誤りは頻繁に起こるものであり、
これに基づいてスケジュールを行うと、主記憶共用体の
負荷は目標よりも高すぎるものとなる。また、この誤り
を防止するために測定間隔を長くとることが考えられる
が、この方策を採ると古い過去の測定値を引きずること
になり、「現在の状況に応じた動的な制御」が実現しに
くい。
【0026】上記のような誤りを避ける、低使用状態の
別の判断方法として、過去の資源使用率測定値を用い
て、近い過去の測定値ほど重みを高くして加重平均を取
ることにより総合的に現在の使用率を推定し、この推定
値が第一の閾値を下回った場合に低使用とする方法もあ
る。ジョブ終了に伴う新しいジョブの要求の判断におい
ては、終了した主記憶共用体の最新の使用度合測定値
が、第二の閾値を上回っていた場合には高使用とする。
ジョブ終了の場合は、実行中ジョブ数が減少するので原
則としては新たなジョブを開始させることになるが、直
前の過去の資源使用度合が高すぎた場合には開始を抑制
することにより、主記憶共用体の負荷を一定に保つこと
ができる。
【0027】本発明に係わるジョブスケジュール方法及
び装置は、前記ジョブスケジュール方法における低使用
の判断方法に追加を行っている。第一の閾値よりも小さ
い第0の閾値を設け、資源の使用度合の測定値が第0の
閾値を下回っていた場合には、一定回数を待たず直ちに
低使用であるとする。これによって、急激に起こった負
荷の減少という異常事態に迅速に対応できる。
【0028】本発明に係わるジョブスケジュール装置
は、ジョブ選択機構の存在形態を具体化している。ジョ
ブ選択機構がシステムに一つだけ存在し集中的にジョブ
選択を実施する形態をとることができる。これにより、
全ての主記憶共用体についてそれらが実行中のジョブの
組み合わせを常に把握でき、特定の主記憶共用体のため
のジョブ選択の要求をジョブ要求判断機構から受けたと
き、負荷バランスの観点だけでなくシステム全体から見
て最適なジョブを選択することができる。
【0029】本発明に係わるジョブスケジュール装置
は、ジョブ選択機構のもう一つの存在形態を具体化して
いる。ジョブ選択機構が各主記憶共用体ごとに分散して
存在する形態をとることができる。この場合には要求判
断機構も同様に分散していることが想定される。ジョブ
選択機構は自らが関与する主記憶共用体だけの事情から
判断してジョブ待ち行列からジョブを選択することにな
る。これにより、特定の主記憶共用体にジョブ選択のた
めの負荷が集中することを防ぐことができ、また、シス
テムがジョブ選択ネックにより性能低下を起こすのを防
ぐことができる。
【0030】図1から図7を参照して本発明の実施の形
態について説明する。
【0031】図2は本発明が対象とするクラスタ型コン
ピュータのハードウェア構成を示す。複数のプロセッサ
たとえばP11からP1mが一つの主記憶装置S1を共
用して主記憶共用体C1を構成し、複数(ここではn)
個のこのような主記憶共用体が大域記憶装置Gに結合さ
れて、全体で一つのクラスタ型コンピュータシステムを
構成する。大域記憶装置は一般に、部分的には半導体記
憶装置、部分的には磁気ディスク装置等の二次記憶装置
で構成され、システム全体の共有情報の格納や主記憶共
用体間の情報交換のために用いられる。
【0032】任意のプロセッサ間における信号の直接的
なやりとりを可能にするために、各プロセッサに結合さ
れた信号線L11からLnmと、それらの上の信号を交
換するスイッチXを備えてもよい。主記憶共用体ごとに
OSが存在して、各主記憶共用体は基本的に独立なもの
として制御される。ただし、主記憶共用体を論理的に複
数に分割して、分割された各々に別のOSを載せて制御
させることも可能である。
【0033】以上のような構成において、ジョブのバッ
チ処理を行う場合、投入されたジョブはいずれかの主記
憶共用体上のジョブ登録機構によって受け入れられ、大
域記憶装置G上のジョブ待ち行列機構に登録、集積され
て処理の開始を待っている。どのジョブの処理も、いず
れの主記憶共用体においても実行可能であるとする。
【0034】図3は本発明のジョブスケジュール装置の
構成の例を示す。前述のように、利用者によって投入さ
れたジョブは、ジョブ登録機構6によって受け入れら
れ、大域記憶G上のジョブ待ち行列機構5に登録されて
(601)、ここで処理の開始を待っている。一方、測
定機構1は各主記憶共用体ごとに存在し、一定時間(た
とえば1秒)ごとに起動されて前回の測定以後のその主
記憶共用体における資源使用度合を測定する。ここで、
資源使用度合としてはCPU使用率、チャネルの使用
率、主記憶領域の使用率、ページング頻度、入出力頻
度、特性の制御テーブルなどソフトウェア資源の使用率
などが対象となりうる。
【0035】測定機構1は測定結果を記憶機構2に格納
する(102)と共に、ジョブ要求判断機構3に対して
測定が行われたことを通知する(101)。通知を受け
た要求判断機構3は、図1(A)の流れ図に示すよう
に、当該主記憶共用体の使用度合が低使用であるか否か
を、格納されている測定結果に基づいて判断し(3
2)、低使用であったならば当該主記憶共用体に新しい
ジョブを開始させるように、ジョブの選択要求301を
ジョブ選択機構4に送る(33)。低使用でなければジ
ョブの選択は要求しない(34)。
【0036】また、ジョブ選択機構4はジョブ登録機構
6によって新しいジョブが登録されたときにも起動され
る(602)。これは、新しいジョブの開始を以前から
要求していた主記憶共用体が存在した場合に、その要求
に応えることを試みるためである。要求を受けたジョブ
選択機構4は、指定された主記憶共用体に適合したジョ
ブをジョブ待ち行列5中から選択し(501)、指定さ
れた主記憶共用体上のジョブ実行管理機構7に通知する
(402)。ただし、適当なジョブが存在しない場合も
あり得て、このときには通知しない。
【0037】ジョブ実行管理機構7は選択されたジョブ
の通知を受けると、そのジョブをジョブ待ち行列5から
取り出して実行を開始し、実行中には実行の管理を行
い、実行が終了すると要求判断機構3に通知する(70
1)。通知を受けた要求判断機構3は図1(B)の流れ
図に示すように、ジョブの実行を終了した主記憶共用体
の資源使用度合が高使用であるか否かを、記憶機構に格
納されている測定結果に基づいて判断し(37)、高使
用でなかったならば、当該主記憶共用体のために新しい
ジョブをスケジュールするようにジョブ選択機構4に要
求301を送る(38)。高使用であったならば、ジョ
ブの選択は要求しない(39)。基本的に使用度合のみ
に基づいて、主記憶共用体上で同時に実行するジョブ数
を決定するので、同時実行ジョブ数の上限(いわゆるイ
ニシエータ数)は、事実上制限にならない程度に大きめ
に設定しておく必要がある。
【0038】図4は資源の使用度合が低使用か否かを判
定する実施の形態を示す。低使用か否かを判定するため
には第1の閾値とこれより小さい第0の閾値の2種類の
閾値を用意しておく。また、第1の閾値を連続して下回
った回数をカウントする変数cとその上限Nを与えてお
く。最新の測定値が第0の閾値を下回っていた場合は、
無条件で低使用と判定する(321→326)。そうで
なかった場合も、測定値がN回連続して第1の閾値を下
回ったならば、低使用と判定する(322→326)。
以上以外の場合は、低使用ではないと判定する。低使用
であると判定した場合には、変数cを0にする(32
5)ことにより、それまでの連続下回り回数をリセット
する。第0の閾値を下回った場合にリセットが必要なの
は、リセットしておかないと引き続いて第1の閾値を下
回る可能性が高く、再びスケジュール要求が出て実行ジ
ョブ数が過剰になる可能性が高いからである。
【0039】本方法において、第1の閾値は、目標とす
る使用度合の近辺に設定し、第0の閾値はそれの80%
程度の値に設定するのがよい。また、図示はしていない
が、資源の使用度合が高使用か否かの判定には、第1の
閾値より大きい第2の閾値を設けておく。最新の測定値
がこれを上回っていたならば高使用と判定し、そうでな
ければ高使用ではないと判定する。
【0040】資源の使用度合が低使用か否かを判定する
別の方法として、過去に長期にわたって得られている測
定値に基づいて現在の使用度合を推定し、この推定値か
ら判断する実施の形態をあげる(図示せず)。測定機構
1による使用度合の測定の度に、次の式を用いて現在の
使用度合を推定する。測定値をm、推定値をe、現在時
刻をT、測定間隔をtとする。
【0041】 e(T)=a*m(T)+(1−a)*e(T−t) ここで、aはパラメタであり、0<a≦1 また、e(T)の初期値を、e(T0 )=m(T0
t)とする すなわち、今回の測定値にaを乗じたものと前回の推定
値に1−aを乗じたものとの和を今回の推定値とする。
この式は次のように展開できる。
【0042】e(T)=a*m(T)+a(1−a)*
m(T−t)+a(1−a)2 m(T−2t)+a(1
−a)3 m(T−3t)+・・・・ この式は、推定値が、近い過去の測定値ほど重視する形
で過去の測定値を全部取り込んだものとなっていること
を示している。aが大きい(1に近い)ほど、近い過去
を重視する度合いが高いことになる。推定値を用いて低
使用か否かを判定するには、単に推定値と第1の閾値を
比較し、第1の閾値を下回っていたならば低使用と判定
する。推定値を用いる場合に第0の閾値の考え方を併用
することも考えられ、一般的にはその方が望ましい。
【0043】図5はジョブ選択機構4の機能の例を示
す。この機構の本来の中心的機能は、指定された主記憶
共用体Ciに適合したジョブの選択(46)にあるが、
本発明ではこの機能については従来技術を用いる。すな
わち、対象主記憶共用体の資源の余裕度、実行中及び実
行待ちの各ジョブのプライオリティとクラス、システム
全体としての制約、指定された主記憶共用体とジョブク
ラスごとに与えられている制約などに基づいて最適なジ
ョブを選択する。図5の実施の形態では、ジョブ登録機
構6によって新しいジョブが登録されたときに、ジョブ
の開始を以前から要求していた主記憶共用体が存在した
場合には直ちにジョブの選択を行うようにするための機
能を示している。
【0044】図5(B)では、ジョブ選択機構4は、ジ
ョブの選択要求301で起動され(45)、指定された
主記憶共用体Ciに適合するジョブの選択を行う(4
6)。適当なジョブが存在しなかった(47)ときに
は、その主記憶共用体Ciを未充足共用体として記憶し
ておく(471)。存在した場合には、指定された主記
憶共用体Ciのジョブ実行管理機構7iに選択されたジ
ョブを通知して、ジョブの引き取りと実行を促し(4
8)、共用体Ciが未充足共用体として登録されていた
ならばこの登録をクリアする(49)。
【0045】図5(A)はジョブ登録機構6からの新し
いジョブの登録通知602によってジョブ選択機構4が
起動された場合(41)の動作を示し、もし未充足共用
体が記憶されていれば、その全ての未充足共用体を対象
として、ジョブ選択要求で起動された場合と同一の動作
を行う(43)。個々の共用体に対するこの動作の内容
は、図5(B)に記載されているものである。未充足共
用体が記憶されていなかった場合は、何もしない(42
→44)。
【0046】以上では図3における各機構の機能内容に
ついて述べてきたが、これらの機構を物理的に図2の上
のどこで実現するかという問題がある。測定機構1は各
主記憶共用体を測定し、ジョブ実行管理機構7は各主記
憶共用体上での実行を密接に管理するので、主記憶共用
体C1〜Cnにそれぞれ持たせる必要がある。ジョブ待
ち行列機構5は、ジョブ選択の柔軟性を確保するために
大域記憶Gに持たせるべきである。ジョブ登録機構6
は、全ての主記憶共用体に存在しても、特定のいくつか
の主記憶共用体だけに存在してもよい。ジョブ選択機構
4に関しては、1つの主記憶共用体Ciだけに置きシス
テム全体を集中的に管理させるか、各主記憶共用体に分
散して持たせ分散管理を行うかという2つの実現法があ
る。これらの実現法にはそれぞれに利害得失があり、シ
ステムの使用形態、使用目的などによって選択するべき
である。
【0047】ジョブ選択機構4を各主記憶共用体C1〜
Cnの上に分散させる実施の形態を図6を参照しつつ説
明する。ここでは、測定機構1、記憶機構2、要求判断
機構3、ジョブ選択機構4、ジョブ実行機構7は全ての
主記憶共用体に、同一機能のものが分散配置されてい
る。主記憶共用体Cjを代表例として述べる。
【0048】利用者によって投入されたジョブは、特定
のまたは全ての主記憶共用体が備えているジョブ登録機
構6iによって受け入れられ、大域記憶G上のジョブ待
ち行列機構5に登録される。測定機構1jは一定時間ご
とにその主記憶共用体Cjにおける資源使用度合を測定
し、結果をCj上にとられた記憶機構2jに格納すると
共に、Cj上のジョブ要求判断機構3jに対して測定が
行われたことを通知する。
【0049】通知を受けた要求判断機構3jは、当該主
記憶共用体Cjの使用度合が低使用であるか否かを、測
定結果2jに基づいて判断し、低使用であったならば当
該主記憶共用体Cjに新しいジョブを開始させるよう
に、ジョブの選択要求をCj上のジョブ選択機構4jに
送る。また、ジョブ選択機構4jは任意のジョブ登録機
構6iによって新しいジョブが登録されたときにも起動
される。
【0050】ジョブ登録機構6iからの通知は、スイッ
チXとこれを通る信号線Lが存在する場合は、これを介
して全ての主記憶共用体に対して行われる。存在しない
場合は、ジョブ登録機構6iは通知をジョブ待ち行列中
に書き込み、ジョブ選択機構4jが定期的にジョブ待ち
行列5を調べにいくなどの手段をとる必要がある。要求
を受けたジョブ選択機構4jは、自らが属する主記憶共
用体Cjに適合したジョブをジョブ待ち行列5中から選
択し、Cj上のジョブ実行管理機構7jに通知する。
【0051】ジョブ実行管理機構7jは、通知されたジ
ョブをジョブ待ち行列5から取り出して実行を開始し、
実行中には実行の管理を行い、終了するとCj上の要求
判断機構3jに通知する。通知を受けた要求判断機構3
jは、ジョブの実行を終了した主記憶共用体Cjの資源
使用度合が高使用であるか否かを、記憶機構2jに格納
されている測定結果に基づいて判断し、高使用でなかっ
たならば、当該主記憶共用体のために新しいジョブをス
ケジュールするように、Cj上のジョブ選択機構4jに
要求を送る。ジョブ選択機構4jは自らが関与する主記
憶共用体Cjだけの事情から判断して、ジョブ待ち行列
からジョブを選択していることになる。
【0052】以上のような構成により、特定の主記憶共
用体にジョブ選択のための負荷が集中することを防ぐこ
とができ、また、システムがジョブ選択ネックにより性
能低下を起こすのを防ぐことができる。ただし、システ
ム全体の実行待ちジョブを見渡すことはできるが、他の
主記憶共用体上で実行中のジョブの集まりについての情
報を得るのは困難なので、システム全体の観点からは選
択するべきジョブの判断を誤る可能性がある。
【0053】集中的にジョブ選択を実施する形態を図7
を参照しつつ説明する。この場合にはプロセッサ間の信
号線L11〜LnmとスイッチXは必須である。ジョブ
選択機能を持つ特定の主記憶共用体をCiとし、一般の
主記憶共用体をCjとして説明する。
【0054】利用者によって投入されたジョブは、全て
のあるいは特定の主記憶共用体に実装されているジョブ
登録機構6kによって受け入れられ、大域記憶G上の待
ち行列機構5に集中的に登録されて、ここで処理の開始
を待っている。一方、測定機構1jは各主記憶共用体ご
とに存在し、一定時間ごとに起動されてCjにおける資
源使用度合を測定し、測定結果を大域記憶Gの中にとら
れた記憶機構2に格納すると共に、Ci上に実装されて
いるジョブ要求判断機構3に対して、測定が行われたこ
とを信号線を介して通知する。
【0055】通知を受けた要求判断機構3は、当該主記
憶共用体Cjの使用度合が低使用であるか否かを、格納
されている測定結果2に基づいて判断し、低使用であっ
たならば当該主記憶共用体Cjに新しいジョブを開始さ
せるように、ジョブの選択要求をCi上に実装されてい
るジョブ選択機構4に送る。
【0056】また、ジョブ選択機構4は任意の主記憶共
用体Ck上のジョブ登録機構6kによって新しいジョブ
が登録されたときにも、信号線Lを介して起動される。
要求を受けたジョブ選択機構4は、指定された主記憶共
用体Cjに適合したジョブをジョブ待ち行列5中から選
択し、Cj上のジョブ実行管理機構7jに信号線を介し
て通知する。
【0057】ジョブ実行管理機構7jは通知されたジョ
ブをジョブ待ち行列5から取り出して実行を開始し、実
行中には実行の管理を行い、実行が終了するとCi上の
要求判断機構3に、信号線を介して通知する。通知を受
けた要求判断機構3は、ジョブの実行を終了した主記憶
共用体Cjの資源使用度合が高使用であるか否かを、記
憶機構2に格納されている測定結果に基づいて判断し、
高使用でなかったならば、当該主記憶共用体のために新
しいジョブをスケジュールするようにCi上のジョブ選
択記機構4に要求を送る。
【0058】上記の集中的にジョブ選択を実施する形態
では、測定結果の記憶機構2を大域記憶G上にとり、ま
た、要求判断機構3及びジョブ選択機構4を同一の特定
の主記憶共用体Ci上に配置するとしている。しかし、
ジョブ選択機構4は特定の主記憶共用体Ci上に配置す
るが、記憶機構2及び要求判断機構3は測定及びジョブ
の割当対象となる全ての主記憶共用体Cj上に分散配置
する実装法もある。この場合、要求判断機構3jとジョ
ブ選択機構4の間の通知は信号線Lを介して行われる。
【0059】以上のジョブ選択を集中的に実施する形態
は、全ての主記憶共用体C1〜Cnについてそれらが実
行中のジョブの組み合わせを常に把握でき、特定の主記
憶共用体Cjのためにジョブ要求判断機構から要求を受
けたとき、負荷バランスの観点だけでなくシステム全体
から見て最適なジョブを選択することができる。一方、
特定の主記憶共用体Ciにジョブ選択の負荷が集中する
ために負荷のアンバランスを生じたり、ジョブ選択ネッ
クのためにシステム性能の低下を起こすおそれもある。
この点については、上記のように要求判断機構3を各主
記憶共用体に分散させることにより、多少緩和すること
が可能である。
【0060】以上の実施の形態において、物理的な実体
である主記憶共用体Cjをジョブ割り当ての単位として
きたが、一つの主記憶共用体を論理的に複数に分割しそ
の各々を独立のOSで制御させるという形態をシステム
がとる場合は、独立のOSで制御される範囲をジョブ割
り当ての単位とすることもできる。大域記憶Gの用途と
しては、各主記憶共用体が実行中のジョブの集まりにつ
いての情報の格納場所などとしても使うことができる。
【0061】負荷状況の判定のベースとなる資源使用度
合の測定では、CPU使用率、チャネル使用率、主記憶
使用率、ページング頻度、入出力頻度、特定の制御テー
ブルなどソフトウェア資源の使用率などを対象とするこ
とができる。そのシステムにとって最も貴重で、ネック
となっている資源の使用度合を測定し、これに基づいて
ジョブのスケジュールを行うべきである。主記憶共用体
ごとの資源使用度合の測定のタイミングについては、全
体を一斉に行うことも、個々に別のタイミングで行うこ
ともできる。効果において大きな差が生ずるとは考えら
れない。
【0062】また、以上の実施の形態では3種類の閾値
を導入している。これらの値は各主記憶共用体でそれぞ
れ同一であるのが普通ではあるが、判定のベースとする
資源の種類、負荷配分の目的やシステム構成によって
は、主記憶共用体ごとにこれらの閾値を変えることが望
ましい場合もある。ハードウェアシステムの構成とし
て、全ての主記憶共用体が同数のプロセッサを持つ例を
挙げているが、アンバランスであってもかまわない。ま
た、個々のプロセッサの能力や主記憶の容量も、必ずし
も同一である必要はない。アンバランスがある場合に
は、上記のようにそれに応じて閾値を変えることが望ま
しい。
【0063】
【発明の効果】以上説明したように本発明によれば、短
期的にも主記憶共用体間の負荷を常にバランスした状態
に保ち、しかも与えられた目標とする資源使用度合に近
いところでバランス状態を保つことを可能にする、動的
なバッチジョブスケジュール方法が実現できる。シミュ
レーション実験によって評価したところ、資源使用度合
としてCPU使用率を採用した本発明の方法の適用によ
り、同時実行ジョブ数のみで制御する方法に比較し、C
PU使用率のばらつきを20から30%低く押さえるこ
とができていた。これによって、オンライン系その他の
優先度の高い負荷に対して、常に対処が可能な状態を保
つことが可能となる。また、ジョブ処理時間のばらつき
を小さくすることができる。前述のシミュレーション実
験では、バッチジョブの処理時間のばらつきを20から
30%低く押さえることができていた。
【図面の簡単な説明】
【図1】ジョブ要求判断機構の動作を説明するフローチ
ャートである。
【図2】本発明が対象とするクラスタ型コンピュータシ
ステムの例を示す図である。
【図3】本発明の一実施形態を示す構成図である。
【図4】主記憶共用体が低使用であるか否かを判定する
動作を説明するためのフローチャートである。
【図5】ジョブ選択機構の動作を説明するフローチャー
トである。
【図6】ジョブ選択を分散して行う実施の形態の構成図
である。
【図7】ジョブ選択を集中して行う実施の形態の構成図
である。
【図8】従来のジョブスケジュール装置を示す構成図で
ある。
【符号の説明】
1 資源使用度合いの測定機構 2 測定結果の記憶機構 3 ジョブ要求判断機構 4 ジョブ選択機構 5 ジョブ待ち行列機構 6 ジョブ登録機構 7 ジョブ実行管理機構 8 従来例のジョブ実行管理機構 P11〜P1m,Pn1〜Pnm プロセッサ S1〜Sn 主記憶装置 C1〜Cn 主記憶共用体 G 大域記憶装置 L11〜Lnm 信号線 X スイッチ

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】複数の主記憶共用体と大域記憶機構とから
    構成され、投入された実行前のジョブを前記大域記憶機
    構に待ち行列として格納し、実行するべきジョブの選択
    を行い、選択されたジョブを前記主記憶共用体にて実行
    するクラスタ型コンピュータシステムにおけるジョブス
    ケジュール方法において、 一定時間ごとに各主記憶共用体における資源の使用度合
    を測定し、測定された使用度合に基づいて、各主記憶共
    用体について低使用であるか否かを判定し、低使用と判
    定した主記憶共用体に関しては新たなジョブを該主記憶
    共用体へスケジュールし、前記主記憶共用体におけるジ
    ョブの実行終了に伴って該主記憶共用体の前記測定され
    ている使用度合に基づいて該主記憶共用体が高使用か否
    かを判定し、高使用と判定した場合には新しいジョブの
    スケジュールは行わず、高使用ではないと判定した場合
    には該主記憶共用体への新たなジョブのスケジュールを
    行うことを特徴とする、ジョブスケジュール方法。
  2. 【請求項2】前記資源の使用度合の測定は、一定時間ご
    とに平均値を測定し、 前記低使用、高使用の判定は、第一の閾値とこれより大
    きい第二の閾値とを設け、前記測定結果の使用度合が連
    続して一定回数だけ第一の閾値を下回っていた場合にの
    みその主記憶共用体を低使用と判定し、主記憶共用体に
    おけるジョブの実行終了時には、該主記憶共用体の最新
    の測定値が第二の閾値を上回っている場合のみ高使用と
    判定することを特徴とする請求項1に記載のジョブスケ
    ジュール方法。
  3. 【請求項3】前記使用度合の測定は、一定時間ごとに平
    均値を測定し、 前記低使用、高使用の判定は、第一の閾値とこれより大
    きい第二の閾値とを設け、過去の使用度合測定結果を総
    合して得られる使用度合推定値が第一の閾値を下回って
    いた場合にのみその主記憶共用体を低使用と判定し、主
    記憶共用体におけるジョブの実行終了時には、該主記憶
    共用体の最新の測定値が第二の閾値を上回っている場合
    のみ高使用と判定することを特徴とする請求項1に記載
    のジョブスケジュール方法。
  4. 【請求項4】前記第一の閾値より小さい第0の閾値を設
    け、前記資源の使用度合の測定値が第0の閾値を下回っ
    た場合には直ちに低使用と判定してその主記憶共用体へ
    のジョブのスケジュールを行うことを特徴とする請求項
    2、又は3に記載のジョブスケジュール方法。
  5. 【請求項5】複数の主記憶共用体と大域記憶機構とから
    構成されるクラスタ型コンピュータにおけるジョブスケ
    ジュール装置において、 前記各主記憶共用体における資源の使用度合を測定する
    測定機構と、 測定された資源使用度合を記憶しておく記憶機構と、 前記測定の終了に伴って起動され、前記記憶されている
    使用度合に基づいて、各主記憶共用体について低使用で
    あるか否かを判定し、低使用と判定した主記憶共用体に
    関しては新たなジョブを該主記憶共用体へスケジュール
    するようにジョブ選択機構に要求を送り、また、主記憶
    共用体におけるジョブの実行終了に伴って起動され、前
    記記憶されている使用度合に基づいて該主記憶共用体が
    高使用か否かを判定し、高使用と判定した場合には新し
    いジョブのスケジュールは要求せず、高使用ではないと
    判定した場合には該主記憶共用体への新たなジョブのス
    ケジュールをジョブ選択機構に要求するジョブ要求判断
    機構と、 該システムにおいて実行されるべき実行開始前のジョブ
    を受け入れ、ジョブ待ち行列に登録するジョブ登録機構
    と、 前記ジョブ待ち行列を前記大域記憶機構上に保持するジ
    ョブ待ち行列機構と、 前記ジョブ要求判断機構からの要求を受けて前記ジョブ
    待ち行列からジョブを選択し、指定された主記憶共用体
    上のジョブ実行管理機構に該ジョブを通知して実行せし
    めるジョブ選択機構と、 前記主記憶共用体ごとにその上に存在し、前記ジョブ選
    択機構から通知されたジョブの実行を管理し、ジョブの
    実行が終了するとジョブ要求判断機構にジョブの終了を
    通知するジョブ実行管理機構とからなるジョブスケジュ
    ール装置。
  6. 【請求項6】前記資源の使用度合測定機構は、資源の使
    用度合を一定時間ごとに平均値を測定し、 前記ジョブ要求判断機構は、第一の閾値とこれより大き
    い第二の閾値を設け、測定結果の使用度合が連続して一
    定回数だけ第一の閾値を下回っていた場合にのみその主
    記憶共用体を低使用と判定してスケジュールを要求し、
    主記憶共用体におけるジョブの実行終了時には、該主記
    憶共用体の最新の測定値が第二の閾値を上回っている場
    合のみ高使用と判定することを特徴とする請求項5に記
    載のジョブスケジュール装置。
  7. 【請求項7】前記資源の使用度合測定機構は、資源の使
    用度合の一定時間ごとの平均値を測定し、 前記ジョブ要求判断機構は、第一の閾値とこれより大き
    い第二の閾値を設け、過去の使用度合測定結果を総合し
    て得られる使用度合推定値が第一の閾値を下回っていた
    場合にのみその主記憶共用体を低使用と判定してスケジ
    ュールを要求し、主記憶共用体におけるジョブの実行終
    了時には、該主記憶共用体の最新の測定値が第二の閾値
    を上回っている場合のみ高使用と判定することを特徴と
    する請求項5に記載のジョブスケジュール装置。
  8. 【請求項8】前記ジョブ要求判断機構は、第一の閾値よ
    り小さい第0の閾値を設け、前記資源の使用度合の測定
    値が第0の閾値を下回った場合には直ちに低使用と判定
    してその主記憶共用体へのジョブのスケジュールを要求
    することを特徴とする請求項6、又は7に記載のジョブ
    スケジュール装置。
  9. 【請求項9】前記ジョブ選択機構が、各主記憶共用体ご
    とに一つずつ分散して存在し、各々の主記憶共用体のジ
    ョブ選択を分担して実行することを特徴とする、請求項
    5、6、7又は8に記載のジョブスケジュール装置。
  10. 【請求項10】前記ジョブ選択機構が、システムに一つ
    だけ存在し、集中的にその機能を実行することを特徴と
    する、請求項5、6、7又は8に記載のジョブスケジュ
    ール装置。
JP7278647A 1995-10-26 1995-10-26 クラスタ型コンピュータのジョブスケジュール方法及び装置 Expired - Fee Related JP2940450B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7278647A JP2940450B2 (ja) 1995-10-26 1995-10-26 クラスタ型コンピュータのジョブスケジュール方法及び装置
FR9612990A FR2740579B1 (fr) 1995-10-26 1996-10-24 Methode d'ordonnancement d'un travail dans un systeme informatique en grappe et son dispositif
US08/738,047 US5881284A (en) 1995-10-26 1996-10-25 Method of scheduling a job in a clustered computer system and device therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7278647A JP2940450B2 (ja) 1995-10-26 1995-10-26 クラスタ型コンピュータのジョブスケジュール方法及び装置

Publications (2)

Publication Number Publication Date
JPH09120389A true JPH09120389A (ja) 1997-05-06
JP2940450B2 JP2940450B2 (ja) 1999-08-25

Family

ID=17600201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7278647A Expired - Fee Related JP2940450B2 (ja) 1995-10-26 1995-10-26 クラスタ型コンピュータのジョブスケジュール方法及び装置

Country Status (3)

Country Link
US (1) US5881284A (ja)
JP (1) JP2940450B2 (ja)
FR (1) FR2740579B1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031771A (ja) * 2003-07-08 2005-02-03 Hitachi Ltd ジョブスケジューリング管理方法及びシステム並びにプログラム
US7707581B2 (en) 2005-02-28 2010-04-27 International Business Machines Corporation Method and system for managing server load to execute transactions of an application program on multiple servers
JP2010244500A (ja) * 2009-03-16 2010-10-28 Nec Corp 分散処理システムおよび分散処理方法
JP2011186546A (ja) * 2010-03-04 2011-09-22 Nec System Technologies Ltd 負荷分散システム
US8386611B2 (en) 2003-10-29 2013-02-26 International Business Machines Corporation Information system, load control method, load control program and recording medium
US8832695B2 (en) 2011-08-19 2014-09-09 Fujitsu Limited Method of scheduling jobs and information processing apparatus implementing same

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024449B1 (en) 1996-11-29 2006-04-04 Ellis Iii Frampton E Global network computers
US6732141B2 (en) 1996-11-29 2004-05-04 Frampton Erroll Ellis Commercial distributed processing by personal computers over the internet
US6167428A (en) 1996-11-29 2000-12-26 Ellis; Frampton E. Personal computer microprocessor firewalls for internet distributed processing
US8225003B2 (en) 1996-11-29 2012-07-17 Ellis Iii Frampton E Computers and microchips with a portion protected by an internal hardware firewall
US7634529B2 (en) * 1996-11-29 2009-12-15 Ellis Iii Frampton E Personal and server computers having microchips with multiple processing units and internal firewalls
US6725250B1 (en) * 1996-11-29 2004-04-20 Ellis, Iii Frampton E. Global network computers
US7035906B1 (en) 1996-11-29 2006-04-25 Ellis Iii Frampton E Global network computers
US8312529B2 (en) 1996-11-29 2012-11-13 Ellis Frampton E Global network computers
US20050180095A1 (en) * 1996-11-29 2005-08-18 Ellis Frampton E. Global network computers
US7926097B2 (en) 1996-11-29 2011-04-12 Ellis Iii Frampton E Computer or microchip protected from the internet by internal hardware
US7506020B2 (en) 1996-11-29 2009-03-17 Frampton E Ellis Global network computers
US7805756B2 (en) 1996-11-29 2010-09-28 Frampton E Ellis Microchips with inner firewalls, faraday cages, and/or photovoltaic cells
US6098091A (en) * 1996-12-30 2000-08-01 Intel Corporation Method and system including a central computer that assigns tasks to idle workstations using availability schedules and computational capabilities
US6938254B1 (en) * 1997-05-06 2005-08-30 Microsoft Corporation Controlling memory usage in systems having limited physical memory
US6490496B1 (en) * 1999-02-25 2002-12-03 3D Systems, Inc. Method, apparatus, and article of manufacture for a control system in a selective deposition modeling system
FR2792087B1 (fr) * 1999-04-07 2001-06-15 Bull Sa Procede d'amelioration des performances d'un systeme multiprocesseur comprenant une file d'attente de travaux et architecture de systeme pour la mise en oeuvre du procede
US7007276B1 (en) 1999-09-28 2006-02-28 International Business Machines Corporation Method, system and program products for managing groups of partitions of a computing environment
US7568052B1 (en) 1999-09-28 2009-07-28 International Business Machines Corporation Method, system and program products for managing I/O configurations of a computing environment
US7051188B1 (en) 1999-09-28 2006-05-23 International Business Machines Corporation Dynamically redistributing shareable resources of a computing environment to manage the workload of that environment
US6651125B2 (en) 1999-09-28 2003-11-18 International Business Machines Corporation Processing channel subsystem pending I/O work queues based on priorities
US6587938B1 (en) 1999-09-28 2003-07-01 International Business Machines Corporation Method, system and program products for managing central processing unit resources of a computing environment
US6519660B1 (en) 1999-09-28 2003-02-11 International Business Machines Corporation Method, system and program products for determining I/O configuration entropy
US6986137B1 (en) * 1999-09-28 2006-01-10 International Business Machines Corporation Method, system and program products for managing logical processors of a computing environment
JP2001109638A (ja) * 1999-10-06 2001-04-20 Nec Corp 推定伸長率に基づくトランザクション負荷分散方法及び方式並びにコンピュータ可読記録媒体
US6754897B1 (en) * 1999-11-12 2004-06-22 Emc Corporation Operation prioritization and selection in a probability-based job scheduler
US6738818B1 (en) * 1999-12-27 2004-05-18 Intel Corporation Centralized technique for assigning I/O controllers to hosts in a cluster
US7093252B1 (en) 2000-04-12 2006-08-15 International Business Machines Corporation Self-submitting job for testing a job scheduling/submitting software
US9788058B2 (en) 2000-04-24 2017-10-10 Comcast Cable Communications Management, Llc Method and system for automatic insertion of interactive TV triggers into a broadcast data stream
US7702995B2 (en) * 2000-04-24 2010-04-20 TVWorks, LLC. Method and system for transforming content for execution on multiple platforms
US8936101B2 (en) 2008-07-17 2015-01-20 Halliburton Energy Services, Inc. Interventionless set packer and setting method for same
US8281022B1 (en) 2000-06-30 2012-10-02 Emc Corporation Method and apparatus for implementing high-performance, scaleable data processing and storage systems
US7689560B2 (en) 2000-10-13 2010-03-30 Miosoft Corporation Persistent data storage techniques
US7587428B2 (en) * 2000-10-13 2009-09-08 Microsoft Corporation Maintaining a relationship between two different items of data
US7502857B2 (en) * 2000-12-15 2009-03-10 International Business Machines Corporation Method and system for optimally allocating a network service
GB0102220D0 (en) * 2001-01-27 2001-03-14 Galleria Software Developement Databases
US8131870B1 (en) 2001-05-24 2012-03-06 Cisco Technology, Inc. Method and apparatus for registering a mobile object on a foreign network
US7415512B1 (en) 2001-05-24 2008-08-19 Cisco Technology, Inc. Method and apparatus for providing a general purpose computing platform at a router on a network
US6970902B1 (en) * 2001-05-24 2005-11-29 Cisco Technology, Inc. Method and apparatus for providing a distributed service in a network
US20030005023A1 (en) * 2001-06-01 2003-01-02 John Gilbert Batch access method and system
US7065764B1 (en) 2001-07-20 2006-06-20 Netrendered, Inc. Dynamically allocated cluster system
US7409706B1 (en) 2001-10-02 2008-08-05 Cisco Technology, Inc. System and method for providing path protection of computer network traffic
CA2365729A1 (en) * 2001-12-20 2003-06-20 Platform Computing (Barbados) Inc. Topology aware scheduling for a multiprocessor system
US7076781B2 (en) * 2002-05-31 2006-07-11 International Business Machines Corporation Resource reservation for large-scale job scheduling
US6973359B2 (en) * 2002-09-19 2005-12-06 Synchrono, Inc. Demand-driven scheduling system and method
US7133915B2 (en) * 2002-10-10 2006-11-07 International Business Machines Corporation Apparatus and method for offloading and sharing CPU and RAM utilization in a network of machines
US7644408B2 (en) * 2003-04-25 2010-01-05 Spotware Technologies, Inc. System for assigning and monitoring grid jobs on a computing grid
US20050114861A1 (en) * 2003-11-12 2005-05-26 Brian Mitchell Parallel execution scheduling method apparatus and system
US7904905B2 (en) * 2003-11-14 2011-03-08 Stmicroelectronics, Inc. System and method for efficiently executing single program multiple data (SPMD) programs
US20060020691A1 (en) * 2004-07-20 2006-01-26 Hewlett-Packard Development Company, L.P. Load balancing based on front-end utilization
US8171474B2 (en) * 2004-10-01 2012-05-01 Serguei Mankovski System and method for managing, scheduling, controlling and monitoring execution of jobs by a job scheduler utilizing a publish/subscription interface
US7433931B2 (en) * 2004-11-17 2008-10-07 Raytheon Company Scheduling in a high-performance computing (HPC) system
GB0513045D0 (en) * 2005-06-27 2005-08-03 Vidus Ltd Resource scheduling method and system
US7861244B2 (en) * 2005-12-15 2010-12-28 International Business Machines Corporation Remote performance monitor in a virtual data center complex
US8826280B1 (en) 2006-03-23 2014-09-02 Emc Corporation Processing raw information for performing real-time monitoring of task queues
US8539493B1 (en) 2006-03-23 2013-09-17 Emc Corporation Configurable prioritization and aging of queued tasks
US8347295B1 (en) * 2006-03-23 2013-01-01 Emc Corporation Profile-based assignment of queued tasks
US8584122B2 (en) * 2006-03-31 2013-11-12 Ebay Inc. Batch scheduling
US8056083B2 (en) 2006-10-10 2011-11-08 Diskeeper Corporation Dividing a computer job into micro-jobs for execution
US8239869B2 (en) 2006-06-19 2012-08-07 Condusiv Technologies Corporation Method, system and apparatus for scheduling computer micro-jobs to execute at non-disruptive times and modifying a minimum wait time between the utilization windows for monitoring the resources
US9588809B2 (en) * 2006-10-10 2017-03-07 Invistasking LLC Resource-based scheduler
US8209417B2 (en) * 2007-03-08 2012-06-26 Oracle International Corporation Dynamic resource profiles for clusterware-managed resources
US8091087B2 (en) * 2007-04-20 2012-01-03 Microsoft Corporation Scheduling of new job within a start time range based on calculated current load and predicted load value of the new job on media resources
US8125796B2 (en) 2007-11-21 2012-02-28 Frampton E. Ellis Devices with faraday cages and internal flexibility sipes
US8627325B2 (en) * 2008-01-03 2014-01-07 Hewlett-Packard Development Company, L.P. Scheduling memory usage of a workload
US8627330B2 (en) * 2008-01-03 2014-01-07 Hewlett-Packard Development Company, L.P. Workload manager managing a workload of an enterprise data warehouse
US9069613B2 (en) * 2008-09-30 2015-06-30 Hewlett-Packard Development Company, L.P. Processing batch database workload while avoiding overload
US8266477B2 (en) * 2009-01-09 2012-09-11 Ca, Inc. System and method for modifying execution of scripts for a job scheduler using deontic logic
US20100287553A1 (en) * 2009-05-05 2010-11-11 Sap Ag System, method, and software for controlled interruption of batch job processing
US8429735B2 (en) 2010-01-26 2013-04-23 Frampton E. Ellis Method of using one or more secure private networks to actively configure the hardware of a computer or microchip
US8935719B2 (en) 2011-08-25 2015-01-13 Comcast Cable Communications, Llc Application triggering
FR2984557B1 (fr) * 2011-12-20 2014-07-25 IFP Energies Nouvelles Systeme et procede de prediction des emissions de polluants d'un vehicule avec calculs simultanes de la cinetique chimique et des emissions
EP2669798A1 (en) * 2012-05-31 2013-12-04 Alcatel Lucent Load distributor, intra-cluster resource manager, inter-cluster resource manager, apparatus for processing base band signals, method and computer program for distributing load
US9477529B2 (en) 2012-06-20 2016-10-25 International Business Machines Corporation Job distributed within a grid environment using mega-host groupings of execution hosts based on resource attributes
US20140068621A1 (en) * 2012-08-30 2014-03-06 Sriram Sitaraman Dynamic storage-aware job scheduling
US9414114B2 (en) 2013-03-13 2016-08-09 Comcast Cable Holdings, Llc Selective interactivity
US11076205B2 (en) 2014-03-07 2021-07-27 Comcast Cable Communications, Llc Retrieving supplemental content
FR3055159B1 (fr) 2016-08-18 2018-08-17 Safran Electronics & Defense Systeme informatique multicoeur ou multiprocesseur pour l'execution de taches harmoniques

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57757A (en) * 1980-06-04 1982-01-05 Hitachi Ltd Job execution schedule system
US4403286A (en) * 1981-03-06 1983-09-06 International Business Machines Corporation Balancing data-processing work loads
JPS61231656A (ja) * 1985-04-06 1986-10-15 Nec Corp 疎結合マルチプロセツサシステム
DE3684138D1 (de) * 1986-02-04 1992-04-09 Ibm Verfahren zum abgleichen der aufgaben in einem mehrprozessorsystem.
US5031089A (en) * 1988-12-30 1991-07-09 United States Of America As Represented By The Administrator, National Aeronautics And Space Administration Dynamic resource allocation scheme for distributed heterogeneous computer systems
US5283897A (en) * 1990-04-30 1994-02-01 International Business Machines Corporation Semi-dynamic load balancer for periodically reassigning new transactions of a transaction type from an overload processor to an under-utilized processor based on the predicted load thereof
JPH0460745A (ja) * 1990-06-28 1992-02-26 Toshiba Corp マルチcpuシステムの負荷分散方式
US5506987A (en) * 1991-02-01 1996-04-09 Digital Equipment Corporation Affinity scheduling of processes on symmetric multiprocessing systems
JPH04352237A (ja) * 1991-05-30 1992-12-07 Nec Corp ジョブ実行自動制御方式
JPH05101019A (ja) * 1991-10-09 1993-04-23 Nec Corp 自動負荷検出分配型分散処理方法
IL99923A0 (en) * 1991-10-31 1992-08-18 Ibm Israel Method of operating a computer in a network
US5287508A (en) * 1992-04-07 1994-02-15 Sun Microsystems, Inc. Method and apparatus for efficient scheduling in a multiprocessor system
JPH07129520A (ja) * 1993-11-08 1995-05-19 Hitachi Ltd 自律分散協調処理方式
US5630124A (en) * 1993-12-06 1997-05-13 International Business Machines Corporation System and method for assuring atomicity of distributed update requests in a parallel database
JPH07225746A (ja) * 1994-02-09 1995-08-22 Mitsubishi Electric Corp 動的負荷分散方法
JPH07234847A (ja) * 1994-02-25 1995-09-05 Hitachi Ltd ジョブのスケジューリング方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031771A (ja) * 2003-07-08 2005-02-03 Hitachi Ltd ジョブスケジューリング管理方法及びシステム並びにプログラム
US8386611B2 (en) 2003-10-29 2013-02-26 International Business Machines Corporation Information system, load control method, load control program and recording medium
US7707581B2 (en) 2005-02-28 2010-04-27 International Business Machines Corporation Method and system for managing server load to execute transactions of an application program on multiple servers
JP2010244500A (ja) * 2009-03-16 2010-10-28 Nec Corp 分散処理システムおよび分散処理方法
JP2011186546A (ja) * 2010-03-04 2011-09-22 Nec System Technologies Ltd 負荷分散システム
US8832695B2 (en) 2011-08-19 2014-09-09 Fujitsu Limited Method of scheduling jobs and information processing apparatus implementing same

Also Published As

Publication number Publication date
FR2740579A1 (fr) 1997-04-30
US5881284A (en) 1999-03-09
JP2940450B2 (ja) 1999-08-25
FR2740579B1 (fr) 2000-06-16

Similar Documents

Publication Publication Date Title
JPH09120389A (ja) クラスタ型コンピュータのジョブスケジュール方法及び装置
JP5041805B2 (ja) データストレージシステムのサービス品質コントローラ及びサービス品質方法
USRE44686E1 (en) Dynamically modifying the resources of a virtual server
JP3813056B2 (ja) 優先順位に基づくチャネル・サブシステム保留入出力作業キューの処理
JP3807916B2 (ja) コンピュータ環境の区画のグループを管理する方法およびシステム
JP3872343B2 (ja) コンピュータ環境におけるワークロード管理
JP3672236B2 (ja) コンピュータ環境の中央処理装置を管理する方法、システム、およびプログラム製品
JP3659324B2 (ja) コンピュータ環境の論理プロセッサを管理する方法、システム、およびプログラム製品
EP1385091A2 (en) Dynamic management of virtual partition workload through service level optimization
JP3008896B2 (ja) 共有バス型マルチプロセッサシステムの割り込み負荷分散システム
US7054968B2 (en) Method and apparatus for multi-port memory controller
JP3172423B2 (ja) プロセッサ資源を管理するための装置および方法
US20050055694A1 (en) Dynamic load balancing resource allocation
US8060679B2 (en) Information processing apparatus and access control method capable of high-speed data access
US9262093B1 (en) Prioritized rate scheduler for a storage system
WO2007071505A1 (en) Load-balancing metrics for adaptive dispatching of long asynchronous network requests
US20070294448A1 (en) Information Processing Apparatus and Access Control Method Capable of High-Speed Data Access
Xu et al. Prophet: Scheduling executors with time-varying resource demands on data-parallel computation frameworks
JP2004118833A (ja) メモリ・コントローラの最適化方法
CN116483538A (zh) 一种一致性低延迟的数据中心任务调度方法
Lynch et al. The OS/VS2 release 2 system resources manager
CN111208943B (zh) 存储系统的io压力调度系统
JP2954056B2 (ja) マルチプロセッサのプロセスディスパッチ方法
CA2316643C (en) Fair assignment of processing resources to queued requests
JPH07234847A (ja) ジョブのスケジューリング方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees