JPH113321A - 並列計算機システム - Google Patents

並列計算機システム

Info

Publication number
JPH113321A
JPH113321A JP15537497A JP15537497A JPH113321A JP H113321 A JPH113321 A JP H113321A JP 15537497 A JP15537497 A JP 15537497A JP 15537497 A JP15537497 A JP 15537497A JP H113321 A JPH113321 A JP H113321A
Authority
JP
Japan
Prior art keywords
computer
job
load information
job execution
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP15537497A
Other languages
English (en)
Inventor
Masashi Hiratsuka
正史 平塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP15537497A priority Critical patent/JPH113321A/ja
Publication of JPH113321A publication Critical patent/JPH113321A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 各ジョブ実行用計算機の負荷に応じてジョブ
を割り当てる並列計算機システムに関し、負荷を高める
ことなく負荷情報の収集を行う。 【解決手段】 各々のジョブ実行用計算機11aで、他
のどのジョブよりも低い優先順位でそのジョブ実行用計
算機11aの負荷情報を収集してスケジューラ計算機1
1bに送信する監視プログラム33を実行させる。ま
た、スケジューラ計算機11bで、監視プログラム33
から送信された最新の負荷情報をその収集時刻とともに
ジョブ実行用計算機11aごとに記録する記録プログラ
ム34と、新たなジョブが与えられたとき、記録プログ
ラム34により記録された負荷情報及びその収集時刻に
基づいてこの新たなジョブを割り当てるジョブ実行用計
算機11aを選択するスケジュールプログラム31とを
実行させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はジョブを複数の計算
機に分散実行させる並列計算機システムに係り、特に、
各計算機の負荷情報に応じてジョブの割当てを行う並列
計算機システムに関する。
【0002】
【従来の技術】従来より、複数のジョブ実行用計算機及
びこれらのジョブ実行用計算機にジョブを割り当てるス
ケジューラ計算機をネットワーク経由で相互に接続し、
新たに投入されたジョブをスケジューラ計算機が各々の
ジョブ実行用計算機に分散実行させる並列計算機システ
ムが知られている。こうした並列計算機システムでは、
ジョブが投入されたとき、負荷が最も小さいと考えられ
るジョブ実行用計算機をスケジューラ計算機が選択し、
このジョブ実行用計算機に対してジョブの実行を割り当
てる、という負荷分散処理を行っている。そして、この
負荷分散処理を実現するには、スケジューラ計算機が、
各々のジョブ実行用計算機からそのジョブ実行用計算機
の負荷を表す負荷情報を収集することが必要である。こ
のため、スケジューラ計算機は、一定時間ごとに、ある
いは新たなジョブが投入されたときに、この負荷情報の
収集を行っている。
【0003】
【発明が解決しようとする課題】上述した負荷情報の収
集を一定時間ごとに行う方法は、ジョブ実行用計算機の
負荷が既にかなり高くなっているときでも負荷情報の収
集が行われるため、この負荷情報の収集によってジョブ
実行用計算機やネットワークの負荷をさらに高めてしま
い、これによって、並列計算機システムの性能低下を招
くなどの悪影響を及ぼすことがあるという問題点があっ
た。
【0004】一方、新たなジョブが投入されたときに負
荷情報の収集を行う方法は、新たなジョブが投入された
時点で、あらゆるジョブ実行用計算機に対して同時に負
荷情報の収集が行われるため、ネットワークの負荷を急
激に高め、また、それらの収集された負荷情報を解析す
るスケジューラ計算機に対して短時間に負荷が集中して
しまい、これによって、並列計算機システムのスループ
ットが低下することがあるという問題点があった。
【0005】したがって本発明の目的は、上記方法を用
いる従来技術の問題点を解決して、新たなジョブの割当
て対象とするジョブ実行用計算機の選択に必要な負荷情
報の収集に際し、ジョブ実行用計算機やネットワークの
負荷が急激に高められることのない並列計算機システム
を提供することにある。
【0006】
【課題を解決するための手段】上記の目的を達成するた
め、本発明の並列計算機システムは、割り当てられたジ
ョブを実行する複数のジョブ実行用計算機と、各々の前
記ジョブ実行用計算機にネットワーク経由で接続され、
新たなジョブをいずれかの前記ジョブ実行用計算機また
は自スケジューラ計算機に割り当てるスケジューラ計算
機とを具備し、前記スケジューラ計算機が、各々の前記
ジョブ実行用計算機の負荷を表す負荷情報に基づき、新
たなジョブを割り当てる計算機を少なくとも1つ選択す
る並列計算機システムにおいて、各々の前記ジョブ実行
用計算機は、他のどのジョブよりも低い優先順位で自ジ
ョブ実行用計算機の前記負荷情報を収集して前記スケジ
ューラ計算機に送信する負荷情報収集送信手段を備え、
前記スケジューラ計算機は、前記負荷情報収集送信手段
から送信された最新の前記負荷情報をその収集時刻とと
もに前記ジョブ実行用計算機ごとに記録する負荷情報記
録手段と、新たなジョブが与えられたとき、前記負荷情
報記録手段により記録された前記負荷情報及びその収集
時刻に基づいて前記新たなジョブを割り当てる計算機を
選択する計算機選択手段とを備えるものである。
【0007】
【発明の実施の形態】以下、本発明の並列計算機システ
ムの実施の形態を図面を用いて詳細に説明する。
【0008】図1は本発明の並列計算機システムの一実
施形態の構成を示すブロック図、図2は図1のシステム
における負荷情報の収集について説明する概念図であ
る。両図中、11aは割り当てられたジョブを実行する
複数のジョブ実行用計算機、11bは各々のジョブ実行
用計算機11aにネットワーク12経由で接続され、新
たなジョブをジョブ実行用計算機11aのいずれかに割
り当てるスケジューラ計算機、21はスケジューラ計算
機11bで実行されるプログラムに応じた処理を行うC
PU、22はスケジューラ計算機11bで処理中のデー
タなどを一時的に格納するメモリ、23はスケジューラ
計算機11bでプログラムやデータを格納する外部記憶
装置、231は外部記憶装置23に設けられ、後述する
記録プログラムにより各々のジョブ実行用計算機11a
の負荷を表す負荷情報及びその収集時刻が記録される負
荷情報ファイル、24はこれらCPU21,メモリ2
2,外部記憶装置23の間でプログラムやデータをやり
とりするためのバス、31はスケジューラ計算機11b
のCPU21で常に実行され、上述した新たなジョブを
ジョブ実行用計算機11aのいずれかに割り当てる具体
的な処理を行う計算機選択手段であるスケジュールプロ
グラム、321は新たに投入されたジョブ、322は割
当て待ちキューに登録された実行割当て待ちジョブ、3
23は割り当てられた特定のジョブ実行用計算機11a
へ送信中の実行待ちジョブ、33は各々のジョブ実行用
計算機11aで実行される負荷情報収集送信手段である
監視プログラム、34はスケジューラ計算機11bのC
PU21で常に実行され、上述の監視プログラム33か
ら送信された最新の負荷情報をその収集時刻とともにジ
ョブ実行用計算機11aごとに負荷情報ファイル231
に記録する負荷情報記録手段である記録プログラムであ
る。なお、図1中にはジョブ実行用計算機11aを4台
のみ接続した構成を示してあるが、このジョブ実行用計
算機11aの接続台数は、必要に応じて所望の台数とす
ることができる。
【0009】図2において、各々のジョブ実行用計算機
11aで実行されている監視プログラム33は、他のど
のジョブよりも低い優先順位で、そのジョブ実行用計算
機の負荷情報、例えばCPU使用率やメモリ使用率など
を収集して前記スケジューラ計算機に送信する。この監
視プログラム33による負荷情報の収集及び送信は、一
応の目安である後述する所定の収集時間間隔で繰り返し
行われる。すなわち、あるジョブ実行用計算機11aに
割り当てられたジョブによるCPU使用率が比較的小さ
かった場合、優先順位の低い監視プログラム33に実行
制御が渡される頻度が大きくなるため、監視プログラム
33による負荷情報の収集及びそのスケジューラ計算機
11bへの送信は、概ね収集時間間隔ごとに行われる。
これに対して、上記ジョブによるCPU使用率がある水
準を超えて大きくなった場合、優先順位の低い監視プロ
グラム33に実行制御が渡される頻度は小さくなるた
め、監視プログラム33による負荷情報の収集及びその
スケジューラ計算機11bへの送信は、収集時間間隔よ
り長い間隔で行われる。また、スケジューラ計算機11
bで実行されている記録プログラム34は、各々のジョ
ブ実行用計算機11aからネットワーク12経由で送信
されてきた上述の負荷情報を、その収集時刻とともにジ
ョブ実行用計算機11aごとに負荷情報ファイル231
中に記録する。すなわち、送信された負荷情報の発信元
であるジョブ実行用計算機11aが“計算機X”であれ
ば、負荷情報ファイル231中の“計算機X”に対応す
る負荷情報フィールド内に、送信された負荷情報をその
収集時刻、例えばこの負荷情報をネットワーク12から
受信したときの時刻とともに記録する。
【0010】図2において、スケジューラ計算機11b
で実行されているスケジュールプログラム31は、新た
に投入されたジョブ321が割当て待ちキューに登録さ
れて実行割当て待ちジョブ322となったとき、記録プ
ログラム34により記録された負荷情報ファイル231
を参照し、各々のジョブ実行用計算機11aごとに、記
録された最新の収集時刻から現在時刻すなわち負荷情報
ファイル231を参照した時刻までに経過した時間を求
める。そして、この時間が所定の収集時間間隔を超過し
ているジョブ実行用計算機11aは、すべて実行割当て
待ちジョブ322の割り当て対象から除外する。続い
て、この時間が所定の収集時間間隔を超過していないジ
ョブ実行用計算機11aについて負荷情報ファイル23
1を参照し、対応する負荷情報で表される負荷が最小の
ジョブ実行用計算機11aを、新たな実行割当て待ちジ
ョブ322を割り当てるべきジョブ実行用計算機11a
として選択する。最後に、この実行割当て待ちジョブ3
22を実行待ちジョブ323として、ネットワーク12
経由で選択された特定のジョブ実行用計算機11aへ送
信する。
【0011】図3は、図1のシステムにおけるジョブの
割当て対象の選択について説明する概念図である。同図
中、横軸は時刻の経過を表し、tは現在時刻、iは一応
の目安である所定の収集時間間隔である。ここで、収集
時間間隔iの具体的な時間の値は、並列計算機システム
の運用方針などに基づいて決めた適当な定数値としてあ
る。また、dは、負荷情報ファイル231に記録された
最新の収集時刻から現在時刻tまでに経過した時間であ
る。
【0012】一般に、ジョブ実行用計算機11aに割り
当てられたジョブによる負荷は、ジョブの同時実行数や
ジョブの処理状態などに応じて常に変化する。そして、
上述したように、監視プログラム33が負荷情報の収集
及び送信を行う間隔は、ジョブ実行用計算機11aに割
り当てられたジョブによるCPU使用率などの負荷に応
じて常に変化する。すなわち、この負荷が比較的小さい
とき、負荷情報の収集及び送信の間隔は収集時間間隔i
に概ね一致するが、負荷がある水準を超えて大きくなる
と、上記間隔は収集時間間隔iより長くなる。このよう
に、負荷情報の収集及び送信の間隔は常に変化している
が、少なくともこの間隔が収集時間間隔iより長い場
合、該当するジョブ実行用計算機11aに割り当てられ
たジョブによる負荷がある水準を超えて大きくなってい
るものとみなされる。すなわち、図3に示すように、負
荷情報ファイル231に記録された最新の収集時刻から
現在時刻tまでに経過した時間dと収集時間間隔iとの
大小関係に対応して、3種類のケースが生ずる
が、このうち、最新の収集時刻から現在時刻tまでに経
過した時間dが収集時間間隔iより長いケースは、該
当するジョブ実行用計算機11aに割り当てられたジョ
ブによる負荷がある水準を超えて大きくなっているもの
とみなされる。したがって、このケースに該当するジ
ョブ実行用計算機11aは、すべて新たなジョブの割り
当て対象から除外する。次に、残りのケースについ
ては、該当するジョブ実行用計算機11aに割り当てら
れたジョブによる負荷がある水準より小さいことしかわ
からないので、再び負荷情報ファイル231を参照す
る。そして、記録された負荷情報で表される負荷が最小
となっているジョブ実行用計算機11aを、新たなジョ
ブを割り当てるジョブ実行用計算機11aとして選択す
る。
【0013】以上のように、本実施形態の並列計算機シ
ステムにおいて、各々のジョブ実行用計算機11aで実
行されている監視プログラム33は、他のどのジョブよ
りも低い優先順位でそのジョブ実行用計算機11aの負
荷を表す負荷情報を収集してスケジューラ計算機11b
に送信している。このため、通常の優先順位のジョブの
実行に伴ってジョブ実行用計算機11aの負荷がかなり
高くなったときは、より低い優先順位の監視プログラム
33の実行はほとんど停止し、負荷情報の収集及びスケ
ジューラ計算機11bへの送信が事実上行われなくなる
ので、既にかなり負荷が高くなっているジョブ実行用計
算機11aやネットワーク12の負荷が監視プログラム
33によってさらに高められることがない。また、スケ
ジューラ計算機11bで実行されているスケジュールプ
ログラム31は、新たなジョブが与えられたとき、既に
負荷情報ファイル231に記録されている負荷情報のみ
を参照して、このジョブを割り当てるジョブ実行用計算
機11aを選択し、各々のジョブ実行用計算機11aか
ら改めて負荷情報を収集しないため、新たなジョブの登
録に際してジョブ実行用計算機11aやネットワーク1
2の負荷が急激に高められることがない。したがって、
新たなジョブの割当て対象とするジョブ実行用計算機1
1aの選択に必要な負荷情報の収集に際し、ジョブ実行
用計算機11aやネットワークの負荷12が急激に高め
られることがなくなり、並列計算機システムの性能低下
などの悪影響の発生を防止することができる。
【0014】さらに、新たなジョブの実行を割り当てる
ジョブ実行用計算機11aの選択に際し、各ジョブ実行
用計算機11aに対応する最新の収集時刻から現在時刻
tまでに経過した時間dと所定の収集時間間隔iとの比
較によって割当て対象を絞り込んだ後、負荷情報で表さ
れる負荷が最小となっているジョブ実行用計算機11a
を選択するので、前回収集された負荷情報による負荷は
比較的小さかったが、現時点では負荷がある水準より大
きいために時間dが収集時間間隔iを超過するジョブ実
行用計算機11aを、割当て対象から除外することがで
きる。
【0015】なお、上述した実施形態では、スケジュー
ラ計算機11bが、新たなジョブをジョブ実行用計算機
11aのいずれかに対してのみ割り当てる場合について
説明を行ったが、割り当て対象にスケジューラ計算機1
1b自身を含めるようにしてもよい。この場合には、ス
ケジューラ計算機11bのすべてが上述したケースに
該当したとき、スケジューラ計算機11b自身を新たな
ジョブの割り当て対象として選択するのが適切である。
【0016】
【発明の効果】以上詳しく説明したように、本発明の並
列計算機システムによれば、通常の優先順位のジョブの
実行に伴ってジョブ実行用計算機の負荷がかなり高くな
ったときは、より低い優先順位の負荷情報収集送信手段
による負荷情報の収集及びスケジューラ計算機への送信
が事実上行われなくなるので、既にかなり負荷が高くな
っているジョブ実行用計算機やネットワークの負荷が負
荷情報収集送信手段によってさらに高められることがな
い。また、計算機選択手段は、新たなジョブが与えられ
たとき、負荷情報記録手段によって既に負荷情報ファイ
ルに記録されている負荷情報のみを参照して、このジョ
ブを割り当てるジョブ実行用計算機を選択し、各々のジ
ョブ実行用計算機から改めて負荷情報を収集しないた
め、新たなジョブの登録に際してジョブ実行用計算機や
ネットワークの負荷が急激に高められることがない。し
たがって、新たなジョブの割当て対象とするジョブ実行
用計算機の選択に必要な負荷情報の収集に際し、ジョブ
実行用計算機やネットワークの負荷が急激に高められる
ことがなくなり、並列計算機システムの性能低下などの
悪影響の発生を防止することができる。
【図面の簡単な説明】
【図1】本発明の並列計算機システムの一実施形態の構
成を示すブロック図である。
【図2】図1のシステムにおける負荷情報の収集につい
て説明する概念図である。
【図3】図1のシステムにおけるジョブの割当て対象の
選択について説明する概念図である。
【符号の説明】
11a ジョブ実行用計算機 11b スケジューラ計算機 12 ネットワーク 21 CPU 23 外部記憶装置 231 負荷情報ファイル 31 スケジュールプログラム 322 実行割当て待ちジョブ 323 実行待ちジョブ 33 監視プログラム

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 割り当てられたジョブを実行する複数の
    ジョブ実行用計算機と、 各々の前記ジョブ実行用計算機にネットワーク経由で接
    続され、新たなジョブをいずれかの前記ジョブ実行用計
    算機または自スケジューラ計算機に割り当てるスケジュ
    ーラ計算機とを具備し、 前記スケジューラ計算機が、各々の前記ジョブ実行用計
    算機の負荷を表す負荷情報に基づき、新たなジョブを割
    り当てる計算機を少なくとも1つ選択する並列計算機シ
    ステムにおいて、 各々の前記ジョブ実行用計算機は、 他のどのジョブよりも低い優先順位で自ジョブ実行用計
    算機の前記負荷情報を収集して前記スケジューラ計算機
    に送信する負荷情報収集送信手段を備え、 前記スケジューラ計算機は、 前記負荷情報収集送信手段から送信された最新の前記負
    荷情報をその収集時刻とともに前記ジョブ実行用計算機
    ごとに記録する負荷情報記録手段と、 新たなジョブが与えられたとき、前記負荷情報記録手段
    により記録された前記負荷情報及びその収集時刻に基づ
    いて前記新たなジョブを割り当てる計算機を選択する計
    算機選択手段とを備えることを特徴とする並列計算機シ
    ステム。
  2. 【請求項2】 前記計算機選択手段は、前記負荷情報記
    録手段により記録された前記負荷情報及びその収集時刻
    に基づき、前記収集時刻から現在までに経過した時間を
    前記ジョブ実行用計算機ごとに求め、 この時間が所定の収集時間間隔を超過しているすべての
    前記ジョブ実行用計算機を、新たなジョブの割り当て対
    象から除外することを特徴とする請求項1記載の並列計
    算機システム。
  3. 【請求項3】 前記計算機選択手段は、新たなジョブを
    割り当てる計算機として、前記時間が前記収集時間間隔
    を超過していない前記ジョブ実行用計算機のうち、対応
    する前記負荷情報で表される負荷が最小のジョブ実行用
    計算機を選択することを特徴とする請求項2記載の並列
    計算機システム。
JP15537497A 1997-06-12 1997-06-12 並列計算機システム Pending JPH113321A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15537497A JPH113321A (ja) 1997-06-12 1997-06-12 並列計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15537497A JPH113321A (ja) 1997-06-12 1997-06-12 並列計算機システム

Publications (1)

Publication Number Publication Date
JPH113321A true JPH113321A (ja) 1999-01-06

Family

ID=15604548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15537497A Pending JPH113321A (ja) 1997-06-12 1997-06-12 並列計算機システム

Country Status (1)

Country Link
JP (1) JPH113321A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092733B2 (en) 2001-01-25 2006-08-15 Kabushiki Kaisha Toshiba Mobile radio communication apparatus capable to plurality of radio communication systems
US7734456B2 (en) 2004-03-30 2010-06-08 Osamu Fujita Method and apparatus for priority based data processing

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092733B2 (en) 2001-01-25 2006-08-15 Kabushiki Kaisha Toshiba Mobile radio communication apparatus capable to plurality of radio communication systems
US7206601B2 (en) 2001-01-25 2007-04-17 Kabushiki Kaisha Toshiba Method for connecting a mobile radio communication apparatus to a plurality of radio communication systems
US7734456B2 (en) 2004-03-30 2010-06-08 Osamu Fujita Method and apparatus for priority based data processing

Similar Documents

Publication Publication Date Title
CN110727512B (zh) 集群资源调度方法、装置、设备及储存介质
EP1750200A2 (en) System and method for executing job step, and computer product
US8352621B2 (en) Method and system to automatically optimize execution of jobs when dispatching them over a network of computers
US7933995B2 (en) Computer program and apparatus for controlling computing resources, and distributed processing system
US8327103B1 (en) Scheduling data relocation activities using configurable fairness criteria
US8239868B2 (en) Computer system, servers constituting the same, and job execution control method and program
CN102541460B (zh) 一种多磁盘场景下的磁盘管理方法和设备
US20220138012A1 (en) Computing Resource Scheduling Method, Scheduler, Internet of Things System, and Computer Readable Medium
US7685285B2 (en) Method and apparatus for managing executions of a management program within a data processing system
JP2009087175A (ja) ストレージ装置、処理制御装置、及び記憶システム
CN107430526B (zh) 用于调度数据处理的方法和节点
JP2014120097A (ja) 情報処理装置、プログラム、及び、情報処理方法
JPH05216842A (ja) 資源管理装置
JP2007328413A (ja) 負荷分散方法
US10866837B2 (en) Distributed job framework and task queue
US10606636B2 (en) Automated predictions for not-yet-completed jobs
JP2776338B2 (ja) ジョブスケジューリング方式
JPH113321A (ja) 並列計算機システム
JPH0793262A (ja) アプリケーションツール実行管理システム
JP5045576B2 (ja) マルチプロセッサシステム及びプログラム実行方法
JP2004178336A (ja) 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム
JPH09274608A (ja) マルチプロセッサシステムにおけるプロセッサ間の負荷配分制御方法
CN114077481A (zh) 任务调度方法、装置、设备和存储介质
JPH10207847A (ja) 分散システムにおける自動負荷分散方式
JP4155403B2 (ja) システム構成制御方法及びその処理プログラム並びにその実施システム