JPH09282288A - 複数計算機運用システム - Google Patents

複数計算機運用システム

Info

Publication number
JPH09282288A
JPH09282288A JP8086466A JP8646696A JPH09282288A JP H09282288 A JPH09282288 A JP H09282288A JP 8086466 A JP8086466 A JP 8086466A JP 8646696 A JP8646696 A JP 8646696A JP H09282288 A JPH09282288 A JP H09282288A
Authority
JP
Japan
Prior art keywords
computer
job
control device
time
computers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8086466A
Other languages
English (en)
Inventor
Hirotaka Yoshioka
弘貴 吉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP8086466A priority Critical patent/JPH09282288A/ja
Publication of JPH09282288A publication Critical patent/JPH09282288A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数計算機運用システムに関し、各計算機の
処理能力やネットワークの使用状態を考慮してジョブの
実行時間を予測し、これに基づいてジョブを自動的に分
散させ、各計算機を効率良く運用する。 【解決手段】 ネットワーク2で接続した複数の計算機
#1〜#nにデータ処理を分散させる複数計算機運用シ
ステムにおいて、少なくとも、各計算機#1〜#n間の
ネットワーク2、各計算機#1〜#nに接続したメモリ
16、及び、各計算機#1〜#nのCPU15にエラー
が生じているか否かを一定時間毎に調査して該調査情報
を取得する複数計算機運用制御装置11を備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数計算機運用シ
ステムに関するものであり、更に詳しく言えば、ネット
ワークに接続された複数の計算機にジョブを効率良く実
行依頼する制御装置に関するものである。
【0002】
【従来の技術】近年、光通信や衛星通信等の発達に伴い
データ通信が可能なネットワークが利用されている。例
えば、複数の計算機を公衆のネットワークに接続するこ
とにより計算機処理を分散して実行する複数計算機運用
システムが増えつつある。図9は、従来例に係る複数計
算機運用システムを示している。図9において、1は、
例えば、半導体製造業の本社に設けられたホスト計算
機、#1〜#8は各地方の事業所に設けられた8台の計
算機である。ホスト計算機1はネットワーク2に接続
し、各計算機#1〜#8はネットワーク2を介してホス
ト計算機1に接続している。
【0003】このシステムでは、ある計算機#1がジョ
ブ(仕事)を投入すると、ホスト計算機1は、各計算機
#1〜#8にジョブを分散し、各計算機#1〜#8にお
いて、データ処理を実行させている。ジョブは、例え
ば、LSI(半導体集積回路装置)の製造管理に必要な
品種別製造数、その受注数や在庫数、納期予定日等の計
算処理等である。
【0004】
【発明が解決しようとする課題】従来技術に係る複数計
算機運用システムでは、ジョブの投入量が少ない場合
は、ホスト計算機1がジョブを各計算機#1〜#8に分
散することで十分対処することができる。しかし、LS
Iの多機能化や性能向上に伴って、益々、ジョブの投入
量が増大し、ジョブの実行に係る計算機処理時間もさる
ことながら、計算に必要な入出力データの転送時間が、
ジョブの実行時間に大きなウエイトを占めるようになっ
てきている。
【0005】また、事業所内のLAN(ローカルエリア
ネットワーク)と比較して公衆のネットワークは、デー
タ伝送速度が低下するため、計算機を設置した事業所が
離れていると、どうしても、ジョブを投入した事業所の
計算機に入出力データが集中してしまう。これにより、
以下の問題を生ずる。 各事業所の計算機に実行依頼するジョブにバラツキ
が生じる。
【0006】 入出力データの集中により記憶装置に
不足が生じる。 特定のネットワークの占有時間が多くなる。 使用頻度が低い計算機の運用コストが増加する。 本発明は、かかる従来例の課題に鑑み創作されたもので
あり、各計算機の処理能力やネットワークの使用状態を
考慮してジョブの実行時間を予測し、これに基づいてジ
ョブを自動的に分散させ、各計算機を効率良く運用する
ことが可能となる複数計算機運用システムの提供を目的
とする。
【0007】
【課題を解決するための手段】本発明に係る第1の複数
計算機運用システムは、その一実施の形態を図1に示す
ように、ネットワークで接続した複数の計算機にデータ
処理を分散させる複数計算機運用システムにおいて、少
なくとも、前記各計算機間のネットワーク、各計算機に
接続した入出力デバイス、及び、各計算機の中央処理装
置にエラーが生じているか否かを一定時間毎に調査して
該調査情報を取得する制御装置を備えていることを特徴
とする。
【0008】本発明の第2のシステムは、ネットワーク
で接続した複数の計算機にデータ処理を分散させる複数
計算機運用システムにおいて、少なくとも、前記各計算
機間のネットワークの使用状態、各計算機に接続された
入出力デバイスの空き状態、及び、各計算機の中央処理
装置の潜在的処理能力を一定時間毎に調査して該調査情
報を取得する制御装置を備えていることを特徴とし、上
記目的を達成する。
【0009】本発明の第1の複数計算機運用システムで
は、各計算機間のネットワーク、各計算機に接続された
入出力デバイス、及び、各計算機の中央処理装置にエラ
ーを生じているか否かが、制御装置によって、一定時間
毎に調査され、この調査情報が取得されているので、複
数の計算機にあるジョブが与えられた場合、エラーが生
じた計算機や入出力デバイスに空きが無い計算機へはジ
ョブの実行依頼が行われることなく、エラーが生じてい
ない計算機にジョブが実行依頼されるようになる。これ
により、複数の計算機を効率良く運用することができ
る。
【0010】本発明の第2のシステムでは、各計算機間
のネットワークの使用状態、各計算機に接続された入出
力デバイスの空き状態、及び、各計算機の中央処理装置
の潜在的処理能力が、制御装置によって、一定時間毎に
調査され、この調査情報が取得されているので、複数の
計算機にあるジョブが与えられた場合、1つの計算機に
ジョブが集中することなく、各計算機の処理能力、その
入出力デバイスの空き状態に応じて各計算機にジョブを
実行依頼することができる。
【0011】これにより、複数の計算機にジョブを効率
良く分散させることができるので、特定のネットワーク
を占有する時間が短くなる。なお、本発明の第3のシス
テムでは、調査情報と、各計算機に実行依頼されるジョ
ブの入力データの大きさや種類から入力データの転送時
間と、出力データの転送時間とが、制御装置によって、
各計算機毎に予測されているので、複数の計算機にある
ジョブが与えられた場合、入出力データの転送時間が最
も早い計算機から順にジョブを実行依頼することができ
る。
【0012】本発明の第4のシステムでは調査情報と、
各計算機に実行依頼されるジョブの入力データの大きさ
や種類から該ジョブの実行時間が、制御装置によって各
計算機毎に予測されているので、複数の計算機にあるジ
ョブが与えられた場合、ジョブの実行時間が最も早い計
算機から順にジョブを実行依頼することができる。本発
明の第5のシステムでは、入出力データの転送時間と、
ジョブの実行時間及びジョブの優先度からジョブの実行
順番が、制御装置によって決定されるので、例えば、複
数の計算機にあるジョブが与えられた場合、入出力デー
タの転送時間が最も早く、しかも、ジョブの実行時間が
最も早い計算機に、優先度の高いジョブを実行させるよ
うに順番を決定することができる。
【0013】本発明の第6のシステムでは、入出力デー
タの転送時間と、ジョブの実行時間の総和から、各計算
機毎にこれから投入するジョブの実行開始時間が、制御
装置によって予測されるので、現在、ある計算機がジョ
ブを実行している場合、最も早く次のジョブに取り掛か
れる計算機を見付出すことができる。したがって、その
計算機に次のジョブを実行依頼することができる。
【0014】本発明の第7のシステムでは、入出力デー
タの転送時間、ジョブの実行時間及び計算機の異常検出
の有無からジョブの実行終了時間が、制御装置によって
予測されているので、現在、ある計算機にジョブが与え
られている場合、異常が無く、最も早くジョブを終了す
る計算機を見付出すことができる。これにより、最も早
くジョブを終了した計算機に次のジョブを実行依頼する
ことができる。
【0015】本発明の第8のシステムでは、ジョブの実
行終了時間が、最も早い計算機に対して制御装置が次の
ジョブの実行依頼を行うので、最も早くジョブを終了し
た計算機から順に次のジョブを実行させることができ
る。本発明の第9のシステムでは、先に取得された調査
情報から、計算機の異常を発見した場合、制御装置によ
って、当該計算機へのジョブが中止され、他の計算機に
該ジョブが実行依頼されるので、当該システムに与えら
れたジョブを異常の無い計算機によって処理することが
できる。これにより、複数の計算機を効率良く運用する
ことができる。
【0016】
【発明の実施の形態】次に、図を参照しながら本発明の
実施の形態について説明をする。図1〜図8は、本発明
の実施の形態に係る複数計算機運用システムを説明する
図である。 (1)第1の実施の形態 図1は、本発明の各実施の形態に係る複数計算機運用シ
ステムの構成図であり、図2は、その制御装置の構成図
であり、図3〜図5はその補足説明図を示している。当
該システムではネットワークに接続した複数の計算機
に、あるジョブが与えられた場合、特定の計算機にジョ
ブが集中しないように、予め、各計算機の処理能力、メ
モリ容量等を把握し、それに基づいて、ジョブを分散さ
せ、各々の計算機によりデータ処理を実行させるもので
ある。
【0017】図1において、#1〜#8は各地方の事業
所に設けられた8台の計算機である。各計算機は、中央
演算装置(以下CPUという)15、メモリ16、キー
ボード17、その他のサポートツール18及び送受信部
19を有している。11は、予め、各計算機#1〜#8
の処理能力、メモリ容量等を把握し、それに基づいてジ
ョブを分散し、各々の計算機#1〜#8がデータ処理を
実行できるように制御する複数計算機運用制御装置であ
り、例えば、LSI製造業に携わる本社に設けられてい
る。この制御装置11はホスト計算機内に組み込んでも
良い。制御装置11はネットワーク2に接続し、各計算
機#1〜#8は送受信部19を介してネットワーク2に
接続している。
【0018】図2において、制御装置11は、キューイ
ングテーブル12、計算機資源テーブル13、ネットワ
ーク資源テーブル14、ネットワーク調査エディタ2
1、随時書込み読出し可能なメモリ(以下RAMとい
う)22、読出し専用メモリ(以下ROMという)2
3、キーボード24、ディスプレイ25、CPU26及
び送受信部27を有している。
【0019】キューイングテーブル12は、各計算機#
1〜#8から投入されたジョブの実行順番を登録するメ
モリである。登録内容は、図3に示すように、ジョブを
他の計算機よりも早く実行依頼するか否かを示す“優先
度”、ジョブを投入してから現在に至るまでの“待ち時
間”、優先度の変更を許可する“操作許可”、計算機間
で転送する入出力データの“入力サイズ/出力サイ
ズ“、ジョブの“実行時間”、ジョブが開始できる“実
行開始予想時間”、ジョブの“計算処理時間”及び各計
算機の“状態”等である。これらはフラグによって管理
している。例えば、“操作許可”は、フラグの「1」又
は「0」によって優先度の操作を許可するか否かが識別
されている。また、ジョブの実行順番は、待ち時間が長
いものと優先度の高いものに分類して管理している。
【0020】計算機資源テーブル13は、各計算機#1
〜#8の処理能力やエラー情報を登録したメモリであ
る。登録内容は、図4に示すように、各計算機のCPU
の性能(種類)、メモリ(外部記憶装置)の空き状態、
データ転送速度、内部メモリの容量、エラーの発生の有
無、ジョブの実行時間、計算処理時間、ジョブの開始時
間等である。このテーブル13は、CPU26によっ
て、一定時間毎に各計算機#1〜#8を調査した後、常
に、最新の情報が保存されるようになっている。
【0021】ネットワーク資源テーブル14、ネットワ
ーク2のデータ転送速度(以下回線速度という)bps
を登録するメモリである。登録内容は、2つの計算機#
1と#2、#1と#3、……#1と#8の間の回線速度
を総当たり形式により求めたものである。ネットワーク
調査エディタ21は、計算機#1と#2、#1と#3、
……#1と#8の間で、一定時間おきにダミー情報を転
送して回線速度を計算したり、ダミー情報の入出力の有
無からCPU15のエラーを検出するように動作する。
当該エディタ21は、ソフトプログラムによって実現さ
れるものである。
【0022】RAM22は、CPU15のエラー情報
や、ネットワーク2の回線速度を一時記憶するメモリで
ある。ROM23はネットワーク調査エディタ21を動
作させる制御プログラムを格納したメモリである。RO
M23は、データの消去及びその書換えが可能なEPR
OMやEEPROMであっても良い。キーボード24
は、オペレータが制御文等を入力するときに使用する。
ディスプレイ25は、データ処理途中のメニュー画面等
を表示するように動作する。
【0023】CPU26は、各テーブル12〜14、R
AM22、ROM23、キーボード24、ディスプレイ
25及び送受信部27の入出力を制御する。例えば、C
PU26はエディタ21のサポートを受けて、各計算機
#1〜#8間のネットワーク2、各計算機#1〜#8に
接続した入出力デバイス(メモリ16、送受信部19
等)、及び、各計算機#1〜#8のCPU15にエラー
が生じているか否かを一定時間毎に調査して該調査情報
を取得する。CPU26は調査情報をテーブル14に登
録する。ここでの調査情報はネットワーク2の回線速度
やCPU15のエラー情報等である(本発明の第1のシ
ステム)。なお、CPU26は、本発明の第2〜第5の
システムを具体化する機能を有している。これらについ
ては図6において詳述する。
【0024】送受信部27は、各計算機#1〜#8と通
信を行うように動作する。送受信部27はネットワーク
2の通信回線に接続されている。送受信部27や各計算
機#1〜#8の送受信部19は、本願発明者が先に特許
出願している計算機間通信方法及び装置を利用する。デ
ータバス28は、各計算機#1〜#8からのジョブ投入
に伴う登録データをRAM22に転送したり、RAM2
2からテーブル12に登録データを転送するように機能
する。データバス28は、RAM22、ROM23、キ
ーボード24、ディスプレイ25、送受信部27及びC
PU26を接続している。これらにより制御装置11を
構成する。
【0025】次に、図3〜図6を参照しながら、本発明
の第1の実施の形態に係るジョブの登録について各計算
機の動作を説明する。まず、各計算機#1〜#8からジ
ョブが投入されると、図3に示すようなキューイングテ
ーブル12に保存される。その保存の方法は、図6にお
いて、ステップP1でジョブ投入を待機していた制御装
置11が、直ぐにジョブを各計算機#1〜#8に分散す
ることなく、ジョブが投入されたタイミングでテーブル
12に登録データを書き込む。
【0026】次いで、ステップP2でCPU26は、入
力データのサイズから出力データのサイズを予想する。
入力データは、ある計算機が投入したジョブを構成する
ものである。CPU26は、入力データサイズ×一定係
数によって出力データのサイズを求めている。ここでの
係数はジョブの種類に応じて代わり、予め関連付けられ
ている。データのフォーマットによって係数が可変する
ものである。
【0027】本実施の形態では、CPU26はネットワ
ーク調査エディタ21のサポートを受けて、各計算機#
1〜#8間のネットワーク2、各計算機#1〜#8に接
続した入出力デバイス(メモリ16、送受信部19
等)、及び、各計算機#1〜#8のCPU15にエラー
が生じているか否かを一定時間毎に調査して該調査情報
を取得している。CPU26は調査情報をテーブル14
に登録する。この調査情報はネットワーク2の回線速度
やCPU15のエラー情報等である。エラー情報は、C
PU15からの「わたしはエラーです」というエラーメ
ッセージ(自己申告)を受信することにより確認しても
良い(本発明の第1のシステム)。
【0028】次いで、ステップP3でCPU26は各計
算機#1〜#8における入力データの転送時間及び出力
データの転送時間を求める。CPU26はネットワーク
資源テーブル14を参照する。このときネットワークエ
ラーが発生している計算機は対象外にする。本実施の形
態では、CPU26は、先に取得した調査情報と、各計
算機#1〜#8に実行依頼されるジョブの入力データの
大きさや種類から、該入力データを各計算機#1〜#8
に転送するときの転送時間と、該計算機#1〜#8のジ
ョブ実行後に出力データを転送するときの転送時間とを
各計算機#1〜#8毎に予測するように動作する(本発
明の第3のシステム)。
【0029】その後、受入れ可能な計算機が存在するか
否かを調べるために、ステップP4で計算機資源テーブ
ル13から、入出力データの一時保存可能なメモリ容量
を備えた計算機を見つけ出す。本実施の形態では、CP
U26は、各計算機#1〜#8間のネットワーク2の使
用状態、各計算機#1〜#8に接続されたメモリ16の
空き状態及び各計算機#1〜#8のCPU15の潜在的
処理能力を一定時間毎に調査して該調査情報を取得する
ように動作している。そして、CPU26は調査情報を
テーブル13に登録する。ここでの調査情報は、各計算
機のCPU、メモリの空き状態、回線速度、内部メモリ
の容量、エラーの発生の有無、ジョブの実行時間、計算
処理時間、ジョブの開始時間等である(本発明の第2の
システム)。
【0030】そして、CPU26は、各計算機#1〜#
8にエラーが発生していないことを確認すると、その
後、各計算機#1〜#8に毎にジョブの実行時間Teを
求める。ここで、実行時間Teは、入力データの1サイ
ズ当たりの平均実行時間Tm×入力データサイズDIN
によって求める。各計算機の実績をテーブル12に登録
しておくためである。本実施の形態では、CPU26
は、先に取得した調査情報と、各計算機#1〜#8に実
行依頼されるジョブの入力データの大きさや種類から、
ジョブの実行に要する実行時間を各計算機#1〜#8毎
に予測するように動作する(本発明の第4のシステ
ム)。
【0031】次に、ステップP5でCPU26は、入出
力データの転送時間と実行時間の総和である計算処理時
間(リードタイム)を各計算機#1〜#8に毎に求め
る。計算処理時間は各計算機がデータを入力してからデ
ータを出力するまでの時間であり、各計算機の能力又は
実績を表すものである。更に、ステップP6で平均計算
処理時間を求め、この時間が一定以上の処理時間を超過
する場合であって、優先度操作の許可があるときは、ジ
ョブの実行順番を変えるために優先度を上げる。このよ
うな機能は短時間で処理可能なジョブを他のジョブに優
先させるものである。なお、平均計算処理時間は、最近
流れたn個のジョブの実行時間を入力サイズで割ったも
のである。優先度は、オペレータによって自由に指定で
きる。一定以上に優先度を高くすることはできない。
【0032】そして、ステップP7でキューイングテー
ブル12にジョブの実行順番を登録する。本実施の形態
では、CPU26は、先に予測した入力データの転送時
間、出力データの転送時間と、ジョブの実行時間及び投
入されたジョブの優先度に応じてジョブの実行順番を決
定するように動作する。このように事前にジョブの実行
順番を求めているのは、優先度操作をするための目安と
して計算処理時間が必要となるためである。なお、待ち
時間が長いもの程、優先度が自動的に上げられる(本発
明の第5のシステム)。
【0033】このようにして本発明の第1の実施の形態
に係る複数計算機運用システムでは、各計算機#1〜#
8間のネットワーク2、各計算機#1〜#8に接続され
たメモリ16、送受信部17等の入出力デバイス、及
び、各計算機#1〜#8のCPU15にエラーを生じて
いるか否かが、ネットワーク調査エディタ21によっ
て、一定時間毎に調査され、この調査情報が取得されて
いるので、8台の計算機#1〜#8にあるジョブが与え
られた場合、エラーが生じた計算機や入出力デバイスに
空きが無い計算機へはジョブの実行依頼が行われること
なく、エラーが生じていない計算機にジョブが実行依頼
されるようになる。これにより、8台の計算機#1〜#
8を効率良く運用することができる。
【0034】また、本実施の形態では、各計算機間のネ
ットワークの使用状態、各計算機に接続された入出力デ
バイスの空き状態、及び、各計算機#1〜#8のCPU
15の潜在的処理能力が、CPU26によって、一定時
間毎に調査され、この調査情報が取得されているので、
計算機#1〜#8にジョブが与えられた場合、1つの計
算機にジョブが集中することなく、各計算機#1〜#8
の処理能力、その入出力デバイスの空き状態に応じて各
計算機#1〜#8にジョブを実行依頼することができる
(第2のシステム)。
【0035】これにより、8台の計算機#1〜#8にジ
ョブを効率良く分散させることができる。ある程度のバ
ラツキが生じも、各事業所の計算機の処理能力に合った
ジョブが実行依頼できる。ジョブが分散されるので、各
計算機が有するメモリ16の容量内でジョブを実行する
ことができる。更に、本実施の形態では調査情報と、各
計算機#1〜#8に実行依頼されるジョブの入力データ
の大きさや種類から入力データの転送時間と、出力デー
タの転送時間とが、CPU26によって、各計算機#1
〜#8毎に予測されているので、計算機#1〜#8にジ
ョブが与えられた場合、入出力データの転送時間が最も
早い計算機から順にジョブを実行依頼することができる
(第3のシステム)。
【0036】また、本実施の形態では、調査情報と、各
計算機#1〜#8に実行依頼されるジョブの入力データ
の大きさや種類から該ジョブの実行時間が、CPU26
によって各計算機#1〜#8毎に予測されているので、
計算機#1〜#8にジョブが与えられた場合、ジョブの
実行時間が最も早い計算機から順にジョブを実行依頼す
ることができる(第4のシステム)。
【0037】更に、本実施の形態では、入出力データの
転送時間と、ジョブの実行時間及びジョブの優先度から
ジョブの実行順番が、CPU26によって決定されるの
で、計算機#1〜#8にジョブが与えられた場合、入出
力データの転送時間が最も早く、しかも、ジョブの実行
時間が最も早い計算機に、優先度の高いジョブを実行さ
せるように順番を決定することができる(第5のシステ
ム)。
【0038】これにより、ネットワーク2に接続された
8台の計算機#1〜#8の処理能力に応じたジョブを分
散させることができる。また、特定のネットワークの占
有時間が多くなることも無くなる。8台の計算機#1〜
#8を均等に運用できるので、運用コストが低減でき
る。 (2)第2の実施の形態 図7は、本発明の第2に実施の形態に係る複数計算機運
用システムのジョブ実行依頼時のフローチャートを示し
ている。第2の実施の形態では、キューイングテーブル
に登録されたジョブの実行順番を再度見直しながら、各
計算機にジョブの実行依頼を行うものである。
【0039】図7において、まず、ステップP11でCP
U26はキューイングテーブル12から登録データを読
み出す。ここで、登録データを分類(ソート)し、その
結果、一番最初に実行するべきジョブに関する登録デー
タを読み出す。次に、ステップP12でCPU26は、ネ
ットワーク資源テーブル14から各計算機間の回線速度
を読み出して、各計算機における入力データの転送時間
及び出力データの転送時間を再計算する。このときネッ
トワークエラーが発生している計算機は対象外にする。
この計算は、先に求めた転送時間がネットワークの使用
状態により変化していることがあるためであり、ジョブ
の実行依頼の直前の見直しである。
【0040】その後、ステップP13でCPU26は計算
機資源テーブル13から、入出力データが一時保存可能
なメモリ容量を備えた計算機を見つけ出す。そして、C
PU26は、各計算機#1〜#8にエラーが発生してい
ないことを確認すると、その後、各計算機#1〜#8毎
にジョブの実行時間Teを再計算する。ここで、実行時
間Teは、入力データの1サイズ当たりの平均実行時間
Tm×入力データサイズDINによって求める。この計
算は、先に求めた実行時間が、各計算機のCPU15や
メモリ16のエラーによって変化していることがあるた
めであり、ジョブの実行依頼の直前の見直しである。ま
た、各計算機#1〜#8のメモリ16が当該システムと
共有している場合があるからである。
【0041】次に、ステップP14でCPU26は各計算
機#1〜#8毎に計算処理時間を再計算する。計算処理
時間は入出力データの転送時間と実行時間の和である。
この計算は、ジョブを実行依頼する直前の優先度操作に
必要となるためである。更に、ステップP15でCPU2
6は計算機で既に実行しているジョブがある場合、次の
ジョブの開始時間を加算した総合計算処理時間を求め
て、これから実行依頼するジョブの実行開始予測時間を
各計算機毎に求める。実行中の計算機に、次のジョブが
無い場合は、例えば、現在の時間を設定する。CPU2
6は、先に予測した入力データの転送時間及び出力デー
タの転送時間と、ジョブの実行時間の総和から、各計算
機#1〜#8毎にこれから投入するジョブの実行開始時
間を予測するように動作する(本発明の第6のシステ
ム)。
【0042】その後、ステップP16でCPU26は実行
開始予測時間とこれから実行依頼するジョブの計算処理
時間を加算して、実行終了予測時間を各計算機#1〜#
8毎に求める。CPU26は、先に各計算機#1〜#8
毎に予測したジョブの実行開始時間、入力データ及び出
力データの転送時間、ジョブの実行時間及び計算機の異
常検出の有無から実行終了時間を予測するように動作す
る(本発明の第7のシステム)。
【0043】そして、ステップP17でCPU26は実行
終了予測時間が最も早い計算機に対してジョブの実行依
頼を行う。CPU26は、先に各計算機#1〜#8毎に
予測したジョブの実行終了時間が、最も早い計算機に対
して次のジョブの実行依頼を行うように動作する(本発
明の第8のシステム)。なお、ステップP18でCPU2
6はジョブ実行依頼の終了判断をする。投入されたジョ
ブを全部各計算機に実行依頼した場合(YES)には、こ
のフローを終了する。また、ジョブを全部各計算機に実
行依頼していない場合(NO)には、ステップP11に戻
ってステップP11〜P17を繰り返す。
【0044】このように本発明の第2の実施の形態に係
る複数計算機運用システムでは、入出力データの転送時
間と、ジョブの実行時間の総和から、各計算機毎にこれ
から投入するジョブの実行開始時間が、CPU26によ
って予測されるので、現在、ある計算機がジョブを実行
している場合、最も早く次のジョブに取り掛かれる計算
機を見付出すことができる。したがって、その計算機に
次のジョブを実行依頼することができる(第6のシステ
ム)。これにより、8台の計算機#1〜#8を効率良く
運用することができる。
【0045】また、本実施の形態では、入出力データの
転送時間、ジョブの実行時間及び計算機の異常検出の有
無からジョブの実行終了時間が、CPU26によって予
測されているので、現在、ある計算機にジョブが与えら
れている場合、異常が無く、最も早くジョブを終了する
計算機を見付出すことができる(第7のシステム)。し
たがって、その計算機に次のジョブを実行依頼すること
ができる。
【0046】更に、本実施の形態では、ジョブの実行終
了時間が、最も早い計算機に対してCPU26が次のジ
ョブの実行依頼を行うので、最も早くジョブを終了した
計算機から順に次のジョブを実行させることができる
(第8のシステム)。これにより、8台の計算機#1〜
#8にジョブを効率良く分散させることができる。な
お、ジョブを実行依頼した後は、CPU26はそのジョ
ブが正常終了したか否を確認し、その後、キューイング
テーブル12から登録を抹消する。また、実行計算機に
何らかのトラブルが発見された場合は、次に説明するフ
ローチャートに従って、他の計算機に再度実行依頼が行
われる。
【0047】(3)第3の実施の形態 図8は、本発明の第3に実施の形態に係る複数計算機運
用システムのエラー発生時の対処フローチャートを示し
ている。第3に実施の形態では、CPU26は、先に取
得した調査情報により計算機に異常を発見した場合、当
該計算機へのジョブを中止し、他の計算機に該ジョブを
移行するように動作する(本発明の第9のシステム)。
【0048】図8において、ステップP21でCPU26
は計算機資源テーブル13及びネットワーク資源テーブ
ル14から登録データを読み出す。次に、ステップP22
でCPU26は、これらのテーブル13及び14を参照
して、ジョブを実行依頼した計算機にエラーが発生して
いるか否かを検出する。エラーが発生していた場合(Y
ES)には、ステップP23に移行してCPU26は、エラ
ー内容に応じて定められた一定時間の経過を待つ。エラ
ーが回復するかも知れないからである。
【0049】そして、ステップP24でCPU26はエラ
ーが回復したか否かを判断する。エラーが回復した場合
(YES)は、ステップP22でエラーが検出されない場合
(NO)と同様に、ステップP28に移行する。ステップ
P23で一定時間待ってもエラーが回復しない場合(N
O)には、ステップP25に移行して、CPU26はジョ
ブの実行依頼を中止(キャンセル)する。
【0050】次に、ステップP26でCPU26は、実行
依頼を中止したジョブの優先度を高く設定して再登録を
し、その後、キューイングデーブル12の“状態”をジ
ョブの実行待ちにする。この再登録によって、先に図7
で説明したようにステップP11でCPU26はキューイ
ングデーブル12から登録データを読み出し、以後の処
理を実行する。
【0051】このようにして本発明の第3の実施の形態
に係る複数計算機運用システムでは、先に取得された調
査情報から、計算機の異常を発見した場合、CPU26
によって、当該計算機へのジョブが中止され、他の計算
機に該ジョブが実行依頼されるので、当該システムに与
えられたジョブを異常の無い計算機によって処理するこ
とができる。
【0052】本実施の形態では、エラー発生率が一定値
を越える計算機や回線速度が遅いネットワークが検出さ
れると、これを実行依頼の対象から除外し、コンソール
(ディスプレイ表示)や電子メール等により管理者に通
知することによって対処する。また、本実施の形態で
は、各計算機#1〜#8のメモリ16の容量を考慮し
て、入出力データの転送と計算機へのジョブを単一のも
のとして説明したが、各計算機が、複数の入出力データ
を格納できるメモリ容量を有する場合は、入力データの
転送、計算機処理及び出力データの転送を別々にスケジ
ューリングしても良い。このようにすると他のジョブを
実行している間に、次のジョブのデータを転送すること
ができ、ネットワークを効率良く使用できる。
【0053】
【発明の効果】以上説明したように本発明の複数計算機
運用システムでは、ネットワーク、各計算機の入出力デ
バイス、及び、その中央処理装置にエラーを生じている
か否かを一定時間毎に調査する制御装置が設けられてい
る。したがって、ネットワーク及び入出力デバイスに空
きが無かったり、エラーが生じた計算機へは、制御装置
が、ジョブの実行依頼を行わないので、エラーが生じて
いない計算機を選んでジョブを実行させることができ
る。これにより、複数の計算機を効率良く運用すること
ができる。
【0054】また、本発明の他のシステムでは、ネット
ワークの使用状態、各計算機の入出力デバイスの空き状
態、及び、各計算機の中央処理装置の潜在的処理能力を
一定時間毎に調査する制御装置が設けられている。した
がって、制御装置は、1つの計算機にジョブを集中して
依頼することなく、各計算機の処理能力、その入出力デ
バイスの空き状態に応じたジョブを実行依頼するように
なる。これにより、複数の計算機にジョブを効率良く分
散させることができる。
【図面の簡単な説明】
【図1】本発明の各実施の形態に係る複数計算機運用シ
ステムの構成図である。
【図2】本発明の各実施の形態に係る複数計算機運用制
御装置の構成図である。
【図3】本発明の各実施の形態に係るキューイングテー
ブルの内容説明図である。
【図4】本発明の各実施の形態に係る計算機資源テーブ
ルの内容説明図である。
【図5】本発明の各実施の形態に係るネットワーク資源
テーブルの内容説明図である。
【図6】本発明の第1の実施の形態に係る複数計算機運
用システムのジョブの登録フローチャートである。
【図7】本発明の第2の実施の形態に係る複数計算機運
用システムのジョブの実行依頼フローチャートである。
【図8】本発明の第3の実施の形態に係る複数計算機運
用システムのエラー発生時の対処フローチャートであ
る。
【図9】従来例に係る複数計算機運用システムの構成図
である。
【符号の説明】
1…ホスト計算機、2…ネットワーク、#1〜#8…計
算機、11…複数計算機運用制御装置、12…キューイ
ングテーブル、13…計算機資源テーブル、14…ネッ
トワーク資源テーブル、15,26…CPU、16…メ
モリ、17,24…キーボード、18…サポートツー
ル、19,27…送受信部、21…ネットワーク調査エ
ディタ、22…RAM、23…ROM、25…ディスプ
レイ、28…データバス。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークで接続した複数の計算機に
    データ処理を分散させる複数計算機運用システムにおい
    て、 少なくとも、前記各計算機間のネットワーク、各計算機
    に接続した入出力デバイス、及び、各計算機の中央処理
    装置にエラーが生じているか否かを一定時間毎に調査し
    て該調査情報を取得する制御装置を備えていることを特
    徴とする複数計算機運用システム。
  2. 【請求項2】 ネットワークで接続した複数の計算機に
    データ処理を分散させる複数計算機運用システムにおい
    て、 少なくとも、前記各計算機間のネットワークの使用状
    態、各計算機に接続された入出力デバイスの空き状態及
    び各計算機の中央処理装置の潜在的処理能力を一定時間
    毎に調査して該調査情報を取得する制御装置を備えてい
    ることを特徴とする複数計算機運用システム。
  3. 【請求項3】 前記請求項1及び請求項2に記載の制御
    装置により取得された調査情報と、前記各計算機に実行
    依頼されるジョブの入力データの大きさや種類から、該
    入力データを各計算機に転送するときの転送時間と、該
    計算機のジョブ実行後に出力データを転送するときの転
    送時間とを各計算機毎に予測する制御装置を備えている
    ことを特徴とする複数計算機運用システム。
  4. 【請求項4】 前記請求項1及び請求項2に記載の制御
    装置により取得された調査情報と、前記各計算機に実行
    依頼されるジョブの入力データの大きさや種類から、該
    ジョブの実行に要する実行時間を各計算機毎に予測する
    制御装置を備えていることを特徴とする複数計算機運用
    システム。
  5. 【請求項5】 前記請求項3に記載の制御装置により予
    測された入力データの転送時間と出力データの転送時
    間、前記請求項4に記載の制御装置により予測されたジ
    ョブの実行時間、及び、投入されたジョブの優先度に応
    じてジョブの実行順番を決定する制御装置を備えている
    ことを特徴とする複数計算機運用システム。
  6. 【請求項6】 前記請求項3に記載の制御装置により予
    測した入力データの転送時間と出力データの転送時間と
    前記請求項4に記載の制御装置により予測されたジョブ
    の実行時間とを加算し、これから投入するジョブの実行
    開始時間を各計算機毎に予測する制御装置を備えている
    ことを特徴とする複数計算機運用システム。
  7. 【請求項7】 前記請求項6に記載の制御装置により予
    測されたジョブの実行開始時間、前記請求項3に記載の
    制御装置により予測された入力データの転送時間と出力
    データの転送時間、前記請求項4に記載の制御装置によ
    り予測されたジョブの実行時間、及び、前記計算機の異
    常検出の有無から実行終了時間を予測する制御装置を備
    えていることを特徴とする複数計算機運用システム。
  8. 【請求項8】 前記請求項7に記載の制御装置により予
    測されたジョブの実行終了時間が、最も早い計算機に対
    して次のジョブの実行依頼を行う制御装置を備えている
    ことを特徴とする複数計算機運用システム。
  9. 【請求項9】 前記請求項1に記載の制御装置により取
    得された調査情報により計算機に異常を発見した場合、
    当該計算機へのジョブを中止し、他の計算機に該ジョブ
    を実行依頼する制御装置を備えていることを特徴とする
    複数計算機運用システム。
JP8086466A 1996-04-09 1996-04-09 複数計算機運用システム Pending JPH09282288A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8086466A JPH09282288A (ja) 1996-04-09 1996-04-09 複数計算機運用システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8086466A JPH09282288A (ja) 1996-04-09 1996-04-09 複数計算機運用システム

Publications (1)

Publication Number Publication Date
JPH09282288A true JPH09282288A (ja) 1997-10-31

Family

ID=13887743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8086466A Pending JPH09282288A (ja) 1996-04-09 1996-04-09 複数計算機運用システム

Country Status (1)

Country Link
JP (1) JPH09282288A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031771A (ja) * 2003-07-08 2005-02-03 Hitachi Ltd ジョブスケジューリング管理方法及びシステム並びにプログラム
WO2005064534A1 (ja) * 2003-12-26 2005-07-14 Evolvable Systems Research Institute Inc. パラメータ調整装置
JP2007244887A (ja) * 2001-12-03 2007-09-27 Ziosoft Inc ボリュームレンダリング処理方法、ボリュームレンダリング処理システム、計算機及びプログラム
JP2007287171A (ja) * 2002-10-25 2007-11-01 Mentor Graphics Corp 遠隔コンピュータへのオペレーションの分散方法、装置及び記憶媒体
JP2008077281A (ja) * 2006-09-20 2008-04-03 Nec Corp スーパースケジューラ、処理依頼方法、およびスーパースケジューラプログラム
US7454754B2 (en) 2001-08-06 2008-11-18 International Business Machines Corporation System for providing resources based on licensing contract with user by correcting the error between estimated execution time from the history of job execution
JP2010079504A (ja) * 2008-09-25 2010-04-08 Mitsubishi Electric Information Systems Corp 分散処理装置、分散処理システム、分散処理方法および分散処理プログラム
JP2010122758A (ja) * 2008-11-17 2010-06-03 Fujitsu Ltd ジョブ管理装置、ジョブ管理方法およびジョブ管理プログラム
US8219997B2 (en) 2006-11-10 2012-07-10 International Business Machines Corporation Execution the job that is divided into job tasks based on the estimated completion time
JP2017174235A (ja) * 2016-03-24 2017-09-28 富士通株式会社 制御方法、制御プログラムおよび制御装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8689229B2 (en) 2001-08-06 2014-04-01 International Business Machines Corporation Providing computational resources to applications based on accuracy of estimated execution times provided with the request for application execution
US8245237B2 (en) 2001-08-06 2012-08-14 International Business Machines Corporation Providing resources to a job comparing estimated execution time on currently available nodes and estimated execution time on nodes available after completion of a currently executing job
US7454754B2 (en) 2001-08-06 2008-11-18 International Business Machines Corporation System for providing resources based on licensing contract with user by correcting the error between estimated execution time from the history of job execution
JP2007244887A (ja) * 2001-12-03 2007-09-27 Ziosoft Inc ボリュームレンダリング処理方法、ボリュームレンダリング処理システム、計算機及びプログラム
JP2007287171A (ja) * 2002-10-25 2007-11-01 Mentor Graphics Corp 遠隔コンピュータへのオペレーションの分散方法、装置及び記憶媒体
JP2005031771A (ja) * 2003-07-08 2005-02-03 Hitachi Ltd ジョブスケジューリング管理方法及びシステム並びにプログラム
US7636706B2 (en) 2003-12-26 2009-12-22 Evolvable Systems Research Institute Inc. Parameter adjustment device
WO2005064534A1 (ja) * 2003-12-26 2005-07-14 Evolvable Systems Research Institute Inc. パラメータ調整装置
JP2008077281A (ja) * 2006-09-20 2008-04-03 Nec Corp スーパースケジューラ、処理依頼方法、およびスーパースケジューラプログラム
US8219997B2 (en) 2006-11-10 2012-07-10 International Business Machines Corporation Execution the job that is divided into job tasks based on the estimated completion time
JP2010079504A (ja) * 2008-09-25 2010-04-08 Mitsubishi Electric Information Systems Corp 分散処理装置、分散処理システム、分散処理方法および分散処理プログラム
JP2010122758A (ja) * 2008-11-17 2010-06-03 Fujitsu Ltd ジョブ管理装置、ジョブ管理方法およびジョブ管理プログラム
JP2017174235A (ja) * 2016-03-24 2017-09-28 富士通株式会社 制御方法、制御プログラムおよび制御装置

Similar Documents

Publication Publication Date Title
US4495570A (en) Processing request allocator for assignment of loads in a distributed processing system
US8533334B2 (en) Message binding processing technique
EP1750200A2 (en) System and method for executing job step, and computer product
US20080229320A1 (en) Method, an apparatus and a system for controlling of parallel execution of services
US20070233924A1 (en) Apparatus, system, and method for resolving computing resource deadlocks
US6864992B1 (en) Network system, method and computer readable medium including print log generation
US20030128384A1 (en) Dynamic load-balancing print server systems and methods
JPH09282288A (ja) 複数計算機運用システム
JP3442932B2 (ja) 情報処理システム
US7924447B2 (en) Method and system for workload balancing
US5613133A (en) Microcode loading with continued program execution
JP2007286703A (ja) 親子ライセンス管理方法、親子ライセンス管理方法及び親子ライセンス管理プログラム
CN107102966B (zh) 多核处理器芯片、中断控制方法及控制器
CN111831408A (zh) 异步任务处理方法、装置、电子设备及介质
CN101634973A (zh) 传送路径选择设备和方法
JP2016042338A (ja) 情報処理システム、情報処理装置、情報処理装置の制御方法、及びプログラム
JPS623361A (ja) ステ−タス通報方式
JP2998648B2 (ja) 負荷分散ジョブ処理システム
CN112651668A (zh) 一种航班资源分配方法、装置及服务器
JPH07249010A (ja) ジョブスケジューラおよびジョブスケジューリング方法
JP2848762B2 (ja) データ授受システムおよびその方法
EP1139228A2 (en) An intelligent bus interconnect unit
JP3082297B2 (ja) タスク制御方式
JP3243672B2 (ja) 医用画像処理システム
US20050165978A1 (en) Apparatus and method of managing device jobs using hosts

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050726

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050825

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20051004

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060310