JPH1011406A - 資源の分散環境におけるジョブ実行方法 - Google Patents

資源の分散環境におけるジョブ実行方法

Info

Publication number
JPH1011406A
JPH1011406A JP16352996A JP16352996A JPH1011406A JP H1011406 A JPH1011406 A JP H1011406A JP 16352996 A JP16352996 A JP 16352996A JP 16352996 A JP16352996 A JP 16352996A JP H1011406 A JPH1011406 A JP H1011406A
Authority
JP
Japan
Prior art keywords
job
computer
server
list
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16352996A
Other languages
English (en)
Inventor
Kazuko Narita
和子 成田
Hideki Mochizuki
秀樹 望月
Mitsugi Yamada
貢 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP16352996A priority Critical patent/JPH1011406A/ja
Publication of JPH1011406A publication Critical patent/JPH1011406A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 ジョブが使用するジョブファイル、ファイル
A、ファイルBのような資源がネットワーク10を介し
て複数のサーバ3−1,3−2,3−3に分散して配置
されるシステムのジョブ実行方法において、ネットワー
クトラフィックと計算機負荷の両面を考慮してジョブを
実行するサーバ3を決定する。 【解決手段】 クライアント2は、ジョブが使用する資
源に関してサーバ3の所有する資源の総データ量の大き
さの順にサーバ名を配列するリストを作成してジョブ情
報に付加し、このリストの先頭のサーバ3へジョブを投
入する。ジョブの投入を受けたサーバ3は、自計算機負
荷の大きさに応じて自計算機でジョブを実行するかリス
トの次の計算機へジョブを転送するかを決定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ジョブの使用する
資源がネットワークを介して複数の計算機に分散して配
置されるシステムのジョブ実行方法に係わり、特にネッ
トワークトラフィックと計算機負荷に基づいてジョブを
実行する計算機を決定する方法に関する。
【0002】
【従来の技術】ジョブ又はプロセスと呼ばれる計算機に
おける作業単位は、その実行時にジョブファイル、アプ
リケーションプログラム、入出力ファイルのような資源
を必要とする。ジョブの使用する資源が1つの計算機内
に限定されず、ネットワークを介して複数の計算機に分
散して配置される計算機システムが知られている。この
ような計算機システムにおいてジョブを実行する計算機
を決定するに当り、従来はこれらの資源がどの計算機に
所在するかを考慮せず、ただ各計算機のCPU使用率、
入出力装置使用率等を比較し、負荷の低い計算機を選択
していた。
【0003】
【発明が解決しようとする課題】上記従来技術によれ
ば、ジョブを実行する計算機として計算機負荷だけを考
慮していたため、他の計算機が所有する資源を取得する
ためにネットワークトラフィックが増大し、効率的なジ
ョブ実行ができないという問題があった。
【0004】本発明の目的は、ネットワークトラフィッ
クも考慮に入れたネットワーク環境でのジョブ実行方法
を提供することにある。
【0005】
【課題を解決するための手段】本発明は、ジョブが使用
する資源に関して計算機の所有する資源の総データ量の
大きさの順に計算機を配列するように計算機の識別子の
リストを作成してジョブ情報に付加し、このリストの先
頭の計算機へジョブを投入し、ジョブが投入された計算
機によって自計算機の負荷の大きさに応じて自計算機で
ジョブを実行するかリストの次の計算機へジョブを転送
するかを決定するジョブ実行方法を特徴とする。
【0006】
【発明の実施の形態】以下、本発明の一実施形態につい
て図面を用いて説明する。
【0007】図1は、ネットワークを介してジョブを実
行するシステムの構成図である。サーバ3−1,3−
2,3−3及び3−4は、ジョブを実行する計算機であ
り、ネットワーク10を介して相互に接続されている。
ジョブを実行するときに使用する資源は、複数のサーバ
3に亘って分散して配置されている。図1の例によれ
ば、サーバ3−3がジョブファイルとアプリケーション
プログラムを所有し、サーバ3−1がファイルAと印刷
出力用の装置Cを所有し、サーバ3−2がファイルBを
所有する。ジョブファイルとは、ジョブ制御のパラメー
タを格納するファイルである。クライアント2は、ネッ
トワーク10を介してサーバ3に接続され、いずれかの
サーバ3にジョブを投入する計算機である。サーバ3及
びクライアント2は、パソコン、ワークステーションを
含む電子計算機である。ジョブファイル,アプリケーシ
ョンプログラム,ファイルA及びファイルBは、サーバ
3に接続される記憶装置上に格納される。
【0008】クライアント2は、ジョブファイルを参照
してジョブを実行するときに使用されるファイルを所有
するサーバの識別子を取得し、ファイルの種別からデー
タ量の多いファイルを所有するサーバから順にサーバ名
を配列する実行可能計算機リストを作成し、ジョブ名等
のパラメータの後に付加し、実行可能計算機リストの先
頭のサーバへジョブを投入する。このジョブを受信した
サーバ3は、他に実行待ちのジョブがなければ投入され
たジョブを直ちに実行する。実行待ちのジョブがあれ
ば、自サーバの負荷と実行可能計算機リストに挙げられ
た次のサーバの負荷とを比較し、自サーバの負荷が小さ
いか等しければ自サーバでジョブを実行し、次のサーバ
の負荷が小さければジョブを次のサーバへ転送する。
【0009】図1に例示するジョブが使用するファイル
の所在場所を纏めると、次のようになる。 ジョブファイル及びアプリケーションプログラム:サー
バ3−3 入出力ファイル: ファイルA:サーバ3−1 ファイルB:サーバ3−2 印刷出力ファイル:サーバ3−1 入出力ファイルは、印刷出力ファイル以外のデータファ
イルである。
【0010】図2は、クライアント2がジョブを投入す
るときサーバ3へ送信する情報の形式を示す図である。
ジョブ名、ジョブファイル名、ユーザ名などジョブに関
する情報に続いて、実行可能計算機の数n、対象計算機
の位置p及び実行可能計算機リストを設定する。実行可
能計算機の数は、ジョブの投入が可能なサーバの数であ
る。実行可能計算機リストは、ジョブの投入が可能なサ
ーバの識別子を優先度の高いものから順に配列するリス
トである。リストに配列されるサーバの数は、実行可能
計算機の数に等しい。対象計算機の位置は、実行可能計
算機リストの中でジョブ投入の対象とするサーバを指す
番号である。
【0011】図3は、クライアント2のオペレーティン
グシステム(OS)の中のジョブ管理機能を有する部分
の処理の流れを示すフローチャートである。クライアン
ト2は、そのOSのサーバ列挙の関数を呼び出してジョ
ブ実行可能なすべてのサーバの識別子を取得する(ステ
ップ21)。次にクライアント2は全サーバの優先度を
記憶する一時記憶領域を0クリアし(ステップ22)、
ジョブが使用する資源を所有するサーバを求める(ステ
ップ23)。ジョブファイルを参照すれば、各資源を所
有するサーバ識別子を得ることができる。ジョブファイ
ルは、クライアント2内に登録されたもの又はサーバ3
−3に要求して取得したものである。次にジョブファイ
ルを所有するサーバの優先度に1を加え(ステップ2
4)、印刷出力ファイルを所有するサーバの優先度に2
を加え(ステップ25)、入出力ファイルを所有するサ
ーバの優先度に3を加える(ステップ26)。ここでは
入出力ファイルのデータ量が最も大きく、印刷出力ファ
イルのデータ量がこれに次ぎ、ジョブファイルのデータ
量が最も小さいものとしている。サーバの優先度はその
サーバが所有する資源の総データ量の大きさの順とな
る。次にサーバ識別子を優先度の高いものから順に配列
する実行可能計算機リストを作成し、実行可能計算機の
数を設定し、対象計算機の位置を1に設定し(ステップ
27)、実行可能計算機リストの先頭のサーバ3へジョ
ブを転送する(ステップ28)。
【0012】ジョブの使用するファイルが図1に示すよ
うにサーバ3に配置されている場合には、サーバ3−1
の優先度が5、サーバ3−2の優先度が3、サーバ3−
3の優先度が1、サーバ3−4の優先度が0となるの
で、実行可能計算機リストはサーバ3−1、サーバ3−
2、サーバ3−3、サーバ3−4の順で配列される。
【0013】図4は、サーバ3のOSの中のジョブ・ス
ケジューラの部分の処理の流れを示すフローチャートで
ある。クライアント2又は他のサーバ3からジョブを受
信すると(ステップ31)、ジョブキューに実行待ちジ
ョブがあれば(ステップ32YES)、実行可能計算機
の数nと対象計算機の位置pとを比較し、両者が等しく
なく当該サーバ3が実行可能計算機リストの最後に配列
されているサーバでなければ(ステップ33NO)、自
サーバの負荷を算出する(ステップ34)。サーバの負
荷は、例えば次の計算式によって計算する。 負荷={(CPU使用率+メモリ使用率)/処理能力}
*実行待ちジョブ数 CPU使用率及びメモリ使用率は、最新の測定値を使用
する。処理能力はサーバの相対的なCPU性能であり、
1から100までの範囲で設定する。値が大きいほど性
能は高くなる。実行待ちジョブ数は、ジョブキューにあ
る実行待ちジョブの数である。次に実行可能計算機リス
トの次の位置p+1にあるサーバの識別子を取得し(ス
テップ35)、上記計算式によってこのサーバの負荷を
計算する(ステップ36)。当該サーバは、次のサーバ
へ現在のCPU使用率、メモリ使用率及び実行待ちジョ
ブ数を問い合わせて取得する。処理能力は固定値であ
り、あらかじめ登録されている数値を使用する。次に算
出した両負荷を比較する(ステップ37)。自サーバの
負荷が次のサーバの負荷より小さいか等しいとき(ステ
ップ37,自サーバ≦次のサーバ)、受信したジョブを
ジョブキューに登録する(ステップ38)。自サーバの
負荷が次のサーバの負荷より大きいとき(ステップ3
7,自サーバ>次のサーバ)、ジョブ情報に付加される
対象計算機の位置をp+1に更新し(ステップ39)、
次のサーバ3へジョブを転送する(ステップ40)。実
行待ちジョブがない場合(ステップ32NO)及び当該
サーバが実行可能計算機リストの最後に配列されている
場合(ステップ33YES)には、受信したジョブをジ
ョブキューに登録する(ステップ38)。
【0014】このようにして受信したジョブを自サーバ
のジョブキューに登録したサーバ3は、ジョブキューか
らこのジョブを取り出して実行する。例えばサーバ3−
1がこのジョブを実行する場合には、サーバ3−3から
ジョブファイル及びアプリケーションプログラムのコピ
ーを取得し、サーバ3−2からファイルBのコピーを取
得した後ジョブを実行する。
【0015】上記実施形態によれば、実行可能計算機リ
ストはデータ量の大きいファイルを所有するサーバから
順に配列されているので、ジョブを実行するサーバの候
補としてまずネットワークトラフィックを優先してサー
バが選択され、サーバの負荷が大きい場合には次の優先
度のサーバが選択され、ネットワーク環境に適したジョ
ブの実行をすることができる。このときクライアント2
がジョブの使用する資源の配置情報からサーバの優先度
を決定し、サーバ3がサーバの動的な負荷状態を考慮に
入れてジョブを実行するサーバを決定する。
【0016】なお上記実施形態では、ジョブを受信した
サーバ3は自サーバの負荷と実行可能計算機リストの次
のサーバの負荷を算出し、両負荷を比較することによっ
てジョブを実行するかジョブをさらに転送するかを決定
したが、自サーバの負荷のみに基づいてジョブを実行す
るかジョブをさらに転送するかを決定してもよい。例え
ば自サーバのCPU使用率、メモリ使用率、入出力使用
率が所定値に達しているか否かによって自サーバの処理
能力に余裕があるか否かを判定することが可能である。
【0017】
【発明の効果】本発明によれば、ネットワークトラフィ
ックと計算機負荷の両面を考慮に入れてジョブを実行す
る計算機を決定するため、ネットワークを含む計算機シ
ステム全体としてジョブの実行性能を向上させることが
できる。
【図面の簡単な説明】
【図1】実施形態のジョブを実行するシステムの構成図
である。
【図2】実施形態のジョブの投入時に転送する情報のデ
ータ形式を示す図である。
【図3】実施形態のクライアント2の処理の流れを示す
フローチャートである。
【図4】実施形態のサーバ3の処理の流れを示すフロー
チャートである。
【符号の説明】
2:クライアント、3:サーバ、10:ネットワーク

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】ジョブの使用する資源がネットワークを介
    して複数の第1の計算機に分散して配置されるシステム
    のジョブ実行方法において、第2の計算機によって該ジ
    ョブが使用する資源に関して第1の計算機の所有する資
    源の総データ量の大きさの順に第1の計算機の識別子を
    配列するリストを作成してジョブ情報に付加し、該リス
    トの先頭の第1の計算機へジョブ情報と該リストを送信
    し、ジョブ情報と該リストを受信する第1の計算機によ
    って計算機負荷の大きさに応じて自計算機でジョブを実
    行するか該リストの次の第1の計算機へジョブ情報と該
    リストを転送するかを決定することを特徴とする資源の
    分散環境におけるジョブ実行方法。
  2. 【請求項2】ジョブ情報と該リストを受信する第1の計
    算機によって自計算機の計算機負荷と該リストの次の第
    1の計算機の計算機負荷とを算出して両負荷を比較し、
    計算機負荷のより小さい計算機でジョブを実行するよう
    に自計算機でジョブを実行するか該リストの次の第1の
    計算機へジョブ情報と該リストを転送するかを決定する
    ことを特徴とする請求項1記載の資源の分散環境におけ
    るジョブ実行方法。
  3. 【請求項3】該資源は、ジョブファイル、印刷出力ファ
    イル及び印刷出力以外の入出力ファイルを含むことを特
    徴とする請求項1記載の資源の分散環境におけるジョブ
    実行方法。
JP16352996A 1996-06-25 1996-06-25 資源の分散環境におけるジョブ実行方法 Pending JPH1011406A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16352996A JPH1011406A (ja) 1996-06-25 1996-06-25 資源の分散環境におけるジョブ実行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16352996A JPH1011406A (ja) 1996-06-25 1996-06-25 資源の分散環境におけるジョブ実行方法

Publications (1)

Publication Number Publication Date
JPH1011406A true JPH1011406A (ja) 1998-01-16

Family

ID=15775613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16352996A Pending JPH1011406A (ja) 1996-06-25 1996-06-25 資源の分散環境におけるジョブ実行方法

Country Status (1)

Country Link
JP (1) JPH1011406A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665716B1 (en) 1998-12-09 2003-12-16 Hitachi, Ltd. Method of analyzing delay factor in job system
JP2004348192A (ja) * 2003-05-20 2004-12-09 Hitachi Ltd Job分配制御方法
US10248458B2 (en) 2016-03-24 2019-04-02 Fujitsu Limited Control method, non-transitory computer-readable storage medium, and control device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665716B1 (en) 1998-12-09 2003-12-16 Hitachi, Ltd. Method of analyzing delay factor in job system
JP2004348192A (ja) * 2003-05-20 2004-12-09 Hitachi Ltd Job分配制御方法
US10248458B2 (en) 2016-03-24 2019-04-02 Fujitsu Limited Control method, non-transitory computer-readable storage medium, and control device

Similar Documents

Publication Publication Date Title
US7779416B2 (en) Load balance control method and load balance control apparatus in data-processing system
US8725912B2 (en) Dynamic balancing of IO resources on NUMA platforms
US7076781B2 (en) Resource reservation for large-scale job scheduling
Elmroth et al. A grid resource broker supporting advance reservations and benchmark-based resource selection
CN113778694B (zh) 一种任务处理方法、装置、设备及介质
JP2005056391A (ja) コンピューティング環境の作業負荷を均衡させる方法およびシステム
WO2006100752A1 (ja) 分散処理管理装置、分散処理管理方法、分散処理管理プログラム
CN112882827B (zh) 用于负载均衡的方法、电子设备和计算机程序产品
Qureshi et al. Grid resource allocation for real-time data-intensive tasks
JP2007328413A (ja) 負荷分散方法
JPH1011406A (ja) 資源の分散環境におけるジョブ実行方法
JPH05173990A (ja) データ処理システム
US7953776B2 (en) Discovery directives
JP2000259591A (ja) 分散処理ジョブ実行方法およびネットワークシステム
JPS6077259A (ja) 負荷分散方式
JP5045576B2 (ja) マルチプロセッサシステム及びプログラム実行方法
JPH0793262A (ja) アプリケーションツール実行管理システム
JPH07152699A (ja) 情報処理方法及び装置及びシステム
JP2003203061A (ja) 並列計算機システムおよび並列計算機システムにおける計算ノードの選択用プログラム
JP2005107632A (ja) Eaiサーバおよびeaiサーバのプログラム
JP2001034583A (ja) 分散オブジェクト性能管理機構
JP5056346B2 (ja) 情報処理装置、情報処理システム、仮想サーバの移動処理の制御方法、及び、プログラム
JPH076110A (ja) 分散処理システムの通信オーバヘッド低減方法
JP2003132039A (ja) シナリオ分割方式
JP3103731B2 (ja) データベース管理装置