JP2001166956A - 複合システムにおけるジョブスケジューリング方式 - Google Patents

複合システムにおけるジョブスケジューリング方式

Info

Publication number
JP2001166956A
JP2001166956A JP34574599A JP34574599A JP2001166956A JP 2001166956 A JP2001166956 A JP 2001166956A JP 34574599 A JP34574599 A JP 34574599A JP 34574599 A JP34574599 A JP 34574599A JP 2001166956 A JP2001166956 A JP 2001166956A
Authority
JP
Japan
Prior art keywords
job
computer
execution
distribution control
executed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP34574599A
Other languages
English (en)
Inventor
Hiroki Yamazaki
弘樹 山崎
Shigeki Matsuo
繁喜 松尾
Hitoshi Kihara
均 木原
Masatoshi Ichikawa
正利 依知川
Naoko Ochi
直子 越智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP34574599A priority Critical patent/JP2001166956A/ja
Publication of JP2001166956A publication Critical patent/JP2001166956A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】複数の計算機から構成される汎用計算機システ
ムにおいて、1つのジョブが複数のジョブステップから
構成されていた場合、ジョブステップ実行中、その計算
機で実行している他のジョブの影響で資源不足等が発生
すると、実行しようとする当該ジョブの後続のジョブス
テップが実行遅延、または実行不可となってしまうため
にジョブステップをバランスよく負荷分散する必要があ
る。 【解決手段】実行しようとするジョブが複数のジョブス
テップから構成されている場合、後続のジョブステップ
を実行する時、資源/負荷情報収集部13より計算機2
・・3の資源使用情報を取得して、最適な計算機を選択
後、その計算機へジョブを再登録し、中断されたジョブ
ステップから続行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の計算機から
構成される汎用計算機システムにおいて、実行させるバ
ッチジョブの負荷分散ジョブスケジューリング方式に関
する。
【0002】
【従来の技術】複数の計算機から構成される汎用計算機
システムにおいて、接続されたシステム上で業務処理を
効率よく遂行するために各計算機の資源を有効に使用
し、1つの計算機に負荷が偏らないような分散のための
ジョブスケジュール方法は従来から研究されている。た
とえば本発明に近い文献として特開平9−120389
号で示されるものがある。それによればジョブ単位での
負荷分散スケジュールを行うもので、ジョブ入力時、接
続されている各計算機の資源の使用度合いを測定した結
果から最適な計算機を選択し、その計算機にジョブを実
行させようとするものである。何故、ジョブ単位のスケ
ジュールかというと、通常、ジョブを計算機で実行する
ためには、専用のイニシエータという1仮想空間を使用
して処理するが、そこでジョブの実行が開始されると、
そのジョブの構成が1つのジョブステップから構成され
ていても複数のジョブステップから構成されていても、
そのイニシエータ空間だけを使用して第1ステップから
最終ステップまでを実行することになるからである。よ
って、ジョブと言う単位でしかジョブのスケジュールを
行えない。
【0003】また、上記で示す複数のジョブステップか
ら構成されているジョブを、各ステップ毎に複数の計算
機で並列に実行させるための手段も研究されている。そ
の文献として特開平8−286932で示されるものが
ある。この機能は1つのジョブが複数のジョブステップ
で構成されている場合、ステップそれぞれを単独の1ジ
ョブとして各計算機で処理するため、ジョブ全体のター
ンアラウンドタイムの短縮、システム全体のスループッ
トの向上を図ることができる。しかし、実行させるステ
ップ間の依存関係がない場合のみジョブステップを並列
に各計算機で実行できるものである。
【0004】
【発明が解決しようとする課題】上記で挙げたような従
来技術では、ジョブ単位でのスケジュールは円滑に行え
ていた。しかし、1つのジョブが複数のジョブステップ
から構成されていた場合、選択された計算機でジョブが
一旦実行されると、その後の計算機の資源使用の負荷状
況にかかわらず、ジョブ全体がその計算機のみで実行さ
れる。ここで言う負荷とはCPU使用率、主記憶や補助
記憶の使用率、I/O負荷率などがあるが、主にCPU
使用率のことである。そのため、その計算機で実行して
いる他のジョブの影響で資源不足等が発生すると、後続
ジョブステップの実行遅延でジョブ全体のターンアラウ
ンドタイムが延びたり、またはジョブステップが実行不
可能となってしまう。
【0005】
【課題を解決するための手段】本発明は複数の計算機か
ら構成される汎用計算機システムにおいて、実行しよう
としたジョブが複数のジョブステップから構成されお
り、かつステップ間で依存関係がある場合、ステップ実
行終了時に今実行している計算機で後続のジョブステッ
プを実行するかどうかを判断し、実行すべきでないと判
断したとき、実行を中断し、他の計算機に委ねるもので
ある。まず、第1ステップのジョブステップが実行され
終了すると、後続のジョブステップを実行しようとす
る。この時、計算機結合/負荷分散コントロール装置の
資源/負荷情報収集部より各計算機の資源使用情報を得
て、自計算機の資源使用の負荷が高く実行できないと判
断した場合、一旦、ジョブステップの実行を中断し、計
算機結合/負荷分散コントロール装置の再登録ジョブ分
散制御部へジョブの再登録要求を行い、再登録ジョブス
テップ分散制御部より最適な他の計算機へジョブを転送
し、再投入された計算機で再登録されたジョブ実行を中
断されたジョブステップから続行するというジョブスケ
ジューリング方式を特徴とする。
【0006】
【発明の実施の形態】以下、本発明の一実態形態につい
て図面を用いて説明する。
【0007】図1は、本実施形態の複数の計算機から構
成される汎用計算機システムの構成図であり、1つ以上
の複数の計算機により構成されるシステムを対象とす
る。複数の計算機である計算機2・・3は相互に通信を
行う手段として、各計算機から更新・参照可能である領
域を保持する計算機結合/負荷分散コントロール装置1
により接続されているものとする。ジョブは計算機2・
・3のどの計算機からも入力できる。
【0008】計算機結合/負荷分散コントロール装置1
はジョブ分散制御部12、資源/負荷情報収集部13、
再登録ジョブ分散制御部14から構成されている。ジョ
ブは計算機2・・3のどの計算機からも入力でき、入力
されたジョブは一旦、ジョブ分散制御部12へ登録さ
れ、ジョブ分散制御部12で選択されたもっとも最適な
計算機へスケジュールされる。選択された計算機ではジ
ョブの実行を開始する。ジョブが実行され、実行に伴い
出力された実行結果、ユーザデータ及びジョブで使用す
る作業用領域はユーザデータ格納装置4へ出力する。ま
た、ジョブの実行過程において履歴を採取したものを格
納するジョブ実行履歴格納装置5がある。
【0009】このユーザデータ格納装置4、ジョブ実行
履歴格納装置5は共用装置であり、計算機2・・3のど
の計算機からも参照、更新が可能である。計算機2・・
3にはそれぞれ、ジョブステップ終了後、後続のジョブ
ステップを実行すべきかどうかを判断するジョブステッ
プ実行判定制御部21・・31がある。ジョブステップ
が終了した時点で計算機結合/負荷分散コントロール装
置1の資源/負荷情報収集部13より得た情報をもとに
他の計算機で実行したほうが良いと判断した場合、ジョ
ブ再登録制御部22・・32で計算機結合/負荷分散コ
ントロール装置1の再登録ジョブ分散制御部14へ再登
録する。再登録負荷分散制御部14では最も最適な計算
機を再度選択しなおし、ジョブを再登録する。再登録さ
れた計算機では再登録ジョブ実行制御部23・・33で
ジョブを受け取りジョブ実行履歴格納装置5より履歴デ
ータを得て、中断されていたジョブステップから実行を
開始させる。
【0010】図2はジョブステップ実行判定部21・・
31、およびジョブステップ再登録部22・・32の処
理の流れを示すフローチャートである。ジョブが入力さ
れる(ステップ601)とジョブ実行の履歴をジョブ実
行履歴格納装置5に採取し始める。ジョブステップが実
行開始される(ステップ602)と、この実行に伴い使
用する入力データ、作業領域やジョブステップの実行結
果をユーザデータ格納装置4へ出力する。ジョブステッ
プの実行が終了する(ステップ603)と次のステップ
があるかどうかを判定(ステップ604)し、後続のジ
ョブステップがない場合はジョブを終了させる(ステッ
プ605)。後続のジョブステップがある場合(ステッ
プ604YES)は資源/負荷情報収集制御13より計
算機2・・3の全ての資源/負荷情報を取得(ステップ
606)する。取得した情報から自計算機のCPU使用
率を取出し、あらかじめ決めていた自計算機のCPU使
用率の限度を示す閾値とを比較(ステップ607)し、
閾値を下回っていた場合(ステップ607YES)は後
続のジョブステップを実行する(ステップ608)。
【0011】閾値を上回っていた場合(ステップ607
YES)は負荷情報をもとに最適な計算機を選択(ステ
ップ609)する。選択した結果、他の計算機の方が負
荷が高く、やはり自計算機と決定されることもあるの
で、その計算機が自計算機かどうかを判定(ステップ6
10)する。自計算機の場合(ステップ610YE
S)、そのまま自計算機で後続のジョブステップを実行
(ステップ608)する。他の計算機だった場合(ステ
ップ610NO)、再登録ジョブという旨の情報(フラ
グ)をセット(ステップ611)し、再登録ジョブ分散
制御へジョブの再登録を行う(ステップ612)。
【0012】図3は計算機結合/負荷分散コントロール
装置1の再登録ジョブ分散制御部14の処理の流れを示
すフローチャートである。計算機2・・3のジョブ再登
録制御部22・・32よりジョブの再登録要求が行わ
れ、その要求を受け付ける(ステップ71)と、再登録
用の専用実行待ちキューへそのジョブを登録する(ステ
ップ72)。その後、専用実行待ちキューからジョブの
取り出しが行われる(ステップ73)。この時点で再
度、資源/負荷情報収集制御13より計算機2・・3の
全ての資源/負荷情報を取得(ステップ74)し、取得
した情報を元に最適な計算機を選定(ステップ75)す
る。そして、選定された計算機へジョブの登録を行う
(ステップ76)。
【0013】図4は再登録ジョブ実行制御部23・・3
3の処理の流れを示すフローチャートである。再登録ジ
ョブ分散制御部14よりジョブが投入される(ステップ
81)と、投入されたジョブが他の計算機で実行してい
て再登録されたジョブかどうかを判定(ステップ82)
し、再登録されたジョブでなければ(ステップ82N
O)、新規のジョブとしてジョブステップを実行する
(ステップ85)。他の計算機で実行していたジョブの
場合(ステップ82YES)、当該ジョブのジョブ実行
履歴を履歴格納装置5から読み込み(ステップ83)、
中断したジョブステップの実行のための情報回復を行い
(ステップ84)。実行すべきステップからジョブステ
ップを再実行させる(ステップ85)。このジョブ実行
は新規に投入したどのジョブよりも最も最優先で実行さ
れる。
【0014】
【発明の効果】本発明によれば、各計算機の資源/負荷
情報によってジョブステップを実行させる計算機を決定
するので、ジョブ全体の実行のための負荷分散がスムー
ズに行え、システム全体のスループットの低下を防ぐ事
ができる。
【図面の簡単な説明】
【図1】実施形態の複数の計算機からなる汎用計算機シ
ステムの構成図である。
【図2】実施形態のジョブステップ実行判定制御部21
・・31、およびジョブ再登録制御部22・・32の処
理の流れを示すフローチャートである。
【図3】実施形態の再登録ジョブ分散制御部14の処理
の流れを示すフローチャートである。
【図4】実施形態の再登録ジョブ実行制御部23・・3
3の処理の流れを示すフローチャートである。
【符号の説明】
1…計算機結合/負荷分散コントロール装置、11…ジ
ョブ分散制御部、12…資源/負荷情報収集部、13…
再登録ジョブ分散制御部、2・3…計算機、21・31
…ジョブステップ実行判定処理部、22・32…ジョブ
再登録制御部、23・33…再登録ジョブ実行制御部、
4…ユーザデータ格納装置、5…ジョブ実行履歴格納装
置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 木原 均 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 (72)発明者 依知川 正利 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 (72)発明者 越智 直子 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 Fターム(参考) 5B045 GG02 JJ08 5B085 AC03 BA01 5B098 AA10 GA03 GA08 GB13 GD02 GD14

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数の計算機から構成される汎用計算機
    システムでのジョブスケジューリングにおいて、複数の
    ジョブステップ構成からなるジョブを実行する場合、後
    続ジョブステップの実行を開始させる直前に、引き続き
    自計算機で実行させるかどうかの判断を、接続している
    全計算機の資源/負荷情報をもとに行うことを特徴とす
    るジョブスケジューリング方式。
  2. 【請求項2】 ジョブステップの実行が引き続き自計算
    機で実行不可能と判断した場合、計算機結合/負荷分散
    コントロール装置の再登録ジョブ分散制御部へジョブの
    再登録要求を行うことを特徴とするジョブスケジューリ
    ング方式。
  3. 【請求項3】 計算機結合/負荷分散コントロール装置
    の再登録ジョブ分散制御部へジョブが再登録された場
    合、最適な計算機へジョブの再スケジュールすることを
    特徴とするジョブスケジューリング方式。
  4. 【請求項4】 計算機結合/負荷分散コントロール装置
    の再登録ジョブ分散制御部から計算機へジョブが再登録
    された場合、ジョブ実行履歴格納装置に格納してある履
    歴データをもとに当該ジョブが以前実行開始しようとし
    ていたジョブステップから再実行を開始させることを特
    徴とするジョブスケジューリング方式。
JP34574599A 1999-12-06 1999-12-06 複合システムにおけるジョブスケジューリング方式 Pending JP2001166956A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34574599A JP2001166956A (ja) 1999-12-06 1999-12-06 複合システムにおけるジョブスケジューリング方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34574599A JP2001166956A (ja) 1999-12-06 1999-12-06 複合システムにおけるジョブスケジューリング方式

Publications (1)

Publication Number Publication Date
JP2001166956A true JP2001166956A (ja) 2001-06-22

Family

ID=18378693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34574599A Pending JP2001166956A (ja) 1999-12-06 1999-12-06 複合システムにおけるジョブスケジューリング方式

Country Status (1)

Country Link
JP (1) JP2001166956A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1750200A2 (en) 2005-08-01 2007-02-07 Fujitsu Ltd. System and method for executing job step, and computer product
WO2008059610A1 (fr) * 2006-11-14 2008-05-22 Sony Computer Entertainment Inc. Système de traitement d'informations, dispositif de traitement d'informations et procédé de traitement d'informations
JP2009217474A (ja) * 2008-03-10 2009-09-24 Fujitsu Ltd ジョブ管理プログラム、情報処理装置およびジョブ管理方法
JP2014102691A (ja) * 2012-11-20 2014-06-05 Toshiba Corp 情報処理装置、通信機能を持つカメラ、および情報処理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1750200A2 (en) 2005-08-01 2007-02-07 Fujitsu Ltd. System and method for executing job step, and computer product
EP1750200A3 (en) * 2005-08-01 2009-02-11 Fujitsu Ltd. System and method for executing job step, and computer product
WO2008059610A1 (fr) * 2006-11-14 2008-05-22 Sony Computer Entertainment Inc. Système de traitement d'informations, dispositif de traitement d'informations et procédé de traitement d'informations
JP2008123344A (ja) * 2006-11-14 2008-05-29 Sony Computer Entertainment Inc 情報処理システム、情報処理装置、および情報処理方法
JP2009217474A (ja) * 2008-03-10 2009-09-24 Fujitsu Ltd ジョブ管理プログラム、情報処理装置およびジョブ管理方法
US8584127B2 (en) 2008-03-10 2013-11-12 Fujitsu Limited Storage medium storing job management program, information processing apparatus, and job management method
JP2014102691A (ja) * 2012-11-20 2014-06-05 Toshiba Corp 情報処理装置、通信機能を持つカメラ、および情報処理方法

Similar Documents

Publication Publication Date Title
US7076781B2 (en) Resource reservation for large-scale job scheduling
US9870252B2 (en) Multi-threaded processing with reduced context switching
JP4247228B2 (ja) ヘテロマルチプロセッサシステムおよびそのos構成方法
CN109086135B (zh) 资源伸缩方法、装置、计算机设备及存储介质
CN115562877A (zh) 分布式算力资源的编排方法、装置、设备及存储介质
JPH10143380A (ja) マルチプロセッサシステム
JP2001166956A (ja) 複合システムにおけるジョブスケジューリング方式
CN110175078B (zh) 业务处理方法及装置
CN109189581B (zh) 一种作业调度方法和装置
CN111143210A (zh) 一种测试任务调度方法和系统
JP5444900B2 (ja) ジョブ実行管理システム、ジョブ実行管理方法、ジョブ実行管理プログラム
JP2001282551A (ja) ジョブ処理装置および方法
JPH08235047A (ja) 排他ウエイト削減制御方法
JP2000259591A (ja) 分散処理ジョブ実行方法およびネットワークシステム
JP2986930B2 (ja) 対称型マルチプロセッサのタスクスケジューリング方式
JP2519792B2 (ja) ジョブ優先度設定方式
JPH07249010A (ja) ジョブスケジューラおよびジョブスケジューリング方法
CN113051049B (zh) 任务调度系统、方法、电子设备及可读存储介质
JPH0744505A (ja) 並列計算機における負荷分散方法
JP2575761B2 (ja) ジョブ管理方法
JP2890569B2 (ja) プロセス制御装置
JPH1011406A (ja) 資源の分散環境におけるジョブ実行方法
JPH10283330A (ja) 並列計算機の負荷分散制御方法
JPH1153327A (ja) マルチプロセッサシステム
JPH06202884A (ja) マルチプログラム実行管理方法