JPH09311795A - Scheduling method - Google Patents

Scheduling method

Info

Publication number
JPH09311795A
JPH09311795A JP12684796A JP12684796A JPH09311795A JP H09311795 A JPH09311795 A JP H09311795A JP 12684796 A JP12684796 A JP 12684796A JP 12684796 A JP12684796 A JP 12684796A JP H09311795 A JPH09311795 A JP H09311795A
Authority
JP
Japan
Prior art keywords
job
resource
computer
estimated
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP12684796A
Other languages
Japanese (ja)
Inventor
Sawaki Kuroda
沢希 黒田
Junji Fukuzawa
淳二 福澤
Nobuo Yamamura
宣夫 山村
Shinji Morita
眞司 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP12684796A priority Critical patent/JPH09311795A/en
Publication of JPH09311795A publication Critical patent/JPH09311795A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To automatically acquire a system resource quantity needed to execute individual jobs by updating the difference between a measured value of the resource consumption of a computer and an estimated value and error in the resource demand quantity of a job being executed. SOLUTION: At each resource, job information 32 in execution and job resource information 21 are totalized to find the estimated value of the resource consumption of the whole computer (step 31), and the found estimated value of the resource consumption is compared with the measured value of the consumption of the resource information 22 of the computer (step 32). When an error in the resource consumption of the whole computer is exceeded, the resource consumption is corrected according to the rate of the resource demand quantity and error (step 33), and the job resource information in execution and further the difference between the measured value of the resource consumption of the computer and the estimated value of the resource consumption and the error in the demand quantity of the job resource information 21 in execution are updated (step 34). Therefore, the system resource quantity needed to execute individual jobs can automatically be acquired.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は繰り返し実行される
ジョブに関して、実行時のシステムに与えるCPU負荷やI
O 負荷等から当該ジョブが必要とする負荷を推定し、当
該推定値を使って、ジョブ投入後のシステムの状態を予
測して、ジョブを投入する計算機を決定するスケジュー
ラに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a CPU that is repeatedly executed and a CPU load or I
The present invention relates to a scheduler that estimates a load required by a job from an O load or the like, uses the estimated value to predict a system state after the job is submitted, and determines a computer to submit the job.

【0002】[0002]

【従来の技術】"PVM Guide" (http://csep1.phy.ornl.g
ov/pvm_guide/pvm_guide.html)によると、分散計算機環
境で性能向上を図る手段として、負荷分散がある。各計
算機の実行待ちジョブ数を計測し、この実行待ちジョブ
数の最も少ない計算機で新しいジョブを実行することに
よって、各計算機の負荷を平均化することができる。
[Prior Art] "PVM Guide" (http: //csep1.phy.ornl.g
According to (ov / pvm_guide / pvm_guide.html), load balancing is a means for improving performance in a distributed computing environment. The load on each computer can be averaged by measuring the number of jobs waiting to be executed on each computer and executing a new job on the computer having the smallest number of jobs waiting to be executed.

【0003】また、Greoge A. Champine 著の『Distrib
uted Computer Systems:Impact onManagement, Design,
and Analysis』によると、 個別ジョブがシステムに与
える負荷を得る方法として、ジョブの実行ステップ数等
をエミュレータ等を利用して計測する方法がある。この
方法では、ジョブの動作が詳細にわかるため、資源に与
える負荷の質/量/時間をほぼ正確に取得することがで
きる。しかし、1命令をエミュレータで解析/実行する
ので、ジョブの実行ステップ数の計測には非常に時間が
かかる。またジョブが他社の開発した物の場合、実行ス
テップ数の計測は、使用契約上認められないことがあ
る。
In addition, Greoge A. Champine's "Distrib
uted Computer Systems: Impact onManagement, Design,
According to "and Analysis", there is a method of measuring the number of execution steps of a job using an emulator etc. as a method of obtaining the load given to the system by an individual job. With this method, since the job operation is known in detail, the quality / amount / time of the load on the resource can be obtained almost accurately. However, since one instruction is analyzed / executed by the emulator, it takes a very long time to measure the number of execution steps of a job. Also, if the job is developed by another company, the measurement of the number of execution steps may not be permitted in the usage contract.

【0004】個別ジョブがシステムに与える負荷を得る
別の方法として、計算機上でそのジョブだけを動かし
て、計算機の負荷を実測する方法がある。この方法で
は、短時間で負荷値を測定できる。しかし、目的のジョ
ブ以外の影響を排除するために、測定専用に計算機シス
テムを用意する必要がある。
As another method for obtaining the load applied to the system by an individual job, there is a method in which only the job is operated on the computer and the load on the computer is measured. With this method, the load value can be measured in a short time. However, in order to eliminate the effects other than the target job, it is necessary to prepare a computer system exclusively for measurement.

【0005】[0005]

【発明が解決しようとする課題】前記システムの負荷状
態による負荷分散スケジュールでは、長時間かかるジョ
ブを同一計算機に割り当てる場合があり、その結果全体
の処理時間が伸びる場合があるという問題がある。
In the load distribution schedule according to the load state of the system, a job that takes a long time may be assigned to the same computer, and as a result, the overall processing time may increase.

【0006】個別ジョブの実行負荷を得るために、当該
ジョブの実行ステップ数等を計測する方法では、ジョブ
の実行ステップ数の計測は通常シミュレータを利用する
ため、非常に時間がかかるという問題がある。またジョ
ブが他社の開発した物の場合、実行ステップ数の計測
は、その使用契約上認められないことがあるという問題
もある。
In the method of measuring the number of execution steps of the job in order to obtain the execution load of the individual job, the simulator is usually used to measure the number of execution steps of the job, so that it takes a very long time. . In addition, when the job is developed by another company, the measurement of the number of execution steps may not be permitted under the usage contract.

【0007】個別ジョブの実行負荷を得るために、計算
機上で当該ジョブだけを動かして負荷を実測する方法で
は、測定専用に分散システムを用意する必要があり、コ
ストがかかってしまうという問題がある。
In the method of measuring the load by moving only the job on a computer in order to obtain the execution load of the individual job, it is necessary to prepare a distributed system exclusively for the measurement, which causes a problem of cost increase. .

【0008】本発明の目的は、個別ジョブに関して、当
該ジョブの実行に必要なシステム資源量を自動的に獲得
することと、前記資源量を元にジョブを計算機に割り当
てることである。
An object of the present invention is to automatically acquire the system resource amount necessary for executing the job for an individual job, and to allocate the job to a computer based on the resource amount.

【0009】[0009]

【課題を解決するための手段】ジョブ名称に対応して、
当該ジョブが使用するCPU やIO の負荷およびジョブ所
要時間などの推定値と、その確度を備えた情報を備え
る。
[Means for solving the problem] Corresponding to the job name,
Estimated values such as the CPU and IO load used by the job and the time required for the job, and information with their accuracy are provided.

【0010】分散した計算機毎にCPU /IO 能力などの
値を測定する。
A value such as CPU / IO capability is measured for each distributed computer.

【0011】未知のジョブの場合、負荷の推定値および
確度は、あらかじめ定めてあるデフォルト値を設定す
る。
In the case of an unknown job, the load estimated value and the accuracy are set to predetermined default values.

【0012】ジョブ実行後の計算機の負荷変動を、その
ジョブの推定負荷として登録する。
The load variation of the computer after the job is executed is registered as the estimated load of the job.

【0013】ジョブの実行中に実行中のジョブの負荷推
定値の合計と、実測した計算機の負荷との差が、確度か
ら求められる許容誤差の範囲内であれば、確度を上げ
る。
If the difference between the total load estimated value of the jobs being executed during the job execution and the actually measured load of the computer is within the range of the allowable error obtained from the accuracy, the accuracy is increased.

【0014】ジョブの実行中に、実行中のジョブの負荷
推定値の合計と、実測した計算機の負荷との差が、確度
から求められる許容誤差範囲を越えた時、推定の誤差の
割合に対応して、推定の負荷の大きさに比例して、その
差分を分配して負荷推定値を修正し、確度を下げる。
During execution of a job, when the difference between the total load estimation value of the job being executed and the actually measured load of the computer exceeds the allowable error range obtained from the accuracy, it corresponds to the ratio of the estimated error. Then, in proportion to the size of the estimated load, the difference is distributed to correct the estimated load value and the accuracy is lowered.

【0015】これらのステップにより、個別ジョブが計
算機システムに与える負荷を自動的に取得する。
By these steps, the load applied to the computer system by the individual job is automatically acquired.

【0016】[0016]

【発明の実施の形態】以下に本発明の一実施の形態を説
明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below.

【0017】図1は本発明によるスケジュール方式を適
用した分散計算機システム(1) の概要を示す。この分散
計算機システム(1) は、管理計算機(11) と、複数の計
算サーバ(12) と、それら繋ぐネットワーク(13) とを含
む。なお、管理計算機(11)は計算サーバ(12) の一つを
兼用しても構わない。
FIG. 1 shows an outline of a distributed computer system (1) to which the schedule system according to the present invention is applied. This distributed computer system (1) includes a management computer (11), a plurality of computing servers (12), and a network (13) connecting them. The management computer (11) may also serve as one of the calculation servers (12).

【0018】管理計算機(11) は、ジョブ資源情報(21)
と、当該計算機システムに要求された起動待ちのジョブ
(112) を管理するジョブ受付キュー(111) と、当該ジョ
ブを1つの計算サーバ(12) に割り当てるスケジューラ
(113) を備える。
The management computer (11) uses the job resource information (21)
And the job waiting for startup requested by the computer system
Job reception queue (111) that manages (112) and scheduler that allocates the job to one computing server (12)
(113) is provided.

【0019】計算サーバ(12) は、CPU 時間、メモリ容
量、ファイルアクセス頻度、ネットワークアクセス頻度
など、複数の資源(121) と、資源の容量や使用量を保持
する計算機資源情報(22) と、資源を使用するジョブ(12
3) と、ジョブを管理する実行中ジョブ情報(23) と、計
算サーバ(12) の資源(121) の状態を調べる資源使用量
測定手段(122) と、ジョブ情報獲得手段(124) を備え
る。
The computing server (12) has a plurality of resources (121) such as CPU time, memory capacity, file access frequency and network access frequency, and computer resource information (22) for holding resource capacity and usage amount. Jobs that use resources (12
3), running job information (23) for managing jobs, resource usage measuring means (122) for checking the status of resources (121) of the computing server (12), and job information acquisition means (124) .

【0020】ジョブ情報獲得手段(124) は、資源使用量
測定手段(122) から計算サーバ(12)の資源の使用量と、
実行中ジョブ情報(23) から、実行中のジョブ(123) が
使用する資源(121) を推測し、ジョブが使用する資源の
量を記憶するジョブ資源情報(12)を更新する。
The job information acquisition means (124) uses the resource usage measuring means (122) to calculate the resource usage of the computing server (12),
The resource (121) used by the running job (123) is estimated from the running job information (23), and the job resource information (12) storing the amount of the resource used by the job is updated.

【0021】ジョブの実行要求があると、実行要求受付
キュー(111) に実行待ちジョブ(112)を入れる。スケジ
ューラ(113) は実行要求受付キュー(111) から実行待ち
ジョブ(112) を取りだし、ジョブ資源情報(21) からジ
ョブが使用する資源量の情報を取得し、各計算サーバ(1
2) の資源使用量測定手段(122) から資源の状態を取得
し、実行待ちジョブ(112) を適当な計算サーバ(12) に
割り当てる。
When there is a job execution request, the execution waiting job (112) is put in the execution request reception queue (111). The scheduler (113) takes out the pending job (112) from the execution request reception queue (111), acquires the resource amount information used by the job from the job resource information (21), and calculates each server (1).
The state of the resource is acquired from the resource usage measuring means (122) of 2), and the waiting job (112) is allocated to an appropriate calculation server (12).

【0022】図2は、各テーブルの構造を示している。FIG. 2 shows the structure of each table.

【0023】ジョブ資源情報(21) は、分散計算機シス
テム上に1つあり、ジョブ名(211)と、当該ジョブの実
行時に消費する各資源名(212) と、その資源を当該ジョ
ブが使用する資源必要量(213) とその確からしさをあら
わす確度(214) とを備える。資源としてジョブの起動か
ら終了までの処理時間、単位時間当たりに使用するCPU
時間、占有するメモリ量、ファイルアクセス頻度、ネッ
トワークアクセス頻度などがある。このテーブルはジョ
ブ情報獲得手段(124) が後述の方法によって追加/変更
する。
There is one job resource information (21) on the distributed computer system, and the job name (211), each resource name (212) consumed when the job is executed, and the resource are used by the job. It has a resource requirement (213) and an accuracy (214) showing its certainty. Processing time from job startup to termination as resources, CPU used per unit time
Time, amount of memory occupied, file access frequency, network access frequency, etc. This table is added / changed by the job information acquisition means (124) by the method described later.

【0024】計算機資源情報(22) は、各計算サーバに
あり、当該計算機が提供できる各資源について、その資
源名(221) と、提供できる能力をあらわす資源容量(22
2) と、資源の使用が著しく悪くなる使用率をあらわす
使用限界(223) と、資源に対する当該計算サーバにおけ
る負荷の測定値である資源使用量(224) を備える。この
テーブルの資源使用量(224) 以外の項目は、別の手段に
よってあらかじめ値が入っているものとする。資源使用
量(224) は、資源使用量測定手段(122) によって定期的
に更新する。
The computer resource information (22) is stored in each computing server, and for each resource that can be provided by the computer, its resource name (221) and resource capacity (22
2), a usage limit (223) that represents the usage rate at which the usage of the resource remarkably deteriorates, and a resource usage amount (224) that is a measurement value of the load on the resource for the calculation server. Items other than the resource usage amount (224) in this table are assumed to be prefilled by other means. The resource usage amount (224) is regularly updated by the resource usage amount measuring means (122).

【0025】実行中ジョブ情報(23) は、実行中のジョ
ブ(123) について、ジョブ名(231)と、ジョブID(232)
を備える。新規起動したジョブについて、当該ジョブ
のためのエントリを追加し、終了したジョブに関して
は、当該終了したジョブのエントリを削除する。
The running job information (23) includes a job name (231) and a job ID (232) for the running job (123).
Is provided. For a newly started job, an entry for the job is added, and for a finished job, the entry for the finished job is deleted.

【0026】以下では、前記の構成を持つ分散計算機シ
ステムにおけるジョブ情報獲得方法とスケジュール方法
について、説明する。
A job information acquisition method and a scheduling method in the distributed computer system having the above configuration will be described below.

【0027】図3はジョブ情報獲得手段におけるジョブ
情報獲得方法の詳細を示す。
FIG. 3 shows the details of the job information acquisition method in the job information acquisition means.

【0028】定期的に以下の処理をおこなう。The following processing is performed periodically.

【0029】ステップ31 では、各資源について、実行
中ジョブ情報(23) のそれぞれのジョブ名(231) と、ジ
ョブ資源情報(21)のジョブ名(211) と一致するエントリ
から、から当該ジョブの資源要求量(213)を読みだす。
In step 31, for each resource, from the entry that matches the respective job name (231) of the running job information (23) and the job name (211) of the job resource information (21), Read resource demand (213).

【0030】実行中のジョブ計算機上で複数のジョブが
動いている時、それぞれの資源に対してジョブは互いに
競合しあうため、ジョブの稼働率が下がる。
When a plurality of jobs are running on the job computer that is being executed, the jobs compete with each other for their respective resources, so the job utilization rate decreases.

【0031】計算機m の資源s の使用量推定値LAms
は、実行中のジョブp とその資源要求量推定値LRps と
計算機m の資源容量LCms を使って、
Estimated usage amount LAms of resource s of computer m
Uses the running job p, its resource demand estimate LRps, and the resource capacity LCms of the computer m,

【0032】[0032]

【数1】 [Equation 1]

【0033】とし、計算機m でのジョブp の稼働率Amp
は、資源s の容量LCms、ジョブp の資源要求量LRps を
使って、
Then, the operation rate Amp of the job p on the computer m
Using the capacity LCms of resource s and the resource demand LRps of job p,

【0034】[0034]

【数2】 [Equation 2]

【0035】によって求める。Calculated by

【0036】次にステップ32 では、計算機資源情報(2
2) の実測した資源使用量(224) と、前記使用量の推定
値LAms との差を求める。後の説明のためにこの差を実
推差と呼ぶ。また、資源要求量(213) と確度(214) から
求める許容誤差を求める。
Next, in step 32, computer resource information (2
Find the difference between the measured resource usage (224) in 2) and the estimated value LAms of the usage. This difference is called the actual difference for the sake of explanation below. Also, the allowable error obtained from the resource demand (213) and the accuracy (214) is calculated.

【0037】許容誤差Eps は、ジョブp の必要資源量LR
ps と、その確度Rps と、を用いて、
The allowable error Eps is the required resource amount LR of the job p.
Using ps and its accuracy Rps,

【0038】[0038]

【数3】 (Equation 3)

【0039】とする。It is assumed that

【0040】前記許容誤差より実推差が大きい時、ステ
ップ33 では、ジョブの実測値(224)と推定使用量LAms
とが一致するように、実推差を実行中のジョブの資源必
要量に分配する。このとき、ジョブの資源要求量が大き
いものがよりたくさん、確度の低いものがよりたくさ
ん、変化するようにする。
When the actual estimation difference is larger than the allowable error, in step 33, the actual measurement value (224) of the job and the estimated usage amount LAms are calculated.
The actual inference is distributed to the resource requirements of the job being executed so that and match. At this time, the number of jobs with large resource requirements changes, and the number of jobs with low accuracy changes more.

【0041】ジョブp の必要資源量LRps を、その確度R
ps と、計算機m での測定値LSms、推定値LAms、定数c
を用いて、
The required resource amount LRps of the job p is determined by its accuracy R
ps, measured value LSms on computer m, estimated value LAms, constant c
Using,

【0042】[0042]

【数4】 (Equation 4)

【0043】で更新する。Update with.

【0044】ステップ34 では、実推差と、ジョブの資
源必要量(213) とその確度(214) から、ジョブの資源必
要量の確度を変更する。
At step 34, the accuracy of the job resource requirement is changed from the actual inference, the job resource requirement (213) and its accuracy (214).

【0045】ジョブp の資源s に関する資源必要量の確
度Rps を、計算機m での資源使用量測定値LSms と、資
源使用量推定値LAms と、許容誤差Eps と、定数c を用
いて、
The accuracy Rps of the resource requirement for the resource s of the job p is calculated by using the resource usage measurement value LSms on the computer m, the resource usage estimation value LAms, the allowable error Eps, and the constant c.

【0046】[0046]

【数5】 (Equation 5)

【0047】で更新する。Update with.

【0048】以上の処理を各計算サーバ(12) の各資源
について繰り返す。
The above processing is repeated for each resource of each calculation server (12).

【0049】次に図4はスケジューラのジョブ起動割当
手段の詳細を示す。
Next, FIG. 4 shows details of the job activation assigning means of the scheduler.

【0050】ジョブ実行要求キュー(111) に実行待ちの
ジョブがある時、以下の処理をおこなう。
When there is a job waiting to be executed in the job execution request queue (111), the following processing is performed.

【0051】ステップ41 では、実行予定ジョブをジョ
ブ実行要求キュー(111) から取得し、ジョブ資源情報(2
1) からジョブ名(211) が合致するエントリの各資源に
ついて、資源必要量(213) とその確度(214) を取得す
る。
In step 41, the scheduled job is acquired from the job execution request queue (111) and the job resource information (2
From 1), for each resource of the entry that matches the job name (211), obtain the resource requirement (213) and its accuracy (214).

【0052】ステップ42 では、計算機資源情報(22) か
ら、実測した資源使用量(224) を取得し、ステップ41
で得たジョブの資源必要量(213) とその確度(214) を利
用して、ジョブ投入後の資源使用量を推定する。
In step 42, the measured resource usage (224) is acquired from the computer resource information (22), and step 41
The resource usage amount after the job is submitted is estimated by using the resource requirement amount (213) and its accuracy (214) obtained in step 2.

【0053】ステップ43 では、各計算機の資源容量(22
2) と、前記ジョブ投入後の資源使用量推定値とから、
推定される資源使用率を求め、これを使用限界(223) と
比較する。
In step 43, the resource capacity of each computer (22
From 2) and the estimated resource usage after the job is submitted,
Obtain the estimated resource utilization and compare it to the usage limit (223).

【0054】推定される資源使用率が使用限界(223) 以
下となる計算サーバ(12) がある時、ステップ44 では、
資源使用率が最も低い計算サーバに当該ジョブを割当て
る。
When there is a calculation server (12) whose estimated resource usage rate is less than or equal to the usage limit (223), in step 44,
The job is assigned to the calculation server with the lowest resource usage rate.

【0055】すなわち、この計算機m は、ジョブp 投入
時に、資源s について、投入前の実測値LSms と、投入
するジョブの資源要求量LRps と、資源容量LCms と、資
源使用限界Bms とにおいて、
That is, this computer m, at the time of submitting the job p, regarding the resource s, the measured value LSms before the submission, the resource requirement amount LRps of the job to be submitted, the resource capacity LCms, and the resource use limit Bms,

【0056】[0056]

【数6】 (Equation 6)

【0057】の条件を満たす。The condition of is satisfied.

【0058】前記条件を満たす計算サーバ(12) がない
時、ステップ45 では、当該ジョブを起動しないで、実
行待ちキュー(111) に保留し、一定時間後に再びステッ
プ41から処理する。
When there is no calculation server (12) satisfying the above conditions, in step 45, the job is not started and is held in the execution waiting queue (111), and after a certain period of time, the process is restarted from step 41.

【0059】別のスケジューリング方法として、前記ス
テップ42 において、実行中ジョブ情報(23) から、
実行中のジョブの一覧を取得し、そのそれぞれの資源必
要量を求め、ステップ41 で得たジョブの資源必要量(21
3) と合計することによってジョブ投入後の資源必要量
を推定する。
As another scheduling method, in step 42, from the running job information (23),
Obtain a list of running jobs, find the resource requirements for each of them, and check the resource requirements (21
Estimate resource requirements after job submission by summing with 3).

【0060】すなわち、ステップ44 で選択される計算
機m は、ジョブp 投入時に、資源sについて、投入前の
実測値LSms と、投入するジョブの資源要求量LRps と、
資源容量LCms と、資源使用限界Bms とにおいて、
That is, the computer m selected in step 44, when submitting the job p, the measured value LSms before the submission of the resource s, the resource requirement amount LRps of the submitted job,
In the resource capacity LCms and the resource usage limit Bms,

【0061】[0061]

【数7】 (Equation 7)

【0062】の条件を満たす。The condition of is satisfied.

【0063】別のスケジューリング方法として、前記ス
テップ44 において、全てのマシンの中で、ジョブ投入
後の資源使用率の合計が最も低くなる計算機に割り当て
る。
As another scheduling method, in step 44, the computer is assigned to the computer having the lowest total resource usage rate after the job is submitted among all the machines.

【0064】すなわち、この計算機m は、ジョブp 投入
時に、資源s について、投入前の実測値LSms と、投入
するジョブの資源要求量LRps と、資源容量LCms と、資
源使用限界Bms とにおいて、
That is, this computer m, at the time of submitting the job p, regarding the resource s, the measured value LSms before the submission, the resource demand amount LRps of the job to be submitted, the resource capacity LCms, and the resource usage limit Bms,

【0065】[0065]

【数8】 (Equation 8)

【0066】の条件を満たす。The condition of is satisfied.

【0067】また別のスケジューリング方法として、前
記ステップ44 において、全てのマシンの中で、ジョブ
投入後の最大の資源使用率の最も低くなる計算機に割り
当てる。
As another scheduling method, in step 44, the computer is assigned to the computer having the lowest maximum resource usage rate after the job is submitted among all the machines.

【0068】すなわち、この計算機m は、ジョブp 投入
時に、資源s について、投入前の実測値LSms と、投入
するジョブの資源要求量LRps と、資源容量LCms と、資
源使用限界Bms と、において、
That is, this computer m, at the time of submitting the job p, for the resource s, the actual measured value LSms before submission, the resource requirement amount LRps of the job to be submitted, the resource capacity LCms, and the resource use limit Bms,

【0069】[0069]

【数9】 [Equation 9]

【0070】の条件を満たす。The condition of is satisfied.

【0071】ジョブが必要とする資源量が不確かな間
は、予測の影響は小さくなり、現状の計算機の負荷だけ
でスケジュールするのと変わらない。
While the amount of resources required by a job is uncertain, the effect of prediction is small, and it is no different from scheduling with only the current computer load.

【0072】繰り返し実行されるジョブが必要とするシ
ステム資源量を自動的に獲得する。ジョブが必要とする
資源量がわかると、投入後の計算機の資源使用が集中し
ないようにスケジュールできる。例えば、CPU 負荷をか
けるがIO 負荷をかけないジョブと、CPU 負荷をかけな
いがIO 負荷をかけるジョブと、を組み合わせてスケジ
ュールするようになり、計算機上のジョブ間の資源の奪
い合いが少なくなり、効率的に計算機を使用できる。
The system resource amount required by the repeatedly executed job is automatically acquired. Once the amount of resources required by the job is known, it is possible to schedule the resource usage of the computer after the job is not concentrated. For example, jobs that apply a CPU load but no IO load and jobs that do not put a CPU load but an IO load are scheduled in combination, which reduces competition for resources between jobs on the computer. You can use the calculator efficiently.

【0073】[0073]

【発明の効果】個別のジョブが必要とする複数のシステ
ム資源の量を自動的に獲得できる。この情報によって、
特定のシステム資源に処理が集中することによって処理
効率が落ちることを防ぐことができる。
According to the present invention, it is possible to automatically acquire the amount of plural system resources required by an individual job. With this information,
It is possible to prevent the processing efficiency from being lowered due to the processing being concentrated on a specific system resource.

【0074】個別ジョブの処理時間を推定できる。The processing time of an individual job can be estimated.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例に係わる分散計算機システムの
構成図である。
FIG. 1 is a configuration diagram of a distributed computer system according to an embodiment of the present invention.

【図2】テーブルのテーブルの構成図である。FIG. 2 is a block diagram of a table.

【図3】個別ジョブの資源要求量獲得方法のブロック図
である。
FIG. 3 is a block diagram of a method for acquiring a resource requirement amount of an individual job.

【図4】ジョブ起動計算機割当スケジュール方法のブロ
ック図である。
FIG. 4 is a block diagram of a job activation computer allocation scheduling method.

【符号の説明】[Explanation of symbols]

LRps …ジョブp が単位時間に必要な資源s の量の推定
値、 LRms …計算機m 上のジョブが単位時間に必要な資源s
の量の推定値、 LAps …ジョブp が単位時間に使用する資源s の量の推
定値、 LAms …計算機m が単位時間に使用する資源s の量の推
定値、 LSms …計算機m が単位時間に使用した資源s の量の実
測値、 LCm …計算機m の単位時間に使用可能な資源s の容量、 Eps …LAps の誤差、 ERps …LAps の誤差率、=E
ps/LAps[%]、 Rps …LAps の確度、=(LAps-Eps)/LAps、 Amp …計算機m 上のジョブp の稼働の割合、Bms …資源
使用限界。
LRps ... Estimated amount of resources s required for job p per unit time, LRms ... Resources s required for job per unit time on computer m
Estimated amount of resource s, LAps ... Estimated amount of resource s used by job p per unit time, LAms ... Estimated amount of resource s used by computer m per unit time, LSms ... Calculator m per unit time Measured value of the amount of resource s used, LCm… capacity of resource s that can be used per unit time of computer m, Eps… LAps error, ERps… LAps error rate, = E
ps / LAps [%], Rps… LAps accuracy, = (LAps-Eps) / LAps, Amp… Percentage of operation of job p on computer m, Bms… Resource usage limit.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 森田 眞司 神奈川県横浜市戸塚区戸塚町5030番地株式 会社日立製作所ソフトウェア開発本部内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Shinji Morita 5030 Totsuka-cho, Totsuka-ku, Yokohama-shi, Kanagawa Stock company Hitachi Software Development Division

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】計算機システムが提供する資源と、計算機
システム全体での資源の使用量を測定する手段と、該計
算機上で実行中のジョブと、実行中ジョブの一覧情報
と、を備える計算機システムにおける、ジョブ資源要求
量獲得方法であって、 ジョブの名称と、計算機の各資源について当該ジョブが
要求する量の推測値と、その確からしさをあらわす確度
とを含むジョブ資源情報を備え、 (a) 計算機で実行中のジョブについて、ジョブ資源情報
の当該ジョブが要求する資源量を合計して計算機全体の
資源使用量の推測値をもとめ、当該ジョブに関する資源
要求量の誤差を加算して、計算機全体の資源使用量の誤
差をもとめ、 (b) 計算機の資源使用量の実測値と、前記求めた資源使
用量の推測値との差が、前記計算機全体の資源使用量の
誤差より大きい時、 (c) 資源使用量の実測値と推測値の差がなくなるよう
に、当該計算機で実行中のジョブについて、資源要求量
およびその誤差の割合に応じて、実行中のジョブ管理情
報の推定資源要求量に加え、 (d) 前記ステップ(b) で求めた実測値と推測値の差と、
実行中のジョブの資源要求量の誤差を更新することを特
徴とした、スケジュール方法。
1. A computer system comprising resources provided by a computer system, means for measuring resource usage in the entire computer system, jobs being executed on the computer, and list information of jobs being executed. A job resource request amount acquisition method, comprising job resource information including a name of the job, an estimated value of the amount requested by the job for each resource of the computer, and a certainty indicating the certainty thereof. ) For the job being executed on the computer, add up the error amount of the resource request amount for the job by summing the resource amount requested by the job in the job resource information and obtaining the estimated value of the resource usage amount of the entire computer. (B) The difference between the measured value of the resource usage of the computer and the estimated value of the calculated resource usage is the error of the resource usage of the entire computer. When the value is large, (c) For the job being executed on the computer, the job management information of the job being executed should be adjusted according to the resource request amount and its error rate so that there is no difference between the measured value and the estimated value of the resource usage amount. In addition to the estimated resource requirement, (d) the difference between the measured value and the estimated value obtained in step (b),
A scheduling method characterized by updating the error in the resource demand of the job being executed.
【請求項2】請求項1の計算機システムで、さらに計算
機の持つ資源容量の情報を備え、前記ステップ(a) にお
いて、 (a1) 実行中のジョブおよび各資源について、当該ジョ
ブの資源推定要求量の合計を出力し、 (a2) 資源推定要求量合計と、計算機の資源容量と、各
ジョブの推定資源要求量とからジョブの稼働率を算出
し、 (a3) 各ジョブの稼働率から、ジョブの資源推定使用量
と、処理時間の推定値を出力することを特徴とした、ス
ケジュール方法。
2. The computer system according to claim 1, further comprising information on resource capacity of the computer, wherein in step (a), (a1) for the job being executed and each resource, the resource estimation request amount of the job. (A2) Calculate the job utilization rate from the total estimated resource demand, the computer resource capacity, and the estimated resource demand of each job. (A3) Calculate the job utilization rate from each job A scheduling method, which is characterized by outputting the estimated resource usage amount and the estimated processing time.
【請求項3】請求項1の計算機システムにおいて、スケ
ジューラがジョブの起動/終了を検知するステップを備
え、 前記検知した時に、前記各ステップを実行することを特
徴とする、スケジュール方法。
3. The scheduling method according to claim 1, further comprising a step of a scheduler detecting a start / end of a job, and executing the steps when the scheduler detects the start / end of the job.
【請求項4】分散計算機環境で、ジョブを投入する時、 (e) 請求項1で求めたジョブの資源使用量を元に、当該
ジョブの資源推定使用量情報を求め、 (f) 当該ジョブの資源推定使用量を、各計算機の資源使
用量に加えて、当該ジョブ投入後の資源使用量を求め、 (g) 資源使用量と資源容量の比を、各資源について和を
求め、 (h) 前記和がもっとも小さくなる計算機に当該ジョブを
割り当てることを特徴とする、スケジュール方法。
4. When a job is submitted in a distributed computer environment, (e) resource estimated usage amount information of the job is obtained based on the resource usage amount of the job obtained in claim 1, and (f) the job The estimated resource usage of the above is added to the resource usage of each computer to obtain the resource usage after the job is submitted. (G) The ratio of the resource usage to the resource capacity is calculated for each resource, and (h) ) A scheduling method, characterized in that the job is assigned to a computer having the smallest sum.
【請求項5】請求項1のステップ(f) の代わりに、 (f') 実行中のジョブジョブと、投入するジョブについ
て、資源推定使用量を読み出し、前記実行中および投入
ジョブの資源推定使用量の総和を求め、これを資源使用
量とすることを特徴とした、スケジュール方法。
5. Instead of step (f) of claim 1, (f ') job being executed and the estimated resource usage of the job to be loaded are read out, and the estimated resource usage of the job being executed and the job being submitted is used. A scheduling method characterized by obtaining the total amount of resources and using this as the resource usage amount.
【請求項6】請求項1のステップ(f) の代わりに、 (f") 当該ジョブの資源推定使用量と誤差範囲の割合と
の積を、各計算機の資源使用量に加えて、当該ジョブ投
入後の資源使用量を求める、ことを特徴とした、スケジ
ュール方法。
6. Instead of step (f) of claim 1, (f ") the product of the estimated resource usage of the job and the ratio of the error range is added to the resource usage of each computer, and A scheduling method characterized in that the amount of resource usage after the input is obtained.
JP12684796A 1996-05-22 1996-05-22 Scheduling method Pending JPH09311795A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12684796A JPH09311795A (en) 1996-05-22 1996-05-22 Scheduling method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12684796A JPH09311795A (en) 1996-05-22 1996-05-22 Scheduling method

Publications (1)

Publication Number Publication Date
JPH09311795A true JPH09311795A (en) 1997-12-02

Family

ID=14945342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12684796A Pending JPH09311795A (en) 1996-05-22 1996-05-22 Scheduling method

Country Status (1)

Country Link
JP (1) JPH09311795A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665716B1 (en) 1998-12-09 2003-12-16 Hitachi, Ltd. Method of analyzing delay factor in job system
US7146357B2 (en) 2003-03-17 2006-12-05 Hitachi, Ltd. Database system, server, query posing method, and data updating method
US7720949B2 (en) 2004-03-01 2010-05-18 Fujitsu Limited Method and apparatus for relay control and computer product
US8832695B2 (en) 2011-08-19 2014-09-09 Fujitsu Limited Method of scheduling jobs and information processing apparatus implementing same
US10055703B2 (en) * 2015-01-13 2018-08-21 Accenture Global Services Limited Factory management system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665716B1 (en) 1998-12-09 2003-12-16 Hitachi, Ltd. Method of analyzing delay factor in job system
US7146357B2 (en) 2003-03-17 2006-12-05 Hitachi, Ltd. Database system, server, query posing method, and data updating method
US7720949B2 (en) 2004-03-01 2010-05-18 Fujitsu Limited Method and apparatus for relay control and computer product
US8832695B2 (en) 2011-08-19 2014-09-09 Fujitsu Limited Method of scheduling jobs and information processing apparatus implementing same
US10055703B2 (en) * 2015-01-13 2018-08-21 Accenture Global Services Limited Factory management system

Similar Documents

Publication Publication Date Title
US8650298B2 (en) Resource allocation system
Yeung et al. Horus: Interference-aware and prediction-based scheduling in deep learning systems
US7302450B2 (en) Workload scheduler with resource optimization factoring
US6618820B1 (en) Method for configuring an application server system
US6539445B1 (en) Method for load balancing in an application server system
EP2901312B1 (en) Real time optimization of compute infrastructure in a virtualized environment
US20050198636A1 (en) Dynamic optimization of batch processing
US11876731B2 (en) System and methods for sharing memory subsystem resources among datacenter applications
JPH07141305A (en) Control method for execution of parallel computer
US20090077235A1 (en) Mechanism for profiling and estimating the runtime needed to execute a job
CN111258745B (en) Task processing method and device
CN108205469B (en) MapReduce-based resource allocation method and server
US20070226743A1 (en) Parallel-distributed-processing program and parallel-distributed-processing system
JPH07281908A (en) Method and apparatus for control of work load for generationof target control data
KR101553650B1 (en) Apparatus and method for load balancing in multi-core system
US20030200252A1 (en) System for segregating a monitor program in a farm system
US20180039520A1 (en) Methods and Nodes for Scheduling Data Processing
JPH09311795A (en) Scheduling method
CN112948113A (en) Cluster resource management scheduling method, device, equipment and readable storage medium
CN110175073B (en) Scheduling method, sending method, device and related equipment of data exchange job
CN115098269A (en) Resource allocation method, device, electronic equipment and storage medium
Liu et al. Leveraging dependency in scheduling and preemption for high throughput in data-parallel clusters
CN109656796B (en) Task selection method and device
Chhabra et al. Qualitative Parametric Comparison of Load Balancing Algorithms in Distributed Computing Environment
CN112333279A (en) Server allocation method, device, equipment and storage medium