JPH09212467A - Load decentralization control system - Google Patents

Load decentralization control system

Info

Publication number
JPH09212467A
JPH09212467A JP1352296A JP1352296A JPH09212467A JP H09212467 A JPH09212467 A JP H09212467A JP 1352296 A JP1352296 A JP 1352296A JP 1352296 A JP1352296 A JP 1352296A JP H09212467 A JPH09212467 A JP H09212467A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
computer
job
destination
distribution
system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1352296A
Other languages
Japanese (ja)
Inventor
Masanori Ito
雅典 伊藤
Original Assignee
Fujitsu Ltd
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PROBLEM TO BE SOLVED: To improve the throughput of a parallel computer system by making CPU capability and the number of CPUs different, computer by computer, automatically selecting a parallel computer including a virtual computer which executes a batch job and distributing jobs, and decentralizing loads.
SOLUTION: A job distribution destination determination part 9 of an operating system 5 distributes a job to a distribution destination determined by a job distribution destination determination part 9, which determines the computer 2 having the highest redundant capability as the job distribution destination. A slave computer is so informed by a job distribution destination information part 13 as to distribute the job to the computer 2 at the determined distribution destination. Further, information on jobs fed to other slave computers is received by a job information reception part 16. Consequently, the throughput of the parallel computer system including the virtual computer can be improved.
COPYRIGHT: (C)1997,JPO

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は、並列型計算機の各計算機に負荷を分散する負荷分散制御システムに関するものである。 The present invention relates to relates to load sharing control system to distribute the load on each computer in the parallel computer.

【0002】近年の計算機システムにおいて、業務処理容量の増大、処理速度の高速化、連続運用の必要性、信頼性の向上が要求されている。 [0002] In modern computer systems, the increase in business processing capacity, higher processing speed, the need for continuous operation, enhanced reliability is required. このため、仮想計算機を混在でき、システムの運用中に動的に稼働計算機の数を増減できる並列型計算機システムが提供されている。 Therefore, can mix the virtual machine, the parallel type computer system is provided that can increase or decrease the number of dynamically operating computer during operation of the system. この並列型計算機システムでは、CPU能力の異なる計算機とCPU能力が可変の計算機が混在し、計算機によってCPU負荷状態が異なり、かつ並列計算機システムで稼働する計算機の数が動的に変動するため、並列型計算機システム全体の処理容量と処理速度を高めるためには各計算機のCPU負荷を平準化する必要がある。 In the parallel type computer system, because different computer and CPU capabilities of the CPU power is variable computer are mixed, different CPU load condition by computer, and the number of computers that run on the parallel computer system due to the dynamic parallel to increase the processing capacity and processing speed of the entire mold computer system needs to balance the CPU load of each computer. しかし、ユーザが各計算機のCPU負荷を平準化するのは困難であるために、システムが自動的にバッチジョブを実行する計算機を決定することが望まれている。 However, since the user is difficult to balance the CPU load of each computer, the system is automatically desirable to determine the computer executing the batch job.

【0003】 [0003]

【従来の技術】従来の並列型計算機システムは、図9に示すように、同じ能力のCPUを同じ台数備えた計算機を並列に接続する。 Conventional parallel type computer system, as shown in FIG. 9, to connect the CPU of the same capacity computer including the same number in parallel. この並列型計算機システムにおける負荷分散を行う手法は、OSが自計算機のCPU使用率を求めて他の全ての計算機に送信して知らせる。 Method of performing load balancing in this parallel computer system, OS is seeking CPU utilization own computer informs sending to all other computers. そして、ジョブがある計算機に投入された場合、最もCPU Then, when it is put into the computer there is a job, most CPU
使用率の低い計算機が余剰CPU能力が大きいとみなしてジョブを配送し、その計算機にジョブの実行をさせる(自計算機の余剰CPU能力が大きいときは自計算機がジョブを実行する)。 Underutilized computer delivers the job is regarded as a large surplus CPU capacity, (its own computer to run jobs when surplus CPU capacity of its own computer is large) that causes the execution of the job to the computer.

【0004】 [0004]

【発明が解決しようとする課題】上述した並列型計算機システムでは、並列型計算機システムを構成する計算機ごとに1台あたりのCPU能力が違う場合や、CPUごとの能力が同じでも台数が違う場合には、CPU使用率が同じでもあっても余剰CPU能力が同じとは限らないから、CPU使用率の最も低い計算機にジョブを配送しても、ジョブを最も高速に実行できるとはならない問題が発生する。 [SUMMARY OF THE INVENTION In a parallel type computer system described above, and if the CPU capacity per one for each computer constituting a parallel type computer system is different, if the capacity of each CPU is the same even number is different , since surplus CPU capacity even CPU utilization even the same may not be the same, even if deliver jobs to the lowest computer CPU utilization, a problem that not a can execute jobs fastest generation to.

【0005】また、並列型計算機システムには仮想計算機が混在できるが、仮想計算機には通常、次の3種類の動作モードがある。 Further, the parallel computer system has a virtual machine can be mixed, the virtual machine generally has the following three modes. ・AUTOモード:同じ計算機上で走行する他の仮想計算機が要求するCPU能力と競合しない限り必要なだけ可変にCPU能力を使用できるモードである。 · AUTO mode: a mode in which only variably CPU power needed, as long as it does not conflict with the CPU power required by the other virtual machine running on the same computer at the current can be used.

【0006】・上限AUTOモード:AUTOモードの仮想計算機と同じ計算機上で共存可能で、決められた比率(CPU配分比)しかCPU能力を使用できないモードである。 [0006] - limit the AUTO mode: AUTO mode can coexist on the same computer at the current and the virtual machine, the ratio which is determined (CPU allocation ratio) only a mode not available CPU power.

【0007】・ロジカルモード:AUTOモードや上限AUTOモードとは同じ計算機上で共存できないが、1 [0007] Logical mode: the AUTO mode and the upper limit AUTO mode, but can not coexist on the same computer at the current time, 1
台の計算機のCPU能力を任意の固定比率(CPU配分比)に分割して使用するモードである。 The CPU power of the platform of the computer is a mode to be used by dividing it into any fixed ratios (CPU allocation ratio).

【0008】これらの仮想計算機システムはそれぞれ独立に、その上で走行するソフトウェアから認識できるC [0008] Each of these virtual computer system independently, C that can be recognized from the software running thereon
PU(論理CPU)の数を定義することができる。 PU can define the number of (logical CPU). このため、上限AUTOモードとロジカルモードの仮想計算機は、実CPUの能力のうち配分比だけのCPU能力を持つ計算機と見なせるから、上記した問題が発生する。 Therefore, the virtual machine upper AUTO mode and logical mode, because regarded as computer having a CPU capable of only distribution ratio of the capacity of the real CPU, the above-mentioned problem occurs.
また、仮想計算機システムは、動的にCPU配分比を変更でき、上限AUTOモードとロジカルモードの仮想計算機において、異なる時刻に同じCPU使用率であっても、余剰CPU能力が同じとは限らないという問題も発生する。 The virtual computer system dynamically change the CPU allocation ratio, the virtual machine upper AUTO mode and logical mode, even with the same CPU utilization at different times, the surplus CPU capacity is not necessarily the same as problems also occur.

【0009】また、計算機の実記憶負荷が高く、仮想計算機が過剰に動作し、外部ページと実ページで過剰に交換が行われている場合には、ページングI/O待ちが頻発してCPU使用率が低くなることがあり、この場合に、新たにジョブを動作させると、実記憶負荷が更に高くなり、ページングI/O待ちがより頻繁に発生し、C Further, higher real storage load of computers, virtual machine operates excessively, if excessively exchanged outside page and real page is being performed, CPU use and frequent paging I / O waiting may rate is low, in this case, when operating the new job, real storage load is further increased, the paging I / O wait occurs more frequently, C
PU使用率が更に低くなって仮想計算機の処理効率が低下してしまう問題が発生する(この場合には、従来の負荷分散の手法では、ジョブを配送するのは逆効果となってしまう点で問題である)。 PU utilization further becomes performance of the virtual machine will problem that reduced low (in this case, in the method of the conventional load distribution, in that to deliver the job becomes counterproductive problem is it).

【0010】本発明は、これらの問題を解決するため、 [0010] The present invention, in order to solve these problems,
計算機ごとにCPU能力および台数が異なりしかも仮想計算機が混在する並列型計算機システムであってもバッチジョブを実行する計算機を自動的に選択してジョブを配送し負荷分散を図り、並列型計算機システムの処理効率を高めることを目的としている。 Different CPU power and the number for each computer moreover delivers the job automatically select the computer to execute the batch job even parallel computer system in which virtual machines are mixed achieving load balancing, the parallel computer system It is intended to increase the processing efficiency.

【0011】 [0011]

【課題を解決するための手段】図1を参照して課題を解決するための手段を説明する。 Referring to Figure 1 SUMMARY OF THE INVENTION To explain the means for solving the problems. 図1において、並列型計算機システム1は、複数の計算機2および仮想計算機2 In Figure 1, a parallel type computer system 1 includes a plurality of computer 2 and the virtual machine 2
を相互に接続して並列処理を行うためのものである。 The it is for performing parallel processing by connecting to each other.

【0012】計算機2および仮想計算機2は、ジョブを実行するものである。 [0012] Computer 2 and the virtual machine 2, and executes the job. 仮想計算機2は、計算機(実計算機)2に任意の個数を動的に設けることができる。 Virtual computer 2 can computer (real computer) dynamically providing any number two. ここで、計算機(マスタ)2は、負荷情報収集手段21、余剰能力評価手段22などから構成されるものである。 Here, the computer (master) 2, the load information collecting unit 21 and is formed from such excess capacity evaluation unit 22.

【0013】負荷情報収集手段21は、計算機(スレーブ)2から負荷情報などを収集するものである。 [0013] The load information collecting means 21 is to collect and load information from the computer (slave) 2. 余剰能力評価手段22は、各計算機から収集した負荷情報をもとに当該計算機の余剰能力を評価して算出するものである。 Excess capacity evaluation means 22, the load information collected from each computer and calculates and evaluates the excess capacity of the computer based.

【0014】次に、動作を説明する。 [0014] Next, the operation will be described. 計算機(マスタ) Computer (master)
2の負荷情報収集手段21が各計算機から負荷情報を収集し、余剰能力評価手段22がこの収集した負荷情報をもとに余剰能力を評価して算出し、いずれかの計算機2 2 of the load information collecting unit 21 collects the load information from each computer, excess capacity evaluation unit 22 is calculated by evaluating the excess capacity on the basis of the load information this collection, one of the computer 2
にジョブが投入されたときに当該ジョブ情報の通知を受けた計算機(マスタ)2が評価した余剰能力が最も高い計算機2を選択し、ジョブを受け付けた計算機2が最も余剰能力が高いときはその計算機2にジョブを実行させ、一方、ジョブを受け付けた計算機以外の他の計算機2が最も余剰能力の高いときはそのジョブを受け付けた計算機2にジョブを転送させ実行させるようにしている。 Its job is to select the job information notification that received computer (master) 2 highest computer 2 excess capacity was evaluated when it is turned on, when the computer 2 that received the job is the most spare capacity is high in computer 2 jobs to execution, whereas, so that when another computer 2 other than computer that has received the job most excess capacity is to be executed by transferring the job to the computer 2 that has received the job.

【0015】この際、実記憶に対する負荷が所定負荷よりも高くて過負荷と判明したときにその計算機2を除外して他の計算機2について余剰能力を評価して算出し、 [0015] At this time, the load on the real storage is calculated to evaluate the excess capacity for other computers 2 by excluding the computer 2 when found to overload higher than the predetermined load,
最も余剰能力の高い計算機にジョブを実行させるようにしている。 And so as to run the job Most excess capacity higher computer.

【0016】また、余剰能力として、各計算機2のCP [0016] Also, as excess capacity, CP of each computer 2
U処理時間+CPU待ち時間、あるいはCPU処理時間+CPU待ち時間+I/O処理時間+I/O待ち時間として算出するようにしている。 It is calculated as the U processing time + CPU latency or CPU processing time + CPU latency + I / O processing time + I / O latency.

【0017】従って、計算機ごとにCPU能力および台数が異なり、しかも仮想計算機が混在する並列型計算機システムであってもバッチジョブを実行する計算機(仮想計算機を含む)2を自動的に選択してジョブを配送し負荷分散を図ることにより、並列型計算機システムの処理効率を高めることが可能となる。 [0017] Thus, unlike the CPU power and the number for each computer, yet (including a virtual machine) computer executing the batch job even parallel computer system in which virtual machines are mixed 2 automatically selected and the job by promoting the delivery load balance, it is possible to increase the processing efficiency of a parallel type computer system.

【0018】 [0018]

【発明の実施の形態】次に、図1から図8を用いて本発明の実施の形態および動作を順次詳細に説明する。 BEST MODE FOR CARRYING OUT THE INVENTION Next, sequentially described in detail embodiments and operation of the present invention with reference to FIGS 1.

【0019】図1は、本発明のシステム構成図を示す。 [0019] Figure 1 shows a system configuration of the present invention.
図1において、負荷情報制御テーブル23は、計算機2 In Figure 1, the load information control table 23, the computer 2
から収集した負荷情報を記憶したり、これら記憶した負荷情報からジョブを実行させる計算機2を選択する時点で余剰能力としてエラップス期待値を計算して設定するものである(後述する図5参照)。 And stores the load information collected from, and sets to calculate the Erappusu expectation as excess capacity at the time of selecting the computer 2 to execute a job from these stored load information (see FIG. 5 described later). ここで、エラップス期待値の最も小さい計算機2にジョブを配送するようにする。 Here, so as to deliver the smallest job to the computer 2 of Erappusu expected value.

【0020】次に、図2を用いて計算機(マスタ)2および図3を用いて計算機(スレーブ)2の構成を順次詳細に説明する。 Next, sequentially described in detail a configuration of a computer (slave) 2 using a computer (master) 2 and 3 with reference to FIG. 図2は、本発明の計算機(マスタ)例を示す。 Figure 2 illustrates a computer (master) of the present invention. これは、図1の計算機(マスタ)2の詳細構成図であって、図1の負荷情報収集手段21は図2のCPU This is a detailed block diagram of a computer (master) 2 in FIG. 1, the load information collecting unit 21 of FIG. 1 in FIG. 2 CPU
負荷情報収集部10に対応し、図1の余剰能力評価手段22は図2のジョブ配送先決定部9の一部に含まれるものである。 Corresponding to the load information collecting section 10, excess capacity evaluation means 22 of Figure 1 are intended to be included as part of the job destination determination unit 9 of FIG.

【0021】図2において、OS5は、オペレーティングシステムであって、全体を統括制御するものであり、 [0021] In FIG. 2, OS5 is an operating system, which centrally controls the whole,
ジョブ実行部7、ジョブ配送部8、ジョブ配送先決定部9、CPU負荷情報収集部10、CPU負荷情報受信部12、ジョブ配送先通知部13、ジョブ受付部14、ジョブ情報受信部16などから構成されるものである。 Job executing section 7, the job distribution unit 8, a job destination determining unit 9, CPU load information collecting section 10, CPU load information receiver unit 12, a job destination notifying unit 13, the job accepting unit 14, and the like Job information receiving unit 16 it is intended to be constructed.

【0022】ジョブ配送部8は、ジョブ配送先決定部9 [0022] The job delivery unit 8, job destination determining section 9
によって決定された配送先にジョブを配送するものである。 It is intended to deliver jobs to the delivery destination determined by the. ジョブ配送先決定部9は、余剰能力の最も高い(エラップス値の最も小さい)計算機をジョブ配送先と決定するものである。 Job destination determination unit 9 is for determining the (smallest Erappusu value) calculator highest excess capacity and job destination.

【0023】CPU負荷情報収集部10は、計算機2の負荷情報を収集するものである。 [0023] CPU load information collecting section 10 is configured to collect load information of the computer 2. CPU負荷情報受信部12は、スレーブ計算機2よりCPU負荷情報を受信するものである。 CPU load information receiver unit 12 is configured to receive CPU load information from the slave computer 2.

【0024】ジョブ配送先通知部13は、ジョブ配送先決定部9によって決定された配送先の計算機2にジョブを配送するようにスレーブ計算機に通知するものである。 The job destination notifying unit 13 is configured to notify the slave computer to deliver the job to the computer 2 of the delivery destination determined by the job destination determining unit 9. ジョブ受付部14は、投入されたジョブを受け付けるものである。 Job accepting unit 14 is for accepting an input job.

【0025】ジョブ情報受信部16は、スレーブ計算機に投入されたジョブの情報を受信するものである。 The job information receiving unit 16 is configured to receive the information of jobs submitted to the slave computer. 図3 Figure 3
は、本発明の計算機(スレーブ)例を示す。 Shows a computer (slave) of the present invention. これは、図1の計算機(マスタ)2以外のスレーブの計算機2の詳細構成図であある。 This is detailed block diagram der of the computer 2 of the computer (master) other than 2 slave FIG.

【0026】図3において、OS5は、オペレーティングシステムであって、全体を統括制御するものであり、 [0026] In FIG. 3, OS5 is a operating system, which centrally controls the whole,
ジョブ実行部7、ジョブ配送部8、CPU負荷情報収集部10、ジョブ受付部14、ジョブ配送先受信部16、 Job executing section 7, the job distribution unit 8, CPU load information collecting section 10, a job receiving unit 14, a job destination receiving unit 16,
ジョブ情報通知部17などから構成されるものである。 It is those composed of such a job information notification unit 17.
7、8、10、14は図2と同一であるので説明を省略する。 7,8,10,14 is omitted are the same as FIG.

【0027】図3において、CPU負荷情報通知部11 [0027] In FIG. 3, CPU load information notification unit 11
は、CPU負荷情報などをマスタ計算機に通知するものである。 Is to notify a CPU load information to the master computer. ジョブ配送先受信部15は、ジョブの配送先をマスタ計算機から受信するものである。 Job destination receiving unit 15 is configured to receive a job destination from the master computer.

【0028】ジョブ情報通知部17は、投入されたジョブのジョブ情報をマスタ計算機へ通知するものである。 The job information notification unit 17 is to notify the job information of the input job to the master computer.
以下図4ないし図8を用いて図1ないし図3の構成の動作を順次詳細に説明する。 The following will be sequentially described in detail an operation of the configuration shown in FIGS. 1 to 3 with reference to FIGS. 4-8.

【0029】図4は、本発明の動作説明図(その1)を示す。 [0029] Figure 4 is a view for explaining an operation of the present invention (Part 1). 図4の(a)は、負荷情報収集のフローチャートを示す。 (A) of FIG. 4 shows a flow chart of load information collecting. 図4の(a)において、ステージ1は、任意の計算機で実行するものである。 In (a) of FIG. 4, stage 1 is to run on any computer.

【0030】S1は、自計算機の負荷情報を収集する。 [0030] S1 is to collect load information of its own computer.
この負荷情報は、例えば図4の(b)に示すないしの情報を収集する。 The load information collecting information Do stone shown in FIG. 4 (b), for example. S2は、マスタ計算機に通知する。 S2 is to notify the master computer.

【0031】図4の(a)において、ステージ2は、マスタ計算機で実行するものである。 [0031] in FIG. 4 (a), the stage 2 is to run on the master computer. S3は、各計算機の負荷情報を受信する。 S3 is receiving the load information of each computer. S4は、負荷情報制御テーブルに格納する。 S4 is stored in the load information control table.

【0032】以上のステージ1のS1、S2およびステージ2のS3、S4によって、全ての計算機2の負荷情報およびI/O負荷情報を計算機(マスタ)2が収集し、後述する図5の負荷情報制御テーブル23のように設定(I/O負荷情報は未設定)できたこととなる。 [0032] Through the above stage 1 of S1, S2 and the stage 2 of the S3, S4, all of the computer 2 load information and I / O load information calculator (master) 2 collects the load information of FIG. 5 described later set as the control table 23 (I / O load information not set) and thus made.

【0033】図4の(b)は、ステージ1において収集・通知する負荷情報の例を示す。 [0033] in FIG. 4 (b) shows an example of load information collecting and notified in stage 1. 負荷情報は、図示のないしの下記のものである。 Load information is provided below to no shown. 計算機識別子:並列型計算機システムを構成する各計算機を識別するもの CPU能力 :実CPUの能力(実CPU一台当たりのMIPS値) CPU台数(1〜N) 実CPU台数(1〜M) CPU使用率 実CPU使用率 CPU配分比:仮想計算機への実CPU能力の配分比(動的変更可能) 計算機構成情報:実計算機、AUTOモード/上限A Computer identifier: Parallel computer CPU power intended to identify each computer constituting the system: (MIPS value per real CPU single) capability of real CPU CPU number (1 to N) used real CPU number (1 to M) CPU rate actual CPU utilization CPU allocation ratio: the distribution ratio of the real CPU capacity to the virtual machine (dynamic changeable) computer configuration information: real computer, AUTO mode / max a
UTOモード/ロジックモードの仮想計算機の区別を表示 実記憶負荷情報:スラッシングを起こしているか否かを表示 図4の(c)は、余剰能力の評価のフローチャートを示す。 UTO Mode / Logic mode virtual machine display real storage load information to distinguish the: the (c) display 4 whether the cause thrashing shows a flowchart of the evaluation of the excess capacity.

【0034】図4の(c)において、ステージ1は、任意の計算機で実行するものである。 [0034] in FIG. 4 (c), the stage 1 is to run on any computer. S11は、ユーザが任意の計算機にジョブを投入する。 S11, the user turns on the job to any computer. S12は、ジョブが投入された計算機がマスタ計算機か、スレーブ計算機か判別する。 S12,, computer job is input is either a master computer to determine whether the slave computer. マスタ計算機の場合には、ステージ2(図4 In the case of the master computer, stage 2 (Fig. 4
の(a)のステージ2)に進む。 Proceed to stage 2) of (a). 一方、スレーブ計算機の場合には、S13でマスタ計算機に、投入されたジョブの情報を通知する。 On the other hand, in the case of the slave computer to the master computer in S13, and notifies the information of the input job.

【0035】以上のS11、S12によって、計算機に投入されたジョブ情報が全てマスタ計算機に通知されたこととなる。 [0035] With the above S11, S12, the job information entered into the computer so that the notified to all the master computer. 図5は、本発明の負荷情報制御テーブル例を示す。 Figure 5 shows a load information control table of the present invention. この負荷情報制御テーブル23は、既述した図4のS4で、全ての計算機2から収集された負荷情報を設定して記憶したものであって、既述した図4の(b) The load information control table 23, in S4 of FIG. 4 already described, there is stored by setting the load information gathered from all the computer 2, of FIG. 4 described above (b)
のないしの情報を設定して記憶したものである。 Set the to information of the to those stored. 図中の“エラップス期待値”は、ないしの情報をもとに算出したものであって、計算機の余剰能力を表すものであり、小さいほど、計算機の余剰能力が高いものである。 "Erappusu expected value" in the figure, the information of from be those calculated based, which represents the excess capacity of the computer, small enough, excess capacity of the computer is high. このエラップス期待値は、例えば下記の式によって計算する(尚、図5の負荷情報制御テーブル23は、C The Erappusu expected value, for example, calculated by the following equation (The load information control table 23 in FIG. 5, C
PU処理時間+CPU待ち時間についてのものである)。 One of which is for PU processing time + CPU latency). ジョブ投入からジョブ終了までに必要な時間(エラップス期待値)は、 =CPU処理時間+CPU待ち時間 +I/O処理時間+I/O待ち時間 (式1) =CPU処理時間×(1+α(CPU数、CPU使用率)) +I/O処理時間×(1+β(チャネル数、チャネル使用率)) (式2) αとβは待ち行列理論の一般論から導かれるものである。 Time required for the job input to the job end (Erappusu expected value), = CPU processing time + CPU latency + I / O processing time + I / O wait time (Equation 1) = CPU processing time × (1 + alpha (number CPU, CPU utilization)) + I / O processing time × (1 + beta (the number of channels, channel utilization)) (in which the formula 2) alpha and beta are derived from the general theory of queuing theory. このαとβとの関係は、例えばCPUバウンドなジョブであれば、必然的にCPU処理時間が大きくなり、 The relationship between the α and β is, for example if the CPU bound job, inevitably CPU processing time is increased,
I/O処理時間が小さくなるので、αの大小関係に敏感に、βの大小関係に鈍感になり、CPU負荷情報およびI/O負荷情報をまとめて計算機2の余剰能力を評価してエラップス値として算出することが可能となった。 Since I / O processing time is reduced, sensitive to the magnitude relation of alpha, becomes insensitive to the magnitude relation of the beta, Erappusu values ​​collectively CPU load information and I / O load information to assess the excess capacity of the computer 2 It is calculated as has become possible.

【0036】尚、I/O処理は、チャネルと呼ばれる入出力機構を経由してディスク装置などと主記憶との間でデータの転送を行っている。 It should be noted, I / O processing is performed to transfer data between the like and the main storage disk device via the input-output mechanism called a channel. 1回のI/O処理にかかる時間は、チャネル数やチャネルの使用率に影響されるので、上記(式2)に示すようにCPUの場合と同様に評価するようにしている。 Time for one I / O processing is affected by the channel number or the channel utilization, and so as to evaluate as in the case of CPU, as shown in (Equation 2).

【0037】図6は、本発明の動作説明図(その2)を示す。 [0037] Figure 6 is a view for explaining an operation of the present invention (Part 2). 図6において、ステージ2は、マスタ計算機で実行するものである。 6, the stage 2 is to run on the master computer. S21は、任意の計算機より、投入されたジョブの情報を受信する。 S21, from any computer, receives information input job. これは、スレーブ計算機に投入されたジョブの情報をマスタ計算機が受信、およびマスタ計算機に投入されたジョブの情報を受け付け、既述した図5の負荷情報制御テーブル23に設定する。 This receives information of jobs submitted to the slave computer master computer, and receives information of the input job to the master computer, set the load information control table 23 of FIG. 5 described above.

【0038】S22は、負荷情報制御テーブルを参照し、各計算機の負荷情報を順々に取り出す。 [0038] S22 refers to the load information control table, retrieve the load information of each computer in turn. S23は、 S23 is,
実記憶負荷が過負荷か判別する。 Real storage load is determined overloaded or. YESの場合には、S In the case of YES, S
24ないしS26をスキップしてS27に進む。 24 to proceed to S27 by skipping S26. 一方、 on the other hand
NOの場合には、S24に進む。 If NO, the process proceeds to S24.

【0039】S24は、計算機の種別を判別する。 [0039] S24, and determines the type of computer. ・実計算機またはAUTOモードの仮想計算機の場合には、S26に示す下記の式4によって当該計算機のエラップス期待値を評価し、S27に進む。 · In the case of real computer or AUTO mode of the virtual machine evaluates the Erappusu expected value of the computer by Equation 4 below shown in S26, the process proceeds to S27.

【0040】 (1+α(実CPU数、実CPU使用率))/CPU能力 (式4) ・上限AUTOモード仮想計算機またはロジカルモード仮想計算機の場合には、S25に示す下記の式5によって当該計算機のエラップス期待値を評価し、S27に進む。 [0040] (1 + alpha (real CPU number, the actual CPU use rate)) in the case of / CPU capacity (Equation 4) upper AUTO mode virtual machine or logical mode virtual machine, of the computer by Equation 5 below shown to step S25 to evaluate the Erappusu expected value, the process proceeds to S27.

【0041】 (1+α(実CPU数、実CPU使用率))/(CPU能力×CPU配分比) (式5) S27は、負荷情報制御テーブルの最後まで評価を行ったか判別する。 [0041] (1 + alpha (real CPU number, actual CPU utilization)) / (CPU capacity × CPU allocation ratio) (Equation 5) S27 decides whether or evaluated until the end of the load information control table. YESの場合には、S28に進む。 In the case of YES, the process proceeds to S28. NO NO
の場合には、S22に戻り、繰り返す。 In the case of, return to S22, repeat.

【0042】S28は、エラップス期待値が最小かつ実記憶過負荷でない計算機をジョブ配送先として選択する。 [0042] S28 selects the computer Erappusu expected value is not the minimum and real storage overload as the job destination. S29は、ジョブを受け付けた計算機に、選択した計算機をジョブ配送先として通知する。 S29 is, the computer that has received the job, to notify the selected computer as a job destination. そして、図7のステージ3へ進む。 Then, the process proceeds to stage 3 of FIG. 7.

【0043】以上のS21からS29によって、全ての計算機から受信した負荷情報を負荷情報制御テーブル2 [0043] by S29 from the above S21, the load the load information received from all of computer information control table 2
3に設定した後、先頭から順番に取り出して実記憶負荷が過負荷でない場合に計算機の種別によって分けてそれぞれエラップス期待値を式4あるいは式5によって計算し、エラップス期待値が最も小さい計算機にジョブを配送させて転送するように通知することが可能となる。 After setting to 3, each leading real storage load removed in order from the divided depending on the type of the computer when it is not overloaded Erappusu expected value is calculated by Equation 4 or Equation 5, job Erappusu expected value is the smallest computer it is possible to notify to transfer by delivering. そして、後述する図7のステージ3によってジョブをエラップス期待値の最も小さい(余剰能力の最も高い)計算機に転送して実行させることが可能となる。 Then, it is possible to execute the transfer (highest excess capacity) Calculator smallest Erappusu expected jobs by the stage 3 of FIG. 7 to be described later.

【0044】図7は、本発明の動作説明図(その3)を示す。 [0044] Figure 7 is a view for explaining an operation of the present invention (Part 3). 図7において、ステージ3は、ジョブを受け付けた計算機で実行するものである。 7, stage 3 is configured to execute a computer that has received the job.

【0045】S31は、マスタ計算機よりジョブ配送先を受信し、ジョブをマスタ計算機から指示された計算機に配送する。 [0045] S31 receives the job destination of the master computer, is delivered to the computer instructed the job from the master computer. ステージ4は、ジョブを配送された計算機で実行するものである。 Stage 4 is intended to run on computers that are delivered to the job.

【0046】S41は、ジョブを受け付けた計算機より配送されたジョブを実行する。 [0046] S41 is, to perform the job that has been delivered from the computer that has received the job. 以上のS31、S41によって、エラップス期待値の最も小さい計算機にジョブを配送して実行させることが可能となる。 With the above S31, S41, it is possible to execute delivers the job to the smallest calculator Erappusu expected value.

【0047】図8は、本発明の余剰能力の評価例を示す。 [0047] Figure 8 shows an evaluation example of excess capacity of the present invention. これは、CPU負荷情報のみをもとに余剰能力を評価して計算したものである。 This is calculated by evaluating the excess capacity on the basis of only the CPU load information. 以下説明する。 It will be described below. ここで、あるサービスを行う複数の窓口に対する客の到着頻度がランダム到着に従い、そのサービス量が指数分布に従うと仮定すると、到着した客がサービスを受けるまでの待ち時間は、処理時間×(窓口の数と窓口の平均稼働率の関数)として図8の(式6)として書けることが、待ち行列理論の一般論として知られている。 Here, the arrival frequency of customers for a plurality of windows to perform a certain service in accordance with random arrival, when the service amount is assumed to follow an exponential distribution, waiting time for customers arrived receive the service, the processing time × (window of can be written as a function) of the average occupancy rate of the number of window as (equation 6) in FIG. 8 is known in general terms of queuing theory. 今、窓口の稼働率をCPU使用率に、窓口の数をCPU台数に対応させ、 Now, the point of contact for capacity utilization to CPU utilization, so as to correspond to the number of windows in the CPU number,
あるジョブを実行完了するために必要な時間をCPU待ち時間とCPU処理時間だけで評価すれば、CPU処理時間は、(式7)のように評価でき、ジョブの処理に必要なダイナミックステップ数はどの計算機で走行させても同じだから除外して考えると、ジョブを投入してから終了するまでに要する時間に比例する量が得られる。 If assessing the time required to perform complete a job by only CPU latency and CPU processing time, CPU processing time, can be evaluated as shown in Equation (7), a dynamic number of steps required to process the job is When any computer in is traveled considered excluded because the same also, an amount proportional to the time required to exiting submit jobs are obtained. この値(エラップス期待値)が最も小さく、かつ実記憶負荷が過負荷状態でない計算機に対してジョブを配送し、 It delivers the job to this value (Erappusu expected value) is the smallest, and real storage load is not overloaded computer,
実行させる。 To be executed. ここで、I/O処理時間およびI/O待ち時間を既述した(式1)、(式2)のように含めるようにしてもよい。 Here, already described an I / O processing time and I / O wait time (Equation 1), may be included as shown in Equation (2).

【0048】 [0048]

【発明の効果】以上説明したように、本発明によれば、 As described in the foregoing, according to the present invention,
計算機ごとにCPU能力および台数が異なり、しかも仮想計算機が混在する並列型計算機システムであってもバッチジョブを実行する計算機(仮想計算機を含む)2を自動的に選択してジョブを配送し負荷分散を図る構成を採用しているため、仮想計算機を含む並列型計算機システムのバッチジョブを実行させる際に、最も余剰能力の高い計算機を動的に選択してジョブを配送し実行させ、 Different CPU power and the number for each computer, yet (including a virtual machine) computer executing the batch job even parallel computer system in which virtual machines are mixed automatically selected delivered to load balance the job 2 since it uses the configuration to achieve, when to execute the batch job of a parallel type computer system including a virtual machine, to the highest excess capacity computer to select dynamically deliver the job execution,
処理効率を高めることができる。 It is possible to increase the processing efficiency.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明のシステム構成図である。 1 is a system configuration diagram of the present invention.

【図2】本発明の計算機(マスタ)例である。 2 is a computer (master) of the present invention.

【図3】本発明の計算機(スレーブ)例である。 3 is a computer (slave) of the present invention.

【図4】本発明の動作説明図(その1)である。 A [4] Operation diagram of the present invention (Part 1).

【図5】本発明の負荷制御情報テーブル例である。 5 is a load control information table of the present invention.

【図6】本発明の動作説明図(その2)である。 It is a 6 operation explanatory diagram of the present invention (Part 2).

【図7】本発明の動作説明図(その3)である。 Is a 7 diagram for describing operation of the present invention (Part 3).

【図8】本発明の余剰能力の評価例である。 8 is an evaluation example of excess capacity of the present invention.

【図9】従来技術の説明図である。 FIG. 9 is an explanatory view of a prior art.

【符号の説明】 DESCRIPTION OF SYMBOLS

1:並列型計算機システム 2:計算機、仮想計算機 21:負荷情報収集手段 22:余剰能力評価手段 23:負荷情報制御テーブル 1: Parallel computer system 2: computer, the virtual machine 21: the load information collecting section 22: excess capacity evaluation means 23: the load information control table

Claims (3)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】並列型計算機の各計算機に負荷を分散する負荷分散制御システムにおいて、 各計算機(仮想計算機を含む、以下同様)の負荷情報の通知を受けて余剰能力を評価して算出する余剰能力評価手段と、 いずれかの計算機にジョブが投入されたときに当該ジョブ情報の通知を受けて上記評価した余剰能力が最も高い計算機を選択し、ジョブを受け付けた計算機が最も余剰能力が高いときはその計算機にジョブを実行させ、一方、ジョブを受け付けた計算機以外の他の計算機が最も余剰能力が高いときはそのジョブを受け付けた計算機にジョブを転送させて実行させる手段とを並列型計算機のうちのマスタ計算機に備えたことを特徴とする負荷分散制御システム。 1. A load distribution control system to distribute the load on each computer of parallel computers, surplus calculated by evaluating excess capacity notified of load information of each computer (including virtual machines, hereinafter the same) and ability evaluating means, either by receiving the notification of the job information to select the highest computer spare capacity that the evaluation when the job is input to the computer, when the most spare capacity is higher computer that has received the job is to execute the job in its computer, whereas, other than computer that has received the job computer of the most when excess capacity is high and means for executing by transferring the job to the computer that has received the job parallel computer of the load distribution control system characterized by comprising a master calculator.
  2. 【請求項2】実記憶に対する負荷が所定負荷よりも高くて過負荷と判明したときにその計算機を除外して他の計算機について余剰能力を評価して算出することを特徴とする請求項1記載の負荷分散制御システム。 2. A method according to claim 1, wherein the load on the real storage which is characterized in that calculated by evaluating excess capacity for the exclusion of the computer when found to overload higher than the predetermined load another computer load balancing control system.
  3. 【請求項3】上記余剰能力として、各計算機のCPU処理時間+CPU待ち時間、あるいはCPU処理時間+C Wherein as the excess capacity, CPU processing time + CPU latency of each computer or CPU processing time, + C
    PU待ち時間+I/O処理時間+I/O待ち時間としたことを特徴とする請求項1あるいは請求項2記載の負荷分散制御システム。 Claim 1 or claim 2 load sharing control system according to characterized in that a PU latency + I / O processing time + I / O latency.
JP1352296A 1996-01-30 1996-01-30 Load decentralization control system Pending JPH09212467A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1352296A JPH09212467A (en) 1996-01-30 1996-01-30 Load decentralization control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1352296A JPH09212467A (en) 1996-01-30 1996-01-30 Load decentralization control system

Publications (1)

Publication Number Publication Date
JPH09212467A true true JPH09212467A (en) 1997-08-15

Family

ID=11835495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1352296A Pending JPH09212467A (en) 1996-01-30 1996-01-30 Load decentralization control system

Country Status (1)

Country Link
JP (1) JPH09212467A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005076131A1 (en) * 2004-02-03 2005-08-18 Sony Corporation Information processing device, information processing method, information processing system, and information processing program
US6986139B1 (en) 1999-10-06 2006-01-10 Nec Corporation Load balancing method and system based on estimated elongation rates
US7290260B2 (en) 2003-02-20 2007-10-30 International Business Machines Corporation Dynamic processor redistribution between partitions in a computing system
JP2008293358A (en) * 2007-05-25 2008-12-04 Fujitsu Ltd Distributed processing program, distributed processing method, distributed processing apparatus, and distributed processing system
US7870439B2 (en) 2003-05-28 2011-01-11 Nec Corporation Fault tolerant multi-node computing system using periodically fetched configuration status data to detect an abnormal node
WO2011096249A1 (en) * 2010-02-05 2011-08-11 日本電気株式会社 Load control device
WO2012023190A1 (en) * 2010-08-18 2012-02-23 富士通株式会社 Communication terminal apparatus, receipt processing program, and receipt processing method
JP5206674B2 (en) * 2007-05-24 2013-06-12 日本電気株式会社 The virtual machine management system, virtual machine management method, and a virtual machine management program
US9384050B2 (en) 2011-03-08 2016-07-05 Fujitsu Limited Scheduling method and scheduling system for multi-core processor system

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6986139B1 (en) 1999-10-06 2006-01-10 Nec Corporation Load balancing method and system based on estimated elongation rates
US7290260B2 (en) 2003-02-20 2007-10-30 International Business Machines Corporation Dynamic processor redistribution between partitions in a computing system
US7870439B2 (en) 2003-05-28 2011-01-11 Nec Corporation Fault tolerant multi-node computing system using periodically fetched configuration status data to detect an abnormal node
US8103771B2 (en) 2004-02-03 2012-01-24 Sony Corporation Distributing processing apparatus, method, and system
WO2005076131A1 (en) * 2004-02-03 2005-08-18 Sony Corporation Information processing device, information processing method, information processing system, and information processing program
JP5206674B2 (en) * 2007-05-24 2013-06-12 日本電気株式会社 The virtual machine management system, virtual machine management method, and a virtual machine management program
JP2008293358A (en) * 2007-05-25 2008-12-04 Fujitsu Ltd Distributed processing program, distributed processing method, distributed processing apparatus, and distributed processing system
US8214686B2 (en) 2007-05-25 2012-07-03 Fujitsu Limited Distributed processing method
WO2011096249A1 (en) * 2010-02-05 2011-08-11 日本電気株式会社 Load control device
US9086910B2 (en) 2010-02-05 2015-07-21 Nec Corporation Load control device
CN102782653A (en) * 2010-02-05 2012-11-14 日本电气株式会社 Load control device
WO2012023190A1 (en) * 2010-08-18 2012-02-23 富士通株式会社 Communication terminal apparatus, receipt processing program, and receipt processing method
US8768330B2 (en) 2010-08-18 2014-07-01 Fujitsu Limited Communication terminal apparatus, computer product, and incoming call processing method
US9384050B2 (en) 2011-03-08 2016-07-05 Fujitsu Limited Scheduling method and scheduling system for multi-core processor system

Similar Documents

Publication Publication Date Title
US7748005B2 (en) System and method for allocating a plurality of resources between a plurality of computing domains
US5925102A (en) Managing processor resources in a multisystem environment in order to provide smooth real-time data streams, while enabling other types of applications to be processed concurrently
US6438553B1 (en) Distributed job integrated management system and method
US6366931B1 (en) Apparatus for and method of non-linear constraint optimization in storage system configuration
US5881284A (en) Method of scheduling a job in a clustered computer system and device therefor
US8205205B2 (en) Multi-objective allocation of computational jobs in client-server or hosting environments
US6985937B1 (en) Dynamically modifying the resources of a virtual server
US20040148606A1 (en) Multi-thread computer
US20030037093A1 (en) Load balancing system and method in a multiprocessor system
US20100005465A1 (en) Virtual machine location system, virtual machine location method, program, virtual machine manager, and server
US5301324A (en) Method and apparatus for dynamic work reassignment among asymmetric, coupled processors
Oppenheimer et al. Resource management for a medium scale time sharing operating system
US6986137B1 (en) Method, system and program products for managing logical processors of a computing environment
US20050091654A1 (en) Autonomic method, system and program product for managing processes
US5870604A (en) Job execution processor changing method and system, for load distribution among processors
US7610425B2 (en) Approach for managing interrupt load distribution
US20030187627A1 (en) I/O velocity projection for bridge attached channel
US20020184290A1 (en) Run queue optimization with hardware multithreading for affinity
US6519660B1 (en) Method, system and program products for determining I/O configuration entropy
US4435755A (en) Balanced channel finding method
US6587938B1 (en) Method, system and program products for managing central processing unit resources of a computing environment
US6651125B2 (en) Processing channel subsystem pending I/O work queues based on priorities
US20020052909A1 (en) Efficient assignment of processing resources in a fair queuing system
US20110010709A1 (en) Optimizing System Performance Using Spare Cores in a Virtualized Environment
US20040205759A1 (en) Information processing system, information processing device, distributed information processing method and computer program

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040302