JP2003203061A - Parallel computer system, and program for selecting calculation node in parallel computer system - Google Patents

Parallel computer system, and program for selecting calculation node in parallel computer system

Info

Publication number
JP2003203061A
JP2003203061A JP2002001552A JP2002001552A JP2003203061A JP 2003203061 A JP2003203061 A JP 2003203061A JP 2002001552 A JP2002001552 A JP 2002001552A JP 2002001552 A JP2002001552 A JP 2002001552A JP 2003203061 A JP2003203061 A JP 2003203061A
Authority
JP
Japan
Prior art keywords
computer system
node
calculation
program
parallel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002001552A
Other languages
Japanese (ja)
Inventor
Katsuya Taigo
克哉 太呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2002001552A priority Critical patent/JP2003203061A/en
Publication of JP2003203061A publication Critical patent/JP2003203061A/en
Withdrawn legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a parallel computer system capable of improving the reliability of a system by excluding a calculation node being in a situation that the abnormal termination may be generated during the calculation, from an object in advance. <P>SOLUTION: In this parallel computer system 10 comprising a master computer 20 and a plurality of calculation nodes 30, the calculation node selected from the plurality of calculation nodes refers a shared file 25 of the master computer to process a program in parallel, and the selection of the calculation node is performed on the basis of whether the calculation node can refer the shared file of the master computer or not. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、並列計算機システ
ムおよび並列計算機システムにおける計算ノードの選択
用プログラムに関し、特に、科学技術計算用の並列計算
機システムおよび並列計算機システムにおける計算ノー
ドの選択用プログラムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel computer system and a program for selecting a calculation node in a parallel computer system, and more particularly to a parallel computer system for scientific and technological calculation and a program for selecting a calculation node in a parallel computer system.

【0002】[0002]

【従来の技術】演算量が莫大である科学技術用計算用プ
ログラム(解析プログラム)は、並列計算機システムに
おいて、並列処理が行われることがある。
2. Description of the Related Art A science and technology calculation program (analysis program), which has a huge amount of calculation, may be processed in parallel in a parallel computer system.

【0003】並列計算機システムにおいて、マスターコ
ンピュータが計算ノード(スレーブコンピュータ)にジ
ョブを分配するときに、その計算ノードが計算できる状
態であるかを確認する必要がある。計算途中で「異常終
了」を発生するおそれのある計算ノードを事前に除外し
て、システムの信頼性を向上させるためである。
In a parallel computer system, when a master computer distributes a job to a calculation node (slave computer), it is necessary to confirm whether or not the calculation node can be calculated. This is to improve the reliability of the system by excluding in advance the calculation nodes that may cause “abnormal termination” during the calculation.

【0004】現状の計算ノードのスケジューリング法で
は、計算ノードの応答性により計算ノードの有効性を確
認している。そのため、計算ノードに障害が発生した場
合、障害の種類によっては応答性は良くても、解析プロ
グラムの実行は不可能である場合がある。
In the current method of scheduling a computing node, the validity of the computing node is confirmed by the response of the computing node. Therefore, when a failure occurs in the computing node, it may be impossible to execute the analysis program even if the response is good depending on the kind of the failure.

【0005】ここで、解析プログラムの実行が不可能で
あるのは、その計算ノードがマスターコンピュータの共
有ファイルに有るファイルのパラメータ等が読めなかっ
たり、または、そのジョブを実行するにはメモリ容量が
不足する等の理由からである。
Here, the reason why the analysis program cannot be executed is that the calculation node cannot read the parameters of the file in the shared file of the master computer, or the memory capacity is large to execute the job. This is because there is a shortage.

【0006】その場合、計算のやり直しとなるが、解析
プログラムは一般に時間がかかるため、再実行は大きな
時間のロスとなる。また、スケジュール管理プログラム
の元で解析プログラムを動作させるため、市販解析プロ
グラムなどでは動作不可能である場合がある。
In that case, the calculation is redone, but since the analysis program generally takes time, re-execution causes a great loss of time. Further, since the analysis program is operated under the schedule management program, it may not be possible to operate with a commercially available analysis program or the like.

【0007】[0007]

【発明が解決しようとする課題】並列計算機システムに
おいて、計算途中で異常終了を起こすような状況にある
計算ノードを事前に対象から除外して、システムの信頼
性を向上させることが望まれている。
In a parallel computer system, it is desired to improve the reliability of the system by excluding in advance the calculation nodes that are in a situation that causes abnormal termination during calculation. .

【0008】なお、特開2001−22601号公報に
は、次の並列計算機システムが記載されている。計算機
であるノードの複数と、該複数のノード相互間で共有す
るメモリにより構成され、ノード相互間をネットワーク
で結合した並列計算機システムにおいて、実行待ちの先
頭のジョブが要求するノード数を確保するため、現在実
行中の複数のジョブの中で実行中のジョブが確保してい
るノード数の総和が、先頭のジョブの要求ノード数を満
たすジョブ群を対象ジョブとして登録する手段と、前記
対象ジョブのノード数の総和と前記先頭のジョブの要求
ノード数にシステムがジョブ稼動状況により予め定めた
重みを乗じた値とを比較し、前記先頭のジョブの要求ノ
ード数にシステムがジョブ稼働状況により予め定めた重
みを乗じた値が、前記対象ジョブのノード数の総和より
大きい場合、前記対象ジョブを一時的に停止または一時
的に中断して、前記先頭のジョブを優先的にスケジュー
ルする手段とを備えたことを特徴としている。
The following parallel computer system is described in Japanese Patent Laid-Open No. 2001-22601. To secure the number of nodes required by the first job waiting for execution in a parallel computer system that is composed of multiple nodes that are computers and a memory that is shared between the multiple nodes and that is connected to each other via a network , Means for registering as a target job a job group in which the total number of nodes secured by the currently executing jobs among the plurality of currently executing jobs satisfies the number of requested nodes of the first job, The total number of nodes is compared with a value obtained by multiplying the number of required nodes of the first job by a weight predetermined by the system depending on the job operating status, and the system is preset to the number of required nodes of the first job depending on the job operating status. If the value multiplied by the weight is larger than the total number of nodes of the target job, the target job is temporarily stopped or temporarily suspended. It is characterized in that a means for preferentially schedule the beginning of the job.

【0009】本発明の目的は、計算途中で異常終了を起
こすような状況にある計算ノードを事前に対象から除外
する並列計算機システムおよび並列計算機システムにお
ける計算ノードの選択用プログラムを提供することであ
る。
An object of the present invention is to provide a parallel computer system for excluding beforehand from a target a calculation node in a situation that causes an abnormal termination during calculation, and a program for selecting a calculation node in the parallel computer system. .

【0010】[0010]

【課題を解決するための手段】以下に、[発明の実施の
形態]で使用する番号・符号を用いて、[課題を解決す
るための手段]を説明する。これらの番号・符号は、
[特許請求の範囲]の記載と[発明の実施の形態]の記
載との対応関係を明らかにするために付加されたもので
あるが、[特許請求の範囲]に記載されている発明の技
術的範囲の解釈に用いてはならない。
[Means for Solving the Problem] [Means for Solving the Problem] will be described below by using the numbers and symbols used in the [Embodiment of the Invention]. These numbers and signs are
Although added to clarify the correspondence between the description in [Claims] and the description in [Embodiment of the Invention], the technology of the invention described in [Claims] It should not be used to interpret the scope.

【0011】本発明の並列計算機システム(10)は、
マスターコンピュータ(20)と複数の計算ノード(3
0)とを備えた並列計算機システム(10)であって、
前記複数の計算ノード(30)のうちの選択された前記
計算ノード(30)は、前記マスターコンピュータ(2
0)の共有ファイル(25)を参照して、プログラムを
並列処理し、前記計算ノード(30)の前記選択は、当
該前記計算ノード(30)が前記マスターコンピュータ
(20)の前記共有ファイル(25)を参照可能か否か
によって行われる。
The parallel computer system (10) of the present invention is
Master computer (20) and multiple computing nodes (3
0) and a parallel computer system (10) comprising:
The selected computing node (30) of the plurality of computing nodes (30) is the master computer (2).
0) refers to the shared file (25), the program is processed in parallel, and the calculation node (30) selects the shared file (25) of the master computer (20). ) Can be referred to or not.

【0012】本発明の並列計算機システム(10)にお
いて、前記計算ノード(30)の前記選択は、当該前記
計算ノード(30)による前記マスターコンピュータ
(20)の一部のマウントが正常であるか否かによって
行われる。
[0012] In the parallel computer system (10) of the present invention, the selection of the computing node (30) is based on whether or not mounting of a part of the master computer (20) by the computing node (30) is normal. Is done by or.

【0013】本発明の並列計算機システム(10)にお
いて、前記計算ノード(30)の前記選択は、前記マス
ターコンピュータ(20)が行う。
In the parallel computer system (10) of the present invention, the master computer (20) selects the computing node (30).

【0014】本発明の並列計算機システム(10)は、
マスターコンピュータ(20)と複数の計算ノード(3
0)とを備えた並列計算機システム(10)であって、
前記複数の計算ノード(30)のうちの選択された前記
計算ノード(30)は、プログラムを並列処理し、前記
計算ノード(30)の前記選択は、当該前記計算ノード
(30)のメモリ(31)の空き容量によって行われ
る。
The parallel computer system (10) of the present invention is
Master computer (20) and multiple computing nodes (3
0) and a parallel computer system (10) comprising:
The selected calculation node (30) of the plurality of calculation nodes (30) processes a program in parallel, and the selection of the calculation node (30) is performed by the memory (31) of the calculation node (30). ) Free space.

【0015】本発明の並列計算機システム(10)は、
マスターコンピュータ(20)と複数の計算ノード(3
0)とを備えた並列計算機システム(10)であって、
前記複数の計算ノード(30)のうちの選択された前記
計算ノード(30)は、前記マスターコンピュータ(2
0)の共有ファイル(25)を参照して、プログラムを
並列処理し、前記計算ノード(30)の前記選択は、当
該前記計算ノード(30)が前記マスターコンピュータ
(20)の前記共有ファイル(25)を参照可能か否か
および当該前記計算ノード(30)のメモリ(31)の
空き容量によって行われる。
The parallel computer system (10) of the present invention is
Master computer (20) and multiple computing nodes (3
0) and a parallel computer system (10) comprising:
The selected computing node (30) of the plurality of computing nodes (30) is the master computer (2).
0) refers to the shared file (25), the program is processed in parallel, and the calculation node (30) selects the shared file (25) of the master computer (20). ) Can be referred to and the free capacity of the memory (31) of the calculation node (30).

【0016】本発明の並列計算機システム(10)にお
いて、前記計算ノード(30)の前記選択は、前記マス
ターコンピュータ(20)が行う。
In the parallel computer system (10) of the present invention, the master computer (20) selects the computing node (30).

【0017】本発明の並列計算機システム(10)にお
いて、前記計算ノード(30)の前記選択は、更に、当
該前記計算ノード(30)のCPU(32)の負荷率に
よって行われる。
In the parallel computer system (10) of the present invention, the selection of the computing node (30) is further performed by the load factor of the CPU (32) of the computing node (30).

【0018】本発明の並列計算機システム(10)にお
いて、前記計算ノード(30)の前記選択は、更に、当
該前記計算ノード(30)の前記CPU(32)の負荷
率と前記CPU(32)の計算能力とに基づいて、行わ
れる。
In the parallel computer system (10) of the present invention, the selection of the calculation node (30) further includes the load factor of the CPU (32) and the CPU (32) of the calculation node (30). It is performed based on the calculation ability.

【0019】本発明の並列計算機システム(10)にお
ける計算ノードの選択用プログラムは、マスターコンピ
ュータ(20)と複数の計算ノード(30)とを備えた
並列計算機システム(10)における計算ノードの選択
用プログラムであって、(a) 前記計算ノード(3
0)が前記マスターコンピュータ(20)の前記共有フ
ァイル(25)を参照可能か否かを確認するステップ
と、(b) 前記(a)の確認結果によって、前記複数
の計算ノード(30)のうちから、前記マスターコンピ
ュータ(20)の共有ファイル(25)を参照してプロ
グラムを並列処理する前記計算ノード(30)を選択す
るステップとをコンピュータに実行させるためのプログ
ラムである。
A program for selecting a calculation node in the parallel computer system (10) of the present invention is for selecting a calculation node in a parallel computer system (10) including a master computer (20) and a plurality of calculation nodes (30). A program comprising: (a) the calculation node (3
0) confirms whether or not the shared file (25) of the master computer (20) can be referred to, and (b) according to the confirmation result of (a), among the plurality of calculation nodes (30). From the shared file (25) of the master computer (20) to select the computing node (30) that processes the program in parallel.

【0020】本発明の並列計算機システム(10)にお
ける計算ノードの選択用プログラムにおいて、前記
(a)は、当該前記計算ノード(30)による前記マス
ターコンピュータ(20)の一部のマウントが正常であ
るか否かによって行われる。
In the program for selecting a computing node in the parallel computer system (10) of the present invention, in (a), a part of mounting of the master computer (20) by the computing node (30) is normal. Or not.

【0021】本発明の並列計算機システム(10)にお
ける計算ノードの選択用プログラムにおいて、前記
(a)および前記(b)は、前記マスターコンピュータ
(20)が行う。
In the program for selecting a computing node in the parallel computer system (10) of the present invention, the above (a) and (b) are performed by the master computer (20).

【0022】本発明の並列計算機システム(10)にお
ける計算ノードの選択用プログラムは、マスターコンピ
ュータ(20)と複数の計算ノード(30)とを備えた
並列計算機システム(10)における計算ノードの選択
用プログラムであって、(c) 前記計算ノード(3
0)の前記計算ノード(30)のメモリ(31)の空き
容量を確認するステップと、(d) 前記(c)の確認
結果によって、前記複数の計算ノード(30)のうちか
ら、プログラムを並列処理する前記計算ノード(30)
を選択するステップとをコンピュータに実行させるため
のプログラムである。
A program for selecting a calculation node in the parallel computer system (10) of the present invention is for selecting a calculation node in a parallel computer system (10) including a master computer (20) and a plurality of calculation nodes (30). (C) the calculation node (3
0) the step of confirming the free capacity of the memory (31) of the calculation node (30), and (d) the parallelization of the program from the plurality of calculation nodes (30) according to the confirmation result of (c). The computing node (30) to process
Is a program for causing a computer to execute the step of selecting.

【0023】本発明の並列計算機システム(10)にお
ける計算ノードの選択用プログラムは、マスターコンピ
ュータ(20)と複数の計算ノード(30)とを備えた
並列計算機システム(10)における計算ノードの選択
用プログラムであって、(e) 前記計算ノード(3
0)が前記マスターコンピュータ(20)の前記共有フ
ァイル(25)を参照可能か否かを確認するステップ
と、(f) 前記計算ノード(30)の前記計算ノード
(30)のメモリ(31)の空き容量を確認するステッ
プと、(g) 前記(e)および前記(f)の確認結果
によって、前記複数の計算ノード(30)のうちから、
前記マスターコンピュータ(20)の共有ファイル(2
5)を参照してプログラムを並列処理する前記計算ノー
ド(30)を選択するステップとをコンピュータに実行
させるためのプログラムである。
The program for selecting a computing node in the parallel computer system (10) of the present invention is for selecting a computing node in a parallel computer system (10) including a master computer (20) and a plurality of computing nodes (30). A program comprising: (e) the calculation node (3
0) whether or not the shared file (25) of the master computer (20) can be referred to, and (f) the memory (31) of the computing node (30) of the computing node (30). From the plurality of calculation nodes (30), the step of confirming the free capacity and (g) the confirmation results of the above (e) and (f),
The shared file (2) of the master computer (20)
5) The step of selecting the calculation node (30) that processes the program in parallel with reference to 5) is a program for causing a computer to execute.

【0024】本発明の並列計算機システム(10)にお
ける計算ノードの選択用プログラムであって、更に、
(h) 前記計算ノード(30)のCPU(32)の負
荷率を確認するステップを備え、 前記計算ノード(3
0)の選択には、前記(h)の確認結果が用いられる。
A program for selecting a calculation node in the parallel computer system (10) of the present invention, further comprising:
(H) a step of confirming a load factor of the CPU (32) of the calculation node (30),
The confirmation result of the above (h) is used for the selection of 0).

【0025】本発明の並列計算機システム(10)にお
ける計算ノードの選択用プログラムであって、更に、
(i) 前記計算ノード(30)のCPU(32)の負
荷率と前記CPU(32)の計算能力を確認するステッ
プを備え、前記計算ノード(30)の選択には、前記
(i)の確認結果が用いられる。
A program for selecting a calculation node in the parallel computer system (10) of the present invention, further comprising:
(I) A step of confirming the load factor of the CPU (32) of the calculation node (30) and the calculation capacity of the CPU (32) is included, and the selection of the calculation node (30) includes confirmation of the above (i). The result is used.

【0026】[0026]

【発明の実施の形態】添付図面を参照して、本発明の並
列計算機システムの一実施形態を説明する。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of a parallel computer system of the present invention will be described with reference to the accompanying drawings.

【0027】図1は、本実施形態の並列計算機システム
を模式的に示すためのブロック図である。図3は、本実
施形態の並列計算機システムによる並列計算の実行手順
を示すフローチャートである。図4は、図3のフローチ
ャート中の「計算ノードの選択ステップ」を詳細に示す
フローチャートである。
FIG. 1 is a block diagram for schematically showing the parallel computer system of this embodiment. FIG. 3 is a flowchart showing an execution procedure of parallel calculation by the parallel computer system of this embodiment. FIG. 4 is a detailed flowchart of the “computing node selection step” in the flowchart of FIG.

【0028】まず、図3を参照して、本実施形態の並列
計算機システムによる並列計算の実行手順を説明する。
First, with reference to FIG. 3, a procedure for executing parallel calculation by the parallel computer system of this embodiment will be described.

【0029】ステップS1に示すように、マスターコン
ピュータ20は、前処理として、実行すべき解析計算プ
ログラムを複数個(N個)のジョブに分割する。分割さ
れたジョブの数と同数の計算ノード30が必要となる。
As shown in step S1, the master computer 20 divides the analysis calculation program to be executed into a plurality of (N) jobs as preprocessing. As many calculation nodes 30 as the number of divided jobs are required.

【0030】次に、ステップS2に示すように、マスタ
ーコンピュータ20は、N個の計算ノード30を選択す
る。この選択ステップにおいて、マスターコンピュータ
20は、その計算ノード30がそのジョブを計算できる
状態であるかを確認する必要がある。そのジョブの計算
途中で「異常終了」を発生するおそれのある計算ノード
30を事前に除外するためである。このステップS2の
内容については、後述する。
Next, as shown in step S2, the master computer 20 selects N calculation nodes 30. In this selection step, the master computer 20 needs to confirm whether the calculation node 30 is in a state capable of calculating the job. This is because the calculation nodes 30 that may cause “abnormal termination” during the calculation of the job are excluded in advance. The contents of step S2 will be described later.

【0031】次に、ステップS3に示すように、マスタ
ーコンピュータ20は、ステップS2にて選択された計
算ノード30にジョブの実行指令を送信する。なお、こ
こで、実行指令のみを送信するのは、計算ノード30
は、プログラム本体をマスターコンピュータ20の共有
ファイル25から読み込むためである。
Next, as shown in step S3, the master computer 20 sends a job execution command to the calculation node 30 selected in step S2. Note that, here, only the execution command is transmitted to the calculation node 30.
Is for reading the program body from the shared file 25 of the master computer 20.

【0032】次に、ステップS4に示すように、計算ノ
ード30は、受信したジョブを実行する。その受信した
プログラム中に「ファイル読み込み」のコマンドが含ま
れており、その読み込み先として「マスターコンピュー
タ20の共有ファイル25」が記述されている。計算ノ
ード30は、そのコマンドを実行して、マスターコンピ
ュータ20の共有ファイル25内のパラメータを参照し
ながら、そのジョブ(解析計算)を実行する。
Next, as shown in step S4, the computing node 30 executes the received job. The received program includes a "file read" command, and the "shared file 25 of the master computer 20" is described as the read destination. The calculation node 30 executes the command and executes the job (analysis calculation) while referring to the parameters in the shared file 25 of the master computer 20.

【0033】次に、上記の計算ノード30の選択ステッ
プ(ステップS2)について、図1および図4を参照し
て、説明する。
Next, the step of selecting the calculation node 30 (step S2) will be described with reference to FIGS.

【0034】科学技術を対象とした解析計算プログラム
を実行する並列計算機システム10には、パラメータ読
み込みおよび、計算結果の書き出しのための共有ディス
クスペース25が一般的に必要である。これは、後述す
るように、マスターコンピュータ20の一部を計算ノー
ド30でマウントすることにより行っている(図1の二
点鎖線M参照)。
The parallel computer system 10 that executes an analytical calculation program for science and technology generally needs a shared disk space 25 for reading parameters and writing calculation results. This is performed by mounting a part of the master computer 20 on the calculation node 30 as described later (see the chain double-dashed line M in FIG. 1).

【0035】本実施形態では、まず、上記マウントが正
常に行われているか否かをマスターコンピュータ20が
確認することで、その計算ノード30が解析プログラム
のジョブを実行可能であるか否かの判断の指針とする
(図4の第1ステップS11)。
In the present embodiment, first, the master computer 20 confirms whether or not the mount is normally performed, thereby determining whether or not the computing node 30 can execute the job of the analysis program. As a guideline (first step S11 in FIG. 4).

【0036】マスターコンピュータ20は、計算ノード
30がマスターコンピュータ20の共有ファイル25に
有るファイルのパラメータ等を読める状態であることを
確認してから、解析プログラムのジョブをその計算ノー
ド30に送る。これにより、その計算ノード30が解析
プログラムのジョブを実行できないという事態の多くが
回避される。
The master computer 20 confirms that the calculation node 30 can read the parameters of the file in the shared file 25 of the master computer 20, and then sends the job of the analysis program to the calculation node 30. This avoids many situations where the computing node 30 cannot execute the job of the analysis program.

【0037】計算ノード30がマスターコンピュータ2
0の共有ファイル25を読める状態にあるか否かをマス
ターコンピュータ20が判断するためには、マスターコ
ンピュータ20は、マスターコンピュータ20のファイ
ル25が計算ノード30の一部として認識されているか
否かを確認する。
The calculation node 30 is the master computer 2
In order for the master computer 20 to determine whether or not the shared file 25 of 0 can be read, the master computer 20 determines whether or not the file 25 of the master computer 20 is recognized as a part of the computing node 30. Check.

【0038】即ち、マスターコンピュータ20の共有デ
ィスクスペース25の部分が計算ノード30にマウント
されているか否かの確認をマスターコンピュータ20が
行う(ステップS11、S12)。
That is, the master computer 20 confirms whether or not the shared disk space 25 of the master computer 20 is mounted on the computing node 30 (steps S11 and S12).

【0039】ここで、「計算ノード30にマウントされ
ている」とは、実在のデータ(解析プログラムのパラメ
ータ等)はマスターコンピュータ20のHDD22のう
ちの計算ノード30がアクセス可能な共有ファイル25
に存在し(格納され)、計算ノード30には存在しない
(格納されていない)が、その計算ノード30は、その
マスターコンピュータ20のHDD22内の計算ノード
30がアクセス可能な共有ファイル25の存在は認識し
ているという意味である。
Here, "mounted on the calculation node 30" means that the actual data (parameters of the analysis program, etc.) is a shared file 25 accessible to the calculation node 30 in the HDD 22 of the master computer 20.
Exists (stored) in the calculation node 30 and does not exist (is not stored) in the calculation node 30, the calculation node 30 does not have the shared file 25 accessible to the calculation node 30 in the HDD 22 of the master computer 20. It means being aware.

【0040】マスターコンピュータ20は、計算ノード
30が有するファイルシステムが何であるか(計算ノー
ド30がどういうファイルデバイスを有しているか)
を、計算ノード30に問い合わせるためのコマンドを有
している。
The master computer 20 determines what file system the computing node 30 has (what kind of file device the computing node 30 has).
With a command to inquire of the computing node 30.

【0041】マスターコンピュータ20がそのコマンド
を実行した結果、計算ノード30内に、マスターコンピ
ュータ20の共有ファイル25のディレクトリがある
(マウントされている)ことが確認できれば、その計算
ノード30は、マスターコンピュータ20の共有ファイ
ル25内のパラメータを用いた解析プログラムを実行可
能であるとマスターコンピュータ20は判断する(ステ
ップS12−Y)。その確認は、マスターコンピュータ
20が同コマンドの実行時に、マスターコンピュータ2
0の共有ファイル25のディレクトリが計算ノード30
から応答として返ってくることで行うことができる。
As a result of the master computer 20 executing the command, if it is confirmed that the directory of the shared file 25 of the master computer 20 exists (is mounted) in the compute node 30, the compute node 30 becomes the master computer. The master computer 20 determines that the analysis program using the parameters in the shared file 25 of 20 can be executed (step S12-Y). The confirmation is made by the master computer 2 when the master computer 20 executes the command.
The shared file 25 directory of 0 is the calculation node 30
It can be done by returning as a response from.

【0042】図2に示すように、計算ノード30内にお
いて、複数存在するファイルデバイスの一つに「ネット
ワーク」ファイルがあり、その「ネットワーク」の一部
に、マスターコンピュータ20の共有ディスク25が見
えて(接続されて)いれば、その計算ノード30のマウ
ントは正常である。
As shown in FIG. 2, a "network" file exists in one of a plurality of file devices existing in the computing node 30, and the shared disk 25 of the master computer 20 can be seen in a part of the "network". If it is connected (connected), the mount of the compute node 30 is normal.

【0043】マスターコンピュータ20は、ステップS
12の判断の結果、その計算ノード30のマウントが正
常ではないと判断すると、その計算ノード30を図3の
選択ステップS2の選択対象から除外する(ステップS
12−N)。
The master computer 20 executes step S
As a result of the determination of 12, when it is determined that the mount of the calculation node 30 is not normal, the calculation node 30 is excluded from the selection target of the selection step S2 of FIG. 3 (step S
12-N).

【0044】なお、計算ノード30がその並列計算機シ
ステム10内で正常であれば、その計算ノード30が起
動した時点で、マスターコンピュータ20内の共有ファ
イル25を自動的にマウントするようになっている。
If the computing node 30 is normal in the parallel computer system 10, the shared file 25 in the master computer 20 is automatically mounted when the computing node 30 is started. .

【0045】マスターコンピュータ20のハードディス
ク(HDD)22の中の共有ファイル(ディレクトリ)
25が計算ノード30にマウントされていることが確認
されれば、並列計算機システム10のネットワークにお
いて、その計算ノード30とマスターコンピュータ20
との通信が正常であることも併せて確認することができ
る。そのマウントは、並列計算機システム10のネット
ワーク上で行われるからである。
Shared file (directory) in the hard disk (HDD) 22 of the master computer 20
If it is confirmed that 25 is mounted on the computing node 30, the computing node 30 and the master computer 20 in the network of the parallel computer system 10
It can also be confirmed that the communication with is normal. This is because the mounting is performed on the network of the parallel computer system 10.

【0046】次に、マスターコンピュータ20は、計算
ノード30のメモリの空き容量を問い合わせ、その問い
合わせの結果として得られた、メモリの空き容量に基づ
いて、その計算ノード30がジョブを実行可能であるか
否かを判断する(図4の第2ステップS14)。
Next, the master computer 20 inquires about the free memory capacity of the calculation node 30, and based on the free memory capacity obtained as a result of the inquiry, the calculation node 30 can execute the job. It is determined whether or not (second step S14 in FIG. 4).

【0047】解析計算プログラムには、多くのメモリを
必要とするものがある。マスターコンピュータ20は、
計算ノード30にそのメモリ(図2の符号31)の空き
容量を問い合わせ、そのメモリ31の空き容量により、
その計算ノード30がジョブを実行可能であるかを判断
する(ステップS14、S15)。
Some analysis calculation programs require a large amount of memory. The master computer 20
The computing node 30 is inquired about the free space of the memory (reference numeral 31 in FIG. 2), and the free space of the memory 31
It is determined whether the calculation node 30 can execute the job (steps S14 and S15).

【0048】マスターコンピュータ20は、その計算ノ
ード30に実行させる予定のジョブの負荷ないし演算量
に応じて、問い合わせて分かったメモリ31の空き容量
で問題無いか(足りているか)否かを決定する(ステッ
プS15)。
The master computer 20 determines whether or not there is no problem (is sufficient) in the free space of the memory 31 found by inquiry, according to the load or the amount of calculation of the job to be executed by the calculation node 30. (Step S15).

【0049】マスターコンピュータ20は、ステップS
15の判断の結果、その計算ノード30のマウントが正
常ではないと判断すると、その計算ノード30を図3の
選択ステップS2の選択対象から除外する(ステップS
15−N)。
The master computer 20 executes step S
As a result of the determination of 15, when it is determined that the mount of the calculation node 30 is not normal, the calculation node 30 is excluded from the selection target of the selection step S2 of FIG. 3 (step S
15-N).

【0050】これにより、マスターコンピュータ20
は、並列計算機システム10全体として、プログラム起
動後、そのプログラムを実行不可能となる障害を取り除
くことができる。
As a result, the master computer 20
As a whole, the parallel computer system 10 can eliminate the obstacle that makes the program inexecutable after the program is started.

【0051】なお、上記実施形態において、「計算ノー
ド30にマウントが正常に行われているか否かの確認」
(第1ステップS11,S12)および「空きメモリ容
量の問い合わせ」(第2ステップS14,S15)は、
いずれか一方のみを行うだけで済ますことができる。そ
の一方だけで、ジョブを実行不可能な計算ノード30の
排除という効果を得ることができる。その両方を行え
ば、上記効果が大きいのは勿論である。
It should be noted that in the above embodiment, "confirmation of whether mounting is normally performed on the computing node 30".
(First step S11, S12) and "Query free memory capacity" (second step S14, S15)
You only have to do one or the other. With only one of them, it is possible to obtain the effect of eliminating the computing node 30 that cannot execute the job. Needless to say, if both of them are performed, the above effect is great.

【0052】次に、「計算ノード30にマウントが正常
に行われているか否かの確認」(第1ステップS11,
S12)および「空きメモリ容量の問い合わせ」(第2
ステップS14,S15)の少なくとも一方を行った結
果、その条件(またはそれらの条件)を満足する計算ノ
ード30が複数存在した場合には、以下の方法(第3ス
テップS16,S17)により、ジョブを分担させる計
算ノード30を決定する。
Next, "confirm whether mount is normally performed on the computing node 30" (first step S11,
S12) and "Inquiry about free memory capacity" (second
As a result of performing at least one of steps S14 and S15), when there are a plurality of calculation nodes 30 satisfying the condition (or those conditions), the job is executed by the following method (third steps S16 and S17). The calculation node 30 to be shared is determined.

【0053】マスターコンピュータ20は、上記条件を
満足する複数の計算ノード30のそれぞれのCPU(図
2の符号32)の負荷率(アイドル状態の割合)を、各
計算ノード30のOSに問い合わせる。次いで、マスタ
ーコンピュータ20は、それぞれの計算ノード30のC
PU32の負荷率が求められたら、その負荷率が低い方
からソートする。マスターコンピュータ20は、そのソ
ートの結果に基づいて、分担させるべきジョブに応じ
て、適切な計算ノード30を選択することができる。
The master computer 20 inquires the OS of each computing node 30 about the load factor (percentage of idle state) of each CPU (reference numeral 32 in FIG. 2) of the plurality of computing nodes 30 satisfying the above conditions. Then, the master computer 20 sends C to each computing node 30.
If the load factor of PU32 is calculated | required, it will sort from the one with the low load factor. The master computer 20 can select an appropriate calculation node 30 according to the jobs to be shared based on the result of the sorting.

【0054】マスターコンピュータ20は、そのソート
の結果、負荷率が低い方から上記N番目以内の計算ノー
ド30を、図3の選択ステップS2の選択対象とする
(ステップS17−Y)。一方、マスターコンピュータ
20は、そのソートの結果、上記N番目以内でない計算
ノード30は、図3の選択ステップS2の選択対象から
除外する(ステップS17−N)。
As a result of the sorting, the master computer 20 sets the N or less calculation nodes 30 from the one having the lowest load factor as the selection target in the selection step S2 of FIG. 3 (step S17-Y). On the other hand, as a result of the sorting, the master computer 20 excludes the calculation nodes 30 that are not within the Nth from the selection target of the selection step S2 of FIG. 3 (step S17-N).

【0055】あるCPU32が負荷の大きなプログラム
を実行しているときには、使用するメモリ31の容量が
多いケースが一般的であるため、上記の「空きメモリ容
量の問い合わせ」のステップ(第2ステップ)にて、そ
のCPU32を有する計算ノード30は、ジョブを実行
不可能であるとして認定されることが多い。しかしなが
ら、使用するメモリ31の容量は少ないがCPU32の
負荷が大きく、ジョブの分担に適さない場合もある。そ
のため、第3ステップにて、「CPUの負荷」を求めて
ジョブの分担を決めることが有効である。
When a certain CPU 32 is executing a program with a large load, the memory 31 to be used generally has a large capacity. Therefore, the above step (second step) of "query for free memory capacity" is performed. Thus, the computing node 30 having the CPU 32 is often certified as being incapable of executing a job. However, although the capacity of the memory 31 to be used is small, the load on the CPU 32 is large, and it may not be suitable for job sharing. Therefore, in the third step, it is effective to determine the load of the job by obtaining the “CPU load”.

【0056】また、マスターコンピュータ20は、計算
ノード30のCPU32の負荷の問い合わせを、その計
算ノード30における解析プログラムを実行を制御する
特定のスケジューリングソフトウェアに対して行うので
はなく、その計算ノード30のOSに対して直接問い合
わせる形をとる。そのため、その計算ノード30内で複
数のプログラムがそれぞれ複数のアプリケーションソフ
トで実行中であっても、そのCPU32の負荷を正確に
把握することができる。
Further, the master computer 20 does not inquire the load of the CPU 32 of the calculation node 30 with respect to the specific scheduling software that controls the execution of the analysis program in the calculation node 30, but rather with respect to the calculation node 30. It takes the form of inquiring directly to the OS. Therefore, even if a plurality of programs are being executed by a plurality of application software in the calculation node 30, the load on the CPU 32 can be accurately grasped.

【0057】ここで、複数の計算ノード30において、
能力の異なるCPU32が混在した場合に対応するた
め、ステップS16では、各CPU32の負荷率にその
CPU32のスペック値(クロック周波数など)を掛け
合わせてなる値を求め、それらの値をソートすることで
能力の適性な評価を実現することができる。
Here, in the plurality of calculation nodes 30,
In order to deal with the case where the CPUs 32 having different abilities are mixed, in step S16, a value obtained by multiplying the load factor of each CPU 32 by the spec value (clock frequency etc.) of the CPU 32 is obtained, and the values are sorted. Appropriate evaluation of ability can be realized.

【0058】本実施形態の並列計算機システムによれ
ば、特別なプログラムの管理下で実行されるものではな
いため、広範囲なプログラムに対し適用可能である。
According to the parallel computer system of this embodiment, since it is not executed under the control of a special program, it can be applied to a wide range of programs.

【0059】[0059]

【発明の効果】本発明の並列計算機システムによれば、
システムの信頼性を向上させることができる。
According to the parallel computer system of the present invention,
The reliability of the system can be improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】図1は、本発明の並列計算機システムの一実施
形態を模式的に示すためのブロック図である。
FIG. 1 is a block diagram schematically showing an embodiment of a parallel computer system of the present invention.

【図2】図2は、本発明の並列計算機システムの一実施
形態における計算ノードの概略構成を示すブロック図で
ある。
FIG. 2 is a block diagram showing a schematic configuration of a computing node in one embodiment of the parallel computer system of the present invention.

【図3】図3は、本発明の並列計算機システムの一実施
形態における並列計算の実行手順を示すフローチャート
である。
FIG. 3 is a flowchart showing an execution procedure of parallel calculation in one embodiment of the parallel computer system of the present invention.

【図4】図4は、図3のフローチャート中の「計算ノー
ドの選択ステップ」を詳細に示すフローチャートであ
る。
4 is a flowchart showing in detail a "computing node selection step" in the flowchart of FIG.

【符号の説明】[Explanation of symbols]

10 並列計算機システム 20 マスターコンピュータ 22 ハードディスク 25 マスターコンピュータの共有ファイル 30 計算ノード 31 メモリ 32 CPU 10 Parallel computer system 20 master computer 22 hard disk 25 Master computer shared files 30 compute nodes 31 memory 32 CPU

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 マスターコンピュータと複数の計算ノー
ドとを備えた並列計算機システムであって、 前記複数の計算ノードのうちの選択された前記計算ノー
ドは、前記マスターコンピュータの共有ファイルを参照
して、プログラムを並列処理し、 前記計算ノードの前記選択は、当該前記計算ノードが前
記マスターコンピュータの前記共有ファイルを参照可能
か否かによって行われる並列計算機システム。
1. A parallel computer system comprising a master computer and a plurality of computing nodes, wherein the selected computing node among the plurality of computing nodes refers to a shared file of the master computer, A parallel computer system that processes programs in parallel, and the selection of the calculation node is performed depending on whether or not the calculation node can refer to the shared file of the master computer.
【請求項2】 請求項1記載の並列計算機システムにお
いて、 前記計算ノードの前記選択は、当該前記計算ノードによ
る前記マスターコンピュータの一部のマウントが正常で
あるか否かによって行われる並列計算機システム。
2. The parallel computer system according to claim 1, wherein the selection of the calculation node is performed depending on whether or not mounting of a part of the master computer by the calculation node is normal.
【請求項3】 請求項1または2に記載の並列計算機シ
ステムにおいて、 前記計算ノードの前記選択は、前記マスターコンピュー
タが行う並列計算機システム。
3. The parallel computer system according to claim 1, wherein the selection of the calculation node is performed by the master computer.
【請求項4】 マスターコンピュータと複数の計算ノー
ドとを備えた並列計算機システムであって、 前記複数の計算ノードのうちの選択された前記計算ノー
ドは、プログラムを並列処理し、 前記計算ノードの前記選択は、当該前記計算ノードのメ
モリの空き容量によって行われる並列計算機システム。
4. A parallel computer system comprising a master computer and a plurality of calculation nodes, wherein the selected calculation node of the plurality of calculation nodes processes a program in parallel, The parallel computer system is selected according to the free memory capacity of the computing node.
【請求項5】 マスターコンピュータと複数の計算ノー
ドとを備えた並列計算機システムであって、 前記複数の計算ノードのうちの選択された前記計算ノー
ドは、前記マスターコンピュータの共有ファイルを参照
して、プログラムを並列処理し、 前記計算ノードの前記選択は、当該前記計算ノードが前
記マスターコンピュータの前記共有ファイルを参照可能
か否かおよび当該前記計算ノードのメモリの空き容量に
よって行われる並列計算機システム。
5. A parallel computer system comprising a master computer and a plurality of computing nodes, wherein the selected computing node among the plurality of computing nodes refers to a shared file of the master computer, A parallel computer system in which a program is processed in parallel, and the selection of the calculation node is performed depending on whether or not the calculation node can refer to the shared file of the master computer and a free space of a memory of the calculation node.
【請求項6】 請求項5記載の並列計算機システムにお
いて、 前記計算ノードの前記選択は、前記マスターコンピュー
タが行う並列計算機システム。
6. The parallel computer system according to claim 5, wherein the selection of the calculation node is performed by the master computer.
【請求項7】 請求項1から6のいずれか1項に記載の
並列計算機システムにおいて、 前記計算ノードの前記選択は、更に、当該前記計算ノー
ドのCPUの負荷率によって行われる並列計算機システ
ム。
7. The parallel computer system according to claim 1, wherein the selection of the calculation node is further performed by a load factor of a CPU of the calculation node.
【請求項8】 請求項1から6のいずれか1項に記載の
並列計算機システムにおいて、 前記計算ノードの前記選択は、更に、当該前記計算ノー
ドの前記CPUの負荷率と前記CPUの計算能力とに基
づいて、行われる並列計算機システム。
8. The parallel computer system according to claim 1, wherein the selection of the calculation node further includes a load factor of the CPU of the calculation node and a calculation capacity of the CPU. A parallel computer system based on.
【請求項9】 マスターコンピュータと複数の計算ノー
ドとを備えた並列計算機システムにおける計算ノードの
選択用プログラムであって、(a) 前記計算ノードが
前記マスターコンピュータの前記共有ファイルを参照可
能か否かを確認するステップと、(b) 前記(a)の
確認結果によって、前記複数の計算ノードのうちから、
前記マスターコンピュータの共有ファイルを参照してプ
ログラムを並列処理する前記計算ノードを選択するステ
ップとをコンピュータに実行させるための並列計算機シ
ステムにおける計算ノードの選択用プログラム。
9. A program for selecting a computing node in a parallel computer system including a master computer and a plurality of computing nodes, comprising: (a) whether the computing node can refer to the shared file of the master computer. And (b) from the plurality of computation nodes according to the confirmation result of (b) above,
A program for selecting a calculation node in a parallel computer system for causing a computer to execute the step of selecting the calculation node that processes a program in parallel by referring to a shared file of the master computer.
【請求項10】 請求項9記載の並列計算機システムに
おける計算ノードの選択用プログラムにおいて、 前記(a)は、当該前記計算ノードによる前記マスター
コンピュータの一部のマウントが正常であるか否かによ
って行われる並列計算機システムにおける計算ノードの
選択用プログラム。
10. The program for selecting a calculation node in a parallel computer system according to claim 9, wherein the (a) is performed depending on whether or not mounting of a part of the master computer by the calculation node is normal. A program for selecting computing nodes in a parallel computer system.
【請求項11】 請求項9または10に記載の並列計算
機システムにおける計算ノードの選択用プログラムにお
いて、 前記(a)および前記(b)は、前記マスターコンピュ
ータが行う並列計算機システムにおける計算ノードの選
択用プログラム。
11. The program for selecting a computing node in a parallel computer system according to claim 9 or 10, wherein (a) and (b) are for selecting a computing node in the parallel computer system performed by the master computer. program.
【請求項12】 マスターコンピュータと複数の計算ノ
ードとを備えた並列計算機システムにおける計算ノード
の選択用プログラムであって、(c) 前記計算ノード
の前記計算ノードのメモリの空き容量を確認するステッ
プと、(d) 前記(c)の確認結果によって、前記複
数の計算ノードのうちから、プログラムを並列処理する
前記計算ノードを選択するステップとをコンピュータに
実行させるための並列計算機システムにおける計算ノー
ドの選択用プログラム。
12. A program for selecting a computing node in a parallel computer system comprising a master computer and a plurality of computing nodes, comprising the step of: (c) checking the free capacity of the memory of the computing node of the computing node. , (D) selecting a calculation node that performs parallel processing of a program from among the plurality of calculation nodes according to the confirmation result of (c), and selecting a calculation node in a parallel computer system For programs.
【請求項13】 マスターコンピュータと複数の計算ノ
ードとを備えた並列計算機システムにおける計算ノード
の選択用プログラムであって、(e) 前記計算ノード
が前記マスターコンピュータの前記共有ファイルを参照
可能か否かを確認するステップと、(f) 前記計算ノ
ードの前記計算ノードのメモリの空き容量を確認するス
テップと、(g) 前記(e)および前記(f)の確認
結果によって、前記複数の計算ノードのうちから、前記
マスターコンピュータの共有ファイルを参照してプログ
ラムを並列処理する前記計算ノードを選択するステップ
とをコンピュータに実行させるための並列計算機システ
ムにおける計算ノードの選択用プログラム。
13. A program for selecting a computing node in a parallel computer system comprising a master computer and a plurality of computing nodes, comprising: (e) whether the computing node can refer to the shared file of the master computer. And (f) checking the free space of the memory of the computing node of the computing node, and (g) confirming the result of the (e) and (f) of the plurality of computing nodes. A program for selecting a computing node in a parallel computer system for causing a computer to execute the step of selecting the computing node that processes a program in parallel by referring to a shared file of the master computer.
【請求項14】 請求項9から13のいずれか1項に記
載の並列計算機システムにおける計算ノードの選択用プ
ログラムであって、 更に、(h) 前記計算ノードのCPUの負荷率を確認
するステップを備え、前記計算ノードの選択には、前記
(h)の確認結果が用いられる並列計算機システムにお
ける計算ノードの選択用プログラム。
14. A program for selecting a computing node in the parallel computer system according to claim 9, further comprising (h) a step of confirming a CPU load factor of the computing node. A program for selecting a calculation node in a parallel computer system, wherein the confirmation result of (h) is used to select the calculation node.
【請求項15】 請求項9から13のいずれか1項に記
載の並列計算機システムにおける計算ノードの選択用プ
ログラムであって、 更に、(i) 前記計算ノードのCPUの負荷率と前記
CPUの計算能力を確認するステップを備え、 前記計算ノードの選択には、前記(i)の確認結果が用
いられる並列計算機システムにおける計算ノードの選択
用プログラム。
15. A program for selecting a calculation node in the parallel computer system according to claim 9, further comprising (i) a CPU load factor of the calculation node and a calculation of the CPU. A program for selecting a calculation node in a parallel computer system, comprising a step of confirming an ability, wherein the selection result of (i) is used for the selection of the calculation node.
JP2002001552A 2002-01-08 2002-01-08 Parallel computer system, and program for selecting calculation node in parallel computer system Withdrawn JP2003203061A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002001552A JP2003203061A (en) 2002-01-08 2002-01-08 Parallel computer system, and program for selecting calculation node in parallel computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002001552A JP2003203061A (en) 2002-01-08 2002-01-08 Parallel computer system, and program for selecting calculation node in parallel computer system

Publications (1)

Publication Number Publication Date
JP2003203061A true JP2003203061A (en) 2003-07-18

Family

ID=27641648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002001552A Withdrawn JP2003203061A (en) 2002-01-08 2002-01-08 Parallel computer system, and program for selecting calculation node in parallel computer system

Country Status (1)

Country Link
JP (1) JP2003203061A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006137223A1 (en) * 2005-06-22 2006-12-28 Nec Corporation Debug system, debug method, and program
US7870424B2 (en) 2006-11-14 2011-01-11 Honda Motor Co., Ltd. Parallel computer system
JP2016224832A (en) * 2015-06-03 2016-12-28 富士通株式会社 Dump management device, dump management program, and dump management method
WO2023188259A1 (en) * 2022-03-31 2023-10-05 日本電信電話株式会社 Secret global model computation device, secret global module computation system configuration method, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006137223A1 (en) * 2005-06-22 2006-12-28 Nec Corporation Debug system, debug method, and program
CN101208667B (en) * 2005-06-22 2012-01-11 日本电气株式会社 Debug system and debug method
JP5163120B2 (en) * 2005-06-22 2013-03-13 日本電気株式会社 Debug system, debugging method, and program
US8589879B2 (en) 2005-06-22 2013-11-19 Nec Corporation Debugging system, debugging method, and program
US7870424B2 (en) 2006-11-14 2011-01-11 Honda Motor Co., Ltd. Parallel computer system
JP2016224832A (en) * 2015-06-03 2016-12-28 富士通株式会社 Dump management device, dump management program, and dump management method
WO2023188259A1 (en) * 2022-03-31 2023-10-05 日本電信電話株式会社 Secret global model computation device, secret global module computation system configuration method, and program

Similar Documents

Publication Publication Date Title
US7810099B2 (en) Optimizing workflow execution against a heterogeneous grid computing topology
US9547529B2 (en) Finding resource bottlenecks with low-frequency sampled data
Elmroth et al. A grid resource broker supporting advance reservations and benchmark-based resource selection
US8782657B2 (en) Dynamic creation and destruction of IO resources based on actual load and resource availability
WO2007023726A1 (en) Information processing system
US20050034130A1 (en) Balancing workload of a grid computing environment
US20040167959A1 (en) Autonomic service routing using observed resource requirement for self-optimization
WO2006100752A1 (en) Distributed processing management device, distributed processing management method, and distributed processing management program
US20070226743A1 (en) Parallel-distributed-processing program and parallel-distributed-processing system
KR101770191B1 (en) Resource allocation and apparatus
US20210096913A1 (en) Cloud application scaler
KR20140117905A (en) Virtual machine allcoation of cloud service for fuzzy logic driven virtual machine resource evaluation apparatus and method
US9652294B2 (en) Cross-platform workload processing
US20120144039A1 (en) Computing scheduling using resource lend and borrow
US8463886B2 (en) Method and apparatus for distributed computing, and computer product
JP2003203061A (en) Parallel computer system, and program for selecting calculation node in parallel computer system
CN111193774A (en) Method and system for improving throughput of server system and server system
JP5045576B2 (en) Multiprocessor system and program execution method
JPH0793262A (en) Application tool execution managing system
JP2003084989A (en) Priority dynamic control system, priority dynamic control method, and priority dynamic control program
JP2005107632A (en) Eai server, and program for eai server
JP2000259591A (en) Distributed processing job execution method and network system
JP5056346B2 (en) Information processing apparatus, information processing system, virtual server movement processing control method, and program
JP2005107824A (en) Eai server, and program for eai server
JPH1011406A (en) Method for job execution in decentralized environment of resource

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405