JP2002123497A - Parallel calculating device, analyzing method and recording medium with analysis program recorded thereon - Google Patents

Parallel calculating device, analyzing method and recording medium with analysis program recorded thereon

Info

Publication number
JP2002123497A
JP2002123497A JP2000315473A JP2000315473A JP2002123497A JP 2002123497 A JP2002123497 A JP 2002123497A JP 2000315473 A JP2000315473 A JP 2000315473A JP 2000315473 A JP2000315473 A JP 2000315473A JP 2002123497 A JP2002123497 A JP 2002123497A
Authority
JP
Japan
Prior art keywords
analysis
boundary data
slave
slave devices
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000315473A
Other languages
Japanese (ja)
Inventor
Katsuya Taigo
克哉 太呉
Hideo Fukuda
秀朗 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2000315473A priority Critical patent/JP2002123497A/en
Publication of JP2002123497A publication Critical patent/JP2002123497A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain a parallel calculating device capable of realizing the acceleration of analysis processing without increasing the communication load of a master unit even if realizing high paralleling by increasing the number of slave units. SOLUTION: The process to be carried out by each slave unit includes a reception waiting shifting step in which shift is made to a reception waiting state, an analysis operation step for performing an analysis operation for a self area, a boundary data transmitting step in which boundary data obtained from operation results are transmitted to all slave units for analyzing adjacent areas, a repeating operation step in which the analysis operation of the self area is performed again by using all boundary data after receiving the boundary data form all of the slave units and boundary data transfer and the analysis operation are hereafter repeatedly performed until the boundary value of each area is converged, and an analysis end notification transmitting step in which notification for notifying the end of the analysis processing is transmitted to the master unit.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、マスタ装置と複数
のスレープ装置で構成される並列計算機装置に関するも
のであり、特に、ボイラ等の熱流動解析や船舶等の航行
性能解析を行うための並列計算機およびその解析方法に
関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel computer device comprising a master device and a plurality of slave devices, and more particularly to a parallel computer device for analyzing heat flow of a boiler or the like and navigation performance analysis of a ship or the like. The present invention relates to a computer and an analysis method thereof.

【0002】[0002]

【従来の技術】以下、従来の並列計算機装置について説
明する。たとえば、ボイラ等の燃焼機器の差別化を推進
するためには、熱流動解析の更なる高度化が必要である
が、高度化を進めればその分計算負荷が大きくなる。具
体的にいうと、現状の燃焼計算においては、1ケースあ
たりワークステーション(DEC Alpha)を用い
て、たとえば、2〜4週間を必要とする。この計算にか
かる期間を短縮するためには、計算機の高度化が不可欠
となるが、性能の高いコンピュータは値段が高くなるた
め、安価で高速な演算を行う計算機環境の整備が急務と
なる。
2. Description of the Related Art A conventional parallel computer will be described below. For example, in order to promote the differentiation of combustion equipment such as a boiler, it is necessary to further enhance the heat flow analysis, but as the advancement proceeds, the calculation load increases accordingly. More specifically, the current combustion calculation requires, for example, two to four weeks using a workstation (DEC Alpha) per case. In order to shorten the time required for the calculation, it is necessary to upgrade the computer. However, since a high-performance computer is expensive, it is urgently necessary to prepare a computer environment for performing a low-cost and high-speed operation.

【0003】そこで、安価で高速な計算機を、コストパ
フォーマンスの高いPCクラスタで並列計算機を構成す
ることが有効となるが、高速化を実現するためには高並
列化が必要であり、高並列化を実現するためには高並列
に対応した通信方法の開発が必要となる。
Therefore, it is effective to configure an inexpensive and high-speed computer with a PC cluster having high cost performance. However, in order to realize high speed, high parallelization is required. In order to realize this, it is necessary to develop a communication method that supports high parallelism.

【0004】以降、従来のPCクラスタによる高並列計
算機の動作について説明する。基本的に、従来は、マス
タ装置として動作する計算機から起動された個々のスレ
ーブ装置が、自装置に割り当てられたボイラ内の所定領
域について、熱流動解析演算を行う(領域分割法)。こ
の方法では、スレーブ装置の通信相手はマスタ装置に固
定しており、送受信順序も固定しているため、デッドロ
ックを起こすことはない。図13は、従来の解析方法を
示すフローチャートである。
[0004] The operation of a highly parallel computer using a conventional PC cluster will be described below. Basically, conventionally, each slave device started from a computer operating as a master device performs a heat-fluid analysis operation on a predetermined region in a boiler assigned to the own device (region division method). In this method, the communication partner of the slave device is fixed to the master device, and the order of transmission and reception is fixed, so that deadlock does not occur. FIG. 13 is a flowchart showing a conventional analysis method.

【0005】まず、マスタ装置では、すべてのスレーブ
装置に対して、熱流動解析を行うために必要な初期値を
送信し(ステップS101)、スレーブ装置からの応
答、すなわち、当該スレーブ装置に割り当てられた領域
の境界データ(当該領域に隣接する領域の熱流動解析を
行うスレーブ装置の入力情報となる)の受信を待つ(ス
テップS102)。
[0005] First, the master device transmits an initial value necessary for performing a heat and fluid analysis to all slave devices (step S101), and a response from the slave device, that is, a value assigned to the slave device. It waits for reception of boundary data of the region (which will be input information of a slave device that performs a heat flow analysis of a region adjacent to the region) (step S102).

【0006】その後、マスタ装置では、最初のスレーブ
装置からの境界データを受け取ると(ステップS10
3,No)、さらに、残りのスレーブ装置からの境界デ
ータの受信を待ち(ステップS102)、すべてのスレ
ーブ装置からの境界データの受信を確認できた段階で
(ステップS103,Yes)、受け取った境界データ
を組み替え(ステップS104)、すべてのスレーブ装
置に対して当該境界データを送信する(ステップS10
5)。
Thereafter, when the master device receives the boundary data from the first slave device (step S10).
(3, No), and further waits for reception of boundary data from the remaining slave devices (step S102). When it is confirmed that boundary data has been received from all slave devices (step S103, Yes), the received boundary data is received. The data is rearranged (step S104), and the boundary data is transmitted to all slave devices (step S10).
5).

【0007】以降、境界データを用いた熱流動解析が完
了するまで(ステップS106,No)、上記ステップ
S102〜ステップS105の処理を繰り返し実行し、
各領域の境界値が収束し解析結果が得られた段階で(ス
テップS106,Yes)、マスタ装置における処理を
終了する、
[0007] Thereafter, until the heat and fluid analysis using the boundary data is completed (step S106, No), the processing of the above steps S102 to S105 is repeatedly executed.
When the boundary value of each area has converged and the analysis result has been obtained (Yes in step S106), the processing in the master device ends.

【0008】一方、各スレーブ装置では、上記マスタ装
置からの初期値を受信後(ステップS111)、自装置
に割り当てられた領域に対して熱流動解析演算を行う
(ステップS112)。そして、演算結果から得られる
境界データをマスタ装置に対して送信し(ステップS1
13)、その応答としてマスタ装置から最新の境界デー
タを受け取る(ステップS114)。
On the other hand, after receiving the initial value from the master device (step S111), each slave device performs a thermal-hydraulic analysis operation on the area assigned to the slave device (step S112). Then, the boundary data obtained from the calculation result is transmitted to the master device (step S1).
13), and receives the latest boundary data from the master device as a response (step S114).

【0009】この段階で各スレーブ装置は、各領域の境
界値が収束したかどうかを確認し、収束していないので
あれば(ステップS115,No)、各領域の境界値が
収束するまで、上記ステップS112〜ステップS11
4の処理を繰り返し実行し、収束した段階で(ステップ
S115,Yes)、スレーブ装置における処理を終了
する。
At this stage, each slave device checks whether or not the boundary value of each area has converged. If the boundary value has not converged (step S115, No), the above-described slave apparatus continues until the boundary value of each area converges. Step S112 to step S11
The processing of Step 4 is repeatedly executed, and when the convergence is achieved (Step S115, Yes), the processing in the slave device ends.

【0010】[0010]

【発明が解決しようとする課題】しかしながら、上記、
従来の並列計算装置においては、高並列化にしたがっ
て、すなわち、スレーブ装置の数が増えるにしたがっ
て、マスタ装置の送信相手が増加し、結果的にマスタ装
置の通信負荷が増大するため、所望の通信速度が得られ
ない、という問題があった。
SUMMARY OF THE INVENTION However,
In the conventional parallel computing device, as the number of slave devices increases, the number of transmission destinations of the master device increases, and as a result, the communication load on the master device increases. There was a problem that speed could not be obtained.

【0011】具体的にいうと、従来の並列計算装置で
は、境界データの転送をすべてマスタ装置に制御させる
こととしたため、スレーブ装置の待ち時間が長くなり、
所望の通信速度が得られない、という結果を招くことと
なった。
More specifically, in the conventional parallel computing device, since the transfer of boundary data is all controlled by the master device, the waiting time of the slave device becomes longer,
As a result, a desired communication speed cannot be obtained.

【0012】本発明は、上記に鑑みてなされたものであ
って、スレーブ装置の数を増やし高並列化を実現した場
合においても、マスタ装置の通信負荷を増大させること
なく、解析処理の高速化を実現可能な並列計算装置を提
供することを目的とする。
The present invention has been made in view of the above, and even when the number of slave devices is increased to achieve high parallelism, the speed of analysis processing can be increased without increasing the communication load on the master device. It is an object of the present invention to provide a parallel computing device capable of realizing the above.

【0013】[0013]

【課題を解決するための手段】上述した課題を解決し、
目的を達成するために、請求項1に記載の並列計算装置
にあっては、領域分割法を採用し、隣接する領域が割り
当てられたスレーブ装置間で境界データの受け渡しを行
うことにより所定の解析処理を行う構成とし、さらに、
マスタ装置が、すべてのスレーブ装置に対して前記解析
処理を行うために必要な初期値を送信し、一方、初期値
を受け取った前記スレーブ装置が、隣接する領域を解析
する他のスレーブ装置からの境界データを待つ受信待ち
状態に移行し、その後、自領域の解析演算を行い、前記
演算結果から得られる境界データを、隣接する領域を解
析するすべてのスレーブ装置に対して送信し、隣接する
領域を解析するすべてのスレーブ装置から境界データを
受け取った後、当該すべての境界データを用いて、再
度、自領域の解析演算を行い、以降、各領域の境界値が
収束するまで、境界データの受け渡しおよび解析演算を
繰り返し実行し、各領域の境界値が収束した段階で、解
析処理の終了を知らせるための通知を前記マスタ装置に
対して送信し、最後に、前記マスタ装置が、すべてのス
レーブ装置から前記通知を受け取った段階で、すべての
処理を終了することを特徴とする。
Means for Solving the Problems The above-mentioned problems are solved,
In order to achieve the object, in the parallel computing device according to claim 1, a predetermined analysis is performed by adopting a region division method and transferring boundary data between slave devices to which adjacent regions are assigned. Processing, and
The master device transmits an initial value necessary for performing the analysis processing to all slave devices, while the slave device that has received the initial value transmits the initial value from another slave device that analyzes an adjacent area. The state shifts to a reception waiting state for waiting for boundary data, and thereafter, an analysis operation of the own area is performed, and boundary data obtained from the operation result is transmitted to all slave devices analyzing the adjacent area, and the adjacent area is analyzed. After receiving the boundary data from all the slave devices, the analysis operation of the own area is performed again using all the boundary data, and thereafter, the boundary data is transferred until the boundary value of each area converges. And repeatedly execute the analysis operation, and at the stage when the boundary value of each area has converged, transmit a notification for notifying the end of the analysis processing to the master device. , The master device, at all stages that received the notification from the slave device, characterized in that the whole process is terminated.

【0014】この発明によれば、マスタ装置を介さずに
スレーブ装置間で境界データを送受信する。具体的にい
うと、各スレーブ装置が、自装置に割り当てられた領域
に対して解析演算を行い、演算結果から得られる境界デ
ータを、隣接する領域を解析するすべてのスレーブ装置
に対して直接送信する。
According to the present invention, boundary data is transmitted and received between slave devices without passing through the master device. Specifically, each slave device performs an analysis operation on an area assigned to itself, and transmits boundary data obtained from the operation result directly to all slave devices that analyze an adjacent region. I do.

【0015】請求項2に記載の並列計算装置にあって
は、前記マスタ装置が、初期設定時に、各スレーブ装置
間で直接通信相手を指定して境界データを転送するため
の送受信相手テーブルを作成し、その後、すべてのスレ
ーブ装置に対して当該テーブルを含む初期値を送信し、
前記スレーブ装置が、前記演算結果から得られる境界デ
ータを、前記テーブルに基づいて、隣接する領域を解析
するすべてのスレーブ装置に対して送信することを特徴
とする。
In the parallel computing device according to the second aspect, the master device creates a transmission / reception partner table for transferring boundary data by directly designating a communication partner between the slave devices at the time of initialization. After that, the initial value including the table is transmitted to all slave devices,
The slave device transmits boundary data obtained from the calculation result to all slave devices that analyze an adjacent area based on the table.

【0016】この発明によれば、解析演算結果から得ら
れる境界データを、送受信相手テーブルに基づいて、ス
レーブ装置間で送受信する。
According to the present invention, the boundary data obtained from the analysis operation result is transmitted and received between the slave devices based on the transmission / reception partner table.

【0017】請求項3に記載の並列計算装置にあって
は、前記マスタ装置が、前記初期値を送信する前に、各
スレーブ装置内のCPUの負荷を計測し、当該計測結果
があらかじめ規定された所定の値より小さい場合に、解
析処理可能と判断し、逆に大きい場合に、当該CPUが
他のユーザに使用されていると判断し、必要数分の解析
処理可能なCPUを確保するまで、前記負荷計測を繰り
返し実行することを特徴とする。
In the parallel computing device according to the third aspect, the master device measures the load of the CPU in each slave device before transmitting the initial value, and the measurement result is defined in advance. If it is smaller than the predetermined value, it is determined that analysis processing is possible. Conversely, if it is larger, it is determined that the CPU is being used by another user, and a necessary number of analysis processing CPUs are secured. , Wherein the load measurement is repeatedly executed.

【0018】この発明によれば、解析演算処理の起動時
に、使用可能なCPUの検索を行い、あらかじめ必要数
のCPUを確保する。
According to the present invention, at the time of starting the analytic operation processing, a search for available CPUs is performed, and a necessary number of CPUs are secured in advance.

【0019】請求項4に記載の並列計算装置にあって
は、領域分割法を採用し、隣接する領域が割り当てられ
たスレーブ装置間で境界データの受け渡しを行うことに
より所定の解析処理を行う構成とし、マスタ装置が、す
べてのスレーブ装置に対して前記解析処理を行うために
必要な初期値を送信し、一方、初期値を受け取った前記
スレーブ装置が、隣接する領域を解析する他のスレーブ
装置からの境界データを待つ受信待ち状態に移行し、同
一スレーブ装置内の複数のCPUが、割り当てられた領
域を分割して解析演算を行い、前記演算結果から得られ
る境界データを、当該領域に隣接する領域を解析するす
べてのスレーブ装置に対して送信し、隣接する領域を解
析するすべてのスレーブ装置から境界データを受け取っ
た後、当該すべての境界データを用いて、再度、当該領
域の解析演算を行い、以降、各領域の境界値が収束する
まで、境界データの受け渡しおよび解析演算を繰り返し
実行し、各領域の境界値が収束した段階で、解析処理の
終了を知らせるための通知を前記マスタ装置に対して送
信し、最後に、前記マスタ装置が、すべてのスレーブ装
置から前記通知を受け取った段階で、すべての処理を終
了することを特徴とする。
According to a fourth aspect of the present invention, in the parallel computing device, a predetermined analysis process is performed by exchanging boundary data between slave devices to which adjacent regions are allocated by adopting a region division method. And the master device transmits an initial value necessary for performing the analysis processing to all slave devices, while the slave device that has received the initial value transmits another initial value to another slave device that analyzes an adjacent area. Transitions to a reception waiting state waiting for boundary data from the plurality of CPUs, and a plurality of CPUs in the same slave device divide the allocated area and perform an analysis operation, and transfer boundary data obtained from the operation result to the adjacent area. After transmitting to all the slave devices analyzing the region to be analyzed and receiving boundary data from all the slave devices analyzing the adjacent region, Using the boundary data, the analysis operation of the region is performed again, and thereafter, the transfer and analysis operation of the boundary data are repeatedly executed until the boundary value of each region converges, and when the boundary value of each region converges, Transmitting a notification for notifying the end of the analysis process to the master device, and finally, when the master device receives the notification from all the slave devices, ends all the processes. And

【0020】この発明によれば、複数のCPUと共有メ
モリを持つ計算機が、1つの領域を分担して演算処理を
行い、同一計算機内のCPU間通信を行わずに、オーバ
ーヘッドを小さくする。
According to the present invention, a computer having a plurality of CPUs and a shared memory performs arithmetic processing while sharing one area, and reduces overhead without performing communication between CPUs in the same computer.

【0021】請求項5に記載の解析方法にあっては、マ
スタ装置により実行される処理として、すべてのスレー
ブ装置に対して前記解析処理を行うために必要な初期値
を送信する初期値送信ステップと、すべてのスレーブ装
置から解析処理の終了を知らせるための通知を受け取る
解析終了通知受信ステップと、を含み、さらに、各スレ
ーブ装置により実行される処理として、隣接する領域を
解析する他のスレーブ装置からの境界データを待つ受信
待ち状態に移行する受信待ち移行ステップと、自領域の
解析演算を行う解析演算ステップと、前記演算結果から
得られる境界データを、隣接する領域を解析するすべて
のスレーブ装置に対して送信する境界データ送信ステッ
プと、隣接する領域を解析するすべてのスレーブ装置か
ら境界データを受け取った後、当該すべての境界データ
を用いて、再度、自領域の解析演算を行い、以降、各領
域の境界値が収束するまで、境界データの受け渡しおよ
び解析演算を繰り返し実行する繰り返し演算ステップ
と、各領域の境界値が収束した段階で、解析処理の終了
を知らせるための通知を前記マスタ装置に対して送信す
る解析終了通知送信ステップと、を含むことを特徴とす
る。
In the analysis method according to the fifth aspect, an initial value transmitting step of transmitting an initial value necessary for performing the analysis process to all slave devices as a process executed by the master device. And an analysis end notification receiving step of receiving a notification for notifying the end of the analysis process from all the slave devices, and further, as a process executed by each slave device, another slave device that analyzes an adjacent area. A reception waiting transition step for transitioning to a reception waiting state for waiting for boundary data from the server; an analysis operation step for performing an analysis operation of the own area; and boundary data obtained from the operation result, all slave devices for analyzing an adjacent area. The boundary data transmission step for transmitting data to the After that, using all the boundary data, perform the analysis operation of the own region again, and thereafter, repeatedly execute the transfer and analysis operation of the boundary data until the boundary value of each region converges, and And transmitting a notification for notifying the end of the analysis processing to the master device when the boundary value of each area has converged.

【0022】この発明によれば、マスタ装置を介さずに
スレーブ装置間で境界データを送受信する。具体的にい
うと、各スレーブ装置が、自装置に割り当てられた領域
に対して解析演算を行い、演算結果から得られる境界デ
ータを、隣接する領域を解析するすべてのスレーブ装置
に対して直接送信する。
According to the present invention, boundary data is transmitted and received between slave devices without going through the master device. Specifically, each slave device performs an analysis operation on an area assigned to itself, and transmits boundary data obtained from the operation result directly to all slave devices that analyze an adjacent region. I do.

【0023】請求項6に記載の解析方法において、前記
初期値送信ステップにあっては、初期設定時に、各スレ
ーブ装置間で直接通信相手を指定して境界データを転送
するための送受信相手テーブルを作成し、その後、すべ
てのスレーブ装置に対して当該テーブルを含む初期値を
送信し、さらに、前記境界データ送信ステップにあって
は、前記演算結果から得られる境界データを、前記テー
ブルに基づいて、隣接する領域を解析するすべてのスレ
ーブ装置に対して送信することを特徴とする。
In the analysis method according to the sixth aspect, in the initial value transmitting step, a transmission / reception partner table for transferring boundary data by directly designating a communication partner between the slave devices at the time of initialization is set. Create, after that, transmit the initial value including the table to all slave devices, further, in the boundary data transmission step, based on the boundary data obtained from the calculation result, based on the table, The transmission is performed to all slave devices that analyze adjacent areas.

【0024】この発明によれば、解析演算結果から得ら
れる境界データを、送受信相手テーブルに基づいて、ス
レーブ装置間で送受信する。
According to the present invention, the boundary data obtained from the analysis operation result is transmitted and received between the slave devices based on the transmission / reception partner table.

【0025】請求項7に記載の解析方法にあっては、さ
らに、前記初期値を送信する前に、各スレーブ装置内の
CPUの負荷を計測し、当該計測結果があらかじめ規定
された所定の値より小さい場合に、解析処理可能と判断
し、逆に大きい場合に、当該CPUが他のユーザに使用
されていると判断し、必要数分の解析処理可能なCPU
を確保するまで、前記負荷計測を繰り返し実行する負荷
計測ステップ、を含むことを特徴とする。
In the analysis method according to the seventh aspect, before transmitting the initial value, a load of a CPU in each slave device is measured, and the measurement result is set to a predetermined value. If it is smaller, it is determined that analysis processing is possible. Conversely, if it is larger, it is determined that the CPU is being used by another user, and the required number of CPUs that can perform analysis processing are determined.
A load measurement step of repeatedly executing the load measurement until the time is secured.

【0026】この発明によれば、解析演算処理の起動時
に、使用可能なCPUの検索を行い、あらかじめ必要数
のCPUを確保する。
According to the present invention, a search for available CPUs is performed at the time of starting the analysis operation processing, and a necessary number of CPUs are reserved in advance.

【0027】請求項8に記載の解析方法にあっては、マ
スタ装置により実行される処理として、すべてのスレー
ブ装置に対して前記解析処理を行うために必要な初期値
を送信する初期値送信ステップと、すべてのスレーブ装
置から解析処理の終了を知らせるための通知を受け取る
解析終了通知受信ステップと、を含み、さらに、前記各
スレーブ装置により実行される処理として、隣接する領
域を解析する他のスレーブ装置からの境界データを待つ
受信待ち状態に移行する受信待ち移行ステップと、同一
スレーブ装置内の複数のCPUが、割り当てられた領域
を分割して解析演算を行う解析演算ステップと、前記演
算結果から得られる境界データを、当該領域に隣接する
領域を解析するすべてのスレーブ装置に対して送信する
境界データ送信ステップと、隣接する領域を解析するす
べてのスレーブ装置から境界データを受け取った後、当
該すべての境界データを用いて、再度、当該領域の解析
演算を行い、以降、各領域の境界値が収束するまで、境
界データの受け渡しおよび解析演算を繰り返し実行する
繰り返し演算ステップと、各領域の境界値が収束した段
階で、解析処理の終了を知らせるための通知を前記マス
タ装置に対して送信する解析終了通知送信ステップと、
を含むことを特徴とする。
[0027] In the analysis method according to the eighth aspect, the initial value transmitting step of transmitting an initial value necessary for performing the analysis processing to all the slave apparatuses as the processing executed by the master apparatus. And an analysis end notification receiving step of receiving a notification for notifying the end of the analysis process from all the slave devices, and further, as a process executed by each of the slave devices, another slave that analyzes an adjacent area. A reception waiting transition step for transitioning to a reception waiting state waiting for boundary data from the apparatus, an analysis operation step in which a plurality of CPUs in the same slave apparatus divides an allocated area and performs an analysis operation, A boundary data transmission system for transmitting the obtained boundary data to all slave devices analyzing an area adjacent to the area. After receiving the boundary data from all the slave devices that analyze the adjacent region, the analysis operation of the region is performed again using all the boundary data, and thereafter, the boundary value of each region converges. Until the threshold value of each area converges, and at the stage when the boundary value of each area has converged, an analysis end to transmit a notification for notifying the end of the analysis processing to the master device. A notification sending step;
It is characterized by including.

【0028】この発明によれば、複数のCPUと共有メ
モリを持つ計算機が、1つの領域を分割して演算処理を
行い、同一計算機内のCPU間通信を行わずに、オーバ
ーヘッドを小さくする。
According to the present invention, a computer having a plurality of CPUs and a shared memory divides one area to perform arithmetic processing, thereby reducing overhead without performing communication between CPUs in the same computer.

【0029】請求項9に記載のプログラムにあっては、
隣接する領域を解析する他のスレーブ装置からの境界デ
ータを待つ受信待ち状態に移行させる受信待ち移行ステ
ップと、自領域の解析演算を行わせる解析演算ステップ
と、前記演算結果から得られる境界データを、隣接する
領域を解析するすべてのスレーブ装置に対して送信させ
る境界データ送信ステップと、隣接する領域を解析する
すべてのスレーブ装置から境界データを受け取った後、
当該すべての境界データを用いて、再度、自領域の解析
演算を行わせ、以降、各領域の境界値が収束するまで、
境界データの受け渡しおよび解析演算を繰り返し実行さ
せる繰り返し演算ステップと、各領域の境界値が収束し
た段階で、解析処理の終了を知らせるための通知を前記
マスタ装置に対して送信させる解析終了通知送信ステッ
プと、を含むことを特徴とする。
[0029] In the program according to the ninth aspect,
A reception waiting transition step of transitioning to a reception waiting state of waiting for boundary data from another slave device analyzing an adjacent area; an analysis operation step of performing an analysis operation of the own area; and boundary data obtained from the operation result. A boundary data transmitting step for transmitting to all the slave devices analyzing the adjacent region, and after receiving the boundary data from all the slave devices analyzing the adjacent region,
Using all the boundary data, the analysis calculation of the own region is performed again, and thereafter, until the boundary value of each region converges,
An iterative operation step of repeatedly executing the transfer and analysis operation of the boundary data, and an analysis end notification transmitting step of transmitting a notification for notifying the end of the analysis processing to the master device when the boundary value of each area has converged. And characterized in that:

【0030】この発明によれば、各スレーブ装置が、自
装置に割り当てられた領域に対して、たとえば、熱流動
解析演算を行い、演算結果から得られる境界データを、
隣接する領域を解析するすべてのスレーブ装置に対して
直接送信する。
According to the present invention, each slave device performs, for example, a thermal-hydraulic analysis operation on an area allocated to the slave device, and outputs boundary data obtained from the operation result.
Transmit directly to all slave devices that analyze adjacent areas.

【0031】[0031]

【発明の実施の形態】以下に、本発明にかかる並列計算
装置の実施の形態を図面に基づいて詳細に説明する。な
お、この実施の形態によりこの発明が限定されるもので
はない。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of a parallel computing device according to the present invention will be described below in detail with reference to the drawings. The present invention is not limited by the embodiment.

【0032】実施の形態1.図1は、本発明にかかる並
列計算機装置(PCクラスタ)の構成を示す図である。
図1において、1はマスタ装置であり、2,3,4はス
レーブ装置である。本発明にかかる並列計算機装置は、
従来の動作とは異なり、すなわち、境界データの転送
を、マスタ装置に制御させることなく、スレーブ装置間
の制御で行う。なお、スレーブ装置の数については、説
明の便宜上、3個としているが、この数は、熱流動解析
の対象となるボイラの領域数によって、可変となる。
Embodiment 1 FIG. 1 is a diagram showing a configuration of a parallel computer device (PC cluster) according to the present invention.
In FIG. 1, 1 is a master device, and 2, 3, and 4 are slave devices. The parallel computer device according to the present invention comprises:
Unlike the conventional operation, the transfer of boundary data is performed by control between slave devices without having the master device control the transfer. Although the number of slave devices is three for convenience of description, this number is variable depending on the number of regions of the boiler to be subjected to the heat flow analysis.

【0033】図2は、本発明にかかる並列計算機装置を
用いて実施する熱流動解析の対象となるゴミ焼却ボイラ
の構成を示す図である。ここでは、ボイラが図示鎖線の
ように分割され、個々の領域にそれぞれスレーブ装置が
割り当てられ、各スレーブ装置が、自装置に割り当てら
れた領域の熱流動解析を行う。
FIG. 2 is a diagram showing a configuration of a refuse incineration boiler to be subjected to a heat flow analysis performed using the parallel computer device according to the present invention. Here, the boiler is divided as shown by a chain line in the figure, slave devices are assigned to individual regions, and each slave device performs a heat flow analysis of the region assigned to the own device.

【0034】以下、本発明にかかる並列計算機装置にお
けるマスタ装置およびスレーブ装置の動作を図面にした
がって説明する。図3は、マスタ装置およびスレーブ装
置の動作、すなわち、熱流動解析方法を示すフローチャ
ートである。
Hereinafter, the operation of the master device and the slave device in the parallel computer device according to the present invention will be described with reference to the drawings. FIG. 3 is a flowchart showing the operation of the master device and the slave device, that is, a heat flow analysis method.

【0035】まず、マスタ装置では、すべてのスレーブ
装置に対して、熱流動解析を行うために必要な初期値を
送信し(ステップS1)、スレーブ装置からの応答、す
なわち、熱流動解析の終了を知らせるための通知を待つ
(ステップS2)。そして、熱流動解析の終了を知らせ
るための通知を受け取った段階で、マスタ装置としての
処理を終了する。
First, the master device transmits an initial value necessary for performing the heat and flow analysis to all the slave devices (step S1), and responds from the slave device, that is, finishes the heat and flow analysis. Wait for a notification for notification (step S2). Then, when the notification for notifying the end of the heat and fluid analysis is received, the processing as the master device ends.

【0036】一方、スレーブ装置では、上記マスタ装置
からの初期値を受信後(ステップS11)、まず、送信
元(隣接する領域を解析するスレーブ装置)を指定し、
通信相手数分の受信待ちを発行する(ステップS1
2)。その後、スレーブ装置では、自装置に割り当てら
れた領域に対して熱流動解析演算を行う(ステップS1
3)。そして、演算結果から得られる境界データを、隣
接する領域を解析するすべてのスレーブ装置に対して送
信し(ステップS14)、さらに、隣接する領域を解析
するすべてのスレーブ装置から、隣接する領域の境界デ
ータを受け取ったかどうかを確認し、受け取っていない
場合については、当該データを受け取るまで待つ(ステ
ップS15)。なお、熱流動解析演算処理において、各
スレーブ装置間で送受信される境界データは、温度,圧
力,流速等のパラメータである。
On the other hand, in the slave device, after receiving the initial value from the master device (step S11), first, a transmission source (slave device for analyzing an adjacent area) is specified.
A reception wait for the number of communication partners is issued (step S1).
2). Thereafter, the slave device performs a heat-hydraulic analysis operation on the area assigned to the slave device (step S1).
3). Then, the boundary data obtained from the operation result is transmitted to all the slave devices analyzing the adjacent region (step S14), and further, the boundary data of the adjacent region is transmitted from all the slave devices analyzing the adjacent region. It is confirmed whether or not the data has been received, and if not, it waits until the data is received (step S15). In the heat flow analysis calculation processing, the boundary data transmitted and received between the slave devices are parameters such as temperature, pressure, and flow velocity.

【0037】その後、隣接する領域を解析するすべての
スレーブ装置から境界データを受け取ったスレーブ装置
では(ステップS16,No)、受け取ったすべての境
界データ(パラメータ)を用いて、再度、ステップS1
2〜ステップS15の処理を実行する。
Thereafter, the slave device that has received the boundary data from all the slave devices analyzing the adjacent area (step S16, No) uses all the received boundary data (parameters) again to execute step S1.
2 to execute the processing of step S15.

【0038】この段階で各スレーブ装置は、各領域の境
界値が収束したかどうかを確認し(ステップS16)、
収束していないのであれば(ステップS16,No)、
各領域の境界値が収束するまで、上記ステップS12〜
ステップS15の処理を繰り返し実行し、収束した段階
で(ステップS16,Yes)、熱流動解析の終了を知
らせるための通知をマスタ装置に対して送信し(ステッ
プS17)、スレーブ装置における処理を終了する。
At this stage, each slave device checks whether the boundary value of each area has converged (step S16).
If not converged (step S16, No),
Until the boundary value of each area converges, the above steps S12 to S12 are performed.
The process of step S15 is repeatedly executed, and when the convergence is reached (step S16, Yes), a notification for notifying the end of the heat and fluid analysis is transmitted to the master device (step S17), and the process in the slave device ends. .

【0039】図4は、上記フローチャートの動作を時系
列的に表現した図である。ここでは、説明の便宜上、ス
レーブ装置が2個の場合について説明する。まず、マス
タ装置では、スレーブ装置(1)および(2)に対し
て、熱流動解析を行うために必要な初期値を送信する。
FIG. 4 is a diagram expressing the operation of the above flowchart in a time-series manner. Here, for convenience of explanation, a case where there are two slave devices will be described. First, the master device transmits to the slave devices (1) and (2) initial values necessary for performing the heat flow analysis.

【0040】スレーブ装置(1)では、上記マスタ装置
からの初期値を受信後、まず、隣接する領域を解析する
スレーブ装置(2)を指定し、受信待ちを発行する。そ
の後、自装置に割り当てられた領域に対して熱流動解析
演算を行い、演算結果から得られる境界データを、隣接
する領域を解析するスレーブ装置(2)に対して送信す
る。さらに、受信完了待ちの動作として、スレーブ装置
(2)から隣接する領域の境界データを受け取ったかど
うかの確認を継続的に行い、図示のAの位置で境界デー
タを受け取る。
After receiving the initial value from the master device, the slave device (1) first designates the slave device (2) for analyzing an adjacent area, and issues a reception wait. Thereafter, a heat flow analysis operation is performed on the area assigned to the own device, and boundary data obtained from the operation result is transmitted to the slave device (2) that analyzes the adjacent region. Furthermore, as an operation of waiting for reception completion, it is continuously checked whether or not boundary data of an adjacent area has been received from the slave device (2), and the boundary data is received at a position A shown in the figure.

【0041】その後、スレーブ装置(2)からの境界デ
ータを受け取ったスレーブ装置(1)では、再度、上記
と同様に受信待ちを発行し、受け取ったすべての境界デ
ータを用いて、熱流動解析演算処理を実行する。以降、
スレーブ装置(1)は、図3に示す処理を繰り返し実行
し、各領域の境界値が収束した段階で、熱流動解析の終
了を知らせるための通知をマスタ装置に対して送信す
る。
After that, the slave device (1) that has received the boundary data from the slave device (2) issues a reception wait again as described above, and uses all of the received boundary data to perform a heat-fluid analysis calculation. Execute the process. Or later,
The slave device (1) repeatedly executes the processing shown in FIG. 3, and transmits a notification for notifying the end of the heat and fluid analysis to the master device when the boundary value of each region has converged.

【0042】一方、スレーブ装置(2)においても、上
記マスタ装置からの初期値を受信後、まず、隣接する領
域を解析するスレーブ装置(1)を指定し、受信待ちを
発行する。その後、自装置に割り当てられた領域に対し
て熱流動解析演算を行い、演算結果から得られる境界デ
ータを、隣接する領域を解析するスレーブ装置(1)に
対して送信する。さらに、受信完了待ちの動作として、
スレーブ装置(1)から隣接する領域の境界データを受
け取ったかどうかを確認するが、ここでは、図示のBの
位置で境界データをすでに受け取っているため、直ちに
受信完了待ちを終了する。
On the other hand, also in the slave device (2), after receiving the initial value from the master device, first, the slave device (1) for analyzing the adjacent area is designated, and a reception wait is issued. After that, a heat flow analysis operation is performed on the region assigned to the own device, and boundary data obtained from the operation result is transmitted to the slave device (1) that analyzes the adjacent region. Furthermore, as an operation of waiting for reception completion,
It is checked whether or not the boundary data of the adjacent area has been received from the slave device (1). Here, since the boundary data has already been received at the position B shown in FIG.

【0043】その後、スレーブ装置(2)では、再度、
上記と同様に受信待ちを発行し、受け取ったすべての境
界データを用いて、熱流動解析演算処理を実行する。以
降、スレーブ装置(2)は、図3に示す処理を繰り返し
実行し、各領域の境界値が収束した段階で、熱流動解析
の終了を知らせるための通知をマスタ装置に対して送信
する。
Thereafter, in the slave device (2),
In the same manner as described above, a wait for reception is issued, and a heat flow analysis operation is performed using all the received boundary data. Thereafter, the slave device (2) repeatedly executes the processing shown in FIG. 3 and, at the stage when the boundary value of each region has converged, transmits a notification for notifying the end of the heat flow analysis to the master device.

【0044】図5は、従来の並列計算装置と本発明の並
列計算装置との比較結果を示す図である。図5からわか
るとおり、上記動作により熱流動解析演算を実施した場
合は、従来の並列計算装置による演算結果よりも、通信
速度が向上している。本発明の並列計算装置では、従来
と異なり、境界データの転送をスレーブ装置間で行うこ
ととしたため、スレーブ装置の待ち時間が短くなり、所
望の通信速度が得られた。
FIG. 5 is a diagram showing a comparison result between the conventional parallel computing device and the parallel computing device of the present invention. As can be seen from FIG. 5, when the heat-fluid analysis calculation is performed by the above operation, the communication speed is improved as compared with the calculation result by the conventional parallel computing device. In the parallel computing device of the present invention, the boundary data is transferred between the slave devices, unlike the related art, so that the waiting time of the slave device is reduced and a desired communication speed is obtained.

【0045】また、図6は、上記実施の形態に示すスレ
ーブ装置として動作し、前述した熱流動解析を実現可能
な一般的な計算機の構成を示す図である。
FIG. 6 is a diagram showing a configuration of a general computer which operates as the slave device shown in the above embodiment and can realize the above-mentioned heat flow analysis.

【0046】この計算機は、CPUを含む制御ユニット
101と、メモリユニット102と、表示ユニット10
3と、入力ユニット104と、CD−ROMドライブユ
ニット105と、ディスクユニット106と、を備え、
これらの各ユニットは、それぞれシステムバスAを介し
て接続されている。また、図6において、制御ユニット
101は、上述したボイラ等の熱流動解析演算処理を実
行する。メモリユニット102は、RAM、ROM等の
メモリを含み、制御ユニット101が実行すべきプログ
ラム、処理の過程で得られた必要なデータ等を記憶す
る。表示ユニット103は、CRTやLCD(液晶表示
パネル)等で構成され、計算機システムの使用者に対し
て、各種画面を表示する。入力ユニット104は、キー
ボード、マウス等で構成され、当該計算機の使用者が、
各種情報の入力を行うために使用する。また、図示のC
D−ROM200には、図3右側(スレーブ装置)に示
す上記処理を記述したプログラムが格納されている。
This computer comprises a control unit 101 including a CPU, a memory unit 102, a display unit 10
3, an input unit 104, a CD-ROM drive unit 105, and a disk unit 106,
These units are connected via a system bus A. In FIG. 6, the control unit 101 executes the above-described heat flow analysis calculation processing of the boiler or the like. The memory unit 102 includes memories such as a RAM and a ROM, and stores programs to be executed by the control unit 101, necessary data obtained in the course of processing, and the like. The display unit 103 includes a CRT, an LCD (liquid crystal display panel), and the like, and displays various screens for a user of the computer system. The input unit 104 includes a keyboard, a mouse, and the like.
Used to input various information. Also, the illustrated C
The D-ROM 200 stores a program describing the above processing shown in the right side of FIG. 3 (slave device).

【0047】上記のように構成される計算機では、ま
ず、CD−ROMドライブユニット105にセットされ
たCD−ROM200からプログラムがディスクユニッ
ト106にインストールされる。そして、計算機を立ち
上げるときにディスクユニット106から読み出された
プログラムが、メモリユニット102に格納される。こ
の状態で、制御ユニット101(CPU)は、メモリユ
ニット102に格納されたプログラムにしたがって、上
記図3に示す処理を実行する。
In the computer configured as described above, first, the program is installed in the disk unit 106 from the CD-ROM 200 set in the CD-ROM drive unit 105. Then, the program read from the disk unit 106 when the computer is started is stored in the memory unit 102. In this state, the control unit 101 (CPU) executes the processing shown in FIG. 3 according to the program stored in the memory unit 102.

【0048】なお、本発明においては、CD−ROM2
00にて各処理を記述したプログラムを提供している
が、このプログラムの記録媒体は、これに限定されるこ
となく、システムを構成するコンピュータに応じて、た
とえば、フロッピーディスク等の磁気ディスク、光磁気
ディスク、磁気テープ、計算機内部のROMおよびRA
M等の他の記録媒体を用いることも可能である。また、
上記記録媒体に記録されたプログラムは、すべてのスレ
ーブ装置に適用可能である。
In the present invention, the CD-ROM 2
00, a program describing each process is provided. However, the recording medium of the program is not limited to this. For example, a magnetic disk such as a floppy disk, an optical disk, etc. Magnetic disk, magnetic tape, ROM and RA in computer
It is also possible to use another recording medium such as M. Also,
The program recorded on the recording medium is applicable to all slave devices.

【0049】このように、本実施の形態においては、マ
スタ装置を介さずにスレーブ装置間で境界データを送受
信する構成としたため、すなわち、各スレーブ装置が、
自装置に割り当てられた領域に対して熱流動解析演算を
行い、演算結果から得られる境界データを、隣接する領
域を解析するすべてのスレーブ装置に対して直接送信す
る構成としたため、スレーブ装置の数を増やし高並列化
を実現した場合においても、マスタ装置の通信負荷を増
大させることなく、解析処理の高速化を実現することが
できる。
As described above, in the present embodiment, the boundary data is transmitted and received between the slave devices without the intervention of the master device.
The configuration is such that the heat flow analysis operation is performed on the area assigned to the own device, and the boundary data obtained from the operation result is directly transmitted to all slave devices analyzing the adjacent region. In this case, even when high parallelism is realized, the analysis processing can be speeded up without increasing the communication load of the master device.

【0050】なお、本実施の形態においては、特に、ゴ
ミ焼却ボイラの熱流動解析演算処理等を実行する並列計
算装置について説明したが、本実施の形態の並列計算装
置については、上記処理に限らず、領域分割法を用いた
すべての解析処理に有効であり、たとえば、船舶の航行
性能解析を実施することも可能である。たとえば、図7
は、直進する船舶の周囲流れ計算を行う場合を示す図で
あり、図8は、斜行,旋回する船舶の両弦計算を行う場
合を示す図である。
Although the present embodiment has been described with reference to the parallel computing device for executing, for example, a heat-fluid analysis calculation process of a refuse incineration boiler, the parallel computing device of the present embodiment is not limited to the above-described process. Instead, it is effective for all analysis processes using the area division method. For example, it is also possible to perform a navigation performance analysis of a ship. For example, FIG.
FIG. 8 is a diagram showing a case in which a flow around a straight-ahead ship is calculated, and FIG. 8 is a diagram showing a case in which a chord calculation of a skewed and turning ship is performed.

【0051】実施の形態2.図9は、実施の形態2の熱
流動解析方法を示すフローチャートである。なお、前述
の実施の形態1と同様の構成については説明を省略す
る。ここでは、前述の実施の形態1と異なる部分につい
てのみ説明する。
Embodiment 2 FIG. 9 is a flowchart illustrating a heat flow analysis method according to the second embodiment. The description of the same configuration as in the first embodiment is omitted. Here, only portions different from the first embodiment will be described.

【0052】以下、本実施の形態の並列計算機装置にお
けるマスタ装置およびスレーブ装置の動作を図9にした
がって説明する。
Hereinafter, the operation of the master device and the slave device in the parallel computer device of this embodiment will be described with reference to FIG.

【0053】まず、マスタ装置では、初期設定時に、各
スレーブ装置同士で直接通信相手を指定して通信するた
めに必要な送受信相手テーブルを作成し(ステップS2
1)、その後、すべてのスレーブ装置に対して、当該送
受信相手テーブルを含んだ初期値を送信し(ステップS
1)、スレーブ装置からの応答、すなわち、熱流動解析
の終了を知らせるための通知を待つ(ステップS2)。
そして、熱流動解析の終了を知らせるための通知を受け
取った段階で、マスタ装置としての処理を終了する。
First, at the time of initialization, the master device creates a transmission / reception partner table required for direct communication between the slave devices by designating the communication partner (step S2).
1) Then, an initial value including the transmission / reception partner table is transmitted to all slave devices (step S).
1) Wait for a response from the slave device, that is, a notification for notifying the end of the heat flow analysis (step S2).
Then, when the notification for notifying the end of the heat and fluid analysis is received, the processing as the master device ends.

【0054】一方、スレーブ装置では、上記マスタ装置
からの初期値を受信後(ステップS11)、まず、隣接
する領域を解析するスレーブ装置を指定し、通信相手数
分の受信待ちを発行する(ステップS12)。その後、
スレーブ装置では、自装置に割り当てられた領域に対し
て熱流動解析演算を行う(ステップS13)。そして、
演算結果から得られる境界データを、送受信相手テーブ
ルに基づいて、隣接する領域を解析するすべてのスレー
ブ装置に対して送信し(ステップS14)、さらに、隣
接する領域を解析するすべてのスレーブ装置から、隣接
する領域の境界データを受け取ったかどうかを確認する
(ステップS15)。なお、以降の動作については、実
施の形態1と同様である。
On the other hand, in the slave device, after receiving the initial value from the master device (step S11), first, a slave device for analyzing an adjacent area is designated, and a reception wait for the number of communication partners is issued (step S11). S12). afterwards,
The slave device performs a thermal-hydraulic analysis operation on the area assigned to the slave device (step S13). And
The boundary data obtained from the calculation result is transmitted to all the slave devices analyzing the adjacent area based on the transmission / reception partner table (step S14). It is confirmed whether or not the boundary data of the adjacent area has been received (step S15). The subsequent operation is the same as in the first embodiment.

【0055】このように、本実施の形態においては、前
述の実施の形態1と同様の効果が得られるとともに、さ
らに、熱流動解析演算結果から得られる境界データを、
送受信相手テーブルに基づいて、スレーブ装置間で送受
信する構成としたため、スレーブ装置における演算処理
を軽減することができる。なお、本実施の形態において
は、特に、ボイラ等の熱流動解析演算処理を実行する並
列計算装置について説明したが、本実施の形態の並列計
算装置については、上記処理に限らず、領域分割法を用
いたすべての解析処理に有効であり、たとえば、船舶の
航行性能解析を実施することも可能である(実施の形態
1と同様)。
As described above, in the present embodiment, the same effects as those of the first embodiment can be obtained, and further, the boundary data obtained from the heat-fluid analysis calculation result is
Since transmission / reception is performed between the slave devices based on the transmission / reception partner table, arithmetic processing in the slave devices can be reduced. In the present embodiment, the parallel computing device that executes the heat-fluid analysis calculation processing of a boiler or the like has been particularly described. However, the parallel computing device according to the present embodiment is not limited to the above-described processing, and may be a region division method. This is effective for all the analysis processes using. For example, it is also possible to perform a navigation performance analysis of a ship (similar to the first embodiment).

【0056】実施の形態3.図10は、実施の形態3の
熱流動解析方法を示すフローチャートである。なお、前
述の実施の形態1と同様の構成については説明を省略す
る。また、本実施の形態の処理は、前述の実施の形態1
および2の処理、すなわち、図3および図9の処理に適
用可能である。ここでは、前述の実施の形態1または2
と異なる部分についてのみ説明する。
Embodiment 3 FIG. 10 is a flowchart illustrating a heat flow analysis method according to the third embodiment. The description of the same configuration as in the first embodiment is omitted. Further, the processing of this embodiment is the same as that of the first embodiment.
3 and FIG. 9 are applicable. Here, Embodiment 1 or 2 described above is used.
Only the parts different from the above will be described.

【0057】以下、本発明にかかる並列計算機装置にお
けるマスタ装置およびスレーブ装置の動作を図10にし
たがって説明する。なお、図10(a)は、熱流動解析
実行時のCPU割り当てフローを示す図であり、図10
(b)は、計算機リストおよび実行リストの一例を示す
図である。
The operation of the master device and the slave device in the parallel computer according to the present invention will be described below with reference to FIG. FIG. 10 (a) is a diagram showing a flow of CPU allocation at the time of executing the heat and flow analysis.
(B) is a diagram showing an example of a computer list and an execution list.

【0058】本実施の形態の並列計算装置では、前述の
図3または図9のプログラムを実行する前に、図10
(a)に示す処理を実行する。まず、マスタ装置では、
図10(b)に示すような、計算機のホスト名を列挙し
た計算機リストをオープンし(ステップS31)、その
なかから適当にホストを検索する(ステップS32)。
ここで、計算機リストにホストが残っていない場合は
(ステップS32、ホストなし)、実行リスト作成処理
を終了する。一方、ホストが残っている場合(ステップ
S32,読み出し)、マスタ装置は、当該ホストを読み
出し、CPUの負荷を計測する(ステップS33)。
In the parallel computing device according to the present embodiment, before executing the program of FIG. 3 or FIG.
The processing shown in FIG. First, in the master device,
A computer list listing the host names of the computers as shown in FIG. 10B is opened (step S31), and a host is appropriately searched therefrom (step S32).
If no host remains in the computer list (step S32, no host), the execution list creation process ends. On the other hand, when the host remains (step S32, read), the master device reads the host and measures the load on the CPU (step S33).

【0059】その結果、求められた負荷が、あらかじめ
規定された所定の値より小さい場合(ステップS34,
Yes)、マスタ装置では、当該ホストが空いていると
判断し、そのホスト名を実行リストに追加する。そし
て、リストにホストがなくなるまで、上記ステップS3
2からS35の処理を繰り返し実行する。
As a result, when the calculated load is smaller than a predetermined value (step S34,
Yes), the master device determines that the host is vacant, and adds the host name to the execution list. Step S3 is repeated until there are no more hosts in the list.
The processes from 2 to S35 are repeatedly executed.

【0060】一方、求められた負荷が、あらかじめ規定
された所定の値より大きい場合(ステップS34,N
o)、マスタ装置では、当該ホストが他のユーザに使用
されていると判断し、その後、必要数のCPUを確保す
るまで、上記ステップS32からS35の処理を繰り返
し実行する。
On the other hand, when the obtained load is larger than a predetermined value (step S34, N
o), the master device determines that the host is being used by another user, and thereafter repeatedly executes the processing of steps S32 to S35 until a required number of CPUs is secured.

【0061】以降、本実施の形態では、上記のように作
成した、解析処理に使用可能なホストが記載された実行
リストを用いて、前述の図3または図9のプログラムを
実行する。
Thereafter, in the present embodiment, the above-described program shown in FIG. 3 or FIG. 9 is executed by using the execution list created as described above and describing the hosts usable for the analysis processing.

【0062】このように、本実施の形態においては、実
施の形態1または2と同様の効果が得られるとともに、
さらに、熱流動解析演算処理の起動時に、使用可能なC
PUの検索を行い、あらかじめ必要数のCPUを確保す
る構成としたため、複数のユーザが同時に同一の並列計
算装置を使用でき、さらに、CPUの稼働率を向上させ
ることができる。また、同様の理由から、故障CPUを
あらかじめ除外しておくことができるため、耐障害性を
大幅に向上させることができる。なお、本実施の形態に
おいては、特に、ボイラ等の熱流動解析演算処理を実行
する並列計算装置について説明したが、本実施の形態の
並列計算装置については、上記処理に限らず、領域分割
法を用いたすべての解析処理に有効であり、たとえば、
船舶の航行性能解析を実施することも可能である(実施
の形態1と同様)。
As described above, in the present embodiment, the same effects as those of the first or second embodiment can be obtained, and
Further, when the heat flow analysis calculation process is started, the available C
Since the required number of CPUs are reserved in advance by searching for PUs, a plurality of users can use the same parallel computing device at the same time, and the operating rate of the CPU can be improved. Further, for the same reason, a faulty CPU can be excluded in advance, so that fault tolerance can be greatly improved. In the present embodiment, the parallel computing device that executes the heat-fluid analysis calculation processing of a boiler or the like has been particularly described. Is effective for all analysis processes using
It is also possible to perform a navigation performance analysis of a ship (similar to the first embodiment).

【0063】実施の形態4.図11は、本実施の形態の
構成を示す図である。図11において、11,12は計
算機(スレーブ装置)であり、13,14,15,16
はCPUであり、17,18は共有メモリである。な
お、本実施の全体構成については、前述の実施の形態1
にて示した図1と同様である。
Embodiment 4 FIG. 11 is a diagram showing a configuration of the present embodiment. In FIG. 11, reference numerals 11 and 12 denote computers (slave devices).
Is a CPU, and 17 and 18 are shared memories. The overall configuration of the present embodiment is described in the first embodiment.
This is the same as FIG.

【0064】前述までの実施の形態では、マルチプロセ
スによる並列実行、すなわち、計算機内の1つのCPU
が1つの領域の熱流動演算処理を行ってきた(図11右
下参照)。このような方法は、独立したアドレス空間で
各処理が行なわれるため汎用性に優れた方法である。P
Cクラスタの基本的な形式である分散メモリ方式では、
各CPUが別々のOSすなわち個別のアドレス空間で実
行されるため、必然的にマルチプロセスによる並列実行
となる。
In the embodiments described above, parallel execution by multi-process, that is, one CPU in a computer
Has performed the heat-fluid calculation processing of one area (see the lower right of FIG. 11). Such a method is excellent in versatility because each processing is performed in an independent address space. P
In the distributed memory method, which is the basic form of the C cluster,
Since each CPU is executed in a separate OS, that is, in an individual address space, parallel execution by multi-process is inevitable.

【0065】そこで、本実施の形態においては、図11
左下に示すように、共有メモリ内で1つのプロセスと
し、マルチスレッドによる並列実行とする。すなわち、
2つのCPUと共有メモリを持つ計算機が、隣り合う2
つの領域の熱流動演算処理を行う。この場合、同一プロ
セス内のスレッド群は、同一アドレス空間で実行される
ため、共有メモリである必要がある。
Therefore, in the present embodiment, FIG.
As shown in the lower left, one process is assumed to be executed in the shared memory, and the processes are executed in parallel by multiple threads. That is,
A computer with two CPUs and a shared memory
Heat flow calculation processing of two areas is performed. In this case, since the threads in the same process are executed in the same address space, they must be shared memories.

【0066】図12は、実施の形態4の熱流動解析方法
を示すフローチャートである。以下、本発明にかかる並
列計算機装置におけるスレーブ装置の動作を図10にし
たがって説明する。なお、マスタ装置の動作について
は、前述の実施の形態1,2または3と同様である。
FIG. 12 is a flowchart showing a heat flow analysis method according to the fourth embodiment. Hereinafter, the operation of the slave device in the parallel computer device according to the present invention will be described with reference to FIG. The operation of the master device is the same as that of the first, second, or third embodiment.

【0067】まず、各スレーブ装置では、通信相手数分
の受信待ちを発行し(ステップS41)、その後、自装
置に割り当てられた領域に対してスレッドを作成する。
すなわち、自装置に割り当てられた領域に対して熱流動
解析演算を行う(ステップS42)。具体的にいうと、
CPU13が、スレッド(1)を開始し(ステップS5
1)、所定領域の偶数行の熱流動解析演算を行う(ステ
ップS52)。また、CPU14が、スレッド(2)を
開始し(ステップS53)、所定領域の奇数行の熱流動
解析演算を行う(ステップS54)。
First, each slave device issues a reception wait for the number of communication partners (step S41), and then creates a thread for an area allocated to the own device.
That is, a heat flow analysis operation is performed on the area assigned to the own device (step S42). Specifically,
The CPU 13 starts the thread (1) (step S5).
1) A heat flow analysis calculation is performed for an even-numbered row in a predetermined area (step S52). Further, the CPU 14 starts a thread (2) (step S53), and performs a heat-fluid analysis operation on an odd-numbered row in a predetermined area (step S54).

【0068】そして、各スレッドを終了後(ステップS
43)、スレーブ装置では、演算結果から得られる境界
データを、隣接する領域を解析するすべてのスレーブ装
置に対して送信し(ステップS44)、さらに、隣接す
る領域を解析するすべてのスレーブ装置から、隣接する
領域の境界データを受け取ったかどうかを確認し、受け
取っていない場合については、当該データを受け取るま
で待つ。
After each thread is terminated (step S
43) In the slave device, the boundary data obtained from the operation result is transmitted to all the slave devices analyzing the adjacent region (step S44), and further, from all the slave devices analyzing the adjacent region, It is checked whether or not the boundary data of the adjacent area has been received, and if not received, it waits until the data is received.

【0069】その後、隣接する領域を解析するすべての
スレーブ装置から境界データを受け取ったスレーブ装置
では(ステップS45,No)、受け取ったすべての境
界データを用いて、再度、ステップS41〜ステップS
44の処理を実行する。
After that, in the slave device that has received the boundary data from all the slave devices that analyze the adjacent area (step S45, No), using the received all the boundary data, steps S41 to S41 are performed again.
The processing of 44 is executed.

【0070】この段階で各スレーブ装置は、各領域の境
界値が収束したかどうかを確認し(ステップS45)、
収束していないのであれば(ステップS45,No)、
各領域の境界値が収束するまで、上記ステップS41〜
ステップS44の処理を繰り返し実行し、収束した段階
で(ステップS45,Yes)、熱流動解析の終了を知
らせるための通知をマスタ装置に対して送信し、スレー
ブ装置における処理を終了する。
At this stage, each slave device checks whether the boundary value of each area has converged (step S45).
If it does not converge (step S45, No),
Until the boundary value of each area converges, the above steps S41 to S41 are performed.
The process of step S44 is repeatedly executed, and when the convergence is reached (step S45, Yes), a notification for notifying the end of the heat flow analysis is transmitted to the master device, and the process in the slave device ends.

【0071】このように、本実施の形態においては、2
つのCPUと共有メモリを持つ計算機が、領域を分担し
て熱流動演算処理を行う構成としたため、同一計算機内
のCPU間通信を必要とせず、前述の実施の形態よりも
オーバーヘッドを小さくすることができ、結果的にパフ
ォーマンスを向上させることができる。なお、本実施の
形態においては、特に、ボイラ等の熱流動解析演算処理
を実行する並列計算装置について説明したが、本実施の
形態の並列計算装置については、上記処理に限らず、領
域分割法を用いたすべての解析処理に有効であり、たと
えば、船舶の航行性能解析を実施することも可能である
(実施の形態1と同様)。
As described above, in the present embodiment, 2
Since a computer having two CPUs and a shared memory is configured to perform heat-fluid operation processing by sharing the area, communication between CPUs in the same computer is not required, and overhead can be reduced as compared with the above-described embodiment. And, as a result, performance can be improved. In the present embodiment, the parallel computing device that executes the heat-fluid analysis calculation processing of a boiler or the like has been particularly described. This is effective for all the analysis processes using. For example, it is also possible to perform a navigation performance analysis of a ship (similar to the first embodiment).

【0072】[0072]

【発明の効果】以上、説明したとおり、本発明にかかる
並列計算装置(請求項1)によれば、マスタ装置を介さ
ずにスレーブ装置間で境界データを送受信する構成とし
た。具体的にいうと、各スレーブ装置が、自装置に割り
当てられた領域に対して解析演算を行い、演算結果から
得られる境界データを、隣接する領域を解析するすべて
のスレーブ装置に対して直接送信する構成とした。これ
により、スレーブ装置の数を増やし高並列化を実現した
場合においても、マスタ装置の通信負荷を増大させるこ
となく、解析処理の高速化を実現することが可能な並列
計算装置を得ることができる、という効果を奏する。
As described above, according to the parallel computing device of the present invention (claim 1), boundary data is transmitted and received between slave devices without passing through the master device. Specifically, each slave device performs an analysis operation on an area assigned to itself, and transmits boundary data obtained from the operation result directly to all slave devices that analyze an adjacent region. Configuration. As a result, even when the number of slave devices is increased to achieve high parallelism, a parallel computing device capable of realizing high-speed analysis processing without increasing the communication load of the master device can be obtained. The effect is as follows.

【0073】また、本発明にかかる並列計算装置(請求
項2)によれば、さらに、解析演算結果から得られる境
界データを、送受信相手テーブルに基づいて、スレーブ
装置間で送受信する構成とした。これにより、スレーブ
装置における演算処理を軽減可能な並列計算装置を得る
ことができる、という効果を奏する。
Further, according to the parallel computing device of the present invention, the boundary data obtained from the result of the analysis operation is transmitted and received between the slave devices based on the transmission / reception partner table. As a result, it is possible to obtain a parallel computing device capable of reducing the arithmetic processing in the slave device.

【0074】また、本発明にかかる並列計算装置(請求
項3)によれば、さらに、解析演算処理の起動時に、使
用可能なCPUの検索を行い、あらかじめ必要数のCP
Uを確保する構成とした。これにより、CPUの稼働率
を向上可能な並列計算装置を得ることができる、という
効果を奏する。また、故障CPUをあらかじめ除外して
おくことができるため、耐障害性を大幅に向上させるこ
とが可能な並列計算装置を得ることができる、という効
果を奏する。
Further, according to the parallel computing device of the present invention, a search for available CPUs is performed at the time of starting the analytic operation processing, and the necessary number of CPs is previously determined.
U was secured. As a result, there is an effect that a parallel computing device capable of improving the operation rate of the CPU can be obtained. Further, since the failed CPU can be excluded in advance, there is an effect that a parallel computing device capable of greatly improving fault tolerance can be obtained.

【0075】また、本発明にかかる並列計算装置(請求
項4)によれば、複数のCPUと共有メモリを持つ計算
機が、領域を分担して演算処理を行う構成とした。これ
により、同一計算機内のCPU間通信を必要とせず、オ
ーバーヘッドを小さくすることができることから、結果
的にパフォーマンスを向上させることが可能な並列計算
装置を得ることができる、という効果を奏する。
Further, according to the parallel computing device of the present invention (claim 4), a computer having a plurality of CPUs and a shared memory is configured to perform arithmetic processing by sharing an area. This eliminates the need for communication between CPUs in the same computer and reduces overhead, so that a parallel computing device capable of improving performance as a result can be obtained.

【0076】また、本発明にかかる解析方法(請求項
5)によれば、マスタ装置を介さずにスレーブ装置間で
境界データを送受信する。具体的にいうと、各スレーブ
装置が、自装置に割り当てられた領域に対して解析演算
を行い、演算結果から得られる境界データを、隣接する
領域を解析するすべてのスレーブ装置に対して直接送信
する。これにより、スレーブ装置の数を増やし高並列化
を実現した場合においても、マスタ装置の通信負荷を増
大させることなく、解析処理の高速化を実現することが
できる、という効果を奏する。
According to the analysis method of the present invention (claim 5), boundary data is transmitted and received between slave devices without passing through the master device. Specifically, each slave device performs an analysis operation on an area assigned to itself, and transmits boundary data obtained from the operation result directly to all slave devices that analyze an adjacent region. I do. As a result, even when the number of slave devices is increased to achieve high parallelism, an effect is achieved in that the analysis processing can be speeded up without increasing the communication load of the master device.

【0077】また、本発明にかかる解析方法(請求項
6)によれば、さらに、解析演算結果から得られる境界
データを、送受信相手テーブルに基づいて、スレーブ装
置間で送受信する。これにより、スレーブ装置における
演算処理を軽減することができる、という効果を奏す
る。
Further, according to the analysis method of the present invention (claim 6), the boundary data obtained from the analysis calculation result is transmitted and received between the slave devices based on the transmission / reception partner table. Thereby, there is an effect that the arithmetic processing in the slave device can be reduced.

【0078】また、本発明にかかる解析方法(請求項
7)によれば、さらに、解析演算処理の起動時に、使用
可能なCPUの検索を行い、あらかじめ必要数のCPU
を確保する。これにより、CPUの稼働率を向上させる
ことができる、という効果を奏する。また、故障CPU
をあらかじめ除外しておくことができるため、耐障害性
を大幅に向上させることができる、という効果を奏す
る。
Further, according to the analysis method of the present invention (claim 7), at the start of the analysis operation processing, a search for available CPUs is performed, and the necessary number of CPUs are previously determined.
To secure. Thereby, there is an effect that the operation rate of the CPU can be improved. Also, the failed CPU
Can be excluded in advance, so that there is an effect that fault tolerance can be greatly improved.

【0079】また、本発明にかかる解析方法(請求項
8)によれば、複数のCPUと共有メモリを持つ計算機
(スレーブ装置)が、領域を分担して演算処理を行う。
これにより、同一計算機内のCPU間通信を必要とせ
ず、オーバーヘッドを小さくすることができることか
ら、結果的にパフォーマンスを向上させることができ
る、という効果を奏する。
Further, according to the analysis method of the present invention (claim 8), a computer (slave device) having a plurality of CPUs and a shared memory performs arithmetic processing while sharing the area.
This eliminates the need for communication between CPUs in the same computer and can reduce the overhead, resulting in an effect that performance can be improved as a result.

【0080】また、本発明にかかる記録媒体(請求項
9)によれば、マスタ装置を介さずにスレーブ装置間で
境界データを送受信することとした。具体的にいうと、
各スレーブ装置が、自装置に割り当てられた領域に対し
て解析演算を行い、演算結果から得られる境界データ
を、隣接する領域を解析するすべてのスレーブ装置に対
して直接送信することとした。これにより、スレーブ装
置の数を増やし高並列化を実現した場合においても、マ
スタ装置の通信負荷を増大させることなく、解析処理の
高速化を実現することが可能なプログラムを得ることが
できる、という効果を奏する。
Further, according to the recording medium of the present invention (claim 9), the boundary data is transmitted and received between the slave devices without passing through the master device. Specifically,
Each slave device performs an analysis operation on an area assigned to itself, and transmits boundary data obtained from the operation result directly to all slave devices analyzing an adjacent region. As a result, it is possible to obtain a program capable of realizing high-speed analysis processing without increasing the communication load on the master device even when the number of slave devices is increased and high parallelism is realized. It works.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明にかかる並列計算機装置の構成を示す図
である。
FIG. 1 is a diagram showing a configuration of a parallel computer device according to the present invention.

【図2】本発明にかかる並列計算機装置を用いて実施す
る熱流動解析の対象となるボイラの構成を示す図であ
る。
FIG. 2 is a diagram showing a configuration of a boiler to be subjected to a heat flow analysis performed using the parallel computer device according to the present invention.

【図3】実施の形態1の熱流動解析方法を示すフローチ
ャートである。
FIG. 3 is a flowchart illustrating a heat flow analysis method according to the first embodiment.

【図4】熱流動解析処理の動作を時系列的に表現した図
である。
FIG. 4 is a diagram expressing the operation of the heat flow analysis process in a time-series manner.

【図5】従来の並列計算装置と実施の形態1の並列計算
装置との比較結果を示す図である。
FIG. 5 is a diagram illustrating a comparison result between the conventional parallel computing device and the parallel computing device according to the first embodiment;

【図6】熱流動解析を実現可能な一般的な計算機の構成
を示す図である。
FIG. 6 is a diagram showing a configuration of a general computer capable of realizing a heat flow analysis.

【図7】直進する船舶の周囲流れ計算を行う場合を示す
図である。
FIG. 7 is a diagram showing a case where a surrounding flow calculation of a straight-ahead ship is performed.

【図8】斜行および旋回する船舶の両弦計算を行う場合
を示す図である。
FIG. 8 is a diagram showing a case where both strings of a skewed and turning ship are calculated.

【図9】実施の形態2の熱流動解析方法を示すフローチ
ャートである。
FIG. 9 is a flowchart showing a heat flow analysis method according to the second embodiment.

【図10】実施の形態3の熱流動解析方法を示すフロー
チャートである。
FIG. 10 is a flowchart showing a heat flow analysis method according to the third embodiment.

【図11】実施の形態4の構成を示す図である。FIG. 11 is a diagram showing a configuration of a fourth embodiment.

【図12】実施の形態4の熱流動解析方法を示すフロー
チャートである。
FIG. 12 is a flowchart illustrating a heat flow analysis method according to the fourth embodiment.

【図13】従来の解析方法を示すフローチャートであ
る。
FIG. 13 is a flowchart showing a conventional analysis method.

【符号の説明】[Explanation of symbols]

1 マスタ装置、2,3,4 スレーブ装置、11,1
2 計算機(スレーブ装置)、13,14,15,16
CPU、17,18 共有メモリ。
1 Master device, 2, 3, 4 Slave device, 11, 1
2 Computer (slave device), 13, 14, 15, 16
CPU, 17, 18 Shared memory.

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 領域分割法を採用し、隣接する領域が割
り当てられたスレーブ装置間で境界データの受け渡しを
行うことにより所定の解析処理を行う並列計算機装置に
おいて、 マスタ装置が、すべてのスレーブ装置に対して前記解析
処理を行うために必要な初期値を送信し、 一方、初期値を受け取った前記スレーブ装置が、隣接す
る領域を解析する他のスレーブ装置からの境界データを
待つ受信待ち状態に移行し、 その後、自領域の解析演算を行い、 前記演算結果から得られる境界データを、隣接する領域
を解析するすべてのスレーブ装置に対して送信し、 隣接する領域を解析するすべてのスレーブ装置から境界
データを受け取った後、当該すべての境界データを用い
て、再度、自領域の解析演算を行い、以降、各領域の境
界値が収束するまで、境界データの受け渡しおよび解析
演算を繰り返し実行し、 各領域の境界値が収束した段階で、解析処理の終了を知
らせるための通知を前記マスタ装置に対して送信し、 最後に、前記マスタ装置が、すべてのスレーブ装置から
前記通知を受け取った段階で、すべての処理を終了する
ことを特徴とする並列計算装置。
1. A parallel computer device that adopts a region division method and performs predetermined analysis processing by transferring boundary data between slave devices to which adjacent regions are assigned. An initial value necessary for performing the analysis process is transmitted to the slave device that has received the initial value, and waits for boundary data from another slave device that analyzes an adjacent area. After that, an analysis operation of the own area is performed, and boundary data obtained from the operation result is transmitted to all slave apparatuses that analyze the adjacent area, and from all the slave apparatuses that analyze the adjacent area. After receiving the boundary data, the analysis operation of the own region is performed again using all the boundary data, and thereafter, the boundary value of each region converges. Then, the boundary data transfer and the analysis operation are repeatedly executed, and when the boundary value of each area has converged, a notification for notifying the end of the analysis processing is transmitted to the master device. , When the notification is received from all the slave devices, all the processes are terminated.
【請求項2】 前記マスタ装置が、初期設定時に、各ス
レーブ装置間で直接通信相手を指定して境界データを転
送するための送受信相手テーブルを作成し、その後、す
べてのスレーブ装置に対して当該テーブルを含む初期値
を送信し、 前記スレーブ装置が、前記演算結果から得られる境界デ
ータを、前記テーブルに基づいて、隣接する領域を解析
するすべてのスレーブ装置に対して送信することを特徴
とする請求項1に記載の並列計算装置。
2. The master device creates a transmission / reception partner table for transferring boundary data by directly specifying a communication partner between slave devices at the time of initial setting, and thereafter, the master device creates a transmission / reception partner table for all slave devices. An initial value including a table is transmitted, and the slave device transmits boundary data obtained from the calculation result to all slave devices that analyze an adjacent area based on the table. The parallel computing device according to claim 1.
【請求項3】 前記マスタ装置が、前記初期値を送信す
る前に、各スレーブ装置内のCPUの負荷を計測し、当
該計測結果があらかじめ規定された所定の値より小さい
場合に、解析処理可能と判断し、逆に大きい場合に、当
該CPUが他のユーザに使用されていると判断し、必要
数分の解析処理可能なCPUを確保するまで、前記負荷
計測を繰り返し実行することを特徴とする請求項1また
は2に記載の並列計算装置。
3. The master device measures a load on a CPU in each slave device before transmitting the initial value, and when the measurement result is smaller than a predetermined value, analysis processing can be performed. On the contrary, when the CPU is large, it is determined that the CPU is being used by another user, and the load measurement is repeatedly executed until a required number of CPUs capable of performing analysis processing are secured. The parallel computing device according to claim 1.
【請求項4】 領域分割法を採用し、隣接する領域が割
り当てられたスレーブ装置間で境界データの受け渡しを
行うことにより所定の解析処理を行う並列計算機装置に
おいて、 マスタ装置が、すべてのスレーブ装置に対して前記解析
処理を行うために必要な初期値を送信し、 一方、初期値を受け取った前記スレーブ装置が、隣接す
る領域を解析する他のスレーブ装置からの境界データを
待つ受信待ち状態に移行し、同一スレーブ装置内の複数
のCPUが、割り当てられた領域を分割して解析演算を
行い、 前記演算結果から得られる境界データを、当該領域に隣
接する領域を解析するすべてのスレーブ装置に対して送
信し、 隣接する領域を解析するすべてのスレーブ装置から境界
データを受け取った後、当該すべての境界データを用い
て、再度、当該領域の解析演算を行い、以降、各領域の
境界値が収束するまで、境界データの受け渡しおよび解
析演算を繰り返し実行し、 各領域の境界値が収束した段階で、解析処理の終了を知
らせるための通知を前記マスタ装置に対して送信し、 最後に、前記マスタ装置が、すべてのスレーブ装置から
前記通知を受け取った段階で、すべての処理を終了する
ことを特徴とする並列計算装置。
4. A parallel computer device which adopts a region division method and performs predetermined analysis processing by transferring boundary data between slave devices to which adjacent regions are assigned, wherein a master device is connected to all slave devices. An initial value necessary for performing the analysis process is transmitted to the slave device that has received the initial value, and waits for boundary data from another slave device that analyzes an adjacent area. Then, a plurality of CPUs in the same slave device divide the assigned region and perform an analysis operation, and transfer the boundary data obtained from the operation result to all slave devices analyzing the region adjacent to the region. After receiving boundary data from all slave devices that transmit and analyze adjacent areas, The analysis operation of the region is performed, and thereafter, the transfer of the boundary data and the analysis operation are repeatedly executed until the boundary value of each region converges, and when the boundary value of each region converges, the end of the analysis processing is notified. And transmitting the notification to the master device, and finally, when the master device receives the notification from all the slave devices, terminates all the processes.
【請求項5】 領域分割法を採用し、隣接する領域が割
り当てられたスレーブ装置間で境界データの受け渡しを
行うことにより所定の解析処理を行う解析方法にあって
は、 マスタ装置により実行される処理として、 すべてのスレーブ装置に対して前記解析処理を行うため
に必要な初期値を送信する初期値送信ステップと、 すべてのスレーブ装置から解析処理の終了を知らせるた
めの通知を受け取る解析終了通知受信ステップと、 を含み、 さらに、前記各スレーブ装置により実行される処理とし
て、 隣接する領域を解析する他のスレーブ装置からの境界デ
ータを待つ受信待ち状態に移行する受信待ち移行ステッ
プと、 自領域の解析演算を行う解析演算ステップと、 前記演算結果から得られる境界データを、隣接する領域
を解析するすべてのスレーブ装置に対して送信する境界
データ送信ステップと、 隣接する領域を解析するすべてのスレーブ装置から境界
データを受け取った後、当該すべての境界データを用い
て、再度、自領域の解析演算を行い、以降、各領域の境
界値が収束するまで、境界データの受け渡しおよび解析
演算を繰り返し実行する繰り返し演算ステップと、 各領域の境界値が収束した段階で、解析処理の終了を知
らせるための通知を前記マスタ装置に対して送信する解
析終了通知送信ステップと、を含むことを特徴とする解
析方法。
5. An analysis method in which a predetermined analysis process is performed by exchanging boundary data between slave devices to which an adjacent region is assigned by adopting an area division method, which is executed by a master device. As the processing, an initial value transmitting step of transmitting an initial value necessary for performing the analysis processing to all slave devices, and an analysis end notification reception receiving a notification for notifying the end of the analysis processing from all slave devices And a reception waiting transition step of transitioning to a reception waiting state of waiting for boundary data from another slave device that analyzes an adjacent area, as a process executed by each of the slave apparatuses. An analysis operation step of performing an analysis operation; and boundary data obtained from the operation result, Boundary data transmission step to be transmitted to the slave device, and after receiving the boundary data from all the slave devices analyzing the adjacent region, using all the boundary data, perform the analysis calculation of the own region again, Thereafter, until the boundary value of each region converges, a repetitive operation step of repeatedly performing the transfer and analysis operation of the boundary data, and at the stage when the boundary value of each region converges, a notification for notifying the end of the analysis process is provided. An analysis end notification transmitting step of transmitting to the master device.
【請求項6】 前記初期値送信ステップにあっては、初
期設定時に、各スレーブ装置間で直接通信相手を指定し
て境界データを転送するための送受信相手テーブルを作
成し、その後、すべてのスレーブ装置に対して当該テー
ブルを含む初期値を送信し、 さらに、前記境界データ送信ステップにあっては、前記
演算結果から得られる境界データを、前記テーブルに基
づいて、隣接する領域を解析するすべてのスレーブ装置
に対して送信することを特徴とする請求項5に記載の解
析方法。
6. In the initial value transmitting step, at the time of initialization, a transmission / reception partner table for transferring boundary data by directly designating a communication partner between the slave devices is created. Transmitting an initial value including the table to the apparatus; and furthermore, in the boundary data transmitting step, the boundary data obtained from the operation result is analyzed based on the table to analyze all adjacent regions. The analysis method according to claim 5, wherein the transmission is performed to a slave device.
【請求項7】 さらに、前記初期値を送信する前に、各
スレーブ装置内のCPUの負荷を計測し、当該計測結果
があらかじめ規定された所定の値より小さい場合に、解
析処理可能と判断し、逆に大きい場合に、当該CPUが
他のユーザに使用されていると判断し、必要数分の解析
処理可能なCPUを確保するまで、前記負荷計測を繰り
返し実行する負荷計測ステップ、 を含むことを特徴とする請求項5または6に記載の解析
方法。
7. The method further comprises: before transmitting the initial value, measuring a load on a CPU in each slave device, and if the measurement result is smaller than a predetermined value, it is determined that analysis processing is possible. Conversely, when the CPU is large, it is determined that the CPU is being used by another user, and the load measurement is repeatedly executed until a required number of CPUs capable of performing analysis processing are secured. The analysis method according to claim 5 or 6, wherein:
【請求項8】 領域分割法を採用し、隣接する領域が割
り当てられたスレーブ装置間で境界データの受け渡しを
行うことにより所定の解析処理を行う解析方法にあって
は、 マスタ装置により実行される処理として、 すべてのスレーブ装置に対して前記解析処理を行うため
に必要な初期値を送信する初期値送信ステップと、 すべてのスレーブ装置から解析処理の終了を知らせるた
めの通知を受け取る解析終了通知受信ステップと、 を含み、 さらに、前記各スレーブ装置により実行される処理とし
て、 隣接する領域を解析する他のスレーブ装置からの境界デ
ータを待つ受信待ち状態に移行する受信待ち移行ステッ
プと、 同一スレーブ装置内の複数のCPUが、割り当てられた
領域を分割して解析演算を行う解析演算ステップと、 前記演算結果から得られる境界データを、当該領域に隣
接する領域を解析するすべてのスレーブ装置に対して送
信する境界データ送信ステップと、 隣接する領域を解析するすべてのスレーブ装置から境界
データを受け取った後、当該すべての境界データを用い
て、再度、当該領域の解析演算を行い、以降、各領域の
境界値が収束するまで、境界データの受け渡しおよび解
析演算を繰り返し実行する繰り返し演算ステップと、 各領域の境界値が収束した段階で、解析処理の終了を知
らせるための通知を前記マスタ装置に対して送信する解
析終了通知送信ステップと、 を含むことを特徴とする解析方法。
8. An analysis method in which a predetermined analysis process is performed by exchanging boundary data between slave devices to which an adjacent region is assigned by adopting an area division method, which is executed by a master device. As the processing, an initial value transmitting step of transmitting an initial value necessary for performing the analysis processing to all slave devices, and an analysis end notification reception receiving a notification for notifying the end of the analysis processing from all slave devices And a reception waiting transition step of transitioning to a reception waiting state of waiting for boundary data from another slave device for analyzing an adjacent area as processing executed by each of the slave devices. An arithmetic operation step in which a plurality of CPUs in the computer divides an allocated area and performs an analysis operation; Transmitting the obtained boundary data to all slave devices analyzing the region adjacent to the region, and receiving boundary data from all slave devices analyzing the adjacent region. An analysis operation of the area is performed again using all the boundary data, and thereafter, a boundary operation step of repeatedly performing the transfer and analysis operation of the boundary data until the boundary value of each area converges; An analysis end notification transmitting step of transmitting a notification for notifying the end of the analysis processing to the master device when the values have converged, the analysis method comprising:
【請求項9】 隣接する領域を解析する他のスレーブ装
置からの境界データを待つ受信待ち状態に移行させる受
信待ち移行ステップと、 自領域の解析演算を行わせる解析演算ステップと、 前記演算結果から得られる境界データを、隣接する領域
を解析するすべてのスレーブ装置に対して送信させる境
界データ送信ステップと、 隣接する領域を解析するすべてのスレーブ装置から境界
データを受け取った後、当該すべての境界データを用い
て、再度、自領域の解析演算を行わせ、以降、各領域の
境界値が収束するまで、境界データの受け渡しおよび解
析演算を繰り返し実行させる繰り返し演算ステップと、 各領域の境界値が収束した段階で、解析処理の終了を知
らせるための通知を前記マスタ装置に対して送信させる
解析終了通知送信ステップと、 を含むことを特徴とする、スレーブ装置にて実行される
解析プログラムを記録したコンピュータ読み取り可能な
記録媒体。
9. A reception waiting transition step for transitioning to a reception waiting state for waiting for boundary data from another slave device for analyzing an adjacent area; an analysis operation step for performing an analysis operation of the own area; A boundary data transmitting step of transmitting the obtained boundary data to all slave devices analyzing the adjacent region; and after receiving the boundary data from all the slave devices analyzing the adjacent region, all the boundary data are received. Again, the analysis operation of the own region is performed again, and thereafter, the boundary data of each region is repeatedly executed until the boundary value of each region converges. At this stage, an analysis end notification transmission step for transmitting a notification for notifying the end of the analysis process to the master device is performed. When, characterized in that it comprises a computer-readable recording medium analysis program executed by the slave device.
JP2000315473A 2000-10-16 2000-10-16 Parallel calculating device, analyzing method and recording medium with analysis program recorded thereon Withdrawn JP2002123497A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000315473A JP2002123497A (en) 2000-10-16 2000-10-16 Parallel calculating device, analyzing method and recording medium with analysis program recorded thereon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000315473A JP2002123497A (en) 2000-10-16 2000-10-16 Parallel calculating device, analyzing method and recording medium with analysis program recorded thereon

Publications (1)

Publication Number Publication Date
JP2002123497A true JP2002123497A (en) 2002-04-26

Family

ID=18794574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000315473A Withdrawn JP2002123497A (en) 2000-10-16 2000-10-16 Parallel calculating device, analyzing method and recording medium with analysis program recorded thereon

Country Status (1)

Country Link
JP (1) JP2002123497A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011058657A1 (en) 2009-11-16 2011-05-19 富士通株式会社 Parallel computation device, parallel computation method, and parallel computation program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011058657A1 (en) 2009-11-16 2011-05-19 富士通株式会社 Parallel computation device, parallel computation method, and parallel computation program
US8549261B2 (en) 2009-11-16 2013-10-01 Fujitsu Limited Parallel computing apparatus and parallel computing method

Similar Documents

Publication Publication Date Title
JP4706720B2 (en) DMA control system, printing apparatus, and transfer instruction program
US20120296958A1 (en) Information processing apparatus, information processing system, information processing method, and program
JPH02230455A (en) Interruption control system for external memory device
US20060265523A1 (en) Data transfer circuit and data transfer method
US8099563B2 (en) Storage device and access instruction sending method
US5734918A (en) Computer system with an input/output processor which enables direct file transfers between a storage medium and a network
JP2002123497A (en) Parallel calculating device, analyzing method and recording medium with analysis program recorded thereon
JP2001051966A (en) Node device, system and method for parallel processing and recording medium recording parallel processing program
JP6123487B2 (en) Control device, control method, and control program
US20040003049A1 (en) Parallel computer and analysis method, and computer product
JP2007172430A (en) Semiconductor integrated circuit
CN101539849B (en) Processor and gating method of register
JP6111731B2 (en) Parallel debugging system, parallel debugging method, and parallel debugging program
JP2522162B2 (en) Terminal sharing control method in virtual machine system
JPH04253228A (en) Task scheduling system for symmetric multiprocessor
KR100520605B1 (en) Digital signal processor and method using multi segmented buses
JP3002041B2 (en) Database processing unit
JP2002007173A (en) Function evaluating method for computer system
JP2983352B2 (en) Database arithmetic processing unit
WO2007088581A1 (en) Procedure calling method in shared memory multiprocessor, procedure calling program and recording medium
JPH0981402A (en) Multiprocessor system
JPH0535643A (en) Fully duplex channel input/output control system
JPH06295247A (en) Real time processing realizing method
JP2954019B2 (en) Logic simulation method
JPH0431419B2 (en)

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080108