JP2000298593A - System and method for predicting performance of multitask system and recording medium stored with program for the method - Google Patents

System and method for predicting performance of multitask system and recording medium stored with program for the method

Info

Publication number
JP2000298593A
JP2000298593A JP11106033A JP10603399A JP2000298593A JP 2000298593 A JP2000298593 A JP 2000298593A JP 11106033 A JP11106033 A JP 11106033A JP 10603399 A JP10603399 A JP 10603399A JP 2000298593 A JP2000298593 A JP 2000298593A
Authority
JP
Japan
Prior art keywords
performance
prediction
performance index
modeling
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11106033A
Other languages
Japanese (ja)
Other versions
JP3663968B2 (en
Inventor
Toshiyasu Kurasugi
俊康 蔵杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10603399A priority Critical patent/JP3663968B2/en
Publication of JP2000298593A publication Critical patent/JP2000298593A/en
Application granted granted Critical
Publication of JP3663968B2 publication Critical patent/JP3663968B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To accurately predict a performance index for the parallel degree of parallel computers in a multitask environment. SOLUTION: When the specification of a parallel degree or the like of parallel computers to be a platform is inputted to an input part 11 in the performance prediction system, a model generation part 12 generates a model on the basis of the specification. A prediction execution part 13 calculates performance index prediction values such as the degree of improvement and more detailed performance indexes such as throughput, a response and a resource using rate from the generated model. A prediction result output part 14 visually expresses the values outputted from the execution part 13.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はマルチタスクシステ
ムの性能予測システム及び予測方法並びにその方法プロ
グラムを記録した記録媒体に関し、特に並列計算機をプ
ラットホームとするマルチタスクシステムの性能予測シ
ステム及び予測方法並びにその方法プログラムを記録し
た記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system and method for predicting the performance of a multitask system and a recording medium on which a method program is recorded, and more particularly to a system and a method for predicting the performance of a multitask system using a parallel computer as a platform. The present invention relates to a recording medium on which a method program is recorded.

【0002】[0002]

【従来の技術】並列計算機における向上度(並列度(同
時に実行状態になるタスクやスレッドの最大数)に対す
る処理性能の向上を示す指標)の予測手法が1967年
に発行されたAFIPS Conference Pr
oceedingsの第483〜485頁に掲載され
た”Validity of the single−
processor approach to ach
ieving largescale computi
ng”と題するG.Amdahlによる論文に掲載され
ている。この従来の方法においては、シングルタスク環
境が想定されており、その仮定のもとに、並列度に対す
る処理性能の向上度の予測手法が示されている。
2. Description of the Related Art An AFIPS Conference Pr issued in 1967 is a method for predicting a degree of improvement (an index indicating an improvement in processing performance with respect to a degree of parallelism (the maximum number of tasks and threads to be simultaneously executed)) in a parallel computer.
“Validity of the single-” published on pages 483 to 485 of the receiveds.
processor approach to ach
ieving largescale computing
ng "in a paper by G. Amdahl. In this conventional method, a single task environment is assumed, and a method of predicting the degree of improvement in processing performance with respect to the degree of parallelism is assumed based on the assumption. It is shown.

【0003】又、1988年に発行されたCACM V
ol.31(5)の第532−533頁に掲載された”
Reevaluating Amdahl´s La
w”と題するJ.Gustafsonによる論文、19
96年に発行された並列処理シンポジウムの第227〜
234頁に掲載された「高並列計算機の性能評価のため
の挙動予測モデルの構成」と題する古市らによる論文に
も同様にシングルタスク環境の仮定をおいた向上度の予
測手法が示されている。
[0003] Also, CACM V issued in 1988
ol. 31 (5), pages 532-533 "
Reevaluating Amdahl's La
w ", a paper by J. Gustafson, 19
The 227th parallel processing symposium published in 1996
A paper by Furuichi et al. Entitled "Configuration of a Behavior Prediction Model for Performance Evaluation of Highly Parallel Computers" on page 234 also shows a prediction method of the degree of improvement based on the assumption of a single task environment. .

【0004】又、マルチタスク環境を想定した場合の予
測手法が、1996年に発行されたCommun.AC
M 39 (12) のArticle 231 に掲
載された”Including Queueing E
ffects in Amdahl´s Law”と題
するR.Nelsonによる論文に掲載されている。こ
の論文ではマルチタスク環境によるタスク(又はスレッ
ド)間のプロセッサ競合を考慮したパラメータを予測式
に取り入れている。
[0004] Further, a prediction method when a multitask environment is assumed is disclosed in Commun. AC
“Including Queueing E,” published in Article 231 of M 39 (12).
R. Nelson, entitled "Facts in Amdahl's Law". In this paper, parameters that take into account processor competition between tasks (or threads) in a multitasking environment are incorporated into the prediction formula.

【0005】ところで、マルチプロセッサを搭載したS
MP(symmetrical multiproce
ssor; 対称型マルチプロセッサ)マシンが比較的
安価になるに伴い、コンピュータシステムのプラットホ
ーム(platform)に採用されるなど、従来は大
規模な科学計算などに用いられていた並列計算機が身近
なものになりつつある。
[0005] By the way, a multiprocessor-equipped S
MP (symmetrical multiproce
With the relatively low cost of ssor (symmetric multi-processor) machines, parallel computers that have been used for large-scale scientific calculations are becoming more familiar, such as being used for computer system platforms. It is becoming.

【0006】システム開発において、並列計算機をプラ
ットホームとして採用する場合に問題となることの1つ
が、並列計算機において並列度をどの程度に設定するか
である。並列度は計算機におけるプロセッサの数と一致
することが多く、一般には並列度をあげると性能は向上
するが、このことはプロセッサ数の増加に繋がるため、
プラットフォームに対するコストは増加してしまう。
In system development, one of the problems when employing a parallel computer as a platform is how much the degree of parallelism is set in the parallel computer. The degree of parallelism often coincides with the number of processors in the computer. Generally, increasing the degree of parallelism improves performance, but this leads to an increase in the number of processors,
The cost for the platform will increase.

【0007】コストパフォーマンスの高いシステム開発
を行うためには、適度な並列度の設定を行うこと、さら
には(要求された処理性能を満たす範囲内で)できるだ
け並列度を低くするようなシステム設計が可能であるこ
とが望ましい。そのためには、システム構成を与えた場
合に並列度に対する処理性能の指標(具体的には速度向
上率、効率、スループット(throughput;単
位時間当たりの処理能力)やレスポンスタイム、資源使
用率などを指す。)を予測する必要がある。このような
指標を予測する場合、従来は主にシングルタスク環境で
の利用を想定して行われていた。シングルタスク環境下
での速度向上率や効率(これらの指標の定義は上記古市
らの論文の第228項参照のこと)の予測手法が上記の
ようにG.Amdahによる論文をはじめとした論文で
示されている。また、マルチタスク環境を想定し、向上
度を予測する手法も上記R.Nelsonの論文で示さ
れている。
[0007] In order to develop a system with high cost performance, it is necessary to set an appropriate degree of parallelism, and to design the system so as to reduce the degree of parallelism as much as possible (within a range satisfying the required processing performance). Preferably it is possible. For that purpose, when a system configuration is given, it refers to an index of processing performance with respect to the degree of parallelism (specifically, speed improvement rate, efficiency, throughput (processing capacity per unit time), response time, resource usage rate, and the like. .) Must be predicted. In the case of predicting such an index, conventionally, it has been mainly assumed to be used in a single task environment. As described above, the prediction method of the speed improvement rate and efficiency under the single task environment (for the definition of these indices, see item 228 of the above-mentioned article by Furuichi et al.) Is described in G. This is shown in papers such as those by Amdah. In addition, a method of predicting the degree of improvement assuming a multitask environment is also described in R. This is shown in the Nelson paper.

【0008】図8は並列計算機をプラットホームとする
マルチタスク環境でのコンピュータシステムの一例を示
す構成図である。図8を参照して、並列計算機101は
複数のプロセッサ、この例では3つのプロセッサ102
〜104を有している。一方、実行される複数のタスク
として、この例では4つのタスク105〜108が存在
する。このコンピュータシステムでは、複数のプロセッ
サ102〜104を搭載したコンピュータ(並列計算
機)101上で、同時に複数のタスク105〜108の
実行が行われるのである。
FIG. 8 is a block diagram showing an example of a computer system in a multitask environment using a parallel computer as a platform. Referring to FIG. 8, a parallel computer 101 has a plurality of processors, in this example, three processors 102.
To 104. On the other hand, in this example, there are four tasks 105 to 108 as a plurality of tasks to be executed. In this computer system, a plurality of tasks 105 to 108 are simultaneously executed on a computer (parallel computer) 101 on which a plurality of processors 102 to 104 are mounted.

【0009】又、この種の技術の一例が特開平9−23
7203号公報、特開昭62−182864号公報、特
開昭59−174957号公報及び特開平10−069
469号公報に開示されている。
An example of this type of technology is disclosed in Japanese Patent Laid-Open No. 9-23 / 1990.
JP-A-7203, JP-A-62-182864, JP-A-59-174957 and JP-A-10-069
No. 469.

【0010】[0010]

【発明が解決しようとする課題】第1の問題点は、マル
チタスク環境又はマルチスレッド環境における並列計算
機の並列度に対する性能の向上度や性能指標を正しく予
測できないということである。その理由は、シングルタ
スク環境を想定して行った予測では、複数のタスクによ
るプロセッサの競合などのリソース競合を考慮していな
いので、誤った予測しか行えないためである。また、
R.Nelsonの論文において示されている手法で
は、予測式の根拠となる理論が示されていないためにそ
の精度に疑問があるからである。
A first problem is that it is not possible to correctly predict the degree of performance improvement or performance index with respect to the degree of parallelism of a parallel computer in a multitask environment or a multithread environment. The reason is that in the prediction performed on the assumption of the single task environment, only the wrong prediction can be performed because the resource competition such as the processor competition by a plurality of tasks is not considered. Also,
R. This is because the accuracy of the method shown in the Nelson's paper is questionable because the theory underlying the prediction formula is not shown.

【0011】第2の問題点は、コストにふさわしい並列
計算機のスペック、より具体的には並列度やプロセッサ
の処理速度といったものの決定を勘や経験にたよらざる
を得ないということである。その理由は、第1の問題点
に示されるように性能指標を適切に予測することができ
ないためである。
The second problem is that it is necessary to consider and determine the specifications of the parallel computer suitable for the cost, more specifically, the determination of the degree of parallelism and the processing speed of the processor. The reason is that the performance index cannot be properly predicted as shown in the first problem.

【0012】第3の問題点は、並列計算機上で実行され
るプログラムの構造にボトルネック(bottle n
eck;阻害要因)があってもその箇所の特定ができな
いことである。その理由は、プログラムではセマフォ
(semaphore)やクリティカルセクション(c
ritical section)などを用いた制御が
行われており、このことがボトルネックとなることが多
々ある。しかしながら、従来の方法では、マルチタスク
環境でのこれらプログラムの構造を適切に考慮していな
いということが理由である。なお、「セマフォ」とは複
数のタスクが同時に動く場合にタスク間の同期を取ると
きに使う信号のことをいい、「クリティカルセクショ
ン」とは複数のタスクが同時実行される環境において、
あるタスクがクリティカルな(重要な)資源を使用して
いる間は他のタスクにその資源が解放されるまでその資
源の使用を待たせること、即ちその待たせる期間のこと
をいう。
The third problem is that the structure of a program executed on a parallel computer has a bottleneck.
eck; inhibition factor) cannot be identified at the location. The reason is that semaphores and critical sections (c
The control is performed using a vertical section, for example, and this often becomes a bottleneck. However, this is because conventional methods do not properly consider the structure of these programs in a multitask environment. Note that "semaphore" refers to a signal used to synchronize tasks when multiple tasks are running simultaneously, and "critical section" refers to an environment where multiple tasks are executed simultaneously.
While a task uses a critical (important) resource, it means that another task waits for the resource to be used until the resource is released, that is, a period during which the task is kept waiting.

【0013】第4の問題点は要求性能を満足するため
に、同時に実行するプログラムの構成やタスク数、スレ
ッド数といったシステム負荷の設定を勘や経験のみで行
わなければならないということである。その理由は、従
来の方法にはマルチタスク環境又はマルチスレッド環境
におけるシステムの性能指標を適切に予測するためのモ
デルおよびその解析手法が示されていないためである。
A fourth problem is that in order to satisfy the required performance, it is necessary to take into account only the configuration of programs to be executed at the same time and the setting of the system load such as the number of tasks and the number of threads, based only on experience. The reason is that the conventional method does not show a model for properly predicting the performance index of the system in a multitask environment or a multithread environment and an analysis method thereof.

【0014】第5の問題点は、システムにおけるスルー
プット、レスポンスタイム(response tim
e;応答時間)、リソース(resource;資源)
の使用率といったより細かい性能指標の予測が不可能で
あることである。その理由は、従来の方法では解析を容
易にするために、算出する指標を速度向上率や効率など
の特定されたものに限定してしまっているからである。
The fifth problem is that the system has a throughput and a response time.
e; response time), resource (resource)
That is, it is impossible to predict a more detailed performance index such as a usage rate. The reason is that in the conventional method, in order to facilitate the analysis, the index to be calculated is limited to a specified index such as a speed improvement rate or efficiency.

【0015】そこで本発明の目的は、上記課題を解決す
ることが可能なマルチタスクシステムの性能予測システ
ム及び予測方法並びにその方法プログラムを記録した記
録媒体を提供することにある。
It is an object of the present invention to provide a performance prediction system and a prediction method for a multitask system capable of solving the above-mentioned problems, and a recording medium on which a method program is recorded.

【0016】[0016]

【課題を解決するための手段】前記課題を解決するため
に本発明による第1の発明は、並列計算機をプラットホ
ームとするマルチタスクシステムの性能予測システムで
あって、そのシステムはマルチタスク環境でのリソース
の競合を待ち行列網モデルを用いてモデル化するモデル
化手段と、そのモデル化されたリソースの競合を待ち行
列理論を用いて解析し前記マルチタスクシステムの性能
指標を予測する性能指標予測手段とを含むことを特徴と
する。
According to a first aspect of the present invention, there is provided a performance prediction system for a multitasking system using a parallel computer as a platform. Modeling means for modeling resource contention using a queuing network model, and performance index predicting means for analyzing the modeled resource contention using queuing theory to predict a performance index of the multitask system And characterized in that:

【0017】又、本発明による第2の発明は、並列計算
機をプラットホームとするマルチタスクシステムの性能
予測方法であって、その方法はマルチタスク環境でのリ
ソースの競合を待ち行列網モデルを用いてモデル化する
第1ステップと、そのモデル化されたリソースの競合を
待ち行列理論を用いて解析し前記マルチタスクシステム
の性能指標を予測する第2ステップとを含むことを特徴
とする。
A second invention according to the present invention is a method for estimating the performance of a multitask system using a parallel computer as a platform, and the method uses a queuing network model for resource contention in a multitask environment. The method includes a first step of modeling and a second step of analyzing contention of the modeled resources by using queuing theory to predict a performance index of the multitask system.

【0018】又、本発明による第3の発明は、並列計算
機をプラットホームとするマルチタスクシステムの性能
予測方法プログラムを記録した記録媒体であって、その
記録媒体にはマルチタスク環境でのリソースの競合を待
ち行列網モデルを用いてモデル化する第1ステップと、
そのモデル化されたリソースの競合を待ち行列理論を用
いて解析し前記マルチタスクシステムの性能指標を予測
する第2ステップとを含むプログラムが記録されている
ことを特徴とする。
According to a third aspect of the present invention, there is provided a recording medium recording a program for predicting the performance of a multitasking system using a parallel computer as a platform, wherein the recording medium has resource competition in a multitasking environment. A first step of modeling using a queuing network model;
A second step of analyzing the modeled resource competition using queuing theory and predicting the performance index of the multitask system.

【0019】第1乃至第3の発明によれば、まず第1に
マルチタスク環境又はマルチスレッド環境における並列
計算機の並列度に対する性能の向上度や性能指標を正し
く予測することができる。次に第2にかけられるコスト
にふさわしい並列度、より具体的にはプロセッサの数の
決定を適切に判断することができる。第3にプログラム
構造におけるボトルネックを特定することができる。第
4に要求性能を満足するために、同時に実行するプログ
ラムの構成やタスク数といったシステムに対する負荷を
どのように設定すべきかを適切に判断することができ
る。第5にシステムにおけるスループット、レスポンス
タイム、リソースの使用率といった細かい性能指標の予
測が可能となる。
According to the first to third aspects of the present invention, first, it is possible to correctly predict the degree of improvement in performance and the performance index with respect to the degree of parallelism of a parallel computer in a multitask environment or a multithread environment. Next, it is possible to appropriately determine the degree of parallelism appropriate for the second cost, more specifically, the determination of the number of processors. Third, a bottleneck in the program structure can be specified. Fourth, it is possible to appropriately determine how to set the load on the system such as the configuration of programs to be executed simultaneously and the number of tasks to satisfy the required performance. Fifth, it is possible to predict detailed performance indicators such as throughput, response time, and resource usage in the system.

【0020】[0020]

【発明の実施の形態】まず、本発明の概要について説明
する。本発明に係るマルチタスクシステムの性能予測シ
ステムは、プラットホームとなる並列計算機の並列度、
プロセッサの処理速度などのスペックを表すパラメー
タ、同時に処理されるプログラムの種類やそれらの数、
各プログラムにおいてスレッド(thread)化がど
のようになされているかを示すパラメータ、各プログラ
ムにおいてセマフォ、クリティカルセクションがどのよ
うに採用されているかを示すパラメータなどを入力パラ
メータとし、これらのパラメータを基に、マルチプロセ
ッサを(プロセッサの数の)複数個のサーバ(serv
er)として捉え、それらのサーバがプロセッサシェア
リング(processor sharing)でタス
ク、又はスレッドを処理するとして、セマフォやクリテ
ィカルセクションをトークン(token)を用いて、
システムに対する負荷を客としてモデル化するモデル生
成部を持つことを特徴としている。
DESCRIPTION OF THE PREFERRED EMBODIMENTS First, an outline of the present invention will be described. The performance prediction system of the multitasking system according to the present invention has a parallel degree of a parallel computer as a platform,
Parameters that represent specifications such as the processing speed of the processor, the types of programs that are processed simultaneously, their number,
A parameter indicating how threading is performed in each program, a parameter indicating how a semaphore and a critical section are adopted in each program are input parameters, and based on these parameters, Multiprocessor (server number) multiple servers (serv
er), and those servers process tasks or threads by processor sharing, and use semaphores and critical sections as tokens.
It is characterized by having a model generation unit that models the load on the system as a customer.

【0021】このモデル生成部により生成されるモデル
には、待ち行列理論の適用が可能であるため、陽に処理
性能の向上度や性能指標を予測する式が求められ、この
式から予測値が容易に求められるという効果が得られ
る。さらに、解析手段として待ち行列理論を用いること
により、必要な入力パラメータを大幅に削減できること
を特徴としている。入力パラメータとして、システムの
動作などの細かいデータが不必要となり、予測のための
準備が容易になるという効果が得られる。
Since the queuing theory can be applied to the model generated by the model generation unit, an equation for explicitly predicting the degree of improvement of the processing performance and the performance index is obtained. The effect of being easily obtained is obtained. Furthermore, by using queuing theory as an analysis means, it is characterized in that required input parameters can be greatly reduced. As input parameters, detailed data such as the operation of the system becomes unnecessary, and an effect that preparation for prediction becomes easy is obtained.

【0022】又、解析手段としては、待ち行列理論の代
わりにシミュレーションを用いてもよく、この場合は数
値的に処理性能の向上度や性能指標を予測することがで
きる。又、モデル化においては、プラットフォームのリ
ソースをさらに細かくモデル化してもよい。この場合は
待ち行列理論を用いても陽な式としては処理性能の向上
度や性能指標を予測することは一般にはできないが、近
似計算法やシミュレーションを用いることにより精度よ
く数値的に予測することが可能である。
As an analysis means, a simulation may be used instead of the queuing theory. In this case, the degree of improvement of the processing performance and the performance index can be predicted numerically. In the modeling, the resources of the platform may be modeled more finely. In this case, it is not generally possible to predict the degree of improvement in processing performance or performance index as an explicit expression using queuing theory, but it is necessary to accurately predict numerically by using an approximate calculation method or simulation. Is possible.

【0023】以下、本発明の実施の形態について添付図
面を参照しながら説明する。図1は本発明に係るマルチ
タスクシステムの性能予測システムの第1の実施の形態
の構成図である。図1を参照して、性能予測システム
は、プラットホームとなる並列計算機の並列度やプロセ
ッサの処理速度などのスペック、及び同時に処理される
プログラムの種類やそれらの数、各プログラムにおいて
スレッド化がどのようになされているかやセマフォ、ク
リティカルセクションがどのように採用されているかを
示すデータが入力されるシステムデータ入力部11と、
システムデータ入力部11からの情報を入力としモデル
を生成するモデル生成部12と、生成されたモデルから
向上度やより細かい性能指標であるスループット、レス
ポンス、リソース使用率などの性能指標予測値を算出す
る予測実行部13と、予測実行部13から出力された値
を可視的に表現する予測結果出力部14とを含んで構成
されている。
Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a configuration diagram of a first embodiment of a performance prediction system for a multitask system according to the present invention. Referring to FIG. 1, the performance prediction system includes a specification such as a parallelism of a parallel computer as a platform and a processing speed of a processor, types and numbers of programs to be simultaneously processed, and how threading is performed in each program. A system data input unit 11 for inputting data indicating whether or not a semaphore or a critical section is adopted;
A model generation unit 12 that generates a model by inputting information from the system data input unit 11 and calculates a performance index prediction value such as a throughput, a response, or a resource usage rate, which is a degree of improvement or a finer performance index, from the generated model And a prediction result output unit 14 that visually represents the value output from the prediction execution unit 13.

【0024】図2は性能予測システムの動作の手順を示
すフローチャートである。次に、この図2を参照しなが
ら性能予測システムの動作について説明する。まず、プ
ラットフォームとなる並列計算機のスペックがシステム
データ入力部11へ入力される(S1)。ここでのスペ
ックとは並列計算機の並列度などをいう。次に、システ
ムデータ入力部11へプログラムに関するデータが入力
される(S2)。そのプログラムに関するデータとは、
(1)同時に実行されるプログラムの種類およびそれら
の数を示すデータ、(2)各プログラムがどのようなタ
スク、スレッドで構成されているかを示すデータ、
(3)各プログラムがセマフォやクリティカルセクショ
ンをどのように用いているかを示すデータ、(4)各タ
スク、スレッドのプラットフォーム上のリソースの平均
使用頻度や平均使用時間を示すデータである。これらの
入力されたデータを基にモデル生成部12によりモデル
が生成される(S3)。
FIG. 2 is a flowchart showing the procedure of the operation of the performance prediction system. Next, the operation of the performance prediction system will be described with reference to FIG. First, the specifications of a parallel computer serving as a platform are input to the system data input unit 11 (S1). The specification here refers to the degree of parallelism of the parallel computer and the like. Next, data relating to the program is input to the system data input unit 11 (S2). The data about the program
(1) data indicating types of programs to be executed simultaneously and their numbers, (2) data indicating what tasks and threads each program is composed of,
(3) Data indicating how each program uses a semaphore or a critical section, and (4) Data indicating average use frequency and average use time of resources on the platform of each task and thread. A model is generated by the model generation unit 12 based on the input data (S3).

【0025】図1におけるモデル生成部12では、
(1)プログラムのセマフォやクリティカルセクション
などの構造がトークンを用いてモデル化され、(2)実
行状態にあるプログラムおよびスレッドが(待ち行列モ
デルでいうところの)客としてモデル化され、(3)並
列計算機が、プロセッサシェアリングによりサービスを
行う、並列度と等しい数の(待ち行列モデルでいうとこ
ろの)サーバとしてモデル化され、これにより待ち行列
網モデルが生成される。
In the model generator 12 in FIG.
(1) The structure of the program, such as semaphores and critical sections, is modeled using tokens. (2) Programs and threads in the execution state are modeled as customers (in the queue model). (3) A parallel computer is modeled as a number of servers (as referred to in the queuing model) that are served by processor sharing and equal in parallelism, thereby creating a queuing network model.

【0026】この待ち行列網モデルが予測実行部13に
より解析される(S4)。このモデルの状態の変化は各
タスク又はスレッドの処理速度が分かれば追うことがで
きるということが待ち行列理論において知られている。
この処理速度は、上記のようなシンプルなモデル化をし
たことにより、算出することが可能である。予測実行部
13では、これらの処理速度を算出した後、これらを用
いてモデルの状態の定常分布、モデルのスループット、
レスポンスタイムなどの性能予測値を待ち行列理論を用
いて算出する。そして、この算出値を予測結果出力部1
4が受け取り、数値のみならず指定されればグラフなど
も用いてユーザに理解しやすい形式にして掲示する(S
5)。
The queuing network model is analyzed by the prediction execution unit 13 (S4). It is known in queuing theory that changes in the state of this model can be followed if the processing speed of each task or thread is known.
This processing speed can be calculated by performing simple modeling as described above. After calculating these processing speeds, the prediction execution unit 13 uses them to calculate the steady state distribution of the model state, the model throughput,
A performance prediction value such as a response time is calculated using queuing theory. Then, the calculated value is output to the prediction result output unit 1.
4 is received and displayed in a format that is easy for the user to understand using not only the numerical value but also a graph if specified (S
5).

【0027】例えば次のようなシステムを例として取り
上げてみる。図3はプログラムの実行タイミングの一例
を示すタイミングチャートである。同時に実行されるプ
ログラムは1種類でその数は常時K(Kは2以上の整
数)個であるとする。又、図3に示されるように各プロ
グラムは、タスク1とタスク2とから構成され、この2
つのタスク1,2の実行を繰り返すものとする。又、タ
スクi(iは1又は2とする)はh(i)個のセマフォ
で制御されている。つまり、同時にタスクiを実行でき
るプログラムはシステム全体でh(i)個である。又、
並列計算機の並列度に関わらず、タスク1の処理は平均
μ(1)秒/回だけプロセッサを使用し、タスク2の処
理はμ(2)秒/回だけプロセッサを使用するとする。
又、並列度はnとする。
For example, the following system is taken as an example. FIG. 3 is a timing chart showing an example of the execution timing of the program. It is assumed that one type of program is executed at the same time, and the number is always K (K is an integer of 2 or more). As shown in FIG. 3, each program is composed of a task 1 and a task 2.
The execution of the two tasks 1 and 2 is repeated. Task i (i is 1 or 2) is controlled by h (i) semaphores. That is, the number of programs that can execute the task i at the same time is h (i) in the entire system. or,
Regardless of the degree of parallelism of the parallel computer, it is assumed that the processing of task 1 uses a processor only on average μ (1) seconds / time, and the processing of task 2 uses a processor only on μ (2) seconds / time.
The degree of parallelism is n.

【0028】このようなシステムは、図4の待ち行列網
モデルの模式説明図に示されるように、(1)K人の客
21が網内を循環し、(2)客21は種類i(iは1又
は2)のトークンを確保したのちにタスクiの処理をサ
ービスステーション22で受け、処理を終了するとトー
クンを解放し、(3)トークンの割り当てはFIFO
(先着先出し)の規律で行われ、(4)客21はタスク
1とタスク2を交互に行い、(5)種類iのトークンは
h(i)個あり、(6)サービスステーション22はプ
ロセッサシェアリングで客21をサービスするn(nは
正の整数)個のサーバ23で構成される、という待ち行
列網モデルとしてモデル生成部12においてモデル化さ
れる。
In such a system, as shown in the schematic explanatory diagram of the queuing network model in FIG. 4, (1) K customers 21 circulate in the network, and (2) customers 21 are of type i ( i secures the token of 1 or 2), receives the processing of task i at the service station 22, releases the token when the processing is completed, and (3) allocates the token to the FIFO.
(4) The customer 21 performs task 1 and task 2 alternately, (5) there are h (i) tokens of type i, and (6) the service station 22 shares the processor. It is modeled in the model generation unit 12 as a queuing network model that is composed of n (n is a positive integer) servers 23 that service customers 21 by a ring.

【0029】さらに具体的に説明すると、「K人の客2
1」とはプログラム1〜Kの各々をいい、客21は種類
1のトークンを獲得した後に行う処理1と、種類2のト
ークンを獲得した後に行う処理2の2種類の処理を交互
に繰り返す。ただし、各種類のトークンの数には制限が
あるため、トークンを獲得できるまで客21はバッファ
24に並んで空きができるまで待つ。そして、トークン
を獲得した客21はサービスステーション22に進み、
n個のサーバ23からプロセッサシェアリングの規律で
サービスを受ける。そして、サービスステーション22
にて処理1を終了した客21は種類2のトークンを獲得
するために移動し、処理2を終了した客21は種類1の
トークンを獲得するために移動する。
More specifically, “K customer 2
"1" refers to each of the programs 1 to K, and the customer 21 alternately repeats two types of processes, a process 1 performed after acquiring a type 1 token and a process 2 performed after acquiring a type 2 token. However, since the number of tokens of each type is limited, the customer 21 waits for a free space in the buffer 24 until a token can be obtained. Then, the customer 21 who has obtained the token proceeds to the service station 22,
The service is received from the n servers 23 under the discipline of processor sharing. And the service station 22
The customer 21 who has completed the processing 1 moves to obtain a type 2 token, and the customer 21 who has completed the processing 2 moves to obtain a type 1 token.

【0030】この待ち行列網モデルを予測実行部13に
おいて解析する。タスクiを実行中の客数をX(i)で
表現するならば、モデルの状態は X=(X(1),X(2)) …(1) により表現することができる。この状態Xの変化の速度
は(この状態Xに依存する)タスクiの処理速度として
求めることができる。L(i)=min(h(i),X
(i))と表すと、この例の場合、状態Xの時の各タス
クの処理速度は、 処理1の処理速度τ(1| X)=n*μ(1)L(1)/max(n,L( 1)+L(2)) …(2) 処理2の処理速度τ(2| X)=n*μ(2)L(2)/max(n,L( 1)+L(2)) …(3) と求めることができる。モデルの状態変化の速度を算出
できれば状態Xとなる定常分布、モデルのスループッ
ト、レスポンスタイムを算出することは待ち行列理論を
用いれば容易なことである。例えばこの例におけるスル
ープットλは、
The queuing network model is analyzed by the prediction execution unit 13. If the number of customers executing task i is represented by X (i), the state of the model can be represented by X = (X (1), X (2)) (1). The speed of the change of the state X can be obtained as the processing speed of the task i (dependent on the state X). L (i) = min (h (i), X
(I)), in this case, the processing speed of each task in the state X is the processing speed τ (1 | X) = n * μ (1) L (1) / max ( n, L (1) + L (2)) (2) Processing speed τ (2 | X) = n * μ (2) L (2) / max (n, L (1) + L (2) of processing 2 ) (3) can be obtained. It is easy to calculate the steady-state distribution which becomes the state X if the speed of the state change of the model can be calculated, the throughput of the model, and the response time by using the queuing theory. For example, the throughput λ in this example is

【0031】[0031]

【数1】 (Equation 1)

【0032】のように陽に算出することができる。速度
向上率、効率、レスポンス、リソースの使用率などの他
の性能指標も待ち行列理論を適用することで陽に予測す
ることができる。予測実行部13はモデルの性能指標の
計算結果を予測値として出力する。そして、この出力を
予測結果出力部14が受け取り、数値をグラフなども用
いてユーザに理解しやすい形式にして掲示する。
The calculation can be explicitly performed as follows. Other performance indicators, such as speedup, efficiency, response, and resource utilization, can also be explicitly predicted by applying queuing theory. The prediction execution unit 13 outputs a calculation result of the performance index of the model as a predicted value. The output is received by the prediction result output unit 14, and the numerical values are displayed in a format that is easy for the user to understand using a graph or the like.

【0033】次に第1の実施の形態の効果について説明
する。本発明は、マルチタスク環境又はマルチスレッド
環境における実際のシステムを適切にかつシンプルに理
論解析が可能な待ち行列網モデルとしてモデル化してい
るために、マルチタスク環境又はマルチスレッド環境に
おける並列計算機システムの性能指標を容易にかつ精度
よく予測できる。又、適切なモデル化により、従来の手
法に比べ様々な指標を予測することができる。
Next, effects of the first embodiment will be described. Since the present invention models an actual system in a multitask environment or a multithread environment as a queuing network model capable of appropriately and simply performing a theoretical analysis, the present invention provides a parallel computer system in a multitask environment or a multithread environment. The performance index can be easily and accurately predicted. By appropriate modeling, various indices can be predicted as compared with the conventional method.

【0034】なお、上記実施の形態では、先に触れたよ
うに、予測実行部13における解析手段として、待ち行
列理論のかわりにシミュレーションを用いてもよい。
又、モデル化においては、プラットフォームのリソース
をさらに細かく待ち行列でいうサーバとしてモデル化し
てもよい。この場合は待ち行列理論を用いても陽な式と
しては処理性能の向上度や性能予測指標を求めることは
できないが、近似計算法やシミュレーションを用いるこ
とにより同様に精度よく数値的に算出することが可能で
ある。
In the above embodiment, as mentioned above, a simulation may be used as the analysis means in the prediction execution unit 13 instead of the queue theory.
In the modeling, the resources of the platform may be modeled more finely as a server referred to in a queue. In this case, even if the queuing theory is used, it is not possible to obtain the degree of improvement in processing performance or the performance prediction index as an explicit expression, but it is necessary to similarly calculate numerically with high accuracy by using an approximate calculation method or simulation. Is possible.

【0035】プラットホームのリソースをさらに細かく
モデル化した例を挙げることにする。図5はプラットホ
ームのリソースをさらに細かくした待ち行列網モデルの
模式説明図である。なお、図4の模式説明図と同様の構
成部分には同一番号を付し、その説明を省略する。予測
の対象となるシステムは上記と同様であるが、プラット
ホームとなる並列計算機のリソースとしてハードディス
ク32,34が夫々存在し、これらのリソースのタス
ク、スレッドによる競合も考慮に入れて性能指標の予測
を行う。
An example in which the resources of the platform are more finely modeled will be described. FIG. 5 is a schematic explanatory diagram of a queuing network model in which the resources of the platform are further reduced. Note that the same components as those in the schematic explanatory diagram of FIG. 4 are denoted by the same reference numerals, and description thereof will be omitted. The systems to be predicted are the same as those described above, but the hard disks 32 and 34 exist as resources of the parallel computer serving as the platform, and the performance index is predicted by taking into account the competition between tasks and threads of these resources. Do.

【0036】タスク1はハードディスク32を利用し、
タスク2はハードディスク34を利用するとする。この
場合は、図5に示されるように、図4で示された待ち行
列網モデルにハードディスク32に相当するサービスス
テーション31とハードディスク34に相当するサービ
スステーション33を加えた形で待ち行列網モデルとし
てモデル化すればよい。ここでは、サービスステーショ
ン31とサービスステーション33はともに1つのサー
バーと1つのバッファで構成されており、サービス規律
をFIFOとしているが、リソースのモデル化はその特
性を反映した形で適切に行う必要がある。又、予測のた
めの解析手法は上記と同様である。
Task 1 uses the hard disk 32,
Task 2 uses the hard disk 34. In this case, as shown in FIG. 5, a service station 31 corresponding to the hard disk 32 and a service station 33 corresponding to the hard disk 34 are added to the queuing network model shown in FIG. You only need to model it. In this case, the service station 31 and the service station 33 are both composed of one server and one buffer, and the service discipline is FIFO. However, it is necessary to appropriately perform resource modeling in a form that reflects its characteristics. is there. The analysis method for prediction is the same as described above.

【0037】次に、第2の実施の形態について説明す
る。その基本的構成は第1の実施の形態と同様である
が、システムにおいて適切なプラットホームのスペック
を特定するために、プラットホームのスペック(具体的
には並列度など)を予測を行いたい範囲のパラメータと
してシステムデータ入力部11に与える。モデル生成部
12は、プラットホームのスペックをパラメータにした
形でモデル化を行う。予測実行部13は、与えられた範
囲でパラメータを変化させ、第1の実施の形態と同じ方
法で予測値を算出する。予測結果出力部14はその計算
結果を受取り、パラメータに対する予測値をユーザに理
解しやすい形式にし表示を行う。ユーザはこの結果か
ら、どのパラメータが適切であるかを判断する。つま
り、適切なプラットホームとなる並列計算機のスペック
を判断する。
Next, a second embodiment will be described. The basic configuration is the same as that of the first embodiment, but in order to specify an appropriate platform specification in the system, a parameter in a range in which the specification of the platform (specifically, the degree of parallelism, etc.) is to be predicted is specified. To the system data input unit 11. The model generation unit 12 performs modeling using the specifications of the platform as parameters. The prediction executing unit 13 changes the parameter within the given range, and calculates a predicted value by the same method as in the first embodiment. The prediction result output unit 14 receives the calculation result, and displays a prediction value for the parameter in a format that is easy for the user to understand. From this result, the user determines which parameter is appropriate. That is, the specifications of the parallel computer which is an appropriate platform are determined.

【0038】例えば、先の第1の実施の形態で用いたシ
ステムに対して並列度nを1から16の範囲とした場合
のスループットを予測し、適切な並列度を算出すること
を考える。ユーザは第1の形態における実施例と同様の
手順でモデルを生成するが、並列度は1からnのパラメ
ータであると指定した入力をシステムデータ入力部11
に対して行う。モデル生成部12は、並列度を1からn
までのパラメータとしてモデルを生成し、それらのモデ
ルを予測実行部13においてパラメータの値を変えなが
ら性能指標の予測値を算出する。そしてユーザに理解し
やすい形にし、表示を行うが、この場合、並列度nに対
するスループットを数値だけではなく、図6に示すよう
なグラフにして表示するとよい。図6を参照して、要求
性能が秒当り4件だとするならば、並列度は5以上でな
ければならないことがわかる。
For example, consider the case where the throughput in the case where the parallel degree n is in the range of 1 to 16 is predicted for the system used in the first embodiment, and an appropriate parallel degree is calculated. The user creates a model in the same procedure as in the embodiment of the first embodiment, but inputs an input designating that the degree of parallelism is a parameter of 1 to n.
Do for The model generation unit 12 sets the degree of parallelism from 1 to n
Models are generated as the parameters up to and the prediction execution unit 13 calculates the predicted values of the performance indexes while changing the parameter values. Then, the data is displayed in a form that is easy for the user to understand. In this case, the throughput with respect to the parallelism n may be displayed as a graph as shown in FIG. Referring to FIG. 6, it can be seen that if the required performance is 4 per second, the degree of parallelism must be 5 or more.

【0039】次に第2の実施の形態の効果について説明
する。本発明はプラットホームのスペックをパラメータ
とし、そのパラメータに対する予測値を見ることができ
る。このため、システムが要求されている性能仕様を満
たすために必要なプラットホームのスペックを決定する
ために必要な客観的なデータ(性能指標)を予測値とし
て得ることができる。
Next, effects of the second embodiment will be described. According to the present invention, the specifications of the platform are used as parameters, and predicted values for the parameters can be viewed. For this reason, objective data (performance index) required to determine the specifications of the platform required to satisfy the performance specifications required by the system can be obtained as predicted values.

【0040】次に、第3の実施の形態について説明す
る。その基本的構成は第1の実施の形態と同様である
が、プログラムにおけるセマフォやクリティカルセクシ
ョンの数や構成、各タスク,スレッドのプラットホーム
上のリソースの平均使用時間、平均利用頻度などといっ
たプログラム構造に関するデータを予測を行いたい範囲
のパラメータとしてシステムデータ入力部11に与え
る。
Next, a third embodiment will be described. Its basic configuration is the same as that of the first embodiment, but it relates to the program structure such as the number and configuration of semaphores and critical sections in a program, and the average use time and average use frequency of resources on each platform of tasks and threads. The data is provided to the system data input unit 11 as a parameter in a range in which prediction is to be performed.

【0041】モデル生成部12は、プログラムデータを
パラメータにした形でモデル化を行う。予測実行部13
は、与えられた範囲でパラメータを変化させ、第1の実
施の形態と同じ方法で予測値を算出する。予測結果出力
部14はその計算結果を受け取り、パラメータに対する
予測値をユーザに理解しやすい形式にし表示を行う。ユ
ーザはこの結果から、どのパラメータが適切であるかを
判断する。つまり、適切なプログラム構造を判断する。
The model generation unit 12 performs modeling using program data as parameters. Prediction execution unit 13
Calculates the predicted value in the same manner as in the first embodiment by changing the parameter within the given range. The prediction result output unit 14 receives the calculation result, and displays a prediction value for the parameter in a format that is easy for the user to understand. From this result, the user determines which parameter is appropriate. That is, an appropriate program structure is determined.

【0042】例えば、先の第1の実施の形態で用いたシ
ステムに対してタスク1のセマフォの数を1(h(1)
=1)とし、タスク2のセマフォの数h(2)をパラメ
ータとし、1〜hまで変化させた場合のスループットを
予測し、適切セマフォの数を算出することを考える。ユ
ーザは第1の形態における実施例と同様の手順でモデル
を生成するが、セマフォの数h(2)は1からhのパラ
メータであると指定した入力をシステムデータ入力部1
1に対して行う。モデル生成部12は、セマフォの数h
(2)を1からhまでのパラメータとしてモデルを生成
し、それらのモデルを予測実行部13がパラメータの値
を変えながら性能予測値を算出する。そして予測結果出
力部14においてユーザに理解しやすい形にし表示を行
う。この場合もh(2)に対するスループットを数値だ
けではなく、グラフデータなども表示するとよい。
For example, for the system used in the first embodiment, the number of semaphores of task 1 is set to 1 (h (1)
= 1), the number of semaphores in task 2 is used as a parameter, and the throughput when the number of semaphores is changed from 1 to h is predicted to calculate the appropriate number of semaphores. The user creates a model in the same procedure as in the embodiment in the first embodiment, but inputs an input specifying that the number h (2) of semaphores is a parameter from 1 to h.
Perform for 1 The model generation unit 12 calculates the number of semaphores h
Models are generated using (2) as parameters from 1 to h, and the prediction execution unit 13 calculates performance prediction values of these models while changing parameter values. Then, the prediction result output unit 14 performs display in a form that is easy for the user to understand. Also in this case, it is preferable to display not only the numerical value of the throughput for h (2) but also graph data.

【0043】次に第3の実施の形態の効果を示す。本発
明はプログラムにおけるセマフォの数などプログラム構
造に関するデータをパラメータとし、そのパラメータに
対する予測値を見ることができる。このため、システム
が要求されている性能仕様を満たすためにはプログラム
構造をどのようにすればよいか判断するために必要な客
観的なデータを得ることができる。
Next, the effects of the third embodiment will be described. According to the present invention, data relating to a program structure such as the number of semaphores in a program is used as a parameter, and a predicted value for the parameter can be viewed. Therefore, it is possible to obtain objective data necessary for determining how to configure the program structure to satisfy the required performance specifications of the system.

【0044】次に、第4の実施の形態について説明す
る。その基本的構成は第1の実施の形態と同様である
が、同時に実行されるプログラム又はタスクの数、スレ
ッドの数などのシステムの負荷に関するデータを予測を
行いたい範囲のパラメータとしてシステムデータ入力部
11に与える。モデル生成部12は、このようなシステ
ムの負荷をパラメータにした形でモデル化を行う。予測
実行部13は、与えられた範囲でパラメータを変化さ
せ、第1の実施の形態と同じ方法で予測値を算出する。
予測結果出力部14はその計算結果を受け取り、パラメ
ータに対する予測値をユーザに理解しやすい形式にし表
示を行う。ユーザはこの結果から、どのパラメータが適
切であるかを判断する。つまり、適切な負荷を判断す
る。
Next, a fourth embodiment will be described. Its basic configuration is the same as that of the first embodiment, but the system data input unit is used as a parameter in a range in which data relating to the load of the system such as the number of programs or tasks to be executed at the same time, the number of threads, etc. Give to 11. The model generation unit 12 performs modeling using the load of such a system as a parameter. The prediction executing unit 13 changes the parameter within the given range, and calculates a predicted value by the same method as in the first embodiment.
The prediction result output unit 14 receives the calculation result, and displays a prediction value for the parameter in a format that is easy for the user to understand. From this result, the user determines which parameter is appropriate. That is, an appropriate load is determined.

【0045】例えば、先の第1の実施の形態で用いたシ
ステムに対してプログラムの数を1〜Kまで変化させた
場合のスループットを予測し、適切な同時に実行するプ
ログラムの数を算出することを考える。ユーザは第1の
形態における実施例と同様の手順でモデルを生成する
が、プログラムの数を1からKのパラメータであると指
定した入力をシステムデータ入力部11に対して行う。
モデル生成部12は、プログラムの数kを1からKまで
のパラメータとしてモデルを生成し、それらのモデルを
予測実行部13がパラメータの値を変えながら性能予測
値を算出する。そして予測結果出力部14はその計算結
果を受け取り、ユーザに理解しやすい形にし表示を行
う。
For example, the throughput when the number of programs is changed from 1 to K with respect to the system used in the first embodiment is estimated, and the appropriate number of simultaneously executing programs is calculated. think of. The user generates a model in the same procedure as in the example of the first embodiment, but inputs an input to the system data input unit 11 specifying the number of programs as a parameter from 1 to K.
The model generation unit 12 generates models using the number k of programs as a parameter from 1 to K, and the prediction execution unit 13 calculates the performance prediction values of these models while changing the parameter values. Then, the prediction result output unit 14 receives the calculation result, and displays it in a form that is easy for the user to understand.

【0046】次に、第4の実施の形態の効果を示す。本
発明はプログラムにおけるプログラムの数などシステム
における負荷をパラメータとし、そのパラメータに対す
る予測値を見ることができる。このため、システムが要
求されている性能仕様を満たすためにはシステムにおけ
る負荷をどのようにすればよいか判断するために必要な
客観的なデータを得ることができる。
Next, effects of the fourth embodiment will be described. According to the present invention, a load in the system such as the number of programs in a program is used as a parameter, and a predicted value for the parameter can be viewed. Therefore, it is possible to obtain objective data necessary for determining how to load the system in order to satisfy the required performance specifications of the system.

【0047】次に、第5の実施の形態について説明す
る。第5の実施の形態は性能予測方法プログラムを記録
した記録媒体に関するものである。図7は記録媒体及び
記録媒体駆動装置の構成図である。図7を参照して、記
録媒体駆動装置はCPU(中央処理装置)41と、入力
部42と、記憶部43と、性能予測システム44とを含
んで構成され、この駆動装置で記録媒体45を駆動す
る。
Next, a fifth embodiment will be described. The fifth embodiment relates to a recording medium on which a performance prediction method program is recorded. FIG. 7 is a configuration diagram of a recording medium and a recording medium driving device. Referring to FIG. 7, the recording medium driving device includes a CPU (central processing unit) 41, an input unit 42, a storage unit 43, and a performance prediction system 44. Drive.

【0048】性能予測システム44は図1に示されるシ
ステムデータ入力部11、モデル生成部12、予測実行
部13及び予測結果出力部14から構成されている。
又、記録媒体45には図2のフローチャートで示される
性能予測方法プログラムが予め記憶されている。
The performance prediction system 44 comprises a system data input unit 11, a model generation unit 12, a prediction execution unit 13, and a prediction result output unit 14 shown in FIG.
The recording medium 45 stores a performance prediction method program shown in the flowchart of FIG. 2 in advance.

【0049】次に、この駆動装置の動作について説明す
る。まず、入力部42を介してCPU41に性能予測方
法プログラムのロード(LOAD)命令が入力される
と、CPU41は記録媒体45から性能予測方法プログ
ラムを読込み、その読込んだプログラムを記憶部43に
書込む。次に、入力部42を介してCPU41に性能予
測方法プログラムのラン(RUN)命令が入力される
と、CPU41は記憶部43から性能予測方法プログラ
ムを読込み、その読込んだプログラムにより性能予測シ
ステム44を制御する。その制御の内容については前述
したので説明を省略する。
Next, the operation of the driving device will be described. First, when a load (LOAD) instruction for a performance prediction method program is input to the CPU 41 via the input unit 42, the CPU 41 reads the performance prediction method program from the recording medium 45, and writes the read program in the storage unit 43. Put in. Next, when a run (RUN) instruction of the performance prediction method program is input to the CPU 41 via the input unit 42, the CPU 41 reads the performance prediction method program from the storage unit 43, and uses the read program to execute the performance prediction system 44. Control. Since the contents of the control have been described above, the description is omitted.

【0050】[0050]

【発明の効果】本発明による第1の発明によれば、並列
計算機をプラットホームとするマルチタスクシステムの
性能予測システムであって、そのシステムはマルチタス
ク環境でのリソースの競合を待ち行列網モデルを用いて
モデル化するモデル化手段と、そのモデル化されたリソ
ースの競合を待ち行列理論を用いて解析し前記マルチタ
スクシステムの性能指標を予測する性能指標予測手段と
を含むため、まず第1にマルチタスク環境またはマルチ
スレッド環境における並列計算機の並列度に対する性能
の向上度や性能指標を正しく予測することができる。次
に第2にかけられるコストにふさわしい並列度、より具
体的にはプロセッサの数の決定を適切に判断することが
できる。第3にプログラム構造におけるボトルネックを
特定することができる。第4に要求性能を満足するため
に、同時に実行するプログラムの構成やタスク数といっ
たシステムに対する負荷をどのように設定すべきかを適
切に判断することができる。第5にシステムにおけるス
ループット、レスポンスタイム、リソースの使用率とい
った細かい性能指標の予測が可能となる。
According to a first aspect of the present invention, there is provided a performance prediction system for a multitasking system using a parallel computer as a platform. The system predicts resource competition in a multitasking environment by using a queuing network model. First, since it includes a modeling means for modeling using the above, and a performance index prediction means for analyzing the competition of the modeled resources by using queuing theory and predicting the performance index of the multitask system, In the multitask environment or the multithread environment, it is possible to correctly predict the performance improvement degree and the performance index with respect to the parallelism of the parallel computer. Next, it is possible to appropriately determine the degree of parallelism appropriate for the second cost, more specifically, the determination of the number of processors. Third, a bottleneck in the program structure can be specified. Fourth, it is possible to appropriately determine how to set the load on the system such as the configuration of programs to be executed simultaneously and the number of tasks to satisfy the required performance. Fifth, it is possible to predict detailed performance indicators such as throughput, response time, and resource usage in the system.

【0051】又、本発明による第2の発明によれば、並
列計算機をプラットホームとするマルチタスクシステム
の性能予測方法であって、その方法はマルチタスク環境
でのリソースの競合を待ち行列網モデルを用いてモデル
化する第1ステップと、そのモデル化されたリソースの
競合を待ち行列理論を用いて解析し前記マルチタスクシ
ステムの性能指標を予測する第2ステップとを含むため
第1の発明と同様の効果を奏する。
According to a second aspect of the present invention, there is provided a method for predicting the performance of a multitask system using a parallel computer as a platform. And a second step of analyzing the competition of the modeled resources using queuing theory and predicting a performance index of the multitask system. Has the effect of

【0052】又、本発明による第3の発明によれば、並
列計算機をプラットホームとするマルチタスクシステム
の性能予測方法プログラムを記録した記録媒体であっ
て、その記録媒体にはマルチタスク環境でのリソースの
競合を待ち行列網モデルを用いてモデル化する第1ステ
ップと、そのモデル化されたリソースの競合を待ち行列
理論を用いて解析し前記マルチタスクシステムの性能指
標を予測する第2ステップとを含むプログラムが記録さ
れているため第1の発明と同様の効果を奏する。
According to a third aspect of the present invention, there is provided a recording medium recording a program for predicting the performance of a multitasking system using a parallel computer as a platform, the recording medium comprising a resource in a multitasking environment. And a second step of analyzing the competition of the modeled resources using queuing theory and predicting the performance index of the multitask system. Since the program including the program is recorded, the same effect as that of the first invention can be obtained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係るマルチタスクシステムの性能予測
システムの第1の実施の形態の構成図である。
FIG. 1 is a configuration diagram of a first embodiment of a performance prediction system of a multitask system according to the present invention.

【図2】性能予測システムの動作の手順を示すフローチ
ャートである。
FIG. 2 is a flowchart illustrating a procedure of an operation of the performance prediction system.

【図3】プログラムの実行タイミングの一例を示すタイ
ミングチャートである。
FIG. 3 is a timing chart showing an example of a program execution timing.

【図4】待ち行列網モデルの模式説明図である。FIG. 4 is a schematic explanatory diagram of a queuing network model.

【図5】プラットホームのリソースをさらに細かくした
待ち行列網モデルの模式説明図である。
FIG. 5 is a schematic explanatory diagram of a queuing network model in which the resources of the platform are further refined.

【図6】スループット対並列度特性図である。FIG. 6 is a plot of throughput versus parallelism.

【図7】記録媒体及び記録媒体駆動装置の構成図であ
る。
FIG. 7 is a configuration diagram of a recording medium and a recording medium driving device.

【図8】並列計算機をプラットホームとするマルチタス
ク環境でのコンピュータシステムの一例を示す構成図で
ある。
FIG. 8 is a configuration diagram illustrating an example of a computer system in a multitask environment using a parallel computer as a platform.

【符号の説明】[Explanation of symbols]

11 システムデータ入力部 12 モデル生成部 13 予測実行部 14 予測結果出力部 45 記録媒体 Reference Signs List 11 system data input unit 12 model generation unit 13 prediction execution unit 14 prediction result output unit 45 recording medium

Claims (13)

【特許請求の範囲】[Claims] 【請求項1】 並列計算機をプラットホームとするマル
チタスクシステムの性能予測システムであって、 マルチタスク環境でのリソースの競合を待ち行列網モデ
ルを用いてモデル化するモデル化手段と、そのモデル化
されたリソースの競合を待ち行列理論を用いて解析し前
記マルチタスクシステムの性能指標を予測する性能指標
予測手段とを含むことを特徴とするマルチタスクシステ
ムの性能予測システム。
1. A performance prediction system for a multitasking system having a parallel computer as a platform, comprising: a modeling means for modeling contention of resources in a multitasking environment using a queuing network model; And a performance index predicting means for analyzing the contention of the resources using queuing theory and predicting the performance index of the multitask system.
【請求項2】 前記モデル化手段は前記並列計算機のス
ペックが入力されるデータ入力部と、このデータ入力部
に入力されたデータを用いてモデルを生成するモデル生
成部とを含むことを特徴とする請求項1記載の性能予測
システム。
2. The method according to claim 1, wherein the modeling unit includes a data input unit to which the specifications of the parallel computer are input, and a model generation unit that generates a model using the data input to the data input unit. The performance prediction system according to claim 1, wherein
【請求項3】 前記性能指標予測手段は前記モデル化手
段にてモデル化されたリソースの競合を解析し性能指標
を予測する予測実行部と、この予測実行部での予測結果
を出力する予測結果出力部とを含むことを特徴とする請
求項1又は2記載の性能予測システム。
3. The performance index predicting unit analyzes a competition of resources modeled by the modeling unit and predicts a performance index, and a prediction result output by the prediction executing unit. The performance prediction system according to claim 1, further comprising an output unit.
【請求項4】 前記モデル化手段はプラットホームのス
ペックをパラメータとしてモデル化を行い、前記性能指
標予測手段はそのパラメータに対する性能指標を予測す
ることを特徴とする請求項1乃至3いずれかに記載の性
能予測システム。
4. The apparatus according to claim 1, wherein the modeling unit performs modeling using a platform specification as a parameter, and the performance index prediction unit predicts a performance index for the parameter. Performance prediction system.
【請求項5】 前記モデル化手段はセマフォやクリティ
カルセクションをはじめとした実行されるプログラムの
構造をパラメータとしてモデル化を行い、前記性能指標
予測手段はそのパラメータに対する性能指標を予測する
ことを特徴とする請求項1乃至3いずれかに記載の性能
予測システム。
5. The method according to claim 1, wherein the modeling unit performs modeling using a structure of a program to be executed including a semaphore and a critical section as a parameter, and the performance index prediction unit predicts a performance index for the parameter. The performance prediction system according to any one of claims 1 to 3.
【請求項6】 前記モデル化手段は同時に実行されるプ
ログラム又はタスクの数、スレッドの数などのシステム
負荷をパラメータとしてモデル化を行い、前記性能指標
予測手段はそのパラメータに対する性能指標を予測する
ことを特徴とする請求項1乃至3いずれかに記載の性能
予測システム。
6. The modeling means performs modeling using a system load such as the number of programs or tasks executed simultaneously and the number of threads as a parameter, and the performance index prediction means predicts a performance index for the parameter. The performance prediction system according to any one of claims 1 to 3, wherein
【請求項7】 前記性能指標予測手段は前記待ち行列網
モデルの状態の変化を各タスク又はスレッドの処理速度
から追うことにより前記待ち行列網モデルのスループッ
トを性能予測値として算出することを特徴とする請求項
1乃至6いずれかに記載の性能予測システム。
7. The performance index predicting means calculates the throughput of the queuing network model as a performance prediction value by following a change in the state of the queuing network model from the processing speed of each task or thread. The performance prediction system according to claim 1.
【請求項8】 並列計算機をプラットホームとするマル
チタスクシステムの性能予測方法であって、 マルチタスク環境でのリソースの競合を待ち行列網モデ
ルを用いてモデル化する第1ステップと、そのモデル化
されたリソースの競合を待ち行列理論を用いて解析し前
記マルチタスクシステムの性能指標を予測する第2ステ
ップとを含むことを特徴とするマルチタスクシステムの
性能予測方法。
8. A method for predicting the performance of a multitasking system using a parallel computer as a platform, comprising: a first step of modeling resource contention in a multitasking environment using a queuing network model; Analyzing the contention of the resources using queuing theory and predicting the performance index of the multitasking system.
【請求項9】 前記第1ステップは前記並列計算機のス
ペックをデータ入力部に入力する第11ステップと、こ
のデータ入力部に入力されたデータを用いてモデルを生
成する第12ステップとを含むことを特徴とする請求項
8記載の性能予測方法。
9. The first step includes an eleventh step of inputting the specifications of the parallel computer to a data input unit and a twelfth step of generating a model using the data input to the data input unit. 9. The performance prediction method according to claim 8, wherein:
【請求項10】 前記第2ステップは前記第1ステップ
にてモデル化されたリソースの競合を解析し性能指標を
予測する第21ステップと、この第21ステップでの予
測結果を出力する第22ステップとを含むことを特徴と
する請求項8又は9記載の性能予測方法。
10. The second step is a twenty-first step of analyzing contention of resources modeled in the first step and predicting a performance index, and a twenty-second step of outputting a prediction result in the twenty-first step. 10. The performance prediction method according to claim 8, further comprising:
【請求項11】 並列計算機をプラットホームとするマ
ルチタスクシステムの性能予測方法プログラムを記録し
た記録媒体であって、 マルチタスク環境でのリソースの競合を待ち行列網モデ
ルを用いてモデル化する第1ステップと、そのモデル化
されたリソースの競合を待ち行列理論を用いて解析し前
記マルチタスクシステムの性能指標を予測する第2ステ
ップとを含むプログラムを記録した記録媒体。
11. A recording medium recording a program for predicting the performance of a multitask system using a parallel computer as a platform, wherein a first step of modeling contention of resources in a multitask environment using a queuing network model. And a second step of analyzing the modeled resource conflict using queuing theory and predicting the performance index of the multitasking system.
【請求項12】 前記第1ステップは前記並列計算機の
スペックをデータ入力部に入力する第11ステップと、
このデータ入力部に入力されたデータを用いてモデルを
生成する第12ステップとを含むことを特徴とする請求
項11記載の記録媒体。
12. The first step is an eleventh step of inputting specifications of the parallel computer to a data input unit;
A twelfth step of generating a model using the data input to the data input unit.
【請求項13】 前記第2ステップは前記第1ステップ
にてモデル化されたリソースの競合を解析し性能指標を
予測する第21ステップと、この第21ステップでの予
測結果を出力する第22ステップとを含むことを特徴と
する請求項11又は12記載の記録媒体。
13. The second step is a twenty-first step of analyzing contention of resources modeled in the first step and predicting a performance index, and a twenty-second step of outputting a prediction result in the twenty-first step. 13. The recording medium according to claim 11, comprising:
JP10603399A 1999-04-14 1999-04-14 Multitask system performance prediction system, prediction method, and recording medium recording the method program Expired - Fee Related JP3663968B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10603399A JP3663968B2 (en) 1999-04-14 1999-04-14 Multitask system performance prediction system, prediction method, and recording medium recording the method program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10603399A JP3663968B2 (en) 1999-04-14 1999-04-14 Multitask system performance prediction system, prediction method, and recording medium recording the method program

Publications (2)

Publication Number Publication Date
JP2000298593A true JP2000298593A (en) 2000-10-24
JP3663968B2 JP3663968B2 (en) 2005-06-22

Family

ID=14423337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10603399A Expired - Fee Related JP3663968B2 (en) 1999-04-14 1999-04-14 Multitask system performance prediction system, prediction method, and recording medium recording the method program

Country Status (1)

Country Link
JP (1) JP3663968B2 (en)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006046297A1 (en) * 2004-10-28 2006-05-04 Fujitsu Limited Analyzing method and device
US7587437B2 (en) 2002-07-22 2009-09-08 Fujitsu Limited Parallel efficiency calculation method and apparatus
JP2009205541A (en) * 2008-02-28 2009-09-10 Mitsubishi Electric Corp Performance evaluation device, performance evaluation program, and performance evaluation method
US8219359B2 (en) 2008-06-25 2012-07-10 Nec Corporation Performance evaluating apparatus
WO2013001576A1 (en) * 2011-06-29 2013-01-03 Nec Corporation Multiprocessor system and method of saving energy therein
EP2879055A1 (en) * 2013-11-25 2015-06-03 Tata Consultancy Services Limited System and method facilitating performance prediction of multi-threaded application in presence of resource bottlenecks
KR101553923B1 (en) 2012-09-24 2015-09-18 삼성에스디에스 주식회사 Apparatus and method for analyzing system usage
US9600290B2 (en) 2013-12-17 2017-03-21 International Business Machines Corporation Calculation method and apparatus for evaluating response time of computer system in which plurality of units of execution can be run on each processor core
CN109840597A (en) * 2017-11-28 2019-06-04 珠海市君天电子科技有限公司 A kind of model prediction method, apparatus, electronic equipment and storage medium
CN111352085A (en) * 2020-04-29 2020-06-30 北京国鼎源创智能科技有限公司 System for judging signal processing performance and computing resource use of pulse Doppler radar
JP7012905B1 (en) * 2020-12-28 2022-01-28 三菱電機株式会社 Schedule generator, schedule generation method and schedule generation program

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7587437B2 (en) 2002-07-22 2009-09-08 Fujitsu Limited Parallel efficiency calculation method and apparatus
US8255442B2 (en) 2002-07-22 2012-08-28 Fujitsu Limited Parallel efficiency calculation method and apparatus
WO2006046297A1 (en) * 2004-10-28 2006-05-04 Fujitsu Limited Analyzing method and device
US8560667B2 (en) 2004-10-28 2013-10-15 Fujitsu Limited Analysis method and apparatus
JP2009205541A (en) * 2008-02-28 2009-09-10 Mitsubishi Electric Corp Performance evaluation device, performance evaluation program, and performance evaluation method
US8219359B2 (en) 2008-06-25 2012-07-10 Nec Corporation Performance evaluating apparatus
WO2013001576A1 (en) * 2011-06-29 2013-01-03 Nec Corporation Multiprocessor system and method of saving energy therein
US9323319B2 (en) 2011-06-29 2016-04-26 Nec Corporation Multiprocessor system and method of saving energy therein
KR101553923B1 (en) 2012-09-24 2015-09-18 삼성에스디에스 주식회사 Apparatus and method for analyzing system usage
EP2879055A1 (en) * 2013-11-25 2015-06-03 Tata Consultancy Services Limited System and method facilitating performance prediction of multi-threaded application in presence of resource bottlenecks
US9600290B2 (en) 2013-12-17 2017-03-21 International Business Machines Corporation Calculation method and apparatus for evaluating response time of computer system in which plurality of units of execution can be run on each processor core
CN109840597A (en) * 2017-11-28 2019-06-04 珠海市君天电子科技有限公司 A kind of model prediction method, apparatus, electronic equipment and storage medium
CN109840597B (en) * 2017-11-28 2023-04-07 珠海市君天电子科技有限公司 Model prediction method and device, electronic equipment and storage medium
CN111352085A (en) * 2020-04-29 2020-06-30 北京国鼎源创智能科技有限公司 System for judging signal processing performance and computing resource use of pulse Doppler radar
CN111352085B (en) * 2020-04-29 2023-06-27 北京国鼎源创智能科技有限公司 Pulse Doppler radar signal processing performance and computing resource use judging system
JP7012905B1 (en) * 2020-12-28 2022-01-28 三菱電機株式会社 Schedule generator, schedule generation method and schedule generation program

Also Published As

Publication number Publication date
JP3663968B2 (en) 2005-06-22

Similar Documents

Publication Publication Date Title
Simakov et al. A slurm simulator: Implementation and parametric analysis
Polo et al. Deadline-based MapReduce workload management
JP5874811B2 (en) Information processing method, program, and information processing apparatus
JP2000298593A (en) System and method for predicting performance of multitask system and recording medium stored with program for the method
Otterness et al. Inferring the scheduling policies of an embedded CUDA GPU
Bridi et al. A constraint programming scheduler for heterogeneous high-performance computing machines
Bergero et al. A novel parallelization technique for DEVS simulation of continuous and hybrid systems
Rolia Predicting the performance of software systems.
US9141936B2 (en) Systems and methods for simulating a resource constrained process
Uddin One-IPC high-level simulation of microthreaded many-core architectures
Rehm et al. Performance modeling of heterogeneous HW platforms
US20040093600A1 (en) Scheduling method, program product for use in such method, and task scheduling apparatus
EP1993038A1 (en) Data processing system and data processing method
Bobrek et al. Stochastic contention level simulation for single-chip heterogeneous multiprocessors
Zhang et al. Performance modeling and optimization of deadline-driven pig programs
Baliś et al. Auto-scaling of scientific workflows in kubernetes
Quan et al. A system-level simulation framework for evaluating task migration in MPSoCs
Behera et al. Time-triggered scheduling for multiprocessor mixed-criticality systems
CN110825502B (en) Neural network processor and task scheduling method for neural network processor
Buzen et al. Best/1-design of a tool for computer system capacity planning
Krawczyk et al. Model-based timing analysis and deployment optimization for heterogeneous multi-core systems using eclipse APP4MC
Krawczyk et al. Automated distribution of software to multi-core hardware in model based embedded systems development
Lázaro-Muñoz et al. A tasks reordering model to reduce transfers overhead on GPUs
Gainaru et al. Profiles of upcoming HPC Applications and their Impact on Reservation Strategies
JP5633961B2 (en) Simulation system, method and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040608

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040810

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040909

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040909

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040909

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050321

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080408

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090408

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100408

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees