JPH11203165A - Test and debug system for parallel computer - Google Patents
Test and debug system for parallel computerInfo
- Publication number
- JPH11203165A JPH11203165A JP10003646A JP364698A JPH11203165A JP H11203165 A JPH11203165 A JP H11203165A JP 10003646 A JP10003646 A JP 10003646A JP 364698 A JP364698 A JP 364698A JP H11203165 A JPH11203165 A JP H11203165A
- Authority
- JP
- Japan
- Prior art keywords
- inter
- node
- communication
- node communication
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Debugging And Monitoring (AREA)
- Multi Processors (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】並列計算機で動作する並列プ
ログラムでは、各ノードで、自ノードで処理した演算結
果(プロセス状態及びメモリ状態など)を他ノードへ受
け渡すとき、または他ノードで処理した演算結果を自ノ
ードで受け取るとき、各ノード間で通信処理を行ってい
る。BACKGROUND OF THE INVENTION In a parallel program operating on a parallel computer, each node transfers an operation result (process state, memory state, etc.) processed by its own node to another node, or an operation processed by another node. When the result is received by the own node, communication processing is performed between the nodes.
【0002】本発明は、並列計算機で動作する並列プロ
グラムにおける、プロセス状態及びメモリ状態等のログ
ファイルに取得し、その取得したログファイルを使用し
た並列化テスト、調査、再現テスト、及び繰り返しテス
トに関するものである。[0002] The present invention relates to a parallelization test, an investigation, a reproduction test, and a repetition test using a log file of a process state and a memory state in a parallel program operating on a parallel computer. Things.
【0003】[0003]
【従来の技術】並列計算機の並列プログラムにおける従
来のテスト方法は、何度か並列プログラムを実行し、ロ
グファイル等に出力された演算結果を比較し妥当性を確
認していた。このテスト方法では、並列プログラム実行
の通信処理の最終結果を確認するのに中間結果の妥当性
を検証するテストとはなっておらず、そのテスト方法が
存在していない。2. Description of the Related Art In a conventional test method for a parallel program of a parallel computer, a parallel program is executed several times, and operation results output to a log file or the like are compared to confirm validity. In this test method, there is no test for verifying the validity of the intermediate result for confirming the final result of the communication processing of the parallel program execution, and no test method exists.
【0004】また、並列計算機における並列プログラム
実行で問題が発生した場合、ノード間通信の状態を参照
する手段がなく、デバッグの手段としてはプログラムの
文単位で変数のメモリ内容を出力するための出力文をプ
ログラムに追加し、結果を出力し問題解決しなければな
らず、ノード間通信処理においてプロセス状態及びメモ
リ状態等によって問題の再現性がない場合の問題の解決
は困難であった。When a problem occurs in the execution of a parallel program in a parallel computer, there is no means for referring to the state of communication between nodes, and as a means for debugging, an output for outputting the memory contents of a variable in statement units of a program is used. A statement must be added to the program, the result must be output and the problem must be solved, and it is difficult to solve the problem when the problem is not reproducible due to the process state and the memory state in the inter-node communication processing.
【0005】[0005]
【発明が解決しようとする課題】上記の従来の並列計算
機におけるテスト・デバッグ方式では、プロセスの途中
に取得する情報は、演算が最終的に終了したメモリの状
態(変数の演算最終結果)しか取得出来ず、ノード間通
信のプロセス状態及びメモリ状態等のタイミングを制御
することが出来なかった。よって、問題解決の効率と繰
り返しテストにおいてテスト結果の妥当性を評価する手
段がなかった。In the above-described conventional test / debugging method for a parallel computer, information obtained during the process is obtained only in the state of the memory in which the operation is finally completed (final operation result of the variable). It was not possible to control the timing of the process state and the memory state of inter-node communication. Therefore, there is no means for evaluating the efficiency of problem solving and the validity of test results in repeated tests.
【0006】本発明では、効率的な問題解決の手段とし
てノード間通信のプロセス状態とメモリ状態等を取得す
る装置と、その取得した結果を解析し、プロセス状態及
びメモリ状態等を自由に書き換える装置を備えることに
よって、問題解決の効率向上と、繰り返しテストにおけ
るテスト結果の妥当性評価を目的とするものである。According to the present invention, an apparatus for acquiring a process state and a memory state of inter-node communication as means for solving problems efficiently, and an apparatus for analyzing the acquired result and freely rewriting the process state and the memory state, etc. The purpose of the present invention is to improve the efficiency of problem solving and to evaluate the validity of test results in repeated tests.
【0007】[0007]
【課題を解決するための手段】本発明は上記の目的を達
成するために、特定のノードに対するプロセス状態及び
メモリ状態等の情報取得用処理と、そのノードで通信が
発生したときプロセス状態及びメモリ状態等の情報をロ
グファイルに記録する処理と、ノード間通信受け渡され
るプロセス状態及びメモリ状態等を自由に書き換える処
理で構成される。In order to achieve the above object, the present invention provides a process for acquiring information such as a process status and a memory status for a specific node, and a process status and a memory when communication occurs in the node. It consists of a process for recording information such as the status in a log file, and a process for freely rewriting the process status and the memory status, etc., which are transferred between nodes.
【0008】[0008]
【発明の実施の形態】本発明について図面を用いて説明
する。DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described with reference to the drawings.
【0009】図1は、本発明のシステム構成図であり、
1は全体装置、30はノード間通信で取得するデータ
(項目)を指示するパラメタファイルのノード間通信取
得項目リスト、10はノード間通信のデータ取得(ログ
作成)装置、40はノード間通信データ取得(ログ作
成)装置が出力する通信ログファイル、20はノード間
通信データ取得(ログファイル)によって与えられるノ
ード間通信再実行装置である。FIG. 1 is a system configuration diagram of the present invention.
1 is an overall device, 30 is an inter-node communication acquisition item list of a parameter file indicating data (items) to be acquired by inter-node communication, 10 is an inter-node communication data acquisition (log creation) device, and 40 is an inter-node communication data A communication log file output by the acquisition (log creation) device. Reference numeral 20 denotes an inter-node communication re-executing device provided by inter-node communication data acquisition (log file).
【0010】図2は、ノード間通信データ取得(ログ作
成)装置の制御フローを表す。100はノード間通信で
発生する状態を記録するための項目の入力装置、140
のノード間通信取得項目リストファイル、110はノー
ド間通信ログファイルの初期化処理、120はノード間
通信が発生した場合にプロセス状態及びメモリ状態等を
150のノード間通信ログファイルに記録する処理、1
30は150のノード間通信ログファイルへの記録を終
了させる処理を表す。FIG. 2 shows a control flow of the inter-node communication data acquisition (log creation) apparatus. 100 is an item input device for recording a state occurring in inter-node communication, 140
An inter-node communication acquisition item list file; 110, an initialization process of an inter-node communication log file; 120, a process of recording a process status, a memory status, and the like in an inter-node communication log file 150 when inter-node communication occurs; 1
Reference numeral 30 denotes a process for ending the recording in the 150 inter-node communication log file.
【0011】図3は、ノード間通信で取得するノード間
通信データを指定するノード間通信取得項目リストファ
イル例である。本ファイル例では、ノード単位で取得の
有無を指定し、取得するデータ(プロセサ状態、メモリ
状態、通信するノード番号、ノード間メッセージ等)を
項目データとして与えている。FIG. 3 is an example of an inter-node communication acquisition item list file for specifying inter-node communication data to be obtained by inter-node communication. In the present file example, whether or not to acquire is designated for each node, and the data to be acquired (processor state, memory state, node number to communicate, message between nodes, etc.) is given as item data.
【0012】図4は、ノード間通信で取得されるノード
間通信ログファイルの記録例を表す。本ファイル例は、
発信元ノード番号、受信先ノード番号、通信開始時刻、
通信時間、プログラム実行アドレス、プロセサ状態、メ
モリ状態等を記録している。FIG. 4 shows a recording example of an inter-node communication log file obtained by inter-node communication. This file example is
Source node number, destination node number, communication start time,
Communication time, program execution address, processor status, memory status, etc. are recorded.
【0013】図5は、ノード間通信再実行装置の制御フ
ローを表している。200はノード間通信で発生する状
態を記録するための項目を表す280のノード間通信取
得項目リストファイルの入力装置、210はノード間通
信ログファイルの初期化処理、220はノード間通信で
取得した290のノード間通信ログファイルの入力処
理、230は新たにノード間通信ログを記録するログフ
ァイルのオープン処理、240は280のファイルで指
定された指定ノードに通信が発生した場合発信元ノード
から与えられる情報ではなく通信ログファイルから与え
られるデータでプロセス状態及びメモリ状態等を更新す
る処理、250はノード間通信が発生した場合にプロセ
ス状態及びメモリ状態等を300のノード間通信ログフ
ァイルに記録する処理、260は300のノード間通信
ログファイルへの記録を終了させる処理、300はテス
トの終了を指定する判定処理、270は繰り返しテスト
を再度実行するための分岐処理を表す。FIG. 5 shows a control flow of the inter-node communication re-execution device. Reference numeral 200 denotes an input device of an inter-node communication acquisition item list file 280 representing an item for recording a state occurring in inter-node communication, 210 denotes an initialization process of an inter-node communication log file, and 220 denotes an obtained by inter-node communication. 290: Input processing of a communication log file between nodes; 230: Open processing of a log file for newly recording a communication log between nodes; 240: Input from a source node when communication occurs to a designated node specified by a file of 280 The process 250 updates the process status and the memory status, etc., with data provided from the communication log file instead of the received information. The process 250 records the process status, the memory status, etc., in the inter-node communication log file 300 when inter-node communication occurs. The process 260 is a process for ending the recording in the 300 node communication log file. 300 the determination process of designating the end of the test, 270 represents a branch processing for executing the repeat test again.
【0014】[0014]
【発明の効果】以上説明したように、本発明は、並列計
算機におけるテスト方式で取得不可能だったノード間通
信のプロセス状態及びメモリ状態等をノード単位に記録
が可能となる。この記録の解析によりノード間で発生し
た事象の解明が容易になる。また、ノード間通信のプロ
セス状態及びメモリ状態等の制御を可能とし、特定ノー
ドに同一データを繰り返し与えることが可能となる。よ
って、並列計算機のデバッグ効率が向上する。As described above, according to the present invention, the process state and the memory state of the inter-node communication which cannot be obtained by the test method in the parallel computer can be recorded on a node-by-node basis. The analysis of this record facilitates the elucidation of the event that has occurred between the nodes. Further, it is possible to control the process state and the memory state of the inter-node communication, and it is possible to repeatedly supply the same data to a specific node. Thus, the debugging efficiency of the parallel computer is improved.
【図1】本発明のシステム構成図を示す。FIG. 1 shows a system configuration diagram of the present invention.
【図2】ノード間通信データ取得(ログ作成)装置の制
御フローを示す。FIG. 2 shows a control flow of an inter-node communication data acquisition (log creation) apparatus.
【図3】ノード間通信取得項目リストファイル例を示
す。FIG. 3 shows an example of an inter-node communication acquisition item list file.
【図4】ノード間通信ログファイルに記録される情報例
を示す。FIG. 4 shows an example of information recorded in an inter-node communication log file.
【図5】ノード間通信再実行装置の制御フローを示す。FIG. 5 shows a control flow of the inter-node communication re-execution device.
1…ノード間通信データ取得・設定処理装置、10…ノ
ード間通信データ取得(ログ作成)装置、20…ノード
間通信再実行装置、30〜31…ノード間通信取得項目
リストファイル、40〜43…ノード間通信ログファイ
ル、 100〜130…処理、200〜220…処理、
300〜310…処理。DESCRIPTION OF SYMBOLS 1 ... Inter-node communication data acquisition / setting processing device, 10 ... Inter-node communication data acquisition (log creation) device, 20 ... Inter-node communication re-execution device, 30-31 ... Inter-node communication acquisition item list file, 40-43 ... Node-to-node communication log file, 100-130 ... process, 200-220 ... process,
300-310 ... processing.
───────────────────────────────────────────────────── フロントページの続き (72)発明者 丹治 茂典 宮城県仙台市青葉区一番町二丁目4番1号 日立東北ソフトウェア株式会社内 ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Shigenori Tanji 2-4-1, Ichibancho, Aoba-ku, Sendai, Miyagi Prefecture Inside Hitachi Tohoku Software Co., Ltd.
Claims (1)
で、ノード間で引き継がれるプロセサ状態とメモリ状態
等をログファイルに記録し、その記録したログファイル
によって与えられる記録によって、並列計算機のノード
間通信の解析、同一環境で繰り返しテスト、及び再現テ
ストが可能になることを特徴としたテスト・デバッグ方
式。In a test / debugging method in a parallel computer, a processor state and a memory state taken over between nodes are recorded in a log file, and a record given by the recorded log file is used to execute communication between nodes of the parallel computer. A test / debugging method characterized by the ability to perform analysis, repetitive testing, and reproduction testing in the same environment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10003646A JPH11203165A (en) | 1998-01-12 | 1998-01-12 | Test and debug system for parallel computer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10003646A JPH11203165A (en) | 1998-01-12 | 1998-01-12 | Test and debug system for parallel computer |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11203165A true JPH11203165A (en) | 1999-07-30 |
Family
ID=11563256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10003646A Pending JPH11203165A (en) | 1998-01-12 | 1998-01-12 | Test and debug system for parallel computer |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11203165A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015182295A1 (en) * | 2014-05-26 | 2015-12-03 | 日立オートモティブシステムズ株式会社 | Vehicle control apparatus |
-
1998
- 1998-01-12 JP JP10003646A patent/JPH11203165A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015182295A1 (en) * | 2014-05-26 | 2015-12-03 | 日立オートモティブシステムズ株式会社 | Vehicle control apparatus |
JP2015225396A (en) * | 2014-05-26 | 2015-12-14 | 日立オートモティブシステムズ株式会社 | Vehicle control device |
CN106462452A (en) * | 2014-05-26 | 2017-02-22 | 日立汽车系统株式会社 | Vehicle control apparatus |
CN106462452B (en) * | 2014-05-26 | 2019-09-06 | 日立汽车系统株式会社 | Controller of vehicle |
US10642658B2 (en) | 2014-05-26 | 2020-05-05 | Hitachi Automotive Systems, Ltd. | Vehicle control apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8584083B2 (en) | Software application recreation | |
JP2000196705A (en) | Automatic communication protocol test system having message/sequence compilation function and tet method | |
CN115629967A (en) | Method and system for completing interface automation case generation and execution based on flow acquisition | |
CN112435072A (en) | Model creating method and device, electronic equipment and storage medium | |
CN113157559B (en) | Flow screening method and device | |
JPH11203165A (en) | Test and debug system for parallel computer | |
CN114924963A (en) | Distributed execution method, device, equipment and medium for webpage compatibility test | |
CN109995607B (en) | Method for testing flow overhead, terminal, server and computer storage medium | |
Dalton et al. | A toolkit for visualizing the runtime behavior of TinyOS applications | |
JP2007156822A (en) | Simulated application test apparatus for computer system | |
KR100340049B1 (en) | Method for testing chill programs using test scenario | |
JPH0778096A (en) | Program test system | |
CN118748646A (en) | Simulation test method and device for scene structure, electronic equipment, vehicle and storage medium | |
JPH11149489A (en) | Simulation system | |
CN117851228A (en) | Method, device, equipment and medium for generating interface test case based on SSM framework | |
JP2000010820A (en) | Method and device for testing one process of multiprocess system | |
JPH03129537A (en) | Test coverage system for microprogram | |
JPH10133717A (en) | Simulator for sequencer | |
JPH02294837A (en) | Test system for information processor | |
JP2002149449A (en) | Method for developing program | |
JPH0713655B2 (en) | Integrated circuit test method | |
JPH02239758A (en) | Communication simulate system | |
JPH08314817A (en) | Error analysis system | |
JPH11338727A (en) | Testing method for information processor | |
JPH02216539A (en) | Interactive test system for information processor |