JPH11203165A - Test and debug system for parallel computer - Google Patents

Test and debug system for parallel computer

Info

Publication number
JPH11203165A
JPH11203165A JP10003646A JP364698A JPH11203165A JP H11203165 A JPH11203165 A JP H11203165A JP 10003646 A JP10003646 A JP 10003646A JP 364698 A JP364698 A JP 364698A JP H11203165 A JPH11203165 A JP H11203165A
Authority
JP
Japan
Prior art keywords
inter
node
communication
node communication
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10003646A
Other languages
Japanese (ja)
Inventor
Hidenori Goto
秀則 後藤
Masao Koike
政男 小池
Shigenori Tanji
茂典 丹治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Solutions East Japan Ltd
Original Assignee
Hitachi Ltd
Hitachi Tohoku Software Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Tohoku Software Ltd filed Critical Hitachi Ltd
Priority to JP10003646A priority Critical patent/JPH11203165A/en
Publication of JPH11203165A publication Critical patent/JPH11203165A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

PROBLEM TO BE SOLVED: To enhance the efficiency of solving problems and to evaluate the validity of test results of repeated tests by recording information such as a process state and a memory state on a log file when communication occurs at a node and rewriting the process state and the memory state which are exchanged in inter-node communication. SOLUTION: An inter-node communication acquisition item list 30 of a parameter file which indicates data (item) that is acquired by inter-node communication, a data acquiring log production) device 10 for the inter-node communication, a communication log file 40 that is outputted by an inter-node communication data acquiring log production) device and an inter-node communication reexecuting device 20 which is given by inter-node communication data acquisition (log file) are shown. Information acquisition processing such as a process state and a memory state to a specific node is performed. When communication occurs at a node, information such as the process state and memory state is recorded on a log file and the process state and the memory state and the like which are exchanged in inter-node communication are freely rewritten.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】並列計算機で動作する並列プ
ログラムでは、各ノードで、自ノードで処理した演算結
果(プロセス状態及びメモリ状態など)を他ノードへ受
け渡すとき、または他ノードで処理した演算結果を自ノ
ードで受け取るとき、各ノード間で通信処理を行ってい
る。
BACKGROUND OF THE INVENTION In a parallel program operating on a parallel computer, each node transfers an operation result (process state, memory state, etc.) processed by its own node to another node, or an operation processed by another node. When the result is received by the own node, communication processing is performed between the nodes.

【0002】本発明は、並列計算機で動作する並列プロ
グラムにおける、プロセス状態及びメモリ状態等のログ
ファイルに取得し、その取得したログファイルを使用し
た並列化テスト、調査、再現テスト、及び繰り返しテス
トに関するものである。
[0002] The present invention relates to a parallelization test, an investigation, a reproduction test, and a repetition test using a log file of a process state and a memory state in a parallel program operating on a parallel computer. Things.

【0003】[0003]

【従来の技術】並列計算機の並列プログラムにおける従
来のテスト方法は、何度か並列プログラムを実行し、ロ
グファイル等に出力された演算結果を比較し妥当性を確
認していた。このテスト方法では、並列プログラム実行
の通信処理の最終結果を確認するのに中間結果の妥当性
を検証するテストとはなっておらず、そのテスト方法が
存在していない。
2. Description of the Related Art In a conventional test method for a parallel program of a parallel computer, a parallel program is executed several times, and operation results output to a log file or the like are compared to confirm validity. In this test method, there is no test for verifying the validity of the intermediate result for confirming the final result of the communication processing of the parallel program execution, and no test method exists.

【0004】また、並列計算機における並列プログラム
実行で問題が発生した場合、ノード間通信の状態を参照
する手段がなく、デバッグの手段としてはプログラムの
文単位で変数のメモリ内容を出力するための出力文をプ
ログラムに追加し、結果を出力し問題解決しなければな
らず、ノード間通信処理においてプロセス状態及びメモ
リ状態等によって問題の再現性がない場合の問題の解決
は困難であった。
When a problem occurs in the execution of a parallel program in a parallel computer, there is no means for referring to the state of communication between nodes, and as a means for debugging, an output for outputting the memory contents of a variable in statement units of a program is used. A statement must be added to the program, the result must be output and the problem must be solved, and it is difficult to solve the problem when the problem is not reproducible due to the process state and the memory state in the inter-node communication processing.

【0005】[0005]

【発明が解決しようとする課題】上記の従来の並列計算
機におけるテスト・デバッグ方式では、プロセスの途中
に取得する情報は、演算が最終的に終了したメモリの状
態(変数の演算最終結果)しか取得出来ず、ノード間通
信のプロセス状態及びメモリ状態等のタイミングを制御
することが出来なかった。よって、問題解決の効率と繰
り返しテストにおいてテスト結果の妥当性を評価する手
段がなかった。
In the above-described conventional test / debugging method for a parallel computer, information obtained during the process is obtained only in the state of the memory in which the operation is finally completed (final operation result of the variable). It was not possible to control the timing of the process state and the memory state of inter-node communication. Therefore, there is no means for evaluating the efficiency of problem solving and the validity of test results in repeated tests.

【0006】本発明では、効率的な問題解決の手段とし
てノード間通信のプロセス状態とメモリ状態等を取得す
る装置と、その取得した結果を解析し、プロセス状態及
びメモリ状態等を自由に書き換える装置を備えることに
よって、問題解決の効率向上と、繰り返しテストにおけ
るテスト結果の妥当性評価を目的とするものである。
According to the present invention, an apparatus for acquiring a process state and a memory state of inter-node communication as means for solving problems efficiently, and an apparatus for analyzing the acquired result and freely rewriting the process state and the memory state, etc. The purpose of the present invention is to improve the efficiency of problem solving and to evaluate the validity of test results in repeated tests.

【0007】[0007]

【課題を解決するための手段】本発明は上記の目的を達
成するために、特定のノードに対するプロセス状態及び
メモリ状態等の情報取得用処理と、そのノードで通信が
発生したときプロセス状態及びメモリ状態等の情報をロ
グファイルに記録する処理と、ノード間通信受け渡され
るプロセス状態及びメモリ状態等を自由に書き換える処
理で構成される。
In order to achieve the above object, the present invention provides a process for acquiring information such as a process status and a memory status for a specific node, and a process status and a memory when communication occurs in the node. It consists of a process for recording information such as the status in a log file, and a process for freely rewriting the process status and the memory status, etc., which are transferred between nodes.

【0008】[0008]

【発明の実施の形態】本発明について図面を用いて説明
する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described with reference to the drawings.

【0009】図1は、本発明のシステム構成図であり、
1は全体装置、30はノード間通信で取得するデータ
(項目)を指示するパラメタファイルのノード間通信取
得項目リスト、10はノード間通信のデータ取得(ログ
作成)装置、40はノード間通信データ取得(ログ作
成)装置が出力する通信ログファイル、20はノード間
通信データ取得(ログファイル)によって与えられるノ
ード間通信再実行装置である。
FIG. 1 is a system configuration diagram of the present invention.
1 is an overall device, 30 is an inter-node communication acquisition item list of a parameter file indicating data (items) to be acquired by inter-node communication, 10 is an inter-node communication data acquisition (log creation) device, and 40 is an inter-node communication data A communication log file output by the acquisition (log creation) device. Reference numeral 20 denotes an inter-node communication re-executing device provided by inter-node communication data acquisition (log file).

【0010】図2は、ノード間通信データ取得(ログ作
成)装置の制御フローを表す。100はノード間通信で
発生する状態を記録するための項目の入力装置、140
のノード間通信取得項目リストファイル、110はノー
ド間通信ログファイルの初期化処理、120はノード間
通信が発生した場合にプロセス状態及びメモリ状態等を
150のノード間通信ログファイルに記録する処理、1
30は150のノード間通信ログファイルへの記録を終
了させる処理を表す。
FIG. 2 shows a control flow of the inter-node communication data acquisition (log creation) apparatus. 100 is an item input device for recording a state occurring in inter-node communication, 140
An inter-node communication acquisition item list file; 110, an initialization process of an inter-node communication log file; 120, a process of recording a process status, a memory status, and the like in an inter-node communication log file 150 when inter-node communication occurs; 1
Reference numeral 30 denotes a process for ending the recording in the 150 inter-node communication log file.

【0011】図3は、ノード間通信で取得するノード間
通信データを指定するノード間通信取得項目リストファ
イル例である。本ファイル例では、ノード単位で取得の
有無を指定し、取得するデータ(プロセサ状態、メモリ
状態、通信するノード番号、ノード間メッセージ等)を
項目データとして与えている。
FIG. 3 is an example of an inter-node communication acquisition item list file for specifying inter-node communication data to be obtained by inter-node communication. In the present file example, whether or not to acquire is designated for each node, and the data to be acquired (processor state, memory state, node number to communicate, message between nodes, etc.) is given as item data.

【0012】図4は、ノード間通信で取得されるノード
間通信ログファイルの記録例を表す。本ファイル例は、
発信元ノード番号、受信先ノード番号、通信開始時刻、
通信時間、プログラム実行アドレス、プロセサ状態、メ
モリ状態等を記録している。
FIG. 4 shows a recording example of an inter-node communication log file obtained by inter-node communication. This file example is
Source node number, destination node number, communication start time,
Communication time, program execution address, processor status, memory status, etc. are recorded.

【0013】図5は、ノード間通信再実行装置の制御フ
ローを表している。200はノード間通信で発生する状
態を記録するための項目を表す280のノード間通信取
得項目リストファイルの入力装置、210はノード間通
信ログファイルの初期化処理、220はノード間通信で
取得した290のノード間通信ログファイルの入力処
理、230は新たにノード間通信ログを記録するログフ
ァイルのオープン処理、240は280のファイルで指
定された指定ノードに通信が発生した場合発信元ノード
から与えられる情報ではなく通信ログファイルから与え
られるデータでプロセス状態及びメモリ状態等を更新す
る処理、250はノード間通信が発生した場合にプロセ
ス状態及びメモリ状態等を300のノード間通信ログフ
ァイルに記録する処理、260は300のノード間通信
ログファイルへの記録を終了させる処理、300はテス
トの終了を指定する判定処理、270は繰り返しテスト
を再度実行するための分岐処理を表す。
FIG. 5 shows a control flow of the inter-node communication re-execution device. Reference numeral 200 denotes an input device of an inter-node communication acquisition item list file 280 representing an item for recording a state occurring in inter-node communication, 210 denotes an initialization process of an inter-node communication log file, and 220 denotes an obtained by inter-node communication. 290: Input processing of a communication log file between nodes; 230: Open processing of a log file for newly recording a communication log between nodes; 240: Input from a source node when communication occurs to a designated node specified by a file of 280 The process 250 updates the process status and the memory status, etc., with data provided from the communication log file instead of the received information. The process 250 records the process status, the memory status, etc., in the inter-node communication log file 300 when inter-node communication occurs. The process 260 is a process for ending the recording in the 300 node communication log file. 300 the determination process of designating the end of the test, 270 represents a branch processing for executing the repeat test again.

【0014】[0014]

【発明の効果】以上説明したように、本発明は、並列計
算機におけるテスト方式で取得不可能だったノード間通
信のプロセス状態及びメモリ状態等をノード単位に記録
が可能となる。この記録の解析によりノード間で発生し
た事象の解明が容易になる。また、ノード間通信のプロ
セス状態及びメモリ状態等の制御を可能とし、特定ノー
ドに同一データを繰り返し与えることが可能となる。よ
って、並列計算機のデバッグ効率が向上する。
As described above, according to the present invention, the process state and the memory state of the inter-node communication which cannot be obtained by the test method in the parallel computer can be recorded on a node-by-node basis. The analysis of this record facilitates the elucidation of the event that has occurred between the nodes. Further, it is possible to control the process state and the memory state of the inter-node communication, and it is possible to repeatedly supply the same data to a specific node. Thus, the debugging efficiency of the parallel computer is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のシステム構成図を示す。FIG. 1 shows a system configuration diagram of the present invention.

【図2】ノード間通信データ取得(ログ作成)装置の制
御フローを示す。
FIG. 2 shows a control flow of an inter-node communication data acquisition (log creation) apparatus.

【図3】ノード間通信取得項目リストファイル例を示
す。
FIG. 3 shows an example of an inter-node communication acquisition item list file.

【図4】ノード間通信ログファイルに記録される情報例
を示す。
FIG. 4 shows an example of information recorded in an inter-node communication log file.

【図5】ノード間通信再実行装置の制御フローを示す。FIG. 5 shows a control flow of the inter-node communication re-execution device.

【符号の説明】[Explanation of symbols]

1…ノード間通信データ取得・設定処理装置、10…ノ
ード間通信データ取得(ログ作成)装置、20…ノード
間通信再実行装置、30〜31…ノード間通信取得項目
リストファイル、40〜43…ノード間通信ログファイ
ル、 100〜130…処理、200〜220…処理、
300〜310…処理。
DESCRIPTION OF SYMBOLS 1 ... Inter-node communication data acquisition / setting processing device, 10 ... Inter-node communication data acquisition (log creation) device, 20 ... Inter-node communication re-execution device, 30-31 ... Inter-node communication acquisition item list file, 40-43 ... Node-to-node communication log file, 100-130 ... process, 200-220 ... process,
300-310 ... processing.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 丹治 茂典 宮城県仙台市青葉区一番町二丁目4番1号 日立東北ソフトウェア株式会社内 ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Shigenori Tanji 2-4-1, Ichibancho, Aoba-ku, Sendai, Miyagi Prefecture Inside Hitachi Tohoku Software Co., Ltd.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】並列計算機におけるテスト・デバッグ方式
で、ノード間で引き継がれるプロセサ状態とメモリ状態
等をログファイルに記録し、その記録したログファイル
によって与えられる記録によって、並列計算機のノード
間通信の解析、同一環境で繰り返しテスト、及び再現テ
ストが可能になることを特徴としたテスト・デバッグ方
式。
In a test / debugging method in a parallel computer, a processor state and a memory state taken over between nodes are recorded in a log file, and a record given by the recorded log file is used to execute communication between nodes of the parallel computer. A test / debugging method characterized by the ability to perform analysis, repetitive testing, and reproduction testing in the same environment.
JP10003646A 1998-01-12 1998-01-12 Test and debug system for parallel computer Pending JPH11203165A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10003646A JPH11203165A (en) 1998-01-12 1998-01-12 Test and debug system for parallel computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10003646A JPH11203165A (en) 1998-01-12 1998-01-12 Test and debug system for parallel computer

Publications (1)

Publication Number Publication Date
JPH11203165A true JPH11203165A (en) 1999-07-30

Family

ID=11563256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10003646A Pending JPH11203165A (en) 1998-01-12 1998-01-12 Test and debug system for parallel computer

Country Status (1)

Country Link
JP (1) JPH11203165A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015182295A1 (en) * 2014-05-26 2015-12-03 日立オートモティブシステムズ株式会社 Vehicle control apparatus

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015182295A1 (en) * 2014-05-26 2015-12-03 日立オートモティブシステムズ株式会社 Vehicle control apparatus
JP2015225396A (en) * 2014-05-26 2015-12-14 日立オートモティブシステムズ株式会社 Vehicle control device
CN106462452A (en) * 2014-05-26 2017-02-22 日立汽车系统株式会社 Vehicle control apparatus
CN106462452B (en) * 2014-05-26 2019-09-06 日立汽车系统株式会社 Controller of vehicle
US10642658B2 (en) 2014-05-26 2020-05-05 Hitachi Automotive Systems, Ltd. Vehicle control apparatus

Similar Documents

Publication Publication Date Title
US8584083B2 (en) Software application recreation
JP2000196705A (en) Automatic communication protocol test system having message/sequence compilation function and tet method
CN115629967A (en) Method and system for completing interface automation case generation and execution based on flow acquisition
CN112435072A (en) Model creating method and device, electronic equipment and storage medium
CN113157559B (en) Flow screening method and device
JPH11203165A (en) Test and debug system for parallel computer
CN114924963A (en) Distributed execution method, device, equipment and medium for webpage compatibility test
CN109995607B (en) Method for testing flow overhead, terminal, server and computer storage medium
Dalton et al. A toolkit for visualizing the runtime behavior of TinyOS applications
JP2007156822A (en) Simulated application test apparatus for computer system
KR100340049B1 (en) Method for testing chill programs using test scenario
JPH0778096A (en) Program test system
CN118748646A (en) Simulation test method and device for scene structure, electronic equipment, vehicle and storage medium
JPH11149489A (en) Simulation system
CN117851228A (en) Method, device, equipment and medium for generating interface test case based on SSM framework
JP2000010820A (en) Method and device for testing one process of multiprocess system
JPH03129537A (en) Test coverage system for microprogram
JPH10133717A (en) Simulator for sequencer
JPH02294837A (en) Test system for information processor
JP2002149449A (en) Method for developing program
JPH0713655B2 (en) Integrated circuit test method
JPH02239758A (en) Communication simulate system
JPH08314817A (en) Error analysis system
JPH11338727A (en) Testing method for information processor
JPH02216539A (en) Interactive test system for information processor