JPH0740259B2 - Parallel processor development system - Google Patents

Parallel processor development system

Info

Publication number
JPH0740259B2
JPH0740259B2 JP1021700A JP2170089A JPH0740259B2 JP H0740259 B2 JPH0740259 B2 JP H0740259B2 JP 1021700 A JP1021700 A JP 1021700A JP 2170089 A JP2170089 A JP 2170089A JP H0740259 B2 JPH0740259 B2 JP H0740259B2
Authority
JP
Japan
Prior art keywords
data
input
trace
memory
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1021700A
Other languages
Japanese (ja)
Other versions
JPH02201695A (en
Inventor
宗一 宮田
敏 松本
憲司 嶋
毅 福原
伸史 小守
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Sharp Corp
Original Assignee
Mitsubishi Electric Corp
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Sharp Corp filed Critical Mitsubishi Electric Corp
Priority to JP1021700A priority Critical patent/JPH0740259B2/en
Priority to US07/471,204 priority patent/US5165036A/en
Publication of JPH02201695A publication Critical patent/JPH02201695A/en
Publication of JPH0740259B2 publication Critical patent/JPH0740259B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、並列処理装置開発システムに関し、特にデ
ータ駆動形(データフロー)プロセッサの開発における
ハードウェア,ソフトウェアのデバッグを容易化,迅速
化できる開発支援環境(開発支援ツール)を有する並列
処理装置開発システムに関するものである。
Description: TECHNICAL FIELD The present invention relates to a parallel processing device development system, and in particular, facilitates and speeds up debugging of hardware and software in the development of a data driven type (data flow) processor. The present invention relates to a parallel processing device development system having a development support environment (development support tool).

〔従来の技術〕[Conventional technology]

第11図は従来のデータ駆動形プロセッサの開発システム
の構成を示す図であり、図において、90はホストパソコ
ン、91はタイマ、92はメモリアドレスジェネレータ、93
はデータ駆動形プロセッサ、94はグラフィックディスプ
レイコントローラ、95はイメージメモリ、96はCRT、97
はシステムバス、98はイメージメモリバスである。
FIG. 11 is a diagram showing the configuration of a conventional data driven processor development system. In the figure, 90 is a host personal computer, 91 is a timer, 92 is a memory address generator, and 93 is a memory address generator.
Is a data driven processor, 94 is a graphic display controller, 95 is an image memory, 96 is a CRT, 97
Is a system bus and 98 is an image memory bus.

この構成において、初期化、ブレークポイントの設定、
メモリ各部のダンプ表示・ロード・設定移動、入力、出
力、オブジェクトプログラムロードなどを行なう。
In this configuration, initialization, setting of breakpoints,
It displays dumps, loads, moves settings, inputs, outputs, loads object programs, etc. in each part of memory.

次に動作について説明する。Next, the operation will be described.

初期化、オブジェクトロード、各部メモリの設定・ロー
ドなどは、ホストパソコン90からのコマンドに基づい
て、各部へホストパソコン90からデータを書き込むこと
により行なわれる。逆に、ダンプ表示は各部からホスト
パソコン90へデータを詠み出すことにより行ない、移動
はこれらの組み合わせによって行なう。演算用データの
投入もホストパソコン90から行なうことができる。
Initialization, object loading, memory setting / loading of each part, etc. are performed by writing data from the host personal computer 90 to each part based on commands from the host personal computer 90. On the contrary, the dump display is performed by reading out the data from each unit to the host personal computer 90, and the movement is performed by a combination of these. Input of calculation data can also be performed from the host personal computer 90.

〔発明が解決しようとする課題〕[Problems to be Solved by the Invention]

従来の並列処理装置開発システムは以上のように構成さ
れ、ホストパソコンからのコマンドによって上記の処理
を行なうが、メモリの値を実行途中や、終了の段階で表
示できるのみで、データ駆動形プロセッサにおける処理
をトレースして、その結果によって、データ駆動形プロ
セッサを用いた応用システムの開発におけるデバッグの
能率化を図ることが可能な開発支援環境ではなく、デー
タ駆動形プロセッサの応用システムの効率的開発が行な
えないという問題点があった。
The conventional parallel processing device development system is configured as described above, and the above processing is performed by the command from the host personal computer. However, the value in the memory can only be displayed during execution or at the end stage. It is not a development support environment that can trace the processing and the result makes it possible to improve the debugging efficiency in the development of the application system using the data driven type processor, and the efficient development of the application system of the data driven type processor. There was a problem that it could not be done.

この発明は上記の問題点を解消するためになされたもの
で、データ駆動形プロセッサの応用システム開発におけ
るハードウェア及びソフトウェアのデバッグを能率よ
く、高速に実施できる開発支援環境を有する並列処理装
置開発システムを得ることを目的とする。
The present invention has been made to solve the above problems, and a parallel processing device development system having a development support environment capable of efficiently and rapidly debugging hardware and software in application system development of a data driven processor. Aim to get.

〔課題を解決するための手段〕[Means for Solving the Problems]

この発明に係る並列処理装置開発システムは、制御コン
ピュータからマルチプロセッサからなる並列処理装置
に、該並列処理装置の実応用の処理速度に対応して高速
に処理用入力データを投入する、専用の投入パケットメ
モリを具備したデータ入力部と、上記並列処理装置の機
能部各部分のデータ転送状況を時刻状態とともに処理実
行状態でトレースする、トレースメモリを具備したトレ
ース部とを備えるとともに、該トレース部によるトレー
ス結果をファイル化し、データフローグラフを作成表示
するようにしたものである。
A parallel processing device development system according to the present invention is a dedicated input for inputting processing input data from a control computer to a parallel processing device including a multiprocessor at a high speed corresponding to the processing speed of the actual application of the parallel processing device. A data input unit equipped with a packet memory and a trace unit equipped with a trace memory for tracing the data transfer status of each functional unit of the parallel processing device in a processing execution state together with a time state are provided by the trace unit. The trace result is made into a file and a data flow graph is created and displayed.

〔作用〕[Action]

この発明においては、専用の投入パケットメモリを具備
したデータ入力部によって処理用入力データの投入を実
応用の処理速度に対応して高速に行なうとともに、トレ
ースメモリを具備したトレーサによってプロセッサ各機
能におけるデータ転送状況を実行状態のままトレース
し、さらにこのトレース結果をファイル化し、データフ
ローグラフ化するようにしたから、並列処理装置の開発
におけるハードウェア及びソフトウェアのデバッグを能
率よく、高速に実施できる。
According to the present invention, the input data for processing is input at high speed by the data input unit equipped with the dedicated input packet memory, and the data in each function of the processor is added by the tracer equipped with the trace memory. Since the transfer status is traced as it is in the execution state, and the trace result is made into a file and is made into a data flow graph, the hardware and software in the development of the parallel processing device can be debugged efficiently and at high speed.

〔実施例〕〔Example〕

以下、この発明の一実施例を図について説明する。 An embodiment of the present invention will be described below with reference to the drawings.

第1図は本発明の一実施例による並列処理装置開発シス
テムの構成を示す図である。
FIG. 1 is a diagram showing the configuration of a parallel processing device development system according to an embodiment of the present invention.

図において、1は開発支援環境、10はデータ駆動形プロ
セッサを含んで成るプロセシングエレメント(PE)、20
はデータ駆動形プロセッサ本体部、21は拡張プログラム
記憶部(Extended Program Store:EPS)、22は拡張デー
タ記憶部、(Extended Data Store:EDS)、23は外部カ
ラー/スタック処理部(External Color/Stack Proces
s:ECS)、31はパソコンなどの制御コンピュータ、40は
インタフェース部、60はトレーサ部である。
In the figure, 1 is a development support environment, 10 is a processing element (PE) including a data driven processor, 20
Is a data-driven processor main unit, 21 is an extended program store (EPS), 22 is an extended data store (EDS), and 23 is an external color / stack processor (External Color / Stack) Proces
s: ECS), 31 is a control computer such as a personal computer, 40 is an interface section, and 60 is a tracer section.

第2図はプロセシングエレメント10の構成を示す図で、
図において、11はキャシュプログラム記憶(Cache Prog
ram Store:CPS)、12は発火処理(Firing Control:F
C)、13は演算処理(Functional Process:FP)、14は合
流分岐機能(Junction&Branch:J&B)、15はキューバ
ッファ(Queuing Buffer:QB)である。
FIG. 2 is a diagram showing the configuration of the processing element 10,
In the figure, 11 is a cache program memory (Cache Prog
ram Store: CPS), 12 is ignition processing (Firing Control: F)
C), 13 is an arithmetic process (Functional Process: FP), 14 is a junction branch function (Junction & Branch: J & B), and 15 is a queue buffer (Queuing Buffer: QB).

第3図はデータ駆動形プロセッサのパケットを示す図で
あり、図において、各フィールドは図中に示している通
りの機能を有するものである。
FIG. 3 is a diagram showing a packet of the data driven type processor. In the figure, each field has a function as shown in the figure.

第4図はインターフェース部40の構成図であり、41はイ
ンターフェース部40とトレーサ部60を管理する従来形
(ノイマン)マイクロプロセッサユニットであり、42は
マイクロプロセッサユニット41のプログラムとデータを
記憶するROM及びRAM、43は制御コンピュータ31と接続す
るシリアルI/Oコントローラ、44はプロセシングエレメ
ント10のデータ駆動形プロセッサにデータパケットを投
入するための出力ポート、45は投入パケットメモリにデ
ータ書き込みするための書込みアドレスカウンタ、46は
投入パケットメモリからデータ読み出しするための読出
しアドレスカウンタ、47はデータパケットの出力ポート
44からの出力を終了するときに用いられるパケット出力
を停止するための停止アドレスラッチ、48aは投入パケ
ットメモリのアドレスマルチプレクサ、48bは投入パケ
ットメモリのデータマルチプレクサ、49は出力ポートの
出力ドライバ、50は4k×64bitsの投入パケットメモリ、
51はデータパケット投入時に投入パケットメモリ50のア
ドレスを停止アドレスラッチ47の内容と比較するアドレ
ス比較器、52はデータパケット投入状態をフリップフロ
ップ、53はデータパケット投入開始トリガ発生器、54は
データパケット投入の際のパケット間隔を記憶する投入
間隔ラッチ、55はデータパケット投入間隔測定のための
投入間隔カウンタ、58はデータパケット投入の出力制御
部である。
FIG. 4 is a block diagram of the interface unit 40, 41 is a conventional (Neumann) microprocessor unit that manages the interface unit 40 and the tracer unit 60, and 42 is a ROM that stores programs and data of the microprocessor unit 41. And RAM, 43 is a serial I / O controller connected to the control computer 31, 44 is an output port for inputting a data packet to the data driven processor of the processing element 10, and 45 is a write for writing data to the input packet memory. Address counter, 46 is a read address counter for reading data from the input packet memory, and 47 is a data packet output port.
A stop address latch for stopping the packet output used when terminating the output from 44, 48a is an input packet memory address multiplexer, 48b is an input packet memory data multiplexer, 49 is an output port output driver, and 50 is Input packet memory of 4k x 64bits,
51 is an address comparator that compares the address of the input packet memory 50 with the contents of the stop address latch 47 when the data packet is input, 52 is a flip-flop for the data packet input state, 53 is a data packet input start trigger generator, and 54 is a data packet The input interval latch stores the packet interval at the time of input, 55 is an input interval counter for measuring the data packet input interval, and 58 is an output control unit for inputting the data packet.

第5図はトレーサ部60の構成図であり、図において、61
はトレースポート、62はタイマ、63は入力ラッチ、64は
同期化回路、65はデマルチプレクサ、66はモード制御
部、67はアドレスカウンタ、68は4k×96bitのトレース
メモリ、69はリード/ライトコントローラ、70はブレー
クポイントラッチ、71は比較器、72はブレークポイント
アドレスラッチである。
FIG. 5 is a block diagram of the tracer unit 60. In FIG.
Is a trace port, 62 is a timer, 63 is an input latch, 64 is a synchronizing circuit, 65 is a demultiplexer, 66 is a mode controller, 67 is an address counter, 68 is a 4k × 96bit trace memory, and 69 is a read / write controller. , 70 is a break point latch, 71 is a comparator, and 72 is a break point address latch.

次にこの実施例の動作について説明する。Next, the operation of this embodiment will be described.

データ駆動プロセッサ10はCPS11、FC12、FP13を基本要
素とし、J&B14、QB15を合わせて第2図のように巡回
パイプラインを構成している。EPS21はCPS11の外部拡張
プログラムを格納する機能部、EDS22は配列データなど
を格納する機能部、ECS23はカラー管理と外部キューの
機能部である。
The data driven processor 10 has CPS11, FC12 and FP13 as basic elements, and J & B14 and QB15 are combined to form a cyclic pipeline as shown in FIG. EPS21 is a functional unit that stores an external expansion program of CPS11, EDS22 is a functional unit that stores array data, etc., ECS23 is a functional unit for color management and external queue.

第3図のようなフォーマットを有する入力パケットはJ
&B14の合流部を経て、CPS11に入力される。CPS11はEPS
21を持ち、FC12を通過したパケットの次位行先をトリガ
に、EPSから次に必要となるプログラムデータを取り出
し、CPS11に格納する。単項演算の場合はそのまま、二
項演算の場合にはオペランド対を形成した後、FC12から
出力される。この演算パケットはFP13に送られ命令コー
ド(OPC:Operation Code)により演算され、J&B14の
分岐機能により出力されるか否かが判定され、出力され
ない場合には再びCPS11に戻って以下同様の処理を繰り
返す。
An input packet having a format as shown in FIG.
It is input to CPS11 via the confluence part of & B14. CPS11 is EPS
With 21 as the trigger, the next destination of the packet that has passed FC12 is used as a trigger to fetch the next required program data from EPS and store it in CPS11. In the case of the unary operation, it is output as it is, and in the case of the binary operation, the operand pair is formed and then output from the FC12. This operation packet is sent to the FP13 and operated by the instruction code (OPC: Operation Code), and it is judged whether or not it is output by the branch function of the J & B14. repeat.

プログラムはループを除いて、基本的に若いノード番号
から実行されることを前提とし、FC12のマッチングメモ
リはハッシュされ、マッチングメモリでハッシュ衝突し
た時には、世代が小さいもの、ノード番号の小さいもの
を保存し、そうでないものを巡回パイプラインあるいは
ECS23へ送出し、常に優先度の高いものから順に処理を
実行して、チップ内の巡回パイプラインが溢れることな
く処理実行がなされることを可能とするものである。
Assuming that the program is executed from a young node number excluding the loop, the matching memory of FC12 is hashed, and when a hash collision occurs in the matching memory, the one with a small generation and the one with a small node number are saved. And then the other ones
It is possible to send the data to the ECS23, execute the processing in order from the highest priority, and execute the processing without overflowing the cyclic pipeline in the chip.

また、CPS11とFC12の間は巡回パイプラインの他の部分
のデータパス2本分を有し、CPS11におけるCOPY処理時
にもデータ転送路に溢路のない構成となっている。
Further, between the CPS11 and FC12, there are two data paths in the other part of the cyclic pipeline, and the data transfer path has no overflow even during COPY processing in CPS11.

開発支援環境1は制御コンピュータ31によってその動作
が制御される。ハードウェアは、インターフェース部40
及びトレーサ部60を含み、最小6枚構成である。そのう
ち、データ駆動形プロセッサを含んで成るプロセシング
エレメント10はデータ駆動形プロセッサ本体部20、拡張
プロセッサ記憶部EPS21、拡張データ記憶部EDS22、外部
カラー・スタック処理部ECS23の4枚で構成されてい
る。
The operation of the development support environment 1 is controlled by the control computer 31. The hardware is interface 40
Also, the tracer unit 60 is included, and the minimum structure is six. Among them, the processing element 10 including the data driven processor is composed of four data driven processor main body 20, extended processor storage unit EPS21, extended data storage unit EDS22, and external color stack processing unit ECS23.

開発支援環境1全体の制御は制御コンピュータ31によっ
て行なわれる。制御コンピュータ31の開発支援環境制御
プログラムによってデータの投入・収集を行なう。同制
御プログラムによる処理機能を以下に示す。
A control computer 31 controls the entire development support environment 1. Data is input and collected by the development support environment control program of the control computer 31. The processing functions of the control program are shown below.

投入のモード プログラム・データのロード、入力データパケットのロ
ード、入力データパケット数の設定、入力データパケッ
トの投入、ダンプ用パケットの投入。
Loading mode Loading of program data, loading of input data packets, setting of the number of input data packets, loading of input data packets, loading of dump packets.

収集のモード ブレークポイント比較値の設定、ブレークポイントマス
ク値の設定、トレース開始するトレーサの起動、トレー
スアドレスカウンタのプリセット、トレースメモリのフ
ァイルへの書き込み、ブレークポイント発生アドレス読
み出し。
Collection mode Setting the breakpoint comparison value, setting the breakpoint mask value, starting the tracer to start the trace, presetting the trace address counter, writing to the trace memory file, and reading the breakpoint occurrence address.

メモリのダンプはプロセシングエレメント10のPE♯毎に
EDS21,FC12,EPS21に対してスタートアドレス、エンドア
ドレスを指定してそれぞれのメモリから出力されるダン
プパケットを、トレーサに収集するものである。この他
に、初期化、所定時間の待機、制御プログラムからの復
帰などが行なえるものとなっている。
Memory dump for each PE # of processing element 10
The start address and end address are specified for EDS21, FC12, EPS21, and dump packets output from the respective memories are collected by the tracer. In addition, initialization, waiting for a predetermined time, and returning from the control program can be performed.

第4図及び第5図はそれぞれインターフェース部及びト
レース部の機能構成図である。制御コンピュータ31とデ
ータ駆動形プロセッサを含む開発支援環境1とのデータ
の転送は、インターフェース部40を介して行なわれる。
4 and 5 are functional block diagrams of the interface unit and the trace unit, respectively. Data transfer between the control computer 31 and the development support environment 1 including a data driven processor is performed via the interface unit 40.

以下に両機能部の動作を詳述する。インターフェース部
40はシリアルポート43を持ち、制御コンピュータ31と接
続される。MPU41はシリアルポート43からのコマンドに
より、上記の投入モードと収集モードの機能を実行す
る。インターフェース部40は電源供給と同時に開発支援
環境1全体の初期化を行なった後、制御コンピュータか
らのコマンドを待つ。プログラム、データのロードは、
1パケット当り第3図の様なタグ領域とデータ32ビット
を一まとめにして、投入パケットメモリ50の2ワードへ
の書き込みを行ない出力ポート44からパケット毎に出力
することにより行う。入力データパケットの投入は高速
に行うことが不可欠であるので、投入パケットメモリ50
を用いている。投入パケットメモリ50は書き込みアドレ
スカウンタ45を用いて最大4kワード分までロードし、入
力データパケット数に対応した情報を停止アドレスラッ
チ47に設定した後、投入間隔を指定した投入コマンドに
より読出しアドレスカウンタ46が停止アドレスラッチ47
に設定された値に一致するまで一気に投入する。
The operation of both functional units will be described in detail below. Interface part
40 has a serial port 43 and is connected to the control computer 31. The MPU 41 executes the functions of the input mode and the collection mode described above by the command from the serial port 43. The interface unit 40 waits for a command from the control computer after initializing the entire development support environment 1 at the same time as supplying power. To load programs and data,
This is performed by collectively writing the tag area and 32 bits of data as shown in FIG. 3 per packet into 2 words of the input packet memory 50 and outputting from the output port 44 for each packet. Since it is indispensable to input the input data packet at high speed, the input packet memory 50
Is used. The input packet memory 50 is loaded up to 4k words using the write address counter 45, and information corresponding to the number of input data packets is set in the stop address latch 47, and then the read address counter 46 is input by the input command specifying the input interval. Stops address latch 47
Input all at once until it matches the value set in.

更に、インターフェース部40のアドレス・データバスは
トレーサ部60へ接続され、トレーサ部60の制御も併せて
行われる。
Further, the address / data bus of the interface unit 40 is connected to the tracer unit 60, and the tracer unit 60 is also controlled.

トレーサ部60は4k×96bitのトレースメモリ68を持ち、
プロセシングエレメント10のいずれの端子にも接続して
そのトレースを行うことができる。トレーサ部60はイン
ターフェース部40のアドレス・データバスと接続され、
インターフェース部40から直接制御される。必要に応じ
て、ブレークポイントの比較値、マスクデータの設定を
行うことが可能である。インターフェース部40からトレ
ーサ番号、トレースモードの設定の後、トレースの開始
が指示される。その後トレーサ部60はトレースポート61
から入って来るデータパケットを内部クロックと同期化
してラッチし、時間情報とともにトレースメモリ68内に
貯えて行く。ブレークポイントラッチ70にブレークポイ
ントを設定した時には、比較器71の出力で一致の採れた
パケットを検出した後停止するが、停止にあたっては直
ちに停止、メモリ容量の1/2のトレースの後停止、メモ
リ容量分のトレースの後停止の3つのトレースモードを
選択でき、トレース履歴を有効に記憶する。
The tracer unit 60 has a 4k × 96bit trace memory 68,
The trace can be made by connecting to any terminal of the processing element 10. The tracer unit 60 is connected to the address / data bus of the interface unit 40,
It is directly controlled by the interface unit 40. If necessary, it is possible to set the comparison value of the breakpoint and the mask data. After setting the tracer number and the trace mode, the interface unit 40 gives an instruction to start the trace. After that, the tracer unit 60 is connected to the trace port 61.
The data packet coming in from is latched in synchronization with the internal clock and stored in the trace memory 68 together with the time information. When a break point is set in the break point latch 70, it stops after detecting a matched packet in the output of the comparator 71, but when it stops, it stops immediately, after a trace of half the memory capacity, and stops. Three trace modes can be selected: stop after trace of capacity and trace history is effectively stored.

トレース終了後、ブレークポイントアドレスラッチ72か
らブレークポイント発生アドレスを読み出し、トレース
モードとアドレスカウンタ67値から有効データを決定で
きる。
After the end of the trace, the breakpoint occurrence address can be read from the breakpoint address latch 72, and valid data can be determined from the trace mode and the value of the address counter 67.

このトレースメモリ68内のトレース結果は、インターフ
ェース部40により、ダンプし、ファイル化することがで
き、このファイルをリスト表示することができる。
The trace result in the trace memory 68 can be dumped and made into a file by the interface unit 40, and this file can be displayed in a list.

トレース部60は複数接続可能で1インターフェース部40
当り15個のトレース部60を用いて15を同時計測可能であ
る。演算パケットや結果パケットなど機能部との接続点
でトレースを行い、同時に記憶されるトレース時刻情報
と共にシステム全体の動作を捕捉できる。
Multiple trace units 60 can be connected and one interface unit 40
It is possible to measure 15 at the same time by using 15 trace units 60 per hit. It is possible to trace the operation packet and the result packet at the connection point with the functional unit and capture the operation of the entire system together with the trace time information stored at the same time.

本実施例ではトレーサ部60によって収集されたプロセシ
ングエレメント10の各部のデータを表示することが可能
である。第6図はトレース結果の表示の様子の一例を示
す図であり、第6図(a)はFP13出力表示、第6図
(b)はECS23出力表示を示している。
In this embodiment, it is possible to display the data of each part of the processing element 10 collected by the tracer part 60. FIG. 6 is a diagram showing an example of how the trace result is displayed. FIG. 6 (a) shows the FP13 output display, and FIG. 6 (b) shows the ECS23 output display.

データ駆動形プロセッサは言語処理系と併せて開発して
いるが、言語処理系のコンパイラ出力形式ファイルと、
マッパ出力であるオブジェクトコード、及び実行トレー
ス結果については、そのプログラムを図式表記・修正す
るツールを備えている。これはマルチプロセッサ実行環
境においてもプロセッサ毎のオブジェクトコードと実行
トレース結果の図的表示を可能とするものである。これ
らを比較することによって、未処理ノードや未投入デー
タパケット、未アクセスメモリなどが極めて簡単に発見
でき、マルチプロセッサのデバッグが容易である。実行
時の最大並列度、平均並列度、実行ランク数、実行時間
などが時刻情報と併せて表示でき、シミュレータ実行結
果と同様に稼動率の評価も簡単に行なえる。
The data-driven processor is being developed together with the language processing system, but the compiler output format file of the language processing system,
For the object code that is the mapper output and the execution trace result, a tool is provided to graphically express and modify the program. This makes it possible to graphically display the object code and execution trace result for each processor even in a multiprocessor execution environment. By comparing these, an unprocessed node, an unentered data packet, an unaccessed memory, etc. can be found very easily, and debugging of a multiprocessor is easy. The maximum parallelism at execution, average parallelism, number of execution ranks, execution time, etc. can be displayed together with time information, and the operating rate can be easily evaluated as well as the simulator execution result.

この表示にあたっては、例えば特願昭62-54406「連想記
憶装置及びデータ駆動形計算機」に記載されたデータ入
れ換え方式におけるノード番号付与に必要なランク解析
結果を用いて表示し、アークについても、重なりを減少
するアルゴリズムを導入して視認性を向上させている。
In this display, for example, the result of rank analysis required for assigning node numbers in the data exchange method described in Japanese Patent Application No. 62-54406 “Associative memory and data driven computer” is used, and arcs are also overlapped. We have improved the visibility by introducing an algorithm to reduce.

コンパイラ出力形式ファイルの図的表示は関数単位で行
なえるもので、複数の関数が展開されたマッパ出力(オ
ブジェクトコード)の図的表示に比較すると一般に見易
いものである。
The graphical display of the compiler output format file can be performed on a function-by-function basis, and is generally easier to see than the graphical display of the mapper output (object code) in which a plurality of functions are expanded.

第7図は3次多項式演算プログラムのデータフローグラ
フのマッパ出力のグラフィック表示例を示す図、第8図
はトレース結果の表示例を示す図である。
FIG. 7 is a diagram showing a graphic display example of a mapper output of a data flow graph of a third-order polynomial calculation program, and FIG. 8 is a diagram showing a display example of trace results.

このように本実施例では、投入パケットメモリ50を備え
たインタフェース部40を介して制御コンピュータ31から
の処理実行のためのデータパケットを高速に並列処理装
置のプロセシングエレメント10に投入するとともに、プ
ロセシングエレメント10の複数の端子にトレースポート
が接続された、各々トレースメモリ68を備えた複数のト
レーサ部60により上記トレースポートに入ってくるデー
タパケットをシステムの内部クロックと同期して共通の
時刻情報とともにトレースし、さらに該複数のトレーサ
部60のトレースメモリに貯えられたトレース結果を収集
してファイル化し、データフローグラフ化して表示する
ようにしたから、並列処理装置の開発におけるハードウ
ェアあるいはソフトウェアのデバッグを極めて容易化,
迅速化できる。
As described above, in this embodiment, the data packet for processing execution from the control computer 31 is rapidly input to the processing element 10 of the parallel processing device via the interface unit 40 having the input packet memory 50, and the processing element is also added. The tracer unit 60 having the trace memory 68, which has the trace ports connected to the 10 pins, traces the data packet entering the trace port together with the common time information in synchronization with the internal clock of the system. In addition, since the trace results stored in the trace memory of the plurality of tracer units 60 are collected and made into a file and displayed as a data flow graph, it is possible to debug the hardware or software in the development of the parallel processing device. Extremely easy,
Can be speeded up.

なお、上記実施例では、データ駆動形プロセッサの開発
支援環境として述べてきたが、他の並列処理計算機ある
いはプロセッサにおいても同様の方式で実現が可能であ
る。
Although the above embodiment has been described as a development support environment for a data-driven processor, it can be implemented in other parallel processing computers or processors in a similar manner.

また、第1図の実施例において、プロセッサエレメント
10の接続方法については特に明記していないが、第9図
のような、シャッフルネット接続や、第10図のようなデ
ィジーチェーン接続など、その他の様々のものが可能で
ある。
Further, in the embodiment of FIG. 1, the processor element
Although the connection method of 10 is not particularly specified, various other things such as a shuffle net connection as shown in FIG. 9 and a daisy chain connection as shown in FIG. 10 are possible.

〔発明の効果〕〔The invention's effect〕

以上のように、この発明によれば、専用の投入パケット
メモリを具備したデータ入力部を介して制御コンピュー
タより処理用入力データをプロセッサに実応用の処理速
度に対応して高速に投入するとともに、トレースメモリ
を具備したトレーサ部によってプロセッサの各機能部に
おけるデータ転送状況を実行状態のまま時刻情報ととも
にトレースし、さらにこのトレース結果をファイル化
し、データフローグラフ化して表示するようにしたか
ら、並列処理装置の開発におけるハードウェア及びソフ
トウェアのデバッグを能率よく、高速に実施できる効果
がある。
As described above, according to the present invention, while inputting the processing input data from the control computer to the processor at a high speed corresponding to the processing speed of the actual application through the data input unit equipped with the dedicated input packet memory, The tracer unit equipped with the trace memory traces the data transfer status in each functional unit of the processor along with the time information in the execution state, and the trace result is filed and displayed as a data flow graph for parallel processing. This has the effect of enabling efficient and high-speed debugging of hardware and software in device development.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例による並列処理装置開発シス
テムの構成を示す図、第2図はプロセシングエレメント
の構成を示す図、第3図はデータ駆動形プロセッサのパ
ケットを示す図、第4図はインターフェース部の構成
図、第5図はトレーサ部の構成図、第6図はトレース結
果の一例を示す図、第7図はデータフローグラフである
マッパ出力のグラフィック表示例を示す図、第8図はト
レース結果の表示例を示す図、第9図はデータ駆動形プ
ロセッサのシャッフルネット接続を示す図、第10図はデ
ータ駆動形プロセッサのデイジーチェーン接続を示す
図、第11図は従来の並列処理装置開発システムの構成を
示す図である。 1は開発支援環境、10はデータ駆動形プロセッサから成
るプロセシングエレメント、20はデータ駆動形プロセッ
サ本体、40はインタフェース部、60はトレーサ部であ
る。 なお図中同一符号は同一又は相当部分を示す。
FIG. 1 is a diagram showing a configuration of a parallel processing device development system according to an embodiment of the present invention, FIG. 2 is a diagram showing a configuration of processing elements, FIG. 3 is a diagram showing packets of a data driven processor, and FIG. Fig. 5 is a block diagram of the interface unit, Fig. 5 is a block diagram of the tracer unit, Fig. 6 is a diagram showing an example of trace results, and Fig. 7 is a diagram showing a graphic display example of mapper output which is a data flow graph. FIG. 8 is a diagram showing a display example of trace results, FIG. 9 is a diagram showing a shuffle net connection of a data driven processor, FIG. 10 is a diagram showing a daisy chain connection of a data driven processor, and FIG. 11 is a conventional diagram. It is a figure which shows the structure of a parallel processing apparatus development system. 1 is a development support environment, 10 is a processing element consisting of a data driven processor, 20 is a data driven processor main body, 40 is an interface section, and 60 is a tracer section. The same reference numerals in the drawings indicate the same or corresponding parts.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 嶋 憲司 兵庫県尼崎市塚口本町8丁目1番1号 三 菱電機株式会社産業システム研究所内 (72)発明者 福原 毅 兵庫県尼崎市塚口本町8丁目1番1号 三 菱電機株式会社産業システム研究所内 (72)発明者 小守 伸史 兵庫県伊丹市瑞原4丁目1番地 三菱電機 株式会社エル・エス・アイ研究所内 (56)参考文献 特開 平2−14333(JP,A) ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Kenji Shima, 8-1-1 Tsukaguchihonmachi, Amagasaki City, Hyogo Prefecture Sanryo Electric Co., Ltd. Industrial Systems Research Institute (72) Inventor Takeshi Fukuhara 8-chome, Tsukaguchihonmachi, Amagasaki City, Hyogo Prefecture No. 1-1 Sanryo Electric Co., Ltd. Industrial Systems Research Laboratory (72) Inventor Nobufumi Komori 4-1-1 Mizuhara, Itami City, Hyogo Prefecture Mitsubishi Electric Co., Ltd. LSE Research Laboratory (56) References 2-14333 (JP, A)

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】単数あるいは複数のマルチプロセッサから
なる並列処理装置と、 該並列処理装置を駆動する制御コンピュータと、該制御
コンピュータからの処理実行のためのパケットを複数個
記憶するためのメモリ手段と、該メモリ手段に記憶され
たパケットを設定可能な投入間隔で上記並列処理装置の
マルチプロセッサに入力するための計測手段とを備えた
データパケット入力部と、 上記マルチプロセッサの複数の機能部の所望の箇所に設
けられた入出力ポート及びデータ転送用ポートに接続さ
れ、上記ポートのデータパケットが、共通の時刻情報と
ともに内部クロックに同期して取り込まれ貯えられる内
部トレースメモリを備えたトレーサ部とを具備し、か
つ、 上記トレーサ部のトレースメモリに取り込まれた処理実
行結果であるデータパケットを処理順に表示する機能、
およびこれを実行プログラムと比較する機能を有するこ
とを特徴とする並列処理装置開発システム。
1. A parallel processing device comprising a single or a plurality of multiprocessors, a control computer for driving the parallel processing device, and a memory means for storing a plurality of packets for executing processing from the control computer. A data packet input section having a measuring means for inputting the packets stored in the memory means to the multiprocessor of the parallel processing device at settable input intervals, and a plurality of functional sections of the multiprocessor. And a tracer unit having an internal trace memory connected to an input / output port and a data transfer port provided at the port, and the data packet of the port is taken in and stored in synchronization with an internal clock together with common time information. Data that is provided and that is the result of processing execution captured in the trace memory of the tracer unit The ability to display the packet to the processing order,
And a parallel processing device development system having a function of comparing this with an execution program.
JP1021700A 1989-01-31 1989-01-31 Parallel processor development system Expired - Lifetime JPH0740259B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1021700A JPH0740259B2 (en) 1989-01-31 1989-01-31 Parallel processor development system
US07/471,204 US5165036A (en) 1989-01-31 1990-01-29 Parallel processing development system with debugging device includes facilities for schematically displaying execution state of data driven type processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1021700A JPH0740259B2 (en) 1989-01-31 1989-01-31 Parallel processor development system

Publications (2)

Publication Number Publication Date
JPH02201695A JPH02201695A (en) 1990-08-09
JPH0740259B2 true JPH0740259B2 (en) 1995-05-01

Family

ID=12062340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1021700A Expired - Lifetime JPH0740259B2 (en) 1989-01-31 1989-01-31 Parallel processor development system

Country Status (1)

Country Link
JP (1) JPH0740259B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0727473B2 (en) * 1988-07-01 1995-03-29 シャープ株式会社 Data flow program debug device

Also Published As

Publication number Publication date
JPH02201695A (en) 1990-08-09

Similar Documents

Publication Publication Date Title
US5165036A (en) Parallel processing development system with debugging device includes facilities for schematically displaying execution state of data driven type processor
US7840842B2 (en) Method for debugging reconfigurable architectures
CN103309786B (en) For non-can the method and apparatus of interactive debug in preemptive type Graphics Processing Unit
JP4766487B2 (en) Program alteration detection device
JPS59160267A (en) Vector processing device
JPS5948424B2 (en) parallel computing system
JP3990332B2 (en) Data processing system
JPH0740259B2 (en) Parallel processor development system
KR102462864B1 (en) Apparatus and method for dynamic binary instrumentation using multi-core
US7107478B2 (en) Data processing system having a Cartesian Controller
JP2006146412A (en) Multi-core processor and debugging method
JP4916151B2 (en) Parallel computing device
JPH06309285A (en) Communication processing circuit for parallel computer
JPS6049464A (en) Inter-processor communication system of multi-processor computer
JPH07121405A (en) Simulation system
JPH01131934A (en) Dynamic single clock tracing system
Jiang et al. Design of a parallel RISC image processor based on PCI bus
Kelly AutoPilot: A message-passing parallel programming library for the IMAPCAR2
JPH05150943A (en) Computer
JPS598068A (en) Debug device of multiprocessor
JPH0635760A (en) Buffer device with tracing function
JP2007179567A (en) Data processing system
JPS5968066A (en) Debugger starting system
JPH0721154A (en) Vector processor
JPH05274385A (en) Logic verification environment controlling device

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 14

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 14