JPH02201695A - System for developing parallel processor - Google Patents

System for developing parallel processor

Info

Publication number
JPH02201695A
JPH02201695A JP1021700A JP2170089A JPH02201695A JP H02201695 A JPH02201695 A JP H02201695A JP 1021700 A JP1021700 A JP 1021700A JP 2170089 A JP2170089 A JP 2170089A JP H02201695 A JPH02201695 A JP H02201695A
Authority
JP
Japan
Prior art keywords
data
trace
input
tracer
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1021700A
Other languages
Japanese (ja)
Other versions
JPH0740259B2 (en
Inventor
Soichi Miyata
宗一 宮田
Satoshi Matsumoto
敏 松本
Kenji Shima
憲司 嶋
Takeshi Fukuhara
福原 毅
Nobufumi Komori
伸史 小守
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Sharp Corp
Original Assignee
Mitsubishi Electric Corp
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Sharp Corp filed Critical Mitsubishi Electric Corp
Priority to JP1021700A priority Critical patent/JPH0740259B2/en
Priority to US07/471,204 priority patent/US5165036A/en
Publication of JPH02201695A publication Critical patent/JPH02201695A/en
Publication of JPH0740259B2 publication Critical patent/JPH0740259B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To efficiently execute debugging at high speed by inputting input data for processing from a control computer to a processor at high speed corresponding to a really applied speed and tracing a transfer condition by a tracer part. CONSTITUTION:A data packet 10 for processing execution is inputted from a control computer 31 through an interface part 40 to a processing element 10 of the parallel processor. The data packet incoming to trace ports is traced by plural tracer parts 60, for which the trace ports are connected to the plural terminals of the processing element 60, together with common time information synchronously with the internal clock of the system. Further, traced results stored in the trace memories of the plural tracer parts 60 are collected and formed as a file. Then, the results are formed as a data flow graph and displayed. Thus, the debugging of a hardware or a software can be made easy and speedy in the development of the parallel processor.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、並列処理装置開発システムに関し、特にデ
ータ駆動形(データフロー)プロセッサの開発における
ハードウェア、ソフトウェアのデバッグを容易化、迅速
化できる開発支援環境(開発支援ツール)を有する並列
処理装置開発システムに関するものである。
[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a parallel processing device development system, and particularly to a system that can facilitate and speed up debugging of hardware and software in the development of data-driven (data flow) processors. The present invention relates to a parallel processing device development system having a development support environment (development support tool).

〔従来の技術〕[Conventional technology]

第11図は従来のデータ駆動形プロセッサの開発システ
ムの構成を示す図であり、図において、90はホストパ
ソコン、91はタイマ、92はメモリアドレスジェネレ
ータ、93はデータ駆動形プロセッサ、94はグラフィ
ックデイスプレィコントローラ、95はイメージメモリ
、96はCRT197はシステムハス、98はイメージ
メモリバスである。
FIG. 11 is a diagram showing the configuration of a conventional data-driven processor development system. In the figure, 90 is a host personal computer, 91 is a timer, 92 is a memory address generator, 93 is a data-driven processor, and 94 is a graphic processor. 95 is an image memory, 96 is a CRT 197 is a system bus, and 98 is an image memory bus.

この構成において、初期化、ブレークポイントの設定、
メモリ各部のダンプ表示・ロード・設定移動、入力、出
力、オブジェクトプログラムロードなどを行なう。
In this configuration, initialization, setting breakpoints,
Performs dump display, loading, setting movement, input, output, object program loading, etc. of each part of memory.

次に動作について説明する。Next, the operation will be explained.

初期化、オブジェクトロード、各部メモリの設定・ロー
ドなどは、ホストパソコン90からのコマンドに基づい
て、各部へホストパソコン90からデータを書き込むこ
とにより行なわれる。逆に、ダンプ表示は各部からホス
トパソコン90ヘデータを読み出すことにより行ない、
移動はこれらの組み合わせによって行なう。演算用デー
タの投入もホストパソコン90から行なうことができる
Initialization, object loading, setting/loading of each section's memory, etc. are performed by writing data from the host computer 90 to each section based on commands from the host computer 90. Conversely, dump display is performed by reading data from each part to the host computer 90,
Movement is performed by a combination of these. Data for calculation can also be input from the host computer 90.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

従来の並列処理装置開発システムは以上のように構成さ
れ、ホストパソコンからのコマンドによって上記の処理
を行なうが、メモリの値を実行途中や、終了の段階で表
示できるのみで、データ駆動形プロセッサにおける処理
をトレースして、その結果によって、データ駆動形プロ
セッサを用いた応用システムの開発におけるデバッグの
能率化を図ることが可能な開発支援環境ではなく、デー
タ駆動形プロセッサの応用システムの効率的開発が行な
えないという問題点があった。
Conventional parallel processing device development systems are configured as described above, and perform the above processing in response to commands from the host computer, but they can only display memory values during execution or at the end of execution, which is difficult for data-driven processors. It is not a development support environment that can trace processing and use the results to streamline debugging in the development of application systems using data-driven processors, but rather it is The problem was that it couldn't be done.

この発明は上記の問題点を解消するためになされたもの
で、データ駆動形プロセッサの応用システム開発におけ
るハードウェア及びソフトウェアのデバッグを能率よく
、高速に実施できる開発支援環境を有する並列処理装置
開発システムを得ることを目的とする。
This invention was made to solve the above problems, and is a parallel processing device development system having a development support environment that enables efficient and high-speed debugging of hardware and software in the development of application systems for data-driven processors. The purpose is to obtain.

〔課題を解決するための手段〕[Means to solve the problem]

この発明に係る並列処理装置開発システムは、1111
1卸コンピユータからマルチプロセッサ並列処理装置に
、該並列処理装置の実応用の処理速度に対応して高速に
処理用入力データを投入する、専用の投入パケットメモ
リを具備したデータ入力部と、上記並列処理装置の機能
部名部分のデータ転送状況を時刻情報とともに処理実行
状態でトレースする、トレースメモリを具備したトレー
ス部とを備えるとともに、該トレース部によるトレース
結果をファイル化し、データフローグラフを作成表示す
るようにしたものである。
The parallel processing device development system according to this invention is 1111
1. A data input unit equipped with a dedicated input packet memory that inputs processing input data from a wholesale computer to a multiprocessor parallel processing device at high speed corresponding to the processing speed of the actual application of the parallel processing device; It is equipped with a trace unit equipped with a trace memory that traces the data transfer status of the functional unit name part of the processing device along with time information in the processing execution state, and also converts the trace results by the trace unit into a file to create and display a data flow graph. It was designed to do so.

〔作用〕[Effect]

この発明においては、専用の投入パケットメモリを具備
したデータ入力部によって処理用入力データの投入を実
応用の処理速度に対応して高速に行なうとともに、トレ
ースメモリを具備したトレーサによってプロセッサ各機
能におけるデータ転送状況を実行状態のままトレースし
、さらにこのトレース結果をファイル化し、データフロ
ーグラフ化するようにしたから、並列処理装置の開発に
おけるハードウェア及びソフトウェアのデバッグを能率
よく、高速に実施できる。
In this invention, a data input unit equipped with a dedicated input packet memory inputs input data for processing at a high speed corresponding to the processing speed of practical applications, and a tracer equipped with a trace memory inputs input data for each processor function. Since the transfer status is traced while it is being executed, and the trace results are converted into a file and converted into a data flow graph, debugging of hardware and software in the development of a parallel processing device can be carried out efficiently and at high speed.

C実施例〕 以下、この発明の一実施例を図について説明する。C Example] An embodiment of the present invention will be described below with reference to the drawings.

第1図は本発明の一実施例による並列処理装置開発シス
テムの構成を示す図である。
FIG. 1 is a diagram showing the configuration of a parallel processing device development system according to an embodiment of the present invention.

図において、1は開発支援環境、10はデータ駆動形プ
ロセッサを含んで成るプロセシングエレメント(PE)
、20はデータ駆動形プロセッサ本体部、21は拡張プ
ログラム記憶部(ExtendedProgram S
tore: E P S ) 、2 2は拡張データ記
憶部、(Extended Data Store:E
 D S) 、2 3は外部カラー/スタック処理部(
External Color/Stack Proc
ess: E C S) 、3 1はパソコンなどの制
御コンピュータ、40はインタフェース部、60はトレ
ーサ部である。
In the figure, 1 is a development support environment, and 10 is a processing element (PE) including a data-driven processor.
, 20 is a data-driven processor main unit, and 21 is an extended program storage unit (Extended Program S).
tore: EP S ), 2 2 is an extended data storage unit, (Extended Data Store: E
DS), 2 3 is an external color/stack processing unit (
External Color/Stack Proc
ess: ECS), 3 1 is a control computer such as a personal computer, 40 is an interface section, and 60 is a tracer section.

第2図はプロセシングエレメント10の構成ヲ示す図で
、図において、11はキャシュプログラム記憶(Cac
he Program Store: C P S) 
、1 2は発火処理(Firing Control:
 F C) 、1 3は演算処理(Functiona
l Process: F P) 、1 4は合流分岐
機能(Junction & Branct+: J 
&B ) 、1 5はキューバソファ (Queuin
g Buffer: QB)である。
FIG. 2 is a diagram showing the configuration of the processing element 10. In the figure, 11 is a cache program storage (Cache program storage).
he Program Store: CPS)
, 1 2 is the firing process (Firing Control:
FC), 1 3 is arithmetic processing (Functiona)
l Process: F P), 14 is a junction & Branct+: J
&B), 1 5 is a Cuban sofa (Queuin
g Buffer: QB).

第3図はデータ駆動形プロセッサのパケットを示す図で
あり、図において、各フィールドは図中に示している通
りの機能を有するものである。
FIG. 3 is a diagram showing a packet of a data-driven processor, and in the figure, each field has a function as shown in the figure.

第4図はインターフェース部40の構成図であリ、41
はインターフェース部40とトレーサ部60を管理する
従来形(ノイマン)マイクロプロセッサユニットであり
、42はマイクロプロセッサユニット41のプログラム
とデータを記憶するROM及びRAM、43は制御コン
ピュータ31と接続するシリアルI10コントローラ、
44はプロセシングエレメント10のデータ駆動形プロ
セッサにデータパケットを投入するための出力ポート、
45は投入パケットメモリにデータ書き込みするための
書込みアドレスカウンタ、46は投入パケットメモリか
らデータ読み出しするための読出しアドレスカウンタ、
47はデータパケットの出力ポート44からの出力を終
了するときに用いられるパケット出力を停止するための
停止アドレスラッチ、48aは投入パケットメモリのア
ドレスマルチプレクサ、48bは投入パケットメモリの
データマルチプレクサ、49は出力ポートの出力ドライ
バ、50は4kX64bitsの投入パケットメモリ、
51はデータパケット投入時に投入パケットメモリ50
のアドレスを停止アドレスラッチ47の内容と比較する
アドレス比較器、52はデータパケット投入状態を示す
フリップフロップ、53はデータパケット投入開始トリ
ガ発生器、54はデータパケット投入の際のパケット間
隔を記憶する投入間隔ラッチ、55はデータパケット投
入間隔測定のための投入間隔カウンタ、56はデータパ
ケット投入の出力制御部である。
FIG. 4 is a configuration diagram of the interface section 40, 41
is a conventional (Neumann) microprocessor unit that manages the interface unit 40 and tracer unit 60; 42 is a ROM and RAM that stores programs and data for the microprocessor unit 41; and 43 is a serial I10 controller that connects to the control computer 31. ,
44 is an output port for inputting data packets to the data-driven processor of the processing element 10;
45 is a write address counter for writing data into the input packet memory; 46 is a read address counter for reading data from the input packet memory;
Reference numeral 47 indicates a stop address latch for stopping the packet output, which is used when ending the output of data packets from the output port 44, 48a indicates an address multiplexer for input packet memory, 48b indicates a data multiplexer for input packet memory, and 49 indicates an output. Port output driver, 50 is 4k x 64 bits input packet memory,
51 is an input packet memory 50 when inputting a data packet.
52 is a flip-flop that indicates the data packet input state, 53 is a data packet input start trigger generator, and 54 stores the packet interval when data packets are input. An input interval latch 55 is an input interval counter for measuring the data packet input interval, and 56 is an output control unit for inputting data packets.

第5図はトレーサ部60の構成図であり、図において、
61はトレースポート、62はタイマ、63は入力ラッ
チ、64は同期化回路、65はデマルチプレクサ、66
はモード制御部、67はアドレスカウンタ、68は4k
x96bitのトレースメモリ、69はリード/ライト
コントローラ、70はブレークポイントラッチ、71は
比較器、72はブレークポイントアドレスランチである
FIG. 5 is a configuration diagram of the tracer section 60, and in the figure,
61 is a trace port, 62 is a timer, 63 is an input latch, 64 is a synchronization circuit, 65 is a demultiplexer, 66
is a mode control unit, 67 is an address counter, and 68 is a 4k
x96-bit trace memory, 69 a read/write controller, 70 a breakpoint latch, 71 a comparator, and 72 a breakpoint address launch.

次にこの実施例の動作について説明する。Next, the operation of this embodiment will be explained.

データ駆動プロセッサ10はCPSII、FCl2、F
P13を基本要素とし、J&B14、QB15を合わせ
て第2図のように巡回パイプラインを構成している。E
PS21はCPSIIO外部拡張プログラムを格納する
機能部、EDS22は配列データなどを格納する機能部
、EC323はカラー管理と外部キューの機能部である
The data driven processor 10 is CPSII, FCl2, F
P13 is the basic element, and J&B14 and QB15 are combined to form a cyclic pipeline as shown in FIG. E
PS21 is a functional unit that stores a CPSIIO external extension program, EDS22 is a functional unit that stores array data, etc., and EC323 is a functional unit that handles color management and external queues.

第3図のようなフォーマットを有する入力パケットはJ
&B14の合流部を経て、CPSllに入力される。C
PSIIはEPS21を持ち、FCl2を通過したパケ
ットの次位行先をトリガに、EPSから次に必要となる
プログラムデータを取り出し、CPSIIに格納する。
The input packet with the format shown in Figure 3 is J
The signal is input to CPSll through the confluence section of &B14. C
The PSII has an EPS 21, and, triggered by the next destination of the packet that has passed through the FCl2, extracts the next required program data from the EPS and stores it in the CPSII.

単項演算の場合はそのまま、二項演算の場合にはオペラ
ンド対を形成した後、FCl2から出力される。この演
算パケットはFP13に送られ命令コード(OPC: 
0peration Code)により演算され、J&
B14の分岐機能により出力されるか否かが判定され、
出力されない場合には再びCPSIIに戻って以下同様
の処理を繰り返す。
In the case of a unary operation, it is output as is, and in the case of a binary operation, it is output from the FCl2 after forming an operand pair. This calculation packet is sent to the FP13 and the instruction code (OPC:
0operation Code), and J&
It is determined whether or not to output by the branch function of B14,
If it is not output, the process returns to CPSII again and the same process is repeated.

プログラムはループを除いて、基本的に若いノード番号
から実行されることを前提とし、FCl2のマツチング
メモリはハツシュされ、マツチングメモリでハツシュ衝
突した時には、世代が小さいもの、ノード番号の小さい
ものを保存し、そうでないものを巡回パイプラインある
いはEC323へ送出し、常に優先度の高いものから順
に処理を実行して、チップ内の巡回パイプラインが溢れ
ることなく処理実行がなされることを可能とするもので
ある。
It is assumed that the program is basically executed from the lowest node number, except for loops, and the matching memory of FCl2 is hashed, and when there is a hash collision in the matching memory, the one with the smaller generation or the one with the smaller node number It is possible to execute processing without overflowing the cyclic pipeline in the chip by saving the cyclic pipeline in the chip and sending the other ones to the cyclic pipeline or EC323, and always executing the processing in order of priority. It is something to do.

また、CPSIIとFCl2の間は巡回パイプラインの
他の部分のデータバス2本分を有し、CPSIIにおけ
るC0PY処理時にもデータ転送路に隘路のない構成と
なっている。
Furthermore, there are two data buses for other parts of the cyclic pipeline between CPSII and FCl2, so that there is no bottleneck in the data transfer path even during C0PY processing in CPSII.

開発支援環境1は制御コンピュータ31によってその動
作が制御される。ハードウェアは、インターフェース部
40及びトレーサ部60を含み、最小6枚構成である。
The operation of the development support environment 1 is controlled by a control computer 31. The hardware includes a minimum of six pieces including an interface section 40 and a tracer section 60.

そのうち、データ駆動形プロセッサを含んで成るプロセ
シングエレメント10はデータ駆動形プロセッサ本体部
20、拡張プロセッサ記憶部EPS21、拡張データ記
憶部EDS22、外部カラー・スタック処理部EC32
3の4枚で構成されている。
Among them, the processing element 10 including a data-driven processor includes a data-driven processor main unit 20, an extended processor storage unit EPS21, an extended data storage unit EDS22, and an external color stack processing unit EC32.
It consists of 4 pieces of 3.

開発支援環境1全体の制御は制御コンピュータ31によ
って行なわれる。制御コンピュータ31の開発支援環境
制御プログラムによってデータの投入・収集を行なう。
The entire development support environment 1 is controlled by a control computer 31. Data is input and collected by the development support environment control program of the control computer 31.

同制御プログラムによる処理機能を以下に示す。The processing functions of the control program are shown below.

■ 投入のモード プログラム・データのロード、入力データパケットのロ
ード、入力データパケット数の設定、入力データパケッ
トの投入、ダンプ用バケットの投入。
■ Input mode Load program/data, load input data packets, set number of input data packets, input input data packets, input dump bucket.

■ 収集のモード ブレークポイント比較値の設定、ブレークポイントマス
ク値の設定、トレース開始するトレーサの起動、トレー
スアドレスカウンタのプリセット、トレースメモリのフ
ァイルへの書き込み、ブレーポイント発生アドレス読み
出し。
■ Collection mode Set breakpoint comparison value, set breakpoint mask value, start tracer to start tracing, preset trace address counter, write trace memory to file, read breakpoint generation address.

メモリのダンプはプロセシングエレメント10のPE#
毎にEDS21.FCl2.EPS21に対してスター
トアドレス、エンドアドレスを指定してそれぞれのメモ
リから出力されるダンプバケットを、トレーサに収集す
るものである。この他に、初ル]化、所定時間の待機、
制御プログラムからの復帰などが行なえるものとなって
いる。
Memory dump is performed by PE# of processing element 10.
Every EDS21. FCl2. A tracer collects dump buckets output from each memory by specifying a start address and an end address for the EPS 21. In addition to this,
It is possible to return from the control program.

第4図及び第5図はそれぞれインターフェース部及びト
し−ス部の機能構成図である。制御コンピュータ:31
とデζ−タ駆動形プロセソザを含む開発支援環境1との
)〜・−夕の転送は、インターフェース部40を介して
行なわれる。
FIGS. 4 and 5 are functional configuration diagrams of the interface section and the toss section, respectively. Control computer: 31
Transfers between the data and the development support environment 1 including the data-driven processor are performed via the interface unit 40.

以下に両機能部の動作を詳述する。インターフェース部
40は・シリアルボー1〜43を持ち、制御コンピュー
タ31と接続される。、MPU41はシリアルボーI・
43からのコマンドにより、上記の投入モー ドと収集
モ・−ドの機能を実行する。インターフェース部40は
電源供給と同時に開発支援環境l全体の初期化を行な2
つだ後、制御コンピュータからのコマンド4待つ。プロ
グラム、データのロードは、1パケット当り第3図の様
なタグ領域とデータ32ビツトを−まとめにして、投入
バケットメモリ50の2ワードへの書き込みを行ない出
力ポート44からバケット毎に出力することにより行う
。入力データパケットの投入は高速に行うことが不可欠
であるので、投入バケットメモリ50を用いている。投
入バケットメモリ50は書き込みアドレスカウンタ45
を用いて最大4にワード分までロードし、入力データパ
ケット数に対応した情報を停止アドレスラッチ47に設
定した後、投入間隔を指定した投入コマンドにより読出
しアドレスカウンタ46が停止アドレスラッチ47 に
設定された値に一致するまで一気に投入する。
The operations of both functional units will be explained in detail below. The interface unit 40 has serial ports 1 to 43 and is connected to the control computer 31. , MPU41 is serial baud I.
The above-mentioned input mode and collection mode functions are executed by commands from 43. The interface unit 40 initializes the entire development support environment 2 at the same time as supplying power.
After that, wait for command 4 from the control computer. To load programs and data, the tag area and 32 bits of data as shown in FIG. This is done by Since it is essential to input data packets at high speed, an input bucket memory 50 is used. The input bucket memory 50 has a write address counter 45
After loading up to 4 words using the input data packet number and setting information corresponding to the number of input data packets in the stop address latch 47, the read address counter 46 is set in the stop address latch 47 by an input command that specifies the input interval. Pour in all at once until it matches the specified value.

更に、インターフェース部40のアドレス・データバス
はトレーサ部60へ接続され、トレーサ部60の制御も
併せて行われる。
Further, the address/data bus of the interface section 40 is connected to the tracer section 60, and the tracer section 60 is also controlled.

トレーサ部60は4kX95bitのトレースメモリ6
8を持ち、プロセシングエレメント10のいずれの端子
にも接続してそのトレースを行うことができる。トレー
サ部60はインターフェース部40のアドレス・データ
バスと接続され、インターフェース部40から直接制御
される。必要に応じて、ブレークポイントの比較値、マ
スクデータの設定を行うことが可能である。インターフ
ェース部40からトレーサ番号、トレースモードの設定
の後、トレースの開始が指示される。その後トレーサ部
60はトレースポート61から入って来るデータパケッ
トを内部クロックと同期化してランチし、時間情報とと
もにトレースメモリ68内に貯えて行く。ブレークポイ
ントランチ70にブレークポイントを設定した時には、
比較器71の出力で一致の採れたバケットを検出した後
停止するが、停止にあたっては直ちに停止、メモリ容量
の1/2のトレースの後停止、メモリ容量分のトレース
の後停止の3つのトレースモードを選択でき、トレース
履歴を有効に記憶する。
The tracer section 60 has a 4k x 95 bit trace memory 6.
8, and can be connected to any terminal of the processing element 10 for tracing. The tracer section 60 is connected to the address/data bus of the interface section 40 and is directly controlled by the interface section 40. If necessary, it is possible to set breakpoint comparison values and mask data. After setting the tracer number and trace mode, the interface unit 40 instructs to start tracing. Thereafter, the tracer section 60 synchronizes the data packets coming in from the trace port 61 with the internal clock, launches them, and stores them in the trace memory 68 along with time information. When setting a breakpoint on breakpoint launch 70,
It stops after detecting a matching bucket in the output of the comparator 71, but there are three trace modes: stop immediately, stop after tracing 1/2 of the memory capacity, and stop after tracing the memory capacity. can be selected and the trace history can be effectively stored.

トレース終了後、ブレークポイントアドレスラッチ72
からブレークポイント発生アドレスを読み出し、トレー
スモードとアドレスカウンタ6フ値から有効データを決
定できる。
After tracing, breakpoint address latch 72
The breakpoint generation address can be read from , and valid data can be determined from the trace mode and address counter 6 value.

このトレースメモリ68内のトレース結果は、インター
フェース部40により、ダンプし、ファイル化すること
ができ、このファイルをリスト表示することができる。
The trace results in the trace memory 68 can be dumped and converted into a file by the interface unit 40, and this file can be displayed as a list.

トレース部60は複数接続可能で1インターフェース部
40当り15個のトレース部60を用いて15点を同時
計測可能である。演算パケットや結果パケットなど機能
部との接続点でトレースを行い、同時に記憶されるトレ
ース時刻情報と共にシステム全体の動作を捕捉できる。
A plurality of trace sections 60 can be connected, and 15 trace sections 60 can be used per one interface section 40 to simultaneously measure 15 points. Tracing is performed at connection points with functional units such as calculation packets and result packets, and the operation of the entire system can be captured along with the trace time information stored at the same time.

本実施例ではトレーサ部60によって収集されたプロセ
シングエレメント10の各部のデータを表示することが
可能である。第6図はトレース結果の表示の様子の一例
を示す図であり、第6図fa)はFP13出力表示、第
6図(b)はEC323出力表示を示している。
In this embodiment, it is possible to display data of each part of the processing element 10 collected by the tracer unit 60. FIG. 6 is a diagram showing an example of how trace results are displayed. FIG. 6 fa) shows an FP13 output display, and FIG. 6B shows an EC323 output display.

データ駆動形プロセッサは言語処理系と併せて開発して
いるが、言語処理系のコンパイラ出力形式ファイルと、
マツパ出力であるオブジェクトコード、及び実行トレー
ス結果については、そのプログラムを図式表記・修正す
るツールを備えている。これはマルチプロセッサ実行環
境においてもプロセッサ毎のオブジェクトコードと実行
トレース結果の図的表示を可能とするものである。これ
らを比較することによって、未処理ノードや未投入デー
タパケット、未アクセスメモリなどが極めて簡単に発見
でき、マルチプロセッサのデバッグが容易である。実行
時の最大並列度、平均並列度、実行ランク数、実行時間
などが時刻情報と併せて表示でき、シミュレータ実行結
果と同様に稼動率の評価も簡単に行なえる。
The data-driven processor is developed in conjunction with the language processing system, but the language processing system's compiler output format file,
For the object code output from Matsupa and the execution trace results, tools are provided to graphically represent and modify the program. This allows graphical display of object code and execution trace results for each processor even in a multiprocessor execution environment. By comparing these, unprocessed nodes, uninput data packets, unaccessed memory, etc. can be found extremely easily, making it easy to debug multiprocessors. Maximum degree of parallelism, average degree of parallelism, number of execution ranks, execution time, etc. during execution can be displayed along with time information, and operation rates can be easily evaluated in the same way as simulator execution results.

この表示にあたっては、例えば特願昭6.2−5440
6「連想記憶装置及びデータ駆動形計算機」に記載され
たデータ入れ換え方式におけるノード番号付与に必要な
ランク解析結果を用いて表示し、アークについても、重
なりを減少するアルゴリズムを導入して視認性を向上さ
せている。
For this display, for example, Japanese Patent Application No. 6.2-5440
6 "Associative memory devices and data-driven computers" The results of the rank analysis necessary for assigning node numbers in the data replacement method described in 6. Improving.

コンパイラ出力形式ファイルの図的表示は関数単位で行
なえるもので、複数の関数が展開されたマツパ出力(オ
ブジェクトコード)の図的表示に比較すると一般に見易
いものである。
A graphical display of a compiler output format file can be performed on a function-by-function basis, and is generally easier to see than a graphical display of Matsupa output (object code) in which multiple functions are expanded.

第7図は3次多項式演算プログラムのデータフローグラ
フのマツパ出力のグラフインク表示例を示す図、第8図
はトレース結果の表示例を示す図である。
FIG. 7 is a diagram showing a graph ink display example of the mapper output of the data flow graph of the cubic polynomial calculation program, and FIG. 8 is a diagram showing a display example of the trace result.

このように本実施例では、投入パケットメモリ50を備
えたインタフェース部40を介して制御コンピュータ3
1からの処理実行のためのデータパケットを高速に並列
処理装置のプロセシングエレメント10に投入するとと
もに、プロセシングエレメント10の複数の端子にトレ
ースポートが接続された、各々トレースメモリ68を備
えた複数のトレーサ部60により上記トレースポートに
入ってくるデータパケットをシステムの内部クロックと
同期して共通の時刻情報とともにトレースし、さらに該
複数のトレーサ部60のトレースメモリに貯えられたト
レース結果を収集してファイル化し、データフローグラ
フ化して表示するようにしたから、並列処理装置の開発
におけるハードウェアあるいはソフトウェアのデバッグ
を極めて容易化、迅速化できる。
In this way, in this embodiment, the control computer 3
A plurality of tracers each having a trace memory 68 and having trace ports connected to a plurality of terminals of the processing element 10 input data packets for processing execution from 1 to the processing element 10 of the parallel processing device at high speed. The unit 60 traces data packets entering the trace port in synchronization with the internal clock of the system together with common time information, and further collects the trace results stored in the trace memories of the plurality of tracer units 60 and files them. Since the data flow graph is displayed in the form of a data flow graph, debugging of hardware or software in the development of a parallel processing device can be extremely facilitated and speeded up.

なお、上記実施例では、データ駆動形プロセッサの開発
支援環境として述べてきたが、他の並列処理計算機ある
いはプロセッサにおいても同様の方式で実現が可能であ
る。
Although the above embodiment has been described as a development support environment for a data-driven processor, it can also be implemented in a similar manner in other parallel processing computers or processors.

また、第1図の実施例において、プロセッサエレメント
10の接続方法については特に明記していないが、第9
図のような、シャツフルネット接続や、第10図のよう
なデイジ−チェーン接続など、その他の様々のものが可
能である。
In addition, in the embodiment shown in FIG.
Various other connections are possible, such as a shirt-full net connection, as shown, or a daisy-chain connection, as shown in FIG.

〔発明の効果〕〔Effect of the invention〕

以上のように、この発明によれば、専用の投入パケット
メモリを具備したデータ入力部を介して制御コンピュー
タより処理用入力データをプロセッサに実応用の処理速
度に対応して高速に投入するとともに、トレースメモリ
を具備したトレーサ部によってプロセッサの各機能部に
おけるデータ転送状況を実行状態のまま時刻情報ととも
にトレースし、さらにこのトレース結果をファイル化し
、データフローグラフ化して表示するようにしたから、
並列処理装置の開発におけるハードウェア及びソフトウ
ェアのデバッグを能率よく、高速に実施できる効果があ
る。
As described above, according to the present invention, input data for processing is inputted from the control computer to the processor at high speed corresponding to the processing speed of the actual application via the data input unit equipped with a dedicated input packet memory, and A tracer section equipped with a trace memory traces the data transfer status of each functional section of the processor along with time information while in the execution state, and the trace results are converted into a file and displayed as a data flow graph.
This has the effect of enabling efficient and high-speed debugging of hardware and software in the development of parallel processing devices.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例による並列処理装置開発シス
テムの構成を示す図、第2図はプロセシングエレメント
の構成を示す図、第3図はデータ駆動形プロセッサのバ
ケットを示す図、第4図はインターフェース部の構成図
、第5図はトレーサ部の構成図、第6図はトレース結果
の一例を示す図、第7図はデータフローグラフであるマ
ツパ出力のグラフインク表示例を示す図、第8図はトレ
ース結果の表示例を示す図、第9図はデータ駆動形プロ
セッサのシャツフルネット接続を示す図、第10図はデ
ータ駆動形プロセッサのデイジ−チェーン接続を示す図
、第11図は従来の並列処理装置開発システムの構成を
示す図である。 1は開発支援環境、10はデータ駆動形プロセッサから
成るプロセシングエレメント、20はデータ駆動形プロ
セッサ本体、40はインタフェース部、60はトレーサ
部である。 なお図中同一符号は同−又は相当部分を示す。
FIG. 1 is a diagram showing the configuration of a parallel processing device development system according to an embodiment of the present invention, FIG. 2 is a diagram showing the configuration of processing elements, FIG. 3 is a diagram showing buckets of a data-driven processor, and FIG. Figure 5 is a configuration diagram of the interface section, Figure 5 is a configuration diagram of the tracer unit, Figure 6 is a diagram showing an example of a trace result, Figure 7 is a diagram showing an example of graph ink display of Matupa output which is a data flow graph, FIG. 8 is a diagram showing a display example of trace results, FIG. 9 is a diagram showing a shirtful net connection of data-driven processors, FIG. 10 is a diagram showing a daisy-chain connection of data-driven processors, and FIG. 1 is a diagram showing the configuration of a conventional parallel processing device development system. 1 is a development support environment, 10 is a processing element consisting of a data-driven processor, 20 is a data-driven processor main body, 40 is an interface section, and 60 is a tracer section. Note that the same reference numerals in the figures indicate the same or equivalent parts.

Claims (1)

【特許請求の範囲】[Claims] (1)単数あるいは複数のマルチプロセッサからなる並
列処理装置と、 該並列処理装置を駆動する制御コンピュータと、該制御
コンピュータからの処理実行のためのパケットを複数個
記憶するためのメモリ手段と、該メモリ手段に記憶され
たパケットを設定可能な投入間隔で上記並列処理装置の
マルチプロセッサに入力するための計測手段とを備えた
データパケット入力部と、 上記マルチプロセッサの複数の機能部の所望の箇所に設
けられた入出力ポート及びデータ転送用ポートに接続さ
れ、上記ポートのデータパケットが、共通の時刻情報と
ともに内部クロックに同期して取り込まれ貯えられる内
部トレースメモリを備えたトレーサ部とを具備し、かつ
、 上記トレーサ部のトレースメモリに取り込まれた処理実
行結果であるデータパケットを処理順に表示する機能、
およびこれを実行プログラムと比較する機能を有するこ
とを特徴とする並列処理装置開発システム。
(1) A parallel processing device consisting of one or more multiprocessors, a control computer for driving the parallel processing device, memory means for storing a plurality of packets for processing execution from the control computer, and a data packet input section comprising a measuring means for inputting the packets stored in the memory means to the multiprocessor of the parallel processing device at settable input intervals; and a desired location of the plurality of functional sections of the multiprocessor. a tracer unit connected to an input/output port and a data transfer port provided in the controller, and equipped with an internal trace memory in which data packets from the ports are captured and stored in synchronization with an internal clock along with common time information. , and a function of displaying data packets that are processing execution results captured in the trace memory of the tracer unit in the order of processing;
A parallel processing device development system characterized by having a function of comparing this with an execution program.
JP1021700A 1989-01-31 1989-01-31 Parallel processor development system Expired - Lifetime JPH0740259B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1021700A JPH0740259B2 (en) 1989-01-31 1989-01-31 Parallel processor development system
US07/471,204 US5165036A (en) 1989-01-31 1990-01-29 Parallel processing development system with debugging device includes facilities for schematically displaying execution state of data driven type processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1021700A JPH0740259B2 (en) 1989-01-31 1989-01-31 Parallel processor development system

Publications (2)

Publication Number Publication Date
JPH02201695A true JPH02201695A (en) 1990-08-09
JPH0740259B2 JPH0740259B2 (en) 1995-05-01

Family

ID=12062340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1021700A Expired - Lifetime JPH0740259B2 (en) 1989-01-31 1989-01-31 Parallel processor development system

Country Status (1)

Country Link
JP (1) JPH0740259B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0214333A (en) * 1988-07-01 1990-01-18 Sharp Corp Debug device for data flow program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0214333A (en) * 1988-07-01 1990-01-18 Sharp Corp Debug device for data flow program

Also Published As

Publication number Publication date
JPH0740259B2 (en) 1995-05-01

Similar Documents

Publication Publication Date Title
US5165036A (en) Parallel processing development system with debugging device includes facilities for schematically displaying execution state of data driven type processor
US5038348A (en) Apparatus for debugging a data flow program
US4922413A (en) Method for concurrent execution of primitive operations by dynamically assigning operations based upon computational marked graph and availability of data
US20060259744A1 (en) Method for information processing
JPS5948424B2 (en) parallel computing system
JP2006509306A (en) Cell engine for cross-referencing data processing systems to related applications
KR20020020186A (en) Multiple logical interfaces to a shared coprocessor resource
JP3990332B2 (en) Data processing system
JPS60101644A (en) Parallel processing computer
JPH02201695A (en) System for developing parallel processor
JP2663893B2 (en) Architecture simulator
US10410713B1 (en) Content addressable memory modeling in emulation and prototyping
US20090043540A1 (en) Performance Testing of Message Passing Operations in a Parallel Computer
JP3696625B2 (en) Data-driven information processing device
Martín Álvarez et al. Efficient data redistribution for malleable applications
JP2006515446A (en) Data processing system with Cartesian controller that cross-references related applications
Haralick et al. Proteus: a reconfigurable computational network for computer vision
Fisher A multi‐processor implementation of occam
KR950703177A (en) ADVANCED MASSIVELY-PARALLEL COMPUTER APPARATUS
JPS6049464A (en) Inter-processor communication system of multi-processor computer
JP2755646B2 (en) Data driven data processor
JP2657947B2 (en) Data processing device
JPH05150943A (en) Computer
JPH02260083A (en) Parallel processor and development supporting device
JPS63204322A (en) Information processor

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 14

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 14