JP2858190B2 - Parallel processing system - Google Patents

Parallel processing system

Info

Publication number
JP2858190B2
JP2858190B2 JP4234653A JP23465392A JP2858190B2 JP 2858190 B2 JP2858190 B2 JP 2858190B2 JP 4234653 A JP4234653 A JP 4234653A JP 23465392 A JP23465392 A JP 23465392A JP 2858190 B2 JP2858190 B2 JP 2858190B2
Authority
JP
Japan
Prior art keywords
processor
processing
processor element
communication channel
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4234653A
Other languages
Japanese (ja)
Other versions
JPH0683789A (en
Inventor
治通 小野
伯一 清水
喜章 松本
拓雄 海野
渡辺  弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Control Systems Inc
Original Assignee
Hitachi Ltd
Hitachi Information and Control Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Information and Control Systems Inc filed Critical Hitachi Ltd
Priority to JP4234653A priority Critical patent/JP2858190B2/en
Publication of JPH0683789A publication Critical patent/JPH0683789A/en
Application granted granted Critical
Publication of JP2858190B2 publication Critical patent/JP2858190B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、一まとまりのデータ処
理を複数のプロセッサ(以下、プロセッサエレメントと
いう)に分割して並列処理する並列処理システムに関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel processing system for dividing a set of data processing into a plurality of processors (hereinafter referred to as "processor elements") for parallel processing.

【0002】[0002]

【従来の技術】並列処理システムは、音響信号処理や画
像信号処理などのように膨大な量の信号処理を高速に処
理するシステムであり、従来から種々の並列処理システ
ムが提案されている。
2. Description of the Related Art A parallel processing system is a system for processing an enormous amount of signal processing such as acoustic signal processing and image signal processing at a high speed, and various parallel processing systems have been proposed.

【0003】例えば、特開昭63−240667号公報
に記載された並列データ処理装置は、複数のプロセッサ
エレメントを行列状に配列し、縦と横方向に隣接するプ
ロセッサエレメント相互を、各プロセッサエレメントに
設けた4組の入出力線を持つデータ転送部を介して接続
し、データ転送部に接続された最大4つのプロセッサエ
レメントとの間でデータの送信/受信を可能にするとと
もに、入力されるデータを中継して他のプロセッサエレ
メントに転送可能に構成されている。
For example, in a parallel data processing apparatus described in Japanese Patent Application Laid-Open No. 63-240667, a plurality of processor elements are arranged in a matrix, and processor elements adjacent in the vertical and horizontal directions are assigned to each processor element. It is connected via a data transfer unit having four sets of input / output lines provided, enabling data transmission / reception with up to four processor elements connected to the data transfer unit, and inputting data. , And can be transferred to another processor element.

【0004】また、特開平3−127251号公報に記
載された並列計算機のデータ通信システムによれば、各
プロセッサエレメントに独立した4個の通信ポート又は
通信チャネルを設け、これを介して隣接するプロセッサ
エレメントを相互に接続し、各通信ポートに接続された
プロセッサエレメントとの間でデータの送信/受信を可
能にするとともに、一のプロセッサエレメントの任意の
2個の通信ポート間を直接的に接続可能にし、中継処理
を行わずに他の2つのプロセッサエレメント間のデータ
転送を直接通過(スルー)させるように構成されてい
る。
Further, according to the data communication system of a parallel computer described in Japanese Patent Application Laid-Open No. 3-127251, four independent communication ports or communication channels are provided for each processor element, and adjacent processor Elements can be connected to each other to enable data transmission / reception to and from the processor element connected to each communication port, and any two communication ports of one processor element can be directly connected. The data transfer between the other two processor elements is directly passed (through) without performing the relay processing.

【0005】しかし、上記2つの公報に記載されたシス
テムのデータ転送部又は通信ポートによれば、データの
送受信と中継(又はスルー中継)を同一時に行えないの
で、処理効率が悪い。
However, according to the data transfer unit or the communication port of the system described in the above two publications, data transmission and reception and relay (or through relay) cannot be performed at the same time, so that processing efficiency is poor.

【0006】また、特開平1−320564号公報に記
載された並列処理システムは、各プロセッサエレメント
の内部システムバスに4個の通信ポートを接続し、各通
信ポートに外部通信線を介して他のプロセッサエレメン
トをそれぞれ接続するとともに、隣合う通信ポートに接
続された外部通信線をバイパススイッチを介して連結可
能に構成したものが提案している。これによれば、隣合
う2つの通信ポートを介してデータの送受信を行いなが
ら、残りの隣合う2つの通信ポート間のバイパススイッ
チを閉じることにより、データのスルー中継を同一時に
行うことができる。
In the parallel processing system described in Japanese Patent Laid-Open Publication No. Hei 1-320564, four communication ports are connected to an internal system bus of each processor element, and each communication port is connected to another communication port via an external communication line. There has been proposed a configuration in which processor elements are connected to each other, and external communication lines connected to adjacent communication ports can be connected via a bypass switch. According to this, while transmitting / receiving data via two adjacent communication ports and closing the bypass switch between the remaining two adjacent communication ports, data through relay can be performed at the same time.

【0007】[0007]

【発明が解決しようとする課題】しかし、特開平1−3
20564号公報に記載された並列処理システムによれ
ば、隣合わない2つの通信ポートに接続された他のプロ
セッサエレメントと送信又は受信を行う場合には、残り
の隣合わない2つの通信ポートに接続された他のプロセ
ッサエレメント間のスルー中継を行えないという問題が
ある。つまり、隣合わない2つの通信ポート間でデータ
のスルー中継を行おうとすると、それらの間にある通信
ポートの外部通信線を経由することになり、3つの通信
ポートがスルー中継に使用されてしまうからである。
However, Japanese Patent Application Laid-Open No. Hei.
According to the parallel processing system described in JP-A-205564, when transmission or reception is performed with another processor element connected to two non-adjacent communication ports, the processor is connected to the remaining two non-adjacent communication ports. However, there is a problem that the through relay cannot be performed between the other processor elements. In other words, when trying to relay data through between two non-adjacent communication ports, the data passes through the external communication line of the communication port between them, and three communication ports are used for through relay. Because.

【0008】また、同様の理由により、隣合わない2つ
の通信ポートに接続されたプロセッサエレメント間のス
ルー中継を行いながら、残りの隣合わない2つの通信ポ
ートに接続された他のプロセッサエレメント間のスルー
中継を行うことができない。
For the same reason, while performing through relay between processor elements connected to two non-adjacent communication ports, communication between other processor elements connected to the remaining two non-adjacent communication ports is performed. Through relay cannot be performed.

【0009】したがって、並列処理システムの構成を一
定の範囲で変更できるが、変更の自由度が十分ではな
く、並列処理できるデータ処理の内容に制限を受けた
り、処理の高速化に制限を受ける場合がある。
Therefore, the configuration of the parallel processing system can be changed within a certain range, but the degree of freedom of the change is not sufficient, and the content of data processing that can be processed in parallel is limited, or the speed of processing is limited. There is.

【0010】また、従来の技術では、プロセッサエレメ
ントが故障した場合の対応について配慮されていないこ
とから、プロセッサエレメントが1つでも故障した場
合、システム全体の動作の保証ができなくなるという問
題がある。
Further, the prior art does not consider how to deal with a failure of a processor element. Therefore, if even one of the processor elements fails, the operation of the entire system cannot be guaranteed.

【0011】また、各プロセッサエレメントを接続する
通信ポートが4個に固定されていることから、処理でき
るパイプライン処理の段数に制限を受ける場合がある。
Further, since the number of communication ports connecting each processor element is fixed to four, the number of pipeline processing stages that can be processed may be limited.

【0012】また、一般に、各プロセッサエレメントは
処理プログラムをステップごとなどのいくつかの処理単
位に区分して実行するが、従来は、その処理単位を実行
する処理時間とデータ転送時間とを調和させることにつ
いて考慮されていないことから、無駄時間が発生する場
合があり、処理の高速化が十分でないという問題があ
る。
In general, each processor element executes a processing program by dividing it into several processing units such as steps, but conventionally, the processing time for executing the processing unit and the data transfer time are coordinated. Since this is not taken into account, there is a case where a dead time is generated, and there is a problem that the processing speed is not sufficiently high.

【0013】本発明の第1の目的は、プロセッサエレメ
ントに接続された複数のプロセッサエレメントの任意の
プロセッサエレメント間で、送信/受信とスルー中継と
を同一時に行うことができる並列処理システムを提供す
ることにある。
A first object of the present invention is to provide a parallel processing system in which transmission / reception and through relay can be performed at the same time between arbitrary processor elements of a plurality of processor elements connected to the processor element. It is in.

【0014】また、本発明の第2の目的は、第1の目的
に加え、プロセッサエレメントが故障しても、処理を継
続できる並列処理システムを提供することにある。
A second object of the present invention is to provide a parallel processing system capable of continuing processing even if a processor element fails, in addition to the first object.

【0015】また、本発明の第3の目的は、第1の目的
に加え、より多段のパイプライン処理を行うことができ
る並列処理システムを提供することにある。
It is a third object of the present invention to provide a parallel processing system capable of performing more multi-stage pipeline processing in addition to the first object.

【0016】また、本発明の第4の目的は、第1の目的
に加え、処理を一層高速化できる並列処理システムを提
供することにある。
Further, a fourth object of the present invention is to provide a parallel processing system which can further increase the processing speed in addition to the first object.

【0017】[0017]

【課題を解決するための手段】上記第1の目的を達成す
るため、本発明の第1の発明は、プロセッサとメモリと
複数の通信チャネルとを内部システムバスにより接続し
てなるプロセッサエレメントを複数備え、プロセッサエ
レメントのそれぞれを、所定数の他のプロセッサエレメ
ントと通信チャネルを介して相互に接続し、管理プロセ
ッサから与える指令に従って一まとまりのデータ処理を
前記各プロセッサエレメントに分担して実行させる並列
処理システムにおいて、プロセッサエレメントは、当該
プロセッサエレメントに属する複数の通信チャネルを共
通に接続可能なバイパスバスを複数有し、通信チャネル
のそれぞれは、当該通信チャネルに接続された他のプロ
セッサエレメントを内部システムバス又はバイパスバス
の1つのバスに接続するチャネルモード切り替え手段を
含んでなることを特徴とする。
In order to achieve the above first object, a first aspect of the present invention is to provide a multiprocessor system comprising a processor, a memory and a plurality of communication channels connected by an internal system bus. Parallel processing in which each of the processor elements is mutually connected to a predetermined number of other processor elements via a communication channel, and a group of data processing is shared and executed by each of the processor elements according to a command given from a management processor. In the system, the processor element has a plurality of bypass buses that can commonly connect a plurality of communication channels belonging to the processor element, and each of the communication channels connects another processor element connected to the communication channel to the internal system bus. Or connect to one of the bypass buses Characterized in that it comprises a channel mode switching means for.

【0018】この場合において、チャネルモード切り替
え手段は管理プロセッサから与えられるチャネルモード
指令に従って切り替えるようにすることができる。
In this case, the channel mode switching means can switch according to a channel mode command given from the management processor.

【0019】また、管理プロセッサにより、各通信チャ
ネルのチャネルモード切り替え手段を切り替え、当該通
信チャネルが属するプロセッサエレメントの処理データ
を複数の他のプロセッサエレメントに伝送するようにす
ることができる。
Further, the management processor can switch the channel mode switching means of each communication channel to transmit processing data of the processor element to which the communication channel belongs to a plurality of other processor elements.

【0020】また、管理プロセッサにより、各通信チャ
ネルのチャネルモード切り替え手段を切り替え、一の通
信チャネルに外部のプロセッサエレメントから入力され
る外部データを、バイパスバスと他の複数の通信チャネ
ルを介して他の外部の複数のプロセッサエレメントに同
時にスルーさせるようにすることができる。
Further, the management processor switches channel mode switching means of each communication channel, and external data inputted from an external processor element to one communication channel is transmitted to another communication channel via a bypass bus and another plurality of communication channels. Can be simultaneously passed through a plurality of external processor elements.

【0021】また、管理プロセッサは、複数のプロセッ
サエレメント相互を接続するインターフェイス通信線と
通信チャネルとの接続状態を管理する構成管理手段と、
各プロセッサエレメントの処理分担に基づいて各通信チ
ャネルのモードを決定し、該決定に基づいてチャネルモ
ード指令を各プロセッサエレメントに出力する通信チャ
ネルモード設定手段とを含んで構成することができる。
The management processor includes a configuration management means for managing a connection state between an interface communication line connecting a plurality of processor elements and a communication channel;
A communication channel mode setting unit that determines a mode of each communication channel based on the processing sharing of each processor element and outputs a channel mode command to each processor element based on the determination.

【0022】また、管理プロセッサは、通信チャネルモ
ード設定手段により全ての通信チャネルのモードを設定
した後、全てのプロセッサエレメントに処理開始指令を
出力するようにすることがこのましい。
It is preferable that the management processor outputs a processing start command to all processor elements after setting all communication channel modes by the communication channel mode setting means.

【0023】また、管理プロセッサは、データ処理を構
成する処理単位の終了とデータ転送の終了のいずれか遅
いものにあわせて、通信チャネルモード設定手段により
必要な通信チャネルのモードを変更設定するようにする
ことができる。
Further, the management processor changes and sets the necessary communication channel mode by the communication channel mode setting means in accordance with the end of the processing unit constituting the data processing or the end of the data transfer, whichever is later. can do.

【0024】上記第2の目的を達成するため、本発明の
第2の発明は、上記第1の発明に加え、管理プロセッサ
に、プロセッサエレメントの動作状態を監視する監視手
段と、該監視手段により動作異常が検出されたプロセッ
サエレメントを切り離すとともに、データ処理を行わせ
るプロセッサエレメント群の再構成を行う再構成手段と
を設け、通信チャネルモード設定手段は再構成手段の決
定に従って各通信チャネルのモードを変更し、該変更に
基づいてチャネルモード指令を各プロセッサエレメント
に出力するようにしたことを特徴とする。
According to a second aspect of the present invention, in order to achieve the second object, in addition to the first aspect, the management processor has a monitoring means for monitoring the operation state of the processor element, and the monitoring means Reconfiguring means for disconnecting the processor element in which the operation abnormality is detected and reconfiguring the processor element group for performing data processing, wherein the communication channel mode setting means sets the mode of each communication channel in accordance with the determination of the reconfiguration means. And a channel mode command is output to each processor element based on the change.

【0025】また、上記第1と第2の発明において、チ
ャネルモード切り替え手段は、他のプロセッサエレメン
トを内部システムバスとスルー用信号線の一方に接続す
る第1の切り替え手段と、スルー用信号線をバイパスバ
スの1つに選択接続する第2の切り替え手段とから構成
することが好ましい。
In the first and second inventions, the channel mode switching means includes a first switching means for connecting another processor element to one of the internal system bus and the through signal line, and a through signal line. And a second switching means for selectively connecting to one of the bypass buses.

【0026】上記第3の目的を達成するため、本発明の
第3の発明は、上記第1又は第2のの発明において、プ
ロセッサエレメントの通信チャネルを8個設けるととも
に、各通信チャネルを共通に接続可能なバイパスバスを
8個設け、そのプロセッサエレメントを行列状に複数配
列し、その行列の縦、横、斜め方向に隣接するプロセッ
サエレメント同士を通信チャネルを介して相互にトーラ
ス状に接続したことを特徴とする。
In order to achieve the third object, the third invention of the present invention is the invention according to the first or second invention, wherein eight communication channels of the processor element are provided and each communication channel is shared. Eight connectable bypass buses are provided, a plurality of processor elements are arranged in a matrix, and adjacent processor elements in the vertical, horizontal, and diagonal directions of the matrix are connected to each other in a torus shape via a communication channel. It is characterized by.

【0027】上記第4の目的を達成するため、本発明の
第4の発明は、プロセッサとメモリと複数の通信チャネ
ルとを内部システムバスにより接続してなるプロセッサ
エレメントを複数相互に接続して形成されたプロセッサ
エレメント群と、一まとまりのデータ処理を行う複数の
処理プログラムを各プロセッサエレメントに割付け、そ
の割付けに従って処理プログラムを対応するプロセッサ
エレメントのメモリに転送するとともに、プロセッサエ
レメント群を管理して複数の処理プログラムを並列処理
させる管理プロセッサと、処理プログラムを構成する処
理単位の開始タイミングを制御する同期信号を全てのプ
ロセッサエレメントに一斉に与える同期信号発生装置と
を備え、プロセッサエレメントのそれぞれは、当該プロ
セッサエレメントに属する複数の通信チャネルを共通に
接続可能なバイパスバスを複数有し、所定数の他のプロ
セッサエレメントと通信チャネルを介して相互に接続さ
れてなり、通信チャネルのそれぞれは、当該通信チャネ
ルに接続された他のプロセッサエレメントを内部システ
ムバス又は前記バイパスバスの1つのバスに接続するチ
ャネルモード切り替え手段を含んでなり、管理プロセッ
サは処理プログラムの割付けに従って各プロセッサエレ
メント相互間のデータの送受とその伝送ルートを決定
し、該決定に従って各通信チャネルのチャネルモード指
令を各チャネルモード切り替え手段に出力し、該チャネ
ルモード切り替え手段はチャネルモード指令に従って切
り替え動作するようにしたことを特徴とする。
In order to achieve the fourth object, a fourth invention of the present invention is to form a plurality of processor elements by connecting a processor, a memory, and a plurality of communication channels by an internal system bus. Assigning a plurality of processing programs for performing a group of data processing to each processor element, transferring the processing program to the memory of the corresponding processor element in accordance with the assignment, and managing the processor element group to generate a plurality of processing programs. And a synchronizing signal generator for simultaneously providing all processor elements with a synchronizing signal for controlling the start timing of a processing unit constituting the processing program. Processor element It has a plurality of bypass buses that can commonly connect a plurality of communication channels belonging thereto, and is mutually connected to a predetermined number of other processor elements via communication channels, and each of the communication channels is connected to the communication channel. Channel mode switching means for connecting another processor element to the internal system bus or one of the bypass buses, wherein the management processor transmits / receives data to / from each processor element according to the assignment of the processing program and the transmission route thereof. Is determined, and a channel mode command for each communication channel is output to each channel mode switching means in accordance with the determination, and the channel mode switching means performs a switching operation in accordance with the channel mode command.

【0028】この場合において、同期信号の周期を、プ
ロセッサエレメントの処理単位の処理時間にチャネルモ
ード切り替え手段の切り替え動作にかかる時間を加えた
時間よりも大きく設定することが好ましい。
In this case, it is preferable that the period of the synchronization signal is set to be longer than the sum of the processing time of the processing unit of the processor element and the time required for the switching operation of the channel mode switching means.

【0029】また、プロセッサエレメント群の処理単位
量と該処理に伴うデータ転送量とを統一し、該統一され
た量に基づいて同期信号の周期を設定することが好まし
い。
Further, it is preferable that the processing unit amount of the processor element group and the data transfer amount accompanying the processing are unified, and the period of the synchronization signal is set based on the unified amount.

【0030】[0030]

【作用】このように構成することにより、本発明によれ
ば、次の作用により上記目的が達成できる。
According to the present invention, the above object can be achieved by the following operation.

【0031】すなわち、第1の発明によれば、複数の通
信チャネルを共通に接続可能なバイパスバスを複数有す
るから、一のスルー中継にかかる2つの通信チャネルを
一のバイパスパスに接続し、他のスルー中継にかかる2
つの通信チャネルを他のバイパスバスに接続することに
より、任意のプロセッサエレメント間の複数のスルー中
継を同一時に行わせることができる。また、相手のプロ
セッサエレメントを内部システムバスに接続することに
より、他のスルー中継の制限を何ら受けることなくかつ
同一時に、送信又は受信を行うことができる。
That is, according to the first aspect, since there are a plurality of bypass buses which can connect a plurality of communication channels in common, two communication channels related to one through relay are connected to one bypass path, and 2 to relay through
By connecting one communication channel to another bypass bus, a plurality of through relays between arbitrary processor elements can be performed at the same time. In addition, by connecting the other processor element to the internal system bus, transmission or reception can be performed at the same time without any limitation of another through relay.

【0032】管理プロセッサにより各プロセッサエレメ
ントに指令を出し、各通信チャネルの接続状態を切り替
えるようにしたものによれば、プロセッサエレメント群
の並列システム構成を、処理プログラムの内容に応じて
自由にかつ速やかに構築することができる。
According to the configuration in which the management processor issues a command to each processor element to switch the connection state of each communication channel, the parallel system configuration of the processor element group can be freely and promptly changed according to the contents of the processing program. Can be built.

【0033】また、管理プロセッサにより一のプロセッ
サエレメントの複数の通信チャネルを内部システムバス
に接続して送信モードに設定できるから、そのすること
ができ、スループットを短縮できる。同様に、通信チャ
ネルの設定により、一のプロセッサエレメントからの転
送データを他の複数のプロセッサエレメントに同一時に
送信することができる。
Further, since a plurality of communication channels of one processor element can be connected to the internal system bus and set to the transmission mode by the management processor, the transmission mode can be set and the throughput can be reduced. Similarly, by setting a communication channel, transfer data from one processor element can be transmitted to a plurality of other processor elements at the same time.

【0034】管理プロセッサにシステムの接続状態を管
理する構成管理手段を設けたものによれば、データ処理
の内容に応じて各プロセッサエレメントの処理分担を決
定し、その決定に基づいて各通信チャネルのモードを設
定することにより、データ処理の内容に合わせて並列処
理システムを自動的に構築できる。つまり、個々のプロ
セッサエレメント相互の接続構成、及びプロセッサエレ
メント内の処理プログラムを一斉に設定変更可能である
ことから、限られたハードウェア構成の中で実現可能な
データ処理の内容を判断し、システムの再構築を迅速に
行うことができる。
According to the configuration in which the management processor is provided with the configuration management means for managing the connection state of the system, the processing allocation of each processor element is determined according to the contents of the data processing, and based on the determination, the communication channel of each communication channel is determined. By setting the mode, a parallel processing system can be automatically constructed according to the contents of data processing. That is, since the connection configuration between the individual processor elements and the processing program in the processor element can be changed at the same time, the contents of the data processing that can be realized in the limited hardware configuration are determined, and the system Can be quickly reconstructed.

【0035】また、各プロセッサエレメントの処理動作
を同期させるとともに、データ処理を構成する処理単位
の終了とデータ転送の終了のいずれか遅いものにあわせ
て、管理プロセッサにより必要な通信チャネルのモード
を変更設定するようしたものによれば、一まとまりのデ
ータ処理を構成する1フェーズごとの処理単位に合わせ
て、最適な並列処理システムを構築することができ、デ
ータ処理の内容に応じて最適な高速処理システムを構築
できる。
In addition, the processing operation of each processor element is synchronized, and the mode of the necessary communication channel is changed by the management processor according to the end of the processing unit constituting the data processing or the end of the data transfer, whichever is later. According to the setting, an optimal parallel processing system can be constructed according to a processing unit for each phase constituting a group of data processing, and an optimal high-speed processing can be performed according to the content of the data processing. Can build a system.

【0036】本発明の第2の発明によれば、プロセッサ
エレメントの監視手段により動作異常が検出されたプロ
セッサエレメントを、再構成手段により切り離すととも
にプロセッサエレメント群の再構成を行うようにしたか
ら、プロセッサエレメント群の一部に故障が発生しても
データ処理を継続でき、信頼性の高いシステムとするこ
とができる。
According to the second aspect of the present invention, the processor element in which the operation abnormality is detected by the processor element monitoring means is separated by the reconfiguration means and the processor element group is reconfigured. Even if a failure occurs in a part of the element group, data processing can be continued, and a highly reliable system can be provided.

【0037】本発明の第3の発明によれば、プロセッサ
エレメントの通信チャネルを8個設け、行列状に配列さ
れたプロセッサエレメントを縦、横、斜め方向に接続し
たものによれば、並列処理システムの接続構成の自由度
が向上するから、限られた規模のプロセッサエレメント
群により、多段処理を含む、より複雑なデータ処理を行
わせることができる。
According to the third aspect of the present invention, according to the parallel processing system in which eight communication channels of processor elements are provided and the processor elements arranged in a matrix are connected vertically, horizontally and diagonally, Since the degree of freedom of the connection configuration is improved, more complicated data processing including multi-stage processing can be performed by the processor element group of a limited scale.

【0038】例えば、複数の音源からなる音響シミュレ
ーションや、複雑な画像処理を高速かつ高品質に行うよ
うな場合、信号処理のためのデータ量や演算のためのパ
ラメータ量が増えるので、システム全体のスループット
の向上を図る必要があるため、並列処理の段数を増やす
などの対処が必要になる。このような場合、本発明によ
れば、信号処理のために必要となる複数の基本的な処理
プログラムを予め準備しておき、そのプログラムの変更
に伴うプロセッサエレメント間のデータ転送の方向を決
定し、それらを一斉に変更することでシステム全体の信
号処理の内容を迅速に変更することが可能である。
For example, when an acoustic simulation composed of a plurality of sound sources or a complicated image processing is performed at high speed and with high quality, the amount of data for signal processing and the amount of parameters for calculation increase, so that Since it is necessary to improve the throughput, it is necessary to take measures such as increasing the number of stages of parallel processing. In such a case, according to the present invention, a plurality of basic processing programs necessary for signal processing are prepared in advance, and the direction of data transfer between processor elements in accordance with the change of the program is determined. By changing them all at once, it is possible to quickly change the signal processing content of the entire system.

【0039】本発明の第4の発明によれば、各プロセッ
サエレメントの処理動作を、同一の同期信号に同期させ
て行わせるようにしたことから、オーバーヘッド時間を
少なくしてスループットを向上できる。
According to the fourth aspect of the present invention, since the processing operation of each processor element is performed in synchronization with the same synchronization signal, the overhead time can be reduced and the throughput can be improved.

【0040】特に、その同期信号の周期を、プロセッサ
エレメントの処理単位の処理時間にチャネルモード切り
替え手段の切り替え動作にかかる時間を加えた時間より
も大きく設定した場合は、各処理単位ごとに並列処理シ
ステムの構成を変更できるから、限られた規模のプロセ
ッサエレメントを用いて一層処理を高速化できるシステ
ムを構築できる。
In particular, when the period of the synchronization signal is set to be longer than the sum of the processing time of the processing unit of the processor element and the time required for the switching operation of the channel mode switching means, the parallel processing is performed for each processing unit. Since the configuration of the system can be changed, it is possible to construct a system that can further increase the processing speed by using processor elements of a limited scale.

【0041】また、プロセッサエレメント群の処理単位
量と該処理に伴うデータ転送量とを統一し、該統一され
た量に基づいて同期信号の周期を設定するようにすれ
ば、更にスループットを向上できる。
Further, the throughput can be further improved by unifying the processing unit amount of the processor element group and the data transfer amount accompanying the processing and setting the period of the synchronization signal based on the unified amount. .

【0042】[0042]

【実施例】以下、本発明を図示実施例に基づいて説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described below with reference to the illustrated embodiments.

【0043】図1乃至図5に、本発明の一実施例の並列
処理システムの構成図を示す。図1は、本発明の主要部
の1つである通信チャネルおよびその制御に関係する部
分の構成図である。図2は、並列処理システムの全体を
示す基本構成図である。図3は、並列処理システムを構
成する1つのプロセッサエレメントの構成図である。図
4は、並列処理システム全体を管理する管理プロセッサ
の構成図である。図5は、プロセッサエレメントの処理
動作のタイミングを制御する同期信号発生装置の構成図
である。
FIGS. 1 to 5 show configuration diagrams of a parallel processing system according to an embodiment of the present invention. FIG. 1 is a configuration diagram of a communication channel which is one of the main parts of the present invention and a portion related to its control. FIG. 2 is a basic configuration diagram showing the entire parallel processing system. FIG. 3 is a configuration diagram of one processor element configuring the parallel processing system. FIG. 4 is a configuration diagram of a management processor that manages the entire parallel processing system. FIG. 5 is a configuration diagram of a synchronization signal generator that controls the timing of the processing operation of the processor element.

【0044】図2に示すように、並列処理システムの基
本構成は、入力装置1と、複数のプロセッサエレメント
PEからなるプロセッサエレメント群2と、出力装置3
と、管理プロセッサ4と、同期信号発生装置5とを含ん
で構成されている。
As shown in FIG. 2, the basic configuration of the parallel processing system includes an input device 1, a processor element group 2 including a plurality of processor elements PE, and an output device 3.
, A management processor 4, and a synchronization signal generator 5.

【0045】プロセッサエレメント群2は、複数のプロ
セッサエレメントPEを、m(m=1,2,…,x)
行、n(n=1,2,…,y)列の行列状に配列し、横
(行)方向と、列(縦)方向と、斜め方向の隣合うプロ
セッサエレメントPEmn相互を、インターフェイス通
信線6により接続して構成されている。この実施例で
は、外周に配列されたプロセッサエレメントPEは、行
列の内側に配列されたプロセッサエレメントPEにのみ
接続されている。しかし、これに限らず、縦方向両端の
複数のプロセッサエレメントPE(PE11,…,PE
1y,PEx1,…,PExy)を隣合うものとして、
縦方向と斜め方向に接続して、トーラス状に構成するこ
とができる。例えば、PE11にPEx1とPEx2を
接続する如くである。
The processor element group 2 stores a plurality of processor elements PE as m (m = 1, 2,..., X)
Arranged in a matrix of rows and n (n = 1, 2,..., Y) columns, the processor elements PEmn adjacent in the horizontal (row) direction, the column (vertical) direction, and the oblique direction are interconnected by an interface communication line 6 for connection. In this embodiment, the processor elements PE arranged on the outer periphery are connected only to the processor elements PE arranged inside the matrix. However, the present invention is not limited to this, and a plurality of processor elements PE (PE11,.
1y, PEx1,..., PExy) as adjacent ones,
They can be connected in the vertical and diagonal directions to form a torus. For example, PEx1 and PEx2 are connected to PE11.

【0046】入力装置1は、複数のプロセッサエレメン
トPEmnで処理するデータをディジタル化するための
装置であり、本実施例では、第1列のプロセッサエレメ
ントPE11〜PEx1に入力インターフェイス7を介
して接続されている。出力装置3は、第y列のプロセッ
サエレメントPE1y〜PExyに出力インターフェイ
ス8を介して接続されている。出力装置3は、プロセッ
サエレメント群2により並列処理されたデータを、ディ
ジタルもしくはアナログ信号にて出力するようになって
いる。管理プロセッサ4は、入力装置1やプロセッサエ
レメント群2を含めたシステム全体を統括管理するもの
で、動作条件を制御パラメータにしてインターフェイス
9を介して各プロセッサエレメントPEmnに逐次出力
するようになっている。また、同期信号発生装置5は、
管理プロセッサ4からインターフェイス10を介して与
えられる指令に応じてプロセッサエレメント群2の処理
動作のタイミングを制御する同期信号11を発生する。
その同期信号11はインターフェイスを介して各プロセ
ッサエレメントPEmnに与えられる。プロセッサエレ
メント群2は、同期信号11により処理を開始し、その
同期信号11のサイクル内に、データ処理の1フェーズ
(処理単位)の処理を終了し、それを繰り返し行う。各
プロセッサエレメントPEmnは、装置全体のデータ処
理のうち、並列演算の処理をそれぞれ分担しており、入
力装置1から受信したデータを処理、加工し、通信線6
を介して次段もしくは周辺のプロセッサエレメントPE
へ転送する。最終的な処理結果は出力装置4から出力さ
れる。
The input device 1 is a device for digitizing data to be processed by the plurality of processor elements PEmn. In this embodiment, the input device 1 is connected to the first row of processor elements PE11 to PEx1 via the input interface 7. ing. The output device 3 is connected to the processor elements PE1y to PExy in the y-th column via the output interface 8. The output device 3 outputs data processed in parallel by the processor element group 2 as digital or analog signals. The management processor 4 manages the entire system including the input device 1 and the processor element group 2, and sequentially outputs the operation conditions as control parameters to the respective processor elements PEmn via the interface 9. . In addition, the synchronization signal generator 5
A synchronization signal 11 for controlling the timing of the processing operation of the processor element group 2 is generated in response to a command given from the management processor 4 via the interface 10.
The synchronization signal 11 is provided to each processor element PEmn via an interface. The processor element group 2 starts processing in response to the synchronization signal 11, ends one phase (processing unit) of data processing within the cycle of the synchronization signal 11, and repeats the processing. Each processor element PEmn is responsible for parallel processing among the data processing of the entire device, and processes and processes data received from the input device 1 to perform communication processing.
Through the next stage or peripheral processor element PE
Transfer to The final processing result is output from the output device 4.

【0047】次に、各装置の詳細構成を説明する。各プ
ロセッサエレメントPEmnは同一に構成されており、
そのブロック構成を図3に示し、通信チャネルを中心と
する詳細構成図を図1に示す。図3に示すように、プロ
セッサエレメントPEは、それぞれ破線で囲まれた信号
処理部20と、制御部30と、通信部40の3つのブロ
ックに分けられ、それらは内部システムバス50によっ
て接続されている。信号処理部20は、シグナルプロセ
ッサ21と、インストラクションメモリ22と、データ
ストレージ23とを含んで構成されている。制御部30
は、制御プロセッサ31と、チャネルモード設定レジス
タ32と、チャネルステータスレジスタ33と、相手P
Eステータスレジスタ34とを含んで構成されている。
通信部40は、最大8個の通信チャネルCH1〜CH8
と、8組のバイパスバス42を有して構成されている。
各通信チャネルCHは同一の構成となっており、送信、
受信又はスルー中継にプリセット可能な単方向通信チャ
ネルである。したがって、個々のプロセッサエレメント
PEは最大8つの通信チャネルを有し、トーラス結合方
式による完全並列処理が可能である他、汎用的にシステ
ム全体の処理内容に応じて様々な接続状態を形成するこ
とができる。
Next, the detailed configuration of each device will be described. Each processor element PEmn is configured identically,
FIG. 3 shows the block configuration, and FIG. 1 shows a detailed configuration diagram focusing on the communication channel. As shown in FIG. 3, the processor element PE is divided into three blocks of a signal processing unit 20, a control unit 30, and a communication unit 40, each of which is surrounded by a broken line, and these are connected by an internal system bus 50. I have. The signal processing unit 20 includes a signal processor 21, an instruction memory 22, and a data storage 23. Control unit 30
Is a control processor 31, a channel mode setting register 32, a channel status register 33,
And an E status register 34.
The communication unit 40 includes up to eight communication channels CH1 to CH8.
And eight sets of bypass buses 42.
Each communication channel CH has the same configuration,
This is a unidirectional communication channel that can be preset for reception or through relay. Therefore, each processor element PE has a maximum of eight communication channels, is capable of performing completely parallel processing by the torus coupling method, and is generally capable of forming various connection states according to the processing contents of the entire system. it can.

【0048】シグナルプロセッサ21は、プロセッサエ
レメント群2の全体で行うデータ処理の一部の処理、即
ちパイプライン処理の一部分を受け持つ。この分担の割
付けは管理プロセッサ4により行われる。
The signal processor 21 is responsible for part of data processing performed by the entire processor element group 2, that is, part of pipeline processing. This assignment is performed by the management processor 4.

【0049】制御プロセッサ31は、管理プロセッサ4
からの命令を受取り、プロセッサエレメントPE内全体
をコントロールするための制御専用のプロセッサであ
る。そのため、制御プロセッサ31はインターフェイス
9によって管理プロセッサ4に接続され、同期信号発生
装置5から同期信号11が入力されている。例えば、制
御プロセッサ31は、管理プロセッサ4からの命令によ
ってシグナルプロセッサ21に対する起動/停止指令2
4を、インストラクションメモリ22にシグナルプロセ
ッサ21用の信号処理プログラムの格納指令25を出力
する。また、管理プロセッサ4に対するプロセッサエレ
メントPE内部ステータスの報告を行う。また、管理プ
ロセッサ4からの指令により通信チャネルCH1〜8に
対する各種の設定等をチャネルモードレジスタ32に行
う。
The control processor 31 includes the management processor 4
Is a processor dedicated to control for receiving instructions from the processor element PE and controlling the entire processor element PE. Therefore, the control processor 31 is connected to the management processor 4 by the interface 9, and receives the synchronization signal 11 from the synchronization signal generator 5. For example, the control processor 31 issues a start / stop command 2 to the signal processor 21 according to a command from the management processor 4.
4 is output to the instruction memory 22 as a storage instruction 25 of a signal processing program for the signal processor 21. Further, it reports the internal status of the processor element PE to the management processor 4. In addition, various settings and the like for the communication channels CH1 to CH8 are performed in the channel mode register 32 according to a command from the management processor 4.

【0050】チャネルモード設定レジスタ32には、管
理プロセッサ4からの命令により各通信チャネルCH1
〜8の通信チャネルの動作モード(チャネルモードと略
称する)の設定がなされる。チャネルモードには送信、
受信又はスルー中継がある。チャネルステータスレジス
タ33には、通信チャネルCH1〜8に設定されている
送信、受信、スルー中継のチャネルモードの設定状態が
格納される。相手PEステータスレジスタ34には、通
信チャネル毎の相手側のチャネルモードの設定状態(送
信、受信又はスルー中継の設定状態)が逐次記録され
る。この相手PEステータスレジスタ34に格納されて
いる情報は、制御プロセッサ31により管理プロセッサ
4へ転送される。
The channel mode setting register 32 stores each communication channel CH1 according to an instruction from the management processor 4.
Operation modes (hereinafter abbreviated as channel modes) of communication channels Nos. To 8 are set. Transmit in channel mode,
There is reception or through relay. The channel status register 33 stores the setting state of the channel mode for transmission, reception, and through relay set for the communication channels CH1 to CH8. In the partner PE status register 34, the setting state of the channel mode of the partner side for each communication channel (the setting state of transmission, reception or through relay) is sequentially recorded. The information stored in the partner PE status register 34 is transferred to the management processor 4 by the control processor 31.

【0051】通信チャネルCH1〜8は同一構成であ
り、図1に例示した通信チャネルCH1、CH2のよう
に構成されている。図示のように、各通信チャネルCH
は、切り替え手段41A,41Bによって切り替え使用
されるバッファメモリ42A,bと、転送手段44と、
送受信/スルー切り替え手段45と、相手PEステータ
ス監視手段46と、バイパスバス切り替え手段47とを
含んで構成されている。2つのバッファメモリ42A,
42Bは切り替え手段41Aを切り替えることによっ
て、内部システムバス50に選択的に接続され、また切
り替え手段41Bによって転送手段44に選択的に接続
される。転送手段44は相手プロセッサエレメントPE
とのデータの送信/受信を行うための機構である。送受
信/スルー切り替え手段45はチャネルモード設定レジ
スタ32の設定内容にしたがって、送受信モードのとき
は外部通信線6を転送手段44に接続し、スルー中継モ
ードのときはスルー用通信線48に切り替え接続する。
バイパスバス切り替え手段47はチャネルモード設定レ
ジスタ32の設定内容にしたがって、スルー用通信線4
8をバイパスバス42a〜hの1つのバイパスバスに接
続可能に構成されている。
The communication channels CH1 to CH8 have the same configuration, and are configured like the communication channels CH1 and CH2 illustrated in FIG. As shown, each communication channel CH
Are buffer memories 42A, b switched by the switching means 41A, 41B, transfer means 44,
It includes transmission / reception / through switching means 45, partner PE status monitoring means 46, and bypass bus switching means 47. Two buffer memories 42A,
42B is selectively connected to the internal system bus 50 by switching the switching means 41A, and is selectively connected to the transfer means 44 by the switching means 41B. The transfer means 44 is a processor element PE
This is a mechanism for transmitting / receiving data to / from the server. The transmission / reception / through switching unit 45 connects the external communication line 6 to the transfer unit 44 in the transmission / reception mode and switches to the through communication line 48 in the through relay mode according to the setting contents of the channel mode setting register 32. .
The bypass bus switching means 47 supplies the through communication line 4 in accordance with the setting contents of the channel mode setting register 32.
8 can be connected to one of the bypass buses 42a to 42h.

【0052】転送手段44、送受信/スルー切り替え手
段45、およびバイパスバス切り替え手段47は、それ
ぞれチャネルモード設定レジスタ32に設定されたチャ
ネルモードを信号線51を介して取り込み、それらの動
作又は切り替えを行うようになっている。また、転送手
段44、送受信/スルー切り替え手段45、およびバイ
パスバス切り替え手段47の動作状態は、信号線52を
介してチャネルモードステータスレジスタ33に格納さ
れる。なお、チャネルモード設定レジスタ32へのチャ
ネルモードの設定は、シグナルプロセッサ21の処理動
作が開始する前に送信、受信又はスルー中継の何れかに
設定される。そして、シグナルプロセッサ21からの起
動により処理開始後データ転送を開始する。バッファメ
モリ42A,Bは交替バッファメモリである。これらの
交替バッファメモリ42A,Bを通信バッファとして用
いることにより、シグナルプロセッサ21のシステムバ
ス50へのアクセスと、通信チャネルCH毎の相手プロ
セッサエレメントPE間とのデータ転送を並列に行うよ
うになっている。また、後述するように、シグナルプロ
セッサ21による1フェーズの処理時間と通信チャネル
CHのデータ転送時間とが、同期信号発生装置3より生
成される同期信号の1サイクル内に終了するように設定
してある。これにより、シグナルプロセッサ21の処理
時間と転送手段44によるデータ転送時間のオーバーヘ
ッドが無くなる。
The transfer means 44, the transmission / reception / through switching means 45, and the bypass bus switching means 47 each take in the channel mode set in the channel mode setting register 32 via the signal line 51, and perform their operations or switching. It has become. The operating states of the transfer means 44, the transmission / reception / through switching means 45, and the bypass bus switching means 47 are stored in the channel mode status register 33 via the signal line 52. The setting of the channel mode in the channel mode setting register 32 is set to transmission, reception, or through relay before the processing operation of the signal processor 21 starts. Then, the data transfer is started after the processing is started by activation from the signal processor 21. The buffer memories 42A and 42B are replacement buffer memories. By using these replacement buffer memories 42A and 42B as communication buffers, access to the system bus 50 of the signal processor 21 and data transfer between the partner processor elements PE for each communication channel CH are performed in parallel. I have. Further, as described later, it is set that the processing time of one phase by the signal processor 21 and the data transfer time of the communication channel CH are completed within one cycle of the synchronization signal generated by the synchronization signal generator 3. is there. This eliminates the overhead of the processing time of the signal processor 21 and the data transfer time of the transfer means 44.

【0053】相手PEステータス監視手段46は、外部
通信線6を介してその通信チャネルCHに接続されてい
る相手PEの識別番号を検出し、信号線53により相手
PEステータスレジスタ34に記憶する。この記憶され
た情報は、制御プロセッサ31を経由して管理プロセッ
サ4へ伝えられる。
The partner PE status monitoring means 46 detects the identification number of the partner PE connected to the communication channel CH via the external communication line 6 and stores it in the partner PE status register 34 via the signal line 53. This stored information is transmitted to the management processor 4 via the control processor 31.

【0054】管理プロセッサ4は、図4に示すように構
成されている。CPU61は管理プロセッサ4内の処理
をつかさどる中央処理装置である。プログラムダウンロ
ード用記憶装置62は、プロセッサエレメント群2の個
々のプロセッサエレメントPEmnに処理プログラムを
ダウンロードするための記憶装置であり、データ処理に
必要な種々のプログラムを格納している。主メモリ63
内のPEステータス監視プログラム63Aは、プロセッ
サエレメントPEmnの全てについて設定されているP
E相互の接続状態と、各プロセッサエレメントPEmn
の通信チャネルCHのチャネルモードの設定状態とを、
インタフェース9を介して受信チャネル64から取り込
んで記憶している。CPU61は、このPEステータス
監視プログラムによってPE相互の接続状態と、各プロ
セッサエレメントPEmnの通信チャネルCH1〜8の
設定状態を把握し、システム全体として実行可能なデー
タ処理プログラムを決定できるようになっている。ま
た、仮に何れかのプロセッサエレメントPEにおいて故
障が発生した場合はその異常が反映され、全てのプロセ
ッサエレメントPEmnについてハードウェアが正常か
異常かの判断をするようになっている。制御指令生成プ
ログラム63Cは、プロセッサエレメントPEmnを制
御するための命令を生成するものである。生成する命令
には、大きく分けて、個々のプロセッサエレメントPE
mnに対する命令と、プロセッサエレメント群2の全体
に対して一斉に指令を出す命令がある。前者には、プロ
セッサエレメントPE内部の通信チャネルCHのチャネ
ルモード設定指令(送信、受信、スルー中継の設定命
令)、プロセッサエレメントPEへの信号処理プログラ
ムのダウンロード指示命令、同期信号発生装置3からの
同期信号11を受け付けるか否かの同期信号有効/無効
命令等がある。同期信号制御手段66は、同期信号発生
装置3への起動/停止並びに同期信号11の周期の設定
を行う。これらの命令等は、送信チャネル65を介して
各プロセッサエレメントPEmnに転送される。 図5
は、同期信号発生装置3の内部ブロック図である。同期
信号発生装置3は、管理プロセッサ4からプログラマブ
ルタイマ72に入力される起動/停止指令および周期設
定制御指令に従って動作する。つまり、発振器71から
のクロック信号をプログラマブルタイマ72により分周
して設定された周期の同期信号を生成して発生する。実
際に各プロセッサエレメントPEmnに出力される同期
信号11は、全てのプロセッサエレメントに共通の信号
であり、負荷が大きいので、ドライバー73を用いてパ
ワー増幅して出力している。
The management processor 4 is configured as shown in FIG. The CPU 61 is a central processing unit that controls processing in the management processor 4. The program download storage device 62 is a storage device for downloading a processing program to each processor element PEmn of the processor element group 2, and stores various programs necessary for data processing. Main memory 63
The PE status monitoring program 63A in the P includes P which is set for all of the processor elements PEmn.
E connection state and each processor element PEmn
And the setting state of the channel mode of the communication channel CH of
The data is fetched from the reception channel 64 via the interface 9 and stored. The CPU 61 grasps the connection state between the PEs and the setting state of the communication channels CH1 to CH8 of each processor element PEmn by using the PE status monitoring program, and can determine a data processing program executable as the whole system. . If a failure occurs in any of the processor elements PE, the abnormality is reflected, and it is determined whether the hardware is normal or abnormal for all the processor elements PEmn. The control command generation program 63C is for generating an instruction for controlling the processor element PEmn. The instructions to be generated are roughly divided into individual processor elements PE.
mn and an instruction for issuing a command to the entire processor element group 2 all at once. The former includes a channel mode setting instruction (a transmission, reception, through relay setting instruction) for a communication channel CH inside the processor element PE, a signal processing program download instruction instruction to the processor element PE, and a synchronization from the synchronization signal generator 3. There is a synchronization signal valid / invalid command for determining whether or not to accept the signal 11. The synchronization signal control unit 66 starts / stops the synchronization signal generator 3 and sets the cycle of the synchronization signal 11. These instructions and the like are transferred to each processor element PEmn via the transmission channel 65. FIG.
3 is an internal block diagram of the synchronization signal generator 3. FIG. The synchronization signal generator 3 operates according to a start / stop command and a cycle setting control command input from the management processor 4 to the programmable timer 72. That is, the clock signal from the oscillator 71 is frequency-divided by the programmable timer 72 to generate and generate a synchronization signal having a set cycle. The synchronization signal 11 actually output to each processor element PEmn is a signal common to all the processor elements and has a large load. Therefore, the power is amplified using the driver 73 and output.

【0055】ここで、プロセッサエレメント群2の各プ
ロセッサエレメントPEmnの接続構成を設定又は変更
して、データ処理の種類や内容に合わせて並列処理シス
テムを構築又は再構築する手順について、図6〜図10
を参照しながら説明する。
Here, the procedure for setting or changing the connection configuration of each processor element PEmn of the processor element group 2 to construct or reconstruct a parallel processing system according to the type and content of data processing will be described with reference to FIGS. 10
This will be described with reference to FIG.

【0056】並列処理システムを構築又は再構築は、管
理プロセッサ4の機能により行う。まず、管理プロセッ
サ4には、プロセッサエレメント群2の基本構成である
PE配列情報(x行×y列の情報)と、入力装置1と出
力装置3が接続されたプロセッサエレメントPEの位置
または識別番号がインプットされている。
The construction or reconstruction of the parallel processing system is performed by the function of the management processor 4. First, the management processor 4 has PE array information (information of x rows × y columns), which is the basic configuration of the processor element group 2, and the position or identification number of the processor element PE to which the input device 1 and the output device 3 are connected. Is input.

【0057】管理プロセッサ4のCPU61はシステム
立ち上げの際に、図6に示す手順により、イニシャル処
理を行う。
The CPU 61 of the management processor 4 performs initial processing according to the procedure shown in FIG. 6 when starting up the system.

【0058】〈ステップ101〉全てのプロセッサエレ
メントPEmnに対して、それらが正常に動作するか否
かのチェックを行い、全てが動作可能であることを確認
する。
<Step 101> For all processor elements PEmn, it is checked whether or not they operate normally, and it is confirmed that all are operable.

【0059】〈ステップ102〉図7に示す信号処理種
別認識プログラム63Bの手順に従って、信号処理種別
認識処理を行う。まず、実行予定の複数の信号処理に対
してタスク番号を付け、以後そのタスク番号により信号
処理の種別を認識する(ステップ111)。次に、現在
のプロセッサエレメント群2の構成規模に基づいて、プ
ロセッサエレメント間の接続を構築して所望の信号処理
のアルゴリズム(例えば、1まとまりの信号処理をいく
つかの処理ブロックに分けた内容)を実現できるか否か
を判断する(ステップ112)。規模が適当でないとき
は、プロセッサエレメントの増設が必要であることを出
力して終了する。規模が適当と判断したときは、図6の
処理に戻る。
<Step 102> Signal processing type recognition processing is performed according to the procedure of the signal processing type recognition program 63B shown in FIG. First, a task number is assigned to a plurality of signal processes to be executed, and thereafter, the type of the signal process is recognized based on the task number (step 111). Next, based on the current configuration scale of the processor element group 2, a connection between the processor elements is established to execute a desired signal processing algorithm (for example, contents obtained by dividing a set of signal processing into several processing blocks). Is determined (step 112). If the scale is not appropriate, it is output that a processor element needs to be added, and the process ends. If it is determined that the scale is appropriate, the process returns to the processing in FIG.

【0060】〈ステップ103〉ここでは、図8の処理
手順に従って、各プロセッサエレメント相互間の通信チ
ャネルCHのチャネルモードを設定して接続処理を行
う。まず、上記の信号処理ブロックに対し、データの流
れに従って順番にプロセッサエレメントPEmnを割り
付ける(ステップ121)。次に、隣合うプロセッサエ
レメントPE同士でデータの送受を行うものがあれば、
それらの通信チャネルCHのチャネルモードを送信又は
受信に設定して接続する(ステップ122)。次に、デ
ータの送受を行うプロセッサエレメントPEが隣合わな
いなどの理由により、他のプロセッサエレメントをスル
ー中継してデータ転送しなければならない場合は、再短
距離でデータ転送できるルートを探し、関連するプロセ
ッサエレメントPEの通信チャネルCHのチャネルモー
ドをスルー中継モードに設定して、データ転送にかかる
プロセッサエレメントPE間を接続する(ステップ12
3)。次に、必要な接続がされていない未接続のプロセ
ッサエレメントPEの有無を判断する(ステップ12
4)。未接続のものがあれば、既に設定したプロセッサ
エレメントPEのスルー中継のルートを変更しながら、
未接続のプロセッサエレメントPEを無くすようにする
(ステップ125)。そして、未接続のものが無くなれ
ば、処理を終了し、スルー中継のルートを変更しても未
接続のプロセッサエレメントPEが無くならない場合
は、ステップ127にすすんで、信号処理ブロックに対
するプロセッサエレメントPEmnの割り付けを変更
し、ステップ122に戻って処理を繰り返す(ステップ
126)。
<Step 103> Here, according to the processing procedure of FIG. 8, the connection mode is set by setting the channel mode of the communication channel CH between the processor elements. First, processor elements PEmn are sequentially allocated to the above signal processing blocks in accordance with the flow of data (step 121). Next, if there is one that transmits and receives data between adjacent processor elements PE,
The connection mode is set by setting the channel mode of those communication channels CH to transmission or reception (step 122). Next, when it is necessary to transfer data through another processor element for the reason that the processor elements PE which transmit and receive data are not adjacent to each other, a route that can transfer data over a short distance is searched for. The channel mode of the communication channel CH of the processor element PE to be set is set to the through relay mode, and the processor elements PE involved in data transfer are connected (step 12).
3). Next, it is determined whether there is an unconnected processor element PE to which a necessary connection has not been made (step 12).
4). If there is an unconnected one, while changing the route of the through relay of the processor element PE already set,
Unconnected processor elements PE are eliminated (step 125). If there is no unconnected processor element, the process is terminated. If there is no unconnected processor element PE even if the route of the through relay is changed, the process proceeds to step 127, where the processor element PEmn for the signal processing block is The assignment is changed, and the process returns to step 122 to repeat the process (step 126).

【0061】以上のステップ101から103により、
管理プロセッサ4は並列処理システムが実行する複数の
信号処理に対応させて、プロセッサエレメント群2の接
続を構築できるように、各プロセッサエレメントPEの
複数の通信チャネルCHのチャネルモードを決定する。
By the above steps 101 to 103,
The management processor 4 determines the channel mode of the plurality of communication channels CH of each processor element PE so that the connection of the processor element group 2 can be established in correspondence with the plurality of signal processes executed by the parallel processing system.

【0062】〈ステップ104〉ステップ103で決定
された各通信チャネルCHのチャネルモードに従って、
制御指令生成プログラム63Cにより各プロセッサエレ
メントPEの各通信チャネルを設定するためのチャネル
モード制御指令に加工してメモリに格納しておく。
<Step 104> According to the channel mode of each communication channel CH determined in step 103,
The control command generation program 63C processes the channel mode control command for setting each communication channel of each processor element PE and stores it in the memory.

【0063】〈ステップ105〉各通信チャネルを設定
するチャネルモード制御指令を送信チャネル64からイ
ンタフェース9を介して各プロセッサエレメントPEに
送出する。このチャネルモード制御指令はタスク番号に
対応させて送出される。
<Step 105> A channel mode control command for setting each communication channel is transmitted from the transmission channel 64 to each processor element PE via the interface 9. This channel mode control command is transmitted in correspondence with the task number.

【0064】〈ステップ106〉各プロセッサエレメン
トPEの制御プロセッサ31は入力されたチャネルモー
ド制御指令が、自プロセッサエレメントPEに対するも
のであるかどうかを判断し、それが自プロセッサエレメ
ントPEに対する指令であれば、チャネルモード制御指
令をタスク番号ごとに対応させてメモリに格納する。そ
して、現在処理しようとしているタスク番号に対応する
チャネルモードを、内部システムバス50上のチャネル
モード設定レジスタ32に所定のチャネル分の情報を書
き込む。
<Step 106> The control processor 31 of each processor element PE determines whether or not the input channel mode control command is for its own processor element PE, and if it is a command for its own processor element PE. The channel mode control command is stored in the memory in correspondence with each task number. Then, the channel mode corresponding to the task number currently being processed is written in the channel mode setting register 32 on the internal system bus 50 for information of a predetermined channel.

【0065】これにより、各通信チャネルCHの送受信
/スルー切り替え手段45、バイパス切り替え手段4
7、転送手段44の設定状態が切り替えられる。
As a result, transmission / reception / through switching means 45 for each communication channel CH and bypass switching means 4
7. The setting state of the transfer means 44 is switched.

【0066】例えば、図1に示す例では、プロセッサエ
レメントPE内の通信チャネルCH1は、チャネルモー
ド設定レジスタ32に書き込まれた内容に従い、転送手
段44は送信又は受信状態に設定されると共に、相手P
E54とのインタフェース信号線6が切り替え手段45
によって転送手段44に接続される。また、相手PEか
ら受信したデータを他のチャネルにスルーする場合は、
図1の通信チャネルCH2のように、相手PE55との
インタフェース信号線6が、チャネルモード設定レジス
タ32の設定状態に合わせて、切り替え手段45により
スルー用信号線48に接続され、さらにこの信号線48
は制御プロセッサ31により制御されるバイパススイッ
チ切り替え手段47により、バイパスバス42の所定の
バス(この例ではバス42b)に接続される。このよう
に信号処理上必要となる全てのプロセッサエレメントP
E内の各通信チャネルCH1〜8は、管理プロセッサ4
からの指令により、送信、受信、スルー中継の何れかの
状態に設定されることになる。
For example, in the example shown in FIG. 1, the communication channel CH1 in the processor element PE is set in the transmission or reception state in accordance with the contents written in the channel mode setting register 32, and the communication channel CH1 is set in the transmission or reception state.
The switching signal 45 is provided by the interface signal line 6 with E54.
Is connected to the transfer means 44. Also, when passing the data received from the partner PE to another channel,
Like the communication channel CH2 in FIG. 1, the interface signal line 6 with the partner PE 55 is connected to the through signal line 48 by the switching means 45 in accordance with the setting state of the channel mode setting register 32.
Is connected to a predetermined bus of the bypass bus 42 (the bus 42b in this example) by the bypass switch switching means 47 controlled by the control processor 31. Thus, all the processor elements P required for signal processing are
Each of the communication channels CH1 to CH8 in the E
Is set to one of the transmission, reception, and through relay states.

【0067】以上のように、本実施例によれば、管理プ
ロセッサ4はデータ処理のタスク番号に従って、その処
理を実現可能な並列処理システムを自動的に構成する。
As described above, according to this embodiment, the management processor 4 automatically configures a parallel processing system capable of realizing the processing according to the task number of the data processing.

【0068】〈ステップ107〉次に、管理プロセッサ
4は、各プロセッサエレメントPEに対し、それぞれが
実行すべき処理プログラムを転送し、インストラクショ
ンメモリ22にダウンロードする。
<Step 107> Next, the management processor 4 transfers the processing program to be executed to each processor element PE and downloads it to the instruction memory 22.

【0069】このようにして、並列処理システムを構築
し、各プロセッサエレメントに所定の処理プログラムを
ダウンロードした後、管理プロセッサ4は同期信号発生
装置5に対し、図9に示す手順にしたがって、同期信号
の周期を設定するとともに、起動指令を出力して並列処
理システムを起動させる。
After the parallel processing system is constructed and a predetermined processing program is downloaded to each processor element, the management processor 4 sends the synchronization signal to the synchronization signal generator 5 in accordance with the procedure shown in FIG. And a start command is output to start the parallel processing system.

【0070】図9は、同期信号の周期の設定法の一実施
例の手順を示している。まず、ステップ201と202
で、予め設定されている入出力装置1,3のバッファ容
量N(ワード)と、目標周波数特性fm(Hz)を取り
込む。このバッファ容量Nは通信チャネルCHのバッフ
ァメモリ42の容量と同じである。次に、ステップ20
3で、転送データの1ワードのサンプリング周波数fs
を、fs>2×fmの条件を満たすように算出する。そ
して、Nワードをサンプリングするに必要な同期信号の
周期Tを、T=N/fsにより算出する。そして、ステ
ップ205において、周期Tが各プロセッサエレメント
PEによる1フェーズの処理時間の最大処理時間以下か
否かを判定する。周期Tがその最大処理時間以上のとき
は、ステップ206により、並列処理システムの構築を
変更して負荷を分散する。このようにして、同期信号の
周期Tを決定した後、同期信号発生装置5に出力すると
ともに、起動指令を出力する。
FIG. 9 shows a procedure of an embodiment of a method of setting the period of the synchronization signal. First, steps 201 and 202
Then, a preset buffer capacity N (word) of the input / output devices 1 and 3 and a target frequency characteristic fm (Hz) are fetched. This buffer capacity N is the same as the capacity of the buffer memory 42 of the communication channel CH. Next, step 20
3, the sampling frequency fs of one word of the transfer data
Is calculated so as to satisfy the condition of fs> 2 × fm. Then, the period T of the synchronization signal required to sample N words is calculated by T = N / fs. Then, in step 205, it is determined whether or not the cycle T is equal to or less than the maximum processing time of the processing time of one phase by each processor element PE. If the period T is equal to or longer than the maximum processing time, the construction of the parallel processing system is changed in step 206 to distribute the load. After determining the cycle T of the synchronization signal in this manner, the synchronization signal is output to the synchronization signal generator 5 and a start command is output.

【0071】これにより、同期信号発生装置5から、各
プロセッサエレメントPEmnに共通の同期信号が一斉
に出力される。そして、各プロセッサエレメントPEm
nは同期信号に従ってデータ処理およびデータ転送を行
うことになる。したがって、各プロセッサエレメントP
Emnのデータ転送量およびデータ転送速度が統一され
る。また、1フェーズ(処理単位)の大きさを統一する
ことと合わせ、データ処理および転送処理に要する処理
時間の無駄を少なくして高速処理を行うことができる。
Thus, a synchronization signal common to each processor element PEmn is output from the synchronization signal generator 5 all at once. Then, each processor element PEm
n performs data processing and data transfer according to the synchronization signal. Therefore, each processor element P
The data transfer amount and data transfer speed of Emn are unified. In addition to unifying the size of one phase (processing unit), high-speed processing can be performed with less processing time required for data processing and transfer processing.

【0072】図10に、同期信号に基づいて実行する入
力装置1から入力される入力信号のサンプリング処理、
プロセッサエレメントPEへの取り込みおよび信号処
理、処理データを次段のプロセッサエレメントPEに転
送する処理のタイミングチャートを示す。本実施例で
は、各通信チャネルCHに交替して用いるバッファメモ
リ42A,Bが設けられていることから、図示のよう
に、入力信号(c)はサンプリングクロック(b)の速
度に合わせたタイミングで符号化され、バッファメモリ
42A,Bのいずれか一方に絶えず書き込まれから、デ
ータを取り逃がすことが無い。例えば、(d)に示すよ
うに周期S0のサイクルで取り込まれたバッファメモリ
42AのデータAは、(e)に示すようにS1のサイク
ルにてバッファメモリ42Bに切り替わり、(f)に示
すようにプロセッサエレメントPEの動作速度に合わせ
たタイミングにてアクセスされる。このアクセスされた
データAはデータA’に加工される。そして、(g)に
示すようにサイクルS2のときに転送先のプロセッサエ
レメントPEが接続された別の通信チャネルCHのバッ
ファメモリ42を経由して転送される。
FIG. 10 shows a sampling process of an input signal input from the input device 1 which is executed based on a synchronization signal.
4 shows a timing chart of a process of taking in a processor element PE, performing signal processing, and transferring processing data to a processor element PE of the next stage. In this embodiment, since the buffer memories 42A and 42B are used alternately for each communication channel CH, as shown in the figure, the input signal (c) is generated at a timing corresponding to the speed of the sampling clock (b). Since the data is encoded and constantly written to one of the buffer memories 42A and 42B, no data is lost. For example, the data A of the buffer memory 42A taken in the cycle period S 0 as shown in (d) is switched to the buffer memory 42B in S 1 of the cycle (e), the shown (f) As described above, the access is performed at a timing corresponding to the operation speed of the processor element PE. The accessed data A is processed into data A '. Then, is transferred via the buffer memory 42 of another communication channel CH the transfer destination processor element PE is connected during the cycle S 2 as shown in (g).

【0073】また、一回のデータ転送を、同期信号の周
期Tよりも短い時間で終了するように設定し、(h)に
示すように、データ転送終了から次の同期信号までの間
に空き時間tを設けるようにすれば、制御プロセッサ3
1による各通信チャネルCHのチャネルモードの設定変
更を行わせることができる。したがって、オンライン中
であっても、プロセッサエレメントPE相互間の通信モ
ードを変更して、並列処理システムの構成を変更するこ
とができる。しかも、各プロセッサエレメントPEの入
力信号のサンプリング、信号処理、およびデータ転送に
影響を及ぼさずにシステム構成を変更できる。
Further, one data transfer is set to end in a time shorter than the period T of the synchronization signal, and as shown in FIG. If the time t is provided, the control processor 3
1 to change the channel mode of each communication channel CH. Therefore, even while online, the configuration of the parallel processing system can be changed by changing the communication mode between the processor elements PE. In addition, the system configuration can be changed without affecting sampling of input signals of each processor element PE, signal processing, and data transfer.

【0074】ところで、管理プロセッサ4は図6のステ
ップ101で説明したように、システムを構成している
プロセッサエレメントPEmnの状態を把握している。
また、各プロセッサエレメントPEの状態および通信チ
ャネルCHの状態は、制御プロセッサ31により常に監
視され、正常・異常の状態が管理プロセッサ4に逐次送
信される。そして、管理プロセッサ4のPEステータス
監視プログラム63Aに従って、初期の状態に対する変
化が常に監視されている。したがって、その監視結果に
より各プロセッサエレメントPEmnの異常を検出する
ことができる。そして、異常を検出した場合は、異常の
プロセッサエレメントをシステムから切り離し、図6の
処理手順に従って、並列処理システムを再構成すること
により、速やかにシステムを再立ち上げしてデータ処理
を行わせることができる。
Incidentally, the management processor 4 grasps the state of the processor element PEmn constituting the system as described in step 101 of FIG.
The state of each processor element PE and the state of the communication channel CH are constantly monitored by the control processor 31, and the normal / abnormal state is sequentially transmitted to the management processor 4. Then, a change from the initial state is constantly monitored according to the PE status monitoring program 63A of the management processor 4. Therefore, an abnormality of each processor element PEmn can be detected from the monitoring result. When an abnormality is detected, the abnormal processor element is disconnected from the system, and the parallel processing system is reconfigured according to the processing procedure shown in FIG. 6 so that the system can be quickly restarted to perform data processing. Can be.

【0075】上述したように、本実施例によれば、8個
の通信チャネルCH1〜8に接続された各プロセッサエ
レメントPEとの間で、送信又は受信をしながら同一時
に残りの任意の通信チャネルCH間でスルー中継を行え
ることから、スルー中継のルート選択の自由度を高くで
きる。その結果、並列処理システムの構成の自由度を十
分高くできるから、プロセッサエレメントPEの数が同
じ規模の並列処理システムと比較して、データ処理の適
用範囲を拡大できたり、データ処理の処理速度を高速化
することができる。
As described above, according to the present embodiment, the remaining arbitrary communication channels are transmitted or received at the same time between the processor elements PE connected to the eight communication channels CH1 to CH8. Since the through relay can be performed between the channels, the degree of freedom in selecting the route of the through relay can be increased. As a result, since the degree of freedom of the configuration of the parallel processing system can be sufficiently increased, the applicable range of the data processing can be expanded and the processing speed of the data processing can be increased as compared with a parallel processing system having the same number of processor elements PE. Speed can be increased.

【0076】ここで、スルー中継のルート選択の自由度
を高くできる点について、前述した特開平1−3205
64号公報のシステムと比較して説明する。図11
(A),(B)は、それぞれ同公報記載のプロセッサエ
レメントの1つの動作状態を模式図で示している。図示
のように、プロセッサエレメントはCPU/メモリ81
に物理的に4個の通信ポート82a〜dがバス接続さ
れ、各通信ポートに接続された外部通信線a〜dのそれ
ぞれ隣合うもの同士がバイパススイッチ83a〜dによ
り接続されている。そして、バイパススイッチ83を閉
じることにより、2つの外部通信線の間でデータをスル
ー中継できるようにしている。しかし、同図(A)に示
すように、外部通信線bからデータを入力し、外部通信
線dから出力するモードのとき、外部通信線aから外部
通信線cにデータをスルー中継することができない。ま
た、同様に、(B)に示すように、外部通信線aからc
および外部通信線cからdのスルー中継を同一時にする
ことかできない。この点、本発明によれば、図1に示し
たように、各通信チャネルCH1〜8はそれぞれバイパ
スバス42・1〜8を介して独立にスルールートを形成
できることから、任意の通信チャネル間で同一時に送信
/受信およびスルー中継を行えるのである。
Here, the point that the degree of freedom of the route selection of the through relay can be increased is described in the above-mentioned JP-A-Hei 1-3205.
A description will be given in comparison with the system of JP-A-64. FIG.
(A) and (B) are schematic diagrams each showing one operation state of the processor element described in the publication. As shown, the processor element is a CPU / memory 81
Physically, four communication ports 82a to 82d are bus-connected, and adjacent external communication lines a to d connected to each communication port are connected by bypass switches 83a to 83d. By closing the bypass switch 83, data can be relayed through between the two external communication lines. However, as shown in FIG. 3A, in a mode in which data is input from the external communication line b and output from the external communication line d, it is possible to through-relay data from the external communication line a to the external communication line c. Can not. Similarly, as shown in (B), external communication lines a to c
Also, the through relay from the external communication lines c to d cannot be performed at the same time. In this regard, according to the present invention, as shown in FIG. 1, the communication channels CH1 to CH8 can independently form through routes via the bypass buses 42.1 to 8 respectively. At the same time, transmission / reception and through relay can be performed.

【0077】また、本発明によれば、通信チャネルCH
1〜8は相互に独立しており、かつそれぞれにチャネル
モードを設定できるから、同一時に複数のプロセッサエ
レメントに同一のデータを送信したり、転送されてくる
データを複数のプロセッサエレメントにスルー中継でき
る。
According to the present invention, the communication channel CH
1 to 8 are independent of each other and can set a channel mode for each, so that the same data can be transmitted to a plurality of processor elements at the same time, and the transferred data can be relayed through to a plurality of processor elements. .

【0078】次に、本発明の並列処理システムの具体的
な装置構造の実施例を図12乃至図16に示す。図4に
示した管理プロセッサ4は、汎用的計算機システムで実
現でき、図5に示した同期信号発生装置3は、汎用のI
C等で容易に構成できる。本発明においてハードウェア
上もっとも重要な部分は、プロセッサエレメントPE内
部の構成とプロセッサエレメントPE間の構成である。
そこで、プロセッサエレメント群2の装置構造の実施例
について説明する。図12は、プロセッサエレメント群
2を全て汎用の信号処理プロセッサ、マイクロプロセッ
サ、汎用IC等のディスクリート部品によって構成した
場合の物理的外観図である。また、一つのプロセッサエ
レメントPEを一つのユニット構成としている。図3で
破線で示した信号処理部20と制御部30は、図12で
シグナルプロセッサボード413と制御プロセッサボー
ド412とし、各々プリント基板化している。図3の通
信部40はハードウェアの物理的制約から通信チャネル
の2つ分をまとめて一枚のプリント基板とし、通信チャ
ネルボードa414、通信チャネルボードb415、通
信チャネルボードc416、通信チャネルボードd41
7に分けて形成している。それらはすべて同じ構成であ
る。制御プロセッサボード412には、管理プロセッサ
4とのインタフェース信号線445を接続するためのコ
ネクタ419と、同期信号発生装置3とのインタフェー
ス信号線446を接続するためのコネクタ418が設け
られている。通信チャネルボードa414から通信チャ
ネルボードd417には他のプロセッサエレメントPE
とのインタフェース信号線群442を接続するためのコ
ネクタ420〜427が設けられている。これらのプリ
ント基板は、図1に示したシグナルプロセッサ用のシス
テムバス50上の接続を行う。バイパスバス42上の接
続は図13に示すバックボード411により行ってい
る。バックボード411は、各ボード間をボード接続用
コネクタ群431によって接続している。電源ボード4
11は、バックボード411経由でこれら全プリント基
板に対し電源を供給するものである。
Next, FIGS. 12 to 16 show an embodiment of a specific device structure of the parallel processing system of the present invention. The management processor 4 shown in FIG. 4 can be realized by a general-purpose computer system, and the synchronization signal generator 3 shown in FIG.
It can be easily composed of C or the like. In the present invention, the most important part in hardware is the configuration inside the processor element PE and the configuration between the processor elements PE.
Therefore, an embodiment of the device structure of the processor element group 2 will be described. FIG. 12 is a physical external view in the case where the processor element group 2 is entirely constituted by discrete components such as a general-purpose signal processor, a microprocessor, and a general-purpose IC. One processor element PE has one unit configuration. The signal processing unit 20 and the control unit 30 indicated by broken lines in FIG. 3 are a signal processor board 413 and a control processor board 412 in FIG. The communication unit 40 in FIG. 3 combines two communication channels into a single printed circuit board due to hardware physical restrictions, and includes a communication channel board a414, a communication channel board b415, a communication channel board c416, and a communication channel board d41.
7 are formed. They are all of the same construction. The control processor board 412 is provided with a connector 419 for connecting an interface signal line 445 to the management processor 4 and a connector 418 for connecting an interface signal line 446 to the synchronization signal generator 3. From the communication channel board a414 to the communication channel board d417, other processor elements PE
And connectors 420 to 427 for connecting the interface signal line group 442 to the interface. These printed circuit boards make connections on the system bus 50 for the signal processor shown in FIG. The connection on the bypass bus 42 is made by the back board 411 shown in FIG. The back board 411 connects the respective boards by a board connection connector group 431. Power supply board 4
Numeral 11 supplies power to all the printed circuit boards via the back board 411.

【0079】図14は、ハードウェアの動作速度の高速
化、小型化を図ることを目的として、一部をカスタムL
SI化した場合のプロセッサエレメントPE内部のブロ
ック図を示す。プロセッサエレメントPEのハードウェ
ア構成は、破線で示された信号処理部20については図
3と同様であるが、制御部30は制御プロセッサ(汎用
のマイクロプロセッサ)32のみとし、制御部30のチ
ャネルモード設定レジスタ32、チャネルステータスレ
ジスタ33、相手PEステータスレジスタ34及び通信
部40は、制御・通信LSI451に1チップ化してい
る。これにより、プロセッサエレメントPEのハードウ
ェアの物量は、図3の場合と比べて大幅に縮小すること
ができる。図15(A),(B)は、一つのプロセッサ
エレメントPEを1ボード化し、そのプリント基板を4
枚実装可能とした場合のマルチプロセッサエレメントP
Eユニットの物理的外観図である。バックボード466
には管理プロセッサ4とのインタフェース信号線483
を接続するためのコネクタ467と、同期信号発生装置
3とのインタフェース信号線484を接続するためのコ
ネクタ468が設けられている。プロセッサエレメント
PEボードa462から通信チャネルボードd465に
は他のプロセッサエレメントPEとの接続を行うインタ
フェース信号線群491(1枚当り5本、合計20本)
を接続するためのコネクタ群471が設けられている。
これらのプリント基板は、図1に示したシグナルプロセ
ッサ用の内部システムバス50上の接続及びバイパスバ
ス42上の接続、およびプロセッサエレメントPEボー
ドa462〜d465の通信チャネル同志の接続は、図
15(B)に示すバックボード466により行ってい
る。バックボード466は、各ボード間をボード接続用
コネクタ群によって接続している。電源ボード461
は、バックボード466経由でこれら全プリント基板に
対し電源を供給するものである。このハードウェア構成
によって、4つのプロセッサエレメントPE間の接続に
関して同一ユニット内のバックボード上で実現できるた
め、ユニット内部のプロセッサエレメントPE間のデー
タ転送は、ユニット外部のプロセッサエレメントPEと
のデータ転送に比べ高速化を図ることができる。また、
一つのプロセッサエレメントPEが1ボード化されたプ
ラグイン構成となっているためシステムの用途に合わせ
てユニット内の実装枚数を簡単に設定したり変更するこ
とができる。図16は、図14のハードウェア構成をプ
ロセッサエレメントPE間の接続についてのみ表した基
本ブロック図である。破線460で囲まれた部分は図1
4のユニット内部を示し、信号線480〜485は図1
4のバックボード466上のプロセッサエレメントPE
間の接続を示し、破線の外側の矢印はユニット外部の他
のプロセッサエレメントPEとの接続信号線を表してい
る。図16は図2に示した縦横行列のプロセッサエレメ
ント群2の一部分を形成するものであり、このユニット
を複数用いた組み合わせによってあらゆるシステム構築
が可能である。
FIG. 14 shows a part of a custom L for the purpose of increasing the operating speed of the hardware and miniaturizing it.
FIG. 3 shows a block diagram of the inside of the processor element PE when the SI is implemented. The hardware configuration of the processor element PE is the same as that shown in FIG. 3 for the signal processing unit 20 indicated by a broken line, but the control unit 30 is only a control processor (general-purpose microprocessor) 32 and the channel mode of the control unit 30 The setting register 32, the channel status register 33, the partner PE status register 34, and the communication unit 40 are integrated into a control / communication LSI 451 as one chip. Thereby, the hardware amount of the processor element PE can be significantly reduced as compared with the case of FIG. FIGS. 15A and 15B show that one processor element PE is made into one board and the printed circuit board is made up of four boards.
Multi-processor element P when mounting is possible
It is a physical appearance figure of an E unit. Backboard 466
Has an interface signal line 483 with the management processor 4
And a connector 468 for connecting an interface signal line 484 to the synchronization signal generator 3. From the processor element PE board a 462 to the communication channel board d 465, an interface signal line group 491 for connecting to another processor element PE (5 per interface, total 20)
Is provided with a connector group 471 for connecting the.
These printed circuit boards are connected on the internal system bus 50 for the signal processor and the connection on the bypass bus 42 shown in FIG. 1, and the connection between the communication channels of the processor element PE boards a462 to d465 is shown in FIG. ) Is performed by the back board 466 shown in FIG. The back board 466 connects the boards with each other via a board connector group. Power supply board 461
Supplies power to all of these printed circuit boards via the back board 466. With this hardware configuration, the connection between the four processor elements PE can be realized on the backboard in the same unit, so that the data transfer between the processor elements PE inside the unit is performed by the data transfer with the processor element PE outside the unit. Higher speed can be achieved. Also,
Since one processor element PE has a plug-in configuration integrated into one board, the number of units mounted in the unit can be easily set or changed according to the use of the system. FIG. 16 is a basic block diagram showing only the connection between the processor elements PE in the hardware configuration of FIG. The portion surrounded by the broken line 460 is shown in FIG.
4 shows the inside of the unit, and signal lines 480 to 485 are shown in FIG.
4 processor element PE on the backboard 466
The connection outside the unit is indicated by an arrow outside the dashed line, indicating a connection signal line with another processor element PE outside the unit. FIG. 16 shows a part of the processor element group 2 of the vertical and horizontal matrix shown in FIG. 2, and any system can be constructed by combining a plurality of these units.

【0080】次に、本発明の並列処理システムを具体的
な信号処理に適用した実施例について説明する。図17
は、本発明を音響シミュレーション解析装置に適用した
実施例であり、(A)は信号処理のブロック構成を示
し、(B)は信号処理ブロックを並列処理システムの各
プロセッサエレメントに割り付けた状態図である。音響
シミュレーション解析は、音響空間についてのシュミレ
ーションおよび解析をするものであり、コンサートホー
ルなどの音響特性のシミュレーションを行い、実際の室
内の音響特性と比較し、音響設計に役立てるものであ
る。
Next, an embodiment in which the parallel processing system of the present invention is applied to specific signal processing will be described. FIG.
FIG. 1A is an embodiment in which the present invention is applied to an acoustic simulation analysis apparatus, FIG. 1A shows a block configuration of signal processing, and FIG. 1B is a state diagram in which signal processing blocks are assigned to respective processor elements of a parallel processing system. is there. The acoustic simulation analysis is to simulate and analyze an acoustic space, simulate acoustic characteristics of a concert hall or the like, compare with actual indoor acoustic characteristics, and use it for acoustic design.

【0081】図17(A)において、ブロック201乃
至204までのブロックは音響シミュレーションの部分
であり、ブロック205乃至208のブロックは音響信
号の解析を行い、ブロック209はシミュレートした音
響を実際の聴音に再生して出力するものである。装置の
使用方法は、まず室内の音響設計を行う前に試験用の音
響信号を入力し、ブロック201乃至204により目的
とする音響特性をシミュレートする。このとき、実際の
音を耳で聞いてモニタリングするとともに、同時にブロ
ック205乃至208によりその音響シミュレート信号
を周波数解析し、それを映像として出力することによ
り、視覚的に解析できるようにする。そして、解析した
内容に基づいて、室内の音響設計を行うとともに、音響
設備を製作する情報とする。
In FIG. 17A, blocks 201 to 204 are a part of an acoustic simulation, blocks 205 to 208 perform an analysis of an acoustic signal, and a block 209 converts the simulated audio into an actual sound. To play back and output. A method of using the apparatus is to input a test sound signal before designing a room sound, and simulate a target sound characteristic by blocks 201 to 204. At this time, the actual sound is monitored by hearing the ear, and at the same time, the sound simulation signal is frequency-analyzed by the blocks 205 to 208, and is output as a video so that it can be visually analyzed. Then, based on the analyzed contents, the acoustic design of the room is performed, and the information is used as information for manufacturing the acoustic equipment.

【0082】また、本実施例装置は、上記のようにして
製作された音響設備を試験する装置としても用いること
ができる。すなわち、実際の室内空間で音響信号を録音
等により収集し、その音響信号を音源符号化ブロック2
01に入力し、処理しやすい信号に符号化する。そし
て、ブロック202乃至204のシミュレーション処理
をしないで、信号線210のルートにより周波数変換部
205に直接バイパスし、ブロック205乃至208に
よりその音響特性を解析し、映像として出力する。これ
によって得られた解析データと、設計前のシミュレーシ
ョンの内容の特性を比較し、要求どおりに設計、製作が
されたか否かを確認する。
The apparatus of this embodiment can be used as an apparatus for testing the acoustic equipment manufactured as described above. That is, an audio signal is collected in an actual indoor space by recording or the like, and the audio signal is collected by the sound source encoding block 2.
01 and encodes it into a signal that is easy to process. Then, without performing the simulation processing of the blocks 202 to 204, the signal is directly bypassed to the frequency conversion unit 205 through the route of the signal line 210, and the acoustic characteristics thereof are analyzed by the blocks 205 to 208, and are output as video. The analysis data thus obtained is compared with the characteristics of the contents of the simulation before the design, and it is confirmed whether the design and manufacture have been performed as required.

【0083】各処理ブロックの内容は次のとおりであ
る。
The contents of each processing block are as follows.

【0084】(1)音響符号化ブロック201 音響空間にて再生するための音をディジタル化するもの
で、実録音やシンセサイザなどにより生成した試験用信
号をA/D変換機によりサンプリングする。
(1) Acoustic coding block 201 A sound for reproduction in an acoustic space is digitized, and a test signal generated by actual recording or a synthesizer is sampled by an A / D converter.

【0085】(2)音源再生ブロック202 符号化された音響信号のディジタルデータを記憶してお
き、用途に応じて逐次出力する。
(2) Sound source reproduction block 202 The digital data of the coded audio signal is stored and sequentially output according to the application.

【0086】(3)残響効果ブロック203 大将となる部屋の構造や室材ごとに異なる残響効果を模
擬する。
(3) Reverberation Effect Block 203 Simulates different reverberation effects depending on the structure and room material of the room as a general.

【0087】(4)伝搬損失効果ブロック204 音響空間の大きさによる音圧レベルおよび周波数特性の
変化を得る。
(4) Propagation loss effect block 204 Changes in sound pressure level and frequency characteristics depending on the size of the acoustic space are obtained.

【0088】(5)周波数変換ブロック205 音の周波数分析を行う場合、映像出力データとして特定
周波数帯域を拡大して表示するため、その周波数帯域幅
を可変するものである。
(5) Frequency conversion block 205 In performing frequency analysis of sound, a specific frequency band is enlarged and displayed as video output data, so that the frequency bandwidth is varied.

【0089】(6)FFTブロック207 音響信号を解析するために、周波数成分のパワースペク
トルをフーリエ変換により生成する。
(6) FFT block 207 In order to analyze an acoustic signal, a power spectrum of a frequency component is generated by Fourier transform.

【0090】(7)平滑化ブロック207 FFT処理で得られた周波数パワースペクトルのデータ
を映像表示するにあたり、オペレータの認識を向上させ
るために、特定の周波数成分を強調させるために平滑処
理する。
(7) Smoothing block 207 In displaying the image of the frequency power spectrum obtained by the FFT processing, a smoothing processing is performed to enhance a specific frequency component in order to improve the recognition of an operator.

【0091】(8)映像出力ブロック208 音響信号の周波数解析結果を映像により視覚的に表示す
る。
(8) Video output block 208 The result of frequency analysis of the audio signal is visually displayed by video.

【0092】(9)聴音出力ブロック209 残響効果および伝搬損失効果処理でえられたディジタル
音響信号モニタリングするため、D/A変換処理して聴
音として出力する。
(9) Hearing sound output block 209 In order to monitor the digital sound signal obtained by the reverberation effect and propagation loss effect processing, the sound is output through a D / A conversion process.

【0093】図10(B)は、同図(A)の音響シミュ
レーション解析装置を、本発明を適用してなる並列処理
システムにより構築した場合の動作時の構成図である。
図示のように、ブロック202乃至207の処理ブロッ
クに、本発明のプロセッサエレメントPE1乃至6が割
り付けられている。プロセッサエレメントPEの数およ
び物理的な接続構成は(A)の構成と同様である。PE
1乃至3の破線210は、スルー中継機能により信号線
210が形成されることを示している。
FIG. 10B is a configuration diagram at the time of operation when the acoustic simulation analyzer of FIG. 10A is constructed by a parallel processing system to which the present invention is applied.
As shown, the processor elements PE1 to PE6 of the present invention are allocated to the processing blocks of blocks 202 to 207. The number of processor elements PE and the physical connection configuration are the same as the configuration in FIG. PE
The broken lines 1 to 3 indicate that the signal line 210 is formed by the through relay function.

【0094】図18は、図17の実施例と同様の音響シ
ミュレーション解析装置の実施例であるが、シミュレー
ションおよび解析対象となる音源を2津にして、ステレ
オ音響特性を得るようにしたものである。図19
(A),(B)は図18のブロックにたいして本発明の
プロセッサエレメントPEを割り付けたものである。同
図(A)は音響シミュレーションと解析を同時に行って
いる状態のシステム構成であり、同図(b)は音響特性
試験のための周波数解析および映像出力の機能部分のみ
を作動させた場合のシステム構成図である図示のよう
に、音響再生ブロック202、残響効果ブロック20
3、伝搬損失効果ブロック204、FFTブロック20
6に対応するPEがそれぞれ二重化されている。これら
は、ステレオ音響特性を得るようにしたために、処理負
荷がほぼ2倍になるためである。
FIG. 18 is an embodiment of an acoustic simulation analysis apparatus similar to that of the embodiment of FIG. 17, except that the number of sound sources to be simulated and analyzed is two, and stereo acoustic characteristics are obtained. . FIG.
(A) and (B) are diagrams in which the processor element PE of the present invention is allocated to the block in FIG. FIG. 1A shows a system configuration in which acoustic simulation and analysis are performed at the same time, and FIG. 1B shows a system in which only a frequency analysis and an image output function for an acoustic characteristic test are operated. As shown in the diagram, the sound reproduction block 202 and the reverberation effect block 20 are used.
3. Propagation loss effect block 204, FFT block 20
The PEs corresponding to 6 are duplicated. This is because the processing load is almost doubled because stereo sound characteristics are obtained.

【0095】図19(A),(B)のシステムを、4行
4列配列のプロセッサエレメント群により構成した場合
のシステム構成図を模式図により示したのが、それぞれ
図20,図21に対応する。図から判るように、各プロ
セッサエレメントPEが8個の通信チャネルを備えてい
ること、およびスルー中継を独立に任意に行えるから、
システム構成の自由度が高く、少ないプロセッサエレメ
ントにより図18のシステムを構築することができる。
このようなシステムは、従来の例えば特開平1−320
564号公報のシステムでは実現することができない。
例えば、図20のプロセッサエレメントPE5のよう
に、送信、受信の経路にたいし、スルー中継のルートが
クロスするような構成は実現できない。
FIGS. 19 (A) and 19 (B) are schematic diagrams showing a system configuration diagram when the system is configured by a processor element group having a 4-row, 4-column array, respectively, corresponding to FIGS. 20 and 21, respectively. I do. As can be seen from the figure, each processor element PE has eight communication channels, and through relay can be arbitrarily performed independently.
The degree of freedom in the system configuration is high, and the system shown in FIG. 18 can be constructed with a small number of processor elements.
Such a system is disclosed in, for example, Japanese Unexamined Patent Publication No.
This cannot be realized by the system of Japanese Patent No. 564.
For example, a configuration in which the route of the through relay crosses the route of the transmission and the reception like the processor element PE5 in FIG. 20 cannot be realized.

【0096】図22(A)は、本発明の並列処理システ
ムを「画像処理応用技術」工業調査会刊に記載のTOS
PIX-Uによって濃淡画像の輪郭抽出処理に適用した
実施例である。処理の概要としては、画像入力装置30
1によりディジタルし、メモリに蓄えられている原画像
を、フィルタリングブロック302でフィルタリングの
ためにX方向とY方向にそれぞれ微分し、さらにつぎの
フィルタリングブロック303により2値化するもので
ある。これによって、得られた輪郭画像を画像出力装置
305へ出力すると共に、特徴計測ブロック304によ
り特徴計測を行うというものである。図22(B)は、
図22(A)の処理を、前記音響シミュレーションシス
テムの例と同様に、並列処理システムにて高速演算を行
う場合のブロック図である。図22(A)のフィルタリ
ング(X、Y方向微分)ブロック302は、2つのプロ
セッサエレメントPE1と5により並列処理される。次
段のフィルタリング(加算/2値化)ブロック303
は、加算処理と2値化処理を直列に行う構成とし、PE
2とPE3により処理される。そして、2値化されたデ
ータは直接画像出力装置305に出力されると共に、特
徴計測ブロック304に対応するPE4に転送される。
FIG. 22 (A) shows a parallel processing system according to the present invention, which is described in TOS described in “Image Processing Applied Technology” published by the Industrial Research Council.
This is an embodiment in which PIX-U is applied to contour extraction processing of a grayscale image. As an outline of the processing, the image input device 30
The original image digitized by 1 and stored in the memory is differentiated in the X and Y directions for filtering in a filtering block 302, and further binarized by a next filtering block 303. As a result, the obtained contour image is output to the image output device 305, and the feature measurement is performed by the feature measurement block 304. FIG. 22 (B)
FIG. 23 is a block diagram in the case where high-speed computation is performed by the parallel processing system in the processing of FIG. 22A, similarly to the example of the acoustic simulation system. The filtering (X, Y direction differentiation) block 302 in FIG. 22A is processed in parallel by the two processor elements PE1 and PE5. Next-stage filtering (addition / binarization) block 303
Has a configuration in which addition processing and binarization processing are performed in series, and PE
2 and PE3. Then, the binarized data is directly output to the image output device 305 and transferred to the PE 4 corresponding to the feature measurement block 304.

【0097】図22の構成に対応する並列処理システム
の接続構成図を図23に示す。この場合のプロセッサエ
レメントの規模は縦3個×横2個である。画像入力装置
301と画像出力装置305、および各PE間の接続と
通信チャネルの方向は、図示していない管理プロセッサ
により設定可能である。実線と矢印で示されるインタフ
ェース信号線は実際の信号処理で使用される接続とデー
タの流れを示したもので、破線で示される接続は物理的
接続は存在するがデータ転送が発生しない部分を示して
いる。図示例では、PE6は未使用状態となっている。
このように、図23の構成は図22(B)と等価であ
り、信号処理の内容に従ったPE間の接続を実現してい
る。
FIG. 23 shows a connection configuration diagram of a parallel processing system corresponding to the configuration of FIG. In this case, the scale of the processor element is 3 × 2. The connection between the image input device 301 and the image output device 305 and the direction of the communication channel between each PE and the direction of the communication channel can be set by a management processor (not shown). The interface signal lines indicated by solid lines and arrows indicate connections and data flows used in actual signal processing, and the connections indicated by broken lines indicate portions where physical connections exist but data transfer does not occur. ing. In the illustrated example, the PE 6 is in an unused state.
As described above, the configuration in FIG. 23 is equivalent to that in FIG. 22B, and realizes connection between PEs according to the content of signal processing.

【0098】なお、上述した実施例の効果に加え、図1
〜図10で説明した実施例によれば、次の効果がある。
In addition to the effects of the above-described embodiment, FIG.
According to the embodiment described with reference to FIGS.

【0099】(1)一つのプロセッサエレメントに対す
る負荷を考慮し、プロセッサエレメントの個数を把握し
ておけば、プロセッサエレメント間の物理的な接続をほ
とんど意識することなく、迅速に並列処理システムの構
築が可能である。
(1) If the number of processor elements is grasped in consideration of the load on one processor element, the parallel processing system can be quickly constructed with little awareness of the physical connection between the processor elements. It is possible.

【0100】(2)管理プロセッサが、プロセッサエレ
メント同志の接続を逐次把握することによって、処理可
能な信号処理の種別を直ちに認識できる。
(2) The management processor can immediately recognize the types of signal processing that can be processed by sequentially grasping the connection between the processor elements.

【0101】(3)通信チャネル毎に接続先通信チャネ
ルの送受信状態を監視する手段を設けることにより物理
的な接続誤りやソフトウェア上の設定誤りを直ちに検出
できる
(3) By providing a means for monitoring the transmission / reception state of the destination communication channel for each communication channel, a physical connection error or a setting error on software can be immediately detected.

【0102】。[0102]

【発明の効果】以上説明したように、本発明によれば、
以下のような効果を得ることができる。 まず、第1の
発明によれば、任意のプロセッサエレメント間の複数の
スルー中継を同一時に行わせることができ、かつ他のス
ルー中継の制限を何ら受けることなくかつ同一時に、送
信又は受信を行うことができる。
As described above, according to the present invention,
The following effects can be obtained. First, according to the first invention, a plurality of through relays between arbitrary processor elements can be performed at the same time, and transmission or reception is performed at the same time without any limitation of other through relays. be able to.

【0103】また、プロセッサエレメント群の並列シス
テム構成を、処理プログラムの内容に応じて自由にかつ
速やかに構築することが可能である。
Further, the parallel system configuration of the processor elements can be freely and promptly constructed according to the contents of the processing program.

【0104】また、データ処理の内容に合わせて並列処
理システムを自動的に構築できる。特に、各プロセッサ
エレメントの処理動作を同期させるとともに、データ処
理を構成する処理単位の終了とデータ転送の終了のいず
れか遅いものにあわせて、管理プロセッサにより必要な
通信チャネルのモードを変更設定するようしたものによ
れば、一まとまりのデータ処理を構成する1フェーズご
との処理単位に合わせて、最適な並列処理システムを構
築することができ、データ処理の内容に応じて最適な高
速処理システムを構築できる。
Further, a parallel processing system can be automatically constructed according to the contents of data processing. In particular, the processing operation of each processor element is synchronized, and the mode of the necessary communication channel is changed and set by the management processor according to the end of the processing unit constituting the data processing or the end of the data transfer, whichever is later. According to this, an optimal parallel processing system can be constructed according to the processing unit for each phase constituting a group of data processing, and an optimal high-speed processing system is constructed according to the contents of the data processing. it can.

【0105】第2の発明によれば、プロセッサエレメン
ト群の一部に故障が発生してもデータ処理を継続でき、
信頼性の高いシステムとすることができる。
According to the second invention, data processing can be continued even if a failure occurs in a part of the processor element group,
A highly reliable system can be provided.

【0106】第3の発明によれば、プロセッサエレメン
トの通信チャネルを8個設け、行列状に配列されたプロ
セッサエレメントを縦、横、斜め方向に接続したものに
よれば、並列処理システムの接続構成の自由度が向上す
るから、限られた規模のプロセッサエレメント群によ
り、多段処理を含む、より複雑なデータ処理を行わせる
ことができる。
According to the third aspect, eight communication channels of processor elements are provided, and the processor elements arranged in a matrix are connected vertically, horizontally, and diagonally. Therefore, more complex data processing including multi-stage processing can be performed by a processor element group of a limited scale.

【0107】第4の発明によれば、各プロセッサエレメ
ントの処理動作を、同一の同期信号に同期させて行わせ
るようにしたことから、オーバーヘッド時間を少なくし
てスループットを向上できる。
According to the fourth aspect, the processing operation of each processor element is performed in synchronization with the same synchronization signal, so that the overhead time can be reduced and the throughput can be improved.

【0108】特に、その同期信号の周期内に通信チャネ
ルの切り替え動作にかかる時間を含めるようにしたもの
によれば、各処理単位ごとに並列処理システムの構成を
変更できるから、限られた規模のプロセッサエレメント
を用いて一層処理を高速化できるシステムを構築でき
る。この場合、プロセッサエレメント群の処理単位量と
該処理に伴うデータ転送量とを統一し、該統一された量
に基づいて同期信号の周期を設定するようにすれば、更
にスループットを向上できる。
In particular, according to the configuration in which the time required for the switching operation of the communication channel is included in the period of the synchronization signal, the configuration of the parallel processing system can be changed for each processing unit. It is possible to construct a system that can further increase the processing speed by using the processor element. In this case, the throughput can be further improved by unifying the processing unit amount of the processor element group and the data transfer amount accompanying the processing and setting the period of the synchronization signal based on the unified amount.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の特徴部である一実施例の通信チャネル
周りの構成図である。
FIG. 1 is a configuration diagram around a communication channel according to an embodiment that is a characteristic part of the present invention.

【図2】本発明の並列処理システムの一実施例の全体構
成図である。
FIG. 2 is an overall configuration diagram of an embodiment of a parallel processing system according to the present invention.

【図3】本発明のプロセッサエレメントの一実施例の全
体構成図である。
FIG. 3 is an overall configuration diagram of an embodiment of a processor element of the present invention.

【図4】本発明の管理プロセッサの一実施例の機能構成
図である。
FIG. 4 is a functional configuration diagram of an embodiment of a management processor of the present invention.

【図5】本発明の同期信号発生装置の一実施例の機能ブ
ロック構成図である。
FIG. 5 is a functional block configuration diagram of an embodiment of a synchronization signal generator according to the present invention.

【図6】本発明の管理プロセッサのイニシャル処理の一
実施例のフローチャートである。
FIG. 6 is a flowchart of an embodiment of an initial process of the management processor of the present invention.

【図7】本発明の管理プロセッサの信号種別認識処理の
一実施例のフローチャートである。
FIG. 7 is a flowchart of one embodiment of a signal type recognition process of the management processor of the present invention.

【図8】本発明の管理プロセッサのPE間接続処理の一
実施例のフローチャートである。
FIG. 8 is a flowchart of one embodiment of a connection process between PEs of the management processor of the present invention.

【図9】本発明の管理プロセッサの同期信号周期設定処
理の一実施例のフローチャートである。
FIG. 9 is a flowchart of one embodiment of a synchronization signal cycle setting process of the management processor of the present invention.

【図10】本発明の並列処理システムにおける一実施例
のデータ転送処理の動作タイミングを説明する図であ
る。
FIG. 10 is a diagram for explaining the operation timing of the data transfer processing of one embodiment in the parallel processing system of the present invention.

【図11】(A),(B)ともに、本発明のデータ転送
の動作を説明するための比較例のデータ転送動作を説明
する図である。
11A and 11B are diagrams illustrating a data transfer operation of a comparative example for describing a data transfer operation of the present invention.

【図12】本発明の並列処理システムの一実施例のハー
ドウェア構成図である。
FIG. 12 is a hardware configuration diagram of an embodiment of a parallel processing system according to the present invention.

【図13】図12のハードウエア構成図の内部の概要構
成図である。
FIG. 13 is a schematic configuration diagram of the inside of the hardware configuration diagram of FIG. 12;

【図14】図3に示した実施例のプロセッサエレメント
の一部をLSI化した一実施例のブロック構成図であ
る。
FIG. 14 is a block diagram of an embodiment in which a part of the processor element of the embodiment shown in FIG. 3 is formed into an LSI;

【図15】(A),(B)は、図14に示した実施例の
プロセッサエレメントを用いてなる並列処理システムの
一実施例のハードウェア構成図である。
FIGS. 15A and 15B are hardware configuration diagrams of an embodiment of a parallel processing system using the processor elements of the embodiment shown in FIG.

【図16】図14に示したプロセッサエレメントを用い
てなる並列処理システムの相互接続例を示す構成図であ
る。
16 is a configuration diagram illustrating an example of interconnection of a parallel processing system using the processor elements illustrated in FIG. 14;

【図17】本発明の並列処理システムを音響信号シミュ
レーション・解析処理に適用した一実施例の構成図であ
り、(A)は音響信号シミュレーション・解析処理の処
理ブロック図、(B)は(A)の各ブロックに本発明の
プロセッサエレメントを割付けてなる概念構成図であ
る。
FIG. 17 is a configuration diagram of an embodiment in which the parallel processing system of the present invention is applied to acoustic signal simulation / analysis processing, where (A) is a processing block diagram of acoustic signal simulation / analysis processing, and (B) is (A). 3 is a conceptual configuration diagram in which a processor element of the present invention is assigned to each block.

【図18】本発明の並列処理システムを適用可能な音響
信号シミュレーション・解析処理の他の実施例の処理ブ
ロック構成図である。
FIG. 18 is a processing block configuration diagram of another embodiment of the acoustic signal simulation / analysis processing to which the parallel processing system of the present invention can be applied.

【図19】図18の各処理ブロックに本発明のプロセッ
サエレメントを割付けてなる概念構成図であり、(A)
は音響シミュレーションと解析処理とを同一時に行って
いる場合のシステム構成図を示し、(B)はシミュレー
ションにより設計した音響特性を試験する場合のシステ
ム構成図である。
FIG. 19 is a conceptual configuration diagram in which a processor element of the present invention is allocated to each processing block of FIG. 18;
FIG. 3A is a system configuration diagram when an acoustic simulation and an analysis process are performed at the same time, and FIG. 2B is a system configuration diagram when an acoustic characteristic designed by the simulation is tested.

【図20】図19(A)のシステム構成図に対応する通
信チャネルの接続切り替え状態を示すシステム構成図で
ある。
FIG. 20 is a system configuration diagram showing a connection switching state of a communication channel corresponding to the system configuration diagram of FIG.

【図21】図19(B)のシステム構成図に対応する通
信チャネルの接続切り替え状態を示すシステム構成図で
ある。
21 is a system configuration diagram showing a communication channel connection switching state corresponding to the system configuration diagram of FIG. 19 (B).

【図22】本発明の並列処理システムを画像処理に適用
してなる一実施例の構成図であり、(A)は画像処理の
処理ブロック図、(B)は(A)の各ブロックに本発明
のプロセッサエレメントを割付けてなる概念構成図であ
る。。
FIGS. 22A and 22B are configuration diagrams of an embodiment in which the parallel processing system of the present invention is applied to image processing, wherein FIG. 22A is a processing block diagram of image processing, and FIG. It is a conceptual block diagram which allocated the processor element of this invention. .

【図23】図22に示したシステム構成図に対応する各
プロセッサエレメントの動作状態における接続を示すシ
ステム構成図である。
FIG. 23 is a system configuration diagram showing connections in an operation state of each processor element corresponding to the system configuration diagram shown in FIG. 22;

【符号の説明】[Explanation of symbols]

1 入力装置、 2 プロセッサエレメント(PE)、 3 出力装置、 4 管理プロセッサ、 5 同期信号発生装置、 6 インタフェース通信線、 20 信号処理部、 21 シグナルプロセッサ、 22 インストラクションメモリ、 23 データストレージ、 30 制御部、 31 制御プロセッサ、 32 チャネルモード設定レジスタ、 33 チャネルステータスレジスタ、 34 相手ステータスレジスタ、 40 通信部、 41A,B 切り替え手段、 42 バイパスバス、 43A,B バッファメモリA,B、 44 転送手段、 45 送受信/スルーモード切り替え手段、 46 相手PEステータス監視手段、 47 バイパスバス切り替え手段、 48 スルー用信号線、 61 CPU、 62 プログラムダウンロード用記憶装置、 63 主メモリ、 63A PEステータス監視プログラム、 63B 信号処理種別認識プログラム、 63C 制御指令生成プログラム、 64 受信チャネル、 65 送信チャネル、 66 同期信号制御手段、 Reference Signs List 1 input device, 2 processor element (PE), 3 output device, 4 management processor, 5 synchronization signal generator, 6 interface communication line, 20 signal processing unit, 21 signal processor, 22 instruction memory, 23 data storage, 30 control unit 31 control processor, 32 channel mode setting register, 33 channel status register, 34 partner status register, 40 communication unit, 41A and B switching means, 42 bypass bus, 43A and B buffer memories A and B, 44 transfer means, 45 transmission and reception / Through mode switching means, 46 partner PE status monitoring means, 47 bypass bus switching means, 48 signal lines for through, 61 CPU, 62 storage for program download, 63 main memory, 63A PE Status monitoring program, 63B signal processing type recognition program, 63C control command generation program, 64 reception channels, 65 transmission channels, 66 synchronization signal control means,

───────────────────────────────────────────────────── フロントページの続き (72)発明者 松本 喜章 茨城県日立市大みか町五丁目2番1号 株式会社 日立情報制御システム内 (72)発明者 海野 拓雄 茨城県日立市大みか町五丁目2番1号 株式会社 日立情報制御システム内 (72)発明者 渡辺 弘 茨城県日立市大みか町五丁目2番1号 株式会社 日立製作所 大みか工場内 (56)参考文献 特開 昭63−70345(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 15/177 G06F 15/16 390 G06F 15/16 470──────────────────────────────────────────────────続 き Continuing on the front page (72) Yoshiaki Matsumoto, Inventor 5-2-1 Omikacho, Hitachi City, Ibaraki Prefecture Inside Hitachi Information & Control Systems Co., Ltd. (72) Takuo Unno 5-2-2 Omikacho, Hitachi City, Ibaraki Prefecture No. 1 Hitachi Information Control System Co., Ltd. (72) Inventor Hiroshi Watanabe 5-2-1 Omika-cho, Hitachi City, Ibaraki Prefecture In-house Omika Plant, Hitachi, Ltd. (56) References JP-A-63-70345 (JP, A) (58) Fields investigated (Int.Cl. 6 , DB name) G06F 15/177 G06F 15/16 390 G06F 15/16 470

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 プロセッサとメモリと複数の通信チャネ
ルとを内部システムバスにより接続してなるプロセッサ
エレメントを複数備え、 前記プロセッサエレメントのそれぞれを、所定数の他の
プロセッサエレメントと前記通信チャネルを介して相互
に接続し、 管理プロセッサから与える指令に従って一まとまりのデ
ータ処理を前記各プロセッサエレメントに分担して実行
させる並列処理システムにおいて、 前記プロセッサエレメントは、当該プロセッサエレメン
トに属する複数の前記通信チャネルを共通に接続可能な
バイパスバスを複数有し、 前記通信チャネルのそれぞれは、当該通信チャネルに接
続された他のプロセッサエレメントを前記内部システム
バス又は前記バイパスバスの1つのバスに接続するチャ
ネルモード切り替え手段を含んでなり、該チャネルモー
ド切り替え手段は前記管理プロセッサから与えられるチ
ャネルモード指令に従って切り替えられることを特徴と
する並列処理システム。
A plurality of processor elements each comprising a processor, a memory, and a plurality of communication channels connected by an internal system bus, wherein each of the processor elements is connected to a predetermined number of other processor elements via the communication channel. In a parallel processing system connected to each other and sharing and executing a group of data processing to each of the processor elements in accordance with a command given from a management processor, the processor elements share a plurality of the communication channels belonging to the processor elements in common. A plurality of connectable bypass buses, each of the communication channels including a channel mode switching unit for connecting another processor element connected to the communication channel to the internal system bus or one of the bypass buses; In-than, the channel mode
The mode switching means is a key provided by the management processor.
A parallel processing system which is switched according to a channel mode command .
【請求項2】 請求項において、前記管理プロセッサ
は、前記各通信チャネルのチャネルモード切り替え手段
を切り替えることにより、当該通信チャネルが属するプ
ロセッサエレメントの処理データを複数の他のプロセッ
サエレメントに伝送することを特徴とする並列処理シス
テム。
2. The processor according to claim 1 , wherein the management processor transmits processing data of a processor element to which the communication channel belongs to a plurality of other processor elements by switching channel mode switching means of each communication channel. A parallel processing system characterized by the following.
【請求項3】 請求項において、前記管理プロセッサ
は、複数の前記プロセッサエレメント相互を接続するイ
ンターフェイス通信線と通信チャネルとの接続状態を管
理する構成管理手段と、前記各プロセッサエレメントの
処理分担に基づいて前記各通信チャネルのモードを決定
し、該決定に基づいて前記チャネルモード指令を前記各
プロセッサエレメントに出力する通信チャネルモード設
定手段とを含んで構成されたことを特徴とする並列処理
プロセッサ。
3. The management processor according to claim 1 , wherein the management processor manages a connection state between an interface communication line connecting the plurality of processor elements and a communication channel, and a processing share of the processor elements. A communication channel mode setting means for determining a mode of each communication channel based on the determination and outputting the channel mode command to each processor element based on the determination.
【請求項4】 請求項において、前記管理プロセッサ
は、前記データ処理の処理単位の終了とデータ転送の終
了のいずれか遅いものに合わせて、前記通信チャネルモ
ード設定手段により必要な通信チャネルのモードを変更
設定することを特徴とする並列処理プロセッサ。
4. The communication channel mode setting means according to claim 3 , wherein said management processor sets a communication channel mode required by said communication channel mode setting means in accordance with whichever of the end of said processing unit of data processing and the end of data transfer. A parallel processing processor characterized in that:
【請求項5】 請求項1乃至のいずれかにおいて、前
記チャネルモード切り替え手段は、前記他のプロセッサ
エレメントを前記内部システムバスとスルー用信号線の
一方に接続する第1の切り替え手段と、前記スルー用信
号線を前記バイパスバスの1つに選択接続する第2の切
り替え手段とからなることを特徴とする並列処理システ
ム。
5. In any of claims 1 to 4, wherein the channel mode switching means comprises first switching means for connecting said other processor elements to one of the internal system bus and a through signal lines, the A second switching unit for selectively connecting a through signal line to one of the bypass buses.
JP4234653A 1992-09-02 1992-09-02 Parallel processing system Expired - Lifetime JP2858190B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4234653A JP2858190B2 (en) 1992-09-02 1992-09-02 Parallel processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4234653A JP2858190B2 (en) 1992-09-02 1992-09-02 Parallel processing system

Publications (2)

Publication Number Publication Date
JPH0683789A JPH0683789A (en) 1994-03-25
JP2858190B2 true JP2858190B2 (en) 1999-02-17

Family

ID=16974387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4234653A Expired - Lifetime JP2858190B2 (en) 1992-09-02 1992-09-02 Parallel processing system

Country Status (1)

Country Link
JP (1) JP2858190B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5279342B2 (en) * 2008-05-22 2013-09-04 キヤノン株式会社 Information processing method and apparatus
US11030148B2 (en) * 2018-04-04 2021-06-08 Lawrence Livermore National Security, Llc Massively parallel hierarchical control system and method

Also Published As

Publication number Publication date
JPH0683789A (en) 1994-03-25

Similar Documents

Publication Publication Date Title
US7870366B2 (en) Chained operation of functional components with DONE and GO registers storing memory address for writing and reading linking signal value
US4644840A (en) Electronic keyboard musical instrument and a method of operating the same
JPH07234842A (en) Parallel data processing system
JP2009508142A (en) Test apparatus and method for testing device under test, and computer program
US20180294814A1 (en) Data processing device and control method therefor
JPS6184178A (en) Basic device for video signal processing
JP2001506367A (en) Scalable tester architecture employing I-Cached SIMD technology
CN109726800B (en) Operation method, device and related product
JP3848074B2 (en) Reactor manual operation device
JP2858190B2 (en) Parallel processing system
JPH0731613B2 (en) Diagnostic control device
US8155941B2 (en) Simulation apparatus, simulation system, and simulation method
JPH0520283A (en) Parallel data processor
JPH11272627A (en) Pipeline type multiprocessor system
CN111432034A (en) Intelligent distributed audio control system and audio signal processing method
JP2000057188A (en) Hardware and software cooperative evaluating device
US7003422B2 (en) Method for connecting test bench elements and shell device
JPH05250072A (en) System for initializing respective hardware at signal processor
JPH05290183A (en) Data control system
JPH037984B2 (en)
JPH10161902A (en) Computer control system and operation reproducing device therefor
JPH0713917A (en) Configuration change system
JP3677382B2 (en) Control information processing apparatus, control support apparatus, and transmission apparatus
JP2003036020A (en) Simulated subaqueous acoustic signal generating apparatus
JPH08179816A (en) Distributed control system