JPS6315334A - Parallel processor - Google Patents

Parallel processor

Info

Publication number
JPS6315334A
JPS6315334A JP15781886A JP15781886A JPS6315334A JP S6315334 A JPS6315334 A JP S6315334A JP 15781886 A JP15781886 A JP 15781886A JP 15781886 A JP15781886 A JP 15781886A JP S6315334 A JPS6315334 A JP S6315334A
Authority
JP
Japan
Prior art keywords
processing
processor
processing device
parallel
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP15781886A
Other languages
Japanese (ja)
Other versions
JP2791010B2 (en
Inventor
Koichiro Omoda
面田 耕一郎
Junji Nakakoshi
中越 順二
Shigeo Nagashima
長島 重夫
Teruo Tanaka
輝雄 田中
Naoki Hamanaka
濱中 直樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61157818A priority Critical patent/JP2791010B2/en
Publication of JPS6315334A publication Critical patent/JPS6315334A/en
Application granted granted Critical
Publication of JP2791010B2 publication Critical patent/JP2791010B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To attain the reallocation of a processing to another processor possible to operate when a processor is placed under a state impossible to operate, by inputting information from a first and a second holding means, detecting the number of the processor to which the processing can be allocated, and performing the allocation of the processing to each processor. CONSTITUTION:The processing read out from a memory device by a reading means is allocated to and executed at each processor, and at this time, a detecting means sends the number of the processor in which no fault is found, and which is not operated at present, to an allocating means, based on the state of the processor held in the first and the second holding means. The allocating means allocates the processing sequentially based on the number of the processor. Also, when the second holding means in execution on the processor, is set at a state impossible to start up, the detecting means detects the number of the processor, and sends it to the allocating means. The allocating means performs the reallocation of the processing based on the number of the processor. In this way, it is possible to allocate the processing dynamically in the execution time of a program, and furthermore, to reallocate the processing when the fault, etc., is found in the processor.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は並列処理装置に係り、特にデータ処理装置に好
適な並列処理装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a parallel processing device, and particularly to a parallel processing device suitable for a data processing device.

〔従来の技術〕[Conventional technology]

プログラムには複数の処理を並列に実行できる部分が多
数ある。この場合、並列実行部分の処理が、例えば配列
の要素明の演算のように規則的であれば、Croy−1
等のベクトルプロセッサで採用されているパイプライン
処理方式を用いで、規則正しい多数の演算を一括して連
続的に処理させることで効率良く高速化が実現できる。
There are many parts of a program that can execute multiple processes in parallel. In this case, if the processing of the parallel execution part is regular, such as the operation of array elements, Croy-1
By using the pipeline processing method adopted in vector processors such as , etc., it is possible to achieve efficient high-speed processing by sequentially processing a large number of regular operations at once.

しかし、並列実行部分の処理が規則的でない場合も数多
く存在する1例えば、回路解析プログラムのデバイスモ
デル計算では多くのトランジスタに関するffX算を並
列に実行可能であるが、トランジスタの種類等により演
算が不規則となる。
However, there are many cases where the processing of the parallel execution part is not regular.1 For example, in device model calculations of circuit analysis programs, it is possible to execute ffX calculations for many transistors in parallel, but depending on the type of transistor etc. It becomes a rule.

このような場合の処理では、パイプライン処理方式の効
果が充分得られず、高速化が困難である。
In processing in such a case, the effect of the pipeline processing method cannot be obtained sufficiently, and it is difficult to increase the speed.

このため、並列実行部分を多数の処理単位に分解し、多
数の処理装置で同時に実行させて高い演算性能を得る並
列処理方式の開発がさかんに行われている。
For this reason, parallel processing methods are being actively developed to obtain high arithmetic performance by breaking down parallel execution parts into a large number of processing units and having them simultaneously executed by a large number of processing devices.

このとき、並列に実行できる多数の処理単位を各処理装
置へ割当てて処理させるが、従来の装置はこの割当てが
プログラムで前もって指定されていた。しかし、実行時
に動的に割当てる点については充分配慮されていなかっ
た。
At this time, a large number of processing units that can be executed in parallel are assigned to each processing device for processing, but in conventional devices, this assignment is specified in advance in the program. However, sufficient consideration was not given to dynamic allocation during execution.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上記従来技術は、各処理装置への処理の割当てを実行時
に動的に割当てる点についての配慮がなされておらず次
のような問題点があった。
The above-mentioned conventional technology does not take into account dynamic assignment of processing to each processing device at the time of execution, and has the following problems.

並列処理装置では、一般的に、処理装置の台数は数十か
ら数百、あるいは数千から数万台と広範囲の構成が考え
られる。このとき、各処理装置への処理の割当てがプロ
グラムで固定的に指定される場合には、プログラム作成
時点で仮定した台数と、プログラムを実際に実行する時
点での台数とが不一致のとき、処理装置の台数が不足し
ていてプログラムが実行できなかったり、あるいは台数
が多過ぎて遊んでしまう、このため、実際に実行する時
点での台数に合わせてプログラムレベルで修正する必要
があった。
In general, parallel processing devices can have a wide range of configurations, ranging from tens to hundreds, or thousands to tens of thousands of processing devices. At this time, if the allocation of processing to each processing device is fixedly specified in the program, if the number of devices assumed at the time of program creation and the number of devices at the time of actual execution of the program do not match, the processing The program could not be executed due to an insufficient number of devices, or the program could not be executed because there were too many devices, so it was necessary to modify the program at the program level to match the number of devices at the time of actual execution.

また、処理装置の台数が非常に多くなった場合には故障
発生の確率が高くなるが、故障が発生した処理装置に割
当てられた処理を他の処理装置へ再割当てして処理を続
行させることができないため信頼性が低いという問題点
があった。
Furthermore, when the number of processing devices becomes extremely large, the probability of a failure occurring increases, but it is possible to continue processing by reassigning the processing assigned to the failed processing device to another processing device. There was a problem that reliability was low because it could not be done.

本発明の目的は、各処理装置への処理の割当てを実行時
に動的に行い、更に、処理装置が動作中に故障等により
動作不能状態になった場合、!I?lJ作可能な作動能
装置へ処理の再割当てが可能なような並列処理装置を提
供することにある。
An object of the present invention is to dynamically allocate processing to each processing device at the time of execution, and furthermore, it is an object of the present invention to dynamically allocate processing to each processing device at the time of execution. I? An object of the present invention is to provide a parallel processing device that can reallocate processing to a device capable of performing IJ operations.

〔問題点を解決するための手段〕[Means for solving problems]

上記目的は、プログラムの指令に基づき処理に必要な情
報を記憶装置から読出す読出し手段各処理装置が処理を
割当てられて動作中かどうかの状態を保持する第1の保
持手段と、各処理装置が故障等により処理の起動が不能
かどうかの状態を保持する第2の保持手段と、各処理装
置に割当てた処理を実行するに必要な情報を保持する第
3の保持手段と、第1と第2の保持手段からの情報を入
力して各処理装置の状態を検出する検出手段と、上記検
出手段からの状態検出情報と、読出し手段からへカされ
る処理に必要な情報に基づき各処理装置へ処理の割当て
行い、また、上記検出手段からの状態検出情報と、第3
の保持手段からの処理に必要な情報に基づき処理装置へ
処理の再割当てを行う割当て手段とで構成することによ
り達成される。
The above purpose is to provide a reading means for reading information necessary for processing from a storage device based on instructions of a program; a second holding means that holds the state of whether or not the processing cannot be started due to a failure or the like; a third holding means that holds information necessary to execute the processing assigned to each processing device; a detection means for detecting the state of each processing device by inputting information from the second holding means, and each processing based on the state detection information from the detection means and the information necessary for the processing that is returned from the reading means. Allocates processing to the device, and also uses the state detection information from the detection means and the third
This is achieved by comprising an allocation means for reallocating processing to a processing device based on the information necessary for the processing from the holding means.

〔作用〕[Effect]

読出し手段により記憶装置から読出した処理を各処理装
置へ割当てて実行するが、その際、第1と第2の保持手
段に保持された処理装置の状態に基づき、検出手段は故
障がなくかつ動作中でない処理装置番号を割当て手段に
送出する。割当て手段はこの処理装置番号に基づき順次
処理を割当てるが、このとき、処理装置へ、処理に必要
な情報を読出し手段から取出して転送すると同時に、同
じ情報を処理装置番号に対応する第3の保持手段にセッ
トしておき、また、対応する第1の保持手段を動作状態
にセットする。なお、処理装置での実行が終了すると第
1の保持手段は非動作状態にセットされ、また、実行中
に故障等があれば対応する第2の保持手段は起動不能状
態にセットされる。
The processing read out from the storage device by the reading means is assigned to each processing device and executed. At this time, based on the state of the processing device held in the first and second holding means, the detection means is determined to be free of failure and operational. A processing device number that is not in the middle is sent to the allocating means. The allocation means sequentially allocates processing based on this processing device number, but at this time, the information necessary for processing is retrieved from the reading means and transferred to the processing device, and at the same time, the same information is transferred to the third holding device corresponding to the processing device number. and the corresponding first holding means is set to the operating state. Note that when the execution in the processing device is completed, the first holding means is set to a non-operating state, and if there is a failure or the like during execution, the corresponding second holding means is set to a non-startable state.

また、処理装置で実行中に第2の保持手段が起動不能状
態にセットされた場合、検出手段はその処理装置番号を
検出して割当て手段に送出する。
Furthermore, when the second holding means is set to a non-startable state during execution in the processing device, the detection means detects the processing device number and sends it to the allocation means.

割当て手段はこの処理装置番号に基づき処理の再割当て
を行うが、この際の処理に必要な情報は検出された処理
装置番号に対応する第3の保持手段から取出す。
The allocation means reallocates the processing based on this processing device number, and the information necessary for the processing at this time is taken out from the third holding device corresponding to the detected processing device number.

このように制御することによって、プログラム実行時に
動的に処理の割当てが可能となり、更に。
By controlling in this way, it is possible to dynamically allocate processing during program execution, and furthermore.

処理装置での故障等による処理の再割当てが可能となる
Processing can be reassigned due to a failure in a processing device or the like.

〔実施例〕〔Example〕

以下1本発明の一実施例を図面を用いて説明する。第1
図は本発明の一実施例の概略構成図である0図中、1は
主記憶、2は記憶側#2−1〜7は主記憶1をセフセス
するためのポート3は入出カプロセッサ、4はホストプ
ロセッサ、5はプロセッサエレメント(PE)制御回路
、5−1はブリフェッチバッファ、5−2はマイクロコ
ンピュータ、5−3は各PE毎の動作状態を保持するラ
ッチ群、5−4は各PE毎に、故障等により処理開始の
起動が不能かどうかの状態を保持するラッチ群、5−5
は、各PE毎に、PEに割当てられたあるまとまった処
理単位(これをブロックと呼び各ブロックは並列に実行
できるものとする。)に関する情報を保持するレジスタ
群、5−6は各PEの動作状態をサーチする回路、5−
7は起動不能状態をサーチする回路、6〜9は番号O〜
3のPE、6−1〜9−1はローカル記憶、6−2〜9
−2はプロセシングユニット(PU)、Q1〜Ω9.f
llo−1−D〜3.1210−2. Q10−3−0
〜3.1210−4−0〜3は信号線である。なお、第
1図ではプロセッサエレメント台数を4とした構成であ
るが、一般的には、4台に限定する8粟はなく実現可能
な範囲であれば何台でも良い。
An embodiment of the present invention will be described below with reference to the drawings. 1st
The figure is a schematic configuration diagram of an embodiment of the present invention. In the figure, 1 is the main memory, 2 is the storage side #2-1 to 7 is the port 3 for accessing the main memory 1, and 4 is the input/output processor. 5 is a host processor, 5 is a processor element (PE) control circuit, 5-1 is a brief fetch buffer, 5-2 is a microcomputer, 5-3 is a latch group that maintains the operating state of each PE, and 5-4 is a A group of latches for each PE that maintains the state of whether processing cannot be started due to a failure or the like, 5-5
is a group of registers that holds information about a certain processing unit (this is called a block and each block can be executed in parallel) allocated to each PE, and 5-6 are registers for each PE. Circuit for searching operating status, 5-
7 is a circuit that searches for an unstartable state, and 6 to 9 are numbers O to
3 PE, 6-1 to 9-1 are local storage, 6-2 to 9
-2 is a processing unit (PU), Q1 to Ω9. f
llo-1-D~3.1210-2. Q10-3-0
~3.1210-4-0~3 are signal lines. Although FIG. 1 shows a configuration in which the number of processor elements is four, in general, there is no limit to four processor elements, and any number of processor elements may be used as long as it is within the practical range.

次に、第1図の概略構成図に基づき概略動作を説明する
が、第6図に示すような簡単な処理例を仮定して説明す
る0図中、1は主記憶、以下は実行に先だって主記憶1
に格納される情報であるが、100−1〜nは入出力デ
ータ、アドレスリスト、プログラムから構成されるn個
のブロック、100−1−1〜100−n−1は各ブロ
ックに対応する入出力データ、100−1−2〜100
− n −2は各ブロックに対応するアドレスリストと
プログラム、101−1〜nはMS (主記憶1)読出
し先頭アドレス、LS(ローカル記憶6−1〜9−1)
書込み先頭アドレスMSからLSへ転送するデータ量を
示すサイズとから構成される各ブロックに対応するブロ
ック情報、102はブロック情報101−1〜nが格納
されている先頭アドレス、103は処理すべきブロック
数(この場合n)である。
Next, the general operation will be explained based on the schematic configuration diagram of FIG. 1, but the explanation will be made assuming a simple processing example as shown in FIG. Main memory 1
100-1 to n are the n blocks consisting of input/output data, address list, and program, and 100-1-1 to 100-n-1 are the inputs corresponding to each block. Output data, 100-1-2 to 100
- n -2 is an address list and program corresponding to each block, 101-1 to n are MS (main memory 1) read start address, LS (local memory 6-1 to 9-1)
Block information corresponding to each block consists of a size indicating the amount of data to be transferred from the write start address MS to LS, 102 is the start address where block information 101-1 to n is stored, 103 is the block to be processed number (in this case n).

ここで、アドレスリスI〜は対応するブロックのプログ
ラムで参照する入出力データのアドレスを指定するリス
トである。例えば、FORTRANのサブルーチンがブ
ロックに対応するものとすれば、サブルーチンの引数で
指定されるデータが上記の入出力データに相当し、この
入出力データをアクセスする場合のアドレス情報が上記
のアドレスリストに相当する。
Here, the address list I~ is a list that specifies the addresses of input/output data to be referenced in the program of the corresponding block. For example, if a FORTRAN subroutine corresponds to a block, the data specified by the subroutine argument corresponds to the above input/output data, and the address information when accessing this input/output data is in the above address list. Equivalent to.

また、各ブロックに対応するアドレスリストとプログラ
ムは主記憶から1割当てられたPEのローカル記憶へ転
送されるが、その際、MS読出し先頭アドレスは主記憶
に格納されている対応するブロックのアドレスリストと
プログラムの先頭アドレスを指定し、また、LS書込み
アドレスはローカル記憶に格納される先頭アドレスを指
定するものとする。なお、この場合アドレスリストとプ
ログラムは主記憶上で連続して格納されているものと仮
定する。
In addition, the address list and program corresponding to each block are transferred from the main memory to the local memory of one assigned PE, but at this time, the MS read start address is the address list of the corresponding block stored in the main memory. and specifies the start address of the program, and the LS write address specifies the start address stored in local storage. In this case, it is assumed that the address list and the program are stored consecutively in the main memory.

ホストプロセッサ4は処理ブロック数103と先頭アド
レス102をPE制御回路5に転送して処理開始を指示
する、その後、PE制御回路5は先頭アドレス102に
基づき主記憶1からブロック情報101−1〜nを順次
読出して、ブロック情報101−1から順次各PEのロ
ーカル記憶の固定アドレスに転送して起動開始信号を送
出する。起ljJ開始信号を受付けた各PEは、ローカ
ル記憶の固定アドレスにセットされたブロック情報に基
づき以下のように処理を行う。即ち、ブロック情報にあ
るMS読出し先頭アドレスで指定された主記憶上のアド
レスから対応するアドレスリストとプログラムを読出し
て、ブロック情報に゛あるLS書込み先頭アドレスで指
定されたローカル記憶上のアドレスに書込む。なお、主
記憶′上から読出すアドレスリストとプログラムの量は
、プロツり情報にあるサイズで指定されるものとする。
The host processor 4 transfers the number of blocks to be processed 103 and the start address 102 to the PE control circuit 5 and instructs it to start processing.Then, the PE control circuit 5 transfers the block information 101-1 to n from the main memory 1 based on the start address 102. are sequentially read out and sequentially transferred from the block information 101-1 to fixed addresses in the local storage of each PE, and an activation start signal is sent. Each PE that receives the start ljJ start signal performs the following processing based on the block information set in the fixed address of the local storage. That is, the corresponding address list and program are read from the address in the main memory specified by the MS read start address in the block information, and written to the address in the local memory specified by the LS write start address in the block information. It's crowded. It is assumed that the amount of address list and program to be read from the main memory is specified by the size in the plot information.

そして、ローカル記憶に読出したプログラムに従って処
理を開始するが、その際、主記憶上の対応する入出力デ
ータをアクセスする場合は、先程主記憶から読出したア
ドレスリストの情報を用いて行うものとする。なお、プ
ログラムの実行途中で得られる中間結果データはローカ
ル記憶上に格納することが考えられるが、このような場
合には、主記憶とローカル記憶を別々にアクセスする命
令をサポートする必要がある。PEでは処理が終了する
とPE制御回路5へ終了信号を送出する。そして、PE
制御回路5は未処理のブロックがあれば新たなブロック
のブロック情報をPEへ転送して起動信号を送出する。
Processing is then started according to the program read out to the local memory, but at that time, when accessing the corresponding input/output data in the main memory, it is done using the information in the address list read out from the main memory earlier. . Note that intermediate result data obtained during program execution may be stored in local storage, but in such a case, it is necessary to support instructions that access main storage and local storage separately. When the processing is completed, the PE sends an end signal to the PE control circuit 5. And P.E.
If there is an unprocessed block, the control circuit 5 transfers the block information of the new block to the PE and sends out a start signal.

このようにして処理ブロック数103で指定された全ブ
ロックの処理を終了すると、PE制御回路5はホストプ
ロセッサへ終了信号を送出して動作を終了するものとす
る。
When processing of all blocks specified by the number of blocks to be processed 103 is completed in this manner, the PE control circuit 5 sends an end signal to the host processor and ends the operation.

ここで、各ブロックの処理を各PEへ割当てて処理を行
うが、この割当てに関する制御は本発明の特徴であり、
動作状態保持ラッチ群5−3、起動不能状態保持ラッチ
群5−4、ブロック情報保持レジスタ群5−5.動作状
態サーチ回路5−6゜起動不能状態サーチ回路5−7を
用いて行う。以上では、第2図〜第5図を用いて、各ブ
ロック処理のPEへの割当て制御を中心にして実施例を
群細に説明する。
Here, the processing of each block is assigned to each PE, and control regarding this assignment is a feature of the present invention.
Operating state holding latch group 5-3, activation disabled state holding latch group 5-4, block information holding register group 5-5. This is performed using the operating state search circuit 5-6 and the inactivation state search circuit 5-7. In the above, the embodiment will be described in detail with reference to FIGS. 2 to 5, focusing on control of allocation of each block process to PE.

第2図は第1図で示したプロセッサエレメント(P E
)制御回路5の構成例である。図中、5−1はブリフェ
ッチバッファ、5−2はマイクロプロセッサ、5−3−
0〜5−3−3は各々プロセッサエレメント(PE)番
号O〜3に対応する動作状態保持ラッチ、5−4−0〜
3は各々PE番号0〜3に対応する起動不能状態保持ラ
ッチ、5−5−〇〜3は各々PE番号O〜3に対応する
ブロック情報保持レジスタ、5−6は動作状態サーチ回
路、5−7は起動不能状態サーチ回路、5−10.5−
14.5−20.5−23〜26,5−27.5−29
〜32はセレクタ、5−11゜5−13.5−15−1
〜2.5−18.5−33はレジスタ、5−12はカウ
ントアツプ回路。
Figure 2 shows the processor element (P E
) This is an example of the configuration of the control circuit 5. In the figure, 5-1 is a brief fetch buffer, 5-2 is a microprocessor, and 5-3-
0 to 5-3-3 are operating state holding latches corresponding to processor element (PE) numbers O to 3, respectively, and 5-4-0 to
3 is a bootable state holding latch corresponding to PE numbers 0 to 3, respectively; 5-5-0 to 3 are block information holding registers corresponding to PE numbers O to 3, respectively; 5-6 is an operation state search circuit; 5- 7 is a startup failure state search circuit, 5-10.5-
14.5-20.5-23 to 26,5-27.5-29
~32 is selector, 5-11°5-13.5-15-1
~2.5-18.5-33 is a register, and 5-12 is a count up circuit.

5−17はカウントダウン回路、5−16はゼロ検出回
路、5−19.5−21〜22.5−27〜28はデコ
ーダ、  A4−1〜4.f15−1〜2゜Q10−1
−0〜3. Q10−2.fllO−3−0〜3.A1
0−4−0〜3.A50−1〜4゜A50−5−1〜2
. A50−6〜19は信号線である。第3図は第2図
に示したPE制御回路5の主要な動作を示す制御フロー
図である。また、第4図と第5図は、各々、第2図に示
した動作状態サーチ回路5−6.起動不能状態サーチ回
路5−7の構成例である。なお、第4図に於て、5−3
−〇〜3は各々、PE番号0〜3に対応する動作状態保
持ラッチ(第2図に図示)、5−4−0〜3は各々、P
E番号O〜3に対応する起動不能状態保持ラッチ(第2
図に図示)5−34〜35゜5−45はOR回路、5−
36〜39.5−44゜5−46〜47. はAND回
路、5−40〜43゜5−48〜53はN O7回路、
A50−5−1〜2.150−12は信号線である。
5-17 is a countdown circuit, 5-16 is a zero detection circuit, 5-19. 5-21 to 22. 5-27 to 28 are decoders, A4-1 to 4. f15-1~2゜Q10-1
-0~3. Q10-2. fllO-3-0~3. A1
0-4-0~3. A50-1~4゜A50-5-1~2
.. A50-6 to A50-19 are signal lines. FIG. 3 is a control flow diagram showing the main operations of the PE control circuit 5 shown in FIG. Further, FIGS. 4 and 5 respectively show the operating state search circuit 5-6 shown in FIG. This is an example of the configuration of a startup failure state search circuit 5-7. In addition, in Figure 4, 5-3
-〇~3 are operating state holding latches corresponding to PE numbers 0~3 (shown in Figure 2), 5-4-0~3 are P
The unstartable state holding latch (second
(Illustrated in the figure) 5-34 to 35° 5-45 is an OR circuit, 5-
36-39.5-44°5-46-47. is an AND circuit, 5-40~43°5-48~53 is an NO7 circuit,
A50-5-1 to 2.150-12 are signal lines.

また、第5図に於て、5−3−0〜3と5−4−〇〜3
は第4図と同様であり、5−50.5−52〜56.5
−60〜61はAND回路、5−51.5−59はOR
回路、5−57〜58,5−62はNOT回路、 A5
0−7〜8. A50−13は信号線である。
Also, in Figure 5, 5-3-0~3 and 5-4-0~3
is the same as in Figure 4, and 5-50.5-52 to 56.5
-60 to 61 are AND circuits, 5-51.5-59 are OR circuits
Circuit, 5-57 to 58, 5-62 are NOT circuits, A5
0-7~8. A50-13 is a signal line.

ホストプロセッサ4より、信号線24−4を介して、第
6図で示したような処理を指定する命令がPE制御回路
5に入力されると、デコーダ5−19で解読され、信号
線Q50−15を介してマイクロコンピュータ5−2に
その旨が伝達される。
When a command specifying the processing shown in FIG. 6 is input from the host processor 4 to the PE control circuit 5 via the signal line 24-4, it is decoded by the decoder 5-19 and sent to the signal line Q50- 15 to the microcomputer 5-2.

すると、マイクロコンピュータ5−2はPEliJ号0
〜3のうち全てが起動不能かどうかを、起動不能状態サ
ーチ回路5−7から出力される信号線Q50−7に基づ
きチェックする。信号aQ50−7は第5図に示すよう
に、起動不能状態保持ラッチ5−4−0〜3が全てON
のとき、即ち、全PEが起動不能状態のときONとなる
Then, the microcomputer 5-2 reads PEliJ No. 0.
.about.3 are all unstartable, based on the signal line Q50-7 output from the unstartable state search circuit 5-7. As shown in FIG. 5, the signal aQ50-7 indicates that all start-up disabled state holding latches 5-4-0 to 3 are ON.
It turns ON when , that is, when all PEs are in a non-startable state.

従って、信号線fi50−7がONのときは、全PEが
起動不能状態であり、ホストプロセッサ4からの命令を
実行できない。このため、マイクロコンピュータ5−2
は信号線Q4−3を介して処理不可をホストプロセッサ
4へ報告して終了する。
Therefore, when the signal line fi50-7 is ON, all PEs are in a non-startable state and cannot execute instructions from the host processor 4. For this reason, the microcomputer 5-2
reports the inability to process to the host processor 4 via the signal line Q4-3 and ends.

一方、信号線Q50−7がOFFのときは、信号線Q4
−3を介してホストプロセッサ4へ処理可能を報告する
と、ホストプロセッサ4は信号線Q4−1.セレクタ5
−14を介して、処理ブロック数103(第6図参照)
をレジスタ5−15−2へ、また、信号mΩ4−1.セ
レクタ5−10を介して先頭アドレス102(第6図参
照)をレジスタ5−11ヘセツトする。その後、レジス
タ5−11にセットした先頭アドレスに基づき、カウン
トアツプ回路5−12で順次アドレス更新しながら、信
号線Q5−1を介してポート2−3に主記憶1への読出
しアドレスを送出し、ブロック情報(第6図に図示した
101−1〜n)を主記憶1から読出し、信号線Q5−
2を介してブリフェッチバッファ5−1に順次格納する
。上記のブロック情報の読出しと並行して、第3図に示
した制御フローに従ってマイクロコンピュータ5−2が
制御を行う、以下では第3図に従って動作を詳細に説明
する。
On the other hand, when signal line Q50-7 is OFF, signal line Q4
-3, the host processor 4 reports that processing is possible through the signal lines Q4-1. selector 5
-14, the number of processing blocks is 103 (see Figure 6)
to the register 5-15-2, and the signal mΩ4-1. The start address 102 (see FIG. 6) is set in the register 5-11 via the selector 5-10. After that, based on the start address set in the register 5-11, the read address to the main memory 1 is sent to the port 2-3 via the signal line Q5-1 while updating the address sequentially in the count-up circuit 5-12. , reads the block information (101-1 to 101-n shown in FIG. 6) from the main memory 1, and connects the signal line Q5-
2 and sequentially stored in the brief fetch buffer 5-1. In parallel with the reading of the block information, the microcomputer 5-2 performs control according to the control flow shown in FIG. 3.The operation will be described in detail below according to FIG.

まず、5100で全ブロックに対して各PEへ起動を掛
けたかどうかチックする。これは、レジスタ5−15−
2に最初セットした処理ブロック数を、1ブロツク起動
を掛ける毎にカウントダウン回路5−17でカウントダ
ウンして行き、値が0になったときゼロ検出回路5−1
6から出力される信号線Q50−1がONとなることに
より全ブロックの起動終了を認識する。
First, at 5100, a check is made to see if each PE has been activated for all blocks. This is register 5-15-
The countdown circuit 5-17 counts down the number of processing blocks initially set to 2 every time one block is activated, and when the value reaches 0, the zero detection circuit 5-1
When the signal line Q50-1 output from 6 is turned ON, it is recognized that the activation of all blocks has been completed.

(1)全ブロックの起動が終了していない場合コニの場
合は、まず、5lotで非動作中のPEがあるかどうか
をチェックする。非動作中のPEが無ければ非動作中の
PEが出現するまで新たなブロックの起動を待つが、こ
の間に、5104で全PEが起動不能状態かどうかをチ
ェック(信号線Q 50−7で認識)する。全PEが起
動不能にであれば、マイクロコンピュータ5−2は信号
線Q4−2を介してホストプロセッサ4へ異常終了を報
告し、実行中の処理を中断する。
(1) When activation of all blocks has not been completed In the case of Koni, first check whether there is an inactive PE in 5 lots. If there is no non-operating PE, activation of a new block is waited until a non-operating PE appears, but during this time, it is checked in 5104 whether all PEs are in the activation-incapable state (recognized by signal line Q 50-7). )do. If all PEs are unable to start, the microcomputer 5-2 reports abnormal termination to the host processor 4 via the signal line Q4-2, and interrupts the process being executed.

なお、各PEはブロックの処理中にマシンチェック等の
動作不能要因を検出すると、信号線QIO−4−0〜3
 (PE番号O〜3に対応)。
Note that when each PE detects an inoperable factor such as a machine check while processing a block, it connects signal lines QIO-4-0 to QIO-3.
(Corresponding to PE numbers O to 3).

セレクタ5−29〜31を介して対応する起動不能状態
保持ラッチ5−4−〇〜3をONにするものとする。
It is assumed that the corresponding activation disabled state holding latches 5-4-0 to 3 are turned on via the selectors 5-29 to 31.

次に、非動作中のPEが有る場合の処理手順を記すが、
ここで、非動作中のPEが有るかどうかは次のようにし
て認識する。
Next, we will describe the processing procedure when there is an inactive PE.
Here, whether or not there is an inactive PE is recognized as follows.

即ち、動作状態を保持ラッチと、動作状態保持ラッチと
対応する起動不能状態保持ラッチが共にOFFのものが
あれば非動作中のPEが有るものとする。なお、動作状
態保持ラッチは対応するPEへの起動が掛かる(信号線
210−1−〇〜3を介して起動信号が送出とONとな
り、PEでの処理が終了する(信号線Q1〇−3−〇〜
3を介して終了信号を受取る)とOFFになるものとす
る。具体的には、非動作中のPEが有るかどうかの情報
は、第4図に図示した動作状態サーチ回路5−6に基づ
き信号線Q50−5−1を介してマイクロコンピュータ
5−2に転送されて認識される。
That is, if both the operating state holding latch and the activation disabled state holding latch corresponding to the operating state holding latch are OFF, it is assumed that there is an inactive PE. Note that the operating state holding latch is activated to the corresponding PE (the activation signal is sent and turned ON via signal lines 210-1-0 to 210-3, and the processing in the PE is completed (signal line Q1-3). −〇〜
3), it will turn OFF. Specifically, information as to whether there is an inactive PE is transferred to the microcomputer 5-2 via the signal line Q50-5-1 based on the operating state search circuit 5-6 shown in FIG. be recognized.

非動作中のPEがあれば、まず第3図に図示した510
2でブリフェッチバッファ5−1に必要とするブロック
情報が前もって主記憶1から読出されていれば、引続い
て5103の処理を行う。前もって読出されていなけれ
ば読出されるまで待って、8103の処理を行う。
If there is an inactive PE, first 510 shown in FIG.
If the block information required for the brief fetch buffer 5-1 has been read out from the main memory 1 in advance in step 2, then the process in step 5103 is performed. If it has not been read in advance, wait until it is read and perform the process of 8103.

次に、5103での処理手順を記す。まず、動作状態サ
ーチ回路5−6から信号mΩ50−12を介して出力さ
れる非動作中のPE番号の(非動作中PEが複数あれば
、その中から1つを選択)のエンコード情報をデコーダ
5−21に入力する。ここで、エンコード情報は第4図
の信号線Q50−12のビット0とビット1に図示した
ように2ビツトで作成され、 ビット0=0.ビット1=OのときPE番号O’  =
O,’  =1’  PE番号1’  =1.   ’
  =O’  PE番号2’  =1.   ’  =
1’  PE番号3を指定するものとする。そして、マ
イクロコンピュータ5−2が信号、l1IQ50−3を
介してイネーブル信号をセレクタ5−21に送出すると
Next, the processing procedure at 5103 will be described. First, the encoded information of the non-operating PE number (if there are multiple non-operating PEs, one is selected from them) output from the operating state search circuit 5-6 via the signal mΩ50-12 is decoded. Enter in 5-21. Here, the encoded information is created with 2 bits as shown in bit 0 and bit 1 of the signal line Q50-12 in FIG. 4, and bit 0=0. When bit 1 = O, PE number O' =
O,' = 1' PE number 1' = 1. '
=O' PE number 2' =1. '=
1' PE number 3 shall be specified. Then, when the microcomputer 5-2 sends an enable signal to the selector 5-21 via the signal l1IQ50-3.

前述のエンコード情報が解読され、信号線Q10−1−
0〜3のどれかがONとなり対応するPEへ起動信号が
送出する。このとき同時に、動作状態保持ラッチ5−3
−0〜3のうち対応するラッチをONにして動作状態と
する。
The aforementioned encoded information is decoded and the signal line Q10-1-
Any one of 0 to 3 turns ON and a start signal is sent to the corresponding PE. At the same time, the operating state holding latch 5-3
The corresponding latch among -0 to 3 is turned on to be in an operating state.

並行して、ブリフェッチバッファ5−1からブロック情
報を読出し、信号線Q50−10゜セレクタ5−20.
信号線Q10−2を介して各PEへブロック情報を送出
する。このとき、同時に、上記ブロック情報をブロック
情報保持レジスタ5−5−0〜3のうち対応するレジス
タヘセットする。その後、5100へ戻り全ブロックの
起動が終了していない場合の処理手順が終了する。
In parallel, block information is read from the brief fetch buffer 5-1, and the signal line Q50-10° selector 5-20.
Block information is sent to each PE via the signal line Q10-2. At this time, at the same time, the block information is set in the corresponding register among the block information holding registers 5-5-0 to 5-3. Thereafter, the process returns to 5100 and the processing procedure when all blocks have not been activated ends.

(2)全ブロックの起動が終了した場合:この場合はま
ず、8106で動作中のPEが有るかどうかチェックす
る。これは、マイクロプロセッサ5−2が、動作状態サ
ーチ回路5−6から信号線1250−5−2を介し転送
される情報に基づいて認識する。
(2) When activation of all blocks is completed: In this case, first, it is checked in 8106 whether there is any PE in operation. This is recognized by the microprocessor 5-2 based on information transferred from the operating state search circuit 5-6 via the signal line 1250-5-2.

このとき、信号線Q50−5−2は、第4図に図示した
ように動作状態保持ラッチ5−3−〇〜3のうち、どれ
か1つでもONのものがあればONとなり、動作中のP
Eが有ることを示す。
At this time, the signal line Q50-5-2 is turned ON if any one of the operating state holding latches 5-3-0 to 3 is ON as shown in FIG. P of
Shows that E exists.

動作中のPEが無ければ、マイクロプロセッサ5−2は
全ブロックの処理が正常に終了したと認識し、信号線Q
4−2を介してホストプロセッサ4へ正常終了報告を行
う。
If there is no PE in operation, the microprocessor 5-2 recognizes that the processing of all blocks has been completed normally, and connects the signal line Q.
A normal completion report is sent to the host processor 4 via 4-2.

動作中のPEが有れば、5107で全PEが起動不能状
態かどうかチェックする。もし、全PEが起動不能状態
であれば前述したslogの処理を行う、全PEが起動
不能状態で無ければ8108の処理を行う、この510
8ではPE起動後にPEでマシンチェック等の動作不能
要因が発生し、対応する動作不能状態保持ラッチがON
になっているかどうかをチェックする。
If there are any PEs in operation, it is checked in step 5107 whether all PEs are in an unstartable state. If all PEs are in an unstartable state, the above-mentioned slog process is performed, and if all PEs are not in an unstartable state, the process of 8108 is performed.
8, an inoperable factor such as a machine check occurs in the PE after the PE starts, and the corresponding inoperable state holding latch is turned ON.
Check whether it is.

具体的には、第5図に図示したように、起動不能状態保
持ラッチ(5−4−0〜3)がONで、かつ、対応する
動作状態保持ラッチ(5−3−〇〜3)がONのものが
あれば、信号mu50−8がONとなり、実行中に起動
不能PEが発生したことがマイクロプロセッサ5−2へ
報告される。
Specifically, as shown in FIG. 5, the unstartable state holding latches (5-4-0 to 3) are ON, and the corresponding operating state holding latches (5-3-0 to 3) are ON. If any PE is ON, the signal mu50-8 is turned ON, and the microprocessor 5-2 is notified that an unstartable PE has occurred during execution.

実行中に起動不能PEが発生していなければ5106へ
戻り、発生していれば5109の処理を行う、 510
9では前述の8101の処理と同様にして、非動作中の
PEが有るかどうかチェックする。
If an unstartable PE has not occurred during execution, the process returns to 5106, and if it has occurred, performs the process of 5109, 510
At step 9, in the same manner as the process at step 8101 described above, it is checked whether there is an inactive PE.

非動作中のPEが無ければ、非動作中のPEが出現する
まで待つが、この間に全PEが起動不能状態になってい
るかがチェックされ、もし、全PEが起動不能状態であ
れば前述の3105の処理を行って異常終了する。
If there is no non-operating PE, the system waits until a non-operating PE appears, but during this time it is checked whether all PEs are in a non-startable state, and if all PEs are in a non-startable state, the above-mentioned process is performed. Processing in step 3105 is performed and the process ends abnormally.

一方、非動作中のPEがあれば5LIO。On the other hand, if there is a non-operating PE, 5 LIO.

5112の処理を行って3106に戻る。まず。After processing 5112, the process returns to 3106. first.

5Lioでは実行中に発生した起動不能PEに対応する
動作状態保持ラッチをOFFにする。
In 5Lio, the operating state holding latch corresponding to the unstartable PE that occurs during execution is turned OFF.

具体的には、起動不能状態サーチ回路5−7から信号線
A30−13を介して出力される実行中に発生した起動
不能PE番号(複数あればその中から1つを選択)のエ
ンコード情報を、レジスタ5−33にセットする。
Specifically, the encoded information of the unstartable PE number (select one from among them if there is more than one) that occurred during execution is output from the unstartable state search circuit 5-7 via the signal line A30-13. , set in register 5-33.

なお、エンコード方式は前述した非動作中PE番号の場
合と同様であり、具体的な論理構成は第5図を参照され
たい。
The encoding method is the same as that for the inactive PE number described above, and please refer to FIG. 5 for the specific logical configuration.

そして、レジスタ5−33にセットしたPE番号のエン
コード情報を信号線Q50−14を介してデコーダ5−
22に入力する。そして、マイクロコンピュータ5−2
が信号線fi50−4を介してデコーダ5−22にイネ
ーブル信号を送出すると、エンコード情報がデコードさ
る6そして、デコード情報がセレクタ5−23〜26を
介して対応するPEの動作状態保持ラッチのリセット端
子に入力されてOFFとなる。
Then, the encoded information of the PE number set in the register 5-33 is sent to the decoder 5-3 via the signal line Q50-14.
22. And microcomputer 5-2
sends an enable signal to the decoder 5-22 via the signal line fi50-4, the encoded information is decoded6, and the decoded information is transmitted via the selectors 5-23 to 5-26 to reset the operating state holding latch of the corresponding PE. It is input to the terminal and turned OFF.

続いて、5112の処理を行う。Subsequently, the process of 5112 is performed.

基本的な動作は前述した5103と同様であるが、以下
の点が異なる。即ち、5103に於ては、ブロック情報
をブリフェッチバッファ5−1から取出したが、511
2ではレジスタ5−33にセットしたPE番号のエンコ
ード情報に基づき、ブロック情報保持レジスタ5−5−
〇〜3の中から対応するブロック情報をセレクタ5−2
7を介して取出す点が異なる。
The basic operation is the same as that of 5103 described above, but the following points are different. That is, in 5103, block information was extracted from the brief fetch buffer 5-1, but in 511
2, based on the encoded information of the PE number set in the register 5-33, the block information holding register 5-5-
Selector 5-2 selects the corresponding block information from 〇 to 3.
The difference is that it is taken out via 7.

以上で本発明の一実施例に基づく動作説明を終了する0
以上の説明は、第6図に示した処理例を基にした動作説
明であるが、一般的には第6図に示した処理例に限定さ
れる必要はない。
This concludes the explanation of the operation based on one embodiment of the present invention.
Although the above description is an operation description based on the processing example shown in FIG. 6, it is generally not necessary to be limited to the processing example shown in FIG.

例えば、第6図では各ブロックの処理のプログラムは各
ブロック毎にPEで別々に主記憶からローカル記憶に読
出しているが、もし、各ブロックに共通であれば、前も
ってブロードキャストして置くことが考えられる。また
、入力データについても、共通データがあれば同様のこ
とが考えられる。
For example, in Figure 6, the processing program for each block is read from the main memory to the local memory separately by the PE for each block, but if it is common to each block, it may be a good idea to broadcast it in advance. It will be done. Moreover, the same thing can be considered for input data if there is common data.

さらに、各PEでのプログラムの実行途中で必要となる
データを必要に応じて主記憶から読出すのではなく、プ
ログラムの開始前に前もって必要なデータを一括して主
記憶からローカル記憶に読出しておき、プログラムの実
行中は極力主記憶をアクセスしないようにする方式も考
えられる。また、第6図では、ホストプロセッサ4が複
数のブロックをひとまとめにして、一括して処理するよ
うにプロセッサエレメントIIJ御回路5に指示するが
、各ブロック毎に指示する方式も考えられる。
Furthermore, instead of reading the necessary data from the main memory as needed during the program execution in each PE, the necessary data is read in advance from the main memory to the local memory in advance before the program starts. Another possible method is to avoid accessing the main memory as much as possible while the program is running. Further, in FIG. 6, the host processor 4 instructs the processor element IIJ control circuit 5 to process a plurality of blocks at once, but a method of instructing each block separately is also conceivable.

例えば、共通データをブロードキャストする場合の処理
は次のように行う。
For example, the process for broadcasting common data is performed as follows.

ホストプロセッサ4より、信号線Q4−4を介して、ブ
ロードキャストを指定する命令がPE制御回路5に入力
されると、デコーダ5−19で解読され、信号m D、
 50−16を介してマイクロコンピュータにその昏が
伝達される。同時に、ホストプロセッサ4は、信号線Q
4−1を介して、読出すべき主記憶の先頭アドレスをレ
ジスタ5−11へ、転送するデータサイズをレジスタ5
−15−2へ、また、ローカル記憶に書込むべき先頭ア
ドレスをレジスタ5−15−1にセットする。
When a command specifying broadcast is input from the host processor 4 to the PE control circuit 5 via the signal line Q4-4, it is decoded by the decoder 5-19, and the signal mD,
The information is transmitted to the microcomputer via 50-16. At the same time, the host processor 4 connects the signal line Q
4-1, the start address of the main memory to be read is sent to register 5-11, and the data size to be transferred is sent to register 5-11.
-15-2, and sets the start address to be written to the local memory in register 5-15-1.

なお、ここでは、転送するデータのアドレス付けは主記
憶上、ローカル記憶上ともに連続アドレスを仮定する。
Here, it is assumed that the addressing of the data to be transferred is continuous in both the main memory and the local memory.

その後、レジスタ5−15−1にセットされた先頭アド
レスを、信号線150−9゜セレクタ5−20.信号線
QIO−2を介して全PEへ転送する。引続いて、レジ
スタ5−11にセットされた先頭アドレスをカウントア
ツプ回路5−12でカウントアツプしながら、主記憶か
ら順次データをプリフェッチバッファ5−1に読出し、
レジスタ5−15−2にセットしたデータサイズだけデ
ータを取出して信号171tQ50−10゜セレクタ5
−20、信号線filo−2を介して全PEへ転送して
ローカル記憶に書込む。
Thereafter, the start address set in the register 5-15-1 is transferred to the signal line 150-9° selector 5-20. Transfer to all PEs via signal line QIO-2. Subsequently, while counting up the start address set in the register 5-11 by the count-up circuit 5-12, data is sequentially read from the main memory to the prefetch buffer 5-1.
Extract data by the data size set in register 5-15-2 and send signal 171tQ50-10° selector 5
-20, transfer to all PEs via signal line filo-2 and write in local storage.

また、第2図に於て、デコーダ5−27とデコーダ5−
28は、ホストプロセッサ4から転送される指令に基づ
き、起動不能状態保持ラッチ5−4−0〜3を0N10
FFするときに用いられるものである。なお、ホストプ
ロセッサ4が起動不能状態ラッチの5−4−0〜3の状
態を知る必要があれば、そのための機能は容易に付加可
能であり、動作状態保持ラッチ5−3−0〜3について
も同様のことが言える。
In addition, in FIG. 2, decoder 5-27 and decoder 5-
28 sets the unstartable state holding latches 5-4-0 to 3 to 0N10 based on the command transferred from the host processor 4.
This is used when performing FF. Incidentally, if the host processor 4 needs to know the status of the non-startable state latches 5-4-0 to 3, a function for that purpose can be easily added. The same thing can be said.

第7図は本発明の他の実施例の構成図である。FIG. 7 is a block diagram of another embodiment of the present invention.

第7図は第6図にベクトル処理装置を組込んだ構成であ
り、10はベクトル処理装置、2−8はベクトル処理装
置が主記憶1をアクセスするためのボート、111はベ
クトル処理袋!!10とボート2−8の間で、アドレス
および読出しデータ/書込みデータ等を転送するための
信号線、Q12はベクトル処理装置10とホストプロセ
ッサ4の間で、制御情報(例えば、ホストプロセッサ4
がらベクトル処理装置10への処理開始を指示する起動
信号、ベクトル処理袋[10からホストプロセッサ4へ
の処理終了信号等)を転送するための信号線であり、そ
の他は第6図と同様である。なお、ベクトル処理装置1
0としては、Cray  1+HITAC3−810等
のベクトル処理装置が考えられる。
FIG. 7 shows a configuration in which a vector processing device is incorporated in the configuration shown in FIG. 6, where 10 is a vector processing device, 2-8 is a boat for the vector processing device to access the main memory 1, and 111 is a vector processing bag! ! Q12 is a signal line for transferring addresses, read data/write data, etc. between the vector processing device 10 and the host processor 4, and a signal line Q12 is used to transfer control information (for example, the host processor 4
This is a signal line for transmitting a start signal for instructing the vector processing device 10 to start processing, a vector processing signal (a processing end signal from 10 to the host processor 4, etc.), and the rest is the same as in FIG. . Note that the vector processing device 1
0, a vector processing device such as Cray 1+HITAC3-810 can be considered.

プログラムを実行する場合、並列処理に適した処理はプ
ロセッサエレメント制御回路5の制御の下に、プロセッ
サエレメント番号O〜3で並列処理させ、一方、ベクト
ル処理(パイプライン処理)に適した処理はベクトル処
理装置10で処理させることにより、高速化、高効率化
が実現できる。
When executing a program, processing suitable for parallel processing is performed in parallel by processor element numbers O to 3 under the control of the processor element control circuit 5, while processing suitable for vector processing (pipeline processing) is performed in parallel using processor element numbers O to 3. By processing with the processing device 10, high speed and high efficiency can be realized.

なお、第7図に於て、ベクトル処理装置10は、高度の
パイプライン方式を採用した比較的大規模な処理装置で
あり、一方、プロセッサエレメント番号O〜3は比較的
小規模の処理装置である。また、プロセッサエレメント
の数は4台に限定する必要はなく、実際には数十〜数百
台で構成され、さらに、ベクトル処理装置も複数台で構
成することも考えられる。
Note that in FIG. 7, the vector processing device 10 is a relatively large-scale processing device that employs an advanced pipeline system, while processor element numbers O to 3 are relatively small-scale processing devices. be. Further, the number of processor elements does not need to be limited to four; in fact, it may consist of several tens to hundreds of processor elements, and it is also conceivable that the vector processing device may also be composed of a plurality of units.

〔発明の効果〕〔Effect of the invention〕

本発明によれば、各処理装置への処理の割当てを実行時
に動的に行うことが出来るため、利用者は処理装置の台
数および処理装置の番号を意識する必要がなく、また、
処理装置が動作中に故障等により動作不能状態になった
場合、動作可能な他処理装置へ処理の再割当てが可能と
なるため信頼性を向上できる並列処理装置を提供できる
という効果があり、また、ベクトル処理装置を組込み。
According to the present invention, since processing can be dynamically assigned to each processing device at the time of execution, the user does not need to be aware of the number of processing devices and the number of the processing device, and
If a processing device becomes inoperable due to a failure or the like during operation, processing can be reassigned to another operational processing device, which has the effect of providing a parallel processing device that can improve reliability. , incorporates a vector processing unit.

ベクトル処理向きの処理をベクトル処理装置で実行させ
、また、並列処理向きの処理を並列処理装置で実行させ
ることによって、処理の内容に応じた負荷分散が可能と
なり、高速化・高効率化が実現できるという効果がある
By executing processes suitable for vector processing on a vector processing device, and executing processes suitable for parallel processing on a parallel processing device, it is possible to distribute the load according to the content of the processing, achieving higher speed and efficiency. There is an effect that it can be done.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例の概略構成図、第2図は第1
図に図示したプロセッサエレメント制御回路の構成例、
第3図は本発明の一実施例の動作を説明するための制御
フロー、第4図と第5図は、各々、第2図に図示した動
作状態サーチ回路と起動不能状態サーチ回路の構成例、
第6図は本発明の一実施例の動作を説明するための処理
例、第7図は本発明の他の実施例の構成図を示す図であ
る。
FIG. 1 is a schematic configuration diagram of an embodiment of the present invention, and FIG.
An example of the configuration of the processor element control circuit shown in the figure,
FIG. 3 is a control flow for explaining the operation of an embodiment of the present invention, and FIGS. 4 and 5 are configuration examples of the operating state search circuit and the inactivation state search circuit shown in FIG. 2, respectively. ,
FIG. 6 is a processing example for explaining the operation of one embodiment of the present invention, and FIG. 7 is a diagram showing a configuration diagram of another embodiment of the present invention.

Claims (1)

【特許請求の範囲】 1、複数の処理装置と、該処理装置の制御を行う制御装
置と、該処理装置と該制御装置とで共有する記憶装置と
で構成し、該各処理装置が各々異なつた複数の処理を並
列に実行可能である並列処理装置に於て、該各処理装置
が動作中かどうかの状態を保持する第1の保持手段と、
該各処理装置が故障等により処理の起動が不能かどうか
の状態を保持する第2の保持手段と、該第1の保持手段
と該第2の保持手段からの情報を入力して処理の割当て
可能な処理装置番号を検出する検出手段と、該検出手段
から出力される情報に応答して該各処理装置へ処理の割
当てを行う割当て手段とを持つことを特徴とする該並列
処理装置。 2、第1項の並列処理装置に於て、更に、該各処理装置
に割当てた処理を実行するに必要な情報を保持する第3
の保持手段を含み、該検出手段は処理実行中に動作不能
状態となつた処理装置番号を検出可能であつて、該割当
て手段は処理実行中に動作不能状態となつた該処理装置
番号に基づき、対応する第3の保持手段から処理を実行
するに必要な情報を取出して処理の再割当てが可能であ
る並列処理装置。
[Claims] 1. Consisting of a plurality of processing devices, a control device that controls the processing devices, and a storage device shared by the processing devices and the control device, each processing device has a different in a parallel processing device capable of executing a plurality of processes in parallel;
a second holding means for holding a state as to whether or not each processing device is unable to start processing due to a failure or the like, and inputting information from the first holding means and the second holding means to allocate processing. The parallel processing apparatus is characterized by having a detecting means for detecting possible processing apparatus numbers, and an assigning means for allocating processing to each of the processing apparatuses in response to information output from the detecting means. 2. In the parallel processing device of item 1, there is also a third parallel processing device that holds information necessary to execute the processing assigned to each processing device.
, the detecting means is capable of detecting a processing device number that becomes inoperable during execution of processing, and the assigning means is capable of detecting a processing device number that becomes inoperable during execution of processing. , a parallel processing device capable of reassigning processes by extracting information necessary to execute a process from a corresponding third holding means.
JP61157818A 1986-07-07 1986-07-07 Parallel processing unit Expired - Lifetime JP2791010B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61157818A JP2791010B2 (en) 1986-07-07 1986-07-07 Parallel processing unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61157818A JP2791010B2 (en) 1986-07-07 1986-07-07 Parallel processing unit

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP8083549A Division JP2685043B2 (en) 1996-04-05 1996-04-05 Parallel processor

Publications (2)

Publication Number Publication Date
JPS6315334A true JPS6315334A (en) 1988-01-22
JP2791010B2 JP2791010B2 (en) 1998-08-27

Family

ID=15657973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61157818A Expired - Lifetime JP2791010B2 (en) 1986-07-07 1986-07-07 Parallel processing unit

Country Status (1)

Country Link
JP (1) JP2791010B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04367963A (en) * 1991-06-15 1992-12-21 Hitachi Ltd Shared storage communication system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5199437A (en) * 1975-02-27 1976-09-02 Nippon Signal Co Ltd
JPS5415388A (en) * 1977-07-06 1979-02-05 Maruho Hatsujiyou Kougiyou Kk Surgical operational coupling clip assembly
JPS5436732A (en) * 1977-08-26 1979-03-17 Ricoh Co Ltd Device for controlling copying apparatus with plural micro-computer
JPS58149556A (en) * 1982-02-27 1983-09-05 Fujitsu Ltd Parallel processing device
JPS58213354A (en) * 1982-06-04 1983-12-12 Nec Corp Processor of pipeline control information
JPS60129845A (en) * 1983-12-16 1985-07-11 Fujitsu Ltd Control system of information processing device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5199437A (en) * 1975-02-27 1976-09-02 Nippon Signal Co Ltd
JPS5415388A (en) * 1977-07-06 1979-02-05 Maruho Hatsujiyou Kougiyou Kk Surgical operational coupling clip assembly
JPS5436732A (en) * 1977-08-26 1979-03-17 Ricoh Co Ltd Device for controlling copying apparatus with plural micro-computer
JPS58149556A (en) * 1982-02-27 1983-09-05 Fujitsu Ltd Parallel processing device
JPS58213354A (en) * 1982-06-04 1983-12-12 Nec Corp Processor of pipeline control information
JPS60129845A (en) * 1983-12-16 1985-07-11 Fujitsu Ltd Control system of information processing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04367963A (en) * 1991-06-15 1992-12-21 Hitachi Ltd Shared storage communication system

Also Published As

Publication number Publication date
JP2791010B2 (en) 1998-08-27

Similar Documents

Publication Publication Date Title
US8418180B2 (en) Thread priority method for ensuring processing fairness in simultaneous multi-threading microprocessors
US5459864A (en) Load balancing, error recovery, and reconfiguration control in a data movement subsystem with cooperating plural queue processors
US8108196B2 (en) System for yielding to a processor
US9164853B2 (en) Multi-core re-initialization failure control system
FI78993B (en) OEVERVAKARE AV DRIFTSYSTEM.
US9052957B2 (en) Method and system for conducting intensive multitask and multiflow calculation in real-time
JP4160925B2 (en) Method and system for communication between processing units in a multiprocessor computer system including a cross-chip communication mechanism in a distributed node topology
JPH0430053B2 (en)
GB2348306A (en) Batch processing of tasks in data processing systems
US7143271B2 (en) Automatic register backup/restore system and method
JPH04211838A (en) Method and apparatus for preventing returning risk
CN114168271B (en) Task scheduling method, electronic device and storage medium
JPS5955565A (en) Multi-firmware system
US7237088B2 (en) Methods and apparatus for providing context switching between software tasks with reconfigurable control
US6910153B2 (en) Method and system for recovery from a coupling facility failure without preallocating space
CN100538648C (en) Use based on specialized processing units on-the-fly modifies systematic parameter
JPS6315334A (en) Parallel processor
CN115777097A (en) Clearing register data
JP2001167058A (en) Information processor
JP5093242B2 (en) Information processing apparatus for performing self-diagnosis processing, self-diagnosis processing method, and self-diagnosis processing program
JP2685043B2 (en) Parallel processor
EP0851352B1 (en) Input/output control device and method applied to fault-resilient computer system
JP2003076671A (en) Fault containment and error handling in partitioned system with shared resources
US6915460B2 (en) Method, apparatus, and program for service processor surveillance with multiple partitions
JP4743414B2 (en) Information processing system, information processing method, and program