JPS6150359B2 - - Google Patents
Info
- Publication number
- JPS6150359B2 JPS6150359B2 JP14132480A JP14132480A JPS6150359B2 JP S6150359 B2 JPS6150359 B2 JP S6150359B2 JP 14132480 A JP14132480 A JP 14132480A JP 14132480 A JP14132480 A JP 14132480A JP S6150359 B2 JPS6150359 B2 JP S6150359B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- processing
- processing device
- command
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000004364 calculation method Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 description 13
- 238000007792 addition Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Advance Control (AREA)
- Multi Processors (AREA)
- Complex Calculations (AREA)
Description
本発明は、並列処理システム特に、並列処理装
置を構成する各処理装置(プロセツサエレメント
以下、略してPEと呼ぶ)が有するデータについ
て、全体の和とか最大値や最小値などを効率良く
求めるための並列処理システムに関する。 一般に、科学技術計算の分野では、ベクトルや
マトリクスのデータの演算を超高速で実行するこ
とが要求されている。これらの演算を超高速で実
行するために、並列処理システムがある。 この並列処理システムは第1図および第2図に
示すように制御装置CUと、この制御装置で制御
される複数の処理装置PEp〜PEn-1を含み、各処
理装置PE間が第1図に示すような適当な接続回
路網Nを通して接続されていたり、あるいは第2
図に示すように各処理装置PEから共通に参照で
きる共通メモリMが接続回路網Nを通して各処理
装置PEと接続されている。 各処理装置PEは制御装置CUとインタフエース
を持ち制御装置CUから実行すべき指令を受け取
ると一斉に指定された指令を実行する。 このような並列処理システムの代表的な従来例
としてILLIAC IVシステムがある。 従来の並列処理システムにおいては、例えば、
ベクトルの和 S
置を構成する各処理装置(プロセツサエレメント
以下、略してPEと呼ぶ)が有するデータについ
て、全体の和とか最大値や最小値などを効率良く
求めるための並列処理システムに関する。 一般に、科学技術計算の分野では、ベクトルや
マトリクスのデータの演算を超高速で実行するこ
とが要求されている。これらの演算を超高速で実
行するために、並列処理システムがある。 この並列処理システムは第1図および第2図に
示すように制御装置CUと、この制御装置で制御
される複数の処理装置PEp〜PEn-1を含み、各処
理装置PE間が第1図に示すような適当な接続回
路網Nを通して接続されていたり、あるいは第2
図に示すように各処理装置PEから共通に参照で
きる共通メモリMが接続回路網Nを通して各処理
装置PEと接続されている。 各処理装置PEは制御装置CUとインタフエース
を持ち制御装置CUから実行すべき指令を受け取
ると一斉に指定された指令を実行する。 このような並列処理システムの代表的な従来例
としてILLIAC IVシステムがある。 従来の並列処理システムにおいては、例えば、
ベクトルの和 S
【式】を求める場合を
考えてみる。
なお、以下の説明では処理装置PEの台数をm
=2L,n>mとし、各処理装置PEは0番から、
m−1までの処理装置番号が付けられているもの
とする。 このような場合には、まず最初に、各処理装置
PEは(a1,a2……,ao)なるベクトルを部分ベ
クトルに分割し、その部分ベクトルについて、部
分和sjを求める(j=0〜m−1)。 次に、各処理装置PEで求められた部分和sjの
総和
=2L,n>mとし、各処理装置PEは0番から、
m−1までの処理装置番号が付けられているもの
とする。 このような場合には、まず最初に、各処理装置
PEは(a1,a2……,ao)なるベクトルを部分ベ
クトルに分割し、その部分ベクトルについて、部
分和sjを求める(j=0〜m−1)。 次に、各処理装置PEで求められた部分和sjの
総和
【式】を求めることによつてベクト
ル和Sが求められるが、この
【式】を求める
方法として最も単純な方法は制御装置CUが各処
理装置PE内にある部分和Sjを各処理装置PEから
順に読み出して次々と加えていく方法がある。と
ころがこの方法では処理装置PEの数がmの場
合、m回の読み出しとm−1回の加算が必要であ
りベクトルの要素nが小さいときは並列処理によ
る高速実行の効果は小さくなる。 そこで、このような場合はILLIAC IVでも行
なわれているように、Tree Height Reducionと
呼ぶ方法が用いられる。 Tree Height Reductionではm台の処理装置
PEがあると、
理装置PE内にある部分和Sjを各処理装置PEから
順に読み出して次々と加えていく方法がある。と
ころがこの方法では処理装置PEの数がmの場
合、m回の読み出しとm−1回の加算が必要であ
りベクトルの要素nが小さいときは並列処理によ
る高速実行の効果は小さくなる。 そこで、このような場合はILLIAC IVでも行
なわれているように、Tree Height Reducionと
呼ぶ方法が用いられる。 Tree Height Reductionではm台の処理装置
PEがあると、
【式】の加算は実行回数L回
(L=log2m)で実行される。
Tree Height Reductionとは実行順番回数k回
目(0kL−1)では第3図に示すように
(第3図ではm=8の場合を示している。) まず最初に(k=0)、各処理装置PEではak=
2k・(mod・m)が計算され、(即ち、1)i番
目の処理装置PEではai=ak+iについて部分和
Sjを取り(すなわちPE0はPE1,PE1はPE2
……,PEm−1はPE0)、それをすでに求まつ
ている部分和に加算する。 次に(k=1)、各処理装置PEは同じようにし
て、2k(modm) (即ち、2)離れた処理装置
PEから、直前の部分和を取り出して同様に直前
の部分和に加算する。 このようにして、k=log2m−1のステツプま
で上記のことを繰り返すと、最後にすべての処理
装置PEに、ベクトル和Sとして、
目(0kL−1)では第3図に示すように
(第3図ではm=8の場合を示している。) まず最初に(k=0)、各処理装置PEではak=
2k・(mod・m)が計算され、(即ち、1)i番
目の処理装置PEではai=ak+iについて部分和
Sjを取り(すなわちPE0はPE1,PE1はPE2
……,PEm−1はPE0)、それをすでに求まつ
ている部分和に加算する。 次に(k=1)、各処理装置PEは同じようにし
て、2k(modm) (即ち、2)離れた処理装置
PEから、直前の部分和を取り出して同様に直前
の部分和に加算する。 このようにして、k=log2m−1のステツプま
で上記のことを繰り返すと、最後にすべての処理
装置PEに、ベクトル和Sとして、
【式】が求まる。
しかしながら、従来の並列処理システム(例え
ばILLIAC IV)では、上記の各処理ステツプの
実行に必要な制御情報や指令を、各演算毎に制御
装置CUから、すべての処理装置PEに個々に送出
して、行なつている。 すなわち、制御装置CUでは、まず実行回数L
=log2mを求め、最初の加算に必要なデータの格
納アドレスaiをai=ak+iとして各処理装置PE
ごとに送出し、第1回目のデータ取り出しと加算
指令を送出して加算を実行させる。このステツプ
を実行順番回数kごとに次々とL=log2m回繰り
返すことによつてベクトル和Sを求めている。 ところが、このような並列処理システムでは制
御装置CUと処理装置PE間の情報の転送量が多
く、かつ、頻繁に情報を転送する必要がある。 さらに、処理装置PEの個数が多くなると、す
べての処理装置PEのハードウエア量が多くなり
制御装置CUと処理装置PEの物理的な距離が離れ
るため、情報の転送速度が遅くなり、結果として
性能があまり上がらない。 また、制御装置CUと処理装置PE間の一度に転
送する情報量を増やすために転送幅(ビツト数)
を増やすことはコスト上好ましくない。 すなわち、従来の並列処理システムは、情報の
転送量ならびに転送回数が多くなるとともに処理
装置PEのハードウエア量が多くなるにもかかわ
らず性能が向上できないという欠点があつた。 本発明の目的は性能を向上できる並列処理シス
テムを提供することにある。 すなわち、本発明の目的は制御情報の転送回数
を削減して性能を向上できる並列処理システムを
提供することにある。 すなわち、本発明の目的は各処理装置PEが、
システム全体に存在する処理装置PEの処理装置
台数を保持するレジスタと、各処理装置PEの処
理装置番号とを備え、制御装置CUから、唯1回
の実行指令だけを送出することによつて、各処理
装置PEは前記処理装置台数と処理装置番号とか
ら、その指令の実行回数と各実行ステツプで必要
なデータの格納場所とを求めて、データを取り出
し、制御装置CUからの指令を実行することによ
つて、制御装置CUと処理装置PE間の情報の転送
回数及び1回の情報転送量を減らすことができる
ようにした並列処理システムを提供することにあ
る。 本発明の並列処理システムは、演算種別を含む
指令を発生する制御装置と前記指令が共通に供給
され動作する同一構成の2のべき乗個の処理装置
を含み、前記処理装置のそれぞれは、前記指令に
応じて動作する処理装置の台数を示す処理装置台
数mを保持する第1のレジスタと、i番目の処理
装置は処理装置番号i(0im−1)を保持
する第2のレジスタと、演算データを格納する第
3のレジスタと、前記処理台数mにもとずいて実
行回数L(L=log2m)を算出し実行順番回数k
(0kl−1)を逐次発生し前記実行順番回
数kと前記処理装置番号iにもとづいて読み出す
べきデータのデータアドレスaiを算出しかつ前
記演算種別に応じた演算を行なう演算部と、前記
実行順番回数kが新たに発生するごとに前記デー
タアドレスにより読み出した読出データと前記演
算データを前記演算種則の指示に従つて演算部で
演算せしめ演算結果を演算データとして再び前記
第3のレジスタに格納せしめる制御回路とを含ん
で構成される。 すなわち、本発明の並列処理システムは、制御
装置と該制御装置により制御される2のべき乗個
の処理装置を含み、前記処理装置は、システムに
存在する全処理装置の個数を示す処理装置台数を
記憶する第1のレジスタと、各処理装置を識別す
るための処理装置番号を記憶する第2のレジスタ
と、前記処理装置台数から実行回数と実行順番回
数を求め前記実行順番回数と前記処理装置数とか
らデータアドレスを求める。演算部と、前記指令
の実行に必要なデータアドレスにより前記指令に
必要なデータを取り出し、前記実行順番回数ごと
に指令を実行する制御回路を含んで構成される。 さらに本発明の並列処理システムは、前記制御
装置からの指令の実行に必要なデータが、各処理
装置内に存在する記憶装置にある場合、第1及び
第2のレジスタと前記指令の実行順番回数とから
前記指令の実行に必要なデータの存在する処理装
置番号を求める手段を有して構成される。 さらに、本発明の並列処理システムは、前記制
御装置からの指令の実行に必要なデータが前記複
数個の処理装置から共通に参照できる記憶装置に
ある場合、制御装置から、前記データの先頭番地
を全処理装置に送ることにより、前記データの先
頭番地と、前記第1及び第2のレジスタと、前記
指令の実行順番回数とから前記指令の実行に必要
なデータの格納場所を求める手段を有して構成さ
れる。 本発明の並列処理システムは、制御装置CUと
処理装置台数m台(m=2L)の処理装置PEを含
み、各々の処理装置PEは、前記処理装置台数m
を保持する第1のレジスタと各処理装置ごとに割
り当てられた処理装置番号を保持する第2のレジ
スタを備えている。各処理装置PEは制御装置CU
からの指令を受けとると、前記第1のレジスタに
保持されている処理装置台数mおよび第2のレジ
スタに保持されている処理装置番号から指令の実
行回数L(L=log2m)と、この指令の実行に必
要なデータの格納場所を求めることによつて、制
御装置CUからの以後の指令を必要とすることな
く、各処理装置PEが独立に必要なデータを取り
出して、前記指令を実行する。 制御装置CUからの指令を実行するために必要
なデータの格納場所は処理装置PEと記憶装置又
は処理装置PE相互の接続方式によつて異なつて
いる。 必要なデータが各処理装置PE内に存在する記
憶装置に格納されている場合、すなわち、各処理
装置PE間が接続回路網を通して接続されている
場合(第1図の構成の場合)は、そのデータが格
納されている処理装置番号を求める。 一方、制御装置CUからの指令の実行に必要な
データが各処理装置PEから共通にアクセスでき
る記憶装置に存在する場合、すなわち、各処理装
置PEは接続回路網を通して記憶装置に接続され
ている場合(第2図の構成の場合)は、制御装置
CUは、指令と共に、各処理装置PEにそのデータ
が格納されている記憶装置の先頭番地を送出し各
処理装置PEはその番地と前記第1のレジスタに
保持されている処理装置台数mおよび第2のレジ
スタに保持されている処理装置番号とから、前記
指令の実行に必要なデータの格納場所(格納番
地)を求める。 次に、本発明の実施例について、図面を参照し
て詳細に説明する。 第4図は、本発明の一実施例に含まれる一つの
処理装置PEを詳細に示すブロツク図である。 本発明の一実施例は、第4図に示す処理装置
PEが第1図あるいは第2図に示す処理装置PE0
〜PEm−1として2のべき乗個含まれている。 第4図においてNPRは処理装置台数を保持す
る処理装置台数保持レジスタであり、PNRは各
処理装置ごとに異なる処理装置番号を保持する処
理装置番号保持レジスタである。これらのレジス
タの値は、あらかじめ、制御装置CUからの指令
によつてセツトされているものとする。 第4図に示す実施例における処理装置PEの制
御はいわゆるマイクロプログラム制御方式を採用
している。すなわち、各処理装置PEは制御装置
CUからのコマンドを、コマンドレジスタCRは受
けとると、コマンドレジスタCRの上位ビツトで
示される指令をデコードするとともにその指令で
指定された制御記憶CMをアクセスし、その番地
から一連のマイクロ命令をマイクロ命令レジスタ
MIRに読み出し、次々とマイクロ命令で指定され
た制御手段に従がつて演算を実行する。 ALUは、加減算、シフトおよび論理演算など
を実行する演算ユニツトである。 第4図に示す実施例では示していないが、前記
演算ユニツトALUのほかに、浮動小数点演算
器、除算器、その他の特殊演算器を付加してもよ
いが、本発明には直接、関係しないので省略して
ある。 さらに、ACCは演算結果を保持するアキユム
レータであり、R0〜R7は8個の作業用レジス
タであり、MARはアドレスレジスタでメモリま
たは他の処理装置PEへの通信用のアドレスを保
持するレジスタで、MDRはデータレジスタで、
メモリまたは他の処理装置から送られてくるデー
タを保持するレジスタである。 次に、第4図に示した実施例による処理装置
PEの動作の一例として第3図に示す総和演算で
第2図に示す共通メモリMを含む場合について第
5図に示すフローチヤートを参照して具体的に説
明する。 まず、制御装置CUから総和演算を指示する指
令がコマンドレジスタ4に受け取られると、その
指令で示される番地bを開始番地として、制御記
憶CMの中にあるマイクロプログラムが次々と実
行される。 第5図に示す流れ図は第4図に示す処理装置
PEの動作を示すものである。 第5図においてR0〜R7は演算結果の中間状
態を保持する作業用レジスタ、NPRは構成され
ている処理装置台数mを保持する処理台数保持レ
ジスタ、PNRは処理装置番号iを保持する処理
装置番号保持レジスタ、MARはメモリアドレス
を保持するアドレスレジスタをそれぞれ示してい
る。ACCは演算結果を保持するアキユムレータ
である。 以下、第5図の動作を順に説明するがすべての
処理装置PEのそれぞれに含まれるアキユムレー
タACCの内容をすべて加算して結果がすべての
処理装置PEのそれぞれのアキユムレータACCに
求められる場合を示す。すなわち、S=Σaiを
求める場合である。制御装置CUからの指令とし
ては第5図を用いて説明する総和演算の他に最大
値や最小値を求めたり内積演算を行なう指令など
種々のものが考えられる。 第5図において、動作ステツプS2〜S6は、
制御装置CUから1つの指令が与えられたときに
くりかえし実行を行なうときの実行回数を求める
部分、動作ステツプS7〜S11は初期設定、動
作ステツプS12〜S16は指令の実行に必要な
データの格納場所を求める部分、動作ステツプS
17〜S19はデータを読み出して、指令で指定
された演算を実行して結果を格納する部分、動作
ステツプS20〜S21は指令の繰返回数を計数
する部分である。 各処理装置PEは動作ステツプS1で、制御装
置CUからの指令を受けると、動作ステツプS2
〜S6で、処理装置台数保持レジスタNPRに保
持されている処理装置台数mからこの指令の実行
回数LをL=log2mにより求める。この求め方は
m=21であるから処理装置台数保持レジスタ
NPR中のビツトが“1”であるビツト位置(最
下位ビツトからのビツト位置)を求めれば良い。
したがつて処理装置台数保持レジスタNPRに保
持した処理装置台数mを右へ1ビツトずつシフト
し、シフトアウトビツトを最上位ビツトに入れる
演算(Right Rotation)を動作ステツプS5で実
行しこれを最上位ビツトが“1”になるまで行な
い、その時までのシフト数をカウントすれば良
い。すなわち、第5図のフローでは作業用レジス
タR1の内容が実行回数Lとして求まつている。 第5図のフローチヤートで示される動作ステツ
プS2〜S6を行なうマイクロ命令を実行するこ
とによつて処理装置台数保持レジスタNPRから
処理装置台数mとして“8”が作業用レジスタR
0にロードされ、作業用レジスタR0の内容を演
算ユニツトALUでシフトし、作業用レジスタR
0の先頭ビツトが“1”であるかどうかを調べる
ことにより作業用レジスタR1に、制御装置CU
からの令をくりかえし実行するための実行回数L
が求まる。動作ステツプS2〜S6で必要な加算
シフトなどは制御記憶CMからマイクロ命令レジ
スタMIRに読み出されたマイクロ命令の制御によ
り演算ユニツトALUで実行される。 次に動作ステツプS7〜S11までは初期設定
部分であるが動作ステツプS7では指令の実行に
必要なデータの格納場所を求める際に使用される
Modulo演算のためのマスクビツトを発生してい
る。すなわち、作業用レジスタR0中に下位1ビ
ツトが“1”、残りの上位ビツトが“0”である
マスクビツトを作つている。これは例えば、作業
用レジスタR0中にすべて“1”のデータを格納
し左へ1ビツトシフトし、次に、その値の“0”
と“1”を反転する演算を行なうことにによつて
得られる。 動作ステツプS8における作業用レジスタR2
は指令の実行順番回数kをカウントするカウンタ
として使用する(初期値は0)。動作ステツプS
9における作業用レジスタR3は各処理装置PE
から見たデータの相対的な格納場所を保持するレ
ジスタとして使用する。初期値は第1回目の演算
は各処理装置PEのすぐ隣りの処理装置すなわち
処理装置番号iが1つ多い処理装置PEが求めた
データを当該処理装置が使用するので“1”であ
る。動作ステツプS10,S11は、第1図に示
したように、処理装置PE間が相互に結ばれてい
る構成では不要であるが、第2図に示した構成で
は必要なステツプであり、制御装置CUからの指
令により与えられた共通メモリMに格納されてい
るデータの先頭番地bに処理装置番号保持レジス
タPNRが保持した処理装置番号iを加えること
によつてデータ格納番地を求め、その番地の内容
を動作ステツプS11で読み出すことによつて演
算すべきデータをアキユムレータACCにロード
している。 すなわち、動作ステツプS7〜S11の初期設
定部分も、制御メモリCMから読み出したマイク
ロ命令の制御にしたがつて演算ユニツトALUの
加算、シフトおよび論理演算の機能を達成させる
ことによつて、必要な値が作業用レジスタR0,
R2,R3,R7,およびアドレスレジスタ
MARにセツトされる。演算実行に必要な共通メ
モリMのアドレスが、アドレスレジスタMARに
セツトされるとアクセス要求を共通メモリMに出
すことによつてそのデータが、処理装置PEと共
通メモリMの接続回路網Nを通してデータレジス
タMDRにロードされる。さらに、データレジス
タMDRの内容はアキユムレータACCへのパスを
通してアキユムレータACCにロードされる。こ
れが第5図の動作ステツプS11の操作である。 次に、動作ステツプS12〜S20の操作も、
演算ユニツトALUで加算、シフトおよび論理演
算機能が達成されることによつて同様に実行され
る。 すなわち、動作ステツプS12では作業用レジ
スタR3の内容を作業用レジスタR2で示される
ビツト数だけ左シフトすることによつて各実行ス
テツプで必要なデータの処理装置PEから見た相
対位置を求めている。すなわち、第j番目の実行
ステツプでは相対位置=2jであり、これは左シ
フトにより求められる。 動作ステツプS13では動作ステツプS12で
求めたデータの相対位置と処理装置番号iを加え
ることによつて、データの絶対位置を求めている
が、この位置は処理装置台数mのモジユロ演算で
ある必要がある。すなわち、処理装置PE0から
の相対位置が処理装置台数mを超えるときは再び
0番目の処理装置PE0からの距離(相対位置)
にする必要がある。 これを行なうために動作ステツプS14で作業
用レジスタR3と先に求めた作業用レジスタR0
に格納されているマスクビツトとの論理積をとつ
ている。 動作ステツプS15は、第1図の構成のシステ
ムでは不要であり、その代りに、作業用レジスタ
R3の内容をアドレスレジスタMARに格納させ
る処理を行う。第2図の構成では、データの先頭
番地bとの加算を行うことによつて、共通メモリ
Mの中のデータの番地を求めている。 動作ステツプS16では第1図の構成のシステ
ムではアドレスレジスタMARで示される処理装
置PEから、第2図の構成のシステムでは共通メ
モリMから必要なデータを読み出し、作業用レジ
スタR4に格納する。 動作ステツプS17は制御装置CUから指定さ
れた指令を実行する動作ステツプであり、本例で
は加算を示している。 動作ステツプS18,S19は結果の格納ステ
ツプであり、第2図の構成のシステムでのみ必要
な動作ステツプである。すなわち、動作ステツプ
S10により求めた共通メモリMの番地に結果を
格納する。 動作ステツプS20では指令の実行順番回数k
をカウントし(1を加え)、 第5図の動作ステツプS21では制御記憶CM
からのマイクロ命令により演算ユニツトALUで
比較動作が行なわれ、さらに処理を繰り返す場合
は動作ステツプS12で示されるマイクロ命令へ
ジヤンプする。そうでなければ、処理は終了であ
り、このときは、アキユムレータACCに最終結
果が求められている。 すなわち、動作ステツプS21で、動作ステツ
プS2〜S6で求めた作業用レジスタR1(L=
log2m)に格納された実行回数Lと作業用レジス
タR2に格納された実行順番回数kとを比較し、
実行回数Lだけ実行したら処理は終了し、結果は
アキユムレータACCに求まつている。そうでな
ければ、動作ステツプS12からの処理を繰り返
す。 以上の動作により、制御装置CUから指定され
た指令が実行され、すべての処理装置PEにその
結果が求まることになる。 上述の実施例の説明では、総和演算を行なう場
合について説明したが制御装置CUから供給され
る指令が総和演算でないときにはその指令に従つ
て指令指示演算が行なわれる。このような指令指
示演算としては、最小値算出演算や、最大値算出
演算、あるいは内積演算などがある。 また、上述の実施例の説明では、演算データが
第2図に示すように、共通メモリMに格納されて
いる場合について説明した演算データが第1図に
示すように処理装置PEのそれぞれに格納されて
いる場合でも本発明は適用できるものである。 さらにまた、処理装置内部の動作は上述の実施
例の説明では、制御記憶CMに格納されたマイク
ロ命令によつて制御される場合について説明した
が、これはマイクロプログラム制御に限らず、通
常のハードウエア論理による制御であつてもかま
わずいずれにしても制御回路としての制御動作と
して制御される。 さらにまた、上述の実施例では演算はすべて演
算ユニツトALUで行なわれる場合について説明
したが、実行回数L、実行順番回数k、データ格
納アドレスaiの作成のための演算と、制御装置
CUから指示される。指令指示演算とを別個の演
算ユニツトで達成してもよく、また、指令指示演
算の種類に応じていくつかの別個の特別の演算ユ
ニツトを設けて指令指示演算の種類に応じて使い
わけてもよい。 さらにまた、上述の実施例では、演算はデータ
アドレスで示される読出データをアキユムレータ
ACCに格納した演算データと演算する場合につ
いて説明したが、演算データはランダムアクセス
メモリなどの内部記憶に格納されているものを使
用してもよい。この場合演算データレジスタとし
ては、内部記憶の所定番地が使用されることとな
る。 本発明の並列処理システムは、2のべき乗個の
同一様式の処理装置のそれぞれに、処理装置台数
を保持するレジスタと、処理装置番号を保持する
レジスタとを追加することにより、指令に含まれ
る演算種別に応じた演算が完了するごとに新たな
各処理装置ごとの指令を供給する代りに、最初に
各処理装置に共通な指令を供給してデータアドレ
スなどの制御指令を各処理装置で逐次算出できる
ので制御情報の転送回数が削減でき性能が向上す
るという効果がある。 本発明は、以上説明したように、CUからの一
度の指令で、その指令に必要な実行回数と実行に
必要なデータの格納場所を各PEが求めるように
構成することによりCUとPEの情報転送回数を少
なくし、かつ一回の情報転送量を少なくすること
によつて、全体の処理性能を上げることができる
という効果がある。
ばILLIAC IV)では、上記の各処理ステツプの
実行に必要な制御情報や指令を、各演算毎に制御
装置CUから、すべての処理装置PEに個々に送出
して、行なつている。 すなわち、制御装置CUでは、まず実行回数L
=log2mを求め、最初の加算に必要なデータの格
納アドレスaiをai=ak+iとして各処理装置PE
ごとに送出し、第1回目のデータ取り出しと加算
指令を送出して加算を実行させる。このステツプ
を実行順番回数kごとに次々とL=log2m回繰り
返すことによつてベクトル和Sを求めている。 ところが、このような並列処理システムでは制
御装置CUと処理装置PE間の情報の転送量が多
く、かつ、頻繁に情報を転送する必要がある。 さらに、処理装置PEの個数が多くなると、す
べての処理装置PEのハードウエア量が多くなり
制御装置CUと処理装置PEの物理的な距離が離れ
るため、情報の転送速度が遅くなり、結果として
性能があまり上がらない。 また、制御装置CUと処理装置PE間の一度に転
送する情報量を増やすために転送幅(ビツト数)
を増やすことはコスト上好ましくない。 すなわち、従来の並列処理システムは、情報の
転送量ならびに転送回数が多くなるとともに処理
装置PEのハードウエア量が多くなるにもかかわ
らず性能が向上できないという欠点があつた。 本発明の目的は性能を向上できる並列処理シス
テムを提供することにある。 すなわち、本発明の目的は制御情報の転送回数
を削減して性能を向上できる並列処理システムを
提供することにある。 すなわち、本発明の目的は各処理装置PEが、
システム全体に存在する処理装置PEの処理装置
台数を保持するレジスタと、各処理装置PEの処
理装置番号とを備え、制御装置CUから、唯1回
の実行指令だけを送出することによつて、各処理
装置PEは前記処理装置台数と処理装置番号とか
ら、その指令の実行回数と各実行ステツプで必要
なデータの格納場所とを求めて、データを取り出
し、制御装置CUからの指令を実行することによ
つて、制御装置CUと処理装置PE間の情報の転送
回数及び1回の情報転送量を減らすことができる
ようにした並列処理システムを提供することにあ
る。 本発明の並列処理システムは、演算種別を含む
指令を発生する制御装置と前記指令が共通に供給
され動作する同一構成の2のべき乗個の処理装置
を含み、前記処理装置のそれぞれは、前記指令に
応じて動作する処理装置の台数を示す処理装置台
数mを保持する第1のレジスタと、i番目の処理
装置は処理装置番号i(0im−1)を保持
する第2のレジスタと、演算データを格納する第
3のレジスタと、前記処理台数mにもとずいて実
行回数L(L=log2m)を算出し実行順番回数k
(0kl−1)を逐次発生し前記実行順番回
数kと前記処理装置番号iにもとづいて読み出す
べきデータのデータアドレスaiを算出しかつ前
記演算種別に応じた演算を行なう演算部と、前記
実行順番回数kが新たに発生するごとに前記デー
タアドレスにより読み出した読出データと前記演
算データを前記演算種則の指示に従つて演算部で
演算せしめ演算結果を演算データとして再び前記
第3のレジスタに格納せしめる制御回路とを含ん
で構成される。 すなわち、本発明の並列処理システムは、制御
装置と該制御装置により制御される2のべき乗個
の処理装置を含み、前記処理装置は、システムに
存在する全処理装置の個数を示す処理装置台数を
記憶する第1のレジスタと、各処理装置を識別す
るための処理装置番号を記憶する第2のレジスタ
と、前記処理装置台数から実行回数と実行順番回
数を求め前記実行順番回数と前記処理装置数とか
らデータアドレスを求める。演算部と、前記指令
の実行に必要なデータアドレスにより前記指令に
必要なデータを取り出し、前記実行順番回数ごと
に指令を実行する制御回路を含んで構成される。 さらに本発明の並列処理システムは、前記制御
装置からの指令の実行に必要なデータが、各処理
装置内に存在する記憶装置にある場合、第1及び
第2のレジスタと前記指令の実行順番回数とから
前記指令の実行に必要なデータの存在する処理装
置番号を求める手段を有して構成される。 さらに、本発明の並列処理システムは、前記制
御装置からの指令の実行に必要なデータが前記複
数個の処理装置から共通に参照できる記憶装置に
ある場合、制御装置から、前記データの先頭番地
を全処理装置に送ることにより、前記データの先
頭番地と、前記第1及び第2のレジスタと、前記
指令の実行順番回数とから前記指令の実行に必要
なデータの格納場所を求める手段を有して構成さ
れる。 本発明の並列処理システムは、制御装置CUと
処理装置台数m台(m=2L)の処理装置PEを含
み、各々の処理装置PEは、前記処理装置台数m
を保持する第1のレジスタと各処理装置ごとに割
り当てられた処理装置番号を保持する第2のレジ
スタを備えている。各処理装置PEは制御装置CU
からの指令を受けとると、前記第1のレジスタに
保持されている処理装置台数mおよび第2のレジ
スタに保持されている処理装置番号から指令の実
行回数L(L=log2m)と、この指令の実行に必
要なデータの格納場所を求めることによつて、制
御装置CUからの以後の指令を必要とすることな
く、各処理装置PEが独立に必要なデータを取り
出して、前記指令を実行する。 制御装置CUからの指令を実行するために必要
なデータの格納場所は処理装置PEと記憶装置又
は処理装置PE相互の接続方式によつて異なつて
いる。 必要なデータが各処理装置PE内に存在する記
憶装置に格納されている場合、すなわち、各処理
装置PE間が接続回路網を通して接続されている
場合(第1図の構成の場合)は、そのデータが格
納されている処理装置番号を求める。 一方、制御装置CUからの指令の実行に必要な
データが各処理装置PEから共通にアクセスでき
る記憶装置に存在する場合、すなわち、各処理装
置PEは接続回路網を通して記憶装置に接続され
ている場合(第2図の構成の場合)は、制御装置
CUは、指令と共に、各処理装置PEにそのデータ
が格納されている記憶装置の先頭番地を送出し各
処理装置PEはその番地と前記第1のレジスタに
保持されている処理装置台数mおよび第2のレジ
スタに保持されている処理装置番号とから、前記
指令の実行に必要なデータの格納場所(格納番
地)を求める。 次に、本発明の実施例について、図面を参照し
て詳細に説明する。 第4図は、本発明の一実施例に含まれる一つの
処理装置PEを詳細に示すブロツク図である。 本発明の一実施例は、第4図に示す処理装置
PEが第1図あるいは第2図に示す処理装置PE0
〜PEm−1として2のべき乗個含まれている。 第4図においてNPRは処理装置台数を保持す
る処理装置台数保持レジスタであり、PNRは各
処理装置ごとに異なる処理装置番号を保持する処
理装置番号保持レジスタである。これらのレジス
タの値は、あらかじめ、制御装置CUからの指令
によつてセツトされているものとする。 第4図に示す実施例における処理装置PEの制
御はいわゆるマイクロプログラム制御方式を採用
している。すなわち、各処理装置PEは制御装置
CUからのコマンドを、コマンドレジスタCRは受
けとると、コマンドレジスタCRの上位ビツトで
示される指令をデコードするとともにその指令で
指定された制御記憶CMをアクセスし、その番地
から一連のマイクロ命令をマイクロ命令レジスタ
MIRに読み出し、次々とマイクロ命令で指定され
た制御手段に従がつて演算を実行する。 ALUは、加減算、シフトおよび論理演算など
を実行する演算ユニツトである。 第4図に示す実施例では示していないが、前記
演算ユニツトALUのほかに、浮動小数点演算
器、除算器、その他の特殊演算器を付加してもよ
いが、本発明には直接、関係しないので省略して
ある。 さらに、ACCは演算結果を保持するアキユム
レータであり、R0〜R7は8個の作業用レジス
タであり、MARはアドレスレジスタでメモリま
たは他の処理装置PEへの通信用のアドレスを保
持するレジスタで、MDRはデータレジスタで、
メモリまたは他の処理装置から送られてくるデー
タを保持するレジスタである。 次に、第4図に示した実施例による処理装置
PEの動作の一例として第3図に示す総和演算で
第2図に示す共通メモリMを含む場合について第
5図に示すフローチヤートを参照して具体的に説
明する。 まず、制御装置CUから総和演算を指示する指
令がコマンドレジスタ4に受け取られると、その
指令で示される番地bを開始番地として、制御記
憶CMの中にあるマイクロプログラムが次々と実
行される。 第5図に示す流れ図は第4図に示す処理装置
PEの動作を示すものである。 第5図においてR0〜R7は演算結果の中間状
態を保持する作業用レジスタ、NPRは構成され
ている処理装置台数mを保持する処理台数保持レ
ジスタ、PNRは処理装置番号iを保持する処理
装置番号保持レジスタ、MARはメモリアドレス
を保持するアドレスレジスタをそれぞれ示してい
る。ACCは演算結果を保持するアキユムレータ
である。 以下、第5図の動作を順に説明するがすべての
処理装置PEのそれぞれに含まれるアキユムレー
タACCの内容をすべて加算して結果がすべての
処理装置PEのそれぞれのアキユムレータACCに
求められる場合を示す。すなわち、S=Σaiを
求める場合である。制御装置CUからの指令とし
ては第5図を用いて説明する総和演算の他に最大
値や最小値を求めたり内積演算を行なう指令など
種々のものが考えられる。 第5図において、動作ステツプS2〜S6は、
制御装置CUから1つの指令が与えられたときに
くりかえし実行を行なうときの実行回数を求める
部分、動作ステツプS7〜S11は初期設定、動
作ステツプS12〜S16は指令の実行に必要な
データの格納場所を求める部分、動作ステツプS
17〜S19はデータを読み出して、指令で指定
された演算を実行して結果を格納する部分、動作
ステツプS20〜S21は指令の繰返回数を計数
する部分である。 各処理装置PEは動作ステツプS1で、制御装
置CUからの指令を受けると、動作ステツプS2
〜S6で、処理装置台数保持レジスタNPRに保
持されている処理装置台数mからこの指令の実行
回数LをL=log2mにより求める。この求め方は
m=21であるから処理装置台数保持レジスタ
NPR中のビツトが“1”であるビツト位置(最
下位ビツトからのビツト位置)を求めれば良い。
したがつて処理装置台数保持レジスタNPRに保
持した処理装置台数mを右へ1ビツトずつシフト
し、シフトアウトビツトを最上位ビツトに入れる
演算(Right Rotation)を動作ステツプS5で実
行しこれを最上位ビツトが“1”になるまで行な
い、その時までのシフト数をカウントすれば良
い。すなわち、第5図のフローでは作業用レジス
タR1の内容が実行回数Lとして求まつている。 第5図のフローチヤートで示される動作ステツ
プS2〜S6を行なうマイクロ命令を実行するこ
とによつて処理装置台数保持レジスタNPRから
処理装置台数mとして“8”が作業用レジスタR
0にロードされ、作業用レジスタR0の内容を演
算ユニツトALUでシフトし、作業用レジスタR
0の先頭ビツトが“1”であるかどうかを調べる
ことにより作業用レジスタR1に、制御装置CU
からの令をくりかえし実行するための実行回数L
が求まる。動作ステツプS2〜S6で必要な加算
シフトなどは制御記憶CMからマイクロ命令レジ
スタMIRに読み出されたマイクロ命令の制御によ
り演算ユニツトALUで実行される。 次に動作ステツプS7〜S11までは初期設定
部分であるが動作ステツプS7では指令の実行に
必要なデータの格納場所を求める際に使用される
Modulo演算のためのマスクビツトを発生してい
る。すなわち、作業用レジスタR0中に下位1ビ
ツトが“1”、残りの上位ビツトが“0”である
マスクビツトを作つている。これは例えば、作業
用レジスタR0中にすべて“1”のデータを格納
し左へ1ビツトシフトし、次に、その値の“0”
と“1”を反転する演算を行なうことにによつて
得られる。 動作ステツプS8における作業用レジスタR2
は指令の実行順番回数kをカウントするカウンタ
として使用する(初期値は0)。動作ステツプS
9における作業用レジスタR3は各処理装置PE
から見たデータの相対的な格納場所を保持するレ
ジスタとして使用する。初期値は第1回目の演算
は各処理装置PEのすぐ隣りの処理装置すなわち
処理装置番号iが1つ多い処理装置PEが求めた
データを当該処理装置が使用するので“1”であ
る。動作ステツプS10,S11は、第1図に示
したように、処理装置PE間が相互に結ばれてい
る構成では不要であるが、第2図に示した構成で
は必要なステツプであり、制御装置CUからの指
令により与えられた共通メモリMに格納されてい
るデータの先頭番地bに処理装置番号保持レジス
タPNRが保持した処理装置番号iを加えること
によつてデータ格納番地を求め、その番地の内容
を動作ステツプS11で読み出すことによつて演
算すべきデータをアキユムレータACCにロード
している。 すなわち、動作ステツプS7〜S11の初期設
定部分も、制御メモリCMから読み出したマイク
ロ命令の制御にしたがつて演算ユニツトALUの
加算、シフトおよび論理演算の機能を達成させる
ことによつて、必要な値が作業用レジスタR0,
R2,R3,R7,およびアドレスレジスタ
MARにセツトされる。演算実行に必要な共通メ
モリMのアドレスが、アドレスレジスタMARに
セツトされるとアクセス要求を共通メモリMに出
すことによつてそのデータが、処理装置PEと共
通メモリMの接続回路網Nを通してデータレジス
タMDRにロードされる。さらに、データレジス
タMDRの内容はアキユムレータACCへのパスを
通してアキユムレータACCにロードされる。こ
れが第5図の動作ステツプS11の操作である。 次に、動作ステツプS12〜S20の操作も、
演算ユニツトALUで加算、シフトおよび論理演
算機能が達成されることによつて同様に実行され
る。 すなわち、動作ステツプS12では作業用レジ
スタR3の内容を作業用レジスタR2で示される
ビツト数だけ左シフトすることによつて各実行ス
テツプで必要なデータの処理装置PEから見た相
対位置を求めている。すなわち、第j番目の実行
ステツプでは相対位置=2jであり、これは左シ
フトにより求められる。 動作ステツプS13では動作ステツプS12で
求めたデータの相対位置と処理装置番号iを加え
ることによつて、データの絶対位置を求めている
が、この位置は処理装置台数mのモジユロ演算で
ある必要がある。すなわち、処理装置PE0から
の相対位置が処理装置台数mを超えるときは再び
0番目の処理装置PE0からの距離(相対位置)
にする必要がある。 これを行なうために動作ステツプS14で作業
用レジスタR3と先に求めた作業用レジスタR0
に格納されているマスクビツトとの論理積をとつ
ている。 動作ステツプS15は、第1図の構成のシステ
ムでは不要であり、その代りに、作業用レジスタ
R3の内容をアドレスレジスタMARに格納させ
る処理を行う。第2図の構成では、データの先頭
番地bとの加算を行うことによつて、共通メモリ
Mの中のデータの番地を求めている。 動作ステツプS16では第1図の構成のシステ
ムではアドレスレジスタMARで示される処理装
置PEから、第2図の構成のシステムでは共通メ
モリMから必要なデータを読み出し、作業用レジ
スタR4に格納する。 動作ステツプS17は制御装置CUから指定さ
れた指令を実行する動作ステツプであり、本例で
は加算を示している。 動作ステツプS18,S19は結果の格納ステ
ツプであり、第2図の構成のシステムでのみ必要
な動作ステツプである。すなわち、動作ステツプ
S10により求めた共通メモリMの番地に結果を
格納する。 動作ステツプS20では指令の実行順番回数k
をカウントし(1を加え)、 第5図の動作ステツプS21では制御記憶CM
からのマイクロ命令により演算ユニツトALUで
比較動作が行なわれ、さらに処理を繰り返す場合
は動作ステツプS12で示されるマイクロ命令へ
ジヤンプする。そうでなければ、処理は終了であ
り、このときは、アキユムレータACCに最終結
果が求められている。 すなわち、動作ステツプS21で、動作ステツ
プS2〜S6で求めた作業用レジスタR1(L=
log2m)に格納された実行回数Lと作業用レジス
タR2に格納された実行順番回数kとを比較し、
実行回数Lだけ実行したら処理は終了し、結果は
アキユムレータACCに求まつている。そうでな
ければ、動作ステツプS12からの処理を繰り返
す。 以上の動作により、制御装置CUから指定され
た指令が実行され、すべての処理装置PEにその
結果が求まることになる。 上述の実施例の説明では、総和演算を行なう場
合について説明したが制御装置CUから供給され
る指令が総和演算でないときにはその指令に従つ
て指令指示演算が行なわれる。このような指令指
示演算としては、最小値算出演算や、最大値算出
演算、あるいは内積演算などがある。 また、上述の実施例の説明では、演算データが
第2図に示すように、共通メモリMに格納されて
いる場合について説明した演算データが第1図に
示すように処理装置PEのそれぞれに格納されて
いる場合でも本発明は適用できるものである。 さらにまた、処理装置内部の動作は上述の実施
例の説明では、制御記憶CMに格納されたマイク
ロ命令によつて制御される場合について説明した
が、これはマイクロプログラム制御に限らず、通
常のハードウエア論理による制御であつてもかま
わずいずれにしても制御回路としての制御動作と
して制御される。 さらにまた、上述の実施例では演算はすべて演
算ユニツトALUで行なわれる場合について説明
したが、実行回数L、実行順番回数k、データ格
納アドレスaiの作成のための演算と、制御装置
CUから指示される。指令指示演算とを別個の演
算ユニツトで達成してもよく、また、指令指示演
算の種類に応じていくつかの別個の特別の演算ユ
ニツトを設けて指令指示演算の種類に応じて使い
わけてもよい。 さらにまた、上述の実施例では、演算はデータ
アドレスで示される読出データをアキユムレータ
ACCに格納した演算データと演算する場合につ
いて説明したが、演算データはランダムアクセス
メモリなどの内部記憶に格納されているものを使
用してもよい。この場合演算データレジスタとし
ては、内部記憶の所定番地が使用されることとな
る。 本発明の並列処理システムは、2のべき乗個の
同一様式の処理装置のそれぞれに、処理装置台数
を保持するレジスタと、処理装置番号を保持する
レジスタとを追加することにより、指令に含まれ
る演算種別に応じた演算が完了するごとに新たな
各処理装置ごとの指令を供給する代りに、最初に
各処理装置に共通な指令を供給してデータアドレ
スなどの制御指令を各処理装置で逐次算出できる
ので制御情報の転送回数が削減でき性能が向上す
るという効果がある。 本発明は、以上説明したように、CUからの一
度の指令で、その指令に必要な実行回数と実行に
必要なデータの格納場所を各PEが求めるように
構成することによりCUとPEの情報転送回数を少
なくし、かつ一回の情報転送量を少なくすること
によつて、全体の処理性能を上げることができる
という効果がある。
第1図は本発明および従来の並列処理システム
を示す一例の概略構成図で各処理装置PEが接続
回路網Nを通してお互いに接続されていることを
示す概略構成図、第2図は本発明および従来の並
列処理システムを示す他の例の概略構成図で、各
処理装置PEから共通に参照できるメモリMが接
続回路網Nを通して接続されていることを示す概
略構成図、第3図は第1図ならびに第2図に示す
並列処理システムおいて各処理装置PEがデータ
S0,S1,……S7の総和
を示す一例の概略構成図で各処理装置PEが接続
回路網Nを通してお互いに接続されていることを
示す概略構成図、第2図は本発明および従来の並
列処理システムを示す他の例の概略構成図で、各
処理装置PEから共通に参照できるメモリMが接
続回路網Nを通して接続されていることを示す概
略構成図、第3図は第1図ならびに第2図に示す
並列処理システムおいて各処理装置PEがデータ
S0,S1,……S7の総和
【式】を求めるとき
の動作フローおよびデータフローを説明するため
の説明図、第4図は本発明の一実施例に含まれる
一つの処理装置PEを詳細に示すブロツク図、第
5図は、第3図に示す処理装置PEの一例の動作
フローの詳細ステツプを示フローチヤートであ
る。 CU……制御装置、PE,PE0〜PEm−1……
処理装置、N……接続回路網、M……共通メモ
リ、NPR……処理装置台数保持レジスタ、PNR
……処理装置番号保持レジスタ、ALU……演算
ユニツト、CR……コマンドレジスタ、CM……
制御記憶、MIR……マイクロ命令レジスタ、
ACC……アキユムレータ、R0〜R7……作業
用レジスタ、MAR……アドレスレジスタ、MDR
……データレジスタ、m……処理装置台数、i…
…処理装置番号、L……実行回数、k……実行順
番回数、aiデータアドレス。
の説明図、第4図は本発明の一実施例に含まれる
一つの処理装置PEを詳細に示すブロツク図、第
5図は、第3図に示す処理装置PEの一例の動作
フローの詳細ステツプを示フローチヤートであ
る。 CU……制御装置、PE,PE0〜PEm−1……
処理装置、N……接続回路網、M……共通メモ
リ、NPR……処理装置台数保持レジスタ、PNR
……処理装置番号保持レジスタ、ALU……演算
ユニツト、CR……コマンドレジスタ、CM……
制御記憶、MIR……マイクロ命令レジスタ、
ACC……アキユムレータ、R0〜R7……作業
用レジスタ、MAR……アドレスレジスタ、MDR
……データレジスタ、m……処理装置台数、i…
…処理装置番号、L……実行回数、k……実行順
番回数、aiデータアドレス。
Claims (1)
- 1 演算種別を含む指令を発生する制御装置と前
記指令が共通に供給され動作する同一構成の2の
べき乗個の処理装置を含み、前記処理装置のそれ
ぞれは、前記指令に応じて動作する処理装置の台
数を示す処理装置台数mを保持する第1のレジス
タと、i番目の処理装置は処理装置番号i(0
im−1)を保持する第2のレジスタと、演算
データを格納する第3のレジスタと、前記処理台
数mにもとずいて実行回線L(L=log2m)を算
出し実行順番回数k(0kL−1)を遂次発
生し前記実行順番回数kと前記処理装置番号iに
もとづいて読み出すべきデータのデータアドレス
aiを算出しかつ前記演算種別に応じた演算を行な
う演算部と、前記実行順番回数kが新たに発生す
るごとに前記データアドレスaiにより読み出した
読出データと前記演算データを前記演算種別の指
示に従つて演算部で演算せしめ演算結果を演算デ
ータとして再び前記第3のレジスタに格納せしめ
る制御回路とを含むことを特徴とする並列処理シ
ステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14132480A JPS5764860A (en) | 1980-10-09 | 1980-10-09 | Parallel processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14132480A JPS5764860A (en) | 1980-10-09 | 1980-10-09 | Parallel processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5764860A JPS5764860A (en) | 1982-04-20 |
JPS6150359B2 true JPS6150359B2 (ja) | 1986-11-04 |
Family
ID=15289270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14132480A Granted JPS5764860A (en) | 1980-10-09 | 1980-10-09 | Parallel processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5764860A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04225449A (ja) * | 1990-12-27 | 1992-08-14 | Nec Eng Ltd | 障害検出処理方式 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58186848A (ja) * | 1982-04-23 | 1983-10-31 | Oki Electric Ind Co Ltd | デ−タフロ−処理方式 |
JPH0658665B2 (ja) * | 1982-05-21 | 1994-08-03 | 株式会社日立製作所 | イメージ信号処理装置 |
JPS6226579A (ja) * | 1985-07-26 | 1987-02-04 | Nec Corp | ベクトル総和演算装置 |
NL194564C (nl) * | 1987-11-10 | 2002-07-02 | Echelon Systems | Intelligente multiprocessorcel voor een netwerk dat voorziet in waarneming, communicaties in twee richtingen en besturing. |
JPH07129521A (ja) * | 1993-01-11 | 1995-05-19 | Nec Corp | 並列処理方式 |
-
1980
- 1980-10-09 JP JP14132480A patent/JPS5764860A/ja active Granted
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04225449A (ja) * | 1990-12-27 | 1992-08-14 | Nec Eng Ltd | 障害検出処理方式 |
Also Published As
Publication number | Publication date |
---|---|
JPS5764860A (en) | 1982-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5408626A (en) | One clock address pipelining in segmentation unit | |
US4361868A (en) | Device for increasing the length of a logic computer address | |
EP0148478B1 (en) | A data processor with control of the significant bit lenghts of general purpose registers | |
US3680058A (en) | Information processing system having free field storage for nested processes | |
US5210839A (en) | Method and apparatus for providing a memory address from a computer instruction using a mask register | |
US3754218A (en) | Data handling system with relocation capability comprising operand registers adapted therefor | |
US3737871A (en) | Stack register renamer | |
US4096570A (en) | Subchannel memory access control system | |
JPH0319986B2 (ja) | ||
JPS6150359B2 (ja) | ||
US7093102B1 (en) | Code sequence for vector gather and scatter | |
Hollaar | Specialized merge processor networks for combining sorted lists | |
US3735364A (en) | Data handling system for handling data in compliance with normal and special descriptors | |
US4301514A (en) | Data processor for processing at one time data including X bytes and Y bits | |
Vassiliadis et al. | Block based compression storage expected performance | |
EP0888586B1 (en) | Array indexing | |
US3405396A (en) | Digital data processing systems | |
RU2066067C1 (ru) | Центральный процессор для многопроцессорной вычислительной системы | |
US6311266B1 (en) | Instruction look-ahead system and hardware | |
US3500027A (en) | Computer having sum of products instruction capability | |
US5802522A (en) | Method and system of storing data blocks that have common data elements | |
JPH036663A (ja) | ベクトルデータ処理方式 | |
JP3511529B2 (ja) | 複合演算処理装置 | |
US20230351150A1 (en) | Neural network arithmetic processing device and neural network arithmetic processing method | |
JP2576589B2 (ja) | 仮想記憶アクセス制御方式 |