JPS6027977A - 並列処理装置 - Google Patents
並列処理装置Info
- Publication number
- JPS6027977A JPS6027977A JP13842683A JP13842683A JPS6027977A JP S6027977 A JPS6027977 A JP S6027977A JP 13842683 A JP13842683 A JP 13842683A JP 13842683 A JP13842683 A JP 13842683A JP S6027977 A JPS6027977 A JP S6027977A
- Authority
- JP
- Japan
- Prior art keywords
- data
- memory
- block
- bus
- arithmetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/167—Interprocessor communication using a common memory, e.g. mailbox
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は複数のデータ処理装置を並列に動作させ、全体
的な処理性能を向上させる並列処理装置に関するもので
ある。
的な処理性能を向上させる並列処理装置に関するもので
ある。
従来例の構成とその問題点
近年、半導体高集積化技術の進歩によりマイクロプロセ
ッサが非常に安価になってきた。そこでMeのマイクロ
プロセッサを用いて並列にデータ処理を行なうことによ
り、システムとしての処理性能を高める構造、すなわち
マルチプロセッサ構造をとることが容易に可能となって
きた。マルチプロセッサにおいてはプロセラザ間でデー
タのやりとりを高速に行なう必要があり、いくつかのデ
ータ転送手段がとられる。
ッサが非常に安価になってきた。そこでMeのマイクロ
プロセッサを用いて並列にデータ処理を行なうことによ
り、システムとしての処理性能を高める構造、すなわち
マルチプロセッサ構造をとることが容易に可能となって
きた。マルチプロセッサにおいてはプロセラザ間でデー
タのやりとりを高速に行なう必要があり、いくつかのデ
ータ転送手段がとられる。
以下にプロセッサ間データ転送手段Vこ関する2種の従
来1+lJについて説明する。
来1+lJについて説明する。
第1図は第1の従来例で、プロセッサ間データ転送手段
である共有メモリ装置を用いたマルチプロセッサの構成
を示すものであり、11.12は中央演算装@(以下C
PUと称す)、21.22はローカルメモリ装置、23
は共有メモリ装置、33は共有バスCBのアクセス調停
を行なうバスアービタ、31,32U各ローカルバスと
共有バスの結合/切断を行なうバッフ7である。以下に
その動作について説明する。
である共有メモリ装置を用いたマルチプロセッサの構成
を示すものであり、11.12は中央演算装@(以下C
PUと称す)、21.22はローカルメモリ装置、23
は共有メモリ装置、33は共有バスCBのアクセス調停
を行なうバスアービタ、31,32U各ローカルバスと
共有バスの結合/切断を行なうバッフ7である。以下に
その動作について説明する。
CPU11は、CPU12に対して転送したいデータを
共有メモリ装置23に格納し、データが準備できたこと
を示す情報を同じく共有メモリ装置23に格納する。C
PU12は共有メモリ装置23を調ベデータが準備でき
たことを確認して所定のデータをローカルメモリ装置2
2にとり込みそれに基づいて処理を開始する。
共有メモリ装置23に格納し、データが準備できたこと
を示す情報を同じく共有メモリ装置23に格納する。C
PU12は共有メモリ装置23を調ベデータが準備でき
たことを確認して所定のデータをローカルメモリ装置2
2にとり込みそれに基づいて処理を開始する。
次にプロセッサ間データ転送手段の第2の従来列につい
て説明する。
て説明する。
第2図は従来のプロセッサ間データ転送手段であるプロ
セッサ間インターフェース装置を用いたマルチプロセッ
サの構成を示すものであり、11゜12はCPU、24
.26はメモリ装置、40はプロセッサ間インタフェー
ス装置でCPU11用のバスとCPU12用のバスの間
に介在する。このプロセッサ間インタフェース装置は牢
なる入出力ポートに位置づけられるデータランチの場合
もあれば、データを入力端から書込んだ順序で出力端か
ら読出し可能な先入先出メモリ装置の場合もある。以下
に、プロセッサ間インタフェース装置としてこの先入先
出メモリ装置を用いた場合を想定して、その動作につい
て説明する。
セッサ間インターフェース装置を用いたマルチプロセッ
サの構成を示すものであり、11゜12はCPU、24
.26はメモリ装置、40はプロセッサ間インタフェー
ス装置でCPU11用のバスとCPU12用のバスの間
に介在する。このプロセッサ間インタフェース装置は牢
なる入出力ポートに位置づけられるデータランチの場合
もあれば、データを入力端から書込んだ順序で出力端か
ら読出し可能な先入先出メモリ装置の場合もある。以下
に、プロセッサ間インタフェース装置としてこの先入先
出メモリ装置を用いた場合を想定して、その動作につい
て説明する。
CPU11は、CPU12に対して転送したいデータを
、グロセノサ用インタフェース装置40が満杯でないこ
とを確認してその入力端に順次書込む○CPU12はプ
ロセノザ間インタフェース装置40が空でない場合その
出力端からデータを1語ずつ順次読出し、これらのデー
タに基づき処理を開始する。
、グロセノサ用インタフェース装置40が満杯でないこ
とを確認してその入力端に順次書込む○CPU12はプ
ロセノザ間インタフェース装置40が空でない場合その
出力端からデータを1語ずつ順次読出し、これらのデー
タに基づき処理を開始する。
次に以上2種の従来例の構成要素となるCPU11゜1
2の構造について説明する。第3図は従来のCPUのデ
ータ処理部を示すものであり、51゜52はデータラッ
チ、60は算術論理演算ユニット(以下ALUと称す〕
、70はレジスタファイルでこれらはCPU内部バスB
tJSを介して接続されている。
2の構造について説明する。第3図は従来のCPUのデ
ータ処理部を示すものであり、51゜52はデータラッ
チ、60は算術論理演算ユニット(以下ALUと称す〕
、70はレジスタファイルでこれらはCPU内部バスB
tJSを介して接続されている。
以上のように構成された従来のCPUKついて、以下そ
の動作について説明する。
の動作について説明する。
レジスタファイルフ0内の演算を施すべき2データが次
々に読出され、バスBUSを介してデークラッチ61.
52にランチされる。次にALU60はこれら2データ
について算術論理演算を施しその結果を再びバスBUS
に出力し、レジスタファイル70はこのデータを格納す
る。
々に読出され、バスBUSを介してデークラッチ61.
52にランチされる。次にALU60はこれら2データ
について算術論理演算を施しその結果を再びバスBUS
に出力し、レジスタファイル70はこのデータを格納す
る。
しかしながら上記のような構成では、マルチプロセラザ
におけるプロセッサ間のデータの授受が、CPUからみ
てメモリなどが接続された外部バスを経由しなければな
らないため、CPUに対する命令コード読出しなどとの
バス輻晴が生じ、システム全体の性能向上に限界がある
という問題を有していた。
におけるプロセッサ間のデータの授受が、CPUからみ
てメモリなどが接続された外部バスを経由しなければな
らないため、CPUに対する命令コード読出しなどとの
バス輻晴が生じ、システム全体の性能向上に限界がある
という問題を有していた。
発明の目的
本発明は」二記従来の問題点を解消するもので、CPU
内部に複数個存在する処理装置間のデータの転送を、パ
イプライン的に高速かつ効率よく行なう並列処理装置を
提供することを目的とする。
内部に複数個存在する処理装置間のデータの転送を、パ
イプライン的に高速かつ効率よく行なう並列処理装置を
提供することを目的とする。
発明の構成
本発明は入力端と出力端に存在するランダムアクセス可
能なRAM構造とシフトレジスタ構造を兼ね備えた第1
.第2のメモリと、これらのメモリの開に介在するシフ
トレジスタ構造をもつ第3のメモリと、第1のメモリに
対して算術論理演算を施す第1のALUと、第2のメモ
リに対して算術論理演算を施す第2のALUを具備した
並列処理装置であり、第1.第2のメモリのデータに対
し独立に読出し、演算、書込みを可能にすることにより
、CPU内部において並列処理性を実現し、処理の高速
化を図ることができるものである。
能なRAM構造とシフトレジスタ構造を兼ね備えた第1
.第2のメモリと、これらのメモリの開に介在するシフ
トレジスタ構造をもつ第3のメモリと、第1のメモリに
対して算術論理演算を施す第1のALUと、第2のメモ
リに対して算術論理演算を施す第2のALUを具備した
並列処理装置であり、第1.第2のメモリのデータに対
し独立に読出し、演算、書込みを可能にすることにより
、CPU内部において並列処理性を実現し、処理の高速
化を図ることができるものである。
実施例の説明
第4図は本発明の第1の実施例における並列処理装置の
構成図を示すものである。第4図において、63〜56
はデータランチ、61.62はそれぞれ第1.第2のA
LU、80は先入先出レジスタファイルで、ラッチ53
.64の入力、ALU61の出力、先入先出レジスタフ
ァイル80の入力端レジスタファイルはバスBUS 1
に接続されており、同様にラッチ55.56の入力、A
LU62の出力、先入先出レジスタファイル80の出力
端レジスタファイルはバスBUS2に接続されている。
構成図を示すものである。第4図において、63〜56
はデータランチ、61.62はそれぞれ第1.第2のA
LU、80は先入先出レジスタファイルで、ラッチ53
.64の入力、ALU61の出力、先入先出レジスタフ
ァイル80の入力端レジスタファイルはバスBUS 1
に接続されており、同様にラッチ55.56の入力、A
LU62の出力、先入先出レジスタファイル80の出力
端レジスタファイルはバスBUS2に接続されている。
以上のように構成されたこの実施例の並列処理装置につ
いて以下その動作を説明する。
いて以下その動作を説明する。
入力端レジスフファイル内の演算を施すべき2データが
次々に読出され、バスBUS1を介してデータラッチ6
3.64にランチされる。次にALU61はこれら2デ
ータについて算術論理演算を施しその結果を再びバスB
US 1に出力し、入力端レジスタファイルはこのデー
タを格納する。
次々に読出され、バスBUS1を介してデータラッチ6
3.64にランチされる。次にALU61はこれら2デ
ータについて算術論理演算を施しその結果を再びバスB
US 1に出力し、入力端レジスタファイルはこのデー
タを格納する。
以上の動作を繰返し、転送出力すべきデータブロックが
入力端レジスタファイルに揃うと先入先出レジスタファ
イル8oの最後尾までこのデータブロックをシフトする
。
入力端レジスタファイルに揃うと先入先出レジスタファ
イル8oの最後尾までこのデータブロックをシフトする
。
1方出力端レジスタフアイル側でも同様に演算を施すべ
き2データが次々に読出され、バスBUS2を介してデ
ータラッチ55.66にランチされる。
き2データが次々に読出され、バスBUS2を介してデ
ータラッチ55.66にランチされる。
次にALU62はこれら2デークについて算術論理演算
を施しその結果を再びバスBUS2に出力し、出力端レ
ジスタファイルはこのデータを格納する。以上の動作を
繰返し、出力端レジスタに存在したデータブロックに対
するデータ処理を全て完了すると先入先出レジスタファ
イル80を1デ一クプロノク分シフトする。
を施しその結果を再びバスBUS2に出力し、出力端レ
ジスタファイルはこのデータを格納する。以上の動作を
繰返し、出力端レジスタに存在したデータブロックに対
するデータ処理を全て完了すると先入先出レジスタファ
イル80を1デ一クプロノク分シフトする。
第5図はこの実施例における先入先出レジスタファイル
の構成図を示すものである。第5図において、81は入
力端に存在する1デークブロソク(=2n語ンの容量を
もつレジスタファイノベ82は入力端から出力端の方向
に1データブロツクの準位で順次シフトするシフトメモ
リ、83は出力端に存在する1データブロツクの容量を
もつレジスフファイル、84は現在の有効なデータブロ
ックの数を記憶する行列長レジスタ、85ば81゜82
.83の各メモリに対しシフト信号を出力するだめのシ
フト制御回路である。
の構成図を示すものである。第5図において、81は入
力端に存在する1デークブロソク(=2n語ンの容量を
もつレジスタファイノベ82は入力端から出力端の方向
に1データブロツクの準位で順次シフトするシフトメモ
リ、83は出力端に存在する1データブロツクの容量を
もつレジスフファイル、84は現在の有効なデータブロ
ックの数を記憶する行列長レジスタ、85ば81゜82
.83の各メモリに対しシフト信号を出力するだめのシ
フト制御回路である。
以上のように構成されたこの実施例の先入先出レジスフ
ファイルについて以下その動作を説明するO 入力端側の処理装置は本先入先出レジスタファイルが満
杯状態であるか否かを示す信号FULを調べ、満杯でな
い場合、入力端レジスタファイル81に対して書込与ア
ドレス情報をADR31に、演算結果である書込みデー
タをBUSlに印加し書込み信号WT1をアクティブに
する。入力端レジスタファイル81内に一連のデータ群
(≦2n語ンの格納を終了すると1デークブロノク書込
み終了信号WTFN fニアクチイブにする。シフト制
御回路86は書込み終了信号WTFNを検出すると、行
列長レジスタ84の内容を参照し、現在の行列長の次の
位置まで入力端レジスタファイル81の内容を1デ一タ
ブロツク単位で順次シフトさせるためのシフト制御信号
5FTiを発生ずる。そして行列長レジスフ84の内容
を1加算する。シフトメモリ82は必(≧0ンデータブ
ロソクの記録容量をもち、シフト制御信号85から出力
制御信号SFT工によりデータブロックを出力端方向に
ソフトする働きをする。
ファイルについて以下その動作を説明するO 入力端側の処理装置は本先入先出レジスタファイルが満
杯状態であるか否かを示す信号FULを調べ、満杯でな
い場合、入力端レジスタファイル81に対して書込与ア
ドレス情報をADR31に、演算結果である書込みデー
タをBUSlに印加し書込み信号WT1をアクティブに
する。入力端レジスタファイル81内に一連のデータ群
(≦2n語ンの格納を終了すると1デークブロノク書込
み終了信号WTFN fニアクチイブにする。シフト制
御回路86は書込み終了信号WTFNを検出すると、行
列長レジスタ84の内容を参照し、現在の行列長の次の
位置まで入力端レジスタファイル81の内容を1デ一タ
ブロツク単位で順次シフトさせるためのシフト制御信号
5FTiを発生ずる。そして行列長レジスフ84の内容
を1加算する。シフトメモリ82は必(≧0ンデータブ
ロソクの記録容量をもち、シフト制御信号85から出力
制御信号SFT工によりデータブロックを出力端方向に
ソフトする働きをする。
次に出力端レジスタファイル83側では、本先入先出レ
ジスタファイルが空状態であるか否かを示す信号EMP
を調べ、空でない場合、出力端レジスフファイル83に
対して読出しアドレス情報をADR2に印加し読出し信
号RD2をアクティブにして、BUS2に出力されるデ
ータを読出す。
ジスタファイルが空状態であるか否かを示す信号EMP
を調べ、空でない場合、出力端レジスフファイル83に
対して読出しアドレス情報をADR2に印加し読出し信
号RD2をアクティブにして、BUS2に出力されるデ
ータを読出す。
出力端レジスタファイル83内の一連のデータ群の読出
し、処理を終了すると1データブロック読出し終了信号
RDFN をアクティブにする。シフト制御回路86は
読出し終了信号RDFN を検出すると、行列長レジス
タ84の内容を参照し、現在の有効データブロックを保
持しているシフトメモリ82と出力端レジスタファイル
83(また満杯時には入力端レジスタファイル81)に
対して1デ一タブロツク分だけシフトさせるだめのシフ
ト制御信号SFT、を発生する。そして行列長レジスタ
84の内容を1m、算する。」二記FUL信号。
し、処理を終了すると1データブロック読出し終了信号
RDFN をアクティブにする。シフト制御回路86は
読出し終了信号RDFN を検出すると、行列長レジス
タ84の内容を参照し、現在の有効データブロックを保
持しているシフトメモリ82と出力端レジスタファイル
83(また満杯時には入力端レジスタファイル81)に
対して1デ一タブロツク分だけシフトさせるだめのシフ
ト制御信号SFT、を発生する。そして行列長レジスタ
84の内容を1m、算する。」二記FUL信号。
EMP信号は行列長レジスタ84の内容がそれぞれR+
1 、oの状態をデコードして作成される。
1 、oの状態をデコードして作成される。
上記の説明では入力端レジスタファイル81への書込み
動作、出力端レジスタファイル83からの読出し動作に
限ったが、データ処理過程において入力端レジスタファ
イル81に対する読出し動作、出力端レジスタファイル
83に対する書込み動作を行なってもさしつかえない。
動作、出力端レジスタファイル83からの読出し動作に
限ったが、データ処理過程において入力端レジスタファ
イル81に対する読出し動作、出力端レジスタファイル
83に対する書込み動作を行なってもさしつかえない。
次に本発明の構成要素である入力端レジスタファイル8
1 、シフトメモ9820回路構成の一実施例を第6図
に示す。第6図において、810は入力端レジスタファ
イル8101ビツトメモリセル、820はシフトメモリ
82の1ビツトメモリセルである。以下にその動作を説
明する。
1 、シフトメモ9820回路構成の一実施例を第6図
に示す。第6図において、810は入力端レジスタファ
イル8101ビツトメモリセル、820はシフトメモリ
82の1ビツトメモリセルである。以下にその動作を説
明する。
入力端レジスタファイル81に対するアドレス信号はア
ドレスデコーダでデコードされて、入力端レジスタファ
イル81内の1語(=mビット)に対して読出し時には
読出し選択信号RDSELk。
ドレスデコーダでデコードされて、入力端レジスタファ
イル81内の1語(=mビット)に対して読出し時には
読出し選択信号RDSELk。
書込み時には書込み選択信号WTSELkとして出力さ
れ、それぞれ各メモリセルの内容をDATAlに出力、
あるいはDATAlを各メモリセルにとり込まれる。第
6図のメモリセル510Ij:(m−1)ビット目のも
のを示している。メモリセル810に対してシフト制御
信号SFTμ+1を1パルス印加すると隣のビット、す
なわち(m−2)ビット目の内容をとり込むことができ
る。すなわちメモリーI=/1,810はRAM構造と
シフトレジスタ構造ヲ兼ね備えたメモリセルといえる。
れ、それぞれ各メモリセルの内容をDATAlに出力、
あるいはDATAlを各メモリセルにとり込まれる。第
6図のメモリセル510Ij:(m−1)ビット目のも
のを示している。メモリセル810に対してシフト制御
信号SFTμ+1を1パルス印加すると隣のビット、す
なわち(m−2)ビット目の内容をとり込むことができ
る。すなわちメモリーI=/1,810はRAM構造と
シフトレジスタ構造ヲ兼ね備えたメモリセルといえる。
一方メモリセル820はメモリセル810に比べRAM
構造に対応する部分が無く、まさにシフトレジスタ構造
をもつメモリセルである。出力端レジスタファイル83
のメモリセルは入力端レジスタファイルのメモリセル8
10と全く同じ構造である。そこでSFT、、4−1と
5FTflの双方にmパルスの信号を印加すると、入力
端レジスフファイル81のデータ全て(1デ一タブロツ
ク分〕はシフトメモリ82の最後尾にシフトさせること
ができる。同様にシフト制御信号5FT0〜SFTλ、
−1に選択的にmの整数倍のパルスを加えることにより
1データプロツタを任意の場所寸でシフトすることがで
きる。
構造に対応する部分が無く、まさにシフトレジスタ構造
をもつメモリセルである。出力端レジスタファイル83
のメモリセルは入力端レジスタファイルのメモリセル8
10と全く同じ構造である。そこでSFT、、4−1と
5FTflの双方にmパルスの信号を印加すると、入力
端レジスフファイル81のデータ全て(1デ一タブロツ
ク分〕はシフトメモリ82の最後尾にシフトさせること
ができる。同様にシフト制御信号5FT0〜SFTλ、
−1に選択的にmの整数倍のパルスを加えることにより
1データプロツタを任意の場所寸でシフトすることがで
きる。
す、上のようにこの実施例によれば、CPU内部に複数
個存在する処理装置間を先入先出レジスタファイルで結
合することにより、各処理装置間のデータ転送を高速に
効率よく行なうことができる。
個存在する処理装置間を先入先出レジスタファイルで結
合することにより、各処理装置間のデータ転送を高速に
効率よく行なうことができる。
以下に本発明の第2の実施例について、図面を参照しな
がら説明する。
がら説明する。
第7図は本発明の第2の実施例を示す並列処理装置の構
成図である。
成図である。
同図において、53〜56はデータラッチ、61゜62
はそれぞれ第1.第2のALUで、以上は第4図の構成
と同様なものである。第4図の構成と異なるのは先入先
出レジスタファイル9oの入力端と出力端のRAM構造
を2ポー)RAM構造にした点、およびバスを2バス構
成にした点である。
はそれぞれ第1.第2のALUで、以上は第4図の構成
と同様なものである。第4図の構成と異なるのは先入先
出レジスタファイル9oの入力端と出力端のRAM構造
を2ポー)RAM構造にした点、およびバスを2バス構
成にした点である。
上記のように構成された第2の実施例の並列処理装置に
ついて、以下その動作を説明する。
ついて、以下その動作を説明する。
入力端レジスタファイル内の演算を施すべき2データが
一動作で同時に読出され、バスABUS1゜BBUSl
を介してデータラッチ53.54にラッチされる。次に
ALU61はこれら2データについて算術論理演算を施
しその結果をバスABUS1に出力し、入力端レジスフ
ファイルはこのデータを格納する〇一方出力端レジスタ
フアイル側でも同様に演算を施すべき2データが一動作
で同時に読出され、バスABUS2.BBUS2 を介
してデータラッチ55.56にランチされる。次にAL
U62はこれら2データについて算術論理演算を施しそ
の結果をバスABUS2 に出力し、出力端レジスタフ
ァイルはこのデータを格納する。
一動作で同時に読出され、バスABUS1゜BBUSl
を介してデータラッチ53.54にラッチされる。次に
ALU61はこれら2データについて算術論理演算を施
しその結果をバスABUS1に出力し、入力端レジスフ
ファイルはこのデータを格納する〇一方出力端レジスタ
フアイル側でも同様に演算を施すべき2データが一動作
で同時に読出され、バスABUS2.BBUS2 を介
してデータラッチ55.56にランチされる。次にAL
U62はこれら2データについて算術論理演算を施しそ
の結果をバスABUS2 に出力し、出力端レジスタフ
ァイルはこのデータを格納する。
先入先出レジスタファイル90のデータブロックシフト
動作については第1の実施例と全く同じである。
動作については第1の実施例と全く同じである。
以上のように、この実施例によれば先入先出レジスタフ
ァイルの入力端、出力端を2ポ一トRAM構造にするこ
とにより、第1の実施例に比べ各処理装置内での演算を
さらに高速化することができるO なお、第1の実施例の説明において1データブロック書
込み終了信号WTFN、1データブロックRDFNは独
立した信号として供給するとしたが、ある特定のアドレ
スに対する書込み、読出し動作を判定して内部的にこれ
らの信号を作成してもよいことは言うまでもない。
ァイルの入力端、出力端を2ポ一トRAM構造にするこ
とにより、第1の実施例に比べ各処理装置内での演算を
さらに高速化することができるO なお、第1の実施例の説明において1データブロック書
込み終了信号WTFN、1データブロックRDFNは独
立した信号として供給するとしたが、ある特定のアドレ
スに対する書込み、読出し動作を判定して内部的にこれ
らの信号を作成してもよいことは言うまでもない。
発明の効果
本発明の並列処理装置は2つの算術論理演算ユニット、
2つの読み書き可能RAM、シフトメモリ、行列長レジ
スタ、シフト制御回路を設けることにより、CPU内部
に複数の処理装置を構成した場合の各処理装置間のデー
タ転送を高速に効率よく行なえ、各処理装置がパイプラ
イン的に処理を進めることができるため、CPUの性能
を大幅に向上することができ、その実用的効果は極めて
大きい。
2つの読み書き可能RAM、シフトメモリ、行列長レジ
スタ、シフト制御回路を設けることにより、CPU内部
に複数の処理装置を構成した場合の各処理装置間のデー
タ転送を高速に効率よく行なえ、各処理装置がパイプラ
イン的に処理を進めることができるため、CPUの性能
を大幅に向上することができ、その実用的効果は極めて
大きい。
第1図は従来の共有メモリ装置を用いたマルチプロセッ
サのブロック図、第2図は従来のプロセッサ間インタフ
ェース装置を用いたマルチプロセッサのブロック図、第
3図は従来の中央処理装置(CPU)のデータ処理部の
ブロック図、第4図は本発明の第1の実施例における並
列処理装置のブロック図、第6図−同実施例における先
入先出レジスタファイルのブロック図、第6図は同実施
例における入力端レジスタファイル部とシフトレジスタ
部の内部回路のブロック図、第7図は本発明の第2の実
施例における並列処理装置のブロック図である。 53〜56・・・・・・データラッチ、61.62・・
・・・・算術論理演算ユニノ) (ALU)、80.9
’O・・・・・・先入先出レジスタファイル、81・・
・・・・入力端レジスタファイル(第1のメモリ)、8
2・・・・・・シフトメモリ(第3のメモリ)、83・
・・・・・出力端レジスタファイル(第2のメモリ)、
84・・・・・・行列長レジスタ、85・・・・・・シ
フト制御回路。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図
サのブロック図、第2図は従来のプロセッサ間インタフ
ェース装置を用いたマルチプロセッサのブロック図、第
3図は従来の中央処理装置(CPU)のデータ処理部の
ブロック図、第4図は本発明の第1の実施例における並
列処理装置のブロック図、第6図−同実施例における先
入先出レジスタファイルのブロック図、第6図は同実施
例における入力端レジスタファイル部とシフトレジスタ
部の内部回路のブロック図、第7図は本発明の第2の実
施例における並列処理装置のブロック図である。 53〜56・・・・・・データラッチ、61.62・・
・・・・算術論理演算ユニノ) (ALU)、80.9
’O・・・・・・先入先出レジスタファイル、81・・
・・・・入力端レジスタファイル(第1のメモリ)、8
2・・・・・・シフトメモリ(第3のメモリ)、83・
・・・・・出力端レジスタファイル(第2のメモリ)、
84・・・・・・行列長レジスタ、85・・・・・・シ
フト制御回路。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図
Claims (2)
- (1)最大2n語の容量よりなる1ブロツクのデータを
記憶し、n本(n≧1)からなる第1のアドレス信号に
よI)1語単位でデータの読み書き可能なRAM構造お
よびシフトレジスタ構造を兼ね備えた第1のメモリと、
前記第1のメモリから読出され/ζデータを第1のバス
を介して入力し、このデータに対して算術論理演算を施
し再び前記第1のバスを介して前記第1のメモリにその
結果を出力する第1の算術論理演算ユニットと、前記第
1のメモリと同じ容量のデータを記憶し、n本からなる
第2のアドレス信号線により1語単位でデータの読み書
き可能なRAM構造およびノフトレジスタ構造を兼ね備
えた第2のメモリと、前記第2のメモリから読出された
データを第2のバスを介して入力し、このデータに対し
て算術論理演算を施し再び前記第2のバスを介して前記
第2のメモリにその結果を出力する第2の算術論理演算
ユニットと、前記第1のメモリと第2のメモリの間に位
置し、前記第1のメモリ内の全データをシフト制御信号
に従って最後尾ブロックにシフト入力し、先頭ブロック
から前記第2のメモリにデータブロックをシフト出力す
るシフトレジスタ構造を備えたrデータブロック(IV
、≧0)の容量をもつ第3のメモリと、現在格納されて
いるデータブロック数を記憶する行列長レジスタと、前
記第1のメモリに対するデータブロックの書込み終了信
号によって前記第1のメモリの内容を前記行列長レジス
タの示すデータブロック数の次のブロックまで順次シフ
トして前記行列長レジスタを1加算し、寸だ前記第2の
メモリに対するデータブロックの読出し終了信号によっ
て現在格納されているデータブロックをすべてシフトし
て前記行列長レジスタを1減算するシフト制御回路とを
備えた並列処理装置。 - (2)最大2n語の容量よりなる1ブロツクのデータを
記憶し、それぞれがn本(n≧1)からなる第1.第2
のアドレス信号により同時に2語のデータ読出しが可能
で、またデータ書込みも可能な2ポー)RAM構造およ
びシフトレジスタ構造を兼ね備えた第1のメモリと、前
記第1のメモリから読出された2語のデータをそれぞれ
第1.第2のバスを弁して入力し、これらのデータに対
して算術論理演算を施し再び前記第1または第2のバス
を介して前記第1のメモリにその結果を出力する第」の
算術論理演算ユニットと、前記第1のメモリと同じ容量
のデータを記憶し、それぞれがn本からなる第3.第4
のアドレス信号線rこより同時に2語のデータ読出しが
可能で、ま/ζデータ書込みも可能な2ポ一トRAM構
造およびシフトレジスタ構造を兼ね備えた第2のメモリ
と、前記第2のメモリから読出された2語のデータをそ
れぞれ第3.第4のバスを介して入力し、これらのデー
タに対して算術論理演算を施し再び前記第3または第4
のバスを介して前記第2のメモリにその結果を出力する
第2の算術論理演算ユニットと、前記第1のメモリと第
2のメモリの間に位置し、前記第1のメモリ内の全デー
タをシフト制御信号に従って最後尾ブロックにシフト入
力し、先頭ブロックから前記第2のメモリにデータブロ
ックをシフト出力するソフトレジスタ構造を備えた必デ
ータブロック(U≧O)の容量をもつ第3のメモリと、
現在格納されているデータブロックθを記憶する行列長
レジスタと、前記第1のメモリに対するデータブロック
の書込み終了信号によって前記第1のメモリの内容を前
記行列長レジスタの示すデータブロック数の次のブロッ
ク1で順次シフトして前記行列長レジスタを1加算し、
すた前記第2のメモリに対するデータブロックの読出し
終了信号によって現在格納されているデータブロックを
すべてシフトして前記行列長レジスタを1減算するシフ
ト制御回路とを備えた並列処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13842683A JPS6027977A (ja) | 1983-07-27 | 1983-07-27 | 並列処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13842683A JPS6027977A (ja) | 1983-07-27 | 1983-07-27 | 並列処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6027977A true JPS6027977A (ja) | 1985-02-13 |
JPH0521262B2 JPH0521262B2 (ja) | 1993-03-23 |
Family
ID=15221687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13842683A Granted JPS6027977A (ja) | 1983-07-27 | 1983-07-27 | 並列処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6027977A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54119930A (en) * | 1978-03-10 | 1979-09-18 | Canon Inc | Pressure-fixed toner |
JPH01179515A (ja) * | 1988-01-11 | 1989-07-17 | Sanyo Electric Co Ltd | デジタル信号処理装置 |
-
1983
- 1983-07-27 JP JP13842683A patent/JPS6027977A/ja active Granted
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54119930A (en) * | 1978-03-10 | 1979-09-18 | Canon Inc | Pressure-fixed toner |
JPS6029110B2 (ja) * | 1978-03-10 | 1985-07-09 | キヤノン株式会社 | 圧力定着用トナ− |
JPH01179515A (ja) * | 1988-01-11 | 1989-07-17 | Sanyo Electric Co Ltd | デジタル信号処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0521262B2 (ja) | 1993-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU645785B2 (en) | Parallel processor memory system | |
EP0248906B1 (en) | Multi-port memory system | |
US4789925A (en) | Vector data logical usage conflict detection | |
US4875161A (en) | Scientific processor vector file organization | |
JPH0425586B2 (ja) | ||
JP3569735B2 (ja) | Sramキャッシュ用ワード幅選択 | |
JPH0622034B2 (ja) | マルチポートベクトルレジスタファイル | |
CN111656339B (zh) | 存储器装置及其控制方法 | |
US4835684A (en) | Microcomputer capable of transferring data from one location to another within a memory without an intermediary data bus | |
CA2478570A1 (en) | Data processing apparatus and system and method for controlling memory access | |
JPS62147546A (ja) | マルチ・ポ−ト・メモリ装置 | |
JPS62272343A (ja) | 高速分散制御メモリシステムおよびその方法 | |
JP4860891B2 (ja) | ビット順次手法により大容量並列プロセッサアレイをメモリアレイに接続する方法及び装置 | |
CN1017837B (zh) | 具有单比特置位和复位功能的主存储器插板 | |
JPS6027977A (ja) | 並列処理装置 | |
US6647450B1 (en) | Multiprocessor computer systems with command FIFO buffer at each target device | |
EP0211613A2 (en) | Scientific processor vector file organization | |
EP0136218A2 (en) | Multiple port pipelined processor | |
US5822766A (en) | Main memory interface for high speed data transfer | |
JPH0427583B2 (ja) | ||
JPS61256478A (ja) | 並列処理計算機 | |
JPH0646413B2 (ja) | デ−タ処理プロセッサ | |
JP2806930B2 (ja) | 主記憶一致制御方式 | |
KR20230142368A (ko) | 미리 결정된 수학적 연산을 수행하는 프로세서 및 컴퓨팅 유닛 | |
JPH0652516B2 (ja) | バス・インターフェース装置 |