JPS6027977A - 並列処理装置 - Google Patents

並列処理装置

Info

Publication number
JPS6027977A
JPS6027977A JP13842683A JP13842683A JPS6027977A JP S6027977 A JPS6027977 A JP S6027977A JP 13842683 A JP13842683 A JP 13842683A JP 13842683 A JP13842683 A JP 13842683A JP S6027977 A JPS6027977 A JP S6027977A
Authority
JP
Japan
Prior art keywords
data
memory
block
bus
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP13842683A
Other languages
English (en)
Other versions
JPH0521262B2 (ja
Inventor
Teiji Nishizawa
西澤 貞次
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP13842683A priority Critical patent/JPS6027977A/ja
Publication of JPS6027977A publication Critical patent/JPS6027977A/ja
Publication of JPH0521262B2 publication Critical patent/JPH0521262B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/167Interprocessor communication using a common memory, e.g. mailbox

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は複数のデータ処理装置を並列に動作させ、全体
的な処理性能を向上させる並列処理装置に関するもので
ある。
従来例の構成とその問題点 近年、半導体高集積化技術の進歩によりマイクロプロセ
ッサが非常に安価になってきた。そこでMeのマイクロ
プロセッサを用いて並列にデータ処理を行なうことによ
り、システムとしての処理性能を高める構造、すなわち
マルチプロセッサ構造をとることが容易に可能となって
きた。マルチプロセッサにおいてはプロセラザ間でデー
タのやりとりを高速に行なう必要があり、いくつかのデ
ータ転送手段がとられる。
以下にプロセッサ間データ転送手段Vこ関する2種の従
来1+lJについて説明する。
第1図は第1の従来例で、プロセッサ間データ転送手段
である共有メモリ装置を用いたマルチプロセッサの構成
を示すものであり、11.12は中央演算装@(以下C
PUと称す)、21.22はローカルメモリ装置、23
は共有メモリ装置、33は共有バスCBのアクセス調停
を行なうバスアービタ、31,32U各ローカルバスと
共有バスの結合/切断を行なうバッフ7である。以下に
その動作について説明する。
CPU11は、CPU12に対して転送したいデータを
共有メモリ装置23に格納し、データが準備できたこと
を示す情報を同じく共有メモリ装置23に格納する。C
PU12は共有メモリ装置23を調ベデータが準備でき
たことを確認して所定のデータをローカルメモリ装置2
2にとり込みそれに基づいて処理を開始する。
次にプロセッサ間データ転送手段の第2の従来列につい
て説明する。
第2図は従来のプロセッサ間データ転送手段であるプロ
セッサ間インターフェース装置を用いたマルチプロセッ
サの構成を示すものであり、11゜12はCPU、24
.26はメモリ装置、40はプロセッサ間インタフェー
ス装置でCPU11用のバスとCPU12用のバスの間
に介在する。このプロセッサ間インタフェース装置は牢
なる入出力ポートに位置づけられるデータランチの場合
もあれば、データを入力端から書込んだ順序で出力端か
ら読出し可能な先入先出メモリ装置の場合もある。以下
に、プロセッサ間インタフェース装置としてこの先入先
出メモリ装置を用いた場合を想定して、その動作につい
て説明する。
CPU11は、CPU12に対して転送したいデータを
、グロセノサ用インタフェース装置40が満杯でないこ
とを確認してその入力端に順次書込む○CPU12はプ
ロセノザ間インタフェース装置40が空でない場合その
出力端からデータを1語ずつ順次読出し、これらのデー
タに基づき処理を開始する。
次に以上2種の従来例の構成要素となるCPU11゜1
2の構造について説明する。第3図は従来のCPUのデ
ータ処理部を示すものであり、51゜52はデータラッ
チ、60は算術論理演算ユニット(以下ALUと称す〕
、70はレジスタファイルでこれらはCPU内部バスB
tJSを介して接続されている。
以上のように構成された従来のCPUKついて、以下そ
の動作について説明する。
レジスタファイルフ0内の演算を施すべき2データが次
々に読出され、バスBUSを介してデークラッチ61.
52にランチされる。次にALU60はこれら2データ
について算術論理演算を施しその結果を再びバスBUS
に出力し、レジスタファイル70はこのデータを格納す
る。
しかしながら上記のような構成では、マルチプロセラザ
におけるプロセッサ間のデータの授受が、CPUからみ
てメモリなどが接続された外部バスを経由しなければな
らないため、CPUに対する命令コード読出しなどとの
バス輻晴が生じ、システム全体の性能向上に限界がある
という問題を有していた。
発明の目的 本発明は」二記従来の問題点を解消するもので、CPU
内部に複数個存在する処理装置間のデータの転送を、パ
イプライン的に高速かつ効率よく行なう並列処理装置を
提供することを目的とする。
発明の構成 本発明は入力端と出力端に存在するランダムアクセス可
能なRAM構造とシフトレジスタ構造を兼ね備えた第1
.第2のメモリと、これらのメモリの開に介在するシフ
トレジスタ構造をもつ第3のメモリと、第1のメモリに
対して算術論理演算を施す第1のALUと、第2のメモ
リに対して算術論理演算を施す第2のALUを具備した
並列処理装置であり、第1.第2のメモリのデータに対
し独立に読出し、演算、書込みを可能にすることにより
、CPU内部において並列処理性を実現し、処理の高速
化を図ることができるものである。
実施例の説明 第4図は本発明の第1の実施例における並列処理装置の
構成図を示すものである。第4図において、63〜56
はデータランチ、61.62はそれぞれ第1.第2のA
LU、80は先入先出レジスタファイルで、ラッチ53
.64の入力、ALU61の出力、先入先出レジスタフ
ァイル80の入力端レジスタファイルはバスBUS 1
に接続されており、同様にラッチ55.56の入力、A
LU62の出力、先入先出レジスタファイル80の出力
端レジスタファイルはバスBUS2に接続されている。
以上のように構成されたこの実施例の並列処理装置につ
いて以下その動作を説明する。
入力端レジスフファイル内の演算を施すべき2データが
次々に読出され、バスBUS1を介してデータラッチ6
3.64にランチされる。次にALU61はこれら2デ
ータについて算術論理演算を施しその結果を再びバスB
US 1に出力し、入力端レジスタファイルはこのデー
タを格納する。
以上の動作を繰返し、転送出力すべきデータブロックが
入力端レジスタファイルに揃うと先入先出レジスタファ
イル8oの最後尾までこのデータブロックをシフトする
1方出力端レジスタフアイル側でも同様に演算を施すべ
き2データが次々に読出され、バスBUS2を介してデ
ータラッチ55.66にランチされる。
次にALU62はこれら2デークについて算術論理演算
を施しその結果を再びバスBUS2に出力し、出力端レ
ジスタファイルはこのデータを格納する。以上の動作を
繰返し、出力端レジスタに存在したデータブロックに対
するデータ処理を全て完了すると先入先出レジスタファ
イル80を1デ一クプロノク分シフトする。
第5図はこの実施例における先入先出レジスタファイル
の構成図を示すものである。第5図において、81は入
力端に存在する1デークブロソク(=2n語ンの容量を
もつレジスタファイノベ82は入力端から出力端の方向
に1データブロツクの準位で順次シフトするシフトメモ
リ、83は出力端に存在する1データブロツクの容量を
もつレジスフファイル、84は現在の有効なデータブロ
ックの数を記憶する行列長レジスタ、85ば81゜82
.83の各メモリに対しシフト信号を出力するだめのシ
フト制御回路である。
以上のように構成されたこの実施例の先入先出レジスフ
ファイルについて以下その動作を説明するO 入力端側の処理装置は本先入先出レジスタファイルが満
杯状態であるか否かを示す信号FULを調べ、満杯でな
い場合、入力端レジスタファイル81に対して書込与ア
ドレス情報をADR31に、演算結果である書込みデー
タをBUSlに印加し書込み信号WT1をアクティブに
する。入力端レジスタファイル81内に一連のデータ群
(≦2n語ンの格納を終了すると1デークブロノク書込
み終了信号WTFN fニアクチイブにする。シフト制
御回路86は書込み終了信号WTFNを検出すると、行
列長レジスタ84の内容を参照し、現在の行列長の次の
位置まで入力端レジスタファイル81の内容を1デ一タ
ブロツク単位で順次シフトさせるためのシフト制御信号
5FTiを発生ずる。そして行列長レジスフ84の内容
を1加算する。シフトメモリ82は必(≧0ンデータブ
ロソクの記録容量をもち、シフト制御信号85から出力
制御信号SFT工によりデータブロックを出力端方向に
ソフトする働きをする。
次に出力端レジスタファイル83側では、本先入先出レ
ジスタファイルが空状態であるか否かを示す信号EMP
を調べ、空でない場合、出力端レジスフファイル83に
対して読出しアドレス情報をADR2に印加し読出し信
号RD2をアクティブにして、BUS2に出力されるデ
ータを読出す。
出力端レジスタファイル83内の一連のデータ群の読出
し、処理を終了すると1データブロック読出し終了信号
RDFN をアクティブにする。シフト制御回路86は
読出し終了信号RDFN を検出すると、行列長レジス
タ84の内容を参照し、現在の有効データブロックを保
持しているシフトメモリ82と出力端レジスタファイル
83(また満杯時には入力端レジスタファイル81)に
対して1デ一タブロツク分だけシフトさせるだめのシフ
ト制御信号SFT、を発生する。そして行列長レジスタ
84の内容を1m、算する。」二記FUL信号。
EMP信号は行列長レジスタ84の内容がそれぞれR+
1 、oの状態をデコードして作成される。
上記の説明では入力端レジスタファイル81への書込み
動作、出力端レジスタファイル83からの読出し動作に
限ったが、データ処理過程において入力端レジスタファ
イル81に対する読出し動作、出力端レジスタファイル
83に対する書込み動作を行なってもさしつかえない。
次に本発明の構成要素である入力端レジスタファイル8
1 、シフトメモ9820回路構成の一実施例を第6図
に示す。第6図において、810は入力端レジスタファ
イル8101ビツトメモリセル、820はシフトメモリ
82の1ビツトメモリセルである。以下にその動作を説
明する。
入力端レジスタファイル81に対するアドレス信号はア
ドレスデコーダでデコードされて、入力端レジスタファ
イル81内の1語(=mビット)に対して読出し時には
読出し選択信号RDSELk。
書込み時には書込み選択信号WTSELkとして出力さ
れ、それぞれ各メモリセルの内容をDATAlに出力、
あるいはDATAlを各メモリセルにとり込まれる。第
6図のメモリセル510Ij:(m−1)ビット目のも
のを示している。メモリセル810に対してシフト制御
信号SFTμ+1を1パルス印加すると隣のビット、す
なわち(m−2)ビット目の内容をとり込むことができ
る。すなわちメモリーI=/1,810はRAM構造と
シフトレジスタ構造ヲ兼ね備えたメモリセルといえる。
一方メモリセル820はメモリセル810に比べRAM
構造に対応する部分が無く、まさにシフトレジスタ構造
をもつメモリセルである。出力端レジスタファイル83
のメモリセルは入力端レジスタファイルのメモリセル8
10と全く同じ構造である。そこでSFT、、4−1と
5FTflの双方にmパルスの信号を印加すると、入力
端レジスフファイル81のデータ全て(1デ一タブロツ
ク分〕はシフトメモリ82の最後尾にシフトさせること
ができる。同様にシフト制御信号5FT0〜SFTλ、
−1に選択的にmの整数倍のパルスを加えることにより
1データプロツタを任意の場所寸でシフトすることがで
きる。
す、上のようにこの実施例によれば、CPU内部に複数
個存在する処理装置間を先入先出レジスタファイルで結
合することにより、各処理装置間のデータ転送を高速に
効率よく行なうことができる。
以下に本発明の第2の実施例について、図面を参照しな
がら説明する。
第7図は本発明の第2の実施例を示す並列処理装置の構
成図である。
同図において、53〜56はデータラッチ、61゜62
はそれぞれ第1.第2のALUで、以上は第4図の構成
と同様なものである。第4図の構成と異なるのは先入先
出レジスタファイル9oの入力端と出力端のRAM構造
を2ポー)RAM構造にした点、およびバスを2バス構
成にした点である。
上記のように構成された第2の実施例の並列処理装置に
ついて、以下その動作を説明する。
入力端レジスタファイル内の演算を施すべき2データが
一動作で同時に読出され、バスABUS1゜BBUSl
を介してデータラッチ53.54にラッチされる。次に
ALU61はこれら2データについて算術論理演算を施
しその結果をバスABUS1に出力し、入力端レジスフ
ファイルはこのデータを格納する〇一方出力端レジスタ
フアイル側でも同様に演算を施すべき2データが一動作
で同時に読出され、バスABUS2.BBUS2 を介
してデータラッチ55.56にランチされる。次にAL
U62はこれら2データについて算術論理演算を施しそ
の結果をバスABUS2 に出力し、出力端レジスタフ
ァイルはこのデータを格納する。
先入先出レジスタファイル90のデータブロックシフト
動作については第1の実施例と全く同じである。
以上のように、この実施例によれば先入先出レジスタフ
ァイルの入力端、出力端を2ポ一トRAM構造にするこ
とにより、第1の実施例に比べ各処理装置内での演算を
さらに高速化することができるO なお、第1の実施例の説明において1データブロック書
込み終了信号WTFN、1データブロックRDFNは独
立した信号として供給するとしたが、ある特定のアドレ
スに対する書込み、読出し動作を判定して内部的にこれ
らの信号を作成してもよいことは言うまでもない。
発明の効果 本発明の並列処理装置は2つの算術論理演算ユニット、
2つの読み書き可能RAM、シフトメモリ、行列長レジ
スタ、シフト制御回路を設けることにより、CPU内部
に複数の処理装置を構成した場合の各処理装置間のデー
タ転送を高速に効率よく行なえ、各処理装置がパイプラ
イン的に処理を進めることができるため、CPUの性能
を大幅に向上することができ、その実用的効果は極めて
大きい。
【図面の簡単な説明】
第1図は従来の共有メモリ装置を用いたマルチプロセッ
サのブロック図、第2図は従来のプロセッサ間インタフ
ェース装置を用いたマルチプロセッサのブロック図、第
3図は従来の中央処理装置(CPU)のデータ処理部の
ブロック図、第4図は本発明の第1の実施例における並
列処理装置のブロック図、第6図−同実施例における先
入先出レジスタファイルのブロック図、第6図は同実施
例における入力端レジスタファイル部とシフトレジスタ
部の内部回路のブロック図、第7図は本発明の第2の実
施例における並列処理装置のブロック図である。 53〜56・・・・・・データラッチ、61.62・・
・・・・算術論理演算ユニノ) (ALU)、80.9
’O・・・・・・先入先出レジスタファイル、81・・
・・・・入力端レジスタファイル(第1のメモリ)、8
2・・・・・・シフトメモリ(第3のメモリ)、83・
・・・・・出力端レジスタファイル(第2のメモリ)、
84・・・・・・行列長レジスタ、85・・・・・・シ
フト制御回路。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図

Claims (2)

    【特許請求の範囲】
  1. (1)最大2n語の容量よりなる1ブロツクのデータを
    記憶し、n本(n≧1)からなる第1のアドレス信号に
    よI)1語単位でデータの読み書き可能なRAM構造お
    よびシフトレジスタ構造を兼ね備えた第1のメモリと、
    前記第1のメモリから読出され/ζデータを第1のバス
    を介して入力し、このデータに対して算術論理演算を施
    し再び前記第1のバスを介して前記第1のメモリにその
    結果を出力する第1の算術論理演算ユニットと、前記第
    1のメモリと同じ容量のデータを記憶し、n本からなる
    第2のアドレス信号線により1語単位でデータの読み書
    き可能なRAM構造およびノフトレジスタ構造を兼ね備
    えた第2のメモリと、前記第2のメモリから読出された
    データを第2のバスを介して入力し、このデータに対し
    て算術論理演算を施し再び前記第2のバスを介して前記
    第2のメモリにその結果を出力する第2の算術論理演算
    ユニットと、前記第1のメモリと第2のメモリの間に位
    置し、前記第1のメモリ内の全データをシフト制御信号
    に従って最後尾ブロックにシフト入力し、先頭ブロック
    から前記第2のメモリにデータブロックをシフト出力す
    るシフトレジスタ構造を備えたrデータブロック(IV
    、≧0)の容量をもつ第3のメモリと、現在格納されて
    いるデータブロック数を記憶する行列長レジスタと、前
    記第1のメモリに対するデータブロックの書込み終了信
    号によって前記第1のメモリの内容を前記行列長レジス
    タの示すデータブロック数の次のブロックまで順次シフ
    トして前記行列長レジスタを1加算し、寸だ前記第2の
    メモリに対するデータブロックの読出し終了信号によっ
    て現在格納されているデータブロックをすべてシフトし
    て前記行列長レジスタを1減算するシフト制御回路とを
    備えた並列処理装置。
  2. (2)最大2n語の容量よりなる1ブロツクのデータを
    記憶し、それぞれがn本(n≧1)からなる第1.第2
    のアドレス信号により同時に2語のデータ読出しが可能
    で、またデータ書込みも可能な2ポー)RAM構造およ
    びシフトレジスタ構造を兼ね備えた第1のメモリと、前
    記第1のメモリから読出された2語のデータをそれぞれ
    第1.第2のバスを弁して入力し、これらのデータに対
    して算術論理演算を施し再び前記第1または第2のバス
    を介して前記第1のメモリにその結果を出力する第」の
    算術論理演算ユニットと、前記第1のメモリと同じ容量
    のデータを記憶し、それぞれがn本からなる第3.第4
    のアドレス信号線rこより同時に2語のデータ読出しが
    可能で、ま/ζデータ書込みも可能な2ポ一トRAM構
    造およびシフトレジスタ構造を兼ね備えた第2のメモリ
    と、前記第2のメモリから読出された2語のデータをそ
    れぞれ第3.第4のバスを介して入力し、これらのデー
    タに対して算術論理演算を施し再び前記第3または第4
    のバスを介して前記第2のメモリにその結果を出力する
    第2の算術論理演算ユニットと、前記第1のメモリと第
    2のメモリの間に位置し、前記第1のメモリ内の全デー
    タをシフト制御信号に従って最後尾ブロックにシフト入
    力し、先頭ブロックから前記第2のメモリにデータブロ
    ックをシフト出力するソフトレジスタ構造を備えた必デ
    ータブロック(U≧O)の容量をもつ第3のメモリと、
    現在格納されているデータブロックθを記憶する行列長
    レジスタと、前記第1のメモリに対するデータブロック
    の書込み終了信号によって前記第1のメモリの内容を前
    記行列長レジスタの示すデータブロック数の次のブロッ
    ク1で順次シフトして前記行列長レジスタを1加算し、
    すた前記第2のメモリに対するデータブロックの読出し
    終了信号によって現在格納されているデータブロックを
    すべてシフトして前記行列長レジスタを1減算するシフ
    ト制御回路とを備えた並列処理装置。
JP13842683A 1983-07-27 1983-07-27 並列処理装置 Granted JPS6027977A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13842683A JPS6027977A (ja) 1983-07-27 1983-07-27 並列処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13842683A JPS6027977A (ja) 1983-07-27 1983-07-27 並列処理装置

Publications (2)

Publication Number Publication Date
JPS6027977A true JPS6027977A (ja) 1985-02-13
JPH0521262B2 JPH0521262B2 (ja) 1993-03-23

Family

ID=15221687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13842683A Granted JPS6027977A (ja) 1983-07-27 1983-07-27 並列処理装置

Country Status (1)

Country Link
JP (1) JPS6027977A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54119930A (en) * 1978-03-10 1979-09-18 Canon Inc Pressure-fixed toner
JPH01179515A (ja) * 1988-01-11 1989-07-17 Sanyo Electric Co Ltd デジタル信号処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54119930A (en) * 1978-03-10 1979-09-18 Canon Inc Pressure-fixed toner
JPS6029110B2 (ja) * 1978-03-10 1985-07-09 キヤノン株式会社 圧力定着用トナ−
JPH01179515A (ja) * 1988-01-11 1989-07-17 Sanyo Electric Co Ltd デジタル信号処理装置

Also Published As

Publication number Publication date
JPH0521262B2 (ja) 1993-03-23

Similar Documents

Publication Publication Date Title
AU645785B2 (en) Parallel processor memory system
EP0248906B1 (en) Multi-port memory system
US4789925A (en) Vector data logical usage conflict detection
US4875161A (en) Scientific processor vector file organization
JPH0425586B2 (ja)
JP3569735B2 (ja) Sramキャッシュ用ワード幅選択
JPH0622034B2 (ja) マルチポートベクトルレジスタファイル
CN111656339B (zh) 存储器装置及其控制方法
US4835684A (en) Microcomputer capable of transferring data from one location to another within a memory without an intermediary data bus
CA2478570A1 (en) Data processing apparatus and system and method for controlling memory access
JPS62147546A (ja) マルチ・ポ−ト・メモリ装置
JPS62272343A (ja) 高速分散制御メモリシステムおよびその方法
JP4860891B2 (ja) ビット順次手法により大容量並列プロセッサアレイをメモリアレイに接続する方法及び装置
CN1017837B (zh) 具有单比特置位和复位功能的主存储器插板
JPS6027977A (ja) 並列処理装置
US6647450B1 (en) Multiprocessor computer systems with command FIFO buffer at each target device
EP0211613A2 (en) Scientific processor vector file organization
EP0136218A2 (en) Multiple port pipelined processor
US5822766A (en) Main memory interface for high speed data transfer
JPH0427583B2 (ja)
JPS61256478A (ja) 並列処理計算機
JPH0646413B2 (ja) デ−タ処理プロセッサ
JP2806930B2 (ja) 主記憶一致制御方式
KR20230142368A (ko) 미리 결정된 수학적 연산을 수행하는 프로세서 및 컴퓨팅 유닛
JPH0652516B2 (ja) バス・インターフェース装置