JPS6043775A - デ−タ処理装置 - Google Patents
デ−タ処理装置Info
- Publication number
- JPS6043775A JPS6043775A JP15132783A JP15132783A JPS6043775A JP S6043775 A JPS6043775 A JP S6043775A JP 15132783 A JP15132783 A JP 15132783A JP 15132783 A JP15132783 A JP 15132783A JP S6043775 A JPS6043775 A JP S6043775A
- Authority
- JP
- Japan
- Prior art keywords
- access
- vector
- time
- section
- vector register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8053—Vector processors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Complex Calculations (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
発明の属する技術分野
本発明は主メモリ上のデータをベクトルレジスjに転送
してこのベクトルレジスタに転送したデ−夕を使用して
ベクトル演算を行うデータ処理装置に関する。
してこのベクトルレジスタに転送したデ−夕を使用して
ベクトル演算を行うデータ処理装置に関する。
従来技術
第1図を参照すると、この種の従来のデータ処理装置で
は主メモリ1から2本のアクセスパイプライン6および
7を介してメモリ制御装置2に各要素のデータがそれぞ
れ1マシンサイクルに2要素ずつ順次読出され、ベクト
ルレジスタ部3内のベクトルレジスタにセットされる。
は主メモリ1から2本のアクセスパイプライン6および
7を介してメモリ制御装置2に各要素のデータがそれぞ
れ1マシンサイクルに2要素ずつ順次読出され、ベクト
ルレジスタ部3内のベクトルレジスタにセットされる。
このベクトルレジスタの各要素のデータに対し、演算パ
イプライン部4または5によシ、1マシンサイクルに2
敬素ずつ順次演算が実行される。例えば、主メモリ上の
ベクトルデータA、BおよびCがそれぞれ32の要素A
(0) 、 A(1) 、・・A(30)およびA (
31); B(o) 、 B(1) 、・・B(30)
およびB(31) i C(0)。
イプライン部4または5によシ、1マシンサイクルに2
敬素ずつ順次演算が実行される。例えば、主メモリ上の
ベクトルデータA、BおよびCがそれぞれ32の要素A
(0) 、 A(1) 、・・A(30)およびA (
31); B(o) 、 B(1) 、・・B(30)
およびB(31) i C(0)。
C(1)、・・C(30)およびC(31)からなると
き、C=A十B なるベクトル演算はベクトルレジスタVRO。
き、C=A十B なるベクトル演算はベクトルレジスタVRO。
VRlおよびVB、2を用い4つのベクトル命令で実行
される。すなわち、 命令(1) : VRo (−A 命令(2): VRl ← B 命令(3):VB2 ← VRQ+VR1命令(4)
: C← VB2 のよりである。
される。すなわち、 命令(1) : VRo (−A 命令(2): VRl ← B 命令(3):VB2 ← VRQ+VR1命令(4)
: C← VB2 のよりである。
命令(1)はアクセスパイプライン6を介して主メモリ
1上のベクトルデータAの32個の要素をベクトルレジ
スタ部3内のベクトルレジスタVROにセットし、命令
(2)はアクセスパイプライン7を介して主メモIJ
l上のベクトルデータBの32個の要素をベクトルレジ
スタ部3内のベクトルレジスタVJにセットする。命令
(3)はベクトルレジスタ部3内の2本のベクトルレジ
スタVROおよびVRlからデータを読出し演算パイプ
ライン部4で加算を実行し、和をベクトルレジスタ3内
のベクトルレジスタVR2にセントする。命令(4)は
ベクトルレジスタ3内のベクトルレジスタ■R2の32
個の要素を読出しアクセスパイプライン6を介して主メ
モリ1にベクトルデータCとして格納する。
1上のベクトルデータAの32個の要素をベクトルレジ
スタ部3内のベクトルレジスタVROにセットし、命令
(2)はアクセスパイプライン7を介して主メモIJ
l上のベクトルデータBの32個の要素をベクトルレジ
スタ部3内のベクトルレジスタVJにセットする。命令
(3)はベクトルレジスタ部3内の2本のベクトルレジ
スタVROおよびVRlからデータを読出し演算パイプ
ライン部4で加算を実行し、和をベクトルレジスタ3内
のベクトルレジスタVR2にセントする。命令(4)は
ベクトルレジスタ3内のベクトルレジスタ■R2の32
個の要素を読出しアクセスパイプライン6を介して主メ
モリ1にベクトルデータCとして格納する。
一般に主メモリ1に使用するメモリ素子のサイクル時間
はマシンサイクル時間よシ長く、数倍程度長いこともめ
ずらしくなく、主メモリをいくつかのバンクに分割する
ことがしばしば行われている。
はマシンサイクル時間よシ長く、数倍程度長いこともめ
ずらしくなく、主メモリをいくつかのバンクに分割する
ことがしばしば行われている。
例えば第2図を参照すると、主メモリ1は4つのモジュ
ールllaないしIldに分かれ・各モジュールは1マ
シンサイクルに1つのベクトル要素を読出し/書込みで
きる。各モジーールは4つのバンク12aないし12d
からなり、各バンクは4マシンサイクルに1つのベクト
ル要素を読出し/書込みできる。各バンクには#0ない
し#15のバンク番号が付与されておシ、#iのバンク
には番地を16で割ったときの剰余がiであるデータが
格納されている。ベクトルデータは隣接した要素が主メ
モリ上に格納される番地の差を要素間距離という。要素
間距離は1とは限らない。例えば35行35列の行列M
(’I I J ) を行方向に主メ゛モリに格納(M
(0,0) 、M(1、O) 、 ・M(34,0)。
ールllaないしIldに分かれ・各モジュールは1マ
シンサイクルに1つのベクトル要素を読出し/書込みで
きる。各モジーールは4つのバンク12aないし12d
からなり、各バンクは4マシンサイクルに1つのベクト
ル要素を読出し/書込みできる。各バンクには#0ない
し#15のバンク番号が付与されておシ、#iのバンク
には番地を16で割ったときの剰余がiであるデータが
格納されている。ベクトルデータは隣接した要素が主メ
モリ上に格納される番地の差を要素間距離という。要素
間距離は1とは限らない。例えば35行35列の行列M
(’I I J ) を行方向に主メ゛モリに格納(M
(0,0) 、M(1、O) 、 ・M(34,0)。
M(0,1)、M(1,1)、−、M(34,1)、M
(0,2)・・・)すると列ベクトルM(0+j)+M
(1+j)+ 。
(0,2)・・・)すると列ベクトルM(0+j)+M
(1+j)+ 。
M(34,j)の要素間距離は1であるが、行ベクトル
M(i、O)、M(i、1)、・・・、M(i、34)
の要素間距離は35である。
M(i、O)、M(i、1)、・・・、M(i、34)
の要素間距離は35である。
第3図を参照すると、ベクトルAの要素間距離を1.ベ
クトルBの要素間距離を35とし、A(0)B(0)と
もにMB#0に格納されているとすると、A(1)はM
B$1.人(2)はMB:14=2 、・、A(15)
はMB(xs)。
クトルBの要素間距離を35とし、A(0)B(0)と
もにMB#0に格納されているとすると、A(1)はM
B$1.人(2)はMB:14=2 、・、A(15)
はMB(xs)。
A(16)はM’B:#0 、・・・、A(31)はM
B#15に格納され、B(1)はMB#3 、 B (
2)はMB#6.・・、 B (6)はMB#2、・・
・、B(31)はMB:#13に格納される。この時の
主メモリ1に対する各要素のアクセスの状況を第3図に
示す。
B#15に格納され、B(1)はMB#3 、 B (
2)はMB#6.・・、 B (6)はMB#2、・・
・、B(31)はMB:#13に格納される。この時の
主メモリ1に対する各要素のアクセスの状況を第3図に
示す。
まず命令1が発行され、1マシンサイクルに2要素ずつ
、A(0)とA(1)がMB#0とMB、#lから・A
(2)とA(3)がMB@2とMB#3から、・、と読
出されていく。MB$0とMB#tは時刻Oから時刻3
まで使用中とl)、MB$2とMB#:3は時刻1から
時刻4まで使用中となる。命令(1)に引継き命令2が
発行されB(0)とB(1)を主メモリ1から読出す。
、A(0)とA(1)がMB#0とMB、#lから・A
(2)とA(3)がMB@2とMB#3から、・、と読
出されていく。MB$0とMB#tは時刻Oから時刻3
まで使用中とl)、MB$2とMB#:3は時刻1から
時刻4まで使用中となる。命令(1)に引継き命令2が
発行されB(0)とB(1)を主メモリ1から読出す。
11(01゜B(1)はそれぞれMB$0.MB@3を
アクセスしなければならない。MB#= 3は命令(1
)によシ時刻1から時刻4まで使用中なのでB (0)
、 B (1)のアクセス時刻5から時刻8の間に行
われる。B (2) 、 B (3)のアクセスはMB
#、9が命令(1)で時刻7まで使用中のため時刻8か
ら時刻11の間に行われる。従って、例えば、時刻5か
ら時刻14の10マシンサイクルの間にA(10)〜A
(27) 、 B(0)〜B(5)の24の要素のアク
セスが開始され、1マシンサイクルに4要素毎アクセス
を開始する場合に比ベロ0%の効率しかない。
アクセスしなければならない。MB#= 3は命令(1
)によシ時刻1から時刻4まで使用中なのでB (0)
、 B (1)のアクセス時刻5から時刻8の間に行
われる。B (2) 、 B (3)のアクセスはMB
#、9が命令(1)で時刻7まで使用中のため時刻8か
ら時刻11の間に行われる。従って、例えば、時刻5か
ら時刻14の10マシンサイクルの間にA(10)〜A
(27) 、 B(0)〜B(5)の24の要素のアク
セスが開始され、1マシンサイクルに4要素毎アクセス
を開始する場合に比ベロ0%の効率しかない。
このように従来この種のデータ処理装置では要素間距離
の異るアクセスを同時に行うとメモリアクセスの効率が
著しく低下するとい5欠点がある。
の異るアクセスを同時に行うとメモリアクセスの効率が
著しく低下するとい5欠点がある。
発明の目的
本発明の目的は上述の欠点を除去しメモリバンク使用中
によるメモリアクセスの待ち時間を減らしメモリアクセ
スの効率が高いデータ処理装置を提供することにある。
によるメモリアクセスの待ち時間を減らしメモリアクセ
スの効率が高いデータ処理装置を提供することにある。
発明の構成
本発明の装置は主メモリと、複数のベクトルレジスタを
有するベクトルレジスタ部と、主メモリとベクトルレジ
スタ部との間でデータ転送を行うアクセスパイプライン
部と、ベクトルレジスタの要素に対して演算を行う演算
パイプライン部を有するデータ処理装置において、 主メモリをアクセスパイプライン部の1組のメそりアク
セスポートに接続し、1つのベクトルレジスタに対応す
るデータ転送を1マシンサイクルに2m個の要素の割合
で直列に実行し、ベクトルレジスタ部をアクセスパイプ
ライン部の2組のベクトルアクセスポートに接続し、1
つのベクトルレジスタに対応するデータ転送t−1マシ
ンサイクルにm個の要素の割合で並列に転送し、アクセ
スパイプラインが2組のバッファでできておシ、メモリ
アクセスポートで転送されるデータは要素毎に交互に2
組りバッファのいずれかに対応し、2 べ組のベクトル
アクセスポートは2X2クロスバ−で2組のバッファと
接続されているように構成されている。
有するベクトルレジスタ部と、主メモリとベクトルレジ
スタ部との間でデータ転送を行うアクセスパイプライン
部と、ベクトルレジスタの要素に対して演算を行う演算
パイプライン部を有するデータ処理装置において、 主メモリをアクセスパイプライン部の1組のメそりアク
セスポートに接続し、1つのベクトルレジスタに対応す
るデータ転送を1マシンサイクルに2m個の要素の割合
で直列に実行し、ベクトルレジスタ部をアクセスパイプ
ライン部の2組のベクトルアクセスポートに接続し、1
つのベクトルレジスタに対応するデータ転送t−1マシ
ンサイクルにm個の要素の割合で並列に転送し、アクセ
スパイプラインが2組のバッファでできておシ、メモリ
アクセスポートで転送されるデータは要素毎に交互に2
組りバッファのいずれかに対応し、2 べ組のベクトル
アクセスポートは2X2クロスバ−で2組のバッファと
接続されているように構成されている。
次に本発明について図面を参照して詳細に説明する・第
4図全参照すると、本発明の一実施例は、主メモリ1.
メモリ制御装置2.ベクトルレジスタ部3.加算パイプ
ライン部42乗算パイプライン部5およびアクセスパイ
プライン部8から構成されている。主メモリ1とメモリ
制御装置2は4部8からのメモリアクセスを制御し、ア
クセスパイプライン部8と?′i4本の読出しラインと
4本の書込みラインで接続される。アクセスパイプライ
ン部8とベクトルレジスタ部3とはそれぞれ2本の読出
しラインと2本の書込みラインをもつ2つのポートで接
続される。加算パイプライン部4と乗算パイプライン部
5とはそれぞれベクトルレジスタ部3から2本×2組の
オペランドの供給を受け2本の出力をベクトルレジスタ
部3に返す。
4図全参照すると、本発明の一実施例は、主メモリ1.
メモリ制御装置2.ベクトルレジスタ部3.加算パイプ
ライン部42乗算パイプライン部5およびアクセスパイ
プライン部8から構成されている。主メモリ1とメモリ
制御装置2は4部8からのメモリアクセスを制御し、ア
クセスパイプライン部8と?′i4本の読出しラインと
4本の書込みラインで接続される。アクセスパイプライ
ン部8とベクトルレジスタ部3とはそれぞれ2本の読出
しラインと2本の書込みラインをもつ2つのポートで接
続される。加算パイプライン部4と乗算パイプライン部
5とはそれぞれベクトルレジスタ部3から2本×2組の
オペランドの供給を受け2本の出力をベクトルレジスタ
部3に返す。
主メモリ1とメモリ制御部2との間の転送レートは読出
し/書込みとも4語/マンンサイクル、メモリ制御部2
とアクセスパイプライン部8との間の転送レートは読出
し/書込みとも4語/マシンサイクル、アクセスパイプ
ライン部8とベクトルレジスタ部3との間の転送レート
はボート当シ読出し/書込みとも2語/マシンサイクル
、加算パイプライン部と乗算パイプライン部の演算レー
トはともに2語/マシンサイクルである。
し/書込みとも4語/マンンサイクル、メモリ制御部2
とアクセスパイプライン部8との間の転送レートは読出
し/書込みとも4語/マシンサイクル、アクセスパイプ
ライン部8とベクトルレジスタ部3との間の転送レート
はボート当シ読出し/書込みとも2語/マシンサイクル
、加算パイプライン部と乗算パイプライン部の演算レー
トはともに2語/マシンサイクルである。
前記主メモリ1は第2図に示すよりに4つのモジュール
llaないしlidからなシ、各モジュールは4つのバ
ンク12aないし12dからなっている。
llaないしlidからなシ、各モジュールは4つのバ
ンク12aないし12dからなっている。
第5図を参照すると、アクセスパイプライン部8は2つ
のバッファBFO81とBFI 82および2×2クロ
スバ83から構成され、バッファBFO81とBFI
82はそれぞれアクセスノくイブライン部8の読出しラ
イン、書込みラインの半数のラインと接続され、かつ、
クロスバ83の一方のポート群A、B、WおよびXに接
続されているOクロスバ83のもう一方のボート群C,
D、Yおよび2はベクトルレジスタ部と接続されている
。
のバッファBFO81とBFI 82および2×2クロ
スバ83から構成され、バッファBFO81とBFI
82はそれぞれアクセスノくイブライン部8の読出しラ
イン、書込みラインの半数のラインと接続され、かつ、
クロスバ83の一方のポート群A、B、WおよびXに接
続されているOクロスバ83のもう一方のボート群C,
D、Yおよび2はベクトルレジスタ部と接続されている
。
第6図を参照すると、主メモリの各バンクのサイクルが
4マシンサイクルとし、ベクトルAの各要素A(0)
、 A(1) 、・・・、A(30)およびA(31)
がそれぞれ主メモリのバンクMB#O,MB#1.・・
・。
4マシンサイクルとし、ベクトルAの各要素A(0)
、 A(1) 、・・・、A(30)およびA(31)
がそれぞれ主メモリのバンクMB#O,MB#1.・・
・。
MB#30およびMB#31に格納されておシ、ベクト
ルBの各要素B(o) 、 B(j) 、・・・、B(
30)およびB(31)が3つ置きの主メモリのバンク
MB$O。
ルBの各要素B(o) 、 B(j) 、・・・、B(
30)およびB(31)が3つ置きの主メモリのバンク
MB$O。
MB#3.MB#6.・・・MB#8 、 MB:#
11 、 MB#14に格納されている場合の主メモリ
1のバンクのサイクルの状態が示されている。時刻のき
ざみはマシンサイクルであシ、時刻OでA(0) 、
A(1) 、 A(2)およびA(3)が格納されてい
るバンクMB#O,MB:#1.MB#:2およびMB
$3がアクセスされ、時刻0〜3の4マシンサイクルの
間ビジーとなる。時刻1でA(4) 、 A(5) 、
A(6)およびA(7)が格納されているバンクMB
$4.MB$5.MB#6およびMB$7がアクセスさ
れ、時刻1〜4の4マシンサイクルの間ビジーとなる。
11 、 MB#14に格納されている場合の主メモリ
1のバンクのサイクルの状態が示されている。時刻のき
ざみはマシンサイクルであシ、時刻OでA(0) 、
A(1) 、 A(2)およびA(3)が格納されてい
るバンクMB#O,MB:#1.MB#:2およびMB
$3がアクセスされ、時刻0〜3の4マシンサイクルの
間ビジーとなる。時刻1でA(4) 、 A(5) 、
A(6)およびA(7)が格納されているバンクMB
$4.MB$5.MB#6およびMB$7がアクセスさ
れ、時刻1〜4の4マシンサイクルの間ビジーとなる。
同様にしてMB$g〜MB:#11は時刻2〜5の間、
MB#x2〜MB#15は時刻3〜6の間ビジーとなる
。時刻4でA(16)〜A(19)のアクセスを行うが
、このときMB#0〜MB#:3は先行アクセスによる
ビジー期間を終了しているので、バンクビジーによる待
ち合せを行うことなくA(16)〜A(19)のアクセ
スが行われる。A(20)〜A(31) についても同
様にバンクビジーによる待合せなしにアクセスが行われ
る。
MB#x2〜MB#15は時刻3〜6の間ビジーとなる
。時刻4でA(16)〜A(19)のアクセスを行うが
、このときMB#0〜MB#:3は先行アクセスによる
ビジー期間を終了しているので、バンクビジーによる待
ち合せを行うことなくA(16)〜A(19)のアクセ
スが行われる。A(20)〜A(31) についても同
様にバンクビジーによる待合せなしにアクセスが行われ
る。
時刻7でベクトルAの全要素についてのアクセスが終了
し時刻8でベクトルBのアクセスを開始する。ベクトル
Bの最初の4要素B(0) 、 B(1) 、 B(2
)およびB(3)の格納されているメモリのバンクはM
B#0.MB#:3.MB$6およびMB$9 である
が、MB−11:9が先行するアクセスのため時刻6〜
9の間ビジーのため、B(o)〜B(3)のアクセスは
2マシンサイクル遅れて時刻10に行われる。以後はバ
ンクビジーによる待合せは発生せず時刻17にB(28
)〜B(31)が格納されているメモリバンクMB$5
、 MB#8 、 MB:14:11およびMB$1
4のアクセスが行われ、ベクトルBの全要素についての
アクセスが終了する。
し時刻8でベクトルBのアクセスを開始する。ベクトル
Bの最初の4要素B(0) 、 B(1) 、 B(2
)およびB(3)の格納されているメモリのバンクはM
B#0.MB#:3.MB$6およびMB$9 である
が、MB−11:9が先行するアクセスのため時刻6〜
9の間ビジーのため、B(o)〜B(3)のアクセスは
2マシンサイクル遅れて時刻10に行われる。以後はバ
ンクビジーによる待合せは発生せず時刻17にB(28
)〜B(31)が格納されているメモリバンクMB$5
、 MB#8 、 MB:14:11およびMB$1
4のアクセスが行われ、ベクトルBの全要素についての
アクセスが終了する。
第7図はアクセスパイプライン部8におけるノ(ソファ
動作を説明するものである。ここではA (0)〜A(
3)がアクセスパイプライン部8に到着する時刻を0と
した時間で表している。
動作を説明するものである。ここではA (0)〜A(
3)がアクセスパイプライン部8に到着する時刻を0と
した時間で表している。
時刻OでA(0)〜A(3)の4語がアクセスパイプラ
イン部8に到着するが、そのうちA(01、A(1)の
2語をバッファBFoにA (2) 、 A (3)の
2語をバッファBFIに格納する。時刻1でA(4)〜
A(7)の2語が到着するのでA(4) 、 A(51
の2語をバッファBFOに、A (6) 、 A (7
)の2語をバッファBFIに格納する。同様にしてA(
s) 、 A(9) 、 A(12) 、A(13)
、 −A(28) 、A(29)がバッフ7BFOに、
A(10)。
イン部8に到着するが、そのうちA(01、A(1)の
2語をバッファBFoにA (2) 、 A (3)の
2語をバッファBFIに格納する。時刻1でA(4)〜
A(7)の2語が到着するのでA(4) 、 A(51
の2語をバッファBFOに、A (6) 、 A (7
)の2語をバッファBFIに格納する。同様にしてA(
s) 、 A(9) 、 A(12) 、A(13)
、 −A(28) 、A(29)がバッフ7BFOに、
A(10)。
A(11) 、 −、A(30)、A(31)がバッフ
ァBF1に格納される◇ベクトルBのバッファへの格納
も同様にして時刻10でB(o) 、 B(1)がバッ
ファBFOに、B (2) 、 B (3)がバッファ
BFIに格納され時匈111でB (4) 、 B (
5)がバッファBFQに、B(4)。
ァBF1に格納される◇ベクトルBのバッファへの格納
も同様にして時刻10でB(o) 、 B(1)がバッ
ファBFOに、B (2) 、 B (3)がバッファ
BFIに格納され時匈111でB (4) 、 B (
5)がバッファBFQに、B(4)。
B(5)がバッファBFIに格納され、時刻17でB(
28)、B(29)がバッファBPOに、E(30)。
28)、B(29)がバッファBPOに、E(30)。
B(31)がバッファ BFlに格納される。時刻1で
バッファBFOからA (0) 、 A (1)を時刻
(2)でバッファBFIからA (2) 、 A (3
)を読出し以後バッファBFOおよびBFlから交互に
Aベクトルの要素を2語ずつ読み出し、クロスバ83を
制御してクロスバ83のボートCにAベクトルの要素が
2語/マシンサイクルの割合でベクトルレジスタ部3に
送られる。
バッファBFOからA (0) 、 A (1)を時刻
(2)でバッファBFIからA (2) 、 A (3
)を読出し以後バッファBFOおよびBFlから交互に
Aベクトルの要素を2語ずつ読み出し、クロスバ83を
制御してクロスバ83のボートCにAベクトルの要素が
2語/マシンサイクルの割合でベクトルレジスタ部3に
送られる。
Aベクトルの要素がベクトルレジスタ部3に送られてい
る間にBベクトルがアクセスパイプライン部8に送られ
てきており、時刻11から読部し可能となる。時刻11
ではバッファBFOの読出しボートはAベクトルのため
に占有されているのでB (0) 、 B (1)のB
FOからの読出しは時刻12に行われる。続いて、時刻
13にB (2) 、 B (3)をバッフγBFIか
ら読出し、以後バッファBFOとBFlから交互にBベ
クトルの要素を2@ずつ読出し、クロスバ83を制御し
てクロスバ83のボートDにBベクトルの要素が2語/
マシンサイクルの割合でペクト、ルレジスタ部3に送ら
れる。
る間にBベクトルがアクセスパイプライン部8に送られ
てきており、時刻11から読部し可能となる。時刻11
ではバッファBFOの読出しボートはAベクトルのため
に占有されているのでB (0) 、 B (1)のB
FOからの読出しは時刻12に行われる。続いて、時刻
13にB (2) 、 B (3)をバッフγBFIか
ら読出し、以後バッファBFOとBFlから交互にBベ
クトルの要素を2@ずつ読出し、クロスバ83を制御し
てクロスバ83のボートDにBベクトルの要素が2語/
マシンサイクルの割合でペクト、ルレジスタ部3に送ら
れる。
発明の効果
本発明にはアクセスパイプライン部を仲介して、主メモ
リとの間は1つのベクトルレジスタに対応するデータ転
送を直列に実行し、ベクトルレジスタ部との間は2つの
ベクトルレジスタに対応するデータ転送を並列に実行す
る構成をとることによシ、主メモリのメモリアクセス効
率の低減を防ぐことができるという効果がある。
リとの間は1つのベクトルレジスタに対応するデータ転
送を直列に実行し、ベクトルレジスタ部との間は2つの
ベクトルレジスタに対応するデータ転送を並列に実行す
る構成をとることによシ、主メモリのメモリアクセス効
率の低減を防ぐことができるという効果がある。
第1図は従来技術を示す図、第2図は第1図および第4
図に示す主メモリ部分を示す図、第3図は従来技術のメ
モリバンクのビジーの状態を示すタイムチャート・第4
図は本発明の一実施例を示す図、第5図は第4図に示し
だアクセスパイプライン部を示す図、第6図は第4図の
動作を説明するだめのメモリバンクのビジーのタイムチ
ャートおよび第7図はアクセスパイプライン部のバッフ
了およびクロスバの動作を説明するためのタイムチャー
トである。 第1図から第7図において、1−・・・主メモリ、2・
・・・・メモリ制御部、3・ ベクトルレジスタ部、4
・・・・・加算パイプライン部、5・・・・・乗算パイ
プラインs、6〜8・・・・・・アクセスパイプライン
部、11a〜lid・・・・メモリモジュール、128
〜12d・・メモリバンク、81〜82・・・・バッフ
丁、83・−・2X2クロスバ。 11( +1 応3m 方4閃 アクセスノぐイブラA’y音に一シ/△べ゛クトルレン
スタ肩ヤカ・、シ/へ 4)5 圀
図に示す主メモリ部分を示す図、第3図は従来技術のメ
モリバンクのビジーの状態を示すタイムチャート・第4
図は本発明の一実施例を示す図、第5図は第4図に示し
だアクセスパイプライン部を示す図、第6図は第4図の
動作を説明するだめのメモリバンクのビジーのタイムチ
ャートおよび第7図はアクセスパイプライン部のバッフ
了およびクロスバの動作を説明するためのタイムチャー
トである。 第1図から第7図において、1−・・・主メモリ、2・
・・・・メモリ制御部、3・ ベクトルレジスタ部、4
・・・・・加算パイプライン部、5・・・・・乗算パイ
プラインs、6〜8・・・・・・アクセスパイプライン
部、11a〜lid・・・・メモリモジュール、128
〜12d・・メモリバンク、81〜82・・・・バッフ
丁、83・−・2X2クロスバ。 11( +1 応3m 方4閃 アクセスノぐイブラA’y音に一シ/△べ゛クトルレン
スタ肩ヤカ・、シ/へ 4)5 圀
Claims (1)
- 【特許請求の範囲】 1、主メモリと、複数のベクトルレジスタを有するベク
トルレジスタ部と、前記主メモリと前記ベクトルレジス
タ部との間でデータ転送を行うアクセスパイプライン部
と、前記ベクトルレジスタの要素に対して演算を行なう
演算ノくイブライン部とを有するデータ処理装置におい
て、前記アクセスパイプライン部の1組のメモ1ノアク
セスポートに接続された前記主メモリでは1つのベクト
ルレジスタに対応するデータ転送が順次実行され、 前記アクセスパイプライン部の2組のベクトルアクセス
ポートに接続された前記ベクトルレジスタ部では2つの
ベクトルレジスタニ対応スるデータ転送が同時に実行さ
れうろことを特徴とするデータ処理装置 2.1つの演算パイプラインが1マシンサイクルでm語
の結果を出力するときに前記アクセスパイプライン部は
ベクトルアクセスポートの1つが1マシンサイクルでm
語の要素を転送しメモリアクセスポートが1マシンサイ
クルで2m語の要素を転送することを特徴とする特許請
求範囲第1項記載のデータ処理装置。 3、 前記アクセスパイプラインが2組のバッフ丁を含
みメモリアクセスポートで転送されるデータは要素毎に
交互に2組のバッフ丁のいずれかに対応し、2組のベク
トルアクセスポートは2X2クロスバ−で2組のバッフ
丁を接続されていることを特徴とする特許請求範囲第1
項記載のデータ処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15132783A JPS6043775A (ja) | 1983-08-19 | 1983-08-19 | デ−タ処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15132783A JPS6043775A (ja) | 1983-08-19 | 1983-08-19 | デ−タ処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6043775A true JPS6043775A (ja) | 1985-03-08 |
JPH0332829B2 JPH0332829B2 (ja) | 1991-05-14 |
Family
ID=15516178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15132783A Granted JPS6043775A (ja) | 1983-08-19 | 1983-08-19 | デ−タ処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6043775A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01284966A (ja) * | 1988-05-11 | 1989-11-16 | Nec Corp | データ処理装置 |
JPH01316871A (ja) * | 1988-06-17 | 1989-12-21 | Nec Corp | ベクトル処理装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5466727A (en) * | 1977-11-07 | 1979-05-29 | Fujitsu Ltd | Access control system for buffer memory |
JPS5491151A (en) * | 1977-12-28 | 1979-07-19 | Fujitsu Ltd | Internal memory control system on array processor |
JPS5798070A (en) * | 1980-12-12 | 1982-06-18 | Fujitsu Ltd | Data processing device |
-
1983
- 1983-08-19 JP JP15132783A patent/JPS6043775A/ja active Granted
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5466727A (en) * | 1977-11-07 | 1979-05-29 | Fujitsu Ltd | Access control system for buffer memory |
JPS5491151A (en) * | 1977-12-28 | 1979-07-19 | Fujitsu Ltd | Internal memory control system on array processor |
JPS5798070A (en) * | 1980-12-12 | 1982-06-18 | Fujitsu Ltd | Data processing device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01284966A (ja) * | 1988-05-11 | 1989-11-16 | Nec Corp | データ処理装置 |
JPH01316871A (ja) * | 1988-06-17 | 1989-12-21 | Nec Corp | ベクトル処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0332829B2 (ja) | 1991-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4891751A (en) | Massively parallel vector processing computer | |
US4896265A (en) | Parallel broadcasting method and apparatus | |
US20090254697A1 (en) | Memory with embedded associative section for computations | |
WO2019076108A1 (zh) | 卷积神经网络运算电路 | |
JPH0425586B2 (ja) | ||
JPS63316168A (ja) | 並列隣接演算処理システム及びその方法 | |
EP3844610B1 (en) | Method and system for performing parallel computation | |
US20050289329A1 (en) | Conditional instruction for a single instruction, multiple data execution engine | |
JP2011141823A (ja) | データ処理装置および並列演算装置 | |
JPS6043775A (ja) | デ−タ処理装置 | |
US3898626A (en) | Data processing apparatus | |
US6085304A (en) | Interface for processing element array | |
JPH0345420B2 (ja) | ||
JP4237046B2 (ja) | 画像処理装置 | |
JP2002269067A (ja) | 行列演算装置 | |
JP2008102599A (ja) | プロセッサ | |
JP4482356B2 (ja) | Simdプロセッサを用いた画像処理方法及び画像処理装置 | |
JP2812292B2 (ja) | 画像処理装置 | |
JP2855899B2 (ja) | 機能メモリ | |
JPS60211580A (ja) | データの記憶および検索方法、装置 | |
JPS6027977A (ja) | 並列処理装置 | |
JP2610500B2 (ja) | 並列ベクトル計算機 | |
JPS599944B2 (ja) | デ−タ処理装置 | |
JPS6058503B2 (ja) | デ−タ処理制御方式 | |
CN115033843A (zh) | 基于三角脉动阵列的协方差矩阵计算的电路实现方法 |