JPS6043775A - デ−タ処理装置 - Google Patents

デ−タ処理装置

Info

Publication number
JPS6043775A
JPS6043775A JP15132783A JP15132783A JPS6043775A JP S6043775 A JPS6043775 A JP S6043775A JP 15132783 A JP15132783 A JP 15132783A JP 15132783 A JP15132783 A JP 15132783A JP S6043775 A JPS6043775 A JP S6043775A
Authority
JP
Japan
Prior art keywords
access
vector
time
section
vector register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP15132783A
Other languages
English (en)
Other versions
JPH0332829B2 (ja
Inventor
Hajime Matsumoto
松本 元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP15132783A priority Critical patent/JPS6043775A/ja
Publication of JPS6043775A publication Critical patent/JPS6043775A/ja
Publication of JPH0332829B2 publication Critical patent/JPH0332829B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8053Vector processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の属する技術分野 本発明は主メモリ上のデータをベクトルレジスjに転送
してこのベクトルレジスタに転送したデ−夕を使用して
ベクトル演算を行うデータ処理装置に関する。
従来技術 第1図を参照すると、この種の従来のデータ処理装置で
は主メモリ1から2本のアクセスパイプライン6および
7を介してメモリ制御装置2に各要素のデータがそれぞ
れ1マシンサイクルに2要素ずつ順次読出され、ベクト
ルレジスタ部3内のベクトルレジスタにセットされる。
このベクトルレジスタの各要素のデータに対し、演算パ
イプライン部4または5によシ、1マシンサイクルに2
敬素ずつ順次演算が実行される。例えば、主メモリ上の
ベクトルデータA、BおよびCがそれぞれ32の要素A
(0) 、 A(1) 、・・A(30)およびA (
31); B(o) 、 B(1) 、・・B(30)
およびB(31) i C(0)。
C(1)、・・C(30)およびC(31)からなると
き、C=A十B なるベクトル演算はベクトルレジスタVRO。
VRlおよびVB、2を用い4つのベクトル命令で実行
される。すなわち、 命令(1) : VRo (−A 命令(2): VRl ← B 命令(3):VB2 ← VRQ+VR1命令(4) 
: C← VB2 のよりである。
命令(1)はアクセスパイプライン6を介して主メモリ
1上のベクトルデータAの32個の要素をベクトルレジ
スタ部3内のベクトルレジスタVROにセットし、命令
(2)はアクセスパイプライン7を介して主メモIJ 
l上のベクトルデータBの32個の要素をベクトルレジ
スタ部3内のベクトルレジスタVJにセットする。命令
(3)はベクトルレジスタ部3内の2本のベクトルレジ
スタVROおよびVRlからデータを読出し演算パイプ
ライン部4で加算を実行し、和をベクトルレジスタ3内
のベクトルレジスタVR2にセントする。命令(4)は
ベクトルレジスタ3内のベクトルレジスタ■R2の32
個の要素を読出しアクセスパイプライン6を介して主メ
モリ1にベクトルデータCとして格納する。
一般に主メモリ1に使用するメモリ素子のサイクル時間
はマシンサイクル時間よシ長く、数倍程度長いこともめ
ずらしくなく、主メモリをいくつかのバンクに分割する
ことがしばしば行われている。
例えば第2図を参照すると、主メモリ1は4つのモジュ
ールllaないしIldに分かれ・各モジュールは1マ
シンサイクルに1つのベクトル要素を読出し/書込みで
きる。各モジーールは4つのバンク12aないし12d
からなり、各バンクは4マシンサイクルに1つのベクト
ル要素を読出し/書込みできる。各バンクには#0ない
し#15のバンク番号が付与されておシ、#iのバンク
には番地を16で割ったときの剰余がiであるデータが
格納されている。ベクトルデータは隣接した要素が主メ
モリ上に格納される番地の差を要素間距離という。要素
間距離は1とは限らない。例えば35行35列の行列M
(’I I J ) を行方向に主メ゛モリに格納(M
(0,0) 、M(1、O) 、 ・M(34,0)。
M(0,1)、M(1,1)、−、M(34,1)、M
(0,2)・・・)すると列ベクトルM(0+j)+M
(1+j)+ 。
M(34,j)の要素間距離は1であるが、行ベクトル
M(i、O)、M(i、1)、・・・、M(i、34)
の要素間距離は35である。
第3図を参照すると、ベクトルAの要素間距離を1.ベ
クトルBの要素間距離を35とし、A(0)B(0)と
もにMB#0に格納されているとすると、A(1)はM
B$1.人(2)はMB:14=2 、・、A(15)
はMB(xs)。
A(16)はM’B:#0 、・・・、A(31)はM
B#15に格納され、B(1)はMB#3 、 B (
2)はMB#6.・・、 B (6)はMB#2、・・
・、B(31)はMB:#13に格納される。この時の
主メモリ1に対する各要素のアクセスの状況を第3図に
示す。
まず命令1が発行され、1マシンサイクルに2要素ずつ
、A(0)とA(1)がMB#0とMB、#lから・A
(2)とA(3)がMB@2とMB#3から、・、と読
出されていく。MB$0とMB#tは時刻Oから時刻3
まで使用中とl)、MB$2とMB#:3は時刻1から
時刻4まで使用中となる。命令(1)に引継き命令2が
発行されB(0)とB(1)を主メモリ1から読出す。
11(01゜B(1)はそれぞれMB$0.MB@3を
アクセスしなければならない。MB#= 3は命令(1
)によシ時刻1から時刻4まで使用中なのでB (0)
 、 B (1)のアクセス時刻5から時刻8の間に行
われる。B (2) 、 B (3)のアクセスはMB
#、9が命令(1)で時刻7まで使用中のため時刻8か
ら時刻11の間に行われる。従って、例えば、時刻5か
ら時刻14の10マシンサイクルの間にA(10)〜A
(27) 、 B(0)〜B(5)の24の要素のアク
セスが開始され、1マシンサイクルに4要素毎アクセス
を開始する場合に比ベロ0%の効率しかない。
このように従来この種のデータ処理装置では要素間距離
の異るアクセスを同時に行うとメモリアクセスの効率が
著しく低下するとい5欠点がある。
発明の目的 本発明の目的は上述の欠点を除去しメモリバンク使用中
によるメモリアクセスの待ち時間を減らしメモリアクセ
スの効率が高いデータ処理装置を提供することにある。
発明の構成 本発明の装置は主メモリと、複数のベクトルレジスタを
有するベクトルレジスタ部と、主メモリとベクトルレジ
スタ部との間でデータ転送を行うアクセスパイプライン
部と、ベクトルレジスタの要素に対して演算を行う演算
パイプライン部を有するデータ処理装置において、 主メモリをアクセスパイプライン部の1組のメそりアク
セスポートに接続し、1つのベクトルレジスタに対応す
るデータ転送を1マシンサイクルに2m個の要素の割合
で直列に実行し、ベクトルレジスタ部をアクセスパイプ
ライン部の2組のベクトルアクセスポートに接続し、1
つのベクトルレジスタに対応するデータ転送t−1マシ
ンサイクルにm個の要素の割合で並列に転送し、アクセ
スパイプラインが2組のバッファでできておシ、メモリ
アクセスポートで転送されるデータは要素毎に交互に2
組りバッファのいずれかに対応し、2 べ組のベクトル
アクセスポートは2X2クロスバ−で2組のバッファと
接続されているように構成されている。
次に本発明について図面を参照して詳細に説明する・第
4図全参照すると、本発明の一実施例は、主メモリ1.
メモリ制御装置2.ベクトルレジスタ部3.加算パイプ
ライン部42乗算パイプライン部5およびアクセスパイ
プライン部8から構成されている。主メモリ1とメモリ
制御装置2は4部8からのメモリアクセスを制御し、ア
クセスパイプライン部8と?′i4本の読出しラインと
4本の書込みラインで接続される。アクセスパイプライ
ン部8とベクトルレジスタ部3とはそれぞれ2本の読出
しラインと2本の書込みラインをもつ2つのポートで接
続される。加算パイプライン部4と乗算パイプライン部
5とはそれぞれベクトルレジスタ部3から2本×2組の
オペランドの供給を受け2本の出力をベクトルレジスタ
部3に返す。
主メモリ1とメモリ制御部2との間の転送レートは読出
し/書込みとも4語/マンンサイクル、メモリ制御部2
とアクセスパイプライン部8との間の転送レートは読出
し/書込みとも4語/マシンサイクル、アクセスパイプ
ライン部8とベクトルレジスタ部3との間の転送レート
はボート当シ読出し/書込みとも2語/マシンサイクル
、加算パイプライン部と乗算パイプライン部の演算レー
トはともに2語/マシンサイクルである。
前記主メモリ1は第2図に示すよりに4つのモジュール
llaないしlidからなシ、各モジュールは4つのバ
ンク12aないし12dからなっている。
第5図を参照すると、アクセスパイプライン部8は2つ
のバッファBFO81とBFI 82および2×2クロ
スバ83から構成され、バッファBFO81とBFI 
82はそれぞれアクセスノくイブライン部8の読出しラ
イン、書込みラインの半数のラインと接続され、かつ、
クロスバ83の一方のポート群A、B、WおよびXに接
続されているOクロスバ83のもう一方のボート群C,
D、Yおよび2はベクトルレジスタ部と接続されている
第6図を参照すると、主メモリの各バンクのサイクルが
4マシンサイクルとし、ベクトルAの各要素A(0) 
、 A(1) 、・・・、A(30)およびA(31)
がそれぞれ主メモリのバンクMB#O,MB#1.・・
・。
MB#30およびMB#31に格納されておシ、ベクト
ルBの各要素B(o) 、 B(j) 、・・・、B(
30)およびB(31)が3つ置きの主メモリのバンク
MB$O。
MB#3.MB#6.・・・MB#8 、 MB:# 
11 、 MB#14に格納されている場合の主メモリ
1のバンクのサイクルの状態が示されている。時刻のき
ざみはマシンサイクルであシ、時刻OでA(0) 、 
A(1) 、 A(2)およびA(3)が格納されてい
るバンクMB#O,MB:#1.MB#:2およびMB
$3がアクセスされ、時刻0〜3の4マシンサイクルの
間ビジーとなる。時刻1でA(4) 、 A(5) 、
 A(6)およびA(7)が格納されているバンクMB
$4.MB$5.MB#6およびMB$7がアクセスさ
れ、時刻1〜4の4マシンサイクルの間ビジーとなる。
同様にしてMB$g〜MB:#11は時刻2〜5の間、
MB#x2〜MB#15は時刻3〜6の間ビジーとなる
。時刻4でA(16)〜A(19)のアクセスを行うが
、このときMB#0〜MB#:3は先行アクセスによる
ビジー期間を終了しているので、バンクビジーによる待
ち合せを行うことなくA(16)〜A(19)のアクセ
スが行われる。A(20)〜A(31) についても同
様にバンクビジーによる待合せなしにアクセスが行われ
る。
時刻7でベクトルAの全要素についてのアクセスが終了
し時刻8でベクトルBのアクセスを開始する。ベクトル
Bの最初の4要素B(0) 、 B(1) 、 B(2
)およびB(3)の格納されているメモリのバンクはM
B#0.MB#:3.MB$6およびMB$9 である
が、MB−11:9が先行するアクセスのため時刻6〜
9の間ビジーのため、B(o)〜B(3)のアクセスは
2マシンサイクル遅れて時刻10に行われる。以後はバ
ンクビジーによる待合せは発生せず時刻17にB(28
)〜B(31)が格納されているメモリバンクMB$5
 、 MB#8 、 MB:14:11およびMB$1
4のアクセスが行われ、ベクトルBの全要素についての
アクセスが終了する。
第7図はアクセスパイプライン部8におけるノ(ソファ
動作を説明するものである。ここではA (0)〜A(
3)がアクセスパイプライン部8に到着する時刻を0と
した時間で表している。
時刻OでA(0)〜A(3)の4語がアクセスパイプラ
イン部8に到着するが、そのうちA(01、A(1)の
2語をバッファBFoにA (2) 、 A (3)の
2語をバッファBFIに格納する。時刻1でA(4)〜
A(7)の2語が到着するのでA(4) 、 A(51
の2語をバッファBFOに、A (6) 、 A (7
)の2語をバッファBFIに格納する。同様にしてA(
s) 、 A(9) 、 A(12) 、A(13) 
、 −A(28) 、A(29)がバッフ7BFOに、
A(10)。
A(11) 、 −、A(30)、A(31)がバッフ
ァBF1に格納される◇ベクトルBのバッファへの格納
も同様にして時刻10でB(o) 、 B(1)がバッ
ファBFOに、B (2) 、 B (3)がバッファ
BFIに格納され時匈111でB (4) 、 B (
5)がバッファBFQに、B(4)。
B(5)がバッファBFIに格納され、時刻17でB(
28)、B(29)がバッファBPOに、E(30)。
B(31)がバッファ BFlに格納される。時刻1で
バッファBFOからA (0) 、 A (1)を時刻
(2)でバッファBFIからA (2) 、 A (3
)を読出し以後バッファBFOおよびBFlから交互に
Aベクトルの要素を2語ずつ読み出し、クロスバ83を
制御してクロスバ83のボートCにAベクトルの要素が
2語/マシンサイクルの割合でベクトルレジスタ部3に
送られる。
Aベクトルの要素がベクトルレジスタ部3に送られてい
る間にBベクトルがアクセスパイプライン部8に送られ
てきており、時刻11から読部し可能となる。時刻11
ではバッファBFOの読出しボートはAベクトルのため
に占有されているのでB (0) 、 B (1)のB
FOからの読出しは時刻12に行われる。続いて、時刻
13にB (2) 、 B (3)をバッフγBFIか
ら読出し、以後バッファBFOとBFlから交互にBベ
クトルの要素を2@ずつ読出し、クロスバ83を制御し
てクロスバ83のボートDにBベクトルの要素が2語/
マシンサイクルの割合でペクト、ルレジスタ部3に送ら
れる。
発明の効果 本発明にはアクセスパイプライン部を仲介して、主メモ
リとの間は1つのベクトルレジスタに対応するデータ転
送を直列に実行し、ベクトルレジスタ部との間は2つの
ベクトルレジスタに対応するデータ転送を並列に実行す
る構成をとることによシ、主メモリのメモリアクセス効
率の低減を防ぐことができるという効果がある。
【図面の簡単な説明】
第1図は従来技術を示す図、第2図は第1図および第4
図に示す主メモリ部分を示す図、第3図は従来技術のメ
モリバンクのビジーの状態を示すタイムチャート・第4
図は本発明の一実施例を示す図、第5図は第4図に示し
だアクセスパイプライン部を示す図、第6図は第4図の
動作を説明するだめのメモリバンクのビジーのタイムチ
ャートおよび第7図はアクセスパイプライン部のバッフ
了およびクロスバの動作を説明するためのタイムチャー
トである。 第1図から第7図において、1−・・・主メモリ、2・
・・・・メモリ制御部、3・ ベクトルレジスタ部、4
・・・・・加算パイプライン部、5・・・・・乗算パイ
プラインs、6〜8・・・・・・アクセスパイプライン
部、11a〜lid・・・・メモリモジュール、128
〜12d・・メモリバンク、81〜82・・・・バッフ
丁、83・−・2X2クロスバ。 11( +1 応3m 方4閃 アクセスノぐイブラA’y音に一シ/△べ゛クトルレン
スタ肩ヤカ・、シ/へ 4)5 圀

Claims (1)

  1. 【特許請求の範囲】 1、主メモリと、複数のベクトルレジスタを有するベク
    トルレジスタ部と、前記主メモリと前記ベクトルレジス
    タ部との間でデータ転送を行うアクセスパイプライン部
    と、前記ベクトルレジスタの要素に対して演算を行なう
    演算ノくイブライン部とを有するデータ処理装置におい
    て、前記アクセスパイプライン部の1組のメモ1ノアク
    セスポートに接続された前記主メモリでは1つのベクト
    ルレジスタに対応するデータ転送が順次実行され、 前記アクセスパイプライン部の2組のベクトルアクセス
    ポートに接続された前記ベクトルレジスタ部では2つの
    ベクトルレジスタニ対応スるデータ転送が同時に実行さ
    れうろことを特徴とするデータ処理装置 2.1つの演算パイプラインが1マシンサイクルでm語
    の結果を出力するときに前記アクセスパイプライン部は
    ベクトルアクセスポートの1つが1マシンサイクルでm
    語の要素を転送しメモリアクセスポートが1マシンサイ
    クルで2m語の要素を転送することを特徴とする特許請
    求範囲第1項記載のデータ処理装置。 3、 前記アクセスパイプラインが2組のバッフ丁を含
    みメモリアクセスポートで転送されるデータは要素毎に
    交互に2組のバッフ丁のいずれかに対応し、2組のベク
    トルアクセスポートは2X2クロスバ−で2組のバッフ
    丁を接続されていることを特徴とする特許請求範囲第1
    項記載のデータ処理装置。
JP15132783A 1983-08-19 1983-08-19 デ−タ処理装置 Granted JPS6043775A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15132783A JPS6043775A (ja) 1983-08-19 1983-08-19 デ−タ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15132783A JPS6043775A (ja) 1983-08-19 1983-08-19 デ−タ処理装置

Publications (2)

Publication Number Publication Date
JPS6043775A true JPS6043775A (ja) 1985-03-08
JPH0332829B2 JPH0332829B2 (ja) 1991-05-14

Family

ID=15516178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15132783A Granted JPS6043775A (ja) 1983-08-19 1983-08-19 デ−タ処理装置

Country Status (1)

Country Link
JP (1) JPS6043775A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01284966A (ja) * 1988-05-11 1989-11-16 Nec Corp データ処理装置
JPH01316871A (ja) * 1988-06-17 1989-12-21 Nec Corp ベクトル処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5466727A (en) * 1977-11-07 1979-05-29 Fujitsu Ltd Access control system for buffer memory
JPS5491151A (en) * 1977-12-28 1979-07-19 Fujitsu Ltd Internal memory control system on array processor
JPS5798070A (en) * 1980-12-12 1982-06-18 Fujitsu Ltd Data processing device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5466727A (en) * 1977-11-07 1979-05-29 Fujitsu Ltd Access control system for buffer memory
JPS5491151A (en) * 1977-12-28 1979-07-19 Fujitsu Ltd Internal memory control system on array processor
JPS5798070A (en) * 1980-12-12 1982-06-18 Fujitsu Ltd Data processing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01284966A (ja) * 1988-05-11 1989-11-16 Nec Corp データ処理装置
JPH01316871A (ja) * 1988-06-17 1989-12-21 Nec Corp ベクトル処理装置

Also Published As

Publication number Publication date
JPH0332829B2 (ja) 1991-05-14

Similar Documents

Publication Publication Date Title
US4891751A (en) Massively parallel vector processing computer
US4896265A (en) Parallel broadcasting method and apparatus
US20090254697A1 (en) Memory with embedded associative section for computations
WO2019076108A1 (zh) 卷积神经网络运算电路
JPH0425586B2 (ja)
JPS63316168A (ja) 並列隣接演算処理システム及びその方法
EP3844610B1 (en) Method and system for performing parallel computation
US20050289329A1 (en) Conditional instruction for a single instruction, multiple data execution engine
JP2011141823A (ja) データ処理装置および並列演算装置
JPS6043775A (ja) デ−タ処理装置
US3898626A (en) Data processing apparatus
US6085304A (en) Interface for processing element array
JPH0345420B2 (ja)
JP4237046B2 (ja) 画像処理装置
JP2002269067A (ja) 行列演算装置
JP2008102599A (ja) プロセッサ
JP4482356B2 (ja) Simdプロセッサを用いた画像処理方法及び画像処理装置
JP2812292B2 (ja) 画像処理装置
JP2855899B2 (ja) 機能メモリ
JPS60211580A (ja) データの記憶および検索方法、装置
JPS6027977A (ja) 並列処理装置
JP2610500B2 (ja) 並列ベクトル計算機
JPS599944B2 (ja) デ−タ処理装置
JPS6058503B2 (ja) デ−タ処理制御方式
CN115033843A (zh) 基于三角脉动阵列的协方差矩阵计算的电路实现方法