JPH06266860A - ベクトル処理プロセッサ - Google Patents

ベクトル処理プロセッサ

Info

Publication number
JPH06266860A
JPH06266860A JP5613993A JP5613993A JPH06266860A JP H06266860 A JPH06266860 A JP H06266860A JP 5613993 A JP5613993 A JP 5613993A JP 5613993 A JP5613993 A JP 5613993A JP H06266860 A JPH06266860 A JP H06266860A
Authority
JP
Japan
Prior art keywords
vector
unit
data
scalar
units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5613993A
Other languages
English (en)
Inventor
Taizo Sato
泰造 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5613993A priority Critical patent/JPH06266860A/ja
Publication of JPH06266860A publication Critical patent/JPH06266860A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Advance Control (AREA)

Abstract

(57)【要約】 【目的】 高速演算処理を行なうベクトル処理プロセッ
サに関し、高性能で、かつ、コンパクトなベクトル処理
プロセッサを提供することを目的とする。 【構成】 1つのベクトル処理プロセッサ11を4個の
ベクトルユニット12〜15及びスカラーユニット18
で構成し、1つのベクトルユニットを加算器32、乗算
器33、除算器34、論理器35よりなる複数の演算器
及び、ベクトルデータのエレメント単位で4分割された
ベクトルレジスタ31で構成し、4個のベクトルユニッ
ト12〜15を並列動作させて、ベクトルデータの処理
を行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はベクトル処理プロセッサ
に係り、特に、高速演算処理を行うベクトル処理プロセ
ッサに関する。
【0002】科学技術計算の分野では例えば配列のよう
な複数のデータからなるデータ集合に対して演算を行う
処理を行うことが多く、データ集合に対して演算を高速
に行うことが要求されている。
【0003】一般的なプロセッサではデータ集合に対し
て演算を行う場合、ループ処理で行なわれるため、高速
で演算を行なうことができない。このため、データ集合
の演算を1命令でパイプライン処理することにより高速
に処理できるベクトル処理プロセッサなるものが開発さ
れている。
【0004】しかしながら、ベクトル処理プロセッサは
現在非常に大きなもので、よりコンパクトなものが要求
されている。
【0005】
【従来の技術】図9にベクトル処理ユニットを有するコ
ンピュータシステムのブロック構成図を示す。同図中、
71はメモリ装置(MSU)を示す。MSU71はメモ
リ制御装置(MCU)72に接続され、MCU72によ
りアクセスを制御される。
【0006】MCU72にはスカラー演算を行なうプロ
セッサであるスカラーユニット(SU)73及びベクト
ル演算を行なうベクトルユニット(VU)74が接続さ
れ、MSU71記憶されたデータにアクセスし、SU7
3及びVU74によりスカラー演算及びベクトル演算を
実行し、再びMSU71に記憶させる等の制御を行な
う。
【0007】図10に従来のベクトル処理ユニットの構
成図を示す。ベクトル処理ユニットはベクトルデータを
演算する演算器75、ベクトルデータを一時保持するベ
クトルレジスタ部76、MSU71とのアクセス制御を
行なうアクセス制御部77、MCU72との接続を行な
う主記憶インタフェース部78より構成され、演算器7
5、ベクトルレジスタ部76は夫々複数個のLSIチッ
プにより構成されていた。
【0008】従来のベクトル処理ユニットで演算の高速
化を計るには演算器75の個数を増やして同時に処理で
きるデータ量を増やす方法が取られており、数十個から
数百個のLSIチップで構成されていた。
【0009】
【発明が解決しようとする課題】しかるに、従来のベク
トル処理プロセッサのように、高速化を計るための演算
器を多数のチップで構成すると非常に大きなものとなっ
てしまい、また、コンパクト化のため数百〜数十個のL
SIチップを演算器、ベクトルレジスタ部、アクセス制
御部、主記憶インタフェース部という機能ブロック毎に
数個のチップに分割すると各チップ間の配線本数が大き
く増大するため、配線本数が1つのチップに許される配
線本数を大きく越えてしまい、実現できなくなる等の問
題点があった。
【0010】また、コンパクト化のため、すべてを1つ
のLSIチップ内に収めたものもあるが、このようなも
のでは十分な性能が得られない等の問題点があった。
【0011】本発明は上記の点に鑑みてなされたもの
で、高性能で、かつ、コンパクトなベクトル処理プロセ
ッサを提供することを目的とする。
【0012】
【課題を解決するための手段】図1に本発明の原理図を
示す。ベクトルレジスタ部2は内部がベクトルデータの
構成要素であるエレメント単位で、n(nは2以上の整
数)個に分割されている。
【0013】演算部3はベクトルレジスタ部2に保持さ
れたベクトルデータに対して並列演算を実行する。n個
のベクトルユニット4は夫々が上記ベクトルレジスタ部
3及び複数の演算部3を有しベクトルデータをベクトル
データの構成要素であるエレメント単位でn個のベクト
ルユニット4夫々のベクトルレジスタ部2に所定の配列
で分配して、保持し、n個のベクトルユニット4の演算
部3で同時に演算処理される。
【0014】
【作用】ベクトルデータをエレメント単位でn個のベク
トルユニット夫々の前記ベクトルレジスタ部に所定の配
列で分配して、保持し、n個のベクトルユニットで同時
に演算を行なうため、演算を高速で行なえると共にベク
トルユニット毎に動作するため、ベクトルユニット間の
データのやり取りがなくて済み、接続配線を減少させる
ことができ、したがって、ベクトル処理プロセッサをコ
ンパクトにまとめることができる。
【0015】
【実施例】図2は本発明の一実施例のブロック図を示
す。同図中、11はベクトル処理プロセッサを示す。本
実施例のベクトル処理プロセッサ11はベクトルユニッ
ト12,13,14,15及びスカラーユニット18よ
り構成される。ベクトルユニット12,13,14,1
5は1つの半導体チップで構成され、主記憶装置16か
ら主記憶インタフェース部17を介して入力された集合
データ(ベクトルデータ)をスカラーユニット18から
入力される命令データに応じてベクトル演算処理する。
【0016】スカラーユニット18は1つの半導体チッ
プで構成されており、ベクトル処理プロセッサ11と同
様に主記憶インタフェース部17を介して主記憶装置1
6と接続されており、主記憶装置16からのデータに応
じてスカラーデータの処理を行うと共にベクトル処理プ
ロセッサ11の命令実行の制御を行なう。
【0017】主記憶インタフェース部17はアドレス制
御ユニット19、データ出力制御ユニット20、データ
入力制御ユニット21よりなる。アドレス制御ユニット
19は主記憶装置16へのアクセスの要求と、受けたア
ドレスに優先順位を付けて主記憶装置16へのデータの
割り振りを行う。また、データ出力制御ユニット20は
アドレス制御ユニット19で割り振られたアドレスに従
って主記憶装置16に書込むべきデータを割り振る。デ
ータ入力制御ユニット21は主記憶装置16からアドレ
ス制御ユニット19に要求されたアドレスに基づいてデ
ータを読み出し、ベクトル処理プロセッサ11及びスカ
ラーユニット18に供給する。
【0018】図3に本発明の一実施例のスカラーユニッ
トのブロック構成図を示す。端子T 1 には主記憶装置1
6よりデータ入力制御ユニット21を介して命令及びス
カラーデータが入力される。命令キャッシュメモリ12
はデータ入力制御ユニット21を介して主記憶装置16
から供給される命令を内部に保持する。命令キャッシュ
メモリ12に保持された命令はプログラムカウンタ23
からのカウントデータに応じて出力され命令デコーダ2
4に供給される。命令デコーダ24は命令のデコードを
行ない、スカラー命令である場合にはスカラーユニット
8内部の命令実行制御を行ない、ベクトル命令である場
合にはベクトル命令をベクトル命令転送部25に供給す
る。
【0019】ベクトル命令転送部25は命令デコーダ2
4より供給されたベクトル命令を端子T2 よりベクトル
処理プロセッサ11に対して転送する。このとき、ベク
トル命令転送部25は必要であればベクトル命令にスカ
ラーレジスタ部26よりスカラーデータが供給され、入
力されたスカラーデータを端子T2 より出力する。
【0020】スカラーレジスタ部26はスカラーデータ
を一時保持するブロックで、スカラーレジスタ部26の
出力スカラーデータはベクトル命令転送部25に供給さ
れると共に演算器27、データキャッシュメモリ28に
供給される。演算器27はスカラーレジスタ部26から
供給されたスカラーデータの演算を行う。
【0021】スカラーレジスタ部26には端子T3 より
供給されるベクトル処理プロセッサ11からのスカラー
データがスカラー入力部29を介して入力されると共に
データキャッシュメモリ28からスカラーデータが入力
される。データキャッシュメモリ28は端子T1 からス
カラーデータを入力し、スカラー演算を行って端子T4
から出力しデータ出力制御ユニット20を介して主記憶
装置16に供給する。このとき、データキャッシュメモ
リ28からはアドレスを端子T5 より出力し、アドレス
制御ユニット19に供給する。
【0022】このようにスカラーユニット18はベクト
ル処理プロセッサ11へベクトル命令を供給し、ベクト
ル演算の実行制御を行なうと共にスカラーデータの演算
を行なう。
【0023】図4に本発明の一実施例のベクトルユニッ
ト12,13,14,15のブロック構成図を示す。端
子T6 はスカラーユニット18の端子T2 と接続され、
スカラーユニット18よりベクトル命令が供給される。
端子T6 にはベクトル命令デコーダ30が接続されてい
て、ベクトル命令デコーダ30は端子T6 より入力され
たベクトル命令をデコードして、ベクトルユニット内の
実行制御を行なう。アドレス加算器38は主記憶装置1
6のアクセスのためのアドレスを計算するブロックで、
ベクトル命令デコーダ30及びベクトルレジスタ部31
からアドレスが供給され、その計算結果のアドレスはア
クセス制御部39を介して端子T11よりアドレス制御ユ
ニット19に供給される。ベクトルレジスタ部31はベ
クトルデータを一時保持するブロックで、ベクトルレジ
スタ部31の内部はベクトルデータのエレメント単位で
4つに分割されている。ベクトルレジスタ部31には端
子T7 を介してデータ出力制御ユニット20、端子T8
を介してデータ入力制御ユニット21と接続され、主記
憶装置16とベクトルデータがやりとりされると共に加
算器32、乗算器33、除算器34、論理器35が接続
されこれらの演算器により内部に保持されたベクトルデ
ータに各種演算が実行される。加算器32、乗算器3
3、除算器34、論理器35にはベクトルレジスタ部3
1からベクトルデータが供給されると共にベクトル命令
デコーダ30よりスカラーデータが供給される。
【0024】加算器32はベクトルレジスタ部31から
供給されたベクトルデータ同志を加算すると共にベクト
ルレジスタ部31から供給されたベクトルデータにスカ
ラーユニット18から供給されたスカラーデータを加算
し、その加算結果を再びベクトルレジスタ部31に供給
する。
【0025】乗算器33はベクトルレジスタ部31から
供給されたベクトルデータ同志を乗算すると共にベクト
ルレジスタ部31から供給されたベクトルデータにスカ
ラーユニット18から供給されたスカラーデータを乗算
し、その乗算結果を再びベクトルレジスタ部31に供給
する。
【0026】乗算器34はベクトルレジスタ部31に保
持されたベクトルデータ同志の除算及びベクトルレジス
タ部31に保持されたベクトルデータとスカラーユニッ
ト18から供給されたスカラーデータとの除算が行なわ
れ、その除算結果を再びベクトルレジスタ部31に供給
する。
【0027】論理器35はベクトルレジスタ部31に保
持されたベクトルデータ同志の論理演算及びベクトルレ
ジスタ部31に保持されたベクトルデータとスカラーユ
ニット18から供給されたスカラーデータとの論理演算
が行なわれ、その結果を再びベクトルレジスタ部31に
供給する。
【0028】また、加算器32にはスカラー入力手段3
6及びスカラー出力手段37が接続され、ベクトルユニ
ット12〜15間にまたがる演算が実行可能な構成とさ
れている。ベクトルユニット12〜15間にまたがる演
算を行なう場合には、まずベクトルユニット15の加算
器32の演算結果(スカラーデータ)をスカラー出力手
段37を介して端子T10より出力する。
【0029】ベクトルユニット15の端子T10はベクト
ルユニット14の端子T9 に接続され、ベクトルユニッ
ト15の加算器32の演算結果は、スカラー入力手段3
6を介してベクトルユニット14の加算器32に供給さ
れる。ベクトルユニット14の加算器32はベクトルユ
ニット15の演算結果とベクトルユニット14の演算結
果とを加算してスカラー出力手段37を介して端子T10
より出力する。
【0030】ベクトルユニット14の端子T10はベクト
ルユニット13の端子T9 と接続されていて、ベクトル
ユニット14の加算器32の演算結果はベクトルユニッ
ト13のスカラー入力手段36を介してベクトルユニッ
ト13の加算器32に供給される。
【0031】ベクトルユニット13の加算器32はベク
トルユニット15及びベクトルユニット14の演算結果
を加算した演算結果にベクトルユニット13のベクトル
データを加算してスカラー出力手段37を介して端子T
10より出力する。
【0032】ベクトルユニット13の端子T10はベクト
ルユニット12の端子T9 に接続されており、ベクトル
ユニット13の加算器32の演算結果はスカラー入力手
段36を介してベクトルユニット12の加算器32に供
給される。
【0033】ベクトルユニット12の加算器32はベク
トルユニット13の加算器32の演算結果となるベクト
ルユニット15,14,13夫々の演算結果を加算した
演算結果にベクトルユニット12の演算結果を加算して
スカラー出力手段37を介して端子T10より出力する。
【0034】ベクトルユニット12の端子T10はスカラ
ーユニット18の端子T3 に接続されていて、ベクトル
ユニット12の加算器32の演算結果はベクトルユニッ
ト12〜15にまたがる演算の演算結果としてスカラー
ユニット18のスカラー入力手段29を介してスカラー
レジスタ部26に保持される。スカラーレジスタ部26
に保持されたベクトルユニット12〜15にまたがる演
算の演算結果はスカラーレジスタ部26からデータキャ
ッシュ28を介して主記憶装置16に供給される。
【0035】このとき、一連のベクトルデータは四つの
ベクトルユニット12,13,14,15のベクトルレ
ジスタ部31に分割されて収納され、演算が実行され
る。
【0036】図5にベクトルレジスタ部31の分割構成
図を示す。同図中、VRO〜VR255はベクトルレジ
スタ番号で、ベクトル命令で指定される番号である。ま
た、E0〜E15はベクトルデータのエレメント番号で
ベクトルレジスタ中のエレメントを特定する。エレメン
トはベクトルデータを構成する要素で、各エレメント毎
に演算が実行される。本実施例では16個のエレメント
(エレメント番号E0〜E15)で一つのベクトルデー
タを構成している。
【0037】各ベクトルユニット12,13,14,1
5のベクトルレジスタ部31は一レジスタ番号内がエレ
メント単位で四分割されており、ベクトルユニット12
のベクトルレジスタ部31には一連のベクトルデータの
エレメント番号E0〜E15のうちエレメント番号E
0,E4,E8,E12が割り振られ、ベクトルユニッ
ト13のベクトルレジスタ部31にはベクトルデータの
エレメント番号E0〜E15のうちエレメント番号E
1,E5,E9,E13が割り振られ、ベクトルユニッ
ト14のベクトルレジスタ部31にはベクトルデータの
エレメント番号E0〜E15のうちエレメント番号E
2,E6,E10,E14が割り振られ、ベクトルユニ
ット15のベクトルレジスタ部31にはベクトルデータ
のエレメント番号E0〜E15のうちエレメント番号E
3,E7,E11,E15が割り振られている。
【0038】ここで、例えば、ベクトルデータA=(a
1 ,a2 ,a3 ,a4 )に対してスカラーデータKを乗
算する演算KA=K(a1 ,a2 ,a3 ,a4 )=(K
1,Ka2 ,Ka3 ,Ka4 )を実行しようとする場
合について説明する。このとき、データa1 はベクトル
ユニット12のベクトルレジスタ部31のアドレス番号
VR0 ,エレメント番号E0 に保持され、データa2
ベクトルユニット13のベクトルレジスタ部31のアド
レス番号VR0 、エレメント番号E1 に保持され、デー
タa3 はベクトルユニット14のベクトルレジスタ部3
1のアドレス番号VR0 、エレメント番号E2 に保持さ
れ、データa4 はベクトルユニット15のベクトルレジ
スタ部31のアドレス番号VR0 、エレメント番号E3
に保持される。
【0039】次にスカラーユニット18からのベクトル
命令に応じてベクトルユニット12〜15が制御され、
スカラーユニット18から供給されたスカラーデータK
がベクトルユニット12〜15の乗算器33に供給され
ると共にベクトルユニット12の乗算器33にはベクト
ルレジスタ部31のアドレス番号VR0 、エレメント番
号E0 からデータa1 が供給され、ベクトルユニット1
3の乗算器33にはベクトルレジスタ部31のアドレス
番号VR0 、エレメント番号E1 からデータa 2 が供給
され、ベクトルユニット14の乗算器33にはベクトル
レジスタ部31のアドレス番号VR0 、エレメント番号
0 からデータa3 が供給され、ベクトルユニット15
の乗算器33にはベクトルレジスタ部31のアドレス番
号VR0、エレメント番号E0 からデータa4 が供給さ
れ、乗算が実行される。
【0040】このため、ベクトルユニット12の乗算器
33では演算K×a1 、ベクトルユニット13の乗算器
33では演算K×a2 、ベクトルユニット14の乗算器
33では演算K×a3 、ベクトルユニット15の乗算器
33では演算K×a4 が同時に実行される。また、ベク
トルユニット12の乗算器33の演算結果Ka1 はベク
トルユニット12のベクトルレジスタ部31内の例え
ば、アドレス番号VR1、エレメント番号E0 に保持さ
れ、ベクトルユニット13の乗算器33の演算結果Ka
2 はベクトルユニット13のベクトルレジスタ部31内
の例えば、アドレス番号VR1 、エレメント番号E1
保持され、ベクトルユニット14の乗算器33の演算結
果Ka3 はベクトルユニット14のベクトルレジスタ部
31内の例えば、アドレス番号VR1 、エレメント番号
2 に保持され、ベクトルユニット15の乗算器33の
演算結果Ka4 はベクトルユニット15のベクトルレジ
スタ部31内の例えば、アドレス番号VR1 、エレメン
ト番号E3 に保持され、ベクトルデータAの演算KAが
終了する。
【0041】このように、ベクトルデータAの各データ
1 ,a2 ,a3 ,a4 をベクトルユニット12〜15
で同時に演算処理できるため、高速に処理できる。
【0042】また、他のベクトル演算においてもベクト
ルデータを構成する各要素を4つのベクトルユニット1
2〜15で同時演算処理できるため、高速演算処理が可
能となる。
【0043】図6にアドレス制御ユニット19のブロッ
ク構成図を示す。スカラーアドレス入力手段39はスカ
ラーユニット8の端子T5 と接続され、スカラーユニッ
ト8からアドレス及びアクセス要求を受け取り、必要と
するアクセスが可能な主記憶装置16のバンクと接続さ
れた主記憶バンク出力手段40〜43に振り分ける。ベ
クトルアドレス入力手段44はベクトルユニット12の
端子T11と接続され、ベクトルユニット12からアドレ
ス及びアクセス要求を受け取り、必要とするアクセスが
可能な主記憶装置16のバンクと接続された主記憶バン
ク出力手段40〜43に振り分ける。
【0044】ベクトルアドレス入力手段45はベクトル
ユニット13の端面T11と接続され、ベクトルユニット
13からアドレス及びアクセス要求を受け取り、主記憶
バンク出力手段40〜43に振り分ける。
【0045】ベクトルアドレス入力手段46はベクトル
ユニット14の端子T11と接続され、ベクトルユニット
14からアドレス及びアクセス要求を受け取り、主記憶
バンク出力手段40〜43に振り分ける。
【0046】ベクトルアドレス入力手段47はベクトル
ユニット15の端子T11と接続され、ベクトルユニット
14からアドレス及びアクセス要求を受け取り、主記憶
バンク出力手段40〜43に振り分ける。
【0047】主記憶バンク出力手段40〜43はスカラ
ーアドレス入力手段39及びベクトルアドレス入力手段
44〜47からのアドレス及びアクセス要求に応じて夫
々に接続された主記憶装置16にアクセスする。
【0048】このとき、主記憶装置16はアドレスに応
じて4つのバンクB0〜B3に分割されており、主記憶
バンク出力手段40はバンクB0、主記憶バンク出力手
段41はバンクB1、主記憶バンク出力手段42はバン
クB2、主記憶バンク出力手段43はバンクB3に夫々
アクセスする。
【0049】図7にデータ出力制御ユニットの構成図を
示す。書込データ出力手段48はスカラーユニット18
より書込みスカラーデータを入力し、アドレス制御ユニ
ット19から供給されるアドレス位置情報に従って書込
スカラーデータを主記憶バンク出力手段49〜52に振
り分ける。書込ベクトルデータ出力手段53はベクトル
ユニット12より書込ベクトルデータを入力し、アドレ
ス制御ユニット19から供給されるアドレス位置情報に
従って書込ベクトルデータを主記憶バンク出力手段49
〜52に振り分ける。
【0050】ベクトル書込データ入力手段54はベクト
ルユニット13より書込ベクトルデータを入力し、アド
レス制御ユニット19から供給されるアドレス位置情報
に従って書込ベクトルデータを主記憶バンク出力手段4
9〜52に振り分ける。ベクトル書込データ出力手段5
5はベクトルユニット14より書込ベクトルデータを入
力し、アドレス制御ユニット19から供給されるアドレ
ス位置情報に従って書込ベクトルデータを主記憶バンク
出力手段49〜52に振り分ける。ベクトル書込データ
入力手段56はベクトルユニット15より書込ベクトル
データを主記憶バンク出力手段49〜52に振り分け
る。
【0051】主記憶バンク出力手段49〜52はアドレ
ス位置情報に従ってスカラー書込データ入力手段48及
びベクトル書込データ入力手段53〜56からの書込ス
カラーデータ及び書込ベクトルデータを主記憶装置18
に転送する。
【0052】このとき、主記憶バンク出力手段49はバ
ンクB0、主記憶バンク出力手段50はバンクB1、主
記憶バンク出力手段51はバンクB2、主記憶バンク出
力手段53はバンクB3に夫々アクセスする。
【0053】図8にデータ入力制御ユニット21の構成
図を示す。主記憶バンク入力手段57〜60は主記憶装
置18を四分割してなるバンクに接続され、アドレス制
御ユニット19からのアドレス及びアクセス要求に応じ
てスカラーデータ及びベクトルデータを読み出し、スカ
ラー読出データ出力手段61及び、ベクトル読出データ
出力手段62〜65に割振る。
【0054】スカラー読出データ出力手段61はスカラ
ーユニット18に接続されていて、入力されたスカラー
データをスカラーユニット18に供給する。
【0055】ベクトル読出データ出力手段62はベクト
ルユニット12に接続されていて、入力されたベクトル
データをベクトルユニット12に供給する。ベクトル読
出データ出力手段63はベクトルユニット13に接続さ
れていて入力されたベクトルデータをベクトルユニット
13に供給する。ベクトル読出データ出力手段64はベ
クトルユニット14に接続されていて入力されたベクト
ルデータをベクトルユニット14に供給する。
【0056】ベクトル読出データ出力手段65はベクト
ルユニット15に接続されていて入力されたベクトルデ
ータをベクトルユニット15に供給する。
【0057】次にベクトル処理プロセッサ11の動作に
ついて説明する。まず、ベクトル処理プロセッサ11に
よりベクトル演算しようとする場合、主記憶装置16よ
りスカラーユニット18の命令キャッシュ22にベクト
ル処理命令がコピーされる。以後、命令キャッシュ22
内の命令に従ってベクトル処理プロセッサ11演算処理
が実行される。このため、主記憶装置16より命令を読
み出す必要がなく、高速で命令を実行できる。
【0058】また、ベクトルユニット12〜15の各ベ
クトルレジスタ部31にはベクトル演算を行なおうとす
るベクトルデータが保持される。このとき、ベクトルデ
ータは図5に示すように分割され保持される。
【0059】命令キャッシュ22からベクトル命令が出
力されるとこのベクトル命令をベクトルユニット12〜
15が受け、ベクトルユニット12〜15はこのベクト
ル命令に従って演算を実施する。
【0060】このとき、各ベクトルユニット12〜15
は並列に演算を実施するため、ベクトルデータを高速に
演算できる。また、ベクトルユニット12〜15夫々に
は、加算器32、乗算器33、除算器34、論理器35
の異なる演算を行なう演算器が設けられており、夫々の
演算器は並列動作可能とされている。
【0061】このため、各ベクトルユニット12〜15
で、異なる演算を同時に実行することができ、高速にベ
クトル演算を行ない得る。
【0062】また、ベクトルユニット12〜15間にま
たがる演算命令は、一般にスカラーデータを最終結果と
して得る命令であるため、本実施例ではベクトルユニッ
ト12〜15及びスカラーユニット18をスカラー入力
手段29,36及びスカラー出力手段37により直列に
接続し、各ベクトルユニット12〜15で演算を実施
し、演算により得られたスカラーデータを順次、次段の
ユニットに転送していくことにより、これに対応し、ベ
クトルユニット12〜15及びスカラーユニット18間
の配線を簡略化している。なお、このような演算は使用
頻度が少なく、演算の高速化を妨げることはない。
【0063】以上のような構成とすることにより、ベク
トルユニット12〜15夫々を、1チップのLSIに収
めても少ないチップ間の配線で、高速な演算処理が行な
え、高性能を維持しつつ、コンパクト化が可能となる。
【0064】なお、本実施例は、4個のベクトルユニッ
トで構成したがこれに限ることはなく、通常は2m (m
は1以上の整数)個のベクトルユニットで構成すればよ
く、このとき内部ベクトルレジスタ部はエレメント単位
で2m に分割される。
【0065】
【発明の効果】上述の如く、本発明によれば、内部がベ
クトルデータのエレメント単位で、n個に並列動作する
ように分割されたベクトルレジスタ部と、夫々が異なる
複数のベクトル演算を実行する複数の演算部とを夫々が
有するn個のベクトルユニットを並列動作するように配
設することにより、異なる複数のベクトル演算を同時に
実行すると共に同種のベクトル演算もn個のエレメント
を同時に処理することができるため、ベクトルデータを
高速で処理することができ、また、1つのベクトルユニ
ットを1つの半導体チップで構成すれば、n個の半導体
チップで構成でき、しかも、各ベクトルユニットは並列
動作する構成であるため、半導体チップ間の配線は少な
くなると共に、1つの半導体チップのリード数が少なく
てすみ、従って、ボード面積及びチップ面積を減少させ
ることができるため、コンパクト化が可能となる等の特
長を有する。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の一実施例のブロック図である。
【図3】本発明の一実施例のスカラーユニットのブロッ
ク図である。
【図4】本発明の一実施例のベクトルユニットのブロッ
ク図である。
【図5】本発明の一実施例のベクトルレジスタ部の構成
図である。
【図6】本発明の一実施例のアドレス制御ユニットのブ
ロック構成図である。
【図7】本発明の一実施例の書込データ制御ユニットの
ブロック構成図である。
【図8】本発明の一実施例の読出データ制御ユニットの
ブロック構成図である。
【図9】ベクトル処理ユニットを有するコンピュータシ
ステムのブロック構成図である。
【図10】従来のベクトル処理ユニットの一例の構成図
である。
【符号の説明】
1 ベクトル処理プロセッサ 2,3,4,5 ベクトルユニット 6 主記憶装置 7 主記憶インタフェース 8 スカラーユニット 9 アドレス制御ユニット 10 データ出力制御ユニット 11 データ入力制御ユニット

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 主メモリ(1)より読み出されたベクト
    ルデータを演算するベトクル処理プロセッサにおいて、 内部が前記ベクトルデータの構成要素であるエレメント
    単位で、n(nは2以上の整数)個に分割されたベクト
    ルレジスタ部(2)と、 前記ベクトルレジスタ部(2)に保持されたデータに対
    して並列演算を実行する複数の演算部(3)とを有する
    n個のベクトルユニット(4)よりなり、 前記ベクトルデータを前記エレメント単位で前記n個の
    ベクトルユニット(4)夫々の前記ベクトルレジスタ部
    (2)に所定の配列で分配して、保持し、前記n個のベ
    クトルユニット(4)で同時に演算を行なうことを特徴
    とするベクトル処理プロセッサ。
  2. 【請求項2】 前記ベクトルユニット(4)は1つの半
    導体チップに収められていることを特徴とする請求項1
    記載のベクトル処理プロセッサ。
  3. 【請求項3】 前記ベクトルユニット(4)の個数nは
    2のm(mは1以上の整数)乗個であることを特徴とす
    る請求項1又は請求項2記載のベクトル処理プロセッ
    サ。
  4. 【請求項4】 スカラーデータの演算処理を行うと共
    に、該スカラーデータの演算処理制御及び前記n個のベ
    クトルユニット(4)の動作制御を行なうスカラーユニ
    ット(5)を有することを特徴とする請求項1又は請求
    項2又は請求項3記載のベクトル処理プロセッサ。
  5. 【請求項5】 前記n個のベクトルユニット(4)は各
    ベクトルユニットで演算したスカラーデータを転送する
    スカラー転送手段(6)を有し、前記n個のベクトルユ
    ニット(4)をスカラー転送手段(6)により直列に接
    続し、各ベクトルユニットで演算した該スカラーデータ
    を順次転送することによりスカラー演算を行うことを特
    徴とする請求項1乃至4のうちいずれか一項記載のベク
    トル処理プロセッサ。
JP5613993A 1993-03-16 1993-03-16 ベクトル処理プロセッサ Withdrawn JPH06266860A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5613993A JPH06266860A (ja) 1993-03-16 1993-03-16 ベクトル処理プロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5613993A JPH06266860A (ja) 1993-03-16 1993-03-16 ベクトル処理プロセッサ

Publications (1)

Publication Number Publication Date
JPH06266860A true JPH06266860A (ja) 1994-09-22

Family

ID=13018750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5613993A Withdrawn JPH06266860A (ja) 1993-03-16 1993-03-16 ベクトル処理プロセッサ

Country Status (1)

Country Link
JP (1) JPH06266860A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008129900A1 (ja) * 2007-04-12 2008-10-30 Nec Corporation アレイプロセッサ型データ処理装置
JP2014130628A (ja) * 2009-01-30 2014-07-10 Ab Initio Technology Llc ベクトルフィールドを用いるデータ処理

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008129900A1 (ja) * 2007-04-12 2008-10-30 Nec Corporation アレイプロセッサ型データ処理装置
JP5146449B2 (ja) * 2007-04-12 2013-02-20 日本電気株式会社 アレイプロセッサ型データ処理装置
US9424230B2 (en) 2007-04-12 2016-08-23 Nec Corporation Converting a data placement between memory banks and an array processing section
JP2014130628A (ja) * 2009-01-30 2014-07-10 Ab Initio Technology Llc ベクトルフィールドを用いるデータ処理
US8996442B2 (en) 2009-01-30 2015-03-31 Ab Initio Technology Llc Processing data using vector fields

Similar Documents

Publication Publication Date Title
JP7016942B2 (ja) 演算アクセラレータ
Siegel et al. PASM: A partitionable SIMD/MIMD system for image processing and pattern recognition
US5872987A (en) Massively parallel computer including auxiliary vector processor
US5758176A (en) Method and system for providing a single-instruction, multiple-data execution unit for performing single-instruction, multiple-data operations within a superscalar data processing system
EP0243085B1 (en) Coprocessor architecture
JP2021508125A (ja) 行列乗算器
US5680338A (en) Method and system for vector processing utilizing selected vector elements
JPH0219945A (ja) 主記憶制御装置
JPH01150963A (ja) 計算機におけるipl方法
Hwang et al. Vector computer architecture and processing techniques
JPS61160176A (ja) ベクトル処理装置
US5586289A (en) Method and apparatus for accessing local storage within a parallel processing computer
US20120151145A1 (en) Data Driven Micro-Scheduling of the Individual Processing Elements of a Wide Vector SIMD Processing Unit
EP0381059A2 (en) Arithmetic element controller
JPH06266860A (ja) ベクトル処理プロセッサ
JP2618223B2 (ja) シングルチツプマイクロコンピユータ
JP7010129B2 (ja) プロセッサ及び情報処理装置
JP2003244190A (ja) データフロー制御スイッチ用プロセッサ及びデータフロー制御スイッチ
Siegel et al. Parallel memory system for a partitionable SIMD/MIMD machine
KR20200142200A (ko) 신경망 연산 효율 증대를 위한 신경망 가속기 및 그의 동작 방법
JPH06309349A (ja) プログラム制御のプロセッサ
Dadda The evolution of computer architectures
US20040216116A1 (en) Method for load balancing a loop of parallel processing elements
RU2042193C1 (ru) Вычислительная система
JP2744152B2 (ja) データ駆動型データ処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000530