JPH09325953A - プロセッサおよびデータ処理装置 - Google Patents

プロセッサおよびデータ処理装置

Info

Publication number
JPH09325953A
JPH09325953A JP14446296A JP14446296A JPH09325953A JP H09325953 A JPH09325953 A JP H09325953A JP 14446296 A JP14446296 A JP 14446296A JP 14446296 A JP14446296 A JP 14446296A JP H09325953 A JPH09325953 A JP H09325953A
Authority
JP
Japan
Prior art keywords
register
instruction
data
stored
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14446296A
Other languages
English (en)
Inventor
Yoshibumi Fujikawa
義文 藤川
Keiji Kojima
啓二 小島
Toru Nojiri
徹 野尻
Kiyokazu Nishioka
清和 西岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP14446296A priority Critical patent/JPH09325953A/ja
Publication of JPH09325953A publication Critical patent/JPH09325953A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 【課題】 積和演算を高速に処理可能なプロセッサを提
供する。 【解決手段】 本発明によるプロセッサは、レジスタフ
ァイル6と、4段のパイプラインの浮動小数点乗算器か
らなる2項演算器41と、4つのレジスタからなる累計
レジスタファイル5と、3段パイプラインの浮動小数点
加算器からなる加算器40とを備える。第2命令レジス
タ212に積和命令が格納されると、レジスタファイル
6から読み出された2つのデータが2項演算器41で乗
算され、その結果と累計レジスタファイル5内のデータ
が加算器40で加算され、加算結果は累計レジスタファ
イル5内に格納される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ストアドプログラ
ム方式のプロセッサに関するものであり、特に、積和演
算など、総和演算を含む処理を高速に行う構成に関する
ものである。
【0002】
【従来の技術】3次元グラフィックの座標処理や音声デ
ータの圧縮伸長処理、音声認識処理では、(数1)に示
す積和演算が多用される。
【0003】
【数1】
【0004】(数1)の演算は、(数2)の積演算と
(数3)の総和演算に分けられる。
【0005】
【数2】
【0006】
【数3】
【0007】(数1)の演算の高速な処理を可能とする
技術としては、特開平4―177462号公報記載の技
術がある。この技術では、図13に示す構成の演算装置
により、(数3)の総和演算を高速に処理する。
【0008】図13で、第1のレジスタ91と第2のレ
ジスタ92は、制御回路95からの制御信号に従って、
入力A,Bの値と、値0と、3入力加算回路94の出力
Cの値の内のいずれか1つを選択・保持し、保持した値
を出力する。また、第3のレジスタ93は、制御回路9
5からの制御信号に従って、値0と、3入力加算回路9
4の出力Cの値の内のいずれか1つを選択・保持し、保
持した値を出力する。3入力加算回路94は、クロック
周期T毎に第1のレジスタ91と第2のレジスタ92と
第3のレジスタ93の各出力値を取り込み、その加算結
果をNクロック周期(=NT)かけて求めて出力Cとし
て出力する。
【0009】この演算装置を利用して積和演算を行う場
合、まず、別途、(数2)の数列dj を求めておく。そ
して、求めた数列dj を、(数4)のように2つの数列
A,Bに分け、数列A,Bをそれぞれ第1のレジスタ9
1と第2のレジスタ92に、順次入力する。
【0010】
【数4】
【0011】第1のレジスタ91と第2のレジスタ92
は、順次入力された数列A,Bの値を格納し、3入力加
算回路94へ出力する。第3のレジスタ93は、数列
A,Bの加算結果が3入力加算回路94の出力Cに現れ
るまでの間、値0を保持し3入力加算回路94へ出力す
る。演算開始からNT時間後に3入力加算回路94の出
力Cに演算結果が現れ始めると、第3のレジスタ93
は、その出力Cを順次格納し3入力加算回路94へ出力
する。これにより、以降、3入力加算回路94では、
(数3)に示す総和演算の部分和が3入力で加算され
る。
【0012】そして、数列A,Bが全て入力された時点
から、3入力加算回路94は、N個の部分和を順次出力
する。出力された部分和は、第1のレジスタ91と第2
のレジスタ92と第3のレジスタ93に振り分けられた
後、一斉に加算回路94に入力される。これが繰り返さ
れることで、加算回路94は、部分和を累計していき、
最終的に総和演算の結果を出力する。
【0013】以上のように、従来の技術では、総和演算
が、N個の部分和を求める過程と、求めた部分和の累計
を求める過程からなる。そして、N個の部分和を3入力
の演算で高速に求めることで、総和演算の高速化を図っ
ている。ただし、部分和の累計を求める過程は、加算回
路94の出力の振り分けに要する演算の空き時間を含
み、総和演算の項数が小さくなってもあまり短縮されな
い。
【0014】ところで、3次元グラフィック処理におけ
る座標計算では、(数5)に示す演算を繰り返し高速に
行う必要がある。(数5)の演算は、4項の積和演算を
4つ含んでいる。上記従来の技術では、前述の総和演算
の動作を4回繰り返すことで、(数5)の演算に対応で
きる。
【0015】
【数5】
【0016】
【発明が解決しようとする課題】(数5)のように、項
数が4と少ない総和演算を個別に複数回行う場合、上記
従来の技術では、部分和を3入力の演算で求める過程が
ほとんどないために、部分和の演算で高速化を図ること
はできない。さらに、部分和の累計を求める過程は、個
別に行う総和演算の数に比例して長くなり、総演算時間
の多くの部分を占めるようになる。このため、従来の技
術では、項数の少ない総和演算を含む演算を個別に複数
回行う処理を、高速に実施することは困難であった。
【0017】そこで、本発明は、項数の少ない総和演算
を含む演算を個別に複数回行う処理をより短時間に実施
するプロセッサを提供することを目的とする。
【0018】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明は、命令を格納する命令レジスタと、前記
命令レジスタに格納された命令に応じて、内部の複数の
レジスタの内の2個以上のレジスタから並列にデータが
読み出されるレジスタファイルと、前記レジスタファイ
ルのレジスタから並列に読み出されたデータに、前記命
令レジスタに格納された命令に応じて所定の演算を施す
演算器と、 前記命令レジスタに格納された命令に応じ
て、内部のM個(Mは2以上の整数)のレジスタの内の
1個以上のレジスタからデータを読み出す累計レジスタ
ファイルと、前記演算器が演算した結果のデータと、前
記累計レジスタファイルのレジスタから読み出されたデ
ータを、前記命令レジスタに格納された命令に応じて加
算する加算器とを有し、前記累計レジスタファイルのレ
ジスタには、前記加算器が加算した結果のデータが、前
記命令レジスタに格納された命令に応じて格納されるこ
とを特徴とするプロセッサを提供する。
【0019】このプロセッサでは、総和演算を含む演算
を個別に複数回行う場合に、例えば、個別に行う各演算
に対して累計レジスタファイルのレジスタを割り当て、
演算器により上記各演算の部分的な演算を行って、その
演算結果を割り当てられたレジスタと加算器を用いて累
計(累積加算)していく使い方が出来る。すなわち、総
和演算を、上記各演算毎に一括して実施するのではな
く、上記各演算の順で累計を行いそれを繰り返すことに
より並列に実施することが出来る。このため、このプロ
セッサでは、従来技術で生じていた演算の空き時間なし
に効率よく演算を行うことができ、総和演算の項数が少
ない場合には、従来技術より短時間に演算を実施するこ
とが出来る。
【0020】
【発明の実施の形態】以下で、本発明の実施形態を説明
する。
【0021】図1に、本発明の実施形態に係る3次元グ
ラフィック処理システムの構成を示す。図1で、3次元
グラフィック処理システムは、プロセッサ11と、プロ
セッサ11のプログラムや作業データを記憶する主記憶
装置12と、二次記憶装置13と、画像データをビデオ
信号に変換するビデオ出力装置14と、通信装置15
と、その他のI/O装置16と、これら装置11〜16
を接続するシステムバス10と、ビデオ出力装置14に
接続されたディスプレイ装置140とにより構成され
る。主記憶装置93の記憶領域には、ビデオ出力装置1
4が変換する画像データを記憶するフレームバッファが
形成されている。プロセッサ11は、二次記憶装置13
内に蓄えられたデータや、通信装置15によって他のシ
ステムから送られたデータを処理し、処理結果を主記憶
装置12内のフレームバッファに画像データとして蓄え
る。フレームバッファに蓄えられた画像データは、ビデ
オ出力装置14でビデオ信号に変換された後、ディスプ
レイ140で表示される。
【0022】プロセッサ11の内部構成を、図2に示
す。
【0023】図2で、プロセッサ11は、4つの読み出
しポートと3つの書き込みポートを持つレジスタファイ
ル6と、ALUからなる第1演算処理装置31、第2演
算処理装置32と、演算処理装置装置31,32に与え
る命令をそれぞれ格納する命令レジスタ211,212
と、ロード/ストア処理装置30と、命令供給装置21
と、書き込みデータ・セレクタ60と、システムバス・
インタフェース20とを備える。また、プロセッサ11
は、図3に示す4段のパイプラインの浮動小数点乗算器
からなる2項演算器41と、図5に示す累計レジスタフ
ァイル5と、3段のパイプラインの浮動小数点加算器か
らなる加算器40とにより構成された積和演算部33
を、第2演算処理装置32に併設している。
【0024】累計レジスタファイル5は、図5に示すよ
うに、浮動小数点データをそれぞれ格納可能な4個のレ
ジスタFMAC0〜FMAC3と、セレクタ54,55
を有し、レジスタFMAC0〜FMAC3において、任
意のレジスタからのデータの読み出しと、任意のレジス
タへのデータの書き込みとを同時に行うことが出来る。
一方、レジスタファイル6は、図6に示すように、浮動
小数点データを格納可能な64個のレジスタR0〜R6
3を形成するRAMからなり、4つの読み出しポートと
3つの書き込みポートにより、レジスタR0〜R63の
任意の4つのレジスタからのデータの読み出しと、任意
の3つのレジスタへの書き込みとを同時に行うことが出
来る。
【0025】命令供給装置21は、主記憶装置12に記
憶されたプログラムの命令を、システムバス・インタフ
ェース20を介して順次読み出し、命令の種類に応じ
て、第1命令レジスタ211または第2命令レジスタ2
12に格納する。第1命令レジスタ211に格納された
命令により、レジスタファイル6の読み出しポートの内
の2つと、第1演算処理装置31と、ロード/ストア処
理装置30と、書き込みデータセレクタ60と、レジス
タファイル6の書き込みポートとが制御される。同様
に、第2命令レジスタ212に格納された命令により、
レジスタファイル6と、第2演算処理装置32と、2項
演算器41と、累計レジスタファイル5と、加算器40
と、書き込みデータセレクタ60とが制御される。ここ
で、プロセッサ11は、第1命令レジスタ211に格納
された一命令の実行と、第2命令レジスタ212に格納
された一命令の実行を、並列的に同時に行うことが出来
る。また、これらの命令の実行に伴うレジスタファイル
6での読み出しと書き込みも、並列的に同時に行うこと
が出来る。つまり、プロセッサ11は、スーパースカラ
またはVLIW(Very Long Instruction Word)アーキテ
クチャを採用したものである。
【0026】また、プロセッサ11は、ロード命令、ス
トア命令、加算命令、乗算命令をサポートする他、積和
演算部33について、積和命令と、全累計レジスタクリ
ア命令と、累計レジスタセット命令の3つの命令もサポ
ートする。この3つの命令は、命令供給装置21によっ
て第2命令レジスタ212に格納される。命令のフォー
マットと動作内容を、表1に示す。表中で、矢印は、右
辺の演算結果を左辺のレジスタに格納することを表し、
RnもしくはFMACnは、レジスタRnもしくはレジ
スタFMACnに格納されたデータを表す。
【0027】
【表1】
【0028】全累計レジスタクリア命令が第2命令レジ
スタ212に格納されると、累計レジスタファイル5の
内部の全てのレジスタFMAC0〜FMAC3の格納デ
ータはゼロにクリアされる。累計レジスタセット命令が
第2命令レジスタ212に格納されると、その命令に応
じて、レジスタファイル6内のレジスタR0〜R63の
1つが選択され、その格納データが読み出しポートに出
力される。出力されたデータは、上記命令に応じた累計
レジスタファイル5内の1つのレジスタに格納される。
【0029】積和命令が第2命令レジスタ212に格納
されると、まず、積和命令に応じたレジスタファイル6
内の2つのレジスタが選択され、これら2つのレジスタ
の格納データが2つの読み出しポートに出力される。そ
して、出力された2つのデータには、2項演算器41に
よって乗算演算が施され、4パイプラインサイクル(p
s)後、その乗算結果が加算器40へ伝えられる。ま
た、積和命令に応じて、累計レジスタファイル5内の1
つのレジスタが選択され、そのレジスタに格納されたデ
ータが加算器40へ伝えられる。加算器40は、伝えら
れた2つのデータを加算し、3[ps]後に、その加算結果
を出力する。積和命令に従って、累計レジスタファイル
5内の1つのレジスタが選択され、そのレジスタに加算
器40の加算結果が格納される。また、同時に、積和命
令に従って、レジスタファイル6内の1つのレジスタが
選択され、そのレジスタにも加算結果が格納される。
【0030】次に、(数5)のマトリクス演算を行う場
合のプロセッサ11の動作を説明する。
【0031】図1に示した主記憶装置12には、作業デ
ータとして、(数5)の座標データ(x,y,z,w)と、マト
リックスデータMi,j(i,j=0,1,2,3)が格納されてい
る。これらのデータは、演算に先立ち、第1命令レジス
タ211に格納されたロード命令に従って、ロード/ス
トア処理装置30の制御下で、主記憶装置12より順次
読み出され、システムバス・インタフェース20、セレ
クタ60を介して、レジスタファイル6内に格納され
る。このとき、レジスタファイル6には、図7の(a)
に示す対応関係でデータが格納される。また、演算結果
(x',y',z',w')は、図7の(b)に示す対応関係でレジ
スタファイル6内に格納される。
【0032】(数5)の処理は、積和命令を用いた図8
に示すプログラムによって実施される。なお、プログラ
ムの各命令(ステップ)は、1[ps]毎に第2命令レジス
タ213に順次格納され、実行される。
【0033】図8のプログラムの処理で、まず、ステッ
プ1の全累計レジスタクリア命令に従って、累計レジス
タファイル5がクリアされる。次に、ステップ2の積和
命令に従って、レジスタファイル6のレジスタR0,R
10の各格納データが2項演算器41に入力される。そ
の乗算結果は4[ps]後に2項演算器41から出力され、
加算器40で、累積レジスタ5のレジスタFMAC0の
格納データ(値0)と加算される。そして、その加算結
果は3[ps]後に出力され、レジスタFMAC0,R4に
格納される。同様に、ステップ3の積和命令に従って、
レジスタR0,R20の各格納データが乗算され、その
結果がレジスタR5に格納される。こうして、ステップ
2〜5により、(数5)のマトリクスデータMi,0(i=
0,1,2,3)と座標データxの乗算結果がそれぞれレジス
タR4〜R7に格納される。そして、ステップ6〜9で
は、マトリクスデータMi,1と座標データyの乗算が行
われて、その乗算結果がレジスタR4〜R7の格納デー
タに累計される。さらに、ステップ10〜17で、座標
データz,wについての乗算と累計が行われ、ステップ1
7の処理が開始されてから7[ps]後に全ての積和演算が
完了する。以上のように、積和演算部33は(数5)の
積和演算を、17個の命令に従って23[ps]で実施す
る。
【0034】ここで、比較のために、(数5)の処理を
積和命令を用いずに加算命令と乗算命令で実施する場合
について考える。ただし、ここでは、累計レジスタファ
イル5を利用せず、各命令毎に加算器40と2項演算器
41を個別に用いるものとする。この場合の積和演算処
理は、図10に示すプログラムによって実現される。図
10のプログラムは、図11に示すタイミングで実行さ
れる。すなわち、この例では、(数5)の積和演算を、
28個の命令により30[ps]で実施する。
【0035】この結果より、積和命令を用いた場合のプ
ログラムは、加算命令と乗算命令の場合の約60%の長
さで済むことがわかる。また、積和命令を用いた場合の
処理速度は、加算命令と乗算命令の場合に対し約1.3
倍高速となる。
【0036】なお、(数5)の処理を複数回繰返した場
合、データのロード/ストアの処理を除くと、積和命令
を用いた場合の処理速度は、加算命令と乗算命令の場合
に対し約1.6倍高速となる。これは、積和命令を用い
た積和演算部33が、乗算と加算を1つの積和演算命令
で実現でき、その積和演算命令を連続的に実行できるこ
となどによるものである。また、累計レジスタファイル
5の設置により増加するハードウェア量は、レジスタフ
ァイル6の読み出しポート数を増やした場合のハードウ
ェアの増加量よりも少ない。
【0037】また、プロセッサ11では、累計レジスタ
ファイルが加算器40のパイプライン段数以上のレジス
タを含んでいるため、命令のレイテンシを考慮して、累
計レジスタの番号と命令を対応付けるので、命令の実行
結果の管理などの命令スケジュール管理を容易に行うこ
とが出来る。これにより、積和演算の中間結果を管理し
たり、途中で他の命令を挿入したり命令の順番を少し変
えたりする柔軟性が得られる。さらに、命令スケジュー
ル管理が容易となることで、プロセッサ11用の高級言
語コンパイラの実現も容易となる。
【0038】次に、(数5)のマトリクス演算を連続し
て複数回行う場合のプロセッサ11の動作について説明
する。
【0039】プロセッサ11は、2つの命令を並行して
同時に実行する機能を用いて、複数のマトリクス演算を
高速に処理することができる。ただし、ここでは、レジ
スタファイル6には、図7に示した構造のデータが2組
格納されるものとする。
【0040】(数5)のマトリクス演算を4回行う場合
のプロセッサ11の動作を、図12に示す。図12で、
まず、図7のマトリクス演算1の演算データが、第1の
命令レジスタ211に格納された命令に従って主記憶装
置12からプロセッサ11のレジスタファイル6にロー
ドされる。ロードされた演算データには、第2の命令レ
ジスタ212に格納された命令に従って図8の手順でマ
トリクス演算1が施される。この演算と並行して、第1
の命令レジスタ211には、次のマトリクス演算2の演
算データのロードを指定する命令やアドレス計算の命令
が格納される。これにより、マトリクス演算1が終了す
る前に、レジスタファイル6にはマトリクス演算2の演
算データがロードされる。マトリクス演算1が終了する
と、第1の命令レジスタ211に、マトリクス演算1の
演算結果データのストアを指定する命令が格納され、第
2の命令レジスタ212には、マトリクス演算2を指示
する命令が格納される。これにより、マトリクス演算1
の演算結果データの主記憶装置12へのストアと、マト
リクス演算2とが並行して同時に行われる。そして、マ
トリクス演算1の演算結果のデータのストアが終了する
と、第1の命令レジスタ211に格納された命令によ
り、マトリクス演算2と並行してマトリクス演算3の演
算データのロードが行われる。こうして、マトリクス演
算3,4についての演算データのロードと演算結果デー
タのストアが行われる。
【0041】次に、項数が非常に多い場合の(数1)の
積和処理への対応について説明する。この場合、レジス
タファイル6の容量に応じて、積和処理を(数6)に示
すような例えば4つの部分和に分け、その部分和を累計
する(数7)により積和処理の結果を得る。
【0042】
【数6】
【0043】
【数7】
【0044】まず、(数6)で示した部分和を、積和演
算命令を用いて求める。その後、求めた4つの部分和
を、(数7)に従って、加算命令を用いて処理する。こ
のように処理することで、積和演算を用いない場合に対
し、約2倍高速に演算することが出来る。
【0045】なお、以上の実施形態では、2項演算器4
1を乗算器としたが、図4に示すように、加算器や、入
力値の差の絶対値を求める演算器としてもよい。2項演
算器41を加算器とすれば、乗算を伴わない総和演算
を、高速に演算することが出来る。また、2項演算器4
1を差の絶対値を求める演算器とすれば、2つのベクト
ルの相違の程度を、高速に演算することが出来る。
【0046】
【発明の効果】以上で説明したように、本発明によれ
ば、項数の少ない総和演算を含む演算を個別に複数回行
う処理をより短時間に実施するプロセッサを提供するこ
とが出来る。
【図面の簡単な説明】
【図1】 本発明の実施形態に係わる3次元コンピュー
タグラフィックスシステムの構成を示すプロック図であ
る。
【図2】 図1のプロセッサの構成を示すブロック図で
ある。
【図3】 図2の浮動小数点2項演算器の構成を示すブ
ロック図である。
【図4】 図2の浮動小数点2項演算器の他の構成例を
示したブロック図である。
【図5】 図2の累計レジスタファイルの構成を示すブ
ロック図である。
【図6】 図2のレジスタファイルの構成を示すブロッ
ク図である。
【図7】 図2のレジスタファイルへの行列データの格
納の様子を示した図である。
【図8】 図2のプロセッサのプログラム例を示した図
である。
【図9】 図8で示したプログラムの実行シーケンスを
示した図である。
【図10】 積和演算命令を用いないプログラム例を示
した図である。
【図11】 図10で示したプログラムの実行シーケン
スを示した図である。
【図12】 マトリクス演算を繰り返し行う場合のプロ
セッサの動作を示す図である。
【図13】 従来の技術による総和演算装置を示したブ
ロック図である。
【符号の説明】
10…システムバス 11…プロセッサ 12…主記憶装置 13…2次記憶装置 14…ビデオ出力装置 140…ディスプレイ装置 15…通信装置 16…その他入出力装置 20…システムバス・インタフェース 21…命令供給装置 211…第1命令レジスタ 212…第2命令レジスタ 30…ロード/ストア処理装置 31…第1演算処理装置 32…第2演算処理装置 40…浮動小数点加算器 41…浮動小数点2項演算器 5…累計レジスタファイル 6…レジスタファイル 60…書き込みデータセレクタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 西岡 清和 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】命令を格納する命令レジスタと、 複数のレジスタを備え、前記命令レジスタに格納された
    命令に応じて、前記複数のレジスタの内の2個以上のレ
    ジスタから並列にデータが読み出されるレジスタファイ
    ルと、 前記レジスタファイルのレジスタから並列に読み出され
    たデータに、前記命令レジスタに格納された命令に応じ
    て所定の演算を施す演算器と、 M個(Mは2以上の整数)のレジスタを備え、前記命令
    レジスタに格納された命令に応じて、前記M個のレジス
    タの内の1個以上のレジスタからデータを読み出す累計
    レジスタファイルと、 前記演算器が演算した結果のデータと、前記累計レジス
    タファイルのレジスタから読み出されたデータを、前記
    命令レジスタに格納された命令に応じて加算する加算器
    とを有し、 前記累計レジスタファイルのレジスタには、前記加算器
    が加算した結果のデータが、前記命令レジスタに格納さ
    れた命令に応じて格納されることを特徴とするプロセッ
    サ。
  2. 【請求項2】請求項1記載のプロセッサであって、 前記加算器が、段数N(ただし、Nは、M≧N≧2を満
    たす整数)のパイプラインで構成されていることを特徴
    とするプロセッサ。
  3. 【請求項3】請求項1または2記載のプロセッサであっ
    て、 前記命令レジスタに格納される命令は、 前記演算器の演算対象のデータが読み出される前記レジ
    スタファイルのレジスタと、前記加算器の演算対象のデ
    ータが読み出される前記累計レジスタファイルのレジス
    タと、前記加算器が加算した結果のデータが格納される
    前記累計レジスタファイルのレジスタとを指定し、か
    つ、前記演算器および加算器の演算および加算の実行を
    指令する命令を含むことを特徴とするプロセッサ。
  4. 【請求項4】請求項1または2記載のプロセッサであっ
    て、 前記命令レジスタに格納された命令に応じて、前記累計
    レジスタファイルの全てのレジスタに格納されるデータ
    を所定の値とする手段を有することを特徴とするプロセ
    ッサ。
  5. 【請求項5】請求項1または2記載のプロセッサであっ
    て、 前記累計レジスタファイルには、前記レジスタファイル
    のレジスタから読み出されたデータが、前記命令レジス
    タに格納された命令に応じて格納されることを特徴とす
    るプロセッサ。
  6. 【請求項6】請求項1または2記載のプロセッサであっ
    て、 前記レジスタファイルのレジスタには、前記加算器が加
    算した結果のデータが、前記命令レジスタに格納された
    命令に応じて格納されることを特徴とするプロセッサ。
  7. 【請求項7】複数の命令からなるプログラムと、データ
    とを記憶した記憶手段と、 前記記憶手段に記憶されたデータを取り込み、前記記憶
    手段に記憶された命令を順次取り込み、取り込んだ命令
    に従った処理を行うプロセッサとを備えたデータ処理装
    置であって、 前記プロセッサは、 前記記憶手段から取り込んだ命令を格納する命令レジス
    タと、 前記記憶手段から取り込んだデータを格納する複数のレ
    ジスタを備え、前記命令レジスタに格納された命令に応
    じて、前記複数のレジスタの内の2個以上のレジスタか
    ら並行してデータが読み出されるレジスタファイルと、 前記レジスタファイルのレジスタから並列に読み出され
    たデータに、前記命令レジスタに格納された命令に応じ
    て所定の演算を施す演算器と、 複数のレジスタを備え、前記命令レジスタに格納された
    命令に応じて、前記複数のレジスタの内の1個以上のレ
    ジスタからデータを読み出す累計レジスタファイルと、 前記演算器が演算した結果のデータと、前記累計レジス
    タファイルのレジスタから読み出されたデータを、前記
    命令レジスタに格納された命令に応じて加算する加算器
    とを有し、 前記累計レジスタファイルのレジスタには、前記加算器
    が加算した結果のデータが、前記命令レジスタに格納さ
    れた命令に応じて格納されることを特徴とするデータ処
    理装置。
JP14446296A 1996-06-06 1996-06-06 プロセッサおよびデータ処理装置 Pending JPH09325953A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14446296A JPH09325953A (ja) 1996-06-06 1996-06-06 プロセッサおよびデータ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14446296A JPH09325953A (ja) 1996-06-06 1996-06-06 プロセッサおよびデータ処理装置

Publications (1)

Publication Number Publication Date
JPH09325953A true JPH09325953A (ja) 1997-12-16

Family

ID=15362839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14446296A Pending JPH09325953A (ja) 1996-06-06 1996-06-06 プロセッサおよびデータ処理装置

Country Status (1)

Country Link
JP (1) JPH09325953A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017010512A (ja) * 2014-07-02 2017-01-12 ヴィア アライアンス セミコンダクター カンパニー リミテッド 計算制御インジケータキャッシュ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017010512A (ja) * 2014-07-02 2017-01-12 ヴィア アライアンス セミコンダクター カンパニー リミテッド 計算制御インジケータキャッシュ

Similar Documents

Publication Publication Date Title
EP3513281B1 (en) Vector multiply-add instruction
JP2645669B2 (ja) データ処理システム
US5226171A (en) Parallel vector processing system for individual and broadcast distribution of operands and control information
US5261113A (en) Apparatus and method for single operand register array for vector and scalar data processing operations
JP3983857B2 (ja) ベクトルレジスタの複数バンクを用いた単一命令複数データ処理
JP4584580B2 (ja) 単一命令複数データ(simd)命令用の積和演算(mac)ユニット
US5081573A (en) Parallel processing system
JP2020529070A (ja) ベクトル計算ユニット
CN110073329A (zh) 访存设备、计算设备和应用于卷积神经网络运算的设备
EP0314809B1 (en) Vector processor for processing recurrent equations at a high speed
JPH10187438A (ja) 乗算器の入力に対する遷移を減少させる方法
CN109144469B (zh) 流水线结构神经网络矩阵运算架构及方法
JP2020109605A (ja) マルチスレッドプロセッサのレジスタファイル
US6446193B1 (en) Method and apparatus for single cycle processing of data associated with separate accumulators in a dual multiply-accumulate architecture
JPH1097517A (ja) 並列乗算累算アレイ回路
JP2518293B2 (ja) デ−タフロ−プロセツサ
CN112074810B (zh) 并行处理设备
US20070198811A1 (en) Data-driven information processor performing operations between data sets included in data packet
EP1936492A1 (en) SIMD processor with reduction unit
JPH09325953A (ja) プロセッサおよびデータ処理装置
JPH05324694A (ja) 再構成可能並列プロセッサ
JPH06309349A (ja) プログラム制御のプロセッサ
JPS6310263A (ja) ベクトル処理装置
US6792442B1 (en) Signal processor and product-sum operating device for use therein with rounding function
EP1785863A2 (en) A divider comprising a carry save adder and a full adder