JPH0511979A - 演算処理装置 - Google Patents

演算処理装置

Info

Publication number
JPH0511979A
JPH0511979A JP3164819A JP16481991A JPH0511979A JP H0511979 A JPH0511979 A JP H0511979A JP 3164819 A JP3164819 A JP 3164819A JP 16481991 A JP16481991 A JP 16481991A JP H0511979 A JPH0511979 A JP H0511979A
Authority
JP
Japan
Prior art keywords
instruction
slot
transfer
integer
slots
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3164819A
Other languages
English (en)
Other versions
JP3186095B2 (ja
Inventor
Atsushi Okamura
淳 岡村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP16481991A priority Critical patent/JP3186095B2/ja
Publication of JPH0511979A publication Critical patent/JPH0511979A/ja
Application granted granted Critical
Publication of JP3186095B2 publication Critical patent/JP3186095B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Executing Machine-Instructions (AREA)
  • Advance Control (AREA)

Abstract

(57)【要約】 【構成】演算命令を解釈実行することのできる整数演算
ユニット6,8と、転送命令を解釈実行することのでき
る転送ユニット5,7と、プログラムの流れの制御を行
うことのできる分岐ユニット11とを少なくとも含む。
これらによりJ×Nビットの(J,Nは自然数)命令を
同時に解釈実行する際、J×Nビットの命令は、転送ユ
ニット5,7が解釈実行する命令セットと、整数演算ユ
ニット6,8が解釈実行する命令セットと、分岐ユニッ
ト11が解釈実行する命令セットとのすべてを単一の命
令フォーマットをもって記述でき且つ等長なJ個のビッ
ト列からなるN個のスロットで構成される。 【効果】VLIW型の命令割付方式を採用することによ
り、スロット数の違う装置間でソフトウェアが互換性を
持つようになると同時に、設計時のモジュール分割化に
より多種のスロット幅や多種の演算を持ったソフトウェ
アの互換性の高い装置を高性能なものから、低価格のも
のまで、これらの組み合せでつくることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は演算処理装置に関し、特
にVLIW(超ロング・インストラクション・ワード)
型の演算処理装置に関する。
【0002】
【従来の技術】従来、この種の計算機システム等の高性
能化を計る演算処理装置としては、VLIW型並列命令
処理方式を採用した演算処理装置がある。このVLIW
型並列命令処理は、複数の命令フィールド(以下、スロ
ットと称す)からなる比較的長い命令語(以下、ブロッ
クと称す)をひとつの命令として処理するものであり、
各スロットが演算器,レジスタ,相互結合網,メモリな
ど独立に制御できる資源を持ち、処理を並列して行うも
のである。
【0003】またVLIW型命令方式は、前述した資源
を制御するのに必要な命令ビットフィールドを、そろぞ
れ整数演算スロット,浮動小数点加算スロット,浮動小
数点加算スロット,転送スロット,分岐制御スロットな
どに分割し、スロット毎の命令を並べてブロックを組み
上げることにより、命令を構成している。
【0004】図8は従来の一例を示す演算処理装置のブ
ロック構成図である。図8に示すように、従来の計算機
における演算器部分は、プロセッサ内部の汎用レジスタ
の集まりであるレジスタファイル1や外部メモリ2を接
続した入力交換網4とレジスタ・ファイル13を接続し
た出力交換網12との間に、転送ユニット5,7と、整
数演算ユニット6,8と、浮動小数点ユニット10およ
び分岐ユニット11とを設け、現在実行中の命令を記憶
する命令レジスタ3Aの各ユニットに対応するスロット
を解析し実行する。このうち、転送ユニット5,7はレ
ジスタファイル1と外部メモリ2の間のデータのやり取
りを行い、整数演算ユニット6,8はレジスタファイル
1のデータの整数演算を行う。また、浮動小数点ユニッ
ト10はレジスタファイル1の浮動小数点データの演算
を行い、分岐ユニット11は分岐命令を実行する。更
に、入力交換網4はレジスタファイル1のデータを各実
行ュニットに分配し、出力交換網12は各ユニットの実
行結果を特定のレジスタファイル13に書戻すための交
換網である。要するに、この演算にあたっては、レジス
タファイル1および外部メモリ2をソースとし、入力交
換網4で各演算器に必要なデータを選択し、その演算結
果を出力交換網12を介してレジスタファイルまたは外
部メモリ13に書き込むという手順で行われる。
【0005】上述したVLIW型演算装置を有効に使う
ためには、並列化されたスロットに対して、翻訳系は解
釈時に並列性を抽出し、命令ブロックを合成する。そこ
で並列スロット数に近い並列度が得られる場合には、高
速処理を実現できる。しかしながら、並列度が低い場合
には、命令スロットをうめることは不可能である。
【0006】図9は図8に示す演算装置における命令ブ
ロックの構成図である。図9に示すように、この命令ブ
ロックは全体で10バイトあり、第1および第2の転送
命令スロット30,31と、第1および第2の整数演算
命令スロット32,33と、浮動小数点演算スロット3
4および分岐演算命令スロット35とを有している。こ
の第1および第2の転送命令スロット30,31は転送
命令のみを置くことができ、ビット番号で表わすよう
に、命令ブロックの159〜121および120〜82
ビットを占めている。また、第1および第2の整数演算
命令スロット32,33は整数演算を置くことができ、
命令ブロックの81〜67および66〜52ビットを占
める。同様に、浮動小数点演算スロット34および分岐
演算命令スロット35はそれぞれ浮動小数点演算命令と
分岐命令を置くことができ、命令ブロックの51〜37
と36〜0ビットを占める。次に、これらスロットのそ
れぞれの構成である命令フォーマットについて説明す
る。
【0007】図10は図9に示す各スロットの命令フォ
ーマット図である。図10に示すように、転送命令スロ
ット36は、図9に示す第1および第2の転送命令スロ
ット30,31の命令フォーマットであり、転送命令コ
ード,2つのレジスタ,相対アドレスを有している。ま
た、整数演算命令スロット37は、図9の第1および第
2の整数演算命令スロット32,33の命令フォーマッ
トであり、整数演算コード,ソースレジスタ,ディステ
ィネーションレジスタを有している。浮動小数点演算命
令スロット38は、同様に浮動小数点演算スロット34
の命令フォーマットであり、浮動小数点命令コード,ソ
ースレジスタ,ディスティネーションレジスタを有して
いる。更に、分岐命令スロット39は分岐演算命令スロ
ット35の命令フォーマットであり、分岐条件コード,
レジスタ,相対アドレスを有している。次に、これらの
命令フォーマット詳細について、図11および図12を
参照する。
【0008】図11(a),(b)はそれぞれ図10に
示す転送命令スロットの転送命令コードを表わす図およ
び整数演算命令スロットの整数演算コードを表わす図で
ある。図11(a)に示すように、この転送命令コード
40は、何もしないモードをコード0とし、以下3つの
モードに対するコードを規定している。また、図11
(b)に示すように、この整数演算コード41では、各
種の演算に対しそれぞれのコードを規定している。
【0009】図12(a),(b)はそれぞれ図10に
示す浮動小数点演算命令スロットの浮動小数点命令コー
ドを表わす図および分岐命令スロットの命令コードを表
わす図である。図12(a),(b)に示すように、浮
動小数点命令コード42および分岐命令コード43も図
11(a),(b)の場合と同様である。
【0010】以下、上述した図10と図11(a),
(b)および図12(a),(b)を参照して詳細に説
明する。
【0011】まず、図10における転送命令スロット3
6の命令は、レジスタ3Aから外部メモリ2へのデータ
の書き込みと外部メモリ2からレジスタ3Aへのデータ
の読み出し、および即値をレジスタ3Aに書き込む動作
をする。ここで、実行されるオペレーションの種類は3
8〜37ビット目で決定される。尚、、それぞれのオペ
レーションは、図11(a)に示すスロットコードを有
する。例えば、スロットコードが1ならば、即値の読み
込みであるので、転送命令の26〜0ビットの値を第2
のレジスタに書き込むという動作を行う。
【0012】次に、図10における整数演算命令スロッ
ト37では、加減乗除,論理演算,比較,補数生成など
を実行できる。各命令は整数演算命令スロット37の整
数演算コードである14〜10ビット目で区別される。
この例における演算は、以下のように実行される。
【0013】ディスティネーション=演算(ソース,デ
ィスティネーション) ディスティネーション=演算(ソース) この図11(b)に示す整数演算コードは、整数演算命
令スロット32,33でのみ有効である。
【0014】次に、図10における浮動小数点演算スロ
ット38は、各浮動小数点演算を実行できる。このスロ
ットも整数演算命令スロット37と同様に、このスロッ
トで実行される浮動小数点命令の種類は、14〜10ビ
ット目で決まる。図12(a)に示す例では、加減乗
除,正弦,余弦,逆正接,平方根,指数,対数を実行す
ることができる。
【0015】最後に、図10における分岐命令スロット
39における分岐条件は、36〜32ビット目で表わさ
れる。しかも、31〜27ビット目に示されるレジスタ
中にある分岐条件が分岐条件コードを満たした場合、相
対アドレスに分岐する。この分岐条件の例は、図12
(b)に示すとおりである。
【0016】例えば、図10の転送命令36は39ビッ
トで構成されているため、ブロックのうちの39ビット
分を占める。そして、この命令はブロックの中で必ずビ
ット159からビット121、またはビット120から
ビット82に置かれる必要がある。さらに各スロットの
動作は限定されており、独立に実行される専用の実行手
段を用いて、独立に命令を解釈実行する。すなわち、各
スロットは転送2、整数演算2、浮動小数点演算1、分
岐1の160ビット幅の命令を実行することになる。こ
の例では、同時に6個の命令を実行することができる
が、命令の種類毎の数が決っており、転送命令は2個、
整数演算命令は2個、浮動小数点演算命令は1個、分岐
命令は1個である場合だけ、6個の命令を実行すること
が可能である。
【0017】一方、同時に実行できる命令がない場合
は、他の演算を阻害させないような命令、例えばNOP
(ノーオペレーション)を実行することになる。
【0018】また、命令ブロックの幅は一般的に8の倍
数になっている。それは一般的に最小データ型である文
字型が8ビット幅のデータであるためであり、他のデー
タ型もこれの整数倍でできている。これと違う半端な長
さでは、命令とデータの長さがずれてしまうので、扱い
にくくなる。
【0019】
【発明が解決しようとする課題】上述した従来のVLI
W型並列処理法式を採用した演算処理装置は、その命令
の長さによって最大の並列性が決定する。つまり、幅が
広い命令ブロックを持つモデル程、その処理速度を速く
できる可能性を持っている。しかしながら、翻訳系の技
術でソースプログラムの並列性を抽出し、多くのスロッ
トを有効な命令で満たすことは困難である。これは、要
するに幅の広いものほど有効な命令の入らないスロット
数が多くなることになる。さらに、並列性の最大は、そ
の応用プログラムによってもほぼ決まっているため、そ
れ以上の数のスロットは単に空いたスロットを生むこと
になる。この空いたスロットを減らすために、アプリケ
ーションプログラムによって最適な且ついろいろな数の
スロットを持ったプロセッサが必要である。これをする
ことは、各々の実行ユニットの構成によって命令のビッ
トフィールドを変更し、ブロック長のつじつまを合わ
せ、デコーダを作ることは非常に無駄が多い。その上、
各スロットが単機能の命令だけしか実行できないため、
並列に実行できるはずの命令でも、その演算を実行でき
るスロットが既に使用されている場合、他の機能のスロ
ットが空いていても、そこへ入ることができない。以上
のスロットの数と機能の違った各々のプロセッサに対応
したプログラム・コードをすべて作らねばならないとい
う欠点がある。
【0020】本発明の目的は、このようなソフトウェア
の互換性の高い演算処理装置を提供することにある。
【0021】
【課題を解決するための手段】本発明の演算処理装置
は、演算命令を解釈実行することのできる整数演算手
段,転送命令を解釈実行することのできる転送手段およ
びプログラムの流れの制御を行うことのできる分岐命令
実行手段を少なくとも含み、これらによりJ×Nビット
の(J,Nは自然数)命令を同時に解釈実行する際、前
記J×Nビットの命令は、前記転送手段が解釈実行する
命令セットと、前記整数演算手段が解釈実行する命令セ
ットと、前記分岐命令実行手段が解釈実行する命令セッ
トとのすべてを単一の命令フォーマットをもって記述で
き且つ等長なJ個のビット列からなるN個のスロットで
構成される。
【0022】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0023】図1は本発明の第一の実施例を示す演算処
理装置のブロック構成図である。図1に示すように、本
実施例の演算処理装置は、レジスタファイル1や外部メ
モリ2を接続した入力交換網4とレジスタ・ファイルま
たは外部メモリ13を接続した出力交換網12との間
に、転送ユニット5および整数演算ユニット6と、転送
ユニット7および整数演算ユニット8と、整数演算ユニ
ット9および浮動小数点ユニット10と、分岐ユニット
11とを設け、現在実行中の命令を記憶する命令レジス
タ(32ビット×4)3の各ユニットに対応する第1乃
至第4の命令スロットを解析し実行する。このうち、転
送ユニット5および整数演算ユニット6と、転送ユニッ
ト7および整数演算ユニット8とは、命令によりどちら
かが選択され、整数演算ユニット9および浮動小数点ユ
ニット10と、分岐ユニット11とは、命令コードによ
り実行時に選択される。ここでは、命令レジスタ3が4
つのスロットを有し、第1のスロットは転送ユニット5
および整数演算ユニット6に対応し、第2のスロットは
転送ユニット7および整数演算ユニット8に対応する。
また、第3のスロットは整数演算ユニット9および浮動
小数点ユニット10に対応し、第4のスロットは分岐ユ
ニット11に対応する。このため、命令レジスタ3のブ
ロックは、128ビット幅であり、各スロットは32ビ
ット幅で構成されている。これら7つの手段は、独立に
各スロットの命令を解釈実行する。
【0024】このように、4スロットの場合、命令は3
2ビット×4としており、各命令フィールドには複数の
演算器が対応する。しかるに、命令フォーマットは各演
算器で共通なため、1つのスロットに1つ以上の演算器
を対応させることができる。
【0025】図2は図1に示す命令レジスタにおける命
令ブロックの構成図である。図2に示すように、この命
令レジスタ3における命令ブロックは、第1スロット1
4,第2スロット15,第3スロット16,第4スロッ
ト17により構成され、各機能は前述したとおり、第
1,第2のスロット14,15には転送命令と整数演算
命令が入り、第3スロット16には浮動小数点演算命令
が入り、第4スロット17には分岐命令が入る。
【0026】図3は図2に示す各スロットの命令フォー
マット図である。図3に示すように、ここでは各スロッ
トの命令ビット・フィールドの分割を示し、各命令のオ
ペコードの部分の長さはすべて6ビットになっている。
整数演算命令18はオペコード,ソースレジスタおよび
ディスティネーションレジスタを有し、第1〜第3スロ
ットに入る整数演算命令のフォーマットである。浮動小
数点命令19は同様にオペコード,ソースレジスタおよ
びディスティネーションレジスタを有し、第3スロット
でのみ実行できる浮動小数点命令のフォーマットであ
る。また、転送命令20はロードセーブ,第1レジス
タ,第2レジスタおよびオフセットを有し、第1,第2
スロットで実行される転送命令用の命令フォーマットで
ある。更に、分岐命令21は分岐条件,第1レジスタお
よびオフセットを有し、第4スロットで実行される分岐
命令用の命令フォーマットである。すなわち、各命令の
フォーマットは32ビット幅に統一されており、ビット
31をMSB、ビット0をLSBとすれば、ビット31
からビット26は全ての命令フォーマットに対して共通
の命令コードとなっている。この命令コードは全ての命
令で重ならないように構成される。しかも、これらの命
令コード群および命令フォーマット群は第1〜第4スロ
ットで同等である。但し、第1のスロットは転送と整数
演算の手段だけを持つため、これ以外の命令を実行する
ことはできない。他のスロットも同様であり、第2スロ
ットでは転送と整数演算のみ、第3スロットでは整数演
算と浮動小数点演算のみ、第4スロットでは浮動小数点
演算のみの実行が可能である。複数の実行手段を割り当
てられたスロットは、命令によって実行手段のうち何れ
かを選ぶことになる。
【0027】実際のプログラムの実行は、実行されるべ
き命令列が順々に命令レジスタ3に取り込まれ、これに
よりlz制御される各手段が外部メモリのデータを内部
レジスタに読み込み、または内部レジスタ上で演算し、
または外部メモリに書き戻すというようにして実行され
る。
【0028】図4(a),(b)はそれぞれ図3におけ
る各スロットの命令ビットフィールドの整数演算命令用
オペコードおよび浮動小数点演算命令用オペコードを表
わす図である。図4(a),(b)に示すように、これ
らオペコードはすべて16進数で記載されており、各演
算手段の解釈実行を行う命令コードの割り付けを示して
いる。例えば、整数演算命令用オペコード22は加算の
フィールド値を00で表わし、浮動小数点演算命令用オ
ペコード23は浮動小数点数変換のフィールド値を14
で表わしている。
【0029】図5(a),(b)はそれぞれ図3におけ
る各スロットの命令ビットフィールドの転送命令用オペ
コードおよび分岐命令用オペコードを表わす図である。
図5(a),(b)に示すように、これらオペコードも
すべて16進数で記載されており、各演算手段の解釈実
行を行う命令コードの割り付けを示している。例えば、
転送命令用オペコード24はロードのフィールド値を0
Dで表わし、分岐命令用オペコード25は等しいのフィ
ールド値を20で表わしている。
【0030】図6は本発明の第二の実施例を示す演算処
理装置のブロック構成図である。図6に示すように、本
実施例の演算処理装置は、レジスタファイル1や外部メ
モリ2を接続した入力交換網4とレジスタ・ファイルま
たは外部メモリ13を接続した出力交換網12との間
に、転送ユニット5,整数演算ユニット6および浮動小
数点ユニット10と、転送ユニット7,整数演算ユニッ
ト8および分岐ユニット11とを設け、現在実行中の命
令を記憶する命令レジスタ(32ビット×2)3の各ユ
ニットに対応する第1,第2の命令スロットを解析し実
行する。これらの転送ユニット5,整数演算ユニット6
および浮動小数点ユニット10と、転送ユニット7,整
数演算ユニット8および分岐ユニット11とは、共に実
行される命令によって選択される。この2スロットのモ
デルでは、レジスタ3における第1の命令スロットに1
つの転送手段,1つの整数演算手段,1つの浮動小数点
手段を割り付け、第2の命令スロットに1つの転送手
段,1つの整数演算手段,1つの分岐手段を割り付けて
いる。このモデルに用いる資源は、転送手段が2個、整
数演算手段が2個、浮動小数点手段が1個、分岐手段が
1個の計6個であり、資源の数を4スロットの場合とほ
ぼ一緒にしているが、これはソフトウェアモデルの等価
性を向上させるためである。
【0031】要するに、2スロットの場合は、4スロッ
トの場合と同じプログラムを実行できるように演算器を
配置しており、各スロットにそれぞれ3つの演算ユニッ
トを接続している。
【0032】図7は図6に示す命令レジスタにおける命
令ブロックの構成図である。図7に示すように、この命
令ブロックは前述した第一の実施例の場合の半分、すな
わち64ビット幅で構成し、スロットは2分割の32ビ
ットとなっている。実線で示す左側の2スロット26,
27が実際の実行手段の存在する部分である。点線で示
す右側の2スロット28,29はこのモデルで4スロッ
トを意図して作成された命令コードを実行したときの場
合について説明するための部分である。
【0033】更に、本実施例における各スロットの命令
フォーマットは、4スロットの場合と同様に、前述した
図3のように割り当てる。また、命令コードも前述した
図4(a),(b)および図5(a),(b)のよう
に、やはり4スロットのときと同様に割り当てる。すな
わち、第1スロットは、図3に示す命令の中での転送命
令,整数演算命令,浮動小数点演算命令を実行でき、第
2スロットは、転送命令,整数演算命令,分岐命令を実
行することができる。
【0034】以上、二つの実施例について説明したが、
これら2つの実施例はスロット単位で全く等価な命令フ
ォーマッとを有し、各実行手段は全く等価なユニットと
して設計することができる。このブロック化されたユニ
ットを用いて演算装置を作成すると、自由な演算手段組
み合せを持ったスロットを必要数並べて多種のVLIW
型演算装置を構成することができる。更に、上述した二
つの実施例のように、同等な数の資源を有する場合は、
うろっとで開発されたソフトウェアが1/Nの幅のVL
IWでそのまま実行可能になる。これは、4スロットの
場合に第3もしくは第4のスロットで使用しているメモ
リの値や内部レジスタの値を第1もしくは第2のスロッ
トで変更しないという制限を設けてソフトウェアを開発
すれば、2つの演算装置は全く同じソフトウェアを実行
することができる。これをより詳細に説明する。
【0035】すなわち、図7の第1スロットと第2スロ
ットは、それぞれ図2の第1スロットと第2スロットに
対応し、図2の第3スロットと第4スロットは、その次
のサイクルに実行される第1スロットと第2スロットに
当たることになる。つまり、この場合には、4スロット
モデルで考えられたプログラムコードの第1スロットと
第2スロットに対応する部分は、転送演算かまたは整数
演算命令が置かれ、それを2スロットモデルで実行する
時には、図7の第1スロットと第2スロットで斜線部分
が使われる。さらに、前述したプログラムコードの第3
スロットに対応する部分は、浮動小数点命令または整数
演算命令が置かれる。それは2スロットモデルでは、次
の実行周期で実行される第1のスロットに対応し、図7
の点線部の第1スロットの斜線部分に対応する。他の残
りも同様である。特に、1/2nの幅のモデルは、各ス
ロットにそれぞれ対応するスロットに入る可能性のある
命令を実行できる手段を入れてやれば、そのままで幅の
広い演算装置用のプログラムコードを実行することがで
きる。
【0036】これら両モデルの場合、コンパイラで抽出
しなければならない並列性は、4スロットの場合に4、
2スロットの場合で2となる。2スロットの場合は、並
列性の低いアプリケーションで空きスロットを減らせる
ため、メモリを有効利用でき、従来の直列命令型演算装
置の場合に比べて2倍近い処理速度が得られる。一方、
4スロットのモデルでは、並列性のより高いアプリケー
ションを2スロットの場合のさらに2倍近く高速に処理
することができる。
【0037】
【発明の効果】以上説明したように、本発明の演算処理
装置は、VLIW型の命令割付方式を採用することによ
り、スロット数の違う装置間でソフトウェアが互換性を
持つようになると同時に、設計時のモジュール分割化に
より多種のスロット幅や多種の演算を持ったソフトウェ
アの互換性の高い装置を高性能なものから、低価格のも
のまで、これらの組み合せでつくることができるという
効果がある。
【図面の簡単な説明】
【図1】本発明の第一の実施例を示す演算処理装置のブ
ロック構成図である。
【図2】図1に示す命令レジスタにおける命令ブロック
の構成図である。
【図3】図2に示す各スロットの命令フォーマット図で
ある。
【図4】図3における各スロットの命令ビットフィール
ドの整数演算命令用オペコードおよび浮動小数点演算命
令用オペコードを表わす図である。
【図5】図3における各スロットの命令ビットフィール
ドの転送命令用オペコードおよび分岐命令用オペコード
を表わす図である。
【図6】本発明の第二の実施例を示す演算処理装置のブ
ロック構成図である。
【図7】図6に示す命令レジスタにおける命令ブロック
の構成図である。
【図8】従来の一例を示す演算処理装置のブロック構成
図である。
【図9】図8に示す演算装置における命令ブロックの構
成図である。
【図10】図9に示す各スロットの命令フォーマット図
である。
【図11】図10に示す転送命令スロットの転送命令コ
ードを表わす図および整数演算命令スロットの整数演算
コードを表わす図である。
【図12】図10に示す浮動小数点演算命令スロットの
浮動小数点命令コードを表わす図および分岐命令スロッ
トの命令コードを表わす図である。
【符号の説明】
1 レジスタファイル 2 外部メモリ 3 命令レジスタ 4 入力交換網 5,7 転送ユニット 6,8,9 整数演算ユニット 10 浮動小数点ユニット 11 分岐ユニット 12 出力交換網 13 レジスタファイルまたは外部メモリ 14,15 転送・整数演算命令ユニット 16 浮動小数点演算・整数演算命令ユニット 17 分岐命令ユニット 18,19 オペコード 20 ロードセーブ 21 分岐命令 22 整数演算命令用オペコード 23 浮動小数点演算命令用オペコード 24 転送命令用オペコード 25 分岐命令用オペコード 26,28 転送・整数演算・浮動小数点演算命令ユ
ニット 27,29 転送・整数演算・分岐命令ユニット

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 演算命令を解釈実行することのできる整
    数演算手段,転送命令を解釈実行することのできる転送
    手段およびプログラムの流れの制御を行うことのできる
    分岐命令実行手段を少なくとも含み、これらによりJ×
    Nビットの(J,Nは自然数)命令を同時に解釈実行す
    る際、前記J×Nビットの命令は、前記転送手段が解釈
    実行する命令セットと、前記整数演算手段が解釈実行す
    る命令セットと、前記分岐命令実行手段が解釈実行する
    命令セットとのすべてを単一の命令フォーマットをもっ
    て記述でき且つ等長なJ個のビット列からなるN個のス
    ロットで構成することを特徴とする演算処理装置。
  2. 【請求項2】 同時に実行される前記命令は、128ビ
    ットの幅を有し、前記スロットは4等分した32ビット
    であり且つ各スロットに転送/整数演算,転送/整数演
    算,整数演算/浮動小数点演算,浮動小数点演算/分岐
    命令を解釈実行できる実行ユニットを分配し、全てのス
    ロットに転送,整数演算,浮動小数点演算,分岐命令の
    命令ビットフィールドが割り付けられていることを特徴
    とする請求項1記載の演算処理装置。
  3. 【請求項3】 前記各スロットは、各々が独立に各スロ
    ットに対応する命令を解釈実行する前記手段を、単独も
    しくは複数組み合わせて持つことを特徴とする請求項1
    および請求項2記載の演算処理装置。
JP16481991A 1991-07-05 1991-07-05 演算処理装置 Expired - Lifetime JP3186095B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16481991A JP3186095B2 (ja) 1991-07-05 1991-07-05 演算処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16481991A JP3186095B2 (ja) 1991-07-05 1991-07-05 演算処理装置

Publications (2)

Publication Number Publication Date
JPH0511979A true JPH0511979A (ja) 1993-01-22
JP3186095B2 JP3186095B2 (ja) 2001-07-11

Family

ID=15800521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16481991A Expired - Lifetime JP3186095B2 (ja) 1991-07-05 1991-07-05 演算処理装置

Country Status (1)

Country Link
JP (1) JP3186095B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002323982A (ja) * 2001-04-25 2002-11-08 Fujitsu Ltd 命令処理方法
US7533243B2 (en) 1997-06-16 2009-05-12 Panasonic Corporation Processor for executing highly efficient VLIW

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7533243B2 (en) 1997-06-16 2009-05-12 Panasonic Corporation Processor for executing highly efficient VLIW
US8019971B2 (en) 1997-06-16 2011-09-13 Panasonic Corporation Processor for executing highly efficient VLIW
US8250340B2 (en) 1997-06-16 2012-08-21 Panasonic Corporation Processor for executing highly efficient VLIW
JP2002323982A (ja) * 2001-04-25 2002-11-08 Fujitsu Ltd 命令処理方法

Also Published As

Publication number Publication date
JP3186095B2 (ja) 2001-07-11

Similar Documents

Publication Publication Date Title
US10469397B2 (en) Processors and methods with configurable network-based dataflow operator circuits
KR101854520B1 (ko) 타이트하게 커플링된 이종 컴퓨팅을 위한 하드웨어 프로세서스들 및 방법들
CN109643233B (zh) 具有带读取和读取/前进操作数编码的流引擎的数据处理设备
KR101703743B1 (ko) 가속된 레인 간 벡터 감축 명령어들
WO2019194915A1 (en) Apparatuses, methods, and systems for unstructured data flow in a configurable spatial accelerator
US20070011441A1 (en) Method and system for data-driven runtime alignment operation
US7346881B2 (en) Method and apparatus for adding advanced instructions in an extensible processor architecture
CN110879724A (zh) 用于深度学习和其它算法的fp16-s7e8混合精度
KR20240011204A (ko) 행렬 연산 가속기의 명령어들을 위한 장치들, 방법들, 및 시스템들
JPS59501684A (ja) 目的命令ストリ−ムへ殆んど実時間で插入するためのソ−スおよび目的命令ストリ−ムの外部における加速式命令写像
KR101729829B1 (ko) 복수의 곱셈 연산들을 수행하는 방법 및 장치
JPH0926878A (ja) データ処理装置
CN112579159A (zh) 用于矩阵操作加速器的指令的装置、方法和系统
KR20230002229A (ko) 체인화된 타일 연산들을 구현하기 위한 시스템들 및 방법들
EP1546869B1 (en) Apparatus, method, and compiler enabling processing of load immediate isntructions in a very long instruction word processor
CN111767079A (zh) 用于矩阵操作加速器的转置指令的装置、方法和系统
CN110909882A (zh) 用于执行水平铺块操作的系统和方法
CN109144471A (zh) 用于二进制向量分解的二进制乘法器
CN109643235B (zh) 用于多源混合操作的装置、方法和系统
CN111752533A (zh) 用于矩阵运算的加速器系统和方法
KR100267092B1 (ko) 멀티미디어신호프로세서의단일명령다중데이터처리
CN101246435A (zh) 一种支持高级语言部分语句功能的处理器指令集
JPH0511979A (ja) 演算処理装置
CN114675888A (zh) 用于加载矩阵操作加速器瓦片的指令的装置、方法和系统
CN114327635A (zh) 用于处理器的非对称执行端口和分配宽度的可缩放端口绑定的方法、系统和装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20001212

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 11