JPH10134036A

JPH10134036A - マルチメディア信号プロセッサの単一命令多重データ処理

Info

Publication number: JPH10134036A
Application number: JP9222416A
Authority: JP
Inventors: Le Trong Nguyen; トロンギュエンリ
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 1996-08-19
Filing date: 1997-08-19
Publication date: 1998-05-22
Also published as: US5978838A; CN1180864A; CN1112635C; FR2752630B1; DE19735350B4; KR100267091B1; TW358313B; DE19735350A1; FR2752630A1; TW366455B; US6058465A; KR19980018070A

Abstract

(57)【要約】【課題】妥当な費用、高い計算能力、及び馴染みのプ
ログラミング環境を提供するＤＳＰを提供すること。【解決手段】本発明は、ベクトルプロセッサアーキテ
クチャはプログラム可能なサイズとタイプのデータエレ
メントを有する固定されたサイズのベクトルレジスタを
備える。データエレメントのタイプとサイズはベクトル
レジスタと関連したオペランドを操作する命令により定
義される。命令によって定義されるデータサイズはベク
トルレジスタの数と命令を完了するために実行される並
列演算の数を決める。本発明の１実施の形態は全てのサ
イズについての整数タイプと３２ビットデータエレメン
トに対する浮動小数点データ型の８ビット、９ビット、
１６ビット、及び３２ビットのデータエレメントサイズ
を支援する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はディジタル信号プロ
セッサ、特にビデオ信号及びオーディオ信号の符号化(e
ncoding)及び復号化(decoding)のようなマルチメディア
機能に有利に適用される命令毎に多重データエレメント
の並列処理を行なうプロセッサに関する。

【０００２】

【従来の技術】実時間ビデオ符号化及び復号化などのマ
ルチメディア応用のためのプログラム可能ディジタル信
号プロセッサ（ＤＳＰ：Digital Signal Processor、以
下ＤＳＰと称する）は、制限された時間内に処理される
べき多量のデータが発生するので高速な処理能力を必要
とする。例えば特開平６−３０９３４９号公報または特
開平６−２６６８６０号公報に示すように、ディジタル
信号プロセッサに対する幾つかのアーキテクチャ(archi
tecture)が知られている。大部分のマイクロプロセッサ
に採用されたこのような汎用アーキテクチャは、実時間
ビデオ符号化または復号化のための充分な計算能力を有
するＤＳＰを提供するためには高速演算周期を必要とす
る。このため、このようなＤＳＰは高コストとなる。

【０００３】超長命令ワード（ＶＬＩＷ：Very Long In
struction Word、以下ＶＬＩＷと称する）プロセッサは
多くの機能ユニットを有するＤＳＰであって、これらの
大部分は相違し、比較的単純なタスク(task)を行う。Ｖ
ＬＩＷＤＳＰに対する単一命令は１２８バイト或いはそ
れ以上であり、分離された機能ユニットを並列に実行す
る分離された部分をもっている。ＶＬＩＷＤＳＰは多く
の機能ユニットが並列演算を行えるために高い計算能力
を備えている。また、ＶＬＩＷＤＳＰは各機能ユニット
が比較的小さくて単純なので比較的安価である。

【０００４】

【発明が解決しようとする課題】ＶＬＩＷＤＳＰの問
題は、ＶＬＩＷＤＳＰの機能ユニットに対する並列実行
に適しない入出力制御、ホストコンピュータとの通信、
及び他の機能を処理することに対する非効率性である。
また、ＶＬＩＷソフトウェアは、通常のソフトウェアと
相違し、ＶＬＩＷソフトウェアアーキテクチャに慣れて
いるプログラマとプログラムツールが足りないために、
開発し難い。

【０００５】妥当な費用、高い計算能力、及び馴染みの
プログラミング環境を提供するＤＳＰがマルチメディア
応用に要求されている。

【０００６】

【課題を解決するための手段】本発明の一特徴によれ
ば、マルチメディアディジタル信号プロセッサは、高い
計算能力を提供するためにベクトルデータ（即ち、オペ
ランド当たり多重データエレメント）を操作するベクト
ルプロセッサを含む。プロセッサはＲＩＳＣ型命令セッ
トを有する単一命令−多重データ(single-instruction-
multiple-data)アーキテクチャを使用する。プログラマ
にとっては、プログラム環境が馴染みの汎用プロセッサ
のプログラム環境と類似しているので、プログラムはベ
クトルプロセッサのプログラム環境に容易に適応でき
る。

【０００７】ＤＳＰは１セットの汎用ベクトルレジスタ
を含む。各ベクトルレジスタは固定サイズをもっている
が、使用者の選択可能なサイズの分離されたデータエレ
メントに分割される。従って、ベクトルレジスタに記憶
されたデータエレメントの数は、エレメントに対する選
択されたサイズによって決定される。例えば、３２バイ
トレジスタは３２個の８ビットデータエレメント、１６
個の１６ビットデータエレメント、或いは８個の３２ビ
ットデータエレメントに分けられる。データサイズと形
式の選択はベクトルレジスタと演算されたデータを処理
する命令によって行われ、命令に対する実行データパス
は命令によって指示されたデータサイズによって多数の
並列演算を実行する。

【０００８】ベクトルプロセッサに対する命令はオペラ
ンドとしてベクトルレジスタ或いはスカラレジスタをも
つことができ、計算能力が高くなるように並列にベクト
ルレジスタの多重データエレメントを操作することがで
きる。本発明によるベクトルプロセッサに対する命令セ
ットの例はコプロセッサインタフェース演算、フロー制
御演算、ロード／記憶演算、及び論理／算術演算を含
む。論理／算術演算は、データエレメントの結果的なデ
ータベクトルを発生するために、１つのベクトルレジス
タからのデータエレメントを、１つ或いはそれ以上の他
のベクトルレジスタからの対応するデータエレメントと
結合させる演算を含む。他の論理／算術演算は１つ或い
はそれ以上のベクトルレジスタからの各種のデータエレ
メントを混合するか、或いはベクトルレジスタからのデ
ータエレメントをスカラ量と結合させる。

【０００９】ベクトルプロセッアーキテクチャの拡張は
それぞれスカラデータエレメントを含むスカラレジスタ
を加算する。スカラとベクトルレジスタの結合(combina
tion）は、ベクトルの各データエレメントをスカラ値と
並列に結合する命令を含むベクトルプロセッサの命令セ
ットの拡張を容易にする。例えば、１つの命令がベクト
ルのデータエレメントにスカラ値を乗算する。また、ス
カラレジスタは単一データエレメントの記憶場所を提供
してベクトルレジスタから抽出されるか、或いはベクト
ルレジスタに記憶されるようにする。また、スカラレジ
スタはベクトルプロセッサとスカラレジスタのみを備え
るアーキテクチャをもつコプロセッサとの間に情報をパ
スするか、或いはロード／記憶演算に対する有効アドレ
スの計算に便利である。

【００１０】本発明の他の特徴によれば、ベクトルプロ
セッサのベクトルレジスタはバンク(bank)から組み合わ
せられる。各バンクは“現在(current）”バンクとして
選択でき、一方他のバンクは“交替(alternative）”バ
ンクである。ベクトルプロセッサの制御レジスタで“現
在バンク”ビットは現在バンクを指示する。ビットの数
の減縮にはベクトルレジスタを識別することが必要であ
り、現在バンクにベクトルレジスタを識別するために若
干の命令はレジスタ番号のみを提供する。ロード／記憶
命令はあるバンクからベクトルレジスタを識別するため
に付加ビットをもつ。従って、ロード／記憶命令は現在
バンクでデータを操作する間、交替バンクでデータを取
り出すことができる。これはイメージ処理及びグラフィ
ック手続に対するソフトウェアパイプライニングを容易
にし、論理／算術演算が規則を外れて交替レジスタバン
クをアクセスするロード／記憶演算によって実行される
ことができるために、データ取出し時にプロセッサ遅延
を減らす。他の命令により交替バンクは現在バンクから
のベクトルレジスタと交替バンクからの対応するベクト
ルレジスタを含むダブルサイズベクトルレジスタの使用
を可能にする。このようなダブルサイズレジスタは命令
構文(syntax)から識別されることができる。ベクトルプ
ロセッサで制御ビットはデフォールトベクトルサイズが
１つ或いは２つのベクトルレジスタのいずれか１つにな
るように設定できる。また、交替バンクは２つのソース
と２つの目的地レジスタを有するシャフル(shuffle）、
アンシャフル(unshuffle）、飽和(saturate)、及び条件
移動のような複合命令の構文でより小さくて且つ明確な
識別されたオペランドを使用可能にする。

【００１１】さらに、ベクトルレジスタは平均カッド(q
uad)、シャフル、アンシャフル、ペア式最大と交換、及
び飽和などの新規命令を具現する。これらの命令はビデ
オ符号化及び復号化のようなマルチメディア機能に共通
の演算を行い、他の命令セットが同一の機能を具現する
ために必要とする２或いはそれ以上の命令に代える。従
って、ベクトルプロセッサ命令セットはマルチメディア
応用時にプログラムの効率と速度を向上させる。

【００１２】

【発明の実施の形態】以下、添付図面を参照して本発明
の好ましい実施の形態をさらに詳しく説明する。

【００１３】図中の同一部分には同一符号を付する。

【００１４】図２は本発明の実施の形態によるマルチメ
ディア信号プロセッサ１００（ＭＳＰ：Multimedia Sig
nal Processor)の実施の形態のブロック図を示す。マル
チメディアプロセッサ１００は汎用プロセッサ１１０と
ベクトルプロセッサ１２０を含むプロセッシングコア１
０５を含む。プロセッシングコア１０５はＳＲＡＭ１６
０，１９０、ＲＯＭ１７０、及びキャッシュコントロー
ル１８０を含むキャッシュサブシステム１３０を通して
マルチメディアプロセッサ１００の残りに接続されてい
る。キャッシュコントロール１８０はプロセッサ１１０
に対する命令キャッシュ１６２とデータキャッシュ１６
４でＳＲＡＭ１６０を構成することができ、ベクトルプ
ロセッサ１２０に対する命令キャッシュ１９２とデータ
キャッシュ１９４でＳＲＡＭ１９０を構成することがで
きる。

【００１５】ワンチップＲＯＭ１７０はプロセッサ１１
０，１２０に対するデータと命令を含み、且つキャッシ
ュから構成することができる。好ましい実施の形態にお
いて、ＲＯＭ１７０はリセット及び初期化手続、自己テ
スト診断手続、インタラプト及び例外処理器、及びサウ
ンドブラスタエミュレーション用サブルーチン、Ｖ．３
４モデム信号処理用サブルーチン、一般電話機能、１−
Ｄ及び３−Ｄグラフィックサブライブラリ、及びＭＰＥ
Ｇ−１、ＭＰＥＧ−２、Ｈ．２６１、Ｈ．２６３、Ｇ．
７２８、Ｇ．７２３のようなオーディオ及びビデオ標準
用サブルーチンライブラリを含む。

【００１６】キャッシュサブシステム１３０は、プロセ
ッサ１１０，１２０を２つのシステムバス１４０，１５
０に接続させ、プロセッサ１１０，１２０とバス１４
０、１５０に結合された装置に対するキャッシュとスイ
ッチングステーションとして作用する。システムバス１
５０はバス１４０よりさらに高いクロック周波数で動作
し、それぞれ外部ローカルメモリ、ホストコンピュータ
のローカルバス、ダイレクトメモリアクセス（ＤＭＡ：
Direct Memory Access）、及び各種アナログ／ディジタ
ル（Ａ／Ｄ）及びディジタル／アナログ（Ｄ／Ａ）変換
器に対するインタフェースを提供するデバイスインタフ
ェース１５２、ＤＭＡコントローラ１５４、ローカルバ
スインタフェース１５６、及びメモリコントローラ１５
８に接続されている。バス１４０にはシステムタイマ１
４２、ＵＡＲＴ(Universal Asynchronous Receiver Tra
nsceiver）１４４、ビットストリームプロセッサ１４
６、及びインタラプトコントローラ１４８が接続されて
いる。“マルチメディア信号プロセッサのマルチプロセ
ッサ動作及びビデオデータを処理するための方法及び装
置”の名称を有する本願出願と合体する特許出願は、プ
ロセッサ１１０，１２０がキャッシュシステム１３０と
バス１４０，１５０を通してアクセスする、好ましいデ
バイスとキャッシュサブシステム１３０の作用をさらに
詳しく説明している。

【００１７】プロセッサ１１０，１２０は分離されたプ
ログラムスレッド(thread)を実行し、それらに割り当て
られた特定タスクをより効率的に実行するために構造的
に相違する。プロセッサ１１０は実時間作動システムの
実行のような制御機能と多数の反復的な計算を要求しな
い類似機能を優先している。従って、プロセッサ１００
は高い計算能力を必要とせず、通常の汎用プロセッサア
ーキテクチャを用いて具現することができる。ベクトル
プロセッサ１２０は大部分のマルチメディア処理におい
て共通のデータブロックに対する反復的な演算を含むナ
ンバクランチング(number crunching)を施す。高い計算
能力と比較的単純なプログラミングのために、ベクトル
プロセッサ１２０はＳＩＭＤ(Single Instruction Mult
iple Data)アーキテクチャを有し、例示された実施の形
態でベクトルプロセッサ１２０における大部分のデータ
パスはベクトルデータ操作を支援するために２８８或い
は５７６ビットのうち１つの広さを有する。また、ベク
トルプロセッサ１２０に対する命令セットは特にマルチ
メディア問題に適した命令を含む。

【００１８】上述の実施の形態において、プロセッサ１
１０は４０ＭＨｚで動作して、ＡＲＭ７標準によって定
義されたレジスタセットを含むＡＲＭ７プロセッサのア
ーキテクチャと一致する３２ビットＲＩＳＣプロセッサ
である。ＡＲＭ７ＲＩＳＣプロセッサに対するアーキテ
クチャと命令セットはAdvance RISC Machines Ltd.から
入手可能な“ＡＲＭ７ＤＭＤａｔａＳｈｅｅｔ”、文書
番号：ＡＲＭＤＤＩ００１０Ｇに記載されている。ＡＲ
Ｍ７ＤＭＤａｔａＳｈｅｅｔはこの出願に参考として含
まれる。後述する別添Ａには好ましい実施の形態でＡＲ
Ｍ７命令セットの拡張を説明している。

【００１９】ベクトルプロセッサ１２０はベクトルとス
カラ量を全て演算する。好ましい実施の形態において、
ベクトルプロセッサ１２０は８０ＭＨｚで動作するパイ
プライン構造のＲＩＳＣエンジンから構成されている。
ベクトルプロセッサ１２０のレジスタは３２ビットスカ
ラレジスタ、３２ビット特殊目的レジスタ、２バンクの
２８８ビットベクトルレジスタ、及び２ダブルサイズ
（例えば、５７６ビット）ベクトルアキュムレータレジ
スタを含む。後述する別添Ｃにはベクトルプロセッサ１
２０の好ましい実施の形態に対するレジスタセットを説
明する。好ましい実施の形態において、プロセッサ１２
０は０〜３１の５ビットレジスタ番号によって命令が識
別される３２個のスカラレジスタを含む。また、２バン
クの３２ベクトルレジスタ構造からなっている６４個の
２８８ビットベクトルレジスタを備えている。各ベクト
ルレジスタは１ビットのバンク番号（０または１）と０
〜３１の５ビットベクトルレジスタ番号によって識別さ
れる。大部分の命令はただベクトルプロセッサ１２０の
制御レジスタＶＣＳＲに記憶されたデフォールトバンク
ビットＣＢＡＮＫとして指示された現在バンクからベク
トルレジスタをアクセスする。第２制御ビットＶＥＣ６
４はデフォールトによるレジスタ番号が各バンクからレ
ジスタを含むダブルサイズベクトルレジスタを識別する
かを指示する。命令の構文はベクトルレジスタを識別す
るレジスタ番号をスカラレジスタを識別するレジスタ番
号と区別する。

【００２０】各ベクトルレジスタはプログラム可能なサ
イズのデータエレメントに分割されることができる。表
１は２８８ビットベクトルレジスタ内でデータエレメン
トに対して支援されるデータ形式を示す。

【００２１】

【表１】

【００２２】後述する別添Ｄにおいて本発明の好ましい
実施の形態から支援されるデータサイズとデータ形式に
対する追加説明を提供する。

【００２３】ｉｎｔ９データ形式の場合、９ビットバイ
トが２８８ビットベクトルレジスタに必然的に包装され
るが、他のデータ形式の場合には２８８ビットベクトル
レジスタに全ての９ビットは使用されない。２８８ビッ
トベクトルレジスタは３２個の８ビット又は９ビット整
数データエレメント、１６個の１６ビット整数データエ
レメント、或いは８個の３２ビット整数または浮動小数
点エレメントを保有することができる。また、２ベクト
ルレジスタはダブルサイズベクトルでデータエレメント
を包装するように結合できる。本発明の好ましい実施の
形態で制御及び状態レジスタＶＣＳＲに制御ビットＶＥ
Ｃ６４を設定することは、ダブルサイズ（５７６ビッ
ト）がベクトルレジスタのデフォールトサイズの場合、
ベクトルプロセッサ１２０をモードＶＥＣ６４に設定す
る。

【００２４】また、マルチメディアプロセッサ１００は
両プロセッサ１１０，１２０がアクセスし得る１セット
の３２ビット拡張レジスタ１１５を含む。後述する別添
Ｂにおいて本発明の好ましい実施の形態で１セットのレ
ジスタとそれらの機能を説明する。拡張レジスタとベク
トルプロセッサ１２０のスカラ及び特殊目的のレジスタ
は、幾つかの環境でプロセッサ１１０がアクセスし得
る。２つの特殊“使用者”拡張レジスタはプロセッサ１
１０，１２０が同時にレジスタを読み取れるように２つ
の読取りポートをもっている。他の拡張レジスタは同時
にアクセスされることができない。

【００２５】ベクトルプロセッサ１２０はベクトルプロ
セッサがランニング或いはアイドル状態にあるかを示す
２つの選択的な状態（ＶＰ＿ＲＵＮ，ＶＰ＿ＩＤＬＥ）
を有する。プロセッサ１１０はベクトルプロセッサ１２
０が状態ＶＰ＿ＩＤＬＥにある時、ベクトルプロセッサ
１２０のスカラ或いは特殊目的のレジスタを読み取るか
書き込むことができるが、ベクトルプロセッサ１２０が
状態ＶＰ＿ＲＵＮにある間にプロセッサ１１０がベクト
ルプロセッサ１２０のレジスタを読み取ったり書き込ん
だりした結果は未定である。

【００２６】プロセッサ１１０に対するＡＲＭ７命令セ
ットの拡張は拡張レジスタとベクトルプロセッサ１２０
のスカラ及び特殊目的のレジスタをアクセスする命令を
含む。命令ＭＦＥＲ，ＭＦＥＰはそれぞれ、拡張レジス
タとベクトルプロセッサ１２０のスカラ或いは特殊目的
のレジスタからプロセッサ１１０の一般レジスタにデー
タを移動させる。命令ＭＴＥＲ，ＭＴＥＰはそれぞれ、
プロセッサ１１０の一般的なレジスタから拡張レジスタ
とベクトルプロセッサ１２０のスカラ或いは特殊目的の
レジスタにデータを移動させる。ＴＥＳＴＳＥＴ命令は
拡張レジスタを読み取り拡張レジスタのビット３０を１
に設定させる。命令ＴＥＳＴＳＥＴはプロセッサ１１０
が生産された結果を読み取るか、或いは使用したプロセ
ッサ１２０に対する信号を発生するようにビット３０を
設定することにより、使用者／生産者同期を容易にす
る。ＳＴＡＲＴＶＰ及びＩＮＴＶＰのようなプロセッサ
１１０に対する他の命令はベクトルプロセッサ１２０の
演算状態を制御する。

【００２７】プロセッサ１１０はベクトルプロセッサ１
２０の演算を制御するマスタプロセッサとしての役割を
果たす。プロセッサ１１０，１２０の間の不均衡分割制
御を使用することはプロセッサ１１０，１２０の同期化
問題を単純化させる。プロセッサ１１０はベクトルプロ
セッサ１２０が状態ＶＰ＿ＩＤＬＥにある間にベクトル
プロセッサ１２０に対するプログラムカウンタに命令ア
ドレスを記録することにより、ベクトルプロセッサ１２
０を初期化させる。その後、プロセッサ１１０はベクト
ルプロセッサ１２０を状態ＶＰ＿ＲＵＮに変更させるＳ
ＴＡＲＴＶＰ命令を実行する。状態ＶＰ＿ＲＵＮにおい
てベクトルプロセッサ１２０はキャッシュサブシステム
１３０を通して命令を取り出し、プロセッサ１１０と並
列にそれら命令を実行し、引き続き自分のプログラムを
実行する。起動後にベクトルプロセッサ１２０は例外に
会うか、適切な条件が満足されてＶＣＪＯＩＮまたはＶ
ＣＩＮＴ命令を実行するか、或いはプロセッサ１１０に
よってインタラプトがかかる時まで実行し続ける。ベク
トルプロセッサ１２０は拡張レジスタに結果を記録する
か、プロセッサ１１０，１２０の共有アドレス空間に結
果を記録するか、或いはベクトルプロセッサ１２０が状
態ＶＰ＿ＩＤＬＥに再進入する時プロセッサ１１０がア
クセスするスカラ或いは特殊目的のレジスタに結果を残
すことにより、プロセッサ１１０に対するプログラム実
行の結果をパスすることができる。

【００２８】ベクトルプロセッサ１２０は自分の例外を
処理することができない。例外を引き起こす命令の実行
時にベクトルプロセッサ１２０は状態ＶＰ＿ＩＤＬＥに
進入してプロセッサ１１０に対してダイレクトラインを
通してインタラプト要求(interrupt request）を発生す
る。ベクトルプロセッサ１２０はプロセッサ１１０が他
のＳＴＡＲＴＶＰ命令を実行する時まで状態ＶＰ＿ＩＤ
ＬＥに残っている。プロセッサ１１０は例外現象を判断
してベクトルプロセッサ１２０のレジスタＶＩＳＲＣを
読み取り、ベクトルプロセッサ１２０を更に初期化させ
ることによりできるだけ例外を処理し、その後所望に応
じて、実行を再び始めるようにベクトルプロセッサ１２
０を調整する。

【００２９】プロセッサ１１０によって実行されるＩＮ
ＴＶＰ命令は、ベクトルプロセッサ１２０がアイドル状
態ＶＰ＿ＩＤＬＥに進入するようにベクトルプロセッサ
１２０にインタラプトを掛ける。例えば、命令ＩＮＴＶ
Ｐはマルチタスクシステム(multitasking system）に用
いられ、ビデオ復号化のような１つのタスクからサウン
ドカードエミュレーションのような他のタスクにベクト
ルプロセッサを交換する。

【００３０】ベクトルプロセッサ命令ＶＣＩＮＴ，ＶＣ
ＪＯＩＮは命令によって指示された条件が満足される場
合、ベクトルプロセッサ１２０による実行を停止し、状
態ＶＰ＿ＩＤＬＥにベクトルプロセッサ１２０を設定
し、このような要求が遮断されない場合、プロセッサ１
１０に対するインタラプトを発する。ベクトルプロセッ
サ１２０のプログラムカウンタ（特殊目的のレジスタＶ
ＰＣ）はＶＣＩＮＴ或いはＶＣＪＯＩＮ命令の次の命令
アドレスを示す。プロセッサ１１０はＶＣＩＮＴ或いは
ＶＣＪＯＩＮ命令がインタラプト要求を引き起こしたか
否かを判断するために、ベクトルプロセッサ１２０のイ
ンタラプトソースレジスタＶＩＳＲＣをチェックするこ
とができる。ベクトルプロセサ１２０は大きいデータバ
スをもっており且つレジスタのセーブ及び復旧にさらに
効率的なので、ベクトルプロセッサ１２０によって実行
されたソフトウェアは環境スイッチングの間、レジスタ
をセーブし復旧する。“マルチプロセッサにおける効率
的な環境セービング及び復旧”との名称の本願出願と関
連した他の出願には環境スイッチングに対する好ましい
システムが記述されている。

【００３１】図１はベクトルプロセッサ１２０の好まし
い実施の形態の重要な機能ブロックを示す。ベクトルプ
ロセッサ１２０は命令取出しユニット（ＩＦＵ：Instru
ction Fetch Unit）２１０、デコーダ２２０、スケジュ
ーラ２３０、実行データパス２４０、及びロード／記憶
ユニット（ＬＳＵ：Load/Store Unit)２５０を含む。Ｉ
ＦＵ２１０は命令を取り出してブランチ(Branch)のよう
なフローコントロール命令を処理する。命令デコーダ２
２０はＩＦＵ２１０から達した順序によって各サイクル
ごとに１つの命令を復号化して、命令から復号化された
フィールド値をＦＩＦＯ方式でスケジューラ２３０に記
録する。スケジューラ２３０は演算実行段階において必
要とする実行制御レジスタに発行されるフィールド値を
選択する。発行選択は実行データパス２４０或いはロー
ド／記憶ユニット２５０のような処理資源の有効性とオ
ペランド(operand）依存性による。実行データパス２４
０はベクトルまたはスカラデータを操作する論理／算術
命令を実行する。ロード／記憶ユニット２５０はベクト
ルプロセッサ１２０のアドレス空間をアクセスするロー
ド／記憶命令を実行する。

【００３２】図３はメイン命令バッファ３１０と第２命
令バッファ３１２に分割された命令バッファを含むＩＦ
Ｕ２１０の実施の形態に対するブロック図を示す。メイ
ンバッファ３１０は現在プログラムカウントに対応する
命令を含む８つの連続命令を含む。第２命令バッファ３
１２はバッファ３１０命令の後続の８命令を含む。ＩＦ
Ｕ２１０はまたバッファ３１０或いは３１２の次のフロ
ーコントロール命令のターゲットを含んだ８連続命令を
含むブランチターゲットバッファ３１４を備える。好ま
しい実施の形態でベクトルプロセッサ１２０は各命令が
３２ビットで長い場合、ＲＩＳＣ形命令セットを使用
し、バッファ３１０，３１２，３１４は８×３２ビット
バッファであり、２５６ビット命令バスを通じてキャッ
シュサブシステム１３０に接続される。ＩＦＵ２１０は
単一クロックサイクル内にキャッシュサブシステム１３
０からバッファ３１０，３１２，３１４中のいずれか１
つに８命令をロードすることができる。レジスタ３４
０，３４２，３４４はそれぞれのバッファ３１０，３１
２，３１４にロードされた命令に対するベースアドレス
を指示する。

【００３３】マルチプレクサＭＵＸ３３２はメイン命令
バッファ３１０から現在命令を選択する。もし、現命令
がフローコントロール命令でなく且つ命令レジスタ３３
０に記憶された命令が復号化段階の実行より前にある場
合、現命令は命令レジスタ３３０に記憶され、プログラ
ムカウントは増分される。プログラムカウントの増分が
バッファ３１０にある最終の命令を選択した後、次のセ
ットの８命令はバッファ３１０にロードされる。もしバ
ッファ３１２が所望の８命令を含む場合、バッファ３１
２とレジスタ３４２の内容は直ちにバッファ３１０とレ
ジスタ３４０に移動され、８以上の命令はキャッシュサ
ブシステム１３０から第２命令バッファ３１２に予め取
り出される。加算器３５０はマルチプレクサＭＵＸ３５
２によって選択されたオフセットレジスタ３４２のベー
スアドレスから次のセットの命令のアドレスを決定す
る。加算器３５０からの結果アドレスはレジスタ３４２
からのアドレスがレジスタ３４０に移動した場合に或い
はその後にレジスタ３４２に記憶される。さらに、計算
されたアドレスは８命令に対する要求を有するキャッシ
ュサブシステム１３０に送られる。キャッシュサブシス
テム１３０に対する予備呼出がバッファ３１０に要求さ
れる時、バッファ３１２に対する次の８命令がまだ備え
られていない場合、予め要求された命令はキャッシュサ
ブシステム１３０から受信され次第にバッファ３１０に
記憶される。

【００３４】現在命令がフローコントロール命令の場
合、ＩＦＵ２１０はフローコントロール命令に対する条
件を評価し、フローコントロール命令を従うプログラム
カウントをアップデートさせることにより命令を処理す
る。ＩＦＵ２１０は条件変更可能な従前の命令が完了し
ていないために、条件が決定されていない場合に保留に
なる。ブランチがなされない場合、プログラムは増分さ
れ、次の命令が前記のように選択される。もしブランチ
が成されてブランチターゲットバッファ３１４がブラン
チのターゲットを含む場合、バッファ３１４とレジスタ
３４４の内容がバッファ３１０及びレジスタ３４０に移
動され、ＩＦＵ２１０はキャッシュサブシステム１３０
からの命令を待たずにデコーダ２２０に引き続き命令を
提供する。

【００３５】ブランチターゲットバッファ３１４に対す
る命令を予め取り出すために、スキャナ３２０は現在プ
ログラムカウント後の次のフロー制御命令を探すため、
バッファ３１０，３１２をスキャニングする。もしフロ
ー制御命令がバッファ３１０または３１２から発見され
る場合、スキャナ３２０は命令を含むバッファ（３１０
又は３１２）のベースアドレスからフロー制御命令のタ
ーゲットアドレスを含む整列したセットの８命令に対す
るオフセットを決定する。マルチプレクサ３５２，３５
４はレジスタ３４０或いは３４２からバッファ３１４に
対する新しいベースアドレスを発生する加算器３５０に
ベースアドレスとフローコントロール命令からオフセッ
トを提供する。新しいベースアドレスはキャッシュサブ
システム１３０に印加されてブランチターゲットバッフ
ァ３１４に８命令を引き続き提供する。

【００３６】“減少及び条件部ブランチ”命令（ＶＤ１
ＣＢＲ，ＶＤ２ＣＢＲ，ＶＤ３ＣＢＲ）及び“変更制御
レジスタ”命令ＶＣＨＧＣＲのようなフローコントロー
ル命令を処理する場合、ＩＦＵ２１０はプログラムカウ
ントに付加してレジスタ値を変更することができる。Ｉ
ＦＵ２１０がフローコントロール命令でない命令を発見
した時、その命令は命令レジスタ３３０に送られてから
デコーダ２２０に送り出される。

【００３７】デコーダ２２０は図４に示すように、スケ
ジューラ２３０でＦＩＦＯバッファ４１０のフィールド
に制御値を記録することにより、命令を復号化する。Ｆ
ＩＦＯバッファ４１０は４行列のフリップフロップを含
み、各フリップフロップは１つの命令の実行を制御する
するための５フィールドの情報を含むことができる。行
列０〜行列３はそれぞれ一番古いものから一番新しい命
令に対する情報を保有し、ＦＩＦＯバッファ４１０の情
報はさらに古い情報が命令として完全に除去されたと
き、さらに低い行列にシフトされる。スケジューラ２３
０は実行レジスタ４２１〜４２７を含むコントロールパ
イプ４２０にロードされる命令の必要なフィールドを選
択することにより、実行端に命令を発行する。大部分の
命令は不規則的な順序で発行と実行を予定することがで
きる。特に論理／算術演算とロード／記憶演算の順序は
ロード／記憶演算と論理／算術演算との間のオペランド
従属性がない限り任意である。ＦＩＦＯバッファ４１０
でフィールド値の比較はあるオペランド従属性が存在す
るかを指示する。

【００３８】図５はベクトルプロセッサ１２０のアドレ
ス空間をアクセスせず、レジスタ対レジスタ演算を行う
命令に対する６段実行パイプラインを示す。命令取出し
段階５１１でＩＦＵ２１０は前記のように命令を取り出
す。取出し端はＩＦＵ２１０がパイプライン遅延、未解
決ブランチ条件、或いは予め取り出された命令を提供す
るキャッシュサブシステム１３０における遅延によって
保留されない限り１クロックサイクルを必要とする。復
号化段階５１２でデコーダ２２０はＩＦＵ２１０から命
令を復号化してスケジューラ２３０に命令に対する情報
を記録する。尚、復号化段階５１２はＦＩＦＯ４１０で
いずれの行列も新しい演算を利用しない限り１クロック
サイクルを必要とする。演算はＦＩＦＯ４１０で第１サ
イクルの間コントロールパイプ４２０に発行されること
ができるが、さらに古い演算の発行によって遅延するこ
ともある。

【００３９】実行データパス２４０はレジスタ対レジス
タ演算を行い、ロード／記録演算に対するアドレスを提
供する。図８は実行データパス２４０の実施の形態のブ
ロック図であり、実行段階５１４，５１５，５１６と関
連して説明される。実行レジスタ４２１は読取り段階５
１４の間クロックサイクルで読み取られたレジスタファ
イル６１０に２レジスタを識別する信号を提供する。レ
ジスタファイル６１０は３２スカラレジスタと６４ベク
トルレジスタを含む。図９はレジスタファイルのブロッ
ク図である。レジスタファイル６１０は各クロックサイ
クルごとに２読取り及び２書込みを収容するように２つ
の読取りポートと２つの書込みポートをもっている。各
ポートは選択回路６１２，６１４，６１６或いは６１８
と、２８８ビットデータバス６１３，６１５，６１７或
いは６１９を含む。回路６１２，６１４，６１６，６１
８のような選択回路は当分野の周知された事項であり、
命令から典型的に抽出された５ビットレジスタ番号から
デコーダ２２０が導出するアドレス信号ＷＲＡＤＤＲ
１，ＷＲＡＤＤＲ２，ＲＤＡＤＤＲ１或いはＲＤＡＤＤ
Ｒ２と、命令又は制御状態レジスタＶＣＳＲからのバン
クビットと、レジスタがベクトルレジスタ或いはスカラ
レジスタであるかを指示する命令構文を使用する。デー
タ読取りはマルチプレクサ６５６を通してロード／記憶
ユニット２５０に対してなされるか、或いはマルチプレ
クサ６２２，６２４を通してマルチプライヤ６２０、算
術論理ユニット６３０、又はアキュムレータ６４０に対
してなされる。大部分の演算は２レジスタを読み取り、
読取り段階５１４は１サイクルで完了する。しかし、乗
算及び加算命令ＶＭＡＤ及びダブルサイズベクトルを調
整する命令のような幾つかの命令は２以上のレジスタか
らデータを必要とするので、読取り段階５１４は１クロ
ックサイクルよりさらに長くなる。

【００４０】実行段階５１５において、マルチプライヤ
６２０、算術論理ユニット６３０、及びアキュムレータ
６４０を通る間、処理データはレジスタファイル６１０
から予め読み取られる。実行段階５１５は必要なデータ
の読取りに多数のサイクルが要求される場合、読取り段
階５１４をオーバーラップすることができる。実行段階
５１５の期間はデータエレメントのタイプ（整数或いは
浮動小数点）及び処理されたデータの量（読み取りサイ
クルの数）によって変わる。実行レジスタ４２２，４２
３，４２５の信号は実行段階の間行われた第１演算のた
めに算術論理ユニット６３０、アキュムレータ６４０、
及びマルチプライヤ６２０に対する入力データを制御す
る。実行レジスタ４３２，４３３，４３５は実行段階５
１５の間行われた第２演算を制御する。

【００４１】図１０は乗算器（マルチプライヤ）６２０
とＡＬＵ(arithmetic and logic unit）６３０の実施の
形態に対するブロック図である。マルチプライヤ６２０
は８つの独立した３６×３６ビットマルチプライヤ６２
６を含む整数マルチプライヤである。それぞれのマルチ
プライヤ６２６は制御回路に相互接続された４つの９×
９ビットマルチプライヤを含む。８ビット及び９ビット
データエレメントサイズをもつ場合、スケジューラ２３
０からの制御信号は４つの９×９ビットマルチプライヤ
を互いに分離させて各マルチプライヤ６２６が４乗算を
行うようにすることで、マルチプライヤ６２０が１サイ
クルの間３２独立乗算を行うようにする。１６ビットデ
ータエレメントの場合、制御回路は一対の９×９ビット
マルチプライヤが共に動作するように接続させて、マル
チプライヤ６２０は１６並列乗算を行う。３２ビット整
数データエレメント形の場合、８つのマルチプライヤ６
２６はクロックサイクルごとに８並列乗算を行う。乗算
の結果は９ビットデータエレメントサイズに対いて５７
６ビットを提供し、そして他のデータサイズに対して５
１２ビットを提供する。

【００４２】ＡＬＵ６３０は２クロックサイクル内にマ
ルチプライヤ６２０から生成された５７６ビットまたは
５１２ビットの結果を処理することができる。ＡＬＵ６
３０は８つの独立した３６ビットＡＬＵ６３６を含む。
各ＡＬＵ６３６は浮動小数点加算と乗算のための３２×
３２ビット浮動小数点ユニットを含む。整数操作のため
に各ＡＬＵ６３６は独立した８ビット及び９ビット操作
を行うことができ、１６ビット及び３２ビット整数デー
タエレメントに対して２或いは４セットで互いに接続さ
れ得る４ユニットを含む。

【００４３】累算器（アキュムレータ）６４０は結果を
累算し、中間結果でさらに高い精密度のために２つの５
７６ビットレジスタを含む。

【００４４】記録段階５１６の間実行段階の結果はレジ
スタファイル６１０に記憶される。２つのレジスタは単
一クロックサイクルの間に記録されることができ、入力
マルチプレクサ６０２，６０５は記録される２データ値
を選択する。演算に対する記録段階５１６の期間は演算
結果として記録されるデータの量と、レジスタファイル
６１０に記録することによりロード命令を完了できるＬ
ＳＵ２５０からの完了によって異なる。実行レジスタ４
２６，４２７からの信号は論理ユニット６３０、アキュ
ムレータ６４０、及びマルチプライヤ６２０のデータが
記録されるレジスタを選択する。

【００４５】図６はロード命令の実行のための実行パイ
プライン５２０を示す。実行パイプライン５２０のため
の命令取出し段階５１１、復号化段階５１２、及び発行
段階５１３はレジスタ対レジスタ演算に対して説明され
たものと同一である。また、読取り段階５１４はキャッ
シュサブシステム１３０に対する呼出用アドレスを決定
するために実行データパス２４０がレジスタファイル６
１０からデータを使用することを除いては前述と同一で
ある。アドレス段階５２５においてマルチプレクサ６５
２，６５４，６５６は実行段階５２６，５２７のために
ロード／記憶ユニット２５０に提供されるアドレスを選
択する。ロード演算に対する情報は段階５２６，５２７
の間ＦＩＦＯ４１０に残留し、一方ロード／記憶ユニッ
ト２５０は演算を処理する。

【００４６】図１１はロード／記憶ユニット２５０に対
する実施の形態を示す。２５６段階の間５２５段階で決
定されたアドレスのデータのためにキャッシュサブシス
テム１３０に対するコール（ｃａｌｌ）を行う。好まし
い実施の形態はプロセッサ１１０，１２０を含む多重デ
バイスがキャッシュサブシステム１３０を通してローカ
ルアドレス空間をアクセスする場合、トランザクション
ベースキャッシュコール(transaction based cache cal
l)を使用する。要求されたデータはキャッシュサブシス
テム１３０に対するコール後に幾つかのサイクルの間に
使用し得ないが、ロード／記憶ユニット２５０は他のコ
ールが保留(pending）されている間キャッシュサブシス
テムに対するコールをすることができる。従って、ロー
ド／記憶ユニット２５０は停止されない。要求されたデ
ータを提供するためにキャッシュサブシステムに要求さ
れるクロックサイクルの数は、データキャッシュ１９４
にヒット或いはミスが存在するかによっている。

【００４７】ドライブ段階５２７において、キャッシュ
サブシステム１３０はロード／記憶ユニット２５０に対
するデータ信号を要求する。キャッシュサブシステム１
３０はロード／記憶ユニット２５０にサイクル当たり２
５６ビット（３２バイト）データを提供することができ
る。バイトアライナ７１０は２８８ビット値を提供する
ために対応する９ビット記憶位置に３２バイトをそれぞ
れ整列させる。２８８ビットフォーマットは時々９ビッ
トデータエレメントを使用するＭＰＥＧ符号化及び復号
化のようなマルチメディア応用に便利である。２８８ビ
ット値は読取りデータバッファ７２０に記録される。記
録段階５２８でスケジューラ２３０はＦＩＦＯバッファ
４１０から実行レジスタ（４２６または４２７）にフィ
ールド４を伝送して、データバッファ７２０からレジス
タファイル６１０に２８８ビット量を記録する。

【００４８】図７は記憶命令の実行のための実行パイプ
ライン５３０を示す。実行パイプライン５３０のための
取出し段階５１１、復号化段階５１２、及び発行段階５
１３は前述と同様である。読み取り段階５１４は記憶さ
れるべきデータとアドレス計算用データとを読み取るこ
とを除いては前述と同一である。記憶されるべきデータ
はロード／記憶ユニット２５０で記録データバッファ７
３０に記録される。マルチプレクサ７４０は９ビットバ
イトを提供するフォーマットのデータを８ビットバイト
を有する通常のフォーマットに変換する。バッファ７３
０からの変換されたデータとアドレス計算段階５２５か
らの関連アドレスはＳＲＡＭ段階５３６の間キャッシュ
サブシステム１３０に並列に送られる。

【００４９】ベクトルプロセッサ１２０の好ましい実施
の形態において、各命令は３２ビット長であって、図８
に示された９つのフォーマットのうち１つをもち、ＲＥ
ＡＲ，ＲＥＡＩ，ＲＲＲＭ５，ＲＲＲＲ，ＲＩ，ＣＴ，
ＲＲＲＭ９，ＲＲＲＭ＊，及びＲＲＲＭ９＊＊のレベル
が付けてある。なお、別添Ｅにおいてベクトルプロセッ
サ１２０に対する命令セットについて説明する。

【００５０】有効アドレスを決定する時にスカラレジス
タを使用する幾つかのロード、記憶、及びキャッシュ演
算はＲＥＡＲフォーマットをもつ。ＲＥＡＲ−フォーマ
ット命令は０００ｂのビット２９〜３１によって識別さ
れ、スカラレジスタに対する２つのレジスタ番号ＳＲ
ｂ，ＳＲｉとビットＤによるスカラ或いはベクトルレジ
スタである可能性のあるレジスタのレジスタ番号Ｒｎに
よって識別される３オペランドをもつ。バンクビットＢ
はレジスタＲｎに対するバンクを識別するか、或いはデ
フォールトベクトルレジスタサイズがダブルサイズの場
合、ベクトルレジスタＲｎがダブルサイズベクトルレジ
スタであるかを指示する。ｏｐ−コードフィールドＯｐ
ｃはオペランドに実行される演算を識別し、フィールド
ＴＴはロード或いは記憶のような伝送タイプを指す。典
型的なＲＥＡＲ−フォーマット命令はスカラレジスタＳ
Ｒｂ，ＳＲｉの内容を加算することにより決定されるア
ドレスからレジスタＲｎをロードする命令ＶＬである。
もしビットＡが設定される場合、計算されたアドレスは
スカラレジスタＳＲｂに記憶される。

【００５１】ＲＥＡ１−フォーマット命令は、フィール
ドＩＭＭの８ビット中間値がスカラレジスタＳＲｉの内
容の代わりに使用されることを除いてはＲＥＡＲ命令と
同一である。ＲＥＡＲとＲＥＡＩフォーマットはデータ
エレメントサイズフィールドを持たない。

【００５２】ＲＲＲＭ５フォーマットは２ソースオペラ
ンドと１目的オペランドをもつ命令のためのものであ
る。これらの命令は３レジスタオペランド或いは２レジ
スタオペランドと５ビット中間値のうち１つを有する。
別添Ｅに示すように、フィールドＤ，Ｓ，Ｍの符号化は
第１ソースオペランドＲａがスカラまたはベクトルレジ
スタであるか否かを判断し、第２ソースオペランドＲｂ
／ＩＭ５がスカラレジスタ、ベクトルレジスタ、或いは
５ビット中間値であるか否かを判断し、目的レジスタＲ
ｄがスカラ或いはベクトルレジスタであるか否かを判断
する。

【００５３】ＲＲＲＲフォーマットは４レジスタオペラ
ンドをもつ命令のためのものである。レジスタ番号Ｒ
ａ，Ｒｂはソースレジスタを指摘する。レジスタ番号Ｒ
ｄは目的レジスタを示し、レジスタ番号Ｒｃはフィール
ドＯｐｃによるソースまたは目的レジスタのうち１つを
示す。レジスタＲｂがスカラレジスタであることを指示
するようにビットＳが設定されている場合を除いて全て
のオペランドはベクトルレジスタである。フィールドＤ
Ｓはベクトルレジスタに対するデータエレメントサイズ
を示す。フィールドＯｐｃは３２ビットデータエレメン
トに対するデータ型を選択する。

【００５４】ＲＩ−フォーマット命令は中間値をレジス
タにロードさせる。フィールドＩＭＭは１８ビットまで
の中間値を含む。レジスタ番号ＲｄはビットＤによるス
カラレジスタと現在バンクのベクトルレジスタのうち１
つである目的レジスタを示す。フィールドＤＳ，Ｆはそ
れぞれのデータエレメントサイズとタイプを指す。３２
ビット整数データエレメントの場合、１８ビット中間値
はレジスタＲｄにロードされる前に拡張されたサインで
ある。浮動小数点データエレメントの場合、ビット１
８、ビット１７〜１０、及びビット９〜０はそれぞれ３
２ビット浮動小数点値のサイン、指数、及び仮数(manti
ssa)を示す。

【００５５】ＣＴフォーマットはフローコントロール命
令に対するものであり、ｏｐ−コードフィールドＯｐ
ｃ、条件フィールドＣｏｎｄ、２３ビット中間値ＩＭＭ
を含む。条件フィールドによって示される条件が真実で
ある場合、ブランチが取られる。可能な条件コードは
“常時(always)”、“より少ない(less than）”、“同
一(equal）”、“以下或いは同一(less than or equa
l)”、“より大きい(greaterthan)”、“同一でない(no
t equal）”、“より大きいか或いは同一(greater than
or equal) ”、及び“オーバフロー(overflow)”であ
る。状態及び制御レジスタＶＣＳＲでビットＧＴ，Ｅ
Ｑ，ＬＴ，ＳＯは条件を評価するのに用いられる。

【００５６】フォーマットＲＲＲＭ９は３レジスタオペ
ランド或いは２レジスタオペランドと９ビット中間値の
うちいずれかを提供する。ビットＤ，Ｓ，Ｍの組合せは
どのオペランドがベクトルレジスタ、スカラレジスタ、
或いは９ビット中間値であるかを示す。フィールドＤＳ
はデータエレメントサイズを示す。ＲＲＲＭ９＊とＲＲ
ＲＭ９＊＊フォーマットはＲＲＲＭ９フォーマットの特
殊なケースであって、演算コードフィールドＯｐｃによ
って区別される。ＲＲＲＭ９＊＊フォーマットはソース
レジスタ番号Ｒａを条件コードＣｏｎｄとＩＤフィール
ドに置き換えた。ＲＲＲＭ９＊＊フォーマットは中間値
の最上位ビットＭＳＢを条件コードＣｏｎｄとビットＫ
に置き換えた。ＲＲＲＭ９＊とＲＲＲＭ９＊＊に対する
追加説明が条件部移動命令ＶＣＭＯＶ、エレメントマス
クを有する条件部移動ＣＭＯＶＭ、及び比較とマスク設
定ＣＭＰＶ命令と関連して後述する別添Ｅになされてい
る。

【００５７】以上、本発明による特定の好ましい実施の
形態に関連して図示し述べたが、特許請求の範囲によっ
て設けられる本発明の精神や分野を外れない限度内で本
発明を多様に改造及び変換し得ることは当分野で通常の
知識を有する者には明らかなことである。

【００５８】［別添Ａ］例示的な実施例において、プロ
セッサ１１０はＡＲＭ７プロセッサの規格に合う汎用プ
ロセッサである。ＡＲＭ７プロセッサ内のレジスタ内の
説明に関するＡＲＭアーキテクチャ文献或いはＡＲＭ７
データシート（１９９４年１２月に発行された文献番号
ＡＲＭＤＤＩ００２０Ｃ）を参照する。

【００５９】ベクトルプロセッサ１２０との相互作用の
ために、プロセッサ１１０はベクトルプロセッサを開始
及び停止させ、同期を含んだベクトルプロセッサ状態を
テストし、ベクトルプロセッサ１２０内のスカラ／特殊
レジスタからのデータをプロセッサ１１０内の汎用レジ
スタ側に伝送し、一般レジスタからのデータをベクトル
プロセッサスカラ／特殊レジスタ側に伝送する。このよ
うな伝送のためには仲介者としてメモリを必要とする。

【００６０】表２にはベクトルプロセッサの相互作用の
ためのＡＲＭ７命令セットの拡張について説明されてい
る。

【００６１】

【表２】

【００６２】

【表３】

【００６３】表３にはＡＲＭ７の例外がリストされてお
り、これら例外はフローティング命令を行う前に検出及
び報告される。例外ベクトルアドレスは１６進数表記で
与えられる。

【００６４】

【表４】

【００６５】次に、ＡＲＭ７命令セットに対する拡張の
構文について説明する。用語説明及び命令フォーマット
に関するＡＲＭアーキテクチャ文献或いはＡＲＭ７デー
タシート（１９９４年１２月に発行された文献番号ＡＲ
ＭＤＤＩ００２０Ｃを参照する。

【００６６】前記ＡＲＭアーキテクチャはコプロセッサ
インタフェースのための３種類の命令フォーマットを提
供する。

【００６７】１．コプロセッサデータ演算（ＣＤＰ）２．コプロセッサデータ伝送（ＬＤＣ，ＳＴＣ）３．コプロセッサレジスタ伝送（ＭＲＣ，ＭＣＲ）ＭＳＰアーキテクチャ拡張は３種類の形態を全て使用す
る。前記コプロセッサのデータ演算フォーマットＣＤＰ
はＡＲＭ７側に再び伝送する必要のない演算のために用
いられる。

【００６８】

【表５】

【００６９】

【表６】

【００７０】コプロセッサデータ伝送フォーマット（Ｌ
ＤＣ，ＳＴＣ）はベクトルプロセッサのレジスタのサブ
セットをメモリに直接ロード或いは記憶させるのに用い
られる。前記ＡＲＭ７プロセッサはワードアドレスを供
給する役目をし、前記ベクトルプロセッサはデータを供
給又は受信し、伝送されたワードの個数を制御する。よ
り詳細なことはＡＲＭ７データシートを参照する。

【００７１】

【表７】

【００７２】

【表８】

【００７３】コプロセッサレジスタ伝送フォーマット
（ＭＲＣ，ＭＣＲ）はＡＲＭ７とベクトルプロセッサと
の間で直接情報を通信するのに用いられる。このフォー
マットはＡＲＭ７レジスタとベクトルプロセッサスカラ
或いは特殊レジスタとの間の移動に用いられる。

【００７４】

【表９】

【００７５】

【表１０】

【００７６】拡張ＡＲＭ命令説明拡張ＡＲＭ命令についてはアルファベット順で説明す
る。

【００７７】ＣＡＣＨＥキャッシュ演算

【００７８】

【表１１】

【００７９】アセンブラ構文ＳＴＣ｛ｃｏｎｄ｝ｐ１５，ｃ０ｐｃ，（Ａｄｄｒｅ
ｓｓ）ＣＡＣＨＥ｛ｃｏｎｄ｝Ｏｐｃ，（Ａｄｄｒｅｓｓ）ここで、ｃｏｎｄ＝｛ｅｑ，ｈｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｖｓ，ｖｃ，ｈｉ，Ｉｓ，ｇｅ，Ｉｔ，ｇｔ，ｌ
ｅ，ａｉ，ｎｖ｝、Ｏｐｃ＝｛０，１，３｝。ＬＤＣ／
ＳＴＣフォーマットのＣＲｎフィールドはＯｐｃを特定
するのに用いられるので、演算コードの十進数表記は第
１構文で文字“ｃ”（即ち、０の代わりにｃ０を使用す
る）で開始すべきことに注目されたい。アドレスモード
構文に関するＡＲＭ７データシートを参照する。

【００８０】

【表１２】

【００８１】演算ＥＡを算出する方法に対するＡＲＭ７データシートを参
照する。

【００８２】例外ＡＲＭ７保護侵害ＩＮＴＶＰインタラプトベクトルプロセッサ

【００８３】

【表１３】

【００８４】アセンプラ構文ＣＤＰ｛ｃｏｎｄ｝ｐ７，１，ｃ０，ｃ０，ｃ０ＩＮＴＶＰ｛ｃｏｎｄ｝ここで、ｃｏｎｄ＝｛ｅｑ，ｎｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｖｓ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌｅ，ａ
ｌ，ｎｓ｝説明この命令はＣｏｎｄが真の時にのみ行われる。

【００８５】この命令はベクトルプロセッサを停止させ
るために信号伝送を行う。

【００８６】ＡＲＭ７はベクトルプロセッサの停止を待
たず、次の命令を引き続き行う。

【００８７】ＭＦＥＲ使用中(busy)待機ループはこの命
令が行われた後にベクトルプロセッサが停止されたかを
調べるために用いられるべきである。この命令はベクト
ルプロセッサが予めＶＰ＿ＩＤＬＥ状態であれば、何の
影響も及ぼさない。

【００８８】ビット１９：１２，７：１５及び３：０は
予約されている。

【００８９】例外ベクトルプロセッサ利用不可能。

【００９０】ＭＦＥＲ拡張レジスタからの移動

【００９１】

【表１４】

【００９２】アセンブラ構文ＭＲＣ｛ｃｏｎｄ｝ｐ７，１，Ｒｄ，ｃＰ，ｃＥＲ，０ＭＦＥＲ｛ｃｏｎｄ｝Ｒｄ，ＲＮＡＭＥここで、ｃｏｎｄ＝｛ｅｑ，ｈｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｒｓ，ｖｓ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌ
ｅ，ａｌ，ｎｖ｝，Ｒｄ＝｛ｒ０，・・・ｒ１５｝，Ｐ
＝｛０，１｝，ＥＲ＝｛０，・・１５｝、そしてＲＮＡ
ＭＥはアーキテクチャ的に特定されたレジスタニモニッ
ク｛即ち、ＰＥＲＯ或いはＣＳＲ｝を意味する。

【００９３】

【表１５】

【００９４】ビット１９：１７及び７：５は予約されて
いる。

【００９５】例外使用者モード中にＰＥＲｘをアクセスしようとする時の
保護侵害ＭＦＶＰベクトルプロセッサからの移動

【００９６】

【表１６】

【００９７】アセンブラ構文ＭＲＣ｛ｃｏｎｄ｝ｐ７，１，Ｒｄ，Ｃｒｎ，ＣＲｍ，
０ＭＦＶＰ｛ｃｏｎｄ｝Ｒｄ，ＲＮＡＭＥここで、ｃｏｎｄ＝｛ｅｑ，ｎｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｖｓ，ｖｃ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌ
ｅ，ａｌ，ｎｖ｝，Ｒｄ＝｛ｒ０，・・・ｒ１５｝，Ｃ
Ｒｎ＝｛ｃ０，・・・ｃ１５｝，ＣＲｍ＝｛ｃ０，・・
ｃ１５｝、そしてＲＮＡＭＥはアーキテクチャ的に特定
されたレジスタニモニック｛即ち、ＳＰＯ或いはＶＣ
Ｓ｝を意味する。

【００９８】

【表１７】

【００９９】ＳＲ０は常に０である３２ビットと判読
し、これに対する記録は無視される。

【０１００】例外ベクトルプロセッサ利用不可能ＭＴＥＲ拡張レジスタ側への移動

【０１０１】

【表１８】

【０１０２】アセンブラ構文ＭＲＣ｛ｃｏｎｄ｝ｐ７，１，Ｒｄ，ｃＰ，ｃＥＲ，０ＭＲＥＲ｛ｃｏｎｄ｝Ｒｄ，ＲＮＡＭＥここで、ｃｏｎｄ＝｛ｅｑ，ｈｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｒｓ，ｖｃ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌ
ｅ，ａｌ，ｎｖ｝，Ｒｄ＝｛ｒ０，・・・ｒ１５｝，Ｐ
＝｛０，１｝，ＥＲ＝｛０，・・１５｝，そしてＲＮＡ
ＭＥはアーキテクチャ的に特定されたレジスタニモニッ
ク｛即ち、ＰＥＲＯ或いはＣＳＲ｝を意味する。

【０１０３】

【表１９】

【０１０４】ビット１９：１７及び７：５は予約されて
いる。

【０１０５】例外使用者モード中にＰＥＲｘをアクセスしようとする時の
保護侵害ＭＴＶＰベクトルプロセッサ側への移動

【０１０６】

【表２０】

【０１０７】アセンブラ構文ＭＲＣ｛ｃｏｎｄ｝ｐ７，１，Ｒｄ，ｃＲｎ，ＣＲｍ，
０ＭＲＥＲ｛ｃｏｎｄ｝Ｒｄ，ＲＮＡＭＥここで、ｃｏｎｄ＝｛ｅｑ，ｎｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｖｓ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌｅ，ａ
ｌ，ｎｖ｝，Ｒｄ＝｛ｒ０，・・・ｒ１５｝，ＣＲｎ＝
｛ｃ０，・・ｃ１５｝、ＣＲｍ＝｛ｃ０，・・・ｃ１
５｝、そしてＲＮＡＭＥはアーキテクチャ的に特定され
たレジスタニモニック｛即ち、ＳＰＯ或いはＶＣＳ｝を
意味する。

【０１０８】

【表２１】

【０１０９】例外ベクトルプロセッサ利用不可能ＰＦＴＣＨプリフェッチ

【０１１０】

【表２２】

【０１１１】アセブラ構文ＭＲＣ｛ｃｏｎｄ｝ｐ１５，２，（Ａｄｄｒｅｓｓ）ＭＦＴＣＨ｛ｃｏｎｄ｝（Ａｄｄｒｅｓｓ）ここで、ｃｏｎｄ＝｛ｅｑ，ｈｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｒｓ，ｖｃ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌ
ｅ，ａｌ，ｎｖ｝、アドレスモード構文に関するＡＲＭ
７データシートを参照する。

【０１１２】説明この命令はＣｏｎｄが真の時にのみ行われる。ＥＡによ
って特定されたキャッシュラインはＡＲＭ７データキャ
ッシュ側にプリフェッチされる。

【０１１３】演算ＥＡが算出される方法に関してはＡＲＭ７データシート
を参照する。

【０１１４】例外無しＳＴＡＲＴＶＰ開始ベクトルプロセッサ

【０１１５】

【表２３】

【０１１６】アセブラ構文ＣＤＰ｛ｃｏｎｄ｝ｐ７，２，ｃ０，ｃ０，ｃ０ＳＴＡＲＴＶＰ｛ｃｏｎｄ｝ここで、ｃｏｎｄ＝｛ｅｑ，ｈｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｖｓ，ｖｃ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌ
ｅ，ａｌ，ｎｖ｝説明この命令はＣｏｎｄが真の時にのみ行われる。この命令
は遂行を開始するようにベクトルプロセッサ側に信号伝
送を行い、ＶＩＳＲＣ（ｖｊｐ）とＶＩＳＲＣ（ｖｉ
ｐ）を自動的にクリアさせる。ＡＲＭ７はベクトルプロ
セッサが遂行を開始することを待たず、次の命令を引き
続き行う。前記ベクトルプロセッサの状態はこの命令が
行われる前に所望の状態に初期化されるべきである。こ
の命令は前記ベクトルプロセッサが予めＶＰ＿ＲＵＮ状
態になっている場合には何の影響も及ぼさない。

【０１１７】ビット１９：１２，７：５，及び３：０は
予約されている。

【０１１８】例外ベクトルプロセッサ利用不可能ＴＥＳＴＳＥＴテスト及びセット

【０１１９】

【表２４】

【０１２０】アセンブラ構文ＭＲＣ｛ｃｏｎｄ｝ｐ７，０，Ｒｄ，ｃ０，ｃＥＲ，０ＴＥＳＴＳＥＴ｛ｃｏｎｄ｝Ｒｄ，ＲＮＡＭＥここで、ｃｏｎｄ＝｛ｅｑ，ｈｅ，ｃｓ，ｃｃ，ｍｉ，
ｐｌ，ｒｓ，ｒｅ，ｈｉ，ｌｓ，ｇｅ，ｌｔ，ｇｔ，ｌ
ｅ，ａｌ，ｎｖ｝，Ｒｄ＝｛ｒ０，・・ｒ１５｝，ＥＲ
＝｛０，・・１５｝，そしてＲＡＮＡＭＥはアーキテク
チャ的に特定されたレジスタニモニック（即ち，ＵＥＲ
１或いはＶＡＳＹＮＣ）を意味する。

【０１２１】説明この命令はＣｏｎｄが真の時にのみ行われる。この命令
はＵＥＲｘ乃至ＲＤの内容を復帰させ、ＵＥＲｘ（３
０）を１に設定する。ＡＲＭ７レジスタ（１５）が目的
レジスタとして特定されると、ＵＥＲｘ（３０）はＣＰ
ＳＲのＺビットから復帰し、これにより短い使用中(bus
y)待機ループが行われることができる。現在、ＵＥＲ１
のみがこの命令に従って動作するように定義されてい
る。

【０１２２】ビット１９：１２及び７：５は予約されて
いる。

【０１２３】例外無し［別添Ｂ］マルチメディアプロセッサのアーキテクチャ
１００はプロセッサ１１０がＭＦＥＲ命令或いはＭＴＥ
Ｒ命令でアクセスする拡張レジスタを定義する。この拡
張レジスタは特権拡張レジスタと使用者拡張レジスタを
含んでいる。

【０１２４】特権拡張レジスタはマルチメディア信号プ
ロセッサの演算を制御するのに主に用いられる。これら
は表１２に示されている。

【０１２５】

【表２５】

【０１２６】前記制御レジスタはＭＳＰ（１００）の演
算を制御する。ＣＴＲの全てのビットはリセット時にク
リアされる。前記レジスタ定義は表２Ｂに示されてい
る。

【０１２７】

【表２６】

【０１２８】

【表２７】

【０１２９】前記状態レジスタはＭＳＰ（１００）の状
態を指示する。フィールドＳＴＲの全てのビットはリセ
ット時にクリアされる。レジスタ定義は表１４に示され
ている。

【０１３０】

【表２８】

【０１３１】プロセッサバージョンレジスタはプロセッ
サのマルチメディア信号プロセッサファミリーの特定プ
ロセッサの特定バージョンを表示する。

【０１３２】ベクトルプロセッサインタラプトマスクレ
ジスタＶＩＭＳＫはプロセッサ１１０にベクトルプロセ
ッサ例外を報告する演算を制御する。ＶＩＭＳＫのそれ
ぞれのビットはＶＩＳＲＣレジスタの対応ビットと共に
セットされると、ＡＲＭ７に対してインタラプトを行う
例外をイネーブルさせる。これはベクトルプロセッサ例
外を検出する方法には何の影響も及ぼさず、但し前記例
外がＡＲＭ７に対してインタラプトを掛けるべきかにの
み影響を及ぼす。ＶＩＭＳＫの全てのビットはリセット
時にクリアされる。レジスタ定義は表１５に示されてい
る。

【０１３３】

【表２９】

【０１３４】ＡＲＭ７命令アドレス区切り点レジスタは
ＡＲＭ７プログラムデバック(debugging）時にこれを支
援する。レジスタ定義は表１６に示されている。

【０１３５】

【表３０】

【０１３６】ＡＲＭ７データアドレス区切り点レジスタ
はＡＲＭ７プログラムデバッグ(debugging）時にこれを
支援する。レジスタ定義は表１７に示されている。

【０１３７】

【表３１】

【０１３８】スクラッチパッドレジスタはキャッシュサ
ブシステム１３０のＳＲＡＭを使用して形成されたスク
ラッチのアドレスとサイズを構成する。レジスタ定義は
表１８に示されている。

【０１３９】

【表３２】

【０１４０】使用者拡張レジスタはプロセッサ１１０，
１２０の同期に主に用いられる。使用者拡張レジスタは
ビット３０にマッピングされた１ビットのみを持てるよ
うに現在定義されており、“ＭＦＥＲＲ１５，ＵＥＲ
ｘ”のような命令は例えばビット値をＺフラグ側に復帰
させる。ビットＵＥＲｘ（３１）及びＵＥＲｘ（２９：
０）は常にゼロと判読される。使用者拡張レジスタは表
１９に説明されている。

【０１４１】

【表３３】

【０１４２】表２０はパワーオンリセット時の拡張レジ
スタの状態を示す。

【０１４３】

【表３４】

【０１４４】［別添Ｃ］ベクトルプロセッサ１２０のア
ーキテクチャ状態は３２個の３２ビットスカラレジス
タ；３２個の２８８ビットベクトルレジスタの２つのバ
ンク：一対の５７６ビットベクトルアキュムレータレジ
スタ；１セットの３２ビット特殊レジスタを含んでい
る。スカラレジスタ、ベクトルレジスタ及びアキュムレ
ータレジスタは汎用プログラミングのためのものであ
り、多数の他のデータ形態を支援する。

【０１４５】このセクション及び次のセクションでは次
の表記を使用する。：ＶＲはベクトルレジスタを示し、
ＶＲｉは第ｉベクトルレジスタ（ゼロオフセット）を示
し、ＶＲ［ｉ］はベクトルレジスタＶＲの第ｉデータエ
レメントを示し、ＶＲ（ａ：ｂ）はベクトルレジスタＶ
Ｒのビットａ乃至ビットｂを示し、ＶＲ［ｉ］（ａ：
ｂ）はベクトルレジスタＶＲの第ｉデータエレメントの
ビットａ乃至ビットｂを示す。

【０１４６】ベクトルアーキテクチャは一つのベクトル
レジスタ内の多数のエレメントＤＭＬデータ種類とサイ
ズの追加された寸法をもっている。ベクトルレジスタは
固定されたサイズをもっているので、保持可能なデータ
エレメントの個数は前記エレメントのサイズに左右され
る。ＭＳＰアーキテクチャは表２１に示すように５種類
のエレメントサイズを定義している。

【０１４７】

【表３５】

【０１４８】ＭＳＰアーキテクチャは特定されたデータ
種類と命令サイズによってベクトルデータを解釈する。
現在、大部分の算術命令のバイト、バイト９、ハフワー
ド及びワードエレメントサイズに対しては２の補数（整
数）フォーマットが支援されている。また、ＩＥＥＥ７
４単一精密度フォーマットは大部分の算術命令のワード
エレメントサイズが支援されている。

【０１４９】命令シーケンスが意味のある結果をもたら
す限り、プログラマは所望の方式でデータを自由に解釈
する。例えば、プログラマはプログラムが“偽(fals
e）”オーバフロー結果を処理し得る限り、符号のない
８ビット数の貯蔵にバイト９サイズを自由に使用し、バ
イトサイズデータエレメントの符号の無い８ビット数を
同様に自由に貯蔵し、提供された２補数算術命令を使用
してこれらに対して演算を自由に行うことができる。

【０１５０】ＳＲ０乃至ＳＲ３１で表記された３２個の
スカラレジスタが存在する。これらスカラレジスタは幅
が３２ビットであり、未確定されたサイズのうちいずれ
かのサイズの１つのデータエレメントを含むことができ
る。スカラレジスタＳＲ０はこのレジスタＳＲ０が０か
らなる３２であって常に判読することができ、レジスタ
ＳＲ０への記録が無視される点から特別であると言え
る。バイト形、バイト９形及びハフワードデータ形は未
確定の値をもった最上位ビットをもっているスカラレジ
スタの最下位ビットに貯蔵される。

【０１５１】レジスタはデータ種類指示器を持っていな
いので、プログラマはそれぞれの命令に用いられるレジ
スタのデータ種類を知っていなければならない。これは
３２ビットレジスタが３２ビットレジスタを含んでいる
と仮定される他のアーキテクチャとは異なる。ＭＳＰア
ーキテクチャはデータ種類Ａの結果がデータ種類Ａに対
して未確定されたビットのみを修正することを指示す
る。例えば、バイト９加算の結果は３２ビット目的スカ
ラレジスタの下位９ビットのみを修正する。上位２３ビ
ットの値は命令に対して異に言及されなければ、未確定
された状態である。

【０１５２】６４ベクトルレジスタはそれぞれ３２ビッ
トレジスタをもっている２つのバンクから構成されてい
る。バンク０は第１の３２レジスタを含んでおり、バン
ク１は第２の３２ビットレジスタを含んでいる。これら
２つのバンクのうち、一つは現在バンクとして設定さ
れ、もう一つは交替バンクとして設定されるようにして
用いられる。交替バンクのベクトルレジスタをアクセス
し得るロード／記憶命令及びレジスタ移動命令を除いた
全てのベクトル命令はデフォルトであって、現在バンク
内のレジスタを使用する。ベクトル制御及び状態レジス
タＶＣＳＲのＣＢＡＮＫビットはバンク０或いはバンク
１を現在バンクとして設定するのに用いられる（他のバ
ンクは交替バンクになる）。現在バンク内のベクトルレ
ジスタはＶＲ０乃至ＶＲ３１とし、交替バンク内のベク
トルレジスタはＶＲＡ０乃至ＶＲＡ３１とする。

【０１５３】また、２つのバンクは概念的には５７６ビ
ットそれぞれのダブルサイズの３２個のベクトルレジス
タを提供し得るように結合することができる。制御レジ
スタＶＣＳＲのＶＥＣ６４ビットはこのモードを示す。
ＶＥＣ６４モードには現在バンク及び交替バンクが存在
せず、ベクトルレジスタ番号は２つのバンクからの対応
する対の２８８ベクトルビットベクトルを示す。即ち、ＶＲｉ（５７５：０）＝ＶＲ１ｉ（２８７：０）：ＶＲ
０ｉ（２８７：０）ここで、ＶＲ０ｉ及びＶＲ１ｉはそれぞれバンク１及び
バンク０でレジスタ番号ＶＲｉをもっているベクトルレ
ジスタを示す。ダブルサイズベクトルレジスタはＶＲ０
乃至ＶＲ３１と表記されている。

【０１５４】ベクトルレジスタは表２２に示したバイ
ト、バイト９、ハフワード或いはワードサイズの多数の
エレメントを収容することができる。

【０１５５】

【表３６】

【０１５６】一つのベクトルレジスタ内のエレメントサ
イズ間の混合は支援されない。バイト９エレメントサイ
ズを除いては２８８ビットのうち２５６ビットにのみが
用いられる。特に、全ての第９ビットは用いられない。
バイト、ハフワード及びワードサイズのうち用いられな
い３２ビットは予約されており、プログラマはこれらの
値に対してどのの仮定もできない。ベクトルアキュムレ
ータレジスタは目的レジスタの結果より高い正確度をも
っている中間結果を記憶装置に提供する。ベクトルアキ
ュムレータレジスタは４つの２８８ビットレジスタ、即
ちＶＡＣ１Ｈ，ＶＡＣ１Ｌ，ＶＡＣ０Ｈ，ＶＡＣ０Ｌか
ら構成されている。ＶＡＣ０Ｈ，ＶＡＣ０Ｌ対はデフォ
ルトによって３つの命令によって用いられる。ＶＥＣ６
４モードでのみ、ＶＡＣ１Ｈ，ＶＡＣ１Ｌ対が６４種類
のバイト９ベクトル演算を模倣するのに用いられる。ソ
ースベクトルレジスタと同じ個数のエレメントをもって
いる拡張された正確度の結果を生成するために、拡張精
密度エレメントは表２３に示すように一対のレジスタに
わたって節減される。

【０１５７】

【表３７】

【０１５８】ＶＡＣ１Ｈ，ＶＡＣ１Ｌ対はＶＥＣ６４モ
ードでのみ用いられることができ、この時エレメントの
個数はバイト９（及びバイト）、ハフワード、及びワー
ドの場合にそれぞれ６４，３２，或いは１６になること
ができる。

【０１５９】メモリから直接ロードされ得るか、或いは
メモリに直接貯蔵されうる３３つの特殊レジスタがあ
る。ＲＡＳＲ０乃至ＲＡＳＲ１５とする１６つの特殊レ
ジスタは内部復帰アドレススタックを形成しており、そ
してサブルーチン呼出命令及びサブルーチン復帰命令に
よって用いられる。１７個以上の３２ビット特殊レジス
タが表２４に示されている。

【０１６０】

【表３８】

【０１６１】ベクトル制御及び状態レジスタ（ＶＣＳ
Ｒ）に関する定義は表２５に示されている。

【０１６２】

【表３９】

【０１６３】

【表４０】

【０１６４】

【表４１】

【０１６５】ベクトルプログラムカウンタレジスタＶＰ
Ｃはベクトルプロセッサ１２０によって行われる次の命
令のアドレスである。ＡＲＭ７プロセッサ１１０はベク
トルプロセッサ１２０の演算を開始させるためにＳＴＡ
ＲＴＶＰ命令を発生する前にレジスタＶＰＣをロードし
なければならない。

【０１６６】ベクトル例外プログラムカウンタＶＥＰＣ
は一番最近の例外を一番生じさせるような命令のアドレ
スを指定する。ＭＳＰ１００は正確な例外を支援せず、
よって“一番生じさせるような”という用語を使用す
る。

【０１６７】ベクトルインタラプト供給レジスタＶＩＳ
ＲＣはインタラプト供給源をＡＲＭ７プロセッサ１１０
に特定する。適切なビットは例外の検出時にハードウェ
アによって設定される。ソフトウェアはベクトルプロセ
ッサ１２０が遂行を再開する前にレジスタＶＩＳＲＣを
クリアさせなければならない。レジスタＶＩＳＲＣで設
定されたあるビットによってベクトルプロセッサ１２０
は状態ＶＰ＿ＩＤＬＥに入る。対応するインタラプトイ
ネーブルビットがＶＩＭＳＫに設定されると、プロセッ
サ１１０に対するインタラプトが信号伝送される。表２
６にはレジスタＶＩＳＲＣの内容が定義されている。

【０１６８】

【表４２】

【０１６９】ベクトルインタラプト命令レジスタＶＩＩ
ＮＳはＶＣＩＮＴ命令或いはＶＣＪＯＩＮ命令がＡＲＭ
７プロセッサ１００をインタラプトするために行われる
と、ＶＣＩＮＴ命令或いはＶＣＪＯＩＮ命令に更新され
る。

【０１７０】ベクトルカウントレジスタＶＣＲ１，ＶＣ
Ｒ２，ＶＣＲ３は減少及びブランチ命令ＶＤ１ＣＢＲ，
ＶＤ２ＣＢＲ，ＶＤ３ＣＢＲのためのものであり、行わ
れるループのカウントに初期化される。命令ＶＤ１ＣＢ
Ｒが行われると、レジスタＶＣＲ１は１だけデクレメン
ト(decrement）される。カウント値がゼロでなく前記命
令に特定された条件がＶＦＬＡＧと一致すると、ブラン
チが取られる。一致しなければ、ブランチは取られな
い。レジスタＶＣＲ１は２つの場合において１だけデク
レメントされる。レジスタＶＣＲ２，ＶＣＲ３も同一方
法で用いられる。

【０１７１】ベクトルグローバルマスクレジスタＶＧＭ
Ｒ０は、ＶＥＣ６モードで影響を受けるＶＲ（５７５：
２８８）内のエレメントとＶＥＣ６４モードにおけるＶ
Ｒ（２８７：０）内のエレメントを指示するのに用いら
れる。レジスタＶＧＭＲ０のそれぞれのビットはベクト
ル目的レジスタの９ビットの更新を制御する。具体的
に、ＶＧＭＲ０（ｉ）は、ＶＥＣ３２モードではＶＲｄ
（９ｉ＋８：９ｉ）の更新を、そしてＶＥＣ６４モード
ではＶＲ０ｄ（９ｉ＋８：９ｉ）の更新を制御する。Ｖ
Ｒ０ｄはＶＥＣ６４モードでバンク０の目的レジスタを
示し。ＶＲｄはＶＥＣ３２モードでバンク０或いはバン
ク１になれる現在バンクの目的レジスタを意味する。ベ
クトルグローバルマスクレジスタＶＧＭＲ０はＶＣＭＯ
ＶＭ命令を除いた全ての命令の遂行に用いられる。

【０１７２】ベクトルグローバルマスクレジスタＶＧＭ
Ｒ１はＶＥＣ６４モードで影響を受けるＶＲ（５７５：
２８８）内のエレメントを指示するのに用いられる。レ
ジスタＶＧＭＲ１のそれぞれのビットはバンク１のベク
トル目的レジスタの９ビットの更新を制御する。具体的
に、ＶＧＭＲ（ｉ）はＶＲ１ｄ（９ｉ＋８：９ｉ）の更
新を制御する。レジスタＶＧＲＭ１はＶＥＣ３２モード
では使用されないが、ＶＥＣ６４ではＶＣＭＯＶＭ命令
を除いた全ての命令の遂行に影響を及ぼす。

【０１７３】ベクトルオーバフローレジスタＶＯＲ０は
ベクトル算術演算後にオーバフロー結果を含んでいるＶ
ＥＣ６４モードでＶＲ（２８７：０）内のエレメントを
指示するのに用いられる。このレジスタはスカラ算術演
算に修正されない。セットされたビットＶＯＲ１（ｉ）
はバイトまたはバイト９の第ｉエレメント、ハフワード
の第（ｉｉｄｉｖ２）エレメント、或いはワードデータ
形演算の第（ｉｉｄｉｖ４）エレメントがオーバフロー
の結果を含んでいることを指示する。例えば、ビット１
とビット３は第１ハフワード及びワードエレメントのオ
ーバフローをそれぞれ指示するように設定される。ＶＯ
Ｒ０のビットのマッピングはＶＧＭＲ０或いはＶＧＭＲ
１のビットのマッピングとは異なる。

【０１７４】ベクトルオーバフローレジスタＶＯＲ１は
ベクトル算術演算後にオーバフローの結果を含んでいる
ＶＥＣ６４モードでＶＲ（５７５：２８８）内のエレメ
ントを指示するのに用いられる。レジスタＶＯＲ１はＶ
ＥＣ３２モードで使用されず、且つスカラ算術演算によ
って修正もされない。セットされたビットＶＯＲ１
（ｉ）はバイトまたはバイト９の第ｉエレメント、ハフ
ワードの第１（ｉｉｄｉｖ２）エレメント、或いはワー
ドデータ形演算の第（ｉｉｄｉｖ４）エレメントがオー
バフローの結果を含んでいることを指示する。例えば、
ビット１とビット３はそれぞれＶＲ（５７５：２８８）
で第１ハフワードとワードエレメントのオーバフローを
指示し得るようにセットされる。ＶＯＲ１のビットマッ
ピングはＶＧＭＲ０或いはＶＧＭＲ１のビットマッピン
グとは異なる。

【０１７５】ベクトル命令アドレス区切り点レジスタＶ
ＩＡＢＲはベクトルプログラムデバッグ(debugging）時
にこれを支援する。このレジスタ定義は表２７に示され
ている。

【０１７６】

【表４３】

【０１７７】ベクトルデータアドレス区切り点レジスタ
ＶＤＡＢＲはベクトルプログラムのデバッグ(debuggin
g）時にこれを支援する。表２８にレジスタ定義が示さ
れている。

【０１７８】

【表４４】

【０１７９】ベクトル移動マスクレジスタＶＭＭＲ０は
モード命令に対してＶＣＳＲ（ＳＭＭ）＝１の時のみな
らず、常にＶＣＭＯＶＭによって用いられる。レジスタ
ＶＭＭＲ０はＶＥＣ３２モードで影響を受ける目的レジ
スタのエレメント、及びＶＥＣ６４モードでＶＲ（２８
７：０）内のエレメントを指示する。ＶＭＭＲ０のそれ
ぞれのビットはベクトル目的レジスタの９ビットの更新
を制御する。具体的に、ＶＭＭＲ０（ｉ）はＶＥＣ３２
モードでＶＲｄ（９ｉ＋８：９ｉ）の更新及びＶＥＣ６
４モードでＶＲ０ｄ（９ｉ＋８：９ｉ）の更新を制御す
る。ＶＲ０ｄはＶＥＣ６４モードでバンク０の目的レジ
スタを示し、このＶＲｄはＶＥＣ３２モードでバンク０
或いはバンク１になれる現在バンクの目的レジスタを意
味する。

【０１８０】ベクトル移動マスクレジスタＶＭＭＲ１は
全ての命令に対してＶＣＳＲ（ＳＭＭ）＝１の時のみな
らず、常にＶＣＭＯＶＭによって用いられる。レジスタ
ＶＭＭＲ１はＶＥＣ３２モードで影響を受けるＶＲ（５
７５：２８８）内のエレメントを指示する。ＶＭＭＲ１
のそれぞれのビットはバンク１のベクトル目的レジスタ
の９ビットに対する更新を制御する。具体的に、ＶＧＭ
Ｒ０１（ｉ）はＶＲｄ（９ｉ＋８：９ｉ）の更新を制御
する。レジスタＶＧＭＲ１はＶＥＣ３２モードで用いら
れない。

【０１８１】ベクトル及びＡＲＭ７同期レジスタＶＡＳ
ＹＮＣはプロセッサ１１０とプロセッサ１２０との間に
生産者／消費者形態の同期を提供する。現在、ビット３
０のみが定義されている。ＡＲＭ７プロセッサは命令
（ＭＦＥＲ，ＭＴＥＲ，ＴＥＳＴＳＥＴ）を使用してレ
ジスタＶＡＳＹＮＣをアクセスすることができ、ベクト
ルプロセッサ１２０は状態ＶＰ＿ＲＵＮ或いは状態ＶＰ
＿ＩＤＬＥにある。レジスタＶＡＳＹＮＣはＴＶＰ或い
はＭＦＶＰ命令を通じてＡＲＭ７プロセッサにアクセス
できないが、これはこれら命令が第１の１６ベクトルプ
ロセッサの特殊レジスタに対してアクセスし得ないため
である。ベクトルプロセッサはＶＭＯＶ命令を通じてレ
ジスタＶＡＳＹＮＣをアクセスすることができる。

【０１８２】表２９はパワーオンリセット時の前記ベク
トルプロセッサの状態を示す。

【０１８３】

【表４５】

【０１８４】前記特殊レジスタは前記ベクトルプロセッ
サが命令を行える前に、ＡＲＭ７プロセッサ１１０によ
って初期化される。

【０１８５】〔別添Ｄ〕各命令はソースと目的オベラン
ドのデータタイプを意味するか或いは指定する。いくつ
かの命令はソースに対して一つのデータタイプを取り、
結果に対して相違したデータタイプを生成する意味をも
つ。この別添は好ましい実施例で指示されるデータタイ
プを説明する。この出願の表３０では支持されるデータ
タイプｉｎｔ８，ｉｎｔ９，ｉｎｔ１６，ｉｎｔ３２，
及びフロート(float）について説明した。符号の無い整
数フォーマット(unsigned integer format）は支持され
ず、そしてそれの符号の無い整数値はまず使用前に２の
補数フォーマットに変換されるべきである。プログラマ
はオーバフローを適切に処理する限り、その選択による
ある他のフォーマット或いは符号の無い整数フォーマッ
トをもつ算術命令を自由に使用することができる。アー
キテクチャは単に２の補数整数のオーバフロー及び３２
ビット浮動小数点データタイプを定義する。アーキテク
チャは符号なしオーバフローの検出に必要な８，９，１
６，或いは３２ビット演算のキャリアウトを検出しな
い。

【０１８６】表３０はロード(load)演算によって支持さ
れるデータサイズを示す。

【０１８７】

【表４６】

【０１８８】アーキテクチャはデータタイプ境界に存在
するようにメモリアドレス整列を指定する。即ち、バイ
トに対しては何の整列要求事項もない。ハフワードに対
する整列要求事項はハフワード境界である。ワードに対
する整列要求事項はワード境界である。

【０１８９】表３１はストア(store）演算によって支持
されるデータサイズを示す。

【０１９０】

【表４７】

【０１９１】１以上のダム(dam）タイプはスカラ或いは
ベクトルでレジスタにマッピングされているために、若
干のデータタイプに対して何の定義もされていない結果
をもつ目的レジスタにビットが存在することができる。
実際に、ベクトル目的レジスタに対するバイト９データ
サイズ演算とスカラ目的レジスタに対するワードデータ
サイズ演算以外にも目的レジスタでその値が演算によっ
て定義されていないビットが存在する。これらビットの
ために、アーキテクチャはそれらの値が未定の状態にな
るように指定する。表３２は各データサイズに対して定
義されていないビットを示す。

【０１９２】

【表４８】

【０１９３】プログラマはプログラミング時にソース及
び目的レジスタ或いはメモリのデータタイプを知ってい
なければならない。一つのエレメントサイズから他のエ
レメントサイズへのデータタイプ変換は暫定的にベクト
ルレジスタに相違した数のエレメントが記憶されるよう
にする。例えば、ハフワードのワードデータタイプへの
ベクトルレジスタ変換は同一数の変換されたエレメント
を記憶するのに２つのレジスタを必要とする。逆に、ベ
クトルレジスタで使用者定義されたフォーマットが持て
るワードデータタイプからハフワードフォーマットへの
変換はベクトルレジスタの１／２に同一数のエレメント
と、他の１／２に残りのビットを生成する。いずれか一
つの場合に、データタイプの変換はソースエレメントと
相違したサイズをもつ変換されたエレメントの整列をも
つ構造的な発行(issue）を生成する。

【０１９４】原則的に、ＭＳＰアーキテクチャは結果と
してエレメントの数を密かに変更する演算を提供しな
い。アーキテクチャはプログラマが目的レジスタでエレ
メントの数を変更させる順序を知っていると判断する。
アーキテクチャは只一つのデータタイプから同一サイズ
の他のデータタイプに変換する演算を提供し、一つのデ
ータタイプから異なるサイズの他のデータタイプに変換
する時、プログラマがデータサイズの差異を調整するこ
とを要求する。

【０１９５】別添Ｅに説明されるＶＳＨＦＬＬ及びＶＵ
ＮＳＨＦＬＬのような特殊命令は第１サイズをもつベク
トルから第２データサイズをもつ第２ベクトルへの変換
を単純にする。ベクトルＶＲａ、例えばさらに小さいエ
レメントサイズのｉｎｔ８から、例えばさらに大きいサ
イズのｉｎｔ１６へ２の補数データタイプを変換するの
に含まれた基本段階は次のようである。

【０１９６】１．異なるベクトルＶＲｂをもつＶＲａに
あるエレメントをバイトデータタイプを使用して２ベク
トル（ＶＲｃ：ＶＲｄ）に分割する(shuffle）。ＶＲａ
にあるエレメントはダブルサイズレジスタ（ＶＲｃ：Ｖ
Ｒｄ）にあるｉｎｔ１６データエレメントの下位バイト
に移動させ、その値と関係の無いＶＲｂのエレメントは
ＶＲｃ：ＶＲｄの上位バイトに移動させる。この演算は
各エレメントのサイズをバイトからハフワードにダブル
化される間、ＶＲａエレメントの１／２をＶＲｃに、残
りの１／２をＶＲｄに効果的に移動させる。

【０１９７】２．８ビットでＶＲｃ：ＶＲｄにあるエレ
メントを算術シフトさせてそれらをサイン拡張させる。

【０１９８】ベクトルＶＲａ、例えばさらに大きいエレ
メントサイズのｉｎｔ１６から、例えばさらに小さいサ
イズのｉｎｔ８に２の補数データタイプを変換するのに
含まれた基本段階は次のようである。

【０１９９】１．ｉｎｔ１６データタイプの各エレメン
トがバイトサイズで表現され得るかを保障するためにチ
ェックする。もし必要なら、さらに小さいサイズに合わ
せるために両端のエレメントを飽和(saturate)させる。

【０２００】２．異なるベクトルＶＲｂをもつＶＲａに
あるエレメントを２ベクトルＶＲｃ：ＶＲｄに結合させ
る(unshuffle）。ＶＲａとＶＲｂにある各エレメントの
上位１／２をＶＲｃに移動させ、下位１／２をＶＲｄに
移動させる。これはＶＲａの全てのエレメントの下位１
／２をＶＲｄの下位１／２に効果的に集める。

【０２０１】特殊な命令は次のデータタイプ変換に提供
される：ｉｎｔ３２を単一精密浮動小数点に；単一精密
浮動小数点を固定小数点に（Ｘ．Ｙ注解）；単一精密浮
動小数点をｉｎｔ３２に；ｉｎｔ８をＩｎｔ９に；ｉｎ
ｔ９をｉｎｔ１６に；及びｉｎｔ１６をｉｎｔ９に。

【０２０２】ベクトルプログラミングに余裕度を与える
ために大部分のベクトル命令はベクトル内から選択され
たエレメントに対してのみ演算を行うようにエレメント
マスクを使用する。ベクトルグローバルマスクレジスタ
(Vector Global Mask Register：ＶＧＭＲ０，ＶＧＭＲ
１）はベクトル命令によってベクトルアキュムレータと
目的レジスタで修正されるエレメントを識別する。バイ
ト及びバイト９データサイズ演算のためにＶＧＭＲ０
（或いはＶＧＭＲ１）で３２ビットそれぞれは演算され
るエレメントを識別する。セット状態のビット（ＶＧＭ
Ｒ０（ｉ）はバイトサイズのエレメント（ｉ，ここでｉ
は０から３１まで）が影響を受けることを指示する。ハ
フワードデータサイズ演算のためにＶＧＭＲ０（或いは
ＶＧＭＲ１）で各３２ビット対は演算されるエレメント
を識別する。セット状態のビットＶＧＭＲ０（２ｉ：２
ｉ＋１）はエレメント（ｉ，ここでｉは０から１５ま
で）が影響を受けることを指示する。もしＶＧＭＲ０で
一対のうち只１つのビットがハフワードデータサイズ演
算のためにセットされた場合、対応するバイトで只その
ビットのみが修正される。ワードデータサイズ演算のた
めにＶＧＭＲ０（或いはＶＧＭＲ１）で各４ビットセッ
トは演算されるエレメントを識別する。セット状態のビ
ットＶＧＭＲ０（４ｉ：４ｉ＋３）はエレメント（ｉ，
ここでｉは０から７まで）が影響を受けることを指示す
る。もしＶＧＭＲ０で４ビットセットの全てのビットが
ワードデータサイズ演算のためにセットされない場合、
対応するバイトで単にそのビットのみが修正される。

【０２０３】ＶＧＭＲ０及びＶＧＭＲ１はベクトルレジ
スタをベクトル或いはスカラレジスタ或いはＶＣＭＰＶ
命令を使用した即値と比較することによりセットされる
ことができる。この命令は特定されたビットサイズによ
ってマスクを適切にセットする。スカラレジスタは只一
つのデータエレメントを含むように定義されるので、ス
カラ演算（即ち、目的レジスタがスカラである）はエレ
メントマスクによって影響を受けない。

【０２０４】ベクトルプログラミングに余裕度を与える
ために、大部分のＭＳＰ命令は３形態のベクトルとスカ
ラ演算を支援する。それらは次のようである：１．ベクトル＝ベクトルｏｐベクトル２．ベクトル＝ベクトルｏｐスカラ３．スカラ＝スカラｏｐスカラスカラレジスタがＢオペランドとして特定されているケ
ース２の場合、スカラレジスタで単一エレメントはベク
トルＡオベランド内に多数のエレメントをマッチングさ
せるのに要求されるだけ多く複製される。複製されたエ
レメントは特定されたスカラオペランドでエレメントを
同じ値をもつ。スカラオペランドはスカラレジスタ或い
は命令から即値オペランド(immedoate operand）の形態
になることができる。即値オベランドの場合にもし特定
されたデータタイプが即値フィールドサイズの有用なも
のよりさらに大きいデータサイズを使用する場合、適当
なサイン−拡張が加えられる。

【０２０５】多くのマルチメディア応用ではソース、中
間及び最終結果の精密性に特別な注意が要求される。し
かも、整数マルチプライ(integer multiply)命令は２ベ
クトルレジスタに記憶され得る“２倍精密”中間結果を
生成する。

【０２０６】ＭＳＰアーキテクチャは現在８，９，１
６，及び３２ビットエレメントに対して２の補数整数フ
ォーマットと３２ビットエレメントに対してＩＥＥＥ７
５４単一精密フォーマットを支援する。オーバフローは
特定されたデータタイプによって表現され得る一番ポジ
ティブ或いは一番ネガティブ値以上の結果となるように
定義される。オーバフローが発生する時、目的レジスタ
に記録された値は有効番号でない。アンダーフローは単
に浮動小数点演算についてのみ定義される。

【０２０７】もし、その他の状態でなければ、全ての浮
動小数点演算はビット（ＶＣＳＲ＜ＲＭＯＤＥ）で特定
された４つのラウンディングモードのうち一つを使用す
る。若干の命令はゼロ（ラウンドイブン）ラウンディン
グモードからラウンドアウェイ(round away)として知ら
れたものを使用する。

【０２０８】飽和(Saturation)は多くのマルチメディア
応用で重要な機能である。ＭＳＰアーキテクチャは全て
の４整数及び浮動小数点演算で飽和を支援する。レジス
タＶＣＳＲでビットＩＳＡＴは整数飽和モードを特定す
る。また、速いＩＥＥＥモードと周知された浮動小数点
飽和モードはＶＣＳＲでＦＳＡＴビットに特定される。
飽和モードがイネーブルされる時、一番ポジティブ或い
は一番ネガティブ値以上になる結果はそれぞれ一番ポジ
ティブ或いは一番ネガティブ値にセットされる。オーバ
フローはこの場合に発生することができなく、オーバフ
ロービットはセットされることができない。

【０２０９】表３３は欠陥のある命令を実行する前に検
出されて報告される精密な例外(Precise Exception）に
対するリストを示す。

【０２１０】

【表４９】

【０２１１】表３４は欠陥のある命令よりプログラム順
序において後の方に存在するある番号の命令を実行した
後、検出されて報告される不精密な例外(Imprecise Exc
eption）に対するリストを示す。

【０２１２】

【表５０】

【０２１３】〔別添Ｅ〕ベクトルプロセッサに対する命
令セットは表３５に示すように１１個の分類を含む。

【０２１４】

【表５１】

【０２１５】

【表５２】

【０２１６】表３６はフローコントロール(Flow Contro
l)命令に対するリストを示す。

【０２１７】

【表５３】

【０２１８】論理（Logical)分類はブール(Boolean）デ
ータタイプを支援し、エレメントマスクによって影響を
受ける。表３７は論理(logic）命令リストである。

【０２１９】

【表５４】

【０２２０】シフト／ローテート(Shift/Rotate)分類命
令はｉｎｔ８，ｉｎｔ９，ｉｎｔ１６及びｉｎｔ３２デ
ータタイプ（フロートデータタイプでない）を演算し、
エレメントマスクによって影響を受ける。表３８はシフ
ト／ローテート分類命令リストである。

【０２２１】

【表５５】

【０２２２】算術(Arithmetic)分類命令は一般にｉｎｔ
８，ｉｎｔ９，ｉｎｔ１６，ｉｎｔ３２，及びフローデ
ータタイプを支援し、エレメントマスクによって影響を
受ける。支援されないデータタイプに対する特別な制限
に対しては次の各命令の詳細な説明を参照されたい。Ｖ
ＣＭＰＶ命令はそれがエレメントマスクを演算するの
で、エレメントマスクによって影響を受けない。表３９
は算術演算命令リストである。

【０２２３】

【表５６】

【０２２４】ＭＰＥＧ命令はＭＰＥＧ符号化及び復号化
に特に適した命令分類であるが、多様な方式で用いられ
ることができる。ＭＰＥＧ命令はｉｎｔ８，ｉｎｔ９，
ｉｎｔ１６及びｉｎｔ３２データタイプを支援し、エレ
メントマスクによって影響を受ける。表４０はＭＰＥＧ
命令リストである。

【０２２５】

【表５７】

【０２２６】各データタイプ変換(Data Type Conversio
n)命令は特殊なデータタイプを支援し、アーキテクチャ
がレジスタで１以上のデータタイプを支援しないため
に、エレメントマスクによって影響を受けない。表４１
はデータタイプ変換命令リストである。

【０２２７】

【表５８】

【０２２８】インタ−エレメント算術（Inter-element
Arithmetic）分類命令はｉｎｔ８，ｉｎｔ９，ｉｎｔ１
６，ｉｎｔ３２及びフローデータタイプを支援する。表
４２はインタエレメント算術分類命令リストである。

【０２２９】

【表５９】

【０２３０】インタエレメントムーブ(Inter-element M
ove)分類命令はバイト、バイト９、ハフワード及びワー
ドデータサイズを支援する。表４３はインタエレメント
ムーブ分類命令リストである。

【０２３１】

【表６０】

【０２３２】ロード／ストア(Load/Store)命令はバイ
ト、ハフワード、及びワードデータサイズに加えて特殊
なバイト９に関連したデータサイズ演算を支援し、エレ
メントマスクによって影響を受けない。表４４はロード
／ストア分類命令リストである。

【０２３３】

【表６１】

【０２３４】大部分のレジスタムーブ(Register Move）
命令はｉｎｔ８，ｉｎｔ９，ｉｎｔ１６，ｉｎｔ３２及
びフローデータタイプを支援し、エレメントマスクによ
って影響を受けない。但し、ＶＣＭＯＶＭ命令はエレメ
ントマスクによって影響を受ける。表４５はレジスタム
ーブ分類の命令リストである。

【０２３５】

【表６２】

【０２３６】表４６はキャッシュサブシステム１３０を
制御するキャッシュ演算(Cache Operation）分類の命令
リストである。

【０２３７】

【表６３】

【０２３８】命令説明命名法命令セットの説明を単純化するために、別添全体にわた
って特殊な用語が用いられる。例えば、命令オペランド
は他の注釈がない場合、バイト、バイト９、ハフワード
或いはワードサイズの符号付きた２の補数整数である。
単語“レジスタ”は汎用（スカラ或いはベクトル）レジ
スタを指称するのに用いられる。他のタイプのレジスタ
は明らかに説明される。アセンブリ言語構文(syntax)に
おいて、接尾語ｂ，ｂ９，ｈ及びｗはデータサイズ（バ
イト、バイト９、ハフワード、及びワード）と整数デー
タタイプ（ｉｎｔ８，ｉｎｔ９，ｉｎｔ１６，及びｉｎ
ｔ３２）の全てを示す。また、命令オペランド、演算、
及びアセンブリ言語構文類の説明に用いられた用語と記
号は次の通りである。

【０２３９】Ｒｄ目的レジスタ（ベクトル、
スカラ或いは特殊目的）Ｒａ，Ｒｂソースレジスタ（ａ，ｂ）（ベクトル、
スカラ或いは特殊目的）Ｒｃソース或いは目的レジスタ（ｃ）（ベク
トル或いはスカラ）Ｒｓストアデータソースレジスタ（ベクトル
或いはスカラ）Ｓ３２ビットスカラ或いは特殊目的レジス
タＶＲ現在バンクベクトルレジスタＶＲＡ代替バンクベクトルレジスタＶＲ０バンク０ベクトルレジスタＶＲ１バンク１ベクトルレジスタＶＲｄベクトル目的レジスタ（ＶＲＡが指定さ
れない限り、現在バンクに対するデフォールト）ＶＲａ，ＶＲｂベクトルソースレジスタ（ａ及び
ｂ）ＶＲｃベクトルソース或いは目的レジスタ
（ｃ）ＶＲｓベクトルストアデータソースレジスタＶＡＣ０Ｈベクトルアキュムレータレジスタ０ハイＶＡＣ０Ｌベクトルアキュムレータレジスタ０ローＶＡＣ１Ｈベクトルアキュムレータレジスタ１ハイＶＡＣ１Ｌベクトルアキュムレータレジスタ１ローＳＲｄスカラ目的レジスタＳＲａ，ＳＲｂスカラソースレジスタ（ａ及びｂ）ＳＲｂ＋有効アドレスをもつベースレジスタのア
ップデートＳＲｓスカラストアデータソースレジスタＳＰ特殊目的レジスタＶＲ〔ｉ〕ベクトルレジスタＶＲにおけるｉ番目の
エレメントＶＲ〔ｉ〕（ａ：ｂ）ベクトルレジスタＶＲにおけ
るｉ番目のエレメントのビット（ａ〜ｂ）ＶＲ〔ｉ〕（ｍｓｂ）ベクトルレジスタＶＲにおけ
るｉ番目のエレメントの最上位ビットＥＡメモリアクセスのための有効アドレスＭＥＭメモリＢＹＴＥ〔ＥＡ〕ＥＡによってアドレスされるメモ
リの１バイトＨＡＬＦ〔ＥＡ〕ＥＡによってアドレスされるメモ
リのハフワード。ビット（１５：８）がＥＡ＋１によっ
てアドレスされる。

【０２４０】ＷＯＲＤ〔ＷＡ〕ＥＡによってアドレ
スされるメモリのワード。ビット（３１：２４）がＥＡ
＋３によってアドレスされる。

【０２４１】ＮｕｍＥｌｅｍ与えられたデータタイ
プに対するエレメントの数を示す。それはＶＥＣ３２モ
ードでそれぞれバイト、バイト９、ハフワード、或いは
ワードデータサイズに対して３２，１６，或いは８であ
る。それはＶＥＣ６４モードでそれぞれバイト、バイト
９、ハフワード、或いはワードデータサイズに対して６
４，３２，或いは１６である。スカラ演算の場合、Ｎｕ
ｍＥｌｅｍは０である。

【０２４２】ＥＭＡＳＫ〔ｉ〕ｉ番目のエレメント
に対するエレメントマスクを示す。それはそれぞれバイ
ト、バイト９、ハフワード、或いはワードデータサイズ
に対してＶＧＭＲ０／１，〜ＶＧＭＲ０／１，ＶＧＭＲ
０／１，或いは〜ＶＧＭＲ０／１で１，２，或いは４ビ
ットを示す。スカラ演算の場合、ＥＭＡＳＫ〔ｉ〕＝０
であってもエレメントマスクはセットされたと推定す
る。

【０２４３】ＭＭＡＳＫ〔ｉ〕ｉ番目のエレメント
に対するエレメントマスクを示す。それはそれぞれバイ
ト、バイト９、ハフワード、或いはワードデータサイズ
に対してＶＭＭＲ０、或いはＶＭＭＲ１で１，２，或い
は４ビットを示す。

【０２４４】ＶＣＳＲベクトルコントロール
及び状態レジスタＶＣＳＲ（ｘ）ＶＣＳＲで１つのビット或いは複数
のビットを示す。“ｘ”はフィールド名である。

【０２４５】ＶＰＣベクトルプロセッサプ
ログラムカウンタＶＥＣＳＩＺＥベクトルレジスタサイズはＶＥＣ３
２で３２、ＶＥＣ６４モードで６４である。

【０２４６】ＳＰＡＤスクラッチパッドＣプログラミング構成物は演算のコントロールフローを
説明するのに用いられる。例外は次のように要約され
る。

【０２４７】＝代入(assignment) ：接合(consatenation）｛ｘ‖ｙ｝ｘとｙの間の選択を指示する（論理ｏｒではない）ｓｅｘ特定データサイズに符号−拡張するｓｅｘ−ｄｐ特定データサイズの２倍精密度で符号−拡張ｚｅｘ特定データサイズにゼロ−拡張するｚｅｒｏゼロ−拡張された（論理）右に移動左に移動する（ゼロ充てん）ｔｒｎｃ７先行７ビット（ハフワードから）を打ち切るｔｒａｃ１先行１ビット（バイト９から）を打ち切る％モジュロ演算者｜式｜式の絶対値／分割（フロートデータタイプに対して４ＩＥＥＥラウンディングモードのうち一つを使用する）／／分割（ゼロラウンディングモードからラウンドアウェイ(round away）を使用する）飽和整数データタイプに対してオーバフロー発生の代わりに一番陰或いは一番陽の値に飽和する。フロートデータタイプに対して、飽和は陽の無限大、陽のゼロ、陰のゼロ、或いは陰の無限大に行われることができる。

【０２４８】一般的な命令フォーマットは図１２に表示
されており、下記に説明される。

【０２４９】ＲＥＡＲフォーマットはロード、ストア及
びキャッシュ演算命令によって用いられ、ＲＥＡＲフォ
ーマットでフィールドは表４７に与えられたように次の
意味をもつ。

【０２５０】

【表６４】

【０２５１】ビット１７：１５は予約(Reserved)され、
アーキテクチャで未来の拡張時に交換性を保障するため
にゼロになるべきである。Ｂ：ＤとＴＴフィールドのあ
る符号化は定義されない。

【０２５２】プログラマはアーキテクチャがこのような
符号化が用いられる時に予想された結果を指定しないた
めに、前記のような符号化を使用してはいけない。表４
８はＶＥＣ３２とＶＥＣ６４モードで支援された（ＬＴ
としてＴＴフィールドで符号化された）スカラロード演
算を示す。

【０２５３】

【表６５】

【０２５４】表４９はビットＶＣＳＲ（０）がクリアの
時のＶＥＣ３０モードで支援された（ＬＴとしてＴＴフ
ィールドで符号化された）ベクトルロード演算を示す。

【０２５５】

【表６６】

【０２５６】Ｂビットは現在或いは交替バンクの指示に
用いられる。

【０２５７】表５０はビットＶＣＳＲ（０）がクリアの
時のＶＥＣ６４モードで支援された（ＬＴとしてＴＴフ
ィールドで符号化された）ベクトルロード演算を示す。

【０２５８】

【表６７】

【０２５９】現在及び交替バンクの概念がＶＥＣ６４モ
ードでは存在しないので、ビットＢは６４バイトベクト
ル演算の指示に用いられる。

【０２６０】表５１はＶＥＣ３２及びＶＥＣ６４モード
で支援された（ＬＴとしてＴＴフィールドで符号化され
た）スカラストア演算リストである。

【０２６１】

【表６８】

【０２６２】表５２はビットＶＣＳＲ（０）がクリアの
時のＶＥＣ３２モードで支援された（ＬＴとしてフィー
ルドＴＴで符号化された）ベクトルストア演算リストで
ある。

【０２６３】

【表６９】

【０２６４】表５３はビットＶＣＳＲ（０）がセットで
ある時のＶＥＣ６４モードで支援された（ＬＴとしてＴ
Ｔフィールドで符号化された）ベクトルストア演算リス
トである。

【０２６５】

【表７０】

【０２６６】現在及び交替バンクの概念がＶＥＣ６４モ
ードでは存在しないので、ビットＢは６４バイトベクト
ル演算の指示に用いられる。

【０２６７】ＲＥＡＩフォーマットはロード、ストア及
びキャッシュ演算命令によって用いられ、ＲＥＡＩフォ
ーマットでフィールドは表５４に与えられたように次の
意味をもつ。

【０２６８】

【表７１】

【０２６９】ＲＥＡＲ及びＲＥＡＩフォーマットはトラ
ンスファタイプに対して同一の符号化を適用する。符号
化に対する詳しいことはＲＥＡＲフォーマットを参考さ
れたい。

【０２７０】ＲＲＲＭ５フォーマットは３レジスタ或い
は２レジスタ及び５ビット即値オペランドを提供する。
表５５はＲＲＲＭ５フォーマットに対するフィールドを
定義する。

【０２７１】

【表７２】

【０２７２】ビットは１９：１５は予約(RESERVED)さ
れ、アーキテクチャで未来の拡張時に互換性を保障する
ためにゼロになるべきである。

【０２７３】全てのベクトルレジスタオペランドは他の
状態がない限り、現在バンク（バンク０或いはバンク１
になることができる）を参照する。表５６はＤＣ（１：
０）が００，０１，或いは１０の時、Ｄ：Ｓ：Ｍ符号化
表である。

【０２７４】

【表７３】

【０２７５】ＤＳ（１：０）が１１の場合、Ｄ：Ｓ：Ｍ
符号化は次の表５７に示す意味をもつ。

【０２７６】

【表７４】

【０２７７】ＲＲＲＲフォーマットは４レジスタのオペ
ランドを提供する。

【０２７８】表５８はＲＲＲＲフォーマットでフィール
ドを示す。

【０２７９】

【表７５】

【０２８０】全てのベクトルレジスタオペランドは他の
状態がない限り、現在バンク（バンク０またはバンク１
になることができる）を言及する。

【０２８１】Ｒ１フォーマットは単にロード即値命令に
よって使用される。表５９はＲＩフォーマットでフィー
ルドを示す。

【０２８２】

【表７６】

【０２８３】Ｆ：ＤＳ（１：０）フィールドのある符号
化は定義されない。プログラマはこのような符号化が用
いられる時アーキテクチャが予想されたけっかを指定し
ないので、前記のような符号化を使用してはいけない。
Ｒｄにロードされた値は表６０に示すようにデータタイ
プによる。

【０２８４】

【表７７】

【０２８５】ＣＴフォーマットは表６１に示すフィール
ドを含む。

【０２８６】

【表７８】

【０２８７】ブランチ条件はＶＣＳＲ［ＧＴ：ＥＱ：Ｌ
Ｔ］フィールドを使用する。

【０２８８】オーバフロー条件はＶＣＳＲ［Ｓ０］ビッ
トを使用し、これはセット状態の時、ＧＴ，ＥＱ，及び
ＬＴビットを先行する。ＶＣＣＳとＶＣＢＡＲＲは前述
と異なってＣｏｎｄ（２：０）フィールドを解釈する。
詳細な命令説明を参考されたい。

【０２８９】ＲＲＲＭ９フォーマットは３レジスタ或い
は２レジスタ及び９ビット即値オペランドを指定する。
表６２はＲＲＲＭ９フォーマットのフィールドをを示
す。

【０２９０】

【表７９】

【０２９１】Ｄ：Ｓ：Ｍ符号化が即値オペランドを指定
しない時、ビット１９：１５は予約され、未来の互換性
を保障するためにゼロになるべきである。

【０２９２】全てのベクトルレジスタオペランドは他の
状態にない限り、現在（バンク０或いはバンク１になす
ることができる）ことるを参照する。Ｄ：Ｓ：Ｍ符号化
は即値フィールドから抽出された即値が表６３に示すよ
うにＤＳ（１：０）符号化によって左右されることを除
いてはＲＲＲＭ５フォーマットに対する表５６及び５７
に示されたことと同一である。

【０２９３】

【表８０】

【０２９４】即値フォーマットはフロートデータタイプ
では有用でない。

【０２９５】ＭＳＰベクトル命令が次のアルファベット
順で示されている。注釈：１．命令は他の状態が存在しない限り、エレメントマス
クによって影響を受ける。ＣＴフォーマット命令はエレ
メントマスクによって影響を受けない。ロード，スト
ア，及びキャッシュ命令からなるＲＥＡＲとＲＥＡＩフ
ォーマット命令もエレメントマスクによって影響を受け
ない。

【０２９６】２．９ビット即値オペランドはフロートデ
ータタイプには有用でない。

【０２９７】３．演算(operation）説明で単にベクトル
形式(form)のみ与えられる。スカラ演算の場合はただ一
つ、０番目のエレメントが定義されたと仮定する。

【０２９８】４．ＲＲＲＭ５とＲＲＲＭ９フォーマット
の場合、次の表６４に示す符号化が整数データタイプ
（ｂ，ｂ９，ｈ，ｗ）に対して使用される。

【０２９９】

【表８１】

【０３００】５．ＲＲＲＭ５とＲＲＲＭ９フォーマット
の場合、次の表６５に示した符号化がフロートデータタ
イプに用いられる。

【０３０１】

【表８２】

【０３０２】６．オーバフローを引き起こす虞のある全
ての命令に対してｉｎｔ８，ｉｎｔ９，ｉｎｔ６，ｉｎ
ｔ３２最大値或いは最小値の制限値はＶＣＳＲ（ＩＳＡ
Ｔ）ビットがセットされた時に適用される。従って、浮
動小数点結果はＶＣＳＲ（ＩＳＡＴ）ビットがセットさ
れた時に−無限大，−ゼロ，＋ゼロ，或いは＋無限大に
飽和される。

【０３０３】７．構文的に．ｎはバイト９データサイズ
を示すために、．ｂ９の代わりに用いられることができ
る。

【０３０４】８．全ての命令に対して目的レジスタ或い
はベクトルアキュムレータに帰還する浮動小数点結果は
ＩＥＥＥ７５４単精度フォーマットからなる。浮動小数
点結果はアキュムレータの下位部分に記録され、上位部
分は修正されない。

【０３０５】ＶＡＡＳ３加算及び（１，０，１）の加算

【０３０６】

【表８３】

【０３０７】アセンブラ構文ＶＡＡＳ３．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＡＳ３．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＡＳ３．ｄｔＳＲｄ，ＳＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝

【０３０８】

【表８４】

【０３０９】説明ベクトル／スカラレジスタＲａの内容はＲｂに加算され
て中間結果を発生し、その後中間結果にＲａの符号が加
算されて得られた最終結果はベクトル／スカラレジスタ
Ｒｄに記憶される。

【０３１０】演算例外オーバフローＶＡＤＡＣ加算及びアキュムレート

【０３１１】

【表８５】

【０３１２】アセンブラ構文ＶＡＤＡＣ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＶＲｂＶＡＤＡＣ．ｄｔＳＲｃ，ＳＲｄ，ＳＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０３１３】

【表８６】

【０３１４】説明ＲａとＲｂはオペランドのそれぞれのエレメントをベク
トルアキュムレータのそれぞれの倍精度エレメントに加
算し、各エレメントの倍精度の和をベクトルアキュムレ
ータと目的レジスタＲｃ，Ｒｄに記憶させる。ＲａとＲ
ｂは指定されたデータタイプを使用するが、ＶＡＣは適
当な倍精度データタイプ（それぞれｉｎｔ８，ｉｎｔ
９，ｉｎｔ１６，及びｉｎｔ３２に対して１６，１８，
３２，及び６４ビット）を使用する。それぞれの倍精度
エレメントの上位部分はＶＡＣＨとＲｃに記憶される。
もしＲｃ＝Ｒｄであれば、Ｒｃの結果は定義されない。

【０３１５】演算 for(i = 0;i < NumElem ＆＆ EMASK[i];i++)｛ Aop[i] =｛VRa[i]‖ SRa｝; Bop[i] =｛VRb[i]‖ SRb｝; VACH[i]:VACL[i] = sex(Aop[i] + Bop[i] + VACH[i]:VACL[i]; Rc[i] = VACH[i] ; Rd[i] = VACL[i] ; ｝ＶＡＤＡＣＬ加算及びローアキュムレート

【０３１６】

【表８７】

【０３１７】アセンブラ構文ＶＡＤＡＣＬ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＤＡＣＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＤＡＣＬ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＡＤＡＣＬ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＡＤＡＣＬ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０３１８】

【表８８】

【０３１９】説明ＲａとＲｂ／即値オペランドのそれぞれのエレメントを
ベクトルアキュムレータのそれぞれの拡張された精密度
エレメントに加算し、低い精密度を目的レジスタ（Ｒ
ｄ）にリターンさせる。ＲａとＲｂ／即値は指定された
データタイプを使用するが、ＶＡＣは適当な倍精度デー
タタイプ（それぞれｉｎｔ８，ｉｎｔ９，ｉｎｔ１６，
及びｉｎｔ３２に対して１６、１８，３２，及び６４ビ
ット）を使用する。それぞれの拡張された精密度エレメ
ントの上位部分はＶＡＣＨに記憶される。

【０３２０】演算 for(i = 0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i] =｛VRb[i]‖ SRb‖ sex(IMM<8:0>)｝; VACH[i]:VACL[i] = sex(Ra[i] + Bop[i] + VACH[i]:VACL[i]; Rd[i] = VACL[i] ; ｝ＶＡＤＤ加算

【０３２１】

【表８９】

【０３２２】アセンブラ構文ＶＡＤＤ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＤＤ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＤＤ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＡＤＤ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＡＤＤ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝。

【０３２３】

【表９０】

【０３２４】説明ＲａとＲｂ／即値オペランドを加算し、その和を目的レ
ジスタＲｄにリターンさせる。

【０３２５】演算 for(i = 0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i] =｛VRb[i]‖ SRb‖ sex(IMM<8:0>)｝; Rd[i] = Ra[i] + Bop[i] ; ｝例外オーバフロー，浮動小数点無効オペランドＶＡＤＤＨその隣接セルエレメント加算

【０３２６】

【表９１】

【０３２７】アセンブラ構文ＶＡＤＤＨ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＤＤＨ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０３２８】

【表９２】

【０３２９】

【表９３】

【０３３０】演算 for(i = 0;i < NumElem - 1 ; i++) ｛ Rd[i] = Ra[i] + Ra[i+1] ; ｝ Rd[NumElem-1] = Ra[NumElem-1]＋｛VPb[0]‖SRb ｝；例外オーバフロー、浮動小数点無効オペランドプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０３３１】ＶＡＮＤＡＮＤ

【０３３２】

【表９４】

【０３３３】アセンブラ構文ＶＡＮＤ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＮＤ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＮＤ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＡＮＤ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＡＮＤ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝，．ｗと．ｆが同
一演算を指定することに留意されたい。

【０３３４】

【表９５】

【０３３５】説明ＲａとＲｂ／即値オペランドを論理的にＡＮＤし、その
結果を目的レジスタＲｄにリターンさせる。

【０３３６】演算 for(i = 0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i] =｛VRb[i]‖ SRb‖ sex(IMM<8:0>)｝; Rd[i]<k> = Ra[i]<k> ＆ Bop[i]<k> , k = for all bits in element i ; ｝例外無しＶＡＮＤＣ補数ＡＮＤ

【０３３７】

【表９６】

【０３３８】アセンブラ構文ＶＡＮＤＣ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＮＤＣ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＮＤＣ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＡＮＤＣ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＡＮＤＣ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝，．ｗと．ｆが同
一の演算を指定することに留意されたい。

【０３３９】

【表９７】

【０３４０】説明Ｒａ及びＲｂ／即値オペランドの補数を論理的にＡＤＮ
し、その結果を目的レジスタＲｄにリターンさせる。

【０３４１】演算 for(i = 0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i] =｛VRb[i]‖ SRb‖ sex(IMM<8:0>)｝; Rd[i]<k> = Ra[i]<k> ＆ -Bop[i]<k>, k = for all bits in element i ; ｝例外無しＶＡＳＡ算術アキュムレータ移動

【０３４２】

【表９８】

【０３４３】アセンブラ構文ＶＡＳＡＬ．ｄｔＶＡＳＡＲ．ｄｔここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝であり、Ｒは左或
いは右側の回転方向を示す。

【０３４４】

【表９９】

【０３４５】説明ベクトルアキュムレータレジスタのそれぞれのデータエ
レメントは右側からゼロ充てん(zerofill)で１ビット位
置だけ左に移動されるか（もしＲ＝０の場合）或いは符
号−拡張で１ビット位置だけ左に移動される（もしＲ＝
１の場合）。この結果はベクトルアキュムレータに記憶
される。

【０３４６】演算 for(i = 0;i < NumElem ＆＆ EMASK[i];i++)｛ if(R = 1) VACOH[i]:VACOL[i] = VACOH[i]:VACOL[i] sign>> 1 ; else VACOH[i]:VACOL[i] = VACOH[i]:VACOL[i] << 1 ; ｝例外オーバフローＶＡＳＬ算術左への移動

【０３４７】

【表１００】

【０３４８】アセンブラ構文ＶＡＳＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＳＬ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＡＳＬ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＡＳＬ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０３４９】

【表１０１】

【０３５０】説明ベクトル／スカラレジスタＲａのそれぞれのデータエレ
メントは右側からゼロ充てんでスカラレジスタＲｂ或い
はＩＭＭフィールドに与えられた移動量だけ左に移動さ
れ、その結果はベクトル／スカラレジスタＲｄに記憶さ
れる。オーバフローを発生するそれらエレメントに対し
てその結果はそれらの符号によって最大陽或いは陰の値
に飽和する。移動量は符号のない整数となるように定義
される。

【０３５１】演算 shift＿amount =｛SRb % 32‖IMM<4:0>｝; for(i = 0 ; i < NumElem ＆＆ EMASK[i] ; i++)｛ Rd[i] = saturate(Ra[i] << shift＿amount; ｝例外なしプログラミング注意移動量はＳＲｂ或いはＩＭＭ（４：０）から５ビット番
号で得られる点に注意されたい。バイト、バイト９、ハ
フワードデータタイプに対してプログラマはデータサイ
ズのビット数より小さいか同一の移動量を正確に指定す
る義務がある。もし移動量が指定されたデータサイズよ
り大きい場合、エレメントはゼロ充てんされる。

【０３５２】ＶＡＳＲ算術右への移動

【０３５３】

【表１０２】

【０３５４】アセンブラ構文ＶＡＳＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＳＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＡＳＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＡＳＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０３５５】

【表１０３】

【０３５６】説明ベクトル／スカラレジスタＲａのそれぞれのデータエレ
メントは最上位ビット位置で符号−拡張されてスカラレ
ジスタＲｂ或いはＩＭＭフィールドの最下位ビットに与
えられた移動量だけ右に算術的に移動され、その結果は
ベクトル／スカラレジスタＲｄに記憶される。移動量は
符号のない整数となるように定義される。

【０３５７】演算 shift＿amount =｛SRb % 32‖IMM<4:0>｝; for(i = 0 ; i < NumElem ＆＆ EMASK[i] ; i++)｛ Rd[i] = Ra[i] sign >> shift＿amount) ; ｝例外無しプログラミング注意移動量がＳＲｂ或いはＩＭＭ（４：０）から５ビット番
号で得られることに注意されたい。バイト、バイト９、
ハフワードデータタイプに対してプログラマはデータサ
イズのビット数より小さいか同一の移動量を正確に指定
する義務がある。もし移動量が指定されたデータサイズ
より大きい場合、エレメントは符号ビットで充てんされ
る。

【０３５８】ＶＡＳＳ３加算及び（−１，
０，１）の符号減算

【０３５９】

【表１０４】

【０３６０】アセンブラ構文ＶＡＳＳ３．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＳＳ３．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＳＳ３．ｄｔＳＲｄ，ＳＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０３６１】

【表１０５】

【０３６２】説明ベクトル／スカラレジスタＲａのＲｂに加算されて中間
結果を生成し、その後中間結果からＲａの符号が減算さ
れて得られた最終結果はベクトル／スカラレジスタＲｄ
に記憶される。

【０３６３】演算例外オーバフローＶＡＳＵＢ減算の絶対値

【０３６４】

【表１０６】

【０３６５】アセンブラ構文ＶＡＳＵＢ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＳＵＢ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＳＵＢ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＡＳＵＢ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＡＳＵＢ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０３６６】

【表１０７】

【０３６７】説明ベクトル／スカラレジスタＲｂ或いはＩＭＭフィールド
の内容はベクトル／スカラレジスタＲａの内容から減算
されてその絶対値がベクトル／スカラレジスタＲｄに記
憶される。

【０３６８】演算例外オーバフロー、浮動小数点無効オペランドプログラミング注意もし減算器の結果が最大陰数であれば、オーバフローは
絶対値演算後に発生される。もし飽和モードがイネーブ
ルされる場合ならば、絶対値演算の結果は最大陽数にな
る。

【０３６９】ＶＡＶＧ２エレメント平均

【０３７０】

【表１０８】

【０３７１】アセンブラ構文ＶＡＶＧ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＶＧ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＡＶＧ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝であり、整数
データタイプに対する“打切り”四捨五入モードを指定
するためにＶＡＶＧＴを使用する。

【０３７２】

【表１０９】

【０３７３】説明ベクトル／スカラレジスタＲａの内容はベクトル／スカ
ラレジスタＲｂの内容に加算されて中間結果を生成し、
その後中間結果は２で割られ、最終結果はベクトル／ス
カラレジスタＲｄに記憶される。整数データタイプに対
してＴ＝１の場合、四捨五入モードが打ち切られ、Ｔ＝
０の場合、ゼロから切り捨てがなされる（デフォール
ト）。フロートデータタイプの場合、四捨五入モードは
ＶＣＳＲ（ＲＭＯＤＥ）に指定される。

【０３７４】演算例外無しＶＡＶＧＨ２隣接エレメント平均

【０３７５】

【表１１０】

【０３７６】アセンブラ構文ＶＡＶＧＨ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＡＶＧＨ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝であり、整数
データタイプに対する“打切り”四捨五入モードを指定
するためにＶＡＶＧＨＴを使用する。

【０３７７】

【表１１１】

【０３７８】

【表１１２】

【０３７９】演算 for(i = 0;i < NumElem - 1 ; i++) ｛ Rd[i] = (Ra[i] + Ra[i+1])// 2 ; ｝ Rd[NumElem-1] = (Ra[NumElem-1] ＋｛VRb[0]‖SRb ｝）／／２；例外無しプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０３８０】ＶＡＶＧＱ４重平均

【０３８１】

【表１１３】

【０３８２】アセンブラ構文ＶＡＶＧＱ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝であり、整数デー
タタイプに対する“打切り”四捨五入モードを指定する
ためにＶＡＶＧＱＴを使用する。

【０３８３】

【表１１４】

【０３８４】

【表１１５】

【０３８５】演算 for(i = 0;i < NumElem - 1 ; i++) ｛ Rd[i] = (Ra[i] + Rb[i] + (Ra[i+1] + Rb[i+1])// 4；｝例外無しＶＣＡＣＨＥキャッシュ演算

【０３８６】

【表１１６】

【０３８７】アセンブラ構文ＶＣＡＣＨＥ．ｆｃＳＲｂ，ＳＲｉＶＣＡＣＨＥ．ｆｃＳＲｂ，＃ＩＭＭＶＣＡＣＨＥ．ｆｃＳＲｂ＋，ＳＲｉＶＣＡＣＨＥ．ｆｃＳＲｂ＋，＃ＩＭＭここで、ｆｃ＝｛０，１｝。

【０３８８】

【表１１７】

【０３８９】演算例外無しプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０３９０】ＶＣＡＮＤ補数加算

【０３９１】

【表１１８】

【０３９２】アセンブラ構文ＶＣＡＮＤ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＣＡＮＤ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＣＡＮＤ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＣＡＮＤ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＣＡＮＤ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝であり、．ｗと．
ｆが同一の演算を指定することに留意されたい。

【０３９３】

【表１１９】

【０３９４】説明ＲａとＲｂ／即値オペランドの補数を論理的にＡＮＤ
し、その結果は目的レジスタＲｄにリターンさせる。

【０３９５】演算 for(i = 0; i < NumElem ＆＆ EMASK[i]; i++) ｛ Bop[i] = ｛VRb[i]‖SRb ‖sex(IMM<8:0>) ｝; Rd[i]<k> = -Ra[i]<k> ＆ Bop[i]<k>, k = for all bits in element i; ｝例外無しＶＣＢＡＲＲ条件付バリヤ

【０３９６】

【表１２０】

【０３９７】アセンブラ構文ＶＣＢＡＲＲ．ｃｏｎｄここで、ｃｏｎｄ＝｛０，−７｝、各条件は後から記号
で与えられる。

【０３９８】

【表１２１】

【０３９９】演算（Ｃｏｎｄ＝真）の間、全ての後続命令は停止させる。

【０４００】例外無しプログラミング注意この命令は命令実行の直列化を施行するためにソフトウ
ェアに提供される。この命令は不正密例外の正確な報告
を行うのに用いられる。例えば、もしこの命令が例外を
生じさせる恐れのある算術命令の直後に用いられる場
合、例外はこの命令を番地指定するプログラムカウンタ
に報告される。

【０４０１】ＶＣＢＲ条件付ブランチ

【０４０２】

【表１２２】

【０４０３】アセンブラ構文ＶＣＢＲ．ｃｏｎｄ＃Ｏｆｆｓｅｔここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４０４】説明Ｃｏｎｄが真であれば、ブランチする。これは遅延した
ブランチでない。

【０４０５】演算例外命令アドレス無効ＶＣＢＲＩ条件付間接ブランチ

【０４０６】

【表１２３】

【０４０７】アセンブラ構文ＶＣＢＲＩ．ｃｏｎｄＳＲｂここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４０８】説明Ｃｏｎｄが真であれば、ブランチする。これは遅延した
ブランチでない。

【０４０９】演算例外命令アドレス無効ＶＣＣＳ条件付文脈切換

【０４１０】

【表１２４】

【０４１１】アセンブラ構文ＶＣＣＳ＃Ｏｆｆｓｅｔ説明もしＶＩＭＳＫ（ｃｓｅ）が真の場合、文脈切換サブル
ーチンにジャンプする。これは遅延したブランチでな
い。もし、ＶＩＭＳＫ（ｃｓｅ）が真の場合、ＶＰＣ＋
４（リターンアドレス）がリターンアドレススタックに
セーブされる。もしそうでなければ、実行はＶＰＣ＋４
で続けられる。

【０４１２】演算例外アドレススタックオーバフローリターンＶＣＨＧＣＲ制御レジスタ変更

【０４１３】

【表１２５】

【０４１４】アセンブラ構文ＶＣＨＧＣＲＭｏｄｅ

【０４１５】

【表１２６】

【０４１６】演算例外無しプログラミング注意この命令はハードウェアがＶＭＯＶ命令をもって機能し
たものよりさらに効率的な方式でＶＣＳＲで制御ビット
を変更するために提供される。

【０４１７】ＶＣＩＮＴ条件付ＡＲＭ７インタラプト

【０４１８】

【表１２７】

【０４１９】アセンブラ構文ＶＣＩＮＴ．ｃｏｎｄ＃ＣＯＤＥここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４２０】説明もしＣｏｎｄが真であれば、実行を停止し、イネーブル
された場合にＡＲＭ７をインタラプトする。

【０４２１】演算 If((Cond=VCSR[SO,GT,EQ,LT]) ｜(Cond==un)) ｛ VISRC<vip> = 1; VIINS = [VCINT.cond #ICODE instruction]; VEPC = VPC; if(VIMSK<vie>==1)signal ARM7 interrupt; VP STATE=VP IDLE; ｝ else VPC = VPC+4; 例外ＶＣＩＮＴインタラプトＶＣＪＯＩＮＡＲＭ７タスクを有する条件付結
合

【０４２２】

【表１２８】

【０４２３】アセンブラ構文ＶＣＪＯＩＮ．ｃｏｎｄ＃Ｏｆｆｓｓｅｔここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４２４】説明もしＣｏｎｄが真であれば、実行を停止し、イネーブル
された場合にＡＲＭ７をインタラプトする。

【０４２５】演算 If((Cond=VCSR[SO,GT,EQ,LT]) ｜(Cond=un))｛ VISRC<vjp> = - 1; VIINS = [VCJOIN.cond #Offset instruction]; VEPC = VPC; if(VIMSK<vje>==1)signal ARM7 interrupt; VP STATE = VP IDLE; ｝ else VPC = VPC+4; 例外ＶＣＪＯＩＮインタラプトＶＣＪＳＲサブルーチンに対する条件付ジャ
ンプ

【０４２６】

【表１２９】

【０４２７】アセンブラ構文ＶＣＪＳＲ．ｃｏｎｄ＃Ｏｆｆｓｓｅｔここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４２８】説明もしＣｏｎｄが真であれば、サブルーチンにジャンプす
る。これは遅延したブランチでない。

【０４２９】もしＣｏｎｄが真であれば、ＶＰＣ＋４
（リターンアドレス）がリターンアドレススタックにセ
ーブされる。もしそうでなければ、実行はＶＰＣ＋４で
続けられる。

【０４３０】演算 If((Cond==VCSR[SO,GT,EQ,LT])｜(Cond==un)) ｛ if(VSP<4>>15) ｛ VISRC<RASO> = 1; signal ARM7 with RASO exception; VP STATE = VP IDLE; ｝else｛ RSTACK[VSP<3:0>] = VPC+4; VSP<4:0> = VSP<4:0>+1; VPC = VPC+sex(Offset<22:0>^* 4); ｝｝ else VPC = VPC+4; 例外アドレススタックオーバフローリターンＶＣＪＳＲＩサブルーチンに対する条件付間接
ジャンプ

【０４３１】

【表１３０】

【０４３２】アセンブラ構文ＶＣＪＳＲＩ．ｃｏｎｄＳＲｂここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４３３】説明もしＣｏｎｄが真であれば、サブルーチンに間接ジャン
プする。これは遅延したブランチでない。

【０４３４】もしＣｏｎｄが真であれば、ＶＰＣ＋４
（リターンアドレス）がリターンアドレススタックにセ
ーブされる。もしそうでなければ、実行はＶＰＣ＋４で
続けられる。

【０４３５】演算 If((Cond==VCSR[SO,GT,EQ,LT])｜(Cond=un))｛ if(VSP<4:9>15)｛ VISRC<RASO> = 1; signal ARM7 with RASO exception; VP STATE = VP IDLE; ｝else｛ RSTACK[VSP<3:0>] = VPC+4; VSP<4:0> = VSP<4:0>+1; VPC = SRb<31:2>:b'OO; ｝｝else VPC = VPC+4; 例外アドレススタックオーバフローリターンＶＣＭＯＶ条件付ムーブ

【０４３６】

【表１３１】

【０４３７】アセンブラ構文ＶＣＭＯＶ．ｄｔＲｄ，Ｒｂ，ｃｏｎｄＶＣＭＯＶ．ｄｔＲｄ，＃ＩＭＭ，ｃｏｎｄここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、ｃｏｎｄ＝
｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，ｎｅ，ｇｅ，ｏ
ｖ｝、．ｆと．ｗは．ｆデータタイプが９ビット即値オ
ペランドによって支援されないことを除いては同一の演
算を指定する。

【０４３８】

【表１３２】

【０４３９】

【表１３３】

【０４４０】演算 If((Cond=VCSR[SOV,GT,EQ,LT])｜(Cond==un)) for(i=0;i<NumElem;i++) Rd[i] ==｛Rb[i] ‖SRb ‖sex(IMM<8:0>) ｝；例外無しプログラミング注意この命令はエレメントマスクによって影響を受けず、−
ＶＣＭＯＶＭはエレメントマスクによって影響を受け
る。ベクトルアキュムレータで拡張された浮動小数点精
密表現は８エレメントに対する全ての５７６ビットを使
用する。従って、アキュムレータを含むベクトルレジス
タムーブは．ｂ９データサイズを指定すべきである。

【０４４１】ＶＣＭＯＶＭエレメントマスクを
有する条件付ムーブ

【０４４２】

【表１３４】

【０４４３】アセンブラ構文ＶＣＭＯＶＭ．ｄｔＲｄ，Ｒｂ，ｃｏｎｄＶＣＭＯＶＭ．ｄｔＲｄ，＃ＩＭＭ，ｃｏｎｄここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、ｃｏｎｄ＝
｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，ｎｅ，ｇｅ，ｏ
ｖ｝、．ｆと．ｗは．ｆデータタイプが９ビット即値オ
ペランドによって支援されないことを除いては同一の演
算を指定する。

【０４４４】

【表１３５】

【０４４５】

【表１３６】

【０４４６】演算 If((Cond=VCSR[SO,GT,EQ,LT]) ｜(Cond=un)) for(i=0;i < NumElem; ＆＆ MMASK[i];i++) Rd[i] = ｛Rb[i] ‖SRb ‖sex(IMM<8:0>) ｝; 例外無しプログラミング注意この命令はＶＭＭＲエレメントマスクによって影響を受
け、−ＶＣＭＯＶはエレメントマスクによって影響を受
けない。ベクトルアキュムレータで拡張された浮動小数
点精密表現は８エレメントに対する全ての５７６ビット
を使用する。従って、アキュムレータを含むベクトルレ
ジスタムーブは．ｂ９データサイズを指定すべきであ
る。

【０４４７】ＶＣＭＰＶ比較及びマスクセット

【０４４８】

【表１３７】

【０４４９】アセンブラ構文ＶＣＭＰＶ．ｄｔＶＲｄ，ＶＲｂ，ｃｏｎｄ．ｍａｓ
ｋＶＣＭＰＶ．ｄｔＶＲｄ，ＳＲｂ，ｃｏｎｄ．ｍａｓ
ｋここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、ｃｏｎｄ＝
｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，ｎｅ，ｇｅ，ｏ
ｖ｝、ｍａｓｋ＝｛ＶＧＭＲ，ＶＭＭＲ｝、もしマスク
が指定されなければ、ＶＧＭＲは仮想である。

【０４５０】

【表１３８】

【０４５１】説明ベクトルレジスタＶＲａ，ＶＲｂの内容は減算演算（Ｖ
Ｒａ[ｉ]−ＶＲｂ[ｉ]を実行することによりエレメント
方式で比較され、ＶＧＭＲ（もしＫ＝０）或いはＶＭＭ
Ｒ（もしＫ＝１）レジスタで対応するビット（＃ｉ）は
もし比較の結果がＶＣＭＰＶ命令のＣｏｎｄフィールド
と符合する場合にセットされる。例えば、Ｃｏｎｄフィ
ールドがＬＴより小さい場合、ＶＧＭＲ[ｉ]（またはＶ
ＭＭＲ[ｉ]）はＶＲａ[ｉ]＜ＶＲｂ[ｉ]の時にセットさ
れる。

【０４５２】演算 for(i=0;i < NumElem ; i++)｛ Bop[i] =｛Rb[i] ‖SRb ‖sex(IMM<8:0>) ｝; relationship[i] =Ra[i] ? Bop[i]; if(k=1) MMASK[i]=(relationship[i]==Cond) ? True:False; else EMASK[i]=(relationship[i]==Cond) ? True:False; 例外無しプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０４５３】ＶＣＮＴＬＺ先行ゼロカウント

【０４５４】

【表１３９】

【０４５５】アセンブラ構文ＶＣＮＴＬＺ．ｄｔＶＲｄ，ＶＲｂＶＣＮＴＬＺ．ｄｔＳＲｄ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０４５６】

【表１４０】

【０４５７】説明Ｒｂの各エレメントに対して先行ゼロの数をカウントし
て、Ｒｄにカウントをリターンする。

【０４５８】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++) ｛ Rd[i] = number of leading zeroes (Rb[i]); ｝例外無しプログラミング注意エレメントの全てのビットがゼロの場合、その結果はエ
レメントサイズ（それぞれバイト、バイト９、ハフワー
ド、或いはワードに対して８，９，１６，或いは３２）
と同一である。先行ゼロのカウントはエレメント位置の
インデックスと逆関係をもつ（もしＶＣＭＰＲ命令の次
に用いられる場合）。エレメント位置を変換するために
与えられたデータタイプに対するＮｕｍＥｌｅｍからＶ
ＣＮＴＬＺの結果を減算する。

【０４５９】ＶＣＯＲ補数ＯＲ

【０４６０】

【表１４１】

【０４６１】アセンブラ構文ＶＣＯＲ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＣＯＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＣＯＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＣＯＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＣＯＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗであり｝、．ｗと．
ｆが同一の演算を指定することに留意されたい。

【０４６２】

【表１４２】

【０４６３】説明ＲａとＲｂ／即値オペランドの補数を論理的にＯＲし、
その結果を目的レジスタＲｄにリターンさせる。

【０４６４】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++) ｛ Bop[i] = ｛VRb[i]‖SRb ‖sex(IMM<8:0>) ｝; Rd[i]<k> = -Ra[i]<k> ｜Bop[i]<k>,k = for all bits in element; ｝例外無しＶＣＲＳＲサブルーチンからの条件付リター
ン

【０４６５】

【表１４３】

【０４６６】アセンブラ構文ＶＣＲＳＲ．ｃｏｎｄここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４６７】説明もしＣｏｎｄが真であれば、サブルーチンにリターンす
る。これは遅延したブランチでない。

【０４６８】もしＣｏｎｄが真であれば、リターンアド
レススタックにセーブされたリターンアドレスから実行
が続けられる。もしそうでなければ、実行はＶＰＣ＋４
で続けられる。

【０４６９】演算 If((Cond==VCSR[SO,GT,EQ,LT])｜(Cond=un))｛ if(VSP<4:0> == 0) ｛ VISRC<RASU> = 1; signal ARM7 with RASU exception; VP STATE = VP IDLE; ｝else｛ VSP<4:0> = VSP<4:0> -1; VPC = RSTACK[VSP<3:0>]; VPC<1:0> = b'00; ｝｝ else VPC = VPC+4; 例外命令アドレス無効、アドレススタックオーバフローリタ
ーン。

【０４７０】ＶＣＶＴＢ９バイト９データタイプ変換

【０４７１】

【表１４４】

【０４７２】アセンブラ構文ＶＣＶＴＢ９．ｍｄＶＲｄ，ＶＲｂＶＣＶＴＢ９．ｍｄＳＲｄ，ＳＲｂここで、ｍｄ＝｛ｂｂ９，ｂ９ｈ，ｈｂ９｝

【０４７３】

【表１４５】

【０４７４】説明Ｒｂの各エレメントはバイトからバイト９（ｂｂ９）
へ、バイト９からハフワード（ｂ９ｈ）へ、或いはハフ
ワードからバイト９（ｈｂ９）へ変換する。

【０４７５】演算 if(md<1:0> = 0)｛ //bb9 for byte to byte 9 conversion VRd = VRb; VRd<9i+8> = VRb<9i+7>, I = 0 to 31(or 63 in VEC64 mode)｝ else if(md<1:0>==2)｛ //b9h for byte9 to halfword conversion VRd = VRb ; VRd<18i+16:18i+9>=VRb<18i+8>,i=0 to 15(or 31 in VEC64 mode)｝ else if(md<1:0> = 3) ｛ //hb9 for halfword to byte9 conversion VRd<18i+8>=VRb<18i+9>,i=0 to 15(or 31 in VEC64 mode) else VRd = undefined; 例外無しプログラミング注意ｂ９ｈはモードを有するこのような命令を使用する前に
プログラマはシャフル(shuffle)演算をもつベクトルレ
ジスタにエレメントの減少した数を調整することが要求
される。ｈｂ９モードを有するこのような命令を使用し
た後、プログラマはアンシャフル演算をもつ目的ベクト
ルレジスタにエレメントの増加した数を調整することが
要求される。この命令はエレメントマスクによって影響
を受けない。

【０４７６】ＶＣＶＴＦＦ浮動小数点の固定小数点への変換

【０４７７】

【表１４６】

【０４７８】アセンブラ構文ＶＣＶＴＦＦＶＲｄ，ＶＲａ，ＳＲｂＶＣＶＴＦＦＶＲｄ，ＶＲａ，＃ＩＭＭＶＣＶＴＦＦＳＲｄ，ＳＲａ，ＳＲｂＶＣＶＴＦＦＳＲｄ，ＳＲａ，＃ＩＭＭ

【０４７９】

【表１４７】

【０４８０】説明ベクトル／スカラレジスタＲａの内容はＹの幅がＲｂ
（モジュロ３２）或いはＩＭＭフィールドによって指定
され、Ｘの幅が（３２−Ｙの幅）に定義される場合、３
２ビット浮動小数点からフォーマット（Ｘ，Ｙ）の固定
小数点実数に変換される。

【０４８１】演算 Y size =｛SRb ％ 32 ‖ IMM<4.0> ｝； for(i＝0;i<NumElem;i++)｛ Rd[i] = convert to < 32-Y size.Y size>format(Ra[i]); ｝例外オーバフロープログラミング注意この命令は単にワードデータサイズのみを支援する。こ
の命令はアーキテクチャがレジスタ内に多重データタイ
プを支援しないために、エレメントマスクを使用しな
い。この命令は整数データタイプに対してゼロ四捨五入
モードから切り捨てを使用する。

【０４８２】ＶＣＶＴＩＦ整数の浮動小数点への変換

【０４８３】

【表１４８】

【０４８４】アセンブラ構文ＶＣＶＴＩＦＶＲｄ，ＶＲｂＶＣＶＴＩＦＶＲｄ，ＳＲｂＶＣＶＴＩＦＳＲｄ，ＳＲａ

【０４８５】

【表１４９】

【０４８６】説明ベクトル／スカラレジスタＲｂの内容はｉｎｔ３２から
フロートデータタイプに変換され、その結果はベクトル
／スカラレジスタＲｄに記憶される。

【０４８７】演算 for(i=0; i<NumElem : i++) ｛ Rd[i] = convert to floating point format(Rb[i]); ｝例外無しプログラミング注意この命令は単にワードデータサイズのみを支援する。こ
の命令はアーキテクチャがレジスタ内に多重データタイ
プを支援しないために、エレメントマスクを使用しな
い。

【０４８８】ＶＤ１ＣＢＲＶＣＲ１減少及び条件付ブランチ

【０４８９】

【表１５０】

【０４９０】アセンブラ構文ＶＤ１ＣＢＲ．ｃｏｎｄ＃Ｏｆｆｓｅｔここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４９１】説明ＶＣＲ１を減少させ、もしＣｏｎｄが真であればブラン
チする。これは遅延したブランチではない。

【０４９２】演算 VCR1 = VCR1 - 1; If((VCR1 > 0) ＆ ((Cond = VCSR[SO,GT,EQ,LT])｜(Cond == un))) VPC = VPC+sex(Offset<22:0>^*4); else VPC = VPC+4; 例外命令アドレス無効プログラミング注意ＶＣＲ１はブランチ条件がチェックされる前に減少され
る。ＶＣＲ１が０の時、この命令を実行することはルー
プカウント２³²−１に効果的にセットする。

【０４９３】ＶＤ２ＣＢＲＶＣＲ２減少及び条件付ブランチ

【０４９４】

【表１５１】

【０４９５】アセンブラ構文ＶＤ２ＣＢＲ．ｃｏｎｄ＃Ｏｆｆｓｅｔここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０４９６】説明ＶＣＲ２を減少させ、もしＣｏｎｄが真であればブラン
チする。これは遅延したブランチではない。

【０４９７】演算 VCR2 = VCR2 - 1; If((VCR2 > 0) ＆ ((Cond = VCSR[SO,GT,EQ,LT])｜(Cond = un))) VPC = VPC+sex(Offset<22:0>^*4); else VPC = VPC+4; 例外命令アドレス無効プログラミング注意ＶＣＲ２はブランチ条件がチェックされる前に減少され
る。ＶＣＲ２が０の時、この命令を実行することはルー
プカウント２³²−１に効果的にセットする。

【０４９８】ＶＤ３ＣＢＲＶＣＲ３減少及び条件付ブランチ

【０４９９】

【表１５２】

【０５００】アセンブラ構文ＶＤ３ＣＢＲ，ｃｏｎｄ＃Ｏｆｆｓｅｔここで、ｃｏｎｄ＝｛ｕｎ，ｌｔ，ｅｑ，ｌｅ，ｇｔ，
ｎｅ，ｇｅ，ｏｖ｝。

【０５０１】説明ＶＣＲ３を減少させ、もしＣｏｎｄが真であればブラン
チする。これは遅延したブランチではない。

【０５０２】演算 VCR3 = VCR3 - 1; If((VCR3 > 0) ＆ ((Cond = VCSR[SO,GT,EQ,LT])｜(Cond = un))) VPC = VPC+sex(Offset<22:0>^*4); else VPC = VPC+4; 例外命令アドレス無効プログラミング注意ＶＣＲ３はブランチ条件がチェックされる前に減少され
る。ＶＣＲ３が０の時、この命令を実行することはルー
プカウント２³²−１に効果的にセットする。

【０５０３】ＶＤＩＶ２Ｎ２ⁿによる分割

【０５０４】

【表１５３】

【０５０５】アセンブラ構文ＶＤＩＶ２Ｎ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＤＩＶ２Ｎ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＤＩＶ２Ｎ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＤＩＶ２Ｎ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝

【０５０６】

【表１５４】

【０５０７】説明ベクトル／スカラレジスタＲａの内容
はｎがスカラレジスタ（Ｒｂ或いはＩＭＭ）の陽の整数である場合、２ⁿによって分割され、そ
の最終結果はベクトル／スカラレジスタＲｄに記憶され
る。この命令は四捨五入モードでとして切捨て（ゼロを
向かって四捨五入）を使用する。

【０５０８】演算例外無しプログラミング注意ＮがＳＲｂ或いはＩＭＭ（４：０）から５ビット数で得
られる点に留意されたい。バイト、バイト９、ハフワー
ドデータタイプの場合、プログラマはデータサイズで精
度が低いか同一のＮの値を正確に指定する責任がある。
もしそれが指定されたデータサイズの精度よりさらに大
きければ、エレメントは符号ビットで充てんされる。こ
の命令は四捨五入モードとしてゼロを向かって四捨五入
を使用する。

【０５０９】ＶＤＩＶ２Ｎ．Ｆ２ⁿフロートによる分割

【０５１０】

【表１５５】

【０５１１】アセンブラ構文ＶＤＩＶ２Ｎ．ｆＶＲｄ，ＶＲａ，ＶＲｂＶＤＩＶ２Ｎ．ｆＶＲｄ，ＶＲａ，＃ＩＭＭＶＤＩＶ２Ｎ．ｆＳＲｄ，ＳＲａ，ＳＲｂＶＤＩＶ２Ｎ．ｆＳＲｄ，ＳＲａ，＃ＩＭＭ

【０５１２】

【表１５６】

【０５１３】説明ベクトル／スカラレジスタＲａの内容はｎがスカラレジ
スタ（Ｒｂ或いはＩＭＭ）の陽の整数の場合、２ⁿによ
って分割され、その最終結果はベクトル／スカラレジス
タＲｄに記憶される。

【０５１４】演算例外無しプログラミング注意ＮがＳＲｂ或いはＩＭＭ（４：０）から５ビット数で得
られる点に留意されたい。

【０５１５】ＶＤＩＶＩ分割初期化−不完全

【０５１６】

【表１５７】

【０５１７】アセンブラ構文ＶＤＩＶＩ．ｄｓＶＲｂＶＤＩＶＩ．ｄｓＳＲｂここで、ｄｓ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０５１８】

【表１５８】

【０５１９】説明非復原符号付き整数除算の初期化段階を実行する。被除
数はアキュムレータで倍精度符号付き整数である。もし
被除数が単精度の場合、それは倍精度で符号拡張されて
ＶＡＣＯＨ及びＶＡＣＯＬに記憶されるべきである。除
数はＲｂで単精度符号付き整数である。

【０５２０】被除数の符号(sign)が除数の符号と同一で
あれば、Ｒｂはアキュムレータの上位から減算され、そ
うでなければ、Ｒｂはアキュムレータの上位に加算され
る。

【０５２１】演算例外無しプログラミング注意プログラマは分割ステップ前にオーバフロー或いはゼロ
による除算の場合を検出ことが要求される。

【０５２２】ＶＩＤＶＳ分割ステップ−不完全

【０５２３】

【表１５９】

【０５２４】アセンブラ構文ＶＤＩＶＳ．ｄｓＶＲｂＶＤＩＶＳ．ｄｓＳＲｂここで、ｄｓ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０５２５】

【表１６０】

【０５２６】説明被復原符号付き除算の一つの反復ステップを行う。この
命令はデータサイズの多数倍（即ち、ｉｎｔ８データタ
イプに対して８倍、ｉｎｔ９に対して９倍、ｉｎｔ１６
に対して１６倍、そしてｉｎｔ３２データタイプに対し
て３２倍）として実行されるべきである。ＶＤＩＶＩ命
令はアキュムレータで初期部分の残りを生成するための
除算ステップ前に一度使用されるべきである。除数はＲ
ｂで単精度符号付き整数である。一応、商ビットはステ
ップごとに抽出されてアキュムレータの最下位ビットに
シフトされる。もし部分残りの符号がＲｂの除数の符号
と同一であれば、Ｒｂはアキュムレータの上位から減算
される。もし同一でなければ、Ｒｂはアキュムレータの
上位に加算される。商ビットはもしアキュムレータで結
果的な部分残り（加算或いは減算）の符号が除数の符号
と同一であれば、１である。そうでなければ、商ビット
はゼロ（０）である。アキュムレータは商ビットが充て
んされた状態で１ビット位置だけ左にシフトされる。除
算ステップの結論として、残りはアキュムレータの上位
に、商はアキュムレータの下位に記録される。商は１の
補数形態である。

【０５２７】演算ＶＥＳＬ１だけエレメントを左にシフトす
る

【０５２８】

【表１６１】

【０５２９】アセンブラ構文ＶＥＳＬ．ｄｔＳＲｃ，ＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｗと．ｆ
が同一演算を指定することに留意されたい。

【０５３０】

【表１６２】

【０５３１】説明１位置だけ左にベクトルレジスタＲａのエレメントをシ
フトし、スカラレジスタＲｂから充てんする。シフトさ
れた一番左側のエレメントはスカラレジスタＲｃにリタ
ーンされ、残りのエレメントはベクトルレジスタＲｄに
リターンされる。

【０５３２】

【表１６３】

【０５３３】演算例外無しプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０５３４】ＶＥＳＲ１だけエレメントを
右にシフトする

【０５３５】

【表１６４】

【０５３６】アセンブラ構文ＶＥＳＲ．ｄｔＳＲｃ，ＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｗと．ｆ
が同一演算を指定することに留意されたい。

【０５３７】

【表１６５】

【０５３８】説明１位置だけ右にベクトルレジスタＲａのエレメントをシ
フトし、スカラレジスタＲｂから充てんする。シフトさ
れた一番右側のエレメントはスカラレジスタＲｃにリタ
ーンされ、残りのエレメントはベクトルレジスタＲｄに
リターンされる。

【０５３９】

【表１６６】

【０５４０】演算例外無しプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０５４１】ＶＥＸＴＲＴ１エレメント抽出

【０５４２】

【表１６７】

【０５４３】アセンブラ構文ＶＥＸＴＲＴ．ｄｔＳＲｄ，ＶＲａ，ＳＲｂＶＥＸＴＲＴ．ｄｔＳＲｄ，ＶＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｗと．ｆ
が同一演算を指定することに留意されたい。

【０５４４】

【表１６８】

【０５４５】説明インデックスがスカラレジスタＲｂ或いはＩＭＭフィー
ルドによって指定されるＲａベクトルレジスタからエレ
メントを抽出してスカラレジスタＲｄに記憶させる。

【０５４６】演算 index32 = ｛SRb ％ 32 ‖ IMM<4:0> ｝; index64 = ｛SRb ％ 64 ‖ IMM<5:0> ｝; index = (VCSR<vec64>) ？ index64 : index32; SRd = VRa[index]; 例外無しプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０５４７】ＶＥＸＴＳＮＧ２（１，−１）の符号抽出

【０５４８】

【表１６９】

【０５４９】アセンブラ構文ＶＥＸＴＳＮＧ２．ｄｔＶＲｄ，ＶＲａＶＥＸＴＳＮＧ２．ｄｔＳＲｄ，ＳＲａここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０５５０】

【表１７０】

【０５５１】説明ベクトル／スカラレジスタＲａの内容の符号値はエレメ
ントのように計算されて、その結果はベクトル／スカラ
レジスタＲｄに記憶される。

【０５５２】演算 for(i=0; i<NumElem ＆＆ EMASK[i]; i++)｛ Rd[i] = (Ra[i]<0) ？-1: 1; ｝例外無しＶＥＸＴＳＮＧ３（１，０，−１）の符号抽出

【０５５３】

【表１７１】

【０５５４】アセンブラ構文ＶＥＸＴＳＮＧ３．ｄｔＶＲｄ，ＶＲａＶＥＸＴＳＮＧ３．ｄｔＳＲｄ，ＳＲａここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０５５５】

【表１７２】

【０５５６】説明ベクトル／スカラレジスタＲａの内容の符号値はエレメ
ントのように計算されて、その結果はベクトル／スカラ
レジスタＲｄに記憶される。

【０５５７】演算 for(i=0; i<NumElem ＆＆ EMASK[i]; i++)｛ if(Ra[i] > 0) Rd[i]=1; else if(Ra[i] < 0) Rd[i]=-1; else Ｒｄ［ｉ］＝０；｝例外無しＶＩＮＳＲＴ１エレメント挿入

【０５５８】

【表１７３】

【０５５９】アセンブラ構文ＶＩＮＳＲＴ．ｄｔＶＲｄ，ＳＲａ，ＳＲｂＶＩＮＳＲＴ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｗと．ｆ
が同一の演算を指定する点に留意されたい。

【０５６０】

【表１７４】

【０５６１】説明スカラレジスタＲａのエレメントをスカラレジスタＲｂ
或いはＩＭＭフィールドによって指定されたインデック
スにあるベクトルレジスタＲｄへ挿入する。

【０５６２】演算 index32 = ｛SRb ％ 32 ‖ IMM<4:0> ｝; index64 = ｛SRb ％ 64 ‖ IMM<5:0> ｝; index = (VCSR<vec64>) ？ index64 : index32; VRd[index]＝SRa; 例外無しプログラミング注意この命令はエレメントマスクによって影響を受けない。

【０５６３】ＶＬロード

【０５６４】

【表１７５】

【０５６５】アセンブラ構文ＶＬ．ｌｔＲｄ，ＳＲｂ，ＳＲｉＶＬ．ｌｔＲｄ，ＳＲｂ，＃ＩＭＭＶＬ．ｌｔＲｄ，ＳＲｂ＋，ＳＲｉＶＬ．ｌｔＲｄ，ＳＲｂ＋，＃ＩＭＭここで、ｌｔ＝｛ｂ，ｂｚ９，ｂｓ９，ｈ，ｗ，４，
８，１６，３２，６４｝、Ｒｄ＝｛ＶＲｄ，ＶＲＡｄ，
ＳＲｄ｝、．ｗと．ｆは同一の演算が指定され、．６４
とＶＲＡｄは共に指定され得ない点に留意されたい。キ
ャッシュオフロードのためにＶＬＯＦＦを使用する。

【０５６６】説明現在或いは交替バンク或いはスカラレジスタにベクトル
レジスタをロードする。

【０５６７】演算 EA= SR_b+ ｛SR_i‖ sex(IMM<7:0>)); if(A==1)SR_b=EA; R_d= see table below;

【０５６８】

【表１７６】

【０５６９】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０５７０】ＶＬＣＢ循環バッファからロード

【０５７１】

【表１７７】

【０５７２】アセンブラ構文ＶＬＣＢ．ｌｔＲｄ，ＳＲｂ，ＳＲｉＶＬＣＢ．ｌｔＲｄ，ＳＲｂ，＃ＩＭＭＶＬＣＢ．ｌｔＲｄ，ＳＲｂ＋，ＳＲｉＶＬＣＢ．ｌｔＲｄ，ＳＲｂ＋，＃ＩＭＭここで、ｌｔ＝｛ｂ，ｂｚ９，ｄｓ９，ｈ，ｗ，４，
８，１６，３２，６４｝、Ｒｄ＝｛ＶＲｄ，ＶＲＡｄ，
ＳＲｄ｝。．ｂと．ｄｓ９は同一の演算が指定され、．
６４とＶＲＡｄは共に指定され得ない点に注意された
い。キャッシュオフロードのためにＶＬＣＢＯＦＦを使
用する。

【０５７３】説明ＳＲ_b+1に存在するＢＥＧＩＮポインタとＳＲ_b+2に存
するＥＮＤポインタで指された循環バッファからベクト
ルレジスタまたはスカラレジスタをロードする。

【０５７４】もし、アドレス更新演算はもちろん、ロー
ド前にＥＮＤアドレスより大きければ有効アドレスが調
整される。また、循環バッファバウンドはそれぞれ．ｈ
及び．ｗスカラレジスタについてハーフワード及びワー
ド境界上で整列されるべきである。

【０５７５】

【表１７８】

【０５７６】例外無効データアドレス、整列されないアクセスプログラミング注意この命令はエレメントマスクにより影響されない。

【０５７７】プログラマは下記条件を満たさなければ予
想通り作動できない。

【０５７８】ＢＥＧＩＮ＜ＥＡ＜２＊ＥＮＤーＢＥＧＩＮすなわち、ＥＡーＥＮＤ＜ＥＮＧーＢＥＧＩＮは勿論、
ＥＡ＞ＢＥＧＩＮＶＬＤダブルロード

【０５７９】

【表１７９】

【０５８０】アセンブラ構文ＶＬＤ．ｌｔＲｄ，ＳＲｂ，ＳＲｉＶＬＤ．ｌｔＲｄ，ＳＲｂ，＃ＩＭＭＶＬＤ．ｌｔＲｄ，ＳＲｂ＋，ＳＲｉＶＬＤ．ｌｔＲｄ，ＳＲｂ＋，＃ＩＭＭここで、ｌｔ＝｛ｂ，ｂｚ９，ｂｓ９，ｈ，ｗ，４，
８，１６，３２，６４｝、Ｒｄ＝｛ＶＲｄ，ＶＲＡｄ，
ＳＲｄ｝、．ｂと．ｂｓ９は同一の演算が指定され、．
６４とＶＲＡｄは一緒に指定され得ない点に留意された
い。キャッシュオフロードのためにＶＬＤＯＦＦを使用
する。

【０５８１】説明現在或いは交替バンク或いは２スカラレジスタに２ベク
トルレジスタをロードする。

【０５８２】

【表１８０】

【０５８３】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０５８４】ＶＬＩ即値ロード

【０５８５】

【表１８１】

【０５８６】アセンブラ構文ＶＬＩ．ｄｔＶＲｄ．＃ＩＭＭＶＬＩ．ｄｔＳＲｄ．＃ＩＭＭここで、ｄｔ＝｛ｂ、ｂ９、ｈ、ｗ、ｆ｝。

【０５８７】説明即値をスカラまたはベクトルレジスタへロードする。

【０５８８】スカラレジスタロードの場合、バイト、バ
イト９、ハーフワードまたはワードはデータ型によりロ
ードされる。バイト、バイト９及びハーフワードデータ
型の場合、影響されないバイト（バイト９）は修正され
ない。

【０５８９】演算Ｒｄ＝以下の表を参照する：

【０５９０】

【表１８２】

【０５９１】例外無しＶＬＱ四重ロード

【０５９２】

【表１８３】

【０５９３】アセンブラ構文ＶＬＱ．ｌｔＲｄ，ＳＲｂ，ＳＲｉＶＬＱ．ｌｔＲｄ，ＳＲｂ，＃ＩＭＭＶＬＱ．ｌｔＲｄ，ＳＲｂ＋，ＳＲｉＶＬＱ．ｌｔＲｄ，ＳＲｂ＋，＃ＩＭＭここで、ｌｔ＝｛ｂ，ｂｚ９，ｂｓ９，ｈ，ｗ，４，
８，１６，３２，６４｝、Ｒｄ＝｛ＶＲｄ，ＶＲＡｄ，
ＳＲｄ｝、．ｂと．ｂｓ９は同一の演算が指定され、．
６４とＶＲＡｄは共に指定され得ない点に留意された
い。キャッシュオフロードのためにＶＬＱＯＦＦを使用
する。

【０５９４】説明現在或いは交替バンク或いは４スカラレジスタに４ベク
トルレジスタをロードする。

【０５９５】演算 EA= SR_b+ ｛SR_i‖ sex(IMM<7:0>)｝; if(A==1)SR_b = EA;; R_d:R_d+1:R_d+2:R_d+3= see table below;

【０５９６】

【表１８４】

【０５９７】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０５９８】ＶＬＲ逆へのロード

【０５９９】

【表１８５】

【０６００】アセンブラ構文ＶＬＲ．ｌｔＲｄ，ＳＲｂ，ＳＲｉＶＬＲ．ｌｔＲｄ，ＳＲｂ，＃ＩＭＭＶＬＲ．ｌｔＲｄ，ＳＲｂ＋，ＳＲｉＶＬＲ．ｌｔＲｄ，ＳＲｂ＋，＃ＩＭＭここで、ｌｔ＝｛４，８，１６，３２，６４｝、Ｒｄ＝
｛ＶＲｄ，ＶＲＡｄ｝、．６４とＶＲＡｄは一緒に指定
され得ない点に留意されたい。キャッシュオフロードの
ためにＶＬＲＯＦＦを使用する。

【０６０１】説明逆エレメント順序でベクトルレジスタをロードする。こ
の命令はスカラ目的レジスタを支援しない。

【０６０２】

【表１８６】

【０６０３】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０６０４】ＶＬＳＬ論理左への移動

【０６０５】

【表１８７】

【０６０６】アセンブラ構文ＶＬＳＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＬＳＬ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＬＳＬ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＬＳＬ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，｝。

【０６０７】

【表１８８】

【０６０８】説明ベクトル／スカラレジスタＲａのそれぞれのエレメント
は最下位ビットＬＳＢの位置にゼロ充てんによってスカ
ラレジスタＲｂ或いはＩＭＭフィールドに与えられた移
動量だけ左に論理的にビット−移動され、その結果はベ
クトル／スカラレジスタＲｄに記憶される。

【０６０９】演算例外無しプログラミング注意移動量がＳＲｂ或いはＩＭＭ（４：０）から５ビット番
号で得られる点に注意されたい。バイト、バイト９、ハ
フワードデータタイプに対してプログラマはデータサイ
ズのビット数より小さいか同一の移動量を正確に指定す
る義務がある。もし移動量が指定されたデータサイズよ
りさらに大きければ、エレメントはゼロ充てんされる。

【０６１０】ＶＬＳＲ論理右への移動

【０６１１】

【表１８９】

【０６１２】アセンブラ構文ＶＬＳＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＬＳＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＬＳＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＬＳＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，｝。

【０６１３】

【表１９０】

【０６１４】説明ベクトル／スカラレジスタＲａのそれぞれのエレメント
は最上位ビットＭＳＢの位置にゼロ充てんでスカラレジ
スタＲｂ或いはＩＭＭフィールドに与えられた移動量だ
け右に論理的にビット−移動され、その結果はベクトル
／スカラレジスタＲｄに記憶される。

【０６１５】演算例外無しプログラミング注意移動量がＳＲｂ或いはＩＭＭ（４：０）から５ビット番
号で得られる点に注意されたい。バイト、バイト９、ハ
フワードデータタイプに対してプログラマはデータサイ
ズのビット数より小さいか同一の移動量を正確に指定す
る義務がある。もし移動量が指定されたデータサイズよ
りさらに大きければ、エレメントはゼロで充てんされ
る。

【０６１６】ＶＬＷＳストライドにロードする

【０６１７】

【表１９１】

【０６１８】アセンブラ構文ＶＬＷＳ．ｌｔＲｄ，ＳＲａ，ＳＲｉＶＬＷＳ．ｌｔＲｄ，ＳＲｂ，＃ＩＭＭＶＬＷＳ．ｌｔＲｄ，ＳＲｂ＋，ＳＲｉＶＬＷＳ．ｌｔＲｄ，ＳＲｂ＋，＃ＩＭＭここで、ｌｔ＝｛４，８，１６，３２，６４｝，Ｒｄ＝
｛ＶＲｄ，ＶＲＡｄ｝、．６４とＶＲＡｄは共に指定さ
れ得ない点に留意されたい。キャッシュオフロードのた
めにＶＬＷＳＯＦＦを使用する。

【０６１９】説明有効アドレスから始めてストライド制御レジスタ(Strid
e Control register)としてスカラレジスタＳＲｂ＋１
を使用してメモリからベクトルレジスタＶＲｄに３２バ
イトがロードされる。ＬＴは各ブロックに対するロード
のために連続したバイトの番号とブロックサイズを指定
する。ＳＲｂ＋１は２連続ブロックの始まりを分離する
番号とストライドを指定する。ストライドはブロックサ
イズと同一か或いはさらに大きいべきである。ＥＡは整
列されたデータサイズでなければならない。ストライド
とブロックサイズはデータサイズの多数倍になるべきで
ある。

【０６２０】演算 EA＝SR_b+ ｛SR_i‖sex(IMM<7:0>）｝； if(A=1) SR_b=EA ； Block＿size＝｛４‖８‖16‖32｝； stride＝SR_b+1<31：0>； for(i=0;i<VECSIZE/Block ＿size;i++） for(j=0;j<Block ＿size;j++) VRd[ｉ^*Block ＿size+j]<8:0>=sex BYTE[EA+i^* Stride+j]; 例外データアドレス、非整列アクセス無効ＶＭＡＣ乗算及びアキュムレート

【０６２１】

【表１９２】

【０６２２】アセンブラ構文ＶＭＡＣ．ｄｔＶＲａ，ＶＲｂＶＭＡＣ．ｄｔＶＲａ，ＳＲｂＶＭＡＣ．ｄｔＶＲａ，＃ＩＭＭＶＭＡＣ．ｄｔＳＲａ，ＳＲｂＶＭＡＣ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝。

【０６２３】

【表１９３】

【０６２４】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、中間結果の各倍精度エレメント
をベクトルアキュムレータの各倍精度エレメントに加算
して、ベクトルアキュムレータに各エレメントの倍精度
の和を記憶させる。ＲａとＲｂは指定されたデータタ
イプを使用し、一方ＶＡＣは適宜な倍精度データタイプ
を使用する（それぞれｉｎｔ８，ｉｎｔ１６，及びｉｎ
ｔ３２に対して１６，３２，及び６４ビット）。各倍精
度エレメントの上位部分はＶＡＣＨに記憶される。

【０６２５】フロートデータタイプに対して全てのオペ
ランドと結果は単精度である。

【０６２６】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Aop[i]＝｛VRa[i]‖SRa ｝; Bop[i]＝｛VRb[i]‖SRb ｝; if(dt==float)VACL[i]=Aop[i] ^*Bop[i]+VACL[i]; else VACH[i]:VACL[i]=Aop[i] ^*Bop[i]+VACH[i]:VACL[i]; 例外オーバフロー、浮動小数点無効オペランドプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０６２７】ＶＭＡＣＦ乗算及び小数部アキュムレート

【０６２８】

【表１９４】

【０６２９】アセンブラ構文ＶＭＡＣＦ．ｄｔＶＲａ，ＶＲｂＶＭＡＣＦ．ｄｔＶＲａ，ＳＲｂＶＭＡＣＦ．ｄｔＶＲａ，＃ＩＭＭＶＭＡＣＦ．ｄｔＳＲａ，ＳＲｂＶＭＡＣＦ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，｝。

【０６３０】

【表１９５】

【０６３１】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、中間結果を１ビット左にシフト
させ、シフトさせた中間結果の各倍精度エレメントをベ
クトルアキュムレータの各倍精度エレメントに加算し
て、ベクトルアキュムレータに各エレメントの倍精度の
和を記憶させる。ＶＲａとＲｂは指定されたデータタ
イプを使用し、一方ＶＡＣは適宜な倍精度データタイプ
を使用する（それぞれｉｎｔ８，ｉｎｔ１６，及びｉｎ
ｔ３２に対して１６，３２，及び６４ビット）。各倍精
度エレメントの上位部分はＶＡＣＨに記憶される。

【０６３２】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； VACH[i]:VACL[i]=((VRa[i]^*Bop[i])<<1)+VACH[i]:VACL[i]; ｝例外オーバフロー、プログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０６３３】ＶＭＡＣＬ乗算及びローアキュムレート

【０６３４】

【表１９６】

【０６３５】アセンブラ構文ＶＭＡＣＬ．ｄｔＶＲａ，ＶＲｂＶＭＡＣＬ．ｄｔＶＲａ，ＳＲｂＶＭＡＣＬ．ｄｔＶＲａ，＃ＩＭＭＶＭＡＣＬ．ｄｔＳＲａ，ＳＲｂＶＭＡＣＬ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝。

【０６３６】

【表１９７】

【０６３７】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、中間結果の各倍精度エレメント
をベクトルアキュムレータの各倍精度エレメントに加算
して、ベクトルアキュムレータに各エレメントの倍精度
の和を記憶させ、目的レジスタＶＲｄに下位部分をリタ
ーンさせる。

【０６３８】ＲａとＲｂは指定されたデータタイプを使
用し、一方ＶＡＣは適宜な倍精度データタイプを使用す
る（それぞれｉｎｔ８，ｉｎｔ１６，及びｉｎｔ３２に
対して１６，３２，及び６４ビット）。各倍精度エレメ
ントの上位部分はＶＡＣＨに記憶される。

【０６３９】フロートデータタイプに対して全てのオペ
ランドと結果は単精度である。

【０６４０】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ｝； if(dt==float)VACL[i]=VRa[i] ^*Bop[i]+VACL[i]； else VACH[i]:VACL[i]=VRa[i] ^*Bop[i]+VACH[i]:VACL[i]； VRd[i]=VACL[i]；例外オーバフロー、浮動小数点無効オペランドプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０６４１】ＶＭＡＤ乗算及び加算

【０６４２】

【表１９８】

【０６４３】アセンブラ構文ＶＭＡＤ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＶＲｂＶＭＡＤ．ｄｔＳＲｃ，ＳＲｄ，ＳＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｈ，ｗ｝。

【０６４４】

【表１９９】

【０６４５】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、中間結果の各倍精度エレメント
をＲｃの各エレメントに加算して、目的レジスタ（Ｒｄ
＋１：Ｒｄ）に各エレメントの倍精度の和を記憶させ
る。

【０６４６】演算 for(i=0:i < NumElem ＆＆ EMASK[i];i++)｛ Aop[i]＝｛VRa[i]‖SRa ｝； Bop[i]＝｛VRb[i]‖SRb ｝； Cop[i]＝｛VRc[i]‖SRc ｝； Rd+1[i]:Rd[i]=Aop[i]^*Bop[i]+sex＿dp(Cop[i]) ; ｝例外無しＶＭＡＤＬ乗算及びロー加算

【０６４７】

【表２００】

【０６４８】アセンブラ構文ＶＭＡＤＬ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＶＲｂＶＭＡＤＬ．ｄｔＳＲｃ，ＳＲｄ，ＳＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝。

【０６４９】

【表２０１】

【０６５０】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、中間結果の各倍精度エレメント
をＲｃの各エレメントに加算して、目的レジスタＲｄに
各エレメントの下位部分倍精度の和を記憶させる。

【０６５１】フロートデータタイプに対して全てのオペ
ランドと結果は単精度である。

【０６５２】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Aop[i]＝｛VRa[i]‖SRa ｝； Bop[i]＝｛VRb[i]‖SRb ｝； Cop[i]＝｛VRc[i]‖SRc ｝； if(dt==float)Lo[i]=Aop[i] ^*Bop[i]+ Cop[i]; else Hi[i]:Lo[i]＝Aop[i]^*Bop[i]+sex＿dp(Cop[i]); Rd[i]=Lo[i]; ｝例外オーバフロー、浮動小数点無効オペランド。

【０６５３】ＶＭＡＳ乗算及びアキュムレ
ータからの減算

【０６５４】

【表２０２】

【０６５５】アセンブラ構文ＶＭＡＳ．ｄｔＶＲａ，ＶＲｂＶＭＡＳ．ｄｔＶＲａ，ＳＲｂＶＭＡＳ．ｄｔＶＲａ，＃ＩＭＭＶＭＡＳ．ｄｔＳＲａ，ＳＲｂＶＭＡＳ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝。

【０６５６】

【表２０３】

【０６５７】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、中間結果の各倍精度エレメント
をベクトルアキュムレータの各倍精度エレメントから減
算して、ベクトルアキュムレータに各エレメントの倍精
度の和を記憶させる。

【０６５８】ＲａとＲｂは指定されたデータタイプを使
用し、一方ＶＡＣは適宜な倍精度データタイプを使用す
る（それぞれｉｎｔ８，ｉｎｔ１６，及びｉｎｔ３２に
対して１６，３２，及び６４ビット）。各倍精度エレメ
ントの上位部分はＶＡＣＨに記憶される。

【０６５９】フロートデータタイプに対して全てのオペ
ランドと結果は単精度である。

【０６６０】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ｝； if(dt==float)VACL[i]=VACL[i]-VRa[i] ^*Bop[i]； else VACH[i]:VACL[i]=VACH[i]:VACL[i]-VRa[i] ^*Bop[i]；｝例外オーバフロー、浮動小数点無効オペランドプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０６６１】ＶＭＡＳＦ乗算及びアキュム
レータ小数部からの減算

【０６６２】

【表２０４】

【０６６３】アセンブラ構文ＶＭＡＳＦ．ｄｔＶＲａ，ＶＲｂＶＭＡＳＦ．ｄｔＶＲａ，ＳＲｂＶＭＡＳＦ．ｄｔＶＲａ，＃ＩＭＭＶＭＡＳＦ．ｄｔＳＲａ，ＳＲｂＶＭＡＳＦ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ｝。

【０６６４】

【表２０５】

【０６６５】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、倍精度中間結果を１ビットだけ
左にシフトし、シフトされた中間結果の各倍精度エレメ
ントをベクトルアキュムレータの各倍精度エレメントか
ら減算して、ベクトルアキュムレータに各エレメントの
倍精度の和を記憶させる。

【０６６６】ＲａとＲｂは指定されたデータタイプを使
用し、一方ＶＡＣは適宜な倍精度データタイプを使用す
る（それぞれｉｎｔ８，ｉｎｔ１６，及びｉｎｔ３２に
対して１６，３２，及び６４ビット）。各倍精度エレメ
ントの上位部分はＶＡＣＨに記憶される。

【０６６７】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； VACH[i]:VACL[i]=VACH[i]:VACL[i]-VRa[i]^*Bop[i]；｝例外オーバフロープログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０６６８】ＶＭＡＳＬ乗算及びアキュム
レータローからの減算

【０６６９】

【表２０６】

【０６７０】アセンブラ構文ＶＭＡＳＬ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＭＡＳＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＭＡＳＬ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＭＡＳＬ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＭＡＳＬ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝。

【０６７１】

【表２０７】

【０６７２】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、中間結果の各倍精度エレメント
をベクトルアキュムレータの各倍精度エレメントから減
算して、ベクトルアキュムレータに各エレメントの倍精
度の和を記憶させ、目的レジスタＶＲｄに下位部分をリ
ターンする。

【０６７３】ＲａとＲｂは指定されたデータタイプを使
用し、一方ＶＡＣは適宜な倍精度データタイプを使用す
る（それぞれｉｎｔ８，ｉｎｔ１６，及びｉｎｔ３２に
対して１６，３２，及び６４ビット）。各倍精度エレメ
ントの上位部分はＶＡＣＨに記憶される。

【０６７４】フロートデータタイプに対して全てのオペ
ランドと結果は単精度である。

【０６７５】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ｝； if(dt==float)VACL[i]=VACL[i]-VRA[i] ^*Bop[i]； else VACH[i]:VACL[i]=VACH[i]:VACL[i]-VRa[i] ^*Bop[i]； VRd[i]=VACL[i]；｝例外オーバフロー、浮動小数点無効オペランドプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０６７６】ＶＭＡＸＥ双方式最大及び交換

【０６７７】

【表２０８】

【０６７８】アセンブラ構文ＶＭＡＸＥ．ｄｔＶＲｄ，ＶＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝。

【０６７９】

【表２０９】

【０６８０】説明ＶＲａとＶＲｂは同一でなければならない。ＶＲａがＶ
Ｒｂと相違する時、その結果は定義されない。

【０６８１】ベクトルレジスタＲｂの各偶数／奇数デー
タエレメントは対で比較され、各データエレメント対の
うちより大きい値がベクトルレジスタＲｄの偶数位置に
記憶され、各データエレメント対のうちより小さい値が
奇数位置に記憶される。

【０６８２】演算 for(i=0;i < NumElem ＆＆ EMASK[i]:i=i+2)｛ VRd[i]＝(VRb[i]>VRb[i+1])?VRb[i]:VRb[i+1]; VRd[i+1]=(VRb[i]>VRb[i+1])?VRb[i+1]:VRb[i]；｝例外無しＶＭＯＶムーブ

【０６８３】

【表２１０】

【０６８４】アセンブラ構文ＶＭＯＶ．ｄｔＲｄ，Ｒｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝であり、Ｒｄ
とＲｂは構造的に指定されたレジスタ名で示される。

【０６８５】

【表２１１】

【０６８６】

【表２１２】

【０６８７】

【表２１３】

【０６８８】演算Ｒｄ＝Ｒｂ例外ＶＣＳＲ或いはＶＩＳＲＣに例外状態ビットをセットす
ることは対応する例外を生じさせる。

【０６８９】プログラミング注意この命令はエレメントマスクによって影響を受けない。
交替バンク概念がＶＥＣ６４モードには存在しないの
で、この命令はＶＥＣ６４モードで交替バンクレジスタ
に対する移動に使用できないことに注意されたい。

【０６９０】ＶＭＵＬ乗算

【０６９１】

【表２１４】

【０６９２】アセンブラ構文ＶＭＵＬ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＶＲｂＶＭＵＬ．ｄｔＳＲｃ，ＳＲｄ，ＳＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｈ，ｗ｝。

【０６９３】

【表２１５】

【０６９４】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度の結果を生成し、目的レジスタＲｃ：Ｒｄに各エレ
メントの倍精度の和をリターンさせる。

【０６９５】ＲａとＲｂは指定されたデータタイプを使
用し、一方Ｒｃ：Ｒｄは適宜な倍精度データタイプを使
用する（それぞれｉｎｔ８，ｉｎｔ１６，及びｉｎｔ３
２に対して１６，３２，及び６４ビット）、各倍精度エ
レメントの上位部分はＲｃに記憶される。

【０６９６】演算例外無しプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。また、この命令
は拡張された結果が支援されたデータタイプでないの
で、フロートデータタイプを支援しない。

【０６９７】ＶＭＵＬＡアキュムレータ乗算

【０６９８】

【表２１６】

【０６９９】アセンブラ構文ＶＭＵＬＡ．ｄｔＶＲａ，ＶＲｂＶＭＵＬＡ．ｄｔＶＲａ，ＳＲｂＶＭＵＬＡ．ｄｔＶＲａ，＃ＩＭＭＶＭＵＬＡ．ｄｔＳＲａ，ＳＲｂＶＭＵＬＡ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝。

【０７００】

【表２１７】

【０７０１】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、その結果をアキュムレータに記
録させる。

【０７０２】フロートデータタイプに対して全てのオペ
ランドと結果は単精度である。

【０７０３】演算例外無しプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０７０４】ＶＭＵＬＡＦアキュムレータ小数部乗算

【０７０５】

【表２１８】

【０７０６】アセンブラ構文ＶＭＵＬＡＦ．ｄｔＶＲａ，ＶＲｂＶＭＵＬＡＦ．ｄｔＶＲａ，ＳＲｂＶＭＵＬＡＦ．ｄｔＶＲａ，＃ＩＭＭＶＭＵＬＡＦ．ｄｔＳＲａ，ＳＲｂＶＭＵＬＡＦ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ｝。

【０７０７】

【表２１９】

【０７０８】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、倍精度中間結果を１ビットだけ
左にシフトして、その結果をアキュムレータに記録させ
る。

【０７０９】演算 for(i=0;i < NumElem ＆＆ EMASK[i]:i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； VACH[i]:VACL[i]=(VRa[i] ^*Bop[i])<<1；｝例外無しプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０７１０】ＶＭＵＬＦ小数部乗算

【０７１１】

【表２２０】

【０７１２】アセンブラ構文ＶＭＵＬＦ．ｄｔＶＲａ，ＶＲｂＶＭＵＬＦ．ｄｔＶＲａ，ＳＲｂＶＭＵＬＦ．ｄｔＶＲａ，＃ＩＭＭＶＭＵＬＦ．ｄｔＳＲａ，ＳＲｂＶＭＵＬＦ．ｄｔＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ｝。

【０７１３】

【表２２１】

【０７１４】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、倍精度中間結果を１ビットだけ
左にシフトして、その結果の上位部分を目的レジスタ
（ＶＲｄ＋１）にリターンし、その結果の下位部分を目
的レジスタＶＲｄにリターンさせる。ＶＲｄは偶数番号
のレジスタでなければならない。

【０７１５】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； Hi[i]:Lo[i]=(VRa[i] ^*Bop[i])<<1； VRd+1[i]=Hi[i]; VRd[i]=Lo[i]; ｝例外無しプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０７１６】ＶＭＵＬＦＲ小数部乗算及び四捨五入

【０７１７】

【表２２２】

【０７１８】アセンブラ構文ＶＭＵＬＦＲ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＭＵＬＦＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＭＵＬＦＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＭＵＬＦＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＭＵＬＦＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ｝。

【０７１９】

【表２２３】

【０７２０】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、倍精度中間結果を１ビットだけ
左にシフトして、シフトされた中間結果を上位部分に対
して四捨五入し、上位部分を目的レジスタ（ＶＲｄ）に
リターンさせる。

【０７２１】演算 for(i=0;i < NumElem ＆＆ EMASK[i]:i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； Hi[i]:Lo[i]=(VRa[i] ^*Bop[i])<<1； if(Lo[i]<msb>==1)Hi[i]=Hi[i]+1; VRd[i]=Hi[i]; ｝例外無しプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０７２２】ＶＭＵＬＬロー乗算

【０７２３】

【表２２４】

【０７２４】アセンブラ構文ＶＭＵＬＬ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＭＵＬＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＭＵＬＬ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＭＵＬＬ．ｄｔＶＲｄ，ＳＲａ，ＳＲｂＶＭＵＬＬ．ｄｔＶＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝。

【０７２５】

【表２２５】

【０７２６】説明Ｒａの各エレメントをＲｂの各エレメントと乗算して倍
精度中間結果を生成し、その結果の下位部分を目的レジ
スタＶＲｄにリターンする。

【０７２７】フロートデータタイプに対して全てのオペ
ランドと結果は単精度である。

【０７２８】演算例外オーバフロー、浮動小数点無効オペランドプログラミング注意この命令はｉｎｔ９データタイプを支援せず、その代わ
りｉｎｔ１６データタイプを使用する。

【０７２９】ＶＮＡＮＤＮＡＮＤ

【０７３０】

【表２２６】

【０７３１】アセンブラ構文ＶＮＡＮＤ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＮＡＮＤ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＮＡＮＤ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＮＡＮＤ．ｄｔＶＲｄ，ＳＲａ，ＳＲｂＶＮＡＮＤ．ｄｔＶＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｈ，ｗ，ｆ｝、．ｗと．ｆが同一
の演算を指定することに留意されたい。

【０７３２】

【表２２７】

【０７３３】説明Ｒａにある各エレメントの各ビットとＲｂ／即値オペラ
ンドにある対応するビットを論理的にＮＡＮＤし、その
結果をＲｄにリターンさせる。

【０７３４】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； Rd[i](k)=-(Ra[i]<k> ＆ Bop[i]<k>,for k=all bits in element；｝例外無しＶＮＯＲＮＯＲ

【０７３５】

【表２２８】

【０７３６】アセンブラ構文ＶＮＯＲ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＮＯＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＮＯＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＮＯＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＮＯＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｗ，ｆ｝、．ｗと．ｆが同
一の演算を指定することに留意されたい。

【０７３７】

【表２２９】

【０７３８】説明Ｒａにある各エレメントの各ビットとＲｂ／即値オペラ
ンドにある対応するビットを論理的にＮＯＲし、その結
果をＲｄにリターンさせる。

【０７３９】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； Rd[i](k)=-(Ra[i]<k> 1 Bop[i]<k>,for k=all bits in element ；｝例外無しＶＯＲＯＲ

【０７４０】

【表２３０】

【０７４１】アセンブラ構文ＶＯＲ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＯＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＯＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＯＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＯＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｗ，ｆ｝、．ｗと．ｆが同
一の演算を指定することに留意されたい。

【０７４２】

【表２３１】

【０７４３】説明Ｒａにある各エレメントの各ビットとＲｂ／即値オペラ
ンドにある対応するビットを論理的にＯＲし、その結果
をＲｄにリターンさせる。

【０７４４】演算 for(i=0;i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i]＝｛VRb[i]‖SRb ‖sex(IMM<8:0>）｝； Rd[i]<k>=-(Ra[i]<k> 1 Bop[i]<k>,for k=all bits in element ；｝例外無しＶＯＲＣ補数ＯＲ

【０７４５】

【表２３２】

【０７４６】アセンブラ構文ＶＯＲＣ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＯＲＣ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＯＲＣ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＯＲＣ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＯＲＣ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝、．ｗと．ｆが同
一の演算を指定することに留意されたい。

【０７４７】

【表２３３】

【０７４８】説明Ｒａにある各エレメントの各ビットとＲｂ／即値オペラ
ンドにある対応するビットの補数を論理的にＯＲし、そ
の結果をＲｄにリターンさせる。

【０７４９】演算 for(i=0:i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i] =｛VRb[i]‖SRb ‖sex(IMM<8.0>) ｝; Ｒｄ［ｉ］＜ｋ＞＝Ｒａ［ｉ］＜ｋ＞１−Ｂｏｐ［ｉ］＜ｋ＞．ｆ
ｏｒｋ＝ａｌｌｂｉｔｓｉｎｅｌｅｍｅｎｔｉ：｝例外無しＶＰＦＴＣＨ事前取出し

【０７５０】

【表２３４】

【０７５１】アセンブラ構文ＶＰＦＴＣＨ．ｄｔＳＲｂ，ＳＲｉＶＰＦＴＣＨ．ｄｔＳＲｂ，＃ＩＭＭＶＰＦＴＣＨ．ｄｔＳＲｂ＋，ＳＲｉＶＰＦＴＣＨ．ｄｔＳＲｂ＋，＃ＩＭＭここで、ｌｎ＝｛１，２，４，８｝。

【０７５２】説明有効アドレスから始める多数のベクトルデータキャッシ
ュラインを予め取り出す。キャッシュラインの数は次の
ように指定される：ＬＮ（１：０）＝００：１つの６４バイトキャッシュラ
インが予め取り出され。るＬＮ（１：０）＝０１：２つの６４バイトキャッシュラ
インが予め取り出される。

【０７５３】ＬＮ（１：０）＝１０：４つの６４バイト
キャッシュラインが予め取り出される。

【０７５４】ＬＮ（１：０）＝１１：８つの６４バイト
キャッシュラインが予め取り出される。

【０７５５】もし有効キャッシュラインが６４バイトバ
ウンダリにない場合、それは６４バイトバウンダリに整
列されるように先に打ち切られる。

【０７５６】演算例外データアドレス例外無効プログラミング注意ＥＡ（３１：０）はローカルメモリのバイトアドレスを
示す。

【０７５７】ＶＰＦＴＣＨＳＰ臨時パッドへの事前取出し

【０７５８】

【表２３５】

【０７５９】アセンブラ構文ＶＰＦＴＣＨＳＰ．ｌｎＳＲｐ，ＳＲｂ，ＳＲｉＶＰＦＴＣＨＳＰ．ｌｎＳＲｐ，ＳＲｂ，＃ＩＭＭＶＰＦＴＣＨＳＰ．ｌｎＳＲｐ，ＳＲｂ＋，ＳＲｉＶＰＦＴＣＨＳＰ．ｌｎＳＲｐ，ＳＲｂ＋，＃ＩＭＭここで、ｌｎ＝｛１，２，４，８｝、ＶＰＦＴＣＨとＶ
ＰＦＴＣＨＳＰは同一の演算コードをもつ説明メモリから臨時パッドに多数の６４バイトブロックを伝
送する。有効アドレスはメモリに開始アドレスを提供
し、ＳＲｐは臨時パッドに開始アドレスを提供する。６
４バイトブロックの数は次のように指定される。

【０７６０】ＬＮ（１：０）＝００：１つの６４バイト
ブロックが伝送される。

【０７６１】ＬＮ（１：０）＝０１：２つの６４バイト
ブロックが伝送される。

【０７６２】ＬＮ（１：０）＝１０：４つの６４バイト
ブロックが伝送される。

【０７６３】ＬＮ（１：０）＝１１：８つの６４バイト
ブロックが伝送される。

【０７６４】もし有効キャッシュラインが６４バイトバ
ウンダリになければ、それは６４バイトバウンダリに整
列されるように先に打ち切られる。もしＳＲｐの臨時パ
ッドポインタアドレスが６４バイトバウンダリになけれ
ば、それはまた６４バイトバウンダリに整列されるよう
に先に打ち切られる。整列された臨時パッドポインタア
ドレスは伝送されたバイト数だけ増分される。

【０７６５】演算例外データアドレス例外無効ＶＲＯＬ左への回転

【０７６６】

【表２３６】

【０７６７】アセンブラ構文ＶＲＯＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＲＯＬ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＲＯＬ．ｄｔＶＲｄ，ＳＲａ，ＳＲｂＶＲＯＬ．ｄｔＶＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０７６８】

【表２３７】

【０７６９】説明ベクトル／スカラレジスタＲａの各データエレメントは
スカラレジスタＲｂ或いはＩＭＭフィールドに与えられ
たビット量だけ左に回転され、その結果はベクトル／ス
カラレジスタＲｄに記憶される。

【０７７０】演算例外なしプログラミング注意回転量はＳＲｂ或いはＩＭＭ（４：０）から５ビット番
号で得られる点に注意されたい。バイト、バイト９、ハ
フワードデータタイプに対してプログラマはデータサイ
ズのビット数より小さいか同一の回転量を正確に指定す
る義務がある。もし回転量が指定されたデータサイズよ
りさらい大きければ、結果は定義されない。ｎだけ左に
回転することはＥｌｅｍＳｉｚｅ−ｎだけ右に回転する
のと等しく、ここでＥｌｅｍＳｉｚｅは与えられたデー
タサイズのビットの番号を示す。

【０７７１】ＶＲＯＲ右への回転

【０７７２】

【表２３８】

【０７７３】アセンブラ構文ＶＲＯＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＲＯＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＲＯＲ．ｄｔＶＲｄ，ＳＲａ，ＳＲｂＶＲＯＲ．ｄｔＶＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０７７４】

【表２３９】

【０７７５】説明ベクトル／スカラレジスタＲａの各データエレメントは
スカラレジスタＲｂ或いはＩＭＭフィールドに与えられ
たビット量だけ右に回転され、その結果はベクトル／ス
カラレジスタＲｄに記憶される。

【０７７６】演算例外なしプログラミング注意回転量はＳＲｂ或いはＩＭＭ（４：０）から５ビット番
号で得られる点に注意されたい。バイト、バイト９、ハ
フワードデータタイプに対してプログラマはデータサイ
ズのビット数より小さいか同一の回転量を正確に指定す
る義務がある。もし回転量が指定されたデータサイズよ
りさらい大きければ、結果は定義されない。ｎだけ右に
回転することはＥｌｅｍＳｉｚｅ−ｎだけ左に回転する
のと等しく、ここでＥｌｅｍＳｉｚｅは与えられたデー
タサイズのビットの番号を示す。

【０７７７】ＶＲＯＵＮＤ浮動小数点を整数に四捨五入する

【０７７８】

【表２４０】

【０７７９】アセンブラ構文ＶＲＯＵＮＤ．ｒｍＶＲｄ，ＶＲｂＶＲＯＵＮＤ．ｒｍＳＲｄ，ＳＲｂここで、ｒｍ＝｛ｎｉｎｆ，ｚｅｒｏ，ｎｅａｒ，ｐｉ
ｎｆ｝。

【０７８０】

【表２４１】

【０７８１】説明浮動小数点データフォーマットでベクトル／スカラレジ
スタＲｂの内容は一番近い３２ビット整数（ワード）に
四捨五入され、その結果はベクトル／スカラレジスタＲ
ｄに記憶される。四捨五入モードはＲＭに定義される。

【０７８２】

【表２４２】

【０７８３】演算例外無しプログラミング注意この命令はエレメントマスクに影響を受けない。

【０７８４】ＶＳＡＴＬ下限境界への飽和

【０７８５】

【表２４３】

【０７８６】アセンブラ構文ＶＳＡＴＬ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＳＡＴＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＳＡＴＬ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＳＡＴＬ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＳＡＴＬ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｆデータ
タイプは９ビット即値で支援されないことに留意された
い。

【０７８７】

【表２４４】

【０７８８】説明ベクトル／スカラレジスタＲａの各データエレメントは
ベクトル／スカラレジスタＲｂ或いはＩＭＭフィールド
にあるそれの対応する下限値に対してチェックされる。
もしデータエレメントの値が下限値よりさらに小さけれ
ば、それは下限値と同一に設定され、最終結果はベクト
ル／スカラレジスタＲｄに記憶される。

【０７８９】演算例外無しＶＳＡＴＵ上限境界への飽和

【０７９０】

【表２４５】

【０７９１】アセンブラ構文ＶＳＡＴＵ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＳＡＴＵ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＳＡＴＵ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＳＡＴＵ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＳＡＴＵ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｆデータ
タイプは９ビット即値で支援されないことに留意された
い。

【０７９２】

【表２４６】

【０７９３】説明ベクトル／スカラレジスタＲａの各データエレメントは
ベクトル／スカラレジスタＲｂ或いはＩＭＭフィールド
にあるそれの対応する上限値に対してチェックされる。
もしデータエレメントの値が上限値よりさらに小さけれ
ば、それは上限値と同一に設定され、最終結果はベクト
ル／スカラレジスタＲｄに記憶される。

【０７９４】演算例外無しＶＳＨＦＬシャフル(shuffle)

【０７９５】

【表２４７】

【０７９６】アセンブラ構文ＶＳＨＦＬ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＶＲｂＶＳＨＦＬ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝、．ｗと．ｆが同
一の演算を指定することに留意されたい。

【０７９７】

【表２４８】

【０７９８】説明ベクトルレジスタＲａの内容は下記に示すようにＲｂと
混ぜられて(shuffle）、その結果はベクトルレジスタＲ
ｃ：Ｒｄに記憶される。

【０７９９】

【表２４９】

【０８００】演算例外無しプログラミング注意この命令はエレメントアスクを使用しない。

【０８０１】ＶＳＨＦＬＨハイシャフル

【０８０２】

【表２５０】

【０８０３】アセンブラ構文ＶＳＨＦＬＨ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＳＨＦＬＨ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝、．ｗと．ｆが同
一の演算を指定することに留意されたい。

【０８０４】

【表２５１】

【０８０５】説明ベクトルレジスタＲａの内容は下記に示すようにＲｂと
混ぜられて(shuffle）、その結果の上位部分はベクトル
レジスタＲｄに記憶される。

【０８０６】

【表２５２】

【０８０７】演算例外無しプログラミング注意この命令はエレメントマスクを使用しない。

【０８０８】ＶＳＨＦＬＬローシャフル

【０８０９】

【表２５３】

【０８１０】アセンブラ構文ＶＳＨＦＬＬ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＳＨＦＬＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｗと．ｆ
が同一の演算を指定することに留意されたい。

【０８１１】

【表２５４】

【０８１２】説明ベクトルレジスタＲａの内容は下記に示すようにＲｂと
混ぜられて(shuffle）、その結果の下位部分はベクトル
レジスタＲｄに記憶される。

【０８１３】

【表２５５】

【０８１４】演算例外無しプログラミング注意この命令はエレメントマスクを使用しない。

【０８１５】ＶＳＴ記憶

【０８１６】

【表２５６】

【０８１７】アセンブラ構文ＶＳＴ．ｓｔＲｓ，ＳＲｂ，ＳＲｉＶＳＴ．ｓｔＲｓ，ＳＲｂ，＃ＩＭＭＶＳＴ．ｓｔＲＳ，ＳＲｂ＋，ＳＲｉＶＳＴ．ｓｔＲｓ，ＳＲｂ＋，＃ＩＭＭここで、ｓｔ＝｛ｂ，ｂ９ｔ，ｈ，ｗ，４，８，１６，
３２，６４｝，Ｒｓ＝｛ＶＲｓ，ＶＲＡｓ，ＳＲ
ｓ｝、．ｂと．ｂ９ｔは同一の演算が指定され、．６４
とＶＲＡｓは共に指定され得ない点に留意されたい。キ
ャッシュオフ記憶のためにＶＳＴＯＦＦを使用する。

【０８１８】説明ベクトルまたはスカラレジスタを記憶する。

【０８１９】演算 EA= SR_b+ ｛SR_i‖ sex(IMM<7:0>)｝; if(A==1)SR_b=EA; ＭＥＭ［ＥＡ］＝ｓｅｅｔａｂｌｅｂｅｌｏ
ｗ；

【０８２０】

【表２５７】

【０８２１】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０８２２】ＶＳＴＣＢ円形バッファによる記憶

【０８２３】

【表２５８】

【０８２４】アセンブラ構文ＶＳＴＣＢ．ｓｔＲｓ，ＳＲｂ，ＳＲｉＶＳＴＣＢ．ｓｔＲｓ，ＳＲｂ，＃ＩＭＭＶＳＴＣＢ．ｓｔＲＳ，ＳＲｂ＋，ＳＲｉＶＳＴＣＢ．ｓｔＲｓ，ＳＲｂ＋，＃ＩＭＭここで、ｓｔ＝｛ｂ，ｂ９ｔ，ｈ，ｗ，４，８，１６，
３２，６４｝，Ｒｓ＝｛ＶＲｓ，ＶＲＡｓ，ＳＲ
ｓ｝、．ｂと．ｂ９ｔは同一の演算が指定され、．６４
とＶＲＡｄは共に指定され得ない点に留意されたい。キ
ャッシュオフロードのためにＶＳＴＣＢＯＦＦを使用す
る。

【０８２５】説明ＳＲｂ＋１でＢＥＧＩＮポインタ、ＳＲｂ＋２でＥＮＤ
ポインタによって境界になった円形バッファからベクト
ルまたはスカラレジスタを記憶する。

【０８２６】有効アドレスはもしそれが記憶のみならず
アドレスアップデート演算以前のＥＮＤアドレスよりさ
らに大きければ、調整される。さらに円形バッファ境界
はそれぞれ．ｈと．ｗスカラロードに対してハフワード
及びワード境界に整列されるべきである。

【０８２７】演算 EA =SR_b+ ｛SRi ‖ sex(IMM<7:0>)｝; BEGIN = SR_b+1; END = SR_b+2; cbsize = END - BEGIN; ｉｆ（ＥＡ＞ＥＮＤ）ＥＡ＝ＢＥＧＩＮ＋（Ｅ
Ａ − ＥＮＤ）；ｉｆ（Ａ＝＝１）ＳＲ_ｂ＝ＥＡ；ＭＥＭ［ＥＡ］＝ｓｅｅｔａｂｌｅｂｅｌｏ
ｗ；

【０８２８】

【表２５９】

【０８２９】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。
プログラマはこの命令が案の通りに動作するように次の
条件を保障すべきである：ＢＥＧＩＮ＜ＥＡ＜２^*ＥＮＤ−ＢＥＧＩＮ即ち、ＥＡ＞ＢＥＧＩＮ及びＥＡ−ＥＮＤ＜ＥＮＤ−Ｂ
ＥＧＩＮＶＳＴＤダブル記憶

【０８３０】

【表２６０】

【０８３１】アセンブラ構文ＶＳＴＤ．ｓｔＲｓ，ＳＲｂ，ＳＲｉＶＳＴＤ．ｓｔＲｓ，ＳＲｂ，＃ＩＭＭＶＳＴＤ．ｓｔＲＳ，ＳＲｂ＋，ＳＲｉＶＳＴＤ．ｓｔＲｓ，ＳＲｂ＋，＃ＩＭＭここで、ｓｔ＝｛ｂ，ｂ９ｔ，ｈ，ｗ，４，８，１６，
３２，６４｝，Ｒｓ＝｛ＶＲｓ，ＶＲＡｓ，ＳＲ
ｓ｝、．ｂと．ｂ９ｔは同一の演算が指定され、．６４
とＶＲＡｓは共に指定され得ない点に留意されたい。キ
ャッシュオフ記憶のためにＶＳＴＤＯＦＦを使用する。

【０８３２】説明現在或いは交替バンク或いは２スカラレジスタから２ベ
クトルレジスタを記憶する。

【０８３３】演算 EA =SR_b+ ｛SR_i‖ sex(IMM<7:0>)｝；ｉｆ（Ａ＝＝１）ＳＲ_ｂ＝ＥＡ；ＭＥＭ［ＥＡ］＝ｓｅｅｔａｂｌｅｂｅｌｏ
ｗ；

【０８３４】

【表２６１】

【０８３５】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０８３６】ＶＳＴＱ４重記憶

【０８３７】

【表２６２】

【０８３８】アセンブラ構文ＶＳＴＱ．ｓｔＲｓ，ＳＲｂ，ＳＲｉＶＳＴＱ．ｓｔＲｓ，ＳＲｂ，＃ＩＭＭＶＳＴＱ．ｓｔＲＳ，ＳＲｂ＋，ＳＲｉＶＳＴＱ．ｓｔＲｓ，ＳＲｂ＋，＃ＩＭＭここで、ｓｔ＝｛ｂ，ｂ９ｔ，ｈ，ｗ，４，８，１６，
３２，６４｝，Ｒｓ＝｛ＶＲｓ，ＶＲＡｓ，ＳＲ
ｓ｝、．ｂと．ｂ９ｔは同一の演算が指定され、．６４
とＶＲＡｓは共に指定され得ない点に留意されたい。キ
ャッシュオフ記憶のためにＶＳＴＱＯＦＦを使用する。

【０８３９】説明現在或いは交替バンク或いは４スカラレジスタから４ベ
クトルレジスタを記憶する。

【０８４０】演算 EA =SR_b+ ｛SR_i‖ sex(IMM<7:0>)｝；ｉｆ（Ａ＝＝１）ＳＲ_ｂ＝ＥＡ；ＭＥＭ［ＥＡ］＝ｓｅｅｔａｂｌｅｂｅｌｏ
ｗ；

【０８４１】

【表２６３】

【０８４２】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０８４３】ＶＳＴＲ逆順記憶

【０８４４】

【表２６４】

【０８４５】アセンブラ構文ＶＳＴＲ．ｓｔＲｓ，ＳＲｂ，ＳＲｉＶＳＴＲ．ｓｔＲｓ，ＳＲｂ，＃ＩＭＭＶＳＴＲ．ｓｔＲＳ，ＳＲｂ＋，ＳＲｉＶＳＴＲ．ｓｔＲｓ，ＳＲｂ＋，＃ＩＭＭここで、ｓｔ＝｛ｂ，ｂ９ｔ，ｈ，ｗ，４，８，１６，
３２，６４｝，Ｒｓ＝｛ＶＲｓ，ＶＲＡｓ，ＳＲ
ｓ｝、．６４とＶＲＡｄは一緒に指定され得ない点に留
意されたい。キャッシュオフ記憶のためにＶＳＴＲＯＦ
Ｆを使用する。

【０８４６】説明逆エレメント順序でベクトルレジスタを記憶する。この
命令はスカラデータソースレジスタを支援しない。

【０８４７】演算 EA =SR_b+ ｛SRi ‖ sex(IMM<7:0>)｝; if(A==1)SR_b= EA; MEM[EA] = see table below;

【０８４８】

【表２６５】

【０８４９】例外データアドレス、非整列アクセス無効プログラミング注意この命令はエレメントマスクによって影響を受けない。

【０８５０】ＶＳＴＷＳストライド記憶

【０８５１】

【表２６６】

【０８５２】アセンブラ構文ＶＳＴＷＳ．ｓｔＲｓ，ＳＲｂ，ＳＲｉＶＳＴＷＳ．ｓｔＲｓ，ＳＲｂ，＃ＩＭＭＶＳＴＷＳ．ｓｔＲＳ，ＳＲｂ＋，ＳＲｉＶＳＴＷＳ．ｓｔＲｓ，ＳＲｂ＋，＃ＩＭＭここで、ｓｔ＝｛４，８，１６，３２｝，Ｒｓ＝｛ＶＲ
ｓ，ＶＲＡｓ｝、．６４モードは支援されず、その代わ
りＶＳＴを使用することに留意されたい。キャッシュオ
フ記憶のためにＶＳＴＷＳＯＦＦを使用する。

【０８５３】説明有効アドレスから始めてストライド制御レジスタ(Strid
e Control Register)としてスカラレジスタＳＲｂ＋１
を使用してベクトルレジスタＶＲｓからメモリに３２バ
イトが記憶される。

【０８５４】ＳＴは各ブロックから記憶のために連続し
たバイトの番号とブロックサイズを指定する。ＳＲｂ＋
１は２連続ブロックの始まりを分離するバイトの番号と
ストライドを指定する。

【０８５５】ストライドはブロックサイズと同一か或い
は大きくなければならない。ＥＡは整列されたデータサ
イズでなければならない。ストライドとブロックサイズ
はデータサイズの多数倍になるべきである。

【０８５６】演算 EA= SR_b+ ｛SR_i‖ sex(IMM<7:0>)｝; if(A==1) SR _b=EA; Block size= ｛4 ‖ 8 ‖ 16 ‖ 32 ｝; Stride = SR_b+1<31:0>; for(i=0;j < VECSIZE/Block size;i++) for(j=0;j < Block size;j++) BYTE｛EA+i^*Stride+j] = VR_s[i^*Block size+j]<7:0>; 例外データアドレス、非整列アクセス無効ＶＳＵＢ減算

【０８５７】

【表２６７】

【０８５８】アセンブラ構文ＶＳＵＢ．ｓｔＶＲｄ，ＶＲａ，ＶＲｂＶＳＵＢ．ｓｔＶＲｄ，ＶＲａ，ＳＲｂＶＳＵＢ．ｓｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＳＵＢ．ｓｔＳＲｄ，ＳＲａ，ＳＲｂＶＳＵＢ．ｓｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｓｔ＝｛ｂ，ｂ９ｔ，ｈ，ｗ，ｆ｝

【０８５９】

【表２６８】

【０８６０】説明ベクトル／スカラレジスタＲｂの内容はベクトル／スカ
ラレジスタＲａの内容から減算され、その結果はベクト
ル／スカラレジスタＲｄに記憶される。

【０８６１】演算例外オーバフロー、浮動小数点無効オペランドＶＳＵＢＳ減算及びセット

【０８６２】

【表２６９】

【０８６３】アセンブラ構文ＶＳＵＢＳ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＳＵＢＳ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝。

【０８６４】

【表２７０】

【０８６５】説明ＳＲｂはＳＲａから減算され、その結果はＳＲｄに記憶
され、ＶＣＳＲにＶＦＬＡＧビットがセットされる。

【０８６６】演算 Bop = ｛SRb ‖ sex(IMM<8:0>)｝; SRd = SRa - Bop; VCSR<lt,eq,gt> = status(SRa - Bop); 例外オーバフロー、浮動小数点無効オペランドＶＵＮＳＨＦＬアンシャッフル

【０８６７】

【表２７１】

【０８６８】アセンブラ構文ＶＵＮＳＨＦＬ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＶＲ
ｂＶＵＮＳＨＦＬ．ｄｔＶＲｃ，ＶＲｄ，ＶＲａ，ＳＲ
ｂここで，ｄｔ＝｛ｂ、ｂ９、ｈ、ｗ、ｆ｝。．ｗと．ｆ
は同一な演算を指定することに注意する。

【０８６９】

【表２７２】

【０８７０】説明ベクトルレジスタＶＲｂの内容が次に示した通りベクト
ルレジスタＶＲｃ：ＶＲｄにＲｂとアンシャッフルされ
る。

【０８７１】

【表２７３】

【０８７２】演算例外無し。

【０８７３】プログラミング注意この命令はエレメントマスクを使用しない。

【０８７４】ＶＵＮＳＨＦＬＨハイアンシャフル

【０８７５】

【表２７４】

【０８７６】アセンブラ構文ＶＵＮＳＨＦＬＨ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＵＮＳＨＦＬＨ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｗと．ｆ
が同一の演算を指定することに留意されたい。

【０８７７】

【表２７５】

【０８７８】説明ベクトルレジスタＲａの内容は下記に示すようにＲｂと
アンシャフル(unshuffle) され、その結果の上位部分は
ベクトルレジスタＲｄにリターンされる。

【０８７９】

【表２７６】

【０８８０】演算例外無しプログラミング注意この命令はエレメントマスクを使用
しない。

【０８８１】ＶＵＮＳＨＦＬＬローアンシャフル

【０８８２】

【表２７７】

【０８８３】アセンブラ構文ＶＵＮＳＨＦＬＬ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＵＮＳＨＦＬＬ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｗと．ｆ
が同一の演算を指定することに留意されたい。

【０８８４】

【表２７８】

【０８８５】説明ベクトルレジスタＲａの内容は下記に示すようにＲｂと
アンシャフル(unshuffle) され、その結果の上位部分は
ベクトルレジスタＲｄにリターンされる。

【０８８６】

【表２７９】

【０８８７】演算例外無しプログラミング注意この命令はエレメントマスクを使用しない。

【０８８８】ＶＷＢＡＣＫ再記録

【０８８９】

【表２８０】

【０８９０】アセンブラ構文ＶＷＢＡＣＫ．ｌｎＳＲｂ，ＳＲｉＶＷＢＡＣＫ．ｌｎＳＲｂ，＃ＩＭＭＶＷＢＡＣＫ．ｌｎＳＲｂ＋，ＳＲｉＶＷＢＡＣＫ．ｌｎＳＲｂ＋，＃ＩＭＭここで、ｌｎ＝｛１，２，４，８｝。

【０８９１】説明ベクトルデータキャッシュでＥＡによってインデックス
が指定されたキャッシュライン（ＥＡとタグが一致する
ものと反対）はそれが修正されたデータを含む場合、メ
モリにアップデートされる。もし１以上のキャッシュラ
インが指定される場合、次の順次的なキャッシュライン
はそれらが修正されたデータを含む場合、メモリにアッ
プデートされる。キャッシュラインの数は次のように指
定される：ＬＮ（１：０）＝００：１つの６４バイトキャッシュラ
インが記録される。

【０８９２】ＬＮ（１：０）＝０１：２つの６４バイト
キャッシュラインが記録される。

【０８９３】ＬＮ（１：０）＝１０：４つの６４バイト
キャッシュラインが記録される。

【０８９４】ＬＮ（１：０）＝１１：８つの６４バイト
キャッシュラインが記録される。

【０８９５】もし有効アドレスが６４バイトバウンダリ
になければ、それは６４バイトバウンダリに整列される
ように先に打ち切られる。

【０８９６】演算例外データアドレス例外無効プログラミング注意ＥＡ（３１：０）はローカルメモリのバイトアドレスを
示す。

【０８９７】ＶＷＢＡＣＫＳＰ臨時パッドからの再記録

【０８９８】

【表２８１】

【０８９９】アセンブラ構文ＶＷＢＡＣＫＳＰ．ｌｎＳＲｐ，ＳＲｂ，ＳＲｉＶＷＢＡＣＫＳＰ．ｌｎＳＲｐ，ＳＲｂ，＃ＩＭＭＶＷＢＡＣＫＳＰ．ｌｎＳＲｐ，ＳＲｂ＋，ＳＲｉＶＷＢＡＣＫＳＰ．ｌｎＳＲｐ，ＳＲｂ＋，＃ＩＭＭここで、ｌｎ＝｛１，２，４，８｝、ＶＷＢＡＣＫとＶ
ＷＢＡＣＫＳＰは同一の演算コードを使用する。

【０９００】説明臨時パッドからメモリに多数の６４バイトブロックを伝
送する。有効アドレスはメモリに開始アドレスを提供
し、ＳＲｐは臨時パッドに開始アドレスを提供する。６
４バイトブロックの数は次のように指定される：ＬＮ（１：０）＝００：１つの６４バイトブロックが記
録される。

【０９０１】ＬＮ（１：０）＝０１：２つの６４バイト
ブロックが記録される。

【０９０２】ＬＮ（１：０）＝１０：４つの６４バイト
ブロックが記録される。

【０９０３】ＬＮ（１：０）＝１１：８つの６４バイト
ブロックが記録される、もし有効アドレスが６４バイト
バウンダリになければ、それは６４バイトバウンダリに
整列されるように先に打ち切られる。もしＳＲｐの臨時
パッドポインタアドレスが６４バイトバウンダリになけ
れば、またそれは６４バイトバウンダリに整列されるよ
うに先に打ち切られる。整列された臨時パッドポインタ
アドレスは伝送されたバイトの数だけ増分される。

【０９０４】演算例外データアドレス例外無効ＶＸＮＯＲＸＮＯＲ（排他的ＮＯＲ）

【０９０５】

【表２８２】

【０９０６】アセンブラ構文ＶＸＮＯＲ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＸＮＯＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＸＮＯＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＸＮＯＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＸＮＯＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝。

【０９０７】

【表２８３】

【０９０８】説明ベクトル／スカラレジスタＲａの内容はベクトル／スカ
ラレジスタＲｂの内容に論理的にＸＮＯＲされ、その結
果はベクトル／スカラレジスタＲｄに記憶される。

【０９０９】演算 for(i=0:i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i] =｛VRb[i]‖SRb ‖sex(IMM<8.0>) ｝; Rd[i]<K>=-(Ra[i]<k> ＾Bop[i]<k>,for k =all bits in element i; ｝例外無しＶＸＯＲＸＯＲ（排他的ＯＲ）

【０９１０】

【表２８４】

【０９１１】アセンブラ構文ＶＸＯＲ．ｄｔＶＲｄ，ＶＲａ，ＶＲｂＶＸＯＲ．ｄｔＶＲｄ，ＶＲａ，ＳＲｂＶＸＯＲ．ｄｔＶＲｄ，ＶＲａ，＃ＩＭＭＶＸＯＲ．ｄｔＳＲｄ，ＳＲａ，ＳＲｂＶＸＯＲ．ｄｔＳＲｄ，ＳＲａ，＃ＩＭＭここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ｝。

【０９１２】

【表２８５】

【０９１３】説明ベクトル／スカラレジスタＲａの内容はベクトル／スカ
ラレジスタＲｂの内容に論理的にＸＯＲされ、その結果
はベクトル／スカラレジスタＲｄに記憶される。

【０９１４】演算 for(i=0:i < NumElem ＆＆ EMASK[i];i++)｛ Bop[i] =｛VRb[i]‖SRb ‖sex(IMM<8:0>) ｝; Rd[i]<k>=Ra[i]<k> ＾Bop[i]<k>),for k =all bits in element i; ｝例外無しＶＸＯＲＡＬＬ全てのエレメントＸＯＲ（排他的
ＯＲ）

【０９１５】

【表２８６】

【０９１６】アセンブラ構文ＶＸＯＲＡＬＬ．ｄｔＳＲｄ，ＶＲｂここで、ｄｔ＝｛ｂ，ｂ９，ｈ，ｗ，ｆ｝、．ｂと．ｂ
９は同一の演算を示す

【０９１７】

【表２８７】

【０９１８】説明ＶＲｂで各エレメントの最下位ビットは共にＸＯＲさ
れ、１ビット結果はＳＲｄの最下位ビットにリターンさ
れる。この命令はエレメントマスクによって影響を受け
ない。

【０９１９】演算例外無し

【図面の簡単な説明】

【図１】マルチメディアプロセッサにおけるベクトルプ
ロセッサのブロック図。

【図２】本発明の実施の形態によるマルチメディア信号
プロセッサのブロック図。

【図３】図１に示すベクトルプロセッサにおける命令取
出しユニットのブロック図。

【図４】図１に示すベクトルプロセッサにおける命令取
出しユニットのブロック図。

【図５】図１に示すベクトルプロセッサにおけるレジス
タ対レジスタ命令に対するステージ実行パイプラインを
示した段階図。

【図６】図１に示すベクトルプロセッサにおけるロード
命令の実行のための実行パイプラインを示した段階図。

【図７】図１に示すベクトルプロセッサにおける格納命
令語の実行のための実行パイプラインを示した段階図。

【図８】図１に示すベクトルプロセッサにおける実行デ
ータパスのブロック図。

【図９】図８に示す実行データパスにおけるレジスタフ
ァイルのブロック図。

【図１０】図８に示す実行データパスにおける並列処理
論理ユニットのブロック図。

【図１１】図２に示すベクトルプロセッサにおけるロー
ド／記憶ユニットブロック図。

【図１２】本発明の実施の形態によるベクトルプロセッ
サの命令セットのフォーマット図。

【符号の説明】

１００マルチメディアプロセッサ１０５プロセッシングコア１１０主プロセッサ１１５拡張レジスタ１２０ベクトルプロセッサ１３０キャッシュサブレジスタ１４０システムバス１４２システムタイマ１４４全二重ＵＡＲＴ１４６ビットストリームプロセッサ１４８インタラプトコントローラ１５０システムバス１５２デバイスインタフェース１５４ＤＭＡコントローラ１５６ローカルバスコントローラ１５８メモリコントローラ１６０，１９０ＳＲＡＭ１６２，１９２命令キャッシュ１６４，１９４データキャッシュ１７０ＲＯＭ１８０キャッシュコントロール２１０命令取出しユニット（ＩＦＵ）２２０デコーダ２３０スケジューラ２４０実行データパス２５０ロード／記憶ユニット（ＬＳＵ）６１０レジスタファイル

Claims

【特許請求の範囲】

【請求項１】ベクトルレジスタを含むレジスタファイ
ルと、命令を復号化する間レジスタファイルから選択されたベ
クトルレジスタを識別し、命令を実行する間処理される
データエレメントに対するサイズを識別するデコーダ
と、ベクトルレジスタに接続された処理回路とから構成さ
れ、前記処理回路は命令の実行時、選択されたベクトル
レジスタのデータに対する多数回の並列演算を行い、並
列演算の数はデータエレメントのサイズによって制御さ
れることを特徴とするベクトルプロセッサ。
【請求項２】各ベクトルレジスタは固定サイズをもっ
ていることを特徴とする請求項１記載のベクトルプロセ
ッサ。
【請求項３】デコーダの識別可能なサイズは８ビッ
ト、９ビット、１６ビット、及び３２ビットであること
を特徴とする請求項１記載のベクトルプロセッサ。
【請求項４】命令を復号化する間、デコーダは命令の
実行中に処理されるデータエレメントのタイプを識別す
ることを特徴とする請求項１記載のベクトルプロセッ
サ。
【請求項５】デコーダの識別可能なタイプは整数と浮
動小数点データ型であることを特徴とする請求項４記載
のベクトルプロセッサ。
【請求項６】ベクトルレジスタにデータを記憶する段
階と、ベクトルレジスタを識別するレジスタ番号とベクトルレ
ジスタでデータエレメントに対するサイズを識別するサ
イズフィールドとを含む命令を形成する段階と、多数の並列演算を実行することにより命令を実行する段
階とから構成され、それぞれの演算はベクトルレジスタ
のデータエレメントに対応し、サイズフィールドは並列
に実行される演算数を制御することを特徴とするベクト
ルプロセッサの演算方法。