JPH02146668A - コンピュータ・システム - Google Patents

コンピュータ・システム

Info

Publication number
JPH02146668A
JPH02146668A JP1069401A JP6940189A JPH02146668A JP H02146668 A JPH02146668 A JP H02146668A JP 1069401 A JP1069401 A JP 1069401A JP 6940189 A JP6940189 A JP 6940189A JP H02146668 A JPH02146668 A JP H02146668A
Authority
JP
Japan
Prior art keywords
data
register
processor
control
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1069401A
Other languages
English (en)
Inventor
David R Baldwin
デイヴィッド ロバート ボードウィン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3DLabs Ltd
Original Assignee
DuPont Pixel Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB8806862A external-priority patent/GB2217062A/en
Priority claimed from GB8806866A external-priority patent/GB2215881A/en
Application filed by DuPont Pixel Systems Ltd filed Critical DuPont Pixel Systems Ltd
Publication of JPH02146668A publication Critical patent/JPH02146668A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • G06F1/08Clock generators with changeable or programmable clock frequency

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
著作権の一部放棄 本特許出願におけるすべての材料は、英国、米国および
その他の国々の著作権法に基く著作権による保護に服す
る。本出願の最初の有効な出願日を以て、本出願の材料
は未公開の材料として保護される。 しかしなから、この材料を複写することは、特許書類あ
るいは特許開示が英国あるいはその他の国の公的な特許
出願書類あるいは記録において現れてくるものとして、
たれもがファクシミリ再生すルコトニ著作権者は異議を
唱えないという範囲内において、許可される。しかし、
その地点においては、著作権者はどのようなものである
かすべての著作権を留保する。 [産業上の利用分野コ 本発明は、コンピュータ・システムおよびサブシステム
、およびコンピュータを利用したデータ処理方式に関l
し、特にタイミング制御の改良されたコンビコータ・シ
ステムに関するもの゛(ある。 [従来の技術] 高速マルチプロセッサ・アーAテクヂャ並列に動作する
複数のプロセッサを使用することは、これまで、非常に
高いスルーブツトを達成するための便利な方法であると
認識されてきた。 このようなアーキテクチャか数多く提案さJ]ている。 しかし、このJ:うなアーAデクヂャを実際:ζ実現す
ることは非常に困MIIである。特に、広範囲にわたる
ユーザの要求を満足し、技術進歩を取り入れることかて
きるような、非常に多様性のあるこの種のアーキテクチ
ャを段別することは困2tlである。 完全に非同期のマルチプロセッサ・アーキテクチャは提
案されてきたか、マルチプロセッサ・アキテクヂャにお
りるプログラミング支援の問題は殆ど解決されていない
ことはこの分野において般に認識されている。 マルチフロセッサ アーキテクチャに関連する部の問題
、「、りのこく最近の概要か、雑誌Computerの
1988年2月号の9ベージのD ubois他著、”
5ynchronization 、 Coheren
ce 、 and EventOrdering in
 Multiprocessors ”に示されている
。この文献は引用することて木明細書の一部とする。ま
た、ディジタル信号処理のために最近提案されたマルチ
フロセッサノ・アーキテクチャについて、眉I誌(:o
+1puLcrの1988年2月号の47ペーシ、La
nge他著、”An  Optimum Parall
elArClllLeCjljrQ for 111g
1l 5peed Real−Tlme DlglLa
l  Si);nal  Processing ” 
に説明されている。 この文献は引用することで木明細書の一部とする。 待ち°°状態信号または“プロセッサ・レディパ状態信
号を使用している。これらの(8−QにJ、どのフロセ
ッサからもセットしたり、クリアできる。 (このような信4すは一般に“セマフォ“と[i干ぶ。 ) (す]余白) プロセッサ間同期 プロセッサ間の同期は、非常に広範囲にわたるマイクロ
フロセッサ・システムで常に重要な問題であると考えら
れている。このようなプロセッサ間インタフェースは、
多くの場合、゛プロセッサ入出力管理 スーパーコンピュータ・システムやメインフレーム・シ
ステムでは、これまで、インタフェース・コントローラ
と少なくとも1つの他のプロセッサを使用するたけてな
く、独立した人出カプロセッサか使用されてきた。この
ようなシステムは多くの場合、いろいろな特殊作業を処
理するために、多彩な専用プロセッサを使用する。 最近では、このような入出カプロセッサがボート・レベ
ルの数値処理サブシステムでも使用されるようになって
きた。たとえば、 Mercury Computer Systemsは
、浮動小数点プロセッサと非同期的に動作する、独立し
たデータ転送プロセッサを備えたシステム(Z jp3
232)を発表した。 専用ハードウェア・アーキテクチャ 多くの専用プロセッサ・アーキテクチャが提案されてお
り、これらのアーキテクチャは特に、特定のアプリケー
ションにとって便利である。しかし、このような専用ア
ーキテクチャを汎用数値処理アーキテクチャに統合する
方法については、あまり注意が払われていない。また、
アルゴリズム固有のプロセッサのための汎用インタフェ
ース管理についても、あまり注意は払われていない。 [発明の要約] 本出願には多くの革新的教示が述べられており、これら
を第1図に示すようなシステムをもとに説明するものと
する。 多くの革新的教示の中で、ここでは特に、2つのプロセ
ッサがどちらも共有された可変時間クロックを採用して
いるシステムについて述へる。 (第1図の実施例では、制御プロセッサ110とデータ
転送プロセッサ120がこの方式でクロックを共有して
いる。)したがって、制御プロセッサ110とデータ転
送プロセッサ120は、別々の命令ストリームを同時に
実行する場合でも、同期をとりながら動作できる。明ら
かに、一方のプロセッサが短いサイクル時間を要求した
場合には、もう一方のプロセッサか要求した長い時間を
生成するために、−時的にクロックの速度が遅くなった
ときに、短いサイクル時間を要求したプロセッサは効率
か低下する。しかし、大部分のインストラクションは短
いサイクル時間を要求するため、この効率の低下はわず
かである。 さらに、別のレベルのオービトレーション機能も提供さ
れる。制御プロセッサ110には、キャッシュ・メモリ
140をアクセスするための優先順位が与えられる。つ
まり、データ転送プロセッサ120は、キャッシュ・ア
クセスを実行する前に、キャッシュ・アクセスか制御プ
ロセッサ110によって割り込まれていないかどうかを
必ず確認しなけれはならない。しかし、ロック・アウト
を防止するために、データ転送プロセッサ120には、
割り込み信号か与えられており、制御プロセッサ110
に刻して、少なくとも1サイクルの間たけ、キャッシュ
・ボート142の制御を解放するように要求することか
てきる。 ここてはさらに、革新的教示として高速数値プロセッサ
にお番プる新しいアーキテクチャ(ロシ・ツタ・ファミ
リの新しい割り振りを基礎にしたもの)について述べる
。第4A〜4D図の実施例では、TTLポート・アーキ
テクチャてECLか使用されている。ECLは3つの重
要な場所て使用されている。 高速数値演算モジュールのクロックは、ECLロジック
を採用した゛°スマート°クロックであり、算術演算ユ
ニットが実行する個々の命令に応じて、サイクル単位て
クロック時間を調整する。 数値処理モジュールの外部の低速ロジックとの同期をと
り、演算ユニット(たとえばALUや乗算器)が受は付
番プることがてきる最大クロツタ速度に匹敵する周波数
で小さいサイクル(またはクロック゛ビート°°)を持
つ状態変化クロック・ドメインを提供するために、EC
L転送りロックを使用している。この場合も、これはか
なり機能の高いクロックであり、システム・クロック・
サイクル間で重要なロジック操作を実行する。 演算ユニットは、ECL内部データ・パスとTTLイン
タフェースを備えている。 この技術側り振りは、特定の演算ユニットから最大限の
速度を引ぎ出すとぎに有利であるはかりでなく、非常に
柔軟なりロック・1−メイン境界を越えて(数値処理モ
ジュールとシステムのほかの部分の間て)非常に効率の
よいデータ転送バスを可能にするためにも有利である。 もちろん、本発明によって可能になる革新的サブシステ
ムの利点は、全体としてのコンピュータ・システムにと
っても有利な点である。さらに、ここで述へる革新的開
示の多くは、第1図に示すような独立したサブシステム
を含まないコンピュータ・システムにも採用でき、もっ
と単純なスタンドアロン構造のコンピュータ・システム
にも採用できる。 (以下、第101頁に続く) [実施例] υ下、図面を参照して本発明の実施例を詳細に説明する
。 (11次) 実施例091.。、、、、、、、、、、、、、、、、、
、、、、、II2概要説明 、、、、、、、、、、、、
、、、、、、、、、、、、、、、l12設51目標、、
、、、、、、、、、、、、、、、、、、、、、、、、、
121アルゴリズムの分割 、、、、、、、、、、、、
、、、、、122アーキテクチヤの説明 、、、、、、
、、、、、、、、、+25cp千ジユール110の概略 (第2八図)  、、、、、、、:、、、、、、、、、
、、、、、、、126DTPモジユール120の概略 (第n図)  、、、、、、、、、、、、、、、、、、
、、、、、、128FPモジユール130の概略 (第4八−4C図)  、、、、、、、、、、、、、、
、、、、、、131DCMの概略 (第5図) 、、、
、、、、、、、、、、、134CM+90の概略、、、
、、、、、、、、、、、、、、’、、、、、137外部
インタフェースの概略。、、、、、、、、139制御プ
ロセッサ(cp)モジュール110、、、.142整数
プロセッサ機構(IPll)240.、、、、、、、、
.150ア(〜17ス生成機構(八G)230、、、、
、、、、、、、.1.52シーケンザ210 と関連支
援ロジック  155割込の     −6,、、、、
、,158浮動小数点プロセッサ(一般)(+61)条
イと1コー1〜・ロジック、、、、、、、、、、、、、
、1fi3マイクロ・アF lノス・ハス  、、、、
、、、168定数フイール)〜 、、、、、、、、、、
、、、、、、、、、I70書込み可能制御記憶機構(W
C5)220.、、、、、l71WCSインタフエース
・レジスタ 222と223  、、、、、、、、、、、、、、、、
   、.172Fl’制御ロジツク その他のロジック 、、、、、、、、、、、、、、、、
、、、175干−1〜・レジスタ203 (1751:
CDハス・デコート・ロジック(176)クロック発生
機構25θ 、、、、、、、、、、、、、、、+78デ
バツグ・バー1−ウェア 、、、、、、、、、、、、、
184マイクロコ一ト語の形式、、、、、、、、、、、
、、、185データφ云送フ゛ロセツサ・モシコーール
120、.198データ転送の制御 、、、、、、、、
、、、、、、、、、201整数ブロセッザ機構340、
、、、、、、、、、、、、.208シ〜ケンヅ3]0 
ど関連支援ロジック、208割込の         
0.、、、、、、、、、.2011011条件コル1ジ
ック  、211 マイクロ・アドレス・ハス311、、、、、.2]1i
1/次アドレス・フィールF、、、、、、21[iマル
ヂウエイ分岐0.−、、、、、.216書込み制御記+
Q機構(WC5)320.、、、、、、、、.220D
M八コントローラ  、、、、、、、、、、、、、、、
、221その他のロジック0.、、、、、、、、、、、
、、.221モー]・・レジスタ(221)、TDババ
スコード(222)、クロック発生 機構(224) デパック・へ−]・ウェア  、、、、、、、、、、2
24マイクロコ一ド語の形式、、、、、、、、、、、、
、225マイクロコード拡ジ長バス、、、、、、、、、
、、、、、233数値プロセッサ・モジュール130、
、、、、、、.234浮動小数点算術演勢−機構(FP
LI) 、、、、、、、、238算術計算機構4110
と450、、、、、、、、、、、.239スクラッヂパ
ット・メモリ1610.、、、、.244高速レジスタ
・ファイル430、、、、、、、.24[i2重バッフ
ァリング    、252 非レジスタ・ヒラ]〜のセノトアッフ 時短 、、、、、、、、、、、、、、、、、、、、、、
、 59ギヘ・ソシュ・ハス・インタフェース と制御 、8998.43、.262 保持レジスタ420、、、、、、、、、、、、、、、、
、.262データ・キャッシュ転送ロジック  263
局所転送ハス制御ロジック(264) 転送りロック発生機構412(264)制御信号(26
9) 転送の制約条件(倍語構造) 、、、、、、、、273
保持レジスタ/転送りロック動作、、、、278FPプ
ログラム制御 マイクロ命令順序付Cプ(27!l);スタック・レジ
スタ47B (281)サブルーチンの動作(283)
、クロック発生機構480 (283) 、マイクロコ
ード短縮(286)、マイクロコートの並列ローF (
289) :Fl+マイクロコート・ルーチン実行の始
動(291) 「1゛モジユールのj巽択(292)、制御レジスタ(
2941 マイクロコート語の形式。 プログラムの流れの例。 デバッグ・ハードウェア 。 アプリケーション向きプロセッサ・ 千ジュール130’。 FFT高速化モジュール。 データ・キャッシュ・メモリ・ モジュール140 メモリ構成、。 データ・ボート cp転送ロジック DTP転送ロジック540、、、、、、−。 仲裁ロジック535 コマンド・メモリ+90 、、、。 ポスト・インタフェース・ロジック160物理的バス線
とのインタフェース バス・コントローラ[i50 (343) :マスタ・
モートとスレーブ・ 、30工 :109 、、、.310C 、,333 、338 ,340 干−1〜(345)、データ・バッファ620 (34
7) 、アドレス・バッファ[i30 (31) VMEインタフェース・メモリ560、、、、、.34
7メモリ・マツプ 、、、、、、、、、、、、、、、、
、、、、347データFIFO1i70.、、、、、、
、、、、、、、、、、、、、、.350VMに1割込み
ロジック680、、、、、、、、、、、、、.351D
M八コンi〜ローラ640、、、、、、、、、、、、、
、、.351マイクロコート・ロー1〜制御 ロジック610、、、、、、、、、、、、、、、、、、
、、、、、.354レジスタ・ブロック612、、、、
、、、、、、、、、.355制御レジスタ・ビット(3
55); ストローブ・バッファ(358)。 状況レジスタ(360) ;wcs制御レジスタ(35
1) ;wcsデータ・レジスタ(31i6) 、CP
マイクロアドレス・レジスタ(357)。 DTPマイクロアドレス・ レジスタ(367) データ・バイブ・インタフェース PAL;216 (41,0) ; マルチウェイ分岐
アドレス指定1’A1217 (4+ 1)データ人力
条件コート選択PAL(4+2)DTP  と I/F
  PAL  、、、、、、、、、、、、、、、、、、
、、lI12VME 7トレス・デ:7− F PAL
(413)DMA FIFoa大況どクロック制御Pへ
L(4]3) 、VME読取りと書込みデコートPへL
811F’11/l) 、VME スレーブ・アクセス
・タイミングFAI、(4i41信号ループ制御PA1
.(415) DCMとDCM T/F PAI、 、、、、、、、、
、、、、、、、4180CMアドレス・デコードPA+
、(418)。 DCM保持レジしタ制御PAL(419)。 DCM書込みフラグ・レジスタ PAI、(421)、FP書込みマスクPへL(423
)FP  PAI、      、、、、、、、、、、
、、、、、、、、、、、、423WCSロート・イネー
ブルPAL(423) ;ポス]・−ソース・モジュー
ル 選十尺PへL (423) 、 CPモジュール選択T
’AI、(425) 、FP−WC5制御1’A1.(
426)ロジック+50、、、、、、、、、、、、、、
、、、、、、、、、、、.369画像ブロセッザ・イン
タフェース170、、、.373直列ループ・インタフ
ェース      376制御記憶機構とのループ・ インタフェース、、、、、、、、、、、、、、、、、、
、、、、37フルーブ制御   、、、、、、、、、、
、、、、、、、、、、、378ループ・トポロジ   
 、、、、、、、、、、、、、3111ポストとのルー
プ・インタフェース  386DTPマイクロコート拡
弓長ル−プ、、、、、、、、386並列マイクロコート
・ローディング  、387モジユール拡弓長オプショ
ン、、、、、、、、、、、、、、391モジユール接続
 、、、、、、、、、、、、、、、、、、、J92多重
数値処理モジュール、、、、、、、、、、、、、、39
4キヤツシユ・メそり拡張、、、、、、、、、、、、、
399物理的および電気的実装ボード 、、、、、、、
、、399PAL実装、、、、、、、、、、、、、、、
、、、、、、、、、、、、405CP PAL、、、、
、、、、、、、、、、、、、、、、、、、、、、、、4
01iクロツク波形生成PAL250 (405) 。 CDバス・ソースPへ1、(408);CDパス宛先P
AI、(409)、符号/ゼロ拡張ハン1〜シェーク・
ロシ・ツク1)八L(428)割込み捕捉I’AL(4
32); マイクロアドレスとクロック制御 PAL(432);直列/並列ロート 選択PAL (433) ;cp書込みデコートPA1
.(434) ;cp読取りデコーI〜PAL(435
);保持レジスタ制御 PA1.46+ (431i) 、保留レジスタ開始ア
ドレスPAL(439) 、レジスタ・ファイルWE制
御(439);レジスタ・ファイル・アドレス修丘■へ
L(440);レジスタ・ファイル・アドレス 増分機構(441):データ有効性制御PAL (44
2) ;マイクロ命令アドレス選択PAL (4421
;^LU問題状況PAL(443)スタック制御PAL
3910 (444) ;レジスタ・ファイル・アドレ
ス 修飾子PAL (445) ;結実用バス制御PへL(
447) ;VME割込みPAL (4−18)DMA
/VME スフ−−1−・7 シン(449) :DM
Δアドレス制御(452)8割込み縁111目足 F4
52) GIPマイクロコ−1〜・デコー1〜 (453八)、G11’割込みマスク(45311:l
G11”割込みステー1−・マシン(454)ホスト・
コンピュータ、、、、、、、、、、、、、、、、、、4
54ポストどのハス・インタフェース、456画像プロ
セッサ・サブシステム 、、、、、、、457システム
の動作、、、、、、、、、、、、、、、、、、、、、、
、459ザンブル動作の実現、、、、、、、、、、、、
、、、、、、1I59物理メモリ・モデル (CP/DTP間のやりとり) 、、、、、、、、、、
、、、、461仮想メモリ・モデル、、、、、、、、、
、、、、、、、、470cpとFP間のやりとり、、、
、、、、、、、、、、、、、、、47Bソフトウ工ア階
層、、、、、、、、、、、、、、、、、、、、484ア
プリケーシヨンとライブラリ ソフトウェア、、、、、、、、、、、、、、、、、、、
、、、486装置トライバ、、、、、、、、、、、、、
、、、、、、、、487マイクロコート監視ルーヂン、
、、、、、、、489マイクロコー1〜転送ルーヂン+
DTPI 、、491マイクロコー1〜転送ルーチン(
C+’)、、、、4!12v イクC1コ−F 1il
r’;iルー −1−ン(肝) 、、、、<。 短縮マイクロコー 、、、、、、、、、、、、、、、、
、、1195マルチウ工イ分岐    、、、、、、、
、、、、、49[i離散フーリエ変換実装、、、、、、
、、、、、、、、、、、、497多重FPモジュール付
きFFT 、、、、、、、、、、、、503バタフライ
泪算スルーブツh (504) 。 転送パン1〜幅(505) ヒストダラム・アルゴリズム実装 、、、−,509プ
レビユー・モートのパイプライン方式%式% 本田L9fiの砂多くの新規な開示技術について、本発
明の好適実施例にq7jに関連つりて説明するか、これ
らの新規開示技術は、ポスト・コンピュータの指示を受
りてオi動して高速数値甜算を処理するサブシステムの
特有の問題に応用できる利、壱かある。(この種のサブ
システムは一般に「高速化ポー1、」と119はれてい
る。)しかし、本実施例は、本明細書に記載されている
新規開示技術の多数の有利な用途の1つの例にすきない
ことは勿論である。例えば、本明細書に開示されている
各種アーキテクチャ上の新規技術は、広範囲にわたるコ
ンピュータ・システムに任意選択的に応用が可能である
。一般的に、本明細書に記載されている内容は特許請求
の範囲に記載の様々な発明の範囲を必ずしも限定するも
のではない。さらに、記載内容によっては、本発明の特
徴事項に適用されるものと適用されないものとかある。 概要説明 以下では、第1図に示すものと同じシステムの実施例(
または第I、10.41、または4;)図に示す代替実
施例)に4.1丁に関連つりて本発明を説明−・j−る
ことにする。こわらの実施例の4.5微生項GJ木発明
の必須事項のすべてであるとは限らず、好適実jjil
i例を説明するために便宜的に示しノこものである。 第1図は、数値処理シスう′ムのアーキテクチャを示し
た概念図であり、通常大型コンピュータ・システムのサ
ブシステムとして使用されるものである。第1図に示す
ようなシステムは一般に「高速化ボート」と呼ばれてい
る。これらは通常サブシステムとして使用されている。 つまり、監視プロセッサから高水準コマンドかこの高速
化サブシステムに与えられる。例えば、監視プロセッサ
は高速化サブシステムにベクトル加算、行列反転、高速
フーリエ変換(FFT)の実行を命令することかできる
。高速化サブシステムはこの命令を受けて監視プロセッ
サか指定した記憶位置からデータを取り出し、数値処理
操作を実行し、その結果を監視プロセッサに返却する。 第1図は、3つの異なるプロセッサ・干シュールか67
、jす、そのすべてか77なるタスクを同時並行1・ご
実行−Cきるアーキテクチャをホしている。こl11ら
の3モジJ1−ルどは、制御プロセッサ(C11)モジ
コール110、データ転送プロセッサ(DTP)干ジュ
ール1.20.数値処理モジュール130である。 (この数イ[1”!処理モジこ1−ルは浮動小数点処理
モジュールであることか好ましく、従)てこのモジーL
−ルiJ ” +(’ ”モジュールと呼C」れること
か多い。数値処理モジュールは、以下で説明するように
、他にも各種タイプのものが使用可能である。)数値処
理モジュール130は他の2つのプロセッサと非同期に
、つまり、完全に独立したクロックで稼動する。さらに
、外部インタフェース150.160,170,180
にも相当量のロジックが備わっている。 データ・キャッシュ・メモリ140の構造と、システム
内の他のブロックとの関係は非常に重要である。データ
・キャッシュ・メモリ+40は広幅キャッシコ・ハス1
44 を経由して浮動小数点プロセッサ130に結ばれ
ている。好適実施例では、キャッジ−2ハス144L;
l、データ川に丁・約t(れた256木の物理線から構
成さ、11でいる。 これらの3種類のプロセッサ・モジ:I−ルはタスク割
振りを容易にする。タスク割振りは基本的には次のJ:
うに行なわれる。 データ転送プロセッサは、外部インクフェースを通して
外部世界とのインターフェースを管理すると共に、キャ
ッシュ・メモリと外部世界との間のデータ転送を取り扱
う。 制御プロセッサ110はアI−レス泪算を行ない、数値
処理モジュール130との間で送受されるすへてのデー
タ転送を制御する。 数値処理モジコール130はデータ計算を行なう。 このタスク割振りを効率よく、高速にサポートするシス
テムを段別するためには、いくつかの重要なアーキテク
チャ上の問題を解決する必要がある。しかし、本発明に
よれは、これらの問題か解決され、驚異的な成果か得ら
れる。 かかるアーキテクチャの実現を容易にするために、第1
図の実施例ては、汀目ずへきハードウェア機構かいくつ
か設りられでいる。第1G:1、制御プロセッサ110
に、アドレス言1■「、 lV7作のための強カッ、1
機能をもたせたことである。好適実施例では、第2図に
概要を示すように、このプロセッサはシーケン→)”た
りてなく、ア1−レス生成ロジンクと鉾術論理演算機構
(ユニツ1−)(A1.U)も備えている。 データ転送プロセッサ120は外部インフッニス・コン
トローラの動作を監視する。好適実施例では、外部イン
タフェース・コン]・ローラは実際には3つ設りられて
いる。つまり、VMEハス・インタフェース160と、
2個のバックブレーン・バスに対する制御装置である。 (一方のバックブレーン・ハスは「データ・パイプ」で
あり、高速化ボート間を高バント幅リンクで結ぶもので
ある。もう一方はrGIPバス」であり、画像や図形デ
ータの伝送を最適化するものである。)これらの3つの
ハス・インタフェースの各々は、独自の制御ロジックと
好ましくはコン1−ローラを備えている。イ列えば、V
Mliハス・インクフェース(J)゛j’1ツク・デー
タ転送を高速化するために、的接メ」ニリ・アクセス(
DMA)コンI−ローラを(jfiλている。 しかし、データ転送ブロセソ4月20はこれらのインタ
フェースを高度に監視する機能を備えてし入る。上記ア
ーキテクチャの最も重要/J部分はA・vッシュ・メモ
リNOである。この大ヤツシコ・メモリは幅か広((2
56ヒツト幅)、大容量であり(少なくとも2メガバイ
l−)、高速であるが(現構成ではアクセス時間が10
0ナノ秒であり、より高速化することが好ましい)、そ
れたりてなく3つのポートを備えて効率化を図っている
。このメモリは物理的には2ボートだりにするのか好ま
しく、制御プロセッサ110とデータ転送プロセッサ1
20間の仲裁はそれぞれのマイクロコート命令方式で行
なわれる。 さらにン主目すべきことは、キ・ヤツシュ・メモリ14
0の3ボートが全く異なることである。−数的に、大部
分の数値処理サブシステムでは、キヤ・ンシュ・メモリ
と数値処理構成機構(ユニ・ント)間のパン1−幅かJ
口°;5に重要になっ′Cいる。従って、好適実施例で
は、数値プロセッサにつながるボ1〜は制御プロセッサ
どデータ転Jxブロセッザにつノ1かるボー i・より
も幅か広くなっている(従9て、パン1〜幅か広くなっ
ている)。好適実施例では、後者のボー1−はわすか3
2ヒツト幅である。さらに、完全並列レジタ群か32ヒ
ツト・ボートで使用さねているので、これらのボートに
対するすへてのアクセスはキャッシュ・メモリ】40か
らは完全に並列、つまり、256ビツト並列読取りまた
は書込みとして見えるようになっている。 数値処理モジュール130とのインタフェースは、複数
のモジュール130かすへて1つの制御プロセッサの制
御を受りて並列に使用でき、すべてか(好ましくは)1
つのデータ・キャッシュ・メ干り140をアクセスでき
るように定義されている。キャッシュ・ハスの幅を極端
に広くすることは、この複数モジュール機能を実現する
上で重要な要因となる。 制御プロセッサ110とデータ転送プロセッサ・モジュ
ール120間のインタフェースにtハキャッシ:Iを効
率J:<利用てぎる重要な機能を備えCいる。好適実施
例ては、重要ノよ機能のいくつか(」、このやりとりの
利点を向上する/ごめV使用ざJlている。第1は、多
重プログラミング ブロモジ”)では普通に行なわれて
いることであるか、制御プロセッサ110とデータ転送
プロセッサ120か共に可変継続時間命令を使用してい
ることである。つまり、ある種の命令タイプは、他の命
令タイプよりもサイクル時間を大幅に長くする必要があ
る。 例えば、極端な例として、ノー・オペレーション命令や
無条件ブランチは、乗算命令よりもCP11時間を大幅
に少なくする必要がある。従って、可変継続時間クロッ
クを使用してプロセッサの制御を行ない、実行中の命令
をクロック発生装置にヂエックさせて、クロック時間間
隔の継続時間をそのチエツク結果に応じて高速に調整す
ることが一般化されている。 本好適実施例では、制御プロセッサ110どブタ転送プ
ロセッサ+20は共に共用可変継続時間り0ツクにより
りVjノックどられる。i+Y=って、制御フ゛ロセッ
リ+10 どデータ11云送ブロセッザは、たとえ別々
の命令スI・リームを同時に実行中であっても、同期し
て稼動するようにイネーブルされる。 制御プロセッサ110にキャッシュ・メモリ140への
アクセス優先1uか与えられている。つまり、データ転
送プロセッサ120は、制御プロセッサ110か先に二
vヤッシュをアクセスしていないことを確かめてからキ
ャッシュをアクセスする必要がある。しかし、ロックア
ウトを防止するために、データ転送プロセッサ120は
割込の信号を出して、制御プロセッサ110が少なくと
も1サイクルの間キャッシュ・ボートの制御権を解放す
るように指示することができる。 これらの3種類のプロセッサ・モジュールは、以下の説
明で略語を用いて弓用することがある。 例えば、データ転送プロセッサ・モジュール120て実
行されるマイクロコードはDTPマイクロコートと呼ぶ
場合かある。同様に、制御プロセッサllOで実行され
るマイクロコートはCPマイクロコートと、数値処理モ
ジュール130てフ、行されるマイクロコ−F ij:
 I’PマイクロコーI・ど叶ふ場合かある。これらの
略語は他の機能についても用いられている。 設84目才票 本好適実施例のサブシステムは、小型化され、低コスI
−であるか、高度の浮動小数点数値処理性能をもつ段別
になっている。 このサブシステムを使用するために2つのシステムが目
標となっている。このサブシステムは、広範囲にわたる
汎用ホスト・コンビコータで浮動小数点高速化機構(ユ
ニット)として使用するのに適している(特に、UNI
Xエンジンと互換性をもたせることが望ましい)。 また、第1図の高速化システムは、特殊画像処理システ
ムで利用すると大きな利点が得られるように意図されて
いる。この種のシステムの例としては、ベンチマーク・
チクノロシーズ社から提供され、rGIPシステム」と
呼ばれる図形画像処理システムがある。(crpシステ
ムは広範囲にわたる図形画像アフリゲージ3ンて冒スル
ーブソI〜か911らねるようにするいくつかの機能を
備えている。)第1.9Δ、10.43図などに示され
ているような高速化リブシステムな備えたこの種のシス
テムは、3次元図形アルコリズムを実行させる上で特に
利点がある。 アルコリズムの分割 以下では、第1図のアーキテクチャについてさらに詳し
く説明するか、その前に、この多重プロセッサ構成がど
のように使用されるかについて説明することにする。 上述したように、大部分のアルゴリズムは4つの独立部
分、つまり、制御、データ人力、アドレス計算、および
データ計算に分けることができる。 これらを個別タスクとして扱い、3つのプロセッサにマ
ツピングするようなアーキテクチャにすることか好まし
い。制御とアドレス計算は制御プロセッサ(C,P)干
ジュール110か取り扱い、データ入出力タスクはデー
タ転送プロセッサ(DTP)モジコール120か取り扱
い、データ;;1綽はr′/勅小数111ブロセソ4)
(FI))干シコール+30か取り扱う。 アル:プリズムを制御プロセッサ・士シー1−ル110
 とFP間でどのように分割ざ第1るかill、いくつ
かの特定アルゴリズム実装例を示して、り下に1−Yし
く説明する。1つの好例は、第31図を参!1ζ(して
上述する高速フーリエ変)M(FFT)実装によるもの
であるが、このFl・Tアルゴリズムはプログラミング
効率が悪いことでよく知られている。 この例では、FFTアルゴリズムは、データ・サンプル
とフェーズ係数のアドレス計算を制御プロセッサ・モジ
ュール110に割り当て、バタフライ計算を浮動小数点
プロセッサ・モジュール130に割り当てることによっ
て、制御プロセッサ・モジュール110と浮動小数点プ
ロセッサ・干ジコール130間で分割されている。 FFTソフトウェアのうちCPモジュール110で実行
される部分は、複素数データのアドレスをステージとバ
タフライ数の関数として計算する。複素数フェーズ係数
はテーブルに保持されているのて、そのソフ1へウェア
部分はテーブル内の必要とする位114′も、ステージ
とバタフライ数の関数として馴算する。アドレスが計算
で求まると、データと係数か取り出されて、浮動小数点
プロセッサ・干シュールエ3oに渡される。/乎動小数
、壱プロセッサ モジュール130かバタフライ計算を
完了すると、制御プロセッサ・モジコール月0はその結
果を読み取り、格納してから次のバタフライのアドレス
計算を繰り返すことになる。?J:[1ずへきことは、
制御プロセッサ・千ジュール110は、実際に行なわれ
ているバタフライ計算を追跡する必要がなく、データを
同期点て浮動小数点プロセッサ・モジュール13[1と
やりとりするだけてよいことである。また、このソフト
ウェアは、アドレスを計算するだけてなく、キャッシュ
・メモリと数値プロセッサ間の実際のデータ転送を制御
することもイ主目すべきである。 FFTソフトウェアのうち浮動小数点プロセッサ・モジ
ュール130て実行される部分は、各連続ステージでデ
ータ・セットのバタフライ言]算を行なうJ二うに直線
的にコーディングされた!1純命令列によってバタフラ
イ4算を行なう。各ステージでの正確なデータと係数を
得るために必要な複層1.72アドレス81算は関知し
ない。従フて、データ泪算のためのコートは、データ転
送操作ど)1((関係に111くことができる。事実、
浮動小数点プロセッサ・モジュール130に別の段別を
採用したい場合(例えば、異なる浮動小数点チップ・セ
ラ1−を使用したり、FFTにより適した低レベル・デ
ータ通路アーキテクチャを使用したりする目的て)は、
このソフトウェア部分(比較的単純化されている)を変
更するだけでよい。 CPとFPソフトウェアの実行は並列に行なわれ、アル
ゴリズム実行速度が低速部分によって決まるようにバイ
ブライン化されている。 アーキテクチャの説明 第1図のサブシステムの主要部分のいくつかについて、
以下詳しく説明する。なお、ここでは、要約だけを説明
していることに注意されたい。もっと詳しい説明はその
あとて行なう。 (:1)モジーC−ル110の概略(第2八図)制御ブ
ロセソ′11((汗)モジv−jli I 10 !!
、32ヒツト整数プロセッサ機構(ユニッl−) (I
PIJ)240、マイクロコート・シーケンサ210、
 アドレス生成機構(ユニッl−) (AG)230、
その他マイクロプログラム・メモリ、クロック発生装置
、ハス制御といった機構(ユニッ1へ)から構成されて
いる。 好適実施例では、整数プロセッサ機構240はWc1t
ek XL8137を使用し、シーケンサ210はAn
alog Devices社製八〇5P−1へ旧を使用
し、アドレス生成機構230はAnalog Devi
ces社製ADSP−1401を使用している。当業者
ならば容易に理解されるように、これらに代えてその他
の各種構成要素を使用することも、他のブロックに同等
の機能をこれらに代えて組み入れることも可能である。 制御プロセッサ・モジュール110は次の2つの主要タ
スクを受は持つ。 まず、ポストからのコマンドを解釈し、DTPモジュー
ル120に転送を要求し、データ計算を開始する前に浮
動小数点プロセッサ・モジュール130を初期化するこ
とによって、ホー)〜の動イ′1を制i:+llするこ
とである(高位1ノヘル)。 次に、データ・キャッシュ・メ千りのアI・レスを生成
し、データ・キャッシコ・メモリとFPモジュール13
0間のデータ転】スど紅路を制御することである。この
活動は通7:X高位レヘル制御操作か完了したあと、実
際の数値処理過程で反復的に行14われる。ループ制御
はシーケンサか取り扱い、アドレス生成機構と1111
がアト1ノス生成のために411他的に使用できるよう
になっている。 他のブロックとの連絡は32ビット幅データ・ハス(C
Dバス112)を通して行なわれ、制御プロセッサ・モ
ジュール110はこのバスを通して、ブタ・キャッシュ
・メモリ140、コマンド・メモリ190、およびFP
モジュール130の制御レジスタに対する読み書ぎを行
なう。制御プロセッサ・モジュール110はポストによ
って(VMEインタフェース+60を通して)、浮動小
数点プロセッサ・千ジュール130によって、あるいは
データ転送プロセッサ・モジュール+20によって割込
みをかりることか可能である。正常動作では(つまり、
プログラム開発やデバッグと切り1加された)、データ
転送プロセッサ・モジコール120だりか割込み発生源
となる。 DTP干ジュール120の概略(第3八図)データ転送
プロセッサ(DTP)モジコール120は同し32ビッ
ト・プロセッサとシーケンサを使用しているので、プロ
グラマから見たどき同しように見える。顕著に異なるの
はバス制御とインタフェース制御である。制御プロセッ
サ・モジュール110 と異なる特徴がもう1つある。 それは、データ転送プロセッサ・モジュール120には
、マイククロコート拡張ポートがあり、アットオン・ボ
ート(大容量メモリ・カートやネットワーク・カートな
ど)の制御が可能になっていることである。 データ転送プロセッサ・モジュール120は次の2つの
タスクを受は持つ。 まず、データ・キャッシュ・メモリと外部インタフェー
ス間のデータ転送を制御することである。(これは、制
御プロセッサ・干シーI−ル110(またはホスト)か
らコマン1〜を受りC行なわjする。) 次は、外部インタフェースからのコマンドをコマンド・
メモリ190に保管されているコマンド待ち行列に転送
し、あとで制御プロセッサ・モシュルが処理できるよう
にすることである。外部インタフェースはいずれもコマ
ンドを出すことかできるが、初期状態では、VMEイン
タフェースか主要コマンド発生源であるものと予想され
る。適当なソフトウェアでコマンド・リストをデータ・
キャッシュ・メモリ(またはコマンド・メ千す)に入れ
ておき、あとでマクロとして呼び出される(この手法は
「ベクトル連鎖」とも呼ばれている)。デバッグ環境で
は、データ転送プロセッサ・モジュール120はデバッ
グ・モニタ(ホスト側で稼動)とデータ転送プロセッサ
・モジュール120や制御プロセッサ・モジュール11
0や浮動小数点プロセッサ・千ジュール+30でデバッ
グ中のマイクロコード間の主要インタフェースとなる。 まノ・、1−のう−タ巾ムiXフ゛ロ→?ン→ノ・セシ
:I−ルを通してう一ハック・セニタはVMl、アドレ
ス空間にマッヒ゛ングされていノよし181重メモリを
アクセスすることかできる。 外部インタフェース、データ・キャッシュ・メモリ、コ
マンI〜・メモリ、VMEインタフェース・メ干り、お
にひデータ転送プロセッサ・モジj、−ル120間のデ
ータとコマン)−の転送は32ビット幅TDハス122
を経由して行なわれる。外部インタフェース150.1
60.170はFIFO(先入れ先出し)でバッファに
人ねられ、アテンションが必要になったとき、つまりあ
る種のデータを受は取フたり、なにもなくなりつつある
とき、データ転送プロセッサ・モシューノl刈20に割
込みをかける。別の割込み発生源としては、ホスト(V
MEインタフェース経由)と、制御プロセッサ・モジュ
ール110がある。 データ&送ブロセッザ・モジュール120によるデータ
・キャッシュ・メモリへのアクセスは、制御プロセッサ
・モジコール110か使用していないリイクルに制限さ
れる。(CIl〜eシ:I−ルl 10 i:I ?’
1動小数49ブロセソ→) 士シーl−ル1、)0への
転送面や自身のためにメモリを使用し′Cいることかあ
る。)データ転送プロセッサ・ヤシ:1−ル120か長
時間アクセス待ちに1ご1′かれた場合は、制御プロセ
ッサ・干ジュールに割込みをかりて、サイクルをスヂー
ルすることかできる。 FPモジュール130の概略(第4A−4C図)浮動小
数点プロセッサ・モジュール130は別ホードに置かれ
ており、このボートは主ベース・ポー1〜に差し込むこ
とによって使用される。浮動小数点プロセッサ・干ジュ
ール+30の動作は次の2つの部分に分かれて行なわれ
る。 (a)マイクロコード浮動小数点機構(ユニット)。こ
の部分は浮動小数点計算を受は持つ。この機構は1つの
目標、つまり、可能な限り高速に動作して、浮動小数点
ハードウェア機構の性能を引き出す設計になっている。 これらの段別目標を達成するために、非常に単純化され
たアーキテクチャが採用されている。つj゛す、浮動小
数点乗算機構、浮動小数;+4.iA l、11  (
算術論理演算機構)、高速多重水−1−・レジスタ・フ
ァイル、単純化された高速シーケンシから構成されてい
る。ざらに、スクラソチパッ;・・メモリか内部データ
通路と密結合さ才1、参照テーブルを保管し、ヒストグ
ラム記憶域を提イj(する。浮動小数点9術演算機構は
2つの読取リポートと1つの書込みボー1〜を通してレ
ジスタ・ファイルとのインタフェースとなる。 もう1つの書込みボートは読取りボートの一方と結はれ
て、データ・シャツフルと複写機能を提供する。最終ボ
ートは両方向であり、データをレジスタ・ファイルとや
りとりするために使用される。 (b)データ・キャッシュ・メモリ・インタフェース。 FPモジュールのこの部分は、データ・キャッシュ・メ
モリとレジスタ・ファイルの両方向ボート間のインタフ
ェースとなる。レジスタ・ファイルとデータ・キャッシ
ュ・メモ9間には両方向レジスタ群かあり、データ転送
のバイブラインどなり、データ多重化と経路指定を取り
扱う。 転送制御は転送ロジソつてη−成さ才する。このインタ
フェースの多くの部分は、物工1目的に1jFl’士ジ
ュール130と同し場所に115゛かれているか、CP
モジュール+10 と共にクロックかとられるので、l
・1)モジュール130の一一部というJ:りも、1広
−玉CP千ジュール110と一般に叶はれている。 高度多重ボート高速レジスタ・ファイルは、制御プロセ
ッサ・モジュール110と浮動小数点プロセッサ・モジ
ュール間のクリーンなインタフニスとなる点で重要な要
素である。このレジスタ・ファイルの一方の側は制御プ
ロセッサ・モジコ。 ル110と同期して動作し、他方の側は浮動小数点プロ
セッサ・モジュール130と同期して動作する。このよ
うにクロック境界を設りたので、境界の一方の側に変更
を加えても他側が影響されることがない。この結果、よ
り高速の、あるいはもつと多くの統合浮動小数点チップ
・セットへの移行が容易になり、従って、浮動小数点機
構の独立性を保つことができる。 浮動小数点プロセッサ・モジュール間 はアルーフリズムt、h合わ1て変更ざオ]ノご士シク
ール130’)は、最高4つまでこの種のザフシスデム
に組み入れることか可能である。第9八図ど第10図に
そのいくつかの例か示さJlでいる。 DCMの概略(第5図) データ・Aヤッシ:2 メ干り]’IOは+’;f+ハ
ント幅多重ボート・メモリである。このメ士りとそのイ
ンタフェースのアーキテクチャGJ、本好適実施例のシ
ステム全体の刺部な大幅に向」二させる利点をもってい
る。高ハント幅か必要とされるのは、浮動小数点プロセ
ッサ・モジコール130かA1純なヘクトル割算を実行
中のとき、浮動小数点プロセッサ・モジュール130に
データを常時提供するためである(そして、その結果を
除去するためである)。例えは、ベクトル[加算J操作
には、計算毎に数字を3回転送する必要がある。浮動小
数点プロセッサ・干ジュール130が20Mflops
の計算速度に耐えられる場合は、それに歩調を合わゼる
ために要求されるメモリのハント幅は毎秒240Mバイ
トどなる。 データ・λヤノシ:I−メ士りjJ、 1i4K x 
:lンl ・)I・・メモリからなるメモリ・バンクを
イ11′1大、ン!11ハイドのオンホード記憶機構を
tW載している。こJlは遠隔メモリ拡張ポーl−43
10をキャッジ;1、・ハス144にイ」加することに
より拡張可能である。(物理的には、このメモリ拡張モ
ジ:!−−ルは浮動小数点プロセッサ・モジュール13
0の各種モジュールと同しコネクタに差し込まれる。)
このメモリ拡張モジュールは、オンポー1〜・データ・
キャッシュ・メモリと同しハント幅になっているので、
追加の12Mハイ1〜・メモリを2Mハイ)・単位で拡
張するように溝成することが可能である。2重容量メモ
リ・モジュールを使用すると、オンホー1〜記憶機構を
4Mバイトまで、オフポート記憶機構を24Mバイトま
で増加できる。 データ・キャッシュ・メモリには3つのボートがあり、
各々はプロセッサの各々につながっている。しかし、制
御プロセッサ・モジュール+10と浮動小数点プロセッ
サ・モシコ、−ル130へのデータ転送はすべてCPマ
イクロコー1〜にJこって制御さ13 /1 ねるのて、多くQ〕、占で、メ千りを2重ボートたりを
もつものどして扱うことか可能とされていた。 7Y動小数、’j:jブロセソリ・モジュール130と
制御プロセッサ・干ジュール110に対するデータ転送
は人出力転+X J:り優先されているので、データ転
送フロセッサ・モジュール120はメモリ・サイクルに
空きか出るまて待たされることになる。データ転送フロ
セッサ・干ジュール120の待ち時間か長い場合は、制
御プロセッサ・モジュール+10に割込みをかけて、メ
モリへのアクセス権を獲得することかできる。このこと
は、制御プロセッサ・モジュール110がランダム・ア
クセスを行なっていない限り、問題となることはない。 その場合でも、ブロック人出力転送では、データ転送プ
ロセサ・モジュール120は別のデータ・ブロックを要
求する必要が起こる前に、メモリ・アクセスと、とにデ
ータを転送するために8サイクルが必要になる。 妥当なサイクル時間メモリ装置で高メモリ・バンド幅を
得るために、広幅メモリ・アーキテクチャか1采用され
ノご。メモリは24ヒ・ンl〜幅であるので、1回のア
クセス・ヅイクルで、32バー(1−f1日・詔)か転
送される。メニ〔りの−リイクル間間か+00 nsて
あれば、メモリ・へン1−幅はフロ・ツク転送では毎秒
320旧\イl−、ランダムト詔のアクセスでは毎秒4
ON1ハイドである。 データ・キャッシュ・メモリは、FPモジ:1−−ル1
3Q用(7)?−1’クロコー1〜・オーバーレイを保
!庁しておくためにも使用できる。これらは、浮動小数
点プロセッサ・モジュール130のマイクロローISが
WCSCSメイズえたとき、FPモジュールの書込み可
能制御記憶機構との間て受り渡しされる。この並行ロー
1・機能によるWO2の再ロートは、ホス1〜制御によ
る通苓のシリアル・ロー1−よりもはるかに高速に行な
われる。事実、この機能はマイクロコードを動的にベー
シングがて籾るたけの高速になっている。 CM 190の概略 コマンド・メモリは小容量(2K)の32ヒ・71〜幅
メモリでり、制御プロセッサ・モシコーール110とう
゛−タ転ユスブIJセツリ モジー!−ル120間の2
つのボー]−をもっている。コマンl’、制御および状
況データーこのメモリに保管さねているソフトウェア待
ち行列またはF I l; 0スタツクを通して、制御
プロセッサ・干シーw−Jl刈10 とTITPの間で
受り渡しされる。 このメモリの半分は制御プロセッサ・モジコール110
と浮動小数点プロセッサ・モジコール130の状態情報
(一部のコマンド構造と共に)を保存しておくために、
マイクロコート・デバッグ・モニタ用として予約されて
いる。 (以下余白) 外部インタフェースの概略 好適実711(例では、効率のよいインタフェースをい
くつか備えている。その中て最も重要なのかホスト・イ
ンタフェース(VMEインタフェースとも呼ばれる)で
ある。VMliインタフJ−スは9丁適実jjl f列
によるサブシステムとVMI−ハスとをホ占ふインタフ
ェースであり、VMEハス規格規格改版1版C1定され
ている電気的仕様とプロ1へコル仕様に徨拠している。 VMEインタフェースは、VMEポストがマイクロコー
ドをアップロー1〜しているとき、制御または状況レジ
スタをアクセスしているとき、VMEインタフェース・
メモリ(VIM)をアクセスしているとき、あるいはデ
ータFIFOをアクセスしているときはスレーブ・モー
トで動作する。スレーブ・モトのインタフェースはバイ
トまたは語アクセスをサポートせす、32ビット並列ア
クセスだりをサポートする。しかし、制御および状況レ
ジスタは16ビツト幅であるので、16ビツトのポスト
は本好適実施例のサブシステムを制御できる。 い1]・インタフェースは、局所DMへの制御を受りて
データF l l: OとV 1.I Eメモリ間てデ
ータを転送するときは、マスタ・モードて動作する。D
Mへの活動は、データ転送プロセッサ・モジュール12
0が割込みサイクルをMEハス上て開始することにより
このモジュールによって制御され、モニタされる。 データ・バイブ・インタフェースは、高ハント幅ハック
フ1ノーン・ハスと結ばれる設計に2tっている。(物
理的には、これはりホン・ケーブルを使用するだけで構
成に含めることかできる。)このハスを使用すると、私
用サブシステム間の通信が行なえるので便利である。つ
まり、インタフェース・ロジックは2つの受信ボートと
1つの送信ボートを備えているので、この種のバスを複
数短距離局所バスとして使用して、幅広いデータ流れア
ーキテクチャを実現することができる。このバス上のデ
ータ転送はFIFOでバッファリングされるので(受信
端側)、データ転送を高速にかつ低オーバヘットで行な
うことができる。複数のサブシステムを並列にも直列に
も(例えは、バー−フシインで)接続てきるので、高性
能のシステムを11X1単に実現することができる。 1つの例として、高性能の実時間3次元図形システムを
、2つの高速化サブシステムと画像プt’1セッサをバ
イブライン構成にすることによって構築することがてぎ
る。最初の高速化サブシステムはフレームnで多角形を
変形してクリッピングし、2番目の高速化サブシステム
はフレームn−1で多角形を描画類に分類しく隠蔽表面
除去のため)、画像プロセッサはフレームn−2で多角
形を描画する。 DTPマイクロコート拡張インタフェースは仮想的にD
TPモジュール120のマイクロアドレスとデータ・バ
スを拡張したものである。これはGIPマイクロコード
拡張バスとギ全に互換性(物理的および電気的に)があ
るので、GIP用に設計され、この種のインタフェース
を使用するどの拡張カートでも使用できる。外部大容量
メモリ・システムとネットワーク・カートはこのインタ
フエース ポー1−31]Iじ(本実施例の→)−ブシ
ステムとオ、^はオ]る。 画像データ・ハス・インタフェース170(またはrG
IPインタフェース」)ハ、特に図形と画像ブタ用に最
適化された別のハスに鯖はねる。このインタフェースは
、GIPマイクロコーロー拡弓長バスども接続できるの
で、本実施例のヅブシステム」二のいくつかのインタフ
ェース・ロジックをGIPマイクロコーローで制御する
ことかできる。これにより、GIPと木実hiU例のザ
ブシステム間は両方向16ビツト幅のFIFOて結ばれ
るので、コマンドとデータをFIFO経由で送ることが
できる。このインタフェースの各側は他方の側に割込み
をかりることかてぎる。 制御プロセッサ(cp)モジュール110制御プロセッ
サは、32ピツ1へ整数プロセッサ機構(ユニット)(
IPU)240に搭載された32ビツト・マイクロコー
ト・プロセッサであり、本好適実施例では、Weite
k XL8137が使用されている。IPU240は1
6ビツ1〜・アトI/ス生成機構(AG)230  (
本実施例てはΔ1lalol: Dcv+ccsネ」八
DSI’ 141Tlを使用)おにひ16ヒツI〜・シ
ーケンサ210(木実h;(例て+J八へaloHDe
viccs 、41:八DSP Idolを使用)によ
ってリボ−1〜される。制御プロセッザ内の主データ通
路はCDハス+12である。 第2A図は本好適実施例におりる制御プロセッサ110
の構造を概要図で示したものである。1月込み可能制御
記憶機構(WC5)220は、マイクロ命令列を納めて
いるメモリである。シーケン4J210からマイクロ命
令71〜レス・コマンドが出されて、制御記憶機構22
0からマイクロ命令が取り出される。 この方法で制御記憶機構から取り出される命令の流れを
示したのが221である。レジスタに格納されない出力
とレジスタ222に格納される出力の両方を設りること
か好ましい。レジスタ222 に格納された出力はデコ
ーダ260に人力される。レジスタ222と223は共
に直列シャドウ・レジスタとして構成され、直列ループ
225 とのインタフェースとなる。マイクロアドレス
の流れの一部をライン211八から行て、浮動小数点モ
ジュール+30に通知するJこうに−・j−るのか好ま
しい。この方法をとると、以下に述へるにうな利点か9
υられる。 また、ライン221  Fの’IKれを両方向にするの
か好ましい。つまり、このラインは書込み可能制御記憶
機構からマイクロ命令を読み出すために使用てぎるたり
てなく、ある種の場合には、命令を逆に制御記憶機構に
碧き込むためにも使用できる。 その利、Qについては下達するか、これは重要な機能で
ある。 マイクロコート出力221は人力としてデコーダ2■に
送られる。従来の方法では、このデコーダは最小限の低
レベル・デコート・ロジックを使用して、マイク命令の
フィールドを分割して、必要時にそれらをデコート化し
ている。本実施例のマイクロ命令形式は第2B図に示さ
れているが、これについては以下で詳しく説明する予定
である。デコーダ260の出力261はアドレス生成機
構230、整数処理機構240、シーケンサ210とい
った主要機能ブロックのすべてに送られる。これらのラ
インはいろいろな個所につながっているので、個別的に
は示しCい/Jい1゜ シーケンサ210は、リンク レジスタ(トランシーバ
)214 をIz山してIPII 240から送られて
くる人力とシーケンサ局所バス215を経由してアI・
レス生成機構230から送られ′(<る人力たりて1.
(く、他のいくつかの人力も受り取る。 さまざまな割込、71線はマルヂブレクヅ213を辿し
て多重化され、これらの91J込みにより、シーケンサ
210のプログラム・カウンタ動作かざまざまに変更さ
れる。割込みをそれぞれに応してIA埋するシーケンサ
・ハードウェアはよく知られている。 別のマルヂブレクザ(212で示されている)は各種条
件コート信号から1つを選択して、シーケンサ210に
人力するために使用される。これらの条件コード信号は
、詳細は後述するように、シケンサ210のロジックの
中でいろいろな使い方をされている。 バッファ217は、マイクロ命令のフィールI−で指定
されている定数を送るために使用される。 ざらに、別の人出力かいくつか書込み制御記1.(工機
構22()どマイクロ命令ハス221 に示さねている
。招込みイネーブル線は、例えはボス1〜からどいった
ように、外部から制御される。さらに、2ウエイ・イン
タフ〕−−ス211Bをjl+ して、ホスl−iオマ
イクロアF lノス・ハス211 に対して読み書きを
行なう。この機能は診断に利用てきるたりてなく、フィ
クロ命令を制御記憶機構に省き込むときにも利用できる
(後述する)。 クロック発生装置250は制御ブロセッ+)110とデ
ータ転送プロセッザ120の両方からサイクル継続時間
人力を受り取る。現クロック・サイクルの継続時間は、
CPとDTPモジュールから受は取った最も継続時間の
長い指定子から即時に選択される。これは、プログラマ
ブル・ロジック・アレイ(PAl、)を用いて実装する
のか好ましい。デコーダ260の場合と同様に、クロッ
ク発生装置250の出力はいろいろな個所に送られるの
で、個々には示していない。 ′fJ2B図は木好適実施例におりるマイクロ命令フィ
ール(−の割当−Cを示1ッたものである。〔;1〕拡
・]]長ロシンにおGづるフィール1−の1刊当ても示
ざ;I+、−Cいる。この拡張ロジックの動作について
はkl、 I−で訂しく説明する。なお、ここて注意し
てお西ノごいことは、この拡張フィールド内のマイクロ
命令の追加ピッ1−と、基本WC5220内の各命令の
こJlらの追加フィール1−をWC5拡張機構およびこ
ねらのマイクロ命令フィール1〜をタコ−1−シて実行
するロジックはすべてザブシステム内の各数値処理モジ
ュール130またはアルゴリズム高速化機構にも同しも
のがあることである。従って、第10図の実施例には、
3つのWC5拡張機構か設りられるのて、CPマイクロ
コート・フィール[・全体は192ビツトになる。 基本命令内の個々の命令フィールドは整数処理機構24
0(32ビツト)、アト1/ス生成機構2:10(1(
lビット)、およびシーケンサ210 (7ビツト)用
に割り振られている。拡張フィールド(これは各wcs
拡張機構に保管される)ては、フィール1−はレジスタ
選択、条件選択、および転送制御用に割り振らねている
。L7 、lqらのヒラ1−の用法についてl」、あと
″CCハトく、ft′Llυしj゛る。 他の命令ノイールトは従来のマイクロコート・アーキテ
クチヤで採用されている方法で割り振られる。例えは、
あるビットは中断点まで各たことを示すために使用され
、いくつかのビットは命令タイプを’h:jiLに記述
するために使用され、2ビツトはクロック制御をツー1
〜化するために(上述したように、可変絹′続時間クロ
ックを可能にする目的で)使用される。 アドレス・レジスタ230はオフ・ザ・シェルフ・アド
レス生成機構である。割算をこの機構で行なえるので、
制御プロセッサ110の高速アドレス計算能力か向上す
る。 さらに、整数処理機構(IPU) 240は算術演算機
能を更に向上させる。IPUはCDバス112から読み
書きができると共に、アドレスをCへバスに出力するこ
ともてきる(レジスタ241を通して)。これらのアl
〜レスは、第1図に示すように、キャッシュ・メモリ1
40どコマンド・メモリ120に対するアドレス情報ど
/Jるものである。 木好適実施例において整数処Jl11機4j“Ij2J
O’u便用される実際の構成要素IJ高高度LJ、、術
ji!i像機riijを(jfiえており、この中に(
:I、乗りニーをバーI〜つJ−アで行なう機能も含ま
れている。従って、機4i1^230 と240を一緒
に使用すると、苫p、 (イ:j (iji涼機構の多
くをアドレス生成のために利用することかできる。更に
、シーケンサ210かマイクロ命令アドレス生成機能も
実行するロジックをいくつかalfえていることは勿論
である。 アドレス生成機構230からの出力231はバッファに
入れられ、CDバス112 に送り返される。シケンサ
210は整数処理機構240の出力を読み取ることがて
きるが(リンク・レジスタ214を通して) 、IPI
+ 240にコマンドてCDバス+12を駆動させるこ
ともできる。キャッシュ・メモリ+40、FPモジュー
ル130、またはコマンド・メモリ190もこれらの結
果がこのバスに送り出された時点で、その結果をアクセ
スすることができる。 レジスタz03(第2八図の左十に図示)は使用頻度の
低いいくつかの制御信号を格納する。これらの制御イ^
゛弓1・= +;l: 、診断用イ8−+、1. E 
11制御侶号IJとかある。 整数プロセッサ機構(IPll) 240■門]240
は、4ボー ト・レジスタ・ファイル111O1ALU
 +120、フィールド・マージ機構1130おJ:ひ
乗算/除算機構1140から構成されている。これらの
構成機構を簡略図で示したのか第11図である。2つの
外部データ通路は同図にDおよびへDハス1101.1
102で示されている。制御プロセッサ・モジュール1
10では、ADハス1102はレジスタ241を通して
接続され、各種メモリへのアI−レス・バスとして使用
される。、Dハス1101は[、Dバス+12 に直結
されている。 IPU240の4つのポート・レジスタ・ファイル11
10により、4番目のボート経由によるレジスタへの書
込みに加えて、rl −r2 + r3といった演算が
1サイクルて行なえる。ALll 1120は通常の算
術および論理演算機能のほかに、優先コート化とビット
またはハイド反転命令を備えている。フィル!−・マー
ジ機構1130は多重ヒラI・ シフ]・と回転、可変
ピッ1−・フィールI・抽出、保?「゛)とマージ機能
を備えている。乗算/除勢機構1140はI門1?40
の他の部分から独立して稼動する。この機構かいったん
乗算または除算操作を開始したあとは、他の乗算/除算
以外の命令はいずれもALU 1120またはフィール
1−・マージ機構1130に実行さセることがてぎる。 乗算は32 x 32符号イ」き(8サイクル)で行な
われ、除算はIi4 x 32ピツ)・符号なしく20
サイクル)で行なわれる。 レジスタ241はIPU 240の外部にあり、Cへハ
スI11 とのインタフェースで使用される。これによ
り、メモリをアクセスするときパイプライン遅延が生じ
る。(このレジスタが必要なのは、ここで使用されてい
る特定部分ては、へDバスはサイクルが開始してから7
5−90ns経過するまでは有効にならないためである
。) IP口240(”C”バス1103上の)に対するマイ
クロコート命令人力は内部的に格納されるので(レジス
タ1151) 、マイクロコート命令は直接に書込み制
御記1□0機構(Wt:S)から取り出される。 ア]・レス生成機構(ΔG) 2:10木好通実施例゛
C使用されるアドレス生成機構230のイll成は第1
2図にその概要か示されている。 主要要素としてCJ、16ヒツ1−幅の糺U 1210
.30個の内部レジスタ(これらのレジスタを機能別に
分りると、15個のアドレス・1ノシスタ1222.4
個のオフセラ1〜・レジスタ1224.4個の比較レジ
スタ1226、おにび4個の初期設定レジスタ1228
に分類される)かある。他にも、アドレス生成機構12
30とピッl−反転機構1240かある。内部バス12
50はブタの経路指定を行ない、”Y”ハス1270は
アドレス出力231を行ない、この出力はCDバス11
2にフィードバックされる(出力バッファ−232がイ
ネプルされたとき)。”D”バス1260はシーケンサ
・データ・バス215に人出力を行なうように結ばれて
おり、バス215はリンク・レジスタ/トランシーバ2
+4によってCDバスから分離されている。 実際の装置は命令デコーダとその他のタイミングおよび
接合ロジック(図示せず)も備えている。 これらの機能により、アI・レス生成機構230 i:
11サイクルて次のことか行なえる。 16ヒツト・ア1〜レスを出力すること。 メモリ・アドレスにオフセットを加えることにJ:リメ
モリ・アドレスを修飾すること。 ア]・レスイ1riかいつ事前設定境界に移動よノこは
境界を越えたかを検出し、条件骨きてアトレスイ11°
1を再初期設定すること。 この最後のステップは循環バッファやモジコール・アド
レス指定を取り入れる上で特に有用である。 アドレス生成機構230はIPLI 240がもつアド
レス生成機能を補強するものである。しかし、アドレス
生成機構230で使用される特定チップは直接に動作す
る場合、16ビツト・アドレスしか生成できない。(倍
精度アドレスは2サイクルを必要とするが、2個のチッ
プをカスケード接続することも可能である。)木好適実
施例では、アドレス生成機構230の16ビツト・アド
レス出力はIPU 240に渡され、そこでそのアドレ
ス出力かヘース・アF lノス:こ力11えらJl、:
1ンヒ゛ソ1〜まで1広引ぐざわる。 アミルレス生成機構のレジスタ+;116ヒツト幅Dボ
1−を通してアクセスされる。このボー1−はシゲンザ
と同し局所部分215 とリンク・レジスタ214 に
接糸売されてし)る。 アドレスはYボー1−1270(第2八図にライン23
1て示されている)から送出される。ア)−レスはCD
ハスと結はれる前に、3状態バツフア232に渡される
。アドレス生成機構のDかYのどちらかか読み取られる
どき(つまり、CDバスを駆動するように要求されると
き)、16ビツト値はバス幅(32ビツト)までゼロで
拡張または符号で拡張することかできる。これを実行す
るロジックは、あとで詳しく説明する符号/セロ拡張P
AL 216内に置かれている。ゼロ拡張または符号拡
張はCPマイクロコロー〜から直接に制御される。(こ
の機能は、16ビツト幅ボートのいずれかがCDハスを
駆動するために選択されたとぎ使用可能になる。) アドレス生成機構230の命令セットは次のように分類
されている。 ルーヒング レジスタ転】ス 言向工里およびシフ]・(イ行」スリ)Iうtイ乍制御
操作 その他の操作 アドレス生成機構の人力とノlるマイクロコート命令は
内部レジスタに格納され、W[:S 220がら直接に
取り出されるようになっている。 シーケンサ220と関連支援ロジック 本好適実施例では、シーケンサ210は八DSI’]4
01を採用している。この特定の八DSI”を実装した
シーケンサの主要要素は第13図に示されている。 これは、16ビツト加算機4/1i13]0.64 x
 64ビットRAM +320、割込みロジック133
0、割込みベクトル記憶機4R1340、および4個の
ループ・カウンタが含まれる。 内部RAM1320は次の3通りの使い方か可能である
。 1つはレジスタ・スタックとしてである。スタックとし
て使用すると、サブルーチンに入ったとき最高71個ま
でのアF lノスをスタックに入れておくことかできる
。これらの7トレスは関係命令内0〕2ヒッI〜・フィ
ールドによってアクセス可能である。 次はサブルーチン・スタックどしてである。このスタッ
クはサブルーチンのリンケージと割込みのための通割戻
りア1−レスの記憶域となるものである。これは、状況
レジスタやカウンタなどの他のハラメータを格納するた
めにも使用できる。 最後は間接アドレス記憶域としでである。これは使用頻
度の高いアドレスの格納用に予約しておくことかできる
。これらはDボートの下位6ビツトを用いてアクセスさ
れる。 スタック制限レジスタ1321はスタック域が他のスタ
ック域を壊したり、スタック・オーバフロやアンダフロ
ーが起こるのを防止するものである。これらのどれかか
起こると、内部割込みが起こり、エラー状態にフラッグ
がイ」りられたり、スタックはオンチップ′に拡弓長さ
れる(スタック・ベシング)。 10個の優先−1,11込みか用意ざ]1−(いる。そ
のうちの2個は装置内部のbので、スタック・エラーど
カウンタ・アンダフローに苅するものである。8個は外
部である。割込み検出、レジスタリングおよびマスキン
グはずへてロジック1330によりオンチップで処理さ
ね、対応するヘクトルか;l;l込のベクトル・ファイ
ル1340から取り出される。 命令セラ1−は非常に豊富てあり、ジャンプ、ザブルヂ
ーチン呼出し、戻りなと幅広く揃っている。これらの命
令の大部分は絶対アドレス、相対アドレス、または間接
アドレスを使用して目標アドレスを指定できる。これら
は選択した条件の1つによって修飾可能である。 無条件。命令を常に実行する。 フラグなし。条件コード人力(FL八へと呼ぶ)が偽で
あれば、命令を実行し、そうでなりれは続行する(通常
失敗命令) フラグ。条件ロー1へ人力が真であれは、命令を実行し
、そってなけれは続行する(通常失敗命令)。 箱号。命令の実行は状況レジスタ内の7〕号ヒン[−に
よって左右される。 スタックも理、状況1ノジスタ繰作、カウンタ操作、お
よび1.]J込み制御を行なう命令も川魚されている。 マイクロツー1〜命令入力は内部レジスタに格納され、
マイクロコート命令はWCS  (レジスタ格納なし)
から直接に取り出される。 シーケンサ支援ロジックには、割込み、条件つきコート
選択、マイクロアドレス・ハス、定数/次アドレス・フ
ィールドの4種類がある。 飢込及 本好適実施例でシーケンサ210用に使用されているチ
ップは4個の割込み人力ビンがあるだけである。従って
、使用可能な割込み数を8個に拡張するために外部マル
チプレクサ213が使用されている。割込みは主に連絡
用とデバッグ・ツールをザボートするために使用される
。 割込み発生源(最も優先度の高い順)は次の通りである
。 クロー ロジック デハッグ環境内では、名1]的には、モニタ タスクと
ユーザ・タスクの2タスクか枢動1.−Cいる。クロー
・ロジック(claw logic)は、モニタ・タス
クを1ステツプ進めることなく、ユーザ・タスクだすな
1ステツプ進めるものである。クロ・ロジックはユーザ
・タスクの中のある命令か実行されると、モニタ・タス
クに「制御を返却させる」。ユーザ・タスクに制御を返
却させる命令はクロニ割込みを要求する。これは1サイ
クルたけ遅れているので、ユーザ・タスクの最初の命令
が実行されると割込みか引き起される。従って、ユーザ
・タスクの次の(つまり、2番目の)命令が実行される
まえに、制御がモニタ・タスクに返却される。 史」1点 この割込みレベルはマイクロコート・ビットと直接関係
があるので、割込みか起こるとこのビットがセットされ
る。この仕組を利用すると、中断点を設ける上で便利で
ある。中断点ビットかセラ]・されノ、:命令か実行さ
れると、制御は中断点処理ルーチンに渡さ引]る。中断
点はいくっても設定が可能である。 VMIミハス VMI−ハス割込みは通産デバッグ・千二夕をサボ1−
する目的たりに使用されるので、正常動作時には使用さ
れない。 浮動小数点プロセッサ(中断点) 浮動小数点プロセッサ・モジュール+30がそのWCS
にセットさねている中断点の1つを見つけると、FPク
ロックは停止される。FPモジュールはこのことをこの
割込みを通して、制御プロセッサ・モジュール110に
通知する。 DTPメモリ・アクセス この割込みは、制御プロセッサ・モジュールにデータ・
キャッシュ・メモリへのアクセスを時的に中止させるた
めに使用される。これによりデータ転送プロセッサ・モ
ジュール+20はキャッシュ140にアクセスかてぎる
ようになる。 DTl】(コマンド) この割込みは、CPコマンFlll・fl (コマンド
・メモリ+90内の)にコマンI・かあることをデータ
転送プロセッサが制御プロセッサ・モジュール110に
知らせるために使用ざねる。+4 DTI’(データ転送完了) この割込みはデータ転送要求が完了したことを制御プロ
セッサ・モジュールに知らせるためにブタ転送プロセッ
サ・モジュール120によりて使用される。*申 浮動小数点プロセッサ(一般) この割込みは、l;PWAIT、FPWΔITが状態を
変えたり、エラーが起こったり(エラー・タイプはソフ
トウェアで定義できる)、浮動小数点プロセッサ・モジ
ュール+30に中断点が現れると、引き起される。活動
事象は、FPモジュール130上にあって、制御プロセ
ッサ・モジュール110かロートできるマスク・レジス
タによって選択される。この割込みは今は使用されず、
将来の使用に備えて予約されている。複数のFPモジュ
ール13oを使用するシステムで6.1.1個の「Pか
この割込のを共用する予定である。従す−(、’i’J
J込みツーヒス・ルーヂ゛)は、これらのFPに正しく
ツーヒスするためにはとの1・1)か割込みを引ぎ起し
たかを知っている必要かある。* 注意 十印のf」いた割込のは通常の条件コート・ロジ
ックでもテス!・てぎるので、ごわらをボリングした方
か好都合の場合には、そうすることか可能である。 **印のイ」いた割込みの場合は、割込み状態を弓き起
したことは、ソフトウェアFIFOデータ構造内の制御
悄幸艮を調へることで検出することができる。これは割
込みが使用されない場合には、ボリングすることか可能
である。 マルチプレクサ213を使用して割込み数を拡張するた
めには、4個の高優先度割込みレベルと4個の低優先度
割込みとの間のタイミング条件を変える必要かある。4
個の高優先度割込みであることを認識するためには、マ
イクロコート・クロックの立上かり縁より25ns前に
割込みを引き起す必要かある。低侃先良割込みの場合は
、この1111間制限は立下がり縁より15 n s前
に−・)−る必要かある。。 割込みな引ぎ起ずには、文4応する割込の人力は1クロ
ック期間の問高しベルに保14ざねる。ハI〜ウェアに
よる割込み認知ライフルは必要77いので、割込み生成
バーミー91フ機構は非′1・:4に甲純化される。 条イ?Iコート・ロジック シーケンサはFl、AGと呼はれる1つの条件ツー1−
入力端をもっており、テスト可能な状況信号はすべて多
重化されてこのビンに人力される。こねは内部レジスタ
に格納され、通常のセラ1〜フフ1時間はIRQにマス
ク(カウンタ・アンダフロー割込み)がかけられている
ときは1Onsであり、イネプルされたときは21in
sである。FLAG入力端の極性はシーケンサ内部で変
えることができる。 第40A図に示すように、FLAG入力端の状態をシー
ケンサ210の外部で保存しておくためにいくつかの追
加ロジックを使用することか好ましい。そうすれば、シ
ーケンサ210の内部状態を割込みか起きたあとて完全
に復元することかて舘る。 1’A14(1211,1シーケン′11210(また
は:1IO)の内部て内部フリップフロップ4020を
エミ:Iレー1−するために使用される。このPALは
従って、「疑似レジスタ」として動作するたりである。 この必要が起こるのは、第40B図に示すような条件の
ときである。 割込みか発生ずると、シーケンサは割込み処理ルーチン
に制御を渡す。このルーチンが実行されている間、疑似
レジスタPALは割込み発生前に存在していた状況フラ
グ条件のコピーを保持しているたりである。割込み処理
ルーチンの実行が終ると、マルチプレクサ212はこの
ルーチンの指示を受けて、PAL4021の出力をシー
ケンサ210へのFLAG入力としてシーケンサに渡す
。これにより、フリップフロップ4020の内部状態が
復元される。 この結果、命令の流れは割込みが起こらなかった場合と
同し順序で継続する。これは、割込みに続く命令が条件
イ1きブランチである場合は特に重要である。内部状態
を正しく復元ずれは、この条件イqぎブランチは正しく
 44行されることになる。 勿論、このロジックは、シーケンサによツーCは必要て
ない場合かあるか、木りf適実施例で使用されているよ
うな特定シーケンサでは使用した方か好都合である。 テス)・可能状況信号には、次のものかある。 IPII 240条件コート出力、これは、現命令の状
況を中継するものである。どの条件かこのピン十でIP
U出力によって指示されるかは、マイクロコート令によ
って定義されている。 マイクロコート・ルーフ:これはVMEインタフェース
制御レジスタの中の状況ビットであり、診断ソフトウェ
アで使用すると便利である。 畳込みフラッグOと1:この2信号はデータ・キャッシ
ュ・メモリ書込みロジックの内部状態をアクセスしやす
くするもので、デバッグ・モニタ内の状態格納と復元マ
イクロコードによってのみ使用される。 保留状態:これは、割込みから戻るときテストされ、ジ
ャンプにJ二って割込み処理ルーチンに移った場合”C
t、どの条(’I (1きジャンプその他か正しく実行
されるJ:うにする。 l:1判人7兄信−号C1’W八11  これは、1・
(〕かその甜2′−を終えて、追加データを待っている
ときクリアされる。 「P状況信号FPWへII  これは、制御プロセッサ
・モジュール110がその泪算を終えて、追加データを
待っているときクリアさねる。 FI’状況信号バンク選択:これは、レジスタ・フ】・
イルか2重バッファ(論理)モーI〜て使用されている
とき、FPレジスタ・ファイルのどちらの半分か制御プ
ロセッサ・モジュール110に割り振られているかを知
らせる。 FP状況信号 直列ループ。これは1・P上の浮動小数
点チップを通して実行される直列ループの終りから抽出
される。この直列ループとのインタフェースを通して、
制御プロセッサ・モジュール+10はこれらの装置の内
部状況を抽出する(挿入)ことかてぎる。 1・P状況信号 cp待ち割込みとFP待ち割込み。こ
ねらの2つの4人7シ11ヒ゛ツ]・はそれそJlの1
10号か1::Iから低に移るとセラ1〜される(マス
キングか可能/j場合)。信号Fl’W層′1とCII
W八11へ、(,1)か割込み発11源を突き止める前
に再び高に戻ることかあるので、直接にテス1−される
。 Fl’状況イル号 1・P中断点。これは、デバッグ「
1的たりに使用され、FPか中断点までくるとセラ1〜
される。 FP状況信号 FPエラチーこれは、エラーh)?!7
動小動点数点プロセッサジュール130て起こると、セ
ットされる。これは将来の使用に備えて設りられたもの
である。 FP状況信号はシーケンサに向う共通線を共用し、実際
にテス1−される状況信号はCP拡張マイクロコード部
分によって選択される。 IPII 240からの条件出力は100nsてサイク
ルするときは、遅れて有効になるのでシーケンサのセッ
トアツプ時間に間に合わない(特にマルヂブレッサによ
って遅延されるので)。この条件をテス]・するときは
、クロックを+25nsに延長する必要かある。 ゴor 1oop”はシーケンサ内部のカウンタの1つ
を使用するど、コーディングしや< ノtす、IPII
240はアドレス泪算から解放される。1・or−1o
opsはIPII240を用いて行なうこともてきるが
、そうすると、サイクル1持間か長くなるので余分なオ
ーバヘットが生しることになる。 条件コートは8.1マルヂブレク4j 212を通して
多重化されてシーケンサの”FLAG”入力端に人力さ
れる。シーケンサは選択した条件ツー1−信号の極性を
内部l/レジスタ格納して、その選択を行なう。 マイクロアドレス・ハス マイクロアドレス・バス211 と21 ] A +;
i、通常プログラム実行時にはシーケンサ210から、
マイクロコートのロード時にはVMEバスから駆動させ
ることができる。VMEバスはマイクロアトlメス・バ
スの内容を読み取って、シーケンサがどのアドレスにあ
るかを確かめることもできる。これは、シーケンサ動作
と非同期に行なわれ、主に診断て使用される。 マイクロアドレス211は、制御ブt’llセンリ モ
ジュール110のWCSの32ヒソI−か各1・P:(
ニジ:I−ル上に1面かれているのて、FP干シ:I−
ル(拡巾(部分211八で示されている)」−にもホ古
はれ°Cいる。マイクロアドレス・ハス拡張部分はFl
l WCSを駆動するためにも使用できる。この機能は
次の2つの理由で便利である。 1 ) FPマイクロコロー−かタウン・ロートされる
ときポストから71−レスを与えることかてきる。 2)FPマイクロコロー〜を制御ブロセッヅ・干ジュー
ルと同期させて実行させるとぎに使用てぎるのて、制御
プロセッサ・モジュール内のシーケンサ210のアドレ
スが内部生成アドレスの代わりに使用できる。(この機
能は本好適実施例では採用されていないが、いつでも利
用できる方法である。) (以下余白) 定数フィール1〜 )フイクIJ1イ1. 、<7の16ヒツ1〜幅定数フ
ィール1−は主にシーケン9に′アドレスを与えるため
に使用されるか、71−レス生成機構の定数を保持する
ために使用することもてぎる。 シーケンサ210は両方向で私用局所バス(シケンヅ・
データ・ハス215)と結ばれている。これにより、ジ
ャンプなとをCDハスl12を使用する処置と並行に行
なうことができる。シーケンサ・データ・ハスは両方向
リンク・レジスタ/トランシーバ214を経由してCD
バス112 とリンクされている。クロックのタイミン
グとリンク・レジスタ214に対する「フィートスルー
」制御は、送り元と宛先はずへて要求条件が異なるので
、転送経路と方向に応して変化する。アドレス生成機構
のブタ入力端は、アドレス生成機構230がシーケンサ
と同しタイミング条件でこのハスで転送を行なう必要が
あるので、このインタフェースのシーク291則に1妾
続されていることにt1目すべきである。 この構成により、次のにうなHY路指定か可能−Cある
。 定数フィール)・−〉シーケンサ(ジャンプ)定数フィ
ールlj−>CDハス(レジスタ・ローF)シーケンサ
−>CDハス(診断) CDハス−〉シーケンサ(ル]算によるシA・ンブ)定
数フィール1〜 〉アドレス生成機構アドレス生成機4
f!i〜>CDハス(診断)CDバス−〉アドレス生成
機構(泪算によるアドレス) 書込み可能制御記憶機構(WO2)220本好適実施例
では、WCSメモリ・バンクはマイクロコートSIL干
ジコ、−ルを使用している。これらは8K x 32ビ
ツト・メモリを備えており、これと共に、マイクロコー
ドのロートと診断のための直列シャドウ・レジスタ22
2 と223を備えている。(これらのシャドウ・レジ
スタの動作は以下で詳しく説明する予定である。)この
モジュールは2つの種類、つまり、出力がレジスタに格
納されるものと、レジスタに格納されないものとかある
。IPII 740、アドレス生成機構230、および
シーケンサ210i:lそれそね独自に内部パイプライ
ン・レジスタを持っているので、WO2からの非レジス
タ格納出力を使用する。 ?」二1.1ずへきことは、制御プロセッサ・モジュー
ルのWO2は実際には分散されていることである。 図示の基本WCS部分220(これは物理的にヘース・
ホード」二に置かれてし\る)のほかに、さらにWC5
220の拡張部分が1つまたは2つ以上ある。これらの
拡張部分はマイクロアドレス・ス1〜リーム211Aを
受は入れ、物理的に各14’モジユール上に置かれてい
る。基本WCS220に格納されている命令セットは各
アIヘレスに96ヒツ)への命令を収容している。WC
S拡張部分490は各々基本WC5220と同じアI〜
レス範囲にまたがっているが、WC5拡張部分の各々(
数値プロセッサ・モジュールの各々にある)は各アドレ
スに追加の32ビツト命令を収容している。 WCSインタフェース・レジスタ222 と223ホス
I〜(VMEインタフェース160を通して稼動する)
が制御記1.(1機4tlのずへてに対してlんみ鶏き
を行なうとぎ使用する直列ループの動作について以下詳
しく説明する。ここでは、バーl−ウェア構成と接続関
係について説明する。 上述したように、レジスタ222はレジスタ格納マイク
ロ命令出力をデコーダ21i0に対して、および他の多
くのロジックとメモリ構成要素に提供する。内部レジス
タに出力を格納する構成要素の場合には、非レジスタ格
納出力も提供される。(例えば、IPII 240は内
部命令パイプライン・レジスタをもっている。また、高
度の内部デコート・ロジックも備えている。IPU 2
40はデコーダ260からある種のレジスタ格納制御ビ
ット、例えは、出力イネーブル信号も受番プ取ることに
注目すへぎである。) レジスタ222は実際は直列シャドウ・レジスタである
。これはレジスタ可能による並列スルーフットが得られ
るたりでなく、直列アクセス・モトももっている。直列
アクセス・干−1−は上述する直列ループとのインタフ
ェースのために使用さJする。 他方のIi「列シャドウ レジスタ223は非レジスタ
格納出力のシャトつとなるもの”Cある。完全な命令に
対応する直列出力を得るためには(要求時に)(または
、逆に命令221の全幅を制御記憶機構220に也ぎ戻
ずためには)、ずへてのヒツト・フィール1−をアクセ
スする必要かある。 勿論、上述したJ:うに接続すると、データ・インタフ
ェースたりてWO2220と結ぶことかできる。つまり
、レジスタ222 と223にはWO2220内の記憶
位置の内容か見えるか、データと明示的に結びイ」いた
71−レスは見えない。アドレス・インタフェースは両
方向接続2】IBで示されているように、別個の2方向
インタフエースである。これはCPマイクロアドレス・
ハスであり、 VMEインタフェース内のマイクロロー
1〜・ロート制御ロジックと結ばれている。これと同し
ハスは、DTP制御記憶機構を除くシステム内のすへて
の制御記憶機構とのマイクロア1〜レス・インタフェー
スとなっている。DTI’制御記憶機構内のマイクロア
1〜レス線はM[インタフェース内の別のレジスタ/ハ
ソファ刀に結はねている。 FT’制御制御フシ ツクキテクチャのもう1つの特徴は、制御ブロセッヅ・
モジュールか単に監視ブロセッツであるたりてなく、浮
動小数点プロセッサ・モジュールとの間て受り渡しされ
るずへてのデータ転送を直接に制御することである。こ
のロジックの大部分はFT’T’ュール」二に置かれて
いるが、その制御は制御プロセッサ・モジュール110
のマイクロコ1−によって行なわれ、60バスとのイン
タフェースとなっている。このロジックばあとて詳しく
説明するが、そこてはFPモジュールのデータ操作につ
いて検討する予定である。 モート・レジスタ203はマイクロコート・ビットを専
用するほど重要でない使用頻度の低い制御信号の値を保
持−う−る。モート・ピッ1〜には次のものがある。 ’jrrK II’Vり保11Jレシス’) 561 
ヲJ ル?If5J1j、りiJレジスタ制御。 4L込み保]・51ノシスタ561 を通る流ねまたは
レジスタ制御(第5図に561として示され−Cいるレ
ジスタは実際には2重に)9jっでおり、1個の読取り
レジスタど1個の書込みIノシスタから71っている)
。 保持レジスタ560に苅するループバック モ2個のL
ED制御信号。 モジュール選択(3ヒツト)、このアトスレは複数個の
FPモジュール+30やアルゴリズム高速化機構130
′の間で選択される。 CDハス・デコート・ロジック デロータ260の機能の1つは、マイクロコードCDソ
ース・フィールドをデローF l、て、CDバスを駆動
できる装置の出力イネーブルを制御することである。ま
た、CD宛先フィールドをデコードして、クロック・ス
トローブと書込みイネーブル信号(これらはクロック発
生機構からの書込みゲーr−イ1<−号によって修n;
11さ1する)な発生ずることも機能の1っである。C
Dハス−にのボー 1〜の大部分は3ノシみ1uきかて
きるのて、IPII 240にある疑似レジスタは必要
ない。(CDソースと宛先の一部はデコダ260にある
デローl〜・ロジックによってでなく、CP拡張ロジッ
ク410にあるデコート・ロジックによって制御される
ことに7土目すべきである。) CDバス・ソースと宛先として可能なものとして、IP
U 240、コマンド・メモリ、データ・キャッシュ・
メモリイ呆持レジスタ56〇八、千−1〜・レジスタ(
8ビツト)、転送制御レジスタ中Φ季、FP制御レしス
タ**−開始アトレス・レジスタ÷**、命令レジスタ
(8ビツト)、状況レジスタ(ソースのみ)*、アドレ
ス生成機構アドレス・ボー1〜**、アドレス生成機構
データ・ボート**、シーケンサ・データ・ボート**
、定数/次アドレス・フィールド(ソースのみ)傘*が
ある。幸印のイ」いたレジスタはFPモモジュール上置
かれているCP拡張ロジックの一部である。これらのレ
ジスタは、WC5拡張部分イQOδご格納さ511ζい
る拡張C1)マイクシノコ−)−内のンイール1〜によ
−〕で選択される。選択されたモジュール/こζプかデ
ータφJ!送ζごJ、己て谷して、データを送受する。 O印のイ・1いたソースは下位16ビツトをff1g動
ざゼるたりである。これらのヒラ1〜の1つか選択され
ると、符−J/セロ拡張PAL 2+6も活動化される
のて、データは32ヒントのハス幅まて符号またはセロ
で拡張される。 ソースと宛先はそれぞれ1つたりか選択可能であり、こ
れらは異なっていなりれはならない。 IPU 240へのデータ転送はIPll 240の命
令フィルドの制御の下で行なわれるので、CDデータは
それが別の宛先にロートされているときど同時にCDバ
スから取り出すことかてきる。 クロック発生機構250 クロック発生機構250は制御プロセッサ・モジュール
110(およびデータ転送プロセッサ・モジュール12
0)を通して使用される基本クロック信号を発生する。 この機構は、制御プロセッサ110とデータ転送プロセ
ッサ120の両方からサイクル継続++、5間人力を受
り取る。現り
【Jツク →ノイクルの糾′続時間は、C
Pど旧P干シコールから受り+1v、−:。 た2つの人力のうらJ■い方の椹′続11.4間に従−
〕(、即時に選択される。 この発生機構はプログラマブル・ロジック・アレイ(P
ΔL)に実装することか々了ましい。この()八]はあ
らかしめ定義された4つの波形列の1つを41F成する
。これらの4つの波形列は期間か異なっている。つまり
、人力クロック期間の4.5.6.7倍になっている。 これは、木実施例のように、4011’llzオシレー
タか使用されるときは、100,125150、および
175nsに変換される。 4つのクロック出力か生成される。これらのクロックは
、タイム2クロツクを除き、ずへてザイクル継続人力に
応して同じ継続時間をもつ。これらには、マイクロコー
ド・クロック、パイプライン・クロック、書込みイネー
ブル・デー1−信号、タイム2クロツクがある。 マイクロコート・クロックは2サイクル(オシレータの
)の間常に高レベルにあり、そのあど2.3.4;1に
!lJ: 5リイクルの間(こJlはヅイクル長人カニ
、lよっ−(か択ざJする)低レベルに/Jる。 マイクロコ−ト 理機構、アドレス生成機構、レジスタt2とを同期させ
てオi動させるものである。 パイプライン・クロックはマイクロコート・クロックと
波形か同しであるが、マイクロコート・クロックはパイ
プライン・クロックを動作させたままにして、マイクロ
コートのロート時にディスエーブルさゼることか可能で
ある。 書込みイネーブル・ゲー]・信号はマイクロコI・・ク
ロックか高になった1サイクルのあと低になるか、マイ
クシコー1〜・クロックが低に戻る1サイクル前に高に
戻る。 この信号はメモリのすべてとレジスタの一部に対する書
込みイネーブルのタイミングをとるものである。 タイプ2クロツクは、マイクロコート・クロックの動作
周波数の2倍の周波数て動作し、その立」−かり縁はマ
イクロコート・クロックの縁と同じタイミングて現Jす
る。これl:I q5ゾI、りl−J Iりてあり整数
プロセッサ機構240 と′110 たりC使用ざ4]
る。IPUはそれぞれの(内部)乗)7「/ 11,4
 ”jetロジックのクロックをとるためにこのクロッ
クを使用して、これらの多重サイクル機能で要する11
4問を短縮する。 クロックのサイクル期間の長さは命令毎に調節さね、各
命令に割り当てられる時間かその命令で指定されたデー
タ通路の経路指定で必要になる最小時間になるようにし
ている。各命令のサイクル維続時間はマイクロコ−1z
・アセンブラに割算させて、命令の二部に含めることか
好ましい。こうすると、サイクル期間の長さか固定して
いる場合よりも性能が向上する。サイクル期間の長さが
固定している場合は、すへての命令が最も遅い命令と同
じ時間かかってしまうからである。木好適実施例では、
サイクル期間の長さは100.125.150および1
75nSかサポートされているが、殆どの命令ハ最短の
サイクル期間の長さを使用するようになっている。 りしJツク−→ノイクルi;j:r?青ちイ^−号」に
よって延長−・]−ることb ’++]’ t(i憂℃
ある。このt、+lちイ吉−号(ま、イ列えは、メ;し
りか使用中てあったり、オフホードにあってそれらのア
クセス時間を追加のバッファリングのために延長する必
要かあるために、メ干りか通′畠のアクセス時間に応し
られないとき使用される。例えは、2ボー1−を備えた
VMEインタフェース・メモリはアドレスの衝突か起こ
ると、一方のボー1〜か待たされることになる。データ
・キャッシュ・メモリ+40Lj:FPモジコールと同
しコネクタを使用するメモリ・ボー1〜に搭載されたキ
ャッシュ・メモリ拡張モジュールで拡張可能である(第
43図に図示)。しかし、使用するメモリのタイプによ
っては、キャッシュ拡張モジュールへのアクセスか基本
キャッシュ140へのアクセスより遅くなる場合がある
。かかる場合には、待ち状態をクロック発生機構に人力
すれば、サイクル期間の長さは自動的に延長される。こ
の機能を使用すれは、はるかに低速で安価なメモリを拡
張子ジュール4310で使用でき、しかも性能の低下を
わずかに1r11えることかてぎる。 ポスI・はVMliハス・インタフェース会・通し−C
−クロック発生機構を制御できる。この1111a(l
 k:j:す、ホス1〜はクロック発生機構250を自
走ざIJるか、停止させるかを選択てきる。イア止状態
にあるときは、ホス]・はクロックを1ステツプt6り
進めることがて籾る。制御プロセッサ・モジュール11
Oとデータ転送プロツセッザ・干ジュール120は共に
1ステツプたり一緒に進められる。 クロック発生機構に最後に人力される制御は、バイブラ
イン・クロック(これは正富動作する)を除くすべての
クロックを禁止する制御である。 これは、WO2のロート(または読取り)時に使用され
るが、これらの処置をとっても、制御プロセッサ・モジ
ュール110やデータ転送プロセッサ・モジュール12
0の内部状態が壊されることかない。これの使用例とし
ては、マイクロコート・デバッグ・セツションで中断点
かWO2に設定された場合かある。 デバッグ バー1−ウJ−ア 制御allフ℃Jセソセ・モジコール110に含まれる
デバッグ・ハードウェアの殆どはすでに木明細書の各所
で触れた通りである。以下では、主要機能を要約する。 ポストは、読取り時と書込み時にマイクロア]・レス・
ハス211の制御権を受は取ることかできる。 ポス]・はWO2220をロートし、再びそれを読み戻
すことかできる。 制御プロセッサ・モジュール+10はVME発生割込み
(つまり、ホストからの割込み)を高優先度割込みとし
て受り取る。 ハードウェアによる中断点がサポートされており、中断
点は無制限にいつでも設定できる。 クロー・ロジックにより、ユーザのタスクはモニタ・タ
スクを1ステップ進めないて1ステップ進むことかてぎ
る。 ずへてのレジスタ&:l読み書きであるので、多くの通
7i’+データ流れを診断時に反転させることかできる
。 クロック制御人力によりマーrクロニ+ −1−を1ス
テップ進めることかてぎる。 すへての割込みは選択的にイネーブル(割込み可能)ま
たはディスエーブル(割込みM It: )させること
ができる。 重要なロジック群の内部状態がアクセスできるので、制
御プロセッサ・モジュール110八−トウエアの状態を
完全な形で格納し復元することかできる。 マイクロコート語の形式 第2B図は、FPモモジュール上置かれているWC52
20とWC5拡張部分に格納されているマイクロ命令の
構造を示した概略図である。中印のついた項目はWO2
から直接に取り出され、これらが制御する装置内部にバ
イブライン化されている。他の項目はWC5220の出
力側のレジスタに格納される。 十*印の付いたフィールドは物理的には1・P千シュル
上のwC5拡張部分に保管されているか、CPマイクロ
コロー語の一部になっている。これらのマイクロコ−1
・にJ:る処置の人1;1チ分はモジJ+−ル選択ロジ
ックによって修飾されるので、FT’干シコ−ルが選択
されなかった場合はなにも作用しない。 利用できるマイクロコート・ビットの総数は導入された
FPモジュール当たり96ビツトに追加の32ヒツトを
加えたビット数である。これらのビットは大部分か使用
されるか、いくつかのビットは予備ビットとして用層、
されている。 +pu 7寅算コート(32)* このフィールドはI
PU240整数プロセッサのデータ経路指定と算術また
は論理演算を制御する。フィールド内のヒツト割振りは
コーディングされる。すべての命令は下位24ビツトが
コーディングされる。上位8ビツトはデータをIPU2
40のレジスタ・ファイルに転送するときだけ使用され
る。(このフィールドの詳細はIPIIに関するメーカ
のデータ資料に記載されている。) シーケンサ演算ロー117)!このフィールドは八DS
T’ 1ull による次のアドレス情報を制御する。 (このフィールドの詳細はその部分のメーカのブタ資本
、Iに記II&さ、11でし入る。)定数/次アドレス
・フィールF(16)!このフィルトは主にシーケンス
にアドレス情報を与えるために使用されるが、16ビツ
I・定数値をデータ・バス上に送り出すためにも使用で
きる。そのあと、これはこのバス上の任意のレジスタに
ロードできる。 アドレス生成機構演算コート(10)*このフィルトは
ADSP +410アドレス生成機構を制御する。 (このフィールドの詳細はこの部分のメーカのデータ資
料に記載されている。) サイクル長さ(2)このビットは選択された命令とデー
タの経路指定に合ったサイクル長さを選択する。 データ・キャッシュ・アクセス(1)*このビットはデ
ータ・キャッシュ・メモリへのアクセスか自身で使用す
るために、あるいはFPとの間でデータをやりとりする
ために、制御プロセッサ・モジュールから要求されると
、活動化する。アクセス・フラグはパイプライン化され
ていないので、デ!87 タ転送ブUセッヅ ;けジュール120からのデータ・
キャラシフ要求との仲裁は要求が出されたヅイクルの開
始前に解決される。 データ・キャッシュ書込みイネーブル(1)このピッ]
・はデータ・キャッシュ・メモリでの書込みサイクルを
発生させる。 データ・キャッシュ書込みオール(1)このピッ1−は
通nの書込みイネーブル・グー1〜操作を無視して、デ
ータ・キャッシュ・メモリ内の語の選択的更新を可能に
し、それらをすべて強制的に書き出さセる。 データ・キャッシュ・ボート選択(1)このビットはF
Pモジュールの保持レジスタまたは制御プロセッサ・モ
ジュール110の保持レジスタのどちらかを、データ・
キャッシュ転送のソースまたは宛先として選択する。 データ・キャッシュ・メモリ長さ(3)これらのヒツト
はFP保持レジスタから取り出して、データ・キャッジ
J・メ干りに書き込まれる語の個数を指tJ三’l−る
。保持レジスタ内の最初の語はデータ・キャッジJ−・
メモリ ア1−レスの最斗位3ヒッ1−で指定される。 条件ツー1−選択(3)このフィール1−は条件イ」き
命令の実行時にシーケンサによってテス1へされる次に
示した条件コートの1つを選択する。条件コ)・とは、
IPo 240条件コード出力、FP状況(別のフィー
ルドによって選択された実際の状況)、FP中断点、マ
イクロロー1〜・ループ、フラグ(2項目)、保留状況
である。 CDバス・ソース(3)このフィールドは以下に挙げた
レジスタ、バッファまたは装置の1つを選択して、CD
バスを駆動する。つまり、IPU 240、コマンド・
メモリ190、データ・キャッシュ・メモリの保持レジ
スタ561の1つ中、モード・レジスタ、FPモモジュ
ール、アドレス生成機構アドレス・ホト、アドレス生成
機構データ・ボート、シーケンサ・データ・ボート、定
数7次71−レス・フィール!・である。(*ソースと
して使用する特定レジスタまたはバッファが別のフィー
ルドて指定されることを意味する。) CDハス宛先(3)このフィールF ’jJJ下に挙げ
たレジスタ、バッファまたは装置の1つをCDハス上の
データの宛先として選択する。つまり、コマンド・メモ
リ、データ・キャッシコ−・メモリ保持レジスタ、モー
ト・レジスタ、FPモジュール(レスとして使用する特
定子ジコ、−ルは別のフィール1−で指定される)、7
1−レス生成機構アドレス・ボート、アドレス生成機構
データ・ボート、シケンサ・データ・ボートである。 IPII 240が含まれていないのは、これはCDバ
ス上のデータをいつでも「取得」できるからである(こ
の機能はIPU命令フィールドによって制御される)。 アドレス・レジスタ制御(2)これらの制御ビットの一
方はアドレス・1ノシスタのローディングをイネーブル
し、他方のビットは診断とデバッグ・モニタが使用でき
るようにレジスタの読み戻しをイネーブルする。 干ジュール選択(3)最−に位ビット(同報選択)は残
りの2ビツト(モジュールID)をどのように解釈する
かを制御−・)−る。回報選択かOのときは、モジュー
ル(ID)はデータ・キャソシコ−・メ干りかCDバス
のどちらかとのデータ中云送に応答させる11N。 モジュールを選択する。同報選択か1のときは、モジュ
ールIDはどちらのグループのFl”(またはアルゴリ
ズム高速化機構)をデータ転送に応答させるかを選択す
る。これにより、同しデータを複数の宛先に同時に転送
てきるので、個々の書き込みよりも高速化される。これ
はモシローールへ転送する。ときだけ有効であることに
fl f、されたい。 というのは、複数の転送をモジュールから行なうと、デ
ータ・バスで競合が起こるからである。 モジュール選択モート(1)選択するモシローールがマ
イクロコード・モジュール・フィールドによって定義さ
れているか、モート・レジスタにJ:って定義されてい
るかを指定する。これにより、モジュールをサイクル単
位でも、あるいはグローバルにも選択できる。グローバ
ル法は存在するFPモジュールのいずれかで作業か行な
えるとぎ使用され、制御プロセッサ・モジコール+10
は転送/甜算サイクルを開始する前に使用すべきFPを
選択する。グローバル機能が使用可能でない場合は、個
々のFPモジュールに対応して異なる制御プロセッサ・
モジコール+10のルーチンか存在することになる。 中断点(11(峙デバッグ専用申*)命令に中断点を設
けるためにデバッグ・千二夕によりて設定される。命令
の実行中に割込みが起こると、その命令の実行か終った
あと、制御権かデバッグ・モニターマイクロコードに渡
される。 クロー(1)  (*希デバッグ専用*中)ユーザ・タ
スクを1ステツプ進めるとき、クロー−ロジックを始動
するように設定される。次の命令の実行中に割込みが起
こると、あるユーザ・タスクの命令が実行されたあと、
制御権がデバッグ・モニタ・マイクロコートに渡される
。これにより、ユーザ・タスクはクロックを物理的にオ
ン、オフに切り替えなくても、1ステツプ進めることが
できる。 割込みDTP (1)これは、16ビツト幅レジスタま
たは装置か読み取られるときのみ効力をもつ。この信号
はデータかセロ拡張さ、t′lているかくヒント】ト3
1かセロにセラ)・)、符号拡張されているか(ビット
+6−31 がビット15と同しにセラ[・)を選択す
る。 保留状況(1) このビットは、通んばシーケンサ21
0内部のFLAGレジスタの状態に従って更新される疑
似状況レジスタの更新を禁止する。通常、この疑似ビッ
トは内部レジスタの状態に従うか、割込みサービス中は
、この疑似ビットは更新されることから禁止される。こ
れにより、FLAGレジスタは割込みルーチンから出た
とき、正しく復元されることになる。 FP条件コート選択(3)**これらのビットは制御プ
ロセッサ・モジュール1]0のシーケンサにつながる共
通条件コート線を内部FPモジュール信号のうちのどれ
で駆動させるかを選択する。選択できるものには、cp
w八Iへ、 FPWAIT、バンク選択、直列ループ、
cp待ち割込み、FP待も割込み、FP中断点、FPエ
ラチーある。 ル]の内部レジスタ444のとわをCDハス紅出て読み
i+’、、 dするかを選択する(下位16ヒツl〜の
/7.I)。レジスタとバッファには、転送制御レジス
タ、Fi1制御レジスタ、開始71〜レス・レジスタ、
命令レジスタ(8ヒツト)、状況レジスタ(ソスのみ)
かある。 レジスタ方向(1戸中このヒツトはレジスタを読取るか
、書き込むかを選択する。 F P 中断点クリア(1)峙このビットはFP中断点
をクリアして、FPクロックか動作するようにする。 開始アドレス・ジャンプ(1)**このビットはFPシ
ーケンザに開始アドレス・レジスタ(制御プロセッサ・
モジュール110によってロードされた)を次に実行す
る命令のア1−レスとして使用させる。これは「ワンシ
ョット」動作て行なわれるので、FPが開始アドレスに
ある命令の実行を終えると、FT’シーケンザはその通
常動作子−Fに戻る。 転送制御(20)**このフィール1〜は保持レジスタ
420(FPモモジュール上)とFP千ジュールの高速
レジスタ・ファイル430間のデータ転送を制御する。 ここでは各ヅフフィールトh)i’;i’i i[!に
説明ざ打ているか、これは転送メカニズノ\仝体か明ら
かになれば、それらの使い方か分かるはずであるからで
ある。 方向(1)このビットは保持レジスタ420とレジスタ
・ファイル430間の転送方向を判定する。方向は保持
1ノジスタからレジスタ・ファイルへと、レジスタ・フ
ァイルから保持レジスタへのどちらかである。 転送イネーブル(1) このビットは他のマイクロコー
ド・ビットとレジスタ格納制御ビット(転送制御レジス
タ内の)で定義されている通りに、転送サイクルを開始
する。 レジスタ・ファイル・アドレス(6)ここで指定される
アドレスはデータかそこから読み書きされるレジスタ・
ファイル内の最初の語のア!・レスである。 レジスタ・ファイル・アドレス修飾子(2)これらはレ
ジスタ・ファイル・アドレスをとのように修飾して、物
理的、論3jli的またはプレビュー・アトレス1旨ン
[干−1・(これらはずへて、レジスタ・ファイルを制
御プロセッサ・モジコール+10とFP間てどのように
共用さ−lるかと係わりかある)をとり人ねるかを指定
する。 保持1ノシスタ開始アドレス(3)これは転送で最初に
使用する保持レジスタを指定する。 保持レジスタ開始アドレス・モーF(2)保持レジスタ
開始アl−レスは次の3ソースのいずれかから取り出さ
れるように指定できる。 1、前述したCPマイクロコ〜ト・フィールドから。 2、FPモジュールの転送レジスタに保持されているフ
ィール1〜から。 3キヤツシユへの最後のアクセスで使用されたアドレス
の最下位3ビツトから。 ハントシェイク・モード(3)ハントシェイク・モード
は制御プロセッサ・千ジュール+10とFPとのパン1
〜シエイクをFPW八IへとCPW八Iへのイ士組とバ
ンク彦根を通して制御する。これらのモー1゛のいくつ
かは通71り′のハントシェイキング・プロシーシャを
無効にするので、主要信号をデバッグ目的に初期設定し
たり、セットジノごりてきる。±−1−に6:1にPD
ONFセッl−、レジスタ・ファイル スワップ要求、
にPDONEセットとスワップ要求、CP D O旧・
クリア、テス1−・モート(診断たりに使用)、ノーオ
ペレーションがある。 2重書き込みイネーブル(1)2重書き込みイネーブル
は、長さや開始パラメータで要求するものを転送する代
わりに、2語をレジスタ・ファイルに転送させる。これ
により、有効なデータにはブタ有効主張フラグが付けら
れ、無効データにはデータ有効拒否フラグが付りらねる
。これらのフラグはどのデータ項目が有効であるかを確
かめるために、FPによってテストされる。 全保持レジスタ・クロックこのビットは、ブタをレジス
タ・ファイルから保持レジスタに転送するとき、通常の
保持レジスタのクロック順序(=Jけを無視する。この
ピッ1〜が活動しているときは、すべてのレジスタは順
次にではなく、−緒にクロックがとられて、レジスタ・
ファ一〆ル・ブタが4コピーされてずへての保持レジス
タに格納さ、jする。 データ中i、’4フ゛ロセ・ンザ・モジ−q、  )し
120第3図はデータ転送プロセッサ・モジュール12
0のブロック図である。同図に示すように、D1’Pモ
ジュール120にア[−レス生成1m 4M 230の
ような独立のアドレス生成機構110が含まれていない
点を除けは、制御プロセッサ・干ジュール110と卯花
によく似ている。各プロセッサ内の特殊目的機能か使用
されない場合は、原理的には、同しマイクロコート(ソ
ース・レベルの)を両プロセッサで実行させることが可
能である。 データ転送プロセッサ・千ジュール120は16ビツ1
〜・シーケンサ310で制御される32ビット整数プロ
セッサ機構(IPII) 340をヘースとした32ビ
ツト・マイクロコート・プロセッサである。データ転送
プロセッサ・モジュール120内の主データ通路は転送
データ・ハス(TDババス122である。 木実施例によるDTPモジュール120構成部分の多く
は制御プロセッサ・モジュール110構成部分と非′畠
にJ:<似ている。これら類似部分は同じ参I)―石−
υで示しである。征つ−(、シーケン−93+o i;
を書込み可能制御機構320に夕」してマイクロ命令ア
ドレス311の列を提供する。シーケンサ310はレジ
スタ314を経由してTDババス22 とのインタフニ
スになるだりでなく、マルチプレクサ312を通して条
件ロー1−を受り取り、マルチプレクサ313を通して
割込みを受は取る。制御記憶機構320からアクセスさ
れたマイクロ命令は出力321 として得られ、レジス
タ格納出力もレジスタ332を通して得られる。線31
111と225はホストからこの書込み可能制御記憶機
構320へのアドレスとデータのインタフェースとなる
(これは下達する)。(線324は直列アクセスで使用
される書込みイネーブル線である。)直列/並列シフ1
〜・レジスタは非レジスタ格納人力を受は取る装置の内
部状態を格納するシャドウ・レジスタである。16ビツ
ト・シーケンサ・バス35からも、16ビツト人力かシ
ーケンサ310に送られる。この人力はバッファされた
人力であり、これは例えば、リテラル値を人力するため
に使用て各る。 マイクロ命令321 はレジスタ格納人力としてデコ−
1・ ロジック31]0に送られる(シャFつ・レジス
タ322経由て)。このデコート・ロジックの出力36
1は制御人力して整数処理機構340、シーケンサ31
O1各種−〆ンタフェース150.160、+70に人
力される。特に、デコーダ360の出力はTDババス2
2へのアクセスを制御する。TDハス122は外部イン
タフェースと、キャッシュ・メモリ140 とのデータ
・インタフェースとなっている。デコーダ260の場合
と同様に、デコーダ360の出力が別に示されていない
のは、これらの出力が広範にわたるからである。 整数処理機構340は制御プロセッサの場合と同根に、
l’1eitek XI、8137を使用するのが好ま
しい。 (たたし、データ転送プロセッサでは、アドレス生成は
それ程重要でないので、アドレス生成機構を別に設ける
必要かない。)整数処理機構340はTDババス22と
の2ウエイ・インタフェースをもっており、レジスタ3
41 を通してTババス+21 にア)・レス出力を送
り出すこともてきる。 データ転送の制御 ソース・ボートと宛先ボートどの間゛(ザー〆クルごと
に1転送かてきるJ:うに−・j−るために幻、いくつ
かの要因を考慮する必要かある。 1、転送のソースまたは宛先はFIFOてバッファリン
グされることがあるので、転送制御はFIFO上の満杯
と空のフラグに応答する必要がある。これらの信号のタ
イミングをシーケンサへの条件ツー1〜人力のバイブラ
イン化と併用すると、転送か1つだけオーバランするこ
とがある。FIFOへの転送の場合は、半満杯フラグが
使用されるので、これは問題でない。半満杯フラグを使
用すると、FIFOに予備容量が十分にあるので、オー
バランした1語または2語を受は入れることがてきる。 FIFOから読み取るときは、他の方式を使用する必要
がある。”empty+I”フラグをもつFIFOを使
用したり、FIFOデータをバイブライン段て遅らUる
オプションは本好適実施例では使用されていないか、こ
れはコスト上の理由とスペース要求量の理由によるもの
である。 この起こりi[Iる問題を解決するために、2つの方法
か川だ、され−〇いる。これらの2力?大のともらを使
用するかは、宛先かメモリであるか、FIFOであるか
によって決まる。違いは、書込み操作がメモリでは元に
戻せるか、FIFOてはできないことである。つまり、
FIFOからメモリへのデータ転送がFIFOか空にな
ったあどて1語または2語に対して続けられると、エラ
ー・データがメモリに書き込まれることになる。しかし
、このデータは正しいデータか使用可能になった時点て
直しに重ね書きすることかてきる。 a、FIFoを読み取るとぎは、読取り信号は論理的に
FIFO空信号によ)て修飾される。この結果、空のF
IFOを読み取ろうとしても、実際には読取り操作は行
なわれない。これにより、FIFO読取りがオーバラン
しても問題は起こらない。FIFOは空のときは自身を
読取りから保護するが、この余分の制御が必要なのは、
オーバラン読取り時にFIFOの他側に書込みが行なわ
れるおそれかあり、そのためにデータか壊されるからで
ある。従って、データ転送プロセッサ・干シーI−ル1
20かデータをメ+9に転送するときは、FIFDか空
になるとイ゛、゛止する。この時点てオーバランかすて
に起こっている。この場合は、 DTPモジコ、−ル1
20かアドレスを追跡てきるので、データがFIFOて
使用可能になったとき、なにもなかったかのように転送
か再開される。 b、FIFOに書き込むときは、書込み操作は元に戻す
ことができない。従って、異なる方法か用いられてしす
る。。マイクロロー1〜は、中云送を始める前にソース
FIFO(と宛先FIFO)からの状況をテスI〜する
。このモードでは、転送速度は低下する。しかし、ソー
スFIFOか半満杯以上になった場合は、マイクロコー
ドは高速転送モートに切り替わる。この状態が起こった
ときは、ソースFIFOの深さの半分までが空マークを
通り過きないで読み出すことができる。従って、このモ
ートでは、DTPモジコル120は状況検査のために停
止しなくても、このサイズのブロックを転送することか
できる。受人れ側FIFOの状況は、それか半満杯以下
でなりれは、なお検査か必要である。低速転送モートど
高速転送モーl−間を切り替えるこれと同し手法をメモ
リにも使用することができることは勿論である。 2、シーケンJJilO内の3ウ工イ分岐命令(BRA
NCI+と呼はれる)を使用すると、転送された語数を
記録しておき、HF口口状化信号テス1−することかで
きる。この方法によると、条件付き経路でIPυ340
を使用しないで済むので、サイクル長さを短縮すること
ができる。 3、データ・キャッシュ・メモリとの間のデータ転送を
最適化するために、TDハス122 どのデータ・イン
タフェースは、32ビツト・レジスタが8個用意されて
いるレジスタ・バンク560B (第5図参照)にバッ
ファされる。これにより、DCMから見たとき、読取り
と書込みを完全に並列に行なうことができる。この経路
には2重バッファリングがないので、長い転送(〉8浮
動小数点語)は自動的に中断されることになる。データ
転送プロセッサ・モジュール120は従って、メモリ・
サイクルか現れるまで転送を一時中止することに1((
る。この中断は連続転送が使用されないで、より多くの
メモリ・アクセス・サイクルが必要であるとき、頻繁に
行なわれることになる。 4データ・キャッシュ・メモリの仲裁はCPモジュール
のヅイクルの始まりて決定される。データ転送プロセッ
サ・千ジュール120か制御プロセッサ・モジュール1
10と非同期に稼動していた場合(命令依存サイクル時
間を可能にするために)は、データ転送プロセッサ・モ
ジュール+20は同期時間が100nsまで、さらにア
クセス時間か100nsまで待たされる場合がある(ア
クセス時間は、制御プロセッサ・モジュール110に優
先権があるので、さらに長くなる可能性があり、DTP
モジュール120は空きメモリ・サイクルを待だなりれ
はならない。)さらに、シーケンサに対するマイクロコ
ード命令とFl、へG人力をパイプライン化すると、さ
らに別の遅延が起こり、その間DTPモジコルは転送が
終ったかを確かめるためにループすることになる。 これらの遅延を最小にするために、制御プロセッサ 千
シ:I−ル110とデータ転送プロセッサ・モジュール
120は同しマイクロコート・クロック発生機構を共用
している。両プロセッサはそれぞれの最適サイクル時間
を要求し、クロック発生機構は最も長いザイクル時間を
選択する。これによってどちらかのプロセッサの平均速
度が大幅に低下しないのは、命令の大部分か最短ザイク
ル時間で実行されるからである。ループ時の遅延を克服
するために、仲裁は非しジスタ格納マイクロロー1〜要
求ビットを用いて行なわれる。 この解決手法の唯一の欠点は、ハードウェアによる単一
ステップを用いるときは、両プロセッサに影響を与える
ことである。 5従って、FIFOかソースまたは宛先であるときは、
FIFO状況信号(場合によっては、データ・キャッシ
ュ・メモリ仲裁信号)を転送時にモニタする必要かある
。これらの4個の状況信号(ll’lFO満杯、FIF
O半満杯、FIFO空、キャッシュ・アクセスW「可)
か−回のサイクル内で干二りできるようにするために、
データ転送プロセッサ・士シーS−ル120は多重ウェ
イ分岐機能をもっている。これにより、テストずへき状
況かジャンプ・ア1ヘレスに挿入されるので、ジャンプ
する先のアドレスはそのサイクル時の状況によって決ま
る。3つの1・IFO状況状態は2ピッ1−にコート化
され、仲裁18号は3番目のビットを構成する。これに
より、8ウ工イ分岐が得られる。FIFO状況だけに関
心があるときは、仲裁信号はディスエーブルできるので
、多重ウェイ分岐は4ウエイに減らされる。 6、制御プロセッサ・モジュール110(またはFPモ
ジュール130)が各サイクルでデータ・キャッシュ・
メモリ140を使用中のときデータ転送プロセッサ・モ
ジュール120かキャッシュ・メモリからロックアウト
されるのを防止するために、割込みが用意されている。 データ転送プロセッサ・モジュールがアクセスを拒否さ
れると、転送承認信号でループを開始する。この状態に
おりるタイムアウトは簡単にテストシて調へることかて
きる。タイムアウトが起こると、データ転送プロセッサ
・ごヒシ:I−ル120は制1allブ
【′Iセソジ・
モジュール110に割込みをかりることかできる。これ
によりデータ転送プロセッサ・モジュール120はメモ
リ・アクセス・モートから出て、再びデータ転送プロセ
ッサ・モジュール120はこの干−トに入る。 整数プロセッサ機構340 IPII 3110は、本好適実施例ては、ずでに述へ
た制御プロセッサ・モジュール1.10のTPo 24
0とほぼ同しである。 シーケンサ310と関連支援ロシック シーケンザ310は、本好適実施例では、すでに述べた
制御プロセッサ・モジュール110のシーケンサ210
とほぼ同しである。 シーケンサ支援ロジックには、割込み、条件コト選択、
マイクロア1〜レス・バス、定数/次アドレス・フィー
ル1〜の4種類かある。 泄込及 シーケンシは4つの割込み人力ビンをもっているたりで
ある。従って、この数を8に拡張するために、外部マル
チプレクサ313が使用される。割込みGJ主に連絡と
デバッグ・ツールのリボ−トのために使用される。 割込み発生源(優先度順)は次の通りである。 クロー・ロジックと中断点:この割込みレベルはクロー
・ロジックと中断点ロジックの間で共用される。これら
の2割込みタイプの機能は、制御プロセッサ・モジュー
ル+10内のシーケンサ210の機能と関連づけて上述
した通りである。 VMEバス(デバッグ):VMEバスM1込みは通常デ
バッグ・モニタをサポートする目的たけに使用されるの
で、正常動作時には使用されない。 VMEバス(コマンド)・ この割込みレベルは、コマンドがコマン)・・レジスタ
に保管されるとセットされる。 制御プロセッサ(コマンド)、この割込みが起こるト、
制御プロセッサ・モジュール110はコマン1〜がDT
PコマンドFIFOにあることをデータ転送プロセッサ
・モジュール120に通知することかできる。** VMEデーデーIFOこの割込みレベルは、ある種のう
−一タを夏りルっだか(人力FIFO) 、データかな
くなったので(出力Fll・Q) 、VMEインタフニ
ス内のデータFIFOにアテンションか必要であること
をデータ転送プロセッサ・モジュール120に通知する
ために使用される。* GIPインタフェース GIP割込みはGIP FIF
O状況信号によって引き起される。 データ・バイブ・インタフェース この割込みレベルは
、ある種のデータを受は取ったのてブタ・パイプ・イン
タフェース内のFIFOの1つにアテンションか必要に
なったとき、データ転送プロセッサ・モジュール120
に通知するために使用される。十 マイクロコート拡張インタフェース この割込みは拡張
カード(例えは、大容量メモリ・カートやネットワーク
・カー1〜)のいずれかて使用するために予約されてい
る。 注意 *印のイ」いた割込みは通常の条件コード・ロシ
ッつてテスl−てきるので、それか望ましい場合はポー
リングが可能である。 ^・印のイ」いた割込みの場合は、割込み状Cμを弓き
起した事象は、ソフトウニアト11・0データ構造内の
制御情報を調へることて検出することかできる。割込み
を使用しない場合は、これをポーリングすることか可能
である。 割込み数を拡張するためにマルチプレクサ313を使用
する場合は、4つの高優先度割込みレベルと4つの低優
先度割込みとの間でタイミング条件か異なることになる
。高優先度割込みであることを認識するためには、割込
みをマイクロ命令1〜・クロックの立上がり縁の25n
s前に引き起す必要がある。低優先度割込みの場合は、
その期限は立下がり緑の15ns前である。 割込みを引き起すために、対応する割込み人力は1クロ
ツタ期間高に保持される。ハードウェアによる割込み承
認サイクルは必要ないので、割込みを引ぎ起ずハードウ
ェアは非常にJli純である。 条件コート・ロジック シーケンサはFl、AGと名付りだ条件ローI〜入力端
を1つ6っているので、ずへてのデス1〜可能4人沙7
信号は多重化され゛にのビンに人力される。これは内部
レジスタに格納され、通常セラ1−アップ時間はIRQ
にマスクかh>iづられているどぎは(カウンタ・アン
タフローJIJ込み) 1(lnsであり、イネーブル
されたときは26nsである。FLAG入力端の極性は
シーケンサ内部で変更することか可能である。 (以下余白) D 1’ Pモジコール14:cP士ジュールと同れに
、第40A図に示すような疑似レジスタ・ロジックを備
えている。(これは割込み処理から戻るときの問題を避
けるためのものである。) テスト可能な状況信号には、次のものがある。 IPU 340条件コーロー出力(COND) :この
信号は現命令の状況を中継する。IPU 340がこの
ビンから出力する特定条件はマイクロ命令でコーディン
グされる。 マイクロコート・ループ これはVMEインタフェース
制御レジスタ内の状況ビットであり、診断ソフトウェア
で使用されるものである。 以下に挙げたFIFOに対するFIFO状況信号 ブタ
・バイブ人力#l(半満杯と空)、データ・バイブ人力
#2(半満杯と空)、データ・パイプ出力#1(満杯)
*、データ・パイプ出力#2(満杯)*、VMEデータ
人力(半満杯と空) 、VMEデータ出力(半満杯と空
)、GIPインタフェース(人力)(半満杯と空)、G
IPインタフェース(出力)(満杯、半満杯と空)。*
印の付いた信号は別ザブシスデl\土の受入れFil・
0から出されるものである。 データ・キャッシュ・メモリ・ヅイクル承認こねはデー
タ・キャッシユ・メ士りへのアクセスが許可されたこと
を示す。 マイクロコート拡張インタフェース条件コード信号・こ
れは状況をデータ転送プロセッサ・モジュールのシーケ
ンサ310に返却するためにいずれかの拡張インタフェ
ース180によって使用される。 DMAハス・エラー この状況ヒツトは、VMEパス上
のDMA転送がハス・エラー発生が原因で途中で打ち切
られたとき活動化する。このエラーが最も起こり得る原
因としては、存在しないメモリがアドレス指定された場
合がある。 書込みフラグ0と1.これらの2信号はデータ・キャッ
シュ・メモリ書込みロジックの内部状態をアクセスしや
すくする。これらは、デバッグ・モニタにある状態スレ
ーブと復元マイクロコードたりによって使用される。 保留状況、これは、割込みから戻ると籾テストされ、そ
のIi’j果、条f′+ (;JぎシャンブノJとか割
込みサービス・ルーチンへのジャンプによってディスエ
ーブルされていても、正しく実行される。 IPU 340からのC0ND出力は、100nsてサ
イクルするときは、シーケンサのセットアツプ時間に間
に合わない程遅れて有効化される(特に、マルチブレサ
クサによ〕て遅延されたとき)。この条イ!1をテスト
するときは、クロックを125nsまて延長する必要か
ある。 ”for 1oops”は、シーケンサ内部のカウンタ
の1つを使用すると、とり入れやすくなり、IPU31
10をアドレス計算から解放することができる。勿論I
P0340を使用しても可能であるが、サイクル時間が
長くなり、それだけ余分のオーバヘットが生しることに
なる。 条件コートは241マルヂブレクサ312を通して多重
化されて、シーケンサ310のFLAG入力端に人力さ
れる。シーケンサは選択した条件コート信号の極性を内
部レジスタに格納して、それを選択する。 マーtクロ)−′1〜レス・ハス:111マイクロアド
レス・ハス311は、2つのソースつまり、正割プログ
ラム実行時にはシーケンサ310から、マイクロコート
のロー1・時にはVMEバスから駆動させることかでき
る。VMEハスはマイクロアドレス・ハス311の内容
を読み取って、シケンサ310かどのアドレスにあるか
を確かめることもてきる。これはシーケンサ動作と非同
期に行なわれ、主に診断で使用される。このバスの拡張
部分は3]IB線で示されているように、ホスト・イン
タフェース・ロジック160に結ばれている。 定数/次アドレス・フィールド これは、シーケンサ210に関連して上述したもとのは
全く異なる方法で使用される。DTPモジュール120
では、マルチウェイ分岐機能を向上するためにいくつか
の新規なロジックが使用されている。このロジック(お
よびマルチウェイ分岐でのその用法)について、以下説
明する。 マルチウェイ分岐 第3八図と第3B図に示す実施例では、マイクロコ−1
−・システムにおりるマルチウェイ分岐に新規な機能か
いくつか追加さ、hている。第30図は、アドレス境界
の制約を受りることなくマルチウェイ分岐を行なうため
に本好適実施例で採用されているマイクロコート動作を
概略図で示したものである。 第3A図から明らかなように、定数/次アドレス・フィ
ールド(マイクロ命令フィールドからのもの)はバッフ
ァ317に対して設けられただけでなく、マルチウェイ
分岐ロジック318に対する入力ともなる。マルチウェ
イ分岐ロジックはマイクロコート・アーキテクチャに新
規な機能をもたせる仕方でこの信号を処理することがで
きる。このマルチウェイ分岐ロジックに対する他の人力
としては、PIF状況信号、およびシフト・コマンド(
これはシーケンサ310によって実行されるマルチウェ
イ分岐ステップにおい゛C1代替宛先間の増分を変える
ために使用される)かある。 M3B図は詳細図である。マイクロ命令ハス311から
の定数フィール1〜(16ビツト)は分割されて])Δ
13J8 どハッンア317 に対する人力か得られる
。共通イネーブル化分は、マルチウェイ分岐操作か望ま
しいとき、これらの両方を活動化するために使用される
。(勿論、シーケンサ・バス315は他にも用途が多数
あるので、マルチウェイ分岐操作が必要になるのはまれ
である。)さらに、定数/次アドレス・フィールドは、
単純なジャンプ操作でもよく使用され、そのような場合
には、マルチウェイ分岐操作か必要になる。 第30図は、マルチウェイ分岐ロジックの内部操作をさ
らに詳しく示している。条件選択/コード化ロジックに
は、各種条件および状況信号が用意されている。これは
これらの条件を選択し、コド化して、分岐で使用できる
3ビット信号を得るものである。 マルチウェイ分岐ロジックは以下で詳しく説明するよう
に、いくつかのマイクロ命令ビットで制御される。 この種のマルチウェイ分岐ロジックを干ジュル120の
ようなデータ転送プロセッサで使用すると、特に利Cル
、か得られる。その場合には、装置条件信号を選択/コ
ート化ロジック301Oに苅する条件人力として使用で
きる。そうずれは、データ転送プロセッサはかなり複雑
なインタフェースに夕・1して高度の制御を行なうこと
かてぎる。関心のある状況信号が現れると、マルチウェ
イ分岐ロジックはその条件を処理するのに相応しいルー
チンに直ちに移ることができる。マルチウェイ分岐機能
により、シーケンサは複数の装置の条件を1回のサイク
ルでテストすることかできる。つまり、DTPモジュー
ル120は各サイクルごとにデータ転送を行なうことが
できる。この結果、1つだけの条件コード(FLA6)
入力端をもつシーケンサは複雑な制御を行なうこともで
きる。 本好適実施例では、選択/コート化ロジック3010に
対する人力には、下達するように4個のFIFOからの
状況ビットがある。しかし、他の扛々な人力構成を使用
できることも勿論である。 シフト人力はシフトとマージ・ロジックに対するもので
ある。これは、マルチウェイ分岐の宛先間のJCj分を
変えることを可能にする。 第30図の右側はシーケンサ310か相対アドレス指定
機能をもつことを概略図て示したものである。この機能
をマルチウェイ分岐機能と併用すると、アi・レス境界
の制約を無視てきる。これはブタ転送プロセッサでは特
に利点かある。この種のプロセッサはデータ転送を小刻
みに行なえる能力か要求されるので、マルチウェイ分岐
命令を多数含めておくことが望ましい場合がある。アド
レス境界の制約がなくなったのて、この種の命令を大量
に使用できる。 本好適実施例ては、プログラム・カウンタがジャンプ宛
先に対する人力として使用されている。 これは、従来の多数のマルチウェイ分岐では、宛先ヘー
ス・アドレスを別のソースから得ていたものと認なるも
のである。 書込み制御記憶機構(WC5) 320WC5はマイク
ロコートSILモジュールを用いて構成されている。こ
れらは8バx32 ビット・メモリてあり、マイクロコ
ートと診断機能をロートするための直列走査パイプライ
ン・レジスタをイメI“1λている。このモジュールは
2種類のものか使用される。レジスタ格納出力と非レジ
スタ格納出力である。IPU 340とシーケンサ31
0は独自の内部バイブライン・レジスタをもっているの
て、非しジスタ格納版を使用する。 WCSインタフェース・レジスタ322と323は制御
プロセッサ・モジュールの個所で」二連したWCSイン
タフェース・レジスタ223 と222と同じ働ぎをす
る。 DMAコントローラ DTPモジュール120の重要な機能は、VMEインタ
フェース160と、場合によつCは、1つまたは2つ以
上の他のインタフェースにある1つまたは2つ以上のD
MAコントローラを制御することである。この機能は、
それぞれのインタフェースと共に、以下で詳しく説明す
る予定である。 モート・レジスタ303は、使用頻度か低く、マイクロ
コ−1〜 ヒンI〜を専用さセるたりの理由かない制御
信号のイ11°lを保持するものである。モート・ビッ
トには、読取り保持レジスタを通る流れとレジスタ制御
、書込み保持レジスタを通る流れとレジスタ制御、マイ
クロコート拡張インタフニスにおいて割込み承認信号を
駆動する外部割込み承認信号、GIP割込み要求、保持
レジスタに対するループバック・モー1−12個の1.
ED制御イ3号がある。 TDハス・デコード このロジック(これはデコーダ360の最も重要な機能
の1つである)は、マイクロコードTDソスをデコート
化し、TDババス22を駆動できる装置の出力イネーブ
ルをその結果に応して制御する。 また、このロジックはTD宛先フィールド(クロック発
生機構250からの書込みゲート信号で修飾されている
)もデコート化して、スロープと書込みイネーブル信号
を発生する。TDババス22上のポートの大部分は読み
書ぎかできるので、IPll上の疑似レジスタは不要で
ある。 TDハス・ソースおJ:び宛先に2了り得るものとして
l;I:、 IPU 340、VMEイ:/ 夕’:l
/ 工2 ・メ−”C: ’)、二1マント・メモリ、
データ・キャッシュ・メ干り保持レジスタ560B、モ
ート・レジスタ(8ビツト)、シーケンヅ・データ・ボ
ート**、定数/次アドレス・フィールド(ソースのみ
)Φ*、VMI:ブタFIFO、データ・バイブ1、デ
ータ・バイブ2、GIP FIFO**、割込みベクト
ル・レジスタ(8ビツト)、DMA制御レジスタ、DM
Aコントローラアドレス・カウンタ*、DMAコントロ
ーラー語カウンタ申がある。*印の付いたソースはDM
Aコン1−ローラ命令によってデコートされる。通路の
TDババス御フィールドの一部としてはデコートされな
い。峙印の付いたソースは、下位16ビツトだけを駆動
する。これらの1つが選択されると、符号/ゼロ拡張P
AL2]6も活動化されるので、データは32ビツトの
バス幅まで符号またはゼロで拡張される。 1つのソースと1つの宛先だけが選択可能であるので、
これらは異なフていなりればならない。 IPll 340へのデータ転送はIPII 340の
命令フィールドの制御を受りて行なわれるので、データ
が別の宛先にロートされているのど並行してデータをT
Dババス22から取り出ずことかてきる。 クロック発生機構 上述したように、クロック発生機構250は、ブタ転送
プロセッサ・モジュール120全体を通して使用される
基本クロック信号を発生ずる。 デバッグ・ハードウェア データ転送プロセッサ・モジュール+20に含まれるデ
バッグ・ハードウェアの大部分はいくつかの個所で前述
した。これらをここで要約して示すと、次の通りである
。マイクロアドレス・バス311  (読み取りと書込
みの両方)のホスト制御、ポストによるWO8のローデ
ィングと読み戻し、DPTのアテンションを得るための
VME生成割込み、ハードウェアによる中断点サポート
(中断点は数に制限されずに、いつでも設定可能)、ク
ロ・ロジック(これにより、ユーザ・タスクはモ・タス
クを1ステップ進めないで1ステップ進むことかできる
)、ずへてのレジスタか読み、1:ン\であること、マ
イクロロー1〜を1スデツプ進めるためのハードウェア
によるクロック1bり御、ずへCの割込みが選択的に割
込み可能または割込み禁止できること、重要なロジック
iffの内部状態に対するアクセス(これにより、 D
TPモジュールのハトウェア状態を完全に格納し、復元
することができる)などである。 マイクロコート語の形式 マイクロコート語の形式の概要を示したのか第3C図で
あり、次のように定義されている。 *印の付いた項目は直接にWO2から取り出されて、こ
れらが制御する装置内部でバイブライン化される。 使用可能なマイクロコート・ビットの総数は96ビツト
である。これらのビットは大部分か使用されるが、その
いくつかは予備として以下のフィルトから除かれている
。 IPII演算コート(32)*  : コノ7 イール
l’はIPLI340整数プロセッサのデータ経路と算
術または論理rili T、’、tイー制御−→−る。 フC−ルI・内のヒラ[・の割振りはコート化されてい
るか、詳細はWeitekデータ資料に記載されている
。ずへての命令は下位24ビツトかコート化されており
、」−位8ピッ1−はデータをTPU 340のレジス
タ・ファイルに転送するときだけ使用される。 シーケンサ演算コート(7)*  このフィールドはA
DSP 1401 による吹のアドレス生成を制御する
。 命令セットはデータ資判に記載されている。 定数7次フィールド(16)申 このフィールドは主に
アドレス情報をシーケンサに与えるために使用されるが
、16ビツト定数値をデータ・バス上に送出するために
も使用できる。その場合は、これはこのバス上のレジス
タのいずれかにロードすることが可能である。 マルチウェイ分岐選択(2)*・このフィールドはマル
チウェイ分岐操作時にFIFO状況信号のどちらのセッ
トを使用するかを選択する。選択できるものには、VM
F人力FIFO1GIP人力FIFO、データ・バイブ
1人力FIFO、データ・バイブ2人力FIFO1かあ
る。 マルチウエイ・シフト制御(2)   これはマルチウ
ェイ分岐状況情報かビット位fV; 0、ヒ・ン1〜位
置1、ビット位置2から挿入されること、あるいは全く
挿入されないことを選択する。シフ1〜要因は多様化さ
れているので、マルチウェイ分岐内の各人口点をそれぞ
れ、1.2または4命令の長さにすることができる。 マルチウェイ分岐転送イネーブル(1)   このヒラ
1−はキャッシュ・メモリ・アクセス許可43号をFI
FO状況と結合するのを可能にしたり、禁止したりする
ものである。このビットが使用されないときは、マルチ
ウェイ分岐は4ウエイであり、使用されるときは、8ウ
エイである。 サイクル長さ(2):このフィールドは選択された命令
とデータ経路に合ったサイクル長さを選択する。 データ・キャッシュ・アクセス(I)*  このビット
は、データ・キャッシュ・メモリへのアクセスがデータ
転送プロセッセ・干ジュール120によつて要求される
と活動化する。 データ・キA・ンシJ)jt込みイネーブル(1):こ
のヒラl〜はデータ・キャッシュ・メモリへのアクセス
か許可されると、データ・キャッシュ・メモリて書込み
サイクルを発生させる。 データ・キャッシュ書込みオール(1):このビットは
通餡の書込みイネーブル・ゲート操作を無効にして、デ
ータ・キャッシュ・メモリ内の語の選択的更新を可能に
し、すべての語が書き込まれるようにする。これは、ア
クセスが許可されたときたけ、データ・キャッシュ・メ
モリ書込みサイクルを発生させる。これはメモリ・ブロ
ックを定数値にセットするときに便利である。 条件ロー1へ選択(5)・このフィールドは条件付き命
令の実行時にシーケンサにテストさせる以下に挙げた条
件コートの1つを選択する。つまり、IPU 340条
件コート出力、マイクロコード・ルブ、ゼ)込みフラグ
(2項目)、データ・バイブ人力FIFO#l (半(
1′lJ杯と空)、データ・バイブ入力++rro#N
半満杯と空)、データ・バイブ出力FIF。 #1(満杯)、データ・バイブ出力)・11・O#2(
τ1ン1イイ・)VMEデーデー力FIFO(半満杯と
g;;) 、 VMI・データ出力FIFO(半満杯と
空)、GIPインタフェース(人力)(半満杯と空)、
GI11インタフェース(出力)(半満杯と空)、デー
タ・キャッシコ・メ干す・サイクル承認、マイクロコー
ド拡張インタフェース条件コート・インタフェース、D
MAバス・エラー、保留状況である。 保留状況(1)   このビットは通常はシーケンサ2
10内のFL八へレジスタの状態に従う疑似状況レジス
タの更新を禁止する。通常、この疑似ビットは内部レジ
スタの状態に従うが、割込みサービスの実行中は、更新
されるのを禁止される。これにより、FL八へレジスタ
は割込みルーチンから出たとき正しく復元される。 TDババスソース(4)  、このフィールドはTDハ
スを駆動させる以下に挙げたレジスタ、バッファ、また
は装置の中から1つを選択する。つまり、IPU 34
0、コマンド・メモリ、VMIミインタフェース・メモ
リ、データ・キャッシュ・メモリ保持レシスタ、(−−
−1:・レジスタ、シーケンシ データ・ボー1−1定
数/次アドレス・フィール1〜、シーケンシ・データ・
ボート、定数/次ア1−レス・フィール1〜、VMEデ
ーデーll・0データ・ボート、データ・バイブ2、G
IP FIFO1割込みヘク)・ル・レジスタ(8ヒ゛
・ント)、DM八副制御レジスタDMAコントローラー
アドレス・カウンタまたはDMAコントローラー詔カウ
ンタである。 TDハス宛先(4)  このフィールドけ以下に挙げた
レジスタ、バッファまたは装置の1つをTDババス上デ
ータの宛先として選択する。つまり、コマン)〜・メ干
り、VMEMンタフェース・メモリ、データ・キャッシ
ュ・メモリ保持レジスタ、モート・レジスタ、シーケン
シ・データ・ボート、定数/次アI〜レス・フィールド
、シーケンサ・データ・ボート、VMEデーデーIFO
データ・バイブ1、ブタ・バイブ2、GIP FIFO
1割込みベクトル・レジスタ(8ピツI・) 、DM八
副制御レジスタDMAコントローラーチー〜レス・カウ
ンタ、DMAコントロラー語カウンタである。 +1)U:140か上に挙げたものの中に含i ;11
. ’(い)3Cいのは、これはTDハス」二のデータ
ないっても[取得]てきるからである。この機(1[は
I P 11命令フイルトによって制御される。 アドレス・レジスタ制御(2)   これらの制御ヒツ
トの一方はア]・レス・レジスタのローデイングを可能
にし、他方のビットはレジスタの読み戻しを可能にして
、診断とデバッグ・モニタで使用てきるようにする。 中断点(1)  (”÷デバッグ専用**)、命令に中
断点を設けるためにデバッグ・モニタによって設定され
る。この結果、命令の実行中に割込みか起こると、その
命令の実行を終えたあと制御権かデバッグ・チエり・マ
イクロコートに渡される。 クロー(1) f季4デバッグ専用中*):ユーザ・タ
スクを1ステツプ進めるときクロー・ロジックを始動す
るために設定される。この結果、次の命令の実行中に割
込みが起こると、ユーザ・タスクのある命令が実行され
たあとで制御権かデバッグ・モニタ・マイクロコートに
移される。これにより、ユーザ タスクはクロックを物
1M1的にオン、オフに切り4・4・λなくても1スデ
ップ進むことかでとる。 割込みCP (2)  これは制御プロセッサ・モシュ
ルに3レベルのうちのルヘルて割込みを引き起すもので
ある。これらのレベルは次のように割り振られている。 つまり、ホストから新しいコマンド受信、データ転送終
了、データ・キャッシュ・メモリへのアクセス権解放で
ある。 セロまたは符号拡張(1)、このビットは16ビツト幅
レジスタまたは装置が読み取られるときたけ効力をもつ
。その場合には、データをゼロで拡張するか(ビット1
6−31がゼロにセット)、符号で拡張するか(ビット
16−31がビット15と同しにセラ1〜)か選択され
る。 DMAコントローラ命令(3)   このフィールドは
DMAコントローラに対する命令を制御する。命令には
、内部レジスタの読み書き、レジスタの再初期設定、ア
]〜レスを増分<6A分)または語カウンタを減分する
通常のDMA動作を扱うものがある。 マイクロツー1−拡弓長ハス マクロコート拡張ハスは」、(木マイクX]ロー1〜サ
ーヒスをオフボートて1広張するものである。これは、
拡張周辺ホード上のある種のインタフェースを制御した
り、周辺ボート全体を制御したり1−るために使用てき
る。これらの使い方の代表例として、大容量メモリ・カ
ー1〜やネットワーク・インタフェース・カートとのイ
ンタフェースとなることである。 拡張バス・インタフェースは電気的および機械的にGI
P上の拡張インタフェースと同しであるので、これらは
どの共通拡張カートでも共用することができる。 拡張コネクタは96ウエイDINコネクタであり、そこ
に現れる信号には、次のものがある。3ビツト・スライ
ス・クロック[注1]、バイブライン・レジスタ・クロ
ック[1]、マイクロアドレス・バス311B(15ビ
ット)[2]、TDババス22(32ビツト)[3]、
リセット、WC5出力制御、バイブライン・レジスタ出
力制御イネーブル、WC5’i!i込みイネーブル32
4、バーrブライン レジスタ モ1〜制御、直列クロ
ック、直列データ・イン、直列データ・アラ1−(マイ
クロコートのローディングで使用)、外131S割込み
[4コ、割込み承認、条件コート[4]。信号は上で注
記したものを除きずへてTTLレヘレベある。つまり、
[1]これらの信号は差分ECI、レベルにある。[2
コこれらの信号は信号コート化ECLレベルにある。[
3]このバスは32ピツ)〜幅であるか、目的によフて
は、2個の16ビツ1−・バス、つまり、−次データ・
バスと二次データ・バスとみなすことができる。 [4]これらの信号はオーブンしているコレクタ・バッ
ファによって駆動される。 ある種のlit:L信号をこのインタフェースで使用す
ると、ボード間のクロック・スキュー効果を最小にする
ので好都合である。 数値プロセッサ・モジュール130 本好適実施例では、数値プロセッサ・モジュール+30
は浮動小数点プロセッサである。従って、このモジ;l
、−ル130は浮動小数点プロセッサ・モジ−7−ル(
ま/こはrFP干ジュールJ)と311干はれることか
ある。しかし、このSヒシ−r−ルは他のラータ型(デ
ータ・タイプ)用に、例λは、複素数算術演算モジュー
ルとして、あるいは広幅整数演算用モジュールどして構
成することも可能である。このモジュールが広い意味て
数値プロセッサ・モジュール130とも呼ばれるのはこ
のためである。 本好適実施例ては、浮動小数点プロセッサ・モジュール
130は浮動小数点プロセッサとキャッシュ・メモリ間
のデータ転送を統御する制御/インタフェース・ロジッ
クと非常に密に結合されている。この制御/インタフェ
ース・ロジックは制御プロセッサのマイクロコート・ク
ロックによってクロックがとられるので、制御プロセッ
サのマイクロ命令の拡張部分で制御するのか好ましい。 本好適実施例では、浮動小数点プロセッサ・干シュル1
30と制御/インタフェース・ロジック(CP拡張ロジ
ック)は主基本ポート(ここには、キャッシュ・メ干り
140と制御プロセッサ・モシュル110の主要部分か
置かれている)に差し込まねる別個のジブポー1〜上に
一部に搭載されている。 追加モジュール130か使用される場合は、その各々に
は制御/インタフェース・ロジックの一部が置かれるこ
とになる。 本実施例のアプリケーションでは、この制御/インタフ
ェース・ロジックは制御プロセッサ・モジュール110
の拡張と見られているが、この制御/インタフェース、
・ロジックかモジュール110の部であるか否かに関係
なく、本アプリケーションでは、このロジックのタイミ
ングと制御特性に関して重要な新規事項がいくつかとり
入れられている。 本好適実施例では、32ビツト・データ構造が使用され
ている。各浮動小数点数は32ピツトで表されるので、
32ビット単位は浮動小数点数(または「F語」)とも
呼ばれる。本好適実施例では、数の形式は小数部が24
ビツト、指数部が8ビツトになっている。これは選択的
にIEliE形式にすることも、DEC形式にすること
も可能である。 7f動小数点ブロセッヅ・千ジュール1′10の内部動
作につい”C1まず説明する。そのあと−(、制御フロ
セ・ンサ・モジュール110およびキャンシュ・メモリ
140とのインタフェースの機能につい−cHしく説明
する。 第4A図から第4D図までは、数値処理モジュール+3
0の主要部分を示したものである。本好適実施例では、
第4八図は制御プロセッサ・モジュール+30とのイン
タフェースとなるために使用されるインタフェース・ロ
ジック410の概略図である。 第4B図はモジュール130内のデータ通路の主要部分
の一部を示している。第4C図はマイクロコートのアク
セスとデコート化のとき本好適実施例で使用されるロジ
ックを示している。第4D図は本好適実施例で浮動小数
点モジュールに使用されるマイクロ命令形式を示してい
る。 実際の数値計算が高速で行なわれる浮動小数点算術演算
機構について最初に説明する。そのあと、FPモジュー
ル130と低速モジュール間のクロック境界をまたいで
データ転送か行なわれる2重ハンファリンク繰作Vつい
て説明する。次に、ブタ転iXの追加段(その大部分は
CPモジュール+10の拡張部分によって制御される)
について説明する。最後に、算術演算機構を統御するプ
ログラムについて説明する。 浮動小数、rハ算術演算機構(FPII)本好適実施例
の浮動小数点算術演算機構は非箔に単純化されており、
高速て動作する。この通路には、浮動小数点乗算機構、
浮動小数点ALU  (算術および論理演算機構)、高
速多重ボート・レジスタ・ファイルか含まれ、これらは
すべて高速で単純化されたシーケンサによって制御され
る。さらに、スクラッチパッド・メモリが内部データ通
路と密結合されて、参照テーブルを保存し、ヒストグラ
ム記憶またはデータ・スタックとして動作する。 2レベル・データ通路のトポロジは第16図に分かりや
すいように示されている。低レベル・ブタ通路とその構
成要素は浮動小数点算術演算機構(FLII) と呼は
れるものである。FPUは、高速レジスタ・フへ−メル
ト4/lO1八i’LI 450、スクランヂバン1〜
・メモリ1610、局所ハス431.432.433.
434から構成されている。 算術計算機構440と450 浮動小数点ブロセッザ・モジュール130て使用される
浮動小数点乗算機構には浮動小数点乗算機構FMPYI
 440と浮動小数点算術論理演算機構(FALU) 
450がある。両方とも、内部アーキテクチャは非常に
よく似ている。唯一の違いはデータの扱い方であり(演
算操作が異なることを別として) 、FALUに累積演
算のための余分のフィードバック通路が設けられている
ことである。 本好適実施例では、Bipolar Integrat
ed Technologies (BIT)社提供の
集積回路(浮動小数点チップ・セットとレジスタ・ファ
イル)か次のように使用されている。BITの部品番号
どこれらに準じるアナログ装置番号は、乗算機構440
:82110または八DSP7]10.  ALII 
 450:B2]20  まノこは八DSP7120゜
レジスター 7 y −1’ ル430:[12210
ま/ごは八DSP7210’t’ある。乗算機構440
とALII 450おJ:ひ晶速しシスり・ファイルは
、実際には、ECLケーl−を内部に使用している。し
かし、こJlらのインタフェースと電源はrTl、であ
る。これらの算術演算チップは完全な64ヒツト・デー
タ通路を内部にもち、外部に32ビン1−・インタフェ
ースをもっている。従って、こわらのデツプは高速64
ピッ]−演算を行なう能力をもち、必要に応して多重化
データ転送を利用する。 FMPY 440とFAI、+1450はそれぞれ、オ
ペランド用の2個の32ピツ]・幅入力ボートXとY(
それぞれ局所オペラン]・・バス431 と432に結
ばれている)と、結実用の32ヒツト幅両方向ボートT
(局所結果ハス433に結ばれている)を備えている。 計算機構の人力ボートの各々はラッチとマルチプレクサ
を備え、出力ボートはマルチプレクサを備えているのて
、64ピッ1〜幅の数を出し入れして転送できるように
なっている。 2割算機構の結実用ボートは並列に接続されている(結
実用ハス433に、従って、レジスタ・ファイルの書込
みボート430Dに)。これにより、計痺機構はタ1部
ママルブIノクヅを使用したり、ブタをレジスタ・ファ
イルあてに送ったりしなくても、データを交換し合うこ
とかできる。これは、例えば、積の和を求める計算を行
なうとき便利である。また、この機能を利用すると、ス
クラッチパッド・メモリ1610どの間で高速にデータ
をやりとりすることができる。しかし、この構成には、
FMl’Y 440とFALLI 450の両方を同時
に活動化できないという制約かある(たたし、積の和を
求める演算は除く)。これは出力ボートか一緒に結合さ
れているからである。これらのボートを別々にしたとし
ても、両方の装置はレジスタ・ファイル430からの同
しデータ通路を共用するので、入力端に問題か起こるこ
とになる。 実際に使用される算術演算機構は人出力ボートを柔軟に
構成できるので、これらのボートをレジスタしたり、透
過にしたりできる。しかし、本好適実施例では、この機
能は使用されていない。ホトはすべてレジスタされる。 両計算機構の内部データ通路と機能4L位はずへて64
ビット幅てあリ、l1l−1(冒迂(sp)と倍精度(
DP)のとららの(i!i算す行なうことかできる。 [・MllY440ての機能単位614個の算術演算命
令をヅボートしている。最小ザイクル時間(ナノ秒単位
)はどちらの精度の場合も、次の通りである。 見抗壓     條抗瓜 乗算      110      59除算    
  200     300平方根     300 
    800バス      4050 整数乗算    45 FALU 450での機能単位は浮動小数点命令、整数
命令、変換命令といったように幅広くザボートシている
。詳細については、メーカのデータ資料に記載されてい
る。ずへての浮動小数点命令(単精度と倍精度)は最小
実行サイクル時間は25nsであり、整数演算はすへて
+2ns 、変換はすべて25nsで行なわれる。 最もよく使用される命令には、次のものがある。 浮動小数点 加算と減算(符号イ」きまたは絶対イ11
冒、絶対イ[l′!、否)[、スケール、マー ン、!
[規化、比較。 変換: 511−>ピッI・整数、符−号イ」きまた(
J符号なし。SP−>li4ヒッ)・整数、符号イ」き
または?)号tt シ。SP <−32ピツ1〜整数、
符号付きまたは符−じなし。SP <−64ビツト整数
、符号イ」きまたは符号なし。DP−>32ビツト整数
、符号f寸ぎまたは符号ナシ。DI’ −>84ビット
整数、符号付きまたは符号なし。DP <−32ビツト
整数、符号付剖または7T号tt L。DP <−54
ヒツト整数、符号付きまたは符号なし。SP−>DP、
DP −>SP0整数:加算(0,l、桁上げ)、 減
算(0,1,桁下げ)、 最大値(符号付きまたは符号
なし)、 最小値(符号付きまたは符号なし)、論理、
シフト(論理または算術)、回転、ビット反転。 (以下余白) スクラソチパノ[・ メ干り1610 第16し1に示すように、スクラッヂバット・メモリ1
610はそのアF +ノス・カウンタ1611と共に、
ホー。 実用バス433につながっている。計算機構440と4
50は両方向ボー1〜でこのバスにつなかっているので
、マルチプレクサ440、A1.U 450、またはレ
ジスタ・ファイル430によってデータを直接にこのメ
モリから読み取ることができる。 アドレス・カウンタ1611を通して、いくつかのアク
セス・モートてこのメモリがアクセスできるようになっ
ている。2個のモード・ビットに応じて、アドレス・カ
ウンタは(読取りまたは書込みアクセスか行なわれるつ
と)アドレスを増分し、アドレスを減分し、アドレスを
保持し、あるいはアドレスを指定できるようにする。(
例えば、ア1’レス増分と減分をいく通りかに組み合わ
せて、スタックどして動作させることも可能である。)
カウンタ1611のアト1ノス生成機能を利用すると、
ある条件のときに、メモリ1610を1サイクル1回の
書込みの割合て機能させることかできる。 このメモリをスタックどして動イ1ざυると、干述した
J:うに、コンパイラでスカシ・プログラミングすると
き特に好都合である。 ヒストグラム・アルゴリズムを実行さ一υるときは、以
前のサブ1−一タル(追跡中のパラメータの)を結実用
バス433土に読み出すことかできる。この種の操作の
1つの簡単な例では、メ干り16]0は結実用バス43
3のデータ・ソースとして指定され、マルチプレクサ4
40が稼動中に、八LII450はコマンドを受けてオ
ペランド値を結実用バスから読み取るようになっている
。マルチプレクサ440が終了すると、その結果を結実
用バス433上に送り出し、糺υはその値を2番目のオ
ペランドとして読み込む。そのあと、ALIIはその和
を結実用バス433に送り出し、その間にメモリ+61
0はコマンドを受けてその結果を書き出す。(その間に
、追加のオペランドをマルチプレクサ+140にロトす
ることが可能である。) このテーブルがあると、データ依存パラメータをそこに
置いておくことかできるので非常に便利である。こねは
超関数を訓算するときに4・シに便利である。 高速レジスタ・ファイル430 レジスタ・ファイル430はデータ・キャッシュ・メモ
リ140との主インタフェースとなるものである。レジ
スタ・ファイルの一方のバンクはCPモジュール110
と部分的に同期して稼動して、局所転送ハス422(両
方向ボー1.430Aに結ばれている(第16図))を
通してFP保持レジスタ420 とのインタフェースと
なる。他方のバンクはFPモジュールと完全に同期して
稼動し、オペランド用バス431.432(読取りボー
ト430Bと430C) 、結実用バス433(読取り
ボート430D)、およびループバック接続434(書
込みボート430E)  とのインタフェースとなる。 第4B図はモジュール+30内のデータ通路の主要部分
を示している。主キャッシュ・ハス144(これは25
6ビツト幅である)は直列の4個のFP保持レジスタ4
20と結はれている。(これらの保持レジスタは実際に
は対になっており、読取りレジスタは書込みレジスタと
並列1ζ/、(つている。従−〕で、保持レジスタ42
0は8個あり、各々か61ヒツト幅であるので、両方向
256ヒツI・・インタフェースになっている。)これ
らの8保持レジスタ420には別々のイネーブル信号か
人力される。従って、このバンク側のレジスタにより、
255 ビット幅のキャッシュ・ハス】44を多重化し
て64ヒツト幅の高速レジスタ・ファイル430に送り
込むことができる。 この多重化が行なわれるのは、主にコストが理由である
。高速レジスタ・ファイル43Gは非常に高価なチップ
である。これらの個数か44gになると、システムのコ
ストか大幅に高くなることになる。さらに、第388図
から明らかなJ:うに、これらの機構の検証は非常に重
要であり(ビン数か非常に多いので)これらのパッケー
ジを4個て11 <16個使用すると、必要とするポー
ト面積が著しく増大することになる。 実際にはレジスタ430は4(IMであり、2個たりて
はない。物理的に公庫1したチップの各々は16ヒツト
幅であるので、これらを4個並列で使用すると、64ヒ
ツト・インタフェースで局所転送ハス422 どホ吉ふ
ことかてぎる(このインタフェースは2F詔幅であるこ
とに7主意されたい)。 本好適実施例では、レジスタ・ファイル430は18ヒ
ツト幅x64記憶位置奥行の5ボート装置から作られて
いる。従って、64ビツト側インタフエースで局所転送
バス422と結ふためには、4個の装置を並列で使用す
る必要がある。(説明を分かりやすくするために、第4
B図には、32ヒツト幅ファイルが2個あるものとして
レジスタ・ファイルが示されている。これにより、下達
する語アドレス奇数/偶数の状況構造が分かりやすくな
る。また同様に、第16図には、レジスタ・ファイル4
30が1個のファイルとして示されている。)本好適実
施例では、これらの装置は実際には1)11社提供のB
2210から作られている。 レジスタ・ファイルは256ビツト幅にして、キャッシ
ュ・バスと直接にインタフェースで結ぶのか理想的であ
るか、そうすると、付加ハードウェア費用か大幅に増加
することになる。木実LA!i例−〇採用した代替方法
では、FP保持レしスク420(関連制御ロジックと共
に)を使用して、キャンシ;トハス144との256ビ
ツト・インタフェースを多重化して611ピツ)〜幅ポ
ート43〇八に結/vでいる。多重化とデータ経路指定
は、第4八図と第1B図にその概要が示されている転送
ロジックによって制御される。これについては、詳しく
下達する。 これらのファイル間の接続は次のようにするのが好まし
い。(ボートは第16図に個々に名前か(=jけられて
いる。) これらのファイル430の各々は両方向インタフェース
430八をもっており、これは線422を通してレジス
タ420に結ばれている。 レジスタ・ファイル430の各々は2つの透過ブタ出力
端をもっている。これらの出力端は個別的にイネーブル
させることができるので、レジスタ・ファイル430内
からの異なる語を表すことかできる。これらの出力43
0Bと4300は局所オペラン1〜・バス431 と4
32を駆動さ′υる。 1ノシスタ・ファイル430の各々は第3局所ブタ・ハ
ス433に結はれた人カポ−1−430Dをもっており
、これは結実用バスと呼ぶことにする。この結実用バス
は計算機構440と450の出力側に結ばれている。 レジスタ・ファイル430の各々はもう1つ人カポ−1
−430Eをもっているか、これは第1オペランド・バ
ス431 につながるループバック接続によって読取り
ボート430Bと結ばれている。この書込みボートはそ
のアドレスを「結果」書込みボート430Dから受は取
る。これにより、Δ111450またはマルチプレクサ
440を通らなくてもデータをあるレジスタ・ファイル
のアドレスから別のアドレスにコピーてきるので、2サ
イクルの遅れが節約されることになる。このことは、計
算機構440と450を使用しなくても、従ってこれら
の機構で起こる遅れなしで、データを望み通りに並べ替
えてやりとりできることを意味する。この機能はサブル
ーチンを扱うとき使用すると、特に利点が得られる。 従フて、5ボー1〜・レジスタ ファーrルCHI i
:12つの読取りボートDとE、2つの書込みホードB
とC1および1つの両方向ボー1〜Aをもっている。読
取りボーl−からはオペランドかFMPY 1140と
FへLU 450に送られ、その結果か書込みボート1
1300 (必要ならば、書込みボート4301i)を
用いて書き戻される。レジスタ・ファイルはF語を12
8語まで保管できる。 書込みボート430Dと430E (および両方向ボー
i・430Eの書込み部分)に対するデータ、アドレス
および書込みイネーブルはレジスタ・ファイル430の
内部に記録される。内部書込みパルスは自動的に発生す
る。 2つの読取りボートはそれぞれのデータ通路をレジスタ
またはラッチすることかでき(共に同じであることが必
要)、それぞれのアドレスをレジスタまたはラッチする
ことができる。浮動小数点プロセッサ・モジュール13
0で使用されている構成では、アドレスがマイクロコー
トから直接に駆動されたとぎアドレスをレジスタし、デ
ータ・うッチを透過にイh(持する。J:うになってい
る。データはFM1’Y 4[1どFΔm+1450の
内部にレジスタされる。 レジスタ・ファイルは、読取りと書込みアドレスか同じ
であるとぎは、「ライト・スルー」千トで動作させるこ
とかてきる。このモートにあるときは、’4f込まれた
データは同しサイクルで読取りボー1〜に現れるか、通
路読取り操作より約10ns遅れて現れる。これは、再
帰たはスカラ計算で使用すると便利であり、その場合に
は、パイプライン段数が減少するという利点か得られる
。 読取りボート430B、読取リポート430C1および
書込みボー1〜430Dに対する個々のアドレスはFP
マイクロコートのフィールドから与えられる。これによ
り、バイブライン処理の制約の枠内でrl −r20P
 ra型の計算を行なうことができる。 2重バッファリング 高度の多重ボート高速レジスタ・ファイル430は、制
御プロセッサ・千ジュールllOと浮動小数点プロセッ
サ・モジュール13(lとをクリーンなインタフェース
で結ぶ上で不可欠な要素である。このレジスタ・ファイ
ルの7トレス空間は2重バッファとして働くように区画
化されている。との]1,1点においても、このレジス
タ・フ)・イルの一方のバンクは制御プロセッサ・モジ
ュールとほぼ同期して稼動し、他方のバンクは浮動小数
パフプロセッサ・モジュールと完全に同期して稼動する
。(CPモジュールとほぼ同期して行なわれる操作につ
いては、下達する。この準同期操作は過温的クロック領
域を提供するものと考えることができるか、高バント幅
インタフェースを得るときに役に立つものである。) 2バンクの割当てはハントシェイキング・ロジックの制
御を受けて、同期点で入れ替えられる。 従って、このクロック境界の配置により、境界の方の側
を他方の側に影響しないで変更することが可能である。 このクリーンなインタフェースを通して、より高速でよ
り集積化された浮動小数点デツプ・セットに移行できる
ので、浮動小数点機構に独立性をもたせることがてきる
。(ハントシェイギング・
【Jシンタの機fitごとf
史い方については、(、P干シコ−ルと「1)モジコー
ルとのやりとりか説明されている個所で第22図を参照
して、ざらに前しく説明する予定である。) 従って、レジスタ・ファイル430は通常にブタと結果
をやりとりするときは、2重にバッファリングされる。 しかし、第18図と第19図に示すような従来システム
ては、この2重バッファリングに柔軟性かない。従って
、制御プロセッサ・モジュール110と浮動小数点ブロ
セツザ・モジュール130は共に、レジスタ・ファイル
430のどちらかのバンクにあるアドレスのどれでもア
クセスができる。アドレスか反対側のバンクからロック
アウトされないということは、以下の説明で明らかにさ
れるように、非常に利点がある。 ハードウェアへのアクセスはカットオフされないので、
レジスタ・ファイルにアクセスするためには(あるレベ
ルで)アドレスの全7ビツト(AD:AD)を指定しな
かればならない。2重バッファリング操作か使用されて
いる場合は、実際にはアドレスの6ヒントか必要である
(現存使用III fit:なバンク内のアドレスを指
定するために)。2キバッファリング操作は実際には、
最上位ア]・レス・ビットを動的に修飾することによっ
て達成される。モート信号は最上位アドレス・ビットか
どのように修飾されるかを刀マしている。 従って、マイクロコートで指定されたレジスタ・ファイ
ル・アドレスはハードウェアによって自動的に修飾され
る。2重バッファリングは、浮動小数点プロセッサ・モ
ジュール130がレジスタ・ファイルのどちらの半分に
アクセスてきるか、制御プロセッサ・モジュール+10
がどちらの半分にアクセスできるかを判断する「バンク
選択」伯−号によって制御される。このバンク選択信号
はマイクロコート・フィールドによって直接制御されな
いが、制御ブロセッザ・モジコ、−ル110と浮動小数
点プロセッサ・モジュール130かスワップ(交換)を
要求したときだけ切り替えられる(別のロジックによっ
て)。 2重バッファリングは、最上位アドレス・ピッl−(A
D)の区画化を使用している。(これと対照的に、第4
11図には、ファイルの倍語構造を示すために2フアイ
ルか並んて示されている。これは最下位71〜レス・ビ
ット(八〇)に対応している。)各レジスタ・ファイル
・アドレス(7ビツト)には2ビツト修飾子がイ」いて
おり、これにより次のア]・レス・モー1−の1つが選
択される。 物理アドレス−これは修飾なしで指定されたアドレスを
使用する。 論理アドレス とれは自動ソフト2重バッファリングが
使用されているとぎ選択され、アドレスの最上位ビット
はバンク選択ビットによって置き換えられる。制御プロ
セッサ・モジュール110のレジスタ・ファイル・アド
レスでは、このビットが反転したものが使用されること
になる。 プレビュー これにより、浮動小数点プロセッサ・モジ
ュール130は、バンクを交換し合ったり物理アドレス
指定を使用しなくても、バンクの他方の側にあるデータ
を調へることができる。同期点を横切るとぎ計算パイプ
ラインを一杯に保つためには、新しいデータへのアクセ
スか必要に1(る(データが移入済みの場合)。しかし
、通’+’p+はバイブライン化による遅延か起こるの
で、現在のバンクに対するすべての結果か書き出される
まではバンクを交換し合うことはできない。このアクセ
ス・モードでは、読取りアクセスかレジスタ・ファイル
の反対側のバンクから行なわれてからバンクの交換が実
際に行なわれるので、この遅延は起こらない。これは、
アドレスの最上位ビットをバンク選択ビットを反転した
もので置き換えることによって行なわれる。 第20図は2重バッファリングでアドレス修飾を行なう
ために使用されるロジックの概要図である。この図の右
側はレジスタ・ファイル430とCPモジュール110
とのインタフェースを示しており、左側はFPモジュー
ル110の残り部分とのインタフェースを示している。 従って、右側のデータ接続個所はボート430A(第1
6図に図示)に、従って、FP保持レジスタ420とキ
ャッシコ・バス144に対応している。左側のデータ接
続個所はボーI〜430B、C,D、 E(第16図に
図示)に、イメ〔)て、マルチプレクサ440、Fへ1
.lI 450などにヌ4応している。 右側のアドレス人力は、CPマイクロア1−レス・バス
211八によってWC5拡張部分490から呼び出され
たマイクロ命令から抽出されたデータ・フィールドに対
応している。左側のアミルレス・フィールドはFPマイ
クロアドレス・バス473によってFPWC5470か
ら呼び出されたマイクロ命令から抽出されたデータ・フ
ィールドに対応している。(レジスタ・ファイル430
はアドレス人力に対する内部パイプライン・レジスタを
もっているので、マイクロ命令ビットは1/ジスタされ
ないで人力される。) 2つのアドレス修飾論理装置2010が示されている。 これらは、SEl、および5EL−bar との接続が
反対になっていることを除りば、はとんど同じである。 従って、CPとFPが同しアドレスを論理モードでアク
セスしようとすると、それぞれの論理装置201Oのア
ドレス修fifli操作か行なわれた結果として、反対
のへ〇ビット出力アトレスが得られるのて、2重バッフ
ァリング4m (j’rか実現される。アドレス論理装
置はCPまたは日)マイクロコート・フィルトの1つか
ら取り出した7ビツト・ア]・レスの上位ビット(八〇
)も受は取る。また、2ヒツト・モート信号も受は取る
。 本好適実施例によれば、実際には、agoアドレス修飾
論理装置2010がFP側に実装されている(ボート4
30B、430C1430Dに1つずつ)。 相補バンク選択信号SELと5EL−barはボート選
択ロジック2020から得られる。これらの2信号は、
FPとCPモジュールが用四バンク交換を要求すると反
対になる。(これを行なうロジックは以下で詳しく説明
する。) 非レジスタ・ビットのセットアツプ時間短縮アドレス修
飾ロジック2020を実装する際に、第17図に示すよ
うに、ある種の追加ロジックが追加されている。この追
加ロジックは一般的問題を解決するもので、多くの分野
で使用するのに適したものになっている。 「ビット・スライス」の多くのメーカはそれそれの1に
にパイブライン・レジスタをAllみ入れている。しか
し、デツプに到達する前にマイクロコ1−・ヒツトに対
して行なわれる処理なデツプのセットアツプ時間に加え
る必要がある。このような事態は、上述したソフト2重
ハファリング・システムを構築する際に起こっていた。 その問題とはアドレス修飾ロジック2010がレジスタ
・ファイル・アドレスの最上位ヒツト(”八〇”ヒツト
)を処理して論理的、物理的、およびプレビュー・千−
トてアドレス指定を行なうと、サイクル時間に余分のl
0nsか付加されることである。(本好適実施例におり
るように)サイクル時間を30ns却下にてぎるとぎは
、これは非常に大きなオーバヘッドとなる。 従って、第17図に示すようなある種の追加ロジックか
余分の10nsをサイクル時間(多くのサイクルて)か
ら除くために採用された。これを行なうことかできるの
は、アドレス指定モー1〜かあるサイクルから次のサイ
クルまで同しままであるときである。その場合には、セ
ラl−アップ111間はずてに前のサイクルて代価か支
払われている。しかし、マイクロロー1〜・71−レス
が変って、新しいデータが書込み可能制御記憶機構(W
CS)でアクセスされると、非レジスタ・マイクロロー
1〜・ビットは不安定になる。従って、セットアツプ時
間が必要以上に再び発生ずることになる。 第17図に示すロジックは修飾アドレス・ビット定数を
別のレジスタ1740に格納している。マイクロコート
から得たものではなく、古いへ6値(レジスタ1740
からフィードバックされたもの)を使用することを選択
するために(マルチプレクサ1739を制御するために
フリップフロップ1720を使用して)、特殊なマイク
ロコード・ビットじu s e o I dA6”と呼
ぶ)が使用されている。(マイクロ命令・アセンブラを
使用するときは、”useold−八〇”マイクロロー
1:・ビットはマイクロコート・アセンブラが自動的に
セットするので、プログラマはその最適化について気に
する必要はない。)マルチプレクサ1730はアドレス
修飾ロジックと同じPALに搭載されているので、マル
チプレクザ6:1余分のi!−/延を引き起−1−j:
どかない。 大へ・ソシュ ハス インタフェースと制御上述したよ
うに、数値プロセッサ・モジコールの動作は多くの面で
制御プロセッサ・モジュール110の拡張部分によって
制御される。このロジックの大部分は物理的に[・I)
モジュール上に音かれているか、その制御は制御プロセ
ッサ・モジュール110どCDハスどのインタフェース
によって行なわれる。キャッシュ・ハス・インタフェー
スは、ブタ・キャッシュ・メモリ+40 、 FP保持
レジスタ420、およびレジスタ・ファイル430間の
データ転送を管理するためにいくつかの部分に分かれて
いる。このインタフェースの主要部分は保持レジスタ4
20、デー〉・キャッシュ転送ロジック、および局所転
送ハス・ロジック2】1oである。 保持レジスタ420 保)jルジスタ4208;J:8個の32ビツト・レジ
スタから構成されている。(これらのレジスタは両方向
てあり、各レジスタは読取り側と書込み側を備え、内1
1(て並列になりでいる。)これらのレジスタiJ:2
56ヒソ1〜かデータ ギへ・ンシ−1・メ士り(問に
、64ピッ1−だりかレジスタ・))・イル側にl、(
るJ:うに配置されている。レジスタ・ファイル側の出
力イネーブルは4グループのレジスタから1つを選択し
て、レジスタ・ファイル430につなかる64ピツ)・
局所転送バス422を駆動する。(このインタフェース
の動作について幻、あとて訂しく説明する。) データ・キャッシュ転送ロジック データ・キャッシュ転送ロジックは主ポート上に置かれ
ており、CP転送ロジックの一部になっている。ここか
らは、モジュール選択ア1−レス(3ビツト)、出力イ
ネーブル、およびクロックが得られる。このロジックは
キャッシュ・メ干す140と保持レジスタ420間の転
送を制御する。この千ジュールが選択されると、出力イ
ネーブル信号は活動化されていると、保持レジスタ42
0をイネーブルしてデータがキャッシュ・バス144を
通って転送される。 局所転送ハス制御ロジック 局所転送ハス制御ロジック2110は第21図に示され
ている。このロジックは保持レジスタ420 どレジス
タ・ファイル430間のデータ転送を受り持つ。1つの
転送サイクルは、4つのマイナ・サイクルをちっており
、これらはレジスタ・ファイルどの間で転送てぎる4対
のF語に対応している。 これらのマイナ・サイクルは高速で動作する専用クロッ
クによって発生ずる。 転送りロック発生機構412 転送りロック発生機構1112からは、主転送サイクル
期間の間たり転送りロック出力が得られる。 これは、CPツクックと転送イネーブル・ビットが共に
「進行」条件を示しているとき1−リガされて動作する
。 転送りロック発生機構はcpツクック発生機構250と
完全にではなく部分的に同期している。高周波数Ef;
1.回路が70Mtlzオシレータに接続されており、
CPツクック発生機構か「進行」条件を示すまでは、高
周波数回路はループを続りているたけである。従って、
高周波数クロックのまイか現、I]るど、「進行」条件
かチエツクされる。つまり、[進行J条件か高周波数ク
ロックの多くて1期間以内に検出されることになる。 進行条件か検出されると、転]スクlJツク発生機構は
高周波発振人力の分割を始めて、主転送サイクルに苅す
る転送りロック出力を発生ずる。どの主転送サイクルか
行なわれているかに応じて、2か65までのクロック・
ビートは主転送サイクル期間に発生ずる。クロック・ビ
ートは8個の保持レジスタすへてに結ばれている。これ
らのレジスタへの順次アクセスは、下達するように、オ
ーバレイされた自走ゼロ・パターンによって「位相」が
とられる。 第47図は転送りロック発生機構のタイミング関係の概
略図である。高速可変長クロック480は同図の下に示
されているが、これは計算機構440と450(レジス
タ・ファイル430のデータ・ボート43〇八、430
B、430C1430D、430Eと共に)の動作のク
ロ・ツクをとるものである。その」二に示されているの
G:1、転、スフロックl112の高速ECLループで
ある。さらにその」二は、主中云送ヅイクルで申云送り
ロック発生機構4+2を始動さセる(CPマイクロコi
・・クロックと共に)イネーブル信号である。その」二
ill中云送タロ・ツタである。その」二はCPツク・
ツク発生機横250ににって発生されるCPマイクロコ
ート・クロックである。 従って、転送りロック発生機構が働いているとぎは、中
間クロック・ゾーンか得られるので、ブタ・キャッシュ
・メモリ140(これはCPツタック発生機構250に
よって制御される)とレジスタ・ファイル430の内側
バンク(これはFPツタック発生機構480によって制
御される)間の転送が高速化される。 FPIIとデータ・キャッシュ・メモリ間のクロック境
界は非常に重要な境界である。この境界はクロック位相
境界だけでなく、クロック周波数の大ぎな差にもまたが
っている。上述したように、さらに、この境界をまたぐ
正味転送バント幅も非常に重要である。 本好適実jifi (’illては、この境界(:12
つのスう一ソソでまたかっている。 1・IIクロック領域から過渡的クロック領域への転送
はレジスタ・ファイル・インタフェースの2重バッファ
リングによって行なわねる。 保持レジスタ420かデータ・ギャツシコ・メ干り14
0への転送は全体かCPツタック領域内で行なわれる。 次に、このクロック周波数差に関して注目すべきいくつ
かの一般的事項を挙げておく。 マイナ転送ヅイクル継続時間と最小FPサイクル時間と
の関係は偶然的なものではない。上述したように、ダイ
アシック演算のときにキャッシュ・ハンド幅に最悪の負
担がかかることになる。例えは、ベクトル加算では、2
個のオペランドと1個の結果をレジスタ・ファイルとキ
ャッシュの間で転送しなければならない。レジスタ・フ
ァイルのFPII側では、2個のオペランドは並列に読
み出され、(これとパイプライン処理されて)その結果
は同時にレジスタ・ファイルに書ぎ戻される。従って、
最悪の場合には、ハ’l’ #機構のすへての泪屹サイ
クルことに、2語をレジスタ・ファイル430に招き込
み、1語を読み出さなりれ(、′lならない。 ずへての演算かタイヤシックであるとは限らないが、多
くのアプリケーションでは、平均的にあまり有利とはい
えない。 過渡的クロック領域を使用する実施例では、上述したよ
うに、次のようにすることが最も好ましい。つまり、マ
イカ・サイクル継続時間をマイカ・サイクルごとに転送
される語数で分割して、FPIIにおりる計算サイクル
の最小継続時間の172ないし1l3倍の範囲にするこ
とが好ましい。しかし、2段インタフェースで過渡的ク
ロック領域を使用すると、この数値関係か満足されない
場合であっても、その利点が得られる。 過渡的クロック領域の利点は高速数値計算機構が使用さ
れているシステムに応用可能である。上述したクロック
・インタフェース・アーキテクチャによれは、この種の
機構をそれぞれのクロック領域に隔離できるので、可能
な限りの最大速度でクロツタを動作ざセることかてきる
。例え(:1、このインタフェース・)′−キデクチャ
は、if’b (曲な高速テクノロジ(シーlセフラン
接合やl1l−V装置デクノロジなど)におりる限られ
た数の泪39機構を大型コンピュータ・システムに組み
入れるとぎに使用可能である。 制御信号 制御信号の数を少なく抑えるためには(入力端と出力側
の両方で)8個のF語を保持レジスタ420からレジス
タ・ファイル430に転送するイー1方にいくつかの制
約がある。これがなぜ必要なのかは、アドレスのことを
考えれば明らかである。F語が8個のときは、全体の柔
軟性が必要である場合には、8個のアドレスが別々に一
必要になる。各アドレスに9ビツトを指定する必要があ
るので、アドレス情報は合計で72ビツトになる。 人力制御信号には、次のものがある。 万卯:データがレジスタ・ファイルから保持レジスタに
転送されるのか、あるいはその逆に転送されるのかを指
定する。 レジスタ 7トレス(6ヒソト) これは、ブタかそこ
からレジスタ・フトイルとの間て]11云送される開始
ア[−レスを指定する。このア1−レスはマイリー転送
ザイクルことに増分され、[i4ピッ1〜まて達するど
、折り返される。FI’U側からは、レジスタ・ファイ
ル・ア[・レスは、64ビツト語ではなく32ヒツ]・
語を参照するのて、7ヒツ1〜であることにン主目すべ
きである。 論理/物理アドレス修飾子 これはアドレスを修飾して
ソフト2重バッファリングを行なうかどうかを選択する
。 転送長さ(3ビツト)・これは転送されたF語の個数(
1,、,8)を判断する。 転送開始(3ビット)・これは8語のうち最初に転送す
るF語を指定する。これらのビットはマイクロコート・
フィールドでも、レジスタ・フィールドでも定義できる
が、CAババス11の最下位ピッ1〜にすることも可能
である。転送開始→−転送長さ〉8ならば、F語の選択
は折り返される。 転送イネーブル 転送に関係する4つの浮動小数点フロ
セッヅ・−〔シ:1.−ルを+ 111%択づ−る。 レジスタ・ファイルと保持1ノシスタに苅−・)−る制
御(g号に6J、次のものかある。 保持1ノシスタII、 IJカイネーブル(4):[i
4ピッ1−・データ・ハスを駆動さゼるレジスタjff
を選択する。転送方向かレジスタ・ファイル430から
保持レジスタ420に向う場合は、これらのイネーブル
はいずれも活動化しない。 保持レジスタ君Tクロック(8)クロック・イネプルは
4つあり、これらはパターン1110.1101.10
11.0111 (r自走低パターンJ)の順番になっ
ている。これらの4クロツク・イネーブルは64ビツト
・レジスタ群を選択する。静的8ビツト・クロック・マ
スクは32ビツト・レジスタのどの2つを実際にイネー
ブルさせて、局所転送バス422をアクセスするかを選
択する。(パターン内の開始位置は転送開始によって決
まり、パターンの数は転送開始と転送長さパラメータに
よって決まることに注意されたい。) ィクル4−どに増分し、論理/物理アドレス修飾子に応
して修fiiliされる。 1ノシスタ・ファイル読取り/書込み制御(2)各月の
レジスタ・ファイルごどに別の文字かあるので、奇数個
の省込みか可能である。これらは転送長さとア1−レス
からデコート化される。 (以下余白) 転送の制約条イ’I((i’i話構異構造述したインタ
フェースにJ:ると、転送にいくつかの制約かある。こ
れらの制約を分かりやすく説明するために、データかデ
ータ・ギャッシコ・メモリ140、保持レジスタ420
、局所転送バス422、おJ:ひレジスタ・ファイル4
30の間でどのようにマツピングされるかを明らかにす
る。 レジスタ・ファイル430はある種の缶詰構造になって
いる。つまり、1・PIからは32ビット幅に見えるが
、局所転送バス422からはレジスタ・ファイル430
は64ビツト幅に見える。 レジスタ・ファイル430と局所転送バス422間を2
語幅のインタフェースを使用して結び、8個のレジスタ
420に印加される転送りロック(実効)を4マイナ・
サイクル以下にすると、転送速度が最大化するので(静
的クロック・マスクが使用できる)非常に有利である。 しかし、ある種の奇数/偶数構造がファイル・アドレス
構造に組み込まれるという副作用が生しる。 これを図式化して示したのが第46図である。l・P保
持レジスタの幅内の8個のFWIj ij相反向きに陰
影をイ」りて、どれが偶数て、とわか奇数であるかを示
している。2倍R11か転送されると、転送された任意
の偶数F語(1vO1W2、W4、W6)4:llzシ
スターファイル430のガ側にマツピングされる。従っ
て、これらはF P I+から見ると、偶数レジスタ・
ファイル・アF lノスにマツピングされる。これに対
応じて、転送された任意の奇数F語はレジスタ・ファイ
ル430の右側にマツピングされるので、FPUから見
たとき、奇数レジスタ・ファイル・ア]〜1ノスにマツ
ピングされる。 このことは、それ程深刻ではないが、(キャッシュ・メ
モリ140からの一連の分散読取りアクセスにおいて)
すべての転送が偶数データ・キャッシュ・アドレスから
の場合には、レジスタ・ファイル430内のアドレスの
半分だけが使用できることを意味する。 もっと重要なことは、1個のF語(例えば)計算アドレ
スから転送される場合には、データがレジスタ・ファイ
ル内の偶数または奇数アドレスで終結する可能刊がある
ので、このデータを正しい側から(FPIIに)アクセ
スさせるようなブ℃Jグラム・ステップを使用する必要
かあることである。 本好適実施例によれば、この種の問題を回避するために
ユーザが選択できる5つのオフシilンか用意されてい
る。つまり、 IJPモジュール+10はDCMでデータを71復てき
るので、転送されるどのデータもDCM内の偶数アドレ
スから開始する。 2、転送ロジックは状況ビットをもっており、最後の転
送が偶数アドレスに対するものか、奇数アドレスに対す
るものであるかを示すようになっている。FPロジック
はこの状況ビットをテストできるが、これから得られる
のは、最後の転送に関する情報だけである。 3.2重書込みサイクルをデータ有効フラグと緒に使用
できるので、語アドレスの偶数/奇数特性をある個所で
無視させることが可能である。つまり、本好適実施例で
レジスタ・ファイル430に実際に使用されているメモ
リには、データの16ビソトことに2個のパリデ(ピッ
l−記1色位置かある。本好適実施例ては、バリデイ検
査は採用されていないので、これらの追加ピッ1−は他
の目的に使用可能である。粕に、これらのピッ1−はデ
ータと共に「データ有効」フラグを送るために使用てき
る。 従って、保持レジスタ420がらの書込みはすべて対の
保持レジスタから対のF WF+をレジスタ・ファイル
430の両側に書ぎ込むことになる。 4、CPモジュール110にJ:って書き込まれるレジ
スタ・ビットは現在の語記憶位置の偶数/奇数状況を示
すために使用できる。FPモジュールはこのレジスタ・
ビットをテストして、条件付き分岐を実行することがで
きる。 s、cpモジュール110はレジスタ478にある開始
アドレスを変更することて、FPに正しい語の偶数/奇
数状況を知らせるようにFPプログラミングを変更する
ことができる。 別の方法としては、専用へ−トウェアを追加して、語の
交換を即時に行なう方法がある。しかし、この方法は、
:jl−用ハートウェア(ζ′よ−)C転送′I+4に
H延か増加するので(交換−・j−るか否かに関係)2
<)好ましくない。 この転送制御では、非連続ア1〜レスな1回の主転】ス
サイクル内て転送することがてぎない。例えは、WOと
W2を保持レジスタからレジスタ・フ)・イルに転送す
るためには、2つの主転送サイクルか必要になる。しか
し、W+も一緒に転送できるならば(それが使用されな
い場合であっても)主転送サイクルは1つだけで十分で
ある。 データをレジスタ・ファイル430からキャッシュ・メ
モリ140に転送するときも、分散書込みが行なわれる
ときと同じような考慮が必要になる。 この場合の好ましい方法は、レジスタ・ファイルの両側
にデータを同時に書き込むことである。つまり、第4B
図に示すように、2つの(物理的には別の)レジスタ・
ファイル部分430と403°ハ藪旦イネーブルできる
ので、結実用バス433から書き込まれたデータは偶数
語と奇数語の両方に書き込まれることになる。この重複
データが保持レシスタ420に−11:ぎ出されるどき
は、これらの8個全部に同時に1t;き込・tノことか
できる。(この機能はマイクロコート内のII It 
Cl o c k A L Lピッ1〜によっ−C活動
化される。) 保持Iノシスタ/転送りロックの動作 主述しlごJ:うに、多くて4個のビー1〜で転送イネ
ーブルを行なうクロックは保持レジスタ420 とレジ
スタ・ファイル430間の転送で使用される。 (本好適実施例では、このクロックは実際には主転送サ
イクルことに5個までのビートをもつことかてきる。そ
のうち4個のビー1−は保持レジスタ・バンクのそれぞ
れの対を活動化し、5個目の位相はバイブライン・オー
バヘットの余裕分となっている。実際の動作では、この
クロックの位相は約30nsである。従って、主ヅイク
ルは約150nsである。(勿論、これらの時間は変更
が可能である。) このクロック構造には、缶詰転送アーキテクチャをキャ
ッシュ・ハス+44 と保持レジスタ430間のインタ
フェースで使用すると、大きな利点が得られる。転iX
ロジックには保留レジスタ430は2話幅に見えるのて
、転送縁イノ1を8:I%Q化てはl、fく、41多重
化として扱うことかできる。 FPプログラム制御 第4C図は本好適実施例において、FPマイクロコト・
アクセスとアコ−1〜化で使用されるロジックを示して
いる。 マイクロ命令の順序付け(シーケンシング)本好適実施
例では、数値処理モジュール130は高度に統合化され
た「シーケンサ」を使用していない。その代わり、実行
すべきマイクロ命令のアドレスを定義し、マイクロ命令
をアコ−1〜化する機能が低レベルの統合化によって実
装されて、最大高速化を図りている。書込み可能制御記
憶機構は、マイクロ命令アドレス入力によってアクセス
されるマイクロ命令を格納している。マイクロ命令アド
レスのソースは次アドレス・ロジック472によって選
択され、このロジックには条件コート人力がマイクロコ
ート語のデコートによって得た出力と共に人力される。 マイクロ命令)・レスは、通’1’l’+動作時には(
つまり制御プロセッサ・士ジュールやポストによる介入
とは別に)4つのソースの1つから得られる。これらの
ソースとは、「真」ア1〜レス・レジスタ474、「偽
」アl” lノス・レジスタ475、スタック・レジス
タ478、開始アドレス・レジスタ479である。 との命令にも「真」71〜レス・フィールドと「偽」ア
ドレス・フィールドがある。これらの2アドレスを組み
合セることにより、条件イ」きジャンプが可能になる。 「真Jアドレスたりが無条件ジャンプと命令「継続」を
可能にする。 これを行なうには、マイクロ命令1171のある種のフ
ィールドが2つのレジスタ474 と475 に送り込
まれる。これらのレジスタは「真」と「偽」アドレスの
バッファとなるので、論理テストの結果に応じて、一方
または他方のアドレスが次のマイクロ命令アドレスとし
て逆ロートすることができる。 オンチップ・バイブライン・レジスタを使用しないマイ
クロコート・ヒツト用と1.て、追加のレジスタ476
が用意さねている。 スタック・レジスタ1711 スタック・レジスタ478はト1)プログラム制御の機
能を強化するものである。これから得られる出力はマイ
クロアドレス・ハス473に送出され、人力はマイクロ
命令バス471から得られる。これについては下達する
。 しかし、FPモジュールの高速マイクロ命令1〜・アー
キテクチャで使用されるスタックに要求される条件はい
く分通常とは異なったものである。本好適実施例による
スタックは必要とする後入れ先出しくLIFO)操作を
高速に行なうだけでなく、デバッグに非常に役立つ柔軟
性を備えている。この機能を得るためには、第39図に
示すように、ある種の新規構造が要求される。 スタック機能を実装するのに都合のよい方法はレジスタ
・ファイルを使用し、その出力イネーブル信号と書込み
イネーブル信号をアドレス・カウンタに結び付けて、”
pop” (読取り)操作か行なわれるたびにカウンタ
を減分し、”push’“(書込み) I’j:イ′[
か’+−1);+:われるノこひにカウンタを増分する
ことである。 中心部分:1920は多段パイプライン・レジスタてあ
り、これはへMD判から市販されている(八Ma129
520)。この部分694個のパイプライン化されたレ
ジスタ3921と、出力を得るためにレジスタ3921
の1つを選択するために使用できる出力マルチプレク−
JJ3922とを備えている。(この種の装置の通常動
作モートはl’lFDか、一定の遅延を得る動作モトの
どちらかである。) 図示の実施例では、このレジスタの制御機能は1、1 
F O操作を実現するために、PAL 3910の制御
の下で使用される。FAl、はコマンド信号を受けてス
タックをポツプまたはブツシュする。読取りスタック人
力も用意されているので、(主に診断目的)スタックの
状態を無変更のまま読取ることができる。このモートて
使用するために用意されたのがオフセラ)・人力であり
、これは最上段レベルを基準にしたスタック・レベルを
読み出すために使用できる。 スタック レジスタの出力はマイクロア1〜レス・バス
473にに、I、はれている。スタック・レジスタへの
人力はイハア1−レスによって/jlられるか、その理
由について以下説明する。 サブルーチンの動作 スタック・レジスタ478はサブルーチン動作を強化す
る機能を備えている。サブルーチンを呼び出すマイクロ
ロー[、命令はサブルーチン・アドレスを真フィール]
・に、戻りア1ミレスを偽フィールドに記述する。この
命令の短フィールドには、フッシュ・コマンドも記述さ
れるので、スタック・レジスタは「偽」アドレス出力を
格納する。サブルーチンの実行か終ると、ポツプ・コマ
ンドがスタック・レジスタをイネーブルして、戻りア]
ヘレスをマイクロ命令バス473上に出力させる。 従って、スタック・レジスタ478が4レヘルであるの
で、サブルーチンを4レヘルまてネストすることができ
る。 クロック発生機構480 FMPYとFAI、]jでのサイクル時間は命令が5+
、Hなると、ヅイクル局間も異なる。サイクル局間を命
令に応して調整するJ:うにするど、泪算時間が最適化
ざiqるので都合かよい。FAI、U>すi算とJ]を
精度乗算との間の差か最大である(lsns)。 FMPYには除幹や平方根のように実行時間が長い命令
かあり、その場合には、実行時間はそれぞれ200ns
 と300nsである。これらの実行速度の遅い命令用
に2つのオプションが用意されている。 1つは、サイクル長さを該当する量だCプ延長するオプ
ションである。 もう1つは、実行時間の長い命令が進行中にFMPYに
対するクロック・イネーブルをディスエーブルするか、
その命令とデータ・ストリームを通常のデータ速度てF
ALUに送り続けるオプションである。これにより、い
くつかのFAl、U演算を除算演算の陰に隠すことがで
きるので、ある種のアルゴリズムにとっては好都合であ
る。 クロック発生機構はマイクロコート・クロックとスクラ
ッヂパット・メモリに対する書込みゲトの2つの波形を
発生する。クロック発生機構が発生ずる最小サイクル時
間の長ざi;l:21nsてあり、こねは最大リイクル
時間の98nsまで7「IS刻みで変えることが司能で
ある。木好適大眉例ては、実際の最小サイクル局間の長
さは21]nsである(これはWCSメモリ・アクセス
時間か制約要因となっているためである)。FALU$
、算のサイクル時間の長さは28nsであるが、単精度
乗3セ演算では4Insである。 クロック発生機構はとC+、ステー)〜・マシンとして
実装されており、人力周波数が14[IMl(zて動作
してタイミング分解能を得ている。このF、CLステト
・マシンをTTL順序イ」すロジックおよび高速計算機
構と併用すると、著しい利点が得られる。 (上述したように、レジスタ・ファイル430と計算機
構440.450は内部にECLが実装され、周辺にT
TLが実装されている。) クロック発生機構は以下に挙げた制御人力を受は取るこ
とができる。つまり、VMEインタフェースからでも(
つまりホス1−から)、cpモジュールからでも受の取
ることがて各る停止または開始コ7ント、マイクロ命令
ハス/171からの長ざ人力フィール[・、 「マろち
状態」(」たはC[)か開始ア1〜レス・レジスタを強
制的に次のFPマイクロサイクルに対するマイクロコ−
レス・ソースにするときはもっと長いヅイクル)を指示
するストレッヂ人力、およびクロック発生機構にも結は
れていて、即時停止を指示する中断点ビットである。 上述したように、CP拡張ロジックにも転送りロック発
生機構412かある。このクロックはクロック発生機構
280とは無関係である。(しかし、これらのクロック
発生機構は共にTTLクロック発生機構内にTTl、ロ
ジック対を駆動するECLロジックを使用する利点を生
かしている。) マイクロコート短縮 FPモジュール130の動作の注目すべき特徴の1つは
、短縮マイクロコートを使用していることである。つま
り、WC5470とのインタフェースにある種のロジッ
クか用意されており、マイクロ命令のあるフィールドを
以前にレジスタに格納された値で即時に置き換えられる
ようになっている。 本好適実施例ては、この方法でii!iぎ換えられるフ
ィール1〜は演算指定子である。しかし、他のシステム
では、他のマイクロ命令フィールドをこの方法で置き換
えることも可能である。 従って、例えは、2個の配列を3個目の配列上にマツピ
ングする演算(例: Ci−△i 4 ni)の場合は
、この種の演算列か開始される前に命令レジスタに演算
指定子(例 ”八DD”)をロー!−することが可能で
ある。この演算列はそのあと、演算を直接に指定してい
なかったコートに記述されることになる。 このロジックは第45図に示されている。命令レジスタ
451Oには演算指定子(8ビツト)かロートされる。 この演算指定子はWC5470に保管されているマイク
ロ命令のフィールドの1つに対応している。 ”1lse IR”ビット(これはCPモジュール11
Oによってレジスタに書き込まれているので、あまり変
更されることがない)を受りると、Ph3.5420は
出力コマント470Bをイネーブルするか、命令レシス
り11510をイネーブルするかを選択する。 ”II s c I It ”ヒツトかマイクロ命令の
あるフf−ルトに割り当てらJ]ていた場合は、これは
サイクルことに変わる可能性かある。しかし、この場合
には、どの指定子を使用するかをデコートするときに(
そのあどそれをイネーブルするときの)余分の遅れが生
しるので、変更か行なわれたサイクルではサイクル時間
か長くなる。 WC5470は、本好適実施例ては、実際には各々か4
ビツト幅の26個の集積回路メモリから物理的に構成さ
れている。従って、これらの物理メモリの2つに演算指
定子フィールドの8ビツトが保管される。これらの2メ
モリは部分470Bで示され、WC5470の残りのフ
ィールドを保管するメモリは47〇八でボされている。 命令レジスタ4510はそれを(CPマイクロコードの
中で)CDハスのソースまたは宛先と指定することによ
って、CDバス122から読み書きすることができる。 PAL 4520には人力の別ピッ1〜も送られるので
、そのバイバス1榮作をマイクロロー1−のり一1〜l
lt・作iHにディスクー−プルすることか可能である
。 マイクロロー1〜の並列ロー1・ 第29図はWC5470がどのように幅広キャッシュ・
バス144 とのインタフェースとなっているかを図式
化して示したものである。64ピッI〜局所ハス422
はFP保持レジスタ420 とレジスタ・ファイル43
0のボート43〇八とを元吉んでいるか、マイクロ命令
データ・バス471 にふる下がっている直列シャドウ
・レジスタ481 にも接続されている。(他の個所で
詳しく説明されているが、これらの直列レジスタは制御
記憶機構470とマイクロ命令をポストから送るとぎ使
用される直列ループとを結ぶインタフェースになってい
る。) この追加の接続は、マイクロコートのオーバレイを非常
に高速に変更できるようにするので、数値プロセッサ・
モジュール130で特に利点が得られる。 本好適実施例では、直列シャ1−ウ・レジスタ481は
実際には、物理的に分離された2つのレシスタ481Δ
と48111からノJる構成になっている。これらのレ
ジスターj制御記憶機構470のデータ・ホトと両方向
て結ふインタフェースになっているたりてなく、局所ハ
ス422からのデータも受番プ取ることかてきる。上て
触れたように、CP拡張ロジッツタのマイクロ命令フィ
ールドは、局所バス422のデータ宛先を示して、この
読取りを指示てきるヒツトか入っている。 上述したように、各FPマイクロ命令は104 ビット
幅である。しかし、直列インタフェース・ルプを巡回す
るデータの自動シフ1〜に合わせるために、シフト・レ
ジスタ481 は112ビツト長になっている。つまり
、命令ビットの数は次の偶数の16の倍数に丸められて
、インタフェースにあるシフト・レジスタの長さか定義
されている。本好適実施例では、レジスタ481Aiよ
64ピツ]・幅であり、レジスタ481Bは48ビット
幅である。 レジスタ481 にマイクロ命令がロードされると(局
所転送バス422の3マイナ転送サイクルで)これらは
命令をWC5470に逆ロートするように駆動される。 このためには、ア1、レスなIPマイク〔Jア[・レス
・ハス473 にiX出する必要かあり、ま)こ書込み
イネーブル信号をWC5470に】スる必要かある。 直列ローディングでは、ポスI〜はC)〕マイクロ)′
1〜レス・レジスタを使用して、ロート(または読み取
る)へきFP l’lcsのアドレスを格納し、このア
ドレスをFP [Sあてに送る。(CI+マイクロア1
〜レス・バス211八からの人力は第4C図の」一方に
示されているバッファからFPマイクロアドレス・バス
473に送り込まれる。) 並列ロード・モートては、CPは目標アドレスを開始レ
ジスタ479 に入れる。 ホストとのインタフェースとなる追加のロジックも用意
されている。このロジックにより、マイクロ命令を制御
記憶機構470に対して読み書きすることができる。こ
の機能は詳しく下達する予定である。 FPマイクロコート・ルーチン実行の始動FPモジュー
ルが起動するとぎ、これは下達するF P WへIT/
CIIWへ11ハントシェイキング・ロシ・ツタにより
、通フi冒りち状態に入る。FPモジコールで実行され
るルーチンを始動するには、CPマイクロコートのある
ピッ1−を使用して、開始レジスタ479に保持されて
いるマイクロ命令アドレスをFPマイクロ命令アドレス
・ハス473上の次のアイクロアドレスとして使用させ
ることかできる。この処置は下達するようにモジュール
選択によって修飾される。 FP千ジュールの選択 最上位レベルでは、浮動小数点プロセッサ・モジュール
130を制御するためにはその前に選択しておかなけれ
ばならない。単一モジュール構成では、FPモジュール
は常時選択されているので、以下に述べることの中には
、適用されないものがある。しかし、複数モジュール構
成では、必要とするFPモジュール(またはアルゴリズ
ム高速化機構)を先に選んでおかないと、その制御を行
なうことができない。複数のFPモジュールを一度に選
んで、データまたは情報をFPモジュールのサブセラ1
−に同報通信することか可能てル)る。FP’ヒシュル
は次の3通りの方法て選択できる。1つは、以前に制御
レジスタに格納されている3ピツ1へ値を使用する方法
である。2番目は、マイクロコト・フィールドを使用す
る方法である。最後は、好ましさの点で劣るが、異なる
モジュールの各々にあるCP拡張ロジック部分に独自の
マイクロコト・ストリームを同期して実行させ、アクセ
ス仲裁をマイクロコートで行なう方法である。使用する
方法はサイクル単位で変更することか可能である。 あるFPモジュールが選択されると、それを制御する方
法は制御レジスタ(長期的な制御情報かロードされてい
る)と専用マイクロコート・ビットの間で分割されて、
サイクルごとに制御が行なわれる。サイクル別制御の殆
どは、下達するようにデータ・キャッシュ・メモリ・イ
ンタフェースとそのモジュール上のレジスタ・ファイル
間のデータ転送を取り扱う。 モジュール選択は第23図に図式化して示されている。 マルヂブ1/クザ2340はモジ、−ルIDに対してど
の人力を使用するかを選択する。デコート・ロジック2
310 (これは千ジュール130または130にある
CP拡張ロジックの一部である)はその特定モジコール
でのスイッヂ設定値と突き合せて、同報通信されたモジ
ュール・アドレスをテストする。修飾ロジック2320
はそのテスト結果に応じて、下達するように、局所WC
5拡張部分からの各種マイクロ命令フィールドを修飾す
る。 制御レジスタ 制御プロセッサ・モジュール+10は、次のレジスタに
読み書きすることができる。 転送制御レジスタ、転送制御レジスタは保持レジスタ4
20(データ・キャッシュ・メモリ・インタフェースに
ある)からレジスタ・ファイル430に転送されるデー
タ転送に影響を与える制御信号を一ケ所に収集するもの
である。ハードウェアの負担を軽くするために、他の信
号もいくつか収集される。 使用される制御43号には、次のものかある。 払4開始(3)このフィール]・は保持レジスタ11丁
の8レジスタのうちのどれを最初に転送場−るかを選択
する。これはマイクロ命令の一部として指定することも
、データが取り出されたデータ・キャッシュ・メモリ・
ア]−レスに基づいて自動的に指定さセることも可能で
ある。 転送長さ(3)このフィールドは、保持レジスタとレジ
スタ・ファイル間で転送する詔の数を指定する。最大8
語まで転送が可能である。 転送タイプ(1)・このビットは転送か保持レジスタと
レジスタ・ファイル間で行なわれるのか(0)、保持レ
ジスタからFPモジュールのWCSバイブライン・レジ
スタに行なわれるのか(1)を選択する。 後者の機能はFPモジュール・メモリの並列ロード時に
使用される。 ループバック制御(1):このビットは、書込み保持レ
ジスタ内のデータを、レジスタ・ファイルに先に書き込
むことなく、直接に読取り保持レジスタに複写すること
を可能にする。これの主な用途は診断および状態格納と
復元操作である。 送許選択(1)、このヒツトはバー1−イ[J線機能か
なく、Fllのシーケンサに対してテストか可能である
。このヒツトを使うと、制御プロセッサ・干ジュー/1
zllOは、現在実行中のルーチン内の2つの操作の1
つを実行するようにFPに通知することがてぎる。例え
は、このビットは、偶数アドレスにあるデータ(奇数ア
ドレスにあるデータではなく)を言]算で使用するよう
に指定するために使用できる。 命令レジスタ選択(1):このピッ1−はwcsにある
マイクロ命令フィールドでなく命令レジスタ(後述)を
使用させて、浮動小数点A1、Uと乗算機構の動作を制
御するものである。 マスク・エラー(1):このビットはFPエラー条件(
FPマイクロコードによって判断される)が制御プロセ
ッサ・モジュール110のシーケンサに割込みを引き起
すのを禁止する。禁止されても、FPエラー状況は通常
条件コート選択プロシージャでテストすることか可能で
ある。 スタック位置(2)診断および状態格納と復元が行なわ
れるときは、ポスト・コンビ:ノータは1・Pのサブル
ーチン・スタックに】′クセスする必要かある。スタッ
クへのアクセスか71能であるとぎは、このフィールド
かどのスタック項目をFijG a取るかを選択するた
めに使用される。アクセスされるスタック項目はスタッ
ク・ポインタが指している位置を基準にしたものである
ことに汀意されたい。 FP制御レジスタ・FP制御レジスタは並列マイクロコ
ート・ロード制御、釧込みマスキング、クロック制御お
よびマイクロアドレス選択フィールドを一ケ所に収集す
る。 クロック制御(2):このフィールドを使用すると、制
御プロセッサ・モジュール+10はFPのクロックを制
御することができる。FPツタックは動作させたままに
することも、停止させることも可能である。クロック制
御フィールドにある追加ビットは、FPマイクロコート
・クロックが制御プロセッサ・モジュール110のマイ
クロコート・クロックを使用して、F[’を制御プロセ
ッサ・千ジュール110と同期して稼動させることを選
択するために使用ざJ]でいノこbのである。 1・Pマイクロコート・71−レス・ソース(2)この
フィール]・により、制御フロセッサ・モジュール+1
0はFPに使用させるマイクロコート・アドレスを次の
うちの1つにすることを選択てぎる。 FPシーケンヅ出力 これはFPかマイクロコートを実
行さセると谷の通nのマイクロアドレス・ソスである。 開始アドレス・レジスタ これは並列マイクロコート・
ロー1−時に開始ア1〜レス・レジスタを選択する。(
CPモジュール110またはポストがFPモジュール1
10にマイクロコードの実行を特定のアドレスから開始
させることを指示するときは、別の仕組を用いて開始ア
ドレス・レジスタが選択される。) スタック出力強制、これは、診断とマイクロコート・デ
バッグ時にザブルーチン・スタックへのアクセス権を得
るために制御プロセッサ・モジュル110にJ:って使
用される。 割込みマスク:これらの4ピツ]〜は、FPてどの事象
か起ぎたどき、Fllに割込みを引き起すかを制御プロ
セッサ・モジュール110に選択ざlるものである。こ
れらの事象には、中断点、CI’ll八lT、へPW八
Iへ、レジスタ・ファイル交ti、FPエラーかある。 割込みが引き起されると、対応するマスクピッi・は−
時的にクリアされて、割込み要求かリセットされる。 並列マイクロコート・ローF 制御(5) このフィル
トには、WC8書込みイネーブル、WC8出カイネーブ
ル、診断シフト・レジスタ・モート、および信号中のク
ロックと直列データを制御する個別ビットがある。並列
マイクロコート・ロートは以下で詳しく説明するように
、制御プロセッサ・モジュール110によって制御され
る。 浮動小数点直列アクセス・ループ(3):浮動小数点へ
LUと乗算機構を通して稼動する直列ループは両チップ
の内部状態をアクセスしたり、ある種の新しい状態情報
をロードしたりするとき使用できるものである。内部レ
ジスタとフラグはずへてこの方法でアクセスかできる。 この直列ルーフを制御するために、制御プロセッツー干
ジュール110は直列モート、直列データ・イン、直列
クロックの3つの制御信号をもっている。直列クロック
はこのレジスタ・ビットから直接に駆動されるので、必
要とする立上がり縁と立下がり縁を発生ずるためには制
御プロセッサ・モジュール110に切り替えさせる必要
がある。 開始アドレス・レジスタ・制御プロセッサ・モジュール
110は、ジャンプ開始アドレス・マイクロコート・ビ
ットが使用されるときFPにその実行を開始さぜようど
するマイクロコート・ルーチンのアドレスを開始アドレ
ス・レジスタにロートする。このレジスタは並列マイク
ロコードの実行時にロードずへきWC5記憶位置のアド
レスを保持するためにも使用される。 命令レジスタ(8ビツト)・制御プロセッサ・モジュー
ル110はWO2から取り出した浮動小数点糺υと乗算
機構の命令を無視して、独自の命令を代用することがて
きる。命令レジスタ4510 (第45図に図示)はこ
の命令を保持する。これの利点は制御プロセッサ・モジ
ュール110か必要とする4、ν定タイプの計算に合わ
せて汎用マイクロコート・ルーチンをカス]・マイズて
ぎるのて、非常によく似たアルゴリズムで使用されるW
CSスペース量を大幅に節減できることである。 4大況レジスタ(ソースのみ)・これはFPモシュルに
あるある種の内部情報をアクセスするために診断とマイ
クロコート・デバッグでのみ使用される。アクセスでき
る状況には、転送時に使用されるレジスタ・ファイル・
アドレスと保持レジスタ開始アドレスおよび問題状況が
ある。 マイクロコード語の形式 FPマイクロコード形式の主要フィールドは第4D図に
その概要が示されている。マイクロコード語の詳しい定
義は下達する。*印の付いた項目はWO2470から直
接に取り出されるので、これらが制御する装置の内部パ
イプライン・レジスタを使用する。フィールド別のビッ
ト数はかっこ内に示されている。 真アドレス(14): このフィールドは通常の順次プ
ログラム実行11;j(例 命令継続)にジャンプする
吹のア]・レス、条(′1(=jきテストか真であると
きジャンプするアドレス、およびジャンプ・サブルチン
命令のサブルーチン・アドレスを収容している。 偽アドレス(9)v  このフィールドは条件付きテス
トか偽であるどきジャンプする次のアドレスとジャンプ
・サブルーチン命令のサブルーチン・アドレスを収容し
ている。 読取りアドレスX(9戸このフィールドはデータか”×
”ボートから読み取られたり、そのボート上に送出され
るレジスタ・ファイル内のアドレスを指定する9ビツト
を保持している。物理アドレスは9ビツトのうちの7ビ
ツトに入れられ、他の2ビツトはアドレスをどのように
修飾するかを選択する。オプションには、修飾なしく物
理)とソフト2重バッファリング(論理とプレビュー)
がある。 読取りアドレスY(911= このフィールドはデータ
か”Y”ボートから読み耳又られたり、そのボート」二
に送出されたりする1ノシスタ・ファイル内のア]〜レ
スを指定する9ピツ1〜を保持している。物シPアドレ
スは9ピツ1〜のうちの7ヒツ]・に入れられ、他の2
ピツ!へはアドレスをとのように修飾するかを選択する
。オフシミ1ンには、修飾なしく物理)とソフト2重バ
ッファリング(論理とプレビュ)かある。 書込みアドレス(8)このフィールドはデータか書き込
まれるレジスタ・ファイル内のアト]ノスを指定する8
ビツトを保持している。物理アドレスは8ビツトのうち
の6ビツトに入れられ、他の2ビツトはアドレスをどの
ように修飾するかを選択する。オプションには、修飾な
しく物理)、ソフト2重バッファリング(論理)、ソフ
ト2重バッファリング(プレビュー)がある。このアド
レスは偶数ア1zレスに1つ、奇数アドレスに1つの対
のレジスタを選択する。レジスタの書込みは2個の別々
の書込みイネーブル・ビットによって制御される。(こ
のm能を使用すると、上述したように、同し結果をレジ
スタ・ファイルの偶数側と奇数例の両方に入れてj、3
<ことかで参る。)このアI・レスは同しデータをレジ
スタ・ファイルに太れるために使用ざ第1る「ルーフハ
ック」碧込みボートでも使用される。 偶数書込みイネーブル(1) このビットか活動してい
るとき、データは偶数レジスタ・ファイル・ア1−レス
に書き込まれる。 奇数書込みイネーブル(1)このビットか活動している
とき、データは奇数レジスタ・ファイル・アドレスに書
ぎ込まれる。 浮動小数点演算(8)*  これは実行したい浮動小数
点または整数演算を指定し、FMPY 440とFAL
U450の両方で共用される。使用される特定部分別の
命令セットと命令コートの詳細はメーカのデータ資料に
記載されている。 FMPYイネーブル制御(4):このフィールドはデー
タの内部多重化と、人出力レジスタのローディング、つ
まり、Xボート・マルチプレクサ制御じX”ボー1〜は
最初のオペラン1〜・ハス431に結ばれたボートであ
る)、イネーブルXボート・レジスタ・データ・ロート
、イネーブルXボート・レジスタ・データ ローF(”
Y”ボー1〜は第2のオペラン1〜・バス432にホ古
はれ)こボーI・である)、イネーブルZレジスタ・ロ
ー1〜(”Z”ホトは結実用バス433に結はれたボー
トである)を制御する。 FΔLU 450イネーブル制御(5)このフィールド
はデータの内部多重化と人出力レジスタのローディング
、つまり、Xボート・マルチプレクサ制御、Yボート・
マルチプレクサ制御、イネーブルXボ]・・レジスタ・
データ・ロート、イネーブルXボート・レジスタ・デー
タ・ロート、イネーブルZレジスタ・ロートを制御する
。 サイクル長さ(4)、命令のサイクル長さを定義する。 これらは28nsから98nsの範囲であり、7ns刻
みで定義できる。 (以下余白) F〜什YまたはF A L 11状況選択(1)^・F
MI’Y440 まノこは[・糺旧50のとちらかを選
択して状況ハスを駆動する。 条件コ−1・選択(5)テストずへき条件を次の中から
1つ選択する。つまり、真強制(省略時の条件) 、F
I’WAIT、桁上げ(FALU)、ゼロによる割り算
(FMPY)、問題状況(ゼロにJ:る割り算)、問題
状況活動、CPオプション・ヒツト、Xデータ有効、Y
データ有効、最後に転送されたデータの7トレス(つま
り、偶数か奇数)、マイクロコート・ルブ、ゼロ、否定
、割込みフラグ、数字でない(NAN)、丸め、問題の
オーバフロー、問題のアンダフロー、問題の不正確、問
題の無効演算、問題の非正規化。これらのうち最後の1
0個はFMPY440またはFALII450から取り
出すことが可能である。 中断点(1):この命令に中断点が設定されていること
を示すために設定される。 FPDONE設定(1)・FPDONE状況フラグが制
御プロセッサ・モジコール11Oインタフエースで設定
されると、割算が完了したことが制御プロセッサ・モジ
コール110に通知ざA]る。 スワッフ嵐旦レジスタ・ファイル内のラフ1−2重バッ
ファを交換することを要求する。この交1pjは、制御
プロセッサ・モジュール110ど浮動小数点プロセンサ
・モシューノ1刈30か共にスワッフを要求するすては
行なわれない。 スクラッチバット制御(3)4このフィールl−はスク
ラッヂバッ)〜とそのア1〜レス・カウンタの動作を制
御する。1つのピッ)・はスクラッヂパッ]−・メモリ
の書込みイネーブルであり、他の2ピツ]・はアドレス
・カウンタ操作をロート、増分、減分、保留の中から選
択する。 結実用バス出力選択(2):このフィールドは結実用バ
ス433を駆動するソースを選択する。ソースとなり得
るものには、FALIl、FMPY 440、スクラッ
チバット・メモリ・データ、スクラッチバット・メモリ
・アドレスがある。 スタック制御(2)・このスタック制御フィール]・は
戻りアl〜レスがブツシュ、ポツプまたは保留されるよ
うにザブルーラン・スタック・ロジックを;1.す73
11する。 ループバンク周込みイネーブル(1)このピッ1〜はル
ープバック・ボー1〜430Hを通してレジスタ・ファ
イル430て書込みサイクルをイネーブルする。これに
より、最初のオペラン1へ・バスにあるデータか書込み
ボート430Dで指定されているアトI/スに複写され
る。奇数と偶数の書込みイネーブルは1ノシスタ・ファ
イル430のどちらのバンクにデータを書き込むか、あ
るいはそれを両方に書き込むかどうかを選択する。 問題状況制御(2)このフィールドはこのサイクルで生
成された状況を問題状況に組み入れるか、問題状況をク
リアするか、保留するかを選択する。 倍精度データ転送(2)これらの2ビツトはFAI、U
450 とFMPY 440内のXとYレジスタに送り
込まれるデータの多重化とZボートから送り出される倍
精度結果の多重化を制御する。 旧人6の使用 このビットはすへてのボー1−のレジス
タ・ファイルに対する最上位アドレス・ピッ1−か隣接
サイクルの間開しままであるどきマイクロコート・アセ
ンブラによってセラ]・ざAする。これはこのような場
合のサイクル時間を短縮するノこめに使用される。 プログラム流れの例 以下は疑似コートで書かれた簡−r)1なプログラム例
である。この例は、新規な機能かどのように実行効率を
向上させるかを示したものである。 この例の動作図は第42図に示されている。この例で注
意すべきことは次の通りである。 大かっこで囲んでまとめて示されている命令は並列に実
行されるものである。 通常、乗算はルーチンを通るバスごとに行なわれる。し
かし、これはルーチンを簡略化するために4つに減らさ
れている。 2重バッファリングはマイクロコートから見えない。 実行される計算式はC[nl −A [nl *B [
nlである。 ただし、nは09.3の範囲であり、8個のオペランド
と4個の結果はレジスタ・ファイル内の固有アドレスに
おかれる。これらの参照の1つにある′ (初期値)は
対応する要素の反対の要素、つまり、バッファが交換さ
れる前に2重バッファの反対側にある要素を示す。 乗算ルーチンは別表に示す通りである。 (以下余白) %’l   表 MTJL3: (Read A[1] and n1i
l rrom rcgvLer filc。 Do     ’   result    =   
 ”  QMUL4: (Read Aj21 and
 Bf21 from regisLer rde。 Do calculation、 result R[
11= A[11” B[11゜Write valu
e of result   1nto   ’   
file nt(Read A[3] and B[3
] rrorn reljster file。 Do calculation、 result R[
21= A(21°B[21゜Write value
 or rasult R[1] 1nto regi
ster file at C[11゜Te5t FP
WAIT K true ’   to     es
econtinue ”(Do calculatio
n、 result R[3] −A[3] ” B[
3]。 Write value orresult R[2]
 1nto register file at C[
2]Set FPDONE and swap buf
rersTest FPWAIT flag、 K t
rue j+nnp to MULI else ju
mpD〇−軸叫一を珂31−43] ” B[3]。 Do calculation、 result R’
[0] −A’[0] ” BTOI。 Write value of result R[3
] 1nto register file at C
[3]Set FPDONE駈d轡b−−7 Write value or result R[3
] 1nto register file at C
[3]Set FPDONE and swap bu
frers。 toMTJL3 3 丁 OA FPヘクトル乗乗算ルーノン ?k 似コート)このル
−チンについて7主目ずへき点がいくつかある。 このルーチンはずへてのサイクルでFPIIがイ史用中
であることを保つように最適化されている(ただし、そ
のためのデータがあることが条件)。もっと単純で効率
か劣る版には、命令MLIL5とそれ以上が備わってい
ない。 8対の数を乗算するようにこれを拡張するために、M 
U 1.4にある命令はレジスタ・アドレスが変わるた
びに4回繰り返される。 すべてのサイクルでFPυを動作状態に保つためには、
交換を行なわないで2重バッファの反対側からデータを
アクセスする必要がある。これは命令MUL5とそれ以
上で使用される。 次の組のデータが用意されている限り(つまり、FPW
AITが偽である)、制御プロセッサ・モジュール11
0と同期をとる時間の無駄がない。 デバッグ・ハードウェア 浮動小数点プロセッサ・モジュール130上のデバッグ
・バー1〜ウエアは制御プロセッサ・モジ:I−ル11
0やブタ転送プロセッヅ・モジコール120に含まれる
ものよりも機能に制約かあるか、これはそこで実行され
るマイクロコートが非71巴に単純化されているからで
ある。 レジスタ・ファイルへのアクセスは局所転送ハス422
を通して行なわれるのて、モニタ・マイクロコードによ
って読み書きができるようになっている。FMPY 4
40とFALU 450は直列走査ロジックが組み込ま
れているので、このロジックによって内部バイブライン
・レジスタと状況/千−ド・レジスタがアクセスできる
。次のマイクロコート・アドレスは開始アドレス・レジ
スタ479をアクセスすることによって制御プロセッサ
・モジュール110がアクセスできる。 中断点ロジックはマイクロコード語の中のあるビットを
使用して、中断点を定義する。中断点ビットが設定され
た命令が現れると、クロック発生機構は中止され、制御
プロセッサ・モジュール110のインタフェースにある
中断点状況信号かセツトされる。中断点から継続するた
めに、制御プロセッサ モジュール+10はクロック発
生機構に送り込まれた中断廃人力をクリアする。中断点
直後に十分な内部状態か格納されると、制御プロセッサ
・モジュール110はある浮動小数点プロセッサ・モジ
ュール130のマイクロコートの実行を開始しく開始ア
ドレス・レジスタの仕組を通して)直接アクセス状況と
スクラッチバット・メモリをアクセスする。 マイクロロー1−は、1ステツプ進めるルーチン内のす
へての命令で中断点ビットをセットすることによっての
み1ステツプ進めることができる。 デバッグ機能をサポートするもう1つの特徴は、サブル
ーチン・スタックを読み取ることができることである。 (以下余白) アプリケージ(ン向きプロセッサ・モジJ、−ル第9八
図はアプリケーション向ぎ数値処理モジコル+30°を
備えた数値高速化ヅブシステムの概要図である(これは
[アルゴリズム高速化機構」とも呼ばれる)。用意され
ている強力な制御ツールを使用すると、制御プロセッサ
110は1つまたは2つ以上の数値IA理モモジュール
10と1つまたは2つ以上のアルゴリズム高速化機構1
30′とを任意に組み合せた形で制御することかてぎる
。 汎用浮動小数点機構130を1つまたは2つ以上のアル
ゴリズム高速化機構+30°と組み合せると、特に利点
が得られる。この種の結合システムでは、汎用浮動小数
点演算を必要とするいう制約から解放されて、アルゴリ
ズム高速化機構130゛を設営4することができる。従
って、アルゴリズム高速化機構は必要ならば、高度にア
プリケーション向きの設計にすることができる。 特に利点のある組合ゼは、複合演算モジュールをモジュ
ール+30°の1つとして含めることてある。 アプリケーション向とプロセッサはアプリケーション向
き数値プロセッサであることが好ましい。しかし、アプ
リケーション向きプロセッサは任意的に(好ましさの点
ては劣るが)、記号プロセッサ(つまり、1.75Pま
たはPIlol、OGを高効率で実行させると剖必要に
なる追加のデータ通路を備えたプロセッサ)や中立ネッ
1〜ワーク・マシンなどの特異なプロセッサにすること
も可能である。 複数の数値プロセッサ・千ジュール130(アルゴリズ
ム高速化機構を含む)の制御について以下説明する。 FFT高速化モジュール 第9B図はアルゴリズム高速化機構130゛の1例のア
ーキテクチャが汎用浮動小数点モジュール130のそれ
とどのように異なるかを図式化して示したものである。 図示のモジュールは離散的積分変換操作を行なうように
特に最適化されている。例えば、このモジュールは高速
フーリエ変換(FFT)アルゴリズムを高速に実行する
。このアルコリズムの実行例について以下横割すること
にする。 第9B図の実施例では、レジスタ・ファイル910はレ
ジスタ・ファイル430よりも高度化された多重ボート
を備えている。レジスタ・ファイル910は4個の読取
りボートと4個の書込みボートのほかに、キャッシュ・
ハス144 とのインタフェースとなる広幅両方向ボー
ト910Aを備えている。 読取りボート910Bとして示されている4木の線は実
際には折り返されている。実行される乗算は乱数乗算で
ないのが代表的であるが、係数(これはデータ語はどに
変化することが少ない)による乗算であるので、サイク
ルの大部分ではザイクル当たり1つだけの複合語の人力
が必要である。 (しかし、このことは最終サイクルでは該当しない。) 4つの乗算機構920は整数または浮動小数点機構にす
ることが可能である。これらは上述した乗算機構と同じ
にするのが最も好ましいが、勿論他の割算機構の使用も
可能である。これらの機構は新しい係数の読取り指示か
あるまて、係数をレジスタに保持している。 従フて、4つの乗算機構920と加算機構930で完全
ノア複合乗算機構911 を構成することかできる。複
合乗算機構911は2つの複合アドレス912とパイプ
ライン化されている。 2つの複合加算機構912に対する人力には、複合乗算
機構911の出力たけてなく、遅延プロッタ940経由
で送られてきた読取りボート91DCからのデータが含
まれる。(この遅延ブロックは任意的にレジスタ・ファ
イル910上のボー1−9]OBと910 Gを共用す
るために使用することもできる。) 複合加算機構の出力は書込みボー1−910Dに結ばれ
ている。 従って、この構造によると、バタフライ別算を非常に効
率よくパイプライン化することができる。 データ・キャッシュ・メモリ・モジュール140データ
・キャッシュ・メモリは高ハン1〜(1ト域)幅の大容
量メ干りである。記1意容J1シは現在では2M[lて
あり、ハンi−幅は毎秒320 M Itである。この
メ干りは多重ボーI−を備えているので、外部世界との
データ転iXを浮動小数点Filρ;Iと並1jに11
7ぽうことができる。甜算か「調歩」式て行なわれて、
浮動小数廃プロセッサ・モジュール+30か長時間アイ
1〜ルになるのを防止する。 第5図はデータ・キャッシュ・メモリ・モジュール+4
0の主要機能を示している。このモシュルの中心となる
のは、大きなメモリ・ブロック510である。木好適実
施例ては、このメモリ・ブロック510は8個のシング
ル・イン・ライン・モジュールで構成され、各々は8個
の32にx8 SR八へSを備えているので、総計2メ
ガバイトのメモリになっている。しかし、当業者ならは
容易に理解されるように、このメモリ構成は高度半導体
部品の供給変化や特定アプリケーションの要求に応して
変更することが可能である。 特に、ある種のアプリケーションでは、メモリ容量を大
きくすると利点が得られる。このメモリ・バンク510
て×256構成を使用すると、少lx くとも完全な並
列アクセスの場合には、アドレス空間の使用効率か向上
する。従って、木好適実施例では、24ヒツ1〜・ア1
〜1ノス情報かアドレス人力511にあるメモリ・バン
ク510に人力される。書込みイネーブル人力512は
実際には8ビット幅であるのて、1つの256ビツI・
・メモリ・ブロック内の個々の32ピツl’ MMか書
込みのために選択できる。これは下達するような利点が
得られる。データ・ボート513は256ビツト幅であ
る。ブロックの機能には、またモジュール140全体が
もつような多重ボート機能を備えていない。この多重機
能を実装するためのロジックとメモリ・バンク510を
アクセスするためのロジックについて、次に説明する。 第5図の下方に示したのは制御プロセッサ110に結ば
れた32ビット幅データ・バス(CDバス112)と、
データ転送プロセッサ120に結ばれた32ヒツ1〜幅
バス(TDババス22)である。これらのバスの各々は
まず保持レジスタ・バンク560に送り込まれる。レジ
スタ・バンク560の各々は並列の8個の32ヒツ1〜
幅レジスタ561を備えている。(木好通実施例では、
これらのレジスタ561の各々は実際には、書込み保持
レジスタ561゛か読取り保1.′lレジスタ561”
と並列になるように構成された4個の711八1.56
52装置を使用して構成されている。レジスタ・セット
560A、550B、420の構造は第42図に詳細が
示されている。 メモリ・バンク510がアクセスされるには、アドレス
をボート511から得る必要がある。このアドレスはマ
ルチプレクサ520を通して、Cババス111(このバ
ス上には制御プロセッサから出されたアドレスが送られ
る)からか、TAババス21(このバス上にはデータ転
送プロセッサ・モジュール120から出されたアドレス
が送られる)から与えられる。選択人力521はこれら
の入力のどちらをアドレス・ボート511 に送るかを
選択する。 マルチプレクサ520に対する選択人力521は仲裁ロ
ジック530によって生成される。この単純なロジック
は、DTT’がアクセスを要求し、CPかアクセスを要
求していノイい場合たり、D ’l’ Pモジュール1
20へのアクセスをh′[可する。選択信号521 は
アドレス・マルヂブレクザ520にたりてなく、書込み
マスク・マルヂブ1ノクザ530とDTP転送ロジック
540にも送られる。 下達するように、書込みマスク人力512はTDババス
22またij:cDババス22からの書込みのときに非
常に利点がある。書込みイネーブル人力512は分解能
か8ビツトであるので、各メモリ・ブロック510内の
8個の32ヒツト語は、1回の完全並列書込み操作時に
個別的に書込みイネーブルさせることかできる。従って
、例えは、制御プロセッサ110が8未満の語をメモリ
・バンクのある行に書き込むことを要求したときは、必
要とする語位置のレジスタ561に必要とするデータ値
がアップ・ロードされる。さらに、8ビツトが書込みマ
スク線551に送出されて、レジスタのどちらにアドレ
ス511  (Cババス11.1からの)で指定された
行にあるメモリ・バンク510の対応する語に書き込む
べきかを示している。(」二連したように、Cババス1
11からマルヂブレクg520へのア1〜レス転送はI
PII 340め出力によっr 1lilJ御される。 )第25図は刊込みマスク・ロジックを別の見方で見た
ものである。同図において、F 11 書込みマスク・
ロジック2510、CP省込みモニタ・ロジック252
0、およびDTI’書込みモニタ・ロジック2530は
3つの別ブロックに分割されて、マルヂブレク→ノ53
0に対する人力となっている。第26図はmF込みモニ
タ・ロジック・ブロックの動作をもっと詳しく示したも
のである。ロジック261Oに対する入力には、レジス
タ選択、全部書込み、DGM書込み、保留レジスタ・ロ
ートなどがある。出力は8個のフラグ・ビットであり、
レジスタ2620に格納されている。 転送ロジック540はデータ転送プロセッサ+20内の
マイクロコート命令列の一部であるマイクロコード命令
フィールド542によって駆動される。 同様に、CD転送ロジック550は制御プロセッサ・モ
ジュール110のシーケンサ210によって駆動される
マイクロコード命令の一部であるマイクロコト命令しッ
I〜552 にj:って駆動される。(実際には、この
シーケンヅによって駆動されるマイクロ命令1〜の一部
は分散しておくのか好ましい。つまり、マイクロ命令の
フィール1〜の一部は制御記1意機構220から切り離
して保管されるか、シーケンサの出力である一連のマイ
クロ命令アドレス211によってクロックがとられてい
る。これにより、システムから見て大幅な利点が得られ
るh釈これについては下達する。) 転送ロジック540と550の他の出力543 と55
3には、それぞれのレジスタ・バンク560の制御とい
った制御機能があるが、この中にはクロッキングと出力
イネーブルが含まれる。(レジスタ・バンク560の各
々は、レジスタ・バンクの両側に2つの出力イネーブル
と、2組のクロックをもっている。また、CP転送ロジ
ック550によって制御される機能の1つとして、メモ
リ・バンク510の出力イネーブル線514がある。) キャッシュ・バンク510へのアクセスを要求するため
にFPモジュール130からの直接人力はないか、こ才
]は、この種のアクセスは制御ブIJセッヅ・:llニ
ジコール110によって制御さJするからである。こう
すると、下達するJ:うに、大幅な利点か得られる。 メモリ構成 高速化サブシステムは広幅メモリ・アーキテクチャを採
用している。データ・キャッシュ・メモリ140をアク
セスするたびに、256ビツ1−かU、み書きされる。 これはサイクル当たり8個の浮動小数煮詰に相当する。 データ・キャッシュ・メ干り140は3ボートで制御プ
ロセッサ・モジュール110、浮動小数点プロセッサ・
モジュール130、およびデータ転送プロセッサ・モジ
ュール120に結ばれているが、制御プロセッサ・モジ
ュール110と浮動小数点プロセッサ・モジュール13
0によるアクセスは制御プロセッサ・モジュール110
のマイクロコートによって制御されるので、仲裁とアド
レス多重化は2通りの方法たりて行なわれる。 データ ボート データーギへ・ノシー7・メモリと4.占ふボー1〜は
3つある。FPモジュールにつ1.−かるホードは25
6ヒツト幅てあり、制御ブロセッザ・モジュール110
とデータ転送プロセッサ・モジュール120の各々から
はそれぞれ32ピツl〜幅ボートとして見える。 32ヒッl−幅ボートに夕4するデータ経路と記憶装置
はデータ・キャッシュ・ブロック140の一部に含まれ
ている。 メモリ配列から32ピッ1−・ハスの1つに送られる2
56ビツト・データの多重化は32個の両方向レジスタ
を通して行なわれ、これらのレジスタは4個ずつ8群に
配置されている。各群は読取り方向に32ビツト(つま
り、浮動小数煮詰の1語)を、書込み方向に32ヒツト
を格納する。これは保持レジスタと叶ばれる。各lノジ
スタを特定して名前をイ」りると、インタフェースのプ
ロセッサ側から見て、読取り保持レジスタおよび書込み
保持レジスタとなる。 データかメモリ配列から読み取られるときは、ン56 
ヒラ1〜全部か保持lノシスタに格納さね、こJ]らの
lノシスタの出カイネーブル何必要とする77動小数点
語を選択して32ヒツ1−・ボーi・に送出するように
制御される。 データがメモリ配列に書き込よJするとぎは、32ピツ
l〜・ボートから更新されノこレシスタノこけか格納さ
れる。これは書込みマスク・ロジックによって制御され
、各群ごとに1つの側合て8個の書込みイネーブルを使
用して達成される。 32ピツ]・・ボートは両方ともデータ経路と記憶装置
ロジックが同しになっている。 浮動小数点プロセッサ・モジュール130につながる2
56 ビット・ボートは32ビツト・ボートと同じよう
なロジックを備えているが、浮動小数点プロセッサ・モ
ジュール110上に置かれている。データ・キャッシュ
・メモリを、モジュールを使用して将来拡張できるよう
にするために、アドレス・バス(24ビツト)と書込み
イネーブル(8)はモジュール・コネクタ3810 (
第38八図と第38B図に図示)に結ばれている。 CPす1云送ロジツク C11転送ロジツクはCP保持レジスタ(またはF11
保持レジスタ)とデータ・キャッシュ・メそり間のデー
タ転送を担当する。 保持レジスタにあるデータはCDソース・マイクロコー
ト・フィールドか読取り保持レジスタを選択したときア
クセスされる。CPアドレス・バスの最下位3ビツトは
駆動すべき32ビツト語を選択してバス上に送り出す。 この過程では、データ・キャッシュ・メモリは使用され
ないか、必要ならば次の組のデータをアクセスすること
が可能である。 データを書込み保持レジスタに書込むときは、CD宛先
マイクロコード・フィールドは保持レジスタをグループ
として選択し、CPアドレス・ハスCAIIIの最下位
3ピツ1〜は更新すべき32ビツトを選択する。書込み
保持レジスタが更新されるときは、対応する書込みフラ
グかセットされる。従って、データ・キャッシュ・メモ
リに対する書込みが行なわねるときは、制御プロセッサ
・モジローール110によって更新された保持lノシス
タたりか実際にメモリ配列にIIFき込まれる。対応す
る保14レジスタが更新されていないメモリ配列内の詰
は変更されない。データ・キャッシュ・メモリに書込み
か行なわれると(データ・ソースが制御ブロセッザ・モ
ジュール110である場合)、書込みフラグはずべてリ
セッ1−される。制御プロセッサ・モジュール110が
データ・キャッシュ・メモリへの書込みと同じサイクル
時に書込み保持レジスタの1つを更新していた場合は、
その書込みフラグはセットされたままである。 例えば、メモリをある定数値にクリアするときこの選択
的書込みメカニズムをバイパスすると好都合の場合があ
る。その場合には、制御プロセッサ・モジュール110
は選択的書込みを無視して、すべての語を更新させるこ
とかできる。この選択的書込み機能を使用しないと、デ
ータ・キャッシュ・メモリの書込み動作は非常に遅くな
り、データ・ブロック(256ビツ1−)を読取り保持
レジスタに読み込み、変更すへぎてない詔を書込み保持
しシスタに転送し、1!;込み保持レジスタを新しいブ
タて更#Ii してから、データ・キャンシュ・招込み
サイクルを実行することになる。現アーキテクヂャでは
、データを読取り保持1ノシスタから一¥1)込み保持
レジスタに複写するには、I Wli当たり1サイクル
か必要である。 書込みフラグの状態はマイクロロー1−のデバッグ時に
状態格納のために、制御プロセッサ・千ジュール110
に状態を壊さないで抽出さセることか可能である。 読取り保持レジスタは書込み保持レジスタとは別になっ
ているので、書込み保持レジスタの内容を壊さないで複
数の読取りサイクルを実行することかてぎる(逆の場合
も同し)。 保持レジスタ・セットとデータ・キャッシュ・メモリ間
のデータ転送を制御するときは、次のようなビットかイ
吏用される。 データ・キャッシュ・アクセス(1)・このピッ1〜は
制御プロセッサ・モジュール110が自身て使用するた
めに、あるいは浮動小数点プロセッサ・モジコール1′
IOどの間でデータをやりとりするノこめにデータ・キ
ャッジニドメモリへのアクセスlq、 jj!4求する
と、活動化する。アクセス・フラグはバイフ゛ライン化
されていない。従って、データ中入】スフロセッサ・モ
ジコール120からの要求どの仲裁は要求か行なわれた
サイクルか始まる前に解決することができる。 データ・キャッシュ書込みイネーブル(1)このビット
はデータ・キャッシュ・メモリで書込みサイクルを生成
する。 データ・キャッシュ書込みオール(1)このビットはデ
ータ・キャッシュ・メモリ内の語を選択的に更新する通
常の書込みイネーブル・ゲート1ffi作を無効にして
、すべての語を書き出すようにする。これは、メモリを
ブロック単位で定数値にセットするとき便利である。 データ・キャッシュ・ボー1へ選択(1):このビット
はデータ・キャッシュ転送のソースまたは宛先として、
FPモジュール保持レジスタか制御プロセッサ・千ジュ
ール110保持レジスタのどちらかを、巽択−・)−る
。 モー1−・L・シスタに幻保持レジスタを制御する3ヒ
ソ1〜かある。2ヒツトは保持レジスタを使用するか、
バイパスするかを選択する。3番目のピッ)〜はデータ
・キャッシュ・メモリがDCMを駆動するのを禁止して
、書込み保持レジスタと読取り保持レジスタの間にルー
プバック・データ通路がセット】′ツブされるようにす
る。これらの機能が存在するのは、状態格納および復元
マイクロコートがデータ・キャッシュ・メモリの書込み
操作を最初に行なわないで書込み保持レジスタとざらに
より正確な診断情報をアクセスできるようにするためで
ある。 制御プロセッサ・モジュール110は次の2通りの方法
でデータ・キャッシュ・メモリを使用することができる
。 最初の方法は広幅メモリ・アーキテクチャを無視して、
それが丁度32ビット幅であるものとして扱うことであ
る。この場合は、CPモジュール110はずへての読取
りアクセスの前とすべての書込みアクセスのあどて)′
クセス・→ノイクルを要求−・)−るたけである。この
方法を使用すると、データ・キャッシュ・メモリをデー
タ・アク→イスかパイプライン化されたメモリと見るこ
とかてきる。この方法はデータ・キャッシュ・メモリの
使用をi:’、1ji1−にするが、データ転送プロセ
ッザ・モジコール120のボートにサービスできるメモ
リの能力を効率よく使用できない。また、この方法によ
ると、制御プロセッサ・モジュール110が順次データ
をアクセスするときに非効率が生しる。しかし、非順次
データ・アクセスの場合は、次の方法は使用できないの
で、この最初の方法を使用せざるを得ない。 制御プロセッサ・モジュール110が順次メ干り・アク
セスを行なうとぎ、メモリ・バンク510をアクセスす
るたびに、すへての保持レジスタ581に対する読み書
きに8サイクルが必要である。ブタ・キャッシュ・メモ
リ・アクセスは保持レジスタ・アクセスとパイプライン
化で参るので、8サイクルのうち7サイクルをデータ転
送ブロセッリ・−〔シ:J−ルかn山に使用することか
できる。 データ キャッシュ・メ千り・アクセスは自動的に行な
わ、11ないので、マイクロコ−]・て8サイクルこと
にアクセス・サイクルを指定できる。この種の転送は、
外部インタフェースとの間の入出力転送か性質上順次で
あるのか通常であるので、ブタ転送プロセッサ・モジコ
ール120でよく行なわれる。 制御プロセッサ・モジコール110はデータ・キャッシ
ュ・メモリとFl”モジュール上の保持レジスタ間のデ
ータ転送も担当する。その場合には、基本制御はデータ
・キャッシュへの書込み時にあるブロック内のとの語を
更新するかを判断する場合以外は同しである。その場合
、上述したように書込みフラグに対して別の方法が取ら
れる。 違いのいくつかの要因を挙げると、次の通りである。 FPのレジスタ・ファイルと保持レジスタ間のブタの流
れを制御する転送ロジックにはある種の制約かあるので
、制御プロセッサ・モジュール110−C使用されてい
るより汎用的マスク41−成機構は不要である。 FPのレジスタ・ファイルからの141 :’l’+の
データ転送はデータ・ブロック単位(つまり、ムク1−
ルの部)で行なわれ、これか1転送サイクルで11なわ
れるときは、いくつかの1μ込みマスク・ヒツトを制御
プロセッサ・モジュール110の場合のように個別的に
てはなく、並列にセラl〜しなりれはならない。 1つのFP書込みマスク生成機構は複数のFPモジュー
ルと競合しなりれはならない。 FP書込みマスクは更新ずへき語と最初の語からの連続
語の個数を指定することによりて生成される。開始位置
はCPアドレスの最下位3ビツトによって与えられ、長
さはマイクロツー1〜命令のフィルトとして保存されて
いる。 DPT転送ロジック540 データ転送プロセッサ・モジュール120の転送ロジッ
クはデータ転送プロセッサ・モジコール120のデータ
・ハス(TCバス122)とメモリ配列間のデータ転送
を担当−・)−る。これ(:1次の、・、長を除CプG
J岬転送ロジックとほぼ回しである。 浮動小数点ブV」センタ・モジュール+20に関連する
部分かない。 出力(i号は仲裁ロジックの結果によって修飾される。 仲裁ロジック535 仲裁ロジックはサイクル単位で蒲にデータ・キャッシュ
・メ干りをアクセスさせるかを判定する。競合する2ボ
ートには、cp/ppとデータ転送プロセッサ・モジュ
ール120かある。CP/FPはデータ転送プロセッサ
・干ジュール120より優先権かあるので、データ転送
プロセッサ・モジュール120が空きメモリ・サイクル
を待たされることになる。データ転送プロセッサ・モジ
ュール+20は制御プロセッサ・モジュール11Oに割
込みをかけることによって、制御プロセッサ・モジュー
ル110に空きメ干り・サイクルを手放させることかで
きる。 データ・キャッシュ・メモリの仲裁は両方のボ1〜のア
クセス要求(CI”/l・1)の場合は要求)を同期化
することによって4j純化されCいる。こ打は同じクロ
ック生成機構を制御プロセッサ・モジ:I−ルIlOと
データ転送プロセッサ・モジュール120間て共用さゼ
ることで達成される。この程度の同期化かないと、′デ
ータ転送プロセッサ・モジュール+20かアクセスを始
めたばかりの場合もあるので、制御プロセッサ・モジュ
ール110があるサイクル時にアクセス権かあると想定
できなくなる。 サイクル単位の仲裁は仲裁ロジックで行なわれる。仲裁
ロジックはCP要求とo’rp要求の2つの要求信号を
受は取る。これらは共に、そのボートがデータ・キャッ
シュ・メモリをアクセスすると主張されるマイクロコー
ト・ピッ1−である。これらのマイクロローI〜・ビッ
トはレジスタに格納されないので、仲裁はアクセスが行
なわれる前にそのサイクルで解決される。これにより、
データ転送プロセッサ・モジュール120の許可信号は
、シケンザのFl、へG人力のバイブライン化によって
起こる余分の→ノイクJ1勺j7延を引き起さZ、(い
て、十分な時間的余裕をもつ−Cデータ転送プロセッサ
・モジュール120にテスl〜させることかで参る。 2つの出力信号として、データ・キャッシュ・メモリへ
のアクセス箱かあることをデータ転送フロセッヅ・モジ
ュール+20に知らせるDTP許可信号と、アクセスと
書込みイネーブル・マルチブ1ノクサを制御する信号と
かある。 CI”/FPは、データ・キャッシュ・メモリをそれか
1ボート装置であるものとしてアクセスする。 しかし、データ転送プロセッサ・モジュール120はア
クセスを要求するたびに、以下のプロシージャに従ねな
りればならない。このプロシージャは疑似ロー1−で書
かれている。 (保持レジスタに書込みを実行) (アクセスがWAITへのジャンプに失敗したWAIT
  場合は、データ・キャッシュ・メモリへの書込みア
クセスを要求、そうでなければ、継続) (他の作業の実行) このイ列に関してl土日ずへき4:jをいくつか挙げる
と、次の通りである。 このロジックは大量の作業を並行に続行さけることかで
きる。 アクセスか失敗すると、岩込み(またはπ)、取りアク
セスでの保持lノシスタのローディング)は自動釣に禁
止される。 テスト結果には、アクセスか成功したか否がか示される
。失敗した場合は、データ転送プロセッサ・モジュール
+20は、アクセスする命令をループさせることによっ
て再試行する。 この例から明らかなように、データ転送プロセッサ・モ
ジュール120はアクセスが許可されるまで待たされる
ことになる。しかし、通常はいくつかのサイクルの間だ
け待たされることになる。アクセスがそれでも許可され
ないと、DTPは制御プロセッサ・モジュール110に
割込みをかけることになる。制御プロセッサ・干ジ:I
−ル110が割込みザービスを行なっている数サイクル
の期間、データ・キャッシュ・メモリは空きになるので
、ブタ転送ンロセソヅ・モジコール120かアクセスす
ることかできる。 コマンド・メモリ190 コマンド・メ干り190を通して、制御ブロセッヅ・モ
ジコール110とデータ中太】Xフ゛ロセ・ンサ・モジ
ュール120は相互に連絡し合うことがで各る。 双方はこのメモリに対しては平等のアクセス権をもって
いる。本好適実施例では2重ボー1−RAMが使用され
ている。コマンド・メモリは32ビット幅x  2に奥
行である。 第15図はこのメモリ構成の重要な機能のいくつかを示
したものである。コマンド待ち行列の動作について、以
下第15図を参照して詳しく説明するが、そこではCP
モジュールとDTPモジュール間のプロセッサ・インタ
フェースについても説明する。しかし、このメモリ構成
のいくつかの主要機能についてここで説明しておく。 これらの2重ポートRAMは、2アドレスが異なるとき
は、両ボー]〜が無制約にアクセスできるようにする。 2ア)−レスが同してあり、両方の側が書込みを行なう
場合は、ホ^果がと91.るか分からない。下達するよ
うに、2プロセッサ間の通イ1.プロ1〜コルは、両方
か同しア1−1ノスに:i1:き込むことかないように
なっている。 制御プロセッサ・モジコール110どデータ転送プロセ
ッサ・モジュール+20かコマンド・メ干りをどのよう
に使用するかはソフトウェ】′て制御される。本好適実
施例では、割振りは次のJ:うになっている。つまり、
CPモジュール110に対するコマンド待ち行列(例:
メモリ・スペースの約12*)DTPモジュール120
に対するコマンド待ち行列(例:メモリ・スペースの約
38%)、状態格納と復元データ構造(例:メそり・ス
ペースの約50*)。 状態格納と復元データ構造はマイクロコード・デバッグ
・モニタが制御プロセッサ・モジュール110と浮動小
数点プロセッサ・モジュール130の状態情報(ある種
のコマンド構造と共に)を保管しておくために使用する
ために予約されている。 ポス1−一インタフj−−ス・ロジックl[i0第6図
は、第1図にその全体かブロック160てン丁くされて
いるポスト インタフェース・ロシ・ツタの主要構成要
素を示しCいる。好適実施例では、システム・ハス!+
、ll V M Eハスであるのて、このインタフェー
ス・ロジックは本明細書中ではr VMEインタフェー
ス」ど叶ふ場合すある。しかし、当業者なら明らかなよ
うに、他のシステム・ハスを幅広く使用することも可能
であり、開示されている新規事項はこの種のシステムに
容易に適用することが可能である。 ハス・コントローラ650はVMEハス・サービス線と
のインタフェースどなって、ハス許可、バス要求、リセ
ットといったインタフェース信号を出力する。 割込みロジック680は割込み処理で使用され、ホスト
に割込み通知を行なう。(これらの割込みはVMEハス
・サービス線600B上に送出される。)本好適実施例
では、こねは下達するように、I’ALを用いて構築さ
れている。 さらに、DMΔコン1−ローラ640′l)川音さ旧゛
Cいることか々fましい。これはVMI−ハスと1・1
Ffl 1i70間のデータ処理を低レベルて制御J−
るbのて、途中に介入するステップをデータ転送ブロセ
ツヅ・士ジュール120に監視させる必要か/Jい。本
好適実施例ては、DMAコンI−ローラは下達するJ:
うに、1”八1.を用いて構築され′Cいる。 VMEインタフェースは主に、次の4つのサービスをボ
ス1−・プロセッサに提供する。 3種類のプロセッサ・モジュールとの直列走査ループ・
インタフェース経由のマイクロコート・ローディング。 コマンド起動と状況監視 DMAによるホスト・メモリへのアクセスによりVME
アドレス空間との間のデータ転送(これにより、サブシ
ステムは独自のデータを転送できる)デバッグ(ハード
ウェアとソフトウェア)機能。 このインタフェース・ロジックの内部接続にはデータ用
のTDババス22 とアドレス情報用のTへバスンl 
、 C11マイクしノアトレス・ハス2+111、DT
PマイクロアI−Iノス・ハス利■、直列マイクロ命令
ルブ225、および多数の割込み線ど状況線かある。 木実施例では、外部接続はVMEハスとの接続である。 このハスの線は第6図にアドレス線60〇八、データ線
600B、およびハス・サービス線(状況線ど制御線を
含む) 600Cとして別々に示されている。 本好適実施例はVMEインタフェース規格の電気的定義
に準拠している。この規格はIEEE標準PI014/
D1.2およびIEc 821 として知られている。 インタフェース・ブロック160は32または24ビツ
ト・アドレスと32または16ビツト・データを受は付
ける。本好適実施例では、アドレス指定とデータ・ルー
チンを単純化するために、使用できるアクセスのタイプ
に若干の制約がある。 別の方法によれば、他のバス構造を幅広く使用すること
も可能である。例えば、必要ならば、VersaBus
  FutureBus  Multibus I I
  Nubusなどを簡単にシステムに組み入れる設泪
じすることか可能である。調速コンビ−・−タ・シスう
ムの場合には、光ファイバに変調固体;18了lノーツ
を使用して光ハスを使用すると利点か71ノられる。 物理バス線とのインタフェース VMEバスと直接インタフェースどなるロジック・ブロ
ックについて最初に説明する。そのあとて他のロジック
とメモリ・ブロックについて説明する。最後に、レジス
タ・ブロック612について説明する。このレジスタ・
ブロックは、他のブロックの動作を分かりやすくするた
めに、かなり詳しく説明されている。 バス・コン1〜ローラ650 バス・コントローラ650はバス・サービス線600C
とのインタフェースとなり、ボード・アドレス・デコー
ダ652からその特定ボートがアドレスされているかど
うかを示す出力を受は取る。 デコーダ!+52はVMEバスのボード・アドレス線を
絶えず監視して、このデコート出力を送出する。ホスト
・システムによって指定されたサブシステムのアドレス
は、DILスイッチを用いて導入111丁にユーヅによ
ってセソl〜される。アI・レスと機能ロー1への実際
のデコートはPALの中で行なわれるのて、サブシステ
ムは[1標VhlEシステムに合った構成にすることが
できる。 ハス・コントローラ650はVME制御プロトコルに従
って、両方向データ・バッファ620または両方向71
〜レス・バッファ630にイネーブル信号を送る。 ハス・コントローラ650はDMAコントローラ650
とVME割込みロジック680(および以下で詳しく説
明するように他のロジック・ブロックからの)からの状
況情報を受は取るようにも接続されている。また、バス
・コントローラ650はDIIAコントローラ640、
VME割込みロジック680、および他の多くブロック
(上述する)に制御信号を送るようにも接続されている
。バス・コントローラ650の状況と制御接続は広範囲
にわたっているので、混乱を避りるために個別的には示
されていない。 しかし、これらの接続は当業者には容易に理解されるは
ずである。 木好通実施例では、これはVMI−ハス・:]ンl−(
:1う装jl (SigncLics S(+8687
2)として構成されている。これはマスク・インタフェ
ースとハス・エラー・サイクルを含むすべてのバス・フ
ロトコルを取り扱う。 マスク・モートとスレーブ・干−1・ VMEインタフェースは2つの別個のインタフェース、
つまり、スレーブ・インタフェースおよびマスタ・イン
タフェースと考えることができる。 マスク・モードでの動作について、DMAコントロラ6
40と関連づけて以下説明する。 スレーブ・モードはスレーブ・アドレス・デコーダ63
2を使用して行なわれる。高速化サブシステムがスレー
ブ・モート(これはバス・コノトローラ650によって
デコードされたVMEコマンドで示される)で動作して
いるときは、コントローラ650は両方向バッファ63
0を通過モートに置いて、スレーブ・アドレス・デコー
ダをイネーブルする。そのあと、スレーブ・アドレス・
デコーダはVMEアドレス線600八から持ち込まれた
アドレスをデコートシて、1.に当の装舊をイネーブル
する。 この場合も、スレーブ・ア1−レス・デコーダの出力は
広範囲に渡っ°C接続されているので、個別にはボされ
ていない。 スレーブ・アドレス・デコーダはVMEプロトコルに準
拠する必要なりTACに生成ロジックも備えている。 VMEプロ1〜コルの下では、現在のハス・マスタかホ
ードをアト1ノス指定し、そのボートはスレーブ・モー
ドにあるときだけ応答することができる。というのは、
どの時点ても活動マスクは1つだりが許されるからであ
る。(バスへのアクセスが許可されるまで、従って活動
状態になるまで待たされているマスクは多数存在するこ
とがあり得る。)そのあと、マスクはスレーブがDTA
Cに (データ転送受領確認)で応答して、データを受
は取ったこと(書込み操作)またはデータを送ったこと
(読取り操作)をマスタに知らぜるまで、待たされるこ
とになる。 データ ハソフ)・620 これは両方向バッファであり、VMI−データ線1i 
00 +1どの直接−〆ンタフェースとなるものである
。 アドレス・バッファ630 これは両方向バッファであり、VMEアドレス線600
Bとの直接インタフェースとなるものである。 VMEインタフェース・メモリ660 このメモリはインタフェース160内の大きな記憶ブロ
ックとなるものである。これのいくつかの用途は、DT
P千ジュール+20の動作と関連づけて上述した通りで
ある。 メモリ・マツプ 各高速化サブシステムは8KBのVMEアドレス空間を
使用する。このアドレス空間のベース・アドレスは8個
のスイッチによって選択される。レジスタ・アドレスは
このベース・アドレスからのオフセットとして与えられ
る。高速化サブシステム用のメモリ・マツプは2つの区
域に分割てきる。 サイズか28 x 32ビット話のメモリ区域。このメ
モリ1ス域の使用法はソフトウェアで制御される。この
区域に納められるデータ構造のいくつかは以下に挙げる
通りである。 メモリ・スペースの下方部分を占有するレジス久区基。 この区域は、詳しく下達するように、多くの重要な機能
用に使用される。 メモリ区域はマイクロロー1−・デバッガと通常の実行
時インタフェース間で共用される。 デバッガ区域には、モニタ・マイクロコードかメモリ、
FIFOなどを読み取れるようにするコマンド待ち行列
の他に、サブシステムの状態格納情報が収容される。 実行時インタフェースは主に装置トライバがそこにコマ
ンドを追加して、口1itzマイクロコードがそこから
コマンドを削除できるコマンド待ち行列から構成されて
いる。 ハードウェアをアクセスする仕方にはいくつかの制約が
ある。これらの制約は主にハードウェアを単純化して、
それてもなお、15または32ビツト・データ・バス・
インタフェースを可能にするためのものである。制約ど
は、ハイド・アクセスかサポートさねないこと、ヒツト
・アクセスは長話(32ビツト)境界で行なう必要かあ
ることである。 メモリ600 とデータFIFO670は32ピッ1−
幅である。ホスト・システムが16ビツト・システムで
ある場合は、−」二位16ビツ1〜はアクセスかでさノ
よい。 16ビツト・システムがメ干り内の連続アドレスに書込
みを行なう場合は、ア1−レスな4ずつ増やして行って
、次の記憶位置に移る必要がある。 好適なサブシステムで使用されるVMEメモリ・マツプ
は次のようになっている。 レジスタ      オフセット 制御レジスタ     0 ストローブ・バッファ 4 状況レジスタ     4 WCS制御レジスタ08 WCS制御レジスタ1  12 WCSデータ・レジスタ 16 CPマイクロアドレス  20 DTPマイクロアドレス 24 データFIFO28 幅 16読み書ぎ 16書込み 8読取り 15M売み書き 8読み書き 16読み書き 16読み書き 6読み書き 32読み書き +トメモリ[1fi0      409[i    
32読み書きデータFIFO670 データFIFO670はデータ転送操作におりる重要な
機能を備えている。 通常の動作モートでは、DMAコントローラがデータF
IFOを排他的に使用するので、データF I F O
がポストによってアクセスされることはない。ホストは
制御レジスタ内のFIFOアクセス・ビットをリセット
することてデータFIFOへのアクセスが可能になる。 PIFO670で示されたブロックは物理的に2個のF
IFOで構成され、両方向FIFOの機能をもっている
。これらのFIFOの一方はホストによって読み取られ
、他方はホストによって書込まれる。FIFOの他の終
端はDTPによってアクセスされる。(従って、−数的
に、ポストがFIFOに書き出したあとでFIFOを読
み取る場合は、読み取られたデータは書き出されたデー
タと異なることになる。)ホストがFIFOをアクセス
するときは、FIFO状況をモニタして、FIFOか空
のときに読み取られたり、−杯のときに碧鈴込まれたり
しないようにしなければならない。(ポストはこれらの
1・11・()を1、な断目的で、あるいはDMAでな
くポーリングされた人出力が必要である場合にアクセス
する必要かあることがある。) VME割込みロジック680 VME プロトコルはいくつかの割込みを用意している
。これらの割込みはDTPモジコール+20によフて引
き起ずことができる。 DTPモジュール120は割込みベクトルも定義してい
る。ベクトルは割込み理由に応じて変更することができ
るが、割込み原因をVMEインタフェース・メモリ66
0に格納しておけば、1つのベクトルを使用することも
可能である。 DMAコントローラ640 データFIFO670とVMEバス間の順次またはブロ
ック・モードの転送がDMAコントローラ640によっ
てサポートされている。(このコントローラはより通常
の単語転送もサポートしている。)DMAアドレスは完
全な32ビツトであり、転送時に使用されるいII゛ 
アミル1/ス修1iili子と10 N G *信号は
ずへて転送か開始される前にDTf’モジJ−ル120
によってレジスタにセラ1−アップされる。 Hl;0670の反対側はDTPモジュール120によ
つ°C−杯または空にされる(通常はデータ・キャッシ
ュ・メ干り140の中に)。16ビツ1〜転送か使用さ
れるどきは、DTPマイクロコーローTe1.32ピッ
1〜内部形式との間でデータをパックまたはアンパック
する。 この部分かDMAコントローラとも呼はれるのは、D 
1’ l’そジュール120からの1個の高水準コマン
ドを受りてFIFO570との間でブロック・データ転
送を行なうことができるからである。しかし、この機能
がもつ機能は商用化されているDMAコントローラ・チ
ップの機能とは同じでない。通常のDMAコントローラ
は、活動時にDMAアクセスで使用するものと同しバス
からデータとアドレス情報を受り取る。しかし、DMA
コントローラ640はそのアドレス情報をDTPモジュ
ール120から受は取り、この情報を使用してVMEハ
スとのア!−レスおJ:ひデータ・インタフェースを制
御−・j−る。 本好適実施例では、DMAコン1−ローラ[i4[1は
実1際には4個の八m29i DM八へ゛・ン1〜・ス
ライス・チップに実装され、ある種の関連ロジックは下
達するようにPALに実装されている。 DMAコン)〜ローラのセラi・ア・シフ゛はD ’r
 P干シ」−ル120によって行なわれ、データはVM
Eハス線600BとデータFIFO670との間で転送
される。 3つのアドレス指定モートが使用可能である。 これらのどれが使用されるかは、転送の種類またはシス
テム構成によって決まる。 アドレス定数保存。このアドレス指定モートはDMAが
VMEメモリにアクセスすると籾同じVMEアドレスを
保存しておくもので、これは人出カポ3トをアクセスす
るとき使用される。 アドレスを2ずつ増分(または減分)。このアドレス指
定モードはアクセスされるVMEメモリが16ビツト幅
だけのとき使用される。この場合は、DTPはデータを
内部で使用される32ビット語と外部で使用される16
ビツト語の間で分割またはマシする。 ア1ヘレスな4ずつ増分(または減分)。このアドレス
指定モートはアクセスされるVMEメ干りが32ビット
幅であるとき使用される。 勿論、当業者にJS<知られているように、複数の状況
信号を使用ずれは、FIFOに対するデータの扱い方を
制御することがてきる。例えば、この種の状況信号には
、FIFO空、FIFO半満杯などがある。 マイクロコート・ロード制御ロジック610このロジッ
クはマイクロアドレス・バス211Bと31111およ
び直列ループ225 とのインタフェースとなるもので
ある。(より正確には、第28図に示すように、このロ
ジックは1つの直列出力線225八を備え、4つの帰還
線225B、225G、225D、225Eを備えてい
る。)このブロックの構成要素とそれが実行する機能に
ついて、第27.28、および29図を参照して以下説
明する(直列ループ・インタフェースの動作と関連付な
がら)。 このロジックはレジスタ・ブロック612にあるCPと
DTPマイクロアI−レス・レジスタを)′クセスする
必要がある。さらに、WC5指定子制御レジスタもアク
セスする。これらのレジスタはIノジスタ・ブロック6
12に示されているか、制御ロジックの一部と見ること
も可能である。 このロジックはフリップフロップ2720、ステ]・・
マシン2740、マルヂブレクヅ2710、おJ:ひW
CSデータ・レジスタ2730 (これはシフ1へ・レ
ジスタである)から構成されている。 レジスタ・ブロック612 多数の有用なレジスタがレジスタ・ブロック612に集
約されて示されている。このブロックに含まれる機能と
信号について以下説明する。 制御レジスタ・ビット ホストは制御レジスタを使用して、サブシステム・ハー
ドウェアの基本的動作を制御する。これらには主にハー
ドウェア・リセット機能とクロック制御が含まれる。制
御ビットは次の通りである。 CPシーケンサ・リセット このビットはセットざよ]
乙と、CI’シーゲンジ210にアト1ノスOまてシヘ
・ンブさゼ、内部シーケンサ状態をリセッ1−する。 DrPシーケンヅ・リセッ1− このビットはセットさ
れると、DTPシーケンサ310にアドレス0まてジャ
ンプさせ、内部シーケンサ状態をリセットする。 DTP リセット このビットはクリアされると、DT
I’を安全状態に置くので、すべてのハスは3状態にな
る。これか主に使用されるのは、違法マイクロコート命
令でハス競合が起こるのを防止するマイクロコートをロ
ー)−するときである。 CPリセット このビットはクリアされると、CPを安
全状態に置くので、すべてのバスは3状態になる。これ
が主に使用されるのは、違法マイクロコート命令でバス
競合か起こるのを防止するマイクロコードをロートする
ときである。 FPリセット、このビットはクリアされると、FPを安
全状態に置くので、すべてのハスは3状態になる。これ
が主に使用されるのは、違法マイクロコート命令−Cハ
ス競合か起こるのを1υj+lニー4−乙〕′lイクロ
ローl’をロー1−するとぎである。 VME FIFOリセット このビ・ントはクリアさJ
すると、VMEデータFIFOを空の状態にセ・ン卜す
る。 データ・バイブFIFOこのビットはクリアされると、
データ・バイブFIFOを空の状態にセ・ン1−する。 GIP FIFOリセット、このビ・ントはクリアされ
ると、GIPインタフェースFIFOを空の状態にセ・
ントして、GIPインタフェースを初期設定する。 自走クロック:このビットはCPとDTPマイクロコー
ド・クロックを制御し、クロックを自走まノこは停止さ
せる。クロックが停止されたとぎは、ホストから1ステ
ツプ進めることが可能である。 クロック・ディスエーブル・このビットはバイブライン
・レジスタに対するクロックを除き、CPとDTPのす
べてのマイクロコード・クロックをディスエーブルする
。これが必要になるのは、例えは中断点を設定するとき
CPまたはDTPの状態を壊さないでマイクロコードが
読み書きされるようにするためである。 自走1゛1)クロック、このヒラ)・はFPマイクロコ
1〜・クロックを制御し、クロックを自走または停止さ
ゼる。 FIFOアクセス このビットはVMliデータFIF
Oへのアクセスを制御する。通常のオプションは内部D
MA コントローラに排他的アクセス権と制御権をもた
せるか、診断時またはVMEスレーブのみ環境では、ホ
ストがこのビットをセットすることでこれらのFIFO
の制御権を受は取ることができる。 マイクロコ−1−・ループ、このビットはテストをマイ
クロロー1〜・レベルで繰り返すために診断機能だけが
使用する。 ストローブ・バッファ ホストはストローブ・バッファを使用して、サブシステ
ムを縁またはパルス面から制御する。ストローブ・バッ
ファに書き込みが行なわれる場合は、セットされている
すべてのビットについて対応するストローブ線にパルス
が現れる。この自動ス1−ロービングにより、ホストは
ストローブ線のセラl−とリセッ[・によるストローブ
線の切(・(λから解放される。この操作は1門:込み
モー1−のときたり使用される。ポス1−かこのバッフ
ァを読み取ると、ある種の代替状況情報がポストに送り
返されることになる。 ストローブ線には、次のものがある。 1ステツプ これは1ザイクルの間にCPとDTPマイ
クロコート・クロックを1ステツプ進めるものである。 これは、ハードウェアがWO2を1ステツプを進めてロ
ードしたり、読取りや変更するとき使用される。 FPバイブライン・クロック:FPパイプライン・クロ
ック信号は、FPのWO2の内容を読み戻すときだけ直
列マイクロコード・ループ制御の一部として使用される
。FP内の実行時パイプライン・クロックは通常FPマ
イクロコート・クロックと同じである。 cp wcs書込みイネーブル:この信号はCPマイク
ロアドレス・レジスタに指定されているアドレスから直
列ループに以前にロートされたデータでFPのWGS 
470 に1μ込みを行なう。CPマイクロアト1ノス
・レジスタか使用されることに注、位されたい。 WGS 470への書込みはり−FWCSマスクによっ
て修飾されるので、選択されたFPだけのWGSか更新
される。 CPデバッグ割込み このストローブはCPに割込みを
引き起すものである。これは、DTPをデバッグ・モニ
タに戻すためにマイクロローI〜・デバッグ・モニタに
よって使用される。 DTP割込み、このス1−ローブはDTPに割込みを引
き起すものである。これは、コマンドがそのコマンド待
ち行列にロードされたことをDTPに通知するために装
置トライバによって使用される。 状況レジスタ 状況レジスタは読取専用であり、主にホストがVMEデ
ータFIFOをアクセスてきるときにホストにVMEデ
ータFIFOを判断させるために使用される。 状況ピッ1〜には次のものかある。 VME出力FIFO状況、このFIFOから出される状
況ピッ1〜には、満杯、半満杯、空の3つがある。これ
らの状況ヒラ[−は、ボス1〜かそこから読取りを行な
うFIFOに対するものである(そのアクセスか可能で
ある場合)。 VME人力FIFO状況、このFIFOから出される状
況ビットには、満杯、半満杯、空の3つがある。これら
の状況ビットは、ポストかそこに別込みを行なうFIF
Oに対するものである(そのアクセスか可能である場合
)。 IIERE: この状況ビットはFPモジュールが存在
するかどう、かをホストに判断させるものである。これ
を行なうには、各モジュールのアドレスなWC5制御レ
ジスタ1に書き込み、この状況ビットをテストする。そ
のアドレスにモジュールがあれは、この状況ビットはク
リアされ、モジュールがなければ、セットされる。 WCS制御レジスタ WCSインタフェースは2つのレジスタを使用して制御
される。最初のレジスタはCP、DTP内およびFPモ
モジュール上ある各種マイクロコート・メモリの読み書
きを制御する。これらの信号の機能と用7去の1iYf
ill iJマイクロコロー−・ローディングの個所で
説明されている。 このレジスタにおける制御信号には次のものかある。 直列ループ出力信号:これは3ビツト・フィールドの最
」二値ピッ1−であり、直列ループの並列通路のどのブ
ランチを戻り路として働かせるかを選択するものである
。このフィールドの他の2ビツトはWC5制御レジスタ
1にある。 FP WC5出カイネーブル このビット出力は、通常
のマイクロコート実行とマイクロコード読み戻し時にイ
ネーブルにする必要かあるが、マイクロコードのロード
時にディスエーブルする必要があるデータをイネーブル
してFPマイクロコード・メモリから取り出すものであ
る。 FPパイプライン出カイネーブル・本好適実施例では、
FP WGS 470はマイクロコート・ローディング
を最適化するために2つのバンクに分割されている(下
達する)。この信号はこれらの2バンクの出力とのイン
タフェースとなるパイプライン・17シスタ476を制
御する。 rp wcsモート・これは直列ループ・モートを制御
し、ループを回ってデータをシフトさせるか、WGSと
の間でデータを転送するかを選択する。 CPとDTPバイブライン・レジスタ出力イネーブル:
これはマイクロツー1〜命令をディスエーブルして、す
べてのピッ1〜を高レベルにするとぎたり使用される。 cp wcs出カイカイネーブルのビット出力は通常の
マイクロコード実行とマイクロコード読み戻し時にイネ
ーブルにする必要があるが、マイクロコードのローディ
ング時にディスエーブルする必要のあるデータをイネー
ブルしてCPマイクロコート・メモリから取り出すもの
である。類似の信号はDTP WC5320の出力イネ
ーブルを制御する。 cp wcsモード:これは直列ループを制御し、ルー
プを回ってデータをシフトさせるか、WGSとの間でデ
ータを転送するかを選択する。 DTP WCSモード:これは直列ループを制御し、ル
ープを回ってデータをシフトさせるか、WGSとの間て
データを転送するかを選択する。 CPマイクしノコート3 択 これはC[)のシーケン
サにその71−レス・ハスを3状態にさせて、その代わ
りにCPマイクロア1−レス・レジスタをイネーブルし
てハスを駆動さゼるものである。 FPマイクロア1〜レス選択 これはFPのWO2のア
ドレス・ソースどしてCPマイクロアドレス・バスを使
用さゼるものである。通常、CPマイクロアドレス選択
は、ボス1〜かマイクロコート・アドレスをCPに、従
ってFT’に送るようにセットアツプされている。 FP WC5選択 FP WO2は並列ロート機能では
データ経路指定が必要になるので、読取り時は2半分と
して扱う必要がある。このピッ1−は下位64ビツトか
上位40ビツトを選択する。 直列ループ復帰選択(2):直列ループ戻り路は4つの
ソースの1つから選択できる。(これはWO2の内容が
直列ループを通して読取られるときそのソースを選択す
るようにセットアツプされていなりれはならない。)ソ
ースとなり得るものには、CP内部(ヘ−ス・ポートた
りにある)、CP外部(ベース・ボー1−ど1・Pモジ
ュールにある) 、 Di’ll、およびFPがある。 直列ループ・モート(2)これらのビットはブタがWC
Sデータ・レジスタから読み刊キされるどき直列ループ
をどのように振る舞わさせるかを制御する。オプション
には、データ保留、データ・シフト、データ・パルスが
ある。これらの効果については、直列マイクロコード・
ロートのm所で説明されている。 他方のレジスタはFPモモジュール上マイクロコードを
ロードし、読み取ることを制御するフィールドを保持す
る。これを制御するフィールドには次の2つがある。 WCSロード・マスク:このマスクの各ビットはマイク
ロコードを対応するモジュールにロートすることをイネ
ーブルする。ビットはいくってもセットできるので、類
似のモジュールに同しマイクロコードを並列にロードす
ることか可能である。 直列ループ出力イネーブル これらの残りのビットはW
C5制御I/シスタ0にある3番目のピッ1〜と一緒に
使用されて、干ジュールのとれに直列ルフのCP外部戻
り路とFP戻り路を駆動させるかを選択する。 WCSデータ・レジスタ WCSデータ・レジスタは直列ループ、従ってマイクロ
コード・メモリをアクセスするときホストが読み書きす
るレジスタである。マイクロコードのローディングを効
率化するために、このレジスタはWC5制御レジスタ0
内の直列ループ・モード・フィールドがどのようにセッ
トアツプされているかに応して異なった振舞い方をする
。 直列ループ・モートが「保持」にセットされている場合
は、このレジスタは他のレジスタと同じように読み書き
される。 直列ループ・モードが「シフト」にセットされている場
合は、WCSデータ・レジスタに対し読み書き操作が行
なわれるたびに、レジスタは16桁だけシフトされ、書
籾込まれたデータが直列ループに挿入されると共に、ル
ープ内の「最後の1語がデータ・レジスタにロー1・さ
れる。 直列ループ・干−1−か「パルス」に七ノドされている
場合は、レジスタは他のレジスタと同しように読み書き
されるか、書込み操作か行なわれると、ある種の制御信
号が自動的に発生されて直列ループを制御する。 CPマイクロアドレス・レジスタ このレジスタはCPまたはFPモジュールのマイクロコ
ード・ロード時にマイクロコート・o −ト制御ロジッ
ク610によって駆動されて、CPマイクロコート・ア
ドレス・バス211B上に送出されるデータを保持する
。CPマイクロア]・レス選択ビットがwC8制御レジ
スタ0にセットされている場合は、このレジスタを読み
取ると、そこに最後に告キ込まれたデータが返却される
。そうでない場合は、CPのシーケンサが出力中のアド
レスの非同期スナップショットが返却される。 DTPマイクロアドレス・レジスタ このレジスタはDTPモジュールのマイクロコド・ロー
ト時にマイクロコート・ロート制御ロジツク610に:
よって駆動されて、D i’ Pマイクロコト・アドレ
ス ハス3 ] I 11上に送出されるデータを保持
する。DTIIマー7クロアI〜レス選択ビットがWC
5制御レジスタ0にセットさ才1ている場合は、このレ
ジスタを読み取ると、そこに最後に書き込まれたデータ
か返却される。そうでない場合は、DTPのシーケンサ
か出力中の71〜レスの非同期スナップショッl−が返
却される。 (以下余白) データ・パイプ・インタフェース・ロジツタj50デー
タ・パイプ概念は複数の個別サブシステムを各種の1〜
ボロシ形状に結合ざ氾るものである。 この結合は「データ・パイプJと叶ばれる複数の局所ハ
スを使用して行なわれる。また、この結合はバックブレ
ーンから独立しているので、相互に1Iillシて結合
することが可能である。 本好適実施例では、各データ・パイプ局所ハスは32ビ
ット幅て毎秒40MBの転送することをザボトし、受取
側はFrF(]でバッファリングされる。各サブシステ
ムは2つの入力バイブと1つの出力バイブをもっている
。出力バイブは個別クロックをもっているので、2人カ
バイブにデーシイ接続されているときは、データは各人
力バイブに個別的にも、まとめても送ることができる。 データ・パイプ・インタフェース150は第7図に示さ
れている。データ・バイブ出カポ−1へは32ビット幅
である。このボートは別の高速化ポート4140上のデ
ータ・パイプ・インタフェースの入カポ−1−(710
または720)に(またはある種のタイプの別の”A 
!i、’1: 、J二のデータ・パイプ゛・インタフェ
ースに)接続する・−とか可能である。データ・パイプ
の受取り側はF I l’ Oてバッファされている(
FTFO740または750を使用して)ので、出力側
731は電気的にデータをバッファするたりである。2
つのストローブ760が用意されているので、一方のデ
ータ・パイプ・インタフェースが他の2つのサブシステ
ムに書き込むことができるようになっている。受取り側
ザブシステムでデータ・オーバランが起こるのを防止す
るために、受取り側システムからのFIFoj1杯フラ
グ770を送り側サブシテムか使用してモニタリングが
できる。2つの人力FIFO740と750が2つの人
力ポードア10と720にあるので、2つのザブシステ
ムは1つのサブシステムにデータを送ることができる。 FIFO出カイ出御イネーブルPマイクロコード内のT
Dソース・フィールドによって制御され、出力ストロー
ブはTD宛先フィールドによって!1iII御される。 人力FIFO状況信号780は条件コート・ロジッつて
テストすることてきるか、割込みを引き起すこともある
。 このインタフェース構成を使用すると、複数のザブシス
テムを局所ハスて各種]・ボロシ形状に結合することか
できる。このようにザブシステムを柔軟に再構成できる
ことは、アプリケーション向きマイクロスコピック・デ
ータ転送アーギテクヂャを多くのアプリケーションで使
用すると大きな利点が得られるので、第1図に示すザブ
シテムの場合に特に有利である。トポロジ形状のいくつ
かの例が第34.35.36.37図に示されている。 ある種のアルゴリズムやアプリケーションでは、複数の
サブシステムを並列またはパイプライン構成にすると、
計算作業負荷を分散できる利点が得られる。例えば、高
性能3次元図形ワークステーション構成の1例が第36
図に示されている。 複数のサブシステムをデーシイ構成で結合すると(第3
7図に図示)、データを共用することかでき、その場合
、「マスタフサブシステム4150Aは例えばホスト・
メモリからデータを人手し、それをデータ・パイプ結合
を通して他のすへてのサブシスデノ、415011.4
1!i0[;、415011 と:!1用することかて
ぎる。この結果、各ザブシステムか独自のコピをもつの
ではなく、1つのザブシステムたりがデータを取り出す
ことになるので、ポスト・バス411Oのパン1−幅か
節約される。 データ・バイブはリングに結合ずれは(第35図)、ケ
ンブリッジ・リングど同しような設謂構造のトークン・
パッシング・ネットワークを効果的に構築することか可
能である。 データ・バイブ経由で送られるデータの内容と意味はソ
フトウェアで制御されるか、通常はメツセージ・バケツ
1〜にするのが普通である。 データ・パイプはシステム間通信用に設計されているが
、これらは他の周辺装置と結ぶことも可能である。持続
入出力速度は毎秒40MBであるが、バースト人力速度
はもっと高速である。バースト入力速度は配線の電気的
特性によって制限されるが、データ・パイプ人力が1つ
のときは、毎秒1601AB  (両方の人力か並51
+化しているときは、適当なバッファ・カートを使用す
れば最高320MBまて)にすることか可能である。 このインタフェース機能の主要な利点は、使用できるサ
ブシステム相互接続トポロジが多様化していることであ
る。従って、特に注目すべきことは、図示の構成例は大
幅な柔軟性が得られることを示している。 画像プロセッサ・インタフェース+70このインタフェ
ースはアプリケーション向ぎバスとの接続を可能にする
。本好適実施例では、このバスは図形と画像データ向け
に特に最適化されている画像プロセッサと結ばれる。ま
た、本好適実施例では、この画像バスはr GISバス
」であり、このバスは160本のデータ線からなり、デ
ータ・クロック期間が120−200nsて動作する。 (従って、このインタフェース・ロジックは本明細書の
各所でrGIPインタフェース」と呼ばれている。)し
かし、他の画像データ・バス標準(好ましさの点で劣る
が)を使用することも可能である。別の方法として、デ
ータ転送要求条件(地震測定や実時間システムなど)が
特殊なアプリケシ三】ンの場合には、他のアプリケーシ
ョン向ぎハスを使用することも可能である。 G I I+ゼインフェースを通して、GIPとザブシ
ステムはデータとコマン1〜を相互に受渡しすることが
できる。このインタフェースは第8図にブロック図で示
されている。 GIP とサブシステム間の連絡はすべて16ビツト幅
両方向PIFO810を通して渡される。FIFOの一
方の側はDTPマイクロコートによって、他側はGIP
マイクロコーローによって制御される。GIPインタフ
ェースはマイクロコード拡張ボート・インタフェースを
備えているので、GIPは実際には、ザブシステムに常
駐しているマイクロコード(8ビツト)を実行する。G
IPマイクロコード拡張バスは前述したDTPマイクロ
コード拡張インタフェースと同じである。 GIPインタフェースは、GIP図形プロセッサがある
種の分散マイクロコードをサブシステムで実行させるた
めに必要なサービスを提供する。これらのサービスには
、GIPマイクロコート・クロック、GIPマイクロア
)へ1ノスとデータ・ハス、割込みと状況信号、おJ:
び拡張GIPマイクロ二フー1:を直列にロートするた
めの手段かある。 GIPインタフェース内の周辺構成要素としては、WC
5830、両方向FIFO(片方向FIFOから構成)
および状況ロジック820と割込みロジック840かあ
る。 常駐GIPマイクロコードにより、GIPは次のような
機能を実行することができる。 PIFO810からデータを読み書きすること。 状況ロジック820を通してFIFO状況信号をテスト
して、開コレクタ条件コート・インタフェース信号に基
づいて結果を駆動すること。 割込みロジック840によりてGIPに割込みを弓き起
す条件をセットアツプすること(例えば、FIFOが満
杯または空になったとき)。 DTPに割込みを引き起すこと。 DTP側からは、FIFOは32ビット幅でなく16ビ
ツト幅である場合を除き、他のFIFOのいずれかであ
るように見える。 辻絡か行なわJ]るときの形式と、晶速化すブシスデム
またはGIPがマスタ装置であるかどうかの詳細はずへ
て2プロセッサで駆動するマイクロコ1〜によって決定
される。3次元ワークステジョン環境では、第36図に
示すように、ポストをマスクに、ザブシステムをスレー
ブに、数値高速化サブシステムをその中間にする階層が
好ましい。 直列ループ・インタフェース 第1図(および他の図)に示す同時並行多重プロセッサ
・システムがもつ利点の1つは、3またはそれ以上のプ
ロセッサの書込み可能制御記憶機構(WCS)が直列ル
ープ・インタフェースを介して結ばれていることである
。本好適実施例によるこのループのトポロジ構造は第2
8図に示されている(第2A、3A、4C2および6図
に225で示されている線は、第28図では中断されて
、1つの出力線225Aと4つの帰還線225B、22
5C1225D、225Eが示されている)。 直列ループと結ぶインタフェースの実装構成は各種プロ
セッサを個別に取り上げて、またVMEインタフェース
と関連つりて1述した通りである。 しかし、これらの機能のいくつかを再びここて検問し直
して、直列ループの高度アーキテクチャな直列ループ・
インタフェースを通してホス)−は制御記憶機構のすべ
てをアクセスしてデータを取り出すことかできる。この
ループの正味ハン]・幅を最大にするために、各個のw
cs (wcs拡張部分490を含む)は直列/並列シ
ャ1−ウ・レジスタのバンクを通して直列ループとのイ
ンタフェースとなっている。 FP WCS 470とのインタフェースとなるシャド
ウ・レジスタは第29図と第4C図にレジスタ481A
と481Bで示されている。CP WCS 220との
インタフェースとなるシャドウ・レジスタは第2八図に
レジスタ222と223で示されている。D、TP W
CS 320とのインタフェースとなるシャドウ・レジ
スタは第3八図にレジスタ322 と323でボされて
いる。CPWC5拡張部分490 とのインタフェース
となるレジスタは第4八図に(汁拡張部分の一部として
全体か示されているか、個別には示されていない。 これらのレジスタの各々は命令をそれぞれの制御記憶機
構にローi−シたり、命令ス]・リームを小刻みにタロ
ツクをとったり、あるいは単純に命令ストリームを可能
な限り高速にクロックをとったりすることができる。従
って、この線のバント幅は効率よく使用され、最小限の
命令だけで特定プロセッサの制御記憶機構をアクセスす
ることができる。 ループ制御 本好適実施例では、直列ループの制御と経路指定のため
の機能かいくつか追加されているので、幅広い構成と拡
張オプションに適応させることがてきる。 本好適実施例では、各サブシステムはマイクロロー1〜
・サブシステムを最高6つまで(制御プロセッサ1つ、
データ転送プロセッサ1つ、浮動小数点プロセッサまた
はアルゴリズム高速化ブロセッ414つまで)をもっこ
とてきる。これらのプロセッサの各々は独自のWCSを
もっている。各WC8はマイクロロー1−のアップロー
トのと谷は書込みを行い、診断、中断点設定などのとき
は読ゐ取らなりればならない。 この機能を利用できるようにする主な機能には、次のも
のがある。 帰還マルチプレクサ・これは2つの内部ソース(制御プ
ロセッサとデータ転送プロセッサ)からと、2つの外部
「帰還バス」 (制御プロセッサの拡張部分と複数の浮
動小数点プロセッサのマイクロコードに対する)からの
直列ループを収集する。 制御プロセッサと浮動小数点プロセッサのマイクロコー
トが置かれている浮動小数点プロセッサ・モジュールか
らの直列ループを収集する帰還直列バス。帰還ループ・
アドレスはどちらの千ジコールに直列帰還バスを駆動さ
せるかを選択する。 各浮動小数点プロセッサ・モジュールはマイクロコード
・ロード・イネーブル・ビットをもっているので、モジ
ュールを任意に組み合せて同時にロートすることかてき
る。 データ転送ブロセノヅの直列ルーフ拡張部分はジャンパ
とワーfヤのリンクによって制御される。 この構成によると、直列ループを回ってデータを転送し
て、WCSにハックロードするプロトコルか非常に複♀
1Fに17る。この種のプロトコルはラフ1−ウェアで
実行されるのか通常である。本好適実施例ては、これら
のプロトコルのうち時間のかかる部分はハードウェアに
実装されているので、マイクロコードのダウンロードが
大幅に高速化する。別の利点として、ソフトウェアのオ
ーバヘットも軽減される。 本好適実施例では、ホストはマイクロコートを1語ずつ
データ・レジスタに書き込む(または読み取る)。(本
実施例では、データ・レジスタは2つの汎用シフト・レ
ジスタから作られている。 直列ループの残り部分はADM社製のAm29818な
どの直列シャドウ・レジスタを使用している。)あらか
しめ選択された直列モードによって、次の3つのいずれ
かが行なわれる。 「保持」モー1−が選択された場合は、データ転送はメ
モ゛りへの転送と同しように行なわねる。 「シフト」干−1〜か選択された場合は、読取りまたは
書込みザイクルか終ると直ちに、データか直列ループの
中に(または外から)シフトされる。これが行なわれて
いる間は、使用中信号によって、ポストによるデータ・
レジスタへの追加アクセスが先に延はされることになる
。 「パルス」モートが選択された場合は、書込みアクセス
が終った約500ns後に、直列データ・クロック・パ
ルスが発生して、シャドウ・レジスタが必要とするモー
トにセットされる。 ループ・トポロジ 第28図は直列ループの大規模接続関係を示したもので
ある。 信号出力線225八はVMEインタフェース160にあ
るマイクロコード・ロード・ロジック610によって駆
動される。(これは1本の物理線だけにする必要はなく
、例えば、4ビット幅バスのようなバスにすることも可
能である。)この線は3つの書込み可能制御記fn機構
220.320  および470の各々の周辺にあるシ
A・1−ウ・レジスタの各々に適用される。(cp w
cs拡張部分490は出力線225八に直結されないで
、−次WC522Gの下流側の線225Gに接続されて
いることに注意されたい。)4木の帰還線か設けられて
いるが、これらはマルチプレクサ2701によって選択
か可能である。これらの帰是線は主にデバッグのとき使
用される。 「スネーキングJ (snaking)か殆どないこと
に注意されたい。つまり、一方のWCS側の直列シャド
ウ・レジスタの直列出力が他方のWCSのインタフェー
スへの入力として使用されるケースは2つしかない。こ
れらのどちらのケースの場合も、直列ループの下流側に
あるWCSは事実上上流側WaSの拡張部分である。つ
まり、独立プロセッサを直列ループ内に直列接続するこ
とは回避されている。これの利点は、異種プロセッサ・
モジュールに対する独立マイクロコード・プログラムを
1つに結合する必要がないことである。この結果、プロ
グラマは上述したアルゴリズムの分割をフルに利用する
ことかできる。また、これはローディングを高速化する
」二で役立つ。ざらに、幅と奥行か異なるWCSを目(
票とした)゛ログラムをマージするときにも問題が起こ
らない。 ループ・トポロジの並行性の利点は、並行ロトが簡単に
行なえることである。例えは、共通のマイクロコート列
をFPモジュール130の各々にロドしようとする場合
は、FPモジュールのすへてにあるシャドウ・レジスタ
のすべてを同時にイネプルさせることができるので、各
々は線225へ上の直列データとバス211B上のマイ
クロアドレスに従ってロードされることになる。 第28図から明らかなように、ループ・トポロジは複数
の並列分岐を備えている。 ■分前・出力線255はCP−次WC5220側シヤド
ウ・レジスタ・インタフェースへの人力となるものであ
る。シャドウ・レジスタ・インタフェースからCP W
CS 220 (線225C)への帰還はマルチプレク
サ2710にフィードバックされる。 タフj−−−スの下(f;こ1lillに(」、cr’
 wcs拡張部分490のずへでにあるシャl−ウ・レ
ジスタ・インタフニスへの人力どなる帰M kg 22
5 Cも設りられている。 シャドウ・レジスタ・インタフェースからWC5拡張部
分490への帰還はすへて帰還線225Dに結ばれてい
るのて、マルチプレクサ271Oにフィードバックされ
る。(帰還は並列に接続されているので、直列出力コマ
ンドは個々のモジュール・アドレスで修飾すれば、帰還
線225D上の競合が防止される。) DTP分岐・出力線225はDTP WO2320にあ
るシャドウ・レジスタ・インタフェースに直列人力を送
るようにも接続されている。シャドウ・レジスタ・イン
タフェースからWO2320(線225B)への帰還は
マルヂブレク+2710にフィードバックされる。 DTP拡張部分ザブブランチ+ DTP WO2320
とのインタフェースの下流側には、帰還線225Bがオ
フボート出力として利用て剖るようになっている。 この接続は必要ならばユーザが開発してDTP拡張ロジ
ックを胃ることかて〜る。かかるLノシックの動作は以
−トに訂しく説明する。 ■91%  出力線225は数値ブロセッヅ・モジュー
ル130または130°の各々にあるWO2+170側
のシャドウ・レジスタ・インタフェースへの直列入力と
しても使用できる。シャドウ・レジスタ・インタフェー
スからの帰還(JずへてPi!225Eに結はれている
ので、マルチプレクサ2710にフィードバックされる
。(帰還は並列に接続されているのて、直列出力コマン
ドを個々のモジュール・アドレスて修飾すれば、帰還線
225Eでの競合が防止される。) 第27図はマイクロコート・ローディング制御ロジック
610の構成要素の詳細図である。重要な構成要素の1
つはフリップフロップ2720であり、これは帰還直列
データを再同期化するものである。 WO2が分散されているときは、シフト・レジスタ・ク
ロックとシャドウ・レジスタのDクロ2り間のクロック
・スキューを制御することは、直列ループ構成が多種類
であるので、非常に困テ1「である。このフリッフロッ
プか含まれていると、フリップフロップがクロック・ス
キューの制御を担当する(スキューが制御ロジックを駆
動する基本クロツタ期間を越えない限り)。ステー1へ
・マシン2740はホストからデコート化信号を受りる
とDクロック出力を発生する。 ホストとのループ・インタフェース 第6図と第27図に関連させて上述したように、マイク
ロコート・ローディング制御ロジック610は直列ルー
プ225上のデータを読み書きできる。 また、CPとDTPマイクロアドレス・バス211Bと
311Bに対しても読み書ぎができる。 DTPマイクロコーロー拡張ループ 本好適実施例によれば、オフポーFで拡張して別の直列
インタフェース・ループを構築することもできる。この
ループとの接続は第28図に2840でボされている。 任意的に、DTPモジュール120はcp wcs拡張
部分490と同じようなりTP WC5拡張部分を追加
の構成要素に組み入れることによって、オフボードで拡
張することか可能である。これらのWC5拡張部分から
は、DTPマイクロアドレス・ハス311 IIで選択
されたマイクロ命令出力か得られる。これらのDTP拡
張部分の制御は、DTP拡張部分か比較的高範囲にわた
る環境で使用されることがあるので、CP拡張ロジック
よりも若干ゆるくするのが好ましい。DTP拡張ロジッ
クは密結合高速入出力装置て利用されることを目的とし
ている。 この拡張オプションが使用される場合は、DTP拡張部
分(いずれかが使用される場合)はすべてDTP自身と
直列になっている。これは競合を防止するためである。 並列マイクロコード・ローディング 上述したように、本好適実施例では、マイクロコードは
2通りの方法で浮動小数点プロセッサにロードされる。 1つはポストの制御の下で直列ループによる方法であり
、もう1つは制御プロセッサの制御の下で並列に行なう
方法である。マイクロコードの並列ローディングは、浮
動小数点プロセッサで使用できる書込み可能制御記憶機
構(”wcs”)の数に制限かあるので(4ハまたは1
(iK命令)、好都合である。7γ動小数、ψプロセッ
サのルヂンか多すぎて、−度にWC3に収まらないとき
は、ある種のす一へレイ手法か必要になる。直列ループ
を使用してオーバ1ノイをロートすることはホストか命
令をロー1−できる速度か遅いので(ディスクへのアク
セスによって、l00m5から3m5)、実用的でない
。 本好適実施例によって提供される並列ロー1−機能は広
幅データ・キャッシュ・メモリを使用してマイクロコー
ト命令全体(現在は+04ビット)を保管しておき、そ
れを1サイクルで浮動小数点プロセッサ書込み保持レジ
スタに転送する。そのあと、これは通常の出力ボートを
通って、直列ロディングで使用される診断シスト・レジ
スタ(例AM029818)に転送される。これらの装
置には、マイクロコート・ヒラ1〜をパイプライン化す
る出カポ−]・(これは必要ならば、人力ボートとして
も使用できる)を備えている。しかし、本好適実施例で
は、この機能は遅ずきるので使用されない。 デツプの多くGJマイクロコロー−をなんらかのソノ法
で内部レジスタに格納している。)このことは、上述し
た並列ロー1〜のルートか直列並列レジスタかもつこの
機能を使用しても、速度や機能か犠牲にならないことを
意味する。並列ロー1・時間は命令当たり約500ns
てあり、これは直列ロー1へ時間よりも大幅に向上して
いる。 もう1つの重要な点は、浮動小数点プロセッサでマイク
ロコートをオーバレイすることがボス1−による監視を
必要としてないで、完全に制御プロセッサによって制御
されることである。逆に、マイクロコート・オーバレイ
がまだデータ・キャッシュ・メモリに存在しない場合は
、制御プロセッサはデータ転送プロセッサがボス]・・
メモリに移って、そこからそれを取り出すように指示す
ることができる。 本好適実施例では、各ザブシステムはマイクロコート・
プロセッサを最高6つまでもつことができる(制御プロ
セッサ1つ、データ転送プロセッサ1つ、浮動小数点プ
ロセッサまたはアルゴリズム高速化ブロセッ′v/1つ
まで)。これらのプロセッサの各々は独自のWC5をも
っている。各WC5はマイクロコートをアップロー1・
するときは、書込みを行ない、診断や中断点を設定する
ときは、そこから読取りを行なう必要がある。 (以下余白) モジュール1広弓長オプション すでに」このいくつかの個所でJj2明した、にうに、
第1図に図示のシステムをモジコール単位で拡張するた
めのオプションがいくつか用意されている。以下では、
これらのオプションのいくつかを要約することにする。 キャッシュ・バス+44に接糸売できるモジュールは次
の2種類がある。 算術演算処理型。これの代表例として、浮動小数点プロ
セッサ・モジュール130とアルゴリズムまたはアプリ
ケーション高速化機構130°がある。 高速データ(OSO)モジュール。これはデータ・キャ
ッシュ・メモリまたは高速人出力ヂャネルを拡張するた
めに使用されるのが代表例である。このメモリを拡張す
る方法は、 DTPマイクロコート拡張バス2824を
通して高速化サブシステムとのインタフェースとなる大
容量メモリ・ザブシステムを使用することとは全く異な
る。ll5D法はデータ・キャッシュ・メモリ140と
同しハント幅をサボ1−するが、大容量メモリ・サブシ
ステムはどの容:jiはマj7られノlい。 多重モジュール構成にすると、浮動小数点プロセッサ・
モジュール+30型のモジュールを4っまて、ll5D
モジユールを2つまで使用できる。これらの数字はアー
キテクチャに制約要因があるからではなく、機械的およ
び電気的理由から選択されたものである。 FP 130千ジユールは千ジュール選択ビットによっ
て選択される。これらは通常制御プロセッサ・モジュー
ル110の制御下に置かれるが、VMEインタフェース
はこれらのビットを無視することができる。これが使用
されるのは、マイクロコードをダウンロードするときゃ
デバッグを行なうときだけである。モジュール選択ビッ
トはリセット・(これはリセット信号で制御される)を
除き、モジュールの動作をすべての面で制御する。 +1SD干ジユールはデータ・キャッシュ・アドレス・
バスをデコートすることによって選択される。 モジュール接続 モジュールどの接続につい”C以下要約して説明する。 接続を論理図域別に分類して挙げて、2種類のモジュー
ルのどちらかこれらの接続を使用するかを示しである。 接続は6個の96ウエイDrNコネクタを使用して行な
われる。第40A図と第40B図は本好適実施例の物理
的接続構成を示したものである。 本好適実施例では、モジュール接続には次のようなもの
がある。 データ・キャッシュ転送用:256ビツト・ブタ、23
ビットDCMアドレス、8個の書込みイネーブル、保持
レジスタOEビット、遅延アクセス信号(例えば、低速
メモリを受は入れるためのクロック・サイクル延長のた
め)、および保持レジスタCにビット。 CPインタフェース用=3ビット・アドレス、16ビツ
ト・データ、16ビツトCPシーケンサ・アドレス、C
Pマイクロコート・クロック、CPパイプライン・クロ
ック、CP書込みゲート・クロック、1つの割込み線、
および1つの条件コート。 マイクロコートのローディング用 cp +vcs出カ
イネーブル別の線、CI’パイプライン出カイカイネー
ブルp wcs刊込みイネーブル、cpモート、cp直
列データ・アウト、CP直列データ・イン、FP wc
s出カイカイネーブル・1】バイブライン出力イネーブ
ル、FPパイプライン・クロック、FP WC5書込み
イネプル、FPモード、FPマイクロアドレス選択、 
FP上位/下位WCS選択、FP直列データ・アウト、
FP直列イン、6個の直列クロック/WCSロード・マ
スク信号、および3ビット直列ループ帰還選択。 汎用目的用・モジュール選択の3ビツト、リセッ1−、
シングル・ステップ、自走、Fp中断点、マイクロコー
ト・ループ、FPリセット、HERE用の制御信号。 DC線用・+5ν電源線21本、−5V電源線6木、接
地線161木。 どのタイプのモジュールもすべての信号をアクセスする
ことができる。 多重数値処理モジュール 第1O区に示すように、各種実施例のうちある非割に有
用な実施例では、複数の数値処理モジュル130が使用
されている。この実施例では、モジュール130はずへ
て制御プロセッサ・モジュール110による高度の監視
下に置かれている。CP干ジュール110は高度の監視
タスクを実行するだけでなく、数値プロセッサ・モジュ
ール130との間で行なわれるすべてのデータ転送を直
接に制御する。数値プロセッサ・モジュール130はす
へてキャッシュ・バス144と並列に結ばれている。数
値プロセッサ・モジュール130の各々は上述したよう
に、CP拡張ロジック410を備えている。データ転送
プロセッサ・モジュール120は上述したように、キャ
ッシュ140と外部との間のデータ転送を管理するもの
である。 データ・キャッシュ・メモリ140と数値プロセッサ・
モジュール130または130°間は高メモリ・バンド
幅で結ばれているので、多くの場合、複数のモジュール
を並列に稼動できるので、データ欠乏が起こることはな
い。 数値プロセッサ・モジュールをいくつ使用して稼動さセ
ることかてきるかは、アプリケーションやアルコリズム
かとのよう1J混成になっているかよる所か大きい。本
好適実施例では、4つまでに制限されている。この制限
を設けたのは、主に電気的および機械的理由によるもの
である。しかし、メモリ・パン1〜幅ずへてか使用され
ていれは、浮動小数点プロセッサ・モジュールの数を増
やしても利点は得られない。 数値プロセッサは独立に稼動するので、モジュール・イ
ンタフェースに、浮動小数点プロセッサ同士の同期また
はデータ交換のためのプロトコルを含める必要はない。 この結果、仲裁の必要がなくなるので、インタフェース
が非常に単純化される。 命令書込みバスは数値またはアプリケーション向きプロ
セッサ(またはその両方)で共用させるのが好ましい。 また、最上位アドレス・ビットは数値またはアプリケー
ション向きプロセッサ(またはその両方)のいずれかが
個別的にアドレス指定されるように、あるいはこれらの
ブロサッサのずへてか一緒にアドレス指定さ4するJ:
うに、あるいはこれらのプロセッサ群の一部(全部でな
く)が−緒にアドレス指定されるように、ロジックに従
って判断させるのが好ましい。 つまり、複数の浮動小数点プロセッサを制御するには、
アルゴリズムを存在する浮動小数点のいずれかで稼動す
ること、あるいはその一部が存在する浮動小数点プロセ
ッサの一部または全部で稼動することがあり得ることを
考慮に入れる必要かある。このためには、制御プロセッ
サと浮動小数点プロセッサとの長期的または短期的な関
係を明確化する必要がある。制御プロセッサはどの浮動
小数点プロセッサを制御すべきか、あるいはどの浮動小
数点プロセッサとの間でデータを転送すべきかをサイク
ル単位で選択することができる。長期的関係の場合は、
これはもっと大局的に定義することも可能である。 本好適実施例では、これはどの浮動小数点プロセッサを
使用すべきかを定義する制御メカニズムをサイクル単位
で選択するマイクロローI〜・ピッ1〜を使用すること
によって達成される。この制御メカニズムは他のマイク
ロコート・ビットを使用することも、レジスタの内容(
これはマイクロコートによって事前にロートされている
)を使用することも可能である。マイクロコート命令フ
ィールド内のピッ1〜を使用して短期(つまり、サイク
ル単位)の定義を行ない、レジスタで長期使用を定義す
ることかできる。 これらの2モートの使用例を示すと、次の通りである。 短期−4つの浮動小数点プロセッサでFFTを行なうと
きは、制御プロセッサは1つの浮動小数点プロセッサに
数サイクルを使用して、次のバタフライのデータをロー
ドし、以前のバタフライの結果を収集してから、別のバ
タフライを扱う次の浮動小数点プロセッサに移ることに
なる。 長期−ベクトル加算を行なうときは、使用すべき浮動小
数点プロセッサはベクトル加算ルーチン(制御プロセッ
サにある)が呼び出される前に選択される。このことは
、制御プロセッサはこの計算にどの浮動小数点プロセッ
サ(またはどのタイプの浮動小数点プロセッサ)を使用
ずへぎかを知らfz <でもよいことを意味する。 第23図はモジュール・アドレスがどのようにデコード
されるかを図式化して示したものである。 このデコードが実際にはどうような方法で行なわれるか
は、 FPモジュール130と関連つけて」二連した通
りである。 キャッシュ・メモリ拡張 上述したように、大容量の拡張メモリをキャッシュ・バ
ス144に直接接続することか可能である。このことは
、物理的構成と使用されるデータ転送プロトコルの別の
利点となっている。この種の構造例は第43図に示され
ている。 物理的および電気的 装ボード 第38八図と第38B図は本好適実施例の物理的レイア
ウトの主要特徴を示したものである。第38B図は子ボ
ートであり、第38八図の主ボードより小さくなってい
る。第38B図は浮動小数点ブロツセサ・千ジュール1
30のバーI・ウェア((−J属制御ブロセッザ拡張ロ
ジックを含む)である。第38A図はデータ転送プロセ
ッサ120、制御プロセッサ110の主要部分、データ
・キャッシュ・メモリ140、コマン1−・メモリ19
0、およびインタフェース150、i60.170.1
80からなる構成を示している。2つのポー1へか一緒
になって、第1図に示すような完全なシステムか得られ
る。 2つのホードは6個のコネクタ3810が同じパターン
になっている。これらのコネクタは雄型と雌型になって
いるので、追加のボードを積層することができる。例え
は、第9図と第1θ図に示している構成は複数の浮動小
数点モジュール+30またはアルゴリズム高速化モジュ
ール130°(またはその両方)を−緒に積層すること
によって得たものである(しかし、将来の改良に備えて
、これらの接続にバックブレーンを使用するとさらに利
点が得られる)。そうすれは、さらに都合のよい機械的
構成が得られる。 コネクタ3810はそれぞれ96ピン幅にするのが好ま
しい。そうすれは、キャッシュ・バス144の全幅がこ
れらのコネクタを通る場合でありてb、−1分なビン数
を予備として残しておくことかできる。 データ・キャッシュ・メモリ140を拡張するための拡
張メモリも、このパターンのコネクタを使用して積層す
ることが可能である。上述したように、キャッシュ・バ
ス144−トに追加の拡張メモリを接続すると、高バン
ト幅チャネルを利用する非常に短時間のアクセス遅延の
間に比較的大ぎなメモリ空間が得られる。本好適実施例
では、100ns以内に240MB/秒の速度で最高1
2MBまでアクセスができる。 第38A図は最大の個別構成要素の位置を示すと共に、
他の区域における一部の機能の全体的割振りを示してい
る。本実施例で使用されているボートは3段高さのEu
rocardである。VMEインタフェース・ロジック
160は全体がボードの縁に置かれ、バックブレーンの
スタブ長さを最小にしている。(VMEインタフェース
規格は短長のスタブを規定している。) メモリ・バンク510は全体が図面の−に方の左隅と右
隅にコネクタ381Oの近くに置かれている。コマン1
〜・メモリ190とVMEインタフェース・メ干り66
0もこの区域に置かれている。 ボート中央部の大部分はCP保持レジスタ560AとD
TP保持レジスタ560Bが占有している。 DTP とCP IPU 340と240、DTPとC
Pシーケンサ310と210、およびCPアドレス生成
機構230はすべて別々に示されている。 DTPモジュールの書込み制御記憶機構320は全体が
図面の左下付近のコネクタ381Oの下方に示されてお
り、CPモジュールの書込み可能制御記憶機構220は
全体が右下付近のコネクタ3810の下方に示されてい
る。GIPインタフェース170、およびDTPマイク
ロコート拡張インタフェース180は全体が左下隅に示
されている。(この区域には、部のDINコネクタ(図
示せず)が置かれており、このロジックを使用してサポ
ートできる物理的接続を提供している。)同様に、右下
隅には、データ・バイブ・インタフェース150だりで
なく、その関連コネクタが搭載されている。 第3811図に示ず子ホー1〜はもっと小形である。 (第38八図と第38n図は同し縮尺て作図されていな
い。) 保持レジスタ420は右」二と左上に示されているコネ
クタ3810間に置かれている。これらのレジスタの間
には、EC1周辺3820があり、ここにECL部品(
これらの部品は大量の発熱を放出する傾向がある)が置
かれている。(本好適実施例では、ECL部品としては
、転送りロック発生機構412とFPマイクロコード・
クロック発生機構480がある。)これらの部品は隔離
されているので、TTLの雑音が雑音の少ないECL部
品に入り込むのを防止している。) 以上の説明から理解されるように、レジスタ・ファイル
430を作るために使用されるチップは、ALII 4
50および乗算機構440と同様に大形である(本好適
実施例では、これらのチップの各々はピン格子パッケー
ジに納められている。)FPモジュールのW[:S 4
70は全体が図面の左中間部にiir?かh−Cいる。 そのすく下に、「Pモジュールの次アドレス・ロジック
477か置かれている。FPモジュールの制御ロジック
かスタックとしても使用できるスクラッチパット・メモ
リ160は物理的に次アト1ノス・ロジック477 に
近接している。 CP拡張ロジックは子ボート130または130′の各
々の制御のためにCPマイクロコードを拡張するとき使
用されるものであるか、その大部分が図示のようにボー
1〜の下縁に置かれている。特に、WC5拡張メモリ4
90は左下に示されている。 浮動小数点プロセッサ・モジュールを別々のサブボード
に分散して搭載させると特に好都合である。(また、複
数の浮動小数点プロセッサ・モジュールが使用される場
合は、各プロセッサ・モジュール130をそれぞれの独
自のサブボード上に置いて隔離するとよい。)数値プロ
セッサ・モジュール130は、高速ロジックがそこに含
まれているので雑音を発生しやすく、また、これらの線
と構成要素はEf:1.レベルを使用するので、雑音の
影響を非常に受けやすい。 さらに、保持レジスタ420、局所転送ハス422、レ
ジスタ・ファイル430、φ云iXクロック412かず
へてサブポート上に搭載されている。こうすると、最高
周波数轢かすべて共通サブポート」二で隔離されるので
、利点が得られる。高速ロジックの各部分をある程度隔
離て剖るので、これは特に複数の数値プロセッサ・モジ
ュールを使用する実施例では有利である。 PAL実装 本好適実施例では、以下に挙げるFAl、(プログラマ
ブル・ロジック・アレイ)が使用されている。 現在使用されているPALはすべてTTI、である。大
部分は16および32シリーズからのものであるが、他
にもいくつかが使用されている。 しかし、当業者なら容易に理解されるように、他のPA
L実装を幅広く使用することも可能である。機能をハー
ドウェア・ブロックに分割することは変更可能であり、
ハードウェアで実装したある機能群を変更することも可
能である。PALに現在実装されている機能の多くはM
S10シック部品を使用して実装することも、ΔSIC
またはセミカスタム集積回路にブロックとして実装する
ことも、IsIロジック・チップをプログラミングする
ことによって実装することも可能である。しかし、この
実装をここで詳細に示したのは、米国特許法の規定に従
うように、本好適実施例の内容をすへて開示するためで
ある。 CP  PAL 以下は、制御プロセッサ・モジュール+10に使用され
ている最も重要なPALのいくつかを簡単に説明したも
のである。 クロック波形生成PAL 250 このPALはCPとDTPによって使用されるタイミン
グ波形を生成する。上述したように、4つのクロックが
発生される。これらは各々4つの事前定義波形列の1つ
に従っている。4つの波形列は異なる期間、つまり、人
力クロック期間の4.5.6および7倍になっているこ
とが特徴である。これは、本好適実施例のように40M
tlzオシレータが使用されるときは、100.125
.150および175nsに変換される。マイクロロー
1− クロックとバイブライン・クロックは同し波形を
もつか、マイクロコート・クロックはマイクロコートを
ロートするとぎは、バイブライン・クロックを動作させ
たままにして禁止することが可能である。マイクロコー
ド・クロックは常に2サイクル(オシレータの)の間高
であり、そのあど2.3.4またはサイクルの間低にな
る(これらの選択はサイクル長入力によって行なわれる
)。サイクル長はCPから要求された最大長さ(2ビツ
ト)とDTPから要求された最大長さ(2ピッl−)か
ら選択される。サイクル長はバイブライン・レジスタか
ら駆動されるので(非レジスタ設計にした方がよいが)
、サイクル長は可能な限り最後の瞬時にサンプリングさ
れて、ループを回って伝播する最大時間が得られる。こ
のタイミングは出力クロックが生成されたサイクルの直
後のサイクルで活動化するので、最初に現れるときより
も重要である。 タイム2クロツクはマイクロコート・クロックが動作す
る周波数の2倍で動作し、その立上がり縁はマイクロロ
ーi〜・クロックの縁と同し時間に現れる。 書込みイネーブル・ゲート信号が低のときVMEインタ
フェース・メモリ660からの人力がサンプリングされ
る。この人力がメモリ使用中を示していた場合は、サイ
クル長はこの入力が変わるまで延長される。これにより
、メモリ・アクセス時間に余裕ができるので、アクセス
衝突、オフボード通信などによってアクセス時間を遅く
することができる。(この使用中信号は、FAl側から
見たときは、書込みゲートが低のとき余分のサイクルを
挿入したように見えるたりである。) クロックを自走させるか、1ステツプ進めるかの選択は
別の人力によって行なわれる。 CDバス・ソースPAL このPALはどのソースにCDバス112を駆動させ、
該当装置の出力イネーブル線を駆動させるかを選択する
CPマイクロコード・ビットをデコードするものである
。いずれかの16ビツト・ソースが選択されると(ア)
・1ノス生成機構230など)、このPΔ1.は符号/
セロ拡張PAL 21[iを活動化さlる信号も出力す
る。リセツ1−信−号が活動しているときは、どのソー
スも選択されない。 TDババス22のデータ・ソース・フィール1−のデコ
ートも同し種類のPALを使用して行なわれる。 TDババスソースを選択するPALも、それぞれの対応
するFIFO空状況信号でFIFO読取りをゲート操作
するロジックを備えているので、空のFIFOが読み取
られるのを防止する(FIFO内にエラーを起す原因に
なる) CDバス宛先PAL このFAl、はCDバス+12上のデータの宛先を選択
するCPマイクロコートをデコードして、該当装置の読
取りイネーブル線を駆動するものである。 TDババス22のデータ宛先ビットのデコートも同じ種
類のPALを用いて行なわれる。 ソースまたは宛先装置が駆動する必要のあるチップ・イ
ネーブル線をもっていると(例えは、VMEインタフェ
ース160やコマンド・メモリ190におけるメモリ)
、それぞれのチップ・イネーブル線が駆動される。 符号/ゼロ拡張PAL 21に のPALはイネーブル信号およびソース・データの高ビ
ットに応じて、符号またはセロ拡張機能を実行する。使
用するのが好ましいPALは8ビツト幅だけであるので
、ずへての符号/ゼロ拡張操作にはこれらが対で使用さ
れる。このPALは2個所で使用されている。一方の対
(第2八図にブロック216で図示)はCDバス112
に、もう一方の対(第3A図にブロック316で図示)
はTOババス22につながっている。 バス・ソース・ロジックは、16ビツト・ソースがアク
セスされるとき、イネーブル・ビットを符号/ゼロ拡張
ロジック21Bに送るものである。 第14A図と第14B図はこのPALの構成と動作を示
している。さらに詳しくは、第14八図は若干具なる実
施例を示している。つまり、各符号/ゼロ拡張操作で3
個の8ビツト・マルチプレクサが使用されている。これ
により、本好適実施例では不可能である単一バイトの使
用が可能になった。第14B図は第14Δ図のバーi・
ウェアで使用されるコマンド構造を示している。 マルチウェイ分岐アドレス指定PAL 217このPA
Lはシーケンサ310のマルチウェイ1機能を実装する
ために使用される。このPALは3ビット条件コードを
受り取り、それをマイクロコート定数フィールドの最下
位3ビツトに挿入する。修飾された定数フィールドはシ
ーケンサ315上にフィードバックされる。シフト・フ
ィールド人力は結果を左に0.1または2桁シフトする
かどうか(つまり、1.2または4をかけるかどうか)
、あるいは入力定数フィールドを未変更のまま送るかど
うかを制御する。別の人力はこのPALの3状態出力ド
ライバをイネーブルする。 第n図に示すように、このPALは3状態バツフア31
8と並列に接続するのが好ましい。定数フィールドの最
下位8ビツトだけがPAL 317に送られる。最上位
8ビツトはバッファ318に送られる。 (好ましくは、修飾された定数フィールドは相対シーケ
ンサ命令で使用されるが、その使用に注意ずれは、絶対
または間接命令で使用することも可能である。)マルチ
ウェイ分岐操作は、第30図を参照して以下に詳しく説
明する。 データ人力条件ローIへ選択PAI。 このPAL(DTPモジュール120に置かれており、
第3図にマルヂブレクザ312で示されている)はDT
I’マイクロコート・シーケンサ310でテストできる
1組のFIFO状況コードを選択する。選択された組の
条件コートはデコードされ、シーケンサ310に送られ
て、これらの条件に基づくマルチウェイ分岐が行なわれ
る。これらの条件信号のソースは、4つのハス人力イン
タフェース、つまり、GIPインタフェース170、デ
ータ・パイプ・インタフェース+50の2つの人力ボー
ト、およびVMEインタフェース160の1つの中にあ
るものが選択される。 DTP  とI/F  P八り 以下は、データ転送プロセッサ・モジュール120 と
インタフェース機構160.170.180で使用され
ている最も重要な機能のいくつかを簡単に説明したもの
である。 VME 7 F L/ス・デ:’ −F PAL1つの
PALはVMEア]・レスの最下位ビットと5アドレス
修飾ビツトをデロー1〜する。その出力はVMEアドレ
スとアドレス修飾子か以前に選択されたビットと一致す
ると活動化する。(アドレスと71−レス修飾子の組合
わせは最高16までプログラミングでき、そのうちの1
つは4ビット切替え信号によって選択される。) VM
E割込みPALからの人力もあり、これは割込み承認サ
イクルがいつ進行中であるかを示している。これは出力
を駆動するようにデコートされたアドレスとORがとら
れる。 VMEアドレス・バスの最上位アドレス・ビット(18
−31)も同じようなPALを使用してデコードされる
。このPALでは、アドレスの」ニイ立8ヒ゛ットを使
用するか無視するかが別の人力で選択される。 DMA FIFO状況とクロック制御PALこのP八り
はDMA FIFO670からのクロックと状況信号の
経路を制御する。また、このPへ1、はこれらのFTF
Oのり℃7ンクをDM八へンI−ローラ640の制御下
に置くか、VMEインタフェースからデコートするかを
制御する。 VME H先取りと書込みデコードPへL611読取り
デコートPΔ1.はVMEバスからの8つの読取りソー
スをデコードする。内部VMEアドレスはデータ・ス1
〜ローブ、書込みイネーブル、およびポー1〜選択信号
によってデコートされ、修飾される。 書込みデコードPALはVMEバスからの9つの書込み
ソースをデコートする。内部VMEアドレスはブタ・ス
トローブ、書込みイネーブル、ボード選択、およびVM
E書込みイネーブル信号によってデコートさね、修飾さ
れる。νME書込みイネーブル信号は各種書込みイネー
ブルまたはクロックのセットアツプと保持条件をVME
バスのタイミングから独立して制御するために使用でき
る。 VMEスレーブ・アクセス・タイミングPALこのPへ
!、はバス・コントローラ650におし)てブタ転送確
認通知のタイミングを発生する。このタイミングは、デ
コーダ611が受り取るのとほぼ同しアドレスと修飾子
もこのP A 1.への人力となるので、読み書きされ
るレジスタまたはメモリに合わせて調整することか可能
である。2重ボートVMEメモリ650が使用中であれ
ば、このタイミングは別の入力によって遅延される。(
これが行なわれると、使用中信号が終了したあとで追加
サイクルが挿入される。) 直列ループがデータのシフトに使用中であれば、タイミ
ングは別の人力によって遅延される。 データが直列ループ・レジスタ680に書き込まれると
き、VME書込み信号が高になったあとで3サイクルの
遅延が挿入されるので、直列ループ・ステート・マシン
(別のPALにある)は余裕をもってデータをラッチ・
インすることができる。 このPALはVMEインタフェース・メモリ660がア
クセスされるときは、イネーブル信号も発生ずる。 信号ループ制御PAL このP八りはマルヂブレクサ2710とステート・マシ
ン2740を実装している。ステート・マシン機能は直
列ループ内の刊込み可能制御記憶機構の各々とのインタ
フェースで818個の直列/並列レジスタを制御するよ
うに接続されている。(これらには、CI’ WGS 
220とDTP WGS 320 (D LF カニ、
プロセッサ・モジュール130の各々にあるFP WG
S 470とFP WC5拡張部分490か含まれる。 )ステー1−・マシンはシフト・レジスタと直列データ
・クロックを制御する。シフト・レジスタとの間でデー
タ転送が行なわれているときは、シフト・レジスタと直
列データ・クロックはアクセスのタイプ(つまり、読取
りか書込み)に応じて、またモード信号に従って制御さ
れる。直列ループ・モード信号は次の3モードの1つを
指定している。 DATA ll0LD (oo) :  通常のレジス
タと同じように読み書きを行なう。 DATASt(IFT(10) :通常のレジスタと同
じように読み書きを行なうが、直列データ・クロックを
切り替えている間に直列ループを回って16ビツトだり
データをシフ1〜する。 DATAPUl、5E(11)・通常のレジスタと同し
ように読み書きを行ない、直列データ・クロック・パル
スを1回発生ずる。 DATA 5IIIFTモートでは、ステート・マシン
はあるサイクルでシフトし、次のサイクルで保持するよ
うにシフ1〜・レジスタを制御する。この2サイクル・
パターンは16回繰り返され、その結果、シフト・レジ
スタの内容か直列ループ内に挿入される。保留サイクル
では、直列データ・クロックが主張される。データがシ
フトされている間、使用中信号は活動しており、そのシ
フトが終るまでシフト・レジスタへの以降のVMEアク
セスを保留にする。 DATA PULSEモートでは、書込み操作の300
−400ns後に、直列クロックは一度だけ高パルスに
なる。このパルスは”818”シャドウ・レジスタ内部
の内部フリップフロップをアップロードする。 (これらのシャトつ・レジスタの各々は内部フリップフ
ロップを備えており、これはデータをそれそれに対応す
るWGSにハックロー1へするときその動作モー1’を
制御する。このDクロックかパルスを発生ずるとぎは、
直列ループを回ってデータはシフ1〜されない。(この
遅延により、データは安定化する。つまり、ループを回
って伝わっていく。)この操作時は、使用中信号は活動
化されて直列ループへのVMEアクセスを禁止する。 このPALは4個の直列ループ帰還路225B、225
C12250,225E、および再同期化フリップフロ
ップ2720を収集するマルチプレクサ2710も備え
ている。 DCM とDCM I/F I’AL 以下は、キャッシュ・メモリ140 と、FPモジュル
130」二に置かれているが、キヤ・ンシュ・メ干す1
40とのデータ・インタフェースを取り扱うCP拡張ロ
ジックで使用される最も重要なPALのいくつかを簡単
に説明したものである。 DCMアドレス・デコートPへり このPALはマルチプレクサと一緒に第5図にプロ・ツ
タ560でパされてし)る。このPAL、はデータ・キ
ャッシュ・メモリ・71−レスをデコートする。 2つのアドレス人力が用意されている。人力5]6はC
ババス111のピッ1〜19−25に対応しており、人
力517はT^ババス21のビット19−25に対応し
ている。仲裁ロジック535によって生成される制御線
521はどちらのアドレスをデコートするかを選択する
。 DCM保持レジスタ制御PAL このPAL(CPとDTPマイクロコート・ストリーム
によって制御される)はデータ保持レジスタ560A、
560B、および420の3つのバンクを制御するため
に使用される各種制御信号を発生する。マイクロコード
・ビットはクロックと出力イネーブル信号を駆動するよ
うにデコードされる。バンク56〇八を制御する信号は
CPアクセス信号536によって制御される。バンク5
60Bを制御する信号は、DTPボートの方が優先度が
低いので、CPアクセス信号536とDTPアクセス信
号537の両方によって制御される。 レジスタ・バンク420(浮動小数点モジュール上のF
P保持1ノシスタ)を制御する信号は該当の干シコール
選択信号とANDかどられる。クロック信号はずへて正
のクロック縁のタイミングを制御するために、書込みイ
ネーブル・ゲート・クロック信号によって修飾される。 別の組の信号はアクセス・サイクルでメモリ出力をディ
スエーブルすることがてきる。これにより、保持レジス
タはデータ・キャッシュ・メモリに書き込まなくても読
み戻すことができる。(これらの信号は書込みマスク情
報をアクセスするために別のPALでも同しように使用
される。)(以 下 余 白) DCM書込みフラグ・レジスタT’AL書込みマスク・
ロジック530(8ヒツトji)込みマスク信号512
をメモリ・バンク510に送る)は複数のPALを使用
して実装されている。DTIIインタフェース・レジス
タ560Bに対応するPAl、を最初に説明する。CP
モジュール110によってアクセスされる他のレジスタ
・セット560Aの状況の追跡は、同しようなPALを
使用して行なわれる。 このPALの目的は、保持レジスタ560B内の8F語
のどれにDTPによフて書き込まれたかを覚えているこ
とである。データ・キャッシュ・メモリ書込みが必要で
あるときは、このPAI、の出力はDTP保持レジスタ
からの並列書込みにマスクをかりる。更新されているF
語だりが実際にはデータ・キャッシュ・メモリ・バンク
510に書キ込まれる。保持レジスタに対する書込みが
行なわれると、対応するフラグ・ビットがPAL内にセ
ットされる。セットされるフラグ・ビットはこれらの条
件の下でDTPアドレスからデコードされる。フラグ・
ビットはデータ・キャッシュ書込みか行なわれるどクリ
アされる。しかし、操作はパイプライン化されているの
で、DTI”は同しサイクルで保持レジスタ560Bに
省き込むことかできる。その場合には、フラグ・ビット
はセソ1−されたままになる。 さらに、8フラグ・ビットずへてを同時にセットするこ
とも可能である(マイクロコート・コマン1−を受りて
)。これにより、ブロックで書込みを行なうことができ
る。リセット信号はフラグをクリアする。ロジックは完
全に同期しており、クロック発生機構250によって発
生したマイクロコト・クロックによってクロックがとら
れる。 別の人力信号は読み戻しモートをイネーブルする。この
モードでは、フラグ・レジスタの状態を下位2ビツトを
使用して直列に出力することができる。マイクロコート
はこの下位2ビツトにあるフラグ・ビットを読み取るこ
とができ、他のフラグ・ビットと入れ替えることにより
、マイクロロー)・はすへてのフラグ・ビットを読み取
ることができる。DTPアドレスは、3フラグ・ビット
のどれを偶数フラグ・ビットと入れ替え、どれをも)数
フラグ・ビットと入れ替えるかを選択する。 FP書込みマスクPへI。 このPALはFP保持レジスタとデータ・キャッシュ・
メモリ間の転送に対して書込みマスクを生成する。マス
ク生成を制御するパラメータには、書き込むべeF語の
個数と先頭のF語がある。 FP  P八り 以下は、本好適実施例においてFPモジュール130に
使用されているプログラマブル・アレイ・ロジック機構
(PAL)を簡単に説明したものである。 WCSロード・イネーブルPへし このP八りはマイクロコートをFPモジュール自身のW
CS 470に、およびcpモジュールの拡張WC54
90(つまり、FPモジュールに置かれているWC8部
分)またはそのどちらかに、モジュール選択信号でロー
ドするとき使用される一部を修飾する。 ホスト−ソース・モジュール選択PALこのPALはポ
ストからのモジュール・アトレス人力を局所スイノヂ設
定値と比較して、そのモジュールか選択されているかど
うかを確かめるものである。1組の人力てWCSロート
かイネーブルされて行なわれる。 モジュール当たり1ビツト・アドレスが用意されている
ので、WCS 書込みをモジュール130のすへてに対
して独立して制御することができる。 (これと対照的に、上述したように、データ・アクセス
は最大モジュール数より少ないビットをもつモジュール
・ア1−レスを使用するので、モジュルのあらゆる組合
わぜを選択することができない。) 第28図に示すように、直列コマンド・ループの好まし
いトポロジは、2つのループ部分2840が各数値処理
モジュール130に入るようになっている。一方の部分
225Aは人力をそのモジュール自身のWCS 470
に送り、もう一方の部分225Gは入力をそのモジュー
ル上のWC5拡張部分490に送るようになっている。 従って、2つの別個の出力コマンドが与えられるので(
しかもモジュール・アドレスニJ: ッテn1liil
iすh ”C) 、 WCS no トWCS 拡張r
fl(分490はそれぞれの出力を共通帰+fflハス
2251・と225D (それぞれ)に送り出し、モジ
コーールのどれかが選択されたときに、そのモジュール
によって駆動させることができる。 CPモジュール選択1’AL このPALはCPによって選択されたモジコーール・ア
ドレスを、局所保管値と突き合せて比較するものである
。一致するものが見付かると、4つの出力が主調される
。これらの出力のうちの2つは制御信号がクロックをと
るようにイネーブルするか、保持レジスタ420を出力
イネーブルする。もう1つの出力信号はLEDを駆動し
て、とのFPモジュールが選択されたかをビジュアルで
表示する。 最後の出力は主ボードに返される条件コート・ビット(
選択済み)をイネーブルする。この最後の出力はCP拡
張マイクロコードで制御されるロジックに対する修飾信
号であり、マイクロコード・フィールド(またはレジス
タ格納値)で定義された処置が行なわれるようにイネー
ブルするものである。 F P−W CS制御pAI。 2つのPALかWCS 470を制御するために使用さ
れる。これらの2つのFAl、は別々の区域に置かれて
いるが、両方ともWCSに影響を与えるので、相互にイ
ンタロックするようになっている。一般的には、最初の
PALは命令レジスタ(これは上述したようにマイクロ
コード短縮のために使用される)を制御するために使用
される。もう1つは並列マイクロコード・ローディング
を制御するために使用される。 最初のPALはWCS 470にある2つのRAMチッ
プの出力イネーブルを制御する。本好適実施例では、W
CS 470は2つのRAMチップを使用して構成され
、インタフェース・レジスタ・セット420 とマツチ
して並列ローディングが行なわれるようにしている。(
本好適実施例では)キャッシュ・バス144は64ビツ
ト・データ通路までに多重化されてFP千ジュール13
0に送り込まれるので、WC5470を2つの部分に分
割すると、マイクロ命令(本実施例て6J、104ビツ
ト長)の並列ローディングにマツチすることになる。 ポストかマイクロ命令i〜をロートするとぎは、命令レ
ジスタはディスエーブルされる。その場合には、命令レ
ジスタの出力は必ずディスエーブルされるので、 RA
M出力はホストによって生成された信号によって制御さ
れる。 2番目のPALは2つの個別機能を実行する。これらは
ハードウェアによる短縮を実現するときだけ結合される
。 最初の機能はホストによるWCSの読取り時にパイプラ
イン・レジスタ476のどちらのバンクをイネーブルさ
せるかを制御するものである。 2番目の機能は転送の長さ、つまり、保持レジスタとレ
ジスタ・ファイル間で転送すべき語の数を調整するもの
である。 パイプライン・レジスタの出力イネーブル信号は2つあ
り、これらは同時に活動することはない。(これらの信
号はレジスタ476の2つのバンクをイネーブルするた
めに使用される。他の個所て説明したように、この構成
はI’lGS 10の2バンクに苅IL(L、でいる。 )パイプライン・レジスタのどちらかを出力イネーブル
させるためには、使用申分4じか非活動に、干ジュール
選択どFPバイブライン・レジスタ出力制御(ポストか
らの)が活動していなければならない。 転送長さフィール1〜は、1か転送ずへき1語を、2が
2語を(以下間し)を表すようにコーディングされる。 8語を転送することを指定するときは、0か使用される
。転送りロック発生機構(キャッシュ・バス・インタフ
ェース460の一部)は、転送サイクルの回数を知って
いる必要があり、これはマイカ・サイクルに1を加えた
数である(バイブラインをセットアツプする場合)。 マイカ・サイクルの数は転送長さとその開始位置と共に
変化する。 ハントシェイク・ロジックPAL 2つのPAl、がハンドシェイク・ロジックを制御する
ために使用される。最初のPALは2つの独立機能を実
行する。最初の機能はCPとFP千ジュール130間の
ハントシェイギングを制御する。(この機能では、第2
2図に状態図を示す、J:うなステー 1・・マシンに
この機能をもたせている。)もう1つの機能(最初の機
能と独立して)はレジスタ・ファイル420が2重バッ
ファ・モートで使用されるときバンク選択を制御する。 (このモートの動作原理は第20図に示されており、上
述した通りである。) ハントシェイキング・ステー1・・マシンはCPがFP
待ちにあることを、CPWAIT出力旧、を駆動するこ
とによって通知する。FPが待ちにある場合は、ハンド
シェイキング・ステート・マシンはFPWAITlll
、を駆動することによってこれを知らせる。 CPWAITとFPWAITが共に)IIであり、cp
がその完了信号を主張した最初のプロセッサである場合
は、次のような手順で行なわれる。 1、CPDONEがIIであることが見付かったときは
、FPWAITはLOに駆動される。 2゜CPDONEがIHになるまでCPWAITはII
Iのままで、制御はその状態のままである。 3.1:OD[]11[かIIIになると、CPWAI
Tは10に!駆動される。 4、CPWAITとFPWAIT信号は、対応ずルDO
NE信号か否定されるまで共にLOのままである。 上記手順は、FPかFPDONEを最初に主張した場合
にも行なわれるか、その役割は反対になる。 CPDONEとFPDONEか共に同時に到来した場合
(つまり、共に同じクロック縁で最初にIllでサンプ
リングされる場合)は、CPWAITとFPWAITが
共ニLOkmなる。 このPALのバンク・スワップ側は上述したCP/FP
ハンドシェイキングが切り離されている。このステート
・マシンを制御する2人力信号は5CPBANKSEL
とFPSWAPである。Sll:PB八へKSELはF
Pがスワップ点まできたときCPにバンクをどのように
割振らせるかを指定している。FPかスワップ点までく
ると、そのスワップ点を通り過ぎるまでFPSWAPを
活動状態に駆動する。スワップ点はCP/FPハンドシ
ェイキング・ロジックによって同期化される。FPSW
AP点ては、5CPBANKSEL(7)状態はBAN
KSEL出力の新しい状態であり、スワップjliの夕
1ては、BANKSEL状態は未変更のままである。 最初のPALはFl’と同期し°C動作するので、もう
方のPALはCPモジュール110か終了したこと、ま
たはバンクの交換を望んでいることを示すCP同期信号
を捕捉するために使用される。 この第2のP八りは3つのハントシェイク・モート・ビ
ットによって制御される(モジュール選択信号による)
。3ハンドシエイク・モート・ビットは次のように割り
振られている。ビットOと1は00がノー・オペレーシ
ョン、OlがCPDONEをセット、10が[:PDO
NEをクリア、11がテスト・モードの処置がとられる
ようにコート化されている。これとは独立して、ビット
2はレジスタ・バンクを交換することを要求する。 CPDONE状態は命令がセットまたはクリア操作であ
る場合を除き、マイクロコード・サイクルにまたがって
未変更のままである。 このPALはモード・フィールドのビット2の正の縁を
、新しい人力を以前にレジスタ格納されたものど比較す
ることによって検出する。縁が検出されると、これによ
りバンク選択出力の状態が切り替えらねる。 割込み捕捉PAL CPW、lT、FPWAJT 、およびいくつかの割込
み信号でクロック縁を捕捉するために別のPALが使用
される。エラー割込みは中断点割込みと同し割込み出力
を共用するか、独自のマスク・ビットをもっている。出
力は対応するマスク・ビットが1,0に駆動されるとリ
セットされるが、このマスク・ビットは以後の割込み縁
を検出するためにHTに戻しておかなければならない。 マイクロアドレスとクロック制御PALこのPALはF
Pマイクロアドレス・ソースの制御とFI’クロックの
制御の2つの独立機能を実行する。 マイクロアドレス・ソースは2ビツトの人力によって選
択され、次のようになっている。(oo)pp次アドレ
ス・ロジック477、(01) CPマイクロアドレス
 211八:(10)開始アドレス・レジスタ479(
連Nt):(11)スタック478の出力。別の人力で
2ピン1〜選択コマン1−を無視することも可能である
。その場合には、 CPマイクロアドレスはモジュール
かイネーブルされるとイネーブルされる。この人力を使
用するど、ポストはセットアツプやデバッグ時にWC5
470をアクセスすることができる。 FPツタック生成機構480(これは本好適実施例では
ECLが使用されている)を制御する出力は次ように選
択ができる。([11])FPマイクロコート・クロッ
クを自、走させる。 (01)FPマイクロコート・ク
ロックを停止させる。別の論理条件はFPツタックを別
の入力によって制御させ、クロックがその主張があった
とき自走するようにする。 直列/並列ロード選択 このPALはマイクロコードをホス1〜またはCPから
FPモジュールのWC5470にロートすることを制御
する。ホストによってロードされるマイクロコドは直列
ループを使用する必要があるが、CPはマイクロコート
を並列にロートすることができる。注目すべき点をいく
つか挙げると、次の通りである。 1、Wcs 470に使用されているバイブライン・レ
ジスタミニl:個別の出力イネーブルをもっていないの
で、これらはデータ・バスでの競合を防止するために別
々に使用される。 22つの直列データ・クロック信号の依存性はホストま
たはCPが選択されたかに応して切り替えられる。 3、ポストか直列ループを制御する場合は、モード信号
は両方のデータ・クロックを一緒に駆動させるか(通常
データ・シフト)、一方だけを駆動させるか(別の信号
で選択されたもの)を選択する。直列データ・クロック
はWC5470からデータを読み戻すときもこれと同じ
ように制御される。 CP書込みデコードPAL このPALはWC5拡張部分490にあるマイクロコー
ド・フィールドをデコードして、レジスタ420のどち
らをアクセスするかを選択するものである。選択された
レジスタには、RCREGDIRがLOのときたり書き
出される。XFnEG、T’PREG、 IIAREG
またはMTIEGの中から1つ選んでそこに;lj各込
むことのほかに、実行される機能には他に2つある。 1 、にDババストランシーバ444に対する方向と出
力イネーブル制御が生成される。 2、中断点をクリアするマイクロコート・ビットは書込
みゲート・クロックで書込みイネーブル・ゲートがとら
れる。ここで短パルスが使用されているのは、再始動直
後に現れる中断点を見失うのを防止するためである。(
これは、新しい中断点が現れたときCPがまだ前の中断
点をクリアする信号を低に維持していると問題を起すこ
とおそれがある。)従って、この信号はそれを短時間に
保つクロックでORをとるようにしている(活動−低A
ND)。 クロック/ストローブはずへてCPMCGにおよびCP
MCCKWGによって修飾されて、マイクロコード・サ
イクル内でタイミングを設定するが、モジュールが選択
されていなければディスエーブルされる。 この1〕八1.はCPマイクロコー1−・フィール1へ
をデコーF L、て、レジスタ480のどちらをアクセ
スするかを選択するものである。選択されたレジスタは
IICREGDIRがII+のときたり読み取られる。 保持レジスタ制御PAL 451 2つのPALが保持レジスタ420からの出力を制御す
るために使用される。 最初のPALは多対のレジスタ420に対するクロック
をイネーブルするために使用される転送シーケンス波形
を発生するものである。各転送サイクルは転送長さで指
定された通りに、1〜4マイナ・サイクルの間持続する
。(「マイカ・サイクル」期間は上述したように、転送
りロック412によって発生ずる。)各マイカ・サイク
ルで対のF語が転送されるが、そのうちの1語は別のP
ALによって禁止されることがある。転送シーケンス波
形は4つの線上に「遊歩1,0」として現れる。 循環列内で最初に主張される線はXFIIR5T<1 
: 2>によって制御され、XFINITが1−11の
ときだけ現れる。XFrNITは最初のサイクル時だけ
活動し、後続のサイクルでは現在のシーケンス波形か次
の島−を制御するために使用される。LICXFDIl
lは転送方向が保持レジスタ420からレジスタ・ファ
イル430へのとき、LOOPB八CKモへトが働し1
てい11ければ、11RCKENP*<0:3>をディ
スエーブルする。IIRにに八1,14は通常の開始お
よび長さ制御を無視して、すへてのクロック・イネーブ
ルを同時に活動化させるので、1回のサイクルでデータ
を4コピーしてずへてのレジスタ対に入れることができ
る。 XFTYPE人力は波形列が通常の転送サイクルに対す
るものか、並列マイクロコード・ロート・サイクルに対
するものかを選択する。後者の場合には、常に2つのマ
イカ転送サイクルがあり、そのタイミングが若干異なる
ことがある。この人力は保持レジスタに対するすべての
クロックを禁止することができる。 第2のPALは各レジスタ対を出力イネーブルするため
に使用される転送シーケンス波形を生成するものである
。これらの2つのPALは相反する転送方向で使用され
る。 「クロック・マスク」PΔ1.は、保持レジスタ420
を構成する8個の32ピツi〜・l/レジスタFレジス
タ)に書き込みを行なうことを制御するために使用され
る8個のクロック・イネーブルを生成するものである。 1回の主転送サイクルて、8個までのF語をレジスタ・
バンク420の8個の別々のレジスタに送り込むことが
できる。人力は更新する必要のある最初のレジスタ(0
,、,7) と更新すべきFレジスタ(1,、,8)の
個数を示している。 PALはそれに応じて、更新すべきすべてのレジスタに
対してビットがセットされたマスクを生成する(主転送
サイクル内で)。転送方向が保持レジスタ420からレ
ジスタ・ファイル430へのとぎは、ずへてのマスク・
ビットはHIにセットされるので、保持レジスタへの書
込みは一切防止される。同様に、マイクロコート・ロー
ト・サイクルが現れている場合は、クロックはディスエ
ーブルされる。すべての保持レジスタがクリアされる場
合(もう1つの信号によって指示された通りに)は、イ
ネーブルは低にセットされるので、すへての保持レジス
タか更新される。 保持レジスタ開始アI〜レスl’へ1 このPへ1.は4:1マルヂフ゛レクサとそのあとに1
7aくレジスタからなっている。マルチプレクサへの人
力となるものには、レジスタからの保持レジスタ(HR
)開始アドレス、マイクロコート命令からのHR開始ア
ドレス、CPアドレス・バスからのFR開始アドレス、
前のHR開始アドレスの4つかある。 モジュールが選択されない場合は、前のIIn開始アド
レスが残される。 レジスタ・ファイルWE制御 このPALはレジスタ・ファイル430に対する書込み
イネーブルを制御する。マイカ・サイクルで1個または
2個のF語がレジスタ・ファイルに書込むことができる
。開始位置と長さの6ビツトはクロック・イネーブル・
マスクが生成されるとき同じ方法で書込みイネーブル・
マスクを生成するために使用される。マスクからの該当
2ビツトはどちらのマイカ・サイクルが進行中であるか
に応じて、下半分書込み信号または上半分書込み信号か
ら順序イ」りられる。ループバック・モートか活動して
いるとぎは、書込みイネーブル・マスクはディスエーブ
ルされる。別の信号はずへてのマイナ・サイクルで両方
の話を強制的に書ぎ込むために使用できる。 下半分書込み信号と上手分書込み信号は転送方向か正し
くないか、転送タイプがマイクロコード・ロー1〜機能
であると、ディスエーブルされる。 人力信号はレジスタ・ファイルの読取りまたは書込みモ
ートを選択するためにもコート化される。 使用中信号線は保持レジスタ・データ・バス422が使
用中であることを指示するものである。 レジスタ・ファイル・アドレス修飾PALこのPALは
モジュールが選択されたときレジスタ・ファイル・アド
レスをレジスタに格納する。 そうでない場合は、前のア1−レスが保持される。 アドレスの最上位ビットはソフト2重バッファリングが
行なわれるように修飾される。2ビット信号はどのタイ
プの修飾を最上位ビットに対して行なうかを選択する。 オプションには次のものがあ1人カヒットの使用。これ
は物理アI・1/ス指定モートである。 2.8ANKSELの使用。これは2重バッファ・モー
トである。 3.8ANにSELの反転値の使用。これはブレビュ・
モートであり、CPまたはFPはバンクを交換し合わな
くても2重バッファの反対側にあるデータかアクセスで
きる。 レジス・ファイル・アクセス増分機構 このPAL  (イネーブルされているとぎ)はレジス
タ・ファイルのポインタを増分する。従って、アドレス
は各マイナ・サイクル(転送りロックの)ごとに増分し
て、レジスタ・ファイル430から次の対の番号を取り
出したり、次の対を書き込んだりすることができる。制
御入力は、保持レジスタ420からレジスタ・ファイル
430への転送の最初のマイナ・サイクル期間アドレス
定数を保持することを可能にする。これが必要なのは、
データ通路がバイブライン化されているからである。 データ有効性制御1’AL このPΔ1幻レジスタ・ファイル430の偶数側と奇数
側に刻するデータ有効性信号を制御する。マイナ・サイ
クルで、1個または2個のF語をレジスタ・ファイルに
書き込むことができる。開始アドレスと長さに応じて、
データの1話または2語かこのマイナ・サイクルで有効
になる。2つの出力(EVENVAIID* とoDo
vAl、IDiはどちらの語が有効であるかを示してい
る。この機能はレジスタ・ファイルからの転送ではディ
スエーブルされる。 マイクロ命令アドレス選択PAL ごのPALは次のマイクロ命令アドレスが真アドレス・
フィールドからのものか(つまり、レジスタ474の出
力)、偽アドレス・フィールドからのものか(つまり、
レジスタ475の出力)を選択する。内部の「常に真」
状況は無条件ジャンプのとき選択てぎる。両方共開始ア
ドレス・レジスタ479がマイクロアドレス・バス47
3を駆動できるように、あるいは5TACKPOPまた
はREADSTACK*信号かスタック操作進行中を示
しているときディスニブルさせること力)できる。(S
[へC旧)01)はl’ l’マイクロコートかう得ら
れるか、1(1・へos’rへCKはC1)にJ:って
制御される。) 上述したように、FPモジュール130はCP千ジュー
ル110とDTPモジュール+20で言うような個別の
シーケンサをもっていない。事実、このモジュルは個別
のプログラム・カウンタでさえもっていない。その代わ
りに、レジスタ474の真と偽の出力がこの機能を果し
ている。 ALU問題状況PAI。 このFAI、は浮動小数点状況ビットの1つがいつ「問
題状況j状態を示したかを記憶している。 (本好適実施例で「問題」状況が使用されているのは、
基本的エラー処理メカニズムから切り離しである種の障
害状態をモニタするためである。)例えば、オーバフロ
ーのテストは各要素の引算のたびでなく、ベクトル演算
の終了時に行なうことができる。乗算機構440とAL
U 440は各々問題状況を表すビットをいくつかもっ
ている(オーバフロー、アンダフロー、 jjjl:効
演算、その他の類似工ラ−を示ずヒノ1−)。2つのマ
イクロコート・ピッ)−は問題状況1ノシスタの更新と
クリアをサイクルiIt位で制御する。 類似の1)計はFMOY状況に刻してこの機能を実行す
る。これらのPへ1、にあるロシ・ツタもコート化され
た出力で各種問題状況状態を示すようになっている。ク
ロック・タイミングの使用により、問題状況ビットが存
在するかどうかが1サイクルで検査される。 スタック制御FAI、391O このFAI4は、サブルーチン・スタック・アドレス指
定の制御とテーブル・アドレス・カウンタの制御の2つ
の別個の機能を実行する。 第39図は浮動小数点プロセッサ・モジュール130内
のスタック・レジスタ478の好適実施例を示している
。I’AL 3910は多重レベル・バイブライン・レ
ジスタ3920を制御する。(本好適実施例では、これ
はAMD 29520が使用されている。)この多重レ
ベル・レジスタ3920は4つのパイプライン化レジス
タ3921を含んでいる。しかし、出力マルチプレクサ
3922にこれらのレジスタのいずれかを選択させて、
直接出力を得ることも可能である。 このマルチプレクサの出力はF11モジコ−−ル130
のマイクロ命令アI・レス・バス473 に結はれてい
る。 FAI、3910は制御人力を多重レベル・レジスタ3
920に提供して、このレジスタを1、IFO(後入れ
先出し)メモリとして機能させる。これにより、メモリ
はスタックとして動作する。PAL 3910はバイブ
ライン化レジスタ3921に対して転送信号3912(
これはマイクロコード・クロックとANDがとられる)
を供給する。また、選択信号3913をマルチプレクサ
3922に供給する。 PALは通常のブツシュとポツプ機能を備えているほか
に、コマンドを受けて読取りスタック・モードに入って
、スタック状況を壊すことなくどのスタック・レベルで
も読み取ることができる。 レジスタ・ファイル・アドレス修飾子PALこのPAL
はFPレジスタ・ファイル・アドレス・フィールドの最
上位ビットを、アドレス修飾コトと2重バッファの現在
選択されているバンクに応して修飾する。修fiili
ずへぎア]・レス・フィール1〜は3つあり(X、Y、
T)(これらは第1オペランド・ハス431、第2オペ
ランド・ハス432、おJ:び結実用バス433に対応
している)、ロジックはこれらの各々に対して同じであ
る。これらのアドレスの1つについてそのロジックを以
下説明する。 修飾最」三位アドレス・ビットは人力アトレスの最上位
ビット、2ビツト修飾コード、およびバンク選択信号か
ら求められる。アドレス・ビットに対する修飾は次の通
りである。 1、修飾なし−これは物理アドレス指定モードである。 2、バンク選択信号の反転−これは2重バッファ構成で
通常のアクセスに使用される「論理」モートである。バ
ンク選択は、データがレジスタ・ファイルと保持レジス
タの間で転送されるとぎ使用されるものと反対であるこ
とに注意されたい。 3バンク選択信号と同等−これはプレビュモー1’であ
る。−ト述したように、このモートにあるときは、FP
はバンクを交換し合わなくても2重バッファの反対側に
あるデータをアクセスできる。この機能は浮動小数点パ
イプラインを一杯に保つことができる。 3つの修飾アドレス・ビットは外部レジスタに格納され
、「旧人6」ビット(各アドレスに1ビツト)としてフ
ィードバックされる。これらは、「旧八6使用」コマン
ドが主張されたとぎこれらのビットの「計算で求めた値
」を置き換えるために使用される。この機能は、アドレ
ス・モードが数サイクルの間未変更のままであるときア
ドレス・セットアツプ時間を短縮する。 結実用バス制御PAL このPALは結実用ソース・マイクロコート・フィール
ドをデコードして、必要とする装置(例えば、第1図の
構成では、FMPY 440. FAl、U 450、
またはスクラッチパッド・メモリ1610)を出力イネ
プルする。このPALは必要時にスクラッチパッド・メ
モリにチップ・イネーブル信号も送る。 VMli割込ミP A 1 このPΔ1. l:l:VME割込みプロトコルをステ
ー1−・マシンの形で実現している。GENVMEIN
Tか活動状態(高)になると、IIIQENは次の正の
vcK縁で高に駆動される。IRQENは割込みか受は
イ」のられるまて活動状態のままであるので、割込みの
原因はCLRIRQFF*を低に駆動することによって
除かれる。VI八へK*とVIA[:KIN*信号かモ
ニタされ、割込み受イ」けサイクルが引き起された割込
みで検出されると、内部割込み受(−10サイクルが開
始される。 正しいVME割込み受付番プザイクルはこれらの信号が
活動状態になり(VI八へKIN*はデイジ一連鎖の部
である) 、 VMEIA<01+03>が割込みが引
き起されたときと同じレベルにセットされることによっ
て識別される。内部割込み受付はサイクルはVMEID
Sが主張されるまで待ったあとで、数サイクルの間に割
込みベクトルをイネーブルしてデータ・バス(IVOE
*)上に送出し、IVDTACHをセットし、111Q
ENを取り除く。しばらくしたあと、VMEIDSは非
活動状態になり、割込みベクトルとIVDT八Cにへ除
かれる。割込み受イτ」リサイクルか現れると、VIN
TA(:Kか主張され、そのあと割込みベクトルをハス
上に送り出すスレーブ・サイクルで旧l5CONを始動
する(アドレス・デコーFPALを通して)。 割込み受イ」けデイジ一連鎖は、未処理の制込み要求が
ないときこのPALに支障なく渡される。 DMA/VMEステート・マシン このPALはVMEバスとデータFIFO間のデータ転
送だけを取り扱う。転送の方向はステート・マシンから
は見えないので、クロックと状況は外部で切り替えられ
る。DMARSTARTが活動状態になると、ステート
・マシンはDMA転送を開始する。まず、同期FIFO
状況(SDMAFSTAT中)がFIFOに1回の転送
分のデータまたは余地があることを示し、SDMADO
NE/J< DMAカウンタが準備状態にあることを示
すまで待っている。DMAGKは低に駆動されて、デー
タがある場合にFIFOを出力イネーブルする。 ステート・マシンはバス要求(LIIUSREQりを出
して、その要求が許可(SLBGRANT+)されるま
で待ってし\る。バスが許可されると、DM八へへ*と
DM八へs*がVMEハス・セットアツプ時間に従って
主張される。これらの2信号はVMEスレーブ装置がデ
ータ転送受付け(SLDTACKk)を返してくるまで
保留され、そのあとDMAGKは高に駆動される。1サ
イクルのあと、DM八へへ*とDMADSIは除かれ、
正の縁がDMAC0IINTテ駆動さレル。転送モード
(DMARBLOCK)が単一転送である場合は、LB
LISRELが主張されてバスが解放され、上で述へた
手順が繰り返される。転送モードがブロック(順次)転
送である場合は、バスは、ブロックの終りまできている
か(BLOCKENDて示される) 、 14FOが満
杯/空であるか(SDMAFSTAT串)、DMAカウ
ントが尽きたか(SDMADONE)、あるし1はDM
AがDMARSTART ノ否定によフて途中で打ち切
られた場合以外は、解散されなし1゜ブロック転送のと
きは、DM八へへ中はBLOCKENDによって解放さ
れるまで保留されている。 5LBUSER旧人力は、DMAアクセスの結果バスに
エラーが起こると、活動状態になる。このエラーが起こ
ると、現在の転送は打ち切られ、DMABERRが駆動
される。ステー1・・マシンはDMATSTARTか否
定されてDMAIIE旧(がクリアされるまでこの私!
占のままである。最後の人力DMATl1STはとのV
Mliサイクルが現れなくてもDMAが行なわれること
を可能にする。これは、ステート・マシンの基本動作を
テストするとぎに便利であり、またバス・エラが起こっ
たときにFIFOの人力を停止させる手段として利用で
きる。 リセ・ント状態はDMARSTART、 DMARBL
OCKおよびDM八へTESTの未使用の組合わせを使
用することによって強行させることができる。 (以 下 余 白) DMAアドレス制御 7 F 1/ ス・ヒy h (VMEI八<01:0
7>は、256バイト境界まてにいつ達する直前にある
かを検出するためにモニタされるのて、ブロックDMA
転送を瞬時に中断させて、VME仲裁を可能にする。(
これにより、VME規格におりる最大ブロック転送長さ
の制約に準拠することがてきる。)このことはBLOC
KENDて示される。PALの残り部分はDMAアドレ
ス増分の処理を担当する。転送サイズ(16または32
ヒ゛・ント)に応じて、DMAアドレスはDM八へNG
が高になると、それぞれ1か2だけ増分される。 DMAアドレスの増分は、DM八へNTEluがマイク
ロコート・クロックの1または2サイクルの間活動して
いるかどうかを選択するDMARLONGINCによっ
て制御される。CLREF*は、DMAC0UNTの縁
を捕捉したフリップフロップをリセットする。VMEI
R5T*は必要ならばPALをリセッ1−するために使
用できる。 割込み縁捕捉 コ(1’)PAL ハGIPIEMPTY*、VMEI
FEMPTY*、DPIIEMPTYVTP INTD
およびVTPINTテ正(71を捕捉し、G l 11
01i M P T Y *とVM11旧・EvP1y
*て負の縁を捕捉する。 これにより、割込・、71信号を縁でトリガさ(、その
あとマイクロコート・クロックと同期させることかでき
る。縁か検出されると、夕4応する出力は低に駆動され
る。縁捕捉フリップフロップは対てリセットされる。つ
まり、TPINTGIP中は2つのGll+縁をリセッ
]・シ、TTIVMEF*は2 ツノVM[i 1&を
リセットし、TPINTVM巨は2つのvrp縁をリセ
ットし、TPINTDPIP[l*は2つのDP縁をリ
セッ1−する。 GIPマイクロコード・デコー1〜 このPALは3つのマイクロコート信号uGIPlID
両UGIPW114およびUGIPFIIをデコードし
て、出力イネーブル、FIFO読取りおよび書込みクロ
ックおよびレジスタ・クロックを発生ずる。FIFO読
取りクロツタはFIFOの空の状況(GIPOE*)に
よってゲートされて、FIFO内の誤りを生じる空のF
IFOの読取りを期止する。クロックタイプの信号はG
IPCIまたはGIPFRDGKで資格づりされる。 4  r+ 2 53A GIP割込みマスク このI“八l は2つの機能を実行する。ます第1に7
つの割込み発生源となり得るものの中から4つを選択し
、必要な場合には選択的に反転して割込み処置か正の縁
になるようにする。4割込み発生源は2組か8!Iされ
、GIPSELIはそのどちらかを選択する。第2の機
能は選択した組に4マスク・ビット(GIT’1M <
0:3>)てマスクをかけてから、結果を駆動してGI
I’INT <O:3>とじて出力するものである。G
ll”IACK*信号は単純に反転されるだけて、GI
f’I八GKかへられる。 (以下余白) Gll’割込みステート・マシン このPALは訓込み人力(GIPINT<0:3>)の
正の縁を探し、1つまたは2つ以上か現れると、GIP
INTか駆動される。特定の割込みはマイクロコート・
フィールドLIGIPCC5<0・l〉でそれを選択し
て、111、IPCl、AIを主張することによってク
リアされる。 すべてのフリップフロップはGIPRST*によるリセ
ットでクリアされる。縁は割込みを1サイクルだけ遅ら
せ、遅延されたものと遅延されなかったものを比較する
ことにより検出される。遅延されなかりたものは、この
ステート・マシンがラン・オフしているGIPCIクロ
ックとすでに同期がとられている。 ホスト・コンピュータ 第1図に示すようなシステムは広範囲にわたるコンピュ
ータ・アーキテクチャで使用できる。本好適実施例では
、第1図のシステムは数値高速化サブシステムとして使
用されている。ポスト・コンピュータはVAX 880
0を使用し、VMEオペレーティング・システムが稼動
して、VMEインタフエスとVMFハス411Oを通し
て第1図のシステムと通信するようになっている。しか
し、他の4116成も幅広く使用することも可能である
。例えば、使用てきるl]旧Xマシンは、Sun Mi
crosystcms社提供の装置を含む扛々なものか
ある。 さらに、他のシステム・ハス構造を使用することも可能
である。例えは、第1図のザブシステムをVMSが稼動
するVAXて使用し、インタフェース・ボックスを経由
してリンクで結ぶことができる。このザブシステムはM
S−DO5が稼動するパーソナル・コンピュータで使用
し、イーサネット(例えば)を経由して単純なVMEバ
ス・インタフニス・ボックスと通信させることさえ可能
である。 さらに注目すべきことは、第1図のサブシステムは32
ビツト・アーキテクチャが中心になっているが、このザ
ブシステムを64ビツト語や48ビツト語で使用できる
という利点があることである。この機能を得る1つの要
因は、わずか2サイクルで64ビツト演算が行なえる浮
動小数点プロセッサ・モジュール130に内部データ通
路を使用したことである。もう1つの要1λ1は、キャ
ッシコ・ハス144を広幅にして、複数の64ピッI−
語を数値プロセッサ・モジュール130と並行して転送
てぎるようにしたことである。従って、64ピッ1−計
算は語のほぼ半分の速度て(つまり、はぼ同しビット速
度)32ビツト演算として実行することかできる。 さらに、本明細書に開示されている多数の新規事項を様
々なシステムに適応させることも可能である。これらの
新規事項は本好適実施例のバス標準と全く異なるバス標
準をもつシステムに適応させることも可能である。実際
には、VMEバス・インタフェースは特別には利点がな
いので(総バンド幅を妥当なものにすることとは別に)
、発明者の開示義務に従うために開示したにすぎない。 ホストとのバス・インタフェース 上述したように、本好適実施例では、ホストと結ぶ主要
インタフェースとしてVMEバスを使用している。この
バスは上述したようによく知られている。 他のバス構成を幅広く使用することも可能である。例え
は、V e r s aIt u s 、F u t 
u r e B u s、またi:ljすullusを
必要ならば、システムに組み入れる段別が簡単に実現て
きる。超高速計算システムの場合は、光学バスを使用し
、光ファイバに変調固体素子レーザを使用すると利点が
得られる。 画像プロセッサ・サブシステム 1つの実施例によるシステムは第1図(または9Aカ)
10)に図示のような1または2以上のサブシステムと
通信するポストを使用しているだけでなく、特殊な図形
プロセッサである追加サブシステムを使用している。こ
こで使用されている好適画像プロセッサは”GTP”プ
ロセッサとも呼ばれ、英国Kingston−upon
−Thames在のbenchMark Techno
l。 gias Ltd  社から提供されているものである
。 第41図は1つの構成例であるが、勿論、広範囲にわた
る他のトポロジやシステム・アーキテクチャを使用する
ことも可能である。ホスト・コンピュータ4100は画
像プロセッサ・サブシステム4140および少なくとも
2つの数値高速化サブシステム4150 (これは例え
は、第1.9.10図に示すものと同しにすることがて
きる)と、VMliハス4+70を経由して通信する。 VMEバス411Oを経由して、主メモリ4160、大
容量記憶装置4170 (例 バー1〜・ディスク)、
および任意的に、1つまたは2以上の装置インタフェー
ス4+80(これは出力装置、ゲートウェイ、他の記憶
装置などにすることができる)をアクセスすることも可
能である。 本実施例では、追加バスが2つ使用されている。画像デ
ータ・バス4130は図形プロセッサと結ぶアプリケー
ション仕様インタフェースとなる。 (これは広幅であり、画像または図形伝送で使用すると
特に便利である。)この実施例の構成例では、これはr
GIPバスJ (benchMark Technol
ogies社提供)が使用されている。このアプリケー
ション向きバスは画像処理サブシステムの広バンド幅大
出力要求に非常にマツチしている。これは広幅バスであ
り、160データ線からなっている。 もう一方のバックブレーン・バスはデータ・パイプ・バ
ス4120である。このバスを使用すると、複数の数値
高速化サブシステムを第34.35.36、37図に示
ずようなトポDジ構成で結ぶことかてぎる。この実施例
の構成例では、このハスは32デタ線からなっている。 システムの動作 本発明を色々な角度から見たいくつかの重要な使い方と
、開示されているシステム・アーキテクチャのいくつか
の使い方について以下説明する。 以下で説明するいくつかの方法はそれぞれ個別発明を構
成するものである。 サンプル動作の実現 アーキテクチャの簡単な使用例について以下説明する。 この例では、ホスト・プロセッサ4100は数値高速化
サブシステム4150 (第1.9または10図に示す
ものと同じ)に対してコマンドを出して2つの配列を一
緒に乗算して(配列要素単位で)その結果を第3の配列
に入れておくものである。 3つの配列はずへてVMEメモリ空間(例えば、主メモ
リ4160)に置かれている。コマンドが出される前は
、ザブシステムは遊休状態にあり、コマンドが実行され
ると、再び遊休状態になる。これは図式化して第42図
に示されている。 コマンド・シナリオは2かト類か示されている。 最初のシナリオは使用されるメそり空間か物理空間だけ
のシステムを詳しく説明している。(この種のアーキテ
クチャは、ボス1〜か可能な限りの作業量を高速化サブ
システムにオフロー1−することが望ましい場合に使用
できる。)第2のシナリオはVMSが稼動するVへXや
UNIXコンピュータに見られるような仮想メモリをも
つシステムに対するものである。この第2シナリオでは
、動的メ干り割振りとディスクとのデータのページ・イ
ンとベジーアウトがどのように処理操作で取り入れられ
ているかが示されている。 第15図はコマンド・メモリ190がどのような構成に
なっているかを示している。また、やりとりされるコマ
ンドと割込みタイプのいくつかも示されている。注目す
べき重要点は、2つのコマンドFIFOが含まれるよう
にコマンド・メモリ+90をソフトウェアで分割すると
好ましいことである。CPコマンドFIFO1520は
CP−11−ジュール110 ニア Fしス指定された
ロマン1〜をバッファするものてあり、DT’Pコマン
1jFIF01510はDTPモジュール+20にアド
レス指定されたコマンドをバッファするものである。 コマンド・インタフェース、やりとり、および作業のス
ケジューリングはラフ1〜ウエアによって制御されるが
、必要に応して変更することが可能である。従って、以
下の例はシステムをどのように使用する必要かあるかを
明確化していない。システムか使用できる態様を示した
にすぎない。 物理メモリ・モデル(CP/DTP間のやりとり)この
例では、ポスト・プロセッサは高速化ザブシステムに対
してコマンドを出して、2つの配列を一緒に乗算して(
配列要素単位で)、その結果を第3の配列に入れておく
ためのものである。3つの配列はすへてVMEメモリ空
間に5置かれている。コマンドが出される前は、高速化
サブシステムは遊休状態にあり、コマンドが実行される
と、再び遊休状態になる。これは図式化して第42図に
ボされている。 コマン1〜の実行時には、吹のようなスデップで行なわ
れる。 (1)ボス1〜はヘクトル乗算コマン)・を高速化ザブ
システムのコマン1〜待ち行列(これはVMliインタ
フェース・メモリに置かれている)に入れる。 その際、コマンドで配列内の要素の数、2つのソス配列
のアドレス、および結果配列のアドレスを指定しおく。 コマンドとそのパラメータか待ち行列に追加されると、
ホストはデータ転送プロセッサ・モジュール120に割
込みを引き起す。これにより、ポストは解放されるのて
、他の仕事を行なうために使用できる。 (2)ホストから割込みを受り取ると、データ転送プロ
セッサ・モジュール120はコマンドとそのパラメータ
のコピーをとって、コマンド・メモリにあるソフトウェ
ア管理のCPコマンドFIFOに入れておく。割込みが
制御プロセッサ・モジュール+10で引き起されて、コ
マンドが存在するとの通知を受ける。データ転送プロセ
ッサ・モジュール120は遊休状態に戻る。 (1)割込のを受けると、それに応えて制御プロセッサ
・モジュール110は遊休状態から出で、コマンドとそ
のパラメータをコマンド・メモリ190内のCPコマン
ドPIFO1520から読み取る。コマンドで指定され
たアドレスが検査され、オフボート(つまり、データ・
キャッシュ・メ干り140にではなく)に置かれている
ことが判明する。従って、この例では、2つのデータ取
出しコマンドと”INTERRIIPT CP WII
EN DONE+コマンドがコマンド・メモリ190内
のDTPコマンドFIFO15]0に書き出される。各
データ取出しコマンドは配列のソース・アドレス、その
長さ、データ・キャッシュ・メモリ内のその宛先アドレ
スを記述している。ブタ転送プロセッサ・モジュール1
20に割込みが起こり、制御プロセッサ・モジュール1
10は遊休状態に戻る。 (4)割込みを受けると、それに応えてデータ転送プロ
セッサ・モジュール120は遊休状態から出て、最初の
コマンド(とそのパラメータ)をDTPコマンドPIF
O1510から読み取る。データ転送プロセッサ・モジ
ュール120はデータを取り出すべきア1−レスをチエ
ツクして、それかVλ)ドア1〜レス空間に置かれてい
ることを確認する。次に、ブタ転送プロセッサ・モジュ
ール120はVM[インタフェース160内のDMAコ
ントローラが配列を取り出して、それをVMEインタフ
ェース160内のブタFIFO670を書き込むように
セラ1−アップする。 (これは実際にはコマンド待ち行列FIFO1510’
J’rよび1520と異なり、ハードウェアFIFOで
あり、先入れ先出し機能はソフトウェアにもたせている
ことに注意されたい。)このデータか到着すると、デー
タ転送プロセッサ・モジュール+20はデータFIFO
670からデータを読み取り、それをデータ・キャッシ
ュ・メモリ140に書ぎ込む。転送が完了すると、DT
PコマンドFIFOが検査されて、次のコマンドはなに
か(もしあれば)が確かめられる。 この場合、別のデータ取出しコマンドが見イ」かると、
最初の取出しコマンドと同じ方法で実行される。これが
終ると、次のコマンドが読み取られ、実行される。この
コマンl〜は制御プロセッサ・モジュール110に割込
みを引き起ず。DTP :Jマン1−FIFO15]0
はこれて空になり、データ転送プロセッサ・モジュール
は遊休状、態に戻る。 (5)この訓込みにより、制御プロセッサ・モジュール
110は、要求した2つの配列がデータ・キャッシュ・
メモリに格納されたことを知る。結果配列の宛先アドレ
スはオフホードにあるので、制御プロセッサ・モジュー
ル110は結果を人れておく一時的配列をデータ・キャ
ッシュ・メモリ140内に割り振る。CPモジュール+
10は割算処理を開始する。計算処理のとき、中間デー
タ・セットがキャッシュ・メモリ140から取り出され
て、FPモジュール130(CPモジュール110の制
御下にある)のレジスタ・ファイルに移される。FPモ
ジュール130は独自のマイクロコードを稼動させ、同
期点でCP千ジュール110とインタフェースになって
、数値演算を実行する。中間データ・セットはFPモジ
ュールのレジスタ・ファイルからキャッシュ・メモリ1
40(CPモジュール110の制御下にある)に移され
る。従って、ベクトル乗算が完了したときは、K?i 
果1.1.CPモジュール+10によって以前に割り振
られたキャッシュ140内の配列に残っている。 (6)次に、制御プロセッサ・モジュール+10はデー
タ保管コマンドと+INTERRUPT ll05T 
WIIENDONE+コマンドをDTI’コマンドFI
FO1510に書き出す。データ保管コマンドは、デー
タ・キャッシュ・メモリ内の結果配列のソース・アドレ
ス、宛先アドレス(下のコマンドで指定されたもの)、
および配列長さを指定している。データ転送プロセッサ
・モジュール!20に割込みが起こる。CPコマンドF
IFOが空ならば、制御プロセッサ・モジュール110
は遊休状態に戻る。 (7)割込みを受けると、それに応えてデータ転送プロ
セッサ・モジュール120はその遊休状態から出て、最
初のコマンド(とそのパラメータ)をDTPコマンドF
IFOから読み取る。データ転送プロセッサ・モジュー
ル120はデータを保管すべきアドレスを調べて、それ
がVMEアドレス空間に置かれていることを確認する。 次に、データ転送ブロセッヅ・モジュール120は、V
Mliインタフェース1■内のDM八へンi〜ローラ6
110か正しい個数のF語をデータFIFO670から
VME主メモリに転送するようにセットアツプする。デ
ータ転送プロセッサ・干ジュール120はデータをデー
タ・キャッシュ・メモリから読み取り、それをデータF
IFO670に書き込む。結果配列がデータFIFOに
転送されると、データ転送プロセッサ・モジュール+2
0はDMAコン1〜ローラにそのことを通知し、 DM
AコントローラがVMEメモリへの転送を終えるまで待
っている。 (8) DTPコマンドFIFOが空でなければ、次の
コマンドが読み取られ、実行される。これは”INTE
RRIIPT−110sT−WHEN−FINISHE
D”コマ:/ドである。このコマンドを受けると、完了
したばかりのコマンドの状況がVMEインタフェース・
メモリ内のコマンド待ち行列に書き出され、ホスト割込
みが引き起される。この割込み通知を受けて、ポストは
そのヘクI・ル乗算コマンドが終了し、その状況をVM
Eインタフェース160内の状況レジスタから読み取る
ことかできることを知る。そのあど、データ転送プロセ
ッサ・モジ;ノール120ハ遊休状態に戻り、こねて操
作を終了する。 上記処理の途中のいっても、ホストは新しいコマンドと
そのパラメータをコマンド待ち行列に招ぎ込んで、デー
タ転送プロセッサ・モジュール120に割り込むことか
可能である。そうすると、DTPモジュールは割込み要
求を制御プロセッサ・モジュール110に対して出して
、新しいコマンドを通知する。可能ならば、その実行は
上述したように開始されることが好ましい。これを行な
うと、制御プロセッサ・モジュール110とデータ転送
プロセッサ・モジュール120はコマンドの処理に専念
できるが、望ましくないやりとりがコマンド間で行なわ
れないようにする配慮が必要である。 データ・アドレス割当てはかなり柔軟性をもたせている
。インタフェース150.160.170(と局所デー
タ・キャッシュ・メモリ140)の各々には、そこを通
してアクセスできるアドレスが範囲で割り当てらねでい
る。これにより、データ転送プロセッサ・モジュール1
20は異なるデータ・ソースや宛先の場所ごとに別コマ
ンド定義をしなくても、コマン!・のデータ要件を満足
するにうに正しいインタフェースを制御することかでき
る。 上述の例では、コマンドはVMEバスを経由してホス1
−から送られてきたが、これらのコマンドは前述の説明
内容に殆んど変更を加えないで、インタフェースのどれ
からでも簡単に出すことができる(あるいはコマンド・
リストの一部として保管しておくことができる) VM
Eボス1−は1つの例として選ばれたものである。 コマンドに必要な総記列サイズがデータ・キャッシュ・
メモリ内の空き記憶域を越えるときは、制御プロセッサ
・モジュール110はコマンドをいくつかの小さな演算
に分割することによって、使用可能な記憶スペース内で
コマンドを処理することを試みる。しかし、ある種のコ
マンドの場合は、これは不可能であるので、ポストにコ
マンドが失敗したことが通知される。 ポストかコマンドを送るのが早ずきる場合は、内部ラフ
1−ウェアF I F Oか一杯にノ、<ることかある
。 これが全体の演算に影響するのを防止するために次のよ
うな配慮がなされている。第1は、DTI+コマンドF
IF01510がCPコマンドFIFO1520の奥行
の少なくとも3倍になっていることである。1つのポス
ト・コマンドは3つ以上のデータ転送コマンドになるこ
とは稀にしかないので、口TPコマンF FIFOがホ
スト・コマンドの結果として一杯になることはない。 CPコマンドFIFOはほぼ満杯マークまでくると、V
MEインタフェース内の状況ビットがセットされる。 仮想メモリ・モデル 仮想メモリを採用する場合は、ホスト側の作業量が増加
するというやっかいな問題がいくつか生じる。これらの
問題が起こるのは、アプリケーションが物理メモリより
はるかに大きい仮想アドレス空間をアクセスできるから
である。仮想アドレス空間全体はディスク上にだけ存在
し、活動中のソントウエ】′かそのとき必要とするアド
レス空間部分は実行時に必要に応して主メモリにベージ
・インされる。このことは、次のような種類の問題をい
くつか起こす原因になっている。 配列、または配列の部分がディスク上にたり存在し、物
理メモリに存在しないことがある。さらに、高速化サブ
システムか必要とする配列部分かシステムで稼動中の他
のタスク用のスペースを作るために、スワップ・アウト
されることかある。 配列に割り当てられる物理アドレスは、コンピュータ始
動以後のすべての処理活動記録と共に変化するので、予
測ができない。 各仮想メモリ・アドレスは変換処理を受けて、特定のデ
ータ項目をアクセスするための物理アドレスが決まる。 この結果、配列がメモリ内で非連続になったり、分散し
たりする。 これらの問題を回避するには、データ転送プロセッサ・
モジュール120が配列をデータ・キャッシュ・メモリ
との間で転送している間、配列を物理メモリにロックし
ておく必要がある。理想的には、配列か連続しているの
か望ましい。配列を連続にてきない場合は、データ転送
ブロセッヅ・モジコール120は転送の過程で分散/収
集操作を行なう必要かある。しかし、データが物理メモ
リのどこに分布しているかを知るには、分散/収集テブ
ルが必要になる。 高速化サブシステムとの間のデータ転送を組織化し、そ
れに伴なうメモリ管理機能を扱う仕事をアプリケーショ
ン・ソフトウェア(ホスト上で稼動する)にもたせるの
が好ましい。(実際には、アプリケーション・ソフトウ
ェアは、MへTl+ライブラリ・ルーチンと装置ドライ
バがこれらの問題を扱うので、その大部分から解放され
ている。業界標準配列プロセッサ・ライブラリ・ルーチ
ンはデータを配列プロセッサとの間で受は渡しすること
(ライブラリ・ルーチンを使用して)をユーザ側に任せ
ている。)ソフトウェア階層について以下説明するが、
ここではその違いについては触れないことにする。 上述した配列乗算例では、アプリケーション・ソフトウ
ェアは次の7スデソブを受り持っている。 1)配列Aを正速化ヅブシステムに転送し、それをア1
−レス昌に保管する(高速化機構にJ:って実行)。 2)配列Bを高速化サブシステムに転送し、それをアド
レスBBに保管する(高速化機構によって実行)。 3)高速化サブシステムが転送を終えるまで待っている
(高速化機構によって実行)。 4)アドレス昌とBBにある配列を一緒に乗算してその
結果をCCに保管する(高速化機構によって実行)。 5)高速化サブシステムが乗算コマンドを終えるまで待
っている(ポストによって実行)。 6)アドレスCCにある配列をポスト・アドレス空間に
転送する(高速化機構によって実行)。 7)高速化サブシステムが転送を終えるまで待っている
(ポスl−によって実行)。 この処理順序に関して注目すべき点をいくつか挙げると
、次の通りである。 113のコマン]−を高速化ジブシステムに送ることが
できる。これらのコマン1〜は待ち行列に置かれてから
、処理される。 ホストは転送と乗算との間の同期点を出して、すへての
データがデータ・キャッシュ・メモリに存在するまで乗
算が開始されないように配慮する。 高速化サブシステムを待たなくても、ポストが解放され
ているので他の仕事ができる。しかし、ホストのオペレ
ーティング・システムは、高速化サブシステムとの同期
をとるためには明示の待ち操作が必要になるのが普通で
ある。 ステップCとeは、転送と計算操作の同期化がオプショ
ンとして高速化サブシステム内で簡単に行なえるので、
省略してもよい。しかし、そうすると、業界の事実上の
標準と互換性を失うことになる。 データ・キャッシュ・メモリのメモリ割振りはCPマイ
クロコード監監視ルーシンりも高いレベル(扱ねれる。 配列はメモリ内でロックされ、データ断片化の問題はア
プリケーションど高速化サブシステム間のインタフェー
ス・ラフ1〜ウエアによフて取り扱われる。同期(待ち
)点か頻繁に現れると、メ干り・ブロックは短期間ロッ
クされるので、多重ユーザや多重タスク処理環境に与え
るストレスが軽減される。 コマンドの実行は次のようなステップで行なわれる。 (1)ホストは、コマンド・タイプと対応する数のパラ
メータを指定して、コマンド(転送または泪算)を高速
化ザブシステムのコマンド待ち行列(VMEインタフェ
ース・メモリに置かれている)に入れる。コマンドとそ
のパラメータが待ち行列に追加されると、ホストはデー
タ転送プロセッサ・モジュール120に割込みを引き起
す。これでホストは解放されるので、他の仕事に使用で
きる。 (2)ホス]・から割込みを受けると、データ転送プロ
セッサ・モジュール120は現在の活動(遊体中かある
種の転送)を−時中止して、コマンl−のタイプを調へ
る。コマン1−には次のようなタイプがある。 コマンドが制御プロセッサ・モジコール+10に対する
ものならば(つまり、計算)、コマン1〜どそのパラメ
ータはコピーされて、コマン1〜・メモリ190内のC
PコマンドFIFO1520に人れられる。 制御プロセッサ・モジュール110で制込みが起こり、
そのコマンドが通知される。データ転送プロセッサ・モ
ジュール120は前の活動に復帰する。 コマンドが同期化コマンドならば、未処理のコマンドす
べてが完了するまで以後のコマンドは待ち行列から取り
出されない。これは、”WAIT FORALL AN
D N0TIFY )IO5T”コマンドをDTPコマ
ンド待ち行列に挿入することによりて行なわれる。 (3)遊休状態にある間、データ転送プロセッサ・モジ
ュール120は絶えずCPコマンドFIFOを調べてい
る。この待ち行列が「空でない」状態になると、コマン
ドはそこから取り出され、操作が行なわれる。例えば、
ホストからデータ・キャッシュ・メモリへの転送の場合
には、データ転送プロセッサ・モジ、−ル120はVM
Eインタフェース内のDM八へントローラか配列を取り
出し、それをデータFIFOに書き込むようにセットア
ツプする。転送か終ると、DTP千ジュール120はコ
マンドをDTPコマン1〜待ち行列から取り除く。別の
コマンドがFIFOにあれは、そのコマンドが実行され
、DTPコマンド待ち行列が空ならば、データ転送プロ
セッサ・モジュール120は遊休状態に戻る。 (4)割込みを受けると、それに応して制御プロセッサ
・モジュール110は遊休状態から出て、コマンドとそ
のパラメータをコマンド・メモリ内のソフトウェアCP
コマンドFIFOから読み取る。アドレス静とBBにあ
る配列のベクトル乗算が完了すると、その結果の配列は
データ・キャッシュ・メモリ内のアドレスCGに残され
ている。コマンドの実行が終ると、そのコマンドはCP
コマンドFIFO1520から除かれる。他にコマンド
がなければ、制御プロセッサ・モジュール110は遊休
状態に戻る。 」二記説明において/j:IJすべき点をいくつか挙げ
るど、次の通りである。 制御ブロセッヅ・モジュール110とデータ転送プロセ
ッサ・モジュール120間の内部制御と同期化が物理メ
モリ・モデルに比へて大幅に減少する。データ転送プロ
セッサ・モジュール120は制御プロセッサ・モジュー
ル110よりも制御機能(またはコマンド経路指定機能
)が強化されている。 待ち行列はホスト連絡用に1つ、DTPの作業用に1つ
、CPの作業用に1つの3つが活動している。 高速化サブシステム側でデータ・キャッシュ・メモリに
残っている以上の記憶域が必要になる計算の場合には、
その計算を小さな部分に分割する仕事はホストが行なう
。 cpとFP間のやりとり 制御プロセッサ・モジュール110と浮動小数点プロセ
ッサ・モジュール130はアルゴリズムを実行するため
に、非常に緊密な関係でやりとりする。制御フロセッサ
・千ジュール110はアI・レスを51算し、データ・
A−=ヤッシュ・メモリと浮動小数点プロセッサ・モジ
コール130間のデータ転送を取り扱うのに対し、浮動
小数点プロセッサ・モジュール130はデータ割算を行
なう。このやりとりは制御プロセッサ・干ジュール11
0、データ転送プロセッサ・モジュール120およびホ
スト・コンピュータ間のインタフェースのタイプから独
立している。 ベクトル乗算コマンドでは、浮動小数点プロセッサ・モ
ジュール130はベクトル乗算を一度に8個の要素ずつ
行なう。従って、配列が大きいときは、制御プロセッサ
・モジュール+10と浮動小数点プロセッサ・モジュー
ル130との間でやりとり(同期点とも呼ばれる)が数
千回行なわれることもあり得る。同期点は、この例では
、400nsごとに現れるので、これらを効率よくする
ことは非常に重要である。 大抵の場合、制御プロセッサ・モジ:ノール110は浮
動小数点プロセッサ・モジコール130かブタ削算を行
なうよりも、アドレス甜算とデータ転送を高速に行なう
能力をもっている。その逆の場合には、待たされる方が
反対になる。 2つのフラグ(cpw八IへとFPW八Iへ)が両ブロ
セ・フサ間の同期を制御することは上述した。FPWA
ITフラグは次の組のデータを浮動小数点プロセッサ・
モジュール130との間で転送すると、制御プロセッサ
・千ジュール110によってクリアされる。このフラグ
をテストすることにより、浮動小数点プロセッサ・モジ
ュール130は同期点まで進むことができるか、制御プ
ロセッサ・モジュール110を待つ必要があるかを知る
ことができる。CPWAITフラグはデータ計算を終え
ると、浮動小数点プロセッサ・モジュール130によっ
てクリアされ、制御プロセッサ・モジュール110によ
ってモニタされる。ハードウェアは、フラグがクリアさ
れてプロセッサが同期点まで進むことが可能になると、
同期点を通過した直後にフラグが自動的にセットされる
構成に/7っている。 第22図はl・P W 八l ’r、CPW八Iへ、F
PDONE、おJ:びCPDONEフラグかcp干ジュ
ール110とFPモジュール130間のデータ・インタ
フェースを調整するためにとのように使用されるかを状
態図で示したものである。 プロセッサ間のハントシエイキング・ロジックどセマフ
詞は多種類のものが実現されているが、第22図に示す
状態図か非常に利点があり、新規なものである。 制御プロセッサ・千ジュール110と浮動小数点プロセ
ッサ・モジュール130間のデータ転送は2重バッファ
になっているので、浮動小数点プロセッサ・モジュール
130がある組のデータを処理している間、制御プロセ
ッサ・モジ:1−−ル110は別の組のデータを処理す
ることができる。2重バッファリングは上述したように
ソフトウェアで行なわれる。両プロセッサはバッファの
交換を制御する信号をもっており、これらは”AND”
がとられて両プロセッサか活動しているときたけ交換が
行なねれるようにしている。 ベクトル乗算は以下のステップで行なわれる。 (同し番号をもつステップは並列に行なわれるものであ
る。)これらのステップを図式化してフローヂャートで
示したのが第33図である。 (1)制御プロセッサ・モジュール110はFPW八I
へフラグをセットして、ベクトル乗算マイクロコートが
実行される浮動小数点プロセッサ・モジュル130を始
動する。浮動小数点プロセッサ・モジュール130はF
PWAITフラグがクリアされるまで待たされる。 (2)制御プロセッサ・モジュール110は最初の8要
素を両配列から2重バッファ(これは物理的には上述し
たように、レジスタ・ファイル430の2バンクから構
成されている)に転送する。CPモジュールは次に、2
重バッファを交換して、浮動小数点プロセッサ・モジュ
ール130がデータをアクセスできるようにして、FP
WAITフラグをクリアする。 (3)制御プロセッサ・モジュール110は次の8要素
を両配列から2重バッファに転送して、1・PWΔIT
フラグをクリアする。そのあと、CPW八Iへフラグが
クリアされるまで(浮動小数点プロセッサ・千ジュール
130によって)待たされる。 (3b)浮動小数点プロセッサ・モジュール130はF
l”WへITフラグがクリアされていることを見つける
と、2重バッファの浮動小数点プロセッサ・モジュール
130側に保管されている8対の要素に対するベクトル
乗算の81算を開始する。8個の結果は2重バッファに
書き戻され、FPWAITフラグがクリアされる。この
例では、制御プロセッサ・モジュル110はすてに終え
て、FPWAITフラグをクリアしているのて、浮動小
数点プロセッサ・モジュル130はバッファを交換して
、即時に次の組の計算を開始することができる。 (4a)制御プロセッサ・モジュール110は8個の結
果を2重バッファからデータ・キャッシュ・メモリに転
送し、そのあと次の8個の要素を両配列から2重バッフ
ァに転送して、FPWAITフラグをクリアする。その
あと、CPWAITフラグがクリアされるまて(浮動小
数点プロセッサ・モジ:+、  )l刈:)0にJ:フ
て)待たされる。 (4b)浮動小数点プロセッサ・モシコ、−ル1;)0
はFl’W八ITへラグがクリアされているのを見つり
るど、2重バッファの自分側に保管されている8対の要
素に対するヘクI〜ル乗算の割算を開始する。 8個の結果は2重バッファに招き戻され、CPWAIT
フラグかクリアさねる。この例では、制御ブロモ・ンサ
・モジュール110はすてに終えて、FPW八Iへフラ
グをクリアしているのて、浮動小数点プロセッサ・モジ
ュール130はバッファを交換して、次の組の割算を開
始することができる。 (5)ステップ(4a)と(4b)がベクi−ル菖1算
全体か完了するまで繰り返される。 (6)ステップ(5)か終わったとき、最後の組の結果
はまだ2重バッファのFP側に残っているのて、制御プ
ロセッサ・モジュール110はバッファを交換して、最
後の結果をデータ・キャッジJ9・メモリに転送する。 /I 83 第1図に示すようノよシステムを動作させるときは、実
行時ラフ1〜ウエア環境全体をいくつかのレベルに分割
することか好ましい。これらのレベルのうちあるものは
、異なるプロセッサで実行される個々のコーI〜・モジ
ュールとして存在し、他のレベルは必要とされるインタ
フェースをいくつかのレベルに分割する形て存在してい
る。これらのレベルずへてとレベル間インタフェースは
ソフトウェア制御下に置かれ、アプリケーション要件に
合っていなければ、変更が可能である。 このソフ]・ウェア構成は一般的に従来からあるもので
ある。しかし、本明細書に記載の新規事項の望ましい使
い方を分かりやずくするために、以下で説明しておくこ
とにする。 第44A、44B、および44C図は第1図に示すよう
なシステムのプログラミング環境を示したものである。 図示の機能別ブロックの多くは他の図に示されているハ
ードウェア要素のそれと同じ番号で示されているが、第
44A、44B、および44C図はプログラマから見た
機能別ブロック間の関係を示すことを目的としている。 従フて、これらの図は必ずしも現実の電気的おJ:び論
理的接続に止も1「に対応していないことに?主意され
たい。 アプリケーションとライブラリ・ラフ1−ウェア以下の
説明では、アプリケーション・ソフトウェアか例えば、
FORTRANや°C°のような高水準言語で書かれて
おり、標準ライブラリ・ルーチンを呼び出して、高速化
サブシステムを使用するものと想定している。これらの
呼出しは業界の事実上の標準に準拠している(つまり、
全体的に浮動小数点システムからのプロダクト命令セッ
トと互換性がある)。これらには、アプリケーション・
データ区域と高速化サブシステムのデータ・キャッシュ
・メモリ間でデータを転送するルーチン、広範囲にわた
る計算、ある種の同期化ルーチンが含まれている。 このレベルでのソフトウェアはホスト・コンピュータ・
システム上で稼動し、必要とするアプリケーションを実
施する機能をもっている。これはライブラリとリンクさ
れて、高速化サブシステムをアクセスする。 ライブラリOJアプリケーション・ソフトウェアから見
て、訪速化サブシステムと結ぶインタフニスの働きをす
る。ライブラリは数百に及ぶ共通算術演算/アルゴリズ
ム・ルーチン群と、高速化サブシステムを初期設定し、
アプリケーションの配列やデータ・セラ)・のデータ転
送を開始するルチン群から構成されている。大部分のラ
イブラリ・ルーチンは人力パラメータと機能番号を装置
)−ライムに渡ずだりの機能しかないが、ある種のパラ
メータ有効性検査が必要ならば組み入れることも可能で
ある。本好適実施例では、装置トライバとのインタフェ
ースはシステム呼出しくSystemCalls)を経
由する。しかし、ある種のオペレーティング・システム
では、呼出しタスクが再スケジューリングのために受渡
しされるので、呼出しに大きなオーバヘットがかかって
いる。 装置トライバ 装置トライバはオペレーティング・システムの部と考え
ることかてぎ、アプリケーション・ラフl−ウェアより
も高度の特村ルベルで実行される。装置1〜ライバの主
な役割il1次の通りである。 1)コマンドとパラメータをライブラリ・ルーチンから
高速化サブシステムのVMEインタフェース・メモリに
置かねているコマンド待ち行列に転送すること。 2)転送すべきデータ(仮想メモリ・システムにある)
がメモリにロックされていることを確かめること。この
ためには、転送が連続ブロックに分割されて・いて、小
さく分割した複数の転送が実際に行なわれているか、分
散/収集テーブルが作られていて、高速化サブシステム
に渡されていることが必要である。 3)マイクロコートを複数のプロセッサにロードし、一
般的にはハードウェアとマイクロコートを既知の状態に
まですること(電源投入後か、新しいアプリケーション
がそれを使用する準備状態に置くため) ライブラリと装置ドライバを新しいポスト上に移植する
最も困難な問題の1つは、装置ドライバである。こJ]
ら!J非’+’l’+にオペレーティング・システムに
依右する傾向かあるので、ポスト・システムの詳しいグ
[J識か要求される。任意的には、この種の問題を避り
るために、物理メモリへのアクセスか許される場合には
、ライブラリを直接にハトウェアとのインタフェースに
することが可能である。こうずれは、トライバの必要性
が回避される。この方法で高速化サブシステムをアクセ
スすると、装置トライバを使用する場合よりも高速化さ
れる。しかし、特に複数ユーザ環境では、安全保護が低
下することになる。 マイクロコード監視ルーチン マイクロコード監視ルーチンは、高速化サブシステムに
おける転送と計算以外の残りのタスクを取り扱うもので
ある。その主なタスクは、ホストとの連絡、制御プロセ
ッサ・プロセッサ・モジュル110とデータ転送プロセ
ッサ・モジュール120間の作業分担、および内部と外
部の同期化である。 監視ルーチンは装置ドライバとは反対側の待ち行列の最
後に置かれており、作業を待ち行列から取り出す。(こ
れを行なうには、作業か空の?t’jち行列から取り出
されないようにするためのある種の待ち行列管理が必要
になる。) どの程度複雑になるかは、どのプロセッサが使用される
かによって決まり、また、ホストにどれだりの仕事をさ
せるか、あるいは高速化サブシステムに負担させるかに
大きく左右される。物理メモリと仮想メモリ・モデルの
個所で行なったベクトル乗算コマンドの説明から明らか
なように、監視ルーチンはいろいろな手法を採用するこ
とができる。 物理メモリ・アーキテクチャでは、監視ルーチンはデー
タ転送プロセッサ・モジュール120と制御プロセッサ
・モジュール110の間で分割される。データ転送プロ
セッサ・モジュール120の部分は、ホストと制御プロ
セッサ・モジュール+10は直接にデータをやりとりで
きないので、コマンドの経路指定を行なうだけである。 制御プロセッサ・モジュール110は作業の分散化とハ
ンドシェイキングを組織化−・]−る。 この分割ill任意的である。別の(好ましさの点て劣
るか)アーキテクチヤでは、制御プロセッサ・干ジュー
ル+10をデータ転送プロセッサ・干ジューJ1月20
のスレーブ・プロセッサ(その反対でなく)として働か
せることも可能である。 仮想メモリ・モデルでは、データ転送プロセッサ・モジ
ュール120がマスクであり、制御プロセッサ・モジュ
ール110がスレーブになっていた。 制御はその殆どかポスト側で取り扱われるので、監視ル
ーチンのDPT部分はコマンドの経路指定だのを扱えば
よい。制御プロセッサ・モジュール110が待ち行列管
理に関与するのはわずかである。 マイクロコード転送ルーチン(DTPIこれらのルーチ
ンは外部インタフェースの1つとデータ・キャッシュ・
メモリ間のデータ転送を取り扱う。インタフェースは主
にVMEバス(とホスト・メモリ)に対するものである
。 ホス1〜・メモリとデータ・キャッシュ・メモリ間の転
送の大部分は、連続ブロック転送、分散/収集転送、n
番目の詰こと、行/列2次元配列アクセスといったよう
に、転送の種類か狭い範囲に限られている。 上記種類のいずれにも属さないタイプの転送はいずれも
、必要時に追加することかできる。ここで注目すべき重
要な点は、ムク1〜ル加算かベクトル乗算と同し転送ル
ーチンを使用することである。これが便利なのは、上述
したように、データ転送ルーチン(計算ルーチンと異な
り)はベクトル加算とベクトル乗算を区別する必要がな
いからである。 マイクロコート転送ルーチン(cp) これらのルーチンはデータ・キャッシュ・メモリの1つ
と浮動小数点プロセッサ・モジュール130の高速レジ
スタ・ファイル間のデータの転送を取り扱う。 この場合も、データ・キャッシュ・メモリとレジスタ・
ファイル間の転送の大部分は、1ベクトル・インと1ベ
クトル・アウト、2ヘクトル・インと1ヘク[−ル・ア
ラ1〜.1ベクトル・インとスカシ・アウトといったよ
うに、転送の種類か狭い範囲に限られている。これらの
転送タイプはデータ型(タイプ)に応してさらに分類す
ることがてきる。ベクトルは単純または複素数データ型
に分けることかてぎ、もっと特殊化された転送タイプも
いくつかある( FFT、 畳み込みなど)。これらは
汎用ルーチンが使用されない場合に効率が向上する。 ここで注目すべき重要な点は、異なる演算で同じルーチ
ンが使用できることである。つまり、ベクトル加算は、
例えばベクトル乗算と同じ転送ルチンを使用する。 マイクロコード言]算ルーチン(FP)各計算タイプご
とに、(例えば)8つの加算、減算または必要な演算を
行なうルーチンが用意されている。この種のルーチンに
よって制御されるデータ転送は、高速レジスタ・ファイ
ル430、乗算機構450、加算機構440、およびス
クラッチバラF1610を含む密結合データ通路内で行
なわれるものたけである。(このデータ通路には、いく
つかの局所バスもあり、その中には第1オペラン]・局
所バス431.第2オペランド局所ハス432、結実用
局所バス431、ループバック接続431が含まれる。 )この場合も、必要となるルーチンの多くはいくつかの
標準データ形式別に分類される。この分類の1例として
、ダイアシック・ベクトル演算(2ベクトル・インと1
ベクトル・アウト、例:ベクトル加算またはベクトル乗
算)がある。従って、標準テンプレートをあるカテゴリ
内の各引算タイプごとにセットアツプすることが可能で
ある。これにより、FPマイクロコートを高速に生成し
て、基本ベクトル演算の多くを取り入れることができる
。 上述したように、レジスタ格納演算指定子はマイクロコ
ード演算コマンドを補強するために使用できる。これに
より、ある計算タイプのカテゴリ内の個々のルーチンす
べてを、1つのルーチンとして書くことができる。その
場合は、制御プロセッサ・モジュール110は計算タイ
プを指定するために演itレジスタをロー1〜しなり旧
はならない。 短縮マイクロコート・ 上述したシステトは短縮マイクロコードを使用する機能
を備えているのて、レジスタに格納されている演算指定
子をマイクロコード命令の残り部分と結合することかで
きる。これは実際には、本好適実施例では、上述したよ
うにFPモジコ、−ル130て使用されている。 この種の短縮マイクロコートは多重プロセッサ・システ
ムの数値処理部分で使用すると、特に利点が得られる。 その場合には、演算指定子短縮マイクロコードを使用す
ると、演算をオーバレイさせる必要がなくなる。 従って、例えば、2つの配列を3個目の配列上にマツピ
ングする演算の場合(例: Ci−八i + Bi)に
は、命令レジスタに演算指定子(例:”ADD”)をロ
ー1へしてから、この種の演算列を開始させることかで
きる。この演算列は、演算を直接に指定しなかったコー
ドで記述されることになる。 従って、この機能を実時間拡張マイクロコードて使用す
ると、多重プロセッサ・システムにおt、−する2つの
マイクロロー1〜・プロセッサ間のインタフェースにさ
らに高度の柔軟性をもたゼることかてきる。 また、命令を数値処理部分にロー1〜するとき要求され
るパン1〜幅を単純化することも可能になる。従って、
アルゴリズム切替えやタスクの再分割がもりと効率よく
なる。 マルチウェイ分岐 第3八図および第3B図を参照して上述したように、本
発明はマイクロコード・システムのマルチウェイ分岐に
全く新しい機能をもたせている。第30図は、本好適実
施例においてアドレス境界の制約のないマルチウェイ分
岐を可能にするマイクロコート操作を示した概略図であ
る。 上述したように、本発明はマルチウェイ分岐をアドレス
境界の制約なしで行なうマイクロコート・コンピュータ
・システムのアーキテクチャを1是供するものである。 さらに、代替宛先間の増分を可変にしている。相対アド
レス指定機能をもつシケンザか使用されている。 本好適実施例では、プログラム・カウンタがジャンプ宛
先の人力として使用されている。これはマルチウェイ分
岐を取り入れて、ベース宛先アドレスか異なるソースか
ら求められる多くの公知システムとは異なるものである
。 離散フーリエ変換実装(Implementation
)第31図は、新規な方法で実現した離散フーリエ変換
の主要機能のいくつかを示す概略図である。 この例では、実現しようとする変換は高速フーリエ変換
(FFT)である。 図示の例は16点基数2複素数FFTである。勿論実世
界のFFTはより多くのデータ点を使用して実現されて
いるが、この例では、いくつかの重要な点を示している
。n点FFTには、 1.og 2nステージが必要で
あるので、1024点FFTには10ステージが必要に
なる。各ステージでは、n/2バタフライ計算を行なう
必要がある。 バタフライ計算は次式で与えられる。 rO−r4 + [(f6*r8)] + (r7*r
9)]rl−r5+[(f7*r8)]−(r6中r!
11]r2 −  r4 −  [(f6*r8)1 
 +  (r7+r9)]r3 −  r5 −  [
(fDr8)]  −(r6*r9)]ただし、 rOとr】は結果Cの実数部と虚数部である。 r2とr3は結果りの実数部と虚数部である。 r4とr5は人力Aの実数部と虚数部である。 r6と「7は入力Bの実数部と虚数部である。 r8とr9は係数にの実数部と虚数部である。 (角かっこ[]内の式は形式的には同じであり、大かっ
こ()内の式も形式的には同じであることに注意された
い、) 第31図は4ステージFFT演算を図式化して示してお
り、各々の円は1つのバタフライ計算を表している。各
日の左側と結ばれている線はバタフライ計算に対する複
素数入力サンプル(AとB)がどこから得たものかを示
し、右側と結ばれている線は複素数の結果(CとD)が
どこに書き出されるかを示している。円内の数は複素数
フェーズ係数”k”である。 木刀法の好適実施例では、FFTアルゴリズムは第1図
に示すようなアーキテクチャにおいて、制御プロセッサ
・モジコール110と浮動小数点プロセッサ・モジュー
ル130間で分割することによって実現されている。第
31図に示すように、アドレス割算は、特に非箔に多数
のデータ点が必要になる場合は、意味かない。制御プロ
セッサ・モジュル110はアドレス計算を実行して、バ
タフライ計算のための正しいデータ・サンプルとフェー
ズ係数の流れを作り出す。バタフライ計算は実際には浮
動小数点プロセッサ・モジュール130によって実行さ
れる。 各ステージでデータ点のいくつかに付いている陰影バー
は、この実施例で得られる新規なデータ処理を示してい
る。各ステージで示されている陰影バーは1つの中間デ
ータ転送のセットを示している。従って、例えば、プロ
セスの開始時には、人力データの8複素数語(0語)が
ロード・インされている。このデータ量だけでも、4つ
のバタフライ計算を実行するのに十分な人力となる。 (係数も与える必要かある。) 1i’r I;t”バ
ーは最初の組の4つのバタフライに対して、C語xO1
XI、X2、×3、X4、X8、X9.X10、Xll
がo−lj ・インされることを示している。4つのバ
タフライ計算か実行され、8個の0語からなる結果か転
送される。さらに、正しい組のフェーズ係数をロートす
るには、追加の転送がいくつか必要である。(最初のス
テラでは1つだののフェーズ係数が使用されているが、
異なるフェーズ係数の個数は各ステージごとに2倍にな
ることに注意されたい。従って、各組の4バタフライに
は少なくともパス144の4サイクルが必要になる。2
サイクルは8個の0語の人力を持ち込むためのものであ
り、2サイクルは0語の結果を再移動するためのもので
ある。(さらに、係数を転送するために5番目の主サイ
クルが必要になる。) 8個の0語は512ビツト、つまり、16個のF語に相
当するので、これは意味のあるデータ・ブロックとなる
。しかし、この方法は本好適実施例で提供される高バン
ド幅を利用できるという利点がある。 ざらに、データをこのサイズのブロック単位で転送する
と、同期点で使用されるCP/FPハンi・シェイキン
グ・ロジックにとって好都合であることが実証されてい
る。 従って、FFTは次の2つの部分に分割されている。 制御プロセッサ・千ジュール110は複素数データのア
ドレスとテーブル・シーケンス内のフェーズ係数位置を
、ステージとバタフライ数を関数として計算するソフト
ウェアを実行させる。アドレスが計算されると、制御プ
ロセッサ・モジュールで稼動中のプロセスは浮動小数点
プロセッサ・モジュール130に送り込まれるデータの
転送も制御する。浮動小数点プロセッサ・モジュール1
30がバタフライ計算を完了すると(そして同期点にあ
ることを示すようにフラグをセットすると)、制御プロ
セッサ・モジュール110は結果を読み取って、それを
保管する。制御プロセッサ・モジュール110はバタフ
ライ泪算が行なわれていることを知らない。同期点て浮
動小数点ブロセツヅ・十ジュール130とデータをやり
とりするノごりである。 FP干ジュール130は、式が上で定義したようにコー
ディングされている単純なリニア命令列によってバタフ
ライを計算するソフトウェアを実行する。このルーチン
は正しい人力データと係数を得るために必要な複雑なア
ドレス計算を知らなくてもよい。従って、このルーチン
はCPモジュール110で稼動するソフ]・ウェアから
完全に切り陣して書くことができる。 この分割が利点としてもつ特徴は、各ステージのFPプ
ロシージャが最後の2つのステージまでそっくり同しに
できることである。(最後の2ステージで実行されるバ
タフライ計算はより密に結合した0語人力を使用するの
で、ある種の中間結果を、レジスタ430に保持されて
いるデータとしてFP内で前送りできる。) この例は、プロセッサ間を独立にできることも示してい
る。FPモジュール130によって実行されるプロシー
シャは非凡に単純に定義されているので、浮動小数点ブ
ロセッザ・モジコール130が異なる割算機構チップ・
セット上に再設用された場合は、この単純なバタフライ
・ルーチンた番プな変更すれはよいことになる。このこ
とは再アセンブルする場合も同しである。 CPとFPのソフトウェアの実行は並列に行なわれ、ア
ルゴリズムが実行される速度が最も遅い部分て決まるよ
うにパイプライン化されている。 FP命令列はこのバタフライ計算を実行するに当たり、
FFTにおける最後の2つのバタフライを除くすべてに
ついて同しままである。従って、例えは、1024点の
複素数FFTては、FPモジュールは最初の8ステージ
の割算を行なうために、同じ命令列512を実行するこ
とになる。そのあと、FFTが最後の2ステージに対し
て異なる命令列の実行を開始する。 多重FPモジュールイ」きFFT もう1つの特に魅力のある構成は、4個のFP干ジュー
ル130を備えた第10図に示すようなシステムである
。 性能に影響を与える主要要因は、バタフライ;11算時
間と「バタフライ・カルキコ、レータJ (例えば、F
Pモジュール130)に対するデータ転送ハン1〜幅の
2つがある。得られる性能はこれらのパラメータのどち
らが満足されなかったかによって決まる。以下の計算例
はIK複素数FFT、基数2に関するものである。 バタフライ計算スルーブツト 基数2のFFTバタフライ計算式は、部分結果が再使用
可能であるとき10回の演算(4回の乗算と6回の加算
/減算)からなっている。第1図(または第1θ図)に
示すようなシステムでは、この計算は、式がALUと乗
算機構を並列に使用することに役立たないので、10サ
イクルを要する。42nsサイクル時間を使用すると、
バタフライ計算には420nsが必要になる。実際のサ
イクル時間は6回のALU演算では52ns、4回の乗
算では42ns (総語330ns )を必要とするが
、同期化、バイブライン始動、などのオーバヘッドを含
めると、400nsになる。従って、Fl”モジュール
は40 D n sてバタフライを演算することかでき
る。 転送ハン]・幅 各基数2のバタフライ割算には、2個の複素数サンプル
と複素数係数(または反復係数)が必要である。この割
算からは、2個の複素数結果が得られる。総泪では、5
個の複素数または10個の浮動小数煮詰をバタフライご
とにデータ・キャッシュ・メモリ1110とF P 1
1の間で転送する必要がある。キャッシュ・メモリのバ
ンド幅は毎秒320MBつまり、80M浮動小数点語で
ある。このデータ速度は8個の連続する語が1つのメモ
リ・サイクル(100ns )で転送できるときだけ達
成される。しかし、FFTを実行させるときは、これは
常に可能である。メモリのバンド幅を最も効率よく使用
する方法は、メモリ・サイクル当たりに4バタフライの
データを転送することである。従って、4回のバタフラ
イ割算には5回のメ干す転送サイクルか必要になる。 1に複素数FFT(基数2)は5120個のバタフライ
からなっている。このFFTにヌ4してデータ転送速度
て許容される最小時間は、従って、(5120/’ll
÷5÷100ns−640マイクロ秒によって与えられ
る。 しかし、このスルーグツ1〜見積値は、最後の2ステー
ジの効果を考慮に入れると、修正する必要がある。ステ
ージロー2で4個のバタフライ割算の組から得た結果の
各データ・セット(8個の0語)は、中間結果をメモリ
に戻さなくても、ステジn−2の4バタフライとステー
ジn+1の4バタフライを計算するのに十分である。し
かし、追加の組の係数が第2ステージで必要になる。こ
の正味の結果は6メモリ・サイクルだけで8バタフライ
を計算することができる。(この手法は1.。 RabinerとB、Gold共著[デジタル信号処理
の理論と応用」のp、577〜p599 に詳しく説明
されている。) 1に複素数FFT(基数2)は5120個のバタフライ
からなるので、この2ステージFFTアルゴリズムでデ
ータ転送速度によって規制される最小時間は次の通りで
ある。 (5120/8) *6+l00ns=384マイクロ
秒この時間は見積転送時間である400マイクロ秒以下
である。従フ゛C1使用可能なメモリのバンド幅は4つ
のFP千ジュールを組として一緒に稼動させるのに適し
ており、400マイクロ秒でFFTが達成される。 必要どされるハント幅を更に減少するために使用できる
手法は次のようにいくつかある。 (1)あるステージ内で使用される異なる係数の個数は
変化する。例えば、ステージ1はすべてのバタフライで
1つの係数値を使用し、ステージ2は2係数を使用し、
ステージ3は4係数を使用しく以下同じ)、ステージ1
0は512係数を使用する。 それより前のステージでは、ステージの開始時に(すべ
てのバタフライででなく)係数を初期設定するので、メ
モリ幅が大幅に節約される。 (2)4つのFFTが並列に実行される場合は(その結
果、1つの高速化サブシステムにおける4つのFPモジ
ュール130の各々は、1つのFFTの1/4ではなく
個々の1ント1を割算するために使用される)、係数を
4つのFPずへてに同報通信することかできる。これに
より、転送の係数部分て使用されるメモリのバント幅が
節約される。 (3)2ステージ・バタフライ割算は3または4ステー
ジに拡張することが可能であるが、制約要因として、新
しいデータ、現在のデータ、および中間記憶域を保存す
るFPのレジスタ・ファイルのサイズがある。例えば、
4ステージ・アルゴリズムには16個のサンプルと8個
の係数が必要であり、32回のバタフライ計算後16個
の結果が得られる。 この結果、比率は32バタフライ当たりlOメそり・サ
イクルとなり、キャッシュ・メモリのバンド幅で160
マイクロ秒ごとにFFT計算をサポートできる。 これらの考え方はすべて、必要ならば基数4または基数
8のFFTで採用可能である。実際には、広幅キャッシ
ュ・バス・アーキテクチャは基数がもっと大きいアルゴ
リズムで採用すると特に利点が得られる。 さらに?1目すべきことは、バタフライ定義とステージ
の関係が異なるどしても、他の整数変換も同し方法で複
数のバタフライ計算ステージに分割することかてぎるこ
とである。従って、データ操作に関して」二連した事柄
は他の離散整数変換にも応用が可能である。 ヒストグラム・アルゴリズム実装 第32図は第16図に示すようなハードウェアでヒスト
グラム・アルゴリズムを実行させる方法を示したもので
ある。 第16図に示すように、数値プロセッサ・サブシステム
の割算部分におけるデータ通路は乗算機構440と加算
機構450だけでなく、データ通路のこの部分と密結合
しているスクラッチパッド・メモリ1510も含んでい
ることが好ましい。(このメモリはアドレス・ロジック
1611を備えている。)このスクラッチバット・メモ
リ1611があると、モジュール110はアドレスを計
算して、データを局所的に取り出すことができる。この
メモリ161Oがない場合は、FPモジュール130は
CPモジュール+10にアドレスを与える必要かあり、
(:1)モジ;lル110の方は参照機能を実行して、
その結果を1・1)モジュール130に返してやる必要
かある。このためには、追加のハンドシエイキングが必
要になるので、効率が非常に低下することになる。従っ
て、この小規模のデータ通路部分のアーキテクチャを、
上述したように数値処理モジュールとのインタフェース
で使用される大規模のデータ処理アキテクヂャと協働さ
せると、利点が得られる。 本好適実施例では、スクラッチバット・メモリ1610
は3通りの使い方が可能である。超関数の計算などのア
ルゴリズムの場合にテーブル・メモリとして使用する方
法、局所スタックとして使用する方法、結果を収集する
ためにヒストグラム・アルゴリズムで使用する方法であ
る。 このスクラッチパッド・メモリをスタックとして使用で
きることは、サブシステムの計算部分の縁にあるデータ
・インタフェースをアーキテクチャ全体にとって非常に
有利な方法で定義でき、そのインタフェースにあるレジ
スタ・ファイルにスタックとして使用できる機能をもた
ゼる必要かなくなるのて、昇路に有利である。 共通高木!lL言語(FORTRANなど)で書いたル
ヂンをマイクロロー1−にコンパイルすることは、マイ
クロコート・プログラムを生成する重要な手段である。 ヘクトル演算を効率のよいマイクロコードにコンパイル
することは比較的容易である。 しかし、スカシ演算もかなりの部分が常にあるので、こ
れらをコンパイルすることは非常に厄介である。 スカシ・ルーチンをマイクロコードにコンパイルする作
業は、スタック・ベースのアーキテクチャが仮想計算機
として使用できる場合には特に行ないやすいことが明ら
かにされている。(従来のこれを行なうには、逆ボーラ
ンド・ロジックに変換する必要がある。) このスクラッチパッド・メモリを使用して結果を累積す
ることは、ヒストグラム・アルゴリズムにとっては好都
合である。ヒストグラム・アルゴリズムを実行させるど
ぎば、ヒストグラム・データをテーブル・メモリに累積
することかでとる。 これにより、データ・キャッシュ・ハスへの】′クセス
・ロートを追加することから避りられる。 密結合局所メモリを使用してヒストグラム・データを収
集することは、画像処理アルゴリズムで特に利点がある
。多くの公知画像処理アルゴリズムはヒストグラム計算
を使用しているか、大量のデータを扱う必要があるので
、キャッシュのバント幅に対する需要が非常に大きくな
る。本発明によれば、ヒストグラム・アルゴリズムを効
率よく使用することが可能になる。 第32図は、多数の画像処理問題に応用できる比較的代
表的なヒストグラム・プロシージャの簡単な例を示した
ものである。同図から明らかなように、ヒストグラム・
テーブルはこのプロシージャの内側ループが繰り返えさ
れるたびにアクセスされる。従って、ヒストグラム・テ
ーブル用に密結合記憶域を用意すると、この種のプロシ
ージャで要求されるバンド幅を大幅に節約することがで
きる。 フレビュー・モー1−のパイプライン方式アルゴリズム 本明細書に記載されている重要な開示事項は、プレビュ
ー・モートでソフトウェア制御の2重バッファを使用し
てバイブライン方式アルゴリズムを実行させて、同期点
を通過する平均スルーブツトを維持する方法である。 第33図は第20図に示すようなソフトウェア制御2重
バッファを備えたへ−1−ウェアでパイプライン方式ア
ルゴリズムを実行させる方法を示したものである。 上述したように、ソフトウェア制御の2重バッファを使
用すると、高速計算機構と高度の制御間のクロック境界
を越えるときに非常に好都合である。しかし、注目すべ
きことは、ソフトウェア制御の2重バッファの利点を広
範囲にわたるバイブライン方式のアルゴリズムにも生か
すことができることである。 2重バッファリング用の好ましいサブシステムはソフト
ウェアて分割された2重ボート・メモリを使用している
ので、メモリの上半分を一方のプロセッサに割り振り、
下半分を他方のブロセソザに割り振ることができる。(
この割振りは良友(Dプロセッサが切替え準備状態にあ
ることを示すそれぞれのフラグをセットすると、切り替
えられる。) このメモリをアクセスすると、追加ピッI〜はそのアク
セスに「物理」、「論理」または「プレビュー」のタグ
を付ける。物理アクセスは全メモリ内のリテラル・アク
セスと解釈され、2重バッファリングは無視される。論
理アクセスは2重バッフアイリング切替え状態によって
判断される追加アドレス・ビットによって補充されてい
る。 プレビュー・アクセスは読取りだけに使用され論理アク
セスでアクセスされる側とはi z=+ (7)メモリ
・バンクに移る。プレビュー・アクセスを使用すると、
パイプライン方式アルゴリズムにおける同期点でのデー
タ流れの非効率が避けられるので非常に有利である。 例えば、標準2重バッファリング方式が第1図に示すよ
う/Jシスデムで使用される場合は、スワップを行なう
たひに、そねか空になる前にデータ・パイプラインを再
ひ一杯にする必要かある。この実施例ては、ヅンブルの
ベクトル演算は浮動小数点プロセッサか各バッファ分の
データに対して8回の割算を行なう必要かある。このこ
とは、3サイクル分のオーバヘットか使用されて、8語
のデータことにバイブラインを一杯にし、空にすること
を意味する。その結果、全体の平均処理時間に付加され
る割合か高くなることは明らかである。 本明細書に記載されている新規事項の1つは、「ソフト
」2重バッファリングを使用してこの問題を解決したこ
とである。プレビュー・モードを使用すると、一方のボ
ートが他方の半分側にあるデータを調へてから、それを
交換することができる。このモー1〜によると、制御プ
ロセッサがその作業を終えて、続行前にバッファ交換を
待っているとき、浮動小数点プロセッサのバイブライン
を常に一杯にしておくことができる。 2重バッファリングは、多重プロセッサ・システムにお
いて数値プロセッサと大容量−” v ・ンシコ・メモ
リ間のインタフェースにあるレジスタ・ファイルで使用
するのか好ましい。レジスタ・ファイルを分割すると、
キャッシュ・メモリ140てブタ衝突が起こるのを回避
できる。 この実施例では、5ボート付きレジスタ・ファイル43
0が2重バッファのメモリとなるように使用されている
。しかし、他の実現方法の使用も可能である。 本発明によれば、ハードウェアで2重バッファリングを
行なう従来のシステムよりも柔軟性に冨んだシステムが
速度を損なうことなく得られる。 特に、「プレビュー」モードを使用すると、この2重バ
ッファリングを取り入れたシステムを多数のパイプライ
ン環境で汎用インタフェース・アーキテクチャとして使
用することができる。 性11■宏」丙 性能最大化の基本的制約要因となるものを挙げると、次
の6つがある。 人出カバン1−幅(これは本好適実施例ては40M1l
/秒になっている)。 データ・キャッシュ・メモリ・ハント幅(これは本好適
実施例ては320MB/秒に12っている)。 浮動小数点プロセッサ・モジュール130の保持レジス
タとレジスタ・ファイル間のデータ転送速度。これは現
在はデータ・キャッシュ・メモリ・パン1〜幅以下にな
っている。 アドレス計算速度(これは本好適実施例では、毎秒10
0万回が代表例であるが、実行されるアルゴリズムに非
常に左右されやすい)。 持続浮動小数点引算速度。本好適実施例では、単精度「
加算」の場合、これは28nsサイクル時間以下である
(より高速の構成要素が利用可能になれば、向上の余地
がある)。単精度乗算の場合は42nsサイクル時間以
下である。 並列に使用される数値処理モジュールの数。 性能の評価 特定のアルゴリズムでその性能を決める要因は以下に挙
げる条件のどれが該当するかによって非常に左右される
。 ソース・データと結果かとこに保管されるか性能はデー
タがデータ・キャッシュ・メモリに保管されるとき最大
化される。データかオフホードに保管される場合は、デ
ータ入出力転送が制約要因となる可能性が大きい。達成
可能な入出力速度は通常、関与する周辺装置とサボー1
−される転送の種類(単一かブロックか)によって決ま
る。入出力速度が毎秒40MBであると、割算速度は3
個の数がすべての計算に関係するような計算では、3.
3MF1.OPSまでである。 データと算術演算との比率:浮動小数点計算速度または
データ転送速度がホトルネックとなるかどうかは、これ
によって決まる。計算量の割にデータが少ないアルゴリ
ズム(例: FFT )は浮動小数点プロセッサ・千ジ
ュール130の速度が制約要因となる。データ転送に制
限されるアルゴリズムの例としては、1回の算術演算に
3個のデータ値を必要とするベクトル加算がある。 データ・キャッシュ・メモリ内のデータのレイ)−′つ
]・ データ・A−ヤノシコ ノ干りと7Y動小数、壱
ブロセソザ・モジュール130間の最大転送速度か得ら
れるのは、8個の連続するF語(つまり、各々が32ヒ
ツトからなる浮動小数煮詰)が−緒に転送されるときた
りである。あるアルゴリズムでのデータかこのブロック
転送機能を利用できない場合は、正味データ転送速度は
低下することになる。これを表にまとめると、次の通り
である。 F話の個数   転送速度 8     80 MF詰/秒 大部分のアルゴリズムはより高速の転送速度を利用する
ことができる(実際には、FFTでさえも上述したよう
に高速の転送速度を利用できる)。 操作の並行・これにより、オフボート人出力転送を浮動
小数点割算と並行に行なうことができる。アルゴリズム
(またはアルゴリズムの列)がこの機能を使用できる場
合は、入出力転送速度が相対的に近くても、全体の割算
速度は1.)ニ臂を受i−Iることはない。 複数のFP  アルコリズムか割算ハウンI〜(束縛)
であり、メモリや人出力のパン1−幅に制限されないと
きは、FPを複数にすると、メモリ・ハント幅を越えな
い限り、1つの浮動小数点ブロモ・ンサ・モジュール1
30の性能は倍になる。例えは、FPが4つのとぎは、
ヘクi・ル加算性能は向上しないが、FFTは4倍の速
度で割算される。 以上説明したことから理解されるように、本明細書中に
開示した新規事項は広範囲にわたって応用することがで
きると共に、広範囲にわたって改良または変形が可能で
ある。従って、特許請求の範囲に記載された内容は上述
した各種実施例に制約されるものではなく、またこれら
の実施例に関する記載に制約されるものでもなく、特許
請求の範囲に明確化された請求事項のみに制約されるも
のである。 4.1メ1面のis車な説明 第1図は新規の3プロセッサ・アーキテクチャをもつ数
値高速化サブシステムの概要を示すブロック図である。 第2八図は本発明の好適実施例におりる制御プロセッサ
・モジュール110のいくつかの主要部分の構成を示す
ブロック図てあり、第2B図は本発明の好適実施例にお
りる制御プロセッサ・モジュール110で使用されてい
るマイクロ命令形式のフィールド割振りを示す概略図で
ある。 第3八図は本発明の好適実施例におけるデータ転送プロ
セッサ・モジュールのいくつかの主要部分の構成を示す
ブロック図であり、第3B図はデータ転送プロセッサ・
モジュールにおいて定数アドレスを選択的に駆動してシ
ーケンサ・バス315上に送出するために使用されるロ
ジックの詳細を示すブロック図であり、第3C図は本発
明の好適実施例におけるデータ転送プロセッサ・モジュ
ール120で使用されているマイクロ命令形式のフィー
ルド割振りを示す概略図である。 第4八、 N1.110おj;び4D図は本発明の好適
実hλ例において浮動小砂点プロセッサとして使用され
る数値処理モジュール130のいくつかの主要部分の構
成を示す図であり、第4八図は制御プロセッサ・モジュ
ール110とのインタフェースのいくつかの主要部分を
示すブロック図、第4B図は本発明の好適実施例におけ
る浮動小数点プロセッサ内のデータ通路のいくつかの主
要部分を示すブロック図、第4C図は本発明の好適実施
例における浮動小数点プロセッサ内の制御ロジックのい
くつかの主要部分を示すブロック図、第4D図は本発明
の好適実施例における数値プロセッサ・千ジュール13
0に使用されているマイクロ命令形式のフィールド割振
りを示す概略図である。 第5図は本発明の好適実施例におけるデータ・キャッシ
ュ・メモリのいくつかの主要部分の構成を示すブロック
図である。 第6図は本発明の好適実施例におけるホスト・インタフ
ェース・ロジックの構成を示すブロック図である。 第7図は本発明の好適実施例におりるデータ・バイブ・
インタフェース・ロジックの41か成を示すブロック図
である。 第8図は本発明の好適実施例におけるGIPインタフェ
ース・ロジックの構成を示すブロック図である。 第9八図はアブイケーション向き数値処理モジュル(「
アルゴリズム高速化機構J ) +3o゛を含む数値高
速化ザブシステムの概要図であり、第9B図はアルゴリ
ズム高速化機構+30°のアーキテクチャか汎用浮動小
数点モジュール130のそれとどのような違いかあるか
を示す概略図である。 第10図は複数の数値プロセッシング・サブ・サブシス
テムを含むザブシステムを示すブロック図である。 第11図は本発明の好適実施例における制御プロセッサ
・モジュール(どデータ転送プロセッサ)の一部である
整数プロセッサ機構(ユニット)のいくつかの主要部分
の構成を示すブロック図てあ第12図は本発明の好適実
施例におりる制御プロセッサの一部であるアドレス生成
機構のいくつかの主要部分を示すブロック図である。 第13図は本発明の好適実施例におりる制御プロセッサ
(とデータ転送プロセッサ)の一部であるシーケンサの
いくつかの主要部分の構成を示すブロック図である。 第14A図は16ヒツト・アドレス生成機構(または他
の低解像度ヅブブロセッヅ)が32ピツ1〜・システム
で使用されるようにするために、本発明の好適°実施例
で使用されているハードウェアを示す概略図であり、第
14B図は低解像度データ・ソースを高速システムて使
用するために、本発明の好適実施例で使用されているハ
ードウェアの各種動作モードで使用される入力を示す表
口である。 第15図は本発明の好適実施例における制御プロセッサ
・モジュールとデータ転送プロセッサ・千ジュール間の
インタフェースを示す概略図てあ第16図は本発明の好
適実施例におりる浮動小数点ブロセソザ内の数値7i1
算用の一部データ通路のいくつかの主要部分の構成を示
すブロック図である。 第17図は非レジスタ格納マイクロコート・ピッI・の
セラ1−アップ時間を短縮するために、本発明の好適実
施例において浮動小数点プロセッサ内で使用さねるロジ
ックを示すブロック図である。 第18図は慣例の二重バッファのハードウェア構成およ
び制御の形態を示すブロック図である。 第19図は外部で制御されるピッ1〜の1つで2重ボー
ト・レジスタ・ファイルが使用される別の公知2重バッ
ファリング手法を示すブロック図である。 第20図は本発明の好適実施例の新規2重バッファリン
グがどのように構成され、どのようにラフ1〜ウエアで
制御されて、複数の任意選択アクセス・干−1〜か得ら
れるかを示す概略図である。 第21図は256 ビット幅のキャッシュ・バスとのイ
ンタフェースとなる保持レジスタと64ヒツト幅である
レジスタ・ファイル間をクロック視界にJたかって行な
われるデータ転送のために、本発明の好適実施例て使用
されるロジックを示す概略図である。 第22図はcpモジュール110 とFPモジュール1
30間をインタフェースで結ぶために、本発明の好適実
施例で使用されるハントシェイキング・ロジックの状態
図である。 第23図は第9図または第10図に示すようなシステム
において複数のFPまたは複数のアルゴリズム高速化機
構(またはその両方)から1つを選択するために、本発
明の好適実施例で使用される制御定義を示す概略図であ
る。 第24.25および26図はキャッシュ・メ干りどのデ
ータ・インタフェースのアーキテクチャを示すブロック
図である。 第27図は複数の装置の書込み可能制御記憶機構とのイ
ンタフェースとなる直列ループにおいてマイクロコート
の転送とローディングの制御を効率化するために、本発
明の好適実施例で使用されるバー1−ウェア構成を示す
概略図である。 第28図は複数のプロセッサのいずれかに、あるいはあ
る特定のプロセッサ群にマイクロロー1〜をロー1−す
ることを可能にするために、本発明の好適実施例で使用
される直列ループ構成を示す概略図である。 第29図は多重プロセッサ・システムにおける数値プロ
セッサの制御記憶機構に直列にまたは並列に書き込むこ
とを可能にするために、本発明の好適実施例で使用され
るロジックを示す概略図である。 第30図はアI・レス境界の制約なしでマルチウェイ分
岐を可能にするために、本発明の好適実施例で使用され
るマイクロコード動作を示す概略図である。 第31図はI!!11散フーリエ変換アルゴリズムを実
行させる方法を示す概略図である。 第32図は第16図に示すようなハードウェアでヒスト
グラム・アルゴリズムを実行させる方法を示すフローチ
ャートである。 第33図は第20図に示したようなラフ1−ウェア制御
2重バッファを含むハードウェアてハイブライン・アル
ゴリズムを実行させる方法を示すフロチャートである。 第34.35.36および37図は、そねぞれか第7図
に示すようなデータ・バイブ・インタフェースを備えて
いる第1図に示すような複数のサブシステムの構成を示
す概略図である。 第38八図は主ホードの好ましい物理的レイアウトを示
す配置図であり、第38B図は第38八図の主ボード上
にネストされた子ボードの好ましい物理的レイアウトを
示す配置図であり、第38B図のボドはFPモジュール
130の主要構成要素が搭載されており、これらの2ボ
ートが一緒になって、第1図に示すような完全なシステ
ムが得られることを示している。 第39図は浮動小数点プロセッサ・モジローール内のス
タック・レジスタの好適実施例を示すブロック図である
。 第40八図は制御プロセッサ・干ジコ、−ル11口(ど
データ転送モジュール120)内のシーケンサと共に本
発明の好適実施例で使用される一部の支援ロジックを示
すブロック図であり、第400図はマルチウェイ分岐操
作時に割込みを引き起こすマイクロ命令列を示す概略図
である。 第41図はボス1〜・コンピュータと、画像処理サブシ
ステムと、少なくとも2つの数値高速化サブシステムと
を備え、これらが主ハスと2つの高パン]・幅ハックレ
ーン・バスで結ばれているコンピュータ・システムを示
す概略図である。 第42図は第1図に示すようなシステムにおいて2つの
配列を一緒に(要素単位で)乗算し、その結果を第3の
配列に格納するステップの流れを示すフローチャートで
ある。 第43図は1つまたは2つ以上の数値処理モジュールと
同し広幅データ・バス上に高速キャッシュ・メモリを備
えたサンプル・システムを示すブロック図である。 第44A、 44Bおよび44C図はCP、DTP、お
よびFPのそれぞれのプログラミング環境を示す概略図
である。 第45図は制御記憶機構から取り出したマイクロコート
のフィール]・に命令レジスタの内容を代入するロジッ
クを示すブロック図である。 第46図は語アドレスの偶数/奇数構造か缶詰転送操作
からどのようにして得られるかを示す説明図である。 第47図は語アドレスの偶数/奇数構造か伯語転送操作
から得るとき使用されるタイミング構成を示す信号波形
図である。 CD八へス112 手続補正書 (方式) %式% 1、事件の表示 特願平1−69401号 2、発明の名称 コンピュータ・システム 3゜ 補正をする者 事件との関係  特許出願人 デュポン ピクセル システムズ リミテッド 代 理 人 〒107 東京都港区赤坂5丁目1番31号 第6セイコービル 3階 平成1年6月12日(全送日:平成1年7月4日)6、
補正の対象 願書、委任状および図面 7、補正の内容 (1)願書の「4.特許出願人」の欄を訂正する。 (2)委任状を追補する。 (3)図面の第31図を浄書し第22図、第38A図お
よび第38B図を訂正する。(内容に変更なし)

Claims (1)

  1. 【特許請求の範囲】 1)独立の各命令ストリームを個別に実行するように接
    続された第1および第2プロセッサと、前記第1および
    第2プロセッサの双方の命令ストリームを監視して、共
    用クロック信号を発生するように接続されたクロック発
    生器とを具え、前記共用クロック信号は、前記第1およ
    び第2プロセッサの双方をクロックするように接続され
    、および前記第1プロセッサにより実行中の命令に対し
    て前記第1プロセッサによって要求される継続時間と、
    前記第2プロセッサにより実行中の命令に対して前記第
    2プロセッサによって要求される継続時間との双方のう
    ちで長い方の継続時間に等しい可変継続時間を有するこ
    とを特徴とするコンピュータ・システム。 2)前記クロック発生器により、前記第1および第2プ
    ロセッサにより実行中の命令の各ストリームの双方を監
    視するようにしたことを特徴とする請求項1記載のコン
    ピュータ・システム。 3)外部インタフェース・バスに接続可能な外部インタ
    フェース・コントローラと、 制御プロセッサと、 個別の各命令ストリームを実行するように前記制御プロ
    セッサと同時に動作可能であつて、前記外部インタフェ
    ース・コントローラを制御するように接続されたデータ
    転送プロセッサと、 前記制御プロセッサおよび前記データ転送プロセッサと
    同時に、かつ非同期で動作可能な数値プロセッサであっ
    て、該数値プロセッサの全体の制御の下で各命令シーケ
    ンスを実行する数値プロセッサと、 前記制御プロセッサおよび前記データ転送プロセッサを
    クロックするように接続された共用クロック回路であっ
    て、該クロック回路は、前記制御プロセッサによって実
    行中の命令および前記データ転送プロセッサによって実
    行中の命令に依存する可変継続時間を有することを特徴
    とするコンピュータ・システム。 4)前記共用クロック回路は、前記データ転送プロセッ
    サによって実行中の前記命令の各ストリームおよび前記
    制御プロセッサによって実行中の前記命令の各ストリー
    ムの双方を監視するクロック発生器を有することを特徴
    とする請求項3記載のコンピュータ・システム。 5)前記共用クロック回路は、前記第1プロセッサによ
    り実行中の命令に対して前記第1プロセッサによって要
    求される継続時間と、前記第2プロセッサにより実行中
    の命令に対して前記第2プロセッサによって要求される
    継続時間との双方のうちで長い方の継続時間に等しい可
    変継続時間を有することを特徴とする請求項3記載のコ
    ンピュータ・システム。 6)高速度算術演算機構と、 制御ストアメモリと、 前記制御ストアメモリから命令をフェッチして、前記演
    算ユニットにコマンドを与えるように接続されたシーケ
    ンシング・ロジックと、 半導体集積回路として構成され、前記制御ストアメモリ
    からフェッチ中の特定の命令に応じて、前記算術演算ユ
    ニットに長さ可変のクロック信号を供給するように接続
    されたクロック発生器とを具え、 前記算術演算ユニットのうちの少なくともいくつかの内
    部部分を、前記クロック発生器の前記集積回路のゲート
    遅れよりも(一般に比較し得る寸法において)4倍大き
    い最小ゲート遅れをもつ半導体技術を用いて構成したこ
    とを特徴とするコンピュータ・システム。 7)前記シーケンシング・ロジックを、前記クロック発
    生器の前記集積回路のゲート遅れよりも(一般に比較し
    得る寸法において)4倍大きい最小ゲート遅れをもつ半
    導体技術を用いて構成したことを特徴とする請求項6記
    載のコンピュータ・システム。
JP1069401A 1988-03-23 1989-03-23 コンピュータ・システム Pending JPH02146668A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB8806866 1988-03-23
GB8806862A GB2217062A (en) 1988-03-23 1988-03-23 Numeric processor with smart clock
GB8806866A GB2215881A (en) 1988-03-23 1988-03-23 Shared variable clock system
GB8806862 1988-03-23

Publications (1)

Publication Number Publication Date
JPH02146668A true JPH02146668A (ja) 1990-06-05

Family

ID=26293676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1069401A Pending JPH02146668A (ja) 1988-03-23 1989-03-23 コンピュータ・システム

Country Status (4)

Country Link
US (1) US5428754A (ja)
EP (1) EP0340900A3 (ja)
JP (1) JPH02146668A (ja)
CA (1) CA1304509C (ja)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6253307B1 (en) * 1989-05-04 2001-06-26 Texas Instruments Incorporated Data processing device with mask and status bits for selecting a set of status conditions
US6839855B2 (en) * 1990-03-23 2005-01-04 Matsushita Electric Industrial Co., Ltd. Data processing apparatus
JP2762670B2 (ja) * 1990-03-30 1998-06-04 松下電器産業株式会社 データ処理装置
US5586332A (en) * 1993-03-24 1996-12-17 Intel Corporation Power management for low power processors through the use of auto clock-throttling
SG48805A1 (en) * 1994-02-04 1998-05-18 Intel Corp Method and apparatus for control of power consumption in a computer system
US5812792A (en) * 1994-07-22 1998-09-22 Network Peripherals, Inc. Use of video DRAM for memory storage in a local area network port of a switching hub
US5696923A (en) * 1994-12-15 1997-12-09 Texas Instruments Incorporated Graphics processor writing to shadow register at predetermined address simultaneously with writing to control register
JPH08185326A (ja) * 1994-12-28 1996-07-16 Fujitsu Ltd インタープリタ言語処理装置
ATE241170T1 (de) * 1995-10-06 2003-06-15 Patriot Scient Corp Architektur für einen risc-mikroprozessor
US5867725A (en) * 1996-03-21 1999-02-02 International Business Machines Corporation Concurrent multitasking in a uniprocessor
US5862368A (en) * 1996-12-11 1999-01-19 Dell Usa, L.P. Process to allow automatic microprocessor clock frequency detection and selection
US5794019A (en) * 1997-01-22 1998-08-11 International Business Machines Corp. Processor with free running clock with momentary synchronization to subsystem clock during data transfers
US6195746B1 (en) 1997-01-31 2001-02-27 International Business Machines Corporation Dynamically typed register architecture
US5956047A (en) * 1997-04-30 1999-09-21 Hewlett-Packard Co. ROM-based control units in a geometry accelerator for a computer graphics system
US6184902B1 (en) 1997-04-30 2001-02-06 Hewlett-Packard Company Centralized branch intelligence system and method for a geometry accelerator
US5990913A (en) * 1997-07-30 1999-11-23 Intel Corporation Method and apparatus for implementing a flush command for an accelerated graphics port device
US7272703B2 (en) * 1997-08-01 2007-09-18 Micron Technology, Inc. Program controlled embedded-DRAM-DSP architecture and methods
JPH11296381A (ja) * 1998-04-08 1999-10-29 Matsushita Electric Ind Co Ltd 仮想マシン及びコンパイラ
US6141762A (en) * 1998-08-03 2000-10-31 Nicol; Christopher J. Power reduction in a multiprocessor digital signal processor based on processor load
US6839728B2 (en) * 1998-10-09 2005-01-04 Pts Corporation Efficient complex multiplication and fast fourier transform (FFT) implementation on the manarray architecture
US6226717B1 (en) * 1999-02-04 2001-05-01 Compaq Computer Corporation System and method for exclusive access to shared storage
KR100340715B1 (ko) * 1999-10-25 2002-06-20 윤종용 개선된 테스트 능력을 가지는 반도체 테스트 장치
JP2001142928A (ja) * 1999-11-16 2001-05-25 Matsushita Electric Ind Co Ltd 半導体集積回路装置の設計方法
US7249242B2 (en) * 2002-10-28 2007-07-24 Nvidia Corporation Input pipeline registers for a node in an adaptive computing engine
US6836839B2 (en) 2001-03-22 2004-12-28 Quicksilver Technology, Inc. Adaptive integrated circuitry with heterogeneous and reconfigurable matrices of diverse and adaptive computational units having fixed, application specific computational elements
US7962716B2 (en) 2001-03-22 2011-06-14 Qst Holdings, Inc. Adaptive integrated circuitry with heterogeneous and reconfigurable matrices of diverse and adaptive computational units having fixed, application specific computational elements
US7653710B2 (en) 2002-06-25 2010-01-26 Qst Holdings, Llc. Hardware task manager
US6577678B2 (en) 2001-05-08 2003-06-10 Quicksilver Technology Method and system for reconfigurable channel coding
US8412915B2 (en) 2001-11-30 2013-04-02 Altera Corporation Apparatus, system and method for configuration of adaptive integrated circuitry having heterogeneous computational elements
US7328414B1 (en) 2003-05-13 2008-02-05 Qst Holdings, Llc Method and system for creating and programming an adaptive computing engine
US7660984B1 (en) 2003-05-13 2010-02-09 Quicksilver Technology Method and system for achieving individualized protected space in an operating system
US8108656B2 (en) 2002-08-29 2012-01-31 Qst Holdings, Llc Task definition for specifying resource requirements
FR2845497B1 (fr) * 2002-10-08 2004-12-24 Renault Sa Dispositif de simulation d'un systeme embarque dans un vehicule automobile
US20040136241A1 (en) * 2002-10-31 2004-07-15 Lockheed Martin Corporation Pipeline accelerator for improved computing architecture and related system and method
US7225301B2 (en) 2002-11-22 2007-05-29 Quicksilver Technologies External memory controller node
US7870553B2 (en) * 2003-08-28 2011-01-11 Mips Technologies, Inc. Symmetric multiprocessor operating system for execution on non-independent lightweight thread contexts
US20050050305A1 (en) * 2003-08-28 2005-03-03 Kissell Kevin D. Integrated mechanism for suspension and deallocation of computational threads of execution in a processor
US7849297B2 (en) * 2003-08-28 2010-12-07 Mips Technologies, Inc. Software emulation of directed exceptions in a multithreading processor
WO2005022381A2 (en) * 2003-08-28 2005-03-10 Mips Technologies, Inc. Integrated mechanism for suspension and deallocation of computational threads of execution in a processor
US7836450B2 (en) * 2003-08-28 2010-11-16 Mips Technologies, Inc. Symmetric multiprocessor operating system for execution on non-independent lightweight thread contexts
US7711931B2 (en) * 2003-08-28 2010-05-04 Mips Technologies, Inc. Synchronized storage providing multiple synchronization semantics
US9032404B2 (en) * 2003-08-28 2015-05-12 Mips Technologies, Inc. Preemptive multitasking employing software emulation of directed exceptions in a multithreading processor
US7418585B2 (en) * 2003-08-28 2008-08-26 Mips Technologies, Inc. Symmetric multiprocessor operating system for execution on non-independent lightweight thread contexts
US20050138233A1 (en) * 2003-12-23 2005-06-23 Intel Corporation Direct memory access control
US7536535B2 (en) * 2005-04-22 2009-05-19 Altrix Logic, Inc. Self-timed processor
US8054314B2 (en) 2005-05-27 2011-11-08 Ati Technologies, Inc. Applying non-homogeneous properties to multiple video processing units (VPUs)
US8681160B2 (en) * 2005-05-27 2014-03-25 Ati Technologies, Inc. Synchronizing multiple cards in multiple video processing unit (VPU) systems
US7613346B2 (en) 2005-05-27 2009-11-03 Ati Technologies, Inc. Compositing in multiple video processing unit (VPU) systems
US7663635B2 (en) * 2005-05-27 2010-02-16 Ati Technologies, Inc. Multiple video processor unit (VPU) memory mapping
US8212838B2 (en) * 2005-05-27 2012-07-03 Ati Technologies, Inc. Antialiasing system and method
US20060271717A1 (en) * 2005-05-27 2006-11-30 Raja Koduri Frame synchronization in multiple video processing unit (VPU) systems
US7649537B2 (en) 2005-05-27 2010-01-19 Ati Technologies, Inc. Dynamic load balancing in multiple video processing unit (VPU) systems
US7681017B2 (en) * 2005-11-01 2010-03-16 Lsi Corporation Pseudo pipeline and pseudo pipelined SDRAM controller
US20080055321A1 (en) * 2006-08-31 2008-03-06 Ati Technologies Inc. Parallel physics simulation and graphics processing
US20080182021A1 (en) * 2007-01-31 2008-07-31 Simka Harsono S Continuous ultra-thin copper film formed using a low thermal budget
US8026740B2 (en) 2008-03-21 2011-09-27 Micron Technology, Inc. Multi-level signaling for low power, short channel applications
US8259461B2 (en) * 2008-11-25 2012-09-04 Micron Technology, Inc. Apparatus for bypassing faulty connections
US8603828B2 (en) 2009-11-18 2013-12-10 Bio-Rad Laboratories, Inc. Multiplex immunoassays for hemoglobin, hemoglobin variants, and glycated forms
WO2011091323A1 (en) 2010-01-21 2011-07-28 Qst Holdings, Llc A method and apparatus for a general-purpose, multiple-core system for implementing stream-based computations
CN103548001B (zh) * 2010-12-22 2015-11-25 通用电气能源能量变换技术有限公司 隔离模块之间提供数据通信、同步和故障检测的通信架构
US8745760B2 (en) * 2012-01-30 2014-06-03 Cisco Technology, Inc. Malware classification for unknown executable files
US9323529B2 (en) 2012-07-18 2016-04-26 International Business Machines Corporation Reducing register read ports for register pairs
US9323532B2 (en) 2012-07-18 2016-04-26 International Business Machines Corporation Predicting register pairs
US9298459B2 (en) * 2012-07-18 2016-03-29 International Business Machines Corporation Managing register pairing
CN104717152B (zh) * 2013-12-17 2019-07-19 深圳市中兴微电子技术有限公司 一种实现接口缓存动态分配的方法和装置
KR102360214B1 (ko) * 2015-08-26 2022-02-08 삼성전자주식회사 실시간 공유 인터페이스를 포함하는 시스템 온 칩의 스케쥴링 방법
US10802754B2 (en) * 2018-03-12 2020-10-13 Micron Technology, Inc. Hardware-based power management integrated circuit register file write protection
US10423218B1 (en) 2018-03-12 2019-09-24 Micron Technology, Inc. Power management integrated circuit with in situ non-volatile programmability
GB2575291B (en) * 2018-07-04 2021-10-13 Graphcore Ltd Gateway to Gateway Synchronisation
CN111381882B (zh) * 2018-12-28 2022-12-02 上海寒武纪信息科技有限公司 数据处理装置及相关产品
US11086625B2 (en) * 2019-09-10 2021-08-10 Apple Inc. Compression assist instructions
CN111445545B (zh) * 2020-02-27 2023-08-18 北京大米未来科技有限公司 一种文本转贴图方法、装置、存储介质及电子设备
US20210117197A1 (en) * 2020-12-23 2021-04-22 Intel Corporation Multi-buffered register files with shared access circuits

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3623017A (en) * 1969-10-22 1971-11-23 Sperry Rand Corp Dual clocking arrangement for a digital computer
US3656123A (en) * 1970-04-16 1972-04-11 Ibm Microprogrammed processor with variable basic machine cycle lengths
US3961313A (en) * 1974-12-04 1976-06-01 International Business Machines Corporation Computer control apparatus
US4153941A (en) * 1976-11-11 1979-05-08 Kearney & Trecker Corporation Timing circuit and method for controlling the operation of cyclical devices
DE2853523C2 (de) * 1978-12-12 1981-10-01 Ibm Deutschland Gmbh, 7000 Stuttgart Dezentrale Erzeugung von Taktsteuersignalen
US4308579A (en) * 1979-02-21 1981-12-29 Pitney Bowes Inc. Multiprocessor parcel postage metering system having serial data bus
US4685614A (en) * 1980-05-27 1987-08-11 Honeywell, Inc. Analog to digital conversion employing the system clock of a microprocessor, the clock frequency varying with analog input
DE3036926C2 (de) * 1980-09-30 1984-07-26 Siemens AG, 1000 Berlin und 8000 München Verfahren und Anordnung zur Steuerung des Arbeitsablaufes in Datenverarbeitungsanlagen mit Mikroprogrammsteuerung
GB2162406B (en) * 1984-06-18 1988-03-09 Logica Computer system
US4851995A (en) * 1987-06-19 1989-07-25 International Business Machines Corporation Programmable variable-cycle clock circuit for skew-tolerant array processor architecture
US5021679A (en) * 1989-06-30 1991-06-04 Poqet Computer Corporation Power supply and oscillator for a computer system providing automatic selection of supply voltage and frequency

Also Published As

Publication number Publication date
EP0340900A2 (en) 1989-11-08
US5428754A (en) 1995-06-27
EP0340900A3 (en) 1991-05-15
CA1304509C (en) 1992-06-30

Similar Documents

Publication Publication Date Title
JPH02146668A (ja) コンピュータ・システム
JPH0235559A (ja) 二重バッファリング・サブシステム
US5056015A (en) Architectures for serial or parallel loading of writable control store
JPH02168351A (ja) 積分変換方法
US5752068A (en) Mesh parallel computer architecture apparatus and associated methods
US5606520A (en) Address generator with controllable modulo power of two addressing capability
Butts et al. A structural object programming model, architecture, chip and tools for reconfigurable computing
US5036453A (en) Master/slave sequencing processor
US6260088B1 (en) Single integrated circuit embodying a risc processor and a digital signal processor
US4745544A (en) Master/slave sequencing processor with forced I/O
JPH03500461A (ja) データ駆動式計算用のデータ流れ装置
US6532530B1 (en) Data processing system and method for performing enhanced pipelined operations on instructions for normal and specific functions
JPS5916072A (ja) デ−タ処理システム用の特殊命令処理装置
JPH0228721A (ja) プロセシング・システム
JPS6187451A (ja) ディジタルデータ通信システム
JPH0236459A (ja) プロセシング・システム
JPS59188879A (ja) デ−タプロセツサ
JPH0236420A (ja) プロセシング・システムズ
GB2217064A (en) Interfacing asynchronous processors
Ramamoorthy et al. Computer Architecture—an Introduction
GB2215883A (en) Data processing system
GB2217056A (en) Double buffering in multi-processor
JP2006515446A (ja) 関連アプリケーションを相互参照するカルテシアンコントローラを有するデータ処理システム
Frison et al. Designing specific systolic arrays with the API15C chip
GB2217059A (en) Multiprocessor system