JPH0816392A - コンピュータシステム、コンピュータシステム動作方法、及びコンピュータ命令シーケンス実行方法 - Google Patents

コンピュータシステム、コンピュータシステム動作方法、及びコンピュータ命令シーケンス実行方法

Info

Publication number
JPH0816392A
JPH0816392A JP7178175A JP17817595A JPH0816392A JP H0816392 A JPH0816392 A JP H0816392A JP 7178175 A JP7178175 A JP 7178175A JP 17817595 A JP17817595 A JP 17817595A JP H0816392 A JPH0816392 A JP H0816392A
Authority
JP
Japan
Prior art keywords
instruction
execution
instructions
string
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7178175A
Other languages
English (en)
Inventor
D May Michael
デイビッド メイ マイケル
Criag Sturges Andrew
クレイグ スタージェス アンドリュー
Mackenzie Sidwell Nathan
マッキンゼー サイドウェル ネイサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STMicroelectronics Ltd Great Britain
Original Assignee
STMicroelectronics Ltd Great Britain
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STMicroelectronics Ltd Great Britain filed Critical STMicroelectronics Ltd Great Britain
Publication of JPH0816392A publication Critical patent/JPH0816392A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3851Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)

Abstract

(57)【要約】 【目的】 コンピュータ命令の実行のためのパイプライ
ン方式演算において生じるバブルを最小にする。 【構成】 6個の命令シーケンスをパイプライン内で実
行する11サイクルの演算において、命令のシーケンス
が二つの命令ストリングをインターリーブする。第1の
ストリングは、命令1、2及び5からなり、この命令5
は、この命令が実行される前の命令1及び命令2の両方
の結果を要求する依存命令である。第2のストリングは
命令3、4及び6によって形成され、この命令6は命令
3及び命令4の実行の結果を要求する第2のストリング
内の依存命令である。二つの命令ストリングが表示され
た数値のシーケンスへインターリーブされ、結果的にバ
ブルが減少した結果が生成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はコンピュータシステムに
対する圧縮された命令に係り、より詳細には圧縮された
命令を有するコンピュータシステムを用いる方法に関す
る。
【0002】
【従来の技術】コンピュータシステムの演算速度及びハ
ードウェアに要求されるスペース及び処理能力を改良す
るため、短いビット長を有する命令を用いることは有利
である。このような命令では命令をメモリから得るのに
必要なアクセスタイムだけでなく命令をデコード(解
読)する速さ及び容易さも改良されている。さらに、速
さの利点は、一連のコンピュータ命令に対する処理シー
ケンスの間の冗長な演算を回避することにある。命令の
シーケンス(列)を実行する時の公知の技術は、パイプ
ライン方式の演算を用いることであり、このパイプライ
ン方式の演算において、実行パイプラインは幾つかの命
令がパイプライン内で同時に処理されるように一連の段
階(ステージ)を有している。パイプラインの一つの段
が一つの命令への実行プロセスの部分を実行している
間、このプロセスの他の部分は異なる命令への実行の異
なる段を処理している。しかしながら、実行への命令ス
トリングが一つ以上の従属命令を含むときには問題が生
じる。従属命令とは、命令が実行され得る前にこのスト
リング内の先行命令を実行した結果を要求する命令のこ
とである。従属命令は、それが、結果を要求する命令に
対してあまりにも近い直後にあるパイプライン内に位置
している場合、この従属命令が実行される前に、初期の
(早い)命令の結果を待機している間にパイプライン内
に遅延又はバブルが発生することがある。
【0003】
【発明が解決しようとする課題】本発明の目的は、高速
パイプライン方式演算を可能とするコンピュータシステ
ム、及びコンピュータシステムを動作する方法を提供す
る。
【0004】本発明の他の目的は、コンピュータ命令の
実行のためのこのようなパイプライン方式の演算におい
て発生し得るバブルを最小限にすることにある。
【0005】本発明の他の目的は、短い又は圧縮された
命令の使用を可能とするパイプライン方式演算を提供す
ることにある。
【0006】
【課題を解決するための手段】本発明は、命令が複数格
納パイプライン方式演算においてそれぞれ実行されるコ
ンピュータシステムの動作方法であって、前記命令が、
当該ストリング内の先行命令の実行の結果を要求する少
なくとも一つの従属命令を含む前記第1の命令ストリン
グ、及び前記第1のストリング内の命令の実行の結果に
依存しない第2の命令ストリングを備え、前記パイプラ
イン方式演算の連続命令に対する連続段を前記パイプラ
イン内の複数の命令と同時に実行するステップと、命令
実行のシーケンシャルな結果を先入れ先出しベースで一
つ以上の結果を同時に保持するように構成されたデータ
格納へ書き込むステップと、前記第2の命令ストリング
の実行を前記第1の命令ストリングとインターリーブす
ることによって、前記第2のストリングの少なくとも一
つの命令を前記従属命令と前記パイプライン方式演算に
おける前記第1のストリングの前記先行命令の間に挿入
するステップと、を備え、前記従属命令の実行が前記先
行命令の実行の結果から取られた値を前記データ格納か
ら得ることを含む、コンピュータシステム動作方法を提
供する。
【0007】本発明は、コンピュータ命令のシーケンス
を実行する方法であって、前記命令の各々が各命令の実
行及び実行結果の書き込みを含む一つの多段パイプライ
ン方式演算においてシーケンシャルに処理され、前記シ
ーケンスが当該ストリング内の先行命令の実行の結果を
要求する少なくとも一つの従属命令を含む前記第1の命
令ストリング、及び前記第1のストリング内の命令の実
行の結果に依存しない第2の命令ストリングを含み、前
記第1及び前記第2の命令ストリングが前記パイプライ
ン方式演算においてインターリーブされ、これによって
前記演算が初期の命令の終了前に各連続命令において開
始され、前記第2のストリングの少なくとも一つの命令
が前記従属命令とパイプライン演算における前記第1の
ストリングの前記先行命令との間に挿入され、前記書き
込みが、複数の結果を、一つ以上の結果を先入れ先出し
ベースで同時に保持するように構成されたデータ格納へ
ロードすることを備え、前記従属命令の実行が、前記先
行命令の実行の結果から引き出された値を前記データ格
納から得ることを含む、コンピュータ命令シーケンス実
行方法を提供する。
【0008】概して、命令の前記第1及び前記第2のス
トリングの各々が、同じストリング内の先行命令の実行
の結果を要求する少なくとも一つの従属命令を含み、前
記第1及び前記第2のストリングが他のストリングの命
令が前記従属命令の実行と各ストリング内の先行命令の
間に挿入されるようにインターリーブされ、これによっ
て同じストリング内の前記従属命令の実行の前記各スト
リングに対する前記先行命令の結果を前記データ格納内
に提供する。
【0009】好ましくは、前記第1及び前記第2のスト
リングにおける命令が、前記先行命令の実行の結果が同
じストリングの前記従属命令の実行と同時に前記データ
格納から出力されるようにインターリーブされる。
【0010】必要であれば、一つの命令の実行に対して
要求されるデータが、異なる命令の実行の結果を前記デ
ータ格納へ書き込むのと同時に、前記データから除去さ
れる。
【0011】幾つかの実施例において、前記データ格納
が前記又は各命令内でアドレスの識別を必要としない暗
黙格納場所を備えている。
【0012】この暗黙格納場所がドレスビットを要求し
ないより短い命令の使用によって格納場所をアドレスす
るのを可能とすることが理解されよう。この場合、前記
命令シーケンス内の少なくとも一つの命令がデータ格納
に対するアドレス識別を全く含んでおらず、前記コンピ
ュータシステム内の論理回路が前記少なくとも一つの命
令へ応答して前記暗黙格納場所へアクセスする。
【0013】一つの実施例において、前記データ格納が
複数のレジスタによって提供され、前記複数のレジスタ
が前記データ格納場所へ先入れ先出しベースでアクセス
するように一連の命令の実行の間にシーケンシャルにア
ドレスされる。
【0014】本発明はさらに、複数の命令を格納するメ
モリ、及び前記メモリに接続され、前記メモリから命令
を受け取ると共にこれらの命令をシーケンスで実行する
処理回路を備えるコンピュータシステムであって、前記
処理回路が、デコード回路、実行回路、及び前記処理回
路によって実行される連続命令の結果を書き込む書き込
み回路を有する多段パイプライン方式回路と命令実行の
一つ以上の結果を同時に保持するための先入れ先出しデ
ータ格納を有し、前記データ格納が前記パイプライン方
式回路に接続されて、連続命令実行の結果を受け取ると
共に前記実行回路が使用するデータのソースを提供する
コンピュータシステムを提供する。
【0015】このコンピュータシステムが、好ましく
は、前記命令シーケンスにおける先行命令の実行の終了
前に前記パイプライン方式回路へ供給されると共に命令
が前記実行及び書き込み回路へ同時に供給されるように
前記パイプライン方式の回路の連続段を介して連続命令
のフローを制御するフロー制御回路を有している。
【0016】本発明の幾つかの実施例が、以下に、例及
び添付図面を用いてより詳細に説明される。
【0017】
【実施例】図1は、従来のRISC(リスク)プロセッ
サシステム用の命令フォーマットを示し、該フォーマッ
トでは全ての命令が固定長を有し、同様のビット配置フ
ォーマットとなっている。示されている例は、単一命令
11からなり、この例においては、各バイトが8ビット
長である4バイト長を有する。第1のバイト12はオペ
コード(演算コード)を定義し、この演算コードは命令
を実行する時にプロセッサによって実行されるべき特定
の演算を定義する。この第2のバイト13はこの命令を
実行する結果の値に対して宛て先のアドレスを提供す
る。バイト14及び15はこの命令を実行する際に使用
すべきデータの第1及び第2のソースのアドレスをそれ
ぞれ指定する。一般的に、バイト13、14及び15は
すべてレジスタアドレスを指定する。このような命令は
解読が容易であり、従って不要な解読時間をとらない。
しかしながら、このタイプの命令における多くのオペラ
ンドはテンポラリ・レジスタ(一時登録)のアドレスで
ある。テンポラリ・レジスタに必要とされるアドレスの
数を制限するように種々の提案が行われ、これらの提案
には、例えば、アキュムレータの使用が含まれ、各命令
内のフィールドはオペランドがアキュムレータ又は明示
レジスタを識別するか否かを指定する。これによって多
数の冗長ビット配置を有する図1に示したタイプの固定
長命令が生じる。また、これによって命令シーケンスを
保持するのに必要とされるビット配置が不必要に大きく
され、プロセッサによって使用される命令を入手すると
き、より大きなンメモリスペースそしてより長いメモリ
アクセスタイムを必要とする。
【0018】本発明は可変長命令を提供する命令セット
を使用する。記述されている好ましい例において、単一
プロセッサによって使用される種々の命令のフォーマッ
トが図2に示されている。この特定の例は異なるビット
長の複数の選択可能な命令を使用し、各々が所定のビッ
ト長のフォーマットと各々が所定のビット長である命令
フィールドの所定のシーケンスとをベースとし、これら
の命令の内のいくつかがフィールドの内の選択された一
つを省略し、これはどのフィールドが省略されたかを示
すようにこの省略されたフィールドよりも短いビット長
の識別子を含み、これによって命令のビット長を圧縮し
て、命令において冗長ビット配置の使用を回避すること
ができる。示されているこの特定の例において、これら
の命令は各8ビットの4バイト20、21、22、及び
23に分割された32ビットのフォーマットをベースに
する。このフォーマットは圧縮されてないベーシックな
フォーマットを示す図2に示されたフォーマットによっ
て記述される。第1のバイト20はレングス(長さ)イ
ンジケータ24に割り当てられた最初の二つのビット配
置を有する。次の6ビットは演算コードインジケータ2
5であるフィールド1を形成し、この演算コードインジ
ケータ25はプロセッサが命令の実行に応答して実行す
る特定の演算を示す。命令フォーマットにおけるこの第
1のフィールドは、同じビット配置における全ての命令
に対して設けられ、常時、演算コードを示す。
【0019】第2のバイト21において、最初の2ビッ
ト配置は命令のタイプを表すインジケータ26を形成す
る。命令ビット長インジケータ24と同時に得られるこ
れら2ビット26は、命令において、どのフィールドが
存在しているか及びどのフィールドが省略されたかを示
す。第2のバイト21の次の6ビットは第2のフィール
ド27を形成する。第3のバイト22において最初の6
ビットは第3のフィールド28を定義する。最後の2ビ
ット29及び30は命令のタイプに従って演算コードイ
ンジケータの拡張、命令インジケータのタイプ、又は定
数の部分を提供する。第4のバイト23において最後の
6ビットは第4のフィールド31を形成する。最後のバ
イト23の最初の2ビット32は定数値の部分又は演算
コードインジケータの拡張を形成することができる。図
2は、全てが、図2のフォーマット12に示されている
四つのフィールドフォーマットをベースとしている15
個の異なるフォーマットを示す。選択可能なフォーマッ
トの各々は、第2、第3又は第4のフィールドの各々を
完全に包含するか又は完全に省略する。タイプインジケ
ータ26(及び拡張ビット30)は長さインジケータ2
4と組み合わされてどのフィールドが省略されたかを示
す。これらは包含されたフィールド内のデータの指定を
示し、これによりレジスタ又は定数値を示すことができ
る。各命令のビット長の圧縮によって冗長ビットを回避
するのを可能とする他に、この例によって明示アドレッ
シングを必要としない暗黙データ格納場所の識別が可能
とされる。使用される命令の基本フォーマットは図2に
おけるフォーマット12に関して最適に図示されてい
る。長さインジケータ24はそれが32ビット長命令で
あることを示している。演算コード25は実行されるべ
き演算を定義する。タイプインジケータ26は、32ビ
ット長命令の場合において、第2のフィールド27が宛
て先レジスタのアドレスを識別し、第3のフィールド2
8が第2のソースレジスタのアドレスを識別し、及び第
4のフィールド31が第1のソースレジスタのアドレス
を識別することを示す。第3のバイト22の最後の2ビ
ットと第4のバイト23の最初の2ビットは、この場
合、演算コード25の拡張部32に対してファシリティ
(資源)を用意する。幾つかの命令に関しては二つのソ
ースアドレス又は宛て先アドレスを識別することは必要
ではない。このような場合、第2、第3及び第4のフィ
ールドの内の一つ又はそれより多くが命令のビット長を
圧縮すると共に冗長なビット配置を回避するために省略
されることができる。さらに、記述されている例は、デ
ータ格納が明示アドレッシングを要求しない場合のプロ
グラム実行シーケンスの間、生データを保持するために
暗黙データ格納を使用する。この例において、暗黙格納
は、複数のデータ値を同時に保持するように構成された
FIFO(FIFO)データ格納によって供給され、こ
の例においては、このようなデータ格納は、「パイプ」
と呼ばれる。このパイプはプログラムシーケンスの実行
に用いる為の宛て先として、第1又は第2のデータのソ
ースとして又はそれらの組合わせとして使用され得る。
宛て先かソース1又はソース2アドレスとしてパイプが
使用される場合、図2に示された命令フォーマットの対
応する第2、第3又は第4のフィールドへのエントリは
全く要求されない。フォーマット1の場合、命令長イン
ジケータ24は、命令が1バイト長であるにすぎず、結
果的に、フィールド2、3、及び4は欠落し、これによ
って両ソースと宛て先アドレスの代わりに暗黙パイプが
使用され得ることが示される。フォーマット2、3、
4、及び5の場合、ビット長インジケータ24は命令が
2バイト長であり、タイプインジケータ26がフォーマ
ット2、3、4、及び5を判定する。フォーマット2で
はフィールド2が宛て先アドレスを示す。フォーマット
3ではフィールド3が第2のソースアドレスを示し、フ
ォーマット4ではフィールド4が第1のソースアドレス
を示す。フォーマット2、3及び4の各々においては暗
黙パイプが省略されたアドレスと置換することが理解さ
れる。拡張される時、フォーマット1乃至4の各々はフ
ォーマット12の形態を取る。フォーマット5は、タイ
プインジケータがフィールド4が第1のソースアドレス
の代わりに定数値を用意することを示す場合の状況を示
す。フォーマット5はフォーマット13へ拡張される。
フォーマット6乃至11はそれぞれ命令が3バイト長で
あることを示す長さインジケータ24を有し、タイプイ
ンジケータ26は最終ビット配置30と共に包含された
フィールドの重みだけでなく省略されたフィールドの表
示を示す。各ケースにおいて暗黙パイプはあらゆる省略
されたアドレスの代わりに使用される。フォーマット
6、7及び8はフォーマット12へ拡張される。フォー
マット9及び10はフォーマット13へ拡張される。フ
ォーマット11はフォーマット15へ拡張される。フォ
ーマット12乃至フォーマット15の場合、長さインジ
ケータは命令が4バイト長であることを示す。フォーマ
ット13、14、及び15の場合、命令は一つ又はそれ
より多くの明示アドレスを省略しかつビット配置は定数
33、34又は35に置き換えられる。拡張時には暗黙
パイプアドレスが欠落フィールドごとに与えられる。以
下の記述において、ビット10乃至15によって与えら
れたビット値は、Arg1(引数:アーギュメント)と呼ば
れ、ビット16乃至21のビット値はArg2であり、ビッ
ト26乃至31のビット値はArg3である。1、2又は3
の引数を有する命令の8つの例が以下の表に示されてお
り、この表はこれらの命令の各々によって示されたソー
ス及び宛て先アドレス並びに図2に対応するバイト長及
びフォーマットを示す。
【0020】
【表1】
【0021】従って、図2に示された圧縮された命令フ
ォーマットにおいては、エラーがない場合は拡張部30
を含み、タイプインジケータ26は省略されたフィール
ド2、3及び4より実質的に小さいビット長を有するこ
とが理解されよう。各所定のビット長である所定のフィ
ールド位置の使用は簡単さ即ち解読の速さを提供する。
各命令は最小ビット長へ圧縮されて、命令の実行に必要
とされる情報を示す。結果的に、命令シーケンスを格納
するメモリスペース及びメモリからプロセッサへ命令を
転送するアクセスタイムが最小化される。メモリからの
各命令フェッチ動作は、固定数バイトをプロセッサへロ
ードし、圧縮された命令の場合においては、メモリから
フェッチされたバイトパッケージの全体が後に続く命令
の一部を含み、次の命令によって使用されないビット配
置を占有することができる。
【0022】図2に示されたタイプの命令を実行する時
に使用されるコンピュータシステムが図3及び図4に示
されている。これはこの例において従来のRAMを備え
るメモリ41に接続されたプロセッサ回路40を示す。
プロセッサ40は全てがメモリ41に接続されたアドレ
スバス42、データバス43、並びに読み出し及び書き
込みコントロール44、45を含む。メモリ41は異な
るアドレス可能な場所において命令のシーケンスを備え
るプログラムを保持するように構成されている。各命令
は図2に関してすでに記述されているフォーマットの内
の一つに追随する。メモリ41はデータも保持すること
ができる。プロセッサ40は制御論理50及びALU
(算術演算論理ユニット)51を含む。データバス43
はデータ値をメモリ41へ転送し又はメモリ41から転
送する。アドレスバス42は読み出し又は書き込み動作
のためにメモリアドレス値を搬送する。メモリ41にお
ける各アドレス可能な場所は4バイトのデータを保持す
る。アドレスバス42の最下位2ビットはどの格納場所
にアクセスすべきかを決定する場合には無視される。A
LU51はソース1バス52及びソース2バス53に接
続されている。これらはALU51への入力が提供さ
れ、得られたあらゆる出力が結果バス54へ送られる。
読み出し線44と書き込み線45は制御回路50から出
力される。読み出し線44が指定(assert)された時、
メモリ41はアドレスバス42によって識別された場所
で格納された値をデータバス43へ転送する。書き込み
線45が指定された時、メモリ41はアドレスバス42
によって識別された格納場所へデータバス43上の値を
格納する。
【0023】プロセッサ40はメモリ41から4バイト
を一度にフェッチすると共に出力61が命令の始まりと
位置合わせされた命令レジスタ62へ4バイトの出力6
1を備えるように構成された命令フェッチユニット60
を含む。命令レジスタ62は複数の分離した出力を用意
するように構成されており、これらの分離した出力は、
命令ごとに完全に拡張された出力を提供するように構成
された拡張回路63へ命令のフィールド及び制御ビット
の各々を示す。
【0024】命令フェッチャ60の構築又は動作が最初
に記述される。このユニットは図4においてより詳しく
示され且つデータバス43に接続された入力データバス
64を有している。フェッチャ60は32ビットワード
が読み出されるメモリ内に次のアドレスを有する32ビ
ットのラッチを備えるフェッチポインタ65を含む。メ
モリから値が読み出される時、ラッチ65は4バイト分
増加されて新しいポインタアドレスが得られる。値4は
この値4を加算器106へ転送するユニット105によ
って発生され、この加算器106はバス103からポイ
ンタ値を受け取り、ポインタ値へ4を加算する。次い
で、その合計がマルチプレクサ92を介してラッチ65
へ送られて、ポインタを更新する。位置合わせされた命
令が1であり、この1が新しい32ビットワードの始ま
りにおいてビット0位置を有することが理解されよう。
しかしながら、可変長命令の使用によって、幾つかの命
令はメモリ内のワードの途中から開始する。フェッチャ
60はメモリから圧縮された命令を読み出し、それらを
正確に位置合わせし、次いでそれらをバス61を介して
フェッチバッファ66から命令レジスタ62へ出力す
る。バス64へ入力された4バイトのワードはロードシ
フター67及び複数の並列マルチプレクサ68を介して
フェッチバッファ66へ送られる。フェッチバッファ6
6は7バイトの命令に至るまで保持することができ、こ
れは命令の位置合わせ誤り(ミスアライメント)のワー
ストケースを保持するのに充分である。4バイトの命令
が1バイトからスタートして32ビットメモリワードと
なることができることから、ワードが3バイトの命令を
有し、命令を終了するのに必要とされる第4番目のバイ
トを得るために引き続く4バイトのワードが読み取られ
なければならない。従って、7バイトがフェッチバッフ
ァ66内で保持されることが必要とされる。命令がバッ
ファ66内で一旦位置合わせされると、4バイトはバイ
ト0、バイト1、バイト2、及びバイト3を表す線7
0、71、72及び73上へ出力される。命令の長さに
よっては命令バッファ62は4つの線70乃至73全て
から送られる信号上で動作するとは限らないが、殆どの
場合において出力はこれらの線上で設けられる。バイト
0は出力される命令の長さを線70上に示し、これは長
さインジケータ74へ渡されて、バッファ66内で幾つ
のバイトが現在除去され得るかをフェッチャ・ユニット
60に対して示す。バイトカウンタ75はバッファ66
内のバイト数のカウントを常に保持し、ユニット74か
ら送られた長さ信号はマルチプレクサ76を介して長さ
減算機構(subtractor)77へ渡され、この長さ減算機
構77は、バッファ66内に残留する有効バイトの数を
カウントするためにマルチプレクサ76及びバイトカウ
ンタ75から入力を受け取る。減算機構77からの出力
78はバイトカウンタ75内の入力を更新するためにマ
ルチプレクサ79を介して送られる。
【0025】マルチプレクサ76からの出力は抽出シフ
タ81への入力を生成する。抽出シフタ81はバッファ
66内でこれらの残留バイトを再配置するために使用さ
れる。これらの残留バイトは次の命令に使用するように
命令レジスタ62へのバス61に供給されるように要求
される。抽出シフタ81は、各線71、72、及び73
から並びにバッファ66のバイト4、バイト5、及びバ
イト6の場所から入力82を受け取る。容量(Amount)
信号80に従って、フェッチバッファ66内に保持され
た値は、この抽出シフタ81によって再配置され、線8
3を介してマルチプレクサ68へ出力される。このよう
に、フェッチバッファになお必要とされるバイトがバイ
ト0で開始される新しい場所でフェッチバッファ66内
に再配置される。バッファ66のバイト0、1及び2内
で保持された値も線85を介してロードシフタ67へフ
ィードバックされる。このロードシフタは、データバス
64上でメモリから読み出された新しいバイトがロード
されるフェッチバッファ66内のバイトの場所を示すた
めにバイトカウンタ75から得られた容量信号86も受
け取る。この容量信号86に従って、メモリからの新し
い4バイトは、バス64へ入力され、フェッチバッファ
66の事前演算から保持されているバイト値を表す線8
5上のいずれかの信号と結合して対応するマルチプレク
サ68へフィードされる。従って、マルチプレクサ68
は、バイト0でスタートするフェッチバッファ66内で
連続バイト位置を占有するように線85のいずれかで保
持されているバイトとメモリから読み出された新しいバ
イトを結合した値をバッファ66へロードするためにラ
ッチ信号90によって動作され得る。ラッチ信号90は
マルチプレクサ79へ送られて、バイトカウント75を
4で更新する。値4はユニット105を介して加算器1
08へ送られ、加算器108は4をバイトカウンタ75
から送られたバイトカウント値に加算し、その合計をバ
イトカウンタ75へ渡す。
【0026】フェッチポインタ65は、通常、フェッチ
ャ60を用いてメモリ内のシーケンシャルなワード場所
から命令を取りに行かせる。しかしながら、いくつかの
プログラムはメモリ内の新しい場所から命令のフェッチ
を開始するようにメカニズムに要求する分岐命令を含
む。このため、マルチプレクサ92を介してフェッチポ
インタ65へ送られ得るスタート入力91を備えてい
る。線91上のスタートアドレスの上位30のアドレス
ビットは、これらの30ビットがメモリ内の新しい4バ
イトワードの始まりに常にアドレスするようにポインタ
65へ渡される。フェッチポインタ65の下位2ビット
は常にゼロへセットされる。32ビットワード内のサブ
ポジション(補助的位置)を示すにすぎない下位2ビッ
トが2ビットラッチ93内に格納される。ラッチ93内
で保持された値はゼロとの比較演算子を検出するために
コンパレータ94内でテストされ、これによって新しい
メモリアドレスが32ビットの境界の始めからスタート
するか又はワードの途中からスタートするか否かが決定
される。それがワードの途中からスタートする場合、コ
ンパレータ104からANDゲート95へ信号が送られ
て、コンパレータ94からANDゲート95への第2の
信号がバッファ66内のバイト数がゼロでないことを示
した時、フェッチバッファの内容のいくつかが調整を必
要とすることを示す。調整出力96は制御ユニット50
へ提供され、命令が正確に位置合わせされておらず、位
置合わせするにはダミー命令の読み出しがこの制御ユニ
ット50からNext(ネクスト(次の))信号97を
用いて実行されることを示す。信号97はORゲート9
8を介して送られることによってフェッチバッファ66
に対する新しいラッチ演算を生じ、この新しいラッチ演
算が上記に説明したようにフェッチバッファ66からの
一つ以上のバイトの除去と抽出シフター81への入力8
0によって決定された容量による再配置とを生じ、この
容量がANDゲート95の出力によりマルチプレクサ7
6を介して経路指定された2ビットラッチ93から導出
されている。
【0027】現在命令がフェッチバッファ66から読み
出され、これによって上記に説明したように命令がフェ
ッチバッファ66から除去されることができることをフ
ェッチャユニットへ伝えるためにNext入力97も制
御ユニット50から導出されることが理解されよう。ラ
ッチ入力100はデータバス64上の値をバッファ66
に格納するようにフェッチャへ命令するため、エッジ感
応信号である制御ユニット50から導出される。Beg
in(ビギン(開始))信号102は、ブランチ命令に
応答してスタート信号入力91に渡された新しいアドレ
スから新しいワードのフェッチを開始するようにフェッ
チャに知らせるために使用される更なるエッジ感応信号
である。アドレス出力103がメモリ内のワードの始ま
りにおいて32ビットの境界を常に指すことが理解され
よう。バイトカウンタ75は、バイトカウントがゼロで
ない場合、ANDゲート95へ信号を送るようにカウン
トコンパレータ106と接続されている。長さ減算機構
77は、フェッチバッファが次の命令を生成するのに充
分な内容を有していない時は必ず、More出力107
を提供するように構成されている。この信号107は、
次の命令は制御ユニット50へ供給されることによっ
て、次の命令がフェッチャから読み取られる前に、ラッ
チ信号100を用いてフェッチャにメモリ読み出しを実
行させる。バイトカウンタ75は、フェッチバッファ6
6から命令が除去された時は常にカウントを減少させ、
新しい値がメモリから読み取られた時は常にカウントを
増加させる。フェッチャがStart(スタート)入力
91を用いて新しい命令シーケンスからスタートする
時、線102上のBegin信号は、カウンタ75内の
カウントをクリアすると共にORゲート109を介して
フェッチポインタ65内の新しいポインタ値をラッチす
るために使用される。単一ビットラッチ110は、新し
いスタートアドレスからの第1の命令がバッファ66内
で位置合わせされた後で2ビットラッチ93をクリアす
るために使用される。
【0028】制御ユニット50から導かれる三つの入力
信号、Next信号97、ラッチ(latch)100
信号、及びBegin信号102は、フェッチャのいく
つかの演算が要求されるまで通常は指定されないことが
理解されよう。実行される四つのタイプの演算は以下の
通りである。出力バス61上で命令レジスタ62に対す
る命令を生成する。正確に位置合わせされた命令がフェ
ッチバッファ66内で保持された時にこれを実行し、M
ore信号107及びAdjust(調整)信号96は
指定されない。フェッチャはメモリの場所から読み出し
動作を実行してもよい。フェッチバッファ66が十分な
データを含まない時は必ず、通常、32ビットのメモリ
場所がシーケンシャルに読み取られる。データが読み取
られるアドレスはバス103へ出力されたフェッチポイ
ンタ65によって表される。これはMore信号107
が指定された時に行われ、Adjust信号96は指定
されない。ラッチ信号100はロードシフタ67から出
力を選択するためにマルチプレクサ68をセットするよ
うに指定される。データがバス64から入力されると、
ラッチ信号100はフェッチバッファ66内に値を格納
するために逆指定される。
【0029】フェッチャは新しい命令シーケンスを初期
化するために使用されることができる。この場合、バイ
トカウント75はクリアされ、メモリ内の新しいアドレ
スがフェッチポインタ65と2ビットバッファ93へラ
ッチされる。この初期化はプログラム分岐命令後に要求
される。これはBegin信号102を指定し、次いで
Begin信号102を逆指定することによって実行さ
れる。さらに、フェッチャは第1の命令を新しい命令シ
ーケンス内で位置合わせするように使用されることがで
きる。新しい命令シーケンスがメモリ内の32ビットワ
ード境界においてスタートしない場合、Adjust信
号96が指定され、この位置合わせ動作はフェッチバッ
ファ665のダミー読み出しを実行するためにNext
信号97を指定し、次いでNext信号97を逆指定
し、これによって新しいシーケンスの第1の命令を位置
合わせすることを含む。
【0030】図3及び図4に示されているように、フェ
ッチャユニット60の出力バス61は命令レジスタ62
へ送られた32ビット信号を提供し、この32ビット値
はフェッチャ60へ送られたNext信号97と同時に
制御ユニット50から導出された入力信号112によっ
てラッチされる。命令レジスタ62内の32ビット信号
は7つの出力信号120、121、122、123、1
24、125、及び126を提供するように構成されて
いる。これらの出力信号の性質が図2に関して記述され
ている。信号120は図2における長さインジケータと
対応しているビット0及び1を表す。信号121はビッ
ト2乃至7から導出され、演算コードを有するフィール
ド1を表す。出力122は図2に示されたタイプインジ
ケータ26を形成するビット8及び9を表す。出力12
3はビット位置10乃至15を表すArg1(引数)であ
る。出力124はビット位置16乃至21を表すArg2で
ある。出力125はビット位置22乃至25を表し、P
ADと呼ばれ、タイプ拡張、演算コードの一部又は定数
値の一部を表す。出力126はArg3を表し、ビット位置
26乃至31を表す。従って、出力121は図2におい
てフィールド1を表し、常に演算コードを示すことが理
解されよう。図2におけるフィールド2、3、及び4
は、命令長に従ってArg1、Arg2、又はArg3のいずれかで
表される。出力120乃至126の各々は命令拡張ユニ
ット63へ送られ、この命令拡張ユニット63はこのユ
ニットへ供給された圧縮された形式から完全な命令を再
構築するように構成されている。出力120を表す長さ
はソース1バス52に接続された長さイネーブルユニッ
ト127へも送られる。
【0031】拡張ユニット63の構築及び演算は図6に
関して記述されている。ユニット130は完全な演算コ
ードを構築するために提供されている。ユニット130
は演算コード入力121を受け取り、いくつかのフォー
マットではPAD信号が演算コード拡張を含むこともあ
るので、PAD入力125にも接続されている。長さ入
力120とタイプ入力122は共にユニット130に接
続され、これによりユニット130が演算コードを構築
する際にPAD入力125からのあらゆる信号を組み込
むか否かを決定する。完全に構築された演算コードは次
いで線131へ出力され、この演算コードはプロセッサ
によって実行される演算を制御するために制御ユニット
50へ送られる。ルータユニット132はArg1、Arg2、
及びArg3の入力123乃至126の各々を受け取るよう
に構成されている。ルータ132は長さ及びタイプ信号
120、122からの入力も受け取り、これによって入
力123、124、及び126のどの入力が宛て先又は
ソース1若しくはソース2の出力を表すかを決定する。
ルータ132は、いくつかのフォーマットにおいてTY
PE拡張を含むので、PAD信号125も受け取ってい
る。ルータ132は宛て先アドレスに対応する第1の出
力140、ソース2アドレスに対応する第2の出力14
1、及びソース1アドレスに対応する第3の出力142
を有する。ルータ132へ送られる長さ入力120及び
タイプ入力122並びにPAD入力125が、ルータが
補正入力信号123乃至126又はそれぞれの出力14
0乃至142を出力するのをイネーブルとし、これらは
それぞれのマルチプレクサ143、144、及び145
へ送られる。これらのマルチプレクサはそれぞれパイプ
アドレッシングユニット146によって決定されたパイ
プアドレスを表す他のアドレスを受け取る。マルチプレ
クサ143乃至145の演算は長さ及びタイプのインン
ジケータ120及び122並びにPAD125からの入
力を有するイネーブルユニット147によって制御され
る。これらの入力信号は圧縮された命令においてフィー
ルドのどれかが欠落しているか否かを決定し、それが欠
落しているフィールドと暗黙パイプアドレス146を置
き換える。このように、拡張ユニットからの出力信号1
50、151、及び152は、圧縮された命令内で明示
的に提供されない暗黙アドレスに対して提供されている
パイプアドレスによって対応する宛て先ソース1及びソ
ース2のアドレスを示す。図2のフォーマットに示され
ているように、命令が定数値を含む場合、Arg1、Arg2、
及びArg3、並びにPADの内のいづれかが長さ及びタイ
プのインジケータ120及び122に従って定数を構築
するために使用されてもよい。これらは定数構築機構1
63へ送られる。入力信号120及び122が定数が構
築されるべきであることを示した場合、出力164へ定
数値を出力するように要求されると、入力123乃至1
25が結合される。長さ及びタイプのインジケータ12
0及び122は、インジケータユニット165へ送られ
て、定数が存在していることを示す信号166を出力す
る。信号166は制御ユニット50へ送られ、定数値は
線164を介して定数レジスタ167へ送られる。PA
D信号125がTYPE拡張を含む時、その値は図2に
示されるように定数がコード化されるか否かを決定しな
い。
【0032】プロセッサは一組のアドレス可能なレジス
タを保持するレジスタファイル179を含む。また、暗
黙データ格納場所は複数のデータ値に対してFIFOデ
ータ格納を提供するパイプ171によって提供される。
レジスタファイル170はバス54に接続されたポイン
タ回路173を有し、これによってデータ値がレジスタ
ファイル内に書き込まれるのを可能にする。同様に、パ
イプ171が選択回路174を有し、これによってデー
タ値が結果バス54からパイプ171内の所望される場
所へ書き込まれるのを可能にする。ポインタ回路173
及びセレクタ回路174は共に、データを格納場所へ書
き込むように要求された時、制御信号50からラッチ信
号186を受け取るように構成されている。同様に、ポ
インタ173及びセレクタ174は共に、命令拡張ユニ
ット63の出力150に接続され、これにより拡張ユニ
ット63からの拡張された命令の出力によって指示され
た時、対応する格納装置がそのデータの宛て先として使
用される。データがレジスタファイル170からソース
バスへ読み取られるのを可能とするため、線176によ
ってソース1バス52と接続され且つ線177によって
ソース2バス53と接続された出力セレクタ175が設
けられている。読み出し動作に使用する補正レジスタ
は、拡張ユニット63によって備えられたソース1又は
ソース2のアドレスによって決定される。線151は、
ソース2アドレスをレジスタファイル170の出力セレ
クタ回路175とパイプ171の出力セレクタ回路17
9の両方へ直接接続する。拡張ユニット63から線15
2へ出力されるソース1アドレスはその出力がセレクタ
175及び179の両方に接続されたマルチプレクサ1
80を通過する。マルチプレクサ180はまた、宛て先
アドレスがソース1の識別の代わりに供給されることが
できるように、宛て先線150からの入力を拡張ユニッ
ト63から得る。セレクタ175はソース1のバスへの
読み出し動作をイネーブルとするように第1のイネーブ
ル入力182を有する。このイネーブル信号182はA
NDゲート185を介して制御ユニット50から得られ
る。第2のイネーブル入力186は、第2のソースバス
53への読み出し動作をイネーブルとするように構成さ
れると共に制御ユニット50から直接得られる。イネー
ブル入力182及び186は同様にパイプ171の出力
セレクタ179へ供給される。
【0033】レジスタファイル170の構築及び動作は
従来通りである。
【0034】パイプ171の構築及び動作については図
7により詳細に記述されている。パイプ171はN個の
データ値を保持するように構成された複数の分離選択可
能なデータ格納(装置)190を備える。結果バス54
は、データ格納190の各々に接続され、宛て先セレク
タ174はどのデータ格納が結果バス54から入力を受
容してよいかを決定するように各データ入力と接続され
ている。同様に、各データ格納190は、二つの分離出
力セレクタ191及び192へ収集される。これらの二
つの出力セレクタは類似し、それぞれが各データ格納場
所へ接続され、あらゆるデータ場所をそれぞれのソース
1バス52及びソース2バス53へ接続させることがで
きる。パイプへ書き込まれる時、宛て先信号150がこ
のパイプへ入力され、このパイプにおいては、宛て先ア
ドレスは、命令がこのパイプの使用を宛て先として要求
することを確実とするように整合ユニット194でその
パイプ用に指定されたアドレスと比較される。宛て先信
号は、レジスタファイル170用の入力セレクタへ送ら
れるが、整合がなければ、この宛て先信号はレジスタフ
ァイル170に無視されることが理解されよう。ユニッ
ト194によって整合が見つかったならば、制御ユニッ
ト50からラッチ信号ユニット184を受け取るように
構成されたANDゲート195へ入力は供給され、これ
によって関連する宛て先が選択されるのは補正ラッチ信
号が指定された時に限られる。セレクタ174はデータ
をパイプ171の連続データ場所へ書き込むように循環
(巡回)方法で演算する。イン・ポインタ196は次の
書き込みエントリのパイプ171内にアドレスを常に有
する。このアドレスは次の書き込み動作に対して要求さ
れたアドレスを選択するために線197を介してセレク
タ174へ入力される。信号197はAdd1(1を加
算せよ)ユニット200からの信号を他の入力として有
する加算器198へ送られる。加算器198の出力はA
NDゲート195からラッチ信号を受け取るポインタ回
路196へフィードバックされ、これによりパイプ17
1へデータを書き込むそれぞれの新しいラッチング動作
ごとにポインタアドレスを一つずつ進める。値がパイプ
へ書き込まれる時、ラッチ信号184は最初に指定され
る。ANDゲート195の出力はパイプ171内のラッ
チ回路201へ送られる。ラッチ信号184が逆指定さ
れた時、結果バス54の値はパイプ171の選択された
場所に格納され、次の書き込みエントリのアドレスがポ
インタ196へ格納される。
【0035】読み出し動作の間、ライン151及び18
3上のソース1及びソース2のアドレスは、レジスタフ
ァイル170及びパイプ171へ送られる。パイプ17
1から読み出される指定されたパイプアドレスは、レジ
スタファイル170内のアドレスと整合しない時、この
アドレスはこのレジスタファイル170によって無視さ
れる。入力されたアドレスは、パイプ171内におい
て、整合ユニット194と類似している他の整合ユニッ
ト205内のパイプの指定されたアドレスと比較され
る。各整合ユニット205の出力はそれぞれのイネーブ
ル入力182又は186を受け取るANDゲート206
へ送られる。ソース1の回路の場合、ANDゲート20
6の出力はソース1セレクタ190に対するイネーブル
信号207と、ORゲート209及びANDゲート21
0への入力を形成する。アウト・ポインタ回路211は
制御ユニット50からDone(終了)信号212を受
け取るように構成されている。ポインタ211は次のエ
ントリが読み取られるパイプ171内の場所190のア
ドレスを保持する。ポインタからの出力215は第1の
加算器216及び第2の加算器217へ送られる。加算
器216は、値1が信号へ加算され且つORゲート20
9からの出力信号の制御下においてマルチプレクサ21
8へ送られるのを可能にする。もう一方の加算器217
は値2を線215上の信号へ加算するように構成され、
ポインタ回路211に対する出力信号215が2だけ増
分された値である出力220をへ提供する。ANDゲー
ト210からの出力によって制御されるマルチプレクサ
221は、ポインタが読み取られる場所が2だけ増分さ
れた場所である線220からの入力か又はマルチプレク
サ218からの出力を受け取るようにポインタ回路22
1への入力223を制御する。マルチプレクサ218の
出力はそれ自体、増分ゼロ又は加算器216によって実
行される増分1を有する出力信号215であってもよ
い。パイプ171からの読み出しを実行する動作におい
て、ソース1出力52はソース2出力53も一緒にアク
ティブ(活動状態)になる前にアクセスされるように定
義される。このため、出力ポインタ値215は、対応す
る信号が入力182及び183上で受け取られた時に読
み取るべきパイプの位置を選択するように出力セレクタ
192へ直接送られる。線207上の信号はソース1バ
ス52に対して読み出し動作が行われたか否かを決定
し、且つこの信号はまた、線221を介してセレクタ回
路191へ入力される場所の選択を用意するため、ポイ
ンタ211からの出力信号215か又は加算器216に
よって生成された増分1を選択するようにマルチプレク
サ220へ送られる。このように、読み出し動作は対応
する入力信号が入力186及び151へ提供された時に
ソースバス53上で実行されてもよい。ソース1バス5
2に対する読み出し動作が全く行われなかった場合、セ
レクタ191はポインタ211から線215を介して指
定された場所から出力する。しかしながら、線207へ
の信号がソース1バス52上で読み出し動作を生じた場
合、マルチプレクサ220は読み出し動作がソース2バ
ス53へのセレクタ191によって実行される場所を1
だけ増分するように演算される。ソース2バスに対して
読み出し動作を生じるように使用されるANDゲート2
06からの出力信号は、ORゲート209へ送られてマ
ルチプレクサ218を制御し、ANDゲート210へ送
られて、次の読み出し動作の為のポインタ211によっ
て指定された場所へ進む時にマルチプレクサ221を制
御する。読み出し動作が全く生じなかった場合、ポイン
タ211からの出力信号215は場所を変更せずにマル
チプレクサ218及び221を介してフィードバックさ
れる。ソースバスに対する読み出し動作が一回だけ発生
した場合、加算器216の出力216はポインタの場所
を1だけ進めるようにマルチプレクサ218及び221
を介して送られる。ソースバス52及び53の両方に対
して読み出し動作が発生した場合、ポインタ211によ
って識別された場所はマルチプレクサを介して線220
へ送られた加算器217の出力を用いることによって2
だけ進められる。
【0036】定数イネーブル167は、制御ユニット5
0からイネーブルソース1信号247を受け取るように
構成されたNANDゲート246からイネーブル信号2
45が引き出された時、命令の拡張部からソース1バス
52へ線164へ出力された定数値を送る。ANDゲー
ト185とNANDゲート246の両方がイネーブル信
号247の他にNORゲート248から入力を受け取
る。このNORゲート248は、拡張された命令内に定
数が存在していることを示す線166からの第1の入力
と宛て先フィールドをソース1アドレスとして使用する
ようにマルチプレクサ180を制御するために制御ユニ
ット50から出力された第2の入力249を受け取る。
命令の演算コードに従って、これは、幾つかの命令が、
他のソースオペランドを指定するために宛て先フィール
ドを使用することを許容する。
【0037】プロセッサは以下の5段パイプラインを有
する。 −フェッチャ60 −命令レジスタ62、拡張部63、ソースマルチプレク
サ180、イネーブル定数167、及びイネーブルIP
300 −実行レジスタ301及びALU51 −メモリレジスタ302及びメモリアクセス303 −書き込みレジスタ304
【0038】衝突ユニット305は、現在実行している
複数の命令のレコードとこれらのそれぞれの宛て先を保
持する。この衝突ユニット305は、まだ実行されてい
る命令の結果に新しい命令が依存するか否かを決定する
ため、Src1(ソース1)183、Src2(ソース
2)151、イネーブルSR1(ソースレジスタ1)1
82及びイネーブルSR2(ソースレジスタ2)186
の信号を使用する。待機信号306は、先行命令の結果
が届くまで、制御ユニット50に新しい命令のスタート
を遅らせるように命令する。衝突ユニット305は、新
しくスタートした命令はそれが終了する時に結果をいく
らかのレジスタ又はパイプ場所内に格納することをこの
ユニットに知らせるために使用されるターゲット(目
的)及びリザーブ(予約)信号を有している。ターゲッ
ト信号は拡張ユニット63からの宛て先信号150から
送られ、リザーブ信号307は制御ユニット50から送
られる。
【0039】命令に対するオペランドは、Src1(ソ
ース1)183及びSrc2(ソース2)151の信号
によって、並びにイネーブル定数(Const )254及び
イネーブルIP(命令ポインタ)232によって、アド
レスされる。拡張ユニット62の出力はこれらの信号又
はこれらの信号が得られる他の信号を生成する。これは
補正値がソース152及びソース253のバスへ書き込
まれるのを可能とする。ソースオペランド値、宛て先ア
ドレス及び演算コード信号308はラッチER(実行レ
ジスタ)信号309によって実行レジスタ(Execute Re
gister)301内に格納される。演算コードER信号3
08は拡張ユニット63からの演算コードと必ずしも同
じ信号ではない。というのは、幾つかのプログラム命令
がシーケンシャルに進行する二つ以上の内部命令へ分割
されるからである。実行レジスタ301への格納は待機
信号306がクリアされた時にのみ生じ、この命令が未
終了の命令の結果を要求しないことを示す。宛て先信号
150が書き込まれると、リザーブ信号307も指定さ
れ、これによって衝突ユニット305は結果が引き続き
書き込まれることを知る。宛て先信号150をソースオ
ペランドアドレスとして使用する命令はこれを分離サイ
クルで読み取らねばならない。これに関しては後に記述
する。
【0040】ソースオペランドが読み出されると同時
に、現在命令の長さを加算器310によってそれに加算
することによって命令ポインタ230が更新されて次の
シーケンシャル命令を指す。これはIPマルチプレクサ
311を介して経路指定され、ラッチIP信号231に
よって格納される。命令ポインタ値がイネーブルIP2
32を指定することによってソース2値として使用され
た時、ゼロ信号312は引き続く命令のアドレスが加算
器310から送られるか又はゼロユニットから値0が送
られるかを制御する。これは分岐に使用される。
【0041】実行レジスタ301からのソース1の値3
13及びソース2の値314はALU51へ送られ、こ
れらの値は演算コード信号55に従って処理される。A
LU51は条件信号56を生成し、これは、幾つかの命
令の間、制御ユニット50によって使用される。ALU
51の出力は、ラッチMR信号316を用いることによ
って、宛て先信号315及び実行レジスタ301からの
演算コード55と共にメモリレジスタ302内に格納さ
れる。
【0042】メモリレジスタ302に内に保持された一
時(テンポラリ)結果317は演算コード信号325と
共にメモリアクセスユニット303へ送られる。これら
はメモリの読み出し又は書き込みが要求されるか否を決
定する。どちらでもない場合、テンポラリ値317が変
更されずにそのまま信号318として書き込みレジスタ
304へ送られる。読み出しが要求された場合、読み出
し信号319が指定され、テンポラリ値317はアドレ
ス信号240へ送られる。制御ユニット50はメモリ読
み出しを実行し、リターンされたデータは結果信号31
8へ送られる。メモリ書き込みが要求された場合、テン
ポラリ値317は再びアドレス信号240へ送られる。
実行レジスタ301からの値信号313はデータバス6
4へ送られる。書き込み信号320が指定され、制御信
号50はメモリ書き込みを実行する。従って、実行ジレ
スタ301が格納する値を保持しなければならない時に
はメモリレジスタ302が書き込むためのアドレスを保
持するので、メモリ書き込みは2段のパイプラインを使
用する。
【0043】メモリアクセスユニット303の出力は、
宛て先信号321及びメモリレジスタからの演算信号3
08と共にラッチWR信号322により書き込みレジス
タ304内に格納される。このユニットからの演算信号
323は制御ユニット50へ送られ、この制御ユニット
50は結果が格納される場合はラッチDR信号184を
指定する。書き込みレジスタ304からの宛て先信号3
24は書き込み用のレジスタ又はパイプ場所を含み、格
納する値は結果バス54へ送られる。この格納はまた、
命令が終了したことを決定することができるように衝突
ユニット305へ送られる。結果バス54は命令ポイン
タ230及びフェッチャ60内に格納されることがで
き、分岐の実行をイネーブルとする。
【0044】アドレスマルチプレクサ242は制御ユニ
ット50からフェッチ制御信号251によって制御さ
れ、これによってメモリがフェッチャ60又はメモリア
クセスアドレス内の値からアドレスされる。
【0045】フェッチャ60に対するラッチ入力100
は、メモリからの読み出しがメモリからの他の命令ワー
ドをフェッチするように要求された時に共にイネーブル
とされる制御ユニットからの信号251及び255をそ
の入力として有するANDゲート260から導出され
る。
【0046】使用上、制御ユニット50からの全ての制
御出力は最初に逆指定される。フェッチャ60からのM
ore出力107は他の命令ワードがメモリ41から必
要とされることを示す場合、読み出し動作は他のワード
をフェッチャ60へロードするために実行される。プロ
セッサが新しい命令シーケンスへ分岐した場合、調整出
力96は位置合わせが必要か否かを示すために提供され
る。位置合わせが必要な場合、命令ワードに対する他の
メモリ読み出しが必要されることもある。More出力
107は命令ワードに対する他のメモリ読み出しが必要
な場合にそれを指示する。位置合わせの後で、命令は命
令レジスタ62へロードされ、ユニット63によって拡
張され、対応するソース又は定数値はソース1バス52
又はソース2バス53へ供給され、次いで対応する演算
が制御ユニット50からのコマンド信号261下でAL
U51によって実行される。
【0047】プロセッサは算術演算命令を実行すること
ができる。これらは一つ又は二つのソースオペランド及
び単一宛て先オペランドを有する。全てが、パイプ17
1、レジスタファイル170又は定数信号164からひ
き出され、拡張ユニット63からの出力信号によって指
定される。いくつかの演算は単一ソースオペランドを有
するにすぎず、この場合、ソース2バス53上の値は無
視され、線186上のイネーブル信号は指定されない。
ソースオペランドは宛て先アドレス及び演算コードと共
に実行レジスタ301内に保持される。ALU51はメ
モリレジスタ内に格納される結果を生成する。メモリア
クセスユニット303は、結果が変更されずに書き込み
レジスタ304へ渡されるようにこれらの命令に対して
演算を行わない。
【0048】プロセッサは32ビットの値をメモリへ書
き込み又はメモリから読み出すメモリ命令を実行しても
よい。読み出しと書き込みの両方に対して、二つのソー
スオペランドが算術演算命令によって実行レジスタ30
1内に格納される。ALU51はこれらの二つの値をア
クセスするアドレスを発生するために加算し、このアド
レスがメモリレジスタ302内に格納される。メモリの
読み出しの際には、このアドレスはメモリアクセスユニ
ット303によって読み出され、その値は、書き込みレ
ジスタ304へ格納される。メモリ書き込みは三つのソ
ースオペランドが要求されるので、もっと複雑である。
書き込むためのアドレスを指定する二つのソースオペラ
ンドが実行レジスタ301内に格納されると、使用宛て
先信号249が指定され、これによって、宛て先信号1
50がソース1バス52へ送られる他のソースオペラン
ドにアクセスする。この他のオペランドが、計算された
アドレスがメモリレジスタ302内に格納された時、実
行レジスタ301へ格納され得る。ここから、このオペ
ランドはメモリアクセスユニット303の値の入力へ送
られる。
【0049】分岐命令を実行するにあたって、プロセッ
サはプログラムの異なる部分が実行されるように命令レ
ジスタ230内に保持された命令ポインタを変更するこ
とができる。通常、命令ポインタは次のシーケンシャル
命令を指し示すためにユニット127からの長さ信号に
よってインクリメントされる。無条件分岐において、命
令ポインタは常に新しい値に変化する。条件分岐に対し
て命令ポインタが更新されるように条件が指定される。
次のシーケンシャルな命令のアドレスがレジスタファイ
ル170又はパイプ171内にセーブされる場合には手
順呼び出しが実行されてもよい。
【0050】プロセッサの動作において、命令ごとの実
行シーケンスはパイプライン方式演算として実行され
る。これは図9に示されている。パイプラインの第1段
において、フェッチ動作は、新しいワードがフェッチャ
60内にフェッチされ、位置合わせされ、命令レジスタ
62内にロードされ、拡張ユニット63によって拡張さ
れた時に実行される。第2段は、命令が実行される演算
を指示するように解読されると共に演算に使用されるべ
きアドレス又は値を識別する解読動作である。適正なデ
ータ線がプロサッセ内でイネーブルとされる。第3段で
は実行が行われる。これは命令の複雑さによって要する
時間が多少変化する。第4段はメモリアクセスを含む。
最後に、実行シーケンスは必要ならば命令の結果を関連
する宛て先レジスタへ書き込むことを含む。各段は命令
に対する全体的な実行シーケンスに要する時間の一部に
対してアクティブであるにすぎない。一旦段が一つの命
令に対して使い果たされると、直ぐに次のシーケンシャ
ルな命令へ進行することが所望される。これはプロセッ
サの演算のパイプライン化によって達成される。実行に
おける段ごとに常に一つの命令が存在している。幾つか
のケースにおいては次の命令にすぐ進むことは可能では
ない。例えば、分岐命令は適正な命令ポインタが決定さ
れるように終了しなければはらない。同様に、先行命令
の結果を要求する命令は、この命令が終了するまで、待
機しなければならない場合もある。これらの命令は解読
段で検出され、要求された値が入手できるまでその位置
に保持されなければならない。従って、段があらゆる動
作を実行していない所謂バブルがパイプライン内に発生
することになる。
【0051】パイプライン動作において発生するこのよ
うなバブルを減少するため、命令ストリングをインター
リーブすることは適切であり、これにより、従属命令が
第1のストリング内の先行命令の実行の結果を要求する
第1のストリング内に発生した時に第1のストリングに
依存しない第2のストリングの少なくとも一つ以上の命
令が、従属命令と結果が要求される先行命令との間に挿
入される。
【0052】例えば、以下の計算がプログラムシーケン
スに必要とされると仮定する。 Ra=(Ra+Rb)×(Rc−Rd) Re=(Re+Rf)×(Rq−Rh) これを実行する命令シーケンスは、 命令1、2及び5は第1の計算を実行し、命令3、4及
び6は第2の計算を実行する。
【0053】上記の表における命令のシーケンスは命令
の二つのストリングをインターリーブしている。第1の
ストリングは、命令1、2及び5からなり、この命令5
は、この命令が実行される前の命令1及び命令2の両方
の結果を要求する従属命令である。命令の第2のストリ
ングは命令3、4及び6によって形成され、この命令6
は命令3及び命令4の実行の結果を要求する第2のスト
リング内の従属命令である。この例においては、二つの
命令ストリングが上記の表に示された数値のシーケンス
へインターリーブされる。これが図10に示された結果
を生成する。この図は、上記の表に示された6個の命令
のシーケンスをパイプライン内で実行する11サイクル
の演算を示す。サイクル0の間、第1の命令がフェッチ
される。サイクル1の間、第2の命令がフェッチされ、
第1の命令が解読される。サイクル2の間、第3の命令
がフェッチされ、第2の命令が解読され、第1の命令が
実行される。サイクル3の間、第4の命令がフェッチさ
れ、第3の命令が解読され、第2の命令が実行され、第
1の命令がメモリアクセス内で使用されてもよい。サイ
クル4の間、第5の命令がフェッチされ、第4の命令が
解読され、第3の命令が実行され、第2の命令がメモリ
アクセス内で使用され、第1の命令の結果がデータ格納
へ書き込まれる。上記の表において、これはレジスタR
2と指定される。サイクル5においては、命令6がフェ
ッチされ、命令5は解読され、命令4が実行され、命令
3がメモリアクセスへ使用され、命令2の結果が表にお
いてR1と指定されるデータ格納へ書き込まれる。サイ
クル6の間、新しい命令ストリングが今や開始されよう
としているので、これらのストリングの他の命令がもう
フェッチされることはない。命令6は解読され、命令5
が実行される。命令5は従属命令であるが、このサイク
ルによって先行命令1及び2の結果が既にデータ格納場
所へ書き込まれ、結果的に命令5はバブルを全く発生せ
ずに実行されることができる。命令4はメモリアクセス
内で使用され、命令3の結果は上記表においてレジスタ
R4と指定されたデータ格納へ書き込まれる。サイクル
7の間、解読回路は、命令6が未だ入手できない命令3
及び命令4の結果を要求する従属命令であることを検出
するので、命令6は解読段に留まっていなければならな
い。この結果、サイクル7の実行段でバブルが発生する
が、命令5はメモリアクセスへ使用され、命令4の結果
が上記表でレジスタR3と指定されたデータ格納へ書き
込まれる。サイクル8の間、先行命令3及び4の結果が
今や入手可能であるので、命令6は実行段へ進行するこ
とができる。サイクル8の間、バブルはメモリアクセス
内で生じるが、命令5の結果は今や上記表においてレジ
スタRaと指定されたデータ格納へ書き込まれる。サイ
クル9の間、命令6はメモリアクセス段へ進行し、書き
込み段において変更がないのでバブルが発生する。サイ
クル10の間、メモリ6の結果が上記表においてレジス
タReと指定されたデータ格納へ書き込まれる。
【0054】従って上記表に示された6個の命令のシー
ケンスは、図10の三つのバブルを発生するだけで終了
する。本発明に従って命令がインターリーブされなかっ
た場合の結果は図12に示されている通りである。この
図は、上記の表の命令1、2及び5からなる第1の命令
ストリングが最初に順に実行され、命令2、3及び6か
らなる第2の命令ストリングがそれに続いて順に実行さ
れる場合の位置を示す。図10から、命令5が命令2の
後でフェッチされた場合、この命令は三つのサイクルに
対する解読段で保持されることによって、命令1及び2
の結果がサイクル6まで入手することができないので、
サイクル4及び5の間の実行段において二つのバブルが
生じることがわかる。同様に、命令6が命令4の後に続
く時、命令3及び4の結果が入手可能である場合は命令
6がサイクル11まで実行段へ進行することができない
ので、この命令は三つのサイクル8、9及び10に対す
る解読段で保持される。これにより、図10の表の3個
に比べて図12の表においては12個のバブルが発生す
る。さらに、これは、図10に示されたインターリーブ
状況における11サイクルの演算ではなく、14サイク
ルのパイプライン方式のプロセッサ演算が6個の命令を
実行することを要求した。
【0055】上記の表は命令の結果を順に書き込むため
に分離アドレス可能なレジスタを指定したが、本発明は
上記の命令ストリングを実行した結果をFIFOベース
で複数の値を同時に保持するように構成された多値デー
タ格納へ書き込む。本発明の例においてはこれはパイプ
171によって用意される。命令1、2、3、4、5及
び6の実行の結果が順に生成されるので、これらの結果
がFIFOデータ格納へ同じ順序で書き込まれ、結果的
に初期の(早い)命令の結果を後の従属命令によって使
用するために同じ順序でデータ格納から得ることができ
ることは理解されよう。これは図12(a)乃至(g)
の順序で図示されている。これらの図は図10に示され
たチャートのサイクル4乃至10の間パイプ171内の
データにおける循環変更を示す。サイクル4の間、命令
1の結果はパイプ内の場所0を占める。次のサイクル5
において、命令1の結果は場所0に残り、命令2の結果
は場所1へ書き込まれる。サイクル6の間、命令3の結
果は場所2へ書き込まれるが、命令5の実行によって場
所0と1内に格納された値が除去される。サイクル7の
間、命令3の結果は場所2内に残り、命令4の結果は場
所3へ書き込まれる。サイクル8の間、命令5の結果は
命令0へ書き込まれ、命令6の実行によって、命令5は
場所2及び3内に保持された命令3及び4の結果を除去
する。サイクル9において、書き込み段においてバブル
が発生し、これによりパイプ内に保持されているデータ
は全く変わらない。サイクル10の間、命令6の結果は
パイプ内の場所1へ書き込まれるが、このパイプはまだ
命令5の結果を場所ゼロ内に保持している。
【0056】パイプ171が上記の表の6個の命令に対
して指定された宛て先レジスタが全てこのパイプ171
の共通のアドレスになるように明示的にアドレスされた
データ格納であり、そして、この場合、パイプ171か
ら又はパイプ171への循環書き込み及び読み取りは、
データを図12(a)乃至(g)に示されたパイプ場所
へ書き込み、このデータをそこから除去するように実行
されることが理解されよう。上記の表の二つのインター
リーブされた命令ストリングを達成するためのコード化
はこの明細書に後述されており、分離した明示的にアド
レスされたレジスタの使用は24バイトを必要とする
が、コード化は16バイトで達成できることが理解され
よう。暗黙パイプ171を使用する場合、図7に示され
たセレクタは、図12(a)乃至(g)に示されたパイ
プへのデータの循環書き込み及びこのパイプからのデー
タの除去を達成するため、上記のパイプラインの実行及
び書き込み段を用いて、実行のためにパイプからデータ
を取らせ、実行後に結果をパイプ内に挿入させる。
【0057】他の実施例において、パイプへのデータの
入力のために格納場所の循環的選択を提供するようにカ
ウンタを用いる代わりにFIFOバッファが使用され、
この場合、新しいデータがバッファ内にプットされるの
で、既にバッファ内にあるデータがバッファ内の新しい
場所へ進む。このような場合、FIFOバッファからソ
ース1及びソース2のバスへデータを読み取るために出
力セレクタを動作するために単一カウンタが使用され
る。次いで、この出力は、最長時間データを保持した場
所に対応するバッファ内の場所から取り出される。
【0058】上記例に使用され得る命令セットが以下に
示される。
【0059】
【表2】
【0060】これらのオペランドには記述型ネームが与
えられる。幾つかの命令は三つ未満のオペランドを有
し、これらは結果的に省略されたオペランドに対するブ
ランクを有する。これらの省略されたオペランドには特
別な値が与えられ、それらが圧縮された命令における省
略に適していることを認めることが理解されよう。命令
に対して選択された非圧縮命令フォーマット(フォーマ
ット12乃至15)はプログラマによって選択されたオ
ペランドに依存する。例えば、Move(移動せよ)命令
は、Result(結果)オペランドに対してレジスタ又はパ
イプを選択することができ、及びValue (値)オペラン
ドに対してレジスタ、パイプ又は定数値を選択すること
ができる。この値が定数でない場合、フォーマット12
が使用され得る。Resultアドレスはフィールド2内で保
持され、特別の値はフィールド3内に埋め込まれ、Valu
e アドレスはフィールド4内にプットされる。Value オ
ペランドが定数である場合、フォーマット13及び14
が定数の長さに従って使用され得る。Value オペランド
が定数であり、Resultオペランドがパイプである場合、
フォーマット13及び14の他に、フォーマット15が
使用され得る。非圧縮フォーマットが一旦選択される
と、それは図2で可能とされたように圧縮されることが
できる。同様の方法が他の命令にも使用され得る。
【0061】オペランド2及びオペランド3によって指
定された値は、ソース2バス53とソース1バス52の
それぞれへプットされる。命令はその機能を実行する。
最終的に、一つあれば、Resultバス54はResultオペラ
ンドによって指定された場所に格納される。
【0062】これらの命令の意味が以下に示される。 Move(移動せよ):ソース1バス52の値がResultバス
54に複写される。 Add (加算せよ):ソース1バス52の値がソース2バ
ス53の値へ加算され、その結果がResultバス54へプ
ットされる。 Subtract(減算せよ):ソース1バス52の値からソー
ス2バす53の値が減算され、その結果がResultバス5
4にプットされる。 Multiply(乗算せよ):ソース1バス52の値がソース
2バス53の値で乗算され、その結果がResultバス54
にプットされる。 Divide(除算せよ):ソース1バス52の値がソース2
バス53の値で除算され、その結果がResultバス54へ
プットされる。 Load Vector (ベクトルをロードせよ):ソース2バス
53上の値がソース1バス52上のスケーリングされた
値へ加算され、その結果がResultバス54へプットされ
る。これがテンポラリ・レジスタ(Temporary Registe
r)240に格納される。次いでメモリ読み出し動作が
生じ、メモリの値がソース1バス53へプットされる。
ALU51はこの値を変更せずにResultバス54へ送
る。 Store Vector(ベクトルを格納せよ):ソース2バス5
3の値がソース1バス52のスケーリングされた値へ加
算され、この結果がResultバス54へプットされる。こ
れがテンポラリ・レジスタ240へ格納される。オペラ
ンド1によってアドレスされた値がソース1バス52へ
運ばれ、ALU51はこの値を変更せずにResultバス5
4へ送る。メモリ書き込み動作が発生して、Resultバス
54の値をメモリに格納する。 Jump(飛越せ):命令ポインタ230はソース2バス5
3へプットされる。オペランド3が定数であれば、AL
U51は加算を実行するようにセットされ、そうでない
場合は、ソース1の値を変更せずに送るようにセットさ
れる。ここでResultバス54は飛越しターゲット値を保
持する。これがフェッチャ60へ書き込まれ、このフェ
ッチャ60は命令の新しいシーケンスのフェッチを開始
するように命令される。 Jump Not Zero (ゼロでなければ飛越せ):オペランド
1によってアドレスされた値はソース1バスに運ばれ、
ALU51からの状態信号56がソース1の値がゼロか
否かを見るためにチェックされる。その値がゼロの場
合、これ以上の動作が行われず、次のシーケンシャルな
命令が実行される。値がゼロでない場合、Jump(飛越
せ)命令と同じ動作が発生する。 Call(呼び出せ):命令ポインタ230がソース2バス
53に運ばれ、ALU51がこのポインタ230をResu
ltバス54へ送るようにセットされる。Resultバス54
の値はオペランド1のアドレスによって指定された場所
に格納される。続いてJump命令と同じ動作が発生する。 Equal To(に等しい):ソース1バス52の値がソース
2バス53の値と比較される。値が等しい場合、値1が
Resultバス54へ運ばれ、そうでない場合、値0がResu
ltバス54へプットされる。 Greater Than(より大きい):ソース1バス52の値が
ソース2バス53の値と比較される。ソース2がソース
1より大きい場合、値1がResultバス54へ運ばれ、そ
うでない場合、値0がResultバス54へプットされる。 And (論理積):ソース1バス52の値がソース2バス
53の値とAND演算され、その結果がResultバス54
へプットされる。 Or(論理和):ソース1バス52の値がソース2バス5
3の値とOR演算され、その結果がResultバス54へプ
ットされる。 Exclusive Or(排他的論理和):ソース1バス52の値
がソース2バス53の値と排他的OR演算され、その結
果がResultバス54へプットされる。 Shift Left(左へシフトせよ):ソース1バス52の値
がソース2バス53の値だけ左へ(最上位エンドまで)
シフトされ、その結果がResultバス54へプットされ
る。 Shift Right (右へシフトせよ):ソース1バス52の
値がソース2バス53の値だけ右へ(最下位エンドま
で)シフトされ、その結果がResultバス54へプットさ
れる。
【0063】この例に従って使用された命令は、これら
が1、2、3、又は4バイトの長さを有することができ
るように圧縮されることが理解されよう。これらの圧縮
された命令の使用によってより高いコード密度が提供さ
れ、図1に示されたタイプの従来の技術の命令のセット
との比較が以下の例において説明されており、表題「従
来の技術」は図1に示したタイプの命令に係り、「本発
明の実施例」は上記の例を説明している。A(*) は命令
の選択されたフィールド内のアドレスの省略を指定する
ために使用され、従って暗黙パイプ171の使用を示
す。
【0064】
【表3】
【0065】
【表4】
【0066】
【表5】
【0067】
【表6】
【0068】
【表7】
【0069】
【表8】
【0070】本発明は上記の例の細部にわたって限定さ
れない。図8は図6及び図7を代替する他の構成を示
す。この他の例において、拡張ユニット63は、ソース
及び宛て先アドレスを提供するように構成されており、
先入れ先出しをベースにしてこれらが動作し且つパイプ
171の代わりにレジスタファイル場所の内のいくつか
を使用することができるように循環的である。図6及び
図7に既に記述された構成要素と同様の図8における構
成素子が同じ参照番号で示され、これらの機能について
ここでは改めて反復しない。この場合、イン・ポインタ
196とアウト・ポインタ211はN乃至N+M−1ま
での数を両端を含み保持することができるラッチであ
る。これらは分離パイプ171への要求条件を置き換え
るために循環バッファとして使用され得るレジスタファ
イル170内のレジスタ数である。このようにレジスタ
ファイル170上のソース及び宛て先セレクタは通常に
アドレスすることによってレジスタの内のいくつかを選
択することができ、他のレジスタは回帰循環バッファベ
ースでアクセスされる。ルータ132からの出力14
0、141、及び145はそれぞれマルチプレクサ26
6、267、及び268へ提供される。マルチプレクサ
268はソース1の出力信号152を提供するように構
成される。マルチプレクサ267はソース2に対して出
力信号を提供し、マルチプレクサ266はその出力とし
て宛て先アドレスを有する他のマルチプレクサ270へ
出力を提供する。出力信号140、141、及び145
の各々はルータ132からのオペランドごとにレジスタ
数を比較しそしてパイプを示す特別のレジスタ数と整合
する場合、信号を指定する同様のコンパレータ回路27
1へ送られる。この特別のレジスタ数はこれらが直接ア
クセスされる必要がないので循環バッファを構成するM
個のレジスタのいづれかであるように定義される。コン
パレータ271の出力はイネーブル暗黙回路147から
の信号を第2の入力として有するORゲート272へそ
れぞれ送られる。マルチプレクサ268はアウト・ポイ
ンタ211から第2の入力を有する。マルチプレクサ2
67はポインタ211の出力又はそのポイント値に対し
て増分1を受け取るように構成されたマルチプレクサ2
74から第2の入力を有する。同様にマルチプレクサ2
66はマルチプレクサ274からの出力又はその値の増
分1を受け取るマルチプレクサ275から入力を受け取
る。
【0071】ポインタ211への入力アドレスはその入
力としてマルチプレクサ275の出力又はその出力値の
増分1を有するマルチプレクサ276から導出される。
ORゲート272は使用済オペランド回路281から第
2の入力を受け取るように構成されたそれぞれのAND
ゲート280へ第1の出力を提供するように構成されて
いる。使用済オペランド281は演算コード信号131
並びに長さ及びタイプの信号120及び122の入力を
受け取る。回路281からの出力は三つのオペランドの
うちのどれがソースであり、どれが宛て先であるかを示
す。この出力はANDゲート280へ送られて、これら
のマルチプレクサ268、267、及び266の適切な
選択を可能とする。使用済オペランド回路281からの
他の出力283がORゲート272からの第2の入力を
受け取る他のANDゲート284へ送られる。これはマ
ルチプレクサ270が宛て先出力がイン・ポインタ19
6又はマルチプレクサ266から導出されるのを可能に
するように制御する。値N+M−1が与えられる場合
に、結果がNとなるように「1を加算せよ(Add on
e)」ユニットの各々が入力信号のモジュロ加算を実行
する。Done(終了)信号212は命令の実行が終了
した時これらのポインタを更新するようにアウト・ポイ
ンタ211及びイン・ポインタ196のラッチングを制
御する。ANDゲート193は、ANDゲート284に
よって示されるように、値がパイプから読み取られた時
のイン・ポインタ196の更新を可能にするにすぎな
い。従って、レジスタファイル内の選択されたレジスタ
は先入れ先出しの複数の値のデータ格納として動作する
ために循環バッファとして使用されてもよいし、これは
長さ及びタイプの信号120及び122がソース又は宛
て先アドレスが圧縮命令において省略されたことを示す
時にもイネーブル暗黙回路147の使用により実行され
得る。
【0072】図2に関して記述された例において、あら
ゆる省略されたフィールドはパイプ171によって提供
された暗黙格納を表すと考えられる。このように、圧縮
された命令が拡張された時、省略されたフィールドはパ
イプ171のアドレスを示す値によって置換される。し
かしながら、他の実施例において、省略されたフィール
ドは包含されたフィールドの内の一つとして同じ値を取
ると考えることができる。命令フォーマットにおいて使
用された長さ及びタイプのインジケータは、包含された
フィールドの内の指定されたフィールドと同じ出力値を
そのフィールドに対して提供するように、包含されたフ
ィールドの内の一つの値が命令の拡張内で反復されるこ
とを示す。命令フォーマットは、包含されたフィールド
の内のどのフィールドがその値を反復させ、また省略さ
れたフィールドの内のどのフィールドがこの反復された
値を取るかを示すために、長さ及びタイプインジケー
タ、及びできれば命令フォーマットのPADセクション
におけるビット値を使用することができる。図2におい
て、フォーマット6乃至11はどれでも、十分なビット
を演算コード拡張位置で有している(ビット数は22又
は32個)ので、拡張ユニットが包含されたフィールド
の内の一つの値を省略されたフィールドへ複写すべきで
あることを示すことができる。
【0073】
【発明の効果】本発明は高速パイプライン方式演算をイ
ネーブルとするコンピュータシステム及びコンピュータ
システム演算方法を提供する。
【図面の簡単な説明】
【図1】従来の技術の命令のフォーマットを示す図であ
る。
【図2】本発明によって使用するための多様な命令フォ
ーマットを示す図である。
【図3】本発明によるコンピュータシステムのブロック
図である。
【図4】本発明によるコンピュータシステムのブロック
図である。
【図5】図3及び図4に示された命令フェッチャの一部
をより詳細に示す図である。
【図6】図3及び図4に示された命令拡張ユニットをよ
り詳細に示す図である。
【図7】図3及び図4のパイプユニットをより詳細に示
す図である。
【図8】図6の回路の改良された構成を示す図である。
【図9】図3及び図4に示された装置のパイプライン方
式演算を示す図である。
【図10】本発明による図9のパイプラインの演算サイ
クルのシーケンスを示す図である。
【図11】他のパイプラインの演算サイクルのシーケン
スを示す図である。
【図12】(a)、(b)、(c)、(d)、(e)、
(f)及び(g)は、図10のサイクル4乃至10に対
するパイプ内のデータ格納を示す図である。
【符号の説明】
318 結果信号 319 読み出し信号 320 書き込み信号 323 演算信号 325 演算コード信号 321 宛て先信号 322 ラッチWR信号
───────────────────────────────────────────────────── フロントページの続き (72)発明者 アンドリュー クレイグ スタージェス イギリス国 BS6 5HP ブリストル モントペリィアー ウェリントン アベ ニュ 3 (72)発明者 ネイサン マッキンゼー サイドウェル イギリス国 BS2 9UD ブリストル セントワーバーフス クリーブ ストリ ート 21

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 命令が複数格納パイプライン方式演算に
    おいてそれぞれ実行されるコンピュータシステムの動作
    方法であって、 前記命令が、当該ストリング内の先行命令の実行の結果
    を要求する少なくとも一つの従属命令を含む第1の命令
    ストリング、及び前記第1のストリング内の命令の実行
    の結果に依存しない第2の命令ストリングを備え、 前記パイプライン方式演算の連続命令に対する連続段を
    前記パイプライン内の複数の命令と同時に実行するステ
    ップと、 命令実行のシーケンシャルな結果を先入れ先出しベース
    で一つ以上の結果を同時に保持するように構成されたデ
    ータ格納へ書き込むステップと、 前記第2の命令ストリングの実行を前記第1の命令スト
    リングとインターリーブすることによって、前記第2の
    ストリングの少なくとも一つの命令を前記従属命令と前
    記パイプライン方式演算における前記第1のストリング
    の前記先行命令の間に挿入するステップと、 を備え、 前記従属命令の実行が前記先行命令の実行の結果から取
    られた値を前記データ格納から得ることを含む、 コンピュータシステム動作方法。
  2. 【請求項2】 コンピュータ命令のシーケンスを実行す
    る方法であって、 前記命令の各々が各命令の実行及び実行結果の書き込み
    を含む一つの多段パイプライン方式演算においてシーケ
    ンシャルに処理され、 前記シーケンスが当該ストリング内の先行命令の実行の
    結果を要求する少なくとも一つの従属命令を含む前記第
    1の命令ストリング、及び前記第1のストリング内の命
    令の実行の結果に依存しない第2の命令ストリングを含
    み、前記第1及び前記第2の命令ストリングが前記パイ
    プライン方式演算においてインターリーブされ、これに
    よって前記演算が初期の命令の終了前に各連続命令にお
    いて開始され、前記第2のストリングの少なくとも一つ
    の命令が前記従属命令とパイプライン演算における前記
    第1のストリングの前記先行命令との間に挿入され、 前記書き込みが、複数の結果を、一つ以上の結果を先入
    れ先出しベースで同時に保持するように構成されたデー
    タ格納へロードすることを備え、 前記従属命令の実行が、前記先行命令の実行の結果から
    取られた値を前記データ格納から得ることを含む、 コンピュータ命令シーケンス実行方法。
  3. 【請求項3】 前記第1及び前記第2の命令ストリング
    の各々が、同じストリング内の先行命令の実行の結果を
    要求する少なくとも一つの従属命令を含み、前記第1及
    び前記第2のストリングが他のストリングの命令が前記
    従属命令の実行と各ストリング内の先行命令の間に挿入
    されるようにインターリーブされ、これによって同じス
    トリング内の前記従属命令の実行の前記各ストリングに
    対する前記先行命令の結果を前記データ格納内に提供す
    る請求項1又は2に記載の方法。
  4. 【請求項4】 前記第1及び前記第2のストリングにお
    ける命令が、前記先行命令の実行の結果が同じストリン
    グの前記従属命令の実行と同時に前記データ格納から出
    力されるようにインターリーブされる請求項1乃至3の
    いずれか一つに記載の方法。
  5. 【請求項5】 一つの命令の実行に対して要求されるデ
    ータが、異なる命令の実行の結果を前記データ格納へ書
    き込むのと同時に、前記データから除去される請求項1
    乃至4のいずれか一つの記載の方法。
  6. 【請求項6】 前記データ格納が前記又は各命令内でア
    ドレスの識別を必要としない暗黙格納場所を備える請求
    項1乃至5のいずれか一つに記載の方法。
  7. 【請求項7】 前記暗黙格納場所が先入れ先出しバッフ
    ァを備える請求項6に記載の方法。
  8. 【請求項8】 前記命令シーケンス内の少なくとも一つ
    の命令がデータ格納に対するアドレス識別を全く含んで
    おらず、前記コンピュータシステム内の論理回路が前記
    少なくとも一つの命令へ応答して前記暗黙格納場所へア
    クセスする請求項6又は7に記載の方法。
  9. 【請求項9】 前記暗黙格納場所が命令の実行に用いる
    データのソースを提供するように構成されている請求項
    8に記載の方法。
  10. 【請求項10】 前記データ格納が複数のレジスタによ
    って提供され、前記複数のレジスタが前記データ格納場
    所へ先入れ先出しベースでアクセスするように一連続の
    命令の実行の間にシーケンシャルにアドレスされる請求
    項1乃至9のいずれか一つに記載の方法。
  11. 【請求項11】 複数の命令を格納するメモリ、及び前
    記メモリに接続され、前記メモリから命令を受け取ると
    共にこれらの命令をシーケンスで実行する処理回路を備
    えるコンピュータシステムであって、 前記処理回路が、解読回路、実行回路、及び前記処理回
    路によって実行される連続命令の結果を書き込む書き込
    み回路を有する多段パイプライン方式回路と命令実行の
    一つ以上の結果を同時に保持するための先入れ先出しデ
    ータ格納を有しており、 前記データ格納が前記パイプライン方式回路に接続され
    て、連続命令実行の結果を受け取ると共に前記実行回路
    が使用するデータのソースを提供する、 コンピュータシステム。
  12. 【請求項12】 前記連続命令が前記命令シーケンスに
    おける先行命令の実行の終了前に前記パイプライン方式
    回路へ供給されると共に命令が前記実行及び書き込み回
    路へ同時に供給されるように前記パイプライン方式の回
    路の連続段を介して連続命令のフローを制御するフロー
    制御回路を有する請求項11に記載のコンピュータシス
    テム。
  13. 【請求項13】 前記処理回路がデータ格納アドレス指
    定を有さない命令に応答して前記データ格納へアクセス
    するように構成された論理回路を含む請求項10乃至1
    2のいずれか一つに記載のコンピュータシステム。
  14. 【請求項14】 前記データ格納が先入れ先出しバッフ
    ァを備える請求項11乃至18のいずれか一つに記載の
    コンピュータシステム。
  15. 【請求項15】 前記データ格納が複数の分離アドレス
    可能なレジスタを備え、アドレッシング回路が一連続の
    命令が実行された時に先入れ先出しベースで動作するよ
    うに前記レジスタへシーケンシャルにアドレスするよう
    に提供された請求項11乃至13のいずれか一つに記載
    のコンピュータシステム。
JP7178175A 1994-06-21 1995-06-21 コンピュータシステム、コンピュータシステム動作方法、及びコンピュータ命令シーケンス実行方法 Pending JPH0816392A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9412439A GB9412439D0 (en) 1994-06-21 1994-06-21 Computer instruction pipelining
GB9412439-3 1994-06-21

Publications (1)

Publication Number Publication Date
JPH0816392A true JPH0816392A (ja) 1996-01-19

Family

ID=10757080

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7178175A Pending JPH0816392A (ja) 1994-06-21 1995-06-21 コンピュータシステム、コンピュータシステム動作方法、及びコンピュータ命令シーケンス実行方法

Country Status (3)

Country Link
EP (1) EP0689130A1 (ja)
JP (1) JPH0816392A (ja)
GB (1) GB9412439D0 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8127082B2 (en) * 2006-02-01 2012-02-28 International Business Machines Corporation Method and apparatus for allowing uninterrupted address translations while performing address translation cache invalidates and other cache operations
US20080122843A1 (en) * 2006-07-20 2008-05-29 Via Technologies, Inc. Multi-thread vertex shader, graphics processing unit and flow control method
US9250916B2 (en) * 2013-03-12 2016-02-02 International Business Machines Corporation Chaining between exposed vector pipelines

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60126734A (ja) * 1983-12-13 1985-07-06 Nec Corp 情報処理装置
JPS6116335A (ja) * 1984-07-02 1986-01-24 Nec Corp 情報処理装置
JPS61180370A (ja) * 1986-01-10 1986-08-13 Hitachi Ltd データ処理装置
JPH02301832A (ja) * 1989-05-17 1990-12-13 Sony Tektronix Corp パイプライン処理方法
JPH0475143A (ja) * 1990-07-17 1992-03-10 Matsushita Electric Ind Co Ltd タスク切換機能付プロセッサ

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58181165A (ja) * 1982-04-16 1983-10-22 Hitachi Ltd ベクトル演算プロセツサ
US4965724A (en) * 1987-03-05 1990-10-23 Oki Electric Industry Co., Ltd. Compiler system using reordering of microoperations to eliminate interlocked instructions for pipelined processing of assembler source program
US5119495A (en) * 1989-12-21 1992-06-02 Bull Hn Information Systems Inc. Minimizing hardware pipeline breaks using software scheduling techniques during compilation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60126734A (ja) * 1983-12-13 1985-07-06 Nec Corp 情報処理装置
JPS6116335A (ja) * 1984-07-02 1986-01-24 Nec Corp 情報処理装置
JPS61180370A (ja) * 1986-01-10 1986-08-13 Hitachi Ltd データ処理装置
JPH02301832A (ja) * 1989-05-17 1990-12-13 Sony Tektronix Corp パイプライン処理方法
JPH0475143A (ja) * 1990-07-17 1992-03-10 Matsushita Electric Ind Co Ltd タスク切換機能付プロセッサ

Also Published As

Publication number Publication date
GB9412439D0 (en) 1994-08-10
EP0689130A1 (en) 1995-12-27

Similar Documents

Publication Publication Date Title
JP2992223B2 (ja) コンピュータシステム、命令ビット長圧縮方法、命令発生方法、及びコンピュータシステム動作方法
JP3547139B2 (ja) プロセッサ
JP3592230B2 (ja) データ処理装置
US6334176B1 (en) Method and apparatus for generating an alignment control vector
US6351804B1 (en) Control bit vector storage for a microprocessor
JPH11154114A (ja) 複数データ・フェッチのアーキテクチャを使ってテーブル・ルックアップを実行するためのシステムおよび方法
US6009508A (en) System and method for addressing plurality of data values with a single address in a multi-value store on FIFO basis
CN108319559B (zh) 用于控制矢量内存存取的数据处理装置及方法
EP0094535B1 (en) Pipe-line data processing system
JP2001034471A (ja) Vliw方式プロセッサ
EP1354267A2 (en) A superscalar processor having content addressable memory structures for determining dependencies
JP3729809B2 (ja) コプロセッサを使用したデータ処理
EP3559803B1 (en) Vector generating instruction
US7047396B1 (en) Fixed length memory to memory arithmetic and architecture for a communications embedded processor system
JP2000322235A (ja) 情報処理装置
US4924377A (en) Pipelined instruction processor capable of reading dependent operands in parallel
JPH0816392A (ja) コンピュータシステム、コンピュータシステム動作方法、及びコンピュータ命令シーケンス実行方法
JPH08212789A (ja) 連想メモリ回路及びtlb回路
JP2828611B2 (ja) コンピュータシステム及び命令実行方法
JPS60129839A (ja) 情報処理装置
EP1132813A2 (en) Computer with high-speed context switching
EP1050800A1 (en) A pipelined execution unit
JP3493110B2 (ja) 高速分岐処理装置
JPH07191911A (ja) アドレス変換装置及びマイクロプロセッサ算出方法
JPH076033A (ja) データ処理装置