JP3741551B2 - データ処理装置 - Google Patents

データ処理装置 Download PDF

Info

Publication number
JP3741551B2
JP3741551B2 JP29219998A JP29219998A JP3741551B2 JP 3741551 B2 JP3741551 B2 JP 3741551B2 JP 29219998 A JP29219998 A JP 29219998A JP 29219998 A JP29219998 A JP 29219998A JP 3741551 B2 JP3741551 B2 JP 3741551B2
Authority
JP
Japan
Prior art keywords
field
instruction
decoder
specified
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP29219998A
Other languages
English (en)
Other versions
JPH11194939A (ja
Inventor
豊彦 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Technology Corp
Original Assignee
Renesas Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Technology Corp filed Critical Renesas Technology Corp
Priority to JP29219998A priority Critical patent/JP3741551B2/ja
Publication of JPH11194939A publication Critical patent/JPH11194939A/ja
Application granted granted Critical
Publication of JP3741551B2 publication Critical patent/JP3741551B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30145Instruction analysis, e.g. decoding, instruction word fields
    • G06F9/3016Decoding the operand specifier, e.g. specifier format
    • G06F9/30167Decoding the operand specifier, e.g. specifier format of immediate specifier, e.g. constants
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30145Instruction analysis, e.g. decoding, instruction word fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3842Speculative instruction execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3853Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution of compound instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline, look ahead using a plurality of independent parallel functional units

Description

【0001】
【発明の属する技術分野】
本発明は複数の演算を並列実行するデータ処理装置に関する。特に、一命令で複数の演算を指定する所謂VLIW(Very Long Instruction Word:超長語命令) 型の命令を実行することにより、複数の演算を高効率で並列実行するデータ処理装置に関する。
【0002】
【従来の技術】
命令レベルの並列性を利用して処理を高速実行するデータ処理装置としては、スーパースケーラ型あるいはVLIW型と称される並列処理技術を採り入れたデータ処理装置が既に提案されている。スーパースケーラとは、順次的に配列された命令列から命令レベルの並列性をハードウェアが検出して複数の命令を並列実行する並列処理技術である。
【0003】
一方、VLIWは、従来の一命令を一演算と見做し、並列実行可能な複数の演算をコンパイル時にコンパイラが検出することにより複数の演算フィールドからなる1個の長語命令にエンコードし、この長語命令で指定された複数の演算をハードウェアが並列実行する並列処理技術である。これらの従来のデータ処理装置に関しては、たとえば「B. R. Rau and J. A. Fisher. ”Instruction-Level Parallelism" The Journal of Supercomputing Vol. 7, No. 1/2, 1993」に詳細に記述されている。
【0004】
【発明が解決しようとする課題】
従来のスーパースケーラ型データ処理装置は過去のデータ処理装置の命令列を変換なしに実行できる利点がある。しかし、並列実行可能な命令列の数が一定でないため、並列実行可能な命令を特定するか、あるいは並列実行可能な命令数に従って次に命令デコーダに入力されるべき命令列を整置する必要があり、このためデコーダハードウェアの負荷が大きいという問題があった。
【0005】
また、従来のVLIW型データ処理装置は各命令の長さが一定且つ一命令内に記述された複数の演算が全て並列実行可能なことが保証されているため、上述の従来のスーパスケーラ型データ処理装置のようなデコーダハードウェアの負荷増大の問題はないものの、並列実行可能な演算がない場合でも1個の命令を使用してしまうため、無効演算(No Operation:NOP)を指定する演算フィールドが多数存在して命令コード長が非常に長くなるという問題があった。また、従来のVLIW型データ処理装置では命令デコーダと演算機構を単純にするために各演算フィールドで指定できる演算の種類を制限し、演算の指定方法を画一的にしているため、一命令内の演算割り付けに自由度が少なく命令のコード効率が悪くなる問題があった。
【0006】
本発明は上述のような従来技術の欠点を補うためになされたもので、基本的にはVLIW型でありながら、演算フィールドの数と演算の順序を指定するフォーマットフィールドとにより演算の数及び順序を柔軟に制御して無効演算の必要性を少なくし、かつ演算実行機構に依存した特定機能の演算のみをデコードする単純なデコーダを並列に動作させることにより、各演算フィールドを多数のデコーダで並列デコードするため、各演算フィールドで指定可能な演算の種類を増大させるため、命令のコード効率を良くしたデータ処理装置に関する。
【0007】
【課題を解決するための手段】
本発明に係るデータ処理装置は、それぞれ演算の種類を指定する第1、第2および第3のオペレーションコードフィールドと、これら3つのオペレーションコードフィールドのそれぞれが指定する演算の実行順序を指定する実行順序指定フィールドとを含んだ命令をデコードする命令デコーダ、および、この命令デコーダに接続され、その命令デコーダから出力されるデコード結果により制御され、前記実行順序指定フィールドで指定された実行順序に従って、前記第1、第2および第3のオペレーションコードフィールドによりそれぞれ指定された演算を実行する演算実行部を備え、前記命令デコーダは、前記実行順序指定フィールドが第1の値であることに従って第1のデコード結果を出力し、前記演算実行部は、前記第1のデコード結果に従い、第1のサイクルで前記第1および第2のオペレーションコードフィールドのそれぞれが指定する演算を並列に実行し、前記第1のサイクルと連続する第2のサイクルで前記第3のオペレーションコードフィールドにより指定された演算を実行すべくなしてあることを特徴とする。
【0008】
また本発明に係るデータ処理装置は命令デコーダは、実行順序指定フィールドが第1の値とは異なる第2の値であることに従って第2のデコード結果を出力し、演算実行部は、前記第2のデコード結果に従い、第1、第2および第3のオペレーションコードフィールドのそれぞれが指定する演算を並列に実行すべくなしてあることを特徴とする。
【0009】
また本発明に係るデータ処理装置は命令デコーダは、実行順序指定フィールドが第1の値とは異なる第3の値であることに従って第3のデコード結果を出力し、演算実行部は、前記第3のデコード結果に従い、第1、第2および第3のオペレーションコードフィールドのそれぞれが指定する演算を所定の順番で逐次実行すべくなしてあることを特徴とする。
【0010】
また本発明に係るデータ処理装置は演算実行部は、演算処理を行う複数の演算部を有し、第3のデコード結果に従い、第1、第2および第3のオペレーションコードフィールドのそれぞれが指定する演算は前記複数の演算部のうちの同一の演算部で処理されるべくなしてあることを特徴とする。
【0011】
また本発明に係るデータ処理装置は演算実行部は、演算の処理を行う第1および第2の演算部を有し、第1のサイクルにおいて、前記第1の演算部は第1のオペレーションコードフィールドにより指定された演算を処理し、前記第2の演算部は前記第1の演算部と並列に動作するように第2のオペレーションコードフィールドにより指定された演算を処理し、第2のサイクルにおいて、第3のオペレーションコードフィールドにより指定された演算を前記第1の演算部で処理するようにしたことを特徴とする。
【0012】
また本発明に係るデータ処理装置は命令デコーダは、命令の第1、第2および第3のオペレーションコードフィールドをそれぞれデコードし、そのデコード結果であるそれぞれ第1、第2および第3の制御信号を出力する第1、第2および第3のデコード部と、実行順序指定フィールドをデコードする第4のデコード部とを有し、この第4のデコード部から出力される第4の制御信号に従って前記第1、第2および第3の制御信号が前記命令デコーダから出力されるタイミングが制御されるように構成され、前記演算実行部は、前記命令デコーダから出力される第1、第2および第3の制御信号に従って、第1、第2、第3のオペレーションコードフィールドによりそれぞれ指定された演算を実行すべくなしてあることを特徴とする。
【0013】
また本発明に係るデータ処理装置は、命令は、互いに同一の長さであり、各々命令の実行するための情報を有する第1、第2および第3の固定フィールドを有し、第1、第2および第3のオペレーションコードフィールドは、それぞれ前記第1、第2および第3の固定フィールド内にあることを特徴とする。
【0014】
また本発明に係るデータ処理装置は、命令は、さらに、第1のオペレーションコードフィールドにより指定される演算の実行条件を指定する第1の条件指定フィールド、第2のオペレーションコードフィールドにより指定される演算の実行条件を指定する第2の条件指定フィールド、および第3のオペレーションコードフィールドにより指定される演算の実行条件を指定する第3の条件指定フィールドを有し、前記第1、第2および第3のオペレーションコードフィールドによりそれぞれ指定された演算のうち、対応する条件指定フィールドの指定する実行条件を満たす演算のみを有効として実行するように構成されたことを特徴とする。
【0015】
また本発明に係るデータ処理装置は、各々は演算の種類を指定する複数のオペレーションコードフィールドと、これらのオペレーションコードフィールドに対応して設けられ、各々は対応のオペレーションコードフィールドにより指定される演算の実行条件を指定する複数の条件指定フィールドと、前記複数のオペレーションコードフィールドによりそれぞれ指定される演算の少なくとも2つを並列に実行するかもしくは逐次に実行するかを指定する実行順序指定フィールドとを有する命令をデコードする命令デコーダ、および、前記命令デコーダに接続され、この命令デコーダから出力されるデコード結果により制御され、前記実行順序指定フィールドに指定される実行順序に従って前記複数のオペレーションコードフィールドにより指定された各演算を実行することのできる演算実行部を備え、前記命令デコード部は、前記複数のオペレーションコードフィールドの指定する演算のうち、対応する条件指定フィールドの指定する実行条件を満たす演算のみを有効として実行するように前記命令実行部を制御していることを特徴とする。
【0016】
また本発明に係るデータ処理装置は、命令実行部は、複数のオペレーションコードフィールドの指定する演算のうち、対応する条件指定フィールドの指定する実行条件を満たす演算の演算結果のみをレジスタ、メモリあるいはフラグに反映するようにしたことを特徴とする。
【0017】
また本発明に係るデータ処理装置は、命令の実行に際して参照されるべき情報を保持している複数のフラグを備え、複数の条件指定フィールドの各々は、前記フラグのいずれか1つを指定し、複数のオペレーションコード指定部によりそれぞれ指定された演算の有効もしくは無効は、その対応する条件指定フィールドの指定するフラグに保持された内容が所定の値であるか否かにより決定されるようにしたことを特徴とする。
【0018】
また本発明に係るデータ処理装置は、複数の条件指定フィールドの各々は、対応するオペレーションコードフィールドに指定される演算が無条件に有効であるとする条件を指定できるようにしたことを特徴とする。
【0019】
【発明の実施の形態】
以下、本発明のデータ処理装置をその実施の形態を示す図面に基づいて詳述する。
【0020】
〔発明の第1の実施の形態〕
(1) 「命令セットとレジスタ」
図1の模式図に本発明のデータ処理装置の第1の実施の形態の命令フォーマットを示す。なお、本発明のデータ処理装置の命令フォーマットには2種類のフォーマットが用意されている。
【0021】
図1において、参照符号1は1個のフォーマットフィールド(FM)10と3個の演算フィールド11, 12, 13とからなる3演算命令のフォーマットを、参照符号2は1個のフォーマットフィールド10と2個の演算フィールド14, 15とからなる2演算命令のフォーマットをそれぞれ示している。なお、本発明のデータ処理装置の命令は8バイト(64ビット) の固定長であり、図1に示されているフォーマット1の3演算命令もフォーマット2の2演算命令も共に全体としては8バイト長である。
【0022】
フォーマット1の3演算命令では、3個の演算フィールド11, 12, 13それぞれが20ビットの短型フォーマットの演算コード(operation_0, operation_1 又は operation_2)を1個ずつ指定する。フォーマット2の2演算命令では、2個の演算フィールド14, 15の内の演算フィールド14が1個の20ビットの短型フォーマットの演算コード(operation_0)と、演算フィールド15が1個の40ビットの長型フォーマットの演算コード(operation_1)との計2個の演算コードを指定する。
【0023】
図2の模式図にフォーマットフィールド10の内容、即ちその値と意味との詳細を示す。なお、この第1の実施の形態においては、フォーマットフィールド10は4ビット構成であり、16種類に分類される。ここで、”2-ops.”は2演算命令を、”3-ops.”は3演算命令を、”1st ”はその欄の演算(operation_0, operation_1 又は operation_2)が最初に実行されるべきであることを、”2nd ”はその欄の演算が二番目に実行されるべきであることを、”3rd ”はその欄の演算が三番目に実行されるべきであることをそれぞれ意味している。また、”--- ”はその欄の演算が存在しないことを意味している。
【0024】
フォーマットフィールド10は、3演算命令のフォーマット1と2演算命令のフォーマット2との区別のほか、それぞれの演算の順序を指定する。ここで演算の順序の指定とは、図2に示されているように、各演算を逐次実行する場合の順序を指定する以外に2個または3個の演算を並列実行する場合をも含む。
【0025】
たとえば、フォーマットフィールド10の値が”FM=0100 ”である場合は、3演算命令であり、演算フィールド11で指定される operation_0 と演算フィールド12で指定される operation_1 とがまず同時に並列実行され、その後に演算フィールド13で指定される operation_2 が実行される。この場合、 operation_0 と operation_1 とは並列実行されるため、相互のオペランドに競合がないことをソフトウェアが保証する必要がある。
【0026】
一方、 operation_0 と operation_2 または operation_1 と operation_2 はいずれの場合も互いを逐次実行することをハードウェアが保証する。ここで逐次実行とは、命令を1個ずつ順次的に実行する従来のデータ処理装置と同様に、先に実行すべき命令の演算結果がその次に実行されるべき命令に反映されることを意味する。
【0027】
図3の模式図に短型フォーマットの演算コードの詳細を示す。短型フォーマットには5種類のフォーマット、即ちSBフォーマット31, SRフォーマット32, SM-1フォーマット33, SM-2フォーマット34, SIフォーマット35がある。
【0028】
これらの5種類のフォーマット31, 32, 33, 34, 35それぞれは、4ビットの実行条件フィールド(<cond>)20と、演算の種類を指定する5ビットのオペレーションコードフィールド21または6ビットのオペレーションコードフィールド23と、分岐命令の分岐幅を指定する11ビットのディスプレイスメント(DISP)フィールド22と、レジスタ上のオペランドを指定する5ビットのレジスタフィールド24と、5ビットのメモリ上のオペランドのアドレスを保持するレジスタ番号を指定する間接アドレスフィールド25, 26と、5ビットの即値を指定する5ビットの即値フィールド27とを組み合わせて構成されている。5種類のフォーマット31, 32, 33, 34, 35の全てに実行条件フィールド20が含まれており、全ての演算は実行条件フィールド20で指定された実行条件が真である場合にのみその演算が有効となる。ここで演算が有効とは、演算結果がレジスタ, メモリあるいはフラグに反映されることを意味する。
【0029】
短型のSBフォーマット31で指定できる演算は、DISPフィールド22で指定される分岐幅が11ビットで表現可能な範囲の分岐及びサブルーチン分岐である。この第1の実施の形態においては、各命令が8バイト長であるため命令アドレスの下位3ビットは常時”0”になり、この場合、14 (=3+11) ビットで16Kバイトまでの分岐幅を指定出来る。
【0030】
短型のSRフォーマット32で指定出来る演算は、加減算等の算術演算, 論理演算, シフト, ビット操作等、計16種類のレジスタ間演算である。
【0031】
短型のSM-1フォーマット33で指定出来る演算は、16種類のロードあるいはストアであり、間接アドレスフィールド25に示されているレジスタ番号<Rb>のレジスタにメモリオペランドのアドレスが格納される。但し、間接アドレスフィールド25が示すレジスタ番号<Rb>が”0”である場合は、ロードに際してはメモリ側のオペランドのアドレッシングモードがスタックからのポップとなり、ストアに際してはメモリ側オペランドのアドレッシングモードがプッシュとなる。
【0032】
短型のSM-2フォーマット34で指定できる演算は、16種類のロード及びストアであり、間接アドレスフィールド26が示すレジスタ番号<Rb>のレジスタの内容とそのレジスタ番号より”1”だけ大きなレジスタ番号のレジスタの内容との和がメモリオペランドのアドレスとなる。
【0033】
短型のSIフォーマット35で指定できる演算は、即値フィールド27の5ビットの即値とレジスタ間の算術演算, 論理演算, ビット操作等の演算, 即値のロード, 無効演算等の12種類の演算である。
【0034】
図4の模式図に長型フォーマットの演算コードの詳細を示す。長型フォーマットには8種類のフォーマット、即ちLBフォーマット71, LM-1フォーマット72, LM-2フォーマット73, LI-Rフォーマット74, LR-Rフォーマット75, LR-Cフォーマット76, LI-Cフォーマット77, MISCフォーマット78があり、ロード, ストア, 各種のレジスタ間の演算, 比較, ジャンプ等の多種多様の演算を行なう。各フォーマット71乃至78には実行条件フィールド20が含まれており、前述の短型フォーマット31乃至35で指定される演算と同様に、全ての演算は実行条件フィールド20で指定された実行条件が真である場合にのみ有効となる。
【0035】
長型のLBフォーマット71は、分岐とサブルーチン分岐の演算のためのフォーマットである。
【0036】
長型のLM-1フォーマット72は、ロード及びストア演算のためのフォーマットである。LM-1フォーマット72では、メモリオペランドのアドレスがフィールド35で示されるレジスタの内容にフィールド38で示される18ビットで表現された符号付き2進数値を加えた値で与えられる。
【0037】
長型のLM-2フォーマット73も、ロード及びストア演算のためのフォーマットである。LM-2フォーマット73では、メモリオペランドのアドレスが2ビットのフィールド41で示されるアドレッシングモードに従って与えられる。図5の一覧図にフィールド41のアドレッシングモードの種類を示す。
【0038】
図5において、フィールド41の値が”<ea>=00”の場合はPC値とディスプレイスメント値を符号拡張した値との加算値、”<ea>=01”の場合はPC値とレジスタRcの値との加算値、”<ea>=10”の場合はPC値とレジスタRcの値との加算値がそれぞれアドレスとなり、”<ea>=11”の場合はポップまたはプッシュモードである。
【0039】
長型のLI-R, LR-Rフォーマット74, 75は、3オペランドの算術演算, 論理演算, シフト演算等のようなレジスタ間の3オペランド演算、あるいは16ビットで表現される1個の即値と2個のレジスタオペランド間の演算のためのフォーマットである。
【0040】
長型のLR-Cフォーマット76は比較演算のためのフォーマットである。LR-Cフォーマット76では、フィールド48で示されるレジスタオペランドとフィールド55で示されるレジスタオペランドとの間の比較演算を指定する。
【0041】
長型のLI-Cフォーマット77も比較演算のためのフォーマットである。LI-Cフォーマット77では、フィールド48で示されるレジスタオペランドとフィールド62で示される即値オペランドとの間の比較演算を指定する。フィールド57は比較演算の真偽判断条件を指定するフィールドであり、その詳細は図6の一覧図に示されている。2個のオペランドに対してこのフィールド57で示された条件の比較が行なわれ、その真偽が判断される。フィールド58は真偽結果を反映するフラグの番号を指定する。フラグは8個あり、フィールド58で指定された番号のフラグが”11”または”10”に変化する。フィールド59は複数の比較演算の条件判断結果を蓄積する際に使用するフィールドであり、フィールド58で指定された条件判断結果との論理積をとるフラグの番号及びそのフラグの真偽値の反転/非反転を指定する4ビットのフィールドである。ビット1〜3が論理積をとるフラグの番号を指定し、ビット0がその入力フラグ値を真偽反転して使用するか、または真偽反転せずに使用するかを指定する。
【0042】
長型のMISCフォーマット78は、ビットマップ操作, ストリング操作等のような多数のオペランドを処理する演算、または無効演算, 制御レジスタ操作等の特権演算に使用するフォーマットである。
【0043】
本発明のデータ処理装置では、命令デコードを単純にするためにジャンプ演算を一命令にたかだか1個のみ指定可能とする。また、2演算命令では2個の演算フィールドのいずれにもジャンプ演算を配置可能であるが、3演算命令では演算フィールド11にのみジャンプ演算を配置可能とする。
【0044】
図7の模式図に本発明のデータ処理装置のレジスタ構成を示す。この第1の実施の形態においては、レジスタとしては、32個の32ビット長の汎用レジスタ (R0〜R31)81、32個の64ビット長の浮動小数点レジスタ(FR0〜FR31)83 、更に10個の32ビット長の制御レジスタ82が含まれる。
【0045】
ゼロ番の汎用レジスタ(R0)80は書き込み値が無視され、読み出された場合に常に”0”を出力するレジスタである。31番の汎用レジスタ(R31)84 はスタックポインタでユーザ用(USP),システム用(SSP),割り込み処理用(ISP) の3個がモードにより切り替わる。
【0046】
制御レジスタ82にはプロセッサステータスワード(PSW)85,プログラムカウンタ(PC)86, 浮動小数点演算例外制御レジスタ(FEIT)87, アドレス変換ベースレジスタ(UATB)88, 例外処理テーブルベースレジスタ(EITVB)89,デバッグサポートレジスタ(DBC, BPA0, BPA1, BMC)90がある。
【0047】
浮動小数点レジスタ83は浮動小数点演算のオペランドとなる短精度の浮動小数点数(32ビット長)または倍精度の浮動小数点数(64ビット長)を格納する。
【0048】
図8及び図9の模式図にプロセッサステータスワード(PSW)85 の詳細な内容を示す。なお、図8はプロセッサステータスワード(PSW)85 の前半の詳細な内容を、図9はプロセッサステータスワード(PSW)85 の後半の詳細な内容をそれぞれ示す。
【0049】
図8において、2ビットの RNGフィールド91はプロセッサのモードを決定するフィールドであり、この第1の実施の形態においては”RNG=00”である場合に割り込み処理モードに、”RNG=10”である場合にシステムモードに、”RNG=11”である場合にユーザモードにそれぞれなる。ATフィールド92はアドレス変換機構のオンオフを切り替えるフィールドであり、1ビットのDBフィールド93はデバッグ機構のオンオフを切り替えるフィールドである。1ビットのXフィールド96はキャリーフラグであり、整数の有効桁数拡張算術演算に使用される。1ビットのVフィールド97はオーバフローフラグであり、整数の算術演算でオーバフローが生じた場合にセットされ、オーバフローが生じなければリセットされる。3ビットの IMASKフィールド94は外部割り込みのマスク状態を制御するフィールドである。8個の条件フラグ95は各フラグが2ビットで構成されており、比較命令で明示的にフラグ番号を指定することにより各フラグを読み出したり、あるいは各フラグに書き込みを行なったりする他、制御レジスタアクセス命令によりプロセッサステータスワード85の内容を読み出したり、あるいは書き換えたりすることにより、参照したりあるいは変更したりすることが可能である。
【0050】
図9に示されている条件フラグ95は本発明のデータ処理装置の命令に含まれる各演算が有効であるか無効であるかを決定する重要な役割を有する。この第1の実施の形態では、命令の各フォーマットに含まれる4ビットの実行条件フィールド20の内のビット1〜3が条件フラグ95の8個のフラグの内の1個のフラグ番号を指定し、ビット0がビット1〜3で指定されたフラグが”偽=10 ”である場合に演算を有効にするか、または”真=11 ”である場合に演算を有効にするかを示す。ビット0〜3で指定されたフラグが”未定義=00 or 01 ”である場合、または指定内容とフラグ値とが異なる場合はその演算は無効になる。条件フラグ95のF0は初期値が”偽=10 ”で他のフラグは初期値が”未定義=00 ”である。ここで、F0フラグは初期状態で各命令フォーマットの条件フィールド20を”1000=F0 が偽なら演算有効”として各演算を無条件で有効にするために初期値が”10”になっている。各フラグはLR-C, LI-Cフォーマットのフィールド57が指定する真偽判断条件による演算結果を判定する変化対象フラグとしてフィールド58で指定された特定の1個のみが変化する。但し、加算または汎用比較演算等の結果に依存して3個のフラグが同時に変化することもある。また、VA(F4)フラグは特定時点の初期化以降に整数演算のオーバーフローがあった場合にも”真=11”になる。
【0051】
(2) 「ハードウェア構成」
本発明のデータ処理装置の第1の実施の形態の全体の構成を図10のブロック図に示す。
【0052】
参照符号107 はバスインタフェイス部であり、本発明のデータ処理装置と外部のメモリとの間をアドレスバス, データバス及び制御信号で接続する。
【0053】
参照符号105 は命令フェッチ部であり、命令キャッシュ及び命令用アドレス変換バッファ(ITLB)を備えている。命令フェッチ部105 は、命令を命令キャッシュから、またはバスインタフェイス部107 を介して外部のメモリからフェッチし、64ビットのIIバス108 を経由して命令マッパ101 へ転送する。
【0054】
参照符号106 はオペランドアクセス部であり、データキャッシュ及びデータ用アドレス変換バッファ(DTLB)を備えている。オペランドアクセス部106 は、データをデータキャッシュから、またはバスインタフェイス部107 を介して外部のメモリからフェッチしてメモリアクセス部125 へ転送したり、あるいはメモリアクセス部125 から転送されたデータをバスインタフェイス部107 を介して外部のメモリに書き込む。
【0055】
命令マッパ101 は命令フェッチ部105 から転送された64ビットの命令をその先頭の4ビットのフォーマットフィールド10の内容に従って演算フィールドに分解し、指定された順序で命令デコーダ102 へ転送する。この際、命令マッパ101 は演算の種類に応じて各演算フィールドを6個のデコーダ111 〜116 の内の対応するデコーダに再配置して転送する。
【0056】
命令デコーダ102 は短型フォーマット31または長型フォーマット71等のジャンプ演算のフィールドをデコードするPCD111、短型フォーマット32, 34または長型フォーマット74〜78の整数の算術演算命令等の汎用レジスタにあるオペランドに関する演算のフィールドをデコードするIAD112, IBD113, ICD114、短型フォーマット33または長型フォーマット72, 73のロードストア演算のフィールドをデコードするMD115 、長型フォーマット72〜77の浮動小数点演算のフィールドをデコードするFD116 から構成される。
【0057】
制御回路103 にはプロセッサステータスワード85のフラグ95が含まれており、命令デコーダ102 のデコード結果とフラグ95の内容とに従って演算部104 を制御する。
【0058】
演算部104 は命令デコーダ102 の6つのデコーダ111 〜116 に対応して、PC部121,3部分からなる整数演算部120,メモリアクセス部125,浮動小数点演算部126 の6つの部分から構成される。
【0059】
PC部121 はプログラムカウンタ及び加算器を含み、ジャンプ命令以外の命令では実行した命令のPC値に”8”を加算して次に実行すべき命令のPC値を計算し、ジャンプ命令では実行したジャンプ命令のPC値に分岐変位を加算するか、あるいは命令で指定されたアドレッシングモードに従って計算を行なうことにより、ジャンプ先命令のPC値を計算する。
【0060】
整数演算部120 には前述の図7に示されている多ポートの汎用レジスタ81及び制御レジスタ82と、3個のシフタ及び3個のALU とが含まれており、3個の整数演算を並列に実行するための3個の整数演算機構(IA, IB, IC)122, 123, 124 にて構成される。
【0061】
浮動小数点演算部126 には図7に示されている浮動小数点レジスタ83と、浮動小数点加算器及び浮動小数点乗算器等の演算機構とがあり、浮動小数点演算を実行する。PC部121 、整数演算機構122, 123, 124 、浮動小数点演算部126 はそれぞれ他と独立に動作するが、必要に応じてバスを経由して相互にデータを送受信することも可能である。
【0062】
メモリアクセス部125 は演算部104 の他の部分121, 120, 126 と協調して動作し、オペランドアクセス部106 との間でデータを送受信する。
【0063】
演算部104 と命令フェッチ部105,オペランドアクセス部106 とはJAバス, AAバス及びDDバスで結合されており、それぞれ演算部104 と命令アドレス, データアドレス及びデータを送受信する。
【0064】
(3) 「命令マッパと命令デコーダ」
図11のブロック図に命令マッパ101 及び命令デコーダ102 の具体的な構成例を示す。命令マッパ101 は、IIバス108 へ出力されている64ビットの命令コードからフォーマットフィールド10, 各演算フィールド11〜15を抽出する演算フィールド抽出部200 と、フォーマットフィールド10をデコードするFMデコーダ221 とで構成される。
【0065】
演算フィールド抽出部200 の各抽出部201 〜213 はそれぞれIIバス108 上の命令コードの一部のビットフィールドを抽出し、命令デコーダ102 を構成する各デコーダ111 〜116 に対応する各演算フィールドのビット列を出力する。64ビットのIIバス108 の内、抽出部201 はビット0〜3を、抽出部202 はビット4〜23を、抽出部203 はビット24〜63を、抽出部204 はビット4〜23を、抽出部205 はビット24〜43を、抽出部206 はビット24〜63を、抽出部207 はビット44〜63を、抽出部208 はビット4〜23を、抽出部209 はビット24〜43を、抽出部210 はビット44〜63を、抽出部211 はビット24〜63を、抽出部212 はビット4〜23を、抽出部213 はビット24〜63をそれぞれ抽出して命令デコーダ102 へ出力する。
【0066】
命令デコーダ102(PCD111, IAD112, IBD113, ICD114, MD115, FD116) はデコーダ部220 と出力処理部240 とで構成されている。具体的には、PCD111は抽出部202 が抽出した短型フォーマットのジャンプ演算コードをデコードするPCS デコーダ222 と、抽出部203 が抽出した長型フォーマットのジャンプ演算コードをデコードする PCLデコーダ223 と、出力処理部241 とで構成される。出力処理部241 は、 PCSデコーダ222, PCLデコーダ223 及びFMデコーダ221 の3個のデコーダのデコード結果に従って、 PCSデコーダ222 または PCLデコーダ223 の出力に従うジャンプ演算, 現PC値に”8”を加算する非ジャンプ演算, 無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0067】
IAD112は抽出部204 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ224 と出力処理部242 とで構成される。出力処理部242 は、ISデコーダ224 のデコード結果とFMデコーダ221 のデコード結果とに従って、ISデコーダ224 の出力に従う整数演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0068】
IBD113は抽出部205 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ225 と、抽出部206 が抽出した長型フォーマットの整数演算コードをデコードするILデコーダ226 と、出力処理部243 とで構成される。出力処理部243 は、ISデコーダ225 とILデコーダ226 とFMデコーダ221 との3個のデコーダのデコード結果に従って、ISデコーダ225 またはILデコーダ226 の出力に従う整数演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0069】
ICD114は抽出部207 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ227 と、出力処理部244 とで構成される。出力処理部244 は、ISデコーダ227 のデコード結果とFMデコーダ221 のデコード結果とに従って、ISデコーダ227 の出力に従う整数演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0070】
MD115 は抽出部208, 209, 210 が抽出した短型フォーマットのメモリアクセス演算コードをそれぞれデコードするMSデコーダ228, 229, 230 と、抽出部211 が抽出した長型フォーマットのメモリアクセス演算コードをデコードするMLデコーダ231 と、出力処理部245 とで構成される。出力処理部245 は、MSデコーダ228, 229, 230 とMLデコーダ231 とFMデコーダ221 との計5個のデコーダのデコード結果に従って、MSデコーダ228, 229, 230 またはMLデコーダ231 の出力に従うメモリアクセス演算と無効演算との内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0071】
FD116 は抽出部212 が抽出した短型フォーマットの浮動小数点演算コードをデコードするFSデコーダ232 と、抽出部213 が抽出した長型フォーマットの浮動小数点演算コードをデコードするFLデコーダ233 と、出力処理部246 とで構成される。出力処理部246 は、FSデコーダ232 とFLデコーダ233 とFMデコーダ221 とのデコード結果に従って、FSデコーダ232 またはFLデコーダ233 の出力に従う浮動小数点演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0072】
出力処理部240(241 〜246)の出力は制御回路103 に入力され、演算部104 の演算を制御するために用いられる。具体的には、出力処理部241 の出力はPC部121 でのPC計算の制御に使用される。出力処理部242, 243, 244 の出力はそれぞれ整数演算部120 の整数演算機構(IA, IB, IC)122, 123, 124 での整数演算の制御に使用される。出力処理部245 の出力はメモリアクセス部125 でのメモリアクセス動作の制御に使用される。出力処理部246 の出力は浮動小数点演算部126 での浮動小数点演算の制御に使用される。
【0073】
FMデコーダ221 のデコード結果の一部は命令フェッチ部105 へも出力され、次の命令コードのIIバス108 への出力タイミングを制御する。命令が2個または3個の演算を逐次実行することを指定している場合には、IIバス108 の値がそれぞれ2クロックサイクルまたは3クロックサイクルの間保持され、フォーマットフィールド10で指定された演算順序に従って各出力処理部241 〜246 の出力が制御される。これにより、クロック毎にその時点で有効な演算フィールドに対応する演算部へはその演算フィールドのデコード結果に従う制御信号が、無効な演算フィールドに対応する演算部へは無効演算の制御信号が、それぞれ各出力処理部241 〜246 から出力される。
【0074】
短型フォーマットでのみ指定可能な演算、短型と長型とのいずれのフォーマットでも指定可能な演算、長型フォーマットでのみ指定可能な演算の一覧をそれぞれの演算を処理するデコーダの情報と共に以下の一覧表に示す。
【0075】
表1は短型フォーマットの演算コードのみで指定可能な演算の一覧であり、24種類ある。表2は短型フォーマットと長型フォーマットとのいずれでも指定可能な演算の一覧であり、19種類ある。表3乃至表7は長型フォーマットの演算コードのみで指定可能な演算の一覧であり、74種類ある。
【0076】
【表1】
Figure 0003741551
【0077】
【表2】
Figure 0003741551
【0078】
【表3】
Figure 0003741551
【0079】
【表4】
Figure 0003741551
【0080】
【表5】
Figure 0003741551
【0081】
【表6】
Figure 0003741551
【0082】
【表7】
Figure 0003741551
【0083】
表1乃至表7において、mnemonicは各演算の略号とそのオペランドを、functionは各演算の意味をそれぞれ示す。typeは各演算の命令マッパ101 での分配先となるデコーダの種類を示している。即ち、typeがPCである演算コードは PCSデコーダ222 または PCLデコーダ223 へ、typeがInteger である演算コードはISデコーダ224,ISデコーダ225,ILデコーダ226 またはISデコーダ227 へ、typeがMemoryである演算コードはMSデコーダ228,MSデコーダ229,MSデコーダ230 またはMLデコーダ231 へ、typeがFloating point(FP)である演算コードはFSデコーダ232 またはFLデコーダ233 へ、それぞれフォーマットの長短あるいは命令上のフィールド位置に依存して命令マッパ101 により分配される。
【0084】
なお、formatの欄は、SRは”Short Register”を、SIは”Short Immediate ”を、SMは”Short Memory”を、SBは”Short Branch”を、LRは”Long Register ”を、LIは”Long Immediate”を、LMは”Long Memory ”を、LBは”Long Branch ”をそれぞれ示している。
【0085】
(4) 「命令実行の例」
図12乃至図20の模式図に本発明のデータ処理装置のプログラムの例を示す。ここでは、フォートラン語, C言語によるソースプログラムと、そのソースプログラムを本発明のデータ処理装置のアセンブラ語で表現したアセンブラプログラムとの双方を示している。
【0086】
各アセンブラプログラムでは2個または3個の演算を一組にまとめ、それぞれの組を空行で区切って示してある。各組の2個乃至3個の演算は図1の参照符号1または2で示されているフォーマットにエンコードされ、本発明のデータ処理装置で一命令として処理される。
【0087】
図12に示されているのは、配列A及び配列Bの各要素相互の積の合計を求めるフォートラン言語によるソースプログラムである。このソースプログラムをアセンブラ言語に翻訳すると図13に示されているようなアセンブラプログラムになる。アセンブラプログラムの前半の3個の命令がループの初期設定であり、後半の3個の命令がループを構成する。このプログラムの実行時間の大半はループの実行時間が占めるため、後半の3個の命令を高速実行することが重要である。本発明のデータ処理装置では、ループ内の8個の演算を3個の命令にエンコードし、それぞれの命令で3個または2個の演算を並列に処理するため、ループの演算が高速実行される。
【0088】
命令301 は、浮動小数点レジスタFR1 へメモリから浮動小数点数をロードする演算(FLD)303(長型フォーマットにエンコードされる)と、汎用レジスタR1へ即値をロードする演算(LDI)304(短型フォーマットにエンコードされる)との2個の演算を並列実行する2演算命令である。また、命令302 は、浮動小数点レジスタFR2 へメモリから浮動小数点数をロードする演算(FLD)305(短型フォーマットにエンコードされる)と、汎用レジスタR1へ即値を加算する演算(ADDI)306(短型フォーマットにエンコードされる)と、汎用レジスタR2へ即値を加算する演算(ADDI)307(短型フォーマットにエンコードされる)との3個の演算を並列実行する3演算命令である。
【0089】
参照符号313 で示されている”1C0F”は演算(FLD)303が実行されるタイミングと実行条件とを示すフィールドであり、最初の”1”はこの演算がデコード直後に発行されることを意味し、引き続く”C0F ”はこの演算が条件フラグF0が”偽=10”である場合に有効であることを示す。また、フィールド313 の演算発行タイミング”1”は、フィールド314 の演算発行タイミング”1”及びこの命令が2演算命令であるということと共にフォーマット1の命令コードのフォーマットフィールド10にエンコードされる。フィールド313 及び314 の実行条件”C0F ”はそれぞれ演算(FLD)303及び(LDI)304に対応する実行条件フィールド20にエンコードされる。
【0090】
命令301 を処理する際、演算(FLD)303の演算コードは命令マッパ101 の抽出部211 により切り出され、MLデコーダ231 によりデコードされて出力処理部245 を経て制御回路103 に送られ、メモリアクセス部125 で実行される。演算(LDI)304の演算コードは命令マッパ101 の抽出部204 により切り出され、ISデコーダ224 によりデコードされて出力処理部242 を経て制御回路103 に送られ、IA122 により実行される。ここで、フラグF0が”10”であるとすると、演算(FLD)303と演算(LDI)304とは共に有効であり、タイミング指定が共に”1”であるため、両演算(FLD)303及び(LDI)304はディレイなしに並列実行され、演算結果がレジスタFR1 及びR1に反映される。
【0091】
命令301 はビット4〜23に短型フォーマットの演算フィールドを、ビット24〜63に長型フォーマットの演算フィールドをそれぞれ有する命令であるため、それ以外の演算フィールドに対応する抽出部205, 207, 209, 210で切り出されたビット列は有効な演算コードではない。このため、FMデコーダ221 から無効化信号が出力されることによりデコード結果が出力処理部240 で無効化される。また、抽出部202, 203, 206, 208, 212, 213で切り出されてデコーダ部220 に送られた演算コードは各デコーダが対象とする演算コードではないので、デコーダ部220 で無効演算に変換されて出力される。
【0092】
命令302 を処理する際に、演算(FLD)305の演算コードは抽出部208 により切り出され、MSデコーダ228 によりデコードされて出力処理部245 を経て制御回路103 に送られ、メモリアクセス部125 で実行される。演算(ADDI)306 の演算コードと演算(ADDI)307 の演算コードとはそれぞれ、抽出部205 と抽出部207 により切り出され、ISデコーダ225 とISデコーダ227 とでデコードされて出力処理部243 と出力処理部244 とを経て制御回路103 に送られ、IB123 とIC124 とにより実行される。ここで、フラグF0が”10”であるとすると、演算(FLD)305, 演算(ADDI)306 及び演算(ADDI)307 は全て有効であり、且つタイミング指定が全て”1”であるため、3個の演算はディレイなしに並列実行され、演算結果がレジスタFR2, R1, R2 にそれぞれ反映される。
【0093】
命令302 はビット4〜23, 24〜43, 44〜63に3個の短型フォーマットの演算フィールドを有する命令であるため、それ以外の演算フィールドに対応する抽出部203, 206, 211, 213で切り出されたビット列は有効な演算コードではない。このため、FMデコーダ221 からの無効化信号によりデコード結果が出力処理部240 で無効化される。また、抽出部202, 204, 209, 210, 212 で切り出されてデコーダ部220 に送られた演算コードは各デコーダが対象とする演算コードではないのでデコーダ部220 で無効演算に変換されて出力される。
【0094】
図14は図12に示されているソースプログラムのループを展開してソースプログラムの4回のループが1回のループになるように翻訳したアセンブラプログラムである。ループを展開する目的はプログラムの実行時間を短縮することにある。図13に示されているアセンブラプログラムでは、3命令でソースプログラムのループ1回分の演算を行なうが、図14に示されているアセンブラプログラムでは6命令でソースプログラムのループ4回分の演算を行なう。
【0095】
ここでの命令数の削減には、分岐演算BRA が減少したことと、4個のデータをメモリの連続領域から4個のレジスタにロードする演算(FLD4)309 を使用したことが寄与している。本発明のデータ処理装置では、4個のデータをメモリからロードする演算(FLD4)309 の実行時間が2クロックサイクルであるため、演算数を削減した効果がそのまま実行時間の削減に必ずしも寄与するものではない。しかし、図14に示されているアセンブラプログラムはソースプログラムのループ4回分の演算を9クロックサイクル (分岐演算BRA と演算FLD4とを2クロックサイクルで実行し、その他の演算を1クロックサイクルで実行する場合)で実行するため、ソースプログラムのループ1回分を5クロックサイクル (分岐演算BRA を2クロックサイクルで実行し、その他の演算を1クロックサイクルで実行する場合)で実行する図13に示されているアセンブラプログラムより2倍以上高速である。
【0096】
図15及び図16の模式図には、配列Xの各要素を調べ、その値が一定値(XLIMIT)より大きい要素の数をカウントするプログラムが示されている。ソースプログラムを図15に、それを翻訳したアセンブラプログラムを図16にそれぞれ示す。
【0097】
図16に示されているアセンブラプログラムの後半の3個の命令がループを形成する。ループ中の命令320 はレジスタR1に即値を加算する演算(ADDI)321 と分岐演算(BRA)323と無効演算(NOP)325とにより構成されている。演算(ADDI)321 は、実行条件フィールド322 の値”C4T ”に従ってフラグF4 が”真=11”である場合に演算が有効となり、レジスタR3に新たな値が書き込まれる。フラグF4は、配列Xの要素の値がXLIMITより大きい場合は”11”に、XLIMIT以下である場合は”10”にそれぞれ演算(FCGT)326 によりなるため、演算(ADDI)321 は結果として配列Xの要素の内のXLIMITより大きい値を有する要素の数をカウントすることになる。また分岐演算(BRA)323は、実行条件324 の値”C3F ”によりフラグF3が”偽=10”である場合にラベルL1へ分岐する。フラグF3は、演算(CMP)327により、配列Xの最後の要素に到達した時点で”11”に、その他の場合は”10”にそれぞれなる。つまり、分岐演算(BRA)323は図15のDOループを制御する分岐である。
【0098】
図17はポインタ操作を行なうC言語によるソースプログラムを、図18はそれを翻訳したアセンブラプログラムをそれぞれ示す模式図である。
【0099】
命令330 は3個のストア演算(STW)331, 333, 335を行なう命令である。この命令では、これら3個のストア演算(STW)331, 333, 335の発行タイミングをフィールド332, 334, 336 の最初でそれぞれ”1”, ”2”, ”3”と指定することにより、逐次実行する。演算331, 333, 335 はそれぞれ、命令マッパ101 の抽出部208, 209, 210 により切り出され、MSデコーダ228, 229, 230 によりデコードされて出力処理部245 へ出力される。出力処理部245 は、各演算の発行タイミングを指定するフォーマットフィールド10のFMデコーダ221 によるデコード結果に従って、MSデコーダ228, 229, 230 のデコード結果を1クロックサイクル遅延させつつ制御回路103 に送る。従って、3個のストア演算(STW)331, 333, 335は1クロックずつずれてメモリアクセス部125 で逐次実行される。
【0100】
命令340 はロード演算(LDW)341と比較演算(CMP)343と分岐演算(BRA)345とを行なう命令である。この命令では、これら3個の演算の発行タイミングをフィールド342, 344, 346 の最初でそれぞれ”1”, ”2”, ”3”と指定することにより3個の演算を逐次実行する。演算341, 343, 345 はそれぞれ、フォーマット1 の3演算命令のフィールド12, 13, 14にエンコードされ、命令マッパ101 の抽出部209, 207, 202 により切り出され、MSデコーダ229,ISデコーダ227, PCSデコーダ222 によりデコードされて出力処理部245, 244, 241 へ出力される。出力処理部245, 244, 241 は、各演算の発行タイミングを指定するフォーマットフィールド10のFMデコーダ221 によるデコード結果に従って、3個のデコード結果を指定された順序に1クロックサイクルずつ遅延させつつ制御回路103 に送る。従って、まず演算(LDW)341が実行され、次に演算(CMP)343が実行され、最後に演算(BRA)345が実行される。演算(CMP)343は演算(LDW)341でレジスタR1にロードされた値を使用し、演算(BRA)345は演算(CMP)343の結果に従って変化するフラグF3の値に依存した処理を行なうため、並列実行した場合と逐次実行した場合とでは演算結果が異なる。
【0101】
図19は条件文 (if文) が入れ子になっているC言語によるソースプログラムを、図20はそれを翻訳したアセンブラプログラムをそれぞれ示す模式図である。
【0102】
このプログラムは配列の要素の値が”2”になる場合に特殊な処理を行なうが、その場合を除けば、2個の配列の要素を順次的に走査し、相互の値が異なっている場合にいずれが大きいかに応じて”1”または”-1”のいずれかを呼び出し、元へ返すプログラムである。
【0103】
演算(IFG)350はフラグを初期化する演算である。この演算が行なわれることにより、フラグF0のみが”偽=10”の状態になり、他のフラグF1〜F7はいずれも”未定義=00”の状態となる。本発明のデータ処理装置では、全ての演算が実行条件を伴うため、全フラグが”00”の状態では有効な演算が行なえない。このため、フラグF0のみは初期状態で”10”になるようにし、大半のプログラムではフラグF0が”10”であることを前提として演算を実行する。
【0104】
演算(CNE)351はレジスタR3の値とR4の値とが不一致(not equal) であるか否かを調べ、その結果をフラグF6に反映する演算である。
【0105】
演算(CLT)352はレジスタR3の値がレジスタR4の値より小であるか否か( ”less than ”) を調べ、その結果をフラグF7に反映する演算である。但し、この命令は実行条件として”C6T ”が指定されているため、フラグF6が”真=11”である場合にのみフラグF7を”11”または”10”に変更する。即ち、フラグF6が”偽=10”である場合は、フラグF7を”未定義=00”の状態に維持する。
【0106】
演算(LDI)353はフラグF7が”11”である場合に演算結果が有効となり、”-1”をレジスタR15 に書き込む演算である。
【0107】
演算(LDI)354はフラグF7が”10”である場合に演算結果が有効となり、”1”をレジスタR15 に書き込む演算である。
【0108】
そして、演算(JMP)355はフラグF6が”11”である場合に呼び出されたルーチンへ制御を返す命令である。”aa≠bb”である場合にこれらの三つの演算により”1”または”-1”が呼び出し元へ返される。”aa=bb”である場合はレジスタR15 には何も書き込まれないし、呼び出し元へ制御が返されることもない。
【0109】
〔他の実施の形態〕
上述の第1の実施の形態においては、命令のフォーマットフィールド10が4ビットであり、一命令で2個または3個の演算を指定する命令を処理するデータ処理装置について述べている。しかし、フォーマットフィールドのビット数または一命令で指定できる演算の数が上述の第1の実施の形態と異なる場合にも、命令のフォーマット及び演算の順序を指定するフォーマットフィールドを有する命令を処理するデータ処理装置を同様に実現することは可能である。
【0110】
図21はフォーマットフィールドが2ビットであり、一命令が1個または2個の演算フィールドを有する場合の本発明のデータ処理装置の第2の実施の形態の命令フォーマットを示す模式図である。
【0111】
この第2の実施の形態では、命令フォーマットは2種類である。参照符号401 は1個のフォーマットフィールド(FM)410 と2個の演算フィールド411, 412とで構成される2演算命令のフォーマットを示しており、参照符号402 は1個のフォーマットフィールド410 と1個の演算フィールド413 とで構成される1演算命令のフォーマットを示している。なお、本第2の実施の形態においては、命令は4バイト(32ビット) の固定長であり、図21に示されているフォーマット401 の2演算命令もフォーマット402 の1演算命令も共に全体としては4バイト長である。
【0112】
フォーマット401 の2演算命令では、2個の演算フィールド411, 412それぞれが15ビットの短型フォーマットの演算コードを1個ずつ指定する。フォーマット402 の1演算命令では、1個の演算フィールド413 が30ビットの長型フォーマットの演算コードを1個指定する。
【0113】
図22の模式図にフォーマットフィールド410 の内容、即ちその値と意味との詳細を示す。なお、この第2の実施の形態においては、フォーマットフィールド410 は2ビット構成であり、4種類に分類される。ここで、”1st ”, ”2nd ”及び”--- ”は前述の図2に示されている第1の実施の形態の場合と同様の意味を有する。
【0114】
フォーマットフィールド410 では、2演算命令のフォーマット401 と1演算命令のフォーマット402 との区別のほか、2演算命令の演算の順序を指定する。ここで演算の順序の指定とは、図22に示されているように、2個の演算を逐次実行する場合の順序を指定する以外に2個の演算を並列実行する場合をも含む。
【0115】
この第2の実施の形態のハードウェア構成は図23に示されているが、図10に示されている第1の実施の形態のハードウェアと類似した構成を有する。主な相違点は、整数演算に関する命令デコーダと整数演算部とが3個ではなく2個のサブブロックから構成されることである。具体的には、図10に参照符号112, 113, 114 及び122, 123, 124 で示されている3組の内の参照符号112, 113及び122, 123で示されている2組にて構成されること、及び浮動小数点演算に関する命令デコーダ116 及び演算部126 が備えられていないことである。
【0116】
また、図24のブロック図に図23のブロック図に対応する命令マッパ101 及び命令デコーダ102 の具体的な構成例を示す。
【0117】
命令マッパ101 は、IIバス108 へ出力されている32ビットの命令コードからフォーマットフィールド410,各演算フィールド411 〜413 を抽出する演算フィールド抽出部200 と、フォーマットフィールド410 をデコードするFMデコーダ621 とで構成される。
【0118】
演算フィールド抽出部200 の各抽出部601 〜613 はそれぞれIIバス108 上の命令コードの一部のビットフィールドを抽出し、命令デコーダ102 を構成する各デコーダ111 〜113, 115に対応する各演算フィールドのビット列を出力する。32ビットのIIバス108 の内、抽出部601 はビット0〜1を、抽出部602 はビット2〜16を、抽出部603 はビット17〜31を、抽出部604 はビット2〜31を、抽出部605 はビット2〜16を、抽出部606 はビット17〜31を、抽出部607 はビット2〜31を、抽出部608 はビット2〜16を、抽出部609 はビット17〜31を、抽出部610 はビット2〜31を、抽出部611 はビット2〜16を、抽出部612 はビット17〜31を、抽出部613 はビット2〜31をそれぞれ抽出して命令デコーダ102 へ出力する。
【0119】
命令デコーダ102(PCD111, IAD112, IBD113, MD115)はデコーダ部220 と出力処理部240 とで構成されている。具体的には、PCD111は抽出部602 が抽出した短型フォーマットのジャンプ演算コードをデコードするPCS デコーダ622 と、抽出部603 が抽出した短型フォーマットのジャンプ演算コードをデコードする PCSデコーダ623 と、抽出部604 が抽出した長型フォーマットのジャンプ演算コードをデコードする PCLデコーダ624 と、出力処理部641 とで構成される。出力処理部641 は、 PCSデコーダ622, 623,PCLデコーダ624 及びFMデコーダ621 の4個のデコーダのデコード結果に従って、 PCSデコーダ622, 623または PCLデコーダ624 の出力に従うジャンプ演算, 現PC値に”8”を加算する非ジャンプ演算, 無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0120】
IAD112は抽出部605 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ625 と、抽出部606 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ626 と、抽出部607 が抽出した長型フォーマットの整数演算コードをデコードするILデコーダ627 と、出力処理部642 とで構成される。出力処理部642 は、ISデコーダ625, 626とILデコーダ627 とFMデコーダ621 との4個のデコーダのデコード結果に従って、ISデコーダ625, 626またはILデコーダ627 の出力に従う整数演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0121】
IBD113は抽出部608 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ628 と、抽出部609 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ629 と、抽出部610 が抽出した長型フォーマットの整数演算コードをデコードするILデコーダ630 と、出力処理部643 とで構成される。出力処理部643 は、ISデコーダ628, 629とILデコーダ630 とFMデコーダ621 との4個のデコーダのデコード結果に従って、ISデコーダ628, 629またはILデコーダ630 の出力に従う整数演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0122】
MD115 は抽出部611, 612が抽出した短型フォーマットのメモリアクセス演算コードをそれぞれデコードするMSデコーダ631, 632と、抽出部613 が抽出した長型フォーマットのメモリアクセス演算コードをデコードするMLデコーダ633 と、出力処理部644 とで構成される。出力処理部644 は、MSデコーダ631, 632とMLデコーダ633 とFMデコーダ621 との計4個のデコーダのデコード結果に従って、MSデコーダ631, 632またはMLデコーダ633 の出力に従うメモリアクセス演算と無効演算との内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0123】
出力処理部640(641 〜644)の出力は制御回路103 に入力され、演算部104 の演算を制御するために用いられる。具体的には、出力処理部641 の出力はPC部121 でのPC計算の制御に使用される。出力処理部642, 643の出力はそれぞれ整数演算部120 の整数演算機構(IA, IB)122, 123での整数演算の制御に使用される。出力処理部644 の出力はメモリアクセス部125 でのメモリアクセス動作の制御に使用される。
【0124】
図25は1ビットのフォーマットフィールドを1個または2個有し、一命令が1個または2個の演算フィールドを含む本発明のデータ処理装置の第3の実施の形態の命令フォーマットを示す模式図である。
【0125】
この第3の実施の形態の命令フォーマットは2種類である。参照符号501 はそれぞれが1ビットの2個のフォーマットフィールド(FM)505, 506と、それぞれが15ビットの2個の演算フィールド511, 512とで構成される2演算命令のフォーマットであり、参照符号502 は1ビットの1個のフォーマットフィールド505 と、31ビットの1個の演算フィールド513 とで構成される1演算命令のフォーマットである。なお、この第3の実施の形態においては、命令は4バイト(32ビット) の固定長であり、図25に示されているフォーマット501 の2演算命令もフォーマッ5 402 の1演算命令も共に全体としては4バイト長である。
【0126】
フォーマット501 の2演算命令では、2個の演算フィールド511, 512がそれぞれ1個ずつの15ビットの短型フォーマットの演算コードを指定する。フォーマット502 の1演算命令では、1個の演算フィールド513 が31ビットの長型フォーマットの演算コードを1個指定する。
【0127】
図26の模式図にフォーマットフィールド505, 506の内容、即ちその値と意味との詳細を示す。なお、この第3の実施の形態においては、フォーマットフィールド505, 506はいずれも1ビット構成であり、命令フォーマット501 で2種類, 命令フォーマット502 で1種類、計3種類の指定をする。ここで、”1st ”, ”2nd ”及び”--- ”は前述の図2及び図22に示されている第1及び第2の実施の形態の場合と同様の意味を有する。
【0128】
ところで、この第3の実施の形態の命令フォーマットのフォーマットフィールド505, 506は前述の第2の実施の形態の命令フォーマットのフォーマットフィールド410 を縮退して一部を二分割したものである。この第3の実施の形態は前述の第2の実施の形態に比して、2演算命令のフォーマット501 のフォーマットフィールド(FM)が2個のフィールド505, 506に分離され、かつフォーマットフィールド505 で指定可能な命令のフォーマットと演算実行順序の組み合わせが4種類から3種類に減少している。しかし、それらの代わりに、長型フォーマット502 の演算フィールド513 の長さが30ビットから31ビットに増加し、かつ短型フォーマット501 の演算フィールド511, 512が16ビット境界であるビット15とビット16とをまたぐことなく配置されている。
【0129】
この第3の実施の形態のハードウェア構成は前述の図23に示されている第2の実施の形態と同様である。
【0130】
また、図27のブロック図に本第3の実施の形態のハードウェア構成に対応する命令マッパ101 及び命令デコーダ102 の具体的な構成例を示す。
【0131】
命令マッパ101 は、IIバス108 へ出力されている32ビットの命令コードからフォーマットフィールド505, 506, 各演算フィールド511 〜513 を抽出する演算フィールド抽出部200 と、フォーマットフィールド505, 506 をデコードするFMデコーダ721 とで構成される。
【0132】
演算フィールド抽出部200 の各抽出部701 〜713 はそれぞれIIバス108 上の命令コードの一部のビットフィールドを抽出し、命令デコーダ102 を構成する各デコーダ111 〜113, 115に対応する各演算フィールドのビット列を出力する。32ビットのIIバス108 の内、抽出部701 はビット0及び16を、抽出部702 はビット1〜15を、抽出部703 はビット17〜31を、抽出部704 はビット1〜31を、抽出部705 はビット1〜15を、抽出部706 はビット17〜31を、抽出部707 はビット1〜31を、抽出部708 はビット1〜15を、抽出部709 はビット17〜31を、抽出部710 はビット1〜31を、抽出部711 はビット1〜15を、抽出部712 はビット17〜31を、抽出部713 はビット1〜31をそれぞれ抽出して命令デコーダ102 へ出力する。
【0133】
命令デコーダ102(PCD111, IAD112, IBD113, MD115)はデコーダ部220 と出力処理部240 とで構成されている。具体的には、PCD111は抽出部702 が抽出した短型フォーマットのジャンプ演算コードをデコードするPCS デコーダ722 と、抽出部703 が抽出した短型フォーマットのジャンプ演算コードをデコードする PCSデコーダ723 と、抽出部704 が抽出した長型フォーマットのジャンプ演算コードをデコードする PCLデコーダ724 と、出力処理部741 とで構成される。出力処理部741 は、 PCSデコーダ722, 723,PCLデコーダ724 及びFMデコーダ721 の4個のデコーダのデコード結果に従って、 PCSデコーダ722, 723または PCLデコーダ724 の出力に従うジャンプ演算, 現PC値に”8”を加算する非ジャンプ演算, 無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0134】
IAD112は抽出部705 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ725 と、抽出部706 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ726 と、抽出部707 が抽出した長型フォーマットの整数演算コードをデコードするILデコーダ727 と、出力処理部742 とで構成される。出力処理部742 は、ISデコーダ725, 726とILデコーダ727 とFMデコーダ721 との4個のデコーダのデコード結果に従って、ISデコーダ725, 726またはILデコーダ727 の出力に従う整数演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0135】
IBD113は抽出部708 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ728 と、抽出部709 が抽出した短型フォーマットの整数演算コードをデコードするISデコーダ729 と、抽出部710 が抽出した長型フォーマットの整数演算コードをデコードするILデコーダ730 と、出力処理部743 とで構成される。出力処理部743 は、ISデコーダ728, 729とILデコーダ730 とFMデコーダ721 との4個のデコーダのデコード結果に従って、ISデコーダ728, 729またはILデコーダ730 の出力に従う整数演算または無効演算の内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0136】
MD115 は抽出部711, 712が抽出した短型フォーマットのメモリアクセス演算コードをそれぞれデコードするMSデコーダ731, 732と、抽出部713 が抽出した長型フォーマットのメモリアクセス演算コードをデコードするMLデコーダ733 と、出力処理部744 とで構成される。出力処理部744 は、MSデコーダ731, 732とMLデコーダ733 とFMデコーダ721 との計4個のデコーダのデコード結果に従って、MSデコーダ731, 732またはMLデコーダ733 の出力に従うメモリアクセス演算と無効演算との内のいずれか一つを行なう制御信号を制御回路103 へ出力する。
【0137】
出力処理部740(741 〜744)の出力は制御回路103 に入力され、演算部104 の演算を制御するために用いられる。具体的には、出力処理部741 の出力はPC部121 でのPC計算の制御に使用される。出力処理部742, 743の出力はそれぞれ整数演算部120 の整数演算機構(IA, IB)122, 123での整数演算の制御に使用される。出力処理部744 の出力はメモリアクセス部125 でのメモリアクセス動作の制御に使用される。
【0138】
なお、以上の各実施の形態においては、演算フィールドに配置される演算の種類に可能な限り制限を加えない場合を例としているが、演算フィールドに配置される演算の種類に制限が加えられてもよいのであれば、本発明のデータ処理装置を図10に示されているよりはるかに簡易なハードウェアで構成することも可能である。
【0139】
たとえば、第3の実施の形態の演算フィールド511 と512 とに配置可能な演算の対称性をなくし、フォーマットフィールド505, 506が共に”01”である場合には演算フィールド512 に無効演算命令のみを配置可能に制限することにより、一方が無効演算である場合にのみ並列実行演算を実行し(実際には演算がなく並列デコードのみ必要)、逐次実行演算である場合には一命令デコーダで演算フィールド511 と512 との双方の演算を時間をずらせて逐次的にデコードすることにより、演算フィールド511 と512 とに配置可能な演算が自由な場合に比して、ハードウェアの規模をほぼ半分程度に削減することが可能になる。
【0140】
以上のとおり、本発明のデータ処理装置では、実行すべき演算の種類を指定する少なくとも1個の演算フィールドと、演算フィールドの個数を指定するフォーマットフィールドとからなる命令コードをデコードして制御信号を出力する命令デコーダと、命令デコーダに接続しており、命令デコーダが出力する制御信号に従って命令を実行する複数の演算手段とを備え、第1の個数の演算フィールドを含む第1の命令コードを命令デコーダがデコードした場合に、命令デコーダは第1の制御信号を出力し、複数の演算手段は第1の制御信号に従って第1の個数の演算を実行し、第1の個数とは異なる第2の個数の演算フィールドを含み、第1の命令コードと同一コード長の第2の命令コードを命令デコーダがデコードした場合に、命令デコーダは第1の制御信号とは異なる第2の制御信号を出力し、複数の演算手段は第2の制御信号に従って第2の個数の演算を実行する。
たとえば2個の演算フィールドとフォーマットフィールドとからなる64ビット長の2演算命令を処理する際は、命令デコーダが2演算を行なうための制御信号を出力し、2個の演算手段が演算を実行し、3個の演算フィールドとフォーマットフィールドとからなる64ビット長の3演算命令を処理する際は、命令デコーダが3演算を行なうための制御信号を出力し、3個の演算手段が演算を実行する。このように本発明のデータ処理装置では、命令の長さは一定に維持しながらも一命令で指定可能な演算の個数を調整することにより、レジスタ番号及び即値等の必要情報が多く且つ演算コードが長い演算と、必要情報が少なく且つ演算コードが短い演算とを固定長の命令コードにエンコードすることが可能になる。このため、命令長を特定するための処理が不要になり、命令の切れ目が常に整置されたアドレス境界に位置するので、命令デコード処理が容易になると共に、コード化効率の良いプログラムを記述すことが可能になる。
【0141】
また、本発明のデータ処理装置は、命令コードをデコードする命令デコーダと、命令デコーダに接続しており、命令デコーダのデコード結果に従って制御信号を出力する制御部と、制御部に接続しており、制御部が出力する制御信号に従って命令を実行する第1の演算手段及び第2の演算手段とを備え、実行すべき演算の種類を指定する少なくとも第1及び第2の演算フィールドと、演算フィールドの個数と演算フィールドが指定する演算の実行順序とを指定するフォーマットフィールドとからなる命令コードを命令デコーダがデコードした場合に、制御部はフォーマットフィールドが指定する演算の実行順序と、第1及び第2の演算フィールドが指定する演算の種類とに従って第1の制御信号と第2の制御信号とを出力し、第1の演算手段は第1の制御信号に従って第1の演算を実行し、第2の演算手段は第2の制御信号に従って第2の演算を実行する。
たとえば2個または3個の演算フィールドと、演算フィールドの数と演算フィールドで指定された演算の実行順序を指定するフォーマットフィールドとからなる複数演算命令を処理する際に、命令デコーダが複数命令をデコードしてフォーマットフィールドで指定された順序で2個または3個の制御信号群を出力し、2個または3個の演算手段がそれぞれの制御信号群で指定された演算を実行する。このように本発明のデータ処理装置では、一命令にエンコード可能な演算の数とエンコードされた演算の実行順序とを可変にしている。このため、演算の実行順序を決定するための無駄な無効演算を用いる必要がない固定長の複数演算命令でコード化効率のよいプログラムを記述することが可能になる。
【0142】
また本発明に係るデータ処理装置は上述の構成において、第1の演算フィールドが指定する第1の演算と、第2の演算フィールドが指定する第2の演算とを逐次実行することをフォーマットフィールドにより指定された第1の命令コードを命令デコーダがデコードした場合に、命令デコーダは第1のデコード結果を出力し、制御部が第1のデコード結果に従って第1の時刻に第1の制御信号を、その後の第2の時刻に第2の制御信号を出力することにより、第1の演算手段が第1の制御信号に従って第1の演算を実行し、その後に第2の演算手段が第2の制御信号に従って第2の演算を実行し、第1の演算フィールドが指定する第3の演算と、第2の演算フィールドが指定する第4の演算とを同時実行することをフォーマットフィールドにより指定された第2の命令コードを命令デコーダがデコードした場合に、命令デコーダは第2のデコード結果を出力し、制御部が第2のデコード結果に従って第3の制御信号と第4の制御信号とを同時に出力することにより、第1の演算手段と第2の演算手段とが同時に第3の制御信号及び第4の制御信号に従って第3の演算及び第4の演算をそれぞれ実行する。
たとえば2個または3個の演算フィールドと、演算フィールドの数と演算フィールドで指定された演算の実行順序を指定するフォーマットフィールドとからなる複数演算命令を処理する際に、命令デコーダが複数命令をデコードしてフォーマットフィールドで指定された順序に従って2個または3個の制御信号群を出力し、2個または3個の演算手段がそれぞれの制御信号群で指定された演算を逐次実行したり、あるいは2個または3個の演算フィールドと、演算フィールドの数と演算フィールドで指定された演算を同時実行することを指定するフォーマットフィールドとからなる複数演算命令を処理する際に、命令デコーダが複数命令をデコードして同時に2個または3個の制御信号群を出力し、2個または3個の演算手段がそれぞれの制御信号群で指定された演算を同時実行する。このように本発明のデータ処理装置では、一命令にエンコードされる演算の数とエンコードされた演算を同時実行するかまたは逐次実行するかを指定できる。このため、固定長の複数演算命令で同時実行可能な演算は同時にエンコードして高速実行し、順序づけが必要な演算は無駄な無効演算を用いずにコード化効率よくエンコードして逐次実行することにより、高速かつコンパクトなプログラムを記述することが可能になる。
【0143】
また本発明に係るデータ処理装置は、命令コードの所定のフィールドをデコードして制御信号を出力する第1のデコーダと、第1のデコーダに接続しており、第1のデコーダが出力する制御信号に従って動作する第1の演算実行部と、所定のフィールドをデコードして制御信号を出力する第2のデコーダと、第2のデコーダに接続しており、第2のデコーダが出力する制御信号に従って動作する第2の演算実行部とを備え、第1の種類の演算が所定のフィールドにより指定されている第1の命令コードがデコード された場合に、第1及び第2のコーダが同時に所定のフィールドをデコードし、第1のデコーダは第1の制御信号を、第2のデコーダは第1の制御信号とは異なる第2の制御信号をそれぞれ出力し、第1の演算実行部は第1の制御信号に従って第1の演算を実行し、第2の演算実行部は第2の制御信号に従って演算を実行せず、第2の種類の演算が所定のフィールドにより指定されている第2の命令コードがデコードされた場合に、第1及び第2のデコーダが同時に所定のフィールドをデコードし、第1のデコーダは第3の制御信号を、第2のデコーダは第3の制御信号とは異なる第4の制御信号をそれぞれ出力し、第1の演算実行部は第3の制御信号に従って演算を実行せず、第2の演算実行部は第4の制御信号に従って第2の演算を実行する。
たとえば命令の第1演算フィールドをデコードして整数演算に関する制御信号を出力する整数演算デコーダと、このデコーダに接続し整数演算に関する制御信号に従って動作する整数演算実行部と、命令の同じ演算フィールドをデコードしてメモリアクセスに関する制御信号を出力するメモリアクセス演算用デコーダと、このデコーダに接続し、メモリアクセスに関する制御信号に従って動作するメモリアクセス部とを備え、演算フィールドで整数加算を指定する命令を処理する際に、整数演算デコーダとメモリアクセス演算デコーダとが同時に整数加算を指定する演算フィールドをデコードし、整数演算デコーダが整数加算に関する制御信号を出力し、メモリアクセス演算デコーダが無効演算の制御信号を出力し、整数演算部が整数加算を実行し、メモリアクセス部が有効なメモリアクセス演算を行なわず、演算フィールドでメモリからレジスタへデータをロードするロード演算を指定する命令を処理する際に、整数演算デコーダとメモリアクセス演算デコーダとが同時にロード演算を指定する演算フィールドをデコードし、整数演算デコーダが無効演算の制御信号を出力し、メモリアドレスアクセス部がロード演算を実行する。このように本発明のデータ処理装置では、命令で指定された1個の演算フィールドを異なる2個の演算部の一方で有効な演算を行ない、他方では有効な演算を行なわないことで演算の種類に依存して2個の種類の演算実行部がそれぞれ専用のデコーダが出力する制御信号に従って動作して命令を処理する。このため、デコーダと演算実行部とを接続する制御信号の配線が単純で回路設計が容易になり、かつ各デコーダは機能が単純で高速なデコードが可能になる。
【0144】
また本発明に係るデータ処理装置は、命令コードの第1の演算フィールドをデコードして第1の制御信号を出力する第1のデコーダと、第1の演算フィールドとは異なる第2の演算フィールドをデコードして第2の制御信号を出力する第2のデコーダと、第1のデコーダと第2のデコーダとに接続しており、第1の制御信号と第2の制御信号との双方を入力していずれか一方を選択的に出力する出力処理部と、出力処理部に接続しており、出力処理部が出力した制御信号に従って動作する演算実行部とを備え、第1の演算フィールドにより第1の演算が、第2の演算フィールドにより第2の演算がそれぞれ指定されている第1の命令コードがデコードされた場合に、第1のデコーダが第1の演算フィールドを、第2のデコーダが第2の演算フィールドを同時にデコードし、第1のデコーダが第1の制御信号を、第2のデコーダが第2の制御信号をそれぞれ出力して出力処理部が第1の制御信号を選択的に演算実行部へ出力することにより、また、第1の演算フィールドにより第3の演算が、第2の演算フィールドにより第1の演算がそれぞれ指定されている第2の命令コードがデコードされた場合に、第1のデコーダが第1の演算フィールドを、第2のデコーダが第2の演算フィールドを同時にデコードし、第1のデコーダが第3の制御信号を、第2のデコーダが第4の制御信号をそれぞれ出力して出力処理部が第4の制御信号を選択的に演算実行部へ出力することにより、第1の演算が第1の演算フィールドまたは第2の演算フィールドのいずれで指定されている場合においても、演算実行部が第1の演算を実行する。
たとえば、第1演算フィールドでメモリからデータをロードするロード演算を指定し、第2演算フィールドで整数加算を指定する第1の命令を処理する際に、第1及び第2のデコーダが同時に第1演算フィールドと第2演算フィールドとをデコードし、第1のデコーダがロード演算に関する制御信号を出力し、第2のデコーダが無効演算の制御信号を出力し、出力処理部がロード演算に関する制御信号を選択的にメモリアクセス部へ出力し、メモリアクセス部がロード演算を実行し、第1演算フィールドで右シフトを指定し、第2演算フィールドでロード演算を指定する第2の命令を処理する際に、第1及び第2のデコーダが並列に第1演算フィールドと第2演算フィールドとをデコードし、第1のデコーダが無効演算の制御信号を出力し、第2のデコーダがロード演算に関する制御信号を出力し、出力処理部がロード演算に関する制御信号を選択的にメモリアクセス部へ出力し、メモリアクセス部がロード演算を実行する。このように本発明のデータ処理装置では、演算を複数の演算フィールドを含む命令のいずれの演算フィールドで指定したかには拘わらずに複数のデコーダが並列に演算フィールドをデコードし、出力処理部がデコード結果から無効な演算を排除して有効な演算を選択的に演算部へ送り、同一の演算実行部が指定された演算を実行する。このため、演算実行部の数より多数の演算フィールドで指定された演算を高速実行可能なデータ処理装置を安価に実現することが可能になる。
【図面の簡単な説明】
【図1】 本発明のデータ処理装置の第1の実施の形態による命令フォーマットを示す模式図である。
【図2】 図1に示されているフォーマットフィールドの値とその意味を示す模式図である。
【図3】 図1に示されている命令フォーマットの演算フィールドで指定可能な短型フォーマットの演算コードを示す模式図である。
【図4】 図1に示されている命令フォーマットの演算フィールドで指定可能な長型フォーマットの演算コードを示す模式図である。
【図5】 図4に示されている長型フォーマットの演算コードのフィールドで指定可能なアドレッシングモードを示す一覧図である。
【図6】 比較演算の真偽判定条件を指定するフィールドの内容を示す一覧図である。
【図7】 本発明のデータ処理装置のレジスタ構成を示す模式図である。
【図8】 本発明のデータ処理装置のプロセッサステータスワードの前半部の構成を示す模式図である。
【図9】 本発明のデータ処理装置のプロセッサステータスワードの後半部の構成を示す模式図である。
【図10】 本発明のデータ処理装置の第1の実施の形態による全体の構成例を示すブロック図である。
【図11】 本発明のデータ処理装置の第1の実施の形態による命令マッパ及び命令デコーダの構成例を示すブロック図である。
【図12】 本発明のデータ処理装置により実行されるプログラムの一例として、配列A及び配列Bの各要素相互の積の合計を求めるフォートラン言語によるソースプログラムを示す模式図である。
【図13】 図12に示されているソースプログラムをアセンブラ言語に翻訳したアセンブラプログラムを示す模式図である。
【図14】 図12に示されているソースプログラムのループを展開してソースプログラムの4回のループが1回のループになるように翻訳したアセンブラプログラムを示す模式図である。
【図15】 本発明のデータ処理装置により実行されるプログラムの一例として、配列Xの各要素を調べ、その値が一定値(XLIMIT)より大きい要素の数をカウントするソースプログラムを示す模式図である。
【図16】 図15に示されているソースプログラムをアセンブラ言語に翻訳したアセンブラプログラムを示す模式図である。
【図17】 本発明のデータ処理装置により実行されるプログラムの一例として、ポインタ操作を行なうC言語によるソースプログラムを示す模式図である。
【図18】 図17に示されているソースプログラムをアセンブラ言語に翻訳したアセンブラプログラムを示す模式図である。
【図19】 本発明のデータ処理装置により実行されるプログラムの一例として、条件文 (if文) が入れ子になっているC言語によるソースプログラムを示す模式図である。
【図20】 図19に示されているソースプログラムをアセンブラ言語に翻訳したアセンブラプログラムを示す模式図である。
【図21】 本発明のデータ処理装置の第2の実施の形態による命令フォーマットを示す模式図である。
【図22】 図21に示されているフォーマットフィールドの値とその意味を示す模式図である。
【図23】 本発明のデータ処理装置の第2の実施の形態による全体の構成例を示すブロック図である。
【図24】 本発明のデータ処理装置の第2の実施の形態による命令マッパ及び命令デコーダの構成例を示すブロック図である。
【図25】 本発明のデータ処理装置の第3の実施の形態による命令フォーマットを示す模式図である。
【図26】 図25に示されているフォーマットフィールドの値とその意味を示す模式図である。
【図27】 本発明のデータ処理装置の第3の実施の形態による命令マッパ及び命令デコーダの構成例を示すブロック図である。
【符号の説明】
1 短型フォーマット、2 長型フォーマット、10 フォーマットフィールド、11, 12, 13, 14, 15 演算フィールド、101 命令マッパ、102 命令デコーダ、103 制御回路、104 演算部、401 短型フォーマット、402 長型フォーマット、410 フォーマットフィールド、411, 412, 413 演算フィールド、501 短型フォーマット、502 長型フォーマット、505, 506 フォーマットフィールド、511, 512, 513 演算フィールド。

Claims (12)

  1. それぞれ演算の種類を指定する第1、第2および第3のオペレーションコードフィールドと、これら3つのオペレーションコードフィールドのそれぞれが指定する演算の実行順序を指定する実行順序指定フィールドとを含んだ命令をデコードする命令デコーダ、および、
    この命令デコーダに接続され、その命令デコーダから出力されるデコード結果により制御され、前記実行順序指定フィールドで指定された実行順序に従って、前記第1、第2および第3のオペレーションコードフィールドによりそれぞれ指定された演算を実行する演算実行部を備え、前記命令デコーダは、前記実行順序指定フィールドが第1の値であることに従って第1のデコード結果を出力し、
    前記演算実行部は、前記第1のデコード結果に従い、第1のサイクルで前記第1および第2のオペレーションコードフィールドのそれぞれが指定する演算を並列に実行し、前記第1のサイクルと連続する第2のサイクルで前記第3のオペレーションコードフィールドにより指定された演算を実行すべくなしてあること
    を特徴とするデータ処理装置。
  2. 命令デコーダは、実行順序指定フィールドが第1の値とは異なる第2の値であることに従って第2のデコード結果を出力し、
    演算実行部は、前記第2のデコード結果に従い、第1、第2および第3のオペレーションコードフィールドのそれぞれが指定する演算を並列に実行すべくなしてあること
    を特徴とする請求項1に記載のデータ処理装置。
  3. 命令デコーダは、実行順序指定フィールドが第1の値とは異なる第3の値であることに従って第3のデコード結果を出力し、
    演算実行部は、前記第3のデコード結果に従い、第1、第2および第3のオペレーションコードフィールドのそれぞれが指定する演算を所定の順番で逐次実行すべくなしてあること
    を特徴とする請求項1に記載のデータ処理装置。
  4. 演算実行部は、演算処理を行う複数の演算部を有し、
    第3のデコード結果に従い、第1、第2および第3のオペレーションコードフィールドのそれぞれが指定する演算は前記複数の演算部のうちの同一の演算部で処理されるべくなしてあること
    を特徴とする請求項3に記載のデータ処理装置。
  5. 演算実行部は、演算の処理を行う第1および第2の演算部を有し、
    第1のサイクルにおいて、前記第1の演算部は第1のオペレーションコードフィールドにより指定された演算を処理し、前記第2の演算部は前記第1の演算部と並列に動作するように第2のオペレーションコードフィールドにより指定された演算を処理し、
    第2のサイクルにおいて、第3のオペレーションコードフィールドにより指定された演算を前記第1の演算部で処理するようにしたこと
    を特徴とする請求項1に記載のデータ処理装置。
  6. 命令デコーダは、命令の第1、第2および第3のオペレーションコードフィールドをそれぞれデコードし、そのデコード結果であるそれぞれ第1、第2および第3の制御信号を出力する第1、第2および第3のデコード部と、実行順序指定フィールドをデコードする第4のデコード部とを有し、この第4のデコード部から出力される第4の制御信号に従って前記第1、第2および第3の制御信号が前記命令デコーダから出力されるタイミングが制御されるように構成され、
    前記演算実行部は、前記命令デコーダから出力される第1、第2および第3の制御信号に従って、第1、第2、第3のオペレーションコードフィールドによりそれぞれ指定された演算を実行すべくなしてあること
    を特徴とする請求項1に記載のデータ処理装置。
  7. 命令は、互いに同一の長さであり、各々命令の実行するための情報を有する第1、第2および第3の固定フィールドを有し、
    第1、第2および第3のオペレーションコードフィールドは、それぞれ前記第1、第2および第3の固定フィールド内にあること
    を特徴とする請求項1に記載のデータ処理装置。
  8. 命令は、さらに、第1のオペレーションコードフィールドにより指定される演算の実行条件を指定する第1の条件指定フィールド、第2のオペレーションコードフィールドにより指定される演算の実行条件を指定する第2の条件指定フィールド、および第3のオペレーションコードフィールドにより指定される演算の実行条件を指定する第3の条件指定フィールドを有し、
    前記第1、第2および第3のオペレーションコードフィールドによりそれぞれ指定された演算のうち、対応する条件指定フィールドの指定する実行条件を満たす演算のみを有効として実行するように構成されたこと
    を特徴とする請求項1に記載のデータ処理装置。
  9. 各々は演算の種類を指定する複数のオペレーションコードフィールドと、これらのオペレーションコードフィールドに対応して設けられ、各々は対応のオペレーションコードフィールドにより指定される演算の実行条件を指定する複数の条件指定フィールドと、前記複数のオペレーションコードフィールドによりそれぞれ指定される演算の少なくとも2つを並列に実行するかもしくは逐次に実行するかを指定する実行順序指定フィールドとを有する命令をデコードする命令デコーダ、および、
    前記命令デコーダに接続され、この命令デコーダから出力されるデコード結果により制御され、前記実行順序指定フィールドに指定される実行順序に従って前記複数のオペレーションコードフィールドにより指定された各演算を実行することのできる演算実行部を備え、
    前記命令デコード部は、前記複数のオペレーションコードフィールドの指定する演算のうち、対応する条件指定フィールドの指定する実行条件を満たす演算のみを有効として実行するように前記命令実行部を制御していること
    を特徴とするデータ処理装置。
  10. 命令実行部は、複数のオペレーションコードフィールドの指定する演算のうち、対応する条件指定フィールドの指定する実行条件を満たす演算の演算結果のみをレジスタ、メモリあるいはフラグに反映するようにしたこと
    を特徴とする請求項9に記載のデータ処理装置。
  11. 命令の実行に際して参照されるべき情報を保持している複数のフラグを備え、
    複数の条件指定フィールドの各々は、前記フラグのいずれか1つを指定し、
    複数のオペレーションコード指定部によりそれぞれ指定された演算の有効もしくは無効は、その対応する条件指定フィールドの指定するフラグに保持された内容が所定の値であるか否かにより決定されるようにしたこと
    を特徴とする請求項9に記載のデータ処理装置。
  12. 複数の条件指定フィールドの各々は、対応するオペレーションコードフィールドに指定される演算が無条件に有効であるとする条件を指定できるようにしたこと
    を特徴とする請求項9に記載のデータ処理装置。
JP29219998A 1995-07-12 1998-10-14 データ処理装置 Expired - Lifetime JP3741551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29219998A JP3741551B2 (ja) 1995-07-12 1998-10-14 データ処理装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP7176380A JP2931890B2 (ja) 1995-07-12 1995-07-12 データ処理装置
JP29219998A JP3741551B2 (ja) 1995-07-12 1998-10-14 データ処理装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP7176380A Division JP2931890B2 (ja) 1995-07-12 1995-07-12 データ処理装置

Publications (2)

Publication Number Publication Date
JPH11194939A JPH11194939A (ja) 1999-07-21
JP3741551B2 true JP3741551B2 (ja) 2006-02-01

Family

ID=16012633

Family Applications (2)

Application Number Title Priority Date Filing Date
JP7176380A Expired - Lifetime JP2931890B2 (ja) 1995-07-12 1995-07-12 データ処理装置
JP29219998A Expired - Lifetime JP3741551B2 (ja) 1995-07-12 1998-10-14 データ処理装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP7176380A Expired - Lifetime JP2931890B2 (ja) 1995-07-12 1995-07-12 データ処理装置

Country Status (2)

Country Link
US (3) US5761470A (ja)
JP (2) JP2931890B2 (ja)

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0974894B1 (en) * 1993-11-05 2002-02-27 Intergraph Corporation Instruction cache associative cross-bar switch
US6360313B1 (en) 1993-11-05 2002-03-19 Intergraph Corporation Instruction cache associative crossbar switch
JP2931890B2 (ja) 1995-07-12 1999-08-09 三菱電機株式会社 データ処理装置
JP3658072B2 (ja) 1996-02-07 2005-06-08 株式会社ルネサステクノロジ データ処理装置およびデータ処理方法
US8583895B2 (en) * 1996-05-15 2013-11-12 Nytell Software LLC Compressed instruction format for use in a VLIW processor
US5991874A (en) * 1996-06-06 1999-11-23 Intel Corporation Conditional move using a compare instruction generating a condition field
JPH1063500A (ja) * 1996-08-23 1998-03-06 Matsushita Electric Ind Co Ltd 信号処理装置
US6061521A (en) * 1996-12-02 2000-05-09 Compaq Computer Corp. Computer having multimedia operations executable as two distinct sets of operations within a single instruction cycle
US5870576A (en) * 1996-12-16 1999-02-09 Hewlett-Packard Company Method and apparatus for storing and expanding variable-length program instructions upon detection of a miss condition within an instruction cache containing pointers to compressed instructions for wide instruction word processor architectures
US20030061471A1 (en) * 1999-07-23 2003-03-27 Masahito Matsuo Data processor
JP3670668B2 (ja) * 1997-01-24 2005-07-13 株式会社ルネサステクノロジ データ処理装置
JP3790607B2 (ja) 1997-06-16 2006-06-28 松下電器産業株式会社 Vliwプロセッサ
JP3414209B2 (ja) * 1997-07-30 2003-06-09 松下電器産業株式会社 プロセッサ
US5922065A (en) * 1997-10-13 1999-07-13 Institute For The Development Of Emerging Architectures, L.L.C. Processor utilizing a template field for encoding instruction sequences in a wide-word format
US6101592A (en) * 1998-12-18 2000-08-08 Billions Of Operations Per Second, Inc. Methods and apparatus for scalable instruction set architecture with dynamic compact instructions
US6216223B1 (en) * 1998-01-12 2001-04-10 Billions Of Operations Per Second, Inc. Methods and apparatus to dynamically reconfigure the instruction pipeline of an indirect very long instruction word scalable processor
US6076154A (en) * 1998-01-16 2000-06-13 U.S. Philips Corporation VLIW processor has different functional units operating on commands of different widths
JP3881763B2 (ja) * 1998-02-09 2007-02-14 株式会社ルネサステクノロジ データ処理装置
US20020087148A1 (en) 1998-02-24 2002-07-04 Brock David L. Flexible instrument
EP0942357A3 (en) 1998-03-11 2000-03-22 Matsushita Electric Industrial Co., Ltd. Data processor compatible with a plurality of instruction formats
EP0945784A1 (en) * 1998-03-27 1999-09-29 Motorola, Inc. Method for storing data structures in memory using address pointers, and apparatus
US6324639B1 (en) 1998-03-30 2001-11-27 Matsushita Electric Industrial Co., Ltd. Instruction converting apparatus using parallel execution code
US6356994B1 (en) * 1998-07-09 2002-03-12 Bops, Incorporated Methods and apparatus for instruction addressing in indirect VLIW processors
JP2000112585A (ja) * 1998-10-02 2000-04-21 Toshiba Corp システムlsi及びパワーマネジメント方法
US7117342B2 (en) * 1998-12-03 2006-10-03 Sun Microsystems, Inc. Implicitly derived register specifiers in a processor
US6314509B1 (en) * 1998-12-03 2001-11-06 Sun Microsystems, Inc. Efficient method for fetching instructions having a non-power of two size
US7114056B2 (en) 1998-12-03 2006-09-26 Sun Microsystems, Inc. Local and global register partitioning in a VLIW processor
US6249861B1 (en) 1998-12-03 2001-06-19 Sun Microsystems, Inc. Instruction fetch unit aligner for a non-power of two size VLIW instruction
US6321325B1 (en) 1998-12-03 2001-11-20 Sun Microsystems, Inc. Dual in-line buffers for an instruction fetch unit
US6820189B1 (en) * 1999-05-12 2004-11-16 Analog Devices, Inc. Computation core executing multiple operation DSP instructions and micro-controller instructions of shorter length without performing switch operation
JP2001005675A (ja) * 1999-06-21 2001-01-12 Matsushita Electric Ind Co Ltd プログラム変換装置及びプロセッサ
GB2352066B (en) * 1999-07-14 2003-11-05 Element 14 Ltd An instruction set for a computer
JP2001034471A (ja) 1999-07-19 2001-02-09 Mitsubishi Electric Corp Vliw方式プロセッサ
JP3730455B2 (ja) 1999-10-01 2006-01-05 富士通株式会社 情報処理装置及び情報処理方法
US6330660B1 (en) 1999-10-25 2001-12-11 Vxtel, Inc. Method and apparatus for saturated multiplication and accumulation in an application specific signal processor
US6408376B1 (en) 1999-10-25 2002-06-18 Intel Corporation Method and apparatus for instruction set architecture to perform primary and shadow digital signal processing sub-instructions simultaneously
US6832306B1 (en) 1999-10-25 2004-12-14 Intel Corporation Method and apparatus for a unified RISC/DSP pipeline controller for both reduced instruction set computer (RISC) control instructions and digital signal processing (DSP) instructions
US6557096B1 (en) 1999-10-25 2003-04-29 Intel Corporation Processors with data typer and aligner selectively coupling data bits of data buses to adder and multiplier functional blocks to execute instructions with flexible data types
US6446195B1 (en) * 2000-01-31 2002-09-03 Intel Corporation Dyadic operations instruction processor with configurable functional blocks
US7120783B2 (en) * 1999-12-22 2006-10-10 Ubicom, Inc. System and method for reading and writing a thread state in a multithreaded central processing unit
US7308686B1 (en) 1999-12-22 2007-12-11 Ubicom Inc. Software input/output using hard real time threads
AU2597401A (en) 1999-12-22 2001-07-03 Ubicom, Inc. System and method for instruction level multithreading in an embedded processor using zero-time context switching
US6704857B2 (en) * 1999-12-23 2004-03-09 Pts Corporation Methods and apparatus for loading a very long instruction word memory
US6732203B2 (en) 2000-01-31 2004-05-04 Intel Corporation Selectively multiplexing memory coupling global bus data bits to narrower functional unit coupling local bus
US6721875B1 (en) * 2000-02-22 2004-04-13 Hewlett-Packard Development Company, L.P. Method and apparatus for implementing a single-syllable IP-relative branch instruction and a long IP-relative branch instruction in a processor which fetches instructions in bundle form
US6842811B2 (en) 2000-02-24 2005-01-11 Pts Corporation Methods and apparatus for scalable array processor interrupt detection and response
US6415376B1 (en) 2000-06-16 2002-07-02 Conexant Sytems, Inc. Apparatus and method for issue grouping of instructions in a VLIW processor
US7010612B1 (en) 2000-06-22 2006-03-07 Ubicom, Inc. Universal serializer/deserializer
US7047396B1 (en) 2000-06-22 2006-05-16 Ubicom, Inc. Fixed length memory to memory arithmetic and architecture for a communications embedded processor system
JP3845814B2 (ja) * 2000-08-10 2006-11-15 株式会社テルミナス・テクノロジー 連想メモリとその検索方法及びルータとネットワークシステム
US7003093B2 (en) * 2000-09-08 2006-02-21 Intel Corporation Tone detection for integrated telecommunications processing
US20020116186A1 (en) * 2000-09-09 2002-08-22 Adam Strauss Voice activity detector for integrated telecommunications processing
US6799262B1 (en) 2000-09-28 2004-09-28 International Business Machines Corporation Apparatus and method for creating instruction groups for explicity parallel architectures
US6883165B1 (en) 2000-09-28 2005-04-19 International Business Machines Corporation Apparatus and method for avoiding deadlocks in a multithreaded environment
US6779106B1 (en) 2000-09-28 2004-08-17 International Business Machines Corporation Apparatus and method for an enhanced integer divide in an IA64 architecture
US6912647B1 (en) * 2000-09-28 2005-06-28 International Business Machines Corportion Apparatus and method for creating instruction bundles in an explicitly parallel architecture
US6886094B1 (en) 2000-09-28 2005-04-26 International Business Machines Corporation Apparatus and method for detecting and handling exceptions
US20030135204A1 (en) 2001-02-15 2003-07-17 Endo Via Medical, Inc. Robotically controlled medical instrument with a flexible section
US7766894B2 (en) 2001-02-15 2010-08-03 Hansen Medical, Inc. Coaxial catheter system
US8414505B1 (en) 2001-02-15 2013-04-09 Hansen Medical, Inc. Catheter driver system
US7699835B2 (en) * 2001-02-15 2010-04-20 Hansen Medical, Inc. Robotically controlled surgical instruments
JP4502532B2 (ja) * 2001-02-23 2010-07-14 株式会社ルネサステクノロジ データ処理装置
JP3564445B2 (ja) * 2001-09-20 2004-09-08 松下電器産業株式会社 プロセッサ、コンパイル装置及びコンパイル方法
US7139897B2 (en) * 2002-04-01 2006-11-21 Hewlett-Packard Development Company, L.P. Computer instruction dispatch
US20030219113A1 (en) * 2002-05-21 2003-11-27 Bershad Neil J. Echo canceller with double-talk and channel impulse response adaptation
JP3851228B2 (ja) * 2002-06-14 2006-11-29 松下電器産業株式会社 プロセッサ、プログラム変換装置及びプログラム変換方法、並びにコンピュータプログラム
US20040024992A1 (en) * 2002-08-02 2004-02-05 Shan-Chyun Ku Decoding method for a multi-length-mode instruction set
JP2004152049A (ja) * 2002-10-31 2004-05-27 Renesas Technology Corp データ処理装置
US7822950B1 (en) 2003-01-22 2010-10-26 Ubicom, Inc. Thread cancellation and recirculation in a computer processor for avoiding pipeline stalls
US7610476B1 (en) * 2003-12-05 2009-10-27 Advanced Micro Devices, Inc. Multiple control sequences per row of microcode ROM
JP4283131B2 (ja) * 2004-02-12 2009-06-24 パナソニック株式会社 プロセッサ及びコンパイル方法
US9047094B2 (en) 2004-03-31 2015-06-02 Icera Inc. Apparatus and method for separate asymmetric control processing and data path processing in a dual path processor
US7949856B2 (en) * 2004-03-31 2011-05-24 Icera Inc. Method and apparatus for separate control processing and data path processing in a dual path processor with a shared load/store unit
US8484441B2 (en) * 2004-03-31 2013-07-09 Icera Inc. Apparatus and method for separate asymmetric control processing and data path processing in a configurable dual path processor that supports instructions having different bit widths
US7475222B2 (en) * 2004-04-07 2009-01-06 Sandbridge Technologies, Inc. Multi-threaded processor having compound instruction and operation formats
CN1950797A (zh) * 2004-05-13 2007-04-18 皇家飞利浦电子股份有限公司 多指令字处理器中反馈连接的运行时间选择
GB2414308B (en) * 2004-05-17 2007-08-15 Advanced Risc Mach Ltd Program instruction compression
US7526633B2 (en) * 2005-03-23 2009-04-28 Qualcomm Incorporated Method and system for encoding variable length packets with variable instruction sizes
JP4766487B2 (ja) * 2006-09-08 2011-09-07 株式会社ソニー・コンピュータエンタテインメント プログラム改ざん検出装置
US9069547B2 (en) 2006-09-22 2015-06-30 Intel Corporation Instruction and logic for processing text strings
US20090209888A1 (en) * 2008-02-18 2009-08-20 Seyed Hessam Khatami Spine Wheel
US8549264B2 (en) * 2009-12-22 2013-10-01 Intel Corporation Add instructions to add three source operands
JP2011145886A (ja) * 2010-01-14 2011-07-28 Nec Corp 情報処理装置
US9678754B2 (en) 2010-03-03 2017-06-13 Qualcomm Incorporated System and method of processing hierarchical very long instruction packets
JP5565228B2 (ja) 2010-09-13 2014-08-06 ソニー株式会社 プロセッサ
JP5813484B2 (ja) * 2011-11-30 2015-11-17 ルネサスエレクトロニクス株式会社 Vliwプロセッサと命令構造と命令実行方法
US9582256B2 (en) * 2013-03-14 2017-02-28 Sas Institute Inc. Automated cooperative concurrency with minimal syntax
US10402199B2 (en) 2015-10-22 2019-09-03 Texas Instruments Incorporated Conditional execution specification of instructions using conditional extension slots in the same execute packet in a VLIW processor
GB2548604B (en) 2016-03-23 2018-03-21 Advanced Risc Mach Ltd Branch instruction
GB2548602B (en) * 2016-03-23 2019-10-23 Advanced Risc Mach Ltd Program loop control
GB2548603B (en) 2016-03-23 2018-09-26 Advanced Risc Mach Ltd Program loop control

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2554050B2 (ja) * 1986-02-26 1996-11-13 株式会社日立製作所 デ−タ処理方法
US5202967A (en) * 1988-08-09 1993-04-13 Matsushita Electric Industrial Co., Ltd. Data processing apparatus for performing parallel decoding and parallel execution of a variable word length instruction
JPH0810428B2 (ja) * 1988-12-26 1996-01-31 三菱電機株式会社 データ処理装置
US5210864A (en) * 1989-06-01 1993-05-11 Mitsubishi Denki Kabushiki Kaisha Pipelined microprocessor with instruction execution control unit which receives instructions from separate path in test mode for testing instruction execution pipeline
JPH07120284B2 (ja) * 1989-09-04 1995-12-20 三菱電機株式会社 データ処理装置
JP2835103B2 (ja) * 1989-11-01 1998-12-14 富士通株式会社 命令指定方法及び命令実行方式
JP2507638B2 (ja) * 1989-12-01 1996-06-12 三菱電機株式会社 デ―タ処理装置
DE69231011T2 (de) * 1991-02-08 2000-09-28 Fujitsu Ltd Cachespeicher zur Verarbeitung von Befehlsdaten und Datenprozessor mit demselben
US5787303A (en) * 1991-10-31 1998-07-28 Kabushiki Kaisha Toshiba Digital computer system capable of processing a plurality of instructions in parallel based on a VLIW architecture
US5371864A (en) * 1992-04-09 1994-12-06 International Business Machines Corporation Apparatus for concurrent multiple instruction decode in variable length instruction set computer
JP2636136B2 (ja) * 1993-04-27 1997-07-30 工業技術院長 演算処理装置及び演算処理方法
US5586277A (en) * 1994-03-01 1996-12-17 Intel Corporation Method for parallel steering of fixed length fields containing a variable length instruction from an instruction buffer to parallel decoders
JP2931890B2 (ja) * 1995-07-12 1999-08-09 三菱電機株式会社 データ処理装置
JPH1049368A (ja) * 1996-07-30 1998-02-20 Mitsubishi Electric Corp 条件実行命令を有するマイクロプロセッサ
JP3147021B2 (ja) 1997-02-26 2001-03-19 松下電器産業株式会社 積層型フィルムコンデンサ用積層フィルムのスリット方法

Also Published As

Publication number Publication date
JPH11194939A (ja) 1999-07-21
US6115806A (en) 2000-09-05
JP2931890B2 (ja) 1999-08-09
US6397323B1 (en) 2002-05-28
US5761470A (en) 1998-06-02
JPH0926878A (ja) 1997-01-28
US20020042871A1 (en) 2002-04-11

Similar Documents

Publication Publication Date Title
JP3741551B2 (ja) データ処理装置
EP2524303B1 (en) Mapping between registers used by multiple instruction sets
EP0368332B1 (en) Pipeline data processor
JP2550213B2 (ja) 並列処理装置および並列処理方法
US7793081B2 (en) Implementing instruction set architectures with non-contiguous register file specifiers
US20060174089A1 (en) Method and apparatus for embedding wide instruction words in a fixed-length instruction set architecture
US6950926B1 (en) Use of a neutral instruction as a dependency indicator for a set of instructions
US6615339B1 (en) VLIW processor accepting branching to any instruction in an instruction word set to be executed consecutively
Berenbaum et al. Introduction to the CRISP Instruction Set Architecture.
JP4502532B2 (ja) データ処理装置
US6209080B1 (en) Constant reconstruction processor that supports reductions in code size and processing time
JP3841967B2 (ja) マイクロプロセッサ
JPS623332A (ja) 情報処理装置
EP0992892B1 (en) Compound memory access instructions
JP2636821B2 (ja) 並列処理装置
JP3102399B2 (ja) データ処理装置及び方法
JP2785820B2 (ja) 並列処理装置
JP2927281B2 (ja) 並列処理装置
Demaille et al. Instruction Selection
Dandamudi RISC Processors

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051108

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081118

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091118

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151118

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151118

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151118

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term