WO1996029646A1

WO1996029646A1 - Processeur

Info

Publication number: WO1996029646A1
Application number: PCT/JP1996/000673
Authority: WO
Inventors: Kiyokazu Nishioka; Kazuhiko Tanaka; Yoshifumi Fujikawa; Toru Nojiri; Keiji Kojima; Koichi Terada; Yoshiki Kurokawa; Koji Hosoki
Original assignee: Hitachi, Ltd.
Priority date: 1995-03-17
Filing date: 1996-03-15
Publication date: 1996-09-26
Also published as: KR19980703033A; US6401190B1; US20020099924A1; US20060053271A1; KR100325658B1; JP3547139B2; US6965981B2

Description

明細書プロセッサ

技術分野

本発明は、デジタル動画や 3次元グラフィックスのようなマルチメディァ処理に適したプロセッサに関わり、特に、並列度の高い処理を少なぃコードサイズで実現するプロセッサに関する。

背景技術

近年、ノソコン、ワークステーションを中心にして、マルチメディァ対応が進展している。マルチメディア対応に必要な機能は、主として、動面圧縮 ·伸張、音声圧縮 ·伸張、 3次元グラフイツクス、及び各種認識処理である。.音声処理などには、従来から、数 1 O M O P S性能の D S P ( Digiて al . Signal Processor)が利用されている。しかしながら、動画、グラフィックスを扱うには、かなり高性能なプロセッサが要求されている。例えば、動画伸張には約 2 G O P S、動画圧縮には約 5 0 G 0 P S程度の性能が必要である。この性能を達成するためには、演算器の高性能化が必要である。そのための手法には、動作周波数の高速化と、演算処理の並列化がある。

前者は、比較的単純に高性能化できるが、実装設計の難易度が高く、コスト増の要因になる。そのため、妥当なコストで実現するには、後者の手法も必須になると思われる。一方、後者は、アプリケーションが並列性を有しているかということと、複数演算器を有効な活用するための制御が複雑になることが課題となる。アプリケーションに関しては、上述したマルチメディアに焦点を絞ると、かなり高度な並列性がある。例えば、動面圧縮処理では、 8演算が同時に実行可能である。

また、複数演算器を活用するための手法として、スパースカラや V L I W ( Very Long Instruction Word) がある。前者は、汎用プロセッザが主として採用している手法であり、複数演算を同時に実行するためのスケジューリングをプロセッサが行うものである。この手法は、既存の単一処理プロセッサとのォブジェク卜との互換性を確保できるという利点があるものの、スケジュ一リングをプロセッサが動的に行うので、そのハードウエアが極めて複雑になっている。一方、 V L I Wは、既存プロセッサとの互換性の確保に難点があるが、命令デコード回路が不要であり、そのハードウェアを簡略化できる利点がある。

V L I Wにおけるハードウエア簡略化の要点のひとつは、命令フォーマツ卜にある。その命令フォーマツトは、演算器を直接制御するフィールドで構成されており、ハードウエアによる制御を極めて単純なものにする。このような命令フォーマツ卜を有するプロセッサの一例として、特開昭 6 3— 9 8 7 3 3 「演算回路制御方式」がある。この引例では、演算用マイク口命令が演算用命令であることを指示するオペレーションフィールドと、演算回路の制御用の複数のコントロールビットを設け、複数のコントロールビッ卜各々で直接演算回路の各部の制御を行っている。このように、 V L I Wは比較的簡単なハードウェアで並列処理を実現できる。

上述したように、スーパ一スカラや V L I Wなどは、性能を引き出すために、処理の並列度を向上する有効な手段である。しかしながら、並列度を十分引き出すためには、コンパイラの助けが必要である。具体的には、ループ展開などの手法が知られている。これは、プログラム中のループ本体を複数回複写（展開）し、展開したループ内のコードをスケジユーリングする手法である。すなわち、ループ戻りの分岐間で実行する命令数を增加させると、複数命令を同時に実行できる可能性が大きくなる。

この手法においては、ループを複写するので、コードサイズが大きくなるという課題がある。つまり、コードサイズが大きくなると、プログラムを格納するメモリ容量を大きくとる必要があり、システムのコスト増につながる。また、キャッシュメモリを有するプロセッサにおいては. コ一ドサイズが大きくなるとヒッ卜率が下がり、システム性能が低下する要因になる。

また、プロセッサの並列度を増やすと、演算器の数が増加する。したがって、回路規模が大きくなり、それにしたがって開発工数が増えるという課題がある。ハ。ソコン等を中心とするコンピュータ市場においては、適時に新製品を投入することが事業的に重要となっており、開発工数の低減が重要になる。

本発明の目的は、上記課題を解決すべく、性能向上のため処理の並列度を向上しつつ、コードサイズを少なく抑えることができるァーキテクチヤを有するプロセッサを提供することにある。

本発明の他の目的は、少ない命令コードで多くの演算を実行可能なプ口セッサを提供することである。

本発明の他の目的は、静的なスケジユーリングを前提にする V L I W 型プロセッサを提供することにある。

本発明の他の目的は、各種アプリケーションに対応可能であり、各演算器の稼動率を高めた V L I W型プロセッサを提供することにある。

本発明の他の目的は、マルチメディァ処理など同一種類の演算を繰り返し実行するような並列プロセッザの命令コード量の削減に有効なマルチメディァ処理に適するプロセッサを提供することにある。

本癸明の他の目的は、コードサイズ削減に有効なス一パースカラ型プ口セッサを提供することにある。

本発明の他の目的は、処理の並列度を増加しつつ開発工数を抑えることが可能なプロセッサアーキテクチャを提供することにある。発明の開示

上記第一の課題を解決するために、本発明は、マルチメディア処理については、同一種類の複数演算を同時に実行するケースが多いことに着目し、一つの命令で複数の演算器を制御できるようなモード情報を命令フォーマツト中に用意した。

例えば、複数の演算器を有し一命令で複数演算を実行するために、各演算器を制御するフィールド複数で 1命令を構成する V L I Wプロセッザにおいては、一つのフィールド中に複数の演算器を制御可能にするモ — ド情報を設けた。さらに、 1命令中の一つのフィールドから複数のフィールドを生成する命令伸張回路を設けると共に、同一機能の演算器を複数並べて上記複数の演算器を構成した。

また、スーパースカラプロセッサにおいては、 1命令中に複数の演算器を同時に制御するモード情報を設けた。また、一つの命令から複数の命令を生成する命令伸張回路を設けると共に、上記生成した複数の命令を同時に実行できるように同一機能の演算器を複数並べる構成とした。また、 3つ以上の演算器を有するプロセッサにおいては、必要数の演算器だけを使用できるように、同時に実行する演算器を指定する指定情報を設けると共に、前記指定情報にしたがって、 V L I Wにおいては必要な数の命令フィールドを、スーパースカラプロセッサにおいては命令を生成する機能を上記命令伸張回路を設けた。

上記第二の課題を解決するために、本発明は、同一種類の演算を複数同時に実行するための演算器と、主にこの演算器に供給するオペランドをメモリから読み込む整数演算器と、上記 2種類の演算器が使用するォペランドを格納するレジスタファイルとで構成された演算ュニットを複数設けた。

即ち'、本発明は、命令コ一ドを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持した複数の命令コードにしたがって並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、上記メモリに格納された命令コード中に、複数の演算ュニッ卜における演算の実行を指示する指定情報を有し、該指定情報を解析して命令コードが指定する複数の演算ュニッ卜を決定して上記命令コードを指定された複数の演算ュニッ卜へ投入する解析手段を設け、単一命令コードで上記複数の演算ュニッ卜における複数の演算を制御可能に構成したことを特徴とするプ口セッサでめる。

また本発明は、命令コードを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持した複数の命令コードにしたがって並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、上記メモリに格納された命令コード中に、複数の演算ュニッ卜における演算の実行を指示する指定情報を有し、該指定情報を解析して命令コードが指定する複数の演算器を決定して上記命令コードを指定された複数の演算ュニットへ投入する解析手段を設け、上記複数の演算ュニッ卜において単一命令コ一ドで複数命合に相当する演算を上記複数の演算ュニットにおいて実行するように構成したことを特徴とするプロセッサである。

また本発明は、命令コ一ドを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持した複数の命令コードにしたがって並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、上記メモリに格納された命令コ一ド中に、演算種類を示すォペコードと、オペランドに加えて、指定情報として実行モードを指定するフィールドを有し、該フィールドを解析して上記実行モードが有効となっている命令の少なくともオペコードとオペランドとを複数の演算ュニッ卜へ投入する解析手段を設け、同一種類の演算を上記複数の演算ュニッ卜において実行可能に構成したことを特徵とするプロセッサである。

また本発明は、命令コードを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持した複数の命令コードに従って並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、上記メモリに格納された命令コード中に、演算種類を示すオペコードと、オペランドに加えて、指定情報として実行モードを指定するフィ一ルドと演算ュニッ卜を指定する演算ュニッ卜指定フィ一ルドとを有し、該フィールドを解析して上記実行モードが有効となっている命令の少なくともォペコードとォぺランドとを、演算ュニット指定フィールドで指定された演算ュニッ卜へ投入する解析手段を設け、上記複数の演算ュニッ卜において上記指定した数同一種類の演算を実行可能に構成したことを特徴とするプロセッサである。

また本発明は、上記プロセッサにおいて、上記各演算ュニッ卜が固有のレジスタファイルを有することを特徴とする。また本発明は、上記プ口セッサにおいて、上記各演算ュニッ卜が固有のレジスタファイルを有し、オペランドフィールドが各演算ュニッ卜固有のレジスタフアイルの中のレジスタ指定することにより、演算データが各演算ュニッ卜で異なることを特徴とする。また本発明は、上記プロセッサにおいて、上記各演算ュニッ卜が共通のレジスタフアイルを有することを特徴とする。また本発明は、上記プロセッサにおいて、上記各演算ュニッ卜が共通のレジスタファイルを有し、該レジスタファイルの中からレジスタ番号を指定するオペランドフィールドを有し、該オペランドフィールドの値に、指定する演算ュニッ卜に固有のオフセッ卜値を加えることで、各演算ュニッ卜が異なるレジスタを使用可能にして、異なる演算データで演算可能に構成したことを特徴とする。

また本発明は、命令コードを格納するメモリと、該メモリから読みだした命令コ一ドを保持する命令コ一ド保持手段と、複数の演算ュニットとを有するプロセッサであって、上記命令コードは上記演算ュニット数に対応する複数フィールドから構成し、この命令コード中の任意の一つのフィールドにおいて、複数の演算ュニットを制御することを示す制御情報と各フィ一ルドが対応する演算ュニッ卜を指定するフィールド情報とを有し、該フィールド情報と上記制御情報を解析して上記フィールドが制御する演算ュニットを特定し、この特定された演算ュニッ卜に対して上記フィールドを投入する解析手段を設け、上記命令コード中の一つのフィールドが複数の演算ュニッ卜を制御して上記演算数よりも少ないフィールド数で構成した短い命令コードで複数演算が実行可能に構成したことを特徴とするプロセッサである。

また本発明は、命令コ一ドを格納するメモリと、該メモリから読みだした命令コードを保持する命令コード保持手段と、複数の演算ュニッ卜とを有するプロセッサであって、上記命令コ一ドは演算ュニッ卜数に対応する複数フィールドから構成し、この命令コ一ド中の任意の一つのフィールドが複数の演算ュニッ卜を制御することを示す制御情報と上記命令コード中に存在するフィールド数を示すへッダ情報とを上記メモリに格納しておき、上記ヘッダ情報と上記制御情報を解析して上記フィールドが制御する演算ュニットを特定し、この特定された演算ュニッ卜に対して上記フィ一ルドを投入する解析手段を設け、命令コ一ド中の一つのフィールドが複数の演算ュニッ卜を制御して上記ヘッダ情報を用いて少ないフィールド数で構成した短い命令コードで複数演算が実行可能に構成したことを特徴とするプロセッサである。

また本発明は、命令コ一ドを格納するメモリと、該メモリから読みだした命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持された情報で制御される少なくとも一つの演算器及び該演算器のオペランド情報を格納するレジスタフアイルで構成された複数の演算ュニットとを備えたプロセッザであって、上記命令コードは演算ュニッ卜数に対応する複数フィ一ルドから構成してこの一つの命令コードで複数の演算ュニットを操作可能に構成し、上記全ての演算ュニット内に、同一機能を有する演算器を少なくとも一つ設けることで、全ての各演算ュニッ卜が同一の演算を実行可能に構成したことを特徴とするプロセッサである。

また本発明は、命令コードを格納するメモリと、該メモリから読みだした命令コ一ドを保持する命令コード保持手段と、該命令コード保持手段に保持した情報で制御される少なくとも一つの演算器及び該演算器のオペランド情報を格納するレジスタファイルで構成した複数の演算ュニットとを備えたプロセッサであって、上記命令コードは演算ュニット数に対応する複数フィールドから構成し、上記全ての演算ュニッ卜内に、同一機能を有する演算器を少なくとも一つ設け、更に上記各演算ュニッ卜内に上記レジスタファイル内のレジス夕で指定不可能なビッ卜幅の広いデータタイプを保持するための特殊レジスタを設け、上記レジスタフアイル内のレジス夕で指定可能なビッ卜幅のデータタイプと上記特殊レジス夕に格納したデータタイプの両方の演算処理を可能に構成したことを特徴とするプロセッサである。また本発明は、複数の演算ュニッ卜の実行を指示する指定情報を有する命令コードを格納するメモリと、該メモリに格納された命令コード中に有する指定情報を解析して命令コードが指定する複数の演算ュニットを決定する解析手段と、該解析手段で決定された複数の演算ュニッ卜を指定する命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持された命令コ一ドに従って、各々が並列に演算を実行する複数の演算ュニッ卜とを備えたことを特徴とするプロセッサである。

また本発明は、複数の演算ュニッ卜の実行を指示する指定情報を有する命令コ一ドを格納するメモリと、該メモリに格納された命令コード中に有する指定情報を解析して単一命令コードで複数命令に相当する演算を実行するように上記単一命令コードが指定する複数の演算ュニットを決定する解析手段と、該解析手段で決定された複数の演算ュニットを指定する単一命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持された単一命令コードに従って、各々が並列に演算を実行する複数の演算ュニッ卜とを備えたことを特徴とするプロセッサである。

また本発明は、上記プロセッサにおいて、上記複数の演算ュニッ卜の各々は、異なる種類の演算を実行するように構成したことを特徴とする。また本発明は、演算種類を示すオペコードと、オペランドに加えて、指定情報として実行モードを指定するフィールドを有する命令コードを格納するメモリと、該メモリから読みだした命令コード中のフィールドを解析して上記実行モードが有効となっている命令の少なくともオペコ一ドとオペランドとを複数の演算ュニッ卜へ投入する解析手段と、該解析手段で投入された複数の演算ュニッ卜への実行モードが有効となっている命令の少なくともオペコードとオペランドとを保持する命令コード保持手段と、該命令コード保持手段に保持された少なくともオペコードとオペランドとに従って同一種類の演算を並列に実行する複数の演算ュニットとを備えたことを特徴とするプロセッサである。.

また本発明は、演算種類を示すオペコードと、オペランドに加えて、指定情報として実行モードを措定するフィールドと演算ュニッ卜を指定する演算ュニッ卜指定フィールドとを有する命令コードを格納するメモリと、該メモリから読みだしたフィールドを解析して上記実行モードが有効となっている命令の少なくともオペコードとオペランドとを、演算ュニッ卜指定フィールドで指定された演算ュニッ卜へ投入する解析手段と、該解析手段で投入された演算ュニット指定フィールドで指定された演算ュニッ卜への実行モードが有効となっている命令の少なくともオペコードとオペランドとを保持する命令コード保持手段と、該命令コード保持手段に保持された少なくともオペコードとオペランドとに従って上記指定された数同一種類の演算を並列に実行可能に構成した複数の演算ュニッ卜とを備えたことを特徵とするプロセッサである。

また本発明は、上記プロセッサにおいて、上記各演算ュニッ卜が固有のレジスタファイルを有することを特徴とする。また本発明は、上記プ口セッサにおいて、上記各演算ュニッ卜が固有のレジスタファイルを有し、オペランドフィールドが各演算ュニット固有のレジスタファイルの中のレジスタ指定することにより、演算データが各演算ュニッ卜で異なることを特徴とする。また本発明は、上記プロセッサにおいて、上記各演算ュニッ卜が共通のレジスタファイルを有することを特徴とする。また本発明は、上記プロセッサにおいて、上記各演算ュニッ卜が共通のレジスタフアイルを有し、該レジスタフアイルの中からレジス夕番号を指定するオペランドフィールドを有し、該オペランドフィールドの値に、指定する演算ュニッ卜に固有のオフセッ卜値を加えることで、各演算ュニッ卜が異なるレジスタを使用可能にして、異なる演算データで演算可能に構成したことを特徵とする。

また本発明は、演算ュニット数に対応する複数フイ ^ "ルドから構成され、この中の任意の一つのフィールドにおいて、複数の演算ュニッ卜を制御することを示す制御情報と各フィールドが対応する演算ュニッ卜を指定するフィニルド情報とを有する命令コードを格納するメモリと、該メモリから読みだした命令コードのフィールド情報と上記制御情報を解析して上記フィールドが制御する演算ュニットを特定し、この特定された演算ュニッ卜に対して上記フィールドを投入する解析手段と、該解析手段で上記フィールドを保持する命令コード保持手段と、該命令コード保持手段に保持されたフィールドに従って並列演算を実行する複数の演算ュニットとを備え、上記命令コード中の一つのフィ一ルドが上記複数の演算ュニットを制御して上記演算数よりも少ないフィ一ルド数で構成した短い命令コードで複数演算が実行可能に構成したことを特徴とするプロセッサである。

また本発明は、演算ュニット数に対応する複数フィールドから構成され、この中の任意の一つのフィールドが複数の演算ュニットを制御することを示す制御情報を有する命令コードと該命令コード中に存在するフィールド数を示すヘッダ情報とを格納するメモリと、該メモリから読みだした上記ヘッダ情報と上記制御情報を解析して上記フィールドが制御する演算ュニットを特定し、この特定された演算ュニッ卜に対して上記フィールドを投入する解析手段と、該解析手段で投入されたフィールドを保持する命令コード保持手段と、該命令コード保持手段に保持されたフィールドに従って並列演算を実行する複数の演算ュニッ卜とを備え、上記命令コード中の一つのフィ一ルドが上記複数の演算ュニッ卜を制御して上記ヘッダ情報を用いて少ないフィールド数で構成した短い命令コ一ドで複数演算が実行可能に構成したことを特徴とするプロセッサである。

また本発明は、上記プロセッサにおいて、上記解析手段には、上記メモリから圧縮された命令コードを読みだして直接実行可能な伸帳命令コ一ドに変換する命令伸帳手段を有することを特徴とする。

また本発明は、上記プロセッサにおいて、上記解析手段には、上記メモリから圧縮された 1命令コード中の少なくとも一つのフィールドを読みだして直接実行可能な複数のフィールドからなる伸帳命令コードに変換する命令伸帳手段を有することを特徴とする。また本発明は、上記プ口セッサにおいて、上記解析手段には、上記メモリから圧縮された命令コードをラツチするィンストラクションバッファと、上記命令コード中に存在するフィールド数を示すへッダ情報を解析するフィールドコントローラと、該フィールドコントローラから解析されたフィールドの選択信号及びフィールドの有無を示す信号に基づいて各フィールドの有無を含めて並び替えて伸帳フィールドを形成する各フィールドに対応したセレクタとを備えたことを特徴とする。また本発明は、上記プロセッサにおいて、上記解析手段には、上記命令コードの各フィールドの実行モード（ Sモード）と S I M Dとを解析して各フィールドの複写元フィールドを選択して決定する S I M Dコントローラと、該 S I M Dコントローラで選択して決定された複写元フィールドを複写して各演算ュニッ卜に対して投入するセレクタとを備えたことを特徴とする。

また本発明は、演算ュニッ卜数に対応する複数フィールドから構成してこの一つで複数の演算ュニットを操作可能に構成した命令コードを格納するメモリを備え、該メモリから読みだした命令コードを保持する命令コード保持手段を備え、該命令コード保持手段に保持された情報で制御される少なくとも一つの同一機能を有する演算器及び該演算器のオペランド情報を格納するレジスタファイルで構成された演算ュニットを複数備え、これら複数の演算ュニッ卜が同一の演算を実行可能に構成したことを特徵とするプロセッサである。

また本発明は、演算ュニット数に対応する複数フィールドから構成された命令コードを格納するメモリを備え、該メモリから読みだした命令コードを保持する命令コ一ド保持手段を備え、該命令コ一ド保持手段に保持した情報で制御される少なくとも一つの同一機能を有する演算器及び該演算器のオペランド情報を格納するレジスタフアイル及び該レジスタフアイル内のレジスタで指定不可能なビッ卜幅の広いデータタィプを保持するための特殊レジスタで構成した演算ュニットを複数備え、これら複数の演算ュニッ卜において上記レジスタファイル内のレジス夕で指定可能なビット幅のデータタイプと上記特殊レジスタに格納したデータタイプの両方の演算処理を可能に構成したことを特徴とするプロセッサである。

また本発明は、命令コード及びデータを格納するメモリと、上記メモリから読みだした複数の命令コードを保持する命令コード保持手段と、上記命令コード保持手段に保持した複数の命令コードにしたがって並列に動作可能な複数の演算ュニットを有するプロセッサであって、複数の演算器と複数アクセスポー卜レジスタファイルとで演算ュニットを構成し、上記各演算器が、対応するアクセスポー卜から上記レジスタフアイルの内容を読み出して演算可能で、かつ、上記複数の演箅ュニッ卜が同一機能であることを特徴とするプロセッサである。

また本発明は、命令コード及びデータを格納するメモリと、上記メモリから読みだした複数の命令コードを保持する命令コード保持手段と、上記命令コード保持手段に保持した複数の命令コードにしたがって並列に動作可能な複数の演算ュニッ卜を有するプロセッサであって、複数の演算器と複数アクセスポ一トレジスタファイルとで演算ュニットを構成し、上記各演算器が、対応するアクセスポー卜から上記レジスタフアイルの内容を読み出して演算可能で、かつ、上記複数の演算ュニッ卜が同一機能のサブセットを有することを特徴とするプロセッサである。

また本発明は、上記プロセッサにおいて、演算ュニット内の少なくとも一つの演算器が上記メモリと上記レジスタフアイル間のデータ転送を行うデータ転送命令を実行可能であることを特徵とする。

本発明によれば、 V L I Wプロセッサが 8つの演算器を有する場合、 1命令は 8つのフィールドで構成される。一つのフィールドが、ォペレーション情報、オペランド情報、及び上記モ一ド情報を有しており、そのモード情報が、複数の演算器を制御する同時演算モードを指定している時、残りの 7つのフィールドは命令読み込み時、メモリ上に実存していない。そこで、命令伸張回路が、前記一つのフィールド中で指定したオペレーション情報とオペランド情報を複写することによって、残り 7 つのフィールドを生成する。これにより、 1 フィールド分のコードサイズで 8フィールドに相当する 1命令を生成し、各演算器が同一機能を有しているので、問題なく複数演算命令が並列に実行可能になり、コードサイズが 1 / 8に圧縮できる。とくに、モード情報に演算器の指定情報を設定すると、その設定情報に対応するフィールドだけが生成されるので、設定情報を 3 ビット設けると同時演算数を 2〜 8の範囲で制御できる。

また、上述したス一パースカラプロセッサが 4つの演算器を有する場合、 1命令が、オペレーション情報、オペランド情報、及び上記モード情報を有しており、そのモード情報が、同時演算モードを指定している時、命令伸張回路が、前記命令中で指定したオペレーション情報とオペランド情報を生成することによって、 3つの命令を生成する。この場合、各演算器が同一機能を有しているので、 1命令分のコ一ドサイズで 4命令に相当する複数演算命令が実行可能になり、コ一ドサイズが 1 Z 4に圧縮できる。とくに、モード情報に演算器の指定情報を設定すると、その設定情報に対応する分の命令だけが新たに生成されるので、設定情報を 2 ビッ卜設けると同時演算数を 2〜 4の範囲で制御できる。

以上のように、本発明によると、同時演算の処理の並列度を向上しつつ、コードサイズを少なく抑えることができる。

また、上述したとおり、演算ュニッ卜単位で処理の並列度を増減するアーキテクチャとすることにより、例えば、 2演算ュニッ卜構成のプロセッサの開発において、 1演算ユニットの回路を開発すれば、この演算ュニッ卜の回路を複写することで 2演算ュニッ卜分の演算器を開発できる。したがって、 2演算ユニットの演算器の開発工数は、 1演算ュニッ卜の演算器の開発工数とほぼ同一となる。将来、半導体の微細化技術が進歩して、 4演算ュニットゃ 8演算ュニッ卜の高並列処理プロセッサを開発する場合でも、演算器の開発工数が増加することはない。

前述したとおり、マルチメディア処理においては、同一種類の演算が複数回繰り返し実行される特性を持っているので、処理の並列度を増やすことにより、確実に性能向上できる。

また、一つの演算ュニット内で、マルチメディア演算器の処理と同時に、整数演算器が次のサイクルで処理するデータをロードできる。ロードしたデータは、演算ュニッ卜内のレジスタファイルに格納されるのでマルチメディァ演算器が処理するオペランドとして使用できる。

このように、演算ュニット単位で処理するソフトウエア構造とすることにより、演算ュニットを対象にしたプログラムの単位で演算ュニットの増減に対応できる。したがって、演算ュニッ卜数を変更したプロセッザに、開発済みプログラムを移植する場合などにも、演算ュニッ卜数の増減に伴うソフトウエアの開発工数を低減できる。以上のように、本発明によると、プロセッサ処理の並列度を向上しつつ、ハードウエアの開発工数だけでなくソフトウエアの開発工数も削減することが可能になる。図面の簡単な説明

第 1図は本発明の第 1の実施例を示すプロセッサのプロック図である c 第 2図はプロセッサの命令フォーマツトを示す図である。第 3図はインストラクシヨンメモリ 1内へのプログラム格納例を示す図である。第 4 図はヘッダのフォーマツトを示す図である。第 5図は命令コードの具体例を示す図である。第 6図は命令コードの具体例を示す図である。第 7 図は命令伸張回路 2の詳細ブロック図である。第 8図はフィールドコン卜ローラ 4 2の詳細ブロック図である。第 9図はプログラムの格納例を示す図である。第 1 0図はフィールドコン卜ローラ 4 2の動作フ口一を示す図である。第 1 1図はへッダアナライザ 6 0の詳紬ブ口ック図である。第 1 2図はパーシャルライ卜コントローラ 6 2の詳細ブロック図である。第 1 3図はアドレスコントローラ 6 1の詳細プロック図である。第 1 4図はセレクトシグナルジヱネレータ 6 3の詳細ブロック図である。第 1 5図はオフセット生成回路 1 2 0の詳細プロック図である。第 1 6 図はS I M Dコントローラ 4 6の詳細ブロック図である。第 1 7図は本発明の第 2の実施例を示すプロセッサのプロック図である。第 1 8図は第 2の実施例を示す命令フォーマツトを示す図である。第 1 9図は命令伸張回路 2 0 0の詳細ブロック図である。第 2 0図はフィールドコン卜ローラ 2 0 1の詳細プロック図である。第 2 1図はシンクロナイザ 2 1 0の詳細プロック図である。第 2 2図はセレク卜シグナルジエネレー夕 2 1 1の詳細ブロック図である。第 2 3図は本発明の第 3の実施例を示すプロセッサのブロック図である。第 2 4図は第 3の実施例を示す命令フォーマツ卜を示す図である。第 2 5図は命令伸張回路 2 4 1の詳細ブロック図である。第 2 6図はレジスタアジヤスタ 2 5 0の機能を実現する真理値表を示す図である。第 2 7図は本発明の第 4の実施例を示すプ口セッサのブロック図である。第 2 8図は第 4の実施例を示す命令フォ一マツトを示す図である。第 2 9図は命令伸張回路 2 6 0の詳細ブロック図である。第 3 0図は本発明に係る I F G演算器の一実施例を示す構成図である。発明を実施するための最良の形態

以下、本発明を説明する。第 1図は、本発明を適用した V L I Wプロセッサのブロック図である。同図において、 1はプロセッサ命令コードを圧縮して格納するィンストラクシヨンメモリ、 2は本発明の主要プロックでありインストラクションメモリ 1から読みだした圧縮命令コードを実際に実行可能なコードに伸張する命令伸張回路、 3はインス卜ラクシヨンメモリ 1のアドレスバス、 4はインストラクションメモリ 1のデ一夕バス、 5 〜 1 2は命令伸張回路 1が伸張コードを出力するフィールドバス、 1 4 ~ 2 1は各々フィールドバス 5 〜 1 2を介して転送される伸張コードを保持する命令レジスタ、 2 2 〜 2 5は同一構成であり、各々命令レジスタ 1 4 〜 2 1に保持した伸張コードにしたがって各種演算を実行する演算ユニット、 2 6は 8 ビットや 1 6 ビット単位で.複数演算を実行するマルチメディァ演算及び乗算など複雑な演算を実行する I F G ( Integer Floating Graphics )演算器、 2 7はデータメモリ 3 0とレジス夕ファイルとの間のデータ転送を実行するデータ転送命令や論理演算など簡単な演算を実行する I N T ( Integer)演算器、 2 8は演算する値や演算結果の値を保持するものであり、 3 2個の 6 4 ビットレジスタで構成し、 4個のリードポー卜と 3個のライ卜ポー卜を有するレジス夕ファイル、 2 9は演算ュニット 2 2〜 2 5の演算結果を他の演算ュニッ卜へ転送可能にする選択回路、 3 0は演算ュニット 2 2〜 2 5内のレジス夕ファイルとの間でデータ転送が可能なデータメモリである。

なお、この図において、この V L I Wプロセッサは 1つの LSIにまとめられている。又、命令コードなどを一旦蓄えるキヤッシュメモリ、命令コードなどをプロセッサ外部から読み込み、演算結果を外部へ出力する等の LSI端子の記述は省略している。

本発明の特徴は、演算ュニッ卜 2 2力 I F G演算器 2 6 と I N T演算器 2 7及びレジスタファイル 2 8で構成されており、同一の演算ュニット 2 3〜 2 5が複数並列に並んだ構成となっていることである。

以下、第 1図の動作を説明する。

同図において、命令伸張回路 2は、アドレスバス 3を介して与えたァドレス情報によりインストラクションメモリ 1から圧縮された命令コードを読み出し、演算ュニット 2 2〜 2 5が直接実行可能になる伸張命令コードに変換する。 1命令に相当する伸張命令コードは、 8つのフィールドで構成されており、各フィールドは各々対応する命令レジスタ 1 4 〜 2 1へ転送される。フィールドには、 I F Gフィールドと I N Tフィ一ルドの 2種類がある。 I F Gフィールドは、命令レジスタ 1 4、 1 6、 1 8、 2 0に、 I N Tフィールドは命令レジスタ 1 5、 1 7、 1 9、 2 1に転送される。

命令レジスタ 1 4に格納された I F Gフィ一ルドは、演算ュニット 2 2内の I F G演算器 2 6に関する演算を制御する。一方、命令レジスタ 1 5に格納された I N Tフィールドは、演算ュニッ卜 2 2内の I N T演算器 2 7に関する演算を制御する。同様に、命令レジスタ 1 6と 1 7は演算ュニット 2 3、命令レジスタ 1 8と 1 9は演算ュニット 2 4、命令レジスタ 2 0と 2 1は演算ュニット 2 5内の I F G演算器及び I N T演算器を制御する。

I F G演算器 2 6及び I N T演算器 2 7において演算するデータは、レジスタファイル 2 8から読みだす。演算結果は、選択回路 2 9へ出力され、いずれの演算ュニッ卜内のレジスタファイル 2 8へも書き込むことができる。

また、データ転送命令が発行されると、選択回路 2 9を通して、レジスタファイル 2 8とデータメモリ 3 0間でデータ転送が行われる。つまり、 I F G演算器 2 6が演算命令を実行すると同時に、データ転送命令によって、次サイクルで I F G演算器 2 6が演算するデータをメモリ 3 0からレジスタファイル 2 8へ転送する命令を I N T演算器 2 7が実行できる。 I N T演算器 2 7によってレジスタファイル 2 8に転送されたデータは、 I F G演算器 2 2からも読み出し可能なので、 I F G演算器は毎サイクル演算命令を実行できる。

画像処理のようなマルチメディァ処理を考慮すると、処理する画像の領域を 4分割し、各領域の処理を各 4つの演算ュニッ卜に割り当てるようなプログラム構造にすることができる。この場合、各領域の処理内容と各演算ュニッ卜の機能が同じであるため、基本的に、各演算ュニットで実行するプログラムは同一である。したがって、一つの演算ュニッ卜のプログラムを開発し、それを他 3つの演算ュニッ卜にも流用できる。本実施例では、演算ュニット数が 4であるが、半導体技術の進歩により、演算ュニッ卜数を 8に増やした場合でも、処理する画像領域を 8分割するプログラム構造とすれば、各演算ュニッ卜で実行するプログラムは、流用可能であり、ソフトウェアの開発工数を削減できる。

これらの効果は、上述した画像処理のようなマルチメディァ処理においては、同一の演算の繰り返し処理が頻発することを利用して、繰り返し処理を並列化することによって処理性能を向上した結果である。演算ュニットは、基本的に同一回路なので、当然、複数の演算ュニットを有するプロセッサのハードウエア開発工数も削減できる。.

また、第 1図の実施例では、上述したように同時演算の処理の並列度を向上しつつ、コードサイズを少なく抑えることもできる。

次に、各演算ュニッ卜 2 2〜 2 5を制御する伸張命令コードのフィ一ルドについて、詳細を説明する。

第 2図は、 I F Gフィールドと I N Tフィールドのフォーマツトを示している。

( 1 )まず、 I F Gフィールドを構成する各プロックについて説明する。即ち、ビット 0〜ビット 7のオペコードブロック（以下、 "ォペコード" と記す）は演算の種類を示しており、最大 2 δ 6種類を指定できる。なお、オペコード = 0の時は、ノーオペレーション（N O P ) とする。ビット 8のイミディエー卜ブロック（以下、 "イミディエート" と記す）は、ビット 2 2〜ビット 2 6のソース 1ブロック（以下、 "ソース 1 " と記す）の内容の意味を示しており、 1の時にイミディエート値、 0の時にレジスタ番号を示している。レジスタ番号は、当該演算ュニッ卜内のレジスタファイルにある 3 2個のレジスタのうちの一- ^を示す。ビット 1 7〜ビッ卜 2 1のソース 0ブロック（以下、 "ソース 0 " と記す）も同様に、当該演算ュニット内のレジスタファイルにある 3 2個のレジス夕のうちの一つを示す。

ビット 2 7の Sモードブロック（以下、 " Sモード" と記す）（ 1 ビッ卜のフィールド）は、本発明のポィントとなる同時演算モードを指定する。本ビット（ " Sモード" ）力、 0の時ノーマルモード、 1の時 S I M D (単一命令複数データ流： Single Instruction Multiple Data stream) モ一ド（同時演算モード）を示す。

ビット 9〜ビット 1 1の S I M D デストノくンクブロックは、ノーマルモードの時、 "デストバンク" と記し、 S I MDモードの時、 "S I MD" と記す。

ノーマルモード（ " Sモード" が 0 ) の時には、各演算ュニッ卜の演算結果は、他の演算ュニット内のレジスタファイル内のレジスタへ書き込むことができる。したがって、ノーマルモード時は、 "デス卜バンク" で演算ュニットを特定し、ビッ卜 1 2〜ビット 1 6のデスティネーシヨンブロック（以下、 "デスティネーション" と記す）でその演算ュニッ卜内のレジスタを特定する。演算ュニッ卜 2 2力パ'ンク 0、演算ュニット 2 3力、'バンク 1、演算ュニット 2 4力、'バンク 2、演算ュニッ卜 2 5がバンク 3に対応している。 "デスティネーション" は、 3 2種類のレジスタ番号を指定可能であり、デストバンクは、 8種類の演算ュニッ卜を指定可能である。本実施例では、 4個の演算ュニッ卜 2 2〜 2 5で構成しているが、命令フォーマツト自身は、 8個の演算ュニッ卜で構成する V L I Wプロセッサに適用できるようになっている。

—方、 S I MDモードの時（ " Sモード" 力、' 1の時）には、一つの I F Gフィールドで複数の演算ュニッ卜を制御可能にするため、各演算ュニッ卜の演算結果は、当該演算ュニッ卜内のレジスタファイル内のレジスタへのみ書き込みができるようにする。従って、 S I MDモード時には、 "デスティネーション" で、 3 2種類のレジスタ番号を指定することで演算結果を書き込むレジスタを指定する。更に、同時に演算する他の演算ュニットを指定するために、デストバンクとフィールドを共用する "S I MD" を用いる。

"S I MD" は、 3 ビッ卜で構成され、他の 3つの演算ュニット力く各々同一演算を実行するか否かを示す。 1は同一命令実行を示し、 0は実行しない、つまり、ノーオペレーション（以下、 N O Pと略記する）を示す。 3つのビットと各演算ユニットとの対応関係は、 I F Gフィールドが保持される命令レジスタに依存する。つまり、 I F Gフィールド力バンク 0に対応する命令レジスタ 1 4に保持される場合、 "S I M D" の 3 ビッ卜は、バンク 1、ノくンク 2、ノく'ンク 3に対応する。従って. "S I MD" 力 1 1 0 ( 2進数）ならば、命令レジスタ 1 4と 1 5、 1 6と 1 7、 1 8と 1 9に、同じ命令が設定される。 I F Gフィ一ルドがバンク 1に対応する命令レジスタ 1 6に保持される場合、 "S I MD" の 3 ビットは、バンク 0、バンク 2、バンク 3に対応する。 I F Gフィ —ルドがバンク 2に対応する命令レジスタ 1 8に保持される場合、 "S I MD" の 3 ビッ卜は、ノく、ンク 0、ノンク 1、ノくンク 3に対応する。 I F Gフィールドがバンク 3に対応する命令レジスタ 2 0に保持される場合、 " S I MD" の 3 ビッ卜は、ノくンク 0、ノく、ンク 1、バンク 2に対応する。

なお、 "デステネーシヨン" 、 "ソース 0 " 、 "ソース 1 " でオペランドを形成する。

(2 )次に、 I N Tフィールドについて説明する。

即ち、 I N Tフィールドの I F Gフィールドとの相違点は、 3つある。一つ目は、 "ォペコード" が 1 ビット削減され、指定できる演算種類が 1 2 8種類になっていることである。 2つ目は、 "ソース 1 " のビット数が 8ビッ卜に拡張され、イミディエー卜値が 0〜 2 δ 5まで指定できるようになっていることである。最後は、 I F Gフィールドにないブランチテストブロック（以下、 "ブランチテスト" ）が加わっていることである。 "ブランチテスト" は、プログラムの分岐制御用である。各演算ュニッ卜 2 2〜 2 5は、条件分岐用に各 1 ビッ卜のブランチバンクレジス夕を 6個有している。これらは 1の時分岐、 0の時分岐しないことを示す。 "ブランチテス卜 " カ、 0 0 0 ( 2進数）の時、分岐は発生しない。 0 0 1の時、無条件分岐が発生する。 0 1 0〜 1 1 1の時、対応するブランチバンクレジスタの内容に応じて分岐（条件分岐）が発生する。

以下に、これらの I F Gフィールド、 I N Tフィールドで構成した命令が、インストラクションメモリ 1へ格納される過程について説明する _c 即ち、第 3図は、インストラクションメモリ 1へのプログラム格納例を示している。図中、 0〜 9 5番地に 8命令が格納されており、ヘッダは各命令のフィールドの有無を示す情報であり、 4命令単位にひとつの割合で設けてある。また、フィ一ノレド 0、 1、 2、 3、 4、 5、 6及び 7 は、各々命令レジスタ 1 4、 1 5、 1 6、 1 7、 1 8、 1 9、 2 0及び 2 1に対応している。また、フィールド無しは、 N O Pまたは S I M D モードを使用することで省略されたフィールドを意味する。

ここでは、 N O Pのフィールドが格納されおらず、 1番目の命令はフィーノレド 0、 1、 4、 6、 7で、 2番目の命令はフィールド 0、 1、 2 で、 3番目の命令はフィールド 0、 1、 2、 4、 6、 7で、 4番目の命令はフィールド 4、 7で、 5番目の命令はフィールド 0、 1で、 6番目の命令はフィールド 2、 3で、 7番目の命令はフィールド 6で、 8番目の命令はフィールド 4で構成されている。

以下、さらに詳細な説明を行う。即ち、第 4図は、第 3図に示すへッダのフォーマツ卜を示している。一つのヘッダは、 1フィールドと同一サイズの 3 2ビッ卜で構成されており、連続する 4命令分のフィールド有無情報（ 4 x 8 - 3 2 ) を示している。

具体的な例として、第 3図で示したヘッダ 0とそれに対応する 1〜4 番目の伸張後の命令フォーマツトを第 5図に示す。この 4命令は全てノ一マルモードを指定しているものとする。伸張後の命令フォーマツ卜とは、命令伸張回路 2がヘッダのフィールド有無情報から生成するものであり、インストラクションメモリ 1内では省略されていた N 0 Pフィールドが生成されるとともに、フィールドの並び替えが行われている。一方、 S I MDモードを指定した具体例として、第 3図で示したへッダ 1 とそれに対応する 5〜 8番目の伸張後の命令フォーマツトを第 6図に示す。これらの命令の "Sモード" と "S I MD" はそれぞれ図中に記載された値になっているものとする。

図中、 5番目の命令では、フィールド 0において "Sモード" = 1により S I MDモードを指定されており、且つ、 " S I MD" 力、' 1 1 1のため、フィ一ノレド 0と 1の内容がフィ一ノレド 2と 3、フィールド 4 と 5 - フィーノレド 6 と 7へ複写される。 6番目の命令では、フィールド 2において " Sモード" = 1により S I MDモードを指定されており、且つ、 "S I MD" が 0 1 0のため、フィールド 2と 3の内容がフィールド 4 と 5へ複写される。 7番目の命令では、フィールド 6において "Sモード" = 1により S I MDモードを指定されており、且つ、 "S I MD" 力、' 1 0 1のため、フィールド 6と 7の内容がフィールド 0と 1、フィールド 4 と 5へ複写される。 8番目の命令では、フィールド 4において S I MDモードを指定されており、且つ、 "S I MD" が 0 0 1 ( 0が N 〇 P、 1が同一命令実行）のため、フィールド 4と 5の内容がフィールド 6と 7へ複写される。

以上が本実施例において、圧縮された命令コードを伸張する方式である。

以下に、この方式を実現する命令伸張回路 2の詳細について説明する。即ち、第 7図は、命令伸張回路 2の詳細を示すブロック図である。同図において、第 1図と同一機能を有する回路プロック及び同一信号線には同一符号を付してある。 4 0はデータバス 4からの圧縮命令コ一ド（ 3 2ノくィト）をラッチするィンストラクシヨンバッファ、 4 1 ( 4 1 a〜 4 1 h ) は 4バイト（ 1フィ一ルド叉は 1ヘッダ） X 8本構成の圧縮フィールドバス、 4 2はへッダ情報を解析するフィールドコントローラ、 4 3は 4バイ卜単位で独立に書き込みを可能にするため 8本の信号で構成したライトイネーブルバス、 4 4はフィールドの並べ替えを行うためのフィールド選択信号線、 4 5 aから 4 5 hは圧縮フィ一ルドバス 4 1 の 8本の 4バイト信号から 1本を選択するセレクタ、 6 7はフィールド 0〜 7の各フィールドの有無を示す 8本フィールド信号線、 4 9はフィールド並べ替え後の伸張フィールドバス、 4 6は各命令の S I M Dモード時のフィールド複写動作を制御する S I M Dコントローラ、 4 7は複写するフィールドの選択を制御する S I M D選択信号線、 4 8はいずれかの 2フィールド（ I F Gフィールドと I N Tフィールド）を選択するデュアルセレクタである。

以下に、その詳細動作を説明する。即ち、フィールドコントローラ 4 2は、インストラクションバッファ 4 0に保持した情報を参照して、へッダ情報を切り出し解析する。その解析結果から、インストラクションパ'ッファ 4 0へフヱツチするべき命令のァドレス情報をァドレスバス 3 へ、 4バイ卜単位でィンストラクションバッファ 4 0へフェツチ可能とする情報をライトイネーブルバス 4 3へ、圧縮フィールドバス 4 1の中からその命令のフィ一ルド 0を選択するための情報をフィールド選択信号線 4 4へ出力する。同様に、フィールド 1 〜 7の選択情報も各々該当するセレクタ 4 δ bカヽら 4 5 hへ出力する。また、各フィールドの有無を示す情報をフィールド信号線 6 7へ出力する。

インストラクションパ'ッファ 4 0は、 3 2ノくィトなので、ヘッダと 8 つのフィ一ルドで構成する最長命令を一度に保持することができない。従って、この場合、 2回のフェッチが必要になる。この場合、フィ一ルドコントローラ 4 2は、 2回目のフヱツチサイクルであることを示す情報を再フツチ信号線 1 3へ出力する。この信号は、第 1図に示す命令レジスタ 1 4〜2 1へ送られる。再フヱツチサイクルで出力されるのは. フィールド 7の情報に限られるので、このサイクルにおいては、フィ一ルド 7に対応する命令レジスタ 2 1だけがフィールドデータをラッチ (更新）する。

セレクタ 4 5 aは、フィールド信号線 6 7のフィールド 0に対応する信号線がフィ一ルド無しを示していると、 0をフィ一ルド情報として出力する。つまり、この実施例では、オペコード = 0を N O Pとしているので、 N O Pが出力される。逆に、フィールド有りを示していると、フィールド選択信号線 4 4の情報に従って、圧縮フィールドバス 4 1力、らフィールド 0の情報を選択して、伸張フィールドバス 4 9へ出力する。同様、各フィールドに対応するセレクタ 4 5 bから 4 5 h力フィ一ルドコントローラ 4 2からの情報に従って、各々のフィールドを選択して、伸張フィ一ノレドバス 4 9へ出力する。このように、伸張フィ一ノレドノくス 4 9には、伸張され、並び換えられた後の命令コードが出力される。

S I M Dコントローラ 4 6は、伸張フィーノレドバス 4 9内のフィ一ルド 0、 2、 4、 6の " Sモード" と " S I M D " を解析して、各フィーノレドの複写元フィールドを決定して、その複写元フィールドを選択する情報を、デュアルセレクタ 4 8 aへ出力する。

ノ一マルモード時には、 S I M Dコントローラ 4 6は、複写元フィ一ルド 0と 1の選択情報をデュアルセレクタ 4 8 aへ出力する。この選択情報にしたがって、デュアルセレクタ 4 8 aは、伸張フィールドバス 4 9内の 8つのフィールドから 2つを選択して、フィールド 0をフィールドバス 5へ、フィールド 1をフィールドバス 6へ出力する。

同様に、フィールド 2と 3、 4と 5及び 6と 7の複写元フィールドを選択する情報が、対応する各デュアルセレクタ 4 8 b〜dへ出力される。各デュアルセレクタ 4 8 b〜dは、伸張フィールドバス 4 9内の 8つのフィ一ルドから 2つを選択して、フィ一ノレド 2をフィ一ノレドバス 7へ、フィ一ルド 3をフィールドバス 8へ、フィ一ノレド 4をフィールドバス 9 へ、フィールド 5をフィールドバス 1 0へ、フィールド 6をフィールドパ'ス 1 1へ、フィールド 7をフィールドバス 1 2へ出力する。このように、 S I M Dモード時には、命令中に指定した情報にしたがって、特定のフィールドの内容を別のフィールドへ複写できる。これにより、少ない命令で多くの演算が可能になる。

例えば、第 3図に示した例の 1番目の命令動作を説明する。インストラクションバッファ 4 0には、ヘッダ 0力、ら 2番目の命令のフィ一ノレド 1までが保持されている。この状態から、各フィールドに対応するセレクタ 4 5 a〜h力、'、フィールドコン卜ローラ 4 2におけるヘッダ 0の解析情報にしたがって、第 5図に示した 1番目の命令フォーマツトを生成して、伸張フィールドバス 4 9へ出力する。

この際、フィールドコントローラ 4 2は、インストラクションノッファ 4 0内の、ヘッダ 0と 1番目の命令に相当する 5フィールド分との合計 2 4バイ卜に、次の命令をフヱツチするための情報を、ライトイネ一ブルバス 4 3へ出力する。ライトイネーブルバス 4 3へ出力される情報は、各々 4バイ卜境界での書き込みを制御するために、 8 ビッ卜で構成してある。

一方、ァドレスバス 3のァドレス情報は、次の命令の先頭（第 3図の 2番目の命令のフィールド 0 ) を示しており、データバス 4にはそのァドレスから連続する 3 2バイ卜のデータ（ 2 4番地〜 5 5番地）が読み出される。この状態で、次のサイクルでは、上記ライトイネーブルバス 4 3の情報に従って、 2 4バイ卜分のデータ（ 3 2番地〜 5 5番地）が更新される。従って、インストラクションバッファ 4 0は、 3 2番地〜 δ 5番地及び 2 4番地〜 3 1番地の 3 2バイ卜の情報を保持する。この状態から、各フィールドに対応するセレクタ 4 5 a〜hが、フィールドコントローラ 4 2におけるへッダ 0の解析情報に従って、第 5図に示した 2番目の命令フォーマツ卜を生成して、伸張フィールドバス 4 9へ出力する。

この際、フィールドコントローラ 4 2は、 2番目の命令に相当する 3 フィ一ルド分の合計 1 2バイ卜をインストラクションバッファ 4 0へフヱツチするための情報を、ライトイネーブルバス 4 3へ転送する。一方、アドレスバス 3のアドレス情報は、次の命令の先頭（第 3図の 3番目の命令のフィールド 0 ) を示しており、データバス 4にはそのアドレスから連続する 3 2バイトのデータ（ 3 6番地〜 6 7番地）が読み出される _c この状態で、次のサイクルでは、上記ライトイネーブルバス 4 3の情報に従って、 1 2バイ卜分のデータ（ 5 6番地〜 6 7番地）が更新される。従って、インストラクションバッファ 4 0は、 6 4番地〜 6 7番地及び 3 6番地〜 6 3番地の 3 2バイ卜の情報を保持する。このように、フィ一ノレドコントローラ 4 2は、アドレスバス 3 とライ卜ィネーブルバス 4 3を介して、インストラクションバッファ 4 0にデータが常時充満するように制御する。このようなフィールドコントローラ 4 2の詳細については、後述する。

以上のように生成した、伸張フィールドバス 4 9上の各フィールドの "Sモード" は、 S I MDコントローラ 4 6において、チヱックされる。 "Sモード" ビッ卜が有効の場合、 S I MDコントローラ 4 6は、第 6 図に示したように、複写するフィールドと複写されるフィールドを特定する。

例えば、フィ一ルド 0と 1へ複写する場合には、複写元のフィールド選択情報を S I MD選択信号線 4 7を介して、デュアルセレクタ 4 8 a へ送る。ノーマルモード時（ "Sモード" = 0の時）、或いは S I MD モード時（ " Sモード" = 1の時）でフィールド 0と 1が複写元の場合. フィールド選択情報は、それ自身のフィールド、つまりフィールド 0と 1を選択する。フィールド 2と 3、フィールド 4と 5、フィールド 6と 7のフィールド選択情報も、同様に、各々該当するデュアルセレクタ 4 8 b〜dへ送られる。

フィールドバス 5と 6は、デュアルセレクタ 4 8 aから出力され、フィーノレドバス 5のフィールド 0 は伸張フィ一ノレドバス 4 9のフィールド 0、 2、 4、 6の中から選択され、一方、フィ一ノレドバス 6のフィールド 1は伸張フィールドバス 4 9のフィールド 1、 3、 5、 7の中から選択される。以下同様に、フィールドバス？〜 1 2上のフィールド 2〜 7 が生成される。この 3 1 0コン卜ロ一ラ 4 6の詳細は、後述する。

以下に、フィールドコントローラ 4 2と S I M Dコントローラ 4 6の詳細構成について説明する。

まず、フィールドコントローラ 4 2の詳細構成を第 8図に示す。同図において、第 7図と同一機能を有する回路ブロック及び同一信号線には同一符号を付してある。図中、 6 0はヘッダ情報を解析するヘッダアナライザ、 6 7はへッダ内のフィールド構成を示す 8 ビッ卜のフィールド信号線、 6 8は圧縮時の命令長（ 0 ~ 3 3 ) を示す 6 ビッ卜の命令長信号線、 6 1はァドレスバス 3へ与えるァドレス情報を生成するァドレスコントローラ、 6 4は実行中の命令アドレス情報を転送する命令アドレスバス、 6 5はへッダに含まれる 4命令のうちの一^ ^を示す 2 ビットのへッダァドレスバス、 6 6はへッダァドレスが 0の時アサ一卜されるへッダ 0信号線、 6 2はライトイネーブルバス 4 3へ与えるフヱツチ情報を生成するパーシャルライトコントローラ、 6 3はフィールド選択信号線 4 4などへ与えるフィールド選択情報を生成するセレクトシグナルジエネレー夕である。以下に、具体例を挙げて、動作説明を行う。第 9図は、インストラクションメモリ 1 に格納されている命令列である。ここでは、 0〜 1 2 7番地までに、 7命令が格納されている。

これらの命令を順次実行する場合の、動作を示すタイムチヤ一卜が第 1 0図である。同図では、 T O〜丁 8までの 9サイクル間の動作を示している。各命令は、基本的には、 4ステージのパイプラインで実行される。 4ステージの内訳としては、 I Fは命令フェッチステージ、 E X P は命令伸張ステージ、 E X Eは演算実行ステージ、 W Bは演算結果の書き込みステージである。図中、命令 1〜命令 6までのタイムチャートを示している。

まず、命令 1に着目する。命令 1 は、初期状態からスター卜しており、 T 0サイクルの各信号線は初期値を示している。命令ァドレスバス 6 4 が 0のためィンストラクシヨンメモリ 1からは、 0番地〜 3 1番地までが読み出される。さらに、ライトイネーブルバス 4 3が 1 1 1 1 1 1 1 1 ( 2進数）であり、インストラクションバッファ 4 0へは、 T 0から T 1サイクルへの遷移時に、 0番地〜 3 1番地までがラッチされる。

T 1サイクルでは、命令 1の E X Pステージが実行される。

具体的に、へッダアナライザ 6 0は、命令ァドレスバス 6 4 とヘッダァドレスノくス 6 5から入力した情報に従って、圧縮フィールドバス 4 1 から入力されたィンストラクシヨンバッファ 4 0にラツチされている情報の中から、ヘッダ情報を特定する。つまり、命令アドレスバス 6 4力 0であることから、命令 1〜 4のへッダは 0〜 3番地に存在していることが判り、この 4バイ卜の情報をラツチする。さらに、ヘッダアドレスバス 6 5が 0であることから、命令 1に相当するヘッダ情報は 0番地の 8 ビッ卜であることが判る。

この情報から、へッダアナライザ 6 0は、命令 1が 5つのフィールドから構成され、その内訳はフィールド 0、 1、 4、 6、 7である、ことが判る。従って、フィールド信号線 6 7へは命令 1のへッダ情報 1 1 0 0 1 0 1 1 ( 2進数）がそのまま出力される。さらに、. 命令 1はヘッダを含めてその命令長が 2 4バイ卜であり、命令長信号線 6 8へは 2 4であることを示す 0 1 1 0 0 0 ( 2進数）の情報が出力される。命令長が 3 2を越えてないので、再フヱッチ信号線 1 3はアサートされない。アドレスコントローラ 6 1は、初期状態のサイクル以外では命令ァドレスバス 6 4の値に 3 2を加算した値をァドレスバス 3へ出力する。従つて、丁 1サイクルでは、 3 2がアドレスバス 3へ出力される。

パーシャルライ卜コントローラ 6 2は、命令長信号線 6 8と命令ァドレスバス 6 4の情報から、インストラクションバッファ 4 0において保持されている命令 1 のフィールドの位置情報をライトイネーブルバス 4 3へ出力する。この位置情報は、 4バイ卜単位で管理されており、 8 ビットで構成してある。 T 2サイクルにおいては、命令ァドレスバス 6 4 が 0、命令長信号線 6 8が 2 4であることから、インストラクションノッファ 4 0の先頭から 2 4バイトが命令 1に相当することが判り、 1 1 1 1 1 1 0 0 ( 2進数）がライトイネーブルバス 4 3へ出力される。セレクトシグナルジエネレ一タ 6 3は、命令ァドレスノくス 6 4、へッダ 0信号線 6 6及びフィ一ルド信号線 6 7から、各フィールド情報をィンストラクシヨンバッファ 4 0の中から選択する情報を生成し、出力する。例えば、フィールド 0の選択情報は、フィールド選択信号線 4 4へ出力される。同様に、フィールド 1〜 7の選択情報は、該当するフィールド選択信号線へ出力される。選択情報は、インストラクションバッファ 4 0において 4バイト境界のどの位置から読み出すかを示す 3 ビットで構成する。 T 1サイクルにおける命令アドレスバス 6 4が 0、ヘッダ 0信号線 6 6がアサートされていることから、命令 1のフィールドは、インストラクションバッファ 4 0の 2番目の 3 2 ビット境界以降に保持されていることが判る。さらに、どのフィールドが存在するかは、フィ一ルド信号線 6 7の情報から判る。従って、 2番目の 3 2 ビット境界には、フィールド 0が保持されていることが判り、フィールド 0を示す選択情報は 1 となり、フィールド選択信号線 4 4へ出力される。同様に、フィールド 1を示す選択情報は 2、フィールド 4は 3、フィールド 6は 4、フィールド 7は 5 となる。

T 1力、ら T 2サイクルへの遷移時に、ァドレスバス 3力、' 3 2、ライ卜ィネーブルバス 4 3力く 1 1 1 1 1 1 0 0 ( 2進数）であることから、ィンストラクシヨンバッファ 4 0へは 3 2番地〜 5 5番地までが新たにラツチされ、既に保持している 2 4番地〜 3 1番地の情報はそのまま保持されている。同時に、命令長信号線 6 8が 2 4であることから、命令ァドレスバス 6 4の情報は、 0に 2 4が加算されて 2 4に、へッダァドレスバス 6 5の情報は 1が加算されて 1 となる。

次に、命令 2に着目すると、上述した T 1サイクルが I Fステージとなり、 T 2サイクルにおいては、インストラクションパ'ッファ 4 0に命令 2が保持されている。 T 2サイクルでは、命令 2の E X Pステージが実行される。

具体的に、へッダアナライザ 6 0は、へッダァドレスバス 6 5が 1であることから、命令 2に相当するヘッダ情報は T 1サイクルでラッチした情報のうち 1番地の 8 ビットであることが判る。この情報から、へッダアナライザ 6 0は、命令 2が 3つのフィールドから構成され、その内訳はフィールド 0、 1、 2である、ことが判る。従って、フィールド信号線 6 7へは命令 2のへッダ情報 1 1 1 0 0 0 0 0 ( 2進数）がそのまま出力される。さらに、命令 2はその命令長が 1 2バイトであり、命令長信号線 6 8へは 2 4であることを示す 0 0 1 1 0 0 ( 2進数）の情報が出力される。命令長が 3 2を越えてないので、再フェッチ信号線 1 3 はアサ一卜されない。

ァドレスコン卜ローラ 6 1は、初期状態のサイクル以外では命令ァドレスバス 6 4の値に 3 2を加算した値をァドレスバス 3へ出力する。従つて、 T 2サイクルでは、 5 6がアドレスバス 3へ出力される。

パーシャルライトコントローラ 6 2は、 T 2サイクルにおける命令ァドレスバス 6 4が 2 4、命令長信号線 6 8が 1 2であることから、インストラクシヨンノくッファ 4 0の 7番目の 4バイ卜境界から 3パ'ィ卜が命令 2に相当することが判り、 1 0 0 0 0 0 1 1 ( 2進数）がライトイネ一ブルバス 4 3へ出力される。

セレクトシグナルジヱネレータ 6 3は、 T 2サイクルにおける命令ァドレスバス 6 4が 2 4、ヘッダ 0信号線 6 6がアサ一卜されてないことから、命令 2のフィーノレドは、インストラクションノッファ 4 0の 7番目の 3 2 ビット境界以降に保持されていることが判る。さらに、どのフィールドが存在するかは、フィールド信号線 6 7の情報から判る。従つて、 7番目の 3 2 ビット境界には、フィールド 0が保持されていることが判り、フィールド 0を示す選択情報は 6 となり、フィールド選択信号線 4 4へ出力される。同様に、フィールド 1を示す選択情報は 7、フィ一ノレド 2は 0となる。

T 2から T 3サイクルへの遷移時に、アドレスバス 3力 5 6、ライトィネーブルバス 4 3が 1 0 0 0 0 0 1 1 ( 2進数）であることから、ィンストラクションバッファ 4 0へは 5 6番地〜 6 7番地までが新たにラツチされ、既に保持している 3 6番地〜 5 5番地の情報はそのまま保持されている。同時に、命令長信号線 6 8が 1 2であることから、命令ァドレスバス 6 4の情報は、 2 4に 1 2が加算されて 3 6に、へッダァドレスバス 6 5の情報は 1が加算されて 2 となる。

次に、命令 3に着目すると、上述した T 2サイクルが I Fステージとなり、 T 3サイクルにおいては、インストラクションバッファ 4 0に命令 3が保持されている。 Τ 3サイクルでは、命令 3の Ε Χ Ρステージが実行される。

具体的に、ヘッダアナライザ 6 0は、ヘッダァドレスバス 6 5が 2であることから、命令 3に相当するへッダ情報は Τ 1サイクルでラッチした情報のうち 2番地の 8 ビットであることが判る。この情報から、へッダアナライザ 6 0は、命令 3が 8つのフィールドから構成され、その内訳はフィールド 0、 1、 2、 3、 4、 5、 6、 7である、ことが判る。従って、フィールド信号線 6 7へは命令 3のヘッダ情報 1 1 1 1 1 1 1 1 ( 2進数）がそのまま出力される。さらに、命令 3はその命令長が 3 2バイ卜であり、命令長信号線 6 8へは 3 2であることを示す 1 0 0 0 0 0 ( 2進数）の情報が出力される。命令長が 3 2を越えてないので、再フェツチ信号線 1 3はアサ一卜されない。

アドレスコントローラ 6 1は、初期状態のサイクル以外では命令ァドレスバス 6 4の値に 3 2を加算した値をァドレスバス 3へ出力する。従つて、 Τ 3サイクルでは、 6 8がァドレスバス 3へ出力される。パーシャルライトコントローラ 6 2は、 Τ 3サイクルにおける命令ァドレスノく' ス 6 4が 3 6、命令長信号線 6 8が 3 2であることから、インストラクシヨンバッファ 4 0の 2番目の 4バイト境界から 3 2バイ卜が命令 3に相当することが判り、 1 1 1 1 1 1 1 1 ( 2進数）がライトイネ一ブルバス 4 3へ出力される。

セレクトシグナルジヱネレー夕 6 3は、 Τ 3サイクルにおける命令ァドレスバス 6 4が 3 6、ヘッダ 0信号線 6 6がアサ一トされてないことから、命令 3のフィ一ルドは、インストラクションバッファ 4 0の 2番目の 3 2 ビット境界以降に保持されていることが判る。さらに、どのフィールドが存在するかは、フィールド信号線 6 7の情報から判る。従つて、 2番目の 3 2 ビット境界には、フィーノレド 0が保持されていることが判り、フィールド 0を示す選択情報は 1 となり、フィールド選択信号線 4 4へ出力される。同様に、フィールド 1を示す選択情報は 2、フィ —ルド 2は 3、 .フィールド 3は 4、フィーノレド 4は 5、フィールド 5は 6、フィーノレド 6は 7、フィールド 7は 0 となる。

T 3から T 4サイクルへの遷移時に、了ドレスバス 3力 < 6 8、ライトィネーブルバス 4 3が 1 1 1 1 1 1 1 1 ( 2進数）であることから、ィンストラクションバッファ 4 0へは 6 8番地〜 9 9番地までが新たにラツチされる。同時に、命令長信号線 6 8が 3 2であることから、命令ァドレスバス 6 4の情報は、 3 6に 3 2が加算されて 6 8に、ヘッダアドレスバス 6 5の情報は 1が加算されて 3 となる。

次に、命令 4に着目すると、上述した T 3サイクルが I Fステージとなり、 T 4サイクルにおいては、インストラクションバッファ 4 0に命令 4が保持されている。 T 4サイクルでは、命令 4の E X Pステージが実行される。

具体的に、ヘッダアナライザ 6 0は、ヘッダァドレスバス 6 5が 3であることから、命令 4に相当するヘッダ情報は T 1サイクルでラッチした情報のうち 3番地の 8 ビットであることが判る。この情報から、へッダアナライザ 6 0は、命令 4が 1つのフィールドから構成され、その内訳はフィールド 0である、ことが判る。従って、フィールド信号線 6 7 へは命令 4のヘッダ情報 1 0 0 0 0 0 0 0 ( 2進数）がそのまま出力される。さらに、命令 4はその命令長が 4バイ卜であり、命令長信号線 6 8へは 4であることを示す 0 0 0 1 0 0 ( 2進数）の情報が出力される。命令長が 3 2を越えてないので、再フエツチ信号線 1 3はアサ一卜されない。

アドレスコントローラ 6 1 は、初期状態のサイクル以外では命令ァドレスバス 6 4の値に 3 2を加算した値をァドレスバス 3へ出力する。従つて、 T 4サイクルでは、 1 0 0がアドレスバス 3へ出力される。パーシャルライ卜コントローラ 6 2は、 T 4サイクルにおける命令ァドレスパ'ス 6 4力く 6 8、命令長信号線 6 8が 4であることから、インストラクシヨンバッファ 4 0の 2番目の 4 ノくィト境界から 4パ'ィ卜が命令 4に相当することが判り、 0 1 0 0 0 0 0 0 ( 2進数）がライトイネーブルバス 4 3へ出力される。

セレクトシグナルジェネレータ 6 3は、 T 4サイクルにおける命令ァドレスバス 6 4が 6 8、ヘッダ 0信号線 6 6がアサ一トされてないことから、命令 4のフィールドは、インストラクションバッファ 4 0の 2番目の 3 2 ビット境界以降に保持されていることが判る。さらに、どのフィールドが存在するかは、フィールド信号線 6 7の情報から判る。従つて、 2番目の 3 2 ビット境界には、フィールド 0が保持されていることが判り、フィールド 0を示す選択情報は 1 となり、フィールド選択信号線 4 4へ出力される。

T 4から T 5サイクルへの遷移時に、ァドレスバス 3力 6 8、ライトィネーブルバス 4 3が 0 1 0 0 0 0 0 0 ( 2進数）であることから、ィンストラクシヨンバッファ 4 0へは 1 0 0番地〜 1 0 3番地までが新たにラッチされ、既に保持している 7 2番地〜 9 9番地の情報はそのまま保持されている。同時に、命令長信号線 6 8が 4であることから、命合ァドレスバス 6 4の情報は、 6 8に 4が加算されて 7 2に、へッダァドレスノ <ス 6 δの情報は 3に 1が加算されて 0 (加算結果は 0〜 3のラップアラウンド）となる。

次に、命令 5に着目すると、上述した Τ 4サイクルが I Fステージとなり、 Τ 5サイクルにおいては、インストラクションバッファ 4 0に命令 5が保持されている。 Τ 5サイクルでは、命令 5の Ε Χ Ρステージが実行される。

具体的に、ヘッダアナライザ 6 0は、命令ァドレスバス 6 4が 7 2であることから、命令 5〜 8のヘッダは 7 2〜 7 5番地に存在していることが判り、インストラクションバッファ 4 0に保持されているこの 4パ' ィ卜の情報をラッチする。さらに、ヘッダァドレスバス 6 5が 0であることから、命令 5に相当するへッダ情報は 7 2番地の 8 ビットであることが判る。この情報から、ヘッダアナライザ 6 0は、命令 5が 8つのフィ一ルドから構成されていることが判る。従って、フィールド信号線 6 7へは命令 5のヘッダ情報 1 1 1 1 1 1 1 1 ( 2進数）がそのまま出力される。さらに、命令 5はヘッダを含めてその命令長が 3 6バイトであり、命令長信号線 6 8へは 3 6であることを示す 1 0 0 1 0 0 ( 2進数）の情報が出力される。命令長が 3 2を越えるので、 T 5〜T 6への遷移時に再フエッチ信号線 1 3はアサ一卜される。

アドレスコントローラ 6 1は、初期状態のサイクル以外では命令ァドレスバス 6 4の値に 3 2を加算した値をァドレスバス 3へ出力する。従つて、 Τ 5サイクルでは、 1 0 4がァドレスバス 3へ出力される。

ノ、。ーシャルライトコントローラ 6 2は、 Τ 5サイクルにおける命令ァドレスバス 6 4が 7 2、命令長信号線 6 8が 3 6であることから、インストラクシヨンバッファ 4 0の 3番目の 4バイ卜境界から 3 2ノィ卜が叩令 5に相当することが判り、 1 1 1 1 1 1 1 1 ( 2進数）がライトイネーブルバス 4 3へ出力される。

セレクトシグナルジヱネレー夕 6 3は、 T 5サイクルにおける命令ァドレスバス 6 4が 7 2、へッダ 0信号線 6 6がアサ一卜されていることから、命令 5のフィールドは、インストラクションノくッファ 4 0の 4番目の 3 2 ビット境界以降に保持されていることが判る。さらに、どのフィールドが存在するかは、フィールド信号線 6 7の情報から判る。従つて、 4番目の 3 2 ビット境界には、フィールド 0が保持されていることが判り、フィールド 0を示す選択情報は 3 となり、フィールド選択信号線 4 4へ出力される。同様に、フィールド 1を示す選択情報は 4、フィ一ルド 2を示す選択情報は 5、フィールド 3を示す選択情報は 6、フィ一ルド 4を示す選択情報は 7、フィールド 5を示す選択情報は 0、フィ一ルド 6を示す選択情報は 1 となる。命令長が 3 2を越えたことから、フィールド 7の情報はィンストラクシヨンバッファ 4 0に保持されてないことが判るので次サイクル（T 6 ) にて選択情報を出力する。

T 5から T 6サイクルへの遷移時に、ァドレスバス 3が 1 0 4、ライトイネーブルバス 4 3が 1 1 1 1 1 1 1 1 ( 2進数）であることから、インストラクションバッファ 4 0へは 1 0 4番地〜 1 3 5番地までが新たにラッチされる。同時に、命令長信号線 6 8が 3 6であることから、命令ァドレスバス 6 4の情報は、 7 2に 3 6が加算されて 1 0 8に、へッダァドレスバス 6 5の情報は 0に 1が加算されて 1 となる。

上述したように、 T 5サイクルでは、命令 5のフィールド 7を生成できないので、命令 5の付加的な E X P ( E X P 2 ) ステージとして T 6 サイクルが必要になる。

T 6サイクルでは、再フヱッチ信号線 1 3がアサートされていることで、 E X P 2ステージであることが判る。再フヱツチ信号線 1 3がアサ一卜されていると、ヘッダアナライザ 6 0、アドレスコントローラ 6 1、パ一シャルライトコントローラ 6 2及びセレクトシグナルジヱネレー夕 6 3は特殊な動作となる。

具体的に、アドレスコントローラ 6 1 は、命令ァドレスバス 6 4の 1 0 8に 2 8を加算した 1 3 6をアドレスバス 3へ出力する。また、 T 6 から T 7への遷移時に、ヘッダァドレスは 1を加算されずに 1のままとなる。ヘッダアナライザ 6 0は、 0を命令長信号線 6 8へ出力する。従って T 6から T 7への遷移時に命令ァドレスバス 6 4の情報は 1 0 8のまま変化しない。パーシャルライトコントローラ 6 2は、命令ァドレスバス 6 4が 1 0 8であり、命令 5のフィールド 7は、インストラクションメモリリ 1の 1 0 4番地に存在していることから、インストラクションバッファ 4 0の 3番目の 4バイト境界にあることが判り、 0 0 1 0 0 0 0 0 ( 2進数）をライトイネーブルバス 4 3へ出力する。

同様に、セレクトシグナルジヱネレータ 6 3は、命令ァドレスバス 6 4力、' 1 0 8であ、命令 5のフィールド 7は、インストラクションメモリ 1の 1 0 4番地に存在していることから、インストラクションバッファ 4 0の 3番目の 4バイト境界にあることが判り、 3をフィーノレド 7に対応するフィールド選択信号線へ出力する。

T 5から T 6サイクルへの遷移時に、ァドレスバス 3力く 1 3 6、ライトイネーブルバス 4 3が 0 0 1 0 0 0 0 0 ( 2進数）であることから、インストラクションノくッファ 4 0へは 1 3 6番地〜 1 3 9番地までが新たにラッチされ、既に保持している 1 0 8番地〜 1 3 5番地の情報はそのまま保持されている。

次に、命令 6に着目すると、上述した T 6サイクルが I Fステージとなり、 T 7サイクルにおいては、インストラクションバッファ 4 0に命令 6が保持されている。 T 7サイクルでは、命令 6の E X Pステージが実行される。

具体的に、ヘッダアナライザ 6 0は、ヘッダァドレスバス 6 5力く 1であることから、命令 6に相当するへッダ情報は T 5サイクルでラツチした情報のうち 2番目のバイト境界であることが判る。この情報から、へッダアナライザ 6 0は、命令 6が 3つのフィ一ルドから構成され、その内訳はフィールド 1 、 2、 3である、ことが判る。従って、フィールド信号線 6 7へは命令 6のヘッダ情報 0 1 1 1 0 0 0 0 ( 2進数）がそのまま出力される。さらに、命令 6はその命令長が 1 2バイ卜であり、命令長信号線 6 8へは 1 2であることを示す 0 0 1 1 0 0 ( 2進数）の情報が出力される。命令長が 3 2を越えてないので、再フェツチ信号線 1 3はアサ一卜されない。

ァドレスコン卜ローラ 6 1は、初期状態のサイクル以外では命令ァドレスバス 6 4の値に 3 2を加算した値をァドレスバス 3へ出力する。従つて、 T 7サイクルでは、 1 4 0がアドレスバス 3へ出力される。

パーシャルライ卜コントローラ 6 2は、 T 7サイクルにおける命令ァドレスバス 6 4が 1 0 8、命令長信号線 6 8が 1 2であることから、ィンストラクションノくッファ 4 0の 4番目の 4バイ卜境界から 1 2 ノくィトが命令 6に相当することが判り、 0 0 0 1 1 1 0 0 ( 2進数）がライトイネ一ブルバス 4 3へ出力される。

セレクトシグナルジエネレー夕 6 3は、 T 7サイクルにおける命令ァドレスバス 6 4力く 1 0 8、ヘッダ 0信号線 6 6がアサ一卜されてないことから、命令 6のフィ一ノレドは、インストラクション 'ッファ 4 0の 4 番目の 3 2 ビット境界以降に保持されていることが判る。さらに、どのフィールドが存在するかは、フィールド信号線 6 7の情報から判る。従つて、 4番目の 3 2 ビット境界には、フィールド 1が保持されていることが判り、フィールド 1を示す選択情報は 3 となり、フィールド選択信号線 4 4 出力される。同様に、フィールド 2を示す選択情報は 4、フィールド 3は 5 となる。

T 7から T 8サイクルへの遷移時に、ァドレスバス 3力く 1 4 0、ライトイネーブルバス 4 3が 0 0 0 1 1 1 0 0 ( 2進数）であることから、インストラクションバッファ 4 0へは 1 4 0番地〜 1 5 1番地までが新たにラッチされ、既に保持している 1 2 0番地〜 1 3 9番地の情報はそのまま保持されている。同時に、命令長信号線 6 8が 1 2であることから、命令ァドレスバス 64の情報は、 1 0 8に 1 2が加算されて 1 2 0 に、ヘッダァドレスバス 6 5の情報は 1に 1が加算されて 2となる。命令 6以降が順次同様のシーケンスで繰り返し実行される。各命令の

E X Pステージから E XEステージに遷移する時に、各命令レジスタ 1 4〜 2 1に、伸張された命令フィールドがラッチされる。従って、 E X Eステージでは、各命令レジスタ 1 4〜 2 1の制御下で各演算ュニット 2 2〜 2 5が演算を実行する。実行結果は、 WBステージにおいて、命令フィールドで指定されたレジス夕へ書き込まれて、命令が終了する。以上が、フィールドコントローラ 4 2の動作説明である。以下、その構成要素であるヘッダアナライザ 6 0、アドレスコントローラ 6 1、ノ、。一シャルライ卜コントローラ 6 2及びセレクトシグナルジヱネレー夕 6 3の詳細構成を説明する。

第 1 1図は、ヘッダアナライザ 6 0の詳細を示すプロック図である。同図において、第 8図と同一機能を有する回路プロック及び同一信号線には同一符号を付してある。図中、 8 0は 8個の 4バイトデータから 1 個を選択するセレクタ、 8 1〜 8 3は各々 1バイ卜データのラッチ回路、 8 4は 4個の 1バイトデータから 1個を選択するセレクタ、 8 5は 1 ビット 9入力の加算器、 8 6は 4 ビットのデコーダ、 8 7は論理積回路 8 7、 8 8は 1 ビットのラッチ回路、 8 9は 1 ビットの反転回路、 9 0は論理積回路 9 0である。

セレクタ 8 0は、 3 2 ビットの命令アドレスバス 6 4 ( I A 3 1〜 I A O ) のうち、 I A 4〜 I A 2の 3 ビッ卜からヘッダの位置を特定して、 4バイト（4命令分の）ヘッダ情報を出力する。ヘッダ 0信号線 6 6はアサートされていると、ヘッダ情報のうち、 1番目の命令ヘッダはセレクタ 84へ、 2番目の命令ヘッダはラッチ回路 8 1へ、 3番目の命令へッダはラツチ回路 8 2へ、 4番目の命令ヘッダはラツチ回路 8 3へ出力される。

セレクタ 8 4は、ヘッダアドレスバス 6 5の情報に従って、 0ならば上記 1番目のべッダ情報、 1ならば上記ラツチ回路 8 1へ保持したへッダ情報、 2ならば上記ラッチ回路 8 2へ保持したヘッダ情報、 3ならば上記ラツチ回路 8 3へ保持したヘッダ情報を選択してフィ一ルド信号線 6 7へ出力する。

フィールド信号線 6 7の情報から、加算器 8 5は命令長情報を生成する。 9入力の内訳は、フィールド信号線 6 7の 8 ビットとヘッダ 0信号線 6 6の 1 ビットである。基本的には、フィールド信号線 6 7のフィールド数を数えることで命令長が判る。さらに、ヘッダ 0信号線 6 6がァサー卜されているサイクルでは、命令がヘッダ情報を含んでいるので、フィールド数から生成した命令長に 1を加算する。従って、加算器 8 5 の加算結果は 0〜 9の範囲であり、命令長を 4 ビッ卜の情報で出力する。実際の命令長は、上記加算結果に 4を乗算した値であり、 0〜3 6バイト長となる。

デコーダ 8 6は、 3 6バイト長の命令を検出する回路であり、入力情報が 9の時出力をアサートする。

デコーダ 8 6の出力がアサ一卜されると、サイクルが遷移する夕ィミングで、ラッチ回路 8 8は、再フェツチ信号線 1 3をアサートする。再フェツチ信号線 1 3がアサートされると、反転回路 8 9の出力がネゲートされ、論理積回路 8 7はデコーダ 8 6の出力をマスクする。

この状態において、サイクルが遷移するタイミングで、ラッチ回路 8 8は、再フェツチ信号線 1 3をネゲートする。すなわち、再フェッチ信号線 1 3は、アサ一卜された次のサイクルでは、必ずネゲー卜される。再フェツチ信号線 1 3がアサートされると、反転回路 8 9の出力が加算器 8 5の出力をマスクし、論理積回路 9 0は命令長 0の情報を命令長信号線 6 8へ出力する。アサ一卜されなければ、加算器 8 5が出力する命令長情報は、命令長信号線 6 8へ出力される。

以上のように、へッダアナライザ 6 0は、命令長信号線 6 8、フィールド信号線 6 7、再フェッチ信号線 1 3の各々へ必要な情報を出力できる。

次に、パーシャルライ卜コントローラ 6 2の詳細動作を説明する。第 1 2図は、パーシャルライ卜コントローラ 6 2の詳細構成を示すブロック図である。同図において、第 8図と同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。

図中、 1 0 0は 4 ビット入力 8 ビット出力のデコーダ、 1 0 1は 8 ビットのバレルシフタ、 1 0 2は 3 ビットの加算器、 1 0 3はアドレスく' ス 3ビット入力 8 ビッ卜出力のデコーダ、 1 0 4はバレルシフタ 1 0 1 とデコーダ 1 0 3の出力を選択してライトイネーブルバス 4 3へ出力するセレクタである。

デコーダ 1 0 0は、同図に示す変換テーブルに従って、 8 ビットの情報を生成する。

この情報は、レルシフタ 1 0 1において、命令ァドレスバス 6 4の 3 ビット（ I A 4 ~ I A 2 ) の情報に従って、口一テートされる。これにより、バレルシフタ 1 0 1が出力する情報は、命令ァドレスバス 6 4 が示す命令が、インストラクションバッファ 4 0内のどこに保持されているかを 4バイト単位で示している。すなわち、この情報は、次のサイクルへの遷移時に、更新するべきィンストラクシヨンバッファ 4 0の場所を示している。

従って、再フヱツチ信号線 1 3がアサ一卜されてない場合、セレクタ 1 0 4がこの情報を選択してライトイネーブルバス 4 3へ出力される。一方、再フェッチ信号線 1 3がアサ一卜されたサイクルでは、命令ァドレスバス 6 4は次の命令の先頭番地を示しているので、. その番地から 4 を減じた値が命令のフィ一ルド 7の格納番地となる。

インストラクションノッファ 4 0 におけるこのフィーノレド 7の格納位置を求めるために、加算器 1 0 2は、命令ァドレスノくス 6 4の 3 ビット ( I A 4〜 I A 2 ) の情報に Ί ( 1 1 0、 2進数）を加算する。その加算結果は、デコーダ 1 0 3の図中に示す変換テーブルに従って、ライトィネーブルバス 4 3へ出力する情報を生成する。

そのために、セレクタ 1 0 4は、再フェツチ信号線 1 3がアサ一卜されると、デコーダ 1 0 3の出力を選択する。

以上のように、ノ、⁰—シャルライトコン卜ローラ 6 2はライトイネーブルバス 4 3へ必要な情報を出力できる。

次に、アドレスコントローラ 6 1の詳細動作を説明する。第 1 3図は、アドレスコントローラ 6 1の詳細構成を示すプロック図である。同図において、第 8図と同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。

図中、 1 1 0は 3 2 ビットのアドレス命令ァドレス情報を保持するプログラ厶カウンタ、 1 1 1は 3 2 ビットの加算器、 1 1 2は 2 ビットのヘッダカウン卜レジスタ、 1 1 3は 2 ビットの加算器、 1 1 4は論理和の否定情報を出力する 2入力の N O R回路、 1 1 5は 3 2と 2 8のどちらかを選択するセレクタ、 1 1 6はセレクタ 1 1 5の出力か 0かを選択するセレクタ、 1 1 7は 3 2 ビットの加算器である。

プログラムカウンタ 1 1 0は、サイクルが遷移する毎に、命令ァドレス情報を更新する。更新情報は、加算器 1 1 1が命令長信号線 6 8の情報とプログラムカウンタ 1 1 0の命令ァドレス情報を加算することで生成される。生成した情報は、命令アドレスバス 6 4へ出力される。ヘッダカウントレジスタ 1 1 2はヘッダァドレス情報（ 0〜 2 ) を保持しており、プログラムカウンタ 1 1 0と同様に、サイクルが遷移する毎に、ヘッダアドレス情報を更新する。更新情報は、加算器 1 1 1がへッダァドレス情報に 1を加算することで生成される。生成した情報は、ヘッダアドレスバス 6 5へ出力される。

N〇 R回路 1 1 4は、ヘッダァドレス情報が 0であることを検出して、ヘッダ 0信号線 6 6をアサートする。

セレクタ 1 1 5は、再フヱツチ信号線 1 3がアサ一トされてない場合 " 3 2 " を、再フヱッチ信号線 1 3がアサ一卜されている場合 " 2 8 " を選択して出力する。

セレクタ 1 1 6は、初期状態の場合のみ 0を選択し、それ以外はセレクタ 1 1 5の出力を選択する。

加算器 1 1 7は、命令ァドレスバス 6 4の情報とセレクタ 1 1 6の出力情報を加算した結果をァドレスバス 3へ出力する。

以上のように、アドレスコントローラ 6 1は、命令ァドレスバス 6 4、へッダァドレスバス 6 5、ヘッダ 0信号線 6 6及びァドレスバス 3へ必要な情報を出力できる。

次に、セレク卜シグナルジェネレータ 6 3の詳細動作を説明する。第 1 4図は、セレクトシグナルジェネレータ 6 3の詳細構成を示すプロック図である。同図において、第 8図と同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。

図中、 1 2 0はオフセット生成回路、 1 2 1は 3 ビットの加算器、 1 2 2〜： 1 2 8は 3 ビットの加算器、 1 2 9は 3 ビットの加算器、 1 3 0 はセレクタである。

オフセット生成回路 1 2 0は、第 1番目のフィールドの位置を 0とした場合の、フィールド 1〜7の相対位置を示す各 3 ビッ卜の情報を生成する。相対位置は、インストラクションメモリ 1に格納してある圧縮状態での相対位置である。従って、オフセッ卜生成回路 1 2 0は、存在するフィールドの相対位置のみ有効な情報を出力する。オフセッ卜生成回路 1 2 0の詳細は、後述する。

加算器 1 2 1は、命令ァドレスバス 6 4の 3 ビット（ I A 4〜 I A 2 ) の情報に、ヘッダ 0信号線 6 6の 1 ビッ卜情報を加えた結果を出力する。ヘッダを含む命令において、命令アドレスバス 6 4の情報はへッダの位置を指しているので、その命令の第 1番目のフィールド位置を知るために、加算器 1 2 1での加算が必要になる。加算結果は、フィールド 0が存在する場合、フィールド 0の位置を示しているので、フィールド選択信号線 4 4へ出力される。

加算器 1 2 2は、オフセット生成回路 1 2 0が出力するフィールド 1 の相対位置情報と第 1番目のフィールド位置情報を加算することで、フィールド 1の絶対位置情報を生成する。以下同様に、加算器 1 2 3〜 1 2 8は、オフセット生成回路 1 2 0が出力するフィールド 2〜 7の各々の相対位置情報と第 1番目のフィールド位置情報を加算することで、フィ一ルド 2〜 7の絶対位置情報を生成する。

とくに、セレクタ 1 3 0は、再フェツチ信号線 1 3がアサートされてない場合にレジスタファイル 2 8の出力を選択し、再フェツチ信号線 1 3がアサ一卜されている場合は加算器 1 2 9の出力を選択して、フィーノレド 7の選択情報として出力する。

再フエツチ信号線 1 3がアサ一卜されている状態では、命令ァドレスバス 6 4は次の命令ァドレス情報を示しているので、フィールド 7のァドレス情報は、上記ァドレス情報から 4を減算した結果となる。従って、加算器 1 2 9は、加算器 1 2 1 と同様に、命令ァドレスバス 6 4の 3 ビッ卜（ I A 4〜 I A 2 ) の情報に一 1 ( 1 1 1、 2進数）を加算することで、フィールド 7の選択情報を生成する。

以上のように、セレクトシグナルジエネレ一タ 6 3は、フィールド選択信号線 4 4などへ必要な選択情報を出力できる。

第 1 5図は、前述したオフセット生成回路 1 2 0の詳細構成図である _c 同図において、第 1 4図と同一回路ブロック及び同一信号線には同一符号を付してある。

図中、 1 3 1は 1 ビット 2入力の加算器、 1 3 2は 1 ビット 3入力の加算器、 1 3 3は 1 ビット 4入力の加算器、 1 3 4は 1 ビット 5入力の加算器、 1 3 5は 1 ビット 6入力の加算器、 1 3 6は 1 ビット 7入力の加算器である。

オフセット生成回路 1 2 0において、フィ一ルド 1の相対位置情報は、フィールド 0が存在する場合 1、存在しない場合 0なので、フィールド信号線 6 7のフィ一ノレド 0の情報そのものとなる。フィーノレド 2の相対位置情報は、フィールド 0とフィールド 1の有無に依存しており、両方存在しない場合 0、どちらか一方が存在する場合 1、両方が存在する場合 2となる。したがって、加算器 1 3 1において、フィールド 0とフィ一ルド 1の各 1 ビット情報を加算することで、相対位置情報が生成される。

同様に、フィールド 3の相対位置情報は、フィールド 0〜 2の有無に依存しており、加算器 1 3 2において、フィールド 0〜 2の各 1 ビッ卜情報を加算することで、生成される。同様に、フィールド 4の相対位置情報は、フィールド 0〜 3の有無に依存しており、加算器 1 3 3において、フィールド 0〜3の各 1 ビット情報を加算することで、生成される。同様に、フィールド 5の相対位置情報は、フィールド 0〜 4の有無に依存じており、加算器 1 3 4において、フィールド 0〜4の各 1 ビッ卜情報を加算することで、生成される。同様に、フィールド 6の相対位置情報は、フィールド 0 ~ 5の有無に依存しており、加算器 1 3 δにおいて、フィールド 0〜5の各 1 ビット情報を加算することで、. 生成される。同様に、フィールド 7の相対位置情報は、フィールド 0〜 6の有無に依存しており、加算器 1 3 6において、フィールド 0〜 6の各 1 ビッ卜情報を加算することで、生成される。

以上がフィ一ルドコン卜ローラ 4 2の詳細説明であり、以下、 S I Μ Dコントローラ 4 6の詳細を説明する。

即ち、第 1 6図は、 S I MDコントローラ 4 6の詳細を示すプロック図である。同図において、第 7図と同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。図中、 1 4 0はィネーブルアナライザ 1 4 0、 1 4 1〜 1 4 3は 1 4 0と同一機能のイネ一ブルアナラィザ、 1 4 4はシグナルジェネレータ、 1 4 5 ~ 1 4 7は 1 44と同一機能のシグナルジヱネレー夕、 1 4 8〜 1 5 0は 2入力の論理積回路、 1 5 1〜 1 5 4と 1 5 6は左側の入力 1 ビッ卜が 0の場合 0、 1の場合右側の 2 ビットの情報を出力する論理積回路、 1 5 5は 4入力の 1 ビット論理和の否定情報を出力する N O R回路 1 5 5である。

イネ一ブルアナライザ 1 4 0は、フィールド 0で S I M Dモードを指定しているかを検出するものであり、伸張フィールドバス 4 9からフィ一ルド 0のビット 9〜 1 1 ( " S I M D " ) とビット 2 7 ( " Sモード" ）の 4 ビットを入力する（第 2図参照）。 "Sモ一ド" が 0の場合、論理積回路 1 4 8、 1 4 9及び 1 5 0は、 0を出力する。一方、 Sモードビッ卜が 1の場合、論理積回路 1 4 8はビット 9の情報を、論理積回路 1 4 9はビット 1 0の情報を、論理積回路 1 5 0はビット 1 1の情報を出力する。第 2図に示した "S I MD" の意味にしたがって、論理積回路 1 4 8の情報が 1の場合、フィールド 0と 1の内容をフィールド 1 と 2へ複写することを示す。同様に、論理積回路 1 4 9の情報が 1の場合フィールド 0と 1の内容を 4と 5へ、論理積回路 1 5 0の情報が 1の場合フィールド 0と 1の内容を 6と 7へ複写することを示す。

同様に、イネ一ブルアナライザ 1 4 1はフィールド 2で、ィネーブルアナライザ 1 4 2はフィールド 4で、イネ一ブルアナライザ 1 4 3はフィールド 6で、 S I M Dモードを指定しているかを検出して、複写先を特定する。各ィネーブルアナライザ 1 4 0〜 1 4 3からの複写指示は、各シグナルジェネレータへ送られる。具体的に、シグナルジェネレータ 1 4 4は、フィ一ルド 0と 1がどのフィ一ルドから複写されるかを決定するものであり、フィールド 2と 3からの複写指示は論理積回路 1 5 2 へ、フィールド 4と 5からの複写指示は論理積回路 1 5 3へ、フィ一ルド 6と 7からの複写指示は論理積回路 1 5 4へ送られる。これらの複写指示が複数のイネ一ブルアナライザから同時に送られることはない。このことは、基本的に、コンパイラが保証している。また、同様の理由から、シグナルジェネレータ 1 4 4においてイネ一ブルアナライザ 1 4 0 から複写指示が送られることはないので、論理積回路 1 5 1の入力は、 0で固定している。

論理積回路 1 5 2は複写指示を受けると複写元としてフィ一ルド 2 と 3を選択するための情報である 1を出力する。同様に、論理積回路 1 5 3は 2、論理積回路 1 5 4は 3を出力する。複写指示がない（ S I M D モードでない）場合、 N O R回路 1 5 5はこれを検出し、論理積回路 1 5 6は、フィールド 0と 1が選択されるように選択情報 0を出力する。最終的には、論理和回路 1 5 7が、論理積回路 1 5 1から 1 5 4と 1 5 6が出力する 3 ビッ卜情報の論理和を、フィールド 0と 1の選択情報として S I M D選択信号線 4 7へ出力する。

シグナルジェネレータ 1 4 5は、基本的には、シグナルジェネレータ 1 4 4と同様に動作する。ただし、フィールド 2と 3の選択情報を出力するので、イネ一ブルアナライザ 1 4 1から複写指示が送られることはないのでそれに対応する入力は 0で固定すると共に、複写指示がない ( S I M Dモードでない）ことを検出するとフィールド 2と 3が選択されるように選択情報 1を出力する。

同様に、シグナルジェネレータ 1 4 6も、基本的には、シグナルジェネレー夕 1 4 4と同様に動作する。ただし、フィールド 4と 5の選択情報を出力するので、イネ一ブルアナライザ 1 4 2から複写指示が送られることはないのでそれに対応する入力は 0で固定すると共に、複写指示がない（ S I M Dモードでない）ことを検出するとフィールド 4 と 5が選択されるように選択情報 2を出力する。

さらに、シグナルジヱネレータ 1 4 7も、基本的には、シグナルジヱネレータ 1 4 4と同様に動作する。ただし、フィールド 6と 7の選択情報を出力するので、イネ一ブルアナライザ 1 4 3から複写指示が送られることはないのでそれに対応する入力は 0で固定すると共に、複写指示がない（ S I M Dモードでない）ことを検出するとフィールド 6 と 7力く選択されるように選択情報 3を出力する。

以上が、第 1図に示した第一の実施例である。本実施例は、 N O Pの圧縮用のヘッダがあることを前提にして、そのヘッダを S I M Dモードでも活用する方式である。

通常、 V L I Wにおいては、ォブジヱク卜の約 8 0 %を N O Pが占めている。従って、 N O P圧縮は、メモリの使用効率を考慮すると必須の技術である。この技術で用いるヘッダを S I M Dモードでも活用することで、オーバーへッドを軽減できることが、本実施例の特徴である。本実施例では、各フィールド当たり 4 ビッ卜の追加で、 S I M Dモードを実現しているが、ヘッダを前提にしない場合には、各フィールドに 7 ビッ卜を追加する必要がある。つまり、本実施例で使用した 4 ビットに加えて、フィールドアドレスの 2ビッ卜と同期制御の 1 ビッ卜が必要になる。

S I MDモード時に省略されたフィールドが存在するので、各フィ一ルド自身がフィールド 0、 1、または 2、 3、または 4、 5、または 6- 7のどれかを知.つている必要がある。このために必要なのがフィールドアドレスの 2ビットである。さらに、 1命令のフィールド数が不定なので、命令の切れ目が不明である。このために必要なのが同期制御の 1 ビットであり、 1命令毎にビットの情報を反転することで、命令の切れ目検出が可能になる。従って、実施例と同様に 1フィールド単位で圧縮を可能にすることまで考慮すると、 1命令（ 32ビット X 8 = 256ビット）当たり、

8 [フィールド] x(2 [フィールドアドレス] + 1 [同期制御])

+ 8 [フィールド] 2 X ( 3 [ "S I MD" ]+ 1 [ "Sモード" ]) = 4 0ビット

ただし、 [ ]内は、その数字の意味を示す

が必要になる。 2フィールド単位での圧縮に限ると、 1命令当たり、

8/2 Χ(2 + 1 )+ 8Ζ2 Χ(3 + 1 )= 28ビッ卜

になる。一方、本実施例では、ヘッダを含めた 1命令当たり、

8 [ヘッダ] + 8ノ 2 X ( 3 + 1 ) = 24ビット

で済むことになり、 S I MDモードを実現する上でのオーバーヘッドを軽減できる。

次に、上述したヘッダを前提にしない方式を第 2の実施例として、第 1 7図を用いて説明する。とくに、本実施例では、上記したうちの、 2 フィールド単位で圧縮することを前提に考える。同図は、 VL I Wプロセッサの全体ブロック図である。同図において、第 1図と同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。図中、 2 0 0は、第 1図とは異なる命令伸張回路である。本実施例では、ヘッダを使用しないので、必ず、 1命令は 3 2バイ卜以内に収まり、第 1図の再フエツチ信号線 1 3は不要となる。すなわち、第 1 0図に示した命令 5で必要になった E X P 2ステージは、存在しない。この点が、本実施例の特徴のひとつである、この点と命令伸張回路 2 0 0の内部動作を除いては、第 1図と同じである。

第 1 8図に、本実施例の命令フォーマツ卜を示す。同図においては、

1 N Tフィールドと I F Gフィールドの 0〜 2 7 ビッ卜は、第 1の実施例と同じである。 I F Gフィ一ルドの 2 8、 2 9 ビットは、そのフィ一ノレドのアドレスを示している。 I F Gフィーノレドは、フィールド 0、 2、 4及び 6の何れかであり、ビット割付は図中のとおりである。また、 I F Gフィールドのビット 3 0 (シンク）は同期信号である。 1命令毎に、シンクビットを反転することで、命令の切れ目を認識できるようになる。図中、偶数番目の命令はシンクビットカ < 0、奇数番目の命令はシンクビッ卜が 1 となる仕様としてある。このような命令フォーマツトをべ一スにして、以下に、本実施例のボイントである命令伸張回路 2 0 0の詳細動作を説明する。

第 1 9図は命令伸張回路 2 0 0の詳細を示すプロック図である。同図において、第 1 7図及び第 7図と同一機能を有する回路プロック及び同一信号線には同一符号を付して有る。

図中、 2 0 1は 1命令を生成する各フィ一ルドを、圧縮フィ一ルドバス 4 1から選択する情報を生成するフィールドコントローラ、 2 0 6〜

2 0 9は上記選択情報を転送する選択情報線、 2 0 2はフィールド 0と 1を生成するデュアルセレクタ、 2 0 3はフィールド 2と 3を生成するデュアルセレクタ、 2 0 4はフィールド 4と 5を生成するデュアルセレクタ、 2 0 5はフィールド 6と 7を生成するデュアルセレクタである。図中明示していないが、デュアルセレクタ 2 0 3〜 2 0 5は、デュアルセレクタ 2 0 2と同一の回路構成である。インストラクションバッファ 4 0から同時に読み出される 3 2バイトは、 1フィールドに相当する 4 ノィト単位の 8本の信号線（4 1 a ~ 4 1 h ) で構成されている。 4 1 aは（ 3 2 X N ) 番地、 4 1 bは（ 3 2 X N + 4 ) 番地、、

4 1 hは（ 3 2 X N + 2 8 ) 番地から読み出されたデータに対応している。

デュアルセレクタ 2 0 2は、選択情報線 2 0 6の選択情報に従って、圧縮フィールドバス 4 l a、 4 1 c、 4 1 e、 4 1 gの中から選択したフィールド 0のデータをフィールドバス 5へ、圧縮フィールドバス 4 1 b、 4 1 d、 4 1 f 、 4 1 hの中から選択したフィールド 1のデータをフィールドバス 6へ出力する。選択情報線 2 0 6の選択情報は、 4 ビッ卜で構成されており、基本的にはその中の 1 ビッ卜がアサ一卜される力、全てがアサ一卜されてない場合 N 0 Pフィールドであるとみなし、 N 0 Pコードに相当する 0を出力する。これにより、 2フィールド単位での N〇 P圧縮が可能になる。デュアルセレクタ 2 0 3〜 2 0 5も同様に、フィールド 2 ~ 7のデータを生成して出力する。

次に、フィールドコントローラ 2 0 1の詳細を説明する。第 2 0図は、フィールドコントローラ 2 0 1の詳細を示すブロック図である。同図において、第 8図と第 1 9図と同一機能を有する回路ブロック及び同一信号線には、同一符号を付して有る。

図中、 2 1 0は圧縮フィールドバス 4 1 と命令ァドレスバス 6 4の情報から命令長信号線 6 8 とライトイネーブルバス 4 3へ出力する情報を生成するシンク口ナイザ、 2 1 1は圧縮フィールドバス 4 1 とライトイネーブルバス 4 3の情報から選択情報線 2 0 6〜2 0 9への選択情報を生成するセレクトシグナルジェネレータである。アドレスコントローラ 6 1は第 8図に示したアドレスコントローラ 6 1 と基本的に同一機能を有している。

シンクロナイザ 2 1 0は、圧縮フィーノレドバス 4 1から 4 1 a、 c、 e及び gのシンクビッ卜を入力する。また、命令ァドレスパ'ス 6 4から命令ァドレスを入力することで、処理中の命令が上記どのシンクビッ卜であるかを特定できる。さらに、シンクビットの変化点を調べることで、その命令長をしることができる。さらに、その命令が存在する上記圧縮フィールドバス 4 1内のデータを特定し、次にィンストラクションバッファ 4 0へ書き込むべき位置を示す情報を命令長信号線 6 8へ出力する。セレクトシグナルジヱネレータ 2 1 1は、ライトイネーブルバス 4 3 の情報と、圧縮フィールドバス 4 1から 4 1 a、 c、 e及び gの " S I M D " 、 " Sモード" 及びァドレス情報を入力する。また、これらの情報から、フィールド 0の位置情報 4 ビット（ 4 1 a、 c、 eまたはの 4つのうちの何れかを示す情報）を選択情報線 2 0 6へ出力する。フィ一ルド 0が N O P圧縮されていると 4 ビット全てが 0になる。これは、同時に、フィールド 1の選択情報（ 4 1 b、 d、 f または gの 4つのうちの何れかを示す情報）でもある。同様に、フィールド 2の位置情報 4 ビット（ 4 1 a、 c、 eまたは hの 4つのうちの何れかを示す情報）を選択情報線 2 0 7へ、フィールド 4の位置情報 4 ビット（ 4 1 a、 c、 eまたは hの 4つのうちの何れかを示す情報）を選択情報線 2 0 8へ、フィールド 6の位置情報 4 ビット（ 4 1 a、 c、 eまたは hの 4つのうちの何れかを示す情報）を選択情報線 2 0 9へ、出力する。以下に、シンクロナイザ 2 1 0とセレクトシグナルジヱネレー夕 2 1 1の詳細動作を説明する。

第 2 1図は、シンクロナイザ 2 1 0の詳細を示すプロック図である。同図において、第 2 0図同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。

図中、 2 2 0はインストラクションノッファ 4 0の 4 1 aと bへの書き込み有効になる情報を生成するライトイネーブル生成回路、 2 2 1〜 2 2 3は、ライトイネーブル生成回路 2 2 0と同一機能を有しており、各々、インストラクションノくッファ 4 0の 4 1 cと dへ、 4 1 e と f へ, 4 1 gと hへの書き込み有効になる情報を生成するライ卜ィネーブル生成回路、 2 2 4は命令アドレスバス 6 4の情報のうち、 I A 4と I A 3 の 2ビットをデコードするデコーダである。デコーダ 2 2 4が出力する 4本の信号線は、セレクトシグナルジエネレータ 6 3が 4 l a と 4 l b を示す信号、 4 1 c と 4 1 dを示す信号、 4 1 eと 4 1 f を示す信号及び 4 1 gと 4 1 hを示す信号である。

ライトイネーブル生成回路 2 2 0は、 4 1 a と bの書き込み有効情報を生成する。圧縮フィ一ルドバス 4 1から 4 1 aと 4 1 gのシンク情報、デコーダ 2 2 4から 4 1 aと bのデコード信号及びライトイネーブル生成回路 2 2 3から書き込み有効情報を入力する。デコーダ 2 2 4からのデコード信号が、アサートされると、ライトイネーブル生成回路 2 2 0 は書き込み有効情報をアサ一卜する。デコード信号がアサ一卜されてない場合、ライトイネーブル生成回路 2 2 3の出力がアサ一卜されてないと、書き込み有効情報をネゲー卜する。デコード信号がアサ一卜されてなく、かつ、ライトイネーブル生成回路 2 2 3がアサ一卜されている場合、 4 1 aのシンク情報と 4 1 gのシンクビットを比較して、同一ならば命令の切れ目でないと判断して書き込み有効情報をアサ一卜する。逆に、比較結果が同一でない場合、命令の切れ目であると判断して、書き込み有効情報をネゲー卜する。

このように、ライトイネーブル生成回路 2 2 0は、 4 l aと bの書き込み有効情報を生成する。これにより、次サイクルへの遷移時に、インストラクシヨンバッファ 4 0へ書き込むか否かを制御する。同様の考え方で、ライトイネーブル生成回路 2 2 1は 4 1 cと d書き込み有効情報を、ライトイネーブル生成回路 2 2 2は 4 1 eと f 書き込み有効情報を. ライトイネーブル生成回路 2 2 3は 4 1 gと h書き込み有効情報を生成して、ライトイネーブルバス 4 3へ出力する。加算器 2 2 5は、ライトイネ一ブル生成回路 2 2 0 - 2 2 3の 4つの信号を入力して、 1 ビットの 4入力加算結果を命令長信号線 6 8へ出力する。 1 ビッ卜は 8バイ卜 ( 2フィールド分）なので、加算結果は、最大 3 2バイトである。加算結果は、命令長情報として命令長信号線 6 8へ出力される。

次に、セレクトシグナルジェネレータ 2 1 1の詳細動作を説明する。第 2 2図はセレクトシグナルジヱネレー夕 2 1 1の詳細を示すプロック図である。同図において、第 2 0図と同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。

2 3 0〜 2 3 3は、同一機能を有する行き先信号生成回路である。行き先信号生成回路 2 3 0においては、 2 3 4が図中に示した真理値表を実現する組み合わせ回路、 2 3 5が 2 ビットのデコーダ、 2 3 6〜 2 3 9は同一機能を有する論理回路である。

行き先信号生成回路 2 3 0は、 4 1 a と cがどのフィールドに相当するかを決定している。論理回路 2 3 6はフィールド 0と 1に相当することを、論理回路 2 3 7はフィールド 2 と 3に相当することを、論理回路 2 3 8はフィールド 4と 5に相当することを、論理回路 2 3 9はフィールド 6と 7に相当することを示す。したがって、 4 l aと bがフィールド 0と 1に相当すると論理回路 2 3 6の出力が、フィールド 2と 3に相当すると論理回路 2 3 7の出力が、フィールド 4と 5に相当すると論理回路 2 3 8の出力が、フィールド 6と 7に相当すると論理回路 2 3 9の出力が、アサ一卜される。また、 4 1 aの命令が S I M Dモード指定していると、行き先信号生成回路 2 3 0は複数の信号を同時にアサ一卜する。例えば、他の 3つのフィールド全てに複写する場合、論理回路 2 3 6〜 2 3 9の出力信号が全てアサ一卜される。

行き先信号生成回路 2 3 0は、圧縮フィールドバス 4 1の中から 4 1 aの " S I MD" 、 " Sモード" 及びアドレスを入力する。これらの入力情報から、組み合わせ回路 2 3 4は、図に示した真理値表にしたがつて、 s f 0 ~ 3の出力情報を生成する。 s f 0〜3は、 4 l aのフィールドが Sモードを指定時に、 4 1 aの複写先フィールドを指定する信号である。図中、 a、 b及び cは " S I MD" 3 ビッ卜の論理値を示す。したがって、 5 1^: 0 ~ 3の 3、 b及び cは、その論理値をそのまま出力することを示している。 s f 0は、 4 1 aフィールドが S I MDモードを指定しており、複写先としてフィールド 0が指定されている時にアサ一卜される。同様に、 s f 1〜 3は、複写先としてフィ一ルド 2、 4、 6が指定されている時にアサ一卜される。

デコーダ 2 3 5は、フィールドのァドレス情報をデコ一ドして、 4 1 aがどのフィールドであるかを示す。フィールド 0ならば論理回路 2 3 6への出力を、フィールド 2ならば論理回路 2 3 7への出力を、フィーノレド 4ならば論理回路 2 3 8への出力を、フィールド 6ならば論理回路 2 3 9への出力を、アサートする。

また、行き先信号生成回路 2 3 0は、ライトイネーブルバス 4 3の中から 4 3 aの書き込み有効情報を入力する。この情報がアサ一卜されていることは、 4 3 aが実行命令のフィールドであることを示す。したがつて、この信号がアサ一卜されてない場合、論理回路 2 3 6〜 2 3 9の出力は、全てアサートされることはない。逆に、アサートされている場合、デコーダ 2 3 5の出力線の中のアサ一卜されている一つの信号線が接続されている論理回路が出力信号をアサ一卜する。ァドレスが 0 0 ( 2進数）ならば論理回路 2 3 6が、了ドレスが 0 1 ( 2進数）ならば論理回路 2 3 7が、ァドレスが 1 0 ( 2進数）ならば論理回路 2 3 8が、ァドレスが 1 1 ( 2進数）ならば論理回路 2 3 9カ、出力信号をアサ一卜する。例えば、論理回路 2 3 6がアサートしており、 S I M Dモードでフィールド 2と 4への複写を指定していると、行き先信号生成回路 2 3 0が論理回路 2 3 7と 2 3 8への信号をアサ一卜するので、論理回路 2 3 6と 2 3 7の出力信号もアサ一卜される。

以上のように、行き先信号生成回路 2 3 0は、 4 1 aがどの命令フィ一ルドに相当するかを、さらに、 S I M Dモード時の複写先フィールドを解析した上で、 4 1 aの行き先フィールドを、選択情報線 2 0 6を介してデュアルセレクタ 2 0 2に対して指定する。同様に、行き先信号生成回路 2 3 1は 4 1 c、行き先信号生成回路 2 3 2は 4 1 e、行き先信号生成回路 2 3 3は 4 1 g、がどの命令フィ一ルドに相当するかを、さらに、 S I M Dモード時の複写先フィ一ルドを解析した上で、各々 4 1 c、 4 1 e、 4 1 gのフィールド情報の行き先フィールド番号を各デュアルセレクタに対して指定する。

これら行き先信号生成回路 2 3 0〜 2 3 3の出力信号で出力する行き先がフィ一ルド 0であるものは選択情報線 2 0 6へ出力される。同様に、これら行き先信号生成回路 2 3 0 - 2 3 3の出力信号で出力する行き先が、フィールド 2であるものは選択情報線 2 0 7へ、フィールド 4であるものは選択情報線 2 0 8へ、フィールド 6であるものは選択情報線 2 0 9へ、出力される。これらの選択情報を使って、第 1 9図におけるデユアルセレクタ 2 0 2〜 2 0 5が圧縮フィールドバス 4 1の情報から各フィールド情報を選択することができる。

以上が、第 2の実施例である。この実施例の特徴は、第 1の実施例のようにヘッダ情報を用いることなく、 S I M Dモードを実現している点である。これによる利点は、最大命令長が 3 2バイ卜のため、次に実行する命令が必ずィンストラクシヨンバッファ 4 0 ( 3 2バイ卜）内に揃つていることが保証されるので、 1命令を揃えるために 1サイクル余分に必要とするケースがなくなり、パイプラインの制御が容易になることである。第 1の実施例において上記余分な 1サイクルを不要にするためには、 6 4バイトのバッファを用意する必要がある。しかし、本実施例では、これを必要とせず、ハードウェア量が少なくて済むという特徴があ O

次に、第 3の実施例について、第 2 3図を用いて説明する。同図において、第 1 7図と同一機能有する回路ブロック及び同一信号線には同一符号を付して有る。

図中、 2 4 0は各演算ユニットに共通のレジスタファイル、 2 4 1は本実施令特有の命令伸張回路である。本実施例は、レジスタファイル 2 4 0が各演算ュニット共通な構成となっている点が特徵である。この場合、命令フォーマットにおいて、レジスタを指定する方法が異なる。本実施例の具体的な命令フォーマツトを第 2 4図に示す。同図は、基本的には、第 1 8図と同様であるが、以下の点で異なっている。デスティ一シヨンとしてバンク指定が不要になるため、 I F Gフィールドのビット 9〜 1 1は、 S I M Dモード時にだけ有効となり、ノ一マルモード時には意味を持たない。同様に、 I N Tフィールドのビット 1 1〜 1 3 も無効となっている。この場合、 S I M Dモード時に問題が発生する。つまり、各フィールドが指定するレジスタ番号が物理的に同じレジスタを示すため、レジスタリソースの競合が発生する。このため、 S I M D モードによって複写されたフィールドのレジスタ番号を調整して、競合発生を避ける必要がある。これは、命令伸張回路 2 4 1によって行われる。第 2 5図は命令伸張回路 2 4 1の詳細プロック図である。同図において、第 2 3図及び第 1 9図と同一機能を有する回路ブロック及び同一信号線には同一符号を付して有る。

図中、 2 5 0〜 2 5 3は、レジスタアジヤス夕である。レジスタアジヤスタ 2 5 0は、入力したフィールドのビッ卜 2 7をチェックする。もしノーマルモードならば、そのフィールド内のレジスタ番号の変更は行わない。逆に、 S I M Dモードならば、ビット 2 8と 2 9のアドレスをチェックする。その結果、アドレスがフィールド 0ならば複写元フィーゾレドであると判断できるので、レジスタ番号の変更を行わない。逆に、これ以外のフィールドならば、複写先のフィールドであると判断してレジス夕番号（ビット 1 2〜： 1 6、 1 7〜 2 1、 2 2〜 2 6 ) を更新する。具体的に、フィールド 3ならばオフセッ卜値 1、フィールド 2ならばォフセット値 2、フィールド 1ならばオフセッ卜値 3を各レジスタ番号に加える。

同様に、レジスタアジヤス夕 2 5 1 も動作する。レジスタアジヤスタ 2 δ 1は、入力したフィールドのビッ卜 2 7をチェックする。もしノーマルモードらば、そのフィールド内のレジスタ番号の変更は行わない。逆に、 S I M Dモードならば、ビット 2 8と 2 9のアドレスをチェックする。その結果、アドレスがフィールド 1ならば複写元フィールドであると判断できるので、レジスタ番号の変更を行わない。逆に、これ以外のフィールドならば、複写先のフィールドであると判断してレジスタ番号（ビット 1 2〜： 1 6、 1 7〜 2 1、 2 2〜 2 6 ) を更新する。具体的に、フィールド 0ならばォフセッ卜値 1、フィールド 3ならばオフセット値 2、フィ一ルド 2ならばオフセット値 3を各レジスタ番号に加える。以下、レジスタアジヤスタ 2 5 2と 2 5 3も同様に動作する。このようなレジス夕アジヤスタ 2 δ 0〜 2 5 3は、上記した動作を簡単な組み合わせ回路で実現できる。

組み合わせ回路を実現するための真理値表を第 26図に示す。同図において、入力フィールドの Sモードはビット 27、アドレスはビッ卜 2 8と 2 9、レジスタ #はビット 1 2〜 1 6、 1 7〜2 1、 22~26の各入力値（0~3 1 ) を示している。出力フィールドのレジスタ #は、ビット 1 2〜： 1 6、 1 7〜2 1、 22 ~ 26の各出力値を示している。とくに、出力レジスタ #が 3 1を越えた場合は、 32を引いた値とする ₍ このように、レジスタフアイルが複数の演算器で共通に使用される構成のプロセッサにも本発明は、適用可能である。

なお、上記第 1、 2、 3の実施例での命令フォーマットは一例であつて、これに限るものではない。

また、第 1、 2、 3の実施例共に、静的なスケジューリングを前提にする VL I Wプロセッサに適用したものであるが、本発明は、このァーキテクチャに限定するものではない。例えば、動的にスケジューリングを行うスーパースカラ型プロセッサにも、本発明は適用できる。スーパースカラ型プロセッサの 1命令は、基本的に前述の実施例で言うところの 1フィールドの固定長で構成されている。このようなプロセッサは、複数の演算ュニッ卜と命令キューを内蔵しており、キューの中に存在する複数命令の依存関係を調べて、その結果、依存関係がなく、実行可能な複数の命令が存在すると、それらの命令を同時に複数の演算ュニットへ転送するディスパッチャを備えている。したがって、本発明の第 2図で示したように、 "Sモード" と "S I MD" によって S I MDモードが命令フォーマツ卜中で指定されていると、上記ディスパッチュニッ卜がその命令を複数の演算ュニッ卜へ転送することで、スーパースカラ型プロセッサの S I MDモードが容易に実現できる。

具体的な全体ブロック図は、第 27図に示す。同図において、第 23 図と同一機能を有する回路プロック及び同一信号線には同一符号を付して有る。図中、 2 6 0はスーパースカラ型アーキテクチャに対応した命令伸張回路である。

また、この実施例における命令フォーマツ卜を第 2 8図に示す。同図に示すとおり、 I F G及び I N Tフィールドが各々 1命令である。したがって、命令がどちらのフォーマツトであるかを知る必要があるため、ビット 3 1力、' 0の時に I F Gフォーマツ卜、 1 の時に I N Tフォーマツ卜であることを示す。このビッ卜以外は、第 2 4図と同様である。ただし、 I N T命令フォーマツ卜の "デスティネーション" 、 "ソース ◦ " 、 "ソース 1 " 及びスペアプロックは、そのビッ卜位置が異なっている。したがって、命令伸張回路 2 6 0カ、同時に実行可能な複数の命令を抽出して、各演算ュニッ卜へ投入することになる。

命令伸張回路 2 6 0の詳細構成を第 2 9図に示す。同図において、第 2 7図及び第 2 5図と同一機能を有する回路ブロック及び同一信号線には、同一符号を付してある。

図中、 2 7 0は命令のスケジユーリングを行い各演算器への命令投入を制御するディスパッチャ、 2 7 1は命令キューである。同図において命令キュー 2 7 1は、最大 8命令を格納することができる。これらの命令は、圧縮フィールドバス 4 1 a 〜 4 1 hを通して、ディスパッチヤ 2 7 0力 ^ 全て知ることができる。

ディスパッチヤ 2 7 0は、各命令フィールドの内容を解析して、プロセッサの内部資源の依存性を調べる。その結果、相互に非依存な複数の命令を決定して、それらの命令を然るべき演算ュニットへ投入するための情報を、デュアルセレクタ 2 0 2 〜 2 0 5へ転送する。一方、ライトィネーブルバス 4 3は、命令キュー 2 7 1内のどの命令が実行されたかを命令キュー 2 7 1へ知らせると共に、ァドレスバス 3を介して、次に命令キュー 2 7 1が保持する命令コードが存在するァドレス情報をァドレスバス 3へ出力する。例えば、 4 1 a〜4 1 cの 3命令が実行されると、命令キュー 2 7 1は、 4 1 c！〜 4 1 hの 5命令を 4 1 a〜 4 1 eの位置へ転送すると同時に、 4 1 f 〜4 1 hヘアドレスパ'ス 3の情報にしたがって転送されてくる 3つの命令をラツチする。

このような構成のスーパ一スカラ型プロセッサにおいて、ディスパッチヤ 2 7 0が " S I MD" を解析して、 1命令を複数の演算ュニッ卜へ投入することは、第 1 9図のフィールドコントローラ 2 0 1の構成を参考すれば、容易に実現可能である。

このようなスーパースカラ型プロセッサは、動的なスケジューリングを行うものの、実際には、並列性を引き出すために、コンパイラが命令の並び替え（例えば、ループ展開）を行っている。これにより、ォブジェクトコ一ドサイズが大きくなるため、 1命令で複数命令の実行が可能になる本発明は、スーパースカラ型プロセッサのコードサイズ削減にも有効である。

また、本発明において、第 1図に示した実施例では、演算ュニット 2 2 - 2 5の演算ュニッ卜は、全く同一の機能を有することを前提にしてあるが、本発明は、これに限ったわけではない。例えば、 S I MDモードで動作可能な命令を限定する場合もある。具体的には、各演算ュニッ卜 2 2〜 2 5力、マルチメディァに有効な演算の命令セッ卜だけを S I MDモードに対応し、分岐命令などに対応していない場合には、各演算ュニッ卜 2 2〜 2 5が必ずしも全く同一である必要はない。この場合の利点は、演算ュニッ卜がサポー卜するオペレ一ション数を多くとれることである。

例えば、第 2図に示した I F Gフィールドにおいては、 8 ビットの

"ォペコード" と 1 ビットの " Sモード" により、 2 5 6種類の命令に対応可能であり、各命令全てに対して S I M Dモードを指定できる仕様となっている。ここで、 S I M Dモードで動作可能な命令を 1 2 8種類に絞ると、演算ュニット 2 2〜 2 5は最大 3 8 4種類の命令をサポー卜できる。つまり、 8 ビットの "オペコード" で指定する半分の 1 2 8種類の命令が S I M Dモードを指定しないので、 " Sモード" の 1 ビットを "ォペコード " の一部として使用可能になり、結果として、 S I M D モードに対応しない命令は 2 δ 6種類をサポ一トできることになる。

さらに、本発明は、 S I M Dモ一ドを使用するため、第 1図における演算ュニット 2 2〜 2 5が同一機能を有している。この構成は、 S I Μ Dモ一ドに使用する以外にも次のような効果もある。

第一に、プロセッサの開発工数削減効果である。つまり、演算ュニッ卜 2 2の回路をコピーすることで、演算ュニット 2 3〜 2 5の回路を開発できる。つまり、回路規模に対する開発工数が通常の 2 5 %で済むことになる。

第二に、各演算ュニッ卜の稼動率を向上できる効果である。各演算ュニッ卜内の I F G演算器が、数値演算命令とマルチメディァ処理命令など複数用途に対応できる構成とすることがポイントである。このような構成により、数値演算が必要なアプリケ一ションに対しては 4つの演算ユニット 2 2〜 2 5の各 I F G演算器が数値演算命令を実行し、マルチメディア処理が必要なアプリケ一ションに対しては 4つの演算ュニットの各 I F G演算器がマルチメディァ処理命令を実行することで、 I F G 演算器の能力を多様なアプリケーションに対してフルに発揮できる。

ここで、ポイントとなる I F G演算器の構成例について説明する。数値演算で使用する 3 2 X 3 2 ビッ卜の乗算命令と、マルチメディアに使用する 1 2 8 ビットデータを、 8 X 8 ビットの演算を同時に 1 6個実行して行う分割乗算命令とを実行できる I F G演算器の構成方法について述べる。通常 3 2 x 3 2 ビッ卜の乗算の結果は、データを 4つの 8ビッ卜に分割して、 1 6個の 8 X 8 ビッ卜の乗算に分割して、各乗算結果の総和を求めることで得られる。従って、 1 6個の 8 ビッ卜乗算器が必要になる。この点に着目すると、マルチメディア処理で多用される 8ビッ卜の乗算を 1 6演算同時に実行することができる。よって、ほとんどの回路部分を共通にしながら、多様なアプリケーションに対応できる I F G演算器を実現できる。この詳細な I F G演算器構成を第 3 0図を用いて以下に説明する。

第 3 0図において、第 1図と同一機能を有する回路ブロック及び同一信号名には同一符号を付してある。

図中、 3 0 0と 3 0 1はマルチメディァに使用する分割乗算命令のォペランドを保持する 1 2 8 ビットのレジスタ、 3 0 2は 3 2 ビッ卜の乗算命令用のデータを 8ビッ卜単位に分配するオペランドル一タ、 3 0 3 は 2 5 6 ビットの 2入力セレクタ、 3 0 4は 8 ビット乗算器、 3 0 5は乗算結果の加算を行う加算器である。

先ず、分割乗算命令の動作を説明する。分割乗算命令は、レジスタ 3 0 0に格納された 1 6個の 8 ビッ卜データ（ a 0〜a l 5 ) とレジスタ 3 0 1に格納された 1 6個の 8ビッ卜データ（ b 0〜b l 5 ) に対して、 C a O x b O + a l x b l - a 2 x b 2 + a 3 x b 3 + a 4 x b 4 + a 5 x b 5 + a 6 x b 6 + - - - - + a l 5 x b l 5 ) の計算を行う。このため、先ず、この乗算命令を実行する前に、レジスタ 3 0 0と 3 0 1 にデ一夕をセッ卜する。

この命令が実行されると、セレクタ 3 0 3は、レジスタ 3 0 0と 3 0 1のデータを選択して各乗算器に出力する。乗算器 3 0 4は、 a 0 X b 0の項を計算する。残りの 1 5個の乗算器は、同様に、 a 1 X b 1、 a 2 x b 2、 a 3 x b 3 , · · · ·、 a 1 5 x b 1 5を計算する。各乗算結果は、加算器 3 0 5へ送られる。この命令が実行されていると、加算器 3 0 5は、 1 6個の乗算結果の総和を計算した結果を出力する。

一方、 3 2 ビット X 3 2 ビットの乗算命令は、 4個の 8 ビットデータ ( 3 0〜3 3と 1) 0〜5 3 ) に分割して、次の 1 6個の 8 ビッ卜乗算に分割する。

( c O = a O x b O、 c l = a O x b l、 c 2 = a 0 x b 2、

c 3 = a 0 x b 3、 c 4 = a l x b 0、 c 5 = a l x b l、

c 6 = a l x b 2、 c 7 = a l x b 3、 c 8 = a 2 x b 0、

c 9 = a 2 x b l、 c l 0 = a 2 x b 2、 c l l = a 2 x b 3、 c l 2 = a 3 x b 0、 c l 3 = a 3 x b l、 c l 4 = a 3 x b 2、 c l 5 = a 3 x b 3 )

このような 1 6個の 8 ビッ卜乗算ができるように、オペランドル一夕 3 0 2は、各乗算器に供給するオペランドデータを出力する。

乗算命令の実行時には、セレクタ 3 0 3力く、オペランドルータ 3 0 2 の出力を選択して各 8 ビット乗算器へ出力する。さらに、乗算結果は、加算器 3 0 5へ送られる。加算器 3 0 5は上記 1 6個の乗算結果を以下のように、計算する。

( c 0 + C c 1 + c 4 ) X 1 6 + ( c 2 + c 5 + c 8 ) x 1 6² + C c 3 + c 6 + c 9 + c l 2 ) x 1 6³ +

( c 7 + c l 0 + c l 3 ) x l 6⁴ +

( c 1 1 + c 1 4 ) x 1 6⁵ + c 1 δ x 1 6⁶ )

この計算結果が 3 2 ビット x 3 2 ビッ卜の乗算結果として出力される。以上述べたように、回路の大半を占める 1 6個の 8 ビッ卜乗算器を、通常の乗算命令と分割乗算命令で兼用できる。このように構成した演算器で構成した演算ュニッ卜を複数並べることで、各種アプリケーションに対応可能になり、各演算ュニッ卜の稼動率を高めた V L I W型プロセッサを実現可能になる産業上の利用可能性

以上述べたように、本発明によれば、マルチメディア処理など同一種類の演算を繰り返し実行するような並列プロセッサの命令コード量の削減に有効である。また、本発明は、同一機能の演算ュニッ卜を複数並べた構成となっているため、演算ュニッ卜の設計工数を削減できることに加えて、並列度向上に対しても演算ュニッ卜の数を増加するだけで簡単にハードウエアを実現できる効果がある。

さらに、画像処理のようなマルチメディア処理を考慮すると、処理する面像の領域を複数に分割し、各領域の処理を各実行ュニッ卜に割り当てるようなプログラム構造にすることができる。したがって、一つの実行ュニッ卜のプログラムを開発し、それを他 3つの実行ュニッ卜にも流用することでソフトウエアの開発工数を削減できる効果もある。

さらに、本発明は、 V L I Wやスーパースカラなど多用なァーキテクチヤのプロセッサに適用可能である。

Claims

請求の範囲

1 .

命令コードを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コ— ド保持手段に保持した複数の命令コードにしたがって並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、

上記メモリに格納された命令コード中に、複数の演算ュニッ卜における演算の実行を指示する指定情報を有し、該指定情報を解析して命令コ一ドが指定する複数の演算ュニットを決定して上記命令コードを指定された複数の演算ユニットへ投入する解析手段を設け、単一命令コードで上記複数の演算ュニッ卜における複数の演算を制御可能に構成したことを特徵とするプロセッサ。

2 .

命令コードを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持した複数の命令コードにしたがって並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、

上記メモリに格納された命令コ一ド中に、複数の演算ュニットにおける演算の実行を指示する指定情報を有し、該指定情報を解析して命令コ一ドが指定する複数の演算器を決定して上記命令コードを指定された複数の演算ュニッ卜へ投入する解析手段を設け、上記複数の演算ュニッ卜において単一命令コードで複数命令に相当する演算を上記複数の演算ュニッ卜において実行するように構成したことを特徴とするプロセッサ。

3 命令コードを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持した複数の命令コードにしたがって並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、

上記メモリに格納された命令コード中に、演算種類を示すォペコードと、オペランドに加えて、指定情報として実行モードを指定するフィ一ルドを有し、該フィールドを解析して上記実行モ一ドが有効となっている命令の少なくともォペコードとオペランドとを複数の演算ュニッ卜へ投入する解析手段を設け、同一種類の演算を上記複数の演算ュニッ卜において実行可能に構成したことを特徴とするプロセッサ。

4

命令コードを格納するメモリと、該メモリから読みだした複数の命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持した複数の命令コードに従って並列に演算動作可能な複数の演算ュニッ卜とを有するプロセッサであって、

上記メモリに格納された命令コード中に、演算種類を示すォペコードと、オペランドに加えて、指定情報として実行モードを指定するフィ一ルドと演算ュニットを指定する演算ュニッ卜指定フィールドとを有し、該フィールドを解析して上記実行モードが有効となっている命令の少なくともオペコードとオペランドとを、演算ュニット指定フィ一ルドで指定された演算ュニッ卜へ投入する解析手段を設け、上記複数の演算ュニッ卜において上記指定した数同一種類の演算を実行可能に構成したことを特徴とするプロセッサ。

0 . 上記各演算ュニッ卜が固有のレジスタファイルを有することを特徴とする請求の範囲第 3項又は 4記載のプロセッサ。

6 .

上記各演算ュニッ卜が固有のレジスタフアイルを有し、オペランドフィールドが各演算ュニット固有のレジスタフアイルの中のレジス夕指定することにより、演算データが各演算ュニッ卜で異なることを特徴とする請求の範囲第 3項又は 4記載のプロセッサ。 7 .

上記各演算ュニッ卜が共通のレジスタフアイルを有することを特徴とする請求の範囲第 3項又は 4記載のプロセッサ。

8 .

上記各演算ュニッ卜が共通のレジスタファイルを有し、該レジスタフアイルの中からレジス夕番号を指定するオペランドフィールドを有し、該オペランドフィールドの値に、措定する演算ュニッ卜に固有のオフセット値を加えることで、各演算ュニッ卜が異なるレジスタを使用可能にして、異なる演算データで演算可能に構成したことを特徴とする請求の範囲第 3項又は 4記載のプロセッサ。

9 .

叩令コードを格納するメモリと、該メモリから読みだした命令コードを保持する命令コード保持手段と、複数の演算ュニットとを有するプロセッサであって、

上記命令コ一ドは上記演算ュニット数に対応する複数フィ一ルドから構成し、この命令コード中の任意の一つのフィールドにおいて、複数の演算ュニットを制御することを示す制御情報と各フィ τ "ルドが対応する演算ュニットを指定するフィールド情報とを有し、該フィールド情報と上記制御情報を解析して上記フィールドが制御する演算ュニッ卜を特定し、この特定された演算ユニットに対して上記フィールドを投入する解析手段を設け、上記命令コード中の一つのフィ一ルドが複数の演算ュニッ卜を制御して上記演算数よりも少ないフィールド数で構成した短い命令コードで複数演算が実行可能に構成したことを特徴とするプロセッサ _c 1 0 .

命合コードを格納するメモリと、該メモリから読みだした命令コードを保持する命令コ一ド保持手段と、複数の演算ュニットとを有するプロセッサであって、

上記命令コードは演算ュニット数に対応する複数フィールドから構成し、この命令コード中の任意の一つのフィールドが複数の演算ユニットを制御することを示す制御情報と上記命令コード中に存在するフィールド数を示すヘッダ情報とを上記メモリに格納しておき、上記ヘッダ情報と上記制御情報を解析して上記フィールドが制御する演算ュニットを特定し、この特定された演算ュニッ卜に対して上記フィールドを投入する解析手段を設け、命令コード中の一つのフィールドが複数の演算ュニッ卜を制御して上記へッダ情報を用いて少ないフィールド数で構成した短い命令コードで複数演算が実行可能に構成したことを特徴とするプロセッサ。 1 1 .

令コードを格納するメモリと、該メモリから読みだした命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持された情報で制御される少なくとも一つの演算器及び該演算器のオペランド情報を格納するレジスタファイルで構成された複数の演算ュニッ卜とを備えたプロセッサであって、

上記命令コードは演算ュニット数に対応する複数フィールドから構成してこの一つの命令コ一ドで複数の演算ュニットを操作可能に構成し、上記全ての演算ュニット内に、同一機能を有する演算器を少なくとも一つ設けることで、全ての各演算ュニットが同一の演算を実行可能に構成したことを特徴とするプロセッサ。

1 2 .

命令コードを格納するメモリと、該メモリから読みだした命合コードを保持する命令コ一ド保持手段と、該命令コード保持手段に保持した情報で制御される少なくとも一つの演算器及び該演算器のオペランド情報を格納するレジスタファイルで構成した複数の演算ュニッ卜とを備えたプロセッサであって、

上記命令コ一ドは演算ュニッ卜数に対応する複数フィールドから構成し、上記全ての演算ュニット内に、同一機能を有する演算器を少なくとも一つ設け、更に上記各演算ュニット内に上記レジスタファイル内のレジス夕で指定不可能なビット幅の広いデータタイプを保持するための特殊レジスタを設け、上記レジスタファイル内のレジスタで指定可能なビット幅のデータタイプと上記特殊レジス夕に格納したデータタイプの両方の演算処理を可能に構成したことを特徴とするプロセッサ。

1 3 .

複数の演算ュニッ卜の実行を指示する指定情報を有する命令コードを格納するメモリと、該メモリに格納された命令コード中に有する指定情報を解析して命令コードが指定する複数の演算ュニットを決定する解析手段と、該解析手段で決定された複数の演算ュニットを指定する命令コ一ドを保持する命令コード保持手段と、該命令コード保持手段に保持された命令コードに従って、各々が並列に演算を実行する複数の演算ュニッ卜とを備えたことを特徵とするプロセッサ。

1 4 .

複数の演算ュニッ卜の実行を指示する指定情報を有する命令コ— ドを格納するメモリと、該メモリに格納された命令コード中に有する指定情報を解析して単一命令コードで複数命令に相当する演算を実行するように上記単一命令コードが指定する複数の演算ュニッ卜を決定する解析手段と、該解析手段で決定された複数の演算ュニットを指定する単一命令コードを保持する命令コード保持手段と、該命令コード保持手段に保持された単一命令コードに従って、各々が並列に演算を実行する複数の演算ュニッ卜とを備えたことを特徵とするプロセッサ。

1 0 .

上記複数の演算ュニッ卜の各々は、異なる種類の演算を実行するように構成したことを特徴とする請求の範囲第 1 3項又は 1 4記載のプロセッサ。

1 6 .

演算種類を示すォペコードと、オペランドに加えて、指定情報として実行モードを指定するフィールドを有する命令コードを格納するメモリと、該メモリから読みだした命令コード中のフィールドを解析して上記実行モードが有効となっている命令の少なくともオペコードとオペランドとを複数の演算ュニッ卜へ投入する解析手段と、該解析手段で投入された複数の演算ュニッ卜への実行モードが有効となっている命令の少なくともオペコードとオペランドとを保持する命令コード保持手段と、該命令コード保持手段に保持された少なくともオペコードとオペランドとに従って同一種類の演算を並列に実行する複数の演算ュニットとを備えたことを特徴とするプロセッサ。

1 7 .

演算種類を示すォペコードと、オペランドに加えて、指定情報として実行モードを指定するフィ一ルドと演算ュニットを指定する演算ュニッ卜指定フィールドとを有する命令コードを格納するメモリと、該メモリから読みだしたフィールドを解析して上記実行モードが有効となっている命令の少なくともォペコードとオペランドとを、演算ュニッ卜指定フィールドで指定された演算ュニッ卜へ投入する解析手段と、該解析手段で投入された演算ュニッ卜指定フィールドで指定された演算ュニッ卜への実行モードが有効となっている命令の少なくともォペコードとオペランドとを保持する命令コード保持手段と、該命令コード保持手段に保持された少なくともォペコードとオペランドとに従って上記指定された数同一種類の演算を並列に実行可能に構成した複数の演算ュニッ卜とを備えたことを特徴とするプロセッサ。

1 8 .

上記各演算ュニットが固有のレジスタフアイルを有することを特徴とする請求の範囲第 1 6項又は 1 7記載のプロセッサ。

1 9 .

上記各演算ュニッ卜が固有のレジスタファイルを有し、オペランドフィールドが各演算ュニッ卜固有のレジスタフアイルの中のレジスタ指定することにより、演算データが各演算ュニッ卜で異なることを特徵とする請求の範囲第 1 6項又は 1 7記載のプロセッサ。

2 0 .

上記各演算ュニットが共通のレジスタファイルを有することを特徴とする請求の範囲第 1 6項又は 1 7記載のプロセッサ。

2 1 .

上記各演算ュニッ卜が共通のレジスタファイルを有し、該レジスタフアイルの中からレジスタ番号を指定するオペランドフィ一ルドを有し、該オペランドフィールドの値に、指定する演算ュニッ卜に固有のオフセット値を加えることで、各演算ュニッ卜が異なるレジスタを使用可能にして、異なる演算データで演算可能に構成したことを特徵とする請求の範囲第 1 6項又は 1 7記載のプロセッサ。

2 2 .

演算ユニット数に対応する複数フィールドから構成され、この中の任意の一つのフィールドにおいて、複数の演算ュニッ卜を制御することを示す制御情報と各フィールドが対応する演算ュニットを指定するフィ一ノレド情報とを有する命合コードを格納するメモリと、該メモリから読みだした命令コードのフィールド情報と上記制御情報を解析して上記フィ —ルドが制御する演算ュニッ卜を特定し、この特定された演算ュニッ卜に対して上記フィ一ルドを投入する解析手段と、該解析手段で上記フィールドを保持する命令コード保持手段と、該命令コード保持手段に保持されたフィールドに従って並列演算を実行する複数の演算ュニッ卜とを備え、上記命令コード中の一つのフィールドが上記複数の演算ュニットを制御して上記演算数よりも少ないフィールド数で構成した短い命令コ一ドで複数演算が実行可能に構成したことを特徴とするプロセッサ。

2 3 .

演算ュニット数に対応する複数フィールドから構成され、この中の任意の一つのフィールドが複数の演算ュニットを制御することを示す制御情報を有する命令コードと該命令コード中に存在するフィールド数を示すヘッダ情報とを格納するメモリと、該メモリから読みだした上記へッダ情報と上記制御情報を解析して上記フィールドが制御する演算ュニッ卜を特定し、この特定された演算ュニットに対して上記フィールドを投入する解析手段と、該解析手段で投入されたフィ一ルドを保持する命令コード保持手段と、該命令コード保持手段に保持されたフィールドに従つて並列演算を実行する複数の演算ュニットとを備え、上記命令コード中の一つのフィールドが上記複数の演算ュニットを制御して上記へッダ情報を用いて少ないフィ一ルド数で構成した短い命合コードで複数演算が実行可能に構成したことを特徴とするプロセッサ。

2 4 .

上記解析手段には、上記メモリから圧縮された命令コードを読みだして直接実行可能な伸帳命令コードに変換する命令伸帳手段を有することを特徴とする請求の範囲第 1 6項又は 1 7又は 2 2又は 2 3記載のプロセッサ。

2 5 .

上記解析手段には、上記メモリから圧縮された 1命令コード中の少なくとも一つのフィールドを読みだして直接実行可能な複数のフィールドからなる伸帳命令コードに変換する命令伸帳手段を有することを特徴とする請求の範囲第 1 6項又は 1 7又は 2 2又は 2 3記載のプロセッサ。

2 6 .

上記解析手段には、上記メモリから圧縮された命令コードをラツチするインストラクションバッファと、上記命令コード中に存在するフィ一ルド数を示すヘッダ情報を解析するフィールドコン卜ローラと、該フィールドコン卜ローラから解析されたフィールドの選択信号及びフィールドの有無を示す信号に基づいて各フィールドの有無を含めて並び替えて伸帳フィールドを形成する各フィ一ルドに対応したセレクタとを備えたことを特徴とする請求の範囲第 1 6項又は 1 7又は 2 2又は 2 3記載のプロセッサ。

2 7 .

上記解析手段には、上記命令コードの各フィールドの実行モード（ S モード）と S I M Dとを解析して各フィールドの複写元フィールドを選択して決定する S I M Dコントローラと、該 S I M Dコントローラで選択して決定された複写元フィールドを複写して各演算ュニッ卜に対して投入するセレクタとを備えたことを特徴とする請求の範囲第 1 6項又は 1 7又は 2 2又は 2 3記載のプロセッサ。 2 8 .

演算ュニット数に対応する複数フィールドから構成してこの一つで複数の演算ュニッ卜を操作可能に構成した命令コードを格納するメモリを備え、該メモリから読みだした命令コードを保持する命令コード保持手段を備え、該命令コード保持手段に保持された情報で制御される少なくとも一つの同一機能を有する演算器及び該演算器のオペランド情報を格納するレジスタファイルで構成された演算ュニットを複数備え、これら複数の演算ュニッ卜が同一の演算を実行可能に構成したことを特徵とするプロセッサ。

2 9 .

演算ュニット数に対応する複数フィールドから構成された命令コードを格納するメモリを備え、該メモリから読みだした命令コードを保持する命令コード保持手段を備え、該命令コード保持手段に保持した情報で制御される少なくとも一つの同一機能を有する演算器及び該演算器のォペランド情報を格納するレジスタファイル及び該レジスタファイル内のレジスタで指定不可能なビット幅の広いデータタイプを保持するための特殊レジス夕で構成した演算ュニッ卜を複数備え、これら複数の演算ュニットにおいて上記レジスタファイル内のレジス夕で指定可能なビット幅のデータタイプと上記特殊レジスタに格納したデータタイプの両方の演算処理を可能に構成したことを特徴とするプロセッサ。

3 0 .

命令コード及びデータを格納するメモリと、上記メモリから読みだした複数の命令コードを保持する命令コード保持手段と、上記命令コード保持手段に保持した複数の命令コードにしたがって並列に動作可能な複数の演算ュニッ卜を有するプロセッサであって、

複数の演算器と複数アクセスポートレジスタファイルで演算ュニッ卜を構成し、上記各演算器が対応するアクセスポー卜から上記レジスタフアイルの内容を読み出して演算可能で、かつ、上記複数の演算ュニットが同一機能であることを特徴とするプロセッサ。 3

命令コード及びデータを格納するメモリと、上記メモリから読みだした複数の命令コードを保持する命令コード保持手段と、上記命令コード保持手段に保持した複数の命令コードにしたがって並列に動作可能な複数の演算ュニットを有するプロセッサであって、

複数の演算器と複数アクセスポートレジスタファイルで演算ュニットを構成し、上記各演算器が対応するアクセスポー卜から上記レジスタフアイルの内容を読み出して演算可能で、かつ、上記複数の演算ュニッ卜が同一機能のサブセットを有することを特徴とするプロセッサ。 3 2 .

前記演算ュニット内の少なくとも一つの演算器が、上記メモリと上記レジスタファイル間のデータ転送を行うデータ転送命令を実行可能であることを特徴とする請求の範囲第 3 0項又は 3 1記載のプロセッサ。