WO2004023291A1

WO2004023291A1 - 情報処理装置

Info

Publication number: WO2004023291A1
Application number: PCT/JP2002/008801
Authority: WO
Inventors: Shigezumi Matsui
Original assignee: Renesas Technology Corp.
Priority date: 2002-08-30
Filing date: 2002-08-30
Publication date: 2004-03-18
Also published as: JPWO2004023291A1

Description

技術分野

本発明は、情報処理装置に関し、特に複数系統の命令実行パイプラインを有するス一パースカラパイプライン構成のマイクロプロセッサに適用して有効な技術に関する。

明 "景技 fe 田

本発明者が検討したところによれば、情報処理装置については、以下のような技術が考えられる。図 1 4および図 1 5により、本発明者が本発明の前提として検討した情報処理装置の一例を説明する。

図 1 4は、本発明者が本発明の前提として検討したマイクロプロセッザの構成の一例を示す。

マイクロプロセッサは、命令フヱツチ要求.命令デコード '演算処理 · 汎用レジスタなどによるデータ保持などを行う CP U 1 0、 DM A転送処理を行う DM A3 トロ一ラ 1 3、命令コードやデータを格納するための RAMなどで構成される内蔵メモリ 1 2、 CP U 1 0や DMAコントローラ 1 3のデータ転送を行う内部バス 1 1、内部バス 1 1からの外部メモリアクセス要求に応じて外部メモリ制御を行う外部バスコントローラ 1 4、外部バスコントロ一ラ 1 4に制御され外部メモリに信号を伝達する外部端子 1 4 1、内部バス 1 1からの周辺モジュールアクセス要求に応じて周辺モジュールバス 1 Ίの制御を行う周辺パスコントローラ 1 6、マイクロプロセヅサ内部に供給する動作クロックを生成するクロック生成回路 1 5、および各種周辺モジュールから構成される。内部バス 1 1には、内蔵メモリ 1 2や外部バスコントロ一ラ 1 4や周辺バスコントローラ 1 6が接続される。

各種周辺モジュールは、一般的に、夕イマ 1 8 0、シリアル通信などを行うシリァルイン夕フエ一ス 1 8 1、ポートなどとして使われるポートインタフェース 182などから成る。

CPU 1 0は、命令フヱツチ要求 ·命令デコードなどを行う命令フエツチユニット 100、演算処理を行う演算器 10 1、データ保持を行うレジスタファイル 102から成る。この CPU 10は、命令ボイン夕で指定されたァドレスから、順次命令をフエツチ ·デコードし、デコード結果に従って、演算処理や、データのレジスタへの格納、レジス夕からメモリなどへのデータの退避などを行う。

DMAコントローラ 13は、転送元ァドレス（以下、ソースアドレスともいう）や転送先アドレス（以下、デスティネーションアドレスともいう）やアドレスラヅプアラウンド用のァドレスを保持するァドレスポインタ 130、転送語数を保持するカウン夕 13 1、 DM A転送時にデ一夕を一時的に保持するデータレジス夕 132を内蔵する。この DMA コントローラ 13は、プロセッサ外部や周辺モジュールからの D M A転送要求に応じて、アドレスポインタ 130で示される転送元ァドレスから転送先アドレスへのデ一夕転送を行う。

図 15は、本発明者が本発明の前提として検討したスーパ一スカラマィクロプロセッサの構成の一例を示す。

スーパ一スカラマイクロプロセッサは、命令フエツチ要求 ·命令デコ ―ド ·演算処理 '汎用レジスタなどによるデータ保持を行う C P U 10 a、命令コ一ドをキヤヅシングする命令キヤヅシュ 19 a、データをキャッシングするデータキヤヅシュ 19 b、命令コ一ドゃデ一夕を格納するための RAMなどで構成される内蔵メモリ 12 a、 DM A転送処理を行う DMAコントローラ 13、 CPU l O aからの命令コードフェッチ要求に対して命令コードを転送する命令転送バス 1 1 a、 C P U 10 a からのデータ転送要求に対してデ一夕を転送するデータ転送バス 1 1 bおよび 1 1 c、 DMAコントローラ 13や命令キヤヅシュ 19 a、デ一夕キャッシュ 1 9 bからのデータ転送要求に対してデータ転送を行う内部バス 1 1 d、内部バス 1 1 dからの外部メモリアクセス要求に応じて外部メモリ制御を行う外部バスコントロ一ラ 14、内部バス 1 1 d からの周辺モジュールアクセス要求に応じて周辺モジュールバスの制御を行う周辺バスコントローラ 1 6などから構成される。なお、周辺モジュールバスや、周辺モジュール、外部端子などは省略してある。

命令転送バス 1 1 aには、命令キヤヅシュ 1 9 aや内蔵メモリ 1 2 a が接続される。データ転送バス 1 1 bおよび 1 1 cには、デ一夕キヤヅシュ 1 9 bや内蔵メモリ 1 2 aが接続される。内部バス 1 1 dには、内蔵メモリ 1 2 aや外部パスコントローラ 1 4や周辺パスコントローラ 1 6が接続される。

C P U 1 0 aは、命令フヱツチ要求 ·命令デコ一ドなどを行う命令フヱツチユニット 1 0 0 a、演算処理を行う演算器 1 0 1 a、デ一夕保持を行うレジス夕ファイル 1◦ 2 aから成る。この C P U 1 O aは、命令ボイン夕で指定されたァドレスから、順次命令をフエツチ ·デコードし、デコードした結果、同時に複数命令が実行できる場合は、該当する複数命令の演算処理や、デ一夕のレジス夕への格納、レジス夕からメモリなどへのデ一夕の退避などを行う。

命令キャッシュ 1 9 aは、外部メモリに格納された、使用頻度の高いアドレスの命令コードのコピーを保持する。また、データキャッシュ 1 9 は、外部メモリに格納された、使用頻度の高いアドレスのデータのコピーを保持し、データの書き換えなどが行われた場合、必要に応じて外部メモリに書き戻す。

内蔵メモリ 1 2 aは、 R A Mなどで構成され、命令コードおよびデ一夕を保持し、必要に応じて内蔵する命令コードおよびデータを読み出す。なお、このようなマイクロプロセッサに関する技術としては、たとえば特開平 4— 6 8 4 5 9号公報に記載される技術などが挙げられる。この公報には、 D M A転送処理と演算処理命令を並列に行うことができるようにしたデジタル信号処理プロセッサが開示されている。しかしながら、本発明のような複数系統の命令実行パイプラインを有するスーパースカラパイプライン構成のマイクロプロセッサに適用する技術ではない。ところで、前記のようなスーパースカラマイクロプロセヅサについて、本発明者が検討した結果、以下のようなことが明らかとなった。

たとえば、前記図 1 5のような命令実行パイプラインを 2系統以上有するスーパースカラパイプライン構成のマイクロプロセッサにおいては、命令の並列度は概ね 1 . 3程度とそれほど高くないため、全ての命令実行パイプラインが常時埋まることはなく、リソースの無駄が生じている。具体的には、 2本のパイプラインで同時に命令実行ができない場合、 1本のパイプラインは休止しているため、リソースの利用効率が低い。一方、ビジネス的には、効率の悪いリソースの使い方は、価格性能比を悪化させるため、プロセッサ上には極力無駄なリソースがなく、常時、適切に動作していることが望ましい。

また、マイクロコントローラと呼ばれる製品群においては、コント口ーラ上に C P Uに加えて、 D M Aコントローラを内蔵し、データ転送能力を強化する例が多い。この D M Aコントローラの処理内容は、一般的な C P Uの処理内容のサブセット的なことが一般的である。この場合、 D M Aコントローラは、専用の別モジュールとして構成されているため、面積効率が低い。さらには、データ転送において、単純な D M A転送だけではなく、転送の際に一種のデ一夕演算処理を行えると、より効率的なマイクロコントローラが構成できる。

これらにより、本発明者は、スーパ一スカラパイプラインプロセッサにおいて、使用頻度の低いパイプラインを、データ演算処理も行える D M A転送用の D M Aコントロ一ラとしても使えれば、専用の D M Aコントローラが不要になることで低価格になり、 C P U処理の性能低下も回避できると考えた。

また、 D M Aコントローラを構成する際、アドレスポインタや転送語数などの情報をチャネル分だけ保持する必要があるが、これを全てレジス夕として保持するとチップ上の占有面積が多くなるため、占有面積に対するデータ保持量の効率がよい R A Mモジュールなどに情報を保持し、必要なものだけを効率のよいキヤッシングァルゴリズムを使って取得することにより、より占有面積を抑えたチップが作成できると考えた。そこで、本発明の第 1の目的は、 C P U処理性能をほとんど低下させずに、 D M Aコントローラのモジュール相当分のゲート論理を不要にして、チップ面積を小さくすることができる情報処理装置を提供することあ o

また、本発明の第 2の目的は、データ演算処理時の C P Uに対する割り込み処理の起動といった余計な切り替えオーバーへッドなどを回避し、高機能なデータ転送処理の処理性能を大幅に向上することができる情報処理装置を提供することにある。

本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。発明の開示

本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。

本発明は、複数系統の命令実行パイプラインを有するスーパースカラパイプライン構成の情報処理装置に適用され、第 1メモリに格納された命令を第 1スーパースカラパイプラインに展開して実行する際に、第 2 スーパースカラパイプラインが命令実行を行えない空きステージ（たとえば空きサイクル、空き時間）が生じた場合に、この空きステージ（空きサイクル、空き時間）を用いて第 2メモリに格納された命令を実行するように切り替える制御手段を有するものである。また、本発明の情報処理装置においては、第 2メモリに格納された命令として、 D M A Cコマンドを実行するようにしたものである。

具体的に、本発明の情報処理装置は、以下のような特徴を有するものである。

( 1 ) スーパ一スカラプロセッサにおいて、一般的には、一連の C P U 命令の並列実行を行うために構成されている複数のパイプラインの一部を、該当する C P U処理が行われていない空きステージに、該当する C P u処理とは別の独立した命令処理を行えるように切り替える制御手段を付加したェンハンストス一パースカラプロセッサ。

( 2 ) スーパースカラプ口セヅサにおいて、一般的には、一連の CPU 命令の並列実行を行うために構成されている複数のパイプラインのー部を、 DMA転送用のプログラマブル DMAコントローラとしても使えるように切り替える制御手段を付加したェンハンストス一パースカラプロセヅサ。

(3) 前記（2) の切り替え制御手段を付加したパイプラインにおいて、 CPU処理と DMA転送処理の切り替えを、 CPU処理優先、 DMA転送処理優先、 DMA転送処理の一部チャネルのみを CPU処理より優先、一定期間毎に優先順位を切り替え、といったモードを持たせたプロセッサ。

(4) 前記（2) の、複数パイプラインの一部は CPU処理と DMA転送処理の切り替えを、いずれか一方に固定的なモードを持たせたプロセヅサ。

(5) DM A転送に必要な、ソ一スアドレス、デスティネーションアドレス、転送語数、アドレスラップアラウンド転送に必要な初期値情報やアドレス範囲情報などを、専用レジス夕ではなく、 RAMなどのメモリに格納し、必要に応じてキヤヅシングレジス夕に情報をキャッシングすることを特徴とする DMA転送機能を有するプロセッサ。

(6) 前記（2)、（3)、（4) のいずれかのプロセヅサにおいて、前記 ( 5 ) の機能を付加したェンハンストス一パースカラプロセッサ。

前記のように、命令実行パイプラインを 2系統以上有するスーパースカラパイプライン構成のマイクロプロセッサにおいては、一般に命令の並列度は常に全ての命令実行パイプラインを埋めるほど高くない。この時々空いてしまうパイプラインを、データ演算処理も行える DMA転送用の DMAコントローラとしても使うことにより、 CPU処理性能の低下を回避しながら、専用の DM Aコントロ一ラが不要になることで低価格になり、さらに、データ転送処理と同時に所望のデータ演算なども行えることにより、余計な CPU処理を起動するためのオーバ一へヅドの大きい割り込み処理なども不要な、デ一夕転送能力の強力なマイクロコントローラを実現することができる。

このとき、 DMA転送の場合の、転送要求に対する応答速度の要求が著しく速くはないことを利用して、 DM A転送用の各種情報を専用レジス夕ではなく、データ保持密度の高い、たとえば RAMなどに置き、必要な情報のみをキャッシングして使うことにより、さらに DMAコントローラとしてのチップ上の占有面積を抑えることができる。図面の簡単な説明

図 1は本発明の一実施の形態の情報処理装置（コンフィグラブルス一パースカラマイクロプロセッサ）を示す構成図、図 2は本実施の形態において、 C P Uレジスタファイルを示す構成図、図 3は DMACレジス夕ファイルを示す構成図、図 4はキャッシング機構付き DMA Cレジス夕ファイルを示す構成図、図 5はパイプラインのステージ構成を示す説明図、図 6は各ステージの処理内容を示す説明図、図 7はパイプライン 1側の C P U命令実行および D M A転送処理の切り替え制御を示すフ口一図、図 8はパイプライン 0およびパイプライン 1の C P U命令実行および D M A転送処理の切り替えを含む処理の流れを示す説明図、図 9 はパイプライン 1の DM A転送処理に関するモード設定を示す説明図、図 10は簡易データ処理を伴う DMA転送処理を示す説明図、図 1 1は簡易データ処理を伴う DM A転送処理を示すフロー図、図 12は DM A 転送時の DMA転送情報のキャッシング動作を示す説明図、図 13はバス構成を適用したコンフィグラブルスーパ一スカラマイクロプロセヅサを示す構成図、図 14は本発明の前提として検討したマイクロプロセッサを示す構成図、図 15は本発明の前提として検討したスーパ一スカラマイクロプロセッサを示す構成図である。発明を実施するための最良の形態以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一機能を有する部材には同一の符号を付し、その繰り返しの説明は省略する。

まず、図 1により、本発明の一実施の形態の情報処理装置の構成の一例を説明する。図 1は本実施の形態の情報処理装置の構成図を示す。本実施の形態の情報処理装置は、たとえばコンフィグラブル（C o n f i gu r a b l e) ス一パースカラマイクロプロセヅサとされ、命令フェッチ要求.'命令デコード ·演算処理 ·汎用レジス夕などによるデー夕保持 . D M A転送要求を受けて DM A転送処理を行う E CPU (ェンハンスト CP U) 1 0 b、命令コードを格納し、 RAMや命令キヤヅシュなどで構成される命令格納メモリ他 1 2 0 a、デ一タを格納し、 RA Mやデータキャッシュなどで構成されるデ一夕メモリ他 1 2 0 cおよび 1 2 0 d、 DMACコマンド群を格納する DMACコマンド格納メモリ 1 2 0 b、 E C P U 1 0 bからの命令コ一ドゃデ一夕転送要求に対して、命令格納メモリ他 1 2 0 aやデータメモリ他 1 20 cや 1 2 0 dとの間で、命令コードゃデ一夕転送を行うスイッチマトリックス（SWM X) 1 1 eなどから構成される。

なお、スィッチマトリックス 1 1 eは、特に限定されているわけではなく、通常のバス構成でも構わない。通常のバス構成にした場合は、たとえば後述する図 1 3に示すような構成となる。また、周辺モジュールバスや、周辺モジュール、外部端子などは省略してある。

スィヅチマトリヅクスモジュール（ S WMX) 1 1 eは、スィヅチマトリックスコント口一ラ 1 l e 1およびデ一夕セレクタとしての機能を有するスィツチマトリックス 1 1 Θ 0から成る。このスィツチマトリヅクスコントローラ 1 1 e 1は、特に限定はされないが、アドレス情報やパイプラインコントロ一ラ 1 00 b 2の制御情報により、どのメモリとの間で命令コードゃデ一夕転送を行うかを制御する。

E C P U 1 0 bは、命令ァドレスを制御する命令ボイン夕 1 00 b 4、 DMA C制御コマンドアドレスを制御する DMA Cポインタ 1 0 O b 5、命令実行パイプライン 1側の C P U処理/ DM A転送処理の切り替え制御などを行うパイプラインコントローラ 100 b 2、パイプラインコントローラ 1 00 b 2の制御を受けて命令/コマンドデコーダ 1 0 0 b 1に送り込む情報を切り替えるセレクタ 100 b 3、パイプライン 0側の命令コードのデコードを行う命令デコーダ 100 b 0、パイプライン 1側の命令コードおよび D M A C制御コマンドのデコードを行う命令/コマンドデコーダ 100 b 1、 DM A要求の情報を保持して順次 DMA転送処理を起動する DMAリクエストキユー 100 b 6、演算処理を行う演算器（ALU 0) l O l b Oおよび（ALU 1) 10 1 b l、 C P Uとしてのデ一夕保持を行う CPUレジスタファイル 102 b 0、 D M A Cとしてのデータ保持を行う DMACレジス夕ファイル 1 02 b l、パイプラインコントローラ 100 b 2の制御を受けて演算器 10 1 b 1に供給するデ一夕を選択するセレクタ 102 b 2から成る。

この ECPU 1 O bは、命令ボイン夕で指定されたァドレスから、順次命令をフェッチ ·デコードし、デコードした結果をもとに同時に複数命令が実行できる場合は、該当する複数命令の演算処理や、データのレジス夕への格納、レジス夕からメモリなどへのデ一夕の退避などを行う。また、 DMA転送要求がある場合は、後述する図 9で示されるようなモードに従って、パイプライン 1側（主な構成要素は、 DMACポインタ 100 b 5、命令ボイン夕 100 b 4の一部、命令/コマンドデコーダ 100 b 1、演算器 101 b l、 CPUレジスタファイル 102 b 0の一部、 DMACレジスタファイル 102 b l、セレクタ 102 b 2) で、必要に応じてデータ演算も行いながら、 DM Aデ一夕転送処理を行う。パイプラインコントローラ 100 b 2は、 DMAリクエストキュー 1 00 b 6からの DM A転送要求、パイプライン 1側の命令 Zコマンドデコーダ 100 b 1のデコード結果などを受けて、主にパイプライン 1側の動作を制御する。また、必要に応じて、スィッチマトリックスコントローラ 1 1 e 1を介してスィツチマトリヅクス 1 1 e 0の制御を行う。

DMACコマンド格納メモリ 120 bは、 RAMなどで構成され、 C P U用の命令コードと同様に順次実行されるような DMA Cコマンドコードを保持し、必要に応じて内蔵する DMA Cコマンドコードを読み出す。

次に、図 2により、本実施の形態において、 E CPUを構成する CP Uレジス夕ファイルの構成の一例を説明する。図 2は CPUレジスタフアイルの構成図を示す。

CPUレジスタファイル 102 b 0は、レジスタ 102 b 00、書き込み用のセレクタ 102 b 0 1、デコーダ 102 b 02、 ANDゲート 102 b 03、読み出し用のセレクタ 102 b 04などから構成される。この例では、書き込みが 2ポート、読み出しが 4ポートであり、これらが同時に動作可能となる。

デコーダ 102 b 02は、パイプライン 0およびパイプライン 1からのレジス夕番号の指示情報 1 02 b 06を受け、レジス夕読み出し用セレク夕 102 b 04の制御および、クロヅク 102 b 05と合わせてレジス夕書き込み信号の生成を行う。また、パイプライン 0およびパイプライン 1からの入力情報制御 102 b 06により、レジス夕への書き込みデ一夕を選択するセレクタ 102 b 0 1の制御を行う。レジス夕への書き込みデ一夕としては、 ALU0や ALU 1といった演算器の出力 1 02 b 08やメモリからの読み出しデータ 102 b 07が選択できる。次に、図 3により、 DMACレジス夕ファイルの構成の一例を説明する。図 3は DMACレジス夕ファイルの構成図を示す。

DMACレジスタファイル 1 02 b 1は、ソースアドレスのレジスタ 1 02 b 1 00、デスティネーションアドレスのレジスタ 1 02 b l 0 1、カウン夕のレジス夕 102 b l 02、書き込み用のセレクタ 102 b 1 1、デコーダ 102 b 1 2、 A N Dゲート 102 b 13、読み出し用のセレクタ 102 b l 4などから構成される。

デコーダ 102 b 12は、パイプライン 1からのレジス夕番号の指示情報 102 b 16を受け、レジスタ読み出し用セレクタ 102 b 14の制御および、クロヅク 102 b 15と合わせてレジス夕書き込み信号の生成を行う。また、パイプライン 1からの入力情報制御 102 b 1 6により、レジス夕への書き込みデータを選択するセレクタ 102 b 1 1の制御を行う。レジスタへの書き込みデータとしては、 ALU 1演算器の出力 1 02 b 1 8やメモリからの読み出しデータ 102 b 17が選択できる。また、ソースアドレスのレジス夕 102 b l 00、デスティネーシヨンアドレスのレジス夕 102 b 10 1、カウン夕のレジス夕 10 2 b 102などの DM A転送に必要なレジス夕については、転送に必要なチャネル数分有している。

次に、図 4により、キャッシング機構付き DMA Cレジスタファイルの構成の一例を説明する。図 4はキャッシング機構付き DMACレジスタフアイルの構成図を示す。

キヤヅシング機構付き D M A Cレジス夕ファイルは、前記 D M A Cレジス夕ファイル 102 b 1の構成に対して、キヤヅシングレジス夕番号格納レジスタ 102 c 1 60、キヤヅシングバリヅド情報格納レジス夕 102 c 1 6 1が付加され、ソースアドレスのレジスタ 102 c 1 00、デスティネーションアドレスのレジス夕 102 c 101、カウン夕のレジス夕 102 c 102などの働きが異なっている。この構成例では、 D M A転送に必要なレジス夕をチャネル数分全て内蔵することはせず、必要な情報はメモリに格納する。

キヤヅシング機構付き DMACレジス夕ファイルには、メモリに格納されている情報のキヤヅシユレジス夕としてコピ一を保持する。キヤヅシングレジスタ番号格納レジスタ 102 c 160に、現在保持している DMA転送用情報のチャネル番号を保持し、キャッシングバリッド情報格納レジス夕 102 c 1 6 1で保持している倩報が V a 1 i dかどうかを制御する。

保持するアドレス情報やカウン夕情報は、特に限定はされないが、ァドレスポインタとして使われるソースアドレス a , b， cといったキヤヅシングソースアドレスポィン夕 1 02 c 1 00やデスティネーションアドレス a , b， cといったキャッシングデスティネーションァドレスポインタ 102 c l 0 1、転送語数カウンタとして使われるカウンタ a , b, cといったキャッシングカウンタレジス夕 102 c 102に格納され、随時更新される。

また、格納しているあるチャネル情報を別のチャネルの情報に入れ替える際は、まず、キャッシングレジス夕のデ一夕をメモリに書き戻して、その後、別のチャネルの情報をメモリから読み込んで設定する。

このキヤヅシングレジス夕の入れ替えァルゴリズムは、後述する図 9 に示すようなモード設定に依存し、一部だけ常駐するモードや、各チヤネルの優先順位が順に入れ替わるラウンドロビンモードおよび、 LRU と呼ばれる使用頻度の低いものを優先的に入れ替えるァルゴリズムなどの組み合わせになる。

続いて、図 5により、本実施の形態において、パイプラインのステ一ジ構成の一例を説明する。併せて、図 6により、各ステージの処理内容の一例を説明する。図 5はパイプラインのステージ構成の説明図、図 6 は各ステージの処理内容の説明図をそれぞれ示す。

本実施の形態のパイプライン制御においては、特にメモリに格納された命令をパイプラインに展開して実行する際に、別のパイプラインが命令実行を行えない空きステージが生じた場合に、この空きステージを用いて別のメモリに格納された命令を実行するように切り替えることが可能となっている。

パイプラィン 0側は、一般的なマイク口プロセッサのパイプラインと同様の 5段ステージ構成となる。すなわち、 CPU命令処理専用となる。また、パイプライン 1側は、一般的なマイクロプロセッサのパイプラインと同様の 5段ステージ構成として動作する場合と、 DMACとして 5 段ステージ構成で動作する場合がある。すなわち、 CPU命令処理/ィンテリジ工ント DMA転送処理兼用となる。

各ステージの処理内容は、図 6に示すように、 I Fが命令フェッチステ一ジ、 I Dが命令デコード &レジス夕読み出しステージ、 EXが演算 ' アドレス計算ステージ、 MAがメモリアクセスステージ、 WBがレジス夕書き込みステージ、 C Rが DMA C制御コマンド読み出しステ一ジ、 CDが DMAC制御コマンドデコ一ド&レジス夕読み出しステージをそれそれ表す。

次に、図 7により、 DMA処理優先モードの場合の、パイプライン 1 側の C P U命令実行および D M A転送処理の切り替え制御のフローの —例を説明する。図 7はパイプライン 1側の CPU命令実行および DM A転送処理の切り替え制御のフ口一図を示す。

まず、 DMA転送要求があるかどうかを判定し（ステップ S l)、要求がある場合（Ye s) は、パイプライン 1側を DMA処理実行モードに設定し（ステップ S 2)、必要に応じてデータ演算なども含めて、設定された転送語数の DM A転送処理を終了するまで繰,り返して実行する（ステップ S 3， S 4)。この後、 ^に制限はされないが、 DM A転送終了時に転送終了を示すフラグの設定などを行い（ステヅプ S 5)、 DMA転送処理を終了する。なお、この設定されたフラグにより、割り込み要求信号を駆動したり、ソフトウェアによるポ一リングで終了を確認したりする。

一方、ステヅプ S 1の判定において、 DMA転送要求がない場合（N o ) は、パイプライン 1側を C P U命令実行モードに設定し（ステップ S 6)、パイプライン 0と同時実行可能かどうかを判定し（ステップ S 7 )、可能な場合（Ye s) は CPU命令を実行して（ステップ S 8 )、パイプライン 0と合わせて通常のスーパースカラマイクロプロセヅサとして動作する。

次に、図 8により、パイプライン 0およびパイプライン 1の CPU命令実行および DM A転送処理の切り替えを含む処理の流れの一例を説明する。併せて、図 9により、パイプライン 1の DM A転送処理に関するモード設定の一例を説明する。図 8はパイプライン 0およびパイプライン 1の C P U命令実行および D M A転送処理の切り替えを含む処理の流れの説明図、図 9はパイプライン 1の DMA転送処理に関するモード設定の説明図をそれぞれ示す。これらのモ一ド設定のための情報は、 01

E CP U 1 0 bに含まれる図示はしない制御レジス夕に設定する、もしくは命令を実行することによってそれぞれのモードを切り替えることが可能になる。

DMA転送要求がない場合は、パイプライン 0とパイプライン 1を合わせて通常のスーパ一スカラマイクロプロセッサとして C P U命令の処理を実行する。このとき、パイプライン 0側とパイプライン 1側で実行する C P U命令によっては、同時に処理を実行できない場合があり、その場合はパイプライン 1側は処理を休止する。

DMA転送要求がある場合は、モード設定にもよるが、パイプライン 1側を DMA処理実行モードに設定し、必要に応じてデ一夕演算なども含めて、設定された転送語数の DMA転送処理を実行し、 DMA転送終了後、通常の CPU命令実行モードに戻す。すなわち、 DM A転送要求があった時点で、パイプライン 1側のレジス夕ファイルを CP Uレジス夕ファイルから DMA Cレジスタフアイルに切り替え、 D MA転送処理が終了したら CP Uレジス夕ファイルに切り替える。

パイプライン 1の DMA処理に関するモード設定は、図 9 (a) に示すように、モード 0が DM A処理禁止、モード 1が DM A処理許可の設定となる。さらに、 DMA処理許可については、図 9 ( b ) に示すように、モード 0が C P U処理優先、モード 1が最優先 D M Aチャネルのみ CP U処理より優先、モード 2が最優先およびその次の DM Aチャネルのみ CP U処理より優先、モード 3がー定時間毎に C P U処理優先と D M A処理優先モ一ドを切り替え、モード 4がー定時間毎に C P U処理優先とモード 1ないし 2を切り替え、モード 5が制御信号により C P U処理優先と DM A処理優先モードを切り替え、モ一ド 6が制御信号により CP U処理優先とモード 1ないし 2を切り替え、モード 7が DM A処理優先の各モードがある。

さらに、 DMAチャネル（ c h.)間の優先順位については、図 9 ( c) に示すように、モード 0がチャネル 0 >チャネル 1 > · · · >チャネル n— 1で固定、モード 1がラウンドロビン、モード 2がチャネル 0のみ 2008801 固定で、チャネル 1以下はラウンドロビン、モード 3がチャネル 0、チャネル 1のみ固定で、チャネル 2以下はラウンドロビンとなる。ラウンドロビンとは、複数チャネルの優先順位が順に変わっていくことを表す。次に、表 1により、 RAMを用いた DMACコマンドメモリの構成の —例を説明する。

RAM上には、 DMA転送に必要な情報の格納領域を確保し、 DMA 転送処理のプログラムを格納する。この例の場合、チャネル 0は単純な DM A転送処理を行い、チャネル 1はデ一夕転送時に付加的なデ一夕処理を同時に行える。 DMA Cコマンドメモリとして、内蔵 RAMを用意すれば、コマンドメモリ兼 DMA情報格納ェリアとして使用可能である。

【表 1】

表 1 dma_sa[0]レジスタ領域 (High)

dma_sa[0]レジスタ領域 (Low)

dma_da[0]レジスタ镇域 (Hi gh)

dma一 da[0]レジスタ領域（Low)

dma_c〖0]レジスタ領域 (Hi gh)

dma_c[0]レジスタ領域 (Low)

channe i O dmaリゾ一スレジスタ読み込み命令（チャネル 0 )

ソースァドレスからデータ読み込み

データカウントレジスタを一 1 &Zeroチェヅク（フラグに反映）デスティネーションァドレスにデータ書き込み

フラグがセヅ卜されていたら、チヤネル 0終了フラグセヅト

DMA転送処理から復帰

リザーブ領域

dma_sa[ 1 ]レジスタ領域 (Hi gh)

dma一 sa [ 1 ]レジスタ領域（ Low)

dma— da[1 ]レジスタ領域 (Hi gh)

dma— da[ 1 ]レジスタ領域（Low)

dma— c[1 ]レジスタ領域 (Hi gh)

dma一 c [ 1 ]レジスタ領域（ Low)

channel 1 dmaリソースレジスタみ読み込み命令（チャネル 1 )

ソースァドレスからデータ読み込み

データカウン卜レジスタを一 1 &Ze「oチエック（フラグに反映) 各種データ処理 (任意にプログラム可能）デステイネ一ションァドレスにデータ書き込み

フラグがセッ卜されていたら、チャネル 1終了フラグセヅ卜 DMA転送処理から復帰

リザーブ領域

dma— sa[2]レジスタ領域 (High)

dma_sa[2]レジスタ領域 (Low)

次に、図 10および図 1 1により、簡易データ処理を伴う DM A転送処理の一例を説明する。図 1 0は簡易データ処理を伴う DMA転送処理の説明図、図 1 1はそのフロ一図をそれぞれ示す。

この例では、入力データの上位ビットの "0"部分を取り除くパツキング処理をしながら、パッキングデータを単位サイズ毎の出力データとして DM A転送処理を行っている。すなわち、 DM A転送要求により起動し、まずパイプライン 1を DMA処理実行モードに設定する（ステヅプ S 1 1 )。そして、ソースァドレスから入力デ一夕を読み込み（ステヅプ S 1 2)、この読み込んだデ一夕の上位ビヅトの "0" を読み飛ばして左詰し（ステップ S 1 3)、この左詰したパヅキングデータを既存データに連結して書き込む（ステップ S 14)。この処理を、転送デー夕が終了するまで繰り返して行い（ステップ S 15)、終了した時点で DM A転送終了フラグをセヅトして終了となる（ステップ S 16)。これにより、従来行われていた、データパッキング処理や、ソフトゥエアによる、 DMA転送終了時に C P Uをオーバーへヅドの大きい割り込み要求などで起動し、不要な "0"部分を取り除く処理を別途行わせるといった余計な処理を行わなくて済み、システム性能の向上が見込まれる。

次に、表 2により、 DMA転送コントローラにキャッシングレジス夕を搭載した場合の D M A転送プログラムの一例を説明する。

この例では、キャッシングレジス夕のヒヅト /ミスの判定と情報の設定を、 I d dma rという命令にて行っている。

【表 2】

表 2 ラベル命令；コメン卜

dmaO： Lddmar #0 ；チャネル #0の DMA情報レジスタをメモリからダウンロードして、 Cadheレジスタに書き込み。既にダウンロードされていた場合は、 NOP相当。また、 Cacheレジスタが一杯の場合は、一番古いデータをメモリに待避してから、ロードする。 dmaOLlimov @dma sa[0]+,dma dt[0] ；ソースレジスタ (dma_sa[0])が示すアドレス力、らデータをリードして (アドレスオートインクリメント)、データレジスタ

(dma_dt[0】)に格納。 ·

mov @dma dt[0] ,dma da[0] + ；デ一タレジスタ (dma— dt[0])のデータを、デスティネーションレジスタ (dma_da[0])が示すアドレスにライト (アドレスォ一トンクリメン卜)。

dt dmacreg [ 0 ] ；カウントレジスタ (dma_c[0])を一 1し、 0かどうかをフラグに反映。

bf dmaOLl ；残リ転送語数が 0でない場合は、 dmaOLlに分岐。

nop

set #1, @dma endf [0] チャネル 0の DMA転送処理フラグを 1に設定。

rtdma DMA転送処理から復帰。

次に、図 12により、 DM A転送コントローラにキャッシングレジス ' 夕を 1セット搭載した場合の、 DM A転送時の DM A転送情報のキヤッシングの動作の一例を説明する。図 12は DMA転送時の DMA転送情報のキヤッシングの動作の説明図を示す。

この例では、パイプライン 1の動作において、チャネル 0の DMA要求、続けてチャネル 0の D MA要求があり、その後、チャネル 1の DM A要求があった場合を示している。この際に、 DMA転送後の CPU処理においては、命令の組み合わせにより一時的に命令処理を休止することがある。

この例の場合に、チャネル 0の DMA転送要求が連続したため、 1回目は DMA転送情報をメモリなどからロードするが、 2回目の DMA転送情報はメモリなどからロードせず、キャッシングされている情報を使用しており、応答速度の改善および低消費電力化が見込める。その後、チャネル 1の DM A転送要求が発生しているため、チャネル 0の DMA 転送情報をメモリなどに退避してから、チャネル 1の DMA転送情報をキヤヅシングレジス夕にコピーしている。

次に、図 13により、バス構成を適用したコンフィグラブルス一パ一スカラマイクロプロセッサの構成の一例を説明する。図 13はバス構成を適用したコンフィグラブルスーパ一スカラマイクロプロセヅサの構成図を示す。

バス構成を適用したコンフィグラブルス一パースカラマイクロプロセヅサは、前記図 1に示したスィヅチマトリヅクスモジュール（ S WM X) をバス構成に代えた構成であり、 E C P U 10 bからの命令コ一ドフヱツチ要求に対して命令コードを転送する命令転送バス 1 10 a、 E CPU 1 0 bからのデータ転送要求に対してデータを転送するデータ転送バス 1 1 0 bおよび 1 10 cから成る。他の構成および動作は、前記図 1と同様である。

以上説明したように、本実施の形態のコンフィグラブルス一パース力ラマイクロプロセッサによれば、 CPU処理用のパイプライン機構によつて、 CPU処理の空き時間などに DMA転送処理を行うことにより、 C P U処理性能をほとんど低下させずに、 DMAコントローラのモジュ —ル相当分のゲート論理が不要になり、チップ面積が小さくなる。

また、従来の汎用の DMAコントローラの場合、 DMA転送処理と同時にデータ演算処理を行うことは難しく、本実施の形態のプログラマブル DMA転送機能により、 DMAデ一夕転送とデータ演算を連続して行えるため、データ演算処理時の CP Uに対する割り込み処理の起動といつた余計な切り替えオーバへッドなどが回避でき、高機能なデ一夕転送処理の処理性能が大幅に向上できる。

この結果、製品全体として、 DMAコントローラのモジュール相当分のチップ面積削減を可能とする。さらに、高機能 ·高性能デ一夕転送機能により、演算を伴うようなデータ転送処理を行う場合、システム性能が大幅に向上する。また、内部バスなどに接続されるバスマスタの個数が減るため、負荷容量的にも、レイアウト的にも、負荷が減り、動作速度向上も期待できる。以上、本発明者によってなされた発明をその実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもな 'い。

たとえば、スーパ一スカラプ口セヅサの命令実行パイプラインは、 2 本に限定されるものではなく、 3本以上のパイプラインを有する場合にも適用可能である。パイプラインの本数が多くなると、 C P U命令を同時に行うスーパ一スカラマイクロプロセッサとしては、同時に各パイプラインを途切れなく動作させられる確立は下がるが、空いているパイプラインを別の処理に充てられるため、さらに D M A転送能力の高いマイクロプロセッサを構成することができる。産業上の利用可能性

以上のように、本発明にかかる情報処理装置は、特に複数系統の命令実行パイプラインを有するスーパ一スカラパイプライン構成のマイク口プロセッサや、組み込み分野を主な夕一ゲヅトとする高性能マイク口コントローラに適用して有用であり、さらに信号処理を行うための処理プロセッサにおいての、インテリジェントデ一夕転送コントローラなどにも広く適用することができる。

Claims

請求の範囲

1 . 複数系統の命令実行パイプラインを有するスーパ一スカラパイプラィン構成の情報処理装置であって、

第 1メモリに格納された命令を第 1ス一パースカラパイプラインに展開して実行する際に、第 2ス一パースカラパイプラインが命令実行を行えない空きステージが生じた場合に、前記空きステージを用いて第 2 メモリに格納された命令を実行するように切り替える制御手段を有することを特徴とする情報処理装置。

2 . 複数系統の命令実行パイプラインを有するスーパ一スカラパイプラィン構成の情報処理装置であって、

第 1メモリに格納された命令を第 1ス一パースカラパイプラインに展開して実行する際に、第 2スーパ一スカラパイプラインが命令実行を行えない空きステージが生じた場合に、前記空きステージを用いて第 2 メモリに格納された D M A Cコマンドを実行するように切り替える制御手段を有することを特徴とする情報処理装置。

3 . 請求項 2記載の情報処理装置において、

前記 D M A Cコマンドは、演算処理したデ一夕を転送可能とすることを特徴とする情報処理装置。

4 . 請求項 2記載の情報処理装置において、

前記制御手段は、 C P U処理と D M A転送処理とを切り替える際に、前記 C P U処理を優先する第 1モード、前記 D M A転送処理を優先する第 2モード、前記 D M A転送処理の一部チャネルのみを前記 C P U処理より優先する第 3モード、一定期間毎に優先順位を切り替える第 4モ一ドを選択的なモ一ドとして有することを特徴とする情報処理装置。

5 . 請求項 2記載の情報処理装置において、

前記制御手段は、 C P U処理と D M A転送処理とを切り替える際に、命令実行を行えない空きステージが生じた第 2スーパースカラパイプラインに対して前記 C P U処理と前記 D M A転送処理のいずれか一方を固定的なモードとして切り替えることを特徴とする情報処理装置。

6 . 請求項 2記載の情報処理装置において、

前記制御手段は、 D M A転送処理の際に、 D M A転送に必要なソースアドレス、デスティネーションアドレスおよび転送語数と、アドレスラップアラウンド転送に必要な初期値情報とァドレス範囲情報をメモリに格納し、必要な情報のみをキヤヅシングレジスタにキャッシングすることを特徴とする情報処理装置。

7 . 複数系統の命令実行パイプラインを有するスーパ一スカラパイブラィン構成の情報処理装置であって、

命令実行を行うための命令が格納された第 1メモリと、

データ転送を実行するための第 2メモリと、

少なくとも第 1および第 2スーパースカラパイプラインとを有し、前記第 1メモリに格納された命令を前記第 1ス一パースカラパイプラインに展開して実行する際に、前記第 2スーパ一スカラパイプラインが前記第 1メモリに格納された命令実行を行えない空きステージが生じた場合に、前記空きステージを用いて前記第 2メモリに格納された命令を実行するように切り替える制御手段を有することを特徴とする情報処理装置。