JPH06103068A

JPH06103068A - データ処理装置

Info

Publication number: JPH06103068A
Application number: JP24996992A
Authority: JP
Inventors: Takeshi Hoshina; 健保科; Yoshio Iida; 良雄飯田
Original assignee: Toyota Motor Corp
Current assignee: Toyota Motor Corp
Priority date: 1992-09-18
Filing date: 1992-09-18
Publication date: 1994-04-15
Also published as: DE69322566D1; EP0588341A2; EP0588341A3; EP0588341B1; DE69322566T2

Abstract

(57)【要約】【目的】並列演算と、逐次演算とを切り替え可能なデ
ータ処理装置であって、製造・設計と、その上のソフト
ウェアの設計が容易なデータ処理装置を得る。【構成】第一のＡＬＵ４０及び第二のＡＬＵ４２、及
び１２個のレジスタ４４−０〜４４−１１を備えてい
る。そして、第一及び第二のＡＬＵ４０、４２と、１２
個のレジスタ４４−０〜４４−１１とを制御しているの
が、制御部４６である。これらの構成を含むプロセッサ
に入力された逐次演算命令は、第一のＡＬＵ４０でのみ
実行され、この際第二のＡＬＵ４２は停止状態にある。
並列演算命令が入力さると、第一及び第二のＡＬＵ４
０、４２において並列に実行され、第一のＡＬＵは、共
通レジスタ４４−０〜４４−３と、専用レジスタ４４−
４〜４４−７とにアクセスでき、第二のＡＬＵ４２は、
共通レジスタ４４−０〜４４−３と、専用レジスタ４４
−４〜４４−７とにアクセスできる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データ処理装置に関す
る。特に、並列演算可能なデータ処理装置に関する。

【０００２】

【従来の技術】近年、デジタル技術は大きく発展し、様
々なデータの処理がデジタル技術により高速に処理され
ている。しかしながら、処理内容の高度化・複雑化のた
めにより高速なデータ処理が要求されている。このよう
な要望により、高速化のための技術が各種開発・提案さ
れている。

【０００３】従来の代表的な高速化技術の一つに、パイ
プラインがある。図３にパイプラインの説明が示されて
いる。図３に示されているように、パイプラインによる
データ処理においては、一個のプロセッサ８の内部が、
複数の処理ステージに分割されている。図３に示されて
いるように、例えば、命令の取り出しステージ１０と、
命令の解読ステージ１２と、オペランドの取り出しステ
ージ１４と、演算実行ステージ１６と、結果の格納ステ
ージ１８とに分割されている。そして、それぞれのステ
ージで一連の別々の命令・データを取り扱うことによ
り、プロセッサ８の動作クロックをそのままの値に維持
したままこの一個のプロセッサ８が同時に５個の命令・
データの組を処理することが可能である。

【０００４】このように、複数の処理ステージに分割す
ることによりそれに比例して速度が増加するが、分岐命
令等の場合には、パイプラインの流れが分断されるた
め、あまり長すぎるパイプラインはかえって速度の低下
を招く。そのため、一般には４〜６段程度のパイプライ
ンが多く用いられている。スーパーコンピュータ等で
は、このパイプラインを複数個備えスーパースケーラ等
が実現されている。

【０００５】従来の他の高速化技術の一つに、マルチプ
ロセッサがある。マルチプロセッサは、上述したパイプ
ラインとは異なり、複数のプロセッサを用いる技術であ
る。図４にマルチプロセッサの説明図が示されている。
図４に示されているように、共用メモリ群３０に対し
て、複数のプロセッサ３２が接続されている。そして、
各プロセッサには、一般に同一の命令が供給され、各プ
ロセッサは、共用メモリ群３０内部の別個のデータに対
しそれぞれデータ処理を実行する。そのため、プロセッ
サの個数に比例した演算速度が得られ、データ処理速度
の向上が期待できる。

【０００６】このような、パイプラインの情報処理装置
が例えば特開平２−２９８２５号公報に記載されてい
る。また、マルチプロセッサにおいて、主プロセッサと
副プロセッサを用いたマルチプロセッサについての一例
が特開平２−３２４５２号公報に記載されている。ま
た、並列処理と逐次処理とを切り替える構成を有する並
列処理装置が例えば特開平３−１２９４３３号公報に記
載されているその他の高速化技術としては、縮小命令セ
ットコンピュータ、いわゆるＲＩＳＣ型コンピュータが
ある。このような型のコンピュータの例が例えば特開昭
６３−４９８４３号公報に記載されている。

【０００７】

【発明が解決しようとする課題】従来のデータ処理装置
は、以上のように構成されていた。そのため、スーパー
スケーラ等の並列処理をパイプラインで行う場合には、
パイプライン等のアーキテクチャが複雑になるため、設
計の労力が増加し、製造時の歩留まりも悪化する。そし
て、ソフトウェアの設計において、正確な制御を行うた
めのソフトウェアを制作するためには、パイプラインの
詳細な動きを把握する必要がある。

【０００８】さらに、上記マルチプロセッサで並列処理
を行う場合には、各プロセッサで共通にアクセス可能な
同一資源（上記の場合には共用メモリ群）が必要であ
る。また、同時にアクセスしてしまうこと（コンフリク
ト）を回避するために、各プロセッサ間での通信が必要
である。そのため、マルチプロセッサによる制御方式で
は、各プロセッサ間の通信状態を十分に把握し、制御の
ためのソフトウェアを製作する必要がある。

【０００９】本発明は、上記課題に鑑みなされたもの
で、その目的は、並列演算と、逐次演算とを切り替える
ことが可能なデータ処理装置であって、製造・設計が容
易なアーキテクチャを有し、かつ、ソフトウェアの設計
が容易となるようなデータ処理装置を得ることである。

【００１０】

【課題を解決するための手段】本発明は、上述の課題を
解決するために、一個の主演算器を含む複数の演算器
と、前記各演算器ごとに設けられ、各対応する演算器に
よってデータの読み書きが行われるレジスタ群と、前記
複数の演算器に共通に設けられ、前記複数の演算器によ
ってデータの読み書きが行われる共通レジスタ群と、前
記複数の演算器を制御する制御部と、を備え、前記制御
部は、並列動作命令を入力した場合には、前記複数の演
算器に同一の演算を行わせ、逐次動作命令を入力した場
合には、前記主演算器のみに演算を行わせ、前記主演算
器に、その他の演算器に対応して設けられている前記専
用レジスタに対してもデータの読み書きを行わせること
を特徴とするデータ処理装置である。

【００１１】したがって、主演算器は、逐次計算の場合
には全てのレジスタ群に対しデータの読み書きが可能で
あり、並列演算の場合には主演算器の専用レジスタ群と
共通レジスタ群とに対し、データの読み書きが可能であ
る。

【００１２】

【作用】本発明における制御部は、逐次演算命令が入力
された場合には、主演算器のみに命令の動作を行わせ、
並列演算命令が入力された場合には、主演算器だけでな
く、全ての演算器に共通に命令動作を行わせる。

【００１３】また、並列演算命令の場合には、各専用レ
ジスタは各対応する演算器によってのみデータの読み書
きが行われ、逐次演算命令の場合には、各専用レジスタ
は全て主演算器からデータの読み書きが可能となる。

【００１４】

【実施例】以下、本発明の好適な実施例を図面に基づい
て説明する。

【００１５】図１は、本発明の一実施例によるデータ処
理装置の構成ブロック図である。図１に示されているよ
うに、本実施例におけるデータ処理装置は、第一のＡＬ
Ｕ４０及び第二のＡＬＵ４２を備えている。また、１２
個のレジスタ４４−０〜４４−１１を備えている。そし
て、これらの第一及び第二のＡＬＵ４０、４２と、１２
個のレジスタ４４−０〜４４−１１とを制御しているの
が、制御部４６である。このような構成を有する本実施
例のデータ処理装置に入力される命令は、逐次演算命令
と並列演算命令とに分けられる。

【００１６】本実施例において特徴的なことは、この逐
次演算命令は、第一のＡＬＵ４０でのみ実行され、この
際第二のＡＬＵ４２は停止状態にあることである。一
方、並列演算命令は、第一及び第二のＡＬＵ４０、４２
において並列に実行される。入力される命令が逐次演算
命令であるか並列演算命令であるかは制御部４６によっ
て判断される。

【００１７】図１（ａ）に示されているのは、並列演算
命令が実行される際（以下、並列モードという）の動作
模式図である。図１（ａ）に示されているように、並列
モードにおいては、レジスタ４４−０〜レジスタ４４−
３が、第一及び第二のＡＬＵ４０、４２に接続されてい
る。また、レジスタ４４−４〜レジスタ４４−７が、第
一のＡＬＵ４０のみに接続されている。そして、レジス
タ４４−８〜レジスタ４４−１１が、第一のＡＬＵ４０
のみに接続されている。

【００１８】本実施例において特徴的なことは、並列モ
ード時に、レジスタが、第一及び第二のＡＬＵの両方に
接続されている共通レジスタ郡と、いずれか一方のＡＬ
Ｕにのみ接続されている専用レジスタ群との２種類備え
られていることである。図１（ａ）に示されているよう
に、本実施例においてはレジスタ４４−０〜レジスタ４
４−３が共通レジスタであり、レジスタ４４−４〜レジ
スタ４４−７が、第一のＡＬＵ４０の専用レジスタ群で
ある。また、レジスタ４４−８〜レジスタ４４−１１
は、第二のＡＬＵ４２の専用レジスタである。なお、第
二のＡＬＵ４２の専用レジスタ４４−８〜４４−１１
は、並列モードにおいては第一のＡＬＵ４０の専用レジ
スタ４４−４〜４４−７と同じ番号で参照される。後述
するように、その際、第一のＡＬＵ４０と第二のＡＬＵ
４２とには同一の命令が供給されるので、例えばレジス
タ４４−８は常に、レジスタ４４−４と同時に参照（ア
クセス）される。具体的な動作については後述する。

【００１９】図１（ｂ）に示されているのは、逐次演算
命令が実行される際（以下、逐次モードという）の動作
模式図である。図１（ｂ）に示されているように、逐次
モードにおいては、全てのレジスタ４４−０〜レジスタ
４４−１１が、第一のＡＬＵ４０のみに接続されてお
り、第二のＡＬＵはいわば切り離された状態である。な
お、二つのモードにおいて、レジスタがどのＡＬＵから
アクセスできるかが、図２に表されている。

【００２０】以下、マトリクスＡとマトリクスＢとの値
を乗算し、マトリクスＣを得る計算について、その詳細
な動作を説明する。なお、マトリクスＢは、Ｉ／Ｏポー
トから入力し、計算結果であるマトリクスＣもＩ／Ｏポ
ートに出力されるものとする。各マトリクスＡ、Ｂ、Ｃ
には以下の関係がある。

【００２１】

【式１】このような乗算を行うプログラムは、例えば以下のよう
になる。ｌｄｉＲ４，ａ；（１）ｌｄｉＲ５，ｂ；（２）ｌｄｉＲ８，ｃ；（３）ｌｄｉＲ９，ｄ；（４）ＬＯＯＰ：（５）ｇｅｔＲ０；（６）ｇｅｔＲ１；（７）ｆｍｐｙ．ｐＲ６，Ｒ４，Ｒ０（８）ｆｍｐｙ．ｐＲ７，Ｒ５，Ｒ１（９）ｆａｄｄ．ｐＲ４，Ｒ６，Ｒ７（１０）ｐｕｔＲ４；（１１）ｐｕｔＲ８；（１２）ｂＬＯＯＰ；（１３）まず、逐次モードから上記プログラムは実行が開始され
る。上記ステップ（１）から（４）までの命令によっ
て、レジスタ４４−４（Ｒ４）にａ、レジスタ４４−５
（Ｒ５）にｂ、レジスタ４４−８（Ｒ８）にｃ、レジス
タ４４−９（Ｒ９）にｄがそれぞれロードされる。以
下、レジスタ４４をＲ０〜Ｒ１１のように記す。なお、
上記ｌｄｉはレジスタに直接に値をロードする逐次演算
命令である。次にステップ（５）はラベルであり、後述
するように、本演算処理の繰り返しの先頭を表す。

【００２２】ステップ（６）から（７）までの命令によ
って、マトリクスＢの値をＩ／Ｏポートから入力し、レ
ジスタＲ０とＲ１とに格納する。上記ｇｅｔは、Ｉ／Ｏ
ポートから値を入力する入出力命令の一種である。

【００２３】以上のようにして、第一のＡＬＵの専用レ
ジスタ（Ｒ４、Ｒ５）にａとｂを、第二のＡＬＵの専用
レジスタ（Ｒ８、Ｒ９）にｃ、ｄを、それぞれ格納し、
さらに、共通レジスタＲ０とＲ１とにマトリクスＢのｘ
とｙとを格納する。

【００２４】次に、実際の乗算が行われる。乗算は、第
一のＡＬＵ４０にてａｘ＋ｂｙが、第二のＡＬＵ４２に
てｃｘ＋ｄｙが、それぞれ並列に行われる。

【００２５】ステップ（８）から（１０）までが乗算の
中心部分である。この３つのステップにおいて用いられ
ている命令のように、後ろにサフィックスの「．ｐ」が
付加されている命令は並列演算命令を表す。つまり、ス
テップ（１）から（７）までは、第一のＡＬＵ４０につ
いて命令が実行されてきたが、このステップ（８）〜
（１０）においては、命令は第一及び第二のＡＬＵ４０
と４２との両方で実行される。

【００２６】まず、ステップ（８）においては、第一の
ＡＬＵ４０はレジスタＲ０の値とＲ４の値とを乗算し、
その結果をレジスタＲ６に格納する。一方、第二のＡＬ
Ｕ４２においては、レジスタのＲ４とＲ６とは、前述し
たように、逐次モードにおけるレジスタＲ８とＲ１０で
ある。したがって、第二のＡＬＵ４２は、レジスタのＲ
０の値とＲ８の値とを乗算し、その結果をレジスタＲ１
０に格納する。このように、第一のＡＬＵ４０において
はａ＊ｘが実行され、第二のＡＬＵ４２においてはｃ＊
ｘが実行され、それぞれの結果が、レジスタＲ６とＲ１
０に格納される。なお、ｆｍｐｙは、浮動小数点数の乗
算を表す。

【００２７】ステップ（９）も、（８）と同一の並列演
算命令であり、第一のＡＬＵ４０はレジスタＲ１の値と
Ｒ５の値とを乗算し、その結果をレジスタＲ７に格納す
る。一方、第二のＡＬＵ４２においては、レジスタのＲ
５とＲ７とは、前述したように、逐次モードにおけるレ
ジスタＲ９とＲ１１である。したがって、第二のＡＬＵ
４２は、レジスタのＲ１の値とＲ９の値とを乗算し、そ
の結果をレジスタＲ１１に格納する。このように、第一
のＡＬＵ４０においてはｂ＊ｙが実行され、第二のＡＬ
Ｕ４２においてはｄ＊ｙが実行され、それぞれの結果
が、レジスタＲ７とＲ１１に格納される。

【００２８】ここまでの結果をまとめると、レジスタＲ
６にａ＊ｘが、レジスタＲ１０にｃ＊ｘが、レジスタＲ
７にｂ＊ｙが、レジスタＲ１１にｄ＊ｙが、それぞれ格
納されている。

【００２９】そして、ステップ（１０）においては、加
算が行われる。この加算も並列演算命令によって第一の
ＡＬＵ４０と第二のＡＬＵ４２において並列に行われ
る。第一のＡＬＵ４０は、レジスタＲ７の値とＲ６の値
とを加算し、その結果をレジスタＲ４に格納する。第二
のＡＬＵ４２においては、レジスタのＲ６、Ｒ７及びＲ
４は、逐次モードにおけるレジスタＲ１０、Ｒ１１及び
Ｒ８である。したがって、第二のＡＬＵ４２は、レジス
タＲ１１の値とＲ１０の値とを加算し、その結果をレジ
スタＲ８に格納する。このように、第一のＡＬＵ４０に
おいては、（ａ＊ｘ）＋（ｂ＊ｙ）が実行され、第二の
ＡＬＵ４２においては（ｃ＊ｘ）＋（ｄ＊ｙ）が実行さ
れ、それぞれの結果が、レジスタＲ４とＲ８に格納され
る。なお、並列演算命令ｆａｄｄ．ｐは、浮動小数点数
の加算命令である。

【００３０】このようにして、マトリクスＡとＢとの乗
算結果であるマトリクスＣの要素ＣｘとＣｙが、レジス
タＲ４とＲ８とに格納される。

【００３１】そして、ステップ（１１）と（１２）にお
いて、上述の演算によって求められた結果がＩ／Ｏポー
トに出力される。ステップ（１１）においては、レジス
タＲ４の値、すなわち、Ｃｘ（（ａ＊ｘ）＋（ｂ＊
ｙ））が出力され、ステップ（１２）においては、レジ
スタＲ８の値、すなわち、Ｃｙ（（ｃ＊ｘ）＋（ｄ＊
ｙ））が出力される。なおｐｕｔは、逐次モードで実行
される命令であり、レジスタの値をＩ／Ｏポートに出力
する命令である。

【００３２】最後にステップ（１３）は、分岐命令であ
り、上述したラベルＬＯＯＰに分岐し、上述したような
演算が繰り返される。

【００３３】従来、並列演算を行うには、各プロセッサ
ごとに異なるプログラムを準備し、それぞれ専用の命令
を供給する必要があった。しかし、本実施例によれば、
プロセッサ内に複数のＡＬＵを備え、それぞれのＡＬＵ
に専用のレジスタを持たせ、各ＡＬＵに共通の命令を与
えながら異なるデータに対する演算を行わせることがで
きる。したがって、上記ステップ（８）から（１０）ま
での演算は、第一及び第二のＡＬＵ４０及び４２にそれ
ぞれ以下のようなプログラムを与えたのと等価である。

【００３４】第一のＡＬＵに対するプログラム第二のＡＬＵに対するプログラムｆｍｐｙＲ６，Ｒ４，Ｒ０ｆｍｐｙＲ１０，Ｒ８，Ｒ０ｆｍｐｙＲ７，Ｒ５，Ｒ１ｆｍｐｙＲ１１，Ｒ９，Ｒ１ｆａｄｄＲ４，Ｒ６，Ｒ７ｆａｄｄＲ８，Ｒ１０，Ｒ１１このように、従来のマルチプロセッサであるならば別々
のプログラムを用意する必要があったが、本実施例によ
れは、一種類のプログラムを与えるだけで、並列演算が
可能である。

【００３５】以上述べたように、本実施例によれば並列
演算命令と、逐次演算命令とを供給するだけで、自動的
にモードの切り替えができるプロセッサが得られる。さ
らに、並列モードにおいては、各ＡＬＵに専用のレジス
タが備えられているため、各ＡＬＵは別個のデータに対
し独立の演算を行うことが可能である。したがって、従
来のマルチプロセッサのように、共通レジスタへの同時
アクセス（コンフリクト）を回避するための通信制御を
極めて簡易なもので済ませることができ、プロセッサ自
体の構造が単純になる。このようなことから、本実施例
によれば、効率の良い並列演算が可能なプロセッサであ
って、かつプログラム開発の容易なプロセッサが得られ
るという効果を有する。

【００３６】

【発明の効果】以上述べたように、本発明のデータ処理
装置によれば、効率の良い並列演算と、従来の逐次演算
とを、命令を切り替えることによって極めて容易に切り
替えることができる。また、並列演算命令は、各演算器
に対し、同一の演算を行わせるため、一つのプログラム
で並列演算を行わせることができるので、極めて容易に
並列演算が実現可能である。

【００３７】したがって、従来のように複雑な設計を行
わなくとも容易に並列演算を実現可能なプロセッサが得
られるという効果を有する。

【図面の簡単な説明】

【図１】本発明の好適な一実施例であるプロセッサの構
成ブロック図である。

【図２】図１の実施例のプロセッサの並列・逐次各モー
ドにおいて、各レジスタがどのＡＬＵからアクセスされ
るかを示す説明図である。

【図３】従来のパイプラインによるプロセッサを表す構
成ブロック図である。

【図４】従来のマルチプロセッサを説明する構成ブロッ
ク図である。

【符号の説明】

４０第一のＡＬＵ４２第二のＡＬＵ４４レジスタ４６制御部

Claims

【特許請求の範囲】

【請求項１】一個の主演算器を含む複数の演算器と、前記各演算器ごとに設けられ、各対応する演算器によっ
てデータの読み書きが行われる専用レジスタ群と、前記複数の演算器に共通に設けられ、前記複数の演算器
によってデータの読み書きが行われる共通レジスタ群
と、前記複数の演算器を制御する制御部と、を備え、前記制御部は、並列動作命令を入力した場合には、前記複数の演算器に
同一の演算を行わせ、逐次動作命令を入力した場合には、前記主演算器のみに
演算を行わせ、前記主演算器に、その他の演算器に対応
して設けられている前記専用レジスタに対してもデータ
の読み書きを行わせることを特徴とするデータ処理装
置。