JPH0561675B2 - - Google Patents
Info
- Publication number
- JPH0561675B2 JPH0561675B2 JP58018315A JP1831583A JPH0561675B2 JP H0561675 B2 JPH0561675 B2 JP H0561675B2 JP 58018315 A JP58018315 A JP 58018315A JP 1831583 A JP1831583 A JP 1831583A JP H0561675 B2 JPH0561675 B2 JP H0561675B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- register
- unit
- array
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000008859 change Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000000034 method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8053—Vector processors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Complex Calculations (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、高速にアレイ演算を行なうためのデ
ータ処理装置に関するものであり、更に具体的に
は、データおよびプログラムを記憶するグローバ
ル・メモリ・ユニツト、プログラムを実行し、ア
レイ演算の制御等を行なうコントロール・プロセ
ツサ・ユニツト、アレイ演算を実行するアレイ・
プロセツサ・ユニツトおよび外部の入出力装置と
のインターフエースである外部インターフエー
ス・ユニツトとを有し、これらの機能ユニツトが
データ・バスおよび制御バスによつて接続された
データ処理装置に関するものである。
ータ処理装置に関するものであり、更に具体的に
は、データおよびプログラムを記憶するグローバ
ル・メモリ・ユニツト、プログラムを実行し、ア
レイ演算の制御等を行なうコントロール・プロセ
ツサ・ユニツト、アレイ演算を実行するアレイ・
プロセツサ・ユニツトおよび外部の入出力装置と
のインターフエースである外部インターフエー
ス・ユニツトとを有し、これらの機能ユニツトが
データ・バスおよび制御バスによつて接続された
データ処理装置に関するものである。
一般に、科学技術計算においてアレイ演算の占
める割り合いは高く、これを汎用計算機で処理す
ると時間かかり過ぎることから、アレイ演算を専
用に行なうデータ処理装置が種々考案され、その
うちのいくつかは実用化されてきた。このような
アレイ演算用のデータ処理装置は、下に示すよう
ないくつかの形式に分類される。
める割り合いは高く、これを汎用計算機で処理す
ると時間かかり過ぎることから、アレイ演算を専
用に行なうデータ処理装置が種々考案され、その
うちのいくつかは実用化されてきた。このような
アレイ演算用のデータ処理装置は、下に示すよう
ないくつかの形式に分類される。
A FFTプロセツサのように、アレイ演算でも
特定の種類の演算のみの高速化を図つた専用の
プロセツサ。
特定の種類の演算のみの高速化を図つた専用の
プロセツサ。
B 汎用計算機にその入出力インターフエースを
介して接続され、一般の科学技術計算における
アレイ演算を汎用計算機よりも高速に実行する
アレイ・プロセツサ。
介して接続され、一般の科学技術計算における
アレイ演算を汎用計算機よりも高速に実行する
アレイ・プロセツサ。
C 汎用計算機の中央処理装置を共有し、アレイ
演算専用の機能を付加した内蔵アレイ・プロセ
ツサ。
演算専用の機能を付加した内蔵アレイ・プロセ
ツサ。
D 超高速に科学技術計算におけるアレイ演算を
処理するスーパーコンピユータ。
処理するスーパーコンピユータ。
上記のうち、Aの形式の専用プロセツサにおい
ては、その構成はある特定の処理に向いたものと
なつており、限られた種類の演算を対象としてい
る。このため、対象としている演算の処理は高速
が行なえるが、対象外の演算は全く行なえない
か、あるいは行なえるとしても非常に低速の処理
となり、処理の柔軟性に欠けるという欠点があつ
た。
ては、その構成はある特定の処理に向いたものと
なつており、限られた種類の演算を対象としてい
る。このため、対象としている演算の処理は高速
が行なえるが、対象外の演算は全く行なえない
か、あるいは行なえるとしても非常に低速の処理
となり、処理の柔軟性に欠けるという欠点があつ
た。
また、上記Bの形式のアレイ・プロセツサで
は、処理の柔軟性はあるが、特定の処理を考えた
とき、汎用計算機に比べて処理性能は改善される
ものの、専用プロセツサが必要な分野に適用でき
るほどの処理性能は有していないという欠点があ
つた。また、汎用計算機の入出力装置の1つとし
て接続されているため、ある1つの演算から他の
演算に処理が移るときには入出力のオーバーヘツ
ドが大きいという欠点もあつた。
は、処理の柔軟性はあるが、特定の処理を考えた
とき、汎用計算機に比べて処理性能は改善される
ものの、専用プロセツサが必要な分野に適用でき
るほどの処理性能は有していないという欠点があ
つた。また、汎用計算機の入出力装置の1つとし
て接続されているため、ある1つの演算から他の
演算に処理が移るときには入出力のオーバーヘツ
ドが大きいという欠点もあつた。
さらに、上記Cの形式の内蔵アレイ・プロセツ
サでは、処理の柔軟性は汎用計算機の中央処理装
置を共有しているため充分にあるが、その反面、
処理性能は上記Bの形式のアレイ・プロセツサほ
どは改善されないという欠点があつた。
サでは、処理の柔軟性は汎用計算機の中央処理装
置を共有しているため充分にあるが、その反面、
処理性能は上記Bの形式のアレイ・プロセツサほ
どは改善されないという欠点があつた。
上記Dの形式のスーパーコンピユータでは、大
規模科学技術計算を指向しており、処理は非常に
高速に行なえる。一般に、スーパーコンピユータ
では取り扱えるデータ幅も広く精度良く計算が行
なえるようになつている。しかし、構成は大規模
であり、精度をそれほど要求しない応用に対して
は、高価過ぎるという欠点があつた。
規模科学技術計算を指向しており、処理は非常に
高速に行なえる。一般に、スーパーコンピユータ
では取り扱えるデータ幅も広く精度良く計算が行
なえるようになつている。しかし、構成は大規模
であり、精度をそれほど要求しない応用に対して
は、高価過ぎるという欠点があつた。
以上のことより、前記A〜Dの形式のデータ処
理装置を次のような条件を要求する応用に対して
用いることは不適当である。
理装置を次のような条件を要求する応用に対して
用いることは不適当である。
− 科学技術計算、とくに、アレイ計算を主体と
する。
する。
− 専用プロセツサとほぼ同等の高速な処理を行
なう。
なう。
− 演算の精度はそれほど要求しない。
− プログラムにより処理内容を動的に変更でき
る。
る。
− 処理内容の変更に伴うオーバーヘツドが小さ
い。
い。
さらに、アレイ演算においては、メモリに対し
連続的にアクセスして大量のデータを読出し又は
書込む場合が多いが、このような処理に適した処
理装置は従来存在しなかつた。すなわち、多数の
ユニツトからメモリにアクセスしなければならぬ
が、この各ユニツトの中にそれぞれ、メモリ・リ
クエスト信号を送出する機能の他に、メモリにア
クセスするために連続的に変化するアドレス信号
を生成する機能、転送したデータ数を計数する機
能を必要とした。たとえば、リアルタイム・デー
タをメモリに入力するためのユニツト中にも、メ
モリ・リクエスト信号を送出する機能の他に、デ
ータアドレスを計算する機能と、データを計数す
る機能を付加しなければならなかつた。メモリに
接続するすべてのユニツトに上述のような機能を
持たせるのは効率的でなく、特に、データアドレ
スを計算する機能を実現するには比較的多量のハ
ードウエアを必要とし、従来のアレイ演算用デー
タ処理装置はメモリに接続するすべてのユニツト
にこのような機能を持たせねばならぬという欠点
があつた。
連続的にアクセスして大量のデータを読出し又は
書込む場合が多いが、このような処理に適した処
理装置は従来存在しなかつた。すなわち、多数の
ユニツトからメモリにアクセスしなければならぬ
が、この各ユニツトの中にそれぞれ、メモリ・リ
クエスト信号を送出する機能の他に、メモリにア
クセスするために連続的に変化するアドレス信号
を生成する機能、転送したデータ数を計数する機
能を必要とした。たとえば、リアルタイム・デー
タをメモリに入力するためのユニツト中にも、メ
モリ・リクエスト信号を送出する機能の他に、デ
ータアドレスを計算する機能と、データを計数す
る機能を付加しなければならなかつた。メモリに
接続するすべてのユニツトに上述のような機能を
持たせるのは効率的でなく、特に、データアドレ
スを計算する機能を実現するには比較的多量のハ
ードウエアを必要とし、従来のアレイ演算用デー
タ処理装置はメモリに接続するすべてのユニツト
にこのような機能を持たせねばならぬという欠点
があつた。
本発明は、このような応用に対して、高速でか
つ柔軟性のあるアレイ演算用データ処理装置を提
供し、前述の従来のアレイ演算用データ処理装置
の欠点を補うためになされたもので、特許請求の
範囲に記載したように構成したことを特徴とする
ものである。
つ柔軟性のあるアレイ演算用データ処理装置を提
供し、前述の従来のアレイ演算用データ処理装置
の欠点を補うためになされたもので、特許請求の
範囲に記載したように構成したことを特徴とする
ものである。
第1図は、本発明の一実施例におけるシステム
構成を示すブロツク図である。図中、100,2
00,300,400,500は機能ユニツトを
示し、10,20,30は複数のバスの束(以
後、これをバンドルと呼ぶ)を示す。
構成を示すブロツク図である。図中、100,2
00,300,400,500は機能ユニツトを
示し、10,20,30は複数のバスの束(以
後、これをバンドルと呼ぶ)を示す。
第1図において、大量のデータ(アレイ・デー
タおよびスカラ・データ)およびプログラムは大
容量の記憶部を持つグローバル・メモリ・ユニツ
ト100に記憶され、実行しようとするプログラ
ムおよびこれに関係したデータはメモリ・バンド
ル10を介して、コントロール・プロセツサ・ユ
ニツト200内のローカル・プログラム・メモリ
210に転送される。
タおよびスカラ・データ)およびプログラムは大
容量の記憶部を持つグローバル・メモリ・ユニツ
ト100に記憶され、実行しようとするプログラ
ムおよびこれに関係したデータはメモリ・バンド
ル10を介して、コントロール・プロセツサ・ユ
ニツト200内のローカル・プログラム・メモリ
210に転送される。
第1図に示されているデータ処理装置に関する
ほとんど全ての制御を、コントロール・プロセツ
サ・ユニツト200が、その内部に持つローカ
ル・プログラム・メモリ210に格納されている
プログラムを、同じくその内部にあるプログラム
実行ユニツト220で実行することによつて行な
う。コントロール・プロセツサ・ユニツト200
は、ローカル・プログラム・メモリ210を主記
憶とし、プログラム実行ユニツト220を中央処
理装置とする計算機と見なすことができる。従つ
て、コントロール・プロセツサ・ユニツト200
でのプログラムの実行は、通常、その内部で閉じ
た形で行なわれ、新しくプログラムが必要になつ
た場合やプログラムの実行結果をグローバル・メ
モリ・ユニツト100に格納するる必要が生じた
場合などに限つて、グローバル・メモリ・ユニツ
ト100とコントロール・プロセツサ・ユニツト
200との間でデータ転送が行なわれる。このこ
とにより、グローバル・メモリ・ユニツト100
への定常的なデータ・アクセスをなくし、他の機
能ユニツトがアクセスする機会を増やしている。
ほとんど全ての制御を、コントロール・プロセツ
サ・ユニツト200が、その内部に持つローカ
ル・プログラム・メモリ210に格納されている
プログラムを、同じくその内部にあるプログラム
実行ユニツト220で実行することによつて行な
う。コントロール・プロセツサ・ユニツト200
は、ローカル・プログラム・メモリ210を主記
憶とし、プログラム実行ユニツト220を中央処
理装置とする計算機と見なすことができる。従つ
て、コントロール・プロセツサ・ユニツト200
でのプログラムの実行は、通常、その内部で閉じ
た形で行なわれ、新しくプログラムが必要になつ
た場合やプログラムの実行結果をグローバル・メ
モリ・ユニツト100に格納するる必要が生じた
場合などに限つて、グローバル・メモリ・ユニツ
ト100とコントロール・プロセツサ・ユニツト
200との間でデータ転送が行なわれる。このこ
とにより、グローバル・メモリ・ユニツト100
への定常的なデータ・アクセスをなくし、他の機
能ユニツトがアクセスする機会を増やしている。
コントロール・プロセツサ・ユニツト200内
のプログラム実行ユニツト220は、ローカル・
プログラム・メモリ210とバンドル40によつ
て接続され、これを介して命令のフエツチ・デー
タの読み出し、およびデータの書き込みが行なわ
れる。プログラム実行ユニツト220は、本デー
タ処理装置に機械命令として定義されているマイ
クロ命令を逐次実行するもので、マイクロプログ
ラムによつて、マイクロ命令の読み出し、解読、
データの読み出し、実行、実行結果の書き込み等
が制御される。
のプログラム実行ユニツト220は、ローカル・
プログラム・メモリ210とバンドル40によつ
て接続され、これを介して命令のフエツチ・デー
タの読み出し、およびデータの書き込みが行なわ
れる。プログラム実行ユニツト220は、本デー
タ処理装置に機械命令として定義されているマイ
クロ命令を逐次実行するもので、マイクロプログ
ラムによつて、マイクロ命令の読み出し、解読、
データの読み出し、実行、実行結果の書き込み等
が制御される。
グローバル・メモリ・ユニツト100に記憶さ
れている大量のアレイ・データを処理するのは、
メモリ・バンドル10に接続されたアレイ・プロ
セツサ・ユニツト300で、これは、ローカル・
データ・メモリ310とアレイ演算実行ユニツト
320とから構成される。処理するアレイ・デー
タは、まず、グローバル・メモリ・ユニツト10
0よりローカル・データ・メモリ310に転送さ
れ、この後、アレイ演算実行ユニツト320にロ
ーカル・データ・メモリ310から取り出された
データが供給され、処理された後、結果をローカ
ル・データ・メモリ310に返す。ローカル・デ
ータ・メモリ310とアレイ演算実行ユニツト3
20との間で、バンドル50を介してデータの授
受を行ないながら、必要な回数だけ、この処理サ
イクルを繰り返す。最終的な結果がローカル・デ
ータ・メモリ310に格納された後、これよりグ
ローバル・データ・メモリ100に転送される。
れている大量のアレイ・データを処理するのは、
メモリ・バンドル10に接続されたアレイ・プロ
セツサ・ユニツト300で、これは、ローカル・
データ・メモリ310とアレイ演算実行ユニツト
320とから構成される。処理するアレイ・デー
タは、まず、グローバル・メモリ・ユニツト10
0よりローカル・データ・メモリ310に転送さ
れ、この後、アレイ演算実行ユニツト320にロ
ーカル・データ・メモリ310から取り出された
データが供給され、処理された後、結果をローカ
ル・データ・メモリ310に返す。ローカル・デ
ータ・メモリ310とアレイ演算実行ユニツト3
20との間で、バンドル50を介してデータの授
受を行ないながら、必要な回数だけ、この処理サ
イクルを繰り返す。最終的な結果がローカル・デ
ータ・メモリ310に格納された後、これよりグ
ローバル・データ・メモリ100に転送される。
機能ユニツト400は外部インターフエース・
ユニツトで、これと入出力バンドル30を介して
接続される例えばデイスプレイ装置および実時間
信号入力装置等の入出力装置500a,500b
とグローバル・メモリ・ユニツト100との間で
のデータ転送を制御する。
ユニツトで、これと入出力バンドル30を介して
接続される例えばデイスプレイ装置および実時間
信号入力装置等の入出力装置500a,500b
とグローバル・メモリ・ユニツト100との間で
のデータ転送を制御する。
コントロール・プロセツサ・ユニツト200
は、データ処理装置全体の制御を行なうために、
制御バンドル20を介して、アレイ・プロセツ
サ・ユニツト300、グローバル・メモリ・ユニ
ツト100、外部インターフエース・ユニツト4
00に対し制御データを送出したり、あるいはこ
れらの機能ユニツトの状態に関するデータを読み
込んだりする。アレイ・プロセツサ・ユニツト3
00に対するアレイ演算の制御あるいは外部イン
ターフエース・ユニツト400に対する入出力デ
ータの転送制御はこのバンドル20を用いて行な
われる。
は、データ処理装置全体の制御を行なうために、
制御バンドル20を介して、アレイ・プロセツ
サ・ユニツト300、グローバル・メモリ・ユニ
ツト100、外部インターフエース・ユニツト4
00に対し制御データを送出したり、あるいはこ
れらの機能ユニツトの状態に関するデータを読み
込んだりする。アレイ・プロセツサ・ユニツト3
00に対するアレイ演算の制御あるいは外部イン
ターフエース・ユニツト400に対する入出力デ
ータの転送制御はこのバンドル20を用いて行な
われる。
第2図は第1図のグローバル・メモリ・ユニツ
ト100の構成例を示すブロツク図であつて、1
20a〜120hとそれぞれメモリ・モジユール
で、図に示す例では8個のメモリ・モジユールに
分割され、いずれか1つのモジユールを特定しな
いで表す場合には符号120によつて示す。11
0はリクエスト制御モジユール、10a,10b
は読出しデータ線、10c,10dは書込みデー
タ線である。グローバル・メモリ・ユニツト10
0へのメモリ・リクエストに対し、リクエスト制
御モジユール110は優先順位制御等の制御を行
い、該当するメモリ・モジユール120に制御信
号を介してアクセスがあることを知らせる。
ト100の構成例を示すブロツク図であつて、1
20a〜120hとそれぞれメモリ・モジユール
で、図に示す例では8個のメモリ・モジユールに
分割され、いずれか1つのモジユールを特定しな
いで表す場合には符号120によつて示す。11
0はリクエスト制御モジユール、10a,10b
は読出しデータ線、10c,10dは書込みデー
タ線である。グローバル・メモリ・ユニツト10
0へのメモリ・リクエストに対し、リクエスト制
御モジユール110は優先順位制御等の制御を行
い、該当するメモリ・モジユール120に制御信
号を介してアクセスがあることを知らせる。
第3図は第2図のメモリ・モジユール120の
構成例を示すブロツク図で、第2図と同一符号は
同一部分を示し、121はメモリ部、122はア
クセス制御回路、130はアドレス生成回路、1
1はメモリ・アドレス信号線、12はリクエス
ト・アドレス信号線、13はリクエスト信号(以
下REQで表す)線、123a,123bはそれ
ぞれ制御信号線である。
構成例を示すブロツク図で、第2図と同一符号は
同一部分を示し、121はメモリ部、122はア
クセス制御回路、130はアドレス生成回路、1
1はメモリ・アドレス信号線、12はリクエス
ト・アドレス信号線、13はリクエスト信号(以
下REQで表す)線、123a,123bはそれ
ぞれ制御信号線である。
第4図は第3図のアドレス生成回路130の構
成例を示すブロツク図で、第3図と同一符号は同
一部分を示し、131はレジスタAR(レジスタ
ARの文字ARは他のレジスタと区別するために
付けた記号である。以下他の文字も同様)、13
2はアキユムレータBR、133はレジスタCR、
134はレジスタMAR、135は加算器であ
る。
成例を示すブロツク図で、第3図と同一符号は同
一部分を示し、131はレジスタAR(レジスタ
ARの文字ARは他のレジスタと区別するために
付けた記号である。以下他の文字も同様)、13
2はアキユムレータBR、133はレジスタCR、
134はレジスタMAR、135は加算器であ
る。
グローバル・メモリ・ユニツト100に対しデ
ータ転送を要求するユニツトは信号REQと、ど
のメモリモジユール120を選択するかを示すモ
ジユール選択信号と、選択したモジユール内のメ
モリ部121のアドレスに関する情報とをグロー
バル・メモリ・ユニツト100に送出し、これら
の信号はリクエスト制御モジユール110を介
し、該当するメモリモジユール120にリクエス
ト信号線13上の信号REQ及びリクエスト・ア
ドレス信号線12上のアドレス情報となつて入力
される。
ータ転送を要求するユニツトは信号REQと、ど
のメモリモジユール120を選択するかを示すモ
ジユール選択信号と、選択したモジユール内のメ
モリ部121のアドレスに関する情報とをグロー
バル・メモリ・ユニツト100に送出し、これら
の信号はリクエスト制御モジユール110を介
し、該当するメモリモジユール120にリクエス
ト信号線13上の信号REQ及びリクエスト・ア
ドレス信号線12上のアドレス情報となつて入力
される。
第5図は信号REQの構成と、アクセス制御回
路122がその信号REQを解読してアドレス生
成回路130を制御する制御動作との対応を示す
図で、図において140は信号REQのビツトパ
ターンを示す欄、141はこのビツトパターンに
対応する制御動作をシンボルによつて示す欄であ
る。但し、ビツトパターン欄140においてXで
示すビツトは解読を行うときには無視されるビツ
トであることを意味する。
路122がその信号REQを解読してアドレス生
成回路130を制御する制御動作との対応を示す
図で、図において140は信号REQのビツトパ
ターンを示す欄、141はこのビツトパターンに
対応する制御動作をシンボルによつて示す欄であ
る。但し、ビツトパターン欄140においてXで
示すビツトは解読を行うときには無視されるビツ
トであることを意味する。
シンボル欄141の各シンボルの意味する制御
は次のとおりである。
は次のとおりである。
NOP…何も動作しない。
SBR…リクエスト・アドレス信号線12上のデ
ータをレジスタAR131とアキユムレータ
BR132にセツトする。
ータをレジスタAR131とアキユムレータ
BR132にセツトする。
SCR…リクエスト・アドレス信号線12上のデ
ータをレジスタCR133にセツトする。
ータをレジスタCR133にセツトする。
RSM…単一データ読出しモードを意味し、レジ
スタAR131の内容をレジスタMAR134
にセツトし、レジスタMAR134の内容をメ
モリ・アドレス信号線11に出力してメモリ部
121からそのアドレスのデータを読出す。
スタAR131の内容をレジスタMAR134
にセツトし、レジスタMAR134の内容をメ
モリ・アドレス信号線11に出力してメモリ部
121からそのアドレスのデータを読出す。
RBM…連読データ読出しモードを意味し、アキ
ユムレータBR132に格納されている値にレ
ジスタCR133に格納されている値を加算し、
加算結果をアキユムレータBR132に入力す
ると共にレジスタMAR134にセツトし、レ
ジスタMAR134の内容をメモリ・アドレス
信号線11に出力してメモリ部121からその
アドレスのデータを読出す。この読出しが終る
と次の加算、MAR134へのセツト、メモリ
部121からの読出しのサイクルを繰返す。
ユムレータBR132に格納されている値にレ
ジスタCR133に格納されている値を加算し、
加算結果をアキユムレータBR132に入力す
ると共にレジスタMAR134にセツトし、レ
ジスタMAR134の内容をメモリ・アドレス
信号線11に出力してメモリ部121からその
アドレスのデータを読出す。この読出しが終る
と次の加算、MAR134へのセツト、メモリ
部121からの読出しのサイクルを繰返す。
RBL…連続データ読出しモードの最後のリクエ
ストを意味するもので、動作はRBMと同じで
あるる。これはアクセス制御回路122に対し
てだけ意味をもつ。
ストを意味するもので、動作はRBMと同じで
あるる。これはアクセス制御回路122に対し
てだけ意味をもつ。
WSM…RSMに対応し、RSMが読出し制御であ
るのに対し、WSMは書込み制御である。
るのに対し、WSMは書込み制御である。
WBM…RBMに対応し、RBMが読出し制御であ
るのに対し、WBMは書込み制御である。
るのに対し、WBMは書込み制御である。
WBL…RBLに対応し、RBLが読出し制御に関す
るものであるのに対し、WBLは書込み制御に
関するものである。
るものであるのに対し、WBLは書込み制御に
関するものである。
信号REQに、第5図に示すような種類を作つ
ておけば、データを1つずつアクセスする単一モ
ードと、一定のアドレス間隔をあけて並んでいる
複数個のデータに連続的にアクセスする連続モー
ドとを実施することができる。
ておけば、データを1つずつアクセスする単一モ
ードと、一定のアドレス間隔をあけて並んでいる
複数個のデータに連続的にアクセスする連続モー
ドとを実施することができる。
第6図は単一モードのアクセスの場合の信号
REQと、レジスタAR131、アキユムレータ
BR132、レジスタCR133、レジスタMAR
134の内容の変化の一例を示す図で、この場合
BRとCRの内容は関係がないのでXで示してあ
る。第6図のARはリクエスト・アドレス信号線
12からレジスタAR131にセツトされる数
値、MARはレジスタMAR134からメモリ・
アドレス信号線11に出力される数値を示す欄で
ある。
REQと、レジスタAR131、アキユムレータ
BR132、レジスタCR133、レジスタMAR
134の内容の変化の一例を示す図で、この場合
BRとCRの内容は関係がないのでXで示してあ
る。第6図のARはリクエスト・アドレス信号線
12からレジスタAR131にセツトされる数
値、MARはレジスタMAR134からメモリ・
アドレス信号線11に出力される数値を示す欄で
ある。
第7図は連続モードのアクセスの場合の信号
REQと、各レジスタの内容の変化の一例を示す
図で、それぞれの欄の意味は第6図と同様であ
る。但しOperation3以後はリクエスト・アドレ
ス信号線12からレジスタAR131に数値をセ
ツトする必要がないことを(−)記号によつて示
している。Operation1のSBRでアキユムレータ
BR132に数値95がセツトされ、Operation2
のSCRでレジスタCR133に数値5がセツトさ
れ、Operation3で95+5=100がBR132と
MAR134にセツトされ、基後MAR134の
内容は5ずつ増加し、信号REQがRBLになつた
点で終る。
REQと、各レジスタの内容の変化の一例を示す
図で、それぞれの欄の意味は第6図と同様であ
る。但しOperation3以後はリクエスト・アドレ
ス信号線12からレジスタAR131に数値をセ
ツトする必要がないことを(−)記号によつて示
している。Operation1のSBRでアキユムレータ
BR132に数値95がセツトされ、Operation2
のSCRでレジスタCR133に数値5がセツトさ
れ、Operation3で95+5=100がBR132と
MAR134にセツトされ、基後MAR134の
内容は5ずつ増加し、信号REQがRBLになつた
点で終る。
第8図は第6図又は第7図に示す如く変化する
MAR134の内容によりアクセスされるメモリ
部121内のデータを示す。データ1〜データ5
の5個のデータを得るため、メモリ・リクエスト
をするユニツトは、リクエスト・アドレス信号線
12上の数値を第6図の場合は5回変化して出力
しなければならないのに対し、第7図の場合は2
回だけ出力すればよい。アレイ演算では一定のア
ドレス間隔で並んだ多数のデータにアクセスする
場合が多いので、メモリ・モジユールの中にアド
レス生成回路130を備えていることは、メモ
リ・リクエストを行う各ユニツトにおける処理を
著しく簡単にすることができる。
MAR134の内容によりアクセスされるメモリ
部121内のデータを示す。データ1〜データ5
の5個のデータを得るため、メモリ・リクエスト
をするユニツトは、リクエスト・アドレス信号線
12上の数値を第6図の場合は5回変化して出力
しなければならないのに対し、第7図の場合は2
回だけ出力すればよい。アレイ演算では一定のア
ドレス間隔で並んだ多数のデータにアクセスする
場合が多いので、メモリ・モジユールの中にアド
レス生成回路130を備えていることは、メモ
リ・リクエストを行う各ユニツトにおける処理を
著しく簡単にすることができる。
なお、以上はグローバル・メモリ・ユニツトの
特定のモジユール構成のものについて説明した
が、この発明はこのような特定の構成のものに限
定されるものでないことは申すまでもない。
特定のモジユール構成のものについて説明した
が、この発明はこのような特定の構成のものに限
定されるものでないことは申すまでもない。
以上のように、単一モード又は連続モードのう
ちいずれか一方の処理の途中に他方のモードを適
時行う手段を設けたので、アレイプロセツサユニ
ツトがグローバルメモリユニツトに格納された大
きなアレイデータを連読モードでアクセスしてい
る途中に、コントロールプロセツサユニツトが1
つのデータをアクセスしたい場合に、1つのデー
タがアクセスできないためにコントロールプロセ
ツサユニツトの処理が止まりシステムの効率が低
下することを防ぐことができる等の効果を奏す
る。
ちいずれか一方の処理の途中に他方のモードを適
時行う手段を設けたので、アレイプロセツサユニ
ツトがグローバルメモリユニツトに格納された大
きなアレイデータを連読モードでアクセスしてい
る途中に、コントロールプロセツサユニツトが1
つのデータをアクセスしたい場合に、1つのデー
タがアクセスできないためにコントロールプロセ
ツサユニツトの処理が止まりシステムの効率が低
下することを防ぐことができる等の効果を奏す
る。
第1図はこの発明の一実施例におけるシステム
構成を示すブロツク図、第2図は第1図のグロー
バル・メモリ・ユニツトの構成例を示すブロツク
図、第3図は第2図のメモリ・モジユールの構成
例を示すブロツク図、第4図は第3図のアドレス
生成回路の構成例を示すブロツク図、第5図は第
3図のアクセス制御回路に入力する信号REQと
その信号により制御動作との対応を示す図、第6
図は単一モードアクセスの場合の信号REQと各
レジスタの内容の変化を示す図、第7図は連続モ
ードアクセスの場合の信号REQと各レジスタの
内容の変化を示す図、第8図は第6図又は第7図
の如く変化するレジスタの内容によりアクセスさ
れるメモリ内のデータを示す図である。 10,20,30,40,50…それぞれバン
ドル(バスの束)、100…グローバル・メモ
リ・ユニツト、200…コントロール・プロセツ
サ・ユニツト、210…ローカル・プログラム・
メモリ、220…プログラム実行ユニツト、30
0…アレイプロセツサ・ユニツト、310…ロー
カル・データ・メモリ、320…アレイ演算実行
ユニツト、400…外部インターフエース・ユニ
ツト、10a〜10d…データバス、11…メモ
リ・アドレス信号線、12…リクエスト・アドレ
ス信号線、13…REQ線、120a〜120h
…メモリ・モジユール、121…メモリ部、12
2…アクセス制御回路、130…アドレス生成回
路、131…レジスタAR、132…アキユムレ
ータBR、133…レジスタCR、134…レジス
タMAR、135…加算器。なお、図中同一符号
は同一又は相当部分を示す。
構成を示すブロツク図、第2図は第1図のグロー
バル・メモリ・ユニツトの構成例を示すブロツク
図、第3図は第2図のメモリ・モジユールの構成
例を示すブロツク図、第4図は第3図のアドレス
生成回路の構成例を示すブロツク図、第5図は第
3図のアクセス制御回路に入力する信号REQと
その信号により制御動作との対応を示す図、第6
図は単一モードアクセスの場合の信号REQと各
レジスタの内容の変化を示す図、第7図は連続モ
ードアクセスの場合の信号REQと各レジスタの
内容の変化を示す図、第8図は第6図又は第7図
の如く変化するレジスタの内容によりアクセスさ
れるメモリ内のデータを示す図である。 10,20,30,40,50…それぞれバン
ドル(バスの束)、100…グローバル・メモ
リ・ユニツト、200…コントロール・プロセツ
サ・ユニツト、210…ローカル・プログラム・
メモリ、220…プログラム実行ユニツト、30
0…アレイプロセツサ・ユニツト、310…ロー
カル・データ・メモリ、320…アレイ演算実行
ユニツト、400…外部インターフエース・ユニ
ツト、10a〜10d…データバス、11…メモ
リ・アドレス信号線、12…リクエスト・アドレ
ス信号線、13…REQ線、120a〜120h
…メモリ・モジユール、121…メモリ部、12
2…アクセス制御回路、130…アドレス生成回
路、131…レジスタAR、132…アキユムレ
ータBR、133…レジスタCR、134…レジス
タMAR、135…加算器。なお、図中同一符号
は同一又は相当部分を示す。
Claims (1)
- 【特許請求の範囲】 1 アレイ・データ、スカラ・データ、およびプ
ログラムを記憶するためのグローバル・メモリ・
ユニツトと、 このグローバル・メモリ・ユニツトにデータ・
バスを介して接続され、実行プログラムおよびこ
れに関係したデータを記憶するためのローカル・
プログラム・メモリと、前記実行プログラムを実
行するプログラム実行ユニツトとを有するコント
ロールプロセツサユニツトと、 前記グローバル・メモリ・ユニツトにデータ・
バスを介して接続され、かつ、前記コントロー
ル・プロセツサ・ユニツトと制御バスを介して接
続され、アレイ演算に用いるアレイ・データを記
憶するためのローカル・データ・メモリおよびア
レイ演算を行なうためのアレイ演算実行ユニツト
を有し、前記コントロール・プロセツサ・ユニツ
トで実行された命令によつて前記制御バスを介し
て制御されるアレイ演算を実行するアレイ・プロ
セツサ・ユニツトと、 入出力装置を接続することができ、前記グロー
バル・メモリ・ユニツトとデータ・バスを介して
接続され、また、前記コントロール・プロセツ
サ・ユニツトと制御バスを介して接続され、前記
コントロール・プロセツサ・ユニツトで実行され
た命令によつてデータの転送制御が行なわれる外
部インターフエース・ユニツトと、 を含むアレイ演算用データ処理装置において、 前記グローバル・メモリ・ユニツトを複数のメ
モリ・モジユールに分割し、この複数のメモリ・
モジユールごとにアクセス制御回路とアドレス生
成回路を設け、 このアドレス生成回路にはレジスタAR、アキ
ユムレータBR、レジスタCR、レジスタMARお
よび加算器を設け、 前記アクセス制御回路においてアクセス要求信
号(REQ)を解読し、この解読結果に応じて、
前記アドレス生成回路ではリクエストアドレス信
号線上の信号をレジスタARとアキユムレータ
BRとに設定し、又はレジスタCRに設定する手段
と、 オペレーシヨンのたびごとに前記アクセス要求
信号(REQ)を解読しその結果に応じて、前記
アドレス生成回路ではレジスタARの内容をレジ
スタMARにうつす(単一モード)か、又はアキ
ユムレータBRの内容とレジスタCRの内容を加算
した数値をアキユムレータBRとレジスタMAR
に入力し、前記アクセス制御回路からの制御があ
るまで、前記加算と加算結果のアキユムレータ
BRとレジスタMARへの格納を繰返す(連続モ
ード)かのいずれかの処理を行い、前記単一モー
ド又は連続モードのうちいずれか一方の処理の途
中に他方のモードを適時行う手段と、 前記レジスタMARの内容が変化するごとにそ
の内容をアドレス信号としてメモリにアクセスす
る手段と、 を備えたことを特徴とするアレイ演算用データ処
理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1831583A JPS59144977A (ja) | 1983-02-07 | 1983-02-07 | アレイ演算用デ−タ処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1831583A JPS59144977A (ja) | 1983-02-07 | 1983-02-07 | アレイ演算用デ−タ処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59144977A JPS59144977A (ja) | 1984-08-20 |
JPH0561675B2 true JPH0561675B2 (ja) | 1993-09-06 |
Family
ID=11968174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1831583A Granted JPS59144977A (ja) | 1983-02-07 | 1983-02-07 | アレイ演算用デ−タ処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59144977A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5819955A (ja) * | 1981-07-29 | 1983-02-05 | Toshiba Corp | 画像メモリ装置 |
-
1983
- 1983-02-07 JP JP1831583A patent/JPS59144977A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5819955A (ja) * | 1981-07-29 | 1983-02-05 | Toshiba Corp | 画像メモリ装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS59144977A (ja) | 1984-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4399503A (en) | Dynamic disk buffer control unit | |
US5832290A (en) | Apparatus, systems and method for improving memory bandwidth utilization in vector processing systems | |
US4325116A (en) | Parallel storage access by multiprocessors | |
US5434970A (en) | System for distributed multiprocessor communication | |
WO1994003860A1 (en) | Massively parallel computer including auxiliary vector processor | |
JP2002509312A (ja) | 不整列データ・アクセスを実行するためのデータ整列バッファを有するディジタル信号プロセッサ | |
JPH04343151A (ja) | メモリアクセス装置 | |
JPH0248931B2 (ja) | ||
JPS5911921B2 (ja) | 数値制御装置 | |
EP0381059A2 (en) | Arithmetic element controller | |
JPH0282330A (ja) | ムーブアウト・システム | |
JPS5832427B2 (ja) | 多重情報処理システム | |
US6647450B1 (en) | Multiprocessor computer systems with command FIFO buffer at each target device | |
JPH0561675B2 (ja) | ||
RU2066067C1 (ru) | Центральный процессор для многопроцессорной вычислительной системы | |
CN112486904A (zh) | 可重构处理单元阵列的寄存器堆设计方法及装置 | |
JP3511529B2 (ja) | 複合演算処理装置 | |
GB2039395A (en) | Processor controlled interface system | |
JPH0346862B2 (ja) | ||
JP3710798B2 (ja) | 複合演算処理装置 | |
JPS6023384B2 (ja) | アレイ・プロセツサにおける内部メモリ制御方式 | |
JP2006515446A (ja) | 関連アプリケーションを相互参照するカルテシアンコントローラを有するデータ処理システム | |
JP2647092B2 (ja) | マルチプロセツサシステム | |
JP3607548B2 (ja) | ベクトル演算装置 | |
JP3039054B2 (ja) | 画像処理装置 |