JP2731743B2 - 通信レジスタ付並列計算機 - Google Patents
通信レジスタ付並列計算機Info
- Publication number
- JP2731743B2 JP2731743B2 JP3954695A JP3954695A JP2731743B2 JP 2731743 B2 JP2731743 B2 JP 2731743B2 JP 3954695 A JP3954695 A JP 3954695A JP 3954695 A JP3954695 A JP 3954695A JP 2731743 B2 JP2731743 B2 JP 2731743B2
- Authority
- JP
- Japan
- Prior art keywords
- communication register
- register
- communication
- access
- request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Multi Processors (AREA)
Description
列計算機に関する。
る並列計算機においては主記憶装置と比較してアクセス
タイムが高速である記憶装置、または、主記憶装置と比
較してアクセススループットが大きい記憶装置、また
は、双方の利点を兼ねそろえた記憶装置を持たせること
により、各プロセッサ間の同期制御、排他制御、並びに
通信制御のための共有変数を、この記憶装置に割り当
て、各演算プロセッサはこの記憶装置にアクセスするこ
とにより、上記制御の処理時間を低減させることができ
るようになる。例えば、2個の演算プロセッサ間で、共
有変数へのリード/ライト処理を介して通信を行う場
合、アクせスタイムの速い通信レジスタを介するほう
が、主記憶装置を介するより、通信処理は高速に実行で
きる。この記憶装置を以下、通信レジスタと呼ぶことに
する。
並列計算機で実行する並列処理において、並列実行が充
分になされないところであり、高並列になるに従い、こ
れら制御の全体の性能に及ぼす影響は非常に大きくな
る。従って、これら制御の処理時間を低減することを目
的とする通信レジスタ構成が、並列計算機の性能向上に
及ぼす効果は非常に大きいものである。
相互結合網とアクセスパスで結合されており、また、通
信レジスタ装置も相互結合網とアクセスパスで結合され
ている。各演算プロセッサが発行する複数個の通信レジ
スタアクセスリクエストは相互結合網で競合調停され、
調停後選択されたリクエストのみ、通信レジスタ装置に
到達する。通信レジスタ装置に到着したリクエストは、
リクエスト内容に従い通信レジスタへ読み出し、または
書き込み処理を実行する。
信レジスタを複数個のワードから成るセットに分割し、
1つのプロセスに対し1つのセットが割り当てられる。
但し、ここでのプロセスとは複数個に分割され、並列実
行される単位(スレッドと言う)からなる1つの処理単
位である。1つのスレッドは演算プロセッサのいづれか
において実行され、複数個のスレッドが同時に複数台の
演算プロセッサで並列に実行処理される。セット内の複
数個のワードの使用方法は、各プログラムにより規定さ
れており、例えば、あるワードは排他制御の為のロック
用フラグとして用いられ、あるワードは同期制御のため
のカウンタに用いられる。また、プロセスが1つのセッ
トの通信レジスタワード数のみで足りない場合には、そ
のプロセスに複数このセットを割り当てるという処置も
ありうる。
ティングシステムに対し通信レジスタのセットを要求す
る。オペレーティングシステムはその要求に対し、ある
セットをそのプロセスに与える。実際には、そのセット
番号をプロセスに与えることになる。プロセスはセット
使用権を受け取ったならば、、各種設定を行った後、並
列実行を開始する。並列実行終了後は、その旨をオペレ
ーティングシステムに通知し、使用したセットを開放す
る。
スタ装置付並列計算機は、物理的に1個の装置として構
成された通信レジスタ装置を備え、これを1本のアクセ
スパスを介して相互結合網に接続している。
ジスタ付系列計算機では、複数個の演算プロセッサが発
行する複数個の通信レジスタアクセスのうち、通信レジ
スタ装置に同時にアクセスできるリクエストは1つに限
られる。ところが、高並列計算機においては、システム
ループレット向上の為、同時に複数個のプロセスを並行
して実行処理している。この時、各々のプロセスは使用
する通信レジスタセットは、同一の通信レジス装置内の
通信レジスタ上にある為、異なるプロセスから同時に通
信レジスタアクセスリクエストが発生した場合、相互結
合網により1つのリクエストに絞られてしまう。競合調
停で敗れたリクエストは相互競合網内でホールドされる
ことになるが、このウェイトはそのリクエストを発行し
たプロセスの実行時間を遅れさせ、並列計算機のプロセ
ス実行スループットを低下させるという問題点がある。
演算プロセッサと、主記憶装置と、前記演算プロセッサ
間の同期制御、排他制御及び通信制御の高速実行を目的
とする複数アドレスの通信レジスタ装置と、これら各装
置を結合する相互結合網より構成される通信レジスタ付
並列計算機において、前記通信レジスタ装置は、それぞ
れが独立して動作可能な複数個の装置に分割され、ま
た、前記相互結合網には、前記演算プロセッサと1:1
対応の入力ポート並びに前記主記憶装置及び前記通信レ
ジスタ装置と1:1の出力ポートを設け、さらに、前記
演算プロセッサからの前記出力ポートへの接続要求を受
けると、競合すればその調停を行うが無競合なら複数の
前記通信レジスタ装置への同時アクセスを可能とするク
ロスバー制御部を設けたことを特徴とすることを特徴と
する。
る。図1は複数個の通信レジスタ装置を持つ本発明の並
列計算機の構成例を示している。11…1nは各演算プ
ロセッサ、2は主記憶装置、30、31、…、3mは各
通信レジスタ装置、4は演算プロセッサ11〜1n、通
信レジスタ装置31〜3m及び主記憶装置2を結合する
相互結合網をそれぞれ示す。
に対し1ポートのアクセスポートを持ち、また、通信レ
ジスタ装置31〜3mも相互結合網4に対し1ポートの
アクセスポートを持つ。相互結合網4は演算プロセッサ
11〜1nに対し合計nポート、通信レジスタ装置31
〜3mに対して合計mポート、主記憶装置2に対して1
ポートのアクセスパスをもっている。アクセスポートと
一方のアクセスポートの間にはアクセスパスが張られ、
このパス上をアクセスリクエストが流れる。
ト向上を目的にアクセスポート、アクセスパスを多重に
持つ構成も考えられる。例えば、主記憶装置と相互結合
網間にn本のアクセスパスを張る構成等がある。
記憶アクセス、もしくは通信レジスタアクセスを行う場
合、リクエストを構成し、これをアクセスパスを通じて
相互結合網4に送出する。相互結合網4は複数個の演算
プロセッサから送られて来る複数個のリクエストを競合
調停し、各リクエストが行きたい主記憶装置2、通信レ
ジスタ装置にルーティングを行い、各々にアクセスパス
を通じリクエストを送出する。主記憶装置2、通信レジ
スタ装置に到着したリクエストは、各装置内でリードア
クセス処理、もしくはライトアクセス処置が実行され
る。リードアクセスの場合は、再度、相互結合網4を介
して演算プロセッサにリードデータが返却される。
定は、m個の通信レジスタ装置31〜3mのいずれかを
指定するフィールドと、通信レジスタ内ワードを指定す
るフィールドの両方が指定される。前者のフィールド長
をaビット、後者のフィールド長をbビットとした時、
通信レジスタアドレスは(a+b)ビットとなる。但
し、各通信レジスタ装置に1ワードの通信レジスタがあ
るとすると、mは2のa乗数、通信レジスタ内のワード
数は2のb乗数となる。また、(a+b)ビットのアド
レスにおいて、装置を指定するaビットが上位ビットと
なり、装置内ワードを示すbビットは下位ビットとな
る。
のフォーマットを示している。このリクエストは、アク
セス先が主記憶装置1なのか通信レジスタなのかを示す
アクセス種別フィールド201、アクセスする通信レジ
スタ装置が、どの通信レジスタ装置なのかを示すルーテ
ィングアドレスフィールド202、アクセスがロードな
のかストアなのか等を示すコードフィールド203、ア
クセスする通信レジスタ装置内の通信レジスタワードの
アドレス番地を示すアドレスフィールド204、および
データフィールド205より成る。ストアアクセスの場
合は、書き込みデータがデータフィールド205として
構成され、ロードアクセスの場合には、読みだしデータ
がリプライのデータフィールドとして構成され、リプラ
イが相互結合網4を逆向きに流れ演算プロセッサに返却
される。
ぞれの構成を示す。各通信レジスタ装置は、複数個のワ
ードより構成される通信レジスタと、通信レジスタアク
セスを制御する制御部より構成される。通信レジスタは
0番地から連続的にアドレス番号が振られている。演算
プロセッサからの通信レジスタアクセスでは、この通信
レジスタアドレスを指定することにより、アクセスする
通信レジスタのワードを決めることが出来る。
スタは主記憶装置2より高速なRAN301で構成す
る。また、このRAM301をアクセスする為に、ライ
トレジスタ302、アドレスレジスタ303及びリード
レジスタ304が備えられており、ライトイネーブル3
05及びリードイネーブル306が供給される。RAM
301にアクセスしない場合は、ライトイネーブル、リ
ードイネーブル共“0”値にする。
ライトイネーブル302を“1”値にし、ライトをする
ワードのアドレスをアドレスレジスタ303に入れ、ラ
イトするデータをライトレジスタ302に入れる。次の
タイミングで、ライトレジスタ302の値はアドレスレ
ジスタ303で指定されたワードに対しライトされる。
場合、リードイネーブル306を“1”値にし、リード
するワードのアドレスをアドレスレジスタ303に入れ
る。次のタイミングでアドレスレジスタ303で指定さ
れたワードの値は、リードレジスタへ304入れられ
る。これら、RAM周辺部の各レジスタの制御は、通信
レジスタ制御部310で制御する。
結合網4により到着するリクエストに対する処理を行
う。相互結合網4よりリクエストを受け取ったならば、
コードフィールドをデコードし、ロードアクセスなのか
ストアアクセスなのかも判断するこのデコード結果は通
信レジスタ制御部310に送られる。リプライパケット
制御部312は、リードレジスタ304内のデータをリ
プライのデータフィールド205として構成し、相互結
合網4に対スるリプライを生成する。
通信レジスタ装置内での処理方法について述べる。スカ
ラストアアクセスならば、アドレスフィールドで示され
たアドレスの通信レジスタのワードに対し、データフィ
ールド205内のデータを書き込む制御となる。即ち、
書き込むタイミングにおいて、アドレスフィールド20
4内の通信レジスタアドレスをアドレスレジスタ303
に入れる。また、データフィールド205内の書き込み
データをライトレジスタ302に入れる。同時にライト
イネーブル305を“1”値にすることにより、次のタ
イミングでスカラストアアクセスが完了する。
ィールドで示されたアドレスの通信レジスタのワードの
値を読みだし、これを、リプライのデータとし、相互結
合網4に送出する制御となる。即ち、読み出すタイミン
グにおいて、アドレスフィールド204内の通信レジス
タアドレスをアドレスレジスタ303に入れ、同時にリ
ードイネーブル306を“1”値にする。次のタイミン
グで読み出されたデータがリードレジスタ304に書き
込まれる。このリードレジスタ304の保持したデータ
に対し、リプライパケット制御部312は、リプライを
構成し相互結合網4に送出する。
では相互結合網4の基本構成としてフルクロスバースイ
ッチを用いている。相互結合網4の構成としてはバス、
リング等多くのネットワーク構成が本発明に適応できる
が、演算プロセッサAから通信レジスタ装置甲へのリク
エストと、演算プロセッサBから通信レジスタ装置乙へ
のリクエストが同時に到達した時に、競合(ブロッキン
グ)が発生しないネットワーク構成が望ましい。フルク
ロスバーは上記例においては、全くブロッキングが生じ
ない。
1)出力であり、各々n個の演算プロセッサと、mこの
通信レジスタ装置、主記憶装置に接続される。401、
402、…40nはn個の入力ポート、411、412
…41nは入力バッファを示している。421、422
…42nは入力ポートから来るリクエストと入力バッフ
ァ411〜41nからのリクストを選択する2ウェイの
セレクタである。430、431…43mはnウェイの
セレクタ、440、441…44nは(m+1)個の出
力ポートを示している。450はクロスバー制御部を示
している。本構成ではフルクロスバーの構成として入力
バッファが他のフルクロスバーを採用しているが、各種
構成のフルクロスバースイッチも本発明に適用可能であ
る。
トルーティング処理について述べる。入力ポートよりリ
クエストが到着したならば、リクエストのルーティンブ
アドレスフィールド202をクロスバー制御部450に
送る。このフィールドには(m+1)この出力ポートの
うち、どの出力ポートに通過したいかが書かれている。
クロスバー制御部450は同一の出力ポートに対しポー
トの優先度に従い1つのリクエストを選択する。選択し
た入力ポート番号は、その出力ポート対応のnウェイセ
レクタのセレクト信号として送られ、選択されたリクス
トはNウェイにセレクタを通過し、出力ポートに達す
る。
ファに一時的に格納され、次のタイミングで再度クロス
バー制御部450に対しリクエスト通過要求を出す。ク
ロスバー制御部450は、故意にあるポートのリクエス
ト通過を遅れさせることがないように公平なポート優先
度を持つ必要がある。クロスバー制御部450は各出力
への接触要求に対し、独立活動時に競合調停制御可能な
構成をとる。例えば、あるタイミングにおいて、入力ポ
ート#0からのリクエストが出力ポート#1の通過要求
し、入力ポート#1からのリクエストが出力ポートと#
0の通過要求を同時に出したとしても、リクエスト制御
部はこの2つのリクエスト同時に通過させる。従って、
各nウェイセレクタも独立に同時動作可能な構成となっ
ている。
顕著に見られる。オペーレーティングシステム、ユーザ
プログラムでの通信レジスタアクセスの最適化を十分行
えば、異なるプロセス間の通信レジスタアクセスの競合
を全く無くすことも可能であり、競合発生時に生じるア
クセスの待ちも生じなくなり、通信レジスタアクセスの
ターンアランドタイムの短縮につながる。従って、通信
レジスタアクセスを行う同期制御、排他制御、通信制御
の処理時間の短縮となり、これをルーチンとして利用す
る各システムプログラム、ユーザプログラムの実行時間
と短縮となる。また、この効果は並列計算機システムの
プロセス実行スループット向上にも貢献する。
示す図である。。
のフォーマットを示す図である。
る。
Claims (2)
- 【請求項1】 複数の演算プロセッサと、主記憶装置
と、前記演算プロセッサ間の同期制御、排他制御及び通
信制御の高速実行を目的とする複数アドレスの通信レジ
スタ装置と、これら各装置を結合する相互結合網より構
成される通信レジスタ付並列計算機において、 前記通信レジスタ装置は、それぞれが独立して動作可能
な複数個の装置に分割され、 また、前記相互結合網には、前記演算プロセッサと1:
1対応の入力ポート並びに前記主記憶装置及び前記通信
レジスタ装置と1:1の出力ポートを設け、さらに、前
記演算プロセッサからの前記出力ポートへの接続要求を
受けると、競合すればその調停を行うが無競合なら複数
の前記通信レジスタ装置への同時アクセスを可能とする
クロスバー制御部を設けたことを特徴とすることを特徴
とする通信レジスタ付並列計算機。 - 【請求項2】 前記主記憶装置と前記相互結合網との間
に、前記演算プロセッサと同数のポートを設けたことを
特徴とする請求項1記載の通信レジスタ付並列計算機。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3954695A JP2731743B2 (ja) | 1995-02-28 | 1995-02-28 | 通信レジスタ付並列計算機 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3954695A JP2731743B2 (ja) | 1995-02-28 | 1995-02-28 | 通信レジスタ付並列計算機 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08235140A JPH08235140A (ja) | 1996-09-13 |
JP2731743B2 true JP2731743B2 (ja) | 1998-03-25 |
Family
ID=12556061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3954695A Expired - Fee Related JP2731743B2 (ja) | 1995-02-28 | 1995-02-28 | 通信レジスタ付並列計算機 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2731743B2 (ja) |
-
1995
- 1995-02-28 JP JP3954695A patent/JP2731743B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08235140A (ja) | 1996-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1345125B1 (en) | Dynamic random access memory system with bank conflict avoidance feature | |
US7369133B1 (en) | Apparatus, system, and method for a partitioned memory for a graphics system | |
EP0380851B1 (en) | Modular crossbar interconnections in a digital computer | |
US7032046B2 (en) | Resource management device for managing access from bus masters to shared resources | |
US6895482B1 (en) | Reordering and flushing commands in a computer memory subsystem | |
US6704821B2 (en) | Arbitration method and circuit architecture therefore | |
US5168570A (en) | Method and apparatus for a multiple request toggling priority system | |
EP0334954B1 (en) | Layered network | |
JP4566738B2 (ja) | コンピュータメモリ装置 | |
JPH09172460A (ja) | パケット交換コンピュータ・システムにおける高速転送スレーブ要求の方法および装置 | |
US5371893A (en) | Look-ahead priority arbitration system and method | |
EP0532542B1 (en) | Multiprocessor system with sharing of memory | |
US7512729B2 (en) | Method and apparatus for a high efficiency two-stage rotating priority arbiter with predictable arbitration latency | |
JPH0786861B2 (ja) | 共用メモリ・マルチプロセツサ・システム | |
US5890220A (en) | Address conversion apparatus accessible to both I/O devices and processor and having a reduced number of index buffers | |
JP2731742B2 (ja) | クラスタ構成の並列計算機 | |
US6801985B1 (en) | Data bus using synchronous fixed latency loop including read address and data busses and write address and data busses | |
US6249855B1 (en) | Arbiter system for central processing unit having dual dominoed encoders for four instruction issue per machine cycle | |
JP2731743B2 (ja) | 通信レジスタ付並列計算機 | |
JP2005527030A (ja) | ストール機能を有する疑似マルチポートデータメモリ | |
JPH06195313A (ja) | コンピュータシステムおよびそれに適した集積回路並びに要求選択回路 | |
JP2618223B2 (ja) | シングルチツプマイクロコンピユータ | |
US20030018859A1 (en) | Arbitration in local system for access to memory in a distant subsystem | |
JP2853652B2 (ja) | プロセッサ間通信におけるパケット送信方法およびその装置 | |
JPH0330175B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19971202 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071219 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081219 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091219 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091219 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101219 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101219 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111219 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111219 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121219 Year of fee payment: 15 |
|
LAPS | Cancellation because of no payment of annual fees |