JP2731743B2 - 通信レジスタ付並列計算機 - Google Patents

通信レジスタ付並列計算機

Info

Publication number
JP2731743B2
JP2731743B2 JP3954695A JP3954695A JP2731743B2 JP 2731743 B2 JP2731743 B2 JP 2731743B2 JP 3954695 A JP3954695 A JP 3954695A JP 3954695 A JP3954695 A JP 3954695A JP 2731743 B2 JP2731743 B2 JP 2731743B2
Authority
JP
Japan
Prior art keywords
communication register
register
communication
access
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3954695A
Other languages
English (en)
Other versions
JPH08235140A (ja
Inventor
憲行 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP3954695A priority Critical patent/JP2731743B2/ja
Publication of JPH08235140A publication Critical patent/JPH08235140A/ja
Application granted granted Critical
Publication of JP2731743B2 publication Critical patent/JP2731743B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は通信レジスタ装置付き並
列計算機に関する。
【0002】
【従来の技術】複数個の演算プロセッサにより構成され
る並列計算機においては主記憶装置と比較してアクセス
タイムが高速である記憶装置、または、主記憶装置と比
較してアクセススループットが大きい記憶装置、また
は、双方の利点を兼ねそろえた記憶装置を持たせること
により、各プロセッサ間の同期制御、排他制御、並びに
通信制御のための共有変数を、この記憶装置に割り当
て、各演算プロセッサはこの記憶装置にアクセスするこ
とにより、上記制御の処理時間を低減させることができ
るようになる。例えば、2個の演算プロセッサ間で、共
有変数へのリード/ライト処理を介して通信を行う場
合、アクせスタイムの速い通信レジスタを介するほう
が、主記憶装置を介するより、通信処理は高速に実行で
きる。この記憶装置を以下、通信レジスタと呼ぶことに
する。
【0003】これら同期制御、排他制御、通信制御は、
並列計算機で実行する並列処理において、並列実行が充
分になされないところであり、高並列になるに従い、こ
れら制御の全体の性能に及ぼす影響は非常に大きくな
る。従って、これら制御の処理時間を低減することを目
的とする通信レジスタ構成が、並列計算機の性能向上に
及ぼす効果は非常に大きいものである。
【0004】並列計算機において、各演算プロセッサは
相互結合網とアクセスパスで結合されており、また、通
信レジスタ装置も相互結合網とアクセスパスで結合され
ている。各演算プロセッサが発行する複数個の通信レジ
スタアクセスリクエストは相互結合網で競合調停され、
調停後選択されたリクエストのみ、通信レジスタ装置に
到達する。通信レジスタ装置に到着したリクエストは、
リクエスト内容に従い通信レジスタへ読み出し、または
書き込み処理を実行する。
【0005】通常、通信レジスタの使用方法として、通
信レジスタを複数個のワードから成るセットに分割し、
1つのプロセスに対し1つのセットが割り当てられる。
但し、ここでのプロセスとは複数個に分割され、並列実
行される単位(スレッドと言う)からなる1つの処理単
位である。1つのスレッドは演算プロセッサのいづれか
において実行され、複数個のスレッドが同時に複数台の
演算プロセッサで並列に実行処理される。セット内の複
数個のワードの使用方法は、各プログラムにより規定さ
れており、例えば、あるワードは排他制御の為のロック
用フラグとして用いられ、あるワードは同期制御のため
のカウンタに用いられる。また、プロセスが1つのセッ
トの通信レジスタワード数のみで足りない場合には、そ
のプロセスに複数このセットを割り当てるという処置も
ありうる。
【0006】プロセスが実行を開始する場合、オペレー
ティングシステムに対し通信レジスタのセットを要求す
る。オペレーティングシステムはその要求に対し、ある
セットをそのプロセスに与える。実際には、そのセット
番号をプロセスに与えることになる。プロセスはセット
使用権を受け取ったならば、、各種設定を行った後、並
列実行を開始する。並列実行終了後は、その旨をオペレ
ーティングシステムに通知し、使用したセットを開放す
る。
【0007】以上のような機能を有する従来の通信レジ
スタ装置付並列計算機は、物理的に1個の装置として構
成された通信レジスタ装置を備え、これを1本のアクセ
スパスを介して相互結合網に接続している。
【0008】
【発明が解決しようとする課題】上述した従来の通新レ
ジスタ付系列計算機では、複数個の演算プロセッサが発
行する複数個の通信レジスタアクセスのうち、通信レジ
スタ装置に同時にアクセスできるリクエストは1つに限
られる。ところが、高並列計算機においては、システム
ループレット向上の為、同時に複数個のプロセスを並行
して実行処理している。この時、各々のプロセスは使用
する通信レジスタセットは、同一の通信レジス装置内の
通信レジスタ上にある為、異なるプロセスから同時に通
信レジスタアクセスリクエストが発生した場合、相互結
合網により1つのリクエストに絞られてしまう。競合調
停で敗れたリクエストは相互競合網内でホールドされる
ことになるが、このウェイトはそのリクエストを発行し
たプロセスの実行時間を遅れさせ、並列計算機のプロセ
ス実行スループットを低下させるという問題点がある。
【0009】
【課題を解決するための手段】本発明の装置は、複数の
演算プロセッサと、主記憶装置と、前記演算プロセッサ
間の同期制御、排他制御及び通信制御の高速実行を目的
とする複数アドレスの通信レジスタ装置と、これら各装
置を結合する相互結合網より構成される通信レジスタ付
並列計算機において、前記通信レジスタ装置は、それぞ
れが独立して動作可能な複数個の装置に分割され、ま
た、前記相互結合網には、前記演算プロセッサと1:1
対応の入力ポート並びに前記主記憶装置及び前記通信レ
ジスタ装置と1:1の出力ポートを設け、さらに、前記
演算プロセッサからの前記出力ポートへの接続要求を受
けると、競合すればその調停を行うが無競合なら複数の
前記通信レジスタ装置への同時アクセスを可能とするク
ロスバー制御部を設けたことを特徴とすることを特徴と
する。
【0010】
【実施例】以下、本発明の実施例を図を用いて説明す
る。図1は複数個の通信レジスタ装置を持つ本発明の並
列計算機の構成例を示している。11…1nは各演算プ
ロセッサ、2は主記憶装置、30、31、…、3mは各
通信レジスタ装置、4は演算プロセッサ11〜1n、通
信レジスタ装置31〜3m及び主記憶装置2を結合する
相互結合網をそれぞれ示す。
【0011】演算プロセッサ11〜1nは相互結合網4
に対し1ポートのアクセスポートを持ち、また、通信レ
ジスタ装置31〜3mも相互結合網4に対し1ポートの
アクセスポートを持つ。相互結合網4は演算プロセッサ
11〜1nに対し合計nポート、通信レジスタ装置31
〜3mに対して合計mポート、主記憶装置2に対して1
ポートのアクセスパスをもっている。アクセスポートと
一方のアクセスポートの間にはアクセスパスが張られ、
このパス上をアクセスリクエストが流れる。
【0012】また他の構成として、アクセススループッ
ト向上を目的にアクセスポート、アクセスパスを多重に
持つ構成も考えられる。例えば、主記憶装置と相互結合
網間にn本のアクセスパスを張る構成等がある。
【0013】演算プロセッサ11〜1nのいずれかが主
記憶アクセス、もしくは通信レジスタアクセスを行う場
合、リクエストを構成し、これをアクセスパスを通じて
相互結合網4に送出する。相互結合網4は複数個の演算
プロセッサから送られて来る複数個のリクエストを競合
調停し、各リクエストが行きたい主記憶装置2、通信レ
ジスタ装置にルーティングを行い、各々にアクセスパス
を通じリクエストを送出する。主記憶装置2、通信レジ
スタ装置に到着したリクエストは、各装置内でリードア
クセス処理、もしくはライトアクセス処置が実行され
る。リードアクセスの場合は、再度、相互結合網4を介
して演算プロセッサにリードデータが返却される。
【0014】通信レジスタアクセス命令でのアドレス指
定は、m個の通信レジスタ装置31〜3mのいずれかを
指定するフィールドと、通信レジスタ内ワードを指定す
るフィールドの両方が指定される。前者のフィールド長
をaビット、後者のフィールド長をbビットとした時、
通信レジスタアドレスは(a+b)ビットとなる。但
し、各通信レジスタ装置に1ワードの通信レジスタがあ
るとすると、mは2のa乗数、通信レジスタ内のワード
数は2のb乗数となる。また、(a+b)ビットのアド
レスにおいて、装置を指定するaビットが上位ビットと
なり、装置内ワードを示すbビットは下位ビットとな
る。
【0015】図2は、相互結合網4を流れるリクエスト
のフォーマットを示している。このリクエストは、アク
セス先が主記憶装置1なのか通信レジスタなのかを示す
アクセス種別フィールド201、アクセスする通信レジ
スタ装置が、どの通信レジスタ装置なのかを示すルーテ
ィングアドレスフィールド202、アクセスがロードな
のかストアなのか等を示すコードフィールド203、ア
クセスする通信レジスタ装置内の通信レジスタワードの
アドレス番地を示すアドレスフィールド204、および
データフィールド205より成る。ストアアクセスの場
合は、書き込みデータがデータフィールド205として
構成され、ロードアクセスの場合には、読みだしデータ
がリプライのデータフィールドとして構成され、リプラ
イが相互結合網4を逆向きに流れ演算プロセッサに返却
される。
【0016】図3は、通信レジスタ装置31〜3mそれ
ぞれの構成を示す。各通信レジスタ装置は、複数個のワ
ードより構成される通信レジスタと、通信レジスタアク
セスを制御する制御部より構成される。通信レジスタは
0番地から連続的にアドレス番号が振られている。演算
プロセッサからの通信レジスタアクセスでは、この通信
レジスタアドレスを指定することにより、アクセスする
通信レジスタのワードを決めることが出来る。
【0017】複数個のワードにより構成される通信レジ
スタは主記憶装置2より高速なRAN301で構成す
る。また、このRAM301をアクセスする為に、ライ
トレジスタ302、アドレスレジスタ303及びリード
レジスタ304が備えられており、ライトイネーブル3
05及びリードイネーブル306が供給される。RAM
301にアクセスしない場合は、ライトイネーブル、リ
ードイネーブル共“0”値にする。
【0018】RAM301に対してライトを行う場合、
ライトイネーブル302を“1”値にし、ライトをする
ワードのアドレスをアドレスレジスタ303に入れ、ラ
イトするデータをライトレジスタ302に入れる。次の
タイミングで、ライトレジスタ302の値はアドレスレ
ジスタ303で指定されたワードに対しライトされる。
【0019】また、RAM301に対してリードを行う
場合、リードイネーブル306を“1”値にし、リード
するワードのアドレスをアドレスレジスタ303に入れ
る。次のタイミングでアドレスレジスタ303で指定さ
れたワードの値は、リードレジスタへ304入れられ
る。これら、RAM周辺部の各レジスタの制御は、通信
レジスタ制御部310で制御する。
【0020】リクエストパケット制御部311は、相互
結合網4により到着するリクエストに対する処理を行
う。相互結合網4よりリクエストを受け取ったならば、
コードフィールドをデコードし、ロードアクセスなのか
ストアアクセスなのかも判断するこのデコード結果は通
信レジスタ制御部310に送られる。リプライパケット
制御部312は、リードレジスタ304内のデータをリ
プライのデータフィールド205として構成し、相互結
合網4に対スるリプライを生成する。
【0021】次に、各通信レジスタアクセスにおける、
通信レジスタ装置内での処理方法について述べる。スカ
ラストアアクセスならば、アドレスフィールドで示され
たアドレスの通信レジスタのワードに対し、データフィ
ールド205内のデータを書き込む制御となる。即ち、
書き込むタイミングにおいて、アドレスフィールド20
4内の通信レジスタアドレスをアドレスレジスタ303
に入れる。また、データフィールド205内の書き込み
データをライトレジスタ302に入れる。同時にライト
イネーブル305を“1”値にすることにより、次のタ
イミングでスカラストアアクセスが完了する。
【0022】スカラロードアクセスならば、アドレスフ
ィールドで示されたアドレスの通信レジスタのワードの
値を読みだし、これを、リプライのデータとし、相互結
合網4に送出する制御となる。即ち、読み出すタイミン
グにおいて、アドレスフィールド204内の通信レジス
タアドレスをアドレスレジスタ303に入れ、同時にリ
ードイネーブル306を“1”値にする。次のタイミン
グで読み出されたデータがリードレジスタ304に書き
込まれる。このリードレジスタ304の保持したデータ
に対し、リプライパケット制御部312は、リプライを
構成し相互結合網4に送出する。
【0023】図4は、相互結合網4の構成を示す。本例
では相互結合網4の基本構成としてフルクロスバースイ
ッチを用いている。相互結合網4の構成としてはバス、
リング等多くのネットワーク構成が本発明に適応できる
が、演算プロセッサAから通信レジスタ装置甲へのリク
エストと、演算プロセッサBから通信レジスタ装置乙へ
のリクエストが同時に到達した時に、競合(ブロッキン
グ)が発生しないネットワーク構成が望ましい。フルク
ロスバーは上記例においては、全くブロッキングが生じ
ない。
【0024】フルクロスバースイッチは、n入力(m+
1)出力であり、各々n個の演算プロセッサと、mこの
通信レジスタ装置、主記憶装置に接続される。401、
402、…40nはn個の入力ポート、411、412
…41nは入力バッファを示している。421、422
…42nは入力ポートから来るリクエストと入力バッフ
ァ411〜41nからのリクストを選択する2ウェイの
セレクタである。430、431…43mはnウェイの
セレクタ、440、441…44nは(m+1)個の出
力ポートを示している。450はクロスバー制御部を示
している。本構成ではフルクロスバーの構成として入力
バッファが他のフルクロスバーを採用しているが、各種
構成のフルクロスバースイッチも本発明に適用可能であ
る。
【0025】次に、本クロスバースイッチでのリクエス
トルーティング処理について述べる。入力ポートよりリ
クエストが到着したならば、リクエストのルーティンブ
アドレスフィールド202をクロスバー制御部450に
送る。このフィールドには(m+1)この出力ポートの
うち、どの出力ポートに通過したいかが書かれている。
クロスバー制御部450は同一の出力ポートに対しポー
トの優先度に従い1つのリクエストを選択する。選択し
た入力ポート番号は、その出力ポート対応のnウェイセ
レクタのセレクト信号として送られ、選択されたリクス
トはNウェイにセレクタを通過し、出力ポートに達す
る。
【0026】選択されなかったリクエストは、入力バッ
ファに一時的に格納され、次のタイミングで再度クロス
バー制御部450に対しリクエスト通過要求を出す。ク
ロスバー制御部450は、故意にあるポートのリクエス
ト通過を遅れさせることがないように公平なポート優先
度を持つ必要がある。クロスバー制御部450は各出力
への接触要求に対し、独立活動時に競合調停制御可能な
構成をとる。例えば、あるタイミングにおいて、入力ポ
ート#0からのリクエストが出力ポート#1の通過要求
し、入力ポート#1からのリクエストが出力ポートと#
0の通過要求を同時に出したとしても、リクエスト制御
部はこの2つのリクエスト同時に通過させる。従って、
各nウェイセレクタも独立に同時動作可能な構成となっ
ている。
【0027】
【発明の効果】本発明の効果は並列計算機の性能向上に
顕著に見られる。オペーレーティングシステム、ユーザ
プログラムでの通信レジスタアクセスの最適化を十分行
えば、異なるプロセス間の通信レジスタアクセスの競合
を全く無くすことも可能であり、競合発生時に生じるア
クセスの待ちも生じなくなり、通信レジスタアクセスの
ターンアランドタイムの短縮につながる。従って、通信
レジスタアクセスを行う同期制御、排他制御、通信制御
の処理時間の短縮となり、これをルーチンとして利用す
る各システムプログラム、ユーザプログラムの実行時間
と短縮となる。また、この効果は並列計算機システムの
プロセス実行スループット向上にも貢献する。
【図面の簡単な説明】
【図1】本発明の通信レジスタ付並列計算機の構成例を
示す図である。。
【図2】本発明において相互結合網を流れるリクエスト
のフォーマットを示す図である。
【図3】本発明における通信レジスタ装置の構成図であ
る。
【図4】本発明における相互結合網の構成図である。
【符号の説明】
11,12,13…1n 演算プロセッサ 2 主記憶装置 31,32,33…3m 通信レジスタ装置 4 相互結合網 301 RAM 302 ライトレジスタ 303 アドレスレジスタ 304 リードレジスタ 305 ライトイネーブル 306 リードイネーブル 310 通信レジスタ制御部 311 リクエストパケット制御部 312 リプライパケット制御部 401〜40n 入力ポート 411〜41n 入力バッファ 421〜42n 2ウェイセレクタ 430〜43n nウェイセレクタ 441〜44n 出力ポート 450 クロスバー制御部

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の演算プロセッサと、主記憶装置
    と、前記演算プロセッサ間の同期制御、排他制御及び通
    信制御の高速実行を目的とする複数アドレスの通信レジ
    スタ装置と、これら各装置を結合する相互結合網より構
    成される通信レジスタ付並列計算機において、 前記通信レジスタ装置は、それぞれが独立して動作可能
    な複数個の装置に分割され、 また、前記相互結合網には、前記演算プロセッサと1:
    1対応の入力ポート並びに前記主記憶装置及び前記通信
    レジスタ装置と1:1の出力ポートを設け、さらに、前
    記演算プロセッサからの前記出力ポートへの接続要求を
    受けると、競合すればその調停を行うが無競合なら複数
    の前記通信レジスタ装置への同時アクセスを可能とする
    クロスバー制御部を設けたことを特徴とすることを特徴
    とする通信レジスタ付並列計算機。
  2. 【請求項2】 前記主記憶装置と前記相互結合網との間
    に、前記演算プロセッサと同数のポートを設けたことを
    特徴とする請求項1記載の通信レジスタ付並列計算機。
JP3954695A 1995-02-28 1995-02-28 通信レジスタ付並列計算機 Expired - Fee Related JP2731743B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3954695A JP2731743B2 (ja) 1995-02-28 1995-02-28 通信レジスタ付並列計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3954695A JP2731743B2 (ja) 1995-02-28 1995-02-28 通信レジスタ付並列計算機

Publications (2)

Publication Number Publication Date
JPH08235140A JPH08235140A (ja) 1996-09-13
JP2731743B2 true JP2731743B2 (ja) 1998-03-25

Family

ID=12556061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3954695A Expired - Fee Related JP2731743B2 (ja) 1995-02-28 1995-02-28 通信レジスタ付並列計算機

Country Status (1)

Country Link
JP (1) JP2731743B2 (ja)

Also Published As

Publication number Publication date
JPH08235140A (ja) 1996-09-13

Similar Documents

Publication Publication Date Title
EP1345125B1 (en) Dynamic random access memory system with bank conflict avoidance feature
US7369133B1 (en) Apparatus, system, and method for a partitioned memory for a graphics system
EP0380851B1 (en) Modular crossbar interconnections in a digital computer
US7032046B2 (en) Resource management device for managing access from bus masters to shared resources
US6895482B1 (en) Reordering and flushing commands in a computer memory subsystem
US6704821B2 (en) Arbitration method and circuit architecture therefore
US5168570A (en) Method and apparatus for a multiple request toggling priority system
EP0334954B1 (en) Layered network
JP4566738B2 (ja) コンピュータメモリ装置
JPH09172460A (ja) パケット交換コンピュータ・システムにおける高速転送スレーブ要求の方法および装置
US5371893A (en) Look-ahead priority arbitration system and method
EP0532542B1 (en) Multiprocessor system with sharing of memory
US7512729B2 (en) Method and apparatus for a high efficiency two-stage rotating priority arbiter with predictable arbitration latency
JPH0786861B2 (ja) 共用メモリ・マルチプロセツサ・システム
US5890220A (en) Address conversion apparatus accessible to both I/O devices and processor and having a reduced number of index buffers
JP2731742B2 (ja) クラスタ構成の並列計算機
US6801985B1 (en) Data bus using synchronous fixed latency loop including read address and data busses and write address and data busses
US6249855B1 (en) Arbiter system for central processing unit having dual dominoed encoders for four instruction issue per machine cycle
JP2731743B2 (ja) 通信レジスタ付並列計算機
JP2005527030A (ja) ストール機能を有する疑似マルチポートデータメモリ
JPH06195313A (ja) コンピュータシステムおよびそれに適した集積回路並びに要求選択回路
JP2618223B2 (ja) シングルチツプマイクロコンピユータ
US20030018859A1 (en) Arbitration in local system for access to memory in a distant subsystem
JP2853652B2 (ja) プロセッサ間通信におけるパケット送信方法およびその装置
JPH0330175B2 (ja)

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19971202

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071219

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101219

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees