JP2003076670A - ネットワーク装置およびプロセッシングシステム - Google Patents

ネットワーク装置およびプロセッシングシステム

Info

Publication number
JP2003076670A
JP2003076670A JP2002151849A JP2002151849A JP2003076670A JP 2003076670 A JP2003076670 A JP 2003076670A JP 2002151849 A JP2002151849 A JP 2002151849A JP 2002151849 A JP2002151849 A JP 2002151849A JP 2003076670 A JP2003076670 A JP 2003076670A
Authority
JP
Japan
Prior art keywords
memory
communication
port
processing
processing elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002151849A
Other languages
English (en)
Inventor
Mitsumasa Koyanagi
光正 小柳
Hiroyuki Kurino
浩之 栗野
Hiroshi Sato
浩 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VISUAL TECHNOLOGY KK
Tohoku Techno Arch Co Ltd
Koyanagi Mitsumasa
Original Assignee
VISUAL TECHNOLOGY KK
Tohoku Techno Arch Co Ltd
Koyanagi Mitsumasa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by VISUAL TECHNOLOGY KK, Tohoku Techno Arch Co Ltd, Koyanagi Mitsumasa filed Critical VISUAL TECHNOLOGY KK
Priority to JP2002151849A priority Critical patent/JP2003076670A/ja
Publication of JP2003076670A publication Critical patent/JP2003076670A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Memory System (AREA)
  • Small-Scale Networks (AREA)

Abstract

(57)【要約】 【課題】 簡易な構成で高速に通信ノード間の通信を行
う。 【解決手段】 ローカルポート212〜215にはプロ
セッシングエレメント301〜304が接続され、リモ
ートポート216a、216bには外部ノードが接続さ
れる。ローカルポート212〜215は共通にブロード
キャストメモリ201に接続され、1の通信ノードから
のメッセージが他の通信ノードにブロードキャストされ
る。さらに各ローカルポートはピア・ツー・ピアメモリ
206〜211により1対1に接続され、相互にメッセ
ージの交換を行う。外部ノードはリモートポート216
aを介してリモート通信用メモリ202〜205に書き
込みを行い、対応するローカルポートへ1対1で通信処
理を行い、またブロードキャストメモリ201を用いて
ローカルポート212〜215にブロードキャスト通信
を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、複数の通信ノー
ドを接続するネットワーク装置に関し、とくに、通信ノ
ード間に配されたメモリを用いて高速に通信を行えるよ
うにするものである。
【0002】
【従来の技術】近年、多数のワークステーションをネッ
トワークで結合したいわゆる超並列クラスタが実用化さ
れつつある。しかし、このようなクラスタにおいてはネ
ットワークの通信速度が遅く、このネットワークが高速
処理のボトルネックとなっていた。多くのネットワーク
には現在広く普及しているイーサネット(登録商標)が
用いられ、その速度はせいぜい100Mbps(Mbi
t/sec)あるいは1Gbps程度である。100M
bpsのイーサネット機器を用いた場合比較的安価にシ
ステムを構築することができる反面、十分な速度を実現
できない。他方、1Gbpsのイーサネット機器を用い
た場合には比較的速度を上げることができるが、システ
ムが非常に高価になる。また、どちらを用いた場合にも
ワークステーション単体を多数並べるため設置面積や重
量、消費電力の問題が無視できない。
【0003】
【発明が解決する課題】この発明は、以上の事情を考慮
してなされたものであり、通信ノード間を安価にかつ高
速に結合することを目的としている。
【0004】
【課題を解決するための手段】この発明によれば、上述
の目的を達成するために、特許請求の範囲に記載のとお
りの構成を採用している。すなわち、この発明に第1の
側面によれば、ネットワーク装置に、複数の通信ポート
と、上記複数の通信ポートから読み出し書き込みを行え
る第1のメモリと、上記複数の通信ポートのサブセット
から読み出し書き込みを行える第2のメモリとを設けて
いる。
【0005】この構成においては、メモリを用いて通信
ポートを相互接続するようにしているので簡易に通信ノ
ードを相互接続することができ、並列処理クラスタを始
めとして種々のコンピュータシステムを簡単な構成で実
現できる。しかもメモリへのアクセスは高速に行えるの
で通信速度を向上させることができる。
【0006】なお、第1のメモリおよび第2のメモリの
アクセスは、例えば、通信ポートを介してこのネットワ
ーク装置に接続されるCPUまたはDMA(ダイレクト
メモリアクセス)により行われる。このアクセスは、主
メモリとI/O装置とを同一の態様でアクセスするメモ
リマップドI/O方式で行うことができる。そして、第
1のメモリおよび第2のメモリのメモリ空間をI/O装
置のアドレス空間に割り当てるようにすることができ
る。この場合、第1のメモリおよび第2のメモリは、通
常のI/O装置と同様にコヒーレンシを考慮することな
く書きこまれる。第1のメモリおよび第2のメモリを、
主メモリのアドレス空間に割り当て、主メモリあるいは
その一部として用いることもできる。また、主メモリと
I/O装置とに個別にメモリ空間を割り当てる通常のア
ドレス方式を用いてもよい。
【0007】また上述の構成において、複数の通信ポー
トのサブセットは2つの通信ポートからなってもよい
し、3つ以上の通信ポートからなってもよい。
【0008】また、上記第1のメモリおよび第2のメモ
リは複数の読み出し/書き込みポートを有してもよい。
【0009】また、上記第1のメモリおよび第2のメモ
リはそれぞれ複数のメモリを多重に保持してもよい。
【0010】また、上述のネットワーク装置の複数の通
信ポートの各々に、プロセッシングエレメントを接続し
てプロセッシングシステムを構築してもよい。
【0011】また、この発明の他の側面によれば、上述
の目的を達成するために、プロセッシングシステムに、
複数のプロセッシングエレメントと、上記複数のプロセ
ッシングエレメントがそれぞれ接続される複数の第1の
通信ポートと、外部機器が接続される少なくとも1つの
第2の通信ポートと、上記第1の通信ポートのすべてか
ら読み出し書き込みを行える第1のメモリと、上記第1
の通信ポートのサブセットから読み出し書き込みを行え
る第2のメモリと、上記第1の通信ポートの1つから読
み出しを行え上記第2の通信ポートの1つから書き込み
を行える第3のメモリとを設けるようにしている。
【0012】この構成によれば、メモリを用いてポート
を相互接続するようにしているので簡易に通信ノードを
相互接続することができ、並列処理クラスタを始めとし
て種々のコンピュータシステムを簡単な構成で実現でき
る。しかも、外部接続用の第2の通信ポートを設けてい
るので外部のリソースと協同してより複雑なコンピュー
タシステムを実現できる。外部から送られてくるデータ
は第2の通信ポートを介して第3のメモリに書き込ま
れ、内部のプロセッシングエレメントが第3のメモリか
ら読み出しを行って受信を行う。
【0013】この構成において上記第2のポートから上
記第1のメモリに書き込みを行ってもよい。このように
すれば、外部から内部のプロセッシングエレメントにブ
ロードキャストを行える。
【0014】もちろん、上述第2の通信ポート以外に外
部機器と接続する通信ポートを用意し、このポートが第
1のメモリには書き込みを行わず、第3のメモリにのみ
書き込みを行うようにしてもよい。この通信ポートは、
プロセッシングエレメントが外部機器と、ピア・ツー・
ピアで通信する場合に用いることができる。
【0015】また、上記のように構成したプロセッシン
グシステムをスイッチ手段で接続して複合プロセッシン
グシステムを構成するようにしてもよい。
【0016】
【発明の実施の態様】以下、この発明の実施例について
説明する。
【0017】図1は、この発明の実施例のプロセッシン
グシステム100を全体として示しており、この図にお
いて、プロセッシングシステム100はネットワーク装
置200、複数のプロセッシングエレメント301〜3
04を含んで構成されている。プロセッシングエレメン
ト301〜304は、図2に示すように、マイクロプロ
セッサ305、外部キャッシュメモリ306、主メモリ
307、システムロジック308を含んで構成されてい
る。
【0018】ネットワーク装置200は全体として1つ
のチップに実装され、プロセッシングシステム100を
実装するボード上に配置されている。ネットワーク装置
200とプロセッシングエレメント301〜304とは
プロセッシングシステム100のボード上にコネクタを
介して結合される。
【0019】図1において、ネットワーク装置200
は、ブロードキャストメモリ201、リモート通信用メ
モリ202〜205、ピア・ツー・ピアメモリ206〜
211、ローカルポート212〜215、入力用リモー
トポート216a、出力用リモートポート216bを含
んで構成されている。ローカルポート212〜215に
はプロセッシングエレメント301〜304が接続され
ている。リモートポート216a、216bには外部シ
ステム(図示しない。他の同様なプロセッシングシステ
ムまたは他のタイプの通信システムで構成できる)が接
続される。入力用リモートポート216aは外部システ
ムからのデータを外部通信用メモリ202〜205へ書
きこむのに用いられる。出力用リモートポート216b
はプロセッシングエレメント301〜304から外部シ
ステムにデータを送信するのに用いられる。
【0020】なお、この実施例において、プロセッシン
グシステム100と外部システムとの間の基本的な処理
は通信処理(データの送受信)である。この通信処理
は、一方のシステムから他方のシステムのメモリへデー
タを書き込み、このデータをその一方のシステムのプロ
セッシングエレメントが読み出すことにより実行され
る。一方のシステムが他方のシステムに返信を送りたい
場合には一方のシステムから他方のシステムのメモリに
書き込みを行う。受信を行う場合に、受信を行うシステ
ムが他方のシステムのメモリから読み出しを行う必要が
ない。もちろん、管理情報を取得する等の目的で他のシ
ステムのメモリから読み出しを行うようにしてもよい。
【0021】ローカルポート212〜215はプロセッ
シングエレメント301〜304をネットワーク装置2
00に結合する。入力用リモートポート216a、出力
用リモートポート216bにはコネクタ(図示しない)
により外部システムが着脱可能に接続される。
【0022】ブロードキャストメモリ201は、ローカ
ルポート212〜215に接続された通信ノードすなわ
ちプロセッシングエレメント301〜304から読み出
し書き込みが行えるようになっている。入力用リモート
ポート216aからブロードキャストメモリ201へ
は、書き込みのみが行われる。ローカルポート212〜
215および入力用リモートポート216aから書き込
まれたデータはローカルポート212〜215(プロセ
ッシングエレメント310〜304)すべてにブロード
キャストされる。
【0023】リモート通信用メモリ202に対しては、
入力用リモートポート216aから書き込みが行われ、
ローカルポート212(プロセッシングエレメント30
1)から読み出しが行われるようになっている。こうし
てリモート通信用メモリ202により入力用リモートポ
ート216aからローカルポート212への通信が行わ
れる。リモート通信用メモリ203、204、205も
同様に接続され、それぞれにより、入力用リモートポー
ト216aからローカルポート213、214、215
への通信が行われる。
【0024】ピア・ツー・ピアメモリ206に対しては
ローカルポート212、213(プロセッシングエレメ
ント301、302)から読み出し書き込みが行われる
ようになっている。こうしてピア・ツー・ピアメモリ2
06により、ローカルポート212、213の間で相互
に通信が行える。ピア・ツー・ピアメモリ207、20
8、209、210、211も同様に接続される。そし
てピア・ツー・ピアメモリ207、208、209、2
10、211によりローカルポート212、214(プ
ロセッシングエレメント301、303)の間、ローカ
ルポート213、214(プロセッシングエレメント3
02、303)の間、ローカルポート213、215
(プロセッシングエレメント302、304)の間、ロ
ーカルポート214、215(プロセッシングエレメン
ト303、304)の間でそれぞれ相互に通信が行われ
る。
【0025】図3は、プロセッシングエレメント301
〜304のマイクロプロセッサ305のアドレス空間を
示している。このアドレス空間はメモリマップトI/O
方式を採用したものであり、主メモリのアドレス空間と
I/Oアドレス空間とを統一して扱っている。図3にお
いて、アドレス空間は主メモリアドレス空間401およ
びI/Oアドレス空間402からなり、I/Oアドレス
空間402にブロードキャスト領域403、第1ローカ
ルポート領域404、第2ローカルポート領域405、
第3ローカルポート領域406、第4ローカルポート領
域407、リモートポートウインドウ領域408および
他のI/O装置領域409が割り当てられている。な
お、リモートポートウインドウ領域408は外部システ
ムからデータを受け取るためのものである。リモートポ
ートウインドウ408にかえてプロセッシングエレメン
ト301〜304ごとにアクセス用の空間を割り当てる
ようにしてもよい。
【0026】図4は、プロセッシングエレメント301
〜304の各々において、ブロードキャスト領域40
3、第1〜第4ローカルポート領域404〜407、リ
モートポートウインドウ領域408をアドレス指定した
ときにどのリソースが選択されるかを示している。この
選択はシステムロジック308(図3)のアドレス機構
が行う。
【0027】図4に示すように、いずれのプロセッシン
グエレメント301〜304においても、ブロードキャ
スト領域403をアドレス指定したときにはブロードキ
ャストメモリ201が選択される。ブロードキャストメ
モリ201のどのアドレスをアクセスするかはプロセッ
シングエレメント301〜304のデバイスドライバが
管理する。他のメモリ202〜211についても同様で
ある。
【0028】他方、第1〜第4ローカルポート領域40
4〜407はプロセッシングエレメント301〜304
ごとに異なるメモリ206〜211を選択する。例え
ば、プロセッシングエレメント301においては、第2
ローカルポート領域405、第3ローカルポート領域4
06、第4ローカルポート領域407のアドレス指定に
よりそれぞれピア・ツー・ピアメモリ206、207、
208が選択される。プロセッシングエレメント302
においては、第1ローカルポート領域404、第3ロー
カルポート領域406、第4ローカルポート領域407
のアドレス指定によりそれぞれピア・ツー・ピアメモリ
206、209、210が選択される。プロセッシング
エレメント303においては、第1ローカルポート領域
404、第2ローカルポート領域405、第4ローカル
ポート領域407のアドレス指定によりそれぞれピア・
ツー・ピアメモリ207、209、211が選択され
る。プロセッシングエレメント304においては、第1
ローカルポート領域404、第2ローカルポート領域4
05、第3ローカルポート領域406のアドレス指定に
よりそれぞれピア・ツー・ピアメモリ208、210、
211が選択される。
【0029】リモートポートウインドウ408もプロセ
ッシングエレメント301〜304ごとに異なるリモー
ト通信用メモリ202〜205を選択する。すなわち、
プロセッシングエレメント301〜304のそれぞれに
おいて、リモートポートウインドウ408のアドレス指
定によりリモート通信用メモリ202〜205のそれぞ
れが選択される。なお、外部システムへの送信は出力用
リモートポート216bを介してI/Oアクセス手順に
より実行される。
【0030】なお、図4に「×」で示すように、プロセ
ッシングエレメント301において第1ローカルポート
領域404は自分宛てであることを示しており、使用し
ない。同様にプロセッシングエレメント302、30
3、304において第2ローカルポート領域405、第
3ローカルポート領域406、第4ローカルポート領域
407はそれぞれ使用しない。
【0031】このようにブロードキャストメモリ20
1、リモート通信用メモリ202〜205、ピア・ツー
・ピアメモリ206〜211のそれぞれのアドレス空間
をI/Oアドレス空間402に割り当てているので、プ
ロセッシングエレメント301〜304のマイクロプロ
セッサ305のメモリ管理機構と無関係にそれらメモリ
への書き込みが行える。このため、これらメモリ管理機
構と無関係にデータを送信でき、すなわち、メモリ20
1〜211への書き込みを行え、こののち、関連するマ
イクロプロセッサ305が主メモリ307にメモリ20
1〜211からデータを取り込む読む。ただし、通常
は、オーバーヘッドを回避するために、この操作はDM
Aで行なう。
【0032】さらに、プロセッシングエレメント301
〜304に共通なアドレスマップを採用し、他のノード
へのアクセスを同一のアドレスで指定できるのでプロセ
ッシングエレメント301〜304のソフトウェア仕様
を共通化することができる。
【0033】また、通信ノード間の複雑な手順例えばハ
ンドシェーク手順を宛先IDを用いて行ってもピア・ツ
ー・ピアメモリ206〜211、ブロードキャストメモ
リ201へのデータの書きこみ、読み出し、更新書きこ
みにより簡易に行うことができる。
【0034】図5は、図1のネットワーク装置200の
より具体的な構成を示している。図5において図1と対
応する箇所には対応する符号を付した。図5において、
ブロードキャストメモリ201は単一書き込みポート/
5読み出しポート構成のSRAM(スタティックランダ
ムアクセスメモリ)からなっており、64ビットのデー
タラインおよび32ビットのアドレス/コマンドライン
が接続されている。リモート通信用メモリ202〜20
5、ピア・ツー・ピアメモリ206〜211はデュアル
ポート構成のSRAMからなっている。入力用リモート
ポート216a(図1参照)、プロセッシングエレメン
ト301、302…はインタフェース216c、212
a、213a…を介してデータライン、アドレス/コマ
ンドラインに接続されている。インタフェース216
c、212a、213a…はクロック等をバッファする
ものである。
【0035】ブロードキャストメモリ201の書き込み
にはアービタ220を用いて調停を行うようになってい
る。221、222はバスコントロールロジックであ
る。223は出力用リモートポート216bをなす出力
ドライブ回路である。
【0036】なお、図5に示すような通常の複数ポート
のメモリを用いる変わりに、図6に示すような複数のメ
モリプレーン231〜234と対応するセンスアンプア
レイ235〜238とを設け、メモリプレーン231〜
234に重複してデータを書き込みようにしてもよい。
図6では4つのメモリプレーン231〜234を示して
いるが、本実施例のブロードキャストメモリ201に用
いる場合には5枚のメモリプレーンが必要となり、リモ
ート通信用メモリ202〜205、ピア・ツー・ピアメ
モリ206〜211に適用する場合には2枚のメモリプ
レーンが必要となる。
【0037】図6の構成では、センスアンプアレイ23
5〜238に同一のデータが実質的に同時に供給され
る。通常のメモリ構成のバスによるボトルネックがなく
なる。
【0038】以上説明した実施例によればブロードキャ
ストメモリ201を用いてローカルポート212〜21
5に接続されたプロセッシングエレメント301〜30
4やリモートポート216a、216bに接続されたシ
ステムあるいは通信ノードとの間で相互通信が簡易に行
える。また、リモート通信用メモリ202〜205、ピ
ア・ツー・ピアメモリ206〜211を用いて対応する
1対1の通信が簡易に行える。しかも各プロセッシング
エレメント301〜304は実メモリアドレスで直接に
対応する通信を行うことができる。
【0039】なお、メモリ201〜211としてSRA
MにかえてDRAM(ダイナミックランダムアクセスメ
モリ)等他の半導体メモリを用いることができる。
【0040】図7は、上述実施例のプロセッシングシス
テム100を複数連結した複合通信システムを示してい
る。図7において、複合通信システム500は複数のプ
ロセッシングシステム100とスイッチ600とマスタ
I/Oマネージャ700とを含んで構成されている。図
8に示すように、スイッチ600はスイッチマトリクス
601およびシステムI/Oバス602により構成さ
れ、出力ポート603および入力ポート604が対応す
るプロセッシングシステム100に接続されている。シ
ステムI/Oバス602の制御データに基づいてスイッ
チングエレメント605が切り替えられて所望のプロセ
ッシングシステム100同士が接続される。
【0041】図9は外部I/O機器との接続状態を示し
ており、システムI/Oバス602と拡張バス705と
の間にマスタI/Oマネージャ700が設けられ外部機
器とのインタフェースを管理するようになっている。こ
の例では拡張バス705に2次記憶装置701、ネット
ワークインタフェースカード702、ビデオカード70
3、ポインティングデバイス704が接続されている。
【0042】以上説明したようにこの実施例によれば、
プロセッシングエレメント等の通信ノードがメモリを介
して直接に通信を行うことができる。しかも通信モード
としては他の通信ノードに一括して通信を行うブロード
キャストモードや通信ノードを1対1で連結するピア・
ツー・ピアモードを利用でき種々の通信アプリケーショ
ンに適合できる。
【0043】なお、上述の例ではブロードキャストの他
のモードとしてはピア・ツー・ピアモードとしたが、3
つの通信ノードが相互に通信するようにしてもよい。す
なわち、どのようなサブセットの構成要素同士を1のメ
モリに接続し、それらが相互通信するようにしてもよ
い。
【0044】また、上述実施例ではリモートポート21
6aがブロードキャストメモリ210に接続されている
が、図10に示すように、入力用リモートポート217
a、出力用リモートポート217bを設け、プロセッシ
ングエレメント310〜304にリモート通信用メモリ
202a〜205aを介して1対1の態様でのみ接続す
るようにしてもよい。すなわち、リモートポート217
aはブロードキャストメモリ201には接続されない。
もちろん、リモートポート216a、216b、217
a、217bおよびリモート通信用メモリ202〜20
5、202a〜05aをともに設けるようにしてもよ
い。もちろん、リモートポートを3組以上設けてもよ
い。
【0045】また、上述の例では、図3に示すように、
プロセッシングエレメント301〜304に共通の物理
アドレス空間を採用し、プロセッシングエレメント30
1〜304の各々のソフトウェアに対して共通のインタ
フェースを提供するようにしているが、図11(a)、
(b)に示すように、プロセッシングエレメント301
〜304でアドレス空間の仕様を異ならせてもよい。す
なわち、図11(a)はプロセッシングエレメント30
1のマイクロプロセッサ305の物理アドレス空間を示
しており、この図では、自分宛てアクセスに対応する第
1ローカルポート領域404を省略している。また、図
11(b)はプロセッシングエレメント302のマイク
ロプロセッサ305の物理アドレス空間を示している。
図11(b)においても、自分宛てアクセスに対応する
第2ローカルポート領域を省略している。他のプロセッ
シングエレメント303、304のマイクロプロセッサ
305の物理アドレス空間も同様に構成される。
【0046】また、この実施例では、メモリマップトI
/O方式のアドレス空間のI/Oアドレス領域にメモリ
201〜211のメモリ空間を割り当てるようにした
が、図12に示すようにメモリアドレス領域にこれらメ
モリ201〜211のメモリ空間を割り当ててもよい。
この場合、メモリコヒーレンシを考慮する必要がある。
【0047】また、図9に示したように、マスタI/O
マネージャ700を用いて2次記憶装置701、ネット
ワークインタフェースカード702、ビデオカード70
3、ポインティングデバイス704等のI/O装置を接
続するようにしたが、図13に示すように、各プロセッ
シングエレメント301〜304に拡張バス700を設
け、I/O装置を接続するようにしてもよい。この場
合、マスタI/Oマネージャ700は不要になる。
【0048】この実施例のプロセッシングシステムまた
はネットワーク装置を用いてコンピュータネットワーク
スイッチ、超並列型コンピュータ、ベクトル型コンピュ
ータ、フォルトトレラントコンピュータ、データベース
検索エンジン、画像処理エンジン、高速プリンタ・コピ
ーマシン、ディスクサーバ、ウェブサーバ、電話交換
機、RAID(Redundant Array of
Inexpensive Disks)、ネットワー
ク・ルータ、ネットワーク・スイッチ等を構成すること
ができる。
【0049】上述実施例においてはつぎのような効果が
実現される。
【0050】ブロードキャストメモリにより1対Nの
送信を同時に行うことができる。すなわち、従来の通信
モデルではN個のノードに対して送信を行う場合N個の
送信が必要であっが、この実施例では1回の送信で済
み、通信速度にしてN倍の効果をもたらす。この場合の
ブロードキャストの対象には、ローカルのノードのみで
なく、リモートポートを介して接続されるリモートの通
信ノードも含まれる。したがって、Nの範囲は容易に数
十から数百のオーダとなり、より多くの通信ノードに1
回のトラフィックで同時に通信でき、より通信効率が向
上する。さらに単一のメモリを介して送信するので情報
を遅滞なく伝送することが可能となる。
【0051】ピア・ツー・ピアメモリにより、ローカ
ルノード間の通信を通信相手も含めた他のノードとまっ
たく競合を発生させることなく行うことができ、通信チ
ャネルの持つ最大の速度で通信が行える。また、データ
通信がシリアルでなくメモリデータパス幅(32〜25
6ビット)程度のパラレル通信で行われるため、数百M
バイトの非常に高速な通信が実現できる。
【0052】モジュール間をスイッチマトリクスおよ
びバス構造の双方で接続することにより、高速なデータ
通信と拡張性に富むI/O構造の両立が可能となる。
【0053】バス構造そのものをチップ内に取り込む
ことによりモジュールの物理設計上大きな問題となるバ
ス構造上の信号の伝播遅延や電気的負荷容量およびそれ
らに伴う波形の乱れなどを大幅に減らすことが可能にな
り、物理設計が容易になる。
【0054】ソフトウェア開発の観点からも、各CP
Uをネットワーク上の独立ノードとすることにより、既
存の超並列演算用のソフトウェアインタフェースに基づ
いて記述されたアプリケーションソフトウェアを、ソー
スコードを変更することなく再コンパイル/リンクのみ
でそのまま実行させることが可能となる。また、オペレ
ーティングシステムもほぼネットワークドライバの変更
のみで移植可能である。
【0055】各ノード間のネットワーク空間を物理ア
ドレス上にダイレクトにマッピングすることによって通
信手順のためのオーバーヘッドを基本的になくすことが
でき、より効率的な通信が可能となる。
【0056】ノードを演算に必要な最小限のコアとし
てボード上に多数実装することによって、ノードあるい
は計算能力あたりの所要設置面積および重量がワークス
テーションの場合に比べて約1桁少なくて済む。
【0057】
【発明の効果】以上説明したように、この発明によれ
ば、メモリを用いてポートを相互接続するようにしてい
るので簡易に通信ノードを相互接続することができ、並
列処理クラスタを始めとして種々のコンピュータシステ
ムを簡単な構成で実現できる。
【図面の簡単な説明】
【図1】 この発明の実施例のプロセッシングシステム
を示すブロック図である。
【図2】 上述プロセッシングシステムのプロセッシン
グエレメントの構成を示すブロック図である。
【図3】 上述プロセッシングエレメントの実アドレス
空間を説明する図である。
【図4】 上述プロセッシングエレメントにおける宛先
とメモリとのマッピングを説明する図である。
【図5】 上述プロセッシングエレメントの具体的な構
成例を示すブロック図である。
【図6】 上述プロセッシングエレメントの他の構成例
を説明する図である。
【図7】 この発明の実施例を用いて構成した複合通信
システムを示す図である。
【図8】 上述複合通信システムのスイッチマトリック
スを示す図である。
【図9】 上述複合通信システムのマスタI/Oマネー
ジャを説明する図である。
【図10】 上述実施例の変形例を説明する図である。
【図11】 上述実施例の変形例を説明する図である。
【図12】 上述実施例の変形例を説明する図である。
【図13】 上述実施例の変形例を説明する図である。
【符号の説明】
100 プロセッシングシステム 200 ネットワーク装置 201 ブロードキャストメモリ 202〜205 リモート通信用メモリ 206〜211 ピア・ツー・ピアメモリ 212〜215 ローカルポート 216a 入力用リモートポート 216b 出力用リモートポート 301〜304 プロセッシングエレメント 305 マイクロプロセッサ 306 外部キャッシュメモリ 307 主メモリ 308 システムロジック 401 主メモリアドレス空間 402 I/Oアドレス空間 403 ブロードキャストメモリマッピング領域 404 第1ローカルポート領域 405 第2ローカルポート領域 406 第3ローカルポート領域 407 第4ローカルポート領域 408 リモートポートウインドウ領域 409 その他のI/O装置領域 500 複合通信システム 600 スイッチ 601 スイッチマトリクス 602 システムI/Oバス 603 出力ポート 604 入力ポート 700 マスタI/Oマネージャ 701 2次記憶装置 702 ネットワークインタフェースカード 703 ビデオカード 704 ポインティングデバイス 705 拡張バス
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04L 12/44 300 H04L 12/44 300 (71)出願人 599122293 ビジュアルテクノロジー株式会社 東京都港区海岸1−9−15 (71)出願人 899000035 株式会社 東北テクノアーチ 宮城県仙台市青葉区荒巻字青葉468番地 (72)発明者 小柳 光正 宮城県名取市ゆりが丘1−22−5 (72)発明者 栗野 浩之 宮城県名取市ゆりが丘2−17−9 (72)発明者 佐藤 浩 東京都杉並区阿佐谷北1−16−17 Fターム(参考) 5B014 FB04 GA04 GA43 GE04 GE07 HB28 5B045 BB17 DD02 DD03 EE08 5B060 KA02 KA06 MB02 5K033 BA05 DB12 DB14

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク装置本体の外部の装置とそ
    れぞれ通信を行うための複数の通信ポートと、 上記複数の通信ポートから読み出し書き込みを行える第
    1のメモリと、 上記複数の通信ポートのサブセットから読み出し書き込
    みを行える第2のメモリとを有することを特徴とするネ
    ットワーク装置。
  2. 【請求項2】 上記複数の通信ポートの各々に接続され
    るプロセッシングエレメントのI/Oアドレス領域に上
    記第1のメモリおよび第2のメモリのメモリ空間を割り
    当てた請求項1記載のネットワーク装置。
  3. 【請求項3】 複数のプロセッシングエレメントを具備
    するプロセッシングシステムにおいて、 上記複数のプロセッシングエレメントのすべてが読み出
    し書き込みを行える第1のメモリと、 上記複数のプロセッシングエレメントのサブセットが読
    み出し書き込みを行える第2のメモリとを有することを
    特徴とするプロセッシングシステム。
  4. 【請求項4】 上記複数のプロセッシングエレメントの
    I/Oアドレス領域に上記第1のメモリおよび第2のメ
    モリのメモリ空間を割り当てた請求項3記載のプロセッ
    シングシステム。
  5. 【請求項5】 上記複数のプロセッシングエレメントの
    メモリマップトI/O方式のアドレス空間のI/Oアド
    レス領域に上記第1のメモリおよび第2のメモリのメモ
    リ空間を割り当てた請求項3記載のプロセッシングシス
    テム。
  6. 【請求項6】 上記複数のプロセッシングエレメントの
    メモリマップトI/O方式のアドレス空間のメモリ領域
    に上記第1のメモリおよび第2のメモリのメモリ空間を
    割り当てた請求項3記載のプロセッシングシステム。
  7. 【請求項7】 上記サブセットを構成するプロセッシン
    グエレメントの数を2とした請求項3、4、5または6
    記載のプロセッシングシステム。
  8. 【請求項8】 複数のプロセッシングエレメントを具備
    するプロセッシングシステムにおいて、 上記複数のプロセッシングエレメントがそれぞれ接続さ
    れる複数の第1の通信ポートと、 外部機器が接続される少なくとも1つの第2の通信ポー
    トと、 上記第1の通信ポートのすべてから読み出し書き込みを
    行える第1のメモリと、 上記第1の通信ポートの対から読み出し書き込みを行え
    る第2のメモリと、 上記第1の通信ポートの1つから読み出しを行え上記第
    2のポートの1つから書き込みを行える第3のメモリと
    を有することを特徴とするプロセッシングシステム。
  9. 【請求項9】 上記第1のメモリは上記第2の通信ポー
    トから書き込みを行える請求項8記載のプロセッシング
    システム。
JP2002151849A 2002-05-27 2002-05-27 ネットワーク装置およびプロセッシングシステム Pending JP2003076670A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002151849A JP2003076670A (ja) 2002-05-27 2002-05-27 ネットワーク装置およびプロセッシングシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002151849A JP2003076670A (ja) 2002-05-27 2002-05-27 ネットワーク装置およびプロセッシングシステム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP24321799A Division JP2001067329A (ja) 1999-08-30 1999-08-30 ネットワーク装置およびプロセッシングシステム

Publications (1)

Publication Number Publication Date
JP2003076670A true JP2003076670A (ja) 2003-03-14

Family

ID=19194769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002151849A Pending JP2003076670A (ja) 2002-05-27 2002-05-27 ネットワーク装置およびプロセッシングシステム

Country Status (1)

Country Link
JP (1) JP2003076670A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017517807A (ja) * 2014-05-09 2017-06-29 マイクロン テクノロジー, インク. ハイブリッドメモリキューブリンクを用いる相互接続システムおよび方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017517807A (ja) * 2014-05-09 2017-06-29 マイクロン テクノロジー, インク. ハイブリッドメモリキューブリンクを用いる相互接続システムおよび方法
US10126947B2 (en) 2014-05-09 2018-11-13 Micron Technology, Inc. Interconnect systems and methods using hybrid memory cube links to send packetized data over different endpoints of a data handling device
US11132127B2 (en) 2014-05-09 2021-09-28 Micron Technology, Inc. Interconnect systems and methods using memory links to send packetized data between different data handling devices of different memory domains
US11947798B2 (en) 2014-05-09 2024-04-02 Micron Technology, Inc. Packet routing between memory devices and related apparatuses, methods, and memory systems

Similar Documents

Publication Publication Date Title
US6874053B2 (en) Shared memory multiprocessor performing cache coherence control and node controller therefor
US5522045A (en) Method for updating value in distributed shared virtual memory among interconnected computer nodes having page table with minimal processor involvement
US8595313B2 (en) Systems and method for simple scale-out storage clusters
JP2575557B2 (ja) スーパーコンピユータシステム
US5577204A (en) Parallel processing computer system interconnections utilizing unidirectional communication links with separate request and response lines for direct communication or using a crossbar switching device
KR100919386B1 (ko) 메모리 허브 구조를 가진 메모리 모듈들에 대한 메모리 액세스들을 제어하는 방법 및 시스템
US8204054B2 (en) System having a plurality of nodes connected in multi-dimensional matrix, method of controlling system and apparatus
JP4024806B2 (ja) 相互接続ネットワーク機能を提供する方法及び装置
JP2002304328A (ja) マルチプロセッサシステム用コヒーレンスコントローラ、およびそのようなコントローラを内蔵するモジュールおよびマルチモジュールアーキテクチャマルチプロセッサシステム
JPH02263260A (ja) メモリアクセススイッチネットワーク
CN110247970B (zh) 一种互连芯片动态共享缓冲装置
CN106844263B (zh) 一种基于可配置的多处理器计算机系统及实现方法
JP3631962B2 (ja) メモリシステム
US20050015544A1 (en) Storage system configurations
CN1288201A (zh) 主从式多处理器系统中的通信接口
US10628365B2 (en) Packet tunneling for multi-node, multi-socket systems
JP2938711B2 (ja) 並列計算機
JP2003076670A (ja) ネットワーク装置およびプロセッシングシステム
US20040151175A1 (en) Transparent data format within host device supporting differing transaction types
JP2003067350A (ja) プロセッシングシステム
JP2001067329A (ja) ネットワーク装置およびプロセッシングシステム
JP2905695B2 (ja) 共用メモリを備えた情報処理システム
WO1991010958A1 (en) Computer bus system
US6671274B1 (en) Link list operable to increase memory bandwidth in a transmission system
CN107911414B (zh) 数据存取系统

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040427