JPH08251196A - 並列計算機 - Google Patents

並列計算機

Info

Publication number
JPH08251196A
JPH08251196A JP5588295A JP5588295A JPH08251196A JP H08251196 A JPH08251196 A JP H08251196A JP 5588295 A JP5588295 A JP 5588295A JP 5588295 A JP5588295 A JP 5588295A JP H08251196 A JPH08251196 A JP H08251196A
Authority
JP
Japan
Prior art keywords
reception
flit
destination
processor
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5588295A
Other languages
English (en)
Inventor
Hiroyuki Takano
裕之 高野
Seigo Suzuki
清吾 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5588295A priority Critical patent/JPH08251196A/ja
Publication of JPH08251196A publication Critical patent/JPH08251196A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【目的】 プロセッサ間の通信のスループットを向上さ
せることができる並列計算機を提供する。 【構成】 ATM通信におけるプロトコルの処理を行う
並列計算機において、入力されるセルのヘッダのアドレ
スに従って対応する端子に接続し、前記セルの通信路確
立のためのスイッチングを行う複数の基本スイッチ12
1と、この基本スイッチ121に前記スイッチングの制
御命令を出力するATMプロセッサ1123とを備え、
前記スイッチングの制御命令は変更可能な制御命令保持
手段1125に保持されるようにしてある。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は並列計算機に関し、特
に、通信のスループットを向上させることができる並列
計算機に関する。
【0002】
【従来の技術】近年マルチメディア通信のニーズが増大
し、通信のデータ量が大幅に増えて来ている。これに対
応する為には、高速度通信が不可欠であるが、基幹回線
から一般家庭の端末回線にまで、高価な一律の高速回線
を張り巡らすことは経済的でない。このためATMなる
非同期の高速交換、通信システムが導入され、活用され
る。このATM方式は、その規格(プロトコル)が階層
構造となっており、最下位の物理レイヤから、最上位の
アプリケーションレイヤまで幅広い各種レベルの規格化
が行われている。しかし、この規格自体にも問題があっ
て、これまでの同期方式の通信システムの諸方式との互
換性を取る必要や、マルチメディア時代でデータの内容
が多岐、且つ大量である為に一律な包括規格を作る事
は、対応機器のコストに大きく影響する事からも得策で
は無く、各応用分野に対応した個別な規格の拡張でカバ
ーするのが現実的である。
【0003】このようなネットワーク上には、各種のデ
ータのみでは無く、コントロール情報も混在している。
この2つは情報の形態、内容が全く異なるばかりでな
く、処理への要求も異なる。例えば、データは連続した
大きな塊として伝送されるケースが多いが、コントロー
ル情報は、1つ(1ワード)毎に独立して意味を持つ
為、塊として送るケースは少ない。又、データはバッチ
的に転送され、必ずしもリアルタイム(即時)処理を要
求しないが、コントロール情報は基本的にリアルタイム
処理が必要である。このような状況において、ATM及
びその類似規格を処理する機能部分HW(ハードウェ
ア)やLSIで作成されていた。
【0004】ここで、ATM交換機能の中で最も基本的
なものの一つは、スイッチである。従来のATMスイッ
チの典型である‘Banyan Switch'を図19に示す。図1
9には2×2のスイッチボックス119を基本要素とし
た構成である。このスイッチボックス119の構成は基
本スイッチ要素121の組合せで種々の大きさのスイッ
チがスケーラブルに構成できる。しかし、非常に高速な
素子が必要とされ、高価なHWやLSIによって占めら
れていた。又、主に速度向上の面から、機能は簡素化さ
れ、単なるスイッチ機能のみがHW又はLSIに集積さ
れている。このため、交換機能の中で純粋のスイッチ機
能以外は、更に別の機構を導入しなければ実現が出来な
い事態になっている。例えば、パケットデータのエラー
チェック、アドレスチェック、パケットの並べ替えや待
ち合わせ等の処理も、全てスイッチとは別の機構によっ
て実現されるので、全体のコストは必要な機能に比例し
て増大する。従って、ATMの全機能を実現しようとす
ると、図14に示す如く、どうしても大型の交換機が必
要となるのである。
【0005】更に、問題を複雑にしているのは、このA
TMを介して通信する主体がWSやPC等のコンピュー
タであり、それ自身がユーザの応用プログラムを実行し
ており、そこから、随時処理内容の変更を要求して来る
事情がある。例えば高精彩静止画の転送中の回線に突然
ゲーム用動画が挿入され(両者の圧縮方式は当然異な
る)同一画面に表示する等は日常的に起こる。更に挿入
されたゲーム用動画は状況に因ってフル画面になった
り、小画面になったり、フル動画になったり、アニメに
なったり、フルカラーになったり256色で良かった
り、随時その要求レベルは変わる。これらは、主に伝送
中の高精彩静止画の情報量と処理量との兼ね合いによっ
て、ユーザが自己の裁量で自由に選択するものである。
【0006】つまり、メインの伝送/処理が忙しい時
に、画面の片隅で楽しむゲームの画質やチラツキは我慢
すべきものであるが、かと言ってまるでゲームを中断す
るのも残念である。このような事態、要求に対して、処
理内容やその程度が変更出来ず、常に最大実行仕様に対
して設定してある専用HW,LSIはこのような使用状
況ではその性能/機能を100%生かし切れず無駄を生
じる。更に全体の状況によって、システムソフトやOS
の制御で動的(自動的)に上記のケースに対応しようと
すると、OS側の負担が増えて本来の仕事の実行に障害
が出る。
【0007】更に、マルチメディアに一般的な上記の場
合、刻々と伝送される大量の高速動画情報と、デスクト
ップでのデータ処理やインタラクティブな通信処理は、
同時に平行して実施される必要がある。この要求に応え
る為には、単一のプロセッサによる逐次的なソフト処理
では、到底無理であり、例え途中の回線の帯域が良くな
ったり、光通信になっても、所詮はそのプロセッサの速
度に大きく制限され、同時平行処理は事実上不可能であ
る。
【0008】一方、並列計算機を構成する要素プロセッ
サ(PE[=Processor Element]と略記される)間の従来
のメッセージ通信方式としてよく使用されるものにワー
ムホールルーティングという方式がある。ワームホール
ルーティングでは、メッセージをフリットと呼ばれる最
小通信単位、例えば数バイトのデータに分割したものを
使用する。メッセージの始端フリットが、送信元の要素
プロセッサの通信チャネルから宛先の要素プロセッサの
通信チャネルまで中継ルートを作りながら、伝搬されて
いく。あるプロセッサがメッセージの始端フリットを受
信すると、そのフリットに示されている宛先に従って中
継ルートとなるチャネルを選択する。後続のフリットは
始端フリットが選択したルートと同じチャネルに送信さ
れていく。メッセージは送信側プロセッサと受信側プロ
セッサとの間の中継ルートを占有する。
【0009】中継ルートの占有によって、二つの問題が
起き得る。一つはデッドロックであり、もう一つはスル
ープットの低下である。デッドロックの問題は、Dally.
W.J.他の“Deadlock-Free Message Routing in Multipr
ocessor Interconnection Networks”(IEEE Trans.Com
put., vol.C6, No.5, May 1987)に開示されている物理
チャネルを論理的に多重化する方法などで解決される。
【0010】一方、スループットの低下は、各メッセー
ジの通信における中継ルートの占有時間が大きいことに
起因している。図15は従来の並列計算機を構成する要
素プロセッサの構成を示したブロック図である。この図
は一次元単方向の場合に必要な構成要件のみを示してあ
り、デッドロックの処理に必要な構成要件については省
略する。この要素プロセッサは、通信チャネル1900
からフリットを受け取るとルータ部1300にて自要素
プロセッサに送信されたか否かを判断し、自己に送信さ
れたフリットであれば宛先用FIFO1600に送出す
る。また、それ以外のフリットは、中継用FIFO17
00に送出し、次の要素プロセッサにフリットを受け渡
す。宛先用FIFO1600は、所定の数だけフリット
を保持することができ、フリットが入力される度に、以
前入力されたフリットが一つづつシフトされる。この宛
先用FIFO1600の全てがフリットを保持し、更に
入力された場合には、最初に保持されたフリットはメッ
セージ再構成手段1210を送出される。このメッセー
ジ再構成手段1210にてフリットをメッセージに再構
成し、このメッセージは、バッファ1230を介して演
算処理部1100に出力されるようにしてある。
【0011】また、演算処理部1100よりバッファ1
230に送出されたデータは、メッセージ分割手段12
20にてフリットに分割され送信用FIFO1500を
通じてFIFOメッセージ占有機構1400に出力され
るようにしてある。
【0012】図16は図15を簡略化して示したもので
ある。以下、この要素プロセッサについては簡略化した
ものを用い、符号を省略する。図17は、要素プロセッ
サを一次元に並べた例である。隣接プロセッサ間での各
フリットの送受信を図17における送信側の要素プロセ
ッサPE1と受信側の要素プロセッサPE2を用いて詳
細に説明する。送信側の要素プロセッサPE1は、受信
側の要素プロセッサPE2の通信チャネルと自身の通信
チャネルの間の信号線へ自身の送信用FIFO1500
の出口にあるフリットデータを乗せると共に、受信要求
信号を受信側要素プロセッサPE2へ送信する。要素プ
ロセッサ間の信号の伝搬にかかる時間を1サイクルと定
義すると、受信要求信号が送信されてから1サイクル後
に受信側要素プロセッサPE2へ到着する。受信側要素
プロセッサPE2はそのフリットを受信し格納すべき宛
先用FIFO1600に空きがあるかモニターし、なけ
れば空きができるまでに必要なサイクル数待つなどし
て、空きができた時点でそこへ通信チャネル間の信号線
に乗っているフリットデータを格納し、受信信号を送信
側要求プロセッサPE1へ送信する。受信信号が送信さ
れてから、1サイクル後に送信側要求プロセッサに受信
信号が到着すると、次のフリットについての送信を準備
する。つまり、図18に示す如く従来の通信方式では1
フリットの送受信に必ず2サイクル以上費やされる。
【0013】また、図17中で送信側の要素プロセッサ
をPE1、隣接していない受信側の要素プロセッサであ
るPE3の通信の場合には、中継している要素プロセッ
サPE2があるため更に多くのサイクルを費やすことに
なる。以下に、この隣接していない場合の通信を説明す
る。
【0014】まず、始端フリットが中継ルートを作りな
がら宛先要素プロセッサまで到着するのに、
【数1】[2サイクル以上の送受信時間]×[1以上D
以下の数]×L だけ費やす。ここでDは各要素プロセッサが中継用に有
しているFIFOの深さであり、Lは送信元要素プロセ
ッサから宛先要素プロセッサまでの要素プロセッサ数で
ある。上式で、[1以上D以下の数]は、要素プロセッ
サが受信したフリットが中継ルート用FIFOを通過す
るのに必要なFIFO段数で、フリットを受信した時点
で中継ルート用FIFO内に複数の空きがあればその分
出口に近い方へそのフリットを格納することができるよ
うに構成することができるため、常にDとは限らない。
始端フリットが届いた後も、従来の通信方式のうち、図
17のように宛先用FIFOや受信した複数のフリット
をメッセージへ再構成した後演算処理部がそのメッセー
ジを使用するまでの間保持しておくバッファが極めて少
ない単純な方式を用いた場合、受信されたメッセージが
使用されるまで宛先用FIFOは空かないため、それが
すべての中継ルートに影響し、依然として、各フリット
の要素プロセッサ間通信には2サイクル以上の時間が費
やされる。
【0015】そこで、上記の単純な方式において宛先用
FIFOや演算処理部がメッセージを使用するまでの間
保持しておくバッファを大きく取ることにより、図18
のように各フリットの要素プロセッサ間通信にかかる時
間を、上記の通信方式での最小値2サイクルに可能な限
り近づけようとしている方式が開示されている(文献:
Shimizu,T.,Ishihata,H.,Horie,T.,“Low-latency mess
age communication support for the AP1000,”in The
19th Annual Int'l Symp. on Computer Architecture,
May 1992,pp.288-297.)。
【0016】
【発明が解決しようとする課題】従来の並列計算機のう
ちで、ATM交換器においては、ハードウェア(H
W)、又は専用LSIを用いて制御を実施していたた
め、下記の問題点がある。すなわち、 (1)各機能毎に専用LSIが必要であり、コストが機
能に比例して増加する。 (2)各機能の処理内容が(専用LSIに依って)固定
しており、機能仕様に対する自由度が小さい。
【0017】(1)の問題については、ATMのよう
に、機能が複雑で多層に亘る場合は結果的にチップ数も
増えて、コストの増加が著しい。
【0018】特にATMは、同じデータ列に対して、各
層(レイヤ)毎に処理する内容が異なる為に、或る特定
な機能を実行する度に、対象となるデータ列を抽出する
前処理が(重複して)必要になったりする事が多い。機
能毎の専用LSIでは、この重複は避けられず結果的に
多くのLSIが必要となる。
【0019】また、(2)の問題については、現在及び
将来の通信プロトコル(論理規格)が安全に固定、標準
化されていない状況であるから、各チップの機能仕様を
完全に規定する事が事実上困難である。素材、インフラ
レベルでも、(高速、中速)光ファイバー、TP(ツイ
ストペアー)、同軸ケーブルと多様であるし、それらの
伝送規格も全て異なっている。
【0020】アプリケーション(応用分野)の要求も実
に多様であり、音声の圧縮、伝送、静止画の伝送、動画
の圧縮伝送、高精彩静止画の圧縮伝送、X線など医療情
報の伝送、設計情報の交換、衛星画像の伝送、ゲームそ
の他マルチメディア情報の伝送とあり、各々データ伝送
/処理への要求は千差万別である。また処理のやり方
も、途中からユーザーソフトにデータを渡してしまう例
もあるし、専用LSIに極力任せる方法もある。又、難
問は従来のLAN(ローカルエリアネットワーク)との
互換性の点においても問題がある。
【0021】また、従来のATMスイッチの典型である
‘Banyan Switch'は、ビット逐次の処理である為に、処
理内容は固定し、切り換えスイッチ以上の機能を持つ事
が出来ない。マルチメディアに必要な双方向スイッチの
機能は持たない。又、1:1の通信経路を選択するが、
1:NやN:1の通信路には対応出来ない、スイッチ内
部のふくそう(経路の衝突)には弱く、内部での待ち合
わせ制御や、迂回経路の選択機能を持てないので、通信
頻度が上がると、セルロス、廃棄を起こし易く、信頼度
が急速に低下する。さらに、ATMスイッチの重要な付
加機能である、データ形式のチェック、並べ替え、優先
制御によるデータセルの破棄や保管、再送要求と実行等
は、高速実行の目的で機能を簡素化した専用スイッチH
Wでは、実行不可能である。
【0022】更に、専用スイッチHWによる方式では、
規格通りの定型処理のみであればうまく行くが、規格が
完全に決まってはいない状況や、周囲のユーザ要求によ
って色々な機能が追加又は変更になるマルチメディア分
野の応用を考えると、適切な実現方法とは言い難い。特
に、上位のユーザアプリケーション層での密なインター
フェースを実現する事が今後のコンピュータとして非常
に大切であるが、この点において専用スイッチHWは、
(プロセッサを用いた)ソフト制御方式に対し大幅に劣
るものである。このように、マルチメディア等のより複
雑、高度な通信形態への対応が難しいという問題があっ
た。
【0023】また、並列計算機に用いられる従来のワー
ムホールルーティング方式では、要素プロセッサ間のフ
リットの送受信には、始端フリットが宛先要素プロセッ
サに到達してルートが確保された後でも、2サイクル以
上費やされることには変わりない。
【0024】しかし、始端フリットが宛先要素プロセッ
サまで到達しルートが確保された後は、ルートが確保さ
れる前に比べ、後続のフリットについてルートを決定す
る必要がないこと、及び、宛先用FIFOや演算処理部
がメッセージを使用するまでの間保持しておくバッファ
が十分に確保されていれば、受信要求・受信という2段
階操作なしでも1サイクル毎にパイプライン的にフリッ
トを送受信できるはずであること、という2つのメリッ
トがあるはずである。このメリットを活かす機構を加え
れば、要素プロセッサ間送受信の平均時間2サイクル以
上という送受信時間の限界を越えることができるはずで
あり、結果スループットの低下を大幅に改善できるはず
であるのに、そのメリットを活かしていないという問題
がある。
【0025】本発明は上記事情を鑑みてなされたもので
あり、その目的とするところは、要素プロセッサ間の通
信のスループットを向上させることができる並列計算機
を提供することである。
【0026】
【課題を解決するための手段】上記目的を達成するた
め、第1の発明の第1の構成は、単数又は複数のプロセ
ッサと、その入出力端子間又はプロセッサ間の結合ネッ
トワークとを有し、その結合ネットワークの制御を行う
制御ソフトウェアを内部に有し、この制御ソフトウエア
のもとに必要なネットワーク制御、及びコンピュータ間
通信を行うことを特徴とする。
【0027】ここで、上記プロセッサは、上記結合ネッ
トワークをI/O命令の一部として実行する通信機構を
有し、各プロセッサ間の通信を制御するソフトウエアカ
ーネルを前記単一又は複数のプロセッサ中に有し、前記
ソフトウエアカーネルの制御のもとでプロセッサ間通信
を並列に実行することが好ましい。
【0028】また、上記プロセッサは、上記結合ネット
ワークをI/O命令の一部として実行する通信機構を有
し、各プロセッサ間の通信を並列に実行することが好ま
しい。また、双方向通信チャネルを持つ場合や、多次元
の場合、並列計算機のプロセッサ間結合方式やデッドロ
ックの回避の方法などによらずに適用することもでき
る。
【0029】また、第1の発明の第2の構成は、ATM
通信におけるプロトコルの処理を行う並列計算機又はそ
の機能を有するLSIチップ又はハードウエアモジュー
ルにおいて、入力されるセルのヘッダのアドレスに従っ
て対応する端子に接続し、前記セルの通信路確立のため
のスイッチングを行う複数の基本スイッチと、この基本
スイッチに前記スイッチングの制御命令を出力するAT
Mプロセッサとを備え、前記スイッチングの制御命令は
変更可能な制御命令保持手段に保持されることを特徴と
する。
【0030】また、上記目的を達成するため、第2の発
明の第1の構成は、通信メッセージを分割したフリット
中の始端フリットの受信要求が宛先要素プロセッサに到
着するまでは、受信要求を行った後にフリットを送出す
るワームホールルーティング機構を選択し、前記始端フ
リットの前記受信要求が前記宛先要素プロセッサに到着
した後は、前記宛先要素プロセッサの宛先用FIFO
に、連続送受信が可能なだけの空き領域があった場合に
連続送受信を行う連続送受信機構を選択する送受信方式
選択部を有する要素プロセッサを複数具備することを特
徴とする。
【0031】また、第2の発明の第2の構成は、隣接す
る要素プロセッサからのフリットを受信し、この受信し
たフリットの送信先を判定するルータ部と、このルータ
部にて自要素プロセッサに送信されたものと判定された
フリットを所定の数だけ保持する宛先用FIFOと、こ
の宛先用FIFOの受信可能領域を監視する宛先用FI
FOモニター手段と、前記ルータ部にて自要素プロセッ
サに送信されなかったものと判定されたフリットを所定
の数だけ保持する中継用FIFOと、この中継用FIF
Oの受信可能領域を監視する中継用FIFOモニター手
段と、前記宛先用FIFOで保持されたフリットをメッ
セージに再構成し、若しくは、自要素プロセッサから送
信するメッセージを送信の宛先を示す情報が格納された
始端フリットと前記メッセージの終端であることを示す
情報が格納された終端フリットとを含むN個(Nは2以
上)のフリットに分割するメッセージ変換部と、送信元
プロセッサから始端フリットが送信され、始端フリット
の受信要求信号を宛先要素プロセッサが受信するまで
は、前記ワームホールルーティング機構を選択し、始端
フリットの受信要求信号を宛先プロセッサが受信した後
は、連続送受信許可信号により、前記ワームホールルー
ティング機構、若しくは、連続送受信機構のいずれの方
式を選択する送受信方式選択部と、前記メッセージ変換
部にて分割されたフリット、若しくは前記ルータ部にて
自要素プロセッサに前記送信されたものと判定されなか
ったフリットを他の隣接する要素プロセッサに終端フリ
ットまで占有して送出する−FIFO−メッセージ占有
機構とを備え、前記ワームホールルーティング機構は、
自要素プロッサが発信元であったときに送信用FIFO
にフリットが格納されている場合や、自要素プロセッサ
が送信元でも宛先でもないときに中継用FIFOにフリ
ットが格納されている場合には、前記フリットの宛先へ
の経路上の隣接要素プロセッサへ受信要求信号を発する
受信要求手段と、自要素プロセッサが隣接要素プロセッ
サから受信要求信号を受けた場合、自要素プロセッサが
前記フリットの宛先でなかったときは前記中継用FIF
Oモニター手段が、また、自要素プロセッサが前記フリ
ットの宛先であったときは前記宛先用FIFOモニター
手段が、それぞれ受信可能であることを示しているとき
に前記フリットを受信し、受信信号を前記隣接要素プロ
セッサへ返信する受信手段と、自要素プロセッサが隣接
要素プロセッサから受信信号が返信されたとき、残りの
フリットについて前記隣接要素プロセッサへの受信要求
手段を継続して行う受信要求継続手段とを備え、前記連
続送受信機構は、自要素プロセッサが発信元であった場
合には送信用FIFOに、自要素プロセッサが送信元で
も宛先でもない場合には中継用FIFOに、それぞれフ
リットがある場合には、前記フリットの宛先への経路上
の隣接要素プロセッサへ、前記隣接要素プロセッサが1
フリット受信に十分な時間間隔である1サイクル毎に順
次前記フリットを送信する連続送信手段と、発信元への
経路上の隣接要素プロセッサから送信されたフリットを
前記1サイクル毎に受信し、受信したサイクル毎に受信
信号を前記隣接要素プロセッサへ送信する連続受信手段
とを備えることを特徴とする。
【0032】ここで、前記送受信方式選択部は、送信元
から始端フリットが送信され、始端フリットの受信要求
信号を宛先要素プロセッサが受信するまでは、ワームホ
ールルーティング機構を選択し、始端フリットの受信要
求信号を宛先プロセッサが受信した後は、送信元要素プ
ロセッサと宛先要素プロセッサの間の距離をLとし、前
記中継用FIFOが前記フリットを格納しておくための
深さをDとしたとき、宛先要素プロセッサの場合には、
分割されたフリットの数NがL×D以上のときは、宛先
用FIFOモニター手段が示す空き領域数がL以上ある
ならば連続送受信許可信号を、L以上ないならば連続送
受信不許可信号を、受信信号を送信するのと同じタイミ
ングで受信信号を送信する隣接要素プロセッサへ送信し
た後、連続送信許可或いは不許可信号のどちらを送信し
たかによってそれぞれ連続送受信機構或いはワームホー
ルルーティング機構を選択し、また、NがL×D未満の
ときは、宛先FIFOモニター手段が示す空き領域数が
N/D(小数点以下は切り上げとする)以上あるならば
連続送受信許可信号を、N/D(小数点以下は切り上げ
とする)以上ないならば連続送受信不許可信号を、受信
信号を送信するのと同じタイミングで受信信号を送信す
る隣接要素プロセッサへ送信した後、連続送信許可或い
は不許可信号のどちらを送信したかによってそれぞれ連
続送受信機構或いはワームホールルーティング機構を選
択する受信機構手段とを備え、宛先でも送信元でもない
要素プロセッサの場合には、連続送受信許可或いは不許
可信号を受信した後は、送信元への経路上にある隣接要
素プロセッサへ受信した連続送受信許可/不許可信号
を、受信信号を送信するのと同じタイミングで前記隣接
要素プロセッサへ送信するとともに、それぞれの場合に
おいて連続送受信機構或いはワームホールルーティング
機構を選択する手段とを備え、送信元要素プロセッサの
場合には、連続送受信許可或いは不許可信号を受信した
後は、それぞれの場合において連続送受信機構或いはワ
ームホールルーティング機構を選択する手段とを備える
ことを特徴とする。
【0033】
【作用】第1の発明の構成によれば、ネットワークに接
続された複数のプロセッサを用いるので、上記のような
ふくそうした処理要求に対しても特別な遅延発生等の問
題を生じる事なく実行する事が出来る。更に、単一又は
2回線を用いて双方向の同時伝送を行う場合(マルチメ
ディア応用では、ごく当り前である)も高速な同時平行
処理が必要であり、ほぼ同一な事情で、本発明が極めて
有効であると言える。
【0034】特にパワー(消費電力)は、専用HWやチ
ップは、殆どの場合、最大使用時に合わせて消費される
ので、大きなパワーロスを生じるが、本案のプロセッサ
アレーでは、ソフト処理に依るパワーマネジメントを使
って、暇なプロセッサを休ませてパワーを節約すること
が容易に実現出来るので、パワー効率も良い。
【0035】また、OS(カーネル)を制御の中核とす
ると、周囲或いは上位のユーザ又はホストのOSとのソ
フト上でのリンクが可能となり、両者間のキメの細かい
やりとりが出来、種々の状況に即応した制御が、ソフト
上で継ぎ目無く実行される。このことは、このような通
信システムの実体をなすホストや端末のコンピュータや
ワークステーションの殆どが標準的なOS(MS-DOS,Wind
ows NT,OS-2,Unix等)によって制御されている為に、こ
れらのOSに対する親和性は、システムの普及、ユーザ
浸透に関して大きな意味を持つ非常に重要な事柄であ
る。
【0036】更に、ホストとなるWS/PCのプロセッ
サと、このATMプロセッサとは、OSの制御の元で相
互にその仕事を分担し、更にその分担を随時変更する事
が容易である。例えば、ATMプロセッサが、高速処理
を要求される物理レイヤの処理で飽和している時に圧縮
された画像情報が、回線から送られて来たとすると、A
TMプロセッサのベース処理量が少ないときはそれ自身
で画像情報のデコード(伸長)を行うが、この場合のよ
うに非常に多忙な時は、その処理(又はその一部)をホ
ストプロセッサに受け持たせる事が可能になる。逆にホ
ストが忙しくなった場合は、デコードを引き受ける。こ
のように、各プロセッサの処理負荷の状況に応じて仕事
を分担し、又分担を変更する事が出来るのである。
【0037】また、第2の発明の構成によれば、各要素
プロセッサは、送信するメッセージ毎に、連続送受信機
構を選択できる間は選択できるようにすることができ、
平均要素プロセッサ間フリット送受信時間を減少せしめ
ることが可能になるのである。
【0038】
【実施例】以下、本発明に係る並列計算機の実施例につ
いて図面を参照しながら説明する。
【0039】第1実施例 第1の発明に係る並列計算機の実施例について説明す
る。図1はこの並列計算機が具備する高速並列データ通
信機構を有する要素プロセッサを示したブロック図であ
る。
【0040】この高速通信機能は、基本的に各ATMプ
ロセッサ(図示せず)からソフトによって制御されるも
のである。このソフト制御の通信機能を用いて、ATM
スイッチ制御の基本となるスイッチカーネルを構成し、
この制御に依ってスイッチ機能を実現すると同時に、上
位のOSやユーザーカーネルの制御を受けて、従来のH
Wによるスイッチに比べて柔軟性の高い機能を実現す
る。
【0041】この例でのスイッチカーネルの伝送速度は
以下である。今、通信路のデータ幅を1ワード32ビッ
トとすると、1ワードの伝送に要するソフトステップ数
は、高だか5ステップであるから、1ステップの実行速
度が命令サイクルを500MHzとすると、2ns×5
=10ns(100MHz/ワード=3.2Gbps)
の高速転送が可能になる。
【0042】図2はこの要素プロセッサの通信経路の例
を示した図である。要素プロセッサ113は図1に図示
した要素プロセッサに該当する。図3は、2x2の基本
スイッチを備えたATM通信におけるプロトコルの処理
を行う並列計算機を示した図である。本実施例において
は、LSIチップ119に実装されているものとする。
この並列計算機は、入力されるセルのヘッダのアドレス
に従って対応する端子に接続し、前記セルの通信路確立
のためのスイッチングを行う複数の基本スイッチ121
と、この基本スイッチ121に前記スイッチングの制御
命令を出力するATMプロセッサ123とを備え、前記
スイッチングの制御命令は変更可能なメモリ125に保
持されている。すなわち、図2の如く構成した要素プロ
セッサ121の通信経路をATMプロセッサ123にて
制御するように構成したものである。このように、AT
Mの基本である高速スイッチ機能が本発明に係るスイッ
チカーネルの採用によって実現される。更に、このカー
ネルは、その内部にエラーチェックや、パケットの迂
回、待ち合わせ等の機能を追加する事も出来る。このよ
うに、スイッチ自体の機能を高度化する事は、交換機能
全体の性能向上に非常に有効である。また、図4の如
く、上述の2x2の基本スイッチを組み合わせることに
より8x8のスイッチ構成にすることも可能である。
【0043】このように、内蔵する高速プロセッサの制
御により、1−32ビットの単位で一括処理が可能であ
る。この為、1ビット単位の逐次処理しか行わぬ従来の
HWによるBanyanスイッチに比べて、遥かに自由、且つ
高度な内容の処理が可能になる。
【0044】ここで、従来型が1:1の通信を前提にし
た経路選択手法をHWで構成しているので、最近マルチ
メディア分野でニーズの高い1:Nの放送的通信に関し
ては、本質的に対応が難しい。しかし本発明によれば、
スイッチ内部の経路選択、制御は内蔵プロセッサのソフ
ト制御により、或いはそれとプロセッサの持つ高速通信
機能を用いて行われる為に、このようなスイッチ機能に
関する制約は、原理的に存在しない。
【0045】また、各セル/パケットの内容、行き先
(アドレス)、優先度指定等のスイッチ動作に必要な情
報は一旦プロセッサ内のバッファに格納されるため、情
報の内容を内部プロセッサが解読して、判断する事が容
易に出来る。このためセルの行き先判断、優先度の考
慮、変更、セルの待ち合わせ(内部のメモリに一旦蓄え
る)、迂回(混んでいるルートを避けて、周り道をす
る)等の高度なルート制御を適宜実行することが出来
る。
【0046】また、本発明では、ソフト制御可能な高速
プロセッサ通信ポートを単数又は複数備えているので、
比較的小さなソフト(例えばATMスイッチカーネル)
の制御で、高速なスイッチ機能を実行できるように容易
に出来る。一方、このような機能拡大でカーネルが大き
く(重く)なり、実行ステップも増えて、スイッチ速度
が遅くなるので、この折り合いをつける必要はあるもの
の、プロセッサの性能向上によって、その上限も向上す
る。このように、処理の全てをソフトウエアで行うので
はなく、例えば、経路選択の処理を、高速なプロセッサ
を用いてその全てをソフトで実行する事が出来るが、い
ずれも非常に時間が掛かり、実行するとしても200−
300ステップを要する。即ち、100MHz(10n
s)サイクルのプロセッサを用いても2−3μsかか
る。155Mbpsのデータでは、4.84MHz(2
06.6ns毎)に1ワード(32ビット)が通過する
ので、この処理速度では全く間に合わない。このような
場合等にはHWに処理を行わせるようにしてもよい。
【0047】このような、ミニOSパッケージ(カーネ
ル)構成にすることによって、端末やホストのコンピュ
ータのOSから、HWを介さずに直接コントロールが可
能になる。即ち、この事はユーザ及びユーザプログラム
からATM機能の制御が、自由にかつ柔軟に出来る事を
意味する。
【0048】次に、図5を参照しながら説明する。
(a)はシステムの中心にATM交換機を置いた、集中
型システムの構成例であり、(b)は独立したATM交
換機を持たず、その機能を各端末機に持たせる分散型ネ
ットワーク構成である。
【0049】(a)では、集中型交換スイッチとして、
‘Banyan Switch'を使い、これを本発明に係る2×2の
基本要素スイッチを用いて構成した。これらの基本スイ
ッチは、全て個々の高速プロセッサからなっており、ア
ドレスや方向等の制御はソフトウェアで制御される。こ
のスイッチ本体は、メッシュ構造を基本とするマルチプ
ロセッサアレーで構成され、2×2の基本構成単位毎
に、スイッチカーネルOSを介して、各ATMノードプ
ロセッサを制御して、ATMスイッチに必要な機能を実
現する。
【0050】高速クロスポイント型ATMスイッチをH
W,LSIで構成する場合Line速度が150Mbp
sで、32×32の構成の場合トータルのスイッチ容量
が154Gbpsとなり、約1000個のLSI(0.
8μルール)が必要で、622Mbps/lineでは
640Gbpsとなる為、4000個のLSIチップが
必要となる。これに対して、本案の構成では、今4個の
スイッチプロセッサが1チップに入っているので32×
32/4=256チップで構成出来る。更に、LSIの
集積度が上がり16プロセッサが1チップに入る事も容
易であるが、この場合には64チップで足りる。
【0051】次に、分散制御ネットワーク構成のATM
スイッチのソフト化について説明する。各端末WSに分
散させた2×2や4×4の小型スイッチを用いて、WS
ネットワークを構成する。ルーティングスイッチのみを
構成するのがこの場合である。各スイッチのプロセッサ
内のカーネルはネットワークを介して各WSのOSによ
って管理される。例えば、WS1がWS3にデータを送
ろうとする場合は、WS1のOSが主体となって、WS
1,WS3のATM部分のマイクロカーネルと連携し、
NWを介してWS3のOSに働きかけて、WS1−>W
S3のコネクションを成立させる。その後、WS1はO
Sや通信ソフトによって、送るデータをATMセル等の
形式に構成し、スイッチBOXのプロセッサを介してW
S3にデータを送ることができる。
【0052】次に、NW各端末間のメモリ共有化の点に
ついては、上記において、OSの管理を超えて、更に上
位のシステム管理やアプリケーションを各WSネットワ
ーク上で行おうとすると、各WSが有するメモリ空間を
共有化した方が、制御プログラムの一元化の意味で制御
しやすい。この場合、本発明の構成によれば、各プロセ
ッサのメモリに共通エリアを想定し、その論理的アドレ
スを共通化する事が容易であり、各々の共有データを高
速でNWを介して移動させることも極めて容易である。
つまり、各WSの共有データをATMBOXとATMプ
ロセッサを介して容易に、転送、制御することができ
る。
【0053】次に、データセキュリティの点について説
明する。例えば、WS1がそのデータを、機密にしたい
場合は、各スイッチ内のプロセッサによって、容易に暗
号化、復号の処理が高速で実行できる。特に、分散ネッ
トワークシステムは、発信、受信の2者間直接通信が原
則で、その間に大きなデータファイルを持たないので、
ファイルサーバーでのトラブル、機密漏洩、データ消
滅、破壊等が、原理的に存在しない高セキュリティを提
供することができる。
【0054】第2実施例 第2の発明に係る並列計算機の実施例について説明す
る。以下の説明では、同一記号は同一部品を示し、説明
の重複は省略する。本発明を構成する要素プロセッサの
一構成例である図6中、従来の構成例である図15を比
較すると、送受信方式選択部1810及び連続送受信機
構1830が新たに付加されているのが分かる。従っ
て、本実施例においては、両者を中心に説明する。
【0055】ここで、本実施例にて用いられる各フリッ
トデータを図10に示す。図示の如くこれらのフリット
データは33ビット幅を持ち、始端フリットの場合(図
10(a))は16ビットの宛先要素プロセッサ番号・
16ビットの送信元要素プロセッサ番号により構成され
ており、また、他のフリットの場合(図10(b),
(c))は32ビットの通信データにより構成されてい
る。これらの各フリットは終端であるかないかを示す1
ビットを有しており、この1ビットにて終端か否かを判
断する。
【0056】また、各要素プロセッサに同一周波数で同
期されたクロック信号が供給されているものとし、更
に、同一FIFO内の各記憶領域間及び、送信用FIF
O1500から隣接する要素プロセッサの宛先FIFO
1600或いは中継用FIFO1700までについて1
フリットデータ当たり1クロックで伝達可能とする。即
ち、1サイクル=1クロックであり、また、そのフリッ
トが始端フリットであるかの判断は、まだ一度も始端フ
リットを受け取ったことがないか、或いは終端フリット
を受信後に初めて来たフリットである場合に始端フリッ
トであると判断したときに、始端フリットであると判断
するという形で従来通りルーター部が行う。本実施例で
は、まだ一度も始端フリットを受け取ったことがない状
態か、或いは終端フリットを受信後、次の始端フリット
を受信していない状態であるかどちらかの状態であると
きに0を、また、他の状態のときに1を保持するルータ
ー部1300内のレジスタを占有状態レジスタ(図示せ
ず)と呼び、そのレジスタの出力する信号を占有状態信
号1311と呼ぶ。同様に、ワームホールルーティング
機構使用時には受信要求のある、連続送受信機構使用時
には次のクロックで受信されるフリットの宛先が自要素
プロセッサであるときには1を、また宛先が自要素プロ
セッサでないときには0を出力しているルーター部13
00内で生成される信号を宛先判別信号1321と呼
び、同じルーター部1300内で生成される宛先−送信
元要素プロセッサ間距離を示している信号を宛先−送信
元要素プロセッサ間距離信号1331と呼ぶ。また、自
要素プロセッサが送信元として送信中のときに1送信元
として送信中でないときに0を保持する−FIFO−メ
ッセージ占有機構1400内のレジスタを送信元レジス
タ1410(図示せず)、送信元レジスタの出力信号を
送信元信号1411と呼ぶ。
【0057】本実施例における送受信方式選択部181
0を図11に示す。この送受信方式選択部1810は自
要素プロセッサがワームホールルーティング機構182
0を使用しているか、連続送受信機構1830を選択し
ているかの情報を保持している選択方式保持ラッチ18
40と、宛先−送信元要素プロセッサ間距離信号133
1及び自要素プロセッサ内の宛先用FIFOモニター手
段1610により宛先用FIFO空き領域数が示されて
いる宛先FIFO空き領域数信号1611から連続送受
信機構1830を使用したい場合には使用できるかどう
かを示す宛先FIFO状態判定信号1871を出力する
宛先FIFO判定回路1870と、受信側の隣接要素プ
ロセッサからの受信要求信号1901、自要素プロセッ
サ内の占有状態信号1311、宛先判別信号1321、
送信元信号1411、及び、宛先FIFO判定信号18
71の5つの信号から、次のクロックの選択方式保持ラ
ッチの値を決める選択方式判定部1850と、選択方式
保持ラッチ1840の値によって、受信側の隣接要素プ
ロセッサとの制御信号である受信要求信号1901、受
信信号1902、送信側の隣接プロセッサとの制御信号
である受信要求信号1911、受信信号1912、自要
素プロセッサの送信用FIFOに使用されているシフト
レジスタの制御用Enable信号1515、宛先用FIFO
に使用されているシフトレジスタのEnable信号制御用1
615、及び、中継用FIFOに使用されているシフト
レジスタの制御用Enable信号1715について、それぞ
れの符号に添字aをつけたワームホールルーティング機
構で制御される信号を使用するか、それぞれ符号に添字
bをつけた連続送受信機構で制御される信号を使用する
かを選択するマルチプレクサ1860とを備える。な
お、本実施例では、各要素プロセッサの選択方式保持ラ
ッチの値が0のときワームホールルーティング機構の選
択を示し、値が1のとき連続送受信機構の選択を示すも
のとする。
【0058】宛先FIFO判定回路1870は、本実施
例においては、宛先FIFO空き領域数信号1611の
示す値Eと、宛先−送信元要素プロセッサ間距離信号1
331の示す値Lと、メッセージのフリットへの分割数
Nと、中継FIFO段数Dにより、NがL×D以上の場
合には、EがL以上のとき1を、EがL未満のとき0
を、NがL×D未満の場合には、Eが「N/D」以上の
とき1を、Eが「N/D」未満のとき0を、宛先FIF
O状態判定信号1871に出力する。但し、「N/D」
はN/Dの値について小数点以下を切り上げた値を示
す。
【0059】また、宛先FIFO判定回路1870は、
宛先FIFO空き領域数信号611の示す値Eと、宛先
−送信元要素プロセッサ間距離信号331の示す値Lに
より、 EがL以上のとき1を、EがL未満のとき
0を、宛先FIFO状態判定信号1861に出力するよ
うしてもよい。
【0060】選択方式判定部1850は、図12のアル
ゴリズムに従い、値0または、値1または、送信側の隣
接要素プロセッサが有する選択方式保持ラッチの出力1
913の値を出力する。
【0061】即ち、占有状態信号1311が0で(S1
01にてp=0 )、且つ受信側の隣接プロセッサからの受
信要求がなく(S102にてR=0 )、且つ自要素プロセ
ッサが送信元でもない場合(S103にてS=0 )と、占
有状態信号1311が1で(S101にてp=1 )、且つ
自要素プロセッサが宛先でなく(S104にてG=1 )、
且つ宛先FIFO状態判定信号1871が0の場合(S
105にてJ=0 )では、強制的にワームホールルーティ
ング機構を選ばせるため値0を信号線851に出力し
(S106)、占有状態信号1311が1で(S101
にてp=1 )、且つ自要素プロセッサが宛先であって(S
104にてG=1 )、宛先FIFO状態判定信号が1の場
合(S105にてJ=1 )には、強制的に連続送受信機構
を選ばせるために値1を信号線851に出力し(S10
6)、その他の場合は、送信側の隣接要素プロセッサの
選択方式保持ラッチの出力1913を信号線1851に
出力する(S107)。
【0062】本実施例においては、連続送受信機構18
30は、受信側受信要求信号線1901bと送信側受信
信号線1912bを出力線を短絡させたバッファにそれ
ぞれ接続し、受信側受信信号線1902bと送信側受信
要求信号線1911bは常に値1の状態にすると共に、
自要素プロセッサが送信元要素プロセッサのときは、送
信用FIFOのEnable信号1515を常に値1で、且つ
宛先用FIFOのEnable信号1615・中継用FIFO
のEnable信号1715を常に値0にし、自要素プロセッ
サが宛先要素プロセッサのときは、宛先用FIFOのEn
able信号1615を常に値1で且つ送信用FIFOのEn
able信号1515・中継用FIFOのEnable信号171
5を常に値0にし、自要素プロセッサが送信元・宛先要
素プロセッサのどちらでもないときは、中継用FIFO
のEnable信号1715を常に値1で且つ宛先用FIFO
のEnable信号1615・送信用FIFOのEnable信号1
515を常に値0にすることで実現することができる。
【0063】以上の構成を持つ送受信選択部1810及
び連続送受信機構1830を従来の要素プロセッサに追
加する。次に、本発明に係る並列計算機の動作について
説明する。
【0064】通信ルート上にある各要素プロセッサは、
送受信方式選択部1810において、送られているメッ
セージの始端フリットが宛先フリットに到着するまで
は、従来と同じ通信方式であるワームホールルーティン
グ機構を選択する(図19参照)。送られているメッセ
ージの始端フリットが宛先フリットに到着したあとは、
宛先用FIFOモニター手段の示す宛先用FIFOの空
き段数が、連続送受信機構を選択するに十分なだけ、即
ち送信・宛先要素プロセッサ間距離Lだけあれば、宛先
要素プロセッサは連続送受信機構を選択し、連続送受信
機構を今後使用すること、即ち、連続送受信許可信号を
受信信号を送信するのと同じタイミングで隣接する中継
ルート上の隣接プロセッサに送信する。受信信号を受け
たその要素プロセッサは、直前に送信したフリットが受
信されたことを確認するので、自身のルーティング用F
IFOにその分の空きができ、1つ送信元よりの要素プ
ロセッサから直前に出ていた受信要求信号に対する受信
信号を送信することができる。このとき宛先要素プロセ
ッサと同様に自身の通信方式に連続送受信機構を選択
し、受信信号を送る要素プロセッサにそれと同じタイミ
ングで連続送受信許可信号を送る。このようにして順次
連続送受信許可信号を送信元まで送りつつ、送られたプ
ロセッサが連続送受信機構を選択していく。図8は、P
E3から送られてきた連続送受信許可信号を、PE2が
PE1へ送信しているタイミング時の各要素プロセッサ
の通信方式の選択を模式的に表している。
【0065】また同様に、宛先用FIFOモニター手段
の示す宛先用FIFOの空き段数が、連続送受信機構を
選択するに十分なだけ即ちLだけ、最初からないか、或
いは連続送受信機構使用中になくなれば、宛先要素プロ
セッサはワームホールルーティング機構を選択し、連続
送受信機構を今後使用しないこと即ち連続送受信不許可
信号受信信号を送信するのと同じタイミングで隣接する
中継ルート上の隣接プロセッサに送信する。受信信号を
受けたその要素プロセッサは、宛先要素プロセッサと同
様に自身の通信方式にワームホールルーティング機構を
選択し、受信信号を送る要素プロセッサにそれと同じタ
イミングで連続送受信不許可信号を送る。このようにし
て順次連続送受信不許可信号を送信元まで送りつつ、送
られたプロセッサがワームホールルーティング機構を選
択していく。図9は、PE3から送られてきた連続送受
信不許可信号を、PE2がPE1へ送信しているタイミ
ング時の各要素プロセッサの通信方式の選択を模式的に
表している。
【0066】本発明では単方向一次元の並列計算機にお
いて、始端フリットが宛先要素プロセッサに到着後、連
続送受信機構を使用できる場合には使用することが可能
となり、通信メッセージのルート上の要素プロセッサの
占有時間を減少せしめることができ、結果スループット
を向上させることができる。
【0067】なお、メッセージのフリットへの分割数N
を可変にする場合には、始端フリットにNの値が記録す
ることができる始端フリット記録部を設ければよい。
【0068】本発明は、本実施例の構成だけではなく、
双方向通信チャネルを持つ場合や、多次元の場合、並列
計算機のプロセッサ間結合方式やデッドロックの回避の
方法などによらず適用できることは明かである。
【0069】
【発明の効果】第1の発明によれば、処理の多くをソフ
トウェアにて処理を行うので、その仕様、処理内容には
大きな自由度を持たせることが出来る。
【0070】また、第2の発明によれば、要素プロセッ
サ間通信において、通信メッセージのルート上の要素プ
ロセッサの占有時間を減少せしめることができ、結果通
信に関するスループットを向上させることができる。
【図面の簡単な説明】
【図1】第2の発明に係る並列計算機の構成を示した図
である。
【図2】プロセッサ間通信経路の例を示した図である。
【図3】2×2の基本スイッチを示した図である。
【図4】8×8のスイッチ構成を示した図である。
【図5】集中、分散ネットワークを示した図である。
【図6】第2の発明に係る要素プロセッサの概要のブロ
ック図である。
【図7】第2の発明に係る要素プロセッサのブロック図
である。
【図8】通信方式が順次、連続送受信方式に変わってい
く状態を示した説明図である。
【図9】通信方式が順次、ワームホールルーティング方
式に変わっていく状態を示した図である。
【図10】第1実施例におけるフリットの構成を示した
図である。
【図11】送受信方式選択部1810の構成を示した図
である。
【図12】選択方式判定部1850の出力値決定アルゴ
リズムである。
【図13】従来の基本スイッチを示した図である。
【図14】従来のATM変換機の概要を示したブロック
図である。
【図15】従来の並列計算機を構成する要素プロセッサ
の一構成例を示した構成図である。
【図16】従来用いられている要素プロセッサの概要図
である。
【図17】従来の並列計算機を並列に構成した例であ
る。
【図18】ワームホールルーティングにおける送受信タ
イミング図である。
【図19】従来の並列計算機の構成と通信形態を示した
説明図である。
【図20】従来の並列計算機の他の構成と通信形態を示
した説明図である。
【符号の説明】
101 プロセッサ 103 Nレジスタ 105 Wレジスタ 107 Sレジスタ 109 Eレジスタ 111 LSIチップ 113 要素プロセッサ 115 S/P変換部 117 P/S変換部 119 LSIチップ 121 ATMプロセッサスイッチ 123 ATMプロセッサ 125 メモリ 127 外部バス 129 ATM交換機 131 ポートユニット 133 スイッチユニット 135 シグナルユニット 137 ATM端末 139 光ファイバ 141 より線対ケーブル 1000 ワームホールルーティング機構 1100 演算処理部 1200 メッセージ変換部 1300 ルーター部 1311 占有状態信号 1321 宛先判別信号 1331 宛先−送信元要素プロセッサ間距離信号 1400 −FIFO−メッセージ占有機構 1411 送信元信号 1500 送信用FIFO 1515 送信用FIFOのEnable信号 1600 宛先用FIFO 1610 宛先用FIFOモニター手段 1611 宛先FIFO空き領域数信号 1615 宛先用FIFOのEnable信号 1700 中継用FIFO 1710 中継用FIFOモニター手段 1715 中継用FIFOのEnable信号 1800 送受信方式制御部 1810 送受信方式選択部 1820 ワームホールルーティング機構 1830 連続送受信機構 1840 選択方式保持ラッチ 1850 選択方式判定部 1851 選択方式判定部信号 1860 マルチプレクサ 1870 宛先FIFO判定回路 1871 宛先FIFO状態判定信号 1900 受信側チャネル 1901 受信側受信要求信号 1902 受信側受信信号 1903 自要素プロセッサ選択通信方式信号 1910 受信側チャネル 1911 送信側受信要求信号 1912 送信側受信信号 1913 送信側隣接要素プロセッサ選択通信方式信号 ASW ATMスイッチ ATMC ATMコントローラ E/O 光ファイバとの接続に用いる光/電変換モジュ
ール PLC 物理層コントローラ SW I/F ATMセルにルーティングタグを付加、
削除するLSI TRX より線対ケーブル対応トランシーバ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 単数又は複数のプロセッサと、その入出
    力端子間又はプロセッサ間の結合ネットワークとを有
    し、その結合ネットワークの制御をを行う制御ソフトウ
    ェアを内部に有し、この制御ソフトウエアのもとに必要
    なネットワーク制御、及びコンピュータ間通信を行うこ
    とを特徴とする並列計算機。
  2. 【請求項2】 上記プロセッサは、上記結合ネットワー
    クをI/O命令の一部として実行する通信機構を有し、
    各プロセッサ間の通信を制御するソフトウエアカーネル
    を前記単一又は複数のプロセッサ中に有し、前記ソフト
    ウエアカーネルの制御のもとでプロセッサ間通信を並列
    に実行することを特徴とする請求項1記載の並列計算
    機。
  3. 【請求項3】 ATM通信におけるプロトコルの処理を
    行う並列計算機又はその機能を有するLSIチップ又は
    ハードウエアモジュールにおいて、 入力されるセルのヘッダのアドレスに従って対応する端
    子に接続し、前記セルの通信路確立のためのスイッチン
    グを行う複数の基本スイッチと、 この基本スイッチに前記スイッチングの制御命令を出力
    するATMプロセッサとを備え、 前記スイッチングの制御命令は変更可能な制御命令保持
    手段に保持されることを特徴とする並列計算機。
  4. 【請求項4】 通信メッセージを分割したフリット中の
    始端フリットの受信要求が宛先要素プロセッサに到着す
    るまでは、受信要求を行った後にフリットを送出するワ
    ームホールルーティング機構を選択し、前記始端フリッ
    トノ前記受信要求が前記宛先要素プロセッサに到着した
    後は、前記宛先要素プロセッサの宛先用FIFOに、連
    続送受信が可能なだけの空き領域があった場合に連続送
    受信を行う連続送受信機構を選択する送受信方式選択部
    を有する要素プロセッサを複数具備することを特徴とす
    る並列計算機。
  5. 【請求項5】 隣接する要素プロセッサからのフリット
    を受信し、この受信したフリットの送信先を判定するル
    ータ部と、 このルータ部にて自要素プロセッサに送信されたものと
    判定されたフリットを所定の数だけ保持する宛先用FI
    FOと、 この宛先用FIFOの受信可能領域を監視する宛先用F
    IFOモニター手段と、前記ルータ部にて自要素プロセ
    ッサに送信されなかったものと判定されたフリットを所
    定の数だけ保持する中継用FIFOと、 この中継用FIFOの受信可能領域を監視する中継用F
    IFOモニター手段と、前記宛先用FIFOで保持され
    たフリットをメッセージに再構成し、若しくは、自要素
    プロセッサから送信するメッセージを送信の宛先を示す
    情報が格納された始端フリットと前記メッセージの終端
    であることを示す情報が格納された終端フリットとを含
    むN個(Nは2以上)のフリットに分割するメッセージ
    変換部と、 送信元プロセッサから始端フリットが送信され、始端フ
    リットの受信要求信号を宛先要素プロセッサが受信する
    までは、前記ワームホールルーティング機構を選択し、
    始端フリットの受信要求信号を宛先プロセッサが受信し
    た後は、連続送受信許可信号により、前記ワームホール
    ルーティング機構、若しくは、連続送受信機構のいずれ
    の方式を選択する送受信方式選択部と、 前記メッセージ変換部にて分割されたフリット、若しく
    は前記ルータ部にて自要素プロセッサに前記送信された
    ものと判定されなかったフリットを他の隣接する要素プ
    ロセッサに終端フリットまで占有して送出する−FIF
    O−メッセージ占有機構と、 を備え、 前記ワームホールルーティング機構は、 自要素プロッサが発信元であったときに送信用FIFO
    にフリットが格納されている場合や、自要素プロセッサ
    が送信元でも宛先でもないときに中継用FIFOにフリ
    ットが格納されている場合には、前記フリットの宛先へ
    の経路上の隣接要素プロセッサへ受信要求信号を発する
    受信要求手段と、 自要素プロセッサが隣接要素プロセッサから受信要求信
    号を受けた場合、自要素プロセッサが前記フリットの宛
    先でなかったときは前記中継用FIFOモニター手段
    が、また、自要素プロセッサが前記フリットの宛先であ
    ったときは前記宛先用FIFOモニター手段が、それぞ
    れ受信可能であることを示しているときに前記フリット
    を受信し、受信信号を前記隣接要素プロセッサへ返信す
    る受信手段と、 自要素プロセッサが隣接要素プロセッサから受信信号が
    返信されたとき、残りのフリットについて前記隣接要素
    プロセッサへの受信要求手段を継続して行う受信要求継
    続手段と、 を備え、 前記連続送受信機構は、 自要素プロセッサが発信元であった場合には送信用FI
    FOに、自要素プロセッサが送信元でも宛先でもない場
    合には中継用FIFOに、それぞれフリットがある場合
    には、前記フリットの宛先への経路上の隣接要素プロセ
    ッサへ、前記隣接要素プロセッサが1フリット受信に十
    分な時間間隔である1サイクル毎に順次前記フリットを
    送信する連続送信手段と、 発信元への経路上の隣接要素プロセッサから送信された
    フリットを前記1サイクル毎に受信し、受信したサイク
    ル毎に受信信号を前記隣接要素プロセッサへ送信する連
    続受信手段と、を備えることを特徴とする並列計算機。
  6. 【請求項6】 前記送受信方式選択部は、 送信元から始端フリットが送信され、始端フリットの受
    信要求信号を宛先要素プロセッサが受信するまでは、ワ
    ームホールルーティング機構を選択し、 始端フリットの受信要求信号を宛先プロセッサが受信し
    た後は、 送信元要素プロセッサと宛先要素プロセッサの間の距離
    をLとし、前記中継用FIFOが前記フリットを格納し
    ておくための深さをDとしたとき、 宛先要素プロセッサの場合には、 分割されたフリットの数NがL×D以上のときは、宛先
    用FIFOモニター手段が示す空き領域数がL以上ある
    ならば連続送受信許可信号を、L以上ないならば連続送
    受信不許可信号を、受信信号を送信するのと同じタイミ
    ングで受信信号を送信する隣接要素プロセッサへ送信し
    た後、連続送信許可或いは不許可信号のどちらを送信し
    たかによってそれぞれ連続送受信機構或いはワームホー
    ルルーティング機構を選択し、また、NがL×D未満の
    ときは、宛先FIFOモニター手段が示す空き領域数が
    N/D(小数点以下は切り上げとする)以上あるならば
    連続送受信許可信号を、N/D(小数点以下は切り上げ
    とする)以上ないならば連続送受信不許可信号を、受信
    信号を送信するのと同じタイミングで受信信号を送信す
    る隣接要素プロセッサへ送信した後、連続送信許可或い
    は不許可信号のどちらを送信したかによってそれぞれ連
    続送受信機構或いはワームホールルーティング機構を選
    択する受信機構手段とを備え、 宛先でも送信元でもない要素プロセッサの場合には、 連続送受信許可或いは不許可信号を受信した後は、送信
    元への経路上にある隣接要素プロセッサへ受信した連続
    送受信許可/不許可信号を、受信信号を送信するのと同
    じタイミングで前記隣接要素プロセッサへ送信するとと
    もに、それぞれの場合において連続送受信機構或いはワ
    ームホールルーティング機構を選択する手段とを備え、 送信元要素プロセッサの場合には、 連続送受信許可或いは不許可信号を受信した後は、それ
    ぞれの場合において連続送受信機構或いはワームホール
    ルーティング機構を選択する手段とを備える、 ことを特徴とする請求項5記載の並列計算機。
JP5588295A 1995-03-15 1995-03-15 並列計算機 Pending JPH08251196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5588295A JPH08251196A (ja) 1995-03-15 1995-03-15 並列計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5588295A JPH08251196A (ja) 1995-03-15 1995-03-15 並列計算機

Publications (1)

Publication Number Publication Date
JPH08251196A true JPH08251196A (ja) 1996-09-27

Family

ID=13011479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5588295A Pending JPH08251196A (ja) 1995-03-15 1995-03-15 並列計算機

Country Status (1)

Country Link
JP (1) JPH08251196A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312480A (ja) * 2000-05-01 2001-11-09 Nec Corp マルチプロセッサシステム
JP2001344228A (ja) * 2000-05-31 2001-12-14 Nippon Telegr & Teleph Corp <Ntt> 暗号化通信におけるサービス品質制御方法及び装置サービス品質制御プログラムを格納した記憶媒体
US7305487B2 (en) 2001-02-24 2007-12-04 International Business Machines Corporation Optimized scalable network switch
WO2009133918A1 (ja) * 2008-04-30 2009-11-05 日本電気株式会社 ルータ、そのルータを有する情報処理装置及びパケットのルーティング方法
US8937958B2 (en) 2012-05-31 2015-01-20 Kabushiki Kaisha Toshiba Router and many-core system

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312480A (ja) * 2000-05-01 2001-11-09 Nec Corp マルチプロセッサシステム
JP2001344228A (ja) * 2000-05-31 2001-12-14 Nippon Telegr & Teleph Corp <Ntt> 暗号化通信におけるサービス品質制御方法及び装置サービス品質制御プログラムを格納した記憶媒体
US7305487B2 (en) 2001-02-24 2007-12-04 International Business Machines Corporation Optimized scalable network switch
US7668970B2 (en) 2001-02-24 2010-02-23 International Business Machines Corporation Optimized scalable network switch
WO2009133918A1 (ja) * 2008-04-30 2009-11-05 日本電気株式会社 ルータ、そのルータを有する情報処理装置及びパケットのルーティング方法
JP5387918B2 (ja) * 2008-04-30 2014-01-15 日本電気株式会社 ルータ、そのルータを有する情報処理装置及びパケットのルーティング方法
US8638665B2 (en) 2008-04-30 2014-01-28 Nec Corporation Router, information processing device having said router, and packet routing method
US8937958B2 (en) 2012-05-31 2015-01-20 Kabushiki Kaisha Toshiba Router and many-core system

Similar Documents

Publication Publication Date Title
US5524113A (en) ATM switch interface
US4933846A (en) Network communications adapter with dual interleaved memory banks servicing multiple processors
US5943481A (en) Computer communication network having a packet processor with subsystems that are variably configured for flexible protocol handling
EP1208447B1 (en) Network processor, memory organization and methods
US7337253B2 (en) Method and system of routing network-based data using frame address notification
KR100277167B1 (ko) 가상버스들을사용한연결망을갖는분산컴퓨팅시스템및데이터통신방법
JPH0619785A (ja) 分散共有仮想メモリーとその構成方法
JP3730471B2 (ja) パケット転送装置
EP0884924B1 (en) ATM Communication apparatus
JPH02151151A (ja) 交換システム
WO2001017179A1 (en) Network switch using network processor and methods
EP1226509A1 (en) Network processor processing complex and methods
Ahuja S/Net: A high-speed interconnect for multiple computers
KR100370637B1 (ko) 컴퓨터구조
JPH08251196A (ja) 並列計算機
US7218638B2 (en) Switch operation scheduling mechanism with concurrent connection and queue scheduling
US6035366A (en) Computer architecture using packet switches for internal data transfer
US20040081158A1 (en) Centralized switching fabric scheduler supporting simultaneous updates
JPH05274279A (ja) 並列処理装置及び方法
Aust et al. Real-time processor interconnection network for fpga-based multiprocessor system-on-chip (mpsoc)
Tomiyasu et al. KUMP/D: the Kyushu University multi-media processor
Hedberg The multiple crossbar network interface
JP3075276B2 (ja) ファイバーチャネルファブリックおよびファブリックポート
Hill Design and Applications for the IMS C004
JPH06187311A (ja) マルチプロセッサシステムおよびプロセッサ間通信方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031216