JPH0887479A - 計算機システム - Google Patents

計算機システム

Info

Publication number
JPH0887479A
JPH0887479A JP22450394A JP22450394A JPH0887479A JP H0887479 A JPH0887479 A JP H0887479A JP 22450394 A JP22450394 A JP 22450394A JP 22450394 A JP22450394 A JP 22450394A JP H0887479 A JPH0887479 A JP H0887479A
Authority
JP
Japan
Prior art keywords
reception
packet
data
transmission
flag area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP22450394A
Other languages
English (en)
Inventor
Takeshi Aimoto
毅 相本
Kenji Nakajima
謙二 中島
Shinichi Tanabe
慎一 田辺
Kazuhiro Hashimoto
一弘 橋本
Hiroshi Iwamoto
博志 岩本
Satoshi Yoshizawa
聡 吉澤
Hideki Murayama
秀樹 村山
Takehisa Hayashi
林  剛久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP22450394A priority Critical patent/JPH0887479A/ja
Priority to US08/529,762 priority patent/US5835492A/en
Publication of JPH0887479A publication Critical patent/JPH0887479A/ja
Priority to US08/964,712 priority patent/US5936955A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、並列処理に適用できる高速
な相互結合網において、分散処理向けネットワークとし
て利用可能時に,連続する複数個のパケットを相互結合
網内で連続して転送することにより,通信ソフトウエア
のオーバヘッドを小さくする相互結合網を実現すること
である。 【構成】 計算機ノード100は、パケット転送アダプタ1
10を備え,パケット転送アダプタ110はパケット通信ネ
ットワーク190を介して他の計算機ノード100との間でパ
ケット通信を行なう。パケット転送アダプタ110から送
信されたパケットは連続受信指示情報を持ち,該連続受
信指示情報がオンの場合,パケット通信ネットワーク19
0は同一送信側計算機からのパケット転送パスを,パケ
ット転送後も開放せず,この機能により受信側計算機は
同一送信側計算機からパケットを連続受信できる。 【効果】 以上本発明によれば、連続する複数個のパケ
ットを相互結合網内で連続して転送することにより,通
信ソフトウエアのオーバヘッドが改善できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は2以上の計算機システム
間を相互結合網を介して接続し、処理を行なうデータ処
理システムに係り、システムの処理効率向上を図るのに
有効なデータ転送方式に係る。
【0002】
【従来の技術】本発明に関連する技術として「オペレー
ティングシステムの設計II,XINUによるインターネッ
トワークの構築:ダグラス・カマー著,村井純監修,歌
代和正・酒匂順子訳,啓学出版,1991年11月」の
21頁から24頁に記載の技術がある。この従来例では
送信側計算機で送信データを複数のパケットに分割し、
パケット単位でネットワークに送出する。受信側計算機
では、パケットを受信する毎にオペレーティング・シス
テムに対して、割り込み処理を用いてパケットの到着を
通知する。通知を受けたオペレーティング・システムは
受信したパケットの先頭部分に格納された情報を参照
し、到着したパケットが受信データの最終パケットであ
るか否かを判定する。最終パケットであった場合、通信
データの送り先プログラムが受信待ち状態にあれば割り
込みを用いて通信データ到着を通知し、また受信待ち状
態にない場合には、受信要求が出されるまで通信データ
を保持しておき、受信要求が出された時にそのデータを
渡す処理を行う。
【0003】また,このデータを渡す処理は,オペレー
ティング・システムが受信パケットを一旦受信した後,
アプリケーションソフトウエアへ配信する。しかし,全
ての送信パケットが受信されるわけではない。パケット
喪失の原因には,例えば,イーサネット、FDDI等のLAN
(Local Area Network)上の通信で,受信側計算機の通信
アダプタの受信バッファオーバフロー等がある。このパ
ケット喪失に対する通信データの品質保証のため,オペ
レーティング・システムはパケット送達確認機能,再送
機能等を備える。しかし,このオペレーティング・シス
テムの通信ソフトウエアのオーバヘッドが大きく、通信
のスループット値は小さくなる。
【0004】
【発明が解決しようとする課題】計算機内で複数のプロ
グラムがプロセッサ処理時間の割当を受けながら同時並
行して実行されるマルチタスク環境では、割り込みが発
生すると現在実行中のプログラムは一時的に中断され、
割り込み処理が実行される。そのため実行中であったプ
ログラムの処理が遅延されると共に、割り込みに伴うソ
フトウェア・オーバヘッドも発生するため、システムの
処理効率が低下する。
【0005】更に、受信プログラムが受信待ち状態にあ
る場合、転送データの最終パケットの到着を契機に、プ
ロセッサ処理時間の割当をその受信プログラムに対して
切り替えるスイッチングが実行される。従って、計算機
内で同時並行に実行されるプログラムの数が多く、また
多数の通信処理が行われる場合、スイッチングの頻度が
高まり、各プログラムに一度に割り当てられるプロセッ
サ処理時間は短縮する。プログラムのスイッチングには
ソフトウェア・オーバヘッドが伴い、また各プログラム
に割り当てられるプロセッサ処理時間が短縮するとメモ
リ・アクセス時のキャッシュ・ミス頻度も高まり、シス
テムの全体処理効率の低下を招く。
【0006】本発明の第一の目的は、ネットワークで結
合された複数の計算機で構成される計算機システムに於
いて、割り込みに伴うソフトウェア・オーバヘッド,ス
イッチングに伴うソフトウェア・オーバヘッドを軽減し
てシステムの処理効率を向上することにある。
【0007】次に,上記,通信ソフトウエアのオーバヘ
ッドの別の例として,パケット並び変えのオーバヘッド
がある。送信元計算機Aから転送する通信データのサイ
ズが(メモリ上のページサイズで規定される)パケット
サイズを越え,複数のパケットに分割されて転送される
場合,受信側の計算機では送信元計算機Aからのパケッ
トは他の複数の送信元計算機からのパケットと混在して
受信してしまう。このため,受信側計算機の通信ソフト
ウエアでは,混在パケットを受信宛先プロセス毎に整理
する必要があるが,この通信処理のオーバヘッドも発生
するため,スループット値が低下する。
【0008】本発明の第二の目的は、ネットワークで結
合された複数の計算機で構成される計算機システムに於
いて、複数の通信パケットに分解された通信データを受
信した受信側計算機での並び変え処理のソフトウエアの
オーバヘッドを小さくする相互結合網を実現することで
ある。
【0009】以上,本発明の目的は、ネットワークで結
合された複数の計算機で構成されるネットワーク計算機
システムに於いて、上述のソフトウェア・オーバヘッド
を軽減してシステムの処理効率を向上することにある。
【0010】
【課題を解決するための手段】上記第一の目的を達成す
るため、本発明では以下の受信通知フラグ領域,受信通
知フラグ領域設定手段,受信通知判定手段,受信プログ
ラム状態フラグ領域を設ける。
【0011】受信通知フラグ領域は、送信側計算機に設
けた受信通知フラグ領域設定手段によってパケット送出
時に設定され、受信側計算機に対してパケット受信時に
受信通知を発行する必要があるか否かを指定する。
【0012】受信側計算機では、受信通知判定手段によ
って受信したパケットの前記受信通知フラグ領域を参照
し、その値に基づいて受信通知を発行するか否かを判定
し、必要であれば受信通知を発行する。
【0013】また、受信プログラム状態フラグ領域を設
け、受信プログラムが受信待ち状態にあるか否かを状態
として格納することにより、前記受信通知判定手段は受
信プログラムが受信待ち状態にある場合にのみ受信通知
を発行する。
【0014】更に、受信通知フラグ領域設定手段に於い
て、送信データ数,送信データ累計長、または経過時間
に応じて受信通知フラグ領域を設定するか否かを決定す
る手段を設けることにより、複数通信データ毎のみに受
信計算機側で受信通知を発行する様に指定する。
【0015】上記第二の目的を達成するため、本発明で
は以下の連続受信指示フラグ領域,連続受信指示フラグ
領域設定手段,連続受信指示実施手段,受信バッファ状
態判定手段を設ける。
【0016】連続受信指示フラグ領域は、送信側計算機
に設けた連続受信指示フラグ領域設定手段によってパケ
ット送出時に設定され、相互結合網の連続受信指示実施
手段に対してパケット転送の切れ目で他の送信元に対し
て転送路を明け渡すか否かを指示する。
【0017】受信側計算機では、受信バッファ状態判定
手段によって受信したパケットの前記連続受信指示フラ
グ領域を参照し、その値に基づいて,受信バッファ枯渇
状態に於いて受信パケットを廃棄するか否かを判定す
る。
【0018】更に、連続受信指示フラグ領域設定手段に
於いて、送信データ数,送信データ累計長、または経過
時間に応じて連続受信指示フラグ領域を設定するか否か
を決定する手段を設けることにより、複数通信データ毎
のみに受信計算機側で受信通知を発行する様に指定す
る。
【0019】
【作用】本発明によれば、送信側の計算機の通信ソフト
ウエアは送信メッセージのサイズに応じて,メッセージ
のサイズがパケットサイズを越える場合は,送信パケッ
トの制御フラグに連続受信指示情報を指定する。送信側
計算機内の相互結合網アダプタは該連続受信指示情報に
基づき,パケットヘッダ情報内に連続受信指示情報を付
加して送信する。相互結合網は送信パケットの制御フラ
グの指定に従って,パケット転送の切れ目で,パケット
転送パスを切断し他の計算機からのパケットに開放する
か,開放せず同一送信元からのパケット転送パスを確保
するかを判断する。前記連続受信指示フラグが指定され
た場合には,廃棄が行われず,且つ相互結合網がフロー
制御機能を備えているので,障害発生時以外では,送信
側がパケットを送信した順に受信することが保証され
る。受信側の計算機は同一送信元からのパケット長を越
えるメッセージを連続したパケットとして受信でき,こ
れにより通信ソフトウエアは順序並び変えの処理は起動
されない。
【0020】
【実施例】並列計算機システムの構成を図1に示す。
【0021】並列計算機システムは並列計算機10とワー
クステーション40と端末30等をLAN20で結合している。
【0022】並列計算機10は、2つ以上の個別の計算機
単位単位(以下、PE:Processig Elem
ent)100-i,j,kがパケット通信ネットワーク190に結
合して構成される。PE110-iは、PE110-iからのパケット
転送信号線191-m、PE110-iへのパケット転送信号線192-
mによってパケット通信ネットワーク190に接続される。
本実施例では、PE100-i,j,kとパケット通信ネットワ
ーク190は別々の装置であり、独立の筐体に実装されて
いるが、同一の筐体に実装されてたとしても構わない。
【0023】以下、PE100-iの構成を説明する。PE1
00-iは、最小構成はプロセッサ130、メモリ160、ネット
ワークアダプタ110が、システムバス180に結合されて構
成される。PE100-iは、システムの構成によっては、
1つ又は、それ以上のI/O装置140を持つ。プロセッサ13
0は、たとえばCPUによって構成される。メモリ160は、
たとえばRAMによって構成される。メモリ160内には、OS
空間160とユーザ空間170によって構成され、OS空間160
には、送信コマンド領域161、送信パケット領域162、受
信コマンド領域163、受信パケット領域164が存在し、ユ
ーザ空間170にはユーザデータ領域T172、ユーザデータ
領域R174が存在する。
【0024】パケット転送アダプタ回路110は、DMA制御
部120、送信用バッファ121、受信用バッファ122、ネッ
トワーク送受信部118、送信コマンド制御情報保持手段1
11、受信コマンド制御情報保持手段112、割込制御情報
保持手段113、アダプタ制御情報保持手段114、アダプタ
制御手段115、送信DMA制御情報保持手段116、受信DMA制
御情報保持手段117が、内部バス125によって結合させて
構成される。送信コマンド制御情報保持手段111、受信
コマンド制御情報保持手段112、割込制御情報保持手段1
13、アダプタ制御情報保持手段114、送信DMA制御情報保
持手段116、受信DMA制御情報保持手段117は、送受信パ
ケットをDMA処理により転送制御する際に必要な情報を
保持する手段であり、たとえばRAMによって構成するこ
とができる。
【0025】アダプタ制御情報保持手段114はパケット
転送アダプタ回路110の動作モード等を設定するための
手段である。アダプタ制御手段115は、送受信パケット
をDMA処理により転送制御する際の制御をパケット転送
アダプタ回路110にプロセッサ130が通知するための手段
であり、TTL、CMOS等の論理によって構成することがで
きる。DMA制御部120および、ネットワーク送受信部118
は、たとえば、TTL、CMOS等の論理によって構成するこ
とができる。送信用バッファ121、受信用バッファ122
は、たとえばRAMによって構成することができる。
【0026】パケット転送信号線とパケット通信ネット
ワークの構成を図2に示す。
【0027】パケット通信ネットワーク190はPE間送受
信回路220-m,nとクロスバスイッチ回路240とスイッチ制
御回路250から構成される。スイッチ接続要求信号248-m
はクロスバスイッチ回路240の接続要求信号であり、パ
ケット転送開始時の接続要求と転送完了時の切断要求に
用いる。スイッチ接続応答信号249-mはスイッチ接続要
求信号248-mに対する応答信号である。スイッチ制御回
路250からの指示に基づいて、パケット通信経路の切り
替える。PE間送受信回路220-mはPE100-iとパケット通信
ネットワーク190間のインタフェース回路であり、PE100
-iとクロスバスイッチ回路240との間で送受信を行な
う。パケット転送信号線191-m、291-mはPE110-iからの
パケットをクロスバスイッチ回路240に転送する信号線
であり、パケット転送信号線292-m、192-mはクロスバス
イッチ回路240からのパケットをPE110-iに転送する信号
線である。パケット転送信号線291-n、191-nはPE110-j
からのパケットをクロスバスイッチ回路240に転送する
信号線であり、パケット転送信号線192-n、292-nはクロ
スバスイッチ回路240からのパケットをPE110-jに転送す
る信号線である。
【0028】パケット転送信号線191-mは、パケットデ
ータを転送するパケットデータ線201-m、パケットデー
タ線201-m上のデータがパケットの先頭であることを示
すフラグ線202-m、タイミング情報を転送するクロック
線203-m、パケット通信ネットワーク190がパケットを受
信可能であることを通知する送信許可信号204-m、PE100
-iからの接続要求を示す接続要求信号205-mから構成さ
れる。パケット転送信号線291-mは、パケットデータ線2
61-m、フラグ線262-m、クロック線263-m、送信許可信号
264-mから構成される。パケット転送信号線192-mは、パ
ケットデータ線211-m、フラグ線212-m、クロック線213-
m、PE100-iがパケットを受信可能であることを通知する
送信許可信号214-mから構成される。パケット転送信号
線292-mは、パケットデータ線271-m、フラグ線272-m、
クロック線273-m、送信許可信号274-mから構成される。
上記パケット転送信号線191-m、192-m等の構成は、論理
的な信号線を示しており、必ずしも別々の信号線で構成
される必要はない。
【0029】送信許可信号204-mはPE間送受信回路220-m
内の受信バッファの受信可能であることを通知するフロ
ー制御用の信号である。フロー制御はセル単位で行なわ
れる。セルはPE間でパケットを分解して転送する際のデ
ータ単位である。送信許可信号304-mはPE間全パスでは
なく、個別のパスのフロー制御を行なう。この場合、パ
ケット転送中に順次、送信側PE100-i内のメモリ150から
パケット通信ネットワーク190までのパスを確保し、パ
ケット通信ネットワーク190内のクロスバスイッチ回路2
40のパスが空き次第、PE間送受信回路220-mからPE間送
受信回路220-nまでのパスを確保し、パケット通信ネッ
トワーク190から受信側PE100-j内のメモリ150までのパ
スを順に確保する。これらのパスには同一パケットのセ
ルが存在し、送信完了後、順にパスを開放する。
【0030】次に、図3を用いてPE間通信パケットの実
施例を示す。図2は並列 計算機10のパケット通信ネッ
トワーク190を通じて転送するデータ300の構造を示す説
明図である。
【0031】転送データ300は先ず予め定められたデー
タ長の分割データ301A〜Mに分割され、パケットヘッ
ダ303を先頭に付与したパケット302に形成される。本分
割処理及びパケット形成処理は、プロセッサ130によっ
て行われ、その際、これらのデータはメインメモリ150
上に保持しておく。パケットヘッダ303内には、データ3
10、タイプ320、送信元アドレス321、受信先アドレス32
2から構成される。更に、本発明による受信通知フラグ
領域311、連続受信指示情報312を設ける。タイプ320
は、パケット転送アダプタ回路110が処理するために必
要な情報であり、たとえばデータ全体の長さ等を保持す
る。送信元アドレス321は、パケットを送出したネット
ワーク内計算機200を識別するための識別子である。受
信先アドレス322は、パケットを受信すべきネットワー
ク内計算機200,及び送信先プログラムを識別するため
の識別子である。連続受信指示情報312はステップ630で
送信側のPE間送受信回路220-mがパケット転送完了時に
スイッチ接続要求信号248-mに切断指示を行なうか否か
を示す情報で有る。
【0032】連続転送モードでは,受信通知フラグ領域
311は、転送データ300内の最後の分割データ301Mを格
納するパケット302Mに於いてのみ設定し、他の分割デ
ータを格納するパケットでは設定しない。連続受信指示
情報312は,転送データ300内の最後の分割データ301M
を格納するパケット302M以外で設定し、パケット302M
では設定しない。
【0033】これにより後述する様に、受信側プロセス
では転送データ300内の最後の分割データ301Mを格納し
たパケット302Mを受信した時のみに、そのデータが到
着したことを受信プログラムに通知する必要があると判
定できる。そのため他の分割データを格納したパケット
を受信した時にはデータ到着の通知を行わなくなり、通
知処理に起因する計算機10の処理効率低下を軽減するこ
とができる。
【0034】連続転送モードを使用しない場合では,受
信通知フラグ領域311は、全てのパケット302A…Mに設
定する。連続受信指示情報312は,全てのパケット302A
…Mに設定しない。
【0035】パケット301が形成されると、順番にパケ
ット転送アダプタ110を経由して、パケット通信ネット
ワーク190に送出する。
【0036】以下、送信処理、受信処理の概要を示す。
【0037】送信処理は、ユーザデータT172と送信コマ
ンド情報161とから本発明ネットワークパケットを作成
してネットワークに出力する処理である。以下、送信時
のソフトウエア処理およびネットワークアダプタ110の
動作を示す。
【0038】送信処理の際の通信処理を行うソフトウエ
ア処理を図4にしたがって説明する。ユーザデータT172
には、送信対象となるユーザデータが保持されている。
まず、ステップ410に示すように送信コマンド情報161に
は、連続受信指示情報312,受信通知フラグ311,タイプ
320、送信元アドレス321、受信先アドレス322の元にな
る情報を設定する。
【0039】次に、ステップ420に示すように、送信コ
マンド情報161にユーザデータT172を指定する情報を設
定する。設定する情報としては、たとえばユーザ空間17
0におけるユーザデータT172のアドレスおよび、データ
長等がある。
【0040】次に、ステップ430に示すように、送信コ
マンド情報161の情報を送信コマンド制御情報保持手段1
11に設定する。送信コマンド制御情報保持手段111に設
定する情報としては、OS空間160における該設定送信コ
マンド情報161のアドレス等がある。
【0041】最後に、ステップ440に示すように、アダ
プタ制御手段115にたいして動作の起動通知を行う。上
記の処理により送信ソフト処理を行う。
【0042】次に、送信処理の際のネットワークアダプ
タ110の動作を図5にしたがって説明する。アダプタ制御
手段115に対する動作の起動通知によって送信動作開始
以降の動作について示す。
【0043】まず、ステップ510に示すように、DMA制御
部120は、送信コマンド制御情報保持手段111の情報に基
づいて送信コマンド領域161の内容を読み出し、送信DMA
制御情報保持手段116に設定する。
【0044】次に、ステップ520に示すように、DMA制御
部120は、送信DMA制御情報保持手段116の内容からタイ
プ320、連続受信指示情報312,受信通知フラグ311,送
信元アドレス321、受信先アドレス322を取り出す。
【0045】次に、ステップ530に示すように、DMA制御
部120は、送信DMA制御情報保持手段116の内容にしたが
って、ユーザデータT172を送信用バッファ121に読み込
む。
【0046】次に、ステップ540に示すように、DMA制御
部120は、ユーザデータT172をデータ310とし、読み出し
た送信コマンド領域161の情報:タイプ320、連続受信指
示情報312,受信通知フラグ311,送信元アドレス321、
受信先アドレス322から、本発明のネットワークパケッ
トをセル単位で送信用バッファ121に作成する。
【0047】最後に、ステップ550に示すように、内部
バス125を介して、ネットワーク送受信部118から、ネッ
トワークパケットを構成し,セル単位で出力する。
【0048】ステップ560に示すように、送信パケット
の最終セルを送信すると、ステップ570にブランチす
る。最終セルでない場合には、ステップ530にブランチ
する。
【0049】ネットワークパケットの出力が完了する
と、送信コマンド領域161にパケット送信の完了状態を
書き込む。また、ステップ570に示すように、送信コマ
ンド制御情報保持手段111内情報にパケット送信完了を
反映する。送信ソフトウエアは送信コマンド領域161に
書き込まれたパケット送信の完了状態に基づいて送信後
処理を行う。
【0050】さらに、送信未の送信コマンドがあると、
ステップ580に示すように、ステップ510に戻る。無い場
合は、送信動作が終了する。
【0051】次に、送信処理の際のパケット通信ネット
ワーク190のPE間送受信回路220-mの送信動作を図6に従
って説明する。
【0052】まず、ステップ610に示すように、送信パ
ケットの先頭を認識すると,受信先アドレス322に基づ
いてスイッチ制御回路250に対する接続要求をスイッチ
接続要求信号248-mに送信する。
【0053】次に、ステップ620に示すように、スイッ
チ制御回路250からの接続完了通知をスイッチ接続応答
信号249-mから受信すると,パケット転送信号線291-mに
クロスバスイッチ回路240に対するパケットのセル送信
を開始する。
【0054】次に、ステップ625に示すように、送信パ
ケットの転送完了まで,ステップ620を実行し,転送完
了するとステップ630にブランチする。
【0055】次に、ステップ630に示すように、パケッ
トの制御情報として連続受信指示情報312の指示が無い
場合には,ステップ640にブランチする。ある場合に
は,送信動作を完了する。
【0056】ステップ640では、スイッチ制御回路250に
対する切断要求をスイッチ接続要求信号248-mに送信す
る。
【0057】次に、ステップ650に示すように、スイッ
チ制御回路250からの切断完了通知をスイッチ接続応答
信号249-mから受信すると,送信動作を完了する。
【0058】連続受信指示情報312がある場合の次パケ
ットの送信は,前パケットと同一のPEに対して行われ,
クロスバスイッチ回路240を切り替える必要はない。図
6では,スイッチ制御回路250がクロスバスイッチ回路2
40を切断してはいないが,次パケットの送信は,ステッ
プ610に示すように、受信先アドレス322に基づいてスイ
ッチ制御回路250に対する接続要求を,再度スイッチ接
続要求信号248-mに送信する。別の実施例としては前パ
ケットに連続受信指示情報312がある場合,ステップ610
では、スイッチ接続要求信号248-mを送信しない処理も
あり得る。
【0059】次に,パケット転送アダプタ回路110内の
割り込み制御論理を,図7に示す。パケット転送アダプ
タ回路110は、受信したパケット302を格納する受信バッ
ファ122,DMA制御部120,割込制御情報保持手段113によ
って構成される。割込制御情報保持手段113はプログラ
ムの状態フラグを格納する領域であり,複数のプログラ
ム状態フラグ701A〜Kによって構成される。各フラグ
は受信側計算機100内で実行中のプログラムが通信デー
タ受信待ち状態にあるか否かを示す。割込制御情報保持
手段113の設定、及び参照の手順については、処理フロ
ーを説明する際に詳述する。DMA制御部120は,受信バッ
ファ122に格納されたパケット302をシステムバス180を
通じてメインメモリ150に転送する処理を制御する機能
のほかに,受信通知判定部710,及びシステムバス180を
通じて行うプログラメインメモリ150メインメモリ50
2上に設けることもできる。
【0060】パケット302が受信バッファ122に格納され
ると、受信通知判定部710は受信通知フラグ領域311、及
び割込制御情報保持手段113を参照し、プログラムへの
受信通知を行う必要があると判定した場合には、割込制
御部720を起動する。
【0061】次に、ネットワークパケットを取り込んで
から、データを受信するまでのネットワークアダプタ11
0の動作について、図8に示す。アダプタ制御手段115に
対する動作の起動通知によって受信動作開始以降のフロ
ーについて示す。図8ではDMA制御部120を中心として、
示している。
【0062】まず、ネットワークアダプタ110内のネッ
トワーク送受信部118は、ネットワーク190を監視して、
受信ネットワークパケットを受信用バッファ122に取り
込み、取り込むとDMA制御部120に通知する様、常時機能
している。本発明の実施例では、パケット通信ネットワ
ーク190は、高速パケット転送に適したスイッチ型ネッ
トワークに限定して示しているため、パケット通信ネッ
トワーク190が受信先アドレス322-aの情報が受信先PEの
アドレスと一致したパケットを転送するため、受信先PE
での受信先アドレス322-aのチェックは不要である。本
発明の別の実施例では、パケット通信ネットワーク190
が、バス型、リング型のトポロジをもっても構わない。
この場合も、ハードウエアフロー制御を行なうことが可
能であるが、受信先PEでの受信先アドレス322-aのチェ
ックが必要となる。
【0063】ステップ805に示すように、ネットワーク
送受信部118からのセル受信の通知を待つ。ステップ810
でセル受信の通知がある場合には、ステップ815にブラ
ンチし、ない場合にはステップ805にブランチする。セ
ル受信の通知がある場合には、ステップ815に示すよう
に、受信用バッファ122から受信セルを読み出す。ステ
ップ820に示すように、読み出した受信セルがパケット
の先頭であった場合にはステップ830を、先頭ではない
場合にはステップ825を実行する。
【0064】先頭ではない場合にはステップ825に示す
ように、受信用バッファ122内の受信セルを廃棄する。
これは、PE100-iとパケット通信ネットワーク190が未接
続状態では、パケット通信ネットワーク190のPE間送受
信回路220-mが廃棄していたパケットを、接続した直後
にPE間送受信回路220-mからPE100-iに転送したセルがパ
ケットの途中からであり、途中から受信したパケットの
受信処理であり、パケットの先頭セルを受信するまでセ
ルは廃棄される。
【0065】先頭の場合にはステップ830に示すよう
に、DMA制御部120は、まず、受信コマンド制御情報保持
手段112内に保持している情報に基づき、受信コマンド
領域163内に未実行の受信コマンドが有るか無いかを判
定する。有る場合にはステップ835を、無い場合にはス
テップ865を実行する。
【0066】有る場合にはステップ835に示すように、
受信コマンド制御情報保持手段112内の情報に基づき、
受信コマンド領域163内の未実行の受信コマンドの情報
をリードし、受信DMA制御情報保持手段117に設定する。
受信コマンド領域163内の未実行の受信コマンドの情報
に割込み発生の指定がある場合には、割込み制御情報保
持手段113にも設定する。
【0067】次に、ステップ840に示すように、受信DMA
制御情報保持手段117の情報に基づき、受信パケット領
域164へ受信セルをDMA転送する。
【0068】次に、ステップ845に示すように、受信セ
ルがパケット形式を遵守しているか、否か、パケット転
送異常終了通知セルではないかを判定し、さらに、ステ
ップ850に示すように、受信セルがパケットの最終セル
であるか否かを判定する。ステップ850で、受信セルが
パケットの最終セルではない場合には、ステップ840に
ブランチし、次の受信セルをDMA転送する。また、受信
セルがパケット形式を遵守し、且つ受信セルがパケット
の最終セルである場合、またはステップ845で、受信セ
ルがパケット形式を遵守していない場合、ステップ860
にブランチする。ステップ860では、受信コマンドに対
するパケット受信の処理が完了したので、受信コマンド
領域163に受信DMA終了状態をライトする。ステップ845
からブランチした場合には障害終了報告を、ステップ85
0から移動した場合には、正常終了報告をライトする。
更に、割込制御情報保持手段113の内容にしたがってプ
ロセッサ130に対して割込を発行する。また、次の受信
コマンドの実行に備えるために、受信コマンド制御情報
保持手段112内の情報を更新する。
【0069】次に、ステップ805により、受信コマンド
領域163内に未実行の受信コマンドが無い場合には、ス
テップ865にブランチする。ステップ865では、連続受信
指示フラグがある場合には、ステップ805にブランチ
し、連続受信指示フラグが無い場合には、ステップ870
にブランチする。
【0070】ステップ870では、受信用バッファ122から
受信セルを読み出す。次に、ステップ880に示すよう
に、受信用バッファ122内の受信セルを廃棄する。これ
は、受信コマンド領域163内に未受信コマンドがない場
合に、受信ソフト前処理が起動され、未受信コマンドが
供給されるまでの間、ネットワークアダプタ受信動作が
停止し、さらに送信許可信号214-mをオフにするフロー
制御により、パケット転送アダプタ回路110やパケット
転送ネットワーク190上に、パケット転送が停止するた
め、全体の通信が閉塞してしまうことを回避するためで
ある。受信パケット廃棄指示情報はソフトウエアによっ
て、アダプタ制御情報保持手段114に設定されるか、ま
たはアダプタ制御手段115に指示される。
【0071】アダプタ制御手段115に対する動作の起動
通知によって受信動作開始する以前は、ステップ870、
ステップ880と同様のフローで、又は送信許可線214-mを
オンに固定することで、受信パケットの廃棄を行なう。
【0072】次にデータ到着後に行う受信ソフト後処理
について述べる。受信ソフト後処理は、ネットワークパ
ケットがハードウエアにより、ユーザデータおよび受信
プロトコル情報に分割して転送した後に発行した割込に
よって起動される。
【0073】まず、割込が発行されると、プロセッサ13
0は受信コマンド領域163の受信完了の受信コマンドを終
了状態にしたがって、処理を行なう。正常終了の場合は
ユーザデータ領域Rへ転送し、異常終了状態の場合は障
害ログを保存し、再送処理を行なう。
【0074】次に,図11にステップ860の動作を示
す。
【0075】ステップ861は、受信コマンド領域163へ受
信DMA終了状態をライトする。
【0076】次に受信通知フラグ領域311が設定されて
いる場合には、ステップ863に進み、送信先アドレス321
を基に送信先プログラムを割り出し、該当するプログラ
ムの状態を割込制御情報保持手段113から参照する。
【0077】割込制御情報保持手段113が設定されてい
ない場合、即ち、送信先プログラムが受信待ち状態に無
い場合には、ステップ866に進み、受信コマンド制御情
報保持手段112内情報の更新処理を起動する。
【0078】割込制御情報保持手段113が設定されてい
た場合には、割込制御部720を起動して送信先プログラ
ムに対する受信通知処理を起動した上で、ステップ866
に進み、受信コマンド制御情報保持手段112内情報の更
新処理を起動する。
【0079】ステップ866の実行後は、ステップ830に戻
り、再び次の受信コマンドをリードする。
【0080】次に、通信処理の機能階層を図9に示す。
機能階層はユーザ空間170内のアプリケーションプログ
ラム910-i,j、920-i,j、OS空間160内の通信ソフト930-
i,j、940-i,j、パケット転送アダプタ950-i,j、パケッ
ト通信ネットワーク960から構成される。アプリケーシ
ョンプログラム910-i,jは、パケットを連続転送指示付
きパケットでパケット通信し、通信ソフト930-i,jを起
動する。アプリケーションプログラム920-i,jは、パケ
ットを連続転送連続転送指示無しパケットでパケット通
信し、通信ソフト940-i,jを起動する。PE100-iからPE10
0-jへパケットを転送する場合を説明する。
【0081】通信ソフト930-iは、連続転送指示付きパ
ケットの転送をパケット転送アダプタ950-iに指示し、
パケット通信ネットワーク960経由でパケットを連続転
送する。パケット転送アダプタ950-jは最後のパケット3
02Nからの受信通知指示に基づいて,通信ソフト930-jを
起動し、アプリケーションプログラム910-jにパケット
データを渡す。
【0082】通信ソフト940-iは、連続転送指示無しパ
ケットの転送をパケット転送アダプタ950-iに指示し、
パケット通信ネットワーク960経由でパケットを他の送
信元からのパケットとマルチプレクスされて転送する。
パケット転送アダプタ950-jは各パケット302A…302Nか
らの受信通知指示に基づいて,通信ソフト930-jを起動
し、アプリケーションプログラム910-jにパケットデー
タを渡す。
【0083】このように、複数の通信ソフトのどれを起
動するかを、パケットのフォーマット情報を元に決定す
ることが出来る。
【0084】次に、本発明の並列計算機の運用状況の一
例を図10に示す。図10では、並列計算機10内のPE10
0-0 … 100-i … 100-jは図9のアプリケーション
プログラム910-i,jが動作する部分1010と、図9のアプ
リケーションプログラム920-i,jが動作する部分1020の
2つに分けて、運用している。更に、分割して運用して
も構わない。叉、部分1010と部分1020は重なっていても
構わない。
【0085】
【発明の効果】本発明は以上説明したように構成されて
いるので、以下に記載されているような効果を奏する。
【0086】本発明によれば、送信側の計算機の通信ソ
フトウエアは送信メッセージのサイズに応じて,送信パ
ケットの制御フィールドに連続受信指示フラグを指定す
ることにより,受信側の計算機システムは同一送信元か
らのパケット長を越えるメッセージを連続したパケット
として受信でき,これにより通信ソフトウエアは順序並
び変えの処理は起動されないので,通信ソフトウエアの
オーバヘッドが小さくできる優れた効果がある。
【図面の簡単な説明】
【図1】本発明の並列計算機システムの全体構成ブロッ
ク図。
【図2】パケット転送信号線構成ブロック図。
【図3】通信パケット構成概念図。
【図4】送信ソフト処理の流れ図。
【図5】ネットワークアダプタ送信処理の流れ図。
【図6】パケット通信ネットワークの送信側PE間送受信
回路の送信処理の流れ図。
【図7】割り込み制御論理構成ブロック図。
【図8】ネットワークアダプタDMA制御部の受信動作の
流れ図。
【図9】通信処理の機能階層の概念図。
【図10】並列計算機の運用状態の一例のブロック概念
図。
【図11】ネットワークアダプタDMA制御部の受信動作
の流れ図。
【符号の説明】
100:PE 190:パケット通信ネットワーク 110:パケット転送アダプタ回路 120:DMA制御部 130:プロセッサ 140:I/O装置 150:メモリ 160:OS空間 170:ユーザ空間 180:システムバス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 橋本 一弘 神奈川県海老名市下今泉810番地 株式会 社日立製作所オフィスシステム事業部内 (72)発明者 岩本 博志 神奈川県海老名市下今泉810番地 株式会 社日立製作所オフィスシステム事業部内 (72)発明者 吉澤 聡 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 村山 秀樹 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 林 剛久 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】複数の計算機が相互結合網を介して該計算
    機間で通信データの転送を行いつつ処理を進める計算機
    システムにおいて,該通信データ内に連続受信指示フラ
    グ領域を設け,送信側計算機はデータ送信の際に連続受
    信指示フラグ領域の設定を行う手段と,該相互結合網
    は,該連続受信指示フラグがオンの該通信データの転送
    中は,該連続受信指示フラグの指示に応じて該相互結合
    網内の転送経路を他の通信データに開放しないことを特
    徴とする計算機システム。
  2. 【請求項2】受信側の計算機は、該連続受信指示フラグ
    がオンの該通信データの受信中は,主記憶内にパケット
    受信バッファ領域が準備できていない状態でも、受信パ
    ケットを廃棄せず,該受信側計算機内で該通信データの
    受信を行うプログラムに受信バッファ枯渇通知を通知す
    ることを特徴とする請求項1の計算機システム。
  3. 【請求項3】各計算機と相互結合網を別々の装置として
    構成し、相互結合網のスイッチ部分をクロスバ回路で構
    成し,相互結合網を介した計算機間の通信をフロー制御
    手段を用いてデータの喪失を防ぐことを特徴とする請求
    項1または2の計算機システム。
  4. 【請求項4】使用者は並列計算機装置を幾つかのグルー
    プに分割して使用でき、同一グループ内でアプリケーシ
    ョンプログラムの指定した通信プログラムが連続受信指
    示がオンの該通信データの転送のあるパケットを用いた
    通信を行なうか、行なわないかを選択することができる
    ことを特徴とする請求項1または2の計算機システム。
  5. 【請求項5】該相互結合網を通じて転送する該通信デー
    タ内に受信通知フラグ領域を設け,送信側計算機はデー
    タを送信する際に,前記受信通知フラグ領域の設定を行
    い、受信側計算機では前記通信データを受信した際に、
    前記受信通知フラグ領域の設定値に基づいて、前記受信
    側計算機内で前記通信データを受信するプログラムに対
    する受信通知を行うか否かを判定し、受信通知を行うと
    判定した場合にのみ受信通知を行うことを特徴とする請
    求項1または2の計算機システム。
  6. 【請求項6】前記受信側計算機内に受信プログラムの状
    態を示す受信プログラム状態フラグ領域を設け、前記通
    信データの受信時には、前記受信通知フラグ領域と共
    に、前記受信プログラム状態フラグ領域をも参照し、両
    フラグ領域の設定値に基づいて前記受信通知を行うか否
    かを判定する請求項5の計算機システム。
  7. 【請求項7】前記送信側計算機内の送信プログラムが送
    信を指定したデータを、複数に分割して前記ネットワー
    クに送出する際に、最後の分割通信データの前記受信通
    知フラグ領域のみを設定する請求項5の計算機システ
    ム。
  8. 【請求項8】前記送信側計算機内の送信プログラムが複
    数のデータを同一受信プログラムに対して送信する際
    に、予め設定された送信回数毎にのみ前記受信通知フラ
    グ領域のみを設定する請求項5の計算機システム。
  9. 【請求項9】送信側計算機内の送信プログラムが複数の
    データを同一受信プログラムに対して送信する際に、最
    初のデータ送信指定がなされた時から、または前回の前
    記受信通知フラグ領域を設定してデータの送出を行った
    時からの送信データの累計データ長が、予め設定された
    データ値を越えた場合にのみ前記受信通知フラグ領域を
    設定する請求項8の計算機システム。
  10. 【請求項10】送信側計算機内の送信プログラムが複数
    のデータを同一受信プログラムに対して送信する際に、
    最初のデータ送信指定がなされた時から、または前回の
    前記受信通知フラグ領域を設定してデータの送出を行っ
    た時からの経過時間が、予め設定された値を越えた場合
    にも前記受信通知フラグ領域を設定する請求項8の計算
    機システム。
JP22450394A 1993-09-08 1994-09-20 計算機システム Pending JPH0887479A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP22450394A JPH0887479A (ja) 1994-09-20 1994-09-20 計算機システム
US08/529,762 US5835492A (en) 1993-09-08 1995-09-18 Network for mutually connecting computers and communicating method using such network
US08/964,712 US5936955A (en) 1993-09-08 1997-11-05 Network for mutually connecting computers and communicating method using such network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22450394A JPH0887479A (ja) 1994-09-20 1994-09-20 計算機システム

Publications (1)

Publication Number Publication Date
JPH0887479A true JPH0887479A (ja) 1996-04-02

Family

ID=16814824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22450394A Pending JPH0887479A (ja) 1993-09-08 1994-09-20 計算機システム

Country Status (1)

Country Link
JP (1) JPH0887479A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287031A (ja) * 1995-04-14 1996-11-01 Nec Corp プロセッサ間データ転送方法およびその装置
US6341313B1 (en) 1998-02-02 2002-01-22 Nec Corporation Flow controlling method and apparatus for network between processors
JP2007100304A (ja) * 2005-09-30 2007-04-19 Nissei Ltd 駐車装置制御システム
JP2008059282A (ja) * 2006-08-31 2008-03-13 Olympus Corp 分散処理システム、分散処理方法及びプログラム
US7613788B2 (en) 1999-05-26 2009-11-03 Juniper Networks, Inc. Apparatus and method for data transmission

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287031A (ja) * 1995-04-14 1996-11-01 Nec Corp プロセッサ間データ転送方法およびその装置
US6341313B1 (en) 1998-02-02 2002-01-22 Nec Corporation Flow controlling method and apparatus for network between processors
US7613788B2 (en) 1999-05-26 2009-11-03 Juniper Networks, Inc. Apparatus and method for data transmission
US8352571B2 (en) 1999-05-26 2013-01-08 Juniper Networks, Inc. Apparatus and method for data transmission
JP2007100304A (ja) * 2005-09-30 2007-04-19 Nissei Ltd 駐車装置制御システム
JP4611856B2 (ja) * 2005-09-30 2011-01-12 日精株式会社 駐車装置制御システム
JP2008059282A (ja) * 2006-08-31 2008-03-13 Olympus Corp 分散処理システム、分散処理方法及びプログラム

Similar Documents

Publication Publication Date Title
USRE37494E1 (en) Transfer of messages in a multiplexed system
JP3730471B2 (ja) パケット転送装置
US7693169B2 (en) Transmission apparatus and frame transmission method
EP0333225A2 (en) Packet communication exchange including dummy packet transmission
JPH08265270A (ja) 転送路割り当てシステム
JP2000503828A (ja) データネットワーク上でデータパケットをスイッチングする方法および装置
JPH114256A (ja) 複数ノードの非同期データ通信システム内で早期到達メッセージを処理する方法
US7016350B2 (en) Data switch and a method for controlling the data switch
JP2002533994A (ja) データ交換方法およびその装置
US20100111082A1 (en) Packet Switching Device and Local Communication Network With Such a Packet Switching Device
JPH08256168A (ja) 転送路割り当てシステム
JP3908483B2 (ja) 通信装置
US5040176A (en) Intra-node pacing for high speed networks
EP0492972A2 (en) Serial link communication systems
US20020131412A1 (en) Switch fabric with efficient spatial multicast
US20020150056A1 (en) Method for avoiding broadcast deadlocks in a mesh-connected network
US5613067A (en) Method and apparatus for assuring that multiple messages in a multi-node network are assured fair access to an outgoing data stream
JPH0887479A (ja) 計算機システム
US5936955A (en) Network for mutually connecting computers and communicating method using such network
JPH08147250A (ja) 相互結合網及びその通信方法
CN114531943A (zh) 数据传输方法、分段报文和自动化通信网络
JP2000022728A (ja) ネットワーク装置
EP1347597B1 (en) Embedded system having multiple data receiving channels
JP3691679B2 (ja) 二重伝送路を有するネットワーク
CN116566825A (zh) 信息传输方法、装置、相关设备及存储介质