JPH11259441A

JPH11259441A - 並列計算機における全対全通信方法

Info

Publication number: JPH11259441A
Application number: JP10062483A
Authority: JP
Inventors: Kimihide Kureya; 公英呉屋
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1998-03-13
Filing date: 1998-03-13
Publication date: 1999-09-24
Also published as: EP0942377A1; US6334138B1

Abstract

(57)【要約】【課題】並列計算機における全体全通信の処理時間を短
縮する。【解決手段】並列計算機上で全体全通信を行う際に、各
計算機のメモリ内部に作業用の一時バッファを確保して
各計算機間で不連続型データを交換する方式と、作業用
の一時バッファを確保せずに各計算機間でデータを交換
する方式とを転送データ個数と計算機台数をパラメータ
として選択することにより通信を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、並列計算機を含む
ネットワークで接続された複数の計算機間でのデータ通
信方式に関わり、特に計算機間のデータ通信の標準的な
インターフェイスであるメッセージパッシングMPIにお
ける全対全通信の高速化手法に関する。

【０００２】

【従来の技術】並列計算機には大きく分けて分散メモリ
型並列計算機と共有メモリ型並列計算機の２種類が存在
するが、現在ではスケーラビリティが容易に達成できる
などの理由で分散メモリ型並列計算機が主流になってい
る。分散メモリ型並列計算機上でのプログラミングモデ
ルとして一般的にはメッセージパッシングモデルが使用
されることが多い。メッセージパッシングモデルでは、
プログラム中に明示的に通信関数を記述する必要があ
る。すなわち、計算に必要なデータが自要素計算機上に
ない場合、データを保持している要素計算機側で送信関
数を発行し、自要素計算機側で受信関数を発行すること
でデータ転送が行われる。

【０００３】上記通信関数のインターフェイスの標準化
を行うことを目的として、近年MPIForumによりMPI(Mess
age Passing Interface)と呼ばれるメッセージパッシン
グのための関数仕様がまとめられている。MPIでは一対
の計算機間で通信を行う一対一通信の他に全計算機間で
通信を行う集団通信が規定されている。集団通信の中
で、全対全通信と呼ばれる通信形態がある。全対全通信
とは、全ての計算機が送信先計算機ごとに異なるデータ
を全ての計算機に送信する通信処理であり、行列の転
置、n体問題などで使用される。MPIにおいて全対全通信
を行う関数としてAlltoallがある。以下にAlltoallの関
数インターフェイスを説明するが、説明を簡単にするた
めに引き数を一部簡略化して記述する。

【０００４】Alltoall(sendbuf, sendcount, sendtype,
recvbuf, recvcount, recvtype)ここで、sendbuf、sen
dcount、sendtypeはそれぞれ、送信すべき配列データが
格納された自計算機の送信バッファの先頭アドレス、各
計算機に送信する要素データの個数、およびデータ型で
ある。また、recvbuf、recvcount、recvtypeはそれぞ
れ、受信すべきデータが格納される自計算機の受信バッ
ファの先頭アドレス、各計算機から受信する要素データ
の個数、およびデータ型である。データ型としてはINTE
GERやREAL、COMPLEXなどが指定可能である。 MPIでは通
信相手を明確に示すために各計算機にランクと呼ばれる
識別番号を割り当て、このランクを用いて通信相手の特
定を行う。以下では、ランクnを割り当てられた計算機
のことを計算機nと表記する。図４（Ａ）は６台の計算
機（４０２から４０７はそれぞれ計算機０から計算機５
を表す）がネットワーク（４０１）によって結合された
並列計算機を示しており、４０８は計算機０のメモリ領
域の拡大図である。４０９、４１０はそれぞれAlltoall
の引数として指定される送信領域sendbufと受信領域rec
vbufに格納されている配列データである。４０９の第ｉ
要素０ｉ（ｉは０から５まで）はそれぞれ計算機０が計
算機ｉに送信するデータであり、また計算機０は４１０
の第ｉ要素ｉ０（ｉは０から５まで）に各計算機ｉから
受信したデータを格納する。図２は６台の計算機間での
Alltoall通信によるデータ転送を表している。２０１は
Alltoall通信が開始される前の各計算機の送信領域に格
納されている配列データを取り出してランク順に並べた
図であり、また２０２はAlltoall通信が終了した後の各
計算機の受信領域に格納された配列データをランク順に
並べた図である。ここで２０３、２０５、２０７、２０
９、２１１、２１３はそれぞれ計算機０〜５の送信領域
上のデータであり、２０４、２０６、２０８、２１０、
２１２、２１４はそれぞれ計算機０〜５の受信領域上の
データである。例として計算機０が行うべき配列データ
転送処理を説明する。計算機０が行う送信処理は以下の
６つである。

【０００５】（ａ）送信領域２０３の第０要素００を自
分自身の受信領域２０４の第０要素に送信。

【０００６】（ｂ）送信領域２０３の第１要素０１を計
算機１の受信領域２０６の第０要素に送信。

【０００７】（ｃ）送信領域２０３の第２要素０２を計
算機２の受信領域２０８の第０要素に送信。

【０００８】（ｄ）送信領域２０３の第３要素０３を計
算機３の受信領域２１０の第０要素に送信。

【０００９】（ｅ）送信領域２０３の第４要素０４を計
算機４の受信領域２１２の第０要素に送信。

【００１０】（ｆ）送信領域２０３の第５要素０５を計
算機５の受信領域２１４の第５要素に送信。また計算機
０が行う受信処理は以下の６つである。

【００１１】（ａ）受信領域２０４の第０要素に自分自
身の送信領域２０３の第０要素００を受信。

【００１２】（ｂ）受信領域２０４の第１要素に計算機
１の送信領域２０５の第０要素１０を受信。

【００１３】（ｃ）受信領域２０４の第２要素に計算機
２の送信領域２０７の第０要素２０を受信。

【００１４】（ｄ）受信領域２０４の第３要素に計算機
３の送信領域２０９の第０要素３０を受信。

【００１５】（ｅ）受信領域２０４の第４要素に計算機
４の送信領域２１１の第０要素４０を受信。

【００１６】（ｆ）受信領域２０４の第５要素に計算機
５の送信領域２１３の第０要素５０を受信。一般の場合
では計算機iの送信領域の第j要素は計算機jの受信領域
の第i要素に送信し、計算機iの受信領域の第j要素は計
算機jの第i要素を受信する。すなわち各計算機の送信領
域と受信領域を取り出した図上で考えるとAlltoallとは
行列の転置と同様の通信形態によりデータ転送を行う関
数である。並列計算機内の各計算機同士がお互いに一対
一通信が可能である場合に、各計算機が自分以外の全計
算機にデータを送信する方式として、特開平８−２６３
４４９があり、該方式を利用することによって並列計算
機においてAlltoall通信を実現することができる。該方
式では自分自身へのデータ転送処理が含まれていない
が、該方式に、自分自身へデータを送信する処理を付加
すると、Alltoall通信を並列に行うことが可能である。
該方式では計算機がn台の場合、自分自身へデータを送
信する処理を加えて２Lステップで通信が終了する（但
し、Lは正の整数であり2L-1＜n≦2Lを満たすものとする
）。各計算機は、自分自身に割り当てられたランク番
号０〜n−1を２進数で表した値とステップ番号１〜2L−
1を２進数で表した値との排他的論理和がランク番号と
して割り当てられている計算機を、ステップ毎の通信相
手とすることにより通信が進行する。図３で６台（２２
＜６≦２３）の計算機が通信を行う場合の該方式の具体
例を説明する。図３（Ａ）はそれぞれの計算機が各ステ
ップでどの計算機を通信相手としているかを示すテーブ
ルである。例えばステップ２では、各計算機のランク
（０、１、２、３、４、５）を２進数表示するとそれぞ
れ（０００、００１、０１０、０１１、１００、１０
１）となる。これらに対してステップ数２の２進数表示
である０１０との排他的論理和を取ると（０１０、０１
１、０００、００１、１１０、１１１）となる。すなわ
ち、ステップ２における計算機（０、１、２、３、４、
５）の通信相手は（２、３、０、１、６、７）となる。
ここで、計算機iの送信領域の第j要素は計算機jの受信
領域の第i要素に送信しなければならないことを考える
と、ステップ２では以下のような通信処理が行われる。

【００１７】（ａ）計算機０は送信領域の第２要素０２
を計算機２の受信領域の第０要素に送信。

【００１８】（ｂ）計算機１は送信領域の第３要素１３
を計算機３の受信領域の第１要素に送信。

【００１９】（ｃ）計算機２は送信領域の第０要素２０
を計算機０の受信領域の第２要素に送信。

【００２０】（ｄ）計算機３は送信領域の第１要素３１
を計算機１の受信領域の第３要素に送信。

【００２１】ただし、計算機（４、５）の通信相手であ
る計算機（６、７）は実際には存在しないので計算機
（４、５）は、他の計算機（０、１、２、３）の通信処
理が終了するまで待機することになる。他のステップに
おいてもステップ２と同様に通信を行うことにより該方
式では計算機台数が６台の場合、結果として７（＝２３
−１）ステップで通信が完了する。図３（Ｂ）は図３
（Ａ）のテーブルから、各ステップにおいて行われるデ
ータ交換を図示したものである。なお、該方式に自分自
身にデータ転送を行うステップ０の処理（各計算機が送
信領域の第i要素ｉｉを受信領域の第ｉ要素に送信する
処理）を追加して８ステップでAlltoallが実現できるこ
とになる。

【００２２】

【発明が解決しようとする課題】上述した従来の方法に
よれば、計算機の個数をnとした場合、全対全通信に必
要な通信ステップ数はnを２のべき乗で切り上げた数で
あるため、計算機数に比例して処理時間が増加するとい
う問題がある。本発明の目的は、MPIにおいて全対全通
信を行う関数であるAlltoallについて、転送データ個数
が小さい場合においては、作業用バッファを確保するこ
とにより従来よりも通信ステップ数の少ない方法を用
い、また転送データ個数が大きい場合においては従来の
方法を用いるというように、転送データ個数の違いによ
り二つの方法を併用してAlltoall通信を高速に動作させ
ることにある。

【００２３】

【課題を解決するための手段】上記目的を達成するため
に、本発明では、各計算機が各通信ステップにおいて保
持しているデータから不連続データを構成し、また各計
算機が受信バッファとは別に作業用バッファを確保し、
不連続データを作業用バッファに転送することにより通
信ステップ数の少ない通信で処理を行う通信方式と、作
業用バッファを用意しない従来方式とを転送データ個数
と計算機台数をパラメータとして選択することにより通
信を行うことを特徴とする。

【００２４】

【発明の実施の形態】以下、図面を参照して本発明によ
るAlltoallの通信方式を説明する。本発明はハイパーキ
ューブアルゴリズムと呼ばれる方式により各通信ステッ
プにおける通信先を決定し、また新たに確保した作業用
の一時バッファ上でデータ転送を行うことにより高速な
Alltoall通信を実現するものである。図４（Ｂ）は本発
明によるAlltoallを行う計算機のメモリ領域を示してい
る。４１１と４１２はそれぞれ実行時に動的に割り当て
られる第一の一時バッファと第二の一時バッファであ
る。ハイパーキューブアルゴリズムとは、計算機個数を
nとした場合に、自計算機のランク番号を２進数で表し
た値と、初期値を１としたカウンタ変数を２進数で表し
た値との排他的論理和をランク番号とする計算機を各ス
テップの通信相手として、自計算機のデータと相手計算
機のデータを交換するという処理を、カウンタ変数を２
倍にしながらlog nステップ繰り返す方式である。ハイ
パーキューブアルゴリズムは計算機台数が２のべきの場
合にのみ使用できる方式である。図８（Ａ）は８台の計
算機でハイパーキューブアルゴリズムによる通信を行う
際に、それぞれの計算機が各ステップでどの計算機を通
信相手としているかを示すテーブルであり、図８（Ｂ）
は図８（Ａ）のテーブルから、各ステップにおいて行わ
れるデータ転送を図示したものである。ただしAlltoall
通信のように、各計算機が送信先計算機ごとに異なるデ
ータを送信する場合にはハイパーキューブアルゴリズム
をそのまま適用することはできない。そこで本発明では
不連続型データを転送することによりハイパーキューブ
アルゴリズムが利用できるようにしている。図５を使用
して６台の計算機で本発明によるAlltoallを行う方法の
説明を行う。なお、ここでは簡単のため全計算機におい
てsendcount、recvcountを共に１としている。全計算機
は（自分自身も含めた）計算機８台から受信するデータ
を確保する第一の一時バッファbuffer（５０１〜５０
６）と第二の一時バッファvbuffer（計算機２は５０
７、計算機３は５０８）をあらかじめ確保しておく。ま
ず、各計算機は送信バッファ上のデータを一時バッファ
buffer（４１１）に移動する。また５０７、５０８はそ
れぞれは計算機２、計算機３が保持している第二の一時
バッファvbuffer（４１２）である。図５の実施例では
計算機の個数が６であるが、６を越える最小の２のべき
である８台の計算機が仮想的に存在するものとして処理
を行うようにする。具体的には計算機６のbufferの代わ
りとして計算機２のvbufferを、また計算機７のbuffer
の代わりとして計算機３のvbufferを使用する。

【００２５】ステップ１では灰色部分のようにデータが
１つおきに並んだ不連続型データの交換が行われる。計
算機０、２、４、６（実際には２）では一時バッファの
先頭から１データ分だけ隔たった位置からのデータを、
また計算機１、３、５、７（実際には３）では一時バッ
ファの先頭からデータを送信する。始めに計算機０と１
（５０９）、計算機２と３（５１０）、計算機４と５
（５１１）でデータの交換を行う。ステップ１が終了し
た後でステップ２において計算機２と計算機３はvbuffe
r上でデータの交換を行う（５１２）。

【００２６】ステップ３では、データが２個連続した不
連続型データ（図５の灰色部分）の交換を行う。計算機
０、１、４、５では一時バッファの先頭から２データ分
だけ隔たった位置からのデータを、また計算機２、３、
６（実際には２）、計算機７（実際には３）では一時バ
ッファの先頭からデータを送信する。計算機０と２（５
１３）、計算機１と３（５１４）がデータの交換を行っ
た後でステップ４において計算機４と６（実際には２）
（５１５）、計算機５と７（実際には３）がデータの交
換を行う（５１６）。この時、（５１５）、（５１６）
において計算機６（実際には２）、７（実際には３）は
vbuffer上でデータ交換を行う。

【００２７】ステップ５では、データが４個連続したデ
ータ型（図５の灰色部分）の交換を行う。計算機０、
１、２、３では一時バッファの先頭から４データ分だけ
隔たった位置からのデータを、また計算機４、５、６
（実際には２）、７（実際には３）では一時バッファの
先頭からデータを送信する。計算機０と４（５１７）、
計算機１と５（５１８）では一時バッファbuffer上でデ
ータの交換を行い、計算機２、計算機３自信のデータ交
換では一時バッファvbuffer上のデータと一時バッファb
uffer上でデータとの交換を行う。

【００２８】最終的に各計算機はステップ５の後に一時
バッファbuffer上に格納されているデータを受信バッフ
ァに移動することでAlltoall通信が完了する。

【００２９】次に、計算機個数が６台の場合に示した例
を一般化して、計算機個数が任意の場合にAlltoall通信
を行う例を図１のフローチャートによって説明する。こ
こでは起動される計算機個数をnとする。他の計算機か
ら受信するデータを格納する目的で一時バッファbuffe
r、vbufferを確保する（１０１）。送信領域sendbuf上
のデータをbufferに移動する（１０２）。計算機個数n
が２のべきとは限らないため、ハイパーキューブアルゴ
リズムが行えるようにnを越える最小の２のべきを求
め、その値をNとする（１０３）。次に各種変数の初期
化として、shift = 1、blockcnt = N/2、blocklen = re
cvcount、stride = 2 × recvcount、vrank =rank^(N/
2)とおく（^は排他的論理和を表す）（１０４）。shift
は繰り返し処理の終了を判定するためのカウンタ変数、
blockcnt、blocklen、strideは元のデータから不連続デ
ータ型を構成するために必要とする変数である。ここで
不連続データ型とは、元のデータを何個か連続したブロ
ックと呼ばれる構成要素を等間隔に並べたものとする。
blockcntはブロックの個数、blocklenは１ブロック内の
元データの個数、stirdeは個々のブロックの先頭の間
が、元データ何個分に相当するかを表す数である。例え
ば図５のステップ１では、blockcnt = ４、blocklen =
１、stride = ２となる。vrankはハイパーキューブアル
ゴリズムにおいて最終ステップでデータを交換し合う通
信相手のランク番号である。図５のような不連続データ
型を構成するための手段として、MPIにはType_vectorと
いう関数が用意されている。Type_vectorの関数インタ
ーフェイスは次のようになっている。

【００３０】Type_vector(count, blocklen, stride, o
ldtype, newtype)ここで、count、blocklen、strideは
上で説明したものと同じ意味であり、oldtypeは各ブロ
ックの構成要素である元データのデータ型（ここでは、
Alltoallの引数として指定されたrecvtype）、newtype
はType_vectorの結果として構成される不連続データ型
へのポインタである。従って例えばこのType_vectorを
利用して不連続データ型を構成すればよい（１０５）。
vrankが起動計算機台数n以上である計算機は、実際には
存在しない計算機が用意すべき一時バッファbufferの代
わりにバッファvbufferを確保しなくてはならないた
め、vrankとnを比較する（１０６）。vrankがnを越えて
いなければその計算機は各通信ステップにおいて自分自
身のデータのみを通信相手と交換すれば良い。そこでラ
ンク番号とshiftとのビット毎の論理積を取った値が１
であれば通信相手のランク番号pareをpare =rank - shi
ftとして、また論理積の値が０であればpare = rank +
shiftとして求める（１０７）。ただし、pareがn以上の
場合、実際にはそのようなランク番号を持つ計算機は存
在しないので、pareとN/2との排他的論理を取った値を
通信相手のランク番号pareとする。各計算機は自分のラ
ンク番号rankと通信相手のランク番号pareを比較して、
rank < pareの場合には一時バッファbufferの先頭からs
hift × recvcountだけ隔たった位置からのデータを通
信相手のデータと交換する。データ交換のために使用す
る通信関数としてMPIの通信関数を用いる場合では、通
信関数への引数として、転送されるデータの型を指定す
る必要がある。この場合に通信関数に指定するデータ型
は１０５で構成したnewtypeを使用する。rank ≧ pare
の場合には一時バッファbufferの先頭位置からのデータ
と交換する（１０８）。vrankがn以上の場合、１０７、
１０８と同様にして送信相手のランク番号pareを計算
し、送信相手とデータの交換を行う（１０９、１１
０）。さらに、実際には存在しない計算機に代わってデ
ータの交換を行うためにvrankにより１０９と同様にし
て送信相手のランク番号vrankを求め（１１１）、vbuff
er上のデータを送信相手と交換する（１１２）。以上に
よってデータの交換が終了した後に、shift = shift ×
２、blockcnt = blockcnt/2、blocklen = blocklen ×
２、stride = stride × ２とし（１１３）、shiftとN
を比較する（１１４）。shiftがN以下であれば１０５以
降の処理を繰り返し、shiftがN以上であれば各計算機は
一時バッファbuffer上のデータをrecvbufに移動して処
理を終了する（１１５）。

【００３１】ハイパーキューブアルゴリズムでは以上説
明したように、計算機台数をnとして2L-1＜n≦2L （Ｌ
は正の整数）と表された場合に、Ｌステップで一時バッ
ファ上の通信が終了する。１ステップにおいて２回デー
タ交換が行われるが、１回のデータ交換において自計算
機から相手計算機への送信と、相手計算機から自計算機
への受信の計２回の通信が行われるため、ハイパーキュ
ーブアルゴリズムでは４Ｌ回の通信が発生する。従っ
て、始めに送信バッファ上のデータを一時バッファに移
動する通信と、最後に一時バッファ上から受信バッファ
にデータを移動する通信の２回を加えると４Ｌ + ２回
の通信が発生する。従来方式の通信回数は2Lステップで
あるが、１ステップにおいて自計算機から相手計算機へ
の送信と、相手計算機から自計算機への受信の計２回の
通信が行われるため、合計通信回数は2L+1である。 nが
大きい場合にはハイパーキューブアルゴリズムの方が遥
かに少ない通信回数で処理を行えるが、作業用メモリを
必要とするため、作業用メモリ確保の処理時間が大きく
なる。またハイパーキューブアルゴリズムでは不連続型
データのデータ転送を行っているが、一般的には不連続
型データ転送のコストは連続データのそれと比較すると
高くついてしまい、ハイパーキューブアルゴリズムでの
通信回数が少ないという利点が相殺されることになる。
そこで、計算機台数とデータ個数をパラメータとしてハ
イパーキューブアルゴリズムと従来方式を切り替えて使
用することにする。図６は以上を考慮して得られたAllt
oallの全体の実施形態を表すフローチャートである。Al
ltoall関数が呼ばれた際に、転送されるデータ個数と起
動される計算機数を取得し（６０１）、あらかじめ作成
しておいたテーブルによりハイパーキューブアルゴリズ
ムと従来方式とでどちらが有利であるかを判断する（６
０２）。図７は両方式を比較するために作成されたテー
ブルの一例を表している。ここではハイパーキューブア
ルゴリズムが有利な場合として、計算機数nが１≦n＜８
では転送データ個数がa個以下、９≦n＜１６ではb個以
下、１７≦n＜３２ではc個以下、３３≦n＜６４ではd個
以下、６５≦n＜１２８ではe個以下、１２９≦n＜２５
６ではf個以下の場合として作成されたテーブルを例示
してある。ハイパーキューブアルゴリズムが有利な場合
には、以降ハイパーキューブアルゴリズムで処理を行い
（６０３）、そうでなければ従来方式で処理を行う（６
０４）。なおテーブルに記述された数値a〜fなどは実装
する計算機の特性、すなわち一対一通信の性能などによ
って異なる。

【００３２】

【発明の効果】以上本発明によれば、起動計算機数と転
送データ個数に応じた効率の良い処理方式で全体全通信
を行うことが可能となる。

【図面の簡単な説明】

【図１】実施例のフローチャートを示す図。

【図２】Alltoall通信の通信形態の説明図。

【図３】Alltoall通信の従来方式の説明図。

【図４】実施例を説明するための並列計算機システムの
概略構成図。

【図５】実施例を説明するためのAlltoall通信の中間状
態の説明図。

【図６】従来方式と本発明による方式とを、計算機台数
と転送データ個数とによって切り替える処理のフローチ
ャートを示す図。

【図７】ハイパーキューブアルゴリズムと従来方式を切
り替えるために使用するテーブルの説明図。

【図８】ハイパーキューブアルゴリズムの説明図。

【符号の説明】

１０１一時バッファを確保する処理１０２送信領域上のデータを一時バッファに移動する
処理１０３計算機台数を越える最小の２のべきを計算する
処理１０４各変数の初期化処理１０５不連続型データを構成する処理１０６通信相手の計算機のランク番号と計算機台数の
大小を比較する処理１０９、１１１通信相手の計算機のランク番号を計算
する処理１０８、１１０、１１２第一の一時バッファ上で通信
相手の計算機とデータを交換する処理１１３各変数の更新処理１１４カウンタ変数と計算機台数を越える最小の２の
べきとの大小を比較する処理１１５一時バッファ上のデータを受信領域に移動する
処理

Claims

【特許請求の範囲】

【請求項１】固有の識別番号を有する複数個の計算機が
ネットワークで結合された分散メモリ型並列計算機にお
いて全対全通信を行う場合に、各計算機内に第一の作業
用バッファと第二の作業用バッファを用意して不連続デ
ータを交換する方式と、前記作業用バッファを用意せず
に計算機個数を２のべき乗に切り上げた通信ステップ数
で処理を実行する方式とを、計算機個数と転送データ量
をパラメータとして選択することにより通信を行うこと
を特徴とする通信方式。
【請求項２】請求項１記載の通信方式において、前記不
連続データは、各計算機へ送信するデータ個数を単位と
して、前記第一の作業用バッファ上において前記計算機
の台数より大きい最小の２のべき（＝２n ）より小さい
任意の２のべき個（＝２k ）のデータと、２k個の間隔
を有することを特徴とする通信方式。
【請求項３】請求項１記載の通信方式において、自計算
機の識別番号に前記２kを加えることにより求められる
数値を識別番号として持つ計算機をデータ交換の相手計
算機とする場合に、自計算機内の第一のバッファの先頭
位置から、各計算機へ送信するデータ個数を単位として
前記２k個隔たった位置からのデータを送信し、また、
自計算機の識別番号に前記２kを引くことにより求めら
れる数値を識別番号として持つ計算機をデータ交換の相
手計算機とする場合に、自計算機内の第一バッファの先
頭からデータを送信することを特徴とする通信方式。
【請求項４】請求項３記載のデータ交換において、自計
算機の識別番号に前記２kを加えた値が計算機台数より
も大きい場合には、該値と２n-1との排他的論理和を取
った値を識別番号として持つ計算機を送信相手とするこ
とを特徴とする通信方式。
【請求項５】請求項１記載の通信方式において、自計算
機の識別番号と２n-1との排他的論理和を取った値を仮
想的な自計算機の識別番号とし、該値が計算機の台数よ
りも大きい場合には、請求項３記載のデータ交換を行っ
た後に、該値に前記２kを加えることにより求められる
数値を識別番号として持つ計算機をデータ交換の相手計
算機とする場合に、自計算機内の第二のバッファの先頭
位置から、各計算機へ送信するデータ個数を単位として
２k個隔たった位置からのデータを送信し、また、該値
に前記２kを引くことにより求められる数値を識別番号
として持つ計算機をデータ交換の相手計算機とする場合
に、自計算機内の第二バッファの先頭からデータを送信
することを特徴とする通信方式。
【請求項６】前記正の整数２kにおけるkは０、１、〜、
n−1まで変化することを特徴とする請求項２〜５のいず
れかに記載の通信方式。