JPH07253953A

JPH07253953A - データ転送方法

Info

Publication number: JPH07253953A
Application number: JP6045672A
Authority: JP
Inventors: Yasuhiro Mori; 康浩森
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1994-03-16
Filing date: 1994-03-16
Publication date: 1995-10-03

Abstract

(57)【要約】【目的】マスタープロセッサと複数スレーブプロセッ
サ間のデータ転送を高速に実行可能な並列計算機とデー
タ転送方式を提供する。【構成】マスタープロセッサ１にある配列データをあ
る一方向のインデックスに着目して分割し、これを共通
バス２によって接続された第０行のスレーブプロセッサ
ＳＰ（０,０）〜ＳＰ（０,Ｎ−１）に送る。次にこのス
レーブプロセッサにおいて送られてきたデータを残りの
インデックスのいずれか一つに着目してさらに小さく分
割し、これをプロセッサ間通信ネットワーク４を介して
他のスレーブプロセッサに転送し、データを分散する。【効果】データ分割の処理に係る負荷を分散でき、２
つのステップの転送を並行して実行できるので、全体の
データ転送速度を上げることができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はマスタープロセッサ上の
配列データを複数のスレーブプロセッサに分散して並列
処理する並列計算機におけるデータ転送方法に関する。

【０００２】

【従来の技術】近年、複数プロセッサにデータを分散さ
せ、これを並列に処理することで計算機の処理能力の向
上を目指す並列計算機が注目されており、いくつかの商
用マシンがリリースされつつある。従来の並列計算機に
ついては例えば特公昭５６−１６４４６４号公報にあ
る。ここに示された並列計算機においてはマスタープロ
セッサがもつ配列データを複数のスレーブプロセッサに
分割して配置し、これを並列に演算することによって全
体の処理速度を上げることを目的としている。

【０００３】

【発明が解決しようとする課題】従って、上記構成の並
列計算機では、マスタープロセッサ一つですべてのデー
タ処理を実行する場合に比べ、データの「分割」と「転
送」といったオーバーヘッドが発生する。このため、上
記従来技術において多数個のスレーブプロセッサを持っ
てきて並列に演算をさせても、前述したオーバヘッドが
大きいと全体の処理速度が上がらないので、オーバヘッ
ドをできるだけ小さくするためのデータ転送方式が望ま
れる。

【０００４】本発明の目的は、上記の考察に基づくもの
であって、並列計算機においてマスタープロセッサと複
数スレーブプロセッサ間で高速にデータ転送方法を提供
することにある。

【０００５】

【課題を解決するための手段】この目的を達成するた
め、本発明のデータ転送方法は、マスタープロセッサ上
の３次元配列データ：ａ（Ｘ，Ｙ，Ｚ）をある一方向の
インデックスに対してＬ個（ＬはＸないしＹないしＺ）
のデータブロックに分割するステップと、その分割され
たｉ番目（１≦ｉ≦Ｌ）のデータブロックを、Ｎ行Ｎ列
（Ｎ≧２）に配置されたＮ²個のスレーブプロセッサの
第ｓ行ｉ列に転送するステップと、前記第ｓ行ｉ列のス
レーブプロセッサにおいては転送されてきたデータブロ
ックの残りのいずれか一方向のインデックスに対してＭ
個（ＭはＸないしＹないしＺ）のデータブロックにもう
一度分割するステップと、その分割されたｊ番目（１≦
ｊ≦Ｍ）のデータブロックを第ｉ行ｊ列のスレーブプロ
セッサにプロセッサ間通信ネットワークを介して転送す
るステップとを備えたものである。

【０００６】

【作用】本発明のデータ転送方式によって、並列計算機
において、マスタープロセッサから第ｓ行のスレーブプ
ロセッサへのデータ転送と第ｓ行のスレーブプロセッサ
から第ｉ行ｊ列のスレーブプロセッサへのデータ転送を
オーバーラップできると共に、マスタープロセッサにお
けるデータの分割、あるいは再構成の負荷が小さくでき
るためにデータ転送を高速に実行できる。また、マスタ
ープロセッサから第ｓ行のスレーブプロセッサへＤＭＡ
転送する場合、インデックスの組合せによってはブロッ
クサイズを大きく取ることができるので、ＤＭＡ転送の
効果をより引き出すことができ、データ転送を高速化で
きる。

【０００７】

【実施例】以下本発明の一実施例のデータ転送方式につ
いて、図面を参照しながら説明する。図１は本発明の実
施例における並列計算機のブロック図を示すものであ
る。マスタープロセッサ１は共通バス２を介して、共通
に接続された第０行にあるＮ個のスレーブプロセッサに
対して、命令やデータのREAD/WRITEができる。また、Ｎ
行Ｎ列に配置されたＮ²個のスレーブプロセッサ３の各
々はプロセッサ間通信ネットワーク４を介して、第ｉ行
ｊ列のスレーブプロセッサが第ｉ列と第ｊ行にある２Ｎ
個のスレーブプロセッサと通信可能である。

【０００８】図２は本発明の実施例におけるデータ転送
方式のフローチャートを示すものである。図３は配列デ
ータ：ａ（Ｘ，Ｙ，Ｚ）を分割する概念を図示したもの
である。ここではＣコンパイラによる配列データの配置
を例に挙げている。Ｃコンパイラの場合、配列のインデ
ックスがより右側にあるものがより頻繁に変化するよう
なフォーマットで配置される。したがって、マスタープ
ロセッサにおいては、ｘ方向のインデックスに着目して
Ｘ個のデータブロックに分割し、第ｓ行のスレーブプロ
セッサにおいては、ｙ方向のインデックスに着目してＹ
個のデータブロックに分割するのが都合が良い。

【０００９】以下図２を用いて図１にある並列計算機の
マスタープロセッサ上にある３次元配列データのスレー
ブプロセッサへの分散方式を説明する。

【００１０】まずステップ２１では、マスタープロセッ
サ１は３次元配列データのｘ方向のインデックスに着目
して、（Ｙ×Ｚ）ワード単位にＸ個のデータブロックに
分割する。

【００１１】そしてステップ２２では、これを共通バス
２によって接続された第ｓ行ｘ列（０≦ｓ≦Ｎ−１）、
本実施例では第０行ｘ列のスレーブプロセッサに転送す
る。マスタープロセッサはすべてのデータ転送が終了す
るまで、これを繰り返す。

【００１２】ステップ２３では、第０行ｘ列のスレーブ
プロセッサにおいては、転送されてきたデータのｙ方向
のインデックスに着目してさらにＺワード単位にＹ個に
分割し、ステップ２４では、これをｘ行ｙ列のスレーブ
プロセッサにネットワークを介して転送する。この動作
はマスタープロセッサからの転送と並行して実行される
ことになる。結果的にａ（ｘ，ｙ，ｚ）の配列データが
第ｘ行ｙ列のスレーブプロセッサに配置され、すべての
動作が終了した時、マスタープロセッサにあった配列デ
ータが複数のスレーブプロセッサに分散されていること
になる。

【００１３】本実施例では配列データの（ｘ，ｙ）のイ
ンデックスの組合せをデータを割り当てるプロセッサＩ
Ｄに対応させてデータ分散する場合を例に挙げた。

【００１４】請求項４は（ｙ，ｚ）,（ｚ，ｘ）の組合
せをプロセッサＩＤとして割り当てる場合について述べ
たものである。すなわち、、配列データを（ｙ，ｚ）,
（ｚ，ｘ）の組合せをプロセッサＩＤとして分散させる
場合、まず（ｘ，ｙ）方向に分散し、その後プロセッサ
間通信ネットワークを介してこれを交換する。

【００１５】本方式の第１の利点は、マスタープロセッ
サ上で配列データを最小単位に分割するのではなく、第
１ステップでの転送先のスレーブプロセッサにおいて最
小単位に分割するために、第１ステップの転送における
データブロックのサイズを大きく取ることができる点に
ある。これはすなわち、マスタープロセッサから共通バ
スで接続された第ｓ行のスレーブプロセッサにデータを
転送する時、ＤＭＡＣを用いてＤＭＡ転送することが多
々あるが、この時、転送対象となるデータのブロックサ
イズが小さいとＤＭＡＣへのパラメータセット等のオー
バヘッドなどのために実効速度が小さくなってしまう。
しかし、本方式ではブロックサイズを大きく取れるので
先述したオーバヘッドは大きくならない。

【００１６】第２の利点は全体の転送を２つのステップ
に分け、これをオーバーラップして実行させることによ
る高速化である。

【００１７】さらに第３の利点として第２ステップの転
送はより細分化されたデータブロックが対象で負荷が大
きいが、これをバンド幅の大きいプロセッサ間通信ネッ
トワークを介して行なうことができることによる高速化
である。

【００１８】図４は複数のスレーブプロセッサに分散さ
れたデータを収集して、マスタープロセッサ上に配列デ
ータとして再構成する転送方式のフローチャート図であ
る。

【００１９】まずステップ４１では、第ｘ行ｙ列のスレ
ーブプロセッサはｘ，ｙをデータのインデックスとして
第ｓ行ｘ列（０≦ｓ≦Ｎ−１）、本実施例では第０行ｘ
列のスレーブプロセッサに転送する。

【００２０】ステップ４３では、第０行ｘ列のスレーブ
プロセッサでは、ステップ４２によって到着したデータ
ブロックをｙについて昇順にソートしてより大きなサイ
ズのデータブロックを構成する。

【００２１】次にステップ４４では、マスタープロセッ
サは再構成されたデータブロックをｘが若い順に読みだ
し、配列データとして再構成していく。

【００２２】本実施例では配列データの（ｘ，ｙ）のイ
ンデックスの組合せをデータを割り当てるプロセッサＩ
Ｄに対応させて分散されたデータをマスタープロセッサ
上に収集する方式を例に挙げた。

【００２３】請求項５は（ｙ，ｚ）,（ｚ，ｘ）の組合
せをプロセッサＩＤとして分散されたデータを収集する
方式について述べたものである。すなわち、（ｙ，
ｚ）,（ｚ，ｘ）の組合せをプロセッサＩＤとして分散
されたデータをマスタープロセッサ上に収集する場合、
まず、プロセッサ間通信ネットワークを介してデータを
転送し、（ｘ，ｙ）の組合せがプロセッサＩＤとなるよ
う編集する。その後、図４に示した実施例によってデー
タを収集する。

【００２４】図５は本発明の他の実施例におけるデータ
転送方式のフローチャートを示すものである。以下では
複数のスレーブプロセッサに同一データを転送する場合
（データのブロードキャスト）を図３を用いて説明す
る。

【００２５】まずステップ５１では、マスタープロセッ
サ１は共通バス２に接続されたＮ個のスレーブプロセッ
サに同時にデータを書き込む。

【００２６】次にステップ５２では、書き込まれたスレ
ーブプロセッサから各々が通信可能なスレーブプロセッ
サに対してデータを送信する。この方式によって、同一
データをマスタープロセッサから複数回書き込む手間が
省け、データのブロードキャストを高速化できる。

【００２７】

【発明の効果】以上の説明から明らかなように、本発明
によれば、先述した並列計算機において、マスタープロ
セッサと複数スレーブプロセッサ間でデータの分散／収
集を高速に実行できる。また、データのブロードキャス
トも高速に実行可能である。

【図面の簡単な説明】

【図１】請求項１の本発明の実施例を示す並列計算機の
ブロック図

【図２】請求項２の本発明の第１の実施例を示すフロー
チャート

【図３】請求項２の同実施例におけるデータ分割を示す
概念図

【図４】請求項３の本発明の第２の実施例を示すフロー
チャート

【図５】請求項の本発明の第３の実施例を示すフローチ
ャート

【符号の説明】

１マスタープロセッサ２共通バス３Ｎ行Ｎ列に配置されたＮ²個のスレーブプロセッサ４プロセッサ間通信ネットワーク

Claims

【特許請求の範囲】

【請求項１】マスタープロセッサ上の３次元配列デー
タ：ａ（Ｘ，Ｙ，Ｚ）をある一方向のインデックスに対
してＬ個（ＬはＸないしＹないしＺ）のデータブロック
に分割するステップと、その分割されたｉ番目（０≦ｉ≦Ｌ−１）のデータブロ
ックを、Ｎ行Ｎ列（Ｎ≧２）に配置されたＮ²個のスレ
ーブプロセッサの第ｓ行ｉ列に転送するステップと、前記第ｓ行ｉ列のスレーブプロセッサにおいては転送さ
れてきたデータブロックの残りのいずれか一方向のイン
デックスに対してＭ個（ＭはＸないしＹないしＺ）のデ
ータブロックにもう一度分割するステップと、その分割されたｊ番目（０≦ｊ≦Ｍ−１）のデータブロ
ックを第ｉ行ｊ列のスレーブプロセッサにプロセッサ間
通信ネットワークを介して転送するステップとを備えた
データ転送方法。
【請求項２】第ｉ行ｊ列のスレーブプロセッサ上に分散
されたデータをｉ，ｊをデータのインデックスとしてプ
ロセッサ間通信ネットワークを介して第ｓ行ｉ列のスレ
ーブプロセッサに転送し、前記第ｓ行ｉ列のスレーブプ
ロセッサにおいて転送されてきたデータブロックをｉが
等しいデータ毎にさらに大きなブロックデータとして再
構成するステップと、これを共通バスを介してマスタープロセッサへ転送する
ことによってスレーブプロセッサ上に分散された３次元
配列データを収集するステップとを備えたデータ転送方
法。
【請求項３】マスタープロセッサから前記共通バスに接
続された第ｓ行のＮ個のスレーブプロセッサに対して同
時にデータを書き込むステップと、次にこのＮ個のスレーブプロセッサから同時に前記プロ
セッサ間通信ネットワークを介して残りのスレーブプロ
セッサに対してデータを再転送することによって複数ス
レーブプロセッサに同一データをブロードキャストする
ステップとを備えたデータ転送方法。
【請求項４】さらに、この分散されたデータをプロセッサ間通信ネットワーク
を介して転送することによってスレーブプロセッサの行
と列の番号に割り付けた配列のインデックスの組合せを
交換するステップを有することを特徴とする請求項１記
載のデータ転送方法。
【請求項５】さらに、Ｎ²個のスレーブプロセッサにあるデータを前記プロセ
ッサ間通信ネットワークを介して転送することによって
スレーブプロセッサの行と列の番号に割り付けた配列の
インデックスの組合せを交換するステップをを有するこ
とを特徴とする請求項２記載のデータ転送方法。