JP4704252B2 - ネットワークシステムのブロードキャスト処理方法及びネットワークシステム - Google Patents

ネットワークシステムのブロードキャスト処理方法及びネットワークシステム Download PDF

Info

Publication number
JP4704252B2
JP4704252B2 JP2006068895A JP2006068895A JP4704252B2 JP 4704252 B2 JP4704252 B2 JP 4704252B2 JP 2006068895 A JP2006068895 A JP 2006068895A JP 2006068895 A JP2006068895 A JP 2006068895A JP 4704252 B2 JP4704252 B2 JP 4704252B2
Authority
JP
Japan
Prior art keywords
data
nodes
node
network
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006068895A
Other languages
English (en)
Other versions
JP2007251334A (ja
Inventor
淳一 稲垣
正夫 小薮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006068895A priority Critical patent/JP4704252B2/ja
Priority to US11/472,985 priority patent/US8386624B2/en
Priority to EP06253424.3A priority patent/EP1887477B1/en
Priority to CNA2006101075212A priority patent/CN101039202A/zh
Priority to KR20060068359A priority patent/KR100774901B1/ko
Publication of JP2007251334A publication Critical patent/JP2007251334A/ja
Application granted granted Critical
Publication of JP4704252B2 publication Critical patent/JP4704252B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17356Indirect interconnection networks
    • G06F15/17368Indirect interconnection networks non hierarchical topologies
    • G06F15/17375One dimensional, e.g. linear array, ring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Information Transfer Between Computers (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、複数のノードがネットワークで接続されたネットワークシステムにおいて、1のノードから他の複数のノードにブロードキャストするブロードキャスト処理方法及びネットワークシステムに関し、特に、各ノードの複数のネットワークアダプタを利用して、効率良くブロードキャストするネットワークシステムのブロードキャスト処理方法及びネットワークシステムに関する。
計算機システムの処理の高速化の要求に伴い、コンピュータを含むノードを複数設け、これら複数のノードをネットワークで接続したネットワーク型コンピュータシステムが提供されている。例えば、並列計算機の分野では、複数のノードで並列に計算処理し、これらの処理データを、ネットワークを介し、やりとりする。このような並列計算機においては、大規模なものでは、数百〜数千ノードで構成される。
このようなネットワークシステムにおいて、1のノードの持つデータを、ネットワークを介し、他の複数のノードに、転送することが行われている。これをブロードキャスト処理という。このようなブロードキャスト処理においては、多量のデータを転送する場合もあり、転送処理時間の短縮化が望まれる。
図11及び図12は、第1の従来のネットワークシステムのブロードキャスト処理の説明図である。図11に示すように、複数(ここでは、4つ)のノード100,101,102,103が、図示しないネットワークで接続される。この各ノード100,101,102,103は、並列転送を可能とするため、複数(ここでは、3つ)のネットワークアダプタ110A,110B,110Cを有する。
この構成において、1のノード100から他の3つのノード101,102,103にブロードキャストする場合には、全ての転送データを、ノード100のネットワークアダプタ110A,110B,110Cから、並列に、各ノード101,102,103の対応するネットワークアダプタ110A,110B,110Cに転送する。
例えば、図12に示すように、12ブロックD0〜D11の転送データを、ノード100から他の3つのノード101,102,103に転送する場合には、ノード100のネットワークアダプタ110Aからノード101のネットワークアダプタ110Aへ、ノード100のネットワークアダプタ110Bらノード102のネットワークアダプタ110Bへ、ノード100のネットワークアダプタ110Cからノード103のネットワークアダプタ110Cへ、それぞれ、12ブロックD0〜D11を転送する。
このように、第1の従来技術では、ノード100,101,102,103が、転送チャネル(ネットワークアダプタ)を複数持つことで、並列転送により、ブロードキャスト処理に要する時間を短縮していた。
図13及び図14は、第2の従来のネットワークシステムのブロードキャスト処理の説明図である。この方法は、図11と同様に、複数のネットワークアダプタを持つノード間でブロードキャストする際に、送信元ノード100が、送信データを、分割して、各ネットワークアダプタから転送する。
即ち、図13及び図14に示すように、送信元ノード100は、送信データブロックD0〜D11を3分割し、分割された各々を、ノード100の3つのネットワークアダプタ110A,110B,110Cから、ノード102のネットワークアダプタ110A,110B,110Cに転送する(1)。
これにより、送信データを保持するノードが2つとなったので、次に、送信元ノード100は、3分割された各々を、ノード100の3つのネットワークアダプタ110A,110B,110Cから、ノード101のネットワークアダプタ110A,110B,110Cに転送する(2)。同時に、ノード102は、ノード100から受信した分割された各々を、ノード102の3つのネットワークアダプタ110A,110B,110Cから、ノード104のネットワークアダプタ110A,110B,110Cに転送する(3)。
通常、転送データ長が長い場合には、ブロードキャスト処理時間は、ネットワークを伝播するデータ量に比例するため、第1の従来技術では、12ブロック転送分の処理時間が必要であるが、第2の従来技術では、3分割して、2回転送しているため、4ブロック転送時間が2回となり、8/12=2/3の処理時間で済む(例えば、特許文献1)。
特開平7−244648号公報
しかしながら、第2の従来技術では、第1回目の転送で、ブロードキャスト元ノード100の転送データのコピーを、ノード102に保持させ、第2回目の転送で、転送元とコピー先の2つのノード100,102からもう2つのノード101,103に転送データ全体を転送して、ブロードキャストする。
このため、第2の従来技術では、ブロードキャスト処理時間に限りがあり、特に、データ転送長が長い場合には、よりブロードキャスト処理時間を短縮することが困難である。
従って、本発明の目的は、ブロードキャスト処理時間を短縮するためのネットワークシステムのブロードキャスト処理方法及びネットワークシステムを提供することにある。
又、本発明の他の目的は、ブロードキャスト処理時間を短縮して、並列計算の性能を向上するためのネットワークシステムのブロードキャスト処理方法及びネットワークシステムを提供することにある。
更に、本発明の他の目的は、転送データ長が長くても、ブロードキャスト処理時間を短縮するためのネットワークシステムのブロードキャスト処理方法及びネットワークシステムを提供することにある。
この目的の達成のため、本発明のネットワークシステムは、各々複数のネットワークアダプタを有する3つ以上のノードと、前記各ノードのネットワークアダプタ間を接続するクロスバースイッチとを有し、1の前記ノードは、他の前記複数のノードに転送するデータを、複数個のデータに分割し、前記分割したデータの各々を、各々異なるネットワークアダプタを介し、他の前記複数のノードに転送し、前記分割されたデータを受け取った前記他の複数のノードの各々は、前記受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割されたデータを受け取っていない他のノードに転送する。
又、本発明のブロードキャスト処理方法は、複数のネットワークアダプタを有する1のノードから、各々複数のネットワークアダプタを有する他の複数のノードに、データをブロードキャストするネットワークシステムのブロードキャスト処理方法であって、前記1のノードで、前記他の複数のノードに転送するデータを、複数個のデータに分割するステップと、前記1のノードから前記分割したデータの各々を、各々異なるネットワークアダプタを介し、他の前記複数のノードに転送する第1のステップと、前記分割されたデータを受け取った前記他の複数のノードの各々から、前記受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送する第2のステップとを有する。
更に、本発明では、好ましくは、前記他の複数のノードの各々は、前記1のノードから前記分割されたデータを受信するとともに、以前に受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送する。
更に、本発明では、好ましくは、前記1のノードは、前記転送するデータを、前記ネットワークアダプタの数に従った分割数で、分割して、前記分割データを作成する。
更に、本発明では、好ましくは、前記1のノードは、前記分割データを、前記ネットワークアダプタの数の前記複数のノードに、転送する。
更に、本発明では、好ましくは、前記1のノードは、前記ネットワークアダプタの数と転送回数に従った分割数で、分割して、前記分割データを作成する。
更に、本発明では、好ましくは、前記他の複数のノードの各々は、前記受け取った分割されたデータを、前記複数のノード間で、前記ネットワークアダプタを重複使用しないように決められたネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送する。
更に、本発明では、好ましくは、前記他の複数のノードが、3つ以上のノードである。
更に、本発明では、好ましくは、前記各ネットワークアダプタが、前記クロスバースイッチと、ネットワークを介し接続された。
更に、本発明では、好ましくは、前記各ノードが、少なくともCPUと、メモリと、前記複数のネットワークアダプタとで構成された。
更に、本発明では、好ましくは、前記複数のノードが、並列計算を実行する並列計算機システムで構成された。
本発明では、転送元であるノードが、ブロードキャストする転送データを、分割し、転送元ノードから他の複数のノードに対し、各分割したデータを別々に転送し、次に、分割データを受け取ったノードは、転送元ノード以外の他のノードに、自分が受け取ったデータを転送する。このため、2回目のデータ転送で、より多くのノード(ネットワークアダプタ)が、データ転送に参加するようにでき、高速に転送処理を実現でき、ブロードキャストの転送処理時間を短縮できる。
以下、本発明の実施の形態を、ネットワークシステムの構成、第1の実施の形態、第2の実施の形態、第3の実施の形態、他の実施の形態の順で説明するが、本発明は、この実施の形態に限られない。
――ネットワークシステムの構成――
図1は、本発明のネットワークシステムの一実施の形態の構成図、図2は、図1のノードのブロック図、図3は、図1及び図2のネットワークアダプタのブロック図、図4は、図1のネットワークシステムのフレームフォーマット図である。
図1に示すように、ネットワークシステムは、複数(ここでは、4つ)のノード10,11,12,13と、3つのクロスバースイッチ(図中、SWA,SWB,SWC)20,21,22とを有する。各ノード10,11,12,13は、3つのネットワークアダプタ(図中、A,B,Cで示す)14A,14B,14Cを有する。
各ノード10,11,12,13が、3つのネットワークアダプタ14A,14B,14Cを有するため、3つのクロスバースイッチ20,21,22が設けられる。即ち、各ノード10,11,12,13のネットワークアダプタ14A,14B,14Cのそれぞれは、対応するクロスバースイッチ20,21,22に接続される。
このノード10(11,12,13)は、図2に示すように、CPU40と、メモリ44と、IOアダプタ46と、前述のネットワークアダプタ14A〜14Cとが、システムコントローラ42を介して接続された計算機である。又、このCPU40,メモリ44、IOアダプタ46の数は、このノードに必要な処理能力に応じて、複数設けても良い。
図1及び図2のネットワークアダプタ14A(14B,14C)は、図3に示すように、システムコントローラ42と接続するホストインターフェイス制御回路50と、送信制御回路52と、クロスバースイッチ20、21,22に接続されるネットワークインターフェイス制御回路54と、受信制御回路56とで構成される。このネットワークアダプタ14A(14B,14C)は、ノード間のデータ通信を担当する。
ネットワークアダプタ14A(14B,14C)を介してノード間のデータ転送をする場合には、図4に示すようなフレーム形式で通信する。図4に示すフレーム形式は、Ethernet(登録商標)で使用されるフレーム形式を示しており、宛先アドレスと、送信元アドレスと、フレームタイプ(例えば、コマンド種別、データサイズ等)と、データ、フレームチエックサム(例えば、CRC(Cyclic Redundancy Code))とからなる。データ領域のデータ長(サイズ)は、可変であり、ノード間を転送するデータは、必要に応じて、複数個のフレームに分割して、転送する。
――第1の実施の形態――
図5は、本発明のブロードキャスト処理の第1の実施の形態の説明図、図6は、図5のブロードキャスト転送のデータの流れを示す図、図7は、図5のデータ転送元ノードの処理フロー図、図8は、データ受信元ノードの処理フロー図である。
図5に示すように、ノード10で、送信ブロックを分割し、各ノード11,12、13に、別々のネットワークアダプタ14A,14B,14Cを介して、転送する(1)。次に、受信した各ノード11,12,13は、受信した分割データを、その分割データを受信していない複数のノードに転送する(2)。
図6も参照して、図13、図14と同一のデータ転送量の例で説明する。即ち、ノード10が、12ブロックのデータD0〜D11を、他の3つのノード11,12,13にブロードキャストする例で説明する。先ず、ノード10は、12ブロックD0〜D11のデータを、4分割する。ノード10の各ネットワークアダプタ14A,14B,14Cから各3ブロックのデータD0〜D2,D3〜D5,D6〜D8を、ノード11,12,13の対応するネットワークアダプタ14A,14B、14Cに転送する。
次に、3ブロックのデータD0〜D2を受信したノード11は、2つのネットワークアダプタ14A,14Bから、データD0〜D2を受信していないノード12,13のネットワークアダプタ14A,14Bに、受信した3ブロックのデータD0〜D2を転送する。
同様に、3ブロックのデータD3〜D5を受信したノード12は、2つのネットワークアダプタ14A,14Cから、データD3〜D5を受信していないノード11,13のネットワークアダプタ14A,14Cに、受信した3ブロックのデータD3〜D5を転送する。
又、3ブロックのデータD6〜D8を受信したノード13は、2つのネットワークアダプタ14B,14Cから、データD6〜D8を受信していないノード11,12のネットワークアダプタ14B,14Cに、受信した3ブロックのデータD6〜D8を転送する。
これとともに、ノード10は、1回目の転送で、未転送であった残りの3ブロックのデータD9〜D11を、3つのネットワークアダプタ14A,14B、14Cから、ノード11、12,13のネットワークアダプタ14A,14B、14Cに、3ブロックのデータD9〜D11を転送する。
このように、転送元であるノード10は、ブロードキャストする転送データを、分割し、ノード10からノード11,12,13に対し、各分割したデータを別々に転送し、次に、ノード10は、分割した残りのデータを、各ノード11,12,13に転送する。これとともに、ノード11,12,13は、ノード10以外の他のノード11,12,13に、自分が受け取ったデータを転送する。
このように、本発明では、2回目のデータ転送で、より多くのノード(ネットワークアダプタ)が、データ転送に参加するようにしているため、高速に転送処理を実現でき、ブロードキャストの転送処理時間を短縮できる。
即ち、前述の第2の従来技術では、第1回目の転送で、転送元ノード10から、全データを、1つの他のノード12に転送し、2回目の転送は、全データを持つ2つのノード10,12から、全データを、他の2つのノード11,13に転送するため、2回目の転送では、6個のネットワークアダプタが転送動作に参加している。
これに対し、本実施例では、第1回目の転送で、転送元ノード10から、4分割したデータを、3つの他のノード11,12、13に転送し、2回目の転送は、全ノード10,11、12、13から、必要なデータを、他の2つのノード10、11,12、13に転送するため、2回目の転送では、9個のネットワークアダプタが転送動作に参加している。全体の転送するデータ量が同じであれば、多くのネットワークアダプタがデータ転送するように工夫することにより、データ転送は早く完了する。
換言すれば、第1回目のデータ転送において、より多くのノードが、第2回目のデータ転送に参加できるように、データを分割し、且つ複数のノードに別々の分割したデータを転送する。そして、個々のノードは、受信した分割データを、他の受信していないノードに転送する。
例えば、ネットワーク全体の総転送量に対する第1、第2の従来技術と本実施例との転送時間を比較すると、第1の従来技術が、総転送量×1=1に対し、第2の従来技術では、総転送量÷3×2=2/3となり、更に、本実施例では、総転送量÷4×2=1/2となる。従って、本実施例では、第1の従来技術の1/2の時間、第2の従来技術の3/4の時間で、ブロードキャスト転送が可能となる。
又、この実施例では、第2回目の転送において、送信ネットワークアダプタと受信ネットワークアダプタとの転送関係を、重複しないように、選択している。例えば、2回目の転送において、ノード10が、ノード11のネットワークアダプタ14A,ノード12のネットワークアダプタ14B,ノード13のネットワークアダプタ14Cとデータ転送するものとすると、ノード11は、ノード12のネットワークアダプタ14A,ノード13のネットワークアダプタ14Bと、ノード12は、ノード11のネットワークアダプタ14C,ノード13のネットワークアダプタ14Aと、ノード13は、ノード11のネットワークアダプタ14B,ノード12のネットワークアダプタ14Cとデータ転送する。
これにより、ネットワークアダプタの重複を防止できる。
図7は、転送元ノードの処理フロー図である。
(S10)転送元ノード10のCPU40は、ブロードキャストデータブロックを、複数の転送ブロックに分割する。この分割数は、転送先ノード数やネットワークアダプタ数であると、前述の2回目の転送効果を最大限発揮する。
(S12)次に、転送元ノード10のCPU40は、ネットワークアダプタ14A,14B,14Cに、分割された転送ブロックを、別々のノード11,12,13に転送するように、指示する。これにより、ノード10のネットワークアダプタ14A,14B,14Cは、分割された転送ブロックを、ノード11のネットワークアダプタ14A,ノード12のネットワークアダプタ14B,ノード13のネットワークアダプタ14Cに転送する。
次に、図8は、受信元ノードの処理フロー図である。
(S20)受信元ノード11,12,13は、先ず、ブロードキャストブロックを受信すると、ブロードキャストデータを、フレームのフレームタイプ(図4参照)で認識する。
(S22)受信元ノード11,12,13は、フレームの宛先アドレスと送信元アドレス(図4参照)を調べ、これ以外の転送すべき転送先を決定する。
(S24)各受信元ノード11,12,13は、転送すべき転送先を宛先として、受信した転送ブロックを、転送すべきノードに転送する。この時、前述のように、各ノードで、ネットワークアダプタが重複使用されることを防止するため、各ノードで予め決められたネットワークアダプタを使用する。
このように、各ノード10,11,12,13のCPU40のデータ分割、転送処理により、容易に、ブロードキャスト転送時間を短縮できる。
――第2の実施の形態――
図9は、本発明の第2の実施の形態のブロードキャスト処理の説明図である。
この実施の形態は、第1の実施の形態の2回のデータ転送をオーバーラップすることにより、より高速にブロードキャスト処理を実行する。図9は、ノード10が、10ブロックのデータD0〜D9を、他の3つのノード11,12,13にブロードキャストする例で説明する。
先ず、ノード10は、ブロードキャストするデータを、D0〜D9に、10分割する。ノード10の各ネットワークアダプタ14A,14B,14Cから各1ブロックのデータD0,D3,D6を、ノード11,12,13の対応するネットワークアダプタ14A,14B、14Cに転送する。
次に、2回目の転送では、ノード10の各ネットワークアダプタ14A,14B,14Cから各1ブロックのデータD1,D4,D7を、ノード11,12,13の対応するネットワークアダプタ14A,14B、14Cに転送する。
そして、同時に、1ブロックのデータD0を受信したノード11は、2つのネットワークアダプタ14A,14Bから、データD0を受信していないノード12,13のネットワークアダプタ14A,14Bに、受信したブロックのデータD0を転送する。
同様に、1ブロックのデータD3を受信したノード12は、2つのネットワークアダプタ14A,14Cから、データD3を受信していないノード13,11のネットワークアダプタ14A,14Cに、受信した1ブロックのデータD3を転送する。
又、1ブロックのデータD6を受信したノード13は、2つのネットワークアダプタ14B,14Cから、データD6を受信していないノード11,12のネットワークアダプタ14B,14Cに、受信した1ブロックのデータD6を転送する。
3回目のデータ転送では、ノード10の各ネットワークアダプタ14A,14B,14Cから各1ブロックのデータD2,D5,D8を、ノード11,12,13の対応するネットワークアダプタ14A,14B、14Cに転送する。
そして、同時に、2回目の転送で、1ブロックのデータD1を受信したノード11は、2つのネットワークアダプタ14A,14Bから、データD1を受信していないノード12,13のネットワークアダプタ14A,14Bに、受信したブロックのデータD1を転送する。
同様に、1ブロックのデータD4を受信したノード12は、2つのネットワークアダプタ14A,14Cから、データD4を受信していないノード13,11のネットワークアダプタ14A,14Cに、受信した1ブロックのデータD4を転送する。
又、1ブロックのデータD7を受信したノード13は、2つのネットワークアダプタ14B,14Cから、データD7を受信していないノード11,12のネットワークアダプタ14B,14Cに、受信した1ブロックのデータD7を転送する。
4回目の転送では、ノード10の各ネットワークアダプタ14A、14B,14Cから各1ブロックのデータD9を、ノード11,12,13の対応するネットワークアダプタ14A、14B,14Cに転送する。
そして、同時に、3回目の転送で、1ブロックのデータD2を受信したノード11は、2つのネットワークアダプタ14A,14Bから、データD2を受信していないノード12,13のネットワークアダプタ14A,14Bに、受信したブロックのデータD2を転送する。
同様に、1ブロックのデータD5を受信したノード12は、2つのネットワークアダプタ14A,14Cから、データD5を受信していないノード13,11のネットワークアダプタ14A,14Cに、受信した1ブロックのデータD5を転送する。
又、1ブロックのデータD8を受信したノード13は、2つのネットワークアダプタ14B,14Cから、データD8を受信していないノード11,12のネットワークアダプタ14B,14Cに、受信した1ブロックのデータD8を転送する。
このように、転送元であるノード10は、ブロードキャストする転送データを、より分割し、ノード10からノード11,12,13に対し、各分割したデータを別々に転送し、次に、ノード10は、分割した残りのデータを、各ノード11,12,13に転送するとともに、ノード11,12,13は、ノード10以外の他のノード11,12,13に、自分が受け取ったデータを転送する。
この例では、転送データを細分割したため、4回の転送が必要となるが、転送回数が2回の第1の実施の形態での転送時間は、総転送量÷4×2=2/4となるのに対し、第2の実施の形態では、総転送量÷10×4=4/10となる。従って、第1の実施の形態に比し、第2の実施の形態は、約4/5の時間でブロードキャストできる。
――第3の実施の形態――
図10は、本発明の第3の実施の形態のブロードキャスト処理の説明図である。この例は、各々ネットワークアダプタを3つ持つ16個のノード0〜15で構成されたネットワークシステムにおいて、ノード0からノード1〜15へ、データをブロードキャストする例である。
先ず、4つのノード0,4,8,12を対象に、第1の実施の形態と同様に、ノード0は、12ブロックD0〜D11のデータを、4分割する。ノード0の各ネットワークアダプタ14A,14B,14Cから各3ブロックのデータD0〜D2,D3〜D5,D6〜D8を、ノード4,8,12の対応するネットワークアダプタ14A,14B、14Cに転送する。
次に、2回目の転送を開始し、3ブロックのデータD0〜D2を受信したノード4は、2つのネットワークアダプタ14A,14Bから、データD0〜D2を受信していないノード8,12のネットワークアダプタ14A,14Bに、受信した3ブロックのデータD0〜D2を転送する。
同様に、3ブロックのデータD3〜D5を受信したノード8は、2つのネットワークアダプタ14A,14Cから、データD3〜D5を受信していないノード12,4のネットワークアダプタ14A,14Cに、受信した3ブロックのデータD3〜D5を転送する。
又、3ブロックのデータD6〜D8を受信したノード12は、2つのネットワークアダプタ14B,14Cから、データD6〜D8を受信していないノード4,8のネットワークアダプタ14B,14Cに、受信した3ブロックのデータD6〜D8を転送する。
これとともに、ノード0は、1回目の転送で、未転送であった残りの3ブロックのデータD9〜D11を、3つのネットワークアダプタ14A,14B、14Cから、ノード4、8,12のネットワークアダプタ14A,14B、14Cに、3ブロックのデータD9〜D11を転送する。
これにより、第1の実施の形態で説明したように、4つのノード0,4,8,12は、12ブロックのデータを保持する。第3回目は、ノード0が、ノード1〜3、ノード4が、ノード5〜7、ノード8が、ノード9〜11、ノード12が、ノード13〜15を対象に、第1回目のデータ転送と同様に、データ転送動作をする。
更に、第4回目のデータ転送は、各々、ノード0〜3、4〜7、8〜11、12〜15をグループとして、第2回目のデータ転送と同様の転送動作を行う。
このように、一回にブロードキャストできる最大のノード数は、ネットワークアダプタの数と同一であり、ノード数が更に増える場合には、2回のデータ転送を、2段、3段と行うことにより、ブロードキャストできるノード数を増加できる。例えば、256ノードのネットワークシステムでは、8回のデータ転送を行えば良い。
――他の実施の形態――
前述の実施の形態では、4ノードのネットワークシステムで説明したが、3ノード以上のネットワークシステムに適用できる。又、ノードの構成を、CPU,メモリ等のコンピュータユニットで説明したが、他の構成のものでも良い。
更に、ネットワークシステムを並列計算機で説明したが、他の分散処理システムや、通信システムにも適用できる。しかも、伝送路のフォーマットは、Ethernet(登録商標)に限らず、他のネットワークプロトコルを適用できる。
(付記1)各々複数のネットワークアダプタを有する3つ以上のノードと、前記各ノードのネットワークアダプタ間を接続するクロスバースイッチとを有し、1の前記ノードは、他の前記複数のノードに転送するデータを、複数個のデータに分割し、前記分割したデータの各々を、各々異なるネットワークアダプタを介し、他の前記複数のノードに転送し、前記分割されたデータを受け取った前記他の複数のノードの各々は、前記受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割されたデータを受け取っていない他のノードに転送することを特徴とするネットワークシステム。
(付記2)前記他の複数のノードの各々は、前記1のノードから前記分割されたデータを受信するとともに、以前に受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送することを特徴とする付記1のネットワークシステム。
(付記3)前記1のノードは、前記転送するデータを、前記ネットワークアダプタの数に従った分割数で、分割して、前記分割データを作成することを特徴とする付記1のネットワークシステム。
(付記4)前記1のノードは、前記分割データを、前記ネットワークアダプタの数の前記複数のノードに、転送することを特徴とする付記1のネットワークシステム。
(付記5)前記1のノードは、前記ネットワークアダプタの数と転送回数に従った分割数で、分割して、前記分割データを作成することを特徴とする付記2のネットワークシステム。
(付記6)前記他の複数のノードの各々は、前記受け取った分割されたデータを、前記複数のノード間で、前記ネットワークアダプタを重複使用しないように決められたネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送することを特徴とする付記1のネットワークシステム。
(付記7)前記他の複数のノードが、3つ以上のノードであることを特徴とする付記1のネットワークシステム。
(付記8)前記各ネットワークアダプタが、前記クロスバースイッチと、ネットワークを介し接続されたことを特徴とする付記1のネットワークシステム。
(付記9)前記各ノードが、少なくともCPUと、メモリと、前記複数のネットワークアダプタとで構成されたことを特徴とする付記1のネットワークシステム。
(付記10)前記複数のノードが、並列計算を実行する並列計算機システムで構成されたことを特徴とする付記1のネットワークシステム。
(付記11)複数のネットワークアダプタを有する1のノードから、各々複数のネットワークアダプタを有する他の複数のノードに、データをブロードキャストするネットワークシステムのブロードキャスト処理方法において、前記1のノードで、前記他の複数のノードに転送するデータを、複数個のデータに分割するステップと、前記1のノードから前記分割したデータの各々を、各々異なるネットワークアダプタを介し、他の前記複数のノードに転送する第1のステップと、前記分割されたデータを受け取った前記他の複数のノードの各々から、前記受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送する第2のステップとを有することを特徴とするネットワークシステムのブロードキャスト処理方法。
(付記12)前記第2のステップは、前記他の複数のノードの各々が、前記1のノードから前記分割されたデータを受信するとともに、以前に受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送するステップを有することを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
(付記13)前記分割ステップは、前記転送するデータを、前記ネットワークアダプタの数に従った分割数で、分割して、前記分割データを作成するステップからなることを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
(付記14)前記第1のステップは、前記分割データを、前記ネットワークアダプタの数の前記複数のノードに、転送するステップからなることを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
(付記15)前記分割ステップは、前記ネットワークアダプタの数と転送回数に従った分割数で、分割して、前記分割データを作成するステップからなることを特徴とする付記12のネットワークシステムのブロードキャスト処理方法。
(付記16)前記第2のステップは、前記受け取った分割されたデータを、前記複数のノード間で、前記ネットワークアダプタを重複使用しないように決められたネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送するステップからなることを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
(付記17)前記他の複数のノードが、3つ以上のノードであることを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
(付記18)前記各ネットワークアダプタが、前記クロスバースイッチと、ネットワークを介し接続されたことを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
(付記19)前記各ノードが、少なくともCPUと、メモリと、前記複数のネットワークアダプタとで構成されたことを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
(付記20)前記第2のステップは、前記1のノードから前記第1のステップで転送しなかった分割したデータの各々を、各々異なるネットワークアダプタを介し、他の前記複数のノードに転送するステップを更に有することを特徴とする付記11のネットワークシステムのブロードキャスト処理方法。
転送元ノードが、ブロードキャストする転送データを、分割し、転送元ノードから他の複数のノードに対し、各分割したデータを別々に転送し、次に、転送データを受けた他の複数のノードは、転送元ノード以外の他のノードに、自分が受け取ったデータを転送する。このように、2回目のデータ転送で、より多くのノード(ネットワークアダプタ)が、データ転送に参加するようにしているため、高速に転送処理を実現でき、ブロードキャストの転送処理時間を短縮できる。
本発明の一実施の形態のネットワークシステムの構成図である。 図1のノードの構成図である。 図1及び図2のネットワークアダプタの構成図である。 図1の伝送フレームのフォーマット図である。 本発明の第1の実施の形態のブロードキャスト処理の説明図である。 図6の第1の実施の形態のデータの流れ図である。 図5の第1の実施の形態の転送元ノードの処理フロー図である。 図5の第1の実施の形態の転送先ノードの処理フロー図である。 本発明の第2の実施の形態のブロードキャスト処理の説明図である。 本発明の第3の実施の形態のブロードキャスト処理の説明図である。 第1の従来技術のブロードキャスト処理の説明図である。 図12のデータの流れ図である。 第2の従来技術のブロードキャスト処理の説明図である。 図13のデータの流れ図である。
符号の説明
10,11,12,13 ノード
14A,14B,14C ネットワークアダプタ
20,21,22 クロスバースイッチ
40 CPU
42 システムコントローラ
44 メモリ
46 IOアダプタ

Claims (5)

  1. 各々複数のネットワークアダプタを有する3つ以上のノードと、
    前記各ノードのネットワークアダプタ間を接続するクロスバースイッチとを有し、
    1の前記ノードは、他の前記複数のノードに転送するデータを、複数個のデータに分割し、前記分割したデータの各々を、各々異なるネットワークアダプタを介し、他の前記複数のノードに転送し、
    前記分割されたデータを受け取った前記他の複数のノードの各々は、前記受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割されたデータを受け取っていない他のノードに転送する
    ことを特徴とするネットワークシステム。
  2. 前記他の複数のノードの各々は、前記1のノードから前記分割されたデータを受信するとともに、以前に受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送する
    ことを特徴とする請求項1のネットワークシステム。
  3. 前記1のノードは、前記転送するデータを、前記ネットワークアダプタの数に従った分割数で、分割して、前記分割データを作成する
    ことを特徴とする請求項1のネットワークシステム。
  4. 複数のネットワークアダプタを有する1のノードから、各々複数のネットワークアダプタを有する他の複数のノードに、データをブロードキャストするネットワークシステムのブロードキャスト処理方法において、
    前記1のノードで、前記他の複数のノードに転送するデータを、複数個のデータに分割するステップと、
    前記1のノードから前記分割したデータの各々を、各々異なるネットワークアダプタを介し、他の前記複数のノードに転送する第1のステップと、
    前記分割されたデータを受け取った前記他の複数のノードの各々から、前記受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送する第2のステップとを有する
    ことを特徴とするネットワークシステムのブロードキャスト処理方法。
  5. 前記第2のステップは、前記他の複数のノードの各々が、前記1のノードから前記分割されたデータを受信するとともに、以前に受け取った分割されたデータを、前記ネットワークアダプタを介し、前記分割データを受け取っていない他のノードに転送するステップを有する
    ことを特徴とする請求項4のネットワークシステムのブロードキャスト処理方法。
JP2006068895A 2006-03-14 2006-03-14 ネットワークシステムのブロードキャスト処理方法及びネットワークシステム Expired - Fee Related JP4704252B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2006068895A JP4704252B2 (ja) 2006-03-14 2006-03-14 ネットワークシステムのブロードキャスト処理方法及びネットワークシステム
US11/472,985 US8386624B2 (en) 2006-03-14 2006-06-23 Broadcast processing method for network system and network system
EP06253424.3A EP1887477B1 (en) 2006-03-14 2006-06-29 Broadcast processing method for network system and network system
CNA2006101075212A CN101039202A (zh) 2006-03-14 2006-07-20 网络系统的广播处理方法及网络系统
KR20060068359A KR100774901B1 (ko) 2006-03-14 2006-07-21 네트워크 시스템의 브로드캐스트 처리 방법 및 네트워크시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006068895A JP4704252B2 (ja) 2006-03-14 2006-03-14 ネットワークシステムのブロードキャスト処理方法及びネットワークシステム

Publications (2)

Publication Number Publication Date
JP2007251334A JP2007251334A (ja) 2007-09-27
JP4704252B2 true JP4704252B2 (ja) 2011-06-15

Family

ID=38353616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006068895A Expired - Fee Related JP4704252B2 (ja) 2006-03-14 2006-03-14 ネットワークシステムのブロードキャスト処理方法及びネットワークシステム

Country Status (5)

Country Link
US (1) US8386624B2 (ja)
EP (1) EP1887477B1 (ja)
JP (1) JP4704252B2 (ja)
KR (1) KR100774901B1 (ja)
CN (1) CN101039202A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101291300B (zh) * 2008-06-12 2011-04-20 华为技术有限公司 消息业务中文件传输的实现方法、装置和用户设备
JP6001474B2 (ja) * 2013-02-26 2016-10-05 日本電信電話株式会社 ブートイメージ配信方法及びブートイメージ配信システム
TWI536816B (zh) 2014-05-12 2016-06-01 財團法人工業技術研究院 網路資料平行傳輸排程的方法與系統
JP6699764B1 (ja) * 2019-01-16 2020-05-27 株式会社富士通ゼネラル 空気調和システム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6115265A (ja) * 1984-06-27 1986-01-23 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション スイツチングシステム
US5136143A (en) * 1991-06-14 1992-08-04 Heatron, Inc. Coated cartridge heater
JPH07123252B2 (ja) 1991-11-27 1995-12-25 インターナショナル・ビジネス・マシーンズ・コーポレイション ネットワーク用スイッチングシステム
JPH07244648A (ja) * 1994-03-07 1995-09-19 Fujitsu Ltd 並列処理システムの同報通信方法
US6055599A (en) * 1995-09-11 2000-04-25 Electronics & Telecommunications Research Institute Hierarchical crossbar interconnection network for a cluster-based parallel processing computer
US5864535A (en) * 1996-09-18 1999-01-26 International Business Machines Corporation Network server having dynamic load balancing of messages in both inbound and outbound directions
US6678769B1 (en) * 1998-02-24 2004-01-13 Canon Kabushiki Kaisha Control apparatus and method for managing a logical connection between source and destination nodes
US6223242B1 (en) * 1998-09-28 2001-04-24 Sifera, Inc. Linearly expandable self-routing crossbar switch
JP3721283B2 (ja) * 1999-06-03 2005-11-30 株式会社日立製作所 主記憶共有型マルチプロセッサシステム
EP1381959A4 (en) 2001-02-24 2008-10-29 Ibm GLOBAL ARBORESCENT NETWORK FOR CALCULATION STRUCTURES
JP4546413B2 (ja) * 2006-03-17 2010-09-15 富士通株式会社 並列計算機のリダクション処理方法及び並列計算機

Also Published As

Publication number Publication date
EP1887477A3 (en) 2008-12-31
KR100774901B1 (ko) 2007-11-09
EP1887477A2 (en) 2008-02-13
KR20070093778A (ko) 2007-09-19
JP2007251334A (ja) 2007-09-27
US20070217450A1 (en) 2007-09-20
EP1887477B1 (en) 2016-10-12
US8386624B2 (en) 2013-02-26
CN101039202A (zh) 2007-09-19

Similar Documents

Publication Publication Date Title
JP4546413B2 (ja) 並列計算機のリダクション処理方法及び並列計算機
US8654798B2 (en) Barrier synchronization apparatus, barrier synchronization system, and barrier synchronization method
US20160239393A1 (en) Faulty core recovery mechanisms for a three-dimensional network on a processor array
JP5460143B2 (ja) データ処理装置、データ処理方法およびプログラム
JP2009246525A (ja) 転送装置及びパケット伝送装置
JP4704252B2 (ja) ネットワークシステムのブロードキャスト処理方法及びネットワークシステム
US8416702B2 (en) Network switch, path setting method, and program
JP2004192483A (ja) 分散ストレージシステムの管理方法
JP4088611B2 (ja) シングル・チップ・プロトコル・コンバーター
US20070028152A1 (en) System and Method of Processing Received Line Traffic for PCI Express that Provides Line-Speed Processing, and Provides Substantial Gate-Count Savings
JP2007102476A (ja) クロスバースイッチ、情報処理装置および転送方法
EP0724813A1 (en) Telecommunication exchange comprising a processor system, and a processor system
EP1476986B1 (en) Information communication controller interface apparatus and method
JP2009188623A (ja) ネットワーク中継装置およびネットワーク中継方法
CN112385159A (zh) 多路径编码装置及相关技术
EP4250118A1 (en) Client and network based erasure code recovery
WO2023093065A1 (zh) 数据传输方法、计算设备及计算系统
JP5168182B2 (ja) 入出力データ転送方式
WO2014061076A1 (ja) 通信システム及び通信装置
WO2020090009A1 (ja) 演算処理装置及びその制御方法
CN116804952A (zh) 基于客户端和网络的擦除码恢复
JP2019115001A (ja) テーブル変換装置、テーブル変換方法、及びゲートウェイ装置
JP2004341595A (ja) 信号転送方法及び信号処理システム
JP2002288147A (ja) 分散メモリ型並列計算機およびコンピュータ・プログラム
JP2005250519A (ja) 2重化システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110309

LAPS Cancellation because of no payment of annual fees