JP5244362B2 - 高速ネットワークシステム及び関連装置 - Google Patents

高速ネットワークシステム及び関連装置 Download PDF

Info

Publication number
JP5244362B2
JP5244362B2 JP2007263197A JP2007263197A JP5244362B2 JP 5244362 B2 JP5244362 B2 JP 5244362B2 JP 2007263197 A JP2007263197 A JP 2007263197A JP 2007263197 A JP2007263197 A JP 2007263197A JP 5244362 B2 JP5244362 B2 JP 5244362B2
Authority
JP
Japan
Prior art keywords
computer
pci express
signal
dedicated
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007263197A
Other languages
English (en)
Other versions
JP2009094778A (ja
Inventor
秀人 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AKIB SYSTEMS INC.
Original Assignee
AKIB SYSTEMS INC.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AKIB SYSTEMS INC. filed Critical AKIB SYSTEMS INC.
Priority to JP2007263197A priority Critical patent/JP5244362B2/ja
Publication of JP2009094778A publication Critical patent/JP2009094778A/ja
Application granted granted Critical
Publication of JP5244362B2 publication Critical patent/JP5244362B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ネットワークシステム、特に通信速度が向上した高速ネットワークシステムに関する。
今日の社会では、インターネットで接続される膨大な数の情報処理端末を利用して、情報の活用が図られている。これらインターネットで接続される情報処理端末として使用されるパーソナルコンピュータや携帯電子端末は、通信技術の発達等に伴って、飛躍的に増加した。
また、これらパーソナルコンピュータや携帯電子端末において、動画等の情報が扱われることが多くなり、これらの情報処理端末間で大容量の情報を短時間に伝送したいという要求が高まっている。
この要求に対して、例えば光ファイバを情報伝送媒体として利用することによって、従来のメタリックケーブルよりも高速に情報が伝送されることが実現している。
また、情報処理端末に情報を提供するサーバシステムにおいては、半導体製造技術の発達によって情報処理能力が飛躍的に向上し、情報処理速度が各サーバ間の情報伝送速度を越えるようになった。
このため、サーバシステムから情報処理端末に対してさらに高速に情報を提供するためには、このサーバシステム内における情報伝送速度を高速化させることが不可欠となっている。
一方、近年、学術研究等における高度な計算処理を行うために、HPC(High Performance Computing)と呼ばれるスーパーコンピュータが知られており、そのHPCに関して種々の研究・開発が進められている。
このHPCとは、複数のノードコンピュータをネットワークで結合して、1つのシステムに統合したものである。これら複数のノードコンピュータは何らかの媒体によって双方向の通信できるように接続され、全体として1つのコンピュータとして扱えるように制御される。そして、HPC全体で各ノードコンピュータの処理速度を超える速い処理速度を得るのである。なお、ノードコンピュータとは、HPC内のネットワークに接続されたコンピュータやHUB等の機器である。
このHPCでは、本願出願時においては、一般的に1G(10の9乗)ビット/秒の「イーサネット(登録商標)」又は「ミリネット」(Myricom社製のネットワークシステム)等の特殊なネットワークが採用されており、最大4Gビット/秒(理論最大値、双方向通信を実現した場合)を実現することが主流となっている。
HPCを構成する上記「イーサネット(登録商標)」や「ミリネット」の情報伝送速度は、本願出願時においては、各ノードコンピュータの演算速度よりも速かったため、上記「イーサネット(登録商標)」や「ミリネット」を採用することによって、各ノードコンピュータの演算能力が十分に活用できたのである。
しかし、近年、例えばAMD社のOpteron等の、従来よりも演算速度が劇的に向上したプロセッサが開発され、このプロセッサがSMPシステムのノードコンピュータに搭載されるようになった。この結果、各ノードコンピュータの演算速度がネットワークの通信速度を越えるようになり、ネットワークの通信速度が、SMPシステム全体の性能にとってボトルネックとなる場合が生じるようになった。なお、SMPシステムとは、Symmetric Multi Processing システムの略であり、システム内に実装された全てのCPUに対して均一に処理を分担させるHPCである。
このネットワークの通信速度の問題は、SMPシステムの処理速度をさらに高速化させる上で深刻な問題であり、SMPシステムを構成するネットワークの高性能化が急務となっている。
そこで、従来のネットワークよりもさらに高速に通信を行うことを目的とした種々の研究・開発が、近年活発になされている。
先行技術文献
ネットワークの高速化に関する先行特許文献を挙げる。
下記特許文献1には、PCIバスインターフェースが、高速ネットワークのボトルネックにならないようにするための技術が開示されている。
特開2003−058395号公報
本願発明者は、上述した背景の下、コンピュータのいわゆる拡張インターフェースを利用してサーバシステムやコンピュータクラスタにおけるノードコンピュータ間の相互通信を実現し、これを一般的なネットワークとして稼働させることを考察した。
本願発明は、上記で述べたような考えを基礎としてなされたものであり、その目的は、コンピュータシステムの拡張インターフェースをネットワークとして使用しうるシステム及びそれに関連する機器を提供することである。
(1)本発明は、上記課題を鑑みてなされたものであり、第1の拡張インターフェースを備える第1のコンピュータと、前記第1の拡張インターフェースに接続する第1のNIC装置と、第2の拡張インターフェースを備える第2のコンピュータと、前記第2の拡張インターフェースに接続する第2のNIC装置と、前記第1のNIC装置及び第2のNIC装置に接続するネットワークケーブルと、からなるネットワークシステムにおいて、前記第1のNIC装置は、前記第1の拡張インターフェースから供給された所定の信号を保存する送信用バッファ手段と、前記送信用バッファ手段に保存した前記信号を、前記ネットワークケーブルに対して、所定のタイミングで送信する第1の送信手段と、を備え、前記第2のNIC装置は、前記ケーブルから送信されてきた前記信号を保存する受信用バッファ手段と、前記受信用バッファ手段に保存した前記信号を前記第2の拡張インターフェースに送信する第2の送信手段と、を備えることを特徴とするネットワークシステムである。
(2)本発明は、上記(1)に記載のネットワークシステムにおいて、前記第1の拡張インターフェース及び前記第2の拡張インターフェースは、PCI Expressのインターフェースであり、前記ネットワークケーブルはPCI Expressのケーブルであることを特徴とするネットワークシステムである。
(3)本発明は、コンピュータの拡張インターフェースに接続するNIC装置において、ネットワークケーブルとの接続コネクタと、前記拡張インターフェースから受信した所定の第1の信号を保存する送信用バッファ手段と、前記送信用バッファ手段に保存した前記第1の信号を、前記接続コネクタを介して前記ネットワークケーブルに対して、所定のタイミングで送信する第1の送信手段と、前記接続コネクタを介して前記ネットワークケーブルから受信した所定の第2の信号を保存する受信用バッファ手段と、前記受信用バッファ手段に保存した前記第2の信号を前記拡張インターフェースに送信する第2の送信手段と、を備えることを特徴とするNIC装置である。
(4)本発明は、上記(3)に記載のNIC装置において、前記拡張インターフェースは、PCI Expressのインターフェースであり、前記ネットワークケーブルは、PCI Expressのケーブルであることを特徴とするNIC装置である。
(5)また、本発明は、上記課題を解決するために、複数のコンピュータと、前記複数のコンピュータと接続するHUB装置と、を備えたネットワークシステムにおいて、それぞれの前記コンピュータは拡張インターフェースを有しており、この拡張インターフェースに接続するNIC装置がそれぞれの前記コンピュータに接続しており、前記コンピュータ毎にそれぞれ接続されている前記NIC装置には、それぞれネットワークケーブルが接続しており、それぞれの前記ネットワークケーブルは、前記HUB装置に接続しており、各NIC装置は、そのNIC装置が接続する前記拡張インターフェースから受信した所定の信号を保存する送信用バッファ手段と、前記送信用バッファ手段に保存した前記信号を、そのNIC装置が接続する前記ネットワークケーブルに対して、所定のタイミングで送信する送信手段と、を備え、前記HUB装置は、接続する複数の前記コンピュータのアドレスを保存する記憶装置と、いずれかのネットワークケーブルから送信されてきた前記信号を保存する中継用バッファ手段と、前記中継用バッファ手段に保存された前記信号から、宛先のコンピュータのアドレス情報を抽出する抽出手段と、前記抽出手段が抽出した前記アドレス情報を前記記憶装置から検索し、前記信号の宛先である前記コンピュータを特定する特定手段と、前記中継用バッファ手段に保存された前記信号を、前記特定したコンピュータに接続する前記ネットワークケーブルを介して送信するスイッチング手段と、
を備えることを特徴とするネットワークシステムである。
(6)本発明は、上記課題を解決するために、複数のコンピュータに所定の拡張インターフェースを介してそれぞれ接続している複数のNIC装置に、所定のネットワークケーブルを介して接続するHUB装置において、接続する複数の前記コンピュータのアドレスを保存する記憶装置と、いずれかの前記NIC装置から受信した信号を保存する中継用バッファ手段と、前記中継用バッファ手段に保存された前記信号に含まれる宛先のデバイス情報を抽出する抽出手段と、前記デバイス情報に基づいて前記信号の宛先であるコンピュータを特定する特定手段と、前記中継用バッファ手段に保存された前記信号から、宛先のコンピュータのアドレス情報を抽出する抽出手段と、前記抽出手段が抽出した前記アドレス情報を前記記憶装置から検索し、前記信号の宛先である前記コンピュータを特定する特定手段と、前記中継用バッファ手段に保存された前記信号を、前記特定したコンピュータに接続する前記ネットワークケーブルを介して送信するスイッチング手段と、を備えることを特徴とするHUB装置である。
(7)本発明は、上記課題を解決するために上記(5)記載のネットワークシステムにおいて、前記拡張インターフェースは、PCI Expressの拡張インターフェースであり、前記ネットワークケーブルは、PCI Expressのケーブルであることを特徴とするネットワークシステムである。
(8)また、本発明は、上記(6)に記載のNIC装置において、前記拡張インターフェースは、PCI Expressの拡張インターフェースであり、前記ネットワークケーブルは、PCI Expressのケーブルであることを特徴とするNIC装置である。
以上述べたように、本発明によれば、拡張インターフェースを用いてネットワークを構成したので、高速なネットワークシステムを簡便に構成することができる。また、そのネットワークを利用してコンピュータクラスタを構築でき、ひいては性能の向上したスーパーコンピュータを実現することができる。
以下、本発明の好ましい形態を図面に基づいて説明する。
第1 ネットワークシステムの概要
上述したように、本願発明者らは、コンピュータの拡張インターフェースをネットワークとして活用しうるシステムを開発した。コンピュータの拡張インターフェースでは、そのコンピュータのクロックに基づいてデータの伝送が行われる。また、複数のコンピュータの各拡張インターフェースでは、それぞれ異なるクロックでデータの伝送が行われる。本願発明者らは、複数のコンピュータの各拡張インターフェース同士を接続するために、各コンピュータの間にバッファ手段を設けて、各コンピュータの拡張インターフェース同士を接続した。
本実施の形態においては、高速な拡張インターフェースであるPCI Expressをネットワークとして利用した。すなわち、本実施の形態では、PCI Express拡張インターフェースを利用した専用NIC装置及び専用HUB装置を新規に作成し、これら専用NIC装置と専用HUB装置とを用いて、PCI Expressのネットワークを構成したのである。
図1には、本実施の形態におけるネットワークシステムのブロック概念図が示されている。この図1に示すように、ノードコンピュータ10の拡張インターフェース(PCI Express)には、専用NIC装置12が接続されている。また、図1中のノードコンピュータ20の拡張インターフェース(PCI Express)には、上述したように、専用NIC装置22が接続されている。
さらに、これら専用NIC装置12、22は、図1に示すように、それぞれ専用HUB装置30に接続されている。
この図1中の、ノードコンピュータ10の拡張ソケットに専用NIC装置12が挿入され、ノードコンピュータ10と専用NIC装置12との間でデータ通信が行われる。また、図1中の、ノードコンピュータ20の拡張ソケットに専用NIC装置22が挿入され、ノードコンピュータ20と専用NIC装置22との間の通信が行われる。
また、図1中の、専用NIC装置12及び専用HUB装置30はPCI Expressのケーブル35cで接続されており、専用HUB装置30に対してデータが伝送される。また、図1中の専用NIC装置22及び専用HUB装置30はPCI Expressのケーブル35dで接続されており、専用HUB装置30のに対してデータが伝送される。
PCI Expressについて
よく知られているように、PCI Expressは、差動信号によるシリアル通信を行っている。片方向の伝送路を1組用意し、双方向にしたものを「レーン」と呼ぶ。また、2つのデバイスを接続するPCI Expressの伝送路を「リンク」と言う。1つのリンクは、最大32のレーンから構成することができる。1レーンで構成されたリンクを「PCIe x1」と表す。32レーンで構成されたリンクは同様に「PCIe x32」と表す。
第2 専用HUB装置
図2は図1と同様の図であるが、専用HUB装置30をより詳細に表した図である。
この図2に示すように、専用HUB装置30は、上流側のチェーンポート32a、下流側のチェーンポート32bを有している。これらチェーンポート32a、32bには、別の専用HUB装置がディジーチェーン接続によって接続することができる。なお、図2では、専用HUB装置30の上流側のチェーンポート32aには何も接続せず、下流側のチェーンポート32bには他の専用HUB装置31を接続している。
図2では、図の上では便宜上チェーンポート32aには何も接続されていないが、PCI Expressの通信形態上、ルートコンプレックスを接続しておくことが好ましい。これは、しばしばホストコンピュータがその役割を果たすことが多い。
また、この専用HUB装置30は、ノードポート34a、34b、34c、34d、34e、34f、34g、34hを有している。図2では、これらのうちノードポート34aに、ノードコンピュータ10が接続され、ノードポート34bに、ノードコンピュータ20が接続されている。
なお、本実施の形態では、便宜上、図2中の各チェーンポート32a、32bでは、PCIe x8に基づく通信が行われ、各ノードポート34a〜34hでは、PCIe x4に基づく通信が行われている。もちろん他のレーン数を採用してもかまわない。

以上述べた構成によって、ノードコンピュータ10及び20は、PCI Express拡張インターフェースを利用したネットワークで接続され、高速な通信が実現する。
(1) 専用NIC装置の構成
上述したように、本実施の形態では、複数のコンピュータの各拡張インターフェース(PCI Express)同士を接続して、ネットワークを構成するために、専用NIC装置を新規に作成した。
各コンピュータのPCI Expressインターフェースでは、パケット通信が行われるため、各コンピュータのPCI Express拡張インターフェース同士を接続して互いに通信を行うために、パケットを保管する何らかの手段が必要である。
そこで、本実施の形態では、各コンピュータの拡張インターフェース同士を接続して互いに通信を行うために、送信用バッファ手段、受信用バッファ手段、及びPCI Expressスイッチチップを備えた専用NIC装置を新規に作成した。
以下、本節では、図3及び図4に基づいて、専用NIC装置の構成について説明する。 まず、図3には、本実施の形態において専用NIC装置12のブロック図が示されている。そして、図4には、専用NIC装置12の使用を示す表が示されている。
図3に示すように、専用NIC装置12は、1個のカードエッジ40aを備えている。このカードエッジ40aは、ノードコンピュータ10の拡張スロットに挿入され、ノードコンピュータ10との間でPCI x8に基づく通信が行われる。
また、この図3に示すように、専用NIC装置12には、1個のHUB接続コネクタ40bが備えられている。このHUB接続コネクタ40bには、専用HUB装置30と繋がるネットワークケーブルが接続される。この結果、専用HUB装置30との間では、PCIe x8に基づく通信が行われる。なお、ネットワークケーブルは、PCI Express(x8)用のケーブルをそのまま用いる。
次に、この図3に示すように、専用NIC装置12には、PCI Expressスイッチチップ43が搭載されている。このPCI Expressスイッチチップ43は、図3に示すように、バス配線55a、バス配線55bを備えており、それぞれHUB接続コネクタ40b、カードエッジ40aに接続されている。このPCI Expressスイッチチップ43は、本実施の形態において、PCI Expressの信号をスイッチングするために用いている。
このPCI Expressスイッチチップ43は、ノードコンピュータ10からノードコンピュータ10の外部に対して送信されたデータのパケット、及びノードコンピュータ10がノードコンピュータ10の外部から受信するデータのパケットのスイッチングを行う。
本実施の形態において特徴的なことは、コンピュータの拡張インターフェース(PCI Express)を用いて、ネットワークを構成したことである。それを実現するための工夫の一つが、PCI Expressをスイッチングするスイッチチップを用いてNIC装置を作成したことである。このスイッチチップは、PCI Expressで伝送されるデータに含まれるデバイスIDの情報を読み込み、PCI Expressのスイッチングを行い、所定のデバイスに対して、そのデータを送出することができるスイッチチップである。
さらに、図3に示すように、専用NIC装置12には、送信用FIFO50aが搭載されている。この送信用FIFO50aは、図3に示すように、PCI Expressスイッチチップ43に接続されている。この送信用FIFO50aは、送信用のバッファとしての役割を担っている。具体的には、ノードコンピュータ10がノードコンピュータ20に対して所定のデータを送信する場合において、まず、PCI Expressスイッチチップ43が、ノードコンピュータ10から前記データを受信し、PCI Expressスイッチチップ43が、この送信用FIFO50aに前記データ(パケット)を一旦保存する。
次に、PCI Expressスイッチチップ43は、送信用FIFO50aに保存した前記データ(パケット)を所定のタイミングで読み取り、専用HUB装置30に対して前記データを送信する。
このような構成によれば、ノードコンピュータ10から専用HUB装置30に対して(最終的には送信先の相手のコンピュータに対して)データを送信する動作を実行することができる。
また、図3に示すように、専用NIC装置12には、受信用FIFO50bが搭載されている。この受信用FIFO50bは、図3に示すように、PCI Expressスイッチチップ43に接続されており、受信用のバッファとしての役割を担っている。具体的には、ノードコンピュータ20から、専用HUB装置30を介して、ノードコンピュータ10に対して、所定のデータが送られてきた際に、まず、PCI Expressスイッチチップ43が前記受信データ(パケット)を受信用FIFO50bに保存する。
次に、PCI Expressスイッチチップ43は、この受信用FIFO50bに保存された前記データ(パケット)を所定のタイミングで読み取り、ノードコンピュータ10に対して送信する。
このような構成によれば、ノードコンピュータ10は、他のノードコンピュータ(例えばノードコンピュータ20)から送られてきたデータを受信することができる。
なお、この専用NIC装置12自体は、従来の例えばイーサネット(登録商標)のNIC(ネットワークインターフェースカード)と同様のインターフェースカードとしてノードコンピュータ10に認識される。例えば、ノードコンピュータ10のアプリケーションプログラムからは、一般的なイーサネット(登録商標)に対してデータパケットを送信するのと同様にデータを送信することができる。
(2) 専用HUB装置の構成
上述したように、本実施の形態では、複数のコンピュータの各拡張インターフェース(PCI Express)同士を接続するために、専用HUB装置30を新規に作成した。この専用HUB装置30は、PCI Expressデバイススイッチを備えており、このPCI Expressデバイススイッチによって、複数のノードコンピュータを、PCI Expressを利用したネットワークで接続する。
以下、本節では、図5及び図6に基づいて、本実施の形態における専用HUB装置30の構成について説明する。図5には、専用HUB装置30のブロックダイヤグラムが示されている。また、図6には、専用HUB装置30の仕様を示す表が示されている。
この図5に示すように、専用HUB装置30には、2個のチェーンポート32a、32bが備えられている。これらのチェーンポート32a、32bには、別の専用HUB装置を接続する。なお、下流側のチェーンポート32bには、何も接続しなくてもかまわないが、上流側はルートコンプレックスを接続しておくことが好ましい接続形態の一つである。
専用HUB装置をディジーチェーン接続する場合は、上流側又は下流側のチェーンポート32a、32bに他の専用HUB装置を接続する。
さて、専用HUB装置30には、8個のノードポート34a〜34hが備えられている。これらのノードポート34a〜34hには、各ノードコンピュータに繋がるネットワークケーブルを接続する。
次に、この図5に示すように、専用HUB装置30は、1個のPCI Expressデバイススイッチ60を備えている。
このPCI Expressデバイススイッチ60は、図5に示すように、2個のチェーンポート32a、32b、及び8個のノードポート34a、34b、34c、34d、34e、34f、34g、34hに接続されている。
また、このPCI Expressデバイススイッチ60は、図5に示すように、1個のEPROM70と1個の中継用FIFO72とを備えている。PCI Expressデバイススイッチ60は、専用HUB装置30に接続する第1のノードコンピュータ10からデータを受信し、所定のタイミングで、そのデータを第2のノードコンピュータに送信するスイッチング動作を行う。
また、図5に示すように専用HUB装置30は、EEPROM70を備えている。このEEPROM70は、専用HUB装置30に接続するデバイスのIPアドレス及びデバイスID等の情報が格納されている。本実施の形態では、例えば所定のホストコンピュータがこのEEPROM70の内容を適宜設定し、接続するノードコンピュータの情報を登録している。
このようなホストコンピュータは、上述したように、ルートコンプレックスとして用いることも好適である。
また、専用HUB装置30は、中継用FIFO72を備えている。この中継用FIFO72は、ノードポート34a〜34hに接続する各ノードコンピュータから専用HUB装置30に対して送られてきたデータを一旦保管するデータバッファであり、高速な半導体メモリによって構成される。なお、実際の保管動作は、PCI Expressデバイススイッチ60によって行われる。
さて、このPCI Expressデバイススイッチ60は、専用HUB装置30に接続される各ノードコンピュータから送信されたデータのパケットのスイッチングを行う。
本願の発明者は、PCI Expressをネットワークを構成する伝送ラインとして利用するために、PCI Expressで伝送されるデータに含まれるデバイスIDの情報を読み込み、データパケットのスイッチングを行い、専用HUB装置30に接続される複数のデバイス間で通信を行うために、このようなPCI Expressデバイススイッチを作成して利用したものである。
なお、ノードコンピュータに、専用HUB装置30の動作を管理する機能(例えば、PCI Expressデバイススイッチのスイッチング動作を制御する機能や、EPROMの内容を変更する機能など)を付加することも好適である。上述したように、このようなコンピュータは、特にホストコンピュータと呼ぶことが好ましい。
また、このホストコンピュータは、専用HUB装置30の上流側のチェーンポート32aに接続し、専用HUB装置の動作を設定しつつ、ルートコンプレックスとして動作させることも好ましい。
本実施の形態においては、拡張インターフェースの例としてPCI Expressを使用したが、このPCI Expressを利用した通信形態においては、ルートコンプレックスが必要だからである。
第3 システムの動作
図7には、ノードコンピュータ10、20、21a、21b、21cと、専用HUB装置30と、ネットワークケーブルと、から構成されるネットワークの概念図が示されている。本章では、この図7に基づいて、ノードコンピュータ10からノードコンピュータ20に対してデータが伝送される動作について説明する。
まず、図7について説明する。
ノードコンピュータ10、20、21a、21b、21c、が所定のネットワークケーブルによって専用HUB装置30に接続されている。この専用HUB装置30の構成は、上で説明したとおりである。
ノードポート34aには、ノードコンピュータ10が接続されている。
また、ノードポート34bには、ノードコンピュータ20が接続されている。また、同様に、ノードポート34cには、ノードコンピュータ21aが接続され、ノードポート34dには、ノードコンピュータ21bが接続されている。また、同様に、ノードポート34eには、ノードコンピュータ21cが接続されている。
また、ノードコンピュータ20の専用NIC装置22は、専用NIC装置12と同様の構成をしている。すなわち、図7に示すように、PCI Expressスイッチチップ75、送信用FIFO80a、受信用FIFO80bを備えている。
ノードコンピュータ同士の通信に係る動作
次に、本節では、ノードコンピュータ10及び20との間で通信を行う場合の動作を、図8のタイムチャートを用いて説明する。
(1)まず、ノードコンピュータ10が、PCI Expressスイッチチップ43に対して、宛先のノードコンピュータ20のアドレスを含む所定のデータパケットを送信する。これは図8の(1)で表される。
(2)次に、PCI Expressスイッチチップ43は、このデータパケットを送信用FIFO50aに保存する。この動作が、図8中の(2)に示されている。
(3)次に、PCI Expressスイッチチップ43は、送信用FIFO50aに保存された前記データを読み取り、所定のタイミングで、専用HUB装置30に送信する。この動作が、図8中の(3)に示されている。
(4)専用HUB装置30のPCI Expressデバイススイッチ60は、専用NIC装置12から送信されてきた前記データパケットを、中継用FIFO72に一旦保存する。この動作は、図8中の(4)に示されている。
(5)次に、PCI Expressデバイススイッチ60は、上記(4)で保存した前記データパケットに含まれる宛先を抽出し、EEPROM70に保存されているデバイス情報を検索し、宛先(ノードコンピュータ20及びその場所など)を特定する。そして、ノードコンピュータ20の専用NIC装置22が接続するノードポートに関する情報を取得する。この動作は、図8中の(5)に示されている。
(6)次に、PCI Expressデバイススイッチ60は、上記(4)で中継用FIFO72に保存した前記データを読み取り、前記データを専用NIC装置22に送信する。この動作は、図8中の(6)に示されている。
(7)次に、専用NIC装置22内のPCI Expressスイッチチップ75は、上記(6)で送信されてきた前記データを、PCI Expressスイッチチップ75が備える受信用FIFO80bに保存する。この動作が、図8中の(7)に示されている。
(8)次に、PCI Expressスイッチチップ75は、上記(8)で受信用FIFO80bに保存された前記データを、所定のタイミングで読み取り、ノードコンピュータ20に対して送信する。この動作は、図8中の(8)に示されている。
以上(1)から(8)で述べた動作によって、ノードコンピュータ10からノードコンピュータ20に対して、データを送信することができる。
また、上記で述べた(1)から(8)の動作と同様の動作を行うことによって、ノードコンピュータ20からノードコンピュータ10に対して、データを送信することができる。すなわち、ノードコンピュータ10とノードコンピュータ20との間で双方向の通信を行うことができる。
また、上記で述べた(1)から(8)の動作において、ノードコンピュータ10は、宛先のアドレス(IPアドレスやデバイスID、MACアドレスなど、アプリケーションによって種々のものを利用することができる)。
一般的には、専用HUB装置30の上で、所定のアドレステーブルに基づき、アドレス変換を行って、IPアドレスを用いつつ、MACアドレスやデバイスID等に変換して通信を行うことが好ましい。この場合、所定のアドレステーブルは、例えばEEPROM70等に格納しておくことが好ましい。
この結果、アプリケーションプログラムを何ら変更せずに、従来の同様のIPアドレスによる通信をそのまま行うことができる。
また、上記で述べた(1)から(8)で述べた動作によって、図7中のノードコンピュータ10、20、21a、21b、21cのいずれの間においても、双方向の通信を行うことができる。
第4 変形例
上記実施の形態では、図2に示すように、ノードコンピュータ10、20、専用HUB装置30からなるネットワークシステムを説明したが、専用HUB装置30を用いずに、ノードコンピュータ10及び20とを接続して、双方向の通信を行うことも好ましい。
図9には、ノードコンピュータ10とノードコンピュータ20とが直接接続されてなるネットワークシステムの概念図が示されている。
図9に示されている構成は、専用HUB装置30を介さずに、専用NIC装置12と専用NIC装置22とがPCI Expressの拡張インターフェースによって接続されている点を除けば、図1や図2などと同様の構成である。
次に、ノードコンピュータ10及び20との間で通信が行われる動作を、図10に基づいて説明する。
(A)まず、ノードコンピュータ10は、宛先のアドレス情報を含む所定のデータパケットを、専用NIC装置12に送信する。この動作が、図10中の(A)に示されている。
(B)次に、PCI Expressスイッチチップ43は、前記データパケットを、送信用FIFO50aに保存する。この動作が、図10中の(B)に示されている。
(C)次に、PCI Expressスイッチチップ43は、保存した前記データパケットを読み取り、相手先のノードコンピュータ20(の専用NIC装置22)に対して送信する。この動作が、図10中の(C)に示されている。
(D)専用NIC装置22中のPCI Expressスイッチチップ75は、受信したデータパケットを、受信用FIFO81bに保存する。この動作が、図10中の(D)に示されている。
(E)次に、PCI Expressスイッチチップ75は、保存した前記データパケットを読み取り、ノードコンピュータ20に対して送信する。この動作が、図10中の(E)に示されている。
このように、上記(A)から(E)で述べた動作を行うことによって、ノードコンピュータ10からノードコンピュータ20に対して、前記データパケットを送信することができる。
また、上記(A)から(E)で述べた動作と同様の動作を行うことによって、ノードコンピュータ20からノードコンピュータ10に対してデータパケットを送信することができる。すなわち、ノードコンピュータ10及び20との間で、双方向の通信が行える。
また、上記で述べた(A)から(E)の動作において、ノードコンピュータ10は、相手先をそのアドレスで指定するが、アプリケーションレベルではIPアドレスを用いて、そのアドレスをMACアドレスやデバイスID等に変換することも好ましい。
この場合、その変換は、専用NIC装置12が行う。専用NIC装置12内にこの変換のためのアドレス変換テーブルを格納した記憶手段を備えておくことが好ましい一例である。
第5 まとめ
以上述べたように、本実施の形態によれば、PCI Expressを利用してネットワークを構築したので、従来より高速なネットワークシステムを簡便に構築することが可能である。その結果、従来より高性能なサーバシステムやHPCを実現することが可能である。
第6 変形例
本実施の形態では、PCI Expressを用いたが、高速な拡張インターフェースであれば、PCI Expressと同様にネットワークに使用することができると考えられる。
本実施の形態で採用するネットワークシステムのブロック図である。 本実施の形態に係るネットワークシステムの構成図である。 本実施の形態で採用する専用NIC装置のブロック図である。 本実施の形態で採用する専用NIC装置の構成を表す表である。 本実施の形態で採用する専用HUB装置に内蔵される専用HUB装置のブロック図である。 本実施の形態で採用する専用HUB装置の構成を表す表である。 複数のノードコンピュータ及び専用HUB装置で構成するネットワークの構成図である。 ノードコンピュータ同士で通信する動作を説明するタイムチャートである。 ノードコンピュータ同士を直接接続して構成するネットワークのブロック図である。 ノードコンピュータ同士を直接接続して通信する動作を説明するタイムチャートである。
符号の説明
10 ノードコンピュータ
12 専用NIC装置
20 ノードコンピュータ
21a、21b、21c ノードコンピュータ
22 専用NIC装置
23a、23b、23c 専用NIC装置
30、31 専用HUB装置
32a、32b チェーンポート
34a〜34h ノードポート
35c、35d ケーブル
40a カードエッジ
40b HUB接続コネクタ
43 PCI Expressスイッチチップ
50a 送信用FIFO
50b 受信用FIFO
55a、55b バス配線
60 PCI Expressデバイススイッチ
70 EEPROM
72 中継用FIFO
75 PCI Expressスイッチチップ
80a 送信用FIFO
80b 受信用FIFO

Claims (4)

  1. 複数のコンピュータと、前記複数のコンピュータと接続するHUB装置と、を備えたネットワークシステムにおいて、
    それぞれの前記コンピュータは拡張インターフェースを有しており、
    この拡張インターフェースに接続する専用NIC装置がそれぞれの前記コンピュータに接続しており、
    前記コンピュータ毎にそれぞれ接続されている前記専用NIC装置には、それぞれ前記拡張インターフェースのケーブルであるネットワークケーブルが接続しており、
    それぞれの前記ネットワークケーブルは、前記HUB装置に接続しており、
    各専用NIC装置は、
    その専用NIC装置が接続する前記拡張インターフェースから受信した所定の信号を保存する送信用バッファ手段と、
    前記送信用バッファ手段に保存した前記信号を、その専用NIC装置が接続する前記ネットワークケーブルに対して、前記拡張インターフェースの信号のまま、所定のタイミングで送信する送信手段と、
    を備え、
    前記HUB装置は、
    接続する複数の前記コンピュータのアドレス情報とノードポートを保存する記憶装置と、
    いずれかのネットワークケーブルから送信されてきた前記信号を保存する中継用バッファ手段と、
    前記中継用バッファ手段に保存された前記信号から、宛先のコンピュータのアドレス情報を抽出する抽出手段と、
    前記抽出手段が抽出した前記アドレス情報を前記記憶装置から検索し、前記信号の宛先である前記コンピュータのノードポートを特定する特定手段と、
    前記中継用バッファ手段に保存された前記信号を、前記特定したコンピュータのノードポートに接続する前記ネットワークケーブルを介して、前記コンピュータに、前記拡張インターフェースの信号のまま、送信するスイッチング手段と、
    を備え
    前記拡張インターフェースは、PCI Expressの拡張インターフェースであり、
    前記ネットワークケーブルは、PCI Expressのケーブルであり、
    前記コンピュータのアドレス情報は、デバイスID、又は、IPアドレス、又は、MACアドレスのいずれかであることを特徴とするネットワークシステム。
  2. 複数のコンピュータに所定の拡張インターフェースを介してそれぞれ接続している複数の専用NIC装置に、所定の前記拡張インターフェースのケーブルであるネットワークケーブルを介して接続するHUB装置において、
    接続する複数の前記コンピュータのアドレス情報とノードポートを保存する記憶装置と、
    いずれかの前記専用NIC装置から受信した信号を保存する中継用バッファ手段と、
    前記中継用バッファ手段に保存された前記信号から、宛先のコンピュータのアドレス情報を抽出する抽出手段と、
    前記抽出手段が抽出した前記アドレス情報を前記記憶装置から検索し、前記信号の宛先である前記コンピュータを特定する特定手段と、
    前記中継用バッファ手段に保存された前記信号を、前記特定したコンピュータに接続する前記ネットワークケーブルを介して、前記拡張インターフェースの信号のまま、送信するスイッチング手段と、
    を備え
    前記拡張インターフェースは、PCI Expressの拡張インターフェースであり、
    前記ネットワークケーブルは、PCI Expressのケーブルであり、
    前記コンピュータのアドレス情報は、デバイスID、又は、IPアドレス、又は、MACアドレスのいずれかであることを特徴とするHUB装置。
  3. 請求項1に記載のネットワークシステムにおいて、
    前記抽出手段が抽出した前記コンピュータのアドレス情報であるIPアドレスを、MACアドレス又はデバイスIDに変換する手段、
    を含み、
    前記特定手段は、前記変換したMACアドレス又はデバイスIDを前記記憶装置から検索し、前記信号の宛先である前記コンピュータを特定することを特徴とするネットワークシステム。
  4. 請求項2に記載のHUB装置において、
    前記抽出手段が抽出した前記コンピュータのアドレス情報であるIPアドレスを、MACアドレス又はデバイスIDに変換する手段、
    を含み、
    前記特定手段は、前記変換したMACアドレス又はデバイスIDを前記記憶装置から検索し、前記信号の宛先である前記コンピュータを特定することを特徴とするHUB装置。
JP2007263197A 2007-10-09 2007-10-09 高速ネットワークシステム及び関連装置 Active JP5244362B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007263197A JP5244362B2 (ja) 2007-10-09 2007-10-09 高速ネットワークシステム及び関連装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007263197A JP5244362B2 (ja) 2007-10-09 2007-10-09 高速ネットワークシステム及び関連装置

Publications (2)

Publication Number Publication Date
JP2009094778A JP2009094778A (ja) 2009-04-30
JP5244362B2 true JP5244362B2 (ja) 2013-07-24

Family

ID=40666296

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007263197A Active JP5244362B2 (ja) 2007-10-09 2007-10-09 高速ネットワークシステム及び関連装置

Country Status (1)

Country Link
JP (1) JP5244362B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5426228B2 (ja) * 2009-05-11 2014-02-26 株式会社アキブホールディングス ネットワークシステム、ホストコンピュータ、hub装置、nic装置、及び通信方法
US8938567B2 (en) 2010-03-11 2015-01-20 Ricoh Company, Limited Communication apparatus, communication system and adapter
WO2015033384A1 (ja) 2013-09-03 2015-03-12 株式会社アキブシステムズ I/oデバイスの仮想化のためのコンピュータシステム及びその運用方法並びにhub装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058738B2 (en) * 2004-04-28 2006-06-06 Microsoft Corporation Configurable PCI express switch which allows multiple CPUs to be connected to multiple I/O devices
JP4685414B2 (ja) * 2004-11-11 2011-05-18 三菱電機株式会社 バス転送装置
JP4667849B2 (ja) * 2004-12-13 2011-04-13 富士通株式会社 ループ検出方法及び装置
US8112513B2 (en) * 2005-11-30 2012-02-07 Microsoft Corporation Multi-user display proxy server

Also Published As

Publication number Publication date
JP2009094778A (ja) 2009-04-30

Similar Documents

Publication Publication Date Title
US7480303B1 (en) Pseudo-ethernet switch without ethernet media-access-controllers (MAC's) that copies ethernet context registers between PCI-express ports
US6993032B1 (en) Buffer arrangements to support differential link distances at full bandwidth
JP5601601B2 (ja) 通信制御システム、スイッチノード、及び通信制御方法
CN109033004B (zh) 一种基于Aurora总线的双机内存数据共享系统
US8571033B2 (en) Smart routing between peers in a point-to-point link based system
US20150317277A1 (en) Computer architecture having selectable, parallel and serial communication channels between processors and memory
CN103077148B (zh) 一种基于pcie的主机通讯方法和主机
EP3827356A1 (en) Unified address space for multiple hardware accelerators using dedicated low latency links
US20020138674A1 (en) Network for increasing transmit link layer core speed
KR102559387B1 (ko) PCIe 인터페이스 장치 및 그 동작 방법
US20150365346A1 (en) Apparatus and method for multilateral one-way communication
JPWO2010123143A1 (ja) 送信装置、送信方法及び送信装置の制御プログラム
CN108462620B (zh) 一种吉比特级SpaceWire总线系统
JP5244362B2 (ja) 高速ネットワークシステム及び関連装置
EP1700224B1 (en) Receiver corporation
US20040019704A1 (en) Multiple processor integrated circuit having configurable packet-based interfaces
US20080263248A1 (en) Multi-drop extension for a communication protocol
JP5426228B2 (ja) ネットワークシステム、ホストコンピュータ、hub装置、nic装置、及び通信方法
US20030120808A1 (en) Receiver multi-protocol interface and applications thereof
US8510485B2 (en) Low power digital interface
US20060288131A1 (en) Memory device capable of communicating with host at different speeds, and data communication system using the memory device
KR20160147373A (ko) 광 신호를 이용한 sata 호스트 버스 어댑터 및 sata 저장소 연결 방법
JP5842491B2 (ja) 中継装置および通信システム
CN209543343U (zh) 大数据运算加速系统
US10664420B2 (en) System and method for port-to-port communications using direct memory access

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101008

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120413

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120824

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121219

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5244362

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250