JP2000244526A - 多重化したネットワーク接続装置システム - Google Patents

多重化したネットワーク接続装置システム

Info

Publication number
JP2000244526A
JP2000244526A JP11044131A JP4413199A JP2000244526A JP 2000244526 A JP2000244526 A JP 2000244526A JP 11044131 A JP11044131 A JP 11044131A JP 4413199 A JP4413199 A JP 4413199A JP 2000244526 A JP2000244526 A JP 2000244526A
Authority
JP
Japan
Prior art keywords
network connection
connection device
network
data
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11044131A
Other languages
English (en)
Inventor
Tatsutoshi Sakuraba
健年 櫻庭
Hajime Serizawa
一 芹沢
Kazuyoshi Tomita
和良 冨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11044131A priority Critical patent/JP2000244526A/ja
Publication of JP2000244526A publication Critical patent/JP2000244526A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】二重化したネットワーク接続装置を正常稼動時
は負荷分散して性能向上に利用し、障害時にはホスト計
算機のソフトの介入なしに可用性を維持する。 【解決手段】受信処理ではネットワークスイッチ180
に各ネットワーク接続装置150,151を接続し、全
く同じ受信データを受信し、その内容からそれぞれでホ
ストに上げるべき受信データを選択し、全体として受信
データの脱落と重複がないようにし、障害発生時には残
りのネットワーク接続装置が選択する受信データを動的
に変更して、全体として受信機能を失わないようにす
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は計算機システムをネ
ットワークに接続する通信装置に係り、特にその良好な
信頼性と性能を実現する装置構成と制御方法に関する。
【0002】
【従来の技術】LAN(Local Area Net
work)にワークステーション、パソコン等の計算機
を接続する場合、計算機はNIC(Network I
nterface Card)等のネットワーク接続装
置を介して接続する。
【0003】通信ポイントを識別するために、物理レイ
ヤの通信では各NICに付与された物理アドレスを用い
る。イーサネット(登録商標)の場合、物理アドレスは
MAC(Media Access Control)
アドレスと呼ばれ、各NICに対してユニークな物理ア
ドレスを製造者が付与して出荷している。
【0004】ネットワークレイヤの通信では、インター
ネットに代表されるTCP/IP通信プロトコルに基づ
くネットワークではIPアドレスを用いる。IPアドレ
スは1つのNICに対応して1つ付与し、計算機上のソ
フトウエアが用いる。
【0005】1台の計算機には通常1つのネットワーク
接続装置を搭載し、従って1つのIPアドレスを持つ。
但し、Douglas Comer著「Interne
tworking With TCP/IP Vol
I:Principles,Protocols,An
d Architecture」の4.4節にある通
り、1台の計算機が複数の、例えば2つのネットワーク
接続装置を搭載することも可能であり、この場合は計算
機は各ネットワーク接続装置に対応して2つのIPアド
レスを持つ。IPアドレスとネットワーク接続装置の関
係は計算機上のソフトウエアによって管理する事ができ
る。より厳密には複数のネットワーク接続装置はそれぞ
れのIOポートに接続され、各ネットワーク接続装置を
ドライブするにはIOポートを区別して制御する必要が
あり、計算機上のソフトウエアはIPアドレスとIOポ
ートの関係を管理する。
【0006】計算機が他の計算機と通信を行うには、通
信先の計算機のIPアドレスと物理アドレスを知る必要
がある。ソフトウエアは通信先のIPアドレスは外部か
ら、例えばユーザの入力により与えられるが、このIP
アドレスに対応する物理アドレスを知るためにはARP
(Address Resolution Proto
col)を用いる。ARPではIPアドレスを含むパケ
ットをブロードキャストし、該当する計算機が対応する
物理アドレスを返すことにより、物理アドレスを計算機
上のソフトウエアに知らしめる事ができる。
【0007】ネットワーク、およびネットワークを利用
したアプリケーションが広く使われるようになってきて
いる。計算機システムを互いにネットワークでつなぎ、
ネットワークを経由して他の計算機が提供するサービス
を利用したり、他の計算機上にある資源を利用したりす
るのが常態となっている。
【0008】他の計算機にネットワークを通じて様々な
サービスを提供する計算機はサーバと呼ばれる。サーバ
とは広い意味での計算機、即ちネットワーク接続装置等
やその上で稼動するソフトウエアも含んだ全体を指す。
これに対し、サーバ内の構造を考える時は、演算装置や
記憶装置を含む計算機本体はネットワーク接続装置等と
対比してホストと呼ばれる。
【0009】上記のような状況下ではサーバのサービス
の可用性が重要になってくる。サーバのサービスの可用
性はサーバ自体の信頼性・可用性の他に、ネットワーク
の信頼性・可用性に大きく依存する。ネットワークの信
頼性とは、ネットワーク上で通信されるデータの信頼
性、即ち、パケット内のデータエラーの有無、パケット
欠落の有無、およびそれらの回復メカニズムのことを言
う。元来ネットワークは外部の影響を受けやすく、通信
路上でのビットの欠落、通信装置の過負荷に伴うパケッ
トの欠落といったエラーが一定の確率で発生する。
【0010】そのため各通信階層のプロトコルはこのよ
うなエラーの発生を想定して設計されている。例えばT
CP(Transmission Control P
rotocol)では、パケット内のデータエラーやパ
ケットの欠落を検出する手段、欠落を検出した時は通信
データを再送するなどの手段を含んでいる。またUDP
(User Datagram Protocol)で
はパケット内のデータエラーの検出を可能としているも
のの、パケットの欠落についてはUDPを使用する上位
のソフトウエアがそれぞれ対処するものとしてUDPと
しては何もしない。
【0011】一方、ネットワークの可用性とは、通信手
段の障害の有無とその回復メカニズムのことを言う。例
えば通信を中継する装置の故障により通信路が切断され
るような場合はネットワークの可用性の問題と考えられ
る。またサーバに装備されたネットワーク接続装置に障
害が生じて、サーバそのものは正常であるにも関わら
ず、ネットワークに対するアクセスができなくなるよう
な場合もネットワークの可用性の問題と考えられる。通
信路の切断の問題は通信経路を複数設ける事により回避
できる。
【0012】一方、ネットワーク接続装置の障害の問題
はネットワーク接続装置を1つだけ搭載した構成では自
動的な回避は不可能であり、例えば障害の発生したネッ
トワーク接続装置を正常なネットワーク接続装置と交換
する必要がある。
【0013】ネットワーク接続装置の障害に対する可用
性を実現するために、ネットワーク接続装置の障害をサ
ーバの障害と考えて、サーバごと交替させるというアプ
ローチがある。また、サーバに2つのネットワーク接続
装置を搭載し、一方に障害が発生した時に自動的に他方
のネットワーク接続装置に切り替えて通信を回復するこ
とが考えられる。サーバが高価で信頼性が高いならば、
ネットワーク接続部分の高可用化のためにこのような構
成がありうる。
【0014】いずれの場合でも、前記のように、各ネッ
トワーク接続装置にはそれぞれ固有のMACアドレスが
付随し、またサーバのソフトウエアはそれぞれに固定し
たIPアドレスを割り当てて使用すると、サーバのソフ
トウエアやサーバの通信相手にネットワーク接続装置の
障害を知られずにネットワーク接続装置を切り替える事
はできないという問題がある。
【0015】特開平6−59924号公報「2重化シス
テムの切替方式」では、運用系と待機系の2つのサーバ
があり、運用系に障害が発生した時は各クライアントに
伝文を送り、運用系切り替えのためのコネクション確立
を行う。この方式ではサーバ・クライアントともに障害
発生を認識し、対応した処理を行わなければならない。
【0016】特開平9−326810号公報「障害時の
コネクション切り替え方法」では、運用系と待機系の2
つのサーバがあり、それぞれのネットワーク接続装置
(LANアダプタ)には同じIPアドレスを用い、運用
系のネットワーク接続装置を有効に、待機系のネットワ
ーク接続装置を無効に設定しておく。運用系に障害が発
生した時はサーバの交代とともにそれぞれのネットワー
ク接続装置の有効・無効を切り替える。
【0017】クライアントは一旦コネクションの切断を
検出するものの、サーバと新たなIPアドレスをやりと
りすることなく、それまでと同じIPアドレスに再接続
要求を出すのみで新しい運用系サーバとコネクションを
張ることができる。MACアドレスは再接続の際に解決
されるので、2つのネットワーク接続装置に同じMAC
アドレスを設定しておく必要は必ずしもない。この方式
では端末側の障害処理の負担が軽減されているものの、
サーバ側のソフトウエアは依然として2つのネットワー
ク接続装置を区別した取り扱いを行う必要がある。
【0018】ネットワーク接続装置の障害時にサーバご
と交替させる方式では、サーバ回復処理を行う必要があ
り、サーバのソフトウエアの介入は避けられない。1サ
ーバに2つのネットワーク接続装置を搭載してネットワ
ーク接続装置の交替を行う構成でも、サーバのソフトウ
エアが一方のネットワーク接続装置の障害を検出する
と、他方のネットワーク接続装置に元のIPアドレスを
割当てて利用することができるが、この時、ソフトウエ
アはIPアドレスとIOポートの対応関係を変更しなけ
ればならない。
【0019】また、これらの技術では、正常運用中は待
機系が丸々遊んでしまい、コストパフォーマンス上の不
満がある。
【0020】
【発明が解決しようとする課題】上記の問題点に鑑み、
本発明の目的は、ネットワーク接続装置の可用性向上に
関し、サーバのネットワーク接続装置に障害が発生して
もサーバのソフトウエアにその事実を極力意識させず、
複雑な回復処理のような介入なしに交替・回復が可能
で、かつ多重に備えたネットワーク接続装置をネットワ
ーク性能の高性能化のためにも利用することが可能なコ
ストパフォーマンスに優れた多重化したネットワーク接
続装置と、その制御方法を提供するという課題を解決し
ようとするものである。
【0021】
【課題を解決するための手段】上記課題を解決するため
の本発明による一つの構成では、ホストの1つの入出力
ポートに内部スイッチを設け、これに複数のネットワー
ク接続装置を搭載し、これらのネットワーク接続装置を
1つのネットワークスイッチにそれぞれ接続する。ホス
トからの送信の時は内部スイッチにおいていずれのネッ
トワーク接続装置を使用するかを決定する。複数のネッ
トワーク接続装置には同じMACアドレスを設定する。ま
たサーバが受信する時はネットワークスイッチは同じ内
容を各ネットワーク接続装置に同時に送るように構成
し、各ネットワーク接続装置において受信したデータを
さらにホストに伝達するか否かを決定する。
【0022】1つのネットワーク接続装置に障害が発生
した場合は、内部スイッチが障害の発生を認識し、障害
の発生したネットワーク接続装置には送信データを送り
出さないようにする。また受信データの場合、障害の発
生したネットワーク接続装置は受信データをホストに伝
達せず、他のネットワーク接続装置が受信データをホス
トに伝達するようにする。これらの構成を可能ならしめ
るために、ネットワーク接続装置には障害発生を検出し
た時には内部スイッチに障害発生を報告すると同時に、
障害状態に移行する障害処理機構を設ける。
【0023】以上により、ネットワーク接続装置の障害
に対する可用性が実現され、内部スイッチで障害ネット
ワーク接続装置を認識するため、サーバのソフトウエア
はネットワーク接続装置が二重であること、ネットワー
ク接続装置の障害発生時にも特別な処理を行う必要はな
い。また平常時は複数のネットワーク接続装置がそれぞ
れ利用されるため、性能的にも優れたものになる。
【0024】
【発明の実施の形態】以下、図を用いて本発明の実施の
形態を説明する。ここでは簡単のために主に2台のネッ
トワーク接続装置によって二重化されている場合につい
て説明するが、本発明はこれに限るものでなく、3台以
上の構成で多重化されている場合でも有効である。また
多重化されたネットワーク接続装置によってなる構造を
ここではネットワーク接続装置セットと呼ぶことにす
る。ネットワーク接続装置における通信データの流れ
は、ホストによる出力、すなわち送信と、ホストによる
入力、すなわち受信の2方向がある。
【0025】図1は本発明の概要を表わすブロック図で
ある。ホスト100は独立した計算機であり、オペレー
ティングシステム、アプリケーションソフトウエア等が
稼動する。ホスト100と本発明にかかるネットワーク
接続装置セット160は1つの内部スイッチ120を介
して接続されている。ホスト100と内部スイッチ12
0はホスト入出力インタフェース105によって接続さ
れている。内部スイッチ120とネットワーク接続装置
セット160内の各ネットワーク接続装置150,15
1はそれぞれ通信データと制御信号を通すネットワーク
接続装置インタフェース130,131で接続され、更
に両者の間にはネットワーク接続装置状態管理インタフ
ェース140,141が設けられている。
【0026】ネットワーク接続装置状態管理インタフェ
ース140,141は必ずしもネットワーク接続装置イ
ンタフェース130,131と独立した接続ではなく、
ネットワーク接続装置インタフェース130,131を
利用した通信によって実現することも可能である。内部
スイッチ120はまたログインタフェース115によ
り、システム監視装置110と接続されている。システ
ム監視装置はネットワーク接続装置に障害が発生した場
合に障害のあったネットワーク接続装置の状態情報の保
管、障害を起こしたネットワーク接続装置の交換作業の
支援などを行う。
【0027】ネットワーク接続装置150,151はそ
れぞれネットワークスイッチインタフェース170,1
71により、本発明にかかるネットワークスイッチ18
0に接続されている。ネットワークスイッチ180は通
信インタフェース190により通信ネットワークに接続
されている。ネットワーク接続装置セット160内の各
ネットワーク接続装置150,151は同じMACアド
レスを持つ。MACアドレスはネットワークインタフェ
ースについて製造者が一意的な番号をつけることになっ
ているが、本実施例ではネットワーク接続装置セット1
60で1つのネットワークインタフェースと考えられ、
このような構成は正当である。
【0028】図2は本発明にかかる内部スイッチ120
の構造を示したブロック図である。ホスト100からの
送信データはホスト入出力インタフェース105を経由
してセレクタ200に入る。セレクタ200ではこの出
力データを複数あるネットワーク接続装置インタフェー
ス130,131から一つを選択して転送する。ネット
ワーク接続装置インタフェースの選択はネットワーク接
続装置状態管理装置220からの選択制御インタフェー
ス230を用いて行う。
【0029】ネットワーク接続装置状態管理装置220
は各ネットワーク接続装置の状態情報をネットワーク接
続装置状態管理インタフェース140,141から得る
ことができ、これを用いて選択制御インタフェース23
0に出力する。各ネットワーク接続装置の状態情報とし
てはその稼動状況、障害状況などがある。また障害発生
時に保守情報を保管するためにログインタフェース11
5を持ち、システム監視装置に接続されている。
【0030】尚、図2において、受信データは複数ある
ネットワーク接続装置インタフェース130,131の
いずれかから入り、セレクタ200を経由してホストの
入力となる。ネットワーク接続装置インタフェース13
0,131からの入力がセレクタ200において衝突す
ることがあるので、セレクタ200ではその調停制御を
行う。
【0031】図3は本発明にかかるネットワーク接続装
置150の構造を示したブロック図である。ホスト10
0から内部スイッチ120を経て出力される送信データ
はネットワーク接続装置インタフェース130を経てネ
ットワーク接続装置150のホストインタフェース30
0に入る。ホストインタフェース300は内部スイッチ
120のセレクタ200とのデータ転送制御を行い、送
信データを内部接続310を介して転送制御装置320
に送り込む。
【0032】転送制御装置320は内部接続330を介
してこのデータをネットワークインタフェース340に
送る。転送制御装置320、およびネットワークインタ
フェース340ではイーサネットのフレームを構成して
ネットワークスイッチインタフェース170に送出す
る。このネットワーク接続装置のMACアドレスはMA
Cアドレス格納装置360に格納されており、転送制御
装置320により設定・変更ができる。ネットワークイ
ンタフェース340で送出するフレームにはMACアド
レス格納手段360に設定されたMACアドレスが付加
される。
【0033】一方、ネットワークスイッチインタフェー
ス170から到来する受信データはフレームに付加され
たMACアドレスとこのネットワーク接続装置のMAC
アドレス360との一致を条件にネットワークインター
フェース340に取り込まれ、転送制御装置320に送
られる。転送制御装置320では受信データを更にホス
トインターフェース300を介してホストまで転送する
か否かを決める。
【0034】この制御は受信したデータに依存し、さら
にネットワーク接続装置状態管理装置220からの選択
制御情報350を用いて行う。選択制御情報350はネ
ットワーク接続装置状態管理インタフェース140から
もたらされる。転送制御装置320では受信データのホ
ストへの転送を行わないと決めた場合、この受信データ
を棄却する。転送か棄却かの決定をフレームの受信後、
速やかに行うことによって、ネットワーク接続装置の負
荷を押えることができる。
【0035】図4はネットワークスイッチ180の構造
を示すブロック図である。ネットワークスイッチインタ
フェース420〜427はそれぞれ、図には示されてい
ない計算機、ルータ、ネットワークスイッチなどとルー
ティングスイッチ410を接続している。ここでは各ネ
ットワークスイッチインタフェース420〜427は双
方向の通信線である。例えばルーティングスイッチ41
0は、ネットワークスイッチインタフェース420から
の入力をその宛先アドレスに応じて例えばネットワーク
スイッチインタフェース427に出力する。
【0036】分配器400はネットワークスイッチ18
0の内部にあるネットワークスイッチインタフェース4
23に接続されており、さらに2本のネットワークスイ
ッチインタフェース170,171によって本発明にか
かるネットワーク接続装置150のネットワークインタ
フェース340、およびネットワーク接続装置151の
ネットワークインタフェースにそれぞれ接続されてい
る。分配器400は次のように構成する。フレームが内
部インタフェース423に出力されると分配器400は
ネットワークスイッチインタフェース170,171の
双方に同じ内容のフレームを同時に出力する。
【0037】またネットワークスイッチインタフェース
170,171からの通信パケットはそれぞれ独立に分
配器400により内部インタフェース423に送出さ
れ、ルーティングスイッチ410により転送される。こ
こでは分配器400はネットワークスイッチ180の内
部に描かれているが、外部に引き出してから取り付けて
も良く、また本発明にかかるネットワーク接続装置セッ
ト160の内部に設けても良い。
【0038】図5はネットワーク接続装置状態管理装置
220の制御に用いるデータ構造を示している。ネット
ワーク接続装置状態管理テーブル500はネットワーク
接続装置に対応する行を持ち、それぞれネットワーク接
続装置識別フィールド510、ネットワーク接続装置状
態フィールド520、受信データ選択条件フィールド5
30、およびネットワーク接続装置負荷指標フィールド
540を持つ。これらの情報はネットワーク接続装置状
態管理インタフェース140,141、ないし142に
より各ネットワーク接続装置から得られる情報を用いて
作成・更新され、選択制御インタフェース230の出力
に反映される。尚、ここでは説明のためネットワーク接
続装置状態管理インタフェースは3本描かれている。こ
れは描かれていないネットワーク接続装置が3台存在す
ることを示している。
【0039】ネットワーク接続装置識別フィールド51
0は接続されている、あるいは接続可能なネットワーク
接続装置を識別し、指定する情報を格納する。図では例
として「0」「1」「2」「3」が格納されている。ネ
ットワーク接続装置状態フィールド520は対応するネ
ットワーク接続装置が正常状態か故障状態か、あるいは
実装されているかなどを表わす。
【0040】図では「正常」「故障」「不在」が表示さ
れている。「正常」は該当するネットワーク接続装置が
正常に動作していることを示す。「故障」は該当するネ
ットワーク接続装置に故障が発生しており、使用できな
いことを表わしている。「不在」は該当するネットワー
ク接続装置が搭載されておらず、使用できないことを表
わしている。
【0041】これらの情報を用いて、故障状態のネット
ワーク接続装置、あるいは実装されていないネットワー
ク接続装置には送信データを振り向けないよう、選択制
御インタフェース230の出力を作成し、セレクタ20
0を制御する。受信データ選択条件フィールド530に
ついては後から説明する。
【0042】図6は1つのネットワーク接続装置の負荷
の程度を表わす負荷指標をネットワーク接続装置状態管
理装置220に報告する際に送られる負荷指標情報の構
造を示している。負荷指標情報600はネットワーク接
続装置状態管理テーブル500の各行と類似の構造を持
ち、ネットワーク接続装置識別フィールド610、ネッ
トワーク接続装置状態フィールド620、およびネット
ワーク接続装置負荷指標フィールド640を持つ。
【0043】ネットワーク接続装置識別フィールド61
0は該当するネットワーク接続装置を示す。ネットワー
ク接続装置状態フィールド620の値は「正常」とし、
このネットワーク接続装置が正常に動作していることを
示すと同時にこの情報が負荷指標情報であることを表示
する。
【0044】ネットワーク接続装置負荷指標フィールド
640には各ネットワーク接続装置の負荷状態を表わす
データが格納されている。ここでは負荷状態表示方法の
一例として負荷状態を0,1,2,3の4段階に分けて
表示している。数字は大きいほど負荷が高いものとし、
例えば過去1秒間のネットワーク接続装置のビジー率が
0〜15%ならば0、15〜30%ならば1、30〜5
0%ならば2、50〜100%ならば3をそれぞれ負荷
指標として与えるものとする。
【0045】負荷指標情報600のネットワーク接続装
置状態管理装置220への報告のタイミングとしては、
1つの送信処理ないし受信処理が終了した時点でに報告
するものが考えられる。しかし、この報告は必ずしも送
信処理・受信処理と同時に行われる必要はなく、送信・
受信をいくつか処理する毎に報告するもの、あるいは一
定時間、例えば1秒おきに報告することなどが考えられ
る。一定時間に報告させる方式とするとこれを対応する
ネットワーク接続装置の時間監視制御と兼用して利用す
ることができる。
【0046】負荷指標情報600を受け取るとネットワ
ーク接続装置状態管理装置220ではそれを元にネット
ワーク接続装置状態管理テーブル500の該当する行を
更新する。該当する行は負荷指標情報600のネットワ
ーク接続装置識別フィールド610とネットワーク接続
装置状態管理テーブル500のネットワーク接続装置識
別フィールド510の一致を調べることにより定まる。
このようにして定まった行のネットワーク接続装置負荷
指標フィールド540にネットワーク接続装置負荷指標
フィールド640の値をコピーする。
【0047】このようにして作成したネットワーク接続
装置状態管理テーブル500の情報を用いて、セレクタ
200がどのように送信データを送出するネットワーク
接続装置を選択するかについて述べる。ネットワーク接
続装置状態フィールド520の値が「正常」であるもの
から選択し、「故障」あるいは「不在」であるものは使
用しない。セレクタが使用を試みるネットワーク接続装
置が「正常」であっても、受信処理中であったり、別の
送信処理中である場合はそのネットワーク接続装置を直
ちに使用することはできない。この時は残りの正常なネ
ットワーク接続装置から使用可能なものを使用する。
【0048】このような場合、どのネットワーク接続装
置から使用を試みるかを決めるために、セレクタ200
は選択制御インタフェース230を介してネットワーク
接続装置負荷指標フィールド540を参照し、その値の
小さいものから順に使用を試みるものとする。但し、そ
の値が等しい時はあらかじめ決めておいた順序に従って
使用を試みるものとする。このように構成することによ
り、受信処理で負荷の高くなっているネットワーク接続
装置には送信処理をやらせないようになり、負荷の分散
を図ることができる。
【0049】図12と図13により上に述べた制御を実
現する一実施例を説明する。図12のネットワーク接続
装置状態管理テーブル1200は図5のネットワーク接
続装置状態管理テーブル500とは異なった状態を示し
ている。ここではネットワーク接続装置識別子ID=
0,1,3の3つのネットワーク接続装置が正常に稼動
しており、対応する負荷指標1241,1242,12
44がそれぞれ3,3,1となっている。
【0050】このときネットワーク接続装置状態管理装
置220は負荷指標の小さい順に従って送信装置選択情
報1290を作成する。送信装置選択情報1290は選
択すべきネットワーク接続装置の識別子の並びがそれぞ
れ1291、1292、1293に格納する。ID3の
エントリ1294には本来ならば正常なネットワーク接
続装置の識別子が格納されるべき所であるが、ID=2
のネットワーク接続装置が故障中であるため、候補のネ
ットワーク接続装置が無いことが「×」によって表現さ
れている。
【0051】図13は送信装置選択情報1290を用い
たセレクタ200におけるネットワーク接続装置の選択
処理を示したフローチャートである。ステップ1305
でまず送信装置選択情報1290をネットワーク接続装
置状態管理装置220から得る。これは、予めネットワ
ーク接続装置状態管理装置220から与えておいた送信
装置選択情報1290をセレクタ内の記憶装置に格納し
ておく、あるいはステップ1305の中でネットワーク
接続装置状態管理装置220に問い合わせる、といった
方法がある。前者の方が送信要求が出てからの処理が短
く、より良い性能が選られると考えられる。
【0052】ステップ1310では送信装置選択情報1
290をサーチするのに用いるエントリポインタ139
0を先頭のエントリ1291に位置づける。ステップ1
320ではエントリポインタ1390の指すエントリに
有効なネットワーク接続装置識別子があるか否かを調べ
る。先頭のエントリには有効な識別子が入っており、Y
ESの分岐に進む。ステップ1340ではこのエントリ
から選択候補のネットワーク接続装置の識別子を取り出
す。
【0053】次にステップ1350ではこのネットワー
ク接続装置が現在使用可能か否かを調べる。このネット
ワーク接続装置が使用可能ならばYESに分岐し、ステ
ップ1360でこのネットワーク接続装置を送信に用
い、選択処理1300は完了する。使用不可ならばNO
の分岐に進む。使用できない状況としては他の送信処
理、あるいは受信処理中である場合がある。
【0054】使用できない時はステップ1370でエン
トリポインタ1390を一つ進め、回帰ループ1380
に従って、ステップ1320に戻る。改めてエントリポ
インタ1390の指すエントリを調べると有効な識別子
があればこれについて同様に使用を試みる。例えば図1
3のエントリポインタ1390がエントリ1294を指
しているとすると、そのエントリは無効であるからステ
ップ1320からNOに分岐し、ステップ1330に進
む。ステップ1330では全てのネットワーク接続装置
の候補がビジーであるので、装置ビジー処理を行う。装
置ビジー処理としては、送信要求元に装置ビジーを応答
する、あるいは一定期間待って、もう一度、ネットワー
ク接続装置の選択を試みる、などが考えられる。
【0055】次にネットワーク接続装置が受信した受信
データの選択、即ちその受信データをホストに転送する
か否かを決める方式について説明する。本実施例では受
信データのもつデータからホスト転送するネットワーク
接続装置を1つ決める。別の言い方をすると各ネットワ
ーク接続装置で受信データから適当なデータ(選択デー
タと呼ぶことにする)を取り出し、その値に応じてその
ネットワーク接続装置がその受信データをホストに転送
するか否かを決定する。正常な複数のネットワーク接続
装置のいずれか1つのみが必ずホストに転送することを
決定する。また、複数のネットワーク接続装置からホス
ト転送を行うものがなるべく一様に選ぶようにして、負
荷分散を図るようにする。
【0056】受信データから選択データを取り出す方法
を説明する。図8、図9、図10、図11は受信データ
のデータ構造を示している。各フィールドの詳細はDo
uglas Comer著の前掲書を参照のこと。図8
はイーサネット上のUDP/IP、あるいはTCP/I
Pで通信されるフレーム800の構造を示している。フ
レームヘッダ、IPヘッダに続いて、UDPヘッダある
いはTCPヘッダがある。図9はIPパケットヘッダ9
00の構造を示している。
【0057】図10はUDPヘッダ1000の構造を示
しており、UDPパケットのチェックサムフィールド1
040がある。図11はTCPヘッダ1100の構造を
示している。UDPヘッダのUDPチェックサム104
0と、TCPヘッダの通し番号フィールドの下位16ビ
ット1140がフレーム800上で同じ位置にある。こ
のフィールドのデータとIPヘッダ900の中の送信元
IPアドレスの下位16ビットとの排他的論理和を選択
データとする。より具体的にはその下位3ビットの値を
用いるものとする。
【0058】UDPチェックサムフィールドにはパケッ
ト内容に依存しており、内容が異なれば選択データの値
は散らばるであろう。またWEBサーバへのアクセスの
ように、内容が同じものが集中するような場合や、UD
Pのチェックサムを使用していない場合(UDPではこ
れはユーザのオプションである)はチェックサムの値が
偏る可能性が高いが、送信元毎に異なるIPアドレスを
計算に組み入れているため、得られる値の分布は散らば
るものと期待できる。またTCPの通し番号は毎回異な
る値となる。いずれの場合も下位3ビットの値の分布は
一様になり、ネットワーク接続装置の間の受信データ処
理に関する負荷は分散されるものと期待できる。
【0059】上記ようにして受信データから得られた選
択データの値0〜7を用いて、この受信データをホスト
に転送するか否かを決める方法を説明する。ネットワー
ク接続装置150には選択制御情報350がある。今そ
の値が{0,2,4,6}(集合値)とする。選択デー
タがこの集合の中のいずれかに等しい時、このネットワ
ーク接続装置はこの受信データをホストに転送すること
に決定する。
【0060】ネットワーク接続装置における受信データ
の選択が上記のように行われる時、複数のネットワーク
接続装置による受信処理を次のように制御する。ネット
ワーク接続装置状態管理テーブル500の各行の受信デ
ータ選択条件フィールド530には該当するネットワー
ク接続装置の選択制御情報350に設定すべき値を格納
する。
【0061】正常なネットワーク接続装置が複数台ある
時、それらには選択データのとりうる値の集合{1,
2,...7}を分割したものを割り当てる。即ち、任意
の2つのネットワーク接続装置については必ず異なる選
択データが割り当てられ、かつすべての選択データの値
はいずれかのネットワーク接続装置に割り当てられてい
る。例えば、図5のネットワーク接続装置状態管理テー
ブル500には識別子が0,1のネットワーク接続装置
についてこの値がそれぞれ{0,2,4,6}、{1,
3,5,7}である状態が示されている。
【0062】また図12のネットワーク接続装置状態管
理テーブル500には同様に{0,2,4}、{1,
5,6}、{3,7}が3つのネットワーク接続装置に
割り当てられている様子が示されている。このように割
り当てることにより、「正常な複数のネットワーク接続
装置のいずれか1つのみが必ずホストに転送する」とい
う前記の条件を満たされる。
【0063】ネットワーク接続装置状態管理装置220
は正常なネットワーク接続装置がどれであるかが与えら
れた時、ネットワーク接続装置状態管理テーブル500
の受信データ選択条件フィールド530を自動的に生成
する。例えば、正常なネットワーク接続装置を並べ、選
択データの取り得る値、本実施例では0,1,…、7を
順次割り当てれば良い。さらに受信データ選択条件フィ
ールド530に設定された値を各ネットワーク接続装置
の選択制御情報350に設定する。ネットワーク接続装
置状態管理インタフェース140,141,ないし14
2を通じて各ネットワーク接続装置に対してこの設定は
なされる。
【0064】次にネットワーク接続装置に障害が発生し
た場合の制御方式について説明する。図7は1つのネッ
トワーク接続装置で障害を検出した時にネットワーク接
続装置状態管理装置220に送られる障害検出情報70
0の構造を示している。障害検出情報700はネットワ
ーク接続装置識別フィールド710、ネットワーク接続
装置状態フィールド720を含む。ネットワーク接続装
置識別フィールド710は該当するネットワーク接続装
置を示す。ネットワーク接続装置状態フィールド720
の値は「故障」とし、このネットワーク接続装置に障害
が発生したことを示すと同時に、この情報が障害検出情
報であることを表示する。
【0065】図14はネットワーク接続装置状態管理装
置220が障害検出情報700を受けた時の処理140
0を示すフローチャートである。ネットワーク接続装置
状態管理装置220は、ステップ1410において、障
害検出情報700のネットワーク接続装置識別フィール
ド710から障害を起こしたネットワーク接続装置の識
別子を得る。ステップ1420では、得られた識別子に
該当するネットワーク接続装置状態管理テーブル500
のエントリのネットワーク接続装置状態フィールド52
0の値を「故障」に変更する。
【0066】ステップ1430ではこの変更を選択制御
インタフェース230によりセレクタ200にも反映さ
せ、セレクタ200における障害の起きたネットワーク
接続装置を送信データの転送のために選択することのな
いようにする。ステップ1440では、該当するエント
リの受信データ選択条件フィールド530をクリアして
このネットワーク接続装置はいかなる受信データもホス
トに転送しないことを表示する。
【0067】ステップ1450では他のネットワーク接
続装置の受信データ選択条件フィールド530を書き換
えて、残りのネットワーク接続装置の間ですべての受信
データが重複なくいずれかのネットワーク接続装置によ
ってホストに転送されるように設定し直す。この処理は
ネットワーク接続装置状態管理装置220により自動的
に行われることはすでに述べた通りである。
【0068】これにより、障害の発生したネットワーク
接続装置がホストに転送するはずだった受信データは他
のネットワーク接続装置によってホストへ転送されるよ
うになる。更にステップ1460では保守情報として障
害を起こしたネットワーク接続装置の状態情報をログイ
ンタフェース115に出力する。この情報はシステム監
視装置110によって保存される。続いてステップ14
70では障害を起こしたネットワーク接続装置の交換保
守を可能とするためにこのネットワーク接続装置の電源
を切断する。ステップ1480で一連の障害処理の終了
をランプ点灯などにより表示する。
【0069】図15は上記の処理で交換可能となった障
害の発生したネットワーク接続装置を実際に交換し、再
び使用を開始する為の方法を説明したフローチャートで
ある。複数の処理の流れが相互に関連している。
【0070】第1の処理の流れはシステム監視装置11
0によるネットワーク接続装置への電源投入処理150
0である。システム監視装置はステップ1510で電源
投入を実行する。矢印1590はこの電源投入を契機に
第2の処理であるネットワーク接続装置の稼動時回復処
理1520が起動されることを表わしている。
【0071】ネットワーク接続装置は内部的な初期化処
理を実行し、ステップ1530にてネットワーク接続装
置状態管理装置220に等ネットワーク接続装置が新た
に起動されたことを報告する。矢印1592はこの報告
を契機に第3の処理であるネットワーク接続装置の復帰
処理1540が起動されることを表わしている。ネット
ワーク接続装置はステップ1532にてこの後のネット
ワーク接続装置からの要求を待つ。
【0072】ステップ1550で、ネットワーク接続装
置状態管理装置220は復帰処理対象のネットワーク接
続装置に対して、このネットワーク接続装置セットに対
して設定されているMACアドレスを設定する。矢印1
594はこの設定要求の発行を表わしている。これによ
ってネットワーク接続装置における要求待ち状態は解除
され、ステップ1534に進み、指定されたMACアド
レスをMACアドレス格納装置360に格納する。これ
によって、このネットワーク接続装置による送信処理は
可能になる。ついでステップ1536にて再び要求待ち
状態に入る。
【0073】ステップ1552で、ネットワーク接続装
置状態管理装置220はネットワーク接続装置状態管理
テーブル500の該当するエントリを作成する。例えば
起動前のネットワーク接続装置状態管理テーブル500
の状態が図12の1200の通りであったとする。すな
わち、識別子が「2」のネットワーク接続装置が故障し
ている。この「2」のネットワーク接続装置を回復、起
動することにより、テーブルの状態は図12の1201
のように変更する。すなわち、状態は「正常」とし、選
択条件を4台の正常なネットワーク接続装置にそれぞれ
図のように割り付け直し、さらに負荷指標は「1」、す
なわち一番負荷の軽い状態とする。
【0074】ステップ1554で、ネットワーク接続装
置状態管理装置220は、セレクタ200において使用
可能なネットワーク接続装置も送信処理に使用されるよ
う、選択制御インタフェース230を通じて使用可能ネ
ットワーク接続装置とその優先順序を設定する。これに
より、送信データが回復中のネットワーク接続装置にも
転送されるようになる。このネットワーク接続装置はす
でに送信処理に関しては実行可能となっているため、実
際に送信データを転送しても正しく送信処理を行うこと
ができる。
【0075】セレクタ200における選択メカニズムに
応じて、上記の使用可能ネットワーク接続装置とその優
先順序の実際の設定方法は変更を受ける。例えばセレク
タ200が毎回の送信処理で必ず、ネットワーク接続装
置状態管理装置に使用可能なネットワーク接続装置を問
い合わせるのならば、ネットワーク接続装置状態管理テ
ーブルへの状態変更の反映だけで良い。しかし、セレク
タがネットワーク接続装置の状態を一定期間、キャッシ
ュとして保持するならば、割込みをかけるなどして積極
的にそれを更新させるべきである。
【0076】ステップ1556で、ネットワーク接続装
置状態管理装置220は各ネットワーク接続装置に処理
すべき受信処理の選択情報を通知する。この中には、以
前から正常に稼動していたネットワーク接続装置と、今
回、障害から回復したネットワーク接続装置も含まれて
いる。矢印1596は障害から回復中のネットワーク接
続装置への通知を表わしており、これによってネットワ
ーク接続装置の要求待ち状態が解除される。この結果、
ネットワーク接続装置はステップ1538にて受信処理
も実行を開始する。以上でネットワーク接続装置の回復
処理が完了する。
【0077】
【発明の効果】本発明によれば、二重化したネットワー
ク接続装置を正常稼動時は負荷分散して性能上有効に利
用し、かつ障害発生時にはホスト計算機のオペレーティ
ングシステム介入なしに可用性を維持することを可能と
なる。
【0078】内部スイッチでは各ネットワーク接続装置
の負荷情報を元に送信処理を実行するネットワーク接続
装置を選択するため、ネットワーク接続装置間の負荷バ
ランスを図ることができ、それぞれのネットワーク接続
装置をなるべく低負荷な状態で使用するため、安定、か
つ良好な送信性能を実現することができる。
【0079】各ネットワーク接続装置では受信処理を分
担して実行するため、受信処理における負荷バランスを
図ることができる。受信処理の分担は到来した受信デー
タの内容、特に上記実施例ではTCP/IPプロトコル
のUDPプロトコルのUDPチェックサムのフィールド
を利用しており、データ内容が異なればその値も変化
し、自然と負荷分散を図ることができる。1つのクライ
アントからサーバにデータをバックアップするような場
合、クライアントのIPアドレスのみを用いた場合では
負荷分散されないが、データ内容を元にネットワーク接
続装置を選択することにより、前記のような場合にも負
荷分散を図ることができる。
【0080】実際には長大なUDPパケットは分割さ
れ、UDPチェックサムは先頭のフラグメントにしか付
加されず、後続のフラグメントはUDPパケットのデー
タの内容を見ることになり、必ずしも理想的な負荷分散
とならない可能性がある。しかし、前記のバックアップ
のような場合にはデータフィールドの内容により、十分
な負荷分散が実現されるものと期待できる。
【0081】ネットワーク接続装置の障害発生時には障
害のあるネットワーク接続装置をはずした構成で受信処
理の分担等を自動的、かつシステム稼働中に動的に再設
定すれば通信処理をそのまま続行でき、さらに障害を起
こしたネットワーク接続装置を取り外し、正常なネット
ワーク接続装置と取り替えて通信処理に復帰させること
ができるため、システム全体での高い可用性が実現でき
る。
【0082】本発明ではネットワーク接続装置を二重化
しているが、ネットワークスイッチ、及び内部スイッチ
の二重化には触れていない。しかし、これらのコンポー
ネントについては別の手段での二重化が可能であり、本
発明と組み合わせれば、より信頼度の高い可用性が実現
できる。
【図面の簡単な説明】
【図1】本発明の概要を表わすブロック図。
【図2】内部スイッチの構造を示すブロック図。
【図3】ネットワーク接続装置の構造を示すブロック
図。
【図4】ネットワークスイッチの構造を示すブロック
図。
【図5】ネットワーク接続装置状態管理装置の制御に用
いるデータ構造を示す図。
【図6】ネットワーク接続装置を報告する負荷指標情報
のデータ構造を示す図。
【図7】ネットワーク接続装置の障害検出情報のデータ
構造を示す図。
【図8】受信データのデータ構造を示す図。
【図9】受信データのデータ構造を示す図。
【図10】受信データのデータ構造を示す図。
【図11】受信データのデータ構造を示す図。
【図12】ネットワーク接続装置状態管理テーブルの状
態の例を示す図。
【図13】セレクタにおけるネットワーク接続装置の選
択処理のフローチャート。
【図14】ネットワーク接続装置状態管理装置における
障害検出情報処理のフローチャート。
【図15】ネットワーク接続装置の使用再開処理のフロ
ーチャート。
【符号の説明】
120…内部スイッチ、150,151…ネットワーク
接続装置、180…ネットワークスイッチ、200…セ
レクタ、220…ネットワーク接続装置状態管理装置、
320…転送制御装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 冨田 和良 神奈川県秦野市堀山下1番地 株式会社日 立製作所汎用コンピュータ事業部内 Fターム(参考) 5B089 GA31 GA32 KA12 MD02 ME04 5K033 AA03 AA06 BA04 DA01 DB03 DB16 DB17 DB20 EA03 EB06 EB08 5K035 AA02 AA03 BB03 CC05 DD01 EE03 EE22 LL14

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】ホスト計算機をネットワークに接続するネ
    ットワーク接続手段であって、内部スイッチを備え、こ
    の内部スイッチではホスト計算機と1台のネットワーク
    接続装置として接続し、複数のネットワーク接続装置を
    備え、各ネットワーク接続装置は前記内部スイッチに接
    続し、各ネットワーク接続装置はそれぞれネットワーク
    スイッチインタフェースを備え、このネットワークスイ
    ッチインタフェースによってネットワークスイッチに接
    続し、前記ホスト計算機からの送信要求の処理では、前
    記内部スイッチが送信要求を前記複数のネットワーク接
    続装置のいずれか1つに転送し、このネットワーク接続
    装置が転送された送信要求を実行し、前記ホスト計算機
    への通信データの処理では、前記ネットワークスイッチ
    が通信データを前記複数のネットワークスイッチインタ
    フェースを介して前記複数のネットワーク接続装置のそ
    れぞれに送り、複数のネットワーク接続装置がこの通信
    データを受信すると、そのうちの1台のネットワーク接
    続装置のみがこの受信データをホスト計算機に転送する
    ことを特徴とする多重化したネットワーク接続装置シス
    テム。
JP11044131A 1999-02-23 1999-02-23 多重化したネットワーク接続装置システム Pending JP2000244526A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11044131A JP2000244526A (ja) 1999-02-23 1999-02-23 多重化したネットワーク接続装置システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11044131A JP2000244526A (ja) 1999-02-23 1999-02-23 多重化したネットワーク接続装置システム

Publications (1)

Publication Number Publication Date
JP2000244526A true JP2000244526A (ja) 2000-09-08

Family

ID=12683075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11044131A Pending JP2000244526A (ja) 1999-02-23 1999-02-23 多重化したネットワーク接続装置システム

Country Status (1)

Country Link
JP (1) JP2000244526A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7032130B2 (en) 2001-10-03 2006-04-18 Hitachi, Ltd. Method and system for managing subject device through network and information processing system performing management
JP2007193779A (ja) * 2005-12-15 2007-08-02 Nvidia Corp 改善された負荷分散及びフェイルオーバー機能のための単一論理ネットワークインタフェイス
JP2007233777A (ja) * 2006-03-02 2007-09-13 Nec Corp マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法
US7512688B2 (en) 2002-03-01 2009-03-31 Hitachi, Ltd. PPPoE network system that can distribute connection requests from PPPoE client terminals to specific PPPoE servers
JP2010226607A (ja) * 2009-03-25 2010-10-07 Giga-Byte Technology Co Ltd ネットワーク自動接続装置及びその方法
JP7404798B2 (ja) 2019-11-15 2023-12-26 富士フイルムビジネスイノベーション株式会社 データ管理システム及びデータ管理プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7032130B2 (en) 2001-10-03 2006-04-18 Hitachi, Ltd. Method and system for managing subject device through network and information processing system performing management
US7512688B2 (en) 2002-03-01 2009-03-31 Hitachi, Ltd. PPPoE network system that can distribute connection requests from PPPoE client terminals to specific PPPoE servers
JP2007193779A (ja) * 2005-12-15 2007-08-02 Nvidia Corp 改善された負荷分散及びフェイルオーバー機能のための単一論理ネットワークインタフェイス
JP4515441B2 (ja) * 2005-12-15 2010-07-28 エヌヴィディア コーポレイション 改善された負荷分散及びフェイルオーバー機能のための単一論理ネットワークインタフェイス
JP2007233777A (ja) * 2006-03-02 2007-09-13 Nec Corp マルチノードコンピュータシステム、統合サービスプロセッサ及びそれらに用いる多重化制御方法
JP2010226607A (ja) * 2009-03-25 2010-10-07 Giga-Byte Technology Co Ltd ネットワーク自動接続装置及びその方法
JP7404798B2 (ja) 2019-11-15 2023-12-26 富士フイルムビジネスイノベーション株式会社 データ管理システム及びデータ管理プログラム

Similar Documents

Publication Publication Date Title
JP3956685B2 (ja) ネットワーク間接続方法、仮想ネットワーク間接続装置およびその装置を用いたネットワーク間接続システム
US6272113B1 (en) Network controller system that uses multicast heartbeat packets
US6052733A (en) Method of detecting errors in a network
US6208616B1 (en) System for detecting errors in a network
US6381218B1 (en) Network controller system that uses directed heartbeat packets
US6728780B1 (en) High availability networking with warm standby interface failover
US5621884A (en) Distributed data access system including a plurality of database access processors with one-for-N redundancy
US6763479B1 (en) High availability networking with alternate pathing failover
US6732186B1 (en) High availability networking with quad trunking failover
US6134678A (en) Method of detecting network errors
KR100831639B1 (ko) 정보 처리 장치, 통신 부하 분산 방법 및 통신 부하 분산프로그램을 기록한 기록 매체
US6229538B1 (en) Port-centric graphic representations of network controllers
US7848226B2 (en) Communication system, switch
US7835265B2 (en) High availability Ethernet backplane architecture
CA2564057C (en) Method of switching between network connection devices using redundancy protocol and pseudo redundant configuration setting means and network system
US7586842B2 (en) Failover of multicast traffic flows using NIC teaming
JP2583023B2 (ja) コンピュータ・システムのローカル・エリア・ネットワークへのフォールト・トレラント接続方法および装置
US6594776B1 (en) Mechanism to clear MAC address from Ethernet switch address table to enable network link fail-over across two network segments
US20050163044A1 (en) High capacity router having redundant components
US6105151A (en) System for detecting network errors
US20030233473A1 (en) Method for configuring logical connections to a router in a data communication system
JP2002057682A (ja) ネットワークインタフェース切替え方法及びネットワークに接続可能なコンピュータ
JP4964666B2 (ja) 冗長化された通信経路を切り替える計算機、プログラム及び方法
US20160205046A1 (en) Transmission device and interface device
JP2000244526A (ja) 多重化したネットワーク接続装置システム