JP4779948B2 - サーバシステム - Google Patents

サーバシステム Download PDF

Info

Publication number
JP4779948B2
JP4779948B2 JP2006319464A JP2006319464A JP4779948B2 JP 4779948 B2 JP4779948 B2 JP 4779948B2 JP 2006319464 A JP2006319464 A JP 2006319464A JP 2006319464 A JP2006319464 A JP 2006319464A JP 4779948 B2 JP4779948 B2 JP 4779948B2
Authority
JP
Japan
Prior art keywords
network
switch
server
modules
network switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006319464A
Other languages
English (en)
Other versions
JP2008135897A (ja
Inventor
渡辺恭司
軸屋孝之
森本成重
矢田浩勝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006319464A priority Critical patent/JP4779948B2/ja
Publication of JP2008135897A publication Critical patent/JP2008135897A/ja
Application granted granted Critical
Publication of JP4779948B2 publication Critical patent/JP4779948B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、計算機とネットワークスイッチとが搭載され、それらを基板配線で接続して一体化したサーバシステムに係り、そのシステム内ネットワークの障害検知方法に関し、システム内ネットワーク障害発生時の多重化ネットワークパスの切り替え(フェイルオーバー)方法に関する。
従来、例えばブレードサーバシステムなどの複数の計算機(サーバモジュール)とネットワークスイッチを搭載して一体化したシステムの内部ネットワーク接続は、一般的な外部ローカルエリアネットワーク(LAN)ケーブルによる接続とは異なり、ミッドプレーン上で内蔵ネットワークスイッチのポートとサーバモジュール上のネットワークコントローラの各ポート間を基板配線するので、ケーブルの抜けや半抜け状態や断線などの障害が発生しない事を前提としていて、ネットワークスイッチのポートリンク状態情報をネットワークコントローラが直接検出する仕組みをもたない。
そして、サーバモジュール上のネットワークコントローラは、内蔵ネットワークスイッチ経由で外部と接続しているため、外部ネットワークがダウンした際のリンク状態を認識することができない。
また、一般的にネットワークスイッチはユーザが多重化またはチーミング機能などによりバンド幅を広げることができるように、2個1組として用いられることが多く、ネットワーク多重化しているシステムの場合に系切り替えを行う際は、データ送受信用の信号線を通してポートリンクのアップ又はダウン状態を検知して系の切り替えを行う方法が一般的であるが、サーバモジュール間のネットワークスイッチにてポートリンクダウンした場合も、その障害をサーバモジュールへ伝えることができない。
そのためサーバモジュールは通信タイムアウトによって障害検出するか、データ信号にオートネゴシエーション失敗のようなリンクダウンを示すデータを載せてサーバモジュールに伝える必要があるが、いずれも複雑なソフトウェア処理が必要な上に検出するまでに時間がかかる。
特開2000−269967 BladeServer Base Specification For Processor Blade Subsystems 2/3/2006 IBM and Intel
上述の従来のタイムアウト検出によるネットワーク障害認識方法では、ネットワークスイッチ側で発生した障害を速やか検出できない問題があり、更に、ネットワークパスを多重化したシステムの場合では、ネットワーク障害をタイムアウト発生により認識した後、主系ネットワークパスから予備系に切り替える処理を行うことになり、予備系ネットワークに切り替わるまで時間が長くなる。また、ネットワークスイッチを介して接続する外部ネットワークに障害が発生した場合は、外部ネットワークのリンク状態を認識できないため、チーミングによる冗長化機能が使用できない。
本発明の目的は、ブレードサーバシステム内のネットワーク障害検知の可用性向上に関し、システムのネットワークスイッチのポートに障害が発生してもサーバのソフトウェアに極力意識させずネットワークスイッチの障害を速やかに検知させ、かつ多重に備えたネットワーク接続の場合では、複雑な処理や切り替え制御ソフトウェアの介入なしで速やかに交替が可能な方法を提供するという課題を解決しようとするものである。
本発明は、複数のサーバモジュールと複数のネットワークスイッチモジュールと前記複数のサーバモジュールと前記複数のネットワークスイッチモジュールとを接続する内部ネットワークから成り、各サーバモジュールは外部ネットワークとの接続制御を行うネットワークコントローラを備え、各ネットワークスイッチモジュールは内部ネットワークと外部ネットワークでデータの交換を行うスイッチ部と両ネットワークと接続するための複数のポートを備えたサーバシステムにおいて、各ネットワークスイッチモジュールは自ネットワークスイッチモジュールの状態を示すスイッチ状態信号を前記複数のサーバモジュールのネットワークコントローラに送出するプロセッサを備えたことを特徴とする。
本発明によれば、ネットワークスイッチのポートリンク状態情報およびネットワークスイッチ状態情報を計算機上のネットワークコントローラが直接検出できるので、OSやデバイスドライバはポーリングまたは割り込みによりネットワークスイッチの障害およびポートリンク状態を速やかに検知できるようになる。
従って、OSやデバイスドライバは該当ネットワークパスの障害発生を他のソフトウェアの介在や複雑な処理を必要とせず、かつ速やかにネットワークスイッチの障害およびリンクアップまたはダウン状態を検知できるようになり、タイムアウトを待たず主系ネットワークから予備系ネットワークへ切り替えることができる効果がある。
次に、本発明の実施の形態について図に基づいて説明する。
図1は本発明の一実施の形態に係るネットワークスイッチモジュールのブロック図である。ネットワークスイッチモジュール(110)内部には、ネットワークスイッチモジュール全体を管理・制御するマイコン(113)とポート(1)〜(n)の通信を送受信するPHY IC(112)と、PHY IC(112)が受けたデータをスイッチングして、ポート(1)〜ポート(n)へ送信するスイッチIC(111)と、機器内の温度監視を行う温度監視IC(114)、冷却ファンの制御および異常検出を行うファン制御IC(115)、電圧監視を行う電圧監視IC(116)が設置され、それぞれがI2Cバスによりマイコン(113)と接続される。なお、ポートには外部ネットワークに接続される外部ポートと内部ネットワークに接続される内部ポートがある。
PHY IC(112)はポート(1)〜(n)の通信の異常を検知する機能も持ち、ポート(1)〜(n)のどれかで異常を検出した場合、ネットワークスイッチ内マイコン(113)に接続された割り込み線(119)で割り込み信号を送ることにより、ポートの異常を通知する。割り込み線(119)を有さないPHY ICの場合はI2Cバス(120)を介してマイコン(113)がPHY IC(119)の内部状態レジスタを定期的に観察することで、異常を検出できるようにするのでも良い。
スイッチIC(111)はマイコン(113)とPCI割り込み線を含むPCIバス(121)で接続され、スイッチIC(111)はPHY IC(112)からのデータにエラーを検出した時などの異常を検出した場合、PCI割り込み信号を送ることにより、異常をマイコン(113)は通知することが出来る。
温度監視IC(114)とファン制御IC(115)と電圧監視IC(116)はマイコン(113)からI2Cバスで内部レジスタを定期的に監視され、機器の温度、電圧またはファンの異常をマイコンが検出することが出来るようになっている。機器の異常は前述のケースに限らず、使用環境に応じて監視したい環境監視ICを追加することで、機器の動作状態監視を細かくすることができる。
さらにマイコン(113)からポート(1)〜(n)の接続・切断状態(リンクアップ・リンクダウン)を示すSW_READY出力信号(118)が設置されていて、マイコン(113)が内部のGPIOレジスタ(117)の値を書き換えることによりSW_READY信号が示す接続または切断状態を切り替えることができる。
例えば、GPIOレジスタ(117)の値に000…0を書き込んだ場合は、ポート(1)〜(n)全てが接続状態、111…1を書き込んだ場合はポート(1)〜(n)全てが切断状態となっていることを示す。
マイコン(113)が、ネットワークスイッチモジュール内部のマイコン(113)またはマイコン(113)上で動作するソフトウェアの異常、スイッチIC(111)の異常、PHY IC(112)の異常、温度監視IC(115)の異常、ファン制御IC(114)または電圧監視ICの異常の何れかの異常を検知した際に、GPIOレジスタ(117)に切断を示す値を書き込むことで、SW_READY出力信号(118)で外部接続機器(サーバモジュール等)にポートの切断を通知することができる。
なお、マイコン(113)はネットワークスイッチモジュール内部の異常を検出したときだけでなく、ユーザからのアクセスにより、GPIOレジスタ(117)を制御して、切断状態とする機能も含む。
さらにGPIOレジスタ(117)の1ビットだけを全てのポートに対応するSW_READY出力信号(118)へ振り分けることでも良く、この場合はネットワークスイッチモジュールの障害を全ポートに通知するので、ネットワークスイッチモジュールが通信可能であるか否かを通知する事になる。
また、マイコン(113)には管理インタフェースが接続され(図示せず)、外部から外部ポートを介してマイコン(113)へアクセスすることができ、GPIOレジスタ(117)の値を操作することもできる。
次に図2を参照して、本発明の一実施形態としての、ブレードサーバシステム内部ネットワークシステムの説明をする。ブレードサーバシステム(210)は、サーバモジュール1(300)〜サーバモジュールn(310)をn台と内蔵ネットワークスイッチモジュール1(240)と内蔵ネットワークスイッチモジュール2(250)を備え、ミッドプレーン(260)が各サーバモジュール間および内蔵ネットワークスイッチモジュール間を接続し、複数のサーバモジュール、ネットワークスイッチモジュールを一つの筺体内に一体化したシステムである。
サーバモジュール1(300)はCPU(301)、メモリコントローラ(302)、メモリ(303)、I/Oコントローラ(304)、記憶装置(305)、ネットワークコントローラLSI1(306)を備える。ネットワークコントローラLSIは、ネットワークコントローラLSI1(306)とネットワークコントローラLSI2(307)が備えられ、冗長化されている。更に、ネットワークコントローラLSI1(306)はポートA(306a)とポートB(306b)を備え、一つのLSIで2つのネットワークと接続することができる構造を持つ。
サーバモジュール1(300)の2つのネットワークコントローラLSIの合計4つのポート(306a)から(307b)をミッドプレーン260を介して図2の様にたすきがけ状に接続することで、システム内ネットワークを冗長化し、各サーバモジュールとシステム外部ネットワーク間の接続の信頼性を高めている。
更に、実施例1で記述したネットワークスイッチモジュール1(240)の異常を通知するための出力信号SW_READY(248)をミッドプレーン(260)を介してネットワークポートに対応したネットワークコントローラLSIのSIGDET入力と接続されている。
この接続形態により、各ネットワークスイッチモジュールの装置障害やポート通信障害によるリンクダウン状態をSW_READY出力信号(245)により直接、対応ネットワークコントローラへ通知できるので、サーバモジュール1(300)〜サーバモジュールn(310)上で動作しているOSやデバイスドライバはネットワークコントローラLSI (306,307,316,317)からの割り込みまたはポーリングによってSW_READY信号(248〜258)の状態を速やかに検知でき、速やかに主系ネットワークパスから予備系への交替処理が行われるようになり、さらに、他のネットワーク監視/切り替えソフトウェアの導入と複雑な処理も必要とせず予備系ネットワークへの交替が可能となる。
例えば、内蔵ネットワークスイッチモジュール1(240)のスイッチIC(241)に動作不能となる障害が起きた場合、マイコン(244)がバス(243)を介してスイッチIC(241)の障害を検知し、マイコン(244)内部のGPIOレジスタ(245)をダウン状態値に変える。この値は、SW_READY出力信号(248)として各サーバモジュールの対応するポート(306a、307a、316a、317a)のSIGDET入力へ伝わる。各サーバモジュール上のCPU(301、311)で動作するOSまたはデバイスドライバは、ネットワークコントローラLSIからの割り込みまたはポーリングで速やかにSIGDET信号から内蔵スイッチモジュール1(240)の障害を検知し、障害を検知した後に速やかに予備系ポート(306b、307b、316b、317b)へ切り替えることができる。
このように本発明により、ネットワークスイッチモジュールから直接サーバモジュールへネットワークダウン状態を通知し、サーバモジュール上のOSまたはデバイスドライバが、それを検知した後に速やかに、他のネットワーク監視または切り替えソフトの導入と複雑な処理も必要とせずに、予備系ポートへ切り替えることができる。
る。
さらに発明によれば、ネットワークスイッチモジュールの障害時に限らず外部からの操作でネットワークパスを交替させることもでき、ネットワークスイッチモジュール障害の程度に応じ、全ポート一括でネットワークパスを交替させたり、選択したポートだけを交替させたりすることもできる。
本発明の一実施の形態に係るネットワークスイッチモジュールのブロック図である。 本発明の一実施形態としての、ブレードサーバシステム内部ネットワークシステムのブロック図である。
符号の説明
110…本発明の実施例のネットワークスイッチモジュール
111…スイッチIC
112…PHY IC
113…マイコンLSI
114…ファン制御・監視IC
115…温度監視IC
116…電圧監視IC
117…GPIOレジスタ1〜n
118…SW_READY出力信号1〜n
119…割り込み線
120…I2Cバス
121…PCIバス
210…ブレードサーバシステム
240、250…本発明の実施例のネットワークスイッチモジュール
241、251…スイッチIC
242、252…PHY IC
243、253…PCIバス
244、254…マイコン
245、255…GPIOレジスタ
246、256…I2Cバス
247、257…割り込み線
248、258…SW_READY出力信号
260…ミッドプレーン
261、262、263、264、265、266、267、268…内部ネットワーク
300、310…サーバモジュール
301、311…CPU
302、312…メモリコントローラLSI
303、313…メモリ
304、314…I/OコントローラLSI
305、315…ストレージデバイス
306、307、316、317…ネットワークコントローラLSI
306a、306b、307a、307b、316a、316b、317a、317b…SIGDET信号入力

Claims (5)

  1. 複数のサーバモジュールと複数のネットワークスイッチモジュールと前記複数のサーバモジュールと前記複数のネットワークスイッチモジュールとを接続する内部ネットワークから成り、各サーバモジュールは外部ネットワークとの接続制御を行うネットワークコントローラを備え、各ネットワークスイッチモジュールは内部ネットワークと外部ネットワークでデータの交換を行うスイッチ部と両ネットワークと接続するための複数のポートを備えたサーバシステムにおいて、
    各ネットワークスイッチモジュールは自ネットワークスイッチモジュールの状態を示すスイッチ状態信号を前記複数のサーバモジュールのネットワークコントローラに送出するプロセッサを備えたことを特徴とするサーバシステム。
  2. 前記ネットワークスイッチモジュールは各ポートのリンク状態を検出する手段を備え、前記プロセッサは前記スイッチ状態信号として検出された各ポートのリンク状態を示す信号を対応するサーバモジュールのネットワークコントローラに送出することを特徴とする請求項1記載のサーバシステム。
  3. 前記ネットワークスイッチモジュールはスイッチ部の障害を検出する手段を備え、前記プロセッサは前記スイッチ状態信号として検出された前記スイッチ部の障害を示す信号を全てのサーバモジュールのネットワークコントローラに送出することを特徴とする請求項1記載のサーバシステム。
  4. 各サーバモジュールは複数のネットワークコントローラを備え、内部ネットワークを多重構成とし、前記ネットワークスイッチモジュールからの前記スイッチ状態信号が障害を示した場合に、ネットワークパスを予備系ネットワークパスに切替えることを特徴とする請求項1乃至3記載のサーバシステム。
  5. 前記ネットワークスイッチモジュールのプロセッサには管理インタフェースが接続され、前記プロセッサは外部ポート経由の指示により前記スイッチ状態信号の値を操作することを特徴とする請求項1乃至4記載のサーバシステム。
JP2006319464A 2006-11-28 2006-11-28 サーバシステム Expired - Fee Related JP4779948B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006319464A JP4779948B2 (ja) 2006-11-28 2006-11-28 サーバシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006319464A JP4779948B2 (ja) 2006-11-28 2006-11-28 サーバシステム

Publications (2)

Publication Number Publication Date
JP2008135897A JP2008135897A (ja) 2008-06-12
JP4779948B2 true JP4779948B2 (ja) 2011-09-28

Family

ID=39560443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006319464A Expired - Fee Related JP4779948B2 (ja) 2006-11-28 2006-11-28 サーバシステム

Country Status (1)

Country Link
JP (1) JP4779948B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6657848B2 (ja) 2015-11-25 2020-03-04 富士通株式会社 スイッチ制御装置、スイッチの制御方法、及びスイッチ制御プログラム

Also Published As

Publication number Publication date
JP2008135897A (ja) 2008-06-12

Similar Documents

Publication Publication Date Title
US7930388B2 (en) Blade server management system
KR100725080B1 (ko) 정보 처리 장치 및 시스템 버스 제어 방법
JP5561622B2 (ja) 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
US8725905B2 (en) Power over ethernet powered management and diagnoses of information handling systems
US20050080887A1 (en) Redundant management control arbitration system
US9195553B2 (en) Redundant system control method
JP2004021556A (ja) 記憶制御装置およびその制御方法
US7421615B2 (en) Apparatus, method and system for selectively coupling a LAN controller to a platform management controller
EP2535817B1 (en) Information processing system
US20030121642A1 (en) Cascadable dual fan controller
JP4655718B2 (ja) コンピュータシステム及びその制御方法
EP1890439B1 (en) Data processing management apparatus, mode management apparatus and mode management method
CN111628944B (zh) 交换机及交换机系统
JP2007067540A (ja) 二重系系切替装置
JP2014191401A (ja) 処理装置、制御プログラム、及び制御法
JP5332257B2 (ja) サーバシステム、サーバ管理方法、およびそのプログラム
CN109995597B (zh) 一种网络设备故障处理方法及装置
JP4779948B2 (ja) サーバシステム
US7523354B2 (en) Disk controller having path obstruction determination function
WO2001084252A1 (fr) Systeme de commande de multiplexage et procede de multiplexage associe
JP6089766B2 (ja) 情報処理システム、及び情報処理装置の障害処理方法
CN113867648B (zh) 一种服务器存储子系统及其控制方法
US20230334184A1 (en) Data center security control module and control method thereof
WO2016203565A1 (ja) 計算機システムおよび制御方法
KR960010879B1 (ko) 공통의 버스 자원을 공유한 다수 프로세서의 버스 이중화 제어 및 버스 이상 상태 발생시 복구 처리방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110607

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110620

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees