JP2006004379A - ホット・スワップ可能なマルチサーバのデータ処理環境における電力回復 - Google Patents

ホット・スワップ可能なマルチサーバのデータ処理環境における電力回復 Download PDF

Info

Publication number
JP2006004379A
JP2006004379A JP2004183004A JP2004183004A JP2006004379A JP 2006004379 A JP2006004379 A JP 2006004379A JP 2004183004 A JP2004183004 A JP 2004183004A JP 2004183004 A JP2004183004 A JP 2004183004A JP 2006004379 A JP2006004379 A JP 2006004379A
Authority
JP
Japan
Prior art keywords
module
power
network
server
power state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004183004A
Other languages
English (en)
Other versions
JP4028859B2 (ja
Inventor
Dake Gregory William
グレゴリー・ウイリアム・デイク
Jeffery Michael Franke
ジェフリー・マイケル・フランケ
Johnson Donald Eugene
ドナルド・ユージーン・ジョンソン
Lardinois Shane Michael
シェーン・マイケル・ラーディノア
Michael Scott Rollins
マイケル・スコット・ロリンズ
David Robert Woodham
デビッド・ロバート・ウッドハム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2004183004A priority Critical patent/JP4028859B2/ja
Publication of JP2006004379A publication Critical patent/JP2006004379A/ja
Application granted granted Critical
Publication of JP4028859B2 publication Critical patent/JP4028859B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Power Sources (AREA)

Abstract

【課題】マルチサーバのデータ処理ネットワークにおける電力を管理するためのシステムおよび方法を提供すること。
【解決手段】データ処理ネットワークは、1組のサーバ・モジュール、サーバ・モジュールを相互接続する少なくとも1つのスイッチ・モジュール、および管理モジュールを含む。管理モジュールは、電力遷移の後、ネットワーク中に記憶された電力状態情報を照会し、その電力状態情報に基づいてサーバ・モジュールおよびスイッチ・モジュールの少なくともいくつかへの電力を回復させる。電力状態情報は、互換性のない通信プロトコルを有するサーバ・モジュールおよびスイッチ・モジュールには、管理モジュールによって電力が回復されないようにする。
【選択図】図6

Description

本発明は、データ処理システムの分野にあり、より詳細には、電力遷移後のデータ処理システムの電力回復の分野にある。
データ処理システムおよびネットワークの分野では、インターネット・データ・センタなどの多くの用途で、1つまたは複数のスイッチ・モジュールを使用して相互接続された1組の高密度組込みサーバ・モジュールが実装されている。この種の環境では、サーバ・モジュール、スイッチ・モジュール、およびネットワークの他の構成要素がホット・スワップ可能(電源を入れたまま構成要素の接続切換ができること)であり、したがってネットワークの可用性を犠牲にせずに、メンテナンスが実施できれば、非常に望ましい。さらに、ネットワークが、様々な種類のスイッチ・モジュールを使用して、様々な相互接続プロトコルや相互接続ファブリックを実装できることが望ましい。これらは、マルチサーバのネットワーク構成において望ましい特性であるが、他と異なるプロトコル特性を有するものもある様々な構成要素をホット・スワップさせることができるため、互換性の問題を生ずることがある。具体的には、操作者、技術者、およびメンテナンス要員が、高密度組込みサーバ構成から様々なカードあるいはモジュールを交換してネットワーク問題に対処しようと試みても、いくつかのカードあるいはモジュールは、他と異なる通信プロトコル特性を有しており、ネットワーク内のすべてのモジュール間で完全な互換性を維持するのは困難である。例えば、様々な通信プロトコル間の互換性がないことによりシステムの構成要素が損われることもある。
PCIスペシャル・インタレスト・グループ(PCI SpecialInterest Group)(http://www.pcisig.com)、「PCIローカル・バス仕様改訂版2.2(PCI Local BusSpecification Rev 2.2)」
したがって、マルチサーバのデータ処理ネットワークにおける電力を管理するためのシステムおよび方法を実装することが望ましい。この実装されたネットワークおよび方法が高度に自動化され、ネットワーク内部にある互換性のないモジュールがパワー・オンされないようにできるならさらに望ましい。この実装されたネットワークおよび方法が、電力遷移後の電力状態が遷移前の電力状態を反映するように、電力リセット後に様々なネットワーク・モジュールへの電力を自動的に回復できるならさらに望ましい。
これらの特定された目的は、本発明によるデータ処理ネットワークによって達成される。このネットワークは、1組のサーバ・モジュールと、サーバ・モジュールを相互接続するための少なくとも1つのスイッチ・モジュールと、管理モジュールとを含む。管理モジュールは、電力遷移後に、永続的メモリに記憶された電力状態情報を照会し、この電力状態情報に基づいて少なくともいくつかのサーバ・モジュールおよびスイッチ・モジュールへの電力を回復させる。電力状態情報は、互換性のない通信プロトコルを有するサーバ・モジュールおよびスイッチ・モジュールには、管理モジュールによって電力が回復されないようにする。一実施形態では、複数のサーバ・モジュールおよびスイッチ・モジュールは、すべて単一のシャーシに挿入されたホット・スワップ可能なモジュールである。この実施形態では、サーバ・モジュールおよび少なくとも1つのスイッチ・モジュールが、システム電力を含めてネットワークの選択された資源を共用する。スイッチ・モジュールおよびサーバ・モジュールは、イーサネット(登録商標)(Ethernet(登録商標))、ファイバ・チャネル、光、およびシリアル通信プロトコルを用いることができる。
本発明の他の目的および利点は、以下の詳細な説明を読み、添付図面を参照すれば明らかになろう。
本発明は、様々な修正および代替形態が可能であるが、その具体的な実施形態を例示として図面に示し、本明細書に詳細に記述する。しかし、本明細書に提示される図面および詳細な説明は、本発明をここに開示する特定の実施形態に限定するものではなく、添付の特許請求の範囲によって定義される本発明の趣旨および範囲に含まれる、すべての変更形態、等価形態、および代替形態を包含することを理解されたい。
一般に本発明は、電力環境を共用する、マルチサーバ内の様々なモジュールの電力状態の回復および監視に関する。システムの管理モジュールがパワー・オンされたとき、管理モジュールにホット・スワップが生じたのか、それともシャーシ全体への交流電力がリセットされたのかを判定する。この判定に応じて、管理モジュールは、次いで様々なモジュールの電力状態をそれらの知られている最近の状態に回復させ、あるいは現在の電力状態を検出し、今後の使用のためにそれらを保存する。管理モジュールを、この電力監視機能および電力回復機能を実施するように構成することにより、本発明は、電力を含めて共通の1組の資源を共用する、複数の相互接続されたシステムによって特徴付けられる環境に、有益で潜在的にエラーを低減させる自動化機能を追加する。
次に図面を参照すると、図1は、本発明に関して使用するのに適したデータ処理システム100の選択された機能のブロック図である。図のデータ処理システム100の諸要素は、完全に単一のプリント回路板上で実装することができる。この実施形態において、データ処理システム100を本明細書では代わりにサーバ・ブレード100と呼ぶこともある。図の実施形態では、サーバ・ブレード100は、システム・バス104に接続された1組の主プロセッサ102A〜102N(総称的にまたは集合的にプロセッサ102と称する)を含む。共通のシステム・メモリ106は、システム・バス104を介して各プロセッサ102にアクセスできる。システム・メモリは、通常ダイナミック・ランダム・アクセス・メモリ(DRAM)デバイスのアレイなどの揮発性記憶媒体で実装されている。図のサーバ・ブレード100のアーキテクチャは、各プロセッサ102がシステム・メモリ106に対して実質的に等しいアクセス権を有しているため、しばしば対称マルチプロセッサ(SMP)システムと呼ばれる。
図のサーバ・ブレード100の実施形態では、バス・ブリッジ108がシステム・バス104と入出力バス110の間のインターフェースを提供する。1つまたは複数の周辺装置114A〜114N(総称的にまたは集合的に周辺装置114と称する)ならびに汎用入出力(GPIO)ポートが入出力バス110に接続される。周辺装置114は、グラフィックス・アダプタ、高速ネットワーク・アダプタまたはネットワーク・インターフェース・カード(NIC)、ハードディスク・コントローラなどの装置を含むことができる。通常、入出力バス110は、一般的な例では、PCIスペシャル・インタレスト・グループ(PCI Special Interest Group)(http://www.pcisig.com)による「PCIローカル・バス仕様改訂版2.2(PCILocal Bus Specification Rev 2.2)」で指定されるPCI(周辺コンポーネント相互接続)バスを含めて、いくつかの業界標準入出力バス仕様の1つに準拠している。
図のサーバ・ブレード100の実施形態は、GPIOポート112に接続されたローカル・サービス・プロセッサ116を含む。ローカル・サービス・プロセッサ116は、主プロセッサ102へのサポートを提供するように構成される。このサポートには、例えば、主プロセッサ102に供給される電力の監視、およびブレードがクラッシュした場合に主プロセッサの再始動を開始することが含まれ得る。
次に図2および図3を参照すると、本発明の一実装形態によるデータ処理ネットワーク200のそれぞれ正面図および背面図が示されている。データ処理ネットワーク200は、この開示ではブレード・センタ200とも呼ぶが、複数のスロットまたはラック122を有するシャーシまたはキャビネット121を含む。キャビネット121(図2)の正面側にある各ラック122は、従来のエッジ・コネクタなどの適切な接続機構を介して、参照番号101a〜101nによって識別されるサーバ・ブレード・モジュール(総称的にまたは集合的にサーバ・ブレード・モジュール101と称する)などのモジュールを受け入れるように構成される。各サーバ・ブレード・モジュール101は、図1に関して述べたように、通常1つまたは複数のサーバ・ブレード100を含む。一実装形態では、各サーバ・ブレード・モジュール101は4U構成要素であり、16台ものサーバ・ブレード100を含むことができる。したがって、図のブレード・センタ200の実施形態は、1組のサーバ・ブレード・モジュール101を含み、そのそれぞれが、1つまたは複数のサーバ・ブレード100を含んでいる。
図3に示すシャーシ121の背面側は、4個ものスイッチ・モジュール126、管理モジュール120、4個の電源モジュール128、および1対のファンまたは送風器モジュール129を受け入れるように設計されている1組のラック124を含む。このスイッチ・モジュール126は、サーバ・ブレード・モジュール101と外部ネットワークの間の接続性を提供する。スイッチ・モジュール126には、光スイッチ・モジュール、ファイバ・チャネル・モジュール、イーサネット(登録商標)・モジュール、およびシリアル・モジュールが含まれ得る。
図3に示すネットワーク200は、キャビネット121内のスロット124に挿入されるシステム管理モジュール120を含む。図の実施形態では、管理モジュール120の寸法がサーバ・ブレード100の寸法と異なっており、管理モジュール・スロット124は管理モジュール120を受け入れ、このスロットへブレード・モジュール101が意図せずに挿入されるのを妨げる寸法になっている。管理モジュール120には通常、各サーバ・ブレード100によって共用されるネットワーク200の資源および特性を監視し制御するように構成された管理モジュール・サービス・プロセッサが実装される。これらの資源および特性には、例えばキャビネット121に印加される電力、キャビネットの冷却ファン、キャビネット121内部の雰囲気温度などの環境特性が含まれ得る。
前に示したように、様々なスイッチ・モジュール126は、動作電圧も含めて種々のプロトコルを有することができる。ブレード・センタ200(図4に示す)の一実装形態では、例えば各ブレード・モジュール101は、2個のスイッチ・モジュール126Aおよび126Bにそれぞれ接続される2つの一体化されたイーサネット(登録商標)・ポート132および134を含む。さらに、ブレード・モジュール101は、参照番号135で示される1つまたは2つのスイッチ用拡張オプション・カードを収納できる。オプション・カード135は、それが存在するとき、第3のスイッチ・モジュール126Cおよび第4のスイッチ・モジュール126Dにそれぞれ接続される、第3の通信ポート136および第4の通信ポート138をそれぞれ提供する。種々のスイッチ・モジュール・タイプはすべて、おそらく同じ形状ファクタを有しているので、どんなスイッチ・モジュール126も、任意のスイッチ・モジュール・ベイに挿入できる。2つの一体化されたイーサネット(登録商標)・ポート132、134の一方であれ、オプション・カード135上の通信ポートであれ、サーバ・ブレードの通信ポートが異なるプロトコルを有するスイッチ・モジュール126に接続されたとき、非互換性が生ずる。非互換性が生じたときは常に、通信パスは、機能しないだけではなく、1つまたは複数のモジュールに破壊的な影響を及ぼすことがあり得る。したがって、スイッチ・モジュール126と、それらのモジュールが接続されているサーバ・ブレード101との間のプロトコルの互換性を維持し監視することが重要である。
本発明は、様々な可能な通信プロトコルを有する複数の交換可能でホット・スワップ可能なスイッチ・モジュールと共に、単一のシャーシ内部にある複数の交換可能でホット・スワップ可能なサーバ・モジュールによって特徴付けられる環境におけるサーバ/スイッチの互換性を監視する自動化された方法を提供する。好ましい実施形態では、管理モジュール120などの管理エージェントが様々な構成要素の電力状態の監視を担当する。管理モジュール120が電力のリセットを検出したとき、それはこの電力リセットがシャーシ全体に影響する交流電力のリセットにより生じたのか、それともこの電力リセットは、やはりホット・スワップが可能な管理モジュールがシステムに接続されたことを示しているにすぎないのかを判定する。このリセットが交流電力のリセットの結果生じた場合(またリセットが正しいシャーシ内で生じていると管理モジュールが判定した場合)、管理モジュールは、様々なサーバ・モジュールおよびスイッチ・モジュールを、知られている最近の正常な電力状態に回復させる。管理モジュールは、ホット・スワップが行われたと判定した場合、後の交流電力リセットに使用できるように様々なモジュールの現在の電力状態を記録する。
次に図5を参照すると、電力状態の表140が、本発明の特定の実装形態の一態様として例示されている。一実施形態では、管理モジュール120は、電力状態の表140中に示される情報を含む表を、フラッシュ・メモリ・デバイスまたは他の形の電気的書換え可能ROM、バッテリ・バックアップ付きCMOS、および電力遷移の間も維持される同様なものなど不揮発性記憶装置中に維持する。図の実施形態による表140は、少なくとも各ブレード・モジュール101、および各スイッチ・モジュール126に対するエントリを含んでいる。
表140中のエントリごとに、それに対応するモジュールの電力状態を示す情報が維持される。本発明においては、各モジュールに対する可能な電力状態として、ON状態、OFF/ENABLED状態、およびOFF/DISABLED状態が含まれる。ON状態は、その名称が示唆するように、対応するモジュールが、記録されている最近の電力状態ではオンであったことを示す。OFF/ENABLED状態は、モジュールはパワー・オフされているが、そのモジュールは、必要に応じてパワー・オンする「許可」を有していたことを示す。OFF/DISABLED状態は、対応するモジュールがパワー・オンされる許可を有していないことを示す。表140の他の実装形態では、対応するモジュールが最近は低電力状態にあることが知られていたことを示す、例えばSTANDBY状態などを含めて、追加の電力状態が組み込まれている。図の表140の実施形態は、示された電力状態に関する情報に加えて、各モジュール・エントリごとに、そのモジュールがシャーシ中に物理的に存在するかどうかを示す。シャーシ中のすべての利用可能なスロットが使われている必要はない。
次に図6を参照すると、マルチモジュールで、ホット・スワップ可能なデータ処理環境における電力状態を自動的に回復させるための、本発明による方法150を示す流れ図が提示されている。方法150は、管理モジュール120がパワー・オンされたときに開始する。管理モジュールは、まずパワー・オンされた原因が何かを判定する(ブロック152)。具体的には、管理モジュール120は、それが給電中のシャーシに挿入されたのか(ホット・スワップされた)、それともコールド・スタートが行われたのかを判定する。コールド・スタートとは、シャーシ全体への交流電力のリセットを指す。一実施形態では、いずれかのモジュールがパワー・オンされているかどうかを検出することによって、この判定が行われる。コールド・スタートの後、管理モジュールの制御下でパワー・アップされるまで、すべてのモジュールはパワー・ダウン状態にある。したがって、管理モジュールが、システムのどのモジュールもパワー・オンされていないことを検出した場合、コールド・スタートが指示される。
コールド・スタートが行われた場合、次いで管理モジュールは、システム構成が、知られている最近の正常な構成から変更されているかどうか判定する(ブロック154)。管理モジュールが、それ自体がもはや前とは異なるシャーシ中にあると判定した場合、あるいは管理モジュールが、1つまたは複数のモジュールが取り外されたまたは挿入されたと判定した場合、その構成は変更されている。コールド・スタートかホット・スワップかの判定が構成変更の判定とあいまって、管理モジュールによって講じられる電力回復処置が規定される。
コールド・スタートが行われ、かつ構成が変更されていない場合、本発明では、表140中に記憶されている情報に基づいて、管理モジュール120は、すべてのモジュールの電力状態を知られている最近の正常な電力状態に回復させる。ホット・スワップまたは再構成が行われていた場合、管理モジュールは現在の電力状態の構成を受動的に知り、後の回復処理中に使用できるようにこの構成を表140に記憶する。
したがって、図6に示すように、ブロック152のコールド・スタートの判定、およびブロック154で同じ構成かどうかの判定の後、管理モジュール120は、表140を使用してモジュールを前の電力状態に回復させることを開始する。管理モジュール120は、表140中の各エントリを調べ、前に(すなわち、直前の電力保持期間中に)オンであったモジュールをパワー・オンする(ブロック156)。適切なモジュールのパワー・オン後、次いで管理モジュール120は、残りのモジュールの「ファブリック」タイプまたはプロトコル・タイプを照会し(ブロック158)、「オン」のモジュールとの互換性に基づいて、これら残りのモジュールに対するON/OFF許可状況をセットし(ブロック160)、その電力状態情報を永続的メモリに記憶させる(ブロック166)。
例えば、通信ポート136(図4を参照)用のイーサネット(登録商標)・オプション・カードを有するサーバ・ブレード101が、前の電力保持期間からパワー・オンされた場合、管理モジュールは、そのモジュールをパワー・オン状態に回復させる。次いで残りのモジュールのファブリック・タイプを検査した後、管理モジュールは、非イーサネット(登録商標)の通信ポート136を有するどの「オフ」モジュールに対しても、また第3のスイッチ・モジュール・ベイ(すなわちスイッチ・モジュール126C)にあるどの非イーサネット(登録商標)のスイッチ・モジュールに対しても、電力許可を拒否する(表140中にOFF/DISABLEDビットをセットする)。各サーバ・ブレード101は4個もの通信ポートを含むことができ、かつシステムは4個ものスイッチ・モジュール126を含むことができるので、互換性の検査では、好ましくはサーバ・ブレードの通信ポートとスイッチ・モジュールのあらゆる対を調べて、完全な互換性を判定する。図4に示すサーバ・ブレード101の実装形態では、4個の通信ポートのうちの2個(132および134)がこのブレード自体に一体化されたイーサネット(登録商標)・ポートである。構成のこの部分は一体化されているので、実質的に変更できない。さらに、これらの一体化されたポートが接続されているスイッチ・モジュール126Aおよび126Bは、常にイーサネット(登録商標)・ポートに接続されているので、イーサネット(登録商標)・スイッチであると推定できる。したがって、変更可能な構成要素が各サーバ・ブレードのそれぞれ第3および第4の通信ポート136、138と、第3および第4のスイッチ・モジュール126C、126Dだけである場合、互換性の検査は、非常に簡略化することができる。いくつかの実施形態では、表140は、各サーバ・ブレード用の各通信ポートのファブリック・タイプおよび各スイッチ・モジュールのファブリック・タイプを含むように拡張できる。
モジュールへの照会は、一例では、モジュール上のEPROMまたは他の不揮発性記憶装置の内部にある所定のアクセス可能な記憶域に記憶されているモジュールの識別を、管理モジュールに読み取らせることによって実施される。他の例では、モジュールのファブリック・タイプは、好ましくは通信ポートおよびスイッチ自体に対する簡単な電気的テストを行うことによって判定できる。例えば、導通テストにより、システム200が使用中の通信ポートの様々なタイプを識別でき、かつ管理モジュール120がそれらのポートを操作できる場合、電気的テストをファブリック・タイプの判定に使用できる。このようにしてファブリック・タイプを判定することにより、例えば、サーバ・ブレードのオプション・カード(図4の参照番号135)が無許可で交換された状況における確認の方策が提供される。なぜなら、かかる変更については、EPROMの識別情報中に反映されていない可能性があるからである。
管理モジュールが、コールド・スタートは行われていない、あるいは現在のシステム構成は前の構成と異なっていると判定した場合、方法150は、回復モードから、「学習」モードへ遷移する。学習モードでは、管理モジュール120がすべてのモジュールの現在の電力状態およびファブリック・タイプを検出し(ブロック164)、その情報を後の電力リセット中に使用できるように不揮発性記憶装置に記憶する(ブロック166)。このようにして、ホット・スワップされた管理モジュールは、パワー・オンし、それが取り付けられていたシャーシの現在の電力状態構成を知るようになる。このシャーシに対する次の交流電力の遷移後、管理モジュールはいつでも前の状態へとシステムを回復できる状態にある。電力状態情報の表140の変更は、モジュールが挿入または取り外されたとき、あるいは人的介入の下に電力許可が変更されたときに行うことができる。
本発明は、電力構成を共用するマルチサーバ中で電力および電力回復を管理するためのネットワークおよび方法を企図していることがこの開示による利益を受ける当業者には明らかであろう。詳細な説明および図面に示し記載した本発明の形態は、単に現在の好ましい例と解釈すべきであることが理解されよう。添付の特許請求の範囲は、ここに開示された好ましい実施形態のすべての変形形態を包含するものと広く解釈するものとする。
本発明の一実施形態で使用するのに適したデータ処理システムの、選択された要素のブロック図である。 本発明の一実施形態で使用するのに適したマルチサーバ・データ処理ネットワークにおける単一シャーシの正面図である。 本発明の一実施形態で使用するのに適したマルチサーバ・データ処理ネットワークにおける単一シャーシの背面図である。 ネットワークの一部分を構成できるサーバ・モジュールとスイッチ・モジュールの間の接続を強調した、図2および図3のネットワークの一実施形態のブロック図である。 本発明の一実施形態によるデータ処理ネットワークの管理モジュールによって維持される、電力状態情報を概念的に表す表である。 本発明の一実施形態による自動化された電力管理および電力回復方法の流れ図である。
符号の説明
100 データ処理システム、サーバ・ブレード
101 サーバ・ブレード・モジュール
102 主プロセッサ
104 システム・バス
106 システム・メモリ
108 バス・ブリッジ
110 入出力バス
112 汎用入出力ポート、GPIOポート
114 周辺装置
116 ローカル・サービス・プロセッサ
120 管理モジュール
121 シャーシ、キャビネット
122 スロット、ラック
124 スロット、ラック
126 スイッチ・モジュール
128 電源モジュール
129 ファン・モジュール、送風器モジュール
132 イーサネット(登録商標)・ポート
134 イーサネット(登録商標)・ポート
135 オプション・カード
136 通信ポート
138 通信ポート
140 表
200 データ処理ネットワーク、ブレード・センタ、システム

Claims (20)

  1. マルチサーバのデータ処理ネットワークにおいて使用する電力管理方法であって、
    電力遷移の検出に応答して、前記電力遷移がコールド・スタートを示しているかどうかを判定するステップと、
    前記電力遷移がコールド・スタートを示しているとの判定に応答して、電力状態情報を取り出すステップと、
    前記電力状態の情報に基づいて、前記ネットワークの少なくともいくつかのモジュールへの電力を回復させるステップとを含み、前記電力状態情報が、前記電力遷移前の前記ネットワークの電力状態を表しており、さらに前記電力状態情報が、互換性のない通信プロトコルを有するネットワーク・モジュールのパワー・オンを阻止する方法。
  2. 前記電力遷移がコールド・スタートを示していないとの判定に応答して、前記ネットワーク・モジュールにそれらの電力状態および通信プロトコル・タイプを照会するステップと、前記電力状態情報および前記通信プロトコル情報を不揮発性記憶装置に記憶するステップとをさらに含む、請求項1に記載の方法。
  3. ネットワーク・モジュールに照会する前記ステップが、前記モジュール上の不揮発性記憶装置からモジュール識別情報を取り出すステップを含む、請求項2に記載の方法。
  4. 前記ネットワーク・モジュールに照会する前記ステップが、前記ネットワークのサーバ・モジュールおよびスイッチ・モジュールに照会するものとしてさらに特徴付けられており、前記サーバ・モジュールのそれぞれが対称マルチプロセッサ・システムを備え、前記スイッチ・モジュールのそれぞれが、前記サーバ・モジュールを相互接続するように構成される、請求項2に記載の方法。
  5. 各ネットワーク・モジュールおよびスイッチ・モジュールが、イーサネット(R)、ファイバ・チャネル、光、およびシリアルから選択された通信プロトコルによって特徴付けられる、請求項4に記載の方法。
  6. 電力を回復させる前記ステップが、
    前記電力状態情報により前の保持期間中にオンであると示されたどのモジュールへの電力も回復させるステップ、および
    前記給電されたモジュールと前記残りのモジュールとの互換性に基づいて電力許可をセットするため、残りのモジュールの通信プロトコル・タイプを照会するステップとしてさらに特徴付けられる、請求項1に記載の方法。
  7. 複数のサーバ・モジュールと、
    前記サーバ・モジュール同士を接続する少なくとも1つのスイッチ・モジュールと、
    電力遷移の後、記憶されている電力状態情報を照会し、前記電力状態情報に基づいて、前記サーバ・モジュールおよび前記スイッチ・モジュールの少なくともいくつかへの電力を回復させ、互換性のない通信プロトコルを有するどのサーバ・モジュールおよびスイッチ・モジュールへの電力回復も阻止する管理モジュールとを備えるデータ処理ネットワーク。
  8. 前記複数のサーバ・モジュールが、単一のシャーシ内部に収納された複数の対称マルチプロセッサ(SMP)サーバ・モジュールを備え、さらに前記少なくとも1つのスイッチ・モジュールが前記シャーシ内部に収納され、さらに前記サーバ・モジュールおよび少なくとも1つのスイッチ・モジュールがシステムの電力を含めて前記ネットワークの選択された資源を共用する、請求項7に記載のネットワーク。
  9. 前記サーバ・モジュールおよび少なくとも1つのスイッチ・モジュールが、イーサネット(登録商標)、ファイバ・チャネル、光、およびシリアルから選択された通信プロトコルに準拠している、請求項7に記載のネットワーク。
  10. 前記電力遷移がコールド・スタートを示しているかどうかを判定するように前記管理モジュールが構成され、かつ
    前記電力遷移がコールド・スタートを示しているとの判定に応答して、前記電力状態情報に基づいて前記管理モジュールの少なくともいくつかへの電力を回復させるように前記管理モジュールが構成されており、
    前記電力状態情報が、前記電力遷移前における前記ネットワークの電力状態を表し、さらに前記電力状態情報が、互換性のない通信プロトコルを有するネットワーク・モジュールが前記管理モジュールによってパワー・オンされるのを阻止する、請求項7に記載のネットワーク。
  11. 前記管理モジュールが、前記電力遷移がコールド・スタートを示していないとの判定に応答して、前記モジュールにそれらの電力状態および通信プロトコル・タイプを照会し、前記電力状態情報および前記通信プロトコル情報を不揮発性記憶装置に記憶するようにさらに構成される、請求項10に記載のネットワーク。
  12. 各管理モジュールが、前記管理モジュール上の不揮発性記憶装置中に記憶されたモジュール識別情報を含み、前記識別情報が、前記通信プロトコル・タイプを示している、請求項11に記載のネットワーク。
  13. 各ネットワーク・モジュールおよびスイッチ・モジュールが、イーサネット(登録商標)、ファイバ・チャネル、光、およびシリアルから選択された通信プロトコルによって特徴付けられる、請求項11に記載のネットワーク。
  14. 前記電力状態情報により前の保持期間中にオンであると示されたどのモジュールへの電力も回復させるように前記管理モジュールが構成され、かつ
    残りのモジュールの通信プロトコル・タイプを照会して、それぞれ前記給電されたモジュールとの互換性に基づいて前記残りのモジュールの電力許可をセットするように前記管理モジュールがさらに構成される、請求項11に記載のネットワーク。
  15. コンピュータ読取り可能媒体に記憶された、マルチサーバのデータ処理ネットワークにおける電力状態を管理するための、コンピュータ実行可能コードを含むコンピュータ・プログラムであって、
    検出された電力遷移がコールド・スタートを示しているかどうかを判定するためのコンピュータ・コード手段と、
    前記電力遷移がコールド・スタートを示しているとの判定に応答して、電力状態情報を取り出すと共に、前記電力状態情報に基づいて前記ネットワークの前記モジュールの少なくともいくつかへの電力を回復させるためのコンピュータ・コード手段とを備え、前記電力状態情報が、前記電力遷移前の前記ネットワークの電力状態を表し、さらに前記電力状態情報が、互換性のない通信プロトコルを有しているネットワーク・モジュールのパワー・オンを阻止する、コンピュータ・プログラム。
  16. 前記電力遷移がコールド・スタートを示していないとの判定に応答して、前記ネットワーク・モジュールにそれらの電力状態および通信プロトコル・タイプを照会し、前記電力状態情報および前記通信プロトコル情報を不揮発性記憶装置に記憶するためのコンピュータ・コード手段をさらに備える、請求項15に記載のコンピュータ・プログラム。
  17. ネットワーク・モジュールを照会するための前記コード手段が、前記モジュール上の不揮発性記憶装置からモジュール識別情報を取り出すためのコード手段を含む、請求項16に記載のコンピュータ・プログラム。
  18. 前記ネットワーク・モジュールを照会するための前記コード手段が、前記ネットワークのサーバ・モジュールおよびスイッチ・モジュールを照会するためのコード手段としてさらに特徴付けられ、各サーバ・モジュールが対称マルチプロセッサ・システムを備え、各スイッチ・モジュールが前記サーバ・モジュールを相互接続するように構成される、請求項16に記載のコンピュータ・プログラム。
  19. 各ネットワーク・モジュールおよびスイッチ・モジュールが、イーサネット(登録商標)、ファイバ・チャネル、光、およびシリアルから選択された通信プロトコルによって特徴付けられる、請求項18に記載のコンピュータ・プログラム。
  20. 電力を回復させるための前記コード手段が、
    前記電力状態情報により前の保持期間中にオンであると示されたどのモジュールにも電力を回復させるためのコード手段、および
    残りのモジュールの通信プロトコル・タイプを照会して、前記給電されたモジュールと前記残りのモジュールとの互換性に基づいて電力許可をセットするためのコード手段としてさらに特徴付けられる、請求項15に記載のコンピュータ・プログラム。
JP2004183004A 2004-06-21 2004-06-21 ホット・スワップ可能なマルチサーバのデータ処理環境における電力回復 Expired - Lifetime JP4028859B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004183004A JP4028859B2 (ja) 2004-06-21 2004-06-21 ホット・スワップ可能なマルチサーバのデータ処理環境における電力回復

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004183004A JP4028859B2 (ja) 2004-06-21 2004-06-21 ホット・スワップ可能なマルチサーバのデータ処理環境における電力回復

Publications (2)

Publication Number Publication Date
JP2006004379A true JP2006004379A (ja) 2006-01-05
JP4028859B2 JP4028859B2 (ja) 2007-12-26

Family

ID=35772700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004183004A Expired - Lifetime JP4028859B2 (ja) 2004-06-21 2004-06-21 ホット・スワップ可能なマルチサーバのデータ処理環境における電力回復

Country Status (1)

Country Link
JP (1) JP4028859B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108919900A (zh) * 2018-06-27 2018-11-30 郑州云海信息技术有限公司 一种服务器系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10888013B2 (en) 2017-10-04 2021-01-05 Google Llc Managing a data center

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108919900A (zh) * 2018-06-27 2018-11-30 郑州云海信息技术有限公司 一种服务器系统

Also Published As

Publication number Publication date
JP4028859B2 (ja) 2007-12-26

Similar Documents

Publication Publication Date Title
TWI631466B (zh) 機箱管理系統及機箱管理方法
JP4725719B2 (ja) ブレードサーバシステムおよびその管理方法
CN105404366B (zh) 在服务器机架系统中的备份管理控制的方法及服务器机架
US6931568B2 (en) Fail-over control in a computer system having redundant service processors
CN109471770B (zh) 一种系统管理方法和装置
CN1770707B (zh) 计算机簇中基于法定成员数关无响应服务器的装置和方法
US7694029B2 (en) Detecting miscabling in a storage area network
CN106814826B (zh) 控制服务器机柜中气流的系统及方法
US11349733B2 (en) Method and system for automatic detection and alert of changes of computing device components
CN105653345A (zh) 用于支持对数据的非易失性随机访问的方法和设备
US10691562B2 (en) Management node failover for high reliability systems
US7206947B2 (en) System and method for providing a persistent power mask
EP2161647A1 (en) Power-on protection method, module and system
US7213163B2 (en) Restoring power in a hot swappable multi-server data processing environment
CN105549696A (zh) 具有机箱管理功能的机架式服务器系统
US8533528B2 (en) Fault tolerant power sequencer
JP4028859B2 (ja) ホット・スワップ可能なマルチサーバのデータ処理環境における電力回復
US9081614B2 (en) Managing shared resources in a multi-computer system with failover support
CN116539992A (zh) 存储设备在位稳定状态检测装置、方法、逻辑模块及介质
US20070180329A1 (en) Method of latent fault checking a management network
KR100544006B1 (ko) 전력 관리 방법, 데이터 처리 네트워크 및 컴퓨터 판독가능한 기록 매체
US9853911B2 (en) System and method for management network activity in a data center environment
CN113946530A (zh) 扩展卡的控制方法及装置、非易失性存储介质
CN113419977A (zh) 一种服务器中pcie设备管理系统和服务器
CN106648007B (zh) 一种通用槽位实现方法、装置及通信设备

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070308

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070313

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20070607

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071009

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4028859

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131019

Year of fee payment: 6