JP2006228220A - ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法 - Google Patents

ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法 Download PDF

Info

Publication number
JP2006228220A
JP2006228220A JP2006036807A JP2006036807A JP2006228220A JP 2006228220 A JP2006228220 A JP 2006228220A JP 2006036807 A JP2006036807 A JP 2006036807A JP 2006036807 A JP2006036807 A JP 2006036807A JP 2006228220 A JP2006228220 A JP 2006228220A
Authority
JP
Japan
Prior art keywords
blade server
client computer
blade
server
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006036807A
Other languages
English (en)
Inventor
Daryl Carvis Cromer
ダリル・カルヴィス・クロマー
Jeffrey Rocker Howard
ハワード・ジェフリー・ロッカー
Randall Scott Springfield
ランドール・スコット・スプリングフィールド
David Waltermann Rod
ロッド・デイヴィッド・ウォルターマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2006228220A publication Critical patent/JP2006228220A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61FFILTERS IMPLANTABLE INTO BLOOD VESSELS; PROSTHESES; DEVICES PROVIDING PATENCY TO, OR PREVENTING COLLAPSING OF, TUBULAR STRUCTURES OF THE BODY, e.g. STENTS; ORTHOPAEDIC, NURSING OR CONTRACEPTIVE DEVICES; FOMENTATION; TREATMENT OR PROTECTION OF EYES OR EARS; BANDAGES, DRESSINGS OR ABSORBENT PADS; FIRST-AID KITS
    • A61F11/00Methods or devices for treatment of the ears or hearing sense; Non-electric hearing aids; Methods or devices for enabling ear patients to achieve auditory perception through physiological senses other than hearing sense; Protective devices for the ears, carried on the body or in the hand
    • A61F11/06Protective devices for the ears
    • A61F11/14Protective devices for the ears external, e.g. earcaps or earmuffs
    • AHUMAN NECESSITIES
    • A41WEARING APPAREL
    • A41DOUTERWEAR; PROTECTIVE GARMENTS; ACCESSORIES
    • A41D13/00Professional, industrial or sporting protective garments, e.g. surgeons' gowns or garments protecting against blows or punches
    • A41D13/05Professional, industrial or sporting protective garments, e.g. surgeons' gowns or garments protecting against blows or punches protecting only a particular body part
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Acoustics & Sound (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Otolaryngology (AREA)
  • Psychology (AREA)
  • Biomedical Technology (AREA)
  • Textile Engineering (AREA)
  • Vascular Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)
  • Telephonic Communication Services (AREA)
  • Power Sources (AREA)

Abstract

【課題】 ブレード・サーバ間の負荷のバランスを取ることができるシステムおよび方法を提供する。
【解決手段】 クライアント・コンピュータにサービスを提供している第1のブレード・サーバに輻輳が生じると、異なるブレード・センタに存在する可能性のある第2のブレード・サーバにサービスを転送する。その際に、第1のブレードおよびクライアントをフリーズさせ、次いで、クライアントの仮想ストレージにおける現在アドレスされている位置に対するポインタおよびクライアント・コンピュータに関連付けた第1のブレード・サーバにおける正確なメモリ・マップを、クライアントのIPアドレスと共に、第2のブレード・サーバに送信する。これらを用いて、第2のブレードにおいて第1のブレードの状態を再構築し、この時点で、第2のブレードはクライアントに対するサービスを再開する。
【選択図】 図3

Description

本発明は、ブレード・サーバ(blade server)に関する。
薄型で、ホット・スワップ可能な(hotswappable)ブレード・サーバは、本棚の本のように、単一のシャシ(chassis)に取り付けられる。各々は独立したサーバであり、それ自身のプロセッサ、メモリ、ストレージ、ネットワーク・コントローラ、オペレーティング・システム、およびアプリケーションを有する。ブレード・サーバは、簡単にシャシ内のベイ(bay)にスライドし、中央面または背面にプラグ接続し、電源、ファン、フロッピ・ドライブ、スイッチ、およびポートを、他のブレード・サーバと共有する。
ブレードの手法の利点には、サーバを追加および除去するためにラックを介して何百本ものケーブルを引く必要性をなくすことが含まれる。スイッチおよび電源ユニットを共有するので、貴重な空間が自由に使えるようになる。ブレード・サーバは、極めて容易に高密度化を可能とする。
実際、すぐに得られる現実的な利点によって、ブレード・サーバ技術は、オン・デマンド・コンピューティングに向けて進行している革命に重要な役割を果たすことになる。急速に発展しつつある他の技術(グリッド・コンピューティング(grid computing)、自律型コンピューティング(autonomiccomputing:IBM商標)、ウェブ・サービス、分散型コンピューティング等)と共に、ブレード・サーバの効率、柔軟性、および費用対効果は、コンピューティング・パワーを電力のような公益サービスによく似たものとする、すなわち、必要な場合はいつでも求められるだけ使用可能とすることができるように役立っている。
ブレード技術は、各サーバが1つのタイプのプロセッサにしか対応することができない従来のサーバ設計による古い制約をなくすのに役立つように設計されている。シャシ内の各ブレードは、自立型サーバであり、それ自身のオペレーティング・システムおよびソフトウエアを実行する。従って、洗練された冷却および電力の技術によって、速度および種類が異なるプロセッサを有する複数のブレードの組み合わせに対応することができる。
本明細書において重要なこととして認識されるように、ブレード・サーバのシャシ内の1つのブレード・サーバは、複数のクライアント・デバイスを蓄積している場合があり、それらの処理の必要性によってサービス需要が増大し、このために輻輳が生じ、性能が劣化する恐れがある。本発明は、ブレード・サーバ間の負荷のバランスを取ることを対象とする。
第1のブレード・サーバから第2のブレード・サーバにクライアント・コンピュータのサービスを転送するための方法は、第1のブレード・サーバから第2のブレード・サーバに、少なくともクライアント・コンピュータの識別子およびクライアント・コンピュータに関するストレージ情報を送信するステップを含む。第2のブレード・サーバは、ストレージ情報およびクライアント・コンピュータ識別子を用いて、クライアント・サービスに対するサービスを再開する。
いくつかの実施においては、送信動作の前に、クライアント・コンピュータおよび第1のブレード・サーバをフリーズさせることが望ましい場合がある。また、クライアント・コンピュータがフリーズしたというステータス・メッセージをクライアント・コンピュータに送信することができる。この方法は、データ・レートおよび格納した全バイトのうち少なくとも1つによって判断されるように第1のブレード・サーバに輻輳が発生した場合、またはブレードの故障が起こりそうな場合に、実行することができる。
ストレージ情報は、第1のブレード・サーバからの直接アクセス記憶装置情報を含むことができ、特定の実施においては、クライアント・コンピュータに関連した仮想ストレージに対するポインタおよびクライアント・コンピュータに関連付けられた第1のブレード・サーバにおける正確なメモリ・マップを含む場合がある。クライアント・コンピュータ識別子は、クライアント・コンピュータのIPアドレスを含むことができる。いずれの場合でも、第2のブレード・サーバは、ストレージ情報を用いて、第2のブレード・サーバにおいて、クライアント・コンピュータに関連付けて第1のブレード・サーバのデータ・ストレージ状態を再構築することができる。
別の態様では、コンピュータ・システムは、クライアント・コンピュータにサービスを提供する第1のブレード・サーバと、クライアント・コンピュータのサービスを転送することが求められる第2のブレード・サーバと、を含む。第2のブレード・サーバにおいて、クライアント・コンピュータに関連付けて第1のブレード・サーバの正確な状態を再構築するための論理を提供し、第2のブレード・サーバはクライアント・コンピュータに関連した仮想メモリ内の位置に示されている。このようにして、第2のブレード・サーバは、第1のブレード・サーバからクライアント・コンピュータのサービス提供を引き継ぐことができる。
更に別の態様では、第1のブレード・サーバから第2のブレード・サーバにクライアント・コンピュータのサービス提供を転送するためのサービスは、第1のブレード・サーバから第2にブレード・サーバに、ストレージ情報およびクライアント情報を送信するための手段を提供するステップと、ストレージ情報およびクライアント情報を用いて、第2のブレード・サーバにおいて、第1のブレード・サーバのクライアント・コンピュータ専用部分の正確な状態を再構築するための手段を提供するステップと、を含む。また、このサービスは、クライアント・コンピュータと第2のブレード・サーバとの間のサービス通信リンクを確立するための手段を提供するためのステップも含むことができる。
本発明の構造および動作の双方に関する本発明の詳細は、添付図面を参照して最も適切に理解することができる。添付図面において、同様の参照番号は同様の部分を示す。
本発明の譲受人による米国特許第6,771,499号は、1つの限定されない(non-limiting)ブレード・サーバ・システムについて記載しており、これと共に本発明を使用可能である。この特許は、引用により本願にも含まれるものとする。便宜のため、図1および2は、かかるシステムを図示し、全体として10と示す。このシステムでは、1つ以上のクライアント・コンピュータ12が、全体として14と示すブレード・サーバ・センタと、有線または無線経路を介して通信を行う。本発明を用いて、単一のブレード・センタにおける複数のブレード間で、または、同一である可能性があり、各々がそれ自身のブレード・サーバ・シャシを有する複数のブレード・センタに分散した複数のブレード間で、負荷のバランスを取ることができる。例えば、図1は、第2のブレード・センタ16を示し、これは、構成および動作においてあらゆる基本的な点でブレード・センタ14と同一であり、これと通信を行う。クライアント・コンピュータとしては、いずれかの適切なコンピューティング・デバイスが機能することができる。
従って、第1のブレード・センタ14の限定されない実施に焦点を当てると、主シャシCH1は、サーバ・ブレード・センタ14の全てのコンポーネントを収容する。シャシCH1の前部における14のスロットに、14またはそれ以上のプロセッサ・ブレードPB1からPB14(またはストレージ・ブレード等の他のブレード)をホット・プラグ可能である。「サーバ・ブレード」、「プロセッサ・ブレード」、または単に「ブレード」という言葉は、本明細書において交換可能に用いるが、これらの言葉は、「プロセッサ」または「サーバ」の機能のみを実行するブレードに限定されず、典型的にハード・ディスク・ドライブを含みその主な機能がデータ・ストレージであるストレージ・ブレード等の他の機能を実行するブレードを含むことは理解されよう。
プロセッサ・ブレードは、業界標準のサーバのプロセッサ、メモリ、ハード・ディスク・ストレージ、およびファームウェアを提供する。更に、それらは、制御パネルによるキーボード、ビデオ、およびマウス(「KVM」)の選択、オンボード・サービス・プロセッサ、および、媒体トレー内のフロッピおよびCD−ROMドライブに対するアクセスを含む。オンボードPCI−Xインタフェースを介して、ドーター・カード(daughter card)が接続され、モジュールSM1〜4を切り替えるための追加の高速リンクを与えるために用いられる。また、各プロセッサ・ブレードが有する前面パネルには、現在のステータスを示すための5つのLEDおよび4つのプッシュ・ボタン・スイッチが備えられ、電源オン/オフ、プロセッサ・ブレードの選択、リセット、およびローカル制御のためのコア・ダンプ用のNMIのために用いられる。
ブレードは、システムにおける他のブレードの動作に影響を与えることなく、「ホット・スワップ」することができる。サーバ・ブレードは、通常、単一のスロット・カード(縦394.2mm、横226.99mm)として実施される。しかしながら、場合によっては、単一のプロセッサ・ブレードが2つのスロットを必要とする場合がある。プロセッサ・ブレードは、機械的および電気的インタフェースならびにサーバ・ブレード・システムの電力および冷却の要求に合致する限り、どのマイクロプロセッサ技術も使用可能である。
冗長性のため、プロセッサ・ブレードは、2つの信号および電力コネクタを有する。その一方は、中央面MPの対応するスロットの上部コネクタに接続され、他方は、中央面の対応する下部コネクタに接続されている。プロセッサ・ブレードは、以下の中央面インタフェースを介して、サーバ・ブレード・システムにおける他の構成要素と接続する。すなわち、(1)ギガビット・イーサネット(Gigabit Ethernet)(ブレード当たり2つ。必須)、(2)ファイバ・チャネル(ブレード当たり2つ。オプション)、(3)管理モジュール・シリアル・リンク、(4)VGAアナログ・ビデオ・リンク、(5)キーボード/マウスUSBリンク、(6)CD−ROMおよびフロッピ・ディスク・ドライブ(「FDD」)USBリンク、(7)12VDC電力、および(8)種々の制御信号、である。これらのインタフェースは、管理モジュール、スイッチ・モジュール、CD−ROM、およびFDD等、サーバ・ブレード・システムにおける他の構成要素と通信を行うための能力を提供する。これらのインタフェースは、中央面において重複させて、冗長性を与える。プロセッサ・ブレードは、通常、媒体トレーのCDROMまたはFDD、ネットワーク(ファイバ・チャネルまたはイーサネット)、またはそのローカルのハード・ディスク・ドライブからの立ち上げをサポートする。
媒体トレーMTは、ブレードのいずれか1つに結合可能なフロッピ・ディスク・ドライブおよびCD−ROMドライブを含む。また、媒体トレーはインタフェース・ボードを収容しており、この上に、インタフェースLED、吸気温度を測定するためのサーミスタ、および4ポートUSBコントローラ・ハブが搭載されている。システム・レベルのインタフェース制御部は、電力、位置、過熱、情報、および一般的な故障のLED、ならびにUSBポートから成る。
中央面回路ボードMPは、シャシCH1の中央付近に配置され、2列のコネクタを含む。上の列は、コネクタMPC−S1−R1からMPC−S14−R1を含み、下の行は、コネクタMPC−S1−R2からMPC−S14−R2を含む。従って、ブレード・スロットの各々は、上下に配置された1対の中央面コネクタ(例えばコネクタMPC−S1−R1およびMPC−S1−R2)を含み、中央面コネクタの各対は、各プロセッサ・ブレードの後縁における1対のコネクタと結合する(図1には示していない)。
図2は、サーバ・ブレード・システムの後部の後ろ側、上側、および左側の斜視図である。図1および2を参照すると、シャシCH2は、冷却、電力、制御、およびスイッチングのための様々なホット・プラグ可能コンポーネントを収容する。シャシCH2は、主シャシCH1の後部内にスライドし、これに保持される。
2つのホット・プラグ可能な送風機BL1およびBL2は、後ろに湾曲したインペラ送風機を含み、サーバ・ブレード・システムのコンポーネントに冗長的な冷却を与える。空気流は、シャシCH1の前部から後部へと向かう。プロセッサ・ブレードPB1からPB14の各々は、空気を入れるための前部グリルを含み、低背型の蒸気チャンバに基づいたヒート・シンクを用いて、ブレード内のプロセッサを冷却する。システム・シャシを通る全体的な空気流は、0.7インチ(約1.78センチメートル)のH2O静圧降下で、約300立方フィート/分(約8496リットル)である。送風機を故障または除去した場合、残りの送風機の速度が自動的に上がって、代わりのユニットが取り付けられるまで必要な空気流を維持する。また、送風機の速度制御は、吸気温度を常に監視するサーミスタによっても行われる。また、サーバ・ブレード・システムのコンポーネントの温度を監視し、様々な温度センサによって報告される温度レベルの上昇に応答して、送風機の速度は自動的に上がる。
4つのホット・プラグ可能な電力モジュールPM1からPM4は、プロセッサ・ブレードおよび他のコンポーネントにDC動作電圧を提供する。一方のパワー・モジュール対は、全ての管理モジュールおよびスイッチ・モジュール、ならびに、スロット1から6にプラグ接続されたいずれかのブレードに、電力を供給する。他方のパワー・モジュール対は、スロット7から14のいずれかのブレードに電力を供給する。各パワー・モジュール対において、1つのパワー・モジュールは、第1のパワー・モジュールが故障したかまたは取り除かれた場合に、他のバックアップとして機能する。このため、14のプロセッサ・ブレード、4つのスイッチ・モジュール、2つの送風機、および2つの管理モジュールを搭載したフル装備の充分に構成されたシャシに電力を供給するために必要なのは、最小で2つのアクティブなパワー・モジュールである。しかしながら、完全な冗長性およびバックアップ機能を提供するためには、4つのパワー・モジュールが必要である。パワー・モジュールは、50/60Hzで200VACから240VACのAC入力電圧範囲間で動作するように設計され、IEC320 C14おす機器結合器を用いる。パワー・モジュールは、+12VDX出力を中央面に供給し、ここから、全てのサーバ・ブレード・システムのコンポーネントが電力を得る。冗長性のため、2つの+12VDC中央面電力バスを用い、冗長パワー・モジュール間の出力負荷のアクティブな電流の共有を行う。
管理モジュールMM1からMM4は、ホット・プラグ可能なコンポーネントであり、制御、監視、警告、再起動、および診断等の基本的な管理機能を与える。また、管理モジュールは、プロセッサ・ブレード間で共通のキーボード、ビデオ、およびマウス信号を切り替える能力等、共有リソースを管理するために必要な他の機能も与える。
1つの制限されないブレード・サーバ・システム14について述べたので、ここで図3を参照する。これは、1つのプロセッサまたは複数のプロセッサによって実行可能な論理を示しており、「古い」ブレードとして考えられるもの、すなわち、輻輳を経験し、本明細書における論理に従って「新しい」すなわち輻輳していないブレードに作業を移さなければならないブレードにおいて実行される。図3〜5の論理は、ブレード・プロセッサ、スーパーバイザ・プロセッサ、あるいは他のプロセッサ、またはそれら全てのうち1つまたはそれらの組み合わせによって実行することができ、この論理は、データ・ストレージ・デバイス上に格納することができる。そのデータ・ストレージ・デバイスは、例えばハード・ディスク・ドライブまたは固体メモリ・デバイス等であるが、これらには限定されない。
図3のブロック20から開始して、各ブレード(「古い」ブレードを含む)は、輻輳がないかどうか、それ自身を監視する(または、以下で述べるスーパーバイザに監視情報を送信する)。輻輳の判定は、データ・レート閾値を超えたこと、あるいは格納された全バイトの閾値を超えたこと、あるいは他の測定基準、あるいは故障が起こりそうなことまたは保守の必要性(例えば動作時間数の閾値が経過した後)の指示(高い温度、大きいノイズまたは振動等)、またはそれら全てによって行うことができる。決定ダイアモンド22において輻輳が判定されると、ブロック24において、ブレード・センタ14におけるスーパーバイザ・プロセッサに、輻輳警告を送信する。次いで、「古い」ブレードは、更に別の命令を待つ。
ブロック26は、スーパーバイザから「古い」ブレードに転送のコマンドが受信されると、「古い」ブレードは、以下に述べる「新しい」ブレードにペイロール(payroll)・メッセージを送信し、クライアント・コンピュータの動作をフリーズさせる。ペイロール・メッセージは、クライアント・コンピュータ、および、クライアント・コンピュータ12にサービスを提供するために用いられているブレード・サーバ・センタ14における関連した直接アクセス記憶装置(DASD:Direct Access Storage Device、例えばハード・ディスク・ドライブ)の双方に関する情報を含む。特定の実施形態では、「ペイロール」において送信されたブレード・センタ・ストレージ情報は、輻輳しているブレードにおけるクライアント・コンピュータ仮想ストレージ内の現在アドレスされている位置に対するポインタ、および、クライアント・コンピュータに関連付けた輻輳ブレードにおける正確な現在のメモリ・マップを含むことができ、一方で、クライアント情報は、クライアント・コンピュータ12のIPアドレスを含むことができる。転送が行われると、ブロック28において、「古い」ブレードを解放することができる。
図4は、ブレード・センタ14における1つ以上のスーパーバイザ・プロセッサによって用いることができる論理を示し、所望の場合に、専用のブレード・プロセッサによって実施可能である。ブロック30において、いずれかの輻輳の受信を含めて、ブレードの性能を監視する。輻輳警告を受信すると、ブロック32においてDOループに入り、論理はブロック34に移って、おそらくは第2のブレード・センタ16において、新しい輻輳していないブレードの位置を特定する。これは、輻輳した「古い」ブレードと実質的に同一であることが好ましい。ブロック36において、かかる「新しい」ブレードが見つかると、上述の転送コマンドを「古い」ブレードに送信して、クライアント・コンピュータ(または、少なくともブレードによるサービス提供に関連したクライアントの部分)をフリーズさせ、ペイロール・メッセージを送信させる。所望の場合、クライアントがフリーズしたことを示すステータス・メッセージをクライアント・コンピュータに送信することができる。「フリーズした」が意味するのは、クライアント・コンピュータと輻輳したブレードとの間にそれ以上のインタラクションが許可されず、クライアント・コンピュータ12に関するいずれの点においても輻輳ブレードが変更されないようにすることである。
図5は、図4のブロック34において位置を特定した「新しい」ブレードによって用いることができる論理を示す。ブロック38から開始して、ペイロール情報を受信しロードする。ブロック40において、「新しい」ブレードは、ペイロール情報を用いて、クライアント・コンピュータ12に関連した「古い」輻輳ブレードの古いDASD(メモリ)状態を再構築する。換言すると、クライアント・コンピュータ12に関連した「古い」輻輳ブレードの正確な状態を、「新しい」ブレード上で再構築する。「新しい」ブレードは、ペイロールで送信されたポインタによって、クライアント・コンピュータ仮想ストレージ内の適正な位置に示されている。次いで、「新しい」ブレードは、所望の場合にはクライアント・コンピュータを認証し、ペイロールで送信されたIPアドレスを用いて、クライアント・コンピュータ12に対するサービスを再開する。
本明細書において詳細に図示し説明した具体的な「ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法」は、本発明の上述の目的を充分に達成することができるが、これは本発明の現在好適である実施形態であり、従って、本発明によって広く考えられる主題を表し、本発明の範囲は当業者に明らかであり得る他の実施形態を充分に包含し、従って、本発明の範囲は、特許請求の範囲以外の何によっても限定されないことは理解されよう。特許請求の範囲において、単数の要素に対する言及は、明示的にそう述べるのでない限り、「唯一のもの」を意味するのでなく、「1つ以上」を意味することが意図される。デバイスまたは方法は、本発明が解決しようとする全ての問題の各々に対処する必要はない。これは、本発明の特許請求項によって包含されているからである。更に、本開示における要素、コンポーネント、または方法ステップのいずれも、特許請求の範囲において、要素、コンポーネント、または方法ステップが明示的に説明されているか否かにはかかわらず、一般の人々のためにのみ用いられることは意図されない。本明細書において明確な定義が行われていないもの、請求項の用語は、本明細書および出願履歴に一致する全ての通常かつ習慣的な意味を与えられるものとする。
本発明のサーバ・ブレード・システムの前側、上側、および右側の分解斜視図である。 サーバ・ブレード・システムの後部の後ろ側、上側、および左側の斜視図である。 「古い」ブレードの限定されない論理のフローチャートである。 スーパーバイザの限定されない論理のフローチャートである。 「新しい」ブレードの限定されない論理のフローチャートである。
符号の説明
PB プロセッサ・ブレード
MT 媒体トレー
CH シャシ
MP 中央面
12 クライアント・コンピュータ
14 第1のブレード・センタ
16 第2のブレード・センタ
PM 電力モジュール
MM 管理モジュール

Claims (12)

  1. 第1のブレード・サーバから第2のブレード・サーバにクライアント・コンピュータのサービスを転送するための方法であって、
    前記第1のブレード・サーバから前記第2のブレード・サーバに、少なくともクライアント・コンピュータの識別子および前記クライアント・コンピュータに関するストレージ情報を送信するステップと、
    前記第2のブレード・サーバにおいて、前記ストレージ情報およびクライアント・コンピュータ識別子を用いて前記クライアント・コンピュータに対するサービスを再開するステップと、
    を含む、方法。
  2. 前記送信ステップの前に、前記クライアント・コンピュータおよび第1のブレード・サーバをフリーズさせるステップを含む、請求項1に記載の方法。
  3. 少なくとも、データ・レートおよび格納した全バイトのうち少なくとも1つによって判断されるように前記第1のブレード・サーバに輻輳が発生した場合、またはブレードの故障が起こりそうな場合に、前記方法を実行する、請求項1に記載の方法。
  4. 前記第2のブレード・サーバが前記第1のブレード・サーバと構成が実質的に同一である、請求項1に記載の方法。
  5. さらに、前記クライアント・コンピュータがフリーズしたというステータス・メッセージを前記クライアント・コンピュータに送信するステップを含む、請求項2に記載の方法。
  6. 前記ストレージ情報が、前記第1のブレード・サーバからの直接アクセス記憶装置情報を含む、請求項1に記載の方法。
  7. 前記ストレージ情報が、前記クライアント・コンピュータに関連した仮想ストレージに対するポインタおよび前記第1のブレード・サーバにおける正確なメモリ・マップを含み、前記メモリ・マップが前記クライアント・コンピュータに関連付けられている、請求項1に記載の方法。
  8. 前記クライアント・コンピュータ識別子が前記クライアント・コンピュータのIPアドレスを含む、請求項7に記載の方法。
  9. 前記第2のブレード・サーバが、前記ストレージ情報を用いて、前記第2のブレード・サーバにおいて、前記クライアント・コンピュータに関連付けて前記第1のブレード・サーバのデータ・ストレージ状態を再構築する、請求項8に記載の方法。
  10. コンピュータ・システムであって、
    クライアント・コンピュータにサービスを提供する少なくとも1つの第1のブレード・サーバと、
    前記クライアント・コンピュータのサービスを転送することが求められる少なくとも1つの第2のブレード・サーバと、
    前記第2のブレード・サーバにおいて、前記クライアント・コンピュータに関連付けて前記第1のブレード・サーバの正確な状態を再構築するための手段であって、前記第2のブレード・サーバが前記クライアント・コンピュータに関連した仮想メモリ内の位置に示され、これによって、前記第2のブレード・サーバは、前記第1のブレード・サーバから前記クライアント・コンピュータのサービス提供を引き継ぐための手段と、
    を含む、コンピュータ・システム。
  11. 前記再構築のための手段が、前記第1のブレード・サーバから前記第2のブレード・サーバに送信されるストレージ情報を用いる、請求項10に記載のシステム。
  12. 第1のブレード・サーバから第2のブレード・サーバにクライアント・コンピュータのサービス提供を転送するためのサービスであって、
    前記第1のブレード・サーバから前記第2にブレード・サーバに、ストレージ情報およびクライアント情報を送信するための手段を提供するステップと、
    前記ストレージ情報およびクライアント情報を用いて、前記第2のブレード・サーバにおいて、前記第1のブレード・サーバに関連したクライアント・コンピュータ専用部分の正確な状態を再構築するための手段を提供するステップと、
    前記クライアント・コンピュータと前記第2のブレード・サーバとの間のサービス通信リンクを確立するための手段を提供するためのステップと、
    を含む、サービス。
JP2006036807A 2005-02-18 2006-02-14 ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法 Pending JP2006228220A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/061,842 US20060190484A1 (en) 2005-02-18 2005-02-18 System and method for client reassignment in blade server

Publications (1)

Publication Number Publication Date
JP2006228220A true JP2006228220A (ja) 2006-08-31

Family

ID=36914067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006036807A Pending JP2006228220A (ja) 2005-02-18 2006-02-14 ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法

Country Status (5)

Country Link
US (1) US20060190484A1 (ja)
JP (1) JP2006228220A (ja)
KR (1) KR20060093019A (ja)
CN (1) CN1821967A (ja)
TW (1) TW200636501A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8161391B2 (en) 2007-06-12 2012-04-17 Hewlett-Packard Development Company, L.P. On-board input and management device for a computing system
US8458324B2 (en) 2009-08-25 2013-06-04 International Business Machines Corporation Dynamically balancing resources in a server farm
JP5299283B2 (ja) * 2007-11-19 2013-09-25 富士通株式会社 情報処理装置及び情報処理システム並びにそれらの制御方法
US9549034B2 (en) 2012-03-30 2017-01-17 Nec Corporation Information processing system

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4512192B2 (ja) * 2005-02-09 2010-07-28 株式会社日立製作所 輻輳制御装置、および、ネットワークの輻輳制御方法
US7423870B2 (en) * 2005-11-18 2008-09-09 International Business Machines Corporation Blade server assembly
KR100796445B1 (ko) * 2006-12-04 2008-01-22 텔코웨어 주식회사 이중화 시스템
US8214479B2 (en) * 2007-04-02 2012-07-03 Telefonaktiebolaget Lm Ericsson (Publ) Scalability and redundancy in an MSC-Server blade cluster
US9047190B2 (en) * 2007-04-10 2015-06-02 International Business Machines Corporation Intrusion protection for a client blade
US7917837B2 (en) * 2007-10-22 2011-03-29 International Business Machines Corporation Providing a blade center with additional video output capability via a backup blade center management module
CN101150413B (zh) * 2007-10-31 2010-06-02 中兴通讯股份有限公司 一种atca刀片服务器多机框级联系统及方法
US8306652B2 (en) * 2008-03-14 2012-11-06 International Business Machines Corporation Dual-band communication of management traffic in a blade server system
US8903989B2 (en) * 2008-04-28 2014-12-02 Hewlett-Packard Development Company, L.P. Adjustable server-transmission rates over fixed-speed backplane connections within a multi-server enclosure
US8032799B2 (en) * 2008-09-17 2011-10-04 International Business Machines Corporation System and method for managing server performance degradation in a virtual universe
US8108503B2 (en) * 2009-01-14 2012-01-31 International Business Machines Corporation Dynamic load balancing between chassis in a blade center
US8352710B2 (en) 2009-01-19 2013-01-08 International Business Machines Corporation Off-loading of processing from a processor blade to storage blades
CN101853185B (zh) * 2009-03-30 2015-07-08 华为技术有限公司 刀片服务器的业务调度方法和刀片服务器
US8972870B2 (en) * 2009-08-27 2015-03-03 International Business Machines Corporation Providing alternative representations of virtual content in a virtual universe
CN101980180A (zh) * 2010-10-12 2011-02-23 浪潮电子信息产业股份有限公司 一种刀片服务器bmc的ipmb地址的确定方法
US20160352823A1 (en) * 2015-05-26 2016-12-01 iDevices, LLC Systems and methods for server failover and load balancing
CN106331004A (zh) * 2015-06-25 2017-01-11 中兴通讯股份有限公司 服务器负载均衡的方法及装置
JP2023061596A (ja) * 2021-10-20 2023-05-02 株式会社日立製作所 情報処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222176A (ja) * 2001-01-25 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法
US20040100765A1 (en) * 2002-11-27 2004-05-27 Internationa Business Machines Corporation Server blade chassis with airflow bypass damper engaging upon blade removal
JP2004295334A (ja) * 2003-03-26 2004-10-21 Nippon Telegr & Teleph Corp <Ntt> 電子計算システム、サーバ装置およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103647B2 (en) * 1999-08-23 2006-09-05 Terraspring, Inc. Symbolic definition of a computer system
EP1381977A1 (en) * 2001-04-26 2004-01-21 Creekpath Systems, Inc. A system for global and local data resource management for service guarantees
US7133850B2 (en) * 2001-09-28 2006-11-07 Pitney Bowes Inc. Postage system having telephone answering and message retrieval capability
US7305429B2 (en) * 2002-06-10 2007-12-04 Utstarcom, Inc. Method and apparatus for global server load balancing
US7933983B2 (en) * 2002-12-17 2011-04-26 Hewlett-Packard Development Company, L.P. Method and system for performing load balancing across control planes in a data center

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222176A (ja) * 2001-01-25 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法
US20040100765A1 (en) * 2002-11-27 2004-05-27 Internationa Business Machines Corporation Server blade chassis with airflow bypass damper engaging upon blade removal
JP2004295334A (ja) * 2003-03-26 2004-10-21 Nippon Telegr & Teleph Corp <Ntt> 電子計算システム、サーバ装置およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8161391B2 (en) 2007-06-12 2012-04-17 Hewlett-Packard Development Company, L.P. On-board input and management device for a computing system
JP5299283B2 (ja) * 2007-11-19 2013-09-25 富士通株式会社 情報処理装置及び情報処理システム並びにそれらの制御方法
US8745436B2 (en) 2007-11-19 2014-06-03 Fujitsu Limited Information processing apparatus, information processing system, and control method therefor
US8458324B2 (en) 2009-08-25 2013-06-04 International Business Machines Corporation Dynamically balancing resources in a server farm
US9288147B2 (en) 2009-08-25 2016-03-15 International Business Machines Corporation Dynamically balancing resources in a server farm
US9549034B2 (en) 2012-03-30 2017-01-17 Nec Corporation Information processing system

Also Published As

Publication number Publication date
TW200636501A (en) 2006-10-16
KR20060093019A (ko) 2006-08-23
US20060190484A1 (en) 2006-08-24
CN1821967A (zh) 2006-08-23

Similar Documents

Publication Publication Date Title
JP2006228220A (ja) ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法
JP4015990B2 (ja) 電力供給装置、非中断電力供給方法、およびシステム
US6688965B1 (en) Invertible back flow damper for an air moving device
US6771499B2 (en) Server blade chassis with airflow bypass damper engaging upon blade removal
US8948000B2 (en) Switch fabric management
US7307837B2 (en) Method and apparatus for enforcing of power control in a blade center chassis
US7716315B2 (en) Enclosure configurable to perform in-band or out-of-band enclosure management
US9128682B2 (en) Independent removable computer rack power distribution system for high-density clustered computer system
KR100570129B1 (ko) 라이브 섀시에 삽입된 모듈에 전력을 자동적으로 분배하기위한 장치, 방법 및 기록 매체
US7487283B2 (en) Apparatus for bridging two or more data communications interfaces
US7194655B2 (en) Method and system for autonomously rebuilding a failed server and a computer system utilizing the same
JP2005038425A (ja) コンピュータ群の電力を管理するシステム
US20080043769A1 (en) Clustering system and system management architecture thereof
US20110317351A1 (en) Server drawer
US20080034067A1 (en) Configurable blade enclosure
US9780960B2 (en) Event notifications in a shared infrastructure environment
US20200133355A1 (en) System and method for recovery of sideband interfaces for controllers
US7809964B1 (en) Storage system assembly with distributed enclosure management
JP2016167213A (ja) ブレード装置およびブレード装置管理方法
US20060031521A1 (en) Method for early failure detection in a server system and a computer system utilizing the same
TW201528001A (zh) 全系統易管理化
TWI473086B (zh) 電腦系統
CN104461951A (zh) 动态管理物理和虚拟多路径i/o的方法及系统
US20040240180A1 (en) Apparatus employing heat sink
US20040233636A1 (en) Apparatus employing heat sink

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120104