JP2007122698A - 高可用性ブレード・ベース分散コンピューティング・システム - Google Patents

高可用性ブレード・ベース分散コンピューティング・システム Download PDF

Info

Publication number
JP2007122698A
JP2007122698A JP2006256984A JP2006256984A JP2007122698A JP 2007122698 A JP2007122698 A JP 2007122698A JP 2006256984 A JP2006256984 A JP 2006256984A JP 2006256984 A JP2006256984 A JP 2006256984A JP 2007122698 A JP2007122698 A JP 2007122698A
Authority
JP
Japan
Prior art keywords
blade
computing system
distributed computing
based distributed
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006256984A
Other languages
English (en)
Other versions
JP4562196B2 (ja
Inventor
Jayanta K Dey
ジャヤンタ・ケイ・デイ
Bharat Sharma
バラット・シャーマ
William E Snaman Jr
ウィリアム・イー・スネイマン,ジュニアー
George Surka
ジョージ・サーカ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Avid Technology Inc
Original Assignee
Avid Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Avid Technology Inc filed Critical Avid Technology Inc
Publication of JP2007122698A publication Critical patent/JP2007122698A/ja
Application granted granted Critical
Publication of JP4562196B2 publication Critical patent/JP4562196B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5038Address allocation for local use, e.g. in LAN or USB networks, or in a controller area network [CAN]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5061Pools of addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1433Saving, restoring, recovering or retrying at system level during software upgrading
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)
  • Stored Programmes (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】ブレード・ベースの分散コンピューティング・システムの高可用化。
【解決手段】ブレード・サーバはいくつかのコンピューティング・ブレード、およびスイッチ用の1つのブレードを統合する。冗長化したコンポーネントは、あるコンポーネントからそれに対する冗長コンポーネントへのオペレーションのフェールオーバーを許可する。高レベル・ネットワーク・アドレスは、各ブレード・サーバに対して連続した1セットのネットワーク・アドレスを用いて割り当てることができる。高レベル・ネットワーク・アドレスの範囲は、各ブレード・サーバごとに割り当てる。各ブレード・サーバは、高レベル・ネットワーク・アドレスを自身のブレードに割り当てる。1つ以上のブレード・サーバの有する様々なコンポーネントの間に構成情報を分散することにより、コンフィギュレーション・マネージャとして動作する任意のコンポーネントが構成情報にアクセスできる。
【選択図】図3

Description

分散コンピューティング・アーキテクチャは、大規模計算のオペレーション、およびデータ格納や抽出のオペレーションを多くの異なるコンピュータが実行するのを可能にし、これにより、これらのオペレーションを実行するのに求められる時間が短縮する。分散コンピューティング・アーキテクチャは、実行するオペレーションが複雑であるアプリケーション、又は大人数のユーザが共有資源を利用して多くのトランザクションを実行するようなアプリケーション向けに使用される。
分散システムの実装コストやメンテナンス・コストを削減するために、ブレードと通常呼ばれる複数の低価格サーバ装置が、筐体に共にパッケージされて、ブレード・サーバと通常呼ばれるものを提供する。装置の占有スペースを最小化することにより、また複数の装置で電源を共有し、かつ別のデバイスも共有することにより、コストは削減される。各ブレードは、低コストで、現場での交換が可能なコンポーネントとなるよう設計される。
特に高帯域幅でリアルタイムなメディア・データを多数のユーザが共有する共有ストレージに対しては、高可用性で高拡張性があるブレード・サーバを使用して分散コンピューティング・アーキテクチャを構築することが望ましい。しかしながら、低価格で交換可能なコンポーネントでシステムにおいて構成された高可用性を提供することには、課題がある。
発明を解決するための手段
概要
ストレージ・ネットワーク・システムのような応用のためのブレード・ベース分散コンピューティング・システムは高可用性を実現する。ブレード・サーバは、種々のコンピューティング・ブレードと、このコンピューティング・ブレードに接続するスイッチ用のブレードを統合する。冗長化したコンポーネントは、あるコンポーネントからその冗長コンポーネントへフェールオーバーする動作を可能にする。
高レベル・ネットワーク・アドレスを各ブレードに割り当てるというような、1つまたはそれ以上のブレード・サーバの構成は、システム内の1ブレード上でのコンフィギュレーション・マネージャと呼ばれる集中処理によって実施することができる。高レベル・ネットワーク・アドレスは各ブレード・サーバに対する一連のネットワーク・アドレスのセットを用いて割り当てることができる。ある範囲の高レベル・ネットワーク・アドレスが各ブレード・サーバに割り当てられる。各ブレード・サーバは各々のブレードに対して順に高レベル・ネットワーク・アドレスを割り当てる。
各ブレードに対するこの高レベル・ネットワーク・アドレスは、その筐体の識別子やスロットの識別子にマッピングすることができる。また構成情報には、ソフトウェアのバージョン情報やソフトウェアのアップグレードを含むことができる。1つまたはそれ以上のブレード・サーバにおける様々なコンポーネントの間で構成情報を分散することにより、コンフィギュレーション・マネージャとして動作する任意のコンポーネントは構成情報にアクセスすることができる。
各ブレード・サーバはまた、自身のブレードが動作中かどうかを決定するために監視をして、ステータス情報の通信およびリカバリ作業の一方もしくは双方を行うことができる。各ブレードで利用できるステータス情報と構成情報、および各ブレードに対するネットワーク・アドレスとその物理的な位置(筐体識別子やスロット識別子)とのマッピングについて、この情報はグラフィカル・ユーザ・インターフェイスにて表示することができる。このようなインターフェイスは、ブレード・サーバの視覚表示を含むことができ、ユーザが各ブレード・サーバや各ブレードについての様々な情報を見るために操作できる。
このようなブレード・ベース・システムにおけるアプリケーションは、様々なクライアント・アプリケーションによりアクセスされる高帯域幅のリアルタイムなメディア・データのための共有ストレージ向けである。このようなアプリケーションにおいて、データはセグメントに分割され、非均一なパターンにしたがってストレージ・ブレードの中で分散される。
このようなシステムにおいては、クライアント・アプリケーションとブレード・サーバとの間でサービスの品質管理を行うことが望ましい。各ブレード・サーバのスイッチには、クライアントに要求される帯域幅に従って、クライアントに対するポート向けの十分な帯域幅を割り当てる。このクライアントは、カタログ・マネージャを通知することで、このストレージ・システムに対する自身の要求帯域を指定することができる。このカタログ・マネージャは、異なるクライアントの要求帯域のスイッチを通告できる。あるクライアントは、定期的にその帯域要求をアップデートすることができる。
発明の詳細な説明
図1は、分散コンピュータ・システム100の例を示している。このコンピュータ・システム100は、複数のコンピューティング・ユニット102を含む。このコンピュータ・システム100には、任意の数のコンピューティング・ユニット102があり得る。このコンピューティング・ユニット100は、コンピュータ・ネットワーク106を通じて相互に接続されており、また複数のクライアント・コンピュータ104にも同様に相互接続されている。
各コンピューティング・ユニット102は、ディスクのような不揮発性のコンピュータで読み出し可能なメディアを備えた装置であり、そこにデータを格納することができる。このコンピューティング・ユニットはまた、より高速であり、通常は揮発性であるメモリを有しており、データは不揮発性コンピュータ読み出し可能メディアからこのメモリに読み出される。各コンピューティング・ユニットはまた、別のコンピュータ・ユニットが有する処理ユニットとは独立して、自身の処理ユニットを有しており、例えばWindows XP Embedded(登録商標)、Linux(登録商標)およびVxWorks(登録商標)オペレーティング・システムのような組込みオペレーティング・システムのような、それ自身のオペレーティング・システムおよびアプリケーション・プログラムを動作させることができる。例えばコンピューティング・ユニットは、サーバ・コンピュータとして実装され、そのオペレーティング・システムにおける1つまたはそれ以上のデータ・ファイル中の、不揮発性コンピュータ読み出し可能メディアに格納されたデータへのアクセスであって、リード・アクセスおよびライト・アクセスを含むがそれに限定されることないようなアクセスの要求に応答する。コンピューティング・ユニットは、データ格納およびデータ抽出に加えて、様々なデータ処理オペレーションのような他のオペレーションも実行することができる。
クライアント・コンピュータ104はまた、コンピュータ・ネットワーク106上のコンピューティング・ユニット102と通信するコンピュータ・システムである。各クライアント・コンピュータは、汎用コンピュータで実現することができ、それ自身の不揮発性メモリや一時メモリを有し、またオペレーティング・システムやアプリケーション・プログラムを動作させるためのプロセッサを有する。各クライアント・コンピュータ104は、異なるセットのアプリケーション・プログラムおよびオペレーティング・システムの一方もしくは双方を実行することができる。
図1に示すこのシステムの一応用例として、高帯域幅のメディア・データのための分散共有ファイルシステムとして使用するものをこれから記述する。このような応用は、米国特許6,785,768により詳細に記述されている。コンピューティング・ユニット102は、ネットワーク106を介してクライアント・コンピュータ104とデータを送受するためのサーバとして動作させることができる。クライアント・コンピュータ104は、ストレージ・ユニット102にデータを格納するためにデジタル・ソースまたはアナログ・ソースから受信したデータを収集するシステムを含むことができる。クライアント・コンピュータ104はまた、このストレージ・ユニットからデータを読み出すシステムも含み、例えば、オーディオ編集やビデオ編集を含むがこれに限定されることのない、マルチメディア・プログラムをオーサリング、処理、または再生するためのシステムというシステムである。他のクライアント・コンピュータ104は、様々な失敗復旧タスクを実行することができる。分散ファイルシステムに対して、1つまたはそれ以上のクライアント・コンピュータを使用して、1つまたはそれ以上のカタログ・マネージャ108を実装することができる。カタログ・マネージャは、クライアント・コンピュータ104からアクセス可能なデータベースであり、コンピューティング・ユニット102で利用できるデータに関する情報を維持する。この実施例は、1997年10月23日付けのPCTPublication WO97/39411に示されているニュース・ブロードキャスティング・システムを実装するのに用いることができる。
このようなシステムにおけるユニットのうちの1つのネットワーク・インターフェイスにより生じる、データ転送要求とその要求の実転送との間の待ち時間は、参照によって本明細書に引用される米国仮特許出願番号60/748,838に基づき、___に出願されたMitch Kuninsky氏による米国特許出願番号___「分散共有ストレージ・システムにおける伝送要求マネージメント」に記載されている技術を用いて削減することができる。
このような分散共有ファイルシステムの実施例において、各ファイルのデータはセグメントに分割される。例えばセグメントのコピーのような、各セグメントに対する冗長情報が決定される。各セグメントとその冗長情報は、異なるコンピューティング・ユニットのストレージに格納される。セグメントおよびその冗長情報がそのコンピューティング・ユニットの任意の順序に従って格納されているコンピューティング・ユニットの選択は、その分散のパターンが、あるファイルと次のファイル、およびそのファイルとその冗長情報と異なる場合は、非連続な分散を提供する。例えばこの順序は、ランダムでも擬似ランダムでも準ランダムでも、または順列のような確定した順序形態でもよい。データのセグメントのコピーの分散の一例を図1に示す。図1において、w、x、yおよびzとしてラベル付けされた4つのコンピューティング・ユニット102は1,2,3および4としてラベル付けされた4つのセグメントに分割されたデータを格納する。セグメントおよびそれらのコピーを分散する一例を示しており、ここでは、セグメント1と3はコンピューティング・ユニットwに格納され、セグメント3と2はコンピューティング・ユニットxに格納され、セグメント4と1はコンピューティング・ユニットyに格納され、セグメント2と4はコンピューティング・ユニットzに格納される。このような分散ファイルシステムの実現に関する更なる詳細は、参照によって本明細書に引用される米国特許6,785,768に記述されている。
図1に示したコンピューティング・ユニット102およびコンピュータ・ネットワーク106は、1つまたはそれ以上のブレード・サーバを用いて実装することができる。ブレード・サーバは、(ブレードと呼ばれる)複数のサーバ・モジュールを一つの筐体に収容するサーバ・アーキテクチャである。このため、各コンピューティング・ユニットはブレードを用いて実装される。この筐体は冗長化した電源およびネットワーク・スイッチを提供し、各ブレードは自身のCPU、メモリ、ハードディスクおよびネットワーク・インターフェイスを有し、(ファイルシステムを含む)自身のオペレーティング・システムやアプリケーション・プログラムを動作することができる。このブレード・サーバはまた、そのブレードのうちの1つの上に少なくとも1つのスイッチを含み、このスイッチに対して他のブレードが接続され、そして1つまたはそれ以上のクライアント・コンピュータを接続することができる。このスイッチ・ブレードの有するCPUは、スイッチを構成し、監視することができる。
図2を参照して、1つまたはそれ以上のブレード・サーバを用いて実現したサーバ・システム200を記述する。このサーバ・システム200は1つまたはそれ以上のブレード・サーバ202を含み、各ブレード・サーバは1セットのブレード206を収容した筐体(図示せず)を備えている。各ブレード206は、プロセッサ、ストレージ、およびネットワーク・アドレスを備えたネットワーク・インターフェイス208を有している。この筐体の少なくとも1つのスロットは、スイッチ・ブレード210と呼ばれるスイッチとして動作するブレードのために予約されている。ある実装において、1つのブレードはIntel Xeon(登録商標)プロセッサのような1つの従来型のプロセッサ、Windows XP Embedded(登録商標)オペレーティング・システムのような1つのオペレーティング・システム、およびディスク・ベースのストレージを有している。この筐体は、すべてのブレードに対する冗長化した電源(図示せず)、および少なくとも1つのスイッチ・ブレード210を含んでいる。このスイッチ・ブレードは、冗長化することもできる。各ブレードは、そのネットワーク・インターフェイスを介してこの筐体のスイッチ・ブレード210に接続する。冗長化したスイッチ・ブレードを提供する場合、各ブレードはまた、冗長化したネットワークを用いてこの冗長化したスイッチ・ブレードに接続することができる。クライアントは、ブレード・サーバに対してこのスイッチ・ブレード210を介して直接的に接続するか、他のネットワーク・インフラストラクチャおよび他のネットワーク接続機器を介して間接的に接続する。ブレード・サーバ202は、それらの夫々のスイッチ間で接続したネットワーク212を有することで相互に接続することもできる。このスイッチは、相互接続した際に1つの大きなスイッチとして動作するように構成することができる。
図3は冗長化したコンポーネントを有するブレード302を示している。このブレード・サーバは、1セットのブレード306を収容した筐体(図示せず)を備えている。各ブレード306は、プロセッサ、ストレージ、第1のネットワーク・アドレスを備えた第1のネットワーク・インターフェイス308、および第2のネットワーク・アドレスを備えた第2のネットワーク・インターフェイス309を有している。この筐体は、すべてのブレードに対する冗長化した電源(図示せず)および冗長化したスイッチ・ブレード310および311を含んでいる。各ブレードは、その第1ネットワーク・インターフェイス308を介してスイッチ310に接続し、またその第2ネットワーク・インターフェイス309を介してスイッチ311に接続する。この冗長ネットワークは、下記に詳細を記述しているとおり、失敗したコンポーネントからバックアップ・コンポーネントへのフェールオーバーを許可することで、より高いシステムの可用性を提供する。この冗長スイッチ・ブレードは、冗長化したシリアル・リンク314又はイーサネット(登録商標)・リンクで相互接続することができる。
各筐体は、このサーバ・システムにおける筐体の間で一意の識別子を有する。この筐体識別子は、恒久的な識別子となり得、製造される際に割り当てられる。筐体内において、筐体内での各物理的な位置は、スロット識別子と呼ばれる筐体位置に対応付けされている。この筐体位置は、例えば筐体に組み込まれたブレードが受信する、筐体内の各スロットに対するハードワイヤード信号で規定することができる。このように、各ブレードはそのスロット識別子および筐体識別子によって一意に特定することができる。
ブレードは一般的に、ディスプレイやキーボードを有さないために、そのブレードのステータスに関する情報の通信は一般的にネットワークを介して行われる。しかしながら、ブレードが適切に機能していなければ、このブレードからの通信は生じない。たとえ通信が生じたとしても、ダイナミック・ホスト・コンフィグレーション・プロトコル(DHCP)のような従来のネットワーク・アドレス割当てプロトコルを用いて、そのネットワーク・アドレスのみが付与されたブレードの物理位置を特定するのは難しい。このような場合のブレードを探し出す唯一の方法はその物理座標を介する方法であり、この座標は、ブレードを収容した筐体の(同じシステムにおける他の筐体と相関する)位置、およびその筐体におけるブレードのスロット識別子との組合せである。システム開発、システム導入、サービス・インテグレーションおよび他の活動の間でブレードの位置を探し出すこともまた重要である。スイッチ・ブレードとコンピュート・ブレードの両方共が、筐体内に一意のスロット識別子を有している。
従って、好ましくはこのネットワークは、(コンピューティング・ユニット対して、またはスイッチに対してであろうと)ブレードに対するスロット識別子および筐体識別子がそのネットワーク・アドレスから決定できるような方法で構成される。このような設定は、筐体内のすべてのブレードが別の筐体のブレードに割り当てられるアドレス・レンジと重複することのないアドレス・レンジ内でアドレスを割り当てられるように実装することができる。これらのネットワーク・アドレスは、連続させることができ、またスロット識別子に従って連続して割り当てることができる。高可用性および自動構成可能性を提供するために、好ましくはこの構成は筐体または筐体内ブレードのスタートアップ時、リブート時、リプレイス時、追加時、アップグレード時に自動的に実施される。スロット識別子と筐体識別子の各組、ネットワーク・アドレス(一般的にはIPアドレス)、を含んだ対応する構成情報、および装置が構成されてその装置でサービスが利用可能となる時間などのような任意の他の情報に対する追跡をするテーブルが維持される。別々のテーブルは、(他の筐体との相関する)筐体位置と筐体識別子とを関連付ける。例えばグローバル・ポジショニング・システム(GPS)のように、位置追跡メカニズムをこの筐体に組み込むことにより、手動もしくは自動でこの関連付けを行うことが可能である。この構成情報をブレードの不揮発性メモリに格納することで、ブレードへの電力の損失に耐えることができる。この構成情報を各ブレードに格納することで任意のブレードがコンフィギュレーション・マネージャとして動作し、任意のコンフィギュレーション・マネージャが構成情報にアクセスすることが可能になる。
図4に、どのようにしてこのような構成が実施されるかを記載する。装置の構成は、装置が起動してそのファームウェア、オペレーティング・システム、および関連したアプリケーションをインストールした後に行うことができる。それからこのサーバ・ブレード装置は、2つのスイッチ・ブレードがトラップした2つの低レベル固定ネットワーク・アドレス(例えばMAXアドレス)に対して、そのスロット識別子を含んだネットワーク・パケット(例えば、イーサネット(登録商標)・レイヤー・パケット)を送出し始める(400)。このスイッチは、これらのメッセージが他の接続された筐体に届くことがないようにプログラムすることができる。スイッチ・ブレードの1つは、高レベル・ネットワーク・アドレス(例えばIPアドレス)をブレードに提供することにより応答を行う(402)。この高レベル・ネットワーク・アドレスは、スロット識別子に基づき、そしてその筐体に割り当てられた1ブロックのネットワーク・アドレスから獲得することができる。好ましくは、各ブレードにはそのスロット識別子に従って、連続したネットワーク・アドレスを割り当てる。ブレードはそれから、その高レベル(例えばIP)ネットワーク・アドレスをスイッチ・ブレードのCPUが規定したアドレスに設定する。
マルチ筐体インストールにおける構成を開始するために、ユーザは筐体の中から任意の1つを選択し、ネットワーク・アドレス・ブロックや時間等を含む完全インストールの構成情報をスイッチ・ブレードの中の1つに提供する。そこでこの選択したスイッチ・ブレードは、コンフィギュレーション・マネージャにこの構成情報、およびスイッチ・ブレードのうちの1つで実行されるプロセスを渡す。スイッチ・ブレードのうちの1つは、コンフィギュレーション・マネージャとして選択される。任意の適当な技術が用いられてコンフィギュレーション・マネージャとして装置を選択する。例えば、各スイッチ・ブレードがスタートアップするとすぐに、その筐体識別子を含む低レベル・ネットワーク・メッセージをこのシステムの別のスイッチ・ブレードに送出することができる。最も低い筐体識別子を有するスイッチ・ブレードをこのコンフィギュレーション・マネージャとして選択することもできる。仮にこのコンフィギュレーション・マネージャが動作しているブレードを取り除いた場合(これは現場交換可能ユニットであるため可能である)、別のスイッチ・ブレードがコンフィギュレーション・マネージャの役割を引き継ぐ。このことは、動作中であることを示すメッセージを別の筐体のスイッチ・ブレードに対してコンフィギュレーション・マネージャに一時的に送信させることで遂行される。ある実施例において、このコンフィギュレーション・マネージャは、外部のユーザ入力を介して手動で定めることができる。別のスイッチ・ブレードが、コンフィギュレーション・マネージャは動作中でないと判断したら、もう1つのスイッチ・ブレードがコンフィギュレーション・マネージャの動作を引き継ぐ。
コンフィギュレーション・マネージャは、このシステムにおけるすべての筐体の筐体識別子をその筐体のスイッチ・ブレードから受信することができる。すべてのスイッチ・ブレードは、ユニキャスト・プロトコルまたはマルチキャスト・プロトコルを介して相互に通信することができる。その後、このコンフィギュレーション・マネージャは、テーブルに筐体識別子を整理し、より大きなアドレス・ブロックからネットワーク・アドレスの範囲を各筐体に割り当てる。その後にこの情報は、各筐体におけるすべてのスイッチ・ブレードに送り返すことができる。筐体のスイッチ・ブレードは、筐体に割り当てたネットワーク・アドレスの範囲を受信し、ネットワーク・アドレスをこの筐体の各ブレードに割り当てる。コンフィギュレーション・マネージャは、各スイッチ・ブレード、および任意的には各筐体の各ブレードがこのシステムの構成情報のコピーを有することを保証する。
各筐体はまた、筐体マネージャを有することができ、これはブレードのステータス、およびブレード上で動作するアプリケーションを監視するアプリケーションである。装置全体において、全ての筐体に筐体マネージャがあるが、コンフィギュレーション・マネージャはただ1つしかない。これら両方の機能は、スイッチ・ブレードのCPUに常駐する。筐体マネージャが実行するプロセスは、これから図5と関連付けて説明する。各アプリケーションおよび装置は、定期的に監視されており、この筐体マネージャにステータス・メッセージを送信する。これらのステータス・メッセージは、筐体マネージャが受信する(500)。この筐体マネージャは、最後のメッセージを受信した時間のような各装置のステータスに関する情報を維持し、またメッセージを受信した時にこのステータスをアップデートする(502)。監視されている各装置もしくはアプリケーションは、定期的にステータス・メッセージを送信することが求められる。ステータス・メッセージの受信予定時間にステータス・メッセージを受信しなければ、すなわちタイムアウトが発生したら(504)、この装置もしくはアプリケーションに対するリカバリ手続を開始する(506)。
このリカバリ手続のタイプおよび複雑さは、監視されている装置もしくはアプリケーションに依存する。例えば、あるアプリケーションが応答しなければ、筐体マネージャはそのアプリケーションを実行しているブレードのオペレーティング・システムに対してそのアプリケーションのプロセスを終了し再起動するよう指示することができる。失敗したオペレーティング・システムは、そのブレードを再起動し得る。対応する冗長化した装置を備えている装置が失敗したら、その冗長装置を起動することができる。ハードウェア装置の失敗を検知したら、システム管理者のアプリケーションにその失敗を通知することができる。
この筐体マネージャの動作に関する特別の例として、図6はコンピューティング・ユニットが失敗した時に、どのようにシステムがリカバリできるかを示したフロー・チャートである。まず、この筐体マネージャは、ステータス・メッセージを監視することによりコンピューティング・ユニット・ブレードが失敗したかどうかを検知する(600)。このような失敗を検知したらすぐに、筐体マネージャは、このコンピューティング・ユニット・ブレード(もしくはその関連アプリケーション)に再起動を指示する(602)。(604)で決定するようにこの再起動がうまくいかなければ、および(606)で決定するように再起動試行数が限界値(例えば、3)に達していなければ、再試行が実施される(602)。何回か試行がうまくいかなければ、そのコンピューティング・ユニットの失敗状態が通信される(608)。再起動がうまくいけば、その後この筐体マネージャは通常のオペレーションを再開する。
コンピューティング・ユニット・ブレードが失敗し、交換する必要がある場合は、新しいコンピューティング・エレメントが追加される際に、筐体内でその構成を行う。コンピューティング・ブレード・ユニットを追加する際は、交換したユニットとネットワーク・アドレスを同一に設定する。それがネットワーク・アドレスを取得するプロセスは、以前に記述してある。この再起動したコンピューティング・ブレードによって、その関連するアプリケーションおよび装置は、ステータス・メッセージをスイッチ・ブレード上の筐体マネージャへ送信することを開始できる。
スイッチ・ブレードの失敗や取替を管理するためのオペレーションについて、これから説明する。ブレード・サーバのスイッチ・ブレードが失敗することによって生じる、サーバ・オペレーションの突発的失敗に対する潜在リスクは、冗長化したスイッチ・ブレードを提供することによって削減される。冗長スイッチ・ブレードを用いることにより、スイッチ・ブレードの失敗に関わらず各コンピューティング・ブレード・サーバへのネットワーク接続性およびサービス持続性が保証される。通常オペレーションの間、複数のスイッチ・ブレードのうちの一つが、アクティブな筐体マネージャとして指定されるのに対して、他のスイッチ・ブレードはパッシブな筐体マネージャとして指定される。両方のスイッチ・ブレードは、スイッチとしてなお動作しているが、その一つだけがアクティブな筐体マネージャである。筐体内のスイッチは、冗長化したシリアル又はイーサネット(登録商標)制御経路を介して接続し、相互にインストール構成情報を交換するのと共に、相互の動作を監視する。ブレード・サーバにおけるこのスイッチ内の一つは、例えば最新の構成データを有していれば、もしくは、最も低いスロット識別子を有していれば、アクティブ・スイッチの役割を担うことが前提となる。スイッチ・ブレードを交換した際には、新しいスイッチは、通常は最新の構成データを有していない。そのような場合は、冗長スイッチ・ネットワークを構成する別のスイッチ・ブレードと同様に、筐体マネージャからその構成データを受信する。
通常オペレーションの間、この筐体マネージャは、一つのスイッチ・ブレード上のCPUで動作し、他のスイッチ・ブレード上のパッシブ筐体マネージャからのステータス・メッセージを監視する。パッシブ筐体マネージャの失敗を検知したら、このアクティブ筐体マネージャはそのスイッチ・ブレードの再起動を試みるか、もしくはその失敗状態を通信することができる。
通常オペレーションの間はまた、パッシブ筐体マネージャは、アクティブ筐体マネージャのスイッチ・ブレードからのステータス・メッセージを監視する。図7は、アクティブ筐体マネージャのスイッチ・ブレードが失敗した時に、どのようにシステムがリカバリできるかを説明したフローチャートである。パッシブ筐体マネージャは、指定された時間の期間内にステータス・メッセージを受信しない際に、アクティブ筐体マネージャの失敗を検知する(700)。この2つのスイッチ・ブレード間の冗長シリアル・リンク接続は、検知した失敗がリンクの失敗である可能性を減らすことを意図する。その後パッシブ筐体マネージャは、アクティブ筐体マネージャとしての役割を引き受ける(702)。新アクティブ筐体マネージャはまた、再起動したスイッチもしくは交換スイッチがパッシブ・モードで筐体マネージャ・サービスを開始することを保証する(704)。(706)で決まるように、再起動がうまくいけば、その時はフェールオーバーが完了する。そうでなければ、(708)で決まるように、閾値に到達するまでもとのアクティブ・スイッチの再起動を何回か試行する。再起動がうまくいかなければ、そのスイッチの失敗状態が通信され(710)、そのスイッチ・ブレードを交換することになる。
図8はスイッチ・ブレードが追加される時にシステムがどのようにリカバリするかを説明したフローチャートである。スイッチ・ブレードが追加される場合、ブレード・サーバにおける他のスイッチ・ブレードの筐体マネージャが現在アクティブ状態にある。このため、この追加されるスイッチ・ブレードは、パッシブ状態でその筐体マネージャ・サービスを開始することになる。追加されたスイッチは起動後、自身のMACアドレス、筐体識別子および筐体位置を用いてブロードキャスト・イーサネット(登録商標)・メッセージを送信する(800)。他のスイッチ・ブレードは、このメッセージを受信し、ネットワーク・アドレスを含んだ自身の情報で応答する(802)。その後パッシブ筐体マネージャは、自身のステータス・メッセージのアクティブ筐体マネージャへの送信を開始する(804)。このパッシブ筐体マネージャはまた、アクティブ筐体マネージャの監視を開始する(806)。
高可用性を提供することができる別の領域は、ブレードのソフトウェアのアップグレードにおける領域である。各ブレード(コンピューティング・ブレード・ユニットでもスイッチ・ブレードでも)は、不揮発性メモリ内にブート・ローダ、オペレーティング・システムおよびロードされるアプリケーションを含むファームウェアを識別するための最新で有効な構成テーブルを維持する。このテーブルのシャドウ・コピーが維持される。さらに、このファームウェア、オペレーティング・システムおよびアプリケーションのシャドウ・コピーも維持される。
図9は、ソフトウェアがシステム内でどのようにアップグレードされるかを示したフローチャートである。ネットワークを介してソフトウェア・アップグレードをブレードに供給することができる。ソフトウェア・アップグレードを実施する時、アップグレードする部分のシャドウもしくは第2コピー、例えばファームウェア、オペレーティング・システムおよびアプリケーションをアップデートする900。ブレードはシャドウ・コピーの構成テーブルに従って起動するよう指示をうける902。失敗が発生したら、例えば2のような回数、再起動を試行する904。ソフトウェア・アップグレードが906に示されているように適切に起動することができなければ、その後ブレードは、現在の有効な構成テーブルに戻る。そうでなければ、そのソフトウェアのシャドウ・コピーが908で示されるように現在の有効な構成テーブルになる。
これらのオペレーションが示すように、各ブレード・サーバは自身のブレードを監視してステータス情報の通信およびリカバリ・オペレーションの開始の一方または双方を実施するために動作可能か否かを決定する。各ブレードで使用可能なステータス情報および構成情報と共に、各ブレードのネットワーク・アドレスの物理位置(筐体識別子およびスロット識別子)へのマップと共に、この情報はグラフィカル・ユーザ・インターフェイスで表示することができる。このようなインターフェイスは、ブレード・サーバのグラフィック表示を含むことができ、ユーザは各ブレード・サーバや各ブレードの様々な情報に対して処理を行う。
上述のシステムは、高可用性で、ブレード・ベースで分散される共有ファイルシステムであって、ビデオ・データやオーディオ・データのような高帯域幅の一時的なメディア・データ、つまり大人数のユーザがいる環境でキャプチャ、編集、プレイバックするデータをサポートするシステムを実装するのに特に役立つ。ネットワークのトポロジーは、そのネットワーク・アドレスから得ることができるので、この情報は、ブレード・サーバを分割使用して様々な性能強化を施すのに使用することができる。例えば、ネットワーク・トポロジーおよびネットワーク・ボトルネックに基づいて、低解像度マテリアルから高解像度マテリアルを分離することができ、次に、異なるクライアントからネットワーク・トラフィックをそのネットワーク上の異なる部分へ分離することになる。このようなアプリケーションにおいて、データはセグメントに分割され、各コンテンツ・タイプで指定されるストレージ・ブレード集合内の均一でないパターンに従って、ストレージ・ブレード内で分散されることになる。
このようなシステムにおいて、クライアント・アプリケーションとブレード・サーバ間のサービス品質を管理することが望ましい。各ブレード・サーバのスイッチは、クライアントが要求する帯域幅に対応して、クライアントのポートに対して十分な帯域、もしくはバッファリングを割り当てる。クライアントは、カタログ・マネージャを通知することで、このストレージ・システムに対する帯域幅要求またはバースト要求を示すことになる。このカタログ・マネージャは、異なるクライアントの帯域幅要求またはバースト要求をスイッチに通知することができる。クライアントは、定期的にその帯域幅要求またはバースト要求をアップデートできる。
例示的な実施例をここに示したが、当業者には明らかなように、上記は単に例示に過ぎず限定されるものではなく、例示のためにのみ提示されている。多くの改変や他の実施例は、技術分野における当業者の範囲に含まれ、そして本発明の範囲に包含されるとみなされるべきである。
分散コンピューティング・システムを例示したブロック図である。 スイッチにより相互接続されたブレードを有するブレード・サーバを例示したブロック図である。 冗長化したスイッチおよびネットワークを有するブレード・サーバを例示したブロック図である。 このシステムをどのように設定するかを記述したフローチャートである。 このシステムのステータスをどのように監視するかを記述したフローチャートである。 コンピューティング・ユニット・ブレードの失敗時に、このシステムがどのように復旧するかを記述したフローチャートである。 スイッチ・ブレードの失敗時に、このシステムがどのように復旧するかを記述したフローチャートである。 スイッチ・ブレードの追加時に、このシステムがどのように復旧するかを記述したフローチャートである。 このシステムにおいて、ソフトウェアをどのようにアップグレードするかを記述したフローチャートである。

Claims (19)

  1. ブレード・ベース分散コンピューティング・システムであって、
    複数のコンピューティング・ブレードおよび1つまたはそれ以上のスイッチ・ブレードを含むブレード・サーバにおいて、各コンピューティング・ブレードは前記1つまたはそれ以上のスイッチ・ブレードに接続したネットワーク・インターフェイスを含む、
    ことを特徴とする、ブレード・ベース分散コンピューティング・システム。
  2. 請求項1に記載のブレード・ベース分散コンピューティング・システムにおいて、1つのスイッチ・ブレードは前記ブレード・サーバにおいて各ブレードを構成するためのコンフィギュレーション・マネージャを含む、ブレード・ベース分散コンピューティング・システム。
  3. 請求項2に記載のブレード・ベース分散コンピューティング・システムにおいて、前記コンフィギュレーション・マネージャは、前記ブレード・サーバの各ブレードに対して複数のネットワーク・アドレスを設定する、ブレード・ベース分散コンピューティング・システム。
  4. 請求項1に記載のブレード・ベース分散コンピューティング・システムにおいて、各ブレードは、前記ブレード・サーバに割り当てた複数のネットワーク・アドレスの範囲から選択した高レベル・ネットワーク・アドレスを有する、ブレード・ベース分散コンピューティング・システム。
  5. 請求項4に記載のブレード・ベース分散コンピューティング・システムにおいて、前記ブレード・サーバは、各ブレードの前記ネットワーク・アドレスを前記ブレード・サーバ内の各ブレードの位置にマップした情報を管理する、ブレード・ベース分散コンピューティング・システム。
  6. 請求項1に記載のブレード・ベース分散コンピューティング・システムにおいて、さらに、前記ブレード・サーバにおける各ブレードのステータスを監視する筐体マネージャを備えている、ブレード・ベース分散コンピューティング・システム。
  7. 請求項1に記載のブレード・ベース分散コンピューティング・システムにおいて、前記筐体マネージャは、失敗するブレードに対してリカバリ・オペレーションを起動する、ブレード・ベース分散コンピューティング・システム。
  8. 請求項7に記載のブレード・ベース分散コンピューティング・システムにおいて、さらに、ユーザが操作して各ブレード・サーバおよび各ブレードに関する様々な情報を閲覧する前記ブレード・サーバのグラフィック表示を含んでいるグラフィカル・ユーザ・インターフェイスを提供するための手段を備えている、ブレード・ベース分散コンピューティング・システム。
  9. 請求項1に記載のブレード・ベース分散コンピューティング・システムにおいて、さらに、
    複数のクライアントであって、前記1つまたはそれ以上のスイッチ・ブレードに接続するネットワークを介して前記ブレード・サーバに接続する複数のクライアントを含み、
    1つのスイッチ・ブレードが各クライアントへの帯域幅の要求に従って前記各クライアントに対する帯域幅を割り当てる手段を含むこと、
    を特徴とする、ブレード・ベース分散コンピューティング・システム。
  10. ブレード・ベース分散コンピューティング・システムであって、
    第1の複数のコンピューティング・ブレードおよび第1のセットの1つまたはそれ以上のスイッチ・ブレードを含んでいる第1のブレード・サーバであって、各コンピューティング・ブレードは、前記1つまたはそれ以上のスイッチ・ブレードに接続するネットワーク・インターフェイスを含む、第1のブレード・サーバと、
    第2の複数のコンピューティング・ブレードおよび第2のセットの1つまたはそれ以上のスイッチ・ブレードを含んでいる第2のブレード・サーバであって、各コンピューティング・ブレードは、前記1つまたはそれ以上のスイッチ・ブレードに接続するネットワーク・インターフェイスを含む、第2のブレード・サーバと、
    前記第1のセットの1つまたはそれ以上のスイッチ・ブレードを前記第2セットの1つまたはそれ以上のスイッチ・ブレードに接続するネットワークと、から成り、
    前記第1のセットおよび第2セットの1つまたはそれ以上のスイッチ・ブレードからの前記スイッチ・ブレードの1つがコンフィギュレーション・マネージャを含むこと、
    を特徴とする、ブレード・ベース分散コンピューティング・システム。
  11. 請求項10に記載のブレード・ベース分散コンピューティング・システムにおいて、前記第1のセットの1つまたはそれ以上のスイッチ・ブレードおよび前記第2のセットの1つまたはそれ以上のブレード・サーバから選択されたスイッチ・ブレードは、前記第1および第2ブレード・サーバを構成するためのコンフィギュレーション・マネージャを含む、ブレード・ベース分散コンピューティング・システム。
  12. 請求項11に記載のブレード・ベース分散コンピューティング・システムにおいて、前記コンフィギュレーション・マネージャは、各ブレード・サーバに対して複数のネットワーク・アドレスの範囲を設定する、ブレード・ベース分散コンピューティング・システム。
  13. 請求項12に記載のブレード・ベース分散コンピューティング・システムにおいて、各ブレードは、前記ブレード・サーバに割り当てた複数の前記ネットワーク・アドレス範囲から選択された高レベル・ネットワーク・アドレスを有する、ブレード・ベース分散コンピューティング・システム。
  14. 請求項13に記載のブレード・ベース分散コンピューティング・システムにおいて、前記ブレード・サーバは、各ブレードの前記ネットワーク・アドレスを前記ブレード・サーバ内の各ブレードの位置にマップした情報を管理する、ブレード・ベース分散コンピューティング・システム。
  15. 請求項10に記載のブレード・ベース分散コンピューティング・システムにおいて、さらに、前記ブレード・サーバにおける各ブレードのステータスを監視する筐体マネージャを備えている、ブレード・ベース分散コンピューティング・システム。
  16. 請求項15に記載のブレード・ベース分散コンピューティング・システムにおいて、前記筐体マネージャは、失敗するブレードに対してリカバリ・オペレーションを起動する、ブレード・ベース分散コンピューティング・システム。
  17. 請求項16に記載のブレード・ベース分散コンピューティング・システムにおいて、さらに、ユーザが操作して各ブレード・サーバおよび各ブレードに関する様々な情報を閲覧する前記第1および第2ブレード・サーバのグラフィック表示を含んでいるグラフィカル・ユーザ・インターフェイスを提供するための手段を備えている、ブレード・ベース分散コンピューティング・システム。
  18. 請求項10に記載のブレード・ベース分散コンピューティング・システムにおいて、さらに、
    1つまたはそれ以上の前記スイッチ・ブレードに接続するネットワークを介して前記第1および第2ブレード・サーバに接続する複数のクライアントを含み、
    各スイッチ・ブレードが、各クライアントに対する帯域幅の要求に従って前記各クライアントに帯域幅を割り当てるための手段を含むこと、
    を特徴とするブレード・ベース分散コンピューティング・システム。
  19. 請求項18に記載のブレード・ベース分散コンピューティング・システムにおいて、さらに、前記第1および第2ブレード・サーバにおける前記複数のブレードの間でコンフィギュレーション情報を分配するための手段を備えている、ブレード・ベース分散コンピューティング・システム。
JP2006256984A 2005-09-23 2006-09-22 高可用性ブレード・ベース分散コンピューティング・システム Active JP4562196B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US72015205P 2005-09-23 2005-09-23
US74884005P 2005-12-09 2005-12-09
US74883905P 2005-12-09 2005-12-09
US11/524,678 US20070083723A1 (en) 2005-09-23 2006-09-21 Highly-available blade-based distributed computing system

Publications (2)

Publication Number Publication Date
JP2007122698A true JP2007122698A (ja) 2007-05-17
JP4562196B2 JP4562196B2 (ja) 2010-10-13

Family

ID=37806740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006256984A Active JP4562196B2 (ja) 2005-09-23 2006-09-22 高可用性ブレード・ベース分散コンピューティング・システム

Country Status (6)

Country Link
US (1) US20070083723A1 (ja)
EP (1) EP1770508B1 (ja)
JP (1) JP4562196B2 (ja)
AT (1) ATE474263T1 (ja)
CA (1) CA2560625A1 (ja)
DE (1) DE602006015406D1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104511A (ja) * 2007-10-25 2009-05-14 Nec Corp ブレードサーバシステム及びスイッチモジュール
US7953827B2 (en) * 2006-10-31 2011-05-31 Dell Products L.P. System and method for dynamic allocation of information handling system network addresses
US7975167B2 (en) 2008-10-03 2011-07-05 Fujitsu Limited Information system
JP2013206295A (ja) * 2012-03-29 2013-10-07 Nec Corp サーバ管理システム、ブレードサーバシステム、サーバ管理方法及びサーバ管理プログラム
JP2013210796A (ja) * 2012-03-30 2013-10-10 Oki Electric Ind Co Ltd 冗長化構築システム及び冗長化構築プログラム
US8635370B2 (en) 2008-02-20 2014-01-21 Nec Corporation Blade server and switch blade
JP2015036966A (ja) * 2013-08-16 2015-02-23 富士通株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2018163557A (ja) * 2017-03-27 2018-10-18 日本電気株式会社 サーバシステム、スイッチモジュール及びログ取得方法
JP2019036943A (ja) * 2017-08-11 2019-03-07 廣達電脳股▲ふん▼有限公司 高可用性ストレージプール構成機構

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7984123B2 (en) * 2007-12-10 2011-07-19 Oracle America, Inc. Method and system for reconfiguring a virtual network path
US8370530B2 (en) * 2007-12-10 2013-02-05 Oracle America, Inc. Method and system for controlling network traffic in a blade chassis
US7962587B2 (en) * 2007-12-10 2011-06-14 Oracle America, Inc. Method and system for enforcing resource constraints for virtual machines across migration
US8095661B2 (en) * 2007-12-10 2012-01-10 Oracle America, Inc. Method and system for scaling applications on a blade chassis
US7945647B2 (en) * 2007-12-10 2011-05-17 Oracle America, Inc. Method and system for creating a virtual network path
US8086739B2 (en) * 2007-12-10 2011-12-27 Oracle America, Inc. Method and system for monitoring virtual wires
US8510370B2 (en) 2008-02-26 2013-08-13 Avid Technology, Inc. Array-based distributed storage system with parity
US7970951B2 (en) * 2008-02-29 2011-06-28 Oracle America, Inc. Method and system for media-based data transfer
US7965714B2 (en) * 2008-02-29 2011-06-21 Oracle America, Inc. Method and system for offloading network processing
US7944923B2 (en) * 2008-03-24 2011-05-17 Oracle America, Inc. Method and system for classifying network traffic
US8839339B2 (en) * 2008-04-15 2014-09-16 International Business Machines Corporation Blade center KVM distribution
US7941539B2 (en) * 2008-06-30 2011-05-10 Oracle America, Inc. Method and system for creating a virtual router in a blade chassis to maintain connectivity
US8739179B2 (en) * 2008-06-30 2014-05-27 Oracle America Inc. Method and system for low-overhead data transfer
JP5321112B2 (ja) * 2008-09-11 2013-10-23 株式会社リコー 現像装置及び画像形成装置
CN101938368A (zh) * 2009-06-30 2011-01-05 国际商业机器公司 刀片服务器系统中的虚拟机管理器和虚拟机处理方法
US9256560B2 (en) 2009-07-29 2016-02-09 Solarflare Communications, Inc. Controller integration
US20110238980A1 (en) 2010-03-23 2011-09-29 Fujitsu Limited System and methods for remote maintenance in an electronic network with multiple clients
US8799422B1 (en) 2010-08-16 2014-08-05 Juniper Networks, Inc. In-service configuration upgrade using virtual machine instances
US9858241B2 (en) 2013-11-05 2018-01-02 Oracle International Corporation System and method for supporting optimized buffer utilization for packet processing in a networking device
US8634415B2 (en) 2011-02-16 2014-01-21 Oracle International Corporation Method and system for routing network traffic for a blade server
US8806266B1 (en) 2011-09-28 2014-08-12 Juniper Networks, Inc. High availability using full memory replication between virtual machine instances on a network device
US9021459B1 (en) 2011-09-28 2015-04-28 Juniper Networks, Inc. High availability in-service software upgrade using virtual machine instances in dual control units of a network device
US8943489B1 (en) * 2012-06-29 2015-01-27 Juniper Networks, Inc. High availability in-service software upgrade using virtual machine instances in dual computing appliances
US9311263B2 (en) 2013-03-15 2016-04-12 Dell Products L.P. Input/output switching module interface identification in a multi-server chassis
WO2014158161A1 (en) * 2013-03-28 2014-10-02 Hewlett-Packard Development Company, L.P. Error coordination message for a blade device having a logical processor in another system firmware domain
US20140317267A1 (en) * 2013-04-22 2014-10-23 Advanced Micro Devices, Inc. High-Density Server Management Controller
JP5902137B2 (ja) * 2013-09-24 2016-04-13 株式会社東芝 ストレージシステム
JP5800002B2 (ja) * 2013-10-11 2015-10-28 富士ゼロックス株式会社 選定システム、選定サーバ及びプログラム
US9489327B2 (en) 2013-11-05 2016-11-08 Oracle International Corporation System and method for supporting an efficient packet processing model in a network environment
US9075773B1 (en) 2014-05-07 2015-07-07 Igneous Systems, Inc. Prioritized repair of data storage failures
US9201735B1 (en) * 2014-06-25 2015-12-01 Igneous Systems, Inc. Distributed storage data repair air via partial data rebuild within an execution path
US9686237B2 (en) * 2014-08-19 2017-06-20 International Business Machines Corporation Secure communication channel using a blade server
US9098451B1 (en) 2014-11-21 2015-08-04 Igneous Systems, Inc. Shingled repair set for writing data
CN105812423B (zh) * 2014-12-29 2019-10-29 联想(北京)有限公司 一种云系统配置方法、服务器及装置
US9276900B1 (en) 2015-03-19 2016-03-01 Igneous Systems, Inc. Network bootstrapping for a distributed storage system
CN105589830B (zh) * 2015-12-28 2018-12-25 浪潮(北京)电子信息产业有限公司 一种刀片式服务器架构
US10355861B2 (en) * 2017-03-28 2019-07-16 Dell Products, Lp Chassis-based cryptographic affinities
US11006544B1 (en) * 2019-12-04 2021-05-11 Hewlett Packard Enterprise Development Lp Automatic component discovery mechanism
US11764986B2 (en) 2017-12-11 2023-09-19 Hewlett Packard Enterprise Development Lp Automatic component discovery mechanism
CN111464329B (zh) * 2020-02-29 2022-08-30 新华三信息技术有限公司 启动方法、互联模块及服务器
CN113422828A (zh) * 2021-06-23 2021-09-21 陈军 集群存储服务器、存储服务器系统及搭建ipfs网络的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005109589A (ja) * 2003-09-26 2005-04-21 Nec Corp ネットワークスイッチ及びその動作方法、並びにブレードサーバ

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3883579B2 (ja) 1996-04-12 2007-02-21 アビッド テクノロジー インコーポレイテッド データ管理機構を改善したマルチメディア・システム
US6415373B1 (en) 1997-12-24 2002-07-02 Avid Technology, Inc. Computer system and process for transferring multiple high bandwidth streams of data between multiple storage units and multiple applications in a scalable and reliable manner
US6070187A (en) * 1998-03-26 2000-05-30 Hewlett-Packard Company Method and apparatus for configuring a network node to be its own gateway
US6438625B1 (en) * 1999-10-21 2002-08-20 Centigram Communications Corporation System and method for automatically identifying slots in a backplane
US6988148B1 (en) * 2001-01-19 2006-01-17 Cisco Technology, Inc. IP pool management utilizing an IP pool MIB
US20030069953A1 (en) * 2001-09-28 2003-04-10 Bottom David A. Modular server architecture with high-availability management capability
TWI231424B (en) * 2002-06-28 2005-04-21 Quanta Comp Inc Management and preparation system of blade server
JP3956786B2 (ja) * 2002-07-09 2007-08-08 株式会社日立製作所 記憶装置の帯域制御装置、方法及びプログラム
US7412515B2 (en) * 2002-09-26 2008-08-12 Lockheed Martin Corporation Method and apparatus for dynamic assignment of network protocol addresses
US7305431B2 (en) * 2002-09-30 2007-12-04 International Business Machines Corporation Automatic enforcement of service-level agreements for providing services over a network
US20040081104A1 (en) * 2002-10-29 2004-04-29 Weimin Pan Method and system for network switch configuration
TWM242781U (en) * 2002-11-25 2004-09-01 Quanta Comp Inc Blade server management system with auxiliary management structure
EP1460819A3 (en) * 2003-03-21 2006-02-08 Broadcom Corporation Method and system for handling traffic for server systems
US8285881B2 (en) * 2003-09-10 2012-10-09 Broadcom Corporation System and method for load balancing and fail over
JP4351517B2 (ja) * 2003-11-14 2009-10-28 株式会社日立製作所 データセンタの装置管理方法、装置管理サーバ、データセンタの装置管理システム並びにプログラム
US7340538B2 (en) * 2003-12-03 2008-03-04 Intel Corporation Method for dynamic assignment of slot-dependent static port addresses
EP1697842A2 (en) * 2003-12-11 2006-09-06 Bladefusion Technologies 2003 LTD. Method and an apparatus for controlling executables running on blade servers
JP4049123B2 (ja) * 2004-04-09 2008-02-20 ソニー株式会社 電子機器及び制御方法
GB2425681A (en) * 2005-04-27 2006-11-01 3Com Corporaton Access control by Dynamic Host Configuration Protocol snooping
US20060268834A1 (en) * 2005-05-26 2006-11-30 Symbol Technologies, Inc. Method, system and wireless router apparatus supporting multiple subnets for layer 3 roaming in wireless local area networks (WLANs)
US20070002833A1 (en) * 2005-06-30 2007-01-04 Symbol Technologies, Inc. Method, system and apparatus for assigning and managing IP addresses for wireless clients in wireless local area networks (WLANs)

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005109589A (ja) * 2003-09-26 2005-04-21 Nec Corp ネットワークスイッチ及びその動作方法、並びにブレードサーバ

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7953827B2 (en) * 2006-10-31 2011-05-31 Dell Products L.P. System and method for dynamic allocation of information handling system network addresses
JP2009104511A (ja) * 2007-10-25 2009-05-14 Nec Corp ブレードサーバシステム及びスイッチモジュール
US8635370B2 (en) 2008-02-20 2014-01-21 Nec Corporation Blade server and switch blade
US7975167B2 (en) 2008-10-03 2011-07-05 Fujitsu Limited Information system
JP2013206295A (ja) * 2012-03-29 2013-10-07 Nec Corp サーバ管理システム、ブレードサーバシステム、サーバ管理方法及びサーバ管理プログラム
JP2013210796A (ja) * 2012-03-30 2013-10-10 Oki Electric Ind Co Ltd 冗長化構築システム及び冗長化構築プログラム
JP2015036966A (ja) * 2013-08-16 2015-02-23 富士通株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2018163557A (ja) * 2017-03-27 2018-10-18 日本電気株式会社 サーバシステム、スイッチモジュール及びログ取得方法
JP2019036943A (ja) * 2017-08-11 2019-03-07 廣達電脳股▲ふん▼有限公司 高可用性ストレージプール構成機構
US10673686B2 (en) 2017-08-11 2020-06-02 Quanta Computer Inc. High availability storage pool compose mechanism

Also Published As

Publication number Publication date
US20070083723A1 (en) 2007-04-12
EP1770508B1 (en) 2010-07-14
EP1770508A3 (en) 2007-09-19
ATE474263T1 (de) 2010-07-15
DE602006015406D1 (de) 2010-08-26
EP1770508A2 (en) 2007-04-04
CA2560625A1 (en) 2007-03-23
JP4562196B2 (ja) 2010-10-13

Similar Documents

Publication Publication Date Title
JP4562196B2 (ja) 高可用性ブレード・ベース分散コンピューティング・システム
US7370336B2 (en) Distributed computing infrastructure including small peer-to-peer applications
CN100544342C (zh) 存储系统
US7139809B2 (en) System and method for providing virtual network attached storage using excess distributed storage capacity
US20030126242A1 (en) Network boot system and method using remotely-stored, client-specific boot images created from shared, base snapshot image
US8028193B2 (en) Failover of blade servers in a data center
US7219254B2 (en) Method and apparatus for high availability distributed processing across independent networked computer fault groups
US9602600B1 (en) Method and apparatus for web based storage on-demand
US7134046B2 (en) Method and apparatus for high availability distributed processing across independent networked computer fault groups
US7499987B2 (en) Deterministically electing an active node
CN113169895A (zh) 用于具有低时延故障转移的虚拟化服务的n+1冗余
CN111147274A (zh) 为集群解决方案创建高度可用的仲裁集的系统和方法
CN1508714A (zh) 确定高可用性集群之活跃度的方法和系统
US11153173B1 (en) Dynamically updating compute node location information in a distributed computing environment
KR20090073130A (ko) 네트워크 엘리먼트에서의 무정지형 매체 액세스 제어 어드레스 할당
CN113765697B (zh) 管理数据处理系统的日志的方法和系统及计算机可读介质
JP2004356920A (ja) Dhcpサーバシステム
US20090089432A1 (en) Information processing system and control method thereof
US7149918B2 (en) Method and apparatus for high availability distributed processing across independent networked computer fault groups
US8074109B1 (en) Third-party voting to select a master processor within a multi-processor computer
US7127637B2 (en) Method and apparatus for high availability distributed processing across independent networked computer fault groups
JP2012164185A (ja) サーバ、クライアント、これらを有するバックアップシステム、及びこれらのバックアップ方法
CN117271205A (zh) 数据处理系统、数据处理方法、装置及相关设备
CN116627905A (zh) 一种文件访问方法、装置、计算机设备及可读存储介质
KR101053823B1 (ko) 위성통신 시스템에서의 이중화 방법 및 그 장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090407

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090707

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090710

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20090902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100706

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100726

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4562196

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250