JP4045282B2 - 高可用性クラスタノードの除去および通信 - Google Patents
高可用性クラスタノードの除去および通信 Download PDFInfo
- Publication number
- JP4045282B2 JP4045282B2 JP2005258992A JP2005258992A JP4045282B2 JP 4045282 B2 JP4045282 B2 JP 4045282B2 JP 2005258992 A JP2005258992 A JP 2005258992A JP 2005258992 A JP2005258992 A JP 2005258992A JP 4045282 B2 JP4045282 B2 JP 4045282B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- status signal
- connector
- cluster
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/42—Loop networks
- H04L12/437—Ring fault isolation or reconfiguration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
- Communication Control (AREA)
Description
クラスタ化されたノードの状態を報告する従来の技法について上述した。従来の技法では、ハートビートメカニズムが使用され、ノードは、「アップ」状態または「ダウン」状態のいずれかであるものと判断される。
図1Aは、本発明の一実施形態による代表的な高可用性クラスタ10を示す概略図である。図には、4つのノード100が示されているが、本発明の範囲内ではさまざまな数のノードを使用してもよい。
ルールD1:計算サブシステムは、50%を超える性能を喪失する
ルールD2:重大な(severe)(危機的(critical)より1つ下のレベル)シャーシコードが受け取られる
特定のシステムに応じて、これらのルールおよび追加のルールの変形を使用してDEGRADED状態を定義してもよい。たとえば、低下状態に入る前の性能率は、50%とは異なっていてもよい。75%等、より高くてもよく、25%等、より低くてもよい。
HAクラスタのノードが、そのノードに対して物理的に保守またはアップグレードを実行するためにオフラインにされなければならない環境がある。かかる保守を、クラスタ動作を過度に中断させることなく実行することが望ましい。より詳細には、クラスタに存在し続けているノードの連続性を維持しながら、ノードをダウンさせ物理的に除去することができることが望ましい。
20・・・ネットワーク
30・・・通信リンク
100・・・ノード
102・・・計算サブシステム(計算ノード)
104・・・サブシステムステータス
106・・・信号処理ハードウェア
108・・・ノードステータス
202・・・信号発生器
204・・・デフォルトBAD信号
206・・・出力信号発生器
304・・・論理機能ブロック
302・・・プルダウン要素
600・・・ステータスパススルー回路
602・・・選択回路
604・・・ノードN+1に送信されるステータス出力信号
700・・・ノード
702・・・サブシステム低下ステータス
704・・・ノード低下ステータス
800・・・ステータスパススルー回路
802・・・選択回路
804・・・ノードN+1に送信されるステータス出力信号
902・・・HAクラスタハードウェアインタフェース
904・・・ノードNとハードウェアインタフェースとの間の接続
906・・・HAクラスタの残りへの接続
1002・・・ノードボックス/システム
1004・・・ノードのコネクタ
1006・・・ラック構造
1008・・・HAクラスタハードウェアインタフェース
1010・・・インタフェースのコネクタ
1012・・・ノード間接続
Claims (9)
- 高可用性クラスタ装置であって、
前記クラスタの複数の計算ノードと、
前記ノードの各々に接続するように構成されたハードウェアインタフェースと、
該ハードウェアインタフェースに結合され、前記ノード間でノードステータス信号を通信するノード間接続であって、前記ノードステータス信号が動作しているノードを示す信号に積極的に変化しない場合には、前記ノードステータス信号はデフォルトの動作していないノードを示す信号となる、ノード間接続と、
前記ノードを相互接続するデータ通信ネットワークであって、該ネットワークは、前記ノード間接続とは別個であるデータ通信ネットワークと
を具備し、
各ノードは、前記ノード間接続によって前記ノードステータス信号を送信することに加えて、前記データ通信ネットワークによってハートビート信号を送信するように構成されており、前記ノード間接続のトポロジカルな接続性を中断することなく前記ハードウェアインタフェースに接続された状態から除去可能である
高可用性クラスタ装置。 - 前記ノード間接続は、ポイント・ツー・ポイントループトポロジーを形成する
請求項1に記載の高可用性クラスタ装置。 - 前記計算ノードの各々はシャーシに収容される
請求項1に記載の高可用性クラスタ装置。 - 前記ハードウェアインタフェースはラックに取り付けられる
請求項3に記載の高可用性クラスタ装置。 - 前記ハードウェアインタフェースは
プリント回路基板
を備える
請求項4に記載の高可用性クラスタ装置。 - 前記ハードウェアインタフェースは別個のシャーシに収容される
請求項4に記載の高可用性クラスタ装置。 - 前記ラックは、複数の前記シャーシを支持するように構成される
請求項4に記載の高可用性クラスタ装置。 - 前記ノードの各々に構成される第1のコネクタと、
前記ハードウェアインタフェースにおける少なくとも1つの第2のコネクタと、
をさらに具備し、
前記第1のコネクタは前記第2のコネクタと嵌合するように構成される
請求項1に記載の高可用性クラスタ装置。 - 高可用性計算クラスタの第1のノードと第2のノードとの間で、動作していないノードを示すデフォルト状態を有するノードステータス信号を通信する方法であって、前記ノードステータス信号を前記ノード間で通信するためのノード間ネットワークは前記ノードを接続するデータ通信ネットワークと別個であり、前記第1のノードと第2のノードとの間の中間ノードは前記クラスタから除去されており、
ハードウェアインタフェースにおける第1のコネクタによって第1のノードから前記ノードステータス信号を受け取るステップと、
前記第1のコネクタから前記ハードウェアインタフェースにおける第2のコネクタに前記ノードステータス信号を転送するステップであって、前記転送するステップは、前記第1のコネクタから前記中間ノードに対応する中間コネクタに前記ノードステータス信号を送信するステップと、前記中間コネクタから前記第2のコネクタに前記ノードステータス信号を送信するステップとを含む、転送するステップと、
前記第2のコネクタから第2のノードに前記ノードステータス信号を送信するステップと
を含む方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/935,882 US7664994B2 (en) | 2004-09-08 | 2004-09-08 | High-availability cluster node removal and communication |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006079618A JP2006079618A (ja) | 2006-03-23 |
JP4045282B2 true JP4045282B2 (ja) | 2008-02-13 |
Family
ID=34984341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005258992A Expired - Fee Related JP4045282B2 (ja) | 2004-09-08 | 2005-09-07 | 高可用性クラスタノードの除去および通信 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7664994B2 (ja) |
JP (1) | JP4045282B2 (ja) |
GB (1) | GB2418041A (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080077635A1 (en) * | 2006-09-22 | 2008-03-27 | Digital Bazaar, Inc. | Highly Available Clustered Storage Network |
US8594110B2 (en) | 2008-01-11 | 2013-11-26 | Mosaid Technologies Incorporated | Ring-of-clusters network topologies |
US8285900B2 (en) * | 2009-02-17 | 2012-10-09 | The Board Of Regents Of The University Of Texas System | Method and apparatus for congestion-aware routing in a computer interconnection network |
JP5381723B2 (ja) * | 2010-01-08 | 2014-01-08 | 日本電気株式会社 | 並列計算機 |
US8108733B2 (en) * | 2010-05-12 | 2012-01-31 | International Business Machines Corporation | Monitoring distributed software health and membership in a compute cluster |
US20110289342A1 (en) * | 2010-05-21 | 2011-11-24 | Schaefer Diane E | Method for the file system of figure 7 for the cluster |
US10680886B1 (en) * | 2014-08-29 | 2020-06-09 | Schneider Electric Systems Usa, Inc. | Remote wireless sensors and systems including remote wireless sensors |
WO2017052548A1 (en) | 2015-09-24 | 2017-03-30 | Hewlett Packard Enterprise Development Lp | Failure indication in shared memory |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6389551B1 (en) | 1998-12-17 | 2002-05-14 | Steeleye Technology, Inc. | Method of preventing false or unnecessary failovers in a high availability cluster by using a quorum service |
US6453426B1 (en) * | 1999-03-26 | 2002-09-17 | Microsoft Corporation | Separately storing core boot data and cluster configuration data in a server cluster |
US6502203B2 (en) | 1999-04-16 | 2002-12-31 | Compaq Information Technologies Group, L.P. | Method and apparatus for cluster system operation |
JP2001067330A (ja) | 1999-06-22 | 2001-03-16 | Fuji Electric Co Ltd | 分散処理システム |
US6609213B1 (en) * | 2000-08-10 | 2003-08-19 | Dell Products, L.P. | Cluster-based system and method of recovery from server failures |
US20030149735A1 (en) * | 2001-06-22 | 2003-08-07 | Sun Microsystems, Inc. | Network and method for coordinating high availability system services |
US20030177228A1 (en) | 2002-02-01 | 2003-09-18 | Xavier Vigouroux | Adaptative heartbeat flow for cluster node aliveness detection |
US6947957B1 (en) * | 2002-06-20 | 2005-09-20 | Unisys Corporation | Proactive clustered database management |
US6822874B1 (en) * | 2002-11-12 | 2004-11-23 | Wooshcom Corporation | Modular high availability electronic product architecture with flexible I/O |
US7451359B1 (en) | 2002-11-27 | 2008-11-11 | Oracle International Corp. | Heartbeat mechanism for cluster systems |
US20050068888A1 (en) * | 2003-09-26 | 2005-03-31 | Komarla Eshwari P. | Seamless balde failover in platform firmware |
US7383464B2 (en) * | 2003-12-08 | 2008-06-03 | International Business Machines Corporation | Non-inline transaction error correction |
US7228462B2 (en) * | 2004-01-23 | 2007-06-05 | Hewlett-Packard Development Company, L.P. | Cluster node status detection and communication |
US6928589B1 (en) * | 2004-01-23 | 2005-08-09 | Hewlett-Packard Development Company, L.P. | Node management in high-availability cluster |
US7698487B2 (en) * | 2004-06-30 | 2010-04-13 | Intel Corporation | Share resources and increase reliability in a server environment |
-
2004
- 2004-09-08 US US10/935,882 patent/US7664994B2/en active Active
-
2005
- 2005-08-09 GB GB0516364A patent/GB2418041A/en not_active Withdrawn
- 2005-09-07 JP JP2005258992A patent/JP4045282B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006079618A (ja) | 2006-03-23 |
GB0516364D0 (en) | 2005-09-14 |
US7664994B2 (en) | 2010-02-16 |
GB2418041A (en) | 2006-03-15 |
US20060053336A1 (en) | 2006-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4045282B2 (ja) | 高可用性クラスタノードの除去および通信 | |
US6928589B1 (en) | Node management in high-availability cluster | |
JP2005209190A (ja) | 高可用性クラスタノードの複数状態ステータスの報告 | |
US6895528B2 (en) | Method and apparatus for imparting fault tolerance in a switch or the like | |
US7284067B2 (en) | Method for integrated load balancing among peer servers | |
US6253266B1 (en) | Apparatus and method for controlling information flow in a card cage having multiple backplanes | |
JP2017518552A (ja) | Rasおよび電力管理のための高速シリアルリンク帯域内レーンフェイルオーバー | |
US7319664B2 (en) | Redundant link management switch for use in a stack of switches and method thereof | |
CN1863081A (zh) | 基于智能平台管理接口的管理系统和方法 | |
JP2006079603A (ja) | 高可用性クラスタ化のためのスマートカード | |
US7206963B2 (en) | System and method for providing switch redundancy between two server systems | |
US11003394B2 (en) | Multi-domain data storage system with illegal loop prevention | |
JP4038510B2 (ja) | クラスタノードのステータスの検出および通信 | |
CN111880999B (zh) | 用于高密度刀片服务器的高可用监控管理装置及冗余切换方法 | |
US20220030093A1 (en) | Selective tcp/ip stack reconfiguration | |
EP4128673A1 (en) | Smart cable for redundant top-of-rack's | |
US11567834B2 (en) | Data center storage availability architecture using rack-level network fabric | |
JP7474168B2 (ja) | 監視システムおよび障害監視方法 | |
CN113392053B (zh) | 一种存储系统,一种通信方法及组件 | |
US20220206690A1 (en) | System and method to increase data center availability using rack-to-rack storage link cable | |
JP2004159205A (ja) | サーバのネットワーク接続システム、方法およびバックプレーン | |
Raikar et al. | Designing network failover and recovery in MPI for multi-rail InfiniBand clusters | |
TW201643740A (zh) | 用來管理一儲存系統之方法與裝置 | |
KR20030064072A (ko) | Atm 교환 시스템에서 이중 미디어 게이트웨이 장치 및제어 방법 | |
Rajan | Building IP networks using Advanced Telecom Computing Architecture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061109 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071119 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |