JP2011524563A - ノード間でのデバイス・エラー情報の同期化 - Google Patents
ノード間でのデバイス・エラー情報の同期化 Download PDFInfo
- Publication number
- JP2011524563A JP2011524563A JP2011512077A JP2011512077A JP2011524563A JP 2011524563 A JP2011524563 A JP 2011524563A JP 2011512077 A JP2011512077 A JP 2011512077A JP 2011512077 A JP2011512077 A JP 2011512077A JP 2011524563 A JP2011524563 A JP 2011524563A
- Authority
- JP
- Japan
- Prior art keywords
- node
- error counter
- error
- message
- counter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
Abstract
【解決手段】 第1のノードは、第1のノード及び第2のノードと通信状態にあるデバイスに関する第1ノード・エラー・カウンタに対してアクションを実行する。第1のノードは、デバイス、及びデバイスに関する第1ノード・エラー・カウンタに対して実行されたアクションを示すメッセージを第2のノードに伝送する。第2のノードは、メッセージ内に示されたデバイスに関する第2ノード・エラー・カウンタに対してメッセージ内に示されたアクションを実行し、ここで、第2ノード・エラー・カウンタは、デバイスに関する第1ノード・エラー・カウンタに対応する。
【選択図】 図6
Description
4:第1のインターフェース
6a、6b、6n:共有デバイス
8:第2のインターフェース
20:プロセッサ
22:デバイス・マネージャ
24:デバイス・エラー情報
26:ノード・リスト
50:デバイス・エラー情報エントリ
52:共有デバイスID
54:ノード所有者ID
56:エラー・カウンタ
58:付加的なエラー情報
70:アクション・マネージャ
72:ターゲット・ノード
74:送信ノード
76:アクション
78:共有デバイスID
90:同期化メッセージ
92:送信ノード
94a、94n:デバイス・エラー情報
300:ストレージ・サーバー(システム)
304a、304b:クラスタ
306a、306b:プロセッサ複合体
308a、308b:デバイス・マネージャ
310:バス
312a、312b、312n:ホスト
314:ネットワーク
316a、316b:ストレージ
318a、318b:ボリューム
320a、320b、320n:デバイス・アダプタ
322a、322b、322n:ネットワーク・アダプタ
326、328:インターフェース
Claims (17)
- 第1のノードによって、前記第1のノード及び第2のノードと通信状態にあるデバイスに関する第1ノード・エラー・カウンタに対してアクションを実行するステップと、
前記第1のノードによって、前記デバイスと前記デバイスに関する前記第1ノード・エラー・カウンタに対して実行された前記アクションとを示すメッセージを、前記第2のノードに伝送するステップと、
前記第2のノードによって、前記メッセージ内に示された前記デバイスに関する第2ノード・エラー・カウンタに対して、前記メッセージ内に示された前記アクションを実行するステップであって、前記第2ノード・エラー・カウンタは、前記デバイスに関する前記第1ノード・エラー・カウンタに対応する、ステップと、
を含む方法。 - 前記メッセージ内に示される前記アクションは、オープン・アクションを含み、前記第2のノードによって前記オープン・アクションを実行するステップは、前記メッセージに応答して前記デバイスに関する前記第2ノード・エラー・カウンタを作成するステップを含む、請求項1に記載の方法。
- 前記メッセージ内に示される前記アクションは、終了アクションを含み、前記第2のノードによって前記終了アクションを実行するステップは、前記メッセージに応答して前記デバイスに関する前記第2ノード・エラー・カウンタを終了するステップを含む、請求項1に記載の方法。
- 前記第1のノードによって前記デバイスのエラーを検出するステップをさらに含み、
前記第1のノードによって実行される前記アクションは、前記エラーの検出に応答して前記デバイスに関する前記第1ノード・エラー・カウンタをインクリメントするステップを含み、
前記メッセージ内に示される前記アクションは、インクリメント・アクションを含み、
前記第2のノードによって前記インクリメント・アクションを実行するステップは、前記第2のノードにおいて前記デバイスに関する前記第2ノード・エラー・カウンタをインクリメントするステップを含む、
請求項1に記載の方法。 - 前記エラー・カウンタ値がエラー閾値に達したことに応答して、前記第1のノードによってエラー回復動作を開始するステップをさらに含む、請求項1に記載の方法。
- 前記第1のノードは、前記デバイスに対するエラー・ハンドリングを実行する前記デバイスの所有者として動作し、
前記第2のノードによって、前記デバイスの所有権を引き継ぐステップと、
前記第2のノードが前記デバイスのエラーを検出したことに応答して、前記第2のノードによって、前記第1のノードによって検出された前記デバイスのエラーを示す前記第2ノード・エラー・カウンタをインクリメントするステップと、
をさらに含む、
請求項1に記載の方法。 - 前記第2のノードは、前記第1のノードの故障に応答して前記デバイスの前記所有権を引き継ぐ、請求項6に記載の方法。
- 前記デバイスは、第1のデバイスを含み、前記第1ノード・エラー・カウンタは、第1ノード第1デバイス・エラー・カウンタを含み、前記第2ノード・エラー・カウンタは、第2ノード第1デバイス・エラー・カウンタ・コピーを含み、
前記第2のノードによって、前記第1のノード及び前記第2のノードと通信状態にある第2のデバイスのエラー数を示す第2ノード第2デバイス・エラー・カウンタを保持するステップと、
前記第1のノードによって、前記第2のノードによって検出されたエラーを含む前記第2のデバイスのエラー数を示す第1ノード第2デバイス・エラー・カウンタを保持するステップと、
をさらに含む、
請求項1に記載の方法。 - 前記第1及び第2のノードは、サーバー内の第1のインターフェースを介して通信する前記サーバー内の第1及び第2の処理クラスタを含み、
前記第1及び第2のデバイスは、第1及び第2のネットワーク・アダプタを含み、
前記第1及び第2の処理クラスタは、第2のインターフェースを介して前記第1及び第2のアダプタと通信する、
請求項8に記載の方法。 - 前記第2のノードによって、前記第2のデバイスからエラー・メッセージを受信するステップと、
前記第2のノードによって、前記第2ノード第2デバイス・エラー・カウンタをインクリメントするステップと、
前記第2のノードによって、前記第2のデバイスに関するインクリメント・メッセージを前記第1のノードに伝送するステップと、
前記インクリメント・メッセージに応答して、前記第1のノードによって、前記第1ノード第2デバイス・エラー・カウンタを前記第2のエラー・カウンタ値にインクリメントするステップと、
をさらに含む、請求項8に記載の方法。 - 前記第1のノードは、前記第1のデバイスに対するエラー・ハンドリングを実行する前記第1のデバイスの所有者として動作し、
前記第2のノードは、前記第2のデバイスに対するエラー・ハンドリングを実行する前記第2のデバイスの所有者として動作し、
前記第2のノードによって前記第1のデバイスの所有権を引き継ぐステップであって、前記第2のノードは、前記第2ノード第1デバイス・エラー・カウンタを用いて、前記第1のデバイスに対するエラー管理を実行する、ステップと、
前記第1のノードによって前記第2のデバイスの所有権を引き継ぐステップであって、前記第1のノードは、前記第1ノード第2デバイス・エラー・カウンタを用いて、前記第2のデバイスに対するエラー管理を実行する、ステップと、
をさらに含む、請求項8に記載の方法。 - 前記第1及び第2のノードにおいて同期化動作を開始するステップと、
前記同期化動作に応答して、前記第1のノードによって、前記第1ノード第1デバイス・エラー・カウンタの値を前記第2のノードに示す同期化メッセージを、前記第2のノードに送信するステップと、
前記同期化動作に応答して、前記第2のノードによって、前記第2ノード第2デバイス・エラー・カウンタの値を前記第1のノードに示す同期化メッセージを、前記第1のノードに送信するステップと、
をさらに含む、請求項8に記載の方法。 - 前記同期化メッセージ内に示された前記値が前記第1ノード第2デバイス・エラー・カウンタより大きいとの前記第1のノードの判断に応じて、前記第1のノードによって、前記第1のノードに送信された前記同期化メッセージ内に示された前記第2ノード第2デバイス・エラー・カウンタの前記値で前記第1ノード第2デバイス・エラー・カウンタを更新するステップと、
前記第2のノードに送信された前記同期化メッセージ内に示された前記値が前記第2ノード第1デバイス・エラー・カウンタより大きいとの前記第2のノードの判断に応じて、前記第2のノードによって、前記第2のノードに送信された前記同期化メッセージ内に示された前記第1ノード第1デバイス・エラー・カウンタの前記値で前記第2ノード第1デバイス・エラー・カウンタを更新するステップと、
をさらに含む、請求項12に記載の方法。 - 前記第1のノードが前記第2のデバイスに関する前記第1ノード第2デバイス・エラー・カウンタを含まないとの判断に応じて、前記第1のノードによって、前記第1ノード第2デバイス・エラー・カウンタを作成するステップと、
前記第1のノードによって、前記第1ノード第2デバイス・エラー・カウンタを、前記第1のノードに送信された前記同期化メッセージ内に示された前記値に設定するステップと、
前記第2のノードが前記第1のデバイスに関する前記第2ノード第1デバイス・エラー・カウンタを含まないとの判断に応じて、前記第2のノードによって、前記第2ノード第1デバイス・エラー・カウンタを作成するステップと、
前記第2のノードによって、前記第2ノード第1デバイス・エラー・カウンタを、前記第2のノードに送信された前記同期化メッセージ内に示された前記値に設定するステップと、
をさらに含む、請求項12に記載の方法。 - 前記第2のノードによって、再初期化動作を開始するステップと、
前記第2のノードによって、前記再初期化動作の一部として結合メッセージを前記第1のノードに送信するステップと、
前記結合メッセージに応答して、前記第1のノードによって、前記デバイスに関する前記第1ノード・エラー・カウンタの値を示すメッセージを前記第2のノードに送信するステップと、
前記結合メッセージに応答して、前記第2のノードによって、前記第2ノード・エラー・カウンタを、送信された前記メッセージ内に示された前記値に更新するステップと、
をさらに含む、請求項1に記載の方法。 - デバイスと通信状態にある第1のノード及び第2のノードを備えるシステムであって、前記第1及び第2のノードは、請求項1から請求項15までのいずれかの請求項に記載された前記ステップを実行するためのプログラム・コードを実行するように様々に適合される、前記システム。
- 第1のノード及び第2のノードによって実行されるコードを含むコンピュータ・プログラムであって、1つのデバイスが、前記第1のノード及び前記第2のノードと通信状態にあり、前記コードは、請求項1から請求項15までのいずれかの請求項において定義される前記ステップを実行するように実行される、前記コンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/132,550 US7904752B2 (en) | 2008-06-03 | 2008-06-03 | Synchronizing device error information among nodes |
US12/132,550 | 2008-06-03 | ||
PCT/EP2009/056557 WO2009147066A1 (en) | 2008-06-03 | 2009-05-28 | Synchronizing device error information among nodes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011524563A true JP2011524563A (ja) | 2011-09-01 |
JP5255697B2 JP5255697B2 (ja) | 2013-08-07 |
Family
ID=41110621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011512077A Active JP5255697B2 (ja) | 2008-06-03 | 2009-05-28 | ノード間でのデバイス・エラー情報の同期化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7904752B2 (ja) |
EP (1) | EP2283612B1 (ja) |
JP (1) | JP5255697B2 (ja) |
KR (1) | KR101385910B1 (ja) |
CA (1) | CA2708976C (ja) |
WO (1) | WO2009147066A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540878A (zh) * | 2019-09-20 | 2021-03-23 | 富士通株式会社 | 信息处理设备、信息处理系统及非暂态存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8381026B2 (en) * | 2009-06-22 | 2013-02-19 | Citrix Systems, Inc. | Systems and method for transaction stall detection and propagating the result in a multi-core architecture |
US8635318B1 (en) * | 2009-09-15 | 2014-01-21 | Symantec Corporation | Message broadcast protocol which handles configuration changes in a cluster of virtual servers |
JP5785455B2 (ja) * | 2011-07-29 | 2015-09-30 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | リムーバブルメディアに関する処理を行う装置及び方法 |
US10289466B2 (en) | 2017-02-01 | 2019-05-14 | International Business Machines Corporation | Error data collection improvements in storage network components |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0955735A (ja) * | 1995-08-10 | 1997-02-25 | Nippon Telegr & Teleph Corp <Ntt> | 通信網故障診断システムおよび通信網故障診断方法 |
JPH09259050A (ja) * | 1996-03-19 | 1997-10-03 | Hitachi Ltd | コンピュータ周辺機器制御装置のエラー報告方法および周辺機器制御装置 |
JPH11296311A (ja) * | 1998-04-08 | 1999-10-29 | Hitachi Ltd | 記憶装置の耐故障制御方式 |
JP2003345679A (ja) * | 2002-05-28 | 2003-12-05 | Nippon Telegr & Teleph Corp <Ntt> | サーバシステム、仲介装置、及び、クライアントサーバ型システムにおける誤り隠蔽方法 |
JP2006164304A (ja) * | 2006-01-20 | 2006-06-22 | Hitachi Ltd | ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法 |
JP2008083896A (ja) * | 2006-09-27 | 2008-04-10 | Fujitsu Ltd | 異常の発生源の特定方法、システム運用方法、基地局制御システム運営方法、および処理システム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1271326B (it) | 1994-12-23 | 1997-05-27 | Sits Soc It Telecom Siemens | Procedimento per il riallineamento automatico nel riporto di evento in un sistema di gestione e relativo sistema |
US6098179A (en) | 1998-01-22 | 2000-08-01 | Digital Equipment Corporation | Method and apparatus for performing error detection |
US6728216B1 (en) | 1998-02-27 | 2004-04-27 | Advanced Micro Devices, Inc. | Arrangement in a network repeater for monitoring link integrity and selectively down shifting link speed based on local configuration signals |
US6510393B1 (en) * | 1998-12-21 | 2003-01-21 | Siemens Atkiengesellschaft | Method for detecting faults in a switching device |
US6725281B1 (en) | 1999-06-11 | 2004-04-20 | Microsoft Corporation | Synchronization of controlled device state using state table and eventing in data-driven remote device control model |
US6701449B1 (en) * | 2000-04-20 | 2004-03-02 | Ciprico, Inc. | Method and apparatus for monitoring and analyzing network appliance status information |
US7209447B1 (en) | 2000-07-13 | 2007-04-24 | Tellabs Operations, Inc. | Method and apparatus for measuring packet connection quality of service |
JP4185661B2 (ja) * | 2000-11-17 | 2008-11-26 | キヤノン株式会社 | 機器管理装置、機器管理プログラム、機器管理プログラムが格納された記録媒体、及び機器管理方法 |
US6865689B1 (en) * | 2001-06-29 | 2005-03-08 | Sun Microsystems, Inc. | Method and apparatus for fault isolation on network loops using low level error counters |
JP2003069614A (ja) | 2001-08-28 | 2003-03-07 | Nec Miyagi Ltd | データ伝送装置 |
US7287193B2 (en) * | 2003-05-15 | 2007-10-23 | International Business Machines Corporation | Methods, systems, and media to correlate errors associated with a cluster |
US7092768B1 (en) | 2004-03-09 | 2006-08-15 | Liquid Sky Studios, Inc. | Distributed control system |
US7539932B2 (en) | 2004-06-17 | 2009-05-26 | International Business Machines Corporation | Method and system for debugging Ethernet |
US7624305B2 (en) * | 2004-11-18 | 2009-11-24 | International Business Machines Corporation | Failure isolation in a communication system |
US7254768B2 (en) | 2005-02-18 | 2007-08-07 | Broadcom Corporation | Memory command unit throttle and error recovery |
US7523359B2 (en) * | 2005-03-31 | 2009-04-21 | International Business Machines Corporation | Apparatus, system, and method for facilitating monitoring and responding to error events |
-
2008
- 2008-06-03 US US12/132,550 patent/US7904752B2/en not_active Expired - Fee Related
-
2009
- 2009-05-28 EP EP09757448A patent/EP2283612B1/en active Active
- 2009-05-28 JP JP2011512077A patent/JP5255697B2/ja active Active
- 2009-05-28 WO PCT/EP2009/056557 patent/WO2009147066A1/en active Application Filing
- 2009-05-28 KR KR1020107027344A patent/KR101385910B1/ko active IP Right Grant
- 2009-05-28 CA CA2708976A patent/CA2708976C/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0955735A (ja) * | 1995-08-10 | 1997-02-25 | Nippon Telegr & Teleph Corp <Ntt> | 通信網故障診断システムおよび通信網故障診断方法 |
JPH09259050A (ja) * | 1996-03-19 | 1997-10-03 | Hitachi Ltd | コンピュータ周辺機器制御装置のエラー報告方法および周辺機器制御装置 |
JPH11296311A (ja) * | 1998-04-08 | 1999-10-29 | Hitachi Ltd | 記憶装置の耐故障制御方式 |
JP2003345679A (ja) * | 2002-05-28 | 2003-12-05 | Nippon Telegr & Teleph Corp <Ntt> | サーバシステム、仲介装置、及び、クライアントサーバ型システムにおける誤り隠蔽方法 |
JP2006164304A (ja) * | 2006-01-20 | 2006-06-22 | Hitachi Ltd | ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法 |
JP2008083896A (ja) * | 2006-09-27 | 2008-04-10 | Fujitsu Ltd | 異常の発生源の特定方法、システム運用方法、基地局制御システム運営方法、および処理システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540878A (zh) * | 2019-09-20 | 2021-03-23 | 富士通株式会社 | 信息处理设备、信息处理系统及非暂态存储介质 |
JP2021051351A (ja) * | 2019-09-20 | 2021-04-01 | 富士通株式会社 | 情報処理装置,情報処理システム及び通信管理プログラム |
JP7338354B2 (ja) | 2019-09-20 | 2023-09-05 | 富士通株式会社 | 情報処理装置,情報処理システム及び通信管理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US7904752B2 (en) | 2011-03-08 |
CA2708976C (en) | 2015-04-21 |
WO2009147066A1 (en) | 2009-12-10 |
US20090300436A1 (en) | 2009-12-03 |
WO2009147066A4 (en) | 2010-02-11 |
EP2283612A1 (en) | 2011-02-16 |
KR101385910B1 (ko) | 2014-04-15 |
EP2283612B1 (en) | 2013-04-03 |
JP5255697B2 (ja) | 2013-08-07 |
CA2708976A1 (en) | 2009-12-10 |
KR20110022587A (ko) | 2011-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220318100A1 (en) | Methods for securely facilitating data protection workflows and devices thereof | |
JP6476348B2 (ja) | 自動スイッチオーバーの実装 | |
US8117169B2 (en) | Performing scheduled backups of a backup node associated with a plurality of agent nodes | |
US20210075665A1 (en) | Implementing switchover operations between computing nodes | |
US10015283B2 (en) | Remote procedure call management | |
US10489230B1 (en) | Chaining log operations in data replication groups | |
US10853210B2 (en) | Storage device health status synchronization | |
US10623178B2 (en) | System and method for secure messaging between distributed computing nodes | |
US20140059315A1 (en) | Computer system, data management method and data management program | |
JP5255697B2 (ja) | ノード間でのデバイス・エラー情報の同期化 | |
US9781201B2 (en) | Multicast transport | |
TW200805079A (en) | Consolidating session information for a cluster of sessions in a coupled session environment | |
US9720789B2 (en) | Multicast transport configuration | |
US20160110263A1 (en) | Fault policy implementation | |
US10567499B1 (en) | Unsupervised round robin catch up algorithm | |
US20090319700A1 (en) | Using device status information to takeover control of devices assigned to a node | |
US9836329B2 (en) | Decentralized processing of worker threads | |
US11126509B2 (en) | Method and system for efficient resource usage through intelligent reporting | |
US20160132841A1 (en) | Transacting across multiple transactional domains |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130419 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5255697 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |