JP4246248B2 - クラスタシステムのコンピュータにおいて実行されるネットワークモニタ・プログラム、情報処理方法及びコンピュータ - Google Patents
クラスタシステムのコンピュータにおいて実行されるネットワークモニタ・プログラム、情報処理方法及びコンピュータ Download PDFInfo
- Publication number
- JP4246248B2 JP4246248B2 JP2007544030A JP2007544030A JP4246248B2 JP 4246248 B2 JP4246248 B2 JP 4246248B2 JP 2007544030 A JP2007544030 A JP 2007544030A JP 2007544030 A JP2007544030 A JP 2007544030A JP 4246248 B2 JP4246248 B2 JP 4246248B2
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- computer
- relay device
- node
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2035—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0893—Assignment of logical groups to network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computer And Data Communications (AREA)
- Hardware Redundancy (AREA)
Description
Claims (5)
- クラスタシステムに含まれるコンピュータで動作するネットワークモニタ・プログラムであって、
前記コンピュータへの業務リクエストを中継する中継装置から生存確認メッセージに対する応答を受信できなかった場合、前記クラスタシステムに含まれる他のコンピュータの状況データを取得するステップと、
前記他のコンピュータの状況データが前記他のコンピュータのいずれかが使用可能な状態であることを示している場合、当該使用可能な状態のコンピュータが前記中継装置と通信可能か確認するステップと、
前記使用可能な状態のコンピュータが前記中継装置と通信可能であると確認できた場合に、クラスタマネージャに通信障害の発生を通知するステップと、
を上記コンピュータに実行させるためのネットワークモニタ・プログラム。 - 前記他のコンピュータの状況データが前記他のコンピュータのいずれもが使用不能な状態であることを示している場合、前記中継装置へ第2の生存確認メッセージを送信して、前記中継装置からの応答を待つステップ、
をさらに実行させるための請求項1記載のネットワークモニタ・プログラム。 - 前記使用可能状態のコンピュータのいずれもが前記中継装置と通信不能であると確認された場合、前記中継装置へ第2の生存確認メッセージを送信して、前記中継装置からの応答を待つステップ、
をさらに実行させるための請求項1記載のネットワークモニタ・プログラム。 - クラスタシステムに含まれるコンピュータに実行される情報処理方法であって、
前記コンピュータへの業務リクエストを中継する中継装置から生存確認メッセージに対する応答を受信できなかった場合、前記クラスタシステムに含まれる他のコンピュータの状況データを取得するステップと、
前記他のコンピュータの状況データが前記他のコンピュータのいずれかが使用可能な状態であることを示している場合、当該使用可能な状態のコンピュータが前記中継装置と通信可能か確認するステップと、
前記使用可能な状態のコンピュータが前記中継装置と通信可能であると確認できた場合に、クラスタマネージャに通信障害の発生を通知するステップと、
を含む情報処理方法。 - クラスタシステムに含まれるコンピュータであって、
ネットワークモニタと、
クラスタマネージャと、
を有し、
前記ネットワークモニタが、
前記コンピュータへの業務リクエストを中継する中継装置から生存確認メッセージに対する応答を受信できなかった場合、前記クラスタシステムに含まれる他のコンピュータの状況データを取得する手段と、
前記他のコンピュータの状況データが前記他のコンピュータのいずれかが使用可能な状態であることを示している場合、当該使用可能な状態のコンピュータが前記中継装置と通信可能か確認する手段と、
前記使用可能な状態のコンピュータが前記中継装置と通信可能であると確認できた場合に、前記クラスタマネージャに通信障害の発生を通知する手段と、
を有するコンピュータ。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2005/020708 WO2007055014A1 (ja) | 2005-11-11 | 2005-11-11 | クラスタシステムのコンピュータにおいて実行されるネットワークモニタ・プログラム、情報処理方法及びコンピュータ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4246248B2 true JP4246248B2 (ja) | 2009-04-02 |
JPWO2007055014A1 JPWO2007055014A1 (ja) | 2009-04-30 |
Family
ID=38023025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007544030A Expired - Fee Related JP4246248B2 (ja) | 2005-11-11 | 2005-11-11 | クラスタシステムのコンピュータにおいて実行されるネットワークモニタ・プログラム、情報処理方法及びコンピュータ |
Country Status (3)
Country | Link |
---|---|
US (1) | US8332506B2 (ja) |
JP (1) | JP4246248B2 (ja) |
WO (1) | WO2007055014A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007304687A (ja) * | 2006-05-09 | 2007-11-22 | Hitachi Ltd | クラスタ構成とその制御手段 |
US8589534B2 (en) * | 2007-09-13 | 2013-11-19 | Ricoh Company, Ltd. | Device information management apparatus, device information management method, and storage medium which operates during a failure |
KR100956638B1 (ko) * | 2007-12-11 | 2010-05-11 | 한국전자통신연구원 | 대규모 클러스터 모니터링 시스템과 그의 자동 구축 및복구 방법 |
FR2931970B1 (fr) * | 2008-05-27 | 2010-06-11 | Bull Sas | Procede de generation de requetes de manipulation d'une base de donnees d'initialisation et d'administration d'une grappe de serveurs , support de donnees et grappe de serveurs correspondants |
US8836515B2 (en) * | 2009-03-26 | 2014-09-16 | Denver Health and Hospital Authority | Flexible head of bed elevation device and alarm |
WO2013030908A1 (ja) * | 2011-08-26 | 2013-03-07 | 富士通株式会社 | スケジューリングシステム、データ処理システムおよびスケジューリング方法 |
JP5782925B2 (ja) * | 2011-08-31 | 2015-09-24 | 富士通株式会社 | 情報処理装置、プログラム、および制御方法 |
JP6007522B2 (ja) * | 2012-03-09 | 2016-10-12 | 日本電気株式会社 | クラスタシステム |
US20170255506A1 (en) * | 2016-03-07 | 2017-09-07 | Dell Software, Inc. | Monitoring, analyzing, and mapping of computing resources |
US11075925B2 (en) | 2018-01-31 | 2021-07-27 | EMC IP Holding Company LLC | System and method to enable component inventory and compliance in the platform |
US10754708B2 (en) | 2018-03-28 | 2020-08-25 | EMC IP Holding Company LLC | Orchestrator and console agnostic method to deploy infrastructure through self-describing deployment templates |
US10693722B2 (en) | 2018-03-28 | 2020-06-23 | Dell Products L.P. | Agentless method to bring solution and cluster awareness into infrastructure and support management portals |
US11086738B2 (en) * | 2018-04-24 | 2021-08-10 | EMC IP Holding Company LLC | System and method to automate solution level contextual support |
US10795756B2 (en) | 2018-04-24 | 2020-10-06 | EMC IP Holding Company LLC | System and method to predictively service and support the solution |
US11599422B2 (en) | 2018-10-16 | 2023-03-07 | EMC IP Holding Company LLC | System and method for device independent backup in distributed system |
US10862761B2 (en) | 2019-04-29 | 2020-12-08 | EMC IP Holding Company LLC | System and method for management of distributed systems |
US11301557B2 (en) | 2019-07-19 | 2022-04-12 | Dell Products L.P. | System and method for data processing device management |
JP7440747B2 (ja) * | 2020-01-27 | 2024-02-29 | 富士通株式会社 | 情報処理装置、情報処理システムおよびネットワーク疎通確認方法 |
CN114928654A (zh) * | 2022-06-07 | 2022-08-19 | 中国工商银行股份有限公司 | 节点状态监测方法、装置、设备、存储介质和程序产品 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04291628A (ja) | 1991-03-20 | 1992-10-15 | Hitachi Ltd | 複合サブシステム形オンラインシステムの障害回復方式 |
JP2687927B2 (ja) | 1995-05-24 | 1997-12-08 | 日本電気株式会社 | 外部バスの障害検出方法 |
JP3141746B2 (ja) * | 1995-09-14 | 2001-03-05 | 横河電機株式会社 | 二重化制御装置 |
JP3248485B2 (ja) * | 1998-05-29 | 2002-01-21 | 日本電気株式会社 | クラスタシステム、クラスタシステムにおける監視方式およびその方法 |
US7284147B2 (en) * | 2003-08-27 | 2007-10-16 | International Business Machines Corporation | Reliable fault resolution in a cluster |
GB0410150D0 (en) * | 2004-05-07 | 2004-06-09 | Ibm | Methods,apparatus and computer programs for recovery from failures in a computing environment |
-
2005
- 2005-11-11 WO PCT/JP2005/020708 patent/WO2007055014A1/ja active Application Filing
- 2005-11-11 JP JP2007544030A patent/JP4246248B2/ja not_active Expired - Fee Related
-
2008
- 2008-04-29 US US12/111,451 patent/US8332506B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPWO2007055014A1 (ja) | 2009-04-30 |
US20080201470A1 (en) | 2008-08-21 |
WO2007055014A1 (ja) | 2007-05-18 |
US8332506B2 (en) | 2012-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4246248B2 (ja) | クラスタシステムのコンピュータにおいて実行されるネットワークモニタ・プログラム、情報処理方法及びコンピュータ | |
KR101099822B1 (ko) | 액티브 라우팅 컴포넌트 장애 처리 방법 및 장치 | |
US10911295B2 (en) | Server apparatus, cluster system, cluster control method and program | |
JP4588262B2 (ja) | ルータ及びネットワークにおける一時停止方法 | |
JP4580372B2 (ja) | ネットワークシステム | |
JP5285045B2 (ja) | 仮想環境における故障復旧方法及びサーバ及びプログラム | |
JP2007058708A (ja) | 多重系システム | |
JP2010067115A (ja) | データ記憶システム、データ記憶方法 | |
JP4806382B2 (ja) | 冗長化システム | |
KR0133337B1 (ko) | 타켓 시스템 이중화 운용관리 장치 및 방법 | |
JP2006246152A (ja) | パケット転送装置、パケット転送ネットワークシステムおよびパケット転送方法 | |
JP3493035B2 (ja) | 動的パス切替方法 | |
US11954509B2 (en) | Service continuation system and service continuation method between active and standby virtual servers | |
JPH1141282A (ja) | 二重化中継装置 | |
JP4863984B2 (ja) | 監視処理プログラム、方法及び装置 | |
JP2000020336A (ja) | 二重化通信システム | |
JP2008117268A (ja) | 情報管理システム | |
JP4191155B2 (ja) | 監視制御プログラム、監視制御装置、監視制御方法 | |
JP2008197907A (ja) | 監視ネットワークシステムおよびデータバックアップ方法 | |
JP2013254333A (ja) | 多重系制御システム及びその制御方法 | |
JP2007058679A (ja) | プロセス管理システム、プロセス管理方法及び冗長システム | |
JP2008166886A (ja) | 情報中継装置 | |
JP6301762B2 (ja) | 中継システムおよびスイッチ装置 | |
JP2015138987A (ja) | 通信システムおよび通信システムにおけるサービス復旧方法 | |
JPH09160875A (ja) | マルチエージェント相互バックアップ方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090107 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140116 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |