JP6179101B2 - 管理装置、管理方法、および管理プログラム - Google Patents
管理装置、管理方法、および管理プログラム Download PDFInfo
- Publication number
- JP6179101B2 JP6179101B2 JP2013005450A JP2013005450A JP6179101B2 JP 6179101 B2 JP6179101 B2 JP 6179101B2 JP 2013005450 A JP2013005450 A JP 2013005450A JP 2013005450 A JP2013005450 A JP 2013005450A JP 6179101 B2 JP6179101 B2 JP 6179101B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- node
- state
- operating
- operating state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
Description
次に、第1の実施形態の変形例の情報処理システム100について、図面を参照して詳細に説明する。
図3は、第1の実施形態の第2の変形例の情報処理システム100全体の構成の例を表すブロック図である。
次に、第1の実施形態の構成例について、図面を参照して詳細に説明する。
2 ノード
3 BMC
4 主処理部
5 LAN
6 管理LAN
7、8 スイッチ
10 ノード情報記憶部
11 故障状態取得部
12 指示部
13 稼働検出部
20 処理実行部
21 クラスタ制御部
22 稼働状態送信部
23 故障検出部
24 起動部
27 クラスタウェア
28 サービス
100 情報処理システム
Claims (11)
- 複数の演算装置に対して、前記演算装置が、稼働している状態である稼働状態であるか、稼働していない状態である非稼働状態であるかを、前記演算装置の識別子に対応付けて記憶するノード情報記憶手段と、
前記非稼働状態である前記演算装置の各々から、当該演算装置に問い合わせを送信することによって当該演算装置の故障の有無を取得する故障状態取得を行う故障状態取得手段と、
前記稼働状態である前記演算装置の数が所定数に満たない場合、前記非稼働状態である場合に稼働指示を受信すると前記稼働状態に遷移する前記複数の演算装置のうち、前記故障状態取得において故障が無い、前記非稼働状態の前記演算装置に対して、前記稼働指示を送信する指示手段と
を含み、
前記演算装置は、所定時間、前記問い合わせを受信しない場合、前記稼働状態に遷移する、
管理装置。 - 前記故障状態取得手段は、前記演算装置に故障の有無の問い合わせを所定の時間間隔で送信して、前記演算装置の故障の有無を取得し、
前記所定時間は、前記所定の時間間隔よりも長い、
請求項1に記載の管理装置。 - 前記演算装置は、与えられた処理を行う主処理手段と、前記主処理手段が停止している状態である前記非稼働状態で自装置の故障の有無を検出する故障検出手段と、前記非稼働状態である場合に前記稼働指示を受信すると、前記主処理手段を起動して、前記主処理手段が稼働している状態である前記稼働状態に遷移させる起動手段を含む
請求項1又は2に記載の管理装置。 - 前記演算装置の各々に対して、当該演算装置が、前記稼働状態であるか、前記非稼働状態であるかを検出し、前記演算装置の識別子と検出された状態を対応付けて前記ノード情報記憶手段に格納する稼働検出手段
を含む請求項1乃至3のいずれかに記載の管理装置。 - 互いに通信可能な、複数の前記演算装置及び請求項1乃至4のいずれかに記載の管理装置を含む情報処理システム。
- 複数の演算装置に対して、前記演算装置が、稼働している状態である稼働状態であるか、稼働していない状態である非稼働状態であるかを、前記演算装置の識別子に対応付けてノード情報記憶手段に記憶し、
前記非稼働状態である前記演算装置の各々から、当該演算装置に問い合わせを送信することによって当該演算装置の故障の有無を取得する故障状態取得を行い、
前記稼働状態である前記演算装置の数が所定数に満たない場合、前記非稼働状態である場合に稼働指示を受信すると前記稼働状態に遷移する前記複数の演算装置のうち、前記故障状態取得において故障が無い、前記非稼働状態の前記演算装置に対して、前記稼働指示を送信し、
前記演算装置は、所定時間、前記問い合わせを受信しない場合、前記稼働状態に遷移する、
管理方法。 - コンピュータを、
複数の演算装置に対して、前記演算装置が、稼働している状態である稼働状態であるか、稼働していない状態である非稼働状態であるかを、前記演算装置の識別子に対応付けて記憶するノード情報記憶手段と、
前記非稼働状態である前記演算装置の各々から、当該演算装置に問い合わせを送信することによって当該演算装置の故障の有無を取得する故障状態取得を行う故障状態取得手段と、
前記稼働状態である前記演算装置の数が所定数に満たない場合、前記非稼働状態である場合に稼働指示を受信すると前記稼働状態に遷移する前記複数の演算装置のうち、前記故障状態取得において故障が無い、前記非稼働状態の前記演算装置に対して、前記稼働指示を送信する指示手段として動作させ、
前記演算装置は、所定時間、前記問い合わせを受信しない場合、前記稼働状態に遷移する、
管理プログラム。 - コンピュータを、
前記演算装置に故障の有無の問い合わせを所定の時間間隔で送信して、前記演算装置の故障の有無を取得する前記故障状態取得手段として動作させ、
前記所定時間は、前記所定の時間間隔よりも長い、
請求項7に記載の管理プログラム。 - 前記演算装置は、与えられた処理を行う主処理手段と、前記主処理手段が停止している状態である前記非稼働状態で自装置の故障の有無を検出する故障検出手段と、前記非稼働状態である場合に前記稼働指示を受信すると、前記主処理手段を起動して、前記主処理手段が稼働している状態である前記稼働状態に遷移させる起動手段を含む
請求項7又は8に記載の管理プログラム。 - コンピュータを、
前記演算装置の各々に対して、当該演算装置が、前記稼働状態であるか、前記非稼働状態であるかを検出し、前記演算装置の識別子と検出された状態を対応付けて前記ノード情報記憶手段に格納する稼働検出手段
として動作させる請求項7乃至9のいずれかに記載の管理プログラム。 - 管理装置から故障の有無の問い合わせを受信すると、故障の有無を前記管理装置に送信する故障検出手段と、
前記管理装置から、故障の有無に基づいて送信される稼働指示を受信すると、稼働していない状態である非稼働状態から稼働している状態である稼働状態に遷移する起動手段と、
を含み、
前記起動手段は、前記非稼働状態で所定時間、前記問い合わせを受信しない場合、前記稼働状態に遷移する、
演算装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013005450A JP6179101B2 (ja) | 2013-01-16 | 2013-01-16 | 管理装置、管理方法、および管理プログラム |
US14/156,597 US9442784B2 (en) | 2013-01-16 | 2014-01-16 | Management device, management method, and medium storing management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013005450A JP6179101B2 (ja) | 2013-01-16 | 2013-01-16 | 管理装置、管理方法、および管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014137681A JP2014137681A (ja) | 2014-07-28 |
JP6179101B2 true JP6179101B2 (ja) | 2017-08-16 |
Family
ID=51166210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013005450A Active JP6179101B2 (ja) | 2013-01-16 | 2013-01-16 | 管理装置、管理方法、および管理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9442784B2 (ja) |
JP (1) | JP6179101B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9917798B2 (en) * | 2013-07-09 | 2018-03-13 | Nevion Europe As | Compact router with redundancy |
KR102243028B1 (ko) * | 2014-04-22 | 2021-04-21 | 에스케이플래닛 주식회사 | 비콘장치의 상태 확인 방법, 이를 위한 시스템 및 장치 |
US10360116B2 (en) * | 2015-02-13 | 2019-07-23 | International Business Machines Corporation | Disk preservation and failure prevention in a raid array |
US9952948B2 (en) * | 2016-03-23 | 2018-04-24 | GM Global Technology Operations LLC | Fault-tolerance pattern and switching protocol for multiple hot and cold standby redundancies |
US10102085B2 (en) * | 2016-08-25 | 2018-10-16 | GM Global Technology Operations LLC | Coordinated multi-mode allocation and runtime switching for systems with dynamic fault-tolerance requirements |
CN115043446B (zh) * | 2020-06-16 | 2024-01-23 | 浙江富春紫光环保股份有限公司 | 基于异常分类模型的污水处理进程的异常监控方法与系统 |
CN115826393A (zh) * | 2023-02-15 | 2023-03-21 | 西安羚控电子科技有限公司 | 一种飞控系统的双余度管理方法及装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0325560A (ja) * | 1989-06-22 | 1991-02-04 | Yokogawa Electric Corp | ネットワークの稼動状況管理方法 |
JPH06195318A (ja) * | 1992-12-24 | 1994-07-15 | Kanebo Ltd | 分散処理システム |
US7400996B2 (en) * | 2003-06-26 | 2008-07-15 | Benjamin Thomas Percer | Use of I2C-based potentiometers to enable voltage rail variation under BMC control |
US7401256B2 (en) * | 2004-04-27 | 2008-07-15 | Hitachi, Ltd. | System and method for highly available data processing in cluster system |
WO2007094041A1 (ja) * | 2006-02-14 | 2007-08-23 | Fujitsu Limited | サーバ管理装置及びサーバ管理プログラム |
JP4923990B2 (ja) * | 2006-12-04 | 2012-04-25 | 株式会社日立製作所 | フェイルオーバ方法、およびその計算機システム。 |
JP5022062B2 (ja) * | 2007-03-01 | 2012-09-12 | 株式会社日立製作所 | プールi/oデバイス動作確認方法、及び計算機システム |
JP4448878B2 (ja) * | 2007-12-06 | 2010-04-14 | 株式会社日立製作所 | 障害回復環境の設定方法 |
JP4572250B2 (ja) | 2008-09-11 | 2010-11-04 | 株式会社日立製作所 | 計算機切り替え方法、計算機切り替えプログラム及び計算機システム |
JP2010113495A (ja) * | 2008-11-06 | 2010-05-20 | Nomura Research Institute Ltd | クラスタシステムおよびクラスタ制御方法 |
US8467929B2 (en) * | 2009-08-24 | 2013-06-18 | Robert Bosch Gmbh | Good checking for vehicle wheel speed sensors |
US8286034B2 (en) * | 2010-07-20 | 2012-10-09 | Oracle America, Inc. | Accurate fault status tracking of variable access sensors |
JP5716460B2 (ja) | 2011-03-03 | 2015-05-13 | 日本電気株式会社 | クラスタシステムおよびその制御方法 |
-
2013
- 2013-01-16 JP JP2013005450A patent/JP6179101B2/ja active Active
-
2014
- 2014-01-16 US US14/156,597 patent/US9442784B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20140201577A1 (en) | 2014-07-17 |
US9442784B2 (en) | 2016-09-13 |
JP2014137681A (ja) | 2014-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6179101B2 (ja) | 管理装置、管理方法、および管理プログラム | |
US9189349B2 (en) | Distributed blade server system, management server and switching method | |
JP4572250B2 (ja) | 計算機切り替え方法、計算機切り替えプログラム及び計算機システム | |
JP6007522B2 (ja) | クラスタシステム | |
JP5858144B2 (ja) | 情報処理システム、障害検知方法および情報処理装置 | |
US10728099B2 (en) | Method for processing virtual machine cluster and computer system | |
US9208124B2 (en) | Reset of processing core in multi-core processing system | |
JP2012022562A (ja) | 通信監視装置及び方法、プログラム | |
JP6130520B2 (ja) | 多重系システムおよび多重系システム管理方法 | |
CN107071189B (zh) | 一种通讯设备物理接口的连接方法 | |
US8819160B2 (en) | Network-connectable device and method for managing power thereof | |
JP5056504B2 (ja) | 制御装置、情報処理システム、情報処理システムの制御方法および情報処理システムの制御プログラム | |
JP5285045B2 (ja) | 仮想環境における故障復旧方法及びサーバ及びプログラム | |
KR102131863B1 (ko) | 라우팅 처리기의 동작 모드 천이 방법 | |
JP2018056633A (ja) | クラスタシステム、サーバ、サーバの動作方法、及びプログラム | |
CN114124803B (zh) | 设备管理方法、装置、电子设备及存储介质 | |
CN108234215B (zh) | 一种网关的创建方法、装置、计算机设备及存储介质 | |
JP2010152742A (ja) | 通信制御装置 | |
JP5504950B2 (ja) | サーバシステムの障害監視装置、サーバシステム、及びサーバシステムの障害監視方法 | |
JP2010244129A (ja) | 計算機システム | |
JP2010157024A (ja) | ディスクアレイ装置、ディスクアレイ装置における電源制御方法及び電源制御プログラム | |
JP6580913B2 (ja) | 電子装置、管理装置、情報処理装置、制御システムおよび電源制御方法、並びにコンピュータ・プログラム | |
JP2013149201A (ja) | 情報処理システム、及び、情報処理システムの制御方法 | |
JP2007074252A (ja) | 高可用性通信装置、障害管理方法、およびプログラム | |
US20180145866A1 (en) | Storage system enclosures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6179101 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |