JP2014137681A - 管理装置、管理方法、および管理プログラム - Google Patents
管理装置、管理方法、および管理プログラム Download PDFInfo
- Publication number
- JP2014137681A JP2014137681A JP2013005450A JP2013005450A JP2014137681A JP 2014137681 A JP2014137681 A JP 2014137681A JP 2013005450 A JP2013005450 A JP 2013005450A JP 2013005450 A JP2013005450 A JP 2013005450A JP 2014137681 A JP2014137681 A JP 2014137681A
- Authority
- JP
- Japan
- Prior art keywords
- node
- failure
- operating
- operating state
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
Abstract
【解決手段】 本発明の管理装置は、複数の演算装置に対して、前記演算装置が、稼働している状態である稼働状態であるか、稼働していない状態である非稼働状態であるかを、前記演算装置の識別子に対応付けて記憶するノード情報記憶手段と、前記非稼働状態である前記演算装置の各々から、故障の有無を取得する故障状態取得手段と、前記稼働状態である前記演算装置の数が所定数に満たない場合、前記非稼働状態である場合に稼働指示を受信すると前記稼働状態に遷移する前記複数の演算装置のうち、前記監視において故障が無い、前記非稼働状態の前記演算装置に対して、前記稼働指示を送信する指示手段とを含む。
【選択図】 図14
Description
次に、第1の実施形態の変形例の情報処理システム100について、図面を参照して詳細に説明する。
図3は、第1の実施形態の第2の変形例の情報処理システム100全体の構成の例を表すブロック図である。
次に、第1の実施形態の構成例について、図面を参照して詳細に説明する。
2 ノード
3 BMC
4 主処理部
5 LAN
6 管理LAN
7、8 スイッチ
10 ノード情報記憶部
11 故障状態取得部
12 指示部
13 稼働検出部
20 処理実行部
21 クラスタ制御部
22 稼働状態送信部
23 故障検出部
24 起動部
27 クラスタウェア
28 サービス
100 情報処理システム
Claims (10)
- 複数の演算装置に対して、前記演算装置が、稼働している状態である稼働状態であるか、稼働していない状態である非稼働状態であるかを、前記演算装置の識別子に対応付けて記憶するノード情報記憶手段と、
前記非稼働状態である前記演算装置の各々から、故障の有無を取得する故障状態取得手段と、
前記稼働状態である前記演算装置の数が所定数に満たない場合、前記非稼働状態である場合に稼働指示を受信すると前記稼働状態に遷移する前記複数の演算装置のうち、前記監視において故障が無い、前記非稼働状態の前記演算装置に対して、前記稼働指示を送信する指示手段と
を含む管理装置。 - 前記故障状態取得手段は、前記演算装置に故障の有無の問い合わせを所定の時間間隔で送信して、前記演算装置の故障の有無を取得し、
前記演算装置は、前記非稼働状態で前記所定の時間間隔以上の長さの所定時間、前記問い合わせを受信しない場合、前記稼働状態に遷移する
請求項1に記載の管理装置。 - 前記演算装置は、与えられた処理を行う主処理手段と、前記主処理手段が停止している状態である前記非稼働状態で自装置の故障の有無を検出する故障検出手段と、前記非稼働状態である場合に前記稼働指示を受信すると、前記主処理部を起動して、前記主処理手段が稼働している状態である前記稼働状態に遷移させる起動手段を含む
請求項1又は2に記載の管理装置。 - 前記演算装置の各々に対して、当該演算装置が、前記稼働状態であるか、前記非稼働状態であるかを検出し、前記演算装置の識別子と検出された状態を対応付けて前記ノード情報記憶部に格納する稼働検出手段
を含む請求項1乃至3のいずれかに記載の管理装置。 - 互いに通信可能な、複数の前記演算装置及び請求項1乃至4のいずれかに記載の管理装置を含む情報処理システム。
- 複数の演算装置に対して、前記演算装置が、稼働している状態である稼働状態であるか、稼働していない状態である非稼働状態であるかを、前記演算装置の識別子に対応付けてノード情報記憶手段に記憶し、
前記非稼働状態である前記演算装置の各々から、故障の有無を取得し、
前記稼働状態である前記演算装置の数が所定数に満たない場合、前記非稼働状態である場合に稼働指示を受信すると前記稼働状態に遷移する前記複数の演算装置のうち、前記監視において故障が無い、前記非稼働状態の前記演算装置に対して、前記稼働指示を送信する
管理方法。 - コンピュータを、
複数の演算装置に対して、前記演算装置が、稼働している状態である稼働状態であるか、稼働していない状態である非稼働状態であるかを、前記演算装置の識別子に対応付けて記憶するノード情報記憶手段と、
前記非稼働状態である前記演算装置の各々から、故障の有無を取得する故障状態取得手段と、
前記稼働状態である前記演算装置の数が所定数に満たない場合、前記非稼働状態である場合に稼働指示を受信すると前記稼働状態に遷移する前記複数の演算装置のうち、前記監視において故障が無い、前記非稼働状態の前記演算装置に対して、前記稼働指示を送信する指示手段と
して動作させる管理プログラム。 - コンピュータを、
前記演算装置に故障の有無の問い合わせを所定の時間間隔で送信して、前記演算装置の故障の有無を取得する前記故障状態取得手段として動作させ、
前記演算装置は、前記非稼働状態で前記所定の時間間隔以上の長さの所定時間、前記問い合わせを受信しない場合、前記稼働状態に遷移する
請求項7に記載の管理プログラム。 - 前記演算装置は、与えられた処理を行う主処理手段と、前記主処理手段が停止している状態である前記非稼働状態で自装置の故障の有無を検出する故障検出手段と、前記非稼働状態である場合に前記稼働指示を受信すると、前記主処理部を起動して、前記主処理手段が稼働している状態である前記稼働状態に遷移させる起動手段を含む
請求項7又は8に記載の管理プログラム。 - コンピュータを、
前記演算装置の各々に対して、当該演算装置が、前記稼働状態であるか、前記非稼働状態であるかを検出し、前記演算装置の識別子と検出された状態を対応付けて前記ノード情報記憶部に格納する稼働検出手段
として動作させる請求項7乃至9のいずれかに記載の管理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013005450A JP6179101B2 (ja) | 2013-01-16 | 2013-01-16 | 管理装置、管理方法、および管理プログラム |
US14/156,597 US9442784B2 (en) | 2013-01-16 | 2014-01-16 | Management device, management method, and medium storing management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013005450A JP6179101B2 (ja) | 2013-01-16 | 2013-01-16 | 管理装置、管理方法、および管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014137681A true JP2014137681A (ja) | 2014-07-28 |
JP6179101B2 JP6179101B2 (ja) | 2017-08-16 |
Family
ID=51166210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013005450A Active JP6179101B2 (ja) | 2013-01-16 | 2013-01-16 | 管理装置、管理方法、および管理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9442784B2 (ja) |
JP (1) | JP6179101B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115826393A (zh) * | 2023-02-15 | 2023-03-21 | 西安羚控电子科技有限公司 | 一种飞控系统的双余度管理方法及装置 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9917798B2 (en) * | 2013-07-09 | 2018-03-13 | Nevion Europe As | Compact router with redundancy |
KR102243028B1 (ko) * | 2014-04-22 | 2021-04-21 | 에스케이플래닛 주식회사 | 비콘장치의 상태 확인 방법, 이를 위한 시스템 및 장치 |
US10360116B2 (en) * | 2015-02-13 | 2019-07-23 | International Business Machines Corporation | Disk preservation and failure prevention in a raid array |
US9952948B2 (en) * | 2016-03-23 | 2018-04-24 | GM Global Technology Operations LLC | Fault-tolerance pattern and switching protocol for multiple hot and cold standby redundancies |
US10102085B2 (en) * | 2016-08-25 | 2018-10-16 | GM Global Technology Operations LLC | Coordinated multi-mode allocation and runtime switching for systems with dynamic fault-tolerance requirements |
CN115043446B (zh) * | 2020-06-16 | 2024-01-23 | 浙江富春紫光环保股份有限公司 | 基于异常分类模型的污水处理进程的异常监控方法与系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0325560A (ja) * | 1989-06-22 | 1991-02-04 | Yokogawa Electric Corp | ネットワークの稼動状況管理方法 |
JPH06195318A (ja) * | 1992-12-24 | 1994-07-15 | Kanebo Ltd | 分散処理システム |
WO2007094041A1 (ja) * | 2006-02-14 | 2007-08-23 | Fujitsu Limited | サーバ管理装置及びサーバ管理プログラム |
JP2008140198A (ja) * | 2006-12-04 | 2008-06-19 | Hitachi Ltd | フェイルオーバ方法、およびその計算機システム。 |
JP2009140194A (ja) * | 2007-12-06 | 2009-06-25 | Hitachi Ltd | 障害回復環境の設定方法 |
JP2010113495A (ja) * | 2008-11-06 | 2010-05-20 | Nomura Research Institute Ltd | クラスタシステムおよびクラスタ制御方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7400996B2 (en) * | 2003-06-26 | 2008-07-15 | Benjamin Thomas Percer | Use of I2C-based potentiometers to enable voltage rail variation under BMC control |
US7401256B2 (en) * | 2004-04-27 | 2008-07-15 | Hitachi, Ltd. | System and method for highly available data processing in cluster system |
JP5022062B2 (ja) * | 2007-03-01 | 2012-09-12 | 株式会社日立製作所 | プールi/oデバイス動作確認方法、及び計算機システム |
JP4572250B2 (ja) | 2008-09-11 | 2010-11-04 | 株式会社日立製作所 | 計算機切り替え方法、計算機切り替えプログラム及び計算機システム |
US8467929B2 (en) * | 2009-08-24 | 2013-06-18 | Robert Bosch Gmbh | Good checking for vehicle wheel speed sensors |
US8286034B2 (en) * | 2010-07-20 | 2012-10-09 | Oracle America, Inc. | Accurate fault status tracking of variable access sensors |
JP5716460B2 (ja) | 2011-03-03 | 2015-05-13 | 日本電気株式会社 | クラスタシステムおよびその制御方法 |
-
2013
- 2013-01-16 JP JP2013005450A patent/JP6179101B2/ja active Active
-
2014
- 2014-01-16 US US14/156,597 patent/US9442784B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0325560A (ja) * | 1989-06-22 | 1991-02-04 | Yokogawa Electric Corp | ネットワークの稼動状況管理方法 |
JPH06195318A (ja) * | 1992-12-24 | 1994-07-15 | Kanebo Ltd | 分散処理システム |
WO2007094041A1 (ja) * | 2006-02-14 | 2007-08-23 | Fujitsu Limited | サーバ管理装置及びサーバ管理プログラム |
JP2008140198A (ja) * | 2006-12-04 | 2008-06-19 | Hitachi Ltd | フェイルオーバ方法、およびその計算機システム。 |
JP2009140194A (ja) * | 2007-12-06 | 2009-06-25 | Hitachi Ltd | 障害回復環境の設定方法 |
JP2010113495A (ja) * | 2008-11-06 | 2010-05-20 | Nomura Research Institute Ltd | クラスタシステムおよびクラスタ制御方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115826393A (zh) * | 2023-02-15 | 2023-03-21 | 西安羚控电子科技有限公司 | 一种飞控系统的双余度管理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6179101B2 (ja) | 2017-08-16 |
US20140201577A1 (en) | 2014-07-17 |
US9442784B2 (en) | 2016-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6179101B2 (ja) | 管理装置、管理方法、および管理プログラム | |
US9189349B2 (en) | Distributed blade server system, management server and switching method | |
JP4572250B2 (ja) | 計算機切り替え方法、計算機切り替えプログラム及び計算機システム | |
JP5858144B2 (ja) | 情報処理システム、障害検知方法および情報処理装置 | |
JP6007522B2 (ja) | クラスタシステム | |
JP2013030863A (ja) | スイッチ装置の制御システム、その構成制御装置および構成制御方法 | |
US10728099B2 (en) | Method for processing virtual machine cluster and computer system | |
US9208124B2 (en) | Reset of processing core in multi-core processing system | |
JP2012022562A (ja) | 通信監視装置及び方法、プログラム | |
JPWO2015104841A1 (ja) | 多重系システムおよび多重系システム管理方法 | |
JP2018045310A (ja) | 情報処理装置及びその制御方法、コンピュータプログラム | |
CN107071189B (zh) | 一种通讯设备物理接口的连接方法 | |
KR102131863B1 (ko) | 라우팅 처리기의 동작 모드 천이 방법 | |
JP5285045B2 (ja) | 仮想環境における故障復旧方法及びサーバ及びプログラム | |
JP2009223368A (ja) | クラスタリング制御装置、制御システム、制御方法及び制御プログラム | |
JP2018056633A (ja) | クラスタシステム、サーバ、サーバの動作方法、及びプログラム | |
CN114124803B (zh) | 设备管理方法、装置、电子设备及存储介质 | |
CN111510336B (zh) | 一种网络设备状态管理方法及装置 | |
TWI697224B (zh) | 通信系統、通信裝置及電腦程式產品 | |
CN108234215B (zh) | 一种网关的创建方法、装置、计算机设备及存储介质 | |
JP2010152742A (ja) | 通信制御装置 | |
JP2013156963A (ja) | 制御プログラム、制御方法、情報処理装置、制御システム | |
JP2010157024A (ja) | ディスクアレイ装置、ディスクアレイ装置における電源制御方法及び電源制御プログラム | |
JP2010244129A (ja) | 計算機システム | |
JP6580913B2 (ja) | 電子装置、管理装置、情報処理装置、制御システムおよび電源制御方法、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6179101 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |