JP6217358B2 - 情報処理装置およびリカバリ管理方法 - Google Patents
情報処理装置およびリカバリ管理方法 Download PDFInfo
- Publication number
- JP6217358B2 JP6217358B2 JP2013249632A JP2013249632A JP6217358B2 JP 6217358 B2 JP6217358 B2 JP 6217358B2 JP 2013249632 A JP2013249632 A JP 2013249632A JP 2013249632 A JP2013249632 A JP 2013249632A JP 6217358 B2 JP6217358 B2 JP 6217358B2
- Authority
- JP
- Japan
- Prior art keywords
- function unit
- processing function
- unit
- address information
- recovery
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
- H04L41/0661—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
Description
図1は、実施例1に係るシステムの全体構成例を示す図である。図1に示すように、このシステムは、業務サーバ10と業務サーバ110とを有する。
図2は、実施例1に係る業務サーバの機能構成を示す機能ブロック図である。業務サーバ10と業務サーバ110とは同様の構成を有するので、ここでは業務サーバ10について説明する。
パーティション50は、図2に示すように、I/O部60と演算部70とを有する。I/O部60は、業務LAN通信部61とSAN通信部62とを有し、これらによって業務サービスに関する情報の送受信等を実行する。
図2に示すように、サーバ管理部80は、通信制御部81、サーバ環境情報テーブル82、送受信部83、検出部84、調整部85、監視部86、リカバリ実行部87を有する。なお、各処理部は、例えばプロセッサが実行するプロセスや電子回路なである。
図6は、実施例1に係るシステムが実行する処理の流れを示すフローチャートである。図6に示すように、リカバリ先のサーバ管理部80は、各業務サーバの各パーティションについてサーバ環境の設定が完了すると(S101:Yes)、S102を実行する。
このように、リカバリ先となるサーバ管理部80は、リカバリ発生前に、リカバリ後のサーバ環境を想定し、管理アドレスの重複が発生する場合には、事前に管理アドレスを再設定しておくことで、事前に不整合の発生を抑制できる。したがって、実際にネットワークブートによるリカバリが発生した場合に通常通り処理しても、エラーなくリカバリを完了させることができる。
図7は、実施例2に係る業務サーバの機能構成を示す機能ブロック図である。業務サーバ10と業務サーバ110とは同様の構成を有するので、ここでは業務サーバ10について説明する。また、実施例1と同様の機能を有する処理部等については、図2と同様の符号をつけたので、それらの詳細な説明は省略する。
図13は、実施例2に係るシステムが実行する処理の流れを示すフローチャートである。図13に示すように、サーバ管理部180がパーティション120の故障を検出すると(S201:Yes)、パーティション120は、パーティション120すなわち業務サーバを停止する(S202)。
このように、サーバ管理部80は、リカバリ先のパーティションが動作中であっても、リカバリ元のパーティションを正確にリカバリすることができる。したがって、停止中の待機系を用意しなくても、運用しているパーティションでリカバリすることができるので、効率的なサーバ運用を実現できる。また、リカバリ先のパーティションは、単純にアドレス情報を設定するだけでなく、オペレーティングシステムが参照できるようにBind IP−MACテーブル70bを更新することもできる。このため、リカバリ完了後に設定ミス等による通信断の発生を抑制できる。
上記実施例では、パーティション120をパーティション50でリカバリする例を説明したが、リカバリ対象をパーティションに限定するものではない。例えば、物理サーバをパーティションでリカバリすることもでき、パーティションを物理サーバでリカバリすることもでき、仮想マシン等を用いてリカバリすることもできる。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
本実施例で開示する業務サーバの構成例を図14に示す。図14は、業務サーバのハードウェア構成例を説明する図である。図14に示すように、各業務サーバは、バックプレーン100に複数の切換装置としてのクロスバとしてXB101、XB102などを有し、クロスバそれぞれにシステムボードとしてSB110〜SB113と入出力システムボードとしてIOSB150とを有する。なお、クロスバ、システムボード、入出力システムボードの数はあくまで例示であり、これに限定されるものではない。
20、50、120、150 パーティション
30、60、130、160 I/O部
31、61 業務LAN通信部
32、62 SAN通信部
40、70、140、170 演算部
70a 筐体内外情報テーブル
70b Bind IP−MACテーブル
70c ネットワーク情報テーブル
41、71 筐体内通信部
42、72 故障検出部
43、73 サーバ停止部
44、74 NW切替依頼部
45、75 仮想アドレス切替部
76 適用判定部
77 テーブル更新部
80、180 サーバ管理部
81 通信制御部
82 サーバ環境情報テーブル
83 送受信部
84 検出部
85 調整部
86 監視部
87 リカバリ実行部
Claims (7)
- 情報処理装置としての機能を発揮する処理機能部ごとに、当該処理機能部が使用する各デバイスに割当てられるアドレス情報と、各デバイスが接続されるネットワークが筐体内ネットワークか筐体外ネットワークかを示すネットワーク情報とを対応付けて記憶する記憶部と、
第1の管理ネットワークを介して監視される、前記情報処理装置としての機能を発揮する第1の処理機能部で、第2の管理ネットワークを介して監視される第2の処理機能部をリカバリさせる場合、前記記憶部を参照して、前記第2の処理機能部が筐体内ネットワークで使用する筐体内アドレス情報の変更が発生するか否かを判定する判定部と、
前記筐体内アドレス情報の変更が発生する場合、筐体内アドレス情報の変更を抑制するとともに筐体外ネットワークで使用される筐体外アドレス情報の変更を適用すると判定し、前記第1の処理機能部に対応する筐体内アドレス情報と前記第2の処理機能部に対応する筐体外アドレス情報とを設定して、前記第2の処理機能部を前記第1の処理機能部でリカバリするリカバリ実行部と
を有することを特徴とする情報処理装置。 - 前記リカバリ実行部は、停止中の前記第1の処理機能部で前記第2の処理機能部をリカバリさせる場合に、前記第2の処理機能部が使用する筐体内アドレス情報の変更が発生するときは、前記第1の管理ネットワークにおいて前記第2の処理機能部が使用する筐体内アドレス情報と競合する処理機能部のいずれかの前記筐体内アドレス情報を、競合しない筐体内アドレス情報に再設定して、前記第2の処理機能部をリカバリすることを特徴とする請求項1に記載の情報処理装置。
- 前記リカバリ実行部は、動作中の前記第1の処理機能部で前記第2の処理機能部をリカバリさせる場合に、前記第2の処理機能部が使用する筐体内アドレス情報の変更が発生するときは、リカバリ先の前記第1の処理機能部に元々設定されている筐体内アドレス情報をリカバリ後の前記筐体内アドレス情報に設定して競合を解消し、前記第2の処理機能部の筐体外アドレス情報を前記第1の処理機能部に設定し、前記第1の処理機能部内における前記筐体外アドレス情報の設定を有効にして、前記第2の処理機能部をリカバリすることを特徴とする請求項1または2に記載の情報処理装置。
- 前記第1の処理機能部は、第1のサーバ装置が有するパーティションであり、
前記第2の処理機能部は、前記第1のサーバ装置とは異なる第2のサーバ装置が有するパーティションであることを特徴とする請求項1に記載の情報処理装置。 - 前記判定部は、前記第2の処理機能部のリカバリが発生する前に、前記第2の処理機能部の前記筐体内アドレス情報の変更が発生するか否かを事前に判定し、
前記リカバリ実行部は、前記第2の処理機能部のリカバリが発生する前に、前記第1の処理機能部の筐体内アドレス情報と前記第2の処理機能部の筐体外アドレス情報とを、前記第1の処理機能部に事前に設定しておくことを特徴とする請求項1に記載の情報処理装置。 - 情報処理装置が、
情報処理装置としての機能を発揮する処理機能部ごとに、当該処理機能部が使用する各デバイスに割当てられるアドレス情報と、各デバイスが接続されるネットワークが筐体内ネットワークか筐体外ネットワークかを示すネットワーク情報とを対応付けて記憶する記憶部を参照し、
第1の管理ネットワークを介して監視される、前記情報処理装置としての機能を発揮する第1の処理機能部で、第2の管理ネットワークを介して監視される第2の処理機能部をリカバリさせる場合、前記第2の処理機能部が筐体内ネットワークで使用する筐体内アドレス情報の変更が発生するか否かを判定し、
前記筐体内アドレス情報の変更が発生する場合、筐体内アドレス情報の変更を抑制するとともに筐体外ネットワークで使用される筐体外アドレス情報の変更を適用すると判定し、前記第1の処理機能部に対応する筐体内アドレス情報と前記第2の処理機能部に対応する筐体外アドレス情報とを設定して、前記第2の処理機能部を前記第1の処理機能部でリカバリする
処理を含んだことを特徴とするリカバリ管理方法。 - 前記判定する処理は、前記第2の処理機能部のリカバリが発生する前に、前記第2の処理機能部の前記筐体内アドレス情報の変更が発生するか否かを事前に判定し、
前記リカバリする処理は、前記第2の処理機能部のリカバリが発生する前に、前記第1の処理機能部の筐体内アドレス情報と前記第2の処理機能部の筐体外アドレス情報とを、前記第1の処理機能部に事前に設定しておくことを特徴とする請求項6に記載のリカバリ管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013249632A JP6217358B2 (ja) | 2013-12-02 | 2013-12-02 | 情報処理装置およびリカバリ管理方法 |
US14/549,998 US20150154083A1 (en) | 2013-12-02 | 2014-11-21 | Information processing device and recovery management method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013249632A JP6217358B2 (ja) | 2013-12-02 | 2013-12-02 | 情報処理装置およびリカバリ管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015106385A JP2015106385A (ja) | 2015-06-08 |
JP6217358B2 true JP6217358B2 (ja) | 2017-10-25 |
Family
ID=53265420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013249632A Active JP6217358B2 (ja) | 2013-12-02 | 2013-12-02 | 情報処理装置およびリカバリ管理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20150154083A1 (ja) |
JP (1) | JP6217358B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102374767B1 (ko) * | 2020-09-29 | 2022-03-14 | 엘에스일렉트릭(주) | 웹 기반 인버터 설정복사 시스템 및 설정복사 장치 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3441264B2 (ja) * | 1995-09-26 | 2003-08-25 | 三菱電機株式会社 | 多重系システム |
US7499410B2 (en) * | 2001-12-26 | 2009-03-03 | Cisco Technology, Inc. | Fibre channel switch that enables end devices in different fabrics to communicate with one another while retaining their unique fibre channel domain—IDs |
JP4757670B2 (ja) * | 2006-03-16 | 2011-08-24 | 株式会社日立製作所 | システム切替方法、その計算機システム及びプログラム |
JP4279298B2 (ja) * | 2006-07-18 | 2009-06-17 | 株式会社東芝 | サービス及びipアドレスの引き継ぎが可能なコンピュータシステム及びプログラム |
US8108514B2 (en) * | 2008-04-02 | 2012-01-31 | International Business Machines Corporation | High availability of internet protocol addresses within a cluster |
JP4811489B2 (ja) * | 2009-03-27 | 2011-11-09 | 日本電気株式会社 | サーバシステム、集合型サーバ装置及びmacアドレス管理方法 |
JP5594668B2 (ja) * | 2010-10-21 | 2014-09-24 | データアクセス株式会社 | ノード、クラスタリングシステム、クラスタリングシステムの制御方法、およびプログラム |
US9923787B2 (en) * | 2012-04-27 | 2018-03-20 | International Business Machines Corporation | Network configuration predictive analytics engine |
-
2013
- 2013-12-02 JP JP2013249632A patent/JP6217358B2/ja active Active
-
2014
- 2014-11-21 US US14/549,998 patent/US20150154083A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20150154083A1 (en) | 2015-06-04 |
JP2015106385A (ja) | 2015-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10432470B2 (en) | Distributed subnet manager for InfiniBand networks | |
CN105743692B (zh) | 用于应用管理的基于策略的框架 | |
Yamato et al. | Fast and reliable restoration method of virtual resources on OpenStack | |
US9582377B1 (en) | Dynamic sizing of storage capacity for a remirror buffer | |
US11226753B2 (en) | Adaptive namespaces for multipath redundancy in cluster based computing systems | |
US9237093B2 (en) | Bandwidth on-demand adaptive routing | |
US20200073656A1 (en) | Method and Apparatus for Drift Management in Clustered Environments | |
GB2492620A (en) | Midplane for blade server management | |
JP2007172334A (ja) | 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム | |
CN106980529B (zh) | 基板管理控制器资源管理的电脑系统 | |
WO2018137520A1 (zh) | 一种业务恢复方法及装置 | |
JP2014522052A (ja) | ハードウェア故障の軽減 | |
US11349706B2 (en) | Two-channel-based high-availability | |
CN107645402B (zh) | 一种路由管理方法和装置 | |
US20190334990A1 (en) | Distributed State Machine for High Availability of Non-Volatile Memory in Cluster Based Computing Systems | |
US20210075763A1 (en) | System and method of using a global discovery service to enable routing of packets from a source container to a destination container | |
BR112017011541B1 (pt) | Método para processar uma solicitação de bloqueio, aparelho de gerenciamento de solicitação de bloqueio e servidor | |
CN113656147A (zh) | 一种集群部署方法、装置、设备及存储介质 | |
JP5531487B2 (ja) | サーバシステム及びサーバシステムの管理方法 | |
WO2021072130A1 (en) | Dynamic discovery of service nodes in a network | |
US9430341B2 (en) | Failover in a data center that includes a multi-density server | |
Venâncio et al. | VNF‐Consensus: A virtual network function for maintaining a consistent distributed software‐defined network control plane | |
JP6217358B2 (ja) | 情報処理装置およびリカバリ管理方法 | |
US10305987B2 (en) | Method to syncrhonize VSAN node status in VSAN cluster | |
US8929251B2 (en) | Selecting a master processor from an ambiguous peer group |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170614 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170911 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6217358 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |