JP5634379B2 - 計算機システムおよび計算機システムの情報保存方法 - Google Patents
計算機システムおよび計算機システムの情報保存方法 Download PDFInfo
- Publication number
- JP5634379B2 JP5634379B2 JP2011235602A JP2011235602A JP5634379B2 JP 5634379 B2 JP5634379 B2 JP 5634379B2 JP 2011235602 A JP2011235602 A JP 2011235602A JP 2011235602 A JP2011235602 A JP 2011235602A JP 5634379 B2 JP5634379 B2 JP 5634379B2
- Authority
- JP
- Japan
- Prior art keywords
- management module
- management
- control unit
- management information
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2089—Redundant storage control functionality
- G06F11/2092—Techniques of failing over between control units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2089—Redundant storage control functionality
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Hardware Redundancy (AREA)
Description
図11は、管理モジュール二重化制御部1226のフローチャートである。
1100、1200、15100、15200 管理モジュール
1110、1210 SDカード
1111 管理モジュール管理情報
1120、1220 計算機制御部
1121、1221 計算機システム管理情報制御部
1122、1222 スイッチ制御部
1123、1223 外部記憶装置制御部
1124、1224 サーバブレード管理情報制御部
1125、1225 スイッチモジュール管理情報制御部
1126、1226 管理モジュール二重化制御部
1300 コンポーネント
1310 サーバブレード
1311 サーバブレード管理情報
1312 BMC
1320 スイッチモジュール
1321 スイッチモジュール管理情報
1322 スイッチモジュール制御部
1400 フロントパネルモジュール
1410、15410 外部記憶装置
1420、15420 スイッチ
3000 管理モジュール系状態格納テーブル
15400 管理情報バックアップモジュール
Claims (10)
- 物理サーバと当該物理サーバを管理する第一の管理モジュールと第二の管理モジュールとを有する計算機システムにおいて、
前記第一の管理モジュールと前記第二の管理モジュールと外部記憶装置とがスイッチを介して接続され、
前記第一の管理モジュールと前記第二の管理モジュールのそれぞれは、前記スイッチの接続の切り替えを制御するスイッチ制御部と、前記計算機システムの管理情報を保存する記憶部と、前記複数の管理モジュールにおける前記管理情報の多重化を制御する多重化制御部と、前記外部記憶装置を制御する外部記憶装置制御部とを備え、
前記第一の管理モジュールの系状態が主系であり、前記第二の管理モジュールの系状態が待機系である場合、
前記第一の管理モジュールのスイッチ制御部は、前記スイッチを制御して、前記第一の管理モジュールと前記外部記憶装置とを接続させ、
前記第一の管理モジュールの外部記憶装置制御部は、前記物理サーバに保存される管理情報の更新に伴って前記第一の管理モジュールの記憶部の管理情報を更新し、当該更新後、前記第一の管理モジュールの記憶部に保存される管理情報を前記外部記憶装置におよび前記第二の管理モジュールの記憶部に格納するよう制御し、
前記第一の管理モジュールと前記第二の管理モジュールのいずれか、もしくは双方での障害発生後、当該管理モジュールの代替として第三の管理モジュールが搭載されたとき、
前記第三の管理モジュールの多重化制御部は、
前記計算機システムに他の管理モジュールが存在するか否かに基づいて、前記第三の管理モジュールの系状態が主系であるか待機系であるかを判定し、
前記判定の結果、前記第三の管理モジュールが主系である場合、前記第三の管理モジュールの多重化制御部は、前記外部記憶装置に保存された管理情報を取得し、当該取得した管理情報を前記第三の管理モジュールの記憶部に格納し、
前記判定の結果、前記第三の管理モジュールが待機系である場合、前記第三の管理モジュールの多重化制御部は、前記他の管理モジュールの記憶部に保存される管理情報を前記外部記憶装置を介して取得し、当該取得した管理情報を前記第三の管理モジュールの記憶部に格納するよう制御する
ことを特徴とする計算機システム。 - 前記第一の管理モジュールの多重化制御部は、系状態が待機系である第二の管理モジュールの多重化制御部に、前記第一の管理モジュールの記憶部に保存される管理情報を含む管理情報格納要求を送信し、前記第二の管理モジュールの多重化制御部は、前記管理情報格納要求に基づいて、受信した管理情報を前記第二の管理モジュールの記憶部に格納することを特徴とする請求項1記載の計算機システム。
- 前記第一の管理モジュールおよび第二の管理モジュールの各々は、前記第一の管理モジュールおよび第二の管理モジュールの系状態を管理する管理モジュール系情報を有し、
前記第二の管理モジュールの多重化制御部は、前記管理モジュール系情報を参照して、前記第一の管理モジュールの系状態が障害であることを検出すると、
前記第二の管理モジュールのスイッチ制御部に、前記外部記憶装置の接続先を前記第一の管理モジュールから前記第二の管理モジュールに切り替えるスイッチ切り替え要求を送信し、
前記第二の管理モジュールのスイッチ制御部は、前記第二の管理モジュールの多重化制御部から受信したスイッチ切り替え要求に基づき、前記スイッチを制御して、前記第二の管理モジュールと前記外部記憶装置とを接続させることを特徴とする請求項2記載の計算機システム。 - 前記第三の管理モジュールは、前記スイッチと前記管理モジュールとの接続状態を制御する接続ポートを有し、
前記第三の管理モジュールの外部記憶装置制御部は、
前記第三の管理モジュールの起動時に、前記接続ポートを閉じて、前記管理モジュールと前記スイッチとが接続しない状態とし、
前記起動した管理モジュールの系状態が主系である場合、前記接続ポートを開けて、前記第三の管理モジュールと前記スイッチとが接続する状態とし、
前記起動した前記第三の管理モジュールの系状態が主系でない場合、前記接続ポートを閉じた状態を継続することを特徴とする請求項1記載の計算機システム。 - 前記計算機システムの管理情報は、主系である前記第一の管理モジュールの管理情報、前記物理サーバの管理情報、主系である前記第一の管理モジュールに管理されるスイッチモジュールの管理情報のうち少なくとも一つを含むことを特徴とする請求項4記載の計算機システム。
- 物理サーバと当該物理サーバを管理する第一の管理モジュールと第二の管理モジュールとを有する計算機システムにおける管理情報の保存方法であって、
前記第一の管理モジュールと前記第二の管理モジュールと外部記憶装置とがスイッチを介して接続され、
前記第一の管理モジュールと前記第二の管理モジュールのそれぞれは、前記スイッチの接続の切り替えを制御するスイッチ制御部と、前記計算機システムの管理情報を保存する記憶部と、前記複数の管理モジュールにおける前記管理情報の多重化を制御する多重化制御部と、前記外部記憶装置を制御する外部記憶装置制御部とを備え、
前記第一の管理モジュールの系状態が主系であり、前記第二の管理モジュールの系状態が待機系である場合、
前記第一の管理モジュールのスイッチ制御部は、前記スイッチを制御して、前記第一の管理モジュールと前記外部記憶装置とを接続させ、
前記第一の管理モジュールの外部記憶装置制御部は、前記物理サーバに保存される管理情報の更新に伴って前記第一の管理モジュールの記憶部の管理情報を更新し、当該更新後、前記第一の管理モジュールの記憶部に保存される管理情報を、前記外部記憶装置および前記第二の管理モジュールの記憶部に格納するよう制御し、
前記第一の管理モジュールと前記第二の管理モジュールのいずれか、もしくは双方での障害発生後、当該管理モジュールの代替として第三の管理モジュールが搭載されたとき、
前記第三の管理モジュールの多重化制御部は、
前記計算機システムに他の管理モジュールが存在するか否かに基づいて、前記第三の管理モジュールの系状態が主系であるか待機系であるかを判定し、
前記判定の結果、前記第三の管理モジュールが主系である場合、前記第三の管理モジュールの多重化制御部は、前記外部記憶装置に保存された管理情報を取得し、当該取得した管理情報を前記第三の管理モジュールの記憶部に格納し、
前記判定の結果、前記第三の管理モジュールが待機系である場合、前記第三の管理モジュールの多重化制御部は、前記他の管理モジュールの記憶部に保存される管理情報を前記外部記憶装置を介して取得し、当該取得した管理情報を前記第三の管理モジュールの記憶部に格納するよう制御することを特徴とする管理情報の保存方法。 - 前記第一の管理モジュールの多重化制御部は、系状態が待機系である第二の管理モジュールの多重化制御部に、前記第一の管理モジュールの記憶部に保存される管理情報を含む管理情報格納要求を送信し、前記第二の管理モジュールの多重化制御部は、前記管理情報格納要求に基づいて、受信した管理情報を前記第二の管理モジュールの記憶部に格納することを特徴とする請求項6記載の管理情報の保存方法。
- 前記第一の管理モジュールおよび第二の管理モジュールの各々は、前記第一の管理モジュールおよび第二の管理モジュール系状態を管理する管理モジュール系情報を有し、
前記第二の管理モジュールの多重化制御部は、前記管理モジュール系情報を参照して、前記第一の管理モジュールの系状態が障害であることを検出すると、
前記第二の管理モジュールのスイッチ制御部に、前記外部記憶装置の接続先を前記第一の管理モジュールから前記第二の管理モジュールに切り替えるスイッチ切り替え要求を送信し、
前記第二の管理モジュールのスイッチ制御部は、前記第二の管理モジュールの多重化制御部から受信したスイッチ切り替え要求に基づき、前記スイッチを制御して、前記第二の管理モジュールと前記外部記憶装置とを接続させることを特徴とする請求項7記載の管理情報の保存方法。 - 前記第三の管理モジュールは、前記スイッチと前記管理モジュールとの接続状態を制御する接続ポートを有し、
前記第三の管理モジュールの前記外部記憶装置制御部は、
前記第三の管理モジュールの起動時に、前記接続ポートを閉じて、前記管理モジュールと前記スイッチとが接続しない状態とし、
前記起動した管理モジュールの系状態が主系である場合、前記接続ポートを開けて、前記管理モジュールと前記スイッチとが接続する状態とし、
前記起動した管理モジュールの系状態が主系でない場合、前記接続ポートを閉じた状態を継続することを特徴とする請求項6記載の管理情報の保存方法。 - 前記計算機システムの管理情報は、主系である前記第一の管理モジュールの管理情報、前記物理サーバの管理情報、主系である前記第一の管理モジュールに管理されるスイッチモの管理情報のうち少なくとも一つを含むことを特徴とする請求項9記載の管理情報の保存方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011235602A JP5634379B2 (ja) | 2011-10-27 | 2011-10-27 | 計算機システムおよび計算機システムの情報保存方法 |
US13/658,427 US9158666B2 (en) | 2011-10-27 | 2012-10-23 | Computer system and computer system information storage method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011235602A JP5634379B2 (ja) | 2011-10-27 | 2011-10-27 | 計算機システムおよび計算機システムの情報保存方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013092956A JP2013092956A (ja) | 2013-05-16 |
JP5634379B2 true JP5634379B2 (ja) | 2014-12-03 |
Family
ID=48616021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011235602A Expired - Fee Related JP5634379B2 (ja) | 2011-10-27 | 2011-10-27 | 計算機システムおよび計算機システムの情報保存方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9158666B2 (ja) |
JP (1) | JP5634379B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150074219A1 (en) * | 2013-07-12 | 2015-03-12 | Brocade Communications Systems, Inc. | High availability networking using transactional memory |
TWI536767B (zh) * | 2013-09-03 | 2016-06-01 | 緯創資通股份有限公司 | 伺服系統及其備援管理方法 |
KR102460453B1 (ko) * | 2016-02-19 | 2022-10-28 | 삼성전자주식회사 | 외부저장매체를 장착 가능한 전자 장치 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01222365A (ja) * | 1988-03-01 | 1989-09-05 | Toshiba Corp | 複合系計算システム |
JPH05244260A (ja) * | 1992-02-26 | 1993-09-21 | Fujitsu Ltd | 外部記憶装置切替えによる二重化運転方式 |
US6333932B1 (en) * | 1994-08-22 | 2001-12-25 | Fujitsu Limited | Connectionless communications system, its test method, and intra-station control system |
NO970466L (no) * | 1997-02-03 | 1998-08-04 | Ericsson Telefon Ab L M | FremgangsmÕte og system for beskyttelse av utstyr og svitsjefunksjonalitet i et telekommunikasjonssystem |
JP3794151B2 (ja) * | 1998-02-16 | 2006-07-05 | 株式会社日立製作所 | クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法 |
JP2000148525A (ja) * | 1998-11-18 | 2000-05-30 | Hitachi Ltd | サービスプロセッサ二重化システムの現用系負荷軽減方法 |
US7111084B2 (en) * | 2001-12-28 | 2006-09-19 | Hewlett-Packard Development Company, L.P. | Data storage network with host transparent failover controlled by host bus adapter |
KR100454681B1 (ko) * | 2002-11-07 | 2004-11-03 | 한국전자통신연구원 | 프레임 다중화를 이용한 이더넷 스위칭 장치 및 방법 |
JP4155399B2 (ja) * | 2003-03-28 | 2008-09-24 | 株式会社日立製作所 | コンピュータ処理方法及びその実施システム並びにその処理プログラム |
JP4030951B2 (ja) * | 2003-11-12 | 2008-01-09 | 埼玉日本電気株式会社 | データ二重化装置及び方法 |
US7664110B1 (en) * | 2004-02-07 | 2010-02-16 | Habanero Holdings, Inc. | Input/output controller for coupling the processor-memory complex to the fabric in fabric-backplane interprise servers |
US20060104289A1 (en) * | 2004-11-12 | 2006-05-18 | Inventec Corporation | Multiplexed computer peripheral connection switching interface |
JP5080140B2 (ja) * | 2007-06-13 | 2012-11-21 | 株式会社日立製作所 | I/oデバイス切り替え方法 |
JP5011073B2 (ja) * | 2007-11-22 | 2012-08-29 | 株式会社日立製作所 | サーバ切り替え方法、およびサーバシステム |
JP5392594B2 (ja) * | 2008-03-05 | 2014-01-22 | 日本電気株式会社 | 仮想計算機冗長化システム、コンピュータシステム、仮想計算機冗長化方法、及びプログラム |
JP4572250B2 (ja) * | 2008-09-11 | 2010-11-04 | 株式会社日立製作所 | 計算機切り替え方法、計算機切り替えプログラム及び計算機システム |
-
2011
- 2011-10-27 JP JP2011235602A patent/JP5634379B2/ja not_active Expired - Fee Related
-
2012
- 2012-10-23 US US13/658,427 patent/US9158666B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013092956A (ja) | 2013-05-16 |
US9158666B2 (en) | 2015-10-13 |
US20130290651A1 (en) | 2013-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9122653B2 (en) | Migrating virtual machines across sites | |
US7240188B2 (en) | Storage system | |
US7945730B2 (en) | Systems and methods for recovering from configuration data mismatches in a clustered environment | |
US7770053B1 (en) | Systems and methods for maintaining data integrity during a migration | |
EP1370945B1 (en) | Failover processing in a storage system | |
US7661018B2 (en) | Method, apparatus and program storage device for providing automatic recovery from premature reboot of a system during a concurrent upgrade | |
KR20150028964A (ko) | 자동화된 재해 복구와 데이터 이송 | |
EP2048580A2 (en) | Storage controller and storage control method | |
JP2009140194A (ja) | 障害回復環境の設定方法 | |
JP5634379B2 (ja) | 計算機システムおよび計算機システムの情報保存方法 | |
JP4320314B2 (ja) | 計算機システム、同期化処理方法、およびプログラム | |
CN110908723A (zh) | 操作系统的主备切换方法、装置及相关设备 | |
US9471256B2 (en) | Systems and methods for restoring data in a degraded computer system | |
US7865766B2 (en) | Providing increased availability of I/O drawers during concurrent I/O hub repair | |
US20060253668A1 (en) | Method and apparatus for preserving operating system and configuration files against a system failure | |
CN111427721B (zh) | 异常恢复方法及装置 | |
US20160328304A1 (en) | Method of copying a data image from a source to a target storage device in a fault tolerant computer system | |
JP2005055995A (ja) | ストレージ制御方法、および、冗長化機能を有するサーバシステム | |
JP6492939B2 (ja) | 制御装置、ストレージシステムおよびプログラム | |
JP6954693B2 (ja) | フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム | |
JP2009265973A (ja) | データ同期システム、障害復旧方法、及び、プログラム | |
JP6773345B1 (ja) | フォールトトレラントシステム、サーバ、及びそれらの運用方法 | |
KR20180034901A (ko) | 고 가용성을 위한 실시간 데이터 복제 시스템 및 방법 | |
JPH07121395A (ja) | 予備装置優先選択方法 | |
CN106953736B (zh) | 故障切换方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140916 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141014 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5634379 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |