JP5277961B2 - 情報処理装置及びその故障隠蔽方法 - Google Patents
情報処理装置及びその故障隠蔽方法 Download PDFInfo
- Publication number
- JP5277961B2 JP5277961B2 JP2008538601A JP2008538601A JP5277961B2 JP 5277961 B2 JP5277961 B2 JP 5277961B2 JP 2008538601 A JP2008538601 A JP 2008538601A JP 2008538601 A JP2008538601 A JP 2008538601A JP 5277961 B2 JP5277961 B2 JP 5277961B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- execution environment
- cpu
- arithmetic
- arithmetic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2043—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2033—Failover techniques switching over of hardware resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2035—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
Description
Claims (12)
- OS及びアプリケーションを実行するための実行環境が動作する複数の演算装置と、
前記複数の演算装置で共有される共有周辺装置と、
を有する情報処理装置であって、
前記複数の演算装置のいずれかで故障が発生すると、該故障が発生した演算装置に代わって該演算装置で動作していたOS及び実行環境で動作する代替演算装置を決定し、
前記故障が発生した演算装置で動作していたOS及び実行環境と、前記代替演算装置となる演算装置で元々動作しているOS及び実行環境とを、前記代替演算装置で時分割に実行し、
前記代替演算装置で動作するOS及び実行環境に対応して前記代替演算装置で動作するOS及び実行環境が参照する前記共有周辺装置の設定値を時分割に変更することで、前記演算装置で発生した故障を隠蔽するための故障隠蔽装置を有する情報処理装置。 - 前記故障隠蔽装置は、
所定時間の経過、OSや実行環境の優先度、ユーザからの切り替え指示、イベントの発生のようなトリガー条件に基づき、前記故障が発生した演算装置で動作するOS及び実行環境を他の演算装置で動作するように切り替える請求項1記載の情報処理装置。 - 前記故障隠蔽装置は、
前記演算装置の故障を検出すると、該演算装置が備えるキャッシュメモリで保持しているデータをメインメモリへ退避させる請求項2記載の情報処理装置。 - 前記故障隠蔽装置が、
前記OSに含まれるプログラムにしたがって前記演算装置が処理を実行することで実現される請求項1から3のいずれか1項記載の情報処理装置。 - 前記演算装置は、
少なくとも2つの動作モードを備え、
前記故障隠蔽装置が、
前記2つのCPUモードのうちの一方の動作モードにより、前記OSに含まれるプログラムにしたがって前記演算装置が処理を実行することで実現される請求項1から3のいずれか1項記載の情報処理装置。 - OS及びアプリケーションを実行するための実行環境が動作する複数の演算装置のいずれかで発生した故障を隠蔽するための故障隠蔽装置であって、
前記故障が発生した演算装置を検出する故障検出部と、
前記故障検出部から故障が発生した演算装置を示す情報を受け取ると、該故障が発生した演算装置に代わって該演算装置で動作していたOS及び実行環境で動作する代替演算装置を決定し、前記代替演算装置による前記OS及び前記実行環境の動作スケジュールを管理するスケジュール部と、
前記故障が発生した演算装置の動作を停止させる故障CPU停止部と、
前記複数の演算装置で共有される共有周辺装置のうち、前記故障が発生した演算装置で使用していた共有周辺装置を前記代替演算装置で使用可能にする共有資源制御部と、
を有し、
前記スケジュール部は、
前記故障が発生した演算装置で動作していたOS及び実行環境と、前記代替演算装置となる演算装置で元々動作しているOS及び実行環境とを、前記代替演算装置に時分割で実行させ、
前記代替演算装置で動作するOS及び実行環境に対応して前記代替演算装置で動作するOS及び実行環境が参照する前記共有周辺装置の設定値を時分割に変更する故障隠蔽装置。 - 前記スケジュール部は、
所定時間の経過、OSや実行環境の優先度、ユーザからの切り替え指示、イベントの発生のようなトリガー条件に基づき、前記故障が発生した演算装置で動作するOS及び実行環境が前記代替演算装置で動作するように、前記故障CPU停止部及び前記共有資源制御部へ指示する請求項6記載の故障隠蔽装置。 - 前記故障CPU停止部は、
前記故障が発生した演算装置が備えるキャッシュメモリで保持しているデータをメインメモリへ退避させる請求項7記載の故障隠蔽装置。 - 前記OSに含まれるプログラムにしたがって前記演算装置が処理を実行することで実現される請求項6から8のいずれか1項記載の故障隠蔽装置。
- OS及びアプリケーションを実行するための実行環境が動作する複数の演算装置と、
前記複数の演算装置で共有される共有周辺装置と、
を有し、前記演算装置で発生した故障を隠蔽するための情報処理装置の故障隠蔽方法であって、
前記複数の演算装置のいずれかで故障が発生すると、該故障が発生した演算装置に代わって該演算装置で動作していたOS及び実行環境で動作する代替演算装置を決定し、
前記故障が発生した演算装置で動作していたOS及び実行環境と、前記代替演算装置となる演算装置で元々動作しているOS及び実行環境とを、前記代替演算装置で時分割に実行し、
前記代替演算装置で動作するOS及び実行環境に対応して前記代替演算装置で動作するOS及び実行環境が参照する前記共有周辺装置の設定値を時分割に変更する故障隠蔽方法。 - 所定時間の経過、OSや実行環境の優先度、ユーザからの切り替え指示、イベントの発生のようなトリガー条件に基づき、前記故障が発生した演算装置で動作するOS及び実行環境を前記代替演算装置で動作するように切り替える請求項10記載の故障隠蔽方法。
- 前記演算装置の故障を検出すると、該演算装置が備えるキャッシュメモリで保持しているデータをメインメモリへ退避させる請求項11記載の故障隠蔽方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008538601A JP5277961B2 (ja) | 2006-10-13 | 2007-09-13 | 情報処理装置及びその故障隠蔽方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006279956 | 2006-10-13 | ||
JP2006279956 | 2006-10-13 | ||
JP2008538601A JP5277961B2 (ja) | 2006-10-13 | 2007-09-13 | 情報処理装置及びその故障隠蔽方法 |
PCT/JP2007/067829 WO2008044423A1 (fr) | 2006-10-13 | 2007-09-13 | Processeur d'informations et procédé de couverture de panne |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008044423A1 JPWO2008044423A1 (ja) | 2010-02-04 |
JP5277961B2 true JP5277961B2 (ja) | 2013-08-28 |
Family
ID=39282632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008538601A Expired - Fee Related JP5277961B2 (ja) | 2006-10-13 | 2007-09-13 | 情報処理装置及びその故障隠蔽方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8108719B2 (ja) |
JP (1) | JP5277961B2 (ja) |
WO (1) | WO2008044423A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5273043B2 (ja) * | 2007-06-12 | 2013-08-28 | 日本電気株式会社 | 情報処理装置、実行環境転送方法及びそのプログラム |
US8489918B2 (en) * | 2010-04-21 | 2013-07-16 | Hitachi, Ltd. | Storage system and ownership control method for storage system |
DE112013007143T5 (de) * | 2013-06-07 | 2016-02-18 | Mitsubishi Electric Corporation | Computersystem und Steuerungsverfahren |
JP6135403B2 (ja) * | 2013-08-27 | 2017-05-31 | 富士通株式会社 | 情報処理システム、情報処理システムの障害処理方法 |
CN108885552B (zh) | 2016-01-22 | 2023-03-14 | 索尼互动娱乐股份有限公司 | 用于向后兼容性的欺骗cpuid |
US20170286324A1 (en) * | 2016-04-05 | 2017-10-05 | Renesas Electronics Corporation | Semiconductor device and access management method |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07175765A (ja) * | 1993-10-25 | 1995-07-14 | Mitsubishi Electric Corp | 計算機の障害回復方法 |
JPH11126195A (ja) * | 1997-10-22 | 1999-05-11 | Mitsubishi Electric Corp | 分散システム |
JP2002527840A (ja) * | 1998-10-09 | 2002-08-27 | オープンウェイヴ システムズ インコーポレイテッド | クラスタシステム用フォールトトレラントバス |
JP2005004289A (ja) * | 2003-06-10 | 2005-01-06 | Hitachi Ltd | 省エネルギー方式 |
WO2005031572A2 (en) * | 2003-09-22 | 2005-04-07 | Jaluna Sa | Operating systems |
WO2005033928A2 (en) * | 2003-09-22 | 2005-04-14 | Jaluna Sa | Operating systems |
US20060212453A1 (en) * | 2005-03-18 | 2006-09-21 | International Business Machines Corporation | System and method for preserving state for a cluster of data servers in the presence of load-balancing, failover, and fail-back events |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02123455A (ja) | 1988-11-02 | 1990-05-10 | Hitachi Ltd | マルチプロセッサシステムの再構成方法 |
JPH03240859A (ja) | 1990-02-19 | 1991-10-28 | Nec Corp | マルチプロセッサ共有資源管理方式 |
US5319773A (en) * | 1990-05-16 | 1994-06-07 | International Business Machines Corporation | Asynchronous resynchronization of a commit procedure |
WO1996025705A1 (en) | 1995-02-14 | 1996-08-22 | Fujitsu Limited | Structure and method for high-performance speculative execution processor providing special features |
JP3676934B2 (ja) | 1998-12-15 | 2005-07-27 | 株式会社日立製作所 | プロセッサおよびマルチプロセッサシステム |
JP2000339186A (ja) | 1999-05-31 | 2000-12-08 | Nec Software Chubu Ltd | クラスタシステム監視端末の自動再接続方法および自動再接続システム |
US7409420B2 (en) * | 2001-07-16 | 2008-08-05 | Bea Systems, Inc. | Method and apparatus for session replication and failover |
JP3813930B2 (ja) | 2002-01-09 | 2006-08-23 | 松下電器産業株式会社 | プロセッサ及びプログラム実行方法 |
JP2005032202A (ja) | 2003-07-09 | 2005-02-03 | Econity:Kk | 資源配分方法ならびに同方法のプログラムを記録した記録媒体 |
JP2005250577A (ja) | 2004-03-01 | 2005-09-15 | Toshiba Corp | コンピュータシステム及び演算処理モジュールの健全性判定方法 |
-
2007
- 2007-09-13 US US12/441,289 patent/US8108719B2/en not_active Expired - Fee Related
- 2007-09-13 WO PCT/JP2007/067829 patent/WO2008044423A1/ja active Application Filing
- 2007-09-13 JP JP2008538601A patent/JP5277961B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07175765A (ja) * | 1993-10-25 | 1995-07-14 | Mitsubishi Electric Corp | 計算機の障害回復方法 |
JPH11126195A (ja) * | 1997-10-22 | 1999-05-11 | Mitsubishi Electric Corp | 分散システム |
JP2002527840A (ja) * | 1998-10-09 | 2002-08-27 | オープンウェイヴ システムズ インコーポレイテッド | クラスタシステム用フォールトトレラントバス |
JP2005004289A (ja) * | 2003-06-10 | 2005-01-06 | Hitachi Ltd | 省エネルギー方式 |
WO2005031572A2 (en) * | 2003-09-22 | 2005-04-07 | Jaluna Sa | Operating systems |
WO2005033928A2 (en) * | 2003-09-22 | 2005-04-14 | Jaluna Sa | Operating systems |
US20060212453A1 (en) * | 2005-03-18 | 2006-09-21 | International Business Machines Corporation | System and method for preserving state for a cluster of data servers in the presence of load-balancing, failover, and fail-back events |
Also Published As
Publication number | Publication date |
---|---|
JPWO2008044423A1 (ja) | 2010-02-04 |
WO2008044423A1 (fr) | 2008-04-17 |
US20090240980A1 (en) | 2009-09-24 |
US8108719B2 (en) | 2012-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5405320B2 (ja) | 仮想計算機制御装置、仮想計算機制御方法及び仮想計算機制御プログラム | |
JP5277961B2 (ja) | 情報処理装置及びその故障隠蔽方法 | |
JP2552651B2 (ja) | 再構成可能なデュアル・プロセッサ・システム | |
WO2016165304A1 (zh) | 一种实例节点管理的方法及管理设备 | |
US20120278653A1 (en) | Handling a failed processor of multiprocessor information handling system | |
JP5099090B2 (ja) | マルチコアシステム、マルチコアシステムの制御方法、及びマルチプロセッサ | |
JP2014026567A (ja) | 監視装置、情報処理装置、及び監視方法 | |
JP2006195821A (ja) | 情報処理システムの制御方法、情報処理システム、ダイレクトメモリアクセス制御装置、プログラム | |
JP5163120B2 (ja) | デバッグシステム、デバッグ方法、およびプログラム | |
US11815984B2 (en) | Error handling in an interconnect | |
US10379931B2 (en) | Computer system | |
US9606879B2 (en) | Multi-partition networking device and method therefor | |
US20090077420A1 (en) | Multiprocessor core dump retrieval | |
JP2011158995A (ja) | コンピュータ装置及びそのbiosアップデート方法 | |
US20110153073A1 (en) | Fault tolerance method and apparatus for robot software component | |
US20210382536A1 (en) | Systems, devices, and methods for controller devices handling fault events | |
JP2010186242A (ja) | 計算機システム | |
EP2843555A1 (en) | Information processing system and method for processing failure | |
US20090187903A1 (en) | Virtual multiprocessor system | |
RU2569576C1 (ru) | Управляющий модуль | |
WO2008004330A1 (fr) | Système à processeurs multiples | |
JP6218652B2 (ja) | 計算機、障害処理方法及びプログラム | |
JP4787551B2 (ja) | デバッグシステム、デバッグ方法およびプログラム | |
JP2005316679A (ja) | 並列演算処理装置 | |
JP2009116699A (ja) | 情報処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130506 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |