JP2005115751A - 計算機システム及び計算機システムの障害兆候の検知方法 - Google Patents
計算機システム及び計算機システムの障害兆候の検知方法 Download PDFInfo
- Publication number
- JP2005115751A JP2005115751A JP2003350818A JP2003350818A JP2005115751A JP 2005115751 A JP2005115751 A JP 2005115751A JP 2003350818 A JP2003350818 A JP 2003350818A JP 2003350818 A JP2003350818 A JP 2003350818A JP 2005115751 A JP2005115751 A JP 2005115751A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- analysis prediction
- sign
- information
- computer system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
Abstract
【解決手段】一般的なOSである第1OS1上で、通常の業務処理を行うサービスAP3が実行される。第1OS1は、第1OS1が行った動作を、動作した時間と共に動作記録情報として記録する動作記録制御部6と、外部からの処理を受け付けて実行する補助ドライバ7とを有する。第1OS1より信頼性の高い第2OS2に備えられるマルチOS制御部インタフェース10は、第2OS2の上で動作するAP4からマルチOS制御部5を操作する。第2OS2上で動作する解析予測AP4は、第1OS1及びサービスAP3の状態を解析して障害の兆候を検知する。障害の兆候を検出した場合、被解析OSやサービスAPの縮退運転や、現用系から待機系の切り替え準備、切り替え等を障害が発生する前に行う。
【選択図】 図2
Description
http://www.atmarkit.co.jp/flinux/rensai/ciuster02/ciuster02.html
2 第2OS
3 サービスAP
4 解析予測AP
5 マルチOS制御部
6 動作記録制御部
7 補助ドライバ
8 メモリ取得部
9 OS間メッセージ通信部
10 マルチOS制御部インタフェース
11 OS状態情報
12 動作記録情報
13 障害兆候表
14 対処プログラム表
15 情報アドレス変換表
16 前状態情報保持部
17 AP状態情報
18 ページ変換テーブル
20 計算機
21 メモリ
22 CPU
23 外部記憶装置
24 キーボード
25 マウス
26 冷却装置
27 温度センサ
28 通信装置
29 画面出力装置
40 外部端末
41 ネットワーク
42 第1通信装置
43 第2通信装置
50 第1計算機
51 第2計算機
60 論理分割制御部
61 第1仮想マルチOSセット
62 第2仮想マルチOSセット
6n 第n仮想マルチOSセット
71 第1障害対応グループ
7n 第n障害対応グループ
80 第1データセット
81 第2データセット
205 ハードウェア動作制御部
221 第2メモリ
Claims (10)
- 第1のOSと、該第1のOS上で動作し通常の業務処理を行うサービスアプリケーションと、前記第1のOSとは異なる第2のOSと、該第2のOS上で動作する解析予測アプリケーションとを備え、前記第1のOSは、自OSの状態情報と動作記録情報とを保持し、前記解析予測アプリケーションは、前記第1のOSが保持する情報の内容を解析して障害の兆候を検知することを特徴とする計算機システム。
- 前記第1のOSは、解析予測アプリケーションの補助を行う補助プログラムを有し、前記解析予測アプリケーションは、解析すべきメモリの位置と解析方法、及び、障害に対して行うべき処理の一覧を保持し、前記補助プログラムは、前記処理の一覧の内容に従い、障害の兆候によって、第1のOSの障害に対する処理を行うことを特徴とする請求項1記載の計算機システム。
- 前記解析予測アプリケーションは、外部端末に対して解析した障害の兆候の内容を通知することを特徴とする請求項1記載の計算機システム。
- 第1のOSと、該第1のOS上で動作し通常の業務処理を行うサービスアプリケーションと、前記第1のOSとは異なる第2のOSと、該第2のOS上で動作する解析予測アプリケーションとを備え、前記第1のOSが、自OSの状態情報と動作記録情報とを保持し、前記解析予測アプリケーションが、前記第1のOSが保持する情報の内容を解析して障害の兆候を検知する構成の計算機を複数台備え、1つの計算機の解析予測アプリケーションが、自己回復不能な障害の兆候を検知した場合、他の計算機に解析した障害の内容を通知し、処理を受け継がせることを特徴とする計算機システム。
- 複数の第1のOSと、該複数の第1のOSのそれぞれの上で動作し通常の業務処理を行う複数のサービスアプリケーションと、前記第1のOSとは異なる1つの第2のOSと、該第2のOS上で動作する解析予測アプリケーションとを備え、前記複数の第1のOSのそれぞれは、自OSの状態情報と動作記録情報とを保持し、前記解析予測アプリケーションは、前記複数第1のOSのそれぞれが保持する情報の内容を解析して障害の兆候を検知することを特徴とする計算機システム。
- 第1のOSと、該第1のOS上で動作し通常の業務処理を行うサービスアプリケーションと、前記第1のOSとは異なる第2のOSと、該第2のOS上で動作する解析予測アプリケーションとを備え、前記第1のOSが、自OSの状態情報と動作記録情報とを保持し、前記解析予測アプリケーションが、前記第1のOSが保持する情報の内容を解析して障害の兆候を検知する構成の計算機を、論理分割により仮想マルチOSセットとして複数台構成し、前記複数の仮想マルチOSセットのそれぞれの第1のOSと第2のOSとが交互に切り替えられて動作を実行し、前記複数の仮想マルチOSセットそれぞれの解析予測アプリケーションが、自セットの前記第1のOSが保持する情報の内容を解析して障害の兆候を検知することを特徴とする計算機システム。
- 前記複数の仮想マルチOSセットの1つの解析予測アプリケーションが、自セットの前記第1のOSでの障害の兆候を検知した場合、他の仮想マルチOSセットに解析した障害の内容を通知し、処理を受け継がせることを特徴とする請求項6記載の計算機システム。
- 複数の第1のOSと、該複数の第1のOSのそれぞれの上で動作し通常の業務処理を行う複数のサービスアプリケーションと、前記第1のOSとは異なる1つの第2のOSと、該第2のOS上で動作する解析予測アプリケーションとを備え、前記複数の第1のOSのそれぞれが、自OSの状態情報と動作記録情報とを保持し、前記解析予測アプリケーションが、前記複数第1のOSのそれぞれが保持する情報の内容を解析して障害の兆候を検知する構成の計算機を、論理分割により仮想マルチOSセットとして構成し、前記マルチOSセットの解析予測アプリケーションが、前記第1のOSでの障害の兆候を検知した場合、他方の第1のOSに処理を受け継ぐことを特徴とする計算機システム。
- 第1のOSとは異なる第2のOS上で動作する解析予測アプリケーションが、第1のOSが保持している状態情報と動作記録情報との内容を解析して障害の兆候を検知することを特徴とする計算機システムの障害兆候の検知方法。
- 前記解析予測アプリケーションは、解析すべきメモリの位置と解析方法、及び、障害に対して行うべき処理の一覧を保持し、前記第1のOSが有する解析予測アプリケーションの補助を行う補助プログラムを使用して、前記処理の一覧の内容に従い、障害の兆候によって、第1のOSの障害に対する処理を行うことを特徴とする請求項9記載の計算機システムの障害兆候の検知方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003350818A JP2005115751A (ja) | 2003-10-09 | 2003-10-09 | 計算機システム及び計算機システムの障害兆候の検知方法 |
US10/798,276 US7243266B2 (en) | 2003-10-09 | 2004-03-12 | Computer system and detecting method for detecting a sign of failure of the computer system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003350818A JP2005115751A (ja) | 2003-10-09 | 2003-10-09 | 計算機システム及び計算機システムの障害兆候の検知方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005115751A true JP2005115751A (ja) | 2005-04-28 |
Family
ID=34419764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003350818A Pending JP2005115751A (ja) | 2003-10-09 | 2003-10-09 | 計算機システム及び計算機システムの障害兆候の検知方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7243266B2 (ja) |
JP (1) | JP2005115751A (ja) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172131A (ja) * | 2005-12-20 | 2007-07-05 | Nec Fielding Ltd | 障害予測システム、障害予測方法、障害予測プログラム |
JP2009110404A (ja) * | 2007-10-31 | 2009-05-21 | Toshiba Corp | 仮想計算機システム及び同システムにおけるゲストosスケジューリング方法 |
JP2010079811A (ja) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | 計算機システム、計算機システムの障害の予兆検知方法及びプログラム |
JP2010102441A (ja) * | 2008-10-22 | 2010-05-06 | Fuji Xerox Co Ltd | 情報処理装置、情報処理プログラム |
JP2011008780A (ja) * | 2009-06-25 | 2011-01-13 | Vmware Inc | 仮想インフラストラクチャを用いた情報技術リスク管理 |
WO2011021318A1 (ja) | 2009-08-19 | 2011-02-24 | 日本電気株式会社 | マルチコアシステム、マルチコアシステムの制御方法、及びマルチプロセッサ |
JP2011138251A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Telecom Networks Ltd | 監視制御ネットワークシステム |
JP2012069076A (ja) * | 2010-09-27 | 2012-04-05 | Toshiba Corp | 評価装置 |
US8191069B2 (en) | 2007-05-22 | 2012-05-29 | Hitachi, Ltd. | Method of monitoring performance of virtual computer and apparatus using the method |
JP2012104148A (ja) * | 2012-01-18 | 2012-05-31 | Toshiba Corp | 評価ユニット、評価方法、評価プログラム、及び記録媒体 |
JP2012119000A (ja) * | 2006-08-18 | 2012-06-21 | Intel Corp | プラットフォーム管理システム、プラットフォーム管理方法およびプログラム |
US8954774B2 (en) | 2011-06-29 | 2015-02-10 | Fujitsu Limited | Preventing starting of the current user operation to save power based on combined most recent operation time |
JP2017045084A (ja) * | 2015-08-24 | 2017-03-02 | 日本電信電話株式会社 | 障害検知装置及び障害検知方法 |
KR20170123324A (ko) | 2015-04-03 | 2017-11-07 | 미쓰비시 덴키 빌딩 테크노 서비스 가부시키 가이샤 | 중계 장치 및 프로그램 |
US10089200B2 (en) | 2014-03-07 | 2018-10-02 | Mitsubishi Electric Corporation | Computer apparatus and computer mechanism |
US10445213B2 (en) | 2016-07-04 | 2019-10-15 | Fujitsu Limited | Non-transitory computer-readable storage medium, evaluation method, and evaluation device |
WO2023008586A1 (ja) * | 2021-07-30 | 2023-02-02 | 京セラ株式会社 | 予測装置、予測方法、予測プログラム、および記録媒体 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7818615B2 (en) * | 2004-09-16 | 2010-10-19 | Invensys Systems, Inc. | Runtime failure management of redundantly deployed hosts of a supervisory process control data acquisition facility |
JP4387968B2 (ja) * | 2005-03-28 | 2009-12-24 | 富士通株式会社 | 障害検出装置および障害検出方法 |
US7702966B2 (en) * | 2005-09-07 | 2010-04-20 | Intel Corporation | Method and apparatus for managing software errors in a computer system |
RU2305313C1 (ru) * | 2005-12-27 | 2007-08-27 | Яков Аркадьевич Горбадей | Способ я.а. горбадея обеспечения надежной работы программного вычислительного средства |
CA2718733C (en) * | 2008-02-15 | 2015-05-26 | The Pnc Financial Services Group, Inc. | Systems and methods for computer equipment management |
US9606879B2 (en) * | 2014-09-29 | 2017-03-28 | Nxp Usa, Inc. | Multi-partition networking device and method therefor |
US9678793B2 (en) | 2015-02-26 | 2017-06-13 | International Business Machines Corporation | Resource-based job scheduling |
US9983972B2 (en) * | 2015-06-01 | 2018-05-29 | Cisco Technology, Inc. | Predictive in-field memory repair scheme |
CN110221928B (zh) * | 2019-06-11 | 2021-06-04 | Oppo广东移动通信有限公司 | 信息记录方法、装置、终端及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5491787A (en) * | 1994-08-25 | 1996-02-13 | Unisys Corporation | Fault tolerant digital computer system having two processors which periodically alternate as master and slave |
JP3546678B2 (ja) | 1997-09-12 | 2004-07-28 | 株式会社日立製作所 | マルチos構成方法 |
JP2003114811A (ja) * | 2001-10-05 | 2003-04-18 | Nec Corp | 自動障害復旧方法及びシステム並びに装置とプログラム |
US7024581B1 (en) * | 2002-10-09 | 2006-04-04 | Xpoint Technologies, Inc. | Data processing recovery system and method spanning multiple operating system |
US7028218B2 (en) * | 2002-12-02 | 2006-04-11 | Emc Corporation | Redundant multi-processor and logical processor configuration for a file server |
US7168002B2 (en) * | 2003-04-25 | 2007-01-23 | International Business Machines Corporation | Preservation of error data on a diskless platform |
-
2003
- 2003-10-09 JP JP2003350818A patent/JP2005115751A/ja active Pending
-
2004
- 2004-03-12 US US10/798,276 patent/US7243266B2/en not_active Expired - Fee Related
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172131A (ja) * | 2005-12-20 | 2007-07-05 | Nec Fielding Ltd | 障害予測システム、障害予測方法、障害予測プログラム |
JP2012119000A (ja) * | 2006-08-18 | 2012-06-21 | Intel Corp | プラットフォーム管理システム、プラットフォーム管理方法およびプログラム |
US8191069B2 (en) | 2007-05-22 | 2012-05-29 | Hitachi, Ltd. | Method of monitoring performance of virtual computer and apparatus using the method |
US8826290B2 (en) | 2007-05-22 | 2014-09-02 | Hitachi, Ltd. | Method of monitoring performance of virtual computer and apparatus using the method |
JP2009110404A (ja) * | 2007-10-31 | 2009-05-21 | Toshiba Corp | 仮想計算機システム及び同システムにおけるゲストosスケジューリング方法 |
US8291413B2 (en) | 2007-10-31 | 2012-10-16 | Kabushiki Kaisha Toshiba | Virtual computer system managing schedule for allocating CPU to guest OSes and guest OS scheduling method |
JP2010079811A (ja) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | 計算機システム、計算機システムの障害の予兆検知方法及びプログラム |
JP4572251B2 (ja) * | 2008-09-29 | 2010-11-04 | 株式会社日立製作所 | 計算機システム、計算機システムの障害の予兆検知方法及びプログラム |
JP2010102441A (ja) * | 2008-10-22 | 2010-05-06 | Fuji Xerox Co Ltd | 情報処理装置、情報処理プログラム |
JP2011008780A (ja) * | 2009-06-25 | 2011-01-13 | Vmware Inc | 仮想インフラストラクチャを用いた情報技術リスク管理 |
WO2011021318A1 (ja) | 2009-08-19 | 2011-02-24 | 日本電気株式会社 | マルチコアシステム、マルチコアシステムの制御方法、及びマルチプロセッサ |
US8719628B2 (en) | 2009-08-19 | 2014-05-06 | Nec Corporation | Multi-core system, method of controlling multi-core system, and multiprocessor |
JP2011138251A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Telecom Networks Ltd | 監視制御ネットワークシステム |
JP2012069076A (ja) * | 2010-09-27 | 2012-04-05 | Toshiba Corp | 評価装置 |
US8954774B2 (en) | 2011-06-29 | 2015-02-10 | Fujitsu Limited | Preventing starting of the current user operation to save power based on combined most recent operation time |
JP2012104148A (ja) * | 2012-01-18 | 2012-05-31 | Toshiba Corp | 評価ユニット、評価方法、評価プログラム、及び記録媒体 |
US10089200B2 (en) | 2014-03-07 | 2018-10-02 | Mitsubishi Electric Corporation | Computer apparatus and computer mechanism |
KR20170123324A (ko) | 2015-04-03 | 2017-11-07 | 미쓰비시 덴키 빌딩 테크노 서비스 가부시키 가이샤 | 중계 장치 및 프로그램 |
JP2017045084A (ja) * | 2015-08-24 | 2017-03-02 | 日本電信電話株式会社 | 障害検知装置及び障害検知方法 |
US10445213B2 (en) | 2016-07-04 | 2019-10-15 | Fujitsu Limited | Non-transitory computer-readable storage medium, evaluation method, and evaluation device |
WO2023008586A1 (ja) * | 2021-07-30 | 2023-02-02 | 京セラ株式会社 | 予測装置、予測方法、予測プログラム、および記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20050081122A1 (en) | 2005-04-14 |
US7243266B2 (en) | 2007-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005115751A (ja) | 計算機システム及び計算機システムの障害兆候の検知方法 | |
JP4980792B2 (ja) | 仮想計算機の性能監視方法及びその方法を用いた装置 | |
JP4920391B2 (ja) | 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム | |
JP3910554B2 (ja) | 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム | |
JP4054616B2 (ja) | 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム | |
JP4659062B2 (ja) | フェイルオーバ方法、プログラム、管理サーバおよびフェイルオーバシステム | |
US11321197B2 (en) | File service auto-remediation in storage systems | |
US8423816B2 (en) | Method and computer system for failover | |
JP5089380B2 (ja) | 仮想マシン・コンピュータ・プログラムの動的マイグレーション | |
JP5851503B2 (ja) | 高可用性仮想機械環境におけるアプリケーションの高可用性の提供 | |
JP5032191B2 (ja) | サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム | |
WO2011074284A1 (ja) | 仮想計算機の移動方法、仮想計算機システム及びプログラムを格納した記憶媒体 | |
US8032786B2 (en) | Information-processing equipment and system therefor with switching control for switchover operation | |
US8117487B1 (en) | Method and apparatus for proactively monitoring application health data to achieve workload management and high availability | |
JP2006163963A (ja) | ディスク引き継ぎによるフェイルオーバ方法 | |
JP2007164305A (ja) | ブート制御方法および計算機システム並びにその処理プログラム | |
JP2004318885A (ja) | 故障プロセッサを置き換える方法、媒体およびシステム | |
EP1943591A1 (en) | Replacing a failing physical processor | |
EP2645635B1 (en) | Cluster monitor, method for monitoring a cluster, and computer-readable recording medium | |
CN111935244B (zh) | 一种业务请求处理系统及超融合一体机 | |
JP2007304845A (ja) | 仮想計算機システムおよびソフトウェア更新方法 | |
JP5597293B2 (ja) | 計算機システム及びプログラム | |
JP2007080012A (ja) | 再起動方法、システム及びプログラム | |
JP2005250840A (ja) | 耐障害システムのための情報処理装置 | |
JP2009003537A (ja) | 計算機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050812 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090512 |