JP2011013953A - 情報処理装置及びそのプロセッサ管理方法 - Google Patents
情報処理装置及びそのプロセッサ管理方法 Download PDFInfo
- Publication number
- JP2011013953A JP2011013953A JP2009157786A JP2009157786A JP2011013953A JP 2011013953 A JP2011013953 A JP 2011013953A JP 2009157786 A JP2009157786 A JP 2009157786A JP 2009157786 A JP2009157786 A JP 2009157786A JP 2011013953 A JP2011013953 A JP 2011013953A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- failure
- occurrence probability
- failure occurrence
- operating system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Debugging And Monitoring (AREA)
- Multi Processors (AREA)
Abstract
【解決手段】サービスプロセッサ110は、固有の識別子をキーとして各プロセッサの稼働時間及び障害履歴を管理し、稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する。また、各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する。そして、複数のプロセッサのうち障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定することで、以後のシステムダウンの確率を低減させる。
【選択図】図3
Description
(1)故障率曲線(バスタブ曲線)から算出する故障発生確率(部品の稼働時間観点からの障害発生確率)、
(2)(重障害に至る予兆である)軽障害の発生頻度から算出する故障発生確率(部品の障害履歴観点からの障害発生確率)、
を加算した最終的な一定期間内にオペレーティングシステムのダウンを招く可能性のある重度の障害の発生確率をいう。具体的なプロセッサの障害発生確率の計算方法は詳しく後述する。
110 サービスプロセッサ
111 プロセッサ監視手段
112 プロセッサ管理手段
113 障害確率計算手段
114 情報伝達手段
120 BIOS
Claims (8)
- 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置であって、
前記サービスプロセッサは、
前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する管理手段と、
前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する障害発生確率計算手段と、
前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する選出手段とを有し、
前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサでオペレーティングシステムを起動することを特徴とする情報処理装置。 - 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置であって、
前記サービスプロセッサは、
前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する管理手段と、
オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する障害発生確率計算手段と、
前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する選出手段とを有し、
前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動することを特徴とする情報処理装置。 - 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサと、オペレーティングシステムの起動制御を行うBIOSとを有する情報処理装置であって、
前記サービスプロセッサは、
前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する管理手段と、
前記オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴から各プロセッサの障害発生確率を計算する障害発生確率計算手段と、
前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを前記BIOSに伝達する伝達手段とを有し、
前記BIOSは、前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記伝達された障害発生確率の最も小さいプロセッサを前記オペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動することを特徴とする情報処理装置。 - 前記障害発生確率計算手段は、前記プロセッサのバスタブ曲線における初期故障期、偶発故障期、摩耗故障期の故障期に基づく障害発生確率と、前記プロセッサの一定期間内における障害発生履歴に基づく障害発生確率とを加算することによって、最終的な障害発生確率を計算することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
- 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置のプロセッサ管理方法であって、
管理手段により、前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する工程と、
計算手段により、前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する工程と、
選出手段により、前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する工程と、
設定手段により、前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動する工程と、
を含むことを特徴とするプロセッサ管理方法。 - 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置のプロセッサ管理方法であって、
管理手段により、前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する工程と、
計算手段により、オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する工程と、
選出手段により、前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する工程と、
設定手段により、前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動する工程と、
を含むことを特徴とするプロセッサ管理方法。 - 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサと、オペレーティングシステムの起動制御を行うBIOSとを有する情報処理装置のプロセッサ管理方法であって、
管理手段により、前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する工程と、
計算手段により、前記オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴から各プロセッサの障害発生確率を計算する工程と、
伝達手段により、前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを前記BIOSに伝達する工程と、
前記BIOSにより、前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記伝達された障害発生確率の最も小さいプロセッサを前記オペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動する工程と、
を含むことを特徴とするプロセッサ管理方法。 - 前記障害発生確率の計算手段は、前記プロセッサのバスタブ曲線における初期故障期、偶発故障期、摩耗故障期の故障期に基づく障害発生確率と、前記プロセッサの一定期間内における障害発生履歴に基づく障害発生確率とを加算することによって、最終的な障害発生確率を計算することを特徴とする請求項5乃至7のいずれか1項に記載のプロセッサ管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009157786A JP5440912B2 (ja) | 2009-07-02 | 2009-07-02 | 情報処理装置及びそのプロセッサ管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009157786A JP5440912B2 (ja) | 2009-07-02 | 2009-07-02 | 情報処理装置及びそのプロセッサ管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011013953A true JP2011013953A (ja) | 2011-01-20 |
JP5440912B2 JP5440912B2 (ja) | 2014-03-12 |
Family
ID=43592763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009157786A Active JP5440912B2 (ja) | 2009-07-02 | 2009-07-02 | 情報処理装置及びそのプロセッサ管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5440912B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013161211A (ja) * | 2012-02-03 | 2013-08-19 | Nec Computertechno Ltd | 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム |
JP2017010421A (ja) * | 2015-06-25 | 2017-01-12 | 富士通株式会社 | 情報処理装置、プロセッサ管理方法、およびプログラム |
DE102018210418A1 (de) | 2017-07-13 | 2019-01-17 | Denso Corporation | Prozessor |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6292045A (ja) * | 1985-10-18 | 1987-04-27 | Fujitsu Ltd | 初期プログラムロ−ド制御方式 |
JPH08272756A (ja) * | 1995-03-31 | 1996-10-18 | Toshiba Corp | マルチプロセッサシステムの起動方法 |
JPH0916442A (ja) * | 1995-06-28 | 1997-01-17 | Nec Corp | Cpu保守システム |
JPH09212470A (ja) * | 1996-01-31 | 1997-08-15 | Toshiba Corp | マルチプロセッサシステム |
JP2002366536A (ja) * | 2002-04-18 | 2002-12-20 | Fujitsu Ltd | プロセッサシステム |
WO2006100747A1 (ja) * | 2005-03-18 | 2006-09-28 | Fujitsu Limited | サービスプロセッサを用いたcpu縮退システム及び縮退方法 |
-
2009
- 2009-07-02 JP JP2009157786A patent/JP5440912B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6292045A (ja) * | 1985-10-18 | 1987-04-27 | Fujitsu Ltd | 初期プログラムロ−ド制御方式 |
JPH08272756A (ja) * | 1995-03-31 | 1996-10-18 | Toshiba Corp | マルチプロセッサシステムの起動方法 |
JPH0916442A (ja) * | 1995-06-28 | 1997-01-17 | Nec Corp | Cpu保守システム |
JPH09212470A (ja) * | 1996-01-31 | 1997-08-15 | Toshiba Corp | マルチプロセッサシステム |
JP2002366536A (ja) * | 2002-04-18 | 2002-12-20 | Fujitsu Ltd | プロセッサシステム |
WO2006100747A1 (ja) * | 2005-03-18 | 2006-09-28 | Fujitsu Limited | サービスプロセッサを用いたcpu縮退システム及び縮退方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013161211A (ja) * | 2012-02-03 | 2013-08-19 | Nec Computertechno Ltd | 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム |
JP2017010421A (ja) * | 2015-06-25 | 2017-01-12 | 富士通株式会社 | 情報処理装置、プロセッサ管理方法、およびプログラム |
DE102018210418A1 (de) | 2017-07-13 | 2019-01-17 | Denso Corporation | Prozessor |
DE102018210418B4 (de) | 2017-07-13 | 2023-08-31 | Denso Corporation | Prozessor |
Also Published As
Publication number | Publication date |
---|---|
JP5440912B2 (ja) | 2014-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2904494B1 (en) | Method for preemptively restarting software in a multisubsystem mobile communication device to increase mean time between failures | |
US8190396B2 (en) | Failure diagnosis system for cooling fans, a failure diagnosis device for cooling fans, a failure diagnosis method for cooling fans, a computer readable medium therefor and a cooling device | |
CN103150237A (zh) | 基于故障的部件更换 | |
US20220342740A1 (en) | Method and Device for Detecting Memory Downgrade Error | |
JP2010134645A (ja) | 遠隔管理システム、遠隔管理装置、機器管理装置、監視間隔制御方法、監視間隔制御プログラム、及びそのプログラムを記録した記録媒体 | |
JP5440912B2 (ja) | 情報処理装置及びそのプロセッサ管理方法 | |
JP2015088176A (ja) | 情報処理装置、障害回避方法およびコンピュータプログラム | |
CN113176963A (zh) | 一种PCIe故障自修复方法、装置、设备及可读存储介质 | |
US9378441B2 (en) | Information processing apparatus, method for controlling the same, and program | |
CN115981898A (zh) | 一种内存可纠错误处理方法、装置、设备及可读存储介质 | |
CN115422010A (zh) | 数据集群中的节点管理方法、装置及存储介质 | |
US10157110B2 (en) | Distributed system, server computer, distributed management server, and failure prevention method | |
CN112148535A (zh) | 一种机架式设备双监控系统 | |
CN108964992B (zh) | 一种节点故障检测方法、装置和计算机可读存储介质 | |
CN110908824A (zh) | 一种故障识别方法、装置及设备 | |
JP2007028118A (ja) | ノード装置の故障判断方法 | |
JP2010009258A (ja) | ソフトウエアの異常検出装置 | |
US20210250226A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP5467936B2 (ja) | 分散・並列処理システムの障害監視装置と方法およびプログラム | |
JP5378847B2 (ja) | 監視装置 | |
JP6365320B2 (ja) | 情報処理システム | |
US10911628B2 (en) | Image processing apparatus, method, and non-transitory computer-readable storage medium | |
JP2018147510A (ja) | サーバ装置およびサーバシステム | |
JP5725126B2 (ja) | 監視制御方法、遠隔管理システム及び遠隔管理装置 | |
US20240248653A1 (en) | System and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130313 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5440912 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |