JP5440912B2 - 情報処理装置及びそのプロセッサ管理方法 - Google Patents

情報処理装置及びそのプロセッサ管理方法 Download PDF

Info

Publication number
JP5440912B2
JP5440912B2 JP2009157786A JP2009157786A JP5440912B2 JP 5440912 B2 JP5440912 B2 JP 5440912B2 JP 2009157786 A JP2009157786 A JP 2009157786A JP 2009157786 A JP2009157786 A JP 2009157786A JP 5440912 B2 JP5440912 B2 JP 5440912B2
Authority
JP
Japan
Prior art keywords
processor
failure
occurrence probability
failure occurrence
operating system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009157786A
Other languages
English (en)
Other versions
JP2011013953A (ja
Inventor
孝行 城風
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009157786A priority Critical patent/JP5440912B2/ja
Publication of JP2011013953A publication Critical patent/JP2011013953A/ja
Application granted granted Critical
Publication of JP5440912B2 publication Critical patent/JP5440912B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、情報処理装置及びそのプロセッサ管理方法に関し、特に、複数のプロセッサを管理する方法に関するものである。
従来、複数のプロセッサを有する情報処理装置においては、オペレーティングシステムはある一つのプロセッサ上で立ち上がり、以後はそのプロセッサがオペレーティングシステム(カーネル)用プロセッサとして固定され、稼働中には他のプロセッサへの割り当て変更は出来ない。よって、プロセッサ非活性化やHot Replace等が可能な情報処理装置においても、稼働中のプロセッサに対して他のプロセッサへの割り当て変更は出来ない。そのため、もし、このプロセッサの障害発生確率が高い場合には、オペレーティングシステムのダウンの可能性が高くなってしまう。
ここで、複数のプロセッサを有する情報処理装置としては、例えば、特許文献1に記載されている。また、部品の故障予防方法や故障診断方法としては、特許文献2、3に記載された方法がある。
特開2006−268519号公報 特開2001−134797号公報 特開2002−304215号公報
上述のようにオペレーティングシステムはある一つのプロセッサ上で立ち上がり、以後はそのプロセッサがオペレーティングシステム(カーネル)用プロセッサとして固定され、稼働中には他のプロセッサへの割り当て変更は出来ない。そのため、このプロセッサの障害発生確率が高い場合には、オペレーティングシステムのダウンの可能性が高くなってしまう問題があった。
一方、特許文献2には、部品の稼働時間を積算し、稼働時間が一定時間を超えた時にその部品が耐用時間を超えたとして通報等を行う方法が記載されているが、複数のプロセッサ等の信頼性を検出するものではない。
また、特許文献3には、使用頻度履歴とその故障発生要因から故障型(初期型故障、偶発型故障、摩耗型故障)の発生確率を抽出し、発生確率が最も高い故障発生要因とその故障型を表示することが記載されている。特許文献3の方法は、初期型故障や偶発型故障等の故障型に対する発生確率を求めるものであり、プロセッサ等の障害発生確率を検出するものではない。
本発明の目的は、障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定することで、システムダウンの可能性をより低減することが可能な情報処理装置及びそのプロセッサ管理方法を提供することにある。
本発明は、固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有し、前記サービスプロセッサは、前記固有の識別子をキーとして各プロセッサの稼働時間及び障害履歴を管理する管理手段と、前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する障害発生確率計算手段と、前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する選出手段とを具備する。そして、前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動する。
本発明によれば、複数のプロセッサの稼働実績から障害発生確率を算出し、最も障害発生率の小さいプロセッサをオペレーティングシステム用に割り当てることにより、以後のシステムダウンを低減させることができる。
本発明に係る情報処理装置の一実施形態を示すブロック図である。 本発明に係るサービスプロセッサの一例を示すブロック図である。 図1、図2の動作を説明する流れ図である。
次に、発明を実施するための形態について図面を参照して詳細に説明する。図1に示すように情報処理装置100内には複数のプロセッサ0、1、2、3が搭載され、それぞれのプロセッサにはSerial Number等の固有識別子が付与されている。各プロセッサには内蔵ROMが設けられている。本実施形態では4個のプロセッサを搭載する例を示しているが、これに限ることはない。
情報処理装置100内には装置内の各部を管理するサービスプロセッサ110が設けられている。サービスプロセッサ110の主な機能としては、各プロセッサの電源状態(電源ON/OFF状態)、OSスタンバイ状態等の情報から各プロセッサの稼働時間を計算し、データベースに記録することである。また、プロセッサ毎に障害履歴をデータベースに記録すること、これらの情報に基づいて各プロセッサの故障発生確率を計算することである。更に、障害発生確率の最も小さいプロセッサをBIOS120に認識させること等である。
その際、論理番号によって優先度付けされている情報処理装置では、障害発生確率が最も小さいプロセッサを認識させる場合、障害発生確率の最も小さいプロセッサに最若番の論理番号を付ける。こうして障害発生確率の最も小さいプロセッサをBIOS120に認識させる。情報処理装置100内にはオペレーティングシステムの起動制御等を行うBIOS120がある(図2)。
図2はサービスプロセッサ110の一例を示すブロック図である。サービスプロセッサ110は、各プロセッサの稼動時間及び障害を監視し、それらの情報をプロセッサ管理手段112に登録するプロセッサ監視手段111、各プロセッサの固有識別子をキーとしたデータベース機能を有するプロセッサ管理手段112、プロセッサ管理手段112に記録された稼働時間及び障害履歴から障害発生確率を計算する障害確率計算手段113、BIOS120に対して障害発生確率の最も小さいプロセッサを確認できる情報を伝達する情報伝達手段114を含んでいる。
サービスプロセッサ110の各手段はそれぞれ次のように動作する。まず、プロセッサ監視手段111は、各プロセッサの稼動時間及び障害を常時監視し、それらの情報を適宜プロセッサ管理手段112に登録する。プロセッサ管理手段112は各プロセッサの固有識別子をキーとしたデータベース機能を有し、プロセッサ毎に稼働時間、障害履歴を管理する。
障害確率計算手段113は、オペレーティングシステムの再立ち上げ時等の適当なタイミングにおいて各プロセッサの障害発生確率を計算する。情報伝達手段114は障害確率計算手段113で計算された各プロセッサの障害発生確率から障害発生確率が最も小さいプロセッサを認識させる情報をオペレーティングシステムの再立ち上げ時等にBIOS120に渡す。
BIOS120は、複数のプロセッサ0〜3のうち障害発生確率が最も小さいプロセッサをオペレーティングシステム起動及び稼動用に指定する。以後、その指定されたプロセッサがオペレーティングシステム用プロセッサとなる。なお、このプロセッサはMonarch CPUとも呼ばれる。
ここで、プロセッサの障害発生確率とは、
(1)故障率曲線(バスタブ曲線)から算出する故障発生確率(部品の稼働時間観点からの障害発生確率)、
(2)(重障害に至る予兆である)軽障害の発生頻度から算出する故障発生確率(部品の障害履歴観点からの障害発生確率)、
を加算した最終的な一定期間内にオペレーティングシステムのダウンを招く可能性のある重度の障害の発生確率をいう。具体的なプロセッサの障害発生確率の計算方法は詳しく後述する。
次に、図1、図2及び図3のフローチャートを参照して本実施形態の動作について詳細に説明する。まず、サービスプロセッサ110のプロセッサ監視手段111は運用中のプロセッサの稼働時間及び障害を監視し、プロセッサ管理手段112にこれらのデータを適宜登録する。
ここで、定期保守等のタイミング、例えば、システム立ち下げ(オペレーティングシステム立ち下げ及びプロセッサ電源OFF:図3のステップA1)を実施した際には、各プロセッサ(運用中のプロセッサ)の稼働時間及び障害履歴に基づいて障害確率計算手段113は各プロセッサの障害発生確率を計算する(図3のステップA2)。
次いで、システム再立ち上げ時に情報伝達手段114はBIOS120に対して各プロセッサの障害発生確率もしくは障害発生確率の最も小さいプロセッサを確認できる情報を伝達する(図3のステップA3)。BIOS120は障害発生確率の最も小さいプロセッサをオペレーティングシステム起動用及びオペレーティングシステム稼動用として設定し、オペレーティングシステムを起動する(図3のステップA4)。障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定することで、以降のシステムダウンを低減させることが可能となる。
本実施形態では、サービスプロセッサ110にプロセッサ監視手段111、プロセッサ管理手段112、障害確率計算手段113及び情報伝達手段114を追加する形であり、BIOS120の機能については障害発生確率の最も小さいプロセッサでオペレーティングシステムを起動及び稼動を実施させればよいため、オペレーティングシステムの改造の必要はない。
次に、プロセッサ監視手段111及びプロセッサ管理手段112がプロセッサの稼働時間を積算する方法を説明する。まず、プロセッサ電源のON/OFF、オペレーティングシステムからのスタンバイ移行/復帰通知をプロセッサ監視手段111が監視する。このタイミングでタイムスタンプを切ってプロセッサ管理手段112に登録することで各プロセッサの稼働時間を計算する。
プロセッサの障害履歴の管理方法としては、プロセッサ監視手段111がプロセッサ障害発生時にBIOS120から受け取ったデータを判別し、プロセッサ管理手段112に登録することで障害履歴を管理する。プロセッサ管理手段112は各プロセッサが個別に有するシリアルナンバー等の固有識別子によってデータを管理する。よって物理的な位置変更等に影響されることなく管理できる。
次に、障害確率計算手段113による障害発生確率の計算方法の一例を説明する。通常、部品の寿命を表すものとして故障率曲線、通称バスタブ曲線と呼ばれるものが知られている。バスタブ曲線に関しては、例えば、特許文献3(特開2002−304215号公報)等に記載されている。バスタブ曲線は、部品使用時間に対して故障発生率が初期故障期、偶発故障期、摩耗故障期を合わせた曲線がバスタブのような曲線になることからそう呼ばれている。
周知のようにバスタブ曲線の初期故障期は、製造過程に起因する欠陥等によって使用開始と同時に劣化・故障してしまうことが多い期間であり、初期不良の発生期間である。偶発故障期は、初期不良がなくなり、一定の割合でしか故障が発生しない安定した期間である。摩耗故障期は部品が摩耗・劣化してきており、故障発生が増加してくる期間である。
まず、上述の(1)の故障発生確率の計算方法に関して説明する。本実施形態では、バスタブ曲線上の初期故障期、磨耗故障期といった故障率の高い期間に相当する場合には、故障発生確率が高くなる計算式を設定する。例えば、プロセッサの累積稼働時間が初期故障期や摩耗故障期に該当している場合には、そのバスタブ曲線の初期故障期や摩耗故障期の曲線(直線)に基づき計算式(近似式)を設定し、その計算式から障害発生確率を計算する。
具体的には、例えば、プロセッサの累積稼働時間が0時間から100時間までは初期故障期に該当するものとし、実際のプロセッサの累積稼働時間が初期故障期にあるものとする。その際、プロセッサの稼働時間が0時間、10時間、20時間、…、100時間になるに従って障害発生確率が低くなるようにバスタブ曲線の初期故障期の曲線(直線)から計算式(近似式)を設定し、実際のプロセッサの稼働時間とその近似式から稼働時間に基づく障害発生確率を算出する。
また、例えば、プロセッサの稼働時間が100時間から400時間まで偶発故障期に該当する場合には、その期間は一定の障害発生確率を設定する。更に、例えば、プロセッサの稼働時間が400時間から500時間まで摩耗故障期に該当する場合には、稼働時間が400時間、410時間、…、500時間になるに従って障害発生確率が高くなるように摩耗故障期の曲線(直線)から近似式を設定し、実際のプロセッサの稼働時間とその近似式から障害発生確率を算出する。
次に、上述の(2)の計算方法に関して説明する。例えば、プロセッサの前回の起動時から立ち下げ時までの障害発生数と稼働時間から障害発生率を計算する。これを累積して、例えば、一定期間(例えば1週間)の障害発生数から障害発生確率を算出する。つまり、一定期間内にシステムダウンに繋がる重障害の予兆となる軽障害(システムダウンまでには至らない、運用中に訂正可能な障害)が何回発生するかを計数し、それに基づいて障害発生確率を計算する。
次に、(1)で得られた障害発生確率に(2)で得られた障害発生確率を加算することで総合的なプロセッサの障害発生確率が得られる。なお、単純な計算方法として、例えば、1週間のうちに10回以上、ある特定の軽障害が発生したら障害発生確率を50%上乗せする等の方法がある。
例えば、図1に示すようにサーバシステムには4個のプロセッサ0、1、2、3が搭載され、再起動前までのそれぞれの稼動実績としてプロセッサ0は稼働時間がバスタブ曲線の初期故障期に該当し(故障発生確率:高)、障害履歴はなしとする。プロセッサ1は稼働時間がバスタブ曲線の磨耗故障期に該当し(故障発生確率:高)、障害履歴はなしとする。
プロセッサ2は稼働時間がバスタブ曲線の偶発故障期に該当し(故障発生確率:低)、障害履歴はなしとする。プロセッサ3は稼働時間がバスタブ曲線の偶発故障期に該当し(故障発生確率:低)、障害履歴はこの1週間に10回発生したとする(故障発生確率:高)。この例の場合には、4個のプロセッサのうちプロセッサ2が最も障害発生確率が低いということになる。
ここで、BIOS120はサービスプロセッサ110から指定されたプロセッサをオペレーティングシステム立ち上げ・運用に割り当てる場合には、サービスプロセッサ110の情報伝達手段114は最も障害発生確率が小さいプロセッサ2をBIOS120に対して指定する。よって、プロセッサ2はオペレーティングシステム用に設定され、以後のシステムダウンの確率を低減することができる。
このように本実施形態では、各プロセッサの稼働時間と障害履歴に基づいて障害発生確率を算出し、システム再立ち上げ時等に最も障害発生率の小さいプロセッサをオペレーティングシステム用に割り当てることにより、以後のシステムダウンを低減することができる。
また、プロセッサのHot Replace機能を有するオペレーティングシステムにおいては、障害発生確率が他のプロセッサに対して比較的高いプロセッサを、Hot Replaceにて予防保守でき、システム性能を損なうことなく運用することが可能となる。つまり、重要度が低いプロセッサは必然的に重要度の低い役割に回されることになるが、重要度が低い場合には、プロセッサが故障となってもシステム全体がダウンする可能性は(重要度が高いプロセッサの故障によるシステムダウンの可能性より)低くなる。Hot Replace機能がついているシステムにおいては、この障害発生確率の高いプロセッサをシステム運用中に別のプロセッサと交換することにより、プロセッサの故障によるシステムダウン確率の更なる低下や、システム性能の低下を未然に防止することができる。
更に、本発明はオペレーティングシステム側の改造なしに実現することが可能である。即ち、プロセッサはサービスプロセッサにて電源ON/OFFが制御され、また一般的にオペレーティングシステムがスタンバイ状態に移行した場合には、オペレーティングシステムからBIOS及びサービスプロセッサにその旨が通知され、これら情報に基づき稼動時間の監視が出来る。また、障害に関しても一般的にBIOS及びサービスプロセッサにて管理される。そのため、特に、オペレーティングシステム側の改造は必要としない。
上述の実施形態で説明の通り、本発明の趣旨は、複数の部品(プロセッサ)の稼働実績から故障発生確率を計算し、故障発生確率の最も小さい部品に重要な役割(オペレーティングシステム稼動等)を担わせることにより、以後のシステムダウンの発生率を低減するというものである。よって、本発明は、情報処理装置等の複数の同じ部品を有する全てのシステムにおいて、そのような目的を達成する場合の手段として適用することが可能である。
なお、以上の実施形態の情報処理装置はハードウェアによっても実現できるが、コンピュータをその情報処理装置として機能させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。また、以上の実施形態のプロセッサ管理方法はハードウェアによっても実現できるが、コンピュータにその方法を実行させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。
本発明は、複数個のプロセッサ等の同一部品を有するシステムに使用することができる。その際、複数の部品の稼働実績から最も障害発生確率の小さい部品を選定し、その部品に最も重要な役割を担わせればよい。
100 情報処理装置
110 サービスプロセッサ
111 プロセッサ監視手段
112 プロセッサ管理手段
113 障害確率計算手段
114 情報伝達手段
120 BIOS

Claims (12)

  1. 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置であって、
    前記サービスプロセッサは、
    前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する管理手段と、
    前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する障害発生確率計算手段と、
    前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する選出手段とを有し、
    前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサでオペレーティングシステムを起動することを特徴とする情報処理装置。
  2. 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置であって、
    前記サービスプロセッサは、
    前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する管理手段と、
    オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する障害発生確率計算手段と、
    前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する選出手段とを有し、
    前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動することを特徴とする情報処理装置。
  3. 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサと、オペレーティングシステムの起動制御を行うBIOSとを有する情報処理装置であって、
    前記サービスプロセッサは、
    前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する管理手段と、
    前記オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴から各プロセッサの障害発生確率を計算する障害発生確率計算手段と、
    前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを前記BIOSに伝達する伝達手段とを有し、
    前記BIOSは、前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記伝達された障害発生確率の最も小さいプロセッサを前記オペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動することを特徴とする情報処理装置。
  4. 前記障害発生確率計算手段は、前記プロセッサのバスタブ曲線における初期故障期、偶発故障期、摩耗故障期の故障期に基づく障害発生確率と、前記プロセッサの一定期間内における障害発生履歴に基づく障害発生確率とを加算することによって、最終的な障害発生確率を計算することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置のプロセッサ管理方法であって、
    管理手段により、前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する工程と、
    計算手段により、前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する工程と、
    選出手段により、前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する工程と、
    設定手段により、前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動する工程と、
    を含むことを特徴とするプロセッサ管理方法。
  6. 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサとを有する情報処理装置のプロセッサ管理方法であって、
    管理手段により、前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する工程と、
    計算手段により、オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴に基づいて各プロセッサの障害発生確率を計算する工程と、
    選出手段により、前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを選出する工程と、
    設定手段により、前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記障害発生確率の最も小さいプロセッサをオペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動する工程と、
    を含むことを特徴とするプロセッサ管理方法。
  7. 固有の識別子を有する複数のプロセッサと、前記複数のプロセッサを管理するサービスプロセッサと、オペレーティングシステムの起動制御を行うBIOSとを有する情報処理装置のプロセッサ管理方法であって、
    管理手段により、前記固有の識別子をキーとして運用中のプロセッサの稼働時間及び障害履歴を管理する工程と、
    計算手段により、前記オペレーティングシステムの立ち下げ時に前記稼働時間と障害履歴から各プロセッサの障害発生確率を計算する工程と、
    伝達手段により、前記各プロセッサの障害発生確率から最も障害発生確率の小さいプロセッサを前記BIOSに伝達する工程と、
    前記BIOSにより、前記オペレーティングシステムの再立ち上げ時に前記複数のプロセッサのうち前記伝達された障害発生確率の最も小さいプロセッサを前記オペレーティングシステム用に設定し、当該プロセッサで前記オペレーティングシステムを起動する工程と、
    を含むことを特徴とするプロセッサ管理方法。
  8. 前記障害発生確率の計算手段は、前記プロセッサのバスタブ曲線における初期故障期、偶発故障期、摩耗故障期の故障期に基づく障害発生確率と、前記プロセッサの一定期間内における障害発生履歴に基づく障害発生確率とを加算することによって、最終的な障害発生確率を計算することを特徴とする請求項5乃至7のいずれか1項に記載のプロセッサ管理方法。
  9. 前記初期故障期には稼働時間が長くなるに従って障害発生確率を低くし、前記摩耗故障期には稼働時間が長くなるに従って障害発生確率を高くすることを特徴とする請求項4に記載の情報処理装置。
  10. 前記初期故障期には稼働時間が長くなるに従って障害発生確率を低くし、前記摩耗故障期には稼働時間が長くなるに従って障害発生確率を高くすることを特徴とする請求項8に記載のプロセッサ管理方法。
  11. 一定期間内に障害が一定回数以上発生した場合に障害発生確率を上乗せする請求項1−4及び9のいずれか1項に記載の情報処理装置。
  12. 一定期間内に障害が一定回数以上発生した場合に障害発生確率を上乗せする請求項5−8及び10のいずれか1項に記載のプロセッサ管理方法。
JP2009157786A 2009-07-02 2009-07-02 情報処理装置及びそのプロセッサ管理方法 Active JP5440912B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009157786A JP5440912B2 (ja) 2009-07-02 2009-07-02 情報処理装置及びそのプロセッサ管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009157786A JP5440912B2 (ja) 2009-07-02 2009-07-02 情報処理装置及びそのプロセッサ管理方法

Publications (2)

Publication Number Publication Date
JP2011013953A JP2011013953A (ja) 2011-01-20
JP5440912B2 true JP5440912B2 (ja) 2014-03-12

Family

ID=43592763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009157786A Active JP5440912B2 (ja) 2009-07-02 2009-07-02 情報処理装置及びそのプロセッサ管理方法

Country Status (1)

Country Link
JP (1) JP5440912B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5958987B2 (ja) * 2012-02-03 2016-08-02 Necプラットフォームズ株式会社 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム
JP6558098B2 (ja) * 2015-06-25 2019-08-14 富士通株式会社 情報処理装置、およびプログラム
JP6915419B2 (ja) 2017-07-13 2021-08-04 株式会社デンソー プロセッサ

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6292045A (ja) * 1985-10-18 1987-04-27 Fujitsu Ltd 初期プログラムロ−ド制御方式
JPH08272756A (ja) * 1995-03-31 1996-10-18 Toshiba Corp マルチプロセッサシステムの起動方法
JP2713250B2 (ja) * 1995-06-28 1998-02-16 日本電気株式会社 Cpu保守システム
JPH09212470A (ja) * 1996-01-31 1997-08-15 Toshiba Corp マルチプロセッサシステム
JP2002366536A (ja) * 2002-04-18 2002-12-20 Fujitsu Ltd プロセッサシステム
CN100507866C (zh) * 2005-03-18 2009-07-01 富士通株式会社 使用服务处理器的cpu退缩系统和cpu退缩方法

Also Published As

Publication number Publication date
JP2011013953A (ja) 2011-01-20

Similar Documents

Publication Publication Date Title
EP2904494B1 (en) Method for preemptively restarting software in a multisubsystem mobile communication device to increase mean time between failures
US8190396B2 (en) Failure diagnosis system for cooling fans, a failure diagnosis device for cooling fans, a failure diagnosis method for cooling fans, a computer readable medium therefor and a cooling device
CN103150237B (zh) 基于故障的部件更换
US11853150B2 (en) Method and device for detecting memory downgrade error
US9910750B2 (en) Storage controlling device, storage controlling method, and non-transitory computer-readable recording medium
JP5440912B2 (ja) 情報処理装置及びそのプロセッサ管理方法
JP2010134645A (ja) 遠隔管理システム、遠隔管理装置、機器管理装置、監視間隔制御方法、監視間隔制御プログラム、及びそのプログラムを記録した記録媒体
CN115981898A (zh) 一种内存可纠错误处理方法、装置、设备及可读存储介质
JP2016224883A (ja) 異常検出方法、情報処理装置および異常検出プログラム
KR101017296B1 (ko) 정보 처리 장치, 에러 통지 프로그램, 에러 통지 방법
US9378441B2 (en) Information processing apparatus, method for controlling the same, and program
WO2006100747A1 (ja) サービスプロセッサを用いたcpu縮退システム及び縮退方法
JP2018133766A (ja) 処理装置、二重化システム、処理方法、および処理プログラム
CN108964992B (zh) 一种节点故障检测方法、装置和计算机可读存储介质
US20200099798A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2007028118A (ja) ノード装置の故障判断方法
JP2010009258A (ja) ソフトウエアの異常検出装置
CN115422010A (zh) 数据集群中的节点管理方法、装置及存储介质
JP6654662B2 (ja) サーバ装置およびサーバシステム
WO2024066589A1 (zh) 一种硬件故障上报的处理方法及其相关设备
US20200304674A1 (en) Image processing apparatus, method, and non-transitory computer-readable storage medium
JP6365320B2 (ja) 情報処理システム
JP5725126B2 (ja) 監視制御方法、遠隔管理システム及び遠隔管理装置
US20240037014A1 (en) Prediction of an anomaly of a resource for programming a checkpoint
KR100913799B1 (ko) 서비스 프로세서를 이용한 cpu 축퇴 시스템 및 축퇴방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130313

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131205

R150 Certificate of patent or registration of utility model

Ref document number: 5440912

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150