JP2005221413A - 電子装置、故障予測方法ならびに故障予測プログラムおよびその記録媒体 - Google Patents

電子装置、故障予測方法ならびに故障予測プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP2005221413A
JP2005221413A JP2004030570A JP2004030570A JP2005221413A JP 2005221413 A JP2005221413 A JP 2005221413A JP 2004030570 A JP2004030570 A JP 2004030570A JP 2004030570 A JP2004030570 A JP 2004030570A JP 2005221413 A JP2005221413 A JP 2005221413A
Authority
JP
Japan
Prior art keywords
environmental load
component
failure
failure prediction
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004030570A
Other languages
English (en)
Other versions
JP4500063B2 (ja
Inventor
Akihiro Yasuo
明弘 安尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004030570A priority Critical patent/JP4500063B2/ja
Priority to US10/875,917 priority patent/US7469189B2/en
Publication of JP2005221413A publication Critical patent/JP2005221413A/ja
Application granted granted Critical
Publication of JP4500063B2 publication Critical patent/JP4500063B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/24Marginal checking or other specified testing methods not covered by G06F11/26, e.g. race tests

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Testing Electric Properties And Detecting Electric Faults (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】経年劣化する部品から構成される電子装置で、構成部品の故障予測を正確に行うこと。
【解決手段】制御部140が、温度設定部120を制御してブレードサーバ100の構成部品であるハードディスク110に通常の使用状態より高い温度負荷を与え、エラー検出部130により高い温度負荷の下で検出されたハードディスク110のエラーに基づいて故障予測を行う。通常の使用状態より高い温度負荷としては、動作保証値での温度負荷や動作保証値外の温度負荷を与える。
【選択図】 図2

Description

この発明は、経年劣化する部品から構成される電子装置、故障予測方法ならびに故障予測プログラムおよびその記録媒体に関し、特に、構成部品の故障の前兆を直接検出し、もって確度の高い故障予測を行うことができる電子装置、故障予測方法ならびに故障予測プログラムおよびその記録媒体に関するものである。
近年の情報機器や通信装置などの電子装置は、大規模化、高集積化により、装置を構成する部品の故障に起因するシステムダウンの可能性が大きくなってきている。例えば、高密度搭載を実現したブレードサーバは、数百規模のCPUを搭載するなど、従来のサーバに比べて部品点数が多く、その分だけ部品故障の可能性が大きくなっている。そこで、システムダウンを回避するために、運用の2重化などの手法がとられているが、それでも、潜在する故障との多重故障等により、装置のシステムダウンは発生している。
そこで、部品の故障を予測することによってシステムダウンを回避することが重要となっており、統計的手法を用いた故障部品予測技術が開発されている。統計的手法を用いた故障予測では、電子装置の動作状態をセンサーを用いて測定した結果と、部品の動作モデルとを比較することで故障の予測を行う。
ここで、動作モデルは、各部品から得た性能データを基に作成され、また、定期的に更新される。この動作モデルと実際の測定結果との間の「ノイズ」として現れる微妙な変化を捕捉することによって、通常動作の誤差の範囲内か、それとも故障の前兆かを判断することができる。例えば、ハードディスク装置では、応答時間を測定した結果と動作モデルから予想される応答時間との差を用いて故障予測を行うことができる。
また、統計的手法を拡張したものとして、対象電子回路や部品に対して、ハード的に冗長構成をとり、冗長部分に対象回路より高い負荷を与えることで、冗長回路が故障した時点で、対象回路も近い将来故障が発生するであろうと予測する手法も開発されている(例えば、特許文献1および2を参照)。
特開平2−87079号公報 特開平7−128384号公報
しかしながら、統計的故障予測の的中率は、動作モデルの質に依存し、規模が大きく動作が複雑な半導体部品の全ての動作をモデル化するのは困難であるという問題がある。さらに、統計的故障予測の的中率は、実際の動作と動作モデルとの差分を故障の前兆と判断する場合の閾値にも依存し、この閾値を決定することも非常に難しいという問題がある。
また、冗長回路を用いた手法は、あくまでも統計的予測にすぎず、部品のばらつき、試験環境の微妙な違いにより誤差が大きいという問題がある。また、装置の運用においても、対象回路が正常に動作している状態で、将来故障するかもしれないレベルでの部品交換は、困難であるといえる。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、構成部品の故障の前兆を直接検出し、もって確度の高い故障予測を行うことができる電子装置、故障予測方法ならびに故障予測プログラムおよびその記録媒体を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、経年劣化する部品から構成される電子装置であって、前記経年劣化する部品に通常の使用状態より高い環境負荷を与える環境負荷付与手段と、前記環境負荷付与手段により通常の使用状態より高い環境負荷が与えられた部品の異常を検出する異常検出手段と、前記異常検出手段により検出された異常に基づいて前記部品の故障予測を行う故障予測手段とを備えたことを特徴とする。
また、本発明は、経年劣化する経年劣化部品の故障予測を行う故障予測方法であって、電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与工程と、前記環境負荷付与工程により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常を検出する異常検出工程と、前記異常検出工程により検出された異常に基づいて前記経年劣化部品の故障予測を行う故障予測工程とを含んだことを特徴とする。
また、本発明は、経年劣化する経年劣化部品の故障予測を行う故障予測プログラムであって、電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与手順と、前記環境負荷付与手順により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常に基づいて該部品の故障予測を行う予測手順とを電子装置に内蔵されたコンピュータに実行させることを特徴とする。
また、本発明は、経年劣化する経年劣化部品の故障予測を行う故障予測プログラムを記録したコンピュータ読み取り可能な記録媒体であって、電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与手順と、前記環境負荷付与手順により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常に基づいて該部品の故障予測を行う予測手順とを電子装置に内蔵されたコンピュータに実行させる故障予測プログラムを記録したことを特徴とする。
かかる発明によれば、経年劣化する部品に通常の使用状態より高い環境負荷を与え、通常の使用状態より高い環境負荷を与えた経年劣化部品の異常に基づいて部品の故障予測を行うよう構成したので、部品の故障の前兆を直接検出して故障予測を行うことができる。
本発明によれば、部品の故障の前兆を直接検出して故障予測を行うので、確度の高い故障予測を行うことができるという効果を奏する。
以下に添付図面を参照して、この発明に係る電子装置、故障予測方法ならびに故障予測プログラムおよびその記録媒体の好適な実施例を詳細に説明する。なお、本実施例では、本発明をブレードサーバに適用した場合を中心に説明する。
まず、本実施例に係る故障予測の概念について図1−1および1−2を用いて説明する。本実施例に係る故障予測では、高ストレスがかかった状態では異常が発生しやすいという電子部品の特徴を利用して故障の発生を予測する。
図1−1は、環境負荷に対する部品特性曲線を示す図である。同図に示すように、電子部品は、温度、湿度、電圧等の環境条件で高い負荷がかかっている時に、異常が発生しやすくなる。
このため、装置に搭載される電子部品は、通常、動作保障条件が規定値以内になるように環境条件が整えられている。(例えば、部品の環境温度が規定値以外になることが想定される場合は、冷却のためのFAN等が設置される。)
また、環境負荷が高い状態では部品に異常が発生しやすいという特徴を利用した例として、部品の出荷試験におけるバーンイン試験がある。バーンイン試験では、保障動作以上の温度を与えて試験を行い、エラーが発生した部品を不良部品と判断している。
また、経年劣化による故障では、電子部品の動作状態の中で徐々に部品の特性が劣化していき、運用環境下における部品としての特性が異常と判断される閾値を超えた時点で故障と判断される。
すなわち、通常運用環境状態では異常が発生していなくても、経年劣化による部品の劣化は進行している(曲線Sから曲線T)。そして、部品の劣化が進み、まもなく故障するといった状態においても、通常の動作条件では、問題が発生せず、正常に動作する状態が存在する。しかし、さらに部品の劣化が進むと、通常の動作条件で異常が発生し、装置全体、システム全体への故障へとつながる(曲線Uおよび曲線V)。
したがって、この経年劣化による部品の劣化を検出することができれば、部品の故障予測が可能となる。本実施例に係る故障予測では、部品に対して環境条件で高い負荷を与え、高負荷状態での誤り動作を検出することにより、経年劣化を起こしながらも通常状態では正常に動作している部品を検出し、部品故障による装置及びシステム全体障害の発生を回避する。
図1−2は、本実施例に係る電子装置の概念構成を示す機能ブロック図である。同図に示すように、本実施例に係る電子装置10は、装置部品11と、環境負荷付与部12と、エラー検出部13と、制御部14とを有する。
装置部品11は、電子装置10の装置機能を実現する部品であり、故障予測の対象である。環境負荷付与部12は、装置部品11に温度、湿度、電圧等の環境負荷を与える機能部である。
エラー検出部13は、環境負荷を加えられた装置部品11に発生する異常を検出する機能部である。異常状態の検出には、外部に検出部を構成してもよいが、パリティ/ECCエラーなどの装置部品11から異常信号が出力される場合は、それらの信号をモニタすることによって異常を検出することも可能である。
制御部14は、環境負荷付与部12を制御して装置部品11に環境負荷を加え、エラー検出部13が検出した異常に基づいて装置部品11の故障予測を行う機能部である。この制御部14からの環境負荷付与試験の指示は、通常の運用状態で行ってもよいし、検出されるエラーにより、装置の運用上問題がある場合は、試験モードに移行してから試験を行うようにしてもよい。
このように、本実施例に係る電子装置10では、制御部14が、環境負荷付与部12を制御して装置部品11に通常の使用状態より高い環境負荷を加え、エラー検出部13が検出した異常に基づいて装置部品11の故障予測を行うこととしたので、経年劣化により故障状態に近づいているが通常状態では正常に動作している部品に対して直接的に劣化の進行状態を把握することが可能となる。
まず、本実施例1に係るブレードサーバの構成について説明する。図2は、本実施例1に係るブレードサーバの構成を示す機能ブロック図である。同図に示すように、このブレードサーバ100は、ハードディスク110と、温度設定部120と、エラー検出部130と、制御部140とを有する。
ハードディスク110は、温度設定部120によって温度負荷が加えられ、故障予測が行われる部品である。図3は、温度負荷に対するハードディスク110のエラー率を示す図である。
一般に、ハードディスク110などの電子部品の動作条件としては、絶対定格としての最高温度および最低温度と、動作保証としての最高温度および最低温度が規定される。絶対定格は、それを超えた状態では、部品が故障する可能性があるとされる値であり、動作保証値は、それを超えた状態では、正常動作を保証しない値である。
すなわち、正常な部品は、動作保証温度外の環境下では、正常に動作しない可能性があるが、動作保証温度内では、正常な動作が保証されている。ただし、経年劣化により故障状態に近づいている部品は、通常動作環境では問題なく正常に動作するが、動作保証内の保証値近辺の環境下ではエラーが検出される可能性が高くなる。
したがって、定期的にハードディスク110に対して、動作保証温度の温度負荷または動作保証温度内近辺の温度負荷を与え、エラーを検出することにより、経年劣化により故障状態に近づいているハードディスク110の特定が可能となる。
図3に示すように、通常状態では、ハードディスク110のエラー率は、動作保証範囲内で警告エラーレート(Erw)以下である(曲線S)。そして、経年劣化が進行し、特性が劣化すると、特性曲線は曲線Tを経て曲線Uの状態となり、ハードディスク110に搭載されたスマート機能(Self-Monitoring, Analysis and Reporting Technology)によって警告状態と判定される。
ここで、スマート機能とは、ハードディスク110の自己診断機能であり、発生したエラーをロギングしておき、エラーが多発するようになると、ディスクの交換時期であると判断する機能である。
しかし、スマート機能によって判断される警告状態から完全な故障状態(曲線V)になるまでの時間が短い場合が多いため、ディスク交換が行われる前にシステムダウンにつながる可能性が高い。
そこで、本実施例に係るブレードサーバ100では、動作環境最低保証値の5℃または動作環境最高保証値55℃でのエラー率を計測することで、スマード機能による故障予測段階よりも早い段階である曲線Tの段階で故障を予測することができる。
温度設定部120は、ハードディスク110に温度負荷を与える機能部であり、例えば、ペルティエ素子などの温度調整回路である。エラー検出部130は、温度負荷を加えられたハードディスク110に発生するエラーを検出する機能部である。
制御部140は、ハードディスク110の直近に配置した温度センサーにより測定された温度に基づいて、温度設定部120を制御してハードディスク110に温度負荷を加え、エラー検出部130が検出したエラーに基づいてハードディスク110のエラー率を算出して故障予測を行う機能部である。
この制御部140は、温度制御部141と、動作保証値記憶部142と、エラーデータ収集部143と、動作保証値試験部144と、動作保証外試験部145と、閾値履歴記憶部146と、温度負荷試験制御部147とを有する。
温度制御部141は、温度設定部120を制御してハードディスク110の温度を動作保証値試験部144または動作保証外試験部145によって指定される設定温度に設定する制御部である。
動作保証値記憶部142は、ハードディスク110の動作保証温度を記憶した記憶部である。図4は、動作保証値記憶部142の一例を示す図である。同図に示すように、この動作保証値記憶部142は、ハードディスク110の動作保証温度として、最低保証値5℃と最高保証値55℃を記憶している。
エラーデータ収集部143は、エラー検出部130により検出されたエラーに基づいてハードディスク110のエラー率を算出する処理部である。このエラーデータ収集部によって算出されたエラー率は、動作保証値試験部144または動作保証外試験部145によってハードディスク110の故障予測に用いられる。
動作保証値試験部144は、動作保証値の温度負荷をハードディスク110に与えた場合のエラー率を求める動作保証値試験を行う処理部であり、求めたエラー率が警告エラーレートを超えた場合には、ハードディスク110に異常が発生する可能性が高いことをユーザに通知する。具体的には、この動作保証値試験部144は、最高保証値55℃の温度負荷をハードディスク110に与えて動作保証値試験を行う。
この動作保証値試験部144が、最高保証値55℃の温度負荷をハードディスク110に与えてエラー率を求め、求めたエラー率が警告エラーレートを超えた場合には、異常が発生する可能性が高いことをユーザに通知することによって、ハードディスク110の故障予測を正確に行うことができる。
なお、ここでは、最高保証値55℃の温度負荷をハードディスク110に与えてエラー率を求めているが、最低保証値5℃の温度負荷を与えてエラー率を求めることもできる。また、最高保証値または最低保証値以外に、動作保証温度内の動作保証値に近い温度の温度負荷を与えることもできる。
また、最高保証値55℃および最低保証値5℃の温度負荷をハードディスク110に与えてエラー率を求め、いずれかのエラー率が警告エラーレートを超えた場合に、ハードディスク110に異常が発生する可能性が高いことをユーザに通知することもできる。
動作保証外試験部145は、動作保証値を超えた温度負荷をハードディスク110に与えた場合に、エラー率が故障閾値となる閾値温度を求める動作保証外試験を行う処理部である。
また、この動作保証外試験部145は、前回の動作保証外試験で求めた閾値温度である前回測定閾値と、今回動作保証外試験で求めた閾値温度である今回測定閾値と、最高保証値55℃との関係に基づいてハードディスク110の故障予測を行う。
具体的には、この動作保証外試験部145は、前回測定閾値と今回測定閾値との差の絶対値と、今回測定閾値と最高保証値55℃との差の絶対値を比較し、前回測定閾値と今回測定閾値との差の絶対値のほうが大きい場合には、次回の動作保証外試験時に異常状態となると判断してユーザに通知する。
この動作保証外試験部145が、最高保証値55℃を超えた温度負荷をハードディスク110に与えた場合にエラー率が故障閾値となる閾値温度を求め、前回測定閾値および最高保証値55℃との関係に基づいて故障予測を行うことによって、ハードディスク110の故障予測を正確に行うことができる。
なお、動作保証値外の負荷を部品に与えることによってすぐに部品の動作が異常になるわけではない。したがって、動作保証値外の負荷をかけて正常に動作する負荷の閾値を検出し、経年劣化とともに変化するこの閾値を計測することで、動作補償範囲で発生する異常を予測することが可能となる。
また、ここでは、最高保証値55℃を超えた温度負荷をハードディスク110に与えた場合に閾値温度を求めているが、最低保証値5℃を超えた低い温度での温度負荷を与えて閾値温度を求めることもできる。また、最高保証値55℃および最低保証値5℃を超えた温度負荷をハードディスク110に与えて閾値温度を求めて故障予測を行い、いずれかの閾値温度に基づいて次回の動作保証外試験時に異常発生が予測される場合に、ユーザに通知することもできる。
閾値履歴記憶部146は、動作保証外試験部145が求めた閾値温度の履歴を記憶する記憶部である。例えば、図3において、特性曲線が故障閾値と交わるAやBなどの温度が閾値温度として閾値履歴記憶部146に記憶される。この閾値履歴記憶部146に記憶される閾値温度は、動作保証外試験部145が故障予測を行う場合に用いられる。
図5は、閾値履歴記憶部146の一例を示す図である。同図に示すように、この閾値履歴記憶部146は、動作保証外試験において求めた閾値温度を順番に記憶する。例えば、前回の動作保証外試験における閾値温度は80℃であり、今回の動作保証外試験における閾値温度は70℃である。
温度負荷試験制御部147は、温度負荷をハードディスク110に与えて温度負荷試験全体の制御をおこなう処理部であり、具体的には、機能部間の制御の移動や機能部と記憶部の間のデータの受け渡しなどをおこなうことによって、温度負荷試験と故障予測を行う。
次に、本実施例1に係るブレードサーバ100による故障予測の処理手順について説明する。図6は、本実施例1に係るブレードサーバ100による故障予測の処理手順を示すフローチャートである。なお、この故障予測は、一定の時間ごとに行われる。
同図に示すように、このブレードサーバ100による故障予測では、まず動作保証値試験部144が動作保証値55℃にハードディスク110の温度を設定して動作保証値での試験を行う(ステップS601)。
そして、ハードディスク110のエラー率が警告エラーレート以上であるか否かを判定し(ステップS602)、エラー率が警告エラーレート以上である場合には、通常動作で異常が発生する可能性があることをユーザに通知する(ステップS603)。
一方、エラー率が警告エラーレート以上でない場合には、動作保証外試験部145が動作保証外試験を行い、動作保証外温度でハードディスク110が異常となる負荷閾値、すなわち閾値温度を測定する(ステップS604)。
そして、絶対値|前回測定閾値−今回測定閾値|と絶対値|今回測定閾値−動作保証値|とを比較し(ステップS605)、絶対値|前回測定閾値−今回測定閾値|のほうが大きい場合には、次回の動作保証外試験時に異常状態となると判断してユーザに通知する(ステップS606)。
一方、絶対値|前回測定閾値−今回測定閾値|のほうが大きくない場合には、次回の動作保証外試験時までにハードディスク110に異常が発生することはないと予測して故障予測を終了する。
このように、動作保証値試験部144が動作保証値試験を実施して故障予測を行い、動作保証外試験部145が動作保証外試験を行って故障予測を行うことによって、ハードディスク110の故障予測を正確に行うことができる。
上述してきたように、本実施例1では、制御部140が、温度設定部120を制御してハードディスク110に通常の使用状態より高い温度負荷を与え、エラー検出部130により高い温度負荷の下で検出されたハードディスク110のエラーに基づいて故障予測を行うこととしたので、ハードディスク110の故障予測を正確に行うことができる。
したがって、ハードディスク110の故障に起因するブレードサーバ100のシステムダウンを防止することができる。また、ハードディスク110の寿命を判断することができるので、ハードディスク110の交換コストや保守作業にかかる作業時間を短縮することができる。
なお、本実施例1では、動作保証値試験および動作保証外試験を行って故障予測を行う場合について説明したが、動作保証値試験または動作保証外試験を行って故障予測を行うこともできる。また、動作保証値試験では、動作保証値の代わりに、動作保証値に近く動作保証内である値を用いることもできる。
ところで、上記実施例1では、ブレードサーバ100の温度設定部120がハードディスク110に温度負荷を与えて温度負荷試験を行う場合について説明したが、一般の電子装置では、電子部品が発熱する場合も多く、電子部品の発熱を利用して温度負荷を与えることもできる。
具体的には、電子部品を冷却するFANやヒートポンプを制御することによって温度負荷を電子部品に与えることができる。例えば、FANの回転数を遅くする、あるいは停止させることによって温度負荷を与えることができる。そこで、本実施例2では、電子部品の冷却を制御することによって温度負荷を与えて温度負荷試験を行う電子装置について説明する。
図7は、本実施例2に係る電子装置の構成を示す機能ブロック図である。同図に示すように、この電子装置200は、電子部品210と、冷却部220と、エラー検出部230と、制御部240とを有する。
電子部品210は、装置機能を実現する部品であり、故障予測の対象である。冷却部220は、電子部品210を冷却する機能部であり、エラー検出部230は、電子部品210に発生するエラーを検出する機能部である。
制御部240は、冷却部220を制御して電子部品210に温度負荷を与え、温度負荷の下でエラー検出部230が検出したエラーに基づいて電子部品210の故障予測を行う機能部である。
この制御部240は、冷却部220を制御して電子部品210の温度を所定の温度に設定する温度制御部241と、電子部品210の動作保証温度を記憶した動作保証値記憶部242と、エラー検出部230により検出されたエラーに基づいて電子部品210のエラーデータを算出するエラーデータ収集部243と、動作保証値試験を行う動作保証値試験部244と、動作保証外試験を行う動作保証外試験部245と、動作保証外試験部245が求めた閾値温度の履歴を記憶する閾値履歴記憶部246と、温度負荷試験全体の制御を行う温度負荷試験制御部247とを有する。
上述してきたように、本実施例2では、温度制御部241が冷却部220を制御して電子部品210の温度を所定の温度に設定することとしたので、電子部品210に外部から熱を加えることなく温度負荷試験を行うことができる。
上記実施例2では、冷却部を制御することによって温度負荷を電子部品に与える場合について説明したが、通常の発熱では温度負荷試験に必要な発熱が得られない場合には、電子部品の処理負荷を上げることによって温度負荷を与えることもできる。そこで、本実施例3では、電子部品の処理負荷を上げることによって温度負荷を与え、温度負荷試験を行う電子装置について説明する。
図8は、本実施例3に係る電子装置の構成を示す機能ブロック図である。同図に示すように、この電子装置300は、通信処理部品310と、試験データ付与部320と、エラー検出部330と、制御部340と、試験データ分離部350とを有する。
通信処理部品310は、通信処理を行う部品であり、故障予測の対象である。試験データ付与部320は、通信処理部品310の処理負荷を上げるために、通常の通信データに試験データを加えたデータを生成する処理部である。エラー検出部330は、通信処理部品310に発生するエラーを検出する機能部である。
制御部340は、試験データ付与部320を制御して通信処理部品210の処理負荷を上げることによって通信処理部品210に温度負荷を与え、温度負荷の下でエラー検出部210により検出されたエラーに基づいて故障予測を行う機能部である。
この制御部340は、試験データ付与部320を制御して通信処理部品210の温度を所定の温度に設定する温度制御部341と、通信処理部品310の動作保証温度を記憶した動作保証値記憶部342と、エラー検出部330により検出されたエラーに基づいて通信処理部品310のエラーデータを算出するエラーデータ収集部343と、動作保証値試験を行う動作保証値試験部344と、動作保証外試験を行う動作保証外試験部345と、動作保証外試験部345が求めた閾値温度の履歴を記憶する閾値履歴記憶部346と、温度負荷試験全体の制御を行う温度負荷試験制御部347とを有する。
試験データ分離部350は、通信処理部品310の処理負荷を上げるために、試験データ付与部320によって加えられた試験データを分離して通信データを取り出す処理部である。
上述してきたように、本実施例3では、温度制御部341が、試験データ付与部320を制御して通信処理部品310の処理負荷を調整することによって通信処理部品310を所定の温度に設定することとしたので、通信処理部品310に外部から熱を加えることなく温度負荷試験を行うことができる。
上記実施例1〜3では、電子部品に温度負荷を与えて故障予測を行う場合について説明したが、温度負荷以外の環境負荷を電子部品に与えることによって故障予測を行うこともできる。
例えば、電子デバイスの動作条件としては電圧条件があり、電子デバイスは、必ず絶対定格としての最高電圧および最低電圧ならびに動作保証としての最高電圧および最低電圧が規定されている。そこで、本実施例4では、電子部品に印加する電圧を可変とし、電子部品を高電圧状態または低電圧状態にして故障予測を行うブレードサーバについて説明する。
図9は、本実施例4に係るブレードサーバの構成を示す機能ブロック図である。同図に示すように、このブレードサーバ400は、メモリモジュール410と、可変電源部420と、エラー検出部430と、制御部440とを有する。
メモリモジュール410は、故障予測の対象となる部品であり、ECCを用いたエラー訂正機能を有している。ECCを用いたエラー訂正では、1ビットのエラーはECCにより自動的に訂正され、その結果がブレードサーバ400に報告される。また、2ビットのエラーは訂正することができずメモリアクセスエラーとして報告される。
図10は、印加電圧に対するメモリモジュール410のエラー率を示す図である。同図に示すように、本来、正常に動作するメモリモジュール410を動作保障範囲内で使用する場合は、エラーは発生することはない。しかし、経年劣化とともにデバイスの特性が劣化してくると、これらのメモリエラーの発生頻度が高くなる。
図10の曲線Sは、正常動作の特性曲線である。動作保障範囲内では、1ビットエラーも2ビットエラーも発生しない。経年劣化が進行し、特性が劣化すると、曲線Tの状態となる。この状態では、動作保障範囲内でも1ビットエラーが発生する(B点)が、2ビットエラーは発生しないため、ブレードサーバ400が故障することはない。
しかし、更に劣化が進むと曲線Uの状態となり、動作保障範囲内で2ビットエラーが発生(C点)し、故障が発生する。したがって、異常が発生する時期が経年劣化が進む前に予測できれば、故障を防ぐことが可能となる。
すなわち、図6にフローチャートで示した処理手順などで、図10のA点からB点、もしくは、A'点からC点への移行時間を計算することで、故障発生時期を予測することが可能となる。
可変電源部420は、メモリモジュール410に印加する電圧を変動させることによって電圧負荷を与える電源であり、エラー検出部430は、メモリモジュール410に発生するエラーを検出する処理部である。
制御部440は、可変電源部420を制御してメモリモジュール410の印加電圧を変動させ、故障予測を行う処理部である。この制御部440は、可変電源部420を制御する電圧制御部441と、メモリモジュール410の動作保証電圧を記憶した動作保証値記憶部442と、エラー検出部430により検出されたエラーに基づいてメモリモジュール410のエラー率を算出するエラーデータ収集部443と、動作保証値試験を行う動作保証値試験部444と、動作保証外試験を行う動作保証外試験部445と、動作保証外試験部445が求めた閾値温度の履歴を記憶する閾値履歴記憶部446と、電圧負荷試験全体の制御を行う電圧負荷試験制御部447とを有する。
上述してきたように、本実施例4では、制御部440が、可変電源部420を制御してメモリモジュール410に電圧負荷を与え、電圧負荷の下でエラー検出部430によって検出されたエラーに基づいて故障予測を行うこととしたので、メモリモジュール410の故障予測を正確に行うことができる。
また、本実施例4では、メモリモジュールに電圧負荷を与えて故障予測を行う場合について説明したが、本発明はこれに限定されるものではなく、例えば、CPUに電圧負荷を与えて故障予測を行う場合にも同様に適用することができる。
図11は、印加電圧に対するCPUのエラー有無を示す図である。CPUは、内部の動作に異常が発生した場合にアラーム信号を出力する。このアラーム信号は、CPUデバイス内部のバスパリティエラーやシーケンスエラー等の状態を出力するものであるが、正常動作時には発生するものではない(曲線S)。
しかし、CPUデバイスの特性が劣化し、セットアップホールドのマージンが不足し、内部タイミングに異常が発生した場合に、バスパリティエラーやシーケンスエラー等の現象が発生し、エラーとして出力される。
このように、ディジタル回路であっても、内部の特性が経年劣化により徐々に変化していく過程の中で閾値を越えたところでエラー状態として出力される(曲線U)。したがって、曲線Tのような状態で印加電圧を変動させ、エラーが発生する値を測定することで、故障発生時期を予測することが可能となる。
上記実施例1〜4では、電子部品に環境負荷を与えて故障予測を行う場合について説明したが、電子部品以外の部品に環境負荷を与えることによって故障予測を行うこともできる。
例えば、FANなどのモータ使用機器に対しても、最大回転数、最小回転数が規定されている。したがって、FANなどのモータ使用機器に対しては、電圧もしくは電流を制御し、回転数を上げた状態もしくは下げた状態での回転数異常(定格値の回転数でない、回転数にばらつきがあるなど)を検出することで部品の異常を検出することが可能となる。そこで、本実施例5では、FANに電圧負荷を与えて故障予測を行う電子装置について説明する。
図12は、本実施例5に係る電子装置の構成を示す機能ブロック図である。同図に示すように、この電子装置500は、FAN510と、可変電源部520と、回転数監視部530と、制御部540とを有する。
FAN510は、故障予測の対象となる部品であり、可変電源部520は、FAN510に印加する電圧を変動させることによって電圧負荷を与える電源である。回転数監視部530は、FAN510の回転数を監視して異常を検出する処理部である。
制御部540は、可変電源部520を制御してFAN510の印加電圧を変動させて故障予測を行う処理部である。この制御部540は、可変電源部520を制御する電圧制御部541と、FAN510の動作保証電圧を記憶した動作保証値記憶部542と、回転数監視部530により検出された回転異常に基づいてFAN510のエラーデータを算出するエラーデータ収集部543と、動作保証値試験を行う動作保証値試験部544と、動作保証外試験を行う動作保証外試験部545と、動作保証外試験部545が求めた閾値温度の履歴を記憶する閾値履歴記憶部546と、電圧負荷試験全体の制御を行う電圧負荷試験制御部547とを有する。
上述してきたように、本実施例5では、制御部540が、可変電源部520を制御してFAN510に電圧負荷を与え、電圧負荷の下で回転数監視部530によって検出されたエラーに基づいて故障予測を行うこととしたので、FAN510の故障予測を正確に行うことができる。
また、本実施例5では、FANに電圧負荷を与えて故障予測を行う電子装置について説明したが、本発明はこれに限定されるものではなく、FAN以外のモータ使用機器の故障予測、あるいは電子装置以外でFANなどのモータ使用機器を備えた装置において故障予測を行う場合にも同様に適用することができる。
また、ハードディスクのように機構部品と電子デバイスが組み合わされた部品に対しては、動作温度、動作電圧などの環境条件以外に、ハードディスクのアクセス頻度を高くし、ハードディスクの駆動系への負荷を高くすることによって、故障予測を行うこともできる。
また、本実施例1〜5では、動作保証値試験および動作保証外試験を行って故障予測を行う制御部について説明したが、これらの制御部が有する構成をソフトウェアによって実現することで、同様の機能を有する故障予測プログラムを得ることができる。そこで、これらの故障予測プログラムを実行するコンピュータについて説明する。
図13は、本実施例1〜5に係る電子装置の故障予測プログラムを実行するコンピュータを示す図である。同図に示すように、このコンピュータ600は、CPU610と、RAM620と、ROM630と、I/Oインタフェース640と、不揮発性メモリ650とを有する。
CPU610は、故障予測プログラムを実行する処理装置であり、RAM620は故障予測プログラムの実行途中結果などを記憶する記憶部である。ROM630は、故障予測プログラムや動作保証値などを記憶した記憶部であり、I/Oインタフェース640は、センサーの測定した測定値などを入力し、温度設定部や可変電源部に設定値を出力するためのインタフェースである。不揮発性メモリ650は、閾値履歴記憶部などに記憶されるデータを記憶するメモリである。
なお、これらCPU610、RAM620、ROM630、不揮発性メモリ650などは、電子装置を構成する部品として電子装置に備えられたものを使用することもでき、また、故障予測プログラム用に専用のものを使用することもできる。
(付記1)経年劣化する部品から構成される電子装置であって、
前記経年劣化する部品に通常の使用状態より高い環境負荷を与える環境負荷付与手段と、
前記環境負荷付与手段により通常の使用状態より高い環境負荷が与えられた部品の異常を検出する異常検出手段と、
前記異常検出手段により検出された異常に基づいて前記部品の故障予測を行う故障予測手段と
を備えたことを特徴とする電子装置。
(付記2)前記環境負荷付与手段は、電子装置の動作を保証する環境と動作を保証しない環境との境界値である動作保証値の環境負荷または動作保証範囲内で動作保証値に近い値の環境負荷を部品に与えることを特徴とする付記1に記載の電子装置。
(付記3)前記故障予測手段は、前記異常検出手段により検出された異常の発生率が所定の値より大きい場合に故障が発生すると予測することを特徴とする付記2に記載の電子装置。
(付記4)前記環境負荷付与手段は、電子装置の動作を保証する環境と動作を保証しない環境との境界値である動作保証値を超えた環境負荷である動作保証外負荷を部品に与えることを特徴とする付記1に記載の電子装置。
(付記5)前記故障予測手段は、前記異常検出手段により検出された異常の発生率が所定の故障閾値となる環境負荷値に基づいて故障発生予測を行うことを特徴とする付記4に記載の電子装置。
(付記6)前記故障予測手段は、過去に動作保証外負荷を部品に与えて異常の発生率が所定の故障閾値となった環境負荷値を前回測定閾値として記憶し、今回動作保証外負荷を部品に与えて異常の発生率が所定の故障閾値となった環境負荷値である今回測定閾値と前回測定閾値との差の絶対値が今回測定閾値と動作保証値との差の絶対値よりも大きい場合に故障が発生すると予測することを特徴とする付記5に記載の電子装置。
(付記7)前記環境負荷付与手段は、温度負荷を環境負荷として部品に与えることを特徴とする付記1〜6のいずれか一つに記載の電子装置。
(付記8)前記環境負荷付与手段は、前記部品に温度負荷を与える温度設定手段と、
前記温度設定手段を用いて部品の温度を制御する温度制御手段とを備えたことを特徴とする付記7に記載の電子装置。
(付記9)前記環境負荷付与手段は、前記部品を冷却する冷却手段と、
前記冷却手段を用いて部品の温度を制御する温度制御手段とを備えたことを特徴とする付記7に記載の電子装置。
(付記10)前記部品は通信データを処理する通信処理部品であり、
前記環境負荷付与手段は、前記通信処理部品が処理する通信データに他のデータを加えて該通信処理部品に温度負荷を与えることを特徴とする付記7に記載の電子装置。
(付記11)前記環境負荷付与手段は、部品への印加電圧を変動させることによって電圧負荷を環境負荷として部品に与えることを特徴とする付記1〜6のいずれか一つに記載の電子装置。
(付記12)前記環境負荷付与手段により環境負荷が与えられる部品はファンであり、
前記異常検出手段は、前記ファンの回転数を監視して異常を検出することを特徴とする付記11に記載の電子装置。
(付記13)前記部品はハードディスクであり、
前記環境負荷付与手段は、前記ハードディスクのアクセス頻度を高くすることによって該ハードディスクに高い環境負荷を与えることを特徴とする付記1に記載の電子装置。
(付記14)経年劣化する経年劣化部品の故障予測を行う故障予測方法であって、
電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与工程と、
前記環境負荷付与工程により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常を検出する異常検出工程と、
前記異常検出工程により検出された異常に基づいて前記経年劣化部品の故障予測を行う故障予測工程と
を含んだことを特徴とする故障予測方法。
(付記15)経年劣化する経年劣化部品の故障予測を行う故障予測プログラムであって、
電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与手順と、
前記環境負荷付与手順により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常に基づいて該部品の故障予測を行う予測手順と
を電子装置に内蔵されたコンピュータに実行させることを特徴とする故障予測プログラム。
(付記16)経年劣化する経年劣化部品の故障予測を行う故障予測プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与手順と、
前記環境負荷付与手順により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常に基づいて該部品の故障予測を行う予測手順と
を電子装置に内蔵されたコンピュータに実行させる故障予測プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
以上のように、本発明に係る電子装置、故障予測方法ならびに故障予測プログラムおよびその記録媒体は、経年劣化する部品から構成される装置の故障予測に有用であり、特に、高い信頼性が要求される電子装置に適している。
環境負荷に対する部品特性曲線を示す図である。 本実施例に係る電子装置の概念構成を示す機能ブロック図である。 本実施例1に係るブレードサーバの構成を示す機能ブロック図である。 温度負荷に対するハードディスクのエラー率を示す図である。 動作保証値記憶部の一例を示す図である。 閾値履歴記憶部の一例を示す図である。 本実施例1に係るブレードサーバによる故障予測の処理手順を示すフローチャートである。 本実施例2に係る電子装置の構成を示す機能ブロック図である。 本実施例3に係る電子装置の構成を示す機能ブロック図である。 本実施例4に係るブレードサーバの構成を示す機能ブロック図である。 印加電圧に対するメモリモジュールのエラー率を示す図である。 印加電圧に対するCPUのエラー有無を示す図である。 本実施例5に係る電子装置の構成を示す機能ブロック図である。 本実施例1〜5に係る電子装置の故障予測プログラムを実行するコンピュータを示す図である。
符号の説明
10,200,300,500 電子装置
11 装置部品
12 環境負荷付与部
13,130,230,330,430 エラー検出部
14,140,240,340,440,540 制御部
100,400 ブレードサーバ
110 ハードディスク
120 温度設定部
141,241,341 温度制御部
142,242,342,442,542 動作保証値記憶部
143,243,343,443,543 エラーデータ収集部
144,244,344,444,544 動作保証値試験部
145,245,345,445,545 動作保証外試験部
146,246,346,446,546 閾値履歴記憶部
147,247,347 温度負荷試験制御部
210 電子部品
220 冷却部
310 通信処理部品
320 試験データ付与部
350 試験データ分離部
410 メモリモジュール
420,520 可変電源部
441,541 電圧制御部
447,547 電圧負荷試験制御部
510 FAN
530 回転数監視部
600 コンピュータ
610 CPU
620 RAM
630 ROM
640 I/Oインタフェース
650 不揮発性メモリ

Claims (10)

  1. 経年劣化する部品から構成される電子装置であって、
    前記経年劣化する部品に通常の使用状態より高い環境負荷を与える環境負荷付与手段と、
    前記環境負荷付与手段により通常の使用状態より高い環境負荷が与えられた部品の異常を検出する異常検出手段と、
    前記異常検出手段により検出された異常に基づいて前記部品の故障予測を行う故障予測手段と
    を備えたことを特徴とする電子装置。
  2. 前記環境負荷付与手段は、電子装置の動作を保証する環境と動作を保証しない環境との境界値である動作保証値の環境負荷または動作保証範囲内で動作保証値に近い値の環境負荷を部品に与えることを特徴とする請求項1に記載の電子装置。
  3. 前記故障予測手段は、前記異常検出手段により検出された異常の発生率が所定の値より大きい場合に故障が発生すると予測することを特徴とする請求項2に記載の電子装置。
  4. 前記環境負荷付与手段は、電子装置の動作を保証する環境と動作を保証しない環境との境界値である動作保証値を超えた環境負荷である動作保証外負荷を部品に与えることを特徴とする請求項1に記載の電子装置。
  5. 前記故障予測手段は、前記異常検出手段により検出された異常の発生率が所定の故障閾値となる環境負荷値に基づいて故障発生予測を行うことを特徴とする請求項4に記載の電子装置。
  6. 前記環境負荷付与手段は、温度負荷を環境負荷として部品に与えることを特徴とする請求項1〜5のいずれか一つに記載の電子装置。
  7. 前記環境負荷付与手段は、部品への印加電圧を変動させることによって電圧負荷を環境負荷として部品に与えることを特徴とする請求項1〜5のいずれか一つに記載の電子装置。
  8. 経年劣化する経年劣化部品の故障予測を行う故障予測方法であって、
    電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与工程と、
    前記環境負荷付与工程により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常を検出する異常検出工程と、
    前記異常検出工程により検出された異常に基づいて前記経年劣化部品の故障予測を行う故障予測工程と
    を含んだことを特徴とする故障予測方法。
  9. 経年劣化する経年劣化部品の故障予測を行う故障予測プログラムであって、
    電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与手順と、
    前記環境負荷付与手順により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常に基づいて該部品の故障予測を行う予測手順と
    を電子装置に内蔵されたコンピュータに実行させることを特徴とする故障予測プログラム。
  10. 経年劣化する経年劣化部品の故障予測を行う故障予測プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
    電子装置を構成する経年劣化部品に通常の使用状態より高い環境負荷を与える環境負荷付与手順と、
    前記環境負荷付与手順により通常の使用状態より高い環境負荷が与えられた経年劣化部品の異常に基づいて該部品の故障予測を行う予測手順と
    を電子装置に内蔵されたコンピュータに実行させる故障予測プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。

JP2004030570A 2004-02-06 2004-02-06 電子装置、予測方法および予測プログラム Expired - Fee Related JP4500063B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004030570A JP4500063B2 (ja) 2004-02-06 2004-02-06 電子装置、予測方法および予測プログラム
US10/875,917 US7469189B2 (en) 2004-02-06 2004-06-23 Electronic device, failure prediction method, and computer product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004030570A JP4500063B2 (ja) 2004-02-06 2004-02-06 電子装置、予測方法および予測プログラム

Publications (2)

Publication Number Publication Date
JP2005221413A true JP2005221413A (ja) 2005-08-18
JP4500063B2 JP4500063B2 (ja) 2010-07-14

Family

ID=34879199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004030570A Expired - Fee Related JP4500063B2 (ja) 2004-02-06 2004-02-06 電子装置、予測方法および予測プログラム

Country Status (2)

Country Link
US (1) US7469189B2 (ja)
JP (1) JP4500063B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7565267B2 (en) 2005-12-28 2009-07-21 Nec Corporation Life prediction and monitoring of components
JP2010102102A (ja) * 2008-10-23 2010-05-06 Canon Inc 画像形成装置及び画像形成装置の制御方法
JP2010272208A (ja) * 2010-09-10 2010-12-02 Toshiba Corp 情報処理装置、ドライブ装置、故障予兆診断方法及びプログラム
US8000927B2 (en) 2007-04-24 2011-08-16 Kabushiki Kaisha Toshiba Data remaining period management device and method
JP2015185120A (ja) * 2014-03-26 2015-10-22 株式会社Nttファシリティーズ 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7802019B2 (en) * 2005-06-14 2010-09-21 Microsoft Corporation Hard disk drive condition reporting and error correction
US7519880B1 (en) * 2005-07-05 2009-04-14 Advanced Micro Devices, Inc. Burn-in using system-level test hardware
US20070219747A1 (en) * 2006-03-07 2007-09-20 Hughes James E HDD throttle polling based on blade temperature
US7865089B2 (en) * 2006-05-18 2011-01-04 Xerox Corporation Soft failure detection in a network of devices
US20070294072A1 (en) * 2006-06-16 2007-12-20 Ming-Shiahn Tsai Testing model
US7974522B2 (en) * 2006-09-29 2011-07-05 Hibbard Gary D Systems and methods to improve consumer product reliability and lifetime of a hard disk drive by reducing its activity
US7818474B2 (en) * 2006-09-29 2010-10-19 Hibbard Gary D Provisional load sharing buffer for reducing hard disk drive (HDD) activity and improving reliability and lifetime
US20080109862A1 (en) * 2006-11-07 2008-05-08 General Instrument Corporation Method and apparatus for predicting failures in set-top boxes and other devices to enable preventative steps to be taken to prevent service disruption
TWI398767B (zh) * 2007-06-07 2013-06-11 Delta Electronics Inc 電子系統及其警告裝置
US20090161243A1 (en) * 2007-12-21 2009-06-25 Ratnesh Sharma Monitoring Disk Drives To Predict Failure
US8320871B2 (en) * 2008-07-03 2012-11-27 Centurylink Intellectual Property Llc Emergency data message router database
CN103440416A (zh) * 2013-08-27 2013-12-11 西北工业大学 基于扩展误差流的叶片加工过程误差预测方法
US9336091B2 (en) * 2014-03-06 2016-05-10 International Business Machines Corporation Reliability enhancement in a distributed storage system
TWI588650B (zh) * 2015-12-29 2017-06-21 飛捷科技股份有限公司 電子裝置壽命存量之顯示及提示系統
KR101734718B1 (ko) * 2015-12-14 2017-05-11 현대자동차주식회사 전동식 파워 스티어링용 모터의 외란 보상 시스템
KR102467843B1 (ko) * 2018-08-23 2022-11-16 삼성전자주식회사 보조 전원 장치의 모니터링 방법과 장치, 및 그 장치를 포함한 전자 시스템
US11209808B2 (en) 2019-05-21 2021-12-28 At&T Intellectual Property I, L.P. Systems and method for management and allocation of network assets

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04286968A (ja) * 1991-03-15 1992-10-12 Fujitsu Ltd 電気機器の温度マージン試験方式
JPH09264930A (ja) * 1996-03-29 1997-10-07 Ando Electric Co Ltd Ic試験装置およびその故障診断方法
JP2000275291A (ja) * 1999-03-26 2000-10-06 Toshiba Corp 電圧マージン試験回路及び劣化診断装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0287079A (ja) 1988-09-26 1990-03-27 Toshiba Corp 電気部品の寿命予測装置
US5557183A (en) * 1993-07-29 1996-09-17 International Business Machines Corporation Method and apparatus for predicting failure of a disk drive
JP3069882B2 (ja) 1993-11-05 2000-07-24 株式会社日立製作所 半導体装置
US5923876A (en) * 1995-08-24 1999-07-13 Compaq Computer Corp. Disk fault prediction system
US6108586A (en) * 1997-03-31 2000-08-22 Hitachi, Ltd. Fraction defective estimating method, system for carrying out the same and recording medium
DE19882463T1 (de) * 1997-06-13 2000-07-06 Seagate Technology Temperaturabhängige Plattenlaufwerk-Parameterkonfiguration
US6249890B1 (en) * 1998-06-05 2001-06-19 Seagate Technology Llc Detecting head readback response degradation in a disc drive
US20040085670A1 (en) * 2002-11-05 2004-05-06 Seagate Technology Llc Method for measuring pad wear of padded slider with MRE cooling effect

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04286968A (ja) * 1991-03-15 1992-10-12 Fujitsu Ltd 電気機器の温度マージン試験方式
JPH09264930A (ja) * 1996-03-29 1997-10-07 Ando Electric Co Ltd Ic試験装置およびその故障診断方法
JP2000275291A (ja) * 1999-03-26 2000-10-06 Toshiba Corp 電圧マージン試験回路及び劣化診断装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7565267B2 (en) 2005-12-28 2009-07-21 Nec Corporation Life prediction and monitoring of components
US8000927B2 (en) 2007-04-24 2011-08-16 Kabushiki Kaisha Toshiba Data remaining period management device and method
JP2010102102A (ja) * 2008-10-23 2010-05-06 Canon Inc 画像形成装置及び画像形成装置の制御方法
JP2010272208A (ja) * 2010-09-10 2010-12-02 Toshiba Corp 情報処理装置、ドライブ装置、故障予兆診断方法及びプログラム
JP2015185120A (ja) * 2014-03-26 2015-10-22 株式会社Nttファシリティーズ 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
US20050193284A1 (en) 2005-09-01
US7469189B2 (en) 2008-12-23
JP4500063B2 (ja) 2010-07-14

Similar Documents

Publication Publication Date Title
JP4500063B2 (ja) 電子装置、予測方法および予測プログラム
JP7130757B2 (ja) 集積回路マージン測定および故障予測装置
US6982842B2 (en) Predictive disc drive failure methodology
US7373559B2 (en) Method and system for proactive drive replacement for high availability storage systems
US8340923B2 (en) Predicting remaining useful life for a computer system using a stress-based prediction technique
US8316263B1 (en) Predicting disk drive failure at a central processing facility using an evolving disk drive failure prediction algorithm
US9891975B2 (en) Failure prediction system of controller
JP5153865B2 (ja) ディジタル・システムの信頼性を監視するシステム、およびその監視する方法
US10268553B2 (en) Adaptive failure prediction modeling for detection of data storage device failures
JP5181312B2 (ja) デジタル・システムの信頼性を監視する方法、及びそのシステム
US7577542B2 (en) Method and apparatus for dynamically adjusting the resolution of telemetry signals
US7870440B2 (en) Method and apparatus for detecting multiple anomalies in a cluster of components
US20150193325A1 (en) Method and system for determining hardware life expectancy and failure prevention
US11307569B2 (en) Adaptive sequential probability ratio test to facilitate a robust remaining useful life estimation for critical assets
WO2004025650A1 (en) Predictive disc drive failure methodology
US20180060148A1 (en) Bad block detection and predictive analytics in nand flash storage devices
JP2016161990A (ja) 誤り訂正機能による寿命予測を有する制御装置
US8234235B2 (en) Security and remote support apparatus, system and method
JP2021043891A (ja) ストレージシステム及びその制御方法
JP4973703B2 (ja) 故障検出方法及び監視装置
EP3611523B1 (en) Apparatuses and methods involving adjustable circuit-stress test conditions for stressing regional circuits
CN113567836B (zh) 一种分段预测电路老化系统及方法
KR20220098202A (ko) 진단 장치, 진단 방법 및 프로그램
US20040193976A1 (en) Method and apparatus for interconnect built-in self test based system management failure monitoring
JP2008084505A (ja) 記憶装置、書き込み手段診断方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100413

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100416

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees