以下、実施形態について図面を参照しつつ説明する。なお、本出願において図面参照符号を付している場合は、それらは、専ら理解を助けるためのものであり、図示の態様に限定することを意図するものではない。なお、下記の実施形態は、あくまで例示であり、本発明を限定するものではない。また、以降の説明で参照する図面等のブロック間の接続線は、双方向及び単方向の双方を含む。一方向矢印については、主たる信号(データ)の流れを模式的に示すものであり、双方向性を排除するものではない。
[実施形態1]
実施形態1に係る被疑部品特定システムについて図面を用いて説明する。図1は、実施形態1に係る被疑部品特定システムの構成を模式的に示したブロック図である。図2は、実施形態1に係る被疑部品特定システムで用いられる障害情報データベースの構成の一例を模式的に示したテーブルである。図3は、実施形態1に係る被疑部品特定システムで用いられる部品戻入率データベースの構成の一例を模式的に示したテーブルである。図4は、実施形態1に係る被疑部品特定システムで用いられる特殊障害データベースの構成の一例を模式的に示したテーブルである。
被疑部品特定システム1は、顧客装置500に障害が発生したときに障害の原因(故障)と疑われる部品(被疑部品)を被疑部品特定装置100で特定するシステムである(図1参照)。被疑部品特定システム1は、被疑部品特定装置100と、顧客装置500と、ネットワーク600と、を有する。ここで、被疑部品は、部品単体だけでなく、複数の部品が組み合わさったユニット、モジュール、基板等も含まれる。また、特定とは、被疑部品に係る情報を出力(交換指示等)することをいう。
被疑部品特定装置100は、顧客装置500に障害が発生したときに被疑部品を特定する装置である(図1参照)。被疑部品特定装置100は、障害が発生している顧客装置500から取得した障害発生情報(顧客情報、装置情報、エラーコードを含む)、及び、過去の障害復旧履歴(障害情報データベース200、部品戻入率データベース300、特殊障害データベース400)に基づいて被疑部品(同時交換被疑部品を含む)を特定する。ここで、障害情報は、障害の内容であり、例えば、エラーコード、障害を意味するログ等を用いることができる。被疑部品特定装置100は、制御部101と、通信部102と、入力部103と、出力部104と、記憶部105と、を有する。
制御部101は、通信部102、入力部103、出力部104、及び、記憶部105を制御する機能部である(図1参照)。制御部101は、通信部102を制御して、顧客装置500に対する情報の送受信を行う。制御部101は、入力部103を制御して、入力部103から入力された情報を取り込む。制御部101は、出力部104を制御して、出力部104に情報を出力させる。制御部101は、記憶部105へのデータの入出力、記憶部105内に記憶されたデータベース200、300、400へのデータの書き込みや読み出しを行う。
制御部101は、ソフトウェアを実行することにより所定の情報処理を行う。制御部101は、障害が発生した顧客装置から取得した障害発生情報(顧客情報、装置情報、エラーコードを含む)、装置構成データベース700、及び、特殊障害データベース400に基づいて、当該障害発生情報に対応し、かつ、当該特殊障害データベース400内の判断条件(第1判断条件、第2判断条件)を満たす同時交換被疑部品を特定する。制御部101は、当該障害発生情報に対応しない、又は、当該判断条件を満たさないときに、障害情報データベース200に基づいて、被疑部品を特定する。制御部101は、特定された被疑部品が複数ある場合、部品戻入率データベース300に基づいて、被疑部品の優先順位を入れ替える。制御部101は、特定された被疑部品(同時交換被疑部品を含む)に基づいて、出力部104から部品の交換を指示する。なお、同時交換被疑部品、第1判断条件及び第2判断条件については、後述する。
通信部102は、情報を通信(送受信)するための機能部(例えば、インタフェース等)である(図1参照)。通信部102は、ネットワーク600に通信可能に接続されている。
入力部103は、情報を入力するための機能部である(図1参照)。入力部103には、例えば、キーボード、マウス、タッチパネル、マイク、その他の入力手段を用いることができ、図示しない通信部を介して通信可能に接続された入力部を有する情報端末等を用いてもよい。
出力部104は、情報を出力するための機能部である(図1参照)。出力部104として、例えば、表示を行うディスプレイ、印刷を行うプリンタ、その他の出力手段を用いることができ、図示しない通信部を介して通信可能に接続された出力部を有する情報端末等を用いてもよい。
記憶部105は、各種データ、プログラムを記憶する機能部である(図1参照)。記憶部105として、例えば、ハードディスク装置でも、外部接続されたRAID(Redundant Arrays of Independent Disks)装置等を用いることができ、どの様な不揮発性記憶装置を用いてもよい。記憶部105は、障害情報データベース200と、部品戻入率データベース300と、特殊障害データベース400と、装置構成データベース700と、を記憶する。
障害情報データベース200は、障害の発生した顧客装置500の過去の障害情報に関する情報を整理して蓄積したデータベースである(図1参照)。障害情報データベース200は、顧客情報と、装置情報と、障害発生日と、エラーコードと、障害情報と、被疑部品と、交換部品と、部品交換日と、が関連付けられている(図2参照)。
ここで、顧客情報として、顧客装置500を使用(所有、レンタルでも可)している顧客を特定できる情報、例えば、顧客の名称、会社名等とすることができる。装置情報として、顧客装置500を特定することができる情報、例えば、装置名、型番等とすることができる。障害発生日は、顧客装置500に障害が発生した日(過去の日)であり、障害が発生した顧客装置500からエラーコード又は障害情報を受信した日とすることができる。エラーコードは、障害を特定するための識別情報であり、障害情報を表現するために付けられた符号(暗号、略号、番号、記号)を用いることができる。エラーコードは、エラーコード毎に、予め定めた障害情報と対応している。交換部品は、交換した部品に係る情報であり、例えば、部品名称、記号、品番等が挙げられる。部品交換日は、部品を交換した日である。
被疑部品には、被疑部品に係る情報が入力され、例えば、部品名称、記号、品番等が入力される。被疑部品は、1つの障害情報に対して複数ある場合、被疑部品に優先順位が付けられている。優先順位は、障害発生の際、例えば、実際にその被疑部品を交換して復旧した確率が高いものを障害原因である可能性が高いとして優先順位を高くしたり、部品コストが安いものの優先順位を高くしたり、することができる。部品コストが安い被疑部品の優先順位を上げる理由として、はんだ付け等、交換試行回数が限られる場合、コストが安いものから障害の原因である事を確認した方が交換試行回数超過による部品廃棄コストを減らせること等が挙げられる。例えば、電源系統であれば、故障の可能性が高い順に、第1被疑部品を標準電源とし、第2被疑部品を電源バックボードとし、第3被疑部品を電源ケーブルとすることができる。なお、図2において、第1被疑部品、第2被疑部品、第3被疑部品の文字列は、被疑部品の名称として記憶しておく必要はなく、記憶しておく各被疑部品が、記憶順序や、データ間の区切り文字で、第1被疑部品、第2被疑部品、第3被疑部品のいずれかであるかが判別できればよい。
図2の障害情報データベース200では、例えば、顧客情報がD商事の場合、装置情報がR140X−YY(装置型番)、エラーコードは“0xC2”(第2ディスク故障)、部品交換日は2016/3/8(第2ディスク交換日)、2016/5/17(ディスクアレイコントローラ交換日)を示す。
部品戻入率データベース300は、保守対象の顧客装置500の製造に使用された部品ごとの総数量に対する、保守作業にて交換され出荷元に戻された比率(戻入率)を整理して蓄積したデータベースである(図1参照)。部品戻入率データベース300は、部品と、戻入率と、被疑部品(保守部品)と、が関連付けられている(図3参照)。図3において、部品の欄には、故障が生じたとき等に使用される部品を対象にした総括名称(例えば、電源)が記載され、被疑部品の欄には、個別名称(例えば、標準電源、増設電源;型番でも可)が記載されているが、顧客装置500内の搭載箇所が異なるだけで、交換時の交換部品としては、同一の部品(例えば、電源)である。同様に、標準CPU503及び増設CPU504の交換部品は、ともに“CPU”である。標準メモリ501及び増設メモリ502の交換部品は、ともに“メモリ”である。第1ディスク513a、第2ディスク513b、第3ディスク513cの交換部品は、ともに“ディスク”である。障害情報データベース200に基づいて特定された優先順位が付された複数の被疑部品において、部品戻入率データベース300における戻入率の最も高い(故障率が最も高い)被疑部品に該当する場合は、交換の優先順位を上げるようにすることができる。これにより、戻入率の高い部品の交換を優先させることで、被疑部品ではあっても障害を発生させていない誤った部品交換を減らすことができる。
特殊障害データベース400は、顧客装置500に特殊障害が発生したときに、1回の作業(保守作業)で特殊障害を復旧できるように、同時に交換する複数の被疑部品(同時交換被疑部品)を特定するためのデータベースである(図1参照)。特殊障害データベース400は、障害が生じている顧客装置500の障害情報に対応する複数の被疑部品及び優先順位を特定するためのものではなく、特殊障害を引き起こす部品をまとめて特定するために用いられる。つまり、特殊障害データベース400は、故障の原因と疑われる被疑部品を、予め定められた優先順位で交換しても、障害が復旧しない場合に対応するものである。特殊障害データベース400は、顧客情報と、装置情報と、エラーコードと、障害情報と、判断条件と、同時交換被疑部品と、が関連付けられている(図4参照)。
ここで、特殊障害とは、過去に障害が発生した顧客装置と同一の構成の顧客装置において、当該過去に障害が発生した顧客装置で交換した部品と同じ部品を交換しても、障害が復旧しない障害をいう。特殊障害として、例えば、個別には故障していない部品が被疑部品の故障を引き起こす場合、個別には故障していない複数の部品が相互作用することによって全体として故障を引き起こす場合等が挙げられる。
なお、顧客情報、装置情報、エラーコード、及び、障害情報は、障害情報データベース200の顧客情報、装置情報、エラーコード、及び、障害情報と同様である。
判断条件は、特殊障害を判断し、同時交換被疑部品を特定するための条件である。判断条件は、相互関係(例えば、電気的接続関係)がある複数の被疑部品を判断するものであり、図4のように、第1判断条件及び第2判断条件を設定することができる。
第1判断条件として、例えば、特殊障害を発生した顧客装置500に所定の部品(例えば、標準電源)を搭載しているか否か、所定の構成(例えば、ディスク3台)を有するか否か等を判断条件とすることができる。
第2判断条件として、例えば、他の所定の部品(第1判断条件の所定の部品とは異なる他の所定の部品;例えば、電源ケーブル)の交換履歴があるか否か、所定のエラーコードがあるか否か等を判断条件とすることができる。所定の部品については、障害情報データベース200の交換部品の欄に記載されている被疑部品を壊す可能性のある部品とすることができる。また、所定のエラーコードについては、障害情報データベース200の交換部品の欄に記載されている被疑部品と相互関係(例えば、電気的接続関係)がある部品等のエラーコードとすることができる。
同時交換被疑部品は、1回の交換作業で同時に交換する可能性がある被疑部品である。同時交換被疑部品の欄には、例えば、部品名称を記載することができる。同時交換被疑部品として、例えば、1又は複数の部品が故障した場合に故障した部品と相互関係(例えば、電気的接続関係)がある部品、当該故障した部品を壊す可能性のある複数の部品、障害情報データベース200の交換部品の欄に記載されている被疑部品と同時に障害の原因となりうる部品、障害情報データベース200の交換部品の欄に記載されている被疑部品に類似する部品(類似部品)等とすることができる。ここで、類似部品とは、使用中の部品の構成(例えば、構造、回路等)が所定割合以上で同じである部品をいう。類似部品として、例えば、標準電源と増設電源との関係や、第1ディスクと、第1ディスクと同一製品だが実装位置が異なる第2ディスクとの関係等のような関係がある部品とすることができる。同時交換被疑部品の特定は、被疑部品の優先順位を示して特定する場合に先立って行われる。
装置構成データベース700は、顧客装置500の構成部品を整理して蓄積したデータベースである(図1参照)。装置構成データベース700では、顧客情報と、装置情報と、構成部品と、が関連付けられている。
顧客装置500は、顧客が使用する装置である(図1参照)。顧客装置500は、装置単体だけでなく、複数の装置が協働するシステムを含む。顧客装置500は、自身に対応する顧客情報及び装置情報を記憶している。顧客装置500は、自身に障害が発生したときに、障害内容に対応したエラーコードを特定する機能を有する。顧客装置500は、エラーコードを特定したときに、特定されたエラーコード、顧客情報、装置情報を含む障害発生情報を生成する機能を有する。顧客装置500は、生成された障害発生情報を被疑部品特定装置100に送信する機能を有する。なお、顧客装置500の一例の詳細については、後述する。
ネットワーク600は、被疑部品特定装置100と顧客装置500とを通信可能に接続する情報通信網である(図1参照)。
次に、実施形態1に係る被疑部品特定システムにおける顧客装置の例について図面を用いて説明する。図5は、実施形態1に係る被疑部品特定システムにおける顧客装置の構成の一例を模式的に示したブロック図である。
顧客装置500は、標準メモリ501と、増設メモリ502と、標準CPU(Central Processing Unit)503と、増設CPU504と、標準電源505と、増設電源506と、電源バックボード507と、マザーボード508と、ディスクアレイコントローラ509と、電源ケーブル510と、ディスクバックボード511と、ディスクケーブル512と、第1〜第3ディスク513a〜513cと、入出力制御部514と、入力部515と、出力部516と、通信部517と、を有する(図5参照)。
標準メモリ501は、顧客装置500に標準搭載されたメモリ(記憶装置)である(図5参照)。標準メモリ501は、標準CPU503に電気的に接続されている。
増設メモリ502は、顧客装置500に増設されたメモリ(記憶装置)である(図5参照)。増設メモリ502は、増設CPU504に電気的に接続されている。
標準CPU503は、顧客装置500に標準搭載された中央処理装置である(図5参照)。標準CPU503は、標準メモリ501、増設CPU504及びマザーボード508に電気的に接続されている。
増設CPU504は、顧客装置500に増設された中央処理装置である(図5参照)。増設CPU504は、増設メモリ502、標準CPU503及びマザーボード508に電気的に接続されている。
標準CPU503及び増設CPU504は、一方のCPUが故障しても、他方のCPUが動作を継続するため、いわゆる、冗長な構成と成っており、この構成を、冗長CPU構成(デュアルCPU構成)という。
標準電源505は、顧客装置500に標準搭載された電源である(図5参照)。標準電源505は、電源バックボード507に電気的に接続されている。
増設電源506は、顧客装置500に増設された電源である(図5参照)。増設電源506は、電源バックボード507に電気的に接続されている。
標準電源505及び増設電源506は、一方の電源が故障しても、他方の電源が電力を供給するため、いわゆる、冗長な構成と成っており、この構成を、冗長電源構成という。
なお、増設メモリ502、増設CPU504及び増設電源506は、性能を向上させる、又は、機能を増やすための追加可能部品であり、搭載されていなくてもよい。
電源バックボード507は、標準電源505及び増設電源506を実装するためのコネクタと、電源ケーブル510を接続するコネクタと、を有するプリント基板である(図5参照)。電源バックボード507は、電源ケーブル510を介してマザーボード508に電気的に接続されている。
マザーボード508は、主要な部品等(図示せず)を搭載した回路基板である(図5参照)。マザーボード508は、CPU(標準CPU503、増設CPU504)を実装可能なコネクタ(又はソケット)と、各メモリ(標準メモリ501、増設メモリ502)を実装可能なコネクタ(又はソケット)と、を有する。また、マザーボード508は、ディスクアレイコントローラ509を実装する。さらに、マザーボード508は、入出力制御部514を有する。なお、入出力制御部514については、後述する。
ディスクアレイコントローラ509は、第1〜第3ディスク513a〜513cに対し、RAID(Redundant Array of Independent Disks)機能を持たせるための回路基板である(図5参照)。ディスクアレイコントローラ509は、ディスクケーブル512を介してディスクバックボード511に電気的に接続されている。
電源ケーブル510は、電源バックボード507とマザーボード508とを接続するケーブルである(図5参照)。
ディスクバックボード511は、第1〜第3ディスク513a〜513cを搭載するためのコネクタと、ディスクケーブル512を接続するためのコネクタと、を有するプリント基板である(図5参照)。ディスクバックボード511は、第1〜第3ディスク513a〜513cと電気的に接続されている。また、ディスクバックボード511は、ディスクケーブル512を介してディスクアレイコントローラ509に電気的に接続されている。
ディスクケーブル512は、ディスクバックボード511とディスクアレイコントローラ509とを接続するケーブルである(図5参照)。
第1〜第3ディスク513a〜513cは、ディスク装置(記憶装置)である(図5参照)。第1〜第3ディスク513a〜513cには、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等の記憶装置を用いることができる。第1〜第3ディスク513a〜513cの接続用インタフェース(Interface)の種類は複数あるが、ここでは、SAS(Serial Attached SCSI(Small Computer System Interface))を用いることができる。SASは、既存SCSIのパラレル転送の性能や拡張性の限界を超えた新たな規格であり、パラレル転送をシリアル転送にすることで、性能の拡張性を有する。
入出力制御部514は、データの入出力を制御する機能部である(図5参照)。入出力制御部514は、被疑部品特定装置(図1の100)の記憶部(図1の105)への入出力、記憶部(図1の105)内に記憶されたデータベース(図1の200、300、400、700)への書き込みや読み出し等、ソフトウェアに従った処理を行う。入出力制御部514は、図5ではマザーボード508に組み込まれているが、マザーボード508とは別の回路基板であってもよい。入出力制御部514は、入力部515及び出力部516と電気的に接続されている。
入力部515は、情報を入力するための機能部である(図5参照)。入力部515には、例えば、キーボード、タッチパネル等を用いることができ、図示しない通信部を介して接続された入力部を有する情報端末等でもよい。入力部515は、入出力制御部514に電気的に接続されている。
出力部516は、情報を出力するための機能部である(図5参照)。出力部516として、例えば、ディスプレイ、プリンタ等の印刷装置、図示しない通信部を介して接続された出力部を有する情報端末等でもよい。出力部516は、入出力制御部514に電気的に接続されている。
通信部517は、情報を通信(送受信)するための機能部(例えば、インタフェース等)である(図5参照)。通信部517は、ネットワーク(図1の600)に通信可能に接続されている。
次に、実施形態1に係る被疑部品特定システムにおける被疑部品特定装置の動作について図面を用いて説明する。図6、図7は、実施形態1に係る被疑部品特定システムにおける被疑部品特定装置の動作を模式的に示したフローチャートである。ここでは、図5に示す顧客装置500に障害が発生した場合を例に説明する。なお、被疑部品特定システムの構成については、図1を参照されたい。
まず、被疑部品特定装置100の制御部101は、障害が発生した顧客装置500からの障害発生情報(顧客情報、装置情報、エラーコードを含む)を取得する(図6のステップA1)。なお、障害発生情報の取得は、顧客装置500からネットワーク600及び通信部102を通じて取得するだけでなく、入力部103から入力されることによって取得してもよい。障害発生情報として、例えば、顧客情報「C商事」、装置情報「R130X−YY」、エラーコード「0xC1」のようにすることができる。
次に、制御部101は、特殊障害データベース400において、ステップA1で取得した障害発生情報におけるエラーコードに対応するエラーコードがあるか否かを判断する(図6のステップA2)。対応するエラーコードがない場合(ステップA2のNO)、ステップA9に進む。
対応するエラーコードがある場合(ステップA2のYES)、制御部101は、装置構成データベース700から、障害発生情報における顧客情報及び装置情報に対応する構成部品に係る情報を取得する(図6のステップA3)。
ステップA3の後、制御部101は、取得した構成部品が、障害発生情報におけるエラーコードに対応する特殊障害データベース400の第1判断条件を満たす(所定の部品を搭載している)か否かを判断する(図6のステップA4)。第1判断条件を満たさない場合(ステップA4のNO)、ステップB1に進む。なお、第1判断条件が複数種類ある場合、少なくとも1つの第1判断条件を満たせば、第1判断条件を満たすと判断する。
第1判断条件を満たす場合(ステップA4のYES)、制御部101は、障害情報データベース200から、障害発生情報における顧客情報及び装置情報に対応する交換部品に係る情報を取得する(図6のステップA5)。例えば、図2の障害情報データベース200の場合、障害発生情報における顧客情報が「C商事」、かつ、装置情報が「R130X−YY」であれば、交換部品「第1ディスク」を取得する。なお、障害情報データベース200において、対応する交換部品がない場合には、交換部品なしのまま、ステップA6に進む。
ステップA5の後、制御部101は、取得した交換部品、及び、障害発生情報におけるエラーコードが特殊障害データベース400の第2判断条件(満たした第1判断条件に対応する第2判断条件)を満たすか否か(所定の部品の交換履歴の有無、かつ、所定のエラーコードの有無)を判断する(図6のステップA6)。第2判断条件を満たさない場合(ステップA6のNO)、ステップB1に進む。なお、第2判断条件が複数種類ある場合、少なくとも1つの第2判断条件を満たせば、第2判断条件を満たすと判断する。
ここで、第2判断条件は、(a)所定の部品の交換履歴あり、かつ、所定のエラーコードありの場合(所定のエラーコードに係る部品の個別の故障の場合)、(b)所定の部品の交換履歴あり、かつ、所定のエラーコードなしの場合(所定のエラーコードに係る部品の個別の故障の場合)、(c)所定の部品の交換履歴なし、かつ、所定のエラーコードありの場合(同時交換被疑部品の故障の場合)、(d)所定の部品の交換履歴なし、かつ、所定のエラーコードなしの場合(同時交換被疑部品の故障の場合)、(e)所定の部品の交換履歴あり(エラーコード不問)の場合、(f)所定の部品の交換履歴なし(エラーコード不問)の場合(同時交換被疑部品の故障の場合)のようにすることができる。
第2判断条件を満たす場合(ステップA6のYES)、制御部101は、特殊障害データベース400において、満たした第1判断条件及び第2判断条件に対応する同時交換被疑部品があるか否かを判断する(図6のステップA7)。対応する同時交換被疑部品がない場合(ステップA7のNO)、ステップB1に進む。
対応する同時交換被疑部品がある場合(ステップA7のYES)、制御部101は、出力部104から、対応する同時交換被疑部品の交換指示情報(同時交換被疑部品、顧客情報、装置情報を含んでもよい)を出力させ(図6のステップA8)、その後、終了する。
ステップA8の後、保守作業者は、同時交換被疑部品の交換指示に従って、現地に行って、部品交換作業を行うことになる。同時交換被疑部品の交換により障害が復旧しない場合、より広範囲の部品を一括して交換し、それでも障害が復旧しない場合には、同時交換被疑部品を含むユニットごと交換し、それでもさらに障害が復旧しない場合には、障害を起こしている装置ごと代替装置に交換することになる。障害が復旧した場合、保守作業者は、特殊障害データベース400の各項目にデータを入力し、登録することになる。
対応するエラーコードがない場合(ステップA2のNO)、制御部101は、新規障害として、出力部104から、現地調査での障害原因の特定の指示情報(顧客情報、装置情報を含んでもよい)を出力させ(図6のステップA9)、その後、終了する。
ステップA9の後、保守作業者は、現地に行って、部品交換作業を行うことになる。障害が復旧した場合、保守作業者は、特殊障害データベース400の各項目にデータを入力し、登録することになる。
第1判断条件を満たさない場合(ステップA4のNO)、第2判断条件を満たさない場合(ステップA6のNO)、又は、対応する同時交換被疑部品がない場合(ステップA7のNO)、制御部101は、障害情報データベース200において、ステップA1で取得した障害発生情報におけるエラーコードに対応するエラーコードがあるか否かを判断する(図7のステップB1)。対応するエラーコードがない場合(ステップB1のNO)、ステップB6に進む。
対応するエラーコードがある場合(ステップB1のYES)、制御部101は、障害情報データベース200から、障害発生情報におけるエラーコードに対応する被疑部品に係る情報を取得する(図7のステップB2)。
ステップB2において、例えば、図2の障害情報データベース200の場合、障害発生情報におけるエラーコードが「0xC1」であれば、被疑部品として、第1被疑部品:第1ディスク、第2被疑部品:ディスクアレイコントローラ、第3被疑部品:ディスクバックボードを取得する。
ステップB2の後、制御部101は、取得した被疑部品に優先順位があるか否かを判断する(図7のステップB3)。優先順位がない場合(ステップB3のNO)、ステップB5に進む。
優先順位がある場合(ステップB3のYES)、制御部101は、部品戻入率データベース300に基づいて、取得した被疑部品の優先順位を入れ替る(図7のステップB4)。
ステップB4において、被疑部品の優先順位の入れ替えは、戻入率の高い被疑部品ほど優先順位が高くなるように入れ替えることができる。例えば、被疑部品が第1ディスク、ディスクアレイコントローラ及びディスクバックボードである場合、第1ディスクの戻入率が30%、ディスクアレイコントローラの戻入率が20%、ディスクバックボードの戻入率が10%であれば、第1被疑部品が第1ディスク、第2被疑部品がディスクアレイコントローラ、第3被疑部品がディスクバックボードとなるように優先順位を入れ替えることができる。また、被疑部品の戻入率が、同じ値の場合は、障害情報データベース200に設定されている優先順位の順番のままとすることができる。
優先順位がない場合(ステップB3のNO)、又は、ステップB4の後、制御部101は、出力部104から、被疑部品の交換指示情報(顧客情報、装置情報、被疑部品を含んでもよい、被疑部品に優先順位がある場合は優先順位を含んでもよい)を出力させ(図7のステップB5)、その後、終了する。
ステップB5の後、保守作業者は、被疑部品の交換指示に従って、現地に行って、部品交換作業を行うことになる。被疑部品の交換により障害が復旧しない場合、より広範囲の部品を一括して交換し、それでも障害が復旧しない場合には、被疑部品を含むユニットごと交換し、それでもさらに障害が復旧しない場合には、障害を起こしている装置ごと代替装置に交換することになる。障害が復旧した場合、保守作業者は、障害情報データベース200の各項目にデータを入力し、登録することになる。
対応するエラーコードがない場合(ステップB1のNO)、制御部101は、出力部104から、現地調査での障害原因の特定の指示情報(顧客情報、装置情報を含んでもよい)を出力させ(図7のステップB6)、終了する。
その後、保守作業者は、現地に行って、部品交換作業を行うことになる。障害が復旧した場合、保守作業者は、障害情報データベース200の各項目にデータを入力し、登録することになる。
次に、実施形態1に係る被疑部品特定システムにおける被疑部品特定装置100の、図4の特殊障害データベース400から同時交換被疑部品を決定するときの動作を、図面を用いて説明する。図8は、実施形態1に係る被疑部品特定システムにおける顧客装置の電源周辺部の構成を模式的に示した冗長電源構成の場合のブロック図である。図9は、実施形態1に係る被疑部品特定システムにおける顧客装置の電源周辺部の構成を模式的に示した標準電源構成の場合のブロック図である。図10は、実施形態1に係る被疑部品特定システムにおける顧客装置のディスク周辺部の構成の一例を模式的に示したディスク3台構成の場合のブロック図である。図11は、実施形態1に係る被疑部品特定システムにおける顧客装置のCPU周辺部の構成を模式的に示した冗長CPU構成の場合のブロック図である。図12は、実施形態1に係る被疑部品特定システムにおける顧客装置のCPU周辺部の構成を模式的に示した標準CPU構成の場合のブロック図である。
顧客装置500の電源周辺部の構成が図8のような冗長電源構成の場合において、電源ケーブル510に故障(例えば、電源ケーブル取り付け時の圧迫等により被覆が損傷し、装置の振動により、間欠的にショートが発生する等)がある場合は、電源ケーブル510の部品交換が必要である。また、電源ケーブル510の故障により、過電流が生じた場合は、標準電源505、増設電源506、又は、電源バックボード507を壊す可能性がある。標準電源505が過電流で壊れた場合、標準電源505の交換を行うことで、装置は一時的に復旧するが、根本原因の、電源ケーブル510が交換されていないため、再度、同じ障害が発生することになる。標準電源505及び増設電源506は、部品名称は異なるが、交換する部品としては、同一の部品である。このため、過電流が発生したことで壊れる標準電源505及び増設電源506の可能性は同等である。このような状況で、被疑部品特定装置100は、以下のように動作する。
まず、制御部101は、障害発生情報として、顧客情報(ここでは、A商事)、装置情報(ここでは、R110X−YY)、及び、エラーコード(ここでは、0xB0)を取得する(図6のステップA1に相当)。ここで、エラーコード「0xB0」は、標準電源の故障を意味する。
次に、制御部101は、特殊障害データベース400において、取得したエラーコード(0xB0)に対応するエラーコードがあるか否かを判断する(図6のステップA2に相当)。ここでは、特殊障害データベース400において、取得したエラーコード(0xB0)に対応するエラーコードがあるので、次に進む。
次に、制御部101は、装置構成データベース700から、取得した顧客情報(A商事)及び装置情報(R110X−YY)に対応する構成部品に係る情報を取得する(図6のステップA3に相当)。ここでは、構成部品として標準電源及び増設電源を含む。
次に、制御部101は、取得した構成部品が、取得したエラーコード(0xB0)に対応する特殊障害データベース400の第1判断条件(標準電源及び増設電源を搭載)を満たすか否かを判断する(図6のステップA4に相当)。ここでは、構成部品には標準電源及び増設電源を含むので、次に進む。
次に、制御部101は、障害情報データベース200から、取得した顧客情報(A商事)及び装置情報(R110X−YY)に対応する交換部品(標準電源)に係る情報を取得する(図6のステップA5に相当)。
次に、制御部101は、取得した交換部品(標準電源)及びエラーコード(0xB0)が特殊障害データベース400の第2判断条件を満たす(電源ケーブルの交換履歴の有無、かつ、エラーコード「0xB1」の有無)か否かを判断する(図6のステップA6に相当)。ここでは、第2判断条件のうち、電源ケーブルの交換履歴なし、かつ、エラーコード「0xB1」なしという条件を満たす。なお、エラーコード「0xB1」は、増設電源の故障を意味する。
次に、制御部101は、特殊障害データベース400において、満たした第1判断条件及び第2判断条件に対応する同時交換被疑部品があるか否かを判断する(図6のステップA7に相当)。ここでは、同時交換被疑部品として、標準電源、増設電源、電源バックボード、電源ケーブルがあるので、次に進む。
最後に、制御部101は、出力部104から、対応する同時交換被疑部品(標準電源、増設電源、電源バックボード、電源ケーブル)の交換指示情報(同時交換被疑部品、顧客情報、装置情報を含んでもよい)を出力させ(図6のステップA8に相当)、その後、終了する。
顧客装置500の電源周辺部の構成が図9のような標準電源構成の場合において、被疑部品特定装置100は、以下のように動作する。
まず、制御部101は、障害発生情報として、顧客情報(ここでは、A商事)、装置情報(ここでは、R110X−YY)、及び、エラーコード(ここでは、0xB0)を取得する(図6のステップA1に相当)。ここで、エラーコード「0xB0」は、標準電源の故障を意味する。
次に、制御部101は、特殊障害データベース400において、取得したエラーコード(0xB0)に対応するエラーコードがあるか否かを判断する(図6のステップA2に相当)。ここでは、特殊障害データベース400において、取得したエラーコード(0xB0)に対応するエラーコードがあるので、次に進む。
次に、制御部101は、装置構成データベース700から、取得した顧客情報(A商事)及び装置情報(R110X−YY)に対応する構成部品に係る情報を取得する(図6のステップA3に相当)。ここでは、構成部品として標準電源を含む(増設電源なし)。
次に、制御部101は、取得した構成部品が、取得したエラーコード(0xB0)に対応する特殊障害データベース400の第1判断条件(標準電源のみ搭載)を満たすか否かを判断する(図6のステップA4に相当)。ここでは、構成部品には標準電源のみ搭載するので、次に進む。
次に、制御部101は、障害情報データベース200から、取得した顧客情報(A商事)及び装置情報(R110X−YY)に対応する交換部品(標準電源)に係る情報を取得する(図6のステップA5に相当)。
次に、制御部101は、取得した交換部品(標準電源)が特殊障害データベース400の第2判断条件を満たす(電源ケーブルの交換履歴の有無)か否かを判断する(図6のステップA6に相当)。ここでは、第2判断条件のうち、電源ケーブルの交換履歴なしという条件を満たす。
次に、制御部101は、特殊障害データベース400において、満たした第1判断条件及び第2判断条件に対応する同時交換被疑部品があるか否かを判断する(図6のステップA7に相当)。ここでは、同時交換被疑部品として、標準電源、増設電源、電源バックボード、電源ケーブルがあるので、次に進む。
最後に、制御部101は、出力部104から、対応する同時交換被疑部品(標準電源、増設電源、電源バックボード、電源ケーブル)の交換指示情報(同時交換被疑部品、顧客情報、装置情報を含んでもよい)を出力させ(図6のステップA8に相当)、その後、終了する。
顧客装置のディスク周辺部の構成が図10のような3台のディスクを搭載する構成の場合において、ディスクバックボード511の故障(例えば、コネクタ部の勘合ゆるみがあり、装置の振動により、間欠的に通信異常が発生する、ディスクへの電源の瞬断が発生する等)により、第1ディスク513aへの制御信号の乱れ、又は、電源の瞬断が生じた場合は、第1ディスク513aを壊す場合がある。第1ディスク513aの交換を行うことで、顧客装置500は一時的に復旧するが、根本原因のディスクバックボード511が交換されない場合、再度、同じ障害が発生する可能性がある。このような状況で、被疑部品特定装置100は、以下のように動作する。
まず、制御部101は、障害発生情報として、顧客情報(ここでは、C商事)、装置情報(ここでは、R130X−YY)、及び、エラーコード(ここでは、0xC1)を取得する(図6のステップA1に相当)。ここで、エラーコード「0xC1」は、第1ディスクの故障を意味する。
次に、制御部101は、特殊障害データベース400において、取得したエラーコード(0xC1)に対応するエラーコードがあるか否かを判断する(図6のステップA2に相当)。ここでは、特殊障害データベース400において、取得したエラーコード(0xC1)に対応するエラーコードがあるので、次に進む。
次に、制御部101は、装置構成データベース700から、取得した顧客情報(C商事)及び装置情報(R130X−YY)に対応する構成部品に係る情報を取得する(図6のステップA3に相当)。ここでは、構成部品として3台のディスクを含む。
次に、制御部101は、取得した構成部品が、取得したエラーコード(0xC1)に対応する特殊障害データベース400の第1判断条件(ディスク3台を搭載)を満たすか否かを判断する(図6のステップA4に相当)。ここでは、構成部品には3台のディスクを搭載するので、次に進む。
次に、制御部101は、障害情報データベース200から、取得した顧客情報(C商事)及び装置情報(R130X−YY)に対応する交換部品(第1ディスク)に係る情報を取得する(図6のステップA5に相当)。
次に、制御部101は、取得した交換部品(第1ディスク)が特殊障害データベース400の第2判断条件を満たす(ディスクバックボードの交換履歴の有無、エラーコード「0xC2」及び「0xC3」の有無)か否かを判断する(図6のステップA6に相当)。ここでは、第2判断条件のうち、ディスクバックボードの交換履歴なし、かつ、エラーコード「0xC2」及び「0xC3」なしという条件を満たす。なお、エラーコード「0xC2」は、第2ディスクの故障を意味し、エラーコード「0xC3」は、第3ディスクの故障を意味する。
次に、制御部101は、特殊障害データベース400において、満たした第1判断条件及び第2判断条件に対応する同時交換被疑部品があるか否かを判断する(図6のステップA7に相当)。ここでは、同時交換被疑部品として、第1ディスク、ディスクバックボードがあるので、次に進む。
最後に、制御部101は、出力部104から、対応する同時交換被疑部品(第1ディスク、ディスクバックボード)の交換指示情報(同時交換被疑部品、顧客情報、装置情報を含んでもよい)を出力させ(図6のステップA8に相当)、その後、終了する。
顧客装置のCPU周辺部の構成が図11のような冗長CPU構成の場合において、マザーボード508の故障により、マザーボードの搭載部品への供給電圧が不安定になると、低電圧での動作となり、標準CPU503、増設CPU504、標準メモリ501を、壊す、もしくは、劣化させる場合がある。標準CPU503の交換を行うことで、装置は一時的に復旧するが、根本原因の、マザーボード508が交換されていないため、再度、同じ障害が発生する可能性がある。このような状況で、被疑部品特定装置100は、以下のように動作する。
まず、制御部101は、障害発生情報として、顧客情報(ここでは、F商事)、装置情報(ここでは、R160X−YY)、及び、エラーコード(ここでは、0xD0)を取得する(図6のステップA1に相当)。ここで、エラーコード「0xD0」は、標準CPUの故障を意味する。
次に、制御部101は、特殊障害データベース400において、取得したエラーコード(0xD0)に対応するエラーコードがあるか否かを判断する(図6のステップA2に相当)。ここでは、特殊障害データベース400において、取得したエラーコード(0xD0)に対応するエラーコードがあるので、次に進む。
次に、制御部101は、装置構成データベース700から、取得した顧客情報(F商事)及び装置情報(R160X−YY)に対応する構成部品に係る情報を取得する(図6のステップA3に相当)。ここでは、構成部品として標準CPU及び増設CPUを含む。
次に、制御部101は、取得した構成部品が、取得したエラーコード(0xD0)に対応する特殊障害データベース400の第1判断条件(標準CPU及び増設CPUを搭載)を満たすか否かを判断する(図6のステップA4に相当)。ここでは、構成部品には標準CPU及び増設CPUを搭載するので、次に進む。
次に、制御部101は、障害情報データベース200から、取得した顧客情報(F商事)及び装置情報(R160X−YY)に対応する交換部品(標準CPU)に係る情報を取得する(図6のステップA5に相当)。
次に、制御部101は、取得した交換部品(標準CPU)が特殊障害データベース400の第2判断条件を満たす(マザーボードの交換履歴の有無、エラーコード「0xD1」の有無)か否かを判断する(図6のステップA6に相当)。ここでは、第2判断条件のうち、マザーボードの交換履歴なし、かつ、エラーコード「0xD1」なしという条件を満たす。なお、エラーコード「0xD1」は、増設CPUの故障を意味する。
次に、制御部101は、特殊障害データベース400において、満たした第1判断条件及び第2判断条件に対応する同時交換被疑部品があるか否かを判断する(図6のステップA7に相当)。ここでは、同時交換被疑部品として、標準CPU、マザーボード、標準メモリがあるので、次に進む。
最後に、制御部101は、出力部104から、対応する同時交換被疑部品(標準CPU、マザーボード、標準メモリ)の交換指示情報(同時交換被疑部品、顧客情報、装置情報を含んでもよい)を出力させ(図6のステップA8に相当)、その後、終了する。
顧客装置のCPU周辺部の構成が図12のような標準CPU構成の場合において、被疑部品特定装置100は、以下のように動作する。
まず、制御部101は、障害発生情報として、顧客情報(ここでは、F商事)、装置情報(ここでは、R160X−YY)、及び、エラーコード(ここでは、0xD0)を取得する(図6のステップA1に相当)。ここで、エラーコード「0xD0」は標準CPUの故障を意味する。
次に、制御部101は、特殊障害データベース400において、取得したエラーコード(0xD0)に対応するエラーコードがあるか否かを判断する(図6のステップA2に相当)。ここでは、特殊障害データベース400において、取得したエラーコード(0xD0)に対応するエラーコードがあるので、次に進む。
次に、制御部101は、装置構成データベース700から、取得した顧客情報(F商事)及び装置情報(R160X−YY)に対応する構成部品に係る情報を取得する(図6のステップA3に相当)。ここでは、構成部品として標準CPUを含む(増設CPUなし)。
次に、制御部101は、取得した構成部品が、取得したエラーコード(0xD0)に対応する特殊障害データベース400の第1判断条件(標準CPUのみ搭載)を満たすか否かを判断する(図6のステップA4に相当)。ここでは、構成部品には標準CPUのみ搭載(増設CPUなし)するので、次に進む。
次に、制御部101は、障害情報データベース200から、取得した顧客情報(F商事)及び装置情報(R160X−YY)に対応する交換部品(標準CPU)に係る情報を取得する(図6のステップA5に相当)。
次に、制御部101は、取得した交換部品(標準CPU)が特殊障害データベース400の第2判断条件を満たす(マザーボードの交換履歴の有無)か否かを判断する(図6のステップA6に相当)。ここでは、第2判断条件のうち、マザーボードの交換履歴なしという条件を満たす。
次に、制御部101は、特殊障害データベース400において、満たした第1判断条件及び第2判断条件に対応する同時交換被疑部品があるか否かを判断する(図6のステップA7に相当)。ここでは、同時交換被疑部品として、標準CPU、マザーボードがあるので、次に進む。
最後に、制御部101は、出力部104から、対応する同時交換被疑部品(標準CPU、マザーボード)の交換指示情報(同時交換被疑部品、顧客情報、装置情報を含んでもよい)を出力させ(図6のステップA8に相当)、その後、終了する。
実施形態1によれば、特殊障害データベース400に基づいて特殊障害を判断することにより、特殊障害を引き起こしている複数の被疑部品を正確に特定することができ、同時にまとめて部品を交換することができ、部品や作業の無駄を抑えることができるので、復旧時間をより短くすることができ、顧客の業務停止の影響を小さくすることができ、費用を抑えることができる。
[実施形態2]
実施形態2に係る被疑部品特定装置について図面を用いて説明する。図13は、実施形態2に係る被疑部品特定装置の構成を模式的に示したブロック図である。
被疑部品特定装置100は、データを取得する取得部106と、データを出力する出力部104と、データを記憶する記憶部105と、取得部106、出力部104及び記憶部105を制御する制御部101と、を備える。
取得部106として、例えば、データを入力する入力部、データを受信する受信部等を用いることができる。
出力部104として、例えば、データを表示する表示部、データを印刷する印刷部等を用いることができる。
記憶部105は、特殊障害データベース400と、装置構成データベース700と、障害情報データベース200と、を記憶する。
特殊障害データベース400は、障害情報と、所定の部品の有無を判断するための第1判断条件と、他の所定の部品の交換履歴の有無かつ所定の障害情報の有無を判断するための第2判断条件と、同時に交換する複数の同時交換被疑部品とが関連付けられたデータベースである。
装置構成データベース700は、顧客情報と、装置情報と、構成部品とが関連付けられたデータベースである。
障害情報データベース200は、顧客情報と、装置情報と、障害情報と、交換部品とが関連付けられたデータベースである。
制御部101は、所定の情報処理を行う。所定の情報処理については、後述する。
実施形態2に係る被疑部品特定システムにおける被疑部品特定装置の動作について図面を用いて説明する。図14は、実施形態2に係る被疑部品特定システムにおける被疑部品特定装置の動作を模式的に示したフローチャートである。なお、被疑部品特定装置100の構成については、図13を参照されたい。
制御部101は、取得部106を通じて、顧客情報、装置情報及び障害情報を含む障害発生情報を取得する(ステップC1)。
制御部101は、特殊障害データベース400において、ステップC1で取得した障害発生情報における障害情報に対応する障害情報があるか否かを判断する(ステップC2)。
特殊障害データベース400において、ステップC1で取得した障害発生情報における障害情報に対応する障害情報があるときに、制御部101は、装置構成データベース700から、ステップC1で取得した障害発生情報における顧客情報及び装置情報に対応する構成部分に係る情報を取得する(ステップC3)。
次に、制御部101は、ステップC3で取得した構成部品が、ステップC1で取得した障害発生情報における障害情報に対応する特殊障害データベース400の第1判断条件を満たすか否かを判断する(ステップC4)。
第1判断条件を満たすときに、制御部101は、障害情報データベース200から、ステップC1で取得した障害発生情報における顧客情報及び装置情報に対応する交換部品に係る情報を取得する(ステップC5)。
次に、制御部101は、ステップC5で取得した交換部品、及び、ステップC1で取得した障害発生情報における障害情報が、満たした第1判断条件に対応する第2判断条件を満たすか否かを判断する(ステップC6)。
第2判断条件を満たすときに、制御部101は、特殊障害データベース400において、満たした第1判断条件及び第2判断条件に対応する同時交換被疑部品があるか否かを判断する(ステップC7)。
対応する同時交換被疑部品があるときに、制御部101は、出力部104から、対応する同時交換被疑部品、顧客情報、装置情報を含む交換指示情報を出力させ(ステップC8)、その後、終了する。
実施形態2によれば、特殊障害データベース400に基づいて特殊障害を判断することにより、特殊障害を引き起こしている複数の被疑部品を正確に特定することができるので、復旧時間をより短くすることができ、顧客の業務停止の影響を小さくすることができ、費用を抑えることができる。
(付記)
本発明では、前記第1の視点に係る被疑部品特定装置の形態が可能である。
前記第1の視点に係る被疑部品特定装置において、前記第1判断条件を満たすか否かを判断する処理では、前記第1判断条件が複数種類ある場合、少なくとも1種類の第1判断条件を満たすか否かを判断する。
前記第1の視点に係る被疑部品特定装置において、前記第2判断条件を満たすか否かを判断する処理では、前記第2判断条件が複数種類ある場合、少なくとも1種類の第2判断条件を満たすか否かを判断する。
前記第1の視点に係る被疑部品特定装置において、前記制御部は、前記特殊障害データベースにおいて、取得した前記障害発生情報における前記障害情報に対応する障害情報がないときに、前記出力部から、現地調査での障害原因の特定の指示情報を出力する。
前記第1の視点に係る被疑部品特定装置において、前記制御部は、前記第1判断条件又は前記第2判断条件を満たさないとき、若しくは、対応する前記同時交換被疑部品がないときに、前記障害情報データベースにおいて、前記障害発生情報における前記障害情報に対応する障害情報があるか否かを判断する処理と、前記障害情報データベースにおいて、前記障害発生情報における前記障害情報に対応する障害情報があるときに、前記障害情報データベースから、前記障害発生情報における前記障害情報に対応する被疑部品に係る情報を取得する処理と、前記出力部から、取得した前記被疑部品、前記顧客情報、前記装置情報を含む交換指示情報を出力させる処理と、さらに行う。
前記第1の視点に係る被疑部品特定装置において、前記記憶部は、部品と、戻入率とが関連付けられた部品戻入率データベースをさらに記憶し、制御部は、取得した被疑部品に優先順位があるか否かを判断する処理と、前記優先順位があるときに、前記部品戻入率データベースに基づいて、戻入率の高い被疑部品ほど優先順位が高くなるように、取得した前記被疑部品の優先順位を入れ替る処理と、前記出力部から、優先順位を入れ替えた前記被疑部品、前記顧客情報、前記装置情報を含む交換指示情報を出力させる処理と、をさらに行う。
前記第1の視点に係る被疑部品特定装置において、前記制御部は、前記障害情報データベースにおいて、前記障害発生情報における前記障害情報に対応する障害情報がないときに、前記出力部から、現地調査での障害原因の特定の指示情報を出力する。
本発明では、前記第2の視点に係る被疑部品特定システムの形態が可能である。
本発明では、前記第3の視点に係る被疑部品特定方法の形態が可能である。
本発明では、前記第4の視点に係るプログラムの形態が可能である。
なお、上記の特許文献の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示(特許請求の範囲及び図面を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせないし選択(必要により不選択)が可能である。すなわち、本発明は、請求の範囲及び図面を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、本願に記載の数値及び数値範囲については、明記がなくともその任意の中間値、下位数値、及び、小範囲が記載されているものとみなされる。