JPWO2012026035A1

JPWO2012026035A1 - 障害処理方法，障害処理システム，障害処理装置及び障害処理プログラム

Info

Publication number: JPWO2012026035A1
Application number: JP2012530495A
Authority: JP
Inventors: 憲司岡野
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2010-08-27
Filing date: 2010-08-27
Publication date: 2013-10-28
Anticipated expiration: 2030-08-27
Also published as: WO2012026035A1; US20130173964A1; JP5459405B2

Abstract

障害発生部品（２４）の記憶部（２４１）から障害発生時に生成された障害情報の格納位置を表す格納位置情報を取得する格納位置情報取得部（３１）と、格納位置情報に基づいて、情報処理装置（２０）及び障害処理装置（３０）と通信可能に接続されデータを格納可能な記憶装置（１１）から、障害発生時に情報処理装置（２０）において生成された障害に関する障害情報を取得する障害情報取得部（３２）と、取得した障害情報に基づいて、情報処理装置（２０）に合わせて障害処理装置（３０）の構成を変更する構成制御部（３４）とをそなえることにより、情報処理装置において発生する障害を容易に再現できるようにすることにより、再現試験を効率よく行なう。

Description

本件は、障害処理方法，障害処理システム，障害処理装置及び障害処理プログラムに関する。

例えば、フィールドにおいて顧客が使用するサーバシステム等の情報処理装置に障害が発生した場合に、情報処理装置のメーカーが、障害の原因となる故障部品を工場に引き取り、障害の再現試験を行なう場合がある。
従来の障害処理手法においては、故障部品は、ユーザから報告された障害報告内容とともにメーカーの工場等に送付される。そして、この工場において、障害報告内容に基づき、再現試験環境が構築され、この再現試験環境下において障害を再現させて原因究明や対処方法の検討等が行なわれる。

なお、障害報告内容は、例えば、フィールドにて修理担当者が顧客等から情報収集したり、サービスセンタにおいてオペレータが顧客から聴取することにより取得され、データとして入力もしくは伝票等に記載され故障部品に添付される。
特開平１０−１３３７３９号公報

しかしながら、このような従来の障害処理手法によれば、工場において障害の再現を行なおうとしても、フィールドから取り寄せられる障害報告内容では、再現試験環境を構築するには不十分な場合が多い。
従って、工場において、再現試験環境を構築することが困難となり、再現試験の作業効率が悪いという課題があり、又、これに伴い障害原因の特定も非効率であるという課題もある。

本件の目的の一つは、このような課題に鑑み創案されたもので、情報処理装置において発生する障害を容易に再現できるようにすることにより、再現試験を効率よく行なうことを目的とする。
なお、前記目的に限らず、後述する発明を実施するための最良の形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。

上記の目的を達成するために、この障害処理方法は、情報処理装置において発生する障害を再現装置において再現させる障害処理方法であって、該情報処理装置において、障害発生時に、障害に関する障害情報を生成する障害情報生成ステップと、該障害情報生成ステップにおいて生成した該障害情報を、該情報処理装置及び該再現装置と通信可能に接続されデータを格納可能な記憶装置に格納する格納処理ステップと、該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理ステップと、該再現装置において、該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得ステップと、該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得ステップと、該障害情報取得ステップにおいて取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御ステップとをそなえる。

また、この障害処理システムは、情報処理装置において発生する障害を再現装置において再現させる障害処理システムであって、該情報処理装置及び該再現装置と通信可能に接続され、データを格納可能な記憶装置をそなえるとともに、該情報処理装置において、障害発生時に、障害に関する障害情報を生成する障害情報生成部と、該障害情報生成部が生成した該障害情報を該記憶装置に格納する格納処理部と、該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理部とをそなえ、該再現装置において、該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得部と、該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得部と、該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御部とをそなえる。

さらに、この障害処理装置は、情報処理装置の障害発生部品において発生する障害を再現させる障害処理装置であって、該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得する格納位置情報取得部と、該格納位置情報に基づいて、当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得する障害情報取得部と、該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該障害処理装置の構成を変更する構成制御部とをそなえる。

また、この障害処理プログラムは、情報処理装置の障害発生部品において発生する障害を再現させる障害再現機能をコンピュータに実行させるための障害処理プログラムであって、該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得し、該格納位置情報に基づいて、該情報処理装置及び当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得し、該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて該コンピュータの構成を変更する。

開示の技術によれば、以下の少なくともいずれか１つの効果ないし利点を奏する。
（１）障害情報のデータサイズを制限する必要がなく、例えば、大量のログ情報を再現装置に受け渡すことができ、障害の再現効率を向上させることができる。
（２）情報処理装置の製造コストを低減することができる。
（３）障害情報を確実に再現装置に受け渡すことができ、再現試験の効率を高めることができ、障害原因の特定までのプロセスを効率化することができる。

（４）再現試験を効率化することで障害原因特定までの時間を短縮し製品の品質を向上させることができる。

実施形態の一例としての障害処理システムの機能構成を模式的に示す図である。実施形態の一例としての障害処理システムの顧客システムのハードウェア構成を例示する図である。実施形態の一例としての障害処理システムにおける構成情報の例を示す図である。実施形態の一例としての障害処理システムにおける構成情報の例を示す図である。実施形態の一例としての障害処理システムにおけるログ情報の例を示す図である。実施形態の一例としての障害処理システムにおける障害ログの例を示す図である。実施形態の一例としての障害処理システムにおける格納処理部及び位置情報格納処理部による処理を例示する図である。実施形態の一例としての障害処理システムの障害再現システムのハードウェア構成を例示する図である。実施形態の一例としての障害処理システムの障害再現システムの機能構成を模式的に示す図である。実施形態の一例としての障害処理システムにおける障害情報取得部による処理を例示する図である。実施形態の一例としての障害処理システムにおける構成情報テーブルの例を示す図である。実施形態の一例としての障害処理システムにおいて障害再現システムの一部のハードウェアエレメントを未実装状態にした例を示す図である。実施形態の一例としての障害処理システムにおいて障害再現システムに顧客システムと同様のドメイン構成を設定した例を示す図である。実施形態の一例としての障害処理システムにおける再現スクリプトイメージを例示する図である。実施形態の一例としての障害処理システムにおける再現スクリプトを例示する図である。実施形態の一例としての障害処理システムにおける障害調査部によるトレースレベルの自動設定手法を説明するための図である。実施形態の一例としての障害処理システムのテストプログラムをテストプログラムリストとして例示する図である。実施形態の一例としての障害処理システムにおける処理を説明するためのフローチャートである。

１障害処理システム
１０管理サーバ
１１記憶装置
２０顧客システム（情報処理装置）
２１障害情報作成部
２２格納処理部
２３位置情報格納処理部
２４障害発生部品
３０障害再現システム（再現装置，障害処理装置）
３１格納位置情報取得部
３２障害情報取得部
３３障害調査部
３４構成制御部
３５スクリプト作成部
３６スクリプト実行部
３７テストプログラム取得部
３８記憶装置（スクリプト格納部，テストプログラム格納部）
４２テストプログラム実行部
５１，５２ネットワーク
２０１，２０１−１〜２０１−３，２０１−５，３０１，３０１−０〜３０１−７ＣＰＵ
２０３，２０３−０〜２０３−２，３０３，３０３−０〜３０３−３ＳＢ
２０４，３０４ＳＰ
２０５，２０５−０〜２０５−１５，２０５−２０，２０５−２１，３０５，３０５−０〜３０５−３１ＤＩＭＭ
２４１ＥＥＰＲＯＭ（記憶部）
２０４１，３０４１ストレージ
２０４２，３０４２構成情報格納領域
２０４３，３０４３設定情報格納領域
２０４４，３０４４ログ情報格納領域
Ｔ１構成情報テーブル

以下、図面を参照して本発明の実施の形態を説明する。
図１は実施形態の一例としての障害処理システム１の機能構成を模式的に示す図、図２はその顧客システム２０のハードウェア構成を例示する図である。
障害処理システム１は、情報処理装置において発生する障害を処理する。本実施形態の一例においては、例えば、メーカーが提供する情報処理装置（顧客システム２０）を顧客（ユーザ）が使用し、この顧客システム２０において生じた障害を処理する例について説明する。

本障害処理システム１は、図１に示すように、顧客システム２０，管理サーバ１０及び障害再現システム３０をそなえている。
なお、本障害処理システム１においては、１以上の顧客システム２０が接続されるが、本実施形態においては、便宜上、１つの顧客システム２０についてのみ図示して説明するものとする。

管理サーバ１０は、サーバ機能をそなえたサーバコンピュータであり、顧客システム２０とネットワーク５１を介して通信可能に接続されている。この管理サーバ１０は、例えば、顧客からの問い合わせに対応するサポートセンター等にそなえられる。
この管理サーバ１０は、記憶装置１１をそなえ、後述する顧客システム２０から、ネットワーク５１を介して送信される障害情報（後述）を、この記憶装置１１における所定の領域に格納する。この記憶装置１１は例えば、ＨＤＤ（Hard Disk Drive）等の大容量の記憶装置であり、多くの障害情報を格納・蓄積することができる。

また、管理サーバ１０は、記憶装置１１に障害情報を格納する際に、この障害情報の格納先を示す格納位置情報を、この障害情報を生成した顧客システム２０に対して通知する。
格納位置情報は、例えば、管理サーバ１０のＩＰアドレスやディレクトリ情報等のデータの格納位置を示す情報であり、本障害処理システム１においては、この格納位置情報を用いることにより、記憶装置１１に格納された特定の障害情報にアクセスすることができる。なお、格納位置情報としては、これらのＩＰアドレスやディレクトリ情報に限定されるものではなく、ネットワーク上の特定のデータにアクセスするために用いられる既知の種々の手法を用いてもよい。

また、管理サーバ１０は、ネットワーク５２を介して障害再現システム３０とも通信可能に接続されている。管理サーバ１０は、後述する障害再現システム３０の障害情報取得部３２が、格納位置情報を参照して障害情報にアクセスしてきた場合に、この障害再現システム３０に対して障害情報を受け渡す（送信する）。
なお、この管理サーバ１０は既知のコンピュータシステムにより構成することができ、その構成の詳細な説明は省略する。

顧客システム２０は、顧客が使用する情報処理装置であり、何らかの障害（故障）が発生しうる部品をそなえるとともに、前述した管理サーバ１０とネットワーク５１を介してデータを授受するための通信機能（図示省略）をそなえている。
また、本実施形態においては、顧客システム２０が、サーバコンピュータシステム等の情報処理装置である例について説明するものとする。

図２に示す例においては、顧客システム２０は、ＳＢ（System Board）２０３−０〜２０３−２やＳＰ２０４、図示しないチップセット等のハードウェアエレメント等をそなえる。そして、ＳＢ２０３−０〜２０３−２やチップセット等のハードウェアエレメントが本体系装置を形成する。
ＳＢ２０３−０には、ＣＰＵ（Central Processing Unit）２０１−０，２０１−１，メモリ２０５−０〜２０５−７がそなえられている。又、ＳＢ２０３−１には、ＣＰＵ２０１−２，２０１−３，メモリ２０５−８〜２０５−１５がそなえられている。同様に、ＳＢ２０３−２には、ＣＰＵ２０１−５及びメモリ２０５−２０，２０５−２１がそなえられている。

メモリ２０５−０〜２０５−１５，２０５−２０，２０５−２１は、種々のデータやプログラムを一時的に格納する記憶領域であって、その一例として、ＤＩＭＭ（Dual Inline Memory Module）が用いられる。本実施形態においては、メモリ２０５−０〜２０５−１５，２０５−２０，２０５−２１としてＤＩＭＭを用いる例について示すものとし、以下、メモリ２０５−０〜２０５−１５，２０５−２０，２０５−２１をＤＩＭＭ２０５−０〜２０５−１５，２０５−２０，２０５−２１と表す。又、以下ＤＩＭＭを示す符号としては、複数のＤＩＭＭのうち１つを特定する必要があるときには符号２０５−０〜２０５−１５，２０５−２０，２０５−２１を用いるが、任意のＤＩＭＭを指すときには符号２０５を用いる場合がある。

同様に、以下、ＳＢを示す符号としては、複数のＳＢのうち１つを特定する必要があるときには符号２０３−０〜２０３−２を用いるが、任意のＳＢを指すときには符号２０３を用いる場合もある。又、以下、ＣＰＵを示す符号としては、複数のＣＰＵのうち１つを特定する必要があるときには符号２０１−０〜２０１−７を用いるが、任意のＣＰＵを指すときには符号２０１を用いる場合がある。

また、以下、ＳＢ２０３−０〜２０３−２をそれぞれ、ＳＢに各符号の“−(ハイフン)”以下の数字（構成番号という場合がある）を付すことにより簡略して表す場合がある。例えば、ＳＢ２０３−０をＳＢ０と表す場合があり、同様に、以下、ＳＢ２０３−１をＳＢ１と表す場合がある。
本体系装置において、ＣＰＵ２０１は種々の制御や演算を行なう処理装置であり、図示しないＲＯＭ（Read Only Memory）等に格納されたプログラムを実行することにより、顧客システム２０における種々の機能を実現する。

なお、以下、ＣＰＵ２０１−０〜２０１−３，２０１−５を、ＣＰＵの後ろに、それぞれ“−”以下の構成番号を付すことにより簡略して表す場合がある。例えば、ＣＰＵ２０１−０をＣＰＵ０と表す。
なお、以下、ＤＩＭＭ２０５−０〜２０５−１５，２０５−２０，２０５−２１についても、ＤＩＭＭの後ろに、それぞれ“−”以下の構成番号を付すことにより簡略して表す場合がある。例えば、ＤＩＭＭ２０５−０をＤＩＭＭ０と表す。

また、顧客システム２０においては、上述した複数のハードウェアエレメントを分割もしくは組み合わせることにより、１以上の独立したドメイン（Domain）を形成するパーティショニング機能をそなえている。そして、このように形成したドメインにおいて、ＯＳ（Operating System）やアプリケーションを動作させることができる。なお、このパーティショニング機能は既知の手法により実現できるものであり、便宜上、その詳細な説明は省略する。

図２に示す例においては、パーティショニング機能により、ＳＢ０上のＣＰＵ０，１及びＤＩＭＭ０〜７とＳＢ１上のＣＰＵ２及びＤＩＭＭ８〜１１とで一つのドメイン（Dom#0）が設定されている。同様に、ＳＢ１上のＣＰＵ３及びＤＩＭＭ１２〜１５で一つのドメイン（Dom#1）が設定されており、ＳＢ２上のＣＰＵ５及びＤＩＭＭ２０，２１で一つのドメイン（Dom#2）が設定されている。

また、顧客システム２０において、上述したＣＰＵ２０１やＤＩＭＭ２０５、図示しない他の電子部品のそれぞれが、何らかの障害が生じうるものであり、これらのＣＰＵ２０１やＤＩＭＭ２０５、他の電子部品をハードウェアエレメント（ハードウェア構成要素）という。
また、顧客システム２０において、これらのＣＰＵ２０１やＤＩＭＭ２０５、他の電子部品のそれぞれにはメモリ（記憶部）２４１がそなえられている。各メモリ２４１は、電力供給がされていない状態でも格納されたデータを保持可能なデータ記憶装置であり、例えば、数ＫＢの記憶容量をそなえている。

メモリ２４１は、既知の種々の手法を用いて実現することができ、例えば、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）やバッテリバックアップされたメモリを用いることができる。
本実施形態においては、このメモリ２４１の一例としてＥＥＰＲＯＭを用いて説明するものとし、以下、メモリ２４１をＥＥＰＲＯＭ２４１と表す。

そして、顧客システム２０におけるＣＰＵ２０１やＤＩＭＭ２０５、他の電子部品のうち、何らかの障害が発生したハードウェアエレメントのことを障害発生部品２４という。なお、本実施形態においては、顧客システム２０から脱着可能なハードウェアエレメントが障害発生部品２４である例について説明する。
ＳＰ２０４は、本体系装置の制御及び保守を行なう。このＳＰ２０４は、ＣＰＵ２０１やＤＩＭＭ２０５に接続され、これらの動作の制御や監視を行なう。又、ＳＰ２０４は、図示しないディスプレイ上にこれらの各部の動作状態を表示する制御や、障害等の情報の収集も行なう。

また、ＳＰ２０４は、ストレージ２０４１をそなえている。このストレージ２０４１は、ハードディスクドライブ、ＳＳＤ（Solid State Drive）等の記憶装置であって、種々のデータを格納するものである。
ストレージ２０４１には、図２に示すように、構成情報格納領域２０４２，設定情報格納領域２０４３及びログ情報格納領域２０４４がそなえられている。これらの構成情報格納領域２０４２，設定情報格納領域２０４３及びログ情報格納領域２０４４は、それぞれデータを格納可能な記憶領域であり、それぞれ数十ＭＢ程度の記憶容量をそなえる。

構成情報格納領域２０４２は構成情報を格納する。この構成情報は、顧客システム２０におけるハードウェア構成及びソフトウェア構成を表す情報であり、ハードウェア構成を示すハードウェア構成情報とソフトウェア構成を示すソフトウェア構成情報とをそなえる。
ハードウェア構成情報は、例えば、顧客システム２０にそなえられている各ハードウェアエレメントを特定する情報や数である。又、ソフトウェア構成情報は、例えば、ＯＳの版数情報，ファームウェアの版数情報、ドメインの設定状態や構成を表す情報（ドメイン構成情報）である。

すなわち、構成情報には、顧客システム２０のハードウェア構成を示すハードウェア構成情報や、顧客システム２０のソフトウェア設定状態を示すソフトウェア設定情報が含まれている。
図３、図４は実施形態の一例としての障害処理システム１における構成情報の例を示す図であり、図３はそのハードウェア構成情報の例を示す図、図４はそのソフトウェア構成情報の例を示す図である。

図３に示すハードウェア構成情報は、ハードウェアエレメント（部品）に対して、搭載情報を関連付けて構成されている。具体的には、図２に示す顧客システム２０のハードウェア構成として、搭載されているＣＰＵ，ＳＢ及びＤＩＭＭ（メモリ）の各構成番号を示している。
また、図４に示すソフトウェア構成情報は、各ドメインに対して、含まれるハードウェアエレメントの構成番号を対応付けて構成されている。具体的には、図２に示す顧客システム２０のドメイン構成を表すドメイン構成情報を示しており、各ドメインに対して、そのドメインに含まれるＣＰＵ２０１，ＳＢ２０３及びＤＩＭＭ２０５の各構成番号を対応付けている。

設定情報格納領域２０４３は設定情報を格納する。この設定情報は、顧客システム２０における各種設定値であり、例えば、ＯＳの設定情報や各ハードウェアエレメントの設定情報（設定値等），ＳＰ２０４の設定情報（設定値）である。
ログ情報格納領域２０４４はログ情報を格納する。このログ情報は、顧客システム２０における各種ログ（履歴情報）であり、例えば、顧客システム２０において所定期間に行なわれた各種操作や処理のログや障害ログである。操作ログには、顧客システム２０においてオペレータが行なったオペレーション内容の他、ＳＰ２０４において行なわれた各種処理の情報が含まれる。すなわち、ログ情報には、顧客システム２０において障害発生前に行なわれた処理に関する処理履歴情報が含まれている。

図５は実施形態の一例としての障害処理システム１におけるログ情報の例を示す図である。この図５に示す例においては、ログ情報（オペレーションログ）として、顧客システム２０の起動時にドメインに関して行なわれた処理が、その処理が実行された日時と関連付けられている。
なお、本実施形態においては、ストレージ２０４１に構成情報格納領域２０４２，設定情報格納領域２０４３及びログ情報格納領域２０４４が形成された例を示しているが、これに限定されるものではない。例えば、構成情報格納領域２０４２，設定情報格納領域２０４３及びログ情報格納領域２０４４の一部を他のストレージ装置にそなえてもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。

図６は実施形態の一例としての障害処理システム１における障害ログの例を示す図である。この図６に示す例においては、障害ログには被疑部品，発生事象及び時刻が含まれる。又、この図６に示す例においては、ＣＰＵ２０１のキャッシュ異常が発生した場合に生成される障害ログを示している。
被疑部品は、障害が発生したと判断される部品（障害発生箇所）を特定する情報であり、図６に示す例においては、ＣＰＵ０において障害が発生していることを示す。発生事象は、障害の内容を示す情報である。この図３に示す例においては、ＣＰＵ０のキャッシュメモリにおいて、訂正不能なデータエラーが発生したことを示している。時刻はその障害が発生した日時を示す。

また、ＳＰ２０４は、図示しないプロセッサ及びＲＯＭをそなえ、プロセッサがＲＯＭに格納されているプログラムを実行することにより、図１に示すような障害情報作成部２１，格納処理部２２及び位置情報格納処理部２３として機能する。
なお、これら障害情報作成部２１，格納処理部２２及び位置情報格納処理部２３としての機能を実現するためのプログラムは、例えばフレキシブルディスク，ＣＤ（ＣＤ−ＲＯＭ，ＣＤ−Ｒ，ＣＤ−ＲＷ等），ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−ＲＡＭ，ＤＶＤ−Ｒ，ＤＶＤ＋Ｒ，ＤＶＤ−ＲＷ，ＤＶＤ＋ＲＷ，ＨＤＤＶＤ等），ブルーレイディスク，磁気ディスク，光ディスク，光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク，光ディスク，光磁気ディスク等の記憶装置（記録媒体）に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。

障害情報作成部２１，格納処理部２２及び位置情報格納処理部２３としての機能を実現する際には、内部記憶装置（本実施形態ではＳＰ２０４のＲＡＭやＲＯＭ）に格納されたプログラムがコンピュータのマイクロプロセッサ（本実施形態ではＳＰ２０４のＣＰＵ）によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。

障害情報作成部２１は、顧客システム２０における障害発生時に、その障害に関する障害情報を生成する。具体的には、障害情報作成部２１は、上述した構成情報，設定情報及びログ情報を障害情報として作成する。
なお、これらの構成情報，設定情報及びログ情報は、それぞれ既知の手法により作成することができ、その収集方法や作成方法についての詳細な説明についても省略する。

格納処理部２２は、障害情報生成部２１が生成した障害情報を管理サーバ１０の記憶装置１１に格納するための制御を行なう。この格納処理部２２は、障害情報生成部２１によって作成された障害情報をネットワーク５１を介して管理サーバ１０に送信し、この管理サーバ１０に対して、記憶装置１１における所定の領域に格納させる。又、格納処理部２２は、管理サーバ１０の記憶装置１１における障害情報の格納位置を表す格納位置情報を位置情報格納処理部２３に通知する。

なお、記憶装置１１における障害情報の格納先は、例えば、予め所定の領域を決めて格納処理部２２に設定しておき、この格納処理部２２から管理サーバ１０に対して、その所定の格納先に障害情報格納させるよう指示してもよい。又、管理サーバ１０が、格納処理部２２から送信された障害情報を記憶装置１１における任意の領域に格納し、管理サーバ１０がその格納位置をネットワーク５１を介して格納処理部２２に通知してもよい。

位置情報格納処理部２３は、記憶装置１１における障害情報の格納位置を表す格納位置情報を、障害発生部品２４のＥＥＰＲＯＭ２４１に格納する。具体的には、格納処理部２２から通知された、もしくは予め設定された格納位置情報をＵＲＬに変換し、この作成したＵＲＬを格納位置情報として障害発生部品２４のＥＥＰＲＯＭ２４１に格納する。
図７は実施形態の一例としての障害処理システム１における格納処理部２２及び位置情報格納処理部２３による処理を例示する図である。この図７に示す例においては、格納処理部２２は、アドレス（ＩＰアドレス）が192.168.11.2である管理サーバ１０においてディレクトリ“/log/incident-uuid”として特定される位置に、障害情報を格納している。

ここで、uuidは事象（障害）を特定するユニークな識別情報（ＩＤ）であり、例えば、装置のシリアル番号や故障が発生した部品種別、部品シリアル番号、事象が発生した時刻等の情報を組み合わせることにより生成する。これにより、複数台のシステムで複数の障害が発生した場合においても、事象と障害情報とを一意に関連付けることが可能となる。
また、uuidの生成には、上述した情報の一部だけを用いてもよく、又、これら以外の情報を用いてもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。

位置情報格納処理部２３は、格納位置情報として障害情報を格納した管理サーバ１０のＵＲＬを障害発生部品２４のＥＥＰＲＯＭ２４１に書き込む。これにより障害発生部品２４と管理サーバ１０に格納した障害情報との関連付けを行なう。
また、この際、位置情報格納処理部２３は、管理サーバ１０に格納した障害情報へアクセスするためのアドレス情報と事象を一意に識別する情報（uuid）とを含むＵＲＬを生成して、ＥＥＰＲＯＭ２４１に書き込む。

図７に示す例においては、位置情報格納処理部２３は、ＵＲＬ“http://192.168.11.2/log/incident-uuid.tar.gz”を格納位置情報として生成し、ＥＥＰＲＯＭ２４１に格納する。
ＥＥＰＲＯＭ２４１に格納位置情報が格納された障害発生部品２４は、何らかの移送手段により、障害再現システム３０がそなえられた工場等に配送される。

図８は実施形態の一例としての障害処理システム１の障害再現システム３０のハードウェア構成を例示する図、図９はその障害再現システム３０の機能構成を模式的に示す図である。
障害再現システム３０は、顧客システム２０において生じた障害の再現試験を行なう情報処理装置（再現装置，障害処理装置）である。再現試験は、顧客システム２０において生じた障害を再現して調査することにより、障害の原因を特定し、復旧方法や回避方法を見つけ出す。

この障害再現システム３０は、顧客システム２０と同じ機種の情報処理装置であって、その情報処理装置に物理的に搭載可能な全てのハードウェアエレメントをそなえている。すなわち、障害再現システム３０においては、例えば、ハードウェアエレメントを取り付け可能な、全てのスロットに物理的に部品が搭載された、いわゆる最大構成となっている。つまり、顧客システム２０と同等もしくはそれ以上のハードウェア部品を搭載している。

図５に示す例においては、障害再現システム３０は、ＳＢ３０３−０〜３０３−３及びＳＰ３０４をそなえ、これらのＳＢ３０３−０〜３０３−３や、図示しないチップセット等のハードウェアエレメントが本体系装置を形成する。又、障害再現システム３０は、ＳＰ３０４をそなえている。
また、ＳＢ０には、ＣＰＵ３０１−０，３０１−１，ＤＩＭＭ３０５−０〜３０５−７がそなえられている。又、ＳＢ１には、ＣＰＵ３０１−２，３０１−３，ＤＩＭＭ３０５−８〜３０５−１５がそなえられている。同様に、ＳＢ２には、ＣＰＵ３０１−４，３０１−５，ＤＩＭＭ３０５−１６〜３０５−２３が、又、ＳＢ３には、ＣＰＵ３０１−６，３０１−７，ＤＩＭＭ３０５−２４〜３０５−３１がそなえられている。

すなわち、図５に示す例においては、障害再現システム３０は、ＳＢ３０３×４，ＣＰＵ３０１×８，ＤＩＭＭ３０５×３２として構成されている。
なお、以下、ＳＢ３０３−０〜３０３−７をそれぞれ、ＳＢに各符号の“−(ハイフン)”以下の数字（構成番号）を付すことにより、簡略して表す場合がある。例えば、ＳＢ３０３−０をＳＢ０といい、同様に、以下、ＳＢ３０３−１をＳＢ１という場合がある。

同様に、ＣＰＵ３０１−０〜３０１−７やＤＩＭＭ３０５−０〜３０５−３１についても、ＣＰＵやＤＩＭＭの後ろに、それぞれ“−”以下の構成番号を付すことにより簡略して表す場合がある。例えば、ＣＰＵ３０１−０をＣＰＵ０と、又、ＤＩＭＭ３０５−０をＤＩＭＭ０と表す場合がある。
また、以下、ＳＢを示す符号としては、複数のＳＢのうち１つを特定する必要があるときには符号３０３−０〜３０３−３を用いるが、任意のＳＢを指すときには符号３０３を用いる。

同様に、以下、ＣＰＵを示す符号としては、複数のＣＰＵのうち１つを特定する必要があるときには符号３０１−０〜３０１−７を用いるが、任意のＣＰＵを指すときには符号３０１を用いる。同様に、以下ＤＩＭＭを示す符号としては、複数のＤＩＭＭのうち１つを特定する必要があるときには符号３０５−０〜３０５−３１を用いるが、任意のＤＩＭＭを指すときには符号３０５を用いる。

また、この障害再現システム３０における各ＣＰＵ３０１は顧客システム２０にそなえられたＣＰＵ２０１と同じもしくはほぼ同じものである。又、この障害再現システム３０における各ＤＩＭＭ３０５は顧客システム２０にそなえられたＤＩＭＭ２０５と同じもしくはほぼ同じものである。
また、障害再現システム３０においても、上述した複数のハードウェアエレメントを分割もしくは組み合わせることにより、１以上の独立したドメインを形成するパーティショニング機能をそなえている。そして、このように形成したドメインにおいて、ＯＳやアプリケーションを動作させることができる。

本体系装置において、ＣＰＵ３０１−０〜３０１−７は、それぞれ種々の制御や演算を行なう処理装置であり、ＲＯＭ（図示省略）等に格納されたプログラムを実行することにより、障害再現システム３０における種々の機能を実現する。
記憶装置３８は、ハードディスクドライブ、ＳＳＤ等の記憶装置であって、種々のデータを格納するものである。そして、この記憶装置３８が、後述するスクリプトを格納するスクリプト格納部として機能するとともに、同じく後述するテストプログラムを格納するテストプログラム格納部として機能する。

ＤＩＭＭ３０５は、種々のデータやプログラムを一時的に格納する主記憶装置であって、ＣＰＵ３０１がプログラムを実行する際に、データやプログラムを一時的に格納・展開して用いる。
また、ＣＰＵ３０１は、ＲＯＭや記憶装置３８に格納されたプログラムを実行することにより、後述するテストプログラム実行部４２として機能する。

ＳＰ３０４は、本体系装置の制御及び保守を行なう。このＳＰ3０４は、ＣＰＵ３０１やＤＩＭＭ３０５に接続され、これらの動作の制御や監視を行なう。又、ＳＰ３０４は、図示しないディスプレイ上にこれらの各部の動作状態を表示したり、障害等の情報を収集する。
また、ＳＰ3０４は、図示しないプロセッサをそなえ、このプロセッサが同じく図示しないＲＯＭや記憶装置３８等に格納された障害処理プログラムを実行することにより、図１や図９に示すような、格納位置情報取得部３１，障害情報取得部３２，障害調査部３３，構成制御部３４，スクリプト作成部３５，スクリプト実行部３６，テストプログラム取得部３７及びハードウェアエレメント特定部４１としての機能をそなえる。

なお、これらの格納位置情報取得部３１，障害情報取得部３２，障害調査部３３，構成制御部３４，スクリプト作成部３５，スクリプト実行部３６，テストプログラム取得部３７及びハードウェアエレメント特定部４１としての機能を実現するためのプログラム（障害処理プログラム）は、例えばフレキシブルディスク，ＣＤ（ＣＤ−ＲＯＭ，ＣＤ−Ｒ，ＣＤ−ＲＷ等），ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−ＲＡＭ，ＤＶＤ−Ｒ，ＤＶＤ＋Ｒ，ＤＶＤ−ＲＷ，ＤＶＤ＋ＲＷ等），磁気ディスク，光ディスク，光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク，光ディスク，光磁気ディスク等の記憶装置（記録媒体）に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。

格納位置情報取得部３１，障害情報取得部３２，障害調査部３３，構成制御部３４，スクリプト作成部３５，スクリプト実行部３６，テストプログラム取得部３７及びハードウェアエレメント特定部４１としての機能を実現する際には、内部記憶装置（本実施形態ではＳＰ３０４のＲＡＭやＲＯＭ）に格納されたプログラムがコンピュータのマイクロプロセッサ（本実施形態ではＳＰ３０４のＣＰＵ）によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。

そして、この障害再現システム３０においては、顧客システム２０から取り外され発送されてきた障害発生部品２４が、既に障害再現システム３０に搭載されている対応する部品に換えて取り付けられる。
すなわち、例えば、障害発生部品２４が顧客システム２０のＣＰＵ０（ＣＰＵ２０１−０）であった場合には、障害再現システム３０におけるＣＰＵ０（３０１−０）が取り外され、障害再現システム３０において、ＣＰＵ３０１−０に代えて障害発生部品２４であるＣＰＵ２０１−０が取り付けられる。

そして、これにより、障害発生部品２４のＥＥＰＲＯＭ２４１に格納された格納位置情報を障害再現システム３０から参照することができるようになる。
格納位置情報取得部３１は、障害発生部品２４のＥＥＰＲＯＭ２４１から、障害発生時に顧客システム２０によって生成された格納位置情報を取得する。この格納位置情報取得部３１は、顧客システム２０から取り外されて配送され、障害再現システム３０のハードウェアエレメントに換えて取り付けられた障害発生部品２４から格納位置情報を取得する。例えば、格納位置情報を、予め規定された特定のファイル名でＥＥＰＲＯＭ２４１に格納したり、又、ＥＥＰＲＯＭ２４１における予め規定された特定のアドレスに格納することにより、格納位置情報取得部３１は容易且つ確実に格納位置情報を取得することができる。

障害情報取得部３２は、格納位置情報取得部３１によって取得された格納位置情報に基づいて、管理サーバ１０の記憶装置１１から障害情報を取得する。
障害情報取得部３２は、障害情報の格納位置を示すＵＲＬを記録する障害発生部品２４が搭載されたことを認識すると、そのＥＥＰＲＯＭ２４１からＵＲＬを取得し、この取得したＵＲＬにより、管理サーバ１０に格納された障害情報にアクセスする。障害情報取得部３２は、管理サーバ１０から障害情報を取得（ダウンロード）し、ＳＰ３０４のメモリ（図示省略）上に展開する。

例えばＵＲＬがhttpのアドレスになっている場合、障害情報取得部３２は、httpのプロトコルを使いてＵＲＬのアドレスにアクセスする。障害情報取得部３２はアドレス先にある情報をＳＰ３０４がそなえるストレージ装置３０４１上に保存する。
図１０は実施形態の一例としての障害処理システム１における障害情報取得部３２による処理を例示する図である。

この図１０に示す例においては、障害情報取得部３２は、ＥＥＰＲＯＭ２４１から取得したＵＲＬ“http//192.168.11.2/log/incident-uuid.tar.gz”により、ネットワーク５２を介して管理サーバ１０にアクセスし、障害情報を取得する。又、取得した障害情報はストレージ３０４１に格納する。

ストレージ３０４１には構成情報格納領域３０４２，設定情報格納領域３０４３及びログ情報格納領域３０４４がそなえられている。ストレージ３０４１は、ハードディスクドライブ、ＳＳＤ等の記憶装置であって、種々のデータを格納するものである。
構成情報格納領域３０４２，設定情報格納領域３０４３及びログ情報格納領域３０４４は、それぞれデータを格納可能な記憶領域であり、例えば、それぞれ数十ＭＢ程度の記憶容量をそなえる。

そして、構成情報格納領域３０４２には、取得された障害情報の構成情報が格納される。同様に、設定情報格納領域３０４３には、取得された障害情報の設定情報が格納され、ログ情報格納領域３０４４には、取得された障害情報のログ情報が格納される。
構成制御部３４は、障害情報取得部３２によって取得した障害情報（構成情報，設定情報）に基づいて、顧客システム２０に合わせて障害再現システム３０のハードウェア構成及びソフトウェア構成のそれぞれについて構成変更を行なう。すなわち、構成制御部３４は、取得した障害情報を参照して、障害再現システム３０において、障害発生時の顧客システム２０にできるだけ近い環境を自動的に作り出す。

構成制御部３４は、障害情報に含まれる構成情報のうちハードウェア構成情報に基づいて、障害再現システム３０のハードウェア構成を顧客システム２０のハードウェア構成に合わせて変更する処理を行なう。
構成制御部３４は、障害情報に含まれる構成情報を参照して顧客システム２０のハードウェア構成を取得する。構成制御部３４は、顧客システム２０の構成情報を参照して、例えば、ＣＰＵやＳＢ，ＤＩＭＭの構成情報を取得する。

また、構成制御部３４は、障害再現システム３０のハードウェア構成を取得する。なお、障害再現システム３０の構成は、ハードウェア構成及びソフトウェア構成のそれぞれについて、予め用意しておくことが望ましいが、現在の構成を逐次採取してもよい。
そして、構成制御部３４は、顧客システム２０のハードウェア構成と障害再現システム３０のハードウェア構成との比較を行ない、これらの差異を確認する。

この比較の結果、障害再現システム３０に顧客システム２０にはないハードウェアエレメント（余剰ハードウェアエレメント）がそなえられている場合には、これらの余剰ハードウェアエレメントを論理的に未実装状態として扱う。
例えば、図２に示す顧客システム２０には、ＳＢ２のＣＰＵ４やＤＩＭＭ１６〜１９，２２，２３，ＳＢ３がそなえられてない点において、図８に示す障害再現システム３０とハードウェア構成が異なっている。

このような場合に、構成制御部３４は、障害再現システム３０におけるＳＢ２のＣＰＵ４，ＤＩＭＭ１６〜１９，２２，２３及びＳＢ３を未実装状態として扱うことにより、障害再現システム３０のハードウェア構成を顧客システム２０のハードウェアに一致させる。
すなわち、構成制御部３４は、障害再現システム３０にそなえられるハードウェアエレメントのうち、顧客システム２０の構成に含まれないハードウェアエレメント（余剰ハードウェアエレメント）を非使用状態にすることにより、障害再現システム３０のハードウェア構成を顧客システム２０のハードウェア構成に合わせる。

ここで、障害再現システム３０の余剰ハードウェアエレメントを未実装状態にする手法について説明する。
構成制御部３４は、構成に応じて各ハードウェアエレメント（部品）をシステムに組み込んだり、縮退したりする機能（以下、単に縮退機能という）をそなえており、各ハードウェアエレメントは縮退することにより論理的には搭載されていないものとみなされる。そして、構成制御部３４は、この縮退機能を用いて、障害再現システム３０の余剰ハードウェアエレメントを論理的に未実装状態に見せる。

縮退機能は、例えば、図１１に示すようなハードウェアの構成を管理する構成情報テーブルＴ１を用いて実現する。
図１１は実施形態の一例としての障害処理システム１における構成情報テーブルＴ１の例を示す図、図１２は実施形態の一例としての障害処理システム１において障害再現システム３０の一部のハードウェアエレメントを未実装状態にした例を示す図である。

構成情報テーブルＴ１は、障害再現システム３０にそなえられている各ハードウェアエレメントのそれぞれに対して、実装状態（ＯＫ）もしくは非実装状態（ＮＧ）を表す情報を関係付けることにより構成されている。
そして、この構成情報テーブルＴ１において、ＯＫが設定されているハードウェアエレメントが実装状態として取り扱われる。又、この構成管理テーブルＴ１においてＮＧが設定されているハードウェアエレメントは、未実装状態として取り扱われ、図１２に示すように、障害再現システム３０において認識されず、非搭載状態となる。

構成制御部３４は、この縮退機能を用いて障害再現システム３０のハードウェア構成を変更する。つまり、構成制御部３４は、顧客システム２０で未実装であるハードウェアエレメントを、障害再現システム３０上では、その構成情報テーブルＴ１上で縮退状態(NG)と設定することで論理的に切り離すのである。
なお、障害再現システム３０にそなえられていないハードウェアが顧客システム２０にそなえられていることが判明した場合には、構成制御部３４は、表示装置（図示省略）等にその旨のメッセージを表示させる等の手法により、オペレータ（試験担当者）に対して通知する。

例えば、周辺機器のように機能拡張のために追加で装備された部品等、再現試験に支障のあるハードウェアが顧客システム２０にそなえられている場合である。オペレータは、必要に応じて、かかるハードウェアを調達し、障害再現システム３０に搭載する。
また、構成制御部３４は、障害情報に含まれる構成情報のうちソフトウェア構成情報に基づいて、障害再現システム３０のソフトウェア構成を顧客システム２０と同様の状態に設定する。

図１３は実施形態の一例としての障害処理システム１において障害再現システム３０に顧客システム２０と同様のドメイン構成を設定した例を示す図である。
構成制御部３４は、例えば、顧客システム２０障害情報に含まれる構成情報からドメイン構成情報を参照し、図１３に示すように、障害再現システム３０のドメイン構成を顧客システム２０のドメイン構成と同様に構成する。なお、ドメイン構成は既知のドメイン構成手順を用いることにより変更することができ、その詳細な説明は省略する。

また、構成制御部３４は、顧客システム２０の障害情報に含まれる構成情報から、顧客システム２０にインストールされていたソフトウェアの種類やその版数情報を読み取り、この同版数のソフトウェアを障害再現システム３０にインストールする。これにより、構成制御部３４は、障害再現システム３０のソフトウェア構成を顧客システム２０に一致させる。

例えば、顧客システム２０と障害再現システム３０とで、インストールされているソフトウェアの版数に差異がある場合は、構成制御部３４は、それにあった版数のイメージ（ディスクイメージ）を取得し、障害再現システム３０に設定する。
このため、管理サーバ１０や図示しないアプリケーションサーバ，記憶装置３８等（以下、管理サーバ１０等という）に、想定される種々のソフトウェアについて、新旧の全ての版数のソフトウェアのイメージを予め格納しておくことが望ましい。

そして、構成制御部３４は、これらの記憶装置３８やアプリケーションサーバから、必要な版数のソフトウェアのイメージをコピーやダウンロード等の手段により取得し、障害再現システム３０に設定する。
なお、障害再現システム３０のソフトウェア構成の設定に際して、構成制御部３４は、管理サーバ１０等からソフトウェア（含むＯＳ）のインストーラを取得し、このインストーラを用いてインストールを行なってもよい。

この場合、障害再現システム３０にインストールするソフトウェアが複数ある場合において、ソフトウェアを所定の順序でインストールしなければならない等、特定のルールがある場合がある。このような場合には、管理サーバ１０等に、顧客システム２０を特定する情報とともに、インストール手順等のルールを明確化したルール情報を格納しておくことが望ましい。構成制御部３４は、ソフトウェアを障害再現システム３０にインストールするに際して、ルール情報の有無を確認し、ルール情報が存在する場合には、このルール情報に従ってインストールを行なう。

また、構成制御部３４は、ＳＰ３０４のファームについても同様に、顧客システム２０と一致するファームを障害再現システム３０に設定する。構成制御部３４は、例えば、管理サーバ１０等から顧客システム２０のＳＰ２０４のファームウェアと同じ版数のファームを取得し、この取得したファームウェアを自身に対して適用することにより、ファームウェアのアップデートを行なう。

スクリプト作成部３５は、障害情報のログ情報に基づいて、顧客システム２０における障害発生時に行なわれた処理を再現する再現スクリプトを作成する。
図１４は実施形態の一例としての障害処理システム１における再現スクリプトイメージを例示する図、図１５はその再現スクリプトを例示する図である。なお、図１５に例示する再現スクリプトは、図５に示すログ情報に基づいて作成されたものであり、この再現スクリプトの作成過程において図１４に例示する再現スクリプトイメージが作成される。

スクリプト作成部３５は、ログ情報（例えば、図５参照）に含まれる処理内容から実行されているコマンドを抽出する。又、スクリプト作成部３５は、図１４に示すように、ログ情報における各コマンドの実行時刻を、最初のコマンドが実行された時刻（図５に示す例では2009/06/29 13:33:22）からの経過時間に換算して、再現スクリプトイメージを作成する。

そして、スクリプト作成部３５は、再現スクリプトイメージに記載されている各処理を所定のプログラム言語の規則（文法）に従って書き換えることにより、再現スクリプト（シェルスクリプト）を作成する。この際、各処理の間に、各処理に対応する経過時間だけ実行を遅延させるコマンドを挿入する。図１５に示す例では、コマンド“sleep”がこの遅延コマンドに相当する。

これらの遅延コマンドにより、再現スクリプトの実行時に、ログ情報に含まれる複数の処理が実行されたタイミングと同じタイミングで、ログ情報に含まれる各処理がそれぞれ実行される。
このように、スクリプト作成部３５は、ログ情報に含まれる複数の処理の実行履歴を、各処理がそれぞれ実行された経過時間と同じタイミングで再現するスクリプト（再現スクリプト）を作成する。作成された再現スクリプトは、例えば、記憶装置３８等に格納される。

障害再現システム３０において、後述するスクリプト実行部３６が、作成された再現スクリプト（例えば、図１５参照）を実行することにより、顧客システム２０において障害が発生した際に実行された複数の処理を、それらの処理が実行されたと同じタイミングで再現することができる。これにより、障害再現システム３０における障害の再現度を向上させることができる。

スクリプト実行部３６は、スクリプト作成部３５によって作成された再現スクリプトを実行する。すなわち、生成された再現スクリプトがＳＰ３０４上で実行される。これにより、障害再現システム３０において再現試験が実現される。
障害調査部３３は、障害情報の障害ログ（被疑箇所特定情報：例えば、図６参照）を参照し、この障害ログに基づいて被疑箇所に相当するハードウェアエレメント（被疑部品）を特定する。例えば、図６に示す障害ログにおいては被疑部品がＣＰＵ０であることがわかる。

また、障害調査部３３は、障害再現システム３０においてトレース情報の収集を行なう。トレース情報は、障害調査情報であり、例えば、特定のハードウェアエレメントについての処理に関して収集されるログ情報である。障害調査部３３は、スクリプト実行部３６による再現スクリプトの実行中に、このトレース情報の収集を行なう。なお、トレース情報の収集手法は既知の種々の手法を用いて実現することができ、その詳細な説明は省略する。

障害調査部３３においては、採取するトレース情報のレベル（トレースレベル：情報採取レベル）を任意に設定できる。トレースレベルを高くすると非常に詳細な情報が多量に採取できる反面、採取できる時間が非常に短くなる。逆にトレースレベルを低くすると単位時間あたりの情報量は少なくなるが、長期間にわたって情報を採取することができる。
本障害処理システム１においては、処理単位ごとにトレースレベルを任意に設定できるものとする。又、顧客システム２０のデフォルト設定（例えば、工場出荷時の設定）では、種々の処理について均一にトレース情報を収集するために、全ての処理単位において中間（Middle）のトレースレベルが設定されているものとする。

図１６は実施形態の一例としての障害処理システム１における障害調査部３３によるトレースレベルの自動設定手法を説明するための図である。
障害調査部３３は、特定した被疑部品からトレースログを重点的に採取する部位を決定し、そのトレースレベルを上げる。これにより、障害発生の被疑部品に関して、詳細な情報が採取できる。又、障害調査部３３は、これに伴い、被疑部品以外の処理に関してのトレースレベルを下げる。これにより、トレース情報全体としての容量を上昇を抑止することができる。

例えば、図６に例示するように、障害ログおいて被疑部品がＣＰＵ０であると判断した場合には、障害調査部３３は、図１６に示すように、ＣＰＵ制御のトレースレベルを上げ、その他のトレースレベルを下げる。これにより、ＣＰＵ制御に関する調査情報を詳細に採取することを可能にする。
また、障害調査部３３は、スクリプト実行部３５による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。障害調査部３３は、この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。

また、障害調査部３３は、特定した被疑部品としてのハードウェアエレメントを、テストプログラム取得部３７に通知する。
テストプログラム取得部３７は、記憶装置３８から、障害通知部３３によって特定された被疑部品のハードウェアエレメントに対応するテストプログラムを取得する。テストプログラムは、ハードウェアエレメントの動作や機能をテストするためのプログラムであり、ドメイン上で実行される。テストプログラムは、例えば、ハードウェアエレメントに対して所定の検査信号を出力し、その応答信号を期待値と比較することにより、ハードウェアエレメントの試験を行なう。

テストプログラムは、ハードウェアコンポーネント種別毎に用意され、例えば、記憶装置３８には、予め、各ハードウェアエレメントに対応するテストプログラムを格納されている。
図１７は実施形態の一例としての障害処理システム１のテストプログラムをテストプログラムリストとして例示する図である。

この図１７に示す例においては、５種類のテストプログラムをハードウェアエレメントの種別（３種類）に応じて分類している。
すなわち、ＣＰＵに関しては、ＣＰＵコア（Core）に関する試験を行なうテストプログラムと、ＣＰＵキャッシュ（Cash）に関する試験を行なうテストプログラムとの２種類のテストプログラムをそなえている。

また、ＳＢに関しては、ＡＳＩＣ（Application Specific Integrated Circuit）に関する試験を行なうテストプログラムと、Ｉ２Ｃ（Inter-Integrated Circuit）に関する試験を行なうテストプログラムとの２種類のテストプログラムをそなえている。更に、メモリ（ＤＩＭＭ）に関する試験を行なうテストプログラムもそなえている。
テストプログラム取得部３７は、この図１７に示すようなテストプログラムリストを参照し、記憶装置３８に格納された複数のテストプログラムの中から、被疑部品のハードウェアエレメントに対応するテストプログラムを選択し、取得する。

具体的には、テストプログラム取得部３７は、障害情報のログ情報に含まれる発生事象を参照し、この発生した事象に応じてテストする範囲の絞り込みを行なう。
例えば、図６に示す障害ログにおいては、被疑部品がＣＰＵ０であり、且つ、発生事象が“Cache Uncorrectable Error”であるので、障害としてＣＰＵでキャッシュに関するエラーが生じたことがわかる。テストプログラム取得部３７は、このような障害ログに関して、テストプログラムリストからＣＰＵキャッシュ（Cache）の試験を行なうテストプログラムを選択する。

なお、テストプログラムは、例えば、管理サーバ１０の記憶装置１１等、記憶装置３８以外の場所に格納してもよい。
また、ＳＰ３０４は、いずれかのドメインにログインし、このドメイン上で実行されるＯＳを操作可能なドメインコンソール機能をそなえている。ＳＰ３０４は、このドメインコンソール機能により、テストプログラム取得部３７によって選択・取得されたテストプログラムをＯＳ上で実行させる。

すなわち、ＳＰ３０４のドメインコンソール機能により、ＣＰＵ３０１は、テストプログラム取得部３７によって取得されたテストプログラムをドメイン上で実行するテストプログラム実行部４２として機能する。
障害再現システム３０においては、例えば、上述したスクリプト実行部３６によるスクリプトの実行やテストプログラム実行部４２によるテストプログラムの実行を、障害事象が再現されるまで繰り返し行なう。そして、顧客システム２０において発生した障害事象と同一の事象が障害再現システム３０で発生した時点で、再現試験は停止される。

上述の如く構成された実施形態の一例としての障害処理システム１における処理を、図１８に示すフローチャート（ステップＳ１０〜Ｓ７０）に従って説明する。
顧客システム２０において障害（故障）が発生すると（ステップＳ１０）、顧客システム２０のＳＰ２０４において、障害情報作成部２１が障害情報（構成情報，設定情報，ログ情報）を作成し、格納処理部２２が、この障害情報を管理サーバ１０に退避させる（ステップＳ２０）。

また、顧客システム２０において、位置情報格納処理部２３が、障害情報の退避先（格納先）のＵＲＬ（格納位置情報）を障害発生部品２４のＥＥＰＲＯＭ２４１に書き込む（ステップＳ３０）。障害発生部品２４は、工場に戻され、この工場の障害再現システム３０において、障害の再現試験が行なわれる（ステップＳ４０）。
工場においては、オペレータが、障害発生部品２４が障害再現システム３０に搭載する（ステップ５０）。障害再現システム３０に障害発生部品２４が取り付けられると、格納位置情報取得部３１が、そのＥＥＰＲＯＭ２４１からＵＲＬを読み出す。

障害情報取得部３２は、このＵＲＬを用いてネットワーク５２を介して管理サーバ１０にアクセスし、障害情報を取得する（ステップＳ６０）。
そして、障害再現システム３０において、構成制御部３４が、この取得した障害情報に基づき、障害再現システム３０のハードウェア構成及びソフトウェア構成を、顧客システム２０に一致させる。

また、障害再現システム３０において、スクリプト作成部３５が、障害情報のログ情報に基づき、障害発生時に顧客システム２０において行なわれた処理を再現するための再現スクリプトを作成する。又、テストプログラム取得部３７が、障害情報に基づいて、障害発生の被疑部品のハードウェアエレメントを試験するためのテストプログラムを記憶装置３８から取得する（ステップＳ７０）。

そして、障害再現システム３０において、スクリプト実行部３５による再現スクリプトの実行と、テストプログラム実行部４１によるテストプログラムの実行とが、顧客システム２０において発生した障害が再現されるまで、繰り返し行なわれる。これらの試験結果は、定期的にオペレータに通知される。
また、例えば、障害調査部３３は、スクリプト実行部３５による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。

この際、障害調査部３３は、障害情報の障害ログに基づくトレースレベルの設定を行ない、この設定に従ってトレース情報の収集を行なう。
このように、実施形態の一例としての障害処理システム１によれば、格納処理部２２が、障顧客システム２０において生じた障害に関する障害情報をネットワーク１を介して管理サーバ１０の記憶装置１１に格納するので、障害情報のデータサイズを制限する必要がなく、例えば、大量のログ情報を障害再現システム３０に受け渡すことができる。これにより、障害再現システム３０において充分なログ情報を取得し、障害再現試験を実行するこができ、障害の再現効率を向上させることができる。

また、位置情報格納処理部２３が、管理サーバ１０における障害情報の格納位置を示す格納位置情報を障害発生部品２４のＥＥＰＲＯＭ２４１に格納するので、ＥＥＰＲＯＭ２４１としての容量の小さいものを用いることができ、ハードウェアエレメントひいては顧客システム２０の製造コストを低減することができる。又、障害発生部品２４と障害情報とを確実に関連付けることができ、例えば、障害発生部品２４を工場に配送する際等に障害情報を無くしてしまうこと等なく、利便性が高い。

障害情報を確実に障害再現システム３０に受け渡すことができ、障害再現システム３０における再現試験の効率を高めることができ、障害原因の特定までのプロセスを効率化することができる。
再現試験を効率化することで障害原因特定までの時間を短縮し製品の品質を向上させることができる。

構成制御部３４が、障害情報（構成情報，設定情報）に基づいて、顧客システム２０に合わせて障害再現システム３０のハードウェア構成及びソフトウェア構成のそれぞれについて障害発生時の顧客システム２０にできるだけ近い環境を作り出す。これにより、再現試験を効率的に実施することができる。
構成制御部３４が、縮退機能を用いて、障害再現システム３０の余剰ハードウェアエレメントを論理的に未実装状態に見せることにより、障害再現システム３０のハードウェア構成を容易且つ効率的に変更することができる。又、構成制御部３４が、障害再現システム３０のドメイン構成を顧客システム２０のドメイン構成と同様に構成することにより、障害再現システム３０のドメイン構成を容易且つ効率的に変更することができる。

スクリプト作成部３５が、障害情報のログ情報に基づいて、顧客システム２０における障害発生時に行なわれた処理を再現する再現スクリプトを作成し、スクリプト実行部３６がこの再現スクリプトを実行する。これにより、顧客システム２０において障害が発生した際に実行された複数の処理を、障害再現システム３０において、それらの処理が実行されたと同じタイミングで再現することができる。すなわち、障害再現システム３０における障害の再現度を向上させることができる。

また、予め各ハードウェアエレメントに対応するテストプログラムを用意しておき、テストプログラム取得部３７が、障害に関する被疑部品のハードウェアエレメントに対応するテストプログラムを取得する。そして、テストプログラム実行部４２が、この選択されたテストプログラムを実行することにより、被疑部品についてテストプログラムによる試験を迅速に行なうことができる。

なお、本実施形態において、コンピュータとは、ハードウェアとオペレーティングシステムとを含む概念であり、オペレーティングシステムの制御の下で動作するハードウェアを意味している。又、オペレーティングシステムが不要でアプリケーションプログラム単独でハードウェアを動作させるような場合には、そのハードウェア自体がコンピュータに相当する。ハードウェアは、少なくとも、ＣＰＵ等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえており、本実施形態においては、顧客システム２０や障害再現システム３０がコンピュータとしての機能を有しているのである。

そして、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上述した実施形態においては、便宜上、障害再現システム３０のハードウェアエレメントとしてＣＰＵ及びＤＩＭＭについて例示し、これら以外のハードウェアエレメントの図示を省略している。しかしながら、これに限定されるものではなく、ＣＰＵやＤＩＭＭ以外のハードウェアエレメントをそなえてもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。

同様に、上述した実施形態においては、顧客システム２０のＣＰＵ２０１やＤＩＭＭ２０５が障害発生部品２４となる例について示しているが、これに限定されるものではない。例えば、冷却用ファンや電源装置等の他のハードウェアエレメントが障害発生部品２４となってもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。この場合、これらの冷却用ファンや電源装置等の他のハードウェアエレメントにもメモリ２４１が直接もしくは間接にそなえられることは言うまでもない。

なお、上述した実施形態が開示されていれば、本発明の障害処理方法，障害処理システム，障害処理方法及び障害処理プログラムを当業者によって実施・製造することが可能である。

図６は実施形態の一例としての障害処理システム１における障害ログの例を示す図である。この図６に示す例においては、障害ログには被疑部品，発生事象及び時刻が含まれる。又、この図６に示す例においては、ＣＰＵ２０１のキャッシュ異常が発生した場合に生成される障害ログを示している。
被疑部品は、障害が発生したと判断される部品（障害発生箇所）を特定する情報であり、図６に示す例においては、ＣＰＵ０において障害が発生していることを示す。発生事象は、障害の内容を示す情報である。この図６に示す例においては、ＣＰＵ０のキャッシュメモリにおいて、訂正不能なデータエラーが発生したことを示している。時刻はその障害が発生した日時を示す。

例えば、図６に例示するように、障害ログおいて被疑部品がＣＰＵ０であると判断した場合には、障害調査部３３は、図１６に示すように、ＣＰＵ制御のトレースレベルを上げ、その他のトレースレベルを下げる。これにより、ＣＰＵ制御に関する調査情報を詳細に採取することを可能にする。
また、障害調査部３３は、スクリプト実行部３６による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。障害調査部３３は、この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。

そして、障害再現システム３０において、スクリプト実行部３６による再現スクリプトの実行と、テストプログラム実行部４２によるテストプログラムの実行とが、顧客システム２０において発生した障害が再現されるまで、繰り返し行なわれる。これらの試験結果は、定期的にオペレータに通知される。
また、例えば、障害調査部３３は、スクリプト実行部３６による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。

同様に、上述した実施形態においては、顧客システム２０のＣＰＵ２０１やＤＩＭＭ２０５が障害発生部品２４となる例について示しているが、これに限定されるものではない。例えば、冷却用ファンや電源装置等の他のハードウェアエレメントが障害発生部品２４となってもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。この場合、これらの冷却用ファンや電源装置等の他のハードウェアエレメントにもＥＥＰＲＯＭ２４１が直接もしくは間接にそなえられることは言うまでもない。

なお、上述した実施形態が開示されていれば、本発明の障害処理方法，障害処理システム，障害処理方法及び障害処理プログラムを当業者によって実施・製造することが可能である。
以上の実施形態に関し、更に以下の付記を開示する。
（付記１）
情報処理装置において発生する障害を再現装置において再現させる障害処理方法であって、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成ステップと、
該障害情報生成ステップにおいて生成した該障害情報を、該情報処理装置及び該再現装置と通信可能に接続されデータを格納可能な記憶装置に格納する格納処理ステップと、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理ステップと、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得ステップと、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得ステップと、
該障害情報取得ステップにおいて取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御ステップとをそなえることを特徴とする、障害処理方法。
（付記２）
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御ステップにおいて、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、付記１記載の障害処理方法。
（付記３）
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御ステップにおいて、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、付記１又は付記２記載の障害処理方法。
（付記４）
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成ステップと、
該スクリプト作成ステップにおいて作成された該再現スクリプトを実行するスクリプト実行ステップとをそなえることを特徴とする、付記１〜付記３のいずれか１項に記載の障害処理方法。
（付記５）
該ハードウェア構成要素に対応するテストプログラムをテストプログラム格納部に格納するテストプログラム格納ステップをそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定ステップと、
該テストプログラム格納部から、該ハードウェア構成要素特定ステップにおいて特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得ステップと、
該テストプログラム取得ステップにおいて取得された該テストプログラムを実行するテストプログラム実行ステップとをそなえることを特徴とする、付記１〜付記４のいずれか１項に記載の障害処理方法。
（付記６）
情報処理装置において発生する障害を再現装置において再現させる障害処理システムであって、
該情報処理装置及び該再現装置と通信可能に接続され、データを格納可能な記憶装置をそなえるとともに、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成部と、
該障害情報生成部が生成した該障害情報を該記憶装置に格納する格納処理部と、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理部とをそなえ、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理システム。
（付記７）
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、付記６記載の障害処理システム。
（付記８）
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、付記６又は付記７記載の障害処理システム。
（付記９）
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、付記６〜付記８のいずれか１項に記載の障害処理システム。
（付記１０）
該ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部をそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
該テストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、付記６〜付記９のいずれか１項に記載の障害処理システム。
（付記１１）
情報処理装置の障害発生部品において発生する障害を再現させる障害処理装置であって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該障害処理装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理装置。
（付記１２）
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、付記１１記載の障害処理装置。
（付記１３）
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、付記１１又は付記１２記載の障害処理装置。
（付記１４）
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、付記１１〜付記１３のいずれか１項に記載の障害処理装置。
（付記１５）
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、付記１１〜付記１４のいずれか１項に記載の障害処理装置。
（付記１６）
情報処理装置の障害発生部品において発生する障害を再現させる障害再現機能をコンピュータに実行させるための障害処理プログラムであって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得し、
該格納位置情報に基づいて、該情報処理装置及び当該コンピュータと通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得し、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該コンピュータの構成を変更するように、該コンピュータを機能させることを特徴とする、障害処理プログラム。
（付記１７）
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせるように、該コンピュータを機能させることを特徴とする、付記１６記載の障害処理プログラム。
（付記１８）
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定するように、該コンピュータを機能させることを特徴とする、付記１６又は付記１７記載の障害処理プログラム。
（付記１９）
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成し、
作成された該再現スクリプトを実行するように、該コンピュータを機能させるをそなえることを特徴とする、付記１６〜付記１８のいずれか１項に記載の障害処理プログラム。
（付記２０）
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定し、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得し、
取得された該テストプログラムを実行するように該コンピュータを機能させることを特徴とする、付記１６〜付記１９のいずれか１項に記載の障害処理プログラム。

Claims

情報処理装置において発生する障害を再現装置において再現させる障害処理方法であって、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成ステップと、
該障害情報生成ステップにおいて生成した該障害情報を、該情報処理装置及び該再現装置と通信可能に接続されデータを格納可能な記憶装置に格納する格納処理ステップと、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理ステップと、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得ステップと、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得ステップと、
該障害情報取得ステップにおいて取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御ステップとをそなえることを特徴とする、障害処理方法。
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御ステップにおいて、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、請求項１記載の障害処理方法。
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御ステップにおいて、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、請求項１又は請求項２記載の障害処理方法。
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成ステップと、
該スクリプト作成ステップにおいて作成された該再現スクリプトを実行するスクリプト実行ステップとをそなえることを特徴とする、請求項１〜請求項３のいずれか１項に記載の障害処理方法。
該ハードウェア構成要素に対応するテストプログラムをテストプログラム格納部に格納するテストプログラム格納ステップをそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定ステップと、
該テストプログラム格納部から、該ハードウェア構成要素特定ステップにおいて特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得ステップと、
該テストプログラム取得ステップにおいて取得された該テストプログラムを実行するテストプログラム実行ステップとをそなえることを特徴とする、請求項１〜請求項４のいずれか１項に記載の障害処理方法。
情報処理装置において発生する障害を再現装置において再現させる障害処理システムであって、
該情報処理装置及び該再現装置と通信可能に接続され、データを格納可能な記憶装置をそなえるとともに、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成部と、
該障害情報生成部が生成した該障害情報を該記憶装置に格納する格納処理部と、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理部とをそなえ、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理システム。
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、請求項６記載の障害処理システム。
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、請求項６又は請求項７記載の障害処理システム。
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、請求項６〜請求項８のいずれか１項に記載の障害処理システム。
該ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部をそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
該テストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、請求項６〜請求項９のいずれか１項に記載の障害処理システム。
情報処理装置の障害発生部品において発生する障害を再現させる障害処理装置であって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該障害処理装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理装置。
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、請求項１１記載の障害処理装置。
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、請求項１１又は請求項１２記載の障害処理装置。
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、請求項１１〜請求項１３のいずれか１項に記載の障害処理装置。
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、請求項１１〜請求項１４のいずれか１項に記載の障害処理装置。
情報処理装置の障害発生部品において発生する障害を再現させる障害再現機能をコンピュータに実行させるための障害処理プログラムであって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得し、
該格納位置情報に基づいて、該情報処理装置及び当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得し、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該コンピュータの構成を変更するように、該コンピュータを機能させることを特徴とする、障害処理プログラム。
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせるように、該コンピュータを機能させることを特徴とする、請求項１６記載の障害処理プログラム。
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定するように、該コンピュータを機能させることを特徴とする、請求項１６又は請求項１７記載の障害処理プログラム。
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成し、
作成された該再現スクリプトを実行するように、該コンピュータを機能させるをそなえることを特徴とする、請求項１６〜請求項１８のいずれか１項に記載の障害処理プログラム。
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定し、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得し、
取得された該テストプログラムを実行するように該コンピュータを機能させるをそなえることを特徴とする、請求項１６〜請求項１９のいずれか１項に記載の障害処理プログラム。