JPWO2012026035A1 - 障害処理方法,障害処理システム,障害処理装置及び障害処理プログラム - Google Patents
障害処理方法,障害処理システム,障害処理装置及び障害処理プログラム Download PDFInfo
- Publication number
- JPWO2012026035A1 JPWO2012026035A1 JP2012530495A JP2012530495A JPWO2012026035A1 JP WO2012026035 A1 JPWO2012026035 A1 JP WO2012026035A1 JP 2012530495 A JP2012530495 A JP 2012530495A JP 2012530495 A JP2012530495 A JP 2012530495A JP WO2012026035 A1 JPWO2012026035 A1 JP WO2012026035A1
- Authority
- JP
- Japan
- Prior art keywords
- information
- failure
- fault
- reproduction
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2294—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
- G06F11/0724—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0748—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
Description
従来の障害処理手法においては、故障部品は、ユーザから報告された障害報告内容とともにメーカーの工場等に送付される。そして、この工場において、障害報告内容に基づき、再現試験環境が構築され、この再現試験環境下において障害を再現させて原因究明や対処方法の検討等が行なわれる。
従って、工場において、再現試験環境を構築することが困難となり、再現試験の作業効率が悪いという課題があり、又、これに伴い障害原因の特定も非効率であるという課題もある。
なお、前記目的に限らず、後述する発明を実施するための最良の形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。
(1)障害情報のデータサイズを制限する必要がなく、例えば、大量のログ情報を再現装置に受け渡すことができ、障害の再現効率を向上させることができる。
(2)情報処理装置の製造コストを低減することができる。
(3)障害情報を確実に再現装置に受け渡すことができ、再現試験の効率を高めることができ、障害原因の特定までのプロセスを効率化することができる。
10 管理サーバ
11 記憶装置
20 顧客システム(情報処理装置)
21 障害情報作成部
22 格納処理部
23 位置情報格納処理部
24 障害発生部品
30 障害再現システム(再現装置,障害処理装置)
31 格納位置情報取得部
32 障害情報取得部
33 障害調査部
34 構成制御部
35 スクリプト作成部
36 スクリプト実行部
37 テストプログラム取得部
38 記憶装置(スクリプト格納部,テストプログラム格納部)
42 テストプログラム実行部
51,52 ネットワーク
201,201−1〜201−3,201−5,301,301−0〜301−7 CPU
203,203−0〜203−2,303,303−0〜303−3 SB
204,304 SP
205,205−0〜205−15,205−20,205−21,305,305−0〜305−31 DIMM
241 EEPROM(記憶部)
2041,3041 ストレージ
2042,3042 構成情報格納領域
2043,3043 設定情報格納領域
2044,3044 ログ情報格納領域
T1 構成情報テーブル
図1は実施形態の一例としての障害処理システム1の機能構成を模式的に示す図、図2はその顧客システム20のハードウェア構成を例示する図である。
障害処理システム1は、情報処理装置において発生する障害を処理する。本実施形態の一例においては、例えば、メーカーが提供する情報処理装置(顧客システム20)を顧客(ユーザ)が使用し、この顧客システム20において生じた障害を処理する例について説明する。
なお、本障害処理システム1においては、1以上の顧客システム20が接続されるが、本実施形態においては、便宜上、1つの顧客システム20についてのみ図示して説明するものとする。
この管理サーバ10は、記憶装置11をそなえ、後述する顧客システム20から、ネットワーク51を介して送信される障害情報(後述)を、この記憶装置11における所定の領域に格納する。この記憶装置11は例えば、HDD(Hard Disk Drive)等の大容量の記憶装置であり、多くの障害情報を格納・蓄積することができる。
格納位置情報は、例えば、管理サーバ10のIPアドレスやディレクトリ情報等のデータの格納位置を示す情報であり、本障害処理システム1においては、この格納位置情報を用いることにより、記憶装置11に格納された特定の障害情報にアクセスすることができる。なお、格納位置情報としては、これらのIPアドレスやディレクトリ情報に限定されるものではなく、ネットワーク上の特定のデータにアクセスするために用いられる既知の種々の手法を用いてもよい。
なお、この管理サーバ10は既知のコンピュータシステムにより構成することができ、その構成の詳細な説明は省略する。
また、本実施形態においては、顧客システム20が、サーバコンピュータシステム等の情報処理装置である例について説明するものとする。
SB203−0には、CPU(Central Processing Unit)201−0,201−1,メモリ205−0〜205−7がそなえられている。又、SB203−1には、CPU201−2,201−3,メモリ205−8〜205−15がそなえられている。同様に、SB203−2には、CPU201−5及びメモリ205−20,205−21がそなえられている。
本体系装置において、CPU201は種々の制御や演算を行なう処理装置であり、図示しないROM(Read Only Memory)等に格納されたプログラムを実行することにより、顧客システム20における種々の機能を実現する。
なお、以下、DIMM205−0〜205−15,205−20,205−21についても、DIMMの後ろに、それぞれ“−”以下の構成番号を付すことにより簡略して表す場合がある。例えば、DIMM205−0をDIMM0と表す。
また、顧客システム20において、これらのCPU201やDIMM205、他の電子部品のそれぞれにはメモリ(記憶部)241がそなえられている。各メモリ241は、電力供給がされていない状態でも格納されたデータを保持可能なデータ記憶装置であり、例えば、数KBの記憶容量をそなえている。
本実施形態においては、このメモリ241の一例としてEEPROMを用いて説明するものとし、以下、メモリ241をEEPROM241と表す。
SP204は、本体系装置の制御及び保守を行なう。このSP204は、CPU201やDIMM205に接続され、これらの動作の制御や監視を行なう。又、SP204は、図示しないディスプレイ上にこれらの各部の動作状態を表示する制御や、障害等の情報の収集も行なう。
ストレージ2041には、図2に示すように、構成情報格納領域2042,設定情報格納領域2043及びログ情報格納領域2044がそなえられている。これらの構成情報格納領域2042,設定情報格納領域2043及びログ情報格納領域2044は、それぞれデータを格納可能な記憶領域であり、それぞれ数十MB程度の記憶容量をそなえる。
ハードウェア構成情報は、例えば、顧客システム20にそなえられている各ハードウェアエレメントを特定する情報や数である。又、ソフトウェア構成情報は、例えば、OSの版数情報,ファームウェアの版数情報、ドメインの設定状態や構成を表す情報(ドメイン構成情報)である。
図3、図4は実施形態の一例としての障害処理システム1における構成情報の例を示す図であり、図3はそのハードウェア構成情報の例を示す図、図4はそのソフトウェア構成情報の例を示す図である。
また、図4に示すソフトウェア構成情報は、各ドメインに対して、含まれるハードウェアエレメントの構成番号を対応付けて構成されている。具体的には、図2に示す顧客システム20のドメイン構成を表すドメイン構成情報を示しており、各ドメインに対して、そのドメインに含まれるCPU201,SB203及びDIMM205の各構成番号を対応付けている。
ログ情報格納領域2044はログ情報を格納する。このログ情報は、顧客システム20における各種ログ(履歴情報)であり、例えば、顧客システム20において所定期間に行なわれた各種操作や処理のログや障害ログである。操作ログには、顧客システム20においてオペレータが行なったオペレーション内容の他、SP204において行なわれた各種処理の情報が含まれる。すなわち、ログ情報には、顧客システム20において障害発生前に行なわれた処理に関する処理履歴情報が含まれている。
なお、本実施形態においては、ストレージ2041に構成情報格納領域2042,設定情報格納領域2043及びログ情報格納領域2044が形成された例を示しているが、これに限定されるものではない。例えば、構成情報格納領域2042,設定情報格納領域2043及びログ情報格納領域2044の一部を他のストレージ装置にそなえてもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
被疑部品は、障害が発生したと判断される部品(障害発生箇所)を特定する情報であり、図6に示す例においては、CPU0において障害が発生していることを示す。発生事象は、障害の内容を示す情報である。この図3に示す例においては、CPU0のキャッシュメモリにおいて、訂正不能なデータエラーが発生したことを示している。時刻はその障害が発生した日時を示す。
なお、これら障害情報作成部21,格納処理部22及び位置情報格納処理部23としての機能を実現するためのプログラムは、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
なお、これらの構成情報,設定情報及びログ情報は、それぞれ既知の手法により作成することができ、その収集方法や作成方法についての詳細な説明についても省略する。
図7は実施形態の一例としての障害処理システム1における格納処理部22及び位置情報格納処理部23による処理を例示する図である。この図7に示す例においては、格納処理部22は、アドレス(IPアドレス)が192.168.11.2である管理サーバ10においてディレクトリ“/log/incident-uuid”として特定される位置に、障害情報を格納している。
また、uuidの生成には、上述した情報の一部だけを用いてもよく、又、これら以外の情報を用いてもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
また、この際、位置情報格納処理部23は、管理サーバ10に格納した障害情報へアクセスするためのアドレス情報と事象を一意に識別する情報(uuid)とを含むURLを生成して、EEPROM241に書き込む。
EEPROM241に格納位置情報が格納された障害発生部品24は、何らかの移送手段により、障害再現システム30がそなえられた工場等に配送される。
障害再現システム30は、顧客システム20において生じた障害の再現試験を行なう情報処理装置(再現装置,障害処理装置)である。再現試験は、顧客システム20において生じた障害を再現して調査することにより、障害の原因を特定し、復旧方法や回避方法を見つけ出す。
また、SB0には、CPU301−0,301−1,DIMM305−0〜305−7がそなえられている。又、SB1には、CPU301−2,301−3,DIMM305−8〜305−15がそなえられている。同様に、SB2には、CPU301−4,301−5,DIMM305−16〜305−23が、又、SB3には、CPU301−6,301−7,DIMM305−24〜305−31がそなえられている。
なお、以下、SB303−0〜303−7をそれぞれ、SBに各符号の“−(ハイフン)”以下の数字(構成番号)を付すことにより、簡略して表す場合がある。例えば、SB303−0をSB0といい、同様に、以下、SB303−1をSB1という場合がある。
また、以下、SBを示す符号としては、複数のSBのうち1つを特定する必要があるときには符号303−0〜303−3を用いるが、任意のSBを指すときには符号303を用いる。
また、障害再現システム30においても、上述した複数のハードウェアエレメントを分割もしくは組み合わせることにより、1以上の独立したドメインを形成するパーティショニング機能をそなえている。そして、このように形成したドメインにおいて、OSやアプリケーションを動作させることができる。
記憶装置38は、ハードディスクドライブ、SSD等の記憶装置であって、種々のデータを格納するものである。そして、この記憶装置38が、後述するスクリプトを格納するスクリプト格納部として機能するとともに、同じく後述するテストプログラムを格納するテストプログラム格納部として機能する。
また、CPU301は、ROMや記憶装置38に格納されたプログラムを実行することにより、後述するテストプログラム実行部42として機能する。
また、SP304は、図示しないプロセッサをそなえ、このプロセッサが同じく図示しないROMや記憶装置38等に格納された障害処理プログラムを実行することにより、図1や図9に示すような、格納位置情報取得部31,障害情報取得部32,障害調査部33,構成制御部34,スクリプト作成部35,スクリプト実行部36,テストプログラム取得部37及びハードウェアエレメント特定部41としての機能をそなえる。
すなわち、例えば、障害発生部品24が顧客システム20のCPU0(CPU201−0)であった場合には、障害再現システム30におけるCPU0(301−0)が取り外され、障害再現システム30において、CPU301−0に代えて障害発生部品24であるCPU201−0が取り付けられる。
格納位置情報取得部31は、障害発生部品24のEEPROM241から、障害発生時に顧客システム20によって生成された格納位置情報を取得する。この格納位置情報取得部31は、顧客システム20から取り外されて配送され、障害再現システム30のハードウェアエレメントに換えて取り付けられた障害発生部品24から格納位置情報を取得する。例えば、格納位置情報を、予め規定された特定のファイル名でEEPROM241に格納したり、又、EEPROM241における予め規定された特定のアドレスに格納することにより、格納位置情報取得部31は容易且つ確実に格納位置情報を取得することができる。
障害情報取得部32は、障害情報の格納位置を示すURLを記録する障害発生部品24が搭載されたことを認識すると、そのEEPROM241からURLを取得し、この取得したURLにより、管理サーバ10に格納された障害情報にアクセスする。障害情報取得部32は、管理サーバ10から障害情報を取得(ダウンロード)し、SP304のメモリ(図示省略)上に展開する。
図10は実施形態の一例としての障害処理システム1における障害情報取得部32による処理を例示する図である。
構成情報格納領域3042,設定情報格納領域3043及びログ情報格納領域3044は、それぞれデータを格納可能な記憶領域であり、例えば、それぞれ数十MB程度の記憶容量をそなえる。
構成制御部34は、障害情報取得部32によって取得した障害情報(構成情報,設定情報)に基づいて、顧客システム20に合わせて障害再現システム30のハードウェア構成及びソフトウェア構成のそれぞれについて構成変更を行なう。すなわち、構成制御部34は、取得した障害情報を参照して、障害再現システム30において、障害発生時の顧客システム20にできるだけ近い環境を自動的に作り出す。
構成制御部34は、障害情報に含まれる構成情報を参照して顧客システム20のハードウェア構成を取得する。構成制御部34は、顧客システム20の構成情報を参照して、例えば、CPUやSB,DIMMの構成情報を取得する。
そして、構成制御部34は、顧客システム20のハードウェア構成と障害再現システム30のハードウェア構成との比較を行ない、これらの差異を確認する。
例えば、図2に示す顧客システム20には、SB2のCPU4やDIMM16〜19,22,23,SB3がそなえられてない点において、図8に示す障害再現システム30とハードウェア構成が異なっている。
すなわち、構成制御部34は、障害再現システム30にそなえられるハードウェアエレメントのうち、顧客システム20の構成に含まれないハードウェアエレメント(余剰ハードウェアエレメント)を非使用状態にすることにより、障害再現システム30のハードウェア構成を顧客システム20のハードウェア構成に合わせる。
構成制御部34は、構成に応じて各ハードウェアエレメント(部品)をシステムに組み込んだり、縮退したりする機能(以下、単に縮退機能という)をそなえており、各ハードウェアエレメントは縮退することにより論理的には搭載されていないものとみなされる。そして、構成制御部34は、この縮退機能を用いて、障害再現システム30の余剰ハードウェアエレメントを論理的に未実装状態に見せる。
図11は実施形態の一例としての障害処理システム1における構成情報テーブルT1の例を示す図、図12は実施形態の一例としての障害処理システム1において障害再現システム30の一部のハードウェアエレメントを未実装状態にした例を示す図である。
そして、この構成情報テーブルT1において、OKが設定されているハードウェアエレメントが実装状態として取り扱われる。又、この構成管理テーブルT1においてNGが設定されているハードウェアエレメントは、未実装状態として取り扱われ、図12に示すように、障害再現システム30において認識されず、非搭載状態となる。
なお、障害再現システム30にそなえられていないハードウェアが顧客システム20にそなえられていることが判明した場合には、構成制御部34は、表示装置(図示省略)等にその旨のメッセージを表示させる等の手法により、オペレータ(試験担当者)に対して通知する。
また、構成制御部34は、障害情報に含まれる構成情報のうちソフトウェア構成情報に基づいて、障害再現システム30のソフトウェア構成を顧客システム20と同様の状態に設定する。
構成制御部34は、例えば、顧客システム20障害情報に含まれる構成情報からドメイン構成情報を参照し、図13に示すように、障害再現システム30のドメイン構成を顧客システム20のドメイン構成と同様に構成する。なお、ドメイン構成は既知のドメイン構成手順を用いることにより変更することができ、その詳細な説明は省略する。
このため、管理サーバ10や図示しないアプリケーションサーバ,記憶装置38等(以下、管理サーバ10等という)に、想定される種々のソフトウェアについて、新旧の全ての版数のソフトウェアのイメージを予め格納しておくことが望ましい。
なお、障害再現システム30のソフトウェア構成の設定に際して、構成制御部34は、管理サーバ10等からソフトウェア(含むOS)のインストーラを取得し、このインストーラを用いてインストールを行なってもよい。
図14は実施形態の一例としての障害処理システム1における再現スクリプトイメージを例示する図、図15はその再現スクリプトを例示する図である。なお、図15に例示する再現スクリプトは、図5に示すログ情報に基づいて作成されたものであり、この再現スクリプトの作成過程において図14に例示する再現スクリプトイメージが作成される。
このように、スクリプト作成部35は、ログ情報に含まれる複数の処理の実行履歴を、各処理がそれぞれ実行された経過時間と同じタイミングで再現するスクリプト(再現スクリプト)を作成する。作成された再現スクリプトは、例えば、記憶装置38等に格納される。
障害調査部33は、障害情報の障害ログ(被疑箇所特定情報:例えば、図6参照)を参照し、この障害ログに基づいて被疑箇所に相当するハードウェアエレメント(被疑部品)を特定する。例えば、図6に示す障害ログにおいては被疑部品がCPU0であることがわかる。
本障害処理システム1においては、処理単位ごとにトレースレベルを任意に設定できるものとする。又、顧客システム20のデフォルト設定(例えば、工場出荷時の設定)では、種々の処理について均一にトレース情報を収集するために、全ての処理単位において中間(Middle)のトレースレベルが設定されているものとする。
障害調査部33は、特定した被疑部品からトレースログを重点的に採取する部位を決定し、そのトレースレベルを上げる。これにより、障害発生の被疑部品に関して、詳細な情報が採取できる。又、障害調査部33は、これに伴い、被疑部品以外の処理に関してのトレースレベルを下げる。これにより、トレース情報全体としての容量を上昇を抑止することができる。
また、障害調査部33は、スクリプト実行部35による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。障害調査部33は、この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。
テストプログラム取得部37は、記憶装置38から、障害通知部33によって特定された被疑部品のハードウェアエレメントに対応するテストプログラムを取得する。テストプログラムは、ハードウェアエレメントの動作や機能をテストするためのプログラムであり、ドメイン上で実行される。テストプログラムは、例えば、ハードウェアエレメントに対して所定の検査信号を出力し、その応答信号を期待値と比較することにより、ハードウェアエレメントの試験を行なう。
図17は実施形態の一例としての障害処理システム1のテストプログラムをテストプログラムリストとして例示する図である。
すなわち、CPUに関しては、CPUコア(Core)に関する試験を行なうテストプログラムと、CPUキャッシュ(Cash)に関する試験を行なうテストプログラムとの2種類のテストプログラムをそなえている。
テストプログラム取得部37は、この図17に示すようなテストプログラムリストを参照し、記憶装置38に格納された複数のテストプログラムの中から、被疑部品のハードウェアエレメントに対応するテストプログラムを選択し、取得する。
例えば、図6に示す障害ログにおいては、被疑部品がCPU0であり、且つ、発生事象が“Cache Uncorrectable Error”であるので、障害としてCPUでキャッシュに関するエラーが生じたことがわかる。テストプログラム取得部37は、このような障害ログに関して、テストプログラムリストからCPUキャッシュ(Cache)の試験を行なうテストプログラムを選択する。
また、SP304は、いずれかのドメインにログインし、このドメイン上で実行されるOSを操作可能なドメインコンソール機能をそなえている。SP304は、このドメインコンソール機能により、テストプログラム取得部37によって選択・取得されたテストプログラムをOS上で実行させる。
障害再現システム30においては、例えば、上述したスクリプト実行部36によるスクリプトの実行やテストプログラム実行部42によるテストプログラムの実行を、障害事象が再現されるまで繰り返し行なう。そして、顧客システム20において発生した障害事象と同一の事象が障害再現システム30で発生した時点で、再現試験は停止される。
顧客システム20において障害(故障)が発生すると(ステップS10)、顧客システム20のSP204において、障害情報作成部21が障害情報(構成情報,設定情報,ログ情報)を作成し、格納処理部22が、この障害情報を管理サーバ10に退避させる(ステップS20)。
工場においては、オペレータが、障害発生部品24が障害再現システム30に搭載する(ステップ50)。障害再現システム30に障害発生部品24が取り付けられると、格納位置情報取得部31が、そのEEPROM241からURLを読み出す。
そして、障害再現システム30において、構成制御部34が、この取得した障害情報に基づき、障害再現システム30のハードウェア構成及びソフトウェア構成を、顧客システム20に一致させる。
また、例えば、障害調査部33は、スクリプト実行部35による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。
このように、実施形態の一例としての障害処理システム1によれば、格納処理部22が、障顧客システム20において生じた障害に関する障害情報をネットワーク1を介して管理サーバ10の記憶装置11に格納するので、障害情報のデータサイズを制限する必要がなく、例えば、大量のログ情報を障害再現システム30に受け渡すことができる。これにより、障害再現システム30において充分なログ情報を取得し、障害再現試験を実行するこができ、障害の再現効率を向上させることができる。
再現試験を効率化することで障害原因特定までの時間を短縮し製品の品質を向上させることができる。
構成制御部34が、縮退機能を用いて、障害再現システム30の余剰ハードウェアエレメントを論理的に未実装状態に見せることにより、障害再現システム30のハードウェア構成を容易且つ効率的に変更することができる。又、構成制御部34が、障害再現システム30のドメイン構成を顧客システム20のドメイン構成と同様に構成することにより、障害再現システム30のドメイン構成を容易且つ効率的に変更することができる。
例えば、上述した実施形態においては、便宜上、障害再現システム30のハードウェアエレメントとしてCPU及びDIMMについて例示し、これら以外のハードウェアエレメントの図示を省略している。しかしながら、これに限定されるものではなく、CPUやDIMM以外のハードウェアエレメントをそなえてもよく、実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
被疑部品は、障害が発生したと判断される部品(障害発生箇所)を特定する情報であり、図6に示す例においては、CPU0において障害が発生していることを示す。発生事象は、障害の内容を示す情報である。この図6に示す例においては、CPU0のキャッシュメモリにおいて、訂正不能なデータエラーが発生したことを示している。時刻はその障害が発生した日時を示す。
また、障害調査部33は、スクリプト実行部36による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。障害調査部33は、この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。
また、例えば、障害調査部33は、スクリプト実行部36による再現スクリプトの実行に伴うログの採取を行ない、この採取したログと障害情報に含まれる障害ログとを比較する。この比較の結果、例えば、ログの内容がほぼ一致した場合や、特徴的な一致が見られた場合に、障害が再現されたと判断する。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
情報処理装置において発生する障害を再現装置において再現させる障害処理方法であって、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成ステップと、
該障害情報生成ステップにおいて生成した該障害情報を、該情報処理装置及び該再現装置と通信可能に接続されデータを格納可能な記憶装置に格納する格納処理ステップと、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理ステップと、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得ステップと、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得ステップと、
該障害情報取得ステップにおいて取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御ステップとをそなえることを特徴とする、障害処理方法。
(付記2)
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御ステップにおいて、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、付記1記載の障害処理方法。
(付記3)
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御ステップにおいて、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、付記1又は付記2記載の障害処理方法。
(付記4)
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成ステップと、
該スクリプト作成ステップにおいて作成された該再現スクリプトを実行するスクリプト実行ステップとをそなえることを特徴とする、付記1〜付記3のいずれか1項に記載の障害処理方法。
(付記5)
該ハードウェア構成要素に対応するテストプログラムをテストプログラム格納部に格納するテストプログラム格納ステップをそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定ステップと、
該テストプログラム格納部から、該ハードウェア構成要素特定ステップにおいて特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得ステップと、
該テストプログラム取得ステップにおいて取得された該テストプログラムを実行するテストプログラム実行ステップとをそなえることを特徴とする、付記1〜付記4のいずれか1項に記載の障害処理方法。
(付記6)
情報処理装置において発生する障害を再現装置において再現させる障害処理システムであって、
該情報処理装置及び該再現装置と通信可能に接続され、データを格納可能な記憶装置をそなえるとともに、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成部と、
該障害情報生成部が生成した該障害情報を該記憶装置に格納する格納処理部と、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理部とをそなえ、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理システム。
(付記7)
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、付記6記載の障害処理システム。
(付記8)
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、付記6又は付記7記載の障害処理システム。
(付記9)
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、付記6〜付記8のいずれか1項に記載の障害処理システム。
(付記10)
該ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部をそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
該テストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、付記6〜付記9のいずれか1項に記載の障害処理システム。
(付記11)
情報処理装置の障害発生部品において発生する障害を再現させる障害処理装置であって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該障害処理装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理装置。
(付記12)
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、付記11記載の障害処理装置。
(付記13)
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、付記11又は付記12記載の障害処理装置。
(付記14)
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、付記11〜付記13のいずれか1項に記載の障害処理装置。
(付記15)
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、付記11〜付記14のいずれか1項に記載の障害処理装置。
(付記16)
情報処理装置の障害発生部品において発生する障害を再現させる障害再現機能をコンピュータに実行させるための障害処理プログラムであって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得し、
該格納位置情報に基づいて、該情報処理装置及び当該コンピュータと通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得し、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該コンピュータの構成を変更するように、該コンピュータを機能させることを特徴とする、障害処理プログラム。
(付記17)
該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせるように、該コンピュータを機能させることを特徴とする、付記16記載の障害処理プログラム。
(付記18)
該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定するように、該コンピュータを機能させることを特徴とする、付記16又は付記17記載の障害処理プログラム。
(付記19)
該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成し、
作成された該再現スクリプトを実行するように、該コンピュータを機能させるをそなえることを特徴とする、付記16〜付記18のいずれか1項に記載の障害処理プログラム。
(付記20)
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定し、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得し、
取得された該テストプログラムを実行するように該コンピュータを機能させることを特徴とする、付記16〜付記19のいずれか1項に記載の障害処理プログラム。
Claims (20)
- 情報処理装置において発生する障害を再現装置において再現させる障害処理方法であって、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成ステップと、
該障害情報生成ステップにおいて生成した該障害情報を、該情報処理装置及び該再現装置と通信可能に接続されデータを格納可能な記憶装置に格納する格納処理ステップと、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理ステップと、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得ステップと、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得ステップと、
該障害情報取得ステップにおいて取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御ステップとをそなえることを特徴とする、障害処理方法。 - 該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御ステップにおいて、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、請求項1記載の障害処理方法。 - 該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御ステップにおいて、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、請求項1又は請求項2記載の障害処理方法。 - 該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成ステップと、
該スクリプト作成ステップにおいて作成された該再現スクリプトを実行するスクリプト実行ステップとをそなえることを特徴とする、請求項1〜請求項3のいずれか1項に記載の障害処理方法。 - 該ハードウェア構成要素に対応するテストプログラムをテストプログラム格納部に格納するテストプログラム格納ステップをそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定ステップと、
該テストプログラム格納部から、該ハードウェア構成要素特定ステップにおいて特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得ステップと、
該テストプログラム取得ステップにおいて取得された該テストプログラムを実行するテストプログラム実行ステップとをそなえることを特徴とする、請求項1〜請求項4のいずれか1項に記載の障害処理方法。 - 情報処理装置において発生する障害を再現装置において再現させる障害処理システムであって、
該情報処理装置及び該再現装置と通信可能に接続され、データを格納可能な記憶装置をそなえるとともに、
該情報処理装置において、
障害発生時に、障害に関する障害情報を生成する障害情報生成部と、
該障害情報生成部が生成した該障害情報を該記憶装置に格納する格納処理部と、
該記憶装置における該障害情報の格納位置を表す格納位置情報を、障害発生部品の記憶部に格納する位置情報格納処理部とをそなえ、
該再現装置において、
該障害発生部品の該記憶部から格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、該記憶装置から該障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該再現装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理システム。 - 該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、請求項6記載の障害処理システム。 - 該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、請求項6又は請求項7記載の障害処理システム。 - 該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえ、
該再現装置において、該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、請求項6〜請求項8のいずれか1項に記載の障害処理システム。 - 該ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部をそなえるとともに、
該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえ、
該再現装置において、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
該テストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、請求項6〜請求項9のいずれか1項に記載の障害処理システム。 - 情報処理装置の障害発生部品において発生する障害を再現させる障害処理装置であって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得する格納位置情報取得部と、
該格納位置情報に基づいて、当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得する障害情報取得部と、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該障害処理装置の構成を変更する構成制御部とをそなえることを特徴とする、障害処理装置。 - 該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該構成制御部が、該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせることを特徴とする、請求項11記載の障害処理装置。 - 該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該構成制御部が、該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定することを特徴とする、請求項11又は請求項12記載の障害処理装置。 - 該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成するスクリプト作成部と、
該スクリプト作成部によって作成された該再現スクリプトを実行するスクリプト実行部とをそなえることを特徴とする、請求項11〜請求項13のいずれか1項に記載の障害処理装置。 - 該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定するハードウェア構成要素特定部と、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得するテストプログラム取得部と、
該テストプログラム取得部によって取得された該テストプログラムを実行するテストプログラム実行部とをそなえることを特徴とする、請求項11〜請求項14のいずれか1項に記載の障害処理装置。 - 情報処理装置の障害発生部品において発生する障害を再現させる障害再現機能をコンピュータに実行させるための障害処理プログラムであって、
該障害発生部品の記憶部から、障害発生時に該情報処理装置によって生成された、障害に関する障害情報の格納位置を表す格納位置情報を取得し、
該格納位置情報に基づいて、該情報処理装置及び当該障害処理装置と通信可能に接続されデータを格納可能な記憶装置から、障害発生時に該情報処理装置において生成された障害に関する障害情報を取得し、
該障害情報取得部によって取得した該障害情報に基づいて、該情報処理装置に合わせて当該コンピュータの構成を変更するように、該コンピュータを機能させることを特徴とする、障害処理プログラム。 - 該障害情報が該情報処理装置のハードウェア構成を示すハードウェア構成情報をそなえ、
該ハードウェア構成情報に基づいて、該再現装置にそなえられるハードウェア構成要素のうち、該情報処理装置の構成に含まれない該ハードウェア構成要素を非使用状態にすることにより、該再現装置のハードウェア構成を該情報処理装置のハードウェア構成に合わせるように、該コンピュータを機能させることを特徴とする、請求項16記載の障害処理プログラム。 - 該障害情報が該情報処理装置のソフトウェア設定状態を示すソフトウェア設定情報をそなえ、
該ソフトウェア設定情報に基づいて、該再現装置のソフトウェア設定を該情報処理装置と同様の状態に設定するように、該コンピュータを機能させることを特徴とする、請求項16又は請求項17記載の障害処理プログラム。 - 該障害情報が、該情報処理装置において障害発生前に行なわれた処理に関する処理履歴情報をそなえるとともに、
該処理履歴情報に基づいて障害発生時に行なわれた処理を再現する再現スクリプトを作成し、
作成された該再現スクリプトを実行するように、該コンピュータを機能させるをそなえることを特徴とする、請求項16〜請求項18のいずれか1項に記載の障害処理プログラム。 - 該障害情報が、該障害の原因となりうる被疑箇所を示す被疑箇所特定情報をそなえるとともに、
該被疑箇所特定情報に基づいて被疑箇所に相当する該ハードウェア構成要素を特定し、
ハードウェア構成要素に対応するテストプログラムを格納するテストプログラム格納部から、該ハードウェア構成要素特定部によって特定された該ハードウェア構成要素に対応する該テストプログラムを取得し、
取得された該テストプログラムを実行するように該コンピュータを機能させるをそなえることを特徴とする、請求項16〜請求項19のいずれか1項に記載の障害処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/064605 WO2012026035A1 (ja) | 2010-08-27 | 2010-08-27 | 障害処理方法,障害処理システム,障害処理装置及び障害処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012026035A1 true JPWO2012026035A1 (ja) | 2013-10-28 |
JP5459405B2 JP5459405B2 (ja) | 2014-04-02 |
Family
ID=45723062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012530495A Active JP5459405B2 (ja) | 2010-08-27 | 2010-08-27 | 障害処理方法,障害処理システム,障害処理装置及び障害処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130173964A1 (ja) |
JP (1) | JP5459405B2 (ja) |
WO (1) | WO2012026035A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5300089B2 (ja) * | 2010-12-13 | 2013-09-25 | エヌイーシーコンピュータテクノ株式会社 | 情報処理装置、情報処理装置障害再現方法および情報処理装置障害再現プログラム |
GB2504728A (en) | 2012-08-08 | 2014-02-12 | Ibm | Second failure data capture in co-operating multi-image systems |
WO2014118897A1 (ja) * | 2013-01-29 | 2014-08-07 | 富士通株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
JP6102327B2 (ja) * | 2013-02-21 | 2017-03-29 | 株式会社リコー | 電子機器、情報処理システム及びプログラム |
US20140331205A1 (en) * | 2013-05-02 | 2014-11-06 | Amazon Technologies, Inc. | Program Testing Service |
CN104615545A (zh) * | 2013-11-05 | 2015-05-13 | 中兴通讯股份有限公司 | 单板信息的存储方法及单板 |
US9626265B2 (en) * | 2015-06-29 | 2017-04-18 | International Business Machines Corporation | Efficiency of cycle-reproducible debug processes in a multi-core environment |
CN105718354A (zh) * | 2016-01-20 | 2016-06-29 | 上海斐讯数据通信技术有限公司 | 一种故障信息的重现方法和重现装置 |
JP6957936B2 (ja) * | 2017-03-31 | 2021-11-02 | 日本電気株式会社 | 障害解析装置、障害解析方法および障害解析プログラム |
US10725890B1 (en) | 2017-07-12 | 2020-07-28 | Amazon Technologies, Inc. | Program testing service |
US10152432B1 (en) | 2017-07-26 | 2018-12-11 | Dell Products L.P. | Support information provisioning system |
JP7073653B2 (ja) * | 2017-09-08 | 2022-05-24 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置 |
WO2019209306A1 (en) * | 2018-04-26 | 2019-10-31 | Google Llc | Auto-form fill based website authentication |
JP7134903B2 (ja) * | 2019-03-05 | 2022-09-12 | 株式会社日立製作所 | 不具合再現支援システム、不具合再現支援方法 |
US11474930B2 (en) * | 2019-12-19 | 2022-10-18 | Vmware, Inc. | Software bug reproduction |
JP7254739B2 (ja) * | 2020-03-19 | 2023-04-10 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | データ流通制御装置、方法およびプログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01177642A (ja) * | 1988-01-08 | 1989-07-13 | Fujitsu Ltd | 計算機システムにおける障害診断方式 |
JPH06139093A (ja) * | 1992-10-29 | 1994-05-20 | Fujitsu Ltd | ハードウェア障害の再現試験方式 |
JP2001005697A (ja) * | 1999-06-25 | 2001-01-12 | Hitachi Ltd | 障害発生部品への障害情報記録方式 |
JP3640187B2 (ja) * | 2002-07-29 | 2005-04-20 | 日本電気株式会社 | マルチプロセッサシステムの障害処理方法、マルチプロセッサシステム及びノード |
JP2004070859A (ja) * | 2002-08-09 | 2004-03-04 | Fujitsu Ltd | 障害情報管理システム |
US20050273653A1 (en) * | 2004-05-19 | 2005-12-08 | Honeywell International Inc. | Single fault tolerance in an architecture with redundant systems |
US7343521B2 (en) * | 2004-05-28 | 2008-03-11 | International Business Machines Corporation | Method and apparatus to preserve trace data |
JP4515314B2 (ja) * | 2005-04-08 | 2010-07-28 | 株式会社日立製作所 | 計算機システムの構成再現方法 |
US7647527B2 (en) * | 2006-01-11 | 2010-01-12 | International Business Machines Corporation | Apparatus and method for collecting and displaying data for remote diagnostics |
DE602006020782D1 (de) * | 2006-01-31 | 2011-04-28 | Fujitsu Ltd | Systemüberwachungseinrichtungssteuerverfahrren, programm und computersystem |
US7743304B2 (en) * | 2006-02-17 | 2010-06-22 | Verigy (Singapore) Pte. Ltd. | Test system and method for testing electronic devices using a pipelined testing architecture |
JP2009020799A (ja) * | 2007-07-13 | 2009-01-29 | D & M Holdings Inc | 障害解析システム及び家庭用機器 |
JP4897654B2 (ja) * | 2007-12-05 | 2012-03-14 | 三菱電機株式会社 | 再現試験システム |
-
2010
- 2010-08-27 WO PCT/JP2010/064605 patent/WO2012026035A1/ja active Application Filing
- 2010-08-27 JP JP2012530495A patent/JP5459405B2/ja active Active
-
2013
- 2013-02-26 US US13/776,802 patent/US20130173964A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2012026035A1 (ja) | 2012-03-01 |
US20130173964A1 (en) | 2013-07-04 |
JP5459405B2 (ja) | 2014-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5459405B2 (ja) | 障害処理方法,障害処理システム,障害処理装置及び障害処理プログラム | |
US6976197B2 (en) | Apparatus and method for error logging on a memory module | |
US10037238B2 (en) | System and method for encoding exception conditions included at a remediation database | |
US7168007B2 (en) | Field replaceable unit (FRU) identification system tool | |
US20070168571A1 (en) | System and method for automatic enforcement of firmware revisions in SCSI/SAS/FC systems | |
US7137020B2 (en) | Method and apparatus for disabling defective components in a computer system | |
US20080184271A1 (en) | Automated Diagnostic Service | |
US9058230B1 (en) | Online expert system guided application installation | |
US20070028041A1 (en) | Extended failure analysis in RAID environments | |
JP2006260568A (ja) | アクティブ及び非アクティブ実行コアを有するマルチコアプロセッサ | |
JP4387968B2 (ja) | 障害検出装置および障害検出方法 | |
US11093321B1 (en) | System and method for automatically updating an information handling system upon system crash | |
JP2017091077A (ja) | 擬似故障の発生プログラム、発生方法、及び発生装置 | |
WO2023226380A1 (zh) | 一种磁盘处理方法、系统及电子设备 | |
US7131030B2 (en) | Method and system for storing field replaceable unit repair history information | |
US6973412B2 (en) | Method and apparatus involving a hierarchy of field replaceable units containing stored data | |
GB2398405A (en) | Consolidating data regarding a hierarchy of field replaceable units containing stored data | |
GB2342471A (en) | Configuring system units | |
US8161324B2 (en) | Analysis result stored on a field replaceable unit | |
US7707890B2 (en) | Acoustic sensor for proactive fault monitoring in computer systems | |
US20030217247A1 (en) | Method and system for storing field replaceable unit static and dynamic information | |
JP5419639B2 (ja) | 計算機装置及び情報処理方法及びプログラム | |
Eldor | Stability Issues in On-Premises Kafka Data Centers | |
JP3664466B2 (ja) | メモリ・チェック・テスト実行方法及び記憶媒体 | |
JP4894592B2 (ja) | 情報通知装置、情報通知方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131230 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5459405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |