JP2004013238A - ディスクアレイ装置における障害発生時の再現テスト方法 - Google Patents

ディスクアレイ装置における障害発生時の再現テスト方法 Download PDF

Info

Publication number
JP2004013238A
JP2004013238A JP2002162237A JP2002162237A JP2004013238A JP 2004013238 A JP2004013238 A JP 2004013238A JP 2002162237 A JP2002162237 A JP 2002162237A JP 2002162237 A JP2002162237 A JP 2002162237A JP 2004013238 A JP2004013238 A JP 2004013238A
Authority
JP
Japan
Prior art keywords
information
disk array
host device
array device
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002162237A
Other languages
English (en)
Inventor
Keita Sato
佐藤 敬太
Hiroyuki Fukuchi
福地 廣行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002162237A priority Critical patent/JP2004013238A/ja
Publication of JP2004013238A publication Critical patent/JP2004013238A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】ホスト装置との間で複数のアクセスパスを持つディスクアレイ装置において、発生した障害についての再現性を高めたテスト方法を提供すること。
【解決手段】このため本発明では、ホスト装置50から複数のアクセスパスp0〜p2を経由して送出されたコマンドを含むインタフェース情報を受信した時刻情報とともに保持するトレース手段と、この保持したトレース情報を前記時刻情報にもとづき時間軸に沿ってマージするトレース情報マージ手段52と、このマージされた情報からコマンドをプログラミング化するプログラム変換手段53を備え、ディスクアレイ装置51に障害が発生したとき、保持するトレース情報に基づき、マージ手段がインタフェース情報をマージした後、これをプログラム変換手段53によりプログラミング化してホスト装置50に送出し、ホスト装置50が前記障害発生時の状態を正確に再現することを可能とした。
【選択図】    図1

Description

【0001】
【発明の属する技術分野】本発明は、ホスト装置とディスクアレイ装置との間で複数のアクセスパスを持つような、冗長性が考慮されたディスクアレイ装置において、ある特定のオペレーションやタイミングにより発生する障害についての再現性を高め障害調査に役立せるテスト方法に関する。
【0002】
【従来の技術】従来では、図3に示す如く、ホスト装置10とディスクアレイ装置11とは1本のアクセスパスで接続されていた。この場合、ホスト装置10からコマンドA、B、C、D、Eを順次発行してディスクアレイ装置にアクセスパスpを経由して送出し、これを実行させたとき、障害が発生してこれを調査する場合、ディスクアレイ装置11側で、このアクセスパスpのインタフェース上から採取したトレース情報を元にして、プログラム変換手段12によりホスト装置10が実行可能なプログラムを作成し、再びコマンドA、B、C、D、Eを作成してこの順番通り発行し、障害発生時の再現環境を実現することができる。なおコマンドにはパラメータが含まれている。
【0003】
しかしこのようなアクセスパスが1本の場合、アクセスパスに障害が発生したときシステムが動作できなくなるようなトラブルを生ずることになる。そのため現在ではホスト装置とディスクアレイ装置の間は高い信頼性と処理の効率化を確保するために、複数のインタフェースを持ち、複数のアクセスパスで接続することが一般的である。
【0004】
複数のアクセスパスを設けることにより、アクセスパスの1本に障害が発生しても他のアクセスパスを使用してコマンドを送出し、動作を継続することができる。また複数のアクセスパスを設けることにより、コマンドA〜Eと並行して別のジョブのコマンドA′〜E′を送出できるので、処理の高速化をはかることができる。
【0005】
【発明が解決しようとする課題】従来の技術では、ある特定パスのインタフェース上のトレース情報を元に実行可能なプログラムを作成し、ホスト装置で再現テストを実施しているので、複数のアクセスパスを持つようなディスクアレイ装置では、各インタフェース同士の時間的な同期が取れないため、障害発生時の状況を忠実に再現することができなかった。
【0006】
例えば、図3に示す如く、ホスト装置10とディスクアレイ装置11が1つのアクセスパスpで接続されている場合には、ホスト装置10からコマンドA、B、C、D、Eがこの順番に発行されても、ディスクアレイ装置11側ではこの順番通りに受信でき、プログラム変換手段12ではこの受信データつまり採取したトレース情報にもとづき、コマンドA、B・・・をホスト装置10が発行した順番通りに発行することができる。
【0007】
しかし図4に示す如く、ホスト装置10とディスクアレイ装置11とが複数のアクセスパスp0、p1、p2で接続されている場合には、各アクセスパスp0、p1、p2同士の同期が取れていないため、アクセスパスp0〜p2を使用して、アクセスパスp0〜p2上に数字1〜5で示す順番でコマンドA、B、C、C、D、Eを発行したとき、各アクセスパスp0、P1、P2同士の同期が取れていないために、ディスクアレイ装置11の受信データにもとづくもコマンドを順番通りに発行することができなくなってしまう。
【0008】
すなわち、ディスクアレイ装置11では、アクセスパスp0により先ずコマンドAを受信し、次にコマンドCを受信したこと、アクセスパスp1では先ずコマンドDを受信し次にコマンドEを受信したこと、アクセスパスp2ではコマンドBを受信したことが識別され、各アクセスパスp0〜p2においてディスクアレイ装置11ではこれらのコマンドA〜Eをどのような順番で受信されたのかということは判断されていなかった。
【0009】
このように各アクセスパスp0、p1、p2同士の同期が取れていないため、コマンドを順番通りに発行することができなくなっていた。
【0010】
プログラム変換手段13には、アクセスパスp0からコマンドA、Cがこの順番で受信されたこと、アクセスパスp1からコマンドD、Eがこの順番で受信されたこと、アクセスパスp2からコマンドBが受信されたというトレース情報が通知され、これらの各コマンド間の順番は通知されない。
【0011】
このためプログラム変換手段13では、ホスト装置10に対してアクセスパスp0に対してはコマンドA、Cの順番のプログラミング化情報を提供し、アクセスパスp1に対してはコマンドD、Eの順番のプログラミング化情報を提供し、アクセスパスp2に対してはコマンドBによるプログラミング化情報を提供することになり、障害発生時の状況を忠実に再現することができなかった。
【0012】
したがって本発明の目的は、ホスト装置とディスクアレイ装置との間に複数のアクセスパスが設けられた冗長性を考慮したディスクアレイ装置に対しても、障害が発生したとき、コマンドを順番通りに再発行することを可能とした障害発生時の再現テスト方法を提供することである。
【0013】
【課題を解決するための手段】本発明の原理を図1にもとづき説明する。図1において、50はホスト装置、51はディスクアレイ装置、52はトレース情報マージ手段、53はプログラム変換手段である。
【0014】
本発明の前記目的は、ホスト装置50と複数のアクセスパスp0、p1、p2で接続されたディスクアレイ装置51における障害発生時の再現テスト方法において、ホスト装置50から複数のアクセスパスを経由して送出されたコマンドを含むインタフェース情報をトレース情報として受信した時刻情報とともに保持するトレース手段と、このトレース手段において保持したトレース情報を前記時刻情報にもとづき時間軸に沿ってマージするトレース情報マージ手段52と、このマージされた情報からパラメータを含むコマンドをプログラミング化するプログラム変換手段53を備え、ディスクアレイ装置51に障害が発生したとき、トレース手段において保持されているトレース情報に基づき、トレース情報マージ手段52がコマンド情報を含むインタフェース情報をマージした後、これをプログラム変換手段53によりプログラミング化してホスト装置50に送出し、ホスト装置50が前記障害発生のときの状態を正確に再現することを可能としたことを特徴とするディスクアレイ装置における障害発生時の再現テスト方法により達成することができる。
【0015】
これにより冗長性を考慮した複数のアクセスパスを持つディスクアレイ装置においても、障害発生時に採取される各アクセスパスのトレース情報を一旦時間軸にしたがって並べ、パラメータを含むコマンドをプログラミング化して、各アクセスパスに送出されるコマンドのタイミングまでも考慮した忠実な障害発生時の再現テストを実施することができ、障害の早期原因究明が可能となる。
【0016】
勿論アクセスパス情報も付加してトレース情報を時間軸でマージするので、コマンドが送出されるアクセスパスも障害発生時と同一にすることができ忠実な障害発生再現テストを実行することができる。
【0017】
【発明の実施の形態】本発明の実施の形態を図2により説明する。図2において他図と同一記号は同一部を示し、54は監視手段、61〜63はディスクアレイ装置51のインタフェース、64はトレース部、65は制御部である。
【0018】
ホスト装置50はデータ処理を行い、処理結果をディスクアレイ装置51に格納したり、データ処理に必要なデータをディスクアレイ装置51より取り出すものであり、またジョブの終了が正常終了か異常終了か等を監視するものである。
【0019】
ディスクアレイ装置51は、図示省略した複数のディスク装置を備え、この複数のディスク装置に対してデータの読み出し、書き込み処理を行うものである。ディスクアレイ装置51には、後述するインタフェース61、62、63、トレース部64、制御部65を具備している。
【0020】
トレース情報マージ手段52は、ディスクアレイ装置51から伝達されたトレース情報を、それに付記されている時刻情報にもとづき時間軸に沿ってマージ処理して、このトレース情報が実行された順番になるように並べるものである。
【0021】
プログラム変換手段53は、トレース情報マージ手段52から伝達されたトレース情報をホスト装置50側が実行可能なプログラム化してホスト装置50に送出するものである。
【0022】
監視手段54は、ディスクアレイ装置51に障害が発生したときこれを表示してオペレータに指示したり、オペレータがこれをみて再現テストを指示する再現テスト指示信号を入力するものである。
【0023】
インタフェース61、62、63は、それぞれアクセスパスp0、p1、p2から伝達されたコマンドの如き受信データを一時保持するものである。このとき受信データにそれを受信したときの時刻情報を付加して保持する。このとき受信データがコマンドの場合には、そのグループを識別するためのジョブ識別番号がホスト装置側から記入されているので、どれとどのコマンドが同一のグループか区別することができる。
【0024】
トレース部64は、インタフェース61〜63に保持されたコマンド列等を一時保持して、ディスクアレイ装置51における動作履歴を記憶するものである。
【0025】
制御部65はディスクアレイ装置51を動作制御するものであり、各コマンド群の動作結果が正常の場合正常終了信号を受け、異常の場合障害発生信号を受けこれらをホスト装置50に通知する。そしてホスト装置50より正常終了による消去信号を受けたとき、正常終了したコマンド群のジョブ識別番号によりトレース部64で保持しているそのジョブ識別番号のコマンド群を消去する。
【0026】
本発明の動作について説明する。
【0027】
ホスト装置50からディスクアレイ装置51に対して、ジョブの実行のためにコマンドA、B、C、D、Eをこの順序で送出する。このとき、コマンドAとCはアクセスパスp0により送出し、コマンドBはアクセスパスp2により、コマンドDとEはアクセスパスp1により送出される。
【0028】
ディスクアレイ装置51では、これをインタフェース61、62、63で受信し、これらコマンドA〜Eを時刻情報を付加し、別に実行する。このときトレース部64では、この受信したコマンドA〜Eをその時刻情報、アクセスパス情報、コマンド群のジョブ識別番号とともに保持する。
【0029】
ディスクアレイ装置51は、このコマンドA〜Eを実行した結果が正常終了であれば、これがそのジョブ識別番号とともに制御部65に報告され、制御部65はこれをホスト装置50に報告し、ホスト装置50から消去信号を受けたとき、これをトレース部64に通知し、トレース部64で保持しているコマンドA〜Eを消去処理させる。
【0030】
しかしこのコマンドA〜Eの実行結果が異常終了であれば、制御部65にこれがそのジョブ識別番号とともに障害発生信号として報告される。
【0031】
制御部65はこれを一時保持するとともに、制御線cを経由してホスト装置50にこの障害発生を通知する。
【0032】
ホスト装置50はこれにより監視手段54にこの障害発生を表示し、オペレータに報告する。オペレータはこれをみて、再現テストが必要と認識したとき再現テスト指示を監視手段54より入力する。
【0033】
この再現テスト指示はホスト装置50を経由してディスクアレイ装置51の制御部65に通知され、制御部65はその一時保持していたジョブ識別番号をトレース部64に送出し、トレース部64よりそのジョブ識別番号のコマンド群つまりトレース情報をその時刻情報、アクセスパス情報と共にトレース情報マージ手段52に送出する。
【0034】
トレース情報マージ手段52はこのコマンド群をその時刻情報をもとにして時間軸にしたがって並べ、各コマンドにアクセスパス情報を付加してプログラム変換手段53に送出する。
【0035】
プログラム変換手段53は、このマージされたトレース情報をもとにしてホスト装置50で実行できるプログラム形式に変換してホスト装置50に送出される。
【0036】
ホスト装置50は、このようにして再現されたプログラムのコマンドを、各コマンドが送出されたアクセスパスまで含めて順番通りに発行し、障害発生の状況を忠実に再現することができる。
【0037】
なお前記説明ではアクセスパス上に1組のコマンド列が送出されている例について説明したが、本発明は勿論これに限定されるものではなく、複数組のコマンド列が送出されている場合においても同様に実施できるものである。
【0038】
【発明の効果】本発明によれば下記の効果を奏することができる。
【0039】
本発明により冗長性を考慮した複数のアクセスパスを持つディスクアレイ装置においても、障害発生時に採取される各アクセスパスのトレース情報を一旦時間軸にしたがって並べパラメータを含むコマンドをプログラミング化して、各アクセスパスに送出されるコマンドのタイミングまでも考慮した忠実な障害発生時の再現テストを実施することができ、障害の早期原因究明が可能となる。
【0040】
勿論アクセスパス情報も付加してトレース情報を時間軸でマージするので、コマンドが送出されるアクセスパスも障害発生時と同一にすることができ忠実な障害発生再現テストを実行することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の実施の形態である。
【図3】従来例説明図である。
【図4】複数のアクセスパスを持つ従来のディスクアレイ装置の問題点説明図である。
【符号の説明】
50 ホスト装置
51 ディスクアレイ装置
52 トレース情報マージ手段
53 プログラム変換手段
54 監視手段
61〜63 インタフェース
64 トレース部

Claims (1)

  1. ホスト装置と複数のアクセスパスで接続されたディスクアレイ装置における障害発生時の再現テスト方法において、
    ホスト装置から複数のアクセスパスを経由して送出されたコマンドを含むインタフェース情報をトレース情報として受信した時刻情報とともに保持するトレース手段と、
    このトレース手段において保持したトレース情報を前記時刻情報にもとづき時間軸に沿ってマージするトレース情報マージ手段と、
    このマージされた情報からパラメータを含むコマンドをプログラミング化するプログラム変換手段を備え、
    ディスクアレイ装置に障害が発生したとき、トレース手段において保持されているトレース情報に基づき、マージ手段がコマンド情報やパラメータ等を含むインタフェース情報をマージした後、これをプログラム変換手段によりプログラミング化してホスト装置に送出し、ホスト装置が前記障害発生のときの状態を正確に再現することを可能としたことを特徴とするディスクアレイ装置における障害発生時の再現テスト方法。
JP2002162237A 2002-06-04 2002-06-04 ディスクアレイ装置における障害発生時の再現テスト方法 Withdrawn JP2004013238A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002162237A JP2004013238A (ja) 2002-06-04 2002-06-04 ディスクアレイ装置における障害発生時の再現テスト方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002162237A JP2004013238A (ja) 2002-06-04 2002-06-04 ディスクアレイ装置における障害発生時の再現テスト方法

Publications (1)

Publication Number Publication Date
JP2004013238A true JP2004013238A (ja) 2004-01-15

Family

ID=30431024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002162237A Withdrawn JP2004013238A (ja) 2002-06-04 2002-06-04 ディスクアレイ装置における障害発生時の再現テスト方法

Country Status (1)

Country Link
JP (1) JP2004013238A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010271879A (ja) * 2009-05-21 2010-12-02 Fujitsu Ltd ディスクアレイ装置の障害再現方法及び障害再現装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010271879A (ja) * 2009-05-21 2010-12-02 Fujitsu Ltd ディスクアレイ装置の障害再現方法及び障害再現装置

Similar Documents

Publication Publication Date Title
US20060200701A1 (en) Kernel-mode in-flight recorder tracing mechanism
WO2015136959A1 (ja) 制御システム、方法、プログラムおよび情報処理装置
TWI566090B (zh) Debugging firmware / software to produce tracking systems and methods, recording media and computer program products
IE60444B1 (en) A software verification apparatus
KR100985749B1 (ko) 내장형 시스템 소프트웨어 자동 테스트 시스템 및 방법과테스트 시나리오 작성 방법
CN110659197B (zh) 应用程序的测试用例生成方法、装置和软件测试系统
JP2004013238A (ja) ディスクアレイ装置における障害発生時の再現テスト方法
JP5396759B2 (ja) 情報処理装置、画像処理装置、ソフトウェア動作テスト方法、ソフトウェア動作テストプログラム、及びそのプログラムを記録した記録媒体
US7159142B2 (en) Pseudo I/O system and method
US10216525B1 (en) Virtual disk carousel
JPH10133914A (ja) 計算機システム及びデバイス入出力シミュレータ
US20070220485A1 (en) Code Editing for Data Traffic Modification
JP2004101203A (ja) ロジックlsiの不良解析システム及び不良解析方法
TWI641247B (zh) 訊息處理方法
JP2006155047A (ja) 検証システム及び検証方法
JPS6245266A (ja) 通信端末装置のリモ−ト故障診断・故障修復方法
JP5604905B2 (ja) 仮想テープ装置
JP2007080292A (ja) デバッグシステム
JP5627320B2 (ja) 動画保存装置及び動画保存システム
JP3348251B2 (ja) 入出力装置
CN117707870A (zh) 一种pci-e链路问题处理方法、装置、设备及介质
CN116521555A (zh) 测试用例的录制方法、回放方法、装置和计算设备
JP2003114834A (ja) Usbデバイス評価システム
JPH04220752A (ja) 入出力装置
JPH08297614A (ja) 磁気ディスク装置の評価方法および装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050906