JP2002351755A - Trouble generating device and testing method for computer system - Google Patents

Trouble generating device and testing method for computer system

Info

Publication number
JP2002351755A
JP2002351755A JP2001155357A JP2001155357A JP2002351755A JP 2002351755 A JP2002351755 A JP 2002351755A JP 2001155357 A JP2001155357 A JP 2001155357A JP 2001155357 A JP2001155357 A JP 2001155357A JP 2002351755 A JP2002351755 A JP 2002351755A
Authority
JP
Japan
Prior art keywords
scsi
failure
fault
input
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001155357A
Other languages
Japanese (ja)
Inventor
Mariko Shimizu
満里子 清水
Akira Sasaki
晃 佐々木
Mitsuru Kawasaki
満 川崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001155357A priority Critical patent/JP2002351755A/en
Publication of JP2002351755A publication Critical patent/JP2002351755A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To easily conduct a test of operation in case of trouble by causing dummy trouble without any anxiety about device breakage as to a computer system to which peripheral equipment is connected by an input/output interface. SOLUTION: In the computer system constituted by connecting the peripheral equipment 130 to a shot computer 110 by the input/output interface of redundant constitution of SCSI buses 121 and 122, etc., a trouble generating device 200 which artificially causes trouble by operating a signal on the SCSI bus 121 when intercepting a bus signal and detecting an input/output request to an object device is connected to the SCSI bus 121 to repeatedly generate trouble state on the SCSI bus 121 in a specified period without actually extracting a cable nor turning off the power source and disable retrial recovery by a low-order SCSI driver, etc., thereby conducting the test of operation in case of trouble as to whether processing for replacement with the SCSI bus 122 of the redundancy system functions.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、障害発生技術およ
びコンピュータシステムの試験技術に関し、特に、SC
SI等で接続されたDASD(Direct Acce
ss Storage Device)等の入出力機器
を含むコンピュータシステムシステムの試験等に適用し
て有効な技術に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a technique for generating a fault and a technique for testing a computer system, and more particularly to an SC technique.
DASD (Direct Access) connected by SI, etc.
The present invention relates to a technology effective when applied to a test of a computer system system including input / output devices such as ss storage device).

【0002】[0002]

【従来の技術】たとえば、高い信頼性が要求される企業
等の基幹業務では、従来では、メインフレームと称され
る大型汎用コンピュータを用いたシステム構築が一般的
であったが、小型コンピュータ用の汎用マイクロプロセ
ッサや汎用オペレーティングシステム等の急速な性能向
上に呼応して、いわゆるオープン系と称されるコンピュ
ータシステムも採用される傾向にある。
2. Description of the Related Art For example, in a core business of a company or the like that requires high reliability, a system construction using a large general-purpose computer called a mainframe has been generally used. In response to the rapid performance improvement of general-purpose microprocessors and general-purpose operating systems, computer systems called open systems tend to be adopted.

【0003】このようなオープン系のコンピュータシス
テムでは、外部記憶装置等の周辺機器として多様なメー
カの製品が採用されることが多いため、周辺機器の接続
には、SCSI等の標準汎用入出力インタフェースが採
用されている。
In such an open computer system, since products of various manufacturers are often used as peripheral devices such as an external storage device, a standard general-purpose input / output interface such as SCSI is used to connect the peripheral devices. Has been adopted.

【0004】一方、オープン系のコンピュータシステム
や周辺機器の信頼性は、メインフレーム系のそれに対し
て必ずしも高くなく、このため、サーバコンピュータや
外部記憶装置の二重化等のようなシステムの冗長化によ
って基幹業務等のシステム構築における高信頼性の確保
を実現している。
On the other hand, the reliability of open computer systems and peripheral devices is not always higher than that of mainframe systems, and therefore, the key is to be achieved by system redundancy such as duplication of server computers and external storage devices. High reliability has been ensured in the construction of systems such as business.

【0005】このような冗長構成のシステムでは周辺機
器等における障害発生時に、予定した信頼性が確保され
るか否かを確認するための障害時運用試験が必須とな
る。
In such a redundant system, when a failure occurs in a peripheral device or the like, a failure operation test for confirming whether or not the expected reliability is secured is essential.

【0006】従来、このような障害時運用試験等の障害
テストを実施するには、たとえばシステム内の試験対象
部分に接続されたケーブルを実際に引き抜くか、試験対
象部分の電源を切断するなどで意図的に障害を発生させ
ていた。
Conventionally, a failure test such as an operation test at the time of a failure is performed by, for example, actually pulling out a cable connected to a portion to be tested in the system or turning off a power supply of the portion to be tested. Failure was intentionally caused.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、上述の
ように実際にケーブルを引き抜く等の方法では、残存電
力や慣性動力で現実に装置を破壊してしまう懸念があ
る。また、上述のケーブル抜去のようにハードウェアの
一部を改変して意図した障害を的確に発生させるために
は、ハードウェア等のシステム構成に精通した専門の係
員を立ち会わせる必要がある。
However, in the method of actually pulling out the cable as described above, there is a concern that the apparatus is actually destroyed by the residual power or inertial power. In addition, in order to modify a part of the hardware and properly generate an intended failure as in the case of the above-described cable removal, it is necessary to have a specialized staff familiar with the system configuration of the hardware and the like present.

【0008】このため、目的の周辺機器の障害発生をソ
フトウェアで代行させる(シミュレートする)ことも考
えられるが、せっかく完成しているソフトウェアシステ
ムを試験用に改造するための工数が余分に掛かり、さら
に、障害をシミュレートするだけなので、テストの成否
の判断も困難である。
For this reason, it is conceivable to substitute (simulate) the occurrence of a failure in a target peripheral device by software, but it takes extra steps to modify the completed software system for testing. Furthermore, it is difficult to judge the success or failure of the test because it only simulates a failure.

【0009】以上のような理由で、完成したコンピュー
タシステムで、実際に障害時運用試験等のテストを行う
事が難しかった。
For the reasons described above, it is difficult to actually perform a test such as an operation test at the time of failure in a completed computer system.

【0010】本発明の目的は、システムの破壊の懸念を
生じることなく、かつ専門家の立ち会い等を必要とする
ことなく、標準汎用入出力インタフェースにおける実際
の障害を的確に発生させることで、障害時運用試験等の
コンピュータシステムの試験を、簡便に、必要な時に何
度でも行うことを可能にする技術を提供することにあ
る。
[0010] It is an object of the present invention to accurately generate an actual failure in a standard general-purpose input / output interface without causing concern about system destruction and without requiring the presence of an expert. It is an object of the present invention to provide a technology that enables a computer system test such as a time operation test to be performed easily and as often as necessary.

【0011】本発明の他の目的は、コンピュータシステ
ムのソフトウェア等に変更を加えることなく、標準汎用
入出力インタフェースにおける実際の障害を的確に発生
させることで、障害時運用試験等のコンピュータシステ
ムの試験の成否の判断を確実に行うことが可能な技術を
提供することにある。
Another object of the present invention is to accurately generate an actual failure in a standard general-purpose input / output interface without changing the software or the like of the computer system, thereby enabling a computer system test such as a failure operation test. It is an object of the present invention to provide a technology capable of reliably determining the success or failure of the above.

【0012】本発明の他の目的は、冗長化によって高信
頼性を実現するコンピュータシステムにおいて、障害発
生時運用におけるシステムの信頼性の維持を確実に検証
することが可能な技術を提供することにある。
Another object of the present invention is to provide a technique capable of reliably verifying the maintenance of the reliability of a computer system in the event of a failure in a computer system realizing high reliability through redundancy. is there.

【0013】[0013]

【課題を解決するための手段】本発明は、コンピュータ
システムにおける標準汎用入出力インタフェースに対す
る接続手段と、前記標準汎用入出力インタフェースにお
ける少なくとも一種類の疑似障害を意図的に発生させる
疑似障害発生手段と、を含む障害発生装置を提供する。
SUMMARY OF THE INVENTION The present invention relates to a connection means for a standard general-purpose input / output interface in a computer system, and a pseudo-failure generating means for intentionally generating at least one type of pseudo-failure in the standard general-purpose input / output interface. And a failure generating device including:

【0014】より具体的には、一例として、ホストコン
ピュータとDASD等の周辺機器との間が、前記標準汎
用入出力インタフェースの一種であるSCSIバスで接
続された構成においては、このSCSIバスには、当該
SCSIバス上での入出力プロトコルを制御する複数の
コントローラが接続でき、個々のコントローラは、他の
コントローラが処理する入出力要求も読み取れる。
More specifically, as an example, in a configuration in which a host computer and a peripheral device such as a DASD are connected by a SCSI bus which is a kind of the standard general-purpose input / output interface, the SCSI bus has A plurality of controllers for controlling an input / output protocol on the SCSI bus can be connected, and each controller can also read an input / output request processed by another controller.

【0015】この特徴を利用して、SCSIコントロー
ラの機能を有する障害発生装置をSCSIバスの任意の
部位に接続して、他のコントローラ間の処理を傍受し、
特定の周辺機器に対する入出力要求を検知した時、たと
えば当該入出力要求の実行期間だけ(SCSIの場合に
は、セレクションフェーズからバスフリーフェーズまで
の間)、選択的にSCSIバス上の信号を操作して、障
害情報をバス上に載せ、バスエラーやパリティエラー等
の疑似障害を確実に発生させる。
By utilizing this feature, a fault occurrence device having the function of a SCSI controller is connected to an arbitrary portion of a SCSI bus to intercept processing between other controllers.
When an input / output request to a specific peripheral device is detected, for example, only during the execution period of the input / output request (in the case of SCSI, from the selection phase to the bus free phase), signals on the SCSI bus are selectively operated. Then, the fault information is put on the bus, and a pseudo fault such as a bus error or a parity error is reliably generated.

【0016】これにより、たとえば、ケーブルの引き抜
きや電源切断等のように、ホストコンピュータにSCS
Iで接続するDASD等の周辺機器を物理的に破壊する
懸念を生じることなく、DASDで障害が発生したかの
ような障害発生状態を簡便に実現できる。
Thus, the SCS is connected to the host computer, for example, by pulling out a cable or cutting off the power.
A failure occurrence state as if a failure has occurred in the DASD can be easily realized without causing a concern that a peripheral device such as a DASD connected by I is physically destroyed.

【0017】この障害発生を検知したコントローラは、
ホストコンピュータ(I/O要求元)に障害報告を報告
する。ホストコンピュータシステムにおけるSCSIド
ライバや業務プログラム等のソフトウェア群は、この障
害報告をきっかけに障害発生時の動作を行い、この動作
がシステム設計者の意図通りであるかの確認が可能とな
る。
The controller which has detected the occurrence of the fault,
Report a failure report to the host computer (I / O request source). The software group such as the SCSI driver and the business program in the host computer system performs an operation at the time of occurrence of the failure in response to the failure report, and it is possible to confirm whether the operation is as intended by the system designer.

【0018】[0018]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0019】図1は、本発明の一実施の形態である障害
発生装置を用いたコンピュータシステムの試験方法が実
施されるコンピュータシステムの構成の一例を示す概念
図であり、図2は、本実施の形態のコンピュータシステ
ムにおける障害発生時の作用の一例を示す概念図、図3
は、本実施の形態の障害発生装置の作用の一例を示すフ
ローチャート、図4は、本実施の形態の障害発生装置の
機能構成の一例を示すブロック図、図5および図6は、
本実施の形態の障害発生装置の外観の一例を示す斜視図
である。
FIG. 1 is a conceptual diagram showing an example of the configuration of a computer system in which a computer system test method using a fault occurrence device according to an embodiment of the present invention is implemented. FIG. FIG. 3 is a conceptual diagram showing an example of an operation when a failure occurs in the computer system according to the embodiment.
Is a flowchart illustrating an example of the operation of the fault generating device according to the present embodiment, FIG. 4 is a block diagram illustrating an example of a functional configuration of the fault generating device according to the present embodiment, and FIGS.
It is a perspective view showing an example of the appearance of a fault occurrence device of this embodiment.

【0020】図1に例示されるように、本実施の形態の
コンピュータシステム100は、ホストコンピュータ1
10と、このホストコンピュータ110に、SCSIバ
ス120等の標準汎用入出力インタフェースを介して接
続されたDASD等の周辺機器130からなる。
As illustrated in FIG. 1, a computer system 100 according to this embodiment includes a host computer 1
And a peripheral device 130 such as a DASD connected to the host computer 110 via a standard general-purpose input / output interface such as a SCSI bus 120.

【0021】本実施の形態の場合、ホストコンピュータ
110と周辺機器130との間を接続するSCSIバス
120は、SCSIバス121およびSCSIバス12
2のように二重化されている。以下の説明では、総称的
な場合にはSCSIバス120と記し、個別的な場合に
はSCSIバス121およびSCSIバス122と記
す。
In the case of this embodiment, the SCSI bus 120 connecting the host computer 110 and the peripheral device 130 is composed of a SCSI bus 121 and a SCSI bus 12.
It is duplicated like 2. In the following description, a generic case is described as a SCSI bus 120, and a specific case is described as a SCSI bus 121 and a SCSI bus 122.

【0022】すなわち、ホストコンピュータ110に
は、SCSIバス121およびSCSIバス122の各
々が接続されるSCSIアダプタ111およびSCSI
アダプタ112が設けられ、バス113を介して、プロ
セッサ114および主記憶115に接続されている。主
記憶115には、SCSIドライバ115a、オペレー
ティングシステム115b、業務プログラム115cが
実装されている。そして、プロセッサ114が、これら
の主記憶115内のソフトウェアを実行することで、S
CSIアダプタ111、SCSIアダプタ112および
SCSIバス121、SCSIバス122を介して接続
された周辺機器130との間における情報の入出力が実
行される。
That is, the host computer 110 has a SCSI adapter 111 and a SCSI adapter 111 to which each of the SCSI bus 121 and the SCSI bus 122 is connected.
An adapter 112 is provided and connected to a processor 114 and a main memory 115 via a bus 113. In the main memory 115, a SCSI driver 115a, an operating system 115b, and a business program 115c are mounted. Then, the processor 114 executes the software in the main storage 115 to execute S
Input and output of information between the CSI adapter 111, the SCSI adapter 112, and the peripheral devices 130 connected via the SCSI bus 121 and the SCSI bus 122 are executed.

【0023】周辺機器130は、SCSIバス121お
よびSCSIバス122の各々に個別に接続される複数
のコントローラ131およびコントローラ132と、こ
れら複数のコントローラ131および132にて共有さ
れる複数の論理ユニット133(DASD133−0〜
133−n)からなる。
The peripheral device 130 includes a plurality of controllers 131 and 132 individually connected to the SCSI bus 121 and the SCSI bus 122, respectively, and a plurality of logical units 133 (shared by the controllers 131 and 132). DASD133-0
133-n).

【0024】ホストコンピュータ110によるアクセス
対象の個々の論理ユニット133の特定は、コントロー
ラ131およびコントローラ132の各々に付与された
SCSI IDと、当該SCSI ID毎に複数設定さ
れる論理ユニット番号(LUN)を用いて行われる。
The identification of each logical unit 133 to be accessed by the host computer 110 includes the SCSI ID assigned to each of the controller 131 and the controller 132 and a plurality of logical unit numbers (LUNs) set for each SCSI ID. It is performed using.

【0025】SCSIバス121およびSCSIバス1
22の各々の末端は、終端抵抗等のターミネータ121
a、ターミネータ122a、が設けられている。
SCSI bus 121 and SCSI bus 1
Each terminal of the terminator 22 has a terminator 121 such as a terminating resistor.
a, and a terminator 122a.

【0026】すなわち、本実施の形態の場合、ホストコ
ンピュータ110から個々の論理ユニット133に対す
るアクセス経路は、複数のSCSIアダプタ111、S
CSIアダプタ112およびSCSIバス121、SC
SIバス122および対応するコントローラ131およ
び132にて冗長化され、ホストコンピュータ110
は、一方の経路に障害が発生しても、他方の経路を用い
て目的の論理ユニット133に対するアクセスを継続可
能にして、システムの信頼性を向上させている。また、
双方の経路が健全な場合には、これら二つのデータ転送
経路を用いた並行的なデータ転送により、入出力性能の
向上を実現している。
That is, in the case of the present embodiment, the access path from the host computer 110 to each logical unit 133 corresponds to the plurality of SCSI adapters 111 and S
CSI adapter 112 and SCSI bus 121, SC
The host computer 110 is made redundant by the SI bus 122 and the corresponding controllers 131 and 132.
With this configuration, even if a failure occurs in one path, access to the target logical unit 133 can be continued using the other path, thereby improving the reliability of the system. Also,
When both paths are sound, the input / output performance is improved by parallel data transfer using these two data transfer paths.

【0027】本実施の形態では、上述のような冗長化さ
れたSCSIバス121および122の一方に後述の障
害発生装置200を接続してSCSIバス信号を傍受
し、後述のような所定の契機で、意図的にSCSIバス
上の障害を発生させることで、冗長化されたシステムが
障害発生時に、予定した動作を的確に行うか否かを検証
したり、性能低下の程度を検証する等の障害時運用試験
を実施する。
In the present embodiment, a failure generator 200 described later is connected to one of the redundant SCSI buses 121 and 122 to intercept the SCSI bus signal, and is triggered by a predetermined trigger described later. By intentionally causing a failure on the SCSI bus, it is possible to verify whether or not the redundant system performs the expected operation properly when a failure occurs, and to verify the degree of performance degradation. Conduct a time operation test.

【0028】図4〜図6を用いて、本実施の形態の障害
発生装置200の構成の一例について説明する。
An example of the configuration of the failure generating device 200 according to the present embodiment will be described with reference to FIGS.

【0029】本実施の形態の障害発生装置200は、図
5に例示されるように、正面パネル201に、電源ボタ
ン202、バスエラー開始/停止ボタン203、パリテ
ィエラー開始/停止ボタン204、SCSI−ID設定
ボタン205、SCSI論理ユニット番号設定ボタン2
06、障害発生カウンタ207、等のユーザインタフェ
ースを備えている。
As shown in FIG. 5, the failure generating apparatus 200 of this embodiment has a power button 202, a bus error start / stop button 203, a parity error start / stop button 204, a SCSI- ID setting button 205, SCSI logical unit number setting button 2
06, a failure occurrence counter 207, and the like.

【0030】そして、ユーザは、これらの各種ボタンを
操作することで、電源のON/OFF、バスエラーおよ
びパリティエラーの各々の障害種別の指定、当該障害の
発生契機となる、SCSI−ID、SCSI論理ユニッ
ト番号の設定、等の操作が可能である。
By operating these various buttons, the user can specify ON / OFF of the power supply, designation of each failure type of a bus error and a parity error, and a SCSI-ID, SCSI Operations such as setting of a logical unit number are possible.

【0031】個々のボタンは、ランプあるいは数値イン
ジケータを兼ねている。すなわち、電源ボタン202、
バスエラー開始/停止ボタン203、パリティエラー開
始/停止ボタン204、の各々は、当該指示が“開始”
の状態で点灯するランプを兼ねる。
Each button also functions as a lamp or a numerical indicator. That is, the power button 202,
Each of the bus error start / stop button 203 and the parity error start / stop button 204 indicates that the instruction is “start”.
The lamp also lights up in the state.

【0032】また、SCSI−ID設定ボタン205、
SCSI論理ユニット番号設定ボタン206の各々は、
押下の度にインクリメントする数値を表示する数値イン
ジケータを兼ね、現在表示されている数値が、SCSI
−IDおよびSCSI論理ユニット番号をそれぞれ示し
ている。
Further, a SCSI-ID setting button 205,
Each of the SCSI logical unit number setting buttons 206
Each time the button is pressed, it also functions as a numerical indicator that displays a numerical value that is incremented.
-Indicates the ID and SCSI logical unit number, respectively.

【0033】一方、図6に例示されるように、障害発生
装置200の背面側には、二つのコネクタ211および
コネクタ212を持つ可換アダプタ210が設けられて
いる。可換アダプタ210は、障害発生装置200の本
体に対して挿抜可能であり、コネクタ211およびコネ
クタ212の種別毎に、別個のものが複数個用意されて
いる。
On the other hand, as shown in FIG. 6, a replaceable adapter 210 having two connectors 211 and 212 is provided on the rear side of the fault occurrence device 200. The replaceable adapter 210 can be inserted into and removed from the main body of the failure generating device 200, and a plurality of separate adapters are prepared for each type of the connector 211 and the connector 212.

【0034】すなわち、SCSIのコネクタ規格(コネ
クタ211およびコネクタ212)には、たとえば、
“ハーフピッチ/ピンタイプ68芯”、“ハーフピッチ
/ベローズタイプ68芯”、“ハーフピッチ/ピンタイ
プ50芯”、“ハーフピッチ/ベローズタイプ50
芯”、“アンフェノール/ピンタイプ50芯”、“低電
圧差動型”、等のように、多種多様な形状があり、可換
アダプタ210は、これらのコネクタ規格毎に、対応す
る形状のコネクタ211およびコネクタ212を持つも
のが個別に用意され、必要に応じて交換して使用する。
これにより、可換アダプタ210を交換するだけで、各
種のSCSI規格のSCSIバスにおける疑似障害発生
を、共通の障害発生装置200で実現できる。
That is, the SCSI connector standards (connector 211 and connector 212) include, for example,
“Half pitch / pin type 68 cores”, “Half pitch / bellows type 68 cores”, “Half pitch / pin type 50 cores”, “Half pitch / bellows type 50 cores”
There are various shapes such as “core”, “Amphenol / pin type 50 core”, “low voltage differential type”, etc., and the interchangeable adapter 210 has a connector of a corresponding shape for each of these connector standards. Those having the 211 and the connector 212 are separately prepared, and exchanged and used as needed.
As a result, by simply exchanging the interchangeable adapter 210, the occurrence of a pseudo failure in the SCSI bus of various SCSI standards can be realized by the common failure generator 200.

【0035】ただし、本実施の形態の障害発生装置20
0は、後述のように、各種SCSI規格に共通な一部の
SCSIバス信号を使用するので、SCSIケーブルの
物理的な接続が可能で、障害発生に必要な信号のピン位
置が共通なコネクタについては、同一の可換アダプタ2
10で間に合わせることができる。
However, the failure generator 20 of the present embodiment
0 uses a part of SCSI bus signals common to various SCSI standards, as described later, so that a SCSI cable can be physically connected, and a connector having a common signal pin position required for failure occurrence is used. Is the same interchangeable adapter 2
At 10 you can make it in time.

【0036】次に、図4を参照して、本実施の形態の障
害発生装置200の内部構成の一例について説明する。
Next, with reference to FIG. 4, an example of the internal configuration of the failure generator 200 according to the present embodiment will be described.

【0037】障害発生装置200は、電源判定論理22
1、障害発生開始判定論理222、障害終了判定論理2
23、アドレス判定論理224、障害発生スイッチ22
5、パリティ障害発生部226、バス障害発生部22
7、障害選択論理228、障害スイッチ制御部223
a、障害スイッチ制御部224a、を備えている。
The fault generating device 200 is provided with the power determination logic 22
1, failure occurrence start determination logic 222, failure end determination logic 2
23, address determination logic 224, failure switch 22
5. Parity failure generator 226, bus failure generator 22
7, fault selection logic 228, fault switch control unit 223
a, a failure switch control unit 224a.

【0038】電源判定論理221は、障害発生装置20
0の電源投入状態の有無に応じて、障害発生操作の可否
を制御する。
The power supply determination logic 221
It controls whether or not a fault occurrence operation is possible depending on whether or not the power-on state is 0.

【0039】障害発生開始判定論理222は、バスエラ
ー開始/停止ボタン203、パリティエラー開始/停止
ボタン204の一方が“開始”に設定されているか否か
により、障害発生の可否を制御する。
The failure occurrence start determination logic 222 controls whether a failure can occur depending on whether one of the bus error start / stop button 203 and the parity error start / stop button 204 is set to “start”.

【0040】障害終了判定論理223は、SCSIバス
信号における後述のバスフリーフェーズの到来契機を検
出し、当該契機で障害スイッチ制御部223aを介して
障害発生スイッチ225をOffにすることで、障害発
生操作を終了させる動作を行う。
The failure termination determination logic 223 detects the arrival of a later-described bus free phase in the SCSI bus signal, and turns the failure occurrence switch 225 off via the failure switch control unit 223a at the timing. Perform an operation to end the operation.

【0041】アドレス判定論理224は、SCSI−I
D設定ボタン205、SCSI論理ユニット番号設定ボ
タン206にて設定されたSCSI−IDやSCSI論
理ユニット番号等の値と、SCSIバス上におけるセレ
クション/リセレクションフェーズで指定されたアドレ
ス値とが一致するか否かを判定し、両者が一致したとき
に障害スイッチ制御部224aを介して障害発生スイッ
チ225をOnにして、疑似障害発生処理を開始させる
制御を行う。
The address determination logic 224 is a SCSI-I
Does the value of the SCSI-ID or SCSI logical unit number set by the D setting button 205 or the SCSI logical unit number setting button 206 match the address value specified in the selection / reselection phase on the SCSI bus? It is determined whether or not they are the same, and when they match, the failure switch 225 is turned on via the failure switch control unit 224a, and control is performed to start the pseudo failure generation processing.

【0042】障害選択論理228は、バスエラー開始/
停止ボタン203、パリティエラー開始/停止ボタン2
04の設定状態に応じて、障害発生処理時に、パリティ
障害発生部226およびバス障害発生部227のいずれ
を起動するか選択する動作を行う。
The fault selection logic 228 determines whether a bus error has started /
Stop button 203, parity error start / stop button 2
In accordance with the setting state of No. 04, an operation of selecting which of the parity fault generating unit 226 and the bus fault generating unit 227 is to be activated at the time of the fault generating process is performed.

【0043】パリティ障害発生部226は、障害発生装
置200が接続されたSCSIバス120(121、1
22)における図示しないSCSI信号のなかのパリテ
ィ用のデータ線の論理状態を反転あるいは固定させるこ
とで、パリティ障害を発生させる処理を行う。
The parity fault generator 226 is connected to the SCSI bus 120 (121, 1, 1) to which the fault generator 200 is connected.
A process for generating a parity fault is performed by inverting or fixing the logic state of the parity data line in the SCSI signal (not shown) in 22).

【0044】バス障害発生部227は、障害発生装置2
00が接続されたSCSIバス120(121、12
2)における図示しないSCSI信号のなかのACK線
の信号を固定することで、バスエラー状態を発生させる
処理を行う。
The bus failure generator 227 is provided with the failure generator 2
00 is connected to the SCSI bus 120 (121, 12
A process for generating a bus error state is performed by fixing the signal of the ACK line in the SCSI signal (not shown) in 2).

【0045】図7に、SCSIバスにおける入出力処理
の実行時のプロトコルの概要を例示する。まず、SCS
Iバス120に接続されたSCSIアダプタ、コントロ
ーラ等の接続要素の間での調停によりイニシエータ(転
送元)を決定しバスを確保するアービトレーション40
1、ターゲット(情報の転送先)を指定するセレクショ
ン/リセレクション402、情報転送403、当該イニ
シエータによるバス占有状態の解除を示すバスフリー4
04、各フェーズの反復で、SCSIバス120上にお
ける情報転送(入出力処理)が進行する。
FIG. 7 exemplifies an outline of a protocol when executing input / output processing on the SCSI bus. First, SCS
Arbitration 40 for determining an initiator (transfer source) by arbitrating between connection elements such as a SCSI adapter and a controller connected to the I bus 120 and securing a bus.
1. Selection / reselection 402 for specifying a target (information transfer destination), information transfer 403, bus free 4 indicating release of the bus occupation state by the initiator
04, information transfer (input / output processing) on the SCSI bus 120 progresses by repeating each phase.

【0046】本実施の形態の障害発生装置200では、
セレクション/リセレクション402からバスフリー4
04の期間内に、セレクション/リセレクション402
で指定されたターゲットのアドレス(SCSI ID、
etc)が、SCSI−ID設定ボタン205、SCS
I論理ユニット番号設定ボタン206にて設定された値
に一致するときのみ、バスエラー開始/停止ボタン20
3またはパリティエラー開始/停止ボタン204にて指
定された障害を発生させる動作を行う。
In the fault generating device 200 of the present embodiment,
Bus free 4 from selection / reselection 402
04 within the period of selection / reselection 402
Target address (SCSI ID,
etc) is the SCSI-ID setting button 205, SCS
Only when the value matches the value set by the I logical unit number setting button 206, the bus error start / stop button 20
3 or an operation for generating a failure specified by the parity error start / stop button 204.

【0047】従って、本実施の形態の障害発生装置20
0では、SCSIバスに接続される接続機器に必要とさ
れる、SCSIプロトコル全体を制御するための複雑な
制御論理は必要なく、装置自身はSCSI IDをもた
ず、単にSCSIバス信号を傍受し、SCSI IDの
判定およびバスフリーの判定等の簡単な処理を行う論理
で、的確に疑似障害を発生させることが可能である。
Accordingly, the failure generator 20 according to the present embodiment
In the case of 0, there is no need for complicated control logic for controlling the entire SCSI protocol, which is required for the connection device connected to the SCSI bus, and the device itself does not have a SCSI ID and simply intercepts the SCSI bus signal. And a logic for performing simple processing such as SCSI ID determination and bus-free determination, it is possible to accurately generate a pseudo failure.

【0048】図3のフローチャートにて、本実施の形態
の障害発生装置200の動作の一例を説明する。
An example of the operation of the failure generator 200 according to the present embodiment will be described with reference to the flowchart of FIG.

【0049】接続されたSCSIバス上の信号入力があ
ると(ステップ301)、バスエラー開始/停止ボタン
203およびパリティエラー開始/停止ボタン204の
いずれかが設定された障害発生開始状態か否かを判定し
(ステップ302)、開始状態でない場合には、入力さ
れたバス信号をそのまま出力する(ステップ309)。
When there is a signal input on the connected SCSI bus (step 301), it is determined whether one of the bus error start / stop button 203 and the parity error start / stop button 204 is in the set fault occurrence start state. A determination is made (step 302). If the state is not the start state, the input bus signal is output as it is (step 309).

【0050】ステップ302で障害発生状態の場合に
は、現在のバス上のアドレスがSCSI−ID設定ボタ
ン205、SCSI論理ユニット番号設定ボタン206
で設定されている値に一致するか否かを判別し(ステッ
プ303)、一致する場合には、エラー種別の設定状態
を判別し(ステップ304)、パリティエラーを発生さ
せる設定の場合は、SCSIバスのパリティ線の論理状
態を反転あるいは固定させてパリティエラーを発生させ
(ステップ305)、バスエラーを発生させる設定の場
合は、ACK線の信号を固定してバスエラー状態を発生
させ(ステップ306)、このエラー状態を、バスフリ
ーが検出されるまで継続する(ステップ307、ステッ
プ308、ステップ309)。
If a fault has occurred in step 302, the current address on the bus is set to the SCSI-ID setting button 205 and the SCSI logical unit number setting button 206.
It is determined whether or not the value matches the value set in step (step 303). If the value matches, the setting state of the error type is determined (step 304). A parity error is generated by inverting or fixing the logic state of the parity line of the bus (step 305). If the bus error is set, the bus error state is generated by fixing the signal of the ACK line (step 306). This error state is continued until a bus-free state is detected (steps 307, 308, 309).

【0051】以下、本実施の形態の作用の一例を説明す
る。
Hereinafter, an example of the operation of the present embodiment will be described.

【0052】まず、ホストコンピュータ110とDAS
D等の周辺機器130を接続するSCSIバス(本実施
の形態の場合、冗長化されたSCSIバスの中の一方の
SCSIバス121)上に本実施の形態の障害発生装置
200を接続する。同一バス上であれば、複数の接続機
器、ターミネータ121aまでのどの位置であっても良
い。例えば図1のごとくである。
First, the host computer 110 and the DAS
The failure generating device 200 according to the present embodiment is connected to a SCSI bus (in the present embodiment, one SCSI bus 121 among the redundant SCSI buses) that connects the peripheral devices 130 such as D. As long as they are on the same bus, they may be at any position up to a plurality of connected devices and the terminator 121a. For example, as shown in FIG.

【0053】次に、本実施の形態の障害発生装置200
に対して、障害を起こしたいアドレス値(SCSI I
D、SCSI LUN)に、図5の障害発生装置200
の正面パネル201にあるSCSI−ID設定ボタン2
05、SCSI論理ユニット番号設定ボタン206に
て、SCSI ID,SCSI LUNの番号をあわせ
て、予め設定する。
Next, the fault generator 200 according to the present embodiment
To the address value (SCSI I
D, SCSI LUN), the failure generator 200 of FIG.
SCSI ID setting button 2 on the front panel 201
05, the SCSI ID and SCSI LUN numbers are set in advance using the SCSI logical unit number setting button 206.

【0054】障害を起こしたい場合は、障害の種類(バ
スエラー、パリテイエラー)によって、図5のバスエラ
ー開始/停止ボタン203またはパリティエラー開始/
停止ボタン204(障害発生ボタン)を押下する。以
降、障害指示のため別の障害発生ボタンを押すまで、S
CSI−ID設定ボタン205およびSCSI論理ユニ
ット番号設定ボタン206で設定したアドレスで同一の
障害を起こす。尚、バスエラー開始/停止ボタン203
またはパリティエラー開始/停止ボタン204を押さな
い限り、この障害発生装置200をSCSIバス121
に接続しても、障害発生装置200の電源がoffであ
っても、onであっても、SCSIバス121における
通常のI/Oが実行できる。
To cause a failure, the bus error start / stop button 203 or the parity error start / stop button 203 shown in FIG. 5 depends on the type of the failure (bus error, parity error).
A stop button 204 (fault occurrence button) is pressed. Thereafter, S is pressed until another trouble occurrence button is pressed to instruct a trouble.
The same failure occurs at the address set by the CSI-ID setting button 205 and the SCSI logical unit number setting button 206. The bus error start / stop button 203
Alternatively, unless the parity error start / stop button 204 is pressed, the failure generating device 200 is connected to the SCSI bus 121.
, The normal I / O on the SCSI bus 121 can be executed regardless of whether the power of the failure generating device 200 is off or on.

【0055】SCSIで接続された周辺機器130への
I/O要求は、多くの場合は図2におけるソフトウェア
階層に例示されるように、業務プログラム115cから
発行される。この要求は下位に位置するオペレーティン
グシステム115b、SCSIドライバ115a等のプ
ログラムによってより物理的な要求に解釈され、SCS
Iバス上に次のようにあらわれる。
An I / O request to the peripheral device 130 connected by SCSI is issued from the business program 115c in many cases, as exemplified in the software hierarchy in FIG. This request is interpreted as a more physical request by a program such as the operating system 115b and the SCSI driver 115a located at a lower level.
The following appears on the I bus.

【0056】SCSIバスでは、上述の図7に例示され
るように、要求元のバス確保、要求先の指示、情報の送
受信、バス解放、のシーケンスを持っている。
As shown in FIG. 7, the SCSI bus has a sequence of securing a bus of a request source, designating a request destination, transmitting and receiving information, and releasing a bus.

【0057】本実施の形態の障害発生装置200によっ
て行われる障害発生の処理フローは図3のごとくであ
る。障害発生装置200をSCSIバス121に接続す
ると、信号入力(コネクタ211)と、信号出力(コネ
クタ212)にスルーするバス信号が通る。障害発生装
置200の電源が入ると、図3にある処理で制御する。
例えば、電源ボタン202によって障害発生装置200
の電源が入り、Parity Start(パリティエ
ラー開始/停止ボタン204)が押されているとこの処
理でパリティエラーの疑似障害を発生させる。
FIG. 3 shows a processing flow of the occurrence of a fault performed by the fault generating apparatus 200 according to the present embodiment. When the failure generator 200 is connected to the SCSI bus 121, a bus signal passing through the signal input (connector 211) and the signal output (connector 212) passes. When the power of the failure generating device 200 is turned on, the control is performed by the processing shown in FIG.
For example, the power failure button 200
Is turned on, and if the Parity Start (parity error start / stop button 204) is pressed, a pseudo error of a parity error is generated in this process.

【0058】図3の如く、障害発生装置200は入力信
号を監視しており、本装置の障害開始ボタン(バスエラ
ー開始/停止ボタン203またはパリティエラー開始/
停止ボタン204)が押された状態では、ホストコンピ
ュータから発行されるI/O要求の要求先が、障害発生
を起こしたい装置(ターゲット)のアドレス(SCSI
ID、LUN)と一致するものを検知した時から、次
のバス解放が発行されるまでを障害発生の対象時間とす
る(図7参照)。
As shown in FIG. 3, the failure generator 200 monitors the input signal and checks the failure start button (bus error start / stop button 203 or parity error start / stop) of the apparatus.
When the stop button 204 is pressed, the destination of the I / O request issued from the host computer is the address (SCSI) of the device (target) in which the failure is to occur.
(ID, LUN) is detected, and the time from when the next bus release is issued is set as a failure occurrence target time (see FIG. 7).

【0059】バスエラー開始/停止ボタン203にて、
障害の種類としてバスエラーを起こす場合は、要求先の
指示、を解析し設定されているアドレスと一致した場
合、通常ではありえないデータの状態としてACK線の
信号を固定する。当該SCSIバス121に接続されて
いるすべてのSCSIアダプタ及び、SCSIコントロ
ーラ(この場合、SCSIアダプタ111及び、コント
ローラ132)等の接続機器は、当該SCSIバス12
1でバスエラーが発生したと認識できる。
With the bus error start / stop button 203,
When a bus error occurs as a type of failure, the instruction of the request destination is analyzed, and if the address matches the set address, the signal on the ACK line is fixed as a data state that is not normally possible. All SCSI adapters connected to the SCSI bus 121 and connected devices such as SCSI controllers (in this case, the SCSI adapter 111 and the controller 132) are connected to the SCSI bus 12
1 indicates that a bus error has occurred.

【0060】パリティエラー開始/停止ボタン204に
て、障害の種類としてパリテイエラーを起こしたい場合
は、要求先の指示(SCSIシーケンスではセレクショ
ン/リセレクションと呼ぶ)に続く情報転送の段階でパ
リテイ用のデータバス線の内、特定ビットの論理値を固
定する。本実施の形態の場合はSCSI ID=0、L
UN=0に一致するSCSIアドレスがSCSIバス上
に検出されると(すなわちターゲットがコントローラ1
31の場合)、特定のパリテイ用データビットを固定す
る。障害対象アドレスの装置では本要求を解析した時、
パリテイエラーが起こっていると認識し、本要求に対応
する処理を実行しない。要求発行元は正常に処理が完了
したという報告が受け取れないため、ターゲット装置で
障害が発生したと認識する。
When a parity error is to be caused as a type of failure by using the parity error start / stop button 204, the parity error is requested at the information transfer stage following the instruction of the request destination (referred to as selection / reselection in the SCSI sequence). , The logic value of a specific bit is fixed. In the case of the present embodiment, SCSI ID = 0, L
If a SCSI address matching UN = 0 is detected on the SCSI bus (ie, the target is
31), a specific parity data bit is fixed. When this request is analyzed by the device at the failure target address,
It recognizes that a parity error has occurred and does not execute the processing corresponding to this request. Since the request issuer cannot receive a report that the processing has been completed normally, it recognizes that a failure has occurred in the target device.

【0061】以上のように、ホストコンピュータ110
からSCSIバスに発行されたI/O要求に対して、障
害発生装置200によるバスエラーや、パリティエラー
の障害が発生した場合、コンピュータシステムは処理の
各段階で、障害回復を試みる。例えば、失敗した要求を
再度発行する等の処理を実行する。しかし、障害発生装
置200において、障害終了指示があるまで、障害発生
を繰り返すことで、図2に示すごとく、下位要求レベル
で、障害回復の動作が走っても回復不能と判断され、上
位で障害検知が行われるに至り、システムレベルでの障
害テストが可能となる。
As described above, the host computer 110
In response to an I / O request issued from the SCSI bus to the SCSI bus, when a failure of the failure generating device 200 causes a bus error or a parity error, the computer system attempts recovery from the failure at each stage of processing. For example, processing such as reissuing the failed request is executed. However, in the failure generating apparatus 200, by repeating the failure occurrence until a failure end instruction is given, as shown in FIG. The detection is performed, and a failure test at the system level becomes possible.

【0062】例えば、図2に示すコンピュータシステム
において、SCSIバス121に接続した障害発生装置
200に“SCSI ID=0,LUN=0、パリテイ
障害開始”と指示する事によって、ホストコンピュータ
110から発行したDASD133−0に対するI/O
で障害を発生させることが可能になる。
For example, in the computer system shown in FIG. 2, a command is issued from the host computer 110 by instructing the fault occurrence device 200 connected to the SCSI bus 121 to “SCSI ID = 0, LUN = 0, start of parity fault”. I / O to DASD133-0
Can cause a failure.

【0063】本実施の形態の障害発生装置200では、
上述のように、コマンド解析など、SCSIプロトコル
の詳細解析はおこなわない。信号線の組み合わせでセレ
クション/リセレクションフェーズでのアドレス設定だ
けを読み、停止ボタンが押される(バスエラー開始/停
止ボタン203またはパリティエラー開始/停止ボタン
204が解除される)まで同一障害を繰り返す。
In the fault occurrence device 200 of the present embodiment,
As described above, detailed analysis of the SCSI protocol such as command analysis is not performed. Only the address setting in the selection / reselection phase is read by the combination of the signal lines, and the same fault is repeated until the stop button is pressed (the bus error start / stop button 203 or the parity error start / stop button 204 is released).

【0064】コンピュータシステム100では、障害を
検知したら障害回復の為の動きを起こす。例えば、図2
の如く、各ソフトウェア階層で障害回復の手段が実装さ
れているホストコンピュータ110は、SCSIバス1
21から障害報告があがってきたら、SCSIアダプタ
111が一定の回数のリトライを行い、回復できなかっ
たら、当該SCSIアダプタ111において障害が発生
した旨のエラーメッセージを表示し、上位のプログラム
に報告する。
In the computer system 100, when a failure is detected, an action is taken to recover from the failure. For example, FIG.
The host computer 110 in which the means for failure recovery is implemented in each software layer as shown in FIG.
When a failure report comes up from the SCSI adapter 21, the SCSI adapter 111 retries a certain number of times, and if recovery is not possible, an error message indicating that a failure has occurred in the SCSI adapter 111 is displayed and reported to a higher-level program.

【0065】上位のプログラムは当該SCSIアダプタ
111以外のSCSIアダプタからも(本実施の形態の
場合、SCSIアダプタ112、SCSIバス122)
当該DASD131−0に接続していれば、別のSCS
Iアダプタ112、SCSIバス122を使ってアクセ
スを試みる。
The host program can also be sent from a SCSI adapter other than the SCSI adapter 111 (in this embodiment, the SCSI adapter 112 and the SCSI bus 122).
If connected to the DASD 131-0, another SCS
An access is attempted using the I adapter 112 and the SCSI bus 122.

【0066】この試みに対してもなお、障害が報告され
ると、この媒体(DASD)が使用できない旨のメッセ
ージを表示し、さらに上位のプログラムに障害報告を行
う。上位のプログラムは例えばデータがレプリカを持っ
ているような構成の場合はオリジナルデータへのアクセ
スが失敗した旨のメッセージを出力し、レプリカにアク
セスするような指示を行う。
If a failure is still reported for this attempt, a message indicating that the medium (DASD) cannot be used is displayed, and a failure report is made to a higher-level program. For example, if the data has a configuration in which the data has a replica, the higher-level program outputs a message indicating that access to the original data has failed, and gives an instruction to access the replica.

【0067】更に、レプリカに対するアクセスにおいて
も障害が報告されると、データアクセス要求に失敗した
旨のメッセージが表示され、当該データを使用するプロ
グラムを停止する。当該プログラムが停止してはならな
いような機能を持っている場合は、ホットスタンバイし
ている他の図示しないコンピュータシステムに当該処理
の続行を指示する機能を起動する。このように、高い信
頼性を要求されるシステムにおいては、障害が発生して
も、業務を停止させない為にさまざまな障害対策(障害
時運用機能)を作り込んでいる。
Further, when a failure is reported in the access to the replica, a message indicating that the data access request has failed is displayed, and the program using the data is stopped. If the program has a function that must not be stopped, a function for instructing another computer system (not shown) in hot standby to continue the process is activated. As described above, in a system that requires high reliability, various failure countermeasures (failure operation functions) are provided so as not to stop the business even if a failure occurs.

【0068】コンピュータシステム100の運用設計と
して、例えばオリジナルデータへのアクセスが失敗して
もレプリカへのアクセスが成功すれば、業務プログラム
115cは正常に処理できる事が期待される。この場
合、システム設計上、レプリカとオリジナルが同じSC
SIアダプタを用いてDASDにアクセスする経路とな
って、レプリカへのアクセスも失敗することはないか、
レプリカの作成タイミングが遅れていて、オリジナルと
同じデータへのアクセスができないなどの障害が検出さ
れることはないか、というようなテストが必要となる。
As an operational design of the computer system 100, it is expected that the business program 115c can be processed normally if the access to the replica succeeds even if the access to the original data fails. In this case, due to the system design, the replica and the original have the same SC.
Is it a route to access DASD using SI adapter, and access to replica does not fail,
A test is required to check whether a failure such as a failure to access the same data as the original is detected because the replica creation timing is delayed.

【0069】これらのテストはSCSIアダプタそのも
のの障害テストが目的の場合とは異なり、障害の種類よ
りも障害がどれだけの繰り返されるかによって確認の項
目が異なる。内部の詳細な動きを知らなくても、外部に
現れるメッセージを読み、例えば、レプリカへのアクセ
ス要求が成功するか否かのテストが行いたければ、レプ
リカへのアクセスを発行した旨のメッセージを見て、障
害発生装置200の障害停止ボタンを押す(バスエラー
開始/停止ボタン203またはパリティエラー開始/停
止ボタン204を解除する)事でレプリカへのアクセス
で業務プログラムが正常に実行されるという動きで運用
設計とおりであるか否かの確認が可能である。
These tests are different from those for the purpose of testing the failure of the SCSI adapter itself, and the items to be confirmed are different depending on how many times the fault is repeated rather than the type of the fault. Read the message that appears to the outside without knowing the detailed internal operation.For example, if you want to test whether the request to access the replica succeeds, look for a message that the access to the replica was issued. By pressing the failure stop button of the failure generating device 200 (by releasing the bus error start / stop button 203 or the parity error start / stop button 204), the business program is normally executed by accessing the replica. It is possible to confirm whether or not the operation is as designed.

【0070】本実施の形態の障害発生装置200は軽
量,小型であり、携帯して運搬可能である。また、本実
施の形態の障害発生装置200では、通常のSCSI接
続機器と同様に、二つのコネクタ211およびコネクタ
212を備えており、双方のコネクタにSCSIケーブ
ルを接続することで、SCSIバスの途中に障害発生装
置200を接続したり、一方のコネクタ211にSCS
Iケーブルを接続し、他方のコネクタ212にターミネ
ータを接続することで、SCSIバスの末端に接続する
等の多様な接続構成が可能であり、障害発生装置200
の試験対象のSCSIバスに対する接続が楽になってい
る。
The fault generating device 200 of the present embodiment is lightweight and small, and can be carried and carried. Further, the failure generating device 200 of the present embodiment includes two connectors 211 and 212 similarly to a normal SCSI connection device, and by connecting a SCSI cable to both connectors, a midway of the SCSI bus is achieved. Or the SCS to one connector 211.
By connecting an I cable and a terminator to the other connector 212, various connection configurations such as connection to the end of a SCSI bus are possible.
Connection to the SCSI bus to be tested is easy.

【0071】また、本実施の形態の障害発生装置200
は、各種のSCSIプロトコルに共通な、セレクション
/リセレクションフェーズでのSCSIバス上における
ターゲットのアドレスの発生、およびバスフリーフェー
ズを検出し、このフェーズの期間にパリティエラーやバ
スエラー等の疑似エラーを発生させるように機能を単純
化したので、SCSIプロトコル全体を制御するための
複雑な論理は不要であり、論理設計および論理構造が簡
略化され、設計および製造が容易である。
The failure generating device 200 according to the present embodiment
Detects the occurrence of a target address on the SCSI bus in the selection / reselection phase and the bus free phase, which are common to various SCSI protocols, and detects a pseudo error such as a parity error or a bus error during this phase. Since the functions are simplified to generate, no complicated logic for controlling the entire SCSI protocol is required, the logic design and structure are simplified, and the design and manufacturing are easy.

【0072】また、多種類のSCSIコネクタ形状への
対応は着脱型の可換アダプタ210としたことにより、
小型化できるとともに、各種の可換アダプタ210を準
備するだけで、一つの障害発生装置200により、多様
な接続規格のSCSIバスの試験を共通に行うことが可
能である。
In addition, a detachable interchangeable adapter 210 is used for various types of SCSI connector shapes.
It is possible to reduce the size, and also to prepare various interchangeable adapters 210, so that a single failure generator 200 can test SCSI buses of various connection standards in common.

【0073】図8にコンピュータシステムの構成の変形
例を示す。
FIG. 8 shows a modification of the configuration of the computer system.

【0074】この図8のコンピュータシステム500の
構成例では、複数の独立なホストコンピュータ510お
よびホストコンピュータ520のSCSIアダプタ51
1およびSCSIアダプタ521に、SCSIバス53
1およびSCSIバス532を介して、ディスクアレイ
装置540を接続した構成とし、ホストコンピュータ5
10は、SCSIバス531を介してディスクアレイ装
置540内の論理ボリューム541にアクセスし、ホス
トコンピュータ520は、SCSIバス532を介して
ディスクアレイ装置540内の論理ボリューム542に
アクセスする構成となっている。
In the configuration example of the computer system 500 shown in FIG. 8, the SCSI adapters 51 of the host computer 510 and the host computer 520 are independent.
1 and the SCSI adapter 521, the SCSI bus 53
1 and a disk array device 540 are connected via a SCSI bus 532.
10 accesses the logical volume 541 in the disk array device 540 via the SCSI bus 531, and the host computer 520 accesses the logical volume 542 in the disk array device 540 via the SCSI bus 532. .

【0075】SCSIバス531はターミネータ531
aで終端され、SCSIバス532はターミネータ53
2aで終端されている。
The SCSI bus 531 is a terminator 531
a, and the SCSI bus 532 is connected to the terminator 53
2a.

【0076】そして、論理ボリューム542には、論理
ボリューム541のデータのレプリカが格納されてお
り、通常はホストコンピュータ510が論理ボリューム
541のデータにアクセスしてサーバ業務を遂行し、論
理ボリューム541等に障害が発生した場合には、ホス
トコンピュータ520に切り替えて論理ボリューム54
2のデータでサーバ業務を引き継ぐことで信頼性を高め
ている。
The logical volume 542 stores a replica of the data of the logical volume 541. Normally, the host computer 510 accesses the data of the logical volume 541 to perform the server operation, and the logical volume 541 or the like performs the server operation. If a failure has occurred, the host computer 520 is switched to the logical volume 54.
The reliability is improved by taking over the server business with the data of 2.

【0077】このようなシステムで、障害発生時にホス
トコンピュータの切り替えが予定通りに機能するか否か
を確認するための障害時運用試験を行う場合には、一方
のSCSIバス531のターミネータ531aの位置に
SCSIケーブル531bを介して本実施の形態の障害
発生装置200をつなぎこみ、障害発生装置200をタ
ーミネータ531aで終端する。
In such a system, when performing a failure operation test for confirming whether or not the switching of the host computer functions as expected when a failure occurs, the position of the terminator 531a of one SCSI bus 531 is required. The failure generating device 200 of the present embodiment is connected to the device via the SCSI cable 531b, and the failure generating device 200 is terminated by the terminator 531a.

【0078】この状態で、システムを稼働させ、ホスト
コンピュータ510による論理ボリューム541へのデ
ータアクセスを開始させ、その状態で、障害発生装置2
00による回復不可能な疑似障害を発生させて、予定通
り、ホストコンピュータ520の側に運用が切り替わっ
てシステムの稼働が継続されるか否かを確認する。
In this state, the system is operated, and data access to the logical volume 541 by the host computer 510 is started.
Then, an irrecoverable pseudo-failure due to 00 is generated, and it is confirmed whether the operation is switched to the host computer 520 side and the operation of the system is continued as scheduled.

【0079】本実施の形態のような、中小型のコンピュ
ータシステム100を用いて信頼性の高いシステムを構
築したいという要求が高まっている。この為、ハードウ
エア構成としても、DASD等の周辺機器130の接続
に冗長性を持たせたり、また、ソフトウエア構成でも、
バックアップ機能を持たせるなど、DASD等の周辺機
器130にハードウエア障害が発生しても、コンピュー
タシステム100の全体がダウンしない機能が準備され
ている。
There is an increasing demand to construct a highly reliable system using the small and medium-sized computer system 100 as in this embodiment. For this reason, even in the hardware configuration, the connection of the peripheral devices 130 such as DASD is made redundant, and in the software configuration,
A function is provided to prevent the entire computer system 100 from going down even if a hardware failure occurs in the peripheral device 130 such as a DASD, such as a backup function.

【0080】このようなコンピュータシステム100を
構築した場合、当然、障害が発生した場合のテスト(障
害時運用試験)が必要となるが、DASDを本当に破壊
してしまう事はテストの再現性、経済性から不可能に近
い。その為、障害時に備えて準備した機能が本当に障害
が発生した時に設計通り機能しないという問題を起こし
ていた。
When such a computer system 100 is constructed, a test (failure operation test) in the event of a failure is naturally required. It is almost impossible from sex. For this reason, there has been a problem that functions prepared for a failure do not function as designed when a failure actually occurs.

【0081】このような状況において、本実施の形態の
障害発生装置200を用いることにより、安全/手軽に
コンピュータシステム100におけるテスト(障害時運
用試験)を実現する事で、障害発生時のシステムの動き
を確実に検証する事ができ、ハードウェアやソフトウェ
アによる各種の障害対策機能が設計通りに的確に機能す
るか否かを、確実に検証できる。
In such a situation, by using the fault generating apparatus 200 of the present embodiment, a test (operation test at the time of fault) in the computer system 100 can be realized safely and easily. The movement can be reliably verified, and it can be reliably verified whether various failure countermeasure functions by hardware or software function properly as designed.

【0082】特に、中小型のコンピュータシステム10
0では、システム構成機器(コンポーネント)を異なる
ベンダが提供している昨今、信頼性確保の為の個々の機
能が有機的に目論見通り動作する事の確認は実証するし
か手段がないのが現状であり、本実施の形態の障害発生
装置200が提供するテスト手段の意義は大きい。
In particular, the small and medium computer system 10
In recent years, different vendors provide system components (components), and in recent years, there is no alternative but to verify that individual functions for ensuring reliability operate organically as expected. Therefore, the significance of the test means provided by the fault occurrence device 200 of the present embodiment is significant.

【0083】以上本発明者によってなされた発明を実施
の形態に基づき具体的に説明したが、本発明は前記実施
の形態に限定されるものではなく、その要旨を逸脱しな
い範囲で種々変更可能であることはいうまでもない。
Although the invention made by the present inventor has been specifically described based on the embodiments, the present invention is not limited to the above-described embodiments, and can be variously modified without departing from the gist thereof. Needless to say, there is.

【0084】[0084]

【発明の効果】本発明によれば、システムの破壊の懸念
を生じることなく、かつ専門家の立ち会い等を必要とす
ることなく、標準汎用入出力インタフェースにおける実
際の障害を的確に発生させることで、障害時運用試験等
のコンピュータシステムの試験を、簡便に必要な時に何
度でも行うことができる、という効果が得られる。
According to the present invention, it is possible to accurately generate an actual failure in the standard general-purpose input / output interface without causing concern about system destruction and without requiring the presence of an expert. Thus, an effect that a test of a computer system such as an operation test at the time of failure can be easily and repeatedly performed when necessary.

【0085】本発明によれば、コンピュータシステムの
ソフトウェア等に変更を加えることなく、標準汎用入出
力インタフェースにおける実際の障害を的確に発生させ
ることで、障害時運用試験等のコンピュータシステムの
試験の成否の判断を確実に行うことができる、という効
果が得られる。
According to the present invention, the actual failure in the standard general-purpose input / output interface is accurately generated without making any change to the software or the like of the computer system. Can be reliably performed.

【0086】本発明によれば、冗長化によって高信頼性
を実現するコンピュータシステムにおいて、障害発生時
運用におけるシステムの信頼性の維持を確実に検証する
ことができる、という効果が得られる。
According to the present invention, in a computer system realizing high reliability by redundancy, it is possible to surely verify the maintenance of the reliability of the system in the event of a failure.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施の形態である障害発生装置を用
いたコンピュータシステムの試験方法が実施されるコン
ピュータシステムの構成の一例を示す概念図である。
FIG. 1 is a conceptual diagram illustrating an example of a configuration of a computer system in which a computer system test method using a fault occurrence device according to an embodiment of the present invention is performed.

【図2】本発明の一実施の形態であるコンピュータシス
テムにおける障害発生時の作用の一例を示す概念図であ
る。
FIG. 2 is a conceptual diagram illustrating an example of an operation when a failure occurs in a computer system according to an embodiment of the present invention.

【図3】本発明の一実施の形態である障害発生装置の作
用の一例を示すフローチャートである。
FIG. 3 is a flowchart illustrating an example of an operation of the fault occurrence device according to the embodiment of the present invention;

【図4】本発明の一実施の形態である障害発生装置の機
能構成の一例を示すブロック図である。
FIG. 4 is a block diagram illustrating an example of a functional configuration of a failure generating device according to an embodiment of the present invention;

【図5】本発明の一実施の形態である障害発生装置の外
観の一例を示す斜視図である。
FIG. 5 is a perspective view showing an example of an external appearance of a fault occurrence device according to an embodiment of the present invention.

【図6】本発明の一実施の形態である障害発生装置の外
観の一例を示す斜視図である。
FIG. 6 is a perspective view showing an example of an external appearance of a fault occurrence device according to an embodiment of the present invention.

【図7】SCSIにおける入出力処理の実行時のプロト
コルの概要を例示するフローチャートである。
FIG. 7 is a flowchart illustrating an outline of a protocol when executing input / output processing in SCSI.

【図8】本発明の一実施の形態である障害発生装置を用
いたコンピュータシステムの試験方法が実施されるコン
ピュータシステムの変形例を示す概念図である。
FIG. 8 is a conceptual diagram showing a modified example of a computer system in which a computer system test method using a fault occurrence device according to an embodiment of the present invention is performed.

【符号の説明】[Explanation of symbols]

100…コンピュータシステム、110…ホストコンピ
ュータ、111…SCSIアダプタ、112…SCSI
アダプタ、113…バス、114…プロセッサ、115
…主記憶、115a…SCSIドライバ、115b…オ
ペレーティングシステム、115c…業務プログラム、
120…SCSIバス、121…SCSIバス、121
a…ターミネータ、122…SCSIバス、122a…
ターミネータ、130…周辺機器、131…コントロー
ラ、132…コントローラ、133…論理ユニット、2
00…障害発生装置、201…正面パネル、202…電
源ボタン、203…バスエラー設定ボタン(第2のユー
ザインタフェース)、204…パリティエラー設定ボタ
ン(第2のユーザインタフェース)、205…SCSI
−ID設定ボタン(第1のユーザインタフェース)、2
06…SCSI論理ユニット番号設定ボタン(第1のユ
ーザインタフェース)、207…障害発生カウンタ、2
10…可換アダプタ、211…コネクタ、212…コネ
クタ、221…電源判定論理、222…障害発生開始判
定論理、223…障害終了判定論理、223a…障害ス
イッチ制御部、224…アドレス判定論理、224a…
障害スイッチ制御部、225…障害発生スイッチ、22
6…パリティ障害発生部、227…バス障害発生部、2
28…障害選択論理、500…コンピュータシステム、
510…ホストコンピュータ、511…SCSIアダプ
タ、520…ホストコンピュータ、521…SCSIア
ダプタ、531…SCSIバス、531a…ターミネー
タ、531b…SCSIケーブル、532…SCSIバ
ス、532a…ターミネータ、540…ディスクアレイ
装置、541…論理ボリューム、542…論理ボリュー
ム。
100 computer system, 110 host computer, 111 SCSI adapter, 112 SCSI
Adapter, 113 bus, 114 processor, 115
... Main memory, 115a SCSI driver, 115b Operating system, 115c Business program,
120: SCSI bus, 121: SCSI bus, 121
a ... terminator, 122 ... SCSI bus, 122a ...
Terminator, 130 peripheral device, 131 controller, 132 controller, 133 logical unit, 2
00: fault occurrence device, 201: front panel, 202: power button, 203: bus error setting button (second user interface), 204: parity error setting button (second user interface), 205: SCSI
-ID setting button (first user interface), 2
06: SCSI logical unit number setting button (first user interface), 207: Fault occurrence counter, 2
10 interchangeable adapter, 211 connector, 212 connector, 221 power determination logic, 222 failure initiation determination logic, 223 failure termination determination logic, 223a failure switch control unit, 224 address determination logic, 224a
Fault switch control unit, 225: fault switch, 22
6 ... Parity failure generator, 227 ... Bus failure generator, 2
28: fault selection logic, 500: computer system,
510: Host computer, 511: SCSI adapter, 520: Host computer, 521: SCSI adapter, 531: SCSI bus, 531a: Terminator, 531b: SCSI cable, 532: SCSI bus, 532a: Terminator, 540: Disk array device, 541 ... logical volume, 542 ... logical volume.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 川崎 満 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所システムソリューショング ループ内 Fターム(参考) 5B034 BB02 CC01 DD03 5B048 AA04 DD18 5B065 BA01 EC02 ZA11 ZA19 5B083 AA08 BB06 CC12 DD11 EE08 EE11  ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Mitsuru Kawasaki 890 Kashimada, Saiwai-ku, Kawasaki-shi, Kanagawa F-term in Hitachi System Solutions Group (Reference) 5B034 BB02 CC01 DD03 5B048 AA04 DD18 5B065 BA01 EC02 ZA11 ZA19 5B083 AA08 BB06 CC12 DD11 EE08 EE11

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 コンピュータシステムにおける入出力イ
ンタフェースに対する接続手段と、前記入出力インタフ
ェースにおける疑似障害を発生させる疑似障害発生手段
と、を含むことを特徴とする障害発生装置。
1. A fault generating apparatus comprising: a connection unit for an input / output interface in a computer system; and a pseudo fault generating unit for generating a pseudo fault in the input / output interface.
【請求項2】 請求項1記載の障害発生装置において、 前記入出力インタフェース上の入出力機器を識別するた
めの識別情報を外部から設定するための第1のユーザイ
ンタフェースと、前記疑似障害の種別を設定するための
第2のユーザインタフェースとを備え、 前記疑似障害発生手段は、前記入出力インタフェース上
で、前記第1のユーザインタフェースにて設定した前記
識別情報にて特定される前記入出力機器に対する入出力
が実行される期間内に、前記第2のユーザインタフェー
スにて設定された特定の前記疑似障害を発生させること
を特徴とする障害発生装置。
2. The fault occurrence device according to claim 1, wherein a first user interface for externally setting identification information for identifying an input / output device on the input / output interface, and a type of the pseudo fault. And a second user interface for setting the pseudo-failure generating means, wherein the pseudo-failure generating means is provided on the input / output interface, the input / output device specified by the identification information set by the first user interface A fault generating apparatus configured to generate the specific pseudo fault set in the second user interface during a period in which input / output is performed on the fault.
【請求項3】 請求項1または2記載の障害発生装置に
おいて、 前記接続手段は、前記障害発生装置に対して着脱可能に
され、前記入出力インタフェースにおける接続構造の規
格の種別に応じて交換可能な可換アダプタからなること
を特徴とする障害発生装置。
3. The fault generating device according to claim 1, wherein said connecting means is detachable from said fault generating device and is exchangeable according to a type of a standard of a connection structure in said input / output interface. A fault generating device comprising a replaceable adapter.
【請求項4】 請求項1,2または3記載の障害発生装
置において、 前記入出力インタフェースは、SCSI(Small
Computer System Interfac
e)であることを特徴とする障害発生装置。
4. The fault occurrence device according to claim 1, wherein the input / output interface is a SCSI (Small).
Computer System Interface
e) A failure generating device, characterized in that:
【請求項5】 入出力インタフェースにて接続される入
出力機器を含むコンピュータシステムの試験方法であっ
て、 請求項1,2,3または4記載の障害発生装置を前記入
出力インタフェースに接続し、特定の前記入出力機器に
対する入出力の実行期間内に疑似障害を発生させること
で、前記コンピュータシステムの障害時運用試験を行う
ことを特徴とするコンピュータシステムの試験方法。
5. A method for testing a computer system including input / output devices connected by an input / output interface, wherein the fault occurrence device according to claim 1, 2, 3, or 4 is connected to the input / output interface. A computer system test method, wherein a fault operation test of the computer system is performed by generating a pseudo fault within an input / output execution period for the specific input / output device.
JP2001155357A 2001-05-24 2001-05-24 Trouble generating device and testing method for computer system Pending JP2002351755A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001155357A JP2002351755A (en) 2001-05-24 2001-05-24 Trouble generating device and testing method for computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001155357A JP2002351755A (en) 2001-05-24 2001-05-24 Trouble generating device and testing method for computer system

Publications (1)

Publication Number Publication Date
JP2002351755A true JP2002351755A (en) 2002-12-06

Family

ID=18999565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001155357A Pending JP2002351755A (en) 2001-05-24 2001-05-24 Trouble generating device and testing method for computer system

Country Status (1)

Country Link
JP (1) JP2002351755A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006259976A (en) * 2005-03-16 2006-09-28 Hitachi Ltd Storage session managing system for storage-area network
JP2008181432A (en) * 2007-01-26 2008-08-07 Mitsubishi Electric Corp Health check device, health check method, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006259976A (en) * 2005-03-16 2006-09-28 Hitachi Ltd Storage session managing system for storage-area network
JP4588500B2 (en) * 2005-03-16 2010-12-01 株式会社日立製作所 Storage session management system in storage area network
US7949882B2 (en) 2005-03-16 2011-05-24 Hitachi, Ltd. Storage session management system in storage area network
JP2008181432A (en) * 2007-01-26 2008-08-07 Mitsubishi Electric Corp Health check device, health check method, and program

Similar Documents

Publication Publication Date Title
US6802023B2 (en) Redundant controller data storage system having hot insertion system and method
US6708285B2 (en) Redundant controller data storage system having system and method for handling controller resets
JP4097436B2 (en) How to remove a controller online from a redundant controller system
US8285913B2 (en) Storage apparatus and interface expansion authentication method therefor
US8726086B2 (en) Generation of simulated errors for high-level system validation
US6442709B1 (en) System and method for simulating disaster situations on peer to peer remote copy machines
US7549020B2 (en) Method and apparatus for raid on memory
US7793145B2 (en) Method and apparatus for verifying fault tolerant configuration
US20090006745A1 (en) Accessing snapshot data image of a data mirroring volume
JPH0651802A (en) Programmable controller having backup function
US6892254B2 (en) Device driver apparatus for I/O device simulation
CN111694760B (en) Server system, flash memory module and method for updating firmware mapping file
US7127638B1 (en) Method and apparatus for preserving data in a high-availability system preserving device characteristic data
US6745345B2 (en) Method for testing a computer bus using a bridge chip having a freeze-on-error option
JP3730620B2 (en) Method and apparatus for facilitating recovery operation of disk array storage device
JP2007122476A (en) Data storage system, data storage controller, and write failure diagnosis method for its disk
US6738937B1 (en) Method for nondisruptive testing of device and host attachment to storage subsystems
US6389559B1 (en) Controller fail-over without device bring-up
JP2002351755A (en) Trouble generating device and testing method for computer system
US20060075186A1 (en) Storage apparatus
JP2022061792A (en) Information processing device control program, information processing device control method and information processing device
JP2960667B2 (en) Information processing apparatus and external storage device driving method
CN108874578A (en) For supervising and the equipment of initiating port
US11175340B1 (en) System and method for managing testing and availability of critical components on system-on-chip
JP2005050084A (en) Failure operation verification device and method