JPH0916340A - Magnetic disk unit exchange system - Google Patents

Magnetic disk unit exchange system

Info

Publication number
JPH0916340A
JPH0916340A JP7162558A JP16255895A JPH0916340A JP H0916340 A JPH0916340 A JP H0916340A JP 7162558 A JP7162558 A JP 7162558A JP 16255895 A JP16255895 A JP 16255895A JP H0916340 A JPH0916340 A JP H0916340A
Authority
JP
Japan
Prior art keywords
magnetic disk
disk unit
unit
spare
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7162558A
Other languages
Japanese (ja)
Inventor
Hideaki Sako
英彰 酒匂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7162558A priority Critical patent/JPH0916340A/en
Publication of JPH0916340A publication Critical patent/JPH0916340A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE: To avoid a magnetic disk storage device fault by previously setting the number of times of retry of write/read operation as a fault symptom and automatically copying a file into a standby unit. CONSTITUTION: This system is provided with an active magnetic disk storage device 5 and a standby magnetic disk storage device 6 for the device 5. Then, a fault monitor process 3 detects the fault symptom based on the number of times of retry at the time of write/read to the active magnetic disk unit and while referring to a fault managing table 7, fault information is generated and sent to a managing process 2. The managing process 2 controls the exchange between active magnetic disk units 51-5n and a standby magnetic disk unit 61 and reports the fault message of the active magnetic disk units 51-5n to a terminal. A recovery process 4 refers to a recovery managing table 7 base on the fault information, moves the files of the active magnetic disk units 51-5n to the standby magnetic disk unit 61, recovers those files and performs the preventive exchange of the active magnetic units 51-5n.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、磁気ディスク記憶装
置の障害磁気ディスクユニットを予備磁気ディスクユニ
ットに代替える磁気ディスクユニット交換システムに関
し、特に障害予兆を検知してユニット交換する磁気ディ
スクユニット交換システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a magnetic disk unit replacement system for replacing a failed magnetic disk unit of a magnetic disk storage device with a spare magnetic disk unit, and more particularly to a magnetic disk unit replacement system which detects a failure sign and replaces the unit. Regarding

【0002】[0002]

【従来の技術】従来、磁気ディスク記憶装置の磁気ディ
スクユニットに対して、書込み/読出し動作時のエラー
ログあるいは監視ツールによる検査結果に基づいて、デ
ィスクユニットの交換を行うか否かを判定し、予防保守
が行われている。
2. Description of the Related Art Conventionally, for a magnetic disk unit of a magnetic disk storage device, it is determined whether or not to replace the disk unit based on an error log at the time of writing / reading operation or an inspection result by a monitoring tool. Preventive maintenance is performed.

【0003】特開平4−205619号公報によれば、
複数の磁気ディスクユニットをマスタディスクと予備デ
ィスクに割当てて管理する情報と、マスタディスクユニ
ットのファイルを予備ディスクに複写して、ファイルを
入れ替える手段と、複写完了でマスタディスクユニット
を予備ディスクユニットに切替える手段を有して、予備
としたディスクユニットを予防保守する仕方を開示して
いる。この公報によれば、上述の予防保守のため複写の
契機は、パトロール機能あるいは再フォーマッティング
機能によって与えられる。しかし、パトロール機能によ
る検査結果判定あるいは再フォーマティングによる複写
は、どちらも人手介入によっている。
According to Japanese Patent Laid-Open No. 4-205619,
Information for allocating and managing multiple magnetic disk units to the master disk and spare disk, a means for copying the files of the master disk unit to the spare disk and replacing the files, and switching the master disk unit to the spare disk unit when copying is completed A method for performing preventive maintenance of a spare disk unit is disclosed. According to this publication, the trigger for copying for the above-mentioned preventive maintenance is given by a patrol function or a reformatting function. However, the inspection result judgment by the patrol function and the copying by reformatting are both performed by manual intervention.

【0004】[0004]

【発明が解決しようとする課題】磁気ディスクユニット
に対する書込み/読出し動作のリトライ回数から、予じ
め設定された回数条件によって障害予兆を判定し、運用
磁気ディスクユニットと予備磁気ディスクユニットの交
換を自動的に行う。
The failure sign is determined from the number of retries of the write / read operation for the magnetic disk unit according to the preset number of times condition, and the operation magnetic disk unit and the spare magnetic disk unit are automatically replaced. To do it.

【0005】[0005]

【課題を解決するための手段】この発明の目的は、磁気
ディスクユニットの書込み/読出し動作のリトライ回数
を予じめ設定した回数条件と比較して障害予兆を判定
し、予防交換することにある。
SUMMARY OF THE INVENTION It is an object of the present invention to compare the number of write / read operations of a magnetic disk unit with a preset number of times to determine a failure sign and preventively replace it. .

【0006】そのため、この発明の複数の運用磁気ディ
スクユニットからなる運用磁気ディスク記憶装置と、運
用磁気ディスクユニットを代替える予備磁気ディスクユ
ニットからなる予備磁気ディスク記憶装置を備えて、障
害予兆を検知した運用磁気ディスクユニットのファイル
を予備磁気ディスクユニットに移送して復旧し、前記運
用磁気ディスクユニットを前記予備磁気ディスクユニッ
トで代替える磁気ディスクユニット交換システムは、運
用磁気ディスクユニットと予備磁気ディスクユニットの
交換を制御し、運用磁気ディスクユニットの障害メッセ
ージを端末に通知する管理プロセスと、運用磁気ディス
クユニットに対する書込み/読出し時のリトライ回数に
基づいて障害予兆を検知し、障害管理テーブルを参照し
て障害情報を生成して前記管理プロセスに送付する障害
監視プロセスと、前記管理プロセスから受理した障害情
報に基づいて、復旧処理管理テーブルを参照し、運用磁
気ディスクユニットのファイルを予備磁気ディスクユニ
ットに移送して復旧し、前記予備磁気ディスクユニット
を運用磁気ディスクユニットと予防交換する復旧プロセ
スと、を備えることを特徴とする。
Therefore, a failure sign is detected by providing an operating magnetic disk storage device including a plurality of operating magnetic disk units of the present invention and a backup magnetic disk storage device including a backup magnetic disk unit that replaces the operating magnetic disk unit. A magnetic disk unit exchange system in which a file of an operating magnetic disk unit is transferred to a spare magnetic disk unit to be restored and the operating magnetic disk unit is replaced by the spare magnetic disk unit is a replacement of the operating magnetic disk unit and the spare magnetic disk unit. Control process to notify the terminal of the failure message of the operating magnetic disk unit and the failure sign is detected based on the number of retries when writing / reading to the operating magnetic disk unit, and the failure information is referenced by referring to the failure management table. Generate a Based on the failure monitoring process sent to the management process, and the failure information received from the management process, the recovery processing management table is referenced, and the file of the operating magnetic disk unit is transferred to the spare magnetic disk unit for recovery, A recovery process for preventive replacement of the spare magnetic disk unit with an operational magnetic disk unit.

【0007】[0007]

【実施例】この発明について図面を参照して説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described with reference to the drawings.

【0008】この発明の一実施例の機能ブロックを示す
図1を参照すると、磁気ディスクユニット交換システム
1は、システム1自身の制御と管理する監視プロセス2
と、磁気ディスク記憶装置5の磁気ディスクユニット5
1乃至5nの障害予兆の監視を行うプロセス3と、磁気
ディスク記憶装置5の運用中ユニット51乃至5nの障
害予兆が検知された運用ユニットのファイルを磁気ディ
スク記憶装置6の予備ユニット61にコピーする復旧プ
ロセス4と、ユニット51乃至5nに対する書込み/読
出し動作の障害予兆を判定するリトライ回数を設定する
障害管理テーブル7と、ユニット51乃至5nに対する
ユニット61の対応を管理する復旧処理管理テーブル8
とを有する。
Referring to FIG. 1 showing a functional block of an embodiment of the present invention, a magnetic disk unit exchange system 1 has a monitoring process 2 for controlling and managing the system 1 itself.
And the magnetic disk unit 5 of the magnetic disk storage device 5.
A process 3 for monitoring failure signs of 1 to 5n and a file of an operation unit in which a failure sign of the operating unit 51 to 5n of the magnetic disk storage device 5 is detected is copied to a spare unit 61 of the magnetic disk storage device 6. A recovery process 4, a failure management table 7 for setting the number of retries for judging a failure sign of a write / read operation for the units 51 to 5n, and a recovery processing management table 8 for managing the correspondence of the unit 61 to the units 51 to 5n.
And

【0009】障害管理テーブル7の項目を示す図2を参
照すると、ユニット名71と、書込み/読出し動作時に
ログしたリトライ情報72と、障害予兆を判定する基準
のリトライ回数である復旧条件73と、を含む。
Referring to FIG. 2 showing items in the failure management table 7, a unit name 71, retry information 72 logged at the time of writing / reading operation, a recovery condition 73 which is a reference number of retries for judging a failure sign, including.

【0010】復旧処理管理テーブル8の項目を示す図8
を参照すると、ユニット名81と、対応する予備のユニ
ットを指す復旧ユニット名82と、端末9へのメッセー
ジ送出するか否かを示す処理方法83とを含む。
FIG. 8 showing the items of the recovery processing management table 8
2, a unit name 81, a recovery unit name 82 indicating a corresponding spare unit, and a processing method 83 indicating whether or not to send a message to the terminal 9 are included.

【0011】この実施例の動作を説明すると、障害管理
プロセス3は、ユニット51乃至5nの動作状況を監視
してリトライ回数をリトライ情報72に記録するととも
に復旧条件73と比較して、障害予兆と判定すべきか否
かを判定する。障害管理プロセス3は、該障害予兆を判
定したユニットを管理プロセス2に通知する。通知を受
けた管理プロセス2は、端末9に通知出力を行うととも
に、復旧プロセス4へ通知を行う。通知を受けた復旧プ
ロセス4は、障害管理テーブル7を参照し、復旧対象の
ユニットを確認し、復旧処理管理テーブル8を参照する
ことにより、ユニット名81に対応する予備ユニット名
82及び処理方法83の取得を行う。
Explaining the operation of this embodiment, the failure management process 3 monitors the operating status of the units 51 to 5n, records the number of retries in the retry information 72, and compares it with the recovery condition 73 to detect a failure sign. Determine whether to make a decision. The failure management process 3 notifies the management process 2 of the unit for which the failure sign has been determined. The management process 2 that received the notification outputs the notification to the terminal 9 and also notifies the recovery process 4. Upon receiving the notification, the restoration process 4 refers to the failure management table 7, confirms the unit to be restored, and refers to the restoration processing management table 8 to refer to the spare unit name 82 corresponding to the unit name 81 and the processing method 83. To get

【0012】処理方法83の指定は、復旧処理を全て自
動実行する場合と、復旧を行うか否かを操作員に確認要
求を行う場合と、メッセージ通知のみ行う場合と、の3
つのパターンを選択できる。運用ユニットから予備ユニ
ットにコピーする復旧処理は、復旧プロセス4が行い、
テーブル7および8から取得した復旧ユニット名82を
もとに障害予兆が検知されたユニット51のファイルを
予備ユニット61へコピーを行う。復旧プロセス4は復
旧処理の終了を管理プロセス2へ通知し、管理プロセス
2は端末9にユニット交換終了のメッセージを出力す
る。
The processing method 83 is designated by the following three cases: a case where all restoration processing is automatically executed, a case where a confirmation request is made to the operator as to whether or not restoration is carried out, and a case where only message notification is given.
You can choose one pattern. The restoration process of copying from the operation unit to the spare unit is performed by the restoration process 4.
Based on the recovery unit name 82 acquired from the tables 7 and 8, the file of the unit 51 in which the failure sign is detected is copied to the spare unit 61. The recovery process 4 notifies the management process 2 of the completion of the recovery process, and the management process 2 outputs a message of unit replacement completion to the terminal 9.

【0013】[0013]

【発明の効果】以上説明したように、この発明によれ
ば、書込み/読出し動作のリトライ回数を障害予兆とし
て、あらかじめ設定された条件と比較し、システムが自
動的に予備ユニットへファイル複写を行って、ユニット
交換することにより、磁気ディスク記憶装置障害を回避
する。
As described above, according to the present invention, the number of retries of the write / read operation is used as a failure sign and compared with a preset condition, and the system automatically copies the file to the spare unit. By replacing the unit, the failure of the magnetic disk storage device can be avoided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.

【図2】図1の障害管理テーブルの項目を示す図であ
る。
FIG. 2 is a diagram showing items of a failure management table in FIG.

【図3】図1の復旧処理管理テーブルの項目を示す図で
ある。
FIG. 3 is a diagram showing items of a recovery processing management table in FIG.

【符号の説明】[Explanation of symbols]

1 磁気ディスクユニット交換システム 2 管理プロセス 3 障害監視プロセス 4 復旧プロセス 5 磁気ディスク記憶装置 6 磁気ディスク記憶装置 7 障害管理テーブル 8 復旧処理管理テーブル 9 端末 51乃至5n ユニット 61 ユニット 1 Magnetic Disk Unit Replacement System 2 Management Process 3 Failure Monitoring Process 4 Recovery Process 5 Magnetic Disk Storage Device 6 Magnetic Disk Storage Device 7 Failure Management Table 8 Recovery Processing Management Table 9 Terminals 51 to 5n Units 61 Units

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 複数の運用磁気ディスクユニットからな
る運用磁気ディスク記憶装置と、運用磁気ディスクユニ
ットを代替える予備磁気ディスクユニットからなる予備
磁気ディスク記憶装置を備えて、障害予兆を検知した運
用磁気ディスクユニットのファイルを予備磁気ディスク
ユニットに移送して復旧し、前記運用磁気ディスクユニ
ットを前記予備磁気ディスクユニットで代替える磁気デ
ィスクユニット交換システムは、 運用磁気ディスクユニットと予備磁気ディスクユニット
の交換を制御し、運用磁気ディスクユニットの障害メッ
セージを端末に通知する管理プロセスと、 運用磁気ディスクユニットに対する書込み/読出し時の
リトライ回数に基づいて障害予兆を検知し、障害管理テ
ーブルを参照して障害情報を生成して前記管理プロセス
に送付する障害監視プロセスと、 前記管理プロセスから受理した障害情報に基づいて復旧
処理管理テーブルを参照し、運用磁気ディスクユニット
のファイルを予備磁気ディスクユニットに移送して復旧
し、前記予備磁気ディスクユニットを運用磁気ディスク
ユニットと予防交換する復旧プロセスと、 を備えることを特徴とする磁気ディスクユニット交換シ
ステム。
1. An operational magnetic disk that detects a failure sign, comprising an operational magnetic disk storage device comprising a plurality of operational magnetic disk units and a spare magnetic disk storage device comprising a spare magnetic disk unit replacing the operational magnetic disk unit. A magnetic disk unit replacement system that transfers a file of a unit to a spare magnetic disk unit to restore it and replaces the working magnetic disk unit with the spare magnetic disk unit controls the replacement of the working magnetic disk unit and the spare magnetic disk unit. Detects a failure sign based on the management process that notifies the terminal of a failure message of the operating magnetic disk unit and the number of retries when writing / reading to the operating magnetic disk unit, and creates failure information by referring to the failure management table. The management process To the recovery processing management table based on the failure monitoring process sent to the server and the failure information received from the management process, the file of the operating magnetic disk unit is transferred to the spare magnetic disk unit for recovery, and the spare magnetic disk unit is recovered. A magnetic disk unit replacement system, comprising: a recovery process for preventive replacement of an operating magnetic disk unit.
JP7162558A 1995-06-28 1995-06-28 Magnetic disk unit exchange system Pending JPH0916340A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7162558A JPH0916340A (en) 1995-06-28 1995-06-28 Magnetic disk unit exchange system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7162558A JPH0916340A (en) 1995-06-28 1995-06-28 Magnetic disk unit exchange system

Publications (1)

Publication Number Publication Date
JPH0916340A true JPH0916340A (en) 1997-01-17

Family

ID=15756876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7162558A Pending JPH0916340A (en) 1995-06-28 1995-06-28 Magnetic disk unit exchange system

Country Status (1)

Country Link
JP (1) JPH0916340A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999039347A1 (en) * 1998-02-02 1999-08-05 Hitachi, Ltd. Automatic replacing method in reading and magnetic disc drive using the method
JP2006268502A (en) * 2005-03-24 2006-10-05 Toshiba Corp Array controller, media error restoring method and program
US7269767B2 (en) 2005-06-06 2007-09-11 Fujitsu Limited Magnetic disk apparatus, preventive maintenance detection method and program therefor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04120619A (en) * 1990-09-12 1992-04-21 Toshiba Corp Computer system
JPH04266117A (en) * 1991-02-21 1992-09-22 Canon Inc Storage device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04120619A (en) * 1990-09-12 1992-04-21 Toshiba Corp Computer system
JPH04266117A (en) * 1991-02-21 1992-09-22 Canon Inc Storage device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999039347A1 (en) * 1998-02-02 1999-08-05 Hitachi, Ltd. Automatic replacing method in reading and magnetic disc drive using the method
JP2006268502A (en) * 2005-03-24 2006-10-05 Toshiba Corp Array controller, media error restoring method and program
US7269767B2 (en) 2005-06-06 2007-09-11 Fujitsu Limited Magnetic disk apparatus, preventive maintenance detection method and program therefor

Similar Documents

Publication Publication Date Title
US20050251635A1 (en) Backup method
CN114675791A (en) Disk processing method and system and electronic equipment
CN114064374A (en) Fault detection method and system based on distributed block storage
JPH0916340A (en) Magnetic disk unit exchange system
JP2001154929A (en) Management method and system for substituting path system
JP2003288279A (en) Fault detection method between storage device and storage device used for it
CN113946474A (en) Efficient disaster tolerance protection method and disaster tolerance processing system for storage system
CN112084097A (en) Disk warning method and device
JP2630263B2 (en) Electronic exchange
JPH06124169A (en) Duplex systematized optical disk device and automatic i/o error restoring method
JPH1188471A (en) Test method and test equipment
JPH04127247A (en) Preventive maintenance back-up system
JPH07261989A (en) Control program restoration system
JP3884152B2 (en) Relay device
JPH10247134A (en) Fault processing circuit for disk array device for direct connection bus
JP5532687B2 (en) Information processing system, failure handling mechanism of information processing system, and failure handling method of information processing system
JP2000293320A (en) Disk subsystem, inspection diagnosing method for disk subsystem and data restoring method for disk subsystem
JPH05274093A (en) Volume fault prevention control system
JPH07152495A (en) Recovery system for disk array device
JPH113289A (en) Automatic disk fault restoration device and restoration method
JPH03271923A (en) Magnetic disk device with measures for fault control
JP2806342B2 (en) Database failure recovery method and device
JP2005275479A (en) Disk array control system
JP2014160333A (en) Multiplex processing system
JPH02150194A (en) Collected/distributed data supervising device for communication supervising system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980922