JPH03144722A - データ記録再生装置のエラー処理方式 - Google Patents

データ記録再生装置のエラー処理方式

Info

Publication number
JPH03144722A
JPH03144722A JP1281662A JP28166289A JPH03144722A JP H03144722 A JPH03144722 A JP H03144722A JP 1281662 A JP1281662 A JP 1281662A JP 28166289 A JP28166289 A JP 28166289A JP H03144722 A JPH03144722 A JP H03144722A
Authority
JP
Japan
Prior art keywords
error
address
storage means
data recording
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1281662A
Other languages
English (en)
Inventor
Chikayoshi Takahashi
高橋 力良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1281662A priority Critical patent/JPH03144722A/ja
Publication of JPH03144722A publication Critical patent/JPH03144722A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的] (産業上の利用分野) 本発明は、例えばハードディスク装置を二重化したシス
テムに用いられるデータ記録再生装置のエラー処理方式
に関する。
(従来の技術) 従来、コンピュータシステムにおいて、外部記憶装置で
ある例えばハードディスク装置(HD D)を二重化し
た方式(ミラードディスク方式)を採用したシステムが
ある。このようなシステムでは、第3図に示すように、
メインとして使用するM−HDDI2及びサブとして使
用するB−HDD13とが設けられている。ホストコン
ピュータ(ホストCPU)toは、ディスクコントロー
ラ(HDC)11を通じてM −HD D 12及びB
−HDD13のそれぞれを制御する。即ち、ホストCP
Ul0がHD C11にデータの転送(リード/ライト
)要求を出力すると、HDCIIはM−HDDI2及び
B−HDD13との間でデータの転送を実行する。
ここで、ディスクシステムのエラー処理方式には、読出
し動作又は書込み動作の際に、再度データの読出し又は
書込みを実行するりトライ方式がある。書込み動作時の
りトライでは、記録媒体に書込みしたデータを読出して
確認し、エラーが発見されると再度の書込み動作が実行
される(Write  and  Verify)。
一方、前記のような二重化システムにおいて、読出し動
作におけるリトライでは、ホストCPU10から読出し
要求が出力されると、HDCIIはM −HD D 1
2からデータの読出し動作を実行する(第4図のステッ
プSl)。HD C11はM −HD D 12からの
読出しデータを検査し、エラーを検出すると再度の読出
し動作(リトライ)を実行する(ステップS2.S3)
。このリトライにおいて、エラーが発見されなければ、
HDCIIはM −HD D I2からの読出しデータ
をホストCPUl0へ転送する(ステップ54.55)
リトライでもエラーが発見されると、HD C11はM
 −HD D 12からの読出し動作を中断し、B−H
DD13からデータを読出す(ステップS6)。この後
、システムでは、M −HD D 12が切り離されて
、以後はB −HD D 13が使用される。
また、M−HDD12は欠陥トラック処理が実行されて
、以後も使用される等の処理がなさ、れる。
(発明が解決しようとする3m) 前記のようなりトライによるエラー処理は、システムに
おけるデータ処理時間の増大化を招く。
この−ような欠点を解泪するために、リトライ処理を禁
止し、エラーが発見された場合に、直ちにサブであるバ
ックアップ側のB−HDD13に切換える方式が考えら
れる。しかし、エラーが発生したM −HD D 12
の障害程度に関係なく、M −HD D 12をシステ
ムから切り離すことは、システムの資源管理の上で不都
合である。また、リトライ処理の許可/禁止及び資源管
理等を全てソフトウェアにより管理する方式も考えられ
るが、システムのオーバーヘッドが増大化する問題があ
る。
本発明の目的は、記憶装置の二重化システムにおいて、
エラー処理を効率化してデータ処理時間の短縮化を図り
、かつエラー発生側の装置に対する障害状況に応じた資
源管理を効率的に実行することができるデータ記録再生
装置のエラー処理方式を提供することにある。
[発明の構成] (課題を解決するための手段と作用) 本発明は、複数のデータ記録再生装置を使用する二重化
システムにおいて、複数のデータ記録再生装置の一方を
メイン装置として使用し、メイン装置に対してデータの
読出し動作を実行した際に、読出しエラーが発生したエ
ラー発生アドレスを格納する第1の記憶手段、エラー発
生時に欠陥トラック処理の対象アドレスを格納する第2
の記憶手段、テストモード時に第1の記憶手段に格納さ
れたエラー発生アドレスに対するテスト読出し動作を実
行し、そのテスト結果が正常の場合には第1の記ta 
f、段からエラー発生アドレスを消去し、そのテスト結
集が異常の場合にはエラー発生アドレスを第2の記憶手
段に格納する第1の制御手段及び第2の記憶手段に格納
されたエラー発生アドレスに対する欠陥トラック処理を
実行し、この実行後に第1及び第2の記憶手段からエラ
ー発生アドレスを消去する第2の制御手段とを備えたエ
ラー処理方式である。
このような構成により、メイン装置にエラーが発生した
場合に、通常のリード/ライトモードとは別のテストモ
ードにおいて、欠陥トラック処理等のエラー処理を実行
する。
(′、A施例) 以下図面を参照して本発明の詳細な説明する。
第1図は同実施例に係わるミラードディスク方式を使用
するコンピュータシステムの構成を示すブロック図であ
る。本システムでは、ホストCPUIGと複数のHDD
であるM −HD D 12゜8−HDD13との間に
、エラー処理機能を有するH D C20が設けられて
いる。HD C20は、ホストc P U 1Gとデー
タの送受信を行なうためのボート部21、複数のボート
部21からのデータを選択するためのマルチプレクサ2
2、読出し又は書込みデータを格納するためのデータレ
ジスタ23、内部ノくス24及びM−HDD12.B−
HDD13のそれぞれとのデイバイス・インターフェー
スを構成するインターフェース回路25.26を備えて
いる。さらに、I D C20は、エラー処理を実行す
るためのマイクロプロセッサ(以下中にCPU)27及
びメモリ(RAM)2gを有する。メモリ2Bは、エラ
ー発生アドレスを格納するレジスタ(TEAR)29及
び欠陥トラック処理用のアドレスレジスタ(DTAR)
30として使用するエリアを備えている。
次に、同実施例の動作を説明する。
先ず、第2図(a)のステップS10に示すように、ホ
ストCPUl0からデータの読出し要求がなされると、
その制御情報(コマンド、データ等を総称する)がポー
ト部21.マルチプレクサ22を通じてデータレジスタ
23にラッチされる。データレジスタ23にラッチされ
た制御情報は、内部バス24を通じて、インターフェー
ス回路25及びメモリ28に格納される。インターフェ
ース回路25は$1lil情報に基づいて、M−HDD
12の所定のトラックからデータの読出し動作を実行す
る(ステップ511)。CPU27はM−HDD12か
らの読出し動作が正常であると、メモリ28に格納され
ている動作履歴に基づいて、読出し動作の完了ステータ
スを内部バス24及びボート部21を通じて通知するこ
とになる(ステップS 12)。
一方、エラーが発生すると、インターフェース回路25
はそのエラーの発生をCPU27に通知する。
CPU27はエラー発生の通知を受信すると、読出し対
象である当該アドレス、即ちエラー発生アドレスをT 
E A R29にセットする(ステップ513)  次
に、CPU27はM −HD D 12とB−HDD1
3とを識別するためのユニットアドレス情報を切換えて
、インターフェース回路28に送出する。これにより、
インターフェース回路2Bは、B−HDD13からデー
タの読出し動作を実行することになる(ステップ514
)。B −HD D 13からの読出しデータが正常で
あれば、データはインターフェース回路2B、内部バス
24及びボート部2Iを通じてホストCPUl0に転送
される(ステップ516)。CPU27は読出し動作の
完了ステータスにより、M −HD D 12のエラー
発生をホストCPUl0に通知する(ステップ517)
。ここで、B−HDDI3からの読出し動作にエラーが
発生すれば、システム停止ヒの状態となる。
ホストCPUl0は、システムのデータ処理状況に応じ
た適切なタイミングで、テストモードを指示するテスト
コマンドをHD C20のボート部21 E出力する(
ステップS18.519)。CPU2はホストCPUl
0からのテストコマンドを受信すると、M −HD D
 12に対するエラー処理を実行する。即ち、CP U
 27は、インターフェース回路25を通じて、M−H
DD12から複数回のテスト読出し動作を行なう。この
とき、CPU27は、T E A R29にセットされ
たエラー発坐アドレスに基づいて、M −HD D 1
2の当該アドレスからデータの読出し動作を実行する(
ステップ520)。
このテスト読出し動作により、CPU27はエラーが一
過性のものであると判定すると、TEAR2!のエラー
発生アドレスを消去し、ホストCPUIIに対してM−
HDDI2の正常及びテスト読出し動作の終了を通知す
る(第2図(b)のステップ828.529)。
一方、テスト読出し動作により、CPU27はエラーが
固定的であると判定すると、エラー発生アドレスである
当該アドレスをDTAR30にセットする(ステップ5
21,522)。さらに、CPU27はM −HD D
 12の障害が固定的であることを、本ストCP U 
toに通知する(ステップ523)。ホストCPUIG
は、M −HD D 12の障害が特定アドレスだけで
あるか又は全域にわたっているかを判定し、全域の場合
にはM −HD D 12をシステムから分離する処理
を行なうことになる(ステップ824,827)。
故障が特定アドレスに限定されている場合には、ホスト
CPUl0は欠陥トラック処理コマンドを出力する(ス
テップ525)。CPU27は欠陥トラック処理コマン
ドに応じて、M−HDD12でエラー発生した欠陥トラ
ックと正常トラックとのトラック代替処理を実行する。
このトラック代替処理が正常に実行されると、CPU2
7はTEAR29及びDTAR3Gから当該アドレス(
エラー発生アドレス)を消去する(ステップS26. 
530)。
そして、CPU27は欠陥トラック処理の終了をホスト
cpυIOJ、:通知すル(ステップ331)。
ここで、TEAR29にエラー発生アドレスが登録され
ている状態では、CPU27はホストCPυ10から通
常の読出し要求が出力されると、その要求アドレスとT
EAR29のアドレスとを比較し、一致すればM−HD
D12をサブであるバックアップ側のB−HDDI3に
切換える処理を実行する(ステップ514)。
このようにして、メインのM −HD D 12の特定
アドレスにエラーが発生し、そのアドレスに対するアク
セス要求がなされると、自動的にサブのB−HDD13
に切換えられる。一方、メインのM −HD D 12
に対しては、通常動作の状況に応じた適切なタイミング
で、テストモードが実行される。このテストモードによ
り、M−HDD12に対する欠陥トラック処理又はシス
テムからの分離等のエラー処理が実行されることになる
[発明の効果] 以上詳述したように本発明によれば、データ記録再生装
置の二重化システムにおいて、メインの装置にエラーが
発生した場合に、通常動作では従来のりトライ処理を実
行しないで、サブの!a鍍鋼に切換えて確実な動作を実
行することができる。
したがって、従来のりトライ処理の処理時間を省略する
ことが可能となるため、通常でのデータ処理時間の短縮
化を図ることが可能となる。
一方、テストモードにおいて、エラーの発生した装置に
対する障害状況を把握し、その障害状況に応じた適切な
エラー処理を実行することができる。したがって、単に
エラー発生した装置をシステムから分離するなどの資源
の無駄を無くし、効率的なシステムの資源管理を実現す
ることが可能となるものである。
【図面の簡単な説明】 第1図は本発明の実施例に係わるコンピュータシステム
の構成を示すブロック図、第2図は同実施例の動作を説
明するためのフローチャート、第3図は従来のコンピュ
ータシステムの基本構成を示すブロック図、第4図は従
来のエラー処理方式を説明するためのフローチャートで
ある。 10・・・ホストCP Ulll、 20・・・HDC
。 M−HDD、13・・・B−HDD、27・・・CPU
。 TEAR,30・・・D T A R。 12・・・ 29・・・

Claims (2)

    【特許請求の範囲】
  1. (1)エラー発生時に相互に代替装置として動作する複
    数のデータ記録再生装置と、 前記複数のデータ記録再生装置の一方をメイン装置とし
    て使用し、前記メイン装置に対してデータの読出し動作
    を実行した際に、読出しエラーが発生したエラー発生ア
    ドレスを格納する第1の記憶手段と、 エラー発生時に欠陥トラック処理の対象アドレスを格納
    する第2の記憶手段と、 テストモード時に前記第1の記憶手段に格納された前記
    エラー発生アドレスに対するテスト読出し動作を実行し
    、そのテスト結果が正常の場合には前記第1の記憶手段
    から前記エラー発生アドレスを消去し、そのテスト結果
    が異常の場合には前記エラー発生アドレスを前記第2の
    記憶手段に格納する第1の制御手段と、 前記第2の記憶手段に格納された前記エラー発生アドレ
    スに対する欠陥トラック処理を実行し、この実行後に前
    記第1及び第2の記憶手段から前記エラー発生アドレス
    を消去する第2の制御手段とを具備したことを特徴とす
    るデータ記録再生装置のエラー処理方式。
  2. (2)エラー発生時に相互に代替装置として動作する複
    数のデータ記録再生装置と、 前記各データ記録再生装置の一方をメイン装置として使
    用し、前記メイン装置に対してデータの読出し動作を実
    行した際に、読出しエラーが発生したエラー発生アドレ
    スを格納する第1の記憶手段と、 前記メイン装置に読出しエラーが発生した際に、各デー
    タ記録再生装置の他方をサブ装置として使用し、前記サ
    ブ装置に対してデータの読出し動作を実行した際に、読
    出しエラーが発生するとシステム全体を停止する装置切
    換え手段と、 エラー発生時に欠陥トラック処理の対象アドレスを格納
    する第2の記憶手段と、 前記装置切換え手段により前記サブ装置を代替装置とし
    て使用する場合に、前記第1の記憶手段に格納された前
    記エラー発生アドレスに対するテスト読出し動作を実行
    し、そのテスト結果が正常の場合には前記第1の記憶手
    段から前記エラー発生アドレスを消去し、そのテスト結
    果が異常の場合には前記エラー発生アドレスを前記第2
    の記憶手段に格納する第1の制御手段と、 前記第2の記憶手段に格納された前記エラー発生アドレ
    スに対する欠陥トラック処理を実行し、この実行後に前
    記第1及び第2の記憶手段から前記エラー発生アドレス
    を消去する第2の制御手段とを具備したことを特徴とす
    るデータ記録再生装置のエラー処理方式。
JP1281662A 1989-10-31 1989-10-31 データ記録再生装置のエラー処理方式 Pending JPH03144722A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1281662A JPH03144722A (ja) 1989-10-31 1989-10-31 データ記録再生装置のエラー処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1281662A JPH03144722A (ja) 1989-10-31 1989-10-31 データ記録再生装置のエラー処理方式

Publications (1)

Publication Number Publication Date
JPH03144722A true JPH03144722A (ja) 1991-06-20

Family

ID=17642229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1281662A Pending JPH03144722A (ja) 1989-10-31 1989-10-31 データ記録再生装置のエラー処理方式

Country Status (1)

Country Link
JP (1) JPH03144722A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191812A (ja) * 1993-12-27 1995-07-28 Nec Corp 固定ディスク装置の障害処理方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191812A (ja) * 1993-12-27 1995-07-28 Nec Corp 固定ディスク装置の障害処理方法および装置

Similar Documents

Publication Publication Date Title
US7549020B2 (en) Method and apparatus for raid on memory
JP2548480B2 (ja) アレイディスク装置のディスク装置診断方法
JP3348417B2 (ja) 記憶システムにおけるデータ回復方法
JP5147824B2 (ja) Raidストレージ・システム、これを動作させる方法及びプログラム
JP4252139B2 (ja) 記憶装置システム
US7117320B2 (en) Maintaining data access during failure of a controller
JPH0328949A (ja) 装置アダプタ及びその診断システム
JP2008269142A (ja) ディスクアレイ装置
JP2000181887A5 (ja)
US20010044883A1 (en) Disk control device and storage device using it
JPH03144722A (ja) データ記録再生装置のエラー処理方式
US6229743B1 (en) Method of a reassign block processing time determination test for storage device
JPH07121315A (ja) ディスクアレイ
JPH08234928A (ja) 情報記憶制御装置
JP3288071B2 (ja) 情報変換処理装置および情報転送制御方法
US8549221B2 (en) RAID management apparatus, RAID management method, and computer product
JP2868003B1 (ja) 磁気ディスク装置
JPH08147112A (ja) ディスクアレイ装置のエラー回復装置
JP2000172570A5 (ja) 情報記録装置並びにこの装置におけるデータの入出力方法及び再構築方法
JP2002251332A (ja) ディスク制御装置
JP3177990B2 (ja) 二重化メモリの診断装置
JP2001092768A (ja) クラスタシステム、その制御方法、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000235458A (ja) 補助記憶装置およびこの補助記憶装置を搭載した情報処理装置
JP2000330733A (ja) ディスクアレイ装置
JP2732951B2 (ja) データ転送制御方法