JP2008257411A - ディスク制御システム - Google Patents

ディスク制御システム Download PDF

Info

Publication number
JP2008257411A
JP2008257411A JP2007097947A JP2007097947A JP2008257411A JP 2008257411 A JP2008257411 A JP 2008257411A JP 2007097947 A JP2007097947 A JP 2007097947A JP 2007097947 A JP2007097947 A JP 2007097947A JP 2008257411 A JP2008257411 A JP 2008257411A
Authority
JP
Japan
Prior art keywords
hdd
disk
internal log
failure
hard disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007097947A
Other languages
English (en)
Inventor
Osamu Kubota
久保田収
Tetsuji Tsukito
月東哲児
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007097947A priority Critical patent/JP2008257411A/ja
Publication of JP2008257411A publication Critical patent/JP2008257411A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】
複数のハードディスクが接続される構成において、ディスクインタフェース上にエラーが現れない場合のHDD故障に対する予測を行う。
【解決手段】
ディスク制御装置202の制御部203は、全HDD内部ログの採取を行い、各HDD内部ログ情報の比較を行って、異常値の有無を判別する。また、「故障予測HDD」と判定とされたHDD内部ログの退避と上位装置への報告を行う。
【選択図】 図2

Description

本発明は、ハードディスク制御システムに関するものである。
ハードディスクの故障予測に関して、ハードディスクドライブ(HDD)は、ハードディスクへのリトライ回数によって、ハードディスクの故障予測を行うことが考えられる。特許文献1では、コマンドのリトライ回数をメモリに記録してエラーレートがスレッシュホールドを超えたときに、以下HDDの故障の兆候有りと判断する技術が開示されている。
特開平10−320131号公報
しかし、通常HDDは、ディスク内部でのリトライ機能を備えており、ディスク内部でのリトライが成功した場合は、ディスクコントローラへの報告を行わない。よって、特許文献1の技術では、ディスク内部でのリトライが頻発しても、故障予測が不可となる。さらに、HDDは、電圧異常や温度異常によって、リトライの痕跡を残さずに故障に至る場合もあり得るが、同様に同発明では、本ケースの故障予測は不可となる。
エラーレート、電圧レベル及び温度レベルによるスレッシュホールドは、HDD単体の場合、HDDメーカから提示される値に基づいて設定されるが、この値をそのまま使用した場合は、既にHDDが「故障」状態となっている場合が想定される。
本発明の目的は、HDDのリトライ回数によって、HDDの故障予測を行うことが出来るハードディスク制御システムを提供することにある。
上記目的を達成するために本発明は、HDDの内部リトライ情報、温度情報、電圧情報は、HDDの内部ログに格納する。この内部ログを取得して、故障予測の判断基準とする構成を採用した。
本発明により、HDDの故障の予兆監視を行うことができる。
以下、本発明の一実施形態を、図面を用いて説明する。
図1は実施形態の概略フローである。全HDD内部ログの採取を行い(ステップ101)、各HDD内部ログ情報の比較を行って(ステップ102)、異常値の有無を判別する(ステップ103)。ステップ103において、「故障予測HDDである」と判定とされたHDD内部ログの退避と上位装置への報告を行う(ステップ104)。
図2は、本実施形態において実現されるハードディスク制御システムのブロック図である。図2に示すように、ディスク制御装置202は、上位装置201および複数のHDD207と接続される。ディスク制御装置202は、制御部203、ディスクコントローラ204、ローカルメモリ205および不揮発メモリ206を備える。制御部203は、ディスクコントローラ204を介して、全ハードディスク207内のHDD内部ログをローカルメモリ205に格納する。制御部203は、ローカルメモリ内で各HDD内部ログに含まれるエラーリトライ、ワースト温度情報及びワースト電圧レベルの比較を行い、異常値を判別する。異常値と判別されたHDDは故障予測HDDと判定され、不揮発メモリに当該HDD内部ログを退避する。
図3は、図1のステップ101(制御部203が、HDD内部ログを採取する処理)の詳細フローを示す。ここで、HDDの識別記号(ID)をn(n=0、1、…、X)とする。
制御開始後、インターバルタイム分ウェイトを持つ(ステップ301)。その後、n=0に設定する(ステップ302)。ID=nのHDDの内部ログ取得コマンドを発行して(ステップ303)、ローカルメモリに格納する(ステップ304)。ここで、n=Xになったか、つまり、全HDDの内部ログを取得できたか否かを判断し(ステップ305)、n=Xでない場合は、ステップ303に戻り、ステップ303〜304を繰り返す。また、n=Xである場合、つまり全HDDの内部ログを採取できた場合は、ログ採取処理を終了する。
図4は、図1のステップ102〜104(HDD内部ログの情報から故障予測の判定と内部ログの退避、上位装置への報告)を詳細に示すフローである。
まず、図3のフロー(図1のステップ101)で採取したHDD内部ログから、エラーリトライ、ワースト電圧レベルおよびワースト温度情報を抽出する(ステップ401)。その後、抽出した各情報を比較して、異常値を示すHDDが無いかどうかを判別する(ステップ402)。ここで、異常値があるか否かを判断し(ステップ403)、異常値が無い場合は、図3のフローへ戻る([B])。ステップ403で、異常値が見つかった場合は、当該HDDを「故障予測HDD」と判定する(ステップ404)。「故障予測HDD」と判定されたHDD内部ログは、不揮発メモリ及び「故障予測HDD」以外のHDDへ退避する(ステップ405)。最後に上位装置へ「故障予測HDD」の報告を行い(ステップ406)、図3のフローへ戻る([B])。
図5は、図4のステップ401において抽出された、エラーリトライ、ワースト電圧レベルおよびワースト温度情報をHDDごとに対応付けて記憶するデータテーブル(ローカルメモリ205内のテーブル)の例である。このテーブルを用いて、ステップ403において異常値を判別する。
HDDの内部リトライ情報、温度情報、電圧情報は、HDDの内部ログとして記録されている。制御部203は、この内部ログを取得してディスク制御装置203のローカルメモリ205に格納する。そして、制御部203は、この内部ログを故障予測の判断基準とすることで、HDDの各故障モードに対応が可能となる。また、複数台のHDDが接続される構成では、通常、各HDDのエラーレート、電圧レベル及び温度レベルはいずれも同等であると考えられるため、各HDD間の値の比較により、異常状態を検出する。これにより実運用に即した判断基準が設定可能となる。
本発明の一実施形態を示す概略フロー。 本発明の一実施形態であるディスク制御システムのブロック図。 図1のステップ101の詳細フロー。 図1のステップ102〜104の詳細フロー。 HDD内部ログ情報を格納するテーブル。
符号の説明
201:上位装置、202:ディスク制御装置、203:制御部、204:ディスクコントローラ、205:ローカルメモリ、206:不揮発メモリ、207:ハードディスク

Claims (3)

  1. ハードディスクに接続されたディスク制御装置によるディスク制御方法であって、
    前記ハードディスクから、該ハードディスクに関する内部ログを取得し、
    該取得した内部ログを、前記ディスク装置内のローカルメモリに記憶し、
    該記憶した内部ログに基づいて、前記ハードディスクの故障予測を行い、
    前記故障予測の結果、故障が予測されたハードディスクに関する情報を、前記ディスク制御装置に接続された上位装置に送信することを特徴とするディスク制御方法。
  2. 前記故障が予測されたハードディスクの内部ログを、前記ハードディスクとは別の記憶媒体に格納することを特徴とする請求項1記載のディスク制御方法。
  3. 前記ディスク制御装置に、ハードディスクが複数接続されている場合に、該複数ハードディスクの内部ログ情報を比較することにより、故障を予測することを特徴とする請求項1記載のディスク制御方法。
JP2007097947A 2007-04-04 2007-04-04 ディスク制御システム Pending JP2008257411A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007097947A JP2008257411A (ja) 2007-04-04 2007-04-04 ディスク制御システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007097947A JP2008257411A (ja) 2007-04-04 2007-04-04 ディスク制御システム

Publications (1)

Publication Number Publication Date
JP2008257411A true JP2008257411A (ja) 2008-10-23

Family

ID=39980939

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007097947A Pending JP2008257411A (ja) 2007-04-04 2007-04-04 ディスク制御システム

Country Status (1)

Country Link
JP (1) JP2008257411A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010157266A (ja) * 2010-04-09 2010-07-15 Toshiba Corp 情報処理装置、故障予兆判定方法及びプログラム
CN106598800A (zh) * 2015-10-14 2017-04-26 中兴通讯股份有限公司 一种硬件故障分析系统和方法
JP2018197922A (ja) * 2017-05-23 2018-12-13 株式会社アイ・オー・データ機器 外部記憶装置
US10686964B2 (en) 2017-03-10 2020-06-16 Canon Kabushiki Kaisha Information processing apparatus preventing risk of shortened lifetime of storage device and control method therefor
KR102199244B1 (ko) * 2020-03-16 2021-01-06 공주대학교 산학협력단 직렬포트를 이용한 서버의 하드 디스크 상태 표시 시스템 및 방법
KR102199243B1 (ko) * 2020-03-16 2021-01-06 공주대학교 산학협력단 병렬포트를 이용한 서버의 하드 디스크 상태 표시 시스템 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320131A (ja) * 1997-05-21 1998-12-04 Mitsubishi Electric Corp ディスクサブシステム
JP2002259168A (ja) * 2001-03-05 2002-09-13 Toshiba Corp ログ特徴を抽出する装置、方法、およびプログラム
JP2005025786A (ja) * 2004-10-04 2005-01-27 Toshiba Corp ログ解析方法、ログ解析プログラム
JP2006011751A (ja) * 2004-06-24 2006-01-12 Sony Corp 情報記憶装置及びその制御方法、並びにコンピュータ・プログラム
JP2006079219A (ja) * 2004-09-08 2006-03-23 Matsushita Electric Ind Co Ltd ディスクアレイ制御装置およびディスクアレイ制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320131A (ja) * 1997-05-21 1998-12-04 Mitsubishi Electric Corp ディスクサブシステム
JP2002259168A (ja) * 2001-03-05 2002-09-13 Toshiba Corp ログ特徴を抽出する装置、方法、およびプログラム
JP2006011751A (ja) * 2004-06-24 2006-01-12 Sony Corp 情報記憶装置及びその制御方法、並びにコンピュータ・プログラム
JP2006079219A (ja) * 2004-09-08 2006-03-23 Matsushita Electric Ind Co Ltd ディスクアレイ制御装置およびディスクアレイ制御方法
JP2005025786A (ja) * 2004-10-04 2005-01-27 Toshiba Corp ログ解析方法、ログ解析プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010157266A (ja) * 2010-04-09 2010-07-15 Toshiba Corp 情報処理装置、故障予兆判定方法及びプログラム
CN106598800A (zh) * 2015-10-14 2017-04-26 中兴通讯股份有限公司 一种硬件故障分析系统和方法
US10686964B2 (en) 2017-03-10 2020-06-16 Canon Kabushiki Kaisha Information processing apparatus preventing risk of shortened lifetime of storage device and control method therefor
JP2018197922A (ja) * 2017-05-23 2018-12-13 株式会社アイ・オー・データ機器 外部記憶装置
JP7129148B2 (ja) 2017-05-23 2022-09-01 株式会社アイ・オー・データ機器 外部記憶装置
KR102199244B1 (ko) * 2020-03-16 2021-01-06 공주대학교 산학협력단 직렬포트를 이용한 서버의 하드 디스크 상태 표시 시스템 및 방법
KR102199243B1 (ko) * 2020-03-16 2021-01-06 공주대학교 산학협력단 병렬포트를 이용한 서버의 하드 디스크 상태 표시 시스템 및 방법

Similar Documents

Publication Publication Date Title
US7890791B2 (en) Disk array device, operating method thereof and program-storing medium
US7321477B2 (en) Disk control apparatus, disk control method, and computer product
CN103207820B (zh) 基于raid卡日志的硬盘的故障定位方法及装置
JP2008257411A (ja) ディスク制御システム
JP2006164445A (ja) 監視装置
JP6078984B2 (ja) 処理装置,処理方法,処理プログラム及び管理装置
US20120173944A1 (en) Server and method for testing inter-integrated circuit devices
CN107179968B (zh) 信息存储装置、故障预测装置及故障预测方法
US7492541B2 (en) Apparatus and method of monitoring hard disk drive
JP5785455B2 (ja) リムーバブルメディアに関する処理を行う装置及び方法
CN108170375B (zh) 一种分布式存储系统中的超限保护方法和装置
JP6880961B2 (ja) 情報処理装置、およびログ記録方法
JP2008198322A5 (ja)
JP4627327B2 (ja) 異常判定装置
JP6079578B2 (ja) ストレージ制御装置、ストレージ制御プログラム、およびストレージ制御方法
JPH07182250A (ja) 磁気ディスクの自動交代処理方式
JP2007233915A (ja) ディスクアレイ制御装置及びエラー監視方法並びにプログラム
JP2880701B2 (ja) ディスクサブシステム
CN107766191A (zh) Linux 系统的自动巡检存储信息及健康状态的测试方法
US6229743B1 (en) Method of a reassign block processing time determination test for storage device
JP2021140284A (ja) 情報処理装置、情報処理方法及びプログラム
JP4732988B2 (ja) 画像記録再生装置
JP2006276965A (ja) 不良ブロック検出方法および不良ブロック検出装置
JP2006018955A (ja) 光ディスク装置及び光ディスク・ライブラリ装置
JP6205909B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120508