JP2013246479A - 処理装置,処理方法,処理プログラム及び管理装置 - Google Patents

処理装置,処理方法,処理プログラム及び管理装置 Download PDF

Info

Publication number
JP2013246479A
JP2013246479A JP2012117600A JP2012117600A JP2013246479A JP 2013246479 A JP2013246479 A JP 2013246479A JP 2012117600 A JP2012117600 A JP 2012117600A JP 2012117600 A JP2012117600 A JP 2012117600A JP 2013246479 A JP2013246479 A JP 2013246479A
Authority
JP
Japan
Prior art keywords
data
copy
failure
storage device
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012117600A
Other languages
English (en)
Other versions
JP6078984B2 (ja
Inventor
Yoshiisa Kaku
兆功 郭
Koichi Yazaki
孝一 矢崎
Hideki Tanaka
秀樹 田中
Koichi Yokota
耕一 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012117600A priority Critical patent/JP6078984B2/ja
Priority to US13/772,930 priority patent/US9176813B2/en
Priority to EP13156740.6A priority patent/EP2667305B1/en
Publication of JP2013246479A publication Critical patent/JP2013246479A/ja
Application granted granted Critical
Publication of JP6078984B2 publication Critical patent/JP6078984B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • G06F11/1068Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices in sector programmable memories, e.g. flash disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1666Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • G06F12/0238Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
    • G06F12/0246Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory in block erasable memory, e.g. flash memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】データの信頼性を向上させる。
【解決手段】障害時に記憶領域22へのライトアクセスを禁止し且つ該記憶領域22へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置20の障害の予兆を検知する予兆検知部112と、障害の予兆を検知すると、ストレージ装置20へ書き込むデータの複写を第1複写データ記憶部12に記憶させる第1複写部113とをそなえる。
【選択図】図1

Description

本件は、処理装置,処理方法,処理プログラム及び管理装置に関する。
Hard Disk Drive(HDD)に比べて高速なデータアクセスが可能なストレージ装置として、近年、Solid State Drive(SSD)が用いられている。SSDは、フラッシュメモリ等で構成される記憶領域を備えるとともに、コントローラ(SSDコントローラ)とキャッシュと記憶領域とを備える。
コンピュータがこのSSDへデータアクセスを行なう際には、HDDと同様にAT Attachment(ATA)コマンドを使用して、SSDコントローラに対して読み書きのデータ転送を行なう。
また、SSDの記憶領域に用いられる記憶素子には書き込み回数の限界があり、SSDを長期的に使用すると故障が生じることが知られている。
ここで、SSDやHDDの故障を未然に検知するための技術として、ディスク障害の早期発見や故障の予測を行なうSelf-Monitoring Analysis and Reporting Technology(S.M.A.R.T.)と呼ばれる自己診断機能が知られている。
また、SSDに記憶されたデータを保護するための技術として、SSDコントローラがSSDにおける故障を検知して、その記憶領域をリードオンリー(ReadOnly)モードにすることで、データの書き込みを禁止し、記憶領域を保護する方法がある。
特表2010−521014号公報
"S.M.A.R.T. Attribute Annex"、September 30,2005、[平成24年3月21日検索]、インターネット(URL:http://www.t13.org/documents/UploadedDocuments/docs2005/e05148r0-ACS-SMARTAttributesAnnex.pdf)
しかしながら、このような従来のSSDを備える情報処理装置においては、SSDにおいて、記憶領域をリードオンリーモードにしてデータの書き込みを禁止した場合であっても、SSDのキャッシュにライトデータを格納した時点で、コントローラが情報処理装置に書き込み成功を通知する場合がある。これにより、SSDからデータの読み出しを行なおうとする際に、読み出し対象のデータがSSDに保存されていない事態が生じ、信頼性が低くなるという課題がある。
1つの側面では、本発明は、データの信頼性を向上できるようにすることを目的とする。
なお、前記目的に限らず、後述する発明を実施するための形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。
このため、処理装置は、障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知する予兆検知部と、前記予兆検知部が前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させる第1複写部とを備える。
また、処理方法は、障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知するステップと、前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させるステップとを備える。
さらに、処理プログラムは、障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知し、前記予兆検知部が前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させる処理をコンピュータに実行させる。
さらに、管理装置は、ストレージ装置の障害の予兆が検知された場合に収集される、前記ストレージ装置への書き込みデータの複写を格納する複写データ格納部と、前記ストレージ装置に記憶されているデータと、前記複写データ格納部に格納された前記書き込みデータの複写とに基づいて、前記ストレージ装置のデータの復元データを作成する、復元部とを備える。
また、処理プログラムは、ストレージ装置の障害の予兆が検知された場合に収集される、前記ストレージ装置への書き込みデータの複写を複写データ格納部に格納し、前記ストレージ装置に記憶されているデータと、前記複写データ格納部に格納された前記書き込みデータの複写とに基づいて、前記ストレージ装置のデータの復元データを作成する処理をコンピュータに実行させる。
1実施形態によれば、信頼性を向上させることができる。
実施形態の一例としてのコンピュータシステムの構成を模式的に示す図である。 実施形態の一例としてのコンピュータシステムにおける第1複写データテーブル及び第2複写データテーブルを例示する図である。 S.M.A.R.T.値を例示する図である。 実施形態の一例としてのコンピュータシステムにおけるデータの流れの概要を示す図である。 実施形態の一例としてのコンピュータシステムにおける異常検知時の処理を説明する図である。 実施形態の一例としてのコンピュータシステムにおける、SSDの障害の予兆の検知手法を説明するフローチャートである。 実施形態の一例としてのコンピュータシステムにおける複写IO処理部によるデータのライト時の処理をフローチャートである。 実施形態の一例としてのコンピュータシステムにおける複写IO処理部によるデータのリード時の処理を説明するフローチャートである。 実施形態の一例としてのコンピュータシステムの変形例の構成を示す図である。 実施形態の一例としてのコンピュータシステムの変形例における履歴情報を例示する図である。 実施形態の一例としてのコンピュータシステムの変形例におけるSSDの障害予兆の検知手法を説明する図である。
以下、図面を参照して本処理装置,処理方法,処理プログラム及び管理装置に係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形(実施形態及び各変形例を組み合わせる等)して実施することができる。又、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
(A)実施形態
図1は実施形態の一例としてのコンピュータシステムの構成を模式的に示す図である。
本コンピュータシステム1は、図1に示すように、コンピュータ10とコンピュータ30とを備える。コンピュータ10とコンピュータ30とはネットワーク50を介して通信可能に接続されている。
ネットワーク50は、コンピュータ10とコンピュータ30とを通信可能に接続する通信手段であり、例えば、Local Area Network(LAN)である。
コンピュータ30は、コンピュータ10の外部に備えられた情報処理装置であり、ストレージ装置31を備える。このコンピュータ30は、例えば、クラウド上に配置されたサーバコンピュータであってもよい。
コンピュータ30は、図1に示すように、CPU39,Random Access Memory(RAM)22,Read Only Memory(ROM)33,IO制御部34,通信部35,キーボード16,マウス17,ディスプレイ18及びストレージ装置31を備える。
通信部35は、コンピュータ30をネットワーク50と通信可能に接続する機器であり、例えば、LANボード等の通信アダプタである。
キーボード16及びマウス17は、それぞれコンピュータ10のオペレータが入力操作を行なう入力装置である。ディスプレイ18は、オペレータに対する種々の情報やメッセージ等を表示する表示装置である。
IO制御部34は、入出力機器に対するデータの受け渡しを制御する。図1に示す例においては、IO制御部14は、ストレージ装置31に対するデータの入出力を制御する。又、コンピュータ10には、後述の如く、コンピュータ10から取り外されたSSD20が接続され、IO制御部34は、このSSD20からのデータの読み出しも行なう。
ROM33は、CPU39が実行するOperating System(OS)やプログラム,種々のデータ等を格納する記憶装置である。
RAM32は、種々のデータやプログラムを格納する主記憶領域であって、CPU39がプログラムを実行する際に、データやプログラムを格納・展開して用いる。
ストレージ装置(第2複写データ記憶部,外部記憶装置)31は、HDDやSSD等の記憶装置であって、種々のデータやプログラムを格納する。又、このストレージ装置31には、第2複写データテーブル131が格納される。
第2複写データテーブル131は、後述する第1複写データテーブル121を複写したバックアップデータであり、この第1複写データテーブル121と同様の構成を備える。すなわち、第2複写データテーブル131は、後述するSDD20における記憶領域のアドレスと当該アドレスに格納されるべきデータ(ライトデータ)とを対応付けて構成されている。
図2は実施形態の一例としてのコンピュータシステム1における第1複写データテーブル121及び第2複写データテーブル131を例示する図である。この図2に示す例においては、第2複写データテーブル131(第1複写データテーブル121)は、LBA番地とライトデータとが対応付けられている。
LBA番地は、Logical Block Addressing(LBA)におけるアドレス(番地)であり、SDD20の記憶領域22における位置を表す。データは、SDD20に記録されるべきライトデータの複写(第1複写データ,第2複写データ)であり、データブロックとして取り扱われる。
すなわち、第2複写データテーブル131は、SDD20における記憶領域のアドレスと当該アドレスに格納されるべきデータ(ライトデータ;第2複写データ)とを対応付ける。
コンピュータ30には、後述するコンピュータ10の複製部114によって、RAM12に記憶された第1複写データテーブル121の複写が送信される。そして、ストレージ装置31の記憶領域には、この第1複写データテーブル121の複写が第2複写データテーブル(第2複写データ)131として記憶される。すなわち、ストレージ装置31は、第1複写データテーブル121のバックアップデータである第2複写データテーブル131を記憶する第2複写データ記憶部(バックアップディスク)として機能する。
CPU39は、種々の制御や演算を行なう処理装置であり、ROM33に格納されたOSやプログラムを実行することにより、種々の機能を実現する。すなわち、CPU39は、図1に示すように、復元部116として機能する。
復元部116は、後述の如く、コンピュータ10において、障害が発生しリードオンリーモードとなったSSD20のデータを復旧し、リカバリイメージデータを作成する。
例えば、リードオンリーモードになったSSD20をコンピュータ10から取り外し、この取り外したSSD20を、輸送手段を用いてコンピュータ30の設置場所まで搬送してコンピュータ30のIO制御部34に接続する。これにより、リードオンリーモードに移行したSSD20のデータを読み出し、コンピュータ30に移動させる。
なお、SSD20のデータの移動は、例えば、コンピュータ10のCPU(ストレージデータ送信部)11が、SSD20の記憶領域22から全データを読み出し、ネットワーク50を介してコンピュータ30に送信することにより行なってもよい。この場合、SSD20のデータの移動は、SSD20がリードオンリーモードに移行した等のタイミングで自動的に移動させてもよく、又、オペレータの操作により移動させてもよい。
無線,有線を問わずネットワーク50のデータ伝送速度は日々向上しており、将来的には、ネットワーク50の伝送速度はより高性能になることが予想される。従って、今後の技術革新によりSSD20の容量が増大した場合でも、SSD20の全データをネットワーク50を介してコンピュータ30に送信することに実施の困難性は無い。
復元部116は、コントローラ21によってリードオンリーモードになったSSD20から読み出したデータと、第2複写データテーブル131のデータとを組み合わせることにより、SSD20のデータの復元データ(リカバリイメージデータ)を作成する。
また、この際、復元部116は、SSD20の記憶領域22から読み出したデータよりも、第2複写データテーブル131に登録されたデータを優先して用いる。すなわち、SSD20の記憶領域22から読み出したデータのうち、第2複写データテーブル131のLBA番地に登録されたアドレスのデータについては、第2複写データテーブル131のデータで上書きする。
そして、復元部116は、復元したSSD20のデータを、例えば、新たに用意した障害の無いSSD20に格納することで、SSD20の復元を行なう。もしくは、復元部116は、復元したSSD20のリカバリイメージデータを、コンピュータ30において新たに用意したストレージ装置に格納する。
コンピュータ10は、図1に示すように、CPU11,RAM12,ROM13,IO制御部14,通信部15,キーボード16,マウス17,ディスプレイ18及びSSD20を備える。
通信部15は、コンピュータ10をネットワーク50と通信可能に接続する機器であり、例えば、LANボード等の通信アダプタであり、通信部35と同様の機能構成を備える。
IO制御部14は、入出力機器に対するデータの受け渡しを制御するインタフェース装置である。図1に示す例においては、IO制御部14は、特に、SSD20に対するデータの入出力を制御する。
SSD20は、記憶媒体22としてフラッシュメモリ等の半導体メモリを備える記憶装置であり、図1に示すように、コントローラ(SSDコントローラ)21,記憶媒体22及びキャッシュメモリ23を備える。
記憶媒体22は、フラッシュメモリ等の半導体メモリであり、データを読み書き可能に記憶する。
キャッシュメモリ23は、記憶媒体22に書き込むデータや記憶媒体22から読み出したデータを一旦格納する記憶装置である。例えば、SSD20は、受信したデータをこのキャッシュ23に一旦格納してから、記憶媒体22に書き込む。
コントローラ21は、記憶媒体22へのデータの書き込みや読み出しを制御する。CPU11がSSD20の記憶媒体22へデータアクセスを行なう際には、例えば、ATAコマンドを用いて、リード要求やライト要求を行なう。コントローラ21は、CPU11から送信されたコマンドに従って、記憶媒体22への各種データアクセスを行なう。
また、コントローラ21は、SSD20における自己診断機能を実現する。例えば、コントローラ21は、自己診断機能としてS.M.A.R.T.を用いる。コントローラ21は、記憶媒体22へのデータアクセスにおける読み取りエラーの発生率や読み書き速度、出荷以来の通算の通電時間等を測定する。これらの測定結果は、S.M.A.R.T.値(自己診断履歴情報)としてCPU11に通知される。
図3はS.M.A.R.T.値を例示する図である。この図3においては、S.M.A.R.T.におけるベンダー固有値のフィールドの一部を例示している。すなわち、“ID#”で表される複数種類の検査項目(属性)について、それぞれ、“ATTRIBUTE_NAME”,“FLAG”,“VALUE”,“ WORST ”,“THRESH”,“TYPE”,“UPDATED”,“WHEN_FAILED”及び“RAW_VALUE”を備える。
例えば、ID=01のRaw_Read_Error_Rateは、ストレージ装置(SSD20)からデータを読み込む時に発生したエラーの割合を表す。数値が閾値より低い場合、SSD20の記憶媒体22に異常がある。又、ID=200のMulti_Zone_Error_Rateは、データの書き込み中に発見されたエラーの総数を示す。
また、各検査項目には、例えば、 “現在の値(VALUE)”,“閾値(THRESHOLD;THRESH)”及び“ワースト値(WORST)”の各項目が設定されている。
さらに、コントローラ21は、記憶媒体22へのライトアクセスを禁止し、記憶媒体22へのリードアクセスのみを許可する制御を行なう。すなわち、SSD20は、リードオンリーモードで動作可能なストレージ装置である。
なお、SSD20における自己診断機能やリードオンリーモードを実現する機能は、機知の種々の手法を用いて実現することができ、その詳細な説明は省略する。
なお、SSD20は、HDDのようなディスクを持たないので、読み取り装置(ヘッド)をディスク上で移動させる時間(シークタイム)や、目的のデータがヘッド位置まで回転してくるまでの待ち時間(サーチタイム)がなく、データを高速に読み書きできる。又、モーターを備える必要が無いので、消費電力も少なく、機械的に駆動する部品が無いため衝撃にも強いという特性を有する。
ROM13は、CPU11が実行するOSやプログラム,種々のデータ等を格納する記憶装置である。
RAM12は、種々のデータやプログラムを格納する主記憶装置であって、CPU11がプログラムを実行する際に、データやプログラムを格納・展開して用いる。又、このRAM12には、第1複写データテーブル121が格納される。
第1複写データテーブル121は、前述の如く、SDD20における記憶領域のアドレスと当該アドレスに格納されるべきデータ(ライトデータ)の複製(第1複写データ)とを対応付ける。
このように、RAM12の記憶領域には、SSD20に記憶するデータの複写が記憶される。すなわち、RAM12は、第1複写データを記憶する第1複写記憶部として機能する。
なお、本実施形態においては、SDD20の記憶領域22におけるアドレスと当該アドレスに格納されるべきデータの複製とを、テーブル状の第1複写データテーブル121もしくは第2複写データテーブル131に登録することにより関連付けているが、これに限定されるものではなく、種々変形して実施することができる。
CPU11は、種々の制御や演算を行なう処理装置であり、ROM13に格納されたOSやプログラムを実行することにより、種々の機能を実現する。すなわち、CPU11は、図1に示すように、IO処理部111,監視部112,複写IO処理部113及び複製部114として機能する。
IO処理部111は、SSD20にリードアクセスもしくはライトアクセスのデータアクセスを行なって、種々のデータアクセス処理を行なう。例えば、IO処理部111は、CPU11による演算結果をSSD20の記憶領域22に格納させたり、CPU11が用いるデータやプログラム等をSSD20の記憶領域22から読み出す。
すなわち、IO処理部111は、SSD20の記憶領域22へのデータ(ライトデータ)の書き込みを行なうライト処理部として機能する。
監視部(予兆検知部)112は、SSD20における障害の予兆を検知する。具体的には、例えば、監視部112は、SSD20のコントローラ21によって通知されたS.M.A.R.T.値(自己診断履歴情報)の少なくとも一部を用いてSSD20における障害の予兆を検知する。
具体的には、監視部112は、S.M.A.R.T.値における少なくとも一部の属性において、現在の値またはワースト値が異常値であることを検知すると、SSD20の障害の予兆を検知する。
ここで、S.M.A.R.T.値の異常値とは、例えば、S.M.A.R.T.値でいうところのTHRESHOLD値(閾値)を上回るあるいは下回ることを指す。すなわち、S.M.A.R.T.値のいずれかの値が閾値を超えた場合に、S.M.A.R.T.が異常値であると判断される。以下、S.M.A.R.T.値のいずれかがTHRESHOLD値を越えた状態をS.M.A.R.T.異常という場合がある。
例えば、監視部112は、S.M.A.R.T.値におけるRaw_Read_Error_RateやMulti_Zone_Error_Rate等、経験的に障害発生時に変化する傾向の高い属性の値を所定の閾値と比較することで、SSD20の障害の予兆を検知する。
また、上述した説明においては、S.M.A.R.T.異常の検知手法としてS.M.A.R.T.のTHRESHOLD値を用いる例を示したが、これに限定されるものではない。すなわち、例えば、安全のために閾値をTHRESHOLD値より余裕を持った値とすることも可能である。更に、障害発生時のS.M.A.R.T.値を統計的に分析することにより、経験則に基づく独自の閾値を用いてS.M.A.R.T.異常を検知してもよい。
また、監視部112は、SSD20の記憶領域22に対する、書き込みミス回数の検知や、リード/ライトの速度低下を検知することによって、SSD20における障害の予兆を検知してもよい。
書き込みミス回数は、例えば、SSD20にデータの書き込みを行なった場合に発生した書き込みミスが連続した回数であり、所定値以上連続して書き込みミスが発生した場合にSSD20の異常と判断する。
リード/ライトの速度低下とは、SSD20の記憶領域22へのデータの書き込み、もしくは記憶領域22からのデータの読み出しの速度が、通常値よりも低下した場合にSSD20の異常と判断する。
また、SSD20における障害の予兆を検知手法は、上述した手法に限定されるものではなく、種々変形して実施することができる。すなわち、上述した手法とは異なる他の手法を用いてもよく、又、各手法を取捨選択して適宜組み合わせて判断してもよい。
なお、監視部112によるSSD20における障害の予兆検知は、これらの手法に限定されるものではなく、これら以外の手法を用いてもよく、種々変形して実施することができる。又、監視部112は、SSD20におけるこれらの種々の障害の予兆検知手法を、適宜、取捨選択し組み合わせて実施してもよい。
また、監視部(障害検知部)112は、RAM12に格納されたデータと、当該データに対応するSSD20から読み出したデータとを比較して、SSD20に正しくデータが書き込まれているかを確認する。具体的には、監視部112は、後述するRAM12の第1複写データテーブル121に格納されたLBA番地に対応するデータをSSD20から読み出す。
そして、監視部112は、第1複写データテーブル121に格納されたデータとSSD20の当該LBA番地に対応するアドレスから読み出したデータとを比較し、これらのデータが一致するか否かを判断する。
監視部112は、これらの第1複写データテーブル121に格納されたデータとSSD20から読み出したデータとが不一致である場合に、SSD20において障害が発生していると判断する。
例えば、監視部112は、SSD20からのデータの読み出しを行なう際に、SSD20におけるリード対象のデータ(リードデータ)のアドレス(指定番地)に基づいて、第1複写データテーブル121を参照する。そして、この第1複写データテーブル121にリードデータの指定番地が登録されている場合には、SSD20から読み出したリードデータと、第1複写データテーブル121から読み出した、その指定番地に対応する第1複写データとを比較する。
監視部112は、SSD20から読み出したリードデータと、第1複写データテーブル121から読み出した第1複写データとが不一致の場合に、SSD20に障害が発生していることを検知する。すなわち、監視部112は、SSD20における障害の発生を検知する障害検知部としての機能も備える。
なお、SSD20における障害発生の検知手法は、これに限定されるものではなく、適宜変形して実施することができる。
監視部112は、SSD20において障害が発生していることを検知すると、複製部114に対して退避通知を出力する。
なお、退避通知を受けた複製部114は、第1複写データテーブル121の複写をコンピュータ30に送信し、そのストレージ装置31に第2複写データテーブル131として保存させる。
また、監視部112は、SSD20において何らかの障害が生じている旨の通知及び、ライトデータの書き込みが失敗した旨の通知(書き込み失敗通知)を出力する。
監視部112は、ディスプレイ18にSSD20にライトデータの書き込みが失敗した旨のメッセージを表示させたり、図示しないスピーカから警告音を出力させることで、コンピュータ10のオペレータに通知する。これにより、オペレータはライトデータの書き込みの失敗を認識することができ、例えば、SSD20から書き込みが完了しているデータを退避させたり、又、ライトデータの再度の書き込みを行なったり、必要な対処を行なうことができる。
SSD20において、何らかの理由で記憶領域22にライトデータを記憶させることができない場合には、SSD20は、ライトデータを記憶できない旨の異常応答をCPU11に対して出力する。
監視部112は、SSD20へのライトデータの書き込みが失敗したことを検知すると又、SSD20に何らかの障害が生じている旨の通知及び、ライトデータの書き込みが失敗した旨の通知(書き込み失敗通知)を行なう。
また、監視部112は、IO処理部111がライトデータをSSD20に記憶させてから所定時間(例えば、2,3分)経過しても、SSD20から異常応答が通知されない場合には、SSD20へのライトデータの書き込みが成功したと判断する。
さらに、監視部112は、SSD20に記憶させてから前記所定時間が経過する前の新しいデータについては、SSD20から読み出したリードデータと、第1複写データテーブル121から読み出した第1複写データとを比較する。そして、SSD20から読み出したリードデータと、第1複写データテーブル121から読み出した第1複写データとが一致する場合に、SSD20へのライトデータの書き込みが成功したと判断する。
一方、SSD20から読み出したリードデータと、第1複写データテーブル121から読み出した第1複写データとが不一致の場合には、監視部112は、SSD20へのライトデータの書き込みが失敗したと判断する。
複写IO処理部(第1複写部)113は、監視部(予兆検知部)112がSSD20における障害の予兆を検知すると、IO処理部111に代えてSSD20に対するデータのリードやライトを行なう。
複写IO処理部113は、SSD20に対してデータ(ライトデータ)の書き込みを行なうとともに、SSD20の記憶領域22に書き込むライトデータの複写(第1複写データ)をRAM12に記憶させる。
本コンピュータシステム1においては、複写IO処理部113は、SSD20へのライトデータの複写を、RAM12の第1複写データテーブル121に格納する。又、この際、複写IO処理部113は、第1複写データテーブル121に、ライトデータの複写を、そのライトデータのSDD20における格納先のアドレスに対応付けて格納する。
このように、複写IO処理部113は、ライトデータの書き込みをSSD20とRAM12との両方に対して行なう。
また、複写IO処理部113は、前述した監視部112がSSD20へのライトデータの書き込みが成功したと判断した場合には、RAM12の第1複写データテーブル121から、当該ライトデータに対応する第1複写データを削除する。これにより、RAM12の空き容量を増加させる。
また、複写IO処理部113が第1複写データをRAM12に記憶させる場合に、RAM12にライトデータを記憶させることができない場合が生じ得る。このような場合には、複写IO処理部113は、例えば、RAM12における、ライトデータのSSD20への書き込みが成功している第1複写データを、RAM12から削除することで、メモリの空き容量の確保に努める。
なお、例えば、第1複写データのサイズがRAM12の空き容量よりも大きい場合には、この第1複写データをRAM12に格納することができない。この場合には、複写IO処理部113は、第1複写データをRAM12に格納することができない旨の通知を出力させる。例えば、ディスプレイ18に第1複写データをRAM12に格納することができない旨のメッセージを出力させることで、コンピュータ10のオペレータに通知を行なう。
また、複写IO処理部113は、SSD20に障害が発生している場合には、第1複写データテーブル121から読み出した第1複写データをリードデータとして応答出力する。
複製部(第2複写部)114は、監視部(障害検知部)112から退避通知を受信すると、RAM12に記憶された第1複写データテーブル121の複写を、コンピュータ30のストレージ装置31に第2複写データテーブル131として保存させる。
すなわち、複製部114は、監視部112がSSD20における障害の発生を検知すると、記憶領域22に記憶された第1複写データテーブル121のバックアップをコンピュータ30のストレージ装置31に保存させる。
そして、コンピュータ10のCPU11が、プログラム(例えば、デバイスプログラム)を実行することにより、上述したIO処理部111,監視部112及び複写IO処理部113として機能する。又、コンピュータ10のCPU11が、プログラム(例えば、処理プログラム)を実行することにより、上述した複製部114として機能する。
また、コンピュータ30のCPU39が、プログラム(例えば、処理プログラム)を実行することにより、上述した復元部116として機能する。
なお、これらのIO処理部111,監視部112,複写IO処理部113,複製部114及び復元部116としての機能を実現するためのプログラム(デバイスプログラム,制御プログラム)は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
IO処理部111,監視部112,複写IO処理部113,複製部114及び復元部116としての機能を実現する際には、内部記憶装置(本実施形態ではRAM12,32やROM13,33)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU11,39)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
なお、本実施形態において、コンピュータとは、ハードウェアとオペレーティングシステムとを含む概念であり、オペレーティングシステムの制御の下で動作するハードウェアを意味している。又、オペレーティングシステムが不要でアプリケーションプログラム単独でハードウェアを動作させるような場合には、そのハードウェア自体がコンピュータに相当する。ハードウェアは、少なくとも、CPU等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえている。
上述の如く構成された、実施形態の一例としてのコンピュータシステム1におけるデータの流れの概要を図4を参照しながら説明する。
例えば、OS上で動作するアプリケーションにおいてデータ(ライトデータ)の保存指示が行なわれる。ライトデータは、アプリケーションからOSを介してデバイスドライバに受け渡される(矢印A1参照)。
デバイスドライバ(IO処理部111)は、SSD20に対してデータの書き込みを行なわせ、SSD20のコントローラ21は、キャッシュ23を介してライトデータを記憶領域22に格納する(矢印A2参照)。コントローラ21は、キャッシュ23にデータの書き込みが完了した時点で、ディスクドライバに対してデータの書き込み完了(Write Success)の応答を通知する(矢印A3参照)。デバイスドライバはOSにデータの書き込み完了(Success)を応答する(矢印A4参照)。
ただし、このようにコントローラ21が書き込み完了の応答をデバイスドライバに送信した場合においても、SSD20において記憶領域22へのライトデータの書き込みが失敗する場合がある。
また、ディスクドライバ(監視部112)は、SSD20の状態を監視し、障害の予兆(例えば、S.M.A.R.T.異常,書き込みミス,リード/ライトの速度低下)の有無を判断する。障害の予兆が検知された場合には、複写IO処理部113が、SSD20の記憶領域22に書き込むライトデータの複写を、SSD20におけるライトアドレスに対応づけて、第1複写データテーブル121としてRAM12に記憶させる(矢印A5参照)。
また、SSDへのリードアクセス時において、監視部112が、SSD20における障害の発生を検知すると、ディスクドライバ(監視部112)がOSを介して制御プログラムに退避通知を行なう(矢印A6参照)。又、SSD20のコントローラ21は、記憶領域22をリードオンリーモードに移行させる。
複製部114は、RAM12の第1複写データテーブル121の複写をコンピュータ30のストレージ装置31に第2複写データテーブル131として記憶させる(矢印A7参照)。
すなわち、コンピュータ10から送信された第1複写データテーブル121を複写したデータは、ネットワーク50を介してコンピュータ30に送信される。コンピュータ30において、第1複写データテーブル121の複写データは、ネットワークドライバを介してストレージ装置31にデータ転送され第2複写データテーブル131として格納される。
その後、リードオンリーモードになったSSD20をコンピュータ30に接続する。コンピュータ30において、復元部116は、このSSD20から読み出したデータと、ストレージ装置31に記憶された第2複写データテーブル131とを組み合わせる。これにより、SSD20のデータが復元される(矢印A8参照)。
図5は実施形態の一例としてのコンピュータシステム1における異常検知時の処理を説明する図である。
SSD20のコントローラ21がS.M.A.R.T.値や書き込みミスの発生,リード/ライト速度をデバイスドライバ(監視部112)に所定間隔もしくは所定のタイミングで通知する。監視部112は、コントローラ21から通知されたこれらの情報に基づいて、SSD20の障害の予兆を検知する(矢印B1参照)。
デバイスドライバにおいて、監視部112は、障害の予兆を検知すると、複写IO処理部113に異常検知を通知する(矢印B2参照)。複写IO処理部113は、SSD20へのライトデータの書き込みとともに(矢印B3参照)、SSD20の記憶領域22に書き込むライトデータの複写をRAM12に記憶させる(矢印B4参照)。なお、RAM12へのライトデータの書き込みは、第1複写データテーブル121において、SSD20におけるライトアドレス(LBA番地)に対応付けて行なう。
このように、監視部112がSSD20の障害の予兆を検知すると、複写IO処理部113が、ライトデータの書き込みをSSD20とRAM12との両方に対して行なう。
また、SSDへのリードアクセス時において、複写IO処理部113は、SSD20から読み出したリードデータと、第1複写データテーブル121から読み出した第1複写データとを比較する(矢印B5,B6参照)。SSD20から読み出したリードデータと、第1複写データテーブル121から読み出した第1複写データとが不一致の場合には、監視部1123は、SSD20において障害が発生したと判断(検知)する。
監視部112は、SSD20における障害の発生を検知すると、複製部114にその旨を通知する(矢印B7参照)。
複製部114は、RAM12の第1複写データテーブル121の複写をコンピュータ30のストレージ装置31に記憶させる(矢印B8参照)。
これにより、第1複写データテーブル121のバックアップが第2複写データテーブル131としてコンピュータ30のストレージ装置31に格納される(矢印B9参照)。
そして、復元部116が、SSD20から読み出したデータと、ストレージ装置31に記憶された第2複写データテーブル131とを組み合わせる。これにより、SSD20のデータが復元される。復元されたSSD20のデータは、例えば、新たに用意されたSSD等の記憶装置に格納される。
次に、図6のフローチャート(ステップC1〜C4)に従って、実施形態の一例としてのコンピュータシステム1における、SSD20の障害の予兆の検知手法を説明する。
監視部112は、SSD20のコントローラ21から通知されるS.M.A.R.T.値が正常であるかを判断する(ステップC1)。例えば、S.M.A.R.T.値が予め設定された閾値を超えている場合等、S.M.A.R.T.値が正常でない場合には(ステップC1のNOルート参照)、複写IO処理部113が、IO処理部111に代えてSSD20に対するデータのリードやライトを行なう(ステップC4)。なお、この複写IO処理部113による処理の詳細は、図7及び図8に示すフローチャートに従って後述する。
S.M.A.R.T.値が正常である場合には(ステップC1のYESルート参照)、次に、監視部112は、SSD20に対してデータの書き込みが正しく行なわれたか否かを判断する(ステップC2)。
例えば、SSD20のコントローラ21は、SSD20の記憶領域22にデータを書き込んだ後に、書き込んだデータの読み込みを行ない、意図したデータと比較することで、確実にデータの書き込みが行なわれたかを確認する。
例えば、書き込むデータのチェックサムとSSD20から読み出したデータのチェックサムとを比較し、これらのチェックサムが一致するか否かを検証する。検証の結果は監視部112に通知され、監視部112は、この通知に基づき、SSD20に対してデータの書き込みが正しく行なわれたか否かを判断する。
データの書き込みを正しく行なわれなかった場合には(ステップC2のNOルート参照)、ステップC4に移行する。
また、SSD20に対してデータの書き込みが正しく行なわれた場合には(ステップC2のYESルート参照)、次に、監視部112は、SSD20に対してリード速度もしくはライト速度の低下の有無を判断する(ステップC3)。
SSD20のコントローラ21は、SSD20の記憶領域22へのデータの書き込み速度、もしくは記憶領域22からのデータの読み出し速度測定する。これらの測定結果は監視部112に通知され、監視部112は、この通知に基づき、SSD20に対してリード速度もしくはライト速度の低下の発生を判断する。
リード速度もしくはライト速度の低下は、例えば、測定したリード速度もしくはライト速度を、予め設定した閾値と比較することにより判断する。又、測定したリード速度もしくはライト速度を、先に測定したリード速度もしくはライト速度と比較し、これらの差が所定の閾値を越えた場合にリード速度もしくはライト速度の低下が生じたと判断してもよく、種々変形して実施することができる。
データの書き込み速度もしくは読み出し速度の低下が発生した場合には(ステップC3のNOルート参照)、ステップC4に移行する。又、データの書き込み速度もしくは読み出し速度が低下していない場合には(ステップC3のYESルート参照)、障害の予兆検知を終了する。
なお、上述したステップC1〜C3の各処理順序は、これに限定されるものではなく、適宜変更して実施することができる。
次に、実施形態の一例としてのコンピュータシステム1における複写IO処理部113によるデータのライト時の処理を、図7に示すフローチャート(ステップD1〜D10)に従って説明する。
複写IO処理部113は、SSD20におけるライトデータの書き込みアドレスが、第1複写データテーブル121のLBA番地に登録されているアドレスに一致するか否かを確認する(ステップD1)。ライトデータの書き込みアドレスが、第1複写データテーブル121のLBA番地に登録されていない場合には(ステップD1のNOルート参照)、次に、ライトデータのデータサイズに基づき、RAM12の空き容量を確認し、RAM12にライトデータを記憶可能であるかを確認する(ステップD2)。RAM12において、ライトデータを記憶可能な容量を確保できる場合には(ステップD2のYESルート参照)、複写IO処理部113は、SSD20のコントローラ21に対して、ライトデータの書き込み要求を送信する(ステップD3)。複写IO処理部113は、SSD20に対してライトデータを転送する(ステップD4)。
また、複写IO処理部113は、RAM21にもライトデータを転送する。すなわち、ライトデータの複写(第1複写データ)をRAM21に転送し、第1複写データテーブル121において、ライトデータと当該データのSSD20におけるアドレスをLBA番地とを関係付けて格納する。すなわち、第1複写データテーブル121のLBA番地及びデータを更新して、処理を終了する。このように、複写IO処理部113は、第1複写データテーブル121を更新しながらSSD20へのデータの書き込みを行なう。
一方、ライトデータの書き込みアドレスが、第1複写データテーブル121のLBA番地に登録されているアドレスに一致する場合には(ステップD1のYESルート参照)、ステップD3に移行する。
また、RAM12においてライトデータを記憶可能な容量を確保できない場合には(ステップD2のNOルート参照)、複写IO処理部113は、第1複写データテーブル121において、登録されてから所定時間(例えば、2,3分)を経過するエントリ(LBA番地,データ)があるかを確認する(ステップD6)。
記憶領域22にデータの書き込みを行なってから所定時間経過してもSSD20が異常応答を出力しない場合は、そのデータの書き込みは成功していると判断することができる。従って、第1複写データテーブル121における当該データのエントリを削除することで、RAM12の空き容量を増やすことができる。
そこで、第1複写データテーブル121に、登録されてから所定時間を経過するエントリがある場合には(ステップD6のYESルート参照)、第1複写データテーブル121における、登録後所定時間が経過しているエントリの第1複写データを、古い順から削除する(ステップD7)。その後、ステップD2に戻る(図7中の丸付き符号A参照)。
また、第1複写データテーブル121に、登録されてから所定時間を経過するエントリがない場合には(ステップD6のNOルート参照)、複写IO処理部113は、第1複写データテーブル121に登録されているデータがSSD20に書き込み成功しているかを確認する(ステップD8)。書き込みが成功しているデータを第1複写データテーブル121から削除することで、RAM12の空き容量を増やすことができる。
すなわち、例えば、第1複写データテーブル121に登録されている1以上のエントリについて、SSD20からそのLBA番地のデータを読み出す。そして、SSD20から転送されたデータとRAM12(第1複写データテーブル121)に保存されているデータとが一致するか否かを確認する。
SSD20から転送されたデータとRAM12に保存されているデータとで一致するものがある場合には(ステップD8のYESルート参照)、ステップD7に移行し、第1複写データテーブル121における、書き込みが成功していると判断される第1複写データを、古い順から削除し、ステップD2に戻る。
SSD20から転送されたデータとRAM12に保存されているデータとで一致するものがない場合には(ステップD8のNOルート参照)、監視部112が退避通知を出力する(ステップD9)。
この退避通知は複製部114に入力される。退避通知を受けた複製部114は、RAM12の第1複写データテーブル121の複写を、ネットワーク50を介してコンピュータ30に送信し、ストレージ装置31に第2複写データテーブル131として保存させる。
また、複写IO処理部113は、RAM12へのライトデータの書き込みが失敗した旨の通知を行ない(ステップD10)、処理を終了する。この場合、復元部116により、当該書き込みが失敗したデータよりも前のデータまで復元することが可能となる。
なお、ステップD9とステップD10との処理順序は、これに限定されるものではなく、先にステップD10を行なった後にステップD9を行なってもよい。
次に、実施形態の一例としてのコンピュータシステム1における複写IO処理部113によるデータのリード時の処理を、図8に示すフローチャート(ステップE1〜E8)に従って説明する。
複写IO処理部113は、SSD20に対して読み出し要求を通知すると(ステップE1)、SSD20はデバイスドライバ(複写IO処理部113)に対象のデータを転送する(ステップE2)。
複写IO処理部113は、読み出し対象のリードデータのSSD20におけるアドレスが、第1複写データテーブル121のLBA番地に登録されているか否かを確認する(ステップE3)。
読み出し対象のリードデータのアドレスが、第1複写データテーブル121に登録されている場合には(ステップE3のYESルート参照)、SSD20から読み出したリードデータと、RAM12(第1複写データテーブル121)から読み出したデータとが一致するかを確認する(ステップE4)。
SSD20から読み出したリードデータと、第1複写データテーブル121から読み出したデータとが不一致の場合は(ステップE4のNOルート参照)、複写IO処理部113は、第1複写データテーブル121から読み出したデータをCPU11等にデータ転送する(ステップE5)。又、監視部112が退避通知を出力し(ステップE6)、処理を終了する。
この退避通知は複製部114に入力される。退避通知を受けた複製部114は、RAM12の第1複写データテーブル121の複写を、ネットワーク50を介してコンピュータ30に送信し、ストレージ装置31に第2複写データテーブル131として保存させる。
なお、ステップE5とステップE6との処理順序は、これに限定されるものではなく、先にステップE6を行なった後にステップE5を行なってもよい。
一方、読み出し対象のリードデータのアドレスが、第1複写データテーブル121に登録されていない場合には(ステップE3のNOルート参照)、複写IO処理部113は、SSD20から読み出したデータをCPU11等にデータ転送する(ステップE7)。又、複写IO処理部113は、第1複写データテーブル121から、当該リードデータに対応する第1複写データを削除して(ステップE8)処理を終了する。
また、SSD20から読み出したリードデータと、第1複写データテーブル121から読み出したデータとが一致する場合も(ステップE4のYESルート参照)、ステップE7に移行する。
なお、ステップE7とステップE8との処理順序は、これに限定されるものではなく、先にステップE8を行なった後にステップE7を行なってもよい。
このように、実施形態の一例としてのコンピュータシステム1によれば、SSD20における障害の予兆が検知されると、ライトデータの複写をRAM12の第1複写データテーブル121に記憶する。
すなわち、本コンピュータシステム1においては、SSD20の障害発生が検知され、このSSD20がリードオンリーモードに移行した場合でも、障害の予兆を検知した以降にSSD20に書き込み要求が行なわれたデータがRAM12に記憶される。
これにより、例えば、SSD20がリードオンリーモードに移行したことによりライトデータをSSD20に格納できなかった場合でも、RAM12からライトデータの複写を読み出して使用することができ、データの信頼性を向上させることができる。又、リードオンリーモードのSSD20から読み出したSSD20のデータと、第1複写データテーブル121に格納された第1複写データとを用いて、アプリケーション等からの書き込み指示に合った状態のSSD20データを復元することができる。
また、SSD20を障害発生時にリードオンリーモードに移行させることにより、記憶領域22の更なる障害の発生を防止することができる
監視部112が、S.M.A.R.T.異常,SSD20に対するデータの書き込みミス、及び、SSD20に対してリード速度もしくはライト速度の低下、の少なくともいずれかを検知すると、SSD20の障害の予兆を検知する。これにより、SSD20の障害の発生を未然に検知して、ライトデータをRAM12にバックアップすることができ、信頼性を向上させることができる。
さらに、複写IO処理部113が、ライトデータの複写をRAM12に格納する際に、RAM12に空き容量が不足している場合には、第1複写データテーブル121からSSD20の書き込みが完了しているデータのエントリを削除する。これにより、ライトデータの複写をRAM12に格納することが可能となり、信頼性を向上させることができる。
また、監視部112がSSD20において障害の発生を検知した場合に、複製部114が、RAM12の第1複写データテーブル121の複写をコンピュータ30のストレージ装置31に記憶させる。これにより、コンピュータ10の電源断等、RAM12のデータが消失した場合においても、復元部116が、ストレージ装置31の第2複写データテーブル131を用いて、SSD20の復元を行なうことができ、これによっても信頼性を向上させることができる。
(B)変形例
上述した実施形態においては、コンピュータ10に備えられた監視部112がSSD20における障害の予兆を検知しているが、これに限定されるものではない。
本変形例においては、ネットワーク50に接続されたコンピュータ30に監視部112aとしての機能を備え、このコンピュータ30に備えられた監視部112aがSSD20における障害の予兆を検知する。
図9は実施形態の一例としてのコンピュータシステム1の変形例の構成を示す図である。
本変形例のコンピュータシステム1は、図9に示すように、コンピュータ30と、1つ以上のコンピュータ10とを備え、コンピュータ10とコンピュータ30とはネットワーク50を介して通信可能に接続されている。
なお、図中、既述の符号と同一の符号は同様の部分を示しているので、その詳細な説明は省略する。
本変形例において、コンピュータ10は、第1実施形態のコンピュータ10における監視部112に代えて情報収集部115を備える。
情報収集部115は、コンピュータ10におけるSSD20の状態記録を採取し、ログ情報としてコンピュータ30に送信する。
情報収集部115は、例えば、所定間隔で、SSD20からS.M.A.R.T.値や、SSD20における障害発生の有無を示す情報を採取する。又、情報収集部115は、SSD20のコントローラ21から取得した、記憶領域22に対する、書き込みミス回数やリード/ライトの速度を、ログ情報としてコンピュータ30に送信してもよい。
情報収集部115は、採取したこれらのSSD20に関する情報を、ログ情報として、SSD20のディスクシリアルナンバーやコンピュータ10のPC IDとともに、コンピュータ30に、ネットワーク50を介して送信する。
なお、情報収集部115としての機能は、例えば、CPU11が、OS上で稼動する情報収集プログラム(情報収集アプリ;図10参照)を実行することにより実現される。
コンピュータ30は、サーバ機能をそなえたサーバコンピュータとして構成され、例えば、クラウド上に配置されている。
ストレージ装置31には、第2複写データテーブル131の他、履歴情報132が格納される。
履歴情報132は、コンピュータ10に備えられるSSD20の動作記録であり、SSD20の障害に関する情報を備える。この履歴情報132は、後述するコンピュータ10の情報収集部115によって収集され、送信されたログ情報に基づいて作成される。
図10は実施形態の一例としてのコンピュータシステム1の変形例における履歴情報132を例示する図である。
この図10に示す例においては、履歴情報132は、タイムスタンプ(Time Stamp),ディスクシリアルナンバー(Disk Serial Number),PC ID,S.M.A.R.T.LOG及び故障の各項目を相互に関連付けて構成されている。なお、図10に示す例においては、履歴情報132をテーブル状に構成して示している。
また、履歴情報132は、SSD20のディスク型番毎に作成される。SSD20のディスク型番は、SSD20の機種を特定する識別情報であり、同一種類のSSD20には同一のディスク型番が設定される。
タイムスタンプは、その情報が情報収集部115によって収集された日時を示す。ディスクシリアルナンバーは、SSD20を特定する識別情報であり、SSD20毎に固有に設定される。PCIDは、そのSSD20が搭載されているコンピュータ10を特定する識別情報である。
S.M.A.R.T.LOGは、SSD20のコントローラ21によって生成されたS.M.A.R.T.値(図3参照)であり、コントローラ21は、所定時間毎にS.M.A.R.T.値を生成する。故障は、SSD20の状態を示す情報であり、その動作履歴を示す情報が収集された時点でSSD20に障害が発生していたか否かを示す。従って、故障情報が“あり”の場合には、対応するS.M.A.R.T.LOGは、故障したSSD20のS.M.A.R.T.値を表し、“なし”の場合は、非故障状態のSSD20のS.M.A.R.T.値を示す。
監視部112aは、コンピュータ10に備えられたSSD20における障害の予兆を検知する。具体的には、例えば、監視部112aは、履歴情報132を用いてSSD20における障害の予兆を検知する。
監視部112aは、例えば、履歴情報におけるS.M.A.R.T.LOGにおける少なくとも一部の属性(Vendor Attribute)において、現在の値またはワースト値が異常値(S.M.A.R.T.異常)であることを検知すると、SSD20の障害の予兆を検知する。
また、この監視部112aによるS.M.A.R.T.異常の検知に際して、S.M.A.R.T.値に含まれる閾値に代えて、別途、独自の閾値を備え、この独自の閾値に基づいてS.M.A.R.T.異常を検知してもよい。
ここで、独自の閾値としては、同一機種のSSD20について、例えば、故障が“あり”となっているS.M.A.R.T.値と、故障が“なし”となっているS.M.A.R.T.値とで相違するパラメータを抽出し、これらのパラメータの変化を統計情報として採取することで独自の閾値を作成する。
なお、監視部112aは、第1実施形態の監視部112と同様に、SSD20の記憶領域22に対する、書き込みミス回数の検知や、リード/ライトの速度低下を検知することによって、SSD20における障害の予兆を検知してもよい。
また、SSD20における障害の予兆を検知手法は、上述した手法に限定されるものではなく、種々変形して実施することができる。すなわち、上述した手法とは異なる他の手法を用いてもよく、又、各手法を取捨選択して適宜組み合わせて判断してもよい。
なお、監視部112aによるSSD20における障害の予兆検知は、これらの手法に限定されるものではなく、これら以外の手法を用いてもよく、種々変形して実施することができることは言うまでもない。又、監視部112aは、SSD20におけるこれらの種々の障害の予兆検知手法を、適宜、取捨選択し組み合わせて実施してもよい。
上述の如く構成された、実施形態の一例としてのコンピュータシステム1の変形例におけるSSD20の障害予兆の検知手法を、図11を用いて説明する。
情報収集部115(情報収集アプリケーション)は、OS及びデバイスドライバを介して、情報取得要求をSSD20に対して通知する(矢印F1,F2参照)。SSD20のコントローラ21は、S.M.A.R.T.値をデバイスドライバに通知し、デバイスドライバはOSに対して、情報収集が成功した旨の通知(success)を行なう(矢印F3参照)。
情報収集部115は、収集したS.M.A.R.T.値を、コンピュータ10のPC IDやSSD20のディスクシリアルナンバーとともに、ログ情報としてネットワーク50を介してコンピュータ30に送信する。
コンピュータ30においては、監視部112aが、コンピュータ10から受信したログ情報を、そのSSD20のディスク型番に対応する履歴情報132に登録する。
監視部112aは、履歴情報132のS.M.A.R.T.値における所定の属性の値を閾値と比較し、その属性の値が閾値を越えたこと(S.M.A.R.T.異常)を検知すると、SSD20の障害の予兆を検知する。
SSD20の障害の予兆を検知した監視部112aは、S.M.A.R.T.異常が検知されたSSD20が備えられたコンピュータ10に対して、S.M.A.R.T.異常が検知された旨の通知(異常通知)を行なう。なお、かかる異常通知を受信したコンピュータ10においては、複写IO処理部113が、IO処理部111に代えてSSD20に対するデータのリードやライトを行なう。
このように、実施形態の一例としてのコンピュータ10の変形例によれば、第1実施形態と同様の作用効果を得られる。更に、コンピュータ30において、1以上のコンピュータ10から受信したログ情報により作成された履歴情報132に基づいて、SSD20の障害の予兆を検知する。これにより、SSD20の障害の予兆を精度良く検知することができる。
例えば、履歴情報132をSSD20のディスク型番毎に備え、監視部112aによるS.M.A.R.T.異常の検知に際して、独自の閾値に基づいてS.M.A.R.T.異常を検知することで、SSD20の機種特性に合った障害の予兆検知を行なうことができる。
また、独自の閾値として、同一機種のSSD20について、例えば、故障が“あり”となっているS.M.A.R.T.値と、故障が“なし”となっているS.M.A.R.T.値とで相違するパラメータを抽出し、これらのパラメータの変化を統計情報として採取することで独自の閾値を作成する。これにより、SSD20の使用状況や障害が実際に発生した状況に合った障害の予兆検知を行なうことができる。
(C)その他
そして、開示の技術は上述した実施形態及び変形例に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成及び各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
例えば、上述した実施形態及び各変形例においては、復元部116をコンピュータ30に備え、このコンピュータ30においてSSD20のデータの復元を行なっているが、これに限定されるものではない。
例えば、USBメモリ等の記録装置に、OSと復元部116としての機能を実現する制御プログラムと第2複写データテーブル131のコピーとを格納し、この記録装置をコンピュータ10に接続する。
コンピュータ10を、この記憶装置に格納したOSで起動させ、制御プログラムを実行させることで、コンピュータ10のCPU11を復元部116として機能させることができる。又、コンピュータ10には、復元したデータの保存先となる新たなSSDを接続しておく。
コンピュータ10において、復元部116は、リードオンリーモードとなっているSSD20から読み出したデータと、記憶装置に格納された第2複写データテーブル131のコピーとを用いて、データの復元を行ない、作成した復元データを新たなSSDに格納する。これにより、コンピュータ10においてもSSD20の復旧を行なうことができる。
また、上述した実施形態及び変形例においては、コンピュータ10にストレージ装置としてSSD20が備えられた例を示しているが、これに限定されるものではなく、SSD以外のストレージ装置に適用してもよい。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
(D)付記
以上の実施形態及び変形例に関し、更に以下の付記を開示する。
(付記1)
障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知する予兆検知部と、
前記予兆検知部が前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させる第1複写部とを備えることを特徴とする、処理装置。
(付記2)
前記ストレージ装置における障害の発生を検知する障害検知部と、
前記障害検知部が前記ストレージ装置における障害の発生を検知すると、前記第1複写データ記憶部に記憶された前記第1複写データの複写を、当該処理装置の外部に備えられた第2複写データ記憶部に第2複写データとして記憶させる第2複写部とを備えることを特徴とする、付記1記載の処理装置。
(付記3)
前記障害検知部が前記ストレージ装置における障害の発生を検知すると、前記ストレージ装置に記憶されたデータの読み出し要求に対して、前記第1複写データを読み出しデータとして応答することを特徴とする、付記2記載の処理装置。
(付記4)
前記障害検知部は、前記ストレージ装置から読み出したデータと前記第1複写データとが不一致である場合に、前記ストレージ装置における障害の発生を検知することを特徴とする、付記2又は3記載の処理装置。
(付記5)
前記ストレージ装置のデータと前記第2複写データとを組み合わせて、前記ストレージ装置のデータの復元イメージデータを作成する復元部を備えることを特徴とする、付記2〜4のいずれか1項に記載の処理装置。
(付記6)
前記ストレージ装置からのデータの読み出しに際して、前記ストレージ装置から読み出したデータと前記第1複写データとが不一致の場合に、前記第1複写データを読み出しデータとして応答することを特徴とする、付記1〜5のいずれか1項に記載の処理装置。
(付記7)
前記予兆検知部が、前記ストレージ装置の自己診断履歴に基づいて、前記ストレージ装置の障害の予兆を検知することを特徴とする、付記1〜6のいずれか1項に記載の処理装置。
(付記8)
障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知するステップと、
前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させるステップとを備えることを特徴とする、処理方法。
(付記9)
前記ストレージ装置における障害の発生を検知するステップと、
前記ストレージ装置における障害の発生を検知すると、前記第1複写データ記憶部に記憶された前記第1複写データの複写を、当該処理装置の外部に備えられた第2複写データ記憶部に第2複写データとして記憶させるステップとを備えることを特徴とする、付記8記載の処理方法。
(付記10)
前記ストレージ装置における障害の発生を検知すると、前記ストレージ装置に記憶されたデータの読み出し要求に対して、前記第1複写データを読み出しデータとして応答するステップを備えることを特徴とする、付記8記載の処理方法。
(付記11)
前記ストレージ装置から読み出したデータと前記第1複写データとが不一致である場合に、前記ストレージ装置における障害の発生を検知することを特徴とする、付記9又は10記載の処理方法。
(付記12)
前記ストレージ装置のデータと前記第2複写データとを組み合わせて、前記ストレージ装置のデータの復元イメージデータを作成するステップを備えることを特徴とする、付記9〜11のいずれか1項に記載の処理方法。
(付記13)
前記ストレージ装置からのデータの読み出しに際して、前記ストレージ装置から読み出したデータと前記第1複写データとが不一致の場合に、前記第1複写データを読み出しデータとして応答することを特徴とする、付記8〜12のいずれか1項に記載の処理方法。
(付記14)
前記ストレージ装置の自己診断履歴に基づいて、前記ストレージ装置の障害の予兆を検知することを特徴とする、付記8〜13のいずれか1項に記載の処理方法。
(付記15)
障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知し、
前記予兆検知部が前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させる
処理をコンピュータに実行させる処理プログラム。
(付記16)
前記ストレージ装置における障害の発生を検知し、
前記ストレージ装置における障害の発生を検知すると、前記第1複写データ記憶部に記憶された前記第1複写データの複写を、当該処理装置の外部に備えられた第2複写データ記憶部に第2複写データとして記憶させる
処理をコンピュータに実行させる、付記15記載の処理プログラム。
(付記17)
障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知し、
前記予兆検知部が前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させる
処理をコンピュータに実行させる処理プログラムを記録したコンピュータ読取可能な記録媒体。
(付記18)
前記処理プログラムが、
前記ストレージ装置における障害の発生を検知し、
前記ストレージ装置における障害の発生を検知すると、前記第1複写データ記憶部に記憶された前記第1複写データの複写を、当該処理装置の外部に備えられた第2複写データ記憶部に第2複写データとして記憶させる
処理をコンピュータに実行させる、付記17記載の処理プログラムを記録したコンピュータ読取可能な記録媒体。
(付記19)
ストレージ装置の障害の予兆が検知された場合に収集される、前記ストレージ装置への書き込みデータの複写を格納する複写データ格納部と、
前記ストレージ装置に記憶されているデータと、前記複写データ格納部に格納された前記書き込みデータの複写とに基づいて、前記ストレージ装置のデータの復元データを作成する、復元部とを備えることを特徴とする、管理装置。
(付記20)
前記ストレージ装置の障害の予兆を検知する予兆検知部を備えることを特徴とする、付記19記載の管理装置。
(付記21)
ストレージ装置の障害の予兆が検知された場合に収集される、前記ストレージ装置への書き込みデータの複写を複写データ格納部に格納し、
前記ストレージ装置に記憶されているデータと、前記複写データ格納部に格納された前記書き込みデータの複写とに基づいて、前記ストレージ装置のデータの復元データを作成する
処理をコンピュータに実行させる、処理プログラム。
(付記22)
前記ストレージ装置の障害の予兆を検知する
処理をコンピュータに実行させる、付記21記載の処理プログラム。
(付記23)
ストレージ装置の障害の予兆が検知された場合に収集される、前記ストレージ装置への書き込みデータの複写を複写データ格納部に格納し、
前記ストレージ装置に記憶されているデータと、前記複写データ格納部に格納された前記書き込みデータの複写とに基づいて、前記ストレージ装置のデータの復元データを作成する
処理をコンピュータに実行させる、処理プログラムを記録したコンピュータ読取可能な記録媒体。
(付記24)
前記処理プログラムが、
前記ストレージ装置の障害の予兆を検知する
処理をコンピュータに実行させる、付記23記載の処理プログラムを記録したコンピュータ読取可能な記録媒体。
1 コンピュータシステム
10,30 コンピュータ
11,39 CPU
12,32 RAM
13,33 ROM
14,34 IO制御部
15,35 通信部
16 キーボード
17 マウス
18 ディスプレイ
20 SSD
21 コントローラ
22 記憶領域
23 キャッシュ
31 ストレージ装置
50 ネットワーク
111 IO処理部
112,112a 監視部
113 複写IO処理部
114 複製部
115 情報収集部
116 復元部
121 第1複写データテーブル
131 第2複写データテーブル
132 履歴情報

Claims (20)

  1. 障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知する予兆検知部と、
    前記予兆検知部が前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させる第1複写部とをそなえることを特徴とする、処理装置。
  2. 前記ストレージ装置における障害の発生を検知する障害検知部と、
    前記障害検知部が前記ストレージ装置における障害の発生を検知すると、前記第1複写データ記憶部に記憶された前記第1複写データの複写を、当該処理装置の外部に備えられた第2複写データ記憶部に第2複写データとして記憶させる第2複写部とをそなえることを特徴とする、請求項1記載の処理装置。
  3. 前記障害検知部が前記ストレージ装置における障害の発生を検知すると、前記ストレージ装置に記憶されたデータの読み出し要求に対して、前記第1複写データを読み出しデータとして応答することを特徴とする、請求項2記載の処理装置。
  4. 前記障害検知部は、前記ストレージ装置から読み出したデータと前記第1複写データとが不一致である場合に、前記ストレージ装置における障害の発生を検知することを特徴とする、請求項2又は3記載の処理装置。
  5. 前記ストレージ装置のデータと前記第2複写データとを組み合わせて、前記ストレージ装置のデータの復元イメージデータを作成する復元部を備えることを特徴とする、請求項2〜4のいずれか1項に記載の処理装置。
  6. 前記ストレージ装置からのデータの読み出しに際して、前記ストレージ装置から読み出したデータと前記第1複写データとが不一致の場合に、前記第1複写データを読み出しデータとして応答することを特徴とする、請求項1〜5のいずれか1項に記載の処理装置。
  7. 前記予兆検知部が、前記ストレージ装置の自己診断履歴に基づいて、前記ストレージ装置の障害の予兆を検知することを特徴とする、請求項1〜6のいずれか1項に記載の処理装置。
  8. 障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知するステップと、
    前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させるステップとをそなえることを特徴とする、処理方法。
  9. 前記ストレージ装置における障害の発生を検知するステップと、
    前記ストレージ装置における障害の発生を検知すると、前記第1複写データ記憶部に記憶された前記第1複写データの複写を、当該処理装置の外部に備えられた第2複写データ記憶部に第2複写データとして記憶させるステップとをそなえることを特徴とする、請求項8記載の処理方法。
  10. 前記ストレージ装置における障害の発生を検知すると、前記ストレージ装置に記憶されたデータの読み出し要求に対して、前記第1複写データを読み出しデータとして応答するステップを備えることを特徴とする、請求項8記載の処理方法。
  11. 前記ストレージ装置から読み出したデータと前記第1複写データとが不一致である場合に、前記ストレージ装置における障害の発生を検知することを特徴とする、請求項9又は10記載の処理方法。
  12. 前記ストレージ装置のデータと前記第2複写データとを組み合わせて、前記ストレージ装置のデータの復元イメージデータを作成するステップを備えることを特徴とする、請求項9〜11のいずれか1項に記載の処理方法。
  13. 前記ストレージ装置からのデータの読み出しに際して、前記ストレージ装置から読み出したデータと前記第1複写データとが不一致の場合に、前記第1複写データを読み出しデータとして応答することを特徴とする、請求項8〜12のいずれか1項に記載の処理方法。
  14. 前記ストレージ装置の自己診断履歴に基づいて、前記ストレージ装置の障害の予兆を検知することを特徴とする、請求項8〜13のいずれか1項に記載の処理方法。
  15. 障害時に記憶領域へのライトアクセスを禁止し且つ該記憶領域へのリードアクセスを許可するリードオンリーモードで動作可能なストレージ装置の障害の予兆を検知し、
    前記予兆検知部が前記障害の予兆を検知すると、前記ストレージ装置へ書き込むデータの複写を第1複写データ記憶部に第1複写データとして記憶させる
    処理をコンピュータに実行させる処理プログラム。
  16. 前記ストレージ装置における障害の発生を検知し、
    前記ストレージ装置における障害の発生を検知すると、前記第1複写データ記憶部に記憶された前記第1複写データの複写を、当該処理装置の外部に備えられた第2複写データ記憶部に第2複写データとして記憶させる
    処理をコンピュータに実行させる、請求項15記載の処理プログラム。
  17. ストレージ装置の障害の予兆が検知された場合に収集される、前記ストレージ装置への書き込みデータの複写を格納する複写データ格納部と、
    前記ストレージ装置に記憶されているデータと、前記複写データ格納部に格納された前記書き込みデータの複写とに基づいて、前記ストレージ装置のデータの復元データを作成する、復元部とを備えることを特徴とする、管理装置。
  18. 前記ストレージ装置の障害の予兆を検知する予兆検知部を備えることを特徴とする、請求項17記載の管理装置。
  19. ストレージ装置の障害の予兆が検知された場合に収集される、前記ストレージ装置への書き込みデータの複写を複写データ格納部に格納し、
    前記ストレージ装置に記憶されているデータと、前記複写データ格納部に格納された前記書き込みデータの複写とに基づいて、前記ストレージ装置のデータの復元データを作成する
    処理をコンピュータに実行させる、処理プログラム。
  20. 前記ストレージ装置の障害の予兆を検知する
    処理をコンピュータに実行させる、請求項19記載の処理プログラム。
JP2012117600A 2012-05-23 2012-05-23 処理装置,処理方法,処理プログラム及び管理装置 Expired - Fee Related JP6078984B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012117600A JP6078984B2 (ja) 2012-05-23 2012-05-23 処理装置,処理方法,処理プログラム及び管理装置
US13/772,930 US9176813B2 (en) 2012-05-23 2013-02-21 Information processing apparatus, control method
EP13156740.6A EP2667305B1 (en) 2012-05-23 2013-02-26 Information processing apparatus, and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012117600A JP6078984B2 (ja) 2012-05-23 2012-05-23 処理装置,処理方法,処理プログラム及び管理装置

Publications (2)

Publication Number Publication Date
JP2013246479A true JP2013246479A (ja) 2013-12-09
JP6078984B2 JP6078984B2 (ja) 2017-02-15

Family

ID=47790022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012117600A Expired - Fee Related JP6078984B2 (ja) 2012-05-23 2012-05-23 処理装置,処理方法,処理プログラム及び管理装置

Country Status (3)

Country Link
US (1) US9176813B2 (ja)
EP (1) EP2667305B1 (ja)
JP (1) JP6078984B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015210664A (ja) * 2014-04-25 2015-11-24 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラムおよび記憶媒体
JP2021108424A (ja) * 2019-12-27 2021-07-29 富士フイルムビジネスイノベーション株式会社 Fax受信装置、fax受信プログラム、及びfax送受信システム
CN113741803A (zh) * 2020-05-27 2021-12-03 巴法络股份有限公司 存储装置
WO2024171443A1 (ja) * 2023-02-17 2024-08-22 日本電気株式会社 故障検知システム、故障検知方法および記録媒体
JP7539856B2 (ja) 2020-07-13 2024-08-26 三星電子株式会社 障害回復機能のあるストレージシステム及びその動作方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6489827B2 (ja) * 2014-12-26 2019-03-27 キヤノン株式会社 画像処理装置、画像処理装置の制御方法及びプログラム
US11188665B2 (en) * 2015-02-27 2021-11-30 Pure Storage, Inc. Using internal sensors to detect adverse interference and take defensive actions
JP6897398B2 (ja) * 2017-07-31 2021-06-30 セイコーエプソン株式会社 三次元形状測定装置、ロボットシステム、及び三次元形状測定方法
US10817370B2 (en) 2018-12-17 2020-10-27 Gsi Technology Inc. Self correcting memory device
CN113778915B (zh) * 2020-06-09 2023-10-10 慧荣科技股份有限公司 生产固态硬盘的方法及计算机可读取存储介质及装置
CN115237333A (zh) * 2021-04-23 2022-10-25 伊姆西Ip控股有限责任公司 用于管理盘的方法、电子设备和计算机程序产品
US12013755B2 (en) * 2022-04-07 2024-06-18 Kioxia Corporation Method and device for assessing operational effectiveness of solid-state drive (SSD) memory device

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129331A (ja) * 1993-11-05 1995-05-19 Fujitsu Ltd ディスクアレイ装置
JP2006268502A (ja) * 2005-03-24 2006-10-05 Toshiba Corp アレイコントローラ、メディアエラー修復方法及びプログラム
JP2006301714A (ja) * 2005-04-15 2006-11-02 Toshiba Corp アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
JP2009217603A (ja) * 2008-03-11 2009-09-24 Toshiba Corp メモリシステム
JP2010521014A (ja) * 2008-02-29 2010-06-17 株式会社東芝 情報処理装置及び不揮発性半導体メモリドライブ
JP2010160623A (ja) * 2009-01-07 2010-07-22 Nec Corp ディスクアレイコントローラ及びディスクアレイの冗長化方法
JP2010191499A (ja) * 2009-02-16 2010-09-02 Nec Corp ストレージシステム
JP2012079100A (ja) * 2010-10-01 2012-04-19 Canon Inc ディスク制御装置及びディスク制御方法、並びにプログラム
JP2012509521A (ja) * 2008-11-18 2012-04-19 エルエスアイ コーポレーション ソリッドステートドライブデータを回復するためのシステム及び方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2307212A1 (en) 1997-11-03 1999-05-14 Gateway, Inc. Automatic backup based on disk drive condition
JP2003150406A (ja) 2001-11-15 2003-05-23 Nec Infrontia Corp コンピュータシステムにおける障害予防システム
JP2005071068A (ja) 2003-08-25 2005-03-17 Renesas Technology Corp 記憶装置
JP4426262B2 (ja) 2003-11-26 2010-03-03 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の障害回避方法
US7870446B2 (en) 2008-02-29 2011-01-11 Kabushiki Kaisha Toshiba Information processing apparatus and nonvolatile semiconductor memory drive
KR20090102192A (ko) * 2008-03-25 2009-09-30 삼성전자주식회사 메모리 시스템 및 그것의 데이터 저장 방법
US8230255B2 (en) * 2009-12-15 2012-07-24 International Business Machines Corporation Blocking write acces to memory modules of a solid state drive
WO2011092425A1 (fr) 2010-02-01 2011-08-04 France Telecom Gestion du lieu de stockage de donnees dans un systeme de stockage distribue

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129331A (ja) * 1993-11-05 1995-05-19 Fujitsu Ltd ディスクアレイ装置
JP2006268502A (ja) * 2005-03-24 2006-10-05 Toshiba Corp アレイコントローラ、メディアエラー修復方法及びプログラム
JP2006301714A (ja) * 2005-04-15 2006-11-02 Toshiba Corp アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
JP2010521014A (ja) * 2008-02-29 2010-06-17 株式会社東芝 情報処理装置及び不揮発性半導体メモリドライブ
JP2009217603A (ja) * 2008-03-11 2009-09-24 Toshiba Corp メモリシステム
JP2012509521A (ja) * 2008-11-18 2012-04-19 エルエスアイ コーポレーション ソリッドステートドライブデータを回復するためのシステム及び方法
JP2010160623A (ja) * 2009-01-07 2010-07-22 Nec Corp ディスクアレイコントローラ及びディスクアレイの冗長化方法
JP2010191499A (ja) * 2009-02-16 2010-09-02 Nec Corp ストレージシステム
JP2012079100A (ja) * 2010-10-01 2012-04-19 Canon Inc ディスク制御装置及びディスク制御方法、並びにプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015210664A (ja) * 2014-04-25 2015-11-24 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラムおよび記憶媒体
JP2021108424A (ja) * 2019-12-27 2021-07-29 富士フイルムビジネスイノベーション株式会社 Fax受信装置、fax受信プログラム、及びfax送受信システム
JP7439511B2 (ja) 2019-12-27 2024-02-28 富士フイルムビジネスイノベーション株式会社 Fax受信装置、fax受信プログラム、及びfax送受信システム
CN113741803A (zh) * 2020-05-27 2021-12-03 巴法络股份有限公司 存储装置
JP2021189619A (ja) * 2020-05-27 2021-12-13 株式会社バッファロー 記憶装置
JP7457248B2 (ja) 2020-05-27 2024-03-28 株式会社バッファロー 記憶装置
JP7539856B2 (ja) 2020-07-13 2024-08-26 三星電子株式会社 障害回復機能のあるストレージシステム及びその動作方法
WO2024171443A1 (ja) * 2023-02-17 2024-08-22 日本電気株式会社 故障検知システム、故障検知方法および記録媒体

Also Published As

Publication number Publication date
EP2667305B1 (en) 2015-01-14
EP2667305A1 (en) 2013-11-27
US20130318392A1 (en) 2013-11-28
JP6078984B2 (ja) 2017-02-15
US9176813B2 (en) 2015-11-03

Similar Documents

Publication Publication Date Title
JP6078984B2 (ja) 処理装置,処理方法,処理プログラム及び管理装置
US10198196B2 (en) Monitoring health condition of a hard disk
US8589726B2 (en) System and method for uncovering data errors
JP5287980B2 (ja) 情報処理装置,情報処理装置の起動制御方法及び起動プログラム
JP2005322399A (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
CN103700387A (zh) 硬盘坏道监测修复装置及方法
US11055160B2 (en) Method of determining potential anomaly of memory device
JP2006139478A (ja) ディスクアレイシステム
JP2014142852A (ja) ストレージシステムおよび制御装置
US20150347224A1 (en) Storage control apparatus and method therefor
US10783042B2 (en) System and method of assessing and managing storage device degradation
EP2912555B1 (en) Hard drive backup
JP5440073B2 (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
CN108170375B (zh) 一种分布式存储系统中的超限保护方法和装置
JP2010257340A (ja) 情報処理装置、情報処理方法及びプログラム
US20140380090A1 (en) Storage control device and storage control method
JP2880701B2 (ja) ディスクサブシステム
JP2008084168A (ja) 情報処理装置及びデータ修復方法
US10592349B2 (en) Storage control device and storage apparatus
EP3547139B1 (en) System and method of assessing and managing storage device degradation
KR100955358B1 (ko) 라이트 누락 검출 장치, 라이트 누락 검출 방법 및 라이트누락 검출 프로그램을 기록한 기록 매체
JP6805838B2 (ja) ディスク管理システム、ディスク管理方法、および、ディスク管理プログラム
JP2004021318A (ja) ディスクアレイ装置、及びその制御方法
JP4780331B2 (ja) ディスクアレイシステム
JP2005275479A (ja) ディスクアレイ制御システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170102

R150 Certificate of patent or registration of utility model

Ref document number: 6078984

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees