TWI537733B - 儲存裝置之運作方法 - Google Patents

儲存裝置之運作方法 Download PDF

Info

Publication number
TWI537733B
TWI537733B TW101114897A TW101114897A TWI537733B TW I537733 B TWI537733 B TW I537733B TW 101114897 A TW101114897 A TW 101114897A TW 101114897 A TW101114897 A TW 101114897A TW I537733 B TWI537733 B TW I537733B
Authority
TW
Taiwan
Prior art keywords
storage device
reply operation
offline
power
storage
Prior art date
Application number
TW101114897A
Other languages
English (en)
Other versions
TW201337564A (zh
Inventor
陳炫廷
陳揆驩
蔡明宏
Original Assignee
群暉科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 群暉科技股份有限公司 filed Critical 群暉科技股份有限公司
Publication of TW201337564A publication Critical patent/TW201337564A/zh
Application granted granted Critical
Publication of TWI537733B publication Critical patent/TWI537733B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Description

儲存裝置之運作方法
本發明相關於一種儲存裝置之運作方法,尤指一種對硬碟進行回復運作之方法。
硬碟是電腦系統中相當重要的元件,用來儲存一個或多個作業系統、應用程式、系統資料或使用者資料等。硬碟的正常運作對電腦系統的效能影響極大,然而不可避免地會發生硬碟驅動(hard disc drive,HDD)錯誤的情形。
當發生硬碟錯誤時,電腦系統往往需要進行繁重的回復運作(recovery operation)。若回復運作失敗,先前技術會直接捨棄硬碟。硬碟錯誤的原因多半是由硬碟惡化所造成,例如病毒入侵、人工設定錯誤、安裝新軟體的錯誤或不相容,或是電性/機械故障。然而,當硬碟狀態尚未準備完全(例如硬碟或晶片反應速度太慢)或硬碟品質較差時,可能會造成暫時性的硬碟錯誤。此時,電腦系統若是重新開機,硬碟可能可以正常運作。在先前技術中,若針對暫時性硬碟錯誤來進行回復運作但無法成功修復,此時會捨棄可能尚能運作的硬碟。
本發明相關於一種操作一儲存裝置之方法,其包含提供該儲存裝置運作所需之一裝置電源;在偵測到一裝置錯誤時,該儲存裝置執行一回復運作;當該回復運作失敗時,重設該裝置電源;以及在重設該裝置電源後,該儲存裝置再次執行該回復運作。
第1圖為本發明中一種儲存裝置運作方法之狀態圖。儲存裝置可在下列四種主要狀態下運作:
狀態一:儲存裝置正常運作;
狀態二:儲存裝置執行一回復運作;
狀態三:儲存裝置執行一相容性驗證運作;以及
狀態四:捨棄儲存裝置。
第2圖為本發明中一種儲存裝置運作方法之流程圖,其包含下列步驟:
步驟210:提供一儲存裝置運作所需之一裝置電源,執行步驟210。
步驟220:判斷是否發生一裝置錯誤;若是,執行步驟230;若否,執行步驟210。
步驟230:儲存裝置執行一回復運作,執行步驟240。
步驟240:判斷回復運作是否成功;若是,執行步驟210;若否,執行步驟250。
步驟250:判斷儲存裝置執行回復運作之次數是否超過一最大重試次數;若是,執行步驟300;若否,執行步驟260。
步驟260:判斷儲存裝置之一寫入快取記憶體(write cache)是否為關閉;若是,執行步驟280;若否,執行步驟270。
步驟270:清除寫入快取記憶體並判斷快取資料是否能被儲存至儲存裝置內;若是,執行步驟280;若否,執行步驟300。
步驟280:重設裝置電源,執行步驟290。
步驟290:忽略一裝置離線中斷訊息(device un-plugged interrupt)並在重設裝置電源之後提供一預定時間,執行步驟230。
步驟300:回報裝置修復失敗。
在步驟210中,當提供裝置電源時,儲存裝置可在狀態一下運作。
在步驟220中,當儲存裝置在狀態一下運作時,本發明會判斷是否發生裝置錯誤。若未偵測到裝置錯誤,儲存裝置會持續在狀態一下運作;若偵測到裝置錯誤,儲存裝置會切換至狀態二以在步驟230中執行回復運作,如第1圖中箭頭A1所示。
在步驟240中,本發明會判斷回復運作是否成功。若在步驟230中能成功修復儲存裝置,儲存裝置會切換回狀態一,如第1圖中箭頭A2所示;若在步驟230中無法成功修復儲存裝置,儲存裝置會切換至狀態三以執行相容性驗證運作,如第1圖中箭頭A3所示。
在本發明實施例中,相容性驗證運作可包含步驟250~290。
在步驟250中,本發明會判斷儲存裝置執行回復運作之次數是否超過一最大重試次數。當儲存裝置發生永久性毀損或故障時,回復運作永遠會失敗。因此,本發明僅會在儲存裝置執行回復運作之次數未超過最大重試次數時執行步驟260。若儲存裝置執行回復運作之次數超過最大重試次數,本發明會執行步驟300以回報裝置修復失敗,此時儲存裝置會切換至狀態四,如第1圖中箭頭A4所示。
在步驟250中,本發明會判斷儲存裝置之寫入快取記憶體是否為關閉。若儲存裝置之寫入快取記憶體為開啟,本發明會執行步驟270以清除寫入快取記憶體並判斷快取資料是否能被儲存至儲存裝置內。若開啟之寫入快取記憶體無法成功地被清除,本發明會執行步驟300以回報裝置修復失敗,此時儲存裝置會切換至狀態,如第1圖中箭頭A4所示。
在步驟280中,若儲存裝置之寫入快取記憶體為關閉或開啟之寫入快取記憶體能成功地被清除,本發明會重設裝置電源。
裝置離線中斷訊息係用來通知系統儲存裝置已被移除。在步驟290中,本發明會忽略裝置離線中斷訊息,並在重設裝置電源之後提供一預定時間,再執行步驟230。因此,儲存裝置可在穩定後再切換至狀態二,如第1圖中箭頭A5所示。
在本發明一實施例中,儲存裝置可為一電腦硬碟。在本發明其它實施例中,儲存裝置可為一網路附加儲存(network-attached storage,NAS)之一延伸元件。本發明可應用在任何電源控制之儲存裝置。
當回復運作失敗時,本發明可重設裝置電源一次或多次。若儲存裝置執行回復運作之次數已超過最大重試次數或儲存裝置之寫入快取記憶體為開啟且無法成功地被清除,本發明會在相容性驗證運作中捨棄儲存裝置。因此,當因為硬碟狀態尚未準備完全(例如硬碟或晶片反應速度太慢)或硬碟品質較差而造成暫時性的硬碟錯誤時,本發明可避免因為回復運作失敗而捨棄可能尚能運作的硬碟。
以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。
210~300...步驟
第1圖為本發明中一種儲存裝置運作方法之狀態圖。
第2圖為本發明中一種儲存裝置運作方法之流程圖。
210~300...步驟

Claims (7)

  1. 一種操作一儲存裝置之方法,其包含:提供該儲存裝置運作所需之一裝置電源;在偵測到一裝置錯誤時,該儲存裝置執行一回復運作(recovery operation);在偵測到該裝置錯誤後,判斷該儲存裝置執行該回復運作之次數是否超過一最大重試次數;當該回復運作失敗時,重設該裝置電源;產生相關於重設該裝置電源之一裝置離線中斷訊息(device un-plugged interrupt)並接著忽略該裝置離線中斷訊息;在忽略該裝置離線中斷訊息後,當該儲存裝置執行該回復運作之次數不超過該最大重試次數時,該儲存裝置在重設該裝置電源後再次執行該回復運作;以及在忽略該裝置離線中斷訊息後,當該儲存裝置執行該回復運作之次數超過該最大重試次數時,回報一裝置修復失敗。
  2. 如請求項1所述之方法,其另包含:當該回復運作失敗且該儲存裝置之一寫入快取記憶體(write cache)為關閉時,重設該裝置電源。
  3. 如請求項1所述之方法,其另包含: 清除該儲存裝置中開啟的一寫入快取記憶體並判斷快取資料是否能被儲存至該儲存裝置內;以及當該回復運作失敗且該快取資料能被儲存至該儲存裝置內時,重設該裝置電源。
  4. 如請求項1所述之方法,其另包含:在重設該裝置電源後經過一預定時間後,該儲存裝置再次執行該回復運作。
  5. 如請求項1所述之方法,其中該儲存裝置係為一硬碟。
  6. 如請求項1所述之方法,其中該儲存裝置係為一網路附加儲存(network-attached storage,NAS)之一延伸元件。
  7. 一種操作一儲存裝置之方法,其包含:提供該儲存裝置運作所需之一裝置電源;在偵測到一裝置錯誤時,該儲存裝置執行一回復運作;當該回復運作失敗時,重設該裝置電源;產生相關於重設該裝置電源之一裝置離線中斷訊息並接著忽略該裝置離線中斷訊息;在忽略該裝置離線中斷訊息後,該儲存裝置再次執行該回復運作;清除該儲存裝置中開啟的一寫入快取記憶體並判斷快取資料是 否能被儲存至該儲存裝置內;以及當該回復運作失敗且該快取資料能被儲存至該儲存裝置內時,重設該裝置電源。
TW101114897A 2012-03-08 2012-04-26 儲存裝置之運作方法 TWI537733B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US13/414,739 US8909983B2 (en) 2012-03-08 2012-03-08 Method of operating a storage device

Publications (2)

Publication Number Publication Date
TW201337564A TW201337564A (zh) 2013-09-16
TWI537733B true TWI537733B (zh) 2016-06-11

Family

ID=45928692

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101114897A TWI537733B (zh) 2012-03-08 2012-04-26 儲存裝置之運作方法

Country Status (3)

Country Link
US (1) US8909983B2 (zh)
EP (1) EP2637100A1 (zh)
TW (1) TWI537733B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9354971B2 (en) * 2014-04-23 2016-05-31 Facebook, Inc. Systems and methods for data storage remediation

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5898861A (en) * 1996-10-18 1999-04-27 Compaq Computer Corporation Transparent keyboard hot plug
JP2002023967A (ja) * 2000-07-05 2002-01-25 Hitachi Electronics Eng Co Ltd 記憶媒体ライブラリアレイ装置におけるドライブ障害復旧方法
US6934805B2 (en) * 2003-05-19 2005-08-23 International Business Machines Corporation Method and apparatus for managing computer storage devices for improved operational availability
US20050210318A1 (en) * 2004-03-22 2005-09-22 Dell Products L.P. System and method for drive recovery following a drive failure
US7536506B2 (en) * 2004-06-21 2009-05-19 Dot Hill Systems Corporation RAID controller using capacitor energy source to flush volatile cache data to non-volatile memory during main power outage
US7480808B2 (en) * 2004-07-16 2009-01-20 Ati Technologies Ulc Method and apparatus for managing power consumption relating to a differential serial communication link
US7428665B2 (en) * 2004-11-12 2008-09-23 Lsi Corporation Methods and structure for detection and handling of catastrophic SCSI errors
US7523359B2 (en) * 2005-03-31 2009-04-21 International Business Machines Corporation Apparatus, system, and method for facilitating monitoring and responding to error events
US7231480B2 (en) * 2005-04-06 2007-06-12 Qlogic, Corporation Method and system for receiver detection in PCI-Express devices
US8108723B2 (en) * 2008-03-31 2012-01-31 Broadcom Corporation Triggered restart mechanism for failure recovery in power over ethernet
US20120030510A1 (en) * 2010-07-27 2012-02-02 Samsung Electronics Co., Ltd. Method to recover data sector damaged by abrupt power loss in hard disk drives
US8458510B2 (en) * 2010-08-12 2013-06-04 International Business Machines Corporation LPAR creation and repair for automated error recovery
US9015455B2 (en) * 2011-07-07 2015-04-21 Intel Corporation Processsor integral technologies for BIOS flash attack protection and notification

Also Published As

Publication number Publication date
EP2637100A1 (en) 2013-09-11
US20130238927A1 (en) 2013-09-12
US8909983B2 (en) 2014-12-09
TW201337564A (zh) 2013-09-16

Similar Documents

Publication Publication Date Title
US9997209B2 (en) Power-failure protection method and solid state drive
KR102198609B1 (ko) 모바일 장치 및 그것의 동작 방법
US8589726B2 (en) System and method for uncovering data errors
JP5669823B2 (ja) チェンジトラッキングを用いたシステムリカバリ方法
TW201715395A (zh) 基板管理控制器的回復方法及基板管理控制器
US9817600B2 (en) Configuration information backup in memory systems
JP5910444B2 (ja) 情報処理装置、起動プログラム、および起動方法
US11914455B2 (en) Addressing storage device performance
JP2014120179A (ja) 停電障害状況におけるイベントトレース情報の復旧
US10324782B1 (en) Hiccup management in a storage array
US20160062838A1 (en) Information processing apparatus, method of controlling the same, and storage medium
TWI537733B (zh) 儲存裝置之運作方法
CN104133742A (zh) 一种数据保护的方法及装置
TW202344994A (zh) 從中斷模式恢復
JP2015215675A (ja) 制御装置、制御方法、及び制御プログラム
US9852293B2 (en) Antivirus scan during a data scrub operation
JP2010536112A (ja) 中断された書込みの回復のためのデータ記憶方法、機器およびシステム
TW201512830A (zh) 資料儲存系統及其控制方法
JP5913078B2 (ja) ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム
US9275697B2 (en) Utilizing destructive features as RAM code for a storage device
JP2017138781A (ja) ディスクアレイコントローラ、ストレージシステム、方法、及び、プログラム
JP2015099430A (ja) 記憶制御装置及び記憶制御システム
CN113868000A (zh) 一种链路故障修复方法、系统及相关组件
TW202405655A (zh) 儲存系統與其硬碟恢復方法
JP2010009345A (ja) ディスクアレイ装置およびソフトエラー修復方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees