TWI483258B - 使用壞區塊增加率的記憶體異常警示方法以及相關的儲存裝置預警系統 - Google Patents
使用壞區塊增加率的記憶體異常警示方法以及相關的儲存裝置預警系統 Download PDFInfo
- Publication number
- TWI483258B TWI483258B TW099105646A TW99105646A TWI483258B TW I483258 B TWI483258 B TW I483258B TW 099105646 A TW099105646 A TW 099105646A TW 99105646 A TW99105646 A TW 99105646A TW I483258 B TWI483258 B TW I483258B
- Authority
- TW
- Taiwan
- Prior art keywords
- storage device
- bad
- unit
- management
- bad block
- Prior art date
Links
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
- Debugging And Monitoring (AREA)
Description
本發明有關一種記憶體異常警示方法以及相關的儲存裝置預警系統,尤指一種使用記憶體中的壞區塊增加率來偵測記憶體發生異常並中斷儲存裝置的使用的警示方法以及相關的儲存裝置預警系統。
除了傳統的硬式磁碟(Hard disk drive,HDD)外,有越來越多的儲存裝置以非揮發性記憶體作為主要的儲存媒介。這些儲存裝置如隨身碟、各式記憶卡、固態硬碟(solid state disk,SSD)等產品,其主要的儲存單元由許多的快閃記憶體所組成。隨著半導體製程的進步,快閃記憶體顆粒的容量越來越大,但發生錯誤的機會也越來越高。當使用者使用這些儲存裝置經過一段時間後,往往會因為記憶體顆粒本身先天體質不佳、裝置電性不佳或是主機供電不穩定,使得儲存裝置中單顆快閃記憶體顆粒的壞區塊(bad block)數量異常增高。由於這些儲存裝置為提高存取效能表現,往往使用多個管理單位同步存取的方式(例如固態硬碟的多通道設計),因此當其中部分快閃記憶體顆粒的壞區塊異常增加時,主機或是儲存裝置本身會中斷儲存裝置本身目前的處理程序,並進入防寫保護(write protection),以達到保護儲存裝置的目的。
然而一般快閃記憶體的儲存裝置在偵測壞區塊是否異常增加的方式上,通常是偵測儲存裝置的壞區塊總數是否超過一個設定的閥值,若超過該設定閥值,則鎖住該儲存裝置並發出警示。然而在一般使用上,這種儲存裝置的壞區塊的發生常常會在短時間內以相當快的速率增加,習知的警示機制由於是偵測壞區塊的總數,無法判斷壞區塊的增加速率,因此往往會在其中某管理單位發生異常錯誤時,即使發出警示也來不及反應。
本發明提供一種使用壞區塊增加率的記憶體異常警示方法,於一儲存裝置中具有複數個管理單位,該方法包含有下列步驟:於一第一時間擷取該複數個管理單位中各管理單位的一第一壞區塊數,於一第二時間擷取各管理單位的一第二壞區塊數;依據各管理單位的該第一壞區塊數以及該第二壞區塊數,計算一判斷數值;以及當該判斷數值超過一閥值時,進行一警示動作。
本發明另提供一種儲存裝置預警系統,其包含有一儲存裝置以及一主機。該儲存裝置包含有一記憶單元以及一控制單元。該記憶單元具有複數個管理單位,該控制單元用來提供該複數個管理單位的壞區塊數的資訊。該主機包含一監控單元,該儲存裝置連接於該主機,該監控單元用來依據該控制單元提供的各管理單位於一第一時間的一第一壞區塊數以及於一第二時間的一第二壞區塊數計算一判斷數值。
本發明另提供一種儲存裝置,包含有一記憶單元、一控制單元以及一監控單元。該記憶單元具有複數個管理單位,該控制單元用來提供該複數個管理單位的壞區塊數的資訊,該監控單元用來依據該控制單元提供的各管理單位於一第一時間的一第一壞區塊數以及於一第二時間的一第二壞區塊數計算複數組判斷數值。
請參考第1圖,第1圖為本發明所揭露的儲存裝置預警系統1其中一實施例的示意圖。在預警系統1中,儲存裝置10包含有一控制單元12以及一記憶單元11,其中記憶單元11為儲存裝置10的記錄媒介,在記憶單元11中具有複數個管理單位13,透過複數個管理單位13同時存取的特性可提升儲存裝置10的使用效能。控制單元12可為一微處理器(Micro Controller Unit,MCU),用以控制、讀寫、檢查儲存裝置10中各管理單位13的狀態,並讀取各管理單位13的壞區塊(bad block)資訊,在固態硬碟的實施例中,控制單元12將各管理單位13的壞區塊資訊記錄在硬碟內,例如:存放於硬碟的SMART欄位中,在其他形式的儲存裝置中,則可透過裝置指令直接自各管理單位13擷取其壞區塊資訊。儲存裝置10連接於主機20,並由主機20的監控單元21自控制單元12獲得各管理單位13的壞區塊資訊並分析之。監控單元21可為一具有數據分析功能之軟體型式,而儲存裝置10可為隨身碟、各式記憶卡、固態硬碟(solid state disk,SSD)等外接式儲存產品。此外,在第6圖的實施
例中,儲存裝置10’亦可為直接建立有監控單元14的儲存裝置,在不需要另外與主機20連接而獨立操作的情形下,利用本發明的方法進行監控預警。
請參考第2圖,第2圖為針對儲存裝置10的記憶體異常現象進行偵測及預警保護的方法100流程圖。其步驟如下:
步驟102:監控單元21自控制單元12於多個管理單位13中擷取各管理單位13在不同時間的壞區塊數的資訊。由於本發明以管理單位13的壞區塊「增加速率」作為分析的方向,因此在不同的單位時間中,分別取得各管理單位13在該單位時間時的壞區塊數,以供下一階段進行分析。例如:於第一時間中,各管理單位13分別具有一第一壞區塊數,於第二時間中各管理單位13分別具有一第二壞區塊數,依此類推。
步驟104:監控單元21分析於各不同時間的各壞區塊數,以計算複數組判斷數值,並判斷其中任一判斷數值是否超過一對應的預設閥值。其中在本發明中,將其中某(些)管理單位13的壞區塊數量的連續快速增加定義為一種異常狀況,至少可使用三種判斷的方式。
方式一:計算所有管理單位13的壞區塊數的平均增加率V,其中每個管理單位在兩個單位時間(可為連續兩個單位時間或不連續
的兩個單位時間)的壞區塊數的差異為該管理單位13的壞區塊增加率,在一個具有N個管理單位13的記憶單元11中,,其中N2
為各管理單位13於一第二時間具有的第二壞區塊數的總和,N1
為各管理單位13於一第一時間具有的第一壞區塊數的總和。
方式二:計算某一單位時間中,各管理單位13的各壞區塊數之間的標準差σc
。當標準差σc
大於某一設定閥值時,表示其中某(些)管理單位13的壞區塊數遠大於其他剩下的管理單位13,因此可合理判斷在儲存裝置10中的某(些)管理單位有壞區塊異常增加的現象。
方式三:計算各管理單位13的壞區塊增加率的標準差σI
。其中在一個具有N個管理單位13的記憶單元11中,每個管理單位13在兩個單位時間(可為連續兩個單位時間或不連續的兩個單位時間)的壞區塊數增加率Mi
為(Di2
-Di1
),其中Di2
為其中第i個管理單位13於一第二時間擷取到的第二壞區塊數,Di1
為第i個管理單位13於一第一時間擷取到的第一壞區塊數。而σI
則為各Mi
之間的標準差。因此當σI
大於某一設定閥值時,表示其中某(些)管理單位13在某一時間區間內的壞區塊增加數量遠大於其他剩下的管理單位13在同一時間區間內的壞區塊增加數量,因此可合理判斷在儲存裝置10中的某(些)管理單位有壞區塊異常增加的現象。
以上三種方式為本發明運用壞區塊「增加速率」的概念來判斷儲存裝置10是否有壞區塊異常增加的其中幾種方式的實施例。在實際使用上,可依需求僅使用其中一種方式來進行判斷,亦可結合其中任兩種或三種方式全部使用的方式來進行壞區塊異常增加的判斷,以應用於各種可能的情況。而步驟104的判斷法則亦不侷限於上述有揭露的方法,凡利用分析兩個單位時間之間,各管理單位13之間的壞區塊數(或增加數)來進行判斷的方式應屬於本發明的範圍。
步驟106:當步驟104所使用的判斷方式的判斷數值超過一設定的閥值時,則判斷儲存裝置10中的某(些)管理單位有壞區塊異常增加的現象,因此由監控單元21或儲存裝置10的控制單元12本身進行一示警動作。例如監控單元21可產生一影像或聲音型式的警示訊號,亦可傳送命令給控制單元12(或由控制單元12自行進行)以中斷並鎖定儲存裝置的10運作。
接下來利用第3圖~第5圖的實施例來說明本發明的記憶體異常的偵測方法。其中利用一具有4個通道(管理單位)的固態硬碟來作說明。
於第3圖的實施例中,設定異常狀況為標準差σc
超過閥值5,或標準差σI
超過閥值2,因此在第3圖中,在第3個單位時間中,通道四的壞區塊數量(12個)遠大於其他通道,使得在該單位時間
中的標準差σc
計算得出5.69(超過閥值5),另一方面,計算第2個單位時間以及第3個單位時間內各通道的壞區塊增加率(分別為0、0、0、5),得出標準差σI
為2.5(亦超過閥值2),因此在第3個單位時間時,即發生記憶體異常。
於第4圖的實施例中,設定異常狀況為所有通道的壞區塊數的平均增加率V超過閥值2,因此在第1個單位時間以及第2個單位時間內各通道的壞區塊增加數(2、2、3、3)得出V為2.5(超過閥值2);在第2個單位時間以及第3個單位時間內各通道的壞區塊增加數(3、4、5、4)得出V為4.0(亦超過閥值2),因此,在第個單位時間以及第3個單位時間時,皆發生記憶體異常。
於第5圖的實施例中,設定異常狀況為標準差σI
超過閥值2,因此在第0個單位時間以及第1個單位時間之間各通道的壞區塊增加率(分別為0、0、4、0),得出標準差σI
為2.0(到達閥值2),因此在第1個單位時間時,發生記憶體異常。
本發明針對一個具有多個管理單位的儲存裝置,例如具有多通道的固態硬碟、多層面(plane)的記憶卡、隨身碟等儲存裝置,利用主機的監控單元監測各管理單位的壞區塊增加速率,並使用標準差的方式統計並評估儲存裝置中是否有某一管理單位或是整個裝置的壞區塊異常增加,以達到針對壞區塊快速增加有效示警及處理的目的。
以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。
1‧‧‧預警系統
10、10’‧‧‧儲存裝置
11‧‧‧記憶單元
12‧‧‧控制單元
13‧‧‧管理單位
14、21‧‧‧監控單元
20‧‧‧主機
100~106‧‧‧步驟
第1圖為本發明所揭露的儲存裝置預警系統其中一實施例之示意圖。
第2圖為本發明所揭露的記憶體異常警示方法的流程示意圖。
第3圖~第5圖為使用記憶體異常警示方法的實施例的示意圖。
第6圖為本發明儲存裝置另一實施例之示意圖。
100~106‧‧‧步驟
Claims (17)
- 一種使用壞區塊增加率的記憶體異常警示方法,於一儲存裝置中具有複數個管理單位,該方法包含有下列步驟:於一第一時間擷取該複數個管理單位中各管理單位的一第一壞區塊數,於一第二時間擷取各管理單位的一第二壞區塊數;依據各管理單位的該第一壞區塊數以及該第二壞區塊數,計算複數組判斷數值,其中計算該複數組判斷數值係透過計算該複數個管理單位的壞區塊數平均增加率V、各管理單位的第一壞區塊數或第二壞區塊數之間的標準差σc 或計算各管理單位的壞區塊增加率Mi 之間的標準差σI 所得到;以及當該複數組判斷數值之任一判斷數值超過對應的一設定閥值時,進行一警示動作。
- 如請求項1所述的方法,其中計算該複數個管理單位之該壞區塊數平均增加率V:V=(N2 -N1 )/N,N2 為該第二壞區塊數的總和,N1 為該第一壞區塊數的總和,N為該複數個管理單位的總數。
- 如請求項1所述的方法,其中計算各管理單位之該壞區塊增加率Mi 之間的標準差σI : 其中Mi =(Di2 -Di1 ),Di2 為其中第i個管理單位於該第二時間擷取到的該第二壞區塊數,Di1 為其中第i個管理單位於該第一時間擷取到的該第一壞區塊數,i為1...N的正整數,N為該複數個管理單位的總數。
- 如請求項1所述的方法,其中進行該警示動作係產生一警示訊號。
- 如請求項1所述的方法,其中進行該警示動作係中斷並鎖定該儲存裝置的運作。
- 一種儲存裝置預警系統,其包含有:一儲存裝置,包含有:一記憶單元,具有複數個管理單位;以及一控制單元,用來提供該複數個管理單位的壞區塊數的資訊;以及一主機,連接於該儲存裝置,該主機包含一監控單元,用來依據該控制單元提供的各管理單位於一第一時間的一第一壞區塊數以及於一第二時間的一第二壞區塊數計算複數組判斷數值,其中計算該複數組判斷數值係透過計算該複數個管理單位的壞區塊數平均增加率V、各管理單位的第一壞區塊數或第二壞區塊數之間的標準差σc 或計算各管理單位的壞區塊增加率Mi 之間的標準差σI 所得到。
- 如請求項6所述的預警系統,其中計算該複數個管理單位之該壞區塊數平均增加率V:V=(N2 -N1 )/N,N2 為該第二壞區塊數的總和,N1 為該第一壞區塊數的總和,N為該複數個管理單位的總數。
- 如請求項6所述的預警系統,其中計算各管理單位之該壞區塊增加率Mi 之間的標準差σI :其中Mi =(Di2 -Di1 ),Di2 為其中第i個管理單位於該第二時間擷取到的該第二壞區塊數,Di1 為其中第i個管理單位於該第一時間擷取到的該第一壞區塊數,i為1...N的正整數,N為該複數個管理單位的總數。
- 如請求項6所述的預警系統,其中該監控單元另用來於該複數組判斷數值之任一判斷數值超過對應的一設定閥值時,產生一警示訊號。
- 如請求項6所述的預警系統,其中該監控單元另用來於該複數組判斷數值之任一判斷數值超過對應的一設定閥值時,傳送命令給該控制單元以中斷並鎖定該儲存裝置的運作。
- 如請求項6所述的預警系統,其中該控制單元用來於該複數組判斷數值之任一判斷數值超過對應的一設定閥值時,中斷並鎖 定該儲存裝置的運作。
- 一種儲存裝置,包含有:一記憶單元,具有複數個管理單位;一控制單元,用來提供該複數個管理單位的壞區塊數的資訊;以及一監控單元,用來依據該控制單元提供的各管理單位於一第一時間的一第一壞區塊數以及於一第二時間的一第二壞區塊數計算複數組判斷數值,其中計算該複數組判斷數值係透過計算該複數個管理單位的壞區塊數平均增加率V、各管理單位的第一壞區塊數或第二壞區塊數之間的標準差σc 或計算各管理單位的壞區塊增加率Mi 之間的標準差σI所得到。
- 如請求項12所述的儲存裝置,其中計算該複數個管理單位的壞區塊數平均增加率V:V=(N2 -N1 )/N,N2 為該第二壞區塊數的總和,N1 為該第一壞區塊數的總和,N為該複數個管理單位的總數。
- 如請求項12所述的儲存裝置,其中計算各管理單位之該壞區塊增加率Mi 之間的標準差σI :其中Mi =(Di2 -Di1 ),Di2 為其中第i個管理單位於該第二時間擷取到的該第二壞區塊數,Di1 為其中第i個管理單位於該 第一時間擷取到的該第一壞區塊數,i為1...N的正整數,N為該複數個管理單位的總數。
- 如請求項12所述的儲存裝置,其中該監控單元另用來於該複數組判斷數值之任一判斷數值超過對應的一設定閥值時,產生一警示訊號。
- 如請求項12所述的儲存裝置,其中該監控單元另用來於該複數組判斷數值之任一判斷數值超過對應的一設定閥值時,傳送命令給該控制單元以中斷並鎖定該儲存裝置的運作。
- 如請求項12所述的儲存裝置,其中該控制單元用來於該複數組判斷數值之任一判斷數值超過對應的一設定閥值時,中斷並鎖定該儲存裝置的運作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW099105646A TWI483258B (zh) | 2010-02-26 | 2010-02-26 | 使用壞區塊增加率的記憶體異常警示方法以及相關的儲存裝置預警系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW099105646A TWI483258B (zh) | 2010-02-26 | 2010-02-26 | 使用壞區塊增加率的記憶體異常警示方法以及相關的儲存裝置預警系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201129981A TW201129981A (en) | 2011-09-01 |
TWI483258B true TWI483258B (zh) | 2015-05-01 |
Family
ID=50180086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW099105646A TWI483258B (zh) | 2010-02-26 | 2010-02-26 | 使用壞區塊增加率的記憶體異常警示方法以及相關的儲存裝置預警系統 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI483258B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10547293B1 (en) | 2019-02-26 | 2020-01-28 | Realtek Semiconductor Corp. | Method and apparatus for improving accuracy of quadrature clock |
TWI759370B (zh) * | 2017-01-23 | 2022-04-01 | 韓商愛思開海力士有限公司 | 記憶體裝置、記憶體系統及其操作方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070067559A1 (en) * | 2005-09-22 | 2007-03-22 | Akira Fujibayashi | Storage control apparatus, data management system and data management method |
US20070271413A1 (en) * | 2005-09-22 | 2007-11-22 | Akira Fujibayashi | Storage control apparatus, data management system and data management method |
US20080082736A1 (en) * | 2004-03-11 | 2008-04-03 | Chow David Q | Managing bad blocks in various flash memory cells for electronic data flash card |
US20080288712A1 (en) * | 2007-04-25 | 2008-11-20 | Cornwell Michael J | Accessing metadata with an external host |
US20090083476A1 (en) * | 2007-09-21 | 2009-03-26 | Phison Electronics Corp. | Solid state disk storage system with parallel accesssing architecture and solid state disck controller |
US20090300274A1 (en) * | 2008-05-27 | 2009-12-03 | Initio Corporation | Ssd with distributed processors |
-
2010
- 2010-02-26 TW TW099105646A patent/TWI483258B/zh active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080082736A1 (en) * | 2004-03-11 | 2008-04-03 | Chow David Q | Managing bad blocks in various flash memory cells for electronic data flash card |
US20070067559A1 (en) * | 2005-09-22 | 2007-03-22 | Akira Fujibayashi | Storage control apparatus, data management system and data management method |
US20070271413A1 (en) * | 2005-09-22 | 2007-11-22 | Akira Fujibayashi | Storage control apparatus, data management system and data management method |
US20090276565A1 (en) * | 2005-09-22 | 2009-11-05 | Akira Fujibayashi | Storage control apparatus, data management system and data management method |
US20080288712A1 (en) * | 2007-04-25 | 2008-11-20 | Cornwell Michael J | Accessing metadata with an external host |
US20090083476A1 (en) * | 2007-09-21 | 2009-03-26 | Phison Electronics Corp. | Solid state disk storage system with parallel accesssing architecture and solid state disck controller |
US20090300274A1 (en) * | 2008-05-27 | 2009-12-03 | Initio Corporation | Ssd with distributed processors |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI759370B (zh) * | 2017-01-23 | 2022-04-01 | 韓商愛思開海力士有限公司 | 記憶體裝置、記憶體系統及其操作方法 |
US10547293B1 (en) | 2019-02-26 | 2020-01-28 | Realtek Semiconductor Corp. | Method and apparatus for improving accuracy of quadrature clock |
Also Published As
Publication number | Publication date |
---|---|
TW201129981A (en) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10678315B2 (en) | Thermal monitoring of memory resources | |
WO2017012392A1 (zh) | 一种磁盘检测的方法和装置 | |
US7917810B2 (en) | Method for detecting problematic disk drives and disk channels in a RAID memory system based on command processing latency | |
TW201928684A (zh) | 具有機器學習機制的儲存系統及其操作方法 | |
EP2472408B1 (en) | Bus monitor for improving system safety of system on chip (soc) and realizing method thereof | |
US20180284857A1 (en) | Thermal throttling for memory devices | |
US20140201576A1 (en) | System and Method for Improving Solid State Storage System Reliability | |
US9436831B2 (en) | Secure erase in a memory device | |
EP3321807B1 (en) | Disk detection method and device | |
US20160180900A1 (en) | Implementing dram row hammer avoidance | |
CN106980562A (zh) | 一种硬盘监控方法及装置 | |
US11754519B2 (en) | System and method to create an air flow map and detect air recirculation in an information handling system | |
US10430278B2 (en) | RAID system including nonvolatile memory and operating method of the same | |
TW201514706A (zh) | 可偵測硬碟狀態的電子裝置 | |
TWI483258B (zh) | 使用壞區塊增加率的記憶體異常警示方法以及相關的儲存裝置預警系統 | |
CN114218037A (zh) | 一种硬盘管理方法、装置、设备及机器可读存储介质 | |
CN105630416B (zh) | 一种云存储系统中的踢盘方法及装置 | |
US20200379525A1 (en) | Computer system with thermal performance mechanism and method of operation thereof | |
US9274966B1 (en) | Dynamically throttling host commands to disk drives | |
JP2015084227A (ja) | ストレージシステム、格納装置、及びストレージシステムの非信号分析方法 | |
CN107870843A (zh) | Nas服务器性能监控的方法及装置 | |
CN108899059A (zh) | 一种固态硬盘的检测方法和设备 | |
TWM532085U (zh) | 硬碟控制晶片及含其的硬碟 | |
US8661288B2 (en) | Diagnosis system for removable media drive | |
KR101847556B1 (ko) | 복수의 레이드 컨트롤러를 구비하는 sas 데이터 컨버팅 시스템 |