TWI607455B - 記憶體資料檢測方法 - Google Patents
記憶體資料檢測方法 Download PDFInfo
- Publication number
- TWI607455B TWI607455B TW104140580A TW104140580A TWI607455B TW I607455 B TWI607455 B TW I607455B TW 104140580 A TW104140580 A TW 104140580A TW 104140580 A TW104140580 A TW 104140580A TW I607455 B TWI607455 B TW I607455B
- Authority
- TW
- Taiwan
- Prior art keywords
- processing chip
- test data
- external memory
- count value
- memory
- Prior art date
Links
Landscapes
- Debugging And Monitoring (AREA)
- For Increasing The Reliability Of Semiconductor Memories (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Description
本發明是有關於一種電子資料檢測方法,特別是指一種記憶體資料檢測方法。
常用於伺服器等電腦系統的儲存設備,如集束磁碟(Just a bunch of disks,JBOD)中,包含多個硬碟、一電連接伺服器及該等硬碟的擴充處理器(Expander),及一電連接該擴充處理器的非揮發隨機存取記憶體(Non-volatile random access memory,NVRAM),該擴充處理器支援串列附接式小型電腦介面(SAS),且讀取該非揮發隨機存取記憶體所儲存的開機組態、映像檔等實體層設定資料,來執行開機初始化,或使伺服器電腦透過其存取該等硬碟的資料等。
然而,當該非揮發隨機存取記憶體的資料線(Data line)存在例如開路、短路故障,造成資料寫入不全、或是儲存的資料損毀時,會導致該擴充處理器功能無法正常執行,且使伺服器
無法存取該等硬碟等。因此,提供一種記憶體資料傳輸檢測方法就成為一個重要的課題。
因此,本發明之目的,即在提供一種記憶體資料檢測方法。
於是,本發明記憶體資料檢測方法,由一處理晶片執行,該處理晶片電連接一外部記憶體,且該記憶體資料檢測方法包含一步驟(A)、一步驟(B)、一步驟(C)、一步驟(D)、一步驟(E)、一步驟(G),及一步驟(H)。
該步驟(A)是該處理晶片將一測試資料寫入該外部記憶體。
該步驟(B)是該處理晶片讀取該外部記憶體的測試資料,且檢測該測試資料是否正確。
該步驟(C)是若步驟(B)的檢測結果為不正確,則該處理晶片增加一重傳計數值。
該步驟(D)是該處理晶片判斷該重傳計數值是否大於一上限次數值。
該步驟(E)是若步驟(D)的判斷結果為否,則該處理晶片清除該外部記憶體的測試資料,並返回步驟(A)。
該步驟(G)是若步驟(B)的檢測結果為正確,則該處理晶片判斷該重傳計數值是否大於一下限次數值,且該下限次數值小於該上限次數值。
該步驟(H)是若步驟(G)的判斷結果為是,則該處理晶片記錄一錯誤訊息。
本發明之功效在於:藉由該處理晶片將該測試資料寫入該外部記憶體,並驗證該測試資料是否正確,並於該測試資料檢測為不正確時,累積該重傳計數值並重傳該測試資料,藉此實現對該外部記憶體的資料檢測。
1‧‧‧儲存設備
11‧‧‧處理晶片
111‧‧‧系統記憶體
112‧‧‧匯流排介面
113‧‧‧資料線
12‧‧‧外部記憶體
13‧‧‧警示單元
S1‧‧‧載入測試資料的步驟
S2‧‧‧清除重傳計數值的步驟
A‧‧‧寫入測試資料的步驟
B‧‧‧驗證測試資料步驟
C‧‧‧增加重傳計數值的步驟
D‧‧‧判斷重傳計數值的步驟
E‧‧‧清除測試資料的步驟
F‧‧‧警示步驟
G‧‧‧判斷重傳計數值的步驟
H‧‧‧記錄錯誤訊息的步驟
I‧‧‧清除測試資料的步驟
J‧‧‧等候預定時間的步驟
本發明之其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:圖1是一系統方塊圖,說明執行本發明記憶體資料檢測方法的一儲存設備;圖2是一流程圖,說明本發明記憶體資料檢測方法的一第一實施例;及圖3是一流程圖,說明本發明記憶體資料檢測方法的一第二實施例。
在本發明被詳細描述之前,應當注意在以下的說明內容中,類似的元件是以相同的編號來表示。
參閱圖1,本發明記憶體資料檢測方法,在如圖1所示的一儲存設備(Storage)1中實施,該儲存設備1例如應用於伺服器等電腦系統的集束磁碟(Just a bunch of disks,JBOD),且包括一處理晶片11、一外部記憶體12,及一警示單元13。
該處理晶片11包括一預存一測試資料的系統記憶體111,及一用以傳輸該測試資料的匯流排介面112,且該處理晶片11記錄一重傳計數值,當該測試資料傳輸失敗時,該處理晶片11會重新傳送,並在此時累加該重傳次數值,來計算重傳的次數。詳言之,該處理晶片11為擴展處理器(Expander),支援串列附接式小型電腦介面(SAS)的工業標準,並可與例如硬碟(圖未示出)電連接,以提供例如伺服器電腦存取硬碟的功能,及擴展伺服器電腦的儲存容量。另外,該匯流排介面112具有多條用以傳輸該測試資料的資料線(Data line)113,且每條資料線113可記錄1位元(bit)的資料。
該外部記憶體12電連接該處理晶片11的匯流排介面112,以經由該匯流排介面112的資料線113,來接收該測試資料。另外,該外部記憶體12用以儲存開機組態、映像檔等實體層設定資料,以供該處理晶片11讀取及寫入。該外部記憶體12可以例如非
揮發隨機存取記憶體(Non-volatile random access memory,NVRAM)、非揮發性靜態隨機存取記憶體(Non-volatile static random access memory,NVSRAM)、或快閃記憶體(Flash memory)來實施。
該警示單元13電連接該處理晶片11,能受該處理晶片11觸發而發出一警示,以通知使用者該外部記憶體12發生記憶功能異常,如資料線113故障等。該警示單元13例如為發光二極體。
參閱圖2,本發明記憶體資料檢測方法的一第一實施例,由該處理晶片11執行,以下詳細說明該第一實施例的各個步驟。
在步驟S1,該處理晶片11載入預存於該系統記憶體111的測試資料。
在步驟S2,該處理晶片11清除其所記錄的該重傳計數值。進一步說,該重傳計數值是自一下限次數值累積至一上限次數值,該下限次數值(例如0)小於該上限次數值(例如3),且在此步驟中,該處理晶片11清除該重傳計數值成該下限次數值。
在步驟A中,該處理晶片11將該測試資料寫入該外部記憶體12。詳言之,該處理晶片11經由該匯流排介面112的資料線113,將該測試資料的各個位元(bit)資料記錄於該外部記憶體12中。
在步驟B中,該處理晶片11讀取該外部記憶體12的測試資料,且檢測該測試資料是否正確。若檢測結果為正確,即進到步驟H;若檢測結果為不正確,進到步驟C。於此步驟中,該處理晶片11比較於步驟S1所載入的該測試資料,是否相同於該外部記憶體12的測試資料,來判斷該測試資料是否正確。更詳細地說,該處理晶片11比較記錄於該系統記憶體111的測試資料的所有位元,與該匯流排介面112的資料線113上記錄的所有位元是否相同,如果其中有任何一個位元不同,則判斷該外部記憶體12記錄的測試資料不正確。
在步驟C中,若步驟B的檢測結果為不正確,則該處理晶片11增加該重傳計數值。在本實施例中,該處理晶片11將該重傳計數值增加1。
在步驟D中,該處理晶片11判斷該重傳計數值是否大於該上限次數值,例如判斷是否大於3次;若判斷結果為是,進到步驟F,若判斷結果為否,進到步驟E。
在步驟E中,該處理晶片11清除該外部記憶體12的測試資料,並返回步驟A,也就是說,該處理晶片重複將該測試資料寫入該外部記憶體12,並再次判斷該測試資料是否正確。
在步驟F中,當該處理晶片11判斷該重傳計數值大於該上限次數值,即觸發該警示單元13發出該警示,並接著進到步驟
H。該警示單元13例如顯示警示燈號,以通知使用者該外部記憶體12發生異常。
在步驟G中,該處理晶片11判斷該重傳次數值是否大於該下限次數值,例如判斷是否大於0次;若判斷結果為是,則進到步驟H,若判斷結果為否,直接進到步驟I。
在步驟H中,當該處理晶片11在步驟F判斷該重傳計數值大於該上限次數值,以及在步驟G中判斷該重傳計數值大於該下限次數值時,該處理晶片11記錄一錯誤訊息於一工作日誌(log)中,並接著進到步驟I。換言之,只要該處理晶片11增加該重傳計數值,或是該重傳計數值大於該上限次數值,該處理晶片11即記錄該錯誤訊息告知使用者。其中,該錯誤訊息即記錄資料線有錯誤的訊息,供使用者得知該外部記憶體12異常或有損毀的情形。
在步驟I中,該處理晶片11清除該外部記憶體12的測試資料,以供下次測試時能再次寫入。
在步驟J中,該處理晶片11等候一預定時間,並返回步驟S2。亦即,該處理晶片11間隔該預定時間,例如10分鐘之後,清除該重傳計數值,並重複執行所述資料檢測方法,以定期檢測該外部記憶體12的資料是否能正常寫入。
因此,本發明記憶體資料檢測方法,藉由每間隔該預定時間,寫入該測試資料至該外部記憶體12,以定期執行該外部記
憶體12的傳輸檢測,來確保該外部記憶體12能正常運作。並且,於該測試資料檢測為不正確,亦即該測試資料寫入失敗時,即重傳該測試資料,並且累積該重傳計數值。
此外,在本實施例中,該處理晶片11還根據該重傳計數值執行相對應的動作,以於執行傳輸檢測過程中有錯誤發生時,達到不同程度的提示作用:一、當該處理晶片11判斷該重傳計數值小於該下限次數值,即0次時,表示此時未有錯誤發生,該處理晶片11清除該外部記憶體12的測試資料,等候再次寫入測試;二、當該處理晶片11判斷該重傳計數值大於該下限次數值時,該處理晶片11會記錄該錯誤訊息於該工作日誌,因為實際而言,該等資料線113可能因為受到電氣訊號干擾、或是該處理晶片11發生資料寫入異常等程式異常的因素,導致該處理晶片11在寫入和驗證該外部記憶體12的測試資料時,發生重傳1次驗證失敗,但重傳2次驗證成功的情形,故只要增加該重傳計數值,該處理晶片11便記錄該錯誤訊息,以提醒使用者該等資料線113傳輸檢測時曾經有錯誤發生;三、當該處理晶片11判斷該重傳次數值大於該上限次數值,即3次時,表示該等資料線113發生異常或毀損的機率很高,因此該處理晶片11除了記錄該錯誤訊息外,更觸發該警示單元13發出該警示通知使用者,如此一來,便能根據不同的重傳次數值,分類不同層級的錯誤,並給予使用者不同程度的提示。
參閱圖3,本發明記憶體資料檢測方法的一第二實施例,與該第一實施例的差異在於:該步驟D能於步驟A及步驟B之間實施。也就是說,相較於該第一實施例,該處理晶片11在將該測試資料寫入該外部記憶體12之後,先判斷該重傳計數值是否大於該上限次數值,若判斷為是,即進到步驟F觸發該警示單元13發出該警示;若判斷為否,進到步驟C,將該重傳計數值增加1,並進到步驟E,清除該外部記憶體12的測試資料,且返回步驟A,即重傳該測試資料至該外部記憶體12,再次判斷該測試資料是否正確。如此,可增加本發明於實施上的彈性。
綜上所述,本發明記憶體資料檢測方法,藉由該處理晶片11定期檢測該外部記憶體12是否能正常執行資料寫入,並於發生異常時,除了重傳該測試資料至該外部記憶體12之外,該處理晶片11還根據該重傳計數值,執行相對應的動作,確保該外部記憶體12的正常運作,如此,該處理晶片11也能正確地讀取該外部記憶體12所儲存的開機組態、映像檔等實體層設定資料,來執行開機初始化,以確保例如伺服器電腦經由該處理晶片11能夠正確、穩定地存取硬碟,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之實施例而已,當不能以此限定本發明實施之範圍,凡是依本發明申請專利範圍及專利說明
書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
S1‧‧‧載入測試資料的步驟
S2‧‧‧清除重傳計數值的步驟
A‧‧‧寫入測試資料的步驟
B‧‧‧驗證測試資料步驟
C‧‧‧增加重傳計數值的步驟
D‧‧‧判斷重傳計數值的步驟
E‧‧‧清除測試資料的步驟
F‧‧‧警示步驟
G‧‧‧記錄錯誤訊息的步驟
H‧‧‧判斷重傳計數值的步驟
I‧‧‧清除測試資料的步驟
J‧‧‧等候預定時間的步驟
Claims (4)
- 一種記憶體資料檢測方法,由一處理晶片執行,該處理晶片記錄一重傳計數值並電連接一外部記憶體及一警示單元,且該記憶體資料檢測方法包含:(S1)該處理晶片載入該測試資料;(S2)該處理晶片清除該重傳計數值;(A)該處理晶片將一測試資料寫入該外部記憶體;(B)該處理晶片讀取該外部記憶體的測試資料,來檢測寫入該外部記憶體的該測試資料是否正確;(C)若步驟(B)的檢測結果為不正確,則該處理晶片增加該重傳計數值;(D)該處理晶片判斷該重傳計數值是否大於一上限次數值;(E)若步驟(D)的判斷結果為否,則該處理晶片清除該外部記憶體的測試資料,並返回步驟(A);(F)若步驟(D)的判斷結果為是,則該處理晶片觸發該警示單元以發出一警示,並進到步驟(H);(G)若步驟(B)的檢測結果為正確,則該處理晶片判斷該重傳計數值是否大於一下限次數值,且該下限次數值小於該上限次數值;(H)若步驟(G)的判斷結果為是,則該處理晶片記錄一錯誤訊息;(I)若步驟(G)判斷的結果為否,則該處理晶片清除該外部記憶體的測試資料;及 (J)該處理晶片等候一預定時間,並返回步驟(S2)。
- 如請求項1所述的記憶體資料檢測方法,在步驟(B)中,該處理晶片比較於步驟(S1)所載入的該測試資料,是否相同於該外部記憶體的測試資料,來判斷該測試資料是否正確。
- 如請求項1所述的記憶體資料檢測方法,其中,該重傳計數值是自該下限次數值累積至該上限次數值,且在該步驟(S2)中,該處理晶片清除該重傳計數值成該下限次數值。
- 一種記憶體資料檢測方法,由一處理晶片執行,該處理晶片電連接一外部記憶體,且該處理晶片記錄一重傳計數值,該記憶體資料檢測方法包含:(S2)該處理晶片清除該重傳計數值;(A)該處理晶片將一測試資料寫入該外部記憶體;(D)該處理晶片判斷該重傳計數值是否大於一上限次數值;(B)若步驟(D)判斷為否,則該處理晶片讀取該外部記憶體的測試資料,來檢測寫入該外部記憶體的該測試資料是否正確;(C)若步驟(B)的檢測結果為不正確,則該處理晶片增加該重傳計數值;及(E)該處理晶片清除該外部記憶體的測試資料,並返回步驟(A)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104140580A TWI607455B (zh) | 2015-12-03 | 2015-12-03 | 記憶體資料檢測方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104140580A TWI607455B (zh) | 2015-12-03 | 2015-12-03 | 記憶體資料檢測方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201721642A TW201721642A (zh) | 2017-06-16 |
TWI607455B true TWI607455B (zh) | 2017-12-01 |
Family
ID=59687195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104140580A TWI607455B (zh) | 2015-12-03 | 2015-12-03 | 記憶體資料檢測方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI607455B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW341367U (en) * | 1997-10-28 | 1998-09-21 | Utek Semiconductor Corp | An auto repairing memory |
TWI294126B (en) * | 2004-06-30 | 2008-03-01 | Hon Hai Prec Ind Co Ltd | System and method for testing memory |
US20100131810A1 (en) * | 2007-03-13 | 2010-05-27 | Thayer Larry J | System and method for implementing a stride value for memory testing |
TWI332665B (en) * | 2007-05-09 | 2010-11-01 | Faraday Tech Corp | Circuit and method for built-in self repair of a multi-port memory |
TWI440036B (zh) * | 2010-01-20 | 2014-06-01 | King Yuan Electronics Co Ltd | 可擴充樣本記憶體之記憶體測試設備 |
-
2015
- 2015-12-03 TW TW104140580A patent/TWI607455B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW341367U (en) * | 1997-10-28 | 1998-09-21 | Utek Semiconductor Corp | An auto repairing memory |
TWI294126B (en) * | 2004-06-30 | 2008-03-01 | Hon Hai Prec Ind Co Ltd | System and method for testing memory |
US20100131810A1 (en) * | 2007-03-13 | 2010-05-27 | Thayer Larry J | System and method for implementing a stride value for memory testing |
TWI332665B (en) * | 2007-05-09 | 2010-11-01 | Faraday Tech Corp | Circuit and method for built-in self repair of a multi-port memory |
TWI440036B (zh) * | 2010-01-20 | 2014-06-01 | King Yuan Electronics Co Ltd | 可擴充樣本記憶體之記憶體測試設備 |
Also Published As
Publication number | Publication date |
---|---|
TW201721642A (zh) | 2017-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105468484B (zh) | 用于在存储系统中确定故障位置的方法和装置 | |
US10198196B2 (en) | Monitoring health condition of a hard disk | |
CN106803429B (zh) | 具有用于存储器的故障监测的电子设备及相关联的方法 | |
US11017875B2 (en) | Tracking address ranges for computer memory errors | |
JP2015529927A (ja) | 訂正不能エラーを含むアドレス範囲の通知 | |
US10338999B2 (en) | Confirming memory marks indicating an error in computer memory | |
CN111048139A (zh) | 一种存储介质检测方法、装置、设备及可读存储介质 | |
US20170293514A1 (en) | Handling repaired memory array elements in a memory of a computer system | |
CN113568777B (zh) | 一种故障处理方法、装置、网络芯片、设备及存储介质 | |
CN108170375B (zh) | 一种分布式存储系统中的超限保护方法和装置 | |
US9230687B2 (en) | Implementing ECC redundancy using reconfigurable logic blocks | |
CN107526677A (zh) | 一种软件错误现场定位及处理的方法及装置 | |
US9563500B2 (en) | Storage integrity validator | |
TWI607455B (zh) | 記憶體資料檢測方法 | |
JP6212947B2 (ja) | 情報処理装置、制御装置及び制御プログラム | |
KR20130136341A (ko) | 반도체 장치 및 그 동작 방법 | |
US11537468B1 (en) | Recording memory errors for use after restarts | |
CN106940666B (zh) | 内存数据检测方法 | |
US8151176B2 (en) | CPU instruction RAM parity error procedure | |
US10140186B2 (en) | Memory error recovery | |
US10055272B2 (en) | Storage system and method for controlling same | |
US10754566B2 (en) | Data storage device and data storage method | |
CN107544860A (zh) | 一种磁盘数据检测方法及装置 | |
CN102549550B (zh) | 一种数据访问方法及系统 | |
JP2014093012A (ja) | ディスクアレイコントローラ、方法、及び、プログラム |