TWI607455B - 記憶體資料檢測方法 - Google Patents

記憶體資料檢測方法 Download PDF

Info

Publication number
TWI607455B
TWI607455B TW104140580A TW104140580A TWI607455B TW I607455 B TWI607455 B TW I607455B TW 104140580 A TW104140580 A TW 104140580A TW 104140580 A TW104140580 A TW 104140580A TW I607455 B TWI607455 B TW I607455B
Authority
TW
Taiwan
Prior art keywords
processing chip
test data
external memory
count value
memory
Prior art date
Application number
TW104140580A
Other languages
English (en)
Other versions
TW201721642A (zh
Inventor
林義嵐
陳光兆
Original Assignee
神雲科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神雲科技股份有限公司 filed Critical 神雲科技股份有限公司
Priority to TW104140580A priority Critical patent/TWI607455B/zh
Publication of TW201721642A publication Critical patent/TW201721642A/zh
Application granted granted Critical
Publication of TWI607455B publication Critical patent/TWI607455B/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Description

記憶體資料檢測方法
本發明是有關於一種電子資料檢測方法,特別是指一種記憶體資料檢測方法。
常用於伺服器等電腦系統的儲存設備,如集束磁碟(Just a bunch of disks,JBOD)中,包含多個硬碟、一電連接伺服器及該等硬碟的擴充處理器(Expander),及一電連接該擴充處理器的非揮發隨機存取記憶體(Non-volatile random access memory,NVRAM),該擴充處理器支援串列附接式小型電腦介面(SAS),且讀取該非揮發隨機存取記憶體所儲存的開機組態、映像檔等實體層設定資料,來執行開機初始化,或使伺服器電腦透過其存取該等硬碟的資料等。
然而,當該非揮發隨機存取記憶體的資料線(Data line)存在例如開路、短路故障,造成資料寫入不全、或是儲存的資料損毀時,會導致該擴充處理器功能無法正常執行,且使伺服器 無法存取該等硬碟等。因此,提供一種記憶體資料傳輸檢測方法就成為一個重要的課題。
因此,本發明之目的,即在提供一種記憶體資料檢測方法。
於是,本發明記憶體資料檢測方法,由一處理晶片執行,該處理晶片電連接一外部記憶體,且該記憶體資料檢測方法包含一步驟(A)、一步驟(B)、一步驟(C)、一步驟(D)、一步驟(E)、一步驟(G),及一步驟(H)。
該步驟(A)是該處理晶片將一測試資料寫入該外部記憶體。
該步驟(B)是該處理晶片讀取該外部記憶體的測試資料,且檢測該測試資料是否正確。
該步驟(C)是若步驟(B)的檢測結果為不正確,則該處理晶片增加一重傳計數值。
該步驟(D)是該處理晶片判斷該重傳計數值是否大於一上限次數值。
該步驟(E)是若步驟(D)的判斷結果為否,則該處理晶片清除該外部記憶體的測試資料,並返回步驟(A)。
該步驟(G)是若步驟(B)的檢測結果為正確,則該處理晶片判斷該重傳計數值是否大於一下限次數值,且該下限次數值小於該上限次數值。
該步驟(H)是若步驟(G)的判斷結果為是,則該處理晶片記錄一錯誤訊息。
本發明之功效在於:藉由該處理晶片將該測試資料寫入該外部記憶體,並驗證該測試資料是否正確,並於該測試資料檢測為不正確時,累積該重傳計數值並重傳該測試資料,藉此實現對該外部記憶體的資料檢測。
1‧‧‧儲存設備
11‧‧‧處理晶片
111‧‧‧系統記憶體
112‧‧‧匯流排介面
113‧‧‧資料線
12‧‧‧外部記憶體
13‧‧‧警示單元
S1‧‧‧載入測試資料的步驟
S2‧‧‧清除重傳計數值的步驟
A‧‧‧寫入測試資料的步驟
B‧‧‧驗證測試資料步驟
C‧‧‧增加重傳計數值的步驟
D‧‧‧判斷重傳計數值的步驟
E‧‧‧清除測試資料的步驟
F‧‧‧警示步驟
G‧‧‧判斷重傳計數值的步驟
H‧‧‧記錄錯誤訊息的步驟
I‧‧‧清除測試資料的步驟
J‧‧‧等候預定時間的步驟
本發明之其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:圖1是一系統方塊圖,說明執行本發明記憶體資料檢測方法的一儲存設備;圖2是一流程圖,說明本發明記憶體資料檢測方法的一第一實施例;及圖3是一流程圖,說明本發明記憶體資料檢測方法的一第二實施例。
在本發明被詳細描述之前,應當注意在以下的說明內容中,類似的元件是以相同的編號來表示。
參閱圖1,本發明記憶體資料檢測方法,在如圖1所示的一儲存設備(Storage)1中實施,該儲存設備1例如應用於伺服器等電腦系統的集束磁碟(Just a bunch of disks,JBOD),且包括一處理晶片11、一外部記憶體12,及一警示單元13。
該處理晶片11包括一預存一測試資料的系統記憶體111,及一用以傳輸該測試資料的匯流排介面112,且該處理晶片11記錄一重傳計數值,當該測試資料傳輸失敗時,該處理晶片11會重新傳送,並在此時累加該重傳次數值,來計算重傳的次數。詳言之,該處理晶片11為擴展處理器(Expander),支援串列附接式小型電腦介面(SAS)的工業標準,並可與例如硬碟(圖未示出)電連接,以提供例如伺服器電腦存取硬碟的功能,及擴展伺服器電腦的儲存容量。另外,該匯流排介面112具有多條用以傳輸該測試資料的資料線(Data line)113,且每條資料線113可記錄1位元(bit)的資料。
該外部記憶體12電連接該處理晶片11的匯流排介面112,以經由該匯流排介面112的資料線113,來接收該測試資料。另外,該外部記憶體12用以儲存開機組態、映像檔等實體層設定資料,以供該處理晶片11讀取及寫入。該外部記憶體12可以例如非 揮發隨機存取記憶體(Non-volatile random access memory,NVRAM)、非揮發性靜態隨機存取記憶體(Non-volatile static random access memory,NVSRAM)、或快閃記憶體(Flash memory)來實施。
該警示單元13電連接該處理晶片11,能受該處理晶片11觸發而發出一警示,以通知使用者該外部記憶體12發生記憶功能異常,如資料線113故障等。該警示單元13例如為發光二極體。
參閱圖2,本發明記憶體資料檢測方法的一第一實施例,由該處理晶片11執行,以下詳細說明該第一實施例的各個步驟。
在步驟S1,該處理晶片11載入預存於該系統記憶體111的測試資料。
在步驟S2,該處理晶片11清除其所記錄的該重傳計數值。進一步說,該重傳計數值是自一下限次數值累積至一上限次數值,該下限次數值(例如0)小於該上限次數值(例如3),且在此步驟中,該處理晶片11清除該重傳計數值成該下限次數值。
在步驟A中,該處理晶片11將該測試資料寫入該外部記憶體12。詳言之,該處理晶片11經由該匯流排介面112的資料線113,將該測試資料的各個位元(bit)資料記錄於該外部記憶體12中。
在步驟B中,該處理晶片11讀取該外部記憶體12的測試資料,且檢測該測試資料是否正確。若檢測結果為正確,即進到步驟H;若檢測結果為不正確,進到步驟C。於此步驟中,該處理晶片11比較於步驟S1所載入的該測試資料,是否相同於該外部記憶體12的測試資料,來判斷該測試資料是否正確。更詳細地說,該處理晶片11比較記錄於該系統記憶體111的測試資料的所有位元,與該匯流排介面112的資料線113上記錄的所有位元是否相同,如果其中有任何一個位元不同,則判斷該外部記憶體12記錄的測試資料不正確。
在步驟C中,若步驟B的檢測結果為不正確,則該處理晶片11增加該重傳計數值。在本實施例中,該處理晶片11將該重傳計數值增加1。
在步驟D中,該處理晶片11判斷該重傳計數值是否大於該上限次數值,例如判斷是否大於3次;若判斷結果為是,進到步驟F,若判斷結果為否,進到步驟E。
在步驟E中,該處理晶片11清除該外部記憶體12的測試資料,並返回步驟A,也就是說,該處理晶片重複將該測試資料寫入該外部記憶體12,並再次判斷該測試資料是否正確。
在步驟F中,當該處理晶片11判斷該重傳計數值大於該上限次數值,即觸發該警示單元13發出該警示,並接著進到步驟 H。該警示單元13例如顯示警示燈號,以通知使用者該外部記憶體12發生異常。
在步驟G中,該處理晶片11判斷該重傳次數值是否大於該下限次數值,例如判斷是否大於0次;若判斷結果為是,則進到步驟H,若判斷結果為否,直接進到步驟I。
在步驟H中,當該處理晶片11在步驟F判斷該重傳計數值大於該上限次數值,以及在步驟G中判斷該重傳計數值大於該下限次數值時,該處理晶片11記錄一錯誤訊息於一工作日誌(log)中,並接著進到步驟I。換言之,只要該處理晶片11增加該重傳計數值,或是該重傳計數值大於該上限次數值,該處理晶片11即記錄該錯誤訊息告知使用者。其中,該錯誤訊息即記錄資料線有錯誤的訊息,供使用者得知該外部記憶體12異常或有損毀的情形。
在步驟I中,該處理晶片11清除該外部記憶體12的測試資料,以供下次測試時能再次寫入。
在步驟J中,該處理晶片11等候一預定時間,並返回步驟S2。亦即,該處理晶片11間隔該預定時間,例如10分鐘之後,清除該重傳計數值,並重複執行所述資料檢測方法,以定期檢測該外部記憶體12的資料是否能正常寫入。
因此,本發明記憶體資料檢測方法,藉由每間隔該預定時間,寫入該測試資料至該外部記憶體12,以定期執行該外部記 憶體12的傳輸檢測,來確保該外部記憶體12能正常運作。並且,於該測試資料檢測為不正確,亦即該測試資料寫入失敗時,即重傳該測試資料,並且累積該重傳計數值。
此外,在本實施例中,該處理晶片11還根據該重傳計數值執行相對應的動作,以於執行傳輸檢測過程中有錯誤發生時,達到不同程度的提示作用:一、當該處理晶片11判斷該重傳計數值小於該下限次數值,即0次時,表示此時未有錯誤發生,該處理晶片11清除該外部記憶體12的測試資料,等候再次寫入測試;二、當該處理晶片11判斷該重傳計數值大於該下限次數值時,該處理晶片11會記錄該錯誤訊息於該工作日誌,因為實際而言,該等資料線113可能因為受到電氣訊號干擾、或是該處理晶片11發生資料寫入異常等程式異常的因素,導致該處理晶片11在寫入和驗證該外部記憶體12的測試資料時,發生重傳1次驗證失敗,但重傳2次驗證成功的情形,故只要增加該重傳計數值,該處理晶片11便記錄該錯誤訊息,以提醒使用者該等資料線113傳輸檢測時曾經有錯誤發生;三、當該處理晶片11判斷該重傳次數值大於該上限次數值,即3次時,表示該等資料線113發生異常或毀損的機率很高,因此該處理晶片11除了記錄該錯誤訊息外,更觸發該警示單元13發出該警示通知使用者,如此一來,便能根據不同的重傳次數值,分類不同層級的錯誤,並給予使用者不同程度的提示。
參閱圖3,本發明記憶體資料檢測方法的一第二實施例,與該第一實施例的差異在於:該步驟D能於步驟A及步驟B之間實施。也就是說,相較於該第一實施例,該處理晶片11在將該測試資料寫入該外部記憶體12之後,先判斷該重傳計數值是否大於該上限次數值,若判斷為是,即進到步驟F觸發該警示單元13發出該警示;若判斷為否,進到步驟C,將該重傳計數值增加1,並進到步驟E,清除該外部記憶體12的測試資料,且返回步驟A,即重傳該測試資料至該外部記憶體12,再次判斷該測試資料是否正確。如此,可增加本發明於實施上的彈性。
綜上所述,本發明記憶體資料檢測方法,藉由該處理晶片11定期檢測該外部記憶體12是否能正常執行資料寫入,並於發生異常時,除了重傳該測試資料至該外部記憶體12之外,該處理晶片11還根據該重傳計數值,執行相對應的動作,確保該外部記憶體12的正常運作,如此,該處理晶片11也能正確地讀取該外部記憶體12所儲存的開機組態、映像檔等實體層設定資料,來執行開機初始化,以確保例如伺服器電腦經由該處理晶片11能夠正確、穩定地存取硬碟,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之實施例而已,當不能以此限定本發明實施之範圍,凡是依本發明申請專利範圍及專利說明 書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
S1‧‧‧載入測試資料的步驟
S2‧‧‧清除重傳計數值的步驟
A‧‧‧寫入測試資料的步驟
B‧‧‧驗證測試資料步驟
C‧‧‧增加重傳計數值的步驟
D‧‧‧判斷重傳計數值的步驟
E‧‧‧清除測試資料的步驟
F‧‧‧警示步驟
G‧‧‧記錄錯誤訊息的步驟
H‧‧‧判斷重傳計數值的步驟
I‧‧‧清除測試資料的步驟
J‧‧‧等候預定時間的步驟

Claims (4)

  1. 一種記憶體資料檢測方法,由一處理晶片執行,該處理晶片記錄一重傳計數值並電連接一外部記憶體及一警示單元,且該記憶體資料檢測方法包含:(S1)該處理晶片載入該測試資料;(S2)該處理晶片清除該重傳計數值;(A)該處理晶片將一測試資料寫入該外部記憶體;(B)該處理晶片讀取該外部記憶體的測試資料,來檢測寫入該外部記憶體的該測試資料是否正確;(C)若步驟(B)的檢測結果為不正確,則該處理晶片增加該重傳計數值;(D)該處理晶片判斷該重傳計數值是否大於一上限次數值;(E)若步驟(D)的判斷結果為否,則該處理晶片清除該外部記憶體的測試資料,並返回步驟(A);(F)若步驟(D)的判斷結果為是,則該處理晶片觸發該警示單元以發出一警示,並進到步驟(H);(G)若步驟(B)的檢測結果為正確,則該處理晶片判斷該重傳計數值是否大於一下限次數值,且該下限次數值小於該上限次數值;(H)若步驟(G)的判斷結果為是,則該處理晶片記錄一錯誤訊息;(I)若步驟(G)判斷的結果為否,則該處理晶片清除該外部記憶體的測試資料;及 (J)該處理晶片等候一預定時間,並返回步驟(S2)。
  2. 如請求項1所述的記憶體資料檢測方法,在步驟(B)中,該處理晶片比較於步驟(S1)所載入的該測試資料,是否相同於該外部記憶體的測試資料,來判斷該測試資料是否正確。
  3. 如請求項1所述的記憶體資料檢測方法,其中,該重傳計數值是自該下限次數值累積至該上限次數值,且在該步驟(S2)中,該處理晶片清除該重傳計數值成該下限次數值。
  4. 一種記憶體資料檢測方法,由一處理晶片執行,該處理晶片電連接一外部記憶體,且該處理晶片記錄一重傳計數值,該記憶體資料檢測方法包含:(S2)該處理晶片清除該重傳計數值;(A)該處理晶片將一測試資料寫入該外部記憶體;(D)該處理晶片判斷該重傳計數值是否大於一上限次數值;(B)若步驟(D)判斷為否,則該處理晶片讀取該外部記憶體的測試資料,來檢測寫入該外部記憶體的該測試資料是否正確;(C)若步驟(B)的檢測結果為不正確,則該處理晶片增加該重傳計數值;及(E)該處理晶片清除該外部記憶體的測試資料,並返回步驟(A)。
TW104140580A 2015-12-03 2015-12-03 記憶體資料檢測方法 TWI607455B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW104140580A TWI607455B (zh) 2015-12-03 2015-12-03 記憶體資料檢測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104140580A TWI607455B (zh) 2015-12-03 2015-12-03 記憶體資料檢測方法

Publications (2)

Publication Number Publication Date
TW201721642A TW201721642A (zh) 2017-06-16
TWI607455B true TWI607455B (zh) 2017-12-01

Family

ID=59687195

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104140580A TWI607455B (zh) 2015-12-03 2015-12-03 記憶體資料檢測方法

Country Status (1)

Country Link
TW (1) TWI607455B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW341367U (en) * 1997-10-28 1998-09-21 Utek Semiconductor Corp An auto repairing memory
TWI294126B (en) * 2004-06-30 2008-03-01 Hon Hai Prec Ind Co Ltd System and method for testing memory
US20100131810A1 (en) * 2007-03-13 2010-05-27 Thayer Larry J System and method for implementing a stride value for memory testing
TWI332665B (en) * 2007-05-09 2010-11-01 Faraday Tech Corp Circuit and method for built-in self repair of a multi-port memory
TWI440036B (zh) * 2010-01-20 2014-06-01 King Yuan Electronics Co Ltd 可擴充樣本記憶體之記憶體測試設備

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW341367U (en) * 1997-10-28 1998-09-21 Utek Semiconductor Corp An auto repairing memory
TWI294126B (en) * 2004-06-30 2008-03-01 Hon Hai Prec Ind Co Ltd System and method for testing memory
US20100131810A1 (en) * 2007-03-13 2010-05-27 Thayer Larry J System and method for implementing a stride value for memory testing
TWI332665B (en) * 2007-05-09 2010-11-01 Faraday Tech Corp Circuit and method for built-in self repair of a multi-port memory
TWI440036B (zh) * 2010-01-20 2014-06-01 King Yuan Electronics Co Ltd 可擴充樣本記憶體之記憶體測試設備

Also Published As

Publication number Publication date
TW201721642A (zh) 2017-06-16

Similar Documents

Publication Publication Date Title
CN105468484B (zh) 用于在存储系统中确定故障位置的方法和装置
US10198196B2 (en) Monitoring health condition of a hard disk
CN106803429B (zh) 具有用于存储器的故障监测的电子设备及相关联的方法
US11017875B2 (en) Tracking address ranges for computer memory errors
JP2015529927A (ja) 訂正不能エラーを含むアドレス範囲の通知
US10338999B2 (en) Confirming memory marks indicating an error in computer memory
CN111048139A (zh) 一种存储介质检测方法、装置、设备及可读存储介质
US20170293514A1 (en) Handling repaired memory array elements in a memory of a computer system
CN113568777B (zh) 一种故障处理方法、装置、网络芯片、设备及存储介质
CN108170375B (zh) 一种分布式存储系统中的超限保护方法和装置
US9230687B2 (en) Implementing ECC redundancy using reconfigurable logic blocks
CN107526677A (zh) 一种软件错误现场定位及处理的方法及装置
US9563500B2 (en) Storage integrity validator
TWI607455B (zh) 記憶體資料檢測方法
JP6212947B2 (ja) 情報処理装置、制御装置及び制御プログラム
KR20130136341A (ko) 반도체 장치 및 그 동작 방법
US11537468B1 (en) Recording memory errors for use after restarts
CN106940666B (zh) 内存数据检测方法
US8151176B2 (en) CPU instruction RAM parity error procedure
US10140186B2 (en) Memory error recovery
US10055272B2 (en) Storage system and method for controlling same
US10754566B2 (en) Data storage device and data storage method
CN107544860A (zh) 一种磁盘数据检测方法及装置
CN102549550B (zh) 一种数据访问方法及系统
JP2014093012A (ja) ディスクアレイコントローラ、方法、及び、プログラム