TWI823556B - 記憶體異常檢測系統、主機板、電子裝置及異常檢測方法 - Google Patents

記憶體異常檢測系統、主機板、電子裝置及異常檢測方法 Download PDF

Info

Publication number
TWI823556B
TWI823556B TW111134216A TW111134216A TWI823556B TW I823556 B TWI823556 B TW I823556B TW 111134216 A TW111134216 A TW 111134216A TW 111134216 A TW111134216 A TW 111134216A TW I823556 B TWI823556 B TW I823556B
Authority
TW
Taiwan
Prior art keywords
signal
control module
level
state
memory
Prior art date
Application number
TW111134216A
Other languages
English (en)
Other versions
TW202411840A (zh
Inventor
邱多
劉君蘭
Original Assignee
新加坡商鴻運科股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 新加坡商鴻運科股份有限公司 filed Critical 新加坡商鴻運科股份有限公司
Application granted granted Critical
Publication of TWI823556B publication Critical patent/TWI823556B/zh
Publication of TW202411840A publication Critical patent/TW202411840A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本發明提供一種記憶體異常檢測系統、主機板、電子裝置及異常檢測方法。其中,記憶體異常檢測系統包括處理器、控制模組、記憶體及監測模組,記憶體包括複數存儲單元。處理器藉由控制模組電連接至每一存儲單元。監測模組電連接至處理器、控制模組及存儲單元。監測模組用於監測每一存儲單元與控制模組,及控制模組與處理器之間產生之訊號之電平,且監測模組根據訊號之電平狀態確認是否發生異常。本申請提供之記憶體異常檢測系統,可快速確認發生異常之存儲單元,有效降低維修成本。

Description

記憶體異常檢測系統、主機板、電子裝置及異常檢測方 法
本發明涉及檢測領域,尤其涉及一種記憶體異常檢測系統、主機板、電子裝置及異常檢測方法。
隨著大資料與雲計算之發展,企業、科研單位等組織對於存放裝置之容量需求越來越大。因此伺服器中記憶體之數量亦越來越多。然而,由於每一記憶體均連接至電腦主機板,如此,當記憶體出現故障時,較難快速定位到出現異常之具體某一記憶體上。
鑒於以上內容,本發明提供了一種快速確定異常之記憶體異常檢測系統、主機板、電子裝置及異常檢測方法。
本申請第一方面提供一種記憶體異常檢測系統,包括處理器、控制模組、記憶體及監測模組,記憶體包括複數存儲單元。處理器藉由控制模組電連接至每一存儲單元。監測模組電連接至處理器、控制模組及存儲單元。監測模組用於監測每一存儲單元與控制模組,及控制模組與處理器之間產生之訊號之電平,且監測模組根據訊號之電平狀態確認是否發生異常。
本申請第二方面提供一種主機板,包括如上任一項所述之記憶體異常檢測系統。
本申請第三方面提供一種電子裝置,包括如上任一項所述之記憶體異常檢測系統。
本申請第四方面提供一種異常檢測方法,應用於記憶體異常檢測系統,所述記憶體異常檢測系統包括處理器、監測模組及複數存儲單元。異常檢測方法包括如下步驟: 獲取各存儲單元與監測模組,及監測模組與處理器之間產生之第一訊號、第二訊號、第三訊號及第四訊號; 檢測第一訊號、第二訊號、第三訊號及第四訊號之電平狀態; 根據檢測結果確認處理器或存儲單元是否發生異常。
與習知技術相比,上述記憶體異常檢測系統有利於快速確定記憶體異常,成本更低,操作方法更便捷。
100:記憶體異常檢測系統
10:處理器
20:控制模組
30:記憶體
31:存儲單元
40:監測模組
50:BMC
200:用戶端
300:電子裝置
圖1為本申請一實施例提供之記憶體異常檢測系統之結構框圖。
圖2為圖1所示記憶體異常檢測系統之訊號流程圖。
圖3為本申請一實施例提供之異常檢測方法之流程示意圖。
需要說明係,當一個元件被稱為“電連接”另一個元件,它可以直接於另一個元件上或者也可以存在居中之元件。當一個元件被認為係“電連接”另一個元件,它可為接觸連接,例如,可為導線連接之方式,也可為非接觸式連接,例如,可為非接觸式耦合之方式。
除非另有定義,本文所使用之所有之技術和科學術語與屬於本發明之技術領域之技術人員通常理解之含義相同。本文中於本發明之說明書中所使用之術語只為描述具體之實施例之目的,非旨在限制本發明。
下面結合附圖,對本發明之一些實施方式作詳細說明。於不衝突之情況下,下述之實施例及實施例中之特徵可相互組合。
隨著大資料與雲計算之發展,企業、科研單位等組織對於存放裝置之容量需求越來越大。因此伺服器中記憶體之數量亦越來越多。例如,隨著存儲技術之發展,習知之伺服器中可安裝64個雙列直插式存儲模組(Dual-Inline-Memory-Modules,DIMM),且該DIMM可是符合DDR5電腦記憶體規格之記憶體。然而,由於每一記憶體均需連接至伺服器中之處理器,如此,當記憶體出現故障時,較難快速定位到出現異常之記憶體,需要花費大量人力與物力對記憶體進行檢測。
為解決上述之至少一問題,請參閱圖1,本申請實施例提供一種記憶體異常檢測系統100,運行於電子裝置300中。電子裝置300可包括,但不限於臺式電腦、筆記本電腦、平板電腦、個人數位助理(PDA)、智慧型電話、遊戲器具、伺服器電腦等。
於本申請實施例中,記憶體異常檢測系統100包括處理器10、控制模組20、記憶體30及監測模組40。其中,處理器10藉由控制模組20電連接至記憶體30。控制模組20用在於上電後進入相應之狀態,以與處理器10之工作狀態互相配合。處理器10藉由控制模組20與記憶體30互相確認工作狀態,進而調取記憶體30儲存之資料或控制記憶體30執行相應之操作。記憶體30包括複數存儲單元31。每一存儲單元31分別電連接至控制模組20。即於本申請實施例中,記憶體30中之複數存儲單元31並聯連接至控制模組20。處理器10藉由控制模組20電連接至每一存儲單元31。如此,處理器10可藉由控制模組20與任一存儲單元31進行工作狀態之確認。監測模組40電連接至處理器10、控制模組20及記憶體30中之每一存儲單元31,用於監測每一存儲單元31與控 制模組20,及控制模組20與處理器10之間產生之訊號之電平狀態,且監測模組40根據訊號之電平狀態確認是否發生異常,並生成相應之監測日誌。
本申請提供之記憶體異常檢測系統100可集成於同一主機板(Motherboard,MB)上。當將設置有記憶體異常檢測系統100之主機板安裝於對應之電腦上時,可於控制對應之電腦實現相應之功能之同時,即時監測記憶體30。
可理解,處理器10為電子裝置300之運算與控制核心,用於解釋電腦指令以及處理電腦軟體中之資料。於本實施例中,處理器10可為中央處理器(Central Processing Unit,CPU)。
於本實施例中,控制模組20及監測模組40可集成於一複雜可程式設計邏輯器件(Complex Programmable Logic Device,CPLD)上。
可理解,記憶體30用於存放資料與程式。於本實施例中,記憶體30可是雙倍資料率同步動態隨機存取記憶體(Double Data Rate Synchronous Dynamic Random Access Memory,DDR)。示例記憶體30可是第五代雙倍資料率同步動態隨機存取記憶體DDR5。
於本申請實施例中,每一存儲單元31為一雙列直插式存儲模組(Dual-Inline-Memory-Modules,DIMM)。其中,電子裝置300上電後,控制模組20依次經歷第一狀態(例如ST_IDLE狀態)、第二狀態(例如ST_DDRIO狀態)、第三狀態(例如ST_LINK狀態)及第四狀態(例如ST_FAULT狀態)。於本申請實施例中,第一狀態為初始狀態,第二狀態為待啟動狀態,第三狀態為連接狀態。第四狀態為故障狀態。
請一併參閱圖2,電子裝置300上電後,且控制模組20進入第三狀態時,存儲單元31輸出第一訊號至控制模組20。控制模組20接收到第一訊 號後,輸出第二訊號至處理器10。如此,當處理器10接收到第二訊號時,可確認存儲單元31已正常上電,可開始工作。
處理器10接收到第二訊號後,繼而輸出第三訊號至控制模組20。控制模組20接收到第三訊號後,繼而輸出第四訊號至存儲單元31。如此,存儲單元31接收到第四訊號時,確認處理器10正常工作。如此,處理器10可對記憶體30進行資料調取或寫入等操作。
於本申請實施例中,當電子裝置300處於運行過程,即電子裝置300之控制模組20進入第三狀態後,且監測模組40監測到第一訊號、第二訊號、第三訊號及第四訊號中之任一之電平狀態為第一電平(例如低電平)時,則說明出現異常。可理解,其中,當控制模組20進入第四狀態時,則說明記憶體30發生異常。然而,當控制模組20進入除第四狀態以外之狀態時,則需結合第一訊號、第二訊號、第三訊號及第四訊號之電平狀態及控制模組20所處之狀態來判斷異常發生原因。
例如,本申請實施例藉由以下複數場景說明於不同狀態下判斷故障之方法。
第一種場景:於電子裝置300運行過程中,當監測模組40監測到第一訊號為第一電平,且控制模組20處於第四狀態時,則判斷存儲單元31發生異常。
第二種場景:於電子裝置300運行過程中,當監測模組40監測到第一訊號為第一電平時,且控制模組20處於第一狀態或第二狀態時,則判斷控制模組20發生異常。
第三種場景:於電子裝置300運行過程中,當監測模組40監測到第一訊號為第二電平(例如高電平),第二訊號為第一電平時,且控制模組20處於第三狀態,則判斷控制模組20出現異常。
第四種場景:於電子裝置300運行過程中,當監測模組40監測到第一訊號及第二訊號均為第二電平,第三訊號為第一電平時,且控制模組20處於第三狀態,則判斷處理器10出現異常;當控制模組20處於第三狀態,且監測模組40監測到第一訊號、第二訊號及第三訊號均為第二電平,且第四訊號為第一電平時,則判斷控制模組20出現異常。
可理解,於本申請實施例中,可藉由監測模組40監測對應之訊號(例如第一訊號、第二訊號、第三訊號及第四訊號)是否為第一電平,即確認對應之訊號是否產生下降沿,以及控制模組20所處之狀態從而確認對應之電子部件(例如處理器10,存儲單元31)或者是相關線路是否發生異常。
請再次參閱圖1,於一些實施例中,記憶體異常檢測系統100還包括基板管理控制器(Baseboard Management Controller,BMC)50。監測模組40上還設置有複數暫存器(圖未示),以記錄對應之存儲單元31之第一訊號、第二訊號、第三訊號及第四訊號之電平狀態。於本申請實施例中,當監測模組40檢測到第一訊號、第二訊號、第三訊號或第四訊號中之任一訊號為第一電平時,監測模組40對相應之暫存器賦值。監測模組40上之複數暫存器藉由雙向二線制同步串列匯流排(Inter-Integrated Circuit,I2C)電連接至BMC50,以將複數暫存器上之值輸出至BMC50,以記錄第一訊號、第二訊號、第三訊號及第四訊號之電平狀態。如此,BMC50可生成相應之檢測日誌。
於本申請實施例中,BMC50還藉由USB介面電連接至使用者端200,例如另一台電腦。如此,技術人員可藉由使用者端200查看相關日誌,以確定電子裝置300工作過程中發生異常之部件。進一步地,當電子裝置300於工作過程中確認記憶體發生異常,技術人員可藉由使用者端200查看日誌,以確定對應之發生異常之存儲單元31,有效降低維修之人工成本及時間成本。
於本申請實施例中,每一存儲單元31還設置有對應之編號。且每一存儲單元31對應之暫存器輸出之資料包括所述編號。如此,監測模組40可藉由暫存器輸出包括對應存儲單元31之編號及對應訊號之電平狀態之資料,以協助確認電子裝置300中發生異常之存儲單元31,從而有效降低檢測維修時之時間成本及人工成本。
可理解,本申請不對監測模組40之具體類型進行限制,例如於其他實施例中,監測模組40還可為現場可程式閘陣列(Field Programmable Gate Array,FPGA)、單片機或其他可程式控制器。
可理解,本申請提供之記憶體異常檢測系統100,藉由設置監測模組40,以記錄電子裝置300工作過程中產生之第一訊號、第二訊號、第三訊號及第四訊號之電平狀態,從而藉由分析電平狀態,確認於電子裝置300工作過程中發生異常之部件。本申請提供之記憶體異常檢測系統100操作便捷,可有效降低維修成本。
請繼續參閱圖3,本申請一實施例還提供一種異常檢測方法,應用於圖1所示之記憶體異常檢測系統100,以檢測電子裝置300中之記憶體是否發生異常狀況。其中,記憶體異常檢測系統包括依次電連接之處理器10、監測模組40及複數存儲單元31。異常檢測方法包括如下步驟:
步驟S1:獲取電子裝置300工作過程中各存儲單元31與控制模組20,及控制模組20與處理器10之間產生之第一訊號、第二訊號、第三訊號及第四訊號。
可理解,第一訊號、第二訊號、第三訊號及第四訊號之間之具體流向,請參閱上述有關內容,於此不再贅述。
步驟S2:檢測第一訊號、第二訊號、第三訊號及第四訊號之電平狀態。
步驟S3:根據上述各訊號之電平狀態確認是否發生異常。
可理解,於步驟S3中,電平狀態包括第一電平及第二電平。於本申請實施例中,第一電平指低電平,第二電平指高電平。
其中,於電子裝置300運行過程中,當監測模組40監測到第一訊號為第一電平,且控制模組20處於第四狀態時,則可判斷存儲單元31發生異常。
於電子裝置300運行過程中,當監測模組40監測到第一訊號為第一電平時,且控制模組20處於第一狀態或第二狀態時,則可判斷控制模組20發生異常。
於電子裝置300運行過程中,當監測模組40監測到第一訊號為第二電平,第二訊號為第一電平時,且控制模組20處於第三狀態,可判斷控制模組20出現異常。
於電子裝置300運行過程中,當監測模組40監測到第一訊號及第二訊號均為第二電平,第三訊號為第一電平時,且控制模組20處於第三狀態,可判斷處理器10出現異常;當控制模組20處於第三狀態,且監測模組40監測到第一訊號、第二訊號及第三訊號均為第二電平,且第四訊號為第一電平時,可判斷控制模組20出現異常。
可理解,上述實施例中所包含之各個模組可集成設置於一計算器設備或工具中,亦可設置成單獨之功能實體,與所述計算器設備或工具連接以向所述計算器設備或工具提供各個模組之功能。
最後應說明,以上實施例僅用以說明本發明之技術方案而非限制。本領域具有通常技藝者應當理解,可以對本發明之技術方案進行修改或等同替換,而不脫離本發明技術方案之精神和範圍。基於本發明中之實施例,本領域 具有通常技藝者於沒有做出創造性勞動前提下所獲得之所有其他實施例,都將屬於本發明保護之範圍。
100:記憶體異常檢測系統
10:處理器
20:控制模組
30:記憶體
31:存儲單元
40:監測模組
50:BMC
200:用戶端
300:電子裝置

Claims (10)

  1. 一種記憶體異常檢測系統,其中,所述記憶體異常檢測系統包括處理器、控制模組、記憶體及監測模組,所述記憶體包括複數存儲單元,所述處理器藉由所述控制模組電連接至每一所述存儲單元,所述監測模組電連接至所述處理器、所述控制模組及所述存儲單元,所述監測模組用於監測每一所述存儲單元與所述控制模組,及所述控制模組與所述處理器之間產生之訊號之電平,且所述監測模組根據所述訊號之電平狀態確認是否發生異常,且當監測到存在所述存儲單元與所述控制模組之間,或所述控制模組與所述處理器之間產生之訊號之電平狀態為第一電平時,確認發生異常。
  2. 如請求項1所述之記憶體異常檢測系統,其中,所述控制模組依次進入第一狀態、第二狀態、第三狀態及第四狀態,且每一所述存儲單元與所述控制模組,及所述控制模組與所述處理器之間產生之訊號包括第一訊號、第二訊號、第三訊號及第四訊號,其中,所述記憶體異常檢測系統上電後,每一所述存儲單元輸出所述第一訊號至所述控制模組,所述控制模組接收到所述第一訊號後,輸出所述第二訊號至所述處理器;所述處理器接收到所述第二訊號後,繼而輸出所述第三訊號至所述控制模組,所述控制模組接收到所述第三訊號後,繼而輸出所述第四訊號至所述存儲單元。
  3. 如請求項2所述之記憶體異常檢測系統,其中,當所述控制模組進入第三狀態後,且所述監測模組監測到所述第一訊號、所述第二訊號、所述第三訊號及所述第四訊號中之任一訊號之電平為所述第一電平時,所述監測模組判斷發生異常。
  4. 如請求項3所述之記憶體異常檢測系統,其中,當所述監測模組監測到所述第一訊號為所述第一電平,且所述控制模組處於所述第四狀態時,所述監測模組判斷所述記憶體發生異常;或當所述監測模組監測到所述第一訊號為所述第一電平時,且所述控制模組處於所述第一狀態或所述第二狀態時,所述監測模組判斷所述控制模組發生異常;或當所述監測模組監測到所述第一訊號為第二電平,所述第二訊號為所述第一電平時,且所述控制模組處於第三狀態,所述監測模組判斷所述控制模組出現異常;或當所述監測模組監測到所述第一訊號及所述第二訊號均為所述第二電平,所述第三訊號為所述第一電平時,且所述控制模組處於所述第三狀態時,所述監測模組判斷所述控制模組出現異常;當所述監測模組監測到所述第一訊號、所述第二訊號及所述第三訊號均為所述第二電平,且所述第四訊號為所述第一電平時,且所述控制模組處於所述第三狀態,所述監測模組判斷所述控制模組出現異常。
  5. 如請求項3所述之記憶體異常檢測系統,其中,所述記憶體異常檢測系統還包括基板管理控制器,所述監測模組還包括複數暫存器,複數所述暫存器用以記錄對應之存儲單元之所述第一訊號、所述第二訊號、所述第三訊號及所述第四訊號之電平狀態,所述基板管理控制器電連接至複數所述暫存器,用於接收複數所述暫存器輸出之資料,以生成相應之檢測日誌。
  6. 如請求項5所述之記憶體異常檢測系統,其中,所述存儲單元設置有對應之編號,所述暫存器輸出之資料包括對應之存儲單元之編號及對應之所述第一訊號、所述第二訊號、所述第三訊號及所述第四訊號之電平狀態。
  7. 一種主機板,其中,所述主機板包括如請求項1至6中任一項所述之記憶體異常檢測系統。
  8. 一種電子裝置,其中,所述電子裝置包括如請求項1至6中任一項所述之記憶體異常檢測系統。
  9. 一種異常檢測方法,應用於記憶體異常檢測系統,其中,所述記憶體異常檢測系統包括處理器、控制模組及記憶體,所述記憶體包括複數存儲單元,所述處理器藉由所述控制模組電連接至每一所述存儲單元,所述控制模組依次進入第一狀態、第二狀態、第三狀態及第四狀態,且每一所述存儲單元與所述控制模組,及所述控制模組與所述處理器之間產生之訊號包括第一訊號、第二訊號、第三訊號及第四訊號,其中,所述記憶體異常檢測系統上電後,每一所述存儲單元輸出所述第一訊號至所述控制模組,所述控制模組接收到所述第一訊號後,輸出所述第二訊號至所述處理器;所述處理器接收到所述第二訊號後,繼而輸出所述第三訊號至所述控制模組,所述控制模組接收到所述第三訊號後,繼而輸出所述第四訊號至所述存儲單元;所述異常檢測方法包括如下步驟:獲取各所述存儲單元與所述控制模組,及所述控制模組與所述處理器之間產生之第一訊號、第二訊號、第三訊號及第四訊號;檢測所述第一訊號、所述第二訊號、所述第三訊號及所述第四訊號之電平狀態;根據所述第一訊號、所述第二訊號、所述第三訊號及所述第四訊號之電平狀態確認是否發生異常,且當監測到存在所述第一訊號、所述第二訊號、所述第三訊號及所述第四訊號中之任一者之電平狀態為第一電平時,確認發生異常。
  10. 如請求項9所述之異常檢測方法,其中,當監測到所述第一訊號為所述第一電平,且所述控制模組處於所述第四狀態時,判斷所述記憶體發生異常;或當監測到所述第一訊號為所述第一電平時,且所述控制模組處於所述第一狀態或所述第二狀態時,判斷所述控制模組發生異常;或當監測到所述第一訊號為第二電平,所述第二訊號為所述第一電平時,且所述控制模組處於第三狀態,判斷所述控制模組出現異常;或當監測到所述第一訊號及所述第二訊號均為所述第二電平,所述第三訊號為所述第一電平時,且所述控制模組處於所述第三狀態時,判斷所述控制模組出現異常;當監測到所述第一訊號、所述第二訊號及所述第三訊號均為所述第二電平,且所述第四訊號為所述第一電平時,且所述控制模組處於第三狀態時,判斷所述控制模組出現異常。
TW111134216A 2022-08-31 2022-09-09 記憶體異常檢測系統、主機板、電子裝置及異常檢測方法 TWI823556B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211059208.1 2022-08-31
CN202211059208.1A CN117667534A (zh) 2022-08-31 2022-08-31 存储器异常检测系统、主板、电子装置及异常检测方法

Publications (2)

Publication Number Publication Date
TWI823556B true TWI823556B (zh) 2023-11-21
TW202411840A TW202411840A (zh) 2024-03-16

Family

ID=89722854

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111134216A TWI823556B (zh) 2022-08-31 2022-09-09 記憶體異常檢測系統、主機板、電子裝置及異常檢測方法

Country Status (3)

Country Link
US (1) US20240069786A1 (zh)
CN (1) CN117667534A (zh)
TW (1) TWI823556B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW226447B (zh) * 1990-09-21 1994-07-11 Mitsuta Industry Co Ltd
CN107450786A (zh) * 2017-08-07 2017-12-08 京东方科技集团股份有限公司 触控控制器、包括其的触控面板以及检测电路故障的方法
CN110196678A (zh) * 2018-02-23 2019-09-03 环达电脑(上海)有限公司 资料储存决定装置
TWI764648B (zh) * 2021-03-25 2022-05-11 微星科技股份有限公司 主機板、主機板的外接裝置以及主機板的開機方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013156942A (ja) * 2012-01-31 2013-08-15 Hitachi Ltd 情報処理装置
US20210286667A1 (en) * 2021-05-27 2021-09-16 Intel Corporation Cloud scale server reliability management

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW226447B (zh) * 1990-09-21 1994-07-11 Mitsuta Industry Co Ltd
CN107450786A (zh) * 2017-08-07 2017-12-08 京东方科技集团股份有限公司 触控控制器、包括其的触控面板以及检测电路故障的方法
CN110196678A (zh) * 2018-02-23 2019-09-03 环达电脑(上海)有限公司 资料储存决定装置
TWI764648B (zh) * 2021-03-25 2022-05-11 微星科技股份有限公司 主機板、主機板的外接裝置以及主機板的開機方法

Also Published As

Publication number Publication date
CN117667534A (zh) 2024-03-08
US20240069786A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
US9569325B2 (en) Method and system for automated test and result comparison
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN107463459A (zh) 系统异常内存数据的保存方法、装置、系统及终端设备
CN113010341A (zh) 一种故障内存定位的方法和设备
US20230366951A1 (en) Power failure monitoring device and power failure monitoring method
TWI823556B (zh) 記憶體異常檢測系統、主機板、電子裝置及異常檢測方法
CN112650612A (zh) 一种内存故障定位方法及装置
US11126486B2 (en) Prediction of power shutdown and outage incidents
CN114461142B (zh) 一种读写Flash数据的方法、系统、装置及介质
TW202411840A (zh) 記憶體異常檢測系統、主機板、電子裝置及異常檢測方法
TWI777628B (zh) 電腦系統及其專用崩潰轉存硬體裝置與記錄錯誤資料之方法
CN115509786A (zh) 一种报告故障的方法、装置、设备及介质
CN115033441A (zh) PCIe设备故障检测方法、装置、设备和存储介质
US11593209B2 (en) Targeted repair of hardware components in a computing device
CN209343321U (zh) 一种计算机故障检测装置
JP5440673B1 (ja) プログラマブルロジックデバイス、情報処理装置、被疑箇所指摘方法およびプログラム
CN114189429A (zh) 一种服务器集群故障的监测系统、方法、装置及介质
TWI733964B (zh) 記憶體整體測試之系統及其方法
TW202115569A (zh) 硬碟安裝檢測系統
CN115695159B (zh) 一种设备诊断方法、装置、设备和存储介质
CN111124804B (zh) 测试方法和装置
CN116560936A (zh) 异常监测方法、协处理器及计算设备
US20230205626A1 (en) Multilevel memory failure bypass
JP3334174B2 (ja) 障害処理検証装置
US8230275B2 (en) Use of parity bits to detect memory installation defects