CN205881469U - 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备 - Google Patents
电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备 Download PDFInfo
- Publication number
- CN205881469U CN205881469U CN201620634069.4U CN201620634069U CN205881469U CN 205881469 U CN205881469 U CN 205881469U CN 201620634069 U CN201620634069 U CN 201620634069U CN 205881469 U CN205881469 U CN 205881469U
- Authority
- CN
- China
- Prior art keywords
- fault
- permanent
- memorizer
- mapping
- signature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015654 memory Effects 0.000 title claims abstract description 95
- 230000001052 transient effect Effects 0.000 title claims abstract description 68
- 238000001514 detection method Methods 0.000 title abstract 2
- 238000013507 mapping Methods 0.000 claims abstract description 70
- 238000012360 testing method Methods 0.000 claims description 21
- 125000004122 cyclic group Chemical group 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 9
- 208000011580 syndromic disease Diseases 0.000 claims description 8
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000000151 deposition Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/12—Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
- G11C29/38—Response verification devices
- G11C29/42—Response verification devices using error correcting codes [ECC] or parity check
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/073—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/076—Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0772—Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1004—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/12—Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
- G11C29/44—Indication or identification of errors, e.g. for repair
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/18—Error detection or correction; Testing, e.g. of drop-outs
- G11B20/1833—Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information
- G11B2020/1843—Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information using a cyclic redundancy check [CRC]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/02—Detection or location of defective auxiliary circuits, e.g. defective refresh counters
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
Abstract
本公开内容提供了电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备。一种电子设备,该电子设备包括具有经受瞬态故障和永久故障的多个存储器位置的存储器以及耦接于该存储器的故障检测电路。该故障检测电路被配置成用于:在第一时间读取这些存储器位置,并且在该第一时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第一故障计数和故障映射签名,并且存储该第一故障计数和故障映射签名。该故障检测电路被配置成用于:在第二时间读取这些存储器位置,并且在该第二时间基于读取这些存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名,并且将该存储的第一故障计数和故障映射签名与该第二故障计数和故障映射签名进行比较以确定永久故障计数。
Description
技术领域
本实用新型涉及存储器的领域,并且更具体而言,涉及在存储器中的高效的故障监测。
背景技术
在被突然地中断之前,应用可以容忍某种程度上的存储器故障。在执行应用期间可能发生永久故障和瞬态故障。永久故障通常被定义为永久的并且当应用关闭时不消失的故障。永久故障通常是由存储器的物理缺陷导致的。瞬态故障是在执行应用期间发生的并且当应用关闭时消失的故障。瞬态故障通常是在存储器没有物理缺陷的情况下由数据值的改变导致的,并且可以由于环境条件而发生。
通常,瞬态故障比永久故障发生得更加频繁得多并且是存储器在使用周期之上使故障显现的结果。在存在纠错机制的情况下,应用可能需要了解这类故障的范围以评估存储器的物理缺陷的严重性。例如,一个应用可以用于在汽车上使用的存储器。
实用新型内容
一种电子设备可以包括具有经受瞬态故障和永久故障的多个存储器位置的存储器以及耦接于该存储器的故障检测电路。该故障检测电路可以被配置成用于:在第一时间读取该多个存储器位置,并且在该第一时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第一故障计数和故障映射签名,并且存储该第一故障计数和故障映射签名。该故障检测电路还可以:在第二时间读取该多个存储器位置,并且在该第二时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名,并且将该存储的第一故障计数和故障映射签名与该第二故障计数和故障映射签名进行比较以确定永久故障计数。因此,该故障检测电路可以在存储器中检测故障的范围,如在故障达到应用被突然地中断的阈值点之前。
故障检测设备还可以包括用于基于永久故障计数超过阈值而生成指示的指示器电路。此外,故障检测电路可以包括被配置成用于读取该多个存储器位置的存储器控制器以及耦接于存储器控制器的存储器错误处置器。存储器控制器可以包括循环冗余校验(CRC)电路和错误计数器,该CRC电路被配置成用于检测瞬态和永久故障,而该错误计数器耦接于该CRC电路并且被配置成用于确定瞬态和永久故障的第一和第二计数。
故障检测电路可以进一步包括处理器,该处理器耦接于CRC电路和错误计数器以将存储的第一故障计数和故障映射签名与第二故障计数和故障映射签名进行比较从而基于存储的第一故障计数和故障映射签名与第二故障计数和故障映射签名之间的改变确定永久故障计数。存储器控制器可以被配置成用于在存储器内的不同块之上以三重复制存储第一故障计数和故障映射签名以及永久故障计数并且CRC电路可以被配置成用于从每个瞬态和永久故障计算故障映射签名。
用于确定故障计数和故障映射签名的第一时间可以对应于存储器的掉电事件而第二时间可以是存储器的上电事件,其中,每个瞬态和永久故障可以具有与其相关联的存储器地址和校正子。此外,每个瞬态故障可以是单比特或双比特可校正的错误,而每个永久故障可以是三比特不可校正的错误。存储器可以是非易失性存储器。
根据本公开的实施方式,提供了一种电子设备,其特征在于包括:存储器,所述存储器具有经受瞬态故障和永久故障的多个存储器位置;以及故障检测电路,所述故障检测电路耦接于所述存储器并且被配置成用于:在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,存储所述第一故障计数和故障映射签名,在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
可选地,所述故障检测电路进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
可选地,所述故障检测电路包括:存储器控制器,所述存储器控制器被配置成用于读取所述多个存储器位置;以及存储器错误处置器,所述存储器错误处置器耦接于所述存储器控制器。
可选地,所述存储器控制器包括:循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
可选地,所述故障检测电路进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
可选地,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
可选地,所述循环冗余校验电路被配置成用于针对每个瞬态和永久故障计算渐进式签名。
可选地,所述第一时间包括所述存储器的掉电事件。
可选地,所述第二时间包括所述存储器的上电事件。
可选地,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
可选地,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
可选地,所述存储器包括非易失性存储器。
根据本公开的实施方式,还提供了一种用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备,其特征在于所述故障检测设备包括:存储器控制器和与其协同操作的存储器错误处置器,并且被配置成用于:在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,存储所述第一故障计数和故障映射签名,在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
可选地,该故障检测设备进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
可选地,所述存储器控制器包括:循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
可选地,该故障检测设备进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
可选地,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
可选地,所述循环冗余校验电路被配置成用于从每个瞬态和永久故障计算故障映射签名。
可选地,所述第一时间包括所述存储器的掉电事件。
可选地,所述第二时间包括所述存储器的上电事件。
可选地,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
可选地,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
附图说明
图1是根据本实用新型的实施例的电子设备的框图;
图2是图1的电子设备的更详细的框图;并且
图3是根据本实用新型的实施例的一种监测故障的方法的流程图。
具体实施方式
现在将参照附图在下文中更为全面地描述本实用新型,在附图中示出了本实用新型的优选实施例。然而,本实用新型可以用许多不同的形式来体现,并且不应当被解释为限于在此所列出的实施例。相反,提供了这些实施例从而使得本披露将是全面和完整的,并且将向本领域技术人员完全传达本实用新型的范围。贯穿全文相似的数字指代相似的元件,并且上撇号符号用于指示在替代实施例中的类似元件。
首先参照图1,电子设备100被展示具有耦接于存储器104的故障检测电路102。存储器104可以具有经受瞬态故障和永久故障的多个存储器位置。故障检测电路102可以被配置成用于在第一时间(例如,掉电)处读取存储器104并且在该第一时间处基于读取存储器104确定包括这些瞬态和永久故障的第一故障计数和故障映射签名。存储第一故障计数和故障映射签名。在具体实施例中,还可以在第二时间(例如,上电)处读取存储器104并且在该第二时间处基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名。故障检测电路102可以将对应于掉电事件的存储的第一故障计数和故障映射签名与对应于上电事件的第二故障计数和故障映射签名进行比较以确定永久故障计数。
电子设备100能够在启动(例如,上电)时并且在关机(例如,掉电)之前管理并读取存储器102、将故障信息存储在可检索的位置中、对存储的故障信息和最近的测试执行评估、并且读取结果从而评估永久和瞬态故障的范围。
如以上所解释的,读取存储器104(例如,闪存或其他非易失性存储器)并且可以在测试期间检测可校正的错误。例如,可校正的错误可以是单比特、双比特或三比特的。对应于每种类型的可校正的错误的地址和校正子可以用于计算对应的可校正的错误的唯一签名。
此外,在存储器104中每种类型的可校正的错误的数量由故障检测电路102计数。此计数可以与上一次上电和掉电测试的存储的计数结果进行比较并且可以相应地关于每种类型的永久和瞬态故障更新这些记录。
例如,在上电时未被检测到但在上一次掉电时被检测到的可校正的错误被认为是瞬态故障,而在上电和掉电时都被检测到的可校正的错误被认为是永久故障。每种类型的可校正的错误的签名和计数被存储在存储器104(例如,数据闪存)内部并且可以由分布在不同的存储块之上的三重复制和纠错方案保护。
现在参照图2,故障检测电路102可以包括存储器控制器106。存储器控制器可以被配置成用于读取存储器104的多个存储器位置。存储器控制器106耦接于系统/测试总线104。如将由本领域技术人员认识到的是,存储器控制器106还可以具有循环冗余校验(CRC)108,该CRC被配置成用于检测瞬态和永久故障。CRC 108还可以针对每个瞬态和永久故障使用对应可校正的错误的地址和校正子计算签名。
存储器控制器106的错误计数器110可以用于确定瞬态和永久故障的第一和第二计数。存储器控制器106可以包括处理器112,该处理器可以用软件编程或者可以是专用集成电路(ASIC)。例如,存储器控制器106的处理器112可以被配置成用于将第一故障计数和故障映射签名与第二故障计数和故障映射签名进行比较以基于对应于掉电事件的第一故障计数和故障映射签名与对应于上电事件的第二故障计数和故障映射签名之间的改变确定永久故障计数。在特定实施例中,每个瞬态故障可以例如被定义为单比特或双比特可校正的错误,而每个永久故障可以例如被定义为三比特不可校正的错误。可校正的错误比特计数基于纠错方案是可扩展的。
故障检测电路102的存储器错误处置器114可以耦接于存储器104并且被配置成用于接收永久和瞬态故障。存储器错误处置器114可以被配置成用于存储(n)个可校正的和(m)个不可校正的错误。尽管安全和高保险系统可以实现用于在电子设备100的寿命期间处置错误的纠错方案,在故障达到应用116被突然地中断的临界点之前故障在存储器104中的范围现在可以由故障检测电路102指示。
例如,如将由本领域技术人员认识到的是,纠错方案可以校正多达(x)个比特。存储器错误处置器114接收所有错误指示,即,具有相应的地址和校正子的可校正的和不可校正的错误。存储器错误处置器114可以存储最多(n)个可校正的和(m)个不可校正的错误。将多达(x-1)个比特校正的可校正的错误转发至存储器错误处置器114可以由寄存器掩模,实现针对在存储器控制器106内部的随机/瞬态故障的保护方案。例如,单比特错误可以被掩模为不重要的。
在存储器104的启动测试之后,将针对每种类型的可校正的错误的由CRC 108计算的签名和错误计数器110的计数与之前存储的记录进行比较以检测每种类型的可校正的错误的数量中的任何改变。针对每种类型的可校正的错误的计数的增加可以指示应用116可能更近乎被突然地中断。故障检测电路进一步包括耦接于处理器112以基于永久故障计数超过阈值而生成指示的指示器电路或指示器118。
如以上所解释的,在正常操作期间,可校正的错误掩模(CE-MASK)可以活跃的并且阻止将特定的可校正的错误(单比特)转发至存储器错误处置器114。出于用于诊断失效的调试目的,CE-MASK可以被取消激活。
直到没有(x)比特可校正的错误被报告时,针对(x-1)比特或更少比特的校正不被故障检测电路102(可配置的)考虑在内。在第一个(x)比特校正被报告后,在每次上电时执行测试,其中,存储器104的所有位置被读取并且错误的签名由CRC 108计算连同由错误计数器110执行对每个可校正的错误的计数。在运行时期间,瞬态(x-1)比特可校正的错误不被报告给存储器控制器106。
在硬件/软件控制之下在不同的闪存块之上分布的存储器104(例如,数据闪存)中以三重复制存储针对每种类型的错误的签名和计数。
在每次测试之后,将针对每种类型的可校正的错误(单比特、双比特、三比特……)的计算的签名和计数与之前存储的计数(例如,来自上电或掉电)进行比较以检测每种类型的可校正的错误的数量中的任何改变并且记录因此针对瞬态和永久类型的故障被更新。在掉电时,存储器104被再次读取并且每个可校正的错误的签名和错误计数可以被存储。因此,在从之前的上电事件到掉电事件处可校正的错误没有改变指示没有附加的瞬态故障。如果在从上一次掉电事件到下一个上电事件处可校正的错误的计数没有改变,那么没有附加的永久故障被检测到。
在正常操作期间,单错误校正掩模(SEC-MASK)可以是活跃的并且阻止将SEC事件转发至存储器错误处置器114。出于用于诊断失效的调试目的,SEC-MASK可以被取消激活。
现在参照图3,现在描述并且总体上指定一种监测存储器中的故障的方法200的流程图。以上所描述的故障检测电路102可以实现方法200。例如,在202在第一时间读取多个存储器位置,并且在204在第一时间(例如,对应于掉电事件)并且基于读取该多个存储器位置确定包括瞬态和永久故障的第一故障计数。移至206,在存储器内的不同存储器块之上以三重复制存储永久和瞬态故障的第一故障计数和故障映射签名。
在208在第二时间处读取该多个存储器位置并且在210在该第二时间(例如,对应于上电事件)处基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名。在212,将存储的第一故障计数和故障映射签名(例如,对应于掉电事件)与第二故障计数和故障映射签名(例如,对应于上电事件)进行比较以确定永久故障计数。在214,基于永久故障计数超过阈值而生成指示。在216,可以在存储器中的不同块之上以三重复制存储第二故障计数和故障映射签名。在204,该方法可以通过再次读取存储器位置并且重复以上所描述的处理而继续监测永久和瞬态故障。
本实用新型的许多修改和其他实施例对于受益于前面的描述和相关附图中呈现的教导的本领域技术人员来说将是显而易见的。因此,应当理解本实用新型不限于所披露的具体实施例,并且那些修改及实施例旨在被包括于所附权利要求书的范围内。
Claims (22)
1.一种电子设备,其特征在于包括:
存储器,所述存储器具有经受瞬态故障和永久故障的多个存储器位置;以及
故障检测电路,所述故障检测电路耦接于所述存储器并且被配置成用于
在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,
存储所述第一故障计数和故障映射签名,
在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且
将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
2.如权利要求1所述的电子设备,其特征在于,所述故障检测电路进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
3.如权利要求1所述的电子设备,其特征在于,所述故障检测电路包括:
存储器控制器,所述存储器控制器被配置成用于读取所述多个存储器位置;以及
存储器错误处置器,所述存储器错误处置器耦接于所述存储器控制器。
4.如权利要求3所述的电子设备,其特征在于,所述存储器控制器包括:
循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及
错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
5.如权利要求4所述的电子设备,其特征在于,所述故障检测电路进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
6.如权利要求3所述的电子设备,其特征在于,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
7.如权利要求4所述的电子设备,其特征在于,所述循环冗余校验电路被配置成用于针对每个瞬态和永久故障计算渐进式签名。
8.如权利要求1所述的电子设备,其特征在于,所述第一时间包括所述存储器的掉电事件。
9.如权利要求1所述的电子设备,其特征在于,所述第二时间包括所述存储器的上电事件。
10.如权利要求1所述的电子设备,其特征在于,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
11.如权利要求1所述的电子设备,其特征在于,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
12.如权利要求1所述的电子设备,其特征在于,所述存储器包括非易失性存储器。
13.一种用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备,其特征在于所述故障检测设备包括:
存储器控制器和与其协同操作的存储器错误处置器,并且被配置成用于
在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,
存储所述第一故障计数和故障映射签名,
在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且
将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
14.如权利要求13所述的故障检测设备,其特征在于进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
15.如权利要求13所述的故障检测设备,其特征在于,所述存储器控制器包括:
循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及
错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
16.如权利要求15所述的故障检测设备,其特征在于进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
17.如权利要求13所述的故障检测设备,其特征在于,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
18.如权利要求15所述的故障检测设备,其特征在于,所述循环冗余校验电路被配置成用于从每个瞬态和永久故障计算故障映射签名。
19.如权利要求13所述的故障检测设备,其特征在于,所述第一时间包括所述存储器的掉电事件。
20.如权利要求13所述的故障检测设备,其特征在于,所述第二时间包括所述存储器的上电事件。
21.如权利要求13所述的故障检测设备,其特征在于,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
22.如权利要求13所述的故障检测设备,其特征在于,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/951,639 | 2015-11-25 | ||
US14/951,639 US9990245B2 (en) | 2015-11-25 | 2015-11-25 | Electronic device having fault monitoring for a memory and associated methods |
Publications (1)
Publication Number | Publication Date |
---|---|
CN205881469U true CN205881469U (zh) | 2017-01-11 |
Family
ID=57691933
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610466671.6A Active CN106803429B (zh) | 2015-11-25 | 2016-06-23 | 具有用于存储器的故障监测的电子设备及相关联的方法 |
CN201620634069.4U Active CN205881469U (zh) | 2015-11-25 | 2016-06-23 | 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610466671.6A Active CN106803429B (zh) | 2015-11-25 | 2016-06-23 | 具有用于存储器的故障监测的电子设备及相关联的方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9990245B2 (zh) |
CN (2) | CN106803429B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803429A (zh) * | 2015-11-25 | 2017-06-06 | 意法半导体国际有限公司 | 具有用于存储器的故障监测的电子设备及相关联的方法 |
WO2019061517A1 (zh) * | 2017-09-30 | 2019-04-04 | 华为技术有限公司 | 内存故障的检测方法、装置和服务器 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102259928B1 (ko) * | 2017-06-26 | 2021-06-03 | 에스케이하이닉스 주식회사 | 오류 관리 시스템 및 이를 포함하는 데이터 처리 시스템 |
US10528422B2 (en) * | 2017-11-13 | 2020-01-07 | Stmicroelectronics International N.V. | Redundant storage of error correction code (ECC) checkbits for validating proper operation of a static random access memory (SRAM) |
IT201800000632A1 (it) * | 2018-01-09 | 2019-07-09 | St Microelectronics Srl | Dispositivo per commutare tra diverse modalita' di lettura di una memoria non volatile e metodo di lettura di una memoria non volatile |
US10705901B2 (en) * | 2018-02-23 | 2020-07-07 | Dell Products, L.P. | System and method to control memory failure handling on double-data rate dual in-line memory modules via suspension of the collection of correctable read errors |
US10761919B2 (en) | 2018-02-23 | 2020-09-01 | Dell Products, L.P. | System and method to control memory failure handling on double-data rate dual in-line memory modules |
US11468962B2 (en) * | 2021-03-03 | 2022-10-11 | Micron Technology, Inc. | Performing memory testing using error correction code values |
US20230368859A1 (en) * | 2022-05-11 | 2023-11-16 | Nxp Usa, Inc. | Testing disruptive memories |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4535455A (en) * | 1983-03-11 | 1985-08-13 | At&T Bell Laboratories | Correction and monitoring of transient errors in a memory system |
US4875209A (en) * | 1988-04-04 | 1989-10-17 | Raytheon Company | Transient and intermittent fault insertion |
US5031180A (en) | 1989-04-11 | 1991-07-09 | Trw Inc. | Triple redundant fault-tolerant register |
JP3272903B2 (ja) * | 1995-03-16 | 2002-04-08 | 株式会社東芝 | 誤り訂正検出回路と半導体記憶装置 |
US5905858A (en) | 1996-11-01 | 1999-05-18 | Micron Electronics, Inc. | System for method memory error handling |
US6119248A (en) | 1998-01-26 | 2000-09-12 | Dell Usa L.P. | Operating system notification of correctable error in computer information |
US7107501B2 (en) * | 2002-05-31 | 2006-09-12 | Infineon Technologies Ag | Test device, test system and method for testing a memory circuit |
DE102004037713A1 (de) * | 2004-08-04 | 2006-03-16 | Robert Bosch Gmbh | Verfahren, Betriebssystem und Rechengerät zum Abarbeiten eines Computerprogramms |
US7420791B1 (en) | 2004-08-09 | 2008-09-02 | Intersil Americas Inc. | Fault signature system for power management integrated circuits |
US20060190700A1 (en) * | 2005-02-22 | 2006-08-24 | International Business Machines Corporation | Handling permanent and transient errors using a SIMD unit |
US7430145B2 (en) * | 2005-09-16 | 2008-09-30 | Hewlett-Packard Development Company, L.P. | System and method for avoiding attempts to access a defective portion of memory |
US8001446B2 (en) | 2007-03-26 | 2011-08-16 | Intel Corporation | Pipelined cyclic redundancy check (CRC) |
US8299768B2 (en) * | 2008-11-20 | 2012-10-30 | Intersil Americas Inc. | PWM voltage converter with redundancy and feedback adjustment |
US7987407B2 (en) * | 2009-08-20 | 2011-07-26 | Arm Limited | Handling of hard errors in a cache of a data processing apparatus |
FR2961613B1 (fr) * | 2010-06-18 | 2012-07-27 | Commissariat Energie Atomique | Procede de protection memoire configurable contre les erreurs permanentes et transitoires et dispositif apparente |
DE102010031282B4 (de) * | 2010-07-13 | 2022-05-12 | Robert Bosch Gmbh | Verfahren zum Überwachen eines Datenspeichers |
KR101991900B1 (ko) * | 2013-03-13 | 2019-06-24 | 삼성전자주식회사 | 메모리 장치의 동작 방법, 이를 이용한 메모리 장치 및 이를 포함하는 메모리 시스템 |
US9323607B2 (en) * | 2014-04-29 | 2016-04-26 | Seagate Technology Llc | Data recovery once ECC fails to correct the data |
CN104657239B (zh) * | 2015-03-19 | 2017-07-28 | 哈尔滨工业大学 | 基于分离式日志的多核处理器瞬时故障恢复系统及其瞬时故障恢复方法 |
US9990245B2 (en) * | 2015-11-25 | 2018-06-05 | Stmicroelectronics S.R.L. | Electronic device having fault monitoring for a memory and associated methods |
-
2015
- 2015-11-25 US US14/951,639 patent/US9990245B2/en active Active
-
2016
- 2016-06-23 CN CN201610466671.6A patent/CN106803429B/zh active Active
- 2016-06-23 CN CN201620634069.4U patent/CN205881469U/zh active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803429A (zh) * | 2015-11-25 | 2017-06-06 | 意法半导体国际有限公司 | 具有用于存储器的故障监测的电子设备及相关联的方法 |
CN106803429B (zh) * | 2015-11-25 | 2021-03-09 | 意法半导体国际有限公司 | 具有用于存储器的故障监测的电子设备及相关联的方法 |
WO2019061517A1 (zh) * | 2017-09-30 | 2019-04-04 | 华为技术有限公司 | 内存故障的检测方法、装置和服务器 |
US11119874B2 (en) | 2017-09-30 | 2021-09-14 | Huawei Technologies Co., Ltd. | Memory fault detection |
Also Published As
Publication number | Publication date |
---|---|
CN106803429A (zh) | 2017-06-06 |
CN106803429B (zh) | 2021-03-09 |
US9990245B2 (en) | 2018-06-05 |
US20170147416A1 (en) | 2017-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN205881469U (zh) | 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备 | |
US7971112B2 (en) | Memory diagnosis method | |
CN105843699B (zh) | 用于错误监视与校正的动态随机存取存储器设备与方法 | |
CN103703447B (zh) | Mram场的干扰检测和恢复 | |
CN102904685B (zh) | 一种硬件表项校验错误的处理方法及装置 | |
WO2017215377A1 (zh) | 内存硬错误的处理方法及装置 | |
US8572444B2 (en) | Memory apparatus and testing method thereof | |
CN104579313B (zh) | 一种基于配置帧的在轨sram型fpga故障检测与修复方法 | |
CN108573007A (zh) | 检测数据一致性的方法、装置、电子设备及存储介质 | |
CN106021014A (zh) | 一种内存管理方法及装置 | |
TW201301291A (zh) | 出錯記憶體定位系統及方法 | |
KR102131230B1 (ko) | 파워트레인 제어기의 램 에러 감지 로직의 자가진단 방법 및 장치 | |
CN102981925A (zh) | 应用于通讯设备的寄存器巡检校验控制方法 | |
CN113742123A (zh) | 内存故障信息记录方法及设备 | |
JP5545771B2 (ja) | 診断装置、診断方法および診断プログラム診断方法 | |
US20140201252A1 (en) | Method and apparatus for testing a random number generator tester | |
US10613918B2 (en) | Data register monitoring | |
CN101271419B (zh) | 随机存储器失效的检测处理方法、装置和系统 | |
CN113625957B (zh) | 一种硬盘故障的检测方法、装置及设备 | |
JP2008027284A (ja) | 障害処理システム、障害処理方法、障害処理装置およびプログラム | |
CN109003643A (zh) | 一种数据处理方法及装置 | |
CN113917385A (zh) | 一种面向电能表的自检测方法及系统 | |
CN111352754A (zh) | 一种数据存储检错纠错方法及数据存储装置 | |
CN111188782A (zh) | 一种风扇冗余测试方法、装置和计算机可读存储介质 | |
TWI607455B (zh) | 記憶體資料檢測方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GR01 | Patent grant |