CN205881469U - 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备 - Google Patents

电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备 Download PDF

Info

Publication number
CN205881469U
CN205881469U CN201620634069.4U CN201620634069U CN205881469U CN 205881469 U CN205881469 U CN 205881469U CN 201620634069 U CN201620634069 U CN 201620634069U CN 205881469 U CN205881469 U CN 205881469U
Authority
CN
China
Prior art keywords
fault
permanent
memorizer
mapping
signature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201620634069.4U
Other languages
English (en)
Inventor
O·兰简
F·E·C·迪塞格尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STMicroelectronics SRL
STMicroelectronics International NV
Original Assignee
STMicroelectronics SRL
STMicroelectronics International NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STMicroelectronics SRL, STMicroelectronics International NV filed Critical STMicroelectronics SRL
Application granted granted Critical
Publication of CN205881469U publication Critical patent/CN205881469U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/12Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
    • G11C29/38Response verification devices
    • G11C29/42Response verification devices using error correcting codes [ECC] or parity check
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/073Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1004Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/12Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
    • G11C29/44Indication or identification of errors, e.g. for repair
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1833Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information
    • G11B2020/1843Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information using a cyclic redundancy check [CRC]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/02Detection or location of defective auxiliary circuits, e.g. defective refresh counters
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals

Abstract

本公开内容提供了电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备。一种电子设备,该电子设备包括具有经受瞬态故障和永久故障的多个存储器位置的存储器以及耦接于该存储器的故障检测电路。该故障检测电路被配置成用于:在第一时间读取这些存储器位置,并且在该第一时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第一故障计数和故障映射签名,并且存储该第一故障计数和故障映射签名。该故障检测电路被配置成用于:在第二时间读取这些存储器位置,并且在该第二时间基于读取这些存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名,并且将该存储的第一故障计数和故障映射签名与该第二故障计数和故障映射签名进行比较以确定永久故障计数。

Description

电子设备和用于具有经受瞬态故障和永久故障的多个存储器 位置的存储器的故障检测设备
技术领域
本实用新型涉及存储器的领域,并且更具体而言,涉及在存储器中的高效的故障监测。
背景技术
在被突然地中断之前,应用可以容忍某种程度上的存储器故障。在执行应用期间可能发生永久故障和瞬态故障。永久故障通常被定义为永久的并且当应用关闭时不消失的故障。永久故障通常是由存储器的物理缺陷导致的。瞬态故障是在执行应用期间发生的并且当应用关闭时消失的故障。瞬态故障通常是在存储器没有物理缺陷的情况下由数据值的改变导致的,并且可以由于环境条件而发生。
通常,瞬态故障比永久故障发生得更加频繁得多并且是存储器在使用周期之上使故障显现的结果。在存在纠错机制的情况下,应用可能需要了解这类故障的范围以评估存储器的物理缺陷的严重性。例如,一个应用可以用于在汽车上使用的存储器。
实用新型内容
一种电子设备可以包括具有经受瞬态故障和永久故障的多个存储器位置的存储器以及耦接于该存储器的故障检测电路。该故障检测电路可以被配置成用于:在第一时间读取该多个存储器位置,并且在该第一时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第一故障计数和故障映射签名,并且存储该第一故障计数和故障映射签名。该故障检测电路还可以:在第二时间读取该多个存储器位置,并且在该第二时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名,并且将该存储的第一故障计数和故障映射签名与该第二故障计数和故障映射签名进行比较以确定永久故障计数。因此,该故障检测电路可以在存储器中检测故障的范围,如在故障达到应用被突然地中断的阈值点之前。
故障检测设备还可以包括用于基于永久故障计数超过阈值而生成指示的指示器电路。此外,故障检测电路可以包括被配置成用于读取该多个存储器位置的存储器控制器以及耦接于存储器控制器的存储器错误处置器。存储器控制器可以包括循环冗余校验(CRC)电路和错误计数器,该CRC电路被配置成用于检测瞬态和永久故障,而该错误计数器耦接于该CRC电路并且被配置成用于确定瞬态和永久故障的第一和第二计数。
故障检测电路可以进一步包括处理器,该处理器耦接于CRC电路和错误计数器以将存储的第一故障计数和故障映射签名与第二故障计数和故障映射签名进行比较从而基于存储的第一故障计数和故障映射签名与第二故障计数和故障映射签名之间的改变确定永久故障计数。存储器控制器可以被配置成用于在存储器内的不同块之上以三重复制存储第一故障计数和故障映射签名以及永久故障计数并且CRC电路可以被配置成用于从每个瞬态和永久故障计算故障映射签名。
用于确定故障计数和故障映射签名的第一时间可以对应于存储器的掉电事件而第二时间可以是存储器的上电事件,其中,每个瞬态和永久故障可以具有与其相关联的存储器地址和校正子。此外,每个瞬态故障可以是单比特或双比特可校正的错误,而每个永久故障可以是三比特不可校正的错误。存储器可以是非易失性存储器。
根据本公开的实施方式,提供了一种电子设备,其特征在于包括:存储器,所述存储器具有经受瞬态故障和永久故障的多个存储器位置;以及故障检测电路,所述故障检测电路耦接于所述存储器并且被配置成用于:在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,存储所述第一故障计数和故障映射签名,在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
可选地,所述故障检测电路进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
可选地,所述故障检测电路包括:存储器控制器,所述存储器控制器被配置成用于读取所述多个存储器位置;以及存储器错误处置器,所述存储器错误处置器耦接于所述存储器控制器。
可选地,所述存储器控制器包括:循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
可选地,所述故障检测电路进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
可选地,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
可选地,所述循环冗余校验电路被配置成用于针对每个瞬态和永久故障计算渐进式签名。
可选地,所述第一时间包括所述存储器的掉电事件。
可选地,所述第二时间包括所述存储器的上电事件。
可选地,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
可选地,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
可选地,所述存储器包括非易失性存储器。
根据本公开的实施方式,还提供了一种用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备,其特征在于所述故障检测设备包括:存储器控制器和与其协同操作的存储器错误处置器,并且被配置成用于:在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,存储所述第一故障计数和故障映射签名,在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
可选地,该故障检测设备进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
可选地,所述存储器控制器包括:循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
可选地,该故障检测设备进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
可选地,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
可选地,所述循环冗余校验电路被配置成用于从每个瞬态和永久故障计算故障映射签名。
可选地,所述第一时间包括所述存储器的掉电事件。
可选地,所述第二时间包括所述存储器的上电事件。
可选地,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
可选地,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
附图说明
图1是根据本实用新型的实施例的电子设备的框图;
图2是图1的电子设备的更详细的框图;并且
图3是根据本实用新型的实施例的一种监测故障的方法的流程图。
具体实施方式
现在将参照附图在下文中更为全面地描述本实用新型,在附图中示出了本实用新型的优选实施例。然而,本实用新型可以用许多不同的形式来体现,并且不应当被解释为限于在此所列出的实施例。相反,提供了这些实施例从而使得本披露将是全面和完整的,并且将向本领域技术人员完全传达本实用新型的范围。贯穿全文相似的数字指代相似的元件,并且上撇号符号用于指示在替代实施例中的类似元件。
首先参照图1,电子设备100被展示具有耦接于存储器104的故障检测电路102。存储器104可以具有经受瞬态故障和永久故障的多个存储器位置。故障检测电路102可以被配置成用于在第一时间(例如,掉电)处读取存储器104并且在该第一时间处基于读取存储器104确定包括这些瞬态和永久故障的第一故障计数和故障映射签名。存储第一故障计数和故障映射签名。在具体实施例中,还可以在第二时间(例如,上电)处读取存储器104并且在该第二时间处基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名。故障检测电路102可以将对应于掉电事件的存储的第一故障计数和故障映射签名与对应于上电事件的第二故障计数和故障映射签名进行比较以确定永久故障计数。
电子设备100能够在启动(例如,上电)时并且在关机(例如,掉电)之前管理并读取存储器102、将故障信息存储在可检索的位置中、对存储的故障信息和最近的测试执行评估、并且读取结果从而评估永久和瞬态故障的范围。
如以上所解释的,读取存储器104(例如,闪存或其他非易失性存储器)并且可以在测试期间检测可校正的错误。例如,可校正的错误可以是单比特、双比特或三比特的。对应于每种类型的可校正的错误的地址和校正子可以用于计算对应的可校正的错误的唯一签名。
此外,在存储器104中每种类型的可校正的错误的数量由故障检测电路102计数。此计数可以与上一次上电和掉电测试的存储的计数结果进行比较并且可以相应地关于每种类型的永久和瞬态故障更新这些记录。
例如,在上电时未被检测到但在上一次掉电时被检测到的可校正的错误被认为是瞬态故障,而在上电和掉电时都被检测到的可校正的错误被认为是永久故障。每种类型的可校正的错误的签名和计数被存储在存储器104(例如,数据闪存)内部并且可以由分布在不同的存储块之上的三重复制和纠错方案保护。
现在参照图2,故障检测电路102可以包括存储器控制器106。存储器控制器可以被配置成用于读取存储器104的多个存储器位置。存储器控制器106耦接于系统/测试总线104。如将由本领域技术人员认识到的是,存储器控制器106还可以具有循环冗余校验(CRC)108,该CRC被配置成用于检测瞬态和永久故障。CRC 108还可以针对每个瞬态和永久故障使用对应可校正的错误的地址和校正子计算签名。
存储器控制器106的错误计数器110可以用于确定瞬态和永久故障的第一和第二计数。存储器控制器106可以包括处理器112,该处理器可以用软件编程或者可以是专用集成电路(ASIC)。例如,存储器控制器106的处理器112可以被配置成用于将第一故障计数和故障映射签名与第二故障计数和故障映射签名进行比较以基于对应于掉电事件的第一故障计数和故障映射签名与对应于上电事件的第二故障计数和故障映射签名之间的改变确定永久故障计数。在特定实施例中,每个瞬态故障可以例如被定义为单比特或双比特可校正的错误,而每个永久故障可以例如被定义为三比特不可校正的错误。可校正的错误比特计数基于纠错方案是可扩展的。
故障检测电路102的存储器错误处置器114可以耦接于存储器104并且被配置成用于接收永久和瞬态故障。存储器错误处置器114可以被配置成用于存储(n)个可校正的和(m)个不可校正的错误。尽管安全和高保险系统可以实现用于在电子设备100的寿命期间处置错误的纠错方案,在故障达到应用116被突然地中断的临界点之前故障在存储器104中的范围现在可以由故障检测电路102指示。
例如,如将由本领域技术人员认识到的是,纠错方案可以校正多达(x)个比特。存储器错误处置器114接收所有错误指示,即,具有相应的地址和校正子的可校正的和不可校正的错误。存储器错误处置器114可以存储最多(n)个可校正的和(m)个不可校正的错误。将多达(x-1)个比特校正的可校正的错误转发至存储器错误处置器114可以由寄存器掩模,实现针对在存储器控制器106内部的随机/瞬态故障的保护方案。例如,单比特错误可以被掩模为不重要的。
在存储器104的启动测试之后,将针对每种类型的可校正的错误的由CRC 108计算的签名和错误计数器110的计数与之前存储的记录进行比较以检测每种类型的可校正的错误的数量中的任何改变。针对每种类型的可校正的错误的计数的增加可以指示应用116可能更近乎被突然地中断。故障检测电路进一步包括耦接于处理器112以基于永久故障计数超过阈值而生成指示的指示器电路或指示器118。
如以上所解释的,在正常操作期间,可校正的错误掩模(CE-MASK)可以活跃的并且阻止将特定的可校正的错误(单比特)转发至存储器错误处置器114。出于用于诊断失效的调试目的,CE-MASK可以被取消激活。
直到没有(x)比特可校正的错误被报告时,针对(x-1)比特或更少比特的校正不被故障检测电路102(可配置的)考虑在内。在第一个(x)比特校正被报告后,在每次上电时执行测试,其中,存储器104的所有位置被读取并且错误的签名由CRC 108计算连同由错误计数器110执行对每个可校正的错误的计数。在运行时期间,瞬态(x-1)比特可校正的错误不被报告给存储器控制器106。
在硬件/软件控制之下在不同的闪存块之上分布的存储器104(例如,数据闪存)中以三重复制存储针对每种类型的错误的签名和计数。
在每次测试之后,将针对每种类型的可校正的错误(单比特、双比特、三比特……)的计算的签名和计数与之前存储的计数(例如,来自上电或掉电)进行比较以检测每种类型的可校正的错误的数量中的任何改变并且记录因此针对瞬态和永久类型的故障被更新。在掉电时,存储器104被再次读取并且每个可校正的错误的签名和错误计数可以被存储。因此,在从之前的上电事件到掉电事件处可校正的错误没有改变指示没有附加的瞬态故障。如果在从上一次掉电事件到下一个上电事件处可校正的错误的计数没有改变,那么没有附加的永久故障被检测到。
在正常操作期间,单错误校正掩模(SEC-MASK)可以是活跃的并且阻止将SEC事件转发至存储器错误处置器114。出于用于诊断失效的调试目的,SEC-MASK可以被取消激活。
现在参照图3,现在描述并且总体上指定一种监测存储器中的故障的方法200的流程图。以上所描述的故障检测电路102可以实现方法200。例如,在202在第一时间读取多个存储器位置,并且在204在第一时间(例如,对应于掉电事件)并且基于读取该多个存储器位置确定包括瞬态和永久故障的第一故障计数。移至206,在存储器内的不同存储器块之上以三重复制存储永久和瞬态故障的第一故障计数和故障映射签名。
在208在第二时间处读取该多个存储器位置并且在210在该第二时间(例如,对应于上电事件)处基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名。在212,将存储的第一故障计数和故障映射签名(例如,对应于掉电事件)与第二故障计数和故障映射签名(例如,对应于上电事件)进行比较以确定永久故障计数。在214,基于永久故障计数超过阈值而生成指示。在216,可以在存储器中的不同块之上以三重复制存储第二故障计数和故障映射签名。在204,该方法可以通过再次读取存储器位置并且重复以上所描述的处理而继续监测永久和瞬态故障。
本实用新型的许多修改和其他实施例对于受益于前面的描述和相关附图中呈现的教导的本领域技术人员来说将是显而易见的。因此,应当理解本实用新型不限于所披露的具体实施例,并且那些修改及实施例旨在被包括于所附权利要求书的范围内。

Claims (22)

1.一种电子设备,其特征在于包括:
存储器,所述存储器具有经受瞬态故障和永久故障的多个存储器位置;以及
故障检测电路,所述故障检测电路耦接于所述存储器并且被配置成用于
在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,
存储所述第一故障计数和故障映射签名,
在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且
将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
2.如权利要求1所述的电子设备,其特征在于,所述故障检测电路进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
3.如权利要求1所述的电子设备,其特征在于,所述故障检测电路包括:
存储器控制器,所述存储器控制器被配置成用于读取所述多个存储器位置;以及
存储器错误处置器,所述存储器错误处置器耦接于所述存储器控制器。
4.如权利要求3所述的电子设备,其特征在于,所述存储器控制器包括:
循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及
错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
5.如权利要求4所述的电子设备,其特征在于,所述故障检测电路进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
6.如权利要求3所述的电子设备,其特征在于,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
7.如权利要求4所述的电子设备,其特征在于,所述循环冗余校验电路被配置成用于针对每个瞬态和永久故障计算渐进式签名。
8.如权利要求1所述的电子设备,其特征在于,所述第一时间包括所述存储器的掉电事件。
9.如权利要求1所述的电子设备,其特征在于,所述第二时间包括所述存储器的上电事件。
10.如权利要求1所述的电子设备,其特征在于,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
11.如权利要求1所述的电子设备,其特征在于,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
12.如权利要求1所述的电子设备,其特征在于,所述存储器包括非易失性存储器。
13.一种用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备,其特征在于所述故障检测设备包括:
存储器控制器和与其协同操作的存储器错误处置器,并且被配置成用于
在第一时间读取所述多个存储器位置并且在所述第一时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第一故障计数和故障映射签名,
存储所述第一故障计数和故障映射签名,
在第二时间读取所述多个存储器位置并且在所述第二时间基于读取所述多个存储器位置确定包括所述瞬态和永久故障的第二故障计数和故障映射签名,并且
将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较以确定永久故障计数。
14.如权利要求13所述的故障检测设备,其特征在于进一步包括指示器,所述指示器被配置成用于基于所述永久故障计数超过阈值而生成指示。
15.如权利要求13所述的故障检测设备,其特征在于,所述存储器控制器包括:
循环冗余校验电路,所述循环冗余校验电路被配置成用于检测所述瞬态和永久故障;以及
错误计数器,所述错误计数器耦接于所述循环冗余校验电路并且被配置成用于确定所述瞬态和永久故障的所述第一和第二计数。
16.如权利要求15所述的故障检测设备,其特征在于进一步包括处理器,所述处理器耦接于所述循环冗余校验电路和所述错误计数器以将所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名进行比较从而基于所述存储的第一故障计数和故障映射签名与所述第二故障计数和故障映射签名之间的改变确定所述永久故障计数。
17.如权利要求13所述的故障检测设备,其特征在于,所述存储器控制器被配置成用于在所述存储器内的不同块之上以三重复制存储所述第一故障计数和故障映射签名以及所述永久故障计数。
18.如权利要求15所述的故障检测设备,其特征在于,所述循环冗余校验电路被配置成用于从每个瞬态和永久故障计算故障映射签名。
19.如权利要求13所述的故障检测设备,其特征在于,所述第一时间包括所述存储器的掉电事件。
20.如权利要求13所述的故障检测设备,其特征在于,所述第二时间包括所述存储器的上电事件。
21.如权利要求13所述的故障检测设备,其特征在于,每个瞬态和永久故障具有与其相关联的存储器地址和校正子。
22.如权利要求13所述的故障检测设备,其特征在于,每个瞬态故障包括单比特或双比特可校正的错误,而每个永久故障包括三比特不可校正的错误。
CN201620634069.4U 2015-11-25 2016-06-23 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备 Active CN205881469U (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/951,639 2015-11-25
US14/951,639 US9990245B2 (en) 2015-11-25 2015-11-25 Electronic device having fault monitoring for a memory and associated methods

Publications (1)

Publication Number Publication Date
CN205881469U true CN205881469U (zh) 2017-01-11

Family

ID=57691933

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610466671.6A Active CN106803429B (zh) 2015-11-25 2016-06-23 具有用于存储器的故障监测的电子设备及相关联的方法
CN201620634069.4U Active CN205881469U (zh) 2015-11-25 2016-06-23 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610466671.6A Active CN106803429B (zh) 2015-11-25 2016-06-23 具有用于存储器的故障监测的电子设备及相关联的方法

Country Status (2)

Country Link
US (1) US9990245B2 (zh)
CN (2) CN106803429B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803429A (zh) * 2015-11-25 2017-06-06 意法半导体国际有限公司 具有用于存储器的故障监测的电子设备及相关联的方法
WO2019061517A1 (zh) * 2017-09-30 2019-04-04 华为技术有限公司 内存故障的检测方法、装置和服务器

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102259928B1 (ko) * 2017-06-26 2021-06-03 에스케이하이닉스 주식회사 오류 관리 시스템 및 이를 포함하는 데이터 처리 시스템
US10528422B2 (en) * 2017-11-13 2020-01-07 Stmicroelectronics International N.V. Redundant storage of error correction code (ECC) checkbits for validating proper operation of a static random access memory (SRAM)
IT201800000632A1 (it) * 2018-01-09 2019-07-09 St Microelectronics Srl Dispositivo per commutare tra diverse modalita' di lettura di una memoria non volatile e metodo di lettura di una memoria non volatile
US10705901B2 (en) * 2018-02-23 2020-07-07 Dell Products, L.P. System and method to control memory failure handling on double-data rate dual in-line memory modules via suspension of the collection of correctable read errors
US10761919B2 (en) 2018-02-23 2020-09-01 Dell Products, L.P. System and method to control memory failure handling on double-data rate dual in-line memory modules
US11468962B2 (en) * 2021-03-03 2022-10-11 Micron Technology, Inc. Performing memory testing using error correction code values
US20230368859A1 (en) * 2022-05-11 2023-11-16 Nxp Usa, Inc. Testing disruptive memories

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4535455A (en) * 1983-03-11 1985-08-13 At&T Bell Laboratories Correction and monitoring of transient errors in a memory system
US4875209A (en) * 1988-04-04 1989-10-17 Raytheon Company Transient and intermittent fault insertion
US5031180A (en) 1989-04-11 1991-07-09 Trw Inc. Triple redundant fault-tolerant register
JP3272903B2 (ja) * 1995-03-16 2002-04-08 株式会社東芝 誤り訂正検出回路と半導体記憶装置
US5905858A (en) 1996-11-01 1999-05-18 Micron Electronics, Inc. System for method memory error handling
US6119248A (en) 1998-01-26 2000-09-12 Dell Usa L.P. Operating system notification of correctable error in computer information
US7107501B2 (en) * 2002-05-31 2006-09-12 Infineon Technologies Ag Test device, test system and method for testing a memory circuit
DE102004037713A1 (de) * 2004-08-04 2006-03-16 Robert Bosch Gmbh Verfahren, Betriebssystem und Rechengerät zum Abarbeiten eines Computerprogramms
US7420791B1 (en) 2004-08-09 2008-09-02 Intersil Americas Inc. Fault signature system for power management integrated circuits
US20060190700A1 (en) * 2005-02-22 2006-08-24 International Business Machines Corporation Handling permanent and transient errors using a SIMD unit
US7430145B2 (en) * 2005-09-16 2008-09-30 Hewlett-Packard Development Company, L.P. System and method for avoiding attempts to access a defective portion of memory
US8001446B2 (en) 2007-03-26 2011-08-16 Intel Corporation Pipelined cyclic redundancy check (CRC)
US8299768B2 (en) * 2008-11-20 2012-10-30 Intersil Americas Inc. PWM voltage converter with redundancy and feedback adjustment
US7987407B2 (en) * 2009-08-20 2011-07-26 Arm Limited Handling of hard errors in a cache of a data processing apparatus
FR2961613B1 (fr) * 2010-06-18 2012-07-27 Commissariat Energie Atomique Procede de protection memoire configurable contre les erreurs permanentes et transitoires et dispositif apparente
DE102010031282B4 (de) * 2010-07-13 2022-05-12 Robert Bosch Gmbh Verfahren zum Überwachen eines Datenspeichers
KR101991900B1 (ko) * 2013-03-13 2019-06-24 삼성전자주식회사 메모리 장치의 동작 방법, 이를 이용한 메모리 장치 및 이를 포함하는 메모리 시스템
US9323607B2 (en) * 2014-04-29 2016-04-26 Seagate Technology Llc Data recovery once ECC fails to correct the data
CN104657239B (zh) * 2015-03-19 2017-07-28 哈尔滨工业大学 基于分离式日志的多核处理器瞬时故障恢复系统及其瞬时故障恢复方法
US9990245B2 (en) * 2015-11-25 2018-06-05 Stmicroelectronics S.R.L. Electronic device having fault monitoring for a memory and associated methods

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803429A (zh) * 2015-11-25 2017-06-06 意法半导体国际有限公司 具有用于存储器的故障监测的电子设备及相关联的方法
CN106803429B (zh) * 2015-11-25 2021-03-09 意法半导体国际有限公司 具有用于存储器的故障监测的电子设备及相关联的方法
WO2019061517A1 (zh) * 2017-09-30 2019-04-04 华为技术有限公司 内存故障的检测方法、装置和服务器
US11119874B2 (en) 2017-09-30 2021-09-14 Huawei Technologies Co., Ltd. Memory fault detection

Also Published As

Publication number Publication date
CN106803429A (zh) 2017-06-06
CN106803429B (zh) 2021-03-09
US9990245B2 (en) 2018-06-05
US20170147416A1 (en) 2017-05-25

Similar Documents

Publication Publication Date Title
CN205881469U (zh) 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备
US7971112B2 (en) Memory diagnosis method
CN105843699B (zh) 用于错误监视与校正的动态随机存取存储器设备与方法
CN103703447B (zh) Mram场的干扰检测和恢复
CN102904685B (zh) 一种硬件表项校验错误的处理方法及装置
WO2017215377A1 (zh) 内存硬错误的处理方法及装置
US8572444B2 (en) Memory apparatus and testing method thereof
CN104579313B (zh) 一种基于配置帧的在轨sram型fpga故障检测与修复方法
CN108573007A (zh) 检测数据一致性的方法、装置、电子设备及存储介质
CN106021014A (zh) 一种内存管理方法及装置
TW201301291A (zh) 出錯記憶體定位系統及方法
KR102131230B1 (ko) 파워트레인 제어기의 램 에러 감지 로직의 자가진단 방법 및 장치
CN102981925A (zh) 应用于通讯设备的寄存器巡检校验控制方法
CN113742123A (zh) 内存故障信息记录方法及设备
JP5545771B2 (ja) 診断装置、診断方法および診断プログラム診断方法
US20140201252A1 (en) Method and apparatus for testing a random number generator tester
US10613918B2 (en) Data register monitoring
CN101271419B (zh) 随机存储器失效的检测处理方法、装置和系统
CN113625957B (zh) 一种硬盘故障的检测方法、装置及设备
JP2008027284A (ja) 障害処理システム、障害処理方法、障害処理装置およびプログラム
CN109003643A (zh) 一种数据处理方法及装置
CN113917385A (zh) 一种面向电能表的自检测方法及系统
CN111352754A (zh) 一种数据存储检错纠错方法及数据存储装置
CN111188782A (zh) 一种风扇冗余测试方法、装置和计算机可读存储介质
TWI607455B (zh) 記憶體資料檢測方法

Legal Events

Date Code Title Description
GR01 Patent grant