CN103745751A - 一种故障告警方法与装置 - Google Patents

一种故障告警方法与装置 Download PDF

Info

Publication number
CN103745751A
CN103745751A CN201310719925.7A CN201310719925A CN103745751A CN 103745751 A CN103745751 A CN 103745751A CN 201310719925 A CN201310719925 A CN 201310719925A CN 103745751 A CN103745751 A CN 103745751A
Authority
CN
China
Prior art keywords
fault
fault point
fisrt
trouble spot
fisrt fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310719925.7A
Other languages
English (en)
Other versions
CN103745751B (zh
Inventor
惠卫锋
朱小刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310719925.7A priority Critical patent/CN103745751B/zh
Publication of CN103745751A publication Critical patent/CN103745751A/zh
Application granted granted Critical
Publication of CN103745751B publication Critical patent/CN103745751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明实施例公开了一种故障告警方法与装置,涉及电子信息技术领域,能够区分故障点的故障类型,避免不必要的硬件更换,减少了维护设备花费的维护成本。本发明的方法包括:当存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息;根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果;判断测试结果与预设的正确结果是否相同;若相同,则判定第一故障点的故障类型为软失效故障;若不同,则判定第一故障点的故障类型为硬失效故障;输出判定得到的第一故障点的故障类型。本发明适用于检测到故障后,区分故障类型并发布告警的场景中。

Description

一种故障告警方法与装置
技术领域
本发明涉及电子信息技术领域,尤其涉及一种故障告警方法与装置。
背景技术
在电子信息技术领域,RAM(Random Access Memory,随机存储记忆体)得到了大规模应用,但是在使用RAM的过程中,往往会出现一些故障,为了能够快速的找到故障并排除,现有技术使用故障告警系统,故障告警系统会根据存储单元在设备中的重要性,设定存储单元发生故障时故障的等级,当系统检测到设备中某个存储单元出现故障时,会根据预先设定的故障等级,向维护人员或用户发布包含故障等级的告警信息,使得维护人员可以根据故障等级对设备进行相应的维护处理。
其中,RAM的故障分为硬失效故障和软失效故障,硬失效故障是由于设备的存储单元或部件内部发生了不可恢复的物理失效,必须更换硬件才可以消除故障;而软失效故障是由于自由电荷聚集在电路节点中,引起了存储数据的改变,不需要更换硬件,通过数据刷新等方法就可以解决故障。
然而,在现有技术的故障告警系统中,维护人员或用户从故障告警系统发布的告警信息得到的是故障等级,但同一故障等级的故障往往会有软失效、硬失效故障的分别,且软失效、硬失效故障的维护处理方法也不同,导致维护人员或用户不能针对性的对故障进行处理,将所有故障当作硬失效故障,更换发生故障的硬件,对于软失效故障,只要故障等级与需要更换硬件的硬失效故障相同,也需要更换硬件,从而增加了大量的维护成本。
发明内容
本发明的实施例提供一种故障告警方法与装置,能够区分故障点的故障类型,避免不必要的硬件更换,减少了维护设备花费的维护成本。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种故障告警方法,包括:
当所述存储设备发生故障时确定第一故障点,并获取所述第一故障点的地址信息;
根据存储单元失效检测规则将校验数据写入到所述第一故障点的地址信息,得到测试结果;
判断所述测试结果与预设的正确结果是否相同;若相同,则判定所述第一故障点的故障类型为软失效故障;若不同,则判定所述第一故障点的故障类型为硬失效故障;
输出判定得到的所述第一故障点的故障类型。
结合第一方面,在第一种可能的实现方式中,所述存储设备为高速缓冲存储器cache;所述地址信息为所述第一故障点所在的缓存线cacheline对应的地址范围。
结合第一方面,在第二种可能的实现方式中,所述存储设备为闪存器flash;所述地址信息为所述第一故障点所在的块对应的地址范围。
结合第一方面,在第三种可能的实现方式中,所述方法还包括:
在判定所述第一故障点的故障类型为软失效故障之后,记录所述第一故障点再次出现软失效故障的次数,当所述次数超过阈值时,判定所述第一故障点的故障类型为硬失效故障。
结合第一方面和第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述方法还包括:
获取第二故障点,检测所述第二故障点与所述第一故障点是否存在配置相关性和时间相关性,所述第二故障点发生的故障伴生于所述第一故障点发生的故障,所述第二故障点的位置包括所述第一故障点所在的所述存储设备,或者与所述第一故障点所在的所述存储设备不同的硬件设备;
若存在所述配置相关性和所述时间相关性中的任意一项,则对所述第二故障点的故障进行自愈;
若不存在所述配置相关性,也不存在所述时间相关性,则发布告警信息,所述告警信息用于表示所述第二故障点的位置。
结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述检测所述第二故障点与所述第一故障点是否存在配置相关性包括:
检测所述第二故障点与发生软失效故障的所述第一故障点的配置信息是否部分相同或完全相同;
若部分相同或完全相同,则所述第二故障点与发生软失效故障的所述第一故障点存在配置相关性;
所述检测所述第二故障点与所述第一故障点是否存在时间相关性包括:
检测所述第二故障点的故障是否满足预设条件,所述预设条件包括:所述第二故障点的故障发生的时刻在所述第一故障点发生软失效故障的时刻之后;所述第二故障点的故障恢复的时刻在所述第一故障点的软失效故障恢复的时刻之后;
若满足所述预设条件,则所述第二故障点与发生软失效故障的所述第一故障点存在时间相关性。
第二方面,本发明实施例提供一种故障告警装置,包括:
获取模块,用于当所述存储设备发生故障时确定第一故障点,并获取所述第一故障点的地址信息;
测试模块,用于根据存储单元失效检测规则将校验数据写入到所述第一故障点的地址信息,得到测试结果;
判断模块,用于判断所述测试结果与预设的正确结果是否相同;若相同,则判定所述第一故障点的故障类型为软失效故障;若不同,则判定所述第一故障点的故障类型为硬失效故障;
发布模块,用于输出判定得到的所述第一故障点的故障类型。
结合第二方面,在第一种可能的实现方式中,所述存储设备为高速缓冲存储器cache;所述地址信息为所述第一故障点所在的缓存线cacheline对应的地址范围。
结合第二方面,在第二种可能的实现方式中,所述存储设备为闪存器flash;所述地址信息为所述第一故障点所在的块对应的地址范围。
结合第二方面,在第三种可能的实现方式中,所述装置还包括:
判定模块,用于在判定所述第一故障点的故障类型为软失效故障之后,记录所述第一故障点再次出现软失效故障的次数,当所述次数超过阈值时,判定所述第一故障点的故障类型为硬失效故障。
结合第二方面和第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述装置还包括:
检测模块,获取第二故障点,检测所述第二故障点与所述第一故障点是否存在配置相关性和时间相关性,所述第二故障点发生的故障伴生于所述第一故障点发生的故障,所述第二故障点的位置包括所述第一故障点所在的所述存储设备,或者与所述第一故障点所在的所述存储设备不同的硬件设备;
自愈模块,用于当存在所述配置相关性和所述时间相关性中的任意一项时,对所述第二故障点的故障进行自愈;
告警模块,用于当不存在所述配置相关性,也不存在所述时间相关性时,发布告警信息,所述告警信息用于表示所述第二故障点的位置。
结合第二方面的第四种可能的实现方式,在第五种可能的实现方式中,所述检测模块包括:
第一检测单元,用于检测所述第二故障点与发生软失效故障的所述第一故障点的配置信息是否部分相同或完全相同;
第一判定单元,用于当部分相同或完全相同时,判定所述第二故障点与发生软失效故障的所述第一故障点存在配置相关性;
第二检测单元,用于检测所述第二故障点的故障是否满足预设条件,所述预设条件包括:所述第二故障点的故障发生的时刻在所述第一故障点发生软失效故障的时刻之后;所述第二故障点的故障恢复的时刻在所述第一故障点的软失效故障恢复的时刻之后;
第二判定单元,用于当满足所述预设条件时,判定所述第二故障点与发生软失效故障的所述第一故障点存在时间相关性。
本发明实施例提供的一种故障告警方法与装置,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。与如图1a所示的现有技术相比,本方案如图1b所示,能够判定存储设备中故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1a为现有技术提供的一种故障告警方法的示意图;
图1b为本发明实施例提供的一种故障告警方法的示意图;
图2a为本发明实施例提供的一种故障告警方法的流程图;
图2b为本发明实施例提供的SRR1寄存器表格的举例示意图;
图3a、图3b为本发明实施例提供的一种故障告警方法的一种具体实现方式的流程图;
图4为本发明实施例提供的一种故障告警方法的另一种具体实现方式的流程图;
图5为本发明实施例提供的一种故障告警方法的又一种具体实现方式的流程图;
图6为本发明实施例提供的一种故障告警方法的再一种具体实现方式的流程图;
图7为本发明实施例提供的一种故障告警装置的结构示意图;
图8为本发明实施例提供的一种故障告警装置的一种具体实现方式的结构示意图;
图9为本发明实施例提供的一种故障告警装置的另一种具体实现方式的结构示意图;
图10为本发明实施例提供的一种故障告警装置的又一种具体实现方式的结构示意图;
图11为本发明实施例提供的一种故障告警系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供的技术方案应用于故障告警系统、,故障告警系统可以确定存储设备中的第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,测试结果,判断第一故障点的故障类型。在实际应用中,存储设备可以是内存、高速缓冲存储器(Cache)、数字处理器、逻辑类器件、以太网交换单元缓存等。
本发明实施例提供了一种故障告警方法,如图2a所示,包括:
101,当所述存储设备发生故障时确定第一故障点,并获取所述第一故障点的地址信息。
其中,在存储设备发生故障时,故障告警系统可以根据处理器状态寄存器的值,确定第一故障点所在的存储设备的类型,比如:在如图2b所示处理器的SRR1寄存器状态表格中,可以根据处理器SRR1寄存器比特位(Bits),则可以根据字段名称(Field Name)和描述(Description)确定对应的第一故障点所在的存储设备的类型。第一故障点可以是随机存储记忆体(RAM)中的存储单元,存储单元的大小可以等于RAM的最小存储单位,也可以等于多个共用同一个物理地址的最小存储单位之和,还可以等于多个物理地址对应的存储单位之和。
其中,地址信息可以是存储设备中的存储单元的物理地址,第一故障点所在的存储设备可以是内存、高速缓冲存储器(Cache)、数字处理器、逻辑类器件、以太网交换单元缓存等。第一故障点所在的存储设备的类型不同,获取第一故障点的地址信息的方法也不同,比如:
a、若第一故障点所在的存储设备为内存、以太网交换单元缓存等,则可以直接得到第一故障点所在的物理地址。
b、若第一故障点所在的存储设备为Cache,则需要根据Cache映射关系、处理器页表入口(PTE)表项等信息,得到第一故障点所在的缓存线cacheline对应的物理地址的范围。
c、若第一故障点所在的存储设备为闪存器(flash)、数字处理器等,则需要得到第一故障点所在的块的物理地址的范围。
其中,故障类型包括软失效故障和硬失效故障。软失效故障是由于自由电荷聚集在电路节点中,引起了存储数据的改变,不需要更换硬件,通过数据刷新等方法就能够解决;硬失效故障是由于设备的存储单元、其他功能性单元或部件内部发生了不可恢复的物理失效,需要更换硬件消除故障。
102,根据存储单元失效检测规则将校验数据写入到所述第一故障点的地址信息,得到测试结果。
其中,校验数据用于对第一故障点进行测试,存储单元失效检测规则可以是棋盘法、数据图案法等测试方法,测试结果为通过测试后从对应的地址读出的与检验数据对应的数据。
其中,102这一步骤可以在存储设备运行过程中进行,不必将第一故障点所在的存储单元从存储设备上拆卸下来再进行测试。
103,判断所述测试结果与预设的正确结果是否相同。
其中,预设的正确结果是在没有出现故障时通过测试后应该得到的正确的测试结果。
104,若相同,则判定所述第一故障点的故障类型为软失效故障。
其中,若测试结果与预设的正确结果相同,那么第一故障点的故障类型为软失效故障,比如:将校验数据写入第一故障点的地址信息,经过测试后,预设的正确结果是二进制字符串1000101001,最终得到的测试结果也是二进制字符串1000101001,则第一故障点的故障类型为软失效故障。
105,若不同,则判定所述第一故障点的故障类型为硬失效故障。
其中,若测试结果与预设的正确结果不同,那么第一故障点的故障类型为硬失效故障,比如:将校验数据写入第一故障点的地址信息,经过测试后,预设的正确结果是二进制字符串1000101001,最终得到的测试结果是二进制字符串1100101001,则第一故障点的故障类型为硬失效故障。
106,输出判定得到的所述第一故障点的故障类型。
其中,故障告警系统输出第一故障点的故障类型,同时,故障告警系统还可以给出提示信息,提示信息包括故障的解决方法。比如:当故障告警系统发布该故障类型为硬失效故障时,还可以发布提示信息,提示维护人员或用户更换第一故障点所在的硬件;当故障告警系统发布该故障类型为软失效故障时,还可以发布提示信息,提示维护人员或用户刷新数据,进行数据恢复。
本发明实施例提供的一种故障告警方法,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。与现有技术相比,本方案能够判定存储设备中故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本。
可选的,在图2a所示的方案的基础上,本发明实施例还提供了一种故障告警方法的具体方案,存储设备为cache,则101可以是101a,102可以是102a,如图3a所示,包括:
101a,当cache发生故障时确定第一故障点,并获取所述第一故障点所在的缓存线cacheline对应的地址范围。
其中,缓存线cacheline是cache的最小的不可再分的物理结构,根据cache映射关系,解析系统的PTE(Page Table Entry,页表)表项,得到第一故障点所在的cacheline,从而确定cacheline对应的地址范围。
102a,根据存储单元失效检测规则将校验数据写入到所述第一故障点所在的缓存线cacheline对应的地址范围,得到测试结果。
其中,具体过程与102相同,在此不再赘述。
本发明实施例提供的一种故障告警方法,能够在cache发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点所在的cacheline对应的地址范围,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。与现有技术相比,本方案能够判定存储设备中故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本。
可选的,在图2a所示的方案的基础上,本发明实施例还提供了一种故障告警方法的具体方案,存储设备为闪存器flash,则101可以是101b,102可以是102b,如图3b所示,包括:
101b,当闪存器flash发生故障时确定第一故障点,并获取所述第一故障点所在的块对应的地址范围。
其中,块是闪存器flash的最小的不可再分的物理结构,确定第一故障点所在的块,从而得到第一故障点所在的块对应的地址范围。
102b,根据存储单元失效检测规则将校验数据写入到所述第一故障点所在的块对应的地址范围,得到测试结果。
其中,具体过程与102相同,在此不再赘述。
本发明实施例提供的一种故障告警方法,能够在闪存器flash发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点所在的块对应的地址范围,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。与现有技术相比,本方案能够判定存储设备中故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本。
此外,在图2a所示的方案的基础上,本发明实施例还提供了一种故障告警方法的具体方案,通过增加107解决第一故障点多次出现软失效故障的问题,如图4所示,包括:
107,在判定所述第一故障点的故障类型为软失效故障之后,记录所述第一故障点再次出现软失效故障的次数,当所述次数超过阈值时,判定所述第一故障点的故障为硬失效故障。
其中,当第一故障点第一次发生软失效故障后,累积记录第一故障点再次发生软失效故障的次数,当次数超过设置的阈值时,判定第一故障点发生硬失效故障,比如:设置的阈值为20,当第一故障点发生软失效故障之后,第一故障点再次发生软失效故障的次数超过20次时,判定第一故障点发生硬失效故障。
本发明实施例提供的一种故障告警方法,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。当在第一故障点反复发生软失效故障,且发生软失效故障的次数超过设置的阈值时,判定第一故障点发生硬失效故障。与现有技术相比,本方案能够判定存储设备中故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,也可以更换反复发生软失效故障的硬件,减低设备运行过程中反复出现故障的概率。
此外,在图4所示的方案的基础上,本发明实施例还提供了一种故障告警方法的具体方案,当判定第一故障点的故障类型为软失效故障后,还可以通过增加108-110来判断其他故障与第一故障点的故障的相关性,并对应处理,如图5所示,包括:
108,获取第二故障点,检测所述第二故障点与所述第一故障点是否存在配置相关性和时间相关性。
其中,第二故障点发生的故障伴生于所述第一故障点发生的故障,第二故障点的位置包括第一故障点所在的存储设备,或者与第一故障点所在的存储设备不同的硬件设备。也就是说,第二故障点可以是与第一故障点所在的存储设备上不同的存储单元,也可以是存储设备所在的系统中的其他硬件设备上具有其他功能的单元,比如:通信单元或控制单元等。当系统检测到第一故障点发生软失效故障时,也可能检测到了其他故障点,如第二故障点、第三故障点等,此时,检测其他故障点是否与第一故障点存在配置相关性和时间相关性。
109,若存在所述配置相关性和所述时间相关性中的任意一项,则对所述第二故障点的故障进行自愈。
其中,若第二故障点与第一故障点存在配置相关性和时间相关性中的一项,或者第二故障点与第一故障点既存在配置相关性,又存在时间相关性,则故障告警系统会对第二故障点使用数据刷新等自愈方法解决第二故障点发生的故障,不会发布告警信息。
110,若不存在所述配置相关性,也不存在所述时间相关性,则发布告警信息。
其中,若第二故障点与第一故障点不存在配置相关性,也不存在时间相关性,则发布告警信息,告警信息用于表示第二故障点的位置,告警信息中也可以包括解决与解决第二故障点发生的故障的操作指导信息等。通过检测第二故障点与第一故障点是否存在配置相关性和时间相关性,来判断第二故障点发生的故障是否是由第一故障点发生的软失效故障引起的。
本发明实施例提供的一种故障告警方法,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。当检测到其他故障点时,通过判断其他故障点与发生软故障的第一故障点是否存在配置相关性和时间相关性,可以得知其他故障点发生的故障是否由第一故障点发生的软失效故障引起,如果是,故障告警系统可以对该故障进行自愈,避免使用花费时间较长的人工修复,提高了故障修复效率。与现有技术相比,本方案能够判定故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,也提高了故障修复效率。
进一步的,在图5所示的方案的基础上,本发明实施例还提供了一种故障告警方法的具体方案,对图5所示的方案中的108的执行过程进一步细化,其中,108具体细化为1081-1084,如图6所示,包括:
1081,检测所述第二故障点与发生软失效故障的所述第一故障点的配置信息是否部分相同或完全相同。
其中,配置信息包括框槽号、模块号、链路号等信息。
1082,若部分相同或完全相同,则所述第二故障点与发生软失效故障的所述第一故障点存在配置相关性。
其中,当第二故障点与发生软失效故障的第一故障点的配置信息部分相同时,判定第二故障点与发生软失效故障的第一故障点存在配置相关性,比如:配置信息包括框槽号、模块号、链路号,第二故障点的框槽号与第一故障点的框槽号相同,则判定第二故障点与第一故障点存在配置相关性。当第二故障点与发生软失效故障的第一故障点的配置信息完全相同时,判定第二故障点与发生软失效故障的第一故障点存在配置相关性,比如:配置信息包括框槽号和链路号,第二故障点的框槽号、链路号与第一故障点的全部相同,则判定第二故障点与第一故障点存在配置相关性。
其中,若第二故障点与发生软失效故障的第一故障点的配置信息完全不相同,则执行1083。
1083,检测所述第二故障点的故障是否满足预设条件。
其中,预设条件包括:第二故障点的故障发生的时刻在第一故障点发生软失效故障的时刻之后;第二故障点的故障恢复的时刻在第一故障点的软失效故障恢复的时刻之后。
1084,若满足预设条件,则所述第二故障点与发生软失效故障的所述第一故障点存在时间相关性。
其中,若第二故障点的故障只满足1083的预设条件中的一个条件,第二故障点与发生软失效故障的第一故障点不存在时间相关性,只有当第二故障点的故障满足所有预设条件时,才能够判定第二故障点与发生软失效故障的第一故障点存在时间相关性。
其中,若不满足预设条件,则发布告警信息,告警信息可以包括第二故障点的位置,也可以包括解决第二故障点的故障的操作指导。
可选的,在本方案中也可以先执行1083-1084,后执行1081-1082,只需要保证时间相关性的检测和配置相关性的检测先后进行即可;或者1083-1084和1081-1082的检测是并列关系,并没有固定的顺序关系,当进行过两次检测,且存在时间相关性和配置相关性中的至少一个时,故障告警系统不会发布第二故障点的告警信息,但会将第二故障点发生的故障记录为日志信息。
本发明实施例提供的一种故障告警方法,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。当检测到其他故障点时,通过判断其他故障点与发生软故障的第一故障点是否存在配置相关性和时间相关性,可以得知其他故障点发生的故障是否由第一故障点发生的软失效故障引起,如果是,故障告警系统可以对该故障进行自愈,避免使用花费时间较长的人工修复,提高了故障修复效率。与现有技术相比,本方案能够判定故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,也提高了故障修复效率。
本发明实施例提供了一种故障告警装置200,如图7所示,包括:
获取模块201,用于当所述存储设备发生故障时确定第一故障点,并获取所述第一故障点的地址信息。
可选的,存储设备为cache;地址信息为第一故障点所在的缓存线cacheline对应的地址范围。
可选的,存储设备为闪存器flash;地址信息为第一故障点所在的块对应的地址范围。
测试模块202,用于根据存储单元失效检测规则将校验数据写入到所述第一故障点的地址信息,得到测试结果。
判断模块203,用于判断所述测试结果与预设的正确结果是否相同;若相同,则判定所述第一故障点的故障类型为软失效故障;若不同,则判定所述第一故障点的故障类型为硬失效故障。
发布模块204,用于输出判定得到的所述第一故障点的故障类型。
本发明实施例提供的一种故障告警装置,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。与现有技术相比,本方案能够判定存储设备中故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,在设备运行过程中进行测试,避免了拆卸硬件的过程,减少了测试花费的时间,提高了测试效率。
进一步的,如图8所示,所述装置200,还包括:
判定模块205,用于在判定所述第一故障点的故障类型为软失效故障之后,记录所述第一故障点再次出现软失效故障的次数,当所述次数超过阈值时,判定所述第一故障点的故障类型为硬失效故障。
本发明实施例提供的一种故障告警装置,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。当在第一故障点反复发生软失效故障,且发生软失效故障的次数超过设置的阈值时,判定第一故障点发生硬失效故障。与现有技术相比,本方案能够判定存储设备中故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,也可以更换反复发生软失效故障的硬件,减低设备运行过程中反复出现故障的概率。
可选的,如图9所示,所述装置200,还包括:
检测模块206,用于获取第二故障点,检测所述第二故障点与所述第一故障点是否存在配置相关性和时间相关性。
其中,第二故障点发生的故障伴生于第一故障点发生的故障,第二故障点的位置包括第一故障点所在的存储设备,或者与第一故障点所在的存储设备不同的硬件设备。
自愈模块207,用于当存在所述配置相关性和所述时间相关性中的任意一项时,对所述第二故障点的故障进行自愈。
告警模块208,用于当不存在所述配置相关性,也不存在所述时间相关性时,发布告警信息。
其中,告警信息用于表示第二故障点的位置。
本发明实施例提供的一种故障告警装置,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。当检测到其他故障点时,通过判断其他故障点与发生软故障的第一故障点是否存在配置相关性和时间相关性,可以得知其他故障点发生的故障是否由第一故障点发生的软失效故障引起,如果是,故障告警系统可以对该故障进行自愈,避免使用花费时间较长的人工修复,提高了故障修复效率。与现有技术相比,本方案能够判定故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,也提高了故障修复效率。
进一步的,如图10所示,所述检测模块206,包括:
第一检测单元2061,用于检测所述第二故障点与发生软失效故障的所述第一故障点的配置信息是否部分相同或完全相同。
第一判定单元2062,用于当部分相同或完全相同时,判定所述第二故障点与发生软失效故障的所述第一故障点存在配置相关性。
第二检测单元2063,用于检测所述第二故障点的故障是否满足预设条件。
其中,预设条件包括:第二故障点的故障发生的时刻在第一故障点发生软失效故障的时刻之后;第二故障点的故障恢复的时刻在第一故障点的软失效故障恢复的时刻之后。
第二判定单元2064,用于当满足所述预设条件时,判定所述第二故障点与发生软失效故障的所述第一故障点存在时间相关性。
本发明实施例提供的一种故障告警装置,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。当检测到其他故障点时,通过判断其他故障点与发生软故障的第一故障点是否存在配置相关性和时间相关性,可以得知其他故障点发生的故障是否由第一故障点发生的软失效故障引起,如果是,故障告警系统可以对该故障进行自愈,避免使用花费时间较长的人工修复,提高了故障修复效率。与现有技术相比,本方案能够判定故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,也提高了故障修复效率。
本发明实施例提供了一种故障告警系统300,如图11所示,包括:至少一个处理器301,例如CPU,至少一个通信总线302,存储器303,至少一个网络接口304或者用户接口305。通信总线302用于实现这些组件之间的连接通信。可选的,用户接口305包括显示器、键盘、鼠标、触摸屏等设备。存储器303可能包含高速RAM存储器,也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
具体的,存储器303可以用于存储故障类型、第一故障点的地址信息,也可以用于存储存储单元失效检测规则、校验数据、预设的正确结果和测试结果,在第一故障点第一次出现软失效故障后,还可以用来存储第一故障点再次出现软失效故障的次数和设置的阈值,以及,还可以用来存储各个故障点的配置信息、各个故障点的故障发生的时刻和恢复的时刻。
进一步的,存储器303还可以用于存储第一故障点所在的缓存线cacheline对应的地址范围;还可以用来存储第一故障点所在的块对应的地址范围。
具体的,处理器301,用于当所述存储设备发生故障时确定第一故障点,并获取所述第一故障点的地址信息;以及,用于根据存储单元失效检测规则将校验数据写入到所述第一故障点的地址信息,得到测试结果;以及,用于判断所述测试结果与预设的正确结果是否相同;若相同,则判定所述第一故障点的故障类型为软失效故障;若不同,则判定所述第一故障点的故障类型为硬失效故障;以及,用于输出判定得到的所述第一故障点的故障类型。
可选的,所述存储设备为cache;所述地址信息为所述第一故障点所在的缓存线cacheline对应的地址范围。
可选的,所述存储设备为闪存器flash;所述地址信息为所述第一故障点所在的块对应的地址范围。
此外,处理器301还用于在判定所述第一故障点的故障类型为软失效故障之后,记录所述第一故障点再次出现软失效故障的次数,当所述次数超过阈值时,判定所述第一故障点的故障类型为硬失效故障。
此外,处理器301还用于获取第二故障点,检测所述第二故障点与所述第一故障点是否存在配置相关性和时间相关性,所述第二故障点发生的故障伴生于所述第一故障点发生的故障,所述第二故障点的位置包括所述第一故障点所在的所述存储设备,或者与所述第一故障点所在的所述存储设备不同的硬件设备;以及,用于当存在所述配置相关性和所述时间相关性中的任意一项时,对所述第二故障点的故障进行自愈;以及,用于当不存在所述配置相关性,也不存在所述时间相关性时,发布告警信息,所述告警信息用于表示所述第二故障点的位置。
进一步的,处理器301还用于检测所述第二故障点与发生软失效故障的所述第一故障点的配置信息是否部分相同或完全相同;以及,用于当部分相同或完全相同时,判定所述第二故障点与发生软失效故障的所述第一故障点存在配置相关性;以及用于检测所述第二故障点的故障是否满足预设条件,所述预设条件包括:所述第二故障点的故障发生的时刻在所述第一故障点发生软失效故障的时刻之后;所述第二故障点的故障恢复的时刻在所述第一故障点的软失效故障恢复的时刻之后;以及,用于当满足所述预设条件时,判定所述第二故障点与发生软失效故障的所述第一故障点存在时间相关性。
本发明实施例提供的一种故障告警系统,能够在存储设备发生故障时确定第一故障点,并获取第一故障点的地址信息,根据存储单元失效检测规则将校验数据写入到第一故障点的地址信息,得到测试结果,根据测试结果与预设的正确结果,判定第一故障点的故障类型,并输出第一故障点的故障类型。当检测到其他故障点时,通过判断其他故障点与发生软故障的第一故障点是否存在配置相关性和时间相关性,可以得知其他故障点发生的故障是否由第一故障点发生的软失效故障引起,如果是,故障告警系统可以对该故障进行自愈,避免使用花费时间较长的人工修复,提高了故障修复效率。与现有技术相比,本方案能够判定故障的类型,例如:当故障为软失效故障时,故障告警系统不会显示更换硬件的告警信息,当故障为硬失效故障时,故障告警系统才会显示更换硬件的告警信息。从而使得维护人员可以针对不同类型的故障采取不同的措施,因此维护人员能够避免不必要的硬件更换,从而减少了维护设备花费的成本;同时,也提高了故障修复效率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (12)

1.一种故障告警方法,其特征在于,用于故障告警系统,所述故障告警系统用于检测存储设备中的存储单元的故障类型,所述故障类型包括软失效故障和硬失效故障;所述方法包括:
当所述存储设备发生故障时确定第一故障点,并获取所述第一故障点的地址信息;
根据存储单元失效检测规则将校验数据写入到所述第一故障点的地址信息,得到测试结果;
判断所述测试结果与预设的正确结果是否相同;若相同,则判定所述第一故障点的故障类型为软失效故障;若不同,则判定所述第一故障点的故障类型为硬失效故障;
输出判定得到的所述第一故障点的故障类型。
2.根据权利要求1所述的方法,其特征在于,所述存储设备为高速缓冲存储器cache;所述地址信息为所述第一故障点所在的缓存线cacheline对应的地址范围。
3.根据权利要求1所述的方法,其特征在于,所述存储设备为闪存器flash;所述地址信息为所述第一故障点所在的块对应的地址范围。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在判定所述第一故障点的故障类型为软失效故障之后,记录所述第一故障点再次出现软失效故障的次数,当所述次数超过阈值时,判定所述第一故障点的故障类型为硬失效故障。
5.根据权利要求1或4所述的方法,其特征在于,当判定所述第一故障点的故障类型为软失效故障后,所述方法还包括:
获取第二故障点,检测所述第二故障点与所述第一故障点是否存在配置相关性和时间相关性,所述第二故障点发生的故障伴生于所述第一故障点发生的故障,所述第二故障点的位置包括所述第一故障点所在的所述存储设备,或者与所述第一故障点所在的所述存储设备不同的硬件设备;
若存在所述配置相关性和所述时间相关性中的任意一项,则对所述第二故障点的故障进行自愈;
若不存在所述配置相关性,也不存在所述时间相关性,则发布告警信息,所述告警信息用于表示所述第二故障点的位置。
6.根据权利要求5所述的方法,其特征在于,所述检测所述第二故障点与所述第一故障点是否存在配置相关性包括:
检测所述第二故障点与发生软失效故障的所述第一故障点的配置信息是否部分相同或完全相同;
若部分相同或完全相同,则所述第二故障点与发生软失效故障的所述第一故障点存在配置相关性;
所述检测所述第二故障点与所述第一故障点是否存在时间相关性包括:
检测所述第二故障点的故障是否满足预设条件,所述预设条件包括:所述第二故障点的故障发生的时刻在所述第一故障点发生软失效故障的时刻之后;所述第二故障点的故障恢复的时刻在所述第一故障点的软失效故障恢复的时刻之后;
若满足所述预设条件,则所述第二故障点与发生软失效故障的所述第一故障点存在时间相关性。
7.一种故障告警装置,其特征在于,包括:
获取模块,用于当所述存储设备发生故障时确定第一故障点,并获取所述第一故障点的地址信息;
测试模块,用于根据存储单元失效检测规则将校验数据写入到所述第一故障点的地址信息,得到测试结果;
判断模块,用于判断所述测试结果与预设的正确结果是否相同;若相同,则判定所述第一故障点的故障类型为软失效故障;若不同,则判定所述第一故障点的故障类型为硬失效故障;
发布模块,用于输出判定得到的所述第一故障点的故障类型。
8.根据权利要求7所述的装置,其特征在于,所述存储设备为高速缓冲存储器cache;所述地址信息为所述第一故障点所在的缓存线cacheline对应的地址范围。
9.根据权利要求7所述的装置,其特征在于,所述存储设备为闪存器flash;所述地址信息为所述第一故障点所在的块对应的地址范围。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
判定模块,用于在判定所述第一故障点的故障类型为软失效故障之后,记录所述第一故障点再次出现软失效故障的次数,当所述次数超过阈值时,判定所述第一故障点的故障类型为硬失效故障。
11.根据权利要求7或10所述的装置,其特征在于,所述装置还包括:
检测模块,用于获取第二故障点,检测所述第二故障点与所述第一故障点是否存在配置相关性和时间相关性,所述第二故障点发生的故障伴生于所述第一故障点发生的故障,所述第二故障点的位置包括所述第一故障点所在的所述存储设备,或者与所述第一故障点所在的所述存储设备不同的硬件设备;
自愈模块,用于当存在所述配置相关性和所述时间相关性中的任意一项时,对所述第二故障点的故障进行自愈;
告警模块,用于当不存在所述配置相关性,也不存在所述时间相关性时,发布告警信息,所述告警信息用于表示所述第二故障点的位置。
12.根据权利要求11所述的装置,其特征在于,所述检测模块包括:
第一检测单元,用于检测所述第二故障点与发生软失效故障的所述第一故障点的配置信息是否部分相同或完全相同;
第一判定单元,用于当部分相同或完全相同时,判定所述第二故障点与发生软失效故障的所述第一故障点存在配置相关性;
第二检测单元,用于检测所述第二故障点的故障是否满足预设条件,所述预设条件包括:所述第二故障点的故障发生的时刻在所述第一故障点发生软失效故障的时刻之后;所述第二故障点的故障恢复的时刻在所述第一故障点的软失效故障恢复的时刻之后;
第二判定单元,用于当满足所述预设条件时,判定所述第二故障点与发生软失效故障的所述第一故障点存在时间相关性。
CN201310719925.7A 2013-12-23 2013-12-23 一种故障告警方法与装置 Active CN103745751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310719925.7A CN103745751B (zh) 2013-12-23 2013-12-23 一种故障告警方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310719925.7A CN103745751B (zh) 2013-12-23 2013-12-23 一种故障告警方法与装置

Publications (2)

Publication Number Publication Date
CN103745751A true CN103745751A (zh) 2014-04-23
CN103745751B CN103745751B (zh) 2017-01-18

Family

ID=50502764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310719925.7A Active CN103745751B (zh) 2013-12-23 2013-12-23 一种故障告警方法与装置

Country Status (1)

Country Link
CN (1) CN103745751B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106205724A (zh) * 2015-05-05 2016-12-07 上海飞俞星信息科技有限公司 一种存储设备的报警系统
CN105527506B (zh) * 2014-09-28 2018-07-06 中国航空工业集团公司西安飞机设计研究所 一种智能故障报文检测系统及其发送方法
CN109144407A (zh) * 2017-06-16 2019-01-04 希捷科技有限公司 用于监测存储器以便引退的系统和方法
WO2021135797A1 (zh) * 2019-12-30 2021-07-08 中兴通讯股份有限公司 告警信息配置方法、告警扫描方法、装置和系统
CN113454613A (zh) * 2020-10-30 2021-09-28 华为技术有限公司 信息传输方法、控制装置、电磁信号收发装置及信号处理设备
CN114168396A (zh) * 2021-11-19 2022-03-11 苏州浪潮智能科技有限公司 一种故障定位方法及相关组件
CN114305187A (zh) * 2022-01-06 2022-04-12 中山东菱威力电器有限公司 一种基于物联网的共享智能马桶盖系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1774641A (zh) * 2003-04-16 2006-05-17 爱德万测试株式会社 测试装置
US20080022176A1 (en) * 2006-07-07 2008-01-24 Kabushiki Kaisha Toshiba Semiconductor integrated circuit
CN101692351A (zh) * 2009-11-02 2010-04-07 华为技术有限公司 存储器测试方法及装置
CN103188113A (zh) * 2011-12-28 2013-07-03 鼎桥通信技术有限公司 一种通信设备的故障处理方法
CN103207825A (zh) * 2012-01-13 2013-07-17 百度在线网络技术(北京)有限公司 一种用于管理整机柜的故障的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1774641A (zh) * 2003-04-16 2006-05-17 爱德万测试株式会社 测试装置
US20080022176A1 (en) * 2006-07-07 2008-01-24 Kabushiki Kaisha Toshiba Semiconductor integrated circuit
CN101692351A (zh) * 2009-11-02 2010-04-07 华为技术有限公司 存储器测试方法及装置
CN103188113A (zh) * 2011-12-28 2013-07-03 鼎桥通信技术有限公司 一种通信设备的故障处理方法
CN103207825A (zh) * 2012-01-13 2013-07-17 百度在线网络技术(北京)有限公司 一种用于管理整机柜的故障的方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105527506B (zh) * 2014-09-28 2018-07-06 中国航空工业集团公司西安飞机设计研究所 一种智能故障报文检测系统及其发送方法
CN106205724A (zh) * 2015-05-05 2016-12-07 上海飞俞星信息科技有限公司 一种存储设备的报警系统
CN109144407A (zh) * 2017-06-16 2019-01-04 希捷科技有限公司 用于监测存储器以便引退的系统和方法
CN109144407B (zh) * 2017-06-16 2021-12-21 希捷科技有限公司 用于监测存储器以便引退的系统和方法
WO2021135797A1 (zh) * 2019-12-30 2021-07-08 中兴通讯股份有限公司 告警信息配置方法、告警扫描方法、装置和系统
CN113454613A (zh) * 2020-10-30 2021-09-28 华为技术有限公司 信息传输方法、控制装置、电磁信号收发装置及信号处理设备
CN113454613B (zh) * 2020-10-30 2022-08-09 华为技术有限公司 信息传输方法、控制装置、电磁信号收发装置及信号处理设备
CN114168396A (zh) * 2021-11-19 2022-03-11 苏州浪潮智能科技有限公司 一种故障定位方法及相关组件
CN114168396B (zh) * 2021-11-19 2024-01-12 苏州浪潮智能科技有限公司 一种故障定位方法及相关组件
CN114305187A (zh) * 2022-01-06 2022-04-12 中山东菱威力电器有限公司 一种基于物联网的共享智能马桶盖系统
CN114305187B (zh) * 2022-01-06 2023-03-14 中山东菱威力电器有限公司 一种基于物联网的共享智能马桶盖系统

Also Published As

Publication number Publication date
CN103745751B (zh) 2017-01-18

Similar Documents

Publication Publication Date Title
CN103745751A (zh) 一种故障告警方法与装置
CN105468484B (zh) 用于在存储系统中确定故障位置的方法和装置
JP4907154B2 (ja) メモリエラーを分類するための方法および装置
CN103049354B (zh) 数据修复方法、数据修复装置以及存储系统
CN102135925B (zh) 用于检测错误检查和纠正内存的方法和装置
CN109308238A (zh) 一种存储系统磁盘阵列坏盘调节的方法、装置及设备
US11164650B2 (en) Scrub management in storage class memory
CN103069393B (zh) 中央处理运算装置以及异常检查方法
CN113835643B (zh) 数据存储方法、装置、电子设备及可读存储介质
CN107731262A (zh) 一种存储磁盘坏块管理方法、装置、设备及可读存储介质
CN103092728A (zh) 一种非易失性内存的磨损错误恢复方法和装置
CN112000536A (zh) 一种内存检测方法、系统及相关设备
KR101449231B1 (ko) 어드레스 변환 검사 장치, 중앙 처리 연산 장치, 및 어드레스 변환 검사 방법
KR20160046225A (ko) 고장 제어 기능을 구비한 캐시 메모리
CN107807862A (zh) 检测硬盘故障点的方法、装置及服务器
CN111221775B (zh) 处理器、缓存处理方法及电子设备
CN103744752B (zh) 一种内存的在线故障检测方法和装置
CN111124818A (zh) 一种扩展器Expander的监控方法、装置及设备
JP2013037631A (ja) 診断装置、診断方法および診断プログラム診断方法
WO2023273637A1 (zh) 一种故障检测方法及装置
CN108231134B (zh) Ram良率补救方法及装置
CN109686397A (zh) 具有自检功能的存储器及其检测方法
CN109215724A (zh) 存储器自动检测和修复的方法及装置
CN107577554A (zh) 检测使用中逻辑页面的数据储存装置与数据储存方法
CN105786719A (zh) 一种NAND Flash存储器和存储器中坏块的处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant