CN109753378A - 一种内存故障的隔离方法、装置、系统及可读存储介质 - Google Patents

一种内存故障的隔离方法、装置、系统及可读存储介质 Download PDF

Info

Publication number
CN109753378A
CN109753378A CN201910002196.0A CN201910002196A CN109753378A CN 109753378 A CN109753378 A CN 109753378A CN 201910002196 A CN201910002196 A CN 201910002196A CN 109753378 A CN109753378 A CN 109753378A
Authority
CN
China
Prior art keywords
memory
address information
failure
memory address
isolation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910002196.0A
Other languages
English (en)
Inventor
王垒
华飞君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Power Commercial Systems Co Ltd
Original Assignee
Inspur Power Commercial Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Power Commercial Systems Co Ltd filed Critical Inspur Power Commercial Systems Co Ltd
Priority to CN201910002196.0A priority Critical patent/CN109753378A/zh
Publication of CN109753378A publication Critical patent/CN109753378A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种内存故障的隔离方法、装置、系统及计算机可读存储介质,该方法包括:在系统运行过程中,对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;将内存地址信息写入系统的隔离文件中,以便对发生故障的内存进行隔离。可见,本申请能够在系统运行过程中通过对各个内存的内存状态进行检测确定出发生故障的内存,并将故障内存的内存地址信息写入至系统的隔离文件中,从而实现对故障内存的隔离,以使故障内存不被访问,进而在确保系统稳定性的基础上,节约系统成本。

Description

一种内存故障的隔离方法、装置、系统及可读存储介质
技术领域
本发明实施例涉及服务器技术领域,特别是涉及一种内存故障的隔离方法、装置、系统及计算机可读存储介质。
背景技术
服务器内存故障是一种服务器常见的故障,当服务器发生内存故障后,就会导致系统运行不稳定甚至出现宕机。通常服务器厂商通过购买iMS商用软件检测和处理服务器的内存故障,并且iMS商用软件是在BIOS层来进行分析处理故障内存的,但是采用购买的商用软件检测和处理服务器的内存故障会增加产品的成本。
鉴于此,如何提供一种解决上述技术问题的内存故障的隔离方法、装置、系统及计算机可读存储介质成为本领域技术人员需要解决的问题。
发明内容
本发明实施例的目的是提供一种内存故障的隔离方法、装置、系统及计算机可读存储介质,在使用过程中实现对故障内存的隔离,以使故障内存不被访问,进而在确保系统稳定性的基础上,节约系统成本。
为解决上述技术问题,本发明实施例提供了一种内存故障的隔离方法,包括:
在系统运行过程中,对所述系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;
将所述内存地址信息写入所述系统的隔离文件中,以便对所述发生故障的内存进行隔离。
可选的,所述对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息的过程包括:
获取所述系统的ECC报错信息;
读取与内存对应的目标ECC报错信息;
对所述目标ECC报错信息进行解析,得到与所述目标ECC报错信息对应的内存地址信息。
可选的,在所述将所述内存地址信息写入所述系统的隔离文件中之前,还包括:
依据所述目标ECC报错信息的内存地址信息判断相应的内存是否为隔离状态,若否,则执行将所述内存地址信息写入所述系统的隔离文件中的步骤。
可选的,在所述将所述内存地址信息写入所述系统的隔离文件中之后,还包括:
将与所述内存地址信息对应的隔离记录写入日志文件中。
可选的,所述隔离记录包括内存地址信息、隔离时间以及错误类型。
可选的,还包括:
在检测到所述系统启动成功后,获取所述日志文件中当前存储的各个隔离记录;
将与当前存储的每个所述隔离记录中的内存地址信息写入至所述隔离文件中,以对相应的内存进行隔离。
本发明实施例还相应的提供了一种内存故障的隔离装置,包括:
第一检测模块,用于在系统运行过程中,对所述系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;
写入模块,用于将所述内存地址信息写入所述系统的隔离文件中,以便对所述发生故障的内存进行隔离。
可选的,所述第一检测模块包括:
获取单元,用于获取所述系统的ECC报错信息;
读取单元,用于读取与内存对应的目标ECC报错信息;
解析单元,用于对所述目标ECC报错信息进行解析,得到与所述目标ECC报错信息对应的内存地址信息。
可选的,还包括:
第二检测模块,用于检测所述目标ECC报错信息的内存地址信息是否为隔离状态,若否,则触发所述写入模块。
可选的,还包括:
日志记录模块,用于将与所述内存地址信息对应的隔离记录写入日志文件中。
可选的,所述第一检测模块,还用于在检测到所述系统启动后,获取所述日志文件中当前存储的各个隔离记录;
所述写入模块,还用于将与当前存储的每个所述隔离记录中的内存地址信息写入至所述隔离文件中,以对相应的内存进行隔离。
本发明实施例还提供了一种内存故障的隔离系统,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述内存故障的隔离方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述内存故障的隔离方法的步骤。
本发明实施例提供了一种内存故障的隔离方法、装置、系统及计算机可读存储介质,该方法包括:在系统运行过程中,对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;将内存地址信息写入系统的隔离文件中,以便对发生故障的内存进行隔离。可见,本申请能够在系统运行过程中通过对各个内存的内存状态进行检测确定出发生故障的内存,并将故障内存的内存地址信息写入至系统的隔离文件中,从而实现对故障内存的隔离,以使故障内存不被访问,进而在确保系统稳定性的基础上,节约系统成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种内存故障的隔离方法的流程示意图;
图2为本发明实施例提供的另一种内存故障的隔离方法的流程示意图;
图3为本发明实施例提供的一种内存故障的隔离装置的结构示意图。
具体实施方式
本发明实施例提供了一种内存故障的隔离方法、装置、系统及计算机可读存储介质,在使用过程中实现对故障内存的隔离,以使故障内存不被访问,进而在确保系统稳定性的基础上,节约系统成本
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1为本发明实施例提供的一种内存故障的隔离方法的流程示意图。该方法,包括:
S110:在系统运行过程中,对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;
需要说明的是,在系统运行过程中,通过对系统中的各个内存的内存状态进行检测,以确定当前时刻是否存在发生故障的内存,如果有发生故障的内存(简称故障内存),则获取故障内存的内存地址信息。
其中,本申请可以应用于linux系统,并且可以基于Intel MCA(MACHINE-CHECKARCHITECTURE)机制实现,并且可以定时对系统中的各个内存的内存状态进行检测。
进一步的,上述S110中对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息的过程包括:
获取系统的ECC报错信息;
读取与内存对应的目标ECC报错信息;
对目标ECC报错信息进行解析,得到与目标ECC报错信息对应的内存地址信息。
具体的,可以通过读取系统的字符设备从而获取系统的ECC报错信息,其中,当该系统为linux系统时,可以读取linux系统字符设备/dev/mcelog,并获取mcelog中的ECC报错信息。由于ECC报错信息中可能包括内存的ECC报错信息和CPU的报错信息,所以在获取到ECC报错信息后,还可以对ECC报错信息的类别进行识别,确定出与内存对应的ECC报错信息,则说明当前存在出现故障的内存,并且可以将与内存对应的ECC报错信息作为目标ECC报错信息,其中与内存对应的ECC报错信息可以为多个,本申请中以一个为例进行详细说明。通过对目标ECC报错信息进行解析,获取目标ECC报错信息的内存地址信息,也即获取与发生故障的内存对应的内存地址信息。
S120:将内存地址信息写入系统的隔离文件中,以便对发生故障的内存进行隔离。
需要说明的是,在获取了故障内存的内存地址信息后,通过将该内存地址信息写入系统的隔离文件中就能够实现对该故障内存的隔离,隔离之后的内存不再被使用,也即隔离后的内存将不被用户访问,从而保障系统的正常运行。
其中,当系统为linux系统时,可以将内存地址信息写入系统文件/sys/devices/system/memory/soft_offline_page中,也即linux系统的隔离文件为系统文件/sys/devices/system/memory/soft_offline_page,以实现对linux系统中的故障内存的隔离。
进一步的,在上述S120中将内存地址信息写入系统的隔离文件中之前,该方法还可以包括:
依据目标ECC报错信息的内存地址信息判断相应的内存是否为隔离状态,若否,则执行将内存地址信息写入系统的隔离文件中的步骤。
具体的,可以根据目标ECC报错信息的内存地址信息查看相应的内存是否处于下线等状态时,也即查看对应的故障内存是否处于隔离状态,当相应的故障内存处于隔离状态时,则说明与该故障内存对应的内存地址信息依据被写入隔离文件中,所以此时无需再写入,当相应的故障内存处于非隔离状态时,此时需要继续执行将与该故障内存对应的内存地址信息写入至隔离文件中,以实现对应该故障内存的隔离。其中,以linux系统为例,系统运行过程中的检测流程如图2所示。
更进一步的,在将内存地址信息写入系统的隔离文件中之后,该方法还包括:
将与内存地址信息对应的隔离记录写入日志文件中。
还需要说明的是,由于系统在每次重启后,前一次写入至隔离文件中的内存地址信息将被清空,并且出现故障的内存在下一次重启系统后还是会处于故障状态,所以为了方便下一次系统启动使能够快速获取将系统在上次运行使发生故障的内存的内存地址信息,并且方便工作人员对系统的内存进行维护,本申请中还可以在将内存地址信息写入至系统的隔离文件中之后,将与该内存地址信息对应的隔离记录写入日志文件中,其中,该隔离记录具体可以包括内存地址信息、隔离时间以及错误类型等信息。
更进一步的,该方法可以还包括:
在检测到系统启动成功后,获取日志文件中当前存储的各个隔离记录;
将与当前存储的每个隔离记录中的内存地址信息写入至隔离文件中,以对相应的内存进行隔离。
具体的,在系统成功后,可以直接读取日志文件中的各个隔离记录,并获取与每个隔离记录对应的内存地址信息,并将该内存地址信息写入至隔离文件中,以对先前出现故障的内存直接进行隔离,然后在系统运行过程中可以通过ECC报错信息实现对系统中内存的状态进行检测(具体可以定时检测),若检测出发生故障的内存,则对ECC报错信息执行解析的操作,并将解析出的与故障内存对应的内存地址信息写入至隔离文件中,以对新出现故障的内存进行隔离,并将相应的隔离记录写入至日志文件中,以对日志文件中的隔离记录进行更新,从而可以提高对故障内存进行隔离的速度,以进一步确保系统的正常运行。
另外,本申请中与故障内存对的记录除了日志文件外,还可以包括内存链表,其中,在系统启动时,可以获取日志文件,将隔离记录从日志文件中逐条读出,并加载到内存链表中(也即将日志文件中的隔离记录同步至内存链表中),然后再从内存链表中获取与每个隔离记录对应的内存地址信息,并将该内存地址信息写入隔离文件中,由于日志文件存储于硬盘中,直接读取硬盘速度较慢,所以本申请中通过将隔离记录加载到内存链表,然后再从内存链表中读取隔离记录大大提高了数据读取速度。
其中,本申请中的日志文件的日志字段格式如表1所示,隔离记录结构体如表2所示。
表1
字段 类型 实例
时间 time_t 2011-12-31 11:43:07
内存地址 Unsigned long long 0x12ds1212
隔离时间 time_t time_t
错误类型 Unsigned int 101
表2
字段 类型 实例
内存地址 Unsigned long long 0x12ds1212
隔离时间 time_t time_t
是否隔离成功 boolen True
错误类型 Unsigned int 101
本发明实施例提供了一种内存故障的隔离方法,该方法包括:在系统运行过程中,对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;将内存地址信息写入系统的隔离文件中,以便对发生故障的内存进行隔离。可见,本申请能够在系统运行过程中通过对各个内存的内存状态进行检测确定出发生故障的内存,并将故障内存的内存地址信息写入至系统的隔离文件中,从而实现对故障内存的隔离,以使故障内存不被访问,进而在确保系统稳定性的基础上,节约系统成本。
在上述实施例的基础上,本发明实施例还相应的提供了一种内存故障的隔离装置,具体请参照图3。该装置包括:
第一检测模块31,用于在系统运行过程中,对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;
写入模块32,用于将内存地址信息写入系统的隔离文件中,以便对发生故障的内存进行隔离。
进一步的,第一检测模块31包括:
获取单元,用于获取系统的ECC报错信息;
读取单元,用于读取与内存对应的目标ECC报错信息;
解析单元,用于对目标ECC报错信息进行解析,得到与目标ECC报错信息对应的内存地址信息。
进一步的,还包括:
第二检测模块,用于检测目标ECC报错信息的内存地址信息是否为隔离状态,若否,则触发写入模块32。
进一步的,还包括:
日志记录模块,用于将与内存地址信息对应的隔离记录写入日志文件中。
进一步的,第一检测模块31,还用于在检测到系统启动后,获取日志文件中当前存储的各个隔离记录;
写入模块32,还用于将与当前存储的每个隔离记录中的内存地址信息写入至隔离文件中,以对相应的内存进行隔离。
在上述实施例的基础上,本发明实施例还提供了一种内存故障的隔离系统,该系统包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述内存故障的隔离方法的步骤。
例如,本实施例中的处理器用于实现在系统运行过程中,对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;将内存地址信息写入系统的隔离文件中,以便对发生故障的内存进行隔离。
在上述实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述内存故障的隔离方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种内存故障的隔离方法,其特征在于,包括:
在系统运行过程中,对所述系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;
将所述内存地址信息写入所述系统的隔离文件中,以便对所述发生故障的内存进行隔离。
2.根据权利要求1所述的内存故障的隔离方法,其特征在于,所述对系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息的过程包括:
获取所述系统的ECC报错信息;
读取与内存对应的目标ECC报错信息;
对所述目标ECC报错信息进行解析,得到与所述目标ECC报错信息对应的内存地址信息。
3.根据权利要求2所述的内存故障的隔离方法,其特征在于,在所述将所述内存地址信息写入所述系统的隔离文件中之前,还包括:
依据所述目标ECC报错信息的内存地址信息判断相应的内存是否为隔离状态,若否,则执行将所述内存地址信息写入所述系统的隔离文件中的步骤。
4.根据权利要求3所述的内存故障的隔离方法,其特征在于,在所述将所述内存地址信息写入所述系统的隔离文件中之后,还包括:
将与所述内存地址信息对应的隔离记录写入日志文件中。
5.根据权利要求4所述的内存故障的隔离方法,其特征在于,所述隔离记录包括内存地址信息、隔离时间以及错误类型。
6.根据权利要求4或5所述的内存故障的隔离方法,其特征在于,还包括:
在检测到所述系统启动成功后,获取所述日志文件中当前存储的各个隔离记录;
将与当前存储的每个所述隔离记录中的内存地址信息写入至所述隔离文件中,以对相应的内存进行隔离。
7.一种内存故障的隔离装置,其特征在于,包括:
第一检测模块,用于在系统运行过程中,对所述系统中各个内存的内存状态进行检测,并获取发生故障的内存对应的内存地址信息;
写入模块,用于将所述内存地址信息写入所述系统的隔离文件中,以便对所述发生故障的内存进行隔离。
8.根据权利要求7所述的内存故障的隔离装置,其特征在于,所述第一检测模块包括:
获取单元,用于获取所述系统的ECC报错信息;
读取单元,用于读取与内存对应的目标ECC报错信息;
解析单元,用于对所述目标ECC报错信息进行解析,得到与所述目标ECC报错信息对应的内存地址信息。
9.一种内存故障的隔离系统,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任意一项所述内存故障的隔离方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任意一项所述内存故障的隔离方法的步骤。
CN201910002196.0A 2019-01-02 2019-01-02 一种内存故障的隔离方法、装置、系统及可读存储介质 Pending CN109753378A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910002196.0A CN109753378A (zh) 2019-01-02 2019-01-02 一种内存故障的隔离方法、装置、系统及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910002196.0A CN109753378A (zh) 2019-01-02 2019-01-02 一种内存故障的隔离方法、装置、系统及可读存储介质

Publications (1)

Publication Number Publication Date
CN109753378A true CN109753378A (zh) 2019-05-14

Family

ID=66405114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910002196.0A Pending CN109753378A (zh) 2019-01-02 2019-01-02 一种内存故障的隔离方法、装置、系统及可读存储介质

Country Status (1)

Country Link
CN (1) CN109753378A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532124A (zh) * 2019-09-06 2019-12-03 西安易朴通讯技术有限公司 内存隔离方法及装置
CN110780646A (zh) * 2019-09-21 2020-02-11 苏州浪潮智能科技有限公司 一种基于mes系统的内存质量预警方法
CN112559240A (zh) * 2020-12-25 2021-03-26 龙芯中科(成都)技术有限公司 内存自适应调整的方法、装置、设备及可读存储介质
WO2021185279A1 (zh) * 2020-03-20 2021-09-23 华为技术有限公司 一种内存故障处理方法及相关设备
CN113515405A (zh) * 2021-07-09 2021-10-19 维沃移动通信有限公司 地址管理方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222025A (zh) * 2011-06-17 2011-10-19 华为数字技术有限公司 一种消除内存故障的方法及装置
WO2011160957A1 (en) * 2010-06-24 2011-12-29 International Business Machines Corporation Isolation of faulty links in a transmission medium
CN103198000A (zh) * 2013-04-02 2013-07-10 浪潮电子信息产业股份有限公司 一种linux系统下的故障内存位置定位方法
CN103279406A (zh) * 2013-05-31 2013-09-04 华为技术有限公司 一种内存的隔离方法和装置
CN105893166A (zh) * 2016-04-29 2016-08-24 浪潮电子信息产业股份有限公司 一种处理内存错误的方法及装置
CN106021014A (zh) * 2016-05-12 2016-10-12 浪潮电子信息产业股份有限公司 一种内存管理方法及装置
CN106133704A (zh) * 2015-01-19 2016-11-16 华为技术有限公司 内存故障隔离方法和装置
CN106126368A (zh) * 2016-08-22 2016-11-16 浪潮电子信息产业股份有限公司 一种linux下内存故障地址解析的方法
CN107092549A (zh) * 2017-04-26 2017-08-25 郑州云海信息技术有限公司 一种自动监控并解析内存故障的工具及方法
CN109086151A (zh) * 2017-06-13 2018-12-25 中兴通讯股份有限公司 一种服务器上隔离内存故障的方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011160957A1 (en) * 2010-06-24 2011-12-29 International Business Machines Corporation Isolation of faulty links in a transmission medium
CN102222025A (zh) * 2011-06-17 2011-10-19 华为数字技术有限公司 一种消除内存故障的方法及装置
CN103198000A (zh) * 2013-04-02 2013-07-10 浪潮电子信息产业股份有限公司 一种linux系统下的故障内存位置定位方法
CN103279406A (zh) * 2013-05-31 2013-09-04 华为技术有限公司 一种内存的隔离方法和装置
CN106133704A (zh) * 2015-01-19 2016-11-16 华为技术有限公司 内存故障隔离方法和装置
CN105893166A (zh) * 2016-04-29 2016-08-24 浪潮电子信息产业股份有限公司 一种处理内存错误的方法及装置
CN106021014A (zh) * 2016-05-12 2016-10-12 浪潮电子信息产业股份有限公司 一种内存管理方法及装置
CN106126368A (zh) * 2016-08-22 2016-11-16 浪潮电子信息产业股份有限公司 一种linux下内存故障地址解析的方法
CN107092549A (zh) * 2017-04-26 2017-08-25 郑州云海信息技术有限公司 一种自动监控并解析内存故障的工具及方法
CN109086151A (zh) * 2017-06-13 2018-12-25 中兴通讯股份有限公司 一种服务器上隔离内存故障的方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532124A (zh) * 2019-09-06 2019-12-03 西安易朴通讯技术有限公司 内存隔离方法及装置
CN110780646A (zh) * 2019-09-21 2020-02-11 苏州浪潮智能科技有限公司 一种基于mes系统的内存质量预警方法
CN110780646B (zh) * 2019-09-21 2021-11-26 苏州浪潮智能科技有限公司 一种基于mes系统的内存质量预警方法
WO2021185279A1 (zh) * 2020-03-20 2021-09-23 华为技术有限公司 一种内存故障处理方法及相关设备
CN113495799A (zh) * 2020-03-20 2021-10-12 华为技术有限公司 一种内存故障处理方法及相关设备
CN113495799B (zh) * 2020-03-20 2024-04-12 华为技术有限公司 一种内存故障处理方法及相关设备
CN112559240A (zh) * 2020-12-25 2021-03-26 龙芯中科(成都)技术有限公司 内存自适应调整的方法、装置、设备及可读存储介质
CN113515405A (zh) * 2021-07-09 2021-10-19 维沃移动通信有限公司 地址管理方法和装置

Similar Documents

Publication Publication Date Title
CN109753378A (zh) 一种内存故障的隔离方法、装置、系统及可读存储介质
CN114579340A (zh) 内存错误处理方法和装置
CN106682193B (zh) 基于缓存的数据持久化存储方法及装置
US11977744B2 (en) Memory anomaly processing method and system, electronic device, and storage medium
CN104685474B (zh) 用于处理不可纠正的内存错误的方法及非瞬态处理器可读介质
CN107506266B (zh) 一种数据恢复方法及系统
MX2014002960A (es) Rastreo de region sucia de medios de volatiles.
US20140188829A1 (en) Technologies for providing deferred error records to an error handler
CN103839591A (zh) 存储器自动检错和容错电路及控制方法
CN108959526B (zh) 日志管理方法以及日志管理装置
CN112579327B (zh) 一种故障检测方法、装置及设备
CN109144754A (zh) 一种可靠性测试方法及装置
CN111026333A (zh) 访问请求处理方法、处理装置、电子设备及存储介质
US20160170842A1 (en) Writing to files and file meta-data
CN113779149A (zh) 消息处理方法、装置、电子设备及可读存储介质
CN113536320A (zh) 一种错误信息处理方法、装置及存储介质
JP6677021B2 (ja) 情報処理装置、情報処理方法、プログラム
CN105868038B (zh) 内存错误处理方法及电子设备
CN117131014A (zh) 数据库迁移方法、装置、设备及存储介质
US20070234114A1 (en) Method, apparatus, and computer program product for implementing enhanced performance of a computer system with partially degraded hardware
CN104461759B (zh) 一种内存多位错误的处理方法及装置
CN115858211A (zh) 机器检查错误的处理方法及装置
US20220374310A1 (en) Write request completion notification in response to partial hardening of write data
US20150249708A1 (en) System and method for asynchronous replication of a storage in a computing environment
CN108231134B (zh) Ram良率补救方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190514

RJ01 Rejection of invention patent application after publication