CN105760241A - 一种内存数据导出方法和系统 - Google Patents

一种内存数据导出方法和系统 Download PDF

Info

Publication number
CN105760241A
CN105760241A CN201410795107.XA CN201410795107A CN105760241A CN 105760241 A CN105760241 A CN 105760241A CN 201410795107 A CN201410795107 A CN 201410795107A CN 105760241 A CN105760241 A CN 105760241A
Authority
CN
China
Prior art keywords
server
internal storage
storage data
request
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410795107.XA
Other languages
English (en)
Other versions
CN105760241B (zh
Inventor
何海洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201410795107.XA priority Critical patent/CN105760241B/zh
Publication of CN105760241A publication Critical patent/CN105760241A/zh
Application granted granted Critical
Publication of CN105760241B publication Critical patent/CN105760241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开的内存数据导出方法和系统,实时检测服务器系统,在服务器系统出现例如当机、意外重启等此类异常现象时,获取服务器系统的异常信息,并依据异常信息,判断服务器系统所属的异常类型;在此基础上,通过对服务器内存数据进行与所述异常类型相对应的处理过程,实现导出服务器内存数据。可见,本发明可在服务器系统发生异常时,有效导出服务器内存的现场数据,进而可为后续进行服务器异常原因分析提供支持,提高了服务器的可维护性。

Description

一种内存数据导出方法和系统
技术领域
本发明属于服务器维护技术领域,尤其涉及一种内存数据导出方法和系统。
背景技术
服务器系统往往会因多种原因而导致其出现当机、重启或自动关机等异常现象。
在出现异常时,为实现对服务器进行维护,避免之后再次出现此类异常现象,需首先对服务器系统发生异常的原因进行分析,而异常发生时的服务器内存现场数据(如所运行程序的上下文信息、变量状态等)是进行异常原因分析的重要依据,因此,提供一种能够在异常发生时,有效导出服务器内存现场数据的方法十分必要。
发明内容
有鉴于此,本发明的目的在于提供一种内存数据导出方法和系统,以实现在服务器系统发生异常时,有效导出服务器内存的现场数据,进而为后续进行异常原因分析提供支持。
为此,本发明公开如下技术方案:
一种内存数据导出方法,包括:
实时获取服务器系统的异常信息;
依据所获取的异常信息,判断服务器系统异常所属的异常类型;
基于所述异常类型,对服务器的内存数据进行相应处理,以实现导出所述内存数据。
上述方法,优选的,所述异常类型包括系统当机、非掉电原因导致的系统意外重启以及软件原因导致的系统意外掉电。
上述方法,优选的,当所述异常类型为系统当机时,所述对服务器的内存数据进行相应处理包括:
接收用户的第一导出请求,所述第一导出请求为用户将其第一存储设备连接至服务器后所触发的请求;
发出第一传输指令,以实现将服务器内存中的第一内存数据传输至所述第一存储设备。
上述方法,优选的,当所述异常类型为非掉电原因所导致的系统意外重启时,所述对服务器的内存数据进行相应处理包括:
发出触发指令,以触发非易失性存储模块NVDIMM将服务器内存中的内存数据转移至其存储器NandFlash中;
设置基本输入输出系统BIOS为调试模式;
在BIOS重新初始化系统后,接收用户的第二导出请求,所述第二导出请求为用户将其第二存储设备连接至服务器后所触发的请求;
发出第二传输指令,以实现将服务器内存中的第二内存数据传输至所述第二存储设备,其中,所述第二内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
上述方法,优选的,当所述异常类型为非掉电原因所导致的系统意外重启时,所述对服务器的内存数据进行相应处理包括:
发出第五传输指令,以实现将服务器内存中的内存数据传输至服务器中的第五存储设备;
接收用户的第三导出请求,所述第三导出请求为用户将其第三存储设备连接至服务器后所触发的请求;
发出第三传输指令,以实现将所述第五存储设备中的内存数据传输至所述第三存储设备中。
上述方法,优选的,当所述异常类型为软件原因所导致的系统意外掉电时,所述对服务器的内存数据进行相应处理包括:
设置BIOS为debug模式;
在BIOS重新初始化系统后,接收用户的第四导出请求,所述第四导出请求为用户将其第四存储设备连接至所述服务器后所触发的请求;
发出第四传输指令,以实现将服务器内存中的第四内存数据传输至所述第四存储设备,其中,所述第四内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
一种内存数据导出系统,包括:
获取模块,用于实时获取服务器系统的异常信息;
判断模块,用于依据所获取的异常信息,判断服务器系统异常所属的异常类型;
处理模块,用于基于所述异常类型,对服务器的内存数据进行相应处理,以实现导出所述内存数据。
上述系统,优选的,所述处理模块包括当机处理单元、重启处理单元和掉电处理单元。
上述系统,优选的,所述当机处理单元包括:
第一接收子单元,用于在所述异常类型为系统当机时,接收用户的第一导出请求,所述第一导出请求为用户将其第一存储设备连接至服务器后所触发的请求;
第一控制子单元,用于发出第一传输指令,以实现将服务器内存中的第一内存数据传输至所述第一存储设备。
上述系统,优选的,所述重启处理单元包括:
触发子单元,用于在所述异常类型为非掉电原因所导致的系统意外重启时,发出触发指令,以触发非易失性存储模块NVDIMM将服务器内存中的内存数据转移至其存储器NandFlash中;
第一设置子单元,用于设置基本输入输出系统BIOS为调试模式;
第二接收子单元,用于在BIOS重新初始化系统后,接收用户的第二导出
请求,所述第二导出请求为用户将其第二存储设备连接至服务器后所触发的请求;
第二控制子单元,用于发出第二传输指令,以实现将服务器内存中的第二内存数据传输至所述第二存储设备,其中,所述第二内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
上述系统,优选的,所述重启处理单元包括:
第五控制子单元,用于在所述异常类型为非掉电原因所导致的系统意外重启时,发出第五传输指令,以实现将服务器内存中的内存数据传输至服务器中的第五存储设备;
第三接收子单元,用于接收用户的第三导出请求,所述第三导出请求为用户将其第三存储设备连接至服务器后所触发的请求;
第三控制子单元,用于发出第三传输指令,以实现将所述第五存储设备中的内存数据传输至所述第三存储设备中。
上述系统,优选的,所述掉电处理单元包括:
第二设置子单元,用于在所述异常类型为软件原因所导致的系统意外掉电时,设置BIOS为debug模式;
第四接收子单元,用于在BIOS重新初始化系统后,接收用户的第四导出请求,所述第四导出请求为用户将其第四存储设备连接至所述服务器后所触发的请求;
第四控制子单元,用于发出第四传输指令,以实现将服务器内存中的第四内存数据传输至所述第四存储设备,其中,所述第四内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
由以上方案可知,本发明提供的内存数据导出方法和系统,实时检测服务器系统,在服务器系统出现例如当机、意外重启等此类异常现象时,获取服务器系统的异常信息,并依据异常信息,判断服务器系统所属的异常类型;在此基础上,通过对服务器内存数据进行与所述异常类型相对应的处理过程,实现导出服务器内存数据。可见,本发明可在服务器系统发生异常时,有效导出服务器内存的现场数据,进而可为后续进行服务器异常原因分析提供支持,提高了服务器的可维护性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种内存数据导出方法实施例一的流程图;
图2为本申请提供的一种内存数据导出方法实施例二的流程图;
图3为本申请实施例二公开的系统当机时导出内存数据的逻辑原理图;
图4为本申请提供的一种内存数据导出方法实施例三的流程图;
图5为本申请提供的一种内存数据导出方法实施例四的流程图;
图6为本申请实施例四公开的非掉电原因导致系统意外重启时导出内存数据的逻辑原理图;
图7为本申请提供的一种内存数据导出方法实施例五的流程图;
图8为本申请提供的一种内存数据导出系统实施例六的结构示意图;
图9为本申请实施例六公开的对处理模块细化后内存数据导出系统的结构示意图;
图10为本申请提供的一种内存数据导出系统实施例七的结构示意图;
图11为本申请提供的一种内存数据导出系统实施例八的结构示意图;
图12为本申请提供的一种内存数据导出系统实施例九的结构示意图;
图13为本申请提供的一种内存数据导出系统实施例十的结构示意图。
具体实施方式
为了引用和清楚起见,下文中使用的技术名词、简写或缩写总结解释如下:
DIMM:Dual-Inline-Memory-Modules,双列直插式存储模块,是在奔腾CPU推出后出现的新型内存条,它提供了64位的数据通道。
NVDIMM:NonvolatileDIMM,非易失性DIMM,能够在完全断电时依然保存完整的内存数据。在系统掉电后,NVDIMM可以利用超级电容提供的电力将RAM中的内容保存到其NandFlash(存储器)中,以保证系统可以快速恢复。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
参考图1,图1为本申请提供的一种内存数据导出方法实施例一的流程图,所述方法可以包括以下步骤:
S101:实时获取服务器系统的异常信息。
S102:依据所获取的异常信息,判断服务器系统异常所属的异常类型。
其中,所述异常类型包括系统当机、非掉电原因导致的系统意外重启以及软件原因导致的系统意外掉电。
S103:基于所述异常类型,对服务器的内存数据进行相应处理,以实现导出所述内存数据。
实际应用场景中,可采用软件程序的形式实现本申请方法的各步骤处理逻辑。本实施例预先将本申请方法的实现程序写入服务器主板上的BMC(BaseboardManagementController,基板管理控制器)中,由BMC基于所写入的程序对服务器的相应器件进行调度或控制,实现在服务器异常时导出服务器内存的现场数据。
具体地,BMC通过监控装置Watchdog实时监测服务器操作系统的运行状态,并在监测到系统异常时获取异常信息、对异常信息进行分析,在此基础上判断系统的异常类型。之后,BMC针对系统所属的异常类型,触发相应的处理流程,导出服务器内存的现场数据。
目前,服务器所采用的内存条DIMM(Dual-Inline-Memory-Modules,双列直插式存储模块)或NVDIMM(NonvolatileDIMM,非易失性DIMM)均为单口模式,仅能为CPU(CPUCentralProcessingUnit,中央处理器)读、写内存数据提供接口。基于此,本申请为了能够同时为BMC导出内存数据提供接口,将DIMM或NVDIMM设计成了双端口dual-port模式,该设计模式下,DIMM或NVDIMM包括主口mainport和从口slaveport,其中,mainport由CPU控制,用于作为CPU读、写内存数据的接口,slaveport连接到BMC,用于为BMC导出内存数据提供接口。
由以上方案可知,本发明提供的内存数据导出方法,实时检测服务器系统,在服务器系统出现例如当机、意外重启等此类异常现象时,获取服务器系统的异常信息,并依据异常信息,判断服务器系统所属的异常类型;在此基础上,通过对服务器内存数据进行与所述异常类型相对应的处理过程,实现导出服务器内存数据。可见,本发明可在服务器系统发生异常时,有效导出服务器内存的现场数据,进而可为后续进行服务器异常原因分析提供支持,提高了服务器的可维护性。
实施例二
本实施例二对系统当机情况下服务器内存现场数据的导出过程进行说明,本实施例的数据导出过程对采用DIMM或NVDIMM的服务器均适用。
参考图2,图2为本申请提供的一种内存数据导出方法实施例二的流程图,其中,所述步骤S103可以通过以下步骤实现:
S201:接收用户的第一导出请求,所述第一导出请求为用户将其第一存储设备连接至服务器后所触发的请求;
S202:发出第一传输指令,以实现将服务器内存中的第一内存数据传输至所述第一存储设备。
具体地,系统当机时,服务器不响应,且当机期间服务器内存现场数据不会丢失,此种情况下,参考图3,技术人员可直接通过BMC提供的NIC(NetworkInterfaceCard,网络适配器)网口、串口或USB(UniversalSerialBus,通用串行总线)接口将外部存储设备与服务器主板上的BMC相连接,并触发BMC进行数据传输控制,实现将服务器内存数据传输至(通过DIMM或NVDIMM的slaveport传输)外部存储设备,最终实现服务器内存现场数据的导出。
实施例三
本实施例三对非掉电原因导致系统意外重启时的服务器内存数据导出过程进行阐述,其中,本实施例的数据导出过程适用于采用NVDIMM的服务器。
参考图4,图4为本申请提供的一种内存数据导出方法实施例三的流程图,其中,所述步骤S103可以通过以下步骤实现:
S401:发出触发指令,以触发非易失性存储模块NVDIMM将服务器内存中的内存数据转移至其存储器NandFlash中;
S402:设置基本输入输出系统BIOS为调试模式;
S403:在BIOS重新初始化系统后,接收用户的第二导出请求,所述第二导出请求为用户将其第二存储设备连接至服务器后所触发的请求;
S404:发出第二传输指令,以实现将服务器内存中的第二内存数据传输至所述第二存储设备,其中,所述第二内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
服务器重启时,内存数据会在重启过程中丢失,且NVDIMM不会自动保存内存数据至其NandFlash中进行内存数据备份(NVDIMM仅在系统掉电时自动备份内存数据)。
基于此,本实施例中,当BMC通过wacthdog检测到系统异常并即将发生意外重启(非掉电原因)时,BMC立即通过BIOS(BasicInputOutputSystem,基本输入输出系统)触发NVDIMM将内存数据保存至其NandFlash中,同时设置BIOS为debug模式。
之后,BIOS重新初始化系统,NVDIMM将其nandflash内容恢复至服务器内存中,由于采用debug模式,BIOS不再进入系统,从而恢复后的内存数据不会被刷新,可保持不变,此时,类似于系统当机时的情况,参考图3,技术人员可将外部存储设备连接于BMC的NIC网口、串口或USB接口上,通过BMC读取服务器的内存数据,后续可根据内存数据中所包含的运行程序的上下文信息、变量状态等,对系统的异常原因进行分析,提高服务器的可维护性。
实施例四
本实施例四同样对非掉电原因导致系统意外重启时的服务器内存数据导出过程进行阐述,与实施例三的区别在于,本实施例的数据导出过程适用于采用DIMM的服务器。
参考图5,图5为本申请提供的一种内存数据导出方法实施例四的流程图,其中,所述步骤S103可以通过以下步骤实现:
S501:发出第五传输指令,以实现将服务器内存中的内存数据传输至服务器中的第五存储设备;
S502:接收用户的第三导出请求,所述第三导出请求为用户将其第三存储设备连接至服务器后所触发的请求;
S503:发出第三传输指令,以实现将所述第五存储设备中的内存数据传输至所述第三存储设备中。
本实施例中,由于服务器采用的内存条为DIMM,区别于NVDIMM,DIMM中未焊接NandFlash,无法在系统重启时,为内存数据提供可用的备份空间,因此,为了及时、有效地保留内存现场数据,需预先在服务器中内置一额外的存储设备,用于在系统意外重启时对内存现场数据进行缓存,以防丢失。
参考图6,当wacthdog检测到系统异常并即将发生意外重启(非掉电原因)时,BMC立刻通过DIMM的Slave接口将服务器内存数据保存至所述额外的存储设备(即图6中的staroge)中,之后,技术人员可通过BMC读取额外存储设备中的内存数据,将内存数据导出。
实施例五
本实施例五对软件原因导致系统意外掉电时的服务器内存数据导出过程进行说明,本实施例的数据导出过程适用于采用NVDIMM的服务器。
参考图7,图7为本申请提供的一种内存数据导出方法实施例五的流程图,其中,所述步骤S103可以通过以下步骤实现:
S701:设置BIOS为debug模式;
S702:在BIOS重新初始化系统后,接收用户的第四导出请求,所述第四导出请求为用户将其第四存储设备连接至所述服务器后所触发的请求;
S703:发出第四传输指令,以实现将服务器内存中的第四内存数据传输至所述第四存储设备,其中,所述第四内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
系统因软件原因意外掉电时,NVDIMM可以利用超级电容提供的电力自动将内存数据保存至其NandFlash中。
由于系统掉电为软件原因所导致,区别于物理掉电,该异常状况下,BMC仍连电,可继续工作。
当BMC通过Watchdog检测到系统掉电(软件原因)时,立即设置BIOS为debug模式,之后BIOS重新初始化系统,NVDIMM将其NandFlash内容恢复到服务器内存中,由于处于debug模式,BIOS不会进入系统,从而恢复后的内存数据不会被刷新,此时,类似于系统当机的情况,参考图3,技术人员可通过BMC连接外部存储设备,进行内存现场数据的导出,进而可为后续分析服务器异常原因,进行服务器维护提供支持。
实施例六
参考图8,图8为本申请提供的一种内存数据导出系统实施例六的结构示意图,所述系统可以包括获取模块100、判断模块200和处理模块300。
获取模块100,用于实时获取服务器系统的异常信息;
判断模块200,用于依据所获取的异常信息,判断服务器系统异常所属的异常类型;
其中,所述异常类型包括系统当机、非掉电原因导致的系统意外重启以及软件原因导致的系统意外掉电。
处理模块300,用于基于所述异常类型,对服务器的内存数据进行相应处理,以实现导出所述内存数据。
参考图9,所述处理模块300包括当机处理单元310、重启处理单元320和掉电处理单元330。
实际应用场景中,可采用软件程序的形式实现本申请系统各模块的处理逻辑。本实施例预先将本申请系统的实现程序写入服务器主板上的BMC(BaseboardManagementController,基板管理控制器)中,由BMC基于所写入的程序对服务器的相应器件进行调度或控制,实现在服务器异常时导出服务器内存的现场数据。
具体地,BMC通过监控装置Watchdog实时监测服务器操作系统的运行状态,并在监测到系统异常时获取异常信息,对异常信息进行分析,在此基础上判断服务器系统的异常类型。之后,BMC针对服务器系统所属的异常类型,触发相应的处理单元,导出服务器内存的现场数据。
目前,DIMM(Dual-Inline-Memory-Modules,双列直插式存储模块)或NVDIMM(NonvolatileDIMM,非易失性DIMM)均为单口模式,仅能为CPU(CPUCentralProcessingUnit,中央处理器)读、写内存数据提供接口。基于此,本申请为了能够同时为BMC导出内存数据提供接口,将DIMM或NVDIMM设计成了双端口dual-port模式,该设计模式下,DIMM或NVDIMM包括主口mainport和从口slaveport,其中,mainport由CPU控制,用于作为CPU读写内存数据的接口,slaveport连接到BMC,用于为BMC导出内存数据提供接口。
由以上方案可知,本发明提供的内存数据导出系统,实时检测服务器系统,在服务器系统出现例如当机、意外重启等此类异常现象时,获取服务器系统的异常信息,并依据异常信息,判断服务器系统所属的异常类型;在此基础上,通过对服务器内存数据进行与所述异常类型相对应的处理过程,实现导出服务器内存数据。可见,本发明可在服务器系统发生异常时,有效导出服务器内存的现场数据,进而可为后续进行服务器异常原因分析提供支持,提高了服务器的可维护性。
实施例七
本实施例七对当机处理单元310在系统当机时的内存数据导出过程进行说明,其中,当机处理单元的数据导出过程对采用DIMM或NVDIMM的服务器均适用。
参考图10,图10为本申请提供的一种内存数据导出系统实施例七的结构示意图,其中,所述当机处理单元310包括第一接收子单元311和第一控制子单元312。
第一接收子单元311,用于在所述异常类型为系统当机时,接收用户的第一导出请求,所述第一导出请求为用户将其第一存储设备连接至服务器后所触发的请求;
第一控制子单元312,用于发出第一传输指令,以实现将服务器内存中的第一内存数据传输至所述第一存储设备。
具体地,系统当机时,服务器不响应,且当机期间服务器内存现场数据不会丢失,此种情况下,参考图3,技术人员可直接通过BMC提供的NIC(NetworkInterfaceCard,网络适配器)网口、串口或USB(UniversalSerialBus,通用串行总线)接口将外部存储设备与服务器主板上的BMC相连接,并触发BMC进行数据传输控制,实现将服务器内存数据传输至(通过DIMM或NVDIMM的slaveport传输)外部存储设备,最终实现服务器内存现场数据的导出。
实施例八
本实施例八对重启处理单元320在非掉电原因导致系统意外重启时的内存数据导出过程进行说明,本实施例中,重启处理单元的数据导出过程仅适用于采用NVDIMM的服务器。
参考图11,图11为本申请提供的一种内存数据导出系统实施例八的结构示意图,其中,所述重启处理单元320包括触发子单元321、第一设置子单元322、第二接收子单元323和第二控制子单元324。
触发子单元321,用于在所述异常类型为非掉电原因所导致的系统意外重启时,发出触发指令,以触发非易失性存储模块NVDIMM将服务器内存中的内存数据转移至其存储器NandFlash中;
第一设置子单元322,用于设置基本输入输出系统BIOS为调试模式;
第二接收子单元323,用于在BIOS重新初始化系统后,接收用户的第二导出请求,所述第二导出请求为用户将其第二存储设备连接至服务器后所触发的请求;
第二控制子单元324,用于发出第二传输指令,以实现将服务器内存中的第二内存数据传输至所述第二存储设备,其中,所述第二内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
服务器重启时,内存数据会在重启过程中丢失,且NVDIMM不会自动保存内存数据至其NandFlash中进行内存数据备份(NVDIMM仅在系统掉电时自动备份内存数据)。
基于此,本实施例中,当BMC通过wacthdog检测到系统异常并即将发生意外重启(非掉电原因)时,立即通过BIOS(BasicInputOutputSystem,基本输入输出系统)触发NVDIMM将内存数据保存至其NandFlash中,同时设置BIOS为debug模式。
之后,BIOS重新初始化系统,NVDIMM将其nandflash内容恢复至服务器内存中,由于采用debug模式,BIOS不再进入系统,从而恢复后的内存数据不会被刷新冲击,可保持不变,此时,技术人员可将外部存储设备连接于BMC的NIC网口、串口或USB接口上,通过BMC读取服务器的内存数据,后续可根据内存数据中所包含的运行程序的上下文信息、变量状态等,对系统的异常原因进行分析,提高了服务器的可维护性。
实施例九
本实施例九同样对重启处理单元320在非掉电原因导致系统意外重启时的内存数据导出过程进行说明,区别于实施例八,本实施例中,重启处理单元的数据导出过程仅适用于采用DIMM的服务器。
参考图12,图12为本申请提供的一种内存数据导出系统实施例九的结构示意图,其中,所述重启处理单元320包括第五控制子单元325、第三接收子单元326和第三控制子单元327。
第五控制子单元325,用于在所述异常类型为非掉电原因所导致的系统意外重启时,发出第五传输指令,以实现将服务器内存中的内存数据传输至服务器中的第五存储设备;
第三接收子单元326,用于接收用户的第三导出请求,所述第三导出请求为用户将其第三存储设备连接至服务器后所触发的请求;
第三控制子单元327,用于发出第三传输指令,以实现将所述第五存储设备中的内存数据传输至所述第三存储设备中。
本实施例中,由于服务器采用的内存条为DIMM,区别于NVDIMM,DIMM中未焊接NandFlash,无法在系统重启时,为内存数据提供可用的备份空间,因此,为了及时、有效地保留内存现场数据,需预先在服务器中内置一额外的存储设备,用于在系统意外重启时对内存现场数据进行缓存,以防丢失。
参考图6,当BMC通过wacthdog检测到系统异常并即将发生意外重启(非掉电原因)时,立刻通过DIMM的Slave接口将服务器内存数据保存至所述额外的存储设备(即图6中的staroge)中,之后,技术人员可通过BMC读取额外存储设备中的内存数据,将内存数据导出。
实施例十
本实施例十对掉电处理单元330在软件原因导致系统意外掉电时的内存数据导出过程进行说明,本实施例中,掉电处理单元的数据导出过程仅适用于采用NVDIMM的服务器。
参考图13,图13为本申请提供的一种内存数据导出系统实施例十的结构示意图,其中,所述掉电处理单元330包括第二设置子单元331、第四接收子单元332和第四控制子单元333。
第二设置子单元331,用于在所述异常类型为软件原因所导致的系统意外掉电时,设置BIOS为debug模式;
第四接收子单元332,用于在BIOS重新初始化系统后,接收用户的第四导出请求,所述第四导出请求为用户将其第四存储设备连接至所述服务器后所触发的请求;
第四控制子单元333,用于发出第四传输指令,以实现将服务器内存中的第四内存数据传输至所述第四存储设备,其中,所述第四内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
系统因软件原因意外掉电时,NVDIMM可以利用超级电容提供的电力自动将内存数据保存至其NandFlash中。
由于系统掉电为软件原因所导致,区别于物理掉电,该异常状况下,BMC仍连电,可继续工作。
当BMC通过Watchdog检测到系统掉电(软件原因)时,立即设置BIOS为debug模式,之后BIOS重新初始化系统,NVDIMM将其NandFlash内容恢复到服务器内存中,由于处于debug模式,BIOS不会进入系统,从而恢复后的内存数据不会被刷新,此时技术人员可通过BMC读取内存数据,实现内存现场数据的导出,进而可为后续分析异常原因提供支持,提高了服务器的可维护性。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上系统时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种内存数据导出方法,其特征在于,包括:
实时获取服务器系统的异常信息;
依据所获取的异常信息,判断服务器系统异常所属的异常类型;
基于所述异常类型,对服务器的内存数据进行相应处理,以实现导出所述内存数据。
2.根据权利要求1所述的方法,其特征在于,所述异常类型包括系统当机、非掉电原因导致的系统意外重启以及软件原因导致的系统意外掉电。
3.根据权利要求2所述的方法,其特征在于,当所述异常类型为系统当机时,所述对服务器的内存数据进行相应处理包括:
接收用户的第一导出请求,所述第一导出请求为用户将其第一存储设备连接至服务器后所触发的请求;
发出第一传输指令,以实现将服务器内存中的第一内存数据传输至所述第一存储设备。
4.根据权利要求2所述的方法,其特征在于,当所述异常类型为非掉电原因所导致的系统意外重启时,所述对服务器的内存数据进行相应处理包括:
发出触发指令,以触发非易失性存储模块NVDIMM将服务器内存中的内存数据转移至其存储器NandFlash中;
设置基本输入输出系统BIOS为调试模式;
在BIOS重新初始化系统后,接收用户的第二导出请求,所述第二导出请求为用户将其第二存储设备连接至服务器后所触发的请求;
发出第二传输指令,以实现将服务器内存中的第二内存数据传输至所述第二存储设备,其中,所述第二内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
5.根据权利要求2所述的方法,其特征在于,当所述异常类型为非掉电原因所导致的系统意外重启时,所述对服务器的内存数据进行相应处理包括:
发出第五传输指令,以实现将服务器内存中的内存数据传输至服务器中的第五存储设备;
接收用户的第三导出请求,所述第三导出请求为用户将其第三存储设备连接至服务器后所触发的请求;
发出第三传输指令,以实现将所述第五存储设备中的内存数据传输至所述第三存储设备中。
6.根据权利要求2所述的方法,其特征在于,当所述异常类型为软件原因所导致的系统意外掉电时,所述对服务器的内存数据进行相应处理包括:
设置BIOS为debug模式;
在BIOS重新初始化系统后,接收用户的第四导出请求,所述第四导出请求为用户将其第四存储设备连接至所述服务器后所触发的请求;
发出第四传输指令,以实现将服务器内存中的第四内存数据传输至所述第四存储设备,其中,所述第四内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
7.一种内存数据导出系统,其特征在于,包括:
获取模块,用于实时获取服务器系统的异常信息;
判断模块,用于依据所获取的异常信息,判断服务器系统异常所属的异常类型;
处理模块,用于基于所述异常类型,对服务器的内存数据进行相应处理,以实现导出所述内存数据。
8.根据权利要求7所述的系统,其特征在于,所述处理模块包括当机处理单元、重启处理单元和掉电处理单元。
9.根据权利要求8所述的系统,其特征在于,所述当机处理单元包括:
第一接收子单元,用于在所述异常类型为系统当机时,接收用户的第一导出请求,所述第一导出请求为用户将其第一存储设备连接至服务器后所触发的请求;
第一控制子单元,用于发出第一传输指令,以实现将服务器内存中的第一内存数据传输至所述第一存储设备。
10.根据权利要求8所述的系统,其特征在于,所述重启处理单元包括:
触发子单元,用于在所述异常类型为非掉电原因所导致的系统意外重启时,发出触发指令,以触发非易失性存储模块NVDIMM将服务器内存中的内存数据转移至其存储器NandFlash中;
第一设置子单元,用于设置基本输入输出系统BIOS为调试模式;
第二接收子单元,用于在BIOS重新初始化系统后,接收用户的第二导出请求,所述第二导出请求为用户将其第二存储设备连接至服务器后所触发的请求;
第二控制子单元,用于发出第二传输指令,以实现将服务器内存中的第二内存数据传输至所述第二存储设备,其中,所述第二内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
11.根据权利要求8所述的系统,其特征在于,所述重启处理单元包括:
第五控制子单元,用于在所述异常类型为非掉电原因所导致的系统意外重启时,发出第五传输指令,以实现将服务器内存中的内存数据传输至服务器中的第五存储设备;
第三接收子单元,用于接收用户的第三导出请求,所述第三导出请求为用户将其第三存储设备连接至服务器后所触发的请求;
第三控制子单元,用于发出第三传输指令,以实现将所述第五存储设备中的内存数据传输至所述第三存储设备中。
12.根据权利要求8所述的系统,其特征在于,所述掉电处理单元包括:
第二设置子单元,用于在所述异常类型为软件原因所导致的系统意外掉电时,设置BIOS为debug模式;
第四接收子单元,用于在BIOS重新初始化系统后,接收用户的第四导出请求,所述第四导出请求为用户将其第四存储设备连接至所述服务器后所触发的请求;
第四控制子单元,用于发出第四传输指令,以实现将服务器内存中的第四内存数据传输至所述第四存储设备,其中,所述第四内存数据为NVDIMM在BIOS重新初始化系统后,将其NandFlash内容恢复至服务器内存后,服务器内存所得的恢复数据。
CN201410795107.XA 2014-12-18 2014-12-18 一种内存数据导出方法和系统 Active CN105760241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410795107.XA CN105760241B (zh) 2014-12-18 2014-12-18 一种内存数据导出方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410795107.XA CN105760241B (zh) 2014-12-18 2014-12-18 一种内存数据导出方法和系统

Publications (2)

Publication Number Publication Date
CN105760241A true CN105760241A (zh) 2016-07-13
CN105760241B CN105760241B (zh) 2019-07-26

Family

ID=56340752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410795107.XA Active CN105760241B (zh) 2014-12-18 2014-12-18 一种内存数据导出方法和系统

Country Status (1)

Country Link
CN (1) CN105760241B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502816A (zh) * 2016-10-31 2017-03-15 宇龙计算机通信科技(深圳)有限公司 电子设备、数据导出方法及系统
CN106571954A (zh) * 2016-10-24 2017-04-19 上海斐讯数据通信技术有限公司 一种ap设备的异常重启原因检测方法及装置
CN106959906A (zh) * 2017-03-28 2017-07-18 联想(北京)有限公司 信息处理方法、信息处理装置及电子设备
WO2019019283A1 (zh) * 2017-07-24 2019-01-31 深圳市盛路物联通讯技术有限公司 物联网无线接入点异常处理方法及设备
CN109634795A (zh) * 2018-12-12 2019-04-16 浪潮(北京)电子信息产业有限公司 服务器整机系统的调试方法、装置、设备及存储介质
CN110377357A (zh) * 2019-06-26 2019-10-25 苏州浪潮智能科技有限公司 一种服务器中dimm的配置方法、系统及装置
CN111125008A (zh) * 2019-12-20 2020-05-08 浪潮电子信息产业股份有限公司 一种异常inode的动态修复方法、系统及相关组件
CN116225812A (zh) * 2023-05-08 2023-06-06 山东云海国创云计算装备产业创新中心有限公司 基板管理控制器系统运行方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6516423B1 (en) * 1999-10-21 2003-02-04 Ericsson Inc. System and method for providing multiple queue redundancy in a distributed computing system
CN101257661A (zh) * 2008-04-09 2008-09-03 中兴通讯股份有限公司 一种大容量用户业务信息加载方法及其系统
CN201576243U (zh) * 2009-10-28 2010-09-08 上海梅山钢铁股份有限公司 一种基于ups信息实现计算机内存数据保护的装置
CN102138129A (zh) * 2008-09-05 2011-07-27 飞思卡尔半导体公司 用于数据处理系统中的统一高速缓存的错误检测方案
CN102413247A (zh) * 2011-11-30 2012-04-11 中兴通讯股份有限公司 终端死机现场的恢复方法及装置
CN103186461A (zh) * 2011-12-30 2013-07-03 重庆重邮信科通信技术有限公司 一种现场数据的保存方法和恢复方法以及相关装置
CN103559105A (zh) * 2013-11-11 2014-02-05 上海航天测控通信研究所 一种基于erc32处理器的星载软件系统及其重入方法
CN103927240A (zh) * 2014-05-06 2014-07-16 成都西加云杉科技有限公司 应对软件崩溃的信息转储方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6516423B1 (en) * 1999-10-21 2003-02-04 Ericsson Inc. System and method for providing multiple queue redundancy in a distributed computing system
CN101257661A (zh) * 2008-04-09 2008-09-03 中兴通讯股份有限公司 一种大容量用户业务信息加载方法及其系统
CN102138129A (zh) * 2008-09-05 2011-07-27 飞思卡尔半导体公司 用于数据处理系统中的统一高速缓存的错误检测方案
CN201576243U (zh) * 2009-10-28 2010-09-08 上海梅山钢铁股份有限公司 一种基于ups信息实现计算机内存数据保护的装置
CN102413247A (zh) * 2011-11-30 2012-04-11 中兴通讯股份有限公司 终端死机现场的恢复方法及装置
CN103186461A (zh) * 2011-12-30 2013-07-03 重庆重邮信科通信技术有限公司 一种现场数据的保存方法和恢复方法以及相关装置
CN103559105A (zh) * 2013-11-11 2014-02-05 上海航天测控通信研究所 一种基于erc32处理器的星载软件系统及其重入方法
CN103927240A (zh) * 2014-05-06 2014-07-16 成都西加云杉科技有限公司 应对软件崩溃的信息转储方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106571954A (zh) * 2016-10-24 2017-04-19 上海斐讯数据通信技术有限公司 一种ap设备的异常重启原因检测方法及装置
CN106502816A (zh) * 2016-10-31 2017-03-15 宇龙计算机通信科技(深圳)有限公司 电子设备、数据导出方法及系统
CN106959906A (zh) * 2017-03-28 2017-07-18 联想(北京)有限公司 信息处理方法、信息处理装置及电子设备
WO2019019283A1 (zh) * 2017-07-24 2019-01-31 深圳市盛路物联通讯技术有限公司 物联网无线接入点异常处理方法及设备
CN109634795B (zh) * 2018-12-12 2022-04-22 浪潮(北京)电子信息产业有限公司 服务器整机系统的调试方法、装置、设备及存储介质
CN109634795A (zh) * 2018-12-12 2019-04-16 浪潮(北京)电子信息产业有限公司 服务器整机系统的调试方法、装置、设备及存储介质
CN110377357B (zh) * 2019-06-26 2022-05-24 苏州浪潮智能科技有限公司 一种服务器中dimm的配置方法、系统及装置
CN110377357A (zh) * 2019-06-26 2019-10-25 苏州浪潮智能科技有限公司 一种服务器中dimm的配置方法、系统及装置
CN111125008B (zh) * 2019-12-20 2022-04-22 浪潮电子信息产业股份有限公司 一种异常inode的动态修复方法、系统及相关组件
CN111125008A (zh) * 2019-12-20 2020-05-08 浪潮电子信息产业股份有限公司 一种异常inode的动态修复方法、系统及相关组件
US11650875B2 (en) 2019-12-20 2023-05-16 Inspur Electronic Information Industry Co., Ltd. Abnormal inode dynamic repair method and system, and related component
CN116225812A (zh) * 2023-05-08 2023-06-06 山东云海国创云计算装备产业创新中心有限公司 基板管理控制器系统运行方法、装置、设备及存储介质
CN116225812B (zh) * 2023-05-08 2023-08-04 山东云海国创云计算装备产业创新中心有限公司 基板管理控制器系统运行方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN105760241B (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
CN105760241A (zh) 一种内存数据导出方法和系统
CN111352338B (zh) 一种双余度飞控计算机及余度管理方法
CN105589776B (zh) 一种故障定位方法及服务器
CN101833497B (zh) 一种基于专家系统方法的计算机故障管理系统
CN205539996U (zh) 控制器、i/o通信总线和通信模块冗余的控制系统
CN103425553B (zh) 一种双机热备份系统及该系统的故障检测方法
CN101807076B (zh) 基于profibus现场总线的具有协同热备份功能的双模冗余容错高可靠控制系统
CN201909961U (zh) 一种冗余控制系统
CN110376876B (zh) 一种双系同步的安全计算机平台
CN109189600A (zh) 一种基于多模冗余嵌入式软件的计算机系统及设计方法
CN104320308B (zh) 一种服务器异常检测的方法及装置
CN107463459A (zh) 系统异常内存数据的保存方法、装置、系统及终端设备
CN103544092A (zh) 一种基于arinc653标准机载电子设备健康监控体系
US9952579B2 (en) Control device
CN105243004A (zh) 一种故障资源检测方法及装置
CN102880527B (zh) 一种基板管理控制器的数据恢复方法
CN101286129A (zh) 嵌入式系统调试
CN110928719A (zh) Ssd低功耗模式异常处理方法、装置、计算机设备及存储介质
CN103853147B (zh) 一种嵌入式系统的在线调试系统
CN107111595A (zh) 双用途引导寄存器
CN110427283A (zh) 一种双余度的燃油管理计算机系统
CN101494564B (zh) 一种电源监控装置及单板热备份的实现方法
CN110445638A (zh) 一种交换机系统故障保护方法及装置
CN206460446U (zh) 一种针对加固计算机主板的监控装置
CN103631739A (zh) 嵌入式系统的定位分析方法和嵌入式系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant