CN116820862A - 一种内存故障模拟方法、装置、设备及机器可读存储介质 - Google Patents

一种内存故障模拟方法、装置、设备及机器可读存储介质 Download PDF

Info

Publication number
CN116820862A
CN116820862A CN202310769480.7A CN202310769480A CN116820862A CN 116820862 A CN116820862 A CN 116820862A CN 202310769480 A CN202310769480 A CN 202310769480A CN 116820862 A CN116820862 A CN 116820862A
Authority
CN
China
Prior art keywords
memory
target server
simulated
fault
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310769480.7A
Other languages
English (en)
Inventor
谭晓涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Information Technologies Co Ltd
Original Assignee
New H3C Information Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Information Technologies Co Ltd filed Critical New H3C Information Technologies Co Ltd
Priority to CN202310769480.7A priority Critical patent/CN116820862A/zh
Publication of CN116820862A publication Critical patent/CN116820862A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/261Functional testing by simulating additional hardware, e.g. fault simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供一种内存故障模拟方法、装置、设备及机器可读存储介质,该方法包括:获取目标服务器的待模拟故障内存的内存信息;根据内存信息,导入配置数据,修改GRUB配置;执行修改后的配置,屏蔽待模拟故障的内存。通过本公开的技术方案,通过管理服务器控制目标服务器屏蔽待模拟故障的内存,实现内存故障模拟,从而可批量化地模拟内存故障,且可方便地模拟不同组合的内存故障,并避免真实损坏硬件设备,有效提高测试效率。

Description

一种内存故障模拟方法、装置、设备及机器可读存储介质
技术领域
本公开涉及通信技术领域,尤其是涉及一种内存故障模拟方法、装置、设备及机器可读存储介质。
背景技术
GRUB(Grand Unified Bootloader)广泛使用的引导加载程序。BIOS(Basic InputOutput System)基本输入输出系统。BMC(Baseboard Management Controller)基板管理控制器。RAS(Reliability、Availability、Serviceability)可靠性、可用性和可维护性。
随着信息技术领域的持续高速发展,各行业都对服务器的安全和稳定性提出了越来越高的要求。对于服务器系统的核心组件之一——内存模块,其可靠性和性能对整个系统的运行和效率至关重要。然而,现代服务器系统中,内存模块巨大的体量、高速的传输速率以及极其复杂的结构设计使得测试和验证内存的可靠性和性能成为一项极具挑战性的任务。当前针对于intel服务器的内存测试中,存在大量对于插法以及故障内存的要求。当前对于故障内存的测试主要依赖于人为制作故障内存,但是这种方式比较耗时,并且操作不当会导致损坏内存情况的发生。
发明内容
有鉴于此,本公开提供一种内存故障模拟方法、装置及电子设备、机器可读存储介质,以改善上述内存故障测试不便的问题。
具体地技术方案如下:
本公开提供了一种内存故障模拟方法,应用于管理服务器,所述方法包括:获取目标服务器的待模拟故障内存的内存信息;根据内存信息,导入配置数据,修改GRUB配置;执行修改后的配置,屏蔽待模拟故障的内存。
作为一种技术方案,所述获取目标服务器的待模拟故障内存的内存信息,包括:通过redfish协议向目标服务器发送查询信令,获取目标服务器响应于查询信令反馈的待模拟故障内存的内存信息,所述查询信令包括内存识别信息,所述内存信息包括内存的物理地址、容量。
作为一种技术方案,所述执行修改后的配置,屏蔽待模拟故障的内存,包括:通过redfish协议向目标服务器发送日志信令,获取目标服务器响应于日志信令反馈的BMC日志,提取BMC日志的内存故障信息。
作为一种技术方案,所述根据内存信息,导入配置数据,修改GRUB配置,包括:保持与目标服务器处于相同的网段,通过SSH通道登录目标服务器的系统,监控GRUB配置的修改。
本公开同时提供了一种内存故障模拟装置,应用于管理服务器,所述装置包括:第一模块,用于获取目标服务器的待模拟故障内存的内存信息;第二模块,用于根据内存信息,导入配置数据,修改GRUB配置;第三模块,用于执行修改后的配置,屏蔽待模拟故障的内存。
作为一种技术方案,所述获取目标服务器的待模拟故障内存的内存信息,包括:通过redfish协议向目标服务器发送查询信令,获取目标服务器响应于查询信令反馈的待模拟故障内存的内存信息,所述查询信令包括内存识别信息,所述内存信息包括内存的物理地址、容量。
作为一种技术方案,所述执行修改后的配置,屏蔽待模拟故障的内存,包括:通过redfish协议向目标服务器发送日志信令,获取目标服务器响应于日志信令反馈的BMC日志,提取BMC日志的内存故障信息。
作为一种技术方案,所述根据内存信息,导入配置数据,修改GRUB配置,包括:保持与目标服务器处于相同的网段,通过SSH通道登录目标服务器的系统,监控GRUB配置的修改。
本公开同时提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,处理器执行所述机器可执行指令以实现前述的内存故障模拟方法。
本公开同时提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现前述的内存故障模拟方法。
本公开提供的上述技术方案至少带来了以下有益效果:
通过管理服务器控制目标服务器屏蔽待模拟故障的内存,实现内存故障模拟,从而可批量化地模拟内存故障,且可方便地模拟不同组合的内存故障,并避免真实损坏硬件设备,有效提高测试效率。
附图说明
为了更加清楚地说明本公开实施方式或者现有技术中的技术方案,下面将对本公开实施方式或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中记载的一些实施方式,对于本领域普通技术人员来讲,还可以根据本公开实施方式的这些附图获得其他的附图。
图1是本公开一种实施方式中的内存故障模拟方法的流程图;
图2是本公开一种实施方式中的内存故障模拟装置的结构图;
图3是本公开一种实施方式中的电子设备的硬件结构图。
附图标记:第一模块21,第二模块22,第三模块23。
具体实施方式
在本公开实施方式使用的术语仅仅是出于描述特定实施方式的目的,而非限制本公开。本公开和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开实施方式可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本公开提供一种内存故障模拟方法、装置及电子设备、机器可读存储介质,以至少改善上述技术问题之一。
具体地技术方案如后述。
在一种实施方式中,本公开提供了一种内存故障模拟方法,应用于管理服务器,所述方法包括:获取目标服务器的待模拟故障内存的内存信息;根据内存信息,导入配置数据,修改GRUB配置;执行修改后的配置,屏蔽待模拟故障的内存。
具体地,如图1,包括以下步骤:
步骤S11,获取目标服务器的待模拟故障内存的内存信息;
步骤S12,根据内存信息,导入配置数据,修改GRUB配置;
步骤S13,执行修改后的配置,屏蔽待模拟故障的内存。
通过管理服务器控制目标服务器屏蔽待模拟故障的内存,实现内存故障模拟,从而可批量化地模拟内存故障,且可方便地模拟不同组合的内存故障,并避免真实损坏硬件设备,有效提高测试效率。
在一种实施方式中,所述获取目标服务器的待模拟故障内存的内存信息,包括:通过redfish协议向目标服务器发送查询信令,获取目标服务器响应于查询信令反馈的待模拟故障内存的内存信息,所述查询信令包括内存识别信息,所述内存信息包括内存的物理地址、容量。
在一种实施方式中,所述执行修改后的配置,屏蔽待模拟故障的内存,包括:通过redfish协议向目标服务器发送日志信令,获取目标服务器响应于日志信令反馈的BMC日志,提取BMC日志的内存故障信息。
在一种实施方式中,所述根据内存信息,导入配置数据,修改GRUB配置,包括:保持与目标服务器处于相同的网段,通过SSH通道登录目标服务器的系统,监控GRUB配置的修改。
在一种实施方式中,提供基于robot framework和Python框架的服务器在linux下批量模拟故障内存的工具,可以稳定的在linux下屏蔽掉部分内存,模拟不同的内存插法,对于一些简单的或者重复性较高的对于系统功能的验证,能够提升效率,减少人为的去制作故障内存。本实施方式基于robot framework和Python框架,结合redfish和SSH实现信息获取、收集日志等操作,通过更改GRUB配置数据来完成模拟故障内存。
具体地,通过redfish协议发送指令,查询需要的数据的参数,包括需要屏蔽的内存的物理地址,内存大小等,并完成数据配置导入;确保目标服务器OS的网络与管理服务器在同一网段,通过SSH通道登录到目标服务器的OS中,监控修改过程;BMC的日志可以通过发送redfish指令获取,OS下的日志可以从SSH通道登录到目标服务器OS中获取,分别提取其中故障上报的日志,从而监控系统是否能够正常启动。
以上实施方式基于robot framework和Python完成基本框架,结合redfish协议提供了Intel服务器在linux环境下批量内存屏蔽,模拟不同的内存插法,减少一些的重复度较高的内存插拔操作以及故障内存制作,可以有效提高测试的效率。
在一种实施方式中,本公开同时提供了一种内存故障模拟装置,如图2,应用于管理服务器,所述装置包括:第一模块,用于获取目标服务器的待模拟故障内存的内存信息;第二模块,用于根据内存信息,导入配置数据,修改GRUB配置;第三模块,用于执行修改后的配置,屏蔽待模拟故障的内存。
在一种实施方式中,所述获取目标服务器的待模拟故障内存的内存信息,包括:通过redfish协议向目标服务器发送查询信令,获取目标服务器响应于查询信令反馈的待模拟故障内存的内存信息,所述查询信令包括内存识别信息,所述内存信息包括内存的物理地址、容量。
在一种实施方式中,所述执行修改后的配置,屏蔽待模拟故障的内存,包括:通过redfish协议向目标服务器发送日志信令,获取目标服务器响应于日志信令反馈的BMC日志,提取BMC日志的内存故障信息。
在一种实施方式中,所述根据内存信息,导入配置数据,修改GRUB配置,包括:保持与目标服务器处于相同的网段,通过SSH通道登录目标服务器的系统,监控GRUB配置的修改。
装置实施方式与对应的方法实施方式相同或相似,在此不再赘述。
在一种实施方式中,本公开提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,处理器执行所述机器可执行指令以实现前述的内存故障模拟方法,从硬件层面而言,硬件架构示意图可以参见图3所示。
在一种实施方式中,本公开提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现前述的内存故障模拟方法。
这里,机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(RadomAccess Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施方式阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本公开时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本公开的实施方式可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施方式、完全软件实施方式、或结合软件和硬件方面的实施方式的形式。而且,本公开实施方式可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施方式的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域技术人员应明白,本公开的实施方式可提供为方法、系统或计算机程序产品。因此,本公开可以采用完全硬件实施方式、完全软件实施方式、或者结合软件和硬件方面的实施方式的形式。而且,本公开可以采用在一个或者多个其中包含有计算机可用程序代码的计算机可用存储介质(可以包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本公开的实施方式而已,并不用于限制本公开。对于本领域技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本公开的权利要求范围之内。

Claims (10)

1.一种内存故障模拟方法,其特征在于,应用于管理服务器,所述方法包括:
获取目标服务器的待模拟故障内存的内存信息;
根据内存信息,导入配置数据,修改GRUB配置;
执行修改后的配置,屏蔽待模拟故障的内存。
2.根据权利要求1所述的方法,其特征在于,所述获取目标服务器的待模拟故障内存的内存信息,包括:
通过redfish协议向目标服务器发送查询信令,获取目标服务器响应于查询信令反馈的待模拟故障内存的内存信息,所述查询信令包括内存识别信息,所述内存信息包括内存的物理地址、容量。
3.根据权利要求1所述的方法,其特征在于,所述执行修改后的配置,屏蔽待模拟故障的内存,包括:
通过redfish协议向目标服务器发送日志信令,获取目标服务器响应于日志信令反馈的BMC日志,提取BMC日志的内存故障信息。
4.根据权利要求1所述的方法,其特征在于,所述根据内存信息,导入配置数据,修改GRUB配置,包括:
保持与目标服务器处于相同的网段,通过SSH通道登录目标服务器的系统,监控GRUB配置的修改。
5.一种内存故障模拟装置,其特征在于,应用于管理服务器,所述装置包括:
第一模块,用于获取目标服务器的待模拟故障内存的内存信息;
第二模块,用于根据内存信息,导入配置数据,修改GRUB配置;
第三模块,用于执行修改后的配置,屏蔽待模拟故障的内存。
6.根据权利要求5所述的装置,其特征在于,所述获取目标服务器的待模拟故障内存的内存信息,包括:
通过redfish协议向目标服务器发送查询信令,获取目标服务器响应于查询信令反馈的待模拟故障内存的内存信息,所述查询信令包括内存识别信息,所述内存信息包括内存的物理地址、容量。
7.根据权利要求5所述的装置,其特征在于,所述执行修改后的配置,屏蔽待模拟故障的内存,包括:
通过redfish协议向目标服务器发送日志信令,获取目标服务器响应于日志信令反馈的BMC日志,提取BMC日志的内存故障信息。
8.根据权利要求5所述的装置,其特征在于,所述根据内存信息,导入配置数据,修改GRUB配置,包括:
保持与目标服务器处于相同的网段,通过SSH通道登录目标服务器的系统,监控GRUB配置的修改。
9.一种电子设备,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储+介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令,以实现权利要求1-4任一所述的方法。
10.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现权利要求1-4任一所述的方法。
CN202310769480.7A 2023-06-27 2023-06-27 一种内存故障模拟方法、装置、设备及机器可读存储介质 Pending CN116820862A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310769480.7A CN116820862A (zh) 2023-06-27 2023-06-27 一种内存故障模拟方法、装置、设备及机器可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310769480.7A CN116820862A (zh) 2023-06-27 2023-06-27 一种内存故障模拟方法、装置、设备及机器可读存储介质

Publications (1)

Publication Number Publication Date
CN116820862A true CN116820862A (zh) 2023-09-29

Family

ID=88119795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310769480.7A Pending CN116820862A (zh) 2023-06-27 2023-06-27 一种内存故障模拟方法、装置、设备及机器可读存储介质

Country Status (1)

Country Link
CN (1) CN116820862A (zh)

Similar Documents

Publication Publication Date Title
CN110557299A (zh) 一种网络传输功能批量测试方法、系统、终端及存储介质
CN106878363A (zh) 一种信息处理方法、装置及系统
CN107357721B (zh) 测试系统的方法及装置
CN113168364A (zh) 一种芯片验证方法和装置
CN114609995A (zh) 故障控制方法、装置、系统、设备、介质及产品
WO2014204470A1 (en) Generating a fingerprint representing a response of an application to a simulation of a fault of an external service
CN112732427B (zh) 一种基于Redis集群的数据处理方法、系统和相关装置
CN111597093B (zh) 一种异常处理方法、装置及其设备
CN116820862A (zh) 一种内存故障模拟方法、装置、设备及机器可读存储介质
CN116009889A (zh) 深度学习模型的部署方法、装置、电子设备及存储介质
CN114356454B (zh) 对账数据处理方法、设备、存储介质及程序产品
CN116402325A (zh) 业务流程自动化处理方法及装置
CN115470141A (zh) 一种故障模拟方法、装置及相关设备
CN111367750B (zh) 一种异常处理方法、装置及其设备
CN114363211A (zh) 一种灾备系统网络的网络连通验证方法及相关设备
CN114385496A (zh) 测试方法、装置、电子设备及计算机可读存储介质
CN110347683B (zh) 一种数据表合并处理方法及装置
CN115858324B (zh) 基于ai的it设备故障处理方法、装置、设备和介质
CN111124889B (zh) 一种基于ICOS系统的主机Numa测试方法、系统及设备
CN116797511A (zh) 一种判断晶圆晶背异常接触点来源的方法、装置和设备
CN117130945B (zh) 一种测试方法和装置
CN113254328B (zh) 白盒测试方法、系统、移动终端及存储介质
CN115794646A (zh) 软件测试方法、装置、电子设备及存储介质
CN115037589A (zh) 一种配置下发方法及装置
CN115437677A (zh) 一种配置管理方法、装置、设备及机器可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination