CN109213648A - Rack机柜开关机稳定性测试方法、装置、终端及存储介质 - Google Patents

Rack机柜开关机稳定性测试方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN109213648A
CN109213648A CN201811021328.6A CN201811021328A CN109213648A CN 109213648 A CN109213648 A CN 109213648A CN 201811021328 A CN201811021328 A CN 201811021328A CN 109213648 A CN109213648 A CN 109213648A
Authority
CN
China
Prior art keywords
rmc
rack cabinet
shutdown
gpu box
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811021328.6A
Other languages
English (en)
Inventor
刘东伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811021328.6A priority Critical patent/CN109213648A/zh
Publication of CN109213648A publication Critical patent/CN109213648A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2289Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by configuration test

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本申请实施例提供一种RACK机柜开关机稳定性测试方法、装置、终端及存储介质,所述方法包括:配置RMC配置文件并将所述配置文件导入RMC;控制RMC下发开机指令执行开机;检测GPU BOX节点数量并对GPU BOX节点进行压力测试;控制RMC下发关机指令执行关机。本发明能够自动检测RACK机柜开关机稳定性,避免了开机后GPU无法正常使用的问题。

Description

RACK机柜开关机稳定性测试方法、装置、终端及存储介质
技术领域
本发明属于整机柜性能测试技术领域,具体涉及一种RACK机柜开关机稳定性测试方法、装置、终端及存储介质。
背景技术
在云计算时代,随着AI(Artificial Intelligence,人工智能)的发展及演进,需要强大的服务器来进行深度学习、视频编解码、科学计算等多种场景的快速、稳定、弹性的计算服务,采用GPU(Graphics Processing Unit,图形处理器)的服务器应运产生。计算型服务器——PCIE-SWITH(PCIE,全称为 peripheral component interconnect express,是一种高速串行计算机扩展总线标准;SWITH,是一种服务器)是一种全新架构的服务器,该服务器在中国的整机柜服务器领域能够满足客户对高性能计算服务器的需求。PCIE-SWITCHRACK机柜由两种节点组成,一种是计算节点、一种是GPU BOX节点,GPU BOX 节点通过MiniSAS HD连接计算节点,GPU BOX节点内装载有GPU。此机型对计算节点和GPU BOX的开关机时序有着严格的要求:开机时,必须要求GPU BOX节点开机后计算节点再开机,关机时,必须计算节点关机后GPU BOX节点再关机。如果不按正常操作,那就会导致计算节点检测不到GPUBOX中的GPU,无法正常使用GPU,因此测试PCIE-SWITCH RACK机柜的开关机稳定性变的尤为重要。
发明内容
针对现有技术的不足,本发明提供一种RACK机柜开关机稳定性测试方法、装置、终端及存储介质,以解决上述技术问题。
第一方面,本申请实施例提供一种RACK机柜开关机稳定性测试方法,所述方法包括:
配置RMC配置文件并将所述配置文件导入RMC(Rack Management Controller,Rack机柜管理模块);
控制RMC下发开机指令执行开机;
检测GPU BOX节点数量并对GPU BOX节点进行压力测试;
控制RMC下发关机指令执行关机。
结合第一方面,在第一方面的第一种实施方式中,所述配置RMC配置文件并将所述配置文件导入RMC包括:
设置RACK机柜的节点数量;
设置RACK机柜中的节点布局;
设置RACK机柜的GPU BOX节点数量;
设置RACK机柜中的GPU BOX节点布局。
结合第一方面,在第一方面的第二种实施方式中,所述检测GPU BOX节点数量并对GPU BOX节点进行压力测试包括:
设置开机等待时间和压力测试时间;
判断开机运行时间是否达到开机等待时间:
是,则对GPU BOX节点执行数量检测并根据压力测试时间对GPU BOX节点进行压力测试;
否,则保持机柜运行状态。
结合第一方面,在第一方面的第三种实施方式中,所述控制RMC下发关机指令执行关机包括:
设置关机持续时间和循环次数;
控制RMC下发关机指令;
控制RMC下发RACK机柜电源关闭指令;
判断本次测试是否达到循环次数:
是,则终止所述开关机稳定性测试;
否,则根据所述关机持续时间循环执行所述开关机稳定性测试。
第二方面,本申请实施例提供一种RACK机柜开关机稳定性测试装置,所述装置包括:
配置单元,配置用于配置RMC配置文件并将所述配置文件导入RMC;
开机单元,配置用于控制RMC下发开机指令执行开机;
测试单元,配置用于检测GPU BOX节点数量并对GPU BOX节点进行压力测试;
关机单元,配置用于控制RMC下发关机指令执行关机。
结合第二方面,在第二方面的第一种实施方式中,所述配置单元包括:
第一数量设置模块,配置用于设置RACK机柜的节点数量;
第一布局设置模块,配置用于设置RACK机柜中的节点布局;
第二数量设置模块,配置用于设置RACK机柜的GPU BOX节点数量;
第二布局设置模块,配置用于设置RACK机柜中的GPU BOX节点布局。
结合第二方面,在第二方面的第二种实施方式中,所述测试单元包括:
时间设置模块,配置用于设置开机等待时间和压力测试时间;
时间判断模块,配置用于判断开机运行时间是否达到开机等待时间:
测试执行模块,配置用于对GPU BOX节点执行数量检测并根据压力测试时间对GPUBOX节点进行压力测试;
状态保持模块,配置用于保持机柜运行状态。
结合第二方面,在第二方面的第三种实施方式中,所述关机单元包括:
设置模块,配置用于设置关机持续时间和循环次数;
关机模块,配置用于控制RMC下发关机指令;
下电模块,配置用于控制RMC下发RACK机柜电源关闭指令;
判断模块,配置用于判断本次测试是否达到循环次数;
终止模块,配置用于终止所述开关机稳定性测试;
循环模块,配置用于根据所述关机持续时间循环执行所述开关机稳定性测试。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端终端执行上述的终端终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的RACK机柜开关机稳定性测试方法、装置、终端及存储介质,通过配置RMC配置文件,使RMC能够动态识别GPU BOX节点,进而按照节点执行顺序控制RACK开关机,并在RACK开机后通过GPU BOX节点进行数量检测和压力测试来检测GPU BOX节点状态,从而确保GPU可以正常使用。本发明能够自动检测RACK机柜开关机稳定性,避免了开机后GPU无法正常使用的问题。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例的方法的示意性流程图。
图2是本申请一个实施例的装置的示意性框图。
图3是本申请一个实施例的机柜示意图。
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本申请中出现的关键术语进行解释。
图1是本申请一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种RACK机柜开关机稳定性测试装置。
如图1所示,该方法100包括:
步骤110,配置RMC配置文件并将所述配置文件导入RMC;
步骤120,控制RMC下发开机指令执行开机;
步骤130,检测GPU BOX节点数量并对GPU BOX节点进行压力测试;
步骤140,控制RMC下发关机指令执行关机。
为了便于对本发明的理解,下面以本发明测试RACK机柜开关机稳定性的原理,结合实施例中对RACK机柜开关机稳定性进行检测的过程,对本发明提供的 RACK机柜开关机稳定性测试方法做进一步的描述。
可选地,作为本申请一个实施例,所述配置RMC配置文件并将所述配置文件导入RMC包括:
设置RACK机柜的节点数量;
设置RACK机柜中的节点布局;
设置RACK机柜的GPU BOX节点数量;
设置RACK机柜中的GPU BOX节点布局。
可选地,作为本申请一个实施例,所述检测GPU BOX节点数量并对GPU BOX 节点进行压力测试包括:
设置开机等待时间和压力测试时间;
判断开机运行时间是否达到开机等待时间:
是,则对GPU BOX节点执行数量检测并根据压力测试时间对GPU BOX节点进行压力测试;
否,则保持机柜运行状态。
可选地,作为本申请一个实施例,所述控制RMC下发关机指令执行关机包括:
设置关机持续时间和循环次数;
控制RMC下发关机指令;
控制RMC下发RACK机柜电源关闭指令;
判断本次测试是否达到循环次数:
是,则终止所述开关机稳定性测试;
否,则根据所述关机持续时间循环执行所述开关机稳定性测试。
具体的,所述RACK机柜开关机稳定性方法包括:
S1、配置RMC配置文件并将所述配置文件导入RMC。
RMC通过其动态配置和功能,区分计算节点和GPU BOX节点,从而实现了计算节点和GPU BOX节点的上下电时序逻辑。
动态配置如下,RMC下通过如下方式进行动态配置,根据如下Rmc.config 文件中的GPUBOX字段判断节点是否是GPU BOX,将配置好的文件导入RMC,即可实现
~#RMC_Asset_DC output Rmc.config//导出RMC配置文本
Configuration file was exported successfully:/var/Rmc.config// 编辑配置文本
~#vi/var/Rmc.config
Node_Type:1
Node_A_Mount:4//计算节点和BOX总的数量
Node_A_Location:0x000x000x080x8C 0x00//计算节点和BOX在机柜的布局
GPUBOX_Mount:2//GPU BOX总的数量
GPUBOX_Location:0x000x000x01 0x100x00//GPU BOX在机柜中的布局
~#RMC_Asset_DC input Rmc.config//将配置文件导入
S2、控制RMC下发开机指令执行开机。
S3、检测GPU BOX节点数量并对GPU BOX节点进行压力测试。
本实施例开机等待时间设置为20min和压力测试时间设置为10min,机柜开机后运行20min启动GPU数量检测脚本,GPU数量检测脚本 GPU_numercheck.sh主要由以下lspci命令组成,在计算节点开机后,将以 GPU_numercheck.sh加入到rc.local中,开机自动运行。如下以NVDIA显卡为例说明:
lspci|grep–i NVDIA|tee–a GPU_numbercheck.log
同理,GPU_stress.sh脚本(压力测试脚本)也按照相同方法放到rc.local 中,计算节点开机即可自动启动压力测试程式,测试10min。
S4、控制RMC下发关机指令执行关机。
其中步骤S2和步骤S4通过开关机脚本执行。通过控制主机连接RMC,运行整机柜开关机chassis_stress.sh脚本,此部分主要通过expect语言实现,控制节点控制RMC对整机柜发送命令。示例如下:
send"start chassis/\r"//整机柜开机命令
expect"*system*"
exec sleep 1200//等待20min中,执行GPU数量检测和压力测试
send"stop chassis/\r"//RMC发送整机关机指令
exec sleep 100
expect"*system*"
send"stop power/\r"//RMC发送整机电源关闭指令
exec sleep 60
expect"*system*"
send"start power/\r"//RMC发送整机电源开启指令
exec sleep 100
循环执行如上脚本100次。
如图2示,该装置200包括:
配置单元210,所述配置单元210用于配置RMC配置文件并将所述配置文件导入RMC;
开机单元220,所述开机单元220用于控制RMC下发开机指令执行开机;
测试单元230,所述测试单元230用于检测GPU BOX节点数量并对GPU BOX 节点进行压力测试;
关机单元240,所述关机单元240用于控制RMC下发关机指令执行关机。
可选地,作为本申请一个实施例,所述配置单元包括:
第一数量设置模块,配置用于设置RACK机柜的节点数量;
第一布局设置模块,配置用于设置RACK机柜中的节点布局;
第二数量设置模块,配置用于设置RACK机柜的GPU BOX节点数量;
第二布局设置模块,配置用于设置RACK机柜中的GPU BOX节点布局。
可选地,作为本申请一个实施例,所述测试单元包括:
时间设置模块,配置用于设置开机等待时间和压力测试时间;
时间判断模块,配置用于判断开机运行时间是否达到开机等待时间:
测试执行模块,配置用于对GPU BOX节点执行数量检测并根据压力测试时间对GPUBOX节点进行压力测试;
状态保持模块,配置用于保持机柜运行状态。
可选地,作为本申请一个实施例,所述关机单元包括:
设置模块,配置用于设置关机持续时间和循环次数;
关机模块,配置用于控制RMC下发关机指令;
下电模块,配置用于控制RMC下发RACK机柜电源关闭指令;
判断模块,配置用于判断本次测试是否达到循环次数;
终止模块,配置用于终止所述开关机稳定性测试;
循环模块,配置用于根据所述关机持续时间循环执行所述开关机稳定性测试。
图3为本发明实施例提供的一种终端装置300的结构示意图,该终端装置 300可以用于执行本申请实施例提供的更新散热策略参数的方法。
其中,该终端装置300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本申请的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310 执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器310可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本申请实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本申请还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本申请提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本申请通过配置RMC配置文件,使RMC能够动态识别GPU BOX节点,进而按照节点执行顺序控制RACK开关机,并在RACK开机后通过GPU BOX节点进行数量检测和压力测试来检测GPU BOX节点状态,从而确保GPU可以正常使用。本发明能够自动检测RACK机柜开关机稳定性,避免了开机后GPU无法正常使用的问题,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器 (ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种RACK机柜开关机稳定性测试方法,其特征在于,所述方法包括:
配置RMC配置文件并将所述配置文件导入RMC;
控制RMC下发开机指令执行开机;
检测GPU BOX节点数量并对GPU BOX节点进行压力测试;
控制RMC下发关机指令执行关机。
2.根据权利要求1所述的方法,其特征在于,所述配置RMC配置文件并将所述配置文件导入RMC包括:
设置RACK机柜的节点数量;
设置RACK机柜中的节点布局;
设置RACK机柜的GPU BOX节点数量;
设置RACK机柜中的GPU BOX节点布局。
3.根据权利要求1所述的方法,其特征在于,所述检测GPU BOX节点数量并对GPU BOX节点进行压力测试包括:
设置开机等待时间和压力测试时间;
判断开机运行时间是否达到开机等待时间:
是,则对GPU BOX节点执行数量检测并根据压力测试时间对GPU BOX节点进行压力测试;
否,则保持机柜运行状态。
4.根据权利要求1所述的方法,其特征在于,所述控制RMC下发关机指令执行关机包括:
设置关机持续时间和循环次数;
控制RMC下发关机指令;
控制RMC下发RACK机柜电源关闭指令;
判断本次测试是否达到循环次数:
是,则终止所述开关机稳定性测试;
否,则根据所述关机持续时间循环执行所述开关机稳定性测试。
5.一种RACK机柜开关机稳定性测试装置,其特征在于,所述装置包括:
配置单元,配置用于配置RMC配置文件并将所述配置文件导入RMC;
开机单元,配置用于控制RMC下发开机指令执行开机;
测试单元,配置用于检测GPU BOX节点数量并对GPU BOX节点进行压力测试;
关机单元,配置用于控制RMC下发关机指令执行关机。
6.根据权利要求5所述的装置,其特征在于,所述配置单元包括:
第一数量设置模块,配置用于设置RACK机柜的节点数量;
第一布局设置模块,配置用于设置RACK机柜中的节点布局;
第二数量设置模块,配置用于设置RACK机柜的GPU BOX节点数量;
第二布局设置模块,配置用于设置RACK机柜中的GPU BOX节点布局。
7.根据权利要求5所述的装置,其特征在于,所述测试单元包括:
时间设置模块,配置用于设置开机等待时间和压力测试时间;
时间判断模块,配置用于判断开机运行时间是否达到开机等待时间:
测试执行模块,配置用于对GPU BOX节点执行数量检测并根据压力测试时间对GPU BOX节点进行压力测试;
状态保持模块,配置用于保持机柜运行状态。
8.根据权利要求5所述的装置,其特征在于,所述关机单元包括:
设置模块,配置用于设置关机持续时间和循环次数;
关机模块,配置用于控制RMC下发关机指令;
下电模块,配置用于控制RMC下发RACK机柜电源关闭指令;
判断模块,配置用于判断本次测试是否达到循环次数;
终止模块,配置用于终止所述开关机稳定性测试;
循环模块,配置用于根据所述关机持续时间循环执行所述开关机稳定性测试。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-4任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。
CN201811021328.6A 2018-09-03 2018-09-03 Rack机柜开关机稳定性测试方法、装置、终端及存储介质 Pending CN109213648A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811021328.6A CN109213648A (zh) 2018-09-03 2018-09-03 Rack机柜开关机稳定性测试方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811021328.6A CN109213648A (zh) 2018-09-03 2018-09-03 Rack机柜开关机稳定性测试方法、装置、终端及存储介质

Publications (1)

Publication Number Publication Date
CN109213648A true CN109213648A (zh) 2019-01-15

Family

ID=64986861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811021328.6A Pending CN109213648A (zh) 2018-09-03 2018-09-03 Rack机柜开关机稳定性测试方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN109213648A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502399A (zh) * 2019-08-23 2019-11-26 广东浪潮大数据研究有限公司 故障检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729271A (zh) * 2012-10-11 2014-04-16 北京百度网讯科技有限公司 整机柜的稳定性测试方法、系统及测试服务器
CN107179991A (zh) * 2017-05-17 2017-09-19 郑州云海信息技术有限公司 一种自动验证Rack机柜RMC稳定性的方法
CN108319469A (zh) * 2018-02-28 2018-07-24 郑州云海信息技术有限公司 一种机柜式服务器各节点的开/关机控制方法及装置
US20180212823A1 (en) * 2015-10-14 2018-07-26 Inspur Electronic Information Industry Co., Ltd Monitoring and management method for complete machine cabinet server

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729271A (zh) * 2012-10-11 2014-04-16 北京百度网讯科技有限公司 整机柜的稳定性测试方法、系统及测试服务器
US20180212823A1 (en) * 2015-10-14 2018-07-26 Inspur Electronic Information Industry Co., Ltd Monitoring and management method for complete machine cabinet server
CN107179991A (zh) * 2017-05-17 2017-09-19 郑州云海信息技术有限公司 一种自动验证Rack机柜RMC稳定性的方法
CN108319469A (zh) * 2018-02-28 2018-07-24 郑州云海信息技术有限公司 一种机柜式服务器各节点的开/关机控制方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502399A (zh) * 2019-08-23 2019-11-26 广东浪潮大数据研究有限公司 故障检测方法及装置
CN110502399B (zh) * 2019-08-23 2023-09-01 广东浪潮大数据研究有限公司 故障检测方法及装置

Similar Documents

Publication Publication Date Title
CN107632219B (zh) 一种自动开关机测试系统及其测试方法
CN109445865A (zh) 一种bios选项远程批量设置方法、装置、终端及存储介质
CN109257249A (zh) 一种网卡稳定性测试方法、装置、终端及存储介质
CN111669284B (zh) OpenStack自动化部署方法、电子设备、存储介质及系统
CN109510742A (zh) 一种服务器网卡远程测试方法、装置、终端及存储介质
US10921870B2 (en) System and method for hybrid power supply
WO2022148072A1 (zh) PCIe switch工作模式更新方法及相关组件
CN107612775A (zh) 一种节点二级连服务器的dc测试方法与系统
CN109542525A (zh) 一种通过bmc切换系统内存配置的方法、装置、终端及存储介质
CN109446097A (zh) 一种回归测试用例选择方法、装置、终端及存储介质
CN109815721A (zh) 一种通过BMC修改BIOS Setup选项密码的方法、装置、终端及存储介质
CN109117335A (zh) 一种硬盘模拟热插拔测试方法、装置、终端及存储介质
CN107977254A (zh) 云数据系统中请求的响应方法和计算机可读存储介质
CN109815070A (zh) 一种host-box服务器稳定性测试方法、装置、终端及存储介质
CN109491909A (zh) 一种cpld刷新验证方法、装置、终端及存储介质
CN109510740A (zh) 一种自动监控网卡mtu值的方法、装置、终端及存储介质
CN109213648A (zh) Rack机柜开关机稳定性测试方法、装置、终端及存储介质
CN105183598A (zh) 一种云计算生态系统中服务器整机的可靠性测试方法
CN115484187B (zh) 容器环境下容器网络接口测试方法、设备及存储介质
CN110908783A (zh) 一种云数据中心虚拟机的管控方法、系统及设备
CN109361543A (zh) 一种整机柜监控方法、装置、终端及存储介质
CN109086214A (zh) 一种数据库写性能测试方法、装置、终端及存储介质
CN109783264A (zh) 一种数据库的高可用解决方法
CN110704160B (zh) 一种双机热备测试方法与装置
CN109189638A (zh) 一种gpu驱动检测方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190115

RJ01 Rejection of invention patent application after publication