CN115904875A - 测试装置、方法、电子设备和存储介质 - Google Patents

测试装置、方法、电子设备和存储介质 Download PDF

Info

Publication number
CN115904875A
CN115904875A CN202211594472.5A CN202211594472A CN115904875A CN 115904875 A CN115904875 A CN 115904875A CN 202211594472 A CN202211594472 A CN 202211594472A CN 115904875 A CN115904875 A CN 115904875A
Authority
CN
China
Prior art keywords
node
module
power supply
power
node server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211594472.5A
Other languages
English (en)
Inventor
王芸红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211594472.5A priority Critical patent/CN115904875A/zh
Publication of CN115904875A publication Critical patent/CN115904875A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Abstract

本发明实施例提供测试装置、方法、电子设备和存储介质,该测试装置包括:供电模块用于为多节点服务器提供电源;检测模块用于分别检测各个节点的电信号,根据电信号确定各个节点的设备状态,当其为关机状态时,生成并发送关机状态信号给测试控制模块;测试控制模块用于当所有节点的关机状态信号均接收到时,生成并发送供电中断指令给开关模块;开关模块用于依据供电中断指令,中断电源,以使多节点服务器整机掉电;显示模块用于显示整机掉电时间。由此避免以单个节点为基准进行断电测试时导致其他节点的宕机异常现象无法识别的情况,且不依赖于BMC和网络,即使不支持BMC或BMC启动失败或没有网络环境的服务器依然可以进行测试。

Description

测试装置、方法、电子设备和存储介质
技术领域
本发明涉及测试技术领域,特别涉及一种测试装置、一种测试方法、一种电子设备和一种计算机可读存储介质。
背景技术
多节点服务器,顾名思义是指具有多个节点的服务器,它是针对云计算、数据中心、互联网应用所推出的一种优化架构的服务器设备。为了保证多节点服务器业务运行,通常需要对多节点服务器进行AC(Alternating Current,交流电)稳定性测试,AC稳定性测试是指对多节点服务器不断进行上电、掉电的测试。
目前的测试方法是以多节点中的节点A为主节点,通过BMC(BaseboardManagement Controller,基板管理控制器)检测到主节点A关机时即可进行整机掉电,然而如果其他节点中有任一节点出现宕机的情况时,还是会整机掉电,导致无法识别其他节点的宕机异常现象,从而容易遗漏问题且无法保留测试环境,不利于研发分析问题。且目前的测试方法大多依赖于BMC,若多节点服务器不支持BMC或者BMC启动失败,或者多节点服务器所在位置没有网络,都无法进行AC稳定性测试,依赖因素太多致使不易于测试多节点服务器。
发明内容
鉴于上述问题,提出了本发明实施例以便提供克服上述问题或者至少部分地解决上述问题的一种测试装置和方法。
本发明实施例还提供了一种电子设备和存储介质,以保证上述方法的实施。
为了解决上述问题,本发明实施例公开了一种测试装置,包括供电模块、开关模块、检测模块、测试控制模块和显示模块;
所述供电模块,用于为多节点服务器提供电源;
所述检测模块,连接所述多节点服务器中的各个节点,用于分别检测所述各个节点的电信号,并根据所述电信号确定所述各个节点的设备状态,当所述设备状态为关机状态时,针对所述关机状态的节点生成关机状态信号,并向所述测试控制模块发送所述关机状态信号;
所述测试控制模块,用于接收所述关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向所述开关模块发送所述供电中断指令;
所述开关模块,用于依据所述供电中断指令,中断所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机掉电;
所述显示模块,用于显示所述多节点服务器的整机掉电时间。
可选地,
所述显示模块,还用于分别记录所述各个节点的上电时长;
所述测试控制模块,还用于当接收不到某一节点的关机状态信号时,从所述显示模块获取针对所述某一节点的目标上电时长,并根据所述目标上电时长确定所述某一节点是否出现宕机异常情况。
可选地,
所述测试控制模块,用于当所述目标上电时长大于或等于预设报警时长时,确定所述某一节点出现宕机异常情况,并输出报警信息;所述报警信息用于指示用户查看所述多节点服务器的机器状况。
可选地,
所述检测模块,用于当所述电信号为0V时,确定对应节点的设备状态为关机状态,以及当所述电信号为预设电压值时,确定对应节点的设备状态为开机状态;其中,所述预设电压值大于0。
可选地,所述检测模块具有多个引脚;
所述检测模块,用于通过各个引脚分别连接所述多节点服务器中的各个节点。
可选地,所述检测模块包括多个传感器;
所述检测模块,用于通过各个传感器,按顺序依次检测所述各个节点的电信号。
可选地,
所述显示模块,还用于接收用户输入的设定测试次数,并显示实时测试次数;
所述测试控制模块,还用于判断所述实时测试次数是否达到所述设定测试次数,若所述实时测试次数达到所述设定测试次数,则停止对所述多节点服务器的测试。
可选地,
所述测试控制模块,还用于当所述多节点服务器整机掉电后,生成供电恢复指令,并向所述开关模块发送所述供电恢复指令;
所述开关模块,还用于依据所述供电恢复指令,恢复所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机上电;
所述显示模块,还用于显示所述多节点服务器的整机上电时间。
本发明还公开了一种测试方法,包括供电模块、开关模块、检测模块、测试控制模块和显示模块;所述方法包括:
所述供电模块为多节点服务器提供电源;
所述检测模块连接所述多节点服务器中的各个节点,并分别检测所述各个节点的电信号,并根据所述电信号确定所述各个节点的设备状态,当所述设备状态为关机状态时,针对所述关机状态的节点生成关机状态信号,并向所述测试控制模块发送所述关机状态信号;
所述测试控制模块接收所述关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向所述开关模块发送所述供电中断指令;
所述开关模块依据所述供电中断指令,中断所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机掉电;
所述显示模块显示所述多节点服务器的整机掉电时间。
可选地,所述方法还包括:
所述显示模块分别记录所述各个节点的上电时长;
所述测试控制模块当接收不到某一节点的关机状态信号时,从所述显示模块获取针对所述某一节点的目标上电时长,并根据所述目标上电时长确定所述某一节点是否出现宕机异常情况。
可选地,所述根据所述目标上电时长确定所述某一节点是否出现宕机异常情况,包括:
所述测试控制模块当所述目标上电时长大于或等于预设报警时长时,确定所述某一节点出现宕机异常情况,并输出报警信息;所述报警信息用于指示用户查看所述多节点服务器的机器状况。
可选地,所述根据所述电信号确定所述各个节点的设备状态,包括:
所述检测模块当所述电信号为0V时,确定对应节点的设备状态为关机状态,以及当所述电信号为预设电压值时,确定对应节点的设备状态为开机状态;其中,所述预设电压值大于0。
可选地,所述检测模块具有多个引脚;所述检测模块分别连接所述多节点服务器中的各个节点,包括:
所述检测模块通过各个引脚分别连接所述多节点服务器中的各个节点。
可选地,所述检测模块包括多个传感器;所述检测模块分别检测所述各个节点的电信号,包括:
所述检测模块通过各个传感器,按顺序依次检测所述各个节点的电信号。
可选地,所述方法还包括:
所述显示模块接收用户输入的设定测试次数,并显示实时测试次数;
所述测试控制模块判断所述实时测试次数是否达到所述设定测试次数,若所述实时测试次数达到所述设定测试次数,则停止对所述多节点服务器的测试。
可选地,所述方法还包括:
所述测试控制模块当所述多节点服务器整机掉电后,生成供电恢复指令,并向所述开关模块发送所述供电恢复指令;
所述开关模块依据所述供电恢复指令,恢复所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机上电;
所述显示模块显示所述多节点服务器的整机上电时间。
本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的测试方法。
本发明实施例还公开了一个或多个计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的测试方法。
与现有技术相比,本发明实施例包括以下优点:
在本发明实施例中,测试装置包括供电模块、开关模块、检测模块、测试控制模块和显示模块;供电模块用于为多节点服务器提供电源;检测模块连接多节点服务器中的各个节点,用于分别检测各个节点的电信号,并根据电信号确定各个节点的设备状态,当设备状态为关机状态时,针对关机状态的节点生成关机状态信号,并向测试控制模块发送关机状态信号;测试控制模块用于接收关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向开关模块发送供电中断指令;开关模块用于依据供电中断指令,中断供电模块为多节点服务器提供的电源,以使多节点服务器整机掉电;显示模块用于显示多节点服务器的整机掉电时间。本发明实施例通过分别检测多节点服务器的每个节点,当所有节点都被检测到关机时,才对多节点服务器进行断电,使得多节点服务器整机掉电,从而避免以单个节点为基准进行断电测试时导致其他节点的宕机异常现象无法识别的情况,且本发明实施例是通过物理电信号来检测节点关机状态,不依赖于BMC和网络,即使不支持BMC或BMC启动失败或没有网络环境,多节点服务器依然可以进行AC稳定性测试。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种测试装置的结构框图;
图2是本发明实施例提供的另一种测试装置的结构框图;
图3是本发明实施例提供的一种测试方法的步骤流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,示出了本发明实施例提供的一种测试装置的结构框图,所述测试装置101包括供电模块1011、开关模块1012、检测模块1013、测试控制模块1014和显示模块1015。
如图1所示,开关模块1012分别连接供电模块1011和多节点服务器102,测试控制模块1014分别连接显示模块1015、开关模块1012和检测模块1013,检测模块1013分别连接多节点服务器102中的各个节点。
具体而言,多节点服务器102由多个节点构成,它可以减轻服务器的负载,可以进行分流并灵活应用,也可以作为虚拟的磁盘服务器。多节点服务器102能够在更小的空间内集成更多的处理器和I/O扩展能力,它可以极大地降低客户的空间成本并能显著提升计算机的性能。机箱内多个节点可以共享电源和风扇,这样的设计可以极大提升电源效率和散热系统的使用效率。另外,多节点服务器102易于管理,它的每个节点可以独立的进行管理,它可以通过机箱管理模块达到统一的管理工作模式,它具备了更好的通用性和更优的易用性。多节点服务器102还拥有着模块化的部署,各个节点可以灵活的进行搭配,可以混合进行部署,模块化的前窗可以根据用户的需求搭配不同种类的节点前窗。灵活扩展的特性,可以实现近乎定制化的产品配置。多节点服务器102可以面向多种不同的工作负载不同的计算节点可搭配不同块的大容量硬盘,无论是多网络扩展还是高IOPS(Input/OutputOperations Per Second,每秒进行读写操作的次数)均可以得到完美的支持。其中,多节点服务器102可以包括高密服务器和刀片服务器。
在本发明实施例中,测试装置101针对多节点服务器102的测试是AC稳定性测试,AC稳定性测试是指对多节点服务器不断进行上电、掉电的测试。
如图1所示,测试装置101包括五个模块,分别是供电模块1011、开关模块1012、检测模块1013、测试控制模块1014和显示模块1015。其中,供电模块1011到多节点服务器102的线路中间增加了开关模块1012,开关模块1012可以用于控制供电模块1011的电源供给。示例性地,如果关闭开关单元1012,那么到多节点服务器102的供电会中断;如果打开开关单元1012,那么到多节点服务器102的供电会恢复,从而通过开关模块1012的开和关,实现对多节点服务器102的AC稳定性测试。
测试控制模块1014分别连接显示模块1015、开关模块1012和检测模块1013,而检测模块1013分别连接多节点服务器102中的节点A、节点B、节点C、节点D、……、节点N,其中N为大于0的正整数,换言之,检测模块1013分别连接多节点服务器102中的每个节点。
所述供电模块1011,用于为所述多节点服务器102提供电源。
在本发明实施例中,供电模块1011可以连接外部电源模块,外部电源模块采用两块2000W的电源输入,可以为供电单元1011提供220V交流电源输入,从而后续供电模块1011为多节点服务器102提供的电源,可以基本满足多节点服务器的高配情况下的功率需求。
如图1所示,当开关单元1012关闭时,供电单元1011可以基于到多节点服务器102的线路来输入交流电,由此为多节点服务器102提供满足功耗要求的交流电。此外,供电单元1011还可以为整个测试装置101供电,以保证测试装置101内部的各个模块可以正常运行。
所述检测模块1013,连接所述多节点服务器中的各个节点,用于分别检测所述各个节点的电信号,并根据所述电信号确定所述各个节点的设备状态,当所述设备状态为关机状态时,针对所述关机状态的节点生成关机状态信号,并向所述测试控制模块1014发送所述关机状态信号。
在本发明实施例中,检测模块1013可以分别检测多节点服务器102中的每个节点的电信号以及地信号,通过电信号可以判断每个节点此时的设备状态。其中,设备状态可以包括开机状态和关机状态。
当设备状态为关机状态时,检测模块1013针对关机状态的节点生成关机状态信号,并且可以将关机状态信号传递给测试控制模块1014,从而让测试控制模块1014知悉哪一节点处于关机状态。
所述测试控制模块1014,用于接收所述关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向所述开关模块1012发送所述供电中断指令。
在本发明实施例中,测试控制模块1014可以接收到检测模块1013所检测的任一节点的关机状态信号,测试控制模块1014可以实时判断是否均接收到所有节点的关机状态信号。如果均接收到所有节点的关机状态信号,那么测试控制模块1014可以判断出所有节点此时均处于关机状态,由此生成供电中断指令,并且可以将供电中断指令发送给开关模块1012。
所述开关模块1012,用于依据所述供电中断指令,中断所述供电模块1011为所述多节点服务器102提供的电源,以使所述多节点服务器102整机掉电。
在本发明实施例中,开关模块1012接收到供电中断指令后,可以响应供电中断指令,中断供电模块1011为多节点服务器102提供的电源,也即是断开供电单元1011到多节点服务器102的线路,使得多节点服务器102整机掉电。
所述显示模块1015,用于显示所述多节点服务器102的整机掉电时间。
在本发明实施例中,当多节点服务器102整机掉电时,显示模块1015可以实时显示多节点服务器102的整机掉电时间,以便于用户(测试工程师)了解当前这一轮AC测试的整机掉电时间。
综上,本发明实施例通过分别检测多节点服务器的每个节点,当所有节点都被检测到关机时,才对多节点服务器进行断电,使得多节点服务器整机掉电,从而避免以单个节点为基准进行断电测试时导致其他节点的宕机异常现象无法识别的情况,且本发明实施例是通过物理电信号来检测节点关机状态,不依赖于BMC和网络,即使不支持BMC或BMC启动失败或没有网络环境,多节点服务器依然可以进行AC稳定性测试。
参照图2,示出了本发明实施例提供的另一种测试装置的结构框图,所述测试装置201可以包括供电模块2011、开关模块2012、检测模块2013、测试控制模块2014和显示模块2015。
具体而言,多节点服务器202由多个节点构成,如图2所示,多节点服务器102包括节点A、节点B、节点C、节点D、……、节点N。多节点服务器202能够在更小的空间内集成更多的处理器和I/O扩展能力,从而极大地降低客户的空间成本并能显著提升计算机的性能。机箱内多个节点可以共享电源和风扇,这样的设计可以极大提升电源效率和散热系统的使用效率。其中,多节点服务器102可以包括高密服务器和刀片服务器。
在本发明实施例中,测试装置201针对多节点服务器202的测试是AC稳定性测试,AC稳定性测试是指对多节点服务器不断进行上电、掉电的测试。
如图2所示,测试装置201包括五个模块,分别是供电模块2011、开关模块2012、检测模块2013、测试控制模块2014和显示模块2015。其中,供电模块2011到多节点服务器202的线路中间增加了开关模块2012,开关模块2012可以用于控制供电模块2011的电源供给。示例性地,如果关闭开关单元2012,那么到多节点服务器202的供电会中断;如果打开开关单元2012,那么到多节点服务器202的供电会恢复,由此通过开关模块2012的开和关,实现对多节点服务器202的AC稳定性测试。
测试控制模块2014分别连接显示模块2015、开关模块2012和检测模块2013,而检测模块2013分别连接多节点服务器202中的节点A、节点B、节点C、节点D、……、节点N,换言之,检测模块2013分别连接多节点服务器202中的每个节点。
本发明的一个可选实施例中,所述检测模块2013具有多个引脚;所述检测模块2013,用于通过各个引脚分别连接所述多节点服务器202中的各个节点。
在本发明实施例中,检测模块2013可以具有多个引脚PIN,从而检测模块2013可以通过每个引脚PIN,来连接多节点服务器202中的每个节点,即一个引脚连接一个节点。
所述供电模块2011,用于为所述多节点服务器202提供电源。
在本发明实施例中,供电模块2011可以连接外部电源模块,外部电源模块采用两块2000W的电源输入,可以为供电单元2011提供220V交流电源输入,从而后续供电模块2011为多节点服务器202提供的电源,可以基本满足多节点服务器的高配情况下的功率需求。
如图2所示,当开关单元2012关闭时,供电单元2011可以基于到多节点服务器202的线路来输入交流电,由此为多节点服务器202提供满足功耗要求的交流电。此外,供电单元2011还可以为整个测试装置201供电,以保证测试装置201内部的各个模块可以正常运行。
所述检测模块2013,用于分别检测所述各个节点的电信号,并根据所述电信号确定所述各个节点的设备状态,当所述设备状态为关机状态时,针对所述关机状态的节点生成关机状态信号,并向所述测试控制模块2014发送所述关机状态信号。
在本发明实施例中,检测模块2013可以分别检测多节点服务器202中的每个节点的电信号以及地信号,通过电信号可以判断每个节点此时的设备状态。其中,设备状态可以包括开机状态和关机状态。
当设备状态为关机状态时,检测模块2013针对关机状态的节点生成关机状态信号,并且可以将关机状态信号传递给测试控制模块2014,从而让测试控制模块2014知悉哪一节点处于关机状态。
本发明的一个可选实施例中,所述检测模块2013包括多个传感器;所述检测模块2013,用于通过各个传感器,按顺序依次检测所述各个节点的电信号。
在本发明实施例中,检测模块2013可以包括多个sensor(传感器),从而检测模块2013可以通过每个sensor,按顺序依次检测每个节点的电信号及地信号,即一个sensor检测一个节点。
在一种示例中,如图2所示,如果设定的顺序是从上到下,那么检测模块2013可以先检测节点A的电信号,然后检测节点B的电信号,然后检测节点C的电信号,然后检测节点D的电信号,……,直至检测到最后一节点N的电信号。
本发明的一个可选实施例中,所述检测模块2013,用于当所述电信号为0V时,确定对应节点的设备状态为关机状态,以及当所述电信号为预设电压值时,确定对应节点的设备状态为开机状态;其中,所述预设电压值大于0。
在本发明实施例中,检测模块2013检测各个节点的电信号,主要是检测各个节点为预设电压值的电信号是否消失,其中,预设电压值大于0。如果一节点的电信号消失,也即是此电信号的电压值由预设电压值转变为0V,那么检测模块2013可以判断出该节点由开机状态转变为关机状态,也即是该节点此时处于关机状态。
需要说明的是,多节点服务器的主板上的电压一般是3.3V/5V/12V,因此,本发明实施例可以设置预设电压值为3.3V/5V/12V。
在本发明实施例中,如果一节点的电信号没有消失,即电信号的电压值仍然是预设电压值,比如12V,那么检测模块2013可以判断出该节点仍处于开机状态。
所述测试控制模块2014,用于接收所述关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向所述开关模块2012发送所述供电中断指令。
在本发明实施例中,测试控制模块2014可以接收到检测模块1013所检测的任一节点的关机状态信号,测试控制模块2014可以实时判断是否均接收到所有节点的关机状态信号。如果均接收到所有节点的关机状态信号,那么测试控制模块2014可以判断出所有节点此时均处于关机状态,由此生成供电中断指令,并且可以将供电中断指令发送给开关模块2012。
在一种示例中,如图2所示,当节点A、节点B、节点C、节点D、……、节点N等节点的12V电信号全部消失后,测试控制模块2014可以接收到全部节点的关机状态信号,此时的测试控制模块2014才会对开关模块2012发出供电中断指令,使得多节点服务器整机掉电,从而可以避免以单个节点为基准进行断电测试时导致其他节点的宕机异常现象无法识别的情况。
需要说明的是,宕机是指节点处于死机状态,死机状态是属于开机状态中的一种异常情况。
所述开关模块2012,用于依据所述供电中断指令,中断所述供电模块2011为所述多节点服务器202提供的电源,以使所述多节点服务器202整机掉电。
在本发明实施例中,开关模块2012接收到供电中断指令后,可以响应供电中断指令,中断供电模块2011为多节点服务器202提供的电源,也即是断开供电单元2011到多节点服务器202的线路,使得多节点服务器202整机掉电。
所述显示模块2015,用于显示所述多节点服务器202的整机掉电时间。
在本发明实施例中,当多节点服务器202整机掉电时,显示模块2015可以实时显示多节点服务器202的整机掉电时间,以便于用户(测试工程师)了解当前这一轮AC测试的整机掉电时间。
本发明的一个可选实施例中,所述显示模块2015,还用于分别记录所述各个节点的上电时长;所述测试控制模块2014,还用于当接收不到某一节点的关机状态信号时,从所述显示模块2015获取针对所述某一节点的目标上电时长,并根据所述目标上电时长确定所述某一节点是否出现宕机异常情况。
在本发明实施例中,显示模块2015可以分别记录各个节点的上电时长,具体地,显示模块2015包含有计数器,显示模块2015可以通过计数器累计每个节点的上电时长,然后将每个节点的上电时长进行记录。其中,上电时长是指每个节点自上次上电后到当前时刻的时间段,如果一节点关机,那么计数器可以停止累计该节点的上电时长。
在具体实现中,显示模块2015可以通过计数器累计节点A的上电时长A Time on、节点B的上电时长B Time on、节点C的上电时长A Time on、节点D的上电时长D_Time_on、……、节点N的上电时长N_Time_on。
如果节点A关机,那么计数器可以停止累计节点A的上电时长A_Time_on;如果节点A没有关机,那么计数器可以继续累计节点A的上电时长A_Time_on。
然而一些节点有可能出现宕机异常情况,导致测试控制模块2014一直接收不到这些节点的关机状态信号,那么这些节点的上电时长会一直增加。
因此,本发明实施例在接收不到某一节点的关机状态信号时,可以通过测试控制模块2014从显示模块2015中获取针对此节点的目标上电时长,然后根据目标上电时长确定此节点是否出现宕机异常情况。
本发明的一个可选实施例中,所述测试控制模块2014,用于当所述目标上电时长大于或等于预设报警时长时,确定所述某一节点出现宕机异常情况,并输出报警信息;所述报警信息用于指示用户查看所述多节点服务器202的机器状况。
在本发明实施例中,当目标上电时长大于或等于预设报警时长T_Beer时,测试控制模块2014可以确定此节点出现宕机异常情况,此时测试控制模块2014可以输出报警信息,以通知用户(测试工程师)及时查看多节点服务器202的机器状况。
其中,预设报警时长T_Beer是测试工程师向显示单元2015初始输入的报警时长,预设报警时长T_Beer可以基于配置最高的节点进行设定,也即是可以将开机时间最长的节点的上电时长作为预设报警时长T_Beer。
在一种示例中,假设节点B宕机,那么节点B的电信号一直是12V,导致测试控制模块2014一直接收不到节点B的关机状态信号,那么节点B的目标上电时长B_Time_on会一直增加,直到目标上电时长B_Time_on大于或等于预设报警时长T_Beer时,测试控制模块2014可以确定节点B出现宕机异常情况,此时测试控制模块2014输出报警信息,通知测试工程师查看多节点服务器202的机器状况。
本发明的一个可选实施例中,所述测试控制模块2014,还用于当所述多节点服务器202整机掉电后,生成供电恢复指令,并向所述开关模块2012发送所述供电恢复指令;所述开关模块2012,还用于依据所述供电恢复指令,恢复所述供电模块2011为所述多节点服务器202提供的电源,以使所述多节点服务器202整机上电;所述显示模块2015,还用于显示所述多节点服务器202的整机上电时间。
在本发明实施例中,在多节点服务器202整机掉电后,测试控制模块2014可以对多节点服务器进行整机上电。具体地,测试控制模块2014可以生成供电恢复指令,然后可以将供电恢复指令发送给开关模块2012,从而开关模块2012响应该供电恢复指令,恢复供电模块2011为多节点服务器202提供的电源,也即是恢复供电单元2011到多节点服务器202的线路,使得多节点服务器202整机上电。此时的显示模块2015可以实时显示多节点服务器202的整机上电时间,以便于测试工程师了解当前这一轮AC测试的整机上电时间。
需要说明的是,一次上电和一次掉电可以构成一轮的AC测试。
本发明的一个可选实施例中,所述显示模块2015,还用于接收用户输入的设定测试次数,并显示实时测试次数;所述测试控制模块2014,还用于判断所述实时测试次数是否达到所述设定测试次数,若所述实时测试次数达到所述设定测试次数,则停止对所述多节点服务器202的测试。
在本发明实施例中,测试工程师可以向显示模块2015输入初始设定的设定测试次数,在开启AC稳定性测试后,显示模块2015可以显示实时测试次数,测试控制模块2014可以判断实时测试次数是否达到设定测试次数。
如果实时测试次数没有达到设定测试次数,可以说明此时的多节点服务器的节点仍会再关机来触发电信号的检测,因此测试控制模块2014可以继续对多节点服务器202的测试;如果实时测试次数达到设定测试次数,可以说明此时的多节点服务器的节点不会再关机来触发电信号的检测,因此测试控制模块2014可以停止对多节点服务器202的测试。
由此可见,本发明实施例可以支持多节点服务器整机AC稳定性测试,通过测试控制模块基于节点的电信号P12V,判断各个节点的运行情况,由此控制开关模块的通/断,从而实现多节点服务器中的整机箱内所有节点的上下电测试。
相比现有技术中通过人工对多节点服务器进行上下电测试,测试时间长会耗费人力和时间,测试时间短会达不到稳定性测试的效果。本发明实施例通过供电模块、开关模块、检测模块、测试控制模块和显示模块的协同合作,可以避免人工对多节点服务器进行上下电测试。
相比现有技术中是以单个节点为基准进行断电测试,从而容易导致无法识别其他节点的宕机异常现象。本发明实施例在所有节点都被检测到关机后,才对多节点服务器进行断电,倘若某一节点宕机,那么此节点不会被检测到关机,所以本发明实施例不会对多节点服务器进行断电,从而可以避免以单个节点为基准进行断电测试时导致其他节点的宕机异常现象无法识别的情况,并且由于多节点服务器不会整机掉电,那么会一直保留发生宕机的节点的测试环境,测试工程师可以基于所保留的测试环境来研究分析出宕机原因。
相比现有技术中依赖于BMC,依赖因素太多致使不易于测试多节点服务器。本发明实施例通过物理电信号来检测节点开关机状态,不依赖于BMC和网络,即使不支持BMC或BMC启动失败或没有网络环境,多节点服务器依然可以进行AC稳定性测试,且采用电信号判断的方法更准确。
综上,本发明实施例通过分别检测多节点服务器的每个节点,当所有节点都被检测到关机时,才对多节点服务器进行断电,使得多节点服务器整机掉电,从而避免以单个节点为基准进行断电测试时导致其他节点的宕机异常现象无法识别的情况,且本发明实施例是通过物理电信号来检测节点关机状态,不依赖于BMC和网络,即使不支持BMC或BMC启动失败或没有网络环境,多节点服务器依然可以进行AC稳定性测试。
参照图3,示出了本发明实施例提供的一种测试方法的步骤流程图,包括供电模块、开关模块、检测模块、测试控制模块和显示模块;该方法具体可以包括如下步骤:
步骤301,所述供电模块为多节点服务器提供电源。
本发明的一个可选实施例中,所述检测模块具有多个引脚;所述检测模块分别连接所述多节点服务器中的各个节点,可以包括:
所述检测模块通过各个引脚分别连接所述多节点服务器中的各个节点。
步骤302,所述检测模块连接所述多节点服务器中的各个节点,并分别检测所述各个节点的电信号,并根据所述电信号确定所述各个节点的设备状态,当所述设备状态为关机状态时,针对所述关机状态的节点生成关机状态信号,并向所述测试控制模块发送所述关机状态信号。
本发明的一个可选实施例中,所述检测模块包括多个传感器;步骤302可以包括如下子步骤:
所述检测模块通过各个传感器,按顺序依次检测所述各个节点的电信号。
本发明的一个可选实施例中,步骤302可以包括如下子步骤:
所述检测模块当所述电信号为0V时,确定对应节点的设备状态为关机状态,以及当所述电信号为预设电压值时,确定对应节点的设备状态为开机状态;其中,所述预设电压值大于0。
步骤303,所述测试控制模块接收所述关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向所述开关模块发送所述供电中断指令;
步骤304,所述开关模块依据所述供电中断指令,中断所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机掉电;
步骤305,所述显示模块显示所述多节点服务器的整机掉电时间。
本发明的一个可选实施例中,所述方法还可以包括:
所述显示模块分别记录所述各个节点的上电时长;
所述测试控制模块当接收不到某一节点的关机状态信号时,从所述显示模块获取针对所述某一节点的目标上电时长,并根据所述目标上电时长确定所述某一节点是否出现宕机异常情况。
本发明的一个可选实施例中,所述根据所述目标上电时长确定所述某一节点是否出现宕机异常情况,可以包括:
所述测试控制模块当所述目标上电时长大于或等于预设报警时长时,确定所述某一节点出现宕机异常情况,并输出报警信息;所述报警信息用于指示用户查看所述多节点服务器的机器状况。
本发明的一个可选实施例中,所述方法还可以包括:
所述显示模块接收用户输入的设定测试次数,并显示实时测试次数;
所述测试控制模块判断所述实时测试次数是否达到所述设定测试次数,若所述实时测试次数达到所述设定测试次数,则停止对所述多节点服务器的测试。
本发明的一个可选实施例中,所述方法还可以包括:
所述测试控制模块当所述多节点服务器整机掉电后,生成供电恢复指令,并向所述开关模块发送所述供电恢复指令;
所述开关模块依据所述供电恢复指令,恢复所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机上电;
所述显示模块显示所述多节点服务器的整机上电时间。
综上,本发明实施例通过分别检测多节点服务器的每个节点,当所有节点都被检测到关机时,才对多节点服务器进行断电,使得多节点服务器整机掉电,从而避免以单个节点为基准进行断电测试时导致其他节点的宕机异常现象无法识别的情况,且本发明实施例是通过物理电信号来检测节点关机状态,不依赖于BMC和网络,即使不支持BMC或BMC启动失败或没有网络环境,多节点服务器依然可以进行AC稳定性测试。
对于方法实施例而言,由于其与系统实施例基本相似,所以描述的比较简单,相关之处参见系统实施例的部分说明即可。
本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述测试方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述测试方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的测试装置、方法、电子设备和计算机可读存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种测试装置,其特征在于,包括供电模块、开关模块、检测模块、测试控制模块和显示模块;
所述供电模块,用于为多节点服务器提供电源;
所述检测模块,连接所述多节点服务器中的各个节点,用于分别检测所述各个节点的电信号,并根据所述电信号确定所述各个节点的设备状态,当所述设备状态为关机状态时,针对所述关机状态的节点生成关机状态信号,并向所述测试控制模块发送所述关机状态信号;
所述测试控制模块,用于接收所述关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向所述开关模块发送所述供电中断指令;
所述开关模块,用于依据所述供电中断指令,中断所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机掉电;
所述显示模块,用于显示所述多节点服务器的整机掉电时间。
2.根据权利要求1所述的装置,其特征在于,所述显示模块,还用于分别记录所述各个节点的上电时长;
所述测试控制模块,还用于当接收不到某一节点的关机状态信号时,从所述显示模块获取针对所述某一节点的目标上电时长,并根据所述目标上电时长确定所述某一节点是否出现宕机异常情况。
3.根据权利要求2所述的装置,其特征在于,
所述测试控制模块,用于当所述目标上电时长大于或等于预设报警时长时,确定所述某一节点出现宕机异常情况,并输出报警信息;所述报警信息用于指示用户查看所述多节点服务器的机器状况。
4.根据权利要求1所述的装置,其特征在于,
所述检测模块,用于当所述电信号为0V时,确定对应节点的设备状态为关机状态,以及当所述电信号为预设电压值时,确定对应节点的设备状态为开机状态;其中,所述预设电压值大于0。
5.根据权利要求1所述的装置,其特征在于,所述检测模块具有多个引脚;
所述检测模块,用于通过各个引脚分别连接所述多节点服务器中的各个节点。
6.根据权利要求1所述的装置,其特征在于,所述检测模块包括多个传感器;
所述检测模块,用于通过各个传感器,按顺序依次检测所述各个节点的电信号。
7.根据权利要求1所述的装置,其特征在于,
所述显示模块,还用于接收用户输入的设定测试次数,并显示实时测试次数;
所述测试控制模块,还用于判断所述实时测试次数是否达到所述设定测试次数,若所述实时测试次数达到所述设定测试次数,则停止对所述多节点服务器的测试。
8.根据权利要求1所述的装置,其特征在于,
所述测试控制模块,还用于当所述多节点服务器整机掉电后,生成供电恢复指令,并向所述开关模块发送所述供电恢复指令;
所述开关模块,还用于依据所述供电恢复指令,恢复所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机上电;
所述显示模块,还用于显示所述多节点服务器的整机上电时间。
9.一种测试方法,其特征在于,包括供电模块、开关模块、检测模块、测试控制模块和显示模块;所述方法包括:
所述供电模块为多节点服务器提供电源;
所述检测模块连接所述多节点服务器中的各个节点,并分别检测所述各个节点的电信号,并根据所述电信号确定所述各个节点的设备状态,当所述设备状态为关机状态时,针对所述关机状态的节点生成关机状态信号,并向所述测试控制模块发送所述关机状态信号;
所述测试控制模块接收所述关机状态信号,并当所有节点的关机状态信号均接收到时,生成供电中断指令,并向所述开关模块发送所述供电中断指令;
所述开关模块依据所述供电中断指令,中断所述供电模块为所述多节点服务器提供的电源,以使所述多节点服务器整机掉电;
所述显示模块显示所述多节点服务器的整机掉电时间。
10.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求9所述的测试方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求9所述的测试方法的步骤。
CN202211594472.5A 2022-12-13 2022-12-13 测试装置、方法、电子设备和存储介质 Pending CN115904875A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211594472.5A CN115904875A (zh) 2022-12-13 2022-12-13 测试装置、方法、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211594472.5A CN115904875A (zh) 2022-12-13 2022-12-13 测试装置、方法、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN115904875A true CN115904875A (zh) 2023-04-04

Family

ID=86470995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211594472.5A Pending CN115904875A (zh) 2022-12-13 2022-12-13 测试装置、方法、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115904875A (zh)

Similar Documents

Publication Publication Date Title
TWI567540B (zh) 動態管理電力供應的方法、系統
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
EP1416381B1 (en) System and method for preserving state data of a personal computer in a standby state in the event of an ac power failure
US7831860B2 (en) System and method for testing redundancy and hot-swapping capability of a redundant power supply
JP5317360B2 (ja) データ処理システムにおいてシステムの電力損失通知をしきい値処理するためのコンピュータ・プログラム、システム、および方法
US8538720B2 (en) Cold boot test system and method for electronic devices
JP2017224272A (ja) ハードウェア障害回復システム
EP2372491B1 (en) Power lock-up setting method and electronic apparatus using the same
TW200928710A (en) Methods and apparatus for managing power on a computer in the event of a power interruption
CN110515802A (zh) 一种服务器开机故障的监测方法、系统及相关组件
US10725519B1 (en) Power control based on power controller configuration records
JP4915224B2 (ja) 情報処理方法、情報処理装置、記録媒体、およびプログラム、並びに制御装置
CN109582505B (zh) 一种bios选项默认值的恢复系统、方法及装置
CN109445561B (zh) 一种应用于服务器上的掉电保护系统,方法及服务器
US8375249B1 (en) Method for testing battery backup units
WO2017027041A1 (en) Device operating state modification with uninterruptible power source
CN218824636U (zh) 一种用于服务器硬盘背板的电源检测装置
CN110389643B (zh) 服务器及其远端控制方法
CN115904875A (zh) 测试装置、方法、电子设备和存储介质
CN108243358B (zh) 可插拔业务板
CN111381659B (zh) 计算机系统及电源管理方法
CN108879589B (zh) 过流保护方法、装置、终端设备及存储介质
CN112463443A (zh) 具有ac loss功能的服务器和异常掉电后自动上电开机的方法
US20190250685A1 (en) Computer system, operational method for a microcontroller, and computer program product
TWI685733B (zh) 電腦系統及電源管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination