CN111752776A - 一种服务器的循环上下电测试方法和系统 - Google Patents

一种服务器的循环上下电测试方法和系统 Download PDF

Info

Publication number
CN111752776A
CN111752776A CN202010471263.6A CN202010471263A CN111752776A CN 111752776 A CN111752776 A CN 111752776A CN 202010471263 A CN202010471263 A CN 202010471263A CN 111752776 A CN111752776 A CN 111752776A
Authority
CN
China
Prior art keywords
server
power
shutdown
psu
powered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010471263.6A
Other languages
English (en)
Other versions
CN111752776B (zh
Inventor
刘纪斌
赵伟涛
殷奎龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010471263.6A priority Critical patent/CN111752776B/zh
Publication of CN111752776A publication Critical patent/CN111752776A/zh
Application granted granted Critical
Publication of CN111752776B publication Critical patent/CN111752776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Abstract

本发明公开一种服务器的循环上下电测试方法和系统,其中,服务器的循环上下电测试方法包括:控制被测试的服务器中电源供电单元PSU上电,触发所述服务器按预设上电开机策略进入开机状态;当所述服务器正常开机时,按预设关机脚本控制所述服务器执行关机操作;通过所述服务器的底板管理控制器BMC,监测所述服务器的关机状态;当监测到所述服务器正常关机时,通过所述BMC向所述PSU发送通断电指令,以控制PSU断电预定时间再次上电。本发明的技术方案能解决现有技术中使用疲劳机或电源分配单元PDU,体积较大,且需要额外引出线路和添加控制主机,导致占用大量资源的问题。

Description

一种服务器的循环上下电测试方法和系统
技术领域
本发明涉及电子信息技术领域,尤其涉及一种服务器的循环上下电测试方法和系统。
背景技术
随着互联网技术的发展,人们对于服务器的需求日渐增多,因此服务器的可靠性就至关重要。为了保证服务器的可靠性,需要在服务器出厂前对服务器进行可靠性测试。在服务器可靠性测试的众多测试项目中,循环上下电测试是一项重要的服务器可靠性测试项目。循环上下电测试主要测试服务器整机的上下电功能,其测试过程中不允许服务器存在异常宕机和错误日志。
循环上下电测试能够控制交流电的通断,达到服务器整机循环上下电的目的,是一种控制整机完整上下电的测试。传统的循环上下电测试方案除了被测服务器外,通常还包括疲劳机或电源分配单元以及控制主机。以疲劳机为例,其具体测试方法如下:首先,疲劳机输出的交流电接到被测服务器上,因为被测服务器需提前设定服务器的上电开机策略,这样被测服务器就会自动开机。然后,判断被测服务器是否开机,被测服务器若开机正常会进入到Linux系统;若开机异常则无法继续执行,那么被测服务器的系统就会卡死。再然后,若被测服务器的操作系统正常工作,在操作系统的控制下被测服务器就会执行自动脚本,在该自动脚本执行时,被测服务器会关机,正常情况下被测服务器内核的12V电压会掉电。为了侦测上下电信号,疲劳机会通过专门引出的12V电压信号线侦测被测服务器上的12V电压信号;若判断侦测到的12V电压信号为0,则判定被测服务器已关机,会继续向下执行;若持续侦测到12V电压信号,则判定系统关机过程异常(例如宕机)。当判定被测服务器已关机时,疲劳机通过设定交流电的断开时间来断开被测服务器的交流电;当断开1分钟后,疲劳机重新接通被测服务器的交流电源,则被测服务器上电开机,执行下一循环,直至循环结束。
然而,在被测服务器的循环上下电测试方案中,需要使用特殊的测试设备:疲劳机或者电源分配单元PDU。虽然疲劳机或PDU能够起到通断交流电的作用,但是,疲劳机或PDU的体积较大且需要引出单独的信号线(即电源侦测线)和供电线连接到被测服务器,这样非常占用资源。此外,疲劳机或PDU还需要额外添加控制主机,以控制疲劳机或PDU侦测被测服务器整机的开关机。
发明内容
本发明提供一种服务器的循环上下电测试方法和系统,旨在解决现有技术提供的使用疲劳机或PDU进行服务器循环上下电测试的方式,体积较大,需要引出信号线和供电线接入到被测服务器,导致占用大量资源的问题。
为实现上述目的,根据本发明的第一方面,本发明提出了一种服务器的循环上下电测试方法,包括:
控制被测试的服务器中电源供电单元PSU上电,触发服务器按预设上电开机策略进入开机状态;
当服务器正常开机时,按预设关机脚本控制服务器执行关机操作;
通过服务器的底板管理控制器BMC,监测服务器的关机状态;
当监测到服务器正常关机时,通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电。
优选地,所述触发服务器按预设上电开机策略进入开机状态的步骤,包括:
当PSU上电时,PSU触发服务器的基本输入输出系统启动;
控制基本输入输出系统执行上电启动模式,以使服务器进入开机状态。
优选地,所述循环上下电测试方法还包括监测服务器的开机状态;该监测服务器的开机状态的步骤包括:
判断服务器是否按照预设上电开机策略上电开机;
当服务器未上电开机时,获取服务器的上电异常信息;或者,
当服务器上电开机时,判断服务器的操作系统是否正常启动;
当操作系统未正常启动时,获取服务器的上电异常信息;或者,
当操作系统正常启动时,执行按预设关机脚本控制服务器执行关机操作的步骤。
优选地,所述按预设关机脚本控制服务器执行关机操作的步骤,包括:
当操作系统正常启动时,控制服务器运行预定时间后执行关机操作;
控制服务器统计本次关机操作的关机次数;
当本次关机操作的关机次数小于预设关机次数阈值时,控制服务器将关机状态信息写入BMC的BMC日志。
优选地,所述通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电的步骤,包括:
预设通断时间与寄存器标志位的对应关系;
根据所述通断电指令,通过所述BMC向所述PSU内的寄存器写入所述寄存器标志位。
根据本发明的第二方面,本发明还提供了一种服务器的循环上下电测试系统,服务器包括电源供电单元PSU和底板管理控制器BMC;该服务器的循环上下电测试系统包括:
上电控制模块,用于控制电源供电单元PSU上电;
开机触发模块,用于触发服务器按预设上电开机策略进入开机状态;
关机控制模块,用于当服务器正常开机时,按预设关机脚本控制服务器执行关机操作;
关机监测模块,用于通过服务器的底板管理控制器BMC,监测服务器的关机状态;
通断指令发送模块,用于当监测到服务器正常关机时,通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电。
优选地,所述开机触发模块包括:
系统启动触发子模块,用于当PSU上电时,控制PSU触发服务器的基本输入输出系统启动;
启动模式执行子模块,用于控制基本输入输出系统执行上电启动模式,以使服务器进入开机状态。
优选地,所述循环上下电测试系统还包括开机监测模块,用于监测服务器的开机状态;开机监测模块包括:
开机判断子模块,用于判断服务器是否按照预设上电开机策略上电开机;
异常信息获取子模块,用于当服务器未上电开机时,获取服务器的上电异常信息;
启动判断子模块,用于当服务器上电开机时,判断服务器的操作系统是否正常启动;
异常信息获取子模块,还用于当操作系统未正常启动时,获取服务器的上电异常信息。
优选地,所述关机控制模块,包括:
关机操作执行子模块,用于当操作系统正常启动时,控制服务器运行预定时间后执行关机操作;
关机次数统计子模块,用于控制服务器统计本次关机操作的关机次数;
关机状态写入子模块,用于当本次关机操作的关机次数小于预设关机次数阈值时,控制服务器将关机状态信息写入BMC的BMC日志。
优选地,所述通断指令发送模块,包括:
标志位设置子模块,用于预设通断时间与寄存器标志位的对应关系;
标志位写入子模块,用于根据所述通断电指令,通过所述BMC向所述PSU内的寄存器写入所述寄存器标志位。
综上,本申请技术方案提供的服务器循环上下电测试方案,直接使用被测试的服务器中的电源供电单元PSU和底板管理控制器BMC对服务器进行测试。具体地,通过控制服务器中电源供电单元PSU上电,服务器上电后将触发服务器按预设上电开机策略自动进入开机状态;当服务器正常开机时,按预设关机脚本控制服务器执行关机操作;此时,本方案通过服务器的底板管理控制器BMC监测服务器的关机状态;当监测到服务器正常关机时,通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电。若通过BMC监测到服务器未正常关机,则输出整机异常信息。
综上,本申请技术方案提供的服务器循环上下电测试方案,仅仅使用服务器自带的电源供电单元PSU和底板管理控制器BMC,就就能够实现对服务器是否正常上下电的监测,不需要额外使用疲劳机或电源分配单元PDU,更不需要单独引出信号线和供电线接入到需要检测的服务器上,从而解决了现有技术中疲劳机或电源分配单元占地体积较大,需要引出信号线和供电线接入到被测服务器,导致占用大量资源等问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明实施例提供的第一种服务器的循环上下电测试方法的流程示意图;
图2是图1所示实施例提供的一种开机触发方法的流程示意图;
图3是图1所示实施例提供的一种关机控制方法的流程示意图;
图4是图1所示实施例提供的一种通断电控制方法的流程示意图;
图5是本发明实施例提供的第二种服务器的循环上下电测试方法的流程示意图;
图6是本发明实施例提供的第三种服务器的循环上下电测试方法的流程示意图;
图7是本发明实施例提供的第一种服务器的循环上下电测试系统的结构示意图;
图8是本发明实施例提供的一种PSU控制输出方式的电路结构示意图;
图9是本发明实施例提供的第二种服务器的循环上下电测试系统的结构示意图;
图10是图9所示实施例提供的一种开机触发模块的结构示意图;
图11是图9所示实施例提供的一种开机监测模块的结构示意图;
图12是图9所示实施例提供的一种关机控制模块的结构示意图;
图13是图9所示实施例提供的一种通断指令发送模块的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决问题是:
现有技术中提供的被测服务器的循环上下电测试方案中,需要使用特殊的测试设备:疲劳机或者电源分配单元PDU。虽然疲劳机或PDU能够起到通断交流电的作用,但是,疲劳机或PDU的体积较大且需要引出单独的信号线(即电源侦测线)和供电线连接到被测服务器,这样非常占用资源。此外,疲劳机或PDU还需要额外添加控制主机,以控制疲劳机或PDU侦测被测服务器整机的开关机。
循环上下电测试主要测试服务器整机的上下电功能,其测试过程中不允许服务器存在异常宕机和错误日志。在本申请下述实施例中,主要测试服务器上下电过程中开机和关机功能是否正常。
为了解决上述问题,参见图1,图1是本发明实施例提供的第一种服务器的循环上下电测试方法的流程示意图。如图1所示,该服务器的循环上下电测试方法包括:
S110:控制被测试的服务器中电源供电单元PSU上电,触发服务器按预设上电开机策略进入开机状态。
PSU为Power supply unit的缩写,即电源供电单元,PSU为服务器自带,能为服务器提供交流电能,从而控制服务器上电。在本申请实施例中,预先通过服务器的基本输入输出系统BIOS设定上电开机策略,当服务器的PSU一上电后,就出发服务器进入开机状态,从而方便监测设备对服务器开机状态的监测。
具体地,如图2所示,该步骤S110触发服务器按预设上电开机策略进入开机状态,具体包括如下子步骤:
S111:当PSU上电时,PSU触发服务器的基本输入输出系统启动。
基本输入输出系统(Basic Input-output System,BIOS)为服务器自带,该基本输入输出系统负责开机时对系统的各项硬件进行初始化设置和测试,以确保系统能够正常工作。若硬件不正常则立即停止工作,并把出错的设备信息反馈给用户。因此当PSU上电时触发该基本输入输出系统启动,则该基本输入输出系统就能够控制服务器执行开机操作。
S112:控制基本输入输出系统执行上电启动模式,以使服务器进入开机状态。
基本输入输出系统包括以下功能模块:电源管理模块Power Management,上电启动模块Restore AC Power Loss,该上电启动模块默认状态为电源关闭状态,当需要做上下电测试,即当PSU上电时,将触发该上电启动模块为电源开启状态。
S120:当服务器正常开机时,按预设关机脚本控制服务器执行关机操作。
循环上下电测试的一项重要内容就是检测服务器是否能够正常关机,在本申请中,在服务器内置预设关机脚本,当服务器正常开机后,按照该预设关机脚本控制服务器执行关机操作,这样就能够通过监测服务器的关机状态,判断服务器是否能够正常关机。
其中,如图3所示,上述步骤S120:按预设关机脚本控制服务器执行关机操作,包括:
S121:当操作系统正常启动时,控制服务器运行预定时间后执行关机操作。
其中,服务器若能够正常开机,且其操作系统若能够正常工作,那么在操作系统下服务器会执行预设关机脚本,该预设关机脚本可适用shell语言编写,其具体作用如下:进入操作系统时,通过计时一段时间后(时长可由操作人员设定),使用shell语言中Ipmitool命令执行关机动作,并计数和设定循环上下电的次数。
S122:控制服务器统计本次关机操作的关机次数。
S123:当本次关机操作的关机次数小于预设关机次数阈值时,控制服务器将关机状态信息写入BMC的BMC日志。
本申请实施例中,循环上下电测试的次数是有限的,通常将预设关机次数阈值设置在400-1200次之间,优选设置500次或1000次。当服务器的关机次数大于或等于该预设关机次数阈值时,则服务器的上下电测试完成,说明服务器上下电功能正常,不存在宕机的情况。
S130:通过服务器的底板管理控制器BMC,监测服务器的关机状态。服务器关机时,服务器会将关机状态写入BMC的BMC日志中,通过BMC日志中存在关机状态位,标志着服务器是否正常关机。通过读取该BMC日志中的关机状态位就能够准确监测到服务器的关机状态。本申请实施例中,监测设备,如带外控制主机,通过网线连接到服务器的底板管理控制器BMC管理网口,通过在服务器中设置一脚本读取BMC中的关机状态并收集BMC日志。
S140:当监测到服务器正常关机时,通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电。
若被测服务器能够正常关机,那么预设的脚本就会继续向BMC发送命令,以控制BMC输出通断电指令,该通断电指令通过系统管理总线SMBus连接到服务器主板的电源供电单元PSU,这样通断电指令就能够控制PSU的断开时间;其中该断开时间可调整。
具体地,如图4所示,上述步骤S140:通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电的步骤,包括:
S141:预设通断时间与寄存器标志位的对应关系。
结合图8所示电路结构,PSU内存在数字信号处理DSP寄存器,本申请中可通过BMC向DSP寄存器中的标志位写入不同的数值来代表不同的关闭时长,例如下表所示:
寄存器标志位 通断时间
0000 1分钟
0001 1.5分钟
0010 2分钟
0011 2.5分钟
0100 3分钟
S142:根据所述通断电指令,通过所述BMC向所述PSU内的寄存器写入所述寄存器标志位。
该通断电指令对应的是寄存器标志位的数值,这样通过设置PSU内寄存器的寄存器标志位数值就能够控制PSU断电一段时间后再通电。
本申请实施例提供的服务器循环上下电测试方法,直接使用被测试的服务器中的电源供电单元PSU和底板管理控制器BMC对服务器进行测试。具体地,通过控制服务器中电源供电单元PSU上电,服务器上电后将触发服务器按预设上电开机策略自动进入开机状态;当服务器正常开机时,按预设关机脚本控制服务器执行关机操作;此时,本方案通过服务器的底板管理控制器BMC监测服务器的关机状态;当监测到服务器正常关机时,通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电。若通过BMC监测到服务器未正常关机,则输出整机异常信息。
综上,本申请实施例提供的服务器循环上下电测试方法,仅仅使用服务器自带的电源供电单元PSU和底板管理控制器BMC,就就能够实现对服务器是否正常上下电的监测,不需要额外使用疲劳机或电源分配单元PDU,更不需要单独引出信号线和供电线接入到需要检测的服务器上,从而解决了现有技术中疲劳机或电源分配单元占地体积较大,需要引出信号线和供电线接入到被测服务器,导致占用大量资源等问题。
另外,如图5所示,图5是本发明实施例提供的第二种服务器的循环上下电测试方法,该方法包括监测服务器的开机状态的步骤;如图5所示,该监测服务器的开机状态的步骤具体包括:
S210:判断服务器是否按照预设上电开机策略上电开机。服务器的上电开机是循环上下电测试的重要内容,若服务器未上电开机,则说明服务器存在开机过程宕机。
S220:当服务器未上电开机时,获取服务器的上电异常信息;服务器未上电开机说明服务器存在开机过程宕机,通过获取服务器的上电异常信息能够发现服务器隐藏的系统开机问题。
或者,
S230:当服务器上电开机时,判断服务器的操作系统是否正常启动。服务器开机后会自动启动操作系统,这样就能够监测服务器的操作系统是否正常启动,这样就能够根据服务器的操作系统的正常启动状况监测服务器是否存在操作系统下宕机。
S240:当操作系统未正常启动时,获取服务器的上电异常信息;操作系统未正常启动,说明服务器存在操作系统下宕机,此时获取服务器的上电异常信息就能够发现隐藏的系统开启问题。
另外当操作系统正常启动时,执行图1所示步骤S120:按预设关机脚本控制服务器执行关机操作的内容。
另外,参见图6,图6是本发明实施例提供的第三种服务器的循环上下电测试方法的流程示意图。其中,从开始步骤S310到步骤S350,即图6的左侧是被测的服务器需要执行的步骤,步骤S360至S390侧,即图6的右侧部分是带外控制主机的一侧。具体地如图6所示,该服务器的循环上下电测试方法包括以下步骤:
S310:服务器的PSU上电,PSU触发服务器自动开机。
S320:判断服务器是否开机;若服务器未开机,说明服务器整机开机异常,输出整机异常信号;若服务器开机,则执行步骤S330。
S330:判断服务器是否进入到操作系统OS中;若服务器未进入到操作系统OS中,说明服务器系统异常,此时输出整机异常信号;若服务器进入到操作系统OS中,则说明系统开启正常,此时执行步骤S340。
S340:自动运行关机脚本,该关机脚本用于控制服务器关机,并进行计数和设定循环上下电的次数。
S350:判断服务器是否关机;若服务器未关机,则说明服务器出现关机异常,此时输出整机异常信息;若服务器正常关机,则说明服务器关机功能正常,此时执行步骤S360。
S360:带外控制主机通过BMC判断服务器的关机状态是否正常。服务器关机时会将关机状态写入BMC日志内,此时通过开发一个脚本读取BMC内系统的状态并收集BMC日志就能够判断服务器是否存在关进异常。其中带外控制主机通过网线连接到BMC的管理网口。
S370:判断关机状态是否正常;若是则执行步骤S380;若否,则说明服务器关机异常,此时输出整机异常信息。
S380:带外控制主机开始收集系统日志,该系统根日志即为上述BMC日志,通过收集该系统日志就能够确定服务器的上下电测试情况。
S390:带外控制主机向BMC发送控制PSU断开指令,在服务器中,BMC通过系统管理总线SMBus连接到PSU中,因此通过向BMC发送控制PSU断开指令,能够控制PSU断开预定时间后再次上电。
本申请上述实施例需要执行通断电源供电单元PSU电压的操作,使用方式如下:带外控制主机使用自动化脚本控制底板管理控制器BMC输出通断电控制指令,该通断电控制指令通过系统管理总线SMBus总线写入PSU的数字信号处理DSP寄存器中;在PSU内,DSP能够侦测到寄存器值改变后,通过GPIO的方式控制PSU输出电压的通断,其中,控制PSU通断使用的开关器件是大功率MOS管。
另外,基于上述方法实施例的同一构思,本发明实施例还提供了一种服务器的循环上下电测试系统,用于实现本发明的上述方法,由于该系统实施例解决问题的原理与上述方法相似,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
参见图7,图7为申请实施例提供的第一种服务器的循环上下电测试系统的结构示意图。如图7所示,该服务器的循环上下电测试系统包括带外整机1,还包括服务器的底板管理控制器BMC2,电源供电单元PSU1(标号3)和PSU2(标号4),其中BMC、PSU1和PSU2均内置于服务器内,本申请实施例中带外整机通过网线与服务器内的BMC相连,BMC通过系统管理总线与各PSU相连,因此本申请实施例提供的循环上下电监测方案,不需要额外的疲劳机或电源分配单元PDU,并且不需要从疲劳机或PDU中单独引出侦测线和电源线,也不需要在被测试的服务器上焊接专门的12V电压接口,因此解决了现有的循环上下电测试方法占地面积大,浪费资源的问题。
另外,参见图8,图8未本申请实施例提供的一种PSU控制输出方式的电路结构图。如图8所示,在该电路结构中,PSU接入220V市电网络,并且该PSU内置有数字信号处理器DSP,该PSU通过变压-整流-滤波处理,将12V电压信号输入至DSP,DSP将12V电压信号输出至主板内的电压转换器中,通过该电压转换器将转换的电压接入到主板的各主板模块中。
其具体控制结构参见图9,图9为本发明实施例提供的一种服务器的循环上下电测试系统的结构示意图,其中,服务器包括电源供电单元PSU和底板管理控制器BMC;如图9所示,该服务器的循环上下电测试系统包括:
上电控制模块101,用于控制电源供电单元PSU上电;
开机触发模块102,用于触发服务器按预设上电开机策略进入开机状态;
关机控制模块103,用于当服务器正常开机时,按预设关机脚本控制服务器执行关机操作;
关机监测模块104,用于通过服务器的底板管理控制器BMC,监测服务器的关机状态;
通断指令发送模块105,用于当监测到服务器正常关机时,通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电。
综上,本申请技术方案提供的服务器循环上下电测试系统,直接使用被测试的服务器中的电源供电单元PSU和底板管理控制器BMC对服务器进行测试。具体地,上电控制模块101通过控制服务器中电源供电单元PSU上电,服务器上电后将触发服务器按预设上电开机策略自动进入开机状态;会在当服务器正常开机时,关机控制模块103按预设关机脚本控制服务器执行关机操作;此时关机监测模块104会通过服务器的底板管理控制器BMC监测服务器的关机状态;当关机监测模块104监测到服务器正常关机时,通断指令发送模块105通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电。若关机监测模块104通过BMC监测到服务器未正常关机,则输出整机异常信息。
综上,本申请技术方案提供的服务器循环上下电测试系统,仅仅使用服务器自带的电源供电单元PSU和底板管理控制器BMC,就就能够实现对服务器是否正常上下电的监测,不需要额外使用疲劳机或电源分配单元PDU,更不需要单独引出信号线和供电线接入到需要检测的服务器上,从而解决了现有技术中疲劳机或电源分配单元占地体积较大,需要引出信号线和供电线接入到被测服务器,导致占用大量资源等问题。
其中,如图10所示,图9所示实施例提供的开机触发模块102包括:
系统启动触发子模块1021,用于当PSU上电时,控制PSU触发服务器的基本输入输出系统启动;
启动模式执行子模块1022,用于控制基本输入输出系统执行上电启动模式,以使服务器进入开机状态。
其中,参见图11,图9所示实施例提供的循环上下电测试系统还包括开机监测模块106,用于监测服务器的开机状态;如图11所示,开机监测模块106包括:
开机判断子模块1061,用于判断服务器是否按照预设上电开机策略上电开机;
异常信息获取子模块1062,用于当服务器未上电开机时,获取服务器的上电异常信息;
启动判断子模块1063,用于当服务器上电开机时,判断服务器的操作系统是否正常启动;
上述异常信息获取子模块1063,还用于当操作系统未正常启动时,获取服务器的上电异常信息。
其中,如图12所示,图9所示实施例提供的关机控制模块103,包括:
关机操作执行子模块1031,用于当操作系统正常启动时,控制服务器运行预定时间后执行关机操作;
关机次数统计子模块1032,用于控制服务器统计本次关机操作的关机次数;
关机状态写入子模块1033,用于当本次关机操作的关机次数小于预设关机次数阈值时,控制服务器将关机状态信息写入BMC的BMC日志。
如图13所示,上述实施例提供的通断指令发送模块105包括:
标志位设置子模块1051,用于预设通断时间与寄存器标志位的对应关系;
标志位写入子模块1052,用于根据所述通断电指令,通过所述BMC向所述PSU内的寄存器写入所述寄存器标志位。
本发明计算机可读存储介质具体实施例与上述基于显微图像的草酸钙晶体智能鉴别方法的各实施例基本相同,在此不再详细赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种服务器的循环上下电测试方法,其特征在于,包括:
控制被测试的服务器中电源供电单元PSU上电,触发所述服务器按预设上电开机策略进入开机状态;
当所述服务器正常开机时,按预设关机脚本控制所述服务器执行关机操作;
通过所述服务器的底板管理控制器BMC,监测所述服务器的关机状态;
当监测到所述服务器正常关机时,通过所述BMC向所述PSU发送通断电指令,以控制PSU断电预定时间再次上电。
2.根据权利要求1所述的循环上下电测试方法,其特征在于,所述触发服务器按预设上电开机策略进入开机状态的步骤,包括:
当所述PSU上电时,所述PSU触发所述服务器的基本输入输出系统启动;
控制所述基本输入输出系统执行上电启动模式,以使所述服务器进入开机状态。
3.根据权利要求1或2所述的循环上下电测试方法,其特征在于,所述循环上下电测试方法还包括监测服务器的开机状态;所述监测服务器的开机状态的步骤包括:
判断所述服务器是否按照所述预设上电开机策略上电开机;
当所述服务器未上电开机时,获取所述服务器的上电异常信息;或者,
当所述服务器上电开机时,判断所述服务器的操作系统是否正常启动;
当所述操作系统未正常启动时,获取所述服务器的上电异常信息;或者,
当所述操作系统正常启动时,执行所述按预设关机脚本控制所述服务器执行关机操作的步骤。
4.根据权利要求3所述的循环上下电测试方法,其特征在于,所述按预设关机脚本控制服务器执行关机操作的步骤,包括:
当所述操作系统正常启动时,控制服务器运行预定时间后执行关机操作;
控制所述服务器统计本次关机操作的关机次数;
当本次关机操作的关机次数小于预设关机次数阈值时,控制所述服务器将关机状态信息写入所述BMC的BMC日志。
5.根据权利要求1所述的循环上下电测试方法,其特征在于,所述通过BMC向PSU发送通断电指令,以控制PSU断电预定时间再次上电的步骤,包括:
预设通断时间与寄存器标志位的对应关系;
根据所述通断电指令,通过所述BMC向所述PSU内的寄存器写入所述寄存器标志位。
6.一种服务器的循环上下电测试系统,其特征在于,所述服务器包括电源供电单元PSU和底板管理控制器BMC;所述服务器的循环上下电测试系统包括:
上电控制模块,用于控制所述电源供电单元PSU上电;
开机触发模块,用于触发所述服务器按预设上电开机策略进入开机状态;
关机控制模块,用于当所述服务器正常开机时,按预设关机脚本控制所述服务器执行关机操作;
关机监测模块,用于通过所述服务器的底板管理控制器BMC,监测所述服务器的关机状态;
通断指令发送模块,用于当监测到所述服务器正常关机时,通过所述BMC向所述PSU发送通断电指令,以控制PSU断电预定时间再次上电。
7.根据权利要求6所述的循环上下电测试系统,其特征在于,所述开机触发模块,包括:
系统启动触发子模块,用于当所述PSU上电时,控制所述PSU触发所述服务器的基本输入输出系统启动;
启动模式执行子模块,用于控制所述基本输入输出系统执行上电启动模式,以使所述服务器进入开机状态。
8.根据权利要求6或7所述的循环上下电测试系统,其特征在于,还包括开机监测模块,用于监测服务器的开机状态;所述开机监测模块包括:
开机判断子模块,用于判断所述服务器是否按照所述预设上电开机策略上电开机;
异常信息获取子模块,用于当所述服务器未上电开机时,获取所述服务器的上电异常信息;
启动判断子模块,用于当所述服务器上电开机时,判断所述服务器的操作系统是否正常启动;
所述异常信息获取子模块,还用于当所述操作系统未正常启动时,获取所述服务器的上电异常信息。
9.根据权利要求8所述的循环上下电测试系统,其特征在于,所述关机控制模块,包括:
关机操作执行子模块,用于当所述操作系统正常启动时,控制所述服务器运行预定时间后执行关机操作;
关机次数统计子模块,用于控制服务器统计本次关机操作的关机次数;
关机状态写入子模块,用于当本次关机操作的关机次数小于预设关机次数阈值时,控制所述服务器将关机状态信息写入所述BMC的BMC日志。
10.根据权利要求6所述的循环上下电测试系统,其特征在于,所述通断指令发送模块,包括:
标志位设置子模块,用于预设通断时间与寄存器标志位的对应关系;
标志位写入子模块,用于根据所述通断电指令,通过所述BMC向所述PSU内的寄存器写入所述寄存器标志位。
CN202010471263.6A 2020-05-29 2020-05-29 一种服务器的循环上下电测试方法和系统 Active CN111752776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010471263.6A CN111752776B (zh) 2020-05-29 2020-05-29 一种服务器的循环上下电测试方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010471263.6A CN111752776B (zh) 2020-05-29 2020-05-29 一种服务器的循环上下电测试方法和系统

Publications (2)

Publication Number Publication Date
CN111752776A true CN111752776A (zh) 2020-10-09
CN111752776B CN111752776B (zh) 2022-10-25

Family

ID=72674101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010471263.6A Active CN111752776B (zh) 2020-05-29 2020-05-29 一种服务器的循环上下电测试方法和系统

Country Status (1)

Country Link
CN (1) CN111752776B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269464A (zh) * 2020-10-20 2021-01-26 苏州浪潮智能科技有限公司 一种优化的电源管理方法及系统
CN113138889A (zh) * 2021-03-26 2021-07-20 山东英信计算机技术有限公司 一种测试电路和服务器
CN113589092A (zh) * 2021-09-28 2021-11-02 苏州浪潮智能科技有限公司 疲劳机、设备上下电测试系统及上下电测试方法
TWI783666B (zh) * 2021-09-03 2022-11-11 英業達股份有限公司 智能自動化測試系統及其方法
CN115695265A (zh) * 2022-10-20 2023-02-03 深圳市智微智能科技股份有限公司 一种交换机自动循环上下电测试方法、设备及存储介质
CN116149957A (zh) * 2023-04-19 2023-05-23 湖南博匠信息科技有限公司 一种通过bmc保存服务器上下电记录的方法
CN116483613A (zh) * 2023-06-21 2023-07-25 苏州浪潮智能科技有限公司 故障内存条的处理方法及装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526663A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种基于带外管理与操作系统协同的开关机测试方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526663A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种基于带外管理与操作系统协同的开关机测试方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269464A (zh) * 2020-10-20 2021-01-26 苏州浪潮智能科技有限公司 一种优化的电源管理方法及系统
CN113138889A (zh) * 2021-03-26 2021-07-20 山东英信计算机技术有限公司 一种测试电路和服务器
CN113138889B (zh) * 2021-03-26 2022-05-17 山东英信计算机技术有限公司 一种测试电路和服务器
TWI783666B (zh) * 2021-09-03 2022-11-11 英業達股份有限公司 智能自動化測試系統及其方法
CN113589092A (zh) * 2021-09-28 2021-11-02 苏州浪潮智能科技有限公司 疲劳机、设备上下电测试系统及上下电测试方法
CN113589092B (zh) * 2021-09-28 2022-01-04 苏州浪潮智能科技有限公司 疲劳机、设备上下电测试系统及上下电测试方法
CN115695265A (zh) * 2022-10-20 2023-02-03 深圳市智微智能科技股份有限公司 一种交换机自动循环上下电测试方法、设备及存储介质
CN116149957A (zh) * 2023-04-19 2023-05-23 湖南博匠信息科技有限公司 一种通过bmc保存服务器上下电记录的方法
CN116149957B (zh) * 2023-04-19 2023-06-20 湖南博匠信息科技有限公司 一种通过bmc保存服务器上下电记录的方法
CN116483613A (zh) * 2023-06-21 2023-07-25 苏州浪潮智能科技有限公司 故障内存条的处理方法及装置、电子设备及存储介质
CN116483613B (zh) * 2023-06-21 2023-09-29 苏州浪潮智能科技有限公司 故障内存条的处理方法及装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111752776B (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
CN111752776B (zh) 一种服务器的循环上下电测试方法和系统
CN111324192A (zh) 一种系统板卡电源检测方法、装置、设备及存储介质
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
WO2019214010A1 (zh) 一种监控设备故障的方法和装置
CN112462920B (zh) 一种电源控制的方法、装置、服务器及存储介质
CN105183575A (zh) 处理器故障的诊断方法、装置及系统
CN113835508A (zh) 一种服务器的功耗管理方法、装置、bmc及存储介质
CN115543872A (zh) 一种设备管理方法、装置及计算机存储介质
CN115728665A (zh) 一种电源故障检测电路、方法及系统
CN107168819B (zh) 一种操作系统重启方法及装置
CN113076210B (zh) 服务器故障诊断结果通知方法、系统、终端及存储介质
CN114996069A (zh) 一种主板测试方法、装置以及介质
CN113419618A (zh) 服务器解码卡下电控制方法、系统、终端及存储介质
CN113590203A (zh) 基板管理控制器失效处理方法及系统、存储介质及单片机
CN114328044B (zh) 一种AIC+box拓扑的测试方法、装置和系统
CN111352789B (zh) 一种用于服务器的交流循环测试方法、装置及存储介质
CN113836035B (zh) 电池管理系统测试方法、装置及电子设备
CN113127277B (zh) 一种设备测试方法、装置、电子设备及可读存储介质
CN115934446A (zh) 一种自检方法、服务器、设备和存储介质
CN114356708A (zh) 一种设备故障监控方法、装置、设备及可读存储介质
CN115292107A (zh) 产品稳定性测试系统、方法及服务器
CN116107821A (zh) 一种整系统开关机测试方法、装置、设备及介质
CN117149492A (zh) 一种服务器故障检测方法、装置、设备及计算机存储介质
CN114443446A (zh) 硬盘指示灯控制方法、系统、终端及存储介质
CN115599716A (zh) 一种识别fru在位方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant