CN114328044B - 一种AIC+box拓扑的测试方法、装置和系统 - Google Patents

一种AIC+box拓扑的测试方法、装置和系统 Download PDF

Info

Publication number
CN114328044B
CN114328044B CN202111450036.6A CN202111450036A CN114328044B CN 114328044 B CN114328044 B CN 114328044B CN 202111450036 A CN202111450036 A CN 202111450036A CN 114328044 B CN114328044 B CN 114328044B
Authority
CN
China
Prior art keywords
aic
power
box
pods
powered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111450036.6A
Other languages
English (en)
Other versions
CN114328044A (zh
Inventor
刘瑞雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111450036.6A priority Critical patent/CN114328044B/zh
Publication of CN114328044A publication Critical patent/CN114328044A/zh
Application granted granted Critical
Publication of CN114328044B publication Critical patent/CN114328044B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请实施例公开了一种AIC+box拓扑的测试方法、装置和系统AIC在上电启动后,控制所有POD开机;获取所有POD的状态;在所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC下电的操作标识。以便于控制端依据操作标识实现对AIC以及box的上下电稳定性测试。AIC通过对自身包含的POD执行关机操作,可以避免控制端直接对AIC执行下电操作时,POD进入recovery模式,导致AIC无法在短时间内再次执行上下电操作。保证了AIC和box上下电操作的顺利执行,从而有效的对AIC+box拓扑的稳定性进行检测。

Description

一种AIC+box拓扑的测试方法、装置和系统
技术领域
本申请涉及设备测试技术领域,特别是涉及一种AIC+box拓扑的测试方法、装置和系统。
背景技术
随着大数据和人工智能的发展,以及5G时代的到来让整个计算机行业对算力的要求越来越高。算力时代的一大特征是跳出了中央处理器(Central Processing Unit,CPU)为主的玩法,将部分功能独立出来,减轻CPU负担。例如,采用图形处理器(GraphicsProcessing Unit,GPU)提供专用计算,负责显示相关的数据处理。智能网卡将CPU执行的网络流量处理分离处理。另外应运而生了一些智能外插卡(AIC)将CPU的部分功能独立出来。一个AIC即是一个独立的小系统。
目前存在一种智能AIC负责视频的转码工作,N个智能AIC置于BOX中工作,而BOX可以供电以及提供散热功能。传统方式中,基板管理控制器(Baseboard ManagementController,BMC)无法实现对AIC上POD状态的检测。BMC控制AIC下电之前,可能会存在AIC上的POD仍处于正常上电状态。若此时BMC直接控制AIC执行下电操作,会导致AIC上的POD进入恢复(recovery)模式,recovery模式一般会持续半小时左右,AIC再次上电时由于POD处于recovery模式下,因此POD并不能实现上电重启,导致无法有效的验证AIC上下电的稳定性。
可见,如何有效的对AIC+box拓扑的稳定性进行检测,是本领域技术人员需要解决的问题。
发明内容
本申请实施例的目的是提供一种AIC+box拓扑的测试方法、装置和系统,可以有效的对AIC+box拓扑的稳定性进行检测。
为解决上述技术问题,本申请实施例提供一种AIC+box拓扑的测试方法,适用于AIC,包括:
在上电启动后,控制所有POD开机;
获取所有所述POD的状态;
在所有所述POD状态正常的情况下,控制所有所述POD关机,并向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据所述操作标识实现对所述AIC以及box的上下电稳定性测试。
可选地,所述获取所有所述POD的状态包括:
基于UART登陆调试窗口,利用所述调试窗口向所有所述POD发送状态获取请求;
若预设时间内接收到所有所述POD反馈的状态信息,则判定所有所述POD状态正常;
若预设时间内未接收到目标POD反馈的状态信息,则判定所述目标POD状态异常。
可选地,还包括:
在所有所述POD中存在状态异常的目标POD的情况下,记录所述目标POD的异常信息。
可选地,所述向对应的寄存器写入支持AIC下电的操作标识包括:
通过I2C向AIC连接的CPLD的温度寄存器中写入一个温度异常值。
本申请实施例还提供了一种AIC+box拓扑的测试装置,适用于AIC,包括控制单元、获取单元和写入单元;
所述控制单元,用于在上电启动后,控制所有POD开机;
所述获取单元,用于获取所有所述POD的状态;
所述控制单元,用于在所有所述POD状态正常的情况下,控制所有所述POD关机;
所述写入单元,用于向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据所述操作标识实现对所述AIC以及box的上下电稳定性测试。
可选地,所述获取单元包括发送子单元、第一判定子单元和第二判定子单元;
所述发送子单元,用于基于UART登陆调试窗口,利用所述调试窗口向所有所述POD发送状态获取请求;
所述第一判定子单元,用于若预设时间内接收到所有所述POD反馈的状态信息,则判定所有所述POD状态正常;
所述第二判定子单元,用于若预设时间内未接收到目标POD反馈的状态信息,则判定所述目标POD状态异常。
可选地,还包括记录单元;
所述记录单元,用于在所有所述POD中存在状态异常的目标POD的情况下,记录所述目标POD的异常信息。
可选地,所述写入单元用于通过I2C向AIC连接的CPLD的温度寄存器中写入一个温度异常值。
本申请实施例还提供了一种AIC+box拓扑的测试方法,适用于控制端,包括:
从寄存器中读取AIC对应的标识信息;
若所述AIC的标识信息为支持AIC下电的操作标识,则控制所述AIC执行下电操作;
获取所述AIC的供电状态;
在所述AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制所述box上电,从而识别所述AIC以及所述box上下电操作是否正常。
可选地,还包括:
若存在不具有支持AIC下电的操作标识的目标AIC,则向所述AIC传输控制POD关机的提示指令,以便于所述AIC控制其管控下的所有POD执行关机操作。
可选地,还包括:
若存在供电状态不是下电状态的目标AIC,则控制所述目标AIC执行下电操作。
本申请实施例还提供了一种AIC+box拓扑的测试装置,适用于控制端,包括读取单元、控制单元、获取单元和识别单元;
所述读取单元,用于从寄存器中读取AIC对应的标识信息;
所述控制单元,用于若所述AIC的标识信息为支持AIC下电的操作标识,则控制所述AIC执行下电操作;
所述获取单元,用于获取所述AIC的供电状态;
所述识别单元,用于在所述AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制所述box上电,从而识别所述AIC以及所述box上下电操作是否正常。
可选地,还包括传输单元;
所述传输单元,用于若存在不具有支持AIC下电的操作标识的目标AIC,则向所述AIC传输控制POD关机的提示指令,以便于所述AIC控制其管控下的所有POD执行关机操作。
可选地,所述控制单元还用于若存在供电状态不是下电状态的目标AIC,则控制所述目标AIC执行下电操作。
本申请实施例还提供了一种AIC+box拓扑的测试系统,包括AIC和控制端;所述AIC设置于box上;
所述AIC,用于在上电启动后,控制所有POD开机;获取所有所述POD的状态;在所有所述POD状态正常的情况下,控制所有所述POD关机,并向对应的寄存器写入支持AIC下电的操作标识;
所述控制端,用于从所述寄存器中读取AIC对应的标识信息;若所述AIC的标识信息为支持AIC下电的操作标识,则控制所述AIC执行下电操作;获取所述AIC的供电状态;在所述AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制所述box上电,从而识别所述AIC以及所述box上下电操作是否正常。
由上述技术方案可以看出,AIC在上电启动后,控制所有POD开机;获取所有POD的状态;在所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC下电的操作标识。控制端从寄存器中读取AIC对应的标识信息;若AIC的标识信息为支持AIC下电的操作标识,则说明此时AIC上所有POD已执行关机,此时可以控制AIC执行下电操作。为了确保AIC下电操作的有效执行,可以获取AIC的供电状态;在AIC的供电状态为下电状态的情况下,说明AIC已完成下电操作,此时可以控制AIC所在的box下电,并间隔预设时间段控制box上电,此时开始重新执行上电操作的流程。通过对AIC和box执行上下电操作,可以获知AIC和box是否能够正常执行上电和下电操作,即识别AIC以及box上下电操作是否正常。在该技术方案中,AIC通过对自身包含的POD执行关机操作,可以避免控制端直接对AIC执行下电操作时,POD进入recovery 模式,导致AIC无法在短时间内再次执行上下电操作。保证了AIC和box上下电操作的顺利执行,从而有效的对AIC+box拓扑的稳定性进行检测。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种适用于AIC的AIC+box拓扑的测试方法的流程图;
图2为本申请实施例提供的一种AIC+box拓扑的架构图;
图3为本申请实施例提供的一种适用于控制端的AIC+box拓扑的测试方法的流程图;
图4为本申请实施例提供的一种适用于AIC 的AIC+box拓扑的测试装置的结构示意图;
图5为本申请实施例提供的一种适用于控制端的AIC+box拓扑的测试装置的结构示意图;
图6为本申请实施例提供的一种AIC61+box拓扑的测试系统的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
接下来,详细介绍本申请实施例所提供的一种AIC+box拓扑的测试方法。图1为本申请实施例提供的一种AIC+box拓扑的测试方法的流程图,适用于AIC,该方法包括:
S101:在上电启动后,控制所有POD开机。
本申请实施例提供的AIC+box拓扑,可以包括多个AIC,多个AIC设置在box上,box上还包括有BMC。拓扑中每个AIC都是一个独立的小系统,整个box 上可以兼容n个AIC 。box负责给其供电,box 上的BMC可以对AIC进行温度监控以及做散热调控。
每个AIC执行的操作流程类似,因此在本申请实施例中,以一个AIC执行的流程为例展开说明。
一个AIC上包括有多个POD,每个POD可以看作是一个独立的数据处理中心,可以独立完成工作。
图2为本申请实施例提供的一种AIC+box拓扑的架构图,图2中右侧框中为一个AIC对应的架构图,AIC中包括有一个SOC(System on Chip,系统级芯片)和多个POD。AIC所执行的处理流程是由SOC完成,图2中是以n个POD为例,n为正整数,对于n的具体取值不做限定。box上设置有BMC可以实现对AIC的温度监控。
每个AIC内一个SOC独立管控了n个POD。每个POD部署了一个完整的Android系统。在控制端控制AIC+box拓扑上电后,SOC会自动开机,SOC的cpu上有pod引脚控制接口,SOC进入系统后会给N个POD开机。
S102:获取所有POD的状态。
SOC可以通过UART登陆Android调试窗口,读取N个POD即POD1… PODn的状态。
在具体实现中,可以基于UART登陆调试窗口,利用调试窗口向所有POD发送状态获取请求;若预设时间内接收到所有POD反馈的状态信息,则判定所有POD状态正常;若预设时间内未接收到目标POD反馈的状态信息,则判定目标POD状态异常。
S103:在所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据操作标识实现对AIC以及box的上下电稳定性测试。
若POD未执行关机操作,控制端就直接对AIC执行下电操作,此时POD属于非正常掉电,导致POD进入recorvery 模式。因此,在本申请实施例中,为了避免POD进入recorvery模式,AIC可以在控制POD开机之后,确定所有POD状态正常之后,控制所有POD关机,此时AIC再执行下电操作不会造成POD的非正常掉电,POD不会进入recorvery 模式。
考虑到实际应用中,AIC中可能会存在某个或某些POD异常的情况,对于状态异常的POD可以记录其对应的异常信息,也即在所有POD中存在状态异常的目标POD的情况下,记录目标POD的异常信息,以便于用户及时对异常状态的POD进行检测修复。
因此,在本申请实施例中,也可以在除去异常状态的POD外,剩余的所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC下电的操作标识。
支持AIC下电的操作标识可以采用温度值形式表示,在AIC正常运行时有其对应的正常温度范围,在所有POD关机之后,AIC的温度会发生变化,因此在实际应用中,可以取正常温度范围之外的一个温度值作为支持AIC下电的操作标识。由于选取的温度值是正常温度范围之外的一个温度值,因此可以将该温度值称作温度异常值。
在具体实现中,SOC可以通过I2C向AIC连接的CPLD的温度寄存器中写入一个温度异常值,作为向控制端传递POD关机信息的依据。
由上述技术方案可以看出,AIC在上电启动后,控制所有POD开机;获取所有POD的状态;在所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据操作标识实现对AIC以及box的上下电稳定性测试。通过对AIC和box执行上下电操作,可以获知AIC和box是否能够正常执行上电和下电操作,即识别AIC以及box上下电操作是否正常。在该技术方案中,AIC通过对自身包含的POD执行关机操作,可以避免控制端直接对AIC执行下电操作时,POD进入recovery 模式,导致AIC无法在短时间内再次执行上下电操作。保证了AIC和box上下电操作的顺利执行,从而有效的对AIC+box拓扑的稳定性进行检测。
图3为本申请实施例提供的一种AIC+box拓扑的测试方法的流程图,适用于控制端,包括:
S301:从寄存器中读取AIC对应的标识信息。
控制端可以同时从多个AIC对应的寄存器中读取AIC对应的标识信息,也可以采用轮询的方式,依次获取多个AIC对应的标识信息。
S302:若AIC的标识信息为支持AIC下电的操作标识,则控制AIC执行下电操作。
控制端读取到AIC的标识信息为支持AIC下电的操作标识后,可以通过命令给此AIC所在槽位下电,将其退出散热调控,避免因散热调控异常影响其他AIC的正常工作。
S303:获取AIC的供电状态。
为了确保AIC下电操作的有效执行,可以获取AIC的供电状态。在实际应用中,当AIC完成下电操作时,其对应的寄存器中会记录有相关的标识信息,控制端通过读取寄存器中记录的标识信息,可以确定AIC是否完成下电操作。
S304:在AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制box上电,从而识别AIC以及box上下电操作是否正常。
box上设置的AIC一般有多个,控制box下电之前需要保证所有AIC执行下电操作。
在实际应用中,若存在供电状态不是下电状态的目标AIC,说明目标AIC下电操作并未生效,此时可以控制目标AIC再次执行下电操作。
在AIC的供电状态为下电状态的情况下,说明AIC已完成下电操作,此时可以控制AIC所在的box下电。
预设时间段的取值能够保证整个机器的DC电均释放完毕即可,例如,预设时间段可以设置为30秒。
在控制box下电30秒后,控制端可以通过智能PDU再次给box上电,AIC上设置的SOC上电会自动开机,SOC启动进系统。
通过控制端自动给box上下电,同时校验AIC上POD的状态,避免POD因异常掉电进入recovery模式。同时测试过程中能有效抓取异常信息,供后续分析。全程无需人工参与,在保障测试效率的同时,能有效验证此拓扑结构的上下电稳定性。
在实际应用中,可能会存在AIC在控制POD关机操作失败的情况发生,导致AIC对应的寄存器中并未记录支持AIC下电的操作标识,因此若存在不具有支持AIC下电的操作标识的目标AIC时,控制端可以向AIC传输控制POD关机的提示指令,以便于AIC控制其管控下的所有POD执行关机操作。
由上述技术方案可以看出,控制端从寄存器中读取AIC对应的标识信息。AIC完成POD的关机操作时,寄存器中会记录支持AIC下电的操作标识。若AIC的标识信息为支持AIC下电的操作标识,则说明此时AIC上所有POD已执行关机,此时可以控制AIC执行下电操作。为了确保AIC下电操作的有效执行,可以获取AIC的供电状态;在AIC的供电状态为下电状态的情况下,说明AIC已完成下电操作,此时可以控制AIC所在的box下电,并间隔预设时间段控制box上电,此时开始重新执行上电操作的流程。通过对AIC和box执行上下电操作,可以获知AIC和box是否能够正常执行上电和下电操作,即识别AIC以及box上下电操作是否正常。在该技术方案中,AIC通过对自身包含的POD执行关机操作,可以避免控制端直接对AIC执行下电操作时,POD进入recovery 模式,导致AIC无法在短时间内再次执行上下电操作。保证了AIC和box上下电操作的顺利执行,从而有效的对AIC+box拓扑的稳定性进行检测。
图4为本申请实施例提供的一种适用于AIC 的AIC+box拓扑的测试装置的结构示意图,包括控制单元41、获取单元42和写入单元43;
控制单元41,用于在上电启动后,控制所有POD开机;
获取单元42,用于获取所有POD的状态;
控制单元41,用于在所有POD状态正常的情况下,控制所有POD关机;
写入单元43,用于向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据操作标识实现对AIC以及box的上下电稳定性测试。
可选地,获取单元包括发送子单元、第一判定子单元和第二判定子单元;
发送子单元,用于基于UART登陆调试窗口,利用调试窗口向所有POD发送状态获取请求;
第一判定子单元,用于若预设时间内接收到所有POD反馈的状态信息,则判定所有POD状态正常;
第二判定子单元,用于若预设时间内未接收到目标POD反馈的状态信息,则判定目标POD状态异常。
可选地,还包括记录单元;
记录单元,用于在所有POD中存在状态异常的目标POD的情况下,记录目标POD的异常信息。
可选地,写入单元用于通过I2C向AIC连接的CPLD的温度寄存器中写入一个温度异常值。
图4所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,AIC在上电启动后,控制所有POD开机;获取所有POD的状态;在所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据操作标识实现对AIC以及box的上下电稳定性测试。通过对AIC和box执行上下电操作,可以获知AIC和box是否能够正常执行上电和下电操作,即识别AIC以及box上下电操作是否正常。在该技术方案中,AIC通过对自身包含的POD执行关机操作,可以避免控制端直接对AIC执行下电操作时,POD进入recovery 模式,导致AIC无法在短时间内再次执行上下电操作。保证了AIC和box上下电操作的顺利执行,从而有效的对AIC+box拓扑的稳定性进行检测。
图5为本申请实施例提供的一种适用于控制端的AIC+box拓扑的测试装置的结构示意图,包括读取单元51、控制单元52、获取单元53和识别单元54;
读取单元51,用于从寄存器中读取AIC对应的标识信息;
控制单元52,用于若AIC的标识信息为支持AIC下电的操作标识,则控制AIC执行下电操作;
获取单元53,用于获取AIC的供电状态;
识别单元54,用于在AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制box上电,从而识别AIC以及box上下电操作是否正常。
可选地,还包括传输单元;
传输单元,用于若存在不具有支持AIC下电的操作标识的目标AIC,则向AIC传输控制POD关机的提示指令,以便于AIC控制其管控下的所有POD执行关机操作。
可选地,控制单元还用于若存在供电状态不是下电状态的目标AIC,则控制目标AIC执行下电操作。
图5所对应实施例中特征的说明可以参见图3所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,控制端从寄存器中读取AIC对应的标识信息。AIC完成POD的关机操作时,寄存器中会记录支持AIC下电的操作标识。若AIC的标识信息为支持AIC下电的操作标识,则说明此时AIC上所有POD已执行关机,此时可以控制AIC执行下电操作。为了确保AIC下电操作的有效执行,可以获取AIC的供电状态;在AIC的供电状态为下电状态的情况下,说明AIC已完成下电操作,此时可以控制AIC所在的box下电,并间隔预设时间段控制box上电,此时开始重新执行上电操作的流程。通过对AIC和box执行上下电操作,可以获知AIC和box是否能够正常执行上电和下电操作,即识别AIC以及box上下电操作是否正常。在该技术方案中,AIC通过对自身包含的POD执行关机操作,可以避免控制端直接对AIC执行下电操作时,POD进入recovery 模式,导致AIC无法在短时间内再次执行上下电操作。保证了AIC和box上下电操作的顺利执行,从而有效的对AIC+box拓扑的稳定性进行检测。
图6为本申请实施例提供的一种AIC61+box拓扑的测试系统的结构示意图,包括AIC61和控制端62;AIC61设置于box上;
AIC61,用于在上电启动后,控制所有POD开机;获取所有POD的状态;在所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC61下电的操作标识;
控制端62,用于从寄存器中读取AIC61对应的标识信息;若AIC61的标识信息为支持AIC61下电的操作标识,则控制AIC61执行下电操作;获取AIC61的供电状态;在AIC61的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制box上电,从而识别AIC61以及box上下电操作是否正常。
为了便于展示,图6中是以三个AIC为例,在实际应用中,AIC的个数可以为更多或更少个,在此不做限定。
图6所对应实施例中特征的说明可以参见图1和图3所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,AIC在上电启动后,控制所有POD开机;获取所有POD的状态;在所有POD状态正常的情况下,控制所有POD关机,并向对应的寄存器写入支持AIC下电的操作标识。控制端从寄存器中读取AIC对应的标识信息;若AIC的标识信息为支持AIC下电的操作标识,则说明此时AIC上所有POD已执行关机,此时可以控制AIC执行下电操作。为了确保AIC下电操作的有效执行,可以获取AIC的供电状态;在AIC的供电状态为下电状态的情况下,说明AIC已完成下电操作,此时可以控制AIC所在的box下电,并间隔预设时间段控制box上电,此时开始重新执行上电操作的流程。通过对AIC和box执行上下电操作,可以获知AIC和box是否能够正常执行上电和下电操作,即识别AIC以及box上下电操作是否正常。在该技术方案中,AIC通过对自身包含的POD执行关机操作,可以避免控制端直接对AIC执行下电操作时,POD进入recovery 模式,导致AIC无法在短时间内再次执行上下电操作。保证了AIC和box上下电操作的顺利执行,从而有效的对AIC+box拓扑的稳定性进行检测。
以上对本申请实施例所提供的一种AIC+box拓扑的测试方法、装置和系统。进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上对本申请所提供的一种AIC+box拓扑的测试方法、装置和系统。进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种AIC+box拓扑的测试方法,其特征在于,适用于AIC,包括:
在上电启动后,控制所有POD开机;
获取所有所述POD的状态;
在所有所述POD状态正常的情况下,控制所有所述POD关机,并向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据所述操作标识实现对所述AIC以及box的上下电稳定性测试。
2.根据权利要求1所述的AIC+box拓扑的测试方法,其特征在于,所述获取所有所述POD的状态包括:
基于UART登陆调试窗口,利用所述调试窗口向所有所述POD发送状态获取请求;
若预设时间内接收到所有所述POD反馈的状态信息,则判定所有所述POD状态正常;
若预设时间内未接收到目标POD反馈的状态信息,则判定所述目标POD状态异常。
3.根据权利要求2所述的AIC+box拓扑的测试方法,其特征在于,还包括:
在所有所述POD中存在状态异常的目标POD的情况下,记录所述目标POD的异常信息。
4.根据权利要求1所述的AIC+box拓扑的测试方法,其特征在于,所述向对应的寄存器写入支持AIC下电的操作标识包括:
通过I2C向AIC连接的CPLD的温度寄存器中写入一个温度异常值。
5.一种AIC+box拓扑的测试装置,其特征在于,适用于AIC,包括控制单元、获取单元和写入单元;
所述控制单元,用于在上电启动后,控制所有POD开机;
所述获取单元,用于获取所有所述POD的状态;
所述控制单元,用于在所有所述POD状态正常的情况下,控制所有所述POD关机;
所述写入单元,用于向对应的寄存器写入支持AIC下电的操作标识,以便于控制端依据所述操作标识实现对所述AIC以及box的上下电稳定性测试。
6.一种AIC+box拓扑的测试方法,其特征在于,适用于控制端,包括:
从寄存器中读取AIC对应的标识信息;
若所述AIC的标识信息为支持AIC下电的操作标识,则控制所述AIC执行下电操作;
获取所述AIC的供电状态;
在所述AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制所述box上电,从而识别所述AIC以及所述box上下电操作是否正常。
7.根据权利要求6所述的AIC+box拓扑的测试方法,其特征在于,还包括:
若存在不具有支持AIC下电的操作标识的目标AIC,则向所述AIC传输控制POD关机的提示指令,以便于所述AIC控制其管控下的所有POD执行关机操作。
8.根据权利要求6所述的AIC+box拓扑的测试方法,其特征在于,还包括:
若存在供电状态不是下电状态的目标AIC,则控制所述目标AIC执行下电操作。
9.一种AIC+box拓扑的测试装置,其特征在于,适用于控制端,包括读取单元、控制单元、获取单元和识别单元;
所述读取单元,用于从寄存器中读取AIC对应的标识信息;
所述控制单元,用于若所述AIC的标识信息为支持AIC下电的操作标识,则控制所述AIC执行下电操作;
所述获取单元,用于获取所述AIC的供电状态;
所述识别单元,用于在所述AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制所述box上电,从而识别所述AIC以及所述box上下电操作是否正常。
10.一种AIC+box拓扑的测试系统,其特征在于,包括AIC和控制端;所述AIC设置于box上;
所述AIC,用于在上电启动后,控制所有POD开机;获取所有所述POD的状态;在所有所述POD状态正常的情况下,控制所有所述POD关机,并向对应的寄存器写入支持AIC下电的操作标识;
所述控制端,用于从所述寄存器中读取AIC对应的标识信息;若所述AIC的标识信息为支持AIC下电的操作标识,则控制所述AIC执行下电操作;获取所述AIC的供电状态;在所述AIC的供电状态为下电状态的情况下,控制box下电,并间隔预设时间段控制所述box上电,从而识别所述AIC以及所述box上下电操作是否正常。
CN202111450036.6A 2021-11-30 2021-11-30 一种AIC+box拓扑的测试方法、装置和系统 Active CN114328044B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111450036.6A CN114328044B (zh) 2021-11-30 2021-11-30 一种AIC+box拓扑的测试方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111450036.6A CN114328044B (zh) 2021-11-30 2021-11-30 一种AIC+box拓扑的测试方法、装置和系统

Publications (2)

Publication Number Publication Date
CN114328044A CN114328044A (zh) 2022-04-12
CN114328044B true CN114328044B (zh) 2023-11-03

Family

ID=81049126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111450036.6A Active CN114328044B (zh) 2021-11-30 2021-11-30 一种AIC+box拓扑的测试方法、装置和系统

Country Status (1)

Country Link
CN (1) CN114328044B (zh)

Also Published As

Publication number Publication date
CN114328044A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN106055438B (zh) 一种快速定位主板上内存条异常的方法及系统
CN111752776B (zh) 一种服务器的循环上下电测试方法和系统
CN116107819A (zh) 一种服务器启动故障检测系统、方法、装置以及介质
CN111338698A (zh) 一种bios准确引导服务器启动的方法及系统
CN116775141A (zh) 异常检测方法、装置、计算机设备及存储介质
CN115543872A (zh) 一种设备管理方法、装置及计算机存储介质
CN114328044B (zh) 一种AIC+box拓扑的测试方法、装置和系统
CN115470056A (zh) 服务器硬件上电启动故障排查方法、系统、装置及介质
US8417932B2 (en) Information processing apparatus and control method thereof
CN115098342A (zh) 系统日志收集方法、系统、终端及存储介质
CN211603369U (zh) 一种服务器dc掉电故障定位系统
CN108073481B (zh) 可提供硬件运作信息的服务器系统及其处理方法
CN102243601B (zh) 用来侦测及控制电脑主机状态的除错系统及其相关方法
CN117555760B (zh) 服务器监测方法及装置、基板控制器及嵌入式系统
CN111061597B (zh) 一种测试kcs通信稳定性的方法
CN115454744A (zh) 测试控制方法、系统、装置、计算机设备和存储介质
CN114416448A (zh) 可靠性的校验方法、装置、存储介质及电子装置
CN117251333A (zh) 一种硬盘信息获取方法、装置、设备及存储介质
CN115470054A (zh) 一种服务器内存功能测试方法、系统、装置及存储介质
CN115934446A (zh) 一种自检方法、服务器、设备和存储介质
CN116974804A (zh) 管理引擎挂死的调试方法、装置、设备及存储介质
CN117056154A (zh) 一种智能网卡网口功能的检测方法、系统、装置及介质
CN117435255A (zh) 系统启动方法及装置、存储介质及电子装置
CN117271226A (zh) 风扇热插拔冗余测试装置、方法、电子设备和服务器
CN114237658A (zh) 基于bmc更新固件的方法及电路

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant