CN115509833A - 一种转码卡搭配gpubox的自动化测试方法、系统、装置及介质 - Google Patents

一种转码卡搭配gpubox的自动化测试方法、系统、装置及介质 Download PDF

Info

Publication number
CN115509833A
CN115509833A CN202211003523.2A CN202211003523A CN115509833A CN 115509833 A CN115509833 A CN 115509833A CN 202211003523 A CN202211003523 A CN 202211003523A CN 115509833 A CN115509833 A CN 115509833A
Authority
CN
China
Prior art keywords
gpubox
transcoding
card
transcoding card
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211003523.2A
Other languages
English (en)
Inventor
张含
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211003523.2A priority Critical patent/CN115509833A/zh
Publication of CN115509833A publication Critical patent/CN115509833A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2284Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2289Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by configuration test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tests Of Electronic Circuits (AREA)

Abstract

本发明提出的一种转码卡搭配GPUBOX的自动化测试方法、系统、装置及可读存储介质,所述方法包括:组装时将转码卡SN扫描到GPUBOX的部件清单中,上传数据库。开始测试前,将转码卡都接上网线,GPUBOX接上BMC网线,加电开机进行测试。转码卡通过PXE方式进入系统进行测试,并通过BMC带外的方式对GPUBOX进行测试。本发明利用转码卡可以视为一台微型服务器,既可以在操作系统下进行自身的测试,又可以通过网络以BMC带外方式对GPUBOX进行测试的特点,实现了对转码卡和GPUBOX的全面自动化的出厂前测试,保证了服务器产品的出厂质量。

Description

一种转码卡搭配GPUBOX的自动化测试方法、系统、装置及介质
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种转码卡搭配GPUBOX的自动化测试方法、系统、装置及介质。
背景技术
随着互联网、云计算和大数据应用技术的发展,数据中心处理数据时对加速计算型的高密服务器需求越来越大。而普通的高密服务器机箱内部空间有限,且基于散热及供电需要,只能搭配1-2片GPU加速卡。GPUBOX服务器是一种独立的用于GPU加速卡、转码卡扩展的服务器,服务器内只有GPU板、风扇板和电源板,GPU板上包含BMC芯片和N个插槽用于连接GPU加速卡、转码卡等。GPUBOX服务器内部空间大,可以搭配8张GPU加速卡、转码卡等,被越来越多的场景和客户需求。
转码卡由CPU、内存、硬盘、网卡和板卡等组成,板卡上有BIOS芯片等,转码卡本身可以作为一台微型服务器来使用,GPUBOX由GPU板、风扇板、电源板等组成、GPU板上有BMC芯片,可以监控GPUBOX的风扇、电源、板卡和GPU板上的PCIE设备,但是GPUBOX本身无法自成系统,一般需要搭配一台服务器作为机头来进行测试。基于这种背景,如何将转码卡和GPUBOX服务器进行搭配,并对转码卡和GPUBOX进行全面自动化的出厂前测试,是我们亟待解决的问题。
发明内容
针对以上问题,本发明的目的在于提供一种转码卡搭配GPUBOX的自动化测试方法、系统、装置及介质。
本发明为实现上述目的,通过以下技术方案实现:一种转码卡搭配GPUBOX的自动化测试方法,包括:
将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库;
分别将转码卡和GPUBOX接入网络,并上电开机;
通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息;
通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查;
通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后进行GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试;
待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号;
转码卡进行自身的配置信息检查和健康状态检查;
对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后进行转码卡的配置信息检查和健康状态检查;
对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后进行转码卡的配置信息检查和健康状态检查;
收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器;
在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
进一步,所述将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库,包括:
将8张转码卡连接在GPUBOX的GPU板上slot0-slot7位置,将转码卡SN、GPU板的SN和BMCMAC扫描到GPUBOX的部件清单中并上传数据库。
进一步,所述分别将转码卡和GPUBOX接入网络,并上电开机,包括:
将8张转码卡通过网线接入网络,将GPUBOX的BMC通过网线接入网络,并上电开机。
进一步,所述通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息,包括:
转码卡通过PXE引导的方式进入系统,从smbios中读取到转码卡的SN,使用转码卡SN在数据库获取到转码卡所在GPUBOX的SN和BMCMAC;
在服务器dhcp日志中通过BMCMAC获取到GPUBOX的BMCIP;
通过BMCIP使用BMC带外命令获取GPUBOX的fru信息,在fru信息中获取8张转码卡的SN及每张转码卡在GPU板上的slot位置信息。
进一步,所述通过安装在Slot0位置的转码卡进行GPUBOX的配置检查,包括:
安装在Slot0位置的转码卡获取GPUBOX的SN;
使用BMC带外命令检查GPUBOX的配置和BOM是否一致。
进一步,所述通过安装在Slot0位置的转码卡进行GPUBOX的健康状态检查,包括:
通过安装在Slot0位置的转码卡进行BMC SEL日志检查和BMC sensor信息检查。进一步,所述转码卡的配置信息检查和健康状态检查,包括:
检查转码卡的CPU配置信息、内存配置信息、硬盘配置信息和网卡配置信息;检查转码卡在操作系统下的dmesg信息、messages信息和mcelog信息。
相应的,本发明还公开了一种转码卡搭配GPUBOX的自动化测试系统,包括:工站组装模块,用于将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库;
网络配置模块,用于分别将转码卡和GPUBOX接入网络,并上电开机;
信息获取模块,用于通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息;
第一检查模块,用于通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查;
第一测试模块,用于通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后启动GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试;
刷新模块,用于待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号;
第二检查模块,用于控制转码卡进行自身的配置信息检查和健康状态检查;
第二测试模块,用于对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后启动转码卡的配置信息检查和健康状态检查;
第三测试模块,用于对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后启动转码卡的配置信息检查和健康状态检查;转码卡信息收集模块,用于收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器;
GPUBOX信息收集模块,用于在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
相应的,本发明公开了一种转码卡搭配GPUBOX的自动化测试装置,包括:
存储器,用于存储转码卡搭配GPUBOX的自动化测试程序;
处理器,用于执行所述转码卡搭配GPUBOX的自动化测试程序时实现如上文任一项所述码卡搭配GPUBOX的自动化测试方法的步骤。
相应的,本发明公开了一种可读存储介质,所述可读存储介质上存储有转码卡搭配GPUBOX的自动化测试程序,所述转码卡搭配GPUBOX的自动化测试程序被处理器执行时实现如上文任一项所述转码卡搭配GPUBOX的自动化测试方法的步骤。
对比现有技术,本发明有益效果在于:本发明公开了一种转码卡搭配GPUBOX的自动化测试方法、系统、装置及可读存储介质,通过将8张转码卡搭配GPUBOX来进行使用,利用转码卡可以视为一台微型服务器,既可以在操作系统下进行自身的测试,又可以通过网络以BMC带外方式对GPUBOX进行测试的特点,实现了对转码卡和GPUBOX的全面自动化出厂前测试,保证了服务器产品的出厂质量。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明具体实施方式的方法流程图。
图2是本发明具体实施方式的系统结构图。
图中,1、工站组装模块;2、网络配置模块;3、信息获取模块;4、第一检查模块;5、第一测试模块;6、刷新模块;7、第二检查模块;8、第二测试模块;9、第三测试模块;10、转码卡信息收集模块;11、GPUBOX信息收集模块。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
如图1所示,本实施例提供了一种转码卡搭配GPUBOX的自动化测试方法,包括如下步骤:
S1:将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库。
具体的,将8张转码卡连接在GPUBOX的GPU板上slot0-slot7位置,将转码卡SN、GPU板的SN和BMCMAC扫描到GPUBOX的部件清单中并上传数据库。
S2:分别将转码卡和GPUBOX接入网络,并上电开机。
具体的,将8张转码卡通过网线接入网络,将GPUBOX的BMC通过网线接入网络,并上电开机。
S3:通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息。
具体来说,转码卡通过PXE引导的方式进入系统,从smbios中读取到卡子的SN,使用转码卡SN在数据库获取到转码卡所在GPUBOX的SN和BMCMAC,在服务器dhcp日志中通过BMCMAC获取到GPUBOX的BMCIP。通过BMCIP使用BMC带外命令获取GPUBOX的fru信息,在fru信息中保存有8张转码卡的SN及每张卡在GPU板上的slot位置信息,这样转码卡可以获取所在的GPUBOX的SN及卡子在GPUBOX中的卡槽位置。
至此,所有测试的准备工作已经完成,后续步骤即可对转码卡和GPUBOX进行全面自动化的出厂前测试。需要特别说明的是,在测试时,Slot0位置的转码卡需要对转码卡本身和GPUBOX进行测试,slot1-slot7位置的转码卡只需要测试转码卡本身。
S4:通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查。
在进行GPUBOX的配置检查时,首先通过安装在Slot0位置的转码卡获取GPUBOX的SN。然后,使用BMC带外命令检查GPUBOX的配置和BOM是否一致。具体包括:通过GPUBOX的BMCIP使用BMC带外命令进行转码卡的数量、温度、电压等检查,使用BMC带外命令进行电源的数量、型号、FW等检查,使用BMC带外命令进行风扇的数量、在位状态、转速等检查,使用BMC带外命令进行GPU板的BMCMAC的唯一性检查等。
在进行GPUBOX的健康状态检查时,包括:进行BMC SEL日志检查,以确定是否有告警、错误、失败等日志;进行BMC sensor信息检查,以确定温度,电压,功率,在位状态,风扇转速等是否正常。
S5:通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后进行GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试。
其中,AC压力测试通过通过智能PDU断电重启实现,DC压力测试通过power cycle重启实现。
S6:待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号。
S7:转码卡进行自身的配置信息检查和健康状态检查。
具体包括:
检查转码卡的CPU的型号、数量、频率等,内存的型号、数量、容量等,硬盘数量、型号、容量等,网卡的数量、型号、FW等。
检查转码卡在操作系统下的dmesg信息、messages信息和mcelog信息。
S8:对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后进行转码卡的配置信息检查和健康状态检查。
其中,通过GPUBOX的BMCIP使用BMC带外方式对卡子进行power cycle进行DC压力测试。
S9:对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后进行转码卡的配置信息检查和健康状态检查。
S10:收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器。
S11:在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
本实施例提供了一种转码卡搭配GPUBOX的自动化测试方法,包括:组装时将8张转码卡SN扫描到GPUBOX的部件清单中,上传数据库。开始测试前,将8张转码卡都接上网线,GPUBOX接上BMC网线,加电开机进行测试。转码卡通过PXE方式进入系统进行测试,流程中可以通过BMC带外的方式对GPUBOX进行测试,由此实现了转码卡搭配GPUBOX的工厂自动化测试流程和方法。
实施例二:
基于实施例一,如图2所示,本发明还公开了一种转码卡搭配GPUBOX的自动化测试系统,包括:工站组装模块1、网络配置模块2、信息获取模块3、第一检查模块4、第一测试模块5、刷新模块6、第二检查模块7、第二测试模块8、第三测试模块9、转码卡信息收集模块10和GPUBOX信息收集模块11。
工站组装模块1,用于将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库。
网络配置模块2,用于分别将转码卡和GPUBOX接入网络,并上电开机。
信息获取模块3,用于通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息。
第一检查模块4,用于通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查。
第一测试模块5,用于通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后启动GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试。
刷新模块6,用于待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号。
第二检查模块7,用于控制转码卡进行自身的配置信息检查和健康状态检查。
第二测试模块8,用于对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后启动转码卡的配置信息检查和健康状态检查。
第三测试模块9,用于对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后启动转码卡的配置信息检查和健康状态检查。
转码卡信息收集模块10,用于收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器。
GPUBOX信息收集模块11,用于在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
本实施例提供了一种转码卡搭配GPUBOX的自动化测试系统,通过将转码卡搭配GPUBOX来进行使用,利用转码卡可以视为一台微型服务器,既可以在操作系统下进行自身的测试,又可以通过网络以BMC带外方式对GPUBOX进行测试的特点,实现了对转码卡和GPUBOX的全面自动化的出厂前测试,保证了服务器产品的出厂质量。
实施例三:
本实施例公开了一种转码卡搭配GPUBOX的自动化测试装置,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的转码卡搭配GPUBOX的自动化测试程序时实现以下步骤:
1、将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库。
2、分别将转码卡和GPUBOX接入网络,并上电开机。
3、通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息。
4、通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查。
5、通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后进行GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试。
6、待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号。
7、转码卡进行自身的配置信息检查和健康状态检查。
8、对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后进行转码卡的配置信息检查和健康状态检查。
9、对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后进行转码卡的配置信息检查和健康状态检查。
10、收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器。
11、在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
进一步的,本实施例中的转码卡搭配GPUBOX的自动化测试装置,还可以包括:
输入接口,用于获取外界导入的转码卡搭配GPUBOX的自动化测试程序,并将获取到的转码卡搭配GPUBOX的自动化测试程序保存至所述存储器中,还可以用于获取外界终端设备传输的各种指令和参数,并传输至处理器中,以便处理器利用上述各种指令和参数展开相应的处理。本实施例中,所述输入接口具体可以包括但不限于USB接口、串行接口、语音输入接口、指纹输入接口、硬盘读取接口等。
输出接口,用于将处理器产生的各种数据输出至与其相连的终端设备,以便于与输出接口相连的其他终端设备能够获取到处理器产生的各种数据。本实施例中,所述输出接口具体可以包括但不限于USB接口、串行接口等。
通讯单元,用于在转码卡搭配GPUBOX的自动化测试装置和外部服务器之间建立远程通讯连接,以便于转码卡搭配GPUBOX的自动化测试装置能够将镜像文件挂载到外部服务器中。本实施例中,通讯单元具体可以包括但不限于基于无线通讯技术或有线通讯技术的远程通讯单元。
键盘,用于获取用户通过实时敲击键帽而输入的各种参数数据或指令。
显示器,用于运行服务器供电线路短路定位过程的相关信息进行实时显示。
鼠标,可以用于协助用户输入数据并简化用户的操作。
实施例四:
本实施例还公开了一种可读存储介质,这里所说的可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动硬盘、CD-ROM或技术领域内所公知的任意其他形式的存储介质。可读存储介质中存储有转码卡搭配GPUBOX的自动化测试程序,所述转码卡搭配GPUBOX的自动化测试程序被处理器执行时实现以下步骤:
1、将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库。
2、分别将转码卡和GPUBOX接入网络,并上电开机。
3、通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息。
4、通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查。
5、通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后进行GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试。
6、待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号。
7、转码卡进行自身的配置信息检查和健康状态检查。
8、对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后进行转码卡的配置信息检查和健康状态检查。
9、对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后进行转码卡的配置信息检查和健康状态检查。
10、收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器。
11、在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
综上所述,本发明实现了对转码卡和GPUBOX的全面自动化的出厂前测试,保证了服务器产品的出厂质量。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各处理单元可以集成在一个功能模块中,也可以是各个处理单元物理存在,也可以两个或两个以上处理单元集成在一个功能模块中。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的转码卡搭配GPUBOX的自动化测试方法、系统、装置及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种转码卡搭配GPUBOX的自动化测试方法,其特征在于,包括:
将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库;
分别将转码卡和GPUBOX接入网络,并上电开机;
通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息;
通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查;
通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后进行GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试;
待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号;
转码卡进行自身的配置信息检查和健康状态检查;
对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后进行转码卡的配置信息检查和健康状态检查;
对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后进行转码卡的配置信息检查和健康状态检查;
收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器;
在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
2.根据权利要求1所述的转码卡搭配GPUBOX的自动化测试方法,其特征在于,所述将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库,包括:
将8张转码卡连接在GPUBOX的GPU板上slot0-slot7位置,将转码卡SN、GPU板的SN和BMCMAC扫描到GPUBOX的部件清单中并上传数据库。
3.根据权利要求2所述的转码卡搭配GPUBOX的自动化测试方法,其特征在于,所述分别将转码卡和GPUBOX接入网络,并上电开机,包括:
将8张转码卡通过网线接入网络,将GPUBOX的BMC通过网线接入网络,并上电开机。
4.根据权利要求3所述的转码卡搭配GPUBOX的自动化测试方法,其特征在于,所述通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息,包括:转码卡通过PXE引导的方式进入系统,从smbios中读取到转码卡的SN,使用转码卡SN在数据库获取到转码卡所在GPUBOX的SN和BMCMAC;
在服务器dhcp日志中通过BMCMAC获取到GPUBOX的BMCIP;
通过BMCIP使用BMC带外命令获取GPUBOX的fru信息,在fru信息中获取8张转码卡的SN及每张转码卡在GPU板上的slot位置信息。
5.根据权利要求4所述的转码卡搭配GPUBOX的自动化测试方法,其特征在于,所述通过安装在Slot0位置的转码卡进行GPUBOX的配置检查,包括:
安装在Slot0位置的转码卡获取GPUBOX的SN;
使用BMC带外命令检查GPUBOX的配置和BOM是否一致。
6.根据权利要求5所述的转码卡搭配GPUBOX的自动化测试方法,其特征在于,所述通过安装在Slot0位置的转码卡进行GPUBOX的健康状态检查,包括:
通过安装在Slot0位置的转码卡进行BMC SEL日志检查和BMC sensor信息检查。
7.根据权利要求6所述的转码卡搭配GPUBOX的自动化测试方法,其特征在于,所述转码卡的配置信息检查和健康状态检查,包括:
检查转码卡的CPU配置信息、内存配置信息、硬盘配置信息和网卡配置信息;
检查转码卡在操作系统下的dmesg信息、messages信息和mcelog信息。
8.一种转码卡搭配GPUBOX的自动化测试系统,其特征在于,包括:
工站组装模块,用于将转码卡组装到GPUBOX的GPU板上,将转码卡SN扫描到GPUBOX的部件清单中,并上传数据库;
网络配置模块,用于分别将转码卡和GPUBOX接入网络,并上电开机;
信息获取模块,用于通过转码卡获取所在的GPUBOX的SN和转码卡的安装卡槽位置信息;
第一检查模块,用于通过安装在Slot0位置的转码卡进行GPUBOX的配置检查和健康状态检查;
第一测试模块,用于通过安装在Slot0位置的转码卡使用BMCIP带外方式对GPUBOX进行AC压力测试和DC压力测试,并在每次重启后启动GPUBOX的配置检查和健康状态检查,以完成GPUBOX的测试;
刷新模块,用于待GPUBOX的测试完成后,每张转码卡刷新自身的FRU信息并在操作系统下刷新smbios中资产编码和套餐号;
第二检查模块,用于控制转码卡进行自身的配置信息检查和健康状态检查;
第二测试模块,用于对每张转码卡进行DC压力测试和reboot重启压力测试,并在每次重启后启动转码卡的配置信息检查和健康状态检查;
第三测试模块,用于对每张转码卡进行CPU压力测试、内存压力测试和硬盘压力测试,并在每种压力测试完成后启动转码卡的配置信息检查和健康状态检查;
转码卡信息收集模块,用于收集所述转码卡的FRU信息、部件信息,建立出厂档案并上传服务器;
GPUBOX信息收集模块,用于在安装在Slot0位置的转码卡上收集GPUBOX的BMCMAC、FRU信息、SEL信息、SDR信息,建立整机出厂档案上传服务器并关机。
9.一种转码卡搭配GPUBOX的自动化测试装置,其特征在于,包括:
存储器,用于存储转码卡搭配GPUBOX的自动化测试程序;
处理器,用于执行所述转码卡搭配GPUBOX的自动化测试程序时实现如权利要求1至7任一项权利要求所述的转码卡搭配GPUBOX的自动化测试方法的步骤。
10.一种可读存储介质,其特征在于:所述可读存储介质上存储有转码卡搭配GPUBOX的自动化测试程序,所述转码卡搭配GPUBOX的自动化测试程序被处理器执行时实现如权利要求1至7任一项权利要求所述的转码卡搭配GPUBOX的自动化测试方法的步骤。
CN202211003523.2A 2022-08-19 2022-08-19 一种转码卡搭配gpubox的自动化测试方法、系统、装置及介质 Pending CN115509833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211003523.2A CN115509833A (zh) 2022-08-19 2022-08-19 一种转码卡搭配gpubox的自动化测试方法、系统、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211003523.2A CN115509833A (zh) 2022-08-19 2022-08-19 一种转码卡搭配gpubox的自动化测试方法、系统、装置及介质

Publications (1)

Publication Number Publication Date
CN115509833A true CN115509833A (zh) 2022-12-23

Family

ID=84502824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211003523.2A Pending CN115509833A (zh) 2022-08-19 2022-08-19 一种转码卡搭配gpubox的自动化测试方法、系统、装置及介质

Country Status (1)

Country Link
CN (1) CN115509833A (zh)

Similar Documents

Publication Publication Date Title
CN109788052B (zh) 一种服务器配置远程查询方法、装置、终端及存储介质
KR100376939B1 (ko) 통신망을 통한 원격 사후관리 방법 및 이를 이용한전자제품의 사후관리시스템
CN115509833A (zh) 一种转码卡搭配gpubox的自动化测试方法、系统、装置及介质
CN111506526A (zh) 一种电池型号的识别方法、装置、电子设备及存储介质
CN115543746A (zh) 图形处理器监测方法、系统、装置及电子设备
CN115470056A (zh) 服务器硬件上电启动故障排查方法、系统、装置及介质
CN114860271A (zh) 一种pxe启动方法、系统、装置及可读存储介质
CN110175096B (zh) 一种gpu加压测试方法、系统、终端及存储介质
CN113900718A (zh) 一种bmc与bios资产信息的解耦方法、系统及装置
CN113849356A (zh) 一种设备测试方法、装置、电子设备和存储介质
CN109800114B (zh) 一种bmc可视化测试方法、装置、终端及存储介质
CN112965862A (zh) 一种服务器可视化检验方法、系统、终端及存储介质
CN112463504A (zh) 一种双控存储产品测试方法、系统、终端及存储介质
CN112486785A (zh) 一种服务器定位宕机阶段的方法、系统、终端及存储介质
CN112003727A (zh) 一种多节点服务器电源测试方法、系统、终端及存储介质
CN104660418A (zh) 网络唤醒控制系统及方法
CN113064793B (zh) 总线设备位置信息轮询收集方法、系统、终端及存储介质
CN117493065B (zh) 处理器信息的处理方法和装置,存储介质及电子设备
CN109120422B (zh) 可取得硬件信息的远程服务器系统及其管理方法
CN113868036B (zh) 服务器时序异常监测方法、系统、终端及存储介质
CN115098403A (zh) 测试机的网络环境检查和修复方法、系统、装置及介质
CN117826055A (zh) 一种电表的可靠性测试方法及装置
CN115525346A (zh) 一种bios与bmc的交互优化方法、系统、装置及介质
CN115525489A (zh) 一种pcie卡的寄存器数据自动获取方法、系统、装置及介质
CN117555745A (zh) 运行状态监控方法、装置、监控设备及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination