CN109697142B - 一种云计算环境下裸金属服务器的检测方法及设备 - Google Patents

一种云计算环境下裸金属服务器的检测方法及设备 Download PDF

Info

Publication number
CN109697142B
CN109697142B CN201710984886.1A CN201710984886A CN109697142B CN 109697142 B CN109697142 B CN 109697142B CN 201710984886 A CN201710984886 A CN 201710984886A CN 109697142 B CN109697142 B CN 109697142B
Authority
CN
China
Prior art keywords
bare metal
metal servers
servers
server
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710984886.1A
Other languages
English (en)
Other versions
CN109697142A (zh
Inventor
姚军
赵鹏
罗刚毅
李灏
魏峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201710984886.1A priority Critical patent/CN109697142B/zh
Publication of CN109697142A publication Critical patent/CN109697142A/zh
Application granted granted Critical
Publication of CN109697142B publication Critical patent/CN109697142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2247Verification or detection of system hardware configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2289Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by configuration test

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种云计算环境下裸金属服务器的检测方法及设备,所述包括:获取云计算环境下的多台裸金属服务器的硬件配置信息;根据所述硬件配置信息将所述多台裸金属服务器进行分组;从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器,N为大于等于1的整数;根据预设镜像检测所述N台裸金属服务器是否与所述预设镜像对应的操作系统适配,获得检测结果。

Description

一种云计算环境下裸金属服务器的检测方法及设备
技术领域
本发明涉及云计算技术领域,尤其涉及一种云计算环境下裸金属服务器的检测方法及设备。
背景技术
裸金属服务器首先在形态上看是一台高性能的硬件服务器,通常会配备高端CPU、10Gb网卡、SSD、FC卡等。其次,从云计算资源使用角度来看,裸金属服务器在分配给租户使用之前,并没有安装任何操作系统,一旦分配出去,是单租户独占的。
通常,裸金属服务器在交付之前需要经过硬件、软件、配置等方面的检验,以确保每一台服务器可以正常使用。目前,裸金属服务器在交付之前的检查主要有如下两种方式:第一种方法为人工对裸金属服务器进行检查,也即人工逐台裸金属服务器上电,部署系统,配置网络,测试网络连通性,挂载卷等,并记录检查结果,该方法费时较多且重复劳动。第二种方法由专业人员编写检查脚本,需要预先根据硬件配置、网络配置、存储配置等构造出可行的用例,并执行检查脚本,最终收集检查结果,这种方法弊端在于弹性不足,无法应用到多种类型裸金属服务器共存的场景,复杂度高且容易出错。
所以,现有技术中,存在裸金属服务器检测效率低的技术问题。
发明内容
本发明实施例提供一种云计算环境下裸金属服务器的检测方法及设备,用于解决现有技术中,存在裸金属服务器检测效率低的技术问题,实现提升裸金属服务器检测效率的技术效果。
为此,本发明实施例提供的云计算环境下裸金属服务器的检测方法的技术方法如下:
获取云计算环境下的多台裸金属服务器的硬件配置信息;
根据所述硬件配置信息将所述多台裸金属服务器进行分组;
从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器,N为大于等于1的整数;
根据预设镜像检测所述N台裸金属服务器是否与所述预设镜像对应的操作系统适配,获得检测结果。
可选的,所述根据预设镜像检测所述N台裸金属服务器是否与所述预设镜像对应的操作系统适配,获得检测结果,具体包括:
若所述N台裸金属服务器中有M台裸金属服务器在使用预设镜像创建实例过程中出现异常,则判定所述M台裸金属服务器与所述镜像文件对应的操作系统不适配,其中,M为小于等于N的正整数;
若所述N台裸金属服务器在使用预设镜像创建实例过程中未出现异常,则控制所述N台裸金属服务器运行测试脚本,检测所述测试脚本是否正常运行,若正常运行,则判定所述N台裸金属服务器与所述操作系统适配,若未正常运行,则判定所述N台裸金属服务器与所述操作系统不适配。
可选的,在所述检测结果表明所述N台裸金属服务器与所述操作系统适配时,所述方法还包括:
确定在所述多台裸金属服务器中使用第一镜像创建实例,其中,所述第一镜像与所述预设镜像相同或不同;
向所述多台裸金属服务器发送至少一个检测命令,以使得所述多台裸金属服务器能够根据所述至少一个检测命令检测各自的网络配置或存储配置。
可选的,在所述向所述多台裸金属服务器发送至少一个检测命令之后,还包括:
若在预设时间内未接收到所述多台裸金属服务器的反馈信息,则判定所述多台裸金属服务器的网络配置检测失败或存储配置检测失败。
可选的,所述从所述分组中的每一组中确定出至少一台裸金属服务器,具体包括:
确定所述分组中的每一组的检测强度值,所述检测强度值为一组内用于检测的裸金属服务器所占比例;
根据每一组的检测强度值从对应的每一组中确定出至少一台裸金属服务器。
可选的,在获取的硬件配置信息中包括第一配置参数以及与所述第一配置参数不同的第二配置参数时,所述根据所述硬件配置信息将所述多台裸金属服务器进行分组,具体为:
根据所述第一配置参数或第二配置参数将所述多台裸金属服务器进行分组,或
结合第一配置参数与第二配置参数将所述多台裸金属服务器进行分组。
可选的,所述第一配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡;所述第二配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡。
另一方面,本发明实施例还提供了一种用于检测云计算环境下裸金属服务器的设备,包括:
获取模块,用于获取云计算环境下的多台裸金属服务器的硬件配置信息;
分组模块,用于根据所述硬件配置信息将所述多台裸金属服务器进行分组;
确定模块,用于从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器,N为大于等于1的整数;
检测模块,用于根据预设镜像检测所述N台裸金属服务器是否与所述预设镜像对应的操作系统适配,获得检测结果。
可选的,所述检测模块还用于:
若所述N台裸金属服务器中有M台裸金属服务器在使用预设镜像创建实例过程中出现异常,则判定所述M台裸金属服务器与所述镜像文件对应的操作系统不适配,其中,M为小于等于N的正整数;
若所述N台裸金属服务器在使用预设镜像创建实例过程中未出现异常,则控制所述N台裸金属服务器运行测试脚本,检测所述测试脚本是否正常运行,若正常运行,则判定所述N台裸金属服务器与所述操作系统适配,若未正常运行,则判定所述N台裸金属服务器与所述操作系统不适配。
可选的,所述设备还包括:
第一确定子模块,用于确定在所述多台裸金属服务器中使用第一镜像创建实例,其中,所述第一镜像与所述预设镜像相同或不同;
发送模块,用于向所述多台裸金属服务器发送至少一个检测命令,以使得所述多台裸金属服务器能够根据所述至少一个检测命令检测各自的网络配置或存储配置。
可选的,所述设备还包括:
判断模块,用于若在预设时间内未接收到所述多台裸金属服务器的反馈信息,则判定所述多台裸金属服务器的网络配置检测失败或存储配置检测失败。
可选的,所述确定模块还用于:
确定所述分组中的每一组的检测强度值,所述检测强度值为一组内用于检测的裸金属服务器所占比例;
根据每一组的检测强度值从对应的每一组中确定出至少一台裸金属服务器。
可选的,所述获取模块还用于:
根据所述第一配置参数或第二配置参数将所述多台裸金属服务器进行分组,或
结合第一配置参数与第二配置参数将所述多台裸金属服务器进行分组。
可选的,所述第一配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡;所述第二配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡。
再一方面,本发明实施例还提供一种用于检测云计算环境下裸金属服务器的设备,包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上所述的云计算环境下裸金属服务器的检测方法。
再一方面,本发明实施例还提供一种计算机可读存储介质:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上所述的云计算环境下裸金属服务器的检测方法。
本发明实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
由于本发明实施例中的技术方案中,将云计算环境下的多台裸金属服务器按照硬件配置进行分组,然后在分组中的每一组中选择一部分裸金属服务器作为具有该硬件配置的裸金属服务器代表,进行操作系统的检测,从而避免了将云计算环境下的所用裸金属服务器进行检测导致的重复检测过程,所以,有效的解决了现有技术中,存在的裸金属服务器检测效率低的技术问题,实现了提升裸金属服务器的检测效率。
同时,又由于利用云计算环境下所有操作系统各自对应的镜像对云计算环境下的多台裸金属服务器进操作系统的检测,所以,还具有确保租户在线上环境指定任一操作系统创建实例,无论调度到哪一台裸金属服务器都可以成功创建的有益技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为本发明实施例提供的一种云计算环境下裸金属服务器的检测方法的流程图;
图2为本发明实施例中的步骤S103的具体实现方式流程图;
图3为本发明实施例中的步骤S104的具体实现方式流程图;
图4为本发明实施例中的还可以执行的一些步骤的流程图;
图5为本发明实施例提供的一种用于检测云计算环境下裸金属服务器的设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明技术方案的一部分实施例,而不是全部的实施例。基于本发明文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明技术方案保护的范围。
请参考图1,为本发明实施例提供一种云计算环境下裸金属服务器的检测方法,包括:
步骤S101:获取云计算环境下的多台裸金属服务器的硬件配置信息;
步骤S102:根据所述硬件配置信息将所述多台裸金属服务器进行分组;
步骤S103:从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器,N为大于等于1的整数;
步骤S104:根据预设镜像检测所述N台裸金属服务器是否与所述预设镜像对应的操作系统适配,获得检测结果。
在具体实践过程中,上述方法首先执行步骤S101,即获取云计算环境下(也可称为云平台)的多台裸金属服务器的硬件配置信息。
在实际应用中,处于云计算环境下的裸金属服务器可以为10台,也可以为100台等,且云计算环境下的多台裸金属服务器的类型可以相同也可以不同,在此不进行任何限制。同时,在本实施例中,以处于云计算环境下的裸金属服务器具体为10台为例,来对本发明实施例中的上述方法的实现过程进行阐述。
那么,在云计算环境下包括的10台裸金属服务器时,云平台就可以去获取这10台裸金属服务器的硬件配置信息,在具体实践过程中,云计算环境下管理裸金属服务器最基本的管理工具为ipmitool,那么就通过ipmitool来管理这10台裸金属服务器自带的BMC接口,进而通过这10台裸金属服务器BMC接口使用IPMI协议来设置这10台裸金属服务器的网卡PXE启动,等待网卡PXE启动成功后,就可以开启这10台裸金属服务器,然后,这10台裸金属服务器就会加载RAMDISK并自动运行agent。
在实际应用中,agent主要用于获取裸金属服务器的硬件配置信息,那么,通过这10台裸金属服务器运行agent,就可以获取到这10台裸金属服务器的硬件配置信息,在具体实践过程中,获取的这10台裸金属服务器的硬件配置信息中可以包括一个或多个硬件配置参数,在实际应用中,裸金属服务器硬件参数有CPU、内存、网卡控制器NIC、磁盘、RAID卡、固件版本以及HBA卡等等,在此就不一一列举了。
当然,在实际应用中,也可能会在获取这10台裸金属服务器中的某一台裸金属服务器的硬件配置信息时,出现获取失败的情况,例如,在获取第10台裸金属服务器的硬件配置信息时失败,这时,就可以去检测获取失败的原因,并进行修复,然后再去获取修复后的第10台裸金属服务器的硬件配置信息。
本发明中的方法在执行完上述步骤S101之后,就会执行步骤S102,也即根据所述硬件配置信息将所述多台裸金属服务器进行分组。
在获取到10台裸金属服务器的硬件配置信息之后,就可以根据获取到的硬件配置信息将这10台裸金属服务器进行分组,例如,当获取的硬件配置信息中包括CPU时,就可以根据CPU类型的不同,将属于同一类型CPU的裸金属服务器归为一组;当获取的硬件配置信息中包括固件版本时,就可以根据固件版本的不同,将属于同一固件版本的裸金属服务器归为一组。
在实际应用中,当获取硬件配置信息中包括多个配置参数时,上述步骤S102还可以按照以下方法具体实现:
根据所述第一配置参数或第二配置参数将所述多台裸金属服务器进行分组,或
结合第一配置参数与第二配置参数将所述多台裸金属服务器进行分组。
这里,假设获取到的硬件配置信息具体包括固件版本、网卡控制器NIC、磁盘、RAID卡以及HBA卡,那么,可以根据网卡控制器的类型将这10台裸金属服务器进行分组,这里假设10台裸金属服务器中的第1台裸金属服务器至第5台裸金属服务器的网卡控制器NIC的类型为Intel 82599ES,第6台裸金属服务器至第10台裸金属服务器的网卡控制器NIC的类型为Intel I350,那么,就可以如表一所示,将第1台裸金属服务器至第5台裸金属服务器归为一组,将第6台裸金属服务器至第10台裸金属服务器归为另一组,其中,BM为裸金属服务器的缩写。
当然,也可以如表二所示根据RAID卡类型进行分组,将RAID卡类型为LSI RAID9440的第1台裸金属服务器,第3台裸金属服务器,第5台裸金属服务器、第7台裸金属服务器以及第9台裸金属服务器归为一组,将RAID卡类型为Adaptec RAID 8885的第2台裸金属服务器,第4台裸金属服务器,第6台裸金属服务器以及第8台裸金属服务器以及第10台裸金属服务器归为另一组。
表一:
Figure BDA0001440281960000081
Figure BDA0001440281960000091
表二:
RAID:LSI RAID 9440 RAID:Adaptec RAID 8885
BM1 BM2
BM3 BM4
BM5 BM6
BM7 BM8
BM9 BM10
当然,还可以结合多个硬件配置参数进行分组,例如可以结合CUP类型和网卡控制器NIC类型对裸金属服务器进行分组,也即将CUP类型以及网卡控制器NIC类型均相同的裸金属服务器归为同一组,这里假设第1台裸金属服务器至第3台裸金属服务器的UP类型以及网卡控制器NIC类型均相同,第4台裸金属服务器和第5台裸金属服务器的UP类型以及网卡控制器NIC类型均相同,第6台裸金属服务器至第10台裸金属服务器的UP类型以及网卡控制器NIC类型均相同,那么,就可以将第1台裸金属服务器至第3台裸金属服务器归为同一组,为叙述方便,称为第一组,将第4台裸金属服务器和第5台裸金属服务器归为第2组,第6台裸金属服务器至第10台裸金属服务器归为第三组。
在本实施例中,具体以如表一所示,按照网卡控制器NIC的类型将第1台裸金属服务器至第5台裸金属服务器归为第一组,将第6台裸金属服务器至第10台裸金属服务器归为第二组为例。
那么,本实施例的方法在执行完步骤S102之后,就会执行步骤S103,也即从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器。
请参考图2,在实际应用中,上述步骤S103还可以按照以下方法具体实施:
步骤S1031:确定所述分组中的每一组的检测强度值,所述检测强度值为一组内用于检测的裸金属服务器所占比例;
步骤S1032:根据每一组的检测强度值从对应的每一组中确定出至少一台裸金属服务器。
在将第1台裸金属服务器至第5台裸金属服务器归为第一组,将第6台裸金属服务器至第10台裸金属服务器归为第二组之后,就可以从这两组中选择出用于操作系统检测的裸金属服务器(也即检测裸金属服务器是否与操作系统适配),具体选择过程如下:首先可以根据实际需要确定每一组中用于操作系统检测的裸金属服务器所占的比例,也即每一组的检测强度值,这里假设,第一组中的检测强度值为0.4,第二组中的检测强度值为0.6,
那么,根据第一组的检测强度值0.4,就可以在第一组中随机选择出两台裸金属服务器,这里假设选择第1台裸金属服务器和第2台裸金属服务器用于操作系统检测。根据第二组的检测强度值0.6,就可以在第二组中随机选择出3台裸金属服务器用于操作系统检测,这里假设选择第6台裸金属服务器、第7台裸金属服务器以及第8台裸金属服务器,那么,在第一组和第二组中总共选择出了5台裸金属服务器用于检测操作系统,这5台裸金属服务分别为第1台裸金属服务、第2台裸金属服务、第6台裸金属服务、第7台裸金属服务以及第8台裸金属服务。在实际应用中,为了便于管理,还可以根据选择出来的折5台裸金属服务器组成待测试裸金属服务器列表。
当然,在实际应用中,在根据第一组的检测强度值0.4在第一组中随机选择出两台裸金属服务器用于检测操作系统之后,还可以在第一组中未被选择的裸金属服务器中再次按照检测强度值0.4或重新设置的一个不同检测强度值继续选择用于检测操作系统的裸金属服务器,例如,在根据第一组的检测强度值0.4选择第1台裸金属服务器和第2台裸金属服务器之后,还可以再次根据检测强度值0.4在第一组中未被选择的裸金属服务器中(也即第3台台裸金属服务器、第4台裸金属服务器以及第5台裸金属服务器中)随机选择用于操作系统检测的裸金属服务器,同样的,也可以在第二组中未被选择裸金属服务器中再次按照检测强度值0.6或重新设置的一个不同检测强度值继续选择用于检测操作系统的裸金属服务器,在此就不重复叙述。
本发明实施例的方法在执行完步骤S103之后,就会执行步骤S104,也即根据预设镜像检测所述N台裸金属服务器是否与所述预设镜像对应的操作系统适配,获得检测结果。
请参考图3,在实际应用中,上述步骤S104还可以按照以下方式具体实现:
步骤S1041:若所述N台裸金属服务器中有M台裸金属服务器在使用预设镜像创建实例过程中出现异常,则判定所述M台裸金属服务器与所述镜像文件对应的操作系统不适配,其中,M为小于等于N的正整数;
步骤S1042:若所述N台裸金属服务器在使用预设镜像创建实例过程中未出现异常,则控制所述N台裸金属服务器运行测试脚本,检测所述测试脚本是否正常运行,若正常运行,则判定所述N台裸金属服务器与所述操作系统适配,若未正常运行,则判定所述N台裸金属服务器与所述操作系统不适配。
在实际应用中,云计算环境下可能用到的操作系统包括多个,例如Windowsserver 2016操作系统、Windows server 2012操作系统、RedHat 7.1操作系统、Ubuntu16.04操作系统、Suse 11操作系统等,那么,可以利用这些操作系统对应的镜像来检测待测试裸金属服务器列表中的每一台裸金属服务器是否与相应的操作系统适配。
这里,假设云计算环境下会用到的操作系统具体包括Windows server 2012操作系统、RedHat 7.1操作系统以及Ubuntu 16.04操作系统,那么,就可以分别使用Windowsserver 2012操作系统对应的镜像检测待测试裸金属服务器列表中的每一台裸金属服务器是否与Windows server 2012操作系统适配;使用RedHat 7.1操作系统对应的镜像检测待测试裸金属服务器列表中的每一台裸金属服务器是否与RedHat 7.1操作系统适配,以及使用Ubuntu 16.04操作系统对应的镜像检测待测试裸金属服务器列表中的每一台裸金属服务器是否与Ubuntu 16.04操作系统适配。
在实际应用中,使用操作系统对应的镜像检测待测试裸金属服务器列表中的每一台裸金属服务器是否与对应的操作系统适配的具体过程如下:可以先使用Windows server2012操作系统对应的镜像在待测试裸金属服务器列表中的每一台裸金属服务器创建实例,在创建实例过程中,可以通过登录云平台下的控制台来观察在创建实例过程是否出现异常,例如,当在第一台裸金属服务和第二台裸金属服务中使用Windows server 2012操作系统对应的镜像创建实例过程出现异常,就会得到异常的检测结果,根据该异常检测结果可以判定第一台裸金属服务和第二台裸金属服务与Windows server 2012操作系统不适配。
在实际应用中,可以是因为第一台裸金属服务和第二台裸金属服务本身存在问题导致上述异常的检测结果,也可能是其他原因,那么,在具体实践过程中,就可以根据上述异常的检测结果去查找出第一台裸金属服务和第二台裸金属服务与Windows server 2012操作系统不适配的具体原因,并进行修复,使得第一台裸金属服务和第二台裸金属服务与Windows server 2012操作系统适配,在此,就不做过多讨论。
具体的,当使用Windows server 2012操作系统对应的镜像在待测试裸金属服务器列表中的每一台裸金属服务器创建实例的过程中未出现异常时,就可以配置待测试裸金属服务器列表中的每一台裸金属服务器的管理网,以便能够远程登录待测试裸金属服务器列表中的每一台裸金属服务器,进而通过远程网络控制裸金属服务器运行必备的测试脚本,比如业务网卡配置猜测试脚本,存储网卡配置测试脚本等,当这些测试脚本在裸金属服务器中均正常运行时,表明待测试裸金属服务器列表中的每一台裸金属服务器均与Windows server 2012操作系统适配,若这些测试脚本在待测试裸金属服务器列表中的某一台裸金属服务器中没有正常运行时,表明该台裸金属服务器与Windows server 2012操作系统不适配。
在利用Windows server 2012操作系统对应的镜像检测待测试裸金属服务器列表中的每一台裸金属服务器是否与Windows server 2012操作系统适配之后,就可以使用RedHat 7.1操作系统对应的镜像逐台检测待测试裸金属服务器列表中的每一台裸金属服务器是否与RedHat 7.1操作系统,以及使用Ubuntu16.04操作系统对应的镜像逐台检测待测试裸金属服务器列表中的每一台裸金属服务器是否与Ubuntu 16.04操作系统适配,在此就不重复叙述了。
所以,通过上述方法,将云计算环境下的多台裸金属服务器按照硬件配置进行分组,然后在分组中的每一组中选择一部分裸金属服务器作为具有该硬件配置的裸金属服务器代表,进行操作系统的检测,从而避免了将云计算环境下的所用裸金属服务器进行检测导致的重复检测过程,所以,有效的解决了现有技术中,存在的裸金属服务器检测效率低的技术问题,实现了提升裸金属服务器的检测效率。
同时,在上述方法中,利用云计算环境下所有操作系统各自对应的镜像对云计算环境下的多台裸金属服务器进操作系统的检测,所以,还具有确保租户在线上环境指定任一操作系统创建实例,无论调度到哪一台裸金属服务器都可以成功创建的有益技术效果。
进一步的,请参考图4,在上述方法中的检测结果表明所述N台裸金属服务器与所述操作系统适配时,本发明实施例中还可以执行以下步骤:
步骤S201:确定在所述多台裸金属服务器中使用第一镜像创建实例,其中,所述第一镜像与所述预设镜像相同或不同;
步骤S202:向所述多台裸金属服务器发送至少一个检测命令,以使得所述多台裸金属服务器能够根据所述至少一个检测命令检测各自的网络配置或存储配置。
在实际应用中,在检测出待测试裸金属服务器列表中的每一台裸金属服务器与云计算环境下的多个操作系统适配时,还可以在上述多个操作系统中选择任一操作系统对应的镜像在云计算环境下的多台裸金属服务器中创建实例,以便对云计算环境下的多台裸金属服务器进行网络配置的检测或存储配置的检测。
在此,继续以云计算环境下包括上述10台裸金属服务器,并假设选择云计算环境下的RedHat 7.1操作系统对应的镜像在这10台裸金属服务器中创建实例为例,在具体实践过程中,可以事先在云计算环境下设置一用于检测网络配置和存储配置的模块,为叙述方便,将事先设置的用于检测网络配置和存储配置的模块称为网络/存储测试服务器,那么,在对云计算环境下的这10台裸金属服务器进行网络配置的检测或存储配置的检测之前,就需要运行该网络/存储测试服务器,同时需要部署这10台裸金属服务器也即利用RedHat7.1操作系统对应的镜像在这10台裸金属服务器中创建实例。
当利用RedHat 7.1操作系统对应的镜像在这10台裸金属服务器中创建实例成功后,会接收到这10台裸金属服务器发送的hello消息,此时,还可以根据创建实例成功后的这10台裸金属服务器创建一个裸金属服务器列表,网络/存储测试服务器就可以根据该列表依次向这10台裸金属服务器发送用于检测这10台裸金属服务器网络配置或存储配置的命令。
当然,在实际应用中,可以事先在网络/存储测试服务器中设置一些用于检测网络配置或存储配置预设策略,那么,在这10台裸金属服务器创建实例成功后,网络/存储测试服务器就可以直接执行事先设置的预设策略,进而对这10台裸金属服务器的网络配置进行检测或存储配置进行检测。当然,网络/存储测试服务器也可以通过交互方式下发用于检测网络配置或存储配置的实时策略,每一个策略都会关联到特定的检查任务,检查任务的执行是由测试服务器通过一条或多条检测命令将关联了特定的检查任务的策略送给10台裸金属服务器。
在本实施例中,具体以网络/存储测试服务器通过交互方式下发用于检测网络配置或存储配置的实时策略为例,那么,在网络/存储测试服务器将用于检测网络配置或存储配置的实时策略通过检测命令的方式发送给上述10台裸金属服务器之后,这10台裸金属服务器就可以执行接收到的检测命令,进而对网络配置或存储配置进行检测。当然,在实际应用中,还可以设置网络/存储测试服务器发送给上述10台裸金属服务器的检测命令的重复发送次数,以便能够成功的将检测命令发送给上述10台裸金属服务器。
在具体实践过程中,在这10台裸金属服务器执行接收到的检测命令,从而对网络配置或存储配置进行检测之后,本发明还可以执行以下步骤:
若在预设时间内未接收到所述多台裸金属服务器的反馈信息,则判定所述多台裸金属服务器网络配置检测失败或存储配置检测失败。
也即在具体实践过程中,可以设置一预设时间段如1秒,2秒等,当网络/存储测试服务将用于检测网络配置或存储配置的检测命令发送给这10台裸金属服务器之后,就可以开始计时,若计时到预设的时间段到达时,未收到来自这10台裸金属服务器的执行结果,则判定这10台裸金属服务器网络配置或存储配置检查失败,当然,也可能在预设的时间段到达时没有收到这10台裸金属服务器中的某一台裸金属服务器的执行结果,则判定该台裸金属服务器网络配置或存储配置检查失败。
例如,当网络/存储测试服务将用于检测网络配置的检测命令发送给这10台裸金属服务器之后,在预设的1秒时间到达时,没有收到来自第4台裸金属服务器和第5台裸金属服务器的执行结果,则判定第4台裸金属服务器和第5台裸金属服务器网络配置检查失败。这时,还可以根据判断结果,对定第4台裸金属服务器和第5台裸金属服务器的网络配置进行修复,当修复完成后,还可以再次发送检测命令检测修复后的第4台裸金属服务器和第5台裸金属服务器的网络配置,直到这10台裸金属服务器都具备上线条件。
所以,通过上述方法,在云计算环境下引入网络/存储测试服务器执行预设或者实时策略,来实现云计算环境下裸金属服务器的网络配置或存储配置的检测,避免了现有技术中采用预设脚本或手工的方式,难以适应SDN网络下与日俱增的网络复杂度。能实现既不盲目信任单一检查任务的执行结果,也不依赖于特定裸金属服务器,可以按需随时随地进行全范围测试,所以,具有提升检查的灵活性,并增强了扩展性的技术效果。
基于同一发明构思,本发明实施例中提供了用于检测云计算环境下裸金属服务器的设备,该设备的云计算环境下裸金属服务器检测方法的具体实施可参见上述方法实施例部分的描述,重复之处不再赘述,请参考图5,该设备包括:
获取模块10,用于获取云计算环境下的多台裸金属服务器的硬件配置信息;
分组模块11,用于根据所述硬件配置信息将所述多台裸金属服务器进行分组;
确定模块12,用于从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器,N为大于等于1的整数;
检测模块13,用于根据预设镜像检测所述N台裸金属服务器是否与所述预设镜像对应的操作系统适配,获得检测结果。
可选的,所述检测模块还用于:
若所述N台裸金属服务器中有M台裸金属服务器在使用预设镜像创建实例过程中出现异常,则判定所述M台裸金属服务器与所述镜像文件对应的操作系统不适配,其中,M为小于等于N的正整数;
若所述N台裸金属服务器在使用预设镜像创建实例过程中未出现异常,则控制所述N台裸金属服务器运行测试脚本,检测所述测试脚本是否正常运行,若正常运行,则判定所述N台裸金属服务器与所述操作系统适配,若未正常运行,则判定所述N台裸金属服务器与所述操作系统不适配。
可选的,所述设备还包括:
第一确定子模块,用于确定在所述多台裸金属服务器中使用第一镜像创建实例,其中,所述第一镜像与所述预设镜像相同或不同;
发送模块,用于向所述多台裸金属服务器发送至少一个检测命令,以使得所述多台裸金属服务器能够根据所述至少一个检测命令检测各自的网络配置或存储配置。
可选的,所述设备还包括:
判断模块,用于若在预设时间内未接收到所述多台裸金属服务器的反馈信息,则判定所述多台裸金属服务器的网络配置检测失败或存储配置检测失败。
可选的,所述确定模块还用于:
确定所述分组中的每一组的检测强度值,所述检测强度值为一组内用于检测的裸金属服务器所占比例;
根据每一组的检测强度值从对应的每一组中确定出至少一台裸金属服务器。
可选的,所述获取模块还用于:
根据所述第一配置参数或第二配置参数将所述多台裸金属服务器进行分组,或
结合第一配置参数与第二配置参数将所述多台裸金属服务器进行分组。
可选的,所述第一配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡;所述第二配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡。
基于同一发明构思,本发明实施例还提供一种用于检测云计算环境下裸金属服务器的设备,包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上所述的云计算环境下裸金属服务器的检测方法。
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上所述的云计算环境下裸金属服务器的检测方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种云计算环境下裸金属服务器的检测方法,其特征在于,包括:
获取云计算环境下的多台裸金属服务器的硬件配置信息;
根据所述硬件配置信息将所述多台裸金属服务器进行分组;
从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器,N为大于等于1的整数;
若所述N台裸金属服务器中有M台裸金属服务器在使用预设镜像创建实例过程中出现异常,则判定所述M台裸金属服务器与所述预设镜像对应的操作系统不适配,其中,M为小于等于N的正整数;
若所述N台裸金属服务器在使用预设镜像创建实例过程中未出现异常,则控制所述N台裸金属服务器运行测试脚本,检测所述测试脚本是否正常运行,若正常运行,则判定所述N台裸金属服务器与所述操作系统适配,若未正常运行,则判定所述N台裸金属服务器与所述操作系统不适配。
2.如权利要求1所述的方法,其特征在于,在所述检测结果表明所述N台裸金属服务器与所述操作系统适配时,所述方法还包括:
确定在所述多台裸金属服务器中使用第一镜像创建实例,其中,所述第一镜像与所述预设镜像相同或不同;
向所述多台裸金属服务器发送至少一个检测命令,以使得所述多台裸金属服务器能够根据所述至少一个检测命令检测各自的网络配置或存储配置。
3.如权利要求2所述的方法,其特征在于,在所述向所述多台裸金属服务器发送至少一个检测命令之后,还包括:
若在预设时间内未接收到所述多台裸金属服务器的反馈信息,则判定所述多台裸金属服务器的网络配置检测失败或存储配置检测失败。
4.如权利要求1-3中任一权项所述的方法,其特征在于,所述从所述分组中的每一组中确定出至少一台裸金属服务器,具体包括:
确定所述分组中的每一组的检测强度值,所述检测强度值为一组内用于检测的裸金属服务器所占比例;
根据每一组的检测强度值从对应的每一组中确定出至少一台裸金属服务器。
5.如权利要求1-3中任一权项所述的方法,其特征在于,在获取的硬件配置信息中包括第一配置参数以及与所述第一配置参数不同的第二配置参数时,所述根据所述硬件配置信息将所述多台裸金属服务器进行分组,具体为:
根据所述第一配置参数或第二配置参数将所述多台裸金属服务器进行分组,或
结合第一配置参数与第二配置参数将所述多台裸金属服务器进行分组。
6.如权利要求5所述的方法,其特征在于,所述第一配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡;所述第二配置参数为CPU或为内存或为网卡控制器NIC或为磁盘或为RAID卡或为固件版本或为HBA卡。
7.一种用于检测云计算环境下裸金属服务器的设备,其特征在于,包括:
获取模块,用于获取云计算环境下的多台裸金属服务器的硬件配置信息;
分组模块,用于根据所述硬件配置信息将所述多台裸金属服务器进行分组;
确定模块,用于从所述分组中的每一组中确定出至少一台裸金属服务器,共确定出N台裸金属服务器,N为大于等于1的整数;
检测模块,用于若所述N台裸金属服务器中有M台裸金属服务器在使用预设镜像创建实例过程中出现异常,则判定所述M台裸金属服务器与所述镜像文件对应的操作系统不适配,其中,M为小于等于N的正整数;
若所述N台裸金属服务器在使用预设镜像创建实例过程中未出现异常,则控制所述N台裸金属服务器运行测试脚本,检测所述测试脚本是否正常运行,若正常运行,则判定所述N台裸金属服务器与所述操作系统适配,若未正常运行,则判定所述N台裸金属服务器与所述操作系统不适配。
8.一种用于检测云计算环境下裸金属服务器的设备,其特征在于,包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如权利要求1-6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1-6中任一项所述的方法。
CN201710984886.1A 2017-10-20 2017-10-20 一种云计算环境下裸金属服务器的检测方法及设备 Active CN109697142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710984886.1A CN109697142B (zh) 2017-10-20 2017-10-20 一种云计算环境下裸金属服务器的检测方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710984886.1A CN109697142B (zh) 2017-10-20 2017-10-20 一种云计算环境下裸金属服务器的检测方法及设备

Publications (2)

Publication Number Publication Date
CN109697142A CN109697142A (zh) 2019-04-30
CN109697142B true CN109697142B (zh) 2022-05-13

Family

ID=66225382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710984886.1A Active CN109697142B (zh) 2017-10-20 2017-10-20 一种云计算环境下裸金属服务器的检测方法及设备

Country Status (1)

Country Link
CN (1) CN109697142B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324496B (zh) * 2020-02-20 2023-05-26 山东汇贸电子口岸有限公司 对裸机进行检测的方法及装置
CN111782283A (zh) * 2020-06-28 2020-10-16 北京思特奇信息技术股份有限公司 一种裸金属服务器的自动化管理方法、装置及介质
CN114070723B (zh) * 2020-07-31 2023-11-03 中移(苏州)软件技术有限公司 裸金属服务器的虚拟网络配置方法、系统及智能网卡
CN112003963B (zh) * 2020-08-27 2022-05-17 苏州浪潮智能科技有限公司 一种裸金属服务器挂载卷的方法、系统、设备以及介质
CN112486755A (zh) * 2020-12-11 2021-03-12 北京金山云网络技术有限公司 一种服务器检测方法、检测装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7395324B1 (en) * 1999-10-18 2008-07-01 Wnf Consulting Method and apparatus for maintaining a computer system
CN102857363A (zh) * 2012-05-04 2013-01-02 运软网络科技(上海)有限公司 一种虚拟网络的自主管理系统和方法
CN104767649A (zh) * 2015-04-30 2015-07-08 杭州华三通信技术有限公司 部署裸金属服务器的方法及装置
US9436493B1 (en) * 2012-06-28 2016-09-06 Amazon Technologies, Inc. Distributed computing environment software configuration
CN107172208A (zh) * 2017-06-30 2017-09-15 联想(北京)有限公司 服务器的部署方法及其系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8700867B2 (en) * 2010-04-30 2014-04-15 Netapp, Inc. Integrated storage controller and appliance method and system
CN104360952B (zh) * 2012-03-02 2018-09-04 北京奇虎科技有限公司 一种软件测试系统及方法
US9292312B2 (en) * 2012-03-22 2016-03-22 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Simulated network boot environment for bootstrap redirection
US20150317169A1 (en) * 2014-05-04 2015-11-05 Midfin Systems Inc. Constructing and operating high-performance unified compute infrastructure across geo-distributed datacenters
US9858060B2 (en) * 2014-05-09 2018-01-02 International Business Machines Corporation Automated deployment of a private modular cloud-computing environment
US10333784B2 (en) * 2015-06-30 2019-06-25 International Business Machines Corporation Cloud system order and configuration using customized templates

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7395324B1 (en) * 1999-10-18 2008-07-01 Wnf Consulting Method and apparatus for maintaining a computer system
CN102857363A (zh) * 2012-05-04 2013-01-02 运软网络科技(上海)有限公司 一种虚拟网络的自主管理系统和方法
US9436493B1 (en) * 2012-06-28 2016-09-06 Amazon Technologies, Inc. Distributed computing environment software configuration
CN104767649A (zh) * 2015-04-30 2015-07-08 杭州华三通信技术有限公司 部署裸金属服务器的方法及装置
CN107172208A (zh) * 2017-06-30 2017-09-15 联想(北京)有限公司 服务器的部署方法及其系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
服务器和存储自动化管理系统测试设计与实现;吴再婕;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170315(第03期);第I138-1740页 *

Also Published As

Publication number Publication date
CN109697142A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109697142B (zh) 一种云计算环境下裸金属服务器的检测方法及设备
US9722859B2 (en) Evaluation of field replaceable unit dependencies and connections
US8954579B2 (en) Transaction-level health monitoring of online services
US8549522B1 (en) Automated testing environment framework for testing data storage systems
CN106998265B (zh) 一种监控方法及其装置
US20180107474A1 (en) Microcode upgrade in a storage system
US9928116B2 (en) Safe consolidation and migration
US20140122931A1 (en) Performing diagnostic tests in a data center
US9378122B2 (en) Adopting an existing automation script to a new framework
CN110457197B (zh) 服务测试方法、装置、计算机设备和存储介质
CN103973515A (zh) 一种网卡稳定性测试方法
CN109324962B (zh) 一种基于云物联技术的应用程序的测试方法及设备
US20140143768A1 (en) Monitoring updates on multiple computing platforms
US20170364436A1 (en) Plugin-based software verification system
CN111897697A (zh) 服务器硬件故障修复方法和装置
CN108199901B (zh) 硬件报修方法、系统、设备、硬件管理服务器与存储介质
US9882779B2 (en) Software version maintenance in a software defined network
US20140282581A1 (en) Method and apparatus for providing a component block architecture
JP2015011413A (ja) 検証自動化方式
US10193744B1 (en) Mass restoration of enterprise business services following service disruption
CN106411643A (zh) Bmc检测方法以及装置
CN109120433B (zh) 用于容器化部署主机的方法和装置
CN107168819B (zh) 一种操作系统重启方法及装置
US20150269047A1 (en) Optimizing computer hardware usage in a computing system that includes a plurality of populated central processing unit ('cpu') sockets
CN109257256A (zh) 设备监控方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant