CN108089911A

CN108089911A - OpenStack环境中的计算节点的控制方法和装置

Info

Publication number: CN108089911A
Application number: CN201711338649.4A
Authority: CN
Inventors: 苏广峰; 孙佳; 王红涛; 张百林; 亢宇飞
Original assignee: Zhengzhou Yunhai Information Technology Co Ltd
Current assignee: Zhengzhou Yunhai Information Technology Co Ltd
Priority date: 2017-12-14
Filing date: 2017-12-14
Publication date: 2018-05-29

Abstract

本发明公开了一种OpenStack环境中的计算节点的控制方法和装置，该方法包括：在控制节点中配置需要监控的用于运行虚拟机的计算节点状态数据；周期性地监测在环境中用于运行虚拟机的计算节点的状态数据；根据监测到的状态数据，确定相应的用于运行虚拟机的计算节点是否可用；在确定相应的用于运行虚拟机的计算节点不可用的时候，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。通过确定计算节点是否可用，并且及时疏散在不可用的计算节点上运行的虚拟机，能够最大程度地缩短RTO和RPO，在最短的时间恢复虚拟机业务，保持高可用性。

Description

OpenStack环境中的计算节点的控制方法和装置

技术领域

本发明涉及信息技术，尤指一种OpenStack环境中的计算节点的控制方法和装置。

背景技术

OpenStack既是一个社区，又是一个项目和一个开源软件，它支持几乎所有类型的云环境，提供了一个部署云的解决方案或工具集。其宗旨在于：帮助组织运行为虚拟计算或存储服务的云，为公有云、私有云提供可扩展的、灵活的云计算。

在OpenStack环境中，高可用性是指在本地系统(在OpenStack环境中，指的是其中的用于运行虚拟机的计算节点)的某个组件出现故障的情况下，不能中断业务、或者能够从中断快速恢复业务以及能够继续访问应用的能力，而无论这个故障是物理设施、业务流程、软/硬件的故障。最高效的可用性，就是当一台机器宕机了，而使得使用服务的用户完全感觉不到。假如计算节点宕机，运行在该计算节点上的服务会做故障切换(failover)，切换一般有两个维度的成本：服务恢复的时间(Recovery Time Objective，简称为RTO)和恢复业务时向前恢复的数据的时间(Recovery Point Objective，简称为RPO)。RTO的最佳情况是0，也就意味着服务能够立即恢复，业务不中断；最坏的情况是该值无穷大，也就意味着服务永远无法恢复；RPO即可能丢失数据的时间，其最佳情况是0，意味着数据是同步的(即数据没有丢失)，RPO大于0意味着有数据丢失，比如“RPO＝1”意味着恢复时使用一天前的数据，那么一天之内的数据就丢失了。本地系统存在RTO和RPO造成了OpenStack环境的可用性不佳以及OpenStack环境不够稳定，影响了用户对于OpenStack环境的信任。

发明内容

为了解决上述技术问题，本发明提供了一种OpenStack环境中的计算节点的控制方法和装置，其最大程度地缩短RTO和RPO，在最短的时间恢复虚拟机业务，使OpenStack环境保持高可用性。

为了达到本发明目的，本发明提供了一种OpenStack环境中的计算节点的控制方法，该方法包括：

在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据；

周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据；

根据监测到的状态数据，确定相应的用于运行虚拟机的计算节点是否可用；

在确定相应的用于运行虚拟机的计算节点不可用的时候，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

进一步地，在一个可选的实施例中，需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括：最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。

进一步地，在一个可选的实施例中，在将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤之后，方法还包括：重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，若确定多个相应的用于运行虚拟机的计算节点是不可用的，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤包括：依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤，直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止：

将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点；

重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，在确定相应的用于运行虚拟机的计算节点不可用的时候，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤，包括：

在确定相应的用于运行虚拟机的计算节点不可用的时候，确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散；

若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散，则向不可用的计算节点发送消息，以重启在不可用的计算节点上运行的服务，并且确定不可用的计算节点是否可用；

若确定不可用的计算节点不可用，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

为了达到本发明目的，本发明还提供了一种OpenStack环境中的计算节点的控制装置，该装置包括：

控制节点配置模块，设置成：在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据；

数据监测模块，设置成：周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据；

可用性确定模块，设置成：根据监测到的状态数据，确定相应的用于运行虚拟机的计算节点是否可用；

计算节点处理模块，设置成：在确定相应的用于运行虚拟机的计算节点不可用的时候，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

进一步地，在一个可选的实施例中，装置还包括重新启动模块，重新启动模块设置成：在计算节点处理模块将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点之后，重新启动模块重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，若计算节点处理模块确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的，则计算节点处理模块设置成：依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤，直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止：

将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点；以及

重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，计算节点处理模块包括：

虚拟机预先疏散模块，设置成：在确定相应的用于运行虚拟机的计算节点不可用的时候，确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散；

服务重启模块，设置成：若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散，则向不可用的计算节点发送消息，以重启在不可用的计算节点上运行的服务，并且确定不可用的计算节点是否可用；以及

虚拟机疏散模块，设置成：若确定不可用的计算节点不可用，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

与现有技术相比，本发明的实施例的有益效果在于：通过采用控制节点监测计算节点的状态数据来识别计算节点的运行状态，确定计算节点是否可用，并且能够及时疏散在不可用的计算节点上运行的虚拟机，从而能够最大程度地缩短RTO和RPO，在最短的时间恢复虚拟机业务，使OpenStack环境保持高可用性，保持OpenStack环境中的业务稳定高效地正常运行。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本发明的技术方案，并不构成对本发明技术方案的限制。

图1为本发明的实施例提供的OpenStack环境中的计算节点的控制方法的流程图；

图2为本发明的可选的实施例提供的步骤S113中的流程图；

图3为本发明的实施例提供的OpenStack环境中的计算节点的控制装置的框图；

图4为本发明的可选的实施例提供的在计算节点处理模块213中的模块的框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

一方面，本发明的实施例提供了一种OpenStack环境中的计算节点的控制方法，如图1所示，该方法包括步骤S101-步骤S113。

步骤S101，在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据。

步骤S105，周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据。

步骤S109，根据监测到的状态数据，确定相应的用于运行虚拟机的计算节点是否可用。

步骤S113，在确定相应的用于运行虚拟机的计算节点不可用的时候，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

本发明的实施例的有益效果在于：通过采用控制节点监测计算节点的状态数据来识别计算节点的运行状态，确定计算节点是否可用，并且能够及时疏散在不可用的计算节点上运行的虚拟机，从而能够最大程度地缩短RTO和RPO，在最短的时间恢复虚拟机业务，使OpenStack环境保持高可用性，保持OpenStack环境中的业务稳定高效地正常运行。

进一步地，在一个可选的实施例中，需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括：计算节点最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。

进一步地，在一个可选的实施例中，在步骤S113之后，该方法还包括：重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，若确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的，则步骤S113包括：依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤，直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止：

重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，如图2所示，步骤S113包括步骤S1131-步骤S1135。

步骤S1131，在确定相应的用于运行虚拟机的计算节点不可用的时候，确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散。

步骤S1133，若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散，则向不可用的计算节点发送消息，以重启在不可用的计算节点上运行的服务，并且确定不可用的计算节点是否可用。

需要说明的是，如果确定在预先确定的时间范围内已对不可用的计算节点进行过虚拟机的疏散，则可以认为在预先确定的时间范围内已经对该计算节点进行过处理，因此不再对该计算节点进行处理。

步骤S1135，若确定不可用的计算节点不可用，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

另一方面，本发明的实施例提供了一种OpenStack环境中的计算节点的控制装置，如图3所示，该装置包括控制节点配置模块201、数据监测模块205、可用性确定模块209以及计算节点处理模块213。

控制节点配置模块201设置成：在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据。

数据监测模块205设置成：周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据。

可用性确定模块209设置成：根据监测到的状态数据，确定相应的用于运行虚拟机的计算节点是否可用。

计算节点处理模块213设置成：在确定相应的用于运行虚拟机的计算节点不可用的时候，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

进一步地，在一个可选的实施例中，OpenStack环境中的计算节点的控制装置还包括重新启动模块，重新启动模块设置成：在计算节点处理模块213将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点之后，重新启动模块重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，若计算节点处理模块213确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的，则计算节点处理模块213设置成：依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤，直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止：

重新启动已疏散了虚拟机的计算节点。

进一步地，在一个可选的实施例中，如图4所示，计算节点处理模块213包括虚拟机预先疏散模块2131、服务重启模块2133以及虚拟机疏散模块2135。

虚拟机预先疏散模块2131设置成：在确定相应的用于运行虚拟机的计算节点不可用的时候，确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散。

服务重启模块2133设置成：若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散，则向不可用的计算节点发送消息，以重启在不可用的计算节点上运行的服务，并且确定不可用的计算节点是否可用。

虚拟机疏散模块2135设置成：若确定不可用的计算节点不可用，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

虽然本发明所揭露的实施方式如上，但上述的内容仅为便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种OpenStack环境中的计算节点的控制方法，其特征在于，包括：

周期性地监测所述在OpenStack环境中用于运行虚拟机的计算节点的状态数据；

根据所述监测到的状态数据，确定相应的用于运行虚拟机的计算节点是否可用；

在确定所述相应的用于运行虚拟机的计算节点不可用的时候，则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

2.根据权利要求1所述的方法，其特征在于，所述需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括：最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。

3.根据权利要求1所述的方法，其特征在于，在将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤之后，所述方法还包括：重新启动已疏散了虚拟机的计算节点。

4.根据权利要求1所述的方法，其中，若确定多个所述相应的用于运行虚拟机的计算节点是不可用的，则所述将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤包括：依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤，直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止：

将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在所述OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点；

重新启动已疏散了虚拟机的计算节点。

5.根据权利要求1所述的方法，其中，所述在确定所述相应的用于运行虚拟机的计算节点不可用的时候，则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤，包括：

在确定所述相应的用于运行虚拟机的计算节点不可用的时候，确定是否在预先确定的时间范围内对所述不可用的计算节点进行过虚拟机的疏散；

若在预先确定的时间范围内并未对所述不可用的计算节点进行过虚拟机的疏散，则向所述不可用的计算节点发送消息，以重启在所述不可用的计算节点上运行的服务，并且确定所述不可用的计算节点是否可用；

若确定所述不可用的计算节点不可用，则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

6.一种OpenStack环境中的计算节点的控制装置，其特征在于，所述装置包括：

控制节点配置模块，所述控制节点配置模块设置成：在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据；

数据监测模块，所述数据监测模块设置成：周期性地监测所述在OpenStack环境中用于运行虚拟机的计算节点的状态数据；

可用性确定模块，所述可用性确定模块设置成：根据所述监测到的状态数据，确定相应的用于运行虚拟机的计算节点是否可用；

计算节点处理模块，所述计算节点处理模块设置成：在确定所述相应的用于运行虚拟机的计算节点不可用的时候，则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。

7.根据权利要求6所述的装置，其特征在于，所述需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括：最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。

8.根据权利要求6所述的装置，其特征在于，所述装置还包括重新启动模块，所述重新启动模块设置成：在所述计算节点处理模块将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点之后，所述重新启动模块重新启动已疏散了虚拟机的计算节点。

9.根据权利要求6所述的装置，其中，若所述计算节点处理模块确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的，则所述计算节点处理模块设置成：依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤，直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止：

重新启动已疏散了虚拟机的计算节点。

10.根据权利要求6所述的装置，其中，计算节点处理模块包括：

虚拟机预先疏散模块，所述虚拟机预先疏散模块设置成：在确定相应的用于运行虚拟机的计算节点不可用的时候，确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散；

服务重启模块，所述服务重启模块设置成：若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散，则向不可用的计算节点发送消息，以重启在不可用的计算节点上运行的服务，并且确定不可用的计算节点是否可用；以及

虚拟机疏散模块，所述虚拟机疏散模块设置成：若确定不可用的计算节点不可用，则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。