CN108089911A - OpenStack环境中的计算节点的控制方法和装置 - Google Patents

OpenStack环境中的计算节点的控制方法和装置 Download PDF

Info

Publication number
CN108089911A
CN108089911A CN201711338649.4A CN201711338649A CN108089911A CN 108089911 A CN108089911 A CN 108089911A CN 201711338649 A CN201711338649 A CN 201711338649A CN 108089911 A CN108089911 A CN 108089911A
Authority
CN
China
Prior art keywords
virtual machine
calculate node
available
run
running
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711338649.4A
Other languages
English (en)
Inventor
苏广峰
孙佳
王红涛
张百林
亢宇飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711338649.4A priority Critical patent/CN108089911A/zh
Publication of CN108089911A publication Critical patent/CN108089911A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种OpenStack环境中的计算节点的控制方法和装置,该方法包括:在控制节点中配置需要监控的用于运行虚拟机的计算节点状态数据;周期性地监测在环境中用于运行虚拟机的计算节点的状态数据;根据监测到的状态数据,确定相应的用于运行虚拟机的计算节点是否可用;在确定相应的用于运行虚拟机的计算节点不可用的时候,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。通过确定计算节点是否可用,并且及时疏散在不可用的计算节点上运行的虚拟机,能够最大程度地缩短RTO和RPO,在最短的时间恢复虚拟机业务,保持高可用性。

Description

OpenStack环境中的计算节点的控制方法和装置
技术领域
本发明涉及信息技术,尤指一种OpenStack环境中的计算节点的控制方法和装置。
背景技术
OpenStack既是一个社区,又是一个项目和一个开源软件,它支持几乎所有类型的云环境,提供了一个部署云的解决方案或工具集。其宗旨在于:帮助组织运行为虚拟计算或存储服务的云,为公有云、私有云提供可扩展的、灵活的云计算。
在OpenStack环境中,高可用性是指在本地系统(在OpenStack环境中,指的是其中的用于运行虚拟机的计算节点)的某个组件出现故障的情况下,不能中断业务、或者能够从中断快速恢复业务以及能够继续访问应用的能力,而无论这个故障是物理设施、业务流程、软/硬件的故障。最高效的可用性,就是当一台机器宕机了,而使得使用服务的用户完全感觉不到。假如计算节点宕机,运行在该计算节点上的服务会做故障切换(failover),切换一般有两个维度的成本:服务恢复的时间(Recovery Time Objective,简称为RTO)和恢复业务时向前恢复的数据的时间(Recovery Point Objective,简称为RPO)。RTO的最佳情况是0,也就意味着服务能够立即恢复,业务不中断;最坏的情况是该值无穷大,也就意味着服务永远无法恢复;RPO即可能丢失数据的时间,其最佳情况是0,意味着数据是同步的(即数据没有丢失),RPO大于0意味着有数据丢失,比如“RPO=1”意味着恢复时使用一天前的数据,那么一天之内的数据就丢失了。本地系统存在RTO和RPO造成了OpenStack环境的可用性不佳以及OpenStack环境不够稳定,影响了用户对于OpenStack环境的信任。
发明内容
为了解决上述技术问题,本发明提供了一种OpenStack环境中的计算节点的控制方法和装置,其最大程度地缩短RTO和RPO,在最短的时间恢复虚拟机业务,使OpenStack环境保持高可用性。
为了达到本发明目的,本发明提供了一种OpenStack环境中的计算节点的控制方法,该方法包括:
在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据;
周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据;
根据监测到的状态数据,确定相应的用于运行虚拟机的计算节点是否可用;
在确定相应的用于运行虚拟机的计算节点不可用的时候,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
进一步地,在一个可选的实施例中,需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括:最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。
进一步地,在一个可选的实施例中,在将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤之后,方法还包括:重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,若确定多个相应的用于运行虚拟机的计算节点是不可用的,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤包括:依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤,直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止:
将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点;
重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,在确定相应的用于运行虚拟机的计算节点不可用的时候,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤,包括:
在确定相应的用于运行虚拟机的计算节点不可用的时候,确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散;
若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散,则向不可用的计算节点发送消息,以重启在不可用的计算节点上运行的服务,并且确定不可用的计算节点是否可用;
若确定不可用的计算节点不可用,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
为了达到本发明目的,本发明还提供了一种OpenStack环境中的计算节点的控制装置,该装置包括:
控制节点配置模块,设置成:在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据;
数据监测模块,设置成:周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据;
可用性确定模块,设置成:根据监测到的状态数据,确定相应的用于运行虚拟机的计算节点是否可用;
计算节点处理模块,设置成:在确定相应的用于运行虚拟机的计算节点不可用的时候,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
进一步地,在一个可选的实施例中,需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括:最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。
进一步地,在一个可选的实施例中,装置还包括重新启动模块,重新启动模块设置成:在计算节点处理模块将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点之后,重新启动模块重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,若计算节点处理模块确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的,则计算节点处理模块设置成:依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤,直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止:
将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点;以及
重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,计算节点处理模块包括:
虚拟机预先疏散模块,设置成:在确定相应的用于运行虚拟机的计算节点不可用的时候,确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散;
服务重启模块,设置成:若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散,则向不可用的计算节点发送消息,以重启在不可用的计算节点上运行的服务,并且确定不可用的计算节点是否可用;以及
虚拟机疏散模块,设置成:若确定不可用的计算节点不可用,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
与现有技术相比,本发明的实施例的有益效果在于:通过采用控制节点监测计算节点的状态数据来识别计算节点的运行状态,确定计算节点是否可用,并且能够及时疏散在不可用的计算节点上运行的虚拟机,从而能够最大程度地缩短RTO和RPO,在最短的时间恢复虚拟机业务,使OpenStack环境保持高可用性,保持OpenStack环境中的业务稳定高效地正常运行。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明的实施例提供的OpenStack环境中的计算节点的控制方法的流程图;
图2为本发明的可选的实施例提供的步骤S113中的流程图;
图3为本发明的实施例提供的OpenStack环境中的计算节点的控制装置的框图;
图4为本发明的可选的实施例提供的在计算节点处理模块213中的模块的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
一方面,本发明的实施例提供了一种OpenStack环境中的计算节点的控制方法,如图1所示,该方法包括步骤S101-步骤S113。
步骤S101,在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据。
步骤S105,周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据。
步骤S109,根据监测到的状态数据,确定相应的用于运行虚拟机的计算节点是否可用。
步骤S113,在确定相应的用于运行虚拟机的计算节点不可用的时候,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
本发明的实施例的有益效果在于:通过采用控制节点监测计算节点的状态数据来识别计算节点的运行状态,确定计算节点是否可用,并且能够及时疏散在不可用的计算节点上运行的虚拟机,从而能够最大程度地缩短RTO和RPO,在最短的时间恢复虚拟机业务,使OpenStack环境保持高可用性,保持OpenStack环境中的业务稳定高效地正常运行。
进一步地,在一个可选的实施例中,需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括:计算节点最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。
进一步地,在一个可选的实施例中,在步骤S113之后,该方法还包括:重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,若确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的,则步骤S113包括:依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤,直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止:
将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点;
重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,如图2所示,步骤S113包括步骤S1131-步骤S1135。
步骤S1131,在确定相应的用于运行虚拟机的计算节点不可用的时候,确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散。
步骤S1133,若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散,则向不可用的计算节点发送消息,以重启在不可用的计算节点上运行的服务,并且确定不可用的计算节点是否可用。
需要说明的是,如果确定在预先确定的时间范围内已对不可用的计算节点进行过虚拟机的疏散,则可以认为在预先确定的时间范围内已经对该计算节点进行过处理,因此不再对该计算节点进行处理。
步骤S1135,若确定不可用的计算节点不可用,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
另一方面,本发明的实施例提供了一种OpenStack环境中的计算节点的控制装置,如图3所示,该装置包括控制节点配置模块201、数据监测模块205、可用性确定模块209以及计算节点处理模块213。
控制节点配置模块201设置成:在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据。
数据监测模块205设置成:周期性地监测在OpenStack环境中用于运行虚拟机的计算节点的状态数据。
可用性确定模块209设置成:根据监测到的状态数据,确定相应的用于运行虚拟机的计算节点是否可用。
计算节点处理模块213设置成:在确定相应的用于运行虚拟机的计算节点不可用的时候,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
本发明的实施例的有益效果在于:通过采用控制节点监测计算节点的状态数据来识别计算节点的运行状态,确定计算节点是否可用,并且能够及时疏散在不可用的计算节点上运行的虚拟机,从而能够最大程度地缩短RTO和RPO,在最短的时间恢复虚拟机业务,使OpenStack环境保持高可用性,保持OpenStack环境中的业务稳定高效地正常运行。
进一步地,在一个可选的实施例中,需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括:计算节点最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。
进一步地,在一个可选的实施例中,OpenStack环境中的计算节点的控制装置还包括重新启动模块,重新启动模块设置成:在计算节点处理模块213将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点之后,重新启动模块重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,若计算节点处理模块213确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的,则计算节点处理模块213设置成:依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤,直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止:
将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点;
重新启动已疏散了虚拟机的计算节点。
进一步地,在一个可选的实施例中,如图4所示,计算节点处理模块213包括虚拟机预先疏散模块2131、服务重启模块2133以及虚拟机疏散模块2135。
虚拟机预先疏散模块2131设置成:在确定相应的用于运行虚拟机的计算节点不可用的时候,确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散。
服务重启模块2133设置成:若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散,则向不可用的计算节点发送消息,以重启在不可用的计算节点上运行的服务,并且确定不可用的计算节点是否可用。
需要说明的是,如果确定在预先确定的时间范围内已对不可用的计算节点进行过虚拟机的疏散,则可以认为在预先确定的时间范围内已经对该计算节点进行过处理,因此不再对该计算节点进行处理。
虚拟机疏散模块2135设置成:若确定不可用的计算节点不可用,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
虽然本发明所揭露的实施方式如上,但上述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种OpenStack环境中的计算节点的控制方法,其特征在于,包括:
在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据;
周期性地监测所述在OpenStack环境中用于运行虚拟机的计算节点的状态数据;
根据所述监测到的状态数据,确定相应的用于运行虚拟机的计算节点是否可用;
在确定所述相应的用于运行虚拟机的计算节点不可用的时候,则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
2.根据权利要求1所述的方法,其特征在于,所述需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括:最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。
3.根据权利要求1所述的方法,其特征在于,在将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤之后,所述方法还包括:重新启动已疏散了虚拟机的计算节点。
4.根据权利要求1所述的方法,其中,若确定多个所述相应的用于运行虚拟机的计算节点是不可用的,则所述将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤包括:依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤,直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止:
将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在所述OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点;
重新启动已疏散了虚拟机的计算节点。
5.根据权利要求1所述的方法,其中,所述在确定所述相应的用于运行虚拟机的计算节点不可用的时候,则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点的步骤,包括:
在确定所述相应的用于运行虚拟机的计算节点不可用的时候,确定是否在预先确定的时间范围内对所述不可用的计算节点进行过虚拟机的疏散;
若在预先确定的时间范围内并未对所述不可用的计算节点进行过虚拟机的疏散,则向所述不可用的计算节点发送消息,以重启在所述不可用的计算节点上运行的服务,并且确定所述不可用的计算节点是否可用;
若确定所述不可用的计算节点不可用,则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
6.一种OpenStack环境中的计算节点的控制装置,其特征在于,所述装置包括:
控制节点配置模块,所述控制节点配置模块设置成:在OpenStack环境中的控制节点中配置需要监控的在OpenStack环境中用于运行虚拟机的计算节点的信息以及状态数据;
数据监测模块,所述数据监测模块设置成:周期性地监测所述在OpenStack环境中用于运行虚拟机的计算节点的状态数据;
可用性确定模块,所述可用性确定模块设置成:根据所述监测到的状态数据,确定相应的用于运行虚拟机的计算节点是否可用;
计算节点处理模块,所述计算节点处理模块设置成:在确定所述相应的用于运行虚拟机的计算节点不可用的时候,则将在所述相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据所述监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
7.根据权利要求6所述的装置,其特征在于,所述需要监控的在OpenStack环境中用于运行虚拟机的计算节点的状态数据包括:最近的主机管理网状态、业务网状态、主机业务处理是否阻塞。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括重新启动模块,所述重新启动模块设置成:在所述计算节点处理模块将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点之后,所述重新启动模块重新启动已疏散了虚拟机的计算节点。
9.根据权利要求6所述的装置,其中,若所述计算节点处理模块确定在OpenStack环境之中有分别与其状态数据相应的用于运行虚拟机的多个计算节点是不可用的,则所述计算节点处理模块设置成:依次对在用于运行虚拟机的多个不可用的计算节点中的每个计算节点执行下列步骤,直到将所有被确定为不可用的用于运行虚拟机的计算节点上的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点为止:
将在用于运行虚拟机的多个不可用的计算节点中的一个计算节点运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点;以及
重新启动已疏散了虚拟机的计算节点。
10.根据权利要求6所述的装置,其中,计算节点处理模块包括:
虚拟机预先疏散模块,所述虚拟机预先疏散模块设置成:在确定相应的用于运行虚拟机的计算节点不可用的时候,确定是否在预先确定的时间范围内对不可用的计算节点进行过虚拟机的疏散;
服务重启模块,所述服务重启模块设置成:若在预先确定的时间范围内并未对不可用的计算节点进行过虚拟机的疏散,则向不可用的计算节点发送消息,以重启在不可用的计算节点上运行的服务,并且确定不可用的计算节点是否可用;以及
虚拟机疏散模块,所述虚拟机疏散模块设置成:若确定不可用的计算节点不可用,则将在相应的用于运行虚拟机的计算节点上运行的虚拟机疏散到在OpenStack环境中根据监测到的状态数据而被确定为可用的用于运行虚拟机的计算节点。
CN201711338649.4A 2017-12-14 2017-12-14 OpenStack环境中的计算节点的控制方法和装置 Pending CN108089911A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711338649.4A CN108089911A (zh) 2017-12-14 2017-12-14 OpenStack环境中的计算节点的控制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711338649.4A CN108089911A (zh) 2017-12-14 2017-12-14 OpenStack环境中的计算节点的控制方法和装置

Publications (1)

Publication Number Publication Date
CN108089911A true CN108089911A (zh) 2018-05-29

Family

ID=62175672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711338649.4A Pending CN108089911A (zh) 2017-12-14 2017-12-14 OpenStack环境中的计算节点的控制方法和装置

Country Status (1)

Country Link
CN (1) CN108089911A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515702A (zh) * 2019-08-29 2019-11-29 浪潮云信息技术有限公司 一种计算节点故障虚拟机的自动疏散方法及装置
CN110580198A (zh) * 2019-08-29 2019-12-17 上海仪电(集团)有限公司中央研究院 OpenStack计算节点自适应切换为控制节点的方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708018A (zh) * 2012-04-20 2012-10-03 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN103019889A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 分布式文件系统及其故障处理方法
CN103152419A (zh) * 2013-03-08 2013-06-12 中标软件有限公司 一种云计算平台的高可用集群管理方法
US20160048408A1 (en) * 2014-08-13 2016-02-18 OneCloud Labs, Inc. Replication of virtualized infrastructure within distributed computing environments
CN106598700A (zh) * 2016-12-12 2017-04-26 武汉烽火信息集成技术有限公司 基于pacemaker的虚拟机的秒级高可用实现方法
CN106775953A (zh) * 2016-12-30 2017-05-31 北京中电普华信息技术有限公司 实现OpenStack高可用的方法与系统
CN107147540A (zh) * 2017-07-19 2017-09-08 郑州云海信息技术有限公司 高可用性系统中的故障处理方法和故障处理集群
CN107453888A (zh) * 2016-05-31 2017-12-08 深圳市深信服电子科技有限公司 高可用性的虚拟机集群的管理方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708018A (zh) * 2012-04-20 2012-10-03 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN103019889A (zh) * 2012-12-21 2013-04-03 曙光信息产业(北京)有限公司 分布式文件系统及其故障处理方法
CN103152419A (zh) * 2013-03-08 2013-06-12 中标软件有限公司 一种云计算平台的高可用集群管理方法
US20160048408A1 (en) * 2014-08-13 2016-02-18 OneCloud Labs, Inc. Replication of virtualized infrastructure within distributed computing environments
CN107453888A (zh) * 2016-05-31 2017-12-08 深圳市深信服电子科技有限公司 高可用性的虚拟机集群的管理方法及装置
CN106598700A (zh) * 2016-12-12 2017-04-26 武汉烽火信息集成技术有限公司 基于pacemaker的虚拟机的秒级高可用实现方法
CN106775953A (zh) * 2016-12-30 2017-05-31 北京中电普华信息技术有限公司 实现OpenStack高可用的方法与系统
CN107147540A (zh) * 2017-07-19 2017-09-08 郑州云海信息技术有限公司 高可用性系统中的故障处理方法和故障处理集群

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515702A (zh) * 2019-08-29 2019-11-29 浪潮云信息技术有限公司 一种计算节点故障虚拟机的自动疏散方法及装置
CN110580198A (zh) * 2019-08-29 2019-12-17 上海仪电(集团)有限公司中央研究院 OpenStack计算节点自适应切换为控制节点的方法及装置

Similar Documents

Publication Publication Date Title
CA2957749C (en) Systems and methods for fault tolerant communications
US10983880B2 (en) Role designation in a high availability node
US20130028091A1 (en) System for controlling switch devices, and device and method for controlling system configuration
JP2013535745A (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
WO2016045439A1 (zh) 一种vnfm容灾保护的方法、装置和nfvo、存储介质
CN104038376A (zh) 一种管理真实服务器的方法、装置及lvs集群系统
WO2019148716A1 (zh) 数据传输方法、服务器及存储介质
US20160036654A1 (en) Cluster system
WO2014067335A1 (zh) 一种分布式通信设备软件升级方法及系统
CN104572241A (zh) 应用程序的切换方法及装置、系统
CN108089911A (zh) OpenStack环境中的计算节点的控制方法和装置
WO2021143026A1 (zh) 流表更新方法、装置、系统、计算机设备及存储介质
JP6489239B2 (ja) 通信装置、システム、方法、及びプログラム
CN103902401A (zh) 基于监控的虚拟机容错方法及装置
JP2010176178A (ja) 仮想計算機システム、仮想計算機のマイグレーション方法、及びプログラム
CN101026613A (zh) 数据链接保护方法及装置
CN106301877A (zh) 一种虚拟网元的升级方法和装置
US9110865B2 (en) Virtual machine dynamic routing
WO2017124829A1 (zh) 恢复虚拟机的方法和装置
US11349964B2 (en) Selective TCP/IP stack reconfiguration
JP2019128912A (ja) プロセス処理装置、プロセス処理システム、プロセス移行順序決定方法、及びプログラム
US10963355B2 (en) Automated and dynamic virtual machine grouping based on application requirement
CN111404810B (zh) openflow流表恢复方法、装置、电子设备及介质
CN110399028A (zh) 一种电源批量操作时防止电涌发生的方法、设备以及介质
CN113127137A (zh) 使用自托管虚拟机的云计算管理平台及其创建实现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180529