CN106972970A - 一种避免oVirt云平台管理节点单点故障的方法 - Google Patents

一种避免oVirt云平台管理节点单点故障的方法 Download PDF

Info

Publication number
CN106972970A
CN106972970A CN201710206613.4A CN201710206613A CN106972970A CN 106972970 A CN106972970 A CN 106972970A CN 201710206613 A CN201710206613 A CN 201710206613A CN 106972970 A CN106972970 A CN 106972970A
Authority
CN
China
Prior art keywords
management node
ovirt
virtual machine
avoiding
faliures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710206613.4A
Other languages
English (en)
Inventor
吴登勇
马晓光
马双涛
陈乃阔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Chaoyue Numerical Control Electronics Co Ltd
Original Assignee
Shandong Chaoyue Numerical Control Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Chaoyue Numerical Control Electronics Co Ltd filed Critical Shandong Chaoyue Numerical Control Electronics Co Ltd
Priority to CN201710206613.4A priority Critical patent/CN106972970A/zh
Publication of CN106972970A publication Critical patent/CN106972970A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

一种避免oVirt云平台管理节点单点故障的方法,是将原本部署在物理服务器上的管理节点部署至计算节点的虚拟机中,并将该虚拟机配置为高可用模式:当管理节点出现故障时,会自动触发管理节点虚拟机的迁移,从而保证整个oVirt云平台系统的稳定性。与传统分布式部署管理节点的方法相比,本发明大大较少了物理服务器的使用数量,并简化了多个服务器之间的通信流程,使整个部署过程简便快捷,而且管理节点的虚拟机在系统中具有最高的响应级别,在物理机宕机后,能够首先自动迁移管理节点虚拟机,待管理节点虚拟机完成迁移后,自动接管管理任务,继续进行其他虚拟机的迁移任务,通过此种方式使系统整体效率及稳定性有较大提升。

Description

一种避免oVirt云平台管理节点单点故障的方法
技术领域
本发明涉及一种避免oVirt云平台管理节点单点故障的方法,属于计算机虚拟化的技术领域。
背景技术
oVirt是基于KVM项目的开源虚拟化管理平台,其主体部分主要由计算节点(Node)和管理节点(Engine)组成,其中计算节点对外提供CPU、内存等计算资源,充当虚拟机管理器(Hypervisor)host的角色,并通过vdsm服务与管理节点进行通信,与管理端overt-engine组成一个虚拟化管理平台。管理节点对整个oVirt云平台中的所有资源进行管控,可以通过用于管理的webadmin门户或具有可以微调的权限和功能的用户门户访问前端。
在传统oVirt云计算环境中,通常是配备一个管理节点,2个以上的计算节点,这很容易造成管理节点出现单点故障。常用的解决方案是管理节点采用主备方式,在正常情况下仅主管理节点对外提供服务,但实时地把数据同步到备管理节点,当主管理节点宕机后,备管理节点立刻开始服务。该方案的优点是对客户端毫无影响,但在绝大多数时间内备管理节点处于空闲状态,存在严重的资源浪费。
中国专利CN103152420B提供一种避免Ovirt虚拟化管理平台单点失效的方法,该方法包括:将平台管理节点的所有服务部署在所述平台的每个物理机上,每个物理机启动分布式服务;所述分布式服务选取所述平台中一个物理机作为管理者,其他物理机作为劳动者,管理者为劳动者调配服务,劳动者启动所述调配的服务,并将服务状态和服务的启动位置发送给管理者;管理者接收并更新所述服务状态和启动服务的位置信息,监视劳动者的运行状态;若一个物理宕机后,分布式服务将选择其他的物理机启动宕机的物理机上的所有服务。通过本发明避免了Ovirt平台的单点失效,保证了Ovirt虚拟化管理平台不间断服务。
中国专利CN103152420A提供一种避免Ovirt虚拟化管理平台单点失效的方法,该方法包括:将平台管理节点的所有服务部署在所述平台的每个物理机上,每个物理机启动分布式服务;所述分布式服务选取所述平台中一个物理机作为管理者,其他物理机作为劳动者,管理者为劳动者调配服务,劳动者启动所述调配的服务,并将服务状态和服务的启动位置发送给管理者;管理者接收并更新所述服务状态和启动服务的位置信息,监视劳动者的运行状态;若一个物理宕机后,分布式服务将选择其他的物理机启动宕机的物理机上的所有服务。通过本发明避免了Ovirt平台的单点失效,保证了Ovirt虚拟化管理平台不间断服务。
针对oVirt云管理平台存在的单点故障问题,现有技术的做法是将管理节点的各项服务分布式地部署在不同物理机上,并从多个物理机中选取一台作为管理服务器,调度其他物理服务器进行协同工作。但是上述方法不仅部署复杂,而且所需的物理服务器数量较多,各服务器之间相互通信占据了大量的系统资源,严重影响系统效率。
发明内容
针对现有技术的不足,本发明提供一种避免oVirt云平台管理节点单点故障的方法。本发明所述方法旨在避免出现管理节点的单点故障,从而提高整个oVirt云计算平台系统的稳定性。
发明概述:
一种避免oVirt云平台管理节点单点故障的方法,是一种管理节点高可用的方案,将原本部署在物理服务器上的管理节点部署至计算节点的虚拟机中,并将该虚拟机配置为高可用模式:当管理节点出现故障时,会自动触发管理节点虚拟机的迁移,从而保证整个oVirt云平台系统的稳定性。
本发明的技术方案如下:
一种避免oVirt云平台管理节点单点故障的方法,包括在物理机上:安装宿主机操作系统、配置宿主机网络及存储、创建宿主系统环境、创建管理节点虚拟机和创建oVirt-engine管理服务。
根据本发明优选的,所述安装宿主机操作系统:在物理机上安装centos7操作系统,此处选择安装minimal的centos系统。由于oVirt云平台的计算节点及管理节点的开发环境基于centos操作系统,所以首先在物理机上安装centos7操作系统,为了避免产生环境冲突,此处选择安装minimal的centos系统。
根据本发明优选的,所述配置宿主机网络及存储:添加oVirt的repo源,以创建宿主系统环境和创建oVirt-engine时访问外部资源;同时配置存储nfs服务,以提供oVirt的iso域和export域。
根据本发明优选的,所述创建宿主系统环境:利用oVirt提供的管理节点虚拟机创建支持指令oVirt-hosted-engine-setup创建宿主系统环境。
根据本发明优选的,在所述创建宿主系统环境过程中,使用预先提供的NFS服务配置存储,并指定宿主系统的全称域名FQDN,该FQDN须和安装oVirt-engine的虚拟机配置一致;同时上传系统安装镜像ISO至宿主系统,为创建管理节点虚拟机提供系统安装镜像。
根据本发明优选的,所述创建管理节点虚拟机:指定引导方式为cdrom,利用上传的系统ISO创建管理节点虚拟机,并为所述管理节点虚拟机指定CPU型号、vCPU数量、磁盘容量及虚拟内存大小,并指定采用VNC作为连接所述管理节点虚拟机的方式。
根据本发明优选的,在所述创建管理节点虚拟机完毕后通过管理节点虚拟机启动指令hosted-engine--vm-start重启所述管理节点虚拟机。
根据本发明优选的,所述创建oVirt-engine管理服务:采用VNC连接至管理节点虚拟机,利用oVirt-engine部署虚拟机的管理服务,通过WEB方式访问管理界面进行oVirt云平台的管理。
本发明的优点在于:
与传统分布式部署管理节点的方法相比,本发明大大较少了物理服务器的使用数量,并简化了多个服务器之间的通信流程,使整个部署过程简便快捷,而且管理节点的虚拟机在系统中具有最高的响应级别,在物理机宕机后,能够首先自动迁移管理节点虚拟机,待管理节点虚拟机完成迁移后,自动接管管理任务,继续进行其他虚拟机的迁移任务,通过此种方式使系统整体效率及稳定性有较大提升。
附图说明
图1:是本发明所述方法的流程示意图。
具体实施方式
下面结合实施例和说明书附图对本发明做详细的说明,但不限于此。
如图1所示。
实施例1、
一种避免oVirt云平台管理节点单点故障的方法,包括在物理机上:安装宿主机操作系统、配置宿主机网络及存储、创建宿主系统环境、创建管理节点虚拟机和创建oVirt-engine管理服务。
所述安装宿主机操作系统:在物理机上安装centos7操作系统,此处选择安装minimal的centos系统。
所述配置宿主机网络及存储:添加oVirt的repo源,以创建宿主系统环境和创建oVirt-engine时访问外部资源;同时配置存储nfs服务,以提供oVirt的iso域和export域。
实施例2、
如实施例1所述的一种避免oVirt云平台管理节点单点故障的方法,其区别在于,所述创建宿主系统环境:利用oVirt提供的管理节点虚拟机创建支持指令oVirt-hosted-engine-setup创建宿主系统环境。
实施例3、
如实施例2所述的一种避免oVirt云平台管理节点单点故障的方法,其区别在于,在所述创建宿主系统环境过程中,使用预先提供的NFS服务配置存储,并指定宿主系统的全称域名FQDN,该FQDN须和安装oVirt-engine的虚拟机配置一致;同时上传系统安装镜像ISO至宿主系统,为创建管理节点虚拟机提供系统安装镜像。
实施例4、
如实施例1所述的一种避免oVirt云平台管理节点单点故障的方法,其区别在于,所述创建管理节点虚拟机:指定引导方式为cdrom,利用上传的系统ISO创建管理节点虚拟机,并为所述管理节点虚拟机指定CPU型号、vCPU数量、磁盘容量及虚拟内存大小,并指定采用VNC作为连接所述管理节点虚拟机的方式。
在所述创建管理节点虚拟机完毕后通过管理节点虚拟机启动指令hosted-engine--vm-start重启所述管理节点虚拟机。
实施例5、
如实施例1所述的一种避免oVirt云平台管理节点单点故障的方法,其区别在于,所述创建oVirt-engine管理服务:采用VNC连接至管理节点虚拟机,利用oVirt-engine部署虚拟机的管理服务,通过WEB方式访问管理界面进行oVirt云平台的管理。
应用例、
如实施例1-5所述的一种避免oVirt云平台管理节点单点故障的方法的具体应用如下:
1、由于oVirt的计算节点及管理节点的开发环境基于centos操作系统,所以首先在物理机上安装centos7操作系统,为了避免产生环境冲突,此处选择安装minimal的centos系统。
2、在宿主系统中配置网络及存储,添加oVirt的repo源,以便创建宿主系统环境和创建oVirt-engine时访问外部资源,同时配置存储nfs服务,以提供oVirt的iso域和export域。
3、利用oVirt-hosted-engine-setup创建宿主系统环境,在过程中使用预先提供的NFS服务配置存储,并指定宿主系统的FQDN,该FQDN须和安装oVirt-engine的虚拟机配置一致。同时上传系统ISO至宿主系统,以便为创建管理节点虚拟机提供系统安装镜像。
4、指定引导方式为cdrom,利用上传的系统ISO创建管理节点虚拟机,并为此虚拟机指定CPU型号、vCPU数量、磁盘容量及虚拟内存大小,并指定采用VNC作为连接此虚拟机的方式。创建虚拟机完毕后通过hosted-engine--vm-start指令重启虚拟机。
5、采用VNC连接至管理节点虚拟机,利用oVirt-engine部署虚拟机的管理服务,通过WEB方式访问管理界面即可进行oVirt云平台的管理。

Claims (8)

1.一种避免oVirt云平台管理节点单点故障的方法,其特征在于,该方法包括在物理机上:安装宿主机操作系统、配置宿主机网络及存储、创建宿主系统环境、创建管理节点虚拟机和创建oVirt-engine管理服务。
2.根据权利要求1所述的一种避免oVirt云平台管理节点单点故障的方法,其特征在于,所述安装宿主机操作系统:在物理机上安装centos7操作系统,此处选择安装minimal的centos系统。
3.根据权利要求1所述的一种避免oVirt云平台管理节点单点故障的方法,其特征在于,所述配置宿主机网络及存储:添加oVirt的repo源,以创建宿主系统环境和创建oVirt-engine时访问外部资源;同时配置存储nfs服务,以提供oVirt的iso域和export域。
4.根据权利要求1所述的一种避免oVirt云平台管理节点单点故障的方法,其特征在于,所述创建宿主系统环境:利用oVirt提供的管理节点虚拟机创建支持指令oVirt-hosted-engine-setup创建宿主系统环境。
5.根据权利要求4所述的一种避免oVirt云平台管理节点单点故障的方法,其特征在于,在所述创建宿主系统环境过程中,使用预先提供的NFS服务配置存储,并指定宿主系统的全称域名FQDN,该FQDN须和安装oVirt-engine的虚拟机配置一致;同时上传系统安装镜像ISO至宿主系统,为创建管理节点虚拟机提供系统安装镜像。
6.根据权利要求1所述的一种避免oVirt云平台管理节点单点故障的方法,其特征在于,所述创建管理节点虚拟机:指定引导方式为cdrom,利用上传的系统ISO创建管理节点虚拟机,并为所述管理节点虚拟机指定CPU型号、vCPU数量、磁盘容量及虚拟内存大小,并指定采用VNC作为连接所述管理节点虚拟机的方式。
7.根据权利要求6所述的一种避免oVirt云平台管理节点单点故障的方法,其特征在于,在所述创建管理节点虚拟机完毕后通过管理节点虚拟机启动指令hosted-engine--vm-start重启所述管理节点虚拟机。
8.根据权利要求1所述的一种避免oVirt云平台管理节点单点故障的方法,其特征在于,所述创建oVirt-engine管理服务:采用VNC连接至管理节点虚拟机,利用oVirt-engine部署虚拟机的管理服务,通过WEB方式访问管理界面进行oVirt云平台的管理。
CN201710206613.4A 2017-03-31 2017-03-31 一种避免oVirt云平台管理节点单点故障的方法 Pending CN106972970A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710206613.4A CN106972970A (zh) 2017-03-31 2017-03-31 一种避免oVirt云平台管理节点单点故障的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710206613.4A CN106972970A (zh) 2017-03-31 2017-03-31 一种避免oVirt云平台管理节点单点故障的方法

Publications (1)

Publication Number Publication Date
CN106972970A true CN106972970A (zh) 2017-07-21

Family

ID=59337351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710206613.4A Pending CN106972970A (zh) 2017-03-31 2017-03-31 一种避免oVirt云平台管理节点单点故障的方法

Country Status (1)

Country Link
CN (1) CN106972970A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989131A (zh) * 2018-08-23 2018-12-11 郑州云海信息技术有限公司 一种私有云管理平台系统及其实现方法
CN109688139A (zh) * 2018-12-27 2019-04-26 成都国信安信息产业基地有限公司 云平台安全检测系统
CN110968444A (zh) * 2018-09-30 2020-04-07 北京国双科技有限公司 云计算平台的数据处理方法和装置
CN111935244A (zh) * 2020-07-20 2020-11-13 江苏安超云软件有限公司 一种业务请求处理系统及超融合一体机
CN112286627A (zh) * 2020-09-25 2021-01-29 福建升腾资讯有限公司 一种基于Ovirt和事件驱动的虚拟机管理方法及系统
CN112527325A (zh) * 2020-11-23 2021-03-19 山东乾云启创信息科技股份有限公司 一种应用于超融合架构的部署方法及系统
CN112527325B (zh) * 2020-11-23 2024-07-09 山东乾云启创信息科技股份有限公司 一种应用于超融合架构的部署方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103152420A (zh) * 2013-03-11 2013-06-12 汉柏科技有限公司 一种避免Ovirt虚拟管理平台单点失效的方法
CN103581177A (zh) * 2013-10-24 2014-02-12 华为技术有限公司 虚拟机管理方法及装置
US8977888B1 (en) * 2012-11-26 2015-03-10 Symantec Corporation Supporting live migration of virtual machine components with SCSI-3 persistent reservation fencing enabled
CN105335214A (zh) * 2015-11-12 2016-02-17 国云科技股份有限公司 一种虚拟机故障检测和恢复的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977888B1 (en) * 2012-11-26 2015-03-10 Symantec Corporation Supporting live migration of virtual machine components with SCSI-3 persistent reservation fencing enabled
CN103152420A (zh) * 2013-03-11 2013-06-12 汉柏科技有限公司 一种避免Ovirt虚拟管理平台单点失效的方法
CN103581177A (zh) * 2013-10-24 2014-02-12 华为技术有限公司 虚拟机管理方法及装置
CN105335214A (zh) * 2015-11-12 2016-02-17 国云科技股份有限公司 一种虚拟机故障检测和恢复的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PCNK: "初探oVirt-体验", 《URL: HTTPS://BLOG.51CTO.COM/NOSMOKING/1695644/》 *
PCNK: "初探oVirt-小结后重做一遍ovirt环境", 《URL:HTTPS://BLOG.51CTO.COM/NOSMOKING/1702916/》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989131A (zh) * 2018-08-23 2018-12-11 郑州云海信息技术有限公司 一种私有云管理平台系统及其实现方法
CN110968444A (zh) * 2018-09-30 2020-04-07 北京国双科技有限公司 云计算平台的数据处理方法和装置
CN109688139A (zh) * 2018-12-27 2019-04-26 成都国信安信息产业基地有限公司 云平台安全检测系统
CN109688139B (zh) * 2018-12-27 2021-08-31 成都国信安信息产业基地有限公司 云平台安全检测系统
CN111935244A (zh) * 2020-07-20 2020-11-13 江苏安超云软件有限公司 一种业务请求处理系统及超融合一体机
CN111935244B (zh) * 2020-07-20 2022-11-29 江苏安超云软件有限公司 一种业务请求处理系统及超融合一体机
CN112286627A (zh) * 2020-09-25 2021-01-29 福建升腾资讯有限公司 一种基于Ovirt和事件驱动的虚拟机管理方法及系统
CN112527325A (zh) * 2020-11-23 2021-03-19 山东乾云启创信息科技股份有限公司 一种应用于超融合架构的部署方法及系统
CN112527325B (zh) * 2020-11-23 2024-07-09 山东乾云启创信息科技股份有限公司 一种应用于超融合架构的部署方法及系统

Similar Documents

Publication Publication Date Title
CN106972970A (zh) 一种避免oVirt云平台管理节点单点故障的方法
EP3588296A1 (en) Dynamically scaled hyperconverged system
US10292044B2 (en) Apparatus for end-user transparent utilization of computational, storage, and network capacity of mobile devices, and associated methods
Ardekani et al. A {Self-Configurable}{Geo-Replicated} Cloud Storage System
CN103491144B (zh) 一种广域网虚拟平台的构建方法
US20190082004A1 (en) Systems and methods for instantiating services on top of services
CN101390336B (zh) 灾难恢复体系结构
US11385883B2 (en) Methods and systems that carry out live migration of multi-node applications
CN102214128B (zh) 多用途恢复环境
CN104951360A (zh) 基于Docker的配置管理方式及装置
CN107220100A (zh) 一种开发运维方法、装置及云计算PaaS平台
CN113504954B (zh) 调用CSI LVM Plugin插件、动态持久卷供应的方法、系统及介质
CN107632937B (zh) 一种对虚拟机集群进行测试的方法、装置、可读存储介质
CN107404524A (zh) 一种分布式集群节点访问的方法及装置
CN106201527B (zh) 一种基于逻辑分区的应用程序容器系统
CN109799998B (zh) OpenStack集群配置及批量部署方法及系统
US8458693B2 (en) Transitioning from static to dynamic cluster management
US20170063986A1 (en) Target-driven tenant identity synchronization
CN104468791A (zh) 私有云IaaS平台的构建方法
CN114679380A (zh) 边缘集群的创建方法和相关装置
CN112235373A (zh) 基于应用ai的云桌面调度系统及其调度方法
Liao et al. Towards virtualized desktop environment
CN109600439A (zh) 基于微服务的PaaS平台的部署方法及PaaS平台
CN112306640A (zh) 容器分配方法及其装置、设备、介质
CN111459619A (zh) 一种基于云平台实现服务的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170721

RJ01 Rejection of invention patent application after publication