CN103152420A - 一种避免Ovirt虚拟管理平台单点失效的方法 - Google Patents
一种避免Ovirt虚拟管理平台单点失效的方法 Download PDFInfo
- Publication number
- CN103152420A CN103152420A CN2013100768793A CN201310076879A CN103152420A CN 103152420 A CN103152420 A CN 103152420A CN 2013100768793 A CN2013100768793 A CN 2013100768793A CN 201310076879 A CN201310076879 A CN 201310076879A CN 103152420 A CN103152420 A CN 103152420A
- Authority
- CN
- China
- Prior art keywords
- service
- manager
- machine
- labourer
- physical machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
本发明提供一种避免Ovirt虚拟化管理平台单点失效的方法,该方法包括:将平台管理节点的所有服务部署在所述平台的每个物理机上,每个物理机启动分布式服务;所述分布式服务选取所述平台中一个物理机作为管理者,其他物理机作为劳动者,管理者为劳动者调配服务,劳动者启动所述调配的服务,并将服务状态和服务的启动位置发送给管理者;管理者接收并更新所述服务状态和启动服务的位置信息,监视劳动者的运行状态;若一个物理宕机后,分布式服务将选择其他的物理机启动宕机的物理机上的所有服务。通过本发明避免了Ovirt平台的单点失效,保证了Ovirt虚拟化管理平台不间断服务。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种避免Ovirt虚拟化管理平台单点失效的方法。
背景技术
现有的Ovirt虚拟化管理平台主要包含管理节点,计算节点(也成被管理节点),其中计算节点负责运行虚机;管理节点(由各种服务组成)负责向下管理计算节点上的虚机启动/停止、虚机迁移、虚机的分配等工作,向上给用户提供接口(包括REST API,Web服务界面等)。
Ovirt的管理节点所有服务部署在一台物理计算机上,计算机节点由很多物理计算机组成。这种部署结构存在:如果管理节点的物理机出现宕机后,那么管理节点的服务就全部停掉,整个Ovirt虚拟化管理平台将无法工作,造成了这种平台的单点失效的问题。
发明内容
(一)所要解决的技术问题
本发明通过提供一种避免Ovirt虚拟化管理平台单点失效的方法,解决了Ovirt平台由于管理节点的物理机宕机后整个平台无法工作的问题。
(二)技术方案
本发明提供一种避免Ovirt虚拟化管理平台单点失效的方法,该方法包括:
S1、将平台管理节点的所有服务部署在所述平台的每个物理机上,每个物理机启动分布式服务;
S2、所述分布式服务选取所述平台中一个物理机作为管理者,其他物理机作为劳动者,管理者为劳动者调配服务,劳动者启动所述调配的服务,并将服务状态和服务的启动位置发送给管理者;
S3、管理者接收并更新所述服务状态和所述服务的启动位置信息,监视劳动者的运行状态;
若所述劳动者出现宕机,管理者接收到连接断开或连接没有响应的服务状态,则将宕机劳动者上运行的服务调配到其他劳动者上;
若所述管理者出现宕机,劳动者发现没有管理者的连接信息,则一个劳动者自动转变为管理者,并把自身服务调配到其他劳动者上。
其中,所述劳动者发送服务状态给管理者进一步包括:管理者向劳动者定时发送服务请求响应信息,劳动者响应所述服务请求响应信息,将本机服务状态发送给管理者。
其中,对所述平台的每个物理机进行编号,所述分布式服务保存物理机的编号和对应地址信息,选取序号最小的物理机作为管理者,若管理者出现宕机,则没有宕机的物理机中序号最小的物理机自动转变为管理者。
其中,所述管理者出现宕机,则没有宕机的物理机中序号最小的物理机自动转变为管理者具体包括:
劳动者发现没有管理者的连接信息,则从最小编号开始逐次检查机器状态;如果发现比自己小的最小编号,则把它作为管理者进行尝试连接;如果发现本机是编号最小的物理机,则把自己作为管理者,并等待劳动者的连接。
(三)有益效果
本发明将Ovirt虚拟化管理平台的管理节点的所有服务部署在每个物理机上,通过分布式服务,实现了服务的自动转移,解决了如果管理节点的物理机宕机后,整个Ovirt虚拟化管理平台无法工作即单点失效的问题,保证了Ovirt虚拟化管理平台的不间断服务。
附图说明
图1为本发明所提供方法的步骤流程图;
图2为本发明实施方式中Ovirt平台管理者和劳动者工作示意图;
图3为本发明实施方式中Ovirt平台物理机宕机后的工作示意图;
图4为本发明实施方式中Ovirt平台管理者宕机后的工作示意图。
具体实施方式
下面结合附图和具体实施例,对本发明的实施方式做进一步详细介绍。
本发明提供了一种避免Ovirt虚拟化管理平台单点失效的方法,具体的步骤如图1所示:
S1、将平台管理节点的所有服务部署在所述平台的每个物理机上,每个物理机启动分布式服务;
管理节点的所有服务包括虚机启动/停止、虚机迁移、虚机的分配等,将这些服务部署在平台下的所有物理机上,令这些物理机都拥有管理节点所有服务能力。
S2、所述分布式服务选取所述平台中一个物理机作为管理者,其他物理机作为劳动者,管理者为劳动者调配服务,劳动者启动所述调配的服务,并将服务状态和所启动服务的位置信息发送给管理者;
管理者为劳动者调配服务,如有劳动者启动虚拟机启动/停止,有劳动者启动虚拟机的分配等,同时管理者向劳动者定时发送服务请求响应信息,劳动者在启动相应的服务后,响应所述服务请求响应信息将此时的服务状态和服务所启动的位置发动给管理者,这样管理者就可以得到服务的状态和服务对应的物理机。
S3、管理者接收并更新所述服务状态和启动服务的位置信息,监视劳动者的运行状态;
若所述劳动者出现宕机,管理者接收到连接断开或连接没有响应的服务状态,则将宕机服务者运行的服务调配到其他劳动者上;
若所述管理者出现宕机,劳动者发现没有管理者信息,则一个劳动者自动转变为管理者,并把自身服务调配到其他劳动者上。可见分布式服务完成了对所有服务的调配和监视,实现了分布式服务避免了平台的单点失败。
具体的实施:
Ovirt虚拟化管理平台中所有物理机都启动一个分布式服务,分布式服务把所有的物理机分为管理者和劳动者两种角色,管理者为序号最小的物理机,其余物理机都为劳动者。
管理者负责调配平台管理节点的服务在劳动者上启动,而且会定时(如间隔1秒)发送简单的服务请求响应信息(如”Hello”消息)给劳动者,以保证连接可用性,也就是连接的心跳检测动作,来监视劳动者的运行状态;劳动者听从管理者的命令,启动相应的服务,并响应所述服务请求响应,向管理者汇报服务状态和服务所启动的位置,此时平台工作如图2所示:
图2中整个管理平台有n台物理机(物理计算机),每台物理机间通过物理网络进行连接,编号分别为1到n,每台物理机都启动分布式服务并且部署管理平台的1到n个服务,分布式服务保存着所有物理机的编号和对应地址信息,选取序号最小的物理机1作为管理者,调配其他劳动者启动相应服务并监控这些服务的状态;其他物理机2到n作为劳动者,负责接收管理者的调配并启动相应的服务,并向管理者发送已经启动的服务状态。这里物理机2启动服务1,物理机3启动服务2等。
所述平台内,如果物理机4出现宕机,则管理者会会收到连接断开或连接没有响应的服务状态,马上发现物理机4宕机,管理者在没有宕机的物理机中选择一个物理机n提供宕机物理机上的服务3,这就实现了服务的自动转移,如图3所示。
如果管理者出现宕机,则其他劳动者接收不到服务请求响应信息,发现没有连接的管理者,则序号最小的物理机2自动从劳动者角色变为管理者角色,具体的为:
每个劳动者从最小编号开始逐次检查机器状态(如利用ping);如果发现比自己小的最小编号,则把它作为管理者进行尝试连接;如果发现自己就是编号最小的物理机,则把自己作为管理者,并等待劳动者的连接,并把自身运行的服务1调配到劳动者物理机3上去。这样既能保证管理者的唯一性,也能保证管理者的可知性。此时平台工作如图4所示。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
Claims (4)
1.一种避免Ovirt虚拟化管理平台单点失效的方法,其特征在于,该方法包括:
S1、将平台管理节点的所有服务部署在所述平台的每个物理机上,每个物理机启动分布式服务;
S2、所述分布式服务选取所述平台中一个物理机作为管理者,其他物理机作为劳动者,管理者为劳动者调配服务,劳动者启动所述调配的服务,并将服务状态和服务的启动位置发送给管理者;
S3、管理者接收并更新所述服务状态和所述服务的启动位置信息,监视劳动者的运行状态;
若所述劳动者出现宕机,管理者接收到连接断开或连接没有响应的服务状态,则将宕机劳动者上运行的服务调配到其他劳动者上;
若所述管理者出现宕机,劳动者发现没有管理者的连接信息,则一个劳动者自动转变为管理者,并把自身服务调配到其他劳动者上。
2.如权利要求1所述方法,其特征在于,所述劳动者发送服务状态给管理者进一步包括:管理者向劳动者定时发送服务请求响应信息,劳动者响应所述服务请求响应信息,将本机服务状态发送给管理者。
3.如权利要求1所述方法,其特征在于,对所述平台的每个物理机进行编号,所述分布式服务保存物理机的编号和对应地址信息,选取序号最小的物理机作为管理者,若管理者出现宕机,则没有宕机的物理机中序号最小的物理机自动转变为管理者。
4.如权利要求3所述方法,其特征在于,所述管理者出现宕机,则没有宕机的物理机中序号最小的物理机自动转变为管理者具体包括:
劳动者发现没有管理者的连接信息,则从最小编号开始逐次检查机器状态;如果发现比自己小的最小编号,则把它作为管理者进行尝试连接;如果发现本机是编号最小的物理机,则把自己作为管理者,并等待劳动者的连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310076879.3A CN103152420B (zh) | 2013-03-11 | 2013-03-11 | 一种避免Ovirt虚拟管理平台单点失效的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310076879.3A CN103152420B (zh) | 2013-03-11 | 2013-03-11 | 一种避免Ovirt虚拟管理平台单点失效的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103152420A true CN103152420A (zh) | 2013-06-12 |
CN103152420B CN103152420B (zh) | 2016-03-02 |
Family
ID=48550279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310076879.3A Expired - Fee Related CN103152420B (zh) | 2013-03-11 | 2013-03-11 | 一种避免Ovirt虚拟管理平台单点失效的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103152420B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105208090A (zh) * | 2015-08-19 | 2015-12-30 | 江苏农牧人电子商务股份有限公司 | 一种基于Zookeeper实现Leader选举的方法 |
CN106445684A (zh) * | 2016-09-14 | 2017-02-22 | 郑州云海信息技术有限公司 | 一种服务部署方法及装置 |
CN106776650A (zh) * | 2015-11-24 | 2017-05-31 | 北大方正集团有限公司 | 数据抓取方法和装置 |
CN106972970A (zh) * | 2017-03-31 | 2017-07-21 | 山东超越数控电子有限公司 | 一种避免oVirt云平台管理节点单点故障的方法 |
CN111935244A (zh) * | 2020-07-20 | 2020-11-13 | 江苏安超云软件有限公司 | 一种业务请求处理系统及超融合一体机 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101247273A (zh) * | 2008-02-27 | 2008-08-20 | 北京航空航天大学 | 分布式环境下服务协同节点组织结构的维护方法 |
CN101594386A (zh) * | 2009-06-29 | 2009-12-02 | 北京航空航天大学 | 基于分布式策略验证的可信虚拟组织构建方法及装置 |
CN102325196A (zh) * | 2011-10-27 | 2012-01-18 | 上海文广互动电视有限公司 | 分布式集群存储系统 |
CN102521044A (zh) * | 2011-12-30 | 2012-06-27 | 北京拓明科技有限公司 | 一种基于消息中间件的分布式任务调度方法及系统 |
US20120278817A1 (en) * | 2011-04-26 | 2012-11-01 | Oracle International Corporation | Event distribution pattern for use with a distributed data grid |
CN102902594A (zh) * | 2012-09-28 | 2013-01-30 | 用友软件股份有限公司 | 资源管理系统和资源管理方法 |
-
2013
- 2013-03-11 CN CN201310076879.3A patent/CN103152420B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101247273A (zh) * | 2008-02-27 | 2008-08-20 | 北京航空航天大学 | 分布式环境下服务协同节点组织结构的维护方法 |
CN101594386A (zh) * | 2009-06-29 | 2009-12-02 | 北京航空航天大学 | 基于分布式策略验证的可信虚拟组织构建方法及装置 |
US20120278817A1 (en) * | 2011-04-26 | 2012-11-01 | Oracle International Corporation | Event distribution pattern for use with a distributed data grid |
CN102325196A (zh) * | 2011-10-27 | 2012-01-18 | 上海文广互动电视有限公司 | 分布式集群存储系统 |
CN102521044A (zh) * | 2011-12-30 | 2012-06-27 | 北京拓明科技有限公司 | 一种基于消息中间件的分布式任务调度方法及系统 |
CN102902594A (zh) * | 2012-09-28 | 2013-01-30 | 用友软件股份有限公司 | 资源管理系统和资源管理方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105208090A (zh) * | 2015-08-19 | 2015-12-30 | 江苏农牧人电子商务股份有限公司 | 一种基于Zookeeper实现Leader选举的方法 |
CN106776650A (zh) * | 2015-11-24 | 2017-05-31 | 北大方正集团有限公司 | 数据抓取方法和装置 |
CN106445684A (zh) * | 2016-09-14 | 2017-02-22 | 郑州云海信息技术有限公司 | 一种服务部署方法及装置 |
CN106972970A (zh) * | 2017-03-31 | 2017-07-21 | 山东超越数控电子有限公司 | 一种避免oVirt云平台管理节点单点故障的方法 |
CN111935244A (zh) * | 2020-07-20 | 2020-11-13 | 江苏安超云软件有限公司 | 一种业务请求处理系统及超融合一体机 |
Also Published As
Publication number | Publication date |
---|---|
CN103152420B (zh) | 2016-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10601728B2 (en) | Software-defined data center and service cluster scheduling and traffic monitoring method therefor | |
US11734138B2 (en) | Hot standby method, apparatus, and system | |
CN103583063B (zh) | 用于地理冗余网关处的故障恢复的系统和方法 | |
CN108632067B (zh) | 容灾部署方法、装置及系统 | |
US20150142958A1 (en) | Control node and communication control method | |
JPWO2015146355A1 (ja) | 更新管理システムおよび更新管理方法 | |
CN105897827A (zh) | 服务器节点、局域网服务器集群及其实现方法 | |
EP3806395B1 (en) | Virtual network function (vnf) deployment method and apparatus | |
CN103152420A (zh) | 一种避免Ovirt虚拟管理平台单点失效的方法 | |
CN106302569B (zh) | 处理虚拟机集群的方法和计算机系统 | |
CN112202918B (zh) | 长连接通信的负载调度方法、装置、设备及存储介质 | |
CN104092774A (zh) | 软件定义网络连接建立控制方法及装置 | |
WO2017114124A1 (zh) | 一种地址分配的方法、网关及系统 | |
CN109245926A (zh) | 智能网卡、智能网卡系统及控制方法 | |
CN104539558A (zh) | 可扩容ip电话交换机刀片机构架及自动扩容方法 | |
CN103401954B (zh) | 虚拟dhcp的实现方法 | |
CN104935614B (zh) | 一种数据传输方法及装置 | |
CN103428269A (zh) | 一种分布式环境下的资源快速部署方法 | |
WO2016145653A1 (zh) | 基于网络功能虚拟化的故障处理方法及设备 | |
CN100423514C (zh) | 分布式设备中地址解析协议数据同步的方法 | |
CN107769973B (zh) | 一种报文转发方法及装置 | |
EP3435615B1 (en) | Network service implementation method, service controller, and communication system | |
CN106302626A (zh) | 一种弹性扩容方法、装置及系统 | |
CN110971872B (zh) | 一种基于分布式集群的视频图像信息采集方法 | |
CN104158681B (zh) | Sdn网络中区域控制器失效的处理方法和处理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
PP01 | Preservation of patent right |
Effective date of registration: 20180823 Granted publication date: 20160302 |
|
PP01 | Preservation of patent right | ||
PD01 | Discharge of preservation of patent |
Date of cancellation: 20210823 Granted publication date: 20160302 |
|
PD01 | Discharge of preservation of patent | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160302 Termination date: 20190311 |
|
CF01 | Termination of patent right due to non-payment of annual fee |