CN105262640A - 一种提升云平台服务器可靠性的系统、方法及其部署框架 - Google Patents

一种提升云平台服务器可靠性的系统、方法及其部署框架 Download PDF

Info

Publication number
CN105262640A
CN105262640A CN201510595540.3A CN201510595540A CN105262640A CN 105262640 A CN105262640 A CN 105262640A CN 201510595540 A CN201510595540 A CN 201510595540A CN 105262640 A CN105262640 A CN 105262640A
Authority
CN
China
Prior art keywords
attribute
physical node
physical
data
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510595540.3A
Other languages
English (en)
Inventor
王智民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING OPZOON TECHNOLOGY Co Ltd
Opzoon Technology Co Ltd
Original Assignee
BEIJING OPZOON TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING OPZOON TECHNOLOGY Co Ltd filed Critical BEIJING OPZOON TECHNOLOGY Co Ltd
Priority to CN201510595540.3A priority Critical patent/CN105262640A/zh
Publication of CN105262640A publication Critical patent/CN105262640A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种提升云平台服务器可靠性的系统、方法及其部署框架,用于集群系统,所述系统包括:热迁移模块,用于迁移集群系统中所有物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性。监控模块用于监控集群系统中所有所述物理节点的运行状态。本发明通过热迁移集群系统中所有物理节点的各种属性,利用监控模块对集群系统中所有物理节点进行监控,从而确保某台物理节点宕机后,虚机能够迁移到别的物理节点上继续运行,通过该接替物理节点完成该故障物理节点的职能,进而提升云平台服务器的可靠性和稳定性。

Description

一种提升云平台服务器可靠性的系统、方法及其部署框架
技术领域
本发明涉及云技术领域,特别涉及一种提升云平台服务器可靠性的系统、方法及其部署框架。
背景技术
随着信息技术的发展,云的应用越来越广泛,客户对云的需求也在不断增长,随之而来,云平台中的虚拟机数量在不断增长,云平台中存储的数据也极速增加,因此,需要云平台保持良好的稳定性才能为客户提供优质的服务。
现有技术中,在提升云平台服务器可靠性时,通常采用分布式部署和虚拟机热备份技术,这两种方式可以提高云平台的可靠性及稳定性,但虚拟机热备份技术本身会占用大量的存储空间,即消耗大量的云服务设备、存储设备等,进而带来云平台成本的上升。
有鉴于此,有必要提出一种新的提升云平台服务器可靠性的方法,在保证云平台服务器可靠性和稳定性的同时,不增加甚至是降低设备成本。
发明内容
本发明的目的是提供一种提升云平台服务器可靠性的系统、方法及其部署框架,本发明通过热迁移集群系统中所有物理节点的各种属性,利用监控模块对集群系统中所有物理节点进行监控,从而确保某台物理节点宕机后,虚机能够迁移到别的物理节点上继续运行,通过该接替物理节点完成该故障物理节点的职能,进而提升云平台服务器的可靠性和稳定性。
为实现上述目的,本发明的一个方面提供了一种提升云平台服务器可靠性的系统,用于集群系统,每个所述物理节点包括:热迁移模块,用于迁移集群系统中所有物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性。监控模块,用于监控集群系统中所有所述物理节点的运行状态。
其中,所述虚机属性包括虚机配置、来宾操作系统、应用程序、网络接口、IP地址、应用在该虚机上的安全策略。
其中,所述数据属性包括静态数据;所述静态数据是保存在本地存储介质中的数据。
其中,所述存储属性包括本地存储介质属性、存储网络属性和存储方式;其中,所述存储方式包括:分布式存储和网络共享式存储。
其中,所述网络属性包括物理网卡属性和IP地址。
其中,所述安全策略属性包括安全防护策略和物理监控策略。
根据本发明的另一方面,提供了一种提升云平台服务器可靠性的方法,用于集群系统,所述方法包括:实时监控集群系统中所有物理节点的运行状态;当监测到任一物理节点发生故障时,从所述集群系统中选择任一运行正常的接替物理节点代替当前故障物理节点继续同一云服务。
其中,所述接替物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性与所述故障物理节点的虚拟属性、数据属性、存储属性、网络属性和安全策略属性相同。
其中,所述虚机属性包括虚机配置、来宾操作系统、应用程序、网络接口、IP地址、应用在该虚机上的安全策略。
其中,所述数据属性包括静态数据;所述静态数据是保存在本地存储介质中的数据。
其中,所述存储属性包括本地存储介质属性、存储网络属性和存储方式;其中,所述存储方式包括:分布式存储和网络共享式存储。
其中,所述网络属性包括物理网卡属性和IP地址。
其中,所述安全策略属性包括安全防护策略和物理监控策略。
根据本发明的又一方面,提供了一种提升云平台服务器可靠性的系统的部署框架,其特征在于,包括多个物理节点;所述多个物理节点组成服务器集群,每个所述物理节点上至少运行一个热迁移模块和一个监控模块,每个所述物理节点采用分布式部署,所有的物理节点通过以太网实现互连。
本发明通过热迁移集群系统中所有物理节点的各种属性,利用监控模块对集群系统中所有物理节点进行监控,从而确保某台物理节点宕机后,虚机能够迁移到别的物理节点上继续运行,通过该接替物理节点完成该故障物理节点的职能,进而提升云平台服务器的可靠性和稳定性。
附图说明
图1是本发明的提升云平台服务器可靠性的系统的结构示意图;
图2是本发明的提升云平台服务器可靠性的方法的流程示意图;
图3是本发明的提升云平台服务器可靠性的系统的部署框架的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
需要说明的是:物理服务器可靠性是指当某台物理服务器宕机后,另外一台物理服务器能够实时的接替其运行,其目的是确保服务器提供的云服务不中断。
图1是本发明的提升云平台服务器可靠性的系统的结构示意图。
如前所述,现有的提升云平台服务器可靠性的方法是通过分布式部署和热备份技术来实现的,由于分布式部署的云平台需要大量的服务器作为支撑,此外热备份技术,需要大量的存储空间和存储设备作为数据存储和备份的支撑,导致现有技术中提升云平台服务器可靠性的方法成本较高,实用性不强。
本发明的提升云平台服务器可靠性的方法采用集群内嵌分布式部署和虚拟机热迁移技术,解决了现有技术中采用热备份技术需要大量存储设备作为支撑的问题。虚拟机热迁移与虚拟机热备份是两个不同级别的热备技术。前者是指在虚拟机不停机的情况下迁移到别的节点上继续运行,后者指两个虚拟机的所有属性和数据都是实时同步的,一旦某个虚拟机宕机,另外一个虚拟机能够无缝的接替发生故障的虚拟机继续运行。在备份的数据上,前者只需要确保两个虚拟机的“属性”相同即可,而后者既需要确保两个虚拟机的“属性”相同,又需要确保两个虚拟机上的操作系统、应用程序、用户数据和应用数据等均相同。
为了确保某台物理节点宕机后,虚拟机能够迁移到别的节点上继续运行,如图1所示,本发明的提升云平台服务器可靠性的系统,用于集群系统,一个集群系统中包括多个物理节点(物理服务器),每个物理节点包括如下组件:
热迁移模块1用于迁移集群系统中所有物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性。
具体来说,热迁移模块1将集群系统中所有物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性进行迁移。举例来说,假设集群系统中包括3个物理节点A、B和C,则每个物理节点中的热迁移模块1将其他所有物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性进行迁移。例如,物理节点A的热迁移模块将物理节点B、C的上述各种属性进行热迁移,物理节点B的热迁移模块将物理节点A、C的上述各种属性进行热迁移,物理节点C的热迁移模块将物理节点A、B的上述各种属性进行热迁移,依次类推,集群系统中的所有物理节点互相进行热迁移。
本发明中,所述虚机属性包括但不限于虚机配置(例如虚机的CPU、内存等等)、来宾操作系统、应用程序、网络接口、IP地址、应用在该虚机上的安全策略等。所述数据属性包括但不限于静态数据;所述静态数据是保存在本地存储介质中的数据(例如硬盘上的数据)。所述存储属性包括但不限于本地存储介质属性、存储网络属性和存储方式等;所述存储方式包括但不限于分布式存储和网络共享式存储等。所述网络属性包括但不限于物理网卡属性和IP地址等。所述安全策略属性包括但不限于安全防护策略和物理监控策略。
这里,对于物理节点的可靠性来说,只需要热迁移静态数据即可,对于动态数据可以不做热迁移,动态数据是当前物理节点的内存中处于运行状态的数据。在进行热迁移时,需要考虑目标节点的存储介质,优先迁移到存储介质相同的物理节点上,如果没有满足该条件的节点时,则迁移到存储介质相似的节点上。例如,IDE硬盘会优先迁移到IDE硬盘上,如果没有,则迁移到SCSI硬盘上。
监控模块2与所述热迁移模块1连接,用于监控集群系统中所有所述物理节点的运行状态。
具体来说,监控模块实时监控集群系统中所有物理节点的运行状态,一旦监测到某个物理节点发生故障(或宕机),则从该集群系统中选择任意运行正常的接替物理节点代替该当前故障物理节点继续提供同一云服务。
图2是本发明的提升云平台服务器可靠性的方法的流程示意图。
如图2所示,所述提升云平台服务器可靠性的方法包括:
步骤S1,实时监控集群系统中所有物理节点的运行状态。
具体来说,实时监控集群系统中所有物理节点的运行状态。
步骤S2,当监测到任一物理节点发生故障时,从所述集群系统中选择任一运行正常的接替物理节点代替当前故障物理节点继续运行。
具体的,当监测到任一物理节点发生故障时,从所述集群系统中选择任一运行正常的接替物理节点代替当前故障物理节点继续提供同一云服务。
其中,所述接替物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性与所述故障物理节点的虚拟属性、数据属性、存储属性、网络属性和安全策略属性相同。
本发明中,所述虚机属性包括但不限于虚机配置(例如虚机的CPU、内存等等)、来宾操作系统、应用程序、网络接口、IP地址、应用在该虚机上的安全策略等。所述数据属性包括但不限于静态数据和动态数据等;所述静态数据是保存在本地存储介质中的数据(例如硬盘上的数据);所述动态数据是当前物理节点的内存中处于运行状态的数据。所述存储属性包括但不限于本地存储介质属性、存储网络属性和存储方式等;所述存储方式包括但不限于分布式存储和网络共享式存储等。所述网络属性包括但不限于物理网卡属性和IP地址。所述安全策略属性包括安全防护策略和物理监控策略等。
图3是本发明的提升云平台服务器可靠性的系统的部署框架的示意图。
如图3所示,所述提升云平台服务器可靠性的系统的部署框架,包括:多个物理节点10。
所述多个物理节点10组成服务器集群,每个所述物理节点上至少运行一个热迁移模块1和一个监控模块2,每个所述物理节点10采用分布式部署,所有的物理节点10通过以太网实现互连。
如上所述,本发明的提升云平台服务器可靠性的系统、方法及其部署框架,本发明通过热迁移集群系统中所有物理节点的各种属性,利用监控模块对集群系统中所有物理节点进行监控,从而确保某台物理节点宕机后,虚机能够迁移到别的物理节点上继续运行,通过该接替物理节点完成该故障物理节点的职能,进而提升云平台服务器的可靠性和稳定性。
此外,本发明利用热迁移技术迁移集群系统中的重要数据,这样能够确保用户的正常使用,尤其是对安全策略的热迁移,目前现有技术中尚未提出。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (14)

1.一种提升云平台服务器可靠性的系统,用于集群系统,该集群系统包括多个物理节点,每个所述物理节点包括:
热迁移模块(1),用于迁移集群系统中所有物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性;
监控模块(2),用于监控集群系统中所有所述物理节点的运行状态。
2.根据权利要求1所述的系统,其特征在于,所述虚机属性包括虚机配置、来宾操作系统、应用程序、网络接口、IP地址、应用在该虚机上的安全策略。
3.根据权利要求1或2所述的系统,其特征在于,所述数据属性包括静态数据;
所述静态数据是保存在本地存储介质中的数据。
4.根据权利要求1或2所述的系统,其特征在于,所述存储属性包括本地存储介质属性、存储网络属性和存储方式;其中,
所述存储方式包括:分布式存储和网络共享式存储。
5.根据权利要求1或2所述的系统,其特征在于,所述网络属性包括物理网卡属性和IP地址。
6.根据权利要求1或2所述的系统,其特征在于,所述安全策略属性包括安全防护策略和物理监控策略。
7.一种提升云平台服务器可靠性的方法,用于集群系统,该集群系统包括多个物理节点,所述方法包括:
实时监控集群系统中所有物理节点的运行状态;
当监测到任一物理节点发生故障时,从所述集群系统中选择任一运行正常的接替物理节点代替当前故障物理节点继续提供同一云服务。
8.根据权利要求7所述的方法,其特征在于,所述接替物理节点的虚机属性、数据属性、存储属性、网络属性和安全策略属性与所述故障物理节点的虚拟属性、数据属性、存储属性、网络属性和安全策略属性相同。
9.根据权利要求7或8所述的方法,其特征在于,所述虚机属性包括虚机配置、来宾操作系统、应用程序、网络接口、IP地址、应用在该虚机上的安全策略。
10.根据权利要求7或8所述的方法,其特征在于,所述数据属性包括静态数据;
所述静态数据是保存在本地存储介质中的数据。
11.根据权利要求7或8所述的方法,其特征在于,所述存储属性包括本地存储介质属性、存储网络属性和存储方式;其中,
所述存储方式包括:分布式存储和网络共享式存储。
12.根据权利要求7或8所述的方法,其特征在于,所述网络属性包括物理网卡属性和IP地址。
13.根据权利要求7或8所述的方法,其特征在于,所述安全策略属性包括安全防护策略和物理监控策略。
14.一种提升云平台服务器可靠性的系统的部署框架,其特征在于,包括多个物理节点(10);
所述多个物理节点(10)组成服务器集群,每个所述物理节点(10)上至少运行一个热迁移模块(1)和一个监控模块(2),每个所述物理节点(10)采用分布式部署,所有的物理节点(10)通过以太网实现互连。
CN201510595540.3A 2015-09-17 2015-09-17 一种提升云平台服务器可靠性的系统、方法及其部署框架 Pending CN105262640A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510595540.3A CN105262640A (zh) 2015-09-17 2015-09-17 一种提升云平台服务器可靠性的系统、方法及其部署框架

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510595540.3A CN105262640A (zh) 2015-09-17 2015-09-17 一种提升云平台服务器可靠性的系统、方法及其部署框架

Publications (1)

Publication Number Publication Date
CN105262640A true CN105262640A (zh) 2016-01-20

Family

ID=55102157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510595540.3A Pending CN105262640A (zh) 2015-09-17 2015-09-17 一种提升云平台服务器可靠性的系统、方法及其部署框架

Country Status (1)

Country Link
CN (1) CN105262640A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110071834A (zh) * 2019-04-25 2019-07-30 新华三技术有限公司 一种云管理平台切换方法和装置
CN110633182A (zh) * 2019-07-09 2019-12-31 北京无限光场科技有限公司 用于监控服务器稳定性的系统、方法和装置
CN110780134A (zh) * 2019-10-30 2020-02-11 深圳市国电科技通信有限公司 一种提升工控类数据采集系统可靠性的系统优化方法
CN111371583A (zh) * 2018-12-26 2020-07-03 中兴通讯股份有限公司 服务器的扩容方法及装置、服务器、存储介质
CN112084069A (zh) * 2020-09-21 2020-12-15 西安超越申泰信息科技有限公司 一种基于飞腾平台的虚拟热备系统
CN116506327A (zh) * 2023-06-26 2023-07-28 中航金网(北京)电子商务有限公司 物理节点监测方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876921A (zh) * 2009-04-29 2010-11-03 华为技术有限公司 一种虚拟机迁移决策方法、装置及系统
CN102118458A (zh) * 2011-03-10 2011-07-06 浪潮(北京)电子信息产业有限公司 一种虚拟机热迁移的方法及系统
US20140359616A1 (en) * 2013-05-30 2014-12-04 Fujitsu Limited Virtual machine managing apparatus, method of managing virtual machine, and information processing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101876921A (zh) * 2009-04-29 2010-11-03 华为技术有限公司 一种虚拟机迁移决策方法、装置及系统
CN102118458A (zh) * 2011-03-10 2011-07-06 浪潮(北京)电子信息产业有限公司 一种虚拟机热迁移的方法及系统
US20140359616A1 (en) * 2013-05-30 2014-12-04 Fujitsu Limited Virtual machine managing apparatus, method of managing virtual machine, and information processing system

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111371583A (zh) * 2018-12-26 2020-07-03 中兴通讯股份有限公司 服务器的扩容方法及装置、服务器、存储介质
CN111371583B (zh) * 2018-12-26 2022-09-23 中兴通讯股份有限公司 服务器的扩容方法及装置、服务器、存储介质
CN110071834A (zh) * 2019-04-25 2019-07-30 新华三技术有限公司 一种云管理平台切换方法和装置
CN110071834B (zh) * 2019-04-25 2022-03-29 新华三技术有限公司 一种云管理平台切换方法和装置
CN110633182A (zh) * 2019-07-09 2019-12-31 北京无限光场科技有限公司 用于监控服务器稳定性的系统、方法和装置
CN110633182B (zh) * 2019-07-09 2023-10-27 北京有竹居网络技术有限公司 用于监控服务器稳定性的系统、方法和装置
CN110780134A (zh) * 2019-10-30 2020-02-11 深圳市国电科技通信有限公司 一种提升工控类数据采集系统可靠性的系统优化方法
CN112084069A (zh) * 2020-09-21 2020-12-15 西安超越申泰信息科技有限公司 一种基于飞腾平台的虚拟热备系统
CN116506327A (zh) * 2023-06-26 2023-07-28 中航金网(北京)电子商务有限公司 物理节点监测方法、装置、计算机设备及存储介质
CN116506327B (zh) * 2023-06-26 2023-11-24 中航金网(北京)电子商务有限公司 物理节点监测方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN105262640A (zh) 一种提升云平台服务器可靠性的系统、方法及其部署框架
CN104320401B (zh) 一种基于分布式文件系统的大数据存储访问系统及方法
US11075795B2 (en) Arbitration method, apparatus, and system used in active-active data centers
CN105095317B (zh) 分布式数据库服务管理系统
CN103207841B (zh) 基于键值对缓存的数据读写方法及装置
US20140164329A1 (en) Dynamically Varying the Number of Database Replicas
CN103929500A (zh) 一种分布式存储系统的数据分片方法
US9225586B2 (en) Automatic expansion method, management device, management system
CN103312809A (zh) 云平台中服务的分布式管理方法
CN103763155A (zh) 分布式云存储系统多服务心跳监测方法
CN101187931A (zh) 分布式文件系统多文件副本的管理方法
CN105554106A (zh) 一种memcache分布式缓存系统
CN111176888B (zh) 云存储的容灾方法、装置及系统
CN106326239A (zh) 分布式文件系统及其文件元信息管理方法
CN104679579A (zh) 一种集群系统中的虚拟机迁移方法和装置
CN104580432A (zh) memcached系统及内存缓存数据提供、维护和集群维护方法及装置
WO2019085975A1 (zh) 一种网络拓扑显示方法及网络管理设备
CN104967873A (zh) 流媒体直播调度方法、系统和调度服务器
CN105635311A (zh) 一种云管理平台中资源池信息同步的方法
CN105162824A (zh) 一种云存储系统中主机多路径部署方法和系统
CN104735110A (zh) 元数据管理方法和系统
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
CN104539982A (zh) 一种视频点对点资源共享调度方法、系统及节点终端
CN105468296A (zh) 基于虚拟化平台的无共享存储管理方法
CN105760391B (zh) 数据动态重分布的方法、数据节点、名字节点及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160120