CN110545203A - 云平台创建初始资源备份池和云平台自愈修复的方法 - Google Patents

云平台创建初始资源备份池和云平台自愈修复的方法 Download PDF

Info

Publication number
CN110545203A
CN110545203A CN201910772465.1A CN201910772465A CN110545203A CN 110545203 A CN110545203 A CN 110545203A CN 201910772465 A CN201910772465 A CN 201910772465A CN 110545203 A CN110545203 A CN 110545203A
Authority
CN
China
Prior art keywords
cloud platform
cloud
image file
initial
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910772465.1A
Other languages
English (en)
Other versions
CN110545203B (zh
Inventor
吴春明
陈双喜
张帆
张兴明
张汝云
邱启仓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhijiang Laboratory
Zhejiang Lab
Original Assignee
Zhijiang Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhijiang Laboratory filed Critical Zhijiang Laboratory
Priority to CN201910772465.1A priority Critical patent/CN110545203B/zh
Publication of CN110545203A publication Critical patent/CN110545203A/zh
Application granted granted Critical
Publication of CN110545203B publication Critical patent/CN110545203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明公开了一种云平台创建初始资源备份池和云平台自愈修复的方法,该方法创建了云平台初始资源备份池,当云平台出现崩溃或故障时,利用云平台自愈修复方法恢复异常云平台的业务数据,使得云平台能够继续执行业务操作。本发明的初始资源备份池的构建方法,不用实时采集云平台的镜像文件,容错系统表征错误恢复作为前滚或回滚;或在每个主进程的不同系统上执行备份进程,如果主进程失败,备份进程可以从上一个检查点实时启动;当云平台崩溃或出现故障时,将云上业务实时迁移至异构云平台中,异常云平台下线自愈修复,重新同步过程数据和要素资源,实时自愈修复,满足高性能业务需求。

Description

云平台创建初始资源备份池和云平台自愈修复的方法
技术领域
本发明属于云计算技术领域,尤其涉及一种云平台创建初始资源备份池和云平台自愈修复的方法。
背景技术
云计算技术将传统IT架构中的存储资源和计算资源逻辑化,其平台自身的冗余性特征,避免单点失效,增强了目标系统的鲁棒性。传统云平台架构上虚拟云主机间的同质性仍然无法避免冗余组件共同脆弱点引发的共模和同态故障。
云中涉及的节点(服务器)数以万计甚至更多,增加了故障的概率和成本。为了避免云中的崩溃和故障,已经在云上提出并实现了检查点机制。然而,显著的开销与检查点策略的应用相关联,它在性能方面可能是昂贵的。在云上虚拟化环境下,检查点策略变得更具挑战性,因为巨大的虚拟机图像需要保存和恢复。
当前,云安全产品和方案大致分为:代理方案、无代理方案和NFV方案,分别从云平台的虚拟主机、服务器和网络等不同层面进行防护。
上述业界主流云安全产品方案主要存在两个方面的缺陷:首先,云安全解决方案存在应用场景的适应性问题,不适当的部署可能导致服务器计算性能大幅下降等隐患;其次,无法避免由于云平台自身漏洞导致云计算环境被劫持或者信息泄漏。因此,对云平台的细粒度保护有待进一步完善。
发明内容
本发明的目的在于针对现有技术的不足,提供一种云平台创建初始资源备份池和云平台自愈修复的方法。
本发明的目的是通过以下技术方案来实现的:一种云平台创建初始资源备份池和云平台自愈修复的方法,包括以下步骤:
(1)构建Ceph作为异构云集群的后端统一存储系统,云主机的每个磁盘均对应一个关系数据库对象;
(2)初始创建云平台时,通过云平台后端的快照功能生成虚拟机快照,创建初始云平台镜像文件,该镜像文件携带所属云平台标识;
(3)采用完整性度量策略,对步骤(2)生成的所有云平台镜像文件进行完整性度量;
(4)当接收到镜像文件上传请求时,根据存储路径,将步骤(3)中进行过完整性度量的云平台镜像文件存储至步骤(1)构建的后端统一存储系统对应位置,构成拟态云集群初始资源备份池;丢弃完整性度量失效的镜像文件;
(5)开启故障检测,当云平台崩溃或出现故障时,将业务从物理主机上迁出,采用实时热迁移策略选择搭建异构云平台的物理主机实施迁出,实时迁移业务至异构云平台中;
(6)从步骤(4)存储至初始资源备份池的云平台镜像文件中的镜像参数信息,找到异常云平台的初始云平台镜像文件,恢复该云平台的初始状态数据,使其重新上线执行业务;
(7)步骤(6)中重新上线的云平台向所在云集群中的任一同构云平台发送同步请求,再由该同构云平台发送同步请求反馈,进行云平台数据和业务的同步;重新上线的云平台根据同步请求反馈生成同步信息,恢复业务数据。
本发明的有益效果是:本发明的初始资源备份池的构建方法,不用实时采集云平台的镜像文件,容错系统表征错误恢复作为前滚或回滚;或在每个主进程的不同系统上执行备份进程,如果主进程失败,备份进程可以从上一个检查点实时启动;本发明提出的云平台自愈修复方法,采集云平台初始镜像文件,当云平台崩溃或出现故障时,将云上业务实时迁移至异构云平台中,异常云平台下线自愈修复,重新同步过程数据和要素资源,实时自愈修复,满足高性能业务需求。
附图说明
图1为本发明实施例中的系统模型示意图;
图2为本发明方法的流程图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,以下将结合附图并举实施例对本发明做进一步详细说明。
基于邬江兴院士团队提出的基于动态异构冗余技术的“网络空间拟态防御”,本发明以拟态架构设计为基础,通过构建OpenStack和CloudStack两个异构云集群的解决思路,构造云架构的内生安全机制,体系化地解决云平台自身的安全问题,并提供一种云平台有效的自愈修复方法。
第一方面,本发明提供了一种云平台创建初始资源备份池的方法,所述方法应用于拟态云平台构造之初,所述方法包括:
接收云集群初始要素资源获取请求,确定并发送对应的镜像文件标识和镜像文件存储路径,以使包含所属镜像文件标识和镜像文件存储路径的镜像参数信息被发送至镜像生成服务,触发所述服务根据所述镜像参数信息创建镜像。将云集群中所有经过完整性验证的初始云镜像划分至初始资源备份池中。
第二方面,本发明提供了一种云平台自愈修复的方法,所述方法应用于检测出异常云平台情况下,所述方法包括:
当云平台发生故障时,将业务迁移至异构云平台上,保证业务不间断运行。同时,根据异常云平台标识和镜像文件存储路径,在初始资源备份池中根据镜像参数信息找到初始镜像文件,恢复云平台初始状态数据,重新上线执行业务。
在上述方案的基础上,所述已完成自愈的云平台重新上线,根据随机选择算法选择所在云集群中任一云平台进行过程数据和要素资源的同步,恢复业务数据。
实施例
如图1所示,在不同的物理主机上构造异构云集群,所述云集群共享统一存储系统,由控制器调度业务过程。本实施例所提供的云平台创建初始资源备份池和云平台自愈修复方法的方法应用于图1所示的场景上。初始创建云平台时,通过云平台后端生成镜像服务完成镜像创建,并将进行过完整性验证的云镜像文件放置在初始备份池中,其内容主要包含了云平台初始的静态要素资源,如日志文件、配置文件等。
参见图2所示的实施例提供的一种云平台自愈修复的方法流程图,所述方法包括如下步骤:
步骤S1,构建Ceph作为异构云集群的后端统一存储系统,云主机的每个磁盘均对应一个关系数据库(Relational Database,RDB)对象;初始创建云平台时,通过云平台后端的快照功能生成虚拟机快照,根据云集群初始要素资源,创建初始云平台镜像文件,该镜像文件携带所属云平台标识;
步骤S2,对所有云平台镜像文件进行完整性度量。采用适合的度量策略对云平台镜像文件进行完整性度量;
步骤S3,将进行过完整性度量的云镜像文件划分至初始资源备份池中。当收到镜像文件上传请求时,该镜像文件上传请求携带有云平台标识和镜像文件,根据存储路径,将云平台镜像文件存储至初始资源备份池;
步骤S4,开启故障检测,当云平台崩溃或出现故障时,实时迁移业务至异构云平台中。云平台崩溃或发生故障会触发物理主机上的业务被迁移。同时,当需要将业务从物理主机上迁出时,采用策略选择合适的搭建异构云平台的物理主机实时迁出,该业务迁移过程使用的是实时热迁移策略;
步骤S5:根据初始资源备份池中镜像参数信息找到异常云平台的初始镜像文件,恢复云平台初始状态数据,重新上线执行业务。根据镜像文件参数信息找出所述异常云平台初始镜像文件作为备份恢复;
步骤S6:选择所在云集群中任一同构云平台进行过程数据和要素资源的同步,恢复业务数据。重新上线的云平台向所在云集群中的任一同构云平台发送同步请求,所述同构云平台发送同步请求反馈,原云平台根据同步请求反馈生成同步信息。
最后应说明的是:本领域的技术人员可以对本发明实施例进行各种修改和变型,倘若这些修改和变型在本发明权利要求及其等同技术的范围之内,则这些修改和变型也在本发明的保护范围之内。
说明书中未详细描述的内容为本领域技术人员公知的现有技术。

Claims (1)

1.一种云平台创建初始资源备份池和云平台自愈修复的方法,其特征在于,包括以下步骤:
(1)构建Ceph作为异构云集群的后端统一存储系统,云主机的每个磁盘均对应一个关系数据库对象。
(2)初始创建云平台时,通过云平台后端的快照功能生成虚拟机快照,创建初始云平台镜像文件,该镜像文件携带所属云平台标识。
(3)采用完整性度量策略,对步骤(2)生成的所有云平台镜像文件进行完整性度量。
(4)当接收到镜像文件上传请求时,根据存储路径,将步骤(3)中进行过完整性度量的云平台镜像文件存储至步骤(1)构建的后端统一存储系统对应位置,构成拟态云集群初始资源备份池;丢弃完整性度量失效的镜像文件;
(5)开启故障检测,当云平台崩溃或出现故障时,将业务从物理主机上迁出,采用实时热迁移策略选择搭建异构云平台的物理主机实施迁出,实时迁移业务至异构云平台中;
(6)从步骤(4)存储至初始资源备份池的云平台镜像文件中的镜像参数信息,找到异常云平台的初始云平台镜像文件,恢复该云平台的初始状态数据,使其重新上线执行业务;
(7)步骤(6)中重新上线的云平台向所在云集群中的任一同构云平台发送同步请求,再由该同构云平台发送同步请求反馈,进行云平台数据和业务的同步;重新上线的云平台根据同步请求反馈生成同步信息,恢复业务数据。
CN201910772465.1A 2019-08-21 2019-08-21 云平台创建初始资源备份池和云平台自愈修复的方法 Active CN110545203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910772465.1A CN110545203B (zh) 2019-08-21 2019-08-21 云平台创建初始资源备份池和云平台自愈修复的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910772465.1A CN110545203B (zh) 2019-08-21 2019-08-21 云平台创建初始资源备份池和云平台自愈修复的方法

Publications (2)

Publication Number Publication Date
CN110545203A true CN110545203A (zh) 2019-12-06
CN110545203B CN110545203B (zh) 2022-03-01

Family

ID=68712054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910772465.1A Active CN110545203B (zh) 2019-08-21 2019-08-21 云平台创建初始资源备份池和云平台自愈修复的方法

Country Status (1)

Country Link
CN (1) CN110545203B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111083160A (zh) * 2019-12-27 2020-04-28 杭州迪普科技股份有限公司 资源信息恢复方法及装置
CN113064699A (zh) * 2021-04-09 2021-07-02 上海安畅网络科技股份有限公司 一种异构云不停服务的迁移方法、装置、设备及存储介质
CN116389233A (zh) * 2023-02-28 2023-07-04 港珠澳大桥管理局 容器云管理平台主备切换系统、方法、装置和计算机设备
CN117614973A (zh) * 2024-01-24 2024-02-27 点击律(上海)网络科技有限公司 一种基于多云架构的文件存储方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008026823A1 (en) * 2006-08-30 2008-03-06 Nhn Corporation Method and apparatus for synchronizing contents
CN103488546A (zh) * 2013-01-29 2014-01-01 中国人民解放军理工大学 一种支持多级别数据和数据库在线并发备份与恢复方法
US20160147614A1 (en) * 2014-11-25 2016-05-26 Kaushal MITTAL Synchronized Backup and Recovery of Database Systems
CN108512908A (zh) * 2018-03-13 2018-09-07 山东超越数控电子股份有限公司 一种基于Ceph的云存储容错机制和基于Ceph的web管理平台

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008026823A1 (en) * 2006-08-30 2008-03-06 Nhn Corporation Method and apparatus for synchronizing contents
CN103488546A (zh) * 2013-01-29 2014-01-01 中国人民解放军理工大学 一种支持多级别数据和数据库在线并发备份与恢复方法
US20160147614A1 (en) * 2014-11-25 2016-05-26 Kaushal MITTAL Synchronized Backup and Recovery of Database Systems
CN108512908A (zh) * 2018-03-13 2018-09-07 山东超越数控电子股份有限公司 一种基于Ceph的云存储容错机制和基于Ceph的web管理平台

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111083160A (zh) * 2019-12-27 2020-04-28 杭州迪普科技股份有限公司 资源信息恢复方法及装置
CN113064699A (zh) * 2021-04-09 2021-07-02 上海安畅网络科技股份有限公司 一种异构云不停服务的迁移方法、装置、设备及存储介质
CN113064699B (zh) * 2021-04-09 2022-12-13 上海安畅网络科技股份有限公司 一种异构云不停服务的迁移方法、装置、设备及存储介质
CN116389233A (zh) * 2023-02-28 2023-07-04 港珠澳大桥管理局 容器云管理平台主备切换系统、方法、装置和计算机设备
CN116389233B (zh) * 2023-02-28 2024-05-28 港珠澳大桥管理局 容器云管理平台主备切换系统、方法、装置和计算机设备
CN117614973A (zh) * 2024-01-24 2024-02-27 点击律(上海)网络科技有限公司 一种基于多云架构的文件存储方法
CN117614973B (zh) * 2024-01-24 2024-03-26 点击律(上海)网络科技有限公司 一种基于多云架构的文件存储方法

Also Published As

Publication number Publication date
CN110545203B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN110545203B (zh) 云平台创建初始资源备份池和云平台自愈修复的方法
US10552064B2 (en) Enabling data integrity checking and faster application recovery in synchronous replicated datasets
US8984330B2 (en) Fault-tolerant replication architecture
US8301600B1 (en) Failover recovery in a distributed data store
US7895501B2 (en) Method for auditing data integrity in a high availability database
CN106776130B (zh) 一种日志恢复方法、存储装置和存储节点
US10565071B2 (en) Smart data replication recoverer
US10469574B1 (en) Incremental container state persistency and replication for containerized stateful applications
US8839031B2 (en) Data consistency between virtual machines
CN106062717A (zh) 一种分布式存储复制系统和方法
CN106339278A (zh) 一种网络文件系统的数据备份及恢复方法
JP2007115007A (ja) ストレージ装置のリストア方法及びストレージ装置
CN103077242A (zh) 一种实现数据库服务器双机热备的方法
CN112698926B (zh) 数据处理方法、装置、设备、存储介质及系统
CN105988894A (zh) 一种双活模式的容灾技术
CN105740049B (zh) 一种控制方法及装置
CN105389231A (zh) 一种数据库双机备份方法及系统
US7478275B1 (en) Method and apparatus for performing backup storage of checkpoint data within a server cluster
CN105323271B (zh) 一种云计算系统以及云计算系统的处理方法和装置
CN111404737B (zh) 一种容灾处理方法以及相关装置
CN116389233B (zh) 容器云管理平台主备切换系统、方法、装置和计算机设备
CN103780433B (zh) 自愈式虚拟资源配置管理数据架构
CN115328931A (zh) 数据库集群数据校验方法、装置、存储介质及电子设备
CN115202917A (zh) 一种用于虚拟化平台下的分布式集群容错恢复方法及系统
CN113297134B (zh) 数据处理系统及数据处理方法、装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant