CN115426251A - 一种云主机的容灾方法、装置及介质 - Google Patents
一种云主机的容灾方法、装置及介质 Download PDFInfo
- Publication number
- CN115426251A CN115426251A CN202211050934.7A CN202211050934A CN115426251A CN 115426251 A CN115426251 A CN 115426251A CN 202211050934 A CN202211050934 A CN 202211050934A CN 115426251 A CN115426251 A CN 115426251A
- Authority
- CN
- China
- Prior art keywords
- disaster recovery
- task
- site
- cloud host
- host
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 197
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000004519 manufacturing process Methods 0.000 claims abstract description 60
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 43
- 238000003860 storage Methods 0.000 claims description 37
- 230000005540 biological transmission Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010033307 Overweight Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/101—Server selection for load balancing based on network conditions
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明公开了一种云主机的容灾方法、装置及介质,适用于网络安全领域。包括:获取生产站点的各云主机资源;对各云主机资源进行配置生成对应的容灾任务;根据负载均衡算法将各容灾任务分配至对应的物理主机以便启动对应的容灾任务;将启动的容灾任务对应的差异数据写入至灾备站点以完成云主机的容灾过程。该方法通过负载均衡算法将各容灾任务分配至对应的物理主机,使得容灾任务的运行不受限于某个特定的物理主机,灵活选择运行任务的物理主机,有效利用集群中物理主机的计算资源,通过负载均衡共同实现任务运行的高可用性。
Description
技术领域
本发明涉及网络安全领域,特别是涉及一种云主机的容灾方法、装置及介质。
背景技术
随着虚拟化技术的普及,越来越多的企业将业务部署在大量云主机上,为防范城市级的重大自然灾害,为本地生产中心构建异地灾备中心是一个迫切需要解决的问题。
现有云主机内先设置一个特定的物理主机,将云主机的容灾任务运行至该特定主机,通常情况下特定主机不会变换,直到特定主机宕机后,云主机迁移至另一主机继续执行,导致云主机下的物理主机计算资源无法实现有效利用,灵活性较低。
因此,寻求一种云主机的容灾方法是本领域技术人员亟需要解决的。
发明内容
本发明的目的是提供一种云主机的容灾方法、装置及介质,使得容灾任务的运行不受限于某个特定的物理主机,灵活选择运行任务的物理主机,有效利用集群中物理主机的计算资源,通过负载均衡共同实现任务运行的高可用性。
为解决上述技术问题,本发明提供一种云主机的容灾方法,包括:
获取生产站点的各云主机资源;
对各云主机资源进行配置生成对应的容灾任务;
根据负载均衡算法将各容灾任务分配至对应的物理主机以便启动对应的容灾任务;
将启动的容灾任务对应的差异数据写入至灾备站点以完成云主机的容灾过程。
优选地,在根据负载均衡算法将各容灾任务分配至对应的物理主机之前,还包括:
确定生产站点的物理主机的连通状态;
将连通状态为正常连通的物理主机存储至存储域以便作为待分配物理主机用于承载容灾任务。
优选地,在根据负载均衡算法将各容灾任务分配至对应的物理主机之前,还包括:
确定生产站点的物理主机与灾备站点的物理主机之间的链路状态;
将链路状态为正常连通的生产站点的物理主机存储至存储域中以便作为待分配物理主机。
优选地,将启动的容灾任务对应的差异数据写入至灾备站点,包括:
获取容灾任务的任务运行进度,其中任务运行进度存储在生产站点与灾备站点对应的共享存储区域内;
对生产站点的物理主机与灾备站点的物理主机之间的传输链路进行监控;
当监控到传输链路发生故障时,获取当前任务运行进度,并根据负载均衡算法更换生产站点内的存储域的物理主机;
根据任务运行进度与当前任务运行进度的对应关系确定剩余任务运行进度对应的差异数据;
将更换后的物理主机与灾备站点的物理主机建立链路连接以传输剩余任务运行进度对应的差异数据。
优选地,将启动的容灾任务对应的差异数据写入至灾备站点,包括:
根据容灾任务以及云主机的虚拟磁盘生成定时备份点;
根据生产站点的当前备份点与上一个备份点对应的增量数据确定差异数据;
将差异数据所属的容灾任务存储至任务队列中;
通过网络报文形式将差异数据发送至灾备站点。
优选地,通过网络报文形式将差异数据发送至灾备站点,包括:
将差异数据发送至灾备站点的缓冲区域;
在差异数据未传输至灾备站点的云主机之前,在灾备站点的备份点生成云主机对应的虚拟磁盘以便差异数据存储;
轮询灾备站点的备份点内的差异数据,并同步至灾备站点的云主机。
优选地,通过网络报文形式将差异数据发送至灾备站点,包括:
轮询由生产站点发送的差异数据,并同步至灾备站点的云主机。
优选地,在将启动的容灾任务对应的差异数据写入至灾备站点之后,还包括:
根据灾备站点接收到的差异数据生成对应的备份完成信息;
将备份完成信息发送至生产站点以便下一个备份点的差异数据传输。
为解决上述技术问题,本发明还提供一种云主机的容灾装置,包括:
获取模块,用于获取生产站点的各云主机资源;
配置模块,用于对各云主机资源进行配置生成对应的容灾任务;
分配模块,用于根据负载均衡算法将各容灾任务分配至对应的物理主机以便启动对应的容灾任务;
写入模块,用于将启动的容灾任务对应的差异数据写入至灾备站点以完成云主机的容灾过程。
为解决上述技术问题,本发明还提供一种云主机的容灾装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述云主机的容灾方法的步骤。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述云主机的容灾方法的步骤。
本发明提供的一种云主机的容灾方法,包括:获取生产站点的各云主机资源;对各云主机资源进行配置生成对应的容灾任务;根据负载均衡算法将各容灾任务分配至对应的物理主机以便启动对应的容灾任务;将启动的容灾任务对应的差异数据写入至灾备站点以完成云主机的容灾过程。该方法通过负载均衡算法将各容灾任务分配至对应的物理主机,使得容灾任务的运行不受限于某个特定的物理主机,灵活选择运行任务的物理主机,有效利用集群中物理主机的计算资源,通过负载均衡共同实现任务运行的高可用性。
另外,本发明还提供了一种云主机的容灾装置及介质,具有如上述云主机的容灾方法相同的有益效果。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种云主机的容灾方法的流程图;
图2为本发明实施例提供的一种云主机的方法的示意图;
图3为本发明实施例提供的一种云主机的容灾装置的结构图;
图4为本发明实施例提供的另一种云主机的容灾装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种云主机的容灾方法、装置及介质,使得容灾任务的运行不受限于某个特定的物理主机,灵活选择运行任务的物理主机,有效利用集群中物理主机的计算资源,通过负载均衡共同实现任务运行的高可用性。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
需要说明的是,云主机的容灾备份主要针对云主机的存储资源(虚拟磁盘),其他中央处理器(Central Processing Unit,CPU)资源、网络资源等均可在完成存储迁移后,再进行分配,其容灾备份的核心在于存储资源的迁移备份。云主机的存储资源一般建立在分布式存储系统上,处于一个存储域的物理主机均可访问到同一云主机的存储资源。图1为本发明实施例提供的一种云主机的容灾方法的流程图,如图1所示,该方法包括:
S11:获取生产站点的各云主机资源;
S12:对各云主机资源进行配置生成对应的容灾任务;
S13:根据负载均衡算法将各容灾任务分配至对应的物理主机以便启动对应的容灾任务;
S14:将启动的容灾任务对应的差异数据写入至灾备站点以完成云主机的容灾过程。
具体地,站点时容灾管理系统的资源组织单位,用户可在站点内或者站点间配置容灾保护业务,按照管理位置划分,站点分为本端站点和远端站点,按照保护关系划分,站点分为生产站点和灾备站点。
主机是指生产站点或灾备站点中的应用服务器,生产站点中的被保护主机成为生产主机,灾备站点中用于测试或者容灾恢复的主机成为灾备主机。主机组是同类主机的组合,组内主机通常为同一个型号、操作系统(Operating System,OS)版本、业务类型和集群/高可用(High Available,HA)的应用配置。
获取生产站点的各云主机资源,其中,各云主机资源可以对应一个或者多个物理主机,在此不做具体限定,根据实际的各云主机资源的资源大小进行对应。
对各云主机资源进行配置生成对应的容灾任务,通过资源的分布式特性,与资源的缓冲策略相结合。云主机在云平台生成容灾任务,为云主机创建容灾任务,当生产站点故障时,通过简单的配置,即可在容灾站点迅速恢复业务。
负载均衡算法可以为自定义均衡算法,其目的是选择资源使用率较小的空闲物理主机执行容灾任务或者当前任务数最小的物理主机,多个容灾任务均衡地分布在集群中不同的物理主机上。负载均衡是当一台服务器的性能达到极限时,可以使用服务器集群提高整体性能,尽力将网络流量平均分发到多个服务器中,包括以下几个特点:
1、高并发:负载均衡通过算法调整负载,尽力均匀的分配应用集群中各节点的工作量,以此提高应用集群的并发处理能力(吞吐量)。
2、伸缩性:添加或减少服务器数量,然后由负载均衡进行分发控制。这使得应用集群具备伸缩性。
3、高可用:负载均衡器可以监控候选服务器,当服务器不可用时,自动跳过,将请求分发给可用的服务器。这使得应用集群具备高可用的特性。
4、安全防护:有些负载均衡软件或硬件提供了安全性功能,如:黑白名单处理、防火墙,防分布式拒绝服务(Distributed Denial of Service,DDos)攻击等。
本实施例对于负载均衡算法不做具体限定,可以是轮询,加权轮询,随机,加权随机,IP Hash,URL Hash,一致性Hash等,轮询算法是每次的请求到达时,对每个服务器都轮询访问,保证每个服务器命中概率相同,实现简单但无法解决不同服务器之间性能差异问题;加权轮询算法是权重高的服务器请求命中的概率更高,根据不同服务器的性能调整权重比可以降低服务器性能差异带来的问题,算法实现上可以将所有的服务器连接对象放到一个list中,按权重比例放不同数量的连接对象到list,比如有三台服务器权重比是1:2:3,list中的连接对象数量数可以是1,2,3,轮询访问这个list即可。
随机算法是所有服务器随机访问,实现简单,服务器的命中概率取决于随机算法,无法解决不同服务器之前性能差异问题;加权随机算法实现上可以参照加权轮询,生成的随机数作为list列表的索引值,也可以降低服务器性能差异带来的问题;IP Hash算法对请求的ip地址用hash算法映射到服务器上,保证一个客户端的所有请求都命中到一台服务器上,适合服务端保存客户端的状态,开启session会话的情况,但是不能跨服务器会话,如果服务器有新上线,下线,重启等导致服务器序号发生改变时会导致此种策略异常。
URL Hash算法是对url请求使用hash映射到指定服务器,可以配合缓存使用,在各服务器不共享缓存的情况下,对需要缓存的请求都打到一台服务器上避免其他服务器重复缓存;一致性Hash算法将主机(ip或者主机名等唯一标识)按一致性hash算法分布在0—223-1的闭环圆圈上,当我们取某个值的时候,将这个数据的key用相同的hash算法映射到0—223-1上,从这个位置顺时针找到的第一个缓存节点,就是该数据存储位置。对应负载均衡算法根据实际采用。
根据负载均衡算法将各容灾任务分配至对应的物理主机。本实施例中的物理主机是经过筛选得到,在分配之前需要判断生产站点的物理主机的工作状态,作为一种优选实施例,具体包括:
确定生产站点的物理主机的连通状态;
将连通状态为正常连通的物理主机存储至存储域以便作为待分配物理主机用于承载容灾任务。
具体地,判断生产站点的物理主机的连通状态是否为正常连通状态,若是,则将正常连通状态的物理主机存储至生产站点对应的存储域中,作为待分配物理主机。
或者,在判断为正常连通状态的物理主机做标记,以便后续根据负载均衡算法仅对标记的物理主机进行分配选定。
在考虑到生产站点的物理主机本身的状态过程中,还可以针对生产站点的物理主机与灾备站点的物理主机之间的链路状态进行检查。作为一种优选实施例,具体包括:
确定生产站点的物理主机与灾备站点的物理主机之间的链路状态;
将链路状态为正常连通的生产站点的物理主机存储至存储域中以便作为待分配物理主机。
具体地,判断生产站点的物理主机与灾备站点的物理主机之间的链路状态是否为正常连通状态,若是,则将正常连通状态所属的生产站点的物理主机存储至生产站点对应的存储域中,作为待分配物理主机。
或者,在判断为正常连通状态的生产站点的物理主机做标记,以便后续根据负载均衡算法仅对标记的物理主机进行分配选定。
在分配至对应的物理主机后,启动容灾任务,将容灾任务中对应的差异数据写入至灾备站点。由于多个容灾任务均衡地分布在集群中不同的物理主机上,对于一组容灾任务,可以设置不同级别的优先级。可以是多个容灾任务对应一个物理主机,根据容灾任务的优先级写入至容灾站点。设置优先级的形式不做限定,可以根据容灾任务的紧急程度,或者容灾任务的数据大小等。
图2为本发明实施例提供的一种云主机的方法的示意图,如图2所示,本发明实施例包括负载均衡装置、任务接收装置、备份点管理装置、比较装置、缓冲装置、网络发送装置、网络接收装置和同步装置。负载均衡装置用于选择生产站点执行容灾任务的物理主机,选定物理主机后,通过比较装置,计算得到云主机的增量数据(第一次为全量数据)放入缓冲装置;然后由发送装置从缓冲装置中取出数据,发送到在被站点的接收装置中;接收装置也可以选择缓冲资源,最后由同步装置从缓冲装置中取出数据写入灾备站点建立的占位虚拟机的虚拟磁盘中。
本发明提供的一种云主机的容灾方法,包括:获取生产站点的各云主机资源;对各云主机资源进行配置生成对应的容灾任务;根据负载均衡算法将各容灾任务分配至对应的物理主机以便启动对应的容灾任务;将启动的容灾任务对应的差异数据写入至灾备站点以完成云主机的容灾过程。该方法通过负载均衡算法将各容灾任务分配至对应的物理主机,使得容灾任务的运行不受限于某个特定的物理主机,灵活选择运行任务的物理主机,有效利用集群中物理主机的计算资源,通过负载均衡共同实现任务运行的高可用性。
在上述实施例的基础上,步骤S14中的将启动的容灾任务对应的差异数据写入至灾备站点,包括:
获取容灾任务的任务运行进度,其中任务运行进度存储在生产站点与灾备站点对应的共享存储区域内;
对生产站点的物理主机与灾备站点的物理主机之间的传输链路进行监控;
当监控到传输链路发生故障时,获取当前任务运行进度,并根据负载均衡算法更换生产站点内的存储域的物理主机;
根据任务运行进度与当前任务运行进度的对应关系确定剩余任务运行进度对应的差异数据;
将更换后的物理主机与灾备站点的物理主机建立链路连接以传输剩余任务运行进度对应的差异数据。
在真正的传输差异数据的过程中,需要将容灾任务的任务运行进度存储在一个共享存储区域内,该区域针对生产站点与灾备站点共享设置。同时监控生产站点与灾备站点之间的传输链路,一旦链路发生故障则需要更新切换生产站点其他物理主机对灾备站点的物理主机的传输。切换其他物理主机后并不需要从头到尾重新将该容灾任务对应的差异数据传输,而是根据当前故障的传输数据的运行进度,进一步传输剩余数据即可,即在失败的位置继续执行。
具体方式是根据当前故障获取当前任务运行进度,通过任务运行进度与当前任务运行进度的对应关系确定剩余任务运行进度,同时根据负载均衡算法在存储域中找到对应的目标物理主机,对目标物理主机域灾备站点的物理主机建立链路连接以传输剩余任务运行进度对应的差异数据。
本发明实施例提供的将启动的容灾任务对应的差异数据写入至灾备站点,考虑在传输过程中出现链路故障,在此根据负载均衡算法分配对应的物理主机以传输剩余的差异数据。可以灵活的选择运行任务的物理机,有效利用集群中所有物理机的计算资源,通过负载均衡共同实现任务运行的高可用。
在上述实施例的基础上,步骤S14中的将启动的容灾任务对应的差异数据写入至灾备站点,包括:
根据容灾任务以及云主机的虚拟磁盘生成定时备份点;
根据生产站点的当前备份点与上一个备份点对应的增量数据确定差异数据;
将差异数据所属的容灾任务存储至任务队列中;
通过网络报文形式将差异数据发送至灾备站点。
需要说明的是,上述实施例针对于步骤S14仅是通过重新分配物理主机角度说明论述,本实施例基于具体的传输过程进行说明论述。结合图2,物理机上的任务接收装置收到容灾任务后,针对云主机的虚拟磁盘生成定时备份点。需要说明的是,任务接收装置是部署在云主机所在的物理集群中每台物理机上,用来接收并启动负载均衡装置分配的容灾任务。备份点管理装置,在生产站点支持备份点之间的时间间隔,定时生成当前云主机的虚拟机磁盘快照。在灾备站点的备份点管理装置是支持在每次增量数据写入之前,为当前可用状态的云主机虚拟此片做一次备份,支持设置最多保留的备份点数量。
根据生产站点的当前备份点与上一个备份点对应的增量数据确定差异数据,具体地,首次备份点的增量数据为全量数据,将差异数据所属的容灾任务存储值任务队列中。也可以将该容灾任务进入缓冲装置,以减少排队时间,可以通过优先级设置,如优先级较高的容灾任务先存储值缓冲装置或分配单独的任务队列。也可以支持数据分片,如根据传输控制协议(Transmission Control Protocol,TCP)缓冲区大小,将数据分为TCP缓冲区的整数倍,加速网络缓存下刷效率。若存在差异数据,将差异数据和业务元数据封装为TCP消息,若无差异数据,则将业务元数据封装成TCP消息。
将容灾任务放置在任务队列后,若缓冲装置装满时,数据的入队需要等待网络发送装置从缓冲装置中再次读取数据时才可以存入。通过网络报文形式将差异数据发送至灾备站点。网络发送装置支持网络连接池,减少建立网络连接的次数,通过连接复用提升网络传输效率。具体地,网络发送装置不断从缓冲装置中读取数据,并封装为TCP消息报文,通过网络发送到对端的接收装置,网络接收装置收到该报文后,对报文解析以便发送至灾备站点的虚拟磁盘中。若网络发送失败,则再次进入缓冲装置。
本发明实施例提供将启动的容灾任务对应的差异数据写入至灾备站点的具体传输过程,通过独立的备份点机制及高效的增量数据计算算法,有效提升差异数据获取的效率;设计合理的缓冲装置,降低网络阻塞,有效利用本端和对端物理机的计算资源,提升传输效率。
在上述实施例的基础上,通过网络报文形式将差异数据发送至灾备站点,包括:
将差异数据发送至灾备站点的缓冲区域;
在差异数据未传输至灾备站点的云主机之前,在灾备站点的备份点生成云主机对应的虚拟磁盘以便差异数据存储;
轮询灾备站点的备份点内的差异数据,并同步至灾备站点的云主机。
具体地,作为灾备站点接收由生产站点发送的差异数据,将其存储值灾备站点的缓冲区域,在未传输至灾备站点的云主机时,会通过备份点管理装置对当前待同步的云主机生成备份点,如此可保证云主机至少存在一个可用的资源。
同步装置不断轮询备份点内的差异数据,并同步至灾备站点的云主机。不直接对磁盘文件进行读写,而是写入临时文件,降低因网络断开,将不完整数据写入磁盘导致错误的概率。
作为另一种实施例,通过网络报文形式将差异数据发送至灾备站点,包括:
轮询由生产站点发送的差异数据,并同步至灾备站点的云主机。
具体地,灾备站点的网络接收装置接收到报文信息后,对报文信息进行解析,可以直接将解析后的数据写入如至虚拟机的对应磁盘中,也可以选择将其放入接收端的缓冲装置中。
本发明实施例提供的通过网络报文形式将差异数据发送至灾备站点的过程,通过独立的备份点机制及高效的增量数据计算算法,有效提升差异数据获取的效率;设计合理的缓冲装置,降低网络阻塞,有效利用本端和对端物理机的计算资源,提升传输效率。同时直接写入至磁盘,也提高传输效率。
在上述实施例的基础上,在步骤S14的将启动的容灾任务对应的差异数据写入至灾备站点之后,还包括:
根据灾备站点接收到的差异数据生成对应的备份完成信息;
将备份完成信息发送至生产站点以便下一个备份点的差异数据传输。
具体地,数据同步完成后,通过网络接收装置与网络发送装置已建立的链路,回复数据备份成功的消息。生产站点收到回复消息后会进行下一个备份点增量数据的传输。
本发明实施例提供的根据灾备站点接收到的差异数据生成对应的备份完成信息;将备份完成信息发送至生产站点,方便下一个备份点的差异数据传输。
上述详细描述了云主机的容灾方法对应的各个实施例,在此基础上,本发明还公开与上述方法对应的云主机的容灾装置,图3为本发明实施例提供的一种云主机的容灾装置的结构图。如图3所示,云主机的容灾装置包括:
获取模块11,用于获取生产站点的各云主机资源;
配置模块12,用于对各云主机资源进行配置生成对应的容灾任务;
分配模块13,用于根据负载均衡算法将各容灾任务分配至对应的物理主机以便启动对应的容灾任务;
写入模块14,用于将启动的容灾任务对应的差异数据写入至灾备站点以完成云主机的容灾过程。
由于装置部分的实施例与上述的实施例相互对应,因此装置部分的实施例请参照上述方法部分的实施例描述,在此不再赘述。
对于本发明提供的一种云主机的容灾装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述云主机的容灾方法相同的有益效果。
图4为本发明实施例提供的另一种云主机的容灾装置的结构图,如图4所示,该装置包括:
存储器21,用于存储计算机程序;
处理器22,用于执行计算机程序时实现云主机的容灾方法的步骤。
本实施例提供的云主机的容灾装置可以包括但不限于智能手机、平板电脑、笔记本电脑或者台式电脑等。
其中,处理器22可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器22可以采用数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器22也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU;协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器22可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器22还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器21可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器21还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器21至少用于存储以下计算机程序211,其中,该计算机程序被处理器22加载并执行之后,能够实现前述任一实施例公开的云主机的容灾方法的相关步骤。另外,存储器21所存储的资源还可以包括操作系统212和数据213等,存储方式可以是短暂存储或者永久存储。其中,操作系统212可以包括Windows、Unix、Linux等。数据213可以包括但不限于云主机的容灾方法所涉及到的数据等等。
在一些实施例中,云主机的容灾装置还可包括有显示屏23、输入输出接口24、通信接口25、电源26以及通信总线27。
领域技术人员可以理解,图4中示出的结构并不构成对云主机的容灾装置的限定,可以包括比图示更多或更少的组件。
处理器22通过调用存储于存储器21中的指令以实现上述任一实施例所提供的云主机的容灾方法。
对于本发明提供的一种云主机的容灾装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述云主机的容灾方法相同的有益效果。
进一步的,本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器22执行时实现如上述云主机的容灾方法的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的一种计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述云主机的容灾方法相同的有益效果。
以上对本发明所提供的一种云主机的容灾方法、云主机的容灾装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (11)
1.一种云主机的容灾方法,其特征在于,包括:
获取生产站点的各云主机资源;
对各所述云主机资源进行配置生成对应的容灾任务;
根据负载均衡算法将各所述容灾任务分配至对应的物理主机以便启动对应的所述容灾任务;
将启动的所述容灾任务对应的差异数据写入至灾备站点以完成所述云主机的容灾过程。
2.根据权利要求1所述的云主机的容灾方法,其特征在于,在所述根据负载均衡算法将各所述容灾任务分配至对应的物理主机之前,还包括:
确定所述生产站点的物理主机的连通状态;
将所述连通状态为正常连通的所述物理主机存储至存储域以便作为待分配物理主机用于承载所述容灾任务。
3.根据权利要求2所述的云主机的容灾方法,其特征在于,在所述根据负载均衡算法将各所述容灾任务分配至对应的物理主机之前,还包括:
确定所述生产站点的物理主机与所述灾备站点的物理主机之间的链路状态;
将所述链路状态为正常连通的所述生产站点的物理主机存储至所述存储域中以便作为所述待分配物理主机。
4.根据权利要求3任意一项所述的云主机的容灾方法,其特征在于,所述将启动的所述容灾任务对应的差异数据写入至灾备站点,包括:
获取所述容灾任务的任务运行进度,其中所述任务运行进度存储在所述生产站点与所述灾备站点对应的共享存储区域内;
对所述生产站点的物理主机与所述灾备站点的物理主机之间的传输链路进行监控;
当监控到所述传输链路发生故障时,获取当前任务运行进度,并根据所述负载均衡算法更换所述生产站点内的所述存储域的物理主机;
根据所述任务运行进度与所述当前任务运行进度的对应关系确定剩余任务运行进度对应的差异数据;
将更换后的物理主机与所述灾备站点的物理主机建立链路连接以传输所述剩余任务运行进度对应的差异数据。
5.根据权利要求4所述的云主机的容灾方法,其特征在于,所述将启动的所述容灾任务对应的差异数据写入至灾备站点,包括:
根据所述容灾任务以及所述云主机的虚拟磁盘生成定时备份点;
根据所述生产站点的当前备份点与上一个备份点对应的增量数据确定所述差异数据;
将所述差异数据所属的容灾任务存储至任务队列中;
通过网络报文形式将所述差异数据发送至所述灾备站点。
6.根据权利要求5所述的云主机的容灾方法,其特征在于,所述通过网络报文形式将所述差异数据发送至所述灾备站点,包括:
将所述差异数据发送至所述灾备站点的缓冲区域;
在所述差异数据未传输至所述灾备站点的云主机之前,在所述灾备站点的备份点生成所述云主机对应的虚拟磁盘以便所述差异数据存储;
轮询所述灾备站点的备份点内的差异数据,并同步至所述灾备站点的云主机。
7.根据权利要求5所述的云主机的容灾方法,其特征在于,所述通过网络报文形式将所述差异数据发送至所述灾备站点,包括:
轮询由所述生产站点发送的所述差异数据,并同步至所述灾备站点的云主机。
8.根据权利要求6或7所述的云主机的容灾方法,其特征在于,在所述将启动的所述容灾任务对应的差异数据写入至灾备站点之后,还包括:
根据所述灾备站点接收到的所述差异数据生成对应的备份完成信息;
将所述备份完成信息发送至所述生产站点以便下一个所述备份点的差异数据传输。
9.一种云主机的容灾装置,其特征在于,包括:
获取模块,用于获取生产站点的各云主机资源;
配置模块,用于对各所述云主机资源进行配置生成对应的容灾任务;
分配模块,用于根据负载均衡算法将各所述容灾任务分配至对应的物理主机以便启动对应的所述容灾任务;
写入模块,用于将启动的所述容灾任务对应的差异数据写入至灾备站点以完成所述云主机的容灾过程。
10.一种云主机的容灾装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至8任一项所述的云主机的容灾方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的云主机的容灾方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050934.7A CN115426251B (zh) | 2022-08-30 | 2022-08-30 | 一种云主机的容灾方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050934.7A CN115426251B (zh) | 2022-08-30 | 2022-08-30 | 一种云主机的容灾方法、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115426251A true CN115426251A (zh) | 2022-12-02 |
CN115426251B CN115426251B (zh) | 2024-02-13 |
Family
ID=84200203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211050934.7A Active CN115426251B (zh) | 2022-08-30 | 2022-08-30 | 一种云主机的容灾方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115426251B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145406A (zh) * | 2017-05-14 | 2017-09-08 | 四川盛世天成信息技术有限公司 | 一种基于集群技术的容灾备份方法及系统 |
WO2018113533A1 (zh) * | 2016-12-22 | 2018-06-28 | 阿里巴巴集团控股有限公司 | 一种元数据迁移方法、装置、系统及设备 |
CN109684074A (zh) * | 2018-11-12 | 2019-04-26 | 平安科技(深圳)有限公司 | 物理机资源分配方法及终端设备 |
CN111381931A (zh) * | 2018-12-29 | 2020-07-07 | 中兴通讯股份有限公司 | 容灾方法、装置及系统 |
CN111614746A (zh) * | 2020-05-15 | 2020-09-01 | 北京金山云网络技术有限公司 | 云主机集群的负载均衡方法、装置及服务器 |
CN114448782A (zh) * | 2022-01-23 | 2022-05-06 | 苏州浪潮智能科技有限公司 | 一种基于云平台对云主机进行容灾的方法、装置及介质 |
CN114706661A (zh) * | 2022-05-31 | 2022-07-05 | 武汉四通信息服务有限公司 | 虚拟机的容灾备份方法、系统、计算机设备及存储介质 |
-
2022
- 2022-08-30 CN CN202211050934.7A patent/CN115426251B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018113533A1 (zh) * | 2016-12-22 | 2018-06-28 | 阿里巴巴集团控股有限公司 | 一种元数据迁移方法、装置、系统及设备 |
CN107145406A (zh) * | 2017-05-14 | 2017-09-08 | 四川盛世天成信息技术有限公司 | 一种基于集群技术的容灾备份方法及系统 |
CN109684074A (zh) * | 2018-11-12 | 2019-04-26 | 平安科技(深圳)有限公司 | 物理机资源分配方法及终端设备 |
CN111381931A (zh) * | 2018-12-29 | 2020-07-07 | 中兴通讯股份有限公司 | 容灾方法、装置及系统 |
CN111614746A (zh) * | 2020-05-15 | 2020-09-01 | 北京金山云网络技术有限公司 | 云主机集群的负载均衡方法、装置及服务器 |
WO2021228103A1 (zh) * | 2020-05-15 | 2021-11-18 | 北京金山云网络技术有限公司 | 云主机集群的负载均衡方法、装置及服务器 |
CN114448782A (zh) * | 2022-01-23 | 2022-05-06 | 苏州浪潮智能科技有限公司 | 一种基于云平台对云主机进行容灾的方法、装置及介质 |
CN114706661A (zh) * | 2022-05-31 | 2022-07-05 | 武汉四通信息服务有限公司 | 虚拟机的容灾备份方法、系统、计算机设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
姜杰;: "基于二层网络互通的跨数据中心电信私有云灾备体系研究", 互联网天地, no. 12 * |
穆俊;: "基于改进人工蜂群算法的负载均衡感知研究", 洛阳理工学院学报(自然科学版), no. 01 * |
Also Published As
Publication number | Publication date |
---|---|
CN115426251B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111091429B (zh) | 电子票据标识分配方法及装置、电子票据生成系统 | |
CN106708622B (zh) | 集群资源处理方法和系统、资源处理集群 | |
CN111124277B (zh) | 一种深度学习数据集缓存方法、系统、终端及存储介质 | |
CN111338773A (zh) | 一种分布式定时任务调度方法、调度系统及服务器集群 | |
US20200319983A1 (en) | Redundancy Method, Device, and System | |
Barr et al. | Building fault-tolerant applications on AWS | |
CN111092921B (zh) | 数据采集方法、装置及存储介质 | |
US10860375B1 (en) | Singleton coordination in an actor-based system | |
CN109783151B (zh) | 规则变更的方法和装置 | |
US11153173B1 (en) | Dynamically updating compute node location information in a distributed computing environment | |
CN112698838B (zh) | 多云容器部署系统及其容器部署方法 | |
CN115454636A (zh) | 一种容器云平台gpu资源调度方法、装置及应用 | |
CN114615268B (zh) | 基于Kubernetes集群的服务网络、监控节点、容器节点及设备 | |
CN114185558A (zh) | 基于K8s的原生应用选主方法、装置及存储介质 | |
US11573839B1 (en) | Dynamic scheduling for live migration between cloud regions and edge locations | |
US11734038B1 (en) | Multiple simultaneous volume attachments for live migration between cloud regions and edge locations | |
CN114565502A (zh) | Gpu资源管理方法、调度方法、装置、电子设备及存储介质 | |
CN116069493A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
CN109413011B (zh) | 公共服务资源申请方法、相关设备及系统 | |
CN111831221B (zh) | 一种基于云存储的分布式存储方法及系统 | |
CN110795209B (zh) | 一种控制方法和装置 | |
CN116112569B (zh) | 微服务调度方法及管理系统 | |
CN114866395B (zh) | 多组分布式一致性协议集群心跳通讯方法及装置 | |
CN115426251A (zh) | 一种云主机的容灾方法、装置及介质 | |
US9348672B1 (en) | Singleton coordination in an actor-based system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |