CN107491343B - 一种基于云计算的跨集群资源调度系统 - Google Patents

一种基于云计算的跨集群资源调度系统 Download PDF

Info

Publication number
CN107491343B
CN107491343B CN201710804995.0A CN201710804995A CN107491343B CN 107491343 B CN107491343 B CN 107491343B CN 201710804995 A CN201710804995 A CN 201710804995A CN 107491343 B CN107491343 B CN 107491343B
Authority
CN
China
Prior art keywords
cluster
data
service module
cross
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710804995.0A
Other languages
English (en)
Other versions
CN107491343A (zh
Inventor
张弦
朱仲马
薛科婷
刘晓浩
何重阳
唐义飞
马腾郡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electric Rice Information System Co., Ltd.
Original Assignee
China Electric Rice Information System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electric Rice Information System Co ltd filed Critical China Electric Rice Information System Co ltd
Priority to CN201710804995.0A priority Critical patent/CN107491343B/zh
Publication of CN107491343A publication Critical patent/CN107491343A/zh
Application granted granted Critical
Publication of CN107491343B publication Critical patent/CN107491343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Abstract

本发明公开了一种基于云计算的跨集群资源调度系统,包括消息捕获服务模块、跨集群元数据同步服务模块、数据多副本异步部署服务模块和跨集群资源调度服务模块;消息捕获服务模块用于捕获本地虚拟化集群内部消息,并上报给跨集群元数据同步服务模块;跨集群元数据同步服务模块用于分发本地虚拟化集群元数据,并接受远端虚拟化集群分发的元数据;数据多副本异步部署服务模块用于提供虚拟化集群后端存储服务,提供虚拟化集群数据远端副本同步、数据一致性校验服务、断点续传功能;跨集群资源调度服务模块包括本地跨集群资源调度服务模块和远端跨集群资源调度服务模块,提供资源重建、跨集群资源调度请求分发响应功能。

Description

一种基于云计算的跨集群资源调度系统
技术领域
本发明属于信息系统领域,尤其涉及一种基于云计算的跨集群资源调度系统。
背景技术
随着信息系统的发展,数据中心已全满进入基于分布式虚拟化技术的云数据中心时代,通过以计算虚拟化、网络虚拟化、存储虚拟化为代表的虚拟化技术,数据中心实现来本地资源的高可靠性、高稳定性、告弹性的按需分配、充分利用。
然后,随着越来越多的系统上线为用户提供不间断服务,越来越多的数据累计在本地,服务的不间断性以及数据安全性越发受到用户和数据中心开发运营人员的关注。
在单个集群内,为保证服务可靠性,多采用多服务实例部署。即单个服务包含多个可用的服务实例,防止单个服务实例出现异常的情况下,仍能维持服务的正常访问。数据多采用基于分布式存储技术的多副本形式,确保单个副本或多个副本损毁丢失的情况下,数据不丢失,仍可以正常访问。在多集群情况下,一般多采用专用存储设备进行数据周期备份,这种策略存在价格昂贵、无法动态实现资源调度、数据恢复使用周期长等问题,并不能实现跨集群资源统一管理调度的能力。
因此,迫切的需要一种跨集群资源管理调度方法,解决跨集群资源统一管理、调度、容灾、备份的问题。
发明内容
针对目前信息系统中无法实现跨虚拟化集群资源统一管理调度的问题,从消息捕获与数据同步的角度,提出一种实现跨集群资源统一调度管理的系统。通过在捕获集群中的各种消息,转化为元数据,并在各个集群之间实现元数据与数据的同步,以此实现数据跨集群的虚拟资源管理与调度。
本发明公开了一种基于云计算的跨集群资源调度系统,包括消息捕获服务模块、跨集群元数据同步服务模块、数据多副本异步部署服务模块和跨集群资源调度服务模块;
所述消息捕获服务模块用于捕获本地虚拟化集群内部消息,并上报给跨集群元数据同步服务模块;
所述跨集群元数据同步服务模块用于分发本地虚拟化集群元数据,并接受远端虚拟化集群分发的元数据;
所述数据多副本异步部署服务模块用于提供虚拟化集群后端存储服务,提供虚拟化集群数据远端副本同步、数据一致性校验服务、断点续传功能;
所述跨集群资源调度服务模块包括本地跨集群资源调度服务模块和远端跨集群资源调度服务模块,提供资源重建、跨集群资源调度请求分发响应功能。
所述虚拟化集群包括计算虚拟化服务、网络虚拟化服务、块存储服务、对象存储服务、共享存储服务、权限管理服务、镜像管理服务、数据处理服务、容器管理服务、数据库服务、裸金属服务、编排服务,各服务之间均通过REST接口实现相互之间的调用。
所述消息捕获服务模块通过端口映射技术捕获虚拟化集群中各服务之间的REST调用及结果数据,如虚拟机创建时计算虚拟化服务调用权限管理服务所提供的REST接口以获得后续操作所需要的授权令牌,调用块存储服务所提供的REST接口以获得块存储资源,调用网络虚拟化服务所提供的REST接口以获得虚拟网络资源等,并将捕获的数据发送到跨集群元数据同步服务模块。
所述消息捕获服务模块捕获虚拟化集群内部基于消息队列的RPC(远程过程调用协议)调用信息,并将捕获的数据发送到跨集群元数据同步服务模块。
虚拟化集群内各服务均由若干组件组成,各个组件之间均通过消息队列服务进行RPC调用。不同服务在消息队列服务内有各自的消息分发队列,消息捕获服务监听各个服务在消息队列服务内部的消息分发队列,并将捕获的数据发送到元数据同步服务。
所述跨集群元数据同步服务模块接收消息捕获服务模块发送的数据,对数据按照JSON(JavaScript Object Notation,JS对象标记)数据格式通过自带协议解析器进行解析处理,标记远端虚拟化集群唯一标示,在本地元数据同步服务模块进行注册,然后将处理过的通过数据解析获得的元数据信息分发到其他已在本地注册过的虚拟化集群(注册过程与本次注册过程相同),同时跨集群元数据同步服务模块还对本地元数据(元数据是对实际数据的描述性数据,如数据分布情况、创建时间、更新时间、权限信息等)(虚拟化集群构建完成时自动生成)进行扫描,与待分发元数据(对上文所属接收到的数据按照JSON数据格式通过自带协议解析器进行解析处理后获得)进行对比,确保元数据一致性(这里仅对数据的元数据与数据是否匹配进行校验,确保元数据对数据的描述准确),如果不一致,则将接受到的数据抛弃。
跨集群元数据同步服务模块将接收远端虚拟化集群分发的元数据(元数据是对实际数据的描述性数据,如数据分布情况、创建时间、更新时间、权限信息等),查看该集群是否已注册,如果已注册,则对元数据进行格式化处理,如果没有注册,则向远端发送错误信息。
跨集群元数据同步服务模块支持本地元数据信息校验,通过与本地集群周期任务报送的数据进行对比,对本地元数据进行实时更新;支持基于策略的元数据信息分发,根据具体需要,将本集群的元数据分发到远端集群;支持基于策略的元数据接受与校验,接收远端分发来的远端集群元数据,对数据进行JSON格式校验,确保元数据格式正确;支持元数据验错重传,当元数据校验格式错误时,及时通知远端集群进行数据重传。
所述数据多副本异步部署服务模块用于提供虚拟化集群后端存储服务包括:用户写入虚拟化集群的数据在数据多副本异步部署服务模块中采用分布式块存储形式进行保存,数据被分为64M一个的数据块,每个数据块均采用多副本形式保存,同时数据多副本异步部署服务模块将向远端备份存储发起备份请求,以确保备份存储状态,得到许可后,将数据以块为单位向远端备份,这一备份过程从数据开始写入本地即开始,同时远端备份是否完成不影响本地写入完成效率;
所述数据多副本异步部署服务模块提供断点续传功能包括:虚拟化集群数据远端副本同步过程中如遇到网络中断,数据多副本异步部署服务模块将启动断点续传机制,对已传输数据块、尚未传输的数据块进行标记,同时对已传输的数据块进行监视,如果在中断期间这些数据块被修改,则对被修改的数据进行标记,当网络恢复时,以数据块为单位,对未传输的数据块和已传输但被修改的数据块进行断点续传;传输完成后,向本地虚拟化管理系统发送完成信号,该信号将被消息捕获服务模块捕获,进而被跨集群元数据同步服务模块分发到远端;
数据多副本异步部署服务模块提供虚拟化集群数据远端副本同步功能:数据多副本异步部署服务模块支持与虚拟化集群衔接,为虚拟化集群提供存储服务;支持跨集群副本异步备份,基于分布式存储集群已有的多副本存储机制,将本地存储集群内的数据块异步的备份到远端分布式存储集群,确保本地存储集群损坏后,数据在远端分布式存储集群仍有有效备份,异步备份不影响本地数据副本写出效率。
数据多副本异步部署服务模块接收到远端备份请求,查看该集群是否已注册,如果已注册,则发送允许信号;接收到远端备份数据时,首先进行元数据记录,并将数据标记为特定集群的备份数据,同时开始备份数据存储;对于接收到的数据,数据多副本异步部署服务模块将进行数据一致性校验服务,检查接收到的数据是否完整,MD5校验值是否正确,数据是否与元数据匹配等,确保接收到的数据没有发生错误,如果数据一致性存在问题,则要求远端重发该数据块。
跨集群资源调度服务模块提供跨集群资源调度请求分发响应功能,用于接受跨集群资源调度请求,并将该请求转发到远端集群,远端集群的跨集群资源调度服务模块将根据该请求进行资源重建,具体过程包括如下步骤:
步骤1,本地跨集群资源调度服务模块接收到跨集群资源调度请求;
步骤2,本地跨集群资源调度服务模块检查该资源是否在跨集群高可用池中,若不在高可用池中,则返回错误,表明该资源不具备高可用能力,若在高可用池中,则继续步骤3;
步骤3,本地跨集群资源调度服务模块查询该资源的远端调度目标集群,获得该资源的远端调度目标集群后继续步骤4,未获得则返回错误,表明该资源无远端调度目标集群;
步骤4,跨集群资源调度服务模块提供跨集群资源调度请求分发响应功能:本地跨集群资源调度服务模块发起跨集群资源调度分发,将资源调度请求转发到该资源远端调度目标集群;
步骤5,远端跨集群资源调度服务模块进行跨集群资源调度响应,检查接收到的资源调度请求是否合法,若不合法,则返回错误到本地跨集群资源调度服务模块,若合法,则继续步骤6;
步骤6,远端跨集群资源调度服务模块基于跨集群元数据同步服务模块检查待恢复资源元数据完整性及合法性,如有问题,则请求本地跨集群资源调度服务模块重发待回复资源的元数据,若无问题,则继续步骤7;
步骤7,远端跨集群资源调度服务模块基于数据多副本异步部署服务模块检查待回复资源的数据完整性及合法性,如有问题,则请求本地跨集群资源调度服务模块通过本地数据多副本异步部署服务模块重发待恢复的数据,如果没有问题,则执行步骤8;
步骤8,远端跨集群资源调度服务模块进行元数据与数据匹配行检查,确保元数据与数据相匹配,若不匹配,则返回错误到本地跨集群资源调度服务模块,表明数据错误,调度失败,若匹配,则继续步骤9;
步骤9,远端跨集群资源调度服务模块进行资源重建,通过调用虚拟化集群的计算、存储、网络相关REST接口,将待恢复资源的元数据提供给虚拟化集群,由虚拟化集群基于远端跨集群资源调度服务模块所提供的元数据调用对应的数据进行虚拟资源重建;
步骤10,远端跨集群资源调度服务模块基于数据多副本异步部署服务模块进行已重建资源的多副本分发;
步骤11,用户可根据具体需求,如是否对已重建资源进行备份、需要备份到哪个远端集群、副本数、备份周期等,确定重建资源是否需要再次进行异端备份,并制定相应的备份策略,远端跨集群资源调度服务模块基于策略进行已重建资源的异端备份。
跨集群资源调度服务模块支持跨集群资源调度信息的接收与分发,确保不同集群之间调度指令的互联互通;支持元数据完整性、正确性校验与出错重传,确保备份数据的元数据正确可用;支持基于数据多副本异步部署服务的数据完整性、正确性校验与出错重传,利用分布式存储集群,确保备份数据的正确可用;支持基于元数据和于数据多副本异步部署服务的资源重建,当用户需要时,可基于通过校验的元数据和本分数据,根据用户需求,对资源进行恢复重建;支持基于策略的重建数据多副本策略在线修改,用户可根据数据重要性,及时动态修改数据副本本分策略,数据多副本异步部署服务将利用分布式存储系统对数据副本进行操作,充分合理利用存储空间。
有益效果:
本发明可在基本不改变现有虚拟化集群和存储集群的基础上,通过添加消息捕获服务模块、跨集群元数据同步服务模块、数据多副本异步部署服务模块和跨集群资源调度服务模块,为已有系统提供跨集群、跨地域的数据本分、容灾恢复能力,充分利用现有的软硬件资源,满足系统对IaaS(基础设施即服务)层高可用、高可靠、异地容灾、快速恢复的需求。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1为消息捕获服务原理示意图。
图2为跨集群元数据同步服务原理示意图。
图3为数据多副本异步部署服务原理示意图。
图4为跨集群资源调度服务流程。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
本发明公开了一种基于云计算的跨集群资源调度系统,包括消息捕获服务模块、跨集群元数据同步服务模块、数据多副本异步部署服务模块和跨集群资源调度服务模块;
如图1所示,所述消息捕获服务模块用于捕获本地虚拟化集群内部消息,并上报给跨集群元数据同步服务模块;
如图2所示,所述跨集群元数据同步服务模块用于分发本地虚拟化集群元数据,并接受远端虚拟化集群分发的元数据;
如图3所示,所述数据多副本异步部署服务模块用于提供虚拟化集群后端存储服务,提供虚拟化集群数据远端副本同步、数据一致性校验服务、断点续传功能;
如图4所示,所述跨集群资源调度服务模块包括本地跨集群资源调度服务模块和远端跨集群资源调度服务模块,提供资源重建、跨集群资源调度请求分发响应功能。
所述虚拟化集群包括计算虚拟化服务、网络虚拟化服务、块存储服务、对象存储服务、共享存储服务、权限管理服务、镜像管理服务、数据处理服务、容器管理服务、数据库服务、裸金属服务、编排服务,各服务之间均通过REST接口实现相互之间的调用。
所述消息捕获服务模块通过端口映射技术捕获虚拟化集群中各服务之间的REST调用及结果数据,并将捕获的数据发送到跨集群元数据同步服务模块。
所述消息捕获服务模块捕获虚拟化集群内部基于消息队列的RPC(远程过程调用协议)调用信息,并将捕获的数据发送到跨集群元数据同步服务模块。
虚拟化集群内各服务均由若干组件组成,各个组件之间均通过消息队列服务进行RPC调用。不同服务在消息队列服务内有各自的消息分发队列,消息捕获服务监听各个服务在消息队列服务内部的消息分发队列,并将捕获的数据发送到元数据同步服务。
所述跨集群元数据同步服务模块接收消息捕获服务模块发送的数据,按照JSON数据格式通过自带协议解析器进行解析处理,标记远端虚拟化集群唯一标示,在本地元数据同步服务模块进行注册,然后将处理过的通过数据解析获得的元数据信息分发到其他已在本地注册过的虚拟化集群(注册过程与本次注册过程相同),同时跨集群元数据同步服务模块还对本地元数据(虚拟化集群构建完成时自动生成)进行扫描,与待分发元数据(对上文所属接收到的数据按照JSON数据格式通过自带协议解析器进行解析处理后获得)进行对比,确保元数据一致性,如果不一致,则将接受到的数据抛弃。
跨集群元数据同步服务模块将接收远端虚拟化集群通过元数据同步服务模块集群分发的元数据,查看该集群是否已注册,如果已注册,则对元数据进行格式化处理,如果没有注册,则向远端发送错误信息。
跨集群元数据同步服务模块支持本地元数据信息校验,通过与本地集群周期任务报送的数据进行对比,对本地元数据进行实时更新;支持基于策略的元数据信息分发,根据具体需要,将本集群的元数据分发到远端集群;支持基于策略的元数据接受与校验,接收远端分发来的远端集群元数据,对数据进行JSON格式校验,确保元数据格式正确;;支持元数据验错重传,当元数据校验格式错误时,及时通知远端集群进行数据重传。。
用户写入虚拟化集群的数据在数据多副本异步部署服务模块中采用分布式块存储形式进行保存,数据被分为64M一个的数据块,每个数据块均采用多副本形式保存,同时数据多副本异步部署服务模块将向远端备份存储发起备份请求,以确保备份存储状态,得到许可后,将数据以块为单位向远端备份,这一备份过程从数据开始写入本地即开始,同时远端备份是否完成不影响本地写入完成效率;
远端备份过程中如遇到网络中断,数据多副本异步部署服务模块将对已传输数据块进行标记,当网络恢复时,以数据块为单位进行断点续传;传输完成后,向本地虚拟化管理系统发送完成信号,该信号将被消息捕获服务模块捕获,进而被跨集群元数据同步服务模块分发到远端;
数据多副本异步部署服务模块支持跨集群副本异步备份,基于分布式存储集群已有的多副本存储机制,将本地存储集群内的数据块异步的备份到远端分布式存储集群,确保本地存储集群损坏后,数据在远端分布式存储集群仍有有效备份,异步备份不影响本地数据副本写出效率。
数据多副本异步部署服务模块接收到远端备份请求,查看该集群是否已注册,如果已注册,则发送允许信号;接收到远端备份数据时,首先进行元数据入库记录,并将数据标记为特定集群的备份数据,同时开始备份数据存储;对于接收到的数据,数据多副本异步部署服务模块将进行一致性检测,确保接收到的数据没有发生错误,如果一致性存在问题,则要求远端重发该数据块。
跨集群资源调度服务模块用于接受跨集群资源调度请求,并将该请求转发到远端集群,远端集群的跨集群资源调度服务模块将根据该请求进行资源重建,具体过程包括如下步骤:
步骤1,本地跨集群资源调度服务模块接收到跨集群资源调度请求;
步骤2,本地跨集群资源调度服务模块检查该资源是否在跨集群高可用池中,若不在高可用池中,则返回错误,表明该资源不具备高可用能力,若在高可用池中,则继续以下过程;
步骤3,本地跨集群资源调度服务模块查询该资源的远端调度目标集群,获得该资源的远端调度目标集群后继续以下操作,未获得则返回错误,表明该资源无远端调度目标集群;
步骤4,本地跨集群资源调度服务模块将资源调度请求转发到该资源远端调度目标集群;
步骤5,远端跨集群资源调度服务模块检查接受到的资源调度请求是否合法,若不合法,则返回错误到本地跨集群资源调度服务模块,表明该请求不合法,若合法,则继续以下操作;
步骤6,远端跨集群资源调度服务模块检查待恢复资源元数据完整性及合法性,如有问题,则请求本地跨集群资源调度服务模块重发待回复资源的元数据,若无问题,则继续以下操作;
步骤7,远端跨集群资源调度服务模块基于数据多副本异步部署服务模块检查待回复资源的数据完整性及合法性,如有问题,则请求本地跨集群资源调度服务模块通过本地数据多副本异步部署服务模块重发待恢复的数据,若无问题,则继续以下操作;
步骤8,远端跨集群资源调度服务模块进行元数据与数据匹配行检查,确保元数据与数据相匹配,若不匹配,则返回错误到本地跨集群资源调度服务模块,表明数据错误,调度失败,若匹配,则继续以下操作;
步骤9,远端跨集群资源调度服务模块进行资源重建;
步骤10,远端跨集群资源调度服务模块基于数据多副本异步部署服务模块进行已重建资源的多副本分发;
步骤11,用户可根据具体需求,确定该资源是否需要再次进行异端备份,并制定相应的备份策略,远端跨集群资源调度服务模块基于策略进行已重建资源的异端备份。
跨集群资源调度服务模块支持跨集群资源调度信息的接收与分发,确保不同集群之间调度指令的互联互通;支持元数据完整性、正确性校验与出错重传,确保备份数据的元数据正确可用;支持基于数据多副本异步部署服务的数据完整性、正确性校验与出错重传,利用分布式存储集群,确保备份数据的正确可用;支持基于元数据和于数据多副本异步部署服务的资源重建,当用户需要时,可基于通过校验的元数据和本分数据,根据用户需求,对资源进行恢复重建;支持基于策略的重建数据多副本策略在线修改,用户可根据数据重要性,及时动态修改数据副本本分策略,数据多副本异步部署服务将利用分布式存储系统对数据副本进行操作,充分合理利用存储空间。。
本发明系统主要针对多集群管理情况下,跨虚拟化集群的消息捕获、元数据同步、数据多副本部署、资源调度功能,通过不同虚拟化集群之间的消息捕获、元数据同步、数据多副本部署,实现不同虚拟化集群之间的虚拟资源同意调度管理。该技术主要由消息捕获服务、元数据管理服务、数据多副本部署服务、跨集群资源调度服务三部分组成。其中消息捕获服务负责以捕获单个虚拟化集群中不同服务之间的通讯消息、各服务元数据变更信息、集群操作指令消息。元数据同步服务负责将消息捕获服务捕获的消息转化为虚拟化平台元数据,并将元数据在各个虚拟化集群之间进行同步,确保不同集群可相互同步元数据。数据多副本部署服务是一种异步分布式存储系统,当某一虚拟化集群向本地写入数据时,该服务将把该数据的一个副本异步同步到备虚拟化集群,该副本是否同步完毕不影响本地写入成功响应。跨集群资源调度服务负责响应用户的跨集群资源调度,当用户进行跨集群资源调度时,该服务将通过远端集群的资源调度服务检查远端集群该资源数据副本状态,状态正常则直接通过该资源响应用户请求,同时调度存储系统开发多副本分发及远端副本备份,状态不正常则尝试请求远端资源调度服务向本地分发副本,待分发完毕后再进行用户请求响应。
本发明提供了一种基于云计算的跨集群资源调度系统,该服务能够实现虚拟化集群内部的消息捕获、跨集群的元数据同步、数据多副本异步部署、跨集群资源调度功能。实现跨虚拟化集群的资源统一调度管理,实现资源的合理、充分利用。该服务由消息捕获服务、跨集群元数据同步服务、数据多副本异步部署服务、跨集群资源调度服务四部分组成。消息捕获服务捕获虚拟化集群内部计算虚拟化服务、网络虚拟化服务、存储虚拟化服务、权限管理服务、镜像管理服务、数据处理服务、容器服务、数据服务等之间的REST接口调用和各服务内部组件之间RPC调用请求及处理结果,并将捕获的消息传递各元数据同步服务。元数据同步服务在各自集群的元数据上标记唯一集群标示,并将本集群的元数据同步到其他集群,同时接收、处理并入库其他集群同步来的元数据。数据多副本异步部署服务是一种优化过的分布式存储服务,采用多副本机制,在确保本地数据多副本的同时,将本地数据向异地同步一份副本,该副本是否完成同步不影响本地数据的使用,同时接收异地数据多副本异步部署服务同步过来的备份部分,并进行集群标记。跨集群资源调度服务负责向其他集群发送跨集群调度请求,异地的跨集群资源调度服务接收到请求后通过本集群虚拟化服务及数据多副本异步部署服务完成资源调度与重构,同时通过消息捕获服务、跨集群的元数据同步服务向远端提供资源调度相关的元数据更新。
本发明提供了一种基于云计算的跨集群资源调度系统,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (1)

1.一种基于云计算的跨集群资源调度系统,其特征在于,包括消息捕获服务模块、跨集群元数据同步服务模块、数据多副本异步部署服务模块和跨集群资源调度服务模块;
所述消息捕获服务模块用于捕获本地虚拟化集群内部消息,并上报给跨集群元数据同步服务模块;
所述跨集群元数据同步服务模块用于分发本地虚拟化集群元数据,并接受远端虚拟化集群分发的元数据;
所述数据多副本异步部署服务模块用于提供虚拟化集群后端存储服务,提供虚拟化集群数据远端副本同步、数据一致性校验服务、断点续传功能;
所述跨集群资源调度服务模块包括本地跨集群资源调度服务模块和远端跨集群资源调度服务模块,提供资源重建、跨集群资源调度请求分发响应功能;
所述消息捕获服务模块通过端口映射技术捕获虚拟化集群中各服务之间的REST调用及结果数据,并将捕获的数据发送到跨集群元数据同步服务模块;
所述消息捕获服务模块捕获虚拟化集群内部基于消息队列的RPC远程过程调用协议调用信息,并将捕获的数据发送到跨集群元数据同步服务模块;
所述跨集群元数据同步服务模块接收消息捕获服务模块发送的数据,对数据按照JSON数据格式通过自带协议解析器进行解析处理,标记远端虚拟化集群唯一标示,在本地元数据同步服务模块进行注册,然后将通过数据解析获得的元数据信息分发到其他已在本地注册过的虚拟化集群,同时跨集群元数据同步服务模块还对本地元数据进行扫描,与待分发元数据进行对比,确保元数据一致性,如果不一致,则将接受到的数据抛弃;
跨集群元数据同步服务模块将接收远端虚拟化集群分发的元数据,查看该集群是否已注册,如果已注册,则对元数据进行格式化处理,如果没有注册,则向远端发送错误信息;
跨集群元数据同步服务模块支持本地元数据信息校验,通过与本地集群周期任务报送的数据进行对比,对本地元数据进行实时更新;支持基于策略的元数据信息分发,根据具体需要,将本集群的元数据分发到远端集群;支持基于策略的元数据接受与校验,接收远端分发来的远端集群元数据,对数据进行JSON格式校验,确保元数据格式正确;支持元数据验错重传,当元数据校验格式错误时,及时通知远端集群进行数据重传;
所述数据多副本异步部署服务模块用于提供虚拟化集群后端存储服务包括:用户写入虚拟化集群的数据在数据多副本异步部署服务模块中采用分布式块存储形式进行保存,数据被分为64M一个的数据块,每个数据块均采用多副本形式保存,同时数据多副本异步部署服务模块将向远端备份存储发起备份请求,以确保备份存储状态,得到许可后,将数据以块为单位向远端备份,这一备份过程从数据开始写入本地即开始,同时远端备份是否完成不影响本地写入完成效率;
所述数据多副本异步部署服务模块提供断点续传功能包括:远端备份过程中如遇到网络中断,数据多副本异步部署服务模块将对已传输数据块进行标记,当网络恢复时,以数据块为单位进行断点续传;传输完成后,向本地虚拟化管理系统发送完成信号,该信号将被消息捕获服务模块捕获,进而被跨集群元数据同步服务模块分发到远端;
数据多副本异步部署服务模块提供虚拟化集群数据远端副本同步功能:数据多副本异步部署服务模块支持跨集群副本异步备份,基于分布式存储集群已有的多副本存储机制,将本地存储集群内的数据块异步的备份到远端分布式存储集群,确保本地存储集群损坏后,数据在远端分布式存储集群仍有有效备份,异步备份不影响本地数据副本写出效率;
数据多副本异步部署服务模块接收到远端备份请求,查看该集群是否已注册,如果已注册,则发送允许信号;接收到远端备份数据时,首先进行元数据记录,并将数据标记为特定集群的备份数据,同时开始备份数据存储;对于接收到的数据,数据多副本异步部署服务模块将进行数据一致性校验服务:包括检查接收到的数据是否完整,MD5校验值是否正确,数据是否与元数据匹配,如果数据一致性存在问题,则要求远端重发该数据块;
跨集群资源调度服务模块提供跨集群资源调度请求分发响应功能,用于接受跨集群资源调度请求,并将该请求转发到远端集群,远端集群的跨集群资源调度服务模块将根据该请求进行资源重建,具体过程包括如下步骤:
步骤1,本地跨集群资源调度服务模块接收到跨集群资源调度请求;
步骤2,本地跨集群资源调度服务模块检查该资源是否在跨集群高可用池中,若不在高可用池中,则返回错误,表明该资源不具备高可用能力,若在高可用池中,则继续步骤3;
步骤3,本地跨集群资源调度服务模块查询该资源的远端调度目标集群,获得该资源的远端调度目标集群后继续步骤4,未获得则返回错误,表明该资源无远端调度目标集群;
步骤4,跨集群资源调度服务模块提供跨集群资源调度请求分发响应功能:本地跨集群资源调度服务模块发起跨集群资源调度分发,将资源调度请求转发到该资源远端调度目标集群;
步骤5,远端跨集群资源调度服务模块进行跨集群资源调度响应,检查接收到的资源调度请求是否合法,若不合法,则返回错误到本地跨集群资源调度服务模块,若合法,则继续步骤6;
步骤6,远端跨集群资源调度服务模块基于跨集群元数据同步服务模块检查待恢复资源元数据完整性及合法性,如有问题,则请求本地跨集群资源调度服务模块重发待回复资源的元数据,若无问题,则继续步骤7;
步骤7,远端跨集群资源调度服务模块基于数据多副本异步部署服务模块检查待回复资源的数据完整性及合法性,如有问题,则请求本地跨集群资源调度服务模块通过本地数据多副本异步部署服务模块重发待恢复的数据,如果没有问题,则执行步骤8;
步骤8,远端跨集群资源调度服务模块进行元数据与数据匹配行检查,确保元数据与数据相匹配,若不匹配,则返回错误到本地跨集群资源调度服务模块,表明数据错误,调度失败,若匹配,则继续步骤9;
步骤9,远端跨集群资源调度服务模块进行资源重建,通过调用虚拟化集群的计算、存储、网络相关REST接口,将待恢复资源的元数据提供给虚拟化集群,由虚拟化集群基于远端跨集群资源调度服务模块所提供的元数据调用对应的数据进行虚拟资源重建;
步骤10,远端跨集群资源调度服务模块基于数据多副本异步部署服务模块进行已重建资源的多副本分发;
步骤11,根据具体需求,确定重建资源是否需要再次进行异端备份,并制定相应的备份策略,远端跨集群资源调度服务模块基于策略进行已重建资源的异端备份。
CN201710804995.0A 2017-09-08 2017-09-08 一种基于云计算的跨集群资源调度系统 Active CN107491343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710804995.0A CN107491343B (zh) 2017-09-08 2017-09-08 一种基于云计算的跨集群资源调度系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710804995.0A CN107491343B (zh) 2017-09-08 2017-09-08 一种基于云计算的跨集群资源调度系统

Publications (2)

Publication Number Publication Date
CN107491343A CN107491343A (zh) 2017-12-19
CN107491343B true CN107491343B (zh) 2020-04-17

Family

ID=60652265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710804995.0A Active CN107491343B (zh) 2017-09-08 2017-09-08 一种基于云计算的跨集群资源调度系统

Country Status (1)

Country Link
CN (1) CN107491343B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710547B (zh) * 2018-05-10 2020-10-27 腾讯科技(深圳)有限公司 一种数据备份方法、装置、终端及存储介质
CN108984122A (zh) * 2018-07-05 2018-12-11 柏建民 映射式远程存储操作技术
CN109144529B (zh) * 2018-08-02 2022-09-09 郑州市景安网络科技股份有限公司 操作系统模板下刷方法、装置、设备及可读存储介质
CN109164826B (zh) * 2018-08-15 2021-07-16 中国电子科技集团公司第二十研究所 一种基于改进蚁群算法的大规模无人集群控制方法
US10866757B2 (en) * 2018-09-26 2020-12-15 EMC IP Holding Company LLC System and method for providing backup services to high availability applications
CN109840166B (zh) * 2019-01-14 2021-03-30 京东数字科技控股有限公司 一种跨集群对象存储异步备份方法、装置和系统
CN111726388A (zh) * 2019-03-22 2020-09-29 苏宁易购集团股份有限公司 一种跨集群高可用的实现方法、装置、系统及设备
CN110113375A (zh) * 2019-03-26 2019-08-09 罗克佳华科技集团股份有限公司 资源共享方法及装置、系统、存储介质
CN111278010B (zh) * 2020-01-21 2022-12-27 北京佰才邦技术股份有限公司 一种备份信息方法、装置、存储介质和计算机设备
US11403401B2 (en) 2020-06-17 2022-08-02 International Business Machines Corporation Preventing unauthorized package deployment in clusters
CN112104723B (zh) * 2020-09-07 2024-03-15 腾讯科技(深圳)有限公司 一种多集群的数据处理系统及方法
CN112751938B (zh) * 2020-12-30 2023-04-07 上海赋算通云计算科技有限公司 一种基于多集群作业的实时数据同步系统,实现方法以及存储介质
CN112860796B (zh) * 2021-02-08 2023-07-25 北京百度网讯科技有限公司 用于同步数据的方法、装置、设备以及存储介质
CN113806066A (zh) * 2021-04-06 2021-12-17 京东科技控股股份有限公司 大数据资源调度方法、系统和存储介质
CN114035899B (zh) * 2021-11-15 2022-10-25 中原银行股份有限公司 一种跨集群参数的配置方法、装置及电子设备
CN115314363B (zh) * 2022-02-22 2024-04-12 网宿科技股份有限公司 服务恢复方法、服务部署方法、服务器及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101969475A (zh) * 2010-11-15 2011-02-09 张军 基于云计算的商业数据可控分发与融合应用系统
CN102307221A (zh) * 2011-03-25 2012-01-04 国云科技股份有限公司 一种云存储系统及其实现方法
CN103458044A (zh) * 2013-09-12 2013-12-18 北京航空航天大学 一种面向广域网环境下多存储集群的元数据共享管理方法
CN104050015A (zh) * 2014-06-27 2014-09-17 国家计算机网络与信息安全管理中心 一种虚拟机镜像存储分发系统
CN105183400A (zh) * 2015-10-23 2015-12-23 浪潮(北京)电子信息产业有限公司 一种基于内容寻址的对象存储方法和系统
US9426220B2 (en) * 2013-04-06 2016-08-23 Citrix Systems, Inc. Systems and methods for reliable replication of an application-state, distributed replication table

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030101160A1 (en) * 2001-11-26 2003-05-29 International Business Machines Corporation Method for safely accessing shared storage

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101969475A (zh) * 2010-11-15 2011-02-09 张军 基于云计算的商业数据可控分发与融合应用系统
CN102307221A (zh) * 2011-03-25 2012-01-04 国云科技股份有限公司 一种云存储系统及其实现方法
US9426220B2 (en) * 2013-04-06 2016-08-23 Citrix Systems, Inc. Systems and methods for reliable replication of an application-state, distributed replication table
CN103458044A (zh) * 2013-09-12 2013-12-18 北京航空航天大学 一种面向广域网环境下多存储集群的元数据共享管理方法
CN104050015A (zh) * 2014-06-27 2014-09-17 国家计算机网络与信息安全管理中心 一种虚拟机镜像存储分发系统
CN105183400A (zh) * 2015-10-23 2015-12-23 浪潮(北京)电子信息产业有限公司 一种基于内容寻址的对象存储方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
云计算安全接入及存储机制研究;朱仲马;《万方数据库》;20150630;全文 *
基于虚拟机迁移的虚拟机集群资源调度;周文煜 等;《华中科技大学学报(自然科学版)》;20110630;全文 *

Also Published As

Publication number Publication date
CN107491343A (zh) 2017-12-19

Similar Documents

Publication Publication Date Title
CN107491343B (zh) 一种基于云计算的跨集群资源调度系统
US20180308091A1 (en) Fairness preserving byzantine agreements
Cristian et al. Fault-tolerance in the advanced automation system
ES2703901T3 (es) Sistema de archivo distribuido mediante nodos de consenso
US9389892B2 (en) Multiple points in time disk images for disaster recovery
US6367029B1 (en) File server system tolerant to software and hardware failures
EP3623963B1 (en) Log entry duplication method and device, computer equipment, and storage medium
US9882980B2 (en) Managing continuous priority workload availability and general workload availability between sites at unlimited distances for products and services
US7996718B1 (en) Techniques for continuous data protection
US20060143497A1 (en) System, method and circuit for mirroring data
US11080690B2 (en) Device, system, method and computer program product for processing electronic transaction requests
WO2017067484A1 (zh) 一种虚拟化数据中心调度系统和方法
CN110392120B (zh) 一种消息推送过程中故障的恢复方法及装置
CN107241430A (zh) 一种基于分布式存储的企业级容灾系统及容灾控制方法
CN108964986B (zh) 协同办公系统应用级双活灾备系统
CN103077242A (zh) 一种实现数据库服务器双机热备的方法
US7797571B2 (en) System, method and circuit for mirroring data
JP2007518195A (ja) リモートデータミラーリングを用いたクラスタデータベース
WO2012171349A1 (zh) 一种分布式自增计数的实现方法、装置及系统
CN113312656B (zh) 数据轮转方法、装置、设备及系统
CN110351122B (zh) 容灾方法、装置、系统与电子设备
US10671596B1 (en) Consistency determination
CN110851528A (zh) 数据库同步方法、装置、存储介质及计算机设备
US20090106781A1 (en) Remote call handling methods and systems
CN115248746A (zh) 数据备份方法、系统及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200117

Address after: 210000 No. 1 East Garden Street, Qinhuai District, Jiangsu, Nanjing

Applicant after: China Electric Rice Information System Co., Ltd.

Address before: 210007 No. 1 East Street, alfalfa garden, Jiangsu, Nanjing

Applicant before: The 28th Research Institute of China Electronic Science and Technology Group Corporation

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant