CN114338727B - 服务集群的构建方法及相关装置 - Google Patents

服务集群的构建方法及相关装置 Download PDF

Info

Publication number
CN114338727B
CN114338727B CN202210008498.0A CN202210008498A CN114338727B CN 114338727 B CN114338727 B CN 114338727B CN 202210008498 A CN202210008498 A CN 202210008498A CN 114338727 B CN114338727 B CN 114338727B
Authority
CN
China
Prior art keywords
site
candidate
auxiliary
target
sites
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210008498.0A
Other languages
English (en)
Other versions
CN114338727A (zh
Inventor
黄硕
王冀康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202210008498.0A priority Critical patent/CN114338727B/zh
Publication of CN114338727A publication Critical patent/CN114338727A/zh
Application granted granted Critical
Publication of CN114338727B publication Critical patent/CN114338727B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开服务集群的构建方法及相关装置,通过获得服务集群的构建请求,其中,构建请求包括主站点标识和目标平均修复时间;根据主站点标识,确定主站点的候选站点集合,其中包括至少一个候选站点,不同候选站点处在不同地理区域;根据目标平均修复时间和各候选站点的当前带宽使用量,从候选站点集合中选择满足条件的候选站点构成辅助站点集合;分别根据辅助站点集合中的各候选站点与主站点之间的历史故障数据,确定各候选站点的故障趋势;根据各候选站点的故障趋势,从辅助站点集合中选择满足条件的候选站点作为目标辅助站点;根据选择的目标辅助站点和主站点,构建相应的服务集群。本发明不仅效率高,而且客观性比较强,比较客观准确。

Description

服务集群的构建方法及相关装置
技术领域
本发明涉及云计算领域,特别涉及一种服务集群的构建方法及相关装置。
背景技术
所谓服务集群是指由两个或两个以上位于不同区域的同类集群站点组成的集群。服务集群内的集群站点,可分为主站点和辅站点(也称为辅助站点)。一方面,主站点交易产生的数据通过实时同步数据复制,能够达到多站点数据的实时同步和零丢失。例如,基于异步复制原理的IBM XRC或Q-REP复制技术实现双站点之间的实时同步数据复制及零丢失。这保证了当主站点发生非计划性停机,如站点发生灾难时,辅站点能迅速接管由原主站点所提供的服务,避免因单一集群站点发生全局性故障或灾难事件引发业务系统中断运行。
但在受到主站点和辅站点间网络链路质量和传输带宽的影响,时常出现数据丢失或者数据复制的延时,从而导致辅站点需要较长的数据修复时间,严重影响服务集群的高可用性。因此,选择与主站点之间网络链路传输质量优良和带宽富足的区域作为辅站点的建站区域,将是所构建服务集群高可用的基本保障。但目前均是通过人工凭借经验选择辅助站点,不仅效率低,而且主观性比较强,不够客观准确。
发明内容
鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的服务集群的构建方法及相关装置。
第一方面,一种服务集群的构建方法,包括:
获得服务集群的构建请求,其中,所述构建请求至少包括目标主站点的主站点标识和目标平均修复时间;
根据所述主站点标识,确定所述主站点的候选站点集合,其中,所述候选站点集合包括至少一个候选站点,不同候选站点处在不同地理区域;
根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合;
分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势;
根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点;
根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群。
结合第一方面,在某些可选的实施方式中,所述根据所述主站点标识,确定所述主站点的候选站点集合,包括:
根据所述主站点标识,测试各站点与所述主站点之间的通信连接情况;
将与所述主站点通信连接的站点作为所述候选站点集合的候选站点。
结合第一方面,在某些可选的实施方式中,所述根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合,包括:
分别获得各所述候选站点的当前带宽使用量和总带宽量,以及所述主站点的最大字节数;
根据公式1:BWneed=BITbig×3÷Tre,计算得到目标辅助站点的带宽需求,其中,所述BWneed为所述带宽需求,所述BITbig为所述最大字节数,所述Tre为所述目标平均修复时间;
根据公式2:BWrest(i)=BWall(i)-BWuse(i),分别计算得到各所述候选站点的当前剩余带宽量,其中,所述i为候选站点的编号,所述BWrest(i)为编号为i的候选站点的当前剩余带宽量,所述BWall(i)为编号为i的候选站点的总带宽量,所述BWuse(i)为编号为i的候选站点的当前带宽使用量;
分别确定各所述候选站点的当前剩余带宽量与所述带宽需求之间的带宽差距;
选择所述带宽差距不大于预设带宽阈值的候选站点构成所述辅助站点集合。
结合第一方面,在某些可选的实施方式中,所述分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势,包括:
分别获得所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,其中,每个所述候选站点的所述历史故障数据均至少包括故障发生周期和周期故障次数;
分别根据各所述候选站点的故障发生周期和周期故障次数,确定各相应所述候选站点的故障趋势。
结合上一个实施方式,在某些可选的实施方式中,所述根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点,包括:
将所述周期故障次数呈下降趋势且所述故障发生周期呈增大趋势的候选站点作为所述目标辅助站点。
结合第一方面,在某些可选的实施方式中,所述根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群,包括:
从云端获得与所述主站点一致的资源,其中,所述资源至少包括网络资源、存储资源和计算资源;
根据获得的资源,配置和部署所述目标辅助站点;
创建所述主站点与所述目标辅助站点的数据备份模式,以及站点切换模式,从而建立相应的所述服务集群。
第二方面,一种服务集群的构建装置,包括:构建请求获得单元、候选集合确定单元、辅助集合确定单元、故障确趋势确定单元、目标站点选择单元和集群构建单元;
所述构建请求获得单元,用于获得服务集群的构建请求,其中,所述构建请求至少包括目标主站点的主站点标识和目标平均修复时间;
所述候选集合确定单元,用于根据所述主站点标识,确定所述主站点的候选站点集合,其中,所述候选站点集合包括至少一个候选站点,不同候选站点处在不同地理区域;
所述辅助集合确定单元,用于根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合;
所述故障确趋势确定单元,用于分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势;
所述目标站点选择单元,用于根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点;
所述集群构建单元,用于根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群。
结合第二方面,在某些可选的实施方式中,所述候选集合确定单元,包括:连接情况确定子单元和候选集合确定子单元;
所述连接情况确定子单元,用于根据所述主站点标识,测试各站点与所述主站点之间的通信连接情况;
所述候选集合确定子单元,用于将与所述主站点通信连接的站点作为所述候选站点集合的候选站点。
第三方面,一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的服务集群的构建方法。
第四方面,一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述任一项所述的服务集群的构建方法。
借由上述技术方案,本发明提供的服务集群的构建方法及相关装置,通过获得服务集群的构建请求,其中,所述构建请求至少包括目标主站点的主站点标识和目标平均修复时间;根据所述主站点标识,确定所述主站点的候选站点集合,其中,所述候选站点集合包括至少一个候选站点,不同候选站点处在不同地理区域;根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合;分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势;根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点;根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群。由此可以看出,本发明可以通过实际的监控数据,选择与主站点之间带宽足够大且网络传输质量稳定的地域节点作为辅助节点之建站地域节点,从而实现容灾级高可用服务集群的建立和供应。本发明不仅效率高,而且客观性比较强,比较客观准确。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明提供的一种服务集群的构建方法的流程图;
图2示出了本发明提供的一种服务集群的构建装置的结构示意图;
图3示出了本发明提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明提供了一种服务集群的构建方法,包括:S100、S200、S300、S400、S500和S600;
S100、获得服务集群的构建请求,其中,所述构建请求至少包括目标主站点的主站点标识和目标平均修复时间;
可选的,本发明的执行主体可以接收外部的构建请求,例如高可用服务请求,并对构建请求进行解析得到相应的请求信息。其中,所述请求信息包括主站点标识和目标平均修复时间。
可选的,主站点标识用于表征需要构建辅助站点的目标主站点,以便于后续确定与目标主站点通信连接的站点,本发明对此不做限制。
可选的,目标平均修复时间指的是所需要构建的辅助站点的平均修复时间,该值属于本领域的公知概念,可以根据实际工程需要进行设定,本发明对此不做限制。
可选的,请求信息中除了可以包括主站点标识和目标平均修复时间,还可以包括:请求类型、主站点区域和高可用级别等,本发明对此不做限制。
可选的,本发明所述的主站点可以是已经部署好并作为主站点使用的站点,本发明对此不做限制。
S200、根据所述主站点标识,确定所述主站点的候选站点集合,其中,所述候选站点集合包括至少一个候选站点,不同候选站点处在不同地理区域;
可选的,通过主站点标识,可以在相应的通信测试模块中测试各个站点与主站点之间的通信连接情况。将与主站点通信连接的站点作为候选站点,将与主站点断开通信的站点排除,从而确定候选站点集合。例如,结合图1所示的实施方式,在某些可选的实施方式中,所述S200包括:步骤1.1和步骤1.2;
步骤1.1、根据所述主站点标识,测试各站点与所述主站点之间的通信连接情况;
步骤1.2、将与所述主站点通信连接的站点作为所述候选站点集合的候选站点。
可选的,除了可以根据通信连接情况筛选候选站点,还可以结合各个站点的每日数据增涨量、距离成本和宽带价格成本等条件,综合确定候选站点集合的各候选站点,本发明对此不做限制。
S300、根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合;
可选的,作为辅助站点,不仅要求与主站点通信连接,还要求当前剩余带宽量满足实际需求。例如,结合图1所示的实施方式,在某些可选的实施方式中,所述S300包括:步骤2.1、步骤2.2、步骤2.3、步骤2.4和步骤2.5;
步骤2.1、分别获得各所述候选站点的当前带宽使用量和总带宽量,以及所述主站点的最大字节数;
可选的,当前带宽使用量表征的是候选站点的总带宽中当前已经被占用了多少;总带宽量表征的是候选站点在建站是建立的带宽总量,本发明对此不做限制。
可选的,主站点的最大字节数表征的是主站点的最大存储量,相应也表征需要存储量不小于最大字节数的辅助站点,本发明对此不做限制。
步骤2.2、根据公式1:BWneed=BITbig×3÷Tre,计算得到目标辅助站点的带宽需求,其中,所述BWneed为所述带宽需求,所述BITbig为所述最大字节数,所述Tre为所述目标平均修复时间;
可选的,带宽需求体现的是至少需要使用多大带宽的辅助站点,本发明对此不做限制。
步骤2.3、根据公式2:BWrest(i)=BWall(i)-BWuse(i),分别计算得到各所述候选站点的当前剩余带宽量,其中,所述i为候选站点的编号,所述BWrest(i)为编号为i的候选站点的当前剩余带宽量,所述BWall(i)为编号为i的候选站点的总带宽量,所述BWuse(i)为编号为i的候选站点的当前带宽使用量;
可选的,通过计算各个候选站点的当前剩余带宽量,以便于后续确定各个候选站点是否适合作为辅助站点集合中的站点。即,当前剩余带宽量满足带宽需求条件的候选站点才可以作为辅助站点集合中的站点。
步骤2.4、分别确定各所述候选站点的当前剩余带宽量与所述带宽需求之间的带宽差距;
可选的,本发明对于计算带宽差距的方式不做具体限制,任何可行的方式均属于本发明的保护范围。例如,本发明可以采用作差或者相除的计算方式计算带宽差距,本发明对此不做限制。
步骤2.5、选择所述带宽差距不大于预设带宽阈值的候选站点构成所述辅助站点集合。
可选的,本发明对于预设带宽阈值不做限制,可以根据实际需要进行设定。
S400、分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势;
可选的,本发明可以获得候选站点与主站点之间的历史故障数据,历史故障数据可以体现出各个候选站点发生周期性故障的周期长度和周次故障次数。例如,结合图1所示的实施方式,在某些可选的实施方式中,所述S400包括:步骤3.1和步骤3.2;
步骤3.1、分别获得所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,其中,每个所述候选站点的所述历史故障数据均至少包括故障发生周期和周期故障次数;
步骤3.2、分别根据各所述候选站点的故障发生周期和周期故障次数,确定各相应所述候选站点的故障趋势。
可选的,通过历史故障数据可以分析得到各个候选站点未来发生故障的故障趋势,包括故障发生周期的变化趋势和周期故障次数的变化趋势。其中,周期故障次数表征的是在各个故障发生周期内发生故障的总次数,本发明对此不做限制。
S500、根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点;
例如,结合上一个实施方式,在某些可选的实施方式中,所述S500包括:将所述周期故障次数呈下降趋势且所述故障发生周期呈增大趋势的候选站点作为所述目标辅助站点。
一般而言,若候选站点的故障趋势为总体发生故障的概率逐渐增强,则不适合作为辅助站点;若候选站点的故障趋势为总体发生故障的概率逐渐降低,则可以考虑作为辅助站点,本发明对此不做限制。
S600、根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群。
可选的,从上述过程可以知道,辅助站点的选择既要选择网络带宽大的,还要选择通信链路质量优越的。而影响网络带宽和通信链路质量的因素有很多共同因素,有些甚至每时每刻都在变化。为此,进行定量分析时,可以构建模型,例如,假设(x,y)是影响宽带和通信链路质量的共同因素,假设x和y是其中的影响因子,则宽带F(x,y*(x)),通信链路质量f(x,y),为求宽带的最大值和通信链路质量的最大值有下列公式:
利用KKT条件将上述各个公式转化为下述各个公式: 由此可求的满足多目标,多约束条件下的最优解,继而求的同时满足宽带和通信链路质量相关条件下的最优值。
可选的,本发明对于在选择好目标辅助站点之后,构建相应的服务集群的过程不做限制。例如,结合图1所示的实施方式,在某些可选的实施方式中,所述S600包括:步骤4.1、步骤4.2和步骤4.3;
步骤4.1、从云端获得与所述主站点一致的资源,其中,所述资源至少包括网络资源、存储资源和计算资源;
步骤4.2、根据获得的资源,配置和部署所述目标辅助站点;
步骤4.3、创建所述主站点与所述目标辅助站点的数据备份模式,以及站点切换模式,从而建立相应的所述服务集群。
如图2所示,本发明提供了一种服务集群的构建装置,包括:构建请求获得单元100、候选集合确定单元200、辅助集合确定单元300、故障确趋势确定单元400、目标站点选择单元500和集群构建单元600;
所述构建请求获得单元100,用于获得服务集群的构建请求,其中,所述构建请求至少包括目标主站点的主站点标识和目标平均修复时间;
所述候选集合确定单元200,用于根据所述主站点标识,确定所述主站点的候选站点集合,其中,所述候选站点集合包括至少一个候选站点,不同候选站点处在不同地理区域;
所述辅助集合确定单元300,用于根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合;
所述故障确趋势确定单元400,用于分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势;
所述目标站点选择单元500,用于根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点;
所述集群构建单元600,用于根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群。
结合图2所示的实施方式,在某些可选的实施方式中,所述候选集合确定单元200,包括:连接情况确定子单元和候选集合确定子单元;
所述连接情况确定子单元,用于根据所述主站点标识,测试各站点与所述主站点之间的通信连接情况;
所述候选集合确定子单元,用于将与所述主站点通信连接的站点作为所述候选站点集合的候选站点。
结合图2所示的实施方式,在某些可选的实施方式中,所述辅助集合确定单元300包括:带宽量获得子单元、带宽需求计算子单元、剩余带宽计算子单元、带宽差距确定子单元和辅助集合构建子单元;
带宽量获得子单元,用于分别获得各所述候选站点的当前带宽使用量和总带宽量,以及所述主站点的最大字节数;
带宽需求计算子单元,用于根据公式1:BWneed=BITbig×3÷Tre,计算得到目标辅助站点的带宽需求,其中,所述BWneed为所述带宽需求,所述BITbig为所述最大字节数,所述Tre为所述目标平均修复时间;
剩余带宽计算子单元,用于根据公式2:BWrest(i)=BWall(i)-BWuse(i),分别计算得到各所述候选站点的当前剩余带宽量,其中,所述i为候选站点的编号,所述BWrest(i)为编号为i的候选站点的当前剩余带宽量,所述BWall(i)为编号为i的候选站点的总带宽量,所述BWuse(i)为编号为i的候选站点的当前带宽使用量;
带宽差距确定子单元,用于分别确定各所述候选站点的当前剩余带宽量与所述带宽需求之间的带宽差距;
辅助集合构建子单元,用于选择所述带宽差距不大于预设带宽阈值的候选站点构成所述辅助站点集合。
结合图2所示的实施方式,在某些可选的实施方式中,所述故障确趋势确定单元400包括:故障数据获得子单元和故障趋势确定子单元;
故障数据获得子单元,用于分别获得所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,其中,每个所述候选站点的所述历史故障数据均至少包括故障发生周期和周期故障次数;
故障趋势确定子单元,用于分别根据各所述候选站点的故障发生周期和周期故障次数,确定各相应所述候选站点的故障趋势。
结合上一个实施方式,在某些可选的实施方式中,所述目标站点选择单元500包括:目标站点选择子单元;
目标站点选择子单元,用于将所述周期故障次数呈下降趋势且所述故障发生周期呈增大趋势的候选站点作为所述目标辅助站点。
结合图2所示的实施方式,在某些可选的实施方式中,所述集群构建单元600包括:资源获得子单元、站点部署子单元和集群建立子单元;
资源获得子单元,用于从云端获得与所述主站点一致的资源,其中,所述资源至少包括网络资源、存储资源和计算资源;
站点部署子单元,用于根据获得的资源,配置和部署所述目标辅助站点;
集群建立子单元,用于创建所述主站点与所述目标辅助站点的数据备份模式,以及站点切换模式,从而建立相应的所述服务集群。
本发明提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的服务集群的构建方法。
所述服务集群的构建装置包括处理器和存储器,上述构建请求获得单元100、候选集合确定单元200、辅助集合确定单元300、故障确趋势确定单元400、目标站点选择单元500和集群构建单元600等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现服务集群的构建方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述服务集群的构建方法。
如图3所示,本发明实施例提供了一种电子设备70,所述电子设备70包括至少一个处理器701、以及与所述处理器701连接的至少一个存储器702、总线703;其中,所述处理器701、所述存储器702通过所述总线703完成相互间的通信;所述处理器701用于调用所述存储器702中的程序指令,以执行上述任一项所述的服务集群的构建方法。本文中的电子设备可以是服务器、PC、PAD、手机等。
本申请是参照根据本申请实施例的方法、装置、电子设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,电子设备包括一个或多个处理器(CPU)、存储器和总线。电子设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种服务集群的构建方法,其特征在于,包括:
获得服务集群的构建请求,其中,所述构建请求至少包括目标主站点的主站点标识和目标平均修复时间;
根据所述主站点标识,确定所述主站点的候选站点集合,其中,所述候选站点集合包括至少一个候选站点,不同候选站点处在不同地理区域;
根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合;
分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势;
根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点;
根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群。
2.根据权利要求1所述的方法,其特征在于,所述根据所述主站点标识,确定所述主站点的候选站点集合,包括:
根据所述主站点标识,测试各站点与所述主站点之间的通信连接情况;
将与所述主站点通信连接的站点作为所述候选站点集合的候选站点。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合,包括:
分别获得各所述候选站点的当前带宽使用量和总带宽量,以及所述主站点的最大字节数;
根据公式1:BWneed=BITbig×3÷Tre,计算得到目标辅助站点的带宽需求,其中,所述BWneed为所述带宽需求,所述BITbig为所述最大字节数,所述Tre为所述目标平均修复时间;
根据公式2:BWrest(i)=BWall(i)-BWuse(i),分别计算得到各所述候选站点的当前剩余带宽量,其中,所述i为候选站点的编号,所述BWrest(i)为编号为i的候选站点的当前剩余带宽量,所述BWall(i)为编号为i的候选站点的总带宽量,所述BWuse(i)为编号为i的候选站点的当前带宽使用量;
分别确定各所述候选站点的当前剩余带宽量与所述带宽需求之间的带宽差距;
选择所述带宽差距不大于预设带宽阈值的候选站点构成所述辅助站点集合。
4.根据权利要求1所述的方法,其特征在于,所述分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势,包括:
分别获得所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,其中,每个所述候选站点的所述历史故障数据均至少包括故障发生周期和周期故障次数;
分别根据各所述候选站点的故障发生周期和周期故障次数,确定各相应所述候选站点的故障趋势。
5.根据权利要求4所述的方法,其特征在于,所述根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点,包括:
将所述周期故障次数呈下降趋势且所述故障发生周期呈增大趋势的候选站点作为所述目标辅助站点。
6.根据权利要求1所述的方法,其特征在于,所述根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群,包括:
从云端获得与所述主站点一致的资源,其中,所述资源至少包括网络资源、存储资源和计算资源;
根据获得的资源,配置和部署所述目标辅助站点;
创建所述主站点与所述目标辅助站点的数据备份模式,以及站点切换模式,从而建立相应的所述服务集群。
7.一种服务集群的构建装置,其特征在于,包括:构建请求获得单元、候选集合确定单元、辅助集合确定单元、故障确趋势确定单元、目标站点选择单元和集群构建单元;
所述构建请求获得单元,用于获得服务集群的构建请求,其中,所述构建请求至少包括目标主站点的主站点标识和目标平均修复时间;
所述候选集合确定单元,用于根据所述主站点标识,确定所述主站点的候选站点集合,其中,所述候选站点集合包括至少一个候选站点,不同候选站点处在不同地理区域;
所述辅助集合确定单元,用于根据所述目标平均修复时间和各所述候选站点的当前带宽使用量,从所述候选站点集合中选择满足条件的候选站点构成辅助站点集合;
所述故障确趋势确定单元,用于分别根据所述辅助站点集合中的各所述候选站点与所述主站点之间的历史故障数据,确定各所述候选站点的故障趋势;
所述目标站点选择单元,用于根据各所述候选站点的所述故障趋势,从所述辅助站点集合中选择满足条件的候选站点作为目标辅助站点;
所述集群构建单元,用于根据选择的所述目标辅助站点和所述主站点,构建相应的服务集群。
8.根据权利要求7所述的装置,其特征在于,所述候选集合确定单元,包括:连接情况确定子单元和候选集合确定子单元;
所述连接情况确定子单元,用于根据所述主站点标识,测试各站点与所述主站点之间的通信连接情况;
所述候选集合确定子单元,用于将与所述主站点通信连接的站点作为所述候选站点集合的候选站点。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1至6中任一项所述的服务集群的构建方法。
10.一种电子设备,其特征在于,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至6中任一项所述的服务集群的构建方法。
CN202210008498.0A 2022-01-05 2022-01-05 服务集群的构建方法及相关装置 Active CN114338727B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210008498.0A CN114338727B (zh) 2022-01-05 2022-01-05 服务集群的构建方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210008498.0A CN114338727B (zh) 2022-01-05 2022-01-05 服务集群的构建方法及相关装置

Publications (2)

Publication Number Publication Date
CN114338727A CN114338727A (zh) 2022-04-12
CN114338727B true CN114338727B (zh) 2024-03-12

Family

ID=81024149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210008498.0A Active CN114338727B (zh) 2022-01-05 2022-01-05 服务集群的构建方法及相关装置

Country Status (1)

Country Link
CN (1) CN114338727B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN104283948A (zh) * 2014-09-26 2015-01-14 东软集团股份有限公司 服务器集群系统及其负载均衡实现方法
CN107453929A (zh) * 2017-09-22 2017-12-08 中国联合网络通信集团有限公司 集群系统自构建方法、装置及集群系统
CN107819808A (zh) * 2016-09-14 2018-03-20 北京百度网讯科技有限公司 通信连接建立方法和装置
CN112422320A (zh) * 2020-10-27 2021-02-26 北京金山云网络技术有限公司 服务器的主从切换方法、装置和服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110047413A1 (en) * 2009-08-20 2011-02-24 Mcgill Robert E Methods and devices for detecting service failures and maintaining computing services using a resilient intelligent client computer
WO2014068615A1 (en) * 2012-10-30 2014-05-08 Hitachi, Ltd. Storage system and data processing method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217402A (zh) * 2008-01-15 2008-07-09 杭州华三通信技术有限公司 一种提高集群可靠性的方法和一种高可靠性通信节点
CN104283948A (zh) * 2014-09-26 2015-01-14 东软集团股份有限公司 服务器集群系统及其负载均衡实现方法
CN107819808A (zh) * 2016-09-14 2018-03-20 北京百度网讯科技有限公司 通信连接建立方法和装置
CN107453929A (zh) * 2017-09-22 2017-12-08 中国联合网络通信集团有限公司 集群系统自构建方法、装置及集群系统
CN112422320A (zh) * 2020-10-27 2021-02-26 北京金山云网络技术有限公司 服务器的主从切换方法、装置和服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向军事业务的容灾模型研究;陈海涛;卢宇彤;朱敏;王少帅;李志勇;;计算机工程与科学;20090215(02);18-20、23 *

Also Published As

Publication number Publication date
CN114338727A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN109412829B (zh) 一种资源配置的预测方法及设备
CN108632365B (zh) 服务资源调整方法、相关装置和设备
CN109412966B (zh) 一种大规模日志传输方法、装置及系统
CN113259148B (zh) 基于联邦学习的告警关联检测方法、系统及介质
CN110413685A (zh) 数据库服务切换方法、装置、可读存储介质和计算机设备
CN111966289A (zh) 基于Kafka集群的分区优化方法和系统
CN109218441A (zh) 一种基于预测和区域划分的p2p网络动态负载均衡方法
CN111641521A (zh) 一种基于Ambari的云上部署大数据集群的方法
CN114338727B (zh) 服务集群的构建方法及相关装置
CN109525036A (zh) 一种通信设备的市电供应状态的监控方法、装置和系统
CN111064613B (zh) 一种网络故障检测方法及装置
RU2532714C2 (ru) Способ получения данных при оценке ресурсов сети и устройство для осуществления способа
CN108804210B (zh) 一种云平台的资源配置方法及装置
JP5813771B2 (ja) 分散型データ記憶システムにデータを記憶する方法およびこれに対応する装置
CN114546714B (zh) 一种数据备份方法、系统、装置以及存储介质
CN113395319A (zh) 网络故障感知的方法、系统、电子设备及存储介质
Lim et al. Communication of technical QoS among cloud brokers
CN111597047A (zh) 一种服务部署方法、装置、电子设备及存储介质
CN115486028B (zh) 健康检查方法与装置、电子设备及存储介质
CN115361388B (zh) 一种边缘云计算系统中的资源调度方法及装置
CN111435919B (zh) 一种配置参数的管理方法、装置及系统
CN115834603A (zh) 数据的同步方法及装置、存储介质和处理器
CN117032973A (zh) 数据处理的方法、装置、处理设备及存储介质
CN117061045A (zh) 换流站中时间同步方法、装置、系统、存储介质及处理器
CN118138632A (zh) 一种微服务架构的扩展处理方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant