CN114915633A - 公有云网络中调度用户到网关集群的方法、设备及介质 - Google Patents

公有云网络中调度用户到网关集群的方法、设备及介质 Download PDF

Info

Publication number
CN114915633A
CN114915633A CN202210426861.0A CN202210426861A CN114915633A CN 114915633 A CN114915633 A CN 114915633A CN 202210426861 A CN202210426861 A CN 202210426861A CN 114915633 A CN114915633 A CN 114915633A
Authority
CN
China
Prior art keywords
cluster
gateway
target
target user
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210426861.0A
Other languages
English (en)
Inventor
何杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba Cloud Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Cloud Computing Ltd filed Critical Alibaba Cloud Computing Ltd
Priority to CN202210426861.0A priority Critical patent/CN114915633A/zh
Publication of CN114915633A publication Critical patent/CN114915633A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1021Server selection for load balancing based on client or server locations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1023Server selection for load balancing based on a hash applied to IP addresses or costs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例提供一种公有云网络中调度用户到网关集群的方法、设备及介质。该方法包括:确定公有云网络中需要分配网关集群的目标用户,目标用户归属于目标地区,获取公有云网络中目标地区内部署的多个网关集群的集群负载,以及该网关集群对应的网络时延,根据集群负载和网络时延,采用选择与目标用户的需求特点匹配的网关集群的原则,从该多个网关集群中选择一个作为目标用户对应的目标网关集群,并将目标用户的路由表配置给目标网关集群。本申请能够降低人工成本。

Description

公有云网络中调度用户到网关集群的方法、设备及介质
技术领域
本申请涉及云计算技术领域,尤其涉及一种公有云网络中调度用户到网关集群的方法、设备及介质。
背景技术
公有云网络中的网关集群具有为广大用户提供数据转发的能力,网关集群中包括了多个网关。
其中,公有云网络中的网关集群是分布式的,同一地区中可以分布式设置多个网关集群,属于同一用户的数据可以由多个网关集群中的一个网关集群进行转发。在由于需求特点、集群运营建设等原因,需要将某些用户从其当前所在的网关集群上迁出时,通常是需要运维人员人工规划、迁移,人工成本较高。
发明内容
本申请实施例提供一种公有云网络中调度用户到网关集群的方法、设备及介质,用以解决现有技术中人工成本较高的问题。
第一方面,本申请实施例提供一种公有云网络中调度用户到网关集群的方法,包括:
确定所述公有云网络中需要分配网关集群的目标用户,所述目标用户归属于目标地区,所述公有云网络中所述目标地区内部署的网关集群的数量为多个;
获取所述多个网关集群的集群负载以及所述多个网关集群对应的网络时延;
根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,所述目标用户的需求特点用于表征所述目标用户的时延要求和吞吐量要求;
将针对所述目标用户的路由表配置给所述目标网关集群。
第二方面,本申请实施例提供一种公有云网络中调度用户到网关集群的装置,包括:
确定模块,用于确定所述公有云网络中需要分配网关集群的目标用户,所述目标用户归属于目标地区,所述公有云网络中所述目标地区内部署的网关集群的数量为多个;
获取模块,用于获取所述多个网关集群的集群负载以及所述多个网关集群对应的网络时延;
选择模块,用于根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,所述目标用户的需求特点用于表征所述目标用户的时延要求和吞吐量要求;
配置模块,用于将针对所述目标用户的路由表配置给所述目标网关集群。
第三方面,本申请实施例提供一种计算机设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如第一方面中任一项所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被执行时,实现如第一方面中任一项所述的方法。
本申请实施例还提供一种计算机程序,当所述计算机程序被计算机执行时,用于实现如第一方面任一项所述的方法。
在本申请实施例中,确定公有云网络中需要分配网关集群的目标用户,目标用户归属于目标地区,获取公有云网络中目标地区内部署的多个网关集群的集群负载,以及该网关集群对应的网络时延,根据集群负载和网络时延,采用选择与目标用户的需求特点匹配的网关集群的原则,从该多个网关集群中选择一个作为目标用户对应的目标网关集群,并将目标用户的路由表配置给目标网关集群,实现了根据集群负载和网络时延,自动将公有云网络中需要分配网关集群的目标用户(例如新上云的用户或者需要从其当前所在的网关集群迁出的用户)调度到网关集群,无需人工调度,从而能够降低人工成本。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例应用的公有云网络的架构示意图;
图2为公有云网络中的虚拟机访问公网发包的示意图;
图3为本申请一实施例提供的公有云网络中调度用户到网关集群的方法的流程示意图;
图4为本申请实施例提供的采集集群负载以及集群健康状态的示意图;
图5为本申请实施例提供的探测网络时延的示意图;
图6为本申请实施例提供的为用户选择对应的网关集群的示意图;
图7为本申请一实施例提供的统计、分析信息给出调度方案并执行调度的示意图;
图8为本申请一实施例提供的公有云网络中调度用户到网关集群的装置的结构示意图;
图9为本申请一实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
图1为本申请实施例应用的公有云网络的架构示意图。如图1所示,在公有云网络中用户(也可以称为租户)可以自定义自己的私有网络(即图1中的专有网络,具体可以为虚拟私有云(Virtual Private Cloud,VPC)),不同专有网络之间逻辑隔离,用户可以在自建的专有网络内创建和管理虚拟机。交换机是组成专有网络的基础网络设备,可以用于连接不同的虚拟机;网关是专有网络的枢纽,可以连接专有网络的各个交换机,同时也可以是连接专有网络和其他网络(例如公网(Internet)和用户的本地网络)的网关设备。
其中,交换机和网关是专有网络中的软件模块,运维人员可以通过控制台对交换机和网关进行配置,具体的,响应于运维人员的配置操作,控制台可以通过调用API的方式触发管控节点向交换机和网关下发配置信息,以实现对交换机和网关进行配置,对应图1中的配置通路。
以虚拟机访问公网发包为例,如图2所示,虚拟机访问公网的报文首先从虚拟机发送到交换机(第①步),第②步从交换机发送到网关,第③步从网关发送到公网,对应图1中的数据通路。
在公有云网络中,多个重要的组件都是以集群形式提供服务,承载大流量的网关同样是以集群形式提供服务,可以称为网关集群。虚拟机发送的报文中可以携带虚拟机所属用户的虚拟网络标识(例如VXLAN网络标识(VXLAN Network Identifier,VNI)),网关集群在接收到报文后,可以解析得到虚拟网络标识,根据虚拟网络标识确定对应的路由表,并根据路由表对报文进行转发。其中,根据一用户的虚拟网络标识确定的对应路由表为该用户的路由表。当某一用户的路由表被配置给某一网关集群后,该网关集群可以对属于该用户的虚拟机的报文进行转发,该用户可以理解为该网关集群承载的用户,该网关集群可以理解为该用户所在的网关集群,同一网关集群可以承载多个用户。应理解,路由表中可以包括路由表项,路由表项可以简称为表项。
公有云网络中的网络集群可以分布在多个地区,同一地区内可以有多个网关集群,多个网关集群可以部署在同一地区内的不同区域,网关集群间因为空间距离长短有不同时延,并且单个网关集群能承载的用户数量受物理资源的限制是有上限的。在实际应用中,网关集群由于机房整体规划会有裁撤、扩容等变化,会造成用户的迁移。
通常,在需要将一个或多个用户从网关集群上迁出时,需要运维人员在考虑网络物理距离带来的延迟、网关集群自身负载以及用户需求特点的基础上,人工确定迁移规划(即需要人工确定将该一个或多个用户分别迁移到哪个网关集群)并人工迁移(即需要人工通过控制台将用户的路由表从原网关集群上删除,并配置给新网关集群),这样的方式存在人工成本较高的问题。
另外,对于首次上云的用户,也需要由运维人员在考虑网络物理距离带来的延迟、网关集群自身的负载以及需求特点的基础上,人工确定将用户的路由表配置给哪个网关集群,并人工通过控制台将用户的路由表配置给确定的网关集群,也存在人工成本较高的问题。
为了解决现有技术中人工成本较高的技术问题,在本申请实施例中,确定公有云网络中需要分配网关集群的目标用户,目标用户归属于目标地区,获取公有云网络中目标地区内部署的多个网关集群的集群负载,以及该网关集群对应的网络时延,根据集群负载和网络时延,采用选择与目标用户的需求特点匹配的网关集群的原则,从该多个网关集群中选择一个作为目标用户对应的目标网关集群,并将目标用户的路由表配置给目标网关集群,其中,目标用户的需求特点用于表征目标用户的时延要求和吞吐量要求,实现了根据集群负载和网络时延,自动将公有云网络中需要分配网关集群的目标用户(例如新上云的用户或者需要从其当前所在的网关集群迁出的用户)调度到网关集群,无需人工调度,从而能够降低人工成本。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突情况下,下述的实施例及实施例中的特征可以相互组合。
图3为本申请一实施例提供的公有云网络中调度用户到网关集群的方法的流程示意图,示例性的,本实施例提供的方法可以图1中的管控节点执行,如图3所示,本实施例的方法可以包括:
步骤31,确定公有云网络中需要分配网关集群的目标用户,目标用户归属于目标地区,公有云网络中目标地区内部署的网关集群的数量为多个;
步骤32,获取该多个网关集群的集群负载以及该多个网关集群对应的网络时延;
步骤33,根据集群负载和网络时延,采用选择与目标用户的需求特点匹配的网关集群的原则,从该多个网关集群中选择一个作为目标用户对应的目标网关集群,目标用户的需求特点用于表征目标用户的时延要求和吞吐量要求;
步骤34,将针对目标用户的路由表配置给目标网关集群。
本申请实施例中,目标用户可以是公有云网络中需要分配网关集群的任意用户。公有云网络中需要分配网关集群的用户可以包括已承载在网关集群上的非首次上云的用户,和/或,未承载在网关集群的上首次上云的用户。
可选的,步骤31具体可以包括:在确定需要将公有云网络中的第一用户从其当前所在的网关集群迁出时,将第一用户确定为公有云网络中需要分配网关集群的目标用户。
示例性的,第一用户可以包括集群流量负载大于流量负载阈值的网关集群上的用户。在此情况下,一个实施例中,本实施例提供的方法还可以包括:将集群流量负载大于流量负载阈值的网关集群上的至少一个用户确定为需要从其当前所在的网关集群迁出的用户。从而可以将流量负载过高的网关集群上的用户迁出,以实现通过对集群流量负载的预判,提前调度流量。
和/或示例性的,第一用户可以包括需要裁撤的网关集群上的用户。在此情况下,一个实施例中,本实施例提供的方法还可以包括:将需要裁撤的网关集群上的全部用户确定为需要从其当前所在的网关集群迁出的用户。从而可以实现将需要裁撤的网关集群上的用户迁出。
和/或示例性的,第一用户可以包括进行网关集群的数量扩容的地区内原网关集群上的用户。在此情况下,一个实施例中,本实施例提供的方法还可以包括:将进行网关集群的数量扩容的地区内原网关集群上的多个用户确定为需要从其当前所在的网关集群迁出的用户。从而实现将进行网关集群的数量扩容的地区内原网关集群上的用户迁移到新网关集群上。
和/或可选的,步骤31具体可以包括:在确定第二用户为公有云网络中首次上云的用户时,将第二用户确定为公有云网络中需要分配网关集群的目标用户。其中,第二用户为公有云网络中首次上云的用户。
用户在购买虚拟机时可以选择地区,以决定运行所购买虚拟机的计算设备所在的地区,因此目标用户存在所属的地区,目标用户所属的地区可以记为目标地区。在本申请实施例中,不限定地区的划分标准,例如可以一个省份为一个地区。
本申请实施例中,公有云网络中目标地区内部署的网关集群的数量为多个,可以获取该多个网关集群的集群负载。
其中,网关集群的集群负载具体可以是能够表征网关集群整体负载情况的任意类型信息。网关集群的集群负载可以包括集群流量负载,进一步的还可以包括集群表项负载,集群流量负载可以表示网关集群所承载的流量情况,集群表项负载可以表示网关集群所容纳的表项情况。
其中,集群流量负载可以包括集群流量使用率,进一步的还可以包括集群流量增长分数,集群流量使用率可以满足如何公式(1),集群流量增长分数可以满足如下公式(2)。
Figure BDA0003608775460000051
Figure BDA0003608775460000061
公式(1)和公式(2)中,f_util表示集群流量使用率,f_usage表示当前时刻的集群流量大小,f_capacity表示集群能够承载的最大流量大小;f_grow_score表示集群流量增长分数,t1和t2表示时刻,t2时刻晚于t1时刻,f_usage1表示t1时刻的集群流量大小,f_usage2表示t2时刻的集群流量大小。
示例性的,对于公有云网络中的任一网关集群,如果其f_util>=f_util_threshold,可以将承载在该网关集群上的一个或多个用户作为目标用户,从而可以实现将该网关集群上承载的一个或多个用户迁移到流量使用率低的网关集群。其中,f_util_threshold可以表示流量使用率阈值,f_util_threshold可以是经验值。
进一步的,对于公有云网络中的任一网关集群,如果其f_growth_score>=f_growth_score_threshold,可以将承载在该网关集群上的一个或多个用户作为目标用户,从而可以实现将该网关集群上的一个或多个用户迁移到流量水位低的网关集群。其中,f_growth_score_threshold可以表示流量增长分数阈值,f_growth_score_threshold可以是经验值。
其中,集群表项负载可以包括集群表项使用率,进一步的还可以包括集群表项增长分数,集群表项使用率可以满足如何公式(3),集群表项增长分数可以满足如下公式(4)。
Figure BDA0003608775460000062
Figure BDA0003608775460000063
公式(3)和公式(4)中,c_util表示集群表项使用率,c_usage表示当前时刻的集群表项数量,c_capacity表示集群能够容纳的最大表项数量;c_grow_score表示集群表项增长分数,t1和t2表示时刻,t2时刻晚于t1时刻,c_usage1表示t1时刻的集群表项数量,c_usage2表示t2时刻的集群表项数量。
可选的,除了获取该多个网关集群的集群负载,还可以获取该多个网关集群的集群健康状态,集群健康状态可以为健康或者不健康,以避免出现将目标用户调度到集群健康状态为不健康的网关集群,导致无法对用户的报文的转发异常,对用户造成损失的问题。
示例性的,如图4所示,可以由信息采集模块来采集网关集群的集群健康状态、集群表项负载和集群流量负载。应理解,信息采集模块是功能模块,一个实施例中,信息采集模块可以包括在执行本申请实施例提供的方法的执行主体中,例如可以包括在管控节点中,在此情况下,步骤31中获取该多个网关集群的集群负载,具体可以包括采集该多个网关集群的集群负载。
其中,对于集群健康状态,例如可以查询网关集群中单个网关的流量大小,并统计得到网关集群的流量大小,如果统计图是平稳的曲线,没有陡跌,可以认为网关集群的集群健康状况为健康,否则可以认为网关集群的集群健康状态为不健康。又例如,可以查询网关集群中单个网关的异常报文数量,并统计得到最近一段时间内网关集群的异常报文数量,如果网络集群的异常报文数量小于预设阈值,可以认为网关集群的集群健康状态为健康,否则可以认为网关集群的健康状态为不健康。
对于集群表项负载,例如可以接收确定向网关集群内单个网关下发的路由表项的行数,并根据确定的向网关集群内单个网关下发的路由表项的行数,统计得到网关集群的集群表项负载。
对于集群流量负载,例如可以查询网关集群中单个网关的流量负载,并根据查询到的网关集群内单个网关的流量负载,统计得到网关集群的集群流量负载。
一个实施例中,管控节点可以每隔一段时间,统计一次网关集群的集群负载,从而管控节点可以动态的获取到网关集群的集群负载。
本申请实施例中,除了获取该多个网关集群的集群负载,还可以获取该多个网关集群对应的网络延时。其中,网关集群对应的网络延迟可以与目标用户对应的对端有关,目标用户对应的对端可以与目标用户需要使用的服务有关。一个实施例中,在目标用户需要使用云上的一个或多个其他虚拟机提供的服务时,目标用户对应的对端可以包括该一个或多个其他虚拟机。另一个实施例中,在目标用户需要使用互联网数据中心(Internet DataCenter,IDC)提供的服务时,目标用户对应的对端可以包括互联网数据中心。
示例性的,在目标用户对应的对端包括云上的一个或多个其他虚拟机的情况下,一网关集群对应的网络时延,可以包括该网关集群下的虚拟机与该一个或多个其他虚拟机中任一其他虚拟机或与该一个或多个其他虚拟机处于同一网关集群下的某一个虚拟机之间的网络时延。
示例性的,在目标用户对应的对端包括互联网数据中心的情况下,一网关集群对应的网络时延,可以包括该网关集群下的虚拟机与互联网数据中心的网关之间的网络时延。
在实际应用中,可以从网关集群下选择一个虚拟机进行网络时延的探测,不同网关集群下选择的虚拟机之间可以两两进行探测,网关集群下选择的虚拟机还可以探测到互联网数据中心的网关的网络时延,网关集群下选择的虚拟机还可以探测到同一网关集群下的另一虚拟机的网络时延。例如,如图5所示,可以探测得到网关集群下的虚拟机与互联网数据中心的网关之间的网络时延为3毫秒(ms),还可以得到同一网关集群下或不同网关集群下的虚拟机之间的网络时延为2ms。
一个实施例中,网关集群下的虚拟机可以每隔一段时间进行一次网络时延的探测,并将探测到的网络时延通知给管控节点,从而使得管控节点可以动态的获取到网关集群对应的网络时延。
本申请实施例中,在获取到该多个网关集群的集群负载以及该多个网关集群对应的网络时延之后,可以根据集群负载和网络时延,采用选择与目标用户的需求特点匹配的网关集群的原则,从多个网关集群中选择一个作为目标用户对应的目标网关集群。其中,目标用户的需求特点可以用于表征目标用户的时延要求和吐吞量要求。应理解,在目标用户的数量为多个时,针对多个目标用户中的每一个目标用户可以执行步骤33。
例如,假设目标用户的需求特点是对时延的要求较高,对吞吐量的要求较低,例如针对少量人员提供交易服务的用户,因此可以选择对应的网络延时较小的网关集群中,集群负载较高的网关集群作为目标网关集群。
再例如,假设目标用户的需求特点是对时延的要求较高,对吞吐量的要求较低,例如针对大量人员提供交易服务的用户,因此可以选择对应的网络延时较小的网关集群中,集群负载较低的网关集群作为目标网关集群。
又例如,假设目标用户的需求特点是对吐吞量要求高,对时延的要求较低,例如提供数据上传服务的用户,因此可以选择集群负载较轻的网关集群中,对应的网络时延较大的网关集群作为目标网关集群。
一个实施例中,步骤33具体可以包括:从该多个网关集群中,选择集群负载小于负载阈值且网络时延和集群负载满足目标用户的需求特点的一个网关集群作为目标用户对应的目标网关集群。以集群负载包括集群表项负载和集群流量负载为例,可以从该多个网关集群中,选择集群表项负载小于表项负载阈值、集群流量负载小于流量负载阈值且网络时延和集群负载满足目标用户的需求特点的一个网关集群作为目标用户对应的目标网关集群。
以集群表项负载包括集群表项使用率(c_util_threshold)和集群表项增长分数(c_growth_score)为例,对于该多个网关集群中的任一网关集群,如果其c_growth_score>=c_growth_score_threshold,可以暂停将目标用户分配到该网关集群,从而可以实现不将目标用户分配给表项使用率高的网关集群;以及,对于该多个网关集群中的任一网关集群,c_util>=c_util_threshold,可以暂停将目标用户分配到该网关集群,从而可以实现不将目标用户分配给表项水位高的网关集群。其中,c_growth_score_threshold和c_util_threshold可以是经验值。
以集群流量负载包括集群流量使用率(f_util_threshold)和集群流量增长分数(f_growth_score)为例,对于该多个网关集群中的任一网关集群,如果其f_growth_score>=f_growth_score_threshold,可以暂停将目标用户分配到该网关集群,从而可以实现不将目标用户分配给流量使用率高的网关集群;以及,对于该多个网关集群中的任一网关集群,f_util>=f_util_threshold,可以暂停将目标用户分配到该网关集群,从而可以实现不将目标用户分配给流量水位高的网关集群。
另一个实施例中,步骤33具体可以包括:从该多个网关集群中,选择集群健康状态为健康、集群负载小于负载阈值且网络时延和集群负载满足目标用户的需求特点的一个网关集群作为目标用户对应的目标网关集群。以集群负载包括集群表项负载和集群流量负载为例,可以从该多个网关集群中,选择集群健康状态为健康、集群表项负载小于表项负载阈值、集群流量负载小于流量负载阈值且网络时延和集群负载满足目标用户的需求特点的一个网关集群作为目标用户对应的目标网关集群。
可选的,在为目标用户选择对应的目标网关集群时,还可以考虑目标用户的规模,以实现将规模大小不同的用户分散在不同的网关集群,从而有利于提高资源利用率。基于此,一个实施例中,步骤33具体可以包括:根据集群负载和所述网络时延,按照相同规模的用户分散在不同网关集群的策略并采用选择与目标用户的需求特点匹配的网关集群的原则,从该多个网关集群中选择一个作为目标用户对应的目标网关集群。示例性的,可以按照相同规模的用户分散在不同网关集群的策略,从该多个网关集群中,选择集群负载小于负载阈值且网络时延和集群负载满足目标用户的需求特点的一个网关集群作为目标用户对应的目标网关集群。
例如,图6中,同一椭圆内的多个用户可以表示需求特点相同的用户,同一椭圆内不同大小的用户可以表示规模不同的用户,同一椭圆内的用户可以表示为其选择的网关集群是同一网关集群的用户。
本申请实施例中,在从多个网关集群中选择一个作为目标用户对应的目标网关集群后,可以将针对目标用户的路由表配置给目标用户对应的目标网关集群。在一目标用户为首次上云的用户时,可以直接将针对该目标用户的路由表配置给该目标用户对应的目标网关集群。在一目标用户为需要从其当前所在的网关集群迁出的用户时,可以将针对该目标用户的路由表从该目标用户当前所在的网关集群上删除,并将针对该目标用户的路由表配置给该目标用户对应的目标网关集群,从而可以实现将该目标用户从原网关集群迁移到新网关集群。
举例,以同一地区内部署的网关集群的数量为2个,分别为网关集群A和网关集群B为例,如图7所示,信息采集模块71可以采集集群A和集群B的集群负载信息,信息采集模块71还可以获得集群A和集群B对应的延迟信息以及用户1、用户2和用户3的需求特点信息,其中,需求特点信息可以用于表征用户的时延要求和吞吐量要求;信息计算模块72可以根据信息采集模块71得到的集群负载信息、延迟信息和需求特点信息,计算用户1、用户2和用户3分别对应的网关集群,例如为用户1和用户2对应集群B,为用户3对应集群A;调度模块73可以根据信息计算模块72的计算结果,执行调度,例如可以将针对用户1的路由表配置给集群B,将针对用户2的路由表配置给集群B,并将用户3的路由表配置给集群A。
采用图7所示的方案,能够全面统计、量化分析多个因素的影响,给出合理的调度方案,并动态收集量化信息,持续执行智能、动态迁移,避免出现由于运维人员因为考虑不全,用户的业务受影响,甚至造成故障的情况巨大的情况。
本实施例提供的方法,通过确定公有云网络中需要分配网关集群的目标用户,目标用户归属于目标地区,获取公有云网络中目标地区内部署的多个网关集群的集群负载,以及该网关集群对应的网络时延,根据集群负载和网络时延,采用选择与目标用户的需求特点匹配的网关集群的原则,从该多个网关集群中选择一个作为目标用户对应的目标网关集群,并将目标用户的路由表配置给目标网关集群,实现了根据集群负载和网络时延,自动将公有云网络中需要分配网关集群的目标用户(例如新上云的用户或者需要从其当前所在的网关集群迁出的用户)调度到网关集群,无需人工调度,从而能够降低人工成本。
图8为本申请一实施例提供的公有云网络中调度用户到网关集群的装置的结构示意图;参考附图8所示,本实施例提供了一种装置,该装置可以执行上述方法实施例提供的方法,具体的,该装置可以包括:
确定模块81,用于确定所述公有云网络中需要分配网关集群的目标用户,所述目标用户归属于目标地区,所述公有云网络中所述目标地区内部署的网关集群的数量为多个;
获取模块82,用于获取所述多个网关集群的集群负载以及所述多个网关集群对应的网络时延;
选择模块83,用于根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,所述目标用户的需求特点用于表征所述目标用户的时延要求和吞吐量要求;
配置模块84,用于将针对所述目标用户的路由表配置给所述目标网关集群。
一个实施例中,确定模块81具体用于:在确定需要将所述公有云网络中的第一用户从其当前所在的网关集群迁出时,将所述第一用户确定为所述公有云网络中需要分配网关集群的目标用户;和/或,在确定第二用户为所述公有云网络中首次上云的用户时,将所述第二用户确定为所述公有云网络中需要分配网关集群的目标用户。
一个实施例中,选择模块83具体用于:从所述多个网关集群中,选择集群负载小于负载阈值且网络时延和集群负载满足所述目标用户的需求特点的一个网关集群作为所述目标用户对应的目标网关集群。
一个实施例中,获取模块82还用于获取所述网关集群的健康状态;
选择模块83具体用于:从所述多个网关集群中,选择集群健康状态为健康、集群负载小于负载阈值且网络时延和集群负载满足所述目标用户的需求特点的一个网关集群作为所述目标用户对应的目标网关集群。
一个实施例中,选择模块83具体用于:根据所述集群负载和所述网络时延,按照相同规模的用户分散在不同网关集群的策略并采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群。
一个实施例中,所述集群负载包括集群表项负载和集群流量负载。
一个实施例中,所述集群表项负载包括集群容量使用率和集群容量增长分数。
一个实施例中,所述集群流量负载包括集群流量使用率和集群容量增长分数。
图8所示装置可以执行图3所示实施例的方法,本实施例未详细描述的部分,可参考对图3所示实施例的相关说明。该技术方案的执行过程和技术效果参见图3所示实施例中的描述,在此不再赘述。
在一个可能的实现中,图8所示装置的结构可实现为一计算机设备。如图9所示,该计算机设备可以包括:处理器91和存储器92。其中,存储器92用于存储支持计算机设备执行上述图3所示实施例中提供的方法的程序,处理器91被配置为用于执行存储器92中存储的程序。
程序包括一条或多条计算机指令,其中,一条或多条计算机指令被处理器91执行时能够实现如下步骤:
确定所述公有云网络中需要分配网关集群的目标用户,所述目标用户归属于目标地区,所述公有云网络中所述目标地区内部署的网关集群的数量为多个;
获取所述多个网关集群的集群负载以及所述多个网关集群对应的网络时延;
根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,所述目标用户的需求特点用于表征所述目标用户的时延要求和吞吐量要求;
将针对所述目标用户的路由表配置给所述目标网关集群。
可选的,处理器91还用于执行前述图3所示实施例中的全部或部分步骤。
其中,计算机设备的结构中还可以包括通信接口93,用于计算机设备与其他设备或通信网络通信。
另外,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被执行时,实现如图3所示实施例提供的方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、链表、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种公有云网络中调度用户到网关集群的方法,其特征在于,包括:
确定所述公有云网络中需要分配网关集群的目标用户,所述目标用户归属于目标地区,所述公有云网络中所述目标地区内部署的网关集群的数量为多个;
获取所述多个网关集群的集群负载以及所述多个网关集群对应的网络时延;
根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,所述目标用户的需求特点用于表征所述目标用户的时延要求和吞吐量要求;
将针对所述目标用户的路由表配置给所述目标网关集群。
2.根据权利要求1所述的方法,其特征在于,所述确定所述公有云网络中需要分配网关集群的目标用户,包括:
在确定需要将所述公有云网络中的第一用户从其当前所在的网关集群迁出时,将所述第一用户确定为所述公有云网络中需要分配网关集群的目标用户;
和/或,在确定第二用户为所述公有云网络中首次上云的用户时,将所述第二用户确定为所述公有云网络中需要分配网关集群的目标用户。
3.根据权利要求1所述的方法,其特征在于,所述根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,包括:
从所述多个网关集群中,选择集群负载小于负载阈值且网络时延和集群负载满足所述目标用户的需求特点的一个网关集群作为所述目标用户对应的目标网关集群。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述网关集群的健康状态;
所述根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,包括:从所述多个网关集群中,选择集群健康状态为健康、集群负载小于负载阈值且网络时延和集群负载满足所述目标用户的需求特点的一个网关集群作为所述目标用户对应的目标网关集群。
5.根据权利要求1所述的方法,其特征在于,所述根据所述集群负载和所述网络时延,采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群,包括:
根据所述集群负载和所述网络时延,按照相同规模的用户分散在不同网关集群的策略并采用选择与所述目标用户的需求特点匹配的网关集群的原则,从所述多个网关集群中选择一个作为所述目标用户对应的目标网关集群。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述集群负载包括集群表项负载和集群流量负载。
7.根据权利要求6所述的方法,其特征在于,所述集群表项负载包括集群容量使用率和集群容量增长分数。
8.根据权利要求6所述的方法,其特征在于,所述集群流量负载包括集群流量使用率和集群流量增长分数。
9.一种计算机设备,其特征在于,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求1至8中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,当所述计算机程序被执行时,实现如权利要求1至8中任一项所述的方法。
CN202210426861.0A 2022-04-21 2022-04-21 公有云网络中调度用户到网关集群的方法、设备及介质 Pending CN114915633A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210426861.0A CN114915633A (zh) 2022-04-21 2022-04-21 公有云网络中调度用户到网关集群的方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210426861.0A CN114915633A (zh) 2022-04-21 2022-04-21 公有云网络中调度用户到网关集群的方法、设备及介质

Publications (1)

Publication Number Publication Date
CN114915633A true CN114915633A (zh) 2022-08-16

Family

ID=82765409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210426861.0A Pending CN114915633A (zh) 2022-04-21 2022-04-21 公有云网络中调度用户到网关集群的方法、设备及介质

Country Status (1)

Country Link
CN (1) CN114915633A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115865684A (zh) * 2023-02-03 2023-03-28 浪潮电子信息产业股份有限公司 一种主机调度方法、系统、设备及计算机可读存储介质
WO2024160167A1 (zh) * 2023-01-30 2024-08-08 华为云计算技术有限公司 一种专属主机的创建方法及相关装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738452B1 (en) * 2005-06-22 2010-06-15 Cisco Technology, Inc. Techniques for load balancing subscriber-aware application proxies
CN104363187A (zh) * 2014-10-29 2015-02-18 工业和信息化部电信传输研究所 一种物联网网关资源响应方法和装置
CN109802985A (zh) * 2017-11-17 2019-05-24 北京金山云网络技术有限公司 数据传输方法、装置、设备及可读取存储介质
CN111371648A (zh) * 2020-03-03 2020-07-03 北京百度网讯科技有限公司 针对虚拟网关集群全局故障的监测方法和装置
CN113259272A (zh) * 2021-05-13 2021-08-13 中国建设银行股份有限公司 一种基于虚拟网关的流量管理方法、装置及设备
CN113268351A (zh) * 2021-06-07 2021-08-17 北京金山云网络技术有限公司 一种网关服务的负载均衡方法及装置
CN114036236A (zh) * 2021-11-16 2022-02-11 东软集团股份有限公司 多网关集群系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738452B1 (en) * 2005-06-22 2010-06-15 Cisco Technology, Inc. Techniques for load balancing subscriber-aware application proxies
CN104363187A (zh) * 2014-10-29 2015-02-18 工业和信息化部电信传输研究所 一种物联网网关资源响应方法和装置
CN109802985A (zh) * 2017-11-17 2019-05-24 北京金山云网络技术有限公司 数据传输方法、装置、设备及可读取存储介质
CN111371648A (zh) * 2020-03-03 2020-07-03 北京百度网讯科技有限公司 针对虚拟网关集群全局故障的监测方法和装置
CN113259272A (zh) * 2021-05-13 2021-08-13 中国建设银行股份有限公司 一种基于虚拟网关的流量管理方法、装置及设备
CN113268351A (zh) * 2021-06-07 2021-08-17 北京金山云网络技术有限公司 一种网关服务的负载均衡方法及装置
CN114036236A (zh) * 2021-11-16 2022-02-11 东软集团股份有限公司 多网关集群系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
潘育飞, 吴震华, 顾尔丹, 陈 纯: "WAP网关集群的分布式负载均衡", 计算机工程, no. 04, 20 April 2002 (2002-04-20) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024160167A1 (zh) * 2023-01-30 2024-08-08 华为云计算技术有限公司 一种专属主机的创建方法及相关装置
CN115865684A (zh) * 2023-02-03 2023-03-28 浪潮电子信息产业股份有限公司 一种主机调度方法、系统、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
EP3028406B1 (en) Profile-based sla guarantees under workload migration in a distributed cloud
US10055262B1 (en) Distributed load balancing with imperfect workload information
US10078533B2 (en) Coordinated admission control for network-accessible block storage
CN108228347A (zh) 一种任务感知的Docker自适应调度系统
US20190391897A1 (en) Adaptive thresholds for containers
CN105515977B (zh) 获取网络中传输路径的方法、装置和系统
CN114915633A (zh) 公有云网络中调度用户到网关集群的方法、设备及介质
US10250673B1 (en) Storage workload management using redirected messages
CN112272217B (zh) 一种kafka集群负载均衡方法、系统、设备以及介质
CN109189578B (zh) 存储服务器分配方法、装置、管理服务器以及存储系统
US10764165B1 (en) Event-driven framework for filtering and processing network flows
EP3465966B1 (en) A node of a network and a method of operating the same for resource distribution
CN112486634A (zh) 一种实现容器云平台整体监控的方法
CN109510834B (zh) 一种安全策略下发方法及装置
Chang et al. Write-aware replica placement for cloud computing
Zhang et al. Dynamic workload management in heterogeneous cloud computing environments
CN110928649A (zh) 资源调度的方法和装置
CN113596146B (zh) 一种基于大数据的资源调度的方法及装置
CN114978913B (zh) 一种基于切链的服务功能链跨域部署方法及系统
US20240039813A1 (en) Health analytics for easier health monitoring of a network
CN111786846B (zh) 一种确定监控机的方法、装置、设备和存储介质
CN117687739A (zh) 资源调度方法及其相关设备
CN113608870A (zh) 消息队列的负载均衡方法及装置、电子设备及存储介质
KR102688943B1 (ko) 다중 협업형 컨테이너 플랫폼에서의 작업 이관 결정 방법
US11750489B1 (en) Modifying health monitoring through user interface

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination