CN107210925B - 用于分布式系统内的资源管理的方法和装置 - Google Patents

用于分布式系统内的资源管理的方法和装置 Download PDF

Info

Publication number
CN107210925B
CN107210925B CN201480084577.3A CN201480084577A CN107210925B CN 107210925 B CN107210925 B CN 107210925B CN 201480084577 A CN201480084577 A CN 201480084577A CN 107210925 B CN107210925 B CN 107210925B
Authority
CN
China
Prior art keywords
computing resources
priority number
priority
load
upper threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480084577.3A
Other languages
English (en)
Other versions
CN107210925A (zh
Inventor
I.巴科斯
G.博多格
A.G.希尔特
L.雅诺西
G.雅罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks Oy
Original Assignee
Nokia Solutions and Networks Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Solutions and Networks Oy filed Critical Nokia Solutions and Networks Oy
Publication of CN107210925A publication Critical patent/CN107210925A/zh
Application granted granted Critical
Publication of CN107210925B publication Critical patent/CN107210925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0895Configuration of virtualised networks or elements, e.g. virtualised network function or OpenFlow elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/60Software-defined switches
    • H04L49/602Multilayer or multiprotocol switching, e.g. IP switching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • H04L2012/5629Admission control
    • H04L2012/5631Resource management and allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/13164Traffic (registration, measurement,...)
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/13349Network management

Abstract

本发明提出了用于核心网络元件中的分布式系统内的资源管理的方法、装置和计算机程序产品,包括将核心网络元件的计算资源组织成集合,其中第一集合总是活动的;设置用于集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当其负载下降到下限阈值以下时,最后激活的集合被去激活;向每个集合分配优先数;在分派给活动集合的计算资源的子区间中分割用于随机化请求分布的随机数的区间,其中基于相应计算资源的集合的优先数来确定每个子区间的长度;以及将来自区间的随机数指派给传入请求,并将请求转发到属于包含所指派的随机数的子区间的这样的计算资源。

Description

用于分布式系统内的资源管理的方法和装置
技术领域
本发明大体上涉及有线和无线通信网络,并且更具体地涉及用于使得能够实现改进负载平衡、特别是用于分布式系统中的改进水平扩缩(scale)的核心网络元件中的优化资源管理的方法、装置和计算机程序产品。
背景技术
为了节省成本,电信运营商通常要求来自基础设施供应商的无线电和核心网络组件的虚拟化。实际上,所有核心网络组件都应当能够在同一云基础设施上运行。除了例如经由对用于所有核心网络组件的统一硬件(HW)的支出来节省成本之外,运营商期望诸如虚拟化网络元件之类的计算资源也可以利用例如云的优点,并且因此进一步优化可用硬件资源的利用率。这样的优点之一是云中的虚拟器具的水平可扩缩性(也称为缩小(scale in)/扩大(scale out))的可能性。
作为例如云上的普通(虚拟)器具,核心网络元件应支持这样的水平扩缩行为。实际上,其意味着应当可能从/向(虚拟)器具(本文是核心网络元件)移除(缩小)或添加(扩大)计算资源,诸如虚拟机(VM)。这将提供“收缩”所需计算资源的数量来处理低业务量(例如,夜晚时间)中的业务量而取决于针对高业务量的持续时间(例如白天时间)的需要而动态地添加诸如虚拟机VM的新计算资源的可能性。
关于具有严格预期服务等级的电信网络元件,缩小过程处的计算资源移除必须不会造成任何服务干扰。在如根据本发明寻址的网络元件的情况下,提供的主要服务是订户之间的呼叫的处理。也就是说,从例如移动交换中心服务器(MSS)或电信应用服务器(TAS)移除计算资源必须不会干扰任何正在进行的呼叫建立或任何正在进行的活动阶段呼叫。换句话说,计算资源(诸如VM)的移除必须是适度的(graceful)。其中需要用于数据会话的这样的适度的缩小过程的对应网络元件例如是SGSN/MME。
为了隐藏来自外部世界的网络元件的计算资源的这种扩缩,众所周知的实践是在网络元件的边缘上利用负载平衡器。负载平衡器(LB)终止来自外部世界的业务,并且它们将传入业务分布在网络元件的内部计算资源之间。通过这种方式,负载平衡器可以用来决定特定活动计算资源是否可以接收新的呼叫请求,或者如果内部计算资源被标记用于适度关闭,则标记的计算资源不应接收新的呼叫请求,但当然用于该计算资源上的正在进行的会话的业务应当仍然引导到该计算资源。
由此,变得显而易见的是,在这种逻辑的情况下,一旦由计算资源处理的正在进行的会话被参与者终止,则计算资源不久后变为“空”。
另一方面,显而易见的是,通常不能预测呼叫的长度。也就是说,其不能预见正在进行的活动阶段呼叫何时将由参与者完成。其意味着可能发生当诸如VM的计算资源由于一些少量的非常长的呼叫会话而不能关闭时的情况。
本说明书涉及称为水平扩缩的缩小和扩大。
基本上,扩大功能使得能够通过添加计算资源以处理增加的业务来增加功能单元(FU)的容量。相反,缩小功能使得能够通过从业务移除计算资源来减少功能单元的容量。水平扩缩已经是应当由所有设备供应商解决的实际上的运营商的要求。
如从上面的介绍变得显而易见的,存在通常不能预测呼叫的长度的问题。因此,如果遵循通用负载平衡器逻辑并且以这样的方式共享内部计算资源之间的传入业务,则所有计算资源具有相同的CPU负载和存储器消耗,其意味着当期望在低业务量时间内适度地关闭计算资源时,它可能处理与未被选择用于关闭的计算资源相同量的呼叫,即长时间呼叫可能以与在其他计算资源中相同的概率出现在该计算资源中。为了降低该概率,存在针对改进的负载平衡器逻辑的需要。
发明内容
因此,为了克服现有技术的缺陷,本发明下的目的是使得能够实现改进的负载平衡。
特别地,本发明的目的是提供用于提供核心网络元件中的优化资源管理的方法、装置和计算机程序产品,其可以在基于云的环境中或在非云环境中配置。
根据本发明的第一方面,提供了一种用于核心网络元件中的分布式系统内的资源管理的方法,包括:将所述核心网络元件的计算资源组织成集合,其中第一集合总是活动的;设置用于所述集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当最后激活的集合的负载下降到下限阈值以下时,最后激活的集合被去激活;向每个集合分配优先数;在分派给活动集合的计算资源的子区间中分割用于随机化请求分布的随机数的区间,其中基于相应计算资源的集合的优先数来确定每个子区间的长度;以及将来自区间的随机数指派给传入请求,并将请求转发到属于包含所指派的随机数的子区间的这样的计算资源。
根据本发明的第二方面,提供了一种用于核心网络元件中的分布式系统内的资源管理的装置,包括:至少一个处理器以及用于存储要由处理器执行的指令的至少一个存储器,其中至少一个存储器和指令被配置为利用至少一个处理器使得所述装置至少执行:将所述核心网络元件的计算资源组织成集合,其中第一集合总是活动的;设置用于所述集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当最后激活的集合的负载下降到下限阈值以下时,最后激活的集合被去激活;向每个集合分配优先数;在分派给活动集合的计算资源的子区间中分割用于随机化请求分布的随机数的区间,其中基于相应计算资源的集合的优先数来确定每个子区间的长度;以及将来自区间的随机数指派给传入请求,并将请求转发到属于包含所指派的随机数的子区间的这样的计算资源。
根据本发明的第三方面,提供了一种包括计算机可执行组件的计算机程序产品,所述计算机可执行组件当所述程序运行时被配置为执行以下步骤:将所述核心网络元件的计算资源组织成集合,其中第一集合总是活动的;设置用于所述集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当最后激活的集合的负载下降到下限阈值以下时,最后激活的集合被去激活;向每个集合分配优先数;在分派给活动集合的计算资源的子区间中分割用于随机化请求分布的随机数的区间,其中基于相应计算资源的集合的优先数来确定每个子区间的长度;以及将来自区间的随机数指派给传入请求,并将请求转发到属于包含所指派的随机数的子区间的这样的计算资源。
在从属权利要求中阐述了本发明的前述示例方面的有利的另外的发展或修改。
根据本发明的某些实施例,所述优先数越大,所述子区间的长度越长。
此外,根据本发明的某些实施例,当计算资源的集合处于非活动状态或已经缩小时,其优先数指示零优先级。
此外,根据本发明的某些实施例,如果单个集合的负载达到上限阈值,则其优先数变为最大,其指示该集合以最高优先级接收传入请求。
此外,根据本发明的某些实施例,如果新集合被加载,则其优先数可取决于实时业务量从预设起始值动态改变直到其最大值。
此外,根据本发明的某些实施例,所述核心网络元件可以是电信应用服务器(TAS)、移动交换服务器MSS、移动性管理实体MME、服务GPRS支持节点SGSN,或者可以是呼叫会话控制功能CSCF、归属订户服务器HSS、网关GPRS支持节点GGSN等中的任何一个。
附图说明
为了更全面地理解本发明的示例实施例,现在参考结合附图进行的以下描述,其中:
图1图示了根据本发明的某些实施例的方法;
图2示意性地图示了根据本发明的某些实施例的装置;
图3示意性地图示了根据本发明的某些实施例的网络元件配置,其中FU被组织成集合;
图4示出了根据本发明的某些实施例的随机化算法的概念图示;
图6示出了根据本发明的某些实施例的算法的信令图;
图6a示意性地图示了当新集合可以被扩大(溢出)时的负载状况中的根据本发明的某些实施例的管理;
图6b示意性地图示了当最后(活动)集合的优先数可以增加(溢出)时的负载状况中的根据本发明的某些实施例的管理;
图6c示意性地图示了当最后(活动)集合的优先数可以减少(回流)时的负载状况中的根据本发明的某些实施例的管理;
图6d示意性地图示了当最后集合(活动)可以缩小(回流)时的负载状况中的根据本发明的某些实施例的管理;
图7包括图7a和7b,图7示出了根据本发明的某些实施例的流程图。
具体实施方式
下文将描述本发明的示例方面。更具体地,下文参考特定非限制性示例以及目前被认为是本发明的可想到实施例的内容来描述本发明的示例方面。本领域技术人员将理解,本发明决不限于这些示例,并且可以更广泛地应用。
应当注意,本发明及其实施例的以下描述主要涉及用作某些示例网络配置和部署的非限制性示例的规范。即,本发明及其实施例主要例如关于被用作某些示例网络配置和部署的非限制性示例的3GPP规范来描述。因此,本文给出的示例实施例的描述具体涉及与其直接相关的术语。这样的术语仅在所呈现的非限制性示例的上下文中使用,并且自然不以任何方式限制本发明。更确切地说,只要符合本文所描述的特征,也可以利用任何其他网络配置或系统部署等。
下文,使用若干替代方案来描述本发明及其各方面或实施例的各种实施例和实现。通常注意,根据某些需要和约束,可以单独或以任何可想到组合(也包括各种替代方案的各个特征的组合)提供所有的所描述替代方案。
特别地,以下实施例、版本和实施例仅被理解为说明性示例。尽管说明书可以在若干位置中引用“一”、“一个”或“一些”示例版本或实施例,但这并不一定意味着每个这样的引用是对相同的(多个)示例版本或实施例或者该特征仅适用于单个示例版本或实施例。不同实施例的单个特征也可以被组合以提供其他实施例。此外,单词“包括”和“包含”应被理解为不将所描述的实施例限制为仅包括已经提到的那些特征,并且这样的示例版本和实施例也可以包含未具体提到的另外的特征、结构、单元、模块等。
一般,电信网络包括多个网络元件,诸如基站BTS、演进节点B的(eNB;即LTE环境中的基站)、用户设备UE(例如移动电话、智能电话、计算机等)、控制器、接口等,并且特别是在提供电信服务中使用的任何设备。
此外,应当注意,如本文提及的核心网络元件可以是例如电信应用服务器(TAS)、移动交换服务器(MSS)、移动性管理实体(MME)、服务GPRS支持节点(SGSN)、或任何呼叫处理节点,但不限于此。
也取决于实际的网络类型的所描述元件的一般功能和互连对于本领域技术人员是已知的并且在对应的说明书中描述,使得本文省略其详细描述。然而,应当注意,除了下文详细描述的那些网络元件和信令链路之外,可以采用若干附加网络元件和信令链路用于向或来自基站和通信网络的通信。
如上文已经指示的,目前的负载平衡算法不支持涉及一些计算资源(诸如VM)应被优先化的逻辑。然而,这样的算法可以加载高阶(order)计算机资源,并且只有在这些高阶计算资源达到给定的负载水平的情况下才将业务溢出到其他低阶计算资源。这样的算法将有助于许多情况下。例如,在基于云的环境中,系统可以将负载聚焦于一些计算资源(诸如虚拟机)上,并且仅在必要时将负载溢出到其他计算资源(诸如虚拟机),这将使得能够实现云中的多得多的动态资源管理,使得不必要的计算资源(CR)可以用于其他目的,或者它们可以被关闭。
这样的算法还将有助于当会话的长度不能被影响(例如呼叫持续时间)并且长时间会话可能阻止从系统适度移除计算资源时的情况下。这样的新算法将意味着,长时间会话以较低概率维持在那些低阶计算资源上,因为不期望由于计算资源的移除而强制断开非常长的呼叫。
此外,即使云环境是本发明的一个应用领域,然而,应注意,本发明不仅限于云环境,而且还可以应用于非云环境中。此外,根据本发明的一些方面,虚拟机(VM)是计算资源的一个示例;然而,本发明不限于此。
图1示出了根据本公开的一些示例版本的方法。
在步骤S11中,核心网络元件的计算资源被组织成集合,其中第一集合(即,基本增量(increment))总是活动的。
然后,在步骤S12中,设置用于集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当最后激活的集合的负载下降到下限阈值以下时,最后激活的集合被去激活。
此外,在步骤S13中,向每个集合分配优先数。该分配的优先数应当是用于相应集合的最大可行优先级。
此外,在步骤S14中,在分派给活动集合的计算资源的子区间中分割用于随机化请求分布的随机数的区间,其中基于相应计算资源的集合的优先数来确定每个子区间的长度。
又此外,在步骤S15中,将来自区间的随机数指派给传入请求,并将请求转发到属于包含所指派的随机数的子区间的这样的计算资源。
在图2中,示出了图示根据本公开的一些示例版本的包括在(电信)通信网络元件中的元件的配置的图,其被配置为在基于云的环境中实现核心网络元件的资源管理,如结合本公开的一些示例版本所描述的。实施例可以在网络元件中或由网络元件执行。应当注意,网络元件可以包括元件或功能,诸如芯片组、芯片、模块等,其也可以是网络元件的一部分或作为单独元件附接到网络元件、虚拟机等。应当理解,每个块及其任何组合可以通过各种部件或其组合来实现,诸如硬件、软件、固件、一个或多个处理器和/或电路。
图2中所示的网络元件20可以包括处理功能、控制单元或诸如CPU等的处理器21,其适于执行与网络元件控制过程相关的程序等所给出的指令。
处理器21被配置为在基于云的环境中执行与核心网络元件的上述资源管理相关的处理。特别地,处理器21包括作为组织单元的子部分210,其被配置为将核心网络元件的计算资源组织成集合,其中第一集合总是活动的。部分210可以被配置为执行根据图1的S11的处理。此外,处理器21包括可用作设置单元的子部分211,其被配置为设置用于集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当最后激活的集合的负载下降到下限阈值以下时,最后激活的集合被去激活。部分211可以被配置为执行根据图1的S12的处理。此外,处理器21包括可用作分配单元的子部分212,其被配置为向每个集合分配优先数。部分212可以被配置为执行根据图1的S13的处理。又此外,处理器21包括可用作分割单元的子部分213,其被配置为在分派给活动集合的计算资源的子区间中分割用于随机化请求分布的随机数的区间,其中基于相应计算资源的集合的优先数来确定每个子区间的长度。部分213可以被配置为执行根据图1的S14的处理。此外,处理器21包括可用作处理单元的子部分214,其被配置为将来自区间的随机数指派给传入请求,并将请求转发到属于包含所分派的随机数的子区间的这样的计算资源。部分214可以被配置为执行根据图1的S15的处理。
附图标记22和23表示连接到处理器21的收发器或输入/输出(I/O)单元(接口)。I/O单元22可以用于与例如网络元件通信。I/O单元23可以用于与例如管理应用通信。附图标记24表示例如可用于存储要由处理器21执行的数据和程序的和/或作为处理器21的工作存储的存储器。
根据本发明的某些实施例,首先,将计算资源组织成集合。这样的集合理论上可以包含任何数量的计算资源,但最多与总计可用的一样多。然而,实际上,在不限制本发明的范围的情况下,基本增量具有最小值2,其他增量具有至少一个FU。一方面,我们可以通过将计算资源组织成集合来最小化新激活的计算资源(在扩大后)立即过载的可能性。另一方面,我们可以同时管理更多的CPU资源。
基本增量是总是存在且总是活动的集合。
这种配置可以在图3中看到。特别地,图3示意性地示出了根据本发明的某些实施例的网络元件配置,其中在虚拟化核心网络元件中,计算资源(CR)被组织成集合S1到Sn,其连接到多个负载平衡器例如LB-0〜LB-m。LB可以通过例如多层站点(site)交换机来切换。
第二步骤在于固定集合的负载的上限阈值(例如LUT=60%)。目标是实现只要平均负载达到给定的上限阈值(LUT)则活动集合被加载。这是非常有用的,因为当且仅当该给定的上限阈值依据活动集合的平均负载被超过时,新的集合才将被置于活动状态中。
类似地,设置集合的负载的下限阈值(例如LLT=10或20%)。这也是非常有用的,因为当且仅当最后的集合的负载在该给定的下限阈值以下时,最后(活动)集合将被置于非活动状态中。
此外,所有集合都被给予优先数。由此,满足以下条件中的至少一个。首先,每个计算资源在其集合内具有相同的优先数,但是计算资源的优先数也可取决于实时业务量而动态改变。计算资源的优先数越大,向该计算资源分配请求的概率越高。然后,如果CR集合处于非活动状态或已经缩小,则其优先数为零。如果集合达到下限,即下降到下限阈值以下,则其意味着该集合意图被去激活,即没有更多的负载被引导到该集合。此外,如果单个集合的负载达到上限阈值(LUT),则其优先数变为最大(M,其中M对于已经达到LUT的所有集合是共同的)。M是可配置参数。又此外,如果新的集合被加载,则其优先数可动态改变直到M(取决于实时业务量)。在所描绘的实施例的情况下,优先数的起始值为M/3,但其可以根据需要进行调整。
也就是说,可以根据需要调整优先数,例如,可以使用不同的尺度。在本实施例中,根据给定的上限阈值将最大值M设置为60。
最后,请求分布被随机化。根据本发明的某些实施例的随机化过程在图4中示出。
在图4中,顶行示出了传入请求。区间(例如[0,1])的这样的细分可以在图4的下部看到,其中每个子区间属于不同的计算资源(CR)。CR的相应阴影指示它们属于的集合。
子区间的长度通过以下公式实时确定:
Figure DEST_PATH_IMAGE002
也就是说,CR的优先数越大,其对应的子区间越大。传入请求被随机分布,因为每个请求都得到来自例如[0,1]的随机数。该请求被转发到该CR,该CR属于包含所分派的随机数的子区间。
综上所述,该算法的理论信令图可以在图5中看到。
在步骤1中,传入请求(例如SIP邀请消息)被转发到负载平衡器的外部接口。
在负载平衡器过程中执行以下步骤。特别地,在步骤2中,生成用于请求的随机数。然后,在步骤3中,选择包含所生成的数的子区间。在步骤4中,选择属于所选择的子区间的CR。随后,在步骤5中,请求从负载平衡器的内部接口转发到所选择的CR。最后,在步骤6中,请求由所选择的CR处理。
基于上文,本发明根据其某些实施例能够管理以下负载状况,其在图6a至6d中描绘。
图6a示意性地图示了当新集合可以被扩大(溢出)时的负载状况中的根据本发明的某些实施例的管理。特别地,如可以在图7a中看到的,所有活动集合S1至Sk的负载达到给定的上限阈值Lut,因此执行到新集合的溢出业务。也就是说,超过该阈值的业务必须流入到新集合Sk+1中。
图6b示意性地图示了当最后(活动)集合的优先数可以增加(溢出)时的负载状况中的根据本发明的某些实施例的管理。特别地,在图7b中所图示的情况下,负载增加(L↑),因此最后的集合的优先级(优先数)可以增加。也就是说,最后的集合必须管理更多的业务。
图6c示意性地图示了当最后(活动)集合的优先数可以减少(回流)时的负载状况中的根据本发明的某些实施例的管理。特别地,如从图7c中所图示的情况变得显而易见的,负载减小(L↓),因此最后的集合的优先级(优先数)可以减少。也就是说,最后的集合可以管理更少的业务。
图6d示意性地图示了当最后集合(活动)可以缩小(回流)时的负载状况中的根据本发明的某些实施例的管理。也就是说,最后活动集合的负载在给定的下限阈值LLt以下,因此最后的集合Sk+1可以被去激活。
如图6a至6d中所图示的,该方法可以看成双向的修改的泄漏桶模型。非常重要的是注意,负载可以溢出并且类似地回流。还值得一提的是,传入请求在活动集合之间不均匀分布。最后的集合通常处理较少的请求,因此最后的集合是用于缩小的明显目标(更快为空)。
图7包括图7a和7b,图7示出了根据本发明的某些实施例的流程图。
在开始过程后,激活基本增量。在步骤1中,监视所有活动集合的资源的利用率。在步骤2中,确定是否仅基本增量是活动的。当仅基本增量是活动的(S2中为是),则在步骤3中确定基本集合的资源的利用率是否已经达到上限阈值。如果否(S3中为否),则过程恢复到步骤1,并且如果达到该阈值(S3中为是),则在步骤4中激活具有优先数(pn)M/3的新集合,并且过程恢复到步骤1。当其他集合也是活动时(S2中为否),则在步骤5中确定所有活动集合的资源的利用率是否已经达到上限阈值。如果是这种情况(S5中为是),则在步骤6中确定是否还有仍然可以被激活的任何更多新集合。如果是(S6中为是),则过程前进到步骤4。否则,如果没有其他集合可以被激活(S6中为否),则所有集合都已经被激活。在步骤7中,上限阈值增加到最大设计阈值,并且可以发出系统达到其最大容量的警报。该过程恢复到步骤1。
如果在步骤5中确定“否”,则现在参考图7b,在步骤8中确定任何集合的资源的利用率是否达到上限阈值。如果是这种情况(S8中为是),则在步骤9中,最后激活的集合的优先数以M/6增加,并且过程恢复到步骤1。否则(S8中为否),在步骤10中确定最后激活的集合的资源的利用率是否在下限阈值以下。如果是这种情况(S10中为是),则在步骤11中最后激活的集合被去激活,并且过程恢复到步骤1。否则(S10中为否),在步骤12中确定资源的利用率是否正在减少。如果是这种情况(S12中为是),则在步骤13中,最后激活的集合的优先数以M/6减小,并且过程恢复到步骤1。否则(S12中为否),过程立即恢复到步骤1。
本发明可以扩展到具有分布式架构的所有网络元件。也就是说,其可以应用于包括多个计算机资源的任何分布式系统。
基本上,存在使用根据本发明的算法的主要优点。一方面,现有资源的更好利用率是可能的。此外,可以通过切断不必要的计算资源来节省能量,或者可以为其他过程分派空闲的计算资源。又此外,任务处理可以变得更有成本效益。
最大的优点在于仅必要量的资源被利用。一旦决定从处于低负载的系统移除计算资源(计算资源的集合),则可以确保较低阶计算资源与较高阶计算资源相比具有较少的要处理的业务量。因此,最低阶计算资源可以以适度的方式更快地为空,这允许服务连续性。
应当注意,本发明的实施例可以以软件、硬件、应用逻辑或软件、硬件和应用逻辑的组合实现为电路。在示例实施例中,应用逻辑、软件或指令集被维持在各种常规计算机可读介质中的任何一个上。在本文档的上下文中,“计算机可读介质”可以是可以包含、存储、传送、传播或传输供指令执行系统、装置或设备(诸如计算机或智能电话或用户设备)使用或用于与指令执行系统、装置或设备结合使用的指令的任何介质或部件。
如本申请中所使用的,术语“电路”是指所有的以下内容:(a)仅硬件电路实现(诸如仅模拟和/或数字电路中的实现)和(b)电路和软件(和/或固件)的组合,诸如(如适用):(i)(多个)处理器的组合或(ii)(多个)处理器/软件的部分(包括(多个)数字信号处理器)、软件和(多个)存储器,其一起工作以使得诸如移动电话或服务器之类的装置执行各种功能)和(c)诸如(多个)微处理器或(多个)微处理器的一部分的电路,其需要软件或固件用于操作,即使在软件或固件不物理存在的情况下。“电路”的该限定适用于该术语在本申请中(包括在任何权利要求中)的所有使用。作为另一示例,如本申请中所使用的,术语“电路”还将覆盖仅处理器(或多个处理器)或处理器的部分及它(或它们)的软件和/或固件的实现。术语“电路”还将覆盖(例如并且如果适用于特定权利要求元件的话)用于移动电话的基带集成电路或应用处理器集成电路、或服务器、蜂窝网络设备或其他网络设备中的类似集成电路。
本发明特别涉及但不限于移动通信,例如涉及GSM、3G、LTETM或LTE高级之下的环境,并且还可以有利地实现在控制器、基站、用户设备或智能电话或可连接到这样的网络的计算机中。也就是说,例如,其可以被实现为芯片组/实现在芯片组中以连接设备。
如果期望,本文讨论的不同功能可以以不同的次序和/或彼此同时地执行。此外,如果期望,上述功能中的一个或多个可以是可选的或可以被组合。
尽管在独立权利要求中阐述了本发明的各个方面,但是本发明的其他方面包括来自所描述的实施例和/或从属权利要求的特征与独立权利要求的特征的其他组合,而不仅仅是在权利要求中明确阐述的组合。
本文还要注意,虽然上面描述了本发明的示例实施例,但是这些描述不应在限制性意义上查看。更确切地说,存在可以在不脱离如所附权利要求中限定的本发明的范围的情况下进行的若干变化和修改。
应用本说明书中使用的缩写的以下含义:
CPU 中央处理单元
CR 计算资源(可以是例如虚拟机或网络元件的功能单元)
HW 硬件
IP 网际协议
IP BB IP骨干网
L 负载
LB 负载平衡器
LLT下限负载阈值
LUT上限负载阈值
NE 网络元件
MGW 媒体网关
MSC 移动交换中心
MSS MSC服务器
TAS 电信(也称为电话)应用服务器
Si第i个集合
SR 站点路由器
VM 虚拟机。
此外,在以上说明书中使用以下术语,其要如下那样理解:
池 计算资源的群组,其中术语“集合”在本文使用
pn 优先数
集合 计算资源的群组
活动集合 CR的集合,其可以接收请求和处理呼叫
非活动集合 CR的集合,其只能处理正在进行的呼叫,但不允许接受新的请求。

Claims (14)

1.一种用于分布式系统内的资源管理的方法,包括:
将计算资源组织(S11)成集合;
设置(S12)用于所述集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当最后激活的集合的负载下降到下限阈值以下时,最后激活的集合被去激活;
向每个集合分配(S13)优先数,其中所分配的优先数是用于相应集合的最大可行优先级;
其特征在于
所述分布式系统在核心网络元件中,并且所述计算资源属于所述核心网络元件;
所述集合中的第一集合总是活动的;并且所述方法还包括
在分派给活动集合的计算资源的子区间中分割(S14)区间,其中基于相应集合的优先数来确定每个子区间的长度;以及
将来自区间的随机数指派(S15)给传入请求,并将请求转发到属于包含所指派的随机数的子区间的这样的计算资源。
2.根据权利要求1所述的方法,其中,所述优先数越大,所述子区间的长度越长。
3.根据权利要求1或2所述的方法,其中,当计算资源的集合处于非活动状态或已经缩小时,其优先数指示零优先级。
4.根据权利要求1或2所述的方法,其中,如果单个集合的负载达到上限阈值,则其优先数变为最大,其指示该集合以最高优先级接收传入请求。
5.根据权利要求1或2所述的方法,其中,如果新集合被加载,则其优先数可取决于实时业务量从预设起始值动态改变直到其最大值。
6.根据权利要求1或2所述的方法,其中,所述核心网络元件是电信应用服务器、移动交换服务器、移动性管理实体、服务GPRS支持节点、或呼叫处理节点。
7.一种用于分布式系统内的资源管理的装置,包括:
组织单元(210),其被配置为将计算资源组织成集合;
设置单元(211),其被配置为设置用于所述集合的负载的上限阈值和下限阈值,其中只要操作中集合的平均负载达到上限阈值则操作中集合被加载,并且当超过上限阈值时新集合被激活,而当最后激活的集合的负载下降到下限阈值以下时,最后激活的集合被去激活;
分配单元(212),其被配置为向每个集合分配优先数,其中所分配的优先数是用于相应集合的最大可行优先级;
其特征在于
所述分布式系统在核心网络元件中,并且所述计算资源属于所述核心网络元件;
所述集合中的第一集合总是活动的;并且所述装置还包括
分割单元(213),其被配置为在分派给活动集合的计算资源的子区间中分割区间,其中基于相应集合的优先数来确定每个子区间的长度;以及
处理单元(214),其被配置为将来自区间的随机数指派给传入请求,并将请求转发到属于包含所指派的随机数的子区间的这样的计算资源。
8.根据权利要求7所述的装置,其中,所述优先数越大,所述子区间的长度越长。
9.根据权利要求7或8所述的装置,其中,当计算资源的集合处于非活动状态或已经缩小时,其优先数指示零优先级。
10.根据权利要求7或8所述的装置,其中,如果单个集合的负载达到上限阈值,则其优先数变为最大,其指示该集合以最高优先级接收传入请求。
11.根据权利要求7或8所述的装置,其中,如果新集合被加载,则其优先数可取决于实时业务量从预设起始值动态改变直到其最大值。
12.根据权利要求7或8所述的装置,其中,所述核心网络元件是电信应用服务器、移动交换服务器、移动性管理实体、服务GPRS支持节点、或呼叫处理节点。
13.一种存储计算机程序的计算机可读介质,包括用于当所述计算机程序在计算机上运行时执行权利要求1至6中任一项的方法的步骤的软件代码部分。
14.根据权利要求13所述的计算机可读介质,其中
所述计算机可读介质可直接加载到所述计算机的内部存储器中和/或可通过上传、下载和推送过程中的至少一个经由网络而传输。
CN201480084577.3A 2014-11-25 2014-11-25 用于分布式系统内的资源管理的方法和装置 Active CN107210925B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2014/075539 WO2016082866A1 (en) 2014-11-25 2014-11-25 Optimized resource management in core network elements

Publications (2)

Publication Number Publication Date
CN107210925A CN107210925A (zh) 2017-09-26
CN107210925B true CN107210925B (zh) 2020-07-14

Family

ID=51999414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480084577.3A Active CN107210925B (zh) 2014-11-25 2014-11-25 用于分布式系统内的资源管理的方法和装置

Country Status (7)

Country Link
US (1) US10374832B2 (zh)
EP (1) EP3224985B1 (zh)
JP (1) JP6487045B2 (zh)
KR (1) KR20170088407A (zh)
CN (1) CN107210925B (zh)
PL (1) PL3224985T3 (zh)
WO (1) WO2016082866A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021066621A1 (en) * 2019-10-04 2021-04-08 Samsung Electronics Co., Ltd. Intelligent cloud platform to host resource efficient edge network function

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102047711A (zh) * 2008-04-16 2011-05-04 意大利电信股份公司 动态地配置电信网络的方法和系统
CN102143484A (zh) * 2010-12-20 2011-08-03 华为技术有限公司 资源分配处理方法、装置和网络服务系统
US8024736B1 (en) * 2005-01-28 2011-09-20 Hewlett-Packard Development Company, L.P. System for controlling a distribution of unutilized computer resources
CN102550004A (zh) * 2009-09-30 2012-07-04 阿尔卡特朗讯公司 企业网络中分配的云资源的动态负载平衡和调配
CN102547851A (zh) * 2010-12-15 2012-07-04 中兴通讯股份有限公司 一种无线资源管理方法及系统
WO2012119029A2 (en) * 2011-03-02 2012-09-07 Blackbird Technology Holdings, Inc. Method and apparatus for power autoscaling in a resource-constrained network
EP2570922A1 (en) * 2011-09-13 2013-03-20 Alcatel Lucent Method and system for managing an elastic server farm

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3270012B2 (ja) 1998-09-08 2002-04-02 富士通株式会社 ネットワークサーバ負荷検出装置、割当装置および方法
JP4230673B2 (ja) 2001-02-22 2009-02-25 富士通株式会社 サービス管理装置
JP2006301749A (ja) 2005-04-18 2006-11-02 Hitachi Information Technology Co Ltd サーバ装置
JP5259725B2 (ja) 2008-10-31 2013-08-07 株式会社日立製作所 計算機システム
JP5671484B2 (ja) * 2009-03-02 2015-02-18 トゥイリオ インコーポレイテッドTwilio Inc. マルチテナント電話ネットワークのための方法およびシステム
US20120233313A1 (en) * 2011-03-11 2012-09-13 Hironobu Fukami Shared scaling server system
US9251033B2 (en) 2011-07-07 2016-02-02 Vce Company, Llc Automatic monitoring and just-in-time resource provisioning system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8024736B1 (en) * 2005-01-28 2011-09-20 Hewlett-Packard Development Company, L.P. System for controlling a distribution of unutilized computer resources
CN102047711A (zh) * 2008-04-16 2011-05-04 意大利电信股份公司 动态地配置电信网络的方法和系统
CN102550004A (zh) * 2009-09-30 2012-07-04 阿尔卡特朗讯公司 企业网络中分配的云资源的动态负载平衡和调配
CN102547851A (zh) * 2010-12-15 2012-07-04 中兴通讯股份有限公司 一种无线资源管理方法及系统
CN102143484A (zh) * 2010-12-20 2011-08-03 华为技术有限公司 资源分配处理方法、装置和网络服务系统
WO2012119029A2 (en) * 2011-03-02 2012-09-07 Blackbird Technology Holdings, Inc. Method and apparatus for power autoscaling in a resource-constrained network
EP2570922A1 (en) * 2011-09-13 2013-03-20 Alcatel Lucent Method and system for managing an elastic server farm

Also Published As

Publication number Publication date
WO2016082866A1 (en) 2016-06-02
KR20170088407A (ko) 2017-08-01
US10374832B2 (en) 2019-08-06
PL3224985T3 (pl) 2019-07-31
EP3224985A1 (en) 2017-10-04
EP3224985B1 (en) 2019-01-16
JP6487045B2 (ja) 2019-03-20
US20170264463A1 (en) 2017-09-14
JP2018504008A (ja) 2018-02-08
CN107210925A (zh) 2017-09-26

Similar Documents

Publication Publication Date Title
US11570262B2 (en) Methods, systems, and computer readable media for rank processing for network function selection
US20190253930A1 (en) Resource management apparatus, resource management method, and program
US11671332B2 (en) Adjusting triggers for automatic scaling of virtual network functions
US11044729B2 (en) Function scheduling method, device, and system
US10979285B2 (en) Service transmission method, device, and system
EP2528389A1 (en) Informing method and equipment for index parameter of access type/frequency of selection priority
CN108617033A (zh) 通信的方法、终端和接入网设备
CN106471777B (zh) 网络资源均衡的方法和装置
US20160269297A1 (en) Scaling the LTE Control Plane for Future Mobile Access
JP7132950B2 (ja) 共有ranでのリソース制御
CN107210925B (zh) 用于分布式系统内的资源管理的方法和装置
CN106792923A (zh) 一种配置QoS策略的方法及装置
US9912559B2 (en) Method and apparatus for load-balancing gateway elements
US10061603B2 (en) Method and apparatus for dynamic routing of user contexts
JP2015176350A (ja) キャシュの管理装置及び通信装置
JP6835683B2 (ja) 分散方法
US10747632B2 (en) Data redundancy and allocation system
JP2019028673A (ja) 管理装置および管理方法
CN102395203B (zh) 一种dsp的分配方法和设备
Oikonomou et al. Optimized cloudlet management in edge computing environment
CN114501533A (zh) 语音业务的处理方法、装置及计算机可读存储介质
CN116915871A (zh) 一种业务处理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant