CN108496338A - 用于电信网络中基于云服务的控制器以及提供基于云服务的方法 - Google Patents

用于电信网络中基于云服务的控制器以及提供基于云服务的方法 Download PDF

Info

Publication number
CN108496338A
CN108496338A CN201680079921.9A CN201680079921A CN108496338A CN 108496338 A CN108496338 A CN 108496338A CN 201680079921 A CN201680079921 A CN 201680079921A CN 108496338 A CN108496338 A CN 108496338A
Authority
CN
China
Prior art keywords
service
model
controller
workload
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680079921.9A
Other languages
English (en)
Other versions
CN108496338B (zh
Inventor
D·卢格内斯
J·奥玛纳伊格勒西亚斯
T·沃伊斯
S·布劳恩
J·亚乔纳亚罗卡
J·莱默
V·希尔特
J·塞内尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel Lucent SAS
Alcatel Optical Networks Israel Ltd
Original Assignee
Alcatel Optical Networks Israel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel Optical Networks Israel Ltd filed Critical Alcatel Optical Networks Israel Ltd
Publication of CN108496338A publication Critical patent/CN108496338A/zh
Application granted granted Critical
Publication of CN108496338B publication Critical patent/CN108496338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • H04L41/0897Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities by horizontal or vertical scaling of resources, or by migrating entities, e.g. virtual resources or entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/508Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement
    • H04L41/5096Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement wherein the managed service relates to distributed or central networked applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/76Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/78Architectures of resource allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/80Actions related to the user profile or the type of traffic
    • H04L47/803Application aware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/83Admission control; Resource allocation based on usage prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/70Virtual switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

控制器被提供给处理电信网络中多个类型的业务的基于云的服务,控制器包括:第一阶段,被配置为针对多个业务类型中的每个业务类型的特定工作负载,自动地对被分配给服务的云资源的使用建模,以便针对每个业务类型提供多个模型;第二阶段,被配置为自动地减少模型的数目并且使模型通用化,以便针对每个业务类型提供通用化的模型,该模型适用于特定工作负载以外的其他工作负载;第三阶段,被配置为针对给定工作负载的各种组合,自动地评估通用化模型的准确度,在每个组合中,每个给定的工作负载具有对应的业务类型,并且被配置为依据评估的准确度选择通用化模型中的一个通用化模型;以及第四阶段,被配置为根据所选择的模型控制云资源的操作。

Description

用于电信网络中基于云服务的控制器以及提供基于云服务的 方法
发明领域
本发明涉及电信,具体涉及到用于电信网络中的基于云的服务的控制器以及提供基于云的服务的方法。
背景技术
传统上,基础设施的部署涉及了相对较长的时间尺度,通常是几个月的量级,这有鉴于容量规划、工程决策以及通常固化并且专用的设备(例如,器具)的测试中所涉及的工作,而在大多数情况下上述容量规划、工程决策和测试针对不同上下文或者服务重复利用是不切实际的。通常,这涉及资源的静态和低效率的过度设计(over-engineering),该资源常常包括用于在故障情景或者灾难中进行故障转移的附加的活动和非活动的备用资源。
使用通用服务器进行虚拟化已经是朝向更灵活的部署和服务的重要一步。然而,这才刚刚开始。
使用云的能力和特征的已知方式超越了简单地在商业硬件上执行虚拟化服务,从而实现了更高效的自动化。例如,诸如服务整合、弹性、实时迁移、按需提供和编排(orchestration)的云能力允许电信提供方以动态和预测方式事先分配资源,以满足预期需求,以及以优先和有效的方式自动地处理意外的业务激增。
然而,已知方式的这些优点的实现具有代价:在云上对服务上线、部署和编排很复杂并且耗时。云环境中的配置、集成和测试需要大量的开发工作,包括定义服务组件之间的依赖关系,设置扩展服务的阈值,以及标识资源需求。这种由云堆栈附加的复杂性使今天的上线和配置过程(换句话说,硬件、软件、服务和特征)既困难又昂贵。
有一系列已知技术,通常用于确保云服务中资源的可用性。最相关的是以下内容:
a)过度提供(overprovisioning):为服务启用的资源足以在任何时刻对最大的预期负载进行服务。这导致通常低于10-15%的平均使用率。因此,这种解决方案十分昂贵,因为这些额外的资源可能被其他服务使用(即,存在机会成本),或者服务可能被缩减(即,减少CAPEX)。这种方式不是动态和自动的。
b)反应技术:通常在这种方式中,服务的云实体的状态被单独跟踪。当它们中任何一个触及相应的给定阈值时,则实体被缩放。这种方式的主要问题是:i)设定这些阈值需要服务的专业知识和手动调整,并且耗时和易于出错,ii)因为仅测量各单独组件的资源度量,例如,CPU(中央处理器利用率),MEM(存储器利用率),所以云实体之间的服务依赖性并未被考虑,因此并未涉及服务度量。
c)主动技术:在此,该方式尝试基于历史服务记录来预测系统将要使用的资源的数量。鉴于不可能进行完美的预测,当需求低于预期时,或者由于过载而进入反应模式时,将会出现这种方式进入过度提供的情况。
d)基于规则的技术:就性能而言,这被视为最好的已知方式,但是仅当系统复杂度极低时才有可能;遗憾的是,大部分基于云的服务并非如此,尤其由各种被分配给各种服务链的分布式资源组成的复杂的电信服务。
发明内容
读者可以参考所附的独立权利要求。一些优选特征在从属权利要求中列出。
本发明的示例是用于基于云的服务的控制器,该基于云的服务处理电信网络中多个类型的业务,该控制器包括:
第一阶段,被配置为针对多个业务类型中的每个业务类型的特定工作负载,自动地对被分配给服务的云资源的使用建模,以便针对每个业务类型提供多个模型;
第二阶段,被配置为自动地减少模型的数目并且使模型通用化,以便针对每个业务类型提供通用化的模型,该模型适用于特定工作负载以外的其他工作负载;
第三阶段,被配置为针对给定工作负载的各种组合,自动地评估的通用化的模型的准确度,在每个组合中,每个给定的工作负载具有对应的业务类型,以及依据评估的准确度选择通用化的模型中的一个通用化的模型;以及
第四阶段,被配置为根据所选择的模型控制云资源的操作。
优选地,第三阶段还被配置为依据工作负载的组合,通过至少一个校正因子来适配所选择的模型。
优选地,第三阶段标识在没有附加的云资源情况下服务操作的工作负载范围。
优选地,控制器指令由用于服务的云实体依据针对服务所预期的工作负载提供的云资源的调整。优选地,在操作云资源时该控制器指令由用于服务的云实体依据所选择的模型以及针对服务所预期的工作负载提供的对云资源的调整。
优选地,该控制器通过指令增加/减少被指配给云实体的资源以及增加/减少的云实体的数目中的至少一项来指令云资源的调整。优选地,在吞吐量瓶颈针对所述服务而被预期的情况下,控制器指令增加被指配给云实体的资源和增加云实体数目中的至少一项。这可以通过指令云应用程序接口增加用于服务的云实体的数目来完成。
优选地,该服务由虚拟网络功能VNF来提供,每个VNF具有至少一个对应的云实体。
优选地,所述业务类型包括消息传送、音频和视频业务类型。
优选地,该控制器连接到工作负载控制器,并且被配置为控制工作负载控制器,该工作负载控制器操作为将工作负载应用于云资源并且向该控制器发送数据。
优选地,控制器使用资源数据和服务数据来提供将工作负载与云资源使用相关的模型。优选地,该资源数据至少包括CPU利用率和存储器利用率、磁盘空间以及网络配置中的至少一些。优选地,服务数据包括指示一段时间内的过载的错误消息的数目以及一段时间内所处理的呼叫的数目中的至少一项。优选地,第三阶段被配置为从云应用程序接口和服务应用程序接口中的至少一个或者两者接收数据,以适配减少的数目的通用模型以提供所选择的模型。
优选地,该服务是互联网协议IP多媒体子系统IMS服务。
或者优选地,该服务是N层级服务,例如内容分发网络或者oneApp服务。
一些优选实施例提供了一种方法和控制器,用于自动进行云化服务的简档配置(profiling)、缩放和控制。这些使得例如在服务水平协议(SLA)中定义的服务质量的预期能够被满足,并且允许动态处理基于云的服务的需求的变化。
一些优选的实施例提供智能自动装置(有时被称为自动机),其自动对电信服务进行简档配置以获得代表性模型(或者一组模型)及其限制。利用自动装置,在云中的电信系统的配置和部署被极大地简化了,并且向人工辅助和/或完全自主过程发展。使用智能自动装置可以降低云环境中服务部署的复杂性以及该服务部署所需的时间。
一些优选的实施例包括自动实现的四个阶段(与需要手动干预的已知方式不同),即:1)在线简档配置和建模;2)模型优化和模型数目的减少;3)干扰建模;和4)基于模型的操作。
在一些优选实施例中,在学习了服务模型之后,自动装置能够操作服务并且确定何时以及如何扩展(增加被指配给云实体的资源),扩大(增加云实体的数目)或者缩减(即,减少聚合的容量)服务。
一些优选实施例提供了能够自动地对操作在云平台上的复杂电信服务进行简档配置和建模的框架。这种模型被用以自动地控制(或操作)这种服务。
一些优选的实施例涉及基于观测的测量数据的自动建模。在这些实施例中,当生成系统模型时,不同的模型族被用作基准,并且随后找到最适合所评估服务的一个模型。对于基于云的电信服务的情况,生成的模型包含如下属性,诸如虚拟网络功能(VNF)对服务中给定负载的资源的各种依赖性,VNF之间的相互依赖性,以及对于任何给定输入或者工作负载每个VNF在每一时刻应该有多少实例在运行。在这些实施例中,模型随后被用于控制服务以及准确地决定任意时刻的(VNF驻留在其中的)云实例的数目。基于模型的控制允许通过以下方式来避免瓶颈:在需要时通过缩放来增大动态操作区域。
一些优选的实施例降低或者消除了在云环境中软件组件的部署和编排所带来的复杂性。使得服务提供方能够快速部署新的服务、改变现有服务、向服务增加元件或者从服务移除元件以及在极其不同的环境部署服务。一些优选实施例可以被认为是云编排系统,该云编排系统能够在特定环境中检测用于特定服务的合适配置,并且相应地调整服务。
一些优选实施例实现了快速并且容易的服务部署以及持续的服务优化,并且消除了对耗时的服务提供任务的需求,诸如,针对每个服务的配置脚本的编程,针对每个虚拟机的缩放规则的手动创建,为确保服务在全部可能的环境中运行而对配置参数的保守建议,以及由于疏忽了应用程序依赖性和环境而导致的次优性能。
一些优选实施例减少了它在部署新的服务、改变现有服务、向服务增加元件和从服务中移除元件以及在极其不同环境中部署服务中所需要的时间。
一些优选实施例提供了:一种框架,该框架自动地对服务的业务和资源利用率之间的关系进行简档配置,以及最终创建了获取开发方想要部署的服务的全部行为的一组模型;一种系统标识方式,该方式可以创建用于单个服务的若干模型,以及最终选择最合适的模型;以及一种自动方式,该方式可以适当调节用以处理传入/预报的输入业务的云实体的数目的大小。
一些优选实施例实现了在特定环境中以及在给定的策略和服务水平协议(SLA)的约束下云服务的自动配置和部署。与之不同,已知方式需要大量耗时以及容易出错的手动配置。
一些优选实施例提供了可以用于电信或者其他通用服务类型的N层级服务的自动的适当大小调节。
一些优选实施例提供了使用测量和自学习算法的自动化框架。
本发明的示例还涉及相应的方法。
本发明的另一示例涉及提供基于的云服务的方法,基于的云服务处理电信网络中多个业务类型,该方法包括:
针对多个业务类型中的每个业务类型的特定工作负载,自动地对被分配给服务的云资源的使用建模,以便针对每个业务类型提供多种模型;
自动地减少模型的数目并且使模型通用化,以便针对每个业务类型提供适用于特定工作负载之外的其他工作负载的通用化的模型;
针对给定工作负载的各种组合,自动地评估通用化的模型的准确度,在每个组合中,每个给定的工作负载具有对应的业务类型,以及依据评估的准确度选择一个通用化的模型;以及
根据所选择的模型操作云资源。
参考附图
现在将通过示例并且参考附图的方式来描述本发明的实施例,其中:
图1是示出了整体控制系统的图,该系统也被称为自动化框架或者自动装置,
图2是有限状态机图,其更详细的示出了图1中所示的控制系统的在线简档配置以及建模阶段,
图3是有限状态机图,其更详细的示出了在图1中所示的控制系统的操作控制器,以及
图4是示出了示例IP(互联网协议)多媒体子系统(IMS)网络的图,在该网络中使用了图1所示的控制器系统。
具体实施方式
发明人意识到可以提供自动化框架,其能够自主地对在任意云平台中运行的复杂电信服务的进行简档配置以及建模。这个模型被用以自动地控制(换言之,操作)这种基于云的服务(有时被称为云化服务)。
发明人意识到可以使用基于所观测的测量数据的自动建模的方式。他们意识到,当生成该系统模型时,使用不同模型族作为基准,然后找到最适合评估中的服务的一个模型,这是可行的。对于电信服务的情况,生成的模型包含如下属性,诸如服务中虚拟网络功能(VNF)之间的不同依赖性,或者对于任何给定的输入或者工作负载,在每个时刻应当有多少(VNF驻留在其中的)云实体(也被称为云实例)在运行。模型随后被用于控制服务,以及准确地决定在任何时刻所需的云实例的适当数目。发明人意识到,基于模型的控制允许通过在需要时通过增大来扩大动态操作区域以避免瓶颈。
如图1所示,自动化框架2包含连接到操作控制器6的建模控制器4。
自动化框架2(也称为自动装置或者控制系统)需要有关服务和预期性能的基本信息作为输入。这个信息包括期望的服务水平协议、业务类型(例如SIP、RTP或者HTTP),以及关于虚拟网络功能(VNF)连接的基本信息。自动化框架2可以被视为分成四个阶段,即在线简档配置和建模阶段8、模型优化和减少阶段10、干扰建模阶段12以及基于模型操作14。
建模控制器4包括在线简档配置和建模阶段8、模型优化和减少阶段10和干扰建模阶段12。操作控制器8提供基于模型操作阶段14。
在更详细的考虑它们之前,让我们首先将这四个阶段总结如下:
1)在线简档配置和建模阶段8中,进行各种测试以针对各种业务类型学习服务行为/模型及其限制(即,服务在其中表现的如同预期的操作域)。为了运行这些测试,对控制器4建模的在线简档配置和建模阶段8使用实际业务或者现有的预记录业务的工作负载,或者生成在特定时间投放在服务上的其他工作负载。在此阶段,在线简档配置和建模阶段8着重于服务并且学习不同虚拟网络功能(VNF)的度量如何关于变化的负载而进行演化。例如,服务度量被获取以便检测服务错误的发生。在此阶段的末尾处,建模控制器2具有描述针对所注入的工作负载的VNF行为的多个模型。
2)在模型优化和减少阶段10,针对任意的工作负载,在第一阶段获得的模型和限制被组合以及通用化。
3)干扰建模阶段12中,针对一组异构工作负载评估模型的准确度。针对不同的工作负载组合测量干扰,并且将其包含在模型中。
4)在操作控制器6中,进行基于模型的操作,在其中自动化框架2使用确定的模型操作服务。此操作意味着保持服务在操作域的限制内,以便不会出现瓶颈。因此,每当云实例接近瓶颈时,控制器6将对服务执行动作,例如通过扩大虚拟网络功能(VNF)的云实例的数目,以便增大其预期行为的操作域。为了更一般进行解释,在学习服务模型之后,自动装置能够操作服务并且确定何时以及如何扩展服务(增加被指配给云实体的资源)、扩大服务(增加云实体的数目)或者缩减服务(即,减少聚合的容量)。
现在我们更详细地考虑这四个阶段。
建模控制器
在此示例中,自动化框架2运行在系统标识(SID)模式上,其中SID是如下方式,其包括通常基于回归来评估不同的模型族,诸如基于自回归模型(ARX)、自回归移动平均模型(ARMAX)、Box-Jenkins、非线性自回归移动平均模型(NARMAX)等,并且包括找到最适合真实服务的模型族。
在线简档配置和建模
在线简档配置和建模阶段8(换句话说,用于模型生成的模型生成阶段或者自动装置)在图2中被显示为有限状态机。现在将在下文中描述图2,其中我们在括号内描述从一个状态到另一个状态的转移的名称。
如图2所示,当自动装置被启动以及就绪时(START(开始)),自动装置移动到系统标识(SID)状态以及阶段1,即在线简档配置和建模,通过调用工作负载的注入(INJECT(注入)||REINJECT(重新注入))来开始,其使自动装置移动到injector(注入器)状态。自动装置等待(INJECTOR_WAIT)注入器就绪,直到工作负载实际被注入(TGEN_OK),然后回到SID状态。从那里,SID转到Monitor(监测器)状态(COLLECT_METRICS)以等待指示了对注入的工作负载的系统反应的测量。当新的数据采样到达时,自动装置回到(NEW_METERS)SID。重复该逻辑,直到已经收集了任意数目的样本N(N取决于特定算法,该特定算法用于从收集的度量来导出服务模型)。并非对全部度量都进行建模,因为这将引起极度的和不必要的复杂性。通过利用工作负载分析其变化,只有相关的度量被考虑(例如,那些具有更多的相关变化和更高相关性的度量)。
SID针对{虚拟网络功能(VNF)、工作负载、模型族(ARX,ARMAX等)}的每个组合计算特定度量的模型。以这种方式,在输入工作负载的执行期间收集了N个采样点之后,该模型被改进并且被在线更新。
对于任意数目的工作负载重复该过程,并且阶段1的结果包括基于这种工作负载的多个模型。因此,在每个工作负载结束时生成INJECT_NEXT转移,直到全部工作负载都已经被执行。
重点注意,在执行工作负载期间,如果达到任何实例的限制(饱和或者瓶颈),则自动装置从SID转移(SYS_LIMIT)到依赖关系(dependencies)状态。在这里,自动装置存储了瓶颈的实例在达到这个瓶颈之前能够处理的负载量,以及哪个实例变得饱和从而引起瓶颈。另外,它还存储每个VNF类型的云实例的数量以及用于这些负载量的云实例的资源使用的信息。此信息随后被用于使用适当数目的实例来缩放系统。在更新依赖关系(DEP_UPDATED)之后,逻辑返回到SID,并且导致瓶颈的(多个)VNF被缩放,参见转移到缩放(Scaling)状态的SCALE(缩放)。自动装置等待Scaling操作完成(SCALING_WAIT),存储诸如对要缩放的VNF进行缩放所需时间的信息,并且返回SID(SCALE_READY)。一旦回到SID,它将要求重新注入当前的工作负载或者注入下一个工作负载。
模型优化和减少
还如图2所示,一旦全部工作负载已经被运行,自动装置转移(OPTIMIZE(优化))到模型优化和减少(MOR)状态。在此,阶段2,即模型优化和减少阶段,开始并且模型在redux状态中被减少和通用化(REDUCE_MODELS)。redux的输入是针对{Family_model(模型族),traffic_type(业务类型),工作负载,VNF,selected_metrics(所选择的度量)}中每个组合的模型。redux按工作负载和VNF组合了不同的度量,将模型的数目减少到{Family_model,traffic_type,VNF}的组合。即,自动装置尝试找到用于全部业务类型的模型(或者减少数目的模型)。
还如图2所示,下一个阶段是选择每个VNF和信息业务类型的最终模型。框架移动到eval(EVAL_MODELS)状态。在此,框架使用第二组工作负载来验证以及选择每个VNF的最终模型。自动装置在eval、injector、monitor以及scale之间迭代地移动,同时注入这些工作负载,收集样本并且在发生瓶颈(限制)时缩放系统。一旦全部负载都已经被注入,框架在所收集的数据与由不同模型获得的结果之间执行对比,以找到每个VNF的具有最小错误(例如,具有最小平均绝对百分比误差MAPE)的模型,以及生成转移(MODELS_READY)以指示阶段2的结束。
干扰建模
自动装置的阶段3(即干扰建模)旨在发现由异构工作负载(即各种业务类型的各个负载的混合和组合)产生的干扰。作为结果,自动装置将确定是否可以将服务及其VNF建模为针对各种业务类型获得的模型的聚合,或者确定是否需要校正因子。自动装置将在interf、injector、monitor和scale之间迭代地移动,同时注入异构工作负载,收集样本并且在需要时缩放服务。当不同的工作负载的组合或者混合已经被注入后,执行对所观测的样本和所期望的来自于模型的结果之间的比较。这些结果将规定针对任何工作负载组合,对于任何VNF是否需要校正因子。一旦已经计算出这些因子,转移(INTERF_READY)使自动装置返回到MOR并且结束阶段3。
用于基于模型的操作的操作控制器
在此,自动装置已经学习了模型,并且它能够在基于模型的操作阶段(阶段4)自动地操作系统。返回参考图1,该操作由独立操作的自动装置14(即,在操作控制器6中)来完成。图3显示了设计用于控制/操作服务的有限状态机。
如图3所示,操作的自动装置14需要如下的输入:i)在建模阶段所用的系统和服务度量;以及ii)服务的离开率和业务率。需要此信息以便在事先有足够时间的情况下动态开启服务。
当模型和服务本身就绪时,操作的自动装置14从init状态移动到control(控制)状态(START)。首先,自动装置14移动到collect(收集)(COLLECT_METRICS)状态,其中针对每个业务类型收集服务度量以及当前的传入率和离开率,并且将其发送到control(NEW_INPUTS)。该操作需要提前采取动作,从而移动到prediction(预测)(NEW_PRED)状态,它寻求服务在时间T内应当预期的负载量的预测。该预测基于最后K个时隙期间是输入率和离开率的时间序列分析。操作的自动装置的提前看到的时间T可以计算为T=max(Ti)+t,max(Ti)是框架需要对VNF的实例进行实例化的最大时间;,并且t是可以由用户设置的一些额外的机动(manoeuvring)时间。一旦预测被计算之后,自动装置14回到control(PRED_READY)。利用服务的当前度量以及服务模型,操作的自动装置14计算服务预测的负载所需的每个VNF的云实例的数目。通过使用模型以及预期的负载量来计算每个VNF的云实例的数目。随后,生成的云实例的数目足以确保服务保持在操作区域的预期行为的限制内。如果添加或者移除任何实例,操作的自动装置14移动到actuate(开启)(SCALE(缩放))状态,并且进行所需的编排动作(扩大、缩减)。自动装置14随后等待此动作完成(ACTION_WAIT),以及移回control(ACTION_TAKEN)。最终,操作的自动装置14等待下一个时隙(WAIT(等待)),在此将发生控制循环的下一次迭代。
应用示例:IP多媒体子系统(IMS)示例
图4显示了使用的自动化框架的示例。
如图4所示,给定用户16(本例中为电信运营方或者开发方)想要在云基础设施18中部署服务(例如IP多媒体子系统IMS)17。
参考图4,自动化框架2’请求开发方16提供关于他想要部署的服务的基本信息,即:工作负载类型(例如,在IMS示例中的音频、视频业务或者即时消息),虚拟网络功能VNF(例如,呼叫服务器,分组接口模块SCM,等等),以及服务水平协议SLA,例如,关于在什么情况下可能预期归因于过载的“服务不可用”响应(例如,错误代码“503”),以及将使用与SLA相对应的哪些服务质量度量。利用此基本信息,该框架为将要执行的简档配置试验生成一组业务工作负载,最初是每个业务类型一个工作负载。然后,针对每个工作负载,自动化框架2’执行如上所述的服务的定向的简档配置以及建模。如图4所示,在此示例中这通过使用专门的工作负载测试器(或工作负载生成器)20来完成。例如,增加工作负载,并且例如监测“服务不可用”(“503”错误)的指示符以了解是否已经到达限制。在其他类似示例中,可以使用与业务有关的现有的生成数据,和/或历史数据。
自动化框架2’连接到服务和云应用程序接口(API’S)。该框架使用那些API以便:
i)收集资源度量(例如,CPU、存储器(MEM)、硬盘、网络),以及例如服务水平协议(SLA)中所定义的、与服务质量有关的服务度量(例如,503响应和已处理的呼叫数目)—在创建将工作负载与资源利用相关的模型期间使用此信息;
ii)在模型被创建、减少和评估后,自动化框架2’的操作控制器6执行动作以与云应用程序接口(API)22通信以便调整(“适当调节大小”,“缩放”,“增长/退增长”)云资源的数目,例如,如在之前的部分中所述的,在基于模型的操作14中处理流入的业务所需的云实体(例如虚拟机或者容器)的数目。此过程确定服务所需的资源的数量,以便提供正确的服务质量,换句话说,对于任何到达率满足约定的SLA,并且然后在提前足够的时间的情况下执行可扩展的操作,使得新的云实体(例如虚拟机VM)24在服务资源耗竭之前启动并且运行,从而最小化SLA的违反。
让我们考虑开发方16想要将IMS服务部署到云基础设施18中的场景中的信息流。自动化框架2’可以被认为具有图1中所示的四个阶段8,10,12,14,换句话说,如上所述被分成四个阶段。附加地,此示例中更具体地,应用以下内容。
在在线简档配置和建模阶段(换句话说,在阶段1中)中,针对每个服务的业务类型(之前由/为用户请求的)创建各种模型。例如,考虑消息传送、音频和视频的业务类型。在此阶段期间,框架2’为每个业务类型生成若干工作负载,并且与负责将工作负载注入/重新注入到服务的工作负载测试器20进行通信。一旦工作负载被注入后,框架2’随后与云基础设施18和服务API 26进行通信以便监测和服务度量。这些度量被用于创建将每个度量与输入工作负载相关联的在线模型。
在模型优化和减少阶段(换句话说,阶段2),框架2’对创建的不同模型进行评估,并且通过比较它们的平均绝对百分比误差MAPE(其是已知的简档配置模型误差的公式)来选择最准确的一个模型。
在干扰建模阶段中(换句话说,阶段3),注入一组新的工作负载,其中在这种情况下,工作负载包括各种业务混合,目的是获取当不同比例的业务类型同时被注入到服务时的干扰,与阶段1类似。在此阶段,框架2’还连接到云18以及服务API 26以便利用干扰因子来丰富以及验证在阶段2中定义的模型。
最终,在基于模型操作的阶段(换句话说,阶段4),已创建的模型被用于计算业务混合的到达率,以动态地计算处理该业务所需的云实体24的数量。附加地,在此阶段,自动化框架2’在后台持续执行模型验证以捕获来自未知业务的新的模型方面。
一些其他示例
代替IMS,一些其他示例可以用于以下类型的云化服务:内容分发网络、oneApp、其他的多层服务(例如,传统的基于web的服务)。
在不脱离其本质特征的情况下,本发明可以以其他特定形式体现。例如,该自动化框架可以被部署在应用中。所描述的实施例在全部方面都应被视为仅是说明性的而非限制性的。因此,本发明的范围由所附权利要求而不是前面的描述来指示。在权利要求的等同方式的内涵和外延内的所有变化都包含在其范围内。
本领域技术人员将容易认识到,各种上述方法的步骤可以由编程的计算机执行。一些实施例涉及程序存储设备,例如数字数据存储介质,其是机器或者计算机可读的并且编码了机器可执行的或者计算机可执行的指令程序,其中所述指令执行所述的上面描述的方法的一些或者全部步骤。程序存储设备可以是,例如,数字存储器,诸如磁盘和磁带的磁存储介质,硬盘驱动器,或光可读数字数据存储介质。一些实施例涉及被编程为执行上述方法的所述步骤的计算机。

Claims (15)

1.一种用于基于云的服务的控制器,所述基于云的服务处理电信网络中的多个类型的业务,所述控制器包括:
第一阶段,所述第一阶段被配置为针对多个业务类型中的每个业务类型的特定工作负载,自动地对被分配给所述服务的云资源的使用建模,以便针对每个业务类型提供多个模型;
第二阶段,所述第二阶段被配置为自动地减少所述模型的数目并且使所述模型通用化,以便针对每个业务类型提供通用化的模型,所述通用化的模型适用于所述特定工作负载以外的其他工作负载;
第三阶段,所述第三阶段被配置为针对给定工作负载的各种组合,自动地评估所述通用化的模型的准确度,在每个组合中,所述给定的工作负载中的每个给定的工作负载具有对应的业务类型,并且所述第三阶段被配置为依据评估的准确度选择所述通用化的模型中的一个通用化的模型;以及
第四阶段,所述第四阶段被配置为根据所选择的模型控制所述云资源的操作。
2.根据权利要求1所述的控制器,其中所述第三阶段还被配置为依据工作负载的所述组合,通过至少一个校正因子来适配所选择的模型。
3.根据权利要求1或者权利要求2所述的控制器,其中所述第三阶段标识在没有附加的云资源情况下所述服务操作的工作负载范围。
4.根据任何一项前述权利要求所述的控制器,其中所述控制器指令由用于所述服务的云实体依据针对所述服务所预期的工作负载提供的所述云资源的调整。
5.根据权利要求4所述的控制器,其中在操作所述云资源时,所述控制器指令由用于所述服务的所述云实体依据所选择的模型和针对所述服务所预期的所述工作负载提供的所述云资源的调整。
6.根据权利要求4或者权利要求5所述的控制器,其中所述控制器通过指令增加被指配给云实体的资源以及增加云实体的数目中的至少一项,或者通过指令减少被指配给云实体的资源以及减少云实体的数目中的至少一项,来指令所述云资源的调整。
7.根据权利要求6所述的控制器,其中在吞吐量瓶颈针对所述服务而被预期的情况下,所述控制器指令增加被指配给云实体的资源以及增加云实体的数目中的至少一项。
8.根据任何一项前述权利要求所述的控制器,其中所述服务由虚拟网络功能VNF提供,每个VNF具有至少一个相应的云实体。
9.根据任何一项前述权利要求所述的控制器,其中所述业务类型包括消息传送业务类型、音频业务类型和视频业务类型。
10.根据任何一项前述权利要求所述的控制器,其中所述控制器连接到工作负载测试器,以及被配置为控制所述工作负载测试器,所述工作负载控制器操作为将所述工作负载应用于所述云资源并且向所述控制器发送数据。
11.根据任何一项前述权利要求所述的控制器,其中所述控制器使用资源数据和服务数据来提供将工作负载与云资源使用相关的所述模型。
12.根据权利要求11所述的控制器,其中所述资源数据包括以下中的至少一些:CPU利用率和存储器利用率、磁盘空间以及网络配置;并且所述服务数据包括以下中的至少一项:指示一段时间内的过载的错误消息的数目以及一段时间内所处理的呼叫的数目。
13.根据权利要求11或者权利要求12所述的控制器,其中所述第三阶段被配置为从云应用程序接口和服务应用程序接口中的至少一个或者两者接收数据,以适配减少的数目的通用化的模型以提供所选择的模型。
14.根据任何一项前述权利要求所述的控制器,其中所述服务是互联网协议IP多媒体子系统IMS服务。
15.一种提供基于云的服务的方法,所述基于云的服务处理电信网络中的多个类型的业务,所述方法包括:
针对多个业务类型中的每个业务类型的特定工作负载,自动地对被分配给所述服务的云资源的使用建模,以便针对每个业务类型提供多种模型;
自动地减少所述模型的数目并且使所述模型通用化,以便针对每个业务类型提供通用化的模型,所述通用化的模型适用于所述特定工作负载以外的其他工作负载;
针对给定工作负载的各种组合,自动地评估所述通用化的模型的准确度,在每个组合中,所述给定的工作负载中的每个给定的工作负载具有对应的业务类型,以及依据评估的准确度选择所述通用化的模型中的一个通用化的模型;以及
根据所选择的模型操作所述云资源。
CN201680079921.9A 2015-12-11 2016-12-09 用于电信网络中基于云服务的控制器以及提供基于云服务的方法 Active CN108496338B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15306988.5A EP3179699B1 (en) 2015-12-11 2015-12-11 A controller for a cloud based service in a telecommunications network, and a method of providing a cloud based service
EP15306988.5 2015-12-11
PCT/EP2016/080467 WO2017097992A1 (en) 2015-12-11 2016-12-09 A controller for a cloud based service in a telecommunications network, and a method of providing a cloud based service

Publications (2)

Publication Number Publication Date
CN108496338A true CN108496338A (zh) 2018-09-04
CN108496338B CN108496338B (zh) 2021-02-02

Family

ID=55077374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680079921.9A Active CN108496338B (zh) 2015-12-11 2016-12-09 用于电信网络中基于云服务的控制器以及提供基于云服务的方法

Country Status (4)

Country Link
US (1) US10862766B2 (zh)
EP (1) EP3179699B1 (zh)
CN (1) CN108496338B (zh)
WO (1) WO2017097992A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918275A (zh) * 2019-01-17 2019-06-21 珠海金山网络游戏科技有限公司 一种实现对服务器性能进行压力测试的方法、装置及系统
CN110472875A (zh) * 2019-08-20 2019-11-19 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN114666223A (zh) * 2020-12-04 2022-06-24 中国移动通信集团设计院有限公司 云计算资源池处理方法、装置及可读存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10700946B2 (en) * 2017-08-08 2020-06-30 Amdocs Development Limited System, method, and computer program for automatically certifying a virtual network function (VNF) for use in a network function virtualization (NFV) based communication network
EP3732837A4 (en) 2017-12-29 2021-11-03 Nokia Technologies Oy VIRTUALIZED NETWORK FUNCTIONS
US10764113B2 (en) * 2018-07-05 2020-09-01 At&T Intellectual Property I, L.P. Self-adjusting control loop
US11023179B2 (en) 2018-11-18 2021-06-01 Pure Storage, Inc. Cloud-based storage system storage management
US10880173B2 (en) 2018-12-03 2020-12-29 At&T Intellectual Property I, L.P. Automated certification of network functions
US11562299B2 (en) * 2019-06-18 2023-01-24 Vmware, Inc. Workload tenure prediction for capacity planning
CN112631860A (zh) * 2020-12-21 2021-04-09 常州微亿智造科技有限公司 工业物联网数据传输Worker服务监控方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761962A (zh) * 2003-03-21 2006-04-19 国际商业机器公司 将非结构化数据实时聚集为结构化数据以便关系数据库引擎进行sql处理
CN101937359A (zh) * 2010-08-19 2011-01-05 中国船舶重工集团公司第七○九研究所 一种面向仿真应用的通用可扩展计算系统
CN102256266A (zh) * 2011-07-04 2011-11-23 重庆邮电大学 一种面向用户应用的自适应接入网络选择实现装置及方法
US20130185729A1 (en) * 2012-01-13 2013-07-18 Rutgers, The State University Of New Jersey Accelerating resource allocation in virtualized environments using workload classes and/or workload signatures
CN103383655A (zh) * 2012-01-13 2013-11-06 埃森哲环球服务有限公司 用于在qos感知云中管理合并的工作负载的性能干扰模型
CN103403682A (zh) * 2012-11-23 2013-11-20 华为技术有限公司 一种逻辑对象部署方法、相关装置及系统
US20140089509A1 (en) * 2012-09-26 2014-03-27 International Business Machines Corporation Prediction-based provisioning planning for cloud environments
CN104301403A (zh) * 2014-09-26 2015-01-21 东北大学 基于组件服务副本增删的云服务资源动态配置系统及方法
US20150295808A1 (en) * 2012-10-31 2015-10-15 Matt O'Malley System and method for dynamically monitoring, analyzing, managing, and alerting packet data traffic and applications
US20150326535A1 (en) * 2014-05-07 2015-11-12 Verizon Patent And Licensing Inc. Network platform-as-a-service for creating and inserting virtual network functions into a service provider network

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7146353B2 (en) * 2003-07-22 2006-12-05 Hewlett-Packard Development Company, L.P. Resource allocation for multiple applications
US9679029B2 (en) * 2010-11-08 2017-06-13 Globalfoundries Inc. Optimizing storage cloud environments through adaptive statistical modeling
JP6237318B2 (ja) * 2014-02-19 2017-11-29 富士通株式会社 管理装置、業務負荷分散管理方法および業務負荷分散管理プログラム
US20160328273A1 (en) * 2015-05-05 2016-11-10 Sap Se Optimizing workloads in a workload placement system

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761962A (zh) * 2003-03-21 2006-04-19 国际商业机器公司 将非结构化数据实时聚集为结构化数据以便关系数据库引擎进行sql处理
CN101937359A (zh) * 2010-08-19 2011-01-05 中国船舶重工集团公司第七○九研究所 一种面向仿真应用的通用可扩展计算系统
CN102256266A (zh) * 2011-07-04 2011-11-23 重庆邮电大学 一种面向用户应用的自适应接入网络选择实现装置及方法
US20130185729A1 (en) * 2012-01-13 2013-07-18 Rutgers, The State University Of New Jersey Accelerating resource allocation in virtualized environments using workload classes and/or workload signatures
CN103383655A (zh) * 2012-01-13 2013-11-06 埃森哲环球服务有限公司 用于在qos感知云中管理合并的工作负载的性能干扰模型
US20140089509A1 (en) * 2012-09-26 2014-03-27 International Business Machines Corporation Prediction-based provisioning planning for cloud environments
US20150295808A1 (en) * 2012-10-31 2015-10-15 Matt O'Malley System and method for dynamically monitoring, analyzing, managing, and alerting packet data traffic and applications
CN103403682A (zh) * 2012-11-23 2013-11-20 华为技术有限公司 一种逻辑对象部署方法、相关装置及系统
US20150326535A1 (en) * 2014-05-07 2015-11-12 Verizon Patent And Licensing Inc. Network platform-as-a-service for creating and inserting virtual network functions into a service provider network
CN104301403A (zh) * 2014-09-26 2015-01-21 东北大学 基于组件服务副本增删的云服务资源动态配置系统及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918275A (zh) * 2019-01-17 2019-06-21 珠海金山网络游戏科技有限公司 一种实现对服务器性能进行压力测试的方法、装置及系统
CN110472875A (zh) * 2019-08-20 2019-11-19 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN114666223A (zh) * 2020-12-04 2022-06-24 中国移动通信集团设计院有限公司 云计算资源池处理方法、装置及可读存储介质
CN114666223B (zh) * 2020-12-04 2023-11-21 中国移动通信集团设计院有限公司 云计算资源池处理方法、装置及可读存储介质

Also Published As

Publication number Publication date
US10862766B2 (en) 2020-12-08
EP3179699A1 (en) 2017-06-14
US20180278485A1 (en) 2018-09-27
WO2017097992A1 (en) 2017-06-15
EP3179699B1 (en) 2020-05-27
CN108496338B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN108496338A (zh) 用于电信网络中基于云服务的控制器以及提供基于云服务的方法
US20220247633A1 (en) Methods, systems and apparatus to improve cluster efficiency
Huber et al. Model-based self-aware performance and resource management using the descartes modeling language
Weyns et al. Perpetual assurances for self-adaptive systems
Bodík et al. Statistical Machine Learning Makes Automatic Control Practical for Internet Datacenters.
NO348072B1 (en) Workflow optimization
Pérez et al. Assessing sla compliance from palladio component models
US20200125962A1 (en) Runtime prediction for a critical path of a workflow
Ardagna et al. Rethinking the use of models in software architecture
Bousselmi et al. Cloud services orchestration: A comparative study of existing approaches
US11461669B2 (en) Runtime prediction for a job of a workflow
US20200125448A1 (en) Failure prediction in a workflow
Pérez et al. Line: Evaluating software applications in unreliable environments
Incerto et al. Symbolic performance adaptation
Pahl et al. Software architecture for the cloud–a roadmap towards control-theoretic, model-based cloud architecture
Fourati et al. Epma: Elastic platform for microservices-based applications: Towards optimal resource elasticity
Brosig Architecture-level software performance models for online performance prediction
Villegas et al. Context-driven adaptive monitoring for supporting SOA governance
Klinaku et al. Architecture-based evaluation of scaling policies for cloud applications
Taheri et al. vmbbthrpred: A black-box throughput predictor for virtual machines in cloud environments
Iosup et al. Self-awareness of cloud applications
Kounev et al. Model-based techniques for performance engineering of business information systems
Danciu et al. Performance awareness in Java EE development environments
Oberle et al. DDPS: A Project Methodology for Data-Driven Process Simulation.
CN112639739A (zh) 在至少两个不同级别的平台的计算机上分发特定应用的子应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant