CN101084680B - 在电信服务和/或网络管理平台中管理资源的方法、相应平台及其计算机程序产品 - Google Patents
在电信服务和/或网络管理平台中管理资源的方法、相应平台及其计算机程序产品 Download PDFInfo
- Publication number
- CN101084680B CN101084680B CN2004800446483A CN200480044648A CN101084680B CN 101084680 B CN101084680 B CN 101084680B CN 2004800446483 A CN2004800446483 A CN 2004800446483A CN 200480044648 A CN200480044648 A CN 200480044648A CN 101084680 B CN101084680 B CN 101084680B
- Authority
- CN
- China
- Prior art keywords
- agency
- resource
- platform
- processing
- processing execution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004590 computer program Methods 0.000 title description 4
- 238000012545 processing Methods 0.000 claims abstract description 111
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000007726 management method Methods 0.000 claims description 35
- 230000015572 biosynthetic process Effects 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 10
- 238000013439 planning Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 2
- 238000011282 treatment Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 25
- 238000013396 workstream Methods 0.000 description 12
- 230000006978 adaptation Effects 0.000 description 9
- 230000009471 action Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 6
- 101150012579 ADSL gene Proteins 0.000 description 5
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 5
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 238000010960 commercial process Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000251730 Chondrichthyes Species 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q3/00—Selecting arrangements
- H04Q3/0016—Arrangements providing connection between exchanges
- H04Q3/0062—Provisions for network management
- H04Q3/0087—Network testing or monitoring arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5003—Managing SLA; Interaction between SLA and QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5003—Managing SLA; Interaction between SLA and QoS
- H04L41/5009—Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/046—Network management architectures or arrangements comprising network management agents or mobile agents therefor
Abstract
本发明涉及用于在电信服务和网络中管理资源的方法和系统。该方法和系统涉及由处理机器(H)上的分布式代理(A1、A2、A3)执行处理(WF1、……、WFn),以执行在网络上的预定的任务,并且其特征在于:设置将由系统满足的包括关于处理(WF1、……、WFn)和资源使用约束的目标;监视计算代理的资源使用和处理执行,并且收集代表资源使用和处理执行的性能数据;比较所收集的性能数据与所设置的数据,当性能数据并未实现目标数据时,建立处罚;并且重新分配用于代理(A1、A2、A3)的处理执行的资源,从而使基于所述比较而确定的处罚最小化。
Description
技术领域
本发明涉及一种用于管理旨在管理电信网络和/或服务的平台内的资源的方法。具体而言,本发明涉及一种用于在管理电信网络和/或服务的平台内分配资源的方法和相应的管理平台。
背景技术
在通信网络/服务领域内,提供包括多个组件的管理平台,所述多个组件例如为在分级架构上组织(有时基于代理)的操作支持系统(OSS)。
US 6243396公开了例如一种通信网络管理系统或平台,其具有控制电信网络资源的互连管理机构的多层分级架构。每个机构具有负责处理的执行的多个代理,它们可以是智能的或者简单的反应代理。
在该公知的架构中,反应代理位于该机构的平台部分内,智能代理位于该机构的控制部分内。将智能和反应代理分组到功能组件以将FCAPS(故障、配置、计费、性能、安全)功能提供给平台。
WO 01/02973教导使用包括集中式处理协调器的平台,所述协调器用于分布式代理的协调,通常利用运行工作流描述(类似于流程图)的工作流引擎来实现,所述工作流描述包括将作业委托给组件(代理)、从代理收集响应、等等。
申请人认为上述架构并未保证代理执行工作流引擎委托的作业。实际上,可用于代理的IT资源,例如计算能力,是有限的,不能保证IT资源足以满足对于平台的所请求商业目标或工作负载。
换句话说,可用于代理的IT资源可能阻止达到预定的商业目标,该商业目标要求由代理执行例如将服务递送给客户的任务。
例如,任务可以是在短于预先定义的持续时间的平均时间内完成预定的处理,或者在固定的期限内完成确定数量的处理。
代理的巨大工作负载可能妨碍代理在预先定义的平均时间或者在固定的期限内完成任务,因而导致无法达到商业目标。
在如WO 01/02973公开的使用集中式处理协调器的基于代理的架构中的另一个问题是协调器本身变成平台操作中的瓶颈,处于将工作流添加到协调器中以提高灵活性的代理外部的处理逻辑越多,协调器将变得越慢。这可能使处理商业性能目标(例如具有其执行期限的处理)的架构的能力恶化。
在IT资源管理领域中,美国专利申请第2003/0167270号公开了一种分布式环境中的资源管理系统,该系统包括多个主机,这些主机实例化(instantiate)可伸缩应用的拷贝。该资源管理系统基于关于应用的拷贝和主机性能的信息,生成启动、关机或者将可伸缩应用的选定拷贝在主机间移动的信号。
此种解决方案至少因为下述原因而并不非常适合于包括由处理协调器或工作流引擎协调的分布式代理架构的平台:
-在所有代理都已经执行某些任务的情况下,可能没有空闲代理用于紧急工作或应用的新执行;
-每次定义新工作流(即新功能),为了满足商业目标(如商业处理的期限),公知系统需要测量关于应用的参数和建立新模型以调整所有代理的新行为;
-公知的资源管理系统仅仅用于可被实例化为多个拷贝的应用或功能。
发明内容
因此,本发明的目的是提供一种对用于管理电信服务和/或网络的基于代理的平台的资源进行管理的方法,该方法通过在资源使用中实现最佳性能,以提高平台效率,从而实现预定的商业目标。
本发明的另一个目的是具有分散式处理逻辑从而在提高平台灵活性的同时实现其更佳性能的管理平台。
根据本发明,这些目的是通过一种对用于管理电信服务和/或网络的平台内的资源进行管理的方法以及通过具有在独立权利要求内提及的特征的管理平台来实现的。
本发明的其它目的是如权利要求所要求保护的用于建立和运行电信管理平台的计算机程序产品或计算机程序集合、电信网络和方法。
总之,为了克服现有技术的缺点,本发明公开了一种基于由预定的指示器(如商业密钥指示器)和目标驱动的预测和适应机制的方法和相应平台,其用于测量和自动控制在管理平台中的IT资源使用。
优选地,根据本发明的平台的架构特征是:
-在代理内提供处理(工作流和规则)引擎,用于实施由所述代理提供的所有功能,以使得代理必须运行的作业成为工作流执行。可以将规则引擎耦合到工作流引擎以执行某些类型的作业。
-提供集中式处理描述数据库用于定义和存储处理描述,并用于将这些描述分给代理。
-提供目标和约束控制台,其允许包括商业目标(如SLA,服务层级协议)的目标数据的指定,和基于功能定义及其集合(如集合到像实现、保证、计费这样的商业处理领域)的处理优先级;
-提供控制代理,其被安排为用于监视在平台的每个代理内的每个处理执行对IT资源的使用,以及由商业处理对工作流的执行,即例如用于监视已过时间、执行频率等等;并
-提供资源分配模块,其被安排为用于基于指定的目标数据(商业目标)和所监视的代表资源使用的性能数据,以自适应方式将IT资源重新分配给平台的每个代理,从而提供最大层级的商业目标实现。
有利地,根据本发明的优选实施例,提供重新分配器控制台作为图形用户界面来定义资源重新分配规则,并提供监视控制台,该监视控制台允许对SLA实现趋势和相应IT资源使用及相关代价进行控制。
在代理内提供处理引擎被证明对于代理间IT资源的动态分配是有利的特征,使得提高了灵活性同时未引入瓶颈,当所有引擎都放置在集中式处理协调器内时就是如此。代理内部的处理引擎允许对于每个功能执行(即,处理执行)分析地测量代理内的资源使用(例如,所使用的CPU时间或RAM)。
将在集中式数据库内的处理描述跨越平台分发给每个代理以在它们的处理引擎内使用,从而实现与平台的全部操作功能的自动同步,以便可以调整与作业语义一起运行的资源管理过程。
实际上,用于管理电信服务和网络的平台的管理员可以建立任何FCAPS(故障、配置、计费、性能和安全)功能,该功能在处理数据库中定义一个或多个工作流和/或规则或者组合现有的多个工作流和/或规则;随后代理自动地获取新处理(工作流和规则)定义并在需要时运行它们。目标控制台自动地允许对于新处理定义SLA和优先级。在运行时间,控制代理允许对于新处理控制SLA趋势和相应IT资源使用,以便重新分配器模块可以优化整体配置,即,改变代理处的工作流优先级或者向该代理提供更多的计算资源(CPU、存储器等等)。
根据本发明的资源管理优选地是在平台中由集中式模块(管理器模块)和分布式模块(控制代理)一起实现的。集中式和分布式功能的组合是该方案的自适应机制的基础。
附图说明
在以下描述中将更详细地解释本发明的其它特征和优点,通过参考附图以非限制示例的方式提供所述描述,在附图中:
图1是表示根据本发明的用于管理电信网络的服务的系统或平台的架构的方框图;
图2是表示图1的管理器模块的内部结构的方框图;
图3是表示图1的具有代理模块和控制代理的主机的内部结构的方框图;
图4是表示根据另选实施例的代理模块的内部结构的方框图;
图5是根据本发明的资源管理方法的流程图;
图6是包含根据本发明的系统的三层服务规定场景的示意图;和
图7是表示在图6的服务规定场景中的多层工作流的图。
具体实施方式
图1表示根据本发明的用于管理电信服务和网络的系统的示例架构。该系统优选地在包括多个处理主机H的分布式处理架构上实现,每个主机H可以包括一个或多个软件代理(A1,A2,A3)。
系统(或平台)包括集中式控制模块或管理器模块MM,该集中式控制模块或管理器模块MM包括在主机上运行并与用于各种协调动作的分布式代理交互的程序或程序组,所述协调动作例如为处理描述的分发、操作的调用、管理控制等等。管理器模块MM还可以优选地包括用于与诸如系统管理员的用户交互的图形用户界面。
在该说明书中,术语处理用于代表一个或多个工作流、一个或多个规则、或者优选地一个或多个工作流和一个或多个规则的组合。
可以将工作流定义为商业过程的自动化,在该过程中,根据一组程序规则,将信息或任务从一个代理传送给另一个代理以进行动作。
通过具有一系列任务以及任务之间的时间和逻辑依赖性的、包括多个另外的或并行的分支的流程图来代表该工作流。存在像XPDL(XML处理描述语言)这样的专门(ad hoc)语言来格式化工作流描述。
规则是声明当发生一组特定条件/事件时必须执行哪些动作。
管理器模块MM包括处理描述数据库PDB,其被安排为存储代表平台的行为和功能方面的所有处理,即,工作流和规则。
数据库PDB还包括例如由工作流和规则处理的数据模型。
处理描述数据库PDB例如可以与本领域普通技术人员公知的任何常规网络存货清单系统的目录部分相关联。
图1的架构包括多个多层代理模块,作为示例示出分别包括某些代理A1、A2、A3的三层。属于同一层级的代理可以相互连接或者可以相互独立。如果可能,将它们耦合到更高层级的代理。在较低层级处,将代理耦合到受控的网络单元(通常表示为通信网络N),例如耦合到ATM交换机、或者耦合到其它服务应用APP,如邮件服务器应用或者VAS服务器应用,即,诸如移动电话应答机服务的增值业务应用。
管理器模块MM本身例如通过通信总线B连接到平台的其它操作支持系统OSS。
用作协调器的一主机代理MA或根据实施类型的多个主机代理MA(在图1中未公开)被提供在多层代理架构的根部,与管理器模块MM相关联。
每个代理A1、A2和A3包括处理引擎PE,并且负责使用处理引擎PE执行一些处理。
处理引擎是执行工作流和/或规则的软件模块。
处理引擎PE有利地嵌入每个代理内,因为处理引擎的外部位置将意味着具有可能导致性能恶化的远程调用。
优选地,每个代理的处理可以由具有相同层级或更高层级的其它代理外部地调用,并对应于每个代理提供给调用代理的服务。
用于任一层的处理引擎将是例如工作流和能够相应地管理工作流和规则的规则引擎的组合。例如,最好将规定处理表示为工作流,而最好将告警相关性表示为规则的组合。在可能的时候,使用工作流是优选的,因为它并不涉及处理规则冲突和规则管理的复杂性。
图1所示的多层架构允许在不同层级中的处理的分段。对于可以安排代理的层级数量不存在限制。这样,可以建立该架构,从而在具有最低的可能层数和允许在分布式与集中式组织之间的处理的自由分配之间的折衷。这一分段还使得能够提供不同的服务观点,从商业观点到系统观点。
在下文中,将工作流引擎视为优选的,但是也可以应用规则引擎。
运行代理(主代理和子层级代理)的每个主机优选地包括一个或多个控制代理CA。它们是负责对资源使用和本地代理(即在主机上运行的代理)的性能进行测量以及执行资源管理的本地优化的模块。控制代理CA耦合到管理器模块和其它控制代理,并将测量数据发送给管理器模块和/或其它控制代理。
管理器模块MM(其架构将随后描述)负责平台的管理、配置和控制。其被安排为用于分析来自人工操作员和外部OSS的输入数据,并确定如何调整平台配置以符合商业性能目标。其主要任务如下:
将来自处理数据(PDB)的处理描述和数据模型分发给代理;
利用控制代理提供的信息监视平台状态,该信息包括在主机上代理的分发、域管理(在代理之间的整个网络的划分)、性能监视;
由代理通过与相关控制代理的交互而执行动作以最佳地使用对于处理执行而分配的资源;这些动作的示例是修改在代理之间的负载平衡和工作流优先级的改变,即,重新调度在一个或多个代理内的排队作业;
与外部系统的交互,如其它操作支持系统。
主代理MA,其架构随后将要描述,负责处理执行的最高层级协调。实际上,顶层的代理负责的处理可能涉及子层代理负责的子处理。而且,存在特征在于提供需要与外部实体(除了代理之外)的交互或者代理之间的协调的功能,而所述与外部实体(除了代理之外)的交互或者代理之间的协调不能轻易地或有效地以分布式方式由低层代理执行。将由代理执行的处理是必需以分布式方式执行的那些处理。
每个代理(A1、A2、A3)可以支持任何网络和服务管理功能(即处理),如FCAPS(故障、配置、计费、性能、安全)功能。这使得能够基于任务优先级和资源需要来进行代理的运行时间任务定制和代理的功能重新分配,例如在日间将更多代理专用于服务提供而在夜间将更多代理专用于网络优化。
在代理中提供处理引擎PE使得能够监视由每个功能(即处理)执行对资源的使用以及功能调用的发生。这些数据是用于由管理器模块MM操作的自动平台控制的主要信息源。
每个代理(A1、A2、A3)表现出反应和前摄(proactive)行为,因事件而触发并且提高处理的自发启动。
优选地,代理模块可以由控制代理或管理器模块在处理机之间移动以便于更轻易的部署,例如实现容错。
图2表示根据本发明优选实施例的管理器模块MM的内部结构。
例如在子模块内组织集中式管理器模块MM。
子模块之一是MNG_CNS控制台,通常表示为管理控制台MNG_CNS;在优选实施例中,管理控制台MNG_CNS包括:
-具有保持平台性能数据的相关性能数据库PFM_DB的监视控制台MC;
-目标和约束控制台GC;
-重新分配器控制台RC;
-管理控制台AC,具有包括由管理控制台管理的管理数据的相关管理数据库ADB;和
-服务创建环境控制台SCC,
以致于
-容量规划模块(未表示);和
-预测控制台(未表示)。
目标控制台GC、管理控制台AC和服务创建控制台SCC全部耦合到处理描述数据库PDB。
管理器模块MM包括直接耦合到目标和约束控制台GC和重新分配器控制台RC的资源分配器RA。
资源分配器RA还例如耦合到管理数据库ADB以及保持平台性能数据的性能数据库PFM_DB。
在优选实施例中,管理器模块MM还包括监视数据获取模块MDM和平台控制器PC。
监视数据获取模块MDM被安排为用于将性能数据从平台控制器PC传送给性能数据库PFM_DB。
此外,例如,资源分配器可以耦合到外部接口模块I,用于监视在外部OSS和管理平台之间的交互。
平台控制器PC通常作为在管理器模块和代理之间的媒介而运行。
具体而言,平台控制器PC实现与管理器模块外部的主代理MA(未表示)的连接和与资源分配器模块RA的连接,并与监视控制台MC、监视数据获取模块MDM、管理控制台AC和管理数据库ADB相耦合,从而与处理描述数据库PDB相耦合。
目标和约束控制台GC旨在定义与存储在处理描述数据库PDB中的处理相关联的商业目标(如服务层级协议或SLA)和约束,统称为目标数据。
服务层级协议或SLA是(契约化或简单同意的)商业处理层级质量的量化。SLA基于性能指示符(平均执行时间、百分点或其它)并声明要在平台上保证的用于这些指示符的值。通常,可以通过专用语言(“语法”)描述SLA,所述专用语言标识SLA目标(性能指示符)和SLA罚则(基于在SLA目标和所收集的性能数据之间比较的SLA代价函数),例如违反SLA的经济处罚的估计。
可以将SLA关联到普通商业处理(如工作流)或者(可以一个或多个工作流属性标识的)其规范之一,其中用于规范的SLA通常重写根部商业处理,如果存在的话。
约束涉及资源使用相关数据。它们最好包括:
-在将要保证的最低吞吐量和可管理网络单元的最小数量方面表示的预分配资源(最好使用术语“吞吐量”替代使用百分比,以使用更容易理解的商业量度);
-可分配资源的最大数量(用代价或全局资源的百分比表示,例如缺省值可以是50%)。
如果修改商业约束,则需要检查以验证预分配资源是否超过最大可分配功率。
根据本发明的优选实施例,资源分配器RA(下文中的重新分配器)是集中式的,并管理将资源分配给代理,从而自适应地控制平台。其被安排为接收例如:
(i)来自目标控制台GC的商业目标;
(ii)监视每个主机的性能数据(如执行时间)和硬件资源使用,从性能数据库PFM_DB获取这些数据;
(iii)可选地,来自负载测试的信息,即,与对于较重的工作流使用的资源使用有关的测量;
(iv)关于可用主机及其硬件特征的数据(标准化的CPU速度,例如由标准性能评估公司使用SPECINT2000速度);这是监视整体处理能力(例如以参考CPU的每小时秒数测量的);
(v)每个主机的硬件资源使用(来自性能数据库PFM_DB)。
重新分配器RA优选地包括两个子模块:评估模块和确定模块,在下文中将提供其示例性描述和功能。
评估模块被安排为接收关于以下内容的数据:
-最高层级(MA)工作流执行请求;和
-在所有代理内的工作流执行请求队列。
而且,评估模块被安排为分析过去工作流执行请求的历史趋势和在单元和复杂性方面的所管理通信网络的趋势。
确定模块被安排为根据先前信息确定该平台是否能够根据随后将要描述的某些准则来处理所有请求。
如果该平台不能管理所有请求,则确定模块例如被安排为发送告警消息并确定哪一动作可以改善情况。具体而言,如果资源足够,但是不完全符合SLA,则确定模块被安排为在平台间重新分配处理(即工作流执行)。优选地,这些动作处理与工作流的不同实例相关的约束和优先级。
管理控制台AC旨在定义和监视例如至少一组下述内容:
i)该平台(即承载用于由所分发代理执行处理的处理能力的主机H)的硬件配置;例如,当将新主机添加到主机预先定义组时,将其自动地加入到整个平台,如因为主机通知其存在,或者可替代地,管理控制台通过接收由操作员例如通过其GUI输入的命令,来识别该主机H;
ii)用于定义软件分布/分配的GUI(即,在目标和约束控制台GC内接收约束相关数据的接口)。具体而言,该GUI例如用于根据下述内容来设置主机组:
-地理约束(例如仅可以在一个区域而不能在另一个区域内安装的代理上执行某些工作流,或者可以仅在特定主机上执行它们);
-分级约束(例如,在特定机器上仅可以运行秒级工作流);
-服务约束(即,对于特定处理类型的约束);
iii)工作流调度表(例如,仅在早晨时间内调度服务规定工作流)。
重新分配器控制台RC被安排为用于定义资源重新分配策略,即指示何时和如何重新分配资源,以根据商业约束和所监视的数据来优化商业目标满意度。重新分配器控制台允许输入同时用于集中式和分布式控制的策略。具体而言,它允许定义:
i)用于集中式控制的规则,定义何时和如何作用于工作流优先级,以达到SLA满意度的最佳可能层级;这些规则在所管理的平台上视为整体(即它们并不直接作用于机器),并基于所有的资源分配器模块输入数据和预测数据而工作;
ii)用于分布式控制的规则,借助于优化本地软件和硬件资源的目的而通过相关CA(线程平行和本地平衡)作用于单个代理;
iii)计算在规则内涉及的复杂表达式的函数。
监视控制台MC被安排来测览监视信息,如:
i)平均每小时吞吐量(如每日)、在队列内的请求数量(如每日)、平均执行时间(如每日)、已经设置了目标的每个商业交易的期限;
ii)在SLA指示符的协议值和测量值之间的差值和相关代价函数的评估方面,在抽样间隔时间上计算出的SLA(突出违反的多个)的情况;
iii)用于每个工作流的硬件资源使用,例如CPU使用和/或使用的RAM的秒数(对于单个层级或者对于低于其的每个层级)方面;当每个主机具有不同于其它主机的计算能力时,将硬件资源使用,例如CPU使用,标准化成参考CPU;
iv)计费信息:由每个工作流使用的资源(在全部资源中的百分数方面和代价方面)。
监视控制台MC能够以分级方式浏览工作流的性能和资源使用(具体而言,每块工作流)。对于每个SLA,可以发布关于由于资源的重度使用导致哪些工作流值得优化的报告。如果在不同层级的工作流上设置其它测量点,则这些测量点也可以呈现在MC上。此外,MC在由工作流使用的资源方面显示关于计费的信息。
服务创建环境控制台SCC被安排为用于定义、创建和修改在PDB内的处理,因而定义、创建和修改在管理平台内提供的每个商业功能。其基于图形接口以便于执行此任务。该控制台还允许在工作流上插入新的监视点。
在又一实施例中,通过给MM模块添加预测控制台和容量规划模块,还使用由MM模块管理的数据来实现有用的容量规划。
预测控制台被安排为设置使用预测,从而实现有用的容量规划活动。该控制台的输入是:
i)预期吞吐量;和
ii)网络主机的预期数量和类型(可将此图计算为数据在处理描述数据库内的投影)。
容量规划模块被安排为保证在时间上的硬件资源。它被安排为接收来自预测控制台和其它控制台(目标和约束控制台、管理控制台和重新分配器控制台)的输入并验证资源的可用性。如果资源不足够,则容量规划模块被安排为向控制台操作员警告对于满足预期增加趋势所需要的硬件量。该模块将其分析基于包括至少下述之一的一组参数:
i)预期吞吐量(在历史趋势方面);
ii)每个工作流(尤其是第一层级工作流)的资源使用信息;
iii)地理约束。
因为容量规划模块基于不确定的数据(尤其是长期数据),其被安排为主要用于信息目的。它可以强调未来需要,但是它优选地并不与资源分配器RA交互。
图3表示包括代理模块A和控制代理CA的主机的内部结构的示例,所述控制代理CA负责主机的整体性能和在主机上运行的所有代理的控制。
每个代理A包括至少一组下述组件:
-工作流队列或队列WFQ;它是多层级优先级队列,其中每个子队列保持具有相同优先级的请求。将发送给代理的每个工作流请求基于其优先级插入相应的子队列内。在图3中将不同的工作流表示为WF1、……、WFn。为了避免在子队列中工作流请求的资源缺乏,队列WFQ例如基于超时准则,为子队列内的请求执行优先级升级。与队列WFQ相关的,存在队列WFQ的相关信息,尤其是:
估计的CPU消耗时间,将对于每种类型工作流而测量的队列中的工作流的CPU消耗时间(这些数据从PFM_DB获得)相加而计算出的;和
请求输入速率,其统计地估计请求由另一个代理(请求在代理内排队)执行的特定类型工作流的速率(例如工作流/小时)。
-与工作流队列WFQ相关联的工作流调度器WFS:其被安排为用于根据其优先级来调度在队列内包含的工作流WFn。每次代理的一个或多个处理引擎准备执行工作流时,调度器将队列中较高优先级的工作流发送给等待处理引擎线程之一。
-由工作流调度器WFS控制的多个处理引擎线程TH1、……、THn;每个代理能够同时运行可配置数量的工作流。这通过在代理中配置多个处理引擎线程TH1、……、THn(独立执行器)来实现。每个处理引擎线程TH1、……、THn能够一次执行一个工作流,如,用java语言实现的线程。
控制代理CA包括至少一组下述组件,优选地以软件实现:
-资源监视器RM:该组件被安排为用于监视并收集在其控制下的代理中的硬件和软件资源使用的相关数据。其任务是测量在包括代理(代理主机)的主机上的当前资源使用和由于工作流执行而实现的CPU和存储器消耗。将测量值同时发送给管理器模块MM和线程控制器TC;
-线程控制器TC:其耦合到资源监视器RM和工作流队列WFQ,被安排为用于本地性能控制。其目标在于有效地管理代理线程的并行化。其被安排为作为输入接收在队列内等待执行的工作流数量、CPU使用和正在执行的机器PE线程的总数量。根据上述输入,线程控制器TC增加或减少处理引擎线程(PE线程)的数量,以实现最佳工作流执行并行化。例如,它创建新的PE线程,如果该队列包含等待被执行的工作流,如果PE线程的总量低于允许的最大数量,并且如果CPU使用低于规定的阈值。如果该代理负责与外部资源(例如设备、网络装置、等)的直接交互,但是PE线程的最大许可数量受可允许的同时外部资源的限制。而且,当线程控制器检测到某些PE线程在定义的时间周期内不被使用时,线程控制器运行PE线程的垃圾收集器。
-耦合到处理引擎线程的调度器:该组件被安排为用于将工作流执行请求发送给其它代理。每个PE线程使用调度器D发送这样一个请求。
调度器使用例如如下的负载平衡算法将请求发送给其它代理。它选择最佳代理在两个步骤中发送请求。
首先,它选择在CPU和存储器方面最低负载的主机。其次,它根据代理队列的估计CPU消耗时间的最小量来选择选定主机的可用代理。
另外,控制代理CA优选地具有根据优选实施例的重要特征。它们能够主动地管理其处理线程的并行化(本地优化)。将队列重新排序和并行化管理的这两个能力联合在一起是根据本发明一个方面的自适应机制的基础。
根据本发明的替代实施例,如图4所示,可以将资源监视器RM、线程控制器TC和调度器D附加到代理模块,例如如果在主机H上存在单个代理模块A。
使用用于实施具有移动性特征的代理的JADE(Java代理开发框架)、用于处理定义的XPDL(XML处理定义语言)和例如Shark的XPDL工作流引擎,来实施本发明系统的优选实施例。
在下文中,提供资源分配器模块的更详细的描述,目的在于说明其操作。
可以将重新分配器RA实施为带有约束处理、数据处理和配置改变功能的基于专家规则的系统。来自所管理网络的所有数据、约束和规则,外部系统,人类知识和内部分析构成其知识基础,这本质上可以用相关知识数据库表示。
重新分配器模块RA以预定的分析间隔上执行评估和确定模块,所述预定的分析间隔可以根据场景情况而逐情况地设置。
首先,重新分配器通过总线B获取来自外部系统的处理请求相关数据,从而评估对于随后的时间间隔而预测的服务/功能请求的数量,并将此信息保存在相关知识数据库内。
随后,确定模块启动资源重新分配规则,从而发现将要执行的动作以通过最佳方式实现预定的商业目的。
详细地说,在每个间隔T上,资源分配器模块基于历史基础考虑排队请求的数量和预测请求的数量。它执行可用硬件资源(主要是CPU和RAM)量的第一次评估。可以使用在间隔结束时的实际测量数据,考虑随后将要描述的“背景错误校正”,来调整这些数据。
以统计方式收集下述数据:
-在每个层级上每个工作流的CPU需求;和
-在子工作流请求方面的最高层级工作流组成(以及与架构的每个层级相关联的CPU需求;此信息还必需考虑地理约束,如果存在的话)。
使所收集的信息与在时间t时队列的长度和组成关联,并与在间隔[t,t+T]期间(通过预测)预期的请求数量关联,以计算对于随后间隔的CPU功率的总请求,将作为包括位于多个间隔之后的一随后间隔或一组间隔的集合。
随后,将CPU总量,即对于新间隔的所请求计算功率(考虑层级和地理约束),与可用的CPU功率进行比较。如果不够,则生成对于控制台的告警(请求新硬件),工作流的优先级将确定如何处理负载。
如果考虑“背景错误校正”以调整可用硬件资源的相关数据,则在每个间隔上,对于每个工作流和每个主机,比较在先前间隔期间使用的CPU量与由不同工作流使用的CPU量。在随后的间隔期间,使用这个数值来“校正”CPU的实际可用性。
根据本发明的方法和系统使用基于优先级的策略,由此存在不同层级的优先级。在每个间隔T上,确定模块根据管理算法可以使用优先级队列来实现商业目的。为了避免资源缺乏,如果工作流请求在低优先级队列中花费过多时间,则自动地更新其优先级,以便将该请求移动到更高优先级的队列。
根据本发明优选实施例的管理算法基于用于改进在每个步骤中的资源配置和用于努力利用递增行为达到最佳配置的自适应解决方案。通过使用分析间隔来保证本方法的结果,所述分析间隔是平均工作流执行时间的至少两倍或三倍(合理间隔将取决于应用场景,并可以从5分钟改变成1小时或更长)。
考虑到以下因素,优先级与工作流的每次执行相关联:
-同意的SLA的情况(风险越大的工作流将保持越高的加权);
-在用于工作流的目标控制台内定义的初始优先级,以致于每个SLA的优先级和经济暗示;
-用于工作流的最小预先分配资源的数量;和
-(在SLA初始协商过程中定义的)最大可分配资源的数量。
这意味着优先级是取决于时间的。如果工作流性能的实例正在接近SLA(即其性能在降低),则将其优先级设置得越高。
代替处理引擎,可以使用用于定义和测量功能执行的任何装置,例如利用统计技术的CPU估计。
在下文中,示出基于推荐架构的性能自适应情况的示例。将要优化的资源是CPU负载。
根据该情况,最高层级工作流是与特征在于优先级属性的SLA相关联的服务,所述优先级属性以在时间t>>ΔT内将要完成的工作流百分比来表示,其中ΔT是观察时间间隔。需要最后一个假定从而给予平台足够的时间来在周期t内重新校准。
最高层级工作流是许多子工作流的组成。所有工作流具有影响在执行之前的其队列等待时间和工作流CPU时间片的优先级属性。
输入数据是:
-用于每个工作流和每个主机的CPU负载[秒];
-约束,即相同工作流仅可以对于一个主机子集运行;
-在子工作流方面的第一层级工作流组成;
-在过去的ΔT时间段内抵达的工作流数量;和
-在过去的ΔT时间段内的工作流执行数量。
目标是:
-预测计算资源是否足以执行在下一ΔT间隔内的所有工作流执行;
-预测计算资源是否足以符合SLA;和
-工作流执行优先级的自适应,从而实现SLA兼容。
性能自适应处理基于每个ΔT时间间隔执行的监视,所述ΔT时间间隔表示最小平台自适应时间。
参考图5的流程图,其报告每ΔT时间间隔执行的监视的示例,对于每个ΔT,由资源分配器RA管理下述步骤:
1)评估在每个主机上每个工作流的CPU负载(步骤100)。这应当通过在样机主机上执行负载测试工作流和使用CPU文件编制(documentation)(先验预测)来实现。考虑对于工作流执行的约束,使用与在前一ΔT内执行的每个工作流相关联的实际CPU时间,可以精确地调整所获得的值;
2)预测用于执行在队列内仍然等待的工作流以及根据预测将在下一个ΔT内到达的工作流所需要的CPU时间(步骤120);
3)比较(步骤140)在步骤120中估计的CPU时间与可用CPU时间,以识别在计算资源方面临界的主机群,并据此识别与受影响的SLA相关联的第一工作流;在所需要的CPU资源大于可用CPU资源的情况下,通知低CPU资源(步骤150)。
4)对于每个SLA,预测(步骤160)执行最低数量工作流以符合SLA需求所需要的CPU时间,随后比较(步骤170)其与可用CPU时间以确定计算资源是否足以符合SLA;
5)如果前一步骤说明在运行工作流内的当前平台优先级配置不能承载SLA约束,则必需利用工作流优先级的重新平衡(考虑在计算资源方面的工作流加权),通过工作流优先级自适应方法调整该配置(步骤180);
6)当不需要优先级自适应,或者已经执行了优先级自适应时,该系统结束性能自适应处理并等待下一个ΔT监视间隔。
在下文中详细描述性能自适应处理的预测方法的示例。进行下述定义:
-ΔT:监视间隔和最小系统自适应时间;
-Lwf(n):在主机n上用于工作流wf执行的CPU负载[秒]。可以先验(或者使用自学习方法)估计这些值,随后在平台操作过程中对这些值进行调整。例如,利用随时间变化的移动平均值。
-Vwf(n):由下式给出对主机n上的工作流wf的约束:
对于执行在下一个ΔT内预测的所有工作流所需的CPU时间的预测被如下计算:
其中:
g是用于集合WF(g)中所有工作流的等价主机组。这意味着可以在主机组g之一中利用相同的概率执行属于集合WF(g)的每个工作流。
Lwf是在主机组g上执行工作流wf所需的CPU时间的预测,由下式给出:
NEPwf是对于工作流wf的预见执行的数量,由下式给出:
NEPwf(g)=NQwf+NAPwf(g)
其中:
NQwf是应当通过下式以第一层级工作流调用表示的在执行队列中工作流wf的总数:
NAPwf(g)是在后一ΔT时间间隔内预见的工作流wf的总数的预测,由下式给出:
其中:
Pi是在前一ΔTi内抵达的工作流的权重;
NAwf(11),i(n)是在ΔTi时间间隔内在主机n上到达的工作流wf的数量,这些工作流是第一层级工作流wfl1的子工作流。
参考上述三个目标,如下执行预测和自适应步骤。
为了预测可用的CPU时间是否足以执行在后一ΔT内的预测工作流,对每一组g执行在CPU时间CpuTimeP(g)和在组g上可用的CPU时间之间的比较:
如果:
系统已经获得足够的计算资源来执行所有任务,
如果:
该系统需要更多的CPU时间,所以它发送带有下述内容的消息:
a)在计算资源方面临界的主机组g;和
b)与可能受该资源缺少影响更大的SLA相关联的第一层级工作流。
为了预测计算资源是否足以符合SLA,对于在第一层级工作流wfl1上定义的每个SLA,在随后ΔT内将要执行从而符合SLA的wfl1的数量NSLAwfl1被如下计算:
如果将SLA定义为在时间t(t>>ΔT)内将要执行的工作流wfl1的百分比p[%],则由下式给出NSLAwfl1:
NSLAwfl1=p·(NSLAQwfl1+NSLAPwfl1)
其中:
NSLAQwfl1是由对于每个ΔTi的在该ΔTi内到达的队列中仍然等待的工作流wfl1数量与仍然可用的ΔT数量n=(t-kΔT)/ΔT的比值之和给出的,从而按时完成这些工作流以符合SLA;k是从工作流到达起在队列内进行等待的ΔT的数量;和
NSLAPwfl1是在下一ΔT内到达的工作流wfl1数量的预测与仍然可用的ΔT数量之间的比值,从而完成这些工作流以符合SLA(即t/ΔT)。
因此,由下式给出对于使工作流wfl1符合SLA所需要的CPU时间:
其中:
NEPSLAwfl1 wf(g)=NQSLAwfl1 wf+NAPSLAwfl1 wf(g)
其中:
并且
其中:
NEwf(wfl1)(g)是对于工作流wfl1的每次执行而言将在主机组g上执行的工作流wf数量的预测,由下式给出:
再次,如果:
系统已经获得足够的计算资源以对于工作流wfl1符合SLA
如果:
则该系统对于工作流wfl1不能符合SLA,那么采用随后描述的工作流优先级自适应方法。
当存在与SLA相关联的至少类型A第一层级工作流时,采用工作流优先级自适应方法,对于其:
而对于另一类型B第一层级工作流:
ΔCpuTimePSLAwfl1(g)<0
该方法包括各种动作,下面以复杂性为序来描述它的至少一些示例:
a)增加类型A工作流的优先级;
b)降低类型B工作流的优先级;
c)将权重与每个第一层级工作流关联以选择最相关的工作流,从而执行动作a)或b);
d)降低在前一ΔT内已经不能符合SLA的工作流的优先级,对于这些LSA,其罚则并不随着时间增加;
e)增加在前一ΔT内已经不能符合SLA的工作流的优先级,对于这些SLA,其罚则随着时间而增加。
动作d)和e)基于通过目标和约束控制台GC定义的试图最小化SLA处罚的代价影响的函数。
有利地,该方法考虑在资源使用上的约束,例如将为每个工作流分配的CPU时间的最大量。这意味着不能增加已经使用预约CPU时间的最大量的工作流的优先级。
如果每个工作流的确切代价的收集过于繁重,则另选的可能是代理以预定的间隔(例如每五分钟)收集所执行“建立块”的数量,并执行与系统资源使用的相关(例如CPU使用)。
通常采用多元回归技术来估计在过载情况下计算机系统的性能。这一选项依赖于分析在其容量之上使用的多个字段内(in-field)OSS的行为。结果是用于OSS的大部分常规性能量度,如CPU使用,可以通过线性回归来模拟。系统响应时间例如根据适中指数法则增长。因而,通过基于系统资源数据和工作流执行数据的多元线性回归技术,可以获得用于预测系统性能的下限。
简单多项式模型的示例如下:
Ucpu=a0+a1·NA+a2·NB+a3·NC
其中:
Ucpu=该代理的CPU使用;
NA=建立块A的执行数量;
NB=建立块B的执行数量;
NC=建立块C的执行数量;
有利地,应当将所有的测量值(具体而言,SLA定义)转换成经济量值,从而以一致的方式优化自适应。
图6通过示例表示根据本发明的三层服务规定场景的建立,特征在于灵活性和可升级性。
在该示例中,底层代理负责与网络单元交互,并被称作资源代理服务器并表示为RP1、RP2、RP3。
称作“供应1”的宽带服务应当在电信网络中递送,所述电信网络包括接入设备(例如ADSL装置)、ATM骨干和BAS(宽带接入服务器),从而获得IP连接。
由RP供应的服务例如有端口配置、交叉连接创建、连接属性修改。它们中的每个都可以包括将要发送给这些装置和/或将由这些装置接收的基本命令序列。
AA1、AA2和AA3是分别用于对代表ADSL装置E(端到端电路的端点A)的图像的资源代理服务器RP1、对代表连接到ADSL装置E的ATM交换机SW的图像的资源代理服务器RP2和对代表BAS(端到端电路的端点Z)的图像的资源代理服务器RP3进行管理的代理。
在图7内示出在服务“供应1”的规定活动中涉及的多层工作流。
层级1或最高层级工作流包括两个步骤或任务,并且由主机代理MA执行。第一个步骤或任务(ADSL连接)请求在代理层级(AA1、AA2、AA3)上执行的层级2工作流的执行,而第二个步骤或任务,即邮箱任务(在该示例中未详细表示)可以由外部平台执行。
因而,ADSL连接任务是层级2工作流,它包括在资源代理服务器层级(RP1、RP2、RP3)上执行的与技术和供应商相关的一系列层级3工作流。层级3工作流包括必需由资源代理服务器在通信网络装置上执行的命令序列。通过扩展层级2工作流“创建ADSL端口供应商A”,在图7中给出层级3工作流的示例。
监视控制台MC通过测量每个工作流的资源使用(CPU、RAM)和经过的时间,来突出在特定供应商或特定工作流上是否存在问题。
假设存在类似于服务“供应1”但是没有邮箱的另一个服务“供应2”,则目标控制台允许利用SLA控制规则和相关代价函数来定义供应1和供应2上的SLA。如果在服务“供应2”上的SLA更重要(例如与“供应2”相关联的代价函数等于超过1秒的平均执行时间的秒数,与“供应1”相关的代价函数等于超过4秒的平均执行时间的秒数),则“供应2”上的优先级增长快于“供应1”的优先级。这意味着当硬件资源(如CPU)缺乏时,对于相同数量的请求,“供应2”的吞吐量将高于“供应1”的吞吐量。
因此,该平台调整资源使用以达到其目标,该目标为外部操作员设置的要求或者由于代理饱和。
因而,显然,在本发明原理保持相同时,由此在不脱离权利要求书定义的本发明的保护范围的情况下,实施例的形式可以相对于通过非限制性的示例描述和例示的实施例而变化很大。
Claims (29)
1.一种用于管理用于电信服务和/或网络的资源的方法,所述方法包括运行分布式代理(A1、A2、A3),所述分布式代理包括用于执行管理处理的处理引擎(PE),
该方法的特征在于:
-设置要满足的目标数据,其中所述目标数据包括关于分布式代理的处理执行的目标和关于资源使用的约束;
-通过所述分布式代理中所包括的所述处理引擎,监视分布式代理(A1、A2、A3)的处理执行和资源使用,
-收集代表所述处理执行和所述资源使用的性能数据;
-比较所收集的性能数据和所设置的目标数据;
-基于所述代理的所收集的性能数据和所设置的目标数据之间的比较,建立至少一个罚则;和
-基于所建立的所述至少一个罚则,将资源重新分配给所述代理(A1、A2、A3)以用于所述代理(A1、A2、A3)的处理执行。
2.根据权利要求1的方法,其中重新分配资源的步骤包括修改在分布式代理(A1、A2、A3)处的处理优先级。
3.根据权利要求1的方法,其中重新分配资源的步骤包括:
-以所确定的观察间隔执行评估步骤和确定步骤,其中:
-评估步骤包括:
-对于至少一个随后观察间隔,收集代表处理执行和所预测处理执行的数量的数据;和
-基于所收集的数据,评估所述代理所需要的资源;并且
-确定步骤包括:
-比较所需要的资源与每个所述代理(A1、A2、A3)可用的资源;和
-将所确定的资源重新分配规则应用于所述代理(A1、A2、A3),从而修改代理(A1、A2、A3)之间的资源使用和/或改变在代理(A1、A2、A3)处的处理优先级和/或重新分配在代理(A1、A2、A3)之间的处理执行。
4.根据前述权利要求中任一项的方法,特征在于:
在与所述处理引擎(PE)相关联的处理描述数据库(PDB)中存储表示处理的处理描述。
5.根据权利要求4的方法,其中处理描述包括工作流和/或规则。
6.根据权利要求1-3中任一项的方法,包括:
-按照代理(A1、A2、A3)的多层配置,提供在分层层级上的代理(A1、A2、A3)。
7.根据权利要求6的方法,其中由集中式管理器模块(MM)将处理执行分配给代理(A1、A2、A3)的多层配置。
8.根据权利要求7的方法,其中
-收集性能数据的步骤包括:
-将所述性能数据发送给集中式管理器模块(MM)和/或发送给与代理(A1、A2、A3)相关联的多个本地性能控制代理(CA)。
9.根据权利要求7的方法,包括:
-在代理(A1、A2、A3)的所述多层配置的顶层处提供至少一个主代理(MA),该主代理(MA)使位于所述多层配置的子层中的代理(A1、A2、A3)负责处理执行。
10.根据权利要求1-3中任一项的方法,包括对于每个代理(A1、A2、A3)的以下步骤:
-按照优先级准则将处理执行请求插入多层级优先级处理队列(WFQ);
-基于多层级优先级处理队列(WFQ),调度处理执行。
11.根据权利要求10的方法,包括由与每个代理相关联的至少一个处理引擎线程(TH1、......、THn)对处理执行进行调度。
12.根据权利要求10的方法,其中基于超时准则升级在多层级优先级处理队列(WFQ)中的处理执行请求。
13.根据权利要求8的方法,包括由与每个代理相关联的至少一个处理引擎线程(TH1、......、THn)对处理执行进行调度,其中,每个控制代理(CA)控制处理引擎线程(TH1、......、THn)的数量和代理的资源使用。
14.根据权利要求8的方法,其中:
-控制代理(CA)执行用于确定代理负载的负载平衡算法;和
-每个代理(A1、A2、A3)基于至少包括由控制代理(CA)确定的代理的负载评估的准则,将处理执行请求发送给其它代理(A1、A2、A3)。
15.一种用于管理用于电信服务和/或网络的资源的平台,包括:
-包括处理引擎(PE)的多个分布式代理(A1、A2、A3),所述处理引擎(PE)能够执行管理处理(WF1、......、WFn),其中所述分布式代理中所包括的所述处理引擎(PE)被配置成用于监视分布式代理(A1、A2、A3)的处理执行和资源使用,和
-集中式管理器模块(MM),被配置成用于:
-设置要由平台满足的目标数据,其中所述目标数据包括关于分布式代理的处理执行(WF1、......、WFn)的目标和关于要由平台满足的平台资源使用的约束;
-收集代表分布式代理(A1、A2、A3)的所述处理执行和所述资源使用的性能数据;
-比较所收集的性能数据与所设置的目标数据;
-基于在所述代理的所收集的性能数据与所设置的目标数据之间的比较,建立至少一个罚则;和
-基于所建立的所述至少一个罚则,将资源重新分配给所述代理(A1、A2、A3)以用于代理(A1、A2、A3)的处理执行。
16.根据权利要求15的平台,其特征在于所述集中式管理器模块(MM)包括资源分配器模块(RA),所述资源分配器模块(RA)包括:
-评估模块,被配置为用于:
-对于随后观察间隔,收集代表处理执行和预测处理执行的数量的数据;和
-基于所述收集的数据,评估所述代理所需要的资源;和
-确定模块,被配置为用于:
-比较所需要的资源与每个所述代理(A1、A2、A3)可用的资源;和
-将所确定的资源重新分配规则应用于所述代理(A1、A2、A3),从而修改代理(A1、A2、A3)之间的资源使用和/或改变在代理(A1、A2、A3)处的处理优先级和/或重新分配在代理(A1、A2、A3)之间的处理执行。
17.根据权利要求15或16的平台,其特征在于所述集中式管理器模块(MM)包括:
-处理描述数据库(PDB),用于存储代表平台的行为和功能方面的处理描述。
18.根据权利要求17的平台,其特征在于所述集中式管理器模块(MM)还包括:
-服务创建控制台(SCC),被安排为用于对处理描述数据库(PDB)中的处理描述进行定义、创建和修改。
19.根据权利要求17的平台,其特征在于处理描述包括工作流和/或规则。
20.根据权利要求15或16的平台,其特征在于:
-按照多层配置在分层层级上组织所述多个分布式代理(A1、A2、A3),并且其特征在于
-所述集中式管理器模块(MM)被配置为用于将处理执行分配给代理的所述多层配置。
21.根据权利要求15或16的平台,其特征在于:
-与至少一组分布式代理(A1、A2、A3)相关联的本地性能控制代理(CA),并且其特征在于
-所述处理引擎(PE)包括资源监视器模块(RM),该资源监视器模块(RM)被配置为用于:
-将所述性能数据发送给集中式管理器模块(MM)和/或与代理(A1、A2、A3)相关联的本地性能控制代理(CA)。
22.根据权利要求20的平台,其特征在于:
-至少一个主代理(MA),位于代理(A1、A2、A3)的所述多层配置的顶层处,并且被配置为用于使位于所述多层配置的子层中的代理(A1、A2、A3)负责处理执行。
23.根据权利要求15或16的平台,其特征在于:
-至少一个处理机器(H),其包括至少一组所述多个分布式代理(A1、A2、A3)。
24.根据权利要求23的平台,其特征在于:
至少一个本地性能控制代理(CA)与所述至少一个处理机器(H)相关联。
25.根据权利要求24的平台,特征在于所述至少一个本地性能控制代理(CA)包括:
-常规本地性能监视模块(RM),被安排为用于收集代表由代理(A1、A2、A3)进行的资源使用和处理执行的性能数据,并将性能数据发送给集中式管理器模块(MM);
-常规线程控制器(TC),耦合到所述常规本地性能监视模块(RM),被安排为用于创建用于执行正在等待的处理(WF1、......、WFn)的处理引擎线程(TH1、......、THn);和
-常规调度器模块(D),耦合到处理引擎线程(TH1、......、THn),并被安排为用于根据预定的负载平衡算法将处理执行请求发送给其它代理(A1、A2、A3)。
26.根据权利要求15的平台,其特征在于管理器模块(MM)包括:
-容量规划模块,被配置为用于:
-基于历史性能和代表当前资源使用的数据,在观察间隔内预测资源的可用性。
27.根据权利要求15的平台,其特征在于管理器模块(MM)包括:
-管理控制台(AC),被配置为用于:
-定义平台的硬件配置;和
-定义关于处理执行的约束。
28.一种电信网络,其包括根据权利要求15或16的平台。
29.一种用于建立并管理电信服务的方法,包括根据权利要求1至3中的任一项定义的方法的管理资源的步骤。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2004/012224 WO2006045337A1 (en) | 2004-10-28 | 2004-10-28 | Method for managing resources in a platform for telecommunication service and/or network management, corresponding platform and computer program product therefor |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101084680A CN101084680A (zh) | 2007-12-05 |
CN101084680B true CN101084680B (zh) | 2012-03-14 |
Family
ID=34959408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2004800446483A Active CN101084680B (zh) | 2004-10-28 | 2004-10-28 | 在电信服务和/或网络管理平台中管理资源的方法、相应平台及其计算机程序产品 |
Country Status (11)
Country | Link |
---|---|
US (1) | US8264971B2 (zh) |
EP (1) | EP1806002B1 (zh) |
JP (1) | JP2008519322A (zh) |
KR (1) | KR101096000B1 (zh) |
CN (1) | CN101084680B (zh) |
AT (1) | ATE479287T1 (zh) |
BR (1) | BRPI0419152B1 (zh) |
DE (1) | DE602004028877D1 (zh) |
ES (1) | ES2351604T3 (zh) |
IL (1) | IL182824A (zh) |
WO (1) | WO2006045337A1 (zh) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080034090A1 (en) * | 2005-09-29 | 2008-02-07 | Nortel Networks Limited | Tender-Bid Method and Architecture For Intelligent Network Resource Deployment |
US8924467B2 (en) * | 2005-12-28 | 2014-12-30 | International Business Machines Corporation | Load distribution in client server system |
GB0610532D0 (en) * | 2006-05-26 | 2006-07-05 | Abilisoft Ltd | Monitoring of network management systems |
JP4240062B2 (ja) * | 2006-05-31 | 2009-03-18 | 日本電気株式会社 | 計算機システムおよび性能計測方法ならびに管理サーバ装置 |
EP1916621A1 (en) * | 2006-10-26 | 2008-04-30 | Hewlett-Packard Development Company, L.P. | Adapting computer networks |
US8160594B2 (en) * | 2006-12-28 | 2012-04-17 | Hitachi, Ltd. | Radio propagation estimating method and radio propagation estimating apparatus |
US20080270653A1 (en) * | 2007-04-26 | 2008-10-30 | Balle Susanne M | Intelligent resource management in multiprocessor computer systems |
JP2008282185A (ja) * | 2007-05-10 | 2008-11-20 | Hitachi Ltd | 物理条件が作業に影響する場合を支援するワークフローシステムおよび、それを用いた輸送方法および保守方法 |
US20090006170A1 (en) * | 2007-06-26 | 2009-01-01 | Wachovia Corporation | Production center system |
DE602007003594D1 (de) | 2007-08-29 | 2010-01-14 | Alcatel Lucent | Verfahren zur Zuweisung von Ressourcen zur Ausführung eines Verwaltungsvorgangs in einem Telekommunikationsnetz |
KR101132592B1 (ko) * | 2007-09-14 | 2012-04-06 | 엔이씨 유럽 리미티드 | 네트워크 성능을 최적화하는 방법 및 시스템 |
US8805647B2 (en) * | 2007-12-20 | 2014-08-12 | Netapp, Inc. | Evaluating and predicting computer system performance using kneepoint analysis |
US9977721B2 (en) | 2007-12-20 | 2018-05-22 | Netapp, Inc. | Evaluating and predicting computer system performance using kneepoint analysis |
WO2009096519A1 (ja) * | 2008-01-31 | 2009-08-06 | Nec Corporation | フィードフォーワード制御方法、サービス提供品質制御装置、システム、プログラム及びその記録媒体 |
US8112366B2 (en) | 2008-09-30 | 2012-02-07 | Microsoft Corporation | Expert system and visualization for multi-server capacity management |
US8656404B2 (en) * | 2008-10-16 | 2014-02-18 | Palo Alto Research Center Incorporated | Statistical packing of resource requirements in data centers |
US10185646B2 (en) * | 2008-12-16 | 2019-01-22 | Red Hat, Inc. | Getting performance saturation point of an event driven system |
JP2012517041A (ja) * | 2009-02-05 | 2012-07-26 | 日本電気株式会社 | 遺伝的アプローチによる期限付きタスクの受付制御・スケジューリング方法、システムおよびプログラム |
JP5609868B2 (ja) * | 2009-05-15 | 2014-10-22 | 日本電気株式会社 | ワークフロー監視制御システム、監視制御方法および監視制御プログラム |
CN101931609B (zh) * | 2009-06-22 | 2014-07-30 | Sap股份公司 | 多租户数据库应用的遵守服务等级协议的布局 |
US10185594B2 (en) * | 2009-10-29 | 2019-01-22 | International Business Machines Corporation | System and method for resource identification |
US8260958B2 (en) * | 2010-02-24 | 2012-09-04 | F5 Networks, Inc. | Reducing energy consumption of servers |
US8255529B2 (en) * | 2010-02-26 | 2012-08-28 | Red Hat, Inc. | Methods and systems for providing deployment architectures in cloud computing environments |
JP5471859B2 (ja) * | 2010-06-10 | 2014-04-16 | 富士通株式会社 | 解析プログラム、解析方法、および解析装置 |
JP5414663B2 (ja) * | 2010-12-24 | 2014-02-12 | 株式会社東芝 | サービス提供システム、装置及びプログラム |
US20120278513A1 (en) * | 2011-02-01 | 2012-11-01 | Michel Prevost | Priority scheduling for multi-channel context aware communication technology |
JP5569424B2 (ja) * | 2011-02-14 | 2014-08-13 | 富士通株式会社 | 更新装置、更新方法、および更新プログラム |
US8630959B2 (en) | 2011-02-23 | 2014-01-14 | International Business Machines Corporation | Determining costs for workflows |
US20120215582A1 (en) * | 2011-02-23 | 2012-08-23 | International Business Machines Corporation | Executing workflows based on service level agreements |
EP2665234B1 (en) * | 2011-06-15 | 2017-04-26 | Huawei Technologies Co., Ltd. | Method and device for scheduling service processing resource |
US8539074B2 (en) | 2011-07-19 | 2013-09-17 | International Business Machines Corporation | Prioritizing data packets associated with applications running in a networked computing environment |
CN102915254B (zh) * | 2011-08-02 | 2018-04-06 | 中兴通讯股份有限公司 | 任务管理方法及装置 |
US8660949B2 (en) | 2011-09-09 | 2014-02-25 | Sap Ag | Method and system for working capital management |
US8769089B2 (en) * | 2011-11-15 | 2014-07-01 | International Business Machines Corporation | Distributed application using diagnostic heartbeating |
US8874974B2 (en) | 2011-11-15 | 2014-10-28 | International Business Machines Corporation | Synchronizing a distributed communication system using diagnostic heartbeating |
US9244796B2 (en) | 2011-11-15 | 2016-01-26 | International Business Machines Corporation | Diagnostic heartbeat throttling |
US8756453B2 (en) | 2011-11-15 | 2014-06-17 | International Business Machines Corporation | Communication system with diagnostic capabilities |
US8903893B2 (en) | 2011-11-15 | 2014-12-02 | International Business Machines Corporation | Diagnostic heartbeating in a distributed data processing environment |
CN103491115A (zh) * | 2012-06-12 | 2014-01-01 | 华为软件技术有限公司 | 资源调度方法、装置及系统 |
US10032136B1 (en) * | 2012-07-30 | 2018-07-24 | Verint Americas Inc. | System and method of scheduling work within a workflow with defined process goals |
GB2507338A (en) | 2012-10-26 | 2014-04-30 | Ibm | Determining system topology graph changes in a distributed computing system |
US9154398B1 (en) * | 2013-03-01 | 2015-10-06 | Emc Corporation | Method and system for identifying root causes of application underachievement in a virtually provisioned environment |
CN103718633B (zh) * | 2013-08-30 | 2017-11-17 | 华为技术有限公司 | 资源分配方法、装置及系统 |
CN104639353A (zh) * | 2013-11-12 | 2015-05-20 | 中兴通讯股份有限公司 | 用于电信网管系统的性能数据采集方法及服务器 |
US9998332B2 (en) | 2013-11-15 | 2018-06-12 | Massachusetts Institute Of Technology | Signal-flow architecture for cooperative control and resource allocation |
CN105873070B (zh) * | 2015-01-20 | 2020-04-10 | 中兴通讯股份有限公司 | 一种授权共享接入系统干扰自适应发现方法与装置 |
JP6425561B2 (ja) * | 2015-01-23 | 2018-11-21 | Kddi株式会社 | 分散型ネットワーク管理システム、ネットワーク管理装置、ネットワーク装置、分散型ネットワーク管理方法およびプログラム |
CN104573993A (zh) * | 2015-01-29 | 2015-04-29 | 北京京东尚科信息技术有限公司 | 多流程执行方法和系统 |
EP3118784A1 (en) | 2015-07-14 | 2017-01-18 | Tata Consultancy Services Limited | Method and system for enabling dynamic capacity planning |
US10332018B2 (en) | 2016-03-01 | 2019-06-25 | International Business Machines Corporation | Service level agreement risk analysis with exogenous architecture |
CN105824703B (zh) * | 2016-03-30 | 2019-03-29 | 联想(北京)有限公司 | 一种线程管理方法和线程管理器 |
US10374872B2 (en) * | 2016-05-24 | 2019-08-06 | Apstra, Inc. | Configuring system resources for different reference architectures |
US11126471B2 (en) * | 2016-06-24 | 2021-09-21 | Schneider Electric Systems Usa, Inc. | Methods, systems and apparatus to dynamically facilitate boundaryless, high availability M:N working configuration system management |
US10698954B2 (en) * | 2016-06-30 | 2020-06-30 | Facebook, Inc. | Computation platform agnostic data classification workflows |
JP6717092B2 (ja) | 2016-07-14 | 2020-07-01 | 富士通株式会社 | 制御装置および制御装置における処理方法 |
CA2973249C (en) * | 2016-07-15 | 2023-01-17 | Intraway R&D S.A. | System and method for providing fraud control |
US10545951B1 (en) * | 2016-12-15 | 2020-01-28 | Amazon Technologies, Inc. | Workflow dependency management system |
US11356315B2 (en) | 2018-03-28 | 2022-06-07 | Intel Corporation | Methods and apparatus to dynamically control devices based on distributed data |
US10572316B2 (en) | 2018-05-14 | 2020-02-25 | International Business Machines Corporation | Adaptable pages, widgets and features based on real time application performance |
US10990441B2 (en) * | 2018-07-31 | 2021-04-27 | Nutanix, Inc. | Multi-level job processing queues |
JP7410379B2 (ja) * | 2019-11-27 | 2024-01-10 | 富士通株式会社 | 資源使用量予測方法および資源使用量予測プログラム |
US11824784B2 (en) | 2019-12-20 | 2023-11-21 | Intel Corporation | Automated platform resource management in edge computing environments |
WO2021164857A1 (en) * | 2020-02-18 | 2021-08-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Dynamic resource dimensioning for service assurance |
JP2022021026A (ja) * | 2020-07-21 | 2022-02-02 | キオクシア株式会社 | メモリシステムおよびコマンドをフェッチする方法 |
KR102427473B1 (ko) * | 2020-09-29 | 2022-08-01 | 한국전자기술연구원 | 마이크로 데이터센터내 가용 자원상태 기반 워크로드 예측 정확도 증가 방법 |
WO2022109351A1 (en) * | 2020-11-20 | 2022-05-27 | Okta, Inc. | Server-based workflow management using priorities |
US20220318067A1 (en) * | 2021-04-06 | 2022-10-06 | Intuit Inc. | Orchestration layer for user defined automation workflows |
WO2024005681A1 (en) * | 2022-07-01 | 2024-01-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and system for system optimization using service allocation weighting factors |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1307770A (zh) * | 1998-06-25 | 2001-08-08 | 艾利森电话股份有限公司 | 业务提供者在电信系统内对运行和维护信息的接入 |
CN1320312A (zh) * | 1998-09-25 | 2001-10-31 | 索马网络公司 | 电信资源协商的方法和系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6752996A (en) * | 1995-08-15 | 1997-03-12 | Broadcom Eireann Research Limited | A communications network management system |
WO2001002973A1 (en) | 1999-07-02 | 2001-01-11 | Covad Communications Group, Inc. | Process fulfillment systems and methods using distributed workflow management architecture |
US6516337B1 (en) * | 1999-10-14 | 2003-02-04 | Arcessa, Inc. | Sending to a central indexing site meta data or signatures from objects on a computer network |
JP3664021B2 (ja) * | 2000-01-05 | 2005-06-22 | 日本電気株式会社 | サービスレベルによる資源割当方式 |
US7181743B2 (en) * | 2000-05-25 | 2007-02-20 | The United States Of America As Represented By The Secretary Of The Navy | Resource allocation decision function for resource management architecture and corresponding programs therefor |
US6823382B2 (en) | 2001-08-20 | 2004-11-23 | Altaworks Corporation | Monitoring and control engine for multi-tiered service-level management of distributed web-application servers |
JP3772713B2 (ja) * | 2001-09-12 | 2006-05-10 | 日本電気株式会社 | プライオリティ動的制御方式、プライオリティ動的制御方法およびプライオリティ動的制御用プログラム |
US7322034B2 (en) | 2002-06-14 | 2008-01-22 | Hewlett-Packard Development Company, L.P. | Method and system for dynamically allocating computer system resources |
-
2004
- 2004-10-28 CN CN2004800446483A patent/CN101084680B/zh active Active
- 2004-10-28 DE DE602004028877T patent/DE602004028877D1/de active Active
- 2004-10-28 EP EP04822335A patent/EP1806002B1/en active Active
- 2004-10-28 WO PCT/EP2004/012224 patent/WO2006045337A1/en active Application Filing
- 2004-10-28 JP JP2007538274A patent/JP2008519322A/ja not_active Withdrawn
- 2004-10-28 ES ES04822335T patent/ES2351604T3/es active Active
- 2004-10-28 KR KR1020077011953A patent/KR101096000B1/ko active IP Right Grant
- 2004-10-28 US US11/666,509 patent/US8264971B2/en active Active
- 2004-10-28 AT AT04822335T patent/ATE479287T1/de not_active IP Right Cessation
- 2004-10-28 BR BRPI0419152-8A patent/BRPI0419152B1/pt active IP Right Grant
-
2007
- 2007-04-26 IL IL182824A patent/IL182824A/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1307770A (zh) * | 1998-06-25 | 2001-08-08 | 艾利森电话股份有限公司 | 业务提供者在电信系统内对运行和维护信息的接入 |
CN1320312A (zh) * | 1998-09-25 | 2001-10-31 | 索马网络公司 | 电信资源协商的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
US8264971B2 (en) | 2012-09-11 |
JP2008519322A (ja) | 2008-06-05 |
WO2006045337A1 (en) | 2006-05-04 |
DE602004028877D1 (de) | 2010-10-07 |
CN101084680A (zh) | 2007-12-05 |
ATE479287T1 (de) | 2010-09-15 |
ES2351604T3 (es) | 2011-02-08 |
EP1806002B1 (en) | 2010-08-25 |
IL182824A (en) | 2011-12-29 |
BRPI0419152A (pt) | 2008-01-22 |
US20090122706A1 (en) | 2009-05-14 |
IL182824A0 (en) | 2007-08-19 |
EP1806002A1 (en) | 2007-07-11 |
KR20070084594A (ko) | 2007-08-24 |
KR101096000B1 (ko) | 2011-12-19 |
BRPI0419152B1 (pt) | 2018-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101084680B (zh) | 在电信服务和/或网络管理平台中管理资源的方法、相应平台及其计算机程序产品 | |
CN101719082B (zh) | 虚拟化计算平台中应用请求调度的方法及其系统 | |
CN104657220B (zh) | 混合云中基于截止时间和费用约束的调度模型及方法 | |
US6349325B1 (en) | Prioritized agent-based hierarchy structure for handling performance metrics data in a telecommunication management system | |
US10373081B2 (en) | On-demand utility services utilizing yield management | |
US8346909B2 (en) | Method for supporting transaction and parallel application workloads across multiple domains based on service level agreements | |
US8640132B2 (en) | Jobstream planner considering network contention and resource availability | |
US9417919B2 (en) | Computer cluster with objective-based resource sharing | |
CN109471705A (zh) | 任务调度的方法、设备及系统、计算机设备 | |
EP1683082A1 (en) | Method and system for tuning a task scheduling process. | |
US20110010343A1 (en) | Optimization and staging method and system | |
CN106452842B (zh) | 基于网络功能虚拟化中介系统架构的网络系统 | |
US20020019873A1 (en) | System and method for modeling and provisioning information system capacity | |
US7113986B2 (en) | System and method for modeling information system capacity and accepting sessions in an information system | |
Pan et al. | A novel approach to scheduling workflows upon cloud resources with fluctuating performance | |
Diao et al. | Staffing optimization in complex service delivery systems | |
US8972579B2 (en) | Resource sharing in computer clusters according to objectives | |
CN1316787C (zh) | 在ip网络设备端口为不同队列准确分配带宽的方法 | |
JP5670290B2 (ja) | 通信サービスのためのプロセスの実行のためのリソースを管理する方法、システム及びコンピュータ・プログラム | |
JP5083311B2 (ja) | 制御プログラム、制御装置、制御方法、中継プログラム | |
Prado et al. | On providing quality of service in grid computing through multi-objective swarm-based knowledge acquisition in fuzzy schedulers | |
Zhou et al. | AHPA: adaptive horizontal pod autoscaling systems on alibaba cloud container service for kubernetes | |
Volckaert et al. | Network aware scheduling in grids | |
Loewenstern et al. | A dynamic request dispatching system for IT service management | |
Roy et al. | Implementation of a resource broker for efficient resource management in grid environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |