CN108255671A

CN108255671A - 计算机系统的应用的监视和警告机制

Info

Publication number: CN108255671A
Application number: CN201711467923.8A
Authority: CN
Inventors: B·德美利兹; C·杰美恩; F·罗谢特
Original assignee: Bull SA
Current assignee: Bull SA
Priority date: 2016-12-29
Filing date: 2017-12-29
Publication date: 2018-07-06
Also published as: EP3343839A1; FR3061570B1; JP2018109973A; US11556445B2; BR102017028271A2; FR3061570A1; US20180217912A1

Abstract

本发明涉及计算机系统的应用的监视和警告机制。系统包括计算机设备和计算机设备执行的软件或代码，实施对应用链的各应用性能进行监视的机制。系统包括形成测量参考元件的计算机硬件和软件布置，使能够由安装在各资源上的消耗探测器在应用链的一个或多个应用的性能降低期间测量各应用的资源使用水平，能够按照每个应用以及按照应用链的每个周期将测量参考元件中的使用水平存储在存储器中；还使得能够针对每个资源和每个应用，通过定义使用水平的可接受性能阈值并存储在存储器中来建立测量参考数据的使用参考元件；根据测量参考元件和使用参考元件构建性能问题的分类模块；当监视机制检测到应用链的应用的性能问题时或当问题已解决时实施警告机制。

Description

计算机系统的应用的监视和警告机制

技术领域

本发明涉及计算机设施监视领域，更具体地说，涉及企业计算机系统的应用的监视和警告领域。

背景技术

根据计算机系统总监(DSI)的职责要求，当一个应用的服务质量超过临界阈值或应用运行失效时，需要进行干预。通常，这种情况是由于带有解决方案的设施上没有监视机制，以及/或者警告没有被重新记录或太迟。在这种情况下，通常难以找到问题的根源，难以解决问题，因为分析问题所需的数据不存在或已经消失了。

当前已知技术提供了一些监视计算机设施的方案。这些方案使得可以诊断服务器资源紧张的问题，但不能在资源饱和与计算机系统的应用之间建立关联。这些方案只能启动技术干预以便解决问题，但达不到《服务水平协议》(英文：Service-Level Agreement,SLA)的要求；而计算机总监(DSI)需要向其上级主管承诺该协议，以便确保应用或应用链服务器的服务质量。

在这种情况下，提出一种方案来解决计算机系统的应用性能问题，从而弥补当前技术的不足，就显得有意义了。

发明内容

本发明的目的是提出一种方案来解决以及/或者预防应用性能问题，从而弥补当前技术的某些不足。

因此，本发明涉及一种系统，该系统包括至少一个计算机设备和由该设备执行的软件或代码，以便实施对应用链的各应用性能进行监视的机制。该系统包括的计算机硬件和软件布置组成了测量参考元件(1)，该测量参考元件(1)实现两方面的功能：一方面可以在应用链的一个或多个应用的性能降低时用安装在各资源上的消耗探测器来测量各应用的资源使用水平，另一方面可以按照每个应用以及按照应用链的每个周期把使用水平存储在测量参考元件(1)的存储器(11)中；特征在于该系统的计算机硬件和软件布置还使得能够：

-针对每个资源以及每个应用，定义使用水平的可接受性能阈值(Smin，Sint，Smax)并存储在至少一个存储器(21、22、23)中，来建立测量参考数据的使用参考元件(2)；

-根据测量参考元件(1)和使用参考元件(2)，构建性能问题的分类模块(3)；

-以及当监视机制检测到应用链的一个或多个应用的性能问题时或当问题已解决时实施警告机制(4)。

因此，通过监视应用链各应用的资源消耗及其随着时间的变化，本发明使得可以在资源紧张发生之前发出警告，或者当应用出现行为异常时发出警告，并解决上述问题。

根据另一特征，使用水平的可接受性能阈值包括三个可接受阈值，这三个阈值构成了一个三元组，包括一个最小阈值、一个最大阈值、一个中间阈值；针对每一个资源以及应用链的每一个应用都存储了这样的阈值三元组。

根据另一特征，使用参考元件包括至少一个硬件和软件布置，使得能够根据测量参考元件的使用水平测量来建立限定的可接受的消耗区间，并把该消耗区间存储在存储器中。

根据另一特征，监视机制能比较测量到的并存储在测量参考元件中的资源使用水平和在使用参考元件中建立的各应用的消耗区间和/或阈值。

根据另一特征，使用参考元件(2)包括至少一个硬件和软件布置(20)，使得能够对每一个资源，用阈值(Smin，Sint，Smax)建立实际使用水平(21)和理论使用水平(22)，并存储在存储器中。

根据另一特征，应用的资源的使用水平经过多次测量，以便显示应用对资源的各种不同的消耗水平的特征。

根据另一特征，对应用的资源的使用水平的测量，是在生产前或鉴定定环境中实施的。

根据另一特征，对应用的资源的使用水平的测量，还可以在生产环境中实施，以便在必要时针对每个资源和每个应用改进使用水平的可接受性能阈值和/或消耗区间。

根据另一特征，测量参考元件包括硬件和软件布置，可以用消耗探测器测量有大幅季节性使用变化的资源或应用的“季节性”使用水平并存储在存储器中，以便建立并存储各个资源以及各个应用的使用水平的可接受性能的“季节性”阈值。

根据另一特征，性能问题分类模块可以通过如下操作建立分类：

-建立存储在存储器中的“资源消耗”类别，该类别包括针对每个资源以及应用链的每个应用测得的使用水平的总消耗，或者

-比较测量参考元件中的可用的资源的测得的使用水平和在使用参考元件中可用的应用对各个资源的使用水平的可接受最大性能阈值，以便在测得的使用水平超过资源的最大阈值时建立存储在存储器中的“硬件异常”类别，或者

-比较在测量参考元件中可用的资源的测得的使用水平和在使用参考元件的存储器中可用的应用对各个资源的使用水平的可接受消耗区间，以便在测得的使用水平在该资源的可接受消耗区间之外时建立存储在存储器中的“应用性能下降”类别，或者

-基于应用对资源需求的季节性规律结合测量参考元件中可用的应用对资源的测得的使用水平，计算存储在存储器中的每个资源以及每个应用性能降低的将来消耗，或者

-比较资源的将来消耗的计算结果和使用参考元件中可用的应用对每个资源的使用水平的可接受最大性能阈值，以便在该资源的将来消耗计算结果超过应用对资源的可接受最大性能阈值时建立存储在存储器中的“应用性能预防”类别，

-或者上述操作中至少二者的组合。

根据另一特征，警告机制使得可以产生如下警告的至少一个或多个，并存储在至少一个存储器中：

-当在测量参考元件中可用的应用的资源使用水平超过使用参考元件中所述可用资源的可接受最大性能阈值时的“硬件异常”警告；

-当测量参考元件中可用的应用的资源使用水平在使用参考元件中所述可用资源的可接受消耗区间之外时的“应用性能降低”警告；

-当分类模块的存储器中可用的应用的资源将来消耗计算结果超过使用参考元件中的所述可用资源的可接受最大性能阈值时的“应用性能预防”警告。

根据另一特征，所述系统能对如下情况持续地监视并发出警告：应用链的一个或多个应用的异常，或者由于应用的关键资源被过度消耗而引起的应用链性能降低，或者资源的将来过度消耗。

另一个目的是消除现有技术中涉及性能降低事件中对应用链的某些应用的可观察征兆的监视和警告方面的一个或多个弊病。

该目的通过一种根据本发明特征之一的系统监视应用链的各个应用的性能并进行控制的方法来实现。所述方法包括：

-为了能够显示资源的不同消耗水平的特征，针对应用链的每个应用测量和存储资源使用水平的步骤；

该方法还包括：

-测量并存储应用的不同组分的资源需求的步骤；

-基于在应用的资源使用水平以及资源需求的测量和存储步骤中获得的数据构建使用参考元件，以便针对每个被测量的资源以及每个应用建立最小阈值、最大阈值和中间阈值的步骤；

-基于使用参考元件以及在应用链的应用的资源使用水平和资源需求的测量和存储步骤中获得的数据，对一个或多个资源的性能问题进行分类并存储的步骤；

-基于分类步骤中的性能问题，比较测得的使用水平和可接受的性能阈值的步骤；

-基于比较步骤中获得的数据设置性能问题警告，以便通过调整应用链或应用链的应用的资源来减轻性能问题的步骤。

根据另一特征，测得的使用水平与可接受性能阈值之间的比较是一直重复进行的，以便针对应用链的各应用持续地进行监视和警告。

本发明的其它特征和优点在下文中描述。

附图说明

本发明的其它特征和优点在下文的描述中展示得更加清楚，下文的描述参考了如下附图：

图1示意性地表示根据本发明一种实施方式的系统的组成元件，用于实施应用链各应用的性能的监视机制。

图2示意性地表示根据本发明一种实施方式的监视应用链各应用性能并发出警告的方法。

具体实施方式

在下文中，信息探测器指的是与设备(例如传感器)配合的软件，可以自动地(例如在有变化发生时，或周期性地)执行、管理并向监视设备重新记录(remonter)测量，用来告知网络流的质量或服务质量(QoS英文(Quality of Service))，等等。这样就不需要由用户重复地发送命令，而是由探测器自动地重新记录信息，避免了阻塞网络。

根据一种实施方式，探测器的采样频率应该保持恒定并同步，以便能在构成应用链的各物理和/或虚拟服务器之间关联这些测量。

本发明涉及一种系统，该系统包括至少一个计算机设备以及由该设备能够执行的软件和代码，其与应用链的其它硬件和软件通信，以便实施一种监视机制，尤其是在应用链的应用的性能降低时监视该应用链的应用(或服务器)的性能。可以看出，应用链的应用的性能降低可以是关于应用链的应用(或服务器)的任何类型的行为异常或任何类型的潜在紧缺，例如(不限于)应用的资源饱和或应用对资源的过度消耗。应用链包括一组资源(R₁，...，R_j，...，Rn)，全部或部分被多个应用或服务器(A1，...，A_j，...，Am)使用。因此，应用链的结构在存储器中表示为与每个应用A_j相关联的资源标识符列表Lr_j。

根据一种实施方式，所述系统包括至少一个测量参考元件(1)的存储计算机硬件和软件布置。该测量参考元件(1)包括至少一个计算机硬件和软件布置(10)，可以在性能降低期间Pdp_j用消耗探测器测量在构成应用链的一组应用(A1，...，A_j，...，Am)的每个应用A_j上各个资源Ri的使用水平Nur_i，然后把这些使用水平Nur_i与时期Pdp_j关联在一起，存储在测量参考元件(1)的存储器(11)中，以便构建信息二元组(doublet)(Nur_i，Pdp_j)。

消耗探测器与各个资源相关联，以便重新记录表示资源使用水平(Nur)的测量或度量信息。对每个资源，消耗探测器都定义了一个标识符Lr作为资源名称以及一个使用水平Nu。每个资源的使用水平Nur_i对应一个信息二元组(Lr，Nu_i)。对于没有性能问题的时期采用同样的办法，存储三元组(Lr，Nu_i，Pndp_j)。

因此，测量参考元件的存储器(11)存储了三元组(Lr，Nu_i，Pdp_j)或(Lr，Nu_j，Pdp_j)，其优点在于减少了探测器发送的信息量，从而减轻了网络拥堵，同时相对于上文所述的方案而言还提高了精度。

根据某些实施方式，所探测的资源可以是每个集群实例，每个应用高速缓存，每个JMS/JDBC应用编程接口的消息队列以及处理器、输入/输出、存储器的大小。JMS(Java消息服务)应用编程接口(API)是在应用之间收发消息的编程接口，JDBC(Java数据库连接)是使得可以访问数据库的API。

信息可以由消耗探测器重新记录，例如(不限于)有：以各种资源(处理器(CPU)、存储器，等等)的占用百分比(％)表示的计算出的每个服务器的负载、磁盘输入/输出上的负载、或网络流量负载(连接分组(英文为TCP，Transmission Control Protocol(传输控制协议))和字节计数)，等等。

探测器可以测量的常规参数为例如：负载、资源占用百分比、响应时间、处理时间、CPU使用水平、磁盘读写率，等等。探测器还可以测量更专业的元素例如：开放端口或文件的数量、JDBC(Java数据库连接，是一种使得Java程序可以访问数据库的编程接口)或JMS(Java消息服务，是一种使得可以在应用之间收发消息的编程接口)消息队列、文件系统占有率、用于J2EE(英文：Java Enterprise Edition(Java企业版)，J2EE是一个开发并执行分布式应用的服务器平台)应用的碎片收集或内存回收(垃圾收集器)的运行效率，等等。

文件系统(例如计算机硬件架构)指的是一组原则和规范，根据其来组织和调用所述计算机架构的文件。

根据某些实施方式，所述系统还包括构成配置参考元件(2)的计算机硬件和软件布置(20)。所述系统的硬件和软件可以在至少一个存储器(21、22、23)中建立使用参考元件，用来针对每个资源和应用链的每个应用定义并存储使用水平的可接受的性能阈值(Smin,Sint,Smax)。

采用消耗探测器测量资源使用水平，信息总监(DSI)可以获得关于应用链的某个给定应用的资源的当前消耗率和(通过计算获得的)预计消耗率的信息。根据某些实施方式，使用水平被多次测量，例如但不限于三次或更多次测量，以便能精确可靠地反映资源的各种不同的使用水平或消耗水平。对资源使用水平的重复测量有两个作用：一个作用是可以建立可接受性能阈值(Smin,Sint,Smax)，即从此应用的资源性能降低的临界值；另一个作用是对应用的每个资源建立可接受的消耗区间(In)，在这个消耗区间以内应用的资源性能不降低且运行良好。根据某些实施方式，使用水平性能阈值包括针对每个资源和应用链的每个应用的三个可接受的阈值且构成了一个三元组：最小阈值(Smin)、中间阈值(Sint)、最大阈值(Smax)。针对应用链的给定应用的每个资源的阈值三元组(Smin,Sint,Smax)存储在使用参考元件(2)的至少一个存储器(21、22、23)中。这些不同的阈值的优点在于确定一个容易建立的可靠的指示或信息，并有助于信息总监(DSI)评估应用的性能状态。根据某些实施方式，针对每个资源以及应用链的每个应用，消耗区间(In)根据测量参考元件(1)的使用水平测量来建立，并存储在使用参考元件(2)的存储器(24)中。例如，该区间可以根据测量参考元件(1)以前测量获得的使用水平测量来计算得出。事实上，以前的测量使得可以用来建立应用使用或消耗资源的季节性，从而建立关于每个物理或虚拟应用的资源使用水平。消耗区间也可以根据各个应用对每个资源的可接受性能阈值(Smin,Sint,Smax)计算而得。例如，消耗区间可以介于最小性能阈值与中间阈值之间、介于中间阈值与最大阈值之间、或介于最小阈值与最大阈值之间。

在某些实施模式中，监测机制使得能够比较被测得并存储在测量参考元件(1)中的资源使用水平和在使用参考元件(2)中为每个资源及每个应用预先建立的阈值(Smin,Sint,Smax)和/或消耗区间(In)。这种测得的使用水平和预先建立和存储在使用参考元件中的阈值和/或区间之间的比较使得能够当系统检测到在应用链的一个或多个应用中潜在的争用和/或异常行为时，或当问题已经解决时，实施警告机制(4)，其细节如下。因此，与现有技术不同，本发明的系统具有在资源性能下降与受影响的计算机系统应用之间建立联系的优点。根据本发明的实施方式，实施计算机系统应用的监视和警告使得能够纠正和防止生产故障。

在某些实施模式中，为每个资源及每个应用建立和存储可接受的性能阈值(Smin,Sint,Smax)和/或消耗区间(In)而进行的使用水平测量，可预先在预生产的信息环境(应用程序部分执行的环境)或者鉴定信息环境(应用程序的测试环境)中被实现。这种方法因此允许在生产之前测量并建立针对每个资源及每个应用的可接受性能阈值和/或消耗区间，以便获得最接近信息生产阶段的性能阈值和/或消耗区间并保证对应用性能下降的最优检测。

在某些实施模式中，为每个资源及每个应用建立和存储可接受的性能阈值(Smin,Sint,Smax)和/或消耗区间(In)而进行的使用水平测量，同样可以在生产中的信息环境中实施，以便重新定义并改进(affiner)这些预先建立并存储在使用参考元件中的不同的性能阈值和消耗区间。这种方法使得能够监视应用链上应用的每个资源的性能阈值变化，为了获得每个资源及每个应用性能阈值和消耗区间的最佳校准而进行重新测量和重新建立，以便能够根据应用性能的下降变化与否实施纠正措施。

在某些实施模式下，例如图1所示，使用参考元件(2)包括至少一个硬件和软件布置，使得能够在至少一个存储器中为每个资源用不同的阈值(Smin,Sint,Smax)建立和存储实际使用水平(21)和理论使用水平(22)。在此情况下，我们将为交互LrR_pS_i存储三元组(Nu_j,A_i,R_p)或二元组(Nu_j,Nur_p):

-在存储器(21)中，是针对每个资源R_j的每个阈值(Smin,Sint,Smax)的实际使用水平列表NumrR_j；

-在存储器(22)中，是针对每个资源R_q的每个阈值(Smin,Sint,Smax)的理论使用水平列表NumrR_q。

每个资源的理论使用水平例如但以非限制性方式是根据涉及类似基础架构(例如：网络流量或盘)的图表获得。至于每个资源的实际使用水平，它们是例如以非限制性方式通过分析不同时期不同探测器的结果获得的。

在某些实施模式下，测量参考元件(1)包括硬件和软件布置，它使得能够通过消耗探测器测量并在存储器(11)存储资源或者有重大使用变化的应用的“季节性”使用水平，以便针对每个资源和每个应用建立使用水平的可接受的性能“季节性”阈值(Smin,Sint,Smax)，并存储在使用参考元件(2)的存储器(23)中。在此情况下，我们将为交互LrR_pS_i存储三元组(Nu_j,A_i,R_p)或二元组(Nu_j,Nur_p)：

-在存储器(21)中，它是每个资源R_j的每个阈值(Smin,Sint,Smax)的实际使用水平列表NumrR_j；

-在存储器(22)中，它是每个资源R_q的每个阈值(Smin,Sint,Smax)的理论使用水平列表NumrR_q；

-在存储器(23)中，它是每个资源R_o的每个阈值(Smin,Sint,Smax)的实际使用水平列表NumrR_o；

每个资源的季节性使用水平，例如但以非限制性方式，是通过分析针对每个应用的每个资源在一个完整的使用周期期间(例如根据资源或应用的使用的可变性设置一个月、一个季度或一年周期)的不同探测器而获得的。

这些参数的列表使得能够实现在构成应用链的应用(或服务器)上测得的资源使用水平和基于资源、应用及使用类型(实际、理论和/或季节性使用)的使用参考元件(2)的可接受性能阈值(Smin,Sint,Smax)之间的比较。这一比较在性能问题产生时期Pdp_j和无性能问题时期Pndp_j之间进行。目的是验证资源已达到使用水平或异常消耗水平或接近最高水平，并且在这一应用资源使用水平上设置警告机制，以便能够纠正应用链的应用资源的异常行为。因此应用性能的这些比较分析的自动实现能够减少故障发生的时间。

在某些实施模式中，该系统还包括一个基于测量参考元件(1)和使用参考元件(2)的性能问题分类模块(3)。

性能问题分类模块(3)包括至少一个硬件和软件布置(30)，使得能够通过下列操作完成分类：

-创建存储在存储器(31)中的“资源消耗”类别，其包括针对每个资源及应用链中每个应用测得的使用水平的总消耗量，或

-将测量参考元件中可用的资源的测得的使用水平和使用参考元件中可用的应用的每一个资源的使用水平的最大可接受性能阈值进行比较，以便当测得的使用水平高于资源最大阈值时，创建存储在一个存储器(32)中的“硬件异常”类别，或

-将在测量参考元件中可用的资源的测得的使用水平和在使用参考元件中可用的应用的各个资源的使用水平的可接受消耗区间(In)进行比较，以便在测得的使用水平超出该资源的可接受消耗区间(In)时创建存储在存储器(33)中的“应用性能下降”类别，或

-基于应用对资源需求的季节性规律结合测量参考元件中可用的应用对资源的测得的使用水平，计算存储在存储器(34)中的按每个资源以及每个应用的性能降低的“将来消耗”，或者

-将资源的将来消耗的计算结果和使用参考元件中可用的应用对每个资源的使用水平的可接受最大性能阈值进行比较，以便在该资源的将来消耗计算结果超过应用对资源的可接受最大性能阈值时创建存储在存储器(35)中的“应用性能预防”类别，或者通过组合上述至少两项操作。

存储器(31)(例如：IO网络或盘)内“资源消耗”类别的创建通过使用将任意资源R_j分类或分级成“资源消耗”的规则来执行，其中任意资源R_j的使用水平Nur_j关于构成应用链的不同应用(A_k,A_l,...)被标识。所述资源R_j的标识符被存储在专用于“资源消耗”的存储器(31)中。这一创建借助测量参考元件(1)的存储器中可用的应用的资源之间的交互来实现，以便针对每个资源和每个应用，创建所述资源R_j的总使用水平NuGr_j。总使用水平NuGr_j通过计算在每个应用A_i上使用的一个资源的所有水平Nur_j的总和ΣNurA_i而获得，并表示在应用链的给定应用上测得的资源消耗总量R_j。

在存储器(32)中创建“硬件异常”类别通过使用下列规则实现：当测得的资源使用水平Nur_j达到或超过使用参考元件(2)中针对每个可用资源R_j的实际使用水平NumrR_j和/或理论使用水平NumtR_j和/或季节性使用水平NumsR_j的最大可接受性能阈值时，产生异常的系统遵循应用链中的应用的资源的饱和。

在存储器(33)中创建“应用性能下降”类别通过使用下列规则实现：当测得的资源使用水平Nur_j在使用参考元件(2)中针对每个可用资源R_j的使用水平的消耗区间之外时。例如当应用链的应用的资源的行为异常(诸如应用停止运行或瞬时集群问题造成SLA服务水平协议下降等)时，就有这种情况。

在存储器(34)中创建“将来消耗”类别，基于被称为“季节性”的规则和资源的实际使用水平来实现。我们将注意到资源或应用的使用水平会随着时间(例如，一天、一周、一个月或一年的一个或几个时刻)而变化，导致组成应用链的各种应用的资源使用水平的变化。例如，有些应用可能在周三不太被使用，这可以用兼职人员通常的每周假期来解释。另一个非限制性例子，金融应用通常在每月末或每季度末被高度使用。因此，应用使用的所有变化可以由季节性规则来定义，它根据应用(尤其是由于行业活动和应用使用者行为)而不同并且随着时间而演变。这解释了求助于能够自动地且持续地监视和预警计算机系统应用性能问题的系统的必要性。

在存储器(35)中创建“应用性能预防”类别，通过使用以下规则来实现：当基于测得的资源使用水平Nur_j的将来消耗计算结果显示应用饱和风险时。例如但不局限于此，若一个资源如CPU的季节性规则预计到在一段时期P₀+60m(m定义任何持续时间段)，资源使用水平(换而言之即将来消耗)将是指定时期P₀3.2倍高。因此，若在P0时期，测得的CPU资源使用水平是CPU总容量的26％。该资源将来消耗结果，通过乘以季节性规则预测的测量使用水平(根据最新的季节性规则Dt＝P₀+60m，使用水平的26％乘以3.2，并得到CPU总容量的83.2％这一结果)获得，将会很大并显示饱和风险并且一个警告将会被设置以便能够纠正CPU饱和问题(例如，通过增大CPU的内存)。

在某些实施模式下，系统还包括计算机硬件和软件布置(40)，它使得能够在监视机制检测到应用链中一个或几个应用的性能问题时或问题已经被解决时实施警告机制(4)。

警告机制使得能够在至少一个存储器(41、42、43)中创建并存储至少一个下列警告：

-当测量参考元件中可用的应用的资源的使用水平高于使用参考元件中所述可用资源的最大可接受性能阈值时的“硬件异常”警告；

-当测量参考元件中可用的应用的资源的使用水平不在使用参考元件中所述可用资源的可接受消耗区间(In)内时的“应用性能下降”警告；

-当分类模块存储器中可用的应用的资源的将来消耗计算结果高于使用参考元件中所述可用资源的最大可接受性能阈值时的“应用性能预防”警告。

“硬件异常”警告，在运行中使用水平异常时，被存储在一个存储器(41)中，以便采取纠正措施。这个纠正措施通常使得能够修改虚拟或物理计算机的硬件或软件配置，例如但不限于此，增加存储器或处理器，(通过增加空间或删除文件等)释放磁盘空间。

“应用性能下降”警告，在应用链上性能下降被检测到时，被存储在存储器(42)中，以便采取适当的纠正措施。此纠正措施通常使得能够监视应用以确定问题的根源，例如但不限于此，停止运行的应用，造成SLA服务水平协议下降的瞬时集群问题等。这一警告在测得的资源使用水平不在系统的使用参考元件中预建并存储的该资源可接受消耗区间(In)内时启动。这个区间可基于针对应用的每一资源的使用水平的先前测量，或基于针对每个资源和每个应用使用水平的可接受消耗区间来建立。

“应用性能预防”警告，在系统旨在预防和预测未来问题时，被存储在存储器(43)中，以便为相关资源提供性能改进建议。因此，在预测应用的资源将来消耗时，纠正器程序将会晚些时间实施。这一配置因此使得能够为实施限制和纠正应用的性能问题的最佳纠正方案争取时间。

在某些实施模式下，该系统包括一个带有纠正程序(5)的硬件和软件布置。事实上，如例如图1和2所示，不同类型的警告由处理程序分析以便能够根据系统检测到的警告实施适当的纠正程序(5)。

在某些实施模式下，该系统能够针对应用链的一个或几个应用上的异常，或应用链上由于应用的关键资源的过度消耗或未来的资源过度消耗的性能下降进行持续监视并警告。

例如如图2所示，监视机制能够收集每个资源及每个应用的使用水平测量，它们被分类并存储在分类模块(3)的存储器(31)中，以便通过以下方法识别性能问题：

-通过与针对每个资源和每个应用预先建立的性能阈值(Smin,Sint,Smax)进行比较，尤其是，将达到最大性能阈值的一个资源，将被系统分类并存储在分类模块(3)的存储器(32)中；或者

-通过与针对每个资源和每个应用预先建立的消耗区间(In)进行比较，尤其是，不在其可接受消耗区间内的一个资源，将被系统分类并存储在分类模块(3)的存储器(33)中；或者

-通过计算针对每个资源和每个应用的将来消耗，尤其是，将有性能问题风险的一个资源，将被系统分类并存储在分类模块(3)的存储器(34)中。

当使用水平异常时，系统能够借助自动且持续警告来实施改善措施。因此，根据检测到的性能问题，该系统设置警告机制(4)和适当的纠正程序(5)。例如，当分类模块(3)指示所测得的资源使用水平已经达到其最大可接受性能阈值时，警告机制在存储器(41)中建立一个“硬件异常”警告，它能够实施关于所述资源的适当的纠正程序。当分类模块(3)指示资源的使用水平不在可接受消耗区间范围内时，警告机制在存储器(42)中建立“应用性能下降”警告，它能够实施关于所述资源的恰当的纠正程序。最后，当分类模块(3)指示资源的使用水平表现出下降的风险，例如资源饱和时，警告机制在存储器(43)中建立“应用性能预防”警告，它使得能够实施关于所述资源的恰当的纠正程序。

本发明同样涉及一种监视应用链的应用的性能以及控制根据本申请的实施模式之一的系统方法。该方法包括：

-为了能够显示资源的不同消耗水平的特征，测量和存储针对应用链的每个应用的资源使用水平的步骤；

-测量和存储应用不同元件对资源的需求的步骤；

-基于从资源使用水平和应用对资源的需求的测量和存储步骤获得的数据构建使用参考元件(2)，以便针对每个测得的资源以及每个应用建立最小阈值(Smin)、最大阈值(Smax)和中间阈值(Sint)的步骤；

-基于从使用参考元件(2)和应用链的应用的资源使用水平及对资源的需求的测量和存储步骤获得的数据，分类和存储一个或几个资源的性能问题的步骤；

-基于分类步骤的性能问题，比较测得的使用水平和可接受性能阈值的步骤；

-基于从比较步骤获得的数据，实施性能问题警告，以便通过修改应用链或应用链的应用的资源来纠正性能问题的步骤。

在某些实施模式下，比较测得的使用水平和可接受性能阈值的步骤被不停地重复以便对应用链的应用进行持续地监视和警告。

如例如图2所示，测量参考元件(1)的应用链的每个应用和每个季节性对每一资源的使用水平的测量，被分类并存储在分类模块(3)的存储器(31)中。这些测量与可接受性能阈值或者与预建的可接受消耗区间作比较，两者已经为每个资源和每个应用预先建立，以便监视和警告DSI应用链上的应用性能问题。这些测量参考元件(1)的使用水平的测量分三个步骤被比较：

-首先，第一步中测得的水平与使用参考元件(2)的最大性能阈值(Smax)进行比较，当使用水平达到其最高性能阈值时，系统将设置应用异常警告(41)；

-其次，如果第一步显示没有异常，然后在第二步中，使用水平与使用参考元件(2)的消耗区间(In)进行比较，当使用水平不在其消耗区间内时，系统将设置“应用性能下降”警告(42)；

-随后，若第二步未显示性能下降，则在第三步中，基于测得的使用水平计算将来的消耗量，当使用水平的测量指示有资源饱和风险时，系统将设置“应用性能预防”警告(43)；

-最后，若第三步未显示有资源饱和风险，那么在应用链中出现性能问题时，将进行新的使用水平测量以便自动并定期地进行监视和警告。

本方法的这些不同步骤因此被自动地连续地执行，以便能够通过在计算机系统中限制或消除性能问题来优化对计算机操作的控制。本发明应用性能的监视方法具有快速自动识别应用性能下降，并针对公司的计算机系统的每个应用实施适当的持续的改进方案的优点。

本申请参考附图和/或各种实施模式描述了各种技术特征和优点。本领域的技术人员将理解，给定实施模式的技术特征事实上可以与另一个实施模式的特征相结合，除非明确提到相反的情况，或者明显的是这些特征是不相容的，或者这种组合不能解决至少一个本申请中提到的技术问题。此外，给定实施模式中描述的技术特征可以与该模式的其他特征相独立，除非明确提到相反的情况。

本领域人员应该清楚，本发明允许具有许多其他特定形式而不背离如权利要求所述的本发明应用范围的实施模式。因此，本实施模式应该被认为是示例性的，但是可以在由所附权利要求的范围限定的领域中进行修改，并且本发明不应该被限制于上面给出的细节。

Claims

1.一种系统，包括至少一个计算机设备和由该计算机设备能够执行的软件或代码，用于实施对应用链的各应用性能进行监视的机制，所述系统包括形成测量参考元件(1)的计算机硬件和软件布置，使得能够一方面由安装在各资源上的消耗探测器在应用链的一个或多个应用的性能降低期间测量各应用的资源使用水平，另一方面能够按照每个应用以及按照应用链的每个周期将使用水平存储在测量参考元件(1)中的存储器(11)中；特征在于所述系统的计算机硬件和软件布置还使得能够：

-通过针对每个资源以及每个应用定义使用水平的可接受性能阈值(Smin，Sint，Smax)并存储在至少一个存储器(21、22、23)中，来建立测量参考数据的使用参考元件(2)；

2.根据权利要求1的系统，其特征在于：使用水平的可接受性能阈值(Smin，Sint，Smax)包括三个可接受的阈值，上述三个可接受的阈值构成三元组并由最小阈值(Smin)、最大阈值(Smax)和中间阈值(Sint)组成；阈值三元组(Smin，Sint，Smax)针对每个资源和应用链的每个应用被存储。

3.根据权利要求1至2中任一项所述的系统，其特征在于：使用参考元件(2)包括至少一个硬件和软件布置(20)，使得能够基于测量参考元件(1)的使用水平测量建立可接受的消耗区间(In)并存储在存储器(24)中。

4.根据权利要求1至3中任一项所述的系统，其特征在于：监视机制能够比较测得和存储在测量参考元件(1)中的资源使用水平和应用在使用参考元件(2)中建立的阈值(Smin，Sint，Smax)和/或消耗区间(In)。

5.根据权利要求1至4中任一项所述的系统，其特征在于：使用参考元件(2)包括至少一个硬件和软件布置(20)，使得能够为每个资源用阈值(Smin，Sint，Smax)建立实际使用水平(21)和理论使用水平(22)并存储在存储器中。

6.根据权利要求1至5中任一项所述的系统，其特征在于：各应用的资源使用水平被测量多次，以便显示各应用的不同的资源消耗水平的特征。

7.根据权利要求1至6中任一项所述的系统，其特征在于：对应用的资源使用水平的测量是在生产前或鉴定环境中实施的。

8.根据权利要求3至7中任一项所述的系统，其特征在于：对应用的资源使用水平的测量还可以在生产环境中实施，以便在必要时针对每个资源和每个应用改进使用水平的可接受性能阈值(Smin，Sint，Smax)和/或消耗区间(In)。

9.根据权利要求1至7中任一项所述的系统，其特征在于：测量参考元件(1)包括硬件和软件布置，使得能够用消耗探测器测量有大幅季节性使用变化的资源或应用的“季节性”使用水平并存储在存储器(23)中，以便建立并存储各个资源以及各个应用的使用水平的可接受性能的“季节性”阈值(Smin，Sint，Smax)。

10.根据权利要求3至9中任一项所述的系统，其特征在于：性能问题分类模块(3)可以通过如下操作建立分类：

-建立存储在存储器(31)中的“资源消耗”类别，该类别包括针对每个资源以及应用链的每个应用测得的使用水平的总消耗，或者

-比较测量参考元件(1)中的可用的资源的测得的使用水平和在使用参考元件(2)中可用的应用对各个资源的使用水平的可接受最大性能阈值(Smax)，以便在测得的使用水平超过资源的最大阈值(Smax)时建立存储在存储器(32)中的“硬件异常”类别，或者

-比较在测量参考元件(1)中可用资源的测得的使用水平和在使用参考元件(2)的存储器(24)中可用的应用对各个资源的使用水平的可接受消耗区间(In)，以便在测得的使用水平在该资源的可接受消耗区间(In)之外时建立存储在存储器(33)中的“应用性能下降”类别，或者

-基于应用对资源需求的季节性规律结合测量参考元件(1)中可用的应用对资源的测得的使用水平，计算存储在存储器(34)中的每个资源以及每个应用性能降低的将来消耗，或者

-比较资源的将来消耗的计算结果和使用参考元件(2)中可用的应用对每个资源的使用水平的可接受最大性能阈值，以便在该资源的将来消耗计算结果超过应用对资源的可接受最大性能阈值时建立存储在存储器(35)中的“应用性能预防”类别，

-或者上述操作中至少二者的组合。

11.根据权利要求3至10中任一项所述的系统，其特征在于：警告机制(4)使得能够产生如下警告中的至少一个或多个并存储在至少一个存储器(41、42、43)中：

-当在测量参考元件(1)中可用的应用的资源使用水平超过使用参考元件(2)中所述可用资源的可接受最大性能阈值(Smax)时的“硬件异常”警告；

-当测量参考元件(1)中可用的应用的资源使用水平在使用参考元件(2)中所述可用资源的可接受消耗区间(In)之外时的“应用性能降低”警告；

-当分类模块(3)的存储器中可用的应用的资源将来消耗计算结果超过使用参考元件(2)中的所述可用资源的可接受最大性能阈值(Smax)时的“应用性能预防”警告。

12.根据权利要求1至11中任一项所述的系统，其特征在于：所述系统能够对如下情况持续地监视并发出警告：应用链的一个或多个应用的异常，或者由于对应用的关键资源的过度消耗而引起的应用链性能降低，或者资源的将来过度消耗。

13.一种根据权利要求2至12中任一项所述的系统监视应用链的各个应用的性能并进行控制的方法，所述方法包括：

所述方法的特征在于还包括：

-测量并存储应用的各个组分的资源需求的步骤；

-基于在应用的资源使用水平以及资源需求的测量和存储步骤中获得的数据构建使用参考元件(2)，以便针对每个被测量的资源以及每个应用建立最小阈值(Smin)、最大阈值(Smax)和中间阈值(Sint)的步骤；

-基于使用参考元件(2)以及在应用链的应用的资源使用水平和资源需求的测量和存储步骤中获得的数据，对一个或多个资源的性能问题进行分类并存储的步骤；

-基于分类步骤中的性能问题，比较测得的使用水平和可接受的性能阈值(Smin，Sint，Smax)的步骤；

-基于比较步骤中获得的数据发出性能问题警告，以便通过调整应用链或应用链的应用的资源来从而减轻性能问题的步骤。

14.根据权利要求13的方法，其特征在于：比较测得的使用水平与可接受性能阈值(Smin，Sint，Smax)的步骤一直重复进行，以便针对应用链的各应用持续进行监视和警告。