CN102822806A - 检测应用的无进展状态 - Google Patents

检测应用的无进展状态 Download PDF

Info

Publication number
CN102822806A
CN102822806A CN201180018496XA CN201180018496A CN102822806A CN 102822806 A CN102822806 A CN 102822806A CN 201180018496X A CN201180018496X A CN 201180018496XA CN 201180018496 A CN201180018496 A CN 201180018496A CN 102822806 A CN102822806 A CN 102822806A
Authority
CN
China
Prior art keywords
resource
group
subrange
output
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201180018496XA
Other languages
English (en)
Other versions
CN102822806B (zh
Inventor
D·佩莱格
L·W·罗素
S·本耶胡达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN102822806A publication Critical patent/CN102822806A/zh
Application granted granted Critical
Publication of CN102822806B publication Critical patent/CN102822806B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • G06F11/3612Software analysis for verifying properties of programs by runtime analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

在说明性实施例中,提供了一种用于检测应用的无进展状态的方法、系统和计算机可用程序产品。一组应用的资源使用和输出被监视。资源使用及输出被测量,以确定在给定时间的资源使用值和输出值。确定资源使用值是否包含在资源使用刻度的子范围内,以及输出值是否包含在输出刻度的子范围内,其中,该资源使用刻度的子范围对应于输出刻度的子范围。如果该确定是否定的,则检测到应用的无进展状态。

Description

检测应用的无进展状态
发明领域
本发明一般涉及改进的数据处理系统,更具体而言,涉及一种用于监控数据处理系统的性能的计算机实现的方法。
背景技术
数据处理系统中存在的情况会影响其中的应用的执行。例如,数据处理系统应能向应用提供合适的资源,从而该应用能够按预期执行。另一个例子是,处理器应能可用于以及时的方式来执行与应用相关的指令,从而该应用的性能在可接受的范围内。
在某些情况下,应用执行会无法执行期望的功能。在很多情况下,在出现这样的失败时,应用进入到错误状态。例如,错误状态可以是应用崩溃或者意外退出执行。错误状态的另一个例子可以是,应用报告对应于失败操作的错误码。
其他应用,例如数据处理系统的操作系统,包含用于检测执行的应用所出现的错误状态的功能。这样的应用于是可以采取适当的动作来保持数据处理系统的稳定性和性能。例如,操作系统可以终止与应用相关的进程,并释放该进程所占用的资源。另一个例子是,监控应用可以俘获(trap)应用产生的错误码,并使得该应用优雅地(gracefully)退出执行,以执行另一操作。
在某些情况下,应用不会进入错误状态,但在其他方面,该应用的继续执行是不希望的。在数据处理系统中检测这样的条件很困难,当前是不可行的,但对于改进数据处理系统的性能来说是需要的。
US20070179746公开了对输入和输出测量之间的关系的监视和模型推导。
US7577550公开了一种监视计算系统的方法,以获取性能测量并基于观察到的计算系统测量来检测异常。
US20070028219公开了一种基于输出差异在阈值残差范围内检测计算机系统中的异常的方法。
US20090199196公开了一种监视应用执行来确定资源-事务对的时间序列数据从而基于偏差信息确定异常的方法。
论文“使用模型驱动异常特征化的I/O系统性能调试”(Kai Shen等,第四届文件和存储技术USENIX会议(4thUNSNIX Conference on File andStorage Technologies),309-22,2005)公开了对软件程序的监视,以创建不同条件下的I/O吞吐量模型,来检测软件程序的异常。
论文“参考驱动的性能异常识别”(Kai Shen等,SIGMETRICS/Performance’09-第11届计算机系统测量和建模国际联合会议的会议录(Proceedings of the 11th International Joint Conference onMeasurement and Modeling of Computer Systems),v 37,n 1,p 85-96,200)公开了一种方法,其基于改变特征描述(profile)来识别性能异常,该改变特征描述表征了目标和参考执行之间的性能偏差。
发明内容
说明性实施例提供了一种用于检测一应用的无进展(no progress)状态的方法、系统和计算机可用程序产品。一实施例监视一组应用的资源使用和输出。这组应用包括所述应用。所述应用在一数据处理系统中执行。该实施例测量资源使用和输出,以确定在第一时间的资源使用值和输出值。该实施例确定资源使用值是否包含在资源使用刻度的子范围内,以及输出值是否包含在输出刻度的子范围内,其中,该资源使用刻度的子范围对应于该输出刻度的子范围。如果该确定是否定的,则该实施例检测到所述应用的无进展状态。
在另一实施例中,在一监视阶段执行所述监视。该实施例还包括选择所述一组应用。该实施例配置一组数据处理系统,以用于这组应用的正常操作。这组数据处理系统包括所述数据处理系统。该实施例在训练阶段测量这组应用在预定间隔(interval)的正常资源使用和正常输出。该实施例确定在训练阶段中的资源使用范围中的第一组阈值,从而在该第一组阈值的阈值之间形成一组资源使用子范围。该实施例确定在训练阶段中的输出范围中的第二组阈值,从而在该第二组阈值的阈值之间形成一组输出子范围。该实施例将资源使用子范围映射到输出子范围。
在另一实施例中,所述映射指示,当所述一组应用中没有应用处于无进展状态时,对于给定资源使用测量所期望的输出测量。
在另一实施例中,所述一组资源使用子范围中的一资源使用子范围被映射到所述一组输出子范围中的多于一个输出子范围。
另一实施例还通知第二应用关于该应用的无进展状态。
另一实施例还使用第二应用来防止该应用继续在无进展状态中执行。
在另一实施例中,其使用被测量的资源是应用所使用的数据处理系统的计算资源。
在另一实施例中,所述第一时间在监视阶段内。
在另一实施例中,当所述资源使用值包含在所述资源使用刻度的子范围内、而所述输出值超过相应的输出刻度的子范围时,检测到该应用处于无进展状态中。
附图说明
现在将参照附图仅作为示例来描述本发明的优选实施例,在附图中:
图1示出了说明性实施例可在其中实现的数据处理系统的网络的图形表示;
图2示出了说明性实施例可在其中实现的数据处理系统的框图;
图3示出了应用操作的一般原理的框图,说明性实施例可以针对所述应用来实现;
图4示出了根据说明性实施例应用在训练阶段消耗的资源和输出之间的关系的框图;
图5示出了根据说明性实施例由监视应用维护的映射;
图6示出了根据说明性实施例应用在监视阶段消耗的资源和输出之间的关系的框图;
图7示出了根据说明性实施例对监视应用进行训练以检测应用的无进展状态的过程的流程图;以及
图8示出了根据说明性实施例检测应用的无进展状态的过程的流程图。
具体实施方式
本发明的实施例发现,在某些情况下,不希望应用继续执行,即使应用还没有进入错误状态。“无进展状态”就是这样一种应用的执行状态。无进展状态是应用的执行状态,其中,应用继续消耗或保留资源,而不会产生合适或期望的输出。
例如,本发明的实施例发现,应用可能在一段延长的时间中继续等待特定的资源变得可用。在等待时,该应用可继续锁定或消耗其他资源,而不产生任何输出,或者产生低于预期或阈值的输出量。换句话说,应用可处于无进展状态中。
由于应用在等待时不产生错误或进入错误状态,操作系统可认为该应用是健康的并允许应用继续在无进展状态中执行。本发明的实施例发现,允许这样的无进展状态不被检测到,会浪费计算资源并可能甚至降低整体系统性能。
作为另一个例子,本发明发现,应用会包含错误,其导致消耗大量处理器周期的计算而不产生结果。再次地,应用可在无进展状态中执行。再次地,操作系统可认为应用是健康的,因为应用简单地保持执行计算而不进入错误状态。本发明发现,允许这样的无进展状态不被检测到,会浪费计算资源并可能甚至降低整体系统性能。
本发明的实施例发现,应用可能会因为多种其他原因而进入到无进展状态。能引起应用的无进展状态的某些其他的原因可以是软件中的错误(bug)、应用配置中的错误、以及系统资源的过载。
本发明的实施例还发现,如果应用中的算法在大多数场景下和预期一样地执行,但应用经过某个场景,其中算法是低效的,则应用也会进入无进展状态。在本发明的实施例所处理的无进展状态中,应用可取得进展并产生输出,但是这样的进展或输出低于阈值。在本发明的实施例所处理的无进展状态的另一变化中,应用在定义的时段中不会产生任何输出或取得任何进展。在本发明的实施例所处理的无进展状态的另一变化中,应用最终可取得进展并产生结果,但这样的进展是在消耗了大于阈值或以其他方式不可接受的时间或资源量之后才实现的。
本发明的实施例还发现,仅监视应用的输出水平对于检测应用的无进展状态来说可能也是不够的。例如,应用的输出通常受对应用的需求所影响。与应用的交互越多,一般可期望输出成比例地增加。相反,低于阈值水平的输出可能只表示与应用的或应用内的低水平的活动,而不是必然表示应用的无进展状态。
用来描述本发明的说明性实施例一般地处理和解决了与数据处理系统中执行的应用的无进展状态相关的上述问题和其他问题。说明性实施例提供了一种用于检测应用的无进展状态的方法、计算机可用程序产品以及数据处理系统。
本发明的实施例可实现检测消耗或保留资源而不产生所需结果的应用。实施例可启用现有的错误状态检测功能,以同时成功地检测应用的无进展状态。实施例可以被集成到这种现有功能中或可以与之结合来操作。
仅作为示例,说明性实施例将针对数据、数据结构和标识符来描述。这样的描述不是要限制本发明。例如,针对网络服务器所输出的页面数来描述的说明性实施例,可以在本发明范围内以类似方式使用数据库所服务的查询数来实现。
此外,说明性实施例可以针对任何类型的数据处理系统来实现。例如,针对多处理器独立数据处理系统来描述的说明性实施例,可以在本发明范围内在多处理器逻辑分区系统中实现。
仅作为示例,说明性实施例将针对某些参数、属性或配置来描述。这样的描述不是要限制本发明。本发明的实施例可以针对任何类型的数据处理系统(例如,任何类型的客户机系统、服务器系统、平台或其组合)来实现。
实现实施例的应用可以采用数据对象、代码对象、封装指令、应用片段、服务和在数据处理环境中可用的其他类型的软件实现的形式。例如,Java
Figure BDA00002241740200061
虚拟机(JVM
Figure BDA00002241740200062
)、Java
Figure BDA00002241740200063
对象、企业级Java Bean(EJB)、小服务程序(servlet)或小应用程序(applet)可以是应用的表现形式(manifestation),本发明可以针对该应用、在其中、或使用它来实现。(Java、JVM、EJB和其他Java相关的术语是太阳微系统公司在美国和其他国家的注册商标)。
说明性实施例可以以硬件、软件或其组合来实现。本公开中的例子只是为了描述清楚,而不是要限制说明性实施例。为了类似的目的,其他或不同的信息、数据、操作、动作、任务、活动和操纵可由本公开想到,并且它们被认为是在说明性实施例的范围内。
说明性实施例将使用特定的代码、数据结构、文件系统、设计、架构、布局、图表和工具来描述,这些仅作为示例而不是要限制说明性实施例。此外,仅作为示例,为了描述清楚,在某些实例中,说明性实施例使用特定的数据处理环境来描述。说明性实施例可以和其他可比或类似目的的结构、系统、应用或架构结合来使用。
这里列出的任何优势仅是示例而不是要限制说明性实施例。其他或不同的优势可通过特定的说明性实施例来实现。此外,特定的说明性实施例可以具有某些、全部或没有上面列出的优势。
参考附图特别是参考图1和2,这些图是说明性实施例可以在其中实现的数据处理系统的示例图。图1和2仅是示例而不是要断言或隐含对环境的限制,不同的实施例将在所述环境中实现。基于下列描述,特定的实现可以对示出的情况进行很多修改。
图1示出了说明性实施例可以在其中实现的数据处理系统的网络的图形表示。数据处理环境100是说明性实施例可以在其中实现的计算机网络。数据处理环境100包括网络102。网络102是用来提供数据处理环境100中互连的各种设备和计算机之间的通信链路的介质。网络102可以包括连接,例如有线、无线通信链路或光缆。服务器104和服务器106和存储单元108一起耦合到网络102。软件应用可以在数据处理环境100中的任何计算机上执行。
此外,客户机110、112和114耦合到网络102。数据处理系统,例如服务器104或106或客户机110、112或114,可以包含数据,且可以具有在其上执行的软件应用或软件工具。
服务器104可以包括应用105。服务器106可以包括监视应用107。监视应用107可以包括本发明的实施例的实现。
服务器104和106、存储单元108和客户机110、112和114可以使用有线连接、无线通信协议或其他合适的数据连接来耦合到网络102。客户机110、112和114可以是,例如,个人计算机或网络计算机。
在示出的例子中,服务器104可以向客户机110、112和114提供数据,例如引导文件、操作系统映像和应用。在该例子中,客户机110、112和114可以是服务器104的客户机。客户机110、112、114或其某个组合可以包括其自身的数据、引导文件、操作系统映像和应用。数据处理环境100可以包括其他未示出的服务器、客户机或其他设备。
在示出的例子中,数据处理环境100可以是因特网。网络102可以表示使用传输控制协议/网际协议(TCP/IP)和其他协议以互相通信的的网络和网关的集合。因特网的核心是包括成千上万商业、政府、教育和其他计算机系统的主要节点或主计算机之间的、路由数据和消息的数据通信链路的主干。当然,数据处理环境100还可以实现为若干不同类型的网络,例如内联网、局域网(LAN)或广域网(WAN)。图1仅作为例子,而不是对不同说明性实施例的架构限制。
除其他使用之外,数据处理环境100可以被用于实现客户机服务器环境,说明性实施例可以在其中实现。客户机服务器环境使得软件应用和数据能够在网络中分布,从而应用通过使用客户机数据处理系统和服务器数据处理系统之间的交互来操作。数据处理环境100还可以使用面向服务的架构,其中,在网络中分布的可互操作的软件组件可以被打包在一起,作为一致(coherent)的商业应用。
参考图2,该图示出了数据处理系统的框图,说明性实施例可以在该数据处理系统中实现。数据处理系统200是计算机(例如图1中的服务器104或客户机110)的例子,实现进程的计算机可用程序代码或指令可位于其中,以用于说明性实施例。
在示出的例子中,数据处理系统200使用中心(hub)架构,其包含北桥和存储器控制器中心(NB/MCH)202以及南桥和输入/输出(I/O)控制器中心(SB/ICH)204。处理单元206、主存储器208和图形处理器210耦合到北桥和存储器控制器中心(NB/MCH)202。处理单元206可以包含一个或多个处理器,并可以使用一个或多个异构处理器系统来实现。在某些实现中,图形处理器210可以通过加速图形端口(AGP)耦合到NB/MCH。
在示出的例子中,局域网(LAN)适配器212耦合到南桥和I/O控制器中心(SB/ICH)204。音频适配器216、键盘和鼠标适配器220、调制解调器222、只读存储器(ROM)224、通用串行总线(USB)和其他端口232、PCI/PCIe设备234通过总线238耦合到南桥和I/O控制器中心204。硬盘驱动器(HDD)226和CD-ROM 230通过总线240耦合到南桥和I/O控制器中心204。PCI/PCIe设备可以包括,例如,以太网适配器、插入卡、用于笔记本电脑的PC卡。PCI使用卡总线控制器,而PCIe不使用。ROM224可以是,例如,闪存二进制输入/输出系统(BIOS)。硬盘驱动器226和CD-ROM 230可以使用例如集成驱动电子设备(IDE)或串行高级技术附件(SATA)接口。超级I/O(SIO)设备236可以耦合到南桥和I/O控制器中心(SB/ICH)204。
操作系统在处理单元206上运行。操作系统协调并提供对图2的数据处理系统200中的各个组件的控制。操作系统可以是商业可用的操作系统例如Microsoft
Figure BDA00002241740200091
Windows
Figure BDA00002241740200092
(Microsoft和Windows是微软公司在美国和其他国家的注册商标)或Linux(Linux是Linus Torvalds在美国和其他国家的注册商标)。面向对象的编程系统,例如JavaTM编程系统,可以和操作系统一起运行,并提供从数据处理系统200上执行的JavaTM程序或应用到操作系统的调用(Java是太阳微系统公司在美国和其他国家的注册商标)。
用于操作系统、面向对象的编程系统和应用或程序的指令位于存储设备(例如磁盘驱动226)上,并可以被载入到主存储器208,以被处理单元206执行。说明性实施例的过程可以由处理单元206使用计算机实现的指令来执行,所述指令可以位于存储器(例如主存储器208、只读存储器224)或一个或多个外围设备中。
图1-2中的硬件可基于实现而变化。其他内部硬件和外围设备,例如闪存、等效的非易失性存储器或光盘驱动器等,可以补充或替换图1-2中示出的硬件。此外,说明性实施例的过程可以被应用于多处理器数据处理系统。
在某些说明性例子中,数据处理系统200可以是个人数字助理(PDA),其通常配置了闪存来提供非易失性存储器,以用于存储操作系统文件和/或用户生成的数据。总线系统可包括一条或多条总线,例如系统总线、I/O总线和PCI总线。当然,总线系统可以用任何类型的通信结构或架构(其提供了附着到该结构或架构的不同组件或设备之间的数据传输)来实现。
通信单元可以包括一个或多个用来发送和接收数据的设备,例如调制解调器或网络适配器。存储器可以是,例如,主存储器208,或高速缓存,例如在北桥和存储器控制器中心202中出现的高速缓存。处理单元可以包括一个或多个处理器或CPU。
在图1-2中描述的例子和上述例子不是要表示架构的限制。例如,数据处理系统200除了采取PDA形式外,还可以是平板计算机、膝上型计算机、或电话设备。
参考图3,该图示出了应用操作的一般原理的框图,说明性实施例可以针对所述应用来实现。应用302可以类似于图1中的应用105。
应用302消耗一组资源304并产生一组输出306。一组资源是在执行计算时消耗的任何数量的一种或多种资源。处理器周期、存储器空间、网络带宽、数据和电能是资源304的例子。资源304是应用302消耗的资源。根据实施例的“消耗的资源”包括应用实际消耗、使用或利用的那些资源,以及应用锁定、保留或以其他方式保持以便当前或未来使用的那些资源。
一组输出是应用的任何类型的一个或多个输出。发送的数据、存储的数据、记录的条目、发送的通知、发布的数据、产生的打印输出、显示的信息以及操纵的信息是数据处理系统中执行的应用的可能的输出306的一些例子。
参考图4,该图示出了根据说明性实施例应用在训练阶段消耗的资源和输出之间的关系的框图。该图中示出的测量和测量刻度可以是实现本发明的实施例的监视应用(例如图1中的监视应用107)的结果。
根据实施例的监视应用观察或监视在数据处理系统中执行的一组示例应用在训练阶段消耗的资源和产生的输出。一组应用是在相同或不同数据处理系统中执行的一个或多个应用中的全部或部分。在本发明的范围内,一组应用可包括与一应用相关的一些进程,并排除与一应用相关的其他进程。由此,一组应用可包括一个或多个进程、线程或与在一个或多个数据处理系统中执行的一个或多个应用相关的可执行体(executable)。
当组中的一应用在与另一应用的数据处理系统不同的数据处理系统上执行时,如果第一应用的执行对第二应用的执行有某些影响,则两个应用属于一组应用。例如,一组中的两个应用可在不同的数据处理系统上执行,但与这两个应用相关的某些进程可针对网络上的公共资源进行竞争。
训练阶段是应用被认为如预期一样操作的时间段。换句话说,在训练阶段,应用的行为是可预测的或者如在应用执行的已知情况下规定的那样,且应用不处于无进展状态。训练阶段可以是一个或多个连续或不连续的时段。
根据实施例的监视应用在资源使用刻度402上绘制该组应用在训练阶段消耗的资源。监视应用在输出刻度404上绘制该组应用在训练阶段产生的输出。
从端到端,资源使用刻度402示出了该组应用在训练阶段的资源使用的范围。在资源使用刻度402上示出的范围可以通过容量(volume)、计数、时间流逝(elapse)或另一合适的度量单位来度量。类似地,从端到端,输出刻度404示出了该组应用在训练阶段产生的输出的范围。输出刻度404示出的范围可以由容量、计数、频率或另一合适的度量单位来度量。
监视应用可以在刻度402和404中创建任何数量的子范围。子范围是两个阈值之间的范围的部分。
例如,图4示出了包含三个子范围的资源使用刻度402。第一示例子范围位于范围起点和较低阈值406之间并包含该范围起点和较低阈值406。第二示例子范围位于较低阈值406之后,直到并包含较高阈值408。第三示例子范围位于较高阈值408之后,直到并包含范围终点。
图4还示出了,例如,输出刻度404包含三个子范围。输出刻度404的第一示例子范围位于输出刻度404的范围起点和较低阈值410之间并包含该范围起点和较低阈值410。输出刻度404的第二示例子范围位于较低阈值410之后,直到并包含较高阈值412。输出刻度404的第三示例子范围位于较高阈值412之后,直到并包含输出刻度404的范围终点。
在绘制训练阶段中的资源使用和输出生成之后,监视应用可以将资源使用刻度402的子范围映射到输出刻度404的子范围。例如,资源使用刻度402的第一子范围可以对应于输出刻度404的第一子范围。换句话说,在训练阶段中,监视应用指示了,当该组应用在消耗资源使用刻度402的第一子范围内的资源时,该组应用产生输出刻度404的第一子范围内的输出。
资源使用刻度402的第二子范围可类似地对应于输出刻度404的第二子范围。资源使用刻度404的第三子范围可类似地对应于输出刻度404的第三子范围。以这种方式将资源使用刻度402的子范围映射到输出刻度404,使得监视应用能够创建一组应用的操作的特征描述。
通常,资源使用刻度402的子范围可对应于输出刻度404的任何一个或多个子范围。换句话说,一个刻度上的一个子范围可对应于另一刻度上的任何数量的子范围。此外,刻度上的子范围每个可以是任何大小而没有限制,且不需要彼此相等或成比例。
此外,在本发明的范围内,不同刻度上的子范围可互相对应,但可以有相同或不同的大小。在一个实施例中,子范围可以不是范围而是刻度上的特定值。
参考图5,该图示出了根据说明性实施例由监视应用维护的映射。表500可以是存储如图4的示例中所示的子范围映射的示例方法。在该实现中,表500可以被记录一组应用的资源使用子范围和输出子范围的映射的任何其他合适的形式来替换。
作为示例,表500可以为一组或多组应用或应用、进程、线程、可执行体的其他组合来存储资源使用子范围和输出子范围的映射。表500可以在列502中存储资源使用子范围信息,在列504中存储输出子范围信息,并在列506中存储对应的该组应用的信息例如标识符。
表500中的一行数据构成了给定一组应用的一个映射。表500可以为特定的一组应用维护一行或多行映射。
为了清楚描述说明性实施例,表500示出了某些示例的映射。行508示出了针对仅包含应用“应用1”的一组应用、从资源使用刻度的子范围的标识符“低阈值1”到输出刻度的子范围的标识符“低输出阈值1”的映射。作为另一个例子,行510针对示出了包含应用“应用2”、应用“应用3”和进程“进程4”的一组应用、从资源使用刻度的子范围的标识符“低阈值2”到输出刻度的子范围的标识符“高输出阈值2”的映射。
子范围和各组应用由图5中的示例标识符来表示。子范围或一组应用可以用任何适于实现的方式在表500中表示。此外,注意到,针对不同组的应用,被标识和映射的子范围可以位于不同的刻度上。针对给定的一组应用,一个刻度上的单个子范围可以映射到另一相应刻度上的多于一个子范围。
在本发明的范围内,表500示出具有映射的其他示例变体的其他行。表500的结构和示例映射不是要限制本发明。表500可以包括任何数量的行、不同的列、以及存储类似映射信息的不同方式。从本公开中,映射的许多其他变体对于本领域普通技术人员将变得明显,且被认为是在本发明的范围内。
例如,在一个实施例中,多行可以为同一组应用但在不同条件下提供多个映射。在表500中可以使用另外的一列或多列来标识这样的条件。这样的列能允许选择合适的行,以用于比较以后类似条件下组的性能。
在某些情况中,表500可以完全不被实现。例如,在一个实施例中,该表可以用基于训练阶段的资源使用和输出数据来创建的一组规则来替换。例如,默认规则可以是,当资源使用有N个间隔且输出水平有N个间隔时,根据测量的排序列表来匹配资源使用测量和输出测量。另一个示例规则可以将资源使用的间隔N中的测量与输出中不低于N的任何间隔进行匹配。根据本公开,许多其他的规则将变得明显,并被认为是在本发明的范围内。
此外,由于表500可以以各种方式来实现,或可以完全不存在,“映射”是指根据本发明的实施例的确定资源使用数据和输出数据之间的对应的任何方法或技术。例如,映射可以采用在规则中实现的一组逻辑指令的形式,所述一组逻辑指令将资源使用测量与输出测量相关联。
参考图6,该图示出了根据说明性实施例应用在监视阶段消耗的资源和输出之间的关系的框图。在该图中示出的测量和测量刻度可以和图4中的相应刻度类似。
根据实施例的监视应用观察或监视在数据处理系统中执行的一组示例应用在监视阶段中消耗的资源和产生的输出。监视阶段是期望其中有应用的无进展状态的一段时间。换句话说,应用的行为在应用执行的当时存在(then-existing)的情况下被监视,且实施例检测应用在监视阶段中是否处于无进展状态。监视阶段可以是一个或多个连续或不连续的时段。
根据实施例的监视应用在资源使用刻度602上绘制该组应用在监视阶段消耗的资源。监视应用在输出刻度604上绘制该组应用在监视阶段产生的输出。
从端到端,资源使用刻度602表示该组应用在训练阶段使用的资源的范围。类似地,从端到端,输出刻度604表示该组应用在训练阶段产生的输出的范围。为了描述清楚且仅作为示例,资源使用刻度602和输出刻度604的第一、第二和第三示例子范围位于相应刻度上,并互相映射,如图4所描述的。
在监视阶段的某个点,监视应用可以确定,该组应用的当前资源使用对应于刻度602上的标记606示出的位置。在所指示的资源使用的期间,该组应用产生的输出对应于刻度604上的标记608所示出的位置。
仅作为示例,标记606和608图形地表示在图形刻度上。在本发明的范围内,标记、子范围以及刻度都可以用任何合适的方式来表示,例如用数值表示。
假设,继续图4中的例子,标记606占据的子范围对应于刻度604的高阈值和终点之间的子范围。监视应用观察到,标记606和608没有占据在训练阶段中映射的对应子范围。基于该示例观察,监视应用能确定这组应用可能处于无进展状态。例如,如标记606和608所示,这组应用看来在监视阶段中针对被消耗的资源量产生了低于期望的输出。在某些组应用中的这种行为可以表明,该组中的一个或多个应用或进程已进入了无进展状态。
要处于无进展状态,一组应用不是必须针对给定资源使用产生低于期望的输出。例如,针对这组应用,标记610和612可以指示另一资源使用和相应的输出生成。根据标记610和612,该组看来消耗了少量的资源但产生了大量的输出。基于该组中的应用的某些特征,可能推导出一应用处于无进展状态,且标记612处的输出测量源于由此引起的大量的日志或调试数据被输出。
参考图7,该图示出了根据说明性实施例对监视应用进行训练以便检测应用的无进展状态的过程的流程图。过程700可以在监视应用例如图1的监视应用107中实现。
过程7开始于选择一组应用(步骤702)。过程700将数据处理系统配置为用于该组的正常操作配置(步骤704)。例如,在步骤704中,过程700可启动被期望在正常操作中与这组应用同时操作的其他进程。作为另一个例子,过程700可以关闭无关的进程,只留下这组应用和最小的系统服务操作,以最小化资源使用和输出数据的噪声。有助于创建如图4和5所示的刻度、子范围和映射的任何合适的配置可以在步骤704中被配置,而没有限制。
过程700在训练阶段中例如以预定的间隔来测量该组的资源使用和输出(步骤706)。例如,过程700可针对特定的一组应用以1秒的间隔来进行测量,而针对另一组以1分钟的间隔来进行测量。过程700还可以将测量与系统心跳率或其他合适的时段或间隔同步。
过程700确定在训练阶段中资源使用范围中的一组阈值(步骤708)。过程700确定在训练阶段中的资源使用范围中的一组阈值(步骤708)。过程700确定在训练阶段中的输出范围中的一组阈值(步骤710)。所述阈值标记了本公开中其他地方描述的资源使用和输出的子范围的起点和终点。
过程700创建资源使用的子范围和输出的子范围之间的一个或多个映射(步骤712)。过程700然后结束。
参考图8,该图示出了根据说明性实施例检测应用的无进展状态的过程的流程图。过程800可以在监视应用例如图1的监视应用107中实现。
过程800开始于监视一组应用的资源使用和产生的输出(步骤802)。过程800在监视阶段的一个点上确定资源使用和输出的测量(步骤804)。过程800将该资源使用和输出与用于被监视的这组应用的资源使用和输出的子范围之间的映射进行比较(步骤806)。
过程800确定所测量的当前资源使用和输出是否与映射的子范围匹配或对应(步骤808)。如果测量的资源使用和输出确实对应于映射的子范围(步骤808的“是”分支),过程800回到步骤804并继续监视该组。
如果测量的资源使用和输出不对应映射的子范围(步骤808的“否”分支),过程808检测到这组应用的至少某个组成部分的无进展状态(步骤810)。过程800然后可结束或回到步骤804继续监视该组。过程800可以通知、日志记录、记录或以其他方式发布或传播该检测结果。
上述框图中的组件和流程图中的步骤仅作为示例。这些组件和步骤是为了描述清楚而选择的,而不是限制本发明的说明性实施例。例如,特定的实现可以组合、忽略、进一步细分、修改、扩大、减少或以其他方式实施任何组件或步骤,而不脱离说明性实施例的范围。而且,在本发明的范围中,以上描述的过程的步骤也可以不同于顺序而被执行。
因此,在说明性实施例中提供了一种计算机执行的方法、设备和计算机程序产品,其用于检测在数据处理系统中执行的应用的无进展状态。使用本发明的实施例,数据处理系统可识别可能进入了不希望状态而未指示错误的应用。检测这样的应用或其部分可允许数据处理系统对应用执行管理行动并以改善的资源使用效率来操作。
本发明可采取完全的软件实施例或包含硬件和软件元件的实施例的形式。在优选的实施例中,本发明在软件或程序代码(其包括但不限于固件、驻留软件和微代码)中实施。
而且,本发明可采取可从计算机可用或计算机可读的介质访问的计算机程序产品的形式,所述计算机可用或计算机可读的介质提供程序代码以供计算机或任何指令执行系统使用或与之相关地使用。在本说明书中,计算机可用或计算机可读介质可以是任何有形的装置,其包括、存储、通信、传播或传递程序以供指令执行系统、装置或设备使用或与之相关地使用。
所述介质可以是电的、磁的、光的、电磁的、红外线的、或半导体的系统(或装置或器件)或传播介质。计算机可读介质的例子包括半导体或固态存储器、磁带、可拆装计算机软盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘以及光盘。光盘的当前例子包括紧致盘-只读存储器(CD-ROM)、紧致盘-读/写(CD-R/W)以及DVD。
而且,计算机存储介质可包含或存储计算机可读程序代码,这样当在计算机上执行计算机可读程序代码时,该计算机可读程序代码的执行使得计算机通过通信链路传输另一个计算机可读程序码。该通信链路可使用例如但不限于是物理或无线的介质。
适用于存储和/或执行程序代码的数据处理系统将包括至少一个通过系统总线直接或间接耦合到存储器元件的处理器。存储器元件可包括在程序代码的实际执行期间使用的本地存储器、大容量存储介质以及高速缓冲存储器,其提供至少一些程序代码的临时存储以便减少在实际执行时必须从大容量存储介质取回代码的次数。
数据处理系统可用作服务器数据处理系统或客户机数据处理系统。服务器和客户机数据处理系统可包括计算机可用的(例如计算机可读的)数据存储介质。与服务器数据处理系统关联的数据存储介质可包括计算机可用代码。客户机数据处理系统可下载该计算机可用代码,诸如用于存储在与客户机数据处理系统关联的数据存储介质上,或用于客户机数据处理系统中。服务器数据处理系统可类似地从客户机处理系统上传计算机可用代码。以这种方式,可使用服务器和客户机数据处理系统上传或下载产生于说明性实施例的计算机可用程序产品实施例的计算机可用代码。
输入/输出或I/O设备(包括但不限于键盘、显示器、指点设备等)可直接或通过介入的I/O控制器而耦合到系统。
网络适配器也可耦合到系统以使得数据处理系统通过介入的专用网或公共网耦合到其他的数据处理系统或远程打印机或存储设备。调制解调器、电缆调制解调器和以太网卡仅是一些当前可用的网络适配器类型。
为了说明和描述的目的已给出了对本发明的描述,且不旨在是穷尽的或限于所公开的发明形式。对本来普通技术人员来说很多修改和变化是明显的。选择并描述实施例是为了解释本发明的原理、实际应用,并使得本领域普通技术人员能理解本发明的具有适于所考虑的特殊用途的各种变化的各种实施例。

Claims (29)

1.一种用于检测一应用的无进展状态的计算机实现的方法,该计算机实现的方法包括:
监视一组应用的资源使用和输出,这组应用包括所述应用,所述应用在一数据处理系统中执行;
测量资源使用和输出,以确定在第一时间的资源使用值和输出值;
确定资源使用值是否包含在资源使用刻度的子范围内,以及输出值是否包含在输出刻度的子范围内,其中,该资源使用刻度的子范围对应于输出刻度的子范围;以及
响应于该确定是否定的,检测到所述应用的无进展状态。
2.如权利要求1所述的计算机实现的方法,其中,所述监视是在监视阶段执行的,还包括:
选择所述一组应用;
配置一组数据处理系统,以用于这组应用的正常操作,该组数据处理系统包括所述数据处理系统;
在训练阶段中的预定间隔中测量这组应用的正常资源使用和正常输出;
确定在训练阶段中的资源使用范围中的第一组阈值,从而在该第一组阈值的阈值之间形成一组资源使用子范围;
确定在训练阶段中的输出范围中的第二组阈值,从而在该第二组阈值的阈值之间形成一组输出子范围;以及
将资源使用子范围映射到输出子范围。
3.如权利要求2所述的计算机实现的方法,其中,所述映射指示,当所述一组应用中没有一个应用处于无进展状态时,对于给定资源使用测量所期望的输出测量。
4.如权利要求2所述的计算机实现的方法,其中,所述一组资源使用子范围中的一资源使用子范围映射到所述一组输出子范围中的多于一个输出子范围。
5.如权利要求1所述的计算机实现的方法,还包括:
通知第二应用关于所述应用的无进展状态。
6.如权利要求1所述的计算机实现的方法,还包括:
使用第二应用来防止所述应用继续在无进展状态中执行。
7.如权利要求1所述的计算机实现的方法,其中,其使用被测量的资源是应用所使用的数据处理系统中的计算资源。
8.如权利要求1所述的计算机实现的方法,其中,所述第一时间在监视阶段内。
9.如权利要求1所述的计算机实现的方法,其中,当所述资源使用值包含在资源使用刻度的子范围内、而输出值超出相应的输出刻度的子范围时,检测到所述应用处于无进展状态中。
10.一种计算机可用程序产品,包括计算机可用存储介质,其中包含用于检测应用的无进展状态的计算机可用代码,该计算机可用代码包括:
用于监视一组应用的资源使用和输出的计算机可用代码,这组应用包括所述应用,所述应用在数据处理系统中执行;
用于测量资源使用和输出,以确定在第一时间的资源使用值和输出值的计算机可用代码;
用于确定资源使用值是否包含在资源使用刻度的子范围内,以及输出值是否包含在输出刻度的子范围内的计算机可用代码,其中,该资源使用刻度的子范围对应于输出刻度的子范围;以及
用于响应于该确定是否定的,检测到所述应用的无进展状态的计算机可用代码。
11.如权利要求10所述的计算机可用程序产品,其中,所述监视是在监视阶段执行的,还包括:
用于选择所述一组应用的计算机可用代码;
用于配置一组数据处理系统,以用于这组应用的正常操作的计算机可用代码,该组数据处理系统包括所述数据处理系统;
用于在训练阶段中的预定间隔中测量这组应用的正常资源使用和正常输出的计算机可用代码;
用于确定在训练阶段中的资源使用范围中的第一组阈值,从而在该第一组阈值的阈值之间形成一组资源使用子范围的计算机可用代码;
用于确定在训练阶段中的输出范围中的第二组阈值,从而在该第二组阈值的阈值之间形成一组输出子范围的计算机可用代码;以及
用于将资源使用子范围映射到输出子范围的计算机可用代码。
12.如权利要求11所述的计算机可用程序产品,其中,所述映射指示,当所述一组应用中没有一个应用处于无进展状态时,对于给定资源使用测量所期望的输出测量。
13.如权利要求11所述的计算机可用程序产品,其中,所述一组资源使用子范围中的一资源使用子范围映射到一组输出子范围中的多于一个输出子范围。
14.如权利要求10所述的计算机可用程序产品,还包括:
通知第二应用关于所述应用的无进展状态。
15.如权利要求10所述的计算机可用程序产品,还包括:
使用第二应用来防止所述应用继续在无进展状态中执行。
16.如权利要求10所述的计算机可用程序产品,其中,其使用被测量的资源是应用所使用的数据处理系统中的计算资源。
17.如权利要求10所述的计算机可用程序产品,其中所述第一时间在监视阶段内。
18.如权利要求10所述的计算机可用程序产品,其中,当所述资源使用值包含在资源使用刻度的子范围内、而输出值超出相应的输出刻度的子范围时,检测到所述应用处于无进展状态中。
19.如权利要求10所述的计算机可用程序产品,其中,所述计算机可用代码被存储在数据处理系统的计算机可读存储介质中,并且其中,所述计算机可用代码通过网络从远程数据处理系统传送。
20.如权利要求10所述的计算机可用程序产品,其中,所述计算机可用代码被存储在服务器数据处理系统的计算机可读存储介质中,并且其中,所述计算机可用程序代码通过网络被下载到远程数据处理系统中,以在与该远程数据处理系统相关的计算机可读存储介质中使用。
21.一种用于检测一应用的无进展状态的数据处理系统,该数据处理系统包括:
包含存储介质的存储设备,其中该存储设备存储计算机可用程序代码;以及
处理器,其中,该处理器执行计算机可用程序代码,且其中,该计算机可用程序代码包括:
用于监视一组应用的资源使用和输出的计算机可用代码,这组应用包括所述应用,所述应用在数据处理系统中执行;
用于测量资源使用和输出,以确定在第一时间的资源使用值和输出值的计算机可用代码;
用于确定资源使用值是否包含在资源使用刻度的子范围内,以及输出值是否包含在输出刻度的子范围内的计算机可用代码,其中,该资源使用刻度的子范围对应于输出刻度的子范围;以及
用于响应于该确定是否定的,检测到所述应用的无进展状态的计算机可用代码。
22.如权利要求21所述的数据处理系统,其中所述监视是在监视阶段执行的,还包括:
用于选择所述一组应用的计算机可用代码;
用于配置一组数据处理系统,以用于这组应用的正常操作的计算机可用代码,该组数据处理系统包括所述数据处理系统;
用于在训练阶段中的预定间隔中测量这组应用的正常资源使用和正常输出的计算机可用代码;
用于确定在训练阶段中的资源使用范围中的第一组阈值,从而在该第一组阈值的阈值之间形成一组资源使用子范围的计算机可用代码;
用于确定在训练阶段中的输出范围中的第二组阈值,从而在该第二组阈值的阈值之间形成一组输出子范围的计算机可用代码;以及
用于将资源使用子范围映射到输出子范围的计算机可用代码。
23.如权利要求22所述的数据处理系统,其中所述映射指示,当所述一组应用中没有一个应用处于无进展状态时,对于给定资源使用测量所期望的输出测量。
24.如权利要求22所述的数据处理系统,其中所述一组资源使用子范围中的一资源使用子范围映射到一组输出子范围中的多于一个输出子范围。
25.如权利要求21所述的数据处理系统,还包括:
通知第二应用关于所述应用的无进展状态。
26.如权利要求21所述的数据处理系统,还包括:
使用第二应用来防止所述应用继续在无进展状态中执行。
27.如权利要求21所述的数据处理系统,其中,其使用被测量的资源是应用所使用的数据处理系统中的计算资源。
28.如权利要求21所述的数据处理系统,其中所述第一时间在监视阶段内。
29.如权利要求21所述的数据处理系统,其中当所述资源使用值包含在资源使用刻度的子范围内、而输出值超出相应的输出刻度的子范围时,检测到所述应用处于无进展状态中。
CN201180018496.XA 2010-04-16 2011-04-14 检测应用的无进展状态 Expired - Fee Related CN102822806B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/762,226 2010-04-16
US12/762,226 US8397106B2 (en) 2010-04-16 2010-04-16 Detecting no progress state of an application
PCT/EP2011/055928 WO2011128411A1 (en) 2010-04-16 2011-04-14 Detecting no progress state of an application

Publications (2)

Publication Number Publication Date
CN102822806A true CN102822806A (zh) 2012-12-12
CN102822806B CN102822806B (zh) 2015-11-25

Family

ID=43928410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180018496.XA Expired - Fee Related CN102822806B (zh) 2010-04-16 2011-04-14 检测应用的无进展状态

Country Status (6)

Country Link
US (1) US8397106B2 (zh)
JP (1) JP5657096B2 (zh)
CN (1) CN102822806B (zh)
DE (1) DE112011100242T8 (zh)
GB (1) GB2492717B (zh)
WO (1) WO2011128411A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106415583A (zh) * 2014-01-22 2017-02-15 英派尔科技开发有限公司 通过现场可编程门阵列的电压测量结果来检测恶意软件

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023085628A1 (ko) * 2021-11-15 2023-05-19 삼성전자 주식회사 어플리케이션의 실행 성능을 개선하는 전자 장치 및 그 동작 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993681B2 (en) * 2002-04-15 2006-01-31 General Electric Corporation Remote administration in a distributed system
US20090199196A1 (en) * 2008-02-01 2009-08-06 Zahur Peracha Automatic baselining of resource consumption for transactions

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3019A (en) * 1843-03-30 Hatching chickens
US8002A (en) * 1851-03-25 Upright pianoforte
US9019A (en) * 1852-06-15 Charles fleischbl
JP3922375B2 (ja) 2004-01-30 2007-05-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 異常検出システム及びその方法
JP4230946B2 (ja) * 2004-03-19 2009-02-25 富士通株式会社 アプリケーション監視装置、そのプログラム、及びその記録媒体。
US20070028219A1 (en) 2004-10-15 2007-02-01 Miller William L Method and system for anomaly detection
JP2006146668A (ja) * 2004-11-22 2006-06-08 Ntt Data Corp 運用管理支援装置及び運用管理支援プログラム
US9135074B2 (en) * 2005-05-19 2015-09-15 Hewlett-Packard Development Company, L.P. Evaluating performance of workload manager based on QoS to representative workload and usage efficiency of shared resource for plurality of minCPU and maxCPU allocation values
US7590513B2 (en) 2006-01-30 2009-09-15 Nec Laboratories America, Inc. Automated modeling and tracking of transaction flow dynamics for fault detection in complex systems
JP2008191849A (ja) * 2007-02-02 2008-08-21 Ns Solutions Corp 稼働管理装置、情報処理装置、稼働管理装置の制御方法、情報処理装置の制御方法及びプログラム
US8966080B2 (en) * 2007-04-13 2015-02-24 Emc Corporation Systems and methods of managing resource utilization on a threaded computer system
US7577550B2 (en) 2007-04-30 2009-08-18 Hewlett-Packard Development Company, L.P. System and method for detecting performance anomalies in a computing system
EP2107464A1 (en) * 2008-01-23 2009-10-07 Comptel Corporation Convergent mediation system with dynamic resource allocation
JP4872944B2 (ja) * 2008-02-25 2012-02-08 日本電気株式会社 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP4659850B2 (ja) * 2008-04-10 2011-03-30 富士通株式会社 ネットワーク監視プログラム、ネットワーク監視方法およびネットワーク監視装置
US9485117B2 (en) * 2009-02-23 2016-11-01 Red Hat, Inc. Providing user-controlled resources for cloud computing environments
JP2011034164A (ja) * 2009-07-30 2011-02-17 Hitachi Ltd リモートコピーシステム及びリモートコピー制御方法
US8856048B2 (en) * 2009-10-15 2014-10-07 International Business Machines Corporation Method, system, and computer program product for automatically applying a predictive temporal profile to computer resource management decisions
JP5028469B2 (ja) * 2009-12-14 2012-09-19 株式会社日立製作所 情報処理装置、リソーススケジュール方法、リソーススケジュールプログラム
US8694163B2 (en) * 2010-06-24 2014-04-08 Noveda Technologies, Inc. System and method for managing resource sustainability performance

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993681B2 (en) * 2002-04-15 2006-01-31 General Electric Corporation Remote administration in a distributed system
US20090199196A1 (en) * 2008-02-01 2009-08-06 Zahur Peracha Automatic baselining of resource consumption for transactions

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106415583A (zh) * 2014-01-22 2017-02-15 英派尔科技开发有限公司 通过现场可编程门阵列的电压测量结果来检测恶意软件

Also Published As

Publication number Publication date
US20110258493A1 (en) 2011-10-20
JP2013525885A (ja) 2013-06-20
CN102822806B (zh) 2015-11-25
US8397106B2 (en) 2013-03-12
DE112011100242T5 (de) 2012-12-27
DE112011100242T8 (de) 2013-03-07
GB2492717B (en) 2018-04-11
GB201219667D0 (en) 2012-12-12
WO2011128411A1 (en) 2011-10-20
JP5657096B2 (ja) 2015-01-21
GB2492717A (en) 2013-01-09

Similar Documents

Publication Publication Date Title
Chen et al. Outage prediction and diagnosis for cloud service systems
Zheng et al. Service-generated big data and big data-as-a-service: an overview
CN102576311B (zh) 用于通过优化性能模型提高软件执行时间的方法和系统
EP3567496B1 (en) Systems and methods for indexing and searching
RU2543316C2 (ru) Система и способ отказоустойчивого выполнения задач по расписанию в распределенных средах
US20090006066A1 (en) Method and System for Automatic Selection of Test Cases
US8645150B2 (en) Source aware data center power profiles
US20100131952A1 (en) Assistance In Performing Action Responsive To Detected Event
JP2005173788A (ja) オートノミック・コンピューティングシステム、実行環境制御方法及びプログラム
US20130197863A1 (en) Performance and capacity analysis of computing systems
CN103795749A (zh) 用于诊断运行在云环境中的软件产品的问题的方法和装置
US8832839B2 (en) Assessing system performance impact of security attacks
CN104112084B (zh) 用于基于执行的许可发现和优化的方法和系统
US20110292834A1 (en) Maintaining Time Series Models for Information Technology System Parameters
KR20150118963A (ko) 큐 모니터링 및 시각화
CN109254922A (zh) 一种服务器BMC Redfish功能的自动化测试方法及装置
CN112685207A (zh) 错误评估的方法、设备和计算机程序产品
CN111913824A (zh) 确定数据链路故障原因的方法及相关设备
CN103152212B (zh) 一种告警相关性分析方法、装置及网络管理系统
CN102822806A (zh) 检测应用的无进展状态
CN112306831B (zh) 计算集群错误预测方法及相关设备
CN108933689A (zh) 一种数据采集系统和方法
US8381045B2 (en) Condition based detection of no progress state of an application
Wang et al. SaaS software performance issue identification using HMRF‐MAP framework
Wyatt II AI4IO: a suite of AI-based tools for IO-aware HPC resource management

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151125

CF01 Termination of patent right due to non-payment of annual fee