CN103827826A - 自适应地确定事务型工作负荷的响应时间分布 - Google Patents

自适应地确定事务型工作负荷的响应时间分布 Download PDF

Info

Publication number
CN103827826A
CN103827826A CN201280047489.7A CN201280047489A CN103827826A CN 103827826 A CN103827826 A CN 103827826A CN 201280047489 A CN201280047489 A CN 201280047489A CN 103827826 A CN103827826 A CN 103827826A
Authority
CN
China
Prior art keywords
response time
interval
mid point
bucket
counter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280047489.7A
Other languages
English (en)
Other versions
CN103827826B (zh
Inventor
R·瓦佩尔
N·纳尔德利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN103827826A publication Critical patent/CN103827826A/zh
Application granted granted Critical
Publication of CN103827826B publication Critical patent/CN103827826B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/021Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a variable is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/87Monitoring of transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/88Monitoring involving counting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/466Transaction processing

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

提供了一种通过测量终端用户事务的响应时间学习工作负荷的响应时间特征,将响应时间分类至存储桶并且随着工作负荷的响应时间特征的变化动态调整响应时间分布的自适应机制。该自适应机制保持经过改变的实际分布,并由此帮助终端用户理解在较长时间段内发生的工作负荷行为的改变。该机制足够稳定以抑制尖峰并且返回工作负荷行为的连续视图,而这是长期性能分析和容量计划制定所需要的。该机制在建立分布的初始学习阶段和一个或多个反应期之间加以区别。反应期例如可以是针对工作负荷行为强波动的快反应期以及针对小偏差的慢反应期。

Description

自适应地确定事务型工作负荷的响应时间分布
背景技术
本发明一般地涉及改进的数据处理装置和方法,尤其涉及用于自适应地确定事务型工作负荷的响应时间分布的机制.
诸如企业资源计划(EPR)系统和数据库处理系统的许多当今的计算机环境针对所谓的事务型工作负荷进行操作。事务是在系统内执行的工作单元,并且以独立于其他事务的连贯可靠的方式被处理。通过定义,事务必须是原子的、一致的、隔离的且持久的。实践者通常使用首字母缩写ACID来指代事务的这些属性。事务提供“全或无”的提议,阐明了执行的每个工作单元必须以其整体完成或者完全没有起作用。
计算机系统可以根据预定义的规则组将事务分类成各服务类型。一种服务类型是共享类似属性并由系统针对安装定义目标(可以是响应时间目标)且针对安装定义重要水平来管理的一组工作。响应时间目标是系统和部件工作负荷管理器尝试达到的目标。系统通过向最重要的工作分配系统资源以达到目标,来尝试首先达到最重要工作的目标。
对于每个服务分类,计算机系统提供管理和/或报告能力。计算机系统可以基于预定的规则组将一个事务报告到一个或多个报告分类中。报告分类仅针对报告目的工作。报告分类并不是用于管理工作的机制,而是用于使系统用户观察工作如何执行。系统可以将每个工作单元与一个服务分类相关联(强制),并与一个或多个报告分类相关联(可选)。
由于保存与服务或报告分类相关联的全部事务的各个响应时间会占据大量的存储空间,因此系统可以提供各时间段上事务响应时间的合并报告。这一合并报告被称为响应时间分布(RTD)。
响应时间分布(RTD)是直方图的一种形式。在统计学中,直方图是示出数据分布的可视印象的图形表示。直方图由在被称为“存储桶”或“箱”的离散间隔上竖起的条状频率组成。矩形的高度还等于间隔的频率密度,即频率除以间隔宽度。直方图的总面积等于数据数量。直方图也可被归一化以显示相对频率。于是其示出了在总面积等于1的情况下落入若干类别中的每一个类别的情况的比例。这些类别通常被规定为变量的连续且不重叠的间隔。
响应时间分布(RTD)通过将每个完成的事务分配至基于响应时间的存储桶而描绘了基于事务行为的系统。每个存储桶表示基于中点的响应时间范围。响应时间分布是静态的,因为由存储桶表示的范围和中点被提前确定。中点例如可以基于响应时间目标或期望响应时间导出。
发明内容
在一个说明性实施例中,提供了一种在数据处理系统中用于事务工作负荷的自适应响应时间分布的方法。所述方法包括基于初始中点生成响应时间分布,其中所述响应时间分布包括多个存储桶。所述多个存储桶中的每个存储桶相对于所述初始中点定义时间范围并且具有相应的存储桶计数器。所述方法还包括针对至少一个时间间隔记录所述数据处理系统中事务的事务响应时间并且将收集到的事务响应时间分配至所述响应时间分布的所述多个存储桶。所述方法还包括响应于从初始中点检测到响应时间的变化,基于收集到的事务响应时间确定新中点。所述方法还包括基于所述新中点更新所述响应时间分布,以使得所述响应时间分布的每个存储桶相对于所述新中点定义时间范围。
在另一个说明性实施例中,提供了一种包括具有计算机可读程序的计算机可用或可读介质的计算机程序产品。所述计算机可读程序在计算设备上执行时使得所述计算设备执行有关上述方法示例性实施例中列出的各操作及其组合。
在又一个说明性实施例中,提供了一种系统/装置。该系统/装置可以包括一个或多个处理器以及耦接至所述一个或多个处理器的存储器。所述存储器可以包括在由所述一个或多个处理器执行时使得所述一个或多个处理器执行有关上述方法示例性实施例中列出的各操作及其组合。
本发明的这些和其他特征和优点将在本发明示例性实施例的如下具体实施方式中被描述,或对借鉴所述具体实施方式的本领域普通技术人员所显见。
附图说明
本发明及其优选使用模式连同其目的和优点将参考结合附图阅读的如下说明性实施例的具体说明而得到最佳的理解。
图1描绘了其中可以实现说明性实施例各方面的示例性分布式数据处理系统的图示;
图2是其中可以实现说明性实施例各方面的示例性数据处理系统的框图;
图3描绘了根据一个实施例生成的一种示例性响应时间分布;
图4描绘了根据一个说明性实施例的一种用于自适应地确定事务工作负荷的响应时间分布的响应时间分布机制的框图;
图5描绘了根据一个说明性实施例生成的一种示例性自适应响应时间分布;
图6是说明了根据说明性实施例的一种用于自适应地确定事务工作负荷的响应时间分布的机制的操作的流程图;
图7是说明了根据一个说明性实施例的用于执行初始化的机制的操作的流程图;
图8是说明了根据一个说明性实施例的一种用于建立响应时间分布的机制的操作的流程图;
图9是说明了根据一个说明性实施例的一种用于检查分布并更新计数器的机制的操作的流程图;
图10是说明了根据一个说明性实施例的一种用于改变中点并传播结果的机制的操作的流程图;
图11是说明了根据一个说明性实施例的一种用于处理结束事务的机制的操作的流程图;
图12说明了根据一个示例性实施例的具有28个存储桶的响应时间分布;
图13说明了根据一个示例性实施例的具有14个存储桶的响应时间分布;
图14是说明了根据一个示例性实施例的中点改变率的表格;
图15A和15B示出了根据一个示例性实施例的低于中点很多的示例性响应时间分布;
图16A和16B示出了根据一个示例性实施例的高于中点很多的示例性响应时间分布;
图17A和17B示出了根据一个示例性实施例的适度低于中点的示例性响应时间分布;以及
图18A和18B示出了根据一个示例性实施例的适度高于中点的示例性响应时间分布。
具体实施方式
示例性的实施例提供了一种通过测量终端用户事务的响应时间学习工作负荷的响应时间特征,将响应时间分类至存储桶并且随着工作负荷的响应时间特征的变化动态调整响应时间分布的自适应机制。该自适应机制保持经过改变的实际分布,并由此帮助终端用户理解在较长时间段内发生的工作负荷行为的改变。该机制足够稳定以抑制尖峰并且返回工作负荷行为的连续视图,这是长期性能分析和容量计划制定所需要的。该机制在建立分布的初始学习阶段和一个或多个反应期之间加以区别。反应期例如可以是针对工作负荷行为的强波动的快反应期以及针对小偏差的慢反应期。作为替代,机制可以在需要时实现更少或更多的反应期(例如,快、中、慢等)。
说明性实施例可以在许多不同类型的数据处理环境中使用。为了提供描述说明性实施例的特定元素和功能性的情境,其后提供图1和2作为其中可以实现说明性实施例各方面的示例性环境。应该理解图1和2仅是例子,而不旨在断言或暗示对其中可以实现本发明各方面或实施例的环境的任何限制。可以对描绘的环境做出许多修改而不背离本发明的精神和范围。
图1描绘了其中可以实现说明性实施例的各方面的示例性分布式数据处理系统的图示。分布式数据处理系统100可以包括其中可以实现说明性实施例的各方面的计算机网络。分布式数据处理系统100包括至少一个网络102,该网络是用于为该分布式数据处理系统100中连接在一起的各个设备和计算机提供通信链路的介质。网络102可以包括连接,诸如有线、无线、通信链路或光纤电缆。
在描绘的例子中,服务器104和服务器106以及存储单元108连接至网络102。此外,客户机110、112和114也连接至网络102。客户机110、112和114例如可以是个人计算机或网络计算机等。在描绘的例子中,服务器104向客户机110、112和114提供诸如引导文件、操作系统图像和应用之类的数据。客户机110、112和114在描绘的例子中是服务器104的客户机。分布式数据处理系统100可以包括未示出的附加服务器、客户机和其他设备。
在描绘的例子中,分布式数据处理系统100是具有表示世界范围的网络集合的网络102以及使用传输控制协议/互联网协议(TCP/IP)协议集彼此通信的网关的因特网。位于因特网中心的是在主要节点或主机计算机之间的高速数据通信主干线,其由路由数据和消息的几千个商用、政府、教育和其他计算机系统组成。当然,该分布式数据处理系统100也可被实现为包括多个不同类型的网络,诸如内联网、局域网(LAN)或广域网(WAN)等。如上所述,图1旨在用作例子,而非对本发明不同实施例的架构限制,因此图1所示的特定元件不应被理解为对在其中可以实现本发明说明性实施例的环境的限制。
图2是其中可以实现说明性实施例的各方面的示例性数据处理系统的框图。数据处理系统200是诸如图1中的服务器104或客户机110的计算机的一个例子,其中可以载有用于实现本发明说明性实施例的处理的计算机可用代码或指令。
在描绘的例子中,数据处理系统200利用包括北桥和存储控制器集线器(NB/MCH)202以及南桥和输入/输出(I/O)控制器集线器(SB/ICH)204的集线器架构。处理单元206、主存储器208和图形处理器210连接至NB/MCH202。图形处理器210可以通过加速图形端口(AGP)连接至NB/MCH202。
在描绘的例子中,局域网(LAN)适配器212连接至SB/ICH204。音频适配器216、键盘和鼠标适配器220、调制解调器222、只读存储器(ROM)224、硬盘驱动器(HDD)226、CD-ROM驱动器230、通用串行总线(USB)端口和其他通信端口232以及PCI/PCIe设备234经由总线238和总线240连接至SB/ICH204。PCI/PCIe设备例如可以包括以太网适配器、内插卡和用于笔记本计算机的PC卡。PCI使用卡总线控制器,而PCIe不使用。ROM224例如可以是闪速基本输入/输出系统(BIOS)。
HDD226和CD-ROM驱动器230通过总线240连接至SB/ICH204。HDD226和CD-ROM驱动器230例如可以使用集成驱动电子设备(IDE)或串行先进技术附接(SATA)接口。超级I/O(SIO)设备236可以连接至SB/ICH204。
操作系统在处理单元206上运行。处理系统与图2所示数据处理系统200内的各部件协作并提供对其的控制。作为客户机,操作系统可以是诸如
Figure BDA0000483480350000061
的商用操作系统。诸如JavaTM编程系统的面向对象编程系统可以结合操作系统运行并且提供从在数据处理系统200上执行的JavaTM程序或应用到操作系统的调用。
作为服务器,数据处理系统200例如可以是运行AdvancedInteractive Executive
Figure BDA0000483480350000062
操作系统或
Figure BDA0000483480350000064
eServerTM
Figure BDA0000483480350000065
计算机系统。数据处理系统200可以是包括处理单元206中的多个处理器的对称多处理器(SMP)系统。作为替换,可以使用单处理器系统。
用于操作系统、面向对象编程系统的指令以及应用或程序位于诸如HDD226的存储设备上,并且可被载入主存储器208以供处理单元206执行。用于本发明说明性实施例的处理可由处理单元206使用计算机可用程序代码执行,计算机可用程序代码则可位于诸如主存储器208或ROM224的存储器内,或例如位于一个或多个外围设备226和230内。
诸如图2所示总线238或总线240的总线系统可以包括一个或多个总线。当然,总线系统可以使用任何类型的通信构造或架构实现,这些通信构造或架构提供在附接至构造或架构的不同部件或设备之间的数据传送。诸如图2的调制解调器222或网络适配器212的通信单元可以包括用于发送和接收数据的一个或多个设备。存储器例如可以是主存储器208、ROM224或诸如在图2的NB/MCH202中找到的高速缓存。
本领域普通技术人员将会理解图1和2的硬件可以依赖于实现变化。诸如闪存、等效非易失性存储器或光盘驱动器等的其他内部硬件或外围设备可以作为图1和2所描绘的硬件的附加或替代而被使用。同样地,各说明性实施例的处理可被应用于前述SMP系统之外的多处理器数据处理系统,而不背离本发明的精神和范围。
此外,数据处理系统200可以采取多种不同的数据处理系统中的任何形式,包括客户机计算设备、服务器计算设备、平板计算机、膝上型计算机、电话或其他通信设备或个人数字助理(PDA)等。在某些说明性例子中,数据处理系统200可以是被配置有闪存以提供用于存储例如操作系统文件和/或用户生成的数据的非易失存储器的便携式计算设备。实质上,数据处理系统200可以是任何已知或以后开发的数据处理系统,而没有架构限制。
使用现有响应时间测量机制仅可能测量定义间隔的多个结束事务的平均响应时间加上诸如偏斜、偏差和中位数的某些标准统计学度量。响应时间分布仅能在分布的初始中点(例如,响应时间目标或期望响应时间)已知或能被确定的情况下被描绘。使用现有方案,即便不针对工作负荷的响应时间特征管理事务工作负荷,也无法提供能被用作终端用户评估的恒定源的响应时间分布。
说明性实施例提供了足够精确以描绘事务的行为并且足够稳定以仅对事务行为的相当偏差作出反应的响应时间分布。说明性实施例的机制在工作负荷的估计、计划和管理执行特征方面为客户安装提供有价值的辅助。
图3描绘了根据一个实施例生成的一种示例性响应时间分布。在描绘的例子中,该系统将RTD中点定义为1秒。关于该中点定义存储桶。例如,第一存储桶包括范围[0s,0.5s],其包括小于中点50%的事务。第二存储桶包括范围[0.5s,0.6s],其包括中点50%至60%的事务。第三至第十一存储桶定义相对于中点10%的增量,直至中点的150%。第十二存储桶包括范围[1.5s,2.0s],其包括从中点150%至200%的事务。第十三存储桶包括范围[2.0s,4.0s],其包括从中点200%至400%的事务。最后,第十四存储桶包括范围[4.0s,∞],其包括大于中点的4倍的事务。
图3示出的RTD表示的是典型分布,虽然中点可以根据期望响应时间变化,并且可以取决于实现对存储桶的分布做出修改。RTD包括诸如所有响应时间之和的其他统计学数据,并且该和例如可以除以事务总数以给出平均响应时间。
RTD可被用于所有事务已结束之后的静态分析,或者在运行工作负荷时系统显示该RTD的情况下用于动态分析。在这两种情况下,必须在建立RTD之前例如通过用户或系统定义规定中点。现有技术中,用户基于期望响应时间或具体目标提前定义中点并由此定义分布。如果中点过低或过高,多数事务聚集在第一或最后的存储桶内,并且RTD不能很好地提供信息。
图4描绘了根据一个说明性实施例的一种用于自适应地确定事务工作负荷的响应时间分布的响应时间分布机制的框图。该说明性实施例的响应时间分布(RTD)机制410用于应对无法或不期望进行静态中点定义的服务分类。RTD机制410适用于没有不稳定的事务。
RTD机制410可被具体化为专用硬件、在通用计算机上运行的软件、或软件和专用硬件的组合。在一个示例性实施例中,RTD机制410可被具体化为在诸如图1的服务器104或客户机110的计算机上执行的软件。机制410监视事务响应时间并将这些事务响应时间记录在累加的事务历史402内。机制410接收初始值414并且生成RTD定义412。在给定时间段内,RTD机制410生成RTD显示416。
根据该说明性实施例,RTD机制410基于累加事务历史402中的事务响应时间动态调整RTD定义412。RTD机制410以固定时间间隔周期性地检查其自适应RTD定义412以确定当前事务良好适配RTD定义412。如果RTD机制410确定大多数事务离用于预定数量时间间隔的中点过远,则RTD机制410就调整该中点并由此调整RTD定义412的存储桶分布。RTD机制410于是可以丢弃旧的RTD定义并将事务响应时间放入新的RTD定义412内。
本质上,RTD机制410根据初始值414定义何种情况会被认为是“离中点过远”以及预定数量的时间间隔。也就是说,初始值414可以包括低阈值、高阈值以及对小于低阈值或高于高阈值的响应时间的数量进行计数的计数器。低阈值和高阈值可被设置为中点的百分比或是预定的存储桶组。例如,低阈值可被设为第一存储桶,而高阈值可被设为最后一个存储桶。可选地,低阈值可被设为前三个存储桶,而高阈值可被设为最后三个存储桶。
根据一个实施例,RTD机制410将中点设为初始值零。在该实施例中,RTD定义412具有预定数量n个存储桶,其中前n-1的存储桶包括范围[0s,0s],而第n个存储桶则包括范围[0s,∞]。RTD机制410收集预定初始交付时间的事务响应时间,根据RTD定义412将事务分配至各存储桶,并在累加事务历史402中累加事务响应时间。
在一个示例性实施例中,向存储桶分配事务可以包括递增与该存储桶相关联的计数器。在另一示例性实施例中,RTD机制410可以存储存储桶标识符并在累加事务历史402中累加事务。在此实施例中,RTD机制410可以通过对累加事务历史402中的具有每个存储桶的相应存储桶标识符的事务进行计数并建立用于RTD显示416的RTD直方图来生成RTD显示416。
在此初始交付时间之后,RTD机制410确定所有事务都被分配给最后一个存储桶。于是,RTD机制410确定所有的事务响应时间都大于高阈值。RTD机制410随后基于在初始交付时间期间收集的事务响应时间来确定新的中点。在一个说明性实施例中,RTD机制410可以将中点设为等于在初始交付时间期间收集的响应时间值的平均值,虽然也可以使用其他技术来设置该RTD定义的中点。RTD机制410随后基于新中点设置RTD定义412。换句话说,RTD机制410相对于该中点确定存储桶范围。RTD机制410随后将事务分配至新RTD定义412中的存储桶。
在初始交付时间之后,RTD机制410收集事务响应时间并在累加事务历史402中累加这些事务。RTD机制410根据RTD定义412将这些事务分配至存储桶。在固定时间间隔结束时,RTD机制410判定预定事务数是否小于低阈值或大于高阈值。利用中点的精确确定,大多数事务被分配至中点附加的存储桶;然而,随着事务工作负荷改变,响应时间可能减小或增加。例如,在轻事务工作负荷期间,响应时间可能减小,而在重事务工作负荷期间,响应时间可能增加。
如果RTD机制410判定预定事务数或事务百分比小于预定时间段的低阈值或大于高阈值,则RTD机制410可以基于初始交付时间期间收集的事务响应时间确定新中点。RTD机制410随后基于新中点设置RTD定义412。换句话说,RTD机制410相对于该中点确定存储桶范围。RTD机制410随后将事务分配至新RTD定义412中的存储桶。
根据一个实施例,RTD机制410基于其中事务历史402中的较旧事务从窗口“撤销(age out)”的事务滑动窗口来生成RTD显示416。于是,RTD机制410删除在预定窗口之前记录在该事务历史402中的事务时间。窗口的大小例如可在初始值414中定义。这允许RTD机制410基于最相关的数据生成实时RTD显示416。
根据一个实施例,累加事务历史402记录多行存储桶计数值。例如,RTD机制410可以在10秒的时间段内在累加事务历史402的第一行中累加事务时间。可能的情况是RTD机制410没有在最近的10秒中累加足够的结束事务以获得统计学上有意义的分布。于是,RTD机制410记录来自前10秒时间间隔的数据;然而,RTD机制410不单独保持每个时间间隔。实际上,RTD机制410例如记录针对最后10秒的一行分布、针对最后20秒的另一行分布、针对最后40秒的一行分布、针对最后160秒的一行分布以及针对最后640秒的一行分布。每20、40、160和640秒,RTD机制410将数据滚动至下一行。这意味着例如倘若定时器值为16,则RTD机制410将表示160秒的第四行滚动至第五行,这是通过将来自第四行的存储桶计数加到第五行的存储桶计数、并且将来自第三行的存储桶计数复制到第四行、将来自第二行的存储桶计数复制到第三行、将来自第一行的存储桶计数复制到第二行、并且清除第一行来实现的。RTD机制410还可以存储不被滚动而是每640秒简单存储来自第五行的存储桶计数拷贝的第六行。本领域技术人员将会认识到时间间隔的时间值和累加事务历史402中的行数的时间值仅作为示例给出,并且这些值和行数可以依赖于实现而变化。
图5描绘了根据一个说明性实施例生成的一种示例性自适应响应时间分布。图5示出的存储桶并非为条形图,而是每个给定时间点处的分布加起来为100%的堆叠图。每个时间点处的截面表示RTD。图5示出了RTD随时间的演化。
如图5所示,在时刻08:34之前没有事务。自适应RTD具有被设为初始值0秒的中点,所以全部事务累加至最近的存储桶直至08:45。在08:45和08:46之间,RTD机制计算新的中点。RTD机制将新的中点设置为0.070秒。RTD机制随后将在前收集和新收集的事务响应时间分配至各存储桶。如图5所示,除了时刻08:46,大多数事务累加至中点附近的存储桶。
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可用的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者以上任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CDROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分的传播的数据信号,其中承载了计算机可读的程序代码。这种传播的信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的计算机代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光纤缆线、射频(RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的各方面的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如JavaTM、SmalltalkTM、C++等,还包括常规的过程式程序设计语言—诸如“C”程序设计语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明的说明性实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明的各方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了用于实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令引导计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
计算机程序指令还可被载入计算机、其它可编程数据处理装置、或其他设备以使得一系列操作步骤将在该计算机、其它可编程数据处理装置、或其他设备上执行以产生计算机实现的处理,由此在该计算机、其它可编程装置上执行的指令提供用于实现在流程图和/或框图的一个或多个框中规定的功能/动作的处理。
图6是说明了根据一个说明性实施例的一种用于自适应地确定事务工作负荷的响应时间分布的机制的操作的流程图。在框600,操作开始,并且该机制执行初始化(框700)。随后将参考图7进一步描述执行初始化的处理。机制开始针对每个时间间隔TI重复的循环(框601)。该机制随后开始针对每个服务分类重复的循环(框602)。服务分类是共享类似属性并由系统针对目标管理的工作组。
该机制建立响应时间分布(RTD)(框800)。随后将参考图8进一步详细描述建立响应时间分布的处理。该机制随后检查分布并更新计数器,即间隔外计数器(OIC)(框900)。随后将参考图9进一步详细描述检查分布并更新计数器的处理。
该机制判定OIC的绝对值是否大于或等于预定阈值(步骤603)。正如下文将进一步详细描述的,机制基于响应时间的趋势递增或递减OIC。对于第一趋势,该机制递减OIC以使得OIC变为负的。对于第二趋势,该机制递增OIC以使得OIC变为正的。对于第三趋势,如果响应时间接近中点,则该机制递减OIC的绝对值以使得OIC从任一方向都变得更接近零。OIC的绝对值大于或等于预定阈值的判定指示在一时间段内RTD大幅偏离中点,这需要RTD中点改变。
如果该机制在框603判定OIC的绝对值小于阈值,则该机制将该间隔的RTD存储到RTD历史内并进行簿记(框604)。如果该机制在框603判定OIC的绝对值大于或等于阈值,则该机制改变中点并将结果传播至新分布(框1000)。随后将参考图10进一步详细描述改变中点并传播结果的处理。该机制随后将间隔的RTD存储至RTD历史并进行簿记(框604)。
随后,该机制可以在每个时间间隔结束时存储RTD以提供RTD历史。该机制还可通过删除在预定时间之前记录或累加的事务时间来“撤销”事务。在一个示例性实施例中,该机制可以为每个RTD考虑预定数量时间间隔的事务。
其后,该机制判定该服务分类是否是最后一个服务分类(框605)。如果该服务分类不是最后一个服务分类,则操作返回框602从而为下一个服务分类重复循环。如果在框605中该服务分类是最后一个服务分类,则该机制等待直到下一时间间隔(框606),并且操作返回框601从而针对下一个时间间隔重复循环。
图7是说明了根据一个说明性实施例的用于执行初始化的机制的操作的流程图。在框700,操作开始,并且该机制开始针对每个服务分类重复的循环(框701)。该机制初始化与该服务分类RTD相关的变量(框702)。在框702,该机制将间隔RTD存储桶初始化为0,将所有历史RTD存储桶初始化为0,将OIC计数器初始化为0,并初始化与RTD有关的其他值。与RTD有关的值可以包括告知中点何时最后改变的时间戳、统计数据(例如响应时间之和、响应时间平方和等)、中点改变次数的计数等。随后,该机制判定该服务分类是否具有可变中点(框703)。如果该服务分类不具有可变中点,则该机制根据其他定义设置服务分类中点MP(框704)。如果在框703服务分类具有可变中点,则该机制将服务分类中点MP设置为缺省初始值(框705)。
其后,该机制判定该服务分类是否是最后一个服务分类(框706)。如果该服务分类不是最后一个服务分类,则操作返回701从而针对下一个服务分类重复循环。如果在框706该服务分类是最后一个服务分类,则操作在框707结束。
图8是说明了根据一个说明性实施例的一种用于建立响应时间分布的机制的操作的流程图。在框800,操作开始,并且该机制确定过去的时间间隔的数量以从响应时间分布历史获得足够的决定数据(框801)。该机制求取历史分布之和以获取累加RTD(框802)。该机制计算累加RTD中的结束事务数(NETA)(框803)。NETA是累加的结束事务的数目。该机制随后计算累加RTD中的平均响应时间(框804)并计算其他统计学数据(框805)。在框804,该机制可以通过将响应时间之和除以NETA的值来计算平均响应时间。在框805,其他统计学数据可以包括响应时间的平方根之和、方差、标准差等。其后,操作在框806结束。
图9是说明了根据一个说明性实施例的一种用于检查分布并更新计数器的机制的操作的流程图。在框900,操作开始,并且该机制判定该服务分类是否具有可变中点(框901)。如果该服务分类不具有可变中点,则操作在框909结束。如果在框901该服务分类具有可变中点,则该机制根据结束事务数(NETA)计算并递增因子inc_factor(框902)。
该结构针对每个实现的RTD检查类型开始循环(框903)。该机制判定RTD是否未通过检查(框904)。这一实现具有建立分布的初始学习阶段、针对工作负荷行为的强波动的快反应期、以及针对小偏差的慢反应期。这可被包括在框903和904的RTD检查类型内,以提供较高的灵活性。
该机制响应于中点为零来判定其处于初始学习阶段。随后是强波动检查。强波动检查的例子是判定第一存储桶内的事务数是否大于等于总事务数的90%。随后,该机制可以执行针对小偏差的检查。小偏差检查的例子是判定前三个存储桶内是否包含总事务数的80%。可以依据期望行为添加或移除检查。检查的次序很重要。如果第一检查被完全包括在第二检查内,则第一检查应在第二检查之前完成。在上述例子中,该机制必须在执行小波动检查之前执行强波动检查。
由第一个未通过检查来确定动作以及RTD跟随哪种趋势(在中点之上或之下)。如果在框904中RTD未通过检查,则该机制调整递增因子以适应第一个未通过检查(框905)。依据上述趋势,该机制将递增因子inc_factor设为正或负。对于一种趋势,OIC将接近并潜在地变得比正阈值更大,而对于另一种趋势,OIC将接近并潜在地变得比负阈值更小。此外,该机制可以根据检查类型而增加或减小该递增因子。例如,强波动可能需要更快的中点改变;因此,该机制会增加递增因子的绝对值,而对于小偏差,该机制会减小递增因子的绝对值。该机制随后将递增因子添加至计数器OIC(框906)。其后,操作在框909结束。
返回框904,如果RTD通过检查,则该机制判定该RTD是否通过全部检查(框907)。如果该机制在框904通过检查并在框907未通过全部检查,则操作返回框903以便针对下一个检查类型重复循环。如果该机制判定RTD在框907通过全部检查,则该机制通过递增因子递减OIC的绝对值,以使得OIC变得更接近零(框908)。其后,操作在框909结束。
图10是说明了根据一个说明性实施例的一种用于改变中点并传播结果的机制的操作的流程图。操作在框1000开始,且该机制将计数器OIC重置为零(框1001)。该机制根据当前RTD统计数据将新值设为中点MP(框1002)。该机制随后改变与RTD相关的变量(框1003)。例如,该机制将间隔存储桶重置为0,将全部历史RTD存储桶重置为0,并设置诸如时间戳等的与RTD相关的其他值。换句话说,该机制从在前间隔清除RTD中的存储桶。
随后,该机制根据新分布更新利用旧中点和RTD的其他元素(框1004)。如果该机制改变中点,则系统必须也改变依赖于该中点的各元素。其后,操作在框1005结束。
图11是说明了根据一个说明性实施例的一种用于处理结束事务的机制的操作的流程图。操作在框1100的事务结束时开始,并且该机制针对该事务所属的服务和全部报告分类开始循环(框1101)。该机制将事务响应时间与服务或报告分类中点MP相比较(框1102)。该机制基于上述比较计算合适的RTD存储桶数(框1103)。随后该机制将该存储桶内的值递增1(框1104)并将该事务响应时间添加至RTD时间和(框1105)。该机制可以在框1105更新其他统计数据,诸如响应时间的平方和等。该机制判定该服务或报告分类是否是该事务所属的最后一个服务或报告分类(框1106)。如果该服务或报告分类不是最后一个服务分类,则操作返回框1101从而针对下一个服务或报告分类重复循环。如果该服务或报告分类是事务所属的最后一个服务或报告分类,则操作在框1107结束。
附图中的流程图和框图显示了根据本发明的各实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在一个实现例中,响应时间分布机制可针对
Figure BDA0000483480350000181
操作系统的工作负荷管理器(WLM)部件来实现。“z/OS”是美国或其他国家的国际商用机器公司的注册商标。在WLM中,每个事务可在至多三个响应时间分布中被报告。图12说明了根据一个示例性实施例的具有28个存储桶的响应时间分布。图13说明了根据一个示例性实施例的具有14个存储桶的响应时间分布。图12和13示出了具有1秒的平均值和1/3秒的标准差的响应时间的理论高斯分布,其被转换为两个RTD类型并作为条形图显示。对于图12所示的RTD,存储桶#1含有相对于中点在范围[0%,50%]内的事务,存储桶#2含有在范围[50%,57.5%]内的事务,......,存储桶#28含有在范围[500%,∞]内的事务。对于图13所示的RTD,存储桶#1含有相对于中点在范围[0%,50%]内的事务,存储桶#2含有在范围[50%,60%]内的事务,......,存储桶#14含有在范围[400%,∞]内的事务。
在上例中,用于RTD检查的时间间隔可被设为10秒。阈值参数可被设为2048。对于初始中点,inc_factor最大值是针对累加RTD中160个事务的32,这使得第一中点设置可在64个时间间隔(约10分钟、40秒)之后。对于强RTD波动,inc_factor最大值是针对累加RTD中160个事务的±16,这使得中点改变可在在128个时间间隔(约21分钟、20秒)之后。对于中RTD波动,inc_factor最大值是针对累加RTD中160个事务的±5,这使得中点改变可在410个时间间隔(约68分钟、40秒)之后。图14是说明了根据一个示例性实施例的中点改变率的表格。
图15A和15B示出了根据一个示例性实施例低于中点很多的示例性响应时间分布。在此例中,RTD机制执行检查以判定第一存储桶[0%,50%]是否含有90%以上的事务以及平均响应时间是否小于中点的1/3。
图16A和16B示出了根据一个示例性实施例高于中点很多的示例性响应时间分布。在此例中,该机制执行检查以判定从300%到无限的存储桶是否含有80%以上的事务。
图17A和17B示出了根据一个示例性实施例适度低于中点的示例性响应时间分布。在此例中,RTD机制执行检查以判定范围在0%至72.5%的存储桶是否含有80%以上的事务以及平均响应时间是否小于中点的3/4。
图18A和18B示出了根据一个示例性实施例适度高于中点的示例性响应时间分布。在此例中,RTD机制执行检查以判定从200%到无限的存储桶是否含有80%以上的事务。
示例性的实施例于是提供一种通过测量终端用户事务的响应时间来学习工作负荷的响应时间特征、将响应时间分类至存储桶并且随着工作负荷的响应时间特征的变化动态调整响应时间分布的自适应机制。该自适应机制保持经过改变的实际分布,并由此帮助终端用户理解在较长时间段内发生的工作负荷行为的改变。该机制足够稳定以抑制尖峰并且返回工作负荷行为的连续视图,而这是长期性能分析和容量计划制定所需要的。这一机制在建立分布的初始学习阶段、针对存储工作负荷行为的强波动的快反应期、以及针对小偏差的慢反应期之间加以区别。
如上所述,应该理解说明性实施例可以采取完全硬件实施例、完全软件实施例或含有硬件和软件元素两者的实施例的形式。在一个示例性实施例中,该说明性实施例的机制由软件或程序代码实现,其包括但不限于固件、驻留软件、微代码等。
适于存储和/或执行程序代码的数据处理系统将包括可以通过系统总线直接或间接连接至存储器元件的至少一个处理器。该存储器元件可以包括在程序代码的实际执行期间使用的本地存储器、大容量存储以及为至少部分程序代码提供临时存储以减少执行期间必须从大容量存储检索代码的次数的高速缓冲存储器。
输入/输出或I/O设备(包括但不限于键盘、显示器、指示设备等)可以直接地或通过其间的I/O控制器连接至系统。网络适配器也可被连接至系统以使得该数据处理系统变得能够通过其间的私有或公共网络连接至其他数据处理系统或是远程打印机或存储设备。调制解调器、电缆调制解调器和以太网卡仅是当前可用的网络适配器类型中的几种。
本发明的描述已经出于例示和说明的目的呈现,而非旨在将本发明排他或限制为本发明所公开的形式。许多修改和变化对于本领域普通技术人员将会是显见的。各实施例出于最好地解释本发明的原理和实践应用以及使得本领域普通技术人员能够理解本发明的具有适于具体使用的各种修改的各实施例的目的而被选择和描述。

Claims (24)

1.一种在数据处理系统中用于事务工作负荷的自适应响应时间分布的方法,所述方法包括:
基于初始中点生成响应时间分布,其中所述响应时间分布包括多个存储桶,所述多个存储桶中的每个存储桶相对于所述初始中点定义时间范围并且具有相应的存储桶计数器;
针对至少一个时间间隔记录所述数据处理系统中事务的事务响应时间;
将收集到的事务响应时间分配至所述响应时间分布的所述多个存储桶;
响应于检测到响应时间从所述初始中点的变化,基于收集到的事务响应时间确定新中点;以及
基于所述新中点更新所述响应时间分布,以使得所述响应时间分布的每个存储桶相对于所述新中点定义时间范围。
2.如权利要求1所述的方法,其中检测到响应时间的变化包括:
对于给定时间间隔,执行至少一个检查,其中所述至少一个检查中的每个检查判定事务响应时间的预定百分比是否被分配至所述多个存储桶中的预定的一组存储桶;
响应于判定响应时间分布未通过所述至少一个检查中的给定检查,递增间隔外计数器;以及
判定所述间隔外计数器是否超过预定阈值。
3.如权利要求2所述的方法,其中递增所述间隔外计数器包括:
基于给定时间间隔内收集的事务时间的数量和所述给定检查的标识来确定递增因子;以及
通过所述递增因子递增所述间隔外计数器。
4.如权利要求2所述的方法,其中检测到响应时间的变化还包括:
响应于判定响应时间分布通过所述至少一个检查,递减所述间隔外计数器的绝对值。
5.如权利要求4所述的方法,其中递减所述间隔外计数器的绝对值包括通过基于在给定时间间隔内收集的事务时间的数量确定的递增因子来递减所述间隔外计数器的绝对值。
6.如权利要求2所述的方法,其中检测到响应时间的变化还包括:
响应于判定所述间隔外计数器没有超过预定阈值,将所述响应时间分布累加至响应时间分布历史。
7.如权利要求1所述的方法,其中确定所述新中点包括将所述新中点设为等于收集到的事务响应时间的平均值。
8.如权利要求1所述的方法,其中所述至少一个时间间隔包括初始学习阶段,并且其中基于初始中点生成响应时间分布包括:
将所述多个存储桶中每个存储桶的计数器设为零;以及
将所述初始中点设为零。
9.如权利要求1所述的方法,其中,将收集到的事务响应时间分配至所述响应时间分布的所述多个存储桶包括:
对于收集到的事务响应时间中的每个事务响应时间,递增与所述多个存储桶中的、定义了包括所述事务响应时间的时间范围的存储桶相关联的计数器。
10.如权利要求1所述的方法,其中,将收集到的事务响应时间分配至所述响应时间分布的所述多个存储桶还包括;
将预定数量的时间间隔的事务响应时间累加至累加事务历史。
11.一种包括其内存储有计算机可读程序的计算机可读存储介质的计算机程序产品,其中所述计算机可读程序在计算设备上执行时使得所述计算设备:
基于初始中点生成响应时间分布,其中所述响应时间分布包括多个存储桶,其中所述多个存储桶中的每个存储桶相对于所述初始中点定义时间范围并且具有相应的存储桶计数器;
针对至少一个时间间隔记录数据处理系统中事务的事务响应时间;
将收集到的事务响应时间分配至所述响应时间分布的所述多个存储桶;
响应于检测到响应时间从所述初始中点的变化,基于收集到的事务响应时间确定新中点;以及
基于所述新中点更新所述响应时间分布,以使得所述响应时间分布的每个存储桶相对于所述新中点定义时间范围。
12.如权利要求11所述的计算机程序产品,其中检测到响应时间的变化包括:
对于给定时间间隔,执行至少一个检查,其中所述至少一个检查中的每个检查判定事务响应时间的预定百分比是否被分配至所述多个存储桶中的预定的一组存储桶;
响应于判定响应时间分布未通过所述至少一个检查中的给定检查,递增间隔外计数器;以及
判定所述间隔外计数器是否超过预定阈值。
13.如权利要求12所述的计算机程序产品,其中递增所述间隔外计数器包括:
基于给定时间间隔内收集的事务时间的数量和所述给定检查的标识来确定递增因子;以及
通过所述递增因子递增所述间隔外计数器。
14.如权利要求12所述的计算机程序产品,其中检测到响应时间的变化还包括:
响应于判定响应时间分布通过所述至少一个检查,递减所述间隔外计数器的绝对值。
15.如权利要求12所述的计算机程序产品,其中检测到响应时间的变化还包括:
响应于判定所述间隔外计数器没有超过预定阈值,将所述响应时间分布累加至响应时间分布历史。
16.如权利要求11所述的计算机程序产品,其中所述至少一个时间间隔包括初始学习阶段,并且其中基于初始中点生成响应时间分布包括:
将所述多个存储桶中每个存储桶的计数器设为零;以及
将所述初始中点设为零。
17.如权利要求11所述的计算机程序产品,其中所述计算机可读程序被存储在数据处理系统中的计算机可读存储介质中,并且其中所述计算机可读程序经网络从远程数据处理系统下载。
18.如权利要求11所述的计算机程序产品,其中所述计算机可读程序被存储在服务器数据处理系统的计算机可读存储介质中,并且其中所述计算机可读程序经网络下载到远程数据处理系统内以供远程系统在计算机可读存储介质中使用。
19.一种装置,包括:
处理器;以及
耦接至所述处理器的存储器,其中所述存储器包括在由所述处理器执行时使得所述处理器进行如下动作的指令:
基于初始中点生成响应时间分布,其中所述响应时间分布包括多个存储桶,其中所述多个存储桶中的每个存储桶相对于所述初始中点定义时间范围并且具有相应的存储桶计数器;
针对至少一个时间间隔记录数据处理系统中事务的事务响应时间;
将收集到的事务响应时间分配至所述响应时间分布的所述多个存储桶;
响应于检测到响应时间从所述初始中点的变化,基于收集到的事务响应时间确定新中点;以及
基于所述新中点更新所述响应时间分布,以使得所述响应时间分布的每个存储桶相对于所述新中点定义时间范围。
20.如权利要求19所述的装置,其中检测到响应时间的变化包括:
对于给定时间间隔,执行至少一个检查,其中所述至少一个检查中的每个检查判定事务响应时间的预定百分比是否被分配至所述多个存储桶中的预定的一组存储桶;
响应于判定响应时间分布未通过所述至少一个检查中的给定检查,递增间隔外计数器;以及
判定所述间隔外计数器是否超过预定阈值。
21.如权利要求20所述的装置,其中递增所述间隔外计数器包括:
基于给定时间间隔内收集的事务时间的数量和所述给定检查的标识来确定递增因子;以及
通过所述递增因子递增所述间隔外计数器。
22.如权利要求20所述的装置,其中检测到响应时间的变化还包括:
响应于判定响应时间分布通过所述至少一个检查,递减所述间隔外计数器的绝对值。
23.如权利要求20所述的装置,其中检测到响应时间的变化还包括:
响应于判定所述间隔外计数器没有超过预定阈值,将所述响应时间分布累加至响应时间分布历史。
24.如权利要求19所述的装置,其中所述至少一个时间间隔包括初始学习阶段,并且其中基于初始中点生成响应时间分布包括:
将所述多个存储桶中每个存储桶的计数器设为零;以及
将所述初始中点设为零。
CN201280047489.7A 2011-09-28 2012-09-26 自适应地确定事务型工作负荷的响应时间分布 Expired - Fee Related CN103827826B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/246,963 US9122782B2 (en) 2011-09-28 2011-09-28 Apparatus and computer program product for adaptively determining response time distribution of transactional workloads
US13/246,963 2011-09-28
PCT/IB2012/055116 WO2013046127A1 (en) 2011-09-28 2012-09-26 Adaptively determining response time distribution of transactional workloads

Publications (2)

Publication Number Publication Date
CN103827826A true CN103827826A (zh) 2014-05-28
CN103827826B CN103827826B (zh) 2017-02-15

Family

ID=47912710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280047489.7A Expired - Fee Related CN103827826B (zh) 2011-09-28 2012-09-26 自适应地确定事务型工作负荷的响应时间分布

Country Status (6)

Country Link
US (2) US9122782B2 (zh)
JP (1) JP2015501020A (zh)
CN (1) CN103827826B (zh)
DE (1) DE112012004042T5 (zh)
GB (1) GB2508768A (zh)
WO (1) WO2013046127A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959302A (zh) * 2017-05-19 2018-12-07 北京京东尚科信息技术有限公司 用于数据处理的方法及其设备
CN109240878A (zh) * 2018-08-20 2019-01-18 北京京东金融科技控股有限公司 数据处理方法和装置
CN112099732A (zh) * 2019-06-17 2020-12-18 慧与发展有限责任合伙企业 非暂时性机器可读存储介质、计算系统和方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2505184A (en) 2012-08-21 2014-02-26 Ibm Checking data quality of an application program by monitoring runtime behaviour
US9384227B1 (en) * 2013-06-04 2016-07-05 Amazon Technologies, Inc. Database system providing skew metrics across a key space
WO2015016899A1 (en) * 2013-07-31 2015-02-05 Hewlett-Packard Development Company, L.P. Comparing response times with goal times
DE102013215529B4 (de) * 2013-08-07 2022-09-29 International Business Machines Corporation Neuzuordnung von Jobs, um die Datenqualität zu prüfen
US10355965B1 (en) * 2014-07-14 2019-07-16 Sprint Communications Company L.P. Leveraging a capacity indicator of a mobility management entity
US10439898B2 (en) * 2014-12-19 2019-10-08 Infosys Limited Measuring affinity bands for pro-active performance management
JP6409599B2 (ja) * 2015-02-04 2018-10-24 富士通株式会社 プログラム、情報処理方法及び情報処理装置
US10489265B2 (en) 2015-04-30 2019-11-26 Micro Focus Llc Monitoring application operations using user interaction times
CN105897516A (zh) * 2016-06-21 2016-08-24 西安科技大学 网络应用层协议可调度性验证方法、监视系统及监视方法
US10176082B2 (en) 2016-06-30 2019-01-08 International Business Machines Corporation Z/OS SMF/RMF workload data playback with web dashboard visualization
JP2018022305A (ja) * 2016-08-03 2018-02-08 富士通株式会社 境界値特定プログラム、境界値特定方法および境界値特定装置
JP7111173B2 (ja) * 2018-10-29 2022-08-02 日本電気株式会社 情報処理装置
US20220253570A1 (en) * 2021-02-05 2022-08-11 Dell Products L.P. Performance impact detection using queuing curve analysis

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI104598B (fi) * 1996-08-29 2000-02-29 Nokia Networks Oy Tapahtumien tallettaminen palvelutietokantajärjestelmässä
FI104600B (fi) * 1996-08-29 2000-02-29 Nokia Networks Oy Kuormitustilanteen valvonta palvelutietokantajärjestelmässä
SE511614C2 (sv) * 1996-10-22 1999-10-25 Ericsson Telefon Ab L M Sätt att mäta QOS
US6263359B1 (en) * 1997-05-22 2001-07-17 International Business Machines Corporation Computer resource proportional utilization and response time scheduling
US6108700A (en) 1997-08-01 2000-08-22 International Business Machines Corporation Application end-to-end response time measurement and decomposition
US6601014B1 (en) * 1999-11-30 2003-07-29 Cerebrus Solutions Ltd. Dynamic deviation
US6701363B1 (en) 2000-02-29 2004-03-02 International Business Machines Corporation Method, computer program product, and system for deriving web transaction performance metrics
US6712615B2 (en) * 2000-05-22 2004-03-30 Rolf John Martin High-precision cognitive performance test battery suitable for internet and non-internet use
US6628994B1 (en) * 2000-08-31 2003-09-30 Hewlett-Packard Development Company, L.P. Method to obtain improved performance by automatic adjustment of computer system parameters
US6738933B2 (en) * 2001-05-09 2004-05-18 Mercury Interactive Corporation Root cause analysis of server system performance degradations
US7290048B1 (en) 2002-03-29 2007-10-30 Hyperformix, Inc. Method of semi-automatic data collection, data analysis, and model generation for the performance analysis of enterprise applications
US7133805B1 (en) * 2004-07-07 2006-11-07 Sprint Communications Company L.P. Load test monitoring system
CN100521809C (zh) * 2004-08-11 2009-07-29 华为技术有限公司 一种在通信系统中分配资源的方法
US8738759B2 (en) 2004-09-23 2014-05-27 Hewlett-Packard Development Company, L.P. System and method for service response monitoring
US8055952B2 (en) 2004-11-16 2011-11-08 Siemens Medical Solutions Usa, Inc. Dynamic tuning of a software rejuvenation method using a customer affecting performance metric
JP4126702B2 (ja) * 2004-12-01 2008-07-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 制御装置、情報処理システム、制御方法、及びプログラム
US7630924B1 (en) 2005-04-20 2009-12-08 Authorize.Net Llc Transaction velocity counting for fraud detection
US20080077932A1 (en) 2006-09-25 2008-03-27 International Business Machines Corporation Mechanism for Automatically Managing the Resource Consumption of Transactional Workloads
US7779133B2 (en) 2007-01-04 2010-08-17 Yahoo! Inc. Estimation of web client response time
JP4893325B2 (ja) * 2007-01-17 2012-03-07 富士通株式会社 システム分析プログラム、該プログラムを記録した記録媒体、システム分析方法およびシステム分析装置
US7797415B2 (en) * 2008-04-29 2010-09-14 Computer Associates Think, Inc. Automatic context-based baselining for transactions
US8813087B2 (en) * 2008-06-13 2014-08-19 International Business Machines Corporation Managing a workload in a cluster of computing systems with multi-type operational resources
US8630193B2 (en) * 2009-06-11 2014-01-14 Centurylink Intellectual Property Llc System and method for indicating performance information to a user to enhance communications
US8577757B2 (en) * 2009-04-17 2013-11-05 Xerox Corporation Inventory management system in a print-production environment
US8538740B2 (en) * 2009-10-14 2013-09-17 International Business Machines Corporation Real-time performance modeling of software systems with multi-class workload
US20120246214A1 (en) * 2009-11-02 2012-09-27 Hitachi, Ltd. Method for supporting service setting
JP5434562B2 (ja) 2009-12-18 2014-03-05 富士通株式会社 運用管理プログラム、運用管理装置および運用管理方法
JP5598229B2 (ja) * 2010-10-01 2014-10-01 富士ゼロックス株式会社 ジョブ分散処理システム、情報処理装置及びプログラム
US9355008B2 (en) * 2011-06-16 2016-05-31 Hewlett Packard Enterprise Development Lp Performance analyzer for self-tuning system controller
US8655702B2 (en) * 2011-06-30 2014-02-18 Infosys Limited System and method for optimizing end-to-end response times distribution across components in a performance engineering process

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959302A (zh) * 2017-05-19 2018-12-07 北京京东尚科信息技术有限公司 用于数据处理的方法及其设备
CN108959302B (zh) * 2017-05-19 2021-06-29 北京京东尚科信息技术有限公司 用于数据处理的方法及其设备
CN109240878A (zh) * 2018-08-20 2019-01-18 北京京东金融科技控股有限公司 数据处理方法和装置
CN112099732A (zh) * 2019-06-17 2020-12-18 慧与发展有限责任合伙企业 非暂时性机器可读存储介质、计算系统和方法

Also Published As

Publication number Publication date
US9146828B2 (en) 2015-09-29
US20130081025A1 (en) 2013-03-28
CN103827826B (zh) 2017-02-15
GB201404934D0 (en) 2014-04-30
US9122782B2 (en) 2015-09-01
JP2015501020A (ja) 2015-01-08
DE112012004042T5 (de) 2014-07-24
WO2013046127A1 (en) 2013-04-04
GB2508768A (en) 2014-06-11
US20130081035A1 (en) 2013-03-28

Similar Documents

Publication Publication Date Title
CN103827826A (zh) 自适应地确定事务型工作负荷的响应时间分布
US10567226B2 (en) Mitigating risk and impact of server-change failures
KR101980286B1 (ko) 애플리케이션별 자원 사용량 정보의 제공 기법
US10050989B2 (en) Inferential analysis using feedback for extracting and combining cyber risk information including proxy connection analyses
US8260622B2 (en) Compliant-based service level objectives
US20200410418A1 (en) Analyzing cloud backup service options using historical data protection activities
US11301136B2 (en) Capacity forecasting based on capacity policies and transactions
US9697571B2 (en) Real-time file system charge-back accounting per management object during a report cycle
US8639556B2 (en) Determining optimal action in consideration of risk
CN110798467B (zh) 目标对象识别方法、装置、计算机设备及存储介质
WO2016109608A1 (en) System for cyber insurance policy including cyber risk assessment/management service
US20150271030A1 (en) Methods and systems for detection of data anomalies
US20190325451A1 (en) Information security system with risk assessment based on multi-level aggregations of risk predictors
CN110991789B (zh) 置信区间的确定方法和装置、存储介质及电子装置
US20140289007A1 (en) Scenario based customer lifetime value determination
McLaughlin et al. A large scale study of the ethereum arbitrage ecosystem
US9042263B1 (en) Systems and methods for comparative load analysis in storage networks
CN104283717B (zh) 一种预测虚拟网络资源状态的方法及装置
US20210342208A1 (en) Cognitive control of runtime resource monitoring scope
US9141460B2 (en) Identify failed components during data collection
CN107247804A (zh) 运维大数据分析方法、装置及系统
WO2006115672A2 (en) Method, apparatus, and computer program product for assessing a user's current information management system
US11138187B2 (en) Data update program, data update method, and data update device
US20040186785A1 (en) Process and system for defining services within an information technology offering
CN116777220B (zh) 一种企业风控管理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

CF01 Termination of patent right due to non-payment of annual fee