CN100440159C - 提供监控信息的方法和设备 - Google Patents

提供监控信息的方法和设备 Download PDF

Info

Publication number
CN100440159C
CN100440159C CNB2005100749637A CN200510074963A CN100440159C CN 100440159 C CN100440159 C CN 100440159C CN B2005100749637 A CNB2005100749637 A CN B2005100749637A CN 200510074963 A CN200510074963 A CN 200510074963A CN 100440159 C CN100440159 C CN 100440159C
Authority
CN
China
Prior art keywords
interval
value
currency
typical value
monitor message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005100749637A
Other languages
English (en)
Other versions
CN1801111A (zh
Inventor
中村元久
前原崇行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN1801111A publication Critical patent/CN1801111A/zh
Application granted granted Critical
Publication of CN100440159C publication Critical patent/CN100440159C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Alarm Systems (AREA)

Abstract

一种存储单元包括:预定数目的当前值缓冲器,用于按照时间顺序存储当前值,和预定数目的区间代表值缓冲器,用于按照时间顺序存储基于属于监控期间所包括的预定区间的当前值计算出的区间代表值。存储控制单元在获得当前值时执行对在当前值缓冲器和区间代表值缓冲器中存储数据的控制。计算单元基于存储单元中存储的当前值和区间代表值计算监控期间的期间代表值。

Description

提供监控信息的方法和设备
技术领域
本发明涉及一种可在控制资源消耗的同时,有效地为实际应用提供充分的监控信息的技术。
背景技术
传统上,被要求稳定运转的服务器设备等类似设备需要获得例如中央处理单元(CPU)使用率和存储器使用率等的运转状态,并且通过例如按照时间顺序来图示该运转状态,将所获得的操作状态信息提供给系统管理员。
例如,2004年12月13在互联网(http://www.fmworld.net/bitz/primergy/serveview/)上检索的FujitsuKabushiki Kaisha的“ServerView3.3”(在线方式)中公开了一种技术,利用该技术,服务器设备可获得构成该服务器设备的主要组元的运转状态,并且可将该运转状态发送给通过网络连接的监控终端,而监控终端通过图示所接收的运转状态来监控服务器设备的运转状态。例如在日本专利申请特开No.2000-347905中公开了一种通过调节CPU的瞬间使用率的波动来计算CPU的使用率的方法。
然而,即使使用传统技术,也很难有效地控制监控所涉及的资源的消耗。近年来,服务器设备常常包括大量CPU和大量存储装置。因此作为监控对象的组元的数目也趋于增加。因此,仅累计所获得的运转信息就耗用了巨大的存储区。
例如,当在服务器设备中以1秒的监控间隔监控存储装置中的虚拟卷(virtual volume)的使用率时,即使每次执行监控的运转信息量为1比特,计算1000秒的监控期间中的平均使用率通常也需要1000比特的存储区。此外,所需存储区与作为监控目标的虚拟卷的增加成正比增加。服务器设备的资源应该用于重要作业处理。如果运转监控消耗过多的资源,则会不适当地阻碍稳定的运转。
另一方面,为了控制服务器设备的存储区的消耗,也可以设想,服务器设备在必要时可将所获得的运转信息发送给监控设备,并且由监控终端计算平均值等。然而,这仅仅是改变了消耗存储区的设备,并没有解决监控中涉及的资源消耗问题。
因此,关键在于去发现如何实现一种服务器设备,该服务器设备可在控制系统监控中涉及的资源消耗的同时,有效地为实际应用提供充分的监控信息。对获得监控目标的运转状态并且提供监控信息的监控信息提供设备来说,也是一样的。
发明内容
本发明的目的至少是解决传统技术中的上述问题。
根据本发明的一个方面,提供了一种监控信息提供设备,该监控信息提供设备每预定监控间隔获得表示监控目标的运转状态的当前值,以生成预定监控期间的监控信息,并且将所生成的监控信息提供给监控终端,该监控信息提供设备包括:存储单元,该存储单元包括:当前值缓冲器,用于按照时间顺序存储属于在监控期间中包括的最近区间的多个当前值;和多个区间代表值缓冲器,各区间代表值缓冲器用于按照时间顺序存储包括在所述监控期间中的区间的区间代表值,所述区间代表值是根据属于包括在所述监控期间中的该区间的当前值计算出的;存储控制单元,当获得了所述当前值时,执行控制以在当前值缓冲器中存储所获得的当前值和在所述区间代表值缓冲器中存储计算出的区间代表值;和计算单元,基于所述存储单元中存储的当前值和区间代表值计算所述监控期间的期间代表值。
根据本发明的另一方面,提供了一种监控信息提供方法,用于每预定监控间隔获得表示监控目标的运转状态的当前值,以生成预定监控期间的监控信息,并且将所生成的监控信息提供给监控终端,该监控信息提供方法包括:存储步骤,存储步骤包括:按照时间顺序将属于所述监控期间中包括的最近区间的多个当前值存储在当前值缓冲器中;和按照时间顺序将根据属于所述监控期间所包括的区间的当前值计算出的区间代表值存储在区间代表值缓冲器中;执行控制,以当获得了当前值时将所获取的当前值存储在所述当前值缓冲器中,和将计算出的区间代表值存储在所述区间代表值缓冲器中;和基于存储的当前值和存储的区间代表值计算监控期间的期间代表值。
本发明的其它目标、特征和优点将在下文中本发明的详细说明中具体地阐述,或者可在结合附图对本发明的以下具体描述的阅读中显而易见。
附图说明
图1是示出了监控信息提供处理的概要的示意图;
图2是监控目标组元(component)的示例表;
图3是计算最大值和平均值的传统方法的图表;
图4是监控信息提供设备的结构框图;
图5是图示计算平均值和最大值的处理的概要的图表;
图6是图示根据本发明的实施例的缓冲器的示意图;
图7是存储器控制单元的处理过程的流程图;
图8是示出了使用最低配置的缓冲器来计算平均值和最大值的处理概要(outline)的图;
图9是假想监控期间和代表缓冲器的示意图;
图10是使用最低配置的缓冲器的情况下存储控制单元的处理过程的流程图;以及
图11是执行监控信息提供程序的计算机的框图。
具体实施方式
下面将参照附图详细解释本发明的示例性实施例。应注意,本发明不受这些实施例的限制。
图1是示出了监控信息提供处理的概要的示意图。假设在该图中所示的服务器设备上执行监控信息提供处理。
如该图所示,在该服务器设备上操作作为本实施例的特征部分的监控信息提供处理,该服务器包括例如CPU、存储器、文件系统(虚拟卷)、和磁盘装置(实际卷)。在这种监控信息提供处理中,可期间性地获得组元的操作状态以创建要发送给监控终端(监控装置)的监控信息。
近年来,在服务器设备中,作为监控目标的组元数目趋于增加。因此为了服务器设备的稳定运转,需要精确地捕获在大量组元中的运转异常。在此将参照图2解释近年来作为服务器设备的监控目标组元的示例。图2是监控目标组元的示例表。
在包括大量CPU的服务器设备中,需要获得各个CPU的使用率。因此如图2所示,当安装了32个CPU时,要将该32个CPU的使用率设定为监控目标。当连接32个硬盘(HDD),并且在各个硬盘设备中形成十五个分区时,就有32×15个分区的使用率被设定为监控目标。这样,在服务器设备中的监控目标组元的数目非常多。因此除非对存储每个监控目标的当前值要使用的的存储区进行控制,否则服务器设备本身的运转可能会受到抑制。当作为监控目标的组元数目这样不断增加时,监控中涉及的存储区消耗问题也变得日益突出。
在传统的监控信息提供处理中,将在用户等指定的监控期间中以预定间隔获得的当前值都存储在存储区中。接着,基于所存储的当前值计算该监控期间中的最大值和平均值。在此参照图3解释传统监控信息提供处理中计算最大值和平均值的方法。图3是计算最大值和平均值的传统方法的图。
如图3所示,以预定取样间隔获得的各当前值由“白圈”表示。垂直轴表示监控目标组元的使用率,水平轴表示时间。在计算图中示出的全部当前值的平均值时,需要累加“白圈”表示的使用率,并且将总使用率除以“白圈”的数目。因此,需要临时存储“白圈”表示的使用率。
另一方面,当计算最大值时,要判断新获得的当前值是否是最大值。仅在当前值是最大值时,才利用当前值替代存储值。因此无需存储图3示出的全部当前值。然而,当仅有一个存储值时,使用率临时为例如1.0这样大的数值。因而,由于该值不能在将来更新,所以不可能在最近的期间中获得最大值。
如上所述,在计算平均值的传统方法中,监控期间越长,消耗的存储区就越多。如果监控期间长,即使计算了当前值的移动平均值,也需要存储大量的当前值。因此没能解决消耗存储区的问题。另外,还是在计算最大值的传统方法中,如果想要获得最近期间中的最大值,需要如在平均值计算时一样存储多个当前值。
为了控制服务器设备的资源消耗,也可以在每次服务器设备获得当前值时,使服务器设备不存储所获得的当前值,而是将当前值发送到监控终端(终端设备)。然而,在这种方法中,资源消耗设备从监控设备转换为监控终端(终端设备)。因此该方法没有根本上解决监控中涉及的资源消耗问题。
因此,在作为本实施例的特征部分的监控信息提供处理中,在指定监控期间中的最大值和平均值的计算处理中适当地使用了基于当前值的区间代表值(最大值、平均值等)。提供了一种机制,可通过减少需要临时存储的当前值数目来控制存储区的消耗,并且可提供满足实际应用的最大值和平均值。
另外,使用标记语言图示所计算的最大值和所计算的平均值,并且将其发送给监控终端(终端设备)。因此也不必在终端设备侧上存储监控信息。因此能够有效地控制终端设备侧上的资源消耗。
图4是监控信息提供设备1的结构的框图。如图所示,监控信息提供设备1包括通信单元2、监控信息提供处理单元10、和存储单元20。
监控信息提供处理单元10包括提供请求接收单元11、监控信息提供单元12、提供数据计算单元13、当前值数据获得单元14、存储控制单元15、和定时器处理单元16。存储单元20包括监控数据存储单元21。
通信单元2由例如局域网(LAN)板卡和广域网(WAN)板卡的通信设备组成。通信单元2与用作监控终端的终端设备和监控目标设备进行通信,以与监控信息提供处理单元10交换数据。例如,当通信单元2从终端设备接收到请求监控信息的提供请求(provision request)时,通信单元2将该提供请求传送给监控信息提供处理单元10的提供请求接收单元11。当通信单元2从监控信息提供单元12接收到监控信息时,通信单元2将该监控信息发送给终端设备。另外,当通信单元2从监控目标设备接收到表示操作状态的当前值数据时,该通信单元2将该数据传送给当前值数据获得单元14。
监控信息提供处理单元10是作为本实施例的特征部分的处理单元。具体地,该监控信息提供处理单元10从监控信息提供设备1的操作系统和外部监控目标设备接收表示监控目标的操作状态的当前值数据,并且将该数据临时存储在存储单元20中。响应于来自作为监控终端的终端设备的请求,监控信息提供处理单元10使用标记语言图示代表监控目标的运转状态的当前值数据的历史值、平均值、最大值等,并且将该历史值、平均值、最大值等提供给该终端设备。
提供请求接收单元11通过通信单元2,从用作监控终端的终端设备接收监控信息提供请求消息,并且通知监控信息提供单元12已经接收到该提供请求。此监控信息提供请求消息是这样的消息:根据系统管理员对终端设备的操作或者根据事先指定的定义文件中定义的处理,将其发送到监控信息提供设备。该监控信息提供请求消息例如包括监控目标名称、监控期间、和提供格式。
当被提供请求接收单元11通知了已经接收到该提供请求时,监控信息提供单元12请求提供数据计算单元13对提供数据进行计算。当监控信息提供单元12接收到计算结果时,监控信息提供单元12同样使用例如超文本链接标记语言(HTML)或者可扩展标记语言(XML)的标记语言图示该计算结果,并且将该计算结果通过通信单元2发送给请求提供监控信息的终端设备。
例如,当终端设备请求监控信息提供单元12提供100秒内的CPU使用率的平均值和历史值时,监控信息提供单元12请求提供数据计算单元13提供该内容。当100秒过去后,如果监控信息提供单元12从提供数据计算单元13接收到相应数据,则监控信息提供单元12使用标记语言图示CPU使用率的历史值和平均值,并且将该历史值和平均值发送给终端设备。
请注意,在本实施例的解释中,监控信息提供单元12使用标记语言图示监控信息,并且将监控信息发送给终端设备。然而监控信息提供单元12可以不使用标记语言而通过排列例如“*”字符来图示监控信息。即使使用标记语言,监控信息提供单元12也可以将监控信息提供单元12提供的数值,保持其数字数值数据的形式地包括在标记语言中。
提供数据计算单元13响应于来自监控信息提供单元12的请求,根据存储单元20的监控数据存储单元21中存储的当前值和区间代表值计算平均值和最大值。另外提供数据计算单元13将所计算的平均值和所计算的最大值连同监控数据存储单元21中存储的数据一起返回给监控信息提供单元12。
图5是示出了用于计算平均值和最大值的处理的概要的图表。在作为本实施例的特征部分的监控信息提供处理中,引入“区间”(section)的概念来计算所获得的当前值的每个区间的平均值和最大值。在除最近的区间之外的区间中,仅在存储单元20中存储所计算的“每个区间的平均值和最大值”。因此,可控制资源消耗。
图5中的“白圈”表示所获得当前值的历史值,其对应于传统监控信息提供处理中的存储区内存储的数据。在本实施例的监控信息提供处理中,仅存储最近区间中的当前值(由图5中的“黑圈”表示)。当用于存储最近区间中的当前值的“当前值缓冲器”满了的时候,计算这些当前值的区间平均值(由图5中的“黑方块”表示)和区间最大值(由图5中的“黑三角”表示),并且将其存储在用于存储区间代表值的“代表值缓冲器”中,并且清空当前值缓冲器。
因此,在图5中示出的情况中,存储在存储单元20中的属于一个区间的六个当前值由一个平均值和一个最大值取代。因此可将存储区缩减为传统存储区的三分之一。请注意,区间的长度可以被设定为任意长度。因此如果将区间的长度设定为一个区间包括两百个当前值,则能够将存储区缩减为传统存储区的百分之一。
当以这种方式用区间代表值代替多个当前值计算整个监控期间的代表值时,计算精确度与基于全部当前值计算整个监控期间的代表值的情况相比有所下降。然而,当监控例如CPU使用率和存储器使用率这样的运转状态时,通常所需的精度可让管理员了解过去的运转状态即可。通常需要提高最近期间中获得的数据的精度而不需要提高过去数据的精度。换言之,如果能够比较过去的数据传输的概况和最近期间中获得的数据的传输,就很容易预测未来的运转异常。因此资源消耗(存储区消耗)控制的优势胜于数据精确度的下降导致的劣势,所以即使用区间代表值来取代多个当前值也不会出现什么问题。
回头参照图4,解释当前值数据获得单元14。当前值数据获得单元14利用来自定时器处理单元16的通知作为触发,期间性地从操作系统等获得例如CPU使用率和存储器使用率的监控目标组元的当前值数据。该当前值数据获得单元14将所获得的当前值数据传送给存储控制单元15。
存储控制单元15将从当前值数据获得单元14接收的当前值数据存储在监控数据存储单元21中设置的缓冲器中。监控数据存储单元21中设置的缓冲器包括“当前值缓冲器”和“代表值缓冲器”。在此,参考图6解释这些缓冲器。图6是根据本发明的缓冲器的视图。
图6示出的缓冲器是用于存储图5中的各值的缓冲器。用于存储最近区间的当前值数据(图5中用“黑圈”表示)的缓冲器是n个缓冲器new(0)到new(n-1)。用于存储最近区间以外的区间的平均值(由图5中的“黑方块”表示)的缓冲器是m个缓冲器Zave(0)到Zave(m-1)。用于存储区间中的最大值(图5中由“黑三角”表示)的缓冲器是m个缓冲器Zmax(0)到Zmax(m-1)。
如图6中所示,当使用n个用于存储当前值的缓冲器和m×2个存储区间的平均值和最大值的缓冲器时,缓冲器的总数由“n+2m”表示。缓冲器的总数可设定为事先指定的固定值,或者可设定为能够最有效地使用存储区的可变值。
存储区的有效使用等同于缓冲器的总数的最小化。因此如果找出使得“n+2m”最小的“n”和“m”之间的关系,则能够最有效地使用存储区。换言之,因为根据算术平均和几何平均(arithmetic and geometricalmeans)的关系判断在“n=2m”的时候“n+2m”最小,所以最好将“n”和“m”之比设定为“2∶1”。
例如,当将取样间隔设定为1秒并且将区间长度设定为10秒时,n值为10。因此,根据“n=2m”的关系,如果将m值设定为5,则可最有效地使用存储区。注意此时缓冲器的总数目是20,即(10+5×2)。
附带地,在存储当前值数据的当前值缓冲器(图6中的“用于存储当前值的缓冲器”)和代表值缓冲器(图6中的“用于存储区间平均值的缓冲器”和“用于存储区间最大值的缓冲器”)中,存储控制单元15执行处理,计算当前值数据的区间平均值和区间最大值,并且将区间平均值和区间最大值存储在代表值缓冲器中。存储控制单元15也执行代表值缓冲器的移动处理。下面详细解释这些处理。
在当前值数据存满了全部当前值缓冲器(new(0)到new(n-1))的情况下,存储控制单元15通过将当前值缓冲器new(0)到new(n-1)中的和除以当前值缓冲器的总数(n)来计算最近区间中的平均值(Zave)。存储控制单元15也通过比较各个当前值缓冲器new(0)到new(n-1)来计算最近区间的最大值(Zmax)。
接着,存储控制单元15删除代表缓冲器中的最旧数据(图6中的Zave(m-1)和Zmax(m-1)),并且执行缓冲器移动(例如将Zave(m-2)移动到Zave(m-1),并且将Zave(m-3)移动到Zave(m-2)。接着存储控制单元15将所计算的最近区间的平均值(Zave)和最大值(Zmax)分别存储在Zave(0)和Zmax(0)中。
在当前值数据存满了全部当前值缓冲器(new(0)到new(n-1))的情况下,存储控制单元15重复上述处理。因此,作为区间代表值的区间平均值和区间最大值可顺次地存储在图6示出的各个区间的缓冲器中。注意,当当前值缓冲器中有空闲空间时,所获得的当前值数据连续地存储在当前值缓冲器中,并不更新代表值缓冲器。另外,当当前值数据存满了全部当前值缓冲器时,存储控制单元15计算最近区间的代表值(平均值和最大值),并且将这些代表值存储在用于存储代表值的缓冲器中。接着删除当前值缓冲器中存储的全部数据(全部清除)。
注意,在本实施例的解释中,使用按照时间顺序排列的多个缓冲器。然而也可以循环地使用环形排列的缓冲器,存储控制单元15执行对环形缓冲器的存储控制。另外,存储控制单元15可以减少从当前值数据获得单元14接收的当前值数据,并且将当前值数据存储在监控数据存储单元21中提供的缓冲器中。
重新参照图4,解释定时器控制单元16。定时器控制单元16测量当前值数据的取样间隔并且指示当前值数据获得单元14获取当前值数据。接收到该命令的当前值数据获得单元14获取各个监控目标的当前值数据。
存储单元20由例如随机存取存储器(RAM)的存储器组成。存储单元20根据监控信息提供处理单元10的命令存储当前值数据和区间代表值数据并且将所存储的数据提供给监控信息提供处理单元10。另外,监控数据存储单元21包括参照图6解释的当前值缓冲器和代表值缓冲器。
图7是存储控制单元15的处理过程的流程图。如图所示,当存储控制单元15从当前值数据获得单元14获得当前值时(步骤S101),存储控制单元15移动当前值存储缓冲器中的存储位置(步骤S102),并且将所获得的当前值存储在当前值缓冲器的new(i)中(步骤S103)。在此,“new(i)”表示一共n个当前值缓冲器中的“第i”个缓冲器。
随后,存储控制单元15判断当前值是否存满了全部当前值存储缓冲器(new(0)到new(n-1))(步骤S104)。接下来,如果当前值存储缓冲器中有空闲空间(步骤S104中为“否”),则存储控制单元15基于当前值存储缓冲器中存储的数值(new(0)到new(i)和区间代表值(Zave(0)到Zave(m-1)以及Zmax(0)到Zmax(m-1))计算整个监控期间的平均值和最大值(步骤S108),并且结束处理。注意图中示出的“MAX(变量(argument)1,变量2等)是返回由变量指定的最大值的函数。
另一方面,如果当前值存满了全部当前值存储缓冲器(步骤S104,“是”),则存储控制单元15替换区间值存储缓冲器以删除最旧的区间值存储缓冲器的值,并且清空最近区间值存储缓冲器(Zave(0)和Zmax(0)(步骤S105)。接着存储控制单元15将当前值缓冲器的平均值和最大值分别存储在Zave(0)和Zmax(0)中(步骤S106)。
随后,存储控制单元15删除当前值存储缓冲器中的全部数值(全部清空)(步骤S107),计算整个监控期间的平均值和最大值,并且结束处理。注意,此时“i”的值是“0”,并且当前值存储缓冲器的全部值(new(0)到new(i))为“0”。因此,存储控制单元15仅基于区间值存储缓冲器的数值(Zave(0)到Zave(m-1)和Zmax(0)到Zmax(m-1))计算监控期间中的平均值和最大值。
在监控信息提供处理的解释中,使用存储当前值的n个缓冲器和存储平均值和最大值的m×2个缓冲器。然而在根据本发明的监控信息提供处理中,即使n和m是1,也能够分别计算整个监控期间的平均值和最大值。在下面的解释中,解释了在一个当前值缓冲器和两个代表值缓冲器(一个用于平均值的缓冲器和一个用于最大值的缓冲器)的情况下,计算整个监控期间的平均值和最大值的处理。
图8是示出了使用具有最小配置的缓冲器计算平均值和最大值的处理的概要的视图。如图所示,在使用最小化配置的缓冲器(一个当前值缓冲器,和两个代表值缓冲器)的计算处理中,引入用于平均值计算的“假想监控期间”(imaginary monitoring period)和用于最大值计算的“最大值持有期间”(maximum value holding period)和“准最大值函数”(quasi-maximum value function)的概念来计算平均值和最大值。
“假想监控期间”表示假想的用于计算平均值的目标期间。通常,在有一个用于存储平均值的代表值缓冲器(此后称为“平均值缓冲器”)的情况下,如果使用该平均值缓冲器和一个当前值缓冲器计算平均值,则平均值倾向于变化轻微。例如用于存储按照1秒的取样间隔获得的当前值的当前值缓冲器与用于存储100秒的平均值的平均值缓冲器相比仅具有百分之一的影响度。因此,如果监控期间长则只能算出对当前值的变化不敏感的平均值。
因此,在根据本实施例的监控信息提供处理中,通过引入“假想监控期间”的概念和减少代表值缓冲器的影响度来解决该问题。在此参照图9解释假想监控期间。图9是假想监控期间和各个缓冲器的示意图。
如图所示,假设一个平均值缓冲器中存储的平均值是在m次取样处理中连续地计算的。此时,长为取样间隔的m倍的期间为“假想监控期间”。放弃最旧的平均值(Zave),并且添加当前值(new)。接着根据m-1个平均值Zave和一新平均值计算新平均值。具体地,将通过表达式((m-1)×Zave+new)/m计算的数值存储在Zave中作为新平均值。
因此,当监控期间长时,能够解决平均值对当前值的变化不敏感的问题。注意,因为可将“假想监控期间”设定为任意长度的期间,所以能够根据用户的需要改变“假想监控期间”。
参照图8,解释“最大值持有期间”和“准最大值函数”。“最大值持有期间”表示其中持有最大值的预定期间。“准最大值函数表示用于减少超过最大值持有期间持有的最大值的函数。例如,当取样间隔为1秒时,假设将最大值持有期间设定为5秒,并且将准最大值功能函数设定为Zmax×0.5。
此时,如果在特定取样处理中获得的CPU使用率是0.8(80%),则Zmax持续5秒为0.8。那么六秒后,使用准最大值功能函数将Zmax的值计算为0.4,即(0.8×0.5)。比较该数值和在6秒新获得的值。如果6秒后和7秒后获得的新值都是0.3,则使用准最大值功能函数计算的6秒和7秒的Zmax分别为0.4和0.2。因此,7秒后的新数值大于Zmax 7的数值。通过比较0.2和0.3,将7秒后的Zmax计算为0.3。
通常,在使用一个用于存储最大值的代表值缓冲器(此后称为最大值缓冲器)时,如果使用该代表值缓冲器和一个当前值缓冲器计算最大值,则一旦最大值采用了接近上限值的数值,此后的最大值不再变化。这就是所谓的“最大值固定”问题。在根据本实施例的监控信息提供处理中,引入“最大值持有期间”和“准最大值功能函数”来解决最大值固定问题。注意可将“最大值持有期间”存储在监控数据存储单元21中。另一方面,可以使用包括“最大值持有期间”的函数作为“准最大值函数”。
这样,通过使用“最大值持有期间”和“准最大值函数”,能够解决最大值固定问题。注意,可将“最大值持有期间”设定为任意长度的期间,并且可将“准最大值函数”设定为任意的递减函数。因此可根据用户的需要改变“最大值持有期间”和“准最大值函数”。
图10是使用最小配置的缓冲器的情况下存储控制单元15的处理过程的流程图。如图所示,当存储控制单元15从当前值数据获得单元14获得当前值时(步骤S201),存储控制单元15根据上次的平均值(Zave)和当前值(new)计算新平均值(Zave)(步骤S202)。注意此时的表达式为上述的Zave=((m-1)×Zave+new)/m。
随后,为计算最大值,存储控制单元15判断上次的最大值的持有时间是否超过了最大值持有期间(步骤S203)。如果上次的最大值的持有时间没有超过最大值持有期间(步骤S203中为否),则存储控制单元1 5将上次的最大值设定为准最大值,而不改变该最大值(步骤S205)。接着,存储控制单元15比较准最大值和当前值,借此来将较大的一个计算为新最大值(步骤S206),并且结束处理。
另一方面,如果上次的最大值的持有超过了最大值持有期间(步骤203中为是),则存储控制单元15将通过将上次的最大值乘以c(0≤c<1)获得的数值设定为准最大值(步骤S204)。接着存储控制单元15比较该准最大值和当前值,借此将较大的一个计算为新最大值(步骤S206),并且结束该处理。
这样,即使当前值缓冲器和代表值缓冲器具有最小化的配置(n=1并且m=1),在根据本实施例的监控信息提供处理中,也能够通过使用“假想监控期间”,“最大值持有期间”和“准最大值函数”提供整个监控期间的平均值和最大值。
如上所述,在本实施例中,当前值数据获得单元根据来自定时器处理单元的命令,以预定取样间隔获得表示监控目标组元的操作状态的当前值。存储控制单元对监控数据存储单元中提供的当前值缓冲器和代表值缓冲器执行控制,从而存储当前值和代表值。当提供请求接收单元从终端设备接收到监控信息提供请求时,提供数据计算单元通过监控信息提供单元被通知了监控信息提供请求,计算监控期间的代表值(例如最大值和平均值)。监控信息提供单元使用标记语言创建包括这种计算结果的图表,并且将该结果发送给请求提供监控信息的终端设备。因此,能够在控制系统监控所涉及的资源消耗的同时有效地为实际应用提供充分的监控信息。
另外,可通过执行计算机事先配备的程序来实现在本实施例中解释的各种处理。因此在下文的解释中,将参照图11解释执行具有与本实施例相同的功能的监控信息提供程序的计算机的示例。图11是执行监控信息提供程序的计算机的视图。
如该图所示,在用作监控信息提供设备的计算机50中,通过总线58连接有输出单元52、磁盘控制I/F单元53、网络I/F单元54、硬盘驱动器(HDD)55、RAM 56和中央处理单元(CPU)57。输入单元是例如键盘的用于输入的设备,输出单元是例如显示器的用于输出的设备。磁盘控制I/F单元53是例如小型计算机系统接口(SCSI)的用于磁盘控制的设备。作为监控目标的磁盘设备和存储设备连接到磁盘控制I/F单元53。
网络I/F单元54对应图4中示出的通信单元2。作为计算机50的监控目标的设备通过网络(例如LAN)连接到网络I/F单元54。另外,显示由计算机50提供的信息的监控终端也以同样的方式连接到网络I/F单元54。
监控信息提供程序55a事先存储在HDD 55中。CPU 57读取并且执行HDD 55中存储的监控信息提供程序55a,由此使得监控信息提供程序55a可用作图11中示出的监控信息提供处理57a。当监控信息提供处理57a运行时,可将当前值数据56a和代表值数据56b存储在RAM 56中。
不是必须事先将监控信息提供程序55a存储在HDD 55中。例如也可以将计算机程序存储在可由计算机50读取的“便携式物理介质”中,例如软盘(FD)、CD-ROM、和磁光盘,或者存储在通过公共线、因特网、LAN、WAN等连接到计算机50的其它计算机(或者服务器)等中,并且由计算机50读取并执行该计算机程序。
根据本发明,能够在控制系统监控所涉及的资源消耗的同时,有效地为实际应用提供充分的监控信息。
此外,根据本发明,可在控制资源消耗的同时,持续地持有高精确的区间代表值。
另外,根据本发明,可在控制资源消耗的同时,有效地为实际应用提供充分的平均值。
此外,根据本发明,可使用最小化的缓冲器配置为实际应用提供充分的平均值。
另外,根据本发明,可在控制资源消耗的同时,有效地为实际应用提供充分的最大值。
此外,根据本发明,可解决最大值固定的问题。
另外,根据本发明,可在解决最大值固定的问题的同时,提供靠近实际最大值的转变(transition)的最大值。
此外,根据本发明,可以在以简单的配置控制资源消耗的同时,为实际应用提供充分的监控信息。
另外,根据本发明,可有效地控制资源消耗。
此外,根据本发明,可有效地为多个监控目标提供监控信息。
另外,根据本发明,可有效地控制传输目的地的监控终端的资源消耗。
虽然为了完全、清楚的公开,本发明是结合具体实施例描述的,但所附的权利要求不应因此受限,而是被构建为包括本技术领域的技术人员能够想到的落入了本文所阐述的基础教导中的全部变型和替换。

Claims (16)

1、一种监控信息提供设备,每预定监控间隔获得表示监控目标的运转状态的当前值,以生成预定监控期间的监控信息,并且将所生成监控信息提供给监控终端,该监控信息提供设备包括:
存储单元,包括:当前值缓冲器,用于按照时间顺序存储属于在监控期间中包括的最近区间的多个当前值;和多个区间代表值缓冲器,各区间代表值缓冲器用于按照时间顺序存储包括在所述监控期间中的区间的区间代表值,所述区间代表值是根据属于包括在所述监控期间中的该区间的当前值计算出的;
存储控制单元,当获得了所述当前值时,执行控制以在当前值缓冲器中存储所获得的当前值和在所述区间代表值缓冲器中存储计算出的区间代表值;和
计算单元,基于所述存储单元中存储的当前值和区间代表值计算所述监控期间的期间代表值。
2.根据权利要求1所述的监控信息提供设备,所述监控信息提供设备还包括监控信息生成单元,用于使用标记语言生成监控信息,所述监控信息包括存储在所述存储单元中的数据和由所述计算单元所计算出的期间代表值中的至少其中之一。
3.根据权利要求1所述的监控信息提供设备,其中如果当前值存满了所述存储单元中设置的所有当前值缓冲器,则所述存储控制单元基于当前值计算最近区间的区间代表值,并且将最近区间的区间代表值存储在区间代表值缓冲器中。
4.根据权利要求1所述的监控信息提供设备,其中
存储在存储单元中的区间代表值是区间平均值,并且
由所述计算单元计算出的所述期间代表值是期间平均值。
5.根据权利要求4所述的监控信息提供设备,其中,
当使用一个区间代表值缓冲器存储平均值时,所述平均值是监控期间中的m个数据的平均,所述存储控制单元通过将存储在所述区间代表值缓冲器中的平均值乘以(m-1),将新当前值与该相乘后的值相加,并将相加后的值除以m,来计算所述期间平均值,并且将计算出的期间平均值存储在区间代表值缓冲器中,并且
计算单元照原样将区间代表值缓冲器的数值设置为期间代表值。
6.根据权利要求1所述的监控信息提供设备,其中
存储在所述存储单元中的所述区间代表值是区间最大值,并且
由所述计算单元计算出的期间代表值是期间最大值。
7.根据权利要求6所述的监控信息提供设备,其中
当使用一个区间代表值缓冲器用于存储区间最大值时,所述存储控制单元持有所述区间代表值缓冲器的数值,直到最大值持有期间期满,所述最大值持有期间表示持有区间代表值缓冲器中的值的期间,并且
当所述最大值持有期间期满之后获得所述当前值时,所述存储控制单元基于对区间代表值缓冲器中的值和所获得的当前值的值的比较,将新区间代表值存储在区间代表值缓冲器中。
8.根据权利要求7所述的监控信息提供设备,其中所述存储控制单元比较所述区间代表值缓冲器中的值和所获得的当前值,并基于所述区间代表值缓冲器中的值和所获得的当前值的比较,在区间代表值缓冲器中存储新区间代表值,其中,
所述存储控制单元在所述区间代表值缓冲器的值大于所获得的当前值时,减小所述区间代表值缓冲器中的值,并存储减小后的值作为所述新区间代表值,以及
在所获得的当前值大于所述区间代表值缓冲器中的值时,存储所获得的当前值作为所述新区间代表值。
9.根据权利要求1所述的监控信息提供设备,其中包括在所述监控期间中的区间数是事先设定的。
10.根据权利要求1所述的监控信息提供设备,其中监控期间中包括的区间数以基于监控期间和监控间隔使所述存储单元中提供的缓冲器数最小的方式变化。
11.根据权利要求1所述的监控信息提供设备,其中所述存储单元具有用于各监控目标的当前值缓冲器和区间代表值缓冲器。
12.根据权利要求2所述的监控信息提供设备,其中所述监控信息生成单元使用标记语言生成图表化表现的监控信息。
13.一种监控信息提供方法,用于每预定监控间隔获得表示监控目标的运转状态的当前值,以生成预定监控期间的监控信息,并且将所生成的监控信息提供给监控终端,该监控信息提供方法包括:
存储步骤,包括:按照时间顺序将属于所述监控期间中包括的最近区间的多个当前值存储在当前值缓冲器中;和按照时间顺序将根据属于所述监控期间所包括的区间的当前值计算出的区间代表值存储在区间代表值缓冲器中;
执行控制,以当获得了当前值时将所获取的当前值存储在所述当前值缓冲器中,并将计算出的区间代表值存储在所述区间代表值缓冲器中;和
基于存储的当前值和存储的区间代表值计算监控期间的期间代表值。
14.根据权利要求13所述的监控信息提供方法,还包括使用标记语言生成监控信息的步骤,所述监控信息包括存储步骤中存储的数据和所述计算步骤中计算出的期间代表值中的至少其中之一。
15.根据权利要求13所述的监控信息提供方法,其中,如果当前值存满了所述存储步骤中设置的全部当前值缓冲器,则所述执行步骤包括:
基于所述当前值计算最近区间的区间代表值;和
将最近区间的区间代表值存储在所述区间代表值缓冲器中。
16.根据权利要求13所述的监控信息提供方法,其中
在所述存储步骤中存储的区间代表值是区间平均值,并且
在所述计算步骤中计算出的期间代表值是期间平均值。
CNB2005100749637A 2005-01-06 2005-06-06 提供监控信息的方法和设备 Expired - Fee Related CN100440159C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005001794A JP4700969B2 (ja) 2005-01-06 2005-01-06 監視情報提供装置、監視情報提供方法および監視情報提供プログラム
JP2005001794 2005-01-06

Publications (2)

Publication Number Publication Date
CN1801111A CN1801111A (zh) 2006-07-12
CN100440159C true CN100440159C (zh) 2008-12-03

Family

ID=36228682

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100749637A Expired - Fee Related CN100440159C (zh) 2005-01-06 2005-06-06 提供监控信息的方法和设备

Country Status (5)

Country Link
US (1) US7472188B2 (zh)
EP (1) EP1679600A3 (zh)
JP (1) JP4700969B2 (zh)
KR (1) KR100629289B1 (zh)
CN (1) CN100440159C (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8015571B2 (en) * 2007-03-16 2011-09-06 Google Inc. Registering an event
JP4659850B2 (ja) * 2008-04-10 2011-03-30 富士通株式会社 ネットワーク監視プログラム、ネットワーク監視方法およびネットワーク監視装置
US8787202B2 (en) * 2010-06-22 2014-07-22 George W. Kuriyan Method and system using wireless packet data networks architecture for remote process control and process monitoring applications
US20130268570A1 (en) * 2010-11-26 2013-10-10 Heung Seob Koo Representative-value calculating device and method
CN104995605B (zh) * 2013-08-07 2018-07-10 富士电机株式会社 监视方法和计算机装置
CN105138447A (zh) * 2015-09-09 2015-12-09 浪潮电子信息产业股份有限公司 一种Reboot测试过程中监测硬盘和内存的实现方法
US11140242B2 (en) * 2017-12-15 2021-10-05 New Relic, Inc. System for processing coherent data
CN115374065B (zh) * 2022-10-25 2023-02-28 山东捷瑞数字科技股份有限公司 一种基于云平台日志记录监控的文件清理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889939A (en) * 1996-06-28 1999-03-30 Kabushiki Kaisha Toshiba Disk drive with a PFA function and monitor value saving control method in the same
JP2002078200A (ja) * 2000-08-22 2002-03-15 Toshiba Corp 監視制御装置及び記憶媒体
CN1466056A (zh) * 2002-06-10 2004-01-07 联想(北京)有限公司 一种机群监控系统和方法
CN1547121A (zh) * 2003-12-10 2004-11-17 中国科学院计算技术研究所 一种大规模机群系统的监控方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696531A (en) * 1991-02-05 1997-12-09 Minolta Camera Kabushiki Kaisha Image display apparatus capable of combining image displayed with high resolution and image displayed with low resolution
JPH0619753A (ja) * 1992-07-06 1994-01-28 Nec Ic Microcomput Syst Ltd プログラム開発支援装置
US5664106A (en) * 1993-06-04 1997-09-02 Digital Equipment Corporation Phase-space surface representation of server computer performance in a computer network
JPH076062A (ja) 1993-06-21 1995-01-10 Fujitsu Ltd Cpuの稼働率測定方法
US5940130A (en) * 1994-04-21 1999-08-17 British Telecommunications Public Limited Company Video transcoder with by-pass transfer of extracted motion compensation data
JP2907063B2 (ja) * 1995-05-24 1999-06-21 日本ビクター株式会社 総符号量制御を行なう動画像符号化装置
US5929916A (en) * 1995-12-26 1999-07-27 Legall; Didier J. Variable bit rate encoding
US5850443A (en) * 1996-08-15 1998-12-15 Entrust Technologies, Ltd. Key management system for mixed-trust environments
US6721941B1 (en) * 1996-08-27 2004-04-13 Compuware Corporation Collection of timing and coverage data through a debugging interface
US6009079A (en) * 1997-04-25 1999-12-28 Lucent Technologies Inc. Method for measuring HDT-NIU availability
CN1138402C (zh) * 1997-05-22 2004-02-11 冲电气工业株式会社 传真通信装置及其方法
US6285466B1 (en) * 1998-05-20 2001-09-04 Oki Electric Industry Co. Ltd. Facsimile communication system
US6574587B2 (en) * 1998-02-27 2003-06-03 Mci Communications Corporation System and method for extracting and forecasting computing resource data such as CPU consumption using autoregressive methodology
US6026139A (en) * 1998-06-16 2000-02-15 Intel Corporation Method and apparatus for generating a frequency distribution representation using integrated counter-based instrumentation
US6513065B1 (en) * 1999-03-04 2003-01-28 Bmc Software, Inc. Enterprise management system and method which includes summarization having a plurality of levels of varying granularity
JP3278636B2 (ja) 1999-06-08 2002-04-30 エヌイーシーシステムテクノロジー株式会社 Cpu使用率算出方式、cpu使用率算出方法およびcpu使用率算出用プログラムを記録した記録媒体
JP3309834B2 (ja) * 1999-07-16 2002-07-29 日本電気株式会社 Atm交換装置及びセルバッファ使用率監視方法
US6535906B1 (en) * 1999-07-27 2003-03-18 Nortel Networks Limited System for controlling the effect of transmitting a document across a packet based network
JP2001142746A (ja) * 1999-11-11 2001-05-25 Nec Software Chubu Ltd 計算機システムの負荷監視装置
JP2001344132A (ja) 2000-03-30 2001-12-14 Fujitsu Ltd リアルタイムモニタ装置
JP2002083113A (ja) 2000-09-07 2002-03-22 Zeon Joho System Kk コンピュータネットワークの価値評価方法
US6664964B1 (en) * 2000-11-10 2003-12-16 Emc Corporation Correlation criteria for logical volumes
JP2002373109A (ja) * 2001-06-13 2002-12-26 Nec Corp データ先読みシステムおよび先読み方法
JP3909232B2 (ja) * 2001-10-09 2007-04-25 日本電産サンキョー株式会社 磁気記録データのデータ復調方法
US7219034B2 (en) * 2001-09-13 2007-05-15 Opnet Technologies, Inc. System and methods for display of time-series data distribution
JP3862548B2 (ja) * 2001-11-02 2006-12-27 沖電気工業株式会社 エコーキャンセラ
US7356079B2 (en) * 2001-11-21 2008-04-08 Vixs Systems Inc. Method and system for rate control during video transcoding
JP2003271557A (ja) * 2002-03-18 2003-09-26 Fujitsu Ltd 障害情報分析方法
US6975963B2 (en) * 2002-09-30 2005-12-13 Mcdata Corporation Method and system for storing and reporting network performance metrics using histograms
GB2402504A (en) * 2002-11-12 2004-12-08 Advanced Risc Mach Ltd Processor performance calculation
JP2004234557A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd データ管理方法、コントローラ、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889939A (en) * 1996-06-28 1999-03-30 Kabushiki Kaisha Toshiba Disk drive with a PFA function and monitor value saving control method in the same
JP2002078200A (ja) * 2000-08-22 2002-03-15 Toshiba Corp 監視制御装置及び記憶媒体
CN1466056A (zh) * 2002-06-10 2004-01-07 联想(北京)有限公司 一种机群监控系统和方法
CN1547121A (zh) * 2003-12-10 2004-11-17 中国科学院计算技术研究所 一种大规模机群系统的监控方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MRTG的研究与部署. 孙泳,史忠植.计算机应用,第24卷第3期. 2004
MRTG的研究与部署. 孙泳,史忠植.计算机应用,第24卷第3期. 2004 *

Also Published As

Publication number Publication date
KR20060080847A (ko) 2006-07-11
EP1679600A2 (en) 2006-07-12
US7472188B2 (en) 2008-12-30
KR100629289B1 (ko) 2006-09-28
US20060150029A1 (en) 2006-07-06
CN1801111A (zh) 2006-07-12
JP2006190109A (ja) 2006-07-20
JP4700969B2 (ja) 2011-06-15
EP1679600A3 (en) 2009-07-15

Similar Documents

Publication Publication Date Title
CN100440159C (zh) 提供监控信息的方法和设备
CN100504793C (zh) 信息处理装置、作业执行请求生成装置及其控制方法
US8086544B2 (en) Analysis of energy-related factors for selecting computational job locations
Ren et al. Hierarchical adaptive dynamic power management
US8095933B2 (en) Grid project modeling, simulation, display, and scheduling
US7995474B2 (en) Grid network throttle and load collector
US20100050180A1 (en) Method and system for green computing interchange switching function
AU2006201165A1 (en) Method and apparatus for generating relevance-sensitive collation keys
JP2010244181A (ja) 仮想マシン管理システム,仮想マシン配置設定方法及びそのプログラム
CN107734052A (zh) 面向组件依赖的负载均衡容器调度方法
CA2948700A1 (en) Systems and methods for websphere mq performance metrics analysis
WO2010047170A1 (ja) 算出装置、システム管理装置、算出方法およびプログラム
JP2006040084A (ja) 資源情報収集配信方法およびシステム
JP3993848B2 (ja) 計算機装置及び計算機装置の制御方法
Swaminathan et al. Investigating the effect of voltage-switching on low-energy task scheduling in hard real-time systems
JP5659054B2 (ja) システム管理装置、システム管理方法及びシステム管理プログラム
JP4479431B2 (ja) 情報ライフサイクル管理システム及びそのデータ配置決定方法
CN111444249A (zh) 基于热数据的用户画像生成方法、装置、设备及存储介质
Andro-Vasko et al. Decrease and reset for power-down
Song et al. Compress blocks or not: Tradeoffs for energy consumption of a big data processing system
CN115237572A (zh) 一种多任务调度方法和装置
US20240103935A1 (en) Computer and model generation method
US20230153305A1 (en) Method and system for high-throughput distributed computing of computational jobs
Chen et al. Energy efficiency of map reduce
Peng et al. Performance monitoring for distributed service oriented grid architecture

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081203

Termination date: 20180606