CN102576326A - 操作监测设备、操作监测方法和程序存储介质 - Google Patents

操作监测设备、操作监测方法和程序存储介质 Download PDF

Info

Publication number
CN102576326A
CN102576326A CN2010800453764A CN201080045376A CN102576326A CN 102576326 A CN102576326 A CN 102576326A CN 2010800453764 A CN2010800453764 A CN 2010800453764A CN 201080045376 A CN201080045376 A CN 201080045376A CN 102576326 A CN102576326 A CN 102576326A
Authority
CN
China
Prior art keywords
performance information
representative
grouping
collection
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800453764A
Other languages
English (en)
Other versions
CN102576326B (zh
Inventor
井伊亚纪子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN102576326A publication Critical patent/CN102576326A/zh
Application granted granted Critical
Publication of CN102576326B publication Critical patent/CN102576326B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3096Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents wherein the means or processing minimize the use of computing system or of computing system component resources, e.g. non-intrusive monitoring which minimizes the probe effect: sniffing, intercepting, indirectly deriving the monitored data from other directly available data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

在用于将多种类型的性能信息进行归组以及选择性监测经归组的性能信息中的代表性性能信息的操作监测设备中,有效地监测除了代表性性能信息之外的性能信息的异常,而不会增大正常的监测负荷。监测条件变更单元(12和23)使性能信息收集单元(11)在预定间隔执行对已由性能信息归组单元(22)归组的性能信息中的代表性性能信息的收集。对于除了作为代表性的性能信息以外的性能信息,使性能信息收集单元(11)或者停止对非代表性信息的收集,或者使性能信息收集单元(11)在比用于代表性性能信息的间隔长的间隔处收集非代表性信息。此外,如果代表性性能信息的波动率或波动量超出预定阈值,则针对除作为代表性的性能信息以外的性能信息,或者使性能信息收集单元(11)开始收集,或者使性能信息收集单元(11)在比常规时间短的间隔执行收集。

Description

操作监测设备、操作监测方法和程序存储介质
技术领域
本发明涉及操作监测设备、操作监测方法和程序存储介质,其监测操作监测目标机器的多种类型的性能信息。
背景技术
监测操作监测目标机器的多种类型的性能信息的操作监测设备和操作监测方法是已知的。在此类型的操作监测设备中,通常针对多种类型的性能信息的每一类型设置阈值,以及监测每个性能信息是否超出了阈值。在任一性能信息超出阈值的情况下,操作监测设备检测此异常,并向管理员发送异常报告。
然而,在此类型操作监测设备中,不得不在短间隔中收集各种类型的性能信息,以便更准确地执行操作监测。
出于此原因,存在一个问题,即,用于收集性能信息的负荷变得较重。
因此,建议这样的操作监测设备,其将多种类型的性能信息中具有强关联性的性能信息归组、从经归组的性能信息选择性能信息的代表,以及聚焦于监测所选择的性能信息(例如,参考日本专利申请特开平号2003-263 342)。
在这种操作监测设备中,存在这样的优势,即,由于收集的性能信息有限,所以降低了用于收集性能信息的负荷。
发明内容
[技术问题]
然而,即使将具有强关联性的多条性能信息归组,该群组中的每条性能信息可能不能在每个波动区域(fluctuating region)中示出关联性。
出于此原因,在仅监测性能信息的代表的情况下,存在这样的风险,即,性能信息的非代表的异常会被忽略。
可以通过依据情况动态选择性能信息的代表来在某种程度上减小这种对异常的忽略。然而,这会增加用于依据情况动态选择性能信息的代表的负荷,从而使得实现减小监测负荷这一原始目标将变得相当困难。
本发明的目的在于提供一种操作监测设备、操作监测方法和程序存储介质,其利用将多种类型的性能信息归组并聚焦于监控经归组的性能信息的代表的操作监测设备,解决了上述问题,并且可以有效地监测性能信息的非代表的异常,而不会增加常规时间的监测负荷。
[针对问题的方案]
根据本发明的示例性方面的操作监测设备装置包括性能信息收集装置,用于收集操作监测目标机器的多种类型的性能信息;性能分析装置,用于对由性能信息收集装置收集的性能信息进行分析;性能信息归组装置,用于基于预定条件,将该操作监测目标机器的多种类型的性能信息进行归组,以及监测条件变更装置,用于使性能信息收集装置在预定间隔执行对由性能信息归组装置归组的性能信息的代表进行收集,使性能信息收集装置停止对经归组的性能信息的非代表的收集,或者使性能信息收集装置在比用于性能信息的代表的间隔长的间隔执行对经归组的性能信息的非代表的收集,以及进一步地,在性能信息的代表的波动率或波动量超出预定阈值的情况下,使性能信息收集装置开始对经归组的性能信息的非代表的收集或者使性能信息收集装置在比常规时间短的间隔执行对经归组的性能信息的非代表的收集。
根据本发明的示例性方面的操作监测方法包括:收集操作监测目标机器的多种类型的性能信息,分析所收集的性能信息,基于预定条件将操作监测目标机器的多种类型的性能信息进行归组,以及将用于收集经归组的性能信息的代表的间隔控制为预定间隔,停止由性能信息收集过程执行的对经归组的性能信息的非代表的收集,或者将用于收集经归组的性能信息的非代表的间隔控制为比用于性能信息的代表的间隔长的间隔,以及进一步地,在性能信息的代表的波动率或波动量超出预定阈值的情况下,开始由性能信息收集过程执行的对经归组的性能信息的非代表的收集,或者将用于收集经归组的性能信息的非代表的间隔控制为比常规时间短的间隔。
一种程序记录介质,其上记录有操作监测程序,用于引起计算机执行根据本发明的示例性方面的方法,包括:收集操作监测目标机器的多种类型的性能信息,分析所收集的性能信息,基于预定条件将操作监测目标机器的多种类型的性能信息进行归组,以及将用于收集经归组的性能信息的代表的间隔控制为预定间隔,停止由性能信息收集过程执行的对经归组的性能信息的非代表的收集,或者将用于收集经归组的性能信息的非代表的间隔控制为比用于性能信息的代表的间隔长的间隔,以及进一步地,在性能信息的代表的波动率或波动量超出预定阈值的情况下,开始由性能信息收集过程执行的对经归组的性能信息的非代表的收集,或者将用于收集经归组的性能信息的非代表的间隔控制为比常规时间短的间隔。
[本发明的有益效果]
根据本发明,通过将多种类型的性能信息归组以及聚焦于监测经归组的性能信息的代表的操作监测设备,也可以有效地监测性能信息的非代表的异常,而不会增大常规时间的监测负荷。
附图说明
图1是示出了根据本发明的示例性实施方式的操作监测设备的基础结构的框图。
图2是示出了根据本发明的示例性实施方式的操作监测设备的具体结构的框图。
图3是示出了根据本发明的示例性实施方式的操作监测设备的性能分析单元的结构的框图。
图4是示出了根据本发明的示例性实施方式的操作监测设备的关联性模型生成处理的流程图。
图5是示出了根据本发明的示例性实施方式的操作监测设备的管理员对话处理的流程图。
图6是示出了根据本发明的示例性实施方式的操作监测设备的监测条件变更处理的流程图。
图7是示出了根据本发明的示例性实施方式的操作监测设备的性能信息显示处理的流程图。
图8是示出了根据本发明的示例性实施方式的操作监测设备的使用示例的框图。
图9是示出了根据本发明的示例性实施方式的将在操作监测设备中进行归组的性能信息的示例的说明图。
图10是示出了根据本发明的示例性实施方式的由操作监测设备执行的操作监测的示例的说明图。
图11是示出了根据本发明的示例性实施方式的由操作监测设备执行的性能估计的示例的说明图。
具体实施方式
在下文中,将参考附图描述本发明的操作监测设备、操作监测方法和操作监测程序的示例实施方式。
由本发明的操作监测设备和操作监测方法执行的下述处理操作利用由计算机上的程序(软件)的指令执行的处理、装置或功能实现。
例如,在本发明的操作监测设备由主机计算机(操作监测目标机器)和经由网络与之可通信连接的监测管理器构建的情况下,本发明的操作监测设备通过分别将本发明的操作监测程序划分成用于主机计算机的程序和用于监测管理器的程序以及通过在计算机中安装用于主机计算机的程序和在计算机中安装用于监测管理器的程序而构建出来。
而且,在本发明的操作监测设备仅由主机计算机(操作监测目标机器)构建的情况下,本发明的操作监测设备通过在计算机中安装本发明的用于主机计算机的操作监测程序而构建。
此外,用于监测管理器的程序可以安装在用于监测管理器的多个计算机中以执行分布式处理,或者一个监测管理器可以执行用于主机计算机的多个计算机(其中安装有用于主机计算机的程序)的操作监测。
由此,本发明中的每个处理或装置由具体装置实现,其中程序和计算机彼此合作工作。
此外,例如通过磁盘、光盘、半导体存储器或任何其他计算机可读记录介质提供程序的部分或全部,以及从记录介质读取的程序安装在计算机中并被执行。而且,程序可以不经由记录介质而是直接通过通信线路加载至计算机中并被执行。
图1是示出了根据本发明的示例性实施方式的操作监测设备的基础结构的框图。
如此附图中所示,根据示例性实施方式的操作监测设备包括例如作为操作监测目标机器的主机计算机1,和可通信地连接至主机计算机1的监测管理器2。
具体地,示例性实施方式的操作监测设备包括性能信息收集单元11,其收集主机计算机1的多种类型的性能信息;性能分析单元21,其分析由性能信息收集单元11收集的性能信息;性能信息归组单元22,其基于预定条件将主机计算机1的多种类型的性能信息进行归组;以及监测条件变更单元12和23,其变更用于由性能信息收集单元11收集的性能信息的类型和收集间隔。
监测条件变更单元12和23使性能信息收集单元11在预定间隔执行对由性能信息归组单元22进行归组的性能信息的代表的收集。
而且,监测条件变更单元12和23使性能信息收集单元11停止对性能信息的非代表的收集,或者使性能信息收集单元11在比用于性能信息的代表的间隔长的间隔处执行对性能信息的非代表的收集。
此外,在性能信息的代表的波动率(或波动量)超出预定阈值的情况下,监测条件变更单元12和23使性能信息收集单元11开始收集性能信息的非代表,或者使性能信息收集单元11在比常规时间短的间隔处执行对性能信息的非代表的收集。
根据这种操作监测设备,可以将多种类型的性能信息归组,以及聚焦于监测经归组的性能信息的代表。
因此,可以减小常规时间的监测负荷。
而且,在性能信息的代表波动极大的情况下,可以开始监测性能信息的非代表,或者使其监测间隔变短。
因此,性能信息的非代表的异常也可以得到有效监测,而不会增大常规时间的监测负荷。
在下文中,将参考图2和图3来描述根据示例性实施方式的操作监测设备的具体结构。
图2是示出了根据示例性实施方式的操作监测设备的具体结构的框图。
如此附图中所示,根据示例性实施方式的操作监测设备包括主机计算机1和监测管理器2。主机计算机1包括性能信息收集单元11和监测条件变更单元12。监测管理器2包括性能分析单元21、性能信息归组单元22、监测条件变更单元23、归组信息累积单元24和管理员对话单元25。
主机计算机1的性能信息收集单元11收集主机计算机1的多种类型的性能信息。例如,性能信息收集单元11针对在主机计算机1上执行的web服务、业务服务等收集工作处理时间、CPU负载、存储器使用率等。
主机计算机1的监测条件变更单元12根据来自安装在监测管理器2中的监测条件变更单元23的指引,变更用于由性能信息收集单元11收集的性能信息的收集间隔或性能信息的类型。
监测管理器2的性能分析单元21对由主机计算机1的性能信息收集单元11收集的性能信息进行分析。例如,性能分析单元21对预定性能信息的波动率进行分析,在波动率超出预定阈值的情况下将其评价为异常,以及向管理员等发送异常报告等。
而且,性能分析单元21计算多个性能信息之间的转换函数,并生成预定关联性模型。
监测管理器2的性能信息归组单元22参考由性能分析单元21生成的关联性模型,以及将具有强关联性的性能信息归组。以及性能信息归组单元22向归组信息累积单元24登记经归组的性能信息。
监测管理器2的管理员对话单元25向管理员等示出由性能信息归组单元22归组的性能信息的类型,从而使得该类型的性能信息被由此选作群组中的代表。由管理员等选作代表的类型的性能信息被登记至归组信息累积单元24。
而且,管理员对话单元25使管理员选择各种监测条件,诸如针对常规时间的用于性能信息的代表的收集间隔,是否在常规时间收集性能信息的非代表,针对常规时间的用于性能信息的非代表的收集间隔,以及在性能信息的代表波动的情况下,用于性能信息的非代表的收集间隔。由管理员等选择的各种监测条件被登记至归组信息累积单元24。
监测管理器2的监测条件变更单元23周期性地确认关于向归组信息累积单元24登记的监测条件和经归组信息的信息。监测条件变更单元23根据新登记的内容和更新的内容向主机计算机1的监测条件变更单元12传输经变更的监测条件,从而使得用于由性能信息收集单元11收集的性能信息的收集间隔和类型被变更。
而且,在从性能分析单元21接收对监测条件的变更指令的情况下,监测条件变更单元23向主机计算机1的监测条件变更单元12传输经变更的监测条件,从而使得用于由性能信息收集单元11收集的性能信息的收集间隔和类型被变更。
因此,监测条件变更单元23可以使性能信息收集单元11在预定间隔执行对由性能信息归组单元22归组的性能信息的代表的收集。
而且,监测条件变更单元23可以使性能信息收集单元11停止对性能信息的非代表的收集,或者使性能信息收集单元11在比用于性能信息的代表的间隔长的间隔处执行对性能信息的非代表的收集。
此外,在性能信息的代表的波动率(或波动量)超出预定阈值的情况下,监测条件变更单元23可以使性能信息收集单元11开始对性能信息的非代表的收集,或者使性能信息收集单元11在比常规时间短的间隔处执行对性能信息的非代表的收集。
图3是示出了根据本发明的示例性实施方式的操作监测设备的性能分析单元21的详细结构的框图。
如此附图中所示,示例性实施方式的性能分析单元21包括信息收集单元211,性能信息累积单元212,关联性模型生成单元213,关联性模型累积单元214,性能值波动率分析单元215和性能估计单元216。
信息收集单元211接收由主机计算机1的性能信息收集单元11收集的性能信息,并将其累积在性能信息累积单元212中。
关联性模型生成单元213通过下述操作来在多条性能信息之间生成预定关联性模型,该性能信息指示主机计算机1的操作状态:针对一段时间从性能信息累积单元212取出性能信息,以及计算任意两条性能信息之间的时间序列的转换函数(参考图4)。
关联性模型累积单元214累积由关联性模型生成单元213生成的关联性模型。
性能信息归组单元22基于此处累积的关联性模型的转换函数,将具有强关联性的性能信息进行归组。
性能值波动率分析单元215从归组信息累积单元24获取由管理员等设置的监测条件,并且监测性能信息的代表的波动。
具体地,性能值波动率分析单元215在预定间隔处从性能信息累积单元212获取性能信息的代表,并计算波动率。
在性能信息的代表的波动率超出预定阈值的情况下,性能值波动率分析单元215通知监测条件变更单元23和12变更用于同一群组中的性能信息的非代表的监测条件,从而使得用于由性能信息收集单元11收集的性能信息的收集间隔被变更。
性能估计单元216基于在关联性模型累积单元214中累积的转换函数和性能信息的代表的测量值来估计性能信息的非代表。
根据这种性能估计单元216,即使在性能信息收集单元11未收集性能信息的非代表时,也可以向管理员示出估计的性能值。
例如,当性能信息收集单元11在收集性能信息的非代表时,可以向管理员等示出实际收集的性能信息的非代表,并且当性能信息收集单元11未在收集性能信息的非代表时,可以向管理员等示出由性能估计单元216估计的性能信息的非代表。
接着,将参考图4到图7描述根据示例性实施方式的、在操作监测设备中执行的各种处理的处理过程。
图4是示出了根据本发明的示例性实施方式的操作监测设备的关联性模型生成处理的流程图。
如此附图中所示,在关联性模型生成处理中,首先,性能分析单元21的关联性模型生成单元213从性能信息累积单元212读取性能信息的日志(步骤S101),并且判断是否存在未分析的性能信息(步骤S102)。
在判断出存在未分析的性能信息的情况下,关联性模型生成单元213计算未分析的该条性能信息与它的其他性能信息之间的转换函数(步骤S103),计算利用函数近似中的误差(步骤S104),并且向关联性模型累积单元214添加关联性模型(步骤S105)。
重复一系列上述处理(步骤S102至步骤S105),直到不存在未分析的性能信息。
图5是示出了根据本发明的示例性实施方式的操作监测设备的管理员对话处理的流程图。
如此附图中所示,在管理员对话处理中,首先,管理员对话单元25在用于管理员的屏幕上显示由性能信息归组单元22归组的性能信息的类型(步骤S201),并且使管理员等将该类型的性能信息选作群组中的代表。此处,在由管理员等执行选择操作时(步骤S202/是),被选作代表的类型的性能信息被登记至归组信息累积单元24(步骤S203)。
接着,管理员对话单元25在用于管理员的屏幕上显示各种监测条件,诸如针对常规时间的用于性能信息的代表的收集间隔,是否在常规时间收集性能信息的非代表,针对常规时间的用于性能信息的非代表的收集间隔,以及在性能信息的代表波动的情况下、用于性能信息的非代表的收集间隔(步骤S204),以及使管理员等选择各种监测条件。
当由管理员等执行选择操作时(步骤S205/是),将选择的各种监测条件登记至归组信息累积单元24(步骤S206)。
图6是示出了根据本发明的示例性实施方式的操作监测设备的监测条件变更处理的流程图。
如此附图中所示,在监测条件变更处理中,首先,监测条件变更单元23周期性地确认关于向归组信息累积单元24登记的经归组的信息和监测条件(针对常规时间的监测条件和针对波动情况的监测条件)的信息(步骤S301)。
而且,监测条件变更单元23基于来自性能分析单元21的监测条件变更指示来判断性能信息的代表的波动率是否超出预定阈值(步骤S302)。
在判断出性能信息的代表的波动率未超出预定阈值的情况下(步骤S302/否),监测条件变更单元23向主机计算机1的监测条件变更单元12传输针对常规时间的监测条件,从而使得性能信息由性能信息收集单元11根据针对常规时间的监测条件进行收集(步骤S303)。
另一方面,在判断出性能信息的代表的波动率超出预定阈值的情况下(步骤S302/是),监测条件变更单元23向主机计算机1的监测条件变更单元12传输针对波动情况的监测条件,从而使得性能信息由性能信息收集单元11根据针对波动情况的监测条件进行收集(步骤S304)。
图7是示出了根据本发明的示例性实施方式的操作监测设备的性能信息显示处理的流程图。
如此附图中所示,在性能信息显示处理中,首先,判断是否存在来自管理员等的性能显示请求(步骤S401)。
在判断出存在来自管理员等的性能显示请求的情况下,判断请求显示的性能信息是否是性能信息的代表(步骤S402)。
以及在判断出该性能信息是性能信息的代表的情况下(步骤S402/是),在用于管理员的屏幕上显示由性能信息收集单元11实际收集的性能信息的代表(步骤S403)。
另一方面,在判断出该性能信息不是性能信息的代表的情况下(步骤S402/否),判断性能信息收集单元11是否在收集性能信息的非代表(步骤S404)。在判断出性能信息收集单元11在收集性能信息的非代表的情况下(步骤S404/是),在用于管理员的屏幕上显示由性能信息收集单元11收集的性能信息的非代表(步骤S403)。
而且,在判断出性能信息收集单元11未在收集性能信息的非代表的情况下(步骤S404/否),在用于管理员的屏幕上显示由性能估计单元216估计的性能信息的非代表(步骤S405)。
接下来,将参考图8至图11来描述根据本发明的示例性实施方式的操作监测设备的操作。
图8是示出了根据本发明的示例性实施方式的操作监测设备的使用示例的框图。
在此附图中示出的使用示例示出了这样的情况,即,多个主机计算机1的操作监测由一个监测管理器2执行。在此情况下,在多个主机计算机1的每个主机计算机中安装用于主机计算机的程序,以及在监测管理器2中安装用于监测管理器的程序。
图9是示出了根据本发明的示例性实施方式的将在操作监测设备中进行归组的性能信息的示例的说明图。
在此附图中示出的示例中,在主机计算机1的多种类型的性能信息中,将CPU负载、工作1的处理时间和存储器使用率A作为性能信息进行检测。
每个性能信息在时间序列中改变,并且由主机计算机1的性能信息收集单元11收集性能信息,并且该性能信息被提供给监测管理器2的性能分析单元21。
性能分析单元21累积每个性能信息,并且基于累积的性能信息来生成预定的关联性模型。
当在这些性能信息中存在关联性时,监测管理器2的性能信息归组单元22将主机计算机1的CPU负载、工作1的处理时间和存储器使用率A进行归组。
管理员对话单元25向管理员等示出经归组性能信息的类型。因此,管理员等可以将该类型的性能信息选作群组中的代表。
此处,假设CPU负载被选作性能信息的代表。作为代表的CPU负载的性能数据持续地在常规间隔处进行收集。
而且,管理员等被要求选择用于除作为群组中的代表的CPU负载以外的性能信息的监测条件。
例如,管理员等以这样的方式来执行对针对常规时间的监测条件的选择,即,工作1的处理时间在是用于监测CPU负载的监测间隔三倍长的时间间隔处进行监测,以及只要在作为代表的CPU负载中没有波动,则不监测存储器使用率A。
而且,例如,管理员等以这样的方式来选择针对波动情况的监测条件,即,在作为代表的CPU负载中存在波动的情况下,工作1的处理时间和存储器使用率A在与用于监测CPU负载的监测间隔相同的时间间隔处进行监测。
从管理员对话单元25向性能信息归组单元22通知由管理员等选择的监测条件。
性能信息归组单元22将由管理员等选择的监测条件登记至归组信息累积单元24。
监测条件变更单元23周期性地确认关于登记至归组信息累积单元24的监测条件和经归组信息的信息,并且根据新登记的内容和更新的内容向主机计算机1的监测条件变更单元12传输经变更的监测条件。因此,用于由性能信息收集单元11收集的性能信息的收集间隔和类型被变更。
图10是示出了根据本发明的示例性实施方式的由操作监测设备执行的操作监测的示例的说明图。
在如此附图中所示CPU负载从逝去的时间t1波动的情况下,监测管理器2的性能值波动率分析单元215判断作为代表的CPU负载的波动率是否超出预定阈值。
此处,在作为代表的CPU负载的波动率超出预定阈值的情况下,监测条件变更单元23通知主机计算机1的监测条件变更单元12基于针对波动情况的监测条件来执行对登记至归组信息累积单元24的群组中的所有的性能信息的监测。因此,用于由性能信息收集单元11收集的性能信息的收集间隔和类型被变更。
而且,当作为代表的CPU负载的波动率在逝去的时间t2处等于或小于预定阈值时,以这样的方式返回监测条件,即,基于登记至归组信息累积单元24的针对常规时间的监测条件,用于工作1的处理时间的监测间隔是3倍,而不监测存储器使用率A。
图11是示出了根据本发明的示例性实施方式的由操作监测设备执行的性能估计的示例的说明图。
当以这种方式设置监测条件时,即,如此附图中所示,性能信息的代表是CPU负载,并且在常规时间处不监测性能信息2,存在这样的情况,即,管理员等需要确认性能信息2。
在此情况下,示例性实施方式的性能估计单元216从关联性模型累积单元214获取用于未被监测的性能信息2的转换函数,获取作为代表的CPU负载的性能数据,根据二者计算性能信息2的测量值,并且向管理员等示出该测量值。
如上文所述,根据示例性实施方式,收集操作监测目标机器的多种类型的性能信息的性能信息收集单元11,分析由性能信息收集单元11收集的性能信息的性能分析单元21,基于预定条件将操作监测目标机器的多种类型的性能信息进行归组的性能信息归组单元22,以及变更用于由性能信息收集单元11收集的性能信息的收集间隔和类型的监测条件变更单元12和23被包括进来,并且监测条件变更单元12和23使性能信息收集单元11在预定间隔处执行对由性能信息归组单元22归组的性能信息的代表的收集。而且,停止由性能信息收集单元11对性能信息的非代表的收集,或者在比用于性能信息的代表的间隔短的间隔处执行由性能信息收集单元11对性能信息的非代表的收集。此外,在性能信息的代表的波动率或波动量超出预定阈值的情况下,开始由性能信息收集单元11对性能信息的非代表的收集,或者在比常规时间短的间隔处执行由性能信息收集单元11对性能信息的非代表的收集。
因此,在将多种类型的性能信息进行归组以及聚焦于监测经归组性能信息的代表的操作监测设备中,也可以有效地监测性能信息的非代表的异常,而不会在常规时间增加监测负载。
而且,由于性能分析单元21计算多种类型的性能信息之间的转换函数,以及性能信息归组单元22基于转换函数将具有强关联性的性能信息进行归组,可以在将多种类型的性能信息进行归组以及聚焦于监测经归组性能信息的代表的操作监测设备中以较高准确性获得整个群组的性能信息。
而且,由于性能估计单元216基于性能信息的代表和转换函数对性能信息的非代表进行估计,所以可以向管理员示出性能信息的非代表的估计值,即使性能信息收集单元11未在收集性能信息的非代表。
而且,在性能信息收集单元11收集性能信息的非代表时,操作监测设备向管理员等示出实际收集的性能信息的非代表,并且在性能信息收集单元11未在收集性能信息的非代表时,向管理员等示出由性能信息估计单元216估计的性能信息的非代表。因此,无论是否执行监测,管理员等请求的性能信息都可以被示出,并且在执行监测时,可以通过示出实际测量值而不是估计值来提高所示数据值的准确性。
此外,根据示例性实施方式,管理员对话单元25根据由管理员等进行的设置操作设置以下中至少一个:性能信息的代表的类型,针对常规时间的用于性能信息的代表的收集间隔,是否在常规时间收集性能信息的非代表,针对常规时间的用于性能信息的非代表的收集间隔,以及针对性能信息的代表波动的情况、用于性能信息的非代表的收集间隔。因此,可以根据作为监测目标的工作、作为监测目标的主机计算机1和执行监测的监测管理器2来任意变更监测条件,以及执行适当的操作监测。
尽管已参考本发明的示例性实施方式具体示出并描述了本发明,但是本发明并不限于这些实施方式。本领域普通技术人员应当理解,在不脱离由所附权利要求限定的本发明精神和范围的前提下,可以对形式和细节做出各种改变。
本申请基于2009年10月8日提交的日本专利申请号2009-233994并要求其优先权权益,在此通过参考将该申请的全部内容并入。
工业适用性
本发明适用于操作监测设备、操作监测方法和操作监测程序,其监测操作监测目标机器的多种类型的性能信息。本发明在这样的领域中是有用的,其中,监测提供例如web服务或业务服务的信息和通信服务的信息处理设备等的各种性能,以及尤其适用于这样的领域,其中需要在正确监测性能信息的同时降低监测负荷。
附图标记列表
1  主机计算机
2  监测管理器
11  性能信息收集单元
12  监测条件变更单元
21  性能分析单元
22  性能信息归组单元
23  监测条件变更单元
24  归组信息累积单元
25  管理员对话单元
211  信息收集单元
212  性能信息累积单元
213  关联性模型生成单元
214  关联性模型累积单元
215  性能值波动率分析单元
216  性能估计单元

Claims (15)

1.一种操作监测设备,包括:
性能信息收集装置,用于收集操作监测目标机器的多种类型的性能信息;
性能分析装置,用于对由所述性能信息收集装置收集的所述性能信息进行分析;
性能信息归组装置,用于基于预定条件,将所述操作监测目标机器的所述多种类型的所述性能信息进行归组;以及
监测条件变更装置,用于使所述性能信息收集装置在预定间隔执行对由所述性能信息归组装置归组的所述性能信息的代表的收集,使所述性能信息收集装置停止对经归组的所述性能信息的非代表的收集,或者使所述性能信息收集装置在比用于所述性能信息的所述代表的所述间隔长的间隔执行对经归组的所述性能信息的所述非代表的收集,以及进一步地在所述性能信息的所述代表的波动率或波动量超出预定阈值的情况下,使所述性能信息收集装置开始对经归组的所述性能信息的所述非代表的收集或者使所述性能信息收集装置在比常规时间短的间隔执行对经归组的所述性能信息的所述非代表的收集。
2.根据权利要求1的操作监测设备,其中所述性能分析装置计算所述多种类型的所述性能信息之间的转换函数;以及
所述性能信息归组装置基于所述转换函数来对具有强关联性的所述性能信息进行归组。
3.根据权利要求2的操作监测设备,进一步包括性能估计装置,用于基于所述性能信息的所述代表和所述转换函数来估计所述性能信息的所述非代表。
4.根据权利要求3的操作监测设备,其中当所述性能信息收集装置在收集所述性能信息的所述非代表时,向管理员示出实际收集的所述性能信息的所述非代表,而当所述性能信息收集装置未在收集所述性能信息的所述非代表时,向所述管理员示出由所述性能估计装置估计的所述性能信息的所述非代表。
5.根据权利要求1-4中任一的操作监测设备,进一步包括管理员对话装置,用于根据由管理员进行的设置操作来设置以下至少一个:指定所述性能信息的所述代表的所述性能信息的类型,针对常规时间的用于所述性能信息的所述代表的收集间隔,是否在常规时间收集所述性能信息的所述非代表,针对常规时间的用于所述性能信息的所述非代表的收集间隔,以及在针对所述性能信息的所述代表波动的情况下,用于所述性能信息的所述非代表的收集间隔。
6.一种操作监测方法,包括:
收集操作监测目标机器的多种类型的性能信息;
分析收集的所述性能信息;
基于预定条件来将所述操作监测目标机器的所述多种类型的所述性能信息进行归组;以及
将用于收集经归组的所述性能信息的代表的间隔控制为预定间隔,停止由所述性能信息收集过程执行的对经归组的所述性能信息的非代表的收集,或者将用于收集经归组的所述性能信息的非代表的间隔控制为比用于所述性能信息的所述代表的所述间隔长的间隔,以及进一步地,在所述性能信息的所述代表的波动率或波动量超出预定阈值的情况下,开始由所述性能信息收集过程执行的对经归组的所述性能信息的所述非代表的收集,或者将用于收集经归组的所述性能信息的所述非代表的所述间隔控制为比常规时间短的间隔。
7.根据权利要求6的操作监测方法,其中
所述分析收集的所述性能信息计算所述多种类型的所述性能信息之间的转换函数;以及
所述将所述多种类型的所述性能信息进行归组基于所述转换函数来将具有强关联性的所述性能信息进行归组。
8.根据权利要求7的操作监测方法,进一步包括:基于所述性能信息的所述代表和所述转换函数来估计所述性能信息的所述非代表。
9.根据权利要求8的操作监测方法,其中当所述性能信息收集装置在收集所述性能信息的所述非代表时,向管理员示出实际收集的所述性能信息的所述非代表,而当所述性能信息收集装置未在收集所述性能信息的所述非代表时,向所述管理员示出基于所述性能信息的所述代表和所述转换函数估计的所述性能信息的所述非代表。
10.根据权利要求6-9中任一的操作监测方法,进一步包括:根据由管理员进行的设置操作来设置以下至少一个:指定所述性能信息的所述代表的所述性能信息的类型,针对常规时间的用于所述性能信息的所述代表的收集间隔,是否在常规时间收集所述性能信息的所述非代表,针对常规时间的用于所述性能信息的所述非代表的收集间隔,以及在针对所述性能信息的所述代表波动的情况下,用于所述性能信息的所述非代表的收集间隔。
11.一种程序记录介质,其上记录有操作监测程序,用于引起计算机执行方法,所述方法包括:
收集操作监测目标机器的多种类型的性能信息;
分析收集的所述性能信息;
基于预定条件来将所述操作监测目标机器的所述多种类型的所述性能信息进行归组;以及
将用于收集经归组的所述性能信息的代表的间隔控制为预定间隔,停止由所述性能信息收集过程执行的对经归组的所述性能信息的非代表的收集,或者将用于收集经归组的所述性能信息的非代表的间隔控制为比用于所述性能信息的所述代表的所述间隔长的间隔,以及进一步地在所述性能信息的所述代表的波动率或波动量超出预定阈值的情况下,开始由所述性能信息收集过程执行的对经归组的所述性能信息的所述非代表的收集,或者将用于收集经归组的所述性能信息的所述非代表的所述间隔控制为比常规时间短的间隔。
12.根据权利要求11的程序记录介质,其上记录有所述操作监测程序,其中
所述分析收集的所述性能信息计算所述多种类型的所述性能信息之间的转换函数;以及
所述将所述多种类型的所述性能信息进行归组基于所述转换函数来将具有强关联性的所述性能信息进行归组。
13.根据权利要求12的程序记录介质,其上记录有所述操作监测程序,进一步包括:基于所述性能信息的所述代表和所述转换函数来估计所述性能信息的所述非代表。
14.根据权利要求13的程序记录介质,其上记录有所述操作监测程序,其中当所述性能信息收集装置在收集所述性能信息的所述非代表时,向管理员示出实际收集的所述性能信息的所述非代表,而当所述性能信息收集装置未在收集所述性能信息的所述非代表时,向所述管理员示出基于所述性能信息的所述代表和所述转换函数估计的所述性能信息的所述非代表。
15.根据权利要求11-14中任一程序记录介质,其上记录有所述操作监测程序,进一步包括:根据由管理员进行的设置操作来设置以下至少一个:指定所述性能信息的所述代表的所述性能信息的类型,针对常规时间的用于所述性能信息的所述代表的收集间隔,是否在常规时间收集所述性能信息的所述非代表,针对常规时间的用于所述性能信息的所述非代表的收集间隔,以及在针对所述性能信息的所述代表波动的情况下,用于所述性能信息的所述非代表的收集间隔。
CN201080045376.4A 2009-10-08 2010-10-04 操作监测设备、操作监测方法和程序存储介质 Active CN102576326B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009-233994 2009-10-08
JP2009233994 2009-10-08
PCT/JP2010/067704 WO2011043447A1 (ja) 2009-10-08 2010-10-04 運用監視装置、運用監視方法及びプログラム記憶媒体

Publications (2)

Publication Number Publication Date
CN102576326A true CN102576326A (zh) 2012-07-11
CN102576326B CN102576326B (zh) 2015-08-19

Family

ID=43856897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080045376.4A Active CN102576326B (zh) 2009-10-08 2010-10-04 操作监测设备、操作监测方法和程序存储介质

Country Status (5)

Country Link
US (1) US20110218770A1 (zh)
EP (1) EP2487593B1 (zh)
JP (1) JP5527324B2 (zh)
CN (1) CN102576326B (zh)
WO (1) WO2011043447A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301883A (zh) * 2015-06-26 2017-01-04 精工爱普生株式会社 网络系统、以及网络系统的控制方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10491650B1 (en) * 2012-02-06 2019-11-26 Amazon Technologies, Inc. Monitoring performance of computing devices
JP5703407B1 (ja) * 2014-03-28 2015-04-22 株式会社日立ハイテクノロジーズ 情報処理装置、情報処理方法、情報システムおよびプログラム
JP6667203B2 (ja) * 2015-03-18 2020-03-18 キヤノン株式会社 情報処理装置およびその制御方法
US10848408B2 (en) * 2015-03-26 2020-11-24 Vmware, Inc. Methods and apparatus to control computing resource utilization of monitoring agents
US9923965B2 (en) 2015-06-05 2018-03-20 International Business Machines Corporation Storage mirroring over wide area network circuits with dynamic on-demand capacity
WO2017020973A1 (en) * 2015-08-03 2017-02-09 Missio B.V. Data loggger and sampling and encoding methods for use in a data logger
US9923784B2 (en) 2015-11-25 2018-03-20 International Business Machines Corporation Data transfer using flexible dynamic elastic network service provider relationships
US10057327B2 (en) 2015-11-25 2018-08-21 International Business Machines Corporation Controlled transfer of data over an elastic network
US9923839B2 (en) * 2015-11-25 2018-03-20 International Business Machines Corporation Configuring resources to exploit elastic network capability
US10177993B2 (en) 2015-11-25 2019-01-08 International Business Machines Corporation Event-based data transfer scheduling using elastic network optimization criteria
US10581680B2 (en) 2015-11-25 2020-03-03 International Business Machines Corporation Dynamic configuration of network features
US10216441B2 (en) 2015-11-25 2019-02-26 International Business Machines Corporation Dynamic quality of service for storage I/O port allocation
JP6648546B2 (ja) * 2016-02-09 2020-02-14 富士通株式会社 情報処理装置、性能データ収集プログラムおよび性能データ収集方法
JP7067108B2 (ja) * 2018-02-20 2022-05-16 コニカミノルタ株式会社 情報処理システム、情報処理装置、および、情報処理プログラム
US10719247B2 (en) * 2018-03-20 2020-07-21 Kabushiki Kaisha Toshiba Information processing device, information processing method, estimation device, estimation method, and computer program product
JP6800904B2 (ja) 2018-03-20 2020-12-16 株式会社東芝 モデル生成装置、情報処理装置、モデル生成方法およびプログラム
JP7360036B2 (ja) * 2019-12-24 2023-10-12 富士通株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099294A (ja) * 2001-09-26 2003-04-04 Keyence Corp データ記録装置
JP2003263342A (ja) * 2002-03-07 2003-09-19 Telecommunication Advancement Organization Of Japan 情報処理装置の監視装置および監視方法並びにそのプログラム
JP2006018369A (ja) * 2004-06-30 2006-01-19 Hitachi Electronics Service Co Ltd システム改善支援システム
US20060277295A1 (en) * 2005-06-03 2006-12-07 Mineyoshi Masuda Monitoring system and monitoring method
US20080132257A1 (en) * 2006-12-05 2008-06-05 Kenny Fok Methods and apparaus for requesting wireless communication device performance data and providing the data in optimal file size
CN101339596A (zh) * 2008-08-26 2009-01-07 腾讯科技(深圳)有限公司 一种对计算机软件系统进行保护的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3818901B2 (ja) * 2000-12-21 2006-09-06 富士通株式会社 記録媒体、ネットワーク監視装置、および、プログラム
JP4841982B2 (ja) * 2006-03-20 2011-12-21 富士通株式会社 性能情報収集方法、装置、及びプログラム
JP2009233994A (ja) 2008-03-27 2009-10-15 Daikyonishikawa Corp ティアライン付スラッシュ成形表皮材の成形方法及び成形装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099294A (ja) * 2001-09-26 2003-04-04 Keyence Corp データ記録装置
JP2003263342A (ja) * 2002-03-07 2003-09-19 Telecommunication Advancement Organization Of Japan 情報処理装置の監視装置および監視方法並びにそのプログラム
JP2006018369A (ja) * 2004-06-30 2006-01-19 Hitachi Electronics Service Co Ltd システム改善支援システム
US20060277295A1 (en) * 2005-06-03 2006-12-07 Mineyoshi Masuda Monitoring system and monitoring method
US20080132257A1 (en) * 2006-12-05 2008-06-05 Kenny Fok Methods and apparaus for requesting wireless communication device performance data and providing the data in optimal file size
CN101339596A (zh) * 2008-08-26 2009-01-07 腾讯科技(深圳)有限公司 一种对计算机软件系统进行保护的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JOSEF PETEK: "Performance Monitor For Gas Turbines", 《PRODUCT LINE LEADER,PERFORMANCE SOFTWARE GE ENERGY》, vol. 25, no. 1, 31 December 2005 (2005-12-31) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301883A (zh) * 2015-06-26 2017-01-04 精工爱普生株式会社 网络系统、以及网络系统的控制方法
CN106301883B (zh) * 2015-06-26 2019-09-03 精工爱普生株式会社 网络系统、以及网络系统的控制方法

Also Published As

Publication number Publication date
CN102576326B (zh) 2015-08-19
JP5527324B2 (ja) 2014-06-18
JPWO2011043447A1 (ja) 2013-03-04
WO2011043447A1 (ja) 2011-04-14
EP2487593A4 (en) 2017-06-21
EP2487593A1 (en) 2012-08-15
US20110218770A1 (en) 2011-09-08
EP2487593B1 (en) 2019-05-29

Similar Documents

Publication Publication Date Title
CN102576326A (zh) 操作监测设备、操作监测方法和程序存储介质
WO2011083687A1 (ja) 運用管理装置、運用管理方法、及びプログラム記憶媒体
US8677191B2 (en) Early detection of failing computers
JP6160673B2 (ja) 運用管理装置、運用管理方法、及びプログラム
CN102693177B (zh) 虚拟机故障诊断方法、处理方法及其装置和系统
US20160224898A1 (en) Application performance analyzer and corresponding method
CN101620562B (zh) 一种嵌入式系统性能的评估方法及系统
CN101595457A (zh) 负载平衡剖析
JP2010526352A (ja) 統計的な分析を利用した性能障害管理システム及びその方法
US20100287019A1 (en) Server farm management
JPWO2010032701A1 (ja) 運用管理装置、運用管理方法、および運用管理プログラム
CN111309502A (zh) 固态硬盘寿命预测方法
US8281102B2 (en) Computer-readable recording medium storing management program, management apparatus, and management method
US9235463B2 (en) Device and method for fault management of smart device
CN108809760A (zh) 数据采样系统中采样周期的控制方法和装置
CN108664346A (zh) 分布式存储系统的节点异常的定位方法、装置和系统
CN103502951A (zh) 操作管理系统、操作管理方法及其程序
CN110069379B (zh) 监控指标的筛选方法及筛选装置
CN111506422B (zh) 事件分析方法及系统
CN109491610A (zh) 一种基于硬盘配置的存储带宽分析方法及装置
CN113419852A (zh) 微服务的请求响应方法、装置、设备及存储介质
WO2015182072A1 (ja) 因果構造推定システム、因果構造推定方法およびプログラム記録媒体
CN112838962A (zh) 一种大数据集群的性能瓶颈检测方法及装置
CN111369033B (zh) 运维指标的取值分布的预测方法和装置
CN110489967B (zh) 程序运行风险的分析方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant