CN102779086A - 监视服务器以及监视评价方法 - Google Patents
监视服务器以及监视评价方法 Download PDFInfo
- Publication number
- CN102779086A CN102779086A CN2012100421995A CN201210042199A CN102779086A CN 102779086 A CN102779086 A CN 102779086A CN 2012100421995 A CN2012100421995 A CN 2012100421995A CN 201210042199 A CN201210042199 A CN 201210042199A CN 102779086 A CN102779086 A CN 102779086A
- Authority
- CN
- China
- Prior art keywords
- mentioned
- row
- estimate
- evaluation
- service data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Debugging And Monitoring (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明涉及一种监视服务器以及监视评价方法,表示对系统内的监视对象设备以及监视项目的监视的充分性。监视服务器从装置接收运行数据,按照由管理者终端指示的观点,使管理者终端输出接收到的运行数据,通过输出运行数据,使用户监视装置以及监视项目,基于运行数据、输出设定、访问日志以及第1期间,生成包含第1信息和表示监视的充分性的第1指标的第一评价值,基于第1评价值,生成包含第2信息和表示监视的充分性的第2指标的第2评价值,基于第2评价值,生成包含第3信息和表示监视的充分性的第3指标的第3评价值,生成用于显示第1、第2、第3评价值的数据。
Description
技术领域
本发明涉及监视服务器,尤其涉及评价监视业务的监视服务器。
背景技术
一般的监视工具为了使得容易掌握计算机系统上的故障或故障的预兆,具备表示计算机系统的运行状况的数据(以下称为运行数据)的可视化功能、以及运行数据表示异常值时的警报发送功能。运行数据的可视化功能是用于运用管理者目视确认运行数据的功能,警报发送功能是用于机械性地检查运行数据的功能。
为了降低计算机系统的运用成本,需要尽可能减少基于目视的监视的确认,增加基于计算机的机械性检查的确认。但是,难以对全部的监视进行机械性检查,一般保留一部分基于目视的确认。保留基于目视的确认的理由如下所示。
第一理由是,对于运用管理者来说,难以将用于在运行数据表示异常值时发送警报的条件预先正确地设定。例如,在将发送警报的条件设定得过于严格的情况下,发生大量的不需要的警报。另一方面,在将发送警报的条件设定得过于宽松的情况下,忽视故障或故障的预兆的可能性变高。
因此,一般的监视工具具有对警报附加等级的功能。即,对根据严格的阈值检查了运行数据的结果发生的警报附加“异常等级”。并且,在被通知到“异常等级”的警报的情况下,运用管理者立即目视确认运行数据所示的故障等,采取必要的措施。此外,对根据宽松的阈值检查了运行数据的结果发生的警报附加“注意等级”。并且,在被通知到“注意等级”的警报的情况下,运用管理者目视确认运行数据所示的故障等,随后采取措施。
此外,为了支持该功能,存在基于过去的运行数据自动生成警报发送条件的设定的监视工具。
第二理由是,在运行数据所示的值的趋势大幅改变的时期,运用管理者难以事先预测有效的警报发送条件。运行数据所示的值的趋势大幅改变的时期例如有变更了计算机系统所包括的装置等时、追加了在计算机系统中动作的应用时、以及应用的使用者的繁忙期等。在这样的时期,运用管理者基于过去的运行数据,难以预测警报发送条件,因此需要进行目视确认,直到运行数据的趋势稳定。
如上所述,计算机系统中的一般的监视业务通过运用管理者的目视确认和基于警报发送功能的机械性检查来进行。但是,在进行将运用管理者的目视确认和机械性的检查组合的监视业务的情况下,一部分运行数据可能不被充分地监视。例如,可能会发生打算进行目视确认而被设定了宽松的警报发送条件的运行数据实际上没有被目视确认的情况。这表示漏掉了必要的监视,导致忽视故障。
为了防止这样的监视的遗漏,需要通过某种方法事先评价将目视确认和机械性的检查组合的监视业务的充分性。但是,利用现有技术也未能定量地评价将目视确认和机械性的检查组合的监视业务的充分性。
用于评价目视确认的充分性的值有监视工具的各画面的页面浏览数、以及唯一用户(唯一访问者)数。另一方面,用于评价机械性检查的充分性的值有警报发送条件的数量、以及实际发送的警报的数量。但是,由于两者的值的测定方法完全不同,因此如果不定义某种评价方法,则不能评价两者的关联性。
此外,以往,将组合目视确认和机械性检查的监视业务的充分性进行定量化的方法中有计算运用管理者所浏览的警报、解决的警报的数量、以及解决的警报的比率的方法。
例如,在将从监视工具接收到的警报作为事件(incident)来保持、并计算该事件的处理率的计算机系统中,接收警报并实际进行目视确认的比率越多、即将目视确认和机械性的监视组合的监视业务越充分,则事件的处理率越高。因此,能够通过事件的处理率,将针对发生事件的监视对象设备的监视的充分性定量化。
进而,改善计算机系统的监视业务的方法中提出了提高故障的自动检测精度的技术(例如,参照专利文献1)、或减少用于自动检测的负荷的技 术(例如,参照专利文献2)等。
先行技术文献
专利文献
专利文献1:日本特开2006-146668号公报
专利文献2:日本特开2005-285040号公报
发明要解决的问题
在使用了上述的将组合目视确认和机械性检查的监视业务的充分性进行定量化的方法的情况下,不能事先对针对尚未发生事件、即正常动作的监视对象设备的监视的充分性进行定量。
此外,专利文献1及专利文献2虽然改善机械性检查,但不能防止在将目视确认和机械性的检查组合的情况下可能发生的监视遗漏。
发明内容
本发明的目的是为了防止在将目视确认和机械性的检查组合的情况下可能发生的监视遗漏,对计算机系统的运用管理者提供表示针对计算机系统内的各监视对象设备以及监视项目的监视的充分性的指标。
用于解决问题的手段
示出本发明的典型的一例则如下。即,一种监视服务器,与取得与预先设定的监视项目有关的运行数据的装置、以及输出上述运行数据的管理者终端连接,具备处理器以及存储器,其特征在于,上述监视服务器从上述装置接收运行数据;按照由上述管理者终端指示的观点(视角),生成用于上述管理者终端将接收到的运行数据输出的输出数据;为了使上述用户监视上述装置以及上述监视项目,将生成的上述输出数据向上述管理者终端发送;上述管理者终端取得用于输出上述运行数据的输出设定、表示从上述管理者终端输出上述运行数据的履历的访问日志、以及输出上述运行数据的第1期间;基于接收到的上述运行数据、取得的上述输出设定、取得的上述访问日志以及上述第1期间,生成包含第1信息和第1指标的第1评价值,该第1信息包含上述装置、上述监视项目、上述观点以及上述用户,该第1指标表示是否充分进行了上述第1信息所示的监视;基于上述第1评价值,生成包含第2信息和第2指标的第2评价值,该第2信 息包含上述装置、上述监视项目以及上述观点,该第2指标表示上述第2信息所示的监视的充分性;基于上述第2评价值,生成包含第3信息和第3指标的第3评价值,该第3信息包含上述装置以及监视项目,该第3指标表示上述第3信息所示的监视的充分性;将上述第1评价值、上述第2评价值以及上述第3评价值保持在上述存储器中;生成用于输出上述第1评价值、上述第2评价值以及上述第3评价值的数据。
发明效果
根据本发明的一个实施方式,能够防止在将目视确认和机械性的检查组合的情况下可能发生的监视遗漏。
附图说明
图1是表示本发明的实施方式的计算机系统的模块图。
图2是表示本发明的实施方式的监视服务器的物理结构的模块图。
图3是表示本发明的实施方式的数据库所保存的数据的模块图。
图4是表示本发明的实施方式的运行数据的说明图。
图5是表示本发明的实施方式的运行数据显示设定的说明图。
图6是表示本发明的实施方式的运用管理者信息的说明图。
图7是表示本发明的实施方式的访问日志的说明图。
图8是表示本发明的实施方式的警报发送条件的说明图。
图9是表示本发明的实施方式的检查日志的说明图。
图10是表示本发明的实施方式的负责人信息的说明图。
图11是表示本发明的实施方式的警报发送履历的说明图。
图12是表示本发明的实施方式的观点的重要度的说明图。
图13是用于本发明的实施方式的监视业务评价程序计算监视业务评价值的流程图。
图14是表示本发明的实施方式的监视业务评价程序计算确认主体为运用管理者的监视业务评价值M3的处理的流程图。
图15是表示本发明的实施方式的包含计数器变量的评价值的说明图。
图16是表示本发明的实施方式的包含监视业务评价值M3的评价值的说明图。
图17是表示本发明的实施方式的监视业务评价程序推测各访问的监视的观点的处理的流程图。
图18是表示本发明的实施方式的监视业务评价程序计算每个警报发送条件的监视业务评价值M3的处理的流程图。
图19是表示本发明的实施方式的监视业务评价程序基于监视业务评价值M3计算监视业务评价值M2的处理的流程图。
图20是表示本发明的实施方式的包含监视业务评价值M2的计数器变量的评价值的说明图。
图21是表示本发明的实施方式的包含监视业务评价值M2的评价值的说明图。
图22是表示本发明的实施方式的监视业务评价程序基于监视业务评价值M2计算监视业务评价值M1的处理的流程图。
图23是表示本发明的实施方式的包含监视业务评价值M1的评价值的说明图。
图24是表示本发明的实施方式的对运用管理者提示的监视业务评价值M1的表的说明图。
具体实施方式
在本实施方式中,对计算机系统中的装置进行监视的服务器使用表示监视的内容的运行数据、和由运用管理者确认运行数据的履历,计算多个不同的监视业务评价值。并且,根据计算出的监视业务评价值,使运用管理者识别哪个监视业务不充分。
以下,利用附图说明实施方式。
图1是表示本发明的实施方式的计算机系统的模块图。
实施方式的计算机系统具有监视服务器3、数据库4、管理者终端20以及监视对象设备。此外,实施方式的计算机系统具有管理网络1、通信线路2以及通信线路11等网络。
本实施方式的监视对象设备是用于对使用计算机系统的用户提供服务的多个设备。监视对象设备中包括多个物理机5(5-1~5-8)、多个交换机6(6-1~6-6)、多个路由器7(7-1,7-2)、多个光纤通道交换机 (FC-SW)8(8-1,8-2)、以及储存设备9(9-1,9-2)等。
此外,物理机5也可以安装多个虚拟机。各物理机5所安装的虚拟机具有网络(Web)应用、网络(Web)容器以及OS。
交换机6是中继路由器7和物理机5的网络设备。路由器7是将运用管理者们管理的计算机系统和WAN10连接的网络设备。FC-SW8是中继物理机5以及储存单元9之间的通信量的网络设备。储存设备9是保存物理机使用的数据的设备。
监视对象设备经由物理通信线路2而与管理网络1连接。此外,监视对象设备经由物理通信线路11而与用于对用户提供服务的广域网(WAN:Wide Area Network)10相互连接。
包括管理网络1以及通信线路2的网络是用于将监视服务器3、数据库4及管理者终端20与监视对象设备连接的网络。本实施方式的计算机系统的运用管理者经由管理网络1以及通信线路2对监视对象设备进行监视,并且,变更监视对象设备的设定。
另外,运用管理者也可以经由包括通信线路11的网络对监视对象设备进行监视,并且,变更监视对象设备的设定。例如,在为了对监视对象设备进行监视而收发的通信数据量少的情况下,用于运用管理者对监视对象设备进行监视的通信量对监视对象设备与WAN10的通信量带来影响较少。因此,不需要通过使用管理网络1来减轻通信线路11的负荷,运用管理者能够经由通信线路11对监视对象设备进行监视。
管理者终端20是本实施方式的计算机系统的运用管理者所使用的终端。管理者终端20具有用于与监视服务器3所具有的各程序进行通信的软件(以下称为监视客户端),执行监视客户端。
本实施方式的监视客户端是网络(Web)浏览器,但管理者终端20所具有的监视客户端也可以是使用专用的通信协议的GUI(Graphical User Interface:图形用户界面)或通过HTTP来通信的网络浏览器等。
监视服务器3是从监视对象设备收集监视对象设备提供的表示服务的运行状况的数据(以下称为运行数据)的服务器。并且是将收集到的运行数据保存到数据库4中的服务器。
此外,监视服务器3将运行数据发送给管理者终端20,使管理者终端 20的监视客户端输出。并且,运用管理者通过参照从监视客户端输出的运行数据,对监视对象设备的监视项目进行监视。
本实施方式的运行数据是与OS(Operating System:操作系统)有关的数据、与在OS上由多个应用共同使用的中间件(数据库、网络容器等)有关的数据、以及应用固有的数据等。监视对象设备所具有的OS或中间件等生成表示监视对象设备的状态的运行数据。
此外,在监视对象设备中发生了异常的现象的情况下,监视对象设备所具有的OS或中间件等生成表示监视对象设备异常的运行数据。运行数据的形式是数值、比率或表示日志的字符串等。运行数据中保存表示监视对象设备的状态的多个数据。
监视服务器3进行判断在运行数据中是否包含表示监视对象设备异常的数据的检查,由此能够确定在监视对象设备中发生的异常或故障的内容。
监视服务器3具有将运行数据提供给运用管理者的功能、以及将运行数据中保存的异常的内容通知给运用管理者的功能。进而,本实施方式的监视服务器3具有将对运用管理者所进行的监视的充分性定量化的值(以下称为监视业务评价值)提供给运用管理者的功能。
图2是表示本发明的实施方式的监视服务器3的物理结构的模块图。
监视服务器3具有接口(I/F)31、处理器32、存储器33以及数据总线34。图2所示的监视服务器3是一个计算机,但也可以由多个虚拟化的计算机等安装。
I/F31是网络接口等。监视服务器3经由I/F31从管理网络1接收包,向管理网络1发送包。
处理器32既可以具有一个处理器,也可以具有多个处理器。处理器32例如是CPU。处理器32经由数据总线34读出存储器33所保持的程序。并且,执行读出的程序。
存储器33是暂时存储单元格。存储器33保持运行数据收集程序331、运行数据显示程序332、警报发送程序333以及监视业务评价程序334。此外,保持通过后述的处理生成的监视业务评价值M1(2400)(以下记为评价值2400)、监视业务评价值M2(2300)(以下记为评价值2300)、监视业务评价值M3(2100)(以下记为评价值2100)。
运行数据收集程序331具有从监视对象设备收集运行数据的功能。运行数据收集程序331为了收集运行数据,例如使用如下方法:在监视对象设备中执行简单网络管理协议(SNMP:Simple Network Management Protocol)等的代理,在该代理与运行数据收集程序331之间进行通信,由此收集运行数据。运行数据收集程序331将收集到的运行数据保存在数据库4中。
运行数据显示程序332具有按照从管理者终端20发送的请求,将保存在数据库4中的运行数据显示在管理者终端20上的功能。
例如,在运用管理者经由管理者终端20所具有的网络浏览器将显示多个运行数据的请求发送给运行数据显示程序332的情况下,运行数据显示程序332按照从管理者终端20发送的请求,从数据库4提取多个运行数据。然后,运行数据显示程序332生成包含提取的多个运行数据的网(Web)页。然后,运行数据显示程序332将生成的网页向管理者终端20的网络浏览器发送。
进而,运行数据显示程序332为了提高运用管理者的便利性,具有将在1个画面上显示的运行数据的种类按照运用管理者的请求来定制的功能。运行数据显示程序332将与该定制的画面显示有关的设定保存在数据库4中。
此外,本发明的运行数据显示程序332为了计算后述的监视业务评价值,具有将各运用管理者的访问日志保存在数据库4中的功能。
警报发送程序333具有实时地或定期地对保存在数据库4中的运行数据进行检查的功能。并且,警报发送程序333在检查运行数据的结果判断为运行数据中有表示监视对象设备的异常的数据的情况下,为了向运用管理者传达异常的内容,将警报消息发送给管理网络1。
由警报发送程序333发送的警报消息是对运用管理者的邮件或其他对管理系统的消息(例如SNMP消息)。警报消息经由管理网络1发送到管理者终端20或运用管理者所使用的设备。
运用管理者为了使警报发送程序333进行上述的检查,将检查的对象的运行数据、用于判断是否异常的条件式、以及判断出异常的情况下的处理预先保存在数据库4中。以下,将用于检查这些运行数据的条件记为警 报发送条件。
本实施方式的警报发送程序333为了计算后述的监视业务评价值,将表示根据各警报发送条件来处理的结果的检查日志保存在数据库4中。
监视业务评价程序334具有按照从管理者终端20发送的请求,计算本实施方式的计算机系统的监视业务评价值,并使管理者终端20显示计算出的监视业务评价值的功能。例如,在运用管理者经由管理者终端20所具有的网络浏览器向监视业务评价程序334请求监视业务评价值的情况下,监视业务评价程序334计算监视业务评价值。然后,生成包含计算出的监视业务评价值的网页,并将生成的网页向管理者终端20的网络浏览器发送。
监视业务评价程序334从数据库4读出监视业务评价值所需要的数据。
另外,处理器32作为通过处理上述的各程序而实现规定的功能的功能部来动作。例如,处理器32通过处理运行数据收集程序331而作为运行数据收集部来发挥功能,通过处理运行数据显示程序332而作为运行数据显示部来发挥功能。关于其他程序也同样。进而,处理器32还作为实现通过各程序执行的多个处理中的各个处理的功能部来动作。本实施方式的监视服务器3是包括这些功能部的装置或系统。
此外,存储器33中保持的各程序也可以通过程序发布服务器或计算机可读取的非暂时性存储媒体而安装在监视服务器3中。此外,也可以是,监视服务器3具有非易失性存储设备,将上述的各程序保持在非易失性存储设备中。并且,处理器32也可以在执行各程序时将各程序读出到存储器33。
图3是表示本发明的实施方式的数据库4所保存的数据的模块图。
数据库4是保存为了计算监视业务评价值而需要的数据以及运行数据的数据库。数据库4保持运行数据1000、运行数据显示设定1100、运用管理者信息1200、访问日志1300、警报发送条件1400、检查日志1500、负责人信息1600、警报发送履历1700以及观点的重要度1800。
在后述的各数据的说明中,数据库4所保存的上述的数据全部保存在表中。但是,本实施方式的数据也可以通过基于CSV等的方法保存在文本文件中,只要读出数据的各程序能够确定各数据,则也可以通过任何方法保存在数据库4中。
另外,上述的监视服务器3所保持的程序以及数据库4所保持的数据等也可以保存在通过非易失性半导体存储器、硬盘驱动器,SSD(Solid State Drive)等存储设备、或IC卡、SD卡、DVD等的监视服务器3可读取的非暂时性的数据存储媒体中。
图4是表示本发明的实施方式的运行数据1000的说明图。
运行数据1000是通过运行数据收集程序331实时地或定期地从各监视对象设备收集的运行数据。
另外,在各监视对象设备中生成的运行数据表示在各监视对象设备所具有的CPU(包括处理器)、存储器以及网络I/F等的物理装置、OS、以及应用等软件中发生的事件(event)。在本实施方式中,将各事件的种类记为监视项目。
运行数据1000包含列1001~列1005。列1001表示在本实施方式的计算机系统中用于唯一地识别运行数据的运行数据ID。
列1002表示用于唯一地识别生成运行数据的监视对象设备的监视对象设备ID。监视对象设备ID也可以是主机名或IP地址等。本实施方式的列1002中作为监视对象设备ID而保存主机名,对物理机5、交换机6以及路由器7等各监视对象设备进行识别。
列1003表示用于唯一地识别运行数据的种类、即监视项目的监视项目ID。
列1004表示测定出在运行数据中保存的值的测定时刻。即,列1004表示生成运行数据的时刻。列1005表示运行数据的值。
图4所示的运行数据1000例如包含行1011及行1016。行1011及行1016表示在监视对象设备host1(监视对象设备ID为“host1”的监视对象设备,以下相同)中测定出关于“OS的CPU使用率”的监视项目的结果。行1011表示2011年1月17日0时测定出的结果,行1016表示2011年1月17日1时测定出的结果。
图5是表示本发明的实施方式的运行数据显示设定1100的说明图。
运行数据显示设定1100表示通过运行数据显示程序332显示在管理者终端20等上的运行数据的显示方法。运行数据显示设定1100预先保存在监视服务器3中,或在运用管理者定制画面显示时被生成。
另外,在本实施方式中将运行数据显示设定1100的各行所包含的多个信息记为运行数据显示设定。
运行数据显示设定1100所包含的各行表示在画面上显示的运行数据以及运行数据的显示方法。运行数据显示设定1100包含列1101~列1107。
列1101表示用于唯一地识别通过运行数据显示程序332显示的各画面的画面ID。列1101表示相同的画面ID的多个行表示同时显示在一个画面上的运行数据。列1101所包含的画面ID与对应于各画面的URL或对应于各画面的URL所包含的参数等唯一地建立关联。
列1102表示用于唯一地识别生成各画面上显示的运行数据的监视对象设备的监视对象设备ID。列1102中保存的值对应于列1002中保存的值。
列1103表示用于唯一地识别各画面上显示的运行数据的监视项目的监视项目ID。列1103中保存的值对应于列1003中保存的值。
例如,行1111及行1112表示画面1(画面ID为1的画面,以下相同)对在监视对象设备host1及监视对象设备host2(监视对象设备ID为host2的监视对象设备,以下相同)中生成的运行数据之中、监视项目ID为“OS的CPU使用率”的运行数据进行显示。
列1104表示各画面上显示的运行数据的概括方法。本实施方式的概括方法中例如有将在一定期间中生成的运行数据所包含的值(对应于运行数据1000的列1005)的最大值、最小值或平均值等显示在画面上的方法。
列1105表示各画面上显示的阈值显示。具体而言,表示各画面上显示的阈值的有无、和有阈值显示时的阈值。
本实施方式的阈值显示的方法例如有在通过棒图显示运行数据的情况下,将棒图中显示的运行数据的值和表示阈值的线显示在相同的画面上的方法。此外,有在通过包括行及列的矩阵显示运行数据的情况下,通过将包含超过阈值的值的单元格的背景色改变为其他的单元格的背景色等来强调显示的方法。
列1106表示在各画面中显示的基线的有无、和作为基线来显示的运行数据的内容。本实施方式的基线是为了由运用管理者判断显示的运行数据是否是正常值而与显示的运行数据进行比较的作为基准的值。基线是用过去的运行数据所包含的值的平均值等表示的值。
运行数据显示程序332将基线显示在画面上,由此使得运用管理者容易判断显示的运行数据是否包含偏离正常值的值。基线例如是昨天的运行数据的值、一周前的运行数据的值、或过去的规定的时间段的运行数据的值的平均值等。
列1107表示各行所示的运行数据显示设定有效还是无效。在根据访问日志计算监视业务评价值的后述的处理中,监视业务评价程序334还使用过去的画面显示中使用的运行数据显示设定,因此本实施方式的运行数据显示设定1100还保持已不使用的显示方法。
因此,在运用管理者不使用一个运行数据显示设定、即想要使一个运行数据显示设定无效的情况下,运行数据显示程序332将与想要无效的运行数据显示设定对应的行的列1107更新为“无效”。此外,在变更运行数据显示设定的情况下,将变更前的行的列1107更新为“无效”,生成新的行。
例如,在运用管理者将想要在一个画面上显示的监视对象设备从仅监视对象设备host1增加到监视对象设备host1及监视对象设备host2的情况下,运行数据显示程序332将行1117的列1107更新为“无效”,追加行1111及行1112的新的2行。
图6是表示本发明的实施方式的运用管理者信息1200的说明图。
运用管理者信息1200包含与能够使用监视服务器3所具有的各程序的运用管理者、以及进行本实施方式的计算机系统的监视业务的运用管理者有关的信息。运用管理者信息1200由运用管理者预先生成。
本实施方式的运用管理者是包括进行监视业务的运用者和比运用者上层的管理者的用户。运用管理者信息1200包含列1201及列1202。
列1201表示用于唯一地识别进行监视业务的运用管理者的运用管理者ID。运用管理者ID在运用管理者经由运行数据显示程序332显示运行数据时的访问控制、以及表示运用管理者显示运行数据的履历的访问日志1300的生成等的、后述的各处理中被使用。列1202表示密码。列1202中保存的密码用于运用管理者显示运行数据时的访问控制。
图7是表示本发明的实施方式的访问日志1300的说明图。
访问日志1300保持表示运用管理者经由运行数据显示程序332显示了 运行数据的履历。访问日志1300在每当运用管理者启动运行数据显示程序332时由运行数据显示程序332生成。访问日志1300包含列1301~列1305。
另外,在本实施方式中,将访问日志1300的各行所包含的多个信息记为访问日志。
列1301表示访问时刻,该访问时刻表示运用管理者启动运行数据显示程序332的时刻。列1302表示启动运行数据显示程序332的运用管理者的运用管理者ID。列1302中保存的值对应于运用管理者信息1200的列1201中保存的值。
列1303表示显示的画面的画面ID。列1303中保存的值对应于运行数据显示设定1100的列1101中保存的值。列1304表示通过运行数据显示程序332显示的运行数据在监视对象设备中生成的期间。本实施方式的运行数据显示程序332能够灵活地变更生成所显示的运行数据的期间。
例如,行1311表示运用管理者ID为“operator1“的运用管理者在2011年1月18日9时,将2011年1月17日生成的1日量的运行数据显示在画面上。此外,行1312表示在与行1311所示的画面1相同的画面1上,将2011年1月18日生成的1日量的运行数据显示在画面。
进而,行1313表示运用管理者ID为“operator1”的运用管理者在与行1311及行1312所示的画面1相同的画面1上,显示了2011年1月17日的6时~7时的1小时量的运行数据。行1314表示运用管理者ID为“operator1”的运用管理者在与行1311~行1313所示的画面1不同的画面上,显示了2011年1月生成的1个月量的运行数据。
列1305表示运用管理者显示概括的运行数据的情况下的概括的单位。例如,行1311表示通过仅显示2011年1月17日生成的1日量的运行数据中的每一小时的最大值,显示概括的运行数据。即,行1311表示显示了24个值。
本实施方式中的访问日志1300为了记录运行数据显示程序332每次起动时显示的运行数据,保持显示的画面ID。在后述的处理中,监视业务评价程序334基于访问日志1300的画面ID,确定运行数据显示设定1100的行,进而基于确定的运行数据显示示设定1100的行的列1102及列1103,确定运行数据1000的行。
另外,通过由访问日志1300保持画面ID,本实施方式的运行数据显示程序332与由访问日志1300保持各个运行数据ID相比,能够减少访问日志1300中保存的数据量。但是,在数据库4能够保存的数据容量足够的情况下,运行数据显示程序332也可以将各个运行数据ID保存在访问日志1300的列1101中。
在访问日志1300保持运行数据ID的情况下,后述的监视业务评价程序334基于访问日志1300的行,能够直接确定运行数据1000的行。
另外,例如在运行数据显示程序332显示超过管理者终端20的显示器的大小的画面的情况下,若运用管理者不将画面显示滚动,则不能确认全部的运行数据。在这样的情况下,访问日志1300中保存的画面ID(对应于列1301)有可能不完全与运用管理者实际确认的运行数据一致。
因此,运行数据显示程序332也可以取得与实际显示在管理者终端20的画面上的运行数据有关的信息(包含运行数据ID),并对访问日志1300追加取得的运行数据ID。
取得运行数据的方法例如有如下方法:在运行数据显示程序332生成网页的情况下,运行数据显示程序332预先保持用于从网页取得运行数据的JavaScript(注册商标)的程序,执行显示画面时生成的程序,由此取得运行数据。由此,能够在后述的监视业务评价值中更正确地反映监视的实际状态。
图8是表示本发明的实施方式的警报发送条件1400的说明图。
警报发送条件1400表示发送警报时的运行数据的值的条件。
警报发送条件1400表示警报发送程序333检查的运行数据、用于判断运行数据是否表示异常的条件式、以及在由警报发送程序333判断为运行数据异常的情况下的处理。警报发送条件1400由运用管理者预先生成,保存在数据库4中。
警报发送条件1400包含列1401~列1407。此外,本实施方式的警报发送条件1400包含行1411~行1415,由此包含多个运行数据的值的条件。
另外,将警报发送条件1400的各行所表示的多个信息记为警报发送条件。
列1401表示用于唯一地识别警报发送条件的条件ID。列1401所示的 条件ID用于后述的检查日志1500的记录。列1402表示生成了被检查的运行数据的监视对象设备的监视对象设备ID。列1402中保存的值对应于运行数据1000的列1002中保存的值、以及运行数据显示设定1100的列1102中保存的值。
列1403表示用于唯一地识别被检查的运行数据的监视项目的监视项目ID。列1403中保存的值对应于运行数据显示设定1100的列1103中保存的值。
列1404表示用于判断由列1402和列1403确定的运行数据是否表示异常的条件式。列1405表示作为检查运行数据的时间的间隔的检查间隔。
例如,行1411中,列1405表示“实时”,因此包含关于需要立即检测异常发生的监视项目的条件式。在使用行1411所示的警报发送条件的情况下,警报发送程序333需要在运行数据收集程序331将运行数据保存在数据库4中的几乎同时检查运行数据。
另一方面,行1413中,列1405表示“每日3:00”,因此包含关于需要监视长期的运行数据的趋势的监视项目的条件式。在使用行1413所示的警报发送条件的情况下,警报发送程序333不需要实时地检查运行数据,因此一天一次等、按照定期的检查间隔检查运行数据。
列1406表示在运行数据满足条件式的情况下警报发送程序333进行的处理。列1407表示各行所示的警报发送条件有效还是无效。
在基于检查日志1500计算后述的监视业务评价值时,需要在过去的检查中使用过的警报发送条件,因此警报发送条件1400需要保持已不使用的警报发送条件。因此,警报发送程序333在警报发送条件不被使用的情况下,将包含不被使用的警报发送条件的行的列1407的状态更新为“无效”。
此外,在运用管理者变更警报发送条件的内容的情况下,警报发送程序333将变更前的警报发送条件的行的列1407的状态更新为“无效”,并生成新的警报发送条件的行。
在以下的说明中,假设行1415的列1407更新为“无效”,行1411的警报发送条件为新生成的条件。
图9是表示本发明的实施方式的检查日志1500的说明图。
检查日志1500包含警报发送程序333根据警报发送条件检查运行数据 的期间。检查日志1500在警报发送程序333每次进行运行数据的检查时由警报发送程序333生成。检查日志1500包含列1501及列1502。
列1501是表示警报发送条件的条件ID。列1501中保存的值对应于警报发送条件1400的列1401中保存的值。
列1502表示根据列1501所示的警报发送条件检查运行数据的期间。即,表示使用列1501所示的警报发送条件的期间。
例如,行1511的数据表示根据条件ID为“condition1”的警报发送条件,检查了从于2010年12月20日10:30:00生成的运行数据到最新的运行数据(在图9所示的检查日志1500中,2011年1月19日的下午6时生成的运行数据)。另外,在条件ID为“condition1”的情况下,警报发送程序333检查在监视对象设备host1中生成的运行数据中的、监视项目为“OS的CPU使用率”的运行数据。
此外,行1515的数据表示条件ID为“condition5”的警报发送条件被使用到2010年12月20日的10:20:00。
上述的检查日志1500保持警报发送条件被使用的检查期间。这是因为基于各警报发送条件检查的运行数据和检查运行数据的履历保存在数据库4和运行数据1000中。即,通过由检查日志1500保持条件ID和检查期间,与保持各个运行数据或运行数据ID相比,检查日志1500的数据量减少。但是,在数据库4中能够保存的数据容量足够的情况下,检查日志1500既可以在列1502中保持各运行数据ID,也可以直接表示使用条件ID所示的警报发送条件的运行数据。
图10是表示本发明的实施方式的负责人信息1600的说明图。
负责人信息1600表示各运用管理者负责监视的监视对象设备以及监视项目。负责人信息1600由运用管理者预先生成。负责人信息1600包含列1601~列1603。
列1601表示示出运用管理者的运用管理者ID。列1601中保存的值对应于在运用管理者信息1200的列1201中保存的值、以及在访问日志1300的列1302中保存的值。
列1602表示示出运用管理者负责监视的监视对象设备的监视对象设备ID。列1602对应于运行数据1000的列1002、运行数据显示设定1100的 列1102、以及警报发送条件1400的列1402。
列1603表示示出运用管理者负责监视的监视项目的监视项目ID。列1603对应于运行数据1000的列1003、运行数据显示设定1100的列1103、以及警报发送条件1400的列1403。
列1602及列1603可以包含表示任意的监视对象设备或监视项目的ID(例如,图10所示的“全部”)。例如,行1611及行1612表示运用管理者ID为“operator1”的运用管理者负责监视对象设备host1及监视对象设备host2的全部的监视项目。另一方面,行1613表示运用管理者ID为“operator2”的运用管理者负责全部的监视对象设备的“网络应用的响应时间”的监视项目。
图11是表示本发明的实施方式的警报发送履历1700的说明图。
警报发送履历1700表示与警报发送程序333过去向管理者终端20等发送的警报有关的履历。警报发送履历1700在警报发送程序333每次发送警报时由警报发送程序333生成。
警报发送履历1700包含列1701~列1705。此外,本实施方式的警报发送履历1700包含行1711~行1714。另外,以下将警报发送履历1700的各行所包含的信息记为警报发送履历。
列1701表示用于唯一地识别所发送的警报的警报ID。列1702表示发送警报的警报发送时刻。
列1703包含是否发送警报的判断中使用的警报发送条件的条件ID。在警报发送履历1700的列1703中保存的值对应于在警报发送条件1400的列1401中保存的值、以及在检查日志1500的列1501中保存的值。
列1704包含表示运用管理者是否确认了该警报的确认状况标志。在本实施方式的列1704中,在运用管理者确认了警报的情况下保存“完成”,在运用管理者未确认警报的情况下保存“未完成”。
列1705包含表示警报的内容的字符串。表示内容的字符串例如包含于向运用管理者通知警报的邮件中。
警报发送程序333取得管理者终端20等的监视客户端的、由运用管理者对警报的确认状况,更新数据库4中保存的警报发送履历1700的方法例如有如下方法。
警报发送程序333具有将表示各警报的内容的字符串、成为发生该警报的契机的运行数据作为网页来显示的功能。并且,在向运用管理者发送的警报的内容中保存包含该警报的警报ID的URL。并且,在运用管理者参照显示的警报的内容访问了该内容所包含的URL的情况下,警报发送程序333将包含与URL所包含的警报ID对应的列1701的警报发送履历1700的行的列1704更新为“完成”。
图12是表示本发明的实施方式的观点的重要度1800的说明图。
观点的重要度1800包含表示应按照怎样的观点来监视各运行数据的数据。观点的重要度1800由运用管理者预先生成。
本实施方式的监视的观点是“阈值监视”或“趋势监视”等的运行数据的显示方法。运用管理者在阅览各监视项目的运行数据时,追加被显示的运行数据或变更显示内容,以使运用管理者容易理解运行数据的值的意思。
运用管理者为了按照运用管理者所希望的监视的观点来显示运行数据,向监视客户端指示显示的运行数据。由此,监视客户端对监视服务器3请求按照来自运用管理者的指示的运行数据,监视服务器3按照来自监视客户端的请求,将运行数据发送给监视客户端。由此,运用管理者能够对监视对象设备的状态正确地进行监视。
例如,在运用管理者想要确认OS的CPU使用率是否超过规定的阈值的情况下,运用管理者按照“阈值监视”的观点显示运行数据,并阅览显示的运行数据。此外,在运用管理者想要确认OS的CPU使用率在过去1年间是否表示突出大的值的情况下,运用管理者按照“偏离监视”的观点显示运行数据,并阅览显示的运行数据。
此外,例如在运用管理者想要确认OS的CPU使用率在过去1年间是否处于变高的趋势的情况下,按照“趋势监视”的观点显示运行数据,并阅览显示的运行数据。
这样,运用管理者通过阅览按照指定的监视的观点显示的运行数据,能够正确地对监视对象设备进行监视。
监视的观点以及监视的观点的重要度根据每个计算机系统、或根据每个监视对象设备而不同。例如,在对物理机5-1施加的负荷高的情况下, 针对物理机5-1的CPU使用率的“阈值监视”的重要度比物理机5-2~物理机5-8高。
此外,也有时在运用本实施方式的计算机系统的期间,监视的观点的重要度变化。例如,在向运行数据的量少、“趋势监视”不重要的计算机系统导入了新的应用的情况下,监视的观点的重要度变化。即,在向计算机系统导入新的应用之后运行数据的量增加的情况下,“趋势监视”的重要度比导入应用前增大。
观点的重要度1800包含列1801~列1804。此外,图12的观点的重要度1800包含行1811~行1817。
列1801表示示出监视对象设备的监视对象设备ID。在列1801中保存的值对应于在运行数据1000的列1002、运行数据显示设定1100的列1102、警报发送条件1400的列1402以及负责人信息1600的列1602中保存的值。在将观点的重要度1800的一行所示的定义适用于全部的监视对象设备的情况下,也可以如行1817那样,表示全部的监视对象设备的“全部”保存在列1801中。
列1802表示示出监视项目的监视项目ID。在列1802中保存的值对应于在运行数据表示设定1100的列1103、警报发送条件1400的列1403以及负责人信息1600的列1603中保存的值。
列1803表示监视的观点。在本实施方式的监视的观点中,例如保存表示“阈值监视”、“偏离监视”(基线监视)、“趋势监视”、“错误字符串监视”或“相关关系监视”等的值。
列1804表示示出各行所示的观点的重要度的数值。本实施方式中的列1804的数值越大,表示观点的监视越重要。例如,行1811~行1813表示在监视对象设备host1的“OS的CPU使用率”的监视项目中,“阈值监视”以及“偏离监视”比“趋势监视”重要。
另一方面,行1814~行1816表示在监视对象设备host1的“OS的可使用存储器”的监视项目中,“趋势监视”最重要。
另外,物理机5是在自身的设备中能够使OS以及虚拟机动作的服务器设备。本实施方式的计算机系统也能够适用于在物理机5中使虚拟机动作的情况。在物理机5中使虚拟机动作的情况下,也可以对虚拟机分配监视 对象设备ID。
图13是用于本发明的实施方式的监视业务评价程序334计算监视业务评价值的流程图。
在本实施方式中,监视业务评价程序334按照3个阶段的步骤计算监视业务评价值。以下,将在最初的阶段中计算的监视业务评价值记为监视业务评价值M3,将在第2个阶段计算的监视业务评价值记为监视业务评价值M2,将在最后的阶段中计算的监视业务评价值记为M1。
图13表示监视业务评价程序334计算监视业务评价值M3、监视业务评价值M2以及监视业务评价值M1的步骤。
在运用管理者想要评价监视业务的情况下,该运用管理者经由管理者终端20所具有的监视客户端,向监视业务评价程序334发送范围T1以及范围T2(S101)。
具体而言,运用管理者在S101中,经由管理者终端20等的监视客户端启动监视业务评价程序334。在起动时,运用管理者将自身的运用管理者ID和密码发送给监视服务器3。监视业务评价程序334参照发送的运用管理者ID、密码以及运用管理者信息1200,由此判断是否认证运用管理者。在认证了运用管理者的情况下,监视业务评价程序334执行S102以后的处理。
范围T1及范围T2是指定用于计算监视业务评价值的时间的范围的变量。范围T1是用于计算监视业务评价值的运行数据的测定时刻,即生成运行数据的时刻的范围。此外,范围T1表示由警报发送程序333进行了检查的时刻的范围。
范围T2是运用管理者显示运行数据、并且确认的时刻的范围。在以下的处理中,关于运用管理者在范围T2中进行的运行数据的显示以及确认,计算监视业务评价值。此外,将由运用管理者进行的运行数据的显示以及确认记为向运行数据的访问。
另外,也可以是,管理者在S101中经由监视客户端将范围T1及范围T2发送该监视业务评价程序334,通过S102以后的处理,计算用于评价运用管理者的监视业务的监视业务评价值。
范围T1及范围T2既可以是相同的时间的范围,也可以是范围T2是比 范围T1长的时间。向运行数据的访问以及检查有时在运行数据生成之后一日后或1周后进行。因此,监视业务评价程序334能够通过指定比范围T1长的范围T2,计算正确地反映监视业务的监视业务评价值。
例如,在评价从2010年10月1日0:00到2010年10月31日23:59的期间X的监视业务的情况下,运用管理者将范围T1指定为上述的期间X,将范围T2指定为从2010年10月1日0:00到2010年11月7日23:59。这样,通过由运用管理者指定范围T2,监视业务评价程序334能够将运用管理者在一周内对2010年10月31日的运行数据进行访问或检查的履历也用于计算监视业务评价值。
在以后的处理中,范围T1和范围T2用作不同的引数(参数、自变量),但范围T1和范围T2也可以如上述那样为相同的范围,因此仅使用某一个引数。
在S101中,从监视客户端接收到范围T1及范围T2的监视业务评价程序334计算确认主体为运用管理者的监视业务评价值M3(S102)。关于确认主体,在后面进行叙述。
S102之后,监视业务评价程序334计算确认主体为警报发送条件的监视业务评价值M3(S103)。S103之后,监视业务评价程序334基于在S102及S103中计算出的监视业务评价值M3,计算监视业务评价值M2(S104)。
S104之后,监视业务评价程序334基于在S104中计算出的监视业务评价值M2,计算监视业务评价值M1(S105)。S105之后,监视业务评价程序334将计算出的监视业务评价值M1、监视业务评价值M2以及监视业务评价值M3向监视客户端发送,向运用管理者显示监视业务评价值(S106)。
接着,说明图13的S102~S106的计算方法的详细内容。
图14是表示本发明的实施方式的监视业务评价程序334计算每个运用管理者的监视业务评价值M3的处理的流程图。
图14所示的处理是相当于图13的S102的处理。图14表示监视业务评价程序334计算确认主体为运用管理者的监视业务评价值M3的处理。
监视业务评价程序334从数据库4的运行数据1000取得测定时刻(对应于列1004)包含在范围T1中的全部运行数据(S201)。具体而言,监视业务评价程序334从运行数据1000中提取在列1004中包含范围T1所包含 的值的各行,由此取得至少一个运行数据。
S201之后,监视业务评价程序334从数据库4的运用管理者信息1200取得全部的运用管理者ID(S202)。
以下的S204~S216的处理是按照在S202中取得的每个运用管理者ID计算监视业务评价值M3的步骤。在计算S202中取得的全部的运用管理者ID的监视业务评价值M3的情况下,监视业务评价程序334重复S204~S216的处理。
监视业务评价程序334从在S202中取得的运用管理者ID中选择一个未验证的运用管理者ID,即未被执行S204~S216的处理的运用管理者ID(S203)。以下将在S203中选择的运用管理者ID记为OID。
S203之后,监视业务评价程序334对在S201中取得的各运行数据,生成按照每个监视的观点保存计数器变量的列2005(S204)。在S204中生成的列2005所示的计数器变量的初始值为0。具体而言,监视业务评价程序334在S204中如评价值2000那样生成列2005。
图15是表示包含本发明的实施方式的计数器变量的评价值2000说明图。
图15所示的评价值2000包含S204中生成的计数器变量。此外,在S204中按照每个运用管理者生成评价值2000。评价值2000是用于计算监视业务评价值M3的信息。
图15所示的评价值2000保持在监视服务器3的存储器33中。评价值2000包含列2001~列2005。
列2001表示运行数据ID。在列2001中保存的值对应于运行数据1000的列1001。列2002表示监视对象设备ID。在列2002中保存的值对应于在运行数据1000的列1002中保存的值。
列2003表示监视项目ID。在列2003中保存的值对应于在运行数据1000的列1003等中保存的监视项目ID的值。列2004表示监视的观点。在列2004中保存的值对应于在观点的重要度1800的列1803中保存的值。
列2005表示计数器变量。在S204的列2005中全部保存0。计数器变量表示将运用管理者ID为OID的运用管理者按照列2004所示的监视的观点显示列2001所示的运行数据的次数。
在不能明确地推测运用管理者显示的运行数据的监视的观点的情况下,本实施方式的监视业务评价程序334如后所述,对计数器变量加上小于1的值。因此,计数器变量并不总是整数。
在S204中,监视业务评价程序334将在S201中取得的运行数据的列1001、列1002以及列1003中保存的值保存在评价值2000的列2001、列2002以及列2003中。并且,参照观点的重要度1800的列1803,按照每个监视的观点,追加包含列2001、列2002以及列2003的唯一组合的行。并且,在列2005中保存0。
S204之后,监视业务评价程序334从数据库4的访问日志1300取得运用管理者ID(对应于列1302)为OID、并且访问时刻(对应于列1301)包含在范围T2中的全部访问日志(S205)。
以下的S207~S214的处理是基于在S205中取得的各访问日志,进行监视的观点的推测、以及对计数器变量加上的值的计算的处理。
首先,监视业务评价程序334判断在S205中取得的访问日志之中是否有未验证的访问日志、即未被执行S207~S214的访问日志(S206)。在没有未验证的访问日志的情况下,监视业务评价程序334转移到S215。
在有未验证的访问日志的情况下,监视业务评价程序334选择一个未验证的访问日志(S207)。以下将在S207中选择的访问日志记为ALOG。
S207之后,监视业务评价程序334判断在ALOG所包含的显示期间(对应于列1304)和范围T1中是否有重复的时间(S208)。在ALOG所包含的显示期间和范围T1中没有重复的时间的情况下,ALOG表示由OID所示的运用管理者访问的运行数据没有在范围T1中生成。即,ALOG所示的访问不包含于在S201中由运用管理者等指定的计算监视业务评价值的范围。
因此,在OID所示的运用管理者所访问的运行数据不包含在范围T1中的情况下,监视业务评价程序334不需要计算ALOG的计数器变量,因此返回S206,在S207中选择新的访问日志作为ALOG。
在ALOG所包含的显示期间(对应于列1304)和范围T1中有重复的时间的情况下,监视业务评价程序334从数据库4000的运行数据显示设定1100取得在列1101中包含与ALOG所包含的画面ID(对应于列1303)相同的画面ID的全部的运行数据显示设定(S209)。由此,监视业务评价程 序334能够确定在ALOG所示的访问中显示的画面的内容。
S209之后,监视业务评价程序334从在S209中取得的运行数据显示设定中选择一个未验证的运行数据显示设定、即未被执行S211~S214的运行数据显示设定(S210)。以下将在S210中选择的运行数据显示设定记为VCONF。
S210之后,监视业务评价程序334基于ALOG以及VCONF,推测在ALOG所示的访问中运用管理者显示的运行数据的监视的观点。此外,按照推测出的监视的观点,计算应对计数器变量加上的值(S211)。S211的详细情况在后面进行叙述。
S211之后,监视业务评价程序334从在S201中取得的运行数据之中选择在列1002及列1003中包含VCONF的监视对象设备ID(对应于列1102)以及监视项目ID(对应于列1103)、并且测定时刻(对应于列1004)包含在ALOG的显示期间(对应于列1304)中的全部的运行数据(S212)。
通过S212,监视业务评价程序334能够选择在各ALOG所示的访问中通过VCONF所示的运行数据显示设定而显示的全部的运行数据。并且,能够选择评价值2000的各行之中更新列2005的运行数据。
S212之后,监视业务评价程序334对与在S212中选择的运行数据对应的评价值2000的行的、与在S211中推测的监视的观点对应的计数器变量(对应于列2005)加上在S211中计算出的值(S213)。
具体而言,监视业务评价程序334提取在评价值2000的列2001、列2002以及列2003中包含S212中选择的运行数据的运行数据ID(对应于列1001)、监视对象设备ID(对应于列1002)以及监视项目ID(列1003)、并且在列2004中包含S211中推测的监视的观点的评价值2000的行。并且,对提取的行的列2005加上在S211中计算出的值。
利用具体例说明上述的S211~S213的处理。例如,表示在S207中访问日志1300的行1311的访问日志被选择为ALOG、且运行数据显示设定1100的行1111的运行数据显示设定被选择为VCONF的情况。此外,表示对范围T1指定2011年1月1日00:00:00~2011年1月31日23:59:59,对范围T2指定2011年1月1日00:00:00~2011年2月7日23:59:59的情况。
此外,在以下所示的具体例中,监视业务评价程序334在S211中基于ALOG以及VCONF,推测在ALOG所示的访问中显示的监视的观点,计算对各监视的观点的计数器变量加上的值。进而,表示在S211中对应于ALOG的监视的观点是“阈值监视”的情况下,对计数器变量的相加值被计算为0.5,在监视的观点是“偏离监视”的情况下,对计数器变量的相加值被计算为0.1,在监视的观点是“趋势监视”的情况下,对计数器变量的相加值被计算为0.0的情况。
在如上述的条件中,监视业务评价程序334在S212中基于ALOG以及VCONF,选择监视对象设备ID为“host1”、监视项目ID为“OS的CPU使用率”、并且测定时刻包含在2011年1月17日中的全部运行数据。具体而言,监视业务评价程序334从图4所示的运行数据1000中选择行1011以及行1016的运行数据。
并且,在S213中,监视业务评价程序334对与行1011的运行数据对应的评价值2000的行2011~行2013的列2005加上在S211中计算出的计数器变量。即,监视业务评价程序334,由于行2011的列2004表示“阈值监视”,因此对行2011的列2005加上0.5,由于行2012的列2004表示“偏离监视”,因此对行2012的列2005加上0.1,由于行2013的列2004表示“趋势监视”,因此对行2013的列2005加上0.0。
监视业务评价程序334判断在S209中取得的运行数据显示设定中是否有未验证的运行数据显示设定、即未被进行S210~S213的处理的运行数据显示设定(S214)。并且,在有未验证的运行数据显示设定的情况下,返回S210。由此,对在S209中取得的运行数据显示设定的全部执行上述的S210~S213。
在S214中,在判断为没有未验证的运行数据显示设定情况下,监视业务评价程序334返回S206。通过S209~S214的处理,能够计算通过运用管理者的一次访问而显示的全部的运行数据的计数器变量。
在S206中,在没有未验证的访问日志的情况下,即在S205中取得的全部的访问日志被执行了S206~S214的处理的情况下,监视业务评价程序334转移到S215。通过S203~S214的处理,监视业务评价程序334能够计算与运用管理者ID为OID的运用管理者在范围T2中进行的全部的访问有关 的计数器变量。
S206之后,监视业务评价程序334基于计算出的计数器变量,计算运用管理者ID为OID的运用管理者的、每个监视的观点的监视业务评价值M3(S215)。
监视业务评价值M3的计算方法中有监视业务评价程序334提取评价值2000之中包含相同的监视对象设备ID、监视项目ID以及监视的观点的行,并计算提取的行的列2005的统计量,由此计算监视业务评价值M3的方法。统计量例如可以是列2005所包含的计数器变量的平均值。此外,在想要忽视计数器变量的偏离值的情况下,统计量也可以是列2005所包含的计数器变数的中央值。
图16是表示本发明的实施方式的包含监视业务评价值M3的评价值2100的说明图。
评价值2100包含监视业务评价值M3。监视业务评价值M3针对监视对象设备、监视项目、监视的观点以及确认主体所示的每个监视业务计算。确认主体中保存表示运用管理者或警报发送条件的值。
即,评价值2100表示各运用管理者进行最多的监视业务。此外,评价值2100表示哪个监视对象设备的哪个监视项目被按照哪个监视的观点来监视。此外,评价值2100表示基于哪个警报发送条件的警报被发送最多。
运用管理者通过参照评价值2100,能够按照每个运用管理者识别被监视最多的监视对象设备、监视项目以及监视的观点的组合。此外,能够识别被发送最多的警报在哪个监视对象设备以及监视项目中生成。
图16所示的评价值2100保持在监视服务器3的存储器33中。评价值2100包含列2101~列2105。
列2101表示监视对象设备ID。在列2101中保存的值对应于在评价值2000的列2002中保存的值。列2102表示监视项目ID。在列2102中保存的值对应于在评价值2000的列2003中保存的值。
列2103表示监视的观点。在列2103中保存的值对应于在评价值2000的列2004中保存的值。列2104表示确认主体。在列2104中保存的值对应于在访问日志1300的列1302或警报发送条件1400的列1401中保存的值。列2105表示监视业务评价值M3。
在列2104中包含表示运用管理者ID的值的行包含:与由运用管理者监视的至少一个运行数据有关的监视业务评价值M3。在列2104中包含表示警报发送条件的值的行包含:与根据警报发送程序333进行检查的结果发送了警报的至少一个运行数据有关的监视业务评价值M3。
利用具体例说明上述的S215的处理。例如,在计算监视对象设备ID为“host1”、监视项目ID为“OS的CPU使用率”、监视的观点为“阈值监视”的行的监视业务评价值M3的情况下,监视业务评价程序334提取评价值2000的行2011以及行2026。
监视业务评价程序334基于在提取的行2011以及行2026的列2005中保存的计数器变量(0.5及1.1),计算监视业务评价值M3。在本实施方式中,监视业务评价程序334计算计数器变量的平均值,其结果,计算出监视业务评价值M3(0.8)。
并且,在S215中,监视业务评价程序334提取列2101为“host1”、列2102为“OS的CPU使用率”、列2103为“阈值监视”的行2111,并在行2111的列2105中保存计算出的监视业务评价值M3(0.8)。此外,在行2111的列2104中保存OID作为确认主体。
另外,在S215中,在评价值2100中没有与评价值2000的行对应的行的情况下,监视业务评价程序334将新的行追加到评价值2100。
S215之后,监视业务评价程序334判断在S202中取得的运用管理者ID之中是否有未验证的运用管理者ID、即未执行S203~S215的处理的运用管理者ID(S216)。在有未验证的运用管理者ID的情况下,监视业务评价程序334返回S203。
在没有未验证的运用管理者ID的情况下,监视业务评价程序334结束图14所示的处理。由此,监视业务评价程序334能够计算确认主体为运用管理者的监视业务评价值M3、并且范围T1以及范围T2中的监视业务评价值M3。
通过图14所示的处理,生成在评价值2100的列2105中保存运用管理者ID的全部的行。具体而言,生成图16所示的行2111~行2116以及行2120。此外,若图14结束,则图13所示的S102结束。
图17是表示本发明的实施方式的监视业务评价程序334推测各访问的 监视的观点的处理的流程图。
图17所示的处理相当于图14所示的S211。监视业务评价程序334通过图17所示的处理,计算对监视的各观点的计数器变量加上的值(相加值)。
此外,后述的引数V1~V23是预先保持在监视业务评价程序334中的参数。在以下所示的处理中,对引数V1~V23设定0~1的值,但只要设定了最大值以及最小值,则可以是任何值。
S301~S307的处理是用于判断ALOG是否是希望“阈值监视”的访问的处理。
监视业务评价程序334判断VCONF的阈值显示的有无(S301)。具体而言,监视业务评价程序334判断在VCONF的列1105所示的阈值显示中是否包含“有”。这是因为在VCONF的阈值显示是“有”的情况下,在通过ALOG所示的访问显示的画面上明确显示阈值,在通过该访问显示的监视的观点中包含“阈值监视”的可能性高。
因此,在S301中VCONF的列1105所示的阈值显示是“有”的情况下,监视业务评价程序334推测为通过ALOG所示的访问进行了基于“阈值监视”的显示的可能性高。然后,转移到S302。
另一方面,在S301中VCONF的列1105所示的阈值显示不是“有”的情况下,监视业务评价程序334推测为通过ALOG所示的访问进行了基于“阈值监视”的显示的可能性低。然后,转移到S305。
S301之后,监视业务评价程序334在S302及S305中判断ALOG的显示期间(对应于列1304)是否是规定的期间以内。这是因为,一般,在ALOG的显示期间有一个月或1年长的情况下,以“阈值监视”为监视的观点显示运行数据的可能性低。
图17的S302及S305中的规定的期间是1周。这是因为在以“阈值监视”为监视的观点来显示运行数据的情况下,在图17的处理中预先设定了运用管理者显示1周量的运行数据的假定。但是,本实施方式的S302及S305中的规定的期间按照设定的假定,可以是任意的期间。
并且,在S302中ALOG的显示期间为1周以下的情况下,在ALOG所示的访问中以“阈值监视”为监视的观点来显示运行数据的可能性最高。因此,监视业务评价程序334转移到S303。
此外,在S302中ALOG的显示期间超过1周的情况下,在ALOG所示的访问中以“阈值监视”为监视的观点来显示运行数据的可能性比ALOG的显示期间为1周以内的情况的可能性低。因此,监视业务评价程序334转移到S304。
此外,在S305中ALOG的显示期间为一周以下的情况下,在ALOG所示的访问中以“阈值监视”为监视的观点来显示运行数据的可能性比VCONF的阈值显示为”有”的情况的可能性低。因此,监视业务评价程序334转移到S306。
此外,在S305中ALOG的显示期间超过一周的情况下,在ALOG所示的访问中以“阈值监视”为监视的观点来显示运行数据的可能性最低。因此,监视业务评价程序334转移到S307。
监视业务评价程序334对于监视的观点为“阈值监视”的情况的相加值,在S303中设定引数V1,在S304中设定引数V2。此外,对于监视的观点为“阈值监视”的情况的相加值,在S305中设定引数V3,在S303中设定引数V4。
在图17中,引数V1预先被设定1.0,引数V2预先被设定0.7,引数V3预先被设定0.5,引数V4预先被设定0.1。引数V1的值在引数V1~V4的各值之中最大。引数V2的值比引数V1的值小,并且比引数V3的值大。引数V3的值比引数V2的值小,并且比引数V4的值大。引数V4的值在引数V1~引数V4的各值之中最小。
例如,在S207中作为ALOG而选择了访问日志1300的行1311的访问日志、并且在S210中作为VCONF而选择了运行数据显示设定1100的行1111的运行数据显示设定的情况下,行1111的列1105为“无”,并且行1311的列1304为2011年1月17日一天。因此,监视业务评价程序334对ALOG所示的访问中的、对针对监视的观点“阈值监视”的加算值设定引数V3。
图17所示的S302及S305的处理是基于ALOG的显示期间的判断处理,但监视的观点的推测方法不限于本实施方式。即,监视业务评价程序334也可以通过在S302及S305中判断访问日志1300、运行数据显示设定1100或运行数据1000,来推测监视的观点。
以下表示其他的第一推测方法。例如,在一周测定一次的监视项目包含在运行数据中的情况下,运用管理者有时将1个月或1年量的运行数据显示在一个画面上,并且按照“阈值监视”的监视的观点显示。这是因为在将显示期间作为一日或一周来显示如上所述的包含一周测定一次的监视项目的运行数据的情况下,最多也只有一个运行数据显示在一个画面上,确认的效率差。
因此,监视业务评价程序334从访问日志1300取得通过ALOG所示的访问显示在1个画面上的运行数据的数量。并且,也可以通过将取得的运行数据的数量与规定的基准值进行比较,推测监视的观点。此外,通过在上述的S302及S305的处理中追加基于显示在1个画面上的运行数据的数量进行的判断,监视业务评价程序334能够正确地推测监视的观点。
此外,表示其他的第二推测方法。例如,在第二推测方法中,假定多数情况下,基于“阈值监视”的监视的观点进行的显示从运行数据的生成起一周以内进行。在该假定中,监视业务评价程序334计算ALOG所包含的访问时刻(对应于列1301)与显示期间(对应于列1304)之间的相差时间、即运行数据生成之后到被运用管理者访问为止的时间。
然后,监视业务评价程序334将计算出的相差时间与规定的基准值的比较结果用于监视的观点的推测。由此,监视业务评价程序334能够更正确地推测监视的观点。
S309~S314是判断通过ALOG所示的访问是否进行了基于“偏离监视”的监视的观点的显示的处理。
S303、S304、S306或S307之后,监视业务评价程序334判断VCONF的列1106所示的基线显示的有无(S309)。在VCONF的列1106表示”有”的情况下、即在通过ALOG所示的访问显示的画面上明确显示有基线的情况下,监视业务评价程序334推测为在ALOG所示的访问的监视的观点中包含有“基线监视”的可能性高。
因此,监视业务评价程序334在VCONF的列1106表示”有”情况下,将对监视的观点“偏离值监视”的相加值设为引数V11(S310)。图17的引数V11是1.0。引数V11的值比引数V12以及引数V13的各值大。
另一方面,在画面上没有明确显示基线的情况下,也有在监视的观点 中包含“偏离值监视”的情况。例如,在运用管理者在相同的画面中显示了不同的显示期间(对应于列1304)的运行数据的情况下,与仅显示了相同的显示期间的运行数据的情况相比,运用管理者监视着偏离值的有无的可能性高。S311~S314中的处理基于这样的前提。
在S309中判断为VCONF的列1106表示“无”的情况下,监视业务评价程序334从访问日志1300取得表示与ALOG相同的运用管理者进行的访问、并且是ALOG所示的访问的前一个(过去一个)的访问的访问日志(以下称为ALOG2)(S311)。
另外,在不能从访问日志1300取得ALOG2的情况下,ALOG所示的访问的监视的观点为“偏离值监视”的可能性低,因此监视业务评价程序334也可以转移到S314。
S311之后,监视业务评价程序334判断ALOG与ALOG2的画面ID(对应于列1303)是否一致、并且ALOG与ALOG2的显示期间(对应于列1304)是否不同(S312)。
在ALOG与ALOG2的画面ID一致、并且ALOG与ALOG2的显示期间不同的情况下,运用管理者按照“偏离值监视”的监视的观点来显示了运行数据的可能性高。因此,监视业务评价程序334对监视的观点为“偏离值监视”的情况的相加值设定引数V12(S313)。
在ALOG与ALOG2的画面ID不一致、或ALOG与ALOG2的显示期间相同的情况下,运用管理者按照“偏离值监视”的监视的观点显示了运行数据的可能性低。因此,监视业务评价程序334对监视的观点为“偏离值监视”的情况的相加值设定引数V13(S314)。
图17的引数V12为0.3,引数V13为0.1。引数V12的值比引数V13的值大。
例如,在S207中作为ALOG而选择了访问日志1300的行1311、并且在S210中作为VCONF而选择了运行数据显示设定1100的行1111的情况下,行1111的列1106表示“无”,并且,行1311的前一个访问日志不在访问日志1300中。因此,监视业务评价程序334在S314中,对ALOG的监视的观点为“偏离值监视”的情况的相加值设定引数V13。
此外,例如,在S207中作为ALOG而选择了访问日志1300的行1312、 并且在S210中作为VCONF而选择了运行数据显示设定1100的行1111的情况下,与ALOG的运用管理者相同、并且表示ALOG所示的访问的前一个访问的ALOG2是行1311。并且,ALOG与ALOG2的画面ID一致,并且ALOG与ALOG2的显示期间不同。因此,监视业务评价程序334在S313中,对ALOG的监视的观点为“偏离值监视”的情况的相加值设定引数V12。
S315~S319是判断通过ALOG所示的访问是否进行了基于“趋势监视”的监视的观点的显示的处理。S315~S319基于如下假定:运行数据的显示期间越长,则按照“趋势监视”的监视的观点显示了运行数据的可能性越高。
S310、S313或S314之后,监视业务评价程序334判断ALOG的列1304所示的显示期间是否为1年以上(S315)。在ALOG的列1304所示的显示期间为1年以上的情况下,监视的观点为“趋势监视”的可能性高。因此,监视业务评价程序334对监视的观点为“趋势监视”的情况的相加值设定引数V21(S316)。
图17的引数V21为1.0。引数V21的值比引数V22以及引数V23的各值大。
在S315中ALOG的显示期间(对应于列1304)小于1年的情况下,监视业务评价程序334进一步按照ALOG的显示期间,判断监视的观点是否为“趋势监视”。具体而言,监视业务评价程序334判断ALOG的列1304所示的显示期间是否为1个月以上(S317)。
在ALOG的列1304所示的显示期间为1个月以上的情况下,监视业务评价程序334对监视的观点为“趋势监视”的情况的相加值设定引数V22。此外,在ALOG的列1304所示的显示期间小于1个月的情况下,监视业务评价程序334对相加值设定引数V23。
图17的引数V22是0.5,引数V23是0.0。引数V22的值比引数V23大。
例如,在S207中作为ALOG而选择了访问日志1300的行1311、在S210中作为VCONF而选择了运行数据显示设定1100的行1111的情况下,ALOG的显示期间(对应于列1304)是2011年1月17日一天。因此,监视业务评价程序334在S319中对ALOG的监视的观点为“趋势监视”的情况的相 加值设定引数V23。
并且,在ALOG是行1311、VCONF是行1111的情况下,通过S301~S319的处理,对ALOG的监视的观点为“阈值监视”的情况的相加值设定引数V3,对监视的观点为“偏离值监视”的情况的相加值设定引数V13,对监视的观点为“趋势监视”的情况的相加值设定引数V23。
存在运用管理者在向运行数据的一次访问中按照多个监视的观点包含运行数据的可能性,根据图17的处理,监视业务评价程序334能够计算多个监视的观点的相加值。
此外,通过对在监视业务中运用者显示的可能性高的监视的观点设定高的相加值,能够定量地计算运用者进行的监视业务的频度。并且,按照计算出的频度,能够计算表示哪个监视业务是否被充分进行的监视业务评价值。
此外,在访问日志1300中包含发送警报的结果为运用管理者访问了运行数据的履历。因此,监视业务评价程序334根据通过机械性的检查发送的警报,能够定量地计算监视的充分性,该监视的充分性表示由运用管理者进行的监视以何种充分程度进行。
并且,监视业务评价程序334能够对运用管理者提示用于防止运用管理者进行的监视的遗漏的指标。即,通过图14及图17的处理,监视业务评价程序334能够对运用管理者提示基于目视的监视和基于机械性的检查的监视的充分性。
另外,在上述的图14及图17中,监视业务评价程序334推测在访问日志1300中保存的各访问日志所示的访问的监视的观点。但是,本实施方式的监视业务评价程序334也可以推测多个访问日志所示的访问的监视的观点。
以下,表示监视业务评价程序334推测多个访问日志所示的访问的监视的观点的方法。
运用管理者在监视对象设备发生故障时的原因查明作业或监视对象设备的定期的(例如每月一次)维护作业中,有时以半天等的一定期间频繁地访问用于对监视对象设备进行监视的监视客户端。对于这样的访问,与通常的访问同样进行上述的图14及图17的处理的情况下,存在计算出的 监视业务评价值M3发生较大的偏差的可能性。即,在运用管理者以一定期间频繁地访问的情况下,监视业务评价程序334不能正确地计算监视业务评价值M3。
因此,监视业务评价程序334也可以在图14的处理中追加将以一定期间频繁发生的访问日志的监视的观点设为“故障的原因查明”、将其他的监视的观点的相加值设为0的处理。由此,能够避免上述的偏差的发生。
具体而言,监视业务评价程序334定期地或按照运用管理者的指示,根据在访问日志1300中保存的多个访问日志的列1301,学习运用管理者的访问顺序的模式。监视业务评价程序334也可以通过计算概率分布,来学习访问顺序的模式。
并且,在发生了表示与通常的访问顺序大为不同的模式的多个访问日志的情况下,监视业务评价程序334提取与通常的模式不同的多个访问日志。并且,将提取的访问日志的监视的观点设为“故障的原因查明”。并且,将监视的观点为“故障的原因查明”的情况的相加值设定为1,对监视的观点为其他的观点的情况的相加值设定0。
监视业务评价程序334也可以将对这样的多个访问日志推测相同的观点的处理追加到图14的S203,对监视的观点为“故障的原因查明”的访问日志以外进行S204以后的处理。
通过对上述的多个访问日志推测相同的监视的观点,监视业务评价程序334能够更正确地计算监视业务评价值M3。
进而,如上所述,引数V1~引数V23的值由运用管理者等预先设定。这些引数基于表示运用管理者如何确认运行数据的假定来设定。例如,在引数V1与引数V3之差被设定得小的情况下,表示:引数V1和引数V3的值基于在未进行阈值显示的情况下、运用管理者也一边注意阈值一边确认运行数据这样的假定来设定。
因此,为了适当地设定引数V1~引数V23的值,本实施方式的计算机系统的管理者需要验证表示运用管理者如何确认运行数据的假定。该验证方法例如是通过对运用管理者的调查或采访来验证如何进行监视业务的方法。
在验证表示运用管理者如何进行监视业务、即如何确认运行数据的假 定的方法中,有通过监视客户端取得运用管理者的监视业务的特征的方法。例如,监视服务器3在显示运行数据的管理者终端20的画面上显示用于输入显示了该画面的理由的按钮或下拉菜单。并且,监视服务器3使运用管理者输入监视的观点。
进而,监视服务器3根据由运用管理者输入的监视的观点、输入的时间以及运用管理者显示的运行数据,生成表示运用管理者如何确认运行数据的统计信息。并且,监视服务器3按照生成的统计信息,设定引数V1~引数V23的值。
如上所述,为了设定引数的值,需要进行假定的验证,但一旦设定的引数也能够在多个计算机系统中使用。将引数保存在其他计算机系统中并不会对计算机系统的物理资源带来破坏本实施方式的有用性的程度的负担。
通过上述的图14及图17所示的处理,图13的S102的处理结束。
图18是表示本发明的实施方式的监视业务评价程序334计算每个警报发送条件的监视业务评价值M3的处理的流程图。
S102之后,执行S103。图18相当于S103的处理。图18表示监视业务评价程序334计算确认主体为警报发送条件的监视业务评价值M3的处理。
监视业务评价程序334基于在S101中接收到的范围T1,从数据库4的运行数据1000取得测定时刻(对应于列1004)包含在范围T1中的全部的运行数据(S401)。
S401之后,监视业务评价程序334从数据库4的警报发送条件1400取得全部的警报发送条件(S402)。
以下的S403~S414的处理是按照在S402中取得的每个警报发送条件计算监视业务评价值M3的步骤。在计算S402中取得的全部的警报发送条件的监视业务评价值M3的情况下,监视业务评价程序334重复S403~S414的处理。
监视业务评价程序334从在S402中取得的警报发送条件选择一个未验证的警报发送条件、即未被执行S404~S414的处理的警报发送条件(S403)。以下将S403中选择的警报发送条件记为COND。
S403之后,监视业务评价程序334对在S401中取得的各运行数据生成 保存每个监视的观点的计数器变量的列2005(S404)。在S404中生成的列2005所示的计数器变量的初始值是0。
具体而言,在S404中监视业务评价程序334与S204同样,基于在S201中取得的运行数据,生成每个警报发送条件的评价值2000。并且,在生成的评价值2000的列2005中保存0。
S404之后,监视业务评价程序334推测COND所示的监视的观点,此外,按照推测出的每个观点计算计数器变量的相加值(S405)。
一般,警报发送条件所包含的条件式(对应于列1404)多数情况下直接表示监视的观点。例如,在警报发送条件1400的行1411的列1404及列1406为“最近30分钟的平均值为90%以上”的情况下,表示发送SNMP消息。即,行1411表示在过去30分钟内生成的运行数据所包含的CPU使用率的过去30分钟的平均值超过作为阈值的90%的情况下,发送警报。因此,行1411的监视的观点是“阈值监视”。
此外,行1412的列1404表示“最新值大幅偏离过去一周的值”,因此对应于行1412的监视的观点是“偏离值监视”。此外,行1413的列1404表示“根据过去1个月的趋势,2个月以内超过30”,因此对应于行1413的监视的观点是“趋势监视”。此外,行1414的列1404表示“活动会话数量的差为20以上”,因此对应于行1414的监视的观点是“相关关系监视”。
因此,监视业务评价程序334在S405中按照警报发送条件1400的列1404中保存的值,推测COND所示的监视的观点。此外,每个监视的观点的相加值预先被设定。在本实施方式中,在S405中被设定的全部的监视的观点的相加值是1.0。
S405之后,监视业务评价程序334从数据库4的检查日志1500取得包含与COND所包含的条件ID(对应于列1401)相同的条件ID(对应于列1501)、检查期间(对应于列1502)与范围T2重复的全部的检查日志(S406)。这是为了取得在用于计算监视业务评价值的期间所使用的、COND所示的警报发送条件。
在以下的S407~S412中,监视业务评价程序334计算与各检查日志对应的对计数器变量的相加值。
首先,监视业务评价程序334判断在S406中取得的检查日志之中是否有未验证的检查日志、即未被执行S207~S214的处理的检查日志(S407)。在没有未验证的检查日志的情况下,监视业务评价程序334转移到S413。
在有未验证的检查日志的情况下,监视业务评价程序334选择一个未验证的检查日志(S408)。以下将在S408中选择的检查日志记为ILOG。
S408之后,判断在ILOG的检查期间(对应于列1502)与范围T1中是否有重复的期间(S409)。在ILOG的检查期间与范围T1中没有重复的期间的情况下,ILOG在用于计算监视业务评价值的期间中未被使用,因此返回S407,选择未验证的新的检查日志。
另外,在范围T1与范围T2不同的情况下,通过S409的处理,能够提取在用于计算监视业务评价值的运行数据被生成的期间所使用的警报发送条件。
在ILOG的检查期间和范围T1中有重复的期间的情况下,监视业务评价程序334计算ILOG的检查期间与范围T1重复的期间(S410)。以下将在S410中计算出的期间记为期间T3。通过计算期间T3,监视业务评价程序334能够选择在使用ILOG的列1501所示的警报发送条件的期间生成的运行数据。
S410之后,监视业务评价程序334从在S401中取得的运行数据之中选择在列1002及列1003中包含COND的列1402所示的监视对象设备ID以及列1403所示的监视项目ID、并且列1004所示的测定时刻包含在期间T3中的全部运行数据(S411)。
由此,监视业务评价程序334能够选择在用于计算监视业务评价值的期间T3中生成、并且使用了COND所示的警报发送条件的全部的运行数据。
S411之后,监视业务评价程序334确定与在S411中选择的运行数据对应、并且与在S405中推测的监视的观点对应的评价值2000的行。并且,对确定的行的列2005加上在S405中计算出的相加值(S412)。
利用具体例说明上述的S403~S412的处理。例如,说明在S403中作为COND而选择了行1411的警报发送条件、在S408中,作为ILOG而选择了行1511的检查日志的情况。此外,说明范围T1被指定了2011年1月1日00:00:00~2011年1月31日23:59:59的情况。
在上述的具体例中,监视业务评价程序334在S405中推测监视的观点。监视业务评价程序334在S405中计算为COND所示的监视的观点是“阈值监视”,相加值是1。
并且,监视业务评价程序334在S410中计算ILOG的检查期间与T1重复的期间T3。在该情况下,期间T3被计算为2011年1月1日00:00:00~2011年1月19日18:00:00。
然后,在S411中,监视业务评价程序334参照行1411的列1402及列1403,提取监视对象设备ID(对应于列1002)为“host1”、监视项目ID(对应于列1003)为“OS的CPU使用率”的运行数据。进而,从提取的运行数据中选择测定时刻(对应于列1004)包含在期间T3中的全部的运行数据。其结果,监视业务评价程序334选择行1011及行1016的运行数据。
然后,在S412中,监视业务评价程序334确定与行1011及行1016对应、监视的观点表示“阈值监视”的评价值2000的行。即,确定行2011及行2026。然后,对行2011及行2026的列2005加上1。
S412之后,监视业务评价程序334返回S407。在S407中判断为没有未验证的检查日志的情况下,对在S406中取得的检查日志全部执行了S408~S412的处理,因此监视业务评价程序334转移到S413。
S412之后,监视业务评价程序334基于评价值2000的列2005所示的计数器变量,计算COND的每个监视的观点的监视业务评价值M3(S413)。
在S413的计算方法中,提取包含相同的监视对象设备ID、监视项目ID以及监视的观点的组的行,计算提取的行的列2005所包含的计数器变量的统计量。即,S413中的监视业务评价值M3的计算方法与S215相同,但监视业务评价程序334在列2104中作为确认主体而保存与警报发送条件1400的列1401对应的值。
S413之后,判断在S402中取得的警报发送条件之中是否有未验证的警报发送条件、即未被执行S403~S413的处理的警报发送条件(S414)。在有未验证的警报发送条件的情况下,监视业务评价程序334返回S403。并且,在没有未验证的警报发送条件的情况下,监视业务评价程序334结束图18所示的处理,图13的S103结束。
通过上述的图18的处理,生成图16所示的行2117~行2119。即,生 成在评价值2100的列2104所示的确认主体中保存警报发送条件的条件ID(对应于列1401及列1501)的行。
此外,在图18的处理中,监视业务评价程序334按照每个警报发送条件计算监视业务评价值M3,由此能够向运用管理者提示表示运行数据是否按照警报发送条件被充分地进行检查的定量的指标。
图19是表示本发明的实施方式的监视业务评价程序334基于监视业务评价值M3计算监视业务评价值M2的处理的流程图。
图19所示的处理是用于计算与图13所示的S104对应、计算监视业务评价M2的处理。监视业务评价M2是表示由监视对象设备、监视项目以及监视的观点表示的监视业务之中哪个监视业务被充分地监视的指标。即,表示基于观点的监视的充分性的指标。
在图19的处理中使用的引数W1~引数W13是监视业务评价程序334预先保持的参数。图19的处理中的引数W1~引数W13是0以上的值。此外,在图19的处理中使用的引数R也是监视业务评价程序334预先保持的参数。图19的处理中的引数R是0~1的值。
监视业务评价程序334从通过图14所示的处理计算出的监视业务评价值M3中,提取监视对象设备ID、监视项目ID以及监视的观点的唯一的组合,根据提取的组合,生成包含后述的评价值2200的列2201、列2202、列2203的行(S501)。然后,按照在S501中生成的每个行,追加保存计数器变量的列(S502)。在S502中计数器变量的值是0。
图20是表示本发明的实施方式的包含监视业务评价值M2的计数器变量的评价值2200的说明图。
评价值2200包含用于计算监视业务评价值M2的计数器变量。评价值2200包含列2201~列2204。
列2201表示监视对象设备ID。在列2201中保存的值对应于在评价值2100的列2101中保存的值。列2202表示监视项目ID。在列2202中保存的值对应于在评价值2100的列2102中保存的值。
列2203表示监视的观点。在列2203中保存的值对应于在评价值2100的列2103中保存的值。列2204表示用于计算监视业务评价值M2的计数器变量。
列2204所示的计数器变量表示:将在列2201所示的监视对象设备中生成、并且包含列2202所示的监视项目的运行数据按照列2203所示的监视的观点进行访问或检查的频度。
通过以下的S503~S515的处理,监视业务评价程序334计算各监视业务评价值M3的各自的权重,并对用于计算监视业务评价值M2的计数器变量加上计算出的权重。
S502之后,监视业务评价程序334从按照图14所示的处理生成的评价值2100中选择一个未验证的行、即未被执行S503~S515的行(S503)。以下将在S503中选择的行记为评价值M3-1。
S503之后,监视业务评价程序334判断评价值M3-1的确认主体(对应于列2104)表示运用管理者还是表示警报发送条件(S504)。
在评价值M3-1的确认主体(对应于列2104)表示警报发送条件的情况下,评价值M3-1表示基于警报发送条件进行的运行数据的检查,不表示是否由运用管理者确认警报所示的运行数据。因此,监视业务评价程序334计算表示通过评价值M3-1所示的警报的发送,运用者进行的监视被何种程度地充分进行、即,评价值M3-1所示的警报的发送对运用管理者的监视起到多少作用的指标,因此执行S508~S513的处理。
在评价值M3-1的列2104表示运用管理者的情况下,监视业务评价程序334判断列2104所示的运用管理者是否预先被设定为进行列2101及列2102所示的监视业务的负责人(S505)。
通过S505的判断,监视业务评价程序334将与对负责人以外的运用管理者辅助地进行的监视业务设定的评价值不同的值,设定给由作为负责人的运用管理者进行的监视业务。这基于如下假定:由作为负责人的运用管理者进行的监视业务比由负责人以外的运用管理者进行的监视业务进行更有效、充分的监视。因此,对由作为负责人的运用管理者进行的监视业务设定高的评价值。
在S505中,监视业务评价程序334参照数据库4的负责人信息1600的列1601~列1603,判断评价值M3-1的运用管理者(对应于列2104)是否是评价值M3-1的列2102及列2103所示的监视对象设备以及监视项目的负责人。
然后,在评价值M3-1的运用管理者是评价值M3-1的列2102及列2103所示的监视对象设备以及监视项目的负责人的情况下,监视业务评价程序334对评价值M3-1的监视业务评价值M3(对应于列2105的值)乘以引数W1。并且,对包含与评价值M3-1的列2101、列2102及列2103对应的值的、评价值2200的行的列2204加上相乘的结果(S506)。
在评价值M3-1的列2104所示的运用管理者不是评价值M3-1的列2102及列2103所示的监视对象设备以及监视项目的负责人的情况下,监视业务评价程序334对评价值M3-1的监视业务评价值M3(对应于列2105的值)乘以引数W2。并且,对包含与评价值M3-1的列2101、列2102及列2103对应的值的、评价值2200的行的列2204加上相乘的结果(S507)。
上述的S505~S507基于预先设定的负责人的监视业务是更有效的监视业务这样的假定,引数W1是比引数W2大的值。图20所示的引数W1是1.0,引数W2是0.5。但是,在基于与上述的假定不同的假定的情况下,引数W1也可以不是比引数W2大的值。
在S504中评价值M3-1的列2104所示的确认主体是警报发送条件的情况下,监视业务评价程序334转移到S508。并且,监视业务评价程序334按照根据列2104所示的警报发送条件来发送的警报对实际的监视业务起到作用的程度,设定监视业务评价值M3的权重。
监视业务评价程序334从警报发送履历1700取得在列1703中包含与评价值M3-1的列2104对应的条件ID、且列1702所示的警报发送时间包含在范围T2的期间中的警报发送履历(S508)。
S508之后,监视业务评价程序334判断在S508中取得的警报发送履历是否是0件(S509)。
然后,在S508中取得的警报发送履历是0件的情况下,警报不会根据评价值M3-1所示的警报发送条件来发送,评价值M3-1所示的警报发送条件是否对运用者的监视起到作用是不明确的。因此,监视业务评价程序334对评价值M3-1的监视业务评价值M3乘以引数W11。并且,对与评价值M3-1对应的评价值2200的列2204加上相乘的结果(S510)。
图19所示的引数W11是0.8。引数W11是用于计算标准的监视业务评价值的数值的数值。
在S509中判断为在S508中取得的警报发送履历为1件以上的情况下,监视业务评价程序334基于警报发送履历的列1704所示的确认状况,计算在S508中取得的警报发送履历的确认完成率。并且判断计算出的确认完成率是否是引数R以上(S511)。
计算出的确认完成率越高,越表示根据评价值M3-1所示的警报发送条件发送的警报由运用管理者确认。此外,在计算出的确认完成率高的情况下,评价值M3-1所示的警报发送条件对实际的监视业务起到作用。
在S511中,监视业务评价程序334计算在列1704中保存有“完成”的行相对于在S508中取得的全部的警报发送履历的行数的比例,由此计算确认完成率。
在确认完成率为引数R以上的情况下,评价值M3-1所示的警报发送条件起到作用,因此监视业务评价程序334对评价值M3-1的监视业务评价值M3乘以引数W12。并且,对包含与评价值M3-1的列2101、列2102及列2103对应的值的、评价值2200的行的列2204加上相乘的结果(S512)。
在S511中判断为确认完成率小于引数R的情况下,评价值M3-1所示的警报发送条件不起到作用,因此监视业务评价程序334对评价值M3-1的监视业务评价值M3乘以引数W13。并且,对包含与评价值M3-1的列2101、列2102及列2103对应的值的、评价值2200的行的列2204加上相乘的结果(S513)。
确认完成率越高,基于警报发送履历的警报对监视业务越起作用,因此引数W12是比引数W13大的值。图19所示的引数W12是1.0,引数W13是0.2。
在上述的S510中,在警报发送履历为0件的情况下对监视业务评价值M3乘的值为常数(引数W11),但也可以按照本实施方式的计算机系统的运用状况,使引数W11动态地变化。
例如,可以认为已发送的警报的确认完成率高的计算机系统的今后新发送的警报的确认完成率高。因此,也可以计算在范围T2中发送的全部的警报的确认完成率,设定警报发送履历为0件的情况的引数W11的值。
具体而言,例如也可以在范围T2中发送的全部的警报的确认完成率为引数R以上的情况下,将引数W11设为与引数W12相同的值,在全部的警 报的确认完成率小于引数R的情况下,将引数W11设为与引数W13相同的值。
监视业务评价程序334判断是否有未验证的评价值2100的行、即未被进行上述的S503~S513的处理的评价值2100的行(S514)。在有未验证的评价值2100的行的情况下,监视业务评价程序334返回S503。由此,对评价值2100的全部的行执行S501~S513的处理。
在没有未验证的评价值2100的行的情况下,监视业务评价程序334将生成的评价值2200保存在评价值2300中(S515)。S515之后,监视业务评价程序334结束图19的处理。若图19的处理结束,则图13的S104结束。
通过图19所示的处理,监视业务评价程序334生成评价值2200,计算列2204所示的计数器变量。并且,计算图21所示的监视业务评价值M2。由此,监视业务评价程序334向运用管理者提示表示各监视对象设备的监视项目按照哪个监视的观点被最好地监视的指标。
图21是表示本发明的实施方式的包含监视业务评价值M2的评价值2300的说明图。
监视业务评价值M2按照监视对象设备、监视项目以及监视的观点所示的每个监视业务来计算。即,监视业务评价值M2表示各监视对象设备的监视项目根据哪个监视的观点被最好地监视。
图21所示的评价值2300保存在监视服务器3的存储器33中。评价值2300包含列2301~列2304。
列2301表示监视对象设备ID。在列2301中保存的值对应于在评价值2200的列2201中保存的值。列2302表示监视项目ID。在列2302中保存的值对应于在评价值2200的列2202中保存的值。列2303表示监视的观点。在列2303中保存的值对应于在评价值2200的列2203中保存的值。
列2304表示监视业务评价值M2。在列2304中保存的值是与评价值2200的计数器变量相同的值。
利用具体例说明图19所示的处理。以下表示基于图16的监视业务评价值M3,计算监视对象设备ID为“host1”、监视项目ID为“OS的CPU使用率”、监视的观点为“阈值监视”的监视业务的监视业务评价值M2的情 况。此外,以下表示范围T1被指定了2011年1月1日00:00:00~2011年1月31日23:59:59、范围T2被指定了2011年1月1日00:00:00~2011年2月7日23:59:59的情况。此外,在该情况下,引数R是0.8。
另外,在图19所示的处理中,对评价值2100的各行进行S504~S514的处理,因此依次生成评价值2200的各行,但在以下所示的例中,仅表示计算监视对象设备ID为“host1”、监视项目ID为“OS的CPU使用率”、监视的观点为“阈值监视”的监视业务、即评价值2200的行2211的计数器变量的处理。
在计算评价值2200的行2211的计数器变量的情况下,在S503中选择评价值2100的行2111、行2114或行2117。
监视业务评价程序334在S504中参照行2111的列2104,判断为行2111的监视业务是基于运用管理者的。并且,在S505中,参照行2111的列2104和负责人信息1600的列1601,确定行1611及行1612。
被确定的行1611的列1602和列1603表示运用管理者ID为“operator1”的运用管理者是监视对象设备host1的全部的监视项目的负责人。因此,在S505中,监视业务评价程序334判断为行2111所示的监视业务是基于负责人的。
并且,监视业务评价程序334在S506中从行2111的列2105取得监视业务评价值M3,将取得的监视业务评价值M3(0.8)与引数W1(1.0)相乘。并且,将相乘的结果0.8与保存在行2211的列2204中的值相加。
进而,监视业务评价程序334在S504中,参照行2114的列2104,判断为行2114的监视业务是基于运用管理者的。并且,在S505中,参照行2114的列2104和负责人信息1600的列1601,确定行1613。
被确定的行1613的列1602和列1603表示运用管理者ID表示“operator2”的运用管理者是全部的监视对象设备的监视项目“网络应用的响应时间”的负责人。因此,在S505中,监视业务评价程序334判断为行2114的监视业务不是基于负责人的。
并且,监视业务评价程序334在S507中从行2114的列2105取得监视业务评价值M3,将取得的监视业务评价值M3(1.4)与引数W2(0.5)相乘。并且,将相乘的结果0.7与保存在行2211的列2204中的值相加。
进而,监视业务评价程序334在S504中,参照行2117的列2104,判断为行2114的监视业务是基于警报发送条件的。并且,在S508中,取得在列1703中包含与行2117的列2104对应的值、且在范围T2中包含列1702的值的、警报发送履历1700的行1712及行1714。
监视业务评价程序334判断为在S508中取得的行不是0行。并且,在S511中,监视业务评价程序334基于行1712及行1714的列1704,计算确认完成率。
计算出的确认完成率是1/2(=0.5)。如上所述,引数R是0.8。因此,监视业务评价程序334在S511中,判断为确认完成率不是引数R以上。
并且,监视业务评价程序334在S513中从行2117的列2105取得监视业务评价值M3,将取得的监视业务评价值M3(1.0)与引数W13(0.2)相乘。并且,将相乘的结果0.2与保存在行2211的列2204中的值相加。此时,监视业务评价程序334将在行2211的列2204中保存的计数器变量计算为0.8+0.7+0.2=1.7。
通过对评价值2100的各行重复上述的处理,监视业务评价程序334生成评价值2200。并且,将生成的评价值2200的各列保存在评价值2300的各列中。
在上述的图19的处理中,在确认主体为运用管理者的情况下,监视业务评价程序334基于负责人信息1600,设定监视业务评价值M3的权重。但是,设定对监视业务评价值M3的权重的方法不限于本实施方式。例如,也可以基于运用管理者的能力、工龄或过去发现故障的预兆的次数等来设定权重。
另一方面,在上述的图19的处理中,在确认主体为警报发送条件的情况下,监视业务评价程序334基于根据警报发送履历1700计算的的确认完成率,设定监视业务评价值M3的权重。但是,设定权重的方法不限于本实施方式。例如,也可以基于各警报实际是否对故障或故障的预兆的发现起到作用,来设定发送了该警报的警报发送履历的权重。
另外,在上述的图19的处理中,计算了确认主体为警报发送条件的情况的监视业务评价值M2,但在监视业务评价值M3中确认主体不包含警报 发送条件的情况下,也可以不执行S508~S518。这是因为,如上所述,表示运用管理者根据警报的发送而进行的向运行数据的访问的访问日志也通过图14的处理,被计算出监视业务评价值M3。因此,在确认主体不包含警报发送条件的情况下,监视业务评价程序334也能够向运用管理者提示基于目视的监视和基于机械性的检查的监视的充分性。
图22是表示本发明的实施方式的监视业务评价程序334基于监视业务评价值M2计算监视业务评价值M1的处理的流程图。
图22所示的处理是对应于图13的S105、用于基于监视业务评价值M2计算监视业务评价值M1的处理。
首先,监视业务评价程序334从通过S104的处理生成的评价值2300提取监视对象设备ID以及监视项目ID的唯一的组合,生成后述的评价值2400的列2401以及列2402(S601)。此外,在S601中,生成保存监视业务评价值M1的列2403。
图23是表示本发明的实施方式的包含监视业务评价值M1的评价值2400的说明图。
监视业务评价值M1按照监视对象设备ID和监视项目ID所示的每个监视业务计算。即,评价值2300表示各监视对象设备的各监视项目被何种程度地充分监视。
图23所示的评价值2400保持在监视服务器3的存储器33中。评价值2400包含列2401~列2403。
列2301表示监视对象设备ID。在列2401中保存的值对应于在评价值2300的列2301中保存的值。列2402表示监视项目ID。在列2402中保存的值对应于在评价值2300的列2302中保存的值。列2403表示监视业务评价值M1。
S601之后,监视业务评价程序334从生成的评价值2400选择一个未验证的行、即未被执行S603~S606的处理的行(S602)。以下将在S602中选择的行记为COMB。
S602之后,监视业务评价程序334提取包含与COMB所包含的监视对象设备ID(对应于列2401)以及监视项目ID(对应于列2402)相同的监视对象设备ID(对应于列2301)以及监视项目ID(对应于列2302)的全部的 评价值2300的行。并且,确定提取的行所包含的全部监视业务评价值M2(S603)。
S603之后,监视业务评价程序334从数据库4的观点的重要度1800取得在S603中确定的行所包含的各监视业务评价值M2(对应于列2304)的重要度(S604)。
具体而言,监视业务评价程序334从观点的重要度1800提取包含与在S603中提取的评价值2300的各行的列2301、列2302以及列2303相同的列1801、列1802以及列1803的行。并且,取得提取的行的列1804的值。即,监视业务评价程序334取得列1804的值,作为在S603中确定的各行的、监视业务评价值M2的重要度。
S604之后,监视业务评价程序334基于在S604中取得的各监视业务评价值M2的重要度,设定各监视业务评价值M2的权重(S605)。设定权重的方法中例如有用一行所示的监视业务评价值M2的重要度除以在S604中取得的全部的重要度的值的总和而得到的值作为对该监视业务评价值M2的权重的方法。
S605之后,基于在S603中取得的监视业务评价值M2和在S605中设定的各监视业务评价值M2的权重,监视业务评价程序334计算对COMB的监视对象设备ID(对应于列2401)和监视项目ID(对应于列2402)所示的监视业务的监视业务评价值M1(S606)。该计算方法中例如有将对各个监视业务评价值M2乘以其权重而得到的值的总和设为监视业务评价值M1的方法。
S606之后,监视业务评价程序334判断在S601中提取的评价值2300的行之中是否有未验证的行、即未被执行S602~S606的行(S607)。并且,在有未验证的行的情况下,监视业务评价程序334返回S602。在没有未验证的行的情况下,监视业务评价程序334结束图22所示的处理。
通过以上的处理,监视业务评价程序334基于监视业务评价值M2计算监视业务评价值M1,生成图23所示的评价值2400。
利用具体例说明上述的图22的处理。
例如,说明监视业务评价程序334根据图21的监视业务评价值M2计算对监视对象ID“host1”以及监视项目ID“OS的CPU使用率”的组合的监 视业务评价值M1的处理。
监视业务评价程序334在S602中选择评价值2400的列2401表示“host1”、列2402为“OS的CPU使用率”的行2411。并且,在S603中,监视业务评价程序334确定列2301为“host1”、列2302为“OS的CPU使用率”的行2311~行2313。
并且,在S604中,监视业务评价程序334参照观点的重要度1800,确定与行2311对应的观点的重要度1800的行1811。并且取得行1811所包含的列1804的值(4),作为行2311的监视业务评价值M2的重要度。
此外,在S604中,监视业务评价程序334确定与行2312对应的观点的重要度1800的行1812。并且取得行1812所包含的列1804的值(4),作为行2312的监视业务评价值M2的重要度。
此外,在S604中,监视业务评价程序334确定与行2313对应的观点的重要度1800的行1813。并且取得行1813所包含的列1804的值(2),作为行2313的监视业务评价值M2的重要度。
并且,在S605中,监视业务评价程序334将用各重要度(4、4、2)除以重要度的总和(10)而得到的值设定为每个监视业务评价值M2的权重。监视业务评价程序334对行2311、行2312以及行2313的监视业务评价值M2的权重分别设定0.4、0.4以及0.2。
并且,在S606中,监视业务评价程序334对行2311、行2312以及行2313的列2304的值乘以在S604中决定的权重。相乘的结果是行2311中计算出0.68,行2312中计算出0.04,行2313中计算出0.1。并且,通过计算相乘的结果的总和(0.82),计算监视业务评价值M1。
上述的处理的结果,在列2401为监视对象设备ID“host1”、列2402为监视项目ID“OS的CPU使用率”的行2411的列2403中保存0.82。
如上所述,监视业务评价程序334通过计算监视业务评价值M1,能够向运用管理者提示基于目视的监视和基于机械性的检查的监视的充分性。并且,由此能够减少监视的遗漏。
具体而言,监视业务评价程序334基于运行数据、各运用管理者对运行数据的访问日志以及基于各警报发送条件的检查日志,计算3种的监视业务评价值M1、M2以及M3。并且,运用管理者确认这些监视业务评价值, 由此在计算机系统中能够迅速确定监视不充分的监视对象设备以及监视项目。
若图22所示的处理结束,则图13所示的S105结束。监视业务评价程序334如上所述,S105之后,在S106中将计算出的监视业务评价值M1、监视业务评价值M2以及监视业务评价值M3发送给监视客户端。
图24是表示本发明的实施方式的对运用管理者提示的监视业务评价值M1的表2500的说明图。
图24的表2500是由监视业务评价程序334根据评价值2400生成、并显示在具有监视客户端的管理者终端20等中的表。表2500的行对应于评价值2400的列2402,表2500的列对应于评价值2400的列2401。此外,各单元格中保存的值对应于在列2403中保存的值。
运用管理者参照表2500提取监视业务评价值M1的值低的监视对象机器以及监视项目,由此能够确定监视不充分的监视对象设备以及监视项目所示的监视业务。
例如,图24的表2500中监视对象设备“host3”的监视项目“数据上载件数”的监视业务评价值M1低。因此,运用管理者能够迅速确定关于监视对象设备“host3”的一部分的运行数据监视不充分的情况。
此外,运用管理者通过参照监视业务评价值M2以及监视业务评价值M3,能够更正确地识别哪个监视业务不充分。通过迅速确定监视不充分的监视对象设备以及监视项目,减少运用管理者重新审视监视业务为止的时间,由此能够减小忽视故障的可能性。
进而,由于对未发生警报的监视对象设备也计算监视业务评价值,因此运用管理者通过执行本实施方式的处理,也能够将针对正常动作的监视对象设备的监视的充分性定量化。
此外,在不同的计算机系统上的监视服务器3中分别计算监视业务评价值的情况下,能够比较不同的计算机系统的监视的充分性。由此,不同的计算机系统的运用管理者们对各计算机系统的监视业务评价值进行比较,能够迅速确定监视不充分的监视对象设备。由此,能够迅速确定应共享彼此的监视技巧的地方。并且,通过在不同的计算机系统的运用管理者之间共享监视业务的技巧,结果上能够降低忽视故障的可能性。
进而,关于一个计算机系统,基于不同的期间的访问日志以及检查日志计算监视业务评价值,由此运用管理者能够比较不同的期间的监视的充分性。例如,分别计算基于上个月的访问日志以及检查日志的监视业务评价值、和基于本月的访问日志以及检查日志的监视业务评价值,由此运用管理者能够确认经过1个月之后监视的充分性改善了多少。
或者,通过计算监视业务的重新审视前和重新审视后的监视业务评价值,运用管理者能够定量地评价由监视业务的重新审视带来的效果。
本实施方式的监视业务评价程序334不仅如监视业务评价值M2那样按照监视对象设备和监视项目所示的运行数据,而且按照每个监视的观点计算。因此,通过参照计算出的监视业务评价值M2,运用管理者能够迅速确定怎样的监视的观点不充分。由此,能够降低忽视故障的可能性。
此外,本实施方式的监视业务评价程序334能够按照进行监视的运用管理者以及警报发送条件来计算。通过使用这样计算出的监视业务评价值,运用管理者能够迅速确定应重新审视哪个运用管理者的活动或警报发送条件的条件式。由此,能够降低忽视故障的可能性。
以上,参照附图详细说明了本发明的实施方式,但是具体的结构不限于该实施方式,还包含不偏离该发明的主旨的范围的设计等。
附图标记说明
1管理网络
2通信线路
3监视服务器
4数据库
5物理机
6交换机
7路由器
8光纤通道交换机
9储存单元
10WAN
11通信线路
20管理者终端
31接口
32CPU
33存储器
34数据总线
331运行数据收集程序
332运行数据显示程序
333警报发送程序
334监视业务评价程序
1000运行数据
1100运行数据显示设定
1200运用管理者信息
1300访问日志
1400警报发送条件
1500检查日志
1600负责人信息
1700警报发送履历
1800观点的重要度。
Claims (13)
1.一种监视服务器,与关于预先设定的监视项目取得运行数据的装置、以及输出上述运行数据的管理者终端连接,具备处理器以及存储器,其特征在于,
上述监视服务器进行以下动作:
从上述装置接收上述运行数据;
按照由用户指示的观点,生成用于上述管理者终端将接收到的上述运行数据输出的输出数据;
为了使上述用户监视上述装置以及上述监视项目,将生成的上述输出数据向上述管理者终端发送;
取得用于上述管理者终端输出上述运行数据的输出设定、表示从上述管理者终端输出上述运行数据的履历的访问日志、以及输出上述运行数据的第1期间;
基于接收到的上述运行数据、取得的上述输出设定、取得的上述访问日志以及上述第1期间,生成包含第1信息和第1指标的第1评价值,该第1信息包含上述装置、上述监视项目、上述观点以及上述用户,该第1指标表示是否充分进行了上述第1信息所示的监视;
基于上述第1评价值,生成包含第2信息和第2指标的第2评价值,该第2信息包含上述装置、上述监视项目以及上述观点,该第2指标表示上述第2信息所示的监视的充分性;
基于上述第2评价值,生成包含第3信息和第3指标的第3评价值,该第3信息包含上述装置以及监视项目,该第3指标表示上述第3信息所示的监视的充分性;
将上述第1评价值、上述第2评价值以及上述第3评价值保持在上述存储器中;
生成用于输出上述第1评价值、上述第2评价值以及上述第3评价值的数据。
2.如权利要求1所述的监视服务器,其特征在于,
上述监视服务器进行以下动作:
通过向上述管理者终端发送警报,向上述用户提示上述警报所示的运行数据;
取得表示为了发送上述警报而使用的上述运行数据的条件的警报条件、发送上述警报的警报发送履历、以及使用上述警报条件的第2期间;
计算上述第1期间与上述第2期间重复的第3期间;
基于接收到的上述运行数据、取得的上述警报条件、取得的上述警报发送履历以及上述第3期间,生成包含上述装置、上述监视项目、上述观点以及上述警报条件的第4信息、以及表示是否充分进行了上述第4信息所示的监视的第4指标;
将上述第4信息和上述第4指标包含在上述第1评价值中。
3.如权利要求2所述的监视服务器,其特征在于,
上述监视服务器进行以下动作:
基于取得的上述输出设定、取得的上述访问日志以及上述第1期间,推测为了输出接收到的上述运行数据而在上述第1期间中从上述管理者终端指示的第1观点;
按照上述第1观点,计算上述第1指标;
基于取得的上述警报条件、取得的上述警报发送履历以及上述第3期间,推测在上述第3期间中使用的上述警报条件所示的第2观点;
按照上述第2观点,计算上述第4指标。
4.如权利要求3所述的监视服务器,其特征在于,
上述监视服务器进行以下动作:
取得表示上述用户负责监视的上述装置以及上述监视项目的负责人信息;
基于上述第1评价值和取得的上述负责人信息,生成包含上述装置、上述监视项目以及上述观点的第2信息、以及表示上述第2信息所示的监视的充分性的第2指标。
5.如权利要求4所述的监视服务器,其特征在于,
上述监视服务器进行以下动作:
取得确认信息,该确认信息表示上述管理者终端是否输出了被发送的上述警报所示的运行数据;
基于上述第1评价值、取得的上述确认信息以及上述第1期间,计算在上述第1期间中输出了上述警报所示的运行数据的确认率;
基于上述第1评价值和计算出的上述确认率,生成包含上述装置、上述监视项目以及上述观点的第5信息、以及表示上述第5信息所示的监视的充分性的第5指标;
将上述第5信息和上述第5指标包含在上述第2评价值中。
6.如权利要求5所述的监视服务器,其特征在于,
上述监视服务器进行以下动作:
取得与上述装置、上述监视项目以及上述观点对应的重要度;
基于上述第2评价值和取得的上述重要度,生成包含上述装置以及监视项目的第3信息、以及表示上述第3信息所示的监视的充分性的第3指标。
7.如权利要求1所述的监视服务器,其特征在于,
表示是否充分进行了上述监视的指标表示上述运行数据在上述第1期间中从上述管理者终端输出的频度。
8.一种监视评价方法,是基于具备处理器以及存储器的监视服务器的监视评价方法,该监视服务器与关于预先设定的监视项目取得运行数据的装置、以及输出该运行数据的管理者终端连接,上述监视评价方法的特征在于,
上述方法进行以下动作:
上述监视服务器从上述装置接收上述运行数据;
上述监视服务器按照由用户指示的观点,生成用于上述管理者终端将接收到的上述运行数据输出的输出数据;
上述监视服务器为了使上述用户监视上述装置以及上述监视项目,将生成的上述输出数据向上述管理者终端发送;
上述监视服务器取得用于上述管理者终端输出上述运行数据的输出设定、表示从上述管理者终端输出上述运行数据的履历的访问日志、以及输出上述运行数据的第1期间;
上述监视服务器基于接收到的上述运行数据、取得的上述输出设定、取得的上述访问日志以及上述第1期间,生成包含第1信息和第1指标的第1评价值,该第1信息包含上述装置、上述监视项目、上述观点以及上述用户,该第1指标表示是否充分进行了上述第1信息所示的监视;
上述监视服务器基于上述第1评价值,生成包含第2信息和第2指标的第2评价值,该第2信息包含上述装置、上述监视项目以及上述观点,该第2指标表示上述第2信息所示的监视的充分性;
上述监视服务器基于上述第2评价值,生成包含第3信息和第3指标的第3评价值,该第3信息包含上述装置以及上述监视项目,该第3指标表示上述第3信息所示的监视的充分性;
上述监视服务器将上述第1评价值、上述第2评价值以及上述第3评价值保持在上述存储器中;
上述监视服务器生成用于输出上述第1评价值、上述第2评价值以及上述第3评价值的数据。
9.如权利要求8所述的监视评价方法,其特征在于,
上述监视服务器通过向上述管理者终端发送警报,向上述用户提示上述警报所示的运行数据;
上述监视服务器取得表示为了发送上述警报而使用的上述运行数据的条件的警报条件、发送上述警报的警报发送履历、以及使用上述警报条件的第2期间;
上述监视服务器计算上述第1期间与上述第2期间重复的第3期间;
上述监视服务器基于接收到的上述运行数据、取得的上述警报条件、取得的上述警报发送履历以及上述第3期间,生成包含上述装置、上述监视项目、上述观点以及上述警报条件的第4信息、以及表示是否充分进行了上述第4信息所示的监视的第4指标;
上述监视服务器将上述第4信息和上述第4指标包含在上述第1评价值中。
10.如权利要求9所述的监视评价方法,其特征在于,
上述监视服务器基于取得的上述输出设定、取得的上述访问日志以及上述第1期间,推测为了输出接收到的上述运行数据而在上述第1期间中从上述管理者终端指示的第1观点;
上述监视服务器按照上述第1观点,计算上述第1指标;
上述监视服务器基于取得的上述警报条件、取得的上述警报发送履历以及上述第3期间,推测在上述第3期间中使用的上述警报条件所示的第2观点;
上述监视服务器按照上述第2观点,计算上述第4指标。
11.如权利要求10所述的监视评价方法,其特征在于,
上述监视服务器取得表示上述用户负责监视的上述装置以及上述监视项目的负责人信息;
上述监视服务器基于上述第1评价值和取得的上述负责人信息,生成包含上述装置、上述监视项目以及上述观点的第2信息、以及表示上述第2信息所示的监视的充分性的第2指标。
12.如权利要求11所述的监视评价方法,其特征在于,
上述监视服务器取得确认信息,该确认信息表示上述管理者终端是否输出了被发送的上述警报所示的运行数据;
上述监视服务器基于上述第1评价值、取得的上述确认信息以及上述第1期间,计算在上述第1期间中输出了上述警报所示的运行数据的确认率;
上述监视服务器基于上述第1评价值和计算出的上述确认率,生成包含上述装置、上述监视项目以及上述观点的第5信息、以及表示上述第5信息所示的监视的充分性的第5指标;
上述监视服务器将上述第5信息和上述第5指标包含在上述第2评价值中。
13.如权利要求12所述的监视评价方法,其特征在于,
上述监视服务器取得与上述装置、上述监视项目以及上述观点对应的重要度;
上述监视服务器基于上述第2评价值和取得的上述重要度,生成包含上述装置以及监视项目的第3信息、以及表示上述第3信息所示的监视的充分性的第3指标。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP107308/2011 | 2011-05-12 | ||
JP2011107308A JP5623333B2 (ja) | 2011-05-12 | 2011-05-12 | 監視サーバ、及び、監視評価方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102779086A true CN102779086A (zh) | 2012-11-14 |
CN102779086B CN102779086B (zh) | 2016-08-24 |
Family
ID=47124005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210042199.5A Expired - Fee Related CN102779086B (zh) | 2011-05-12 | 2012-02-22 | 监视评价装置以及监视评价方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5623333B2 (zh) |
CN (1) | CN102779086B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562608A (zh) * | 2017-08-11 | 2018-01-09 | 东软集团股份有限公司 | 资源指标重要度评估方法及装置 |
CN110352438A (zh) * | 2017-03-03 | 2019-10-18 | 三菱电机株式会社 | 信息技术运用评价装置及信息技术运用评价方法 |
CN110737715A (zh) * | 2019-10-21 | 2020-01-31 | 北京百度网讯科技有限公司 | 数据的可视化显示方法、装置、设备及介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111176956A (zh) * | 2018-11-09 | 2020-05-19 | 广州贵冠科技有限公司 | 监控装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1609818A (zh) * | 2003-10-23 | 2005-04-27 | 夏普株式会社 | 数据监视装置、具有该数据监视装置的网络系统、以及数据监视方法、用于执行该数据监视方法的计算机程序 |
US20060101520A1 (en) * | 2004-11-05 | 2006-05-11 | Schumaker Troy T | Method to manage network security over a distributed network |
US20090019312A1 (en) * | 2007-07-11 | 2009-01-15 | Bea Systems, Inc. | System and Method for Providing an Instrumentation Service Using Dye Injection and Filtering in a SIP Application Server Environment |
CN101960863A (zh) * | 2008-03-07 | 2011-01-26 | 日本电气株式会社 | 内容分发系统、特征量分发服务器、客户端和内容分发方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188726A (ja) * | 1999-12-28 | 2001-07-10 | Fujitsu Ltd | 監視事象通知システム |
JP2008269109A (ja) * | 2007-04-17 | 2008-11-06 | Sharp Corp | コンテンツ表示装置、コンテンツ表示システム、コンテンツ表示方法、プログラム、および、記録媒体 |
JP4867908B2 (ja) * | 2007-12-19 | 2012-02-01 | 日本電気株式会社 | 監視システム、ネットワーク監視装置及びサービス実行環境監視方法 |
TWI397865B (zh) * | 2009-08-12 | 2013-06-01 | Utechzone Co Ltd | Security personnel to monitor the degree of focus monitoring system |
-
2011
- 2011-05-12 JP JP2011107308A patent/JP5623333B2/ja not_active Expired - Fee Related
-
2012
- 2012-02-22 CN CN201210042199.5A patent/CN102779086B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1609818A (zh) * | 2003-10-23 | 2005-04-27 | 夏普株式会社 | 数据监视装置、具有该数据监视装置的网络系统、以及数据监视方法、用于执行该数据监视方法的计算机程序 |
US20060101520A1 (en) * | 2004-11-05 | 2006-05-11 | Schumaker Troy T | Method to manage network security over a distributed network |
US20090019312A1 (en) * | 2007-07-11 | 2009-01-15 | Bea Systems, Inc. | System and Method for Providing an Instrumentation Service Using Dye Injection and Filtering in a SIP Application Server Environment |
CN101960863A (zh) * | 2008-03-07 | 2011-01-26 | 日本电气株式会社 | 内容分发系统、特征量分发服务器、客户端和内容分发方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110352438A (zh) * | 2017-03-03 | 2019-10-18 | 三菱电机株式会社 | 信息技术运用评价装置及信息技术运用评价方法 |
CN110352438B (zh) * | 2017-03-03 | 2023-06-06 | 三菱电机株式会社 | 信息技术运用评价装置及信息技术运用评价方法 |
CN107562608A (zh) * | 2017-08-11 | 2018-01-09 | 东软集团股份有限公司 | 资源指标重要度评估方法及装置 |
CN110737715A (zh) * | 2019-10-21 | 2020-01-31 | 北京百度网讯科技有限公司 | 数据的可视化显示方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102779086B (zh) | 2016-08-24 |
JP5623333B2 (ja) | 2014-11-12 |
JP2012238213A (ja) | 2012-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101300360B1 (ko) | 동적 어플리케이션 사용 정보의 분산 캡쳐 및 결집체 | |
CN102741872B (zh) | 广告管理系统 | |
US20160140626A1 (en) | Web page advertisement configuration and optimization with visual editor and automatic website and webpage analysis | |
CN112380473B (zh) | 数据采集与同步方法、装置、设备及存储介质 | |
CN104834582B (zh) | 一种监控事件展示方法 | |
JP2010211419A (ja) | 使用電力監視システム | |
CN105490854A (zh) | 实时日志收集方法、系统和应用服务器集群 | |
EP2510486A2 (en) | Methods for capturing and reporting metrics regarding ad placement | |
CN102779086A (zh) | 监视服务器以及监视评价方法 | |
CN108845914A (zh) | 性能测试报告的生成方法、电子装置及可读存储介质 | |
CN109614766A (zh) | 一种通过文件获取对网页进行区块链存证的方法及装置 | |
US10771359B2 (en) | System capacity heatmap | |
CN111984896A (zh) | 埋点数据采集方法、装置、计算机设备及可读存储介质 | |
CN105827300A (zh) | 中继装置以及数据通信系统 | |
US20200327181A1 (en) | Device for providing visitor behavior analysis data of dynamic webpage, and method for providing visitor behavior analysis data of website using same | |
CN107179979B (zh) | 一种远程终端信息的获取、分析方法、装置及系统 | |
JP2018060332A (ja) | インシデント分析プログラム、インシデント分析方法、情報処理装置、サービス特定プログラム、サービス特定方法及びサービス特定装置 | |
CN103699644A (zh) | 一种资讯发布的方法、用户终端及系统 | |
US20240113913A1 (en) | System and method for collecting and displaying information about many computer systems | |
CN112989162A (zh) | 埋点上报方法、装置、设备及存储介质 | |
CN112130944A (zh) | 页面异常的检测方法、装置、设备及存储介质 | |
CN115563423A (zh) | 数据采集方法、装置、计算机设备及存储介质 | |
EP3591481B1 (en) | Device configuration management apparatus, system, and program | |
CN114238335A (zh) | 一种埋点数据生成方法及其相关设备 | |
CN103221931A (zh) | 信息处理设备、信息处理方法和信息处理程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160824 Termination date: 20190222 |
|
CF01 | Termination of patent right due to non-payment of annual fee |