CN106133699A - 故障通知装置、故障通知方法以及程序 - Google Patents

故障通知装置、故障通知方法以及程序 Download PDF

Info

Publication number
CN106133699A
CN106133699A CN201580015065.6A CN201580015065A CN106133699A CN 106133699 A CN106133699 A CN 106133699A CN 201580015065 A CN201580015065 A CN 201580015065A CN 106133699 A CN106133699 A CN 106133699A
Authority
CN
China
Prior art keywords
acquirement
monitored object
data
picture data
object apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580015065.6A
Other languages
English (en)
Inventor
骞冲お
平太一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nec Fei Dingke Co Ltd
NEC Fielding Ltd
Original Assignee
Nec Fei Dingke Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Fei Dingke Co Ltd filed Critical Nec Fei Dingke Co Ltd
Publication of CN106133699A publication Critical patent/CN106133699A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

期望即使在操作系统的启动中产生了故障的情况下,也能够准确地掌握被监控对象装置的状态的故障通知装置。故障通知装置具有第一取得部和通知部。第一取得部以被监控对象装置中的故障检测为契机,取得被监控对象装置显示于显示设备的画面数据。在取得的画面数据在规定的期间内没有变化时,通知部将从取得的画面数据得到的信息通知给外部。

Description

故障通知装置、故障通知方法以及程序
技术领域
(关于相关申请的记载)
本发明要求日本专利申请:特愿2014-126807号(2014年6月20日申请)的优先权,该申请的所有记载内容将通过引用而被援引到本说明书中。
本发明涉及故障通知装置、故障通知方法以及程序。特别是,涉及将具有显示设备的装置作为被监控对象的故障通知装置、故障通知方法以及程序。
背景技术
近年来,以计算机网络为基础进行各种业务和服务,计算机网络成为社会上重要的基础设施。因此,对构成计算机网络的各种装置(例如,服务器等)是否正常动作进行监控的重要性增加。
在专利文献1中公开了能够远程掌握与确认对象装置之间的通信中断的原因及其严重性的操作系统(OS;Operating System)动作状态确认系统。
在专利文献2中公开了在故障原因分析系统中检测故障原因判定规则的变更并迅速地进行修正的系统。
现有技术文献
专利文献
专利文献1:日本特开2012-038257号公报
专利文献2:日本特开2012-003713号公报
发明内容
发明所要解决的课题
另外,将上述现有技术文献的各公开内容通过引用援引到本说明书中。以下的分析是由本申请发明人完成的。
如专利文献1和专利文献2所公开,为了通知在计算机系统中产生的故障的检测和迅速地恢复故障,安装有各种对策和功能。这种功能等有时在构成系统的装置之间协作而实现,也有时通过计算机装置单体实现。
例如,在计算机启动时BIOS(Basic Input Output System:基本输入输出系统)启动,通常进行构成计算机的设备的初始化和进行状态确认的POST(Power On Self Test:开机自检)。当POST结束时,OS启动,作为OS具有的一个功能开始将在硬件等中产生的故障(错误)作为事件进行存储的事件日志服务。通过将具有这种功能的计算机组装到系统,从而系统管理者能够迅速地掌握在计算机中产生的故障,并采取其应对措施。
但是,有时系统管理者很难确认在计算机中产生的故障。例如,OS能够存储事件日志是在OS启动之后。因此,在OS启动之前,无法进行事件日志的存储。即,当在POST结束之后且OS启动完成前(即,OS的启动中)在计算机中产生了某种故障时,系统管理者无法获取事件日志。
因此,关于在上述期间产生的故障,用于分析故障的信息少,系统管理者很难准确地掌握成为被监控对象的计算机的系统状态。
本发明的目的在于提供一种故障通知装置、故障通知方法以及程序,即使在OS的启动中产生了故障的情况下,也能够有助于准确地掌握被监控对象装置的状态。
用于解决课题的手段
根据本发明的第一观点,提供一种故障通知装置,具有:第一取得部,以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及通知部,当所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
根据本发明的第二观点,提供一种故障通知方法,包括以下工序:以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及在所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
根据本发明的第三观点,提供一种程序,使对故障通知装置进行控制的计算机执行以下处理:以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及在所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
另外,该程序能够记录在计算机可读取的存储介质中。存储介质可以是半导体存储器、硬盘、磁记录介质、光记录介质等非瞬态(non-transient)介质。本发明还能够作为计算机程序产品来具体实现。
发明效果
根据本发明的各观点,提供一种故障通知装置、故障通知方法以及程序,即使当在OS的启动中产生了故障的情况下,也能够有助于准确地掌握被监控对象装置的状态。
附图说明
图1是用于说明一实施方式的概要的图。
图2是示出第一实施方式的故障通知系统的整体结构的一例的图。
图3使示出用户计算机的内部结构的一例的图。
图4是示出故障通知装置的内部结构的一例的图。
图5是示出系统事件日志数据库所存储的信息的一例的图。
图6是示出错误信息数据库存储的信息的一例的图。
图7是示出第一实施方式的故障通知系统的动作的一例的时序图。
具体实施方式
首先,使用图1对一实施方式的概要进行说明。另外,付记在该概要的附图参照标号是作为用于帮助理解的一例为了方便而付记在各要素上的,该概要的记载不意图进行任何的限定。
如上所述,期望如下的故障通知装置:即使在OS的启动中产生了故障的情况下,也能够准确地把握被监控对象装置的状态。
因此,作为一例提供图1所示的故障通知装置100。故障通知装置100具备第一取得部101和通知部102。第一取得部101以被监控对象装置中的故障检测为契机,取得被监控对象装置显示于显示设备的画面数据。在所取得的画面数据在规定的期间内没有变化时,通知部102将从所取得的画面数据得到的信息通知给外部。
即使在被监控对象装置(例如,图2所示的用户计算机10)的OS启动中产生故障,被监控对象装置无法生成事件日志的状况下,在液晶面板等显示设备上也应持续显示某些消息。或者,当在OS启动中陷入无法动作状态(所谓的死机状态)时,被监控对象装置的画面显示不应被更新。故障通知装置100以这种被监控对象装置中的画面显示的更新停止的情况为契机,将从画面数据得到的信息通知给外部(例如,图2的监控中心)。其结果是,例如,在监控中心,能够掌握在OS启动中陷入死机状态的被监控对象装置的存在。
以下参照附图进一步详细说明具体的实施方式。
[第一实施方式]
使用附图更详细地说明第一实施方式。
图2是示出第一实施方式的故障通知系统的整体结构的一例的图。当参照图2时,故障通知系统构成为包含用户计算机10、故障通知装置20及接收终端30。
用户计算机10与故障通知装置20通过由因特网、LAN(Local Area Network:局域网)等构成的网络41连接。同样,故障通知装置20与接收终端30通过网络42连接。
用户计算机10是故障通知系统中的成为被监控对象的装置。用户计算机10是服务器等的信息处理装置。
故障通知装置20是如下的装置:对用户计算机10的动作状况、故障产生状况进行监控,以故障产生为契机,将用户计算机10的系统状态通知给监控中心。另外,根据通过在用户计算机10中产生的故障,需要基于系统管理者的应对措施,因此故障通知装置20根据需要将需要基于系统管理者的应对措施的要旨通知给监控中心。
接收终端30是设置在监控中心内且系统管理者等使用的终端。系统管理者根据通过接收终端30得到的用户计算机10的系统状态,采取适当的应对措施。例如,在从故障通知装置20通知需要对在用户计算机10中产生的故障采取何种应对时,进行与所通知的用户计算机10的系统状态对应的应对措施。
图3是示出用户计算机10的内部结构的一例的图。当参照图3时,用户计算机10构成为包含控制部201、存储部202、第一通信部203、显示部204、BMC部205及第二通信部206。
控制部201、存储部202、第一通信部203、显示部204以及BMC部205分别通过总线彼此连接。另一方面,第二通信部206不与控制部201等连接而与BMC部205连接。即,第二通信部206是对BMC部205设置的专用的通信单元。
控制部201通过CPU(Central Processing Unit:中央处理器)等的处理器构成,是对用户计算机10的整体进行控制的单元。控制部201通过CPU执行存储在存储部202中的OS或与各种应用有关的程序来实现。
存储部202存储OS等程序,并且存储在控制部201的动作中所需的信息。
第一通信部203是控制部201在与外部的通信中使用的单元。例如,在用户计算机10接入到图2中未图示的服务器装置等时使用第一通信部203。
显示部204构成为包含液晶面板等显示设备和用于驱动显示设备的驱动器。显示部204是对用户提供用户计算机10进行了信息处理的结果的单元。
BMC部205是包含独立于控制部201而动作的处理器的控制单元。BMC部205作为所谓BMC(Baseboard Management Controller:主板管理控制器)来动作。BMC部205对作为构成用户计算机10的硬件的控制部201和显示部204的状态进行管理。在控制部201由主处理器构成时,BMC部205由副处理器构成。
BMC部205还具有将在用户计算机10中产生的事件作为系统事件日志(SEL;SystemEvent Log)存储在存储部202中的功能。更具体地讲,在构成用户计算机10的硬件上产生了某种故障时,BMC部205生成系统事件日志并储存到存储部202中。
在第一实施方式中,对作为BMC部205与控制部201等的接口规格使用IPMI(Intelligent Platform Management Interface:智能平台管理接口)标准进行了说明。但是,不意味着限定所使用的接口标准,只要是能够监控用户计算机10的硬件的标准则可以是任何标准。
BMC部205根据来自故障通知装置20的请求,通过第二通信部206将与用户计算机10有关的信息发送到故障通知装置20。在BMC部205发送到故障通知装置20的信息中至少包含画面捕捉数据和系统事件日志。
更具体地讲,BMC部205从显示部204取得与画面显示有关的画面数据,将该画面数据作为画面捕捉数据发送到故障通知装置20。另外,BMC部205读出储存在存储部202中的系统事件日志并发送到故障通知装置20。
图4是示出故障通知装置20的内部结构的一例的图。当参照图4时,故障通知装置20构成为包含控制部301、存储部302、通信部303、显示部304。
控制部301、存储部302、通信部303以及显示部304分别通过总线彼此连接。
控制部301对故障通知装置20的整体进行控制。控制部301经由通信部303与连接于网络的用户计算机10和接收终端30彼此通信。控制部301经由显示部304向系统管理者(或者操作员)提供所需的信息。
另外,控制部301具有如下功能:对用户计算机10的动作状态进行监控,当在用户计算机10中产生了故障时,将用户计算机10的系统状态和基于系统管理者的应对的有无发送到监控中心的接收终端30。另外,控制部301还能够通过计算机程序来实现,该计算机程序使搭载在故障通知装置20中的计算机使用其硬件执行包含在之后详细叙述的控制部301中的各部的处理。
存储部302存储控制部301的动作中所需的信息等。另外,在存储部302中构筑有系统事件日志(SEL)数据库401和错误信息数据库402的数据库。而且,在存储部302中还存在储存数据的数据区域403。
控制部301构成为包含动作状态监控部501、画面捕捉数据取得部502、系统事件日志取得部503、错误信息取得管理部504及错误信息通知部505。
动作状态监控部501与用户计算机10之间定期地进行与平(PING)命令有关的包等的通信,对用户计算机10是否正常动作进行监控。
在用户计算机10的动作确认的结果是判断为用户计算机10没有正常动作时,画面捕捉数据取得部502取得用户计算机10的画面捕捉数据。具体地讲,画面捕捉数据取得部502接入到用户计算机10的BMC部205并取得画面捕捉数据。
在用户计算机10的动作确认的结果是判断为用户计算机10没有正常动作时,系统事件日志取得部503取得用户计算机10的系统事件日志。具体地讲,系统事件日志取得部503接入到用户计算机10的BMC部205并经由BMC部205取得系统事件日志。
错误信息取得管理部504根据通过画面捕捉数据取得部502取得的画面捕捉数据和通过系统事件日志取得部503取得的系统事件日志,确定是继续这些错误信息的取得还是停止这些错误信息的取得。即,错误信息取得管理部504根据所取得的画面捕捉数据和系统事件日志,对画面捕捉数据取得部502和系统事件日志取得部503的数据取得动作进行管理。
错误信息取得管理部504根据所取得的系统事件日志和储存在系统事件日志数据库401中的信息,判定是继续错误信息的取得还是停止错误信息的取得。而且,错误信息取得管理部504根据所取得的画面捕捉数据是否在规定的期间内被更新,判断是继续错误信息的取得还是停止错误信息的取得。
当在用户计算机10中产生了故障时,错误信息通知部505将表示用户计算机10的系统状态的信息、表示是否需要基于系统管理者的应对的信息通知给监控中心。具体地讲,作为表示用户计算机10的系统状态的信息,错误信息通知部505将所取得的画面捕捉数据和系统事件日志发送给接收终端30。
在系统事件日志数据库401中,对于系统事件日志的所取得的每个数据值,预先登记是否继续错误信息的取得、以及是否需要基于系统管理者的应对。
图5是示出系统事件日志数据库401存储的信息的一例的图。当参照图5时,对于系统事件日志的所取得的每个值,存储有继续错误信息的取得还是停止错误信息的取得、以及是否需要基于系统管理者的应对。另外,与图5所示的“传感器类型”等一起记载的带括弧的字节数,是从IPMI规格的“SEL记录格式”得到的从头部开始的字节数。例如,“传感器类型”能够通过参照系统事件日志的第11字节来得到。
在错误信息数据库402中,对于错误产生时的每个报文,存储有与是否继续错误信息的取得、以及是否需要基于系统管理者的某种应对有关的信息。具体地讲,在故障产生时将预想要显示在用户计算机10的画面上的错误报文作为字符串预先登记在错误信息数据库402中。
图6是示出错误信息数据库402存储的信息的一例的图。当参照图6时,对于每个错误报文存储有与是否继续错误信息的取得、以及是否需要通过系统管理者进行某种应对有关的信息。
接着,对第一实施方式的故障通知系统的动作进行说明。
图7是示出第一实施方式的故障通知系统的动作的一例的时序图。
在步骤S101中,故障通知装置20进行用户计算机10的动作状态的监控。具体地讲,动作状态监控部501向用户计算机10发送基于PING命令的“Echo Request(响应请求)”包,对用户计算机10的死机与否进行确认。
如果用户计算机10正常动作,则用户计算机10响应发送“Echo Reply(响应应答)”包(步骤S201)。
故障通知装置20确认来自用户计算机10的响应发送的接收有无(步骤S102),如果接收了响应发送则重复进行步骤S101的包发送处理。即,如果在用户计算机10中没有产生故障,则故障通知装置20和用户计算机10重复进行步骤S101、S102以及S201的动作。
接着,考虑在用户计算机10中产生了故障的情况。
此时,用户计算机10无法对来自故障通知装置20的“Echo Request”包进行响应发送(步骤S102,否分支)。因此,故障通知装置20执行步骤S103之后的处理。动作状态监控部501存储确定了对于PING命令无法从用户计算机10确认响应发送的时刻(基于PING命令的死机与否监控中断的时刻)下的时间戳。
另外,虽然在图7所示的时序图中未图示,但是故障通知装置20是在步骤S102之后恢复在用户计算机10中产生的故障时所具备的、发送与“Echo Request”有关的包的装置。
在步骤S103中,故障通知装置20通过用户计算机10的第二通信部206接入到BMC部205。
之后,在步骤S104中,故障通知装置20开始从用户计算机10取得错误信息。具体地讲,画面捕捉数据取得部502开始用户计算机10的画面捕捉数据的取得。同样,系统事件日志取得部503开始系统事件日志的取得。
所取得的画面捕捉数据和系统事件日志被储存在存储部302的数据区域403中。
之后,错误信息取得管理部504将所取得的(储存在数据区域403中的)系统事件日志与存储在系统事件日志数据库401中的信息进行对照确认(步骤S105)。具体地讲,错误信息取得管理部504判定所取得的系统事件日志的一部分是否与预先登记在系统事件日志数据库401中的表示错误信息取得的停止的值一致。
在判定的结果是所取得的系统事件日志为指示错误信息取得的停止的日志时(步骤S105,是分支),转移到步骤S110。
另一方面,如果判定的结果是所取得的系统事件日志不是指示错误信息取得的停止的日志(步骤S105,否分支),则执行步骤S106之后的处理。
在步骤S106中,动作状态监控部501从用户计算机10确认响应发送的接收有无(步骤S106)。在接收到响应发送时(步骤S106,是分支),转移到步骤S110。在没有接收到响应发送时(步骤S106,否分支),动作状态监控部501执行步骤S107之后的处理。
在步骤S107中,错误信息取得管理部504通过确认画面捕捉数据的更新有无,判定是否存在用户计算机10的画面变化。即,从故障通知装置20监控用户计算机10上的画面显示的变化。
在用户计算机10中确认到画面变化的期间(步骤S107,是分支),重复进行从步骤S106开始的处理。
另一方面,在经过规定的时间(例如,一分钟等)无法确认画面变化时(步骤S107,否分支),执行步骤S108之后的处理。另外,当在由画面捕捉数据构成的画面中无法确认字符串的状态持续时,也判断为在用户计算机10中无法确认画面变化。另外,在画面变化的确认的有无中能够利用与画面监控有关的应用程序。
在步骤S108中,错误信息通知部505从画面捕捉数据提取错误报文。具体地讲,错误信息通知部505利用与字符识别有关的应用程序等,提取包含在画面捕捉数据中的报文(字符串)。另外,错误信息通知部505还提取存储在数据区域403中的用户计算机10的系统事件日志。另外,将错误信息通知部505提取错误信息的期间设为从基于PING命令的死机与否监控中断的时刻到本步骤为止的期间。
在步骤S109中,错误信息通知部505将所提取的报文与存储在错误信息数据库402中的信息进行对照。错误信息通知部505通过这种对照处理而生成通知给监控中心的信息(与用户计算机10的系统状态有关的信息)。具体地讲,如果与所提取的错误报文一致的报文被登记到错误信息数据库402中,则错误信息通知部505使该登记的信息(字符串和是否需要应对)成为通知给监控中心的信息。另一方面,在用户计算机10的画面在规定的时间内没有变化,没有显示在错误信息数据库402中也没有登记的错误报文,或者错误报文自身没有显示时,认为用户计算机10的系统状态为死机,因此错误信息通知部505使该要旨成为通知给监控中心的信息。
在步骤S110中,错误信息取得管理部504对画面捕捉数据取得部502和系统事件日志取得部503指示停止各自的数据取得动作。
在步骤S111中,错误信息通知部505将表示用户计算机10的系统状态的信息、是否需要基于系统管理者的应对的信息发送到监控中心的接收终端30。
具体地讲,在所取得的系统事件日志存储在系统事件日志数据库401中且为表示日志取得的停止的日志时,将该所取得的系统事件日志和画面捕捉数据作为用户计算机10的系统状态进行通知。
另外,即使当在用户计算机10中产生了故障时,有时也存在用户计算机10恢复到正常(步骤S202),进行“Echo Reply”包的响应发送的情况(步骤S203)。如上所述在用户计算机10的动作状态恢复的情况下,错误信息通知部505判断为用户计算机10的OS启动,停止画面的捕捉,将所取得的画面捕捉数据和系统事件日志发送到监控中心。
而且,当用户计算机10的画面显示在规定的期间内停止时,错误信息通知部505将从画面捕捉数据提取的错误报文、登记在错误信息数据库402中的信息、表示用户计算机10处于死机状态的信息中的任意一个和系统事件日志作为系统状态发送到监控中心。
监控中心的接收终端30接收这些信息(步骤S301)。
如上所述,在通过系统事件日志数据库401确认出了在步骤S105中取得的系统事件日志的应对方法时,故障通知装置20判断为产生了已知的故障。此时,故障通知装置20停止系统事件日志和画面捕捉数据的取得,将所取得的这些数据发送到监控中心。
另一方面,在系统事件日志与系统事件日志数据库401的信息的对照的结果是判断为没有应对方法的未知的问题时,进行从画面捕捉数据得到的错误报文与错误信息数据库402的信息的对照。此时,在用户计算机10的画面显示没有在一定期间更新时,故障通知装置20考虑用户计算机10处于死机状态的可能性,将其要旨和所取得的系统事件日志发送到监控中心。
另外,第一实施方式的故障通知装置20等为例示且能够进行各种变形。例如,在第一实施方式中对故障通知装置20取得用户计算机10的BMC部205生成的系统事件日志的方式进行了说明。但是,不意味着限定故障通知装置20取得的日志的种类。例如,用户计算机10所包含的控制部201,即使在OS的启动前也采取与在构成用户计算机10的硬件中产生的故障有关的日志,如果能够储存到存储部202,则故障通知装置20也可以将这种日志也作为取得的对象。
如上所述,第一实施方式的故障通知装置20使用PING命令等监控用户计算机10的死机与否。此时,在判断为用户计算机10的动作停止时,接入到用户计算机10内的BMC部205,取得作为硬件信息的系统事件日志和画面捕捉数据。
而且,在判断为用户计算机10的画面在规定的期间内没有变化时,故障通知装置20从画面捕捉数据提取错误报文,将用户计算机10的故障产生通知给监控中心。或者,故障通知装置20将用户计算机10死机的可能性通知给监控中心。
其结果是,即使在用户计算机10中产生故障,在OS的启动中途死机的情况下,第一实施方式的故障通知装置20也能够将与系统状态有关的适当的信息提供给系统管理者。另外,由于在经过规定的期间之后没有进行画面捕捉数据和系统事件日志的取得,因此能够取得适当的期间的错误信息(画面捕捉数据、系统事件日志)。另外,将来自画面捕捉数据的错误报文和系统事件日志与对应的数据库的信息进行对照,从而能够适当地判断用户计算机10的系统状态。其结果是,能够提高故障分析的精度。
关于上述的实施方式的一部分或全部,还能够如以下的付记记载,但是不限定于以下。
[付记1]
一种故障通知装置,具有:
第一取得部,以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及
通知部,当所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
[付记2]
根据付记1所述的故障通知装置,其中,
还具有第二取得部,该第二取得部以所述被监控对象装置中的故障检测为契机,取得所述被监控对象装置生成的日志,
所述通知部将所述取得的日志通知给外部。
[付记3]
根据付记2所述的故障通知装置,其中,
还具有管理部,该管理部根据所述取得的画面数据和日志,对所述第一取得部和所述第二取得部的数据取得动作进行管理。
[付记4]
根据付记3所述的故障通知装置,其中,
在所述取得的画面数据在规定的期间内没有变化时,所述管理部停止所述第一取得部和所述第二取得部的数据取得动作。
[付记5]
根据付记1至4中的任意一项所述的故障通知装置,其中,
在所述取得的画面数据在规定的期间内没有变化时,所述通知部将从所述取得的画面数据提取的字符串通知给外部。
[付记6]
根据付记3至5中的任意一项所述的故障通知装置,其中,
在所述取得的日志的一部分与预先确定的值一致时,所述管理部停止所述第二取得部的数据取得动作。
[付记7]
根据付记2至6中的任意一项所述的故障通知装置,其中,
所述第一取得部从副处理器取得所述画面数据,所述副处理器为包含于所述被监控对象装置中的处理器,且独立于使操作系统动作的主处理器而动作,
所述第二取得部从所述副处理器取得所述日志。
[付记8]
还具有监控部,该监控部对所述被监控对象装置发送规定的包,并根据有无来自所述被监控对象装置的响应来监控所述被监控对象装置的动作状态。
[付记9]
一种故障通知方法,包括以下工序:
以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及
在所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
[付记10]
一种程序,使对故障通知装置进行控制的计算机执行以下处理:
以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及
在所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
另外,付记9和付记10的方式与付记1的方式相同,能够在付记2~付记8的方式上进行展开。
另外,将所引用的上述的专利文献等的各公开援引到本说明书中。在本发明的所有公开(包含权利要求书)的框架内,能够进一步根据其基本的技术思想,进行实施方式或实施例的变更·调整。另外,能够在本发明的所有公开的框架内进行各种公开要素(包含各权利要求的各要素、各实施方式或实施例的各要素、各附图的各要素等)的多种组合或选择。即,本发明当然包含包括权利要求书在内的所有公开、本领域技术人员能够根据技术思想得到的各种变形、修正。特别是,关于记载于本说明书的数值范围,包含在该范围内的任意的数值或小范围在没有特别的记载时也应解释为被具体地记载。
标号说明
10 用户计算机
20、100 故障通知装置
30 接收终端
41、42 网络
101 第一取得部
102 通知部
201、301 控制部
202、302 存储部
203 第一通信部
204、304 显示部
205 BMC(Baseboard Management Controller:主板管理控制器)部
206 第二通信部
303 通信部
401 系统事件日志(SEL;System Event Log)数据库
402 错误信息数据库
403 数据区域
501 动作状态监控部
502 画面捕捉数据取得部
503 系统事件日志取得部
504 错误信息取得管理部
505 错误信息通知部。

Claims (10)

1.一种故障通知装置,具有:
第一取得部,以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及
通知部,当所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
2.根据权利要求1所述的故障通知装置,其中,
还具有第二取得部,该第二取得部以所述被监控对象装置中的故障检测为契机,取得所述被监控对象装置生成的日志,
所述通知部将所述取得的日志通知给外部。
3.根据权利要求2所述的故障通知装置,其中,
还具有管理部,该管理部根据所述取得的画面数据和日志,对所述第一取得部和所述第二取得部的数据取得动作进行管理。
4.根据权利要求3所述的故障通知装置,其中,
在所述取得的画面数据在规定的期间内没有变化时,所述管理部停止所述第一取得部和所述第二取得部的数据取得动作。
5.根据权利要求1至4中的任意一项所述的故障通知装置,其中,
在所述取得的画面数据在规定的期间内没有变化时,所述通知部将从所述取得的画面数据提取的字符串通知给外部。
6.根据权利要求3至5中的任意一项所述的故障通知装置,其中,
在所述取得的日志的一部分与预先确定的值一致时,所述管理部停止所述第二取得部的数据取得动作。
7.根据权利要求2至6中的任意一项所述的故障通知装置,其中,
所述第一取得部从副处理器取得所述画面数据,所述副处理器为包含于所述被监控对象装置中的处理器,且独立于使操作系统动作的主处理器而动作,
所述第二取得部从所述副处理器取得所述日志。
8.根据权利要求1至7中的任意一项所述的故障通知装置,其中,
还具有监控部,该监控部对所述被监控对象装置发送规定的包,并根据有无来自所述被监控对象装置的响应来监控所述被监控对象装置的动作状态。
9.一种故障通知方法,包括以下工序:
以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及
在所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
10.一种程序,使对故障通知装置进行控制的计算机执行以下处理:
以被监控对象装置中的故障检测为契机,取得所述被监控对象装置显示于显示设备的画面数据;以及
在所述取得的画面数据在规定的期间内没有变化时,将从所述取得的画面数据得到的信息通知给外部。
CN201580015065.6A 2014-06-20 2015-06-18 故障通知装置、故障通知方法以及程序 Pending CN106133699A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014-126807 2014-06-20
JP2014126807 2014-06-20
PCT/JP2015/067670 WO2015194651A1 (ja) 2014-06-20 2015-06-18 障害通知装置、障害通知方法及びプログラム

Publications (1)

Publication Number Publication Date
CN106133699A true CN106133699A (zh) 2016-11-16

Family

ID=54935627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580015065.6A Pending CN106133699A (zh) 2014-06-20 2015-06-18 故障通知装置、故障通知方法以及程序

Country Status (3)

Country Link
JP (1) JP6222759B2 (zh)
CN (1) CN106133699A (zh)
WO (1) WO2015194651A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109254863A (zh) * 2018-08-30 2019-01-22 郑州云海信息技术有限公司 一种记录系统事件日志的方法、装置及受控终端

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6863920B2 (ja) * 2018-03-22 2021-04-21 Necプラットフォームズ株式会社 サーバ、サーバ管理システム、サーバの保守方法、およびサーバのプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039519A (ja) * 2008-07-31 2010-02-18 Japan Digital Laboratory Co Ltd エラー通知方法、情報処理装置および通信システム
CN102479138A (zh) * 2010-11-29 2012-05-30 鸿富锦精密工业(深圳)有限公司 利用图像进行错误侦测的系统及方法
CN102736970A (zh) * 2012-06-29 2012-10-17 浪潮电子信息产业股份有限公司 一种操作系统活动状态的监控方法
CN103489460A (zh) * 2012-06-11 2014-01-01 鸿富锦精密工业(深圳)有限公司 测试装置及测试方法
CN103617108A (zh) * 2013-12-17 2014-03-05 昆山中创软件工程有限责任公司 一种计算机设备运行状态的监测方法及装置
CN103810106A (zh) * 2014-03-06 2014-05-21 安一恒通(北京)科技有限公司 一种测试界面流畅度的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852720A (en) * 1996-08-16 1998-12-22 Compaq Computer Corp. System for storing display data during first time period prior to failure of computer and during second time period after reset of the computer
JP2006065659A (ja) * 2004-08-27 2006-03-09 Fujitsu Ltd コンピュータ動作記録プログラム、コンピュータ動作解決プログラム、コンピュータ、管理装置、および方法
JP2013206073A (ja) * 2012-03-28 2013-10-07 Nec Corp ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039519A (ja) * 2008-07-31 2010-02-18 Japan Digital Laboratory Co Ltd エラー通知方法、情報処理装置および通信システム
CN102479138A (zh) * 2010-11-29 2012-05-30 鸿富锦精密工业(深圳)有限公司 利用图像进行错误侦测的系统及方法
CN103489460A (zh) * 2012-06-11 2014-01-01 鸿富锦精密工业(深圳)有限公司 测试装置及测试方法
CN102736970A (zh) * 2012-06-29 2012-10-17 浪潮电子信息产业股份有限公司 一种操作系统活动状态的监控方法
CN103617108A (zh) * 2013-12-17 2014-03-05 昆山中创软件工程有限责任公司 一种计算机设备运行状态的监测方法及装置
CN103810106A (zh) * 2014-03-06 2014-05-21 安一恒通(北京)科技有限公司 一种测试界面流畅度的方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109254863A (zh) * 2018-08-30 2019-01-22 郑州云海信息技术有限公司 一种记录系统事件日志的方法、装置及受控终端

Also Published As

Publication number Publication date
JPWO2015194651A1 (ja) 2017-04-27
WO2015194651A1 (ja) 2015-12-23
JP6222759B2 (ja) 2017-11-01

Similar Documents

Publication Publication Date Title
JP6333410B2 (ja) 障害処理方法、関連装置、およびコンピュータ
EP3232326A1 (en) Keyboard video mouse (kvm) device and method for detecting host failure using the same
US20150127814A1 (en) Monitoring Server Method
CN104301136B (zh) 故障信息上报及处理的方法及设备
US9875165B2 (en) Communication bus with baseboard management controller
JP2011210064A (ja) ログ情報収集システム、装置、方法及びプログラム
EP3239840B1 (en) Fault information provision server and fault information provision method
WO2015037603A1 (ja) 遠隔監視システム、遠隔監視方法、及びプログラム
US10664335B2 (en) System and method for maintaining the health of a machine
CN103984622B (zh) 基于Linux的GPON ONU设备的日志管理方法及装置
CN106385343B (zh) 一种分布式系统下监控客户端的方法及装置、分布式系统
EP2975524B1 (en) Information processing device
CN106133699A (zh) 故障通知装置、故障通知方法以及程序
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
US7877646B2 (en) Method and system for monitoring a computing device
US20150249566A1 (en) Apparatus for selecting master in redundancy system
JP2006268515A (ja) Pciカ−ド障害管理方式
US20090182878A1 (en) Devices, methods, and computer program products for real-time resource capacity management
KR101584210B1 (ko) Mcu 통합 감시 시스템 및 방법
JP2015082131A (ja) 監視システム、監視方法、監視プログラム及び監視装置
JP2011035512A (ja) ネットワーク監視システム
JP2011028490A (ja) システム監視装置、システム監視方法、及びプログラム
JP5523898B2 (ja) 制御装置
JP2010220022A (ja) フラッディングアラームのマスク方法、ネットワーク管理サーバ及びプログラム
JP2004220221A (ja) 情報処理装置、情報処理装置における監視制御方法及び情報処理システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161116

RJ01 Rejection of invention patent application after publication