CN104067599A - 网络状态监视系统 - Google Patents

网络状态监视系统 Download PDF

Info

Publication number
CN104067599A
CN104067599A CN201380004229.6A CN201380004229A CN104067599A CN 104067599 A CN104067599 A CN 104067599A CN 201380004229 A CN201380004229 A CN 201380004229A CN 104067599 A CN104067599 A CN 104067599A
Authority
CN
China
Prior art keywords
monitored
state information
monitoring unit
monitoring
supervision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380004229.6A
Other languages
English (en)
Inventor
铃木友泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Publication of CN104067599A publication Critical patent/CN104067599A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

在通信网络的装置监视系统中,SNMP监视部从被监视组取得各被监视装置的状态信息,从而监视各被监视装置的状态。命令监视部使用监视命令取得被监视装置的状态信息。监视管理部确认SNMP监视部对各被监视装置的监视状况,并且,如果存在状态信息的取得失败的被监视装置,则将其设定成新的监视对象,使命令监视部发送监视命令。用通过该命令取得的状态信息更新监视结果,由此提高故障监视的可靠性。

Description

网络状态监视系统
技术领域
本发明涉及监视系统,例如涉及监视存在于网络上的装置的状态的监视系统。
背景技术
在IP(Internet Protocol:互联网协议)网络等通信网络上存在各种装置。为了监视这些装置的状态,以往例如应用如下的故障监视方式。即,该故障监视方式例如是:监视装置基于SNMP(Simple Network Management Protocol:简单网络管理协议),由该监视装置参照存储在被监视装置的MIB(Management Information Base:管理信息库)中的信息,或者由监视装置分析监视装置与被监视装置之间的固有的命令响应结果,从而监视被监视装置的装置状态,并将该装置状态作为监视结果显示在维护终端等的显示部上。
日本特开2000-69119号公报公开有网络管理系统中的可靠性通信方式。该可靠性通信方式是在以网络管理协议进行管理的网络管理系统中确保通信路由的可靠性的技术。在该公开技术中,监视装置以SNMP确认多个通信路由的可靠性。
此外,日本特开平11-154950号公报公开有如下的网络管理装置,该网络管理装置为了管理网络被管理装置的设备状态详细信息,在网络管理设备与网络被管理装置之间发送接收SNMP Trap和SNMP GET消息,从而由监视装置确认被管理装置的状态变化。
但是,有时例如在SNMP的通信和被监视装置上的SNMP代理中产生故障。在如以往那样由监视装置将SNMP用于掌握被监视装置的状态时,在该故障产生时,监视装置最终无法掌握被监视装置的状态。作为对比文件而列举的2个现有技术均是利用SNMP的技术,因此,在应用该技术的监视系统的监视装置中,具有在与SNMP关联的故障产生时无法掌握被监视装置的状态的问题。
发明内容
本发明的目的在于提供一种监视系统,即使在产生与SNMP关联的故障时,也能够取得被监视装置的状态信息。
本发明的监视系统包含:第1监视部,其根据第1监视方式从多个被监视装置分别取得状态信息,从而监视这些被监视装置的状态;第2监视部,其按照基于第2监视方式的指示,从任意一个被监视装置取得状态信息,从而监视该被监视装置的状态;以及监视管理部,其对这些被监视装置的监视结果进行管理,监视管理部通过第1监视部取得状态信息进行管理,并且,如果在各被监视装置中存在状态信息的取得失败的装置,则将以其为新的监视对象取得状态信息作为所述指示给出到第2监视部,根据由第2监视部响应于该指示而取得的状态信息对监视结果进行管理。
本发明的监视装置包含:第1监视部,其根据第1监视方式从多个被监视装置分别取得状态信息,从而监视这些被监视装置的状态;第2监视部,其按照基于第2监视方式的指示,从任意一个被监视装置取得状态信息,从而监视该被监视装置的状态;以及监视管理部,其对这些被监视装置的监视结果进行管理,监视管理部通过第1监视部取得状态信息进行管理,并且,如果在各被监视装置中存在状态信息的取得失败的装置,则将以其为新的监视对象取得状态信息作为所述指示给出到第2监视部,根据由第2监视部响应于该指示而取得的状态信息对监视结果进行管理。
此外,本发明的监视方法根据分别来自多个被监视装置的状态信息进行监视,在该监视方法中使用监视装置,该监视装置包含:第1监视部,其根据第1监视方式从多个被监视装置分别取得状态信息,从而监视该多个被监视装置的状态;第2监视部,其按照基于第2监视方式的指示,从多个被监视装置的任意一个取得状态信息,从而监视该被监视装置的状态;以及监视管理部,其对多个被监视装置的监视结果进行管理,该监视方法包含以下步骤:由监视管理部通过第1监视部取得所述状态信息进行管理,并且,如果在多个被监视装置中存在该状态信息的取得失败的装置,则将以该装置为新的监视对象取得状态信息作为指示给出到第2监视部,根据由第2监视部响应于该指示而取得的状态信息对监视结果进行管理。
根据本发明,还提供监视程序,该监视程序在被计算机读入并由计算机执行时,使计算机作为上述第1监视部、第2监视部和监视管理部发挥功能。
根据本发明,在利用SNMP监视被监视装置的装置状态时,即使产生与SNMP关联的故障,也能够监视被监视装置的装置状态。因此,与以往相比可靠性提高,装置的维护者能够掌握更准确的装置状态。
附图说明
本发明的目的和特征通过考虑参照以下附图的详细说明而变得更清楚。
图1是示出本发明的装置监视系统的一个实施例的概略结构的框图。
图2是示出图1的监视结果存储部中包含的监视表的一例的图。
图3A~图3C是示出图1的装置监视系统中的动作步骤的流程图。
具体实施方式
接着,参照附图详细说明本发明的监视系统的一个实施例。参照图1,实施例的监视系统10是如下的装置监视系统,其利用监视装置1监视被监视组2,并将其监视结果显示在维护终端装置3上,由此监视通信网络上的装置状态。监视装置1包含SNMP(Simple Network Management Protocol:简单网络管理协议)监视部11,SNMP监视部11监视被监视组2中的各被监视装置2a、2b、…、2N的状态。其中,N是自然数。监视装置1还包含命令监视部12,命令监视部12使用监视命令从被监视组2取得被监视装置的状态信息。监视管理部13确认SNMP监视部11对各被监视装置2a、2b、…、2N的监视状况,并且,如果存在状态信息的取得失败的被监视装置,则将其设定成新的监视对象,使命令监视部12发送监视命令。该命令之后将详细叙述,可以是针对网络以及网络设备的指示,即网络命令。命令监视部12使用监视命令从该被监视装置取得状态信息,由此更新监视结果。由此,实施例的监视系统10提高故障监视的可靠性,装置的维护者能够掌握更准确的装置状态。
对于与本发明的理解无直接关系的实施例的部分,省略图示和记述。在以下的记述中,信号和数据由其呈现出的连接线的参照标号指示。
在本实施例中,如上所述,在被监视组2中包含自然数N台的被监视装置2a、2b、…、2N。因此,能够用1≤n≤N的变量n表示被监视装置2a、2b、…、2N中特定的1台。
在图1的装置监视系统10中,监视装置1与被监视组2内的被监视装置2a、2b、…、2N分别利用与它们对应的信号线33、35、37、…、39连接而构建成通信网络41。在该网络中,例如可以采用IP(Internet Protocol:互联网协议)作为通信协议。
维护终端装置3具有可见和/或可听地输出监视装置1取得的被监视装置2a、2b、…、2N的状态的信息即装置状态信息31作为监视结果的功能。维护终端装置3具有监视装置1的GUI(Graphical User Interface:图形用户界面)控制等的人机界面,能够在其显示画面上根据来自监视装置1的画面信息显示画面,或者向其发声装置输出警告报警声等可听声。维护终端装置3还具有操作部,能够使用该操作部针对被监视装置2a、2b、…、2N分别进行与状态监视有关的各种设定。
监视装置1具有监视被监视装置2a、2b、…、2N的装置状态的功能。更具体而言,监视装置1具有基于SNMP的监视功能,以及基于针对被监视装置2a、2b、…、2N的固有命令的监视功能。监视装置1通过GUI控制等向维护终端装置3提供被监视装置2a、2b、…、2N的监视结果31。
监视装置1具有如下功能:通过SNMP定期向被监视装置2a、2b、…、2N送出请求表示装置状态的装置状态信息的请求信号33,并取得被监视装置2a、2b、…、2N对其做出响应而提供的装置状态信息。监视装置1还具有如下功能:在不能通过该SNMP得到被监视装置2a、2b、…、2N的装置状态信息的情况下,对该信息取得失败的被监视装置2n送出固有命令即监视执行命令,由此从该被监视装置2n取得装置状态信息。
并且,监视装置1还具有使监视结果反映通过执行这样的命令而独立取得的被监视装置2n的装置状态信息的功能。由此,即使在产生SNMP的通信故障等而无法通过SNMP取得装置状态信息的情况下,监视装置1也能够利用固有命令取得装置状态信息,由此对监视结果进行更新。
监视装置1还具有通过例如GUI控制对维护终端装置3赋予各种画面信息的功能。画面信息例如包含被监视装置2a、2b、…、2N各自的网络流量信息、CPU(CentralProcessing Unit:中央处理单元)和存储器的使用率、硬件的运转状况等。维护终端装置3中能够应用用于显示画面信息的各种显示形式,由此能够进行被监视装置2a、2b、…、2N的网络结构的映射图显示,以及与各装置状态的种类对应的图形显示。此外,还可以输出与各被监视装置2a、2b、…、2N的装置状态信息对应的警告报警声,或者以与装置状态信息对应的显示色输出显示。
更具体而言,如图1所示,本实施例中的监视装置1包含SNMP监视部11、命令监视部12以及监视管理部13作为监视单元。
在本实施例中,监视装置1通过包含CPU、ROM(Read-Only Memory:只读存储器)、RAM(Random Access Memory:随机存取存储器)、EEPROM(ElectricallyErasable Programmable Read-Only Memory:电可擦除只读存储器)、输入输出接口等的处理系统即计算机来实现。CPU读出并执行存储在ROM中的处理程序,从而实现监视装置1的各种功能。图1用模块示出在监视装置1中实现的这些功能。
另外,处理程序可以采取安装到监视装置1的监视程序的形式。该情况下,可以说处理程序实现图1所示的各功能部,即SNMP控制部11、命令监视部12以及监视管理部13的功能。
SNMP监视部11具有通过SNMP监视被监视装置2a、2b、…、2N的装置状态的功能。SNMP监视部11作为基于SNMP的监视系统的管理器发挥功能。该管理器功能构成为从被监视装置2a、2b、…、2N定期取得装置状态信息。此外,SNMP监视部11构成为如SNMP Trap那样,使用SNMP在预定的时机从被监视装置2a、2b、…、2N取得状态信息。
详细叙述内部结构时,如图1所示,SNMP监视部11具有管理信息存储部111和SNMP控制部112。SNMP控制部112具有对通过SNMP监视被监视装置2a、2b、…、2N各自的状态进行控制的功能。SNMP控制部112可广泛应用基于SNMP的监视方式。SNMP控制部112例如可以在管理信息存储部111中定义与状态监视相关的信息。SNMP控制部112依照该与状态监视相关的定义从各被监视装置2a、2b、…、2N取得装置状态信息。
更具体而言,SNMP控制部112使用被监视装置2a、2b、…、2N的装置识别信息和信息识别信息,以预定的时间间隔定期地向被监视装置2a、2b、…、2N请求这些装置状态信息。SNMP控制部112能够响应于该请求而取得从被监视装置2a、2b、…、2N送出的装置状态信息。
在此,装置识别信息例如可以是装置的IP地址等唯一确定该装置的信息。另一方面,信息识别信息是以MIB(Management Information Base:管理信息库)的形式存储在管理信息存储部111中的对象的集合体。更具体而言,信息识别信息可以是网络中的实体器件的主机名称或作为监视对象的装置中的要素的信息。此外,装置状态信息的种类基于管理信息存储部111的对象定义,但不特别限定于此。该装置状态信息可定义成各种状态信息。
这些各种状态信息例如有与被监视装置的系统相关的状态信息、与接口相关的状态信息、与IP等协议相关的状态信息、与ICMP(Internet Control Message Protocol:互联网控制消息协议)相关的状态信息、与TCP(Transmission Control Protocol:传输控制协议)相关的状态信息、与UDP(User Datagram Protocol:用户数据报协议)相关的状态信息等。此外,被监视组2的各装置的类别例如有是网络设备还是服务器的类别即服务器/客户端的类别。并且,SNMP控制部112可以构成为能够根据装置的设置方式等设定要取得的装置状态信息的种类,从而将其保存到管理信息存储部111进行管理。
SNMP控制部112对根据装置状态信息的类别设定的1个或多个阈值与所取得的装置状态信息进行比较,得到表示其比较结果的逻辑值作为监视结果。并且,SNMP控制部112具有如下功能:根据来自监视管理部13的请求,将被请求的被监视装置2a、2b、…、2N的监视结果给出到监视管理部132。
管理信息存储部111例如具有存储相当于MIB等的信息的功能,管理被监视装置2a、2b、…、2N的装置状态信息。管理信息存储部111保持与作为SNMP代理的被监视装置2a、2b、…、2N的管理信息存储部对应的信息。作为进行保持的信息,存储有与进行保持的项目对应的内容,即表示“完成”/“未完成”、“正常”/“异常”等的值。管理信息存储部111在构成为在监视装置1与各被监视装置2a、2b、…、2N之间保持对应信息的系统的情况下,例如可以保持用RFC(Request for Comments)1155定义的信息,也可以保持扩展后的固有信息。
监视管理部13具有管理SNMP监视部11和命令监视部12对被监视装置2a、2b、…、2N的监视结果的功能。如图1所示,监视管理部13具有关于监视结果的监视存储部131和确认部132、关于命令监视的指示部133和取得部134以及针对监视结果的更新部135。
监视存储部131保持着监视表,该监视表对被监视装置2a、2b、…、2N的监视处理的实施状态404(图2)以及基于被监视装置2a、2b、…、2N的监视结果进行管理。
在此,参照图2说明本实施例中的监视表400的结构例。在该图所示的例子中,监视表400具有装置识别信息402、实施状态404以及监视结果406,作为信息的项目即输入或显示字段。
装置识别信息402可以追加识别监视装置1监视的被监视装置2a、2b、…、2N的装置的特定主机名称和/或器件类别等。
实施状态STATE404表示SNMP监视部11的监视处理处于怎样的进行状态。基于SNMP的监视例如如下进行:通过轮询等以预定的时间间隔定期地从各被监视装置2a、2b、…、2N取得装置状态信息。在实施状态STATE404中,按照以预定的时间间隔更新的方式,记载有是否实施了针对各被监视装置2a、2b、…、2N的SNMP的监视处理的状态。例如在以预定的时间间隔实施了基于SNMP的信息取得的情况下,在相应记录(entry;record)的实施状态STATE404中以与表示“完成”的信息对应的逻辑值的形式存储该信息,并且,在未以预定的时间间隔实施信息取得的情况下,在实施状态STATE404中将表示“未完成”的信息作为与其对应的逻辑值进行存储。实施状态STATE404在针对被监视组结束预期的1次监视处理后,将全部记录重置成初始状态即“未完成”,监视在下次监视处理开始之前为待机状态。
监视结果RESULT406示出基于SNMP的被监视装置2a、2b、…、2N的装置状态信息的监视结果。在监视结果RESULT406中例如存储有如下信息,该信息表示对从被监视装置2a、2b、…、2N取得的装置状态信息和阈值进行比较后其监视结果是正常还是异常。在装置状态信息为阈值以下的情况下,在相应记录中存储表示“正常”的逻辑值,在装置状态信息超过阈值的情况下,在相应记录中存储表示“异常”的逻辑值。除此以外,在监视中无法取得信息的情况下,能够存储与表示“取得失败”的信息对应的逻辑值。
另外,关于“异常”,阈值不限于1个,也可以设定与以上的种类或等级对应的多个阈值。能够通过设置多个阈值,得知监视对象的异常程度。“异常”例如可以按照异常的重要性或程度从高到低的顺序设置表示“Critical(关键)”、“Major(主要)”以及“Minor(次要)”等的值,对以上的程度进行分类。
并且,在监视结果RESULT406中,除了存储对装置状态信息和阈值进行比较的结果以外,还可以对装置状态信息和特定的值进行比较,在一致的情况下存储“正常”,在不一致的情况下存储“异常”。
确认部132具有如下功能:参照监视表400,选定实施状态STATE404为“未完成”的记录,从SNMP监视部11取得被监视装置2a、2b、…、2N中的与该选定相应的装置的监视结果。更具体而言,确认部132在选定实施状态STATE404为“未完成”的记录后,将选定的记录的装置识别信息402通知给SNMP监视部11。SNMP监视部11取得与该装置识别信息402对应的被监视装置2a、2b、…、2N的监视结果并送到确认部132。确认部132将所取得的监视结果送到更新部135。
指示部133具有如下功能:取得来自SNMP监视部11的被监视装置2a、2b、…、2N中的相应装置2n的监视结果,在通过SNMP取得的监视结果是“取得失败”的情况下,指示命令监视部12通过执行命令来监视装置状态。
基于SNMP的监视结果示出“取得失败”的情况是如下情况:SNMP监视部11通过SNMP请求被监视装置2n取得装置状态信息,但无法取得装置状态信息。该情况下,估计是产生了与SNMP关联的故障,如与被监视组2的相应装置2n之间的SNMP的通信故障、被监视组2中的SNMP代理的故障等。在产生这样的与SNMP关联的故障时,指示部133使命令监视部12执行基于固有命令的该被监视装置2n的状态监视,因此,向命令监视部12通知被监视组2的该被监视装置2n的装置识别信息,并且指示执行该命令。
取得部134具有如下功能:在指示部133指示通过执行命令进行监视的情况下,从命令监视部12接收通过执行命令监视该被监视装置2n的监视结果。
更新部135具有如下功能:根据从SNMP监视部11或命令监视部12得到的被监视装置2n的监视结果,更新监视表400中的对应记录的内容。即,更新部135在从SNMP监视部11得到“正常”/“异常”的监视结果时,以该监视结果更新对应记录的内容。此外,更新部135在从SNMP监视部11接收到“取得失败”的监视结果时,使监视表400的对应记录反映从命令监视部12得到的监视结果。
命令监视部12具有如下功能:在从监视管理部13接收到指示时,通过预定命令执行被监视装置2n的状态监视。如图1所示,命令监视部12包含执行部121。执行部121具有监视执行功能,即根据来自监视管理部13的指示,对被指示的被监视装置2n送出预定命令,使被监视装置2n回送状态信息。
针对被监视组2的基于命令的监视方式只要参照装置的状态,则能够广泛应用各种方式。此外,命令监视部12可以构成为不仅能够取得1种状态信息,还能够取得多种状态信息。在后者的情况下,可以在监视装置1或命令监视部12中预先设定用于得到多种状态信息的步骤,命令监视部12使用与这些种类对应的多个命令得到各状态信息。
具体而言,命令监视部12为了参照各种状态信息,可以根据telnet等通信协议,使用被监视装置2a、2b、…、2N的IP地址等的装置识别信息,向被监视装置2n发送ping命令,由此,取得网络的连通监视的状态信息,或者,将输出有无各种硬件故障、发送接收分组次数、CPU或存储器的使用率等的命令发送到被监视装置2n,由此取得状态信息。装置识别信息可以根据需要使用主机名称或端口号等。
此外,命令监视部12可以预先确定与被监视装置2n之间的固有命令,并使用确定的固有命令取得各种装置状态信息。执行部121根据从被监视组2取得的装置状态信息和1个或多个阈值,判断监视结果是“正常”、“异常”或“取得失败”等中的哪一个,并将该监视结果给出到监视管理部13。
另外,对于执行部121的命令,其命令形式与SNMP命令不同,状态信息的形式也可能不同,执行部121可以构成为调整这些形式的差异来给出监视结果。
此外,图1的监视装置1不限于上述结构,也可以将实现SNMP监视部11、命令监视部12以及监视管理部13的功能的程序写入计算机可读取的记录介质,并适当读出来实现。该记录介质例如有CD-ROM(Compact Disc Read-Only Memory:只读式光盘)、USB(Universal Serial Bus:通用串行总线)存储器或EEPROM(ElectricallyErasable Programmable Read-Only Memory:电可擦除只读存储器)半导体存储器等。
被监视组2包含由监视装置1监视状态的各被监视装置2a、2b、…、2N。这些被监视装置例如包含交换装置或网关装置等网络设备、以及服务器等各种通信网络结构要素。如图1所示,被监视装置2a、2b、…、2N分别具有管理信息存储部21和SNMP控制部22。
管理信息存储部21具有如下功能:存储相当于MIB等的信息,管理由其搭载的被监视装置的状态信息。管理信息存储部21例如可以管理由RFC1155定义的信息,也可以管理扩展后的固有信息。
SNMP控制部22具有将通过SNMP从SNMP监视部11请求的装置状态信息送到SNMP监视部11的功能、以及基于SNMP的监视系统的代理功能。
接着,参照图3A、图3B以及图3C记述本实施例中的装置监视系统10的监视装置1进行的装置监视处理的动作。这3个图是组合示出装置监视处理的动作步骤的流程图。
首先,参照图3A,在监视装置1起动后,监视管理部13将监视表400的全部记录的实施状态STATE404设定成“未完成”(步骤S501)。
监视管理部13参照监视表400,选定实施状态STATE404为“未完成”的被监视装置中的任意1台2n的记录(步骤S502)。监视对象即被监视装置的选定顺序没有特别限定,例如可以随机选择,也可以是登记在监视表400中的记录顺序或预定的优先顺序。
在这样的记录选定后,监视管理部13将记录的装置识别信息送到SNMP监视部11,请求SNMP监视部11确认与该装置识别信息对应的被监视装置2n的状态(步骤S503)。
SNMP监视部11在从监视管理部13给出该被监视装置2n的状态确认请求时,参照管理信息存储部111,将从监视管理部13通知的装置识别信息设定成发送目的地而生成SNMP的GET命令,并以GET消息的形式发送该GET命令。在本实施例中,以GET命令指定的对象是装置状态信息,装置状态信息的类别是预先设定的。SNMP监视部11将包含对象识别信息(Object IDentification)的GET消息(GetRequest)作为应取得的信息识别信息发送给代理。
SNMP监视部11判断监视对象处于怎样的状态,并将其判断结果送到监视管理部13(步骤S504)。将判断结果作为SNMP的GetResponse消息,从作为代理的被监视装置2n送到SNMP监视部11。接收该判断结果作为响应的SNMP监视部11取得GetResponse消息中包含的装置状态信息。
具体而言,SNMP监视部11判断监视对象状态的“正常”/“异常”,并将其判断结果作为监视结果通知给监视管理部13。此时,作为监视对象的被监视装置2n的装置状态根据所取得的装置状态信息和预先设定的1个或多个阈值进行判断。另外,SNMP监视部11在进行了针对上述监视对象的基于SNMP的监视处理的结果是无法取得装置状态信息的情况下,将表示“取得失败”的监视结果通知给监视管理部13。例如,可以是在SNMP监视部11发送GET消息后,经过预定时间仍未接收到GetResponse消息的情况下,SNMP监视部11判断为“取得失败”。此外,也可以预先设定GET消息的发送重试次数,在GET消息的发送次数超过该重试次数的情况下,SNMP监视部11判断为“取得失败”。
在通知监视结果后,监视装置1的处理经由图3A中的连接点A进入图3B的判断处理步骤S505。
监视管理部13根据来自SNMP监视部11的监视结果,判断是否已得到表示作为监视对象的被监视装置2n的状态的监视结果(步骤S505)。在已得到“正常”/“异常”的监视结果的情况下(是),监视管理部13判断为从作为监视对象的被监视装置2n已得到表示装置状态的监视结果。该情况下,进入更新处理步骤S508,在该步骤中,监视管理部13对监视表400中的对应记录的实施状态STATE404设定“完成”,在监视结果RESULT406中设置“正常”/“异常”中的任意一个。
与此相对,在判断步骤S505中得到“取得失败”的监视结果的情况下(否),监视管理部13判断为在SNMP中产生一些故障而无法从作为监视对象的被监视装置2n取得与状态相关的信息。因此,监视管理部13将被监视装置2n的装置识别信息通知给命令监视部12,并进入关于与装置识别信息的未取得对应的被监视装置2n请求基于命令的状态确认的处理步骤S506。
该状态确认的请求处理步骤S506是从监视管理部13将无法取得信息的被监视装置2n的状态确认请求送到命令监视部12的处理。
在请求状态确认后,命令监视部12对该被监视装置2n执行基于预定命令的状态监视而取得装置状态信息,并将其监视结果作为命令响应送到监视管理部13(步骤S507)。通过该命令响应,命令监视部12将从未取得装置识别信息的被监视装置2n取得的装置状态信息与1个或多个阈值进行比较,并根据其比较结果得到监视结果。由此,命令监视部12得到“正常”/“异常”或“取得失败”的监视结果。命令监视部12将监视结果送到监视管理部13,并进入在监视结果RESULT406中设定对应值的更新处理步骤S508。
命令监视部12在命令发送后经过预定时间仍没有回送的情况下判断为“取得失败”,或者在命令发送次数超过预先设定的重试次数时也判断为“取得失败”。
接着,监视管理部13根据来自命令监视部12的监视结果,更新监视表400中的对应记录的值(步骤S508)。具体而言,在被给出表示“正常”/“异常”的监视结果后,监视管理部13对监视表400中的对应记录的实施状态STATE404设定“完成”的值,在监视结果RESULT406中设定“正常”/“异常”的值。此外,在被给出表示“取得失败”的监视结果后,监视管理部13对监视表400中的对应记录的实施状态STATE404设定“完成”的值,在监视结果RESULT406中设定“取得失败”的值。
另外,监视管理部13在命令监视部12进行基于命令执行的监视的情况下,可以将该命令执行监视的情况通知给维护终端装置3。此时,可以将确定作为监视对象的被监视装置2n的IP地址和主机名称等装置固有的信息也一并通知给维护终端装置3。即,通知这些信息意味着通知维护者产生与SNMP关联的故障。此外,监视管理部13参照监视表400,在监视结果RESULT406示出“取得失败”的情况下,可以将“取得失败”的情况通知给维护终端装置3。
然后,监视管理部13参照监视表400,判断全部记录的实施状态STATE404是否均为“完成”(步骤S509),当存在“未完成”的记录时(否),继续监视动作,因此,经由图3B的连接点B将处理步骤转移到图3A的选定处理步骤S502。此外,在全部记录的实施状态STATE404均为“完成”的情况下(是),监视管理部13经由图3B的连接点C进入图3C的待机处理步骤S510。该待机处理是等待至下一监视实施的时刻为止的处理。
在待机处理S510中成为下一监视实施的时刻时,判断是否停止监视管理部13(步骤S511)。例如,在通过来自外部的操作等停止监视管理部13的情况下(是),监视管理部13转移到处理结束而结束一系列的处理。此外,在监视管理部13继续监视的情况下(否),监视管理部13经由图3C的连接点D将处理步骤转移到图3A的设定处理步骤S501。
综上所述,根据本实施例,装置监视系统10在由于SNMP协议的通信故障或网络上的被监视装置的SNMP代理的故障而无法通过SNMP取得被监视装置的状态信息时,通过基于命令取得装置状态信息,取得被监视装置2n的状态信息。由此,能够对全部被监视装置2a、2b、…、2N进行取得处理而掌握这些装置的状态。结果,监视装置1对装置的故障监视与以往相比可靠性提高,装置的维护者能够掌握更准确的装置状态。
在上述实施例的说明中也触及到了本发明的各种变形实施方式,但根据本发明,还可实现以下的其它实施例。
在上述实施例中,监视装置1采取了融合基于SNMP的监视和基于命令的监视来监视装置状态的结构。在产生与SNMP关联的故障时执行的监视方式不限于上述基于命令执行的监视方式,可以设为基于在监视装置1与被监视组2的装置2a、2b、…、2N各自之间固有地定义的消息发送接收的监视方式,也可以包含基于命令执行的监视方式和基于固有消息发送接收的监视方式的两个方式。
此外,上述实施例中的命令监视部12是单一的,但也可以具有多个。即,可以构成为多个命令监视部分别参照不同的装置状态,监视装置1使监视结果反映各自取得的装置状态信息。在这样具有多个命令监视部,从而增加可取得的装置状态信息的组合时,监视装置1能够进一步提高被监视装置2a、2b、…、2N的状态监视的可靠性。
并且,在具有多个命令监视部的情况下,可以根据被监视装置2a、2b、…、2N的种类选定执行监视处理的命令监视部。作为具体例,在将交换装置等网络设备设为被监视装置的情况下,监视装置1中的监视管理部13使命令监视部12动作来进行状态监视,以监视网络设备的网络连通状态、发送接收分组数和发送接收分组丢失数等通信状态。此外,在将服务器设为被监视装置的情况下,监视管理部13可以构成为使命令监视部12动作来进行状态监视,使得除了网络的连通状态、发送接收分组数和发送接收分组丢失数等通信状态以外,还监视CPU和存储器的使用率以及硬件的运转状况等装置内部的状态。
监视装置1进行的装置监视的处理步骤不限于图3A、图3B以及图3C所示的特定步骤。在该图所示的处理步骤中,关于针对1台选定的被监视装置2n的基于SMMP的监视,在信息取得失败的情况下,接着进行基于命令执行的监视。但是,不限于这样的步骤,还可以针对全部被监视装置2a、2b、…、2N大致尝试基于SNMP的监视,然后针对监视结果示出取得失败的被监视装置2n,进行基于命令执行的监视处理。
包含公元2013年1月16日申请的日本专利申请日本特愿2013-005657号的说明书、权利要求书、附图和摘要的全部公开内容都被包含在本说明书中进行参照。
参照特定的实施例对本发明进行了说明,但是本发明不限于这些实施例。应理解所谓的本领域技术人员能够在不脱离本发明的范围和概念的范围内对这些实施例进行变更或修正。

Claims (14)

1.一种监视系统,其特征在于,该监视系统包含:
第1监视部,其根据第1监视方式从多个被监视装置分别取得状态信息,从而监视该多个被监视装置的状态;
第2监视部,其按照基于第2监视方式的指示,从所述多个被监视装置的任意一个取得状态信息,从而监视该被监视装置的状态;以及
监视管理部,其对所述多个被监视装置的监视结果进行管理,
该监视管理部通过第1监视部取得所述状态信息进行管理,并且,如果在所述多个被监视装置中存在该状态信息的取得失败的装置,则将以该装置为新的监视对象取得所述状态信息作为所述指示给出到第2监视部,根据由第2监视部响应于该指示而取得的状态信息对所述监视结果进行管理。
2.根据权利要求1所述的监视系统,其特征在于,
所述监视管理部包含监视存储部,该监视存储部与所述多个被监视装置对应地存储第1监视部进行的监视的实施状态和该多个被监视装置的监视结果,
在实施了第1监视部进行的监视时,所述监视管理部将所述状态信息的取得失败的被监视装置作为所述新的监视对象并向第2监视部给出所述指示。
3.根据权利要求2所述的监视系统,其特征在于,
所述监视管理部包含:
确认部,其参照所述监视存储部,将所述多个被监视装置中的所述实施状态示出未完成的装置作为所述监视对象并向第1监视部给出所述指示;
指示部,其将所述状态信息的取得失败的被监视装置作为所述新的监视对象并向第2监视部给出所述指示;
取得部,其取得第2监视部按照该指示而从该被监视装置取得的所述状态信息作为所述监视结果;以及
更新部,其根据由第1监视部和第2监视部中的任意一个取得的状态信息,对所述监视存储部的监视结果进行更新。
4.根据权利要求1所述的监视系统,其特征在于,
第1监视方式是简单网络管理协议(SNMP:Simple Network ManagementProtocol),
第1监视部包含:
对象管理部,其关于所述多个被监视装置,管理按照与状态监视相关的定义而取得的装置状态信息;以及
控制部,其对基于阈值与所述取得的装置状态信息之间的比较的监视结果进行判断,其中,所述阈值是按照所述装置状态信息的类别而设定的。
5.根据权利要求1所述的监视系统,其特征在于,
第2监视方式是参照所述多个被监视装置各自的状态的命令方式。
6.根据权利要求1所述的监视系统,其特征在于,
该监视系统包含多个第2监视部,第2监视方式是参照所述多个被监视装置各自的状态的命令方式,能够取得多种状态信息。
7.一种监视装置,其特征在于,该监视装置包含:
第1监视部,其根据第1监视方式从多个被监视装置分别取得状态信息,从而监视该多个被监视装置的状态;
第2监视部,其按照基于第2监视方式的指示,从所述多个被监视装置的任意一个取得状态信息,从而监视该被监视装置的状态;以及
监视管理部,其对所述多个被监视装置的监视结果进行管理,
该监视管理部通过第1监视部取得所述状态信息进行管理,并且,如果在所述多个被监视装置中存在该状态信息的取得失败的装置,则将以该装置为新的监视对象取得所述状态信息作为所述指示给出到第2监视部,根据由第2监视部响应于该指示而取得的状态信息对所述监视结果进行管理。
8.根据权利要求7所述的监视装置,其特征在于,
所述监视管理部包含监视存储部,该监视存储部与所述多个被监视装置对应地存储第1监视部进行的监视的实施状态和该多个被监视装置的监视结果,
在实施了第1监视部进行的监视时,所述监视管理部将所述状态信息的取得失败的被监视装置作为所述新的监视对象并向第2监视部给出所述指示。
9.根据权利要求8所述的监视装置,其特征在于,
所述监视管理部包含:
确认部,其参照所述监视存储部,将所述多个被监视装置中的所述实施状态示出未完成的装置作为所述监视对象并向第1监视部给出所述指示;
指示部,其将所述状态信息的取得失败的被监视装置作为所述新的监视对象并向第2监视部给出所述指示;
取得部,其取得第2监视部按照该指示而从该被监视装置取得的所述状态信息作为所述监视结果;以及
更新部,其根据由第1监视部和第2监视部中的任意一个取得的状态信息,对所述监视存储部的监视结果进行更新。
10.根据权利要求7所述的监视装置,其特征在于,
第1监视方式是简单网络管理协议(SNMP:Simple Network ManagementProtocol),
第1监视部包含:
对象管理部,其关于所述多个被监视装置,管理按照与状态监视相关的定义而取得的装置状态信息;以及
控制部,其对基于阈值与所述取得的装置状态信息之间的比较的监视结果进行判断,其中,所述阈值是按照所述装置状态信息的类别而设定的。
11.根据权利要求7所述的监视装置,其特征在于,
第2监视方式是参照所述多个被监视装置各自的状态的命令方式。
12.根据权利要求7所述的监视装置,其特征在于,
该监视装置包含多个第2监视部,第2监视方式是参照所述多个被监视装置各自的状态的命令方式,能够取得多种状态信息。
13.一种监视方法,根据分别来自多个被监视装置的状态信息进行监视,其特征在于,
在该监视方法中使用监视装置,该监视装置包含:
第1监视部,其根据第1监视方式从所述多个被监视装置分别取得状态信息,从而监视该多个被监视装置的状态;
第2监视部,其按照基于第2监视方式的指示,从所述多个被监视装置的任意一个取得状态信息,从而监视该被监视装置的状态;以及
监视管理部,其对所述多个被监视装置的监视结果进行管理,
该监视方法包含以下步骤:由所述监视管理部通过第1监视部取得所述状态信息进行管理,并且,如果在所述多个被监视装置中存在该状态信息的取得失败的装置,则将以该装置为新的监视对象取得所述状态信息作为所述指示给出到第2监视部,根据由第2监视部响应于该指示而取得的状态信息对所述监视结果进行管理。
14.一种监视程序,其特征在于,该监视程序在被计算机读入并由该计算机执行时,使该计算机作为以下部件发挥功能:
第1监视部,其根据第1监视方式从多个被监视装置分别取得状态信息,从而监视该多个被监视装置的状态;
第2监视部,其按照基于第2监视方式的指示,从所述多个被监视装置的任意一个取得状态信息,从而监视该被监视装置的状态;以及
监视管理部,其对所述多个被监视装置的监视结果进行管理,
该监视管理部通过第1监视部取得所述状态信息进行管理,并且,如果在所述多个被监视装置中存在该状态信息的取得失败的装置,则将以该装置为新的监视对象取得所述状态信息作为所述指示给出到第2监视部,根据由第2监视部响应于该指示而取得的状态信息对所述监视结果进行管理。
CN201380004229.6A 2013-01-16 2013-10-09 网络状态监视系统 Pending CN104067599A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013005657A JP6186729B2 (ja) 2013-01-16 2013-01-16 監視システム及び監視プログラム
JP2013-005657 2013-01-16
PCT/JP2013/077427 WO2014112162A1 (ja) 2013-01-16 2013-10-09 ネットワーク状態監視システム

Publications (1)

Publication Number Publication Date
CN104067599A true CN104067599A (zh) 2014-09-24

Family

ID=51209275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380004229.6A Pending CN104067599A (zh) 2013-01-16 2013-10-09 网络状态监视系统

Country Status (4)

Country Link
US (1) US20160119181A1 (zh)
JP (1) JP6186729B2 (zh)
CN (1) CN104067599A (zh)
WO (1) WO2014112162A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608788A (zh) * 2014-11-19 2016-05-25 冲电气工业株式会社 监视装置及监视系统
CN105653366A (zh) * 2014-11-27 2016-06-08 歌乐株式会社 信息处理装置和运行管理程序
CN108769170A (zh) * 2018-05-18 2018-11-06 郑州云海信息技术有限公司 一种集群网络故障自检系统及方法
CN109660420A (zh) * 2017-10-12 2019-04-19 雅马哈株式会社 通信中继装置
CN112567693A (zh) * 2018-08-16 2021-03-26 瑞典爱立信有限公司 用于网络设备性能测量的管理模型

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102320385B1 (ko) * 2014-09-11 2021-11-02 한국전자통신연구원 네트워크 협력기반 저전력형 유료방송 셋톱박스 및 그 제어 방법
US9678820B2 (en) * 2015-06-29 2017-06-13 Vmware, Inc. Alerting with duplicate suppression
CN107276836A (zh) * 2017-08-16 2017-10-20 郑州云海信息技术有限公司 云系统中告警信息的管理方法和装置
WO2020222026A1 (en) 2019-04-29 2020-11-05 One Bit Monitoring Oü System and method for the environment monitoring by the means of generic network device
JP7506229B1 (ja) 2023-07-11 2024-06-25 ソフトバンク株式会社 診断装置、診断方法、診断プログラム、及び診断システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001025933A1 (fr) * 1999-10-01 2001-04-12 Fujitsu Limited Systeme de modele d'agent et de gestionnaire
JP2008299548A (ja) * 2007-05-31 2008-12-11 Mitsubishi Electric Corp ネットワーク管理装置及びネットワーク管理方法及びプログラム
JP4869160B2 (ja) * 2007-06-07 2012-02-08 アラクサラネットワークス株式会社 パケット中継装置
JP2008306449A (ja) * 2007-06-07 2008-12-18 Yokogawa Electric Corp ネットワーク機器監視装置及びネットワーク機器監視方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608788A (zh) * 2014-11-19 2016-05-25 冲电气工业株式会社 监视装置及监视系统
CN105608788B (zh) * 2014-11-19 2018-10-12 冲电气工业株式会社 监视装置及监视系统
CN105653366A (zh) * 2014-11-27 2016-06-08 歌乐株式会社 信息处理装置和运行管理程序
CN105653366B (zh) * 2014-11-27 2019-03-15 歌乐株式会社 信息处理装置和存储介质
CN109660420A (zh) * 2017-10-12 2019-04-19 雅马哈株式会社 通信中继装置
CN109660420B (zh) * 2017-10-12 2022-04-26 雅马哈株式会社 通信中继装置
CN108769170A (zh) * 2018-05-18 2018-11-06 郑州云海信息技术有限公司 一种集群网络故障自检系统及方法
CN112567693A (zh) * 2018-08-16 2021-03-26 瑞典爱立信有限公司 用于网络设备性能测量的管理模型

Also Published As

Publication number Publication date
WO2014112162A1 (ja) 2014-07-24
JP6186729B2 (ja) 2017-08-30
JP2014138262A (ja) 2014-07-28
US20160119181A1 (en) 2016-04-28

Similar Documents

Publication Publication Date Title
CN104067599A (zh) 网络状态监视系统
US8989002B2 (en) System and method for controlling threshold testing within a network
US9419871B2 (en) Method and system for remotely monitoring device status and internet connectivity on a computer network
US6115743A (en) Interface system for integrated monitoring and management of network devices in a telecommunication network
US7430688B2 (en) Network monitoring method and apparatus
CN109960634B (zh) 一种应用程序监控方法、装置及系统
CN107800783B (zh) 远程监控服务器的方法及装置
US20180324063A1 (en) Cloud-based system for device monitoring and control
CN110445697B (zh) 视频大数据云平台设备接入服务方法
CN111130821B (zh) 一种掉电告警的方法、处理方法及装置
KR20210002907A (ko) 차량용 이더넷 통신 모니터링 장치 및 그의 이더넷 통신 모니터링 방법과 그를 포함하는 차량
US20040098230A1 (en) Computer network monitoring with test data analysis
US20170187575A1 (en) System and method for customizing standard device-orientated services within a high scale deployment
EP1622310B1 (en) Administration method and system for network management systems
WO2002077830A1 (fr) Systeme de commande de surveillance, procede de commande de surveillance et programme de commande pour dispositif commande
CN112888007A (zh) 设备离线原因诊断方法、设备及存储介质
CN113810238A (zh) 网络监测方法、电子设备及存储介质
CN111130917B (zh) 线路测试的方法、装置及系统
CN100421381C (zh) 一种获取网络设备运行和故障状态信息的方法及装置
KR20030021862A (ko) 이엠에스 서버와 에이전트 간의 장애 처리 방법
CN111581107A (zh) Ftp程序疲劳测试方法及系统
JP4361505B2 (ja) トラヒック監視方法、装置及びプログラム
JP7238515B2 (ja) ネットワーク制御装置、システム、方法、及びプログラム
EP3597908A1 (en) System and method for managing a plurality of wind power plants
KR20070059296A (ko) 원격 국소의 인터넷 장비들에 대한 원격관리 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140924