CN106487612A - 一种服务器节点监控方法、监控服务器及系统 - Google Patents

一种服务器节点监控方法、监控服务器及系统 Download PDF

Info

Publication number
CN106487612A
CN106487612A CN201610971427.5A CN201610971427A CN106487612A CN 106487612 A CN106487612 A CN 106487612A CN 201610971427 A CN201610971427 A CN 201610971427A CN 106487612 A CN106487612 A CN 106487612A
Authority
CN
China
Prior art keywords
proxy device
server node
network state
monitoring
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610971427.5A
Other languages
English (en)
Inventor
张旭芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Inspur Smart Computing Technology Co Ltd
Original Assignee
Guangdong Inspur Big Data Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Inspur Big Data Research Co Ltd filed Critical Guangdong Inspur Big Data Research Co Ltd
Priority to CN201610971427.5A priority Critical patent/CN106487612A/zh
Publication of CN106487612A publication Critical patent/CN106487612A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种服务器节点监控方法、监控服务器及系统,该方法应用于监控服务器,包括:S0:预先设置对应硬件运行参数的第一告警阈值以及对应网络状态参数的第二告警阈值;S1:向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数;S2:判断所述硬件运行参数及所述网络状态参数中是否存在至少一个大于对应的告警阈值,如果是,则确定外部服务器节点异常,并进行告警。通过本发明的技术方案,可更加全面的监控服务器节点。

Description

一种服务器节点监控方法、监控服务器及系统
技术领域
本发明涉及计算机技术领域,特别涉及一种服务器节点监控方法、监控服务器及系统。
背景技术
随着数据中心的数据处理需求不断提高,对服务器运行状态直接决定其数据处理能力,因此,如何实现对服务器节点进行监控,并根据监控结果进行相应的管理也日趋重要。
目前,主要通过在服务器节点上安装相应的硬件监控终端,以实时采集服务器上相应硬件的运行参数(比如,内存利用率及存储空间利用率、风扇转速及处理器利用率等),硬件监控终端可将采集的运行参数发送到监控服务器,以使得工作人员可根据监控服务器获取的运行参数对相应的服务器进行管理,或根据预先设置的参考阈值以确定是否产生对应服务器节点的告警信息,以对工作人员进行提示。
由于服务器节点在执行相应的数据处理任务时,通常还需要与外部设备进行网络连接,通过网络与外部设备进行信息交互以实现相应的数据处理任务,而在上述技术方案中,监控服务器仅能获取到服务器节点的硬件运行参数,监控范围并不全面。
发明内容
本发明实施例提供了一种服务器节点监控方法、监控服务器及系统,可更加全面的监控服务器节点。
第一方面,本发明提供了一种服务器节点监控方法,应用于监控服务器,包括:
S0:预先设置对应硬件运行参数的第一告警阈值和网络状态参数的第二告警阈值;
S1:向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数;
S2:判断所述硬件运行参数及所述网络状态参数中是否存在至少一个大于对应的告警阈值,如果是,则确定外部服务器节点异常,并进行告警。
优选地,
所述向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数,包括:
以设定时间间隔向所述第一代理装置和第二代理装至分别发送触发信号,以使所述第一代理装置在接收到本次触发信号时,连续采集外部服务器节点的硬件运行参数,并转发本次触发信号之前的一个时间间隔内采集的硬件运行参数,以及使所述第二代理装置在接收到本次触发信号时,连续采集外部服务器节点的网络状态参数,并转发本次触发信号之前的一个时间间隔内采集的网络状态参数。
优选地,
所述第一代理装置和所述第二代理装置安装在外部服务器节点内。
优选地,
所述硬件运行参数包括:处理器利用率、内存利用率、风扇转速中的一项或多项;
和/或,
所述网络状态参数包括:数据包传输速率、数据包丢包率、与当前服务器节点建立连接的用户数量、任务等待时长以及任务执行时长中的一项或多项。
第二方面,本发明实施例提供了一种监控服务器,包括:
设置模块,用于预先设置对应硬件运行参数的第一告警阈值和网络状态参数的第二告警阈值;
数据采集模块,用于向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数;
处理模块,用于判断所述硬件运行参数及所述网络状态参数中是否存在至少一个大于对应的告警阈值,如果是,则确定外部服务器节点异常,并进行告警。
优选地,
所述数据采集模块,用于以设定时间间隔向所述第一代理装置和第二代理装至分别发送触发信号,以使所述第一代理装置在接收到本次触发信号时,连续采集外部服务器节点的硬件运行参数,并转发本次触发信号之前的一个时间间隔内采集的硬件运行参数,以及使所述第二代理装置在接收到本次触发信号时,连续采集外部服务器节点的网络状态参数,并转发本次触发信号之前的一个时间间隔内采集的网络状态参数。
优选地,
所述第一代理装置和所述第二代理装置安装在外部服务器节点内。
优选地,
所述硬件运行参数包括:处理器利用率、内存利用率、风扇转速中的一项或多项;
和/或,
所述网络状态参数包括:数据包传输速率、数据包丢包率、与当前服务器节点建立连接的用户数量、任务等待时长以及任务执行时长中的一项或多项。
第三方面,本发明实施例提供了一种服务器节点监控系统,包括:
至少一个服务器节点、至少一个第一代理装置、至少一个第二代理装置,以及如上述第二方面中任一所述的监控服务器;其中,
所述至少一个服务器节点与所述至少一个第一代理装置一一对应连接;所述至少一个服务器节点与所述至少一个第二代理装置一一对应连接;每一个所述第一代理装置和每一个所述第二代理装置均与所述监控服务器相连;
所述第一代理装置,用于接收所述监控服务器发送的触发信号,采集并转发对应连接的所述服务器节点的硬件运行参数;
所述第二代理装置,用于接收所述监控服务器发送的触发信号,采集并转发对应连接的所述服务器节点的网络状态参数。
优选地,
所述第一代理装置和所述第二代理装置均安装在对应连接的所述服务器节点中。
本发明实施例提供了一种服务器节点监控方法、监控服务器及系统,通过在监控服务器中预先设置对应硬件运行参数的第一告警阈值以及对应网络状态参数的第二告警阈值,向第一代理装置和第二代理装置分别发送触发信号,即可使第一代理装置采集并转发服务器节点的硬件运行参数,以及使第二代理装置采集并转发服务器节点的网络状态参数,当硬件运行参数及网络状态参数中存在至少一个大于对应的告警阈值时,则可确定外部服务器节点异常,并进行告警;综上可见,本发明实施例提供的技术方案中,不仅仅对服务器节点的硬件运行状态进行监控,还可同时监控服务器节点的网络状态,可更加全面的监控服务器节点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种服务器节点监控方法的流程图;
图2是本发明一实施例提供的一种监控服务器的结构示意图;
图3是本发明一实施例提供的一种服务器节点监控系统的结构示意图;
图4是本发明一实施例提供的另一种服务器节点监控系统的结构示意图;
图5是本发明一实施例提供的另一种服务器节点监控方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种服务器节点监控方法,应用于监控服务器,包括:
S0:预先设置对应硬件运行参数的第一告警阈值以及对应网络状态参数的第二告警阈值;
S1:向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数;
S2:判断所述硬件运行参数及所述网络状态参数中是否存在至少一个大于对应的告警阈值,如果是,则确定外部服务器节点异常,并进行告警。
本发明上述实施例中,通过在监控服务器中预先设置对应硬件运行参数的第一告警阈值以及对应网络状态参数的第二告警阈值,向第一代理装置和第二代理装置分别发送触发信号,即可使第一代理装置采集并转发服务器节点的硬件运行参数,以及使第二代理装置采集并转发服务器节点的网络状态参数,当硬件运行参数及网络状态参数中存在至少一个大于对应的告警阈值时,则可确定外部服务器节点异常,并进行告警;综上可见,本发明实施例提供的技术方案中,不仅仅对服务器节点的硬件运行状态进行监控,还可同时监控服务器节点的网络状态,可更加全面的监控服务器节点。
具体地,所述硬件运行参数包括:处理器利用率、内存利用率、风扇转速中的一项或多项;
和/或,
所述网络状态参数包括:数据包传输速率、数据包丢包率、与当前服务器节点建立连接的用户数量、任务等待时长以及任务执行时长中的一项或多项。
举例来说,可以设置处理器利用率和内存利用率分别对应的第一告警阈值为75%,当监控服务器确定出第一代理装置采集并转发的服务器节点的处理器利用率或内存利用率大于75%时,则可确定该服务器节点的处理器或内存异常,并产生告警;又如,设置设置数据博丢包率对应的第二告警阈值为99.9%,以及任务等待时长为0.01秒,当监控服务器确定出第二代理装置采集并转发的服务器节点的数据包丢包率大于99.9%或任务等待时长大于0.01秒时,则可确定服务器节点的网络状态异常,并产生告警。
应当理解的是,监控服务器还可以设置相应的告警等级,比如,设置处理器利用率对应的第一告警阈值中,包括一级告警阈值和告警阈值,在监控服务器确定出第一代理装置采集并转发的服务器节点的处理器利用率大于一级告警阈值或二级告警阈值时,进行不同方式的告警,比如,显示不同颜色的告警灯光,发出不同的声响等。
进一步的,为了实现对服务器节点于各个时间段内的工作状态进行分别监控,避免持续因出现误差而错误的确定服务器节点发生异常,本发明一个优选实施例中,所述向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数,包括:
以设定时间间隔向所述第一代理装置和第二代理装至分别发送触发信号,以使所述第一代理装置在接收到本次触发信号时,连续采集外部服务器节点的硬件运行参数,并转发本次触发信号之前的一个时间间隔内采集的硬件运行参数,以及使所述第二代理装置在接收到本次触发信号时,连续采集外部服务器节点的网络状态参数,并转发本次触发信号之前的一个时间间隔内采集的网络状态参数。
本发明上述实施例中,通过计算固定时间间隔内相应硬件运行参数或网络状态参数的平均值来确定服务器节点是否发生异常,可避免因硬件运行参数或网络状态参数的瞬时值过高或其它原因导致的误差而使得监控服务器错误的确定服务器节点发生异常。
本发明一实施例中,所述第一代理装置和所述第二代理装置安装在外部服务器节点内。具体地,第一代理装置和第二代理装置可以分别安装在服务器节点上的snmpd(守护进程)服务和sysstat软件包。
如图2所示,本发明实施例提供了一种监控服务器,包括:
设置模块201,用于预先设置对应硬件运行参数的第一告警阈值和网络状态参数的第二告警阈值;
数据采集模块202,用于向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数;
处理模块203,用于判断所述硬件运行参数及所述网络状态参数中是否存在至少一个大于对应的告警阈值,如果是,则确定外部服务器节点异常,并进行告警。
本发明一个优选实施例中,所述第一代理装置和所述第二代理装置安装在外部服务器节点内。
本发明一个优选实施例中,所述硬件运行参数包括:处理器利用率、内存利用率、风扇转速中的一项或多项;
和/或,
所述网络状态参数包括:数据包传输速率、数据包丢包率、与当前服务器节点建立连接的用户数量、任务等待时长以及任务执行时长中的一项或多项。
进一步的,为了实现对服务器节点于各个时间段内的工作状态进行分别监控,避免持续因出现误差而错误的确定服务器节点发生异常,本发明一个优选实施例中,所述数据采集模块303,用于以设定时间间隔向所述第一代理装置和第二代理装至分别发送触发信号,以使所述第一代理装置在接收到本次触发信号时,连续采集外部服务器节点的硬件运行参数,并转发本次触发信号之前的一个时间间隔内采集的硬件运行参数,以及使所述第二代理装置在接收到本次触发信号时,连续采集外部服务器节点的网络状态参数,并转发本次触发信号之前的一个时间间隔内采集的网络状态参数。
如图3所示,本发明实施例提供了一种服务器节点监控系统,包括:
至少一个服务器节点301、至少一个第一代理装置302、至少一个第二代理装置303,以及本发明任意一个实施例提供的监控服务器304;其中,
所述至少一个服务器节点301与所述至少一个第一代理装置302一一对应连接;所述至少一个服务器节点301与所述至少一个第二代理装置303一一对应连接;每一个所述第一代理装置302和每一个所述第二代理装置303均与所述监控服务器304相连;
所述第一代理装置302,用于接收所述监控服务器304发送的触发信号,采集并转发对应连接的所述服务器节点301的硬件运行参数;
所述第二代理装置303,用于接收所述监控服务器304发送的触发信号,采集并转发对应连接的所述服务器节点301的网络状态参数。
如图4所示,本发明一个优选实施例中,所述第一代理装置302和所述第二代理装置303均安装在对应连接的所述服务器节点301中。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
为了更加清楚的说明本发明实施例提供的技术方案及优点,下面以利用本发明实施例提供的服务器节点监控系统对服务器节点进行监控为例,参考图2、图3、图4,可以包括如下各个步骤:
步骤501,在服务器节点中分别安装并启动第一代理装置和第二代理装置。
本发明实施例中,第一代理装置和第二装置可以分别是在服务器节点中安装并启动的snmpd(守护进程)服务和sysstat软件包
步骤502,设置第一代理装置和第二代理装置分别对应的至少一个硬件监控项目和至少一个软件监控项目。
举例来说,可以设置硬件监控项目包括但不限于处理器利用率、内存利用率以及风扇转速;可以设置的网络状态监控项目包括但不限于数据包传输速率、数据丢包率以及任务等待时长等。
步骤503,在监控服务器中设置每一个硬件监控项目分别对应的第一告警阈值,以及设置每一个网络监控项目分别对应的第二告警阈值。
举例来说,这里可以设置处理器利用率和内存利用率分别对应的第一告警阈值为75%;设置数据包丢包率和任务等待时长对应的第二告警阈值分别为99.9%和0.01秒。
步骤504,监控服务器以设定时间间隔周期性向安装在服务器节点中的第一代理装置和第二代理装置分别发送触发信号。
步骤505,第一代理装置在接收到本次触发信号时,持续采集每一个硬件监控项目分别对应的硬件运行参数,并将前一个时间间隔内采集的硬件运行参数转发至监控服务器,第二代理装置在接收到本次触发信号时,持续采集每一个网络监控项目分贝对应的网络状态参数,并将前一个时间间隔内采集的网络状态参数发送至监控服务器。
本发明实施例中,为了避免因硬件运行参数或网络状态参数的瞬时值过高或其它原因导致的误差而使得监控服务器错误的确定服务器节点发生异常,这里可通过计算固定时间间隔内响应硬件运行参数或网络状态参数的平均值来确定服务器节点是否发生异常。
举例来说,监控服务器以设置时间间隔在t1、t2时刻分别向第一代理装置和第二代理装置发送触发信号,第一代理装置和第二代理装置在t2时刻接收到触发信号时,第一代理装置持续采集对应的服务器节点的相应硬件监控项目的硬件运行参数,并将t1时刻至t2时刻之间的时间段内采集的硬件运行参数发送到监控服务器;第二代理服务器同理。如此,即可使监控服务器即可针对接收的硬件运行参数和网络状态参数,计算相应监控项目在t1时刻至t2时刻之间对应的平均值,通过比较平均值与对应的第一告警阈值或第二告警阈值来实现准确确定服务器节点是否发生异常。
步骤506,监控服务器根据接收的硬件运行参数和网络状态参数计算相应监控项目对应的硬件运行参数或网络状态参数的平均值。
步骤507,监控服务器分别对每一个计算的平均值与对应的第一告警阈值或第二告警阈值进行比较,以判断是否存在至少一个监控项目对应的平均值大于对应的告警阈值,当判断结果为是时,执行步骤508;否则,结束当前业务流程。
步骤508,确定服务器节点发生异常,并进行告警。
应当理解的是,监控服务器还可以设置相应的告警等级,比如,设置处理器利用率对应的第一告警阈值中,包括一级告警阈值和告警阈值,在监控服务器确定出第一代理装置采集并转发的服务器节点的处理器利用率大于一级告警阈值或二级告警阈值时,进行不同方式的告警,比如,显示不同颜色的告警灯光,发出不同的声响等。
综上所述,本发明各个实施例至少具有如下有益效果:
1、本发明一实施例中,通过在监控服务器中预先设置对应硬件运行参数的第一告警阈值以及对应网络状态参数的第二告警阈值,向第一代理装置和第二代理装置分别发送触发信号,即可使第一代理装置采集并转发服务器节点的硬件运行参数,以及使第二代理装置采集并转发服务器节点的网络状态参数,当硬件运行参数及网络状态参数中存在至少一个大于对应的告警阈值时,则可确定外部服务器节点异常,并进行告警;综上可见,本发明实施例提供的技术方案中,不仅仅对服务器节点的硬件运行状态进行监控,还可同时监控服务器节点的网络状态,可更加全面的监控服务器节点。
2、本发明一实施例中,通过计算固定时间间隔内相应硬件运行参数或网络状态参数的平均值来确定服务器节点是否发生异常,可避免因硬件运行参数或网络状态参数的瞬时值过高或其它原因导致的误差而使得监控服务器错误的确定服务器节点发生异常。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个〃·····”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种服务器节点监控方法,其特征在于,应用于监控服务器,包括:
预先设置对应硬件运行参数的第一告警阈值以及对应网络状态参数的第二告警阈值;还包括:
向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数;
判断所述硬件运行参数及所述网络状态参数中是否存在至少一个大于对应的告警阈值,如果是,则确定外部服务器节点异常,并进行告警。
2.根据权利要求1所述的服务器节点监控方法,其特征在于,
所述向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数,包括:
以设定时间间隔向所述第一代理装置和第二代理装至分别发送触发信号,以使所述第一代理装置在接收到本次触发信号时,连续采集外部服务器节点的硬件运行参数,并转发本次触发信号之前的一个时间间隔内采集的硬件运行参数,以及使所述第二代理装置在接收到本次触发信号时,连续采集外部服务器节点的网络状态参数,并转发本次触发信号之前的一个时间间隔内采集的网络状态参数。
3.根据权利要求1所述的服务器节点监控方法,其特征在于,
所述第一代理装置和所述第二代理装置安装在外部服务器节点内。
4.根据权利要求1至3中任一所述的服务器节点监控方法,其特征在于,
所述硬件运行参数包括:处理器利用率、内存利用率、风扇转速中的一项或多项;
和/或,
所述网络状态参数包括:数据包传输速率、数据包丢包率、与当前服务器节点建立连接的用户数量、任务等待时长以及任务执行时长中的一项或多项。
5.一种监控服务器,其特征在于,包括:
设置模块,用于预先设置对应硬件运行参数的第一告警阈值和网络状态参数的第二告警阈值;
数据采集模块,用于向第一代理装置和第二代理装置分别发送触发信号,以使第一代理装置采集并转发外部服务器节点的硬件运行参数,以及使第二代理装置采集并转发外部服务器节点的网络状态参数;
处理模块,用于判断所述硬件运行参数及所述网络状态参数中是否存在至少一个大于对应的告警阈值,如果是,则确定外部服务器节点异常,并进行告警。
6.根据权利要求5所述的监控服务器,其特征在于,
所述数据采集模块,用于以设定时间间隔向所述第一代理装置和第二代理装至分别发送触发信号,以使所述第一代理装置在接收到本次触发信号时,连续采集外部服务器节点的硬件运行参数,并转发本次触发信号之前的一个时间间隔内采集的硬件运行参数,以及使所述第二代理装置在接收到本次触发信号时,连续采集外部服务器节点的网络状态参数,并转发本次触发信号之前的一个时间间隔内采集的网络状态参数。
7.根据权利要求5所述的监控服务器,其特征在于,
所述第一代理装置和所述第二代理装置安装在外部服务器节点内。
8.根据权利要求5至7中任一所述的监控服务器,其特征在于,
所述硬件运行参数包括:处理器利用率、内存利用率、风扇转速中的一项或多项;
和/或,
所述网络状态参数包括:数据包传输速率、数据包丢包率、与当前服务器节点建立连接的用户数量、任务等待时长以及任务执行时长中的一项或多项。
9.一种服务器节点监控系统,其特征在于,包括:
至少一个服务器节点、至少一个第一代理装置、至少一个第二代理装置,以及如上述权利要求5至8中任一所述的监控服务器;其中,
所述至少一个服务器节点与所述至少一个第一代理装置一一对应连接;所述至少一个服务器节点与所述至少一个第二代理装置一一对应连接;每一个所述第一代理装置和每一个所述第二代理装置均与所述监控服务器相连;
所述第一代理装置,用于接收所述监控服务器发送的触发信号,采集并转发对应连接的所述服务器节点的硬件运行参数;
所述第二代理装置,用于接收所述监控服务器发送的触发信号,采集并转发对应连接的所述服务器节点的网络状态参数。
10.根据权利要求9所述的服务器节点监控系统,其特征在于,
所述第一代理装置和所述第二代理装置均安装在对应连接的所述服务器节点中。
CN201610971427.5A 2016-11-01 2016-11-01 一种服务器节点监控方法、监控服务器及系统 Pending CN106487612A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610971427.5A CN106487612A (zh) 2016-11-01 2016-11-01 一种服务器节点监控方法、监控服务器及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610971427.5A CN106487612A (zh) 2016-11-01 2016-11-01 一种服务器节点监控方法、监控服务器及系统

Publications (1)

Publication Number Publication Date
CN106487612A true CN106487612A (zh) 2017-03-08

Family

ID=58271658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610971427.5A Pending CN106487612A (zh) 2016-11-01 2016-11-01 一种服务器节点监控方法、监控服务器及系统

Country Status (1)

Country Link
CN (1) CN106487612A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107659459A (zh) * 2017-11-02 2018-02-02 郑州云海信息技术有限公司 分布式集群管理软件容灾管理方法、系统、介质及设备
CN109032913A (zh) * 2018-08-20 2018-12-18 郑州云海信息技术有限公司 一种设备稳定性检测方法及相关装置
CN109344039A (zh) * 2018-09-13 2019-02-15 郑州云海信息技术有限公司 一种主机智能监控方法及装置
CN111327492A (zh) * 2020-01-21 2020-06-23 光大兴陇信托有限责任公司 一种全链路监控处理方法
CN111679958A (zh) * 2020-06-11 2020-09-18 上海安畅网络科技股份有限公司 一种服务器监控系统
CN112565388A (zh) * 2020-12-01 2021-03-26 中盈优创资讯科技有限公司 一种基于打分体系的分布式采集服务调度系统及方法
CN113268389A (zh) * 2021-06-09 2021-08-17 无锡炫我科技有限公司 异常节点监测的方法、装置、电子设备和可读存储介质
CN114338368A (zh) * 2021-12-30 2022-04-12 南京中孚信息技术有限公司 基于单向导入设备的网络监管方法、设备及介质
CN115277133A (zh) * 2022-07-13 2022-11-01 国家电网有限公司信息通信分公司 设备管理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621484A (zh) * 2008-07-04 2010-01-06 鸿富锦精密工业(深圳)有限公司 用于邮件服务器监控的应用服务器及其监控方法
CN102104616A (zh) * 2010-11-03 2011-06-22 深圳市科陆电子科技股份有限公司 在浏览器上对系统内多台web服务器进行实时监控的方法
CN103051496A (zh) * 2012-12-21 2013-04-17 大唐软件技术股份有限公司 一种监测点服务器的监控方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621484A (zh) * 2008-07-04 2010-01-06 鸿富锦精密工业(深圳)有限公司 用于邮件服务器监控的应用服务器及其监控方法
CN102104616A (zh) * 2010-11-03 2011-06-22 深圳市科陆电子科技股份有限公司 在浏览器上对系统内多台web服务器进行实时监控的方法
CN103051496A (zh) * 2012-12-21 2013-04-17 大唐软件技术股份有限公司 一种监测点服务器的监控方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107659459A (zh) * 2017-11-02 2018-02-02 郑州云海信息技术有限公司 分布式集群管理软件容灾管理方法、系统、介质及设备
CN109032913A (zh) * 2018-08-20 2018-12-18 郑州云海信息技术有限公司 一种设备稳定性检测方法及相关装置
CN109344039A (zh) * 2018-09-13 2019-02-15 郑州云海信息技术有限公司 一种主机智能监控方法及装置
CN111327492A (zh) * 2020-01-21 2020-06-23 光大兴陇信托有限责任公司 一种全链路监控处理方法
CN111327492B (zh) * 2020-01-21 2020-12-15 光大兴陇信托有限责任公司 一种全链路监控处理方法
CN111679958A (zh) * 2020-06-11 2020-09-18 上海安畅网络科技股份有限公司 一种服务器监控系统
CN112565388A (zh) * 2020-12-01 2021-03-26 中盈优创资讯科技有限公司 一种基于打分体系的分布式采集服务调度系统及方法
CN113268389A (zh) * 2021-06-09 2021-08-17 无锡炫我科技有限公司 异常节点监测的方法、装置、电子设备和可读存储介质
CN114338368A (zh) * 2021-12-30 2022-04-12 南京中孚信息技术有限公司 基于单向导入设备的网络监管方法、设备及介质
CN115277133A (zh) * 2022-07-13 2022-11-01 国家电网有限公司信息通信分公司 设备管理方法及装置
CN115277133B (zh) * 2022-07-13 2024-03-15 国家电网有限公司信息通信分公司 设备管理方法及装置

Similar Documents

Publication Publication Date Title
CN106487612A (zh) 一种服务器节点监控方法、监控服务器及系统
US11381974B2 (en) Method and attack detection function for detection of a distributed attack in a wireless network
JP5767617B2 (ja) ネットワーク障害検出システムおよびネットワーク障害検出装置
JP5418250B2 (ja) 異常検出装置、プログラム、及び異常検出方法
CN108418710B (zh) 一种分布式监控系统、方法及装置
EP2800024B1 (en) System and methods for identifying applications in mobile networks
CN110740072B (zh) 一种故障检测方法、装置和相关设备
US20070168505A1 (en) Performance monitoring in a network
CN110908872B (zh) 一种服务器状态检测方法及系统
CN112636979B (zh) 一种集群告警方法及相关装置
JP2013054402A (ja) 運用監視装置、運用監視プログラム及び記録媒体
CN109039795B (zh) 一种云服务器资源监控方法和系统
CN104506392A (zh) 一种宕机检测方法及设备
AU2019277439B2 (en) Abnormality detection apparatus, abnormality detection method, and abnormality detection program
JP4919935B2 (ja) 警備システム
JP2004145536A (ja) 管理システム
EP1622310A2 (en) Administration system for network management systems
CN108616423B (zh) 一种脱网设备监测方法以及装置
CN114296979A (zh) 一种检测物联网设备异常状态的方法及装置
CN115174189A (zh) 异常检测方法、装置、电子设备及存储介质
WO2014040470A1 (zh) 告警消息的处理方法及装置
JP2015082131A (ja) 監視システム、監視方法、監視プログラム及び監視装置
CN114338189A (zh) 基于节点拓扑关系链的态势感知防御方法、装置及系统
KR101490316B1 (ko) 네트워크 장비의 장애 검출 시스템 및 이를 이용한 장애 검출 방법
CN102567470A (zh) 系统级性能数据的处理方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170308

RJ01 Rejection of invention patent application after publication