CN111200526A - 网络设备的监控系统及方法 - Google Patents

网络设备的监控系统及方法 Download PDF

Info

Publication number
CN111200526A
CN111200526A CN201911408769.6A CN201911408769A CN111200526A CN 111200526 A CN111200526 A CN 111200526A CN 201911408769 A CN201911408769 A CN 201911408769A CN 111200526 A CN111200526 A CN 111200526A
Authority
CN
China
Prior art keywords
collection
acquisition
alarm
channel
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911408769.6A
Other languages
English (en)
Other versions
CN111200526B (zh
Inventor
高昊阳
章彩红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN201911408769.6A priority Critical patent/CN111200526B/zh
Publication of CN111200526A publication Critical patent/CN111200526A/zh
Application granted granted Critical
Publication of CN111200526B publication Critical patent/CN111200526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供一种网络设备的监控系统及方法,涉及监控技术领域,所述监控系统包括:设备管理器、厂商控制器、采集通道、系统自监控器、配置器,其中,所述设备管理器与各厂商控制器对接,以通过网络设备的厂商控制器控制各网络设备向其对应的采集通道上送性能数据,所述采集通道从其对应网络设备上送的性能数据中根据采集规则规定的采集任务筛选需要的数据,根据阈值告警规则生成告警事件以进行告警,所述系统自监控器监控所述采集通道的采集任务量,根据所述采集任务量给出配置所述网络设备对应的采集通道、采集规则、阈值告警规则的建议。本实施方式提供的监控系统、方法可以灵活调配采集资源和处理资源,便于对大量的网络设备进行监控。

Description

网络设备的监控系统及方法
技术领域
本发明涉及监控技术领域,具体而言,涉及一种网络设备的监控系统及方法。
背景技术
随着5G、软件定义接入网以及核心网技术的发展,大型企业的网络设备越来越多,种类越来越繁杂。对于大型企业而言,对各类网络设备进行监控,是保障企业系统安全稳定运行,协助运维人员及时发现并处置网络故障的重要基础。
传统网络监控方式(如SNMP get和CLI)的管理效率低,其通过拉模式来获取设备的监控数据,不能监控大量网络节点,限制了网络增长。并且,传统网络监控方式只能依靠加大查询频度来提升获取数据的精度,获取数据的粒度较粗,并且,高频度查询也会导致网络节点CPU利用率高而影响设备的正常功能。同时,由于网络传输时延的存在,监控到的网络节点的数据并不正确。由此,传统监控模式已不能满足用户需求的演进。
Telemetry协议是一项远程的从物理设备或虚拟设备上高速采集数据的技术。采用telemetry协议的网络设备通过推模式(Push Mode)周期性的主动向采集器上送设备的接口流量统计、CPU或内存数据等信息。
对于大型企业而言,其需监控大量的网络设备,如何合理的调配各采集器与各网络设备间的采集资源、处理资源,是亟待解决的技术问题。
发明内容
本发明提供了一种网络设备的监控系统及方法,以解决现有技术中存在的上述技术问题。
本发明实施方式的第一方面提供一种网络设备的监控系统,所述监控系统包括:
设备管理器,用于获取各网络设备的配置信息,将所述配置信息发送给各网络设备的厂商控制器,所述配置信息包括:与所述设备对应的采集通道;
厂商控制器,用于接收所述配置信息,根据所述配置信息配置相应的网络设备,以使所述网络设备向其对应的采集通道上送性能数据;
采集通道,包括采集器集群、性能数据缓存和预处理器集群,所述采集器集群用于根据采集规则从所述性能数据中筛选出设定设备的设定对象的设定指标的指标数据,将所述指标数据存储到性能数据缓存中,所述预处理器集群用于从所述性能数据缓存中获取所述指标数据,判断所述指标数据是否满足阈值告警规则,若满足,则根据所述指标数据生成告警事件以进行告警,其中,所述采集规则规定了需监控的设定设备、设定对象和设定指标,一个设备的一个对象的一个指标对应一条采集任务;
系统自监控器,用于监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议;
配置器,用于根据所述配置建议配置所述网络设备对应的采集通道、所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则;
其中,所述网络设备为支持telemetry协议的网络设备,所述采集器为telemetry采集器。
在本发明的一种实施方式中,所述监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议包括:
获取由测试环境测试得到的所述采集通道的最大任务量;
若所述采集通道的采集任务量与最大任务量的比值大于设定阈值,则提供增加所述网络设备对应的采集通道数量的建议。
在本发明的一种实施方式中,
所述配置器还用于将所述采集规则、阈值告警规则分别发送给对应的消息队列;
所述采集器集群、预处理器集群还用于分别监听对应的消息队列,分别获取更新的采集规则、阈值告警规则。
在本发明的一种实施方式中,所述采集通道还包括:
负载均衡器,用于使所述采集通道内的各采集器负载均衡。
在本发明的一种实施方式中,所述监控系统还包括:
事件分析器,用于获取所述告警事件,根据告警平台的事件规则生成告警发送给对应的告警平台,以进行告警。
本发明实施方式的第二方面提供一种网络设备的监控方法,其特征在于,所述方法包括:
设备管理器获取各网络设备的配置信息,将所述配置信息发送给各网络设备的厂商控制器,所述配置信息包括:与所述设备对应的采集通道;
厂商控制器接收所述配置信息,根据所述配置信息配置相应的网络设备,以使所述网络设备向其对应的采集通道上送性能数据;
所述采集通道的采集器集群根据采集规则从所述性能数据中筛选出设定设备的设定对象的设定指标的指标数据,将所述指标数据存储到性能数据缓存中,所述采集通道的预处理器集群用于从所述性能数据缓存中获取所述指标数据,判断所述指标数据是否满足阈值告警规则,若满足,则根据所述指标数据生成告警事件以进行告警,其中,所述采集规则规定了需监控的设定设备、设定对象和设定指标,一个设备的一个对象的一个指标对应一条采集任务;
系统自监控器监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议;
根据所述配置建议通过配置器配置所述网络设备对应的采集通道、所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则;
其中,所述网络设备为支持telemetry协议的网络设备,所述采集器为telemetry采集器。
在本发明的一种实施方式中,所述监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议包括:
获取由测试环境测试得到的所述采集通道的最大任务量;
若所述采集通道的采集任务量与最大任务量的比值大于设定阈值,则提供增加所述网络设备对应的采集通道数量的建议。
在本发明的一种实施方式中,所述方法还包括:
所述配置器将所述采集规则、阈值告警规则分别发送给对应的消息队列;
所述采集器集群、预处理器集群分别监听对应的消息队列,分别获取更新的采集规则、阈值告警规则。
在本发明的一种实施方式中,所述方法还包括:
通过负载均衡器使所述采集通道内的各采集器负载均衡。
在本发明的一种实施方式中,所述方法还包括:
事件分析器获取所述告警事件,根据告警平台的事件规则生成告警发送给对应的告警平台,以进行告警。
本实施方式提供的监控系统、方法可以灵活的调配采集资源和处理资源,便于监控大量的网络设备。
附图说明
图1是根据本发明一种实施方式的监控系统的模块示意图;
图2是根据本发明一种实施方式的监控方法的方法流程图。
具体实施方式
为了便于理解本发明技术方案的各个方面、特征以及优点,下面结合附图对本发明进行具体描述。应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。
本发明实施方式的一方面提供一种网络设备的监控系统。图1示出了根据本发明一种实施方式的监控系统模块示意图。如图1所示,本实施方式所述的网络设备的监控系统包括:设备管理器11、厂商控制器12、采集通道13、系统自监控器14、以及配置器15。
设备管理器11,用于获取各网络设备20的配置信息,将所述配置信息发送给各网络设备20的厂商控制器,所述配置信息包括:与所述设备对应的采集通道;
厂商控制器12,用于接收所述配置信息,根据所述配置信息配置相应的网络设备20,以使所述网络设备20向其对应的采集通道上送性能数据;
采集通道13,包括采集器集群131、性能数据缓存132和预处理器集群133,所述采集器集群131用于根据采集规则从所述性能数据中筛选出设定设备的设定对象的设定指标的指标数据,将所述指标数据存储到性能数据缓存132中,所述预处理器集群133用于从性能数据缓存132中获取所述指标数据,判断所述指标数据是否满足阈值告警规则,若满足,则根据所述指标数据生成告警事件,其中,所述采集规则规定了需监控的设定设备、设定对象和设定指标,一个对象的一个指标对应一条采集任务;
系统自监控器14,用于监控采集通道13内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议;
配置器15,用于根据配置建议配置所述网络设备对应的采集通道、所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则。
其中,所述网络设备为支持telemetry协议的网络设备(telemetry网络设备),所述采集器为telemetry采集器。设备管理器11与各网络设备的厂商控制器12对接,可以将各网络设备的配置信息,如设备的ip,与所述设备对应的采集通道、采集间隔、资源路径等发送给其厂商控制器12。厂商控制器12可以根据接收的配置信息对相应的网络设备进行配置。配置完成之后,各网络设备可以主动将其资源路径下的性能数据上送给其对应的采集通道。
一台网络设备有多个监控对象(如CPU、端口、内存等,由CI表示),每个监控对象又有多个指标(如,对于端口这一监控对象来说,有端口流入流量、端口流出流量、端口错包、端口丢包等指标,由KPI表示)。厂商控制器对网络设备配置之后,网络设备会将其资源路径下的所有性能数据全部上送给对应的采集通道,而这些数据对用户而言是冗余的。本实施方式的采集通道接收到对应的网络设备上送的性能数据之后,可以使其内的采集器集群根据器采集规则从网络设备上送的性能数据中筛选出设定设备的设定对象的设定指标的指标数据。所述采集规则可以设定获取采集通道对应的某个设备的某个监控对象的某个指标,采集器集群可以按照所述采集规则获取指标数据。
采集器集群131获取指标数据后,可以将所述指标数据存储到性能数据缓存132中。所述预处理器集群133可以从所述性能数据缓存132中获取所述指标数据,判断所述指标数据是否满足阈值告警规则,若满足,则根据所述指标数据生成告警事件。所述告警规则可以包括但不限于窗口阈值规则、非窗口阈值规则、突发阈值规则、期间阈值规则、基线阈值规则等。突发阈值规则可以设置为若某项指标超过或低于固定阈值,就生成触发告警的事件,期间阈值规则可以设置为若某项指标在规定时间内的累计值超过或低于固定阈值,就生成触发告警的事件,基线阈值规则可以设置为若某项指标的历史平均值加上该指标的当前值超过或低于固定阈值时,就进行告警。
在采集通道内,最小采集单元为采集任务,一个采集任务对应一个网络设备的一个监控对象的一个指标。系统自监控器14可以监控所述采集通道内的采集任务量,根据采集任务量来评估所述采集通道内的采集压力,根据评估结果提供配置建议,所述配置建议包括但不限于所述网络设备对应的采集通道,所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则等。
例如,网络设备1对应采集通道A,在采集通道A内的采集任务量大于设定阈值时,可以建议在采集通道A的基础上增加一个采集通道B,即将网络设备1配置为对应采集通道A和采集通道B,使用采集通道A和B对网络设备1上送的性能数据进行筛选。
再例如,网络设备1对应的采集通道为A,在采集通道A内的采集任务量小于设定阈值时,可以建议将新增加的网络设备2添加到采集通道A内,即将网络设备1和网络设备2对应的采集通道均配置为采集通道A,使用采集通道A对网络设备1、2上送的性能数据进行筛选。
又例如,在网络设备对应的采集通道A内的采集任务量到达瓶颈时,也可以通过提供调整采集通道A内的采集规则、阈值规则的建议,以调整采集通道A内的采集任务量和阈值告警规则。
本实施方式提供的监控系统可以灵活的调配采集资源和处理资源,便于监控大量的网络设备。
在本发明的一种实施方式中,系统自监控器15可以获取测试环境下测试得到的采集通道的最大任务量,若所述采集通道的采集任务量与最大任务量的比值大于设定阈值,则可以提供增加所述网络设备对应的采集通道数量的建议。例如,可以获取通过测试得到网络设备1对应的采集通道A内的最大任务量,并监控采集通道A的当前采集任务量,若当前采集任务量与最大任务量的比值大于设定阈值,就建议增加网络设备对应的采集通道数量。
进一步地,配置器15还可用于将所述采集规则、阈值告警规则分别发送给对应的消息队列;所述采集器集群131、预处理器集群133还用于分别监听对应的消息队列,分别获取更新的采集规则、阈值告警规则。
例如,配置器15可以配置采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则,将配置的采集规则下发给采集规则消息队列,采集器集群131可以监听所述采集规则消息队列,当监听到有新的采集规则下发时,可以获取新的采集规则,用新的采集规则来筛选数据。同样的,配置器15可以将配置的阈值告警规则下发给阈值告警规则消息队列,预处理器集群133可以监听所述阈值告警规则消息队列,当有新的阈值告警规则下发时,可以获取新的阈值告警规则,使用新的阈值告警规则来进行阈值告警。
通过以上方式,可以实现采集规则、阈值告警规则的热加载,无需启停采集器、预处理器即可加载新的采集规则和阈值告警规则,及时修正采集规则和阈值告警规则,实现灵活的数据采集和阈值告警。此外,可以将采集规则、阈值规则配置为Lua脚本,以保证每次下发的轻量性。
进一步地,也可以通过按照方式向采集器集群131下发发现规则,发现规则可以规定获取设定设备的设定资源数据。采集器集群131可以监听发现规则的消息队列,根据发现规则来获取设定设备的设定资源数据以供用户查看。通过配置发现规则,本实施方式可以灵活查看网络设备的各种资源数据,如CPU使用率、内存使用率等,便于配置网络设备对应的采集通道、采集规则、阈值告警规则等。
在本发明的一种实施方式中,采集通道13还可以包括负载均衡器,设置在采集通道内的各采集器之间,以使采集通道内的各采集器负载均衡,保证同一采集通道内的采集器形成准备模式。
在本发明的一种实施方式,监控系统10进一步地可以包括事件分析器16。事件分析器16可以对接一个告警平台,也可以对接多个告警平台。预处理器133生成告警事件后,可以将告警事件存储到告警事件缓存中,事件分析器16可以从告警事件缓存中获取告警事件,可以按照告警事件对应的告警平台的事件规则来丰富所述告警事件的告警级别、告警内容、配置信息等信息,生成符合告警平台格式的告警,将所述告警事件发送给对应的告警平台。
与上述实施方式中的采集规则、阈值告警规则相同,事件规则也可以热加载的方式加载到事件分析器上,事件分析器可以监听对应的消息队列来热加载对应的事件规则,从而,可以实现事件规则的实时修正。
对应于上述实施方式所述的监控系统,本发明实施方式的另一方面还提供了一种网络设备的监控方法。图2示出了根据本发明一种实施方式的监控方法的流程图。如图2所示,本实施方式所述的监控方法可以包括如下处理:
S101:设备管理器获取各网络设备的配置信息,将所述配置信息发送给各网络设备的厂商控制器,所述配置信息包括:与所述设备对应的采集通道;
S102:厂商控制器接收所述配置信息,根据所述配置信息配置相应的网络设备,以使所述网络设备向其对应的采集通道上送性能数据;
S103:所述采集通道的采集器集群根据采集规则从所述性能数据中筛选出设定设备的设定对象的设定指标的指标数据,将所述指标数据存储到性能数据缓存中,所述采集通道的预处理器集群用于从所述性能数据缓存中获取所述指标数据,判断所述指标数据是否满足阈值告警规则,若满足,则根据所述指标数据生成告警事件,其中,所述采集规则规定了需监控的设定设备、设定对象和设定指标,一个设备的一个对象的一个指标对应一条采集任务;
S104:系统自监控器监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议;
S105:根据所述配置建议通过配置器配置所述网络设备对应的采集通道、所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则;
其中,所述网络设备为支持telemetry协议的网络设备,所述采集器为telemetry采集器。
在本发明的一种实施方式中,所述监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议包括:
获取由测试环境测试得到的所述采集通道的最大任务量;
若所述采集通道的采集任务量与最大任务量的比值大于设定阈值,则提供增加所述网络设备对应的采集通道数量的建议。
在本发明的一种实施方式中,所述方法还包括:通过所述配置器配置所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则,将所述采集规则、阈值告警规则分别发送给对应的消息队列;
所述采集器集群、预处理器集群分别监听对应的消息队列,分别获取更新的采集规则、阈值告警规则。
在本发明的一种实施方式中,所述方法还包括:
通过负载均衡器使所述采集通道内的各采集器负载均衡。
在本发明的一种实施方式中,所述方法还包括:
事件分析器获取所述告警事件,根据告警平台的事件规则生成告警发送给对应的告警平台,以进行告警。
本领域技术人员可以理解的是,为了描述的方便和简洁,本实施方式所述的网络设备的监控方法可以参照上述实施方式所述的网络设备的监控系统的对应过程,在此不再赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分所述的方法。
本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的保护范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。

Claims (10)

1.一种网络设备的监控系统,其特征在于,所述监控系统包括:
设备管理器,用于获取各网络设备的配置信息,将所述配置信息发送给各网络设备的厂商控制器,所述配置信息包括:与所述设备对应的采集通道;
厂商控制器,用于接收所述配置信息,根据所述配置信息配置相应的网络设备,以使所述网络设备向其对应的采集通道上送性能数据;
采集通道,包括采集器集群、性能数据缓存和预处理器集群,所述采集器集群用于根据采集规则从所述性能数据中筛选出设定设备的设定对象的设定指标的指标数据,将所述指标数据存储到性能数据缓存中,所述预处理器集群用于从所述性能数据缓存中获取所述指标数据,判断所述指标数据是否满足阈值告警规则,若满足,则根据所述指标数据生成告警事件以进行告警,其中,所述采集规则规定了需监控的设定设备、设定对象和设定指标,一个设备的一个对象的一个指标对应一条采集任务;
系统自监控器,用于监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议;
配置器,用于根据所述配置建议配置所述网络设备对应的采集通道、所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则;
其中,所述网络设备为支持telemetry协议的网络设备,所述采集器为telemetry采集器。
2.根据权利要求1所述的监控系统,其特征在于,所述监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议包括:
获取由测试环境测试得到的所述采集通道的最大任务量;
若所述采集通道的采集任务量与最大任务量的比值大于设定阈值,则提供增加所述网络设备对应的采集通道数量的建议。
3.根据权利要求1所述的监控系统,其特征在于,
所述配置器还用于将所述采集规则、阈值告警规则分别发送给对应的消息队列;
所述采集器集群、预处理器集群还用于分别监听对应的消息队列,分别获取更新的采集规则、阈值告警规则。
4.根据权利要求1所述的监控系统,其特征在于,所述采集通道还包括:
负载均衡器,用于使所述采集通道内的各采集器负载均衡。
5.根据权利要求1所述的监控系统,其特征在于,所述监控系统还包括:
事件分析器,用于获取所述告警事件,根据告警平台的事件规则生成告警发送给对应的告警平台,以进行告警。
6.一种网络设备的监控方法,其特征在于,所述方法包括:
设备管理器获取各网络设备的配置信息,将所述配置信息发送给各网络设备的厂商控制器,所述配置信息包括:与所述设备对应的采集通道;
厂商控制器接收所述配置信息,根据所述配置信息配置相应的网络设备,以使所述网络设备向其对应的采集通道上送性能数据;
所述采集通道的采集器集群根据采集规则从所述性能数据中筛选出设定设备的设定对象的设定指标的指标数据,将所述指标数据存储到性能数据缓存中,所述采集通道的预处理器集群用于从所述性能数据缓存中获取所述指标数据,判断所述指标数据是否满足阈值告警规则,若满足,则根据所述指标数据生成告警事件以进行告警,其中,所述采集规则规定了需监控的设定设备、设定对象和设定指标,一个设备的一个对象的一个指标对应一条采集任务;
系统自监控器监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议;
根据所述配置建议通过配置器配置所述网络设备对应的采集通道、所述采集通道内采集器集群的采集规则和预处理器集群的阈值告警规则;
其中,所述网络设备为支持telemetry协议的网络设备,所述采集器为telemetry采集器。
7.根据权利要求6所述的监控方法,其特征在于,所述监控所述采集通道内的采集任务量,根据所述采集任务量评估所述采集通道的采集压力,根据评估结果提供配置建议包括:
获取由测试环境测试得到的所述采集通道的最大任务量;
若所述采集通道的采集任务量与最大任务量的比值大于设定阈值,则提供增加所述网络设备对应的采集通道数量的建议。
8.根据权利要求6所述的监控方法,其特征在于,所述方法还包括:
所述配置器将所述采集规则、阈值告警规则分别发送给对应的消息队列;
所述采集器集群、预处理器集群分别监听对应的消息队列,分别获取更新的采集规则、阈值告警规则。
9.根据权利要求6所述的监控方法,其特征在于,所述方法还包括:
通过负载均衡器使所述采集通道内的各采集器负载均衡。
10.根据权利要求6所述的监控方法,其特征在于,所述方法还包括:
事件分析器获取所述告警事件,根据告警平台的事件规则生成告警发送给对应的告警平台,以进行告警。
CN201911408769.6A 2019-12-31 2019-12-31 网络设备的监控系统及方法 Active CN111200526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911408769.6A CN111200526B (zh) 2019-12-31 2019-12-31 网络设备的监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911408769.6A CN111200526B (zh) 2019-12-31 2019-12-31 网络设备的监控系统及方法

Publications (2)

Publication Number Publication Date
CN111200526A true CN111200526A (zh) 2020-05-26
CN111200526B CN111200526B (zh) 2022-09-16

Family

ID=70746252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911408769.6A Active CN111200526B (zh) 2019-12-31 2019-12-31 网络设备的监控系统及方法

Country Status (1)

Country Link
CN (1) CN111200526B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112367224A (zh) * 2020-11-11 2021-02-12 全球能源互联网研究院有限公司 一种终端监测装置、系统及方法
CN112596975A (zh) * 2020-12-15 2021-04-02 中国建设银行股份有限公司 对网络设备进行监控处理的方法、系统、设备和存储介质
CN113612622A (zh) * 2021-06-28 2021-11-05 苏州浪潮智能科技有限公司 一种网络操作系统下各模块告警方法、装置
CN114070718A (zh) * 2021-10-19 2022-02-18 深圳市有方科技股份有限公司 一种告警方法、装置和存储介质
CN114338484A (zh) * 2021-12-29 2022-04-12 中国电信股份有限公司 光网络性能数据融合采集方法、装置、设备和存储介质
CN114428683A (zh) * 2020-10-29 2022-05-03 北京科东电力控制系统有限责任公司 调度自动化系统运行状态信息采集方法、存储介质和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130157571A1 (en) * 2011-12-19 2013-06-20 Dene Robert Iliff System for wireless remote monitoring of alarm events of a medical device and corresponding patient
CN105763851A (zh) * 2016-04-05 2016-07-13 赣州市金电电子设备有限公司 基于电子政务网络平台的森林防火视频监控预警系统
CN106844165A (zh) * 2016-12-16 2017-06-13 华为技术有限公司 告警方法及装置
CN108762222A (zh) * 2018-07-31 2018-11-06 河南中烟工业有限责任公司 一种多通道设备网络联控方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130157571A1 (en) * 2011-12-19 2013-06-20 Dene Robert Iliff System for wireless remote monitoring of alarm events of a medical device and corresponding patient
CN105763851A (zh) * 2016-04-05 2016-07-13 赣州市金电电子设备有限公司 基于电子政务网络平台的森林防火视频监控预警系统
CN106844165A (zh) * 2016-12-16 2017-06-13 华为技术有限公司 告警方法及装置
CN108762222A (zh) * 2018-07-31 2018-11-06 河南中烟工业有限责任公司 一种多通道设备网络联控方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114428683A (zh) * 2020-10-29 2022-05-03 北京科东电力控制系统有限责任公司 调度自动化系统运行状态信息采集方法、存储介质和设备
CN112367224A (zh) * 2020-11-11 2021-02-12 全球能源互联网研究院有限公司 一种终端监测装置、系统及方法
CN112596975A (zh) * 2020-12-15 2021-04-02 中国建设银行股份有限公司 对网络设备进行监控处理的方法、系统、设备和存储介质
CN113612622A (zh) * 2021-06-28 2021-11-05 苏州浪潮智能科技有限公司 一种网络操作系统下各模块告警方法、装置
CN113612622B (zh) * 2021-06-28 2023-01-24 苏州浪潮智能科技有限公司 一种网络操作系统下各模块告警方法、装置
CN114070718A (zh) * 2021-10-19 2022-02-18 深圳市有方科技股份有限公司 一种告警方法、装置和存储介质
CN114070718B (zh) * 2021-10-19 2023-11-21 深圳市有方科技股份有限公司 一种告警方法、装置和存储介质
CN114338484A (zh) * 2021-12-29 2022-04-12 中国电信股份有限公司 光网络性能数据融合采集方法、装置、设备和存储介质
CN114338484B (zh) * 2021-12-29 2024-05-24 中国电信股份有限公司 光网络性能数据融合采集方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN111200526B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN111200526B (zh) 网络设备的监控系统及方法
US8180922B2 (en) Load balancing mechanism using resource availability profiles
US9225554B2 (en) Device-health-based dynamic configuration of network management systems suited for network operations
US8635376B2 (en) Computer system input/output management
Trihinas et al. Jcatascopia: Monitoring elastically adaptive applications in the cloud
US20140215077A1 (en) Methods and systems for detecting, locating and remediating a congested resource or flow in a virtual infrastructure
EP3361703B1 (en) Load balancing method, related device and system
US20130212257A1 (en) Computer program and monitoring apparatus
CN107544832A (zh) 一种虚拟机进程的监控方法、装置和系统
US9772920B2 (en) Dynamic service fault detection and recovery using peer services
US20040083246A1 (en) Method and system for performance management in a computer system
US20230412674A1 (en) Topology-aware load balancing method and apparatus, and computer device
CN111865817A (zh) 遥测采集器负载均衡管控方法、装置、设备及存储介质
CN111339466A (zh) 接口管理方法、装置、电子设备及可读存储介质
US11423326B2 (en) Using machine-learning methods to facilitate experimental evaluation of modifications to a computational environment within a distributed system
WO2021249546A1 (zh) 网络监测方法、电子设备及存储介质
EP1622310B1 (en) Administration method and system for network management systems
WO2023116225A1 (zh) 一种网络巡检方法、网络设备及网络管理设备
CN116708217A (zh) 一种数据中心设备监控方法、系统、电子设备及存储介质
CN112838942A (zh) 网络运维方法、电子设备以及存储介质
CN106686082B (zh) 存储资源调整方法及管理节点
CN115712529A (zh) 一种边缘智能设备测试方法、装置、设备及存储介质
CN115048260A (zh) 一种基于云计算的核电厂PaaS平台资源配额监控方法和系统
CN114090382B (zh) 超融合集群健康巡检方法和装置
Kontoudis et al. A statistical approach to virtual server resource management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant