CN106961352B - 监控系统及监控方法 - Google Patents

监控系统及监控方法 Download PDF

Info

Publication number
CN106961352B
CN106961352B CN201710198716.0A CN201710198716A CN106961352B CN 106961352 B CN106961352 B CN 106961352B CN 201710198716 A CN201710198716 A CN 201710198716A CN 106961352 B CN106961352 B CN 106961352B
Authority
CN
China
Prior art keywords
early warning
monitoring
rule
monitored object
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710198716.0A
Other languages
English (en)
Other versions
CN106961352A (zh
Inventor
陈仰文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen heliyunchuang Information Technology Co.,Ltd.
Original Assignee
Kang Chaohong
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kang Chaohong filed Critical Kang Chaohong
Priority to CN201710198716.0A priority Critical patent/CN106961352B/zh
Publication of CN106961352A publication Critical patent/CN106961352A/zh
Application granted granted Critical
Publication of CN106961352B publication Critical patent/CN106961352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0609Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on severity or priority
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions

Abstract

本发明实施例公开了一种监控系统及监控方法,所述监控系统包括:后台管理子系统,用于配置监控对象的监控规则及预警规则;其中,预警规则至少包括:预警级别以及与预警级别对应的预警方式;数据采集子系统,用于根据监控规则对S监控对象进行数据采集,以获取监控数据;预警子系统,用于根据预警规则,确定监控数据是否触发了预警及预警的预警参数,并采用与预警级别对应的预警方式发送预警信息。本发明实施例提供的技术方案,在需要预警时会采用与预警级别对应的预警方式进行预警,相对于采用统一单一预警方式能够通过预警方式区分预警的严重程度,可以减少管理人员对严重预警的遗漏现象,提升了监控系统的监控性能。

Description

监控系统及监控方法
技术领域
本发明涉及信息技术领域,尤其涉及一种监控系统及监控方法。
背景技术
随着信息技术的发展,有一台或多台服务器及一个或多个数据库组成的信息系统。为了保证信息系统的安全,通常会设置保证该信息系统安全的监控系统。该监控系统一般监控信息系统的运行状态,一旦监测到异常的指标,就给管理人员发送邮件或短息。
现在发现,一方面监控系统一旦发现异常就给监管人员的邮箱或电子设备发送邮件或短信,会导致管理人员频繁的收到短信和/或邮件;这样就导致了对管理人员的信息骚扰。另一方面由于这些短信和/或邮件大多的时候提示的小问题。长此以往管理人员收到预警短信和/或邮件之后,就习惯性的认为是不着急的小预警,从而不重视。这样的话,管理人员就有很高的概率漏掉严重的预警短信和/或邮件,导致监控系统不能正常的发挥监控作用。
发明内容
有鉴于此,本发明实施例提一种监控系统及监控方法,以解决上述问题。
本发明实施例的技术方案是这样实现的:
本发明实施例第一方面提供一种监控系统,包括:
后台管理子系统,用于配置监控对象的监控规则及预警规则;其中,所述预警规则至少包括:预警级别以及与预警级别对应的预警方式;
数据采集子系统,用于根据所述监控规则对所述监控对象进行数据采集,以获取监控数据;
预警子系统,用于根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数,并当所述监控数据触发了预警时,采用与所述预警级别对应的预警方式发送预警信息,其中,所述预警参数包括所述预警级别及所述预警方式。
基于上述方案,所述预警规则还包括:预警调整条件;
所述预警子系统,还用于根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件,当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数。
基于上述方案,所述预警子系统,具体用于根据所述预警规则及所述监控数据,确定所述监控对象是否处于数据备份状态和/或设备重新部署状态,当所述监控对象处于所述数据备份状态和/或所述设备重新部署状态,则确定所述监控对象满足所述预警调整条件,降低所述监控数据触发的预警的所述预警级别,或,屏蔽所述监控数据触发的预警。
基于上述方案,所述后台管理子系统,用于管理信息系统的节点树并根据所述节点树配置所述监控对象的监控规则及预警规则,其中,所述节点树中一个节点定于一个所述监控对象,并存储有所述监控对象的监控规则和/或预警规则;
所述数据采集子系统,还用于监控所述信息系统中的所述节点树是否发生了预设变化;若发生了预设变化,则重新获取所述监控对象的监控规则;和/或,所述预警子系统,还用于当所述节点树发生了所述预设变化,重新获取预警规则。
基于上述方案,所述数据采集子系统,具体用于根据所述监控规则,采集获得监控数据,将所述监控数据存储预定数据库,将所述监控对象的设备信息发送给预定消息队列;
所述预警子系统,具体用于从所述预定消息队列接收所述设备信息,根据所述设备信息从所述预定数据库读取所述监控对象的监控数据。
本发明实施例第二方面提供一种监控方法,包括:
配置监控对象的监控规则及预警规则;其中,所述预警规则至少包括:预警级别以及与预警级别对应的预警方式;
根据所述监控规则对所述监控对象进行数据采集,以获取监控数据;
根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数,其中,所述预警参数包括所述预警级别及所述预警方式;
当所述监控数据触发了预警时,采用与所述预警级别对应的预警方式发送预警信息。
基于上述方案,所述预警规则还包括:预警调整条件;
所述方法还包括:
根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件;
当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数。
基于上述方案,所述根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件,包括:
根据所述预警规则及所述监控数据,确定所述监控对象是否处于数据备份状态和/或设备重新部署状态;
所述当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数,包括:
当所述监控对象处于所述数据备份状态和/或所述设备重新部署状态,则确定所述监控对象满足所述预警调整条件,降低所述监控数据触发的预警的所述预警级别,或,屏蔽所述监控数据触发的预警。
基于上述方案,所述方法还包括:
管理信息系统的节点树并根据所述节点树配置所述监控对象的监控规则及预警规则,其中,所述节点树中一个节点定于一个所述监控对象,并存储有所述监控对象的监控规则和/或预警规则;
监控所述信息系统中的所述节点树是否发生了预设变化;
若发生了预设变化,则数据采集子系统重新获取所述监控对象的监控规则,和/或,预警子系统新获取预警规则。
基于上述方案,所述根据所述监控规则对所述监控对象进行数据采集,以获取监控数据,包括:
根据所述监控规则,采集获得监控数据;
将所述监控数据存储预定数据库;
将所述监控对象的设备信息发送给预定消息队列;
所述根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数,包括:
从所述预定消息队列接收所述设备信息,根据所述设备信息从所述预定数据库读取所述监控对象的监控数据。
本发明实施例中提供的监控系统及监控方法,后台管理子系统内配置的预警规则,包括预警级别及与预警级别对应的预警方式。这样的话,后续预警子系统判断出需要预警时,会采用与监测到的异常的严重程度相适配的预警方式,向管理人员提供的通信地址或设备发送预警信息,而不是所有的预警采用单一预警方式发送预警信息。故相对于现有技术,可以解决现有监控该系统采用单一预警方式发送预警信息,导致管理人员的一个账号出现成堆的预警信息造成的信息干扰问题。同时采用不同的预警方式进行预警信息的发送,方便管理人员可以根据预警方式就知道当前检测到异常的严重程度,从而做出相应的反馈;且可以对于表征异常程度较为预警方式进行重点查看,从而可以减少管理人员对异常程度较大的预警信息的遗漏,从而提升监控系统的监控性能。
附图说明
图1为本发明实施例提供的第一种监控系统的结构示意图;
图2为本发明实施例提供的一种可用于监控系统的电子设备的结构示意图;
图3为本发明实施例提供的第二种监控系统的结构示意图;
图4为本发明实施例提供的第一种监控方法的流程示意图;
图5为本发明实施例提供的第二种监控方法的流程示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明的技术方案,并不用于限定本发明的保护范围。
如图1所示,本实施例提供一种监控系统,包括:
后台管理子系统110,用于配置监控对象的监控规则及预警规则;其中,所述预警规则至少包括:预警级别以及与预警级别对应的预警方式;
数据采集子系统120,用于根据所述监控规则对所述监控对象进行数据采集,以获取监控数据;
预警子系统130,用于根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数,并当所述监控数据触发了预警时,采用与所述预警级别对应的预警方式发送预警信息,其中,所述预警参数包括所述预警级别及所述预警方式。
本实施例提供一种监控系统,该系统至少包括三个子系统。分别是后台管理子系统110、数据采集子系统120及预警子系统130。所述监控子系统中每一个子系统都是有一台或多台的服务器或计算机等电子设备构成。
图2所示为本发明实施例提供的一种电子设备的结构示意图,所述电子设备200包括:处理器204、收发机202、存储器203和总线接口.,所述总线接口,用于处理器、存储器及收发机等电子设备的内部通信。所述收发机202用于电子设备之间的信息交互。所述存储器203,用于存储有可执行代码,所述处理器204通过执行所述代码,可以实现监控规则及预警规则的配置,或,监控数据的采集,和/或预警信息的发送。
这里的处理器204,可为中央处理器、数字信号处理器、应用处理器、可编程阵列、微处理器或专用集成电路等。
在本实施例中所述后台管理子系统110,会分别与所述数据采集子系统120及预警子系统相连,所述后台管理子系统110内配置有监控规则及预警规则。
所述监控规则,用于所述数据采集子系统120对监控对象进行监控及数据采集。所述预警规则,用于预警子系统130,根据所述数据采集子系统120采集的监控数据确定是否需要预警,并根据预警级别采用不同的预警方式向管理人员给出的通信地址或通信设备发送预警信息。
在本实施例中所述监控规则可包括:各种监控参数。所述监控参数可包括:对象参数、频次参数、指标参数等各种参数。
所述对象参数,指示了需要监控的监控对象,可包括:监控对象的名称、网络协议(IP)地址或媒体访问控制(MAC)地址及访问路径中的一项或多项。所述数据采集子系统120,根据所述对象参数,可以确定出当前需要监控信息系统中哪一台或几台服务器,并可以基于所述IP地址、MAC地址及访问路径中的至少一项,可以与监控对象建立连接,从而方便所述访问子系统从所述监控对象中采集数据,从而进行监控对象的运行状况的监控。
所述频次参数,可包括:数据采集间隔、监控间隔等参数。所述数据采集间隔可为:数据采集子系统120根据监控结果,输出监控数据的周期或时间段。所述监控间隔可为所述数据采集子系统120,查看所述监控对象的时间间隔或周期等。大多数的情况下,信息系统是会处于正常运行状态,通常所述数据采集间隔的时长,可稍微大于所述监控间隔等,以减少所述数据采集子系统120的数据采集次数,减少不必要的采集数据的输出。
在不同的时间段,所述数据采集子系统120对监控对象的监控间隔或数据采集间隔可以不同。例如,信息系统可以分为闲时和忙时,闲时出现异常状况的概率更小,为了减少监控系统的负载和开销,在闲时的数据采集间隔和/或监控间隔对应的时长,都可以小于所述信息系统在忙时的数据采集间隔和/或监控间隔。这里的信息系统是处于闲时还是忙时,可以根据所述信息系统在各个不同各时段的负载率来确定。例如,基于一段时间的统计,信息系统挂在夜间12点以后的负载率低于预定阈值,则该时段可为闲时,否则可认为是忙时。
所述指标参数,可用于指示所述数据采集子系统120采集的监控对象的各种指标参数,例如,可包括:中央处理器(CPU)的负载率、剩余存储资源,数据输出量、数据写入量等参数,所述指标参数可包括多种,在此就不一一限定了。
在本实施例中所述预警子系统130会根据数据采集子系统120采集的数据进行判断,判断是否需要预警,预警级别,及预警方式等。在本实施例中监控数据触发的预警根据异常的严重程度分别不同预警级别。不同的预警级别对应的预警方式不同。假设,预警级别越高,对应的异常的严重程度越高,则采用的预警方式可为管理人员更容易查看的预警方式。
在本实施例中所述预警方式包括:邮件预警、短信预警及即时通信预警。
所述邮件预警,为采用邮件发送预警信息。
所述短信预警,为采用短信发送预警信息。
所述即时通信预警,为通过即时通信消息发送预警信息。这里的即时通信消息可包括:微信消息、脸书消息或QQ消息等。
在本实施例中会根据监控数据触发的预警的严重程度不同,被划分到不同的预警级别,并采用对应于预警级别的预警方式发送预警信息。这样的话,不会产生所有的预警都采用单一方式,而管理人员无法通过预警方式确定当前告警的严重程度,进而导致的不重视,从而降低了遗漏掉严重预警导致的信息系统异常未被及时监控或处理的概率,从而提升了监控系统的监控性能。且在本实施例中根据预警级别,采用对应的预警方式进行预警,同时还可以减少大量的预警信息采用单一预警方式,导致管理人员的邮箱、短信箱或即时通信接收到大量信息,形成的对管理的信息骚扰的问题。
在本实施例中所述短信预警对应的预警级别最高,所述邮件预警对应的预警级别次之,所述即时通信预警对应的预警级别再次之。
在一些实施例中所述预警子系统130,还可用于将预定个数预警级别为指定范围的预警级别对应预警信息,整合到一条预警消息中通过对应的预警方式发送;或者,将预定时间内预警级别为所述指定范围内的预警信息,整合到一条预警消息中通过对应的预警方式发送。这样相对于触发了一次预警,就发送预警信息,显然可以减少预警信息的条数,从而可以减少管理人员接收到预警信息的条数,从而可以减少信息干扰。在本实施例中所述指定范围的预警级别均为不太严重的,暂时不会影响信息系统的正常运行的预警。
可选地,所述预警规则还包括:预警调整条件;
所述预警子系统130,还用于根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件,当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数。
当信息系统处于一些特定状况下,信息系统的正常运行也可能触发预警。例如,当前信息系统的两台设备之间进行数据备份,这时就可能导致被监控的监控对象的数据迁移量大于预警阈值,则可能触发预警。在本实施例中为了排除了这种错误的预警,在本实施例中所述预警规则中还包括预警调整条件。所述预警子系统130在发送预警之前,还会根据所述预警规则及监控数据,确定监控对象的当前运行状况是否满足预警调整条件。例如,信息统统内两台设备之间进行数据备份,则可以根据监控数据中数据迁出的地址,确定出信息系统锅内的数据迁移备份,还是被系统外的设备频繁访问或病毒式访问。
在本实施例中预警子系统130,根据监控数据确定出满足所述预警条件时,会修订修正数据触发的预警的预警参数。这里的预警参数可包括前述的预警级别和/或预警方式。具体的,可包括:降低预警级别,或直接调整预警方式。在一些实施例中还可以直接屏蔽该预警。
可选地,所述预警子系统130,具体用于根据所述预警规则及所述监控数据,确定所述监控对象是否处于数据备份状态和/或设备重新部署状态,当所述监控对象处于所述数据备份状态和/或所述设备重新部署状态,则确定所述监控对象满足所述预警调整条件,降低所述监控数据触发的预警的所述预警级别,或,屏蔽所述监控数据触发的预警。
在本实施例中可以通过预警的屏蔽,或预警级别的降低,减少预警的错误率或对管理人员的信息干扰。
可选地,所述后台管理子系统110,用于管理信息系统的节点树并根据所述节点树配置所述监控对象的监控规则及预警规则,其中,所述节点树中一个节点定于一个所述监控对象,并存储有所述监控对象的监控规则和/或预警规则;
所述数据采集子系统120,还用于监控所述信息系统中的所述节点树是否发生了预设变化;若发生了预设变化,则重新获取所述监控对象的监控规则。
在本实施例中所述后台管理子系统110,还将用于管理信息系统中每一个节点,这里的一个节点可以对应于一个监控对象,一个监控对象可对应于一台或多台物理设备,或对应于一台物理设备的一项或多项功能。当所述节点树发生了变化,则信息系统的设备之间的架构或功能发生了变化,为了更好的监控信息系统,则对应的监控规则会发生变化。故在本实施例中所述后台管理子系统110,会管理信息系统的节点树,并基于节点树重新配置监控规则。
在本实施例中所述数据采集子系统120,会监控所述信息系统中的节点树是否发生了变化,若发生了变化则将获取新的监控规则。
在一些实施例中,若所述节点树发生了变化,所述后台管理子系统110重新配置了监控规则,则会将重新配置的额监控规则,写入到指定数据库。对应地,所述数据采集子系统120会从所述指定数据库,读取新的监控规则。
在一些实施例中,所述后台管理子系统110在更新了监控规则之后,会主动将新的监控规则推送给所述数据采集子系统120,方便所述数据采集子系统120及时根据新的监控规则,对信息系统进行监控。
在一些实施例中,所述预警子系统130,还用于在节点树发生了预设变化时,从新获取预警规则。这里的预警子系统130,重新获取所述预警规则,可以直接从后台管理子系统110中读取,或从所述执行数据库中读取,或接收所述后台管理子系统110推送的预警规则。
但是节点树发生了变化,则可能仅有监控规则发生了变化,预警规则未发生变化,也有可能预警规则发生了变化,而监控规则保持不变;在有一些实施例中所述监控规则和所述预警规则都发生了相应变化。
在一些实施例中,所述数据采集子系统120,具体用于根据所述监控规则,采集获得监控数据,将所述监控数据存储预定数据库,将所述监控对象的设备信息发送给预定消息队列;
所述预警子系统130,具体用于从所述预定消息队列接收所述设备信息,根据所述设备信息从所述预定数据库读取所述监控对象的监控数据。
在本实施例中所述预定消息队列可为先进先出队列,这样的话,所述预警子系统130,会顺序读取到需要判断当前是否异常的监控对象的设备信息,以顺序从预定数据库读取监控数据。
在一些场景中所述预定消息队列分为包括多个,不同类型的监控对象的设备信息,存储到对应类型的预定消息队列中,这样方便所述预警子系统130,可以根据可能发生的异常的严重程度,优先处理哪一个预定消息队列中携带的设备信息的异常判断。
在一些实施例中所述预定消息队列可为先进先出队列,在另一些实施例中,所述预定消息队列可为一个消息暂存通道,至于所述预警子系统130具体如何读取所述预定消息队列中的设备信息,可以由所述预警子系统130自行根据读取规则确定。总之,所述预定消息队列不局限于先进先出队列。例如,所述预定消息队列还可为Kafka队列。
如图3所示,以下结合上述任意实施例提供一个具体示例,包括:
在后台管理子系统对需要监控的服务器进行配置服务器的相关信息,同时配置该服务器的预警规则。此时,后台管理子系统会同时去变更Zookeeper的节点树。这里的相关信息可包括前的监控规则。
数据采集子系统时刻在监听Zookeeper的节点树的变化,当有新增需要监控的服务器的信息在Zookeeper上有变化的时候,则会监听到该事件,同时去数据库获取被监控的服务器的设备信息,根据该设备信息,按一定的频率采集被监控服务器的监控指标获得监控数据,同时将该监控数据存储到MongoDB数据库。这里的MongoDB数据库可为前述预定数据库。
当数据采集子系统采集完数据后,根据获取到的被监控服务器的信息,如果该服务器需要去判断预警,则发送消息到消息队列Kafka中。
预警子系统是Kafka消息队列的消费者,当Kafka中有消息过来的时候,会根据消息队列中的被监控服务器信息,会去Mysql数据库获取被监控服务器配置的预警规则,同时会再去MongoDB中获取被监控服务器的监控指标数据,之后根据配置的预警规则,对这些指标数据进行判断,当这些数据满足了需要发送的规则时,则根据配置的相关预警规则发送方式进行消息的预警。这里的发送方式可包括:短信、邮件及微信等。根据预警级别以对应的预警方式发送预警信息到不同人员,方便灵活。通过预警规则的配置,减少之前全部通过短信发送不同严重程度的预警信息,在本实施例中仅对需要预警的异常发送必要的预警信息,节省了短信的费用。通过预警规则的配置,配置不同时段使用不同预警规则,以区别应对特殊时刻时候的情形(数据库备份的时候),使系统预警更加准确。
如图4所示,本实施例提供一种监控方法,包括:
步骤S110:配置监控对象的监控规则及预警规则;其中,所述预警规则至少包括:预警级别以及与预警级别对应的预警方式;
步骤S120:根据所述监控规则对所述监控对象进行数据采集,以获取监控数据;
步骤S130:根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数;其中,所述预警参数包括所述预警级别及所述预警方式;
步骤S140:当所述监控数据触发了预警时,采用与所述预警级别对应的预警方式发送预警信息。
本实施例提供的监控方法可为运行上述监控系统中的方法。
在本实施例中步骤S110配置监控对象的监控规则,及基于监控数据进行预警的预警规则。
在本实施例中配置监控规则及预警规则时,可包括:人机交互界面或从其他设备接收所述监控规则及预警规则。在一些实施例中,所述步骤S110还可包括:利用配置代码自动根据信息系统的节点树或设备部署架构及功能部署,自动配置所述监控规则及预警规则。
在步骤S120中采集子系统会根据监控规则对监控搞对象进行监控,并进行数据采集,从而获得所述监控数据。
在步骤S130中会基于预警规则,处理所述监控数据,从而确定出是否需要预警,预警的预警级别及发送预警的预警方式等。
在步骤S140中会在需要预警时,采用与预警级别对应的预警方式发送预警信息;而非对于所有预警采用单一预警方式进行预警。
在本实施例中所述预警级别及预警方式,都是与预警对应的可能的信息异常的严重程度成正比的。
可选地,如图5所示,所述预警规则还包括:预警调整条件;
所述方法还包括:
步骤S101:根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件;
步骤S102:当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数。
在本实施例中还会判断所述监控对象的当前运行状况,时可能导致预警但是却是监控对象正常运行的一些应用场景,这些应用场景即为满足所述预警调整条件的应用场景。在步骤S102中会在满足预警调整条件时,修正的监控数据触发的预警的预警参数。这里的预警参数包括预警级别。若预警级别被调为0,则可认为不用预警,相当于屏蔽了所述监控数据触发的预警。这里的预警参数还可包括:预警方式。例如,若不修正之前,预警方式为短信预警,这样管理人员接收到短信会认为是监控到很严重的异常,在修正之后,预警方式可为微信预警,管理人员接收到微信会认为监控的异常很小,暂时不会影响信息系统给的正常运行,可以属于正常指标波动,可以再观察一段时间再做出决策。
可选地,所述步骤S101可包括:
根据所述预警规则及所述监控数据,确定所述监控对象是否处于数据备份状态和/或设备重新部署状态;
所述步骤S102可包括:当所述监控对象处于所述数据备份状态和/或所述设备重新部署状态,则确定所述监控对象满足所述预警调整条件,降低所述监控数据触发的预警的所述预警级别,或,屏蔽所述监控数据触发的预警。
在本实施例中至少数据备份及设备重新部署,属于触发的预警进行预警参数调整的应用场景。通过上述处理,则后续在进行信息系统内的数据备份和/或设备重新部署时,管理人员会接收到不到预警或接收不到严重预警,一方面减少对管理人员的信息干扰,另一方面提升了预警的精确性。
在一些实施例中,所述方法还包括:
管理信息系统的节点树并根据所述节点树配置所述监控对象的监控规则及预警规则,其中,所述节点树中一个节点定于一个所述监控对象,并存储有所述监控对象的监控规则和/或预警规则;
监控所述信息系统中的所述节点树是否发生了预设变化;
若发生了预设变化,则数据采集子系统重新获取所述监控对象的监控规则,和/或,预警子系统重新获取预警规则。
在本实施例中所述信息系统的节点树,在节点树发生了变化,则相当于信息系统的架构和/或功能部署发生了变化,则为了确保监控系统的监控精确性,可能需要调整监控规则。在本实施例中若信息系统给的节点树发送了变化,则预警子系统会重新获取监控对象的监控规则,从而确保监控的精确性。
对应地,在一些实施例中节点树发生了变化,对应的预警规则也可能会发生变化,则所述预警子系统130,会重新获取预警规则,从而实现精确的预警。
在一些实施例中,所述步骤S120可包括:
根据所述监控规则,采集获得监控数据;
将所述监控数据存储预定数据库;
将所述监控对象的设备信息发送给预定消息队列;
所述步骤S130可包括:
从所述预定消息队列接收所述设备信息,根据所述设备信息从所述预定数据库读取所述监控对象的监控数据。
在本实施例中采集子系统会将采集的需要判断是否异常发送给预警子系统判断时,会将对应的监控数据存储到预定数据库,并将对应的设备信息发送给消息队列,这样预警子系统接收到所述预定消息队列传输的设备信息之后,会以该设备信息为查询依据,查询所述预定数据库,从而获得对应的监控数据,进行异常判断,从而确定是否需要预警。
在一些实施例中,所述采集子系统具有一定的预判功能,采集子系统根据预判规则,对自己采集的监控数据,若无法明确出与判处是否发生了异常,则将所述监控数据的监控对象的设备信息推送到所述预定消息队列中,这样预警子系统中需要处理的数据就大大降低了。通过采集子系统的初步处理,可以减少预定消息队列中的设备消息,从而提升正常异常被判断出需要预警的时延减小了。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种监控系统,其特征在于,包括:
后台管理子系统,用于配置监控对象的监控规则及预警规则;其中,所述预警规则至少包括:预警级别以及与预警级别对应的预警方式;
数据采集子系统,用于根据所述监控规则对所述监控对象进行数据采集,以获取监控数据;
预警子系统,用于根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数,并当所述监控数据触发了预警时,采用与所述预警级别对应的预警方式发送预警信息,其中,所述预警参数包括所述预警级别及所述预警方式;
其中,所述数据采集子系统,还用于根据预判规则,确定所述监控数据是否异常;
所述预警子系统,还用于所述预警规则还包括预警调整条件时,根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件,当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数;
所述后台管理子系统,还用于管理信息系统的节点树并根据所述节点树配置所述监控对象的预警规则,其中,所述节点树中一个节点对应于一个所述监控对象,并存储有所述监控对象的预警规则;
所述数据采集子系统,还用于监控所述信息系统中的所述节点树是否发生了预设变化;所述预警子系统,还用于当所述节点树发生了所述预设变化,重新获取预警规则。
2.根据权利要求1所述的系统,其特征在于,
所述预警子系统,具体用于根据所述预警规则及所述监控数据,确定所述监控对象是否处于数据备份状态和/或设备重新部署状态,当所述监控对象处于所述数据备份状态和/或所述设备重新部署状态,则确定所述监控对象满足所述预警调整条件,降低所述监控数据触发的预警的所述预警级别,或,屏蔽所述监控数据触发的预警。
3.根据权利要求1或2所述的系统,其特征在于,
所述后台管理子系统,用于管理信息系统的节点树并根据所述节点树配置所述监控对象的监控规则,其中,所述节点树中一个节点对应于一个所述监控对象,并存储有所述监控对象的监控规则;
所述数据采集子系统,还用于监控所述信息系统中的所述节点树是否发生了预设变化;若发生了预设变化,则重新获取所述监控对象的监控规则。
4.根据权利要求1或2所述的系统,其特征在于,
所述数据采集子系统,具体用于根据所述监控规则,采集获得监控数据,将所述监控数据存储预定数据库,将所述监控对象的设备信息发送给预定消息队列;
所述预警子系统,具体用于从所述预定消息队列接收所述设备信息,根据所述设备信息从所述预定数据库读取所述监控对象的监控数据。
5.一种监控方法,其特征在于,包括:
配置监控对象的监控规则及预警规则;其中,所述预警规则至少包括:预警级别以及与预警级别对应的预警方式;
根据所述监控规则对所述监控对象进行数据采集,以获取监控数据;
根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数,其中,所述预警参数包括所述预警级别及所述预警方式;
当所述监控数据触发了预警时,采用与所述预警级别对应的预警方式发送预警信息;
所述方法还包括:所述预警规则还包括:预警调整条件;
根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件;
当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数;
所述方法还包括:
管理信息系统的节点树并根据所述节点树配置所述监控对象的预警规则,其中,所述节点树中一个节点对应于一个所述监控对象,并存储有所述监控对象的预警规则;监控所述信息系统中的所述节点树是否发生了预设变化;若发生了预设变化,则预警子系统重新获取预警规则;
所述根据所述监控规则对所述监控对象进行数据采集,以获取监控数据,包括:
根据所述监控规则,采集获得所述监控对象的监控数据;
根据预判规则,确定所述监控数据是否异常。
6.根据权利要求5所述的方法,其特征在于,
所述根据所述预警规则及所述监控数据,确定所述监控对象的当前运行状况是否满足所述预警调整条件,包括:
根据所述预警规则及所述监控数据,确定所述监控对象是否处于数据备份状态和/或设备重新部署状态;
所述当满足所述预警调整条件时,修正所述监控数据触发的预警的预警参数,包括:
当所述监控对象处于所述数据备份状态和/或所述设备重新部署状态,则确定所述监控对象满足所述预警调整条件,降低所述监控数据触发的预警的所述预警级别,或,屏蔽所述监控数据触发的预警。
7.根据权利要求5或6所述的方法,其特征在于,
所述方法还包括:
管理信息系统的节点树并根据所述节点树配置所述监控对象的监控规则,其中,所述节点树中一个节点对应于一个所述监控对象,并存储有所述监控对象的监控规则;
监控所述信息系统中的所述节点树是否发生了预设变化;
若发生了预设变化,则数据采集子系统重新获取所述监控对象的监控规则。
8.根据权利要求5或6所述的方法,其特征在于,
所述根据所述监控规则对所述监控对象进行数据采集,以获取监控数据,包括:
根据所述监控规则,采集获得监控数据;
将所述监控数据存储预定数据库;
将所述监控对象的设备信息发送给预定消息队列;
所述根据所述预警规则,确定所述监控数据是否触发了预警及所述预警的预警参数,包括:
从所述预定消息队列接收所述设备信息,根据所述设备信息从所述预定数据库读取所述监控对象的监控数据。
CN201710198716.0A 2017-03-29 2017-03-29 监控系统及监控方法 Active CN106961352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710198716.0A CN106961352B (zh) 2017-03-29 2017-03-29 监控系统及监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710198716.0A CN106961352B (zh) 2017-03-29 2017-03-29 监控系统及监控方法

Publications (2)

Publication Number Publication Date
CN106961352A CN106961352A (zh) 2017-07-18
CN106961352B true CN106961352B (zh) 2020-09-25

Family

ID=59471055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710198716.0A Active CN106961352B (zh) 2017-03-29 2017-03-29 监控系统及监控方法

Country Status (1)

Country Link
CN (1) CN106961352B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109427177B (zh) * 2017-08-25 2020-12-22 贵州白山云科技股份有限公司 一种监控报警方法及装置
CN107493208A (zh) * 2017-08-30 2017-12-19 苏州朗动网络科技有限公司 一种中大型业务系统的全链路性能监控方法及系统
CN109981388A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 一种监控设备的方法和装置
CN108270618B (zh) * 2017-12-30 2021-07-16 华为技术有限公司 告警判定的方法、装置及告警系统
CN108809720A (zh) * 2018-06-13 2018-11-13 郑州云海信息技术有限公司 云数据系统中告警任务的管理方法和装置
CN108810142A (zh) * 2018-06-13 2018-11-13 平安科技(深圳)有限公司 Zookeeper的监控方法、装置、计算机设备及存储介质
CN109583758B (zh) * 2018-11-30 2021-07-13 广州净松软件科技有限公司 监察系统的预警规则修正方法、装置和计算机设备
CN109901969B (zh) * 2019-02-01 2022-10-14 广东安可云科技有限公司 一种集中监控管理平台的设计方法及装置
CN110411547A (zh) * 2019-08-01 2019-11-05 吉旗(成都)科技有限公司 用于货车感知物联网设备的故障远程自动诊断方法及装置
CN110796552A (zh) * 2019-10-31 2020-02-14 维沃移动通信有限公司 一种风险提示方法及装置
CN111026607A (zh) * 2019-11-14 2020-04-17 山东中创软件商用中间件股份有限公司 一种服务器监控系统、方法及服务器数据采集方法和系统
CN111200517B (zh) * 2019-12-24 2022-06-07 苏州达家迎信息技术有限公司 一种业务数据预警控制方法、装置、设备及存储介质
CN111090655B (zh) * 2019-12-27 2023-11-03 北京明略软件系统有限公司 基于监控数据的预警方法及装置、电子设备和存储介质
CN114650218B (zh) * 2020-12-17 2023-12-12 中移(苏州)软件技术有限公司 一种数据获取方法、设备、系统及存储介质
CN114389971B (zh) * 2022-03-23 2022-12-23 苏州浪潮智能科技有限公司 一种智能监控微调整方法、装置、设备及存储介质
CN115174351A (zh) * 2022-07-07 2022-10-11 深圳市积加跨境网络科技有限公司 一种电商运营预警数据生成方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101471808A (zh) * 2007-12-26 2009-07-01 英业达股份有限公司 一种群集储存系统的报警显示系统及方法
CN102136924A (zh) * 2010-01-27 2011-07-27 新奥特(北京)视频技术有限公司 一种告警信息的过滤分发处理方法和一种服务器
CN102148692A (zh) * 2010-02-09 2011-08-10 新奥特(北京)视频技术有限公司 一种告警信息的二次过滤监控方法和系统
CN103544093A (zh) * 2012-07-13 2014-01-29 深圳市快播科技有限公司 监控报警控制方法及其系统
CN104618163A (zh) * 2015-02-03 2015-05-13 江苏辰云信息科技有限公司 基于消息队列的分布式机房监控系统及方法
CN106201835A (zh) * 2016-07-14 2016-12-07 浪潮软件股份有限公司 一种预警自动管理的实现方法置的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7958201B2 (en) * 2009-01-29 2011-06-07 Ted Lindsay Method, system and apparatus for encouraging frequent and purposeful electronic communications from caregivers to individuals with impaired memory
CN102201928A (zh) * 2010-03-24 2011-09-28 中兴通讯股份有限公司 告警级别处理方法及告警服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101471808A (zh) * 2007-12-26 2009-07-01 英业达股份有限公司 一种群集储存系统的报警显示系统及方法
CN102136924A (zh) * 2010-01-27 2011-07-27 新奥特(北京)视频技术有限公司 一种告警信息的过滤分发处理方法和一种服务器
CN102148692A (zh) * 2010-02-09 2011-08-10 新奥特(北京)视频技术有限公司 一种告警信息的二次过滤监控方法和系统
CN103544093A (zh) * 2012-07-13 2014-01-29 深圳市快播科技有限公司 监控报警控制方法及其系统
CN104618163A (zh) * 2015-02-03 2015-05-13 江苏辰云信息科技有限公司 基于消息队列的分布式机房监控系统及方法
CN106201835A (zh) * 2016-07-14 2016-12-07 浪潮软件股份有限公司 一种预警自动管理的实现方法置的方法

Also Published As

Publication number Publication date
CN106961352A (zh) 2017-07-18

Similar Documents

Publication Publication Date Title
CN106961352B (zh) 监控系统及监控方法
CN108270618B (zh) 告警判定的方法、装置及告警系统
CN109726072B (zh) WebLogic服务器的监控告警方法、装置、系统及计算机存储介质
CN110224858B (zh) 基于日志的告警方法及相关装置
CN110213068B (zh) 一种消息中间件的监控方法及相关设备
CN109660380A (zh) 服务器运行状态的监控方法、平台、系统及可读存储介质
CN108572907B (zh) 一种告警方法、装置、电子设备及计算机可读存储介质
EP2907085B1 (en) Autonomic network sentinels
CN103220173B (zh) 一种报警监控方法及监控系统
KR101853676B1 (ko) 차량 침입 탐지 장치 및 방법
CN112311617A (zh) 一种配置化数据监控告警方法及系统
JP2010531553A (ja) ネットワーク異常検出のための統計的方法およびシステム
CN101527660B (zh) 告警方法、相关设备及系统
CN109669835B (zh) MySQL数据库监控方法、装置、设备及可读存储介质
CN109450691B (zh) 服务网关监控方法、设备及计算机可读存储介质
CN114356499A (zh) Kubernetes集群告警根因分析方法及装置
CN114328102A (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN114338372A (zh) 网络信息安全监控方法及系统
EP1785866A1 (en) Alarm consolidaton in IT infrastructures
CN102195791A (zh) 一种告警的分析方法、装置及系统
CN111339466A (zh) 接口管理方法、装置、电子设备及可读存储介质
EP1622310A2 (en) Administration system for network management systems
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
WO2018201864A1 (zh) 一种数据库性能诊断方法、装置、设备以及存储介质
CN113835961B (zh) 告警信息监控方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200831

Address after: No.128, Zhujia village, Sizhou Town, Dexing City, Shangrao City, Jiangxi Province

Applicant after: Kang Chaohong

Address before: 518000 Guangdong Province, Shenzhen high tech Zone of Nanshan District City, No. 9018 North Central Avenue's innovation building A, 6-8 layer, 10-11 layer, B layer, C District 6-10 District 6 floor

Applicant before: NUBIA TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201222

Address after: 518039 a1825, blocks a, B and C, Qunxing square, 38 Hongli Road, Lichun community, Huaqiangbei street, Futian District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen heliyunchuang Information Technology Co.,Ltd.

Address before: No. 128, Zhujia village, Sizhou Town, Dexing City, Shangrao City, Jiangxi Province

Patentee before: Kang Chaohong

TR01 Transfer of patent right