CN110764967A - 高性能监控告警系统、方法、装置及计算机可读存储介质 - Google Patents

高性能监控告警系统、方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN110764967A
CN110764967A CN201910996168.5A CN201910996168A CN110764967A CN 110764967 A CN110764967 A CN 110764967A CN 201910996168 A CN201910996168 A CN 201910996168A CN 110764967 A CN110764967 A CN 110764967A
Authority
CN
China
Prior art keywords
data
alarm
module
parameter configuration
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910996168.5A
Other languages
English (en)
Inventor
王斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Inspur Smart Computing Technology Co Ltd
Original Assignee
Guangdong Inspur Big Data Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Inspur Big Data Research Co Ltd filed Critical Guangdong Inspur Big Data Research Co Ltd
Priority to CN201910996168.5A priority Critical patent/CN110764967A/zh
Publication of CN110764967A publication Critical patent/CN110764967A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种高性能监控告警系统、方法、装置及计算机可读存储介质,本申请参数配置模块中存储了需监控的数据源的参数配置信息,便于后续对监控内容进行修改,数据过滤模块采用多线程并行获取各类数据源的监控项数据,处理速度更快,数据队列模块能够有效作为数据过滤模块与告警信息生成模块之间的数据缓冲区,避免数据堵塞的情况,告警信息生成模块能够生成便于用户快速理解的告警信息,提高告警效率,通知接口模块能够有效的将告警信息发送至相应的外围业务接口,快速对告警信息进行分类发送至指定的终端进行告警,综上提高了整体告警效率。

Description

高性能监控告警系统、方法、装置及计算机可读存储介质
技术领域
本发明涉及信息处理领域,特别涉及一种高性能监控告警系统、方法、装置及计算机可读存储介质。
背景技术
目前监控告警技术实现采集和显示,主要是先将遍历所有监控项数据,然后逐一比对监控数据和告警规则,再进行告警信息过滤,最终进行告警信息显示等处理。此类技术实现重点局限于告警处理的流程化,而忽略了高性能服务器业务领域中巨量监控指标告警的实时性和有效性,使得对监控告警指标的处理存在滞后时间差。例如:对服务器某些重要指标的告警,如GPU卡状态,主要目的是为了及时给相关业务平台及时发送通知和业务相关告警操作,如训练作业所需计算资源的重新调度等。这就要求对监控信号的告警需要快速精准处理。
发明内容
有鉴于此,本发明的目的在于提供一种高性能监控告警系统、方法、装置及计算机可读存储介质,提高告警效率。其具体方案如下:
一种高性能监控告警系统,包括:参数配置模块、数据过滤模块、数据队列模块、告警信息生成模块和通知接口模块;
所述参数配置模块,用于存储监控数据源所需的参数配置信息;
所述数据过滤模块,用于利用所述参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据,各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至所述数据队列模块;
所述数据队列模块,用于存储告警数据;
所述告警信息生成模块,用于获取所述数据队列模块中的告警数据,生成告警信息,发送告警信息至所述通知接口模块;
所述通知接口模块,用于发送告警信息至相应的外围业务接口,以进行告警。
可选的,所述数据过滤模块,包括:
数据获取单元,用于利用所述参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据;
初始筛选单元,用于利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据;
告警分类单元,用于利用每个线程对相应的数据源的初始告警数据和所述参数配置信息中的告警规则进行匹配,得到每类数据源利用所述告警规则分类后的告警数据;
告警数据发送单元,用于发送告警数据至所述数据队列模块。
可选的,所述数据队列模块,具体用于利用多个与各类数据源对应的数据队列,存储各类数据源的告警数据。
本发明还公开了一种高性能监控告警方法,包括:
利用预先存储的参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据;
各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至用于存储告警数据的数据队列;
利用所述数据队列中的告警数据,生成告警信息;
发送告警信息至相应的外围业务接口,以进行告警。
可选的,所述利用预先存储的参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据的过程,包括:
利用所述参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据。
可选的,所述各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至用于存储告警数据的数据队列:
利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据;
利用每个线程对相应的数据源的初始告警数据和所述参数配置信息中的告警规则进行匹配,得到每类数据源利用所述告警规则分类后的告警数据;
发送告警数据至所述数据队列模块。
可选的,所述发送告警数据至所述数据队列模块的过程,包括:
发送各类数据源的告警数据至多个与各类数据源一一对应的数据队列。
本发明还公开了一种高性能监控告警装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如前述的高性能监控告警方法。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述的高性能监控告警方法。
本发明中,高性能监控告警系统,包括:参数配置模块、数据过滤模块、数据队列模块、告警信息生成模块和通知接口模块;参数配置模块,用于存储监控数据源所需的参数配置信息;数据过滤模块,用于利用参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据,各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至数据队列模块;数据队列模块,用于存储告警数据;告警信息生成模块,用于获取数据队列模块中的告警数据,生成告警信息,发送告警信息至通知接口模块;通知接口模块,用于发送告警信息至相应的外围业务接口,以进行告警。
本发明实施例参数配置模块中存储了需监控的数据源的参数配置信息,便于后续对监控内容进行修改,数据过滤模块采用多线程并行获取各类数据源的监控项数据,处理速度更快,数据队列模块能够有效作为数据过滤模块与告警信息生成模块之间的数据缓冲区,避免数据堵塞的情况,告警信息生成模块能够生成便于用户快速理解的告警信息,提高告警效率,通知接口模块能够有效的将告警信息发送至相应的外围业务接口,快速对告警信息进行分类发送至指定的终端进行告警,综上提高了整体告警效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种高性能监控告警系统结构示意图;
图2为本发明实施例公开的另一种高性能监控告警系统结构示意图;
图3为本发明实施例公开的一种高性能监控告警方法流程示意图;
图4为本发明实施例公开的另一种高性能监控告警方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种高性能监控告警系统,参见图1所示,该系统包括:参数配置模块1、数据过滤模块2、数据队列模块3、告警信息生成模块4和通知接口模块5;
参数配置模块1,用于存储监控数据源所需的参数配置信息。
具体的,要想对数据源进行监控,需要确定监控哪些数据源,得知如何获取数据源的运行数据,此类,为实现监控数据源的相关参数综合形成参数配置信息,其中,参数配置信息可以包括数据源的特征信息、数据源的运行数据的获取接口信息和数据元的定义等,从而确保数据过滤模块2能够利用参数配置信息获取到需监控的数据源的运行数据。
其中,数据源的位置信息可以供用户直接定位数据源所在位置,例如,CPU1在第3服务器的2号主板的A1区。
可以理解的是,若在实际应用中需要调整数据源的信息,例如,增加或删除或改变监控数据源的监控项,均可以通过在参数配置信息中进行调整,实现改变,使监控更为灵活。
数据过滤模块2,用于利用参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据,各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至数据队列模块3。
具体的,为了提高数据过滤速度和告警判断速度,在利用参数配置信息获取多种数据源的监控项数据即运行数据时,采用多线程并行处理的方式获取,每个线程按照预设的数据源的种类获取相对应的数据源的监控项数据,例如,线程1获取数据源GPU的监控项数据,线程2获取数据源CPU的监控项数据,线程3获取数据源主板的监控项数据,从而各线程并行获取每类数据源的监控项数据。
具体的,每个线程在获取每种数据源的监控项数据后,继续对类数据源的监控项数据进行筛选,从中筛选出满足预设的告警条件的告警数据,例如,针对数据源CPU的线程对监控项数据CPU温度进行筛选,从中筛选出如CPU温度高于90°的数据,作为告警数据,得到告警数据后,线程再将告警数据发送至数据队列模块3。
其中,数据源可以包括CPU、GPU、内存、硬盘和主板等,监控项可以包括CPU利用率、GPU利用率、GPU内存利用率、GPU功耗和GPU温度等。
数据队列模块3,用于存储告警数据。
具体的,由于数据过滤装置利用多线程快速高效的对监控项数据进行筛选,为了避免后续生成告警信息时产生数据堵塞,利用数据队列模块3存储数据过滤模块2输出的告警数据,以便后续告警信息生成模块4从数据队列模块3中获取告警数据,告警数据在数据队列模块3中可以存储在FIFO形式的队列中。
告警信息生成模块4,用于获取数据队列模块3中的告警数据,生成告警信息,发送告警信息至通知接口模块5。
具体的,告警信息生成模块4中预先存储有相应的告警信息模板,通过将告警数据填写至相应的模板中便可以得到响应的告警信息,例如,告警数据中记录了,过热的CPU所在位置、温度和告警级别,告警模板中预留了上述三个数据中填写位置,同时,告警模板中还包括相应的格式来凸显告警内容,例如,通过将温度和告警级别用红色突出显示,或采用大号文字提高显示占比等,告警模板中还可以添加相应的提示字语等,方便用户快速理解告警内容。
具体的,告警信息生成后便可以发送至通知接口模块5,以便将告警内容显示给用户。
通知接口模块5,用于发送告警信息至相应的外围业务接口,以进行告警。
具体的,多种数据源和多种监控项可以由不同的部门和/或人员负责,因此,告警信息需要发送给相应的用户终端,为此,根据告警信息中的内容与预先设置的发送规则进行匹配,可以发送告警信息至相应的外围业务接口转发至相应的用户终端和/或告警设备对用户进行告警,实现对数据源的告警监控。
可见,本发明实施例参数配置模块1中存储了需监控的数据源的参数配置信息,便于后续对监控内容进行修改,数据过滤模块2采用多线程并行获取各类数据源的监控项数据,处理速度更快,数据队列模块3能够有效作为数据过滤模块2与告警信息生成模块4之间的数据缓冲区,避免数据堵塞的情况,告警信息生成模块4能够生成便于用户快速理解的告警信息,提高告警效率,通知接口模块5能够有效的将告警信息发送至相应的外围业务接口,快速对告警信息进行分类发送至指定的终端进行告警,综上提高了整体告警效率。
本发明实施例公开了一种具体的高性能监控告警系统,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。参见图2所示,具体的:
具体的,上述数据过滤模块2,可以具体包括数据获取单元21、初始筛选单元22、告警分类单元23和告警数据发送单元24;其中,
数据获取单元21,用于利用参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据。
具体的,一个线程获取一类数据源的监控项数据,例如,第一线程获取CPU的利用率、功耗和温度等监控项数据。
初始筛选单元22,用于利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据。
具体的,为了提高筛选速度,针对每种监控项数据设置告警阈值,快速筛选不满足告警阈值的数据,仅保留满足告警阈值的数据,减少后续进行具体的告警划分时的数据量,提高处理速度,例如,CPU的CPU温度的告警阈值可以为80°,低于80°的数据均舍弃认定为正常数据,高于80°的数据则保留,作为初始告警数据,以便后续对初始告警数据进行进一步的划分;通过初始筛选单元22快速剔除掉正常数据,在进行具体的告警划分前减少了大量的数据,提高后续的告警划分效率。
告警分类单元23,用于利用每个线程对相应的数据源的初始告警数据和参数配置信息中的告警规则进行匹配,得到每类数据源利用告警规则分类后的告警数据。
具体的,告警规则可以一同预先存储至参数配置模块1中,通过参数配置模块1可以调整告警规则,利用告警规则可以具体的对初始告警数据进行分级,例如,CPU过热可以分为预警、过热和停机三个级别,预警可以对应80°到85°,过热可以对应86°到105°,停机可以对应106°以上,对初始告警数据分级后,可以得到各类数据源的告警数据。
告警数据发送单元24,用于发送告警数据至数据队列模块3。
进一步的,为了减少数据堵塞的情况发生,进一步的提高告警信息的生成速率,可以利用多线程按照各类数据源的种类划分多个数据队列,每个数据队列仅存储与其相对应的数据源的监控项数据,以便后续告警信息生成模块4能够多线程的并行从多个数据队列中生成针对不同种类的数据源的告警数据。
具体的,上述数据队列模块3,具体用于利用多个与各类数据源对应的数据队列,存储各类数据源的告警数据。
相应的,本发明实施例还公开了一种高性能监控告警方法,参见图3所示,该方法包括:
S11:利用预先存储的参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据;
S12:各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至用于存储告警数据的数据队列;
S13:利用数据队列中的告警数据,生成告警信息;
S14:发送告警信息至相应的外围业务接口,以进行告警。
可见,本发明实施例参数配置信息存储了需监控的数据源,便于后续对监控内容进行修改,采用多线程并行获取各类数据源的监控项数据,处理速度更快,数据队列能够有效作为告警信息生成前的数据缓冲区,避免数据堵塞的情况,能够生成便于用户快速理解的告警信息,提高告警效率,能够有效的将告警信息发送至相应的外围业务接口,快速对告警信息进行分类发送至指定的终端进行告警,综上提高了整体告警效率。
具体的,本发明实施例还公开了一种高性能监控告警方法,参见图4所示,该方法包括:
S21:利用参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据;
S22:利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据;
S23:利用每个线程对相应的数据源的初始告警数据和参数配置信息中的告警规则进行匹配,得到每类数据源利用告警规则分类后的告警数据;
S24:发送各类数据源的告警数据至多个与各类数据源一一对应的数据队列;
S25:发送告警信息至相应的外围业务接口,以进行告警。
此外,本发明实施例还公开了一种高性能监控告警装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序,其中,所述计算机程序被处理器执行时实现以下步骤:
利用预先存储的参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据;各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至用于存储告警数据的数据队列;利用数据队列中的告警数据,生成告警信息;发送告警信息至相应的外围业务接口,以进行告警。
可见,本发明实施例参数配置信息存储了需监控的数据源,便于后续对监控内容进行修改,采用多线程并行获取各类数据源的监控项数据,处理速度更快,数据队列能够有效作为告警信息生成前的数据缓冲区,避免数据堵塞的情况,能够生成便于用户快速理解的告警信息,提高告警效率,能够有效的将告警信息发送至相应的外围业务接口,快速对告警信息进行分类发送至指定的终端进行告警,综上提高了整体告警效率。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:利用所述参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据;利用每个线程对相应的数据源的初始告警数据和所述参数配置信息中的告警规则进行匹配,得到每类数据源利用所述告警规则分类后的告警数据;发送告警数据至所述数据队列模块。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:发送各类数据源的告警数据至多个与各类数据源一一对应的数据队列。
另外,本发明实施例还公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器执行时实现以下步骤:
利用预先存储的参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据;各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至用于存储告警数据的数据队列;利用数据队列中的告警数据,生成告警信息;发送告警信息至相应的外围业务接口,以进行告警。
可见,本发明实施例参数配置信息存储了需监控的数据源,便于后续对监控内容进行修改,采用多线程并行获取各类数据源的监控项数据,处理速度更快,数据队列能够有效作为告警信息生成前的数据缓冲区,避免数据堵塞的情况,能够生成便于用户快速理解的告警信息,提高告警效率,能够有效的将告警信息发送至相应的外围业务接口,快速对告警信息进行分类发送至指定的终端进行告警,综上提高了整体告警效率。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:利用所述参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据;利用每个线程对相应的数据源的初始告警数据和所述参数配置信息中的告警规则进行匹配,得到每类数据源利用所述告警规则分类后的告警数据;发送告警数据至所述数据队列模块。
本实施例中,所述计算机可读存储介质中保存的计算机子程序被处理器执行时,可以具体实现以下步骤:发送各类数据源的告警数据至多个与各类数据源一一对应的数据队列。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
以上对本发明所提供的技术内容进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种高性能监控告警系统,其特征在于,包括:参数配置模块、数据过滤模块、数据队列模块、告警信息生成模块和通知接口模块;
所述参数配置模块,用于存储监控数据源所需的参数配置信息;
所述数据过滤模块,用于利用所述参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据,各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至所述数据队列模块;
所述数据队列模块,用于存储告警数据;
所述告警信息生成模块,用于获取所述数据队列模块中的告警数据,生成告警信息,发送告警信息至所述通知接口模块;
所述通知接口模块,用于发送告警信息至相应的外围业务接口,以进行告警。
2.根据权利要求1所述的高性能监控告警系统,其特征在于,所述数据过滤模块,包括:
数据获取单元,用于利用所述参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据;
初始筛选单元,用于利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据;
告警分类单元,用于利用每个线程对相应的数据源的初始告警数据和所述参数配置信息中的告警规则进行匹配,得到每类数据源利用所述告警规则分类后的告警数据;
告警数据发送单元,用于发送告警数据至所述数据队列模块。
3.根据权利要求1所述的高性能监控告警系统,其特征在于,所述数据队列模块,具体用于利用多个与各类数据源对应的数据队列,存储各类数据源的告警数据。
4.一种高性能监控告警方法,其特征在于,包括:
利用预先存储的参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据;
各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至用于存储告警数据的数据队列;
利用所述数据队列中的告警数据,生成告警信息;
发送告警信息至相应的外围业务接口,以进行告警。
5.根据权利要求4所述的高性能监控告警方法,其特征在于,所述利用预先存储的参数配置信息和按照数据源种类划分的多线程,并行获取每类数据源的监控项数据的过程,包括:
利用所述参数配置信息和多个按照数据源种类与数据源一一对应的线程,并行获取每类数据源的监控项数据。
6.根据权利要求4所述的高性能监控告警方法,其特征在于,所述各线程从相应的监控项数据中筛选满足预设告警条件的告警数据,并发送告警数据至用于存储告警数据的数据队列:
利用每个线程从相应的数据源的监控项数据中筛选满足预设告警阈值的初始告警数据;
利用每个线程对相应的数据源的初始告警数据和所述参数配置信息中的告警规则进行匹配,得到每类数据源利用所述告警规则分类后的告警数据;
发送告警数据至所述数据队列模块。
7.根据权利要求6所述的高性能监控告警方法,其特征在于,所述发送告警数据至所述数据队列模块的过程,包括:
发送各类数据源的告警数据至多个与各类数据源一一对应的数据队列。
8.一种高性能监控告警装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求4至7任一项所述的高性能监控告警方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求4至7任一项所述的高性能监控告警方法。
CN201910996168.5A 2019-10-18 2019-10-18 高性能监控告警系统、方法、装置及计算机可读存储介质 Pending CN110764967A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910996168.5A CN110764967A (zh) 2019-10-18 2019-10-18 高性能监控告警系统、方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910996168.5A CN110764967A (zh) 2019-10-18 2019-10-18 高性能监控告警系统、方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110764967A true CN110764967A (zh) 2020-02-07

Family

ID=69332293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910996168.5A Pending CN110764967A (zh) 2019-10-18 2019-10-18 高性能监控告警系统、方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110764967A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342603A (zh) * 2021-06-07 2021-09-03 平安证券股份有限公司 告警数据处理方法、装置、计算机设备和存储介质
CN114301857A (zh) * 2021-12-24 2022-04-08 三川智慧科技股份有限公司 一种基于物联网的水表通讯方法及装置
CN116149959A (zh) * 2023-04-20 2023-05-23 北京集度科技有限公司 一种数据处理装置、方法、监测设备以及计算机程序产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030135382A1 (en) * 2002-01-14 2003-07-17 Richard Marejka Self-monitoring service system for providing historical and current operating status
CN102546216A (zh) * 2010-12-30 2012-07-04 中国移动通信集团山东有限公司 网络管理系统中的告警消息处理方法及网络管理系统
CN106161088A (zh) * 2016-07-01 2016-11-23 成都视达科信息技术有限公司 一种基于多线程的服务器自动巡检方法及系统
CN109684176A (zh) * 2018-12-26 2019-04-26 广东浪潮大数据研究有限公司 一种告警信息的上报方法、系统及相关组件
CN109743191A (zh) * 2018-11-28 2019-05-10 中通服建设有限公司 一种设备告警的精确定位集中处理系统、方法及装置
CN110232010A (zh) * 2019-06-18 2019-09-13 深圳前海微众银行股份有限公司 一种告警方法、告警服务器及监控服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030135382A1 (en) * 2002-01-14 2003-07-17 Richard Marejka Self-monitoring service system for providing historical and current operating status
CN102546216A (zh) * 2010-12-30 2012-07-04 中国移动通信集团山东有限公司 网络管理系统中的告警消息处理方法及网络管理系统
CN106161088A (zh) * 2016-07-01 2016-11-23 成都视达科信息技术有限公司 一种基于多线程的服务器自动巡检方法及系统
CN109743191A (zh) * 2018-11-28 2019-05-10 中通服建设有限公司 一种设备告警的精确定位集中处理系统、方法及装置
CN109684176A (zh) * 2018-12-26 2019-04-26 广东浪潮大数据研究有限公司 一种告警信息的上报方法、系统及相关组件
CN110232010A (zh) * 2019-06-18 2019-09-13 深圳前海微众银行股份有限公司 一种告警方法、告警服务器及监控服务器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张劲松: "《网络金融理论与实务》", 31 December 2007, 浙江科学技术出版社, pages: 219 *
张海阔等: "面向海量告警数据的并行处理系统设计与实现", 《计算机工程与设计》 *
张海阔等: "面向海量告警数据的并行处理系统设计与实现", 《计算机工程与设计》, no. 02, 16 February 2018 (2018-02-16) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342603A (zh) * 2021-06-07 2021-09-03 平安证券股份有限公司 告警数据处理方法、装置、计算机设备和存储介质
CN114301857A (zh) * 2021-12-24 2022-04-08 三川智慧科技股份有限公司 一种基于物联网的水表通讯方法及装置
CN116149959A (zh) * 2023-04-20 2023-05-23 北京集度科技有限公司 一种数据处理装置、方法、监测设备以及计算机程序产品

Similar Documents

Publication Publication Date Title
CN111082966B (zh) 基于批量告警事件的定位方法、装置、电子设备及介质
CN110764967A (zh) 高性能监控告警系统、方法、装置及计算机可读存储介质
CN107145489B (zh) 一种基于云平台的客户端应用的信息统计方法和装置
US20200410164A1 (en) Methods and systems using cognitive artifical intelligence to implement adaptive linguistic models to process data
CN108270618A (zh) 告警判定的方法、装置及告警系统
US8954971B2 (en) Data collecting method, data collecting apparatus and network management device
US9027037B2 (en) Information output device, method, and recording medium for outputting notification information corresponding to a state of a computer
CN110232010A (zh) 一种告警方法、告警服务器及监控服务器
US11042525B2 (en) Extracting and labeling custom information from log messages
CN111585785B (zh) 告警信息的屏蔽方法、装置、计算机设备及存储介质
CN114091704B (zh) 一种告警压制方法和装置
CN113704065A (zh) 监控方法、装置、设备及计算机存储介质
CN110704283A (zh) 一种统一生成告警信息的方法、装置和介质
CN108520056A (zh) 业务数据监控方法及装置、系统、可读介质和电子设备
CN112948223A (zh) 一种监测运行情况的方法和装置
US11194303B2 (en) Method and system for anomaly detection and notification through profiled context
CN110677271B (zh) 基于elk的大数据告警方法、装置、设备及存储介质
KR100984282B1 (ko) 메모리캐쉬를 이용한 통합보안관리시스템
JP2011526121A (ja) 監視システムにおけるメッセージの対象とされたユーザへの通知
JP2017156863A (ja) 監視システム、プログラム
CN112910733A (zh) 一种基于大数据的全链路监控系统及方法
Girish et al. Extreme event detection and management using twitter data analysis
CN116112342A (zh) 告警信息处理方法、装置、电子设备以及存储介质
TWI720963B (zh) 用於對資訊安全性事件進行高頻啟發式資料擷取和分析的系統和方法
CN114168371A (zh) 一种故障智能自动报警系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination