CN115664940B - 分布式节点指标与告警缓存方法、装置和电子设备 - Google Patents

分布式节点指标与告警缓存方法、装置和电子设备 Download PDF

Info

Publication number
CN115664940B
CN115664940B CN202211688348.5A CN202211688348A CN115664940B CN 115664940 B CN115664940 B CN 115664940B CN 202211688348 A CN202211688348 A CN 202211688348A CN 115664940 B CN115664940 B CN 115664940B
Authority
CN
China
Prior art keywords
alarm
data
gateway
data sent
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211688348.5A
Other languages
English (en)
Other versions
CN115664940A (zh
Inventor
姜作毅
陈睿彧
张新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianwei Communication Technology Co ltd
Original Assignee
Beijing Tianwei Communication Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tianwei Communication Technology Co ltd filed Critical Beijing Tianwei Communication Technology Co ltd
Priority to CN202211688348.5A priority Critical patent/CN115664940B/zh
Publication of CN115664940A publication Critical patent/CN115664940A/zh
Application granted granted Critical
Publication of CN115664940B publication Critical patent/CN115664940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请涉及一种分布式节点指标与告警缓存方法、装置和电子设备,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。达到被缓存数据不会被周期性地反复重试发送造成网络和告警系统的资源被过度占用的功效,避免因同一个网络故障原因造成指标发送延迟的各个节点不会同时将数据集中上传;被缓存数据不会触发告警,但会被打上标签,通过告警系统模拟出告警事件,被记录。

Description

分布式节点指标与告警缓存方法、装置和电子设备
技术领域
本公开涉及分布式储存技术领域,尤其涉及一种分布式节点指标与告警缓存方法、装置和电子设备。
背景技术
由于SD-WAN的Underlay网络是基于不可靠的互联网,而告警的机制基本上又是基于来自各个节点上报的各种指标(如温度、带宽、CPU使用率等),当因Underlay网络质量的原因造成指标无法上报,将无法发送的指标缓存在节点内部即可,等Underlay网络恢复正常后再发送即可,再由告警系统负责处理和存储那些迟到的数据。
而缓存告警并伺机重新发送会带来以下问题:
如果长时间断网(非故障,而是项目需要故意长期断网)却不断电,可能会造成节点中缓存的指标数据量过大,(极端情况会造成存储崩溃,一般通过Rotate来解决),即使在非极端情况下,网络恢复时,集中的指标上传也会占用过大的网络带宽与告警系统的资源;
如果发生故障的Underlay网络是拓扑的骨干处,会造成一大串节点发生缓存,同样地,当网络恢复正常时,所有的节点同时上传被缓存的指标数据,也会占用过大的网络带宽与告警系统的资源;
如果被缓存的数据触发了告警,则是过时的大量告警,引起运维人员的反感并掩盖了真正有用的告警;但如果不触发告警,在审计时又会引起不必要的辩解,与普通的系统相比,这是SD-WAN系统特有的一个两难的问题。
发明内容
为了解决上述问题,本申请提出一种分布式节点指标与告警缓存方法、装置和电子设备。
本申请一方面,提出一种分布式节点指标与告警缓存方法,包括如下步骤:
通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;
所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;
所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;
所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。
作为本申请的一可选实施方案,可选地,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,包括:
判断网络质量,获取网络状态:
当所述网络状态处于正常状态时,通过所述采集节点采集数据,并直接将所述采集数据发送至所述告警网关。
作为本申请的一可选实施方案,可选地,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,还包括:
判断网络质量,获取网络状态:
当网络质量处于非正常状态时,通过所述采集节点采集数据,将所述采集数据发送并保存至缓存模块,并对每条所述采集数据进行缓存标记,得到指标数据;
通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关。
作为本申请的一可选实施方案,可选地,通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关,包括:
预设上报所述指标数据的重试时间,并将所述重试时间配置于所述缓存模块上;
所述缓存模块根据所述重试时间,反复重试上报所述指标数据;
其中,所述重试时间频率为:
T(n+1) = T(n) * (1.5- 2.0) * (0.9-1.1)
T(n+1) 为下一次上报时间,T(n) 为首次间隔时间。
作为本申请的一可选实施方案,可选地,所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存,包括:
所述时序数据库接收所述指标数据,并判断所述指标数据是否具备缓存标记:
若所述指标数据不具备所述缓存标记,则保存所述指标数据,并用于读取展示;
若所述指标数据具备所述缓存标记,则保存具备所述缓存标记的所述指标数据,并用于读取展示。
作为本申请的一可选实施方案,可选地,所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存,包括:
所述告警系统判断引擎接收所述指标数据,并根据预设告警条件判断所述指标数据是否触发告警:
若触发告警,则将所述指标数据发送并保存至告警系统事件记录模块;
若未触发告警,则将所述指标数据发送至下一节点。
作为本申请的一可选实施方案,可选地,在触发告警时,还包括:
判断所述指标数据是否具备缓存标记:
若所述指标数据不具备缓存标记,则将告警信息发送至告警系统发送引擎,通过所述告警系统发送引擎通知接收人;
若所述指标数据具备缓存标记,则连同所述缓存标记一并保存所述指标数据。
作为本申请的一可选实施方案,可选地,在触发告警时,还包括:
若所述指标数据不具备缓存标记,即所述指标数据为实时数据,则所述告警系统判断引擎根据实时计算规则,实时计算所述指标数据的上报时间;
若所述指标数据具备缓存标记,即所述指标数据为非实时数据,则所述告警系统判断引擎根据限时计算规则,异步计算所述指标数据的上报时间。
本申请另一方面,提供一种实现上述所述的分布式节点指标与告警缓存方法的装置,包括:
采集节点,用于采集数据,并根据网络状态,将采集数据发送至告警网关;
缓存模块,用于缓存采集节点在网络质量处于非正常状态时发送的采集数据,并对每条所述采集数据进行缓存标记后发送至告警网关;
告警网关,用于接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;
时序数据库,用于接收所述指标数据,并根据所述指标数据的属性进行保存;
数据展示模块,用于对接所述时序数据库并展示所述时序数据库中的数据;
告警系统判断引擎,用于接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警处理;
告警系统事件记录模块,用于缓存告警处理后的指标数据;
告警系统发送引擎,用于将不具备缓存标记的告警信息发送至接收人。
本申请另一方面,还提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述可执行指令时实现上述所述的分布式节点指标与告警缓存方法。
本发明的技术效果:
本申请通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。达到被缓存数据不会被周期性地反复重试发送造成网络和告警系统的资源被过度占用;因同一个网络故障原因造成指标发送延迟的各个节点不会同时将数据集中上传;被缓存的数据不会触发告警,但会被打上标签,并在UI中以明显的方式展示这个标签,说明当时没有触发告警的原因,但是被缓存的数据依然会通过告警系统模拟出告警事件,在系统中被记录。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出为本发明分布式节点指标与告警缓存方法的实施流程示意图;
图2示出为本发明的网络拓扑结构示意图;
图3示出为本发明时序数据库中所标记的缓存数据指标表。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
实施例1
如图1所示,本申请一方面,提出一种分布式节点指标与告警缓存方法,包括如下步骤:
S1、通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;
如图2所示,正常情况下,节点内的采集功能直接将指标数据发送至告警网关(图中虚线)。而出现长时间断网等这类网络状态情况下,本申请需要缓存采集文件。
作为本申请的一可选实施方案,可选地,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,包括:
判断网络质量,获取网络状态:
当所述网络状态处于正常状态时,通过所述采集节点采集数据,并直接将所述采集数据发送至所述告警网关。
在图2中,采集节点采集数据后,若是网络状态良好,则直接可以发送至告警网关(虚线),由告警网关直接将采集数据发送至时序数据库和告警系统判断引擎进行正常处理,具体可以参见下述告警判定流程。
作为本申请的一可选实施方案,可选地,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,还包括:
判断网络质量,获取网络状态:
当网络质量处于非正常状态时,通过所述采集节点采集数据,将所述采集数据发送并保存至缓存模块,并对每条所述采集数据进行缓存标记,得到指标数据;
通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关。
图2中,流程(1)所示的情况为网络出现非正常状态时,则当虚线路径无法发送时,则发送至缓存模块,缓存模块则伺机将指标数据发送至告警网关,如果指标数据是由缓存模块发送的,则每条数据都会被打上“缓存”的标签。
对于正常的实时数据,依然是奉行及时、准点的形式上报,由于数据量完全可以估算,此处不用任何特殊算法。
缓存模块中缓存的数据,打上了“缓存”标签。对于打了“缓存”标签的指标数据(非实时数据),由于无法预测网络何时恢复,所以只能反复重试上报的时机,因此缓存模块需要反复重试上报这类数据。
本实施例,采用随机性的报文时间规则,每次缓存模块上报数据的重试时间,必须呈非线性的增长,同时进行了“随机飘移”处理。
作为本申请的一可选实施方案,可选地,通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关,包括:
预设上报所述指标数据的重试时间,并将所述重试时间配置于所述缓存模块上;
所述缓存模块根据所述重试时间,反复重试上报所述指标数据;
其中,所述重试时间频率为:
T(n+1) = T(n) * (1.5- 2.0) * (0.9-1.1)
T(n+1) 为下一次上报时间,T(n) 为首次间隔时间。
比如,第一次等1分钟,第二次等待时间是第一次的1.8倍,或者是不固定的倍数,经实验,从1.5至2倍都是适合的值,但是需要一个上限,比如半个月,这个上限也可以是个随机范围,比如半个月正负浮动5%。
为了加大随机性,每次重试时间也可以加上10%的正负浮动,随机漂移。
即:首次间隔为T(n),那么下一次间隔就是 T(n+1) = T(n) * (1.5- 2.0) *(0.9-1.1)。
被缓存的指标数据每次试图上报的间隔非固定,总体上下一次的间隔是上一次的1.5至2倍,并额外加上10%的随机漂移,以避开多节点同时上报,并存在随机的最大间隔时间上限。
上述线性系数:1.5- 2.0,以及随机漂移系数:0.9-1.1,仅仅为本实施例的示例,可以由用户视系统的运行性能等进行设定。
S2、所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;
如图2所示,告警网关会将收到的指标数据发送至时序数据库,发送时会带上从节点传过来的“缓存”标签(如果有的话),这个标签会影响图中流程(4)的行为。
与此同时,告警网关也会将流程(1)收到的指标数据,如同流程(2)一样发至告警系统的判定引擎,同样发送时会带上从节点传过来的“缓存”标签(如果有的话),这个标签会影响流程(5)的行为。
具体如下:
S3、所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;
作为本申请的一可选实施方案,可选地,所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存,包括:
所述时序数据库接收所述指标数据,并判断所述指标数据是否具备缓存标记:
若所述指标数据不具备所述缓存标记,则保存所述指标数据,并用于读取展示;
若所述指标数据具备所述缓存标记,则保存具备所述缓存标记的所述指标数据,并用于读取展示。
时序数据库在保存指标数据时同时也保存了“缓存”标签,此处无特殊逻辑,而在数据展现时,API从时序数据库读取指标数据时,也会将“缓存”标签一起读取,在展现时,如图3所示,会在这些迟到的数据上打上明显的标记(示例中的“断网维护”),供操作人员参考。
若时序数据库发现指标数据无“缓存”标签,则这类无“缓存”标签的指标数据将直接保存,在后续数据展现时,API从时序数据库读取指标数据时,展示数据无“缓存”标签。
S4、所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。
告警系统判断引擎会按照预设的告警规则对指标数据进行告警判断,告警网关发送的实时数据进行告警判断,发送的缓存数据(非实时数据)不会触发告警,即若是缓存标记的指标数据,被告警系统判断引擎接收后,作为缓存数据,不会触发告警,但是会被打上标签,并在UI中以明显的方式展示这个标签,说明当时没有触发告警的原因,但是被缓存的数据依然会通过告警系统模拟出告警事件,在告警系统事件记录模块中保存并记录。
作为本申请的一可选实施方案,可选地,所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存,包括:
所述告警系统判断引擎接收所述指标数据,并根据预设告警条件判断所述指标数据是否触发告警:
若触发告警,则将所述指标数据发送并保存至告警系统事件记录模块;
若未触发告警,则将所述指标数据发送至下一节点。
如图2所示,告警系统判断引擎会根据流程(3)发来的指标数据以及预设的规则判断是否会触发告警,如符合触发条件,则会发送到“告警系统事件记录模块”入库。
作为本申请的一可选实施方案,可选地,在触发告警时,还包括:
判断所述指标数据是否具备缓存标记:
若所述指标数据不具备缓存标记,则将告警信息发送至告警系统发送引擎,通过所述告警系统发送引擎通知接收人;
若所述指标数据具备缓存标记,则连同所述缓存标记一并保存所述指标数据。
如图2中流程(5)所示,如果触发告警的指标数据没有“缓存”标签,这个告警还会沿虚线送至“告警系统发送引擎”,通知接收人。被缓存数据不会触发告警,但会被打上标签,并在UI中以明显的方式展示这个标签,说明当时没有触发告警的原因,但是被缓存的数据依然会通过告警系统模拟出告警事件,在告警系统事件记录模块中保存并记录。
作为本申请的一可选实施方案,可选地,在触发告警时,还包括:
若所述指标数据不具备缓存标记,即所述指标数据为实时数据,则所述告警系统判断引擎根据实时计算规则,实时计算所述指标数据的上报时间;
若所述指标数据具备缓存标记,即所述指标数据为非实时数据,则所述告警系统判断引擎根据限时计算规则,异步计算所述指标数据的上报时间。
告警系统对于缓存数据以及实时的采集数据,上报的时间不同。为了避免缓存数据大量积压,本实施例,告警系统判断引擎对实时数据和非实时数据的报文时间计算方式不同。
如果是实时数据,判断引擎会在第一时间实时计算,如果是带“缓存”标签的非实时数据,判断引擎会在闲时在后台异步计算,这样,对面大量积压的缓存数据时,不会影响到优先级更高的实时数据
实时计算规则和限时计算规则,由用户根据系统运行环境和情况设定即可,本实施例不做限定。
因此,本申请通过缓存报文,被缓存的指标数据每次试图上报的间隔非固定,总体上下一次的间隔是上一次的1.5至2倍,并额外加上10%的随机漂移,以避开多节点同时上报,并存在随机的最大间隔时间上限,被缓存数据不会被周期性地反复重试发送造成网络和告警系统的资源被过度占用。被缓存的数据不会触发告警,但会被打上标签,并在UI中以明显的方式展示这个标签,说明当时没有触发告警的原因,但是被缓存的数据依然会通过告警系统模拟出告警事件,在系统中被记录,实现分布式储存的优异效果。
需要说明的是,尽管以不同系数作为示例介绍了如上重试上报的时间计算,但本领域技术人员能够理解,本公开应不限于此。事实上,用户完全可根据实际应用场景灵活设定线性系数以及随机漂移系数,只要可以按照上述技术方法实现本申请的技术功能即可。
实施例2
基于实施例1的实施原理,本申请另一方面,提供一种实现上述所述的分布式节点指标与告警缓存方法的装置,包括:
采集节点,用于采集数据,并根据网络状态,将采集数据发送至告警网关;
缓存模块,用于缓存采集节点在网络质量处于非正常状态时发送的采集数据,并对每条所述采集数据进行缓存标记后发送至告警网关;
告警网关,用于接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;
时序数据库,用于接收所述指标数据,并根据所述指标数据的属性进行保存;
数据展示模块,用于对接所述时序数据库并展示所述时序数据库中的数据;
告警系统判断引擎,用于接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警处理;
告警系统事件记录模块,用于缓存告警处理后的指标数据;
告警系统发送引擎,用于将不具备缓存标记的告警信息发送至接收人。
上述各个模块/引擎等设施,具体功能和连接关系,参见上述实施例1和附图2所示。
显然,本领域的技术人员应该明白,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各控制方法的实施例的流程。上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(FlashMemory)、硬盘(HardDiskDrive,缩写:HDD)或固态硬盘(Solid-StateDrive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
实施例3
更进一步地,根据本公开的另一方面,还提供了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述可执行指令时实现上述所述的分布式节点指标与告警缓存方法。
本公开实施例来电子设备包括处理器以及用于存储处理器可执行指令的存储器。其中,处理器被配置为执行可执行指令时实现前面任一所述的一种分布式节点指标与告警缓存方法。
此处,应当指出的是,处理器的个数可以为一个或多个。同时,在本公开实施例的电子设备中,还可以包括输入装置和输出装置。其中,处理器、存储器、输入装置和输出装置之间可以通过总线连接,也可以通过其他方式连接,此处不进行具体限定。
存储器作为一计算机可读存储介质,可用于存储软件程序、计算机可执行程序和各种模块,如:本公开实施例的一种分布式节点指标与告警缓存方法所对应的程序或模块。处理器通过运行存储在存储器中的软件程序或模块,从而执行溯源系统的各种功能应用及数据处理。
输入装置可用于接收输入的数字或信号。其中,信号可以为产生与设备/终端/服务器的用户设置以及功能控制有关的键信号。输出装置可以包括显示屏等显示设备。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (7)

1.分布式节点指标与告警缓存方法,其特征在于,包括如下步骤:
通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,包括:判断网络质量,获取网络状态:当网络状态处于非正常状态时,通过所述采集节点采集数据,将所述采集数据发送并保存至缓存模块,并对每条所述采集数据进行缓存标记,得到指标数据;通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关;如果指标数据是由缓存模块发送的,则每条数据都会被打上缓存的标签;对于打了缓存标签的指标数据,缓存模块需要反复重试上报这类数据,采用报文时间规则,每次缓存模块上报数据的重试时间,必须呈非线性的增长,同时进行了随机飘移处理;
通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关,包括:
预设上报所述指标数据的重试时间,并将所述重试时间配置于所述缓存模块上;
所述缓存模块根据所述重试时间,反复重试上报所述指标数据;
其中,所述重试时间频率为:
T(n+1) = T(n) * (1.5-2.0) * (0.9-1.1)
T(n+1) 为下一次上报时间,T(n) 为首次间隔时间;1.5- 2.0代表线性系数的取值范围;0.9-1.1代表随机漂移系数的取值,随机漂移系数的取值为0.9、1和1.1中的任一数值;
所述告警网关接收所述采集数据和处于预设网络状态下所形成的指标数据,把所述采集数据和指标数据均发送至时序数据库和告警系统判断引擎;
所述时序数据库接收所述告警网关发送的数据,并根据所述告警网关发送的数据的属性进行保存;
所述告警系统判断引擎接收并保存所述告警网关发送的数据,并根据预设告警条件对所述告警网关发送的数据进行告警缓存;
其中,所述时序数据库接收所述告警网关发送的数据,并根据所述告警网关发送的数据的属性进行保存,包括:
所述时序数据库接收所述告警网关发送的数据,并判断所述告警网关发送的数据中是否具备缓存标记:
若所述告警网关发送的数据不具备所述缓存标记,则保存所述告警网关发送的数据,并用于读取展示;
若所述告警网关发送的数据具备所述缓存标记,则保存具备所述缓存标记的所述告警网关发送的数据,并用于读取展示。
2.根据权利要求1所述的分布式节点指标与告警缓存方法,其特征在于,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,包括:
判断网络质量,获取网络状态:
当所述网络状态处于正常状态时,通过所述采集节点采集数据,并直接将所述采集数据发送至所述告警网关。
3.根据权利要求1所述的分布式节点指标与告警缓存方法,其特征在于,所述告警系统判断引擎接收并保存所述告警网关发送的数据,并根据预设告警条件对所述告警网关发送的数据进行告警缓存,包括:
所述告警系统判断引擎接收所述告警网关发送的数据,并根据预设告警条件判断所述告警网关发送的数据是否触发告警:
若触发告警,则将所述告警网关发送的数据发送并保存至告警系统事件记录模块;
若未触发告警,则将所述告警网关发送的数据发送至下一节点。
4.根据权利要求3所述的分布式节点指标与告警缓存方法,其特征在于,在触发告警时,还包括:
判断所述告警网关发送的数据是否具备缓存标记:
若所述告警网关发送的数据不具备缓存标记,则将告警信息发送至告警系统发送引擎,通过所述告警系统发送引擎通知接收人;
若所述告警网关发送的数据具备缓存标记,则连同所述缓存标记一并保存所述指标数据。
5.根据权利要求4所述的分布式节点指标与告警缓存方法,其特征在于,在触发告警时,还包括:
若所述告警网关发送的数据不具备缓存标记,即所述告警网关发送的数据为实时数据,则所述告警系统判断引擎根据实时计算规则,实时计算所述告警网关发送的数据的上报时间;
若所述告警网关发送的数据具备缓存标记,即所述告警网关发送的数据为非实时数据,则所述告警系统判断引擎根据限时计算规则,异步计算所述告警网关发送的数据的上报时间。
6.实现权利要求1-5中任一项所述的分布式节点指标与告警缓存方法的装置,其特征在于,包括:
采集节点,用于采集数据,并根据网络状态,将采集数据发送至告警网关;
缓存模块,用于缓存采集节点在网络状态处于非正常状态时发送的采集数据,并对每条所述采集数据进行缓存标记后发送至告警网关;
告警网关,用于接收所述采集数据和处于预设网络状态下所形成的指标数据,把所述采集数据和指标数据均发送至时序数据库和告警系统判断引擎;
时序数据库,用于接收所述告警网关发送的数据,并根据所述告警网关发送的数据的属性进行保存;
数据展示模块,用于对接所述时序数据库并展示所述时序数据库中的数据;
告警系统判断引擎,用于接收并保存所述告警网关发送的数据,并根据预设告警条件对所述告警网关发送的数据进行告警处理;
告警系统事件记录模块,用于缓存告警处理后的所述告警网关发送的数据;
告警系统发送引擎,用于将不具备缓存标记的告警网关所发送的数据对应的告警信息发送至接收人;
其中,所述时序数据库接收所述告警网关发送的数据,并根据所述告警网关发送的数据的属性进行保存,包括:
所述时序数据库接收所述告警网关发送的数据,并判断所述告警网关发送的数据中是否具备缓存标记:
若所述告警网关发送的数据不具备所述缓存标记,则保存所述告警网关发送的数据,并用于读取展示;
若所述告警网关发送的数据具备所述缓存标记,则保存具备所述缓存标记的所述告警网关发送的数据,并用于读取展示。
7.电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述可执行指令时实现权利要求1至5中任一项所述的分布式节点指标与告警缓存方法。
CN202211688348.5A 2022-12-28 2022-12-28 分布式节点指标与告警缓存方法、装置和电子设备 Active CN115664940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211688348.5A CN115664940B (zh) 2022-12-28 2022-12-28 分布式节点指标与告警缓存方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211688348.5A CN115664940B (zh) 2022-12-28 2022-12-28 分布式节点指标与告警缓存方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN115664940A CN115664940A (zh) 2023-01-31
CN115664940B true CN115664940B (zh) 2023-04-28

Family

ID=85023577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211688348.5A Active CN115664940B (zh) 2022-12-28 2022-12-28 分布式节点指标与告警缓存方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN115664940B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957867A (zh) * 2010-10-29 2011-01-26 国电南瑞科技股份有限公司 电力调度自动化系统分布式应用解列状态下数据缓存方法
CN102034148A (zh) * 2010-12-08 2011-04-27 山东浪潮齐鲁软件产业股份有限公司 一种监控系统的事件预警及防风暴策略的实现方法
CN102624881A (zh) * 2012-02-29 2012-08-01 浙江大学 一种面向移动设备的服务缓存系统架构及开发方法
CN102625349A (zh) * 2012-03-09 2012-08-01 浪潮通信信息系统有限公司 一种告警风暴下的数据处理方法
CN104362757A (zh) * 2014-11-27 2015-02-18 广西电网公司电力科学研究院 一种基于iec61850的变电站在线监测系统
CN106487574A (zh) * 2016-04-01 2017-03-08 国家计算机网络与信息安全管理中心 自动化运行维护监测系统
CN106502838A (zh) * 2016-11-02 2017-03-15 中车青岛四方机车车辆股份有限公司 列车数据的缓存方法、装置和系统
CN109194451A (zh) * 2018-08-17 2019-01-11 北汽福田汽车股份有限公司 车载终端的数据补发方法及车载终端
CN114095393A (zh) * 2022-01-20 2022-02-25 北京天维信通科技有限公司 自动挂载检测探针的sd-wan新建隧道节点监测方法
CN114124655A (zh) * 2021-10-20 2022-03-01 曙光信息产业(北京)有限公司 网络监控方法、系统、装置、计算机设备和存储介质
CN114338671A (zh) * 2021-12-27 2022-04-12 广西电网有限责任公司 一种用于小水电站边缘计算网关数据处理方法
CN114564370A (zh) * 2022-04-29 2022-05-31 天云软件技术有限公司 告警阈值的确定方法、装置、设备及计算机存储介质
CN114791909A (zh) * 2022-04-11 2022-07-26 江苏安控智汇科技股份有限公司 一种基于物联网的数据采集处理方法及装置
WO2022188624A1 (zh) * 2021-03-09 2022-09-15 华为技术有限公司 自动生成自治系统as标识的方法、第一网络设备及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160350722A1 (en) * 2014-01-24 2016-12-01 N'8Kd Decision Pty Ltd Managing scheduled events in network-hosted time management system

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957867A (zh) * 2010-10-29 2011-01-26 国电南瑞科技股份有限公司 电力调度自动化系统分布式应用解列状态下数据缓存方法
CN102034148A (zh) * 2010-12-08 2011-04-27 山东浪潮齐鲁软件产业股份有限公司 一种监控系统的事件预警及防风暴策略的实现方法
CN102624881A (zh) * 2012-02-29 2012-08-01 浙江大学 一种面向移动设备的服务缓存系统架构及开发方法
CN102625349A (zh) * 2012-03-09 2012-08-01 浪潮通信信息系统有限公司 一种告警风暴下的数据处理方法
CN104362757A (zh) * 2014-11-27 2015-02-18 广西电网公司电力科学研究院 一种基于iec61850的变电站在线监测系统
CN106487574A (zh) * 2016-04-01 2017-03-08 国家计算机网络与信息安全管理中心 自动化运行维护监测系统
CN106502838A (zh) * 2016-11-02 2017-03-15 中车青岛四方机车车辆股份有限公司 列车数据的缓存方法、装置和系统
CN109194451A (zh) * 2018-08-17 2019-01-11 北汽福田汽车股份有限公司 车载终端的数据补发方法及车载终端
WO2022188624A1 (zh) * 2021-03-09 2022-09-15 华为技术有限公司 自动生成自治系统as标识的方法、第一网络设备及系统
CN114124655A (zh) * 2021-10-20 2022-03-01 曙光信息产业(北京)有限公司 网络监控方法、系统、装置、计算机设备和存储介质
CN114338671A (zh) * 2021-12-27 2022-04-12 广西电网有限责任公司 一种用于小水电站边缘计算网关数据处理方法
CN114095393A (zh) * 2022-01-20 2022-02-25 北京天维信通科技有限公司 自动挂载检测探针的sd-wan新建隧道节点监测方法
CN114791909A (zh) * 2022-04-11 2022-07-26 江苏安控智汇科技股份有限公司 一种基于物联网的数据采集处理方法及装置
CN114564370A (zh) * 2022-04-29 2022-05-31 天云软件技术有限公司 告警阈值的确定方法、装置、设备及计算机存储介质

Also Published As

Publication number Publication date
CN115664940A (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
CN110213068B (zh) 一种消息中间件的监控方法及相关设备
US20160283307A1 (en) Monitoring system, monitoring device, and test device
CN110224885B (zh) 设备监控的告警方法、装置、存储介质及电子设备
CN111966289B (zh) 基于Kafka集群的分区优化方法和系统
CN104731690A (zh) 适应性度量收集、存储、和警告阈值
CN112131073A (zh) 服务器的监控方法和系统
CN102957550A (zh) 基于日志检测的告警方法及系统
CN115664940B (zh) 分布式节点指标与告警缓存方法、装置和电子设备
CN113472858B (zh) 埋点数据处理方法、装置及电子设备
CN110543410A (zh) 一种处理集群指标的方法、查询集群指标的方法和装置
US20190386912A1 (en) Application-aware links
CN112751722B (zh) 数据传输质量监控方法和系统
JP2005250521A (ja) データ処理システム及びデータ処理装置及びデータ処理方法
JP4578371B2 (ja) 監視情報取得装置
CN114417200B (zh) 网络数据的采集方法、装置及电子设备
CN113835961B (zh) 告警信息监控方法、装置、服务器及存储介质
CN114281250A (zh) 存储文件的清理方法及装置、存储介质、电子装置
US20200382397A1 (en) System and method for detecting dropped aggregated traffic metadata packets
CN103684929A (zh) 服务器状态的监控系统及方法
CN109766462B (zh) 输电线路监控系统中的图像文件读取方法、装置及系统
CN108829563B (zh) 一种告警方法和告警装置
CN112148508A (zh) 一种信息处理的方法及相关装置
CN112749398B (zh) 数据传输通道控制方法和系统
CN115686381B (zh) 存储集群运行状态的预测方法及装置
CN114116502B (zh) 一种物联网型配变终端应用开发平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant