CN114448835B - 一种时延周期性越限的告警处理方法 - Google Patents

一种时延周期性越限的告警处理方法 Download PDF

Info

Publication number
CN114448835B
CN114448835B CN202111590811.8A CN202111590811A CN114448835B CN 114448835 B CN114448835 B CN 114448835B CN 202111590811 A CN202111590811 A CN 202111590811A CN 114448835 B CN114448835 B CN 114448835B
Authority
CN
China
Prior art keywords
time
time delay
limit
delay
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111590811.8A
Other languages
English (en)
Other versions
CN114448835A (zh
Inventor
刘岩
左延智
霍永华
范斐
董忠磊
张立斌
付静
王宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 54 Research Institute
63921 Troops of PLA
Original Assignee
CETC 54 Research Institute
63921 Troops of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 54 Research Institute, 63921 Troops of PLA filed Critical CETC 54 Research Institute
Priority to CN202111590811.8A priority Critical patent/CN114448835B/zh
Publication of CN114448835A publication Critical patent/CN114448835A/zh
Application granted granted Critical
Publication of CN114448835B publication Critical patent/CN114448835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes

Abstract

本发明涉及网络运维和流量管控领域中时延周期性越限的告警处理方法,针对时延周期性的超限,时延超过正常值并没有影响业务工作,而又很难查找定位的问题,基于流量监测,观察测试流的时延越限告警事件是否有周期性,当发现时延越限告警后,定位时间点和间隔周期,查找发送源,监视进程运行清单,找到告警前后时间段启动运行停止的进程,基于时间进程匹配相关设备,确保告警定位的准确;判断时延超限告警事件出现的时间点是否为设定的工作时间范围,查找关联设备是否发生时延越限告警,将真正的时延越限故障与规定时间内正常工作运行且占用大部分进程的软件造成的时延越限,对于多种常态化应用场景的流量越限告警排查和定位具有强有力的支撑作用。

Description

一种时延周期性越限的告警处理方法
技术领域
本发明涉及到网络运维和流量管控领域,尤其涉及一种时延周期性越限的告警处理方法。
背景技术
随着业务多样化、业务融合化、网络开放化、终端智能化的融合发展,网络覆盖领域急剧拓展,新的应用大量涌现,网络流量激增,对多样化应用和重要业务的细粒度资源尚未达到;此外,目前网络中部署的流量监测和探测设备还只能针对单个节点和局部信息,从网络中获取的信息也相对孤立,对链路沿途多点信息的关联分析和综合呈现还很欠缺,无法实现流量的全程全域监测,在网络故障的快速定位、网络运行状态的综合评定等方面还都无法提供全面实时的数据基础;同时,各类网络监测手段独立建设,未形成合力。
在现有的IP网络通信中,经常会遇到丢包的情况,直观的表现形式就是视频图像中出现“马赛克”,甚至是视频画面停止,通过添加设备、增加网络带宽等方法就可以解决丢包问题。有些重要业务网,为了保密的需要,会在路由器后端部署保密机,这样网络传输的所有数据包均为加密数据。在这种情况下,一旦出现丢包,就很难定位丢包位置。了保密的需要在路由器后端部署保密机,在网络中传输加密后的数据包,导致难以进行常规的流量监测;一旦发生丢包,如图像出现“马赛克”时,很难精确定位丢包位置。因此亟需解决加密后的流量信息的丢包监测问题。
均匀发包是网络探针的一项重要功能之一,当网速升级到万兆后,相应地发包功能也需要提升到万兆,必须达到线速。原有软件发包的方式需要升级为硬件发包,因此提出了硬件流量生成的方法。如何对硬件发出的流量数据包进行检测是一个问题,不能直接采用自己的探针抓包来进行验证,可以设计一种第三方仪器仪表检验的方案。高精度数据采集卡每发送100个数据包输出一个电平信号,与上一次输出的极性相反,即观察到一次完整的方波信号,表示发送了200个数据包。通过测量这个方波的频率就能得到流量发送包频,查看数据记录趋势图可以验证发送的均匀程度。
随着网络的融合发展,网络覆盖领域急剧拓展,新的应用大量涌现,网络流量激增,网络传输带宽也由百/千兆扩容到万兆,而目前对网络流量的监测能力只限于千兆以下,对大带宽传输环节的流量监测还处于空白;此外,目前网络中部署的监测设备还只能针对单个节点和局部信息,从网络中获取的信息也相对孤立,对链路沿途多点信息的关联分析和综合呈现还很欠缺,无法实现流量的全程全域监测,在网络故障的快速定位、网络运行状态的综合评定等方面无法提供全面实时的数据基础;同时,流量监测方面还没有形成统一的、适合航天业务网应用特点的规范,各类网络监测手段独立建设,未形成合力。因此对大带宽全域流量感知监测技术的研究和网络流量监测规范的制定迫在眉睫。
发明内容
本发明所要解决的技术问题是针对时延周期性的超限,时延超过正常值并没有影响业务工作,而问题又很难查找定位的问题,提出一种时延周期性越限的告警处理方法。
本发明所采用的技术方案为:
一种时延周期性越限的告警处理方法,包括以下步骤:
S1:在业务网中部署网络探针监测网络流量,并观察测试流的时延越限告警事件是否有周期性,持续设定时间后时延自动恢复正常,如果是,则转入步骤S2;
S2:记录时延越限告警事件出现的时间点和间隔周期,形成故障事件报告表;
S3:判断时延超限告警事件出现的时间点是否为设定的工作时间范围,如果是,则判定为正常工作时间范围,转入步骤S4;否则转入步骤S5;
S4:根据测试流包含的源IP地址,确定测试流的发送设备,并查看该设备与其他设备之间的关联关系;如果其他关联设备发送的测试流也发生了时延越限告警,则判定发生时延越限告警的关联设备均发生故障;如果其他关联设备未发生时延越限告警,仅测试流的发送设备发生告警,则判定设备在正常执行任务过程中产生了时延越限,且周期性重复,转入步骤S6;
S5:根据测试流包含的源IP地址,确定测试流的发送设备,全程记录设备上的进程运行情况,连续记录设定时间段,形成事件和进程运行清单,按照清单中的时间先后次序排列,如果某个进程有规律地出现启动和运行,且一段时间后关闭退出,并且运行时间段与事件的持续时间相关,则判定该进程为怀疑对象;转入步骤S6;
S6:基于人工经验查找时延超限告警原因,排除故障;
完成时延周期性越限的告警分析处理。
本发明相对于现有技术的优点和创新点如下:
1、当发现时延越限告警后,定位时间点和间隔周期,查找发送源,基于发送源监视进程运行清单,找到告警前后时间段启动运行停止的进程,基于时间进程匹配相关设备,确保告警定位的准确性;
2、本发明首次将真正的时延越限故障与规定时间内正常工作运行且占用大部分进程的软件造成的时延越限,对于多种常态化应用场景的流量越限告警排查和定位具有强有力的支撑作用;
附图说明
图1是本发明的设计流程图;
具体实施方式
下面结合图1,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
一种时延周期性越限的告警处理方法,包括以下步骤:
S1:在业务网中部署网络探针监测网络流量,并观察测试流的时延越限告警事件是否有周期性,持续设定时间后时延自动恢复正常,如果是,则转入步骤S2;
S2:记录时延越限告警事件出现的时间点和间隔周期,形成故障事件报告表;
S3:判断时延超限告警事件出现的时间点是否为设定的工作时间范围,如果是,则判定为正常工作时间范围,转入步骤S4;否则转入步骤S5;
S4:根据测试流包含的源IP地址,确定测试流的发送设备,并查看该设备与其他设备之间的关联关系;如果其他关联设备发送的测试流也发生了时延越限告警,则判定发生时延越限告警的关联设备均发生故障;如果其他关联设备未发生时延越限告警,仅测试流的发送设备发生告警,则判定设备在正常执行任务过程中产生了时延越限,且周期性重复,转入步骤S6;
S5:根据测试流包含的源IP地址,确定测试流的发送设备,全程记录设备上的进程运行情况,连续记录设定时间段,形成事件和进程运行清单,按照清单中的时间先后次序排列,如果某个进程有规律地出现启动和运行,且一段时间后关闭退出,并且运行时间段与事件的持续时间相关,则判定该进程为怀疑对象;转入步骤S6;
S6:基于人工经验查找时延超限告警原因,排除故障;
在新疆某单位有一台业务处理机,向北京中心发送业务信息。平时工作正常,但是每天晚上24时左右出现时延偏大直至超限,该时延超限告警持续几分钟至十几分钟不等,然后又恢复正常。该单位反复查找故障原因,未发现设备运行故障。该单位没有部署网络探针,无法采集该设备的网络数据包,但在北京中心部署了网络探针,可以捕获目的地址的数据包,从而发现时延超限。根据故障特点分析,初步判断是某个应用干扰了正常的业务工作,进一步跟踪监测,发现是病毒检测软件,设置24小时进行的全盘查杀病毒,由于病毒监测软件频繁读取磁盘文件,影响了网络通信,从而造成时延超限;病毒查杀结束后,病毒检测软件进入休眠,通信恢复正常。由于病毒查杀操作在操作系统的后台运行,比较隐秘,因此一直未发现。修改病毒检测策略后,时延恢复正常。
完成时延周期性越限的告警分析处理。

Claims (1)

1.一种时延周期性越限的告警处理方法,其特征在于,包括以下步骤:
S1:在业务网中部署网络探针监测网络流量,并观察测试流的时延越限告警事件是否有周期性,且持续设定时间后时延自动恢复正常,如果是,则转入步骤S2;
S2:记录时延越限告警事件出现的时间点和间隔周期,形成故障事件报告表;
S3:判断时延越限告警事件出现的时间点是否为设定的工作时间范围,如果是,则判定为正常工作时间范围,转入步骤S4;否则转入步骤S5;
S4:根据测试流包含的源IP地址,确定测试流的发送设备,并查看该设备与其他设备之间的关联关系;如果其他关联设备发送的测试流也发生了时延越限告警,则判定发生时延越限告警的关联设备均发生故障;如果其他关联设备未发生时延越限告警,仅测试流的发送设备发生告警,则判定设备在正常执行任务过程中产生了时延越限,且周期性重复,转入步骤S6;
S5:根据测试流包含的源IP地址,确定测试流的发送设备,全程记录设备上的进程运行情况,连续记录设定时间段,形成事件和进程运行清单,按照清单中的时间先后次序排列,如果某个进程有规律地出现启动和运行,且一段时间后关闭退出,并且运行时间段与事件的持续时间相关,则判定该进程为怀疑对象;转入步骤S6;
S6:基于人工经验查找时延越限告警原因,排除故障;
完成时延周期性越限的告警分析处理。
CN202111590811.8A 2021-12-23 2021-12-23 一种时延周期性越限的告警处理方法 Active CN114448835B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111590811.8A CN114448835B (zh) 2021-12-23 2021-12-23 一种时延周期性越限的告警处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111590811.8A CN114448835B (zh) 2021-12-23 2021-12-23 一种时延周期性越限的告警处理方法

Publications (2)

Publication Number Publication Date
CN114448835A CN114448835A (zh) 2022-05-06
CN114448835B true CN114448835B (zh) 2024-02-27

Family

ID=81364576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111590811.8A Active CN114448835B (zh) 2021-12-23 2021-12-23 一种时延周期性越限的告警处理方法

Country Status (1)

Country Link
CN (1) CN114448835B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103001820A (zh) * 2012-04-25 2013-03-27 广东电网公司电力科学研究院 一种基于智能变电站交换机延时的在线检测报警方法
CN103178991A (zh) * 2011-12-21 2013-06-26 中国移动通信集团黑龙江有限公司 一种多网络关系分析的方法和系统
CN104377813A (zh) * 2014-09-17 2015-02-25 中国南方电网有限责任公司 具有时延管理功能的广域保护系统及实现时延管理功能的方法
CN105868876A (zh) * 2015-01-21 2016-08-17 国家电网公司 一种基于过程监视的集中运维故障闭环处理方法
CN113542039A (zh) * 2021-09-16 2021-10-22 浩鲸云计算科技股份有限公司 一种通过ai算法定位5g网络虚拟化跨层问题的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5538652B2 (ja) * 2010-12-20 2014-07-02 三菱電機株式会社 ネットワークの状態監視方式

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178991A (zh) * 2011-12-21 2013-06-26 中国移动通信集团黑龙江有限公司 一种多网络关系分析的方法和系统
CN103001820A (zh) * 2012-04-25 2013-03-27 广东电网公司电力科学研究院 一种基于智能变电站交换机延时的在线检测报警方法
CN104377813A (zh) * 2014-09-17 2015-02-25 中国南方电网有限责任公司 具有时延管理功能的广域保护系统及实现时延管理功能的方法
CN105868876A (zh) * 2015-01-21 2016-08-17 国家电网公司 一种基于过程监视的集中运维故障闭环处理方法
CN113542039A (zh) * 2021-09-16 2021-10-22 浩鲸云计算科技股份有限公司 一种通过ai算法定位5g网络虚拟化跨层问题的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄玉学 ; 刘明波 ; 朱忠 ; .综合信息传输平台自动化检测系统的设计.电子测量技术.2011,(第02期),全文. *

Also Published As

Publication number Publication date
CN114448835A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
EP3253018B1 (en) Network intrusion detection based on geographical information
CN105264861B (zh) 用于检测多阶段事件的方法和设备
CN114006723B (zh) 基于威胁情报的网络安全预测方法、装置及系统
CN113660115B (zh) 基于告警的网络安全数据处理方法、装置及系统
CN117319047A (zh) 一种基于网络安全异常检测的网络路径分析方法及系统
CN101252477B (zh) 一种网络故障根源的确定方法及分析装置
Roblee et al. Implementing large-scale autonomic server monitoring using process query systems
CN113794590A (zh) 处理网络安全态势感知信息的方法、装置及系统
CN114448835B (zh) 一种时延周期性越限的告警处理方法
CN110049317A (zh) 一种视频监控系统的在线故障检测方法、系统和电子设备
CN110969082B (zh) 一种时钟同步测试巡检方法和系统
CN114301796B (zh) 预测态势感知的验证方法、装置及系统
CN114006719B (zh) 基于态势感知的ai验证方法、装置及系统
CN114189361B (zh) 防御威胁的态势感知方法、装置及系统
CN112615848B (zh) 漏洞修复状态检测方法及系统
CN114257414A (zh) 一种网络安全智能值班方法及系统
CN104539941A (zh) 基于改进代码书的交通视频专网故障定位方法
CN113127856A (zh) 网络安全运维管理方法、装置、计算设备及存储介质
CN111193639A (zh) 一种网络质量检测处理方法及系统
CN115442279B (zh) 一种告警源定位方法、装置、设备及存储介质
JP2011160406A (ja) ネットワーク機器監視モニタ装置
CN116204386B (zh) 应用服务关系自动识别及监控方法、系统、介质和设备
CN111181812B (zh) 基于网络流量的链路故障检测方法
CN110022249B (zh) 基于反向波测技术的复杂网络环境网络延时监测方法
Prieto Suárez et al. Detecting disruption periods on tcp servers with passive packet traffic analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant