CN111555902B - 一种网络传输异常的定位系统和方法 - Google Patents
一种网络传输异常的定位系统和方法 Download PDFInfo
- Publication number
- CN111555902B CN111555902B CN202010218250.8A CN202010218250A CN111555902B CN 111555902 B CN111555902 B CN 111555902B CN 202010218250 A CN202010218250 A CN 202010218250A CN 111555902 B CN111555902 B CN 111555902B
- Authority
- CN
- China
- Prior art keywords
- node
- log information
- tracing
- protocol
- alarm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/064—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供一种网络传输异常的定位系统和方法,该方法包括:周期采集网络中各节点的日志信息,当节点在业务交互时,若所处理的协议状态为告警状态,则采集此刻与前一个周期采集时间点之间的告警日志信息;将告警日志信息与已采集的日志信息合并,并向前一时间段溯源;将告警日志信息与下一个周期采集时间点的日志信息合并得到完整衔接时间段的日志信息,并向后一时间段溯源;将前序溯源链路和后序溯源链路拼接得到完整溯源链路,根据告警日志信息和完整溯源链路确定网络传输异常节点、直接关联节点和异常起始节点;该方法能够将网络传输异常定位到协议级,并能够溯源异常发生的传输路径,进而能够获取直接关联节点以及造成异常的起始节点。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种网络传输异常的定位系统和方法。
背景技术
物联网环境下业务类型多样、设备节点异构,为满足不同的业务应用需求,各类设备节点往往引入未经鲁棒性验证的私有协议,且各私有协议间可能存在交互机制的冲突,从而导致网络通信及业务传输异常,由于私有协议格式的非对外公开性,网络监测人员较难锁定异常相关节点和具体业务交互过程。
目前,现有技术中主要采取提取与归并告警日志信息、监控网络节点报文信息以及向网络节点主动发送故障排查指令的方法实现对网络传输故障排查和定位;例如:专利号为CN201510381630的中国专利申请提出了一种网络节点故障的定位方法;该方法从冗余的告警节点中快速排查出故障节点,但是该专利将故障节点范围限定在发生了告警的节点,而忽略了由于不同私有协议间冲突的情况,往往未发生告警的节点的业务流程因素可能是造成故障的原因。
专利号为CN201510484578的中国专利申请提出了一种故障排查方法和系统;该方法能够获得节点上功能模块级的故障定位,并获得详细的故障原因;但是该专利需要监控各个功能模块的报文处理流程,以及进行大量的预设故障信息匹配,为网络传输带来过重负担。
专利号为CN201510498442的中国专利申请提出了一种在线故障排查方法及装置;该专利解决了跨区域、跨专业的网元节点故障排查;但是该专利需要向网络节点主动发送故障排查指令,属于侵入式排查,且逐个发送指令,排查和定位速度慢。
综上,现有网络排查故障定位方法存在如下问题:需要记录大量原始信息或向网络中发送探测信息,导致网络传输负担大;排查故障范围窄,仅限定在发出告警信息的节点中,但未发出告警的节点的某些业务流程由于不同私有协议间冲突,也可能引起网络出现异常;定位程度低,仅限于设备节点级或功能模块级,难以锁定具体出现问题的业务流程,不利于后续阶段传输故障的定向解决和业务交互的进一步优化。
发明内容
有鉴于此,本发明的目的在于提出一种网络传输异常的定位系统和方法,以解决现有技术中存在的网络传输负担大、排查故障范围窄和定位程度低的问题。
基于上述目的,本发明提供了一种网络传输异常的定位方法,所述定位方法包括:
步骤一:周期采集网络中各节点的日志信息,当节点在业务交互时,若所处理的协议状态为告警状态,则采集此刻与前一个周期采集时间点之间的告警日志信息;
步骤二:将告警日志信息与已采集的日志信息合并,并向前一时间段溯源,建立前序溯源链路;
步骤三:将告警日志信息与下一个周期采集时间点的日志信息合并得到完整衔接时间段的日志信息,并向后一时间段溯源,建立后序溯源链路;
步骤四:将前序溯源链路和后序溯源链路拼接得到完整溯源链路,再根据告警日志信息和完整溯源链路确定网络传输异常节点、直接关联节点和异常起始节点。
上述定位方法能够将网络传输异常定位到协议级,而且能够溯源异常发生的传输路径,进而能够获取直接关联节点和造成异常的起始节点,以及能够显示特定业务流程存在的问题,便于后期相应业务协议和节点间业务传输协议的优化以及告警状态的补充。
可选地,所述步骤二中,若向前一时间段溯源无法构造,则等待下一个周期采集时间点,并将下一个周期采集时间点的日志信息与告警日志信息合并得到完整衔接时间段的日志信息,再向前一时间段溯源。
可选地,所述向前一时间段溯源包括:
根据告警日志信息的输入节点,获取前一节点的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议状态的初始状态,或输入节点/输出节点为空,则停止回溯。
可选地,所述向前一时间段溯源还包括:如果前一节点的日志信息显示不属于该次业务交互,则认为当前节点为此次业务交互的起始节点,转为获取当前节点前一时间点不同状态的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议状态的初始状态,或输入节点/输出节点为空,则停止回溯。
可选地,所述向后一时间段溯源包括:
根据告警日志的输出节点,获取后一节点的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议的故障/结束状态,或输出节点为空,则停止溯源。
可选地,所述日志信息和告警日志信息均包括:节点进行业务处理的状态、输入节点、输出节点以及与节点相关的每一项业务协议的处置状态。
可选地,所述协议包括:TCP/IP协议栈中通用协议和物联网终端的私有协议。
可选地,所述周期采集网络中各节点的日志信息包括:
按照同一时钟源对网络中各节点进行时钟同步,并按照各自的时间周期采集各节点的日志信息。
本发明另一方面提供了一种网络传输异常的定位系统,该系统包括:存储器、与所述存储器连接的处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述定位方法。
从上面所述可以看出,本发明提供一种网络传输异常的定位方法至少包括如下效果:
本发明定位方法能够在物联网多协议环境下将网络传输异常定位到协议级,而且能够溯源异常发生的传输路径,进而能够获取直接关联节点和造成异常的起始节点,以及能够显示特定业务流程存在的问题,便于后期相应业务协议和节点间业务传输协议的优化以及告警状态的补充。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。
本发明中协议状态为该协议在传输交互中包含的自定义的有限状态,例如启动业务交互、发送数据、接收数据、重新连接、业务中断等表示常态或异常的状态量。
网络中各节点包括业务系统节点、网络/安全设备节点和其他物联网设备节点。
现有网络排查故障定位方法包括采取提取与归并告警日志信息、监控网络节点报文信息以及向网络节点主动发送故障排查指令的方法;但上述方法存在需要记录大量原始信息或向网络中发送探测信息,导致网络传输负担大;排查故障范围窄,仅限定在发出告警信息的节点中,但未发出告警的节点的某些业务流程由于不同私有协议间冲突,也可能引起网络出现异常;定位程度低,仅限于设备节点级或功能模块级,难以锁定具体出现问题的业务流程,不利于后续阶段传输故障的定向解决和业务交互的进一步优化。
针对上述问题,本发明提出一种网络传输异常的定位方法,该定位方法包括:
步骤一:按照同一时钟源对网络中各节点进行时钟同步,并按照各自的时间周期采集各节点的日志信息,当节点在业务交互时,若所处理的协议状态为告警状态,则采集此刻与前一个周期采集时间点之间的告警日志信息,其中,日志信息和告警日志信息均包括:节点进行业务处理的状态、输入节点、输出节点以及与节点相关的每一项业务协议的处置状态;
步骤二:将告警日志信息与已采集的日志信息合并,并向前一时间段溯源,建立前序溯源链路;
步骤三:将告警日志信息与下一个周期采集时间点的日志信息合并得到完整衔接时间段的日志信息,并向后一时间段溯源,建立后序溯源链路;
步骤四:将前序溯源链路和后序溯源链路拼接得到完整溯源链路,再根据告警日志信息和完整溯源链路确定网络传输异常节点、直接关联节点和异常起始节点。
上述定位方法能够将网络传输异常定位到协议级,而且能够溯源异常发生的传输路径,进而能够获取直接关联的节点和造成异常的起始节点,以及能够显示特定业务流程存在的问题,便于后期相应业务协议和节点间业务传输协议的优化以及告警状态的补充。
在一实施方式中,若向前一时间段溯源无法构造,则等待下一个周期采集时间点,并将下一个周期采集时间点的日志信息与告警日志信息合并得到完整衔接时间段的日志信息,再向前一时间段溯源。
在一实施方式中,向前一时间段溯源包括:
根据告警日志信息的输入节点,获取前一节点的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议状态的初始状态,或输入节点/输出节点为空,则停止回溯。
在一实施方式中,向前一时间段溯源还包括:如果前一节点的日志信息显示不属于该次业务交互,则认为当前节点为此次业务交互的起始节点,转为获取当前节点前一时间点不同状态的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议状态的初始状态,或输入节点/输出节点为空,则停止回溯。
在一实施方式中,向后一时间段溯源包括:
根据告警日志的输出节点,获取后一节点的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议的故障/结束状态,或输出节点为空,则停止溯源。
本发明中对节点处理的协议类型不作严格限制,例如,协议可以包括: TCP/IP协议栈中通用协议和物联网终端的私有协议。本发明上述定位方法能够在物联网多协议环境下实现对网络传输异常的定位,而且能够实现私有协议冲突故障定位。
本发明还提供一种网络传输异常的定位系统,该系统包括:存储器、与存储器连接的处理器,及存储在存储器上并可在处理器上运行的计算机程序,处理器运行计算机程序时执行上述定位方法。
以下通过具体实施例对本发明技术方案作进一步详细的解释说明。
实施例
本实施例网络中包含5个节点,具体为V1、V2、V3、V4和V5,各节点间业务交互涉及的协议情况如下:V1与V2之间通过协议P1、P6、P7完成业务交互,V2与V3之间通过协议P1、P5、P7完成业务交互,V3与V4之间通过协议P1、P2、P5、P7完成业务交互,V4与V5之间通过协议P1、P4、P7完成业务交互;假设本次故障的业务交互中,V5为业务交互起始节点,故障发生在V5与V4之间,无后续数据包传递。
按照同一时钟源对网络中各节点进行时钟同步,并按照各自的时间周期采集各节点的日志信息;
当V5节点的P4协议为告警状态时,则采集此刻与前一个周期采集时间点之间的告警日志信息,其中,日志信息和告警日志信息均包括:节点进行业务处理的状态、输入节点、输出节点以及与节点相关的每一项业务协议的处置状态;
将告警日志信息与已采集的日志信息合并,向前一时间段溯源;具体地:根据告警日志的输入节点,获取前一输入节点V4的日志信息,经判断前条日志信息不属于该次业务交互,则获取当前V5节点的前一条状态信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议状态的初始状态,或输入节点/输出节点为空,则停止回溯,通过该路径回溯,可以获得前一次业务交互在某一节点(例如V2) 处没有继续进行,而由于V2与V1间的协议机制未触及告警,因而溯源系统只收到了V5的告警,则获得前一时间段的前序溯源链路为V5→V4→V3 →V2;
将告警日志信息与下一个周期采集时间点的日志信息合并得到完整衔接时间段的日志信息,并向后一时间段溯源;具体地:根据告警日志的输出节点,获取下一节点V4的日志信息,再顺着数据包传递的方向构建链路,由于业务交互未继续进行,输出节点为空,则停止溯源;则获得后一时间段的后序溯源链路为V5→V4;
将前序溯源链路和后序溯源链路拼接,得到完整的溯源链路,再根据告警日志信息和完整溯源链路确定网络传输异常节点为V5、直接关联节点为V4和异常起始节点为V2。
上述定位方法能够将网络传输异常定位到协议级,而且能够溯源异常发生的传输路径,进而能够获取与告警节点直接关联的节点以及造成异常的起始节点,以及能够显示特定业务流程存在的问题,便于后期相应业务协议和节点间业务传输协议的优化以及告警状态的补充。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种网络传输异常的定位方法,其特征在于,包括:
步骤一:周期采集网络中各节点的日志信息,当节点在业务交互时,若所处理的协议状态为告警状态,则采集此刻与前一个周期采集时间点之间的告警日志信息;
步骤二:将告警日志信息与已采集的日志信息合并,并向前一时间段溯源,建立前序溯源链路;其中,所述向前一时间段溯源,包括:根据所述告警日志信息的输入节点,获取前一节点的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议状态的初始状态,或输入节点/输出节点为空,则停止回溯;
步骤三:将告警日志信息与下一个周期采集时间点的日志信息合并得到完整衔接时间段的日志信息,并向后一时间段溯源,建立后序溯源链路;其中,所述向后一时间段溯源,包括:根据所述告警日志的输出节点,获取后一节点的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议的故障/结束状态,或输出节点为空,则停止溯源;
步骤四:将前序溯源链路和后序溯源链路拼接得到完整溯源链路,再根据告警日志信息和完整溯源链路确定网络传输异常节点、直接关联节点和异常起始节点。
2.根据权利要求1所述的定位方法,其特征在于,所述步骤二中,若向前一时间段溯源无法构造,则等待下一个周期采集时间点,并将下一个周期采集时间点的日志信息与告警日志信息合并得到完整衔接时间段的日志信息,再向前一时间段溯源。
3.根据权利要求2所述的定位方法,其特征在于,所述向前一时间段溯源还包括:如果前一节点的日志信息显示不属于该次业务交互,则认为当前节点为此次业务交互的起始节点,转为获取当前节点前一时间点不同状态的日志信息,再顺着数据包传递的方向构建链路,直至遍历获取到各节点所涉及的该次业务交互相关协议状态的初始状态,或输入节点/输出节点为空,则停止回溯。
4.根据权利要求1所述的定位方法,其特征在于,所述日志信息和告警日志信息均包括:节点进行业务处理的状态、输入节点、输出节点以及与节点相关的每一项业务协议的处置状态。
5.根据权利要求1所述的定位方法,其特征在于,所述协议包括:TCP/IP协议栈中通用协议和物联网终端的私有协议。
6.根据权利要求1所述的定位方法,其特征在于,所述周期采集网络中各节点的日志信息包括:
按照同一时钟源对网络中各节点进行时钟同步,并按照各自的时间周期采集各节点的日志信息。
7.一种网络传输异常的定位系统,其特征在于,包括:存储器、与所述存储器连接的处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序;
所述处理器运行所述计算机程序时执行权利要求1-6任一项所述的定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010218250.8A CN111555902B (zh) | 2020-03-25 | 2020-03-25 | 一种网络传输异常的定位系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010218250.8A CN111555902B (zh) | 2020-03-25 | 2020-03-25 | 一种网络传输异常的定位系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111555902A CN111555902A (zh) | 2020-08-18 |
CN111555902B true CN111555902B (zh) | 2022-10-14 |
Family
ID=72007408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010218250.8A Active CN111555902B (zh) | 2020-03-25 | 2020-03-25 | 一种网络传输异常的定位系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111555902B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112905430B (zh) * | 2021-02-24 | 2023-06-13 | 浙江大华技术股份有限公司 | 日志输出方法、装置、存储介质及电子装置 |
CN113672939A (zh) * | 2021-08-23 | 2021-11-19 | 杭州安恒信息技术股份有限公司 | 一种终端行为告警溯源分析的方法、装置、设备及介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015010229A1 (zh) * | 2013-07-22 | 2015-01-29 | 华为技术有限公司 | 无线网络故障诊断方法和设备 |
CN105653419B (zh) * | 2014-11-11 | 2018-10-09 | 阿里巴巴集团控股有限公司 | 基于监控点的溯源实现方法及系统 |
CN107196895B (zh) * | 2016-11-25 | 2020-07-17 | 北京神州泰岳信息安全技术有限公司 | 网络攻击溯源实现方法及装置 |
CN108055148B (zh) * | 2017-12-08 | 2020-10-09 | 国网江苏省电力有限公司 | 一种自动化可溯源的电力无线专网网管诊断方法 |
CN110149350B (zh) * | 2019-06-24 | 2021-11-05 | 国网安徽省电力有限公司信息通信分公司 | 一种告警日志关联的网络攻击事件分析方法及装置 |
CN110839019A (zh) * | 2019-10-24 | 2020-02-25 | 国网福建省电力有限公司 | 一种面向电力监控系统的网络安全威胁溯源方法 |
-
2020
- 2020-03-25 CN CN202010218250.8A patent/CN111555902B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111555902A (zh) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Svoboda et al. | Network monitoring approaches: An overview | |
EP3987724A1 (en) | In-line performance monitoring | |
CN111555902B (zh) | 一种网络传输异常的定位系统和方法 | |
WO2017206841A1 (zh) | 一种网络设备的服务质量检测方法和装置 | |
CN103414916B (zh) | 一种故障诊断系统及方法 | |
CN101826989A (zh) | 一种故障处理方法和装置 | |
JP2004173136A (ja) | ネットワーク管理装置 | |
CN113708995B (zh) | 一种网络故障诊断方法、系统、电子设备及存储介质 | |
EP4032207A1 (en) | State machine handling at a proxy node in an ethernet-based fronthaul network | |
CN111934936B (zh) | 网络状态检测方法、装置、电子设备及存储介质 | |
CN112333044B (zh) | 分流设备性能测试方法、装置、系统、电子设备以及介质 | |
CN103262046A (zh) | 服务器管理装置、服务器管理方法和程序 | |
CN103078791A (zh) | Oam报文处理方法、设备及系统 | |
CN106664247B (zh) | 通信装置、通信系统和通信方法 | |
JP2006229399A (ja) | 通信システム、中継ノード及びそれらに用いる通信方法並びにそのプログラム | |
RU2730390C1 (ru) | Способ и устройство для автоматического определения топологии межузловой связи в совместно используемом резервном кольце трансокеанской мультиплексной секции | |
CN107612848B (zh) | 一种调试方法及装置、以及计算机可读存储介质 | |
CN101431435B (zh) | 一种基于面向连接的业务配置与管理方法 | |
CN115835275A (zh) | 一种5g cpe故障诊断的方法及装置 | |
JP6011540B2 (ja) | 診断システム | |
CN101321094A (zh) | 一种连通性故障的定位装置及方法 | |
CN107005440A (zh) | 一种链路故障定位的方法、装置及系统 | |
CN114765633A (zh) | 基于列车实时以太网协议的网络报文解析方法及装置 | |
US8571182B2 (en) | Systems and methods of masking non-service affecting alarms in a communication system | |
JP3897012B2 (ja) | パス故障検出方法および検出装置、ならびにそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |