CN111988170B - 一种终端故障定位方法及装置 - Google Patents

一种终端故障定位方法及装置 Download PDF

Info

Publication number
CN111988170B
CN111988170B CN202010787594.0A CN202010787594A CN111988170B CN 111988170 B CN111988170 B CN 111988170B CN 202010787594 A CN202010787594 A CN 202010787594A CN 111988170 B CN111988170 B CN 111988170B
Authority
CN
China
Prior art keywords
terminal
network
fault
message
network device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010787594.0A
Other languages
English (en)
Other versions
CN111988170A (zh
Inventor
陈志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruijie Networks Co Ltd
Original Assignee
Ruijie Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruijie Networks Co Ltd filed Critical Ruijie Networks Co Ltd
Priority to CN202010787594.0A priority Critical patent/CN111988170B/zh
Publication of CN111988170A publication Critical patent/CN111988170A/zh
Application granted granted Critical
Publication of CN111988170B publication Critical patent/CN111988170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/10Mapping addresses of different types
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/622Layer-2 addresses, e.g. medium access control [MAC] addresses

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及通信技术领域,并公开了一种终端故障定位方法及装置,方法包括:获取故障终端的媒体访问控制MAC地址;根据故障终端的MAC地址和终端网络状态表确定故障终端的网络状态,终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的;根据故障终端的网络状态确定故障终端的故障。本发明基于网络设备遥测和旁路流量,实现信息的实时采集,保留故障现场,无需故障发生后再进行采集,减少故障复现及故障信息采集时间,无需故障排查人员参与,减少人员投入和缩短故障恢复时间。

Description

一种终端故障定位方法及装置
技术领域
本发明涉及通信技术领域,尤其涉及一种终端故障定位方法及装置。
背景技术
目前,随着网络规模和互联网应用的快速增长,人们越来越依赖于网络进行办公,若计算机的网络发生故障,则会对用户造成不可估计的损失,因此计算机等终端的网络故障的快速定位及解决对缩短网络恢复时间及降低用户因为网络故障导致的损失有着重要的意义。
传统的终端的网络故障定位是在用户报障后才进行数据采集和故障定位的,通常包括物理层故障排除(例如连接端口状态)、网络层故障排除(包括使用Ping工具、传输控制协议(Transmission Control Protocol,TCP)连通性探测等),这些检查项不仅需要借助探测工具及故障排除技术人员手动排除而且存在一定的局限性,比如终端开启防火墙时Ping工具无效,再比如对于发生在报障之前的故障无相关信息,这些局限性严重影响故障恢复时间。
发明内容
本申请提供了一种终端故障定位的方法及装置,用以解决如何高效准确的定位终端故障的问题。
第一方面,本申请实施例提供一种终端故障定位的方法,应用于各个网络设备连接的分析服务器中,包括:
获取故障终端的媒体访问控制MAC地址;
根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态,所述终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的;
根据所述故障终端的网络状态确定所述故障终端的故障。
上述方案,针对网络设备的设定报文定位到终端的设定报文,基于网络设备的端口信息定位到终端的端口信息,根据故障终端的MAC地址和终端网络状态表确定故障终端的网络状态,无需故障排查人员参与,减少人员投入和缩短故障恢复时间。
可选的,根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态之前,还包括:
采集各个网络设备的端口信息和设定报文;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息;
根据各个网络设备连接的各个终端的设定报文和端口信息,确定各个网络设备连接的各个终端的网络状态。
上述方案,基于网络设备连接的各个终端的端口信息和设定报文的实时采集,保留故障现场,无需故障发生后再进行采集,减少故障信息采集时间;针对网络设备的设定报文定位到终端的设定报文,基于网络设备的端口状态信息定位到终端的端口信息,通过采集各个网络设备的端口信息和设定报文并根据各个网络设备连接的各个终端的设定报文和端口信息,确定各个网络设备连接的各个终端的网络状态,最终形成终端网络状态表,从而高效准确的确定故障终端的网络状态。
可选的,从采集的设定报文中获取各个网络设备连接的各个终端的设定报文之前,还包括:
获取各个网络设备的地址解析协议ARP表以及MAC表;
根据各个网络设备的ARP表以及MAC表确定各个网络设备连接的各个终端的MAC地址、互联网协议地址IP地址以及端口;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息,包括:
根据各个网络设备连接的各个终端的IP地址从采集的设定报文中获取各个网络设备连接的各个终端的设定报文;
根据各个网络设备连接的各个终端的端口从采集的设定报文中获取各个网络设备连接的各个终端的端口信息。
上述方案,根据各个网络设备的ARP表以及MAC表确定各个网络设备连接的各个终端的MAC地址、互联网协议地址IP地址以及端口,从而针对网络设备的设定报文定位到终端的设定报文,基于网络设备的端口状态信息定位到终端的端口信息,高效定位终端的网络状态。
可选的,根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态,包括:
根据各个网络设备连接的各个终端的设定报文和端口信息确定各个网络设备连接的各个终端的网络参数;
从网络参数与网络状态的对照关系中确定各个网络设备连接的各个终端的网络参数对应的网络状态;其中,网络参数包括端口状态、端口上下行流量状态、报文应答状态、报文流量状态和是否成功获取IP地址。
上述方案,通过设定的网络参数和网络状态的对照关系,确定终端当前的网络状态,同时,将网络参数包括端口状态、端口上下行流量状态、报文应答状态、报文流量状态和是否成功获取IP地址进行综合分析,快速确定终端的网络状态。
可选的,根据各个网络设备连接的各个终端的设定报文和端口信息确定各个网络设备连接的各个终端的网络参数,包括:
根据各个网络设备的端口连接情况确定各个网络设备连接的各个终端的端口状态;
解析各个网络设备的端口上下行流量确定各个网络设备连接的各个终端的端口上下行流量状态;
若设定报文为传输控制协议TCP报文,则识别所述TCP报文确定各个网络设备连接的各个终端的报文应答状态;
若设定报文为域名系统DNS报文,则识别所述DNS报文确定各个网络设备连接的各个终端的报文流量状态;
若设定报文为动态主机配置协议DHCP报文,则根据所述DHCP报文判断各个网络设备连接的各个终端是否成功获取IP地址。
上述方案,通过识别TCP控制报文、DNS报文以及DHCP报文生成终端的数据特征,从而高效定位终端的报文流量状态。并且解析各个网络设备的端口上下行流量确定各个终端的端口上下行流量状态,高效准确的生成各个终端的网络参数。
可选的,根据所述故障终端的网络状态确定所述故障终端的故障,包括:
若所述故障终端的网络状态为离线,则检测所述故障终端的网络物理连接情况,若所述故障终端的网络物理连接情况异常,则确定所述故障终端的故障为网络物理连接异常;
若所述故障终端的网络状态为没有IP地址,则根据所述故障终端的IP地址是动态IP地址或者静态IP地址检查所述故障终端的IP配置是否正确,若所述故障终端对应的IP配置不正确,则确定所述故障终端的故障为IP配置异常;
若所述故障终端的网络状态为网络数据传输异常,则检查所述故障终端对应的网络层传输情况,若所述故障终端对应的网络层传输情况存在异常,则确定所述故障终端的故障为网络传输异常;
若所述故障终端的网络状态为网络连接状态正常,则确定所述故障终端的故障为业务层异常;
若所述故障终端的网络状态为未知,则根据所述故障终端历史的网络状态确定所述故障终端的网络故障。
上述方案,将终端的网络状态定位到不同的故障,明确了故障定界,从而有效缩短故障排查时间。
第二方面,本申请实施例提供一种终端故障定位的装置,所述装置包括:
获取模块,用于获取故障终端的MAC地址;
处理模块,用于根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态,所述终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的;根据所述故障终端的网络状态确定所述故障终端的故障。
可选的,所述处理模块还用于:
根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态之前,采集各个网络设备的端口信息和设定报文;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息;
根据各个网络设备连接的各个终端的设定报文和端口信息,确定各个网络设备连接的各个终端的网络状态。
可选的,所述处理模块还用于:从采集的设定报文中获取各个网络设备连接的各个终端的设定报文之前,获取各个网络设备的地址解析协议ARP表以及MAC表;
根据各个网络设备的ARP表以及MAC表确定各个网络设备连接的各个终端的MAC地址、互联网协议地址IP地址以及端口;
所述处理器,用于从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息,具体用于:
根据各个网络设备连接的各个终端的IP地址从采集的设定报文中获取各个网络设备连接的各个终端的设定报文;
根据各个网络设备连接的各个终端的端口从采集的设定报文中获取各个网络设备连接的各个终端的端口信息。
可选的,所述处理模块具体用于:
根据各个网络设备连接的各个终端的设定报文和端口信息确定各个网络设备连接的各个终端的网络参数;
从网络参数与网络状态的对照关系中确定各个网络设备连接的各个终端的网络参数对应的网络状态;其中,网络参数包括端口状态、端口上下行流量状态、报文应答状态、报文流量状态和是否成功获取IP地址。
可选的,所述处理模块具体用于:
根据各个网络设备的端口连接情况确定各个网络设备连接的各个终端的端口状态;
解析各个网络设备的端口上下行流量确定各个网络设备连接的各个终端的端口上下行流量状态;
若设定报文为传输控制协议TCP报文,则识别所述TCP报文确定各个网络设备连接的各个终端的报文应答状态;
若设定报文为域名系统DNS报文,则识别所述DNS报文确定各个网络设备连接的各个终端的报文流量状态;
若设定报文为动态主机配置协议DHCP报文,则根据所述DHCP报文判断各个网络设备连接的各个终端是否成功获取IP地址。
可选的,所述处理模块具体用于:
若所述故障终端的网络状态为离线,则检测所述故障终端的网络物理连接情况,若所述故障终端的网络物理连接情况异常,则确定所述故障终端的故障为网络物理连接异常;
若所述故障终端的网络状态为没有IP地址,则根据所述故障终端的IP地址是动态IP地址或者静态IP地址检查所述故障终端的IP配置是否正确,若所述故障终端对应的IP配置不正确,则确定所述故障终端的故障为IP配置异常;
若所述故障终端的网络状态为网络数据传输异常,则检查所述故障终端对应的网络层传输情况,若所述故障终端对应的网络层传输情况存在异常,则确定所述故障终端的故障为网络传输异常;
若所述故障终端的网络状态为网络连接状态正常,则确定所述故障终端的故障为业务层异常;
若所述故障终端的网络状态为未知,则根据所述故障终端历史的网络状态确定所述故障终端的网络故障。
相应的,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述终端故障定位的方法。
相应的,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述终端故障定位的方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种终端故障定位的方法的系统框架;
图2为本发明实施例提供的一种终端故障定位的方法的流程示意图;
图3为本发明实施例提供的一种终端的地址信息获取的方法的流程示意图;
图4为本发明实施例提供的一种终端故障定位的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
首先,对本申请中的部分用语进行解释说明,以便使本领域技术人员理解。
遥测:遥测是将对象参量的近距离测量值传输至远距离的测量站来实现远距离测量的技术。
本发明实施例提供一种终端故障定位的方法,本发明实施例提供的终端故障定位的方法,可以适用于如图1所示的系统架构中,该系统架构包括网络设备100,采集服务器200、分析服务器300以及终端400。
其中,采集服务器200用于实时采集各网络设备100的端口信息和各网络设备100的设定报文;针对任一网络设备100连接的任一终端400,从网络设备100的设定报文中获取终端400的设定报文,并从网络设备100的端口信息中获取终端400的端口信息;
分析服务器300用于根据终端400的设定报文和端口信息,确定终端400的网络状态。
在一种可能的实施方式中,采集服务器200以及分析服务器300可以由同一服务器实现。
需要说明的是,图1仅是本申请实施例系统架构的一种示例,本申请对此不做具体限定。
基于上述所示意的系统架构,图2为本发明实施例提供的一种终端故障定位的方法所对应的流程示意图,如图2所示,该方法包括:
步骤201,获取故障终端的媒体访问控制(Media Access Control Address)MAC地址。
步骤202,根据故障终端的MAC地址和终端网络状态表确定故障终端的网络状态。
需要说明的是,终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的;
步骤203,根据故障终端的网络状态确定故障终端的故障。
上述方案,基于网络设备连接的各个终端的端口信息和设定报文的实时采集,保留故障现场,无需故障发生后再进行采集,减少故障信息采集时间;针对网络设备的设定报文定位到终端的设定报文,基于网络设备的端口信息定位到终端的端口信息,从而确定了终端的网络状态,无需故障排查人员参与,减少人员投入和缩短故障恢复时间。
本申请实施例,在步骤202之前,采集各个网络设备的端口信息和设定报文;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息;
根据各个网络设备连接的各个终端的设定报文和端口信息,确定各个网络设备连接的各个终端的网络状态。
本申请实施例中,可以通过在网络设备上部署远程网络流量监控技术——封装远程端口镜像(Encapsulated Remote Switch Port Analyzer,ERSPAN),得到网络设备的设定报文;通过在网络设备的遥测技术得到网络设备的端口信息。
需要说明的是,ERSPAN是远程端口镜像(Remote Switch Port Analyzer,RSPAN)的扩展。普通的RSPAN,镜像数据报文只能在二层内传输,无法经过路由的网络,而ERSPAN却可以将镜像报文在路由的网络间传输。ERSPAN实现的功能是将所有的被镜像报文通过一个通用路由封装(Generic Routing Encapsulation,GRE)GRE隧道封装成IP报文,路由到远端镜像设备的目的端口。
进一步的,根据采集服务器地址将在网络设备上采集的信息发送至采集服务器。
本申请实施例中,基于网络设备遥测技术定期获取网络设备上配置的ARP表、MAC表。进一步的,基于网络设备遥测技术实时获取网络设备的端口状态、端口上下行流量状态。
具体来说,本申请提供了如图3所示的终端的信息获取的方法流程。如图3所示:
步骤301,获取各个网络设备的地址解析协议ARP表以及MAC表。
步骤302,根据各个网络设备的ARP表以及MAC表确定各个网络设备连接的各个终端的MAC地址、互联网协议地址IP地址以及端口。
具体的,采集分析服务器解析ARP表、MAC表并建立以MAC为Key的终端信息映射关系,从而建立了终端接入的网络设备的端口与终端的IP地址的关系。
具体的,采集分析服务器根据ARP表、MAC表建立终端的MAC地址与终端接入的网络设备的端口地址的关系,并建立终端的MAC地址与终端的IP地址的关系,从而以终端的MAC地址为键建立了终端接入的网络设备的端口地址与终端的IP地址的关系。
举例来说,如表1所示:
表1
Figure BDA0002622569760000101
从表1中可以看出,终端的MAC地址为AA:BB:CC:DD:EE:FF,终端接入的网络设备的端口地址为192.168.2.101:G0/1,终端的IP地址为192.168.1.2。
基于此,根据各个网络设备连接的各个终端的IP地址从采集的设定报文中获取各个网络设备连接的各个终端的设定报文。
进一步的,根据各个网络设备连接的各个终端的端口从采集的设定报文中获取各个网络设备连接的各个终端的端口信息。上述方案,根据各网络设备的ARP信息确定与各网络设备连接的各终端的地址信息,从而根据终端的地址信息中的IP地址获取终端的设定报文以及根据终端地址信息中的端口获取终端的端口信息,高效定位终端的网络状态。
本申请实施例中,在确定各个网络设备连接的各个终端的网络状态之前,根据各个网络设备连接的各个终端的设定报文和端口信息确定各个网络设备连接的各个终端的网络参数。
具体的,根据各个网络设备的端口连接情况确定各个网络设备连接的各个终端的端口状态;
解析各个网络设备的端口上下行流量确定各个网络设备连接的各个终端的端口上下行流量状态;
若设定报文为传输控制协议TCP报文,则识别TCP报文确定各个网络设备连接的各个终端的报文应答状态;
若设定报文为域名系统DNS报文,则识别DNS报文确定各个网络设备连接的各个终端的报文流量状态;
若设定报文为动态主机配置协议DHCP报文,则根据DHCP报文判断各个网络设备连接的各个终端是否成功获取IP地址。上述方案,通过识别TCP控制报文、DNS报文以及DHCP报文生成终端的数据特征,从而高效定位终端的报文流量状态。并且解析各个网络设备的端口上下行流量确定各个终端的端口上下行流量状态,高效准确的生成各个终端的网络参数。
具体的,以终端的IP地址对DNS报文进行分组,按时间排序并判断DNS请求报文是否得到应答;以终端的IP地址对TCP控制报文进行分组,按时间排序并判断TCP请求报文是否得到应答;以DHCP报文中的终端MAC地址为key对DHCP报文进行分组。
进一步的,对于有TCP报文的终端,生成终端的TCP控制报文应答状态,分别为终端的TCP控制报文请求得到应答以及终端的TCP控制报文请求没有得到应答。
同样的,对于有DNS报文的终端,生成终端的DNS报文应答状态,分别为终端的DNS报文请求得到应答以及终端的DNS报文请求没有得到应答。同样的,对于有DNS报文的终端,根据DHCP报文判断终端是否成功获取IP地址。
本申请实施例中,采集分析服务器根据采集到的信息做如下操作:
S1、解析网络设备的端口信息,其中根据端口信息中的端口上下行流量可以得出存在上行流量/不存在上行流量以及存在下行流量/不存在下行流量等几种情况;根据端口信息中的端口状态,得到终端的连接端口为UP状态或DOWN状态。
具体的,当端口检测到上行流量,则为存在上行流量;当端口检测不到上行流量,则为不存在上行流量;当端口检测到下行流量,则为存在下行流量;当端口检测不到下行流量,则为不存在下行流量。
终端的连接端口指示了终端的连接端口的物理属性,终端的连接端口为UP状态表示该端口处于可连接状态,DOWN状态表示该端口处于不可连接状态。
S2、解析DHCP报文,对于有DHCP报文的终端,生成终端的DHCP状态,包括终端获取IP成功/终端获取IP失败。
S3、识别TCP控制报文,对于有TCP报文的终端,生成终端的TCP请求报文应答状态。
S4、识别DNS报文,对于有DNS报文的终端生成终端的DNS请求报文应答状态。
S5、根据S3和S4产生的终端应答状态生成终端的IP报文应答/无应答状态。
S6、根据是否存在以终端的IP地址为源地址的TCP报文和DNS报文,生成终端的IP报文流量状态。
S7、将上述步骤生成的数据,结合表1,生成终端的网络参数,如表2所示:
表2
Figure BDA0002622569760000131
需要说明的是,上述步骤S6即对应表2中的终端存在非DHCP的IP流量或终端不存在非DHCP的IP流量。
在步骤202中,终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的。
具体的,根据各个网络设备连接的各个终端的设定报文和端口信息确定各个网络设备连接的各个终端的网络参数;
从网络参数与网络状态的对照关系中确定各个网络设备连接的各个终端的网络参数对应的网络状态;
需要说明的是,网络参数包括端口状态、端口上下行流量状态、报文应答状态、报文流量状态和是否成功获取IP地址。
上述方案,通过设定的网络参数和网络状态的对照关系,确定终端当前的网络状态,同时,将网络参数包括端口状态、端口上下行流量状态、报文应答状态、报文流量状态和是否成功获取IP地址进行关联分析,快速准确识别终端的网络状态。举例来说,网络参数与网络状态的对照关系如表3所示:
表3
1 2 3 4 5 6 7
Port_UP
Port_DOWN
Port_Upstream_Traffic
Port_Upstream_NO_Traffic
Port_Downstream_Traffic
Port_Downstream_NO_Traffic
Terminal_DHCP_SUCCESS
Terminal_DHCP_FAILURE
Terminal_IP_Traffic
Terminal_NO_IP_Traffic
Tenminal_NO_RESPONSE
Terminal_RESPONSE
终端状态 D C B A E E E
需要说明的是,表3中终端状态一列则对应了表2中的终端的网络参数。终端的网络参数包含了多种特征,当终端的网络参数满足一种或几种特征时,则确定了终端状态。其中,A、B、C、D等为预先定义的不同的终端状态。在一种可能的实施方式中,如表4所示:
表4
Figure BDA0002622569760000141
本申请实施例中,所述终端的网络状态包括A离线状态、B没有IP地址状态、C网络数据传输异常、D网络连接状态正常以及E状态未知;
本申请实施例中,表3中列举7种网络参数与网络状态的对照关系。
举例来说,当终端满足终端的请求没有得到应答Tenminal_NO_RESPONSE以及终端存在非DHCP的IP流量Terminal_IP_Traffic时,终端状态为C网络数据传输异常。
再比如,当终端满足终端获取IP成功Terminal_DHCP_SUCCESS、终端不存在非DHCP的IP流量Terminal_NO_IP_Traffic时,终端状态为E状态未知。
具体的,本申请实施例中,若故障终端的网络状态为离线,则检测故障终端的网络物理连接情况,若故障终端的网络物理连接情况异常,则确定故障终端的故障为网络物理连接异常;
若故障终端的网络状态为没有IP地址,则根据故障终端的IP地址是动态IP地址或者静态IP地址检查故障终端的IP配置是否正确,若故障终端对应的IP配置不正确,则确定故障终端的故障为IP配置异常;
若故障终端的网络状态为网络数据传输异常,则检查故障终端对应的网络层传输情况,若故障终端对应的网络层传输情况存在异常,则确定故障终端的故障为网络传输异常;
若故障终端的网络状态为网络连接状态正常,则确定故障终端的故障为业务层异常;
若故障终端的网络状态为未知,则根据故障终端历史的网络状态确定故障终端的网络故障。在一种可能的实施方式中,终端的网络状态以表5的形式记录,如表5所示:
表5
Figure BDA0002622569760000151
从表5中可以看出,终端的MAC地址为AA:BB:CC:DD:EE:FF的终端在时间为2019/10/10 10:10:10的终端状态为Terminal_Status_DOWN。
进一步的,本申请实施例中,当大量的终端处于获取不到状态时,可能是DHCP服务器故障。
上述方案,基于网络设备遥测和旁路流量,实现信息的实时采集,保留故障现场,无需故障发送后再进行采集,减少故障信息采集时间,无需故障排查人员参与,减少人员投入和缩短故障恢复时间。将网络设备遥测的端口状态、端口流量、旁路流量提取的TCP报文、DNS报文、DHCP报文进行关联分析,快速准确识别终端的网络状态。此外,使用ERSPAN提取比直接旁路流量少的报文,减少冗余数据的采集,提高数据处理能力。
基于同一发明构思,图4示例性的示出了本发明实施例提供的一种终端故障定位的装置,该装置可以为终端故障定位的方法的流程。
所述终端故障定位的装置,包括:
获取模块401,用于获取故障终端的MAC地址;
处理模块402,用于根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态,所述终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的;根据所述故障终端的网络状态确定所述故障终端的故障。
可选的,所述处理模块402还用于:
根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态之前,采集各个网络设备的端口信息和设定报文;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息;
根据各个网络设备连接的各个终端的设定报文和端口信息,确定各个网络设备连接的各个终端的网络状态。
可选的,所述处理模块402还用于;从采集的设定报文中获取各个网络设备连接的各个终端的设定报文之前,获取各个网络设备的地址解析协议ARP表以及MAC表;
根据各个网络设备的ARP表以及MAC表确定各个网络设备连接的各个终端的MAC地址、互联网协议地址IP地址以及端口;
所述处理模块402,用于从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息,具体用于:
根据各个网络设备连接的各个终端的IP地址从采集的设定报文中获取各个网络设备连接的各个终端的设定报文;
根据各个网络设备连接的各个终端的端口从采集的设定报文中获取各个网络设备连接的各个终端的端口信息。
可选的,所述处理模块402具体用于:
根据各个网络设备连接的各个终端的设定报文和端口信息确定各个网络设备连接的各个终端的网络参数;
从网络参数与网络状态的对照关系中确定各个网络设备连接的各个终端的网络参数对应的网络状态;其中,网络参数包括端口状态、端口上下行流量状态、报文应答状态、报文流量状态和是否成功获取IP地址。
可选的,所述处理模块402具体用于:
根据各个网络设备的端口连接情况确定各个网络设备连接的各个终端的端口状态;
解析各个网络设备的端口上下行流量确定各个网络设备连接的各个终端的端口上下行流量状态;
若设定报文为TCP报文,则识别所述TCP报文确定各个网络设备连接的各个终端的报文应答状态;
若设定报文为DNS报文,则识别所述DNS报文确定各个网络设备连接的各个终端的报文流量状态;
若设定报文为DHCP报文,则根据所述DHCP报文判断各个网络设备连接的各个终端是否成功获取IP地址。
可选的,所述处理模块402具体用于:
若所述故障终端的网络状态为离线,则检测所述故障终端的网络物理连接情况,若所述故障终端的网络物理连接情况异常,则确定所述故障终端的故障为网络物理连接异常;
若所述故障终端的网络状态为没有IP地址,则根据所述故障终端的IP地址是动态IP地址或者静态IP地址检查所述故障终端的IP配置是否正确,若所述故障终端对应的IP配置不正确,则确定所述故障终端的故障为IP配置异常;
若所述故障终端的网络状态为网络数据传输异常,则检查所述故障终端对应的网络层传输情况,若所述故障终端对应的网络层传输情况存在异常,则确定所述故障终端的故障为网络传输异常;
若所述故障终端的网络状态为网络连接状态正常,则确定所述故障终端的故障为业务层异常;
若所述故障终端的网络状态为未知,则根据所述故障终端历史的网络状态确定所述故障终端的网络故障。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种终端故障定位的方法,应用于各个网络设备连接的分析服务器中,其特征在于,所述方法包括:
获取故障终端的媒体访问控制MAC地址;
根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态,所述终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的;
根据所述故障终端的网络状态确定所述故障终端的故障;
其中,根据各个网络设备连接的各个终端的设定报文和端口信息确定所述终端网络状态表,包括:
根据各个所述网络设备的端口连接情况确定连接的各个所述终端的端口状态;
根据各个所述网络设备的端口上下行流量确定各个所述终端的端口上下行流量状态;
根据所述设定报文确定各个所述网络设备的连接的各个所述终端的数据特征,根据所述数据特征确定所述终端的报文流量状态;
根据所述端口状态、所述端口上下行流量状态以及所述报文流量状态,确定所述终端网络状态表。
2.如权利要求1所述的方法,其特征在于,根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态之前,还包括:
采集各个网络设备的端口信息和设定报文;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息;
根据各个网络设备连接的各个终端的设定报文和端口信息,确定各个网络设备连接的各个终端的网络状态。
3.如权利要求2所述的方法,其特征在于,从采集的设定报文中获取各个网络设备连接的各个终端的设定报文之前,还包括:
获取各个网络设备的地址解析协议ARP表以及MAC表;
根据各个网络设备的ARP表以及MAC表确定各个网络设备连接的各个终端的MAC地址、互联网协议地址IP地址以及端口;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息,包括:
根据各个网络设备连接的各个终端的IP地址从采集的设定报文中获取各个网络设备连接的各个终端的设定报文;
根据各个网络设备连接的各个终端的端口从采集的设定报文中获取各个网络设备连接的各个终端的端口信息。
4.如权利要求2所述的方法,其特征在于,根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态,包括:
根据各个网络设备连接的各个终端的设定报文和端口信息确定各个网络设备连接的各个终端的网络参数;
从网络参数与网络状态的对照关系中确定各个网络设备连接的各个终端的网络参数对应的网络状态;其中,网络参数包括端口状态、端口上下行流量状态、报文应答状态、报文流量状态和是否成功获取IP地址。
5.如权利要求4所述的方法,其特征在于,根据各个网络设备连接的各个终端的设定报文确定各个网络设备连接的各个终端的网络参数,包括:
若设定报文为传输控制协议TCP报文,则识别所述TCP报文确定各个网络设备连接的各个终端的报文应答状态;
若设定报文为域名系统DNS报文,则识别所述DNS报文确定各个网络设备连接的各个终端的报文流量状态;
若设定报文为动态主机配置协议DHCP报文,则根据所述DHCP报文判断各个网络设备连接的各个终端是否成功获取IP地址。
6.如权利要求1-5任一所述的方法,其特征在于,根据所述故障终端的网络状态确定所述故障终端的故障,包括:
若所述故障终端的网络状态为离线,则检测所述故障终端的网络物理连接情况,若所述故障终端的网络物理连接情况异常,则确定所述故障终端的故障为网络物理连接异常;
若所述故障终端的网络状态为没有IP地址,则根据所述故障终端的IP地址是动态IP地址或者静态IP地址检查所述故障终端的IP配置是否正确,若所述故障终端对应的IP配置不正确,则确定所述故障终端的故障为IP配置异常;
若所述故障终端的网络状态为网络数据传输异常,则检查所述故障终端对应的网络层传输情况,若所述故障终端对应的网络层传输情况存在异常,则确定所述故障终端的故障为网络传输异常;
若所述故障终端的网络状态为网络连接状态正常,则确定所述故障终端的故障为业务层异常;
若所述故障终端的网络状态为未知,则根据所述故障终端历史的网络状态确定所述故障终端的网络故障。
7.一种终端故障定位的装置,其特征在于,包括:
获取模块,用于获取故障终端的MAC地址;
处理模块,用于根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态,所述终端网络状态表是根据各个网络设备连接的各个终端的设定报文和端口信息确定的;根据所述故障终端的网络状态确定所述故障终端的故障;
其中,所述处理模块还用于,根据各个所述网络设备的端口连接情况确定连接的各个所述终端的端口状态;根据各个所述网络设备的端口上下行流量确定各个所述终端的端口上下行流量状态;根据所述设定报文确定各个所述网络设备的连接的各个所述终端的数据特征,根据所述数据特征确定所述终端的报文流量状态;根据所述端口状态、所述端口上下行流量状态以及所述报文流量状态,确定所述终端网络状态表。
8.如权利要求7所述的装置,其特征在于,所述处理模块还用于:
根据所述故障终端的MAC地址和终端网络状态表确定所述故障终端的网络状态之前,采集各个网络设备的端口信息和设定报文;
从采集的设定报文中获取各个网络设备连接的各个终端的设定报文,并从采集的端口信息中获取各个网络设备连接的各个终端的端口信息;
根据各个网络设备连接的各个终端的设定报文和端口信息,确定各个网络设备连接的各个终端的网络状态。
9.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至6任一项所述的方法。
10.一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至6任一项所述的方法。
CN202010787594.0A 2020-08-07 2020-08-07 一种终端故障定位方法及装置 Active CN111988170B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010787594.0A CN111988170B (zh) 2020-08-07 2020-08-07 一种终端故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010787594.0A CN111988170B (zh) 2020-08-07 2020-08-07 一种终端故障定位方法及装置

Publications (2)

Publication Number Publication Date
CN111988170A CN111988170A (zh) 2020-11-24
CN111988170B true CN111988170B (zh) 2023-04-28

Family

ID=73446061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010787594.0A Active CN111988170B (zh) 2020-08-07 2020-08-07 一种终端故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN111988170B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113746704A (zh) * 2021-09-08 2021-12-03 迈普通信技术股份有限公司 故障监测方法、装置、电子设备及计算机可读存储介质
CN114221882A (zh) * 2021-12-23 2022-03-22 锐捷网络股份有限公司 故障链路检测方法、装置、设备和存储介质
CN114866456A (zh) * 2022-04-22 2022-08-05 新华三工业互联网有限公司 一种报文发送方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219091A (zh) * 2014-08-27 2014-12-17 中国科学院计算技术研究所 一种网络运行故障检测系统及其方法
CN107493183A (zh) * 2016-06-13 2017-12-19 中国移动通信集团北京有限公司 一种故障定位方法及装置
CN109428741A (zh) * 2017-08-22 2019-03-05 中兴通讯股份有限公司 一种网络故障的检测方法及装置
CN109495322A (zh) * 2018-12-25 2019-03-19 华为技术有限公司 网络故障定位方法、相关设备及计算机存储介质
CN110611596A (zh) * 2019-09-30 2019-12-24 广州竞远安全技术股份有限公司 一种局域网故障定位系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10560311B2 (en) * 2015-10-14 2020-02-11 Hitachi Ltd. Management apparatus, management method, and recording medium
CN106502853B (zh) * 2016-12-23 2018-06-26 北京华杰代克科技有限公司 嵌入式智能故障检测报警系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219091A (zh) * 2014-08-27 2014-12-17 中国科学院计算技术研究所 一种网络运行故障检测系统及其方法
CN107493183A (zh) * 2016-06-13 2017-12-19 中国移动通信集团北京有限公司 一种故障定位方法及装置
CN109428741A (zh) * 2017-08-22 2019-03-05 中兴通讯股份有限公司 一种网络故障的检测方法及装置
CN109495322A (zh) * 2018-12-25 2019-03-19 华为技术有限公司 网络故障定位方法、相关设备及计算机存储介质
CN110611596A (zh) * 2019-09-30 2019-12-24 广州竞远安全技术股份有限公司 一种局域网故障定位系统

Also Published As

Publication number Publication date
CN111988170A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN111988170B (zh) 一种终端故障定位方法及装置
CN103138988B (zh) 网络故障的定位处理方法及装置
US8245079B2 (en) Correlation of network alarm messages based on alarm time
WO2015135417A1 (en) Method and system for monitoring quality of data transmission in idc network
CN106130786A (zh) 一种网络故障的检测方法及装置
CN108092854A (zh) 基于iec61375协议的列车级以太网设备的测试方法及装置
CN111030873A (zh) 一种故障诊断方法及装置
CN113938395B (zh) 数据分析方法、系统、设备及存储介质
CN110708715B (zh) 一种5g基站业务故障查找方法及装置
CN103905219A (zh) 一种业务平台中通信信息的监控存储系统及方法
CN114363151A (zh) 故障检测方法和装置、电子设备和存储介质
CN111683044A (zh) 一种正向隔离装置策略自动检测方法及装置
CN101252477B (zh) 一种网络故障根源的确定方法及分析装置
CN104950832B (zh) 钢铁厂控制系统
CN107566170B (zh) 一种基于规则库的配网自动化远动通道自动检测方法
CN104378246B (zh) 一种网络设备故障定位系统、方法及装置
CN110768871B (zh) 一种自动统计dcs系统数据传输正确性的测试方法及系统
CN112532467B (zh) 用于实现故障检测的方法、装置及系统
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN107509214A (zh) 一种多射频链路无线路由器及故障诊断方法
KR20160105222A (ko) Sdn 기반의 네트워크 모니터링 장치 및 방법
CN107547282B (zh) 一种信息与通信业务影响分析模型建立方法及系统
CN111385157B (zh) 一种服务器异常检测方法及装置
CN110958145A (zh) 一种管理自组网设备的方法、装置以及电子设备
CN113518034A (zh) 路由检测的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant