CN116248605A - 故障处理方法、装置、设备及存储介质 - Google Patents

故障处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116248605A
CN116248605A CN202310081115.7A CN202310081115A CN116248605A CN 116248605 A CN116248605 A CN 116248605A CN 202310081115 A CN202310081115 A CN 202310081115A CN 116248605 A CN116248605 A CN 116248605A
Authority
CN
China
Prior art keywords
transmission link
data message
data
switching
int
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310081115.7A
Other languages
English (en)
Inventor
冷大伟
袁福利
陈翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310081115.7A priority Critical patent/CN116248605A/zh
Publication of CN116248605A publication Critical patent/CN116248605A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/28Flow control; Congestion control in relation to timing considerations
    • H04L47/283Flow control; Congestion control in relation to timing considerations in response to processing delays, e.g. caused by jitter or round trip time [RTT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/20Support for services
    • H04L49/208Port mirroring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了一种故障处理方法、装置、设备及存储介质,该方法包括:在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的,根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同。本发明避免了出现网络拥塞的问题,提升了带内网络遥测系统中数据报文的传输效率。

Description

故障处理方法、装置、设备及存储介质
技术领域
本发明涉及通信技术领域,特别涉及一种故障处理方法、装置、设备及存储介质。
背景技术
随着超大型数据中心的出现,需要管理的网络设备数目越来越多,需要监控的信息数量非常庞大,这激发了对实时,自适应和高效网络监控技术的空前需求,带内网络遥测(Inband Network Telemetry,INT)是可以解决这些问题的网络监视技术之一。具体的步骤包括:普通数据报文到达带内网络遥测系统的第一个交换节点时,带内网络遥测模块匹配并镜像出该报文,根据遥测任务的需要在报文头部后插入INT头部,将INT头部所指定的遥测信息封装成元数据插入到INT头部之后;报文转发到中间节点时,设备匹配INT头部后插入元数据;报文转发到带内网络遥测系统最后一跳时,交换设备匹配INT头部插入最后一个元数据并提取全部遥测信息且转发到遥测服务器;遥测服务器解析遥测报文内的遥测信息,上报给上层遥测应用程序。因此,INT可以通过实时收集每个数据包/每节点的信息来监视应用程序流的端到端性能。
然而,数据报文在INT系统的交换节点中传输时的抖动时间是不一样的,当某一时刻链路出现故障从而使得数据报文的抖动时间增长,则会导致即将通过这一链路的所有数据报文都需要增长抖动时间,导致出现网络拥塞的问题。
发明内容
本发明实施例的目的在于提供一种故障处理方法、装置、设备及存储介质,解决现有的INT系统中当某一时刻链路出现故障从而使得数据报文的抖动时间增长,则会导致即将通过这一链路的所有数据报文都需要增长抖动时间,导致出现网络拥塞的问题,具体技术方案如下:
在本发明实施的第一方面,首先提供了一种故障处理方法,其特征在于,所述方法包括:
在检测到第一数据报文经过所述INT系统的交换节点的情况下,通过所述交换节点的第一交换设备在第一数据报文中插入时间戳,所述第一交换设备是通过与所述第一数据报文匹配确定的;
根据相邻两个交换节点中的所述第一交换设备插入的所述时间戳生成第一传输链路的抖动时间,所述第一传输链路是根据所述相邻两个交换节点的所述第一交换设备确定的;
在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路,所述第二数据传输链路与所述第一数据传输链路的终点第一交换设备不同。
可选地,所述在检测到第一数据报文经过所述INT系统的交换节点的情况下,通过所述交换节点的第一交换设备在第一数据报文中插入时间戳之前,所述方法还包括:
在检测到第二数据报文到达所述INT系统的起始交换节点的情况下,获取所述第二数据报文的验证信息;
根据所述验证信息从所述起始交换节点的交换设备中确定所述第一交换设备;
通过所述第一交换设备生成所述第二数据报文的镜像报文;
将INT头部和元数据插入所述镜像报文中生成所述第一数据报文。
可选地,所述在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路之前,所述方法还包括:
针对所述第一传输链路获取目标数量的历史抖动时间;
根据所述历史抖动时间生成所述平均抖动时间。
可选地,所述在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路之后,所述方法还包括:
获取所述INT系统的多个所述第一数据报文;
根据多个所述第一数据报文获取多个INT信息;
根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文。
可选地,所述根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文之后,所述方法还包括:
获取所述第三数据报文的上报周期;
根据所述上报周期将所述第三数据报文发送至遥测服务器。
可选地,所述根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文包括:
根据预设规则获取多个所述INT信息的目标参数;
在检测到多个所述INT信息的目标参数中存在一致的情况下,将含有一致的所述目标参数的所述第一数据报文进行聚合生成第三数据报文。
可选地,所述根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文之后,所述方法还包括:
获取所述第一数据报文的聚合信息;
根据所述聚合信息生成报文聚合信息统计值。
在本发明实施的第二方面,还提供了一种故障处理装置,其特征在于,包括:
插入模块,用于在检测到第一数据报文经过所述INT系统的交换节点的情况下,通过所述交换节点的第一交换设备在第一数据报文中插入时间戳,所述第一交换设备是通过与所述第一数据报文匹配确定的;
第一生成模块,用于根据相邻两个交换节点中的所述第一交换设备插入的所述时间戳生成第一传输链路的抖动时间,所述第一传输链路是根据所述相邻两个交换节点的所述第一交换设备确定的;
控制模块,用于在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路,所述第二数据传输链路与所述第一数据传输链路的终点第一交换设备不同。
在本发明实施的第三方面,还提供了一种通信设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;
所述处理器,用于读取存储器中的程序实现执行上述任一所述的故障处理方法。
在本发明实施的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的故障处理方法。
本发明实施例提供的故障处理方法,通过在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的,从而使得第一数据报文中携带时间信息,而后根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同,从而及时发现出现故障的据传输链路并做出相应调整,避免了出现网络拥塞的问题,提升了带内网络遥测系统中数据报文的传输效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的故障处理方法的步骤流程图一;
图2是本发明实施例提供的故障处理方法的步骤流程图二;
图3是本发明实施例提供的故障处理方法的步骤流程图三;
图4是本发明实施例提供的故障处理方法的步骤流程图四;
图5是本发明实施例提供的一种故障处理装置的结构示意图;
图6是本发明实施例提供的一种通信设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
参照图1,示出了本发明实施例提供的故障处理方法的步骤流程图一,所述方法可以包括:
步骤101,在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳。
本发明实施例应用于带内网络遥测INT系统,这个系统内包括三种主要的功能节点分别是INT Source、INT Sink和INT Transit Hop。其中INT Source、INT Sink可认为是遥测线路的起点和终点,INT Source负责指出需要收集信息的流量和要收集的信息,INTSink负责将收到的信息进行整理并上报给监控设备;INT Transit Hop则可认为是线路上支持INT遥测的所有设备。
需要说明的是,本发明实施例中第一交换设备是通过与第一数据报文匹配确定的,因为INT系统的每一个交换节点处都设置有多个交换设备,每一个交换设备中都设置了相应的采样匹配参数,只有当第一数据报文的匹配参数与交换设备设置的一致时,才允许第一数据报文通过该交换设备并使得该交换设备施行对应操作,本发明实施例中将可以匹配第一数据报文的交换设备统称为第一交换设备。
需要说明的是,本发明实施例中在检测到第一数据报文经过INT系统的交换节点的情况下,根据匹配到的第一交换设备在第一数据报文的INT头部后插入时间戳,因为第一数据报文在INT系统中会经过多个交换节点,所以在第一数据报文每经过一个交换节点时,就会让匹配的第一交换设备在第一数据报文的INT头部后插入时间戳。其中,时间戳是使用数字签名技术产生的数据,签名的对象包括了原始文件信息、签名参数、签名时间等信息。
步骤102,根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间。
本发明实施例中第一传输链路是根据相邻两个交换节点的第一交换设备确定的,第一数据报文从INT系统的一个交换节点传输到另一个交换节点,在这个过程中会通过每个交换节点中匹配的第一交换设备为第一数据报文插入时间戳,而这两个时间戳的时间间隔差就是第一数据报文在相邻两个交换节点中的第一交换设备进行数据传输的抖动时间,其中,将进行了第一数据报文传输的相邻两个交换节点之间的第一交换设备构成的数据报文传输链路称为第一传输链路。示例的,第一数据报文在经过第一交换节点时匹配到的第一交换设备是第一交换机,通过第一交换机在第一数据报文上插入第一时间戳为13点20分20秒,而后将携带这一时间戳信息的第一数据报文发送至相邻的第二交换节点,在第二交换节点匹配到的第一交换设备是第二交换机,通过第二交换机在第一数据报文上插入第二时间戳为13点20分30秒,将第一交换机和第二交换机构成的数据传输链路称为第一传输链路,那么计算出第一数据报文在相邻两个交换节点之间的第一交换机和第二交换机构成的第一传输链路的抖动时间为10秒。
步骤103,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路。
本发明实施例中每一个交换节点处都有多个交换设备,因此相邻的两个交换节点之间会有多条数据报文传输链路,其中,每条链路的终点第一交换设备不同。在检测到第一数据报文在第一数据传输链路的抖动时间大于平均抖动时间的时候,就认为此时第一数据传输链路可能出现故障,为了之后要通过这条链路的所有数据报文均排队等待,导致网络拥塞的问题,将要通过这条第一数据传输链路的下一数据报文切换至第二数据传输链路,同时控制第一数据传输链路调整为禁止接收数据报文的状态,并将这一问题反馈至遥测服务器,以使遥测服务器调用显示屏显示该问题,使得工作人员及时排查并处理第一数据传输链路的问题。此外,在工作人员对第一数据传输链路进行排除处理之后,就控制第一数据传输链路调整为正常接收数据报文的状态,并控制第一数据传输链路继续接收接下来的数据报文。
需要说明的是,本发明实施例中的第二数据传输链路与第一数据传输链路的终点第一交换设备不同,但是两者的起点第一交换设备不进行限定,可以相同也可以不同。
需要说明的是,本发明实施例中平均抖动时间是通过获取目标数量的历史数据得到的,通过获取第一传输链路目标数量的历史抖动时间来计算平均抖动时间,具体的实现步骤包括:
针对第一传输链路获取目标数量的历史抖动时间;
根据历史抖动时间生成平均抖动时间。
示例的,获取最近20次的历史抖动时间,然后计算出平均抖动时间为15秒,那么在抖动时间大于15秒的时候切换第一数据报文的数据传输链路,当抖动时间小于或等于15秒的时候保持第一数据报文在第一数据传输链路上不变。
本发明实施例提供的故障处理方法,通过在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的,从而使得第一数据报文中携带时间信息,而后根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同,从而及时发现出现故障的据传输链路并做出相应调整,避免了出现网络拥塞的问题,提升了带内网络遥测系统中数据报文的传输效率。
参照图2,示出了本发明实施例提供的故障处理方法的步骤流程图二,本实施例公开的故障处理方法其步骤与如图1所示的基本相同,区别在于,在步骤101之前,还可以包括:
步骤201,在检测到第二数据报文到达INT系统的起始交换节点的情况下,获取第二数据报文的验证信息。
本发明实施例中第二数据报文的验证信息可以是第二数据报文的IP地址,或者第二数据报文的编码信息,本发明在此不做具体限定。当检测到第二数据报文到达INT系统的起始交换节点的时候,首先对第二数据报文进行解析,获取第二数据报文的验证信息。
步骤202,根据验证信息从起始交换节点的交换设备中确定第一交换设备。
本发明实施例的起始交换节点处包括多个交换设备,但并不是需要每一个交换设备都对第一数据报文进行处理,因此在交换设备中设置不同的采样匹配方式,通过获取第二数据报文的验证信息而后将验证信息与采样匹配方式中设置的匹配参数进行对比,当一致时匹配成功,将匹配成功的交换设备称为第一交换设备。
示例的,获取到的第二数据报文的验证信息为IP地址,此时的IP地址为192.163.1.1,起始交换节点上有三个交换价,第一个交换机设置的匹配参数的IP地址为192.128.1.1,第二个交换机设置的匹配参数的IP地址为192.163.1.1,第三个交换机设置的匹配参数的IP地址为192.155.1.1。那么确定第二个交换机为匹配成功的第一交换设备。
步骤203,通过第一交换设备生成第二数据报文的镜像报文。
本发明实施例在确定好匹配的第一交换设备后,就可以通过第一交换设备对第二数据报文进行处理,因为INT技术不会改变原始数据报文转发路径和内容,所以通过第一交换设备生成第二数据报文的镜像报文。
步骤204,将INT头部和元数据插入镜像报文中生成第一数据报文。
本发明实施例中的INT系统是通过在数据层面收集和报告网络状态来实现对网络状态的监控,因此在生成镜像报文之后,还需要在镜像报文的在四层头部后插入INT头部,并将INT头部所指定的信息封装成元数据(Met aData,MD)插入到INT头部,将生成的新的数据报文称为第一数据报文,其中INT头部所指定的信息包括但不限于一下至少一项:源IP、目的IP、源端口、目的端口、INT ID。
本发明实施例提供的故障处理方法,通过在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的,从而使得第一数据报文中携带时间信息,而后根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同,从而及时发现出现故障的据传输链路并做出相应调整,避免了出现网络拥塞的问题,提升了带内网络遥测系统中数据报文的传输效率。此外,通过匹配的方式确定第一交换设备避免了交换节点的所有交换设备都对第二数据报文进行处理,减少资源浪费,同时通过对镜像报文处理,避免了对原始数据报文的影响。
参照图3,示出了本发明实施例提供的故障处理方法的步骤流程图三,本实施例公开的故障处理方法其步骤与如图1所示的基本相同,区别在于,在步骤103之后,还可以包括:
步骤301,获取INT系统的多个第一数据报文。
本发明实施例的INT系统中包括多个交换节点,当数据报文进到INT系统之后会经过多个交换节点,在每个经过的交换节点都会获取INT信息,将获取到INT信息的数据报文称为第一数据报文。因为这些第一数据报文中有些INT信息是一致的,为了减少资源消耗和通信开销,减少遥测服务器压力,将这些含有相同INT信息的第一数据报文进行聚合处理,因此首先获取到经过INT系统处理的多个第一数据报文。
需要说明的是,为了获取数据报文在INT系统完整的第一数据报文,首先需要确认第一数据报文已经完成了此次遥测任务,即第一数据报文到达INT系统的最终交换节点,且与最终交换节点的交换设备完成匹配并插入元数据。
步骤302,根据多个第一数据报文获取多个INT信息。
本发明实施例在获取到多个第一数据报文后,对这些第一数据报文进行解析,因为第一数据报文都是经过INT系统的交换节点处的交换设备处理后生成的,每一个都携带了INT信息,因此解析第一数据报文获取多个INT信息。
步骤303,根据多个INT信息将多个第一数据报文进行聚合生成第三数据报文。
本发明实施例通过获取的INT信息获取其中包含的目标参数,其中,目标参数包括但不限于以下至少一种:源IP、目的IP、源端口、目的端口、INT ID,根据目标参数将目标参数完全一致的第一数据报文进行聚合生成第三数据报文。示例的,获取到了5个INT信息,其中包含的目标参数分别是:“192.163.1.1,192.128.1.1,port5,port10,102”,“192.166.1.1,192.125.1.1,port8,port1,201”,“192.163.1.1,192.128.1.1,port5,port10,102”,“192.163.1.1,192.128.1.1,port5,port10,102”,“192.166.1.1,192.125.1.1,por t8,port1,201”,可以看出第一、三、四的目标参数是完全一致的,因此将这3个第一数据报文进行聚合,第二、五的目标参数是完全一致的,因此将这2个第一数据报文进行聚合,最终得到的第三数据报文是“192.163.1.1,192.128.1.1,port5,port10,102”,“192.166.1.1,192.125.1.1,port8,port1,201”。具体地实现步骤包括:
根据预设规则获取多个INT信息的目标参数;
在检测到多个INT信息的目标参数中存在一致的情况下,将含有一致的目标参数的第一数据报文进行聚合生成第三数据报文。
需要说明的是,在将第一数据报文进行聚合后就可以将聚合后第三数据报文周期性上报给遥测服务器,因此首先获取上报周期,然后根据上报周期将聚合后的第三数据报文周期性发送至遥测服务器,具体地实现步骤包括:
获取第三数据报文的上报周期;
根据上报周期将第三数据报文发送至遥测服务器。
本发明实施例提供的故障处理方法,通过在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的,从而使得第一数据报文中携带时间信息,而后根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同,从而及时发现出现故障的据传输链路并做出相应调整,避免了出现网络拥塞的问题,提升了带内网络遥测系统中数据报文的传输效率。此外通过将含有相同INT信息的第一数据报文进行聚合,减少资源消耗和通信开销,减少遥测服务器压力。
参照图4,示出了本发明实施例提供的故障处理方法的步骤流程图四,本实施例公开的故障处理方法其步骤与如图3所示的基本相同,区别在于,在步骤303之后,还可以包括:
步骤401,获取第一数据报文的聚合信息。
本发明实施例中第一数据报文的聚合信息就是第一数据报文中有几个是可以合并的,示例的,第一数据报文有20个,其中有5个是可以合并的,那么此时的聚合信息就是5个第一数据报文进行聚合。
步骤402,根据聚合信息生成报文聚合信息统计值。
本发明实施例中根据聚合信息生成报文聚合信息统计值,然后将这个报文聚合信息统计值添加到聚合统计表中,发送至遥测服务器,以使遥测服务器检测丢包情况是否正常。
本发明实施例提供的故障处理方法,通过在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的,从而使得第一数据报文中携带时间信息,而后根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同,从而及时发现出现故障的据传输链路并做出相应调整,避免了出现网络拥塞的问题,提升了带内网络遥测系统中数据报文的传输效率。同时通过对聚合信息的统计,增加了丢包率的检测,进一步增强对网络状态的监控。
参照图5,示出了本发明实施例提供的一种故障处理装置的结构示意图,如图5所示,该装置可以包括:
插入模块501,用于在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的。
第一生成模块502,用于根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的。
控制模块503,用于在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同。
可选地,故障处理装置还包括:
第一获取模块,用于在检测到第二数据报文到达INT系统的起始交换节点的情况下,获取第二数据报文的验证信息。
确定模块,用于根据验证信息从起始交换节点的交换设备中确定第一交换设备。
第二生成模块,用于通过第一交换设备生成第二数据报文的镜像报文。
第三生成模块,用于将INT头部和元数据插入镜像报文中生成第一数据报文。
第二获取模块,用于针对第一传输链路获取目标数量的历史抖动时间。
第四生成模块,用于根据历史抖动时间生成平均抖动时间。
第三获取模块,用于获取INT系统的多个第一数据报文,第一数据报文是通过INT系统的交换节点获取的。
第四获取模块,用于根据多个第一数据报文获取多个INT信息。
第五生成模块,用于根据多个INT信息将多个第一数据报文进行聚合生成第三数据报文。
第六获取模块,用于获取第三数据报文的上报周期。
发送模块,用于根据上报周期将第三数据报文发送至遥测服务器。
可选地,第五生成模块还包括:
获取子模块,用于根据预设规则获取多个INT信息的目标参数。
生成子模块,用于在检测到多个INT信息的目标参数中存在一致的情况下,将含有一致的目标参数的第一数据报文进行聚合生成第三数据报文。
可选地,故障处理装置还包括:
第七获取模块,用于获取第一数据报文的聚合信息。
第六生成模块,用于根据聚合信息生成报文聚合信息统计值。
本发明实施例提供的故障处理方法,通过在检测到第一数据报文经过INT系统的交换节点的情况下,通过交换节点的第一交换设备在第一数据报文中插入时间戳,第一交换设备是通过与第一数据报文匹配确定的,从而使得第一数据报文中携带时间信息,而后根据相邻两个交换节点中的第一交换设备插入的时间戳生成第一传输链路的抖动时间,第一传输链路是根据相邻两个交换节点的第一交换设备确定的,在检测到抖动时间大于平均抖动时间的的情况下,控制第一传输链路下一数据报文切换至第二数据传输链路,第二数据传输链路与第一数据传输链路的终点第一交换设备不同,从而及时发现出现故障的据传输链路并做出相应调整,避免了出现网络拥塞的问题,提升了带内网络遥测系统中数据报文的传输效率。
本发明实施例还提供了一种通信设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
在检测到第一数据报文经过所述INT系统的交换节点的情况下,通过所述交换节点的第一交换设备在第一数据报文中插入时间戳,所述第一交换设备是通过与所述第一数据报文匹配确定的;
根据相邻两个交换节点中的所述第一交换设备插入的所述时间戳生成第一传输链路的抖动时间,所述第一传输链路是根据所述相邻两个交换节点的所述第一交换设备确定的;
在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路,所述第二数据传输链路与所述第一数据传输链路的终点第一交换设备不同。
本发明还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的故障处理方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其他设备固有相关。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图,或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明的排序设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
需要说明的是,本申请实施例中获取各种数据相关过程,都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。

Claims (10)

1.一种故障处理方法,应用于带内网络遥测INT系统,其特征在于,所述方法包括:
在检测到第一数据报文经过所述INT系统的交换节点的情况下,通过所述交换节点的第一交换设备在第一数据报文中插入时间戳,所述第一交换设备是通过与所述第一数据报文匹配确定的;
根据相邻两个交换节点中的所述第一交换设备插入的所述时间戳生成第一传输链路的抖动时间,所述第一传输链路是根据所述相邻两个交换节点的所述第一交换设备确定的;
在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路,所述第二数据传输链路与所述第一数据传输链路的终点第一交换设备不同。
2.根据权利要求1所述的方法,其特征在于,所述在检测到第一数据报文经过所述INT系统的交换节点的情况下,通过所述交换节点的第一交换设备在第一数据报文中插入时间戳之前,所述方法还包括:
在检测到第二数据报文到达所述INT系统的起始交换节点的情况下,获取所述第二数据报文的验证信息;
根据所述验证信息从所述起始交换节点的交换设备中确定所述第一交换设备;
通过所述第一交换设备生成所述第二数据报文的镜像报文;
将INT头部和元数据插入所述镜像报文中生成所述第一数据报文。
3.根据权利要求1所述的方法,其特征在于,所述在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路之前,所述方法还包括:
针对所述第一传输链路获取目标数量的历史抖动时间;
根据所述历史抖动时间生成所述平均抖动时间。
4.根据权利要求1所述的方法,其特征在于,所述在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路之后,所述方法还包括:
获取所述INT系统的多个所述第一数据报文;
根据多个所述第一数据报文获取多个INT信息;
根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文。
5.根据权利要求4所述的方法,其特征在于,所述根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文之后,所述方法还包括:
获取所述第三数据报文的上报周期;
根据所述上报周期将所述第三数据报文发送至遥测服务器。
6.根据权利要求4所述的方法,其特征在于,所述根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文包括:
根据预设规则获取多个所述INT信息的目标参数;
在检测到多个所述INT信息的目标参数中存在一致的情况下,将含有一致的所述目标参数的所述第一数据报文进行聚合生成第三数据报文。
7.根据权利要求4所述的方法,其特征在于,所述根据多个所述INT信息将多个所述第一数据报文进行聚合生成第三数据报文之后,所述方法还包括:
获取所述第一数据报文的聚合信息;
根据所述聚合信息生成报文聚合信息统计值。
8.一种故障处理装置,其特征在于,包括:
插入模块,用于在检测到第一数据报文经过所述INT系统的交换节点的情况下,通过所述交换节点的第一交换设备在第一数据报文中插入时间戳,所述第一交换设备是通过与所述第一数据报文匹配确定的;
第一生成模块,用于根据相邻两个交换节点中的所述第一交换设备插入的所述时间戳生成第一传输链路的抖动时间,所述第一传输链路是根据所述相邻两个交换节点的所述第一交换设备确定的;
控制模块,用于在检测到所述抖动时间大于平均抖动时间的的情况下,控制所述第一传输链路下一数据报文切换至第二数据传输链路,所述第二数据传输链路与所述第一数据传输链路的终点第一交换设备不同。
9.一种通信设备,其特征在于,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;
所述处理器,用于读取存储器中的程序实现如权利要求1-7中任意一项所述故障处理方法中的步骤。
10.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任意一项所述故障处理方法中的步骤。
CN202310081115.7A 2023-02-03 2023-02-03 故障处理方法、装置、设备及存储介质 Pending CN116248605A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310081115.7A CN116248605A (zh) 2023-02-03 2023-02-03 故障处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310081115.7A CN116248605A (zh) 2023-02-03 2023-02-03 故障处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116248605A true CN116248605A (zh) 2023-06-09

Family

ID=86634380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310081115.7A Pending CN116248605A (zh) 2023-02-03 2023-02-03 故障处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116248605A (zh)

Similar Documents

Publication Publication Date Title
US20220060422A1 (en) Methods, systems and computer readable media for network congestion control tuning
US8989002B2 (en) System and method for controlling threshold testing within a network
CN112350854B (zh) 一种流量故障定位方法、装置、设备及存储介质
US10715426B2 (en) Processing rule modification method, apparatus and device
CN108900374B (zh) 一种应用于dpi设备的数据处理方法和装置
US11044184B2 (en) Data packet loss detection
CN112202635B (zh) 链路的监控方法、装置、存储介质以及电子装置
CN109656574A (zh) 交易时延度量方法、装置、计算机设备及存储介质
WO2021128927A1 (zh) 报文的处理方法及装置、存储介质和电子装置
US20150071085A1 (en) Network gateway for real-time inspection of data frames and identification of abnormal network behavior
CN109960634A (zh) 一种应用程序监控方法、装置及系统
CN109905412B (zh) 一种网络数据并行加解密处理方法、装置和介质
CN108718347A (zh) 一种域名解析方法、系统、装置及存储介质
CN110855424B (zh) 一种DPI领域非对称流量xDR合成的方法和装置
CN110838930A (zh) 业务逻辑拓扑的生成方法及装置
CN116723154A (zh) 一种基于负载均衡的路由分发方法及系统
CN112422434A (zh) Ipfix消息处理方法及其应用、asic芯片
CN114338403A (zh) 一种监控网络意图的方法、网络意图监控系统及存储介质
KR20220029142A (ko) Sdn 컨트롤러 서버 및 이의 sdn 기반 네트워크 트래픽 사용량 분석 방법
CN104104555B (zh) 监控方法、系统、控制端及执行端
CN116248605A (zh) 故障处理方法、装置、设备及存储介质
US10181997B2 (en) Methods, systems and computer readable media for providing receive port resiliency in a network equipment test device
CN114567481A (zh) 一种数据传输方法、装置、电子设备及存储介质
CN113904994A (zh) 一种家庭网关大数据统一上报平台的方法
KR101506448B1 (ko) M2m 트래픽 관리 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination