CN112367196A - 一种检测网络通信故障的方法、装置及电子设备 - Google Patents

一种检测网络通信故障的方法、装置及电子设备 Download PDF

Info

Publication number
CN112367196A
CN112367196A CN202011190346.4A CN202011190346A CN112367196A CN 112367196 A CN112367196 A CN 112367196A CN 202011190346 A CN202011190346 A CN 202011190346A CN 112367196 A CN112367196 A CN 112367196A
Authority
CN
China
Prior art keywords
message
tipc
network node
node device
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011190346.4A
Other languages
English (en)
Other versions
CN112367196B (zh
Inventor
刘世科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruijie Networks Co Ltd
Original Assignee
Ruijie Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruijie Networks Co Ltd filed Critical Ruijie Networks Co Ltd
Priority to CN202011190346.4A priority Critical patent/CN112367196B/zh
Publication of CN112367196A publication Critical patent/CN112367196A/zh
Application granted granted Critical
Publication of CN112367196B publication Critical patent/CN112367196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种检测网络通信故障的方法、装置及电子设备,应用于通信故障检测设备,该方法包括:接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;确定预设时间内是否接收到第二网络节点设备上报的第一TIPC报文对应的第二TIPC报文;若确定预设时间内未接收到第二TIPC报文,则确定第一网络节点设备到第二网络节点设备的传输通路单向不通;若确定预设时间内接收到第二TIPC报文,则根据第一TIPC报文和第二TIPC报文,确定第一网络节点设备与第二网络节点设备间的通信故障。本发明提供的方案,用以快速检测基于TIPC协议的通信过程中的通信故障,提高网络通信故障检测的效率。

Description

一种检测网络通信故障的方法、装置及电子设备
技术领域
本发明涉及通信技术领域,特别涉及一种检测网络通信故障的方法、装置及电子设备。
背景技术
透明内部进程通信(Transparent Inter Process Communication,TIPC)协议是一种用于内部集群(Intra Cluster)通信的网络通信协议,TIPC协议以共享内存为基础实现任务和资源的调度,使处于相同集群内的不同网络节点设备无需考虑所处的位置,能够直接进行快速可靠的通信。其中,内部集群可以是任何类型的分布式多处理器系统。TIPC协议为分布式系统的进程间通信提供了一套透明可靠的传输协议。
采用TIPC协议的分布式网络系统中各个网络节点设备之间进行通信时,可能由于各种通信故障无法进行正常的数据传输,因此在发生通信故障时需要及时检测确定对应的故障从而进行解决,保证正常通信。目前检测网络节点设备间通信故障时通常采用如下两种方式:
1)根据是否接收到对端设备发送的保活状态报文确定是否发生通信故障。
两个网络节点设备根据TIPC协议建立连接后分别启动保活定时器,并每隔0.5秒向对端设备发送保活(keeplive)状态报文,及接收对端设备发送的保活状态报文。网络节点设备若在连续30秒内没有收到对端设备发送的保活状态报文,则复位通信链路(Link),输出通信链路发生故障的信息。
2)根据数据报文序列号确定是否发生通信故障。
根据目前TIPC协议的规定,TIPC报文中会携带序列号。网络节点设备向对端设备发送数据报文时按序发送,数据报文的序列号按序递增,接收对端设备发送的数据报文时也会按序接收,因此,通过网络节点设备对接收的数据报文的序列号进行筛查,若发现数据报文并未按序送达,则向对端设备请求重传数据报文。当请求重传的次数达到设定阈值时,复位通信链路,输出通信链路发生故障的信息。
上述现有通信故障检测方法仅能确定通信链路是否发生故障,而无法确定发生故障时具体的故障类型,因此通信故障检测效率较低。
发明内容
本发明提供了一种检测网络通信故障的方法、装置及电子设备,用以快速检测基于TIPC协议的通信过程中的通信故障,提高网络通信故障检测的效率。
根据本发明实施例的第一方面,提供一种检测网络通信故障的方法,应用于第一网络节点设备,该方法包括:
向第二网络节点设备发送第一透明内部进程通信TIPC报文,以使所述第二网络节点设备确定所述第一TIPC报文符合预设的筛选条件后,将所述第一TIPC报文对应的第二TIPC报文上报给通信故障检测设备;
确定所述第一TIPC报文是否符合所述筛选条件;
若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
上述实施例中,第一网络节点设备向第二网络节点设备发送第一TIPC报文进行通信的过程中,仅需在发送TIPC报文时对TIPC报文进行是否符合预设的筛选条件的判断,并将符合预设的筛选条件的TIPC报文上报给通信故障检测设备,就能由通信故障检测设备根据该报文检测第一网络节点设备与第二网络节点设备间的通信故障情况。其中,至少能使通信故障检测设备确定该报文相关的故障信息,例如发生故障的报文类型、故障类型等。因而通信故障检测设备能获取到更多相关的通信故障详细信息,有助于更快的解决故障。同时,网络节点设备所需的处理时间较短,资源占用也较少。因此上述通信故障检测方法能够在减少网络节点设备资源占用的同时,检测到发生通信故障时的故障类型,大大提高了通信故障检测的效率。
可选地,所述向第二网络节点设备发送第一TIPC报文,包括:
向所述第二网络节点设备发送携带报文发送时间的第一TIPC报文,以使所述第二网络节点设备根据所述报文发送时间确定所述第一TIPC报文对应的第二TIPC报文,和/或,根据所述报文发送时间确定所述第一网络节点设备与所述第二网络节点设备间的通信故障;
其中,所述报文发送时间为向所述第二网络节点设备发送所述第一TIPC报文的时间。
上述实施例中,第一网络节点设备通过在发送到第二网络节点设备的TIPC报文中添加报文发送时间,一方面,能够使第二网络节点设备确定对应的第二TIPC报文,进而在后续过程中使接收第一TIPC报文和第二TIPC报文的通信故障检测设备能够根据这两个报文快速确定第一网络节点设备与第二网络节点设备之间得到通信故障,提高对第一网络节点设备与第二网络节点设备之间通信故障的检测速率;另一方面,还能够使第二网络节点设备根据该报文发送时间确定第一网络节点设备与第二网络节点设备之间是否存在报文传输速率异常的故障。
可选地,所述确定所述第一TIPC报文是否符合预设的筛选条件,包括:
确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据是否一致;
若确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据一致,则确定所述第一TIPC报文符合所述筛选条件。
上述实施例中,第一网络节点设备能够根据预设的筛选参数对发送的TIPC报文进行快速筛选,从而加快对第一网络节点设备与第二网络节点设备间是否存在通信故障的检测速率。同时,预设报文参数能够实现根据实际需求对不同类型报文进行快速筛选,从而检测是否存在对应的不同类型的通信故障。
根据本发明实施例的第二方面,提供一种检测网络通信故障的方法,应用于第二网络节点设备,该方法包括:
接收第一TIPC报文,所述第一TIPC报文是第一网络节点设备发送给所述第二网络节点设备的、并且是所述第一网络节点设备在确定所述第一TIPC报文符合预设的筛选条件后发送给通信故障检测设备的;
确定所述第一TIPC报文是否符合所述筛选条件;
若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
上述实施例中,第二网络节点设备接收第一网络节点设备发送的第一TIPC报文进行通信的过程中,仅需在接收报文时对报文进行是否符合预设的筛选条件的判断,并将符合预设的筛选条件的TIPC报文对应的第二TIPC报文发送到通信故障检测设备即可,保证了第二网络节点设备额外附加的工作量不会过大;第二网络节点设备上报TIPC报文后使通信故障检测设备根据该报文检测第一网络节点设备与第二网络节点设备间存在通信故障时的故障类型,能够快速实现对网络节点设备间通信故障的检测。
可选地,所述确定所述第一TIPC报文是否符合所述筛选条件,包括:
确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据是否一致;
若确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据一致,则确定所述第一TIPC报文符合所述筛选条件。
上述实施例中,第二网络节点设备能够根据预设的筛选参数对接收的报文进行快速筛选,从而加快对第一网络节点设备与第二网络节点设备间是否存在通信故障的检测速率。同时,预设报文参数能够实现根据实际需求对不同类型报文进行快速筛选。
可选地,所述将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,包括:
确定所述第一TIPC报文中是否包括报文发送时间,其中,所述报文发送时间为所述第一网络节点设备向所述第二网络节点设备发送所述第一TIPC报文的时间;
若确定所述第一TIPC报文中包括所述报文发送时间,则将所述第一TIPC报文的报文接收时间替换所述报文发送时间,得到第二TIPC报文,并向所述通信故障检测设备发送所述第二TIPC报文;
若确定所述第一TIPC报文中未包括所述报文发送时间,则将所述第一TIPC报文作为第二TIPC报文发送给所述通信故障检测设备。
上述实施例中,第二网络节点设备筛选到符合预设筛选条件的报文,且确定该报文中包括报文发送时间时,将报文发送时间替换为接收该报文的报文接收时间后发送到通信故障检测设备,能够使通信故障检测设备快速确定第二网络节点设备接收该报文的时间,从而根据该接收时间进行故障类型检测,提高对第一网络节点设备与第二网络节点设备间是否存在通信故障的检测效率。
可选地,所述确定所述第一TIPC报文中包括所述报文发送时间之后,还包括:
确定所述报文发送时间与所述报文接收时间之间的时间间隔是否大于预设阈值;
若确定所述时间间隔大于所述预设阈值,则确定所述第一网络节点设备与所述第二网络节点设备之间的TIPC报文传输速率异常。
上述实施例中,第二网络节点设备接收到的第一网络节点设备发送的报文中包括报文发送时间时,将该报文发送时间与自身接收该报文的报文接收时间进行比较,就能快速确定该报文对应的传输时间,从而确定该报文的传输速率是否存在异常,使第二网络节点设备也能够对报文传输速率的异常进行检测。
根据本发明实施例的第三方面,提供一种检测网络通信故障的方法,应用于通信故障检测设备,该方法包括:
接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;
确定预设时间内是否接收到所述第二网络节点设备上报的所述第一TIPC报文对应的第二TIPC报文;
若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通;
若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
上述实施例中,通信故障检测设备接收第一网络节点设备发送的第一TIPC报文后,根据是否接收到第二网络节点设备发送的对应的报文,能够确定第一网络节点设备发送的报文是否成功传输到第二网络节点设备,从而确定第一网络节点设备与第二网络节点设备间是否存在传输通路单向不通的故障;若接收到第二网络节点设备发送的对应的报文,也能根据第一网络节点设备与第二网络节点设备发送的对应报文进一步检测在无单向不通故障的情况下,是否存在报文传输速率的相关故障。保证了通信故障检测设备能够在较短时间内快速确定第一网络节点设备与第二网络节点设备间存在的通信故障。
可选地,所述根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障,包括:
确定所述第一TIPC报文的报文发送时间与报文接收时间之间的时间间隔是否大于预设阈值;
若确定所述时间间隔大于所述预设阈值,则确定所述第一网络节点设备与所述第二网络节点设备之间的TIPC报文传输速率异常;
其中,所述报文发送时间为所述第一网络节点设备向所述第二网络节点设备发送所述第一TIPC报文的时间,所述报文接收时间为所述第二网络节点设备接收到所述第一网络节点设备发送的所述第一TIPC报文的时间。
上述实施例中,通信故障检测设备分别接收到第一网络节点设备和第二网络节点设备发送的报文时,若报文中包括时间信息,即第一TIPC报文中包括报文发送时间,第二TIPC报文中包括报文接收时间,则将报文对应的报文发送时间与报文接收时间进行比较,就能快速确定第一网络节点设备与第二网络节点设备之间的报文对应的传输时间,从而确定该报文的传输速率是否存在异常。
可选地,确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通之后,还包括:
若已确定所述第二网络节点设备到所述第一网络节点设备的传输通路单向不通,则确定所述第一网络节点设备与所述第二网络节点设备之间的传输通路双向不通。
上述实施例中,通信故障检测设备可分别确定第一网络节点设备到第二网络节点设备的传输通路单向不通,及第二网络节点设备到第一网络节点设备的传输通路单向不通,进而能够结合确定第一网络节点设备与第二网络节点设备之间的传输通路双向不通。
可选地,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障之后,还包括:
若确定所述第一TIPC报文为单播报文,则确定所述第一网络节点设备与所述第二网络节点设备之间的通信故障为单播通信故障;
若确定所述第一TIPC报文为广播报文,则确定所述第一网络节点设备与所述第二网络节点设备之间的通信故障为广播通信故障。
上述实施例中,通信故障检测设备确定第一网络节点设备与第二网络节点设备之间的通信故障之后,能够通过识别第一网络节点设备与第二网络节点设备之间传输的TIPC报文的报文类型,进一步确定上述通信故障的单播或广播类型,能得到更详细的通信故障检测结果。
根据本发明实施例的第四方面,提供一种检测网络通信故障的装置,应用于第一网络节点设备,包括:
报文发送模块,用于向第二网络节点设备发送第一透明内部进程通信TIPC报文,以使所述第二网络节点设备确定所述第一TIPC报文符合预设的筛选条件后,将所述第一TIPC报文对应的第二TIPC报文上报给通信故障检测设备;
报文筛选模块,用于确定所述第一TIPC报文是否符合所述筛选条件;
报文上报模块,用于若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
根据本发明实施例的第五方面,提供一种检测网络通信故障的装置,应用于第二网络节点设备,包括:
报文接收模块,用于接收第一TIPC报文,所述第一TIPC报文是第一网络节点设备发送给所述第二网络节点设备的、并且是所述第一网络节点设备在确定所述第一TIPC报文符合预设的筛选条件后发送给通信故障检测设备的;
报文筛选模块,用于确定所述第一TIPC报文是否符合所述筛选条件;
报文上报模块,用于若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
根据本发明实施例的第六方面,提供一种检测网络通信故障的装置,应用于通信故障检测设备,包括:
第一报文接收模块,用于接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;
第二报文接收模块,用于确定预设时间内是否接收到所述第二网络节点设备上报的所述第一TIPC报文对应的第二TIPC报文;
第一故障确定模块,用于若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通;
第二故障确定模块,用于若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
根据本发明实施例的第七方面,提供一种电子设备,包括:存储器和处理器;其中:
所述存储器用于存储程序;
所述处理器用于读取所述存储器中存储的计算机指令,执行本申请实施例上述各个方面以及各个方面涉及的任一可能设计的方法。
根据本发明实施例的第八方面,提供一种计算机可读存储介质,该计算机存储介质存储有程序指令,当其在计算机上运行时,使得计算机执行本发明实施例上述各个方面以及各个方面涉及的任一可能设计的方法。
根据本发明实施例的第九方面,提供一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行实现本申请实施例上述各个方面以及各个方面涉及的任一可能设计的方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为TIPC网络的网络架构示意图;
图2为基于TIPC协议的通信模型示意图;
图3为本发明实施例中提供的一种利用TIPC协议进行通信的示意图;
图4为本发明实施例中提供的一种网络节点设备间的通信故障示意图;
图5为本发明实施例中提供的一种检测网络通信故障的方法示意图;
图6为本发明实施例中提供的一种检测网络通信故障的方法示意图;
图7为本发明实施例中提供的一种检测网络通信故障的方法示意图;
图8为本发明实施例中提供的一种TIPC报文格式示意图;
图9为本发明实施例中提供的另一种TIPC报文格式示意图;
图10为本发明实施例中提供的一种网络节点设备内设置预设筛选条件的方法示意图;
图11为本发明实施例中提供的一种网络节点设备内传输预设筛选条件的方法示意图;
图12为本发明实施例中提供的一种TIPC报文发送及筛选的流程示意图;
图13为本发明实施例中提供的一种TIPC报文接收及筛选的流程示意图;
图14为本发明实施例中提供的一种第一网络节点设备的示意图;
图15为本发明实施例中提供的一种第二网络节点设备的示意图;
图16为本发明实施例中提供的一种通信故障检测设备的示意图;
图17为本发明实施例中提供的一种第一网络节点设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了方便理解,下面对本发明实施例中涉及的名词进行解释:
1)嵌入式系统:一般指具有计算机功能但又不称之为计算机的设备或器材,是以应用为中心、软硬件可裁减的专用计算机系统,主要由嵌入式处理器、相关支撑硬件、嵌入式操作系统及应用软件系统等组成。
2)TIPC(Transparent Inter-Process Commutation,透明内部进程通信)协议:TIPC协议为分布式系统的进程间通信提供了一套透明可靠的传输协议,可用于内部集群(Intra Cluster)通信中,或用于嵌入式盒式设备之间的通信、机架式嵌入式设备之间的通信及机架式嵌入式设备板卡之间的通信等。其中,内部集群可以是任何类型的分布式多处理器系统。
参照图1,为TIPC网络的网络架构示意图。如图所示,TIPC网络的构成是通过TIPC相连的所有域的集合,每个域中包括至少一个集群,每个集群内包括至少一个节点设备(Node),网络中的所有域都直接相连。其中,一个域内所有集群必须是全部直接互通的,在集群中所有的节点设备必须全部直接互连,集群之间也是全部直接互连的。
参照图2,为基于TIPC协议的通信模型示意图。如图所示,进行通信的两个节点设备A和B分别包括应用层(Application)、TIPC层、驱动传输层。其中TIPC层包括Link(链路)层和Bearer(承载业务)层,节点设备A、B之间可通过Link、连接Connection和Bearer层通路传输数据。Link层次可提供可靠传输服务,两个节点设备之间一般是一条Link链路,Link层次上传输的数据称为报文Message。Connection是两个节点设备的端口之间传输数据的逻辑通道,Connection建立后节点设备的任何一个端点传送报文时都不再需要指明接收端的地址,Connection上传输的是用户数据。TIPC可在Bearer层利用多种类型的及各种逻辑层次的、可靠或不可靠的传输方式提供传输服务。
网络节点设备之间基于TIPC协议进行通信时,在Bearer层传输数据,其对接的是2层通路传输,其中,TIPC协议对报文的组包、拆包、捆绑等操作在Link层完成,Bearer层只对TIPC报文进行传输,即执行2层通路的收发接口。
参照图3,为本发明实施例提供的一种分布式设备中两个板卡上的节点设备利用TIPC协议进行通信的示意图。如图所示,节点设备中包括用户空间与内核空间两个空间。本发明实施例中,基于TIPC协议进行通信的节点设备中,将虚拟地址空间划分为两部分,一部分为内核空间,另一部分为用户空间。其中,操作系统和驱动程序运行在内核空间,对应不同业务的应用程序运行在用户空间。
具体通信时,发送端设备在用户空间根据业务进程调用API(ApplicationProgramming Interface,应用程序接口),通过对应的端口(Socket)向内核空间发送报文或数据传输指令,由用户态转为内核态,在内核空间将报文或数据发送到接收端设备的内核空间,接收端设备在内核态接收数据后再从内核空间通过对应端口传输到用户空间,完成报文或数据的传输。上述图2所示例的基于TIPC协议的通信模型中的方法在内核空间完成。
如上图3所示的网络设备使用TIPC协议进行跨设备通信的使用场景中,通信方式可分为单播通信、广播通信。而由于涉及到2层通路的跨设备通信,在两个网络节点设备之间以TIPC报文格式传输数据时可能存在如图4所示的几种故障,具体包括:
1)单向不通:两个网络节点设备中仅有一个网络节点设备能够正常接收到对端发送的TIPC报文。
2)双向不通:两个网络节点设备均无法接收到对端发送的TIPC报文。
3)广播不通:两个网络节点设备之间使用广播方式收发报文时,报文传输不通,包括单向广播不通和双向广播不通。
4)单播不通:两个网络节点设备之间使用单播方式收发报文时,传输不通,包括单向单播广播不通和双向单播不通。
5)报文传输速率异常:两个网络节点设备之间传输报文耗时比正常情况下的耗时长。
实际通信过程中,上述故障问题可能部分或全部同时出现,而现有的通路故障开源诊断方法的诊断手段较少,且能够诊断的故障问题有限。在出现上述示例的相关故障时,现有故障诊断方法往往无法快速定位通路故障类型,导致浪费大量人力来检测通路故障,且耗时较长,故障检测效率很低,在产品开发阶段还容易造成开发周期久,及人力、资源浪费等问题。
鉴于此,本发明实施例提供一种检测网络通信故障的方法,应用于设备间基于TIPC协议进行通信的网络系统中。例如应用于通信故障检测设备对图1所示网络中任意两个互连的节点设备之间的通信过程进行故障检测的场景中。
本申请实施例中,确定基于TIPC协议进行通信的两个节点设备A、B间是否存在通信故障的过程中,节点设备A为报文发送端、节点设备B为报文接收端时,将节点设备A作为第一网络节点设备,执行本发明实施例提供的应用于第一网络节点设备的方法,将节点设备B作为第二网络节点设备,执行本发明实施例提供的应用于第二网络节点设备的方法,能够确定节点设备A向节点设备B发送TIPC报文时存在的通信故障;节点设备B为报文发送端、节点设备A为报文接收端时,将节点设备B作为第一网络节点设备,执行本发明实施例提供的应用于第一网络节点设备的方法,将节点设备A作为第二网络节点设备,执行本发明实施例提供的应用于第二网络节点设备的方法,能够确定节点设备B向节点设备A发送TIPC报文时存在的通信故障。通过结合上述两个过程能够确定节点设备A和节点设备B之间收发报文过程中存在通信故障。其中,上述两个过程可以同时存在,节点设备A、B分别执行对应的方法。
例如,将节点设备A作为第一网络节点设备,将节点设备B作为第二网络节点设备时确定的A、B之间的通信故障为节点设备A至节点设备B存在单向不通的故障,将节点设备B作为第一网络节点设备,将节点设备A作为第二网络节点设备时确定的节点设备A、B之间的通信故障为节点设备B至节点设备A存在单向不通的故障,则能够确定节点设备A、B之间存在的通信故障为双向不通的故障。
以下对本发明实施例提供的检测网络通信故障的方法进行详细说明。
参照图5,为本发明实施例提供的一种检测网络通信故障的方法示意图,应用于第一网络节点设备,如图所示,该方法包括:
步骤S501,向第二网络节点设备发送第一TIPC报文,以使所述第二网络节点设备确定所述第一TIPC报文符合预设的筛选条件后,将所述第一TIPC报文对应的第二TIPC报文上报给通信故障检测设备;
步骤S502,确定所述第一TIPC报文是否符合所述筛选条件;
步骤S503,若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
参照图6,为本发明实施例提供的一种检测网络通信故障的方法示意图,应用于第二网络节点设备,如图所示,该方法包括:
步骤S601,接收第一TIPC报文,所述第一TIPC报文是第一网络节点设备发送给所述第二网络节点设备的、并且是所述第一网络节点设备在确定所述第一TIPC报文符合预设的筛选条件后发送给通信故障检测设备的;
步骤S602,确定所述第一TIPC报文是否符合所述筛选条件;
步骤S603,若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
参照图7,为本发明实施例提供的一种检测网络通信故障的方法示意图,应用于通信故障检测设备,如图所示,该方法包括:
步骤S701,接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;
步骤S702,确定预设时间内是否接收到所述第二网络节点设备上报的所述第一TIPC报文对应的第二TIPC报文;
步骤S703,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通;若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
下面结合具体实施例对上述检测网络通信故障的方法进行详细介绍。
本发明实施例中,第一网络节点设备向第二网络节点设备发送的TIPC报文为如下格式1和格式2所述的任一种格式的报文:
格式1
第一网络节点设备向第二网络节点设备发送的TIPC报文为TIPC协议规定的格式,包括报文头数据和用户数据两部分内容,即,采用如图8所示的报文格式。其中,用户数据为第一网络节点设备需发送到第二网络节点设备的业务相关数据;TIPC报文格式中报文头数据主要包括报文类型、传输地址、传输类型、端口号(Port ID)、传输方向、进程名等信息,与TIPC协议中规定的格式一致。
格式2
第一网络节点设备向第二网络节点设备发送的TIPC报文包括报文头数据、用户数据及报文发送时间三部分内容,即,采用如图9所示的报文格式。其中,报文发送时间为第一网络节点设备向第二网络节点设备发送第一TIPC报文的时间;TIPC报文格式中除该报文发送时间外的其它内容与上述图8所示的格式相同,为TIPC协议规定的格式。上述TIPC报文中增加的报文发送时间在报文格式中的位置可以是位于报文头数据之前,或者报文头数据与用户数据之间(图9示出),或者位于用户数据之后。
本发明实施例中,第一网络节点设备向第二网络节点设备发送TIPC报文进行通信的过程中,第一网络节点设备发送报文时增加报文过滤环节,筛选出符合预设筛选条件的TIPC报文,第二网络节点设备接收TIPC报文时增加报文过滤环节,筛选出符合预设筛选条件的TIPC报文。第一网络节点设备与第二网络节点设备筛选到符合预设筛选条件的TIPC报文时,分别将筛选到的TIPC报文发送到通信故障检测设备,未筛选到符合预设筛选条件的TIPC报文时,不向通信故障检测设备发送TIPC报文。
上述符合预设筛选条件为TIPC报文的报文头数据与预设报文参数中,各相同字段对应的数据一致。其中,预设报文参数包括TIPC报文的报文头格式中至少一个字段对应的预设参数。
具体实施时,第一网络节点设备与第二网络节点设备在用户空间接收输入的预设筛选条件及对应的预设报文参数,然后发送到内核空间的TIPC协议内核,由TIPC协议内核在2层收发接口对发送的TIPC报文进行筛选。
具体的,如图10所示,第一网络节点设备或第二网络节点设备在用户空间,通过TIPC-Config(配置命令)进程接收用户输入的报文头识别参数,作为预设报文参数,对预设报文参数进行有效性判断,例如判断该预设参数是否是TIPC报文头数据格式中包括的字段对应的数据、数据格式是否正确等。若确定预设报文参数有效,则通过TIPC-Config进程发送到内核空间的TIPC协议内核;若确定预设报文参数无效,则输出参数设置无效的提示信息,反馈给用户。
TIPC报文头数据中不同字段对应的数据具有不同含义,根据预设筛选条件对应的预设报文参数,能够对其中至少一个字段对应的数据进行匹配,来筛选出符合条件的TIPC报文。其中,每个预设筛选条件可以对应多个不同的预设报文参数。
上述TIPC-Config是用户空间的进程,TIPC协议是运行在内核空间的,本实施例采用内核开源Netlink机制完成用户空间和内核空间之间的数据交互。如图11所示,在用户空间根据输入的报文头识别参数确定对应的预设筛选条件后,通过TIPC-Config进程对该筛选条件进行合理性检测。若确定筛选条件合理,则通过Netlink将预设筛选条件发送到内核空间的TIPC协议内核,否则,输出筛选条件无效的提示信息。
第一网络节点设备内核空间TIPC层接收到上述预设筛选条件后,在Bearer层的2层收发接口对需要发送的第一TIPC报文进行筛选,具体的TIPC报文发送及筛选流程如图12所示,包括:
步骤1、TIPC的Link层对待发送的数据报文进行协议封装,得到SKB(SocketBuffers,套接字缓存)数据包格式的第一TIPC报文;
步骤2、Link层将第一TIPC报文发送给Bearer层;
步骤3、Bearer层对接收的第一TIPC报文的报文头数据进行TIPC协议报文头解析确定各字段数据;
步骤4、将解析的各字段数据分别与预设报文参数进行匹配;
步骤5、确定一致时确定匹配成功,将该第一TIPC报文发送到通信故障检测设备;
步骤6、Bearer层将第一TIPC报文发送到网络设备层;
步骤7、网络设备层将第一TIPC报文发送到第二网络节点设备。
上述步骤中,第一网络节点设备筛选到符合预设筛选条件的第一TIPC报文后,确定该第一TIPC报文中是否包括报文发送时间,若是,则仅将该第一TIPC报文发送到通信故障检测设备,否则,将发送该第一TIPC报文的报文发送时间发送到通信故障检测设备。
第二网络节点设备在Bearer层的2层收发接口对接收的第一TIPC报文进行筛选,具体的TIPC报文接收及筛选流程如图13所示,包括:
步骤1、网络设备层将接收的第一网络节点设备发送的SKB包格式的第一TIPC报文发送到Bearer层;
步骤2、Bearer层对接收的第一TIPC报文的报文头数据进行TIPC协议报文头解析确定各字段数据;
步骤3、将解析的各字段数据分别与预设报文参数进行匹配;
步骤4、确定一致时确定匹配成功,将该第一TIPC报文对应的第二TIPC报文发送到通信故障检测设备;
步骤5、Bearer层将第一TIPC报文发送到Link层,由Link层进行后续处理。
上述步骤中,第二网络节点设备确定接收的第一TIPC报文中是否包括报文发送时间,若是,则将该第一TIPC报文中的报文发送时间替换为接收该第一TIPC报文的报文接收时间后,得到对应的第二TIPC报文,发送到通信故障检测设备,否则,将第一TIPC报文作为第二TIPC报文发送到通信故障检测设备,并将接收该第一TIPC报文的报文接收时间发送到通信故障检测设备。
作为一种可选的实施方式,第二网络节点设备若确定接收的第一TIPC报文中包括报文发送时间,则将该报文发送时间与自身接收该第一TIPC报文的报文接收时间进行比较,若确定报文发送时间与报文接收时间之间的时间间隔大于预设阈值,则确定第一网络节点设备与第二网络节点设备间存在TIPC报文传输速率异常的故障,否则,确定第一网络节点设备与第二网络节点设备间不存在TIPC报文传输速率异常的故障。其中,该预设阈值为网络节点设备间传输TIPC报文的正常传输时间,可根据经验预估确定具体数值,或者取网络节点设备间传输TIPC报文的历史传输时间的平均值。
上述第二网络节点设备确定第一网络节点设备与第二网络节点设备间存在TIPC报文传输速率异常的故障时,还可以对接收到的第一TIPC报文进行类型识别,确定对应的报文类型为单播或广播,从而进一步确定第一网络节点设备与第二网络节点设备间存在单播TIPC报文传输速率异常或广播TIPC报文传输速率异常的故障。
本发明实施例中,通信故障检测设备用于对第一网络节点设备和第二网络节点设备间的通信故障进行检测。
具体的,通信故障检测设备接收第一网络节点设备上报的第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若是,则确定第一网络节点设备和第二网络节点设备间的通路不存在不通的故障;否则,确定第一网络节点设备到第二网络节点设备的传输通路单向不通。其中,预设时间用于消除第一网络节点设备将第一TIPC报文发送到第二网络节点设备的正常传输耗时,及第一网络节点设备和第二网络节点设备向通信故障检测设备发送报文的传输时差导致的时间误差,可根据经验设定。
本申请实施例中,通信故障检测设备确定第一网络节点设备到第二网络节点设备的传输通路单向不通时,记录该故障信息,后续若确定第二网络节点设备到第一网络节点设备的传输通路单向不通,则确定第一网络节点设备与第二网络节点设备之间的传输通路双向不通;或者,通信故障检测设备确定第二网络节点设备到第一网络节点设备的传输通路单向不通时,记录该故障信息,后续若确定第一网络节点设备到第二网络节点设备的传输通路单向不通,则确定第一网络节点设备与第二网络节点设备之间的传输通路双向不通。
上述通信故障检测设备若确定接收到第二网络节点设备上报的第一TIPC报文对应的第二TIPC报文,则确定第一TIPC报文对应的报文发送时间与报文接收时间之间的时间间隔是否大于预设阈值,若是,说明第一网络节点设备和第二网络节点设备间报文的传输时间大于正常传输时间,报文传输过慢,则确定第一网络节点设备和第二网络节点设备间存在报文传输速率异常的故障,否则,确定第一网络节点设备和第二网络节点设备间报文传输速率正常。其中,报文发送时间为第一网络节点设备向第二网络节点设备发送第一TIPC报文的时间,报文接收时间为第二网络节点设备接收到第一网络节点设备发送的第一TIPC报文的时间。
通信故障检测设备通过如下任一方式确定第一TIPC报文对应的报文发送时间,及对应的报文接收时间:
1)从第一TIPC报文中读取报文发送时间,从第二TIPC报文中读取报文接收时间;此种方式可在第一网络节点设备向第二网络节点设备发送的TIPC报文采用上述格式2的场景下执行。
2)接收第一网络节点设备发送的报文发送时间,接收第二网络节点设备发送的报文接收时间;此种方式可在第一网络节点设备向第二网络节点设备发送的TIPC报文采用上述格式1的场景下执行。
本发明实施例中,通信故障检测设备接收到第一网络节点设备上报的第一TIPC报文时,识别该第一TIPC报文的报文类型,或者,接收到第二网络节点设备上报的第一TIPC报文对应的第二TIPC报文时,识别该第二TIPC报文的报文类型。确定报文类型为单播报文时,则在上述确定第一网络节点设备和第二网络节点设备间存在通信故障时,能够确定该故障为单播故障;确定报文类型为广播报文时,则在上述确定第一网络节点设备和第二网络节点设备间存在通信故障时,能够确定该故障为广播故障。
其中,通信故障检测设备通过如下任一方式确定第一TIPC报文或第二TIPC报文的报文类型:
1)对第一TIPC报文或第二TIPC报文进行内容分析,确定对应的报文类型。
该方式中,通信故障检测设备接收到第一网络节点设备上报的第一TIPC报文或第二网络节点设备上报的第二TIPC报文后,根据报文内容对第一TIPC报文或第二TIPC报文进行类型识别,确定对应的报文类型。
2)接收第一网络节点设备发送的第一TIPC报文的报文类型或接收第二网络节点设备发送的第二TIPC报文的报文类型。
该方式中,第一网络节点设备或第二网络节点设备将TIPC报文上报给通信故障检测设备时,可以同时将该TIPC报文对应的报文类型上报给通信故障检测设备,以使通信故障检测设备根据该报文类型确定发生故障对应的传输类型。其中,上述报文类型包括单播和广播。
本申请实施例中,第一网络节点设备与第二网络节点设备筛选出符合预设筛选条件的第一TIPC报文时,还可以将第一TIPC报文,或者将第一TIPC报文与第一TIPC报文对应的第二TIPC报文打印输出。从而根据两个设备是否输出相对应的报文确定两个设备间是否存在通信故障,或者,将两个设备筛选出的第一TIPC报文或将第一TIPC报文与第一TIPC报文对应的第二TIPC报文进行对比,确定两个设备间是否存在通信故障。
以上对本发明中一种检测网络通信故障的方法进行说明,以下对执行上述检测网络通信故障方法的装置及设备进行说明。
请参阅图14,本发明实施例提供一种检测网络通信故障的装置,应用于第一网络节点设备,包括:
报文发送模块1401,用于向第二网络节点设备发送第一透明内部进程通信TIPC报文,以使所述第二网络节点设备确定所述第一TIPC报文符合预设的筛选条件后,将所述第一TIPC报文对应的第二TIPC报文上报给通信故障检测设备;
报文筛选模块1402,用于确定所述第一TIPC报文是否符合所述筛选条件;
报文上报模块1403,用于若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
可选地,所述报文发送模块向第二网络节点设备发送第一TIPC报文,包括:
向所述第二网络节点设备发送携带报文发送时间的第一TIPC报文,以使所述第二网络节点设备根据所述报文发送时间确定所述第一TIPC报文对应的第二TIPC报文,和/或,根据所述报文发送时间确定所述第一网络节点设备与所述第二网络节点设备间的通信故障;
其中,所述报文发送时间为向所述第二网络节点设备发送所述第一TIPC报文的时间。
可选地,所述报文筛选模块确定所述第一TIPC报文是否符合预设的筛选条件,包括:
确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据是否一致;
若确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据一致,则确定所述第一TIPC报文符合所述筛选条件。
请参阅图15,本发明实施例提供一种检测网络通信故障的装置,应用于第二网络节点设备,包括:
报文接收模块1501,用于接收第一TIPC报文,所述第一TIPC报文是第一网络节点设备发送给所述第二网络节点设备的、并且是所述第一网络节点设备在确定所述第一TIPC报文符合预设的筛选条件后发送给通信故障检测设备的;
报文筛选模块1502,用于确定所述第一TIPC报文是否符合所述筛选条件;
报文上报模块1503,用于若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
可选地,所述报文筛选模块确定所述第一TIPC报文是否符合所述筛选条件,包括:
确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据是否一致;
若确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据一致,则确定所述第一TIPC报文符合所述筛选条件。
可选地,所述报文上报模块将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,包括:
确定所述第一TIPC报文中是否包括报文发送时间,其中,所述报文发送时间为所述第一网络节点设备向所述第二网络节点设备发送所述第一TIPC报文的时间;
若确定所述第一TIPC报文中包括所述报文发送时间,则将所述第一TIPC报文的报文接收时间替换所述报文发送时间,得到第二TIPC报文,并向所述通信故障检测设备发送所述第二TIPC报文;
若确定所述第一TIPC报文中未包括所述报文发送时间,则将所述第一TIPC报文作为第二TIPC报文发送给所述通信故障检测设备。
可选地,所述报文上报模块确定所述第一TIPC报文中包括所述报文发送时间之后,还用于:
确定所述报文发送时间与所述报文接收时间之间的时间间隔是否大于预设阈值;
若确定所述时间间隔大于所述预设阈值,则确定所述第一网络节点设备与所述第二网络节点设备之间的TIPC报文传输速率异常。
请参阅图16,本发明实施例提供一种检测网络通信故障的装置,应用于通信故障检测设备,包括:
第一报文接收模块1601,用于接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;
第二报文接收模块1602,用于确定预设时间内是否接收到所述第二网络节点设备上报的所述第一TIPC报文对应的第二TIPC报文;
第一故障确定模块1603,用于若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通;
第二故障确定模块1604,用于若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
可选地,所述第二故障确定模块根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障,包括:
确定所述第一TIPC报文中包括的报文发送时间与所述第二TIPC报文中包括的报文接收时间之间的时间间隔是否大于预设阈值;
若确定所述时间间隔大于所述预设阈值,则确定所述第一网络节点设备与所述第二网络节点设备之间的TIPC报文传输速率异常;
其中,所述报文发送时间为所述第一网络节点设备向所述第二网络节点设备发送所述第一TIPC报文的时间,所述报文接收时间为所述第二网络节点设备接收到所述第一网络节点设备发送的所述第一TIPC报文的时间。
可选地,所述第一故障确定模块确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通之后,还包括:
若已确定所述第二网络节点设备到所述第一网络节点设备的传输通路单向不通,则确定所述第一网络节点设备与所述第二网络节点设备之间的传输通路双向不通。
可选地,所述第一故障确定模块确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,或者所述第二网络节点设备到所述第一网络节点设备的传输通路单向不通,或者所述第一网络节点设备与所述第二网络节点设备之间的传输通路双向不通之后,还包括:
若确定所述第一TIPC报文为单播报文,则确定所述第一网络节点设备与所述第二网络节点设备之间的故障为单播通信故障;
若确定所述第一TIPC报文为广播报文,则确定所述第一网络节点设备与所述第二网络节点设备之间的故障为广播通信故障。
上面从模块化功能实体的角度对本申请实施例中执行检测网络通信故障方法的装置进行了描述,下面从硬件处理的角度对本申请实施例中执行检测网络通信故障方法的设备进行描述。
请参阅图17,本申请实施例中提供一种电子设备,包括:
处理器1701、存储器1702、收发器1709以及总线系统1711;
所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,实现应用于本申请实施例中第一网络节点设备的通信故障检测方法,或者实现应用于本申请实施例中第二网络节点设备的通信故障检测方法,或者实现应用于本申请实施例中通信故障检测设备的通信故障检测方法。
图17是本发明实施例提供的一种电子设备的结构示意图,该设备1700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(英文全称:centralprocessing units,英文简称:CPU)1701(例如,一个或一个以上处理器)和存储器1702,一个或一个以上存储应用程序1704或数据1706的存储介质1703(例如一个或一个以上海量存储设备)。其中,存储器1702和存储介质1703可以是短暂存储或持久存储。存储在存储介质1703的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对信息处理装置中的一系列指令操作。更进一步地,处理器1701可以设置为与存储介质1703通信,在设备1700上执行存储介质1703中的一系列指令操作。
设备1700还可以包括一个或一个以上电源1710,一个或一个以上有线或无线网络接口1707,一个或一个以上输入输出接口1708,和/或,一个或一个以上操作系统1705,例如Windows Server,Mac OS X,Unix,Linux,FreeBSD等。
其中,所述处理器执行所述存储器中的程序,执行应用于第一网络节点设备的通信故障检测方法时,包括如下步骤:
向第二网络节点设备发送第一透明内部进程通信TIPC报文,以使所述第二网络节点设备确定所述第一TIPC报文符合预设的筛选条件后,将所述第一TIPC报文对应的第二TIPC报文上报给通信故障检测设备;
确定所述第一TIPC报文是否符合所述筛选条件;
若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
所述处理器执行所述存储器中的程序,执行应用于第二网络节点设备的通信故障检测方法时,包括如下步骤:
接收第一TIPC报文,所述第一TIPC报文是第一网络节点设备发送给所述第二网络节点设备的、并且是所述第一网络节点设备在确定所述第一TIPC报文符合预设的筛选条件后发送给通信故障检测设备的;
确定所述第一TIPC报文是否符合所述筛选条件;
若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
所述处理器执行所述存储器中的程序,执行应用于第一网络节点设备的通信故障检测方法时,包括如下步骤:
接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;
确定预设时间内是否接收到所述第二网络节点设备上报的所述第一TIPC报文对应的第二TIPC报文;
若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通;
若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
本发明实施例还提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述实施例提供的检测网络通信故障的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种检测网络通信故障的方法,应用于第一网络节点设备,其特征在于,包括:
向第二网络节点设备发送第一透明内部进程通信TIPC报文,以使所述第二网络节点设备确定所述第一TIPC报文符合预设的筛选条件后,将所述第一TIPC报文对应的第二TIPC报文上报给通信故障检测设备;
确定所述第一TIPC报文是否符合所述筛选条件;
若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
2.根据权利要求1所述的方法,其特征在于,所述向第二网络节点设备发送第一TIPC报文,包括:
向所述第二网络节点设备发送包括报文发送时间的第一TIPC报文,以使所述第二网络节点设备根据所述报文发送时间确定所述第一TIPC报文对应的第二TIPC报文,和/或,根据所述报文发送时间确定所述第一网络节点设备与所述第二网络节点设备间的通信故障;
其中,所述报文发送时间为向所述第二网络节点设备发送所述第一TIPC报文的时间。
3.根据权利要求1或2所述的方法,其特征在于,所述确定所述第一TIPC报文是否符合预设的筛选条件,包括:
确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据是否一致;
若确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据一致,则确定所述第一TIPC报文符合所述筛选条件。
4.一种检测网络通信故障的方法,应用于第二网络节点设备,其特征在于,包括:
接收第一TIPC报文,所述第一TIPC报文是第一网络节点设备发送给所述第二网络节点设备的、并且是所述第一网络节点设备在确定所述第一TIPC报文符合预设的筛选条件后发送给通信故障检测设备的;
确定所述第一TIPC报文是否符合所述筛选条件;
若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
5.根据权利要求4所述的方法,其特征在于,所述确定所述第一TIPC报文是否符合所述筛选条件,包括:
确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据是否一致;
若确定所述第一TIPC报文的报文头数据与预设报文参数中各相同字段对应的数据一致,则确定所述第一TIPC报文符合所述筛选条件。
6.根据权利要求4或5所述的方法,其特征在于,所述将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,包括:
确定所述第一TIPC报文中是否包括报文发送时间,其中,所述报文发送时间为所述第一网络节点设备向所述第二网络节点设备发送所述第一TIPC报文的时间;
若确定所述第一TIPC报文中包括所述报文发送时间,则将所述第一TIPC报文的报文接收时间替换所述报文发送时间,得到第二TIPC报文,并向所述通信故障检测设备发送所述第二TIPC报文;
若确定所述第一TIPC报文中未包括所述报文发送时间,则将所述第一TIPC报文作为第二TIPC报文发送给所述通信故障检测设备。
7.根据权利要求6所述的方法,其特征在于,所述确定所述第一TIPC报文中包括所述报文发送时间之后,还包括:
确定所述报文发送时间与所述报文接收时间之间的时间间隔是否大于预设阈值;
若确定所述时间间隔大于所述预设阈值,则确定所述第一网络节点设备与所述第二网络节点设备之间的TIPC报文传输速率异常。
8.一种检测网络通信故障的方法,应用于通信故障检测设备,其特征在于,包括:
接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;
确定预设时间内是否接收到所述第二网络节点设备上报的所述第一TIPC报文对应的第二TIPC报文;
若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通;
若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
9.根据权利要求8所述的方法,其特征在于,所述根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障,包括:
确定所述第一TIPC报文的报文发送时间与报文接收时间之间的时间间隔是否大于预设阈值;
若确定所述时间间隔大于所述预设阈值,则确定所述第一网络节点设备与所述第二网络节点设备之间的TIPC报文传输速率异常;
其中,所述报文发送时间为所述第一网络节点设备向所述第二网络节点设备发送所述第一TIPC报文的时间,所述报文接收时间为所述第二网络节点设备接收到所述第一网络节点设备发送的所述第一TIPC报文的时间。
10.根据权利要求8所述的方法,其特征在于,确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通之后,还包括:
若已确定所述第二网络节点设备到所述第一网络节点设备的传输通路单向不通,则确定所述第一网络节点设备与所述第二网络节点设备之间的传输通路双向不通。
11.根据权利要求8~10任一所述的方法,其特征在于,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障之后,还包括:
若确定所述第一TIPC报文为单播报文,则确定所述第一网络节点设备与所述第二网络节点设备之间的通信故障为单播通信故障;
若确定所述第一TIPC报文为广播报文,则确定所述第一网络节点设备与所述第二网络节点设备之间的通信故障为广播通信故障。
12.一种检测网络通信故障的装置,应用于第一网络节点设备,其特征在于,包括:
报文发送模块,用于向第二网络节点设备发送第一透明内部进程通信TIPC报文,以使所述第二网络节点设备确定所述第一TIPC报文符合预设的筛选条件后,将所述第一TIPC报文对应的第二TIPC报文上报给通信故障检测设备;
报文筛选模块,用于确定所述第一TIPC报文是否符合所述筛选条件;
报文上报模块,用于若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
13.一种检测网络通信故障的装置,应用于第二网络节点设备,其特征在于,包括:
报文接收模块,用于接收第一TIPC报文,所述第一TIPC报文是第一网络节点设备发送给所述第二网络节点设备的、并且是所述第一网络节点设备在确定所述第一TIPC报文符合预设的筛选条件后发送给通信故障检测设备的;
报文筛选模块,用于确定所述第一TIPC报文是否符合所述筛选条件;
报文上报模块,用于若确定所述第一TIPC报文符合所述筛选条件,则将所述第一TIPC报文对应的第二TIPC报文上报给所述通信故障检测设备,以使所述通信故障检测设备接收所述第一TIPC报文后,确定预设时间内是否接收到所述第二TIPC报文,若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通,若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
14.一种检测网络通信故障的装置,应用于通信故障检测设备,其特征在于,包括:
第一报文接收模块,用于接收第一网络节点设备上报的、且发送给第二网络节点设备的第一TIPC报文;
第二报文接收模块,用于确定预设时间内是否接收到所述第二网络节点设备上报的所述第一TIPC报文对应的第二TIPC报文;
第一故障确定模块,用于若确定所述预设时间内未接收到所述第二TIPC报文,则确定所述第一网络节点设备到所述第二网络节点设备的传输通路单向不通;
第二故障确定模块,用于若确定所述预设时间内接收到所述第二TIPC报文,则根据所述第一TIPC报文和所述第二TIPC报文,确定所述第一网络节点设备与所述第二网络节点设备间的通信故障。
15.一种电子设备,其特征在于,包括:存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,实现如权利要求1~3、4-7或者8-11任一所述方法的步骤。
16.一种计算机程序介质,其特征在于,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~3任一所述方法的步骤,或者实现如权利要求4~7任一所述方法的步骤,或者实现如权利要求8~11任一所述方法的步骤。
CN202011190346.4A 2020-10-30 2020-10-30 一种检测网络通信故障的方法、装置及电子设备 Active CN112367196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011190346.4A CN112367196B (zh) 2020-10-30 2020-10-30 一种检测网络通信故障的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011190346.4A CN112367196B (zh) 2020-10-30 2020-10-30 一种检测网络通信故障的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112367196A true CN112367196A (zh) 2021-02-12
CN112367196B CN112367196B (zh) 2023-03-21

Family

ID=74513318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011190346.4A Active CN112367196B (zh) 2020-10-30 2020-10-30 一种检测网络通信故障的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112367196B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114268562A (zh) * 2021-11-01 2022-04-01 贵州电网有限责任公司 芯片化继电保护的传输链路检测装置、系统和方法
WO2022267815A1 (zh) * 2021-06-21 2022-12-29 中兴通讯股份有限公司 数据包过滤方法和装置、电子设备、和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080080384A1 (en) * 2006-10-02 2008-04-03 Atkins Mark G System and method for implementing an infiniband error log analysis model to facilitate faster problem isolation and repair
CN101212366A (zh) * 2007-12-21 2008-07-02 杭州华三通信技术有限公司 以太环网中的故障检测方法、系统及主节点
CN102244600A (zh) * 2011-08-12 2011-11-16 华为技术有限公司 一种rrpp环网中链路故障检测及处理方法、装置
CN107360012A (zh) * 2016-05-10 2017-11-17 大唐移动通信设备有限公司 一种链路状态处理方法及网络节点设备
CN109495322A (zh) * 2018-12-25 2019-03-19 华为技术有限公司 网络故障定位方法、相关设备及计算机存储介质
US20190288905A1 (en) * 2016-12-02 2019-09-19 Huawei Technologies Co., Ltd. Fault detection method, apparatus, and system in nfv system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080080384A1 (en) * 2006-10-02 2008-04-03 Atkins Mark G System and method for implementing an infiniband error log analysis model to facilitate faster problem isolation and repair
CN101212366A (zh) * 2007-12-21 2008-07-02 杭州华三通信技术有限公司 以太环网中的故障检测方法、系统及主节点
CN102244600A (zh) * 2011-08-12 2011-11-16 华为技术有限公司 一种rrpp环网中链路故障检测及处理方法、装置
CN107360012A (zh) * 2016-05-10 2017-11-17 大唐移动通信设备有限公司 一种链路状态处理方法及网络节点设备
US20190288905A1 (en) * 2016-12-02 2019-09-19 Huawei Technologies Co., Ltd. Fault detection method, apparatus, and system in nfv system
CN109495322A (zh) * 2018-12-25 2019-03-19 华为技术有限公司 网络故障定位方法、相关设备及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
施思 等: "TIPC在嵌入式集群系统中的应用与优化", 《信息技术与网络安全》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022267815A1 (zh) * 2021-06-21 2022-12-29 中兴通讯股份有限公司 数据包过滤方法和装置、电子设备、和计算机可读存储介质
CN114268562A (zh) * 2021-11-01 2022-04-01 贵州电网有限责任公司 芯片化继电保护的传输链路检测装置、系统和方法

Also Published As

Publication number Publication date
CN112367196B (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
JP3640187B2 (ja) マルチプロセッサシステムの障害処理方法、マルチプロセッサシステム及びノード
US8284669B2 (en) Data acknowledgement apparatus and method
US20040001449A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
US7424640B2 (en) Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes
CN112367196B (zh) 一种检测网络通信故障的方法、装置及电子设备
US20060280132A1 (en) Techniques to identify duplex mismatch
CN107948063B (zh) 一种建立聚合链路的方法和接入设备
JPH09160858A (ja) データ再送方法及びサーバ
US7178051B2 (en) Method for synchronous support of fault-tolerant and adaptive communication
US20070226549A1 (en) Apparatus for detecting errors in a communication system
CN105634894A (zh) 一种增强型can总线数据重发方法和装置
CN113992740B (zh) 一种基于自主可控的中间件及数据传输方法
CN111556043B (zh) 一种报文处理方法、装置、系统、设备及可读存储介质
US6938086B1 (en) Auto-detection of duplex mismatch on an ethernet
Cisco CIP Microcode Release Note and Upgrade Instructions
US11784929B2 (en) Heterogeneous link data translation and distribution method, system and device, and storage medium
CN113242292A (zh) 报文传输方法、装置、设备、介质及产品
KR100216580B1 (ko) 비동기전달모드 교환기와 운용워크스테이션간의 통신장애상태 관리방법
JP2009130405A (ja) 受信装置及び通信システム
CN110099001A (zh) 双向转发检测时间参数协商方法、装置及电子设备
CN114500157B (zh) 基于can网关的冗余实现系统、电子设备和计算机可读存储介质
CN113791804B (zh) 多路仪器并行升级的方法、装置、计算机设备及存储介质
CN117240552A (zh) 跨场区数据传输自动化验证方法和装置
CN117082653A (zh) 基于重发机制的网络通信优化方法及系统
US7500154B2 (en) Method and system for generating a console log

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant