CN113395319A - 网络故障感知的方法、系统、电子设备及存储介质 - Google Patents

网络故障感知的方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN113395319A
CN113395319A CN202110454288.XA CN202110454288A CN113395319A CN 113395319 A CN113395319 A CN 113395319A CN 202110454288 A CN202110454288 A CN 202110454288A CN 113395319 A CN113395319 A CN 113395319A
Authority
CN
China
Prior art keywords
node
current target
edge node
intermediate node
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110454288.XA
Other languages
English (en)
Other versions
CN113395319B (zh
Inventor
姚文昊
彭辉云
彭怀德
杨辉
李雪婷
孔强
熊艳芳
王敏
王琦珑
吴浩
黄一凡
段晓光
熊艳
周成
杨雨晴
章小枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Beijing University of Posts and Telecommunications
Economic and Technological Research Institute of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Beijing University of Posts and Telecommunications
Economic and Technological Research Institute of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Beijing University of Posts and Telecommunications, Economic and Technological Research Institute of State Grid Jiangxi Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110454288.XA priority Critical patent/CN113395319B/zh
Publication of CN113395319A publication Critical patent/CN113395319A/zh
Application granted granted Critical
Publication of CN113395319B publication Critical patent/CN113395319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开提供一种网络故障感知的方法、系统、电子设备及存储介质,该方法边缘节点先通过已构建的感知函数,从所有与该边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点,然后向该当前目标中心节点发送所述连接性检查消息,边缘节点根据是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知,从而准确确定网络故障的位置,并提高了网络故障感知的效率。

Description

网络故障感知的方法、系统、电子设备及存储介质
技术领域
本公开涉及网络信息技术领域,尤其涉及一种网络故障感知的方法、系统、电子设备及存储介质。
背景技术
随着云数据中心互连成为云计算的支持技术,云间数据中心的任何故障都可能严重影响云计算的性能。例如,2013年8月,Amazon aws服务关闭了大约半小时。据《福布斯》(Forbes)估计,由于数据中心停机造成的收入损失为每分钟66,240美元。同月,数据中心提供的所有Google服务都关闭了大约5分钟,导致全球网络流量下降了40%,估计损失了500,000美元。在这种情况下,分布式云数据中心的复杂性体现在以下几点。首先,云节点和链接规模的急剧增加将导致更多潜在的故障风险以及大量的警报信息。此外,由于云数据中心灵活性的增加,故障定位变得更加困难。具体来说,由具有复杂调用关系的多数据中心承载的大量服务,在云数据中心之间具有大量的交互需求。另外,大量数据的迁移和备份也增加了云数据中心之间的交互。由于潜在的网络状态和数据中心之间的交互的复杂性,发生故障时将有更多的警报集,这使得难以确定故障表现的确切根本原因。
近年来连接到网络的设备和终端数量大幅度上升,使得处理数据的核心网压力巨增,为了减轻核心网的压力,也为了契合5G的低时延、大带宽、高并发和本地化场景需求,需要把一些高复杂度的服务和任务下沉到网络的边缘节点进行处理,而移动边缘计算MEC(Mobile Edge Computing)作为边缘节点,几乎一半的数据需要在此进行分析、处理,如果边缘节点发生故障,云数据中心又没能及时处理,那么损失不可估量。
发明内容
有鉴于此,本公开的目的在于提出一种网络故障感知的方法、系统、电子设备及存储介质。
基于上述目的,本公开提供了一种网络故障感知的方法,该方法包括:
边缘节点基于已构建的感知函数,从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点;
所述边缘节点向所述当前目标中间节点发送所述连接性检查消息;
所述边缘节点基于是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知。
从上面所述可以看出,本公开提供的网络故障感知的方法,边缘节点先通过已构建的感知函数,从所有与该边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点,然后向该当前目标中心节点发送所述连接性检查消息,边缘节点根据是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知,从而准确确定网络故障的位置,并提高了网络故障感知的效率。
附图说明
为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例的一种网络故障感知的方法的流程示意图;
图2为本公开实施例的另一种网络故障感知的方法的流程示意图;
图3为本公开实施例的一种具体的电子设备硬件结构示意。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如背景技术部分所述,近年来连接到网络的设备和终端数量大幅度上升,使得处理数据的云数据中心压力巨增,为了减轻云数据中心的压力,也为了契合5G的低时延、大带宽、高并发和本地化场景需求,需要把一些高复杂度的服务和任务下沉到网络的边缘进行处理,而移动边缘计算MEC(Mobile Edge Computing)作为边缘节点,几乎一半的数据需要在此进行分析、处理,这时若边缘节点发生故障那么后果不堪设想,但是传统的网络故障判断方法主要通过云数据中心(中心节点)来进行数据采集分析,然后确定故障位置,这种判断方法由于受到云数据中心本身庞大数据处理量的影响很难做到准确快速的找到网络中的故障位置,为了避免这种情况,本公开通过各个边缘节点来进行故障位置的确定,并在进行故障确定之前边缘节点预先通过构建的感知函数进行故障位置的预筛选即从所有与边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点,进一步提高了故障位置确定的效率,最后边缘节点通过判断中间节点与边缘节点的之间的路径是否正常来确定故障位置,从而在通过感知函数预判之后进一步通过验证来确定故障位置,保证了故障感知的准确定性。
在一个具体应用场景中,本公开的网络故障感知的方法可以应用于边缘节点与云端网络协同工作的网路中,该网路可以是移动网、互联网、局域网等其他具有多个交互节点的网络。
同样的,在另一具体应用场景中,本公开的网络故障感知的方法可以应用于多个具有网络连接关系的终端,通过本公开的方案可以确定各个终端之间的连接关系是否发生了故障。
参考图1,为本公开实施例的一种网络故障感知的方法的流程示意图,该方法包括以下步骤:
S101,边缘节点基于已构建的感知函数,从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点。
本步骤中,边缘节点可以是各种具有计算能力的传感器,小到终端嵌入式芯片,大到智能汽车,边缘节点与其他节点进行信号交互时,主要通过各个中间节点来完成信息的传递,每个边缘节点连接的中间节点的数量不固定,因此在通过构建的感知函数判断故障位置时只判断与边缘节点有连接关系的中间节点是否存在故障,并将通过感知函数将最可能发生故障的中间节点确认为当前目标中间节点。
需要说明的是,每次边缘节点通过感知函数确认当前目标中心节点后,会对该目标中间节点进行后续验证,若验证后发现该目标中间节点没有故障,会重新通过感知函数再次确认当前目标中间节点,此时的当前目标中心节点是在剩余的与边缘节点有连接关系且未进行验证的中间节点中,再次确认最可能发生故障的中间节点为当前目标中间节点。这里是否进行过验证主要通过是否接收过连接性检查消息来确认,该连接性检查消息(CCM,Connectivity Check Message)用于判断节点之间的路径是否正常。
为了准确的构建感知函数,在一些实施例中,在从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点之前,所述方法还包括:
所述边缘节点对于任一所述中间节点,确定该中间节点在所有预设时段下分别对应的差异特征向量,并确定所有所述差异特征向量中最大的所述差异特征向量为最大差异特征向量;
所述边缘节点确定所述最大差异特征向量对应的目标预设时段,并确定所有所述中间节点在该目标预设时段下的所述差异特征向量的和,基于所述最大差异特征向量与所述和,确定所述感知函数的权重;
所述边缘节点基于所述感知函数权重与该中间节点的差异特征向量,构建该中间节点对应的所述感知函数;
其中,所述差异特征向量为其对应的所述中间节点在相应的所述预设时段内开始收集数据与结束收集数据的特征向量的差的绝对值。
具体的,为了使构建的感知函数可以很好的找到当前目标中间节点,本公开通过设置差异特征向量来表示中间节点在预设时段内的特征波动,该差异特征向量是在预设时段内每个中间节点开始收集数据与结束收集数据的特征向量的差的绝对值,该预设时段可以根据需要进行设置,例如将预设时段设置为5分钟,对应的,此时的差异特征向量是这5分钟内中间节点开始收集数据时的特征向量减去这5分钟内中间节点结束收集数据时的特征向量的差的绝对值。在确定差异特征向量后,可选的,设置一个预设时间,该预设时间包括多个预设时段,对于每个中间节点,每个预设时段都对应一个差异特征向量,然后通过比较从中确定出最大的差异特征向量,该最大差异特征向量可以很好的表示出该中间节点的最大特点,同时,将最大差异特征向量对应的预设时段确定为目标预设时段,并计算所有中间节点在目标预设时段对应的差异特征向量的和,通过最大差异特征向量与所有中间节点在目标预设时段对应的差异特征向量的和,计算感知函数的权重,该感知函数的权重很好的表示了每个中间节点与其他中间节点的差异性,即每个中间节点的独特性,最后用每个中间节点在所有时段的差异特征向量的和与其对应的感知函数的权重相乘,构建该所述中间节点对应的所述感知函数。可选的,每个中间节点在所有时段的差异特征向量的和是在预设时间范围内的该中间节点在所有时段对应的差异特征向量的和。通过该感知函数就可以从多个中间节点中选出最可能发生故障的中间节点,可选的,边缘节点可以从云数据中心获取与当前边缘节点有连接关系的中间节点的数据信息,然后根据该数据信息构建每个中间节点的感知函数,可选的,边缘节点可以先构建出感知函数,然后从云数据中心获取与当前边缘节点有连接关系的中间节点的数据信息,并将该数据信息输入到感知函数中,得到各个中间节点的对应的感知函数。
在一些实施例中,所述特征向量包括时延特征向量、抖动特征向量、丢包率特征向量、接收流量特征向量、发送流量特征向量、边缘节点路由信息特征向量中的一个或多个,当所述特征向量为多个时,每个所述特征向量单独参与构建所述感知函数的过程,从而得到每个中间节点对应的的多个感知函数,且每个所述感知函数均单独参与确定所述当前目标中间节点。例如,当特征向量包括时延特征向量和抖动特征向量时,延时特征向量和抖动特征向量各自参与一次构建感知函数的过程,从而得到两个感知函数,然后每个感知函数都会确定出一个当前目标中间节点。
需要说明的是,根据这两个感知函数确认出的目标中间节点可能相同也可能不同,可选的,若这两个感知函数确认出的目标中间节点不同时,可以先将两个特征向量统一量化,然后进行比较重新确定出最可能发生故障的中间节点,并将该中间节点确认为当前目标中间节点,从而提高故障感知的效率。可选的,若这两个感知函数确认出的目标中间节点不同时,可以向两个目标中间节点同时发送连接性检查消息,并同时执行后续步骤。
为了进一步提高故障感知的效率,在一些实施例中,边缘节点基于已构建的感知函数,从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点,具体包括:
所述边缘节点从云数据中心获取历史故障位置,并基于已构建的所述感知函数及所述历史故障位置,从所有与边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定所述当前目标中间节点;
其中,所述历史故障位置是所述云数据中心将接收到的所述边缘节点发送的所述故障位置,按照预设规则进行筛选后确定的。
具体的,边缘节点每次确认故障位置后都会向云数据中心发送该故障位置,云数据中心会将所有故障位置进行保存,并通过预设规则筛选出重要的故障位置,作为历史故障位置进行长期保存,并删除那些不重要的故障位置。该预设规则包括相同故障位置出现的频率是否大于预设阈值、相同故障位置出现的频率的排名是否处于预设排名范围。为了进一步提高故障感知的效率,先通过从云数据中心获取的历史故障位置筛选出哪些中间节点可能出现故障,然后再从筛选出的中间节点中基于感知函数判断哪个中间节点出现故障的概率最大,这样减少了根据感知函数进行判断的工作量,从而提高了故障感知的效率。
在一些实施例中,当边缘节点确定了故障位置后,除了将故障位置发送给云数据中心,同时将故障位置对应的所述感知函数发送给云数据中心,从而使云数据中心可以根据感知函数确定感知函数对应的网络的故障位置的重要级别,从而可以根据该重要级别依次处理各个故障位置,保证了最重要的故障位置优先得到处理。可选的,云数据中心也可以通过该感知函数来对保存的故障位置进行筛选,并删除那些不重要的故障位置。
S102,所述边缘节点向所述当前目标中间节点发送所述连接性检查消息。
本步骤中,所述边缘节点在通过已构建的感知函数确定当前目标中间节点后,向该当前目标中心节点发送连接性检查消息。
S103,所述边缘节点基于是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知。
本步骤中,边缘节点向当前目标中间节点发送所述连接性检查消息后,若没有故障,中间节点会向该边缘节点发送回应信息,因此,该边缘节点通过是否接收到当前目标中间节点的回应信息来进行网络故障感知。
在一些实施例中,所述边缘节点基于是否接收到所述当前目标中间节点的回应信息,进行所述网络感知,具体包括:
所述边缘节点响应于确定接收到所述当前目标中间节点的回应信息,重新确定所述当前目标中间节点;
所述边缘节点响应于确定未接收到所述当前目标中间节点的回应信息,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。
具体的,边缘节点在向当前目标中间节点发送连接性检查消息后,若边缘节点接收到所述当前目标中间节点的回应信息,说明此时该当前目标中间节点与该边缘节点的路径正常,这时需重新确定所述当前目标中间节点,即重新开始执行步骤S101。若边缘节点未接收到所述当前目标中间节点的回应信息,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置,此时,该边缘节点的本次故障感知结束。
需要说明的是,由于在进行多次重新确定所述当前目标中间节点时,每次都是从未接受过连接性检查消息的中间节点中选出当前目标中间节点,所以若一直未发现故障位置,那么最后一次确认完当前目标中间节点后,不再存在未接受过连接性检查消息的中间节点,此时,该边缘节点的本次故障感知结束且未发现故障位置。
为了防止故障位置的误判,在一些实施例中,在所述边缘节点响应于确定未接收到所述当前目标中间节点的回应信息后,所述方法还包括:
所述边缘节点再次向所述当前目标中间节点发送所述连接性检查消息;
所述边缘节点响应于确定重新接收到所述当前目标中间节点的回应信息,重新确定所述当前目标中间节点;
所述边缘节点响应于确定再次未接收到所述当前目标中间节点的回应信息,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。
具体的,在进行故障位置确认时,有时因为网络延时等原因,一次未收到中间节点的回应信息并不能立刻确定该路径一定存在故障,为了避免这种因素的干扰,所以边缘节点在第一次未收到中间节点的回应信息时,并不马上做出判断,而是再次向所述当前目标中间节点发送所述连接性检查消息,若第二次同样未收到回应信息,再作出故障判断,若边缘节点第二次收到了回应信息,排除该中间节点的故障,并重新确定所述当前目标中间节点,即重新执行步骤S101。
参考图2,为本公开实施例的另一种网络故障感知的方法的流程示意图,该方法包括以下步骤:
S201,基于已构建的感知函数,从所有与边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点。
本步骤中,所述感知函数通过以下公式构建:
Figure BDA0003040004970000071
Figure BDA0003040004970000072
P(t)=|P1-P2|;
其中,F(t)表示所述感知函数,λt表示所述感知函数的权重,k表示预设时段,n表示预设时间内的所有的预设时段的数量,P1表示预设时段内开始数据收集时的单个中间节点的单个特征向量的数据,P2为预设时段内结束数据收集时的所述单个中间节点的所述单个特征向量的数据。i为中间节点,m为中间节点的数量,Pt为差异特征向量。
S202,向所述当前目标中间节点发送所述连接性检查消息。
S203,判断所述边缘节点是否接收到所述当前目标中间节点的回应信息。
本步骤中,边缘节点在向所述当前目标中间节点发送所述连接性检查消息后,判断所述边缘节点是否接收到所述当前目标中间节点的回应信息,若是,则执行步骤S201,若否,则执行步骤S204。
S204,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。
本步骤中,当所述边缘节点未接收到所述当前目标中间节点的回应信息后,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。可选的,在确认该故障位置后,将该故障位置发送给云数据中心。
本公开提供的网络故障感知的方法,边缘节点先通过已构建的感知函数,从所有与边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点,从而通过感知函数从所有相关中间节点中进行预判断,然后向该当前目标中心节点发送所述连接性检查消息,根据边缘节点是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知,从而准确确定网络故障的位置,并提高了网络故障感知的效率。此外,本公开对于流量爆炸时代进行网络故障定位具有较强的适应性,且本公开将复杂性保留在边缘节点上,提供了良好的扩缩性。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种网络故障感知的系统。
所述系统包括多个边缘节点、多个中间节点及云数据中心,所述中间节点用于传递所述边缘节点发送的信息,所述云数据中心用于存储故障位置,任一所述边缘节点均能用于执行如上所述的网络故障感知的方法。
在具体的应用场景中,边缘节点可以直接和云数据中心发送或接收消息,边缘节点也可以通过中间节点和云数据中心发送或接收消息。
上述实施例的系统用于实现前述任一实施例中相应的网络故障感知的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的网络故障感知的方法。
图3示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以是本公开的边缘节点,具体的可以采用通用的CPU(CentralProcessing Unit,中央处理器)、微处理器、应用专用集成电路(Application SpecificIntegrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以是本公开的云数据中心,具体的可以采用ROM(Read OnlyMemory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的网络故障感知的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的网络故障感知的方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的网络故障感知的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
需要说明的是,本公开的实施例还可以以下方式进一步描述:
一种网络故障感知的方法,包括:
边缘节点基于已构建的感知函数,从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点;
所述边缘节点向所述当前目标中间节点发送所述连接性检查消息;
所述边缘节点基于是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知。
可选的,所述边缘节点基于是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知,具体包括:
所述边缘节点响应于确定接收到所述当前目标中间节点的回应信息,重新确定所述当前目标中间节点;
所述边缘节点响应于确定未接收到所述当前目标中间节点的回应信息,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。
可选的,在所述边缘节点响应于确定未接收到所述当前目标中间节点的回应信息后,所述方法还包括:
所述边缘节点再次向所述当前目标中间节点发送所述连接性检查消息;
所述边缘节点响应于确定重新接收到所述当前目标中间节点的回应信息,重新确定所述当前目标中间节点;
所述边缘节点响应于确定再次未接收到所述当前目标中间节点的回应信息,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。
可选的,在从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点之前,所述方法还包括:
所述边缘节点对于任一所述中间节点,确定该中间节点在所有预设时段下分别对应的差异特征向量,并确定所有所述差异特征向量中最大的所述差异特征向量为最大差异特征向量;
所述边缘节点确定所述最大差异特征向量对应的目标预设时段,并确定所有所述中间节点在该目标预设时段下的所述差异特征向量的和,基于所述最大差异特征向量与所述和,确定所述感知函数的权重;
所述边缘节点基于所述感知函数权重与该中间节点的差异特征向量,构建该中间节点对应的所述感知函数;
其中,所述差异特征向量为其对应的所述中间节点在相应的所述预设时段内开始收集数据与结束收集数据的特征向量的差的绝对值。
可选的,所述特征向量包括时延特征向量、抖动特征向量、丢包率特征向量、接收流量特征向量、发送流量特征向量、边缘节点路由信息特征向量中的一个或多个;所述方法还包括:
所述边缘节点响应于确定所述特征向量为多个,每个所述特征向量单独参与构建所述感知函数的过程,以得到每个所述中间节点对应的多个所述感知函数且每个所述感知函数均单独参与确定所述当前目标中间节点。
可选的,在将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置之后,所述方法还包括:
所述边缘节点将所述故障位置以及所述故障位置对应的所述感知函数发送给云数据中心,以使所述云数据中心根据所述感知函数确定所述网络的故障位置的重要级别。
可选的,边缘节点基于已构建的感知函数,从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点,具体包括:
所述边缘节点从云数据中心获取历史故障位置,并基于已构建的所述感知函数及所述历史故障位置,从所有与边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定所述当前目标中间节点;
其中,所述历史故障位置是所述云数据中心将接收到的所述边缘节点发送的所述故障位置,按照预设规则进行筛选后确定的。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本公开实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本公开实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本公开实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本公开实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种网络故障感知的方法,包括:
边缘节点基于已构建的感知函数,从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点;
所述边缘节点向所述当前目标中间节点发送所述连接性检查消息;
所述边缘节点基于是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知。
2.根据权利要求1所述的方法,其中,所述边缘节点基于是否接收到所述当前目标中间节点的回应信息,进行所述网络故障感知,具体包括:
所述边缘节点响应于确定接收到所述当前目标中间节点的回应信息,重新确定所述当前目标中间节点;
所述边缘节点响应于确定未接收到所述当前目标中间节点的回应信息,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。
3.根据权利要求2所述的方法,其中,在所述边缘节点响应于确定未接收到所述当前目标中间节点的回应信息后,所述方法还包括:
所述边缘节点再次向所述当前目标中间节点发送所述连接性检查消息;
所述边缘节点响应于确定重新接收到所述当前目标中间节点的回应信息,重新确定所述当前目标中间节点;
所述边缘节点响应于确定再次未接收到所述当前目标中间节点的回应信息,将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置。
4.根据权利要求1所述的方法,其中,在从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点之前,所述方法还包括:
所述边缘节点对于任一所述中间节点,确定该中间节点在所有预设时段下分别对应的差异特征向量,并确定所有所述差异特征向量中最大的所述差异特征向量为最大差异特征向量;
所述边缘节点确定所述最大差异特征向量对应的目标预设时段,并确定所有所述中间节点在该目标预设时段下的所述差异特征向量的和,基于所述最大差异特征向量与所述和,确定所述感知函数的权重;
所述边缘节点基于所述感知函数权重与该中间节点的差异特征向量,构建该中间节点对应的所述感知函数;
其中,所述差异特征向量为其对应的所述中间节点在相应的所述预设时段内开始收集数据与结束收集数据的特征向量的差的绝对值。
5.根据权利要求4所述的方法,其中,所述特征向量包括时延特征向量、抖动特征向量、丢包率特征向量、接收流量特征向量、发送流量特征向量、边缘节点路由信息特征向量中的一个或多个;所述方法还包括:
所述边缘节点响应于确定所述特征向量为多个,每个所述特征向量单独参与构建所述感知函数的过程,以得到每个所述中间节点对应的多个所述感知函数且每个所述感知函数均单独参与确定所述当前目标中间节点。
6.根据权利要求2所述的方法,其中,在将所述边缘节点与所述当前目标中间节点之间的路径确定为故障位置之后,所述方法还包括:
所述边缘节点将所述故障位置以及所述故障位置对应的所述感知函数发送给云数据中心,以使所述云数据中心根据所述感知函数确定所述网络的故障位置的重要级别。
7.根据权利要求6所述的方法,其中,边缘节点基于已构建的感知函数,从所有与所述边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定当前目标中间节点,具体包括:
所述边缘节点从云数据中心获取历史故障位置,并基于已构建的所述感知函数及所述历史故障位置,从所有与边缘节点有连接关系且未接收过连接性检查消息的中间节点中确定所述当前目标中间节点;
其中,所述历史故障位置是所述云数据中心将接收到的所述边缘节点发送的所述故障位置,按照预设规则进行筛选后确定的。
8.一种网络故障感知的系统,其中,所述系统包括多个边缘节点、多个中间节点及云数据中心,所述中间节点用于传递所述边缘节点发送的信息,所述云数据中心用于存储故障位置,任一所述边缘节点均能用于执行如权利要求1至7任意一项所述的方法。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行权利要求1至7任一所述的方法。
CN202110454288.XA 2021-04-26 2021-04-26 网络故障感知的方法、系统、电子设备及存储介质 Active CN113395319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110454288.XA CN113395319B (zh) 2021-04-26 2021-04-26 网络故障感知的方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110454288.XA CN113395319B (zh) 2021-04-26 2021-04-26 网络故障感知的方法、系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113395319A true CN113395319A (zh) 2021-09-14
CN113395319B CN113395319B (zh) 2022-09-16

Family

ID=77617726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110454288.XA Active CN113395319B (zh) 2021-04-26 2021-04-26 网络故障感知的方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113395319B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114422338A (zh) * 2022-03-29 2022-04-29 浙江网商银行股份有限公司 故障影响分析方法以及装置

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050122908A1 (en) * 2003-12-09 2005-06-09 Toshio Soumiya Method of and control node for detecting failure
CN101163057A (zh) * 2007-11-20 2008-04-16 华为技术有限公司 故障通知方法和装置、以及业务接收方法和装置
CN101821990A (zh) * 2007-10-09 2010-09-01 Lm爱立信电话有限公司 处理网络中的故障的结构和方法
CN102137420A (zh) * 2011-03-29 2011-07-27 华为技术有限公司 语音信道的检测方法和基站控制器
CN102624584A (zh) * 2012-03-01 2012-08-01 中兴通讯股份有限公司 链路检测方法及装置
US20140233373A1 (en) * 2013-02-15 2014-08-21 Fujitsu Limited Node failure detection for distributed linear protection
WO2014132286A1 (en) * 2013-02-27 2014-09-04 National Institute Of Information And Communications Technology Method for link failure detection and session transfer to a lively link in the multihoming environment of id/locator split-based networks
CN104954153A (zh) * 2014-03-24 2015-09-30 中兴通讯股份有限公司 节点故障检测方法及装置
CN105379180A (zh) * 2013-08-09 2016-03-02 华为技术有限公司 一种业务流链路的连通性检测方法、相关装置及系统
CN107347014A (zh) * 2016-05-04 2017-11-14 中国移动通信集团广东有限公司 一种网络故障检测方法和系统
CN107682214A (zh) * 2016-08-01 2018-02-09 中兴通讯股份有限公司 环回检测方法及装置
CN107947851A (zh) * 2017-11-13 2018-04-20 深圳市飞鸿光电子有限公司 一种无源光网络的流氓光网络单元检测方法和系统
CN111510345A (zh) * 2020-04-03 2020-08-07 网宿科技股份有限公司 一种边缘节点异常检测的方法及装置
CN112260922A (zh) * 2020-10-16 2021-01-22 南京嘉环科技股份有限公司 网络环路问题快速定位方法与系统
CN112737871A (zh) * 2020-12-11 2021-04-30 北京东土军悦科技有限公司 链路故障检测方法、装置、计算机设备及存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050122908A1 (en) * 2003-12-09 2005-06-09 Toshio Soumiya Method of and control node for detecting failure
CN101821990A (zh) * 2007-10-09 2010-09-01 Lm爱立信电话有限公司 处理网络中的故障的结构和方法
CN101163057A (zh) * 2007-11-20 2008-04-16 华为技术有限公司 故障通知方法和装置、以及业务接收方法和装置
CN102137420A (zh) * 2011-03-29 2011-07-27 华为技术有限公司 语音信道的检测方法和基站控制器
CN102624584A (zh) * 2012-03-01 2012-08-01 中兴通讯股份有限公司 链路检测方法及装置
US20140233373A1 (en) * 2013-02-15 2014-08-21 Fujitsu Limited Node failure detection for distributed linear protection
WO2014132286A1 (en) * 2013-02-27 2014-09-04 National Institute Of Information And Communications Technology Method for link failure detection and session transfer to a lively link in the multihoming environment of id/locator split-based networks
CN105379180A (zh) * 2013-08-09 2016-03-02 华为技术有限公司 一种业务流链路的连通性检测方法、相关装置及系统
CN104954153A (zh) * 2014-03-24 2015-09-30 中兴通讯股份有限公司 节点故障检测方法及装置
CN107347014A (zh) * 2016-05-04 2017-11-14 中国移动通信集团广东有限公司 一种网络故障检测方法和系统
CN107682214A (zh) * 2016-08-01 2018-02-09 中兴通讯股份有限公司 环回检测方法及装置
CN107947851A (zh) * 2017-11-13 2018-04-20 深圳市飞鸿光电子有限公司 一种无源光网络的流氓光网络单元检测方法和系统
CN111510345A (zh) * 2020-04-03 2020-08-07 网宿科技股份有限公司 一种边缘节点异常检测的方法及装置
CN112260922A (zh) * 2020-10-16 2021-01-22 南京嘉环科技股份有限公司 网络环路问题快速定位方法与系统
CN112737871A (zh) * 2020-12-11 2021-04-30 北京东土军悦科技有限公司 链路故障检测方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李论: "复杂配电网故障区域定位及测距研究", 《万方学位论文库》 *
梁小晓: "物联网感知层传感节点故障诊断研究", 《组合机床与自动化加工技术》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114422338A (zh) * 2022-03-29 2022-04-29 浙江网商银行股份有限公司 故障影响分析方法以及装置

Also Published As

Publication number Publication date
CN113395319B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN111478798B (zh) 故障处理方法、故障处理的装置和存储介质
CN111126594B (zh) 基于边缘计算的神经网络模型动态切分方法及装置
CN112783731B (zh) 异常设备检测方法、装置、设备和存储介质
CN114978945B (zh) 基于边缘节点的网络拨测方法、服务器集群及相关设备
CN111031519A (zh) 一种基于边缘计算的终端接入认证方法及装置
CN113395319B (zh) 网络故障感知的方法、系统、电子设备及存储介质
CN113703996B (zh) 基于用户和yang模型分组的访问控制方法、设备及介质
CN108804210B (zh) 一种云平台的资源配置方法及装置
CN107608844B (zh) 一种硬件测试的方法、系统、装置及计算机可读存储介质
US20150142965A1 (en) Distributed deployment device and method
CN110380902B (zh) 拓扑关系生成方法、装置、电子设备及存储介质
CN113869989B (zh) 一种信息处理方法及装置
CN113806656A (zh) 确定用户的特征的方法、设备及计算机可读介质
CN113642638B (zh) 容量调整方法、模型的训练方法、装置、设备、存储介质
CN116009898A (zh) K8s部署任务的状态确定方法、装置、设备及介质
CN115580647A (zh) 一种服务调用链路追踪方法、系统及电子设备
CN113271606B (zh) 云原生移动网络稳定性保障的业务调度方法及电子设备
CN111585784B (zh) 一种网络切片部署方法及装置
CN113727208A (zh) 快速读写光模块参数信息的通信方法、装置、设备及介质
CN110738476A (zh) 一种样本迁移方法、装置及设备
CN114640383B (zh) 卫星网络业务建立方法、装置、电子设备及存储介质
CN115086226B (zh) 一种匿名网络中匿名链路建立方法和系统
CN109582449B (zh) 风控业务系统中的风控任务分组方法、装置、计算机设备
CN113472565B (zh) 服务器功能的扩容方法、装置、设备和计算机可读介质
CN112492005B (zh) 一种边缘设备的迁移方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant