CN112867051A - 用于基于对等统计的故障检测的系统和方法 - Google Patents

用于基于对等统计的故障检测的系统和方法 Download PDF

Info

Publication number
CN112867051A
CN112867051A CN202010117385.5A CN202010117385A CN112867051A CN 112867051 A CN112867051 A CN 112867051A CN 202010117385 A CN202010117385 A CN 202010117385A CN 112867051 A CN112867051 A CN 112867051A
Authority
CN
China
Prior art keywords
network component
operational
determining
parameter value
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010117385.5A
Other languages
English (en)
Inventor
程晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juniper Networks Inc
Original Assignee
Juniper Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Juniper Networks Inc filed Critical Juniper Networks Inc
Publication of CN112867051A publication Critical patent/CN112867051A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/10Monitoring; Testing of transmitters
    • H04B17/15Performance testing
    • H04B17/17Detection of non-compliance or faulty performance, e.g. response deviations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/309Measuring or estimating channel quality parameters
    • H04B17/318Received signal strength
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/02Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
    • H04W84/10Small scale networks; Flat hierarchical networks
    • H04W84/12WLAN [Wireless Local Area Networks]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/08Access point devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本公开的实施例涉及用于基于对等统计的故障检测的系统和方法。尽管许多网络组件包括诊断能力,但这些诊断可能不可靠。因此,当仅依赖于这些诊断时,会导致可操作性或不可操作性的错误指示。为了更好地检测网络组件的操作问题,来自网络组件和一个或多个对等设备的操作参数被分析,以确定网络组件是否是操作的。在一些实施例中,从这些操作参数得出的数据被提供给监督机器学习模型,并且该模型提供指示网络组件的操作状态的输出。一些实施例对设备的操作参数进行二值化并且计算二值化的参数指示设备的不活动性的最大持续时间。一些实施例计算二值化的参数的移动平均。在一些实施例中,最大持续时间和/或(多个)移动平均被提供给机器学习模型。

Description

用于基于对等统计的故障检测的系统和方法
技术领域
一个示例性方面涉及基于不可靠设备统计来标识网络设备中的故障,并且更特别地涉及用于观测相邻(对等)网络设备的行为并且基于设备的不可靠状态报告以及基于从其对等方收集的统计来确定该设备的健康状况的方法和/或装置。
背景技术
无线电芯片组通常被使用在诸如Wi-Fi接入点(AP)之类的无线接入点中。尽管芯片组极大地简化了无线AP的设计和构造,但是由于芯片组所暴露的计数器通常受到来自相邻AP的干扰而被损坏,所以芯片组的内部状态通常难以进行评估。如此,由内部芯片组计数器提供的信息会提供噪声数据,该噪声数据传达不可靠的并且有时是误导的信息。
因此,可能难以评估无线电发射器是否正在经历操作困难(例如,卡住或已经停止发射)。检测操作问题或故障对于迅速解决问题可能是重要的。例如,如果接入点的信标无线电(或任何其他无线电)停止发射,则该接入点对于相邻的移动无线终端(WT)是不可见的。结果,相邻的WT将不能与该AP相关联或以其他方式与该AP通信。我们越早检测到发生的问题,就可以越快地通知技术人员,和/或可以调用自动恢复机制来补救该情形。因此,即使当网络计数器的内置诊断正在提供噪声的并且有时是误导的信息时,也需要用于提供网络组件的可靠健康状态的改进方法。
发明内容
根据本公开的一些实施例,提供了一种确定网络组件是否可操作(operable)的方法,该方法包括:由一个或多个硬件处理器确定网络组件的第一操作参数值;由一个或多个硬件处理器确定网络组件的一个或多个相邻设备;由一个或多个硬件处理器确定一个或多个相邻设备的第二操作参数值;由一个或多个硬件处理器基于网络组件的第一操作参数值和一个或多个相邻设备的第二操作参数值来确定网络组件是否是操作的(operational);以及基于网络组件是否被确定为是操作的,条件性地控制网络组件。
根据本公开的另一些实施例,提供了一种确定网络组件是否可操作的系统,该系统包括:硬件处理电路;存储指令的一个或多个硬件存储器,该指令在被执行时将硬件处理电路配置为执行操作,操作包括:确定网络组件的第一操作参数值;确定网络组件的一个或多个相邻设备;确定一个或多个相邻设备的第二操作参数值;基于网络组件的第一操作参数值和一个或多个相邻设备的第二操作参数值来确定网络组件是否是操作的;以及基于网络组件是否被确定为是操作的,条件性地控制网络组件。
根据本公开的又一些实施例,提供了一种存储指令的非瞬态计算机可读存储介质,该指令在被执行时将硬件处理电路配置为确定网络组件是否可操作,操作包括:确定网络组件的第一操作参数值;确定网络组件的一个或多个相邻设备;确定一个或多个相邻设备的第二操作参数值;基于网络组件的第一操作参数值和一个或多个相邻设备的第二操作参数值来确定网络组件是否是操作的;以及基于网络组件是否被确定为是操作的,条件性地控制网络组件。
附图说明
通过结合附图参考以下描述,可以更好地理解本文的实施例,在附图中,相同的附图标记指示相同或功能相似的元件,在附图中:
图1a是图示了示例性网络环境的实施例的框图;
图1b是图示了网络环境的示例性Wi-Fi部分的实施例的框图;
图2是图示了示例性无线接入点的实施例的框图;
图3是图示了包括自动故障分析器的示例性网络管理系统的实施例的框图;
图4是图示了示例性网络节点服务器的实施例的框图;
图5是图示了诸如用户装备(UE)或无线终端(WT)的示例性设备的实施例的框图;
图6A是被用来确定对等邻居的数据结构的说明性示例;
图6B是示出了在一些所公开的实施例中的操作参数值的处理的图;
图7是图示了过程700的示例性实施例的流程图,通过过程700来建立和使用行为模型;
图8是用于确定网络组件是否是操作的过程的流程图;
图9是用于确定网络组件是否是操作的过程的流程图;
图10是用于确定网络组件是否是操作的过程的流程图;
图11是用于量化操作参数测量的过程1100的流程图;以及
图12示出了根据本公开的一些示例的示例机器学习模块。
具体实施方式
许多网络设备包括诊断能力。这些诊断能力通常维护有关网络设备的性能的统计。这些统计可以传达与例如由网络设备处理的网络业务量有关的统计(例如,接收到的消息或分组的计数、发射的消息或分组的计数、延迟或吞吐量)。在一些情况下,这些统计依赖于网络业务的基于硬件的分析。例如,网络设备的网络接口芯片可以维护一个或多个数据值以支持这些诊断统计的生成。但是,这些诊断能力有时是不可靠的。例如,一些网络接口芯片易受由其他无线设备生成的干扰的影响,这可能会导致其支持诊断能力的内部计数器的损坏。为了减少不确定性并且增加网络设备的诊断的可靠性,所公开的实施例并入了来自相邻(对等)设备的信息,以得出关于给定设备的健康状况的更准确的确定。
根据一个非限制性示例,AP的信标无线电以特定速率(例如,每秒10个信标)发射信标消息。当无线设备接收到该信标消息时,它可以评估信标的信号强度,并且基于信号的强度来确定是否与该AP相关联。接入点的一些实施例包括无线的无线电芯片组,该无线电芯片组维护表征该无线无线电的操作的一个或多个计数器。在这些实施例的一些实施例中,无线电芯片组中的内部计数器Rx对AP响应于发送信标信号而接收的消息的数目进行计数。然而,由Rx计数器指示的计数可能会受到来自其他相邻WT的消息的影响,并且因此是不可靠的。此外,芯片组中包括的Rx计数器提供了各种其他参数的累积计数。在仅基于无线无线电的内部管理的统计来评估AP的健康状况时,这可能会带来挑战。
由于由网络设备提供的内部诊断可能是不可靠的,并且因此传达很少的或者有时是误导的有关AP的健康状况的信息,因此实现一个或多个所公开的实施例的系统使用预定阈值来将内部诊断所提供的接收(Rx)计数映射为二进制值(例如0或1)。当Rx计数器指示的数目降到低于预定阈值时,系统将Rx计数映射为第一值(例如零(0)),并且当数目等于或大于阈值时,Rx计数被映射为第二值(例如一(1))。
依赖于由单个AP提供的诊断数据的实现可能会经历挑战。例如,基于由单个AP提供的数据对联网的系统进行控制确定的实现可以检测到大量的误报或无法检测到一些AP故障,由单个AP提供的数据可以是来自接入点的内部诊断(例如,上面讨论的Rx计数器)的原始未处理的接收计数或者是如上所述的是接收计数的二进制值。这导致次优的控制确定。
为了提高这些确定的准确性,至少一些所公开的实施例利用了来自相邻(对等)AP的信息。一些实施例对在进行关于特定网络设备的确定时所依赖的邻居或对等设备的数目设置了限制。例如,一些实施例可以将所考虑的对等设备的数目限制为五(5)、六(6)、七(7)、八(8)、九(9)或十(10)个设备。
一些所公开的实施例从无线终端接收信号强度测量,以确定哪些AP在彼此的预定义的接近度内。在一些实施例中,如果存在满足以下等式1所定义的条件的客户端WTi,则两个AP——AP1和AP2被称为对等方:
SS1+SS2>TSS 等式1
其中:
TSS-预定信号强度(例如RSSI)阈值
SS1-WTi从AP1接收的信号的强度
SS2-WTi从AP2接收的信号的强度
备选地,在一些实施例中,AP标识彼此的信标信号,并且如果从另一AP接收到的信号的信号强度大于预定阈值,则将AP定义为对等邻居。具体地,在以下情况下,APi和APj被视为邻居:
SSi->j>T2或SSj->i>T2 等式2
其中:
SSi->j-从APi发射并且由APj接收的信号的强度(例如RSSI)
T2-预定阈值
在其他实施例中,第一AP的对等方被标识为具有高于阈值的、在第一AP处经历的信号强度的那些候选对等AP。一些实施例通过信号强度对候选对等AP进行排名,并且然后选择N个排名最高的候选AP作为第一AP的对等AP。(例如,N可以是一到一百之间的任何数目)。
为了合并来自对等AP的信息,一些所公开的实施例收集来自相邻AP的操作统计。这些操作统计可以包括例如与对等AP相关联或与之通信的客户端的数目,或者对等AP的接收计数器。接收计数器可以对接收到的分组的数目、接收到的数据的量、或对对等AP上的接收活动性进行量化的其他度量进行计数。一些实施例将所收集的操作统计存储在存储器中。一些实施例将所收集的操作统计组织在表中,诸如下面的示例表1:
表1
Figure BDA0002391894880000051
Figure BDA0002391894880000061
上面的表1的APi标示了其健康状况正被分析的AP。AP1至AP5表示在一些实施例中由以上等式1或等式2定义的APi的对等方。关联的无线设备的数目指示与每个对等AP相关联的WT的时间相关的数目以及与其健康状况正被评估的AP相关联的WT的数目。Rx计数器指示在预定时间窗口(例如,一分钟)内由所述对等AP中的每个对等AP的接收计数器(Rx)跟踪的接收消息的数目。在一些实施例中,接收计数器以相应网络组件的硬件、软件或固件来实现。
将第一预定阈值(例如,十(10))与关联于每个AP的无线设备的数目相关,并且将第二预定阈值(例如,五十(50))用于(多个)接收计数器,表1中的值被映射到活动状态或不活动状态或者被映射为如下面的表2所示的两个二进制值之一:
表2
网络设备 量化的客户端数目 量化的接收计数
AP<sub>i</sub> 0 0
AP<sub>1</sub> 1 1
AP<sub>2</sub> 0 1
AP<sub>3</sub> 0 0
AP<sub>4</sub> 1 1
AP<sub>5</sub> 0 0
在一些实施例中,根据以下来执行表1中所表示的数据到表2中所表示的数据的转换:如果AP在特定时间段期间是活动的,则方法针对上述时间窗口将AP状态标记为零。然而,如果确定AP在特定时间段期间是不活动的,则方法针对上述时间窗口将AP的状态映射到二进制值1。(例如,在此示例中,活动=>0;不活动=>1)。
在至少一些实施例中,定期地收集表1中的信息,例如每60秒收集表1中的信息。然后,如上所述,将定期收集的信息映射到二进制值。该定期处理针对被监测的每个AP生成二值化的数据的时间序列。
时间序列内的数据被归组到各时间段中,各时间段可以包括在多于一个的定期收集间隔内收集的数据。例如,在一些实施例中,尽管每N秒收集一次数据,但是Z秒时间段的数据被归组以进行进一步处理(其中Z>N)。
下面在表3中提供了由其健康状况被评估的AP及其对等方所观测到的客户端的数目的时间序列的说明性示例。由于每列表示单个收集事件,因此多个列表示在某时间段内的多个收集事件。
表3
<u>网络设备</u> <u>时间段1</u> <u>时间段2</u> <u>时间段3</u>
AP<sub>i</sub> 1 1 1 1 1 1 0 1 1 0 0 1 1 1 0 1 1 1 1 1 1 0 1 0 1 1 1 0 1 0
AP<sub>1</sub> 0 0 0 1 1 0 1 0 0 1 1 0 1 1 0 0 0 1 0 1 1 1 0 0 0 0 1 0 1 0
AP<sub>2</sub> 1 0 1 1 0 0 1 0 0 1 1 0 0 0 1 1 1 1 1 1 1 0 1 0 0 1 0 1 1 0
AP<sub>3</sub> 1 0 0 1 0 0 0 1 1 1 0 0 1 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 1
AP<sub>4</sub> 0 1 1 1 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 1 0 0 1 1 0 0 0 0 1 0
AP<sub>5</sub> 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 1 0 0 1 0 0 1 1 0 1 0 0 1
类似地,下面的表4说明了被监测的网络组件(APi)及其对等方的Rx计数的示例映射时间序列。
表4
Figure BDA0002391894880000071
Figure BDA0002391894880000081
为了确定主体(subject)AP在给定时间窗口(时间段)内是否是活动的,系统分析每个时间段内的活动性指示的数目。例如,方法可以针对其健康状况正被评估的主体AP(例如,APi)使用第一准则(例如,阈值>0.2(例如,>20%)。一些实施例使用W(例如10)分钟的窗口大小来确定主体AP的活动性状态。如果指示时间窗口内的活动性的数据值的百分比大于第一阈值,则确定主体AP在该时间窗口期间是活动的。第二阈值(例如,>0.4{>40%})可以被用于主体AP的对等AP。具体地,如果在给定时间段内的活动性指示的百分比(例如,在此示例中为零)大于第二阈值,则对等AP被认为是活动的。
在以上表3示例中,在第一时间窗口期间,APi在十(10)个样本中的两(2)个样本期间是活动的,并且因此被确定为在该时间窗口期间是不活动的(0.2小于或等于上面讨论的第一阈值)。在第二时间窗口(在此示例中也是10分钟)期间,APi也是在10个样本中的2个样本中是活动的,并且因此它被假定为是不活动的。在十分钟的第三示例时间段中,APi在十个(10)样本中的四(4)个样本中是活动的,并且因此其被确定为是活动的。通过使用值一(1)表示不活动,并且使用值零(0)表示活动,以上三个确定可以以向量被表示为{1,1,0}或(不活动,不活动,活动)。
对于相邻AP,在一些实施例中使用第二阈值(例如0.4)。通过使用第二阈值,对于所图示的三个时间段,对等AP1的状态被映射为{活动,活动,活动}或被等同地映射为{0,0,0}。类似地,AP2被映射为{活动,不活动,活动}或被等同地映射到{0,1,0}。
然后,在连续时间段期间APi是不活动的最大持续时间被确定。例如,如果APi在五个连续的一分钟时段的持续时间内(总持续时间为五分钟)是不活动的,则确定APi在为五的持续时间内是不活动的。再次参考表3的示例,短活动性序列指示APi在为二的持续时间内是不活动的(在第一时间段和第二时间段中是不活动的)。该持续时间被存储以供之后使用。
接下来,系统使用活动状态和不活动状态的映射(例如,在10分钟窗口内)来计算APi活动状态的移动窗口平均(例如,在此示例中,活动状态被表示为零)。例如,假定APi的活动状态由序列{1,1,0,0,1,1,0,0,0}给出,那么使用大小为二(2)的移动窗口会使得移动窗口的平均为{1,0.5,0,0.5,1,0.5,0,0}。该移动窗口平均被存储以供进一步使用。对等AP状态值的平均也被确定。然后,对等AP状态的该平均被用来生成平均的对等方状态的移动平均。
平均对等方状态值由下面的等式2给出:
Figure BDA0002391894880000091
其中:
平均对等方状态[k]-平均对等方状态向量的第k个元素
对等方数目- 要被平均的对等AP活动性向量的数目
对等方p[k]- 对等APp的活动性状态向量的第k个元素。
作为示例,如果用于APi的两个对等AP例如APj和APk的状态的时间序列由如下给出:
APj状态={0,0,0,1,1,0,0,0,0,1,1,1}
APk状态={0,1,1,1,1,0,1,0,0,1,0,1}
其中APj和APk是APi的邻居。
通过上面的等式2,对等AP值的平均是:
APi对等方的状态值的平均={0,0.5,0.5,1,1,0,0.5,0,0,1,0.5,1}
通过使用长度为二(2)的移动窗口,上述序列的移动平均由如下给出:
APi对等方的状态值的移动平均=
{0.25,0.5,0.75,1,0.5,0.25,0.25,0,0.5,0.75,0.75}
对表4的数据执行类似的计算,以获取由对等方的Rx计数器判定的不活动状态的百分比的移动平均。
基于以上讨论,使用以下统计中的一个或多个的组合来得出APi是否可操作的指示:
a.从与APi相关联的设备的数目中得出的不活动性指示的最大持续时间。
b.从在给定的时间窗口内与APi相关联的设备的数目中得出的活动性指示的百分比
c.从在给定的时间窗口内APi的接收计数中得出的活动性指示的百分比
d.从一个或多个对等AP的(多个)接收计数器中得出的活动性指示的移动平均。
e.从与一个或多个对等AP相关联的设备的数目中得出的活动性指示的移动平均。
一些所公开的实施例利用机器学习模型来评估APi是正在运行/操作还是停机/不操作。用于确定APi是操作的一个或多个准则可以根据实施例而变化。在一些实施例中使用以下示例准则:
·持续时间>100 R1
·从APi的客户端的数目中得出的不活动状态的百分比>0.8 R2
·从APi的Rx计数中得出的不活动状态的百分比>0.8 R3
·基于(多个)Rx计数器的不活动状态指示的对等移动平均<0.3 R4
·从关联的客户端的数目中得出的不活动状态指示的对等移动平均<0.2 R5
通常,以上的R1-R3指示APi是不活动的,并且因此可能正经历操作故障。R4和R5检查APi的对等AP是否是活动的。一些实施例仅在发现APi是不活动的并且其邻居是活动的时才确定APi是有故障的。
上面阐明的五个规则(R1至R5)定义了五维“立方体”体积。可以在五维空间中定义更复杂的体积,而不是简单的立方体,并且基于组合的活动性向量是否在上述更复杂的体积内来确定APi是否正在经历操作故障。其中组合的活动性向量被定义为组合的活动性向量=[S1,S2,S3,S4,S5] 等式5
其中:
S1是一个时间段内的不活动性的最大持续时间,
S2是在该时间段内关联的客户端的数目指示不活动性的时间的百分比,
S3是在该时间段内接收计数器指示不活动性的时间的百分比,
S4是基于接收计数器的对等AP的不活动性指示的移动平均,以及
S5是基于关联的客户端的数目的对等AP的活动性指示的移动平均。
尽管上面的描述包括在评估AP的健康状况时对四个特定活动性测量的参考,但是一些实施例可以依赖于上面未讨论的一个或多个附加参数。
图1a图示了根据示例性实施例实现的示例性系统100a。示例性系统100a包括多个接入点(AP1 142、…、AP X 144、AP 1'150、…、AP X'152)、多个认证、授权和计费(AAA)服务器(仅示出一个AA服务器110)、多个动态主机配置协议(DHCP)服务器(仅示出一个DHCP服务器116),多个域名系统(DNS)服务器(仅示出一个DNS服务器122)、多个Web服务器(仅示出一个Web服务器128)和网络管理系统(NMS)136,例如,接入点管理系统,它们经由例如互联网和/或企业内联网的网络134而被耦合在一起。网络通信链路(143、145、151、153、161、163、171、173)将接入点(AP1 142、AP X 144、AP 1'150、AP X'152)分别耦合到网络134。网络通信链路111将AA服务器(仅示出AA服务器110)耦合到网络134。网络通信链路117将DHCP服务器(仅示出一个DHCP服务器116)耦合到网络134。网络通信链路123将DNS服务器(仅示出一个DNS服务器122)耦合到网络134。网络通信链路129将Web服务器(仅示出一个Web服务器128)耦合到网络134。示例性系统100还包括多个客户端或用户装备设备(UE 1 138、…、UEZ140、UE 1'146、…、UE Z'148)。UE(138、140、146和148)中的至少一些是可以在整个系统100中移动的无线设备。
在示例性系统100中,接入点组位于不同的(多个)客户场所处。客户场所1 102,例如购物中心,包括接入点(AP 1 142、…、AP X 144)。客户场所2 104,例如体育场,包括接入点(AP 1'150、…、AP X'152)。如图1中所示,UE(UE 1 138、…、UE Z 140)当前位于客户场所1 102处;UE(UE 1'146、…、UE Z'148)当前位于客户场所2 104处。
网络管理系统(NMS)136连续收集与上述部分或所有客户端或UE所经历的性能相关的SLE统计。每当经历SLE降级时,网络管理系统136并且尤其是自动故障分析器模块触发向系统中的注入动作,诸如重启设备或向IT技术人员发出警报。
图1b图示了根据示例性实施例实现的示例性系统100b。示例性系统100b包括多个接入点(AP1 161、AP2 162…、AP8 168)以及这些AP之间的无线链路。
链路表示到相邻AP的N个最强的RSSI信号。在图1b的示例中,数目N=5。基于RSSI,AP1的对等邻居是AP2、AP3、AP7和AP6。AP2的对等邻居是AP1、AP3、AP4、AP7和AP2。AP3的对等邻居是AP1、AP2、AP8、AP4和AP5。类似地,可以针对其他AP确定其他对等邻居。应当注意,尽管上述AP的对等方的数目受到预定参数N=5的限制。相反,由于来自其他AP的RSSI的强度低于RSSI阈值,例如-75dBm,因此AP8仅具有两个相邻的对等方AP3和AP4。
图2图示了根据示例性实施例的示例性接入点200(例如,图1a的接入点AP 1142,…,AP X 144、AP 1’150,…,AP X’152)。接入点200包括有线接口230、无线接口236、242、例如CPU的处理器206、存储器212、以及模块的组装208,例如硬件模块的组装、例如电路的组装,它们经由总线209耦合在一起,各种元件可以通过总线209互换数据和信息。有线接口230包括接收器232和发射器234。有线接口将接入点200耦合到图1的网络和/或互联网134。第一无线接口236可以支持Wi-Fi接口,例如IEEE 802.11接口,包括:耦合到接收天线239的接收器238,接入点可以经由接收器238接收来自例如无线终端的通信设备的无线信号;以及耦合到发射天线241的发射器240,接入点可以经由发射器240向例如无线终端的通信设备发射无线信号。第二无线接口242可以支持
Figure BDA0002391894880000131
接口,其包括:耦合到接收天线245的接收器244,接入点可以经由接收天线245接收来自例如无线终端的通信设备的无线信号;以及耦合到发射天线247的发射器246,接入点可以经由发射天线247向例如无线终端的通信设备发射无线信号。
存储器212包括例程214和数据/信息216。例程214包括模块的组装218,例如软件模块的组装,以及应用编程接口(API)220。数据/信息216包括配置信息222、消息事件流捕获224和在发现异常消息流的情况下要采取的补救动作226的集合。
图3图示了根据示例性实施例的示例性网络管理和故障检测系统300,例如无线系统监测和故障检测服务器。在一些实施例中,图3的网络监测和故障检测系统300是图1的网络管理系统(NMS)136。网络管理系统300包括通信接口330(例如,以太网接口)、处理器306、输出设备308(例如,显示器、打印机等)、输入设备310(例如键盘、小键盘、触摸屏、鼠标等)、存储器312和模块的组装340(例如,硬件模块的组装,例如,电路的组装),它们经由总线309耦合在一起,各种元件可以通过总线309互换数据和信息。通信接口330将网络监测和故障检测系统300耦合到网络和/或互联网。通信接口330包括:接收器332,网络监测系统可以经由接收器332接收数据和信息,例如,包括来自各种AP的RSSI、与每个AP相关联的WT的数目、来自AP的内部计数器的计数等;以及发射器334,网络监测系统300可以经由发射器334发送数据和信息,例如包括配置信息,并且确认来自网络的其他设备的信息的接收。
存储器312包括例程314和数据/信息317。例程314包括模块的组装318,例如,软件模块的组装。
存储器312包括例程314和数据/信息317。例程314包括模块的组装318,例如,软件模块的组装,以及应用编程接口(API)320。数据/信息317包括配置信息322、每个AP的对等邻居323、与每个AP相关联的WT的计数324、每个AP的内部计数器Rx的计数以及其他活动性指示器,例如,每个AP发送的字节数目319。
存储器模块312还包括活动性统计模块350。模块350还包括历史记录的活动性测量的多个活动性时间序列351,…,353。例如,活动性测量可以包括但不限于:与每个AP相关联的客户端的数目、来自每个AP的Rx计数器的计数、每个AP从关联的WT接收的字节数目等。配置模型322还包括被用来将时间序列(例如351a,…,353a)映射到活动性指示序列(例如351b,…,353b)的参数等。
例程314使用与每个AP及其对等方相关联的活动性时间序列和时间序列来确定AP不活动性是指示故障AP还是仅仅是在接近其健康状况正被评估的AP的附近的低网络活动性(例如无线活动性)的指示器。
图4图示了示例性节点服务器400,例如,AA服务器、DHCP服务器、DNS服务器、Web服务器等。在一些实施例中,图4的节点服务器400是图1的服务器110、116、122、128。节点服务器400包括通信接口402(例如以太网接口)、处理器406、输出设备408(例如显示器、打印机等)、输入设备410(例如键盘、小键盘、触摸屏、鼠标等)、存储器412、以及模块的组装416(例如硬件模块的组装,例如电路的组装),它们经由总线409耦合在一起,各种元件可以通过总线409互换数据和信息。通信接口402将网络监测系统400耦合到网络和/或互联网。通信接口402包括:接收器420,节点服务器可以经由接收器420接收数据和信息,例如包括与操作相关的信息,例如注册请求、AA服务、DHCP请求、简单通知服务(SNS)查找和网页请求;以及发射器422,节点服务器400可以经由发射器422发送数据和信息,例如包括配置信息、认证信息、网页数据等。
存储器412包括例程428和数据/信息430。例程428包括模块的组装432(例如,软件模块的组装)和数据信息430。
图5图示了根据示例性实施例的示例性客户端,诸如UE 500(例如,用户装备UE 1138,…,UE Z 140、UE 1’146,…,UE Z’148)。
UE 500包括有线接口502、无线接口504、处理器506(例如CPU)、存储器512、以及模块的组装516(例如硬件模块的组装,例如电路的组装),它们经由总线509耦合在一起,各种元件可以通过总线509互换数据和信息。有线接口502包括接收器520和发射器522。有线接口将UE 500耦合到图1的网络和/或互联网134。
示例性无线接口504可以包括蜂窝接口524、第一无线接口526(例如IEEE802.11WiFi接口)和第二无线接口528(例如
Figure BDA0002391894880000151
接口)。蜂窝接口524包括:耦合到接收器天线533的接收器532,接入点可以经由接收器532从例如AP 1 142,…,AP X 144、AP 1'150,…,AP X'152的接入点接收无线信号;以及耦合到发射天线535的发射器534,接入点可以通过发射器534向例如AP 1 142,…,AP X 144、AP 1'150,…,AP X'152的AP发射无线信号。第一无线接口526可以支持Wi-Fi接口,例如IEEE 802.11接口,包括:耦合到接收天线537的接收器536,UE可以经由接收器536从例如AP的通信设备接收无线信号;以及耦合到发射天线539的发射器538,UE可以经由发射器538向例如AP的通信设备发射无线信号。第二无线接口528可以支持
Figure BDA0002391894880000152
其包括:耦合到接收天线541的接收器540,UE可以经由接收器540从例如AP的通信设备接收无线信号;以及耦合到发射天线543的发射器542,UE可以经由发射器542向例如AP的通信设备发射无线信号。
存储器512包括例程528和数据/信息517。例程528包括模块的组装515,例如软件模块的组装。数据/信息517可以包括配置信息以及UE 500的正常操作所需的任何附加信息。
图6A是被用来确定对等邻居的数据结构的说明性示例。
数据605是存储AP的RSSI观测值的数据结构。字段606存储从其他AP接收信号的AP的标识符。字段607存储被存储在数据结构605中的RSSI测量的数目。字段608存储生成由接收AP(例如606)接收到的信号的AP的标识符。字段609存储从由608标识的AP接收到的信号的RSSI值。对于从其中接收到信号的每个AP,在数据结构605内重复字段608和609。
数据结构615提供每个AP的对等邻居的列表。数据616指示其对等方正被评估的AP。数据617提供与AP1相关联的对等方的数目。在一些情况下,该数目受到其RSSI大于预定阈值(例如-75dBm)的AP的数目的限制。在其他情况下,为了减少计算量的缘故,该数目被限制为预定阈值,例如5。在这种情况下,系统将对等AP确定为来自其的RSSI最强的AP。数据618提供具有最强RSSI的(例如,由617指示的)“计数2”个AP的列表。
图6B是示出在一些所公开的实施例中的操作参数值的处理的图。图6B示出了在被标识为时间T1-T24的一系列对应时间段652上的、网络设备的操作参数测量或值V1-V24的时间序列654。操作参数可以指示与网络设备相关联或以其他方式与网络设备通信的无线设备的数目,或者指示由网络设备接收和/或发射的分组或消息的计数。在一些实施例中,针对多种类型的操作参数值(例如,关联设备的计数和接收计数,和/或附加的操作网络参数)重复图6B中所图示的网络参数值的处理。
一些所公开的实施例确定网络设备的活动性指示。如下面更详细地讨论的,活动性指示的确定基于准则。在一些实施例中,如果值(例如,V1-V24中的任何一个)低于阈值,则活动性指示指示网络设备的第一状态(例如“活动的”),否则活动性指示被设置为指示网络设备的第二状态(例如“不活动的”)。这些活动性指示在图6B中经由包括指示I1-I24的活动性指示时间序列656而被图示。每个被编号的活动性指示均从对应的等同编号的操作参数测量中得出(例如,从V24中得出I24,等等)。然后,一些所公开的实施例量化多个活动性指示以生成单个量化的活动性指示。量化的活动性指示被示为时间序列658,包括QI1-QI4。每个量化的活动性指示表示在一个时间段期间网络设备的活动性,该时间段在图6B中被示为QT1-QT4。注意,每个量化时段QT1-QT4包括多个操作参数值。因此,至少在一些实施例中,图6B图示了操作参数值的采样频率超过了量化时间段。虽然图6B示出了从时间序列656到序列658的活动性指示的量化,但是一些实施例未将多个活动性指示量化为单个指示。在这些实施例中,操作参数值的表征基于时间序列656。
如上文所讨论的,一些实施例基于活动性指示656或量化的活动性指示658来表征设备的操作参数。例如,一些实施例生成活动性指示656或658的移动平均。在图6B中,由MA1-MA3图示了示例移动平均。MA1基于QI1和QI2。MA2基于QI2和QI3。MA3基于QI3和QI4。在一些实施例中,图6B中图示的移动平均被提供给机器学习模型。一些实施例确定活动性指示指示不活动性的最大连续持续时间。在一些实施例中,基于指示656来确定最大连续持续时间。在其他实施例中,基于指示658来确定最大连续持续时间。一些实施例将最大连续持续时间提供给机器学习模型。
图7是图示了过程700的示例性实施例的流程图,通过过程700建立并使用行为模型。在一些实施例中,下面关于图7讨论的一个或多个功能由硬件处理电路(例如406)执行。在一些实施例中,存储在存储器(例如412)中的指令(例如428)在被执行时将硬件处理电路(例如406)配置为执行下面讨论的一个或多个功能。
该过程开始于步骤705,并且前进至步骤710,在步骤710,系统标识其健康状况在讨论中的设备,例如AP。例如,系统尝试标识AP的发射器是否是操作的,确定网络内的活动性是否在相邻设备/AP之间被适当地分布,等等。该方法继续到步骤715,其中由其健康状况正被评估的设备收集测量;然后测量被发送到网络管理系统,诸如图1的服务器136,以进行存储和进一步评估。
该过程前进到步骤720,其中网络管理系统标识其健康状况正被评估的AP的对等设备,例如对等AP。对等设备是处于评估的AP通过大于预定RSSI的RSSI接收到它们的信号的设备。一旦对等设备被标识,系统就在步骤725中收集与这些对等设备的活动性相关的指示器的测量。
该过程前进到步骤730,其中将在步骤715中收集的活动性相关的测量与预定阈值进行比较,从而得到统计,该统计指示其健康状况正被评估的AP的估计的活动性级别。类似地,在步骤735中,将在步骤725中收集的活动性相关的测量与预定阈值进行比较,从而得到统计,该统计指示其健康状况正被评估的AP的对等方的估计的活动性级别。
该过程前进到步骤740,其中系统分析与其健康状况正被评估的AP的活动性相关的时间序列及其对等方的时间序列,从而得到这些设备的级别活动性的附加估计器。
该过程前进到步骤745,其中使用一组规则来处理其健康状况被估计的AP的活动性相关的统计以及该AP的对等方的活动性相关的统计。根据第一实施例,将不同活动性指示器中的每一个与关联的阈值进行比较,从而得到针对其健康状况正被评估的AP的活动性指示器及其对等方的活动性指示器(例如,参见规则1至规则5)。根据第二实施例,对规则进行集中检查以针对特定阈值。根据第三实施例,将其健康状况被测量的设备的活动性级别的估计级别与其对等方的活动性级别进行比较。如果特定设备的级别与其对等方的活动性级别非常不同,则系统用平衡算法(例如漫游算法)将此标记为问题,并且改变其健康状况正被评估的设备与其对等方之间的漫游准则。
该过程前进到步骤750,其中系统确定在步骤745中检查的条件是否被满足。如果该方法在步骤750中确定规则R1至R5已被满足,或者换言之,其健康状况被检查的AP在其对等方显示活动性时是不活动的,则系统在步骤760中认为该AP是故障的。否则,过程移动到步骤765,其中AP被认为是起作用的。类似地,根据第二实施例,步骤750确定其健康状况正被评估的AP的活动性统计和其对等方的活动性统计的组合向量是否在预定体积内。如果系统确定组合的活动性向量在预定义的体积内,则在步骤760中将该AP声明为是故障的。否则,在步骤765中将该AP声明为是操作的。
返回到步骤760,除了将AP标记为是故障的之外,该方法还前进到步骤770,其中故障检测服务器和/或网络管理服务器(例如,图1的136)调用校正动作,诸如重启故障的AP以尝试减轻该问题、通知技术人员等。
图8是用于确定网络组件是否是操作的过程的流程图。在一些实施例中,下面关于图8讨论的一个或多个操作由硬件处理电路(例如506)执行。例如,存储在存储器(例如512)中的指令(例如528)将硬件处理电路配置为执行以下关于图8和过程800讨论的一个或多个操作。在一些实施例中,过程800由网络管理系统136执行。在操作805中,针对主体设备确定活动性的第一指示。在一些实施例中,操作805包括获取主体设备的操作参数值。例如,可以经由操作设备与网络管理设备之间的网络连接来接收操作参数值。如上所讨论,操作参数可以包括以下中的一项或多项:在预定时间段期间由主体设备接收到的分组或消息的计数、或者在预定时间段期间与主体设备通信或与之相关联(例如,站点和接入点之间的关联)的无线设备的数目。
在各种实施例中表征操作参数值。在一些实施例中,将操作参数值二值化为在一个时间段期间主体设备是活动的(或操作的)还是不活动的(或不操作的)指示。二值化基于特定于操作参数的阈值(例如,接收计数或关联设备的数目)。由于随着时间定期地收集操作参数值,因此操作805生成活动性或不活动性的二值化指示的时间序列。在一些方面,时间序列被进一步量化以减少时间序列中包括的活动性指示的数目。例如,在一些实施例中,将过程1100应用于所生成的操作805的时间序列。
在一些实施例中,确定这些活动性指示的移动平均。在一些实施例中,还确定在收集时间段内的不活动性指示的最大连续时段或持续时间。
在操作810中,针对主体设备的一个或多个相邻设备确定活动性的第二指示。在一些实施例中,操作810包括获取每个相邻设备的操作参数值。例如,在一些实施例中,经由每个相邻设备与网络管理设备之间的网络连接来接收操作参数值。如上所讨论,在一些实施例中,操作参数值表示以下中的一项或多项:在预定时间段期间由(多个)邻居(对等)设备的每个接收到的分组或消息的计数,或者在预定时间段期间与相应的相邻设备通信或与之相关联(例如,在站点(例如,WT或UE)与接入点之间的关联)的无线设备的数目。
类似于第一操作参数值,在各种实施例中表征第二操作参数。在一些实施例中,第二操作参数被用来确定相应的相邻设备是活动的(或操作的)还是不活动的(或不操作的)指示。确定是基于特定于操作参数的准则(例如,接收计数或关联设备的数目)。在一些实施例中,由于随着时间定期地收集第二操作参数值。在这些实施例中,操作810生成每个相邻设备的活动性或不活动性指示的时间序列。在一些实施例中,这些生成的时间序列中的每一个被量化,以减少各自基于单个操作参数值的各个活动性确定的数目或对各个活动性确定进行概括。例如,在一些实施例中,操作810利用如下所述的过程1100来量化针对相邻设备的活动性指示的每个时间序列,从而减少表示在一个时间段内相邻设备的活动性指示的数目。
在一些实施例中,当存在针对对应的多个对等/相邻设备的活动性指示的多个时间序列时,在一些实施例中,对多个时间序列求平均或以其他方式聚合为共同表示主体设备的相邻设备的单个时间序列。在一些实施例中,这些聚合的二值化的时间序列的移动平均被确定。这得到移动平均的另一时间序列。
操作815确定主体设备是否是操作的。基于第一指示和第二指示进行该确定。在一些实施例中,该确定基于以上讨论的第一操作参数的一个或多个表征以及第二操作参数的一个或多个表征。在一些实施例中,将这些表征提供给机器学习模型,并且该确定基于机器学习模型的输出,如上所述。
在操作820中,基于操作815的确定来条件性地控制主体设备。在一些实施例中,如果主体设备是操作的,则没有控制输入被提供给主体设备。在一些实施例中,如果主体设备被确定是不操作的,则主体设备可以被重启、被断电或被重置。在一些实施例中,通过将(例如,与操作参数被确定时安装在主体设备上的先前版本不同的)不同版本的固件、bios或软件安装到主体设备来条件性地控制主体设备。在一些实施例中,如果主体设备被确定是不操作的,则生成一个或多个警报。可以经由本领域中已知的任何手段来生成警报,包括电子邮件、文本、寻呼机或其他消息传递技术。在一些实施例中,由操作820生成的警报用于通知人类IT技术人员,他可以提供手动干预以使设备返回到可操作状态。
图9是用于确定网络组件是否是操作的过程805的流程图。在一些实施例中,下面关于图9讨论的一个或多个操作由硬件处理电路(例如506)执行。例如,存储在存储器(例如512)中的指令(例如528)将硬件处理电路配置为执行以下关于图9讨论的一个或多个操作。下面关于单个操作参数讨论图9。然而,技术人员将理解,在一些实施例中,可以针对多种不同类型的操作参数重复过程805。例如,一些实施例针对接收到的分组或消息的至少一个计数器以及与主体设备(例如,如上所讨论的APi)相关联或与之通信的无线设备的数目的计数执行过程805。过程805可以针对所公开的实施例考虑的附加操作参数进一步重复。
在开始操作905之后,过程805移动到操作910。在操作910中,设备的操作参数值的第一时间序列被确定。例如,如上所讨论,网络设备可以包括诊断能力,其提供各种统计的收集,包括例如接收和/或发射的分组或消息的数目的计数,与网络设备通信或与之相关联的设备的数目、存储器使用率、CPU利用率或其他操作参数。在一些实施例中,定期地从网络设备多次收集操作参数,以便创建操作参数值的时间序列。
在操作920中,生成活动性指示的第二时间序列。基于第一时间序列以及基于准则来生成第二时间序列。例如,在一些实施例中,准则将第一时间序列中的每个值与阈值进行比较。基于比较,在一些实施例中,第一时间序列中的每个值被二值化为两个可能值中的一个。一个值指示设备的活动性,而第二个二进制值指示设备的活动性的缺乏。作为一个示例,在一些实施例中,较低数目的接收分组可以指示设备不是活动的。在一些实施例中,非常高数目的接收分组也可以指示不活动性或故障的设备。在操作920中生成的第二时间序列的值指示在收集第一时间序列中的对应操作参数值的时间段期间设备的不活动性或活动性。
操作930确定第二时间序列的值中的连续不活动性指示的最大持续时间。最大持续时间可以用指示的数目或连续不活动的逝去时间来表示。
操作935确定第二时间序列中指示活动性的活动性指示的百分比。备选实施例确定第二时间序列中指示不活动性的活动性指示的百分比。
操作940确定活动性指示的第二时间序列的移动平均。移动平均依赖于被用来计算移动平均的指示的窗口,其可以是例如二(2)到一百(100)个测量之间的任何数目的指示,或者任何数目。移动平均还依赖于顺序移动平均计算之间重叠的测量的数目。重叠测量(或非重叠测量)的数目也可以根据实施例而变化。例如,在一些实施例中,在顺序移动平均测量之间可以存在一个非重叠测量,但是可以预期其他数目。
在操作950中,关于设备是操作的还是不操作的进行确定。该确定基于持续时间、活动性指示的百分比(不活动性指示的百分比)或移动平均中的一项或多项。如上所讨论,在一些实施例中,将操作参数的这些表征中的一个或多个提供给机器学习模型,并且设备的操作状态的确定基于机器学习模型的输出。在操作950之后,过程805移动到结束状态960。
图10是用于确定网络组件是否是操作的过程810的流程图。在一些实施例中,下面关于图10讨论的一个或多个操作由硬件处理电路(例如506)执行。例如,存储在存储器(例如512)中的指令(例如528)将硬件处理电路配置为执行以下关于图10讨论的一个或多个操作。
在开始操作1005之后,过程810移动到操作1010。在操作1010中,针对主体设备的对应多个对等设备的操作参数值的第一多个时间序列被确定。例如,如上所讨论,经受可操作性确定的设备(例如,APi)可以在其他设备(对等或相邻设备)的接近度内。在各个方面,基于由(多个)相邻设备发出并在主体设备处接收到的信号的可见性来确定这种接近度(反之亦然)。在操作1010中,从那些对等设备收集操作参数。操作参数可以包括与每个对等设备相关联的无线设备数目和/或由相应对等设备中的每个所接收和/或发送的分组数目的(多个)计数器。其他操作参数也被预期,诸如分组误差的数目、网络抖动测量、延迟、吞吐量或其他统计。在至少一些实施例中,关于每个对等设备的该统计信息可以从内置在每个对等设备中的诊断能力中获取。在一些情况下,对等设备包括维护这样的统计信息的硬件。在其他实施例中,信息经由基于固件或基于软件的实现来维护。在一些实施例中,定期地从对等设备多次收集每个对等设备的操作参数,以便创建操作参数值的时间序列(例如,第一多个时间序列中的单个时间序列)。
在操作1020中,生成与上面相关于操作1010所讨论的每个对等设备或相邻设备相对应的第二多个时间序列。第二多个时间序列中的每个时间序列由指示相应相邻设备的活动性的值组成。第二多个中的每个时间序列基于第一多个中的对应时间序列。(例如,第一对等设备的操作参数值的第一时间序列被用来生成第二多个中的对应的第二时间序列)。在一些实施例中,通过将一个或多个准则应用于操作1010的对应的第一时间序列的值来确定活动性的指示。例如,操作1020可以将第一多个时间序列中的每个值与预定阈值进行比较,并且基于比较的结果,设置第二多个时间序列中的时间序列中的对应值。在一些实施例中,操作1020基于一个或多个准则对第一多个时间序列中的值进行二值化以生成第二多个时间序列。
在操作1030中,第二多个时间序列中的对应值被聚合以生成第三时间序列。在一些实施例中,聚合对对应值求平均。备选地,对应值的中值可以被用于聚合。
在操作1040中,活动性信息的第三时间序列的移动平均被确定。移动平均窗口大小和/或重叠大小(在窗口内)可以根据实施例而变化。一些实施例使用两个活动性指示的窗口大小。换言之,在这些实施例中,使用两个活动性指示来定义每个移动平均。一些实施例使用(窗口大小–1)的重叠大小。
操作1050基于移动平均来确定主体设备是否是操作的。如上所讨论,在一些实施例中,对等AP操作参数的一个或多个表征可以被用来进行确定。在一些实施例中,将这些表征提供给机器学习模型,并且使用机器学习模型的输出来进行操作确定。
图11是用于量化操作参数测量的过程1100的流程图。在一些实施例中,下面关于图11讨论的一个或多个操作由硬件处理电路(例如506)执行。例如,存储在存储器(例如512)中的指令(例如528)将硬件处理电路配置为执行以下关于图11讨论的一个或多个操作。在一些实施例中,图11的过程1100被用来将第一数目的操作参数测量减少为较小数目的活动性指示。
在开始操作1105之后,过程1100移动到操作1110,该操作1110获取设备在第一时间段内的多个活动性指示。例如,如以上关于操作920和1020所讨论的,一些实施例基于对应多个操作参数值来确定多个活动性确定。在至少一些实施例中,这些多个中的每个可以表示时间序列,因为每个操作参数测量和/或活动性确定表示离散时间段内的网络设备的状态,并且在至少一些实施例中按时间组织该多个。因此,在一些实施例中,操作1110从操作920或1020获取多个活动性指示。
在操作1120中,多个活动性指示包括多个部分。每个部分表示等量的逝去时间(例如十分钟)。因此,操作1110的多个活动性指示共同地表示一个时间段,该时间段是由每个部分所表示的逝去时间的聚合。每个部分都被量化为活动性的单个指示器。量化基于准则。在一些方面,该准则比较在该部分中指示特定活动性值(例如活动的或不活动的)的活动性指示的数目,并且基于该数目设置单个指示器。在一些实施例中,如果该数目满足准则(例如,大于量化阈值),则将单个指示器设置为第一值,否则将其设置为第二值。
在操作1130中,基于多个部分生成第二多个量化的活动性指示。第二多个包括针对包括在第一多个活动性指示中的每个部分的单个活动性指示器。在一些实施例中,第二多个量化的活动性指示由图8的过程800、图9的过程805和/或图10的过程810来使用。
图12示出了根据本公开的一些示例的示例机器学习模块1200。机器学习模块1200利用训练模块1210和预测模块1220。训练模块1210将历史信息1230输入到特征确定模块1250a中。历史信息包括从一个或多个网络设备中得出的信息。在各种实施例中,历史信息包括如上所讨论的一个或多个操作参数值。历史信息1230可以被标记。标签可以指示在测量或以其他方式记录与标签相关联的操作参数值或其表征期间,主体网络设备是否是操作的。
在一些实施例中,下面关于图12描述的机器学习模块1200作为以上关于图8讨论的过程800的一部分而被调用。在一些实施例中,预测模块1220作为过程800的一部分被执行,并且在过程800的执行之前执行训练模块1210。在一些实施例中,以下关于机器学习模块1200讨论的一个或多个功能由网络管理系统136执行。
特征确定模块1250a从该历史信息1230中确定一个或多个特征1260。一般而言,特征1260是一组输入的信息,并且是被确定为预测特定结果的信息。例如,在各种实施例中,特征可以包括历史信息中包括的操作参数值的一个或多个表征。这可以包括例如诸如活动性指示、量化的活动性指示、活动性指示的移动平均和/或不活动指示的最大连续持续时间。机器学习算法1270基于特征1260和关联的标签来产生模型1218。
在预测模块1220中,当前信息1290可以被输入到特征确定模块1250。例如,主体网络设备和/或主体网络设备的邻居或对等设备的操作参数值和/或其表征被包括在当前信息中。特征确定模块1250b可以从当前信息1290中确定与从历史信息1230中确定的特征确定模块1250a相同的特征组或不同的特征组(例如,操作参数值的表征)。在一些示例中,特征确定模块1250a和1250b是相同的模块。特征确定模块1250b产生特征向量1215,特征向量1215被输入到模型1218中以生成主体网络设备1295的操作状态的指示。训练模块1210可以以离线的方式进行操作以训练模型1218。但是,预测模块1220可以被设计为以在线的方式进行操作。应当注意,可以经由附加训练和/或用户反馈来定期地更新模型1218。
可以从许多不同的潜在的监督或无监督的机器学习算法中选择机器学习算法1270。监督学习算法的示例包括人工神经网络、贝叶斯网络、基于实例的学习、支持向量机、决策树(例如迭代二分法3、C4.5、分类和回归树(CART)、卡方自动交互检测器(CHAID等)、随机森林、线性分类器、二次分类器、k最近邻、线性回归、逻辑回归、隐马尔可夫模型、基于人工生命的模型、模拟退火和/或病毒学。无监督学习算法的示例包括期望最大化算法、向量量化和信息瓶颈方法。无监督模型可以不具有训练模块1210。在示例实施例中,使用回归模型,并且模型1280是与特征1260、1215的向量中的每个特征的学习重要性相对应的系数的向量。为了计算分数,在一些实施例中采用模型306的系数向量和特征向量1215的点积。
尽管已经关于特定的事件序列讨论了上述流程图,但是应当理解,可以在不实质影响(多个)实施例的操作的情况下发生对该序列的改变。另外,本文示出的示例性技术不限于具体示出的实施例,而是还可以与其他示例性实施例一起利用,并且每个所描述的特征被单独地和分别地要求保护。
可以在诸如IEEE 802.11收发器等的(多个)无线电信设备/系统上实现上述系统。可以与该技术一起使用的无线协议的示例包括IEEE 802.11a、IEEE 802.11b、IEEE802.11g、IEEE 802.11n、IEEE802.11ac、IEEE 802.11ad、IEEE 802.11af、IEEE 802.11ah、IEEE802.11ai、IEEE 802.11aj、IEEE 802.11aq、IEEE 802.11ax、Wi-Fi、LTE、4G、
Figure BDA0002391894880000271
无线HD、WiGig、WiGi、3GPP、无线LAN、WiMAX、DensiFi SIG、Unifi SIG、3GPP LAA(许可辅助接入)等等。
另外,可以实施系统、方法和协议以改进以下中的一项或多项:专用计算机、编程的微处理器或微控制器以及(多个)外围集成电路元件、ASIC或其他集成电路、数字信号处理器、诸如离散元件电路之类的硬连线电子或逻辑电路、诸如PLD、PLA、FPGA、PAL的可编程逻辑设备、调制解调器、发射器/接收器、任何可比较的装置等等。一般而言,能够实现状态机、进而能够实现本文所示方法的任何设备都可以从根据本文提供的公开内容的各种通信方法、协议和技术中受益。
本文所描述的处理器的示例可以包括但不限于以下中的至少一种:
Figure BDA0002391894880000272
800和801、具有4G LTE集成和64位计算的
Figure BDA0002391894880000273
610和615、具有64位架构的
Figure BDA0002391894880000274
A7处理器、
Figure BDA0002391894880000275
M7运动协处理器、
Figure BDA0002391894880000276
系列、
Figure BDA0002391894880000277
CoreTM系列处理器、
Figure BDA00023918948800002717
系列处理器、
Figure BDA0002391894880000279
AtomTM系列处理器、Intel
Figure BDA00023918948800002711
系列处理器、
Figure BDA00023918948800002710
i5-4670K和i7-4770K 22nm Haswell、
Figure BDA00023918948800002712
i5-3570K22nm Ivy桥接器、
Figure BDA00023918948800002713
FXTM系列处理器、
Figure BDA00023918948800002714
FX-4300、FX-6300和FX-8350 32nmVishera、
Figure BDA00023918948800002715
Kaveri处理器、Texas
Figure BDA00023918948800002716
Jacinto C6000TM汽车信息娱乐处理器、Texas
Figure BDA0002391894880000281
OMAPTM汽车级移动处理器、
Figure BDA0002391894880000282
CortexTM-M处理器、
Figure BDA0002391894880000283
Cortex-A和ARM926EJ-STM处理器、
Figure BDA0002391894880000284
AirForce BCM4704/BCM4703无线联网处理器、AR7100无线网络处理单元、其他行业等同处理器,并且可以使用任何已知的或将来开发的标准、指令集、库和/或架构来执行计算功能。
此外,所公开的方法可以容易地以使用对象或面向对象的软件开发环境的软件来实现,该对象或面向对象的软件开发环境提供了可以在各种计算机或工作站平台上使用的便携式源代码。备选地,所公开的系统可以使用标准逻辑电路或VLSI设计以硬件部分或全部地实现。使用软件还是硬件来实现根据实施例的系统取决于系统的速度和/或效率要求,特定功能、以及所利用的特定软件或硬件系统或微处理器或微计算机系统。利用计算机和电信领域的一般基本知识并且根据本文提供的功能描述,在适用技术领域的普通技术人员可以使用任何已知的或以后开发的系统或结构、设备和/或软件,以硬件和/或软件容易地实现本文所示出的通信系统、方法和协议。
此外,所公开的方法可以容易地以可以被存储在存储介质上的软件和/或固件来实现,以改进以下各项的性能:具有控制器和存储器协作的编程的通用计算机、专用计算机、微处理器等。在这些实例中,可以将系统和方法实现为嵌入在诸如applet、JAVA.RTM或CGI脚本之类的个人计算机上的程序,实现为驻留在服务器或计算机工作站上的资源、实现为嵌入专用通信系统或系统组件中的例程等等。该系统还可以通过将系统和/或方法物理地合并到软件和/或硬件系统(诸如通信收发器的硬件和软件系统)中来被实现。
因此,很显然,至少提供了用于增强和提高通信可靠性的系统和方法。尽管已经结合多个实施例描述了实施例,但是很明显,对于适用技术领域的普通技术人员而言,许多备选、修改和变型将是或显而易见的。因此,本公开旨在涵盖在本公开的精神和范围内的所有这样的备选、修改、等同和变型。
示例1是一种确定网络组件是否可操作的方法,包括:确定网络组件的第一操作参数值;确定网络组件的一个或多个相邻设备;确定一个或多个相邻设备的第二操作参数值;基于网络组件的第一操作参数值和一个或多个相邻设备的第二操作参数值来确定网络组件是否是操作的;基于网络组件是否被确定为是操作的,条件性地控制网络组件。
在示例2中,示例1的主题可选地包括:其中确定网络组件的一个或多个相邻设备包括:获取设备列表,信号已经由网络组件通过无线介质从设备接收;通过将从设备列表中的每个设备接收到的信号的强度与信号强度阈值比较,确定相邻设备。
在示例3中,示例1-2中任何一个或多个的主题可选地包括:其中网络组件的第一操作参数值指示接收到的消息的数目或与网络组件相关联的无线终端的数目,并且方法还包括确定最大连续持续时间,在最大连续持续时间中操作参数值指示网络组件是不活动的,其中网络组件是否是操作的确定基于最大连续持续时间。
在示例4中,示例3的主题可选地包括:向机器学习模型提供最大连续持续时间,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例5中,示例1-4中任何一个或多个的主题可选地包括:其中相邻设备的第二操作参数值指示在相应的相邻设备处接收到的消息的计数或与相应的相邻设备相关联的无线终端的数目。
在示例6中,示例5的主题可选地包括:其中确定网络组件是否是操作的包括以下中的一项或多项:基于第一操作参数值来生成网络设备的活动性指示;以及确定活动性指示的移动平均,其中网络组件是否是操作的确定基于移动平均。
在示例7中,示例6的主题可选地包括:将移动平均提供给机器学习模型,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例8中,示例6-7中任何一个或多个的主题可选地包括:其中网络组件是否是操作的确定包括:基于第一相邻设备的第二操作参数值,生成第一相邻设备的活动性的第一指示;基于第二相邻设备的第二操作参数值,生成第二相邻设备的活动性的第二指示;聚合活动性的对应的第一指示和第二指示;基于聚合来生成第三活动性指示;以及生成第三活动性指示的移动平均,其中网络组件是否是操作的确定基于移动平均。
在示例9中,示例8的主题可选地包括:将移动平均提供给机器学习模型,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例10中,示例5-9中任何一个或多个的主题可选地包括:其中确定网络组件是否是操作的包括:基于第一操作参数值来生成网络设备的活动性指示;以及确定指示活动性的活动性指示的百分比,其中网络组件是否是操作的确定基于二值化的值。
在示例11中,示例1-10中一个或多个的主题可选地包括:其中条件性地控制网络组件包括对网络组件断电或重置网络组件。
在示例12中,示例1-11中一个或多个的主题可选地包括:响应于确定网络组件是不操作的,生成警报。
示例13是一种确定网络组件是否可操作的系统,系统包括:硬件处理电路;存储指令的一个或多个硬件存储器,该指令在被执行时将硬件处理电路配置为执行操作,操作包括:确定网络组件的第一操作参数值;确定网络组件的一个或多个相邻设备;确定一个或多个相邻设备的第二操作参数值;基于网络组件的第一操作参数值和一个或多个相邻设备的第二操作参数值来确定网络组件是否是操作的;以及基于网络组件是否被确定是操作的,条件性地控制网络组件。
在示例14中,示例13的主题可选地包括:其中确定网络组件的一个或多个相邻设备包括:获取设备列表,信号已经由网络组件通过无线介质从设备接收;通过将从设备列表中的每个设备接收到的信号的强度与信号强度阈值比较,确定相邻设备。
在示例15中,示例13-14中任何一个或多个的主题可选地包括:其中网络组件的第一操作参数值指示接收到的消息的数目或与网络组件相关联的无线终端的数目,方法还包括确定最大连续持续时间,在最大连续持续时间中操作参数值指示网络组件是不活动的,其中网络组件是否是操作的确定基于最大连续持续时间。
在示例16中,示例15的主题可选地还包括以下操作:向机器学习模型提供最大连续持续时间,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例17中,示例13-16中任何一个或多个的主题可选地包括:其中相邻设备的第二操作参数值指示在相应的相邻设备处接收到的消息的计数或与相应的相邻设备相关联的无线终端的数目。
在示例18中,示例17的主题可选地包括:其中确定网络组件是否是操作的包括以下中的一项或多项:基于第一操作参数值来生成网络设备的活动性的指示;以及确定活动性指示的移动平均,其中网络组件是否是操作的确定基于移动平均。
在示例19中,示例18的主题可选地还包括以下操作:将移动平均提供给机器学习模型,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例20中,示例18-19中任何一个或多个的主题可选地包括:其中网络组件是否是操作的确定包括:基于第一相邻设备的第二操作参数值,生成第一相邻设备的活动性的第一指示;基于第二相邻设备的第二操作参数值,生成第二相邻设备的活动性的第二指示;聚合活动性的对应的第一指示和第二指示;基于聚合来生成第三活动性指示;以及生成第三活动性指示的移动平均,其中网络组件是否是操作的确定基于移动平均。
在示例21中,示例20的主题可选地还包括以下操作:将移动平均提供给机器学习模型,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例22中,示例17-21中任何一个或多个的主题可选地包括:其中确定网络组件是否是操作的包括:基于第一操作参数值来生成网络设备的活动性指示;确定指示活动性的活动性指示的百分比,其中网络组件是否是操作的确定基于二值化的值。
在示例23中,示例13-22中任何一个或多个的主题可选地包括:其中条件性地控制网络组件包括对网络组件断电或重置网络组件。
在示例24中,示例13-23中任何一个或多个的主题可选地还包括以下操作:响应于确定网络组件是不操作的,生成警报。
示例25是一种存储指令的非瞬态计算机可读存储介质,该指令在被执行时将硬件处理电路配置为确定网络组件是否可操作,操作包括:确定网络组件的第一操作参数值;确定网络组件的一个或多个相邻设备;确定一个或多个相邻设备的第二操作参数值;基于网络组件的第一操作参数值和一个或多个相邻设备的第二操作参数值来确定网络组件是否是操作的;以及基于网络组件是否被确定为是操作的,条件性地控制网络组件。
在示例26中,示例25的主题可选地包括:其中确定所述网络组件的一个或多个相邻设备包括:获取设备列表,信号已经由网络组件通过无线介质从设备接收;通过将从设备列表中的每个设备接收到的信号的强度与信号强度阈值比较,确定相邻设备。
在示例27中,示例25-26中任何一个或多个的主题可选地包括:其中网络组件的第一操作参数值指示接收到的消息的数目或与网络组件相关联的无线终端的数目,方法还包括确定最大连续持续时间,在最大连续持续时间中操作参数值指示网络组件是不活动的,其中网络组件是否是操作的确定基于最大连续持续时间。
在示例28中,示例27的主题可选地包括:向机器学习模型提供最大连续持续时间,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例29中,示例25-28中任何一个或多个的主题可选地包括:其中相邻设备的第二操作参数值指示在相应的相邻设备处接收到的消息的计数或与相应的相邻设备相关联的无线终端的数目。
在示例30中,示例29的主题可选地包括:其中确定网络组件是否是操作的包括以下中的一项或多项:基于第一操作参数值来生成网络设备的活动性的指示;以及确定活动性指示的移动平均,其中网络组件是否是操作的确定基于移动平均。
在示例31中,示例30的主题可选地包括:将移动平均提供给机器学习模型,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例32中,示例30-31中任何一个或多个的主题可选地包括:其中网络组件是否是操作的确定包括:基于第一相邻设备的第二操作参数值,生成第一相邻设备的活动性的第一指示;基于第二相邻设备的第二操作参数值,生成第二相邻设备的活动性的第二指示;聚合活动性的对应的第一指示和第二指示;基于聚合来生成第三活动性指示;以及生成第三活动性指示的移动平均,其中网络组件是否是操作的确定基于移动平均。
在示例33中,示例32的主题可选地包括:将移动平均提供给机器学习模型,其中网络组件是否是操作的确定基于机器学习模型的输出。
在示例34中,示例30-33中任何一个或多个的主题可选地包括:其中确定网络组件是否是操作的包括:基于第一操作参数值来生成网络设备的活动性指示;确定指示活动性的活动性指示的百分比,其中网络组件是否是操作的确定基于二值化的值。
在示例35中,示例25-34中任何一个或多个的主题可选地包括:其中条件性地控制网络组件包括对网络组件断电或重置网络组件。在示例36中,示例25-35中任何一个或多个的主题可选地还包括以下操作:响应于确定网络组件是不操作的,生成警报。

Claims (20)

1.一种确定网络组件是否可操作的方法,所述方法包括:
由一个或多个硬件处理器确定所述网络组件的第一操作参数值;
由所述一个或多个硬件处理器确定所述网络组件的一个或多个相邻设备;
由所述一个或多个硬件处理器确定所述一个或多个相邻设备的第二操作参数值;
由所述一个或多个硬件处理器基于所述网络组件的所述第一操作参数值和所述一个或多个相邻设备的所述第二操作参数值来确定所述网络组件是否是操作的;以及
基于所述网络组件是否被确定为是操作的,条件性地控制所述网络组件。
2.根据权利要求1所述的方法,其中确定所述网络组件的所述一个或多个相邻设备包括:
获取设备列表,信号已经由所述网络组件通过无线介质从所述设备接收;以及
通过将从所述设备列表中的每个设备接收到的信号的强度与信号强度阈值比较,确定所述相邻设备。
3.根据权利要求1所述的方法,其中所述网络组件的所述第一操作参数值指示接收到的消息的数目或与所述网络组件相关联的无线终端的数目,并且所述方法还包括:确定最大连续持续时间,在所述最大连续持续时间中所述操作参数值指示所述网络组件是不活动的,其中所述网络组件是否是操作的所述确定基于所述最大连续持续时间。
4.根据权利要求1所述的方法,其中所述相邻设备的所述第二操作参数值指示在相应的相邻设备处接收到的消息的计数或与所述相应的相邻设备相关联的无线终端的数目。
5.根据权利要求4所述的方法,其中确定所述网络组件是否是操作的包括以下中的一项或多项:
基于所述第一操作参数值来生成所述网络设备的活动性的指示;以及
确定所述活动性指示的移动平均,其中所述网络组件是否是操作的所述确定基于所述移动平均。
6.根据权利要求4所述的方法,其中确定所述网络组件是否是操作的包括:
基于所述第一操作参数值来生成所述网络设备的活动性指示;
确定指示活动性的所述活动性指示的百分比,其中所述网络组件是否是操作的所述确定基于二值化的值。
7.根据权利要求1所述的方法,其中条件性地控制所述网络组件包括对所述网络组件断电或重置所述网络组件。
8.一种确定网络组件是否可操作的系统,所述系统包括:
硬件处理电路;
存储指令的一个或多个硬件存储器,所述指令在被执行时将所述硬件处理电路配置为执行操作,所述操作包括:
确定所述网络组件的第一操作参数值;
确定所述网络组件的一个或多个相邻设备;
确定所述一个或多个相邻设备的第二操作参数值;
基于所述网络组件的所述第一操作参数值和所述一个或多个相邻设备的所述第二操作参数值来确定所述网络组件是否是操作的;以及
基于所述网络组件是否被确定为是操作的,条件性地控制所述网络组件。
9.根据权利要求8所述的系统,其中确定所述网络组件的所述一个或多个相邻设备包括:
获取设备列表,信号已经由所述网络组件通过无线介质从所述设备接收;以及
通过将从所述设备列表中的每个设备接收到的信号的强度与信号强度阈值比较,确定所述相邻设备。
10.根据权利要求8所述的系统,其中所述网络组件的所述第一操作参数值指示接收到的消息的数目或与所述网络组件相关联的无线终端的数目,并且所述方法还包括:确定最大连续持续时间,在所述最大连续持续时间中所述操作参数值指示所述网络组件是不活动的,其中所述网络组件是否是操作的所述确定基于所述最大连续持续时间。
11.根据权利要求10所述的系统,所述操作还包括:将所述最大连续持续时间提供给机器学习模型,其中所述网络组件是否是操作的所述确定基于所述机器学习模型的输出。
12.根据权利要求8所述的系统,其中所述相邻设备的所述第二操作参数值指示在相应的相邻设备处接收到的消息的计数或与所述相应的相邻设备相关联的无线终端的数目。
13.根据权利要求12所述的系统,其中确定所述网络组件是否是操作的包括以下中的一项或多项:
基于所述第一操作参数值来生成所述网络设备的活动性的指示;以及
确定所述活动性指示的第一移动平均,其中所述网络组件是否是操作的所述确定基于所述第一移动平均。
14.根据权利要求13所述的系统,所述操作还包括:将所述第一移动平均提供给机器学习模型,其中所述网络组件是否是操作的所述确定基于所述机器学习模型的输出。
15.根据权利要求13所述的系统,其中所述网络组件是否是操作的所述确定包括:
基于第一相邻设备的所述第二操作参数值,生成所述第一相邻设备的活动性的第一指示;
基于第二相邻设备的所述第二操作参数值,生成所述第二相邻设备的活动性的第二指示;
聚合活动性的对应的所述第一指示和所述第二指示;
基于所述聚合来生成第三活动性指示;以及
生成所述第三活动性指示的第二移动平均,其中所述网络组件是否是操作的所述确定基于所述第二移动平均。
16.根据权利要求15所述的系统,所述操作还包括:将所述第二移动平均提供给机器学习模型,其中所述网络组件是否是操作的所述确定基于所述机器学习模型的输出。
17.根据权利要求12所述的系统,其中确定所述网络组件是否是操作的包括:
基于所述第一操作参数值来生成所述网络设备的活动性指示;
确定指示活动性的所述活动性指示的百分比,其中所述网络组件是否是操作的所述确定基于二值化的值。
18.根据权利要求8所述的系统,其中条件性地控制所述网络组件包括对所述网络组件断电或重置所述网络组件。
19.根据权利要求8所述的系统,所述操作还包括:响应于确定所述网络组件是不操作的,生成警报。
20.一种存储指令的非瞬态计算机可读存储介质,所述指令在被执行时将硬件处理电路配置为确定网络组件是否可操作,所述操作包括:
确定所述网络组件的第一操作参数值;
确定所述网络组件的一个或多个相邻设备;
确定所述一个或多个相邻设备的第二操作参数值;
基于所述网络组件的所述第一操作参数值和所述一个或多个相邻设备的所述第二操作参数值来确定所述网络组件是否是操作的;以及
基于所述网络组件是否被确定为是操作的,条件性地控制所述网络组件。
CN202010117385.5A 2019-11-26 2020-02-25 用于基于对等统计的故障检测的系统和方法 Pending CN112867051A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/696,281 2019-11-26
US16/696,281 US20210160125A1 (en) 2019-11-26 2019-11-26 Systems and methods for fault detection based on peer statistics

Publications (1)

Publication Number Publication Date
CN112867051A true CN112867051A (zh) 2021-05-28

Family

ID=69740273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010117385.5A Pending CN112867051A (zh) 2019-11-26 2020-02-25 用于基于对等统计的故障检测的系统和方法

Country Status (3)

Country Link
US (1) US20210160125A1 (zh)
EP (1) EP3829210A1 (zh)
CN (1) CN112867051A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11062233B2 (en) 2018-12-21 2021-07-13 The Nielsen Company (Us), Llc Methods and apparatus to analyze performance of watermark encoding devices
US11128539B1 (en) * 2020-05-05 2021-09-21 Ciena Corporation Utilizing images to evaluate the status of a network system

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989766A (zh) * 2009-08-03 2011-03-23 南京南瑞继保电气有限公司 基于保护动作链的电力系统故障诊断的方法
US20120002537A1 (en) * 2010-06-30 2012-01-05 Cellco Partnership Base station failover using neighboring base stations as relays
CN103746846A (zh) * 2014-01-02 2014-04-23 华为技术有限公司 网络远程管理方法、网络管理系统和用户代理装置
US20150200738A1 (en) * 2014-01-15 2015-07-16 Cisco Technology, Inc. Intelligent wiring in a low power and lossy network
US20150237519A1 (en) * 2014-02-18 2015-08-20 Benu Networks, Inc. Cloud controller for self-optimized networks
CN104956373A (zh) * 2012-12-04 2015-09-30 惠普发展公司,有限责任合伙企业 确定异常网络行为的可疑根本原因
CN106254150A (zh) * 2016-09-18 2016-12-21 南方电网科学研究院有限责任公司 网络故障处理方法与系统
CN107403005A (zh) * 2017-07-24 2017-11-28 浙江极赢信息技术有限公司 一种网站监控方法及装置
US20180067779A1 (en) * 2016-09-06 2018-03-08 Smartiply, Inc. AP-Based Intelligent Fog Agent
CN108965934A (zh) * 2017-05-27 2018-12-07 华为技术有限公司 一种故障检测方法、监控设备及网络设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2230864B1 (en) * 2009-03-17 2020-01-08 Alcatel Lucent Fault detection among base stations
US9678801B2 (en) * 2012-08-09 2017-06-13 International Business Machines Corporation Service management modes of operation in distributed node service management
US10592379B2 (en) * 2014-11-18 2020-03-17 Comcast Cable Communications Management, Llc Methods and systems for status determination
US10420024B2 (en) * 2016-03-22 2019-09-17 British Telecommunications Public Limited Company Transmitter outage detection
US11539609B2 (en) * 2018-09-11 2022-12-27 Trilliant Networks, Inc. Method and apparatus for reporting power down events in a network node without a backup energy storage device
US11405776B2 (en) * 2018-10-31 2022-08-02 Hewlett Packard Enterprise Development Lp Troubleshooting and resolving access point failures on computer networks
US11125791B2 (en) * 2019-05-30 2021-09-21 Landis+Gyr Innovations, Inc. Managing outage detections and reporting

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989766A (zh) * 2009-08-03 2011-03-23 南京南瑞继保电气有限公司 基于保护动作链的电力系统故障诊断的方法
US20120002537A1 (en) * 2010-06-30 2012-01-05 Cellco Partnership Base station failover using neighboring base stations as relays
CN104956373A (zh) * 2012-12-04 2015-09-30 惠普发展公司,有限责任合伙企业 确定异常网络行为的可疑根本原因
CN103746846A (zh) * 2014-01-02 2014-04-23 华为技术有限公司 网络远程管理方法、网络管理系统和用户代理装置
US20150200738A1 (en) * 2014-01-15 2015-07-16 Cisco Technology, Inc. Intelligent wiring in a low power and lossy network
US20150237519A1 (en) * 2014-02-18 2015-08-20 Benu Networks, Inc. Cloud controller for self-optimized networks
US20180067779A1 (en) * 2016-09-06 2018-03-08 Smartiply, Inc. AP-Based Intelligent Fog Agent
CN106254150A (zh) * 2016-09-18 2016-12-21 南方电网科学研究院有限责任公司 网络故障处理方法与系统
CN108965934A (zh) * 2017-05-27 2018-12-07 华为技术有限公司 一种故障检测方法、监控设备及网络设备
CN107403005A (zh) * 2017-07-24 2017-11-28 浙江极赢信息技术有限公司 一种网站监控方法及装置

Also Published As

Publication number Publication date
US20210160125A1 (en) 2021-05-27
EP3829210A1 (en) 2021-06-02

Similar Documents

Publication Publication Date Title
US11985025B2 (en) Network system fault resolution via a machine learning model
US10924330B2 (en) Intelligent anomaly detection and root cause analysis in mobile networks
US9167463B2 (en) Communication node operable to estimate faults in an ad hoc network and method of performing the same
WO2017215647A1 (en) Root cause analysis in a communication network via probabilistic network structure
CN113424493A (zh) 故障检测方法
US20200235834A1 (en) Systems and methods for mobile network interference analysis
US10375590B2 (en) Method and system for performance estimation of a communication link
US7764959B2 (en) Analysis of arbitrary wireless network data using matched filters
US20190327130A1 (en) Methods, control node, network element and system for handling network events in a telecomunications network
US20110119523A1 (en) Adaptive remote decision making under quality of information requirements
US20220174511A1 (en) Method and system for filtering of abnormal network parameter values prior to being used in training of a prediction model in a communication network
US20230362075A1 (en) Virtual network assistant having proactive analytics and correlation engine using unsupervised ml model
US11330486B2 (en) Wireless terminal roaming
CN112867051A (zh) 用于基于对等统计的故障检测的系统和方法
US10397065B2 (en) Systems and methods for characterization of transient network conditions in wireless local area networks
US8971871B2 (en) Radio base station, control apparatus, and abnormality detection method
CN114253799A (zh) 一种故障处理系统、方法、服务器及可读存储介质
Silva et al. Machine learning-based spectrum decision algorithms for Wireless Sensor Networks
Elbadry et al. Aletheia: A lightweight tool for WiFi medium analysis on the edge
US20240187302A1 (en) Network anomaly detection and mitigation
Touloupou et al. Intra: Introducing adaptation in 5G monitoring frameworks
WO2023156827A1 (en) Anomaly detection
CN118250713A (zh) 波束网格优化
WO2024145494A1 (en) Systems, apparatuses, and methods for network analysis
WO2023224578A1 (en) Identifying mobile devices suitable for use in an artificial intelligence operation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination