CN104935466B - 一种故障处理方法和装置 - Google Patents

一种故障处理方法和装置 Download PDF

Info

Publication number
CN104935466B
CN104935466B CN201510337765.9A CN201510337765A CN104935466B CN 104935466 B CN104935466 B CN 104935466B CN 201510337765 A CN201510337765 A CN 201510337765A CN 104935466 B CN104935466 B CN 104935466B
Authority
CN
China
Prior art keywords
failure
message
reports
response message
report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510337765.9A
Other languages
English (en)
Other versions
CN104935466A (zh
Inventor
赵锦江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN201510337765.9A priority Critical patent/CN104935466B/zh
Publication of CN104935466A publication Critical patent/CN104935466A/zh
Application granted granted Critical
Publication of CN104935466B publication Critical patent/CN104935466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Small-Scale Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种故障处理方法和装置,所述方法包括:第一AP在检测到自身出现故障时,生成上报当前故障事件的故障上报报文;广播故障上报报文,以使接收到故障上报报文的至少一个第二AP对接收到的故障上报报文进行封装后,发送给接入控制器AC,其中第二AP为第一AP的邻居AP;接收第二AP转发的故障响应报文,故障响应报文是AC针对故障上报报文的响应报文并通过第二AP转发的;第一AP在接收到故障响应报文之后,对当前故障事件进行故障恢复处理。本发明能够在AP出现故障时及时上报到AC,以便对AP故障进行实时的恢复处理。

Description

一种故障处理方法和装置
技术领域
本发明涉及网络通信技术领域,尤其涉及一种故障处理方法和装置。
背景技术
在集中控制型WLAN(Wireless Local Area Networks,无线局域网)由FIT AP(FITAccess Point,瘦访问接入点)设备以及AC(Access Controller,接入控制器)共同架构而成,目前得到越来越广泛的应用,特别是在较大范围WLAN网络部署情况下,如体育场馆、办公楼宇等需要多个AP(Access Point,访问接入点)才能覆盖全面的区域,集中控制型WLAN网络可以实现对多AP的统一管理,无线客户端统一认证以及无线客户端漫游等特性。
集中控制型WLAN网络中,AP和AC间主要通过CAPWAP(Control And Provisioningof Wireless Access Points Protocol Specification,无线访问接入点的控制和配置协议)通信,交互无线管理报文和数据报文。其中CAPWAP隧道使用保活报文交互机制进行保活,AP会定期发送保活请求报文给AC,AC收到后回应保活响应报文给AP,一旦保活报文交互出现问题,则认为是AP本身故障或者是AP和AC之间链路故障,AP应通过自动重启等方法以恢复链路。
但是,在AP上行链路故障的情况下,按照现有CAPWAP协议的规定,从出现故障到判断故障需要经历最少30秒钟时间。这段时间内,AP上关联的集中转发的无线客户端均无法进行数据通信。同时,根据现有CAPWAP协议规定,AC并不知道AP由于何种原因出现故障,只知道AP不可达,且AP只有在上行链路故障排除后才能够将上次的故障原因上报给AC,使得AP故障无法实时处理。
发明内容
有鉴于此,本发明提供一种故障处理方法和装置,在AP出现故障时及时上报到AC,以便对AP故障进行实时的恢复处理。
根据本发明实施例的第一方面,提供一种故障处理方法,所述方法包括:
第一AP在检测到自身出现故障时,生成上报当前故障事件的故障上报报文;
广播所述故障上报报文,以使接收到所述故障上报报文的至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给接入控制器AC,其中所述第二AP为所述第一AP的邻居AP;
接收所述第二AP转发的故障响应报文,所述故障响应报文是所述AC针对所述故障上报报文的响应报文并通过所述第二AP转发的;
所述第一AP在接收到所述故障响应报文之后,对所述当前故障事件进行故障恢复处理。
根据本发明实施例的第二方面,提供一种故障处理方法,所述方法包括:
接入控制器AC接收第二访问接入点AP转发的经过封装后的故障上报报文,所述故障上报报文是第一AP在检测到自身出现故障时,生成并广播到所述第二AP的,其中所述第二AP为所述第一AP的邻居AP;
判断所述第一AP和所述第二AP是否属于所述AC管理的AP;
当所述第一AP和所述第二AP属于所述AC管理的AP时,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP,通过所述第二AP将所述故障响应报文转发给所述第一AP,由所述第一AP在接收到所述故障响应报文后,对所述当前故障事件进行故障恢复处理。
根据本发明实施例的第三方面,提供一种故障处理装置,所述装置包括:
报文生成单元,用于第一AP在检测到自身出现故障时,生成上报当前故障事件的故障上报报文;
广播单元,用于广播所述故障上报报文,以使接收到所述故障上报报文的至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给接入控制器AC,其中所述第二AP为所述第一AP的邻居AP;
接收单元,用于接收所述第二AP转发的故障响应报文,所述故障响应报文是所述AC针对所述故障上报报文的响应报文并通过所述第二AP转发的;
故障处理单元,用于所述第一AP在接收到所述故障响应报文之后,对所述当前故障事件进行故障恢复处理。
根据本发明实施例的第四方面,提供一种故障处理装置,所述装置包括:
接收单元,用于接入控制器AC接收第二访问接入点AP转发的经过封装后的故障上报报文,所述故障上报报文是第一AP在检测到自身出现故障时,生成并广播到所述第二AP的,其中所述第二AP为所述第一AP的邻居AP;
第一判断单元,用于判断所述第一AP和所述第二AP是否属于所述AC管理的AP;
发送单元,用于当所述第一AP和所述第二AP属于所述AC管理的AP时,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP,通过所述第二AP将所述故障响应报文转发给所述第一AP,由所述第一AP在接收到所述故障响应报文后,对所述当前故障事件进行故障恢复处理。
本发明实施例中,第一AP检测到自身出现故障时,生成故障上报报文并广播出去,使得接收到所述故障上报报文的至少一个第二AP及时上报到接入控制器AC,其中第二AP为所述第一AP的邻居AP。AC会针对所述故障上报报文下发故障响应报文,同样通过第二AP转发给第一AP,以便第一AP对产生的故障进行实时恢复处理。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是应用本发明实施例实现故障处理的应用场景示意图;
图2是本发明故障处理方法的一个实施例流程图;
图3是本发明故障处理方法的另一个实施例流程图;
图4a-4c是本发明故障处理方法的又一个实施例流程图;
图5是本发明故障处理装置的一个实施例框图;
图6是本发明故障处理装置的另一个实施例框图;
图7是本发明故障处理装置的另一个实施例框图;
图8是本发明故障处理装置的另一个实施例框图;
图9是本发明故障处理装置的另一个实施例框图;
图10是本发明故障处理装置的另一个实施例框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
参见图1,为应用本发明实施例实现故障处理的应用场景示意图:
图1中,当第一AP出现故障时,生成故障上报报文,该故障上报报文通过至少一个邻居AP,第二AP-1或第二AP-2,及时上报到接入控制器AC。AC会针对该故障上报报文下发故障响应报文,同样通过第二AP-1或第二AP-2转发到第一AP,第一AP在接收到故障响应报文后,就可以对产生的故障进行实时的恢复处理。
另外,AC可以根据故障报文中携带的故障类型,在网管平台产生相应的告警,以便故障问题得以及时记录和解决。
参见图2,为本发明故障处理方法的一个实施例流程图,该实施例从第一AP进行描述,包括以下步骤:
步骤201:第一AP在检测到自身出现故障时,生成上报当前故障事件的故障上报报文。
本实施例中,第一AP可以检测到自身出现的故障,检测过程与现有方式相同,在此不再赘述。检测到自身出现故障时,根据检测到的故障生成故障上报报文。
可选地,在管理帧中增加一个类型(subtype)来表示AP的故障上报报文(BrokenReport)。
本实施例中,为了让AC及时得知出现故障的第一AP以及所述第一AP出现故障的原因,以便AC根据故障原因,在网管平台产生相应的告警,可选地,所述故障上报报文中携带标识所述当前故障事件的故障类型的标识位。
无线802.11协议中规定无线信息元素标识(Element ID)11-15位是保留参数位,本实施例中,可选地,复用其中至少一位作为标识位作为所述故障类型的标识位。
本实施例中,为了避免误报故障事件,可选地,当第一AP检测到自身出现故障且在第一时间段内未排除所述当前故障事件时,才会生成所述故障上报报文。
步骤202:广播所述故障上报报文,以使接收到所述故障上报报文的至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给AC,其中所述第二AP为所述第一AP的邻居AP。
第一AP生成故障上报报文后,可选地,通过常用工作信道,例如802.11代网络(generation net,GN)中的1、6、11信道,广播所述故障上报报文。
例如,第一AP通过第一信道广播所述故障上报报文之后,在第二时间段内保持在第一信道,来侦听是否收到第二AP转发的故障响应报文。如果未收到故障响应报文,可选地,判断重新发送所述故障上报报文的次数是否超过预设阈值,当重新发送所述故障上报报文的次数未超过预设阈值时,重新在第一信道发送所述故障上报报文,否则跳变到其他信道重新广播故障上报报文。
本实施例中,为了避免同一故障重复上报,可选地,故障上报报文中设置有标识所述当前故障事件的故障事件标识和所述第一AP的AP标识,其中,重发或跳变信道发送故障上报报文时,不更改所述故障事件标识的值。
关联到同一个AP下的多个终端构成一个BSS(Basic Service Set,基本服务集),不同的BSS之间、以及BSS与有线网络之间构成一个ESS(Extended Service Set,扩展服务集)。本实施例中,可选地,第二AP只接收处于同一ESS内的出现故障的第一AP发送的故障上报报文。
本实施例中,所述故障上报报文中还携带有当前管理所述第一AP的AC的MAC(Media Access Control,媒体访问控制)地址信息和所述第一AP的SSID(Service SetIdentifier,服务集标识)。可选地,通过无线信息元素标识的保留参数位中的一位来携带当前管理所述第一AP的AC的MAC地址。所述第二AP根据所述故障上报报文中的当前管理所述第一AP的AC的MAC地址信息和所述第一AP的SSID,来判断所述第一AP与自身是否处于同一ESS域内。
为了避免出现重复上报的故障报文,第二AP在接收到故障上报报文后,根据其中的故障事件标识和所述AP标识,判断是否是首次收到所述第一AP发送的故障上报报文。第二AP可以只在首次接收到该故障上报报文时,对故障上报报文进行封装转发。可选地,第二AP对故障上报报文封装CAPWAP报文头,然后将封装后的所述故障上报报文转发给AC。
所述AC接收到封装后的所述故障上报报文后,判断所述第一AP和转发封装后的所述故障上报报文的第二AP是否属于所述AC管理的AP。
由于AC会预先为其管理的所有AP分配BSSID(Basic Service Set Identifier,基本服务集标识),同时记录其管理的所有AP的MAC(Media Access Control,媒体访问控制)地址信息。因此,可选地,当所述AC接收到封装报文,即接收到经过CAPWAP封装后的故障上报报文后,确定发送所述封装报文的AP的BSSID以及所述封装报文的源MAC地址,即所述AC确定第二AP的BSSID和第二AP的MAC地址。所述AC根据第二AP的BSSID和第二AP的MAC地址,判断所述第二AP是否属于所述AC管理的AP。
所述AC还需要对所述封装报文进行解封装,得到所述故障上报报文。当第一AP生成故障上报报文时,在所述故障上报报文中携带了所述第一AP的BSSID。因此,可选地,所述AC可以根据所述故障上报报文中携带的BSSID以及所述故障上报报文的源MAC地址信息,即第一AP的BSSID和所述第一AP的MAC地址,判断出现故障的第一AP是否属于所述AC管理的AP。
当所述第一AP和所述第二AP属于所述AC管理时,所述AC才会下发针对所述故障上报报文的故障响应报文到所述第二AP。
考虑到AC可能收到多个第二AP转发的同一故障上报报文,可选地,所述AC只对首次接收到的故障上报报文下发故障响应报文。所述AC根据所述故障上报报文中携带的所述故障事件标识和所述AP标识,判断是否已经处理过所述第一AP的所述故障上报报文。当AC未处理过所述故障上报报文时,AC根据所述封装报文的源MAC地址下发针对所述故障上报报文的故障响应报文到发送所述封装报文的所述第二AP。当AC已经处理过所述故障上报报文时,丢弃该报文。
同时,当所述AC接收到多个所述第二AP发送的封装后的所述故障上报报文时,所述AC应记录下转发所述故障上报报文的所有第二AP的信息,第二AP和出现故障的第一AP处于相邻地域,后续可以通过第二AP来补充服务故障区域。例如AC更改自身记录的出现故障的第一AP的状态信息(由run转为idle),然后根据记录的第二AP列表重新计算和部署各个第二AP的信道和发射功率,用以覆盖所述第一AP当前覆盖的区域,弥补故障损失等。
AC可以根据故障上报报文中携带的故障类型的标识位,在网管平台产生相应的告警,以便故障问题得以及时记录和解决。
第二AP在收到AC下发的故障响应报文后,通过无线空口转发给第一AP。
步骤203:接收所述第二AP转发的故障响应报文,所述故障响应报文是所述AC针对所述故障上报报文下发到所述第二AP的。
步骤204:所述第一AP在接收到所述故障响应报文之后,对所述当前故障事件进行故障恢复处理。
第一AP收到AC下发的故障响应报文后,进行故障恢复处理,例如进行重启,或者及时更新CAPWAP隧道状态信息(由run转为idle),并可以进行关闭无线服务、踢无线客户端下线,以使得无线客户端及时关联到没有故障的AP上。
由上述实施例可见,当第一AP出现故障时,第一AP生成故障上报报文,该故障上报报文通过至少一个邻居第二AP,及时上报到AC。所述AC会针对该故障上报报文下发故障响应报文并通过所述第二AP转发到第一AP,第一AP在接收到故障响应报文后,就可以对产生的故障进行实时的恢复处理。
参见图3,为本发明故障处理方法的再一个实施例流程图,该实施例从AC进行描述,包括以下步骤:
步骤301:AC接收第二AP转发的经过封装后的故障上报报文,所述故障上报报文是第一AP在检测到自身出现故障时,生成并广播到所述第二AP的,其中所述第二AP为所述第一AP的邻居AP。
步骤302:判断所述第一AP和所述第二AP是否属于所述AC管理的AP。
步骤303:当所述第一AP和所述第二AP属于所述AC管理的AP时,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP,通过所述第二AP将所述故障响应报文转发给所述第一AP,由所述第一AP在接收到所述故障响应报文后,对所述当前故障事件进行故障恢复处理。
可选地,所述AC根据解封装后的所述故障上报报文中携带的故障事件标识和AP标识,判断是否已经处理过所述第一AP的所述故障上报报文。当AC未处理过所述故障上报报文时,AC下发针对所述故障上报报文的故障响应报文到发送所述封装后的故障上报报文的所述第二AP。
另外,AC可以根据故障报文中携带的标识当前故障事件的故障类型的标识位,在网管平台产生相应的告警。
如有多个第二AP上报故障信息,AC记录所有第二AP的信息。,第二AP和出现故障的第一AP处于相邻地域,后续可以通过第二AP来补充服务故障区域。
由上述实施例可见,AC接收到的故障上报报文可以由可用的第二AP转发,使得AC能及时得知故障AP,并采取相应措施。
参见图4a-4c,为本发明故障处理方法的又一个实施例流程图,该实施例分别从第一AP侧、第二AP侧与AC侧,详细描述了本发明实施例的故障处理过程:
<第一AP侧>
故障处理方法如图4a所示,包括:
步骤401a:检测自身是否故障,当出现故障时,执行步骤402a。
第一AP可以检测到自身出现的故障,检测过程与现有方式相同,在此不再赘述。
步骤402a:检测在第一时间段内当前故障事件是否被排除,当第一时间段内当前故障事件未被排除时,执行步骤403a,否则结束故障处理过程。
可选地,第一AP在检测到自身出现故障时,启动一定时器Time-report,当Time-report超时时,当前故障事件仍未被排除,则执行步骤403a。
步骤403a:生成故障上报报文。
本实施例中,可选地,在管理帧中增加一个类型(subtype)来表示AP的故障上报报文(Broken Report)。
为了让AC及时得知第一AP出现故障的原因,以便AC根据故障原因,在网管平台产生相应的告警,可选地,所述故障上报报文中携带标识所述当前故障事件的故障类型的标识位。
无线802.11协议中规定无线信息元素标识(Element ID)第11-15位是保留参数位,本实施例中,可选地,复用其中至少一位作为标识位,作为所述故障类型标识。表1为本实施例定义的标识位编码所对应的故障类型,原则上任何AP的故障类型均可以编码上报。
表1
标识位编码 故障类型
0 上行链路故障
1 其他故障类型1
2 其他故障类型2
所述故障上报报文中还携带有当前管理所述第一AP的AC的MAC地址信息和所述第一AP的SSID。可选地,通过所述无线信息元素标识的保留参数位中的一位携带当前管理所述第一AP的AC的MAC地址,以便后续第二AP根据所述故障上报报文中的当前管理所述第一AP的AC的MAC地址和所述第一AP的SSID,来判断所述第一AP与自身是否处于同一ESS域内。
步骤404a:广播所述故障上报报文。
可选地,通过常用工作信道广播所述故障上报报文,例如802.11代网络(generation net,GN)中的1、6、11信道。
步骤405a:判断第二时间段内是否接收到第二AP转发的故障响应报文。
第一AP通过第一信道广播所述故障上报报文之后,在第二时间段内保持在第一信道,来侦听是否收到第二AP转发的故障响应报文。
可选地,同样设置一定时器Timer-retransmit,当Timer-retransmit超时,仍未接收到第二AP转发的故障响应报文时,执行步骤406a,否则执行步骤408a。
步骤406a:判断重新发送所述故障上报报文的次数是否超过预设阈值。
当重新发送所述故障上报报文的次数未超过预设阈值时,执行步骤407a,否则跳变到其他信道返回执行步骤404a。如果遍历所有信道均未收到故障响应报文,则结束当前故障处理流程。
步骤407a:重新发送所述故障上报报文。
本实施例中,为了避免同一故障重复上报,可选地,故障上报报文中携带了标识所述当前故障事件的故障事件标识和所述第一AP的AP标识。重发和跳变信道发送故障上报报文时,不更改故障事件标识的值。在重新发送故障上报报文后,执行步骤405a。
步骤408a:接收第二AP转发的故障响应报文之后,对所述当前故障事件进行故障恢复处理。
第一AP收到AC下发的故障响应报文后,进行故障恢复处理,例如进行重启,或者及时更新CAPWAP隧道状态信息(由run转为idle),并可以进行关闭无线服务、踢无线客户端下线,以使得无线客户端及时关联到没有故障的AP上。
由上述实施例可见,当第一AP出现故障时,第一AP生成故障上报报文,该故障上报报文通过至少一个邻居第二AP,及时上报到AC。AC会针对该故障上报报文下发故障响应报文,同样通过转发所述故障上报报文的第二AP转发到第一AP,第一AP在接收到故障响应报文后,就可以对产生的故障进行实时的恢复处理。
<第二AP侧>
故障处理方法如图4b所示,包括:
步骤401b:接收邻居第一AP广播的故障上报报文,所述故障上报报文是所述第一AP在检测到自身出现故障时,生成的用于上报当前故障事件的报文。
步骤402b:判断所述第一AP与自身是否处于同一ESS区域内。
可选地,第二AP根据所述故障上报报文中的当前管理所述第一AP的AC的MAC地址和所述第一AP的SSID,,判断所述第一AP与自身是否处于同一ESS区域内。如果是则执行步骤403b,否则执行步骤408b。
步骤403b:判断是否已经接收过所述故障上报报文。
为了避免出现重复上报的故障报文,可选地,第二AP根据故障上报报文中的所述故障事件标识和所述AP标识,判断所述第二AP是否已经接收过所述第一AP广播的所述故障上报报文。如果未接收过所述故障上报报文,则执行步骤404b,否则执行步骤408b。
步骤404b:对所述故障上报报文进行封装。
可选地,第二AP对所述故障上报报文封装CAPWAP报文头。
步骤405b:将封装后的所述故障上报报文发送给AC。
步骤406b:接收所述AC针对所述故障上报报文下发的故障响应报文。
步骤407b:转发所述故障响应报文到所述第一AP。
步骤408b:丢弃该报文。
由上述实施例可见,第二AP接收到处于同一ESS内的出现故障的第一AP发送的故障上报报文,并在首次接收到该报文时,对其进行封装,将封装后的所述故障上报报文转发给AC。当AC针对故障上报报文下发故障响应报文到第二AP时,第二AP再转发到第一AP。通过可用的第二AP作为出现故障的第一AP的中继点,从而及时进行故障的上报和故障的实时恢复处理。
<AC侧>
故障处理方法如图4c所示,包括:
步骤401c:AC接收第二AP转发的经过封装后的故障上报报文,所述故障上报报文是第一AP在检测到自身出现故障时,生成并广播到所述第二AP的,其中所述第二AP为所述第一AP的邻居AP。
步骤402c:判断所述第一AP和所述第二AP是否属于所述AC管理的AP。
可选地,AC根据封装报文(即封装CAPWAP报文头的故障上报报文)的BSSID以及所述封装报文的源地址信息,判断第二AP是否属于所述AC管理的AP;根据解封装后的所述故障上报报文中的BSSID以及所述故障上报报文的源地址信息,可以判断出现故障的第一AP是否属于所述AC管理的AP。如果是,则执行步骤403c,否则执行步骤406c。
步骤403c:判断是否已经处理过所述故障上报报文。
可选地,AC根据所述故障上报报文中的所述故障事件标识和所述AP标识,判断是否已经处理过所述第一AP的所述故障上报报文。如果未处理过所述故障上报报文,则执行步骤404c,否则执行步骤406c。
步骤404c:根据所述故障上报报文,上报故障告警到网管平台。
AC可以根据故障报文中携带的故障类型的标识位,在网管平台产生相应的告警,以便故障问题得以及时记录和解决。
步骤405c:所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP。
步骤406c:丢弃该报文。
下发故障响应报文之后,AC应及时清除出现故障的第一AP的状态信息(由run转为idle),然后根据记录的第二AP列表重新计算和部署各个邻居AP的信道和发射功率,用以补充覆盖区域,弥补故障损失等。
另外,如有多个第二AP上报故障信息,AC应记录所有第二AP的信息,以供后续使用。因为第二AP和出现故障的第一AP处于相邻地域,可以用来补充服务故障区域。
由上述实施例可见,AC接收到的故障上报报文是由可用的第二AP转发的,使得AC能及时得知故障AP,并采取相应措施。
本发明实施例中,第一AP检测到自身出现故障时,生成故障上报报文,并通过至少一个邻居第二AP及时上报到接入控制器AC。AC会针对所述故障上报报文下发故障响应报文,同样通过第二AP转发给第一AP,以便第一AP对产生的故障进行实时恢复处理。
与前述故障处理方法实施例相对应,本发明还提供了故障处理装置的实施例。
参见图5,为本发明故障处理装置的一个实施例框图,用于第一AP,所述装置包括:报文生成单元510、广播单元520、接收单元530和故障处理单元540。
其中,报文生成单元510,用于检测到本第一AP在出现故障时,生成上报当前故障事件的故障上报报文;
广播单元520,用于广播所述故障上报报文,以使接收到所述故障上报报文的至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给接入控制器AC,其中所述第二AP为所述第一AP的邻居AP;
接收单元530,用于接收所述第二AP转发的故障响应报文,所述故障响应报文是所述AC针对所述故障上报报文的响应报文并通过所述第二AP转发的;
故障处理单元540,用于在接收到所述故障响应报文之后,对所述当前故障事件进行故障恢复处理。
在一个可选的实现方式中:
参见图6,为本发明故障处理装置的另一个实施例框图,该实施例在前述图5所示实施例的基础上,所述装置还包括:重传单元550,用于在第二时间段内未收到所述故障响应报文时,重新发送所述故障上报报文。
参见图7,为本发明故障处理装置的一个实施例框图,用于AC,所述装置包括:接收单元710、第一判断单元720和发送单元730。
其中,接收单元710,用于接收第二访问接入点AP转发的经过封装后的故障上报报文,所述故障上报报文是第一AP在检测到自身出现故障时,生成并广播到所述第二AP的,其中所述第二AP为所述第一AP的邻居AP;
第一判断单元720,用于判断所述第一AP和所述第二AP是否属于所述AC管理的AP;
发送单元730,用于当所述第一AP和所述第二AP属于所述AC管理的AP时,下发针对所述故障上报报文的故障响应报文到所述第二AP,通过所述第二AP将所述故障响应报文转发给所述第一AP,由所述第一AP在接收到所述故障响应报文后,对所述当前故障事件进行故障恢复处理。
在一个可选的实现方式中:
参见图8,为本发明故障处理装置的另一个实施例框图,该实施例在前述图7所示实施例的基础上,所述装置还包括:调整单元740,用于调整所述第二AP的发射功率和信道,以使所述第二AP覆盖所述第一AP当前覆盖的区域。
在另一个可选的实现方式中:
参见图9,为本发明故障处理装置的另一个实施例框图,该实施例在前述图7所示实施例的基础上,所述故障上报报文中至少携带标识所述当前故障事件的故障事件标识和所述第一AP的AP标识;
所述装置还包括:
第二判断单元750,用于根据所述故障事件标识和所述AP标识,判断是否已经处理过所述第一AP的所述故障上报报文;
所述发送单元730具体用于当所述AC未处理过所述第一AP的所述故障上报报文时,下发针对所述故障上报报文的故障响应报文到所述第二AP。
在另一个可选的实现方式中:
参见图10,为本发明故障处理装置的另一个实施例框图,该实施例在前述图8所示实施例的基础上,所述装置还包括:记录单元760,用于当所述AC接收到多个所述第二AP转发的所述故障上报报文时,记录所述多个第二AP;
所述调整单元740具体用于调整所述多个第二AP的发射功率和信道,以使所述多个第二AP覆盖所述第一AP当前覆盖的区域。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
由上述实施例可见,第一AP检测到自身出现故障时,生成故障上报报文,并通过至少一个邻居第二AP及时上报到AC。AC会针对所述故障上报报文下发故障响应报文,同样通过第二AP转发给第一AP,以便第一AP对产生的故障进行实时恢复处理。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种故障处理方法,其特征在于,所述方法包括:
第一AP在检测到自身出现故障时,生成上报当前故障事件的故障上报报文;
广播所述故障上报报文,以使接收到所述故障上报报文的至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给接入控制器AC,其中所述第二AP为所述第一AP的邻居AP;所述至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给接入控制器AC,包括:所述至少一个第二AP在确定到所述第一AP与所述第二AP处于同一ESS内、且该第二AP首次接收到该故障上报报文时,将该故障上报报文进行封装后,发送给所述AC;
接收所述第二AP转发的故障响应报文,所述故障响应报文是所述AC针对所述故障上报报文的响应报文并通过所述第二AP转发的;
所述第一AP在接收到所述故障响应报文之后,对所述当前故障事件进行故障恢复处理。
2.如权利要求1所述的故障处理方法,其特征在于,广播所述故障上报报文之后,所述方法还包括:
所述第一AP在第二时间段内未收到所述故障响应报文时,重新发送所述故障上报报文。
3.一种故障处理方法,其特征在于,所述方法包括:
接入控制器AC接收第二访问接入点AP转发的经过封装后的故障上报报文,所述故障上报报文是第一AP在检测到自身出现故障时,生成并广播到所述第二AP的,其中所述第二AP为所述第一AP的邻居AP;所述故障上报报文是所述第二AP在确定到所述第一AP与所述第二AP处于同一ESS内、且该第二AP首次接收到该故障上报报文时,将该故障上报报文进行封装后,发送给所述AC的;
判断所述第一AP和所述第二AP是否属于所述AC管理的AP;
当所述第一AP和所述第二AP属于所述AC管理的AP时,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP,通过所述第二AP将所述故障响应报文转发给所述第一AP,由所述第一AP在接收到所述故障响应报文后,对当前故障事件进行故障恢复处理。
4.如权利要求3所述的故障处理方法,其特征在于,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP之后,所述方法还包括:
所述AC调整所述第二AP的发射功率和信道,以使所述第二AP覆盖所述第一AP当前覆盖的区域。
5.如权利要求3所述的故障处理方法,其特征在于,所述故障上报报文中至少携带标识所述当前故障事件的故障事件标识和所述第一AP的AP标识;
接入控制器AC接收第二访问接入点AP转发的经过封装后的故障上报报文之后,所述方法还包括:
所述AC根据所述故障事件标识和所述AP标识,判断是否已经处理过所述第一AP的所述故障上报报文;
所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP具体为:
当所述AC未处理过所述第一AP的所述故障上报报文时,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP。
6.如权利要求4所述的故障处理方法,其特征在于,所述方法还包括:
当所述AC接收到多个第二AP转发的所述故障上报报文时,所述AC记录所述多个第二AP;
所述AC调整所述第二AP的发射功率和信道,以使所述第二AP覆盖所述第一AP当前覆盖的区域具体包括:
所述AC调整所述多个第二AP的发射功率和信道,以使所述多个第二AP覆盖所述第一AP当前覆盖的区域。
7.一种故障处理装置,其特征在于,所述装置包括:
报文生成单元,用于第一AP在检测到自身出现故障时,生成上报当前故障事件的故障上报报文;
广播单元,用于广播所述故障上报报文,以使接收到所述故障上报报文的至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给接入控制器AC,其中所述第二AP为所述第一AP的邻居AP;所述至少一个第二AP对接收到的所述故障上报报文进行封装后,发送给接入控制器AC,包括:所述至少一个第二AP在确定到所述第一AP与所述第二AP处于同一ESS内、且该第二AP首次接收到该故障上报报文时,将该故障上报报文进行封装后,发送给所述AC;
接收单元,用于接收所述第二AP转发的故障响应报文,所述故障响应报文是所述AC针对所述故障上报报文的响应报文并通过所述第二AP转发的;
故障处理单元,用于所述第一AP在接收到所述故障响应报文之后,对所述当前故障事件进行故障恢复处理。
8.如权利要求7所述的故障处理装置,其特征在于,所述装置还包括:
重传单元,用于所述第一AP在第二时间段内未收到所述故障响应报文时,重新发送所述故障上报报文。
9.一种故障处理装置,其特征在于,所述装置包括:
接收单元,用于接入控制器AC接收第二访问接入点AP转发的经过封装后的故障上报报文,所述故障上报报文是第一AP在检测到自身出现故障时,生成并广播到所述第二AP的,其中所述第二AP为所述第一AP的邻居AP;所述故障上报报文是所述第二AP在确定到所述第一AP与所述第二AP处于同一ESS内、且该第二AP首次接收到该故障上报报文时,将该故障上报报文进行封装后,发送给所述AC的;
第一判断单元,用于判断所述第一AP和所述第二AP是否属于所述AC管理的AP;
发送单元,用于当所述第一AP和所述第二AP属于所述AC管理的AP时,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP,通过所述第二AP将所述故障响应报文转发给所述第一AP,由所述第一AP在接收到所述故障响应报文后,对当前故障事件进行故障恢复处理。
10.如权利要求9所述的故障处理装置,其特征在于,所述装置还包括:
调整单元,用于所述AC调整所述第二AP的发射功率和信道,以使所述第二AP覆盖所述第一AP当前覆盖的区域。
11.如权利要求9所述的故障处理装置,其特征在于,所述故障上报报文中至少携带标识所述当前故障事件的故障事件标识和所述第一AP的AP标识;
所述装置还包括:
第二判断单元,用于所述AC根据所述故障事件标识和所述AP标识,判断是否已经处理过所述第一AP的所述故障上报报文;
所述发送单元具体用于当所述AC未处理过所述第一AP的所述故障上报报文时,所述AC下发针对所述故障上报报文的故障响应报文到所述第二AP。
12.如权利要求10所述的故障处理装置,其特征在于,所述装置还包括:
记录单元,用于当所述AC接收到多个所述第二AP转发的所述故障上报报文时,所述AC记录所述多个第二AP;
所述调整单元具体用于所述AC调整所述多个第二AP的发射功率和信道,以使所述多个第二AP覆盖所述第一AP当前覆盖的区域。
CN201510337765.9A 2015-06-17 2015-06-17 一种故障处理方法和装置 Active CN104935466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510337765.9A CN104935466B (zh) 2015-06-17 2015-06-17 一种故障处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510337765.9A CN104935466B (zh) 2015-06-17 2015-06-17 一种故障处理方法和装置

Publications (2)

Publication Number Publication Date
CN104935466A CN104935466A (zh) 2015-09-23
CN104935466B true CN104935466B (zh) 2019-05-07

Family

ID=54122442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510337765.9A Active CN104935466B (zh) 2015-06-17 2015-06-17 一种故障处理方法和装置

Country Status (1)

Country Link
CN (1) CN104935466B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105553735B (zh) * 2015-12-24 2018-10-12 迈普通信技术股份有限公司 一种堆叠系统故障处理方法、设备及堆叠系统
CN106339297B (zh) * 2016-09-14 2020-10-02 郑州云海信息技术有限公司 一种存储系统故障实时告警的方法及系统
EP3422637A1 (en) * 2017-06-28 2019-01-02 Thomson Licensing Method of communication failure reporting and corresponding apparatus
CN108235351A (zh) * 2017-12-27 2018-06-29 杭州迪普科技股份有限公司 一种使无线控制器获得无线接入点故障信息的方法及装置
CN109413680B (zh) * 2018-09-21 2020-01-10 北京邮电大学 一种超密集网络中基于认知和接入点协作的自治愈方法
CN110971428B (zh) * 2018-09-28 2021-08-13 上海华为技术有限公司 网络设备脱管上报方法、设备和系统
US10862742B2 (en) * 2019-03-08 2020-12-08 Juniper Networks, Inc. Method for conveying AP error codes over BLE advertisements
CN111130934A (zh) * 2019-12-20 2020-05-08 国铁吉讯科技有限公司 通信系统的监测方法、装置及系统
US20230370501A1 (en) * 2020-09-14 2023-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Methods, Communication Devices and System Relating to Performing Lawful Interception
CN112134753A (zh) * 2020-09-14 2020-12-25 锐捷网络股份有限公司 一种故障处理方法、装置、系统、电子设备以及存储介质
CN114448771A (zh) * 2021-12-29 2022-05-06 华为技术有限公司 故障检测的方法及其装置
CN116996924B (zh) * 2023-09-22 2023-12-05 新华三技术有限公司 一种故障处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101600216A (zh) * 2009-06-26 2009-12-09 北京邮电大学 一种无线接入网络的分布式自愈方法和系统
CN102958082A (zh) * 2012-12-07 2013-03-06 广州杰赛科技股份有限公司 网络优化分析方法及系统
CN103517389A (zh) * 2013-10-24 2014-01-15 北京交通大学 一种wlan设备自适应节能方法
CN103874114A (zh) * 2014-03-19 2014-06-18 杭州华三通信技术有限公司 一种ap故障处理方法、ap设备以及ac设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070064673A1 (en) * 2005-03-10 2007-03-22 Nehru Bhandaru Flexible, scalable, wireless data forwarding and mobility for secure wireless networks
CN101729307A (zh) * 2008-10-25 2010-06-09 华为技术有限公司 一种故障检测方法、通信设备及网络系统
CN102333335B (zh) * 2011-10-20 2014-01-22 华为技术有限公司 一种无线局域网wlan中业务恢复的方法、设备和系统
CN103298012B (zh) * 2013-06-09 2016-05-04 杭州华三通信技术有限公司 一种ap故障检测方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101600216A (zh) * 2009-06-26 2009-12-09 北京邮电大学 一种无线接入网络的分布式自愈方法和系统
CN102958082A (zh) * 2012-12-07 2013-03-06 广州杰赛科技股份有限公司 网络优化分析方法及系统
CN103517389A (zh) * 2013-10-24 2014-01-15 北京交通大学 一种wlan设备自适应节能方法
CN103874114A (zh) * 2014-03-19 2014-06-18 杭州华三通信技术有限公司 一种ap故障处理方法、ap设备以及ac设备

Also Published As

Publication number Publication date
CN104935466A (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
CN104935466B (zh) 一种故障处理方法和装置
US11323341B2 (en) Methods and apparatus for capturing and/or using packets to facilitate fault detection
CA3051661C (en) Methods and systems of an all purpose broadband network
WO2021093692A1 (zh) 网络质量检测方法、装置、服务器和计算机可读介质
CN103179599B (zh) Wlan性能的监控方法、设备及系统
CN107197029B (zh) 一种基于边缘转发节点的终端设备离线检测方法及系统
EP2129049A1 (en) A protecting method and device for ethernet tree service
CN109561033B (zh) Overlay网络中组播复制的方法及装置
CN107342809B (zh) 一种业务性能监测与故障定位方法及装置
CN103686854B (zh) 控制ap的方法和装置
CN104012136B (zh) 基站、通信系统和用于基站的控制方法
EP2680634B1 (en) Method, device and system for signalling tracing
CN104469827B (zh) 一种无线链路失败的处理方法及装置
CN103053175A (zh) Iptv故障定位方法、装置和系统
CN103581025B (zh) 路由信息处理方法、设备及系统
Aydeger et al. SDN-enabled recovery for Smart Grid teleprotection applications in post-disaster scenarios
CN103004141A (zh) 网络环路检测方法、设备及系统
CN105940687A (zh) 在无线通信系统中由终端执行的d2d操作方法及使用该方法的终端
Kwon et al. Traffic data classification using machine learning algorithms in SDN networks
CN103200107B (zh) 一种报文的传输方法和设备
EP3048761A1 (en) Control method and device for self-loopback of network data
CN105592490B (zh) 一种路由切换方法及设备
CN106230658B (zh) 一种监控网络设备的方法和装置
CN103686675B (zh) 一种邻区配置方法及装置
WO2015154512A1 (zh) 一种组播链路的检测方法、网络设备及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant after: Xinhua three Technology Co., Ltd.

Address before: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant before: Huasan Communication Technology Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant