CN107423151A - 一种无线接入点系统恢复的方法和装置 - Google Patents
一种无线接入点系统恢复的方法和装置 Download PDFInfo
- Publication number
- CN107423151A CN107423151A CN201710194255.XA CN201710194255A CN107423151A CN 107423151 A CN107423151 A CN 107423151A CN 201710194255 A CN201710194255 A CN 201710194255A CN 107423151 A CN107423151 A CN 107423151A
- Authority
- CN
- China
- Prior art keywords
- time
- access point
- wireless access
- idle task
- system time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/04—Arrangements for maintaining operational condition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供一种无线接入点系统恢复的方法和装置,包括:无线接入点记录空闲任务运行时的系统时间;无线接入点记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。本发明能够在无线接入点系统死锁情况下,有效地对无线接入点系统进行恢复。
Description
技术领域
本发明实施方式涉及通信技术领域,尤其涉及一种无线接入点系统恢复的方法和装置。
背景技术
接入点(AP,access point)是组建小型无线局域网时最常用的设备。AP相当于一个连接有线网和无线网的桥梁,其主要作用是将各个无线网络客户端连接到一起,然后将无线网络接入以太网。AP无线覆盖距离通常为几十米至上百米。由于AP带有的接入点客户端模式,使得AP之间可以进行无线链接,从而可以扩大无线网络的覆盖范围。
在实施本发明的过程中,发明人发现现有技术至少存在如下问题:
通常AP设备经过严格的测试和认证才进入市场,不同的厂家对自家AP的系统错误恢复都做了增强,尽可能从所有的错误中恢复过来,例如看门狗(watchdog),用来防止系统死锁;双系统备份,用来防止系统升级错误;守护进程,监管每个进程的异常状态。
但是,AP是一种系统稳定性要求极高的接入层设备,在火车站、机场、地铁或者体育场等人流量密集的热门场所,一个AP很可能同时接入上百个用户。由于大量用户接入AP,有可能导致系统繁忙而出现异常,例如内核卡死导致的无线接入点系统死锁,从而将导致用户无法正常上网。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
针对上述问题,本发明实施方式的目的在于提供一种无线接入点系统恢复的方法和装置,能够在内核卡死导致的无线接入点系统死锁情况下,有效地对无线接入点系统进行恢复。
为实现上述目的,本发明实施方式提供一种无线接入点系统恢复的方法,包括:无线接入点记录空闲任务运行时的系统时间;无线接入点记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。
进一步地,所述无线接入点记录最后一次空闲任务运行时的系统时间。
进一步地,所述无线接入点的中断定时器在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
进一步地,所述无线接入点的中断定时器预先设置容忍时间;所述中断定时器查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则所述中断定时器在中断时间内向看门狗进行喂狗操作;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作。
为实现上述目的,本发明实施方式还提供一种无线接入点系统恢复的装置,包括:空闲任务记录模块,用于记录空闲任务运行时的系统时间;中断定时器,用于记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作;看门狗,用于在超过预先设置的喂狗操作间隔时间时,触发无线接入点系统进行恢复。
由上可见,本发明实施方式提供的一种无线接入点系统恢复的方法和装置,通过无线接入点的中断定时器在中断时间内进行喂狗操作,并预先设置容忍时间,则在进行喂狗操作之前,判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间,如果小于,则说明优先级最低的空闲任务也得到了CPU执行,无线接入点系统正常运行,中断定时器在中断时间内向看门狗进行喂狗操作;如果大于等于,则说明优先级最低的空闲任务长时间得不到CPU的执行,无线接入点系统进入异常状态,中断定时器停止向看门狗进行喂狗操作,则看门狗发送系统重起信号触发无线接入点系统进行恢复。本发明创造性的将空闲任务和硬件中断定时器进行喂狗操作相结合,及时地将无线接入点系统从假死(CPU 100%)状态中恢复过来。
附图说明
为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图逐一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施方式提供的无线接入点系统恢复的方法的流程示意图;
图2为本发明另一个实施方式提供的无线接入点系统恢复的方法的流程示意图;
图3为本发明实施方式提供的无线接入点系统恢复的装置的示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
目前,例如针对应用层错误问题,无线接入点通常通过应用层进行喂狗操作,一旦应用出了问题,无线接入点进行系统恢复。但是,如果系统确实很忙,如果喂狗操作进程无法使用CPU资源,将导致系统误重启,此外喂狗操作进程本身就有异常的可能。
再例如针对硬件及代码跑飞等问题,通过中断定时器进行喂狗操作,一旦系统异常,比如中断向量表被修改,无线接入点进行系统恢复。但是,因为中断的优先级高,而监控进程优先级低,有可能导致监控进程无法监控到其他线程或者用户面进程出现无法恢复的问题,比如某个内核高优先级线程进入了死循环,或者内核本身进入循环,占用100%CPU,而用户面进程就根本没有CPU时间片。
又例如针对进程级别的错误,通过监控应用进程,无线接入点对异常的进程进行重启或者将因为错误自己退出的进程拉起进行系统恢复。但是,如果高优先级进程占用100%CPU时,低优先级的监控进程就失去了监控的能力。
至少针对上述的问题,本发明实施方式提供一种无线接入点系统恢复的方法。请参阅图1,所述方法可以包括以下步骤。
步骤S1:无线接入点记录空闲任务运行时的系统时间;
步骤S2:无线接入点记录当前的系统时间;
步骤S3:如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;
步骤S4:在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。
本发明实施方式还提供一种无线接入点系统恢复的方法。请参阅图2,所述方法可以包括以下步骤。
步骤S21:无线接入点记录空闲任务运行时的系统时间T1。
中央处理单元(CPU)依靠任务的优先级在多个任务之间转换,调度任务。每个任务执行时,独占CPU。任务中包括一个空闲(idle)任务,空闲任务永远设为最低优先级,它只是在不停地给一特定计数器加1,统计任务使用这个特定计数器以确定现行应用软件实际消耗的CPU时间,因此,该空闲任务在没有其它任务进入就绪态时才投入运行。
在本实施方式中,当idle任务运行时,无线接入点记录最后一次空闲任务运行时的系统时间T1。
步骤S22:无线接入点的中断定时器在中断时间内记录当前的系统时间T2。
在本实施方式中,预先设置中断定时器的中断时间,例如1秒钟。
无线接入点通过中断定时器在中断时间内进行喂狗操作。需要特别注意的是,中断定时器在中断时间内向看门狗进行喂狗操作之前,记录当前的系统时间T2。
步骤S23:无线接入点判断当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值是否小于预先设置的容忍时间,如果小于,进行步骤S24;如果大于等于,进行步骤S25。
在本实施方式中,无线接入点的中断定时器预先设置容忍时间,例如5分钟。
无线接入点的中断定时器查询空闲任务运行时的系统时间T1,比较当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值和容忍时间,来决定是否向看门狗进行喂狗操作。
步骤S24:无线接入点的中断定时器在中断时间内向看门狗进行喂狗操作。
看门狗(watchdog)本质上是一种定时器,当无线接入点开启了看门狗(watchdog)功能,那么无线接入点必须在规定的时间间隔内向看门狗发送一个信号,这个发送信号的行为称为喂狗(feed dog)操作。而当看门狗记时超时时,看门狗将发送系统重起信号(Reset Signal)触发系统重起。
在本实施方式中,如果当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值小于容忍时间,那么说明其它任务都进入就绪态,优先级最低的空闲任务也得到了CPU执行,则无线接入点的中断定时器在中断时间内向看门狗进行喂狗操作,因此,看门狗不会发送系统重起信号起,无线接入点系统正常运行。
步骤S25:无线接入点的中断定时器停止向看门狗进行喂狗操作。
在本实施方式中,如果当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值大于等于容忍时间,说明优先级最低的空闲任务长时间得不到CPU的执行,优先级较低的监控进程也很难获得CPU的执行,无线接入点系统长期处于高负载运行,进入异常状态,则无线接入点的中断定时器停止向看门狗进行喂狗操作。
步骤S26:看门狗在超过预先设置的间隔时间时,触发无线接入点系统进行恢复。
在本实施方式中,看门狗预先设置间隔时间,当超过间隔时间时,说明中断定时器已停止向看门狗进行喂狗操作,无线接入点系统处于异常状态,因此看门狗发送系统重起信号触发无线接入点系统进行恢复。
请参阅图3。本发明实施方式提供一种无线接入点系统恢复的装置,包括:
空闲任务记录模块,用于记录空闲任务运行时的系统时间;
中断定时器,用于记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作;
看门狗,用于在超过预先设置的喂狗操作间隔时间时,触发无线接入点系统进行恢复。
进一步地,
所述空闲任务记录模块,具体用于:记录最后一次空闲任务运行时的系统时间。
所述中断定时器,具体用于:在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
所述中断定时器,还用于:预先设置容忍时间;查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则在中断时间内向看门狗进行喂狗操作;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作。
上述的无线接入点系统恢复的装置涉及到的具体技术细节和无线接入点系统恢复的方法中的类似,故不再具体赘述。
由上可见,本发明实施方式提供的一种无线接入点系统恢复的方法和装置,通过无线接入点的中断定时器在中断时间内进行喂狗操作,并预先设置容忍时间,则在进行喂狗操作之前,判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间,如果小于,则说明优先级最低的空闲任务也得到了CPU执行,无线接入点系统正常运行,中断定时器在中断时间内向看门狗进行喂狗操作;如果大于等于,则说明优先级最低的空闲任务长时间得不到CPU的执行,无线接入点系统进入异常状态,中断定时器停止向看门狗进行喂狗操作,则看门狗发送系统重起信号触发无线接入点系统进行恢复。本发明创造性的将空闲任务和硬件中断定时器进行喂狗操作相结合,及时地将无线接入点系统从假死(CPU 100%)状态中恢复过来。
最后应说明的是:上面对本发明的各种实施方式的描述以描述的目的提供给本领域技术人员。其不旨在是穷举的、或者不旨在将本发明限制于单个公开的实施方式。如上所述,本发明的各种替代和变化对于上述技术所属领域技术人员而言将是显而易见的。因此,虽然已经具体讨论了一些另选的实施方式,但是其它实施方式将是显而易见的,或者本领域技术人员相对容易得出。本发明旨在包括在此已经讨论过的本发明的所有替代、修改、和变化,以及落在上述申请的精神和范围内的其它实施方式。
Claims (10)
1.一种无线接入点系统恢复的方法,其特征在于,包括:
无线接入点记录空闲任务运行时的系统时间;
无线接入点记录当前的系统时间;
如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;
在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。
2.根据权利要求1所述的无线接入点系统恢复的方法,其特征在于,所述无线接入点记录空闲任务运行时的系统时间,包括:
无线接入点记录最后一次空闲任务运行时的系统时间。
3.根据权利要求2所述的无线接入点系统恢复的方法,其特征在于,所述无线接入点的中断定时器在中断时间内进行喂狗操作;
所述无线接入点记录当前的系统时间,包括:
所述无线接入点的中断定时器在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
4.根据权利要求3所述的无线接入点系统恢复的方法,其特征在于,所述方法还包括:
无线接入点的中断定时器预先设置容忍时间;
所述中断定时器查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间。
5.根据权利要求4所述的无线接入点系统恢复的方法,其特征在于,所述方法还包括:
如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则所述中断定时器在中断时间内向看门狗进行喂狗操作。
6.一种无线接入点系统恢复的装置,其特征在于,包括:
空闲任务记录模块,用于记录空闲任务运行时的系统时间;
中断定时器,用于记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作;
看门狗,用于在超过预先设置的喂狗操作间隔时间时,触发无线接入点系统进行恢复。
7.根据权利要求6所述的无线接入点系统恢复的装置,其特征在于,所述空闲任务记录模块,具体用于:记录最后一次空闲任务运行时的系统时间。
8.根据权利要求7所述的无线接入点系统恢复的装置,其特征在于,所述中断定时器,具体用于:在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
9.根据权利要求8所述的无线接入点系统恢复的装置,其特征在于,所述中断定时器,还用于:
预先设置容忍时间;
查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间。
10.根据权利要求9所述的无线接入点系统恢复的装置,其特征在于,所述中断定时器,还用于:
如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则在中断时间内向看门狗进行喂狗操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710194255.XA CN107423151A (zh) | 2017-03-28 | 2017-03-28 | 一种无线接入点系统恢复的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710194255.XA CN107423151A (zh) | 2017-03-28 | 2017-03-28 | 一种无线接入点系统恢复的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107423151A true CN107423151A (zh) | 2017-12-01 |
Family
ID=60423166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710194255.XA Pending CN107423151A (zh) | 2017-03-28 | 2017-03-28 | 一种无线接入点系统恢复的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107423151A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1815449A (zh) * | 2005-02-01 | 2006-08-09 | 艾默生网络能源有限公司 | 看门狗控制方法 |
CN101937371A (zh) * | 2010-08-27 | 2011-01-05 | 北京星网锐捷网络技术有限公司 | 一种嵌入式系统中监控任务执行状态的方法及装置 |
CN102521098A (zh) * | 2011-11-23 | 2012-06-27 | 中兴通讯股份有限公司 | Cpu死机监控的处理方法和装置 |
CN104102572A (zh) * | 2013-04-01 | 2014-10-15 | 中兴通讯股份有限公司 | 一种系统故障检测及处理方法、装置 |
CN104636212A (zh) * | 2014-12-29 | 2015-05-20 | 漳州科能电器有限公司 | 一种嵌入式操作系统看门狗实现方法 |
US20150339178A1 (en) * | 2014-05-21 | 2015-11-26 | Freescale Semiconductor, Inc. | Processing system and method of operating a processing system |
US9436627B2 (en) * | 2011-08-25 | 2016-09-06 | International Business Machines Corporation | Detection of abnormal operation caused by interrupt processing |
-
2017
- 2017-03-28 CN CN201710194255.XA patent/CN107423151A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1815449A (zh) * | 2005-02-01 | 2006-08-09 | 艾默生网络能源有限公司 | 看门狗控制方法 |
CN101937371A (zh) * | 2010-08-27 | 2011-01-05 | 北京星网锐捷网络技术有限公司 | 一种嵌入式系统中监控任务执行状态的方法及装置 |
US9436627B2 (en) * | 2011-08-25 | 2016-09-06 | International Business Machines Corporation | Detection of abnormal operation caused by interrupt processing |
CN102521098A (zh) * | 2011-11-23 | 2012-06-27 | 中兴通讯股份有限公司 | Cpu死机监控的处理方法和装置 |
CN104102572A (zh) * | 2013-04-01 | 2014-10-15 | 中兴通讯股份有限公司 | 一种系统故障检测及处理方法、装置 |
US20150339178A1 (en) * | 2014-05-21 | 2015-11-26 | Freescale Semiconductor, Inc. | Processing system and method of operating a processing system |
CN104636212A (zh) * | 2014-12-29 | 2015-05-20 | 漳州科能电器有限公司 | 一种嵌入式操作系统看门狗实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101888029B1 (ko) | 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템 | |
EP2614436B1 (en) | Controlled automatic healing of data-center services | |
US9110867B2 (en) | Providing application based monitoring and recovery for a hypervisor of an HA cluster | |
US8743680B2 (en) | Hierarchical network failure handling in a clustered node environment | |
US8812501B2 (en) | Method or apparatus for selecting a cluster in a group of nodes | |
US8910172B2 (en) | Application resource switchover systems and methods | |
US7856639B2 (en) | Monitoring and controlling applications executing in a computing node | |
CN108038019A (zh) | 一种基板管理控制器的故障自动恢复方法及系统 | |
US20020188891A1 (en) | Apparatus and method for building metadata using a heartbeat of a clustered system | |
CN108429629A (zh) | 设备故障恢复方法和装置 | |
CN108768758A (zh) | 分布式存储系统在线升级方法、装置、设备及存储介质 | |
US9229839B2 (en) | Implementing rate controls to limit timeout-based faults | |
US7318171B2 (en) | Policy-based response to system errors occurring during OS runtime | |
CN110618864A (zh) | 一种中断任务恢复方法及装置 | |
US20220083413A1 (en) | Detecting and recovering from fatal storage errors | |
US10169172B2 (en) | Passive detection of live systems during controller failover in distributed environments | |
CN110502369B (zh) | 一种设备死机恢复的方法、装置和存储介质 | |
US7428655B2 (en) | Smart card for high-availability clustering | |
CN109257218B (zh) | 一种基于snmp协议网络系统孤岛自愈方法 | |
CN109828945A (zh) | 一种业务报文处理方法及系统 | |
CN107423151A (zh) | 一种无线接入点系统恢复的方法和装置 | |
CN103428022B (zh) | 一种备份和恢复网元上配置数据文件的方法及系统 | |
CN104038364A (zh) | 分布式流处理系统的容错方法、节点及系统 | |
CN109189444A (zh) | 一种服务器虚拟化系统的管理节点的升级控制方法及装置 | |
CN107315660A (zh) | 一种虚拟化系统的双机热备份方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171201 |