CN107423151A - 一种无线接入点系统恢复的方法和装置 - Google Patents

一种无线接入点系统恢复的方法和装置 Download PDF

Info

Publication number
CN107423151A
CN107423151A CN201710194255.XA CN201710194255A CN107423151A CN 107423151 A CN107423151 A CN 107423151A CN 201710194255 A CN201710194255 A CN 201710194255A CN 107423151 A CN107423151 A CN 107423151A
Authority
CN
China
Prior art keywords
time
access point
wireless access
idle task
system time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710194255.XA
Other languages
English (en)
Inventor
李铭梁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Feixun Data Communication Technology Co Ltd
Original Assignee
Shanghai Feixun Data Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Feixun Data Communication Technology Co Ltd filed Critical Shanghai Feixun Data Communication Technology Co Ltd
Priority to CN201710194255.XA priority Critical patent/CN107423151A/zh
Publication of CN107423151A publication Critical patent/CN107423151A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种无线接入点系统恢复的方法和装置,包括:无线接入点记录空闲任务运行时的系统时间;无线接入点记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。本发明能够在无线接入点系统死锁情况下,有效地对无线接入点系统进行恢复。

Description

一种无线接入点系统恢复的方法和装置
技术领域
本发明实施方式涉及通信技术领域,尤其涉及一种无线接入点系统恢复的方法和装置。
背景技术
接入点(AP,access point)是组建小型无线局域网时最常用的设备。AP相当于一个连接有线网和无线网的桥梁,其主要作用是将各个无线网络客户端连接到一起,然后将无线网络接入以太网。AP无线覆盖距离通常为几十米至上百米。由于AP带有的接入点客户端模式,使得AP之间可以进行无线链接,从而可以扩大无线网络的覆盖范围。
在实施本发明的过程中,发明人发现现有技术至少存在如下问题:
通常AP设备经过严格的测试和认证才进入市场,不同的厂家对自家AP的系统错误恢复都做了增强,尽可能从所有的错误中恢复过来,例如看门狗(watchdog),用来防止系统死锁;双系统备份,用来防止系统升级错误;守护进程,监管每个进程的异常状态。
但是,AP是一种系统稳定性要求极高的接入层设备,在火车站、机场、地铁或者体育场等人流量密集的热门场所,一个AP很可能同时接入上百个用户。由于大量用户接入AP,有可能导致系统繁忙而出现异常,例如内核卡死导致的无线接入点系统死锁,从而将导致用户无法正常上网。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
针对上述问题,本发明实施方式的目的在于提供一种无线接入点系统恢复的方法和装置,能够在内核卡死导致的无线接入点系统死锁情况下,有效地对无线接入点系统进行恢复。
为实现上述目的,本发明实施方式提供一种无线接入点系统恢复的方法,包括:无线接入点记录空闲任务运行时的系统时间;无线接入点记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。
进一步地,所述无线接入点记录最后一次空闲任务运行时的系统时间。
进一步地,所述无线接入点的中断定时器在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
进一步地,所述无线接入点的中断定时器预先设置容忍时间;所述中断定时器查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则所述中断定时器在中断时间内向看门狗进行喂狗操作;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作。
为实现上述目的,本发明实施方式还提供一种无线接入点系统恢复的装置,包括:空闲任务记录模块,用于记录空闲任务运行时的系统时间;中断定时器,用于记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作;看门狗,用于在超过预先设置的喂狗操作间隔时间时,触发无线接入点系统进行恢复。
由上可见,本发明实施方式提供的一种无线接入点系统恢复的方法和装置,通过无线接入点的中断定时器在中断时间内进行喂狗操作,并预先设置容忍时间,则在进行喂狗操作之前,判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间,如果小于,则说明优先级最低的空闲任务也得到了CPU执行,无线接入点系统正常运行,中断定时器在中断时间内向看门狗进行喂狗操作;如果大于等于,则说明优先级最低的空闲任务长时间得不到CPU的执行,无线接入点系统进入异常状态,中断定时器停止向看门狗进行喂狗操作,则看门狗发送系统重起信号触发无线接入点系统进行恢复。本发明创造性的将空闲任务和硬件中断定时器进行喂狗操作相结合,及时地将无线接入点系统从假死(CPU 100%)状态中恢复过来。
附图说明
为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图逐一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施方式提供的无线接入点系统恢复的方法的流程示意图;
图2为本发明另一个实施方式提供的无线接入点系统恢复的方法的流程示意图;
图3为本发明实施方式提供的无线接入点系统恢复的装置的示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
目前,例如针对应用层错误问题,无线接入点通常通过应用层进行喂狗操作,一旦应用出了问题,无线接入点进行系统恢复。但是,如果系统确实很忙,如果喂狗操作进程无法使用CPU资源,将导致系统误重启,此外喂狗操作进程本身就有异常的可能。
再例如针对硬件及代码跑飞等问题,通过中断定时器进行喂狗操作,一旦系统异常,比如中断向量表被修改,无线接入点进行系统恢复。但是,因为中断的优先级高,而监控进程优先级低,有可能导致监控进程无法监控到其他线程或者用户面进程出现无法恢复的问题,比如某个内核高优先级线程进入了死循环,或者内核本身进入循环,占用100%CPU,而用户面进程就根本没有CPU时间片。
又例如针对进程级别的错误,通过监控应用进程,无线接入点对异常的进程进行重启或者将因为错误自己退出的进程拉起进行系统恢复。但是,如果高优先级进程占用100%CPU时,低优先级的监控进程就失去了监控的能力。
至少针对上述的问题,本发明实施方式提供一种无线接入点系统恢复的方法。请参阅图1,所述方法可以包括以下步骤。
步骤S1:无线接入点记录空闲任务运行时的系统时间;
步骤S2:无线接入点记录当前的系统时间;
步骤S3:如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;
步骤S4:在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。
本发明实施方式还提供一种无线接入点系统恢复的方法。请参阅图2,所述方法可以包括以下步骤。
步骤S21:无线接入点记录空闲任务运行时的系统时间T1。
中央处理单元(CPU)依靠任务的优先级在多个任务之间转换,调度任务。每个任务执行时,独占CPU。任务中包括一个空闲(idle)任务,空闲任务永远设为最低优先级,它只是在不停地给一特定计数器加1,统计任务使用这个特定计数器以确定现行应用软件实际消耗的CPU时间,因此,该空闲任务在没有其它任务进入就绪态时才投入运行。
在本实施方式中,当idle任务运行时,无线接入点记录最后一次空闲任务运行时的系统时间T1。
步骤S22:无线接入点的中断定时器在中断时间内记录当前的系统时间T2。
在本实施方式中,预先设置中断定时器的中断时间,例如1秒钟。
无线接入点通过中断定时器在中断时间内进行喂狗操作。需要特别注意的是,中断定时器在中断时间内向看门狗进行喂狗操作之前,记录当前的系统时间T2。
步骤S23:无线接入点判断当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值是否小于预先设置的容忍时间,如果小于,进行步骤S24;如果大于等于,进行步骤S25。
在本实施方式中,无线接入点的中断定时器预先设置容忍时间,例如5分钟。
无线接入点的中断定时器查询空闲任务运行时的系统时间T1,比较当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值和容忍时间,来决定是否向看门狗进行喂狗操作。
步骤S24:无线接入点的中断定时器在中断时间内向看门狗进行喂狗操作。
看门狗(watchdog)本质上是一种定时器,当无线接入点开启了看门狗(watchdog)功能,那么无线接入点必须在规定的时间间隔内向看门狗发送一个信号,这个发送信号的行为称为喂狗(feed dog)操作。而当看门狗记时超时时,看门狗将发送系统重起信号(Reset Signal)触发系统重起。
在本实施方式中,如果当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值小于容忍时间,那么说明其它任务都进入就绪态,优先级最低的空闲任务也得到了CPU执行,则无线接入点的中断定时器在中断时间内向看门狗进行喂狗操作,因此,看门狗不会发送系统重起信号起,无线接入点系统正常运行。
步骤S25:无线接入点的中断定时器停止向看门狗进行喂狗操作。
在本实施方式中,如果当前的系统时间T2与空闲任务运行时的系统时间T1的时间差值大于等于容忍时间,说明优先级最低的空闲任务长时间得不到CPU的执行,优先级较低的监控进程也很难获得CPU的执行,无线接入点系统长期处于高负载运行,进入异常状态,则无线接入点的中断定时器停止向看门狗进行喂狗操作。
步骤S26:看门狗在超过预先设置的间隔时间时,触发无线接入点系统进行恢复。
在本实施方式中,看门狗预先设置间隔时间,当超过间隔时间时,说明中断定时器已停止向看门狗进行喂狗操作,无线接入点系统处于异常状态,因此看门狗发送系统重起信号触发无线接入点系统进行恢复。
请参阅图3。本发明实施方式提供一种无线接入点系统恢复的装置,包括:
空闲任务记录模块,用于记录空闲任务运行时的系统时间;
中断定时器,用于记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作;
看门狗,用于在超过预先设置的喂狗操作间隔时间时,触发无线接入点系统进行恢复。
进一步地,
所述空闲任务记录模块,具体用于:记录最后一次空闲任务运行时的系统时间。
所述中断定时器,具体用于:在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
所述中断定时器,还用于:预先设置容忍时间;查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则在中断时间内向看门狗进行喂狗操作;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作。
上述的无线接入点系统恢复的装置涉及到的具体技术细节和无线接入点系统恢复的方法中的类似,故不再具体赘述。
由上可见,本发明实施方式提供的一种无线接入点系统恢复的方法和装置,通过无线接入点的中断定时器在中断时间内进行喂狗操作,并预先设置容忍时间,则在进行喂狗操作之前,判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间,如果小于,则说明优先级最低的空闲任务也得到了CPU执行,无线接入点系统正常运行,中断定时器在中断时间内向看门狗进行喂狗操作;如果大于等于,则说明优先级最低的空闲任务长时间得不到CPU的执行,无线接入点系统进入异常状态,中断定时器停止向看门狗进行喂狗操作,则看门狗发送系统重起信号触发无线接入点系统进行恢复。本发明创造性的将空闲任务和硬件中断定时器进行喂狗操作相结合,及时地将无线接入点系统从假死(CPU 100%)状态中恢复过来。
最后应说明的是:上面对本发明的各种实施方式的描述以描述的目的提供给本领域技术人员。其不旨在是穷举的、或者不旨在将本发明限制于单个公开的实施方式。如上所述,本发明的各种替代和变化对于上述技术所属领域技术人员而言将是显而易见的。因此,虽然已经具体讨论了一些另选的实施方式,但是其它实施方式将是显而易见的,或者本领域技术人员相对容易得出。本发明旨在包括在此已经讨论过的本发明的所有替代、修改、和变化,以及落在上述申请的精神和范围内的其它实施方式。

Claims (10)

1.一种无线接入点系统恢复的方法,其特征在于,包括:
无线接入点记录空闲任务运行时的系统时间;
无线接入点记录当前的系统时间;
如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则无线接入点停止向看门狗进行喂狗操作;
在超过预先设置的喂狗操作间隔时间时,看门狗触发无线接入点系统进行恢复。
2.根据权利要求1所述的无线接入点系统恢复的方法,其特征在于,所述无线接入点记录空闲任务运行时的系统时间,包括:
无线接入点记录最后一次空闲任务运行时的系统时间。
3.根据权利要求2所述的无线接入点系统恢复的方法,其特征在于,所述无线接入点的中断定时器在中断时间内进行喂狗操作;
所述无线接入点记录当前的系统时间,包括:
所述无线接入点的中断定时器在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
4.根据权利要求3所述的无线接入点系统恢复的方法,其特征在于,所述方法还包括:
无线接入点的中断定时器预先设置容忍时间;
所述中断定时器查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间。
5.根据权利要求4所述的无线接入点系统恢复的方法,其特征在于,所述方法还包括:
如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则所述中断定时器在中断时间内向看门狗进行喂狗操作。
6.一种无线接入点系统恢复的装置,其特征在于,包括:
空闲任务记录模块,用于记录空闲任务运行时的系统时间;
中断定时器,用于记录当前的系统时间;如果当前的系统时间与空闲任务运行时的系统时间的时间差值大于等于预先设置的容忍时间,则停止向看门狗进行喂狗操作;
看门狗,用于在超过预先设置的喂狗操作间隔时间时,触发无线接入点系统进行恢复。
7.根据权利要求6所述的无线接入点系统恢复的装置,其特征在于,所述空闲任务记录模块,具体用于:记录最后一次空闲任务运行时的系统时间。
8.根据权利要求7所述的无线接入点系统恢复的装置,其特征在于,所述中断定时器,具体用于:在中断时间内且向看门狗进行喂狗操作之前,记录当前的系统时间。
9.根据权利要求8所述的无线接入点系统恢复的装置,其特征在于,所述中断定时器,还用于:
预先设置容忍时间;
查询空闲任务运行时的系统时间,并判断当前的系统时间与空闲任务运行时的系统时间的时间差值是否小于容忍时间。
10.根据权利要求9所述的无线接入点系统恢复的装置,其特征在于,所述中断定时器,还用于:
如果当前的系统时间与空闲任务运行时的系统时间的时间差值小于容忍时间,则在中断时间内向看门狗进行喂狗操作。
CN201710194255.XA 2017-03-28 2017-03-28 一种无线接入点系统恢复的方法和装置 Pending CN107423151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710194255.XA CN107423151A (zh) 2017-03-28 2017-03-28 一种无线接入点系统恢复的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710194255.XA CN107423151A (zh) 2017-03-28 2017-03-28 一种无线接入点系统恢复的方法和装置

Publications (1)

Publication Number Publication Date
CN107423151A true CN107423151A (zh) 2017-12-01

Family

ID=60423166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710194255.XA Pending CN107423151A (zh) 2017-03-28 2017-03-28 一种无线接入点系统恢复的方法和装置

Country Status (1)

Country Link
CN (1) CN107423151A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815449A (zh) * 2005-02-01 2006-08-09 艾默生网络能源有限公司 看门狗控制方法
CN101937371A (zh) * 2010-08-27 2011-01-05 北京星网锐捷网络技术有限公司 一种嵌入式系统中监控任务执行状态的方法及装置
CN102521098A (zh) * 2011-11-23 2012-06-27 中兴通讯股份有限公司 Cpu死机监控的处理方法和装置
CN104102572A (zh) * 2013-04-01 2014-10-15 中兴通讯股份有限公司 一种系统故障检测及处理方法、装置
CN104636212A (zh) * 2014-12-29 2015-05-20 漳州科能电器有限公司 一种嵌入式操作系统看门狗实现方法
US20150339178A1 (en) * 2014-05-21 2015-11-26 Freescale Semiconductor, Inc. Processing system and method of operating a processing system
US9436627B2 (en) * 2011-08-25 2016-09-06 International Business Machines Corporation Detection of abnormal operation caused by interrupt processing

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815449A (zh) * 2005-02-01 2006-08-09 艾默生网络能源有限公司 看门狗控制方法
CN101937371A (zh) * 2010-08-27 2011-01-05 北京星网锐捷网络技术有限公司 一种嵌入式系统中监控任务执行状态的方法及装置
US9436627B2 (en) * 2011-08-25 2016-09-06 International Business Machines Corporation Detection of abnormal operation caused by interrupt processing
CN102521098A (zh) * 2011-11-23 2012-06-27 中兴通讯股份有限公司 Cpu死机监控的处理方法和装置
CN104102572A (zh) * 2013-04-01 2014-10-15 中兴通讯股份有限公司 一种系统故障检测及处理方法、装置
US20150339178A1 (en) * 2014-05-21 2015-11-26 Freescale Semiconductor, Inc. Processing system and method of operating a processing system
CN104636212A (zh) * 2014-12-29 2015-05-20 漳州科能电器有限公司 一种嵌入式操作系统看门狗实现方法

Similar Documents

Publication Publication Date Title
KR101888029B1 (ko) 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템
EP2614436B1 (en) Controlled automatic healing of data-center services
US9110867B2 (en) Providing application based monitoring and recovery for a hypervisor of an HA cluster
US8743680B2 (en) Hierarchical network failure handling in a clustered node environment
US8812501B2 (en) Method or apparatus for selecting a cluster in a group of nodes
US8910172B2 (en) Application resource switchover systems and methods
US7856639B2 (en) Monitoring and controlling applications executing in a computing node
CN108038019A (zh) 一种基板管理控制器的故障自动恢复方法及系统
US20020188891A1 (en) Apparatus and method for building metadata using a heartbeat of a clustered system
CN108429629A (zh) 设备故障恢复方法和装置
CN108768758A (zh) 分布式存储系统在线升级方法、装置、设备及存储介质
US9229839B2 (en) Implementing rate controls to limit timeout-based faults
US7318171B2 (en) Policy-based response to system errors occurring during OS runtime
CN110618864A (zh) 一种中断任务恢复方法及装置
US20220083413A1 (en) Detecting and recovering from fatal storage errors
US10169172B2 (en) Passive detection of live systems during controller failover in distributed environments
CN110502369B (zh) 一种设备死机恢复的方法、装置和存储介质
US7428655B2 (en) Smart card for high-availability clustering
CN109257218B (zh) 一种基于snmp协议网络系统孤岛自愈方法
CN109828945A (zh) 一种业务报文处理方法及系统
CN107423151A (zh) 一种无线接入点系统恢复的方法和装置
CN103428022B (zh) 一种备份和恢复网元上配置数据文件的方法及系统
CN104038364A (zh) 分布式流处理系统的容错方法、节点及系统
CN109189444A (zh) 一种服务器虚拟化系统的管理节点的升级控制方法及装置
CN107315660A (zh) 一种虚拟化系统的双机热备份方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171201