CN102736958A - 一种对多个进程系统进行监控的看门狗实现方法及系统 - Google Patents

一种对多个进程系统进行监控的看门狗实现方法及系统 Download PDF

Info

Publication number
CN102736958A
CN102736958A CN2012101727122A CN201210172712A CN102736958A CN 102736958 A CN102736958 A CN 102736958A CN 2012101727122 A CN2012101727122 A CN 2012101727122A CN 201210172712 A CN201210172712 A CN 201210172712A CN 102736958 A CN102736958 A CN 102736958A
Authority
CN
China
Prior art keywords
monitored
dog
control process
hardware circuit
watchdog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101727122A
Other languages
English (en)
Inventor
姚敏
郭小东
邓永坚
王志波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Gongjin Electronics Co Ltd
Original Assignee
Shenzhen Gongjin Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Gongjin Electronics Co Ltd filed Critical Shenzhen Gongjin Electronics Co Ltd
Priority to CN2012101727122A priority Critical patent/CN102736958A/zh
Publication of CN102736958A publication Critical patent/CN102736958A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种对多个进程系统进行监控的看门狗实现方法,包括应用层的主程序启动一个控制进程,对看门狗硬件电路的进行初始化,使能看门狗硬件电路;并周期性地给所述的看门狗硬件电路进行复位;同时给被监控进程设置定时器,当任何一个被监控进程没有在规定时间内完成其对应的定时器的清零动作,所述的控制进程强制使所述的周期性喂狗线程退出。本发明能够在既监控操作系统内核的同时,又能够很好的监控应用程序,提高系统的稳定和可靠性。

Description

一种对多个进程系统进行监控的看门狗实现方法及系统
技术领域
本发明涉及多进程系统的实时监控领域,特别涉及到EPON网络终端设备中对操作系统层和应用层的程序的监控功能,用软硬件结合的方法来以保证系统的可靠性和稳定性。
背景技术
以太网无源光网络(Ethernet Passive Optical Network ,EPON)继承了以太网的可扩展性强、对IP数据业务适配效率高等优点,同时支持高速Internet接入、语音、IPTV、TDM专线甚至CATV等多种业务综合接入,并具有很好的QoS保证和组播业务支持能力,是目前建设高质量接入网的重要备选技术之一。目前现有的以太网无源光网络中(EPON)主要由光网络终端(optical line terminal,OLT)和光网络单元(Optical Network Unit,ONU),以及之间连接的光纤组成的网络。光线路终端(OLT)通过“操作管理和维护协议(Operation Administration and Maintenance Protocol,OAM协议)”,对光网络单元(ONU)进行远程的操作维护和管理。同时方便管理员的操作,EPON网络中还采用终端综合管理系统(Information Technology for Manufacturing Systems ITMS)通过TR069协议来管理网络终端设备。
在网络终端设备中,为了保证系统的稳定性和系统的安全性,往往都需要对系统中的多个进程和操作系统内核层进行监控。在操作系统崩溃、应用层进程发生异常以及硬件发生异常时,往往都要通过设置看门狗模块使系统复位。现有的看门狗实现方法往往只能监控单一的系统进程,并且喂狗(给“看门狗”电路进行复位为“喂狗”)时间有比较严格的硬件限制。详细说明如下:
看门狗电路其实就是一个计数器。当看门狗启动后,计数器开始自动计数,经过一定时间计数器溢出就会对CPU产生一个复位信号使系统重启。系统正常运行时,需要在看门狗允许的时间间隔内对看门狗计数器清零也即喂狗,不让复位信号产生。目前常用的硬件看门狗电路一般只能保持的在1.6S的持续电平时间,保证在每个1.6S内系统要给看门狗计数器清零,否则就会导致ONU复位。如果仅仅是一个单进程的系统,系统在1.6s的时间内给看门狗电路喂狗完全可行的。但是对于一个有操作系统的、能够执行多进程、多任务的比较复杂的系统来说,需要监控多个进程,并且每个进程比较复杂,执行时间过长,往往都不能规定的时间内完成喂狗动作,这样就导致系统在没有出现异常的情况也发生复位,导致系统频繁的重启,也就失去了监控应用层进程运行的状态的功能。
发明内容
为解决目前比较复杂的系统需要监控多个进程,并且每个进程比较复杂,执行时间过长,往往都不能规定的时间内完成喂狗动作,这样就导致系统在没有出现异常的情况也发生复位,导致系统频繁的重启,也就失去了监控应用层进程运行的状态的功能的不足,提供一种对多个进程系统进行监控的看门狗实现方法。
本发明为了完成其技术目的所采用的技术方案是:一种对多个进程系统进行监控的看门狗实现方法,包括以下步骤:
步骤A、应用层的主程序启动一个控制进程,对看门狗硬件电路的进行初始化,使能看门狗硬件电路;
步骤B、 所述的控制进程开启一个周期性的喂狗线程,周期性地给所述的看门狗硬件电路进行复位;
步骤C、 所述的控制进程接受其他被监控进程的注册,记录被监控进程的名单;
步骤D、所述的控制进程给每一个注册过的被监控进程设置定时器,每个被监控进程会在设定的时间内对定时器时间清零;当任何一个被监控进程没有在规定时间内完成其对应的定时器的清零动作,所述的控制进程强制使所述的周期性喂狗线程退出。
本发明能够在既监控操作系统内核的同时,又能够很好的监控应用程序,提高系统的稳定和可靠性。同现有的技术相比,本发明的可以通过设定定时器时间的长短从而控制喂狗线程是否喂狗,从而间接设定了看门狗硬件电路的喂狗时间,从而可以保证应用程序有足够的时间来间接给硬件看门喂狗,同时在应用程序发生故障并且超出定时器的设定的时间,喂狗线程无法喂狗,也就导致看门狗电路超时复位。由于本发明就普遍的适用性,可以广泛的应用各种比较复杂嵌入式系统设备中。
下面通过结合具体实施例和附图对本发明进行进一步的说明。
附图说明
附图1是本发明整体框图。
附图2是本发明的多进程具体喂狗功能的实现流程图。
具体实施方式
如图1所示,本实施例是一种应用于OLT上的对多进程监控看门狗的实现方法,光线路终端(OLT)通过“操作管理和维护协议(Operation Administration and Maintenance Protocol,OAM协议)”,对光网络单元(ONU)进行远程的操作维护和管理。同时方便管理员的操作,EPON网络中还采用终端综合管理系统(ITMS)通过TR069协议来管理网络终端设备。
参看图1是本系统的整体框架图,本发明是了解决在ONU设备中监控应用层程序,受看门狗硬件设备的喂狗时间限制和应用层程序自身的执行比较长和容易阻塞等特点,提出一种全新解决方法,如图2所示,是本系统的多进程具体喂狗功能的实现流程图;
1)系统上电后处理器(CPU)从复位地址,开始运行启动代码(bootloader),启动代码是嵌入式系统加电后首先运行的一段程序。其主要任务是初始化硬件设备、建立内存空间的映射,将系统的软硬件环境设定在一个合适的状态。把程序镜像(image)从ROM或是flash中拷贝到RAM中,然后调用内核。内核启动完毕后就是创建根文件系统,用户空间所有的操作都是依赖于根文件系统。根文件系统完成后就开始启动应用层的进程;
2)首先应用层的主程序启动一个控制进程,控制进程主要完成;
a)看门狗硬件电路的初始化,使能看门狗硬件电路;
b)开启一个周期性的喂狗线程,喂狗周期要小于看门狗硬件电路持续电平时间,不断的周期性给看门狗硬件电路喂狗;
c)接受其他被监控进程的注册,记录被监控进程的名单;
d)控制进程给每一个注册过的被监控进程设置定时器,每个被监控进程会在设定的时间内对定时器时间清零。如果有其中一个被监控进程没有在规定时间内完成其对应的定时器的清零动作,就会导致控制进程强制使周期性喂狗线程退出,从而硬件看门狗电路没有喂狗,也就导致系统的复位重启。
本系统中每一个被监控进程会在启动的过程中主动向控制进程注册,同时设定本进程的超时复位时间。本进程在运行的过程中会在规定时间内把控制进程中的定时器清零。如果本进程发生异常或是故障将无法在规定的时间内清零定时器,从而导致系统复位重启。
总之,本发明的方法可以同时对多个应用层进程进行比较灵活的监控,并且能够比较灵活的设定看门狗的超时时间。解决了传统的看门狗只能对单一的进程监控,同是对看门狗的喂狗时间也比较严格的问题,能够广泛的应用于比较复杂的嵌入式系统设备中。

Claims (1)

1. 一种对多个进程系统进行监控的看门狗实现方法,其特征在于:包括以下步骤:
步骤A、应用层的主程序启动一个控制进程,对看门狗硬件电路的进行初始化,使能看门狗硬件电路;
步骤B、 所述的控制进程开启一个周期性的喂狗线程,周期性地给所述的看门狗硬件电路进行复位;
步骤C、 所述的控制进程接受其他被监控进程的注册,记录被监控进程的名单;
步骤D、所述的控制进程给每一个注册过的被监控进程设置定时器,每个被监控进程会在设定的时间内对定时器时间清零;当任何一个被监控进程没有在规定时间内完成其对应的定时器的清零动作,所述的控制进程强制使所述的周期性喂狗线程退出。
CN2012101727122A 2012-05-30 2012-05-30 一种对多个进程系统进行监控的看门狗实现方法及系统 Pending CN102736958A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101727122A CN102736958A (zh) 2012-05-30 2012-05-30 一种对多个进程系统进行监控的看门狗实现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101727122A CN102736958A (zh) 2012-05-30 2012-05-30 一种对多个进程系统进行监控的看门狗实现方法及系统

Publications (1)

Publication Number Publication Date
CN102736958A true CN102736958A (zh) 2012-10-17

Family

ID=46992503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101727122A Pending CN102736958A (zh) 2012-05-30 2012-05-30 一种对多个进程系统进行监控的看门狗实现方法及系统

Country Status (1)

Country Link
CN (1) CN102736958A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103036778A (zh) * 2012-12-18 2013-04-10 上海斐讯数据通信技术有限公司 一种家庭网关设备中防止设备僵死的装置和方法
CN103501471A (zh) * 2013-09-22 2014-01-08 国家电网公司 一种远程集中控制10g epon设备的方法及其系统
CN104636212A (zh) * 2014-12-29 2015-05-20 漳州科能电器有限公司 一种嵌入式操作系统看门狗实现方法
CN108897248A (zh) * 2018-06-07 2018-11-27 浙江国自机器人技术有限公司 一种多cpu控制器和移动机器人
CN110297724A (zh) * 2019-06-27 2019-10-01 厦门四信通信科技有限公司 嵌入式软件看门狗设计方法、装置、设备及存储介质
CN110502369A (zh) * 2019-08-20 2019-11-26 京信通信系统(中国)有限公司 一种设备死机恢复的方法、装置和存储介质
CN110727529A (zh) * 2019-09-06 2020-01-24 深圳市智微智能科技开发有限公司 一种看门狗复位方法及其系统
CN111078441A (zh) * 2018-10-19 2020-04-28 迈普通信技术股份有限公司 一种系统运行状态监测方法、装置及电子设备
WO2020082354A1 (zh) * 2018-10-26 2020-04-30 深圳市欢太科技有限公司 一种系统状态检测方法、系统状态装置及终端设备
CN116684520A (zh) * 2022-09-30 2023-09-01 荣耀终端有限公司 一种关机方法和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101034495A (zh) * 2007-01-09 2007-09-12 方科峰 数字交通系统
CN101739305A (zh) * 2010-02-09 2010-06-16 太仓市同维电子有限公司 操作系统内核级实时看门狗监控装置及其监控方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101034495A (zh) * 2007-01-09 2007-09-12 方科峰 数字交通系统
CN101739305A (zh) * 2010-02-09 2010-06-16 太仓市同维电子有限公司 操作系统内核级实时看门狗监控装置及其监控方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
叶帮利: "《用于工控监测系统的多进程软件看门狗》", 《微计算机信息(测控自动化)》, vol. 24, no. 31, 31 December 2008 (2008-12-31) *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103036778A (zh) * 2012-12-18 2013-04-10 上海斐讯数据通信技术有限公司 一种家庭网关设备中防止设备僵死的装置和方法
CN103036778B (zh) * 2012-12-18 2018-05-01 上海斐讯数据通信技术有限公司 一种家庭网关设备中防止设备僵死的装置和方法
CN103501471A (zh) * 2013-09-22 2014-01-08 国家电网公司 一种远程集中控制10g epon设备的方法及其系统
CN103501471B (zh) * 2013-09-22 2017-04-12 国家电网公司 一种远程集中控制10g epon设备的方法及其系统
CN104636212A (zh) * 2014-12-29 2015-05-20 漳州科能电器有限公司 一种嵌入式操作系统看门狗实现方法
CN108897248A (zh) * 2018-06-07 2018-11-27 浙江国自机器人技术有限公司 一种多cpu控制器和移动机器人
CN111078441A (zh) * 2018-10-19 2020-04-28 迈普通信技术股份有限公司 一种系统运行状态监测方法、装置及电子设备
WO2020082354A1 (zh) * 2018-10-26 2020-04-30 深圳市欢太科技有限公司 一种系统状态检测方法、系统状态装置及终端设备
CN110297724A (zh) * 2019-06-27 2019-10-01 厦门四信通信科技有限公司 嵌入式软件看门狗设计方法、装置、设备及存储介质
CN110502369A (zh) * 2019-08-20 2019-11-26 京信通信系统(中国)有限公司 一种设备死机恢复的方法、装置和存储介质
CN110502369B (zh) * 2019-08-20 2022-03-25 京信网络系统股份有限公司 一种设备死机恢复的方法、装置和存储介质
CN110727529A (zh) * 2019-09-06 2020-01-24 深圳市智微智能科技开发有限公司 一种看门狗复位方法及其系统
CN116684520A (zh) * 2022-09-30 2023-09-01 荣耀终端有限公司 一种关机方法和电子设备
CN116684520B (zh) * 2022-09-30 2024-04-12 荣耀终端有限公司 一种关机方法、电子设备、存储介质及芯片

Similar Documents

Publication Publication Date Title
CN102736958A (zh) 一种对多个进程系统进行监控的看门狗实现方法及系统
Vayghan et al. Deploying microservice based applications with kubernetes: Experiments and lessons learned
CN101271415B (zh) 嵌入式设备中监控看门狗的实现方法
US20130232382A1 (en) Method and system for determining the impact of failures in data center networks
CN100518082C (zh) 一种具有自恢复功能的远程在线升级方法
WO2018113514A1 (zh) Cdn管理系统、方法及装置
US8738968B2 (en) Configuration based service availability analysis of AMF managed systems
CN102761439B (zh) Pon接入系统中基于看门狗的异常检测记录装置及方法
CN102508734B (zh) 操作系统恢复方法及智能设备
CN102968352A (zh) 进程监控及多级恢复系统和方法
CN103605536B (zh) 一种嵌入式操作系统的启动方法、装置及基板管理控制器
JP2007316855A (ja) 電子機器及び電子機器の再起動方法
CN110825490A (zh) 一种基于Kubernetes容器应用健康检查的方法及其系统
CN102081573A (zh) 用于记录设备重启原因的装置及方法
CN109582486A (zh) 一种看门狗监测方法、系统及设备和存储介质
WO2014206099A1 (zh) 一种多节点服务器系统的故障现场信息的收集方法及装置
CN112306567A (zh) 集群管理系统和容器管控方法
EP3049932A1 (de) Verfahren zum erkennen eines ausfalls eines constituent-systems in einem system-of-systems
US10205767B2 (en) Management system and method for a big data processing device
CN102521060A (zh) 基于看门狗本地检测技术的高可用集群系统假死解决方法
CN107995033B (zh) 一种onu配置文件升级方法及装置
CN112350862A (zh) 一种监控报警及故障自愈系统
CN102819455A (zh) 一种在应用层对进程进行管理的方法和管理系统
CN104360913B (zh) 用于计算机操作系统的监控模块
CN102819474A (zh) 系统操作的测试方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20121017