CN103309759A - 一种操作系统中断服务的检测方法 - Google Patents

一种操作系统中断服务的检测方法 Download PDF

Info

Publication number
CN103309759A
CN103309759A CN2012101174641A CN201210117464A CN103309759A CN 103309759 A CN103309759 A CN 103309759A CN 2012101174641 A CN2012101174641 A CN 2012101174641A CN 201210117464 A CN201210117464 A CN 201210117464A CN 103309759 A CN103309759 A CN 103309759A
Authority
CN
China
Prior art keywords
numerical value
application program
operating system
detection method
storage element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101174641A
Other languages
English (en)
Inventor
刘耿佋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Accton Technology Corp
Original Assignee
Accton Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Accton Technology Corp filed Critical Accton Technology Corp
Publication of CN103309759A publication Critical patent/CN103309759A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明是关于一种操作系统中断服务的检测方法,用以检测一操作系统中的至少一应用程序是否已中断服务,而该操作系统中设有一对应该应用程序的第一数值于一储存单元中;该检测方法包含有下列步骤:先于一预定时间内发送一信息请求该应用程序响应,并对该储存单元中储存的数值以一预定方式运算后,调整成另一数值;若调整后的数值等于一第二数值时,则重新启动该操作系统;若该应用程序响应时,则重新设定该储存单元中的数值为该第一数值。

Description

一种操作系统中断服务的检测方法
技术领域
本发明与系统检测有关,更详而言之是指一种操作系统中断服务的检测方法。
背景技术
随着科技的进步,许多网络装置搭载操作系统,利用操作系统建立的各种应用程序提供网络装置的网络服务或使用接口的设定/操作服务。
然而,当操作系统中的某个应用程序进入无限循环或是其它因素造成的中断服务(crashed)时,因为其它应用程序尚在执行中,必须等到操作系统进行重置动作(Reboot)后,应用程序才可以恢复正常的服务功能,而在重置之前的期间,恐将造成网络装置的某些功能无法正常提供服务。若该应用程序提供网络装置执行重要的服务,则可能造成该网络装置的瘫痪,而影响网络运作的执行。
发明内容
有鉴于此,本发明提供一种操作系统中断服务的检测方法,可在应用程序停止服务时,自动重启系统来使应用程序重新提供服务。
缘以达成上述目的,本发明提供有一种操作系统中断服务的检测方法,用以检测一操作系统中的至少一应用程序是否已中断服务(crashed),而该操作系统中设有一对应该应用程序的第一数值于一储存单元中;该检测方法包含有下列步骤:
A.于一预定时间内发送一信息请求该应用程序响应,并对该储存单元中储存的数值以一预定方式运算后,调整成另一数值;
B.若调整后的数值等于一第二数值时,则重新启动该操作系统;
C.若该应用程序响应时,则重新设定该储存单元中的数值为该第一数值。
依据上述构思,于步骤A中,该信息为操作系统中的事件(event)信息。
依据上述构思,于步骤A中,是依据一系统定时器(System timer)在固定时间产生的计时信号,于该预定时间内发送该信息至该应用程序。
依据上述构思,于步骤A中,是以该储存单元中储存的数值加上或减去一预设数字的方式,将该储存单元中储存的数值调整成另一数值。
依据上述构思,于步骤B中,重新启动操作系统时,还包括于记录对应该应用程序的重新启动系统纪录(log recorded)。
依据上述构思,于步骤C中,是由该应用程序重新设定该储存单元中的数值为该第一数值。
依据上述构思,于步骤C中,当该应用程序接收该信息时,将发出一回复信号。
依据上述构思,于步骤C中,还包括若该应用程序未响应时,则重新执行步骤A至步骤C。
依据上述构思,于步骤C中,若该应用程序响应时,除重新设定该储存单元中的数值为该第一数值外,还重新执行步骤A至步骤C。
缘以达成上述目的,本发明还提供有一种操作系统中断服务的检测方法,用以检测一操作系统中的至少一应用程序是否已中断服务(crashed),而该操作系统中设有一对应该应用程序的第一数值于一储存单元中;该检测方法包含有下列步骤:
A.于一预定时间内发送一事件(event)信息请求该应用程序响应,并以该储存单元中储存的数值加上或减去一预设数字的方式,将该储存单元中储存的数值调整成另一数值;
B.若调整后的数值等于一第二数值时,则重新启动该操作系统;
C.若该应用程序响应时,该应用程序则重新设定该储存单元中的数值为该第一数值,并重新执行步骤A至步骤C;若该应用程序未响应时,则重新执行步骤A至步骤C。依据上述构思,于步骤B中,重新启动操作系统时,还包括于记录对应该应用程序的重新启动系统纪录。
由此,透过上述的设计,便可当该操作系统中的某个应用程序进入无限循环或是其因素造成的中断服务(crashed)时,实时地重新启动(Reboot)该操作系统。
附图说明
图1为本发明较佳实施例的检测方法流程图
图2为使用本发明检测方法的系统架构图。
图3说明本发明较佳实施例的检测方法的步骤A。
图4说明本发明较佳实施例的检测方法的步骤C。
图5揭示系统的应用程序已被认定停止服务。
主要元件符号说明
10系统定时器
20监控程序
31、32应用程序
具体实施方式
为能更清楚地说明本发明,兹举较佳实施例并配合图示详细说明如后。
请参阅图1,为本发明较佳实施例检测方法的流程图。续参阅图2,为本发明较佳实施例的操作系统架构,于本实施例中,是以装载于网络装置的操作系统进行说明,其中该操作系统可以是Linux操作系统,但不以此为限。该操作系统包含有一系统定时器(System timer)10、一监控程序20以及数个被监控的应用程序31、32。其中,该系统定时器10每经过一固定时间会产生一信号来达到计时的目的;该监控程序20则于一储存单元(如内存、暂存区等)中具有数个对应各该应用程序31、32的第一数值;以及被监控的应用程序31、32用于执行特定功能的应用程序,例如提供使用接口的应用程序、执行网络地址转换(Network AddressTranslation)的应用程序、或执行网络封包转传功能的应用程序等,但不以此为限,任何可以在操作系统中执行的各种应用程序皆可。另外,该第一数值可由与该第二数值的绝对差值大小,设定为各种数值,提供应用程序在中断服务后至操作系统重置之间具有不同的时间长短,用以依应用程序所提供的功能重要性,在中断服务发生时,具有不同的等待重置时间,于本实施例中,该第一数值是以数字10为例,但不以此为限。
请参阅图3至图5,当操作系统开始运作时,该监控程序20将依据本发明实施例的该检测方法检测所述应用程序31、32是否已中断服务(crashed)。本发明实施例的监控方法包含有下列步骤:
A.于一预定时间内发送一信息请求该应用程序响应,并对该储存单元中储存的数值以一预定方式运算后,调整成另一数值。于本步骤中,系统定时器10于一预定时间产生一信号,该监控程序20将依据该系统定时器10产生的信号,于预定时间内发出该信息至各监控的应用程序,请求各该应用程序于收到该信息后发出响应信息,以响应该监控程序20,并且该监控程序20于发出该信息后,将该储存单元中储存的数值调整为另一数值。于本实施例中,该预定时间可视需求而设定各种时间,例如1分钟;而该信息可以是该操作系统的事件(event)信息,当应用程序收到要求回复的事件信息时,正常运作中的应用程序将依据该事件信息发出响应信息;该预定方式为将该数值减去该预设数字的方式,把该数值调整为另一数值,其中该预设数字可以为任何数字,于本实施例中以1为例。请参阅图3所示,当监控程序20发出信息后,将对应该监控程序的数值减去预设数字后,得到各个对应被监控程序的第二数字为9。于另一实施例中,当该应用程序接收该信息后,发出回复信息至该监控程序20,并且将该储存于储存单元的数值调整为该第一数值。此外,该预设方式亦可以是将该数值加上该预设数字的方式,把该数值调整为另一数值。
B.侦测调整后的数值是否等于一第二数值,若调整后的数值等于一第二数值时,则重新启动该操作系统。于本步骤中,该监控程序20将在步骤A中依该预定方式运算取得的数值与该第二数值进行比对,以判断该运算后的数值与该第二数值是否相符,并于相符时,发出操作系统重置的指令,以要求操作系统进行重置的动作。补充说明的是,该第二数值的设定依据该预定方式而设定为不同的数值,若该预定方式为相加,则该第二数值需设定为大于储存单元中的初始数值;反之,若该预定方式为相减,则该第二数值需设定为小于初始数值。于本实施例中,该第二数值为0,因此,当该数值被以预定方式调整至0时,监控程序20将发出操作系统重新启动的指令,令操作系统进行重置(Reset),例如暖开机(Warm start)等,但不以此为限。另外,于另一实施例中,当重新启动操作系统时,监控程序将记录对应该应用程序的重新启动系统纪录(log recorded),用以供使用者或维修人员分析哪个应用程序经常停止服务而造成该系统的重新启动,而作为后续操作系统管理的参考依据。
C.侦测各该应用程序31、32是否产生响应;若该应用程序响应时,则重新设定该储存单元中的数值为该第一数值,并重新执行步骤A至步骤C;若该应用程序未响应时,则重新执行步骤A至步骤C。于本步骤中,监控程序20依据是否接收到应用程序的回复信息,侦测各该应用程序31、32是否响应,并于侦测该应用程序响应时,将对应该应用程序的数值,设定为该第一数值;反之,若该应用程序于预设时间内未响应时,则重新执行步骤A至步骤C。请参阅图4所示,当监控程序20收到应用程序回复的响应信息,则将对应该应用程序31的数值设定为10,并继续执行步骤A至步骤C;当监控程序20未收到应用程序回复的响应信息时,则继续执行步骤A至步骤C。
请参阅图5,监控程序依据上述的步骤,若应用程序32一直无响应时,监控程序在该预定时间发出信息时会一直持续将对应该被监控的应用程序32的数值调整至符合第二数字,一旦符合第二数字,该监控程序20则认定应用程序32已停止服务,而将操作系统重新启动,来使应用程序32可以重新提供服务。
由上述可知,本发明实施例可以依据不同的应用程序功能,在中断服务发生时,在适当时间之内可以对操作系统进行重置,解决应用程序中断服务的问题,不需等到处理器过载的时候才进行重置,而可提供实时及必要的重置动作,避免因重要功能的应用程序中断时间过久,影响搭载操作系统的装置功能运行。
以上所述仅为本发明较佳可行实施例而已,举凡应用本发明说明书及权利要求所为之等效方法变化,理应包含在本发明的专利范围内。

Claims (10)

1.一种操作系统中断服务的检测方法,用以检测一操作系统中的至少一应用程序是否已中断服务,而该操作系统中设有一对应该应用程序的第一数值于一储存单元中;其特征在于,该检测方法包含有下列步骤:
A.于一预定时间内发送一信息请求该应用程序响应,并对该储存单元中储存的数值以一预定方式运算后,调整成另一数值;
B.若调整后的数值等于一第二数值时,则重新启动该操作系统;
C.若该应用程序响应时,则重新设定该储存单元中的数值为该第一数值。
2.如权利要求1所述的检测方法,其特征在于,于步骤A中,该信息为操作系统中的事件信息。
3.如权利要求1所述的检测方法,其特征在于,于步骤A中,依据一系统定时器在固定时间产生的计时信号,于该预定时间内发送该信息至该应用程序。
4.如权利要求1所述的检测方法,其特征在于,于步骤A中,对该储存单元中储存的数值加上或减去一预设数字的方式,将该储存单元中储存的数值调整成另一数值。
5.如权利要求1所述的检测方法,其特征在于,于步骤B中,重新启动操作系统时,还包括于记录对应该应用程序的重新启动系统纪录。
6.如权利要求1所述的检测方法,其特征在于,于步骤C中,是由该应用程序重新设定该储存单元中的数值为该第一数值。
7.如权利要求1所述的检测方法,其特征在于,于步骤C中,当该应用程序接收该信息时,将发出一回复信号。
8.如权利要求1所述的检测方法,其特征在于,于步骤C中,还包括若该应用程序未响应时,则重新执行步骤A至步骤C。
9.一种操作系统中断服务的检测方法,用以检测一操作系统中的至少一应用程序是否已中断服务,而该操作系统中设有一对应该应用程序的第一数值于一储存单元中;其特征在于,该检测方法包含有下列步骤:
A.于一预定时间内发送一事件信息请求该应用程序响应,并以该储存单元中储存的数值加上或减去一预设数字的方式,将该储存单元中储存的数值调整成另一数值;
B.若调整后的数值等于一第二数值时,则重新启动该操作系统;
C.若该应用程序响应时,该应用程序则重新设定该储存单元中的数值为该第一数值,并重新执行步骤A至步骤C;若该应用程序未响应时,则重新执行步骤A至步骤C。
10.如权利要求9所述的检测方法,其特征在于,于步骤B中,重新启动操作系统时,还包括于记录对应该应用程序的重新启动系统纪录。
CN2012101174641A 2012-03-06 2012-04-20 一种操作系统中断服务的检测方法 Pending CN103309759A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW101107548A TWI643063B (zh) 2012-03-06 2012-03-06 Detection method
TW101107548 2012-03-06

Publications (1)

Publication Number Publication Date
CN103309759A true CN103309759A (zh) 2013-09-18

Family

ID=49114851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101174641A Pending CN103309759A (zh) 2012-03-06 2012-04-20 一种操作系统中断服务的检测方法

Country Status (3)

Country Link
US (1) US9495230B2 (zh)
CN (1) CN103309759A (zh)
TW (1) TWI643063B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115437856A (zh) * 2021-06-01 2022-12-06 长鑫存储技术有限公司 内存测试方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323412A (zh) * 1998-08-11 2001-11-21 英特尔公司 以不同等待时间调度指令
CN1506826A (zh) * 2002-12-09 2004-06-23 联想(北京)有限公司 计算机应用软件自纠错自重起方法
CN1506825A (zh) * 2002-12-10 2004-06-23 深圳市中兴通讯股份有限公司 一种看门狗实时可调复位方法和装置
CN1904852A (zh) * 2006-08-01 2007-01-31 西安西电捷通无线网络通信有限公司 一种计算机应用程序的监控及异常处理方法
CN100394399C (zh) * 2006-02-22 2008-06-11 迈普(四川)通信技术有限公司 一种死循环或类死循环任务检测方法
CN102141947A (zh) * 2011-03-30 2011-08-03 东方通信股份有限公司 一种对采用嵌入式操作系统的计算机应用系统中异常任务的处理方法及系统
US20120030670A1 (en) * 2010-07-30 2012-02-02 Jog Rohit Vijay Providing Application High Availability in Highly-Available Virtual Machine Environments
CN102414672A (zh) * 2009-07-20 2012-04-11 密克罗奇普技术公司 可编程异常处理等待时间

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040250155A1 (en) * 2003-05-19 2004-12-09 Stefan Weichselbaum Aspect based recovery system and method
TWI228650B (en) * 2003-06-17 2005-03-01 Acer Inc Application program management system and method thereof
TWI234112B (en) * 2003-07-04 2005-06-11 Service & Quality Technology C Automatic reset method and device for computer failure
US7424644B2 (en) * 2005-03-01 2008-09-09 Microsoft Corporation Method and system for recovering data from a hung application
US7818625B2 (en) * 2005-08-17 2010-10-19 Microsoft Corporation Techniques for performing memory diagnostics
TW200919303A (en) * 2007-10-26 2009-05-01 Mitac Int Corp System capable of monitoring multi-thread status and monitoring method thereof
TW201106152A (en) * 2009-08-10 2011-02-16 Inventec Corp Method for detecting hang of computer system
TW201116995A (en) * 2009-11-04 2011-05-16 Inventec Corp Method of monitoring operating system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1323412A (zh) * 1998-08-11 2001-11-21 英特尔公司 以不同等待时间调度指令
CN1506826A (zh) * 2002-12-09 2004-06-23 联想(北京)有限公司 计算机应用软件自纠错自重起方法
CN1506825A (zh) * 2002-12-10 2004-06-23 深圳市中兴通讯股份有限公司 一种看门狗实时可调复位方法和装置
CN100394399C (zh) * 2006-02-22 2008-06-11 迈普(四川)通信技术有限公司 一种死循环或类死循环任务检测方法
CN1904852A (zh) * 2006-08-01 2007-01-31 西安西电捷通无线网络通信有限公司 一种计算机应用程序的监控及异常处理方法
CN102414672A (zh) * 2009-07-20 2012-04-11 密克罗奇普技术公司 可编程异常处理等待时间
US20120030670A1 (en) * 2010-07-30 2012-02-02 Jog Rohit Vijay Providing Application High Availability in Highly-Available Virtual Machine Environments
CN102141947A (zh) * 2011-03-30 2011-08-03 东方通信股份有限公司 一种对采用嵌入式操作系统的计算机应用系统中异常任务的处理方法及系统

Also Published As

Publication number Publication date
US20130238284A1 (en) 2013-09-12
TW201337542A (zh) 2013-09-16
US9495230B2 (en) 2016-11-15
TWI643063B (zh) 2018-12-01

Similar Documents

Publication Publication Date Title
US11360842B2 (en) Fault processing method, related apparatus, and computer
US11256539B2 (en) Task processing method, apparatus, and system based on distributed system
CN108363659B (zh) 一种处理电子设备异常的方法及装置
WO2023115999A1 (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN101354677A (zh) 一种应用程序运行状态的检测方法、恢复方法及装置
CN102521098B (zh) Cpu死机监控的处理方法和装置
CN107436414B (zh) 一种存储系统中bbu的有效性测试方法和装置
CN104636221A (zh) 一种计算机系统故障处理方法和装置
CN109361542A (zh) 客户端的故障处理方法、装置、系统、终端和服务器
US20170102979A1 (en) Mitigating Crashes of an Application Server Executing a Monitoring Agent
CN110502399B (zh) 故障检测方法及装置
EP3042287A1 (en) Rootkit detection in a computer network
CN105426263A (zh) 一种实现金库系统安全运行的方法及系统
CN103178977A (zh) 计算机系统及计算机系统的开机管理方法
CN110502369A (zh) 一种设备死机恢复的方法、装置和存储介质
CN105844179A (zh) 一种终端保护方法及装置
CN103513996A (zh) 终端设备的Android系统恢复方法及该终端设备
CN109062718B (zh) 一种服务器及数据处理方法
CN103309759A (zh) 一种操作系统中断服务的检测方法
CN104580135A (zh) 一种基于uefi的终端实时控制系统和方法
CN107179911A (zh) 一种重启管理引擎的方法和设备
CN113918407A (zh) 一种管理服务进程的方法、装置及可读存储介质
CN105391575A (zh) 一种金库控制方法及系统
CN104268081B (zh) 一种软件运行状态监控方法及装置
CN104142832A (zh) 电脑装置及其重开机方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130918