TW201428485A - 處理程式異常的系統及方法 - Google Patents

處理程式異常的系統及方法 Download PDF

Info

Publication number
TW201428485A
TW201428485A TW101148702A TW101148702A TW201428485A TW 201428485 A TW201428485 A TW 201428485A TW 101148702 A TW101148702 A TW 101148702A TW 101148702 A TW101148702 A TW 101148702A TW 201428485 A TW201428485 A TW 201428485A
Authority
TW
Taiwan
Prior art keywords
server
main
main program
program
module
Prior art date
Application number
TW101148702A
Other languages
English (en)
Inventor
Chung-I Lee
De-Yi Xie
Shuai-Jun Tao
zhi-qiang Yi
Jun-Chao Yao
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201428485A publication Critical patent/TW201428485A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)
  • Retry When Errors Occur (AREA)
  • Computer And Data Communications (AREA)

Abstract

一種處理程式異常的系統,包括:關閉模組,用於當主伺服器的系統時間超過了該主伺服器中的主程式中最早待處理記錄對應的預設處理時間時,關閉該主程式;執行模組,用於當主伺服器中的主程式的執行次數沒有超過預設次數時,重新執行該主程式;及啟動模組,用於當主伺服器中的主程式執行次數超過了預設次數時,啟動備份伺服器中的主程式。

Description

處理程式異常的系統及方法
本發明涉及一種系統程式管理系統及方法,尤其涉及一種處理程式異常的系統及方法。
一種迴圈處理多筆處理記錄的程式,通常於處理每筆記錄時,主程式需要調用第三方元件,調用的過程中第三方元件出現異常或者出現主程式無法預知的事件時,主程式往往無法捕捉到此類異常,導致主程式卡住或者介面出現假死現象,影響了主程式的後續運行。最終使得其他待處理的記錄一直處於等待狀態,耽誤了處理時間。
鑒於以上內容,有必要提供一種處理程式異常的系統及方法,可以處理程式運行出現異常的情況。
一種處理程式異常的系統,該系統包括:關閉模組,用於當主伺服器的系統時間超過了該主伺服器中的主程式中早待處理記錄對應的預設處理時間時,關閉該主程式;執行模組,用於當主伺服器中的主程式的執行次數沒有超過預設次數時,重新執行該主程式;及啟動模組,用於當主伺服器中的主程式執行次數超過了預設次數時,啟動備份伺服器中的主程式。
一種處理程式異常的方法,該方法包括:關閉步驟,當主伺服器的系統時間超過了該主伺服器中的主程式中最早待處理記錄對應的預設處理時間時,關閉該主程式;執行步驟,當主伺服器中的主程式的執行次數沒有超過預設次數時,重新執行該主程式;及啟動步驟,當主伺服器中的主程式執行次數超過了預設次數時,啟動備份伺服器中的主程式。
相較於習知技術,所述處理程式異常的系統及方法,使得主程式於調用第三方元件的時候,及時處理異常情況,防止主程式捕捉不到異常而無法正常運行。
如圖1所示,是本發明處理程式異常的系統較佳實施例的運行環境圖。該處理程式異常的系統10運行於主伺服器1中,該主伺服器1藉由網路連接於至少一個備份伺服器2。本實施例中,以一個備份伺服器2為例來說明本發明。
所述主伺服器1和備份伺服器2均包括主程式11,所述主程式11包括多個待處理記錄,每筆待處理記錄均對應了預設處理時間,並按照預設處理時間的先後排序。於執行主伺服器1中的主程式11時,該主程式11中的每筆待處理記錄於正常情況下,均應當於主伺服器1的系統時間到達該待處理記錄對應的預設處理時間時,執行該待處理記錄。若當系統時間到達該待處理記錄對應的預設處理時間,但是該待處理記錄還沒有執行,則判斷為該主伺服器1中的主程式11出現異常。
如圖2所示,是圖1中處理程式異常的系統10的功能模組圖。所述處理程式異常的系統10包括:第一判斷模組100、關閉模組101、第二判斷模組102、執行模組103、啟動模組104、第三判斷模組105、第四判斷模組106、切換模組107及提示模組108。所述模組是具有特定功能的軟體程式段,該軟體程式段儲存於電腦可讀儲存介質或其他儲存設備,可被電腦或其他包含處理器的計算裝置執行,從而完成本發明中處理程式異常的作業流程。
第一判斷模組100用於當執行主伺服器1中的主程式11時,判斷主伺服器1的系統時間是否超過了該主程式11中的最早待處理記錄對應的預設處理時間。本實施例中,可每隔一段時間檢測一次系統時間是否超過了主程式11中最早待處理記錄對應的預設處理時間。當主伺服器1的系統時間超過主程式11中最早待處理記錄的預設處理時間,則表明該主程式11於執行的過程中出現異常。
關閉模組101用於當主伺服器1的系統時間超過了主程式11中最早待處理記錄對應的預設處理時間時,關閉該主程式11。本實施例中,若於執行該主程式11時使用到相關程式進程,則該關閉模組101於關閉主程式11的同時關閉該相關程式進程。例如於執行主程式11時需要用到word程式,關閉模組101則關閉該主程式11的同時關閉word程式的進程。
第二判斷模組102用於判斷所述主伺服器1中的主程式11執行次數是否超過了預設次數。該主程式11的執行次數的初始值可設置為0。
執行模組103用於當主伺服器1中的主程式11執行次數沒有超過預設次數時,重新執行該主程式11,並將所述執行次數加1。由所述第一判斷模組100繼續判斷重新執行該主程式11時,主伺服器1的系統時間是否超過了該主程式11中最早待處理記錄對應的預設處理時間。當主伺服器1的系統時間沒有超過主程式11中最早待處理記錄對應的預設處理時間時,繼續按照預設處理時間的先後順序執行該主程式11中的待處理記錄。
當主伺服器1中的主程式11執行次數超過了預設次數時,啟動模組104用於啟動備份伺服器2中的主程式11。主伺服器1中的主程式11執行次數超過了預設次數,則表明於規定的預設次數內,主程式11無法自行解決所發生的異常。
第三判斷模組105用於判斷備份伺服器2的系統時間是否超過了備份伺服器2中的主程式11中最早待處理記錄對應的預設處理時間。若備份伺服器2的系統時間沒有超過備份伺服器2中主程式11中最早待處理記錄對應的預設處理時間,則表示於執行備份伺服器2中的主程式11中沒有出現異常。
若備份伺服器2中的系統時間超過了備份伺服器2中主程式11的最早待處理記錄對應的預設處理時間,則第四判斷模組106用於判斷該備份伺服器中主程式11的最早待處理記錄是否與主伺服器1中主程式11中出現異常的待處理記錄相同。若備份伺服器2中主程式11的最早待處理記錄與主伺服器1中主程式11出現異常的待處理記錄不相同,則切換模組107用於將該備份伺服器2作為新主伺服器,而將所述主伺服器1作為該新主伺服器的備份伺服器,等同於上文項所述之執行主伺服器1中主程式11的方法來執行新主伺服器中的主程式11,當執行次數達到預設次數時,切換至新備份伺服器,並執行新備份伺服器中的主程式11。
提示模組108用於當備份伺服器2中主程式11的最早待處理記錄與主伺服器1中主程式11出現異常的待處理記錄相同時,提示工作人員處理異常。本實施例中,該提示模組108可彈出對話方塊提示工作人員主程式11執行過程中出現無法處理的異常。
如圖3所示,是本發明處理程式異常的方法較佳實施例的作業流程圖。
步驟S30,當主伺服器1為主伺服器並執行該主伺服器1中的主程式11時,第一判斷模組100判斷主伺服器1的系統時間是否超過了該主程式11中的最早待處理記錄對應的預設處理時間。本實施例中,可每隔一段時間檢測一次系統時間是否超過了主程式11中最早待處理記錄對應的預設處理時間。當主伺服器1的系統時間超過主程式11中最早待處理記錄的預設處理時間,則表明該主程式11於執行的過程中出現異常,執行步驟S31。當主伺服器1的系統時間沒有超過主程式11中最早待處理記錄的預設處理時間時,則繼續執行該主程式11。
步驟S31,關閉模組101關閉該主程式11。本實施例中,若於執行該主程式11時使用到相關程式進程,則該關閉模組101於關閉主程式11的同時關閉該相關程式進程。例如於執行主程式11時需要用到word程式,則關閉模組101關閉該主程式的同時關閉word程式的進程。
步驟S32,第二判斷模組102判斷所述主伺服器1中的主程式11執行次數是否超過了預設次數。該主程式11的執行次數的初始值可設置為0。當主伺服器1中的主程式11的執行次數超過了預設次數,則執行步驟S34。當主伺服器1中的主程式11的執行次數沒有超過預設次數,則執行步驟S33。
步驟S33,執行模組103重新執行該主程式11,並將所述執行次數加1,並轉至步驟S30。
步驟S34,啟動模組104啟動備份伺服器2中的主程式11。主伺服器1中的主程式11執行次數超過了預設次數,則表明於規定的預設次數內,主程式11無法自行解決所發生的異常。
步驟S35,第三判斷模組105判斷備份伺服器2的系統時間是否超過了備份伺服器2中的主程式11中最早待處理記錄對應的預設處理時間。若備份伺服器2的系統時間沒有超過備份伺服器2中主程式11中最早待處理記錄對應的預設處理時間,則表示於執行備份伺服器2中的主程式11中沒有出現異常,結束流程。若備份伺服器2的系統時間超過了備份伺服器2中主程式11中最早待處理記錄對應的預設處理時間,執行步驟S36。
步驟S36,第四判斷模組106判斷備份伺服器中主程式11的最早待處理記錄是否與主伺服器1中主程式11中出現異常的待處理記錄相同。若備份伺服器2中主程式11的最早待處理記錄與主伺服器1中主程式11出現異常的待處理記錄相同,則執行步驟S37。若備份伺服器2中主程式11的最早待處理記錄與主伺服器1中主程式11出現異常的待處理記錄不相同,則執行步驟S38。
步驟S37,提示模組108提示工作人員處理異常。本實施例中,該提示模組108可彈出對話方塊提示工作人員主程式11執行過程中出現無法處理的異常。
步驟S38,切換模組107將該備份伺服器2切換為新主伺服器,而所述主伺服器1切換為該新主伺服器的備份伺服器,並返回步驟S30。
最後所應說明的是,以上實施例僅用以說明本發明的技術方案而非限制,儘管參照以上較佳實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或等同替換,而不脫離本發明技術方案的精神和範圍。
1...主伺服器
10...處理程式異常的系統
11...主程式
2...備份伺服器
100...第一判斷模組
101...關閉模組
102...第二判斷模組
103...執行模組
104...啟動模組
105...第三判斷模組
106...第四判斷模組
107...切換模組
108...提示模組
圖1是本發明處理程式異常的系統較佳實施例的運行環境圖。
圖2是圖1中處理程式異常的系統10的功能模組圖。
圖3是本發明處理程式異常的方法較佳實施例的作業流程圖。
10...處理程式異常的系統
100...第一判斷模組
101...關閉模組
102...第二判斷模組
103...執行模組
104...啟動模組
105...第三判斷模組
106...第四判斷模組
107...切換模組
108...提示模組

Claims (6)

  1. 一種處理程式異常的系統,該系統包括:
    關閉模組,用於當主伺服器的系統時間超過了該主伺服器中的主程式中最早待處理記錄對應的預設處理時間時,關閉該主程式;
    執行模組,用於當主伺服器中的主程式的執行次數沒有超過預設次數時,重新執行該主程式;及
    啟動模組,用於當主伺服器中的主程式執行次數超過了預設次數時,啟動備份伺服器中的主程式。
  2. 如申請專利範圍第1項所述之處理程式異常的系統,該系統還包括:提示模組,用於當備份伺服器中的系統時間超過了備份伺服器中主程式最早待處理記錄對應的預設處理時間,且備份伺服器中主程式的最早待處理記錄與主伺服器中主程式出現異常的待處理記錄相同時,提示工作人員處理異常。
  3. 如申請專利範圍第1項所述之處理程式異常的系統,該系統還包括:切換模組,用於若備份伺服器中主程式的最早待處理記錄與主伺服器中主程式出現異常的待處理記錄不相同,則將該備份伺服器作為新主伺服器,而所述主伺服器作為該新主伺服器的備份伺服器。
  4. 一種處理程式異常的方法,該方法包括:
    關閉步驟,當主伺服器的系統時間超過了該主伺服器中的主程式中最早待處理記錄對應的預設處理時間時,關閉該主程式;
    執行步驟,當主伺服器中的主程式的執行次數沒有超過預設次數時,重新執行該主程式;及
    啟動步驟,當主伺服器中的主程式執行次數超過了預設次數時,啟動備份伺服器中的主程式。
  5. 如申請專利範圍第4項所述之處理程式異常的方法,該方法還包括:提示步驟,當備份伺服器中的系統時間超過了備份伺服器中主程式最早待處理記錄對應的預設處理時間,且備份伺服器中主程式的最早待處理記錄與主伺服器中主程式出現異常的待處理記錄相同時,提示工作人員處理異常。
  6. 如申請專利範圍第5項所述之處理程式異常的方法,該方法還包括:切換步驟,若備份伺服器中主程式的最早待處理記錄與主伺服器中主程式出現異常的待處理記錄不相同,則將該備份伺服器作為新主伺服器,而所述主伺服器作為該新主伺服器的備份伺服器,並重新執行所述關閉步驟、執行步驟及啟動步驟。
TW101148702A 2012-12-17 2012-12-20 處理程式異常的系統及方法 TW201428485A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210548239.3A CN103870351A (zh) 2012-12-17 2012-12-17 处理程序异常的系统及方法

Publications (1)

Publication Number Publication Date
TW201428485A true TW201428485A (zh) 2014-07-16

Family

ID=50908912

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101148702A TW201428485A (zh) 2012-12-17 2012-12-20 處理程式異常的系統及方法

Country Status (3)

Country Link
US (1) US20140173333A1 (zh)
CN (1) CN103870351A (zh)
TW (1) TW201428485A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109753292B (zh) * 2018-12-24 2023-07-07 智慧互通科技股份有限公司 一种在多单实例数据库服务中部署多个应用的方法及装置
CN112486713B (zh) * 2019-09-11 2023-07-18 华为技术有限公司 一种冻屏处理方法及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5715386A (en) * 1992-09-30 1998-02-03 Lucent Technologies Inc. Apparatus and methods for software rejuvenation
US6515968B1 (en) * 1995-03-17 2003-02-04 Worldcom, Inc. Integrated interface for real time web based viewing of telecommunications network call traffic
TW200725301A (en) * 2005-12-27 2007-07-01 Univ Yuan Ze Distributed data server and method thereof
CN101594254B (zh) * 2009-06-30 2011-04-27 中国运载火箭技术研究院 一种基于代理技术的网格计算容错系统及方法
GB2472620B (en) * 2009-08-12 2016-05-18 Cloudtran Inc Distributed transaction processing

Also Published As

Publication number Publication date
CN103870351A (zh) 2014-06-18
US20140173333A1 (en) 2014-06-19

Similar Documents

Publication Publication Date Title
JP7237110B2 (ja) 故障予測方法、装置、電子設備、記憶媒体、及びプログラム
US20160055046A1 (en) System fault detection and processing method, device, and computer readable storage medium
CN103092746B (zh) 线程异常的定位方法及系统
Huang et al. Software reliability analysis and assessment using queueing models with multiple change-points
CN107451040B (zh) 故障原因的定位方法、装置及计算机可读存储介质
US8954579B2 (en) Transaction-level health monitoring of online services
CN104636221A (zh) 一种计算机系统故障处理方法和装置
TW201537461A (zh) 用於使用者模式故障報告之架構
JP2014509012A5 (zh)
US20110197193A1 (en) Device and method for controlling communication between bios and bmc
US9836386B2 (en) Automatic switch to debugging mode
CN105045708A (zh) 软件运行错误处理方法及系统
TWI668567B (zh) 伺服器及自動檢修基板管理控制器的方法
US10169137B2 (en) Dynamically detecting and interrupting excessive execution time
WO2017045436A1 (zh) 虚拟机故障处理方法和装置
CN104598340A (zh) 硬件故障的检测系统、电子装置及方法
TW201428485A (zh) 處理程式異常的系統及方法
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
JP2016066139A (ja) 車両制御装置
CN104239208A (zh) 一种自动化执行期间异常恢复方法
JP5613570B2 (ja) バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム
JPWO2011051999A1 (ja) 情報処理装置及び情報処理装置の制御方法
WO2016078224A1 (zh) 一种信息处理方法、装置及计算机存储介质
JP6596287B2 (ja) プラント保全支援システム
US20190138074A1 (en) Power monitoring and reduction