CN104216795A - 一种多进程保护系统及其实现方法 - Google Patents

一种多进程保护系统及其实现方法 Download PDF

Info

Publication number
CN104216795A
CN104216795A CN201310219535.3A CN201310219535A CN104216795A CN 104216795 A CN104216795 A CN 104216795A CN 201310219535 A CN201310219535 A CN 201310219535A CN 104216795 A CN104216795 A CN 104216795A
Authority
CN
China
Prior art keywords
managing
module
supervisory
process module
protection system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310219535.3A
Other languages
English (en)
Inventor
王峰
陈绍东
马安岭
李勇伟
王飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai United Imaging Healthcare Co Ltd
Original Assignee
Shanghai United Imaging Healthcare Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai United Imaging Healthcare Co Ltd filed Critical Shanghai United Imaging Healthcare Co Ltd
Priority to CN201310219535.3A priority Critical patent/CN104216795A/zh
Publication of CN104216795A publication Critical patent/CN104216795A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种进程保护系统及其实现方法,所述系统包括若干个应用进程,还包括一个管理进程模块,与所述应用进程进行信息交互并监控所述应用进程的运行状态;和一个备用管理进程模块,与所述管理进程模块进行实时信息同步并监控所述管理进程模块的运行状态。本发明提供的一种多进程保护系统及其实现方法通过一个管理进程模块进行集中式的管理,其它应用进程均独立运行,并受管理进程模块监控,降低系统的资源消耗,提高系统的使用效率。

Description

一种多进程保护系统及其实现方法
技术领域
本发明涉及多进程计算机软件系统领域,尤其涉及一种多进程保护系统及其实现方法。
背景技术
进程保护是指计算机系统中某个进程出现异常不能继续工作时,不需要复位整个系统而能够重新启动该进程,避免出现进程意外终止而可能造成的计算机系统不稳定,尤其是一些关键进程出现异常情况而使用户在不知情等情况下造成难以预料的损失。
现有技术中,多进程保护系统主要有以下两种类型:第一、关键应用进程配有管理进程模块,对所述关键应用进程进行同步信息交互和实施监控,当关键应用进程出现异常,管理进程模块重新启动关键应用进程。该系统只对部分核心进程进行管理,当其它进程出现异常时,需要重新启动系统。第二、根据应用进程的类型进行划分,同一类型的应用进程统一由一个管理进程模块进行状态管理,监控同一类型下所有应用进程是否发生异常,若出现异常则重新启动该应用程序,不同类型的管理模块都配有各自对应的备用进程模块,备用管理进程模块和管理进程模块进行实时信息交互,并监控管理进程模块是否正常工作,若出现异常,则切换备用模块为管理进程模块,对该类型下的所有应用程序进行管理和监控。但该方法根据应用进程的类型设定多个管理进程和对应的备用进程,占用过多系统内存,不利于系统的高效运行。
发明内容
本发明所要解决的技术问题是提供一种多进程保护系统及其实现方法,用以解决现有进程保护系统中保护进程线程复杂,占有较多的系统资源,运行效率不高的问题。
为了解决上述问题,本发明提供了一种多进程保护系统,包括若干个应用进程,所述系统还包括:
一个管理进程模块,与所述应用进程进行信息交互并监控所述应用进程的运行状态;
和一个备用管理进程模块,与所述管理进程模块进行实时信息同步并监控所述管理进程模块的运行状态。
进一步地,若所述备用管理进程模块与所述管理进程模块通信中断,则备用管理进程模块替换所述管理进程模块。
进一步地,所述系统还包括守护进程模块,检测所述管理进程模块的运行状态。
为了解决上述技术问题,本发明还提供了一种多进程保护系统的实现方法,包括如下步骤:
管理进程获取保护进程列表,与应用进程进行信息交互并对所述应用进程进行实时监控;若管理进程与任意一个应用进程通信中断,则根据进程列表中对应进程的信息重新启动该应用进程;
备用进程与所述管理进程进行实时信息同步并监控所述管理进程的运行状态;若备用管理进程与所述管理进程通信中断,则备用管理进程替换所述管理进程。
进一步地,所述保护进程列表包括所述应用进程的进程号、进程名称和通信端口信息。
进一步地,所述方法还包括如下步骤:
守护进程实时监控所述管理进程的运行状态,守护进程与所述管理进程通信中断,则通知备用管理进程替换所述管理进程。
与现有技术相比,本发明具有以下优点:(1)集中式管理。整个系统中只有一个管理进程配有备用进程,其它应用进程均独立运行,并受管理进程监控,降低系统的资源消耗,提高系统的使用效率。(2)高效的保护。系统中所有的进程在出现异常停止工作,都能通过管理进程顺利的恢复而不需要重启整个系统。(3)管理进程采用主备机制,一旦出现问题,可以高效快速的切换到备用进程。
附图说明
图1所示为本发明一个实施例的多进程保护系统的结构示意图;
图2所示为本发明又一个实施例的多进程保护方法的流程示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,本发明利用示意图进行详细描述,在详述本发明实施例时,为便于说明,所述示意图只是实例,其在此不应限制本发明保护的范围。
本发明为解决上述技术问题提供了一种多进程保护系统,如图1本发明一个实施例的多进程保护系统的结构示意图所示,本实施例提供的多进程保护系统包括一个管理进程模块1、一个备用管理进程模块2和若干个应用进程3。所述管理进程模块1与所述应用进程3进行实时信息交互并监控所述应用进程的运行状态;所述备用管理进程模块2与所述管理进程模块1进行实时信息同步并监控所述管理进程模块1的运行状态;当所述备用管理进程模块2与所述管理进程模块1通信中断时(例如未检测到管理进程模块的心跳,两者中断信息交互),则备用管理进程模块2替换管理进程模块1,执行管理进程模块1的工作,实时与应用进程3进行信息交互并监控其运行状态(如图1虚线所示),管理进程模块1进行自我修复后执行备用管理进程模块2的工作。本系统还包括守护模块4,检测所述管理进程模块1的运行状态,当检测到管理进程模块1出现问题(例如没有心跳),立即通知备用管理进程模块2替换所述管理进程模块1,此时备用管理模块2仅需要与管理进程模块1进行信息同步的工作,减轻备用管理进程模块2的工作量。
本实施通过一个管理进程模块对所有应用进程进行集中式的管理,使得所有进程都能在一个安全的环境下运行,任意一个进程出现问题都能通过管理进程模块重新启动该进程而不需要重新启动系统,有效地节省了系统开销,保证系统的高效运行。
为了解决上述技术问题,本发明还提供了一种多进程保护方法,如图2本发明又一个实施例的多进程保护方法的流程示意图所示,所述方法包括如下步骤:
首先执行步骤S1,管理进程获取保护进程列表,所述保护进程列表包括所有应用进程的进程号、进程名称和通信端口信息等信息,与每个应用进程一一对应。然后执行步骤S2~S4,所述管理进程实时与所有应用进程进行信息交互并监控其运行状态,若管理进程与任意一个进程通信中断,则根据对应进程的信息重新启动该应用进程。具体地,当管理进程实时与应用进程进行信息交互时,获得实时的保护进程列表,若与保护列表中任意一个应用进程通信中断,即保护进程列表中没有该进程信息时,说明该进程出现异常情况,管理进程重新启动该进程,并在进程列表中随机分配新的进程信息,对该进程进行实时信息交互。
需要说明的是,所述管理进程配有一个备用管理进程与其进行实时信息同步并监控所述管理进程的运行状态,若备用管理进程与所述管理进程通信中断,则备用管理进程替换所述管理进程,执行管理进程的工作。此外,还可以配有一个守护进程,实时监控所述管理进程的运行状态,若守护进程与所述管理进程的通信中断,则通知备用管理进程替换所述管理进程,所述守护进程分担了备用进程对所述管理进程的监控的工作,减轻了备用进程的工作量。
本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。

Claims (6)

1.一种多进程保护系统,包括若干个应用进程,其特征在于,所述系统还包括
一个管理进程模块,与所述应用进程进行信息交互并监控所述应用进程的运行状态;
和一个备用管理进程模块,与所述管理进程模块进行实时信息同步并监控所述管理进程模块的运行状态。
2.如权利要求1所述的多进程保护系统,其特征在于,若所述备用管理进程模块与所述管理进程模块信息中断,则备用管理进程模块替换所述管理进程模块。
3.如权利要求1所述的多进程保护系统,其特征在于,所述系统还包括守护进程模块,检测所述管理进程模块的运行状态。
4.一种实现如权利要求1所述的多进程保护系统的方法,其特征在于,包括如下步骤:
管理进程获取保护进程列表,与应用进程进行信息交互并对所述应用进程进行实时监控;若管理进程与任意一个应用进程的通信中断,则根据进程列表中对应进程的信息重新启动该应用进程;
备用管理进程与所述管理进程进行实时信息同步并监控所述管理进程的运行状态;若备用管理进程与所述管理进程通信中断,则备用管理进程替换所述管理进程。
5.如权利要求4所述的多进程保护系统的方法,其特征在于,所述保护进程列表包括所述应用进程的进程号、进程名称和通信端口信息。
6.如权利要求4所述的多进程保护系统的方法,其特征在于,所述方法还包括如下步骤:
守护进程实时监控所述管理进程的运行状态,若守护进程与所述管理进程通信中断,则通知备用管理进程替换所述管理进程。
CN201310219535.3A 2013-06-04 2013-06-04 一种多进程保护系统及其实现方法 Pending CN104216795A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310219535.3A CN104216795A (zh) 2013-06-04 2013-06-04 一种多进程保护系统及其实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310219535.3A CN104216795A (zh) 2013-06-04 2013-06-04 一种多进程保护系统及其实现方法

Publications (1)

Publication Number Publication Date
CN104216795A true CN104216795A (zh) 2014-12-17

Family

ID=52098314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310219535.3A Pending CN104216795A (zh) 2013-06-04 2013-06-04 一种多进程保护系统及其实现方法

Country Status (1)

Country Link
CN (1) CN104216795A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915252A (zh) * 2015-06-15 2015-09-16 上海斐讯数据通信技术有限公司 一种进程端口管理装置及方法
CN105978746A (zh) * 2016-07-26 2016-09-28 北京沐星科技有限公司 游戏服务器集群系统及提高游戏空间服务方法
CN107526672A (zh) * 2016-06-21 2017-12-29 大唐移动通信设备有限公司 一种数据记录的方法及装置
CN108566424A (zh) * 2018-04-11 2018-09-21 深圳市腾讯网络信息技术有限公司 基于服务器资源消耗预测的调度方法、装置和系统
CN109426591A (zh) * 2017-09-04 2019-03-05 武汉斗鱼网络科技有限公司 守护windows单一程序的多个进程的方法及设备
CN109788068A (zh) * 2019-02-14 2019-05-21 腾讯科技(深圳)有限公司 心跳状态信息上报方法、装置和设备及计算机存储介质
CN114385329A (zh) * 2021-12-06 2022-04-22 深圳市亚略特科技股份有限公司 进程管理方法、装置、电子装置及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060048000A1 (en) * 2004-08-25 2006-03-02 Evolium S.A.S. Process management system
CN101256506A (zh) * 2008-03-20 2008-09-03 金魁 计算机网络应用程序管理系统
CN101399850A (zh) * 2008-10-15 2009-04-01 中兴通讯股份有限公司 一种控制应用服务器进程的方法及其系统
CN101477474A (zh) * 2009-01-04 2009-07-08 中国科学院计算技术研究所 一种联合模拟系统及其工作方法
CN102135929A (zh) * 2010-01-21 2011-07-27 腾讯科技(深圳)有限公司 一种分布式容错服务系统
CN103117923A (zh) * 2013-01-18 2013-05-22 杭州华三通信技术有限公司 一种进程管理方法和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060048000A1 (en) * 2004-08-25 2006-03-02 Evolium S.A.S. Process management system
CN101256506A (zh) * 2008-03-20 2008-09-03 金魁 计算机网络应用程序管理系统
CN101399850A (zh) * 2008-10-15 2009-04-01 中兴通讯股份有限公司 一种控制应用服务器进程的方法及其系统
CN101477474A (zh) * 2009-01-04 2009-07-08 中国科学院计算技术研究所 一种联合模拟系统及其工作方法
CN102135929A (zh) * 2010-01-21 2011-07-27 腾讯科技(深圳)有限公司 一种分布式容错服务系统
CN103117923A (zh) * 2013-01-18 2013-05-22 杭州华三通信技术有限公司 一种进程管理方法和设备

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915252A (zh) * 2015-06-15 2015-09-16 上海斐讯数据通信技术有限公司 一种进程端口管理装置及方法
CN104915252B (zh) * 2015-06-15 2018-04-06 上海斐讯数据通信技术有限公司 一种进程端口管理装置及方法
CN107526672A (zh) * 2016-06-21 2017-12-29 大唐移动通信设备有限公司 一种数据记录的方法及装置
CN105978746A (zh) * 2016-07-26 2016-09-28 北京沐星科技有限公司 游戏服务器集群系统及提高游戏空间服务方法
CN105978746B (zh) * 2016-07-26 2019-02-01 北京沐星科技有限公司 游戏服务器集群系统及提高游戏空间服务方法
CN109426591A (zh) * 2017-09-04 2019-03-05 武汉斗鱼网络科技有限公司 守护windows单一程序的多个进程的方法及设备
CN109426591B (zh) * 2017-09-04 2021-01-01 武汉斗鱼网络科技有限公司 守护windows单一程序的多个进程的方法及设备
CN108566424A (zh) * 2018-04-11 2018-09-21 深圳市腾讯网络信息技术有限公司 基于服务器资源消耗预测的调度方法、装置和系统
CN108566424B (zh) * 2018-04-11 2021-04-20 深圳市腾讯网络信息技术有限公司 基于服务器资源消耗预测的调度方法、装置和系统
CN109788068A (zh) * 2019-02-14 2019-05-21 腾讯科技(深圳)有限公司 心跳状态信息上报方法、装置和设备及计算机存储介质
CN109788068B (zh) * 2019-02-14 2020-11-03 腾讯科技(深圳)有限公司 心跳状态信息上报方法、装置和设备及计算机存储介质
CN114385329A (zh) * 2021-12-06 2022-04-22 深圳市亚略特科技股份有限公司 进程管理方法、装置、电子装置及可读存储介质

Similar Documents

Publication Publication Date Title
CN104216795A (zh) 一种多进程保护系统及其实现方法
US10095576B2 (en) Anomaly recovery method for virtual machine in distributed environment
US9141491B2 (en) Highly available server system based on cloud computing
CN102761439B (zh) Pon接入系统中基于看门狗的异常检测记录装置及方法
CN101996106B (zh) 一种对软件运行状态进行监控的方法
CN101895540B (zh) 用于应用服务进程守护的系统和方法
US10545807B2 (en) Method and system for acquiring parameter sets at a preset time interval and matching parameters to obtain a fault scenario type
CN102394774B (zh) 一种云计算操作系统的控制器服务状态监控和故障恢复方法
CN105302661A (zh) 一种实现虚拟化管理平台高可用的系统和方法
JP2004030363A (ja) 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム
CN103607297A (zh) 一种计算机集群系统的故障处理方法
US20020120884A1 (en) Multi-computer fault detection system
CN105554074A (zh) 一种基于rpc通信的nas资源监控系统及监控方法
US11662803B2 (en) Control method, apparatus, and electronic device
CN105589756A (zh) 批处理集群系统以及方法
US10317985B2 (en) Shutdown of computing devices
CN107729213B (zh) 一种后台任务监控方法及装置
EP4242842A1 (en) Thread priority adjusting method, terminal, and computer readable storage medium
CN111538585A (zh) 一种基于node.js的服务器进程调度方法、系统和装置
CN104679710A (zh) 一种面向半导体生产线搬运系统软件故障快速恢复方法
WO2015188619A1 (zh) 物理主机故障检测方法、装置及虚机管理方法、系统
CN110209497B (zh) 一种主机资源动态扩缩容的方法及系统
US10157110B2 (en) Distributed system, server computer, distributed management server, and failure prevention method
JP2011243012A (ja) 仮想計算機システムのメモリダンプ取得方法
CN102231124A (zh) 一种嵌入式系统任务的守护方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141217