CN102436404B - 一种进程守护方法 - Google Patents

一种进程守护方法 Download PDF

Info

Publication number
CN102436404B
CN102436404B CN 201110246854 CN201110246854A CN102436404B CN 102436404 B CN102436404 B CN 102436404B CN 201110246854 CN201110246854 CN 201110246854 CN 201110246854 A CN201110246854 A CN 201110246854A CN 102436404 B CN102436404 B CN 102436404B
Authority
CN
China
Prior art keywords
work
progress
thread
task
finger daemon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110246854
Other languages
English (en)
Other versions
CN102436404A (zh
Inventor
胡加明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong Construction Engineering Co ltd
Original Assignee
Suzhou Codyy Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Codyy Network Technology Co Ltd filed Critical Suzhou Codyy Network Technology Co Ltd
Priority to CN 201110246854 priority Critical patent/CN102436404B/zh
Publication of CN102436404A publication Critical patent/CN102436404A/zh
Application granted granted Critical
Publication of CN102436404B publication Critical patent/CN102436404B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种进程守护方法,包括以下步骤。守护进程实时监测工作进程的运行。当守护进程监测到工作进程停止执行任务时,守护进程分析工作进程停止执行任务的原因,并分析获得导致所述原因的线程。守护进程根据恢复策略分别处理工作进程中的问题线程以及正常线程。

Description

一种进程守护方法
技术领域
本发明属于网络技术领域,尤其涉及一种进程守护方法。
背景技术
目前,网站的运转极大程度上依赖于服务器的稳定运行。目前较多网站采用主从复制架构,且amoeba进程在主从复制架构中对数据读写分离起着重要作用。然而,amoeba进程于运行过程中存在停止运行的情况,从而很大程度影响网站的稳定性。
发明内容
本发明提供一种进程守护方法,以解决上述问题。
本发明提供一种进程守护方法,包括以下步骤。守护进程实时监测工作进程的运行。当守护进程监测到工作进程停止执行任务时,守护进程分析工作进程停止执行任务的原因,并分析获得导致所述原因的线程。守护进程根据恢复策略分别处理工作进程中的问题线程以及正常线程。其中,当工作进程停止执行任务的原因为工作进程的资源需求达到警戒值时,恢复策略为:守护进程重启工作进程中的正常线程,以执行未完成的任务,守护进程将问题线程执行的任务分配给其他工作进程中资源需求最低的工作进程执行,或者,恢复策略为:守护进程重启工作进程中的正常线程,以执行未完成的任务,守护进程根据工作进程的优先级将问题线程执行的任务分配给其他工作进程中优先级最低的工作进程执行。当工作进程停止执行任务的原因为业务需求问题时,恢复策略为:守护进程重启工作进程中的正常线程,以执行未完成的任务,守护进程调用其他正常进程中的线程执行问题线程执行的任务。
相较于先前技术,根据本发明提供的进程守护方法,守护进程监测工作进程,并分析获得导致工作进程中的问题线程,再根据恢复策略处理问题线程。如此,可以防止工作进程突然停止执行任务而造成损失,从而提高操作的稳定性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1所示为根据本发明的较佳实施例提供的进程守护方法的流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1所示为根据本发明的较佳实施例提供的进程守护方法的流程图。如图1所示,本发明较佳实施例提供的进程守护方法包括步骤101~103。
于步骤101,守护进程实时监测工作进程的运行。其中,工作进程指核心业务进程。于此,工作进程例如为mysql主从复制架构中的amoeba进程。然而,本发明并不限定于此。具体而言,守护进程实时监控工作进程是否正常执行任务。
于步骤102,当守护进程监测到工作进程停止执行任务时,守护进程分析工作进程停止执行任务的原因,并分析获得导致所述原因的线程。具体而言,一个工作进程可包括多个线程。当守护进程监测到工作进程停止执行任务时,守护进程会根据记录的工作进程的资源需求以及业务需求情况分析工作进程停止执行任务的原因。此外,当守护进程分析得到工作进程停止执行任务的原因后,守护进程会继续分析到底是工作进程中的哪个线程的运行产生问题而导致上述原因,从而获得工作进程中的问题线程。
于步骤103,守护进程根据恢复策略分别处理工作进程中的问题线程以及正常线程。
于本实施例中,当工作进程停止执行任务的原因为工作进程的资源需求达到警戒值时,恢复策略为:守护进程重启工作进程中的正常进程,以执行未完成的任务,守护进程将问题线程执行的任务分配给其他工作进程中资源需求最低的工作进程执行。其中,工作进程的资源需求例如指CPU占用率、内存占用率或磁盘空间占用率。然而,本发明并不限定于此。于实际应用中,可根据实际需要进行设置。
具体而言,以三个工作进程A~C,工作进程A包括三个线程a~c为例说明。其中,工作进程A的线程a的CPU占用率为50%,线程b和线程c的CPU占用率分别为5%。工作进程B的CPU占用率为6%,工作进程C的CPU占用率为4%,即工作进程C的资源需求小于工作进程B。当工作进程A的资源需求(例如,CPU占用率)达到警戒值(例如,60%)时,守护进程分析获得导致上述原因的线程为工作进程A的线程a。此时,恢复策略为:守护进程重启工作进程A中的正常线程b和c,以执行未完成的任务,守护进程将问题线程a执行的任务分配给工作进程C执行。其中,守护进程不会重启问题线程a。
此外,于另一较佳实施例中,当工作进程停止执行任务的原因为工作进程的资源需求达到警戒值时,恢复策略为:守护进程重启工作进程中的正常进程,以执行未完成的任务,守护进程根据工作进程的优先级将问题线程执行的任务分配给其他工作进程中优先级最低的工作进程执行。其中,工作进程的资源需求例如指CPU占用率、内存占用率或磁盘空间占用率。然而,本发明并不限定于此。于实际应用中,可根据实际需要进行设置。
具体而言,以三个工作进程A~C,工作进程A包括三个线程a~c为例说明。其中,工作进程A~C的优先级顺序为:工作进程A的优先级高于工作进程B,工作进程B的优先级高于工作进程C。而且,工作进程A的线程a的CPU占用率为50%,线程b和线程c的CPU占用率分别为5%。当工作进程A的资源需求(例如,CPU占用率)达到警戒值(例如,60%)时,守护进程分析获得导致上述原因的线程为工作进程A的线程a。此时,恢复策略为:守护进程重启工作进程A中的正常线程b和c,以执行未完成的任务,守护进程根据工作进程的优先级将问题线程a执行的任务分配给工作进程B和C中优先级较低的工作进程C执行。其中,守护进程不会重启问题线程a。
此外,于本实施例中,当工作进程停止执行任务的原因为业务需求问题时,恢复策略为:守护进程重启工作进程中的正常线程,以执行未完成的任务,守护进程调用其他正常进程中的线程执行问题线程执行的任务。其中,业务需求问题包括业务请求长时间未处理的问题。业务请求例如包括查询请求、删除请求、修改请求以及增加请求。然而,本发明对此不作任何限定。
具体而言,以四个工作进程A~D,工作进程A包括四个线程a1~a4,工作进程B包括三个线程b1~b3,工作进程C包括四个线程c1~c4,工作进程D包括三件d1~d3为例进行说明。其中,工作进程A的线程a1执行查询请求、线程a2执行删除请求,线程a3执行修改请求,线程a4执行增加请求。当工作进程A停止执行任务的原因为长时间未处理查询请求时,守护进程分析获得问题线程为工作进程A的线程a1。此时,恢复策略为:守护进程重启工作进程A中的正常线程a2~a4,以执行未完成的任务,守护进程调用正常进程(例如,工作进程B、C或D)中的空闲线程执行问题线程a1执行的查询任务。
以下举例说明上述正常进程中的空闲线程的选取方式。根据其他正常进程的资源需求(例如,CPU占用率)和警戒值(例如,60%)的比值设置正常进程的优先级。其中,CPU占用率和警戒值的比值越小优先级越高。此外,通过线程的CPU占用率判断线程的空闲程度,CPU占用率越低则线程越空闲。例如,工作进程B~D的CPU占用率和警戒值的比值从大到小的顺序为:工作进程D、工作进程C、工作进程B。据此,工作进程B~D的优先级从高到低的顺序为:工作进程B、工作进程C、工作进程D。另外,在工作进程B中线程的空闲程度从高到低的顺序为:线程b1、线程b2、线程b3。此时,根据恢复策略,守护进程调用工作进程B中的线程b1执行问题线程a1执行的查询任务。
综上所述,根据本发明较佳实施例提供的进程守护方法,守护进程监测工作进程,并分析获得导致工作进程中的问题线程,再根据恢复策略处理问题线程。如此,可以防止工作进程突然停止执行任务而造成损失,从而提高操作的稳定性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种进程守护方法,其特征在于,包括以下步骤:
守护进程实时监测工作进程的运行;
当所述守护进程监测到所述工作进程停止执行任务时,所述守护进程分析所述工作进程停止执行任务的原因,并分析获得导致所述原因的线程;
所述守护进程根据恢复策略分别处理所述工作进程中的问题线程以及正常线程,
其中,当所述工作进程停止执行任务的原因为工作进程的资源需求达到警戒值时,所述恢复策略为:所述守护进程重启所述工作进程中的正常线程,以执行未完成的任务,所述守护进程将问题线程执行的任务分配给其他工作进程中资源需求最低的工作进程执行,或者,所述恢复策略为:所述守护进程重启所述工作进程中的正常线程,以执行未完成的任务,所述守护进程根据工作进程的优先级将问题线程执行的任务分配给其他工作进程中优先级最低的工作进程执行,
当所述工作进程停止执行任务的原因为业务需求问题时,所述恢复策略为:所述守护进程重启所述工作进程中的正常线程,以执行未完成的任务,所述守护进程调用其他正常进程中的线程执行问题线程执行的任务。
2.根据权利要求1所述的进程守护方法,其特征在于,所述工作进程的资源需求指CPU占用率、内存占用率或磁盘空间占用率。
3.根据权利要求1所述的进程守护方法,其特征在于,所述业务需求问题指业务请求长时间未处理。
4.根据权利要求3所述的进程守护方法,其特征在于,所述业务请求包括查询请求、删除请求、修改请求以及增加请求。
CN 201110246854 2011-08-24 2011-08-24 一种进程守护方法 Active CN102436404B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110246854 CN102436404B (zh) 2011-08-24 2011-08-24 一种进程守护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110246854 CN102436404B (zh) 2011-08-24 2011-08-24 一种进程守护方法

Publications (2)

Publication Number Publication Date
CN102436404A CN102436404A (zh) 2012-05-02
CN102436404B true CN102436404B (zh) 2013-08-14

Family

ID=45984483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110246854 Active CN102436404B (zh) 2011-08-24 2011-08-24 一种进程守护方法

Country Status (1)

Country Link
CN (1) CN102436404B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461862B (zh) * 2014-10-23 2017-07-21 中标软件有限公司 数据处理系统以及线程崩溃后的资源恢复方法和装置
CN104484167B (zh) * 2014-12-05 2018-03-09 广州华多网络科技有限公司 任务处理方法及装置
CN104503828B (zh) * 2014-12-12 2018-12-11 广东欧珀移动通信有限公司 一种进程管理方法及终端
CN105791345B (zh) * 2014-12-22 2019-07-19 北京北方华创微电子装备有限公司 半导体工艺设备中服务端与工控机的通信系统
CN104850460A (zh) * 2015-06-02 2015-08-19 上海斐讯数据通信技术有限公司 一种服务程序线程管理方法
CN105787359B (zh) * 2016-02-19 2019-01-08 百度在线网络技术(北京)有限公司 进程守护方法和装置
CN107943657A (zh) * 2017-11-24 2018-04-20 郑州云海信息技术有限公司 一种Linux系统问题自动分析方法及系统
CN108334410A (zh) * 2018-01-26 2018-07-27 福建星瑞格软件有限公司 一种分布式应用程序客户端轻量化方法以及计算机设备
CN108549553B (zh) * 2018-03-29 2022-04-05 深圳市彬讯科技有限公司 一种基于三维模型云制作的3ds Max进程守护方法与装置
CN108776633B (zh) * 2018-05-22 2021-07-02 深圳壹账通智能科技有限公司 监控进程运行的方法、终端设备及计算机可读存储介质
CN112882793B (zh) * 2021-02-19 2023-03-24 杭州谐云科技有限公司 一种容器资源共享的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388061A (zh) * 2008-11-05 2009-03-18 山东中创软件工程股份有限公司 基于Windows系统远程线程监控的进程保护技术
CN101895540A (zh) * 2010-07-12 2010-11-24 中兴通讯股份有限公司 用于应用服务进程守护的系统和方法
CN102103676A (zh) * 2011-02-28 2011-06-22 南京邮电大学 一种基于进程间继承关系的爪哇程序进程守护方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7606892B2 (en) * 2003-04-22 2009-10-20 Hewlett-Packard Development Company, L.P. Method and system of supporting a computer network resource pool

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388061A (zh) * 2008-11-05 2009-03-18 山东中创软件工程股份有限公司 基于Windows系统远程线程监控的进程保护技术
CN101895540A (zh) * 2010-07-12 2010-11-24 中兴通讯股份有限公司 用于应用服务进程守护的系统和方法
CN102103676A (zh) * 2011-02-28 2011-06-22 南京邮电大学 一种基于进程间继承关系的爪哇程序进程守护方法

Also Published As

Publication number Publication date
CN102436404A (zh) 2012-05-02

Similar Documents

Publication Publication Date Title
CN102436404B (zh) 一种进程守护方法
EP2698711B1 (en) Method for dispatching central processing unit of hotspot domain virtual machine and virtual machine system
US8954971B2 (en) Data collecting method, data collecting apparatus and network management device
US8122158B1 (en) Method for improving I/O performance of host systems by applying future time interval policies when using external storage systems
CN106789141B (zh) 一种网关设备故障处理方法及装置
CN106407830B (zh) 一种基于云的数据库的检测方法和装置
US9495201B2 (en) Management of bottlenecks in database systems
CN108989238A (zh) 一种分配业务带宽的方法以及相关设备
WO2017052672A1 (en) Hierarchical index involving prioritization of data content of interest
US20100217933A1 (en) Allocation control program and allocation control device
JP2007004337A (ja) 自律運用管理システム、自律運用管理方法及びプログラム
TW201737111A (zh) 分散式儲存系統硬碟掛住故障檢測、處理方法及裝置
Ouyang et al. Reducing late-timing failure at scale: Straggler root-cause analysis in cloud datacenters
US9244719B2 (en) Batch processing system
JP2008152618A (ja) ジョブ割当プログラム、方法及び装置
CN107402863B (zh) 一种用于通过日志系统处理业务系统的日志的方法与设备
US9128754B2 (en) Resource starvation management in a computer system
US9135064B2 (en) Fine grained adaptive throttling of background processes
EP3916554B1 (en) A throughput-optimized, quality-of-service aware power capping system
CN113590285A (zh) 一种用于线程池参数动态设置的方法、系统及设备
CN107872480B (zh) 大数据集群数据平衡方法和装置
JP2013171542A (ja) 性能分析装置、性能分析方法及び性能分析プログラム
CN108924002B (zh) 一种性能数据文件的解析方法、装置、设备及存储介质
US20160006635A1 (en) Monitoring method and monitoring system
CN102737198A (zh) 对象保护方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Suzhou City, Jiangsu province 215121 Fengting Avenue Suzhou Industrial Park No. 666 Weiting Intelligent Industrial Park Building 8

Patentee after: Kuo Di education and science company limited

Address before: Suzhou City, Jiangsu province 215121 Fengting Avenue Suzhou Industrial Park No. 666 Weiting Intelligent Industrial Park Building 8

Patentee before: Suzhou Kuodi Network Technology Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201117

Address after: 226100 Guangzhou road Jiangsu city Nantong Province Haimen Economic and Technological Development Zone No. 999

Patentee after: Nantong Construction Engineering Co.,Ltd.

Address before: Suzhou City, Jiangsu province 215121 Fengting Avenue Suzhou Industrial Park No. 666 Weiting Intelligent Industrial Park Building 8

Patentee before: CODYY EDUCATION TECHNOLOGY Co.,Ltd.