CN102200941A - 进程状态监控方法及单元 - Google Patents

进程状态监控方法及单元 Download PDF

Info

Publication number
CN102200941A
CN102200941A CN2010101344111A CN201010134411A CN102200941A CN 102200941 A CN102200941 A CN 102200941A CN 2010101344111 A CN2010101344111 A CN 2010101344111A CN 201010134411 A CN201010134411 A CN 201010134411A CN 102200941 A CN102200941 A CN 102200941A
Authority
CN
China
Prior art keywords
status file
status
file
information
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101344111A
Other languages
English (en)
Inventor
李方宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN2010101344111A priority Critical patent/CN102200941A/zh
Publication of CN102200941A publication Critical patent/CN102200941A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了进程状态监控方法及单元。预先设定每个被监控进程的每个实例对应一个状态文件,且所有状态文件互不重叠;方法包括:一个被监控进程的一个实例启动,该实例在自身的状态文件上加互斥锁,并将自身从启动到停止过程中的各个状态信息写入该状态文件中;监控进程从所述被监控进程的所述实例的状态文件中读取状态信息。本发明提高了进程状态监控的准确性、稳定性和通用性。

Description

进程状态监控方法及单元
技术领域
本发明涉及计算机应用技术领域,具体涉及进程监控方法及单元。
背景技术
进程是计算机应用软件运行的一个实例,对进程状态的监控和管理是计算机软件管理的一个重要范畴。一个好的应用程序,尤其是对外提供服务的应用程序,必须能够将其内部运行状态实时反馈给外部系统,供外界对其进行监控、管理和维护。一旦进程运行出现问题,外界能够及时获知,并进而采取相应的对策如:重新启动进程等。
对进程状态监控的准确性,直接影响到应用软件的可用性。现有对进程进行监控的方法主要有两种:
第一种:通过操作系统提供的应用程序接口(API,ApplicationProgramming Interface)对操作系统中运行的进程进行监控。各种不同的操作系统都提供了系统监控的API,能够监控到系统中正在运行的各个进程状态,此方式能实时得到进程的中央处理单元(CPU,Central Processing Unit)利用率、内存占用率等通用信息。
第二种:进程通过打开特定的套接字(Socket)端口,与外部程序通信并进行数据交互,将进程的内部状态信息反馈给外部程序。
第一种方案存在以下缺点:
一、监控数据不完整:通过操作系统提供的API只能获知进程是否正在运行,并得到CPU、内存等通用信息,无法获知进程更具体的内部状态信息,例如:一个服务进程在开始启动到能够正常提供服务有一个时间间隔,此时进程的状态应该是“正在启动”,而不是通过操作系统的API获知的“已经启动并能提供服务”。
二、跨平台能力较低:对不同的操作系统需要使用不同的API进行监控,使得监控软件的跨平台能力降低。
三、无法对多实例进程的各个实例进行区分:同一个操作系统中如果同时启动同一个应用程序的多个实例,操作系统无法区分具体需要监控哪个实例。对基于Java虚拟机的服务进程进行监控时该问题尤其突出,系统中所有使用Java虚拟机的程序使用操作系统提供的API取到的进程名都是“java”,无法区分哪个进程是需要监控的进程。
第二种方案存在以下缺点:
一、可能出现监控冲突:Socket端口是操作系统中的一类重要资源,不同的进程不能绑定相同的端口以提供服务,因此应用程序启动时,如果监控端口已经被其它进程占用了,就会产生监控失败的问题。
二、Socket资源对操作系统依赖过高:当操作系统发生问题时,Socket端口可能会误认为被监控进程已经停止,从而不继续提供监控服务,此时监控操作将会失败。
在进程的监控过程中,一旦由于外部原因导致获取的监控数据出现问题,就可能导致外部监控程序对被监控进程执行误操作如:将正常运行的进程重启等,此类误操作导致的后果往往很严重。因此,亟需一种稳定、简单、通用的进程状态监控方法。
发明内容
本发明提供进程状态监控方法及单元,以提高监控进程状态的准确性、稳定性和通用性。
本发明的技术方案是这样实现的:
一种进程状态监控方法,预先设定每个被监控进程的每个实例对应一个状态文件,且所有状态文件互不重叠,该方法包括:
一个被监控进程的一个实例启动,该实例在自身的状态文件上加互斥锁,并将自身从启动到停止过程中的各个状态信息写入该状态文件中;
监控进程从所述被监控进程的所述实例的状态文件中读取状态信息。
所述状态信息为:正在启动、已经启动、正在停止或已经停止。
所述监控进程从所述被监控进程的所述实例的状态文件中读取状态信息之前进一步包括:
监控进程定时查询所述被监控进程的所述实例的状态文件,判断是否该状态文件不存在或者未加锁,若是,则确定所述实例未启动或已停止;否则,执行所述从所述被监控进程的所述实例的状态文件中读取状态信息的动作。
当监控进程发现所述被监控进程的所述实例的状态文件加锁时,
所述方法进一步包括:监控进程发现所述状态文件中的状态信息在预设时长内未被更新,则执行实例异常操作。
所述该实例在自身的状态文件上加互斥锁之后进一步包括:
该实例定时将自身的资源占用信息写入自身的状态文件中;
且,监控进程定时从所述实例的状态文件中读取资源占用信息;
或者,该实例在自身发生运行错误现象时,将错误信息写入自身的状态文件中;
且,监控进程定时从所述实例的状态文件中读取错误信息。
所述方法进一步包括:
监控进程在需要对一个被监控进程的一个实例进行管理时,将管理指令写入该实例的状态文件中,该实例读取该指令,根据该指令执行相应操作。
所述预先设定每个被监控进程的每个实例对应一个状态文件包括:
监控进程或预先设定的状态文件分配进程为每个被监控进程的每个实例分配一个状态文件;
或者,
预先设定状态文件分配规则,以便每个被监控进程的每个实例根据该规则确定本实例对应的状态文件。
一种进程状态监控单元,包括:
状态文件信息获取模块:获取并记录每个被监控进程的每个实例对应的状态文件信息,其中,所有状态文件互不重叠;
监控模块:根据状态文件信息获取模块记录的每个被监控进程的每个实例的状态文件信息,定时轮询各被监控进程的各实例的状态文件,若发现一个实例的状态文件被加互斥锁,则从该状态文件中读取该实例写入的状态信息。
该单元进一步包括:
状态文件分配模块:为每个被监控进程的每个实例分配一个状态文件,且所有状态文件互不重叠,并将为每个被监控进程的每个实例分配的状态文件信息发送给状态文件信息获取模块。
所述监控模块进一步包括:用于当发现一个被加互斥锁的状态文件中的状态信息在预设时长内未被更新时,执行实例异常操作的子模块。
所述监控模块进一步包括:用于当发现一个状态文件被加互斥锁后,定时从该状态文件中读取实例写入的资源占用信息或错误信息的子模块。
该单元进一步包括:
管理模块:当需要对一个被监控进程的一个实例进行管理时,将管理指令写入该实例的状态文件中。
与现有技术相比,本发明中,每个被监控进程的每个实例对应一个状态文件,且所有状态文件互不重叠,当一个被监控进程的一个实例启动时,对其状态文件加互斥锁,并将从启动到停止过程中的各状态信息写入状态文件中,监控进程从该状态文件中读取该状态信息,使得被监控进程在自身状态发生改变时,可以实时将改变后的状态信息写入状态文件中,从而使得监控进程能够准确得知每个被监控进程的每个实例的各个状态,同时,本发明只使用文件即可,不依赖于API或Socket端口,对各种操作系统都适用,且很稳定。
附图说明
图1为本发明实施例提供的进程状态监控方法流程图;
图2为本发明实施例提供的进程状态监控单元的组成图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
图1为本发明实施例提供的进程状态监控方法流程图,如图1所示,其具体步骤如下:
步骤100:为每个被监控进程的每个实例分配一个状态文件,且所有状态文件互不重叠,监控进程记录各被监控进程ID+实例ID与状态文件ID的对应关系,被监控进程记录自身的各实例ID与状态文件ID的对应关系。
这里,状态文件ID可以为:文件的存储路径+文件名。
可由监控进程或一个专门的状态文件分配进程来为每个被监控进程的每个实例分配状态文件,将为所有被监控进程的所有实例分配的状态文件信息如:被监控进程ID+实例ID+状态文件ID存入监控进程和被监控进程都可访问的存储区域中。一个被监控进程的一个实例一开始启动,首先从该存储区域读取自身的状态文件信息如:根据被监控进程ID+实例ID读取到状态文件ID;而监控进程则可从该存储区域中读取到所有被监控进程的所有实例的状态文件信息。
或者,也可预先确定一个状态文件分配规则,例如:所有被监控进程的状态文件的存储路径相同,都为一个指定的存储路径,而每个被监控进程的每个实例的状态文件的文件名即为被监控进程ID+实例ID,监控进程和被监控进程都预先记录该规则。当步骤101中任一被监控进程的一个实例开始启动时,首先根据该状态文件分配规则得出自身的状态文件信息如:状态文件存储路径+文件名,再执行后续操作;而监控进程则可根据该规则,得到所有被监控进程的所有实例的状态文件信息。
若被监控进程只有一个实例,则只为该被监控进程分配一个状态文件即可,此时,监控进程只需记录该被监控进程ID与其状态文件ID的对应关系,被监控进程只需记录其状态文件ID。
步骤101:被监控进程的一个实例启动,对自身状态文件的部分区域如:头2个字节加上互斥锁。
这里,被监控进程的一个实例启动后,若根据记录的自身的状态文件ID,发现监控进程为自身分配的状态文件还未存在,则根据该状态文件ID如:文件的存储路径+文件名,创建状态文件。
同一操作系统下,同一时刻只允许一个进程的一个实例对特定文件的特定区域加锁。
步骤102:被监控进程的该实例将自身从启动到停止过程中的各个状态信息写入状态文件中。
被监控进程的实例从启动到停止过程中的各个状态包括:正在启动、已经启动、正在停止、已经停止等。
这里,可预先设定状态文件中加锁区域之后的某块区域为状态信息区域,被监控进程的实例将自身状态信息写入该区域。
还可在状态文件中设置CPU、内存等资源的占用信息区域,被监控进程的实例可定时如:每隔10秒将自身的CPU、内存等资源的占用信息以及当前的时间戳写入状态文件的对应区域中。
还可在状态文件中设置错误信息区域,如果被监控进程的当前实例在运行过程中出错如:数据库等外部资源突然不可用,则被监控进程的当前实例可将错误信息写入该区域。
步骤103:监控进程定时轮询各被监控进程的各实例的状态文件,对于每个被监控进程的每个实例执行步骤104~106:
步骤104:监控进程判断是否该被监控进程的该实例的状态文件不存在或者状态文件未加互斥锁,若是,执行步骤105;否则,执行步骤106。
步骤105:监控进程认为该被监控进程的该实例未启动或已停止,本流程结束。
步骤106:监控进程从该被监控进程的该实例的状态文件读取状态信息。
监控进程可根据读取的状态信息采取相应的操作。例如:如果发现正在运行的一个被监控进程的一个实例突然异常停止,则应该立即记录日志,并重新启动该被监控进程的该实例。
监控进程还可从该实例的状态文件中读取资源占用信息、错误信息等。
步骤107:被监控进程的一个实例退出,其状态文件的互斥锁被释放。
这里,状态文件的互斥锁可由被监控进程的实例释放,也可由操作系统在发现被监控进程的实例退出时释放。
另外,本发明实施例中,监控进程在发现一个被监控进程的一个实例状态文件存在且已被加锁后,若发现该状态文件中的状态信息在预设时长如:5分钟内未被更新,则认为该被监控进程的该实例出现异常,无法提供服务,如:实例挂死。此时监控进程可采取实例异常操作如:记录日志、重新启动该被监控进程的实例等。
另外,本发明实施例中,还可在状态文件中设置管理字段,监控进程在需要对被监控进程的一个实例进行管理时,可将管理指令写入该区域,被监控进程的实例定时从该区域中读取指令,若读取到,则根据该指令执行相应操作。
由于同一操作系统下,同一时刻只允许一个进程的一个实例对特定文件的特定区段加锁,且一旦该实例退出,该锁必然释放,本发明实施例中,被监控进程的实例启动后,对其状态文件加互斥锁,这样,监控进程就能够根据状态文件是否存在和是否已加互斥锁,准确判断出被监控进程的实例是否正常运行,不会出现误报。
另外,在一个操作系统下,相对于Socket资源来说,文件系统的资源几乎是无穷尽的,本发明实施例中,为不同被监控进程的不同实例分配不同的状态文件,每个被监控进程的每个实例将其状态信息写入其状态文件中,这样,就能够确保不同被监控进程的不同实例使用不同的状态文件,而不会产生冲突,从而可实现对多实例进程的各个实例的监控。
另外,文件系统对操作系统的依赖性较Socket资源要小得多,因此采用本发明实施例,监控进程状态将更加稳定、可靠。
此外,本发明实施例中,监控进程还可将管理指令写入被监控进程的实例的状态文件中,从而在监控进程的同时,还可对进程进行管理。
为了提高效率和资源占用率,本发明实施例中,被监控进程和监控进程可使用文件-内存映像的方式访问状态文件,无需显式地对文件进行读、写操作。目前常用的操作系统如:Windows、Linux、Unix、Mac OS等均支持文件-内存映射访问方式。
图2为本发明实施例提供的进程状态监控单元的组成图,如图2所示,其主要包括:状态文件信息获取模块21和监控模块22,其中:
状态文件信息获取模块21:获取每个被监控进程的每个实例对应的状态文件信息,根据获取的信息记录被监控进程ID+实例ID与状态文件ID的对应关系,其中,所有状态文件互不重叠。
监控模块22:根据状态文件信息获取模块21记录的被监控进程ID+实例ID与状态文件ID的对应关系,定时轮询各被监控进程的各实例的状态文件,若发现一个实例的状态文件被加互斥锁,则从该状态文件中读取该实例写入的状态信息。
图2所示的进程状态监控单元还可包括:状态文件分配模块,用于为每个被监控进程的每个实例分配一个状态文件,且所有状态文件互不重叠,并将为每个被监控进程的每个实例分配的状态文件信息发送给状态文件信息获取模块21。
监控模块22还可包括:用于当发现一个被加互斥锁的状态文件中的状态信息在预设时长内未被更新时,执行实例异常操作的子模块。
监控模块22还可包括:用于当发现一个状态文件被加互斥锁后,定时从该状态文件中读取实例写入的资源占用信息或错误信息的子模块。
图2所示的进程状态监控单元还可包括:管理模块,用于当需要对一个被监控进程的一个实例进行管理时,将管理指令写入该实例的状态文件中,以便该实例从该状态文件中读取该指令,并执行相应操作。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种进程状态监控方法,其特征在于,预先设定每个被监控进程的每个实例对应一个状态文件,且所有状态文件互不重叠,该方法包括:
一个被监控进程的一个实例启动,该实例在自身的状态文件上加互斥锁,并将自身从启动到停止过程中的各个状态信息写入该状态文件中;
监控进程从所述被监控进程的所述实例的状态文件中读取状态信息。
2.如权利要求1所述的方法,其特征在于,所述状态信息为:正在启动、已经启动、正在停止或已经停止。
3.如权利要求1或2所述的方法,其特征在于,所述监控进程从所述被监控进程的所述实例的状态文件中读取状态信息之前进一步包括:
监控进程定时查询所述被监控进程的所述实例的状态文件,判断是否该状态文件不存在或者未加锁,若是,则确定所述实例未启动或已停止;否则,执行所述从所述被监控进程的所述实例的状态文件中读取状态信息的动作。
4.如权利要求3所述的方法,其特征在于,当监控进程发现所述被监控进程的所述实例的状态文件加锁时,
所述方法进一步包括:监控进程发现所述状态文件中的状态信息在预设时长内未被更新,则执行实例异常操作。
5.如权利要求1或2所述的方法,其特征在于,所述该实例在自身的状态文件上加互斥锁之后进一步包括:
该实例定时将自身的资源占用信息写入自身的状态文件中;
且,监控进程定时从所述实例的状态文件中读取资源占用信息;
或者,该实例在自身发生运行错误现象时,将错误信息写入自身的状态文件中;
且,监控进程定时从所述实例的状态文件中读取错误信息。
6.如权利要求1或2所述的方法,其特征在于,所述方法进一步包括:
监控进程在需要对一个被监控进程的一个实例进行管理时,将管理指令写入该实例的状态文件中,该实例读取该指令,根据该指令执行相应操作。
7.如权利要求1或2所述的方法,其特征在于,所述预先设定每个被监控进程的每个实例对应一个状态文件包括:
监控进程或预先设定的状态文件分配进程为每个被监控进程的每个实例分配一个状态文件;
或者,
预先设定状态文件分配规则,以便每个被监控进程的每个实例根据该规则确定本实例对应的状态文件。
8.一种进程状态监控单元,其特征在于,包括:
状态文件信息获取模块:获取并记录每个被监控进程的每个实例对应的状态文件信息,其中,所有状态文件互不重叠;
监控模块:根据状态文件信息获取模块记录的每个被监控进程的每个实例的状态文件信息,定时轮询各被监控进程的各实例的状态文件,若发现一个实例的状态文件被加互斥锁,则从该状态文件中读取该实例写入的状态信息。
9.如权利要求8所述的单元,其特征在于,该单元进一步包括:
状态文件分配模块:为每个被监控进程的每个实例分配一个状态文件,且所有状态文件互不重叠,并将为每个被监控进程的每个实例分配的状态文件信息发送给状态文件信息获取模块。
10.如权利要求8或9所述的单元,其特征在于,所述监控模块进一步包括:用于当发现一个被加互斥锁的状态文件中的状态信息在预设时长内未被更新时,执行实例异常操作的子模块。
11.如权利要求8或9所述的单元,其特征在于,所述监控模块进一步包括:用于当发现一个状态文件被加互斥锁后,定时从该状态文件中读取实例写入的资源占用信息或错误信息的子模块。
12.如权利要求8或9所述的单元,其特征在于,该单元进一步包括:
管理模块:当需要对一个被监控进程的一个实例进行管理时,将管理指令写入该实例的状态文件中。
CN2010101344111A 2010-03-25 2010-03-25 进程状态监控方法及单元 Pending CN102200941A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101344111A CN102200941A (zh) 2010-03-25 2010-03-25 进程状态监控方法及单元

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101344111A CN102200941A (zh) 2010-03-25 2010-03-25 进程状态监控方法及单元

Publications (1)

Publication Number Publication Date
CN102200941A true CN102200941A (zh) 2011-09-28

Family

ID=44661631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101344111A Pending CN102200941A (zh) 2010-03-25 2010-03-25 进程状态监控方法及单元

Country Status (1)

Country Link
CN (1) CN102200941A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246566A (zh) * 2012-02-03 2013-08-14 腾讯科技(深圳)有限公司 应用程序的资源监控方法及装置
CN103701651A (zh) * 2013-12-31 2014-04-02 山东中创软件工程股份有限公司 一种国产环境下应用服务容灾装置和方法
CN103823710A (zh) * 2014-03-06 2014-05-28 北京京东尚科信息技术有限公司 一种在Windows系统中对Java虚拟机进程的管理方法及系统
CN104484224A (zh) * 2014-12-18 2015-04-01 北京奇虎科技有限公司 一种服务器进程控制方法、装置及系统
CN104601546A (zh) * 2014-12-22 2015-05-06 深圳市鼎泰富科技有限公司 一种利用设备通信资源提高网络带宽的系统及方法
CN106844002A (zh) * 2016-12-23 2017-06-13 中国科学院信息工程研究所 一种基于虚拟化技术的云平台客户机系统可用性提升方法
CN106909599A (zh) * 2016-07-04 2017-06-30 阿里巴巴集团控股有限公司 一种集群系统、消息处理方法及装置
CN107729167A (zh) * 2016-08-10 2018-02-23 腾讯科技(深圳)有限公司 应用异常处理方法和装置
CN107741894A (zh) * 2016-11-25 2018-02-27 腾讯科技(深圳)有限公司 一种应用进程的监控方法和装置
CN108280012A (zh) * 2018-01-25 2018-07-13 郑州云海信息技术有限公司 一种监控服务器系统进程的方法及装置
CN109446034A (zh) * 2018-10-11 2019-03-08 广州酷狗计算机科技有限公司 上报崩溃事件的方法、装置、计算机设备及存储介质
CN109491720A (zh) * 2018-10-09 2019-03-19 深圳市网心科技有限公司 进程启动方法、电子设备、系统及存储介质
CN109725950A (zh) * 2018-12-29 2019-05-07 武汉斗鱼网络科技有限公司 一种实现客户端单实例运行的方法、装置及存储介质
CN110032487A (zh) * 2018-11-09 2019-07-19 阿里巴巴集团控股有限公司 保活监控方法、装置及电子设备
CN110928686A (zh) * 2019-11-21 2020-03-27 苏州交驰人工智能研究院有限公司 一种超算平台资源使用监控方法
CN111381965A (zh) * 2020-03-03 2020-07-07 百度在线网络技术(北京)有限公司 用于处理请求的方法和装置
CN112181544A (zh) * 2020-11-27 2021-01-05 深圳开源互联网安全技术有限公司 Java应用的运行方法、系统、装置及计算机可读存储介质
CN112579385A (zh) * 2019-09-29 2021-03-30 中国石油天然气集团有限公司 一种服务器文件监控方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078123A (ja) * 2003-08-29 2005-03-24 Nippon Telegr & Teleph Corp <Ntt> 故障検出装置および故障検出方法ならびにそのプログラム
CN1756406A (zh) * 2004-09-30 2006-04-05 华为技术有限公司 一种手持设备的监控方法及故障定位方法
JP2007304837A (ja) * 2006-05-11 2007-11-22 Nec Fielding Ltd 情報処理装置及び監視方法並びにプログラム
CN101674465A (zh) * 2009-10-28 2010-03-17 广东威创视讯科技股份有限公司 一种视频多任务监控处理方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078123A (ja) * 2003-08-29 2005-03-24 Nippon Telegr & Teleph Corp <Ntt> 故障検出装置および故障検出方法ならびにそのプログラム
CN1756406A (zh) * 2004-09-30 2006-04-05 华为技术有限公司 一种手持设备的监控方法及故障定位方法
JP2007304837A (ja) * 2006-05-11 2007-11-22 Nec Fielding Ltd 情報処理装置及び監視方法並びにプログラム
CN101674465A (zh) * 2009-10-28 2010-03-17 广东威创视讯科技股份有限公司 一种视频多任务监控处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
史蒂文斯等: "《UNIX环境高级编程第2版》", 31 May 2006, article "《守护进程》", pages: 346-353 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246566A (zh) * 2012-02-03 2013-08-14 腾讯科技(深圳)有限公司 应用程序的资源监控方法及装置
CN103246566B (zh) * 2012-02-03 2017-12-01 腾讯科技(深圳)有限公司 应用程序的资源监控方法及装置
CN103701651A (zh) * 2013-12-31 2014-04-02 山东中创软件工程股份有限公司 一种国产环境下应用服务容灾装置和方法
CN103701651B (zh) * 2013-12-31 2017-01-04 山东中创软件工程股份有限公司 一种国产环境下应用服务容灾装置和方法
CN103823710A (zh) * 2014-03-06 2014-05-28 北京京东尚科信息技术有限公司 一种在Windows系统中对Java虚拟机进程的管理方法及系统
CN103823710B (zh) * 2014-03-06 2017-04-12 北京京东尚科信息技术有限公司 一种在Windows系统中对Java虚拟机进程的管理方法及系统
CN104484224A (zh) * 2014-12-18 2015-04-01 北京奇虎科技有限公司 一种服务器进程控制方法、装置及系统
CN104601546A (zh) * 2014-12-22 2015-05-06 深圳市鼎泰富科技有限公司 一种利用设备通信资源提高网络带宽的系统及方法
CN104601546B (zh) * 2014-12-22 2017-12-01 深圳市鼎泰富科技有限公司 一种利用设备通信资源提高网络带宽的系统及方法
CN106909599A (zh) * 2016-07-04 2017-06-30 阿里巴巴集团控股有限公司 一种集群系统、消息处理方法及装置
CN107729167B (zh) * 2016-08-10 2020-09-11 腾讯科技(深圳)有限公司 应用异常处理方法和装置
CN107729167A (zh) * 2016-08-10 2018-02-23 腾讯科技(深圳)有限公司 应用异常处理方法和装置
CN107741894A (zh) * 2016-11-25 2018-02-27 腾讯科技(深圳)有限公司 一种应用进程的监控方法和装置
CN106844002A (zh) * 2016-12-23 2017-06-13 中国科学院信息工程研究所 一种基于虚拟化技术的云平台客户机系统可用性提升方法
CN108280012A (zh) * 2018-01-25 2018-07-13 郑州云海信息技术有限公司 一种监控服务器系统进程的方法及装置
CN109491720A (zh) * 2018-10-09 2019-03-19 深圳市网心科技有限公司 进程启动方法、电子设备、系统及存储介质
CN109446034A (zh) * 2018-10-11 2019-03-08 广州酷狗计算机科技有限公司 上报崩溃事件的方法、装置、计算机设备及存储介质
CN109446034B (zh) * 2018-10-11 2022-02-18 广州酷狗计算机科技有限公司 上报崩溃事件的方法、装置、计算机设备及存储介质
CN110032487A (zh) * 2018-11-09 2019-07-19 阿里巴巴集团控股有限公司 保活监控方法、装置及电子设备
CN109725950A (zh) * 2018-12-29 2019-05-07 武汉斗鱼网络科技有限公司 一种实现客户端单实例运行的方法、装置及存储介质
CN112579385A (zh) * 2019-09-29 2021-03-30 中国石油天然气集团有限公司 一种服务器文件监控方法及装置
CN110928686A (zh) * 2019-11-21 2020-03-27 苏州交驰人工智能研究院有限公司 一种超算平台资源使用监控方法
CN111381965A (zh) * 2020-03-03 2020-07-07 百度在线网络技术(北京)有限公司 用于处理请求的方法和装置
CN111381965B (zh) * 2020-03-03 2023-01-31 百度在线网络技术(北京)有限公司 用于处理请求的方法和装置
CN112181544A (zh) * 2020-11-27 2021-01-05 深圳开源互联网安全技术有限公司 Java应用的运行方法、系统、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN102200941A (zh) 进程状态监控方法及单元
CN102981931B (zh) 虚拟机备份方法及装置
CN111338854B (zh) 基于Kubernetes集群快速恢复数据的方法及系统
US8694820B2 (en) Failure recovery method
US7698602B2 (en) Systems, methods and computer products for trace capability per work unit
KR100974156B1 (ko) 파일 서버 재초기화 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
CN109656742B (zh) 一种节点异常处理方法、装置及存储介质
JP2004246892A (ja) マルチノード分散データ処理システムにおいてリモート・アクセス可能なリソースを管理する方法
US9563478B1 (en) Scalable concurrent execution of distributed workflows sharing common operations
CN104951395A (zh) 一种嵌入式系统调试信息处理方法及装置
CN103425645A (zh) 数据库集群单点故障的监控系统及方法
WO2020015116A1 (zh) 数据库监控方法及终端设备
US20210165767A1 (en) Barriers for Dependent Operations among Sharded Data Stores
CN105357042A (zh) 一种高可用集群系统及其主节点和从节点
CN104793981A (zh) 一种虚拟机集群的在线快照管理方法及装置
CN113342554B (zh) Io多路复用方法、介质、设备和操作系统
CN113986450A (zh) 一种虚拟机备份方法及装置
US20140164851A1 (en) Fault Processing in a System
US9965357B1 (en) Virtual backup and restore of virtual machines
CN115599575B (zh) 一种解决集群逻辑卷并发激活和反激活的新方法
CN104504348A (zh) 一种基于高可用存储系统的数据保护方法
CN115080309A (zh) 数据备份系统、方法、存储介质以及电子设备
CN114610567A (zh) 容器监控方法、网络设备及存储介质
CN110704249A (zh) 一种保证应用一致性的方法、装置及系统
CN106959888B (zh) 云存储系统中的任务处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110928