CN111176938A - 系统运行状态的监控方法及装置 - Google Patents

系统运行状态的监控方法及装置 Download PDF

Info

Publication number
CN111176938A
CN111176938A CN201911322952.4A CN201911322952A CN111176938A CN 111176938 A CN111176938 A CN 111176938A CN 201911322952 A CN201911322952 A CN 201911322952A CN 111176938 A CN111176938 A CN 111176938A
Authority
CN
China
Prior art keywords
monitoring
file
memory
state information
line number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911322952.4A
Other languages
English (en)
Inventor
刘亚轩
何建锋
陈宏伟
高阳春
冯国礼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Jiaotong University Jump Network Technology Co ltd
Original Assignee
Xi'an Jiaotong University Jump Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Jiaotong University Jump Network Technology Co ltd filed Critical Xi'an Jiaotong University Jump Network Technology Co ltd
Priority to CN201911322952.4A priority Critical patent/CN111176938A/zh
Publication of CN111176938A publication Critical patent/CN111176938A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种系统运行状态的监控方法与装置:监控进程统计系统的运行状态信息,将统计结果写入第一文件,判断第一文件的当前行数是否大于预设行数;若第一文件的当前行数大于预设行数,删除非当前文件,将所述第一文件命名为第二文件,监控进程休眠第一时长;若第一文件的当前行数不大于预设行数,监控进程休眠第二时长;将所述第一文件与第二文件导出为系统状态信息日志。有利于系统稳定性分析,同时为调试和恢复过程提供了可靠依据。

Description

系统运行状态的监控方法及装置
技术领域
本发明属于计算机技术领域,尤其是涉及一种系统运行状态的监控方法及装置。
背景技术
计算机系统及其程序的运行相关参数,例如CPU、内存、磁盘等资源的占用率,会随着对应的进程的运行状态实时变化,例如当某一进程高速运行时,会占用较多的资源,容易导致系统或程序的资源总占用率过高,从而造成其他程序或进程运行缓慢与系统超负载,当计算机全部资源占用过高时甚至会导致系统或程序的全面崩溃或宕机,影响业务的运营。因此,需要对系统及程序的进程特别是内存占用的状态进行监控,以合理配置系统资源。
发明内容
为了克服上述的技术问题,特提出一种系统运行状态的监控方法并提出一种监控装置,在系统与程序运行中,监控其运行状态信息并生成日志文件,以便进行系统稳定性的分析。
一种系统运行状态的监控方法:监控进程统计系统的运行状态信息,将统计结果写入第一文件,判断第一文件的当前行数是否大于预设行数;若第一文件的当前行数大于预设行数,删除非当前文件,将所述第一文件命名为第二文件,监控进程休眠第一时长;若第一文件的当前行数不大于预设行数,监控进程休眠第二时长;将所述第一文件与第二文件导出为系统状态信息日志。
优选的,记录的系统状态信息文件通过JSH命令下载到U盘,以进行系统运行情况的分析。
上述的系统运行状态信息至少包括CPU状态、内存状态、磁盘状态、接口状态:
CPU状态信息:进程总数、正在运行的进程数、休眠的进程数、停止的进程数、进程ID、进程优先级、进程使用的虚拟内存总量、进程状态、CPU时间占用百分比、进程占用的物理内存百分比、进程使用的CPU时间总计;
内存状态信息:物理内存总量、使用的物理内存总量、空闲内存总量、用作内核缓存的内存总量、交换区总量、使用的交换区总量、空闲交换区总量、缓冲的交换区总量;
磁盘状态信息:磁盘分区、容量大小、已用空间大小、可用空间大小、已用空间百分比、挂载点;
接口状态信息:接口名称、接口IP、接口MAC、接口MTU,接口收发包流量。
进一步的,内存状态信息的监控包括,系统程序启动时,为进程创建内存监控线程以执行以下步骤:
S21.判断进程在数据库的状态字段为启用或停用,若为停用则进行步骤S22,若为启用则进行步骤S23;
S22.关闭该进程,监控线程休眠第三时长;
S23.检查该进程所占内存是否超过预设的内存阈值,若未超过则监控线程休眠第三时长,若超过则重启该进程并进行步骤S24;
S24.检查该进程是否运行,若运行则监控线程休眠第三时长,若未运行则启动该进程后监控线程休眠第三时长;
S25.第三时长结束后,重复进行以上步骤。
优选的,内存监控线程的处理函数,周期检查关键进程的启用状态与内存占用。
根据策略,配置进程在数据库的状态字段为启用或停用;根据进程的重要性,配置相应的内存阈值与第三时长,所述内存阈值为内存占用量或占用总内存的百分比。
一种系统运行状态的监控装置,包括:
数据库单元,用于保存预设的配置参数,包括监控与检查周期、被监控的系统运行状态信息、进程的启用状态、预设的休眠时长、内存阈值;
监控单元,按照数据库单元配置的监控周期,监控系统运行状态信息;
信息处理单元,对监控单元监控到的系统信息进行处理,按照数据库单元的配置做出相应的操作指令;
存储单元,存储用于保存系统运行状态信息的文件。
优选的,监控单元创建进程周期统计数据库单元配置的需要监控的系统状态信息,将统计结果写入第一文件,信息处理单元判断当第一文件的当前行数大于数据库单元的预设行数时,删除非当前文件,将所述第一文件命名为第二文件,监控进程休眠第一时长;将所述第一文件与第二文件导出为系统状态信息日志。
进一步的,系统程序的关键进程启动时,监控单元为该进程创建相应的内存监控线程;
信息处理单元判断该进程在数据库单元的状态字段为开启或停用;若为停用则关闭该进程并且内存监控线程进行休眠;若为启用则检查该进程的内存占用是否超过数据库单元配置的内存阈值,若超过则重启该进程,若未超过则内存监控线程进行休眠;
休眠结束后,内存监控线程继续监控系统程序的内存状态。
上述的技术方案,为系统或程序的运行创建监控进程,周期的获取被监控信息并统计生成文件,当文件的内容达到预设数量,删除其他文件同时修改文件命名,文件可以导出进行进一步分析;进一步的是为系统进程创建内存监控线程,按照预先配置,周期的检查对应进程的内存占用情况,做出相应的操作,包括关闭、重启进程;有利于系统稳定性分析,同时为调试和恢复过程提供了可靠依据。
附图说明
图1为系统运行状态的监控装置,组成示意图;
图2为系统运行状态的监控方法实施例一,工作流程示意图;
图3为系统运行状态的监控方法实施例二,工作流程示意图。
具体实施方式
如图1所示,系统运行状态的监控装置,包括:
数据库单元,用于保存预设的配置参数,包括监控与检查周期、被监控的系统运行状态信息、进程的启用状态、预设的休眠时长、内存阈值;
监控单元,按照数据库单元配置的监控周期,监控系统运行状态信息;
信息处理单元,对监控单元监控到的系统信息进行处理,按照数据库单元的配置做出相应的操作指令;
存储单元,存储用于保存系统运行状态信息的文件。
工作原理:监控单元创建进程,周期地统计数据库单元配置的需要监控的系统状态信息,将统计结果写入存储单元的文件X,信息处理单元判断当文件X的当前行数大于数据库单元的预设行数时,删除非当前文件,将所述文件X命名为文件Y,监控进程休眠10分钟;将所述文件X与文件Y导出为系统状态信息日志;
进一步的,系统程序的关键进程启动时,监控单元为该进程创建相应的内存监控线程;
信息处理单元判断该进程在数据库单元的状态字段为开启或停用;若为停用则关闭该进程并且内存监控线程进行休眠;若为启用则检查该进程的内存占用是否超过数据库单元配置的内存阈值,若超过则重启该进程,若未超过则内存监控线程进行休眠;
休眠结束后,内存监控线程继续监控系统程序的进程内存状态。
实施例一
如图2所示,该实施例说明系统运行状态的监控方法。
在数据库单元:
1、预设系统运行状态的统计周期为固定的10分钟;
2、预设监控的系统运行状态信息:CPU状态信息包括进程总数、正在运行的进程数、休眠的进程数、停止的进程数、进程ID、进程优先级、进程使用的虚拟内存总量、进程状态、CPU时间占用百分比、进程占用的物理内存百分比、进程使用的CPU时间总计;内存状态信息包括:物理内存总量、使用的物理内存总量、空闲内存总量、用作内核缓存的内存总量、交换区总量、使用的交换区总量、空闲交换区总量、缓冲的交换区总量;磁盘状态信息包括:磁盘分区、容量大小、已用空间大小、可用空间大小、已用空间百分比、挂载点;接口状态信息包括:接口名称、接口IP、接口MAC、接口MTU,接口收发包流量;
3、预设用于写入统计结果的文件X的最大行数为10万行。
监控单元创建监控进程,其工作流程如下所述:
监控进程统计预设的系统运行状态信息,将统计结果写入文件X,信息处理单元统计其行数,判断当前行数是否大于10万;
当写入的行数大于10万时,将文件X重新命名为文件Y;
监控进程休眠10分钟后,重新启动并统计系统运行状态信息,并将结果写入新创建的文件X,当文件X的当前行数大于10万时,若存在同名的文件Y则删除后将文件X重命名为文件Y,若不存在同名文件Y则直接将文件X重命名为文件Y;
监控进程再次休眠10分钟后重新执行统计。
当写入的行数不足10万时,监控进程直接休眠10分钟后重新执行统计。
每次判断时的文件X与文件Y通过JSH命令下载到U盘。
可见,监控进程实际是以10分钟作为周期,判断统计到的系统运行状态信息是否超过10万行,并按照判断结果执行相应的操作,并将统计的信息进行导出,既实现了利用信息日志进行系统状态的分析,而且监控进程进行周期性工作,可以有效降低对系统资源的占用。
实施例二
该实施例也是说明系统运行状态的监控方法。
在数据库单元:
1、预设系统运行状态的统计周期为固定的15分钟;
2、预设监控的系统运行状态信息:CPU状态信息包括进程总数、正在运行的进程数、休眠的进程数、停止的进程数、进程ID、进程优先级、进程使用的虚拟内存总量、进程状态、CPU时间占用百分比、进程占用的物理内存百分比、进程使用的CPU时间总计;内存状态信息包括:物理内存总量、使用的物理内存总量、空闲内存总量、用作内核缓存的内存总量、交换区总量、使用的交换区总量、空闲交换区总量、缓冲的交换区总量;磁盘状态信息包括:磁盘分区、容量大小、已用空间大小、可用空间大小、已用空间百分比、挂载点;接口状态信息包括:接口名称、接口IP、接口MAC、接口MTU,接口收发包流量;
3、预设用于写入统计结果的文件X的最大行数为15万行。
监控单元创建监控进程,其工作流程如下所述:
监控进程统计预设的系统运行状态信息,将统计结果写入文件X,信息处理单元统计其行数,判断当前行数是否大于15万;
当写入的行数大于15万时,将文件X重新命名为文件Y1;
监控进程休眠15分钟后,重新启动并统计系统运行状态信息,并将结果写入新创建的文件X,当文件X的当前行数大于15万时,将文件X重命名为文件Y2;
按以上步骤,监控进程再次休眠10分钟后重新执行统计,会依次产生文件Yn(n为依次的数字)。
当写入文件X的行数不足15万时,监控进程直接休眠15分钟后重新执行统计。
将上述的文件X、文件Y1直至Yn,通过JSH命令下载到U盘。
可见,监控进程实际是以15分钟作为周期,判断统计到的系统运行状态信息是否超过15万行,并按照判断结果执行相应的操作,并将统计的信息进行导出,既实现了利用信息日志进行系统状态的分析,而且监控进程进行周期性工作,可以有效降低对系统资源的占用。
实施例三
该实施例具体实施例一、二中,内存状态监控的技术方案。
如图3所示,根据策略,在数据库单元配置进程在数据库的状态字段是否为启用;根据进程的重要性,配置相应的内存阈值,配置内存监控线程休眠时长为5秒,所述内存阈值占用总内存的百分比。
系统程序启动时,监控单元为每个进程创建相应的内存监控线程n,所述的进程可以在数据库单元中进行配置,例如只对系统程序的关键进程创建内存监控线程。
以内存监控线程1为例说明,该线程1执行以下步骤:
S21.判断数据库的状态字段,所述进程是否为启用,若为否(图中为“N”)则进行步骤S22,若为是(图中为“Y”)则进行步骤S23;
S22.关闭该进程,监控线程休眠5秒;
S23.检查该进程所占内存是否超过预设的内存阈值,若未超过则监控线程休眠5秒,若超过则重启该进程并进行步骤S24;
S24.检查该进程是否运行,若运行则监控线程休眠5秒,若未运行则启动该进程后监控线程休眠5秒;
S25.内存监控线程休眠5秒后,重复进行以上步骤,即S21至S24。
如上所述各实施例的技术方案,有利于系统稳定性分析,同时为调试和恢复过程提供了可靠依据。

Claims (9)

1.系统运行状态的监控方法,监控并记录系统的运行状态信息,包括CPU状态、内存状态、磁盘状态与接口状态,其特征在于,
监控进程统计系统的运行状态信息,将统计结果写入第一文件,判断第一文件的当前行数是否大于预设行数;
若第一文件的当前行数大于预设行数,删除非当前文件,将所述第一文件命名为第二文件,监控进程休眠第一时长;若第一文件的当前行数不大于预设行数,监控进程休眠第二时长;
将所述第一文件与第二文件导出为系统状态信息日志。
2.根据权利要求1所述的监控方法,其特征在于,记录的系统状态信息文件通过JSH命令下载到U盘,以进行系统运行情况的分析。
3.根据权利要求1所述的监控方法,其特征在于,所述内存状态的监控包括,系统程序启动时,为进程创建内存监控线程以执行以下步骤:
S21.判断数据库的状态字段,所述进程为启用或停用,若为停用则进行步骤S22,若为启用则进行步骤S23;
S22.关闭该进程,监控线程休眠第三时长;
S23.检查该进程所占内存是否超过预设的内存阈值,若未超过则监控线程休眠第三时长,若超过则重启该进程并进行步骤S24;
S24.检查该进程是否运行,若运行则监控线程休眠第三时长,若未运行则启动该进程后监控线程休眠第三时长;
S25.第三时长结束后,重复进行以上步骤。
4.根据权利要求3所述的监控方法,其特征在于,监控线程的处理函数,周期检查关键进程的启用状态与内存占用。
5.根据权利要求3所述的监控方法,其特征在于,根据策略配置进程在数据库的状态字段为启用或停用;根据进程的重要性,配置相应的内存阈值与第三时长,所述内存阈值为内存占用量或占用总内存的百分比。
6.根据权利要求1所述的监控方法,其特征在于,
所述CPU状态信息包括进程总数、正在运行的进程数、休眠的进程数、停止的进程数、进程ID、进程优先级、进程使用的虚拟内存总量、进程状态、CPU时间占用百分比、进程占用的物理内存百分比、进程使用的CPU时间总计;
所述内存状态信息包括:物理内存总量、使用的物理内存总量、空闲内存总量、用作内核缓存的内存总量、交换区总量、使用的交换区总量、空闲交换区总量、缓冲的交换区总量;
所述磁盘状态信息包括:磁盘分区、容量大小、已用空间大小、可用空间大小、已用空间百分比、挂载点;
所述接口状态信息包括:接口名称、接口IP、接口MAC、接口MTU,接口收发包流量。
7.系统运行状态的监控装置,其特征在于,包括:
数据库单元,用于保存预设的配置参数,包括监控与检查周期、被监控的系统运行状态信息、进程的启用状态、预设的休眠时长、内存阈值;
监控单元,按照数据库单元配置的监控周期,监控系统运行状态信息;
信息处理单元,对监控单元监控到的系统信息进行处理,按照数据库单元的配置做出相应的操作指令;
存储单元,存储用于保存系统运行状态信息的文件。
8.根据权利要求7所述的系统运行监控装置,其特征在于,
监控单元创建进程周期统计数据库单元配置的需要监控的系统状态信息,将统计结果写入第一文件,信息处理单元判断当第一文件的当前行数大于数据库单元的预设行数时,删除非当前文件,将所述第一文件命名为第二文件,监控进程休眠第一时长;将所述第一文件与第二文件导出为系统状态信息日志。
9.根据权利要求7所述的系统运行监控装置,其特征在于,系统程序的关键进程启动时,监控单元为该进程创建相应的内存监控线程;
信息处理单元判断该进程在数据库单元的状态字段为开启或停用;若为停用则关闭该进程并且内存监控线程进行休眠;若为启用则检查该进程的内存占用是否超过数据库单元配置的内存阈值,若超过则重启该进程,若未超过则内存监控线程进行休眠;
休眠结束后,内存监控线程继续监控系统程序的进程内存状态。
CN201911322952.4A 2019-12-20 2019-12-20 系统运行状态的监控方法及装置 Pending CN111176938A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911322952.4A CN111176938A (zh) 2019-12-20 2019-12-20 系统运行状态的监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911322952.4A CN111176938A (zh) 2019-12-20 2019-12-20 系统运行状态的监控方法及装置

Publications (1)

Publication Number Publication Date
CN111176938A true CN111176938A (zh) 2020-05-19

Family

ID=70650247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911322952.4A Pending CN111176938A (zh) 2019-12-20 2019-12-20 系统运行状态的监控方法及装置

Country Status (1)

Country Link
CN (1) CN111176938A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111638953A (zh) * 2020-05-21 2020-09-08 贝壳技术有限公司 一种实现gpu虚拟化的方法、装置和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111638953A (zh) * 2020-05-21 2020-09-08 贝壳技术有限公司 一种实现gpu虚拟化的方法、装置和存储介质
CN111638953B (zh) * 2020-05-21 2021-07-30 贝壳找房(北京)科技有限公司 一种实现gpu虚拟化的方法、装置和存储介质

Similar Documents

Publication Publication Date Title
US8117415B2 (en) Storage device estimating a completion time for a storage operation
US8850403B2 (en) Profiling data snapshots for software profilers
US7739268B2 (en) Optimization of performing query compilations
WO2017173927A1 (zh) 分布式存储系统硬盘挂住故障检测、处理方法及装置
CN105824702A (zh) 一种管理程序内存占用量的方法和终端
WO2011079585A1 (zh) 获取进程阻塞信息的方法及装置
CN111008157B (zh) 存储系统写缓存数据下发方法及相关组件
CN107767264A (zh) 联机交易系统热点账户交易流量压力实时调控方法及装置
CN103514112B (zh) 一种数据存储方法及系统
CN108958891B (zh) 一种虚拟机内存分配方法、装置及终端
CN109901969B (zh) 一种集中监控管理平台的设计方法及装置
CN111813548A (zh) 一种资源调度方法、装置、电子设备及存储介质
WO2021253851A1 (zh) 一种集群分布式资源调度方法、装置、设备及存储介质
CN111176938A (zh) 系统运行状态的监控方法及装置
CN105183629B (zh) 分析php应用软件性能的诊断系统及其方法和性能管理平台
CN108491159B (zh) 一种基于随机延迟缓解i/o瓶颈的大规模并行系统检查点数据写入方法
CN107395735B (zh) 一种容器集群的延时缩容调度方法及系统
CN105005504B (zh) 一种安卓平台的单任务模式实现方法及系统
CN112817933A (zh) 一种弹性数据库连接池的管理方法及装置
CN111124761B (zh) 一种设备重启方法、装置、设备及介质
JP2015022504A (ja) 情報処理装置、方法、及びプログラム
CN102426539A (zh) 一种定时器任务自动处理方法及系统
WO2008035352A2 (en) A method and a storage device estimating a completion time for a storage operation
CN111611463A (zh) 一种基于Scrapy-Redis的分布式网络爬虫优化方法
US20060036601A1 (en) Autonomic virtual log configuration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200519

WD01 Invention patent application deemed withdrawn after publication