CN105491143A - 一种软件运行状态监控系统及其实现方法 - Google Patents

一种软件运行状态监控系统及其实现方法 Download PDF

Info

Publication number
CN105491143A
CN105491143A CN201510939738.9A CN201510939738A CN105491143A CN 105491143 A CN105491143 A CN 105491143A CN 201510939738 A CN201510939738 A CN 201510939738A CN 105491143 A CN105491143 A CN 105491143A
Authority
CN
China
Prior art keywords
software
monitoring
script
server
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201510939738.9A
Other languages
English (en)
Inventor
胡文彬
李勇波
季统凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Cloud Technology Co Ltd
Original Assignee
G Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Cloud Technology Co Ltd filed Critical G Cloud Technology Co Ltd
Priority to CN201510939738.9A priority Critical patent/CN105491143A/zh
Publication of CN105491143A publication Critical patent/CN105491143A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及软件和服务器监控技术领域,特别是一种软件运行状态监控系统及其实现方法。本发明的监控探针和脚本模块负责获取软件运行状态及服务器资源使用情况信息;监控信息采集模块负责搜集监控探针和脚本模块发回的监控信息,整合后存储到监控信息库;WEB监控界面将监控信息库的各种监控信息和故障预警展示给运维人员,同时提供软件控制界面,使运维人员可对软件进行启停等各种操作。本发明能实现分布式环境下的软件运行状态的集中监控和故障预警,并且可对软件进行控制,能充分保障软件正常工作及提高软件的可信性,满足系统运维人员对软件和服务器运行状态的监控需要;可以用于软件运行状态监控。

Description

一种软件运行状态监控系统及其实现方法
技术领域
本发明涉及软件和服务器监控技术领域,特别是一种软件运行状态监控系统及其实现方法。
背景技术
随着互联网的发展,企业根据业务需求研发各种应用软件,如何监控这些软件的运行状态并保障其正常运行,是企业的系统运维人员需面对的一个难题。一般的监控系统只是对软件进程或服务器资源进行监控,无法对软件运行状态进行深入的监控,如监控软件各个线程运行的详细信息等,也无法提供控制软件启停等操作的功能,因此不能很好的保障软件正常工作及提高软件的可信性。
发明内容
本发明解决的技术问题之一在于提供一种软件运行状态监控系统。
本发明解决的技术问题之二在于提供一种软件运行状态监控的实现方法。
本发明解决上述技术问题之一的技术方案是:
所述的系统由监控代理、监控信息库和WEB监控界面组成;
所述的监控信息库负责存储各类监控信息和日志,主要包括软件运行状态信息、服务器运行状态信息、软件控制操作日志等;
所述的WEB监控界面负责将软件运行状态、服务器运行状态等各类监控信息及故障预警展示给系统运维人员,同时提供控制软件启动、停止、重启等各种操作的界面;
所述的监控代理,部署在每台需要监控软件运行状态的应用服务器上,主要负责采集监控信息和控制软件,它由监控信息采集、监控探针、脚本模块及WebService接口组成;
所述的监控信息采集,负责采集由监控探针和脚本模块获取的各类监控信息;
所述的监控探针,是一段具有获取软件运行状态的代码,可以根据实际需要,注入在软件源代码中的不同位置,当软件触发监控探针时,监控探针就会获取软件当前的运行状态,然后发送到监控信息采集模块;
所述的脚本模块,由一系列shell脚本构成,包括但不局限于软件日志分析脚本、软件进程监控脚本、软件内存占用情况脚本、软件控制脚本、服务器CPU使用率脚本、服务器磁盘使用率脚本、服务器内存使用率脚本等,主要负责执行监控服务器使用情况、软件运行状态及控制软件等;
所述的WebService接口,主要是提供给外部应用程序调用脚本模块,执行控制软件或者获取相关监控信息的脚本。
本发明解决上述技术问题之二的技术方案是:
所述的方法按照以下流程步骤处理:
第一步,根据实际监控需要,将监控探针注入到软件源代码的不同位置;
第二步,软件运行时,触发监控探针,监控探针获取软件运行的各种状态,发送监控信息到监控信息采集模块;
第三步,监控信息采集模块搜集各个监控探针发回的监控信息,整合后存储到监控信息库;
第四步,监控信息采集模块根据配置,调用脚本模块的各类脚本,获取软件进程信息、软件内存使用信息及服务器各类资源使用情况等各种监控信息,存储到监控信息库;
第五步,运维人员通过WEB监控界面,查看软件运行状态、服务器资源使用情况等各类监控信息;
第六步,当软件运行状态或服务器资源使用情况等监控信息与预置的正常状态不符,则在WEB监控界面出现故障预警;并通过短信和邮件的方式通知运维人员,运维人员可通过WEB监控界面提供的软件控制界面,对软件进行重启操作;
第七步,WEB监控界面的软件控制界面通过监控代理的WebService接口,调用脚本模块中的软件控制脚本,完成对软件的重启操作。
所述的监控代理可以部署在任意操作系统的服务器,且每台服务器只需部署一个代理。
所述的WEB监控界面可以实现对一个或多个监控代理的集中管控。
本发明由监控探针和脚本模块获取软件运行状态和服务器运行状态,由监控信息采集负责搜集和整合监控信息,由监控信息库存储监控信息和日志,由WEB监控界面展示监控信息和故障预警,并可通过操作界面控制软件的启停等,实现保障软件和服务器的正常工作、提高软件的可信性。因此,采用本发明的系统及方法,具有以下有益效果:(1)适用于分布式环境下使用,统一管控;(2)采用监控探针注入的方式,获取详细的软件运行状态;(3)集成脚本模块,通过shell脚本可获取软件和服务器的各种监控信息;(4)采用WebService技术,不受系统平台的限制;(5)同时实现监控及故障预警功能;(6)配置灵活、运维方便。
附图说明
下面结合附图对本发明进一步说明:
图1是本发明的架构示意图。
具体实施方式
如图1所示,本发明的系统主要由监控代理、监控信息库和WEB监控界面三大组件组成。
1、监控代理:监控代理是核心组件,部署在每台需要监控软件运行状态的应用服务器上,主要负责采集监控信息和控制软件,它由监控信息采集、监控探针、脚本模块及WebService接口组成;
(1)监控信息采集:监控信息采集负责采集由监控探针和脚本模块获取的各类监控信息;
(2)监控探针:监控探针是一段具有获取软件运行状态的代码,可以根据实际需要,注入在软件源代码中的不同位置,当软件触发监控探针时,监控探针就会获取软件当前的运行状态,然后发送到监控信息采集模块;
(3)脚本模块:脚本模块由一系列shell脚本构成,包括但不局限于软件日志分析脚本、软件进程监控脚本、软件内存占用情况脚本、软件控制脚本、服务器CPU使用率脚本、服务器磁盘使用率脚本、服务器内存使用率脚本等,主要负责执行监控服务器使用情况、软件运行状态及控制软件等;
(4)WebService接口:WebService接口主要是提供给外部应用程序调用脚本模块,执行控制软件或者获取相关监控信息的脚本。
2、监控信息库:监控信息库负责存储各类监控信息和日志,主要包括软件运行状态信息、服务器运行状态信息、软件控制操作日志等;
3、WEB监控界面:WEB监控界面负责将软件运行状态、服务器运行状态等各类监控信息及故障预警展示给系统运维人员,同时提供控制软件启动、停止、重启等各种操作的界面。
如图1所示,软件运行状态监控系统的详细实施流程为:
第一步,根据实际监控需要,将监控探针注入到软件源代码的不同位置;
第二步,软件运行时,触发监控探针,监控探针获取软件运行的各种状态,发送监控信息到监控信息采集模块;
第三步,监控信息采集模块搜集各个监控探针发回的监控信息,整合后存储到监控信息库;
第四步,监控信息采集模块根据配置,调用脚本模块的各类脚本,获取软件进程信息、软件内存使用信息及服务器各类资源使用情况等各种监控信息,存储到监控信息库;
第五步,运维人员通过WEB监控界面,查看软件运行状态、服务器资源使用情况等各类监控信息;
第六步,当软件运行状态或服务器资源使用情况等监控信息与预置的正常状态不符,则会在WEB监控界面出现故障预警;例如当软件当前进程数为0时,WEB监控界面会出现进程预警,并通过短信和邮件的方式通知运维人员,运维人员可通过WEB监控界面提供的软件控制界面,对软件进行重启操作;
第七步,WEB监控界面的软件控制界面通过监控代理的WebService接口,调用脚本模块中的软件控制脚本,完成对软件的重启操作。
所述的监控代理可以部署在任意操作系统的服务器,且每台服务器只需部署一个代理;
所述的软件可以被注入一个或多个监控探针;
所述的WEB监控界面可以实现对一个或多个监控代理的集中管控。

Claims (4)

1.一种软件运行状态监控系统,其特征在于:所述的系统由监控代理、监控信息库和WEB监控界面组成;
所述的监控信息库负责存储各类监控信息和日志,主要包括软件运行状态信息、服务器运行状态信息、软件控制操作日志等;
所述的WEB监控界面负责将软件运行状态、服务器运行状态等各类监控信息及故障预警展示给系统运维人员,同时提供控制软件启动、停止、重启等各种操作的界面;
所述的监控代理,部署在每台需要监控软件运行状态的应用服务器上,主要负责采集监控信息和控制软件,它由监控信息采集、监控探针、脚本模块及WebService接口组成;
所述的监控信息采集,负责采集由监控探针和脚本模块获取的各类监控信息;
所述的监控探针,是一段具有获取软件运行状态的代码,可以根据实际需要,注入在软件源代码中的不同位置,当软件触发监控探针时,监控探针就会获取软件当前的运行状态,然后发送到监控信息采集模块;
所述的脚本模块,由一系列shell脚本构成,包括但不局限于软件日志分析脚本、软件进程监控脚本、软件内存占用情况脚本、软件控制脚本、服务器CPU使用率脚本、服务器磁盘使用率脚本、服务器内存使用率脚本等,主要负责执行监控服务器使用情况、软件运行状态及控制软件等;
所述的WebService接口,主要是提供给外部应用程序调用脚本模块,执行控制软件或者获取相关监控信息的脚本。
2.权利要求1所述软件运行状态监控系统的实现方法,其特征在于:所述的方法按照以下流程步骤处理:
第一步,根据实际监控需要,将监控探针注入到软件源代码的不同位置;
第二步,软件运行时,触发监控探针,监控探针获取软件运行的各种状态,发送监控信息到监控信息采集模块;
第三步,监控信息采集模块搜集各个监控探针发回的监控信息,整合后存储到监控信息库;
第四步,监控信息采集模块根据配置,调用脚本模块的各类脚本,获取软件进程信息、软件内存使用信息及服务器各类资源使用情况等各种监控信息,存储到监控信息库;
第五步,运维人员通过WEB监控界面,查看软件运行状态、服务器资源使用情况等各类监控信息;
第六步,当软件运行状态或服务器资源使用情况等监控信息与预置的正常状态不符,则在WEB监控界面出现故障预警;并通过短信和邮件的方式通知运维人员,运维人员可通过WEB监控界面提供的软件控制界面,对软件进行重启操作;
第七步,WEB监控界面的软件控制界面通过监控代理的WebService接口,调用脚本模块中的软件控制脚本,完成对软件的重启操作。
3.根据权利要求2所述的实现方法,其特征在于:所述的监控代理可以部署在任意操作系统的服务器,且每台服务器只需部署一个代理。
4.根据权利要求2或3所述的实现方法,其特征在于:所述的WEB监控界面可以实现对一个或多个监控代理的集中管控。
CN201510939738.9A 2015-12-15 2015-12-15 一种软件运行状态监控系统及其实现方法 Withdrawn CN105491143A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510939738.9A CN105491143A (zh) 2015-12-15 2015-12-15 一种软件运行状态监控系统及其实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510939738.9A CN105491143A (zh) 2015-12-15 2015-12-15 一种软件运行状态监控系统及其实现方法

Publications (1)

Publication Number Publication Date
CN105491143A true CN105491143A (zh) 2016-04-13

Family

ID=55677853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510939738.9A Withdrawn CN105491143A (zh) 2015-12-15 2015-12-15 一种软件运行状态监控系统及其实现方法

Country Status (1)

Country Link
CN (1) CN105491143A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161145A (zh) * 2016-07-25 2016-11-23 天脉聚源(北京)传媒科技有限公司 一种服务器系统运行状态信息的监控方法和系统
CN106201832A (zh) * 2016-06-29 2016-12-07 浪潮(北京)电子信息产业有限公司 一种对web应用运行状态进行监控的方法及装置
CN106357757A (zh) * 2016-09-07 2017-01-25 华为技术有限公司 一种监控系统中的被监控装置及监控方法
CN107729184A (zh) * 2017-10-23 2018-02-23 国云科技股份有限公司 一种系统组件服务自愈方法
CN108021485A (zh) * 2016-11-04 2018-05-11 北大方正集团有限公司 应用程序运行状态的监控方法及装置
CN108491303A (zh) * 2018-02-12 2018-09-04 安徽航天信息有限公司 一种基于中标麒麟操作系统软件运维自动化的方法
CN108566314A (zh) * 2018-03-06 2018-09-21 平安科技(深圳)有限公司 电子装置、集群环境下状态信息的获取方法及存储介质
CN109471772A (zh) * 2018-10-25 2019-03-15 北京计算机技术及应用研究所 并行程序运行时监控方法
CN109614292A (zh) * 2018-12-12 2019-04-12 国网辽宁省电力有限公司信息通信分公司 基于shell的主机运行数据自动采集监控系统
CN109802842A (zh) * 2017-11-16 2019-05-24 华为软件技术有限公司 应用拓扑的生成方法及相关设备
CN110427294A (zh) * 2019-06-17 2019-11-08 平安普惠企业管理有限公司 系统集成环境监控方法、装置、可读存储介质和程序产品
CN110430070A (zh) * 2019-07-19 2019-11-08 北京奇艺世纪科技有限公司 一种服务状态分析方法、装置、服务器、数据分析设备及介质
CN110647442A (zh) * 2019-09-25 2020-01-03 北京宝兰德软件股份有限公司 软件安装状态监控方法及装置
CN111768079A (zh) * 2020-06-01 2020-10-13 国网江苏省电力有限公司 一种电力系统的安全运维管理系统及方法
CN112860543A (zh) * 2021-01-20 2021-05-28 维沃移动通信(深圳)有限公司 检测页面运行的方法和电子设备
CN113176996A (zh) * 2021-04-29 2021-07-27 深信服科技股份有限公司 故障处理方法、引擎、插件化探针、设备及可读存储介质
CN113656291A (zh) * 2021-08-04 2021-11-16 成都中科合迅科技有限公司 软件脚本引擎动态调用方法
CN113992342A (zh) * 2021-09-10 2022-01-28 南京南瑞信息通信科技有限公司 一种无损网络安全监测管控方法、装置及系统
CN115037652A (zh) * 2022-05-17 2022-09-09 上海金仕达软件科技有限公司 一种套保系统后台模块运行监控系统
CN116302797A (zh) * 2023-02-03 2023-06-23 安芯网盾(北京)科技有限公司 一种服务端软件健康状态采集方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605056A (zh) * 2009-06-16 2009-12-16 中兴通讯股份有限公司 一种j2ee服务器监控装置及采用该装置的监控方法
CN101847116A (zh) * 2010-05-05 2010-09-29 中兴通讯股份有限公司 一种基于j2ee架构的监控系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605056A (zh) * 2009-06-16 2009-12-16 中兴通讯股份有限公司 一种j2ee服务器监控装置及采用该装置的监控方法
CN101847116A (zh) * 2010-05-05 2010-09-29 中兴通讯股份有限公司 一种基于j2ee架构的监控系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱頔: "《服务器运行状态监控系统的设计与实现》", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
王涛: "《一种监控探针描述语言及其编译器的设计与实现》", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106201832A (zh) * 2016-06-29 2016-12-07 浪潮(北京)电子信息产业有限公司 一种对web应用运行状态进行监控的方法及装置
CN106161145A (zh) * 2016-07-25 2016-11-23 天脉聚源(北京)传媒科技有限公司 一种服务器系统运行状态信息的监控方法和系统
CN106357757A (zh) * 2016-09-07 2017-01-25 华为技术有限公司 一种监控系统中的被监控装置及监控方法
CN106357757B (zh) * 2016-09-07 2019-10-22 华为技术有限公司 一种监控系统中的被监控装置及监控方法
CN108021485A (zh) * 2016-11-04 2018-05-11 北大方正集团有限公司 应用程序运行状态的监控方法及装置
CN107729184B (zh) * 2017-10-23 2021-07-30 国云科技股份有限公司 一种系统组件服务自愈方法
CN107729184A (zh) * 2017-10-23 2018-02-23 国云科技股份有限公司 一种系统组件服务自愈方法
CN109802842A (zh) * 2017-11-16 2019-05-24 华为软件技术有限公司 应用拓扑的生成方法及相关设备
CN109802842B (zh) * 2017-11-16 2021-12-03 华为技术有限公司 应用拓扑的生成方法及相关设备
CN108491303A (zh) * 2018-02-12 2018-09-04 安徽航天信息有限公司 一种基于中标麒麟操作系统软件运维自动化的方法
CN108566314A (zh) * 2018-03-06 2018-09-21 平安科技(深圳)有限公司 电子装置、集群环境下状态信息的获取方法及存储介质
CN109471772A (zh) * 2018-10-25 2019-03-15 北京计算机技术及应用研究所 并行程序运行时监控方法
CN109614292A (zh) * 2018-12-12 2019-04-12 国网辽宁省电力有限公司信息通信分公司 基于shell的主机运行数据自动采集监控系统
CN110427294A (zh) * 2019-06-17 2019-11-08 平安普惠企业管理有限公司 系统集成环境监控方法、装置、可读存储介质和程序产品
CN110427294B (zh) * 2019-06-17 2022-07-29 平安普惠企业管理有限公司 系统集成环境监控方法、装置、可读存储介质和程序产品
CN110430070A (zh) * 2019-07-19 2019-11-08 北京奇艺世纪科技有限公司 一种服务状态分析方法、装置、服务器、数据分析设备及介质
CN110430070B (zh) * 2019-07-19 2022-07-22 北京奇艺世纪科技有限公司 一种服务状态分析方法、装置、服务器、数据分析设备及介质
CN110647442A (zh) * 2019-09-25 2020-01-03 北京宝兰德软件股份有限公司 软件安装状态监控方法及装置
CN111768079A (zh) * 2020-06-01 2020-10-13 国网江苏省电力有限公司 一种电力系统的安全运维管理系统及方法
CN112860543A (zh) * 2021-01-20 2021-05-28 维沃移动通信(深圳)有限公司 检测页面运行的方法和电子设备
CN113176996A (zh) * 2021-04-29 2021-07-27 深信服科技股份有限公司 故障处理方法、引擎、插件化探针、设备及可读存储介质
CN113656291A (zh) * 2021-08-04 2021-11-16 成都中科合迅科技有限公司 软件脚本引擎动态调用方法
CN113992342A (zh) * 2021-09-10 2022-01-28 南京南瑞信息通信科技有限公司 一种无损网络安全监测管控方法、装置及系统
CN115037652A (zh) * 2022-05-17 2022-09-09 上海金仕达软件科技有限公司 一种套保系统后台模块运行监控系统
CN116302797A (zh) * 2023-02-03 2023-06-23 安芯网盾(北京)科技有限公司 一种服务端软件健康状态采集方法及系统

Similar Documents

Publication Publication Date Title
CN105491143A (zh) 一种软件运行状态监控系统及其实现方法
Edrington et al. Machine monitoring system based on MTConnect technology
CN104268055B (zh) 一种程序异常的监控方法和装置
CN105359143B (zh) 数据库诊断界面系统
CN104636435A (zh) 云终端录屏方法
CN101707399A (zh) 电能信息采集方法及系统
CN111881014B (zh) 一种系统测试方法、装置、存储介质及电子设备
CN113778486B (zh) 一种代码流水线的容器化处理方法、装置、介质及设备
CN112328456A (zh) 一种基于服务发现的集群资源监控系统
CN103077111A (zh) 一种持续集成失败用例的定位方法及系统
CN104407959A (zh) 基于应用的监控方法及监控装置
CN102387208A (zh) 分布式任务调度方法及任务调度系统
CN110445694A (zh) 一种基于Zabbix监控触发通知的方法
CN103605592A (zh) 一种分布式计算机系统故障检测机制
CN105632248A (zh) 一种安全监控系统及其数据处理方法
Xu et al. Availability Modeling and Analysis of a Single-Server Virtualized System with Rejuvenation.
CN104348653A (zh) 云管理平台的用户任务实现方法、系统与触发器
CN102891774A (zh) 一种云计算系统中监控虚拟机状态并提示告警的方法
Cao et al. ITIL Incident management process reengineering in industry 4.0 environments
CN108241565A (zh) 一种用于实现应用系统自动化运维的系统及方法
CN106649028A (zh) 一种自动化Linux系统维护任务的方法
CN102184120A (zh) Java虚拟机的管理方法、监控系统和监控代理模块
CN103684917A (zh) 一种多目标机系统监视系统及方法
CN104486149B (zh) 一种用于地面测试的有限状态机方法
CN104679710A (zh) 一种面向半导体生产线搬运系统软件故障快速恢复方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20160413