CN110633191A - 实时监控软件系统业务健康度的方法和系统 - Google Patents

实时监控软件系统业务健康度的方法和系统 Download PDF

Info

Publication number
CN110633191A
CN110633191A CN201910934320.7A CN201910934320A CN110633191A CN 110633191 A CN110633191 A CN 110633191A CN 201910934320 A CN201910934320 A CN 201910934320A CN 110633191 A CN110633191 A CN 110633191A
Authority
CN
China
Prior art keywords
monitoring data
monitoring
target
target monitoring
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910934320.7A
Other languages
English (en)
Other versions
CN110633191B (zh
Inventor
王保强
刘春波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Dinglishen Science And Technology Co Ltd
Original Assignee
Hainan Dinglishen Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Dinglishen Science And Technology Co Ltd filed Critical Hainan Dinglishen Science And Technology Co Ltd
Priority to CN201910934320.7A priority Critical patent/CN110633191B/zh
Publication of CN110633191A publication Critical patent/CN110633191A/zh
Application granted granted Critical
Publication of CN110633191B publication Critical patent/CN110633191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/323Visualisation of programs or trace data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/865Monitoring of software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/875Monitoring of systems including the internet
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种实时监控软件系统业务健康度的方法和系统,该方法包括:判断目标应用程序类型,根据目标应用程序类型选取应用服务器对目标应用程序进行实时监控;应用服务器捕获到目标监控数据时,通过打包协议进行封装后实时发送至监控采集服务器;监控采集服务器接收数据后,进行反解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群;监控数据库集群保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器;监控Web服务器接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控。本发明能起到及时监控、及时发现、分析和定位问题的作用,为系统安全、高效的运行提供强有力的支持。

Description

实时监控软件系统业务健康度的方法和系统
技术领域
本发明涉及软件系统监控技术领域,尤其涉及一种实时监控软件系统业务健康度的方法和系统。
背景技术
随着互联网的飞速发展和企业基础设施建设规模的不断扩大,企业业务对计算机信息系统的依赖程度越来越紧密,计算机信息系统的任何波动,都会直接影响到业务的正常开展,计算机信息系统如果崩溃,对于企业业务的影响将是致命的,为了解决这一问题,各个企业分别通过IT运维管理系统、网络管理系统、数据仓库、报表系统等方式对计算机信息系统的配置、网络、运行日志等方面进行管理,但这些方式均存在一些弊端,例如:IT运维管理系统侧重物理主机、存储、虚拟机、数据库等设备的正常运行和IT管理的标准化、流程化、规范化,但缺少对信息系统内在业务逻辑的异常监控手段;网络管理系统侧重网络设备、网络流量方面的异常监控,同样缺乏对业务本身的监控;而通过数据仓库或报表系统对业务系统的监控往往比较滞后,容易错失定位和纠正问题的最佳时机,从而可能导致给企业的运营和生产带来难以估量的损失。
发明内容
本发明的目的在于提供一种实时监控软件系统业务健康度的方法和系统,以解决现有技术中无法对业务系统健康度进行实时有效的监控的问题。
本发明第一方面提供一种实时监控软件系统业务健康度的方法,包括:
判断目标应用程序类型,根据目标应用程序类型选取相应的应用服务器对目标应用程序进行实时监控,所述目标应用程序类型包括客户端软件、Web软件和组合软件,所述应用服务器包括客户端应用服务器和Web应用服务器,所述对目标应用程序进行实时监控具体为对目标监控数据进行实时采集和监控,所述目标监控数据包括预定义的异常消息、事件和业务统计指标数据;
应用服务器捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器;
监控采集服务器接收到经过封装的目标监控数据后,进行反解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群;
监控数据库集群保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器;
监控Web服务器接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控。
进一步的,当Web应用服务器捕获到目标监控数据时,先提交到Qos服务器,所述Qos服务器接收各个Web应用服务器上传的目标监控数据,进行轻度汇总,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器。
进一步的,所述监控采集服务器接收到经过封装的目标监控数据后,进行反解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群,具体包括:
监控采集服务器接收经过封装的目标监控数据,进行反解析,对目标监控数据进行序列化和反序列化处理,根据目标监控数据属性进行轻度汇总;
部署一个计时器,根据计时器的频率判断当前为计数时间还是输出时间;
若为计数时间,则对目标监控数据的计数器进行加一操作;
若为输出时间,则批量或单条输出目标监控数据到监控数据库集群进行永久性保存。
进一步的,所述监控数据库集群保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器,具体包括:
监控数据库集群对目标监控数据进行入库,入库后的目标监控数据生成业务监控的1分钟线;
设置第一定时任务,所述第一定时任务每5分钟执行一次处理数据命令,将1分钟线的目标监控数据汇总为5分钟线;
设置第二定时任务,所述第二定时任务每一小时执行一次处理数据命令,将5分钟线的目标监控数据汇总成1小时线;
设置第三定时任务,所述第三定时任务每一小时执行一次处理数据命令,将1小时线的目标监控数据汇总成每日线;
每次执行处理数据命令时,将执行结果发送至监控Web服务器进行展示。
进一步的,所述监控Web服务器接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控,具体包括:
对监控频率、业务类型、业务配置、业务源、统计指标进行配置;
对展示图表进行配置,所述展示图表包括单图表和复合图表;
根据预设配置对所接收的目标监控数据进行处理并通过可视化人机界面以展示图表的形式向用户展示。
本发明第二方面提供一种实时监控软件系统业务健康度的系统,包括:
客户端软件应用服务器,用于在判断目标应用程序类型为客户端软件或组合软件时,对目标应用程序进行实时监控,所述对目标应用程序进行实时监控具体为对目标监控数据进行实时采集和监控,还用于在捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后发送至监控采集服务器,所述目标监控数据包括预定义的异常消息、事件和业务统计指标数据;
Web应用服务器,用于在判断目标应用程序类型为Web软件或组合软件时,对目标应用程序进行实时监控,还用于在捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器;
监控采集服务器,用于在接收到经过封装的目标监控数据后,进行泛解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群;
监控数据库集群,用于保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器;
监控Web服务器,用于接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控。
进一步的,所述系统还包括Qos服务器,所述Qos服务器用于接收各个Web应用服务器上传的目标监控数据,进行轻度汇总,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器。
进一步的,所述监控采集服务器包括,
接收模块,用于接收经过封装的目标监控数据,进行反解析,对目标监控数据进行序列化和反序列化处理,根据目标监控数据属性进行轻度汇总;
计时器模块,用于部署一个计时器,根据计时器频率判断当前为计数时间还是输出时间,若为计数时间,则对目标监控数据的计数器进行加一操作,若为输出时间,则批量或单条输出目标监控数据到监控数据库集群进行永久性保存。
进一步的,所述监控数据库集群包括,
入库模块,用于对目标监控数据进行入库,入库后的目标监控数据生成业务监控的1分钟线;
第一任务模块,用于设置第一定时任务,所述第一定时任务每5分钟执行一次处理数据命令,将1分钟线的目标监控数据汇总为5分钟线;
第二任务模块,用于设置第二定时任务,所述第二定时任务每一小时执行一次处理数据命令,将5分钟线的目标监控数据汇总成1小时线;
第三任务模块,用于设置第三定时任务,所述第三定时任务每一小时执行一次处理数据命令,将1小时线的目标监控数据汇总成每日线;
发送模块,用于在每次执行处理数据命令时,将执行结果发送至监控Web服务器进行展示。
进一步的,所述监控Web服务器包括,
第一配置模块,用于对监控频率、业务类型、业务、业务源、统计指标进行配置;
第二配置模块,用于对展示图表进行配置,所述展示图表包括单图表和复合图表;
展示模块,用于根据预设配置对所接收的目标监控数据进行处理并通过可视化人机界面以展示图表的形式向用户展示。
与现有技术相比,本发明的有益效果是:
本发明提供的一种实时监控软件系统业务健康度的方法,根据目标应用程序的类型选取相应的应用服务器对目标应用程序进行实时监控,采集相关业务数据和异常消息等目标监控数据,并通过监控采集服务器对目标监控数据进行实时的数据处理,提交到监控数据库集群进行保存,同时监控Web服务器以实时频度通过可视化人机界面向用户进行展示,从而起到及时监控、及时发现、分析和定位问题的作用,为系统安全、高效的运行提供强有力的支持。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的实时监控软件系统业务健康度方法流程示意图。
图2是本发明另一实施例提供的实时监控软件系统业务健康度方法流程示意图。
图3是本发明另一实施例提供的实时监控软件系统业务健康度方法流程示意图。
图4是本发明另一实施例提供的实时监控软件系统业务健康度方法流程示意图。
图5是本发明一实施例提供的实时监控软件系统业务健康度系统结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所列举实施例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明一实施例提供的实时监控软件系统业务健康度方法流程示意图。该方法中的服务器可以是计算机、伺服器等设备,本发明实施例中,在此不做具体限定。
如图1所示,所述实时监控软件系统业务健康度的方法,包括以下步骤:
S11、判断目标应用程序类型,根据目标应用程序类型选取相应的应用服务器对目标应用程序进行实时监控,所述目标应用程序类型包括客户端软件、Web软件和组合软件,所述应用服务器包括客户端应用服务器和Web应用服务器,所述对目标应用程序进行实时监控具体为对目标监控数据进行实时采集和监控,所述目标监控数据包括预定义的异常消息、事件和业务统计指标数据。
其中,所述目标应用程序即所要监控的软件系统,所述组合软件为同时兼顾Web软件和客户端软件两种形式的软件。
当目标应用程序类型为客户端软件时,选取客户端应用服务器对目标程序进行实时监控;若目标应用程序类型为Web软件,则选取Web应用服务器对目标应用程序进行实时监控;若目标应用程序类型为组合软件,则同时通过客户端应用服务器和Web应用服务器对其相应部分进行实时监控。
另外,在对目标监控数据进行实时采集和监控前,需要对目标监控数据进行预定义,即定义重点监控的异常消息、事件和业务统计指标数据,所述业务统计指标数据为对某项业务所要统计的指标,例如对于充值业务,可以统计充值成功次数、充值失败次数、登录POS机次数等指标,以便后续数据加工使用。
S12、应用服务器捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器。
在目标应用程序运行过程中,若生成了目标监控数据,则应用服务器对目标监控数据进行采集,对所采集的目标监控数据通过打包协议进行封装。一些实施方式中,所述打包协议可以采用Protobuf协议,Protobuf协议可以支持Java、C++、Python等多种语言环境,在C/S、B/S框架下运行,同时便于后续步骤中监控采集服务器能够方便地调用相关方法来完成目标监控数据的序列化和反序列化处理。
另外,经过封装后的目标监控数据,应当包括业务类型编号、源ID、活动ID、统计ID、统计值、统计值生成时间,其中,所述业务类型编号为业务平台/业务系统的唯一识别标识;所述源ID为同一业务平台/业务系统下划分出的不同子业务的唯一识别标识;所述活动ID用于在服务ID、源ID都相同的情况下用于进一步区分业务的唯一识别标识;所述统计ID为要统计的数据项的唯一识别标识;所述统计值为统计ID所对应的具体数值;所述统计值生成时间为统计值生成的具体时间。
S13、监控采集服务器接收到经过封装的目标监控数据后,进行反解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群。
其中,所述监控采集服务器为客户端应用服务器、Web应用服务器提供了一个标准、通用的消息接口,各个客户端应用服务器、Web应用服务器将采集到的目标监控数据通过该消息接口实时发送到监控采集服务器。
监控采集服务器接收到经过封装的目标监控数据后,基于打包协议对经过封装的目标监控数据进行反解析,根据预设的时间频率对目标监控数据进行汇总,并实现相关业务、业务源和指标的逻辑处理和转换,然后基于预设的时间频率将处理后的目标监控数据发送到监控数据库集群。
S14、监控数据库集群保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器。
其中,所述监控数据库集群主要用于永久或周期性保存目标监控数据,并基于不同的时间粒度对目标监控数据进行加工,以实现不同时间粒度的监控需求,以便于后续步骤中监控Web服务器调用相应时间粒度的目标监控数据向用户进行展现,所述时间粒度可以分为1分钟线、5分钟线、1小时线和每日线。
一些实施方式中,所述监控数据库集群可以是关系型数据库,例如Oracle、SQLServer、DataBase2,也可以是NoSQL数据库,例如MongoDB,还可以是其他数据库,这主要取决于采集和处理的软件系统业务健康度的指标的数量、监控频率和系统硬件、数据库的吞吐量。
S15、监控Web服务器接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控。
其中,所述监控Web服务器通过可视化人机界面为用户提供了一个业务监控视角以实现实时监控,同时用户可以通过监控Web服务器设置不同的刷新频率,以实现不同时间粒度的实时监控需求,根据监控内容,用户可以对被监控业务的健康度进行衡量,所述用户可以是企业的运维、运营、开发人员。
采用本实施例提供的实时监控软件系统业务健康度的方法,根据目标应用程序的类型选取相应的应用服务器对目标应用程序进行实时监控,采集相关业务数据和异常消息等目标监控数据,并通过监控采集服务器对目标监控数据进行实时的数据处理,提交到监控数据库集群进行保存,同时监控Web服务器以实时频度通过可视化人机界面向用户进行展示,从而起到及时监控、及时发现、分析和定位问题的作用,为系统安全、高效的运行提供强有力的支持。
可选的,所述步骤S12中,当Web应用服务器捕获到目标监控数据时,将目标监控数据发送至Qos服务器,Qos服务器接收各个Web应用服务器上传的目标监控数据,进行轻度汇总后,通过打包协议对目标监控数据进行封装后发送至监控采集服务器。Qos(Quality ofService)服务,在网络过载或堵塞时,能够保证传输带宽、降低传输时延、降低数据丢包率,由于Web应用服务的不确定性以及待监控业务指标随着业务规模的扩大也会逐渐增长,通过Qos服务器进行Web应用服务器目标监控数据的采集能够确保目标监控数据的传输不受延迟或丢弃,从而保证监控的实时性。
图2为本发明另一实施例提供的实时监控软件系统业务健康度方法流程示意图。
如图2所示,所述监控采集服务器接收到经过封装的目标监控数据后,进行反解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群,具体包括:
S131、监控采集服务器接收经过封装的目标监控数据,进行反解析,对目标监控数据进行序列化和反序列化处理,根据目标监控数据属性进行轻度汇总。
S132、部署一个计时器,根据计时器的频率判断当前为计数时间还是输出时间。
其中,在监控采集服务器内部部署一个计时器,所述计时器的频率可以预先设置,计时器的频率决定了展示的目标监控数据的实时程度,通过计时器的频率决定进行目标监控数据输出还是目标监控数据的计数器工作。
S133、若为计数时间,则对目标监控数据的计数器进行加一操作。
其中,若是计数时间,则对目标监控数据的业务统计指标数据在原来的值的基础上进行更新次数加一操作。计时器判断和计数器加一操作是实现实时监控软件系统业务健康度检查的粒度的基础。
S134、若为输出时间,则批量或单条输出目标监控数据到监控数据库集群进行永久性保存。
其中,当目标监控数据输出到监控数据库集群后,需要对预定义的业务统计指标数据的计数器/计量器属性进行判断,如果该指标是计数器属性,则需要对原指标值进行清空或置零操作。
一些实施方式中,监控采集服务器可以是将目标监控数据批量或单条以调用存储过程/程序的方式发送到监控数据库集群。
图3为本发明另一实施例提供的实时监控软件系统业务健康度方法流程示意图。
如图3所示,所述监控数据库集群保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器,具体包括:
S141、监控数据库集群对目标监控数据进行入库,入库后的目标监控数据生成业务监控的1分钟线。
其中,监控数据库集群通过调用存储过程和SQL的方式对目标监控数据进行入库,入库后的目标监控数据即可生成业务监控的1分钟线,1分钟粒度的目标监控数据对于较短的周期监控较为合适,出于不同监控周期和监控粒度的要求,需要对目标监控数据进行二次处理。
S142、设置第一定时任务,所述第一定时任务每5分钟执行一次处理数据命令,将1分钟线的目标监控数据汇总为5分钟线。
S143、设置第二定时任务,所述第二定时任务每一小时执行一次处理数据命令,将5分钟线的目标监控数据汇总成1小时线。
S144、设置第三定时任务,所述第三定时任务每一小时执行一次处理数据命令,将1小时线的目标监控数据汇总成每日线。
每次执行处理数据命令时,监控数据库集群都会将执行结果发送至监控Web服务器进行展示,以便监控Web服务器分别进行5分钟线、1小时线、每日线的监控数据展示。
图4为本发明另一实施例提供的实时监控软件系统业务健康度方法流程示意图。
如图4所示,所述监控Web服务器接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控,具体包括:
S151、对监控频率、业务类型、业务、业务源、统计指标进行配置。
其中,对监控频率进行配置,即设定监控业务系统健康度的实时频率,例如1分钟、5分钟,从而配合监控采集服务器上传目标监控数据的频率,以及监控数据库集群入库的频率。
对业务类型进行配置,即对业务类型进行相应的维护和管理,业务类型的属性主要包括业务类型编号和业务类型名称,其中业务类型编号可由系统自动生成,作为该业务类型的唯一识别标识,业务类型名称为各业务大类的统称,例如CRM系统、OA系统、人力资源管理系统等。
所述业务可以理解为系统的不同模块、服务,比如登录服务/模块,充值服务/模块,权限验证服务/模块等,每项业务的属性包括业务类型、业务编号和业务名称,所述业务类型为该业务所属的业务大类;业务编号由系统自动生成,作为该业务的唯一识别标识;业务名称为该类服务的统称,例如登录服务/模块。
所述业务源指某项具体服务,例如登录验证服务。对业务源进行配置,即对业务源进行相应的维护和管理。业务源的属性包括业务名称、业务源编号、业务源名称、业务源描述和业务源适用指标,其中,业务名称为该业务源所属业务名称,例如登录验证服务所属业务名称为登录服务/模块;所属业务源编号可由系统自动生成,作为该业务源的唯一识别标识;业务源名称可采用IP:Port:thread_id的形式,IP即提供服务的IP地址,Port为提供服务的端口号,thread_id即子服务,若没有thread_id则赋值为-1。一台服务器可能包含多个不同端口号,以提供不同服务,集群情况下不同服务器的相同端口号也可以提供相同服务。业务源适用指标用于说明相应业务源适用哪些指标。
所述统计指标为实时监控软件平台业务健康度的核心,对统计指标进行配置,即对业务统计指标进行相应的维护和管理。统计指标的属性包括业务名称、指标编号、指标名称、指标描述、计数器/计量器属性、指标级别,其中,业务名称为该统计指标所针对的业务名称,例如充值服务/模块;指标编号由系统自动生成,作为该统计指标的唯一识别标识;指标名称为相应业务所要统计的指标,例如充值成功次数、充值失败次数、登录POS机次数等;计数器/计量器属性用于明确该指标的统计规则是采用计数器统计还是计量器统计;指标描述用于辅助用户理解该统计指标的作用。指标级别用于描述相应统计指标的重要级别。
S152、对展示图表进行配置,所述展示图表包括单图表和复合图表。
其中,对单图表进行配置,即维护由多个业务构成的业务列表、由多个业务源构成的业务源列表、由多个统计指标构成的统计指标列表的对照关系,用户可以通过选择某个业务的单个或多个业务源、某个统计指标或多个统计指标的组合,实现对业务的监控,单图表将这些组合解析成可执行的SQL语句,并可设置该图表的名称以及该图表的上级名称,从而形成具有监控层次的树形目录菜单,监控Web服务器可以通过可视化人机界面进行相关图表的动态展示。
所述复合图表为一个或多个单图表的组合,用于将不同的单图表进行对比展示。单图表主要实现单个业务一组业务源内某个统计指标的监控,当然也可以实现多个统计指标的组合监控。复合图表则是为了实现相同业务不同统计指标、不同业务不同统计指标的对比,从而使用户获得更未完整的参考和对比,对复合图表的配置实际上是基于对单图表的单选或多选。
S153、根据预设配置对所接收的目标监控数据进行处理并通过可视化人机界面以展示图表的形式向用户展示。
其中,监控Web服务器可以通过单图表或复合图表的形式向用户展示监控数据。
单图表展示,可以实现基于单图表配置的监控业务或指标的可视化界面展示,在单图表界面中,根据监控频率配置中的频率设定进行各时间粒度的监控数据的展示,另外用户也可以选择不同的时间段进行历史和当前日期的监控和回顾。
复合图表展示,可以实现基于复合图表配置的监控业务或指标的可视化界面展示,复合图表除了具备单图表的功能和按照实时频率进行刷新外,还可以对所选择的单图表集合进行再选择,在监控过程中随时可以调节单图表的数量和类型,从而使用户获得更为精确的监控效果。
基于同样的发明构思,图5为本发明一实施例提供的实时监控软件系统业务健康度的系统结构示意图。
如图5所示,所述系统包括客户端软件应用服务器1、Web应用服务器2、监控采集服务器3、监控数据库集群4、监控Web服务器5。
其中,所述客户端软件应用服务器1,用于在判断目标应用程序类型为客户端软件或组合软件时,对目标应用程序进行实时监控,所述对目标应用程序进行实时监控具体为对目标监控数据进行实时采集和监控,还用于在捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后发送至监控采集服务器3,所述目标监控数据包括预定义的异常消息、事件和业务统计指标数据。
所述Web应用服务器2,用于在判断目标应用程序类型为Web软件或组合软件时,对目标应用程序进行实时监控,还用于在捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器3。
所述监控采集服务器3,用于在接收到经过封装的目标监控数据后,进行泛解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群4。
所述监控数据库集群4,用于保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器5。
所述监控Web服务器5,用于接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控。
可选的,所述系统还包括Qos服务器6,所述Qos服务器6用于接收各个Web应用服务器2上传的目标监控数据,进行轻度汇总,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器3。
可选的,所述监控采集服务器3包括:
接收模块,用于接收经过封装的目标监控数据,进行反解析,对目标监控数据进行序列化和反序列化处理,根据目标监控数据属性进行轻度汇总。
计时器模块,用于部署一个计时器,根据计时器频率判断当前为计数时间还是输出时间,若为计数时间,则对目标监控数据的计数器进行加一操作,若为输出时间,则批量或单条输出目标监控数据到监控数据库集群进行永久性保存。
可选的,所述监控数据库集群4包括:
入库模块,用于对目标监控数据进行入库,入库后的目标监控数据生成业务监控的1分钟线。
第一任务模块,用于设置第一定时任务,所述第一定时任务每5分钟执行一次处理数据命令,将1分钟线的目标监控数据汇总为5分钟线。
第二任务模块,用于设置第二定时任务,所述第二定时任务每一小时执行一次处理数据命令,将5分钟线的目标监控数据汇总成1小时线。
第三任务模块,用于设置第三定时任务,所述第三定时任务每一小时执行一次处理数据命令,将1小时线的目标监控数据汇总成每日线。
发送模块,用于在每次执行处理数据命令时,将执行结果发送至监控Web服务器5进行展示。
可选的,所述监控Web服务器5包括:
第一配置模块,用于对监控频率、业务类型、业务、业务源、统计指标进行配置。
第二配置模块,用于对展示图表进行配置,所述展示图表包括单图表和复合图表。
展示模块,用于根据预设配置对所接收的目标监控数据进行处理并通过可视化人机界面以展示图表的形式向用户展示。
所述系统用于执行前述实施例,其实现原理和技术效果可以参照前述方法实施例,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种实时监控软件系统业务健康度的方法,其特征在于,所述方法包括以下步骤:
判断目标应用程序类型,根据目标应用程序类型选取相应的应用服务器对目标应用程序进行实时监控,所述目标应用程序类型包括客户端软件、Web软件和组合软件,所述应用服务器包括客户端应用服务器和Web应用服务器,所述对目标应用程序进行实时监控具体为对目标监控数据进行实时采集和监控,所述目标监控数据包括预定义的异常消息、事件和业务统计指标数据;
应用服务器捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器;
监控采集服务器接收到经过封装的目标监控数据后,进行反解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群;
监控数据库集群保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器;
监控Web服务器接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控。
2.根据权利要求1所述的一种实时监控软件系统业务健康度的方法,其特征在于,当Web应用服务器捕获到目标监控数据时,先提交到Qos服务器,所述Qos服务器接收各个Web应用服务器上传的目标监控数据,进行轻度汇总,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器。
3.根据权利要求1所述的一种实时监控软件系统业务健康度的方法,其特征在于,所述监控采集服务器接收到经过封装的目标监控数据后,进行反解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群,具体包括:
监控采集服务器接收经过封装的目标监控数据,进行反解析,对目标监控数据进行序列化和反序列化处理,根据目标监控数据属性进行轻度汇总;
部署一个计时器,根据计时器的频率判断当前为计数时间还是输出时间;
若为计数时间,则对目标监控数据的计数器进行加一操作;
若为输出时间,则批量或单条输出目标监控数据到监控数据库集群进行永久性保存。
4.根据权利要求1所述的一种实时监控软件系统业务健康度的方法,其特征在于,所述监控数据库集群保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器,具体包括:
监控数据库集群对目标监控数据进行入库,入库后的目标监控数据生成业务监控的1分钟线;
设置第一定时任务,所述第一定时任务每5分钟执行一次处理数据命令,将1分钟线的目标监控数据汇总为5分钟线;
设置第二定时任务,所述第二定时任务每一小时执行一次处理数据命令,将5分钟线的目标监控数据汇总成1小时线;
设置第三定时任务,所述第三定时任务每一小时执行一次处理数据命令,将1小时线的目标监控数据汇总成每日线;
每次执行处理数据命令时,将执行结果发送至监控Web服务器进行展示。
5.根据权利要求1所述的一种实时监控软件系统业务健康度的方法,其特征在于,所述监控Web服务器接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控,具体包括:
对监控频率、业务类型、业务配置、业务源、统计指标进行配置;
对展示图表进行配置,所述展示图表包括单图表和复合图表;
根据预设配置对所接收的目标监控数据进行处理并通过可视化人机界面以展示图表的形式向用户展示。
6.一种实时监控软件系统业务健康度的系统,其特征在于,所述系统包括,
客户端软件应用服务器,用于在判断目标应用程序类型为客户端软件或组合软件时,对目标应用程序进行实时监控,所述对目标应用程序进行实时监控具体为对目标监控数据进行实时采集和监控,还用于在捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后发送至监控采集服务器,所述目标监控数据包括预定义的异常消息、事件和业务统计指标数据;
Web应用服务器,用于在判断目标应用程序类型为Web软件或组合软件时,对目标应用程序进行实时监控,还用于在捕获到目标监控数据时,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器;
监控采集服务器,用于在接收到经过封装的目标监控数据后,进行泛解析,对目标监控数据进行汇总和逻辑处理后发送至监控数据库集群;
监控数据库集群,用于保存目标监控数据,基于不同的时间粒度对目标监控数据进行加工后发送至监控Web服务器;
监控Web服务器,用于接收不同时间粒度的目标监控数据并通过可视化人机界面进行展示以实现实时监控。
7.根据权利要求6所述的一种实时监控软件系统业务健康度的系统,其特征在于,所述系统还包括Qos服务器,所述Qos服务器用于接收各个Web应用服务器上传的目标监控数据,进行轻度汇总,通过打包协议对目标监控数据进行封装后实时发送至监控采集服务器。
8.根据权利要求6所述的一种实时监控软件系统业务健康度的系统,其特征在于,所述监控采集服务器包括,
接收模块,用于接收经过封装的目标监控数据,进行反解析,对目标监控数据进行序列化和反序列化处理,根据目标监控数据属性进行轻度汇总;
计时器模块,用于部署一个计时器,根据计时器频率判断当前为计数时间还是输出时间,若为计数时间,则对目标监控数据的计数器进行加一操作,若为输出时间,则批量或单条输出目标监控数据到监控数据库集群进行永久性保存。
9.根据权利要求6所述的一种实时监控软件系统业务健康度的系统,其特征在于,所述监控数据库集群包括,
入库模块,用于对目标监控数据进行入库,入库后的目标监控数据生成业务监控的1分钟线;
第一任务模块,用于设置第一定时任务,所述第一定时任务每5分钟执行一次处理数据命令,将1分钟线的目标监控数据汇总为5分钟线;
第二任务模块,用于设置第二定时任务,所述第二定时任务每一小时执行一次处理数据命令,将5分钟线的目标监控数据汇总成1小时线;
第三任务模块,用于设置第三定时任务,所述第三定时任务每一小时执行一次处理数据命令,将1小时线的目标监控数据汇总成每日线;
发送模块,用于在每次执行处理数据命令时,将执行结果发送至监控Web服务器进行展示。
10.根据权利要求6所述的一种实时监控软件系统业务健康度的系统,其特征在于,所述监控Web服务器包括,
第一配置模块,用于对监控频率、业务类型、业务、业务源、统计指标进行配置;
第二配置模块,用于对展示图表进行配置,所述展示图表包括单图表和复合图表;
展示模块,用于根据预设配置对所接收的目标监控数据进行处理并通过可视化人机界面以展示图表的形式向用户展示。
CN201910934320.7A 2019-09-29 2019-09-29 实时监控软件系统业务健康度的方法和系统 Active CN110633191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910934320.7A CN110633191B (zh) 2019-09-29 2019-09-29 实时监控软件系统业务健康度的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910934320.7A CN110633191B (zh) 2019-09-29 2019-09-29 实时监控软件系统业务健康度的方法和系统

Publications (2)

Publication Number Publication Date
CN110633191A true CN110633191A (zh) 2019-12-31
CN110633191B CN110633191B (zh) 2023-07-28

Family

ID=68973376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910934320.7A Active CN110633191B (zh) 2019-09-29 2019-09-29 实时监控软件系统业务健康度的方法和系统

Country Status (1)

Country Link
CN (1) CN110633191B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231173A (zh) * 2020-09-29 2021-01-15 厦门卫星定位应用股份有限公司 原始数据流转的实时监控方法及装置
CN112783745A (zh) * 2021-02-02 2021-05-11 无锡车联天下信息技术有限公司 一种集群数据的监控方法、装置、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154861A1 (en) * 2006-12-22 2008-06-26 Hon Hai Precision Industry Co., Ltd. System and method for retrieving data from different types of data sources
CN101483545A (zh) * 2008-12-31 2009-07-15 中国建设银行股份有限公司 一种金融业务监控方法及系统
CN103888287A (zh) * 2013-12-18 2014-06-25 北京首都国际机场股份有限公司 信息系统一体化运维监控服务预警平台及其实现方法
CN107133240A (zh) * 2016-02-29 2017-09-05 阿里巴巴集团控股有限公司 页面监控方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154861A1 (en) * 2006-12-22 2008-06-26 Hon Hai Precision Industry Co., Ltd. System and method for retrieving data from different types of data sources
CN101483545A (zh) * 2008-12-31 2009-07-15 中国建设银行股份有限公司 一种金融业务监控方法及系统
CN103888287A (zh) * 2013-12-18 2014-06-25 北京首都国际机场股份有限公司 信息系统一体化运维监控服务预警平台及其实现方法
CN107133240A (zh) * 2016-02-29 2017-09-05 阿里巴巴集团控股有限公司 页面监控方法、装置及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231173A (zh) * 2020-09-29 2021-01-15 厦门卫星定位应用股份有限公司 原始数据流转的实时监控方法及装置
CN112783745A (zh) * 2021-02-02 2021-05-11 无锡车联天下信息技术有限公司 一种集群数据的监控方法、装置、系统及存储介质

Also Published As

Publication number Publication date
CN110633191B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
WO2023246347A1 (zh) 数字孪生处理方法及数字孪生系统
WO2021169268A1 (zh) 数据处理方法、装置、设备和存储介质
US20060026467A1 (en) Method and apparatus for automatically discovering of application errors as a predictive metric for the functional health of enterprise applications
CN107888452B (zh) 一种24小时分布式网站性能监测和实时告警方法
US20030167180A1 (en) System and methods for determining contract compliance
CN107104840A (zh) 一种日志监控方法、装置及系统
CN104917627B (zh) 一种用于大型服务器集群的日志集群扫描与分析方法
CN109684052A (zh) 事务分析方法、装置、设备及存储介质
CN110581773A (zh) 一种自动化服务监控与报警管理系统
CN1763778A (zh) 使用关联图和运行时行为模型确定问题的系统和方法
US7779113B1 (en) Audit management system for networks
WO2022237506A1 (zh) 在线问诊业务监控方法、装置、设备及存储介质
CN110620699B (zh) 消息到达率确定方法、装置、设备和计算机可读存储介质
CN111585840A (zh) 服务资源监测方法、装置和设备
CN114090366A (zh) 一种监控数据的方法、装置和系统
CN113746703B (zh) 一种异常链路监控方法、系统和装置
CN110633191B (zh) 实时监控软件系统业务健康度的方法和系统
CN113641567B (zh) 一种数据库巡检方法、装置、电子设备及存储介质
WO2024164730A1 (zh) 一种混合云管的异常实时上报方法、系统、设备和介质
CN113157521B (zh) 用于区块链全生命周期的监控方法和监控系统
CN106534162A (zh) 一种基于远程管理通讯协议的服务器温度监控系统及方法
WO2019237592A1 (zh) 数据监控方法、装置、计算机设备及存储介质
CN116961241B (zh) 一种基于电网业务的统一应用监测平台
US20180329792A1 (en) Network device monitoring
CN102480369A (zh) 一种网络管理系统及性能采集的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant