CN103475544A - 一种基于云资源监控平台的业务监控方法 - Google Patents

一种基于云资源监控平台的业务监控方法 Download PDF

Info

Publication number
CN103475544A
CN103475544A CN2013104255734A CN201310425573A CN103475544A CN 103475544 A CN103475544 A CN 103475544A CN 2013104255734 A CN2013104255734 A CN 2013104255734A CN 201310425573 A CN201310425573 A CN 201310425573A CN 103475544 A CN103475544 A CN 103475544A
Authority
CN
China
Prior art keywords
monitoring
business
resource
analysis
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013104255734A
Other languages
English (en)
Inventor
陆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2013104255734A priority Critical patent/CN103475544A/zh
Publication of CN103475544A publication Critical patent/CN103475544A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种基于云资源监控平台的业务监控方法,基于云资源监控平台的业务监控子系统,业务依赖资源分析单元和业务关联监控参数分析与处理单元。其中,基于云资源监控平台的业务监控子系统负责协调各个单元模块;业务依赖资源分析单元主要负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量等;业务关联监控参数分析与处理单元负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略等。该一种基于云资源监控平台的业务监控方法和现有技术相比,真正意义上实现对某项业务应用进行高可靠性的、准确的监控,实用性强,易于推广。

Description

一种基于云资源监控平台的业务监控方法
 
技术领域
    本发明涉及云技术的应用领域,具体的说是一种基于云资源监控平台的业务监控方法。
背景技术
当前,基于云平台的监控应用越来越广泛,对业务监控的可靠性也越来越高,由于传统的业务监控只针对业务相关的各资源进行单个监控,具体到业务的运行情况、资源使用情况需要人为的去进行判断和计算,无法实现直接对业务进行具备高可靠性的监控。但在实际应用中,特别是对关键的、重要的业务进行监控时,传统的业务监控方式已经无法达到使用需求,监控结果不准确、太片面,当业务出现问题时,无法准确的判断和定位业务出问题的原因。
为了解决传统业务监控方式存在的各种问题,使对业务的监控做到更可靠、精准,我们提出一种基于云资源监控平台的、高可靠的、全面精准的业务监控方法。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种基于云资源监控平台的业务监控方法。
本发明的技术方案是按以下方式实现的,该一种基于云资源监控平台的业务监控方法,其结构包括:
基于云资源监控平台的业务监控子系统,是该方法的载体,负责协调各个单元模块;
业务依赖资源分析单元,负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量;
业务关联监控参数分析与处理单元,负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略,进而实现当某项关联的监控参数出现问题或告警时能够准确无误的反馈该业务的运行状况、健康状况及趋势分析;
其具体监控过程如下:
一、在基于云资源监控平台的业务监控子系统中,先由业务依赖资源分析单元对业务所依赖的资源进行分析,再对业务所依赖的各资源的正常使用情况进行分析,获取到资源列表及正常资源使用率等参数信息;
二、业务关联监控参数分析与处理单元在获取到所需的各项参数信息后,就会进行分析及处理,最终得出监控该业务所需的一个整体的、有依赖优先级的、可靠的业务监控组方案,其中包括了监控该业务所有关联的监控项及监控参数、告警阀值;
三、由子系统进行调度完成对业务的高可靠性监控。
所述业务依赖资源分析单元和业务关联监控参数分析与处理单元都模块化处理,即,业务关联监控参数分析与处理只需要业务依赖资源分析模块提供分析的结果数据,业务依赖资源分析模块是独立于业务关联监控参数分析与处理模块存在的。
本发明与现有技术相比所产生的有益效果是:
本发明的一种基于云资源监控平台的业务监控方法打破了传统的只能单独监控服务器硬件、网络设备、数据库应用、Web应用等资源的方法,通过对业务应用所涉及到的资源进行细致的分析,建立相应的业务监控组,综合各种资源的监控参数并分析设置各监控参数的优先级顺序,真正意义上实现对某项业务应用进行高可靠性的、准确的监控,使与业务紧密关联的各项监控参数作为一个整体来保证对此项业务精确的、可靠的监控,实用性强,易于推广。
附图说明
附图1是本发明的业务监控进程实现流程图。
附图2是本发明的实施例的实现流程图。
具体实施方式
下面结合附图对本发明的一种基于云资源监控平台的业务监控方法作详细说明。
如附图1所示,现提供一种基于云资源监控平台的业务监控方法,其结构包括:
基于云资源监控平台的业务监控子系统,业务依赖资源分析单元,业务关联监控参数分析与处理单元。其中:
基于云资源监控平台的业务监控子系统是该方法的载体,负责协调各个单元模块;
业务依赖资源分析单元主要负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量等。如一个网站业务要依赖于至少一台服务器及运行的某种操作系统、一台路由器/交换机、一种Web应用服务、一种数据库应用服务等,及其相应的各资源的使用量(业务所需的磁盘容量、网络带宽占用量、Web应用的负载、数据库存储空间的大小等);
业务关联监控参数分析与处理单元是该方法的核心,负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略等,进而实现当某项关联的监控参数出现问题或告警时能够准确无误的反馈该业务的运行状况、健康状况及趋势分析。如某网站业务相关的监控参数及优先依赖关系可以这样定义,一台运行Linux系统的物理服务器的CPU利用率、内存利用率、网络接口流量、磁盘分区利用率、风扇转速、主板电压、内存温度、CPU温度等(一级依赖优先级);一台网络设备的端口状态、端口流量(二级依赖优先级);一个Tomcat应用的内存使用情况、CPU使用情况等(三级依赖优先级);一个Mysql数据库的表空间利用率、当前连接数等(四级依赖优先级)。其中,这里的依赖优先级是根据不同的业务类型、业务性质来确定的,主要取决于业务所依赖的程度,比如上边的例子,当这个网站业务所在的物理服务器直接坏掉后,此业务将肯定停止运行,所以依赖优先级必然较高。
其具体监控过程如下:
一、在基于云资源监控平台的业务监控子系统中,先由业务依赖资源分析单元对业务所依赖的资源进行分析,再对业务所依赖的各资源的正常使用情况进行分析,获取到资源列表及正常资源使用率等参数信息;
二、业务关联监控参数分析与处理单元在获取到所需的各项参数信息后,就会进行分析及处理,最终得出监控该业务所需的一个整体的、有依赖优先级的、可靠的业务监控组方案,其中包括了监控该业务所有关联的监控项及监控参数、告警阀值;
三、由子系统进行调度完成对业务的高可靠性监控。
所述业务依赖资源分析单元和业务关联监控参数分析与处理单元都模块化处理,即,业务关联监控参数分析与处理只需要业务依赖资源分析模块提供分析的结果数据,业务依赖资源分析模块是独立于业务关联监控参数分析与处理模块存在的。
在体系结构中,通过业务依赖资源分析单元,对业务依赖的资源及资源使用情况进行分析,获取其资源列表、各资源的使用情况、各资源被业务依赖的优先级等各项数据,经过业务关联监控参数分析与处理模块分析与处理后,得到业务监控所需的、作为一个整体业务组存在的各资源监控参数及关联关系,进而实现高可靠性的业务监控。
如附图2所示,以下用一个网站业务监控的实施例说明高可靠性业务监控系统的实施过程:
(1)分析该网站业务所依赖的资源,包括运行Linux操作系统的虚拟机、该网站所使用的网络环境中的路由器/交换机、该网站所使用的Web服务器Tomcat、该网站所使用的数据库Mysql 5.0以及该网站应用所在的云资源平台;
(2)分析该网站业务所依赖各资源的监控参数,如运行Linux操作系统的虚拟机需要监控其CPU负载情况、内存利用率、磁盘利用率、网络接口流量等,所依赖的云资源平台则要监控其计算节点、物理节点、存储节点及网络情况等,其他资源的监控参数略。并预设各监控参数所需的告警阀值,即在阀值范围内为正常,超出阀值范围为不正常;
(3)分析该网站业务所依赖各资源的相互依赖优先级,这里根据资源关键程度进行依赖优先级排定为:一级依赖优先级(该网站应用所在的云资源平台)、二级依赖优先级(运行Linux操作系统的虚拟机)、三级依赖优先级(该网站所使用的网络环境中的路由器/交换机)、四级依赖优先级(该网站所使用的Web服务器Tomcat)、五级依赖优先级(该网站所使用的数据库Mysql 5.0);
(4)部署应用前三个步骤中分析出的数据,使业务监控系统运行,并调用各资源监控进程开始对各资源进行监控,如图2中所示,得出各资源的状态是否正常,然后如图1中所示,按分析出的依赖优先级一级一级的得出最终的监控结果,该网站业务状态是否正常。
除说明书所述的技术特征外,均为本专业技术人员的公知技术。

Claims (2)

1.一种基于云资源监控平台的业务监控方法,其特征在于,其结构包括:
基于云资源监控平台的业务监控子系统,是该方法的载体,负责协调各个单元模块;
业务依赖资源分析单元,负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量;
业务关联监控参数分析与处理单元,负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略,进而实现当某项关联的监控参数出现问题或告警时能够准确无误的反馈该业务的运行状况、健康状况及趋势分析;
其具体监控过程如下:
一、在基于云资源监控平台的业务监控子系统中,先由业务依赖资源分析单元对业务所依赖的资源进行分析,再对业务所依赖的各资源的正常使用情况进行分析,获取到资源列表及正常资源使用率等参数信息;
二、业务关联监控参数分析与处理单元在获取到所需的各项参数信息后,就会进行分析及处理,最终得出监控该业务所需的一个整体的、有依赖优先级的、可靠的业务监控组方案,其中包括了监控该业务所有关联的监控项及监控参数、告警阀值;
三、由子系统进行调度完成对业务的高可靠性监控。
2.根据权利要求1所述的一种基于云资源监控平台的业务监控方法,其特征在于,所述业务依赖资源分析单元和业务关联监控参数分析与处理单元都模块化处理,即,业务关联监控参数分析与处理只需要业务依赖资源分析模块提供分析的结果数据,业务依赖资源分析模块是独立于业务关联监控参数分析与处理模块存在的。
CN2013104255734A 2013-09-18 2013-09-18 一种基于云资源监控平台的业务监控方法 Pending CN103475544A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013104255734A CN103475544A (zh) 2013-09-18 2013-09-18 一种基于云资源监控平台的业务监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013104255734A CN103475544A (zh) 2013-09-18 2013-09-18 一种基于云资源监控平台的业务监控方法

Publications (1)

Publication Number Publication Date
CN103475544A true CN103475544A (zh) 2013-12-25

Family

ID=49800254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013104255734A Pending CN103475544A (zh) 2013-09-18 2013-09-18 一种基于云资源监控平台的业务监控方法

Country Status (1)

Country Link
CN (1) CN103475544A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763126A (zh) * 2013-12-27 2014-04-30 乐视网信息技术(北京)股份有限公司 监控数据库的系统、方法及数据库监控装置
CN103780696A (zh) * 2014-01-23 2014-05-07 北京荣之联科技股份有限公司 基于分布式推送的云监控方法、装置及系统
CN103905533A (zh) * 2014-03-13 2014-07-02 广州杰赛科技股份有限公司 基于云存储的分布式告警监控方法和系统
CN104331354A (zh) * 2014-11-20 2015-02-04 普华基础软件股份有限公司 一种云计算的实时综合监控方法
CN105183610A (zh) * 2015-09-22 2015-12-23 浪潮集团有限公司 一种基于资源依赖关系的云数据中心业务监控系统及方法
CN105243004A (zh) * 2015-09-15 2016-01-13 浪潮集团有限公司 一种故障资源检测方法及装置
CN105471625A (zh) * 2015-11-16 2016-04-06 杭州东信北邮信息技术有限公司 一种资源池业务健康的监控方法和系统
CN105553717A (zh) * 2015-12-14 2016-05-04 上海携程商务有限公司 呼叫中心及其监控系统
CN106055449A (zh) * 2016-05-12 2016-10-26 深圳市永兴元科技有限公司 一种基于资源依赖关系的云数据监控方法及装置
CN106453544A (zh) * 2016-09-30 2017-02-22 郑州云海信息技术有限公司 一种云环境及其监控方法、系统
CN106453504A (zh) * 2016-09-13 2017-02-22 杭州东方通信软件技术有限公司 一种基于nginx服务器集群的监控系统及方法
CN106649055A (zh) * 2017-01-10 2017-05-10 山东浪潮云服务信息科技有限公司 一种基于国产cpu和操作系统的软硬件故障告警系统及方法
CN107566150A (zh) * 2016-07-01 2018-01-09 华为技术有限公司 处理云资源的方法和物理节点
CN108737197A (zh) * 2018-06-20 2018-11-02 郑州云海信息技术有限公司 一种云环境下的故障预测方法及装置
CN111092751A (zh) * 2019-11-26 2020-05-01 中盈优创资讯科技有限公司 监控数据处理方法及装置
CN112214382A (zh) * 2016-12-16 2021-01-12 华为技术有限公司 告警方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754664B1 (en) * 1999-07-02 2004-06-22 Microsoft Corporation Schema-based computer system health monitoring
CN101984415A (zh) * 2010-11-02 2011-03-09 中兴通讯股份有限公司 一种设定监控指标阈值的方法和装置
CN102571413A (zh) * 2011-12-02 2012-07-11 曙光信息产业(北京)有限公司 一种集群环境下资源管理的方法
CN103152438A (zh) * 2013-04-09 2013-06-12 上海理想信息产业(集团)有限公司 一种云计算环境下业务健康度获取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754664B1 (en) * 1999-07-02 2004-06-22 Microsoft Corporation Schema-based computer system health monitoring
CN101984415A (zh) * 2010-11-02 2011-03-09 中兴通讯股份有限公司 一种设定监控指标阈值的方法和装置
CN102571413A (zh) * 2011-12-02 2012-07-11 曙光信息产业(北京)有限公司 一种集群环境下资源管理的方法
CN103152438A (zh) * 2013-04-09 2013-06-12 上海理想信息产业(集团)有限公司 一种云计算环境下业务健康度获取方法

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763126A (zh) * 2013-12-27 2014-04-30 乐视网信息技术(北京)股份有限公司 监控数据库的系统、方法及数据库监控装置
CN103780696A (zh) * 2014-01-23 2014-05-07 北京荣之联科技股份有限公司 基于分布式推送的云监控方法、装置及系统
CN103905533A (zh) * 2014-03-13 2014-07-02 广州杰赛科技股份有限公司 基于云存储的分布式告警监控方法和系统
CN104331354A (zh) * 2014-11-20 2015-02-04 普华基础软件股份有限公司 一种云计算的实时综合监控方法
CN105243004A (zh) * 2015-09-15 2016-01-13 浪潮集团有限公司 一种故障资源检测方法及装置
CN105183610B (zh) * 2015-09-22 2018-12-14 浪潮集团有限公司 一种基于资源依赖关系的云数据中心业务监控系统及方法
CN105183610A (zh) * 2015-09-22 2015-12-23 浪潮集团有限公司 一种基于资源依赖关系的云数据中心业务监控系统及方法
CN105471625A (zh) * 2015-11-16 2016-04-06 杭州东信北邮信息技术有限公司 一种资源池业务健康的监控方法和系统
CN105471625B (zh) * 2015-11-16 2018-09-21 杭州东信北邮信息技术有限公司 一种资源池业务健康的监控方法和系统
CN105553717B (zh) * 2015-12-14 2019-07-26 上海携程商务有限公司 呼叫中心及其监控系统
CN105553717A (zh) * 2015-12-14 2016-05-04 上海携程商务有限公司 呼叫中心及其监控系统
CN106055449A (zh) * 2016-05-12 2016-10-26 深圳市永兴元科技有限公司 一种基于资源依赖关系的云数据监控方法及装置
CN106055449B (zh) * 2016-05-12 2019-02-26 深圳市永兴元科技股份有限公司 一种基于资源依赖关系的云数据监控方法及装置
CN107566150A (zh) * 2016-07-01 2018-01-09 华为技术有限公司 处理云资源的方法和物理节点
CN107566150B (zh) * 2016-07-01 2020-04-28 华为技术有限公司 处理云资源的方法和物理节点
US10897431B2 (en) 2016-07-01 2021-01-19 Huawei Technologies Co., Ltd. Cloud resource processing method and physical node
CN106453504A (zh) * 2016-09-13 2017-02-22 杭州东方通信软件技术有限公司 一种基于nginx服务器集群的监控系统及方法
CN106453544A (zh) * 2016-09-30 2017-02-22 郑州云海信息技术有限公司 一种云环境及其监控方法、系统
CN106453544B (zh) * 2016-09-30 2020-02-07 苏州浪潮智能科技有限公司 一种云环境及其监控方法、系统
CN112214382A (zh) * 2016-12-16 2021-01-12 华为技术有限公司 告警方法及装置
CN106649055A (zh) * 2017-01-10 2017-05-10 山东浪潮云服务信息科技有限公司 一种基于国产cpu和操作系统的软硬件故障告警系统及方法
CN108737197A (zh) * 2018-06-20 2018-11-02 郑州云海信息技术有限公司 一种云环境下的故障预测方法及装置
CN111092751A (zh) * 2019-11-26 2020-05-01 中盈优创资讯科技有限公司 监控数据处理方法及装置
CN111092751B (zh) * 2019-11-26 2022-04-19 中盈优创资讯科技有限公司 监控数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN103475544A (zh) 一种基于云资源监控平台的业务监控方法
US10031671B2 (en) Method, apparatus, and system for calculating identification threshold to distinguish cold data and hot data
CN102694868B (zh) 一种集群系统实现及任务动态分配方法
WO2021129367A1 (zh) 一种监控分布式存储系统的方法及装置
US8661283B2 (en) Power distribution unit-device correlation
CN108595306B (zh) 一种面向混部云的服务性能测试方法
CN106027328B (zh) 一种基于应用容器部署的集群监控的方法及系统
WO2015101089A1 (zh) 大规模集群的管理方法、装置和系统
CN102135932A (zh) 一种监控系统及监控方法
CN112311617A (zh) 一种配置化数据监控告警方法及系统
CN103095599A (zh) 一种云计算操作系统中动态反馈加权综合负载调度方法
CN106210124B (zh) 一种统一的云数据中心监控系统
CN105592122A (zh) 一种云平台监控方法以及云平台监控系统
CN111966289A (zh) 基于Kafka集群的分区优化方法和系统
CN104580194A (zh) 面向视频应用的虚拟化资源管理方法及装置
CN112367384A (zh) 基于Kafka集群的动态限速方法、装置以及计算机设备
CN116016276A (zh) 服务器健康状态检测方法和装置
CN104834584A (zh) 一种监测主机硬件负载的方法和系统
CN111240936A (zh) 一种数据完整性校验的方法及设备
CN106886477B (zh) 一种云系统中监控阈值设定方法及装置
CN110868330B (zh) 云平台可划分cpu资源的评估方法、装置及评估系统
CN102546652B (zh) 一种服务器负载平衡系统及方法
CN104268004A (zh) 一种云计算操作系统下的虚拟机迁移方法
CN102708035A (zh) 一种基于模式匹配的集群系统监控方法
CN103902445A (zh) 一种回归测试对象确定方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131225

WD01 Invention patent application deemed withdrawn after publication