CN103475544A - 一种基于云资源监控平台的业务监控方法 - Google Patents
一种基于云资源监控平台的业务监控方法 Download PDFInfo
- Publication number
- CN103475544A CN103475544A CN2013104255734A CN201310425573A CN103475544A CN 103475544 A CN103475544 A CN 103475544A CN 2013104255734 A CN2013104255734 A CN 2013104255734A CN 201310425573 A CN201310425573 A CN 201310425573A CN 103475544 A CN103475544 A CN 103475544A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- business
- resource
- analysis
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供一种基于云资源监控平台的业务监控方法,基于云资源监控平台的业务监控子系统,业务依赖资源分析单元和业务关联监控参数分析与处理单元。其中,基于云资源监控平台的业务监控子系统负责协调各个单元模块;业务依赖资源分析单元主要负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量等;业务关联监控参数分析与处理单元负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略等。该一种基于云资源监控平台的业务监控方法和现有技术相比,真正意义上实现对某项业务应用进行高可靠性的、准确的监控,实用性强,易于推广。
Description
技术领域
本发明涉及云技术的应用领域,具体的说是一种基于云资源监控平台的业务监控方法。
背景技术
当前,基于云平台的监控应用越来越广泛,对业务监控的可靠性也越来越高,由于传统的业务监控只针对业务相关的各资源进行单个监控,具体到业务的运行情况、资源使用情况需要人为的去进行判断和计算,无法实现直接对业务进行具备高可靠性的监控。但在实际应用中,特别是对关键的、重要的业务进行监控时,传统的业务监控方式已经无法达到使用需求,监控结果不准确、太片面,当业务出现问题时,无法准确的判断和定位业务出问题的原因。
为了解决传统业务监控方式存在的各种问题,使对业务的监控做到更可靠、精准,我们提出一种基于云资源监控平台的、高可靠的、全面精准的业务监控方法。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种基于云资源监控平台的业务监控方法。
本发明的技术方案是按以下方式实现的,该一种基于云资源监控平台的业务监控方法,其结构包括:
基于云资源监控平台的业务监控子系统,是该方法的载体,负责协调各个单元模块;
业务依赖资源分析单元,负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量;
业务关联监控参数分析与处理单元,负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略,进而实现当某项关联的监控参数出现问题或告警时能够准确无误的反馈该业务的运行状况、健康状况及趋势分析;
其具体监控过程如下:
一、在基于云资源监控平台的业务监控子系统中,先由业务依赖资源分析单元对业务所依赖的资源进行分析,再对业务所依赖的各资源的正常使用情况进行分析,获取到资源列表及正常资源使用率等参数信息;
二、业务关联监控参数分析与处理单元在获取到所需的各项参数信息后,就会进行分析及处理,最终得出监控该业务所需的一个整体的、有依赖优先级的、可靠的业务监控组方案,其中包括了监控该业务所有关联的监控项及监控参数、告警阀值;
三、由子系统进行调度完成对业务的高可靠性监控。
所述业务依赖资源分析单元和业务关联监控参数分析与处理单元都模块化处理,即,业务关联监控参数分析与处理只需要业务依赖资源分析模块提供分析的结果数据,业务依赖资源分析模块是独立于业务关联监控参数分析与处理模块存在的。
本发明与现有技术相比所产生的有益效果是:
本发明的一种基于云资源监控平台的业务监控方法打破了传统的只能单独监控服务器硬件、网络设备、数据库应用、Web应用等资源的方法,通过对业务应用所涉及到的资源进行细致的分析,建立相应的业务监控组,综合各种资源的监控参数并分析设置各监控参数的优先级顺序,真正意义上实现对某项业务应用进行高可靠性的、准确的监控,使与业务紧密关联的各项监控参数作为一个整体来保证对此项业务精确的、可靠的监控,实用性强,易于推广。
附图说明
附图1是本发明的业务监控进程实现流程图。
附图2是本发明的实施例的实现流程图。
具体实施方式
下面结合附图对本发明的一种基于云资源监控平台的业务监控方法作详细说明。
如附图1所示,现提供一种基于云资源监控平台的业务监控方法,其结构包括:
基于云资源监控平台的业务监控子系统,业务依赖资源分析单元,业务关联监控参数分析与处理单元。其中:
基于云资源监控平台的业务监控子系统是该方法的载体,负责协调各个单元模块;
业务依赖资源分析单元主要负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量等。如一个网站业务要依赖于至少一台服务器及运行的某种操作系统、一台路由器/交换机、一种Web应用服务、一种数据库应用服务等,及其相应的各资源的使用量(业务所需的磁盘容量、网络带宽占用量、Web应用的负载、数据库存储空间的大小等);
业务关联监控参数分析与处理单元是该方法的核心,负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略等,进而实现当某项关联的监控参数出现问题或告警时能够准确无误的反馈该业务的运行状况、健康状况及趋势分析。如某网站业务相关的监控参数及优先依赖关系可以这样定义,一台运行Linux系统的物理服务器的CPU利用率、内存利用率、网络接口流量、磁盘分区利用率、风扇转速、主板电压、内存温度、CPU温度等(一级依赖优先级);一台网络设备的端口状态、端口流量(二级依赖优先级);一个Tomcat应用的内存使用情况、CPU使用情况等(三级依赖优先级);一个Mysql数据库的表空间利用率、当前连接数等(四级依赖优先级)。其中,这里的依赖优先级是根据不同的业务类型、业务性质来确定的,主要取决于业务所依赖的程度,比如上边的例子,当这个网站业务所在的物理服务器直接坏掉后,此业务将肯定停止运行,所以依赖优先级必然较高。
其具体监控过程如下:
一、在基于云资源监控平台的业务监控子系统中,先由业务依赖资源分析单元对业务所依赖的资源进行分析,再对业务所依赖的各资源的正常使用情况进行分析,获取到资源列表及正常资源使用率等参数信息;
二、业务关联监控参数分析与处理单元在获取到所需的各项参数信息后,就会进行分析及处理,最终得出监控该业务所需的一个整体的、有依赖优先级的、可靠的业务监控组方案,其中包括了监控该业务所有关联的监控项及监控参数、告警阀值;
三、由子系统进行调度完成对业务的高可靠性监控。
所述业务依赖资源分析单元和业务关联监控参数分析与处理单元都模块化处理,即,业务关联监控参数分析与处理只需要业务依赖资源分析模块提供分析的结果数据,业务依赖资源分析模块是独立于业务关联监控参数分析与处理模块存在的。
在体系结构中,通过业务依赖资源分析单元,对业务依赖的资源及资源使用情况进行分析,获取其资源列表、各资源的使用情况、各资源被业务依赖的优先级等各项数据,经过业务关联监控参数分析与处理模块分析与处理后,得到业务监控所需的、作为一个整体业务组存在的各资源监控参数及关联关系,进而实现高可靠性的业务监控。
如附图2所示,以下用一个网站业务监控的实施例说明高可靠性业务监控系统的实施过程:
(1)分析该网站业务所依赖的资源,包括运行Linux操作系统的虚拟机、该网站所使用的网络环境中的路由器/交换机、该网站所使用的Web服务器Tomcat、该网站所使用的数据库Mysql 5.0以及该网站应用所在的云资源平台;
(2)分析该网站业务所依赖各资源的监控参数,如运行Linux操作系统的虚拟机需要监控其CPU负载情况、内存利用率、磁盘利用率、网络接口流量等,所依赖的云资源平台则要监控其计算节点、物理节点、存储节点及网络情况等,其他资源的监控参数略。并预设各监控参数所需的告警阀值,即在阀值范围内为正常,超出阀值范围为不正常;
(3)分析该网站业务所依赖各资源的相互依赖优先级,这里根据资源关键程度进行依赖优先级排定为:一级依赖优先级(该网站应用所在的云资源平台)、二级依赖优先级(运行Linux操作系统的虚拟机)、三级依赖优先级(该网站所使用的网络环境中的路由器/交换机)、四级依赖优先级(该网站所使用的Web服务器Tomcat)、五级依赖优先级(该网站所使用的数据库Mysql 5.0);
(4)部署应用前三个步骤中分析出的数据,使业务监控系统运行,并调用各资源监控进程开始对各资源进行监控,如图2中所示,得出各资源的状态是否正常,然后如图1中所示,按分析出的依赖优先级一级一级的得出最终的监控结果,该网站业务状态是否正常。
除说明书所述的技术特征外,均为本专业技术人员的公知技术。
Claims (2)
1.一种基于云资源监控平台的业务监控方法,其特征在于,其结构包括:
基于云资源监控平台的业务监控子系统,是该方法的载体,负责协调各个单元模块;
业务依赖资源分析单元,负责分析业务的类型和特点,确定该业务所依赖的各项资源及各资源的使用量;
业务关联监控参数分析与处理单元,负责对业务相关各资源的监控参数进行全面分析,确定各监控参数依赖的优先级顺序及合理的监控数据采集频率、告警阀值、通知策略,进而实现当某项关联的监控参数出现问题或告警时能够准确无误的反馈该业务的运行状况、健康状况及趋势分析;
其具体监控过程如下:
一、在基于云资源监控平台的业务监控子系统中,先由业务依赖资源分析单元对业务所依赖的资源进行分析,再对业务所依赖的各资源的正常使用情况进行分析,获取到资源列表及正常资源使用率等参数信息;
二、业务关联监控参数分析与处理单元在获取到所需的各项参数信息后,就会进行分析及处理,最终得出监控该业务所需的一个整体的、有依赖优先级的、可靠的业务监控组方案,其中包括了监控该业务所有关联的监控项及监控参数、告警阀值;
三、由子系统进行调度完成对业务的高可靠性监控。
2.根据权利要求1所述的一种基于云资源监控平台的业务监控方法,其特征在于,所述业务依赖资源分析单元和业务关联监控参数分析与处理单元都模块化处理,即,业务关联监控参数分析与处理只需要业务依赖资源分析模块提供分析的结果数据,业务依赖资源分析模块是独立于业务关联监控参数分析与处理模块存在的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013104255734A CN103475544A (zh) | 2013-09-18 | 2013-09-18 | 一种基于云资源监控平台的业务监控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013104255734A CN103475544A (zh) | 2013-09-18 | 2013-09-18 | 一种基于云资源监控平台的业务监控方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103475544A true CN103475544A (zh) | 2013-12-25 |
Family
ID=49800254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013104255734A Pending CN103475544A (zh) | 2013-09-18 | 2013-09-18 | 一种基于云资源监控平台的业务监控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103475544A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103763126A (zh) * | 2013-12-27 | 2014-04-30 | 乐视网信息技术(北京)股份有限公司 | 监控数据库的系统、方法及数据库监控装置 |
CN103780696A (zh) * | 2014-01-23 | 2014-05-07 | 北京荣之联科技股份有限公司 | 基于分布式推送的云监控方法、装置及系统 |
CN103905533A (zh) * | 2014-03-13 | 2014-07-02 | 广州杰赛科技股份有限公司 | 基于云存储的分布式告警监控方法和系统 |
CN104331354A (zh) * | 2014-11-20 | 2015-02-04 | 普华基础软件股份有限公司 | 一种云计算的实时综合监控方法 |
CN105183610A (zh) * | 2015-09-22 | 2015-12-23 | 浪潮集团有限公司 | 一种基于资源依赖关系的云数据中心业务监控系统及方法 |
CN105243004A (zh) * | 2015-09-15 | 2016-01-13 | 浪潮集团有限公司 | 一种故障资源检测方法及装置 |
CN105471625A (zh) * | 2015-11-16 | 2016-04-06 | 杭州东信北邮信息技术有限公司 | 一种资源池业务健康的监控方法和系统 |
CN105553717A (zh) * | 2015-12-14 | 2016-05-04 | 上海携程商务有限公司 | 呼叫中心及其监控系统 |
CN106055449A (zh) * | 2016-05-12 | 2016-10-26 | 深圳市永兴元科技有限公司 | 一种基于资源依赖关系的云数据监控方法及装置 |
CN106453544A (zh) * | 2016-09-30 | 2017-02-22 | 郑州云海信息技术有限公司 | 一种云环境及其监控方法、系统 |
CN106453504A (zh) * | 2016-09-13 | 2017-02-22 | 杭州东方通信软件技术有限公司 | 一种基于nginx服务器集群的监控系统及方法 |
CN106649055A (zh) * | 2017-01-10 | 2017-05-10 | 山东浪潮云服务信息科技有限公司 | 一种基于国产cpu和操作系统的软硬件故障告警系统及方法 |
CN107566150A (zh) * | 2016-07-01 | 2018-01-09 | 华为技术有限公司 | 处理云资源的方法和物理节点 |
CN108737197A (zh) * | 2018-06-20 | 2018-11-02 | 郑州云海信息技术有限公司 | 一种云环境下的故障预测方法及装置 |
CN111092751A (zh) * | 2019-11-26 | 2020-05-01 | 中盈优创资讯科技有限公司 | 监控数据处理方法及装置 |
CN112214382A (zh) * | 2016-12-16 | 2021-01-12 | 华为技术有限公司 | 告警方法及装置 |
CN118337595A (zh) * | 2024-04-16 | 2024-07-12 | 江苏电宿蔚联网络科技有限公司 | 一种内容分发网络的告警管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6754664B1 (en) * | 1999-07-02 | 2004-06-22 | Microsoft Corporation | Schema-based computer system health monitoring |
CN101984415A (zh) * | 2010-11-02 | 2011-03-09 | 中兴通讯股份有限公司 | 一种设定监控指标阈值的方法和装置 |
CN102571413A (zh) * | 2011-12-02 | 2012-07-11 | 曙光信息产业(北京)有限公司 | 一种集群环境下资源管理的方法 |
CN103152438A (zh) * | 2013-04-09 | 2013-06-12 | 上海理想信息产业(集团)有限公司 | 一种云计算环境下业务健康度获取方法 |
-
2013
- 2013-09-18 CN CN2013104255734A patent/CN103475544A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6754664B1 (en) * | 1999-07-02 | 2004-06-22 | Microsoft Corporation | Schema-based computer system health monitoring |
CN101984415A (zh) * | 2010-11-02 | 2011-03-09 | 中兴通讯股份有限公司 | 一种设定监控指标阈值的方法和装置 |
CN102571413A (zh) * | 2011-12-02 | 2012-07-11 | 曙光信息产业(北京)有限公司 | 一种集群环境下资源管理的方法 |
CN103152438A (zh) * | 2013-04-09 | 2013-06-12 | 上海理想信息产业(集团)有限公司 | 一种云计算环境下业务健康度获取方法 |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103763126A (zh) * | 2013-12-27 | 2014-04-30 | 乐视网信息技术(北京)股份有限公司 | 监控数据库的系统、方法及数据库监控装置 |
CN103780696A (zh) * | 2014-01-23 | 2014-05-07 | 北京荣之联科技股份有限公司 | 基于分布式推送的云监控方法、装置及系统 |
CN103905533A (zh) * | 2014-03-13 | 2014-07-02 | 广州杰赛科技股份有限公司 | 基于云存储的分布式告警监控方法和系统 |
CN104331354A (zh) * | 2014-11-20 | 2015-02-04 | 普华基础软件股份有限公司 | 一种云计算的实时综合监控方法 |
CN105243004A (zh) * | 2015-09-15 | 2016-01-13 | 浪潮集团有限公司 | 一种故障资源检测方法及装置 |
CN105183610B (zh) * | 2015-09-22 | 2018-12-14 | 浪潮集团有限公司 | 一种基于资源依赖关系的云数据中心业务监控系统及方法 |
CN105183610A (zh) * | 2015-09-22 | 2015-12-23 | 浪潮集团有限公司 | 一种基于资源依赖关系的云数据中心业务监控系统及方法 |
CN105471625A (zh) * | 2015-11-16 | 2016-04-06 | 杭州东信北邮信息技术有限公司 | 一种资源池业务健康的监控方法和系统 |
CN105471625B (zh) * | 2015-11-16 | 2018-09-21 | 杭州东信北邮信息技术有限公司 | 一种资源池业务健康的监控方法和系统 |
CN105553717B (zh) * | 2015-12-14 | 2019-07-26 | 上海携程商务有限公司 | 呼叫中心及其监控系统 |
CN105553717A (zh) * | 2015-12-14 | 2016-05-04 | 上海携程商务有限公司 | 呼叫中心及其监控系统 |
CN106055449A (zh) * | 2016-05-12 | 2016-10-26 | 深圳市永兴元科技有限公司 | 一种基于资源依赖关系的云数据监控方法及装置 |
CN106055449B (zh) * | 2016-05-12 | 2019-02-26 | 深圳市永兴元科技股份有限公司 | 一种基于资源依赖关系的云数据监控方法及装置 |
CN107566150A (zh) * | 2016-07-01 | 2018-01-09 | 华为技术有限公司 | 处理云资源的方法和物理节点 |
CN107566150B (zh) * | 2016-07-01 | 2020-04-28 | 华为技术有限公司 | 处理云资源的方法和物理节点 |
US10897431B2 (en) | 2016-07-01 | 2021-01-19 | Huawei Technologies Co., Ltd. | Cloud resource processing method and physical node |
CN106453504A (zh) * | 2016-09-13 | 2017-02-22 | 杭州东方通信软件技术有限公司 | 一种基于nginx服务器集群的监控系统及方法 |
CN106453544A (zh) * | 2016-09-30 | 2017-02-22 | 郑州云海信息技术有限公司 | 一种云环境及其监控方法、系统 |
CN106453544B (zh) * | 2016-09-30 | 2020-02-07 | 苏州浪潮智能科技有限公司 | 一种云环境及其监控方法、系统 |
CN112214382A (zh) * | 2016-12-16 | 2021-01-12 | 华为技术有限公司 | 告警方法及装置 |
CN106649055A (zh) * | 2017-01-10 | 2017-05-10 | 山东浪潮云服务信息科技有限公司 | 一种基于国产cpu和操作系统的软硬件故障告警系统及方法 |
CN108737197A (zh) * | 2018-06-20 | 2018-11-02 | 郑州云海信息技术有限公司 | 一种云环境下的故障预测方法及装置 |
CN111092751A (zh) * | 2019-11-26 | 2020-05-01 | 中盈优创资讯科技有限公司 | 监控数据处理方法及装置 |
CN111092751B (zh) * | 2019-11-26 | 2022-04-19 | 中盈优创资讯科技有限公司 | 监控数据处理方法及装置 |
CN118337595A (zh) * | 2024-04-16 | 2024-07-12 | 江苏电宿蔚联网络科技有限公司 | 一种内容分发网络的告警管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103475544A (zh) | 一种基于云资源监控平台的业务监控方法 | |
US10031671B2 (en) | Method, apparatus, and system for calculating identification threshold to distinguish cold data and hot data | |
CN108595306B (zh) | 一种面向混部云的服务性能测试方法 | |
CN106027328B (zh) | 一种基于应用容器部署的集群监控的方法及系统 | |
CN102694868A (zh) | 一种集群系统实现及任务动态分配方法 | |
US20180176088A1 (en) | Virtualized network function monitoring | |
US20120117392A1 (en) | Power distribution unit-device correlation | |
WO2015101089A1 (zh) | 大规模集群的管理方法、装置和系统 | |
CN102135932A (zh) | 一种监控系统及监控方法 | |
CN106210124B (zh) | 一种统一的云数据中心监控系统 | |
CN105592122A (zh) | 一种云平台监控方法以及云平台监控系统 | |
CN111966289A (zh) | 基于Kafka集群的分区优化方法和系统 | |
CN109062699A (zh) | 一种资源监控方法、装置、服务器及存储介质 | |
CN106598738A (zh) | 一种计算机集群系统及其并行计算方法 | |
CN104346211A (zh) | 一种云计算下实现虚拟机迁移的方法及系统 | |
CN105872061A (zh) | 一种服务器集群管理方法、装置及系统 | |
CN105471938B (zh) | 服务器负载管理方法及装置 | |
CN112367384A (zh) | 基于Kafka集群的动态限速方法、装置以及计算机设备 | |
CN111240936A (zh) | 一种数据完整性校验的方法及设备 | |
CN114461407A (zh) | 数据处理方法、装置、分发服务器、系统及存储介质 | |
CN112000657A (zh) | 数据管理方法、装置、服务器及存储介质 | |
CN113626869A (zh) | 数据处理方法、系统、电子设备以及存储介质 | |
CN106886477B (zh) | 一种云系统中监控阈值设定方法及装置 | |
CN106210101B (zh) | 消息管理系统及消息管理方法 | |
CN105471607A (zh) | 一种大规模集群节点动态信息的树形监视方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131225 |
|
WD01 | Invention patent application deemed withdrawn after publication |