CN103346906A - 一种基于云计算的智能运维方法及系统 - Google Patents
一种基于云计算的智能运维方法及系统 Download PDFInfo
- Publication number
- CN103346906A CN103346906A CN2013102514414A CN201310251441A CN103346906A CN 103346906 A CN103346906 A CN 103346906A CN 2013102514414 A CN2013102514414 A CN 2013102514414A CN 201310251441 A CN201310251441 A CN 201310251441A CN 103346906 A CN103346906 A CN 103346906A
- Authority
- CN
- China
- Prior art keywords
- obtains
- performance data
- real
- virtual machine
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种基于云计算的智能运维方法及系统通过把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应。系统包括:非结构化性能数据采集模块、平均性能基线生成模块、实时性能数据采集模块、运维指令生成模块和运维指令执行模块。本发明一种基于云计算的智能运维方法及系统能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。本发明作为一种基于云计算的智能运维方法及系统应用于云计算系统中。
Description
技术领域
本发明涉及通信领域,尤其涉及一种基于云计算的智能运维方法及系统。
背景技术
云计算是指一种抽象的、虚拟化的、动态可扩展的,能将托管的计算能力、存储能力、平台及服务按需提供给外部客户和应用的一种以规模经济驱动的大规模分布式计算模式。
作为云计算的三层分级之一,基础设施即服务云以虚拟机的形式为用户提供服务,即当用户需要计算资源时,基础设施即服务云将其中的资源打包成虚拟机的形式提供给用户使用;当用户不再需要计算资源时,基础设施会回收并销毁上述虚拟机以回收计算资源。
现有的系统运行维护工作一般是由人工来进行管理的,要求运维人员每天要定时对系统的运行状况进行检查。但是,人工检查的方式缺乏准确性和及时性,在没有用户历史性能基线的情况下,运维人员难以判断异常的运行状况,不能及时对异常作出反应,并且需要不断进行手动运维,速度较慢,效率低且容易出错。
发明内容
为了解决上述技术问题,本发明的目的是提供一种能根据系统实际运行情况,自动进行智能运维的一种基于云计算的智能运维方法。
本发明的另一个目的是提供一种能根据系统实际运行情况,自动进行智能运维的一种基于云计算的智能运维系统。
本发明所采用的技术方案是:
一种基于云计算的智能运维方法,包括以下步骤:
A、从桌面云平台采集非结构化性能数据;
B、对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
C、采集实时性能数据;
D、通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
E、执行得到的运维指令序列。
进一步作为优选的实施方式,所述的步骤B包括:
B1、根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
B2、计算每台虚拟机的每项资源的使用时长;
B3、根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
B4、根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
进一步作为优选的实施方式,所述的步骤D包括:
D1、根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
D2、根据采集的实时性能数据,计算单位时间内获得的数据量;
D3、根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
D4、判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找维护响应表,得到相应的维护指令序列;反之,则结束不再执行任何动作。
本发明所采用的另一技术方案是:
一种基于云计算的智能运维系统,包括:
非结构化性能数据采集模块,用于从桌面云平台采集非结构化性能数据;
平均性能基线生成模块,用于对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
实时性能数据采集模块,用于采集实时性能数据;
运维指令生成模块,用于通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
运维指令执行模块,用于执行得到的运维指令序列。
进一步作为优选的实施方式,所述的平均性能基线生成模块包括:
资源使用量计算模块,用于根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
使用时长计算模块,用于计算每台虚拟机的每项资源的使用时长;
聚类分析模块,用于根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
平均性能基线计算模块,用于根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
进一步作为优选的实施方式,所述的运维指令生成模块包括:
用户类型判断模块,用于根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
数据量计算模块,用于根据采集的实时性能数据,计算单位时间内获得的数据量;
差值计算模块,用于根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
运维指令查找模块,用于判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找运维响应表,得到相应的运维指令序列;反之,则结束不再执行任何动作。
本发明的有益效果是:
本发明一种基于云计算的智能运维方法通过把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应,有效解决了异常运行状况难以判断,以及不能及时对异常作出反应的问题。本发明一种基于云计算的智能运维方法能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。
本发明的另一个有益效果是:
本发明一种基于云计算的智能运维系统通过非结构化性能数据采集模块、平均性能基线生成模块、实时性能数据采集模块、运维指令生成模块和运维指令执行模块把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应,有效解决了异常运行状况难以判断,以及不能及时对异常作出反应的问题。本发明一种基于云计算的智能运维系统能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。
附图说明
下面结合附图对本发明的具体实施方式作进一步说明:
图1是本发明一种基于云计算的智能运维方法的步骤流程图;
图2是本发明一种基于云计算的智能运维方法步骤B的步骤流程图;
图3是本发明一种基于云计算的智能运维方法步骤D的步骤流程图;
图4是本发明一种基于云计算的智能运维系统的模块方框图;
图5是本发明平均性能基线生成模块的子模块方框图;
图6是本发明运维指令生成模块的子模块方框图。
具体实施方式
图1是本发明一种基于云计算的智能运维方法的步骤流程图,结合图1,本发明作为一种基于云计算的智能运维方法,包括以下步骤:
A、从桌面云平台采集非结构化性能数据;
B、对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
C、采集实时性能数据;
D、通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
E、执行得到的运维指令序列。
图2是本发明一种基于云计算的智能运维方法步骤B的步骤流程图,所述的步骤B包括:
B1、根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
B2、计算每台虚拟机的每项资源的使用时长;
B3、根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
B4、根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
设非结构化性能数据集为集合D,被监控的虚拟机为i(i=1,2,…,M),列入性能基线分析范围的资源为j(j=1,2,…,N),虚拟机常用的进程和服务为s(s=1,2,...,S),则每小时内每台虚拟机的每项资源使用量的平均值 每台虚拟机的每项资源的使用时长Tis=∑tis,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合U={u|u=Kmeans(Davg,ij,Tis),j=1,2,…,N,i=1,2,…,M,s=1,2,…S},对于用户类型u∈U,设u包括S-E个虚拟机,即ui(i=S,S+1,…,E),24小时内的平均性能基线Luj,组成基线集
图3是本发明一种基于云计算的智能运维方法步骤D的步骤流程图,所述的步骤D包括:
D1、根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
D2、根据采集的实时性能数据,计算单位时间内获得的数据量;
D3、根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
D4、判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找维护响应表,得到相应的维护指令序列;反之,则结束不再执行任何动作。
设实时监控系统获得的数据为G={Gj},当前时段为h=1hour,资源阈值为F={Fjp},维护响应表A={Aj},维护指令集C={Ca}根据采集的实时性能数据,设单位时间为5min,令某时段h内时间节点为t(t=1,2,…,12),得到单位时间内获得的数据量根据得到的单位时间内获得的数据量,得到单位时间内获得的数据量与对应虚拟机的平均性能基线的差值Bjp=Gj,avg-Luj,如果|Bjp|>Fjp,则根据Bjp,查找维护响应表,得到维护指令集Ca(a=1,2,...V)。
图4是本发明一种基于云计算的智能运维系统的模块方框图,系统包括:
非结构化性能数据采集模块,用于从桌面云平台采集非结构化性能数据;
平均性能基线生成模块,用于对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
实时性能数据采集模块,用于采集实时性能数据;
运维指令生成模块,用于通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
运维指令执行模块,用于执行得到的运维指令序列。
图5是本发明平均性能基线生成模块的子模块方框图,所述的平均性能基线生成模块包括:
资源使用量计算模块,用于根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
使用时长计算模块,用于计算每台虚拟机的每项资源的使用时长;
聚类分析模块,用于根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
平均性能基线计算模块,用于根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
图6是本发明运维指令生成模块的子模块方框图,所述的运维指令生成模块包括:
用户类型判断模块,用于根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
数据量计算模块,用于根据采集的实时性能数据,计算单位时间内获得的数据量;
差值计算模块,用于根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
运维指令查找模块,用于判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找运维响应表,得到相应的运维指令序列;反之,则结束不再执行任何动作。
从上述内容可以看出:
本发明一种基于云计算的智能运维方法及系统通过把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应,有效解决了异常运行状况难以判断,以及不能及时对异常作出反应的问题。本发明一种基于云计算的智能运维方法及系统能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (6)
1.一种基于云计算的智能运维方法,其特征在于,包括以下步骤:
A、从桌面云平台采集非结构化性能数据;
B、对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
C、采集实时性能数据;
D、通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
E、执行得到的运维指令序列。
2.根据权利要求1所述的一种基于云计算的智能运维方法,其特征在于:所述的步骤B包括:
B1、根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
B2、计算每台虚拟机的每项资源的使用时长;
B3、根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
B4、根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
3.根据权利要求2所述的一种基于云计算的智能运维方法,其特征在于:所述的步骤D包括:
D1、根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
D2、根据采集的实时性能数据,计算单位时间内获得的数据量;
D3、根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
D4、判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找维护响应表,得到相应的维护指令序列;反之,则结束不再执行任何动作。
4.一种基于云计算的智能运维系统,其特征在于,包括:
非结构化性能数据采集模块,用于从桌面云平台采集非结构化性能数据;
平均性能基线生成模块,用于对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
实时性能数据采集模块,用于采集实时性能数据;
运维指令生成模块,用于通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
运维指令执行模块,用于执行得到的运维指令序列。
5.根据权利要求4所述的一种基于云计算的智能运维系统,其特征在于:所述的平均性能基线生成模块包括:
资源使用量计算模块,用于根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
使用时长计算模块,用于计算每台虚拟机的每项资源的使用时长;
聚类分析模块,用于根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
平均性能基线计算模块,用于根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
6.根据权利要求5所述的一种基于云计算的智能运维系统,其特征在于:所述的运维指令生成模块包括:
用户类型判断模块,用于根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
数据量计算模块,用于根据采集的实时性能数据,计算单位时间内获得的数据量;
差值计算模块,用于根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
运维指令查找模块,用于判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找运维响应表,得到相应的运维指令序列;反之,则结束不再执行任何动作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310251441.4A CN103346906B (zh) | 2013-06-19 | 2013-06-19 | 一种基于云计算的智能运维方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310251441.4A CN103346906B (zh) | 2013-06-19 | 2013-06-19 | 一种基于云计算的智能运维方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103346906A true CN103346906A (zh) | 2013-10-09 |
CN103346906B CN103346906B (zh) | 2016-07-13 |
Family
ID=49281682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310251441.4A Active CN103346906B (zh) | 2013-06-19 | 2013-06-19 | 一种基于云计算的智能运维方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103346906B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108319500A (zh) * | 2017-01-16 | 2018-07-24 | 阿里巴巴集团控股有限公司 | 一种云计算系统的操作方法、装置及电子设备 |
CN108880855A (zh) * | 2018-04-12 | 2018-11-23 | 合肥天源迪科信息技术有限公司 | 一种基于云计算的桌面云智能运维方法及系统 |
CN112835662A (zh) * | 2019-11-25 | 2021-05-25 | 深信服科技股份有限公司 | 桌面云场景下虚拟机运维方法、系统、设备及计算机介质 |
US11947438B2 (en) | 2018-06-28 | 2024-04-02 | Xi'an Zhongxing New Software Co., Ltd. | Operation and maintenance system and method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080002670A1 (en) * | 2006-06-30 | 2008-01-03 | Bugenhagen Michael K | System and method for adjusting code speed in a transmission path during call set-up due to reduced transmission performance |
CN101136781A (zh) * | 2007-09-30 | 2008-03-05 | 亿阳信通股份有限公司 | 一种网管系统中性能数据采集时机控制方法和装置 |
WO2009006834A1 (fr) * | 2007-07-06 | 2009-01-15 | Huawei Technologies Co., Ltd. | Procédé de gestion d'élément de réseau, système de gestion d'équipement d'élément de réseau et système de gestion d'élément de réseau |
CN102882745A (zh) * | 2012-09-29 | 2013-01-16 | 摩卡软件(天津)有限公司 | 一种用于监控业务服务器的方法和装置 |
CN103095533A (zh) * | 2013-02-22 | 2013-05-08 | 浪潮电子信息产业股份有限公司 | 一种云计算系统平台中的定时监控方法 |
-
2013
- 2013-06-19 CN CN201310251441.4A patent/CN103346906B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080002670A1 (en) * | 2006-06-30 | 2008-01-03 | Bugenhagen Michael K | System and method for adjusting code speed in a transmission path during call set-up due to reduced transmission performance |
WO2009006834A1 (fr) * | 2007-07-06 | 2009-01-15 | Huawei Technologies Co., Ltd. | Procédé de gestion d'élément de réseau, système de gestion d'équipement d'élément de réseau et système de gestion d'élément de réseau |
CN101136781A (zh) * | 2007-09-30 | 2008-03-05 | 亿阳信通股份有限公司 | 一种网管系统中性能数据采集时机控制方法和装置 |
CN102882745A (zh) * | 2012-09-29 | 2013-01-16 | 摩卡软件(天津)有限公司 | 一种用于监控业务服务器的方法和装置 |
CN103095533A (zh) * | 2013-02-22 | 2013-05-08 | 浪潮电子信息产业股份有限公司 | 一种云计算系统平台中的定时监控方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108319500A (zh) * | 2017-01-16 | 2018-07-24 | 阿里巴巴集团控股有限公司 | 一种云计算系统的操作方法、装置及电子设备 |
CN108880855A (zh) * | 2018-04-12 | 2018-11-23 | 合肥天源迪科信息技术有限公司 | 一种基于云计算的桌面云智能运维方法及系统 |
US11947438B2 (en) | 2018-06-28 | 2024-04-02 | Xi'an Zhongxing New Software Co., Ltd. | Operation and maintenance system and method |
CN112835662A (zh) * | 2019-11-25 | 2021-05-25 | 深信服科技股份有限公司 | 桌面云场景下虚拟机运维方法、系统、设备及计算机介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103346906B (zh) | 2016-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330056B (zh) | 基于大数据云计算平台的风电场scada系统及其运行方法 | |
CN103092316B (zh) | 一种基于数据挖掘的服务器功耗管理系统 | |
CN104361110B (zh) | 海量用电数据分析系统及其实时计算、数据挖掘方法 | |
CN103164279B (zh) | 云计算资源分配方法和系统 | |
CN109151072A (zh) | 一种基于雾节点的边缘计算系统 | |
CN105260235A (zh) | 一种云平台中基于应用场景的资源调度方法及装置 | |
CN104317658A (zh) | 一种基于MapReduce的负载自适应任务调度方法 | |
CN110287228B (zh) | 基于电网调度域设备监测实时数据采集的实现方法 | |
CN103346906A (zh) | 一种基于云计算的智能运维方法及系统 | |
CN102902592B (zh) | 一种集群计算资源的分区调度管理方法 | |
CN102571499A (zh) | 一种云端数据库服务器集群的监控方法 | |
CN104407688A (zh) | 基于树回归的虚拟化云平台能耗测量方法及系统 | |
CN103645795A (zh) | 一种基于人工神经网络的云计算数据中心节能方法 | |
CN110502719A (zh) | 边缘计算模型管理系统及方法 | |
WO2013169903A1 (en) | Methods and systems for managing distributed energy resources | |
CN105041696A (zh) | 一种服务器机柜风扇调速方法及服务器机柜 | |
CN115511656A (zh) | 一种基于挖掘电网数据价值的需求规划辅助决策系统 | |
CN208890843U (zh) | 一种基于雾节点的边缘计算系统 | |
CN112948353B (zh) | 一种应用于DAstudio的数据分析方法、系统及存储介质 | |
CN103617090A (zh) | 一种基于分布式管理的节能方法 | |
CN112907911A (zh) | 一种基于设备工艺数据的智能异常识别与报警算法 | |
CN103679550A (zh) | 基于状态检修的输变电设备评估系统 | |
Ismaeel et al. | Real-time energy-conserving vm-provisioning framework for cloud-data centers | |
CN105427543A (zh) | 一种基于智能电网的温度预警方法及系统 | |
Ismaeel et al. | A novel host readiness factor for energy-efficient VM consolidation in cloud data centers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |