CN103346906B - 一种基于云计算的智能运维方法及系统 - Google Patents

一种基于云计算的智能运维方法及系统 Download PDF

Info

Publication number
CN103346906B
CN103346906B CN201310251441.4A CN201310251441A CN103346906B CN 103346906 B CN103346906 B CN 103346906B CN 201310251441 A CN201310251441 A CN 201310251441A CN 103346906 B CN103346906 B CN 103346906B
Authority
CN
China
Prior art keywords
performance data
real
virtual machine
module
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310251441.4A
Other languages
English (en)
Other versions
CN103346906A (zh
Inventor
赵淦森
虞海
王维栋
卓超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201310251441.4A priority Critical patent/CN103346906B/zh
Publication of CN103346906A publication Critical patent/CN103346906A/zh
Application granted granted Critical
Publication of CN103346906B publication Critical patent/CN103346906B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于云计算的智能运维方法及系统通过把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应。系统包括:非结构化性能数据采集模块、平均性能基线生成模块、实时性能数据采集模块、运维指令生成模块和运维指令执行模块。本发明一种基于云计算的智能运维方法及系统能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。本发明作为一种基于云计算的智能运维方法及系统应用于云计算系统中。

Description

一种基于云计算的智能运维方法及系统
技术领域
本发明涉及通信领域,尤其涉及一种基于云计算的智能运维方法及系统。
背景技术
云计算是指一种抽象的、虚拟化的、动态可扩展的,能将托管的计算能力、存储能力、平台及服务按需提供给外部客户和应用的一种以规模经济驱动的大规模分布式计算模式。
作为云计算的三层分级之一,基础设施即服务云以虚拟机的形式为用户提供服务,即当用户需要计算资源时,基础设施即服务云将其中的资源打包成虚拟机的形式提供给用户使用;当用户不再需要计算资源时,基础设施会回收并销毁上述虚拟机以回收计算资源。
现有的系统运行维护工作一般是由人工来进行管理的,要求运维人员每天要定时对系统的运行状况进行检查。但是,人工检查的方式缺乏准确性和及时性,在没有用户历史性能基线的情况下,运维人员难以判断异常的运行状况,不能及时对异常作出反应,并且需要不断进行手动运维,速度较慢,效率低且容易出错。
发明内容
为了解决上述技术问题,本发明的目的是提供一种能根据系统实际运行情况,自动进行智能运维的一种基于云计算的智能运维方法。
本发明的另一个目的是提供一种能根据系统实际运行情况,自动进行智能运维的一种基于云计算的智能运维系统。
本发明所采用的技术方案是:
一种基于云计算的智能运维方法,包括以下步骤:
A、从桌面云平台采集非结构化性能数据;
B、对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
C、采集实时性能数据;
D、通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
E、执行得到的运维指令序列。
进一步作为优选的实施方式,所述的步骤B包括:
B1、根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
B2、计算每台虚拟机的每项资源的使用时长;
B3、根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
B4、根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
进一步作为优选的实施方式,所述的步骤D包括:
D1、根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
D2、根据采集的实时性能数据,计算单位时间内获得的数据量;
D3、根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
D4、判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找维护响应表,得到相应的维护指令序列;反之,则结束不再执行任何动作。
本发明所采用的另一技术方案是:
一种基于云计算的智能运维系统,包括:
非结构化性能数据采集模块,用于从桌面云平台采集非结构化性能数据;
平均性能基线生成模块,用于对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
实时性能数据采集模块,用于采集实时性能数据;
运维指令生成模块,用于通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
运维指令执行模块,用于执行得到的运维指令序列。
进一步作为优选的实施方式,所述的平均性能基线生成模块包括:
资源使用量计算模块,用于根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
使用时长计算模块,用于计算每台虚拟机的每项资源的使用时长;
聚类分析模块,用于根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
平均性能基线计算模块,用于根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
进一步作为优选的实施方式,所述的运维指令生成模块包括:
用户类型判断模块,用于根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
数据量计算模块,用于根据采集的实时性能数据,计算单位时间内获得的数据量;
差值计算模块,用于根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
运维指令查找模块,用于判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找运维响应表,得到相应的运维指令序列;反之,则结束不再执行任何动作。
本发明的有益效果是:
本发明一种基于云计算的智能运维方法通过把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应,有效解决了异常运行状况难以判断,以及不能及时对异常作出反应的问题。本发明一种基于云计算的智能运维方法能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。
本发明的另一个有益效果是:
本发明一种基于云计算的智能运维系统通过非结构化性能数据采集模块、平均性能基线生成模块、实时性能数据采集模块、运维指令生成模块和运维指令执行模块把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应,有效解决了异常运行状况难以判断,以及不能及时对异常作出反应的问题。本发明一种基于云计算的智能运维系统能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。
附图说明
下面结合附图对本发明的具体实施方式作进一步说明:
图1是本发明一种基于云计算的智能运维方法的步骤流程图;
图2是本发明一种基于云计算的智能运维方法步骤B的步骤流程图;
图3是本发明一种基于云计算的智能运维方法步骤D的步骤流程图;
图4是本发明一种基于云计算的智能运维系统的模块方框图;
图5是本发明平均性能基线生成模块的子模块方框图;
图6是本发明运维指令生成模块的子模块方框图。
具体实施方式
图1是本发明一种基于云计算的智能运维方法的步骤流程图,结合图1,本发明作为一种基于云计算的智能运维方法,包括以下步骤:
A、从桌面云平台采集非结构化性能数据;
B、对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
C、采集实时性能数据;
D、通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
E、执行得到的运维指令序列。
图2是本发明一种基于云计算的智能运维方法步骤B的步骤流程图,所述的步骤B包括:
B1、根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
B2、计算每台虚拟机的每项资源的使用时长;
B3、根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
B4、根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
设非结构化性能数据集为集合D,被监控的虚拟机为i(i=1,2,…,M),列入性能基线分析范围的资源为j(j=1,2,…,N),虚拟机常用的进程和服务为s(s=1,2,...,S),则每小时内每台虚拟机的每项资源使用量的平均值 D avg , ij = Σ t = 1 12 D ij 12 i = 1,2 , . . . M , j = 1,2 . . , N , 每台虚拟机的每项资源的使用时长Tis=∑tis,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合U={u|u=Kmeans(Davg,ij,Tis),j=1,2,…,N,i=1,2,…,M,s=1,2,…S},对于用户类型u∈U,设u包括S-E个虚拟机,即ui(i=S,S+1,…,E),24小时内的平均性能基线Luj,组成基线集
L = { L uj | L uj = Σ i = S E D avg , ij E - S , u ∈ U , i = S , S + 1 , · · · , E , j = 1,2 , · · · , N } .
图3是本发明一种基于云计算的智能运维方法步骤D的步骤流程图,所述的步骤D包括:
D1、根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
D2、根据采集的实时性能数据,计算单位时间内获得的数据量;
D3、根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
D4、判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找维护响应表,得到相应的维护指令序列;反之,则结束不再执行任何动作。
设实时监控系统获得的数据为G={Gj},当前时段为h=1hour,资源阈值为F={Fjp},维护响应表A={Aj},维护指令集C={Ca}根据采集的实时性能数据,设单位时间为5min,令某时段h内时间节点为t(t=1,2,…,12),得到单位时间内获得的数据量根据得到的单位时间内获得的数据量,得到单位时间内获得的数据量与对应虚拟机的平均性能基线的差值Bjp=Gj,avg-Luj,如果|Bjp|>Fjp,则根据Bjp,查找维护响应表,得到维护指令集Ca(a=1,2,...V)。
图4是本发明一种基于云计算的智能运维系统的模块方框图,系统包括:
非结构化性能数据采集模块,用于从桌面云平台采集非结构化性能数据;
平均性能基线生成模块,用于对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
实时性能数据采集模块,用于采集实时性能数据;
运维指令生成模块,用于通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
运维指令执行模块,用于执行得到的运维指令序列。
图5是本发明平均性能基线生成模块的子模块方框图,所述的平均性能基线生成模块包括:
资源使用量计算模块,用于根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
使用时长计算模块,用于计算每台虚拟机的每项资源的使用时长;
聚类分析模块,用于根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
平均性能基线计算模块,用于根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线。
图6是本发明运维指令生成模块的子模块方框图,所述的运维指令生成模块包括:
用户类型判断模块,用于根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
数据量计算模块,用于根据采集的实时性能数据,计算单位时间内获得的数据量;
差值计算模块,用于根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
运维指令查找模块,用于判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找运维响应表,得到相应的运维指令序列;反之,则结束不再执行任何动作。
从上述内容可以看出:
本发明一种基于云计算的智能运维方法及系统通过把实时性能数据与历史性能基线进行比较分析,并生成相应的运维指令序列,使得系统可以自动进行运维响应,有效解决了异常运行状况难以判断,以及不能及时对异常作出反应的问题。本发明一种基于云计算的智能运维方法及系统能够根据实际情况自动进行运维响应,大大减少运维人员的工作量,提升运维的效率,并且根据历史性能基线作为参考,分析较为准确,大大减少出错的机会,更有针对性,运维更加准确。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (2)

1.一种基于云计算的智能运维方法,其特征在于,包括以下步骤:
A、从桌面云平台采集非结构化性能数据;
B、对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
C、采集实时性能数据;
D、通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
E、执行得到的运维指令序列;
所述的步骤B包括:
B1、根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
B2、计算每台虚拟机的每项资源的使用时长;
B3、根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
B4、根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线;
所述的步骤D包括:
D1、根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
D2、根据采集的实时性能数据,计算单位时间内获得的数据量;
D3、根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
D4、判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找维护响应表,得到相应的维护指令序列;反之,则结束不再执行任何动作。
2.一种基于云计算的智能运维系统,其特征在于,包括:
非结构化性能数据采集模块,用于从桌面云平台采集非结构化性能数据;
平均性能基线生成模块,用于对采集的非结构化性能数据进行聚类分析并计算,得到平均性能基线;
实时性能数据采集模块,用于采集实时性能数据;
运维指令生成模块,用于通过得到的平均性能基线与采集的实时性能数据进行对比分析,进而得到相应的运维指令序列;
运维指令执行模块,用于执行得到的运维指令序列;
所述的平均性能基线生成模块包括:
资源使用量计算模块,用于根据采集的非结构化性能数据,分别计算每小时内每台虚拟机的每项资源使用量的平均值;
使用时长计算模块,用于计算每台虚拟机的每项资源的使用时长;
聚类分析模块,用于根据计算得到的每台虚拟机的某项资源的使用时长,利用Kmeans算法对每项资源进行聚类分析,得到用户类型集合;
平均性能基线计算模块,用于根据得到的用户类型集合,计算24小时内每台虚拟机的平均性能基线;
所述的运维指令生成模块包括:
用户类型判断模块,用于根据得到的用户类型集合和采集的实时性能数据,判断得到实时性能数据的来源虚拟机所属于的用户类型;
数据量计算模块,用于根据采集的实时性能数据,计算单位时间内获得的数据量;
差值计算模块,用于根据得到的单位时间内获得的数据量,计算单位时间内获得的数据量与对应虚拟机的平均性能基线的差值;
运维指令查找模块,用于判断得到的差值是否大于预设的资源阈值,若是,则根据得到的差值,查找运维响应表,得到相应的运维指令序列;反之,则结束不再执行任何动作。
CN201310251441.4A 2013-06-19 2013-06-19 一种基于云计算的智能运维方法及系统 Active CN103346906B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310251441.4A CN103346906B (zh) 2013-06-19 2013-06-19 一种基于云计算的智能运维方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310251441.4A CN103346906B (zh) 2013-06-19 2013-06-19 一种基于云计算的智能运维方法及系统

Publications (2)

Publication Number Publication Date
CN103346906A CN103346906A (zh) 2013-10-09
CN103346906B true CN103346906B (zh) 2016-07-13

Family

ID=49281682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310251441.4A Active CN103346906B (zh) 2013-06-19 2013-06-19 一种基于云计算的智能运维方法及系统

Country Status (1)

Country Link
CN (1) CN103346906B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319500B (zh) * 2017-01-16 2022-06-21 阿里巴巴集团控股有限公司 一种云计算系统的操作方法、装置及电子设备
CN108880855A (zh) * 2018-04-12 2018-11-23 合肥天源迪科信息技术有限公司 一种基于云计算的桌面云智能运维方法及系统
CN110659173B (zh) 2018-06-28 2023-05-26 中兴通讯股份有限公司 一种运维系统及方法
CN112835662A (zh) * 2019-11-25 2021-05-25 深信服科技股份有限公司 桌面云场景下虚拟机运维方法、系统、设备及计算机介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136781A (zh) * 2007-09-30 2008-03-05 亿阳信通股份有限公司 一种网管系统中性能数据采集时机控制方法和装置
CN102882745A (zh) * 2012-09-29 2013-01-16 摩卡软件(天津)有限公司 一种用于监控业务服务器的方法和装置
CN103095533A (zh) * 2013-02-22 2013-05-08 浪潮电子信息产业股份有限公司 一种云计算系统平台中的定时监控方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8488447B2 (en) * 2006-06-30 2013-07-16 Centurylink Intellectual Property Llc System and method for adjusting code speed in a transmission path during call set-up due to reduced transmission performance
CN101079745B (zh) * 2007-07-06 2010-12-29 华为技术有限公司 网元管理方法、网元设备管理系统及网元管理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136781A (zh) * 2007-09-30 2008-03-05 亿阳信通股份有限公司 一种网管系统中性能数据采集时机控制方法和装置
CN102882745A (zh) * 2012-09-29 2013-01-16 摩卡软件(天津)有限公司 一种用于监控业务服务器的方法和装置
CN103095533A (zh) * 2013-02-22 2013-05-08 浪潮电子信息产业股份有限公司 一种云计算系统平台中的定时监控方法

Also Published As

Publication number Publication date
CN103346906A (zh) 2013-10-09

Similar Documents

Publication Publication Date Title
CN103346906B (zh) 一种基于云计算的智能运维方法及系统
CN103092316B (zh) 一种基于数据挖掘的服务器功耗管理系统
CN102799512B (zh) 一种基于向量自回归的云计算中虚拟机监控方法
CN104731595A (zh) 面向大数据分析的混合计算系统
CN103699696A (zh) 一种云计算环境下的数据在线聚集方法
CN104407688A (zh) 基于树回归的虚拟化云平台能耗测量方法及系统
CN105320757A (zh) 一种快速处理数据的商业智能分析方法
CN102571499A (zh) 一种云端数据库服务器集群的监控方法
CN108549353A (zh) 智慧工厂监控方法及系统、可读存储介质、终端
Qazi et al. Workload prediction of virtual machines for harnessing data center resources
CN113268486A (zh) 智能工厂的一体化数据应用系统
CN105468756A (zh) 一种海量数据处理系统的设计和实现方法
CN102567076B (zh) 一种基于能耗的服务器整合方案选择方法
CN115981902A (zh) 一种细粒度分布式微服务系统异常根因定位方法及装置
CN112234707B (zh) 一种高能同步辐射光源磁铁电源故障识别系统
CN112907911A (zh) 一种基于设备工艺数据的智能异常识别与报警算法
Ismaeel et al. Real-time energy-conserving vm-provisioning framework for cloud-data centers
Ismaeel et al. A novel host readiness factor for energy-efficient VM consolidation in cloud data centers
Huang et al. Tool remaining useful life prediction based on edge data processing and lstm recurrent neural network
CN107121616B (zh) 一种用于对智能仪表进行故障定位的方法和装置
EP3465562A1 (en) Data driven invocation of real time wind market forecasting analytics
CN105469181A (zh) 一种基于大数据分析的铝电解过程能效管理系统
Shinwari et al. Auto scalable big data as-a-service in the cloud: a literature review
CN206905203U (zh) 一种用于楼宇空气净化器的智能控制系统
CN113094247B (zh) 一种基于Storm的采煤机运行状态实时预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant