CN105279023B - 一种虚拟机迁移方法和装置 - Google Patents

一种虚拟机迁移方法和装置 Download PDF

Info

Publication number
CN105279023B
CN105279023B CN201510849248.XA CN201510849248A CN105279023B CN 105279023 B CN105279023 B CN 105279023B CN 201510849248 A CN201510849248 A CN 201510849248A CN 105279023 B CN105279023 B CN 105279023B
Authority
CN
China
Prior art keywords
alarm
physical machine
utilization rate
virtual machine
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510849248.XA
Other languages
English (en)
Other versions
CN105279023A (zh
Inventor
苏志远
亓开元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201510849248.XA priority Critical patent/CN105279023B/zh
Publication of CN105279023A publication Critical patent/CN105279023A/zh
Application granted granted Critical
Publication of CN105279023B publication Critical patent/CN105279023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种虚拟机迁移方法和装置,其中方法包括:获取各物理机的历史资源利用数据,确定超过预设标准阈值大于预设次数的报警数据,将该告警数据输入时间序列趋势预测法中自回归模型,得到预测数值,若该预测数值大于预设阈值,则得到具有该告警数据的告警物理机内各虚拟机被迁移概率,基于该被迁移概率选取待迁移虚拟机,对该待迁移虚拟机进行迁移。可有效地减少外部其他复杂因素的干扰,保证SLA,避免虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作,并在告警物理机出现过载前对其内虚拟机进行迁移,保证告警物理机持续不间断正常运转,且可有效减少虚拟机迁移成本,保证虚拟机迁移后告警物理机资源利用率,避免造成资源浪费。

Description

一种虚拟机迁移方法和装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种虚拟机迁移方法和装置。
背景技术
随着虚拟化技术的发展以及云计算概念的普及,越来越多的用户选择通过向数据中心租用计算资源的方式来完成其工作任务而非自己购买物理设备。现有技术中,一般通过对各物理机的CPU利用率进行监测,若发现某物理机的CPU利用率超过预设阈值,则将该物理机内负荷最大的虚拟机迁移至其他物理机,进行虚拟机迁移,来保证用户的服务质量,提高资源利用率。通过对各物理机的CPU利用率进行监测来确定对哪个物理机内的虚拟机进行迁移,只考虑了CPU利用率单监控目标,由于外部其他复杂因素的干扰,将无法保证SLA(Service-Level Agreement,服务等级协议),且在发现某物理机的CPU利用率超过预设阈值后,再对该物理机内虚拟机进行迁移,在对该物理机内虚拟机进行迁移前,该物理机已经出现过载,无法持续不间断地保证系统正常运转,同时,在发现某物理机的CPU利用率超过预设阈值后对该物理机内虚拟机进行迁移,仅通过一次判断便对该物理机内虚拟机进行迁移,可能因为虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作,另一方面,当发现某物理机的CPU利用率超过预设阈值后,直接将该物理机内负荷最大的虚拟机迁移至其他物理机,虚拟机的负载越高则其体积也将越大,越大体积的虚拟机一方面会增加虚拟机的迁移成本,另外一方面可能会使得迁移之后,过载的物理机资源利用率偏低,造成资源浪费。
发明内容
有鉴于此,本发明实施例提供一种虚拟机迁移方法和装置,以解决现有技术中只考虑了CPU利用率单监控目标,由于外部其他复杂因素的干扰,无法保证SLA,在对物理机内虚拟机进行迁移前,该物理机已经出现过载,无法持续不间断地保证系统正常运转,仅通过一次判断便对物理机内虚拟机进行迁移,可能因虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作,将物理机内负荷最大的虚拟机迁移至其他物理机,一方面会增加虚拟机的迁移成本,另外一方面可能会使得迁移后过载的物理机资源利用率偏低,造成资源浪费的问题。
为实现上述目的,本发明实施例提供如下技术方案:
一种虚拟机迁移方法,包括:
获取各物理机的历史资源利用数据,其中,所述历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率;
在所有所述物理机中,选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据;
将所述告警物理机的告警数据输入时间序列趋势预测法中自回归模型,得到所述告警数据的预测数值,判断所述预测数值是否大于预设阈值;
若大于,则确定所述告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在所述告警物理机所有虚拟机中的占比,根据所述占比得到所述各虚拟机被迁移概率,基于所述被迁移概率在所述告警物理机所有虚拟机中选取待迁移虚拟机,对所述待迁移虚拟机进行迁移。
其中,所述判断所述预测数值是否大于预设阈值后还包括:若大于,则在所有所述物理机中确定所有非告警物理机,在所有所述非告警物理机中选取目的物理机;
其中,所述对所述待迁移虚拟机进行迁移包括:将所述待迁移虚拟机迁移至所述目的物理机。
其中,所述在所有所述非告警物理机中选取目的物理机包括:
确定各所述非告警物理机与所述告警物理机在网络拓扑树形结构中的通信距离,根据所述通信距离确定各所述非告警物理机的权值;
根据各所述非告警物理机的权值、当前CPU空闲率、当前内存空闲率和当前带宽空闲率,计算得到各所述非告警物理机被选取概率,基于所述被选取概率在所有所述非告警物理机中选取目的物理机,得到目的物理机。
其中,所述被选取概率为:
其中,Sj为第j台非告警物理机的被选取概率,dj为第j台非告警物理机的权值,为第j台非告警物理机当前CPU空闲率,为第j台非告警物理机当前内存空闲率,第j台非告警物理机当前带宽空闲率。
其中,所述选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据包括:
确定待测物理机的历史CPU利用率,判断所述待测物理机的历史CPU使用率超过第一预设标准阈值的次数是否大于第一预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史CPU使用率为告警数据;
确定待测物理机的历史内存使用率,判断所述待测物理机的历史内存使用率超过第二预设标准阈值的次数是否大于第二预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史内存使用率为告警数据;
确定待测物理机的历史带宽使用率,判断所述待测物理机的历史带宽使用率超过第三预设标准阈值的次数是否大于第三预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史带宽使用率为告警数据。
其中,所述告警数据的预测数值xv(t+1)为:
xv(t+1)=φtxv(t)+φt-1xv(t-1)+…+φkxv(k)+…+φ2xv(2)+φ1xv(1)+ε;
其中,xv(k)为所述告警数据在第k时刻的数值,xv(t)为所述告警数据当前时刻的数值,φk为所述告警数据在第k时刻的自回归参数,φt为所述告警数据当前时刻的自回归参数,ε为服从正态分布的随机变量,ε∈(0,1)。
其中,所述根据所述占比得到所述各虚拟机被迁移概率包括:
根据所述占比计算得到所述各虚拟机的当前体积:
其中,为第i台虚拟机的当前体积,为第i台虚拟机当前CPU使用率在所述告警物理机所有虚拟机中的占比,为第i台虚拟机当前内存使用率在所述告警物理机所有虚拟机中的占比,为第i台虚拟机当前带宽使用率在所述告警物理机所有虚拟机中的占比。
根据所述各虚拟机的当前体积计算得到所述各虚拟机被迁移的概率:
其中,为第i台虚拟机被迁移的概率,为第i台虚拟机的当前体积。
一种虚拟机迁移装置,包括:数据获取模块、第一选取模块、预测判断模块和迁移模块;其中,
所述数据获取模块,用于获取各物理机的历史资源利用数据,其中,所述历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率;
所述第一选取模块,用于在所有所述物理机中,选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据;
所述预测判断模块,用于将所述告警数据输入时间序列趋势预测法中自回归模型,得到所述告警数据的预测数值,判断所述预测数值是否大于预设阈值;
所述迁移模块,用于当所述预测判断模块判定所述预测数值大于预设阈值时,分别确定所述告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在所述告警物理机所有虚拟机中的占比,根据所述占比得到所述各虚拟机被迁移概率,基于所述被迁移概率在所述告警物理机所有虚拟机中选取待迁移虚拟机,对所述待迁移虚拟机进行迁移。
其中,所述虚拟机迁移装置还包括:第二选取模块,用于当所述预测判断模块判定所述预测数值大于预设阈值时,在所有所述物理机中确定所有非告警物理机,在所有所述非告警物理机中选取目的物理机。
其中,所述第二选取模块包括:权值确定单元和计算选取单元;其中,
所述权值确定单元,用于确定各所述非告警物理机与所述告警物理机在网络拓扑树形结构中的通信距离,根据所述通信距离确定各所述非告警物理机的权值;
所述计算选取单元,用于根据各所述非告警物理机的权值、当前CPU空闲率、当前内存空闲率和当前带宽空闲率,计算得到各所述非告警物理机被选取概率,基于所述被选取概率在所有所述非告警物理机中选取目的物理机,得到目的物理机。
基于上述技术方案,本发明实施例提供的虚拟机迁移方法和装置,获取各物理机的历史资源利用数据后,其中,该历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率,在所有物理机中选择告警物理机,其中,该告警物理机的历史CPU使用率、历史内存使用率和历史带宽使用率这三个历史资源利用数据中,存在超过预设标准阈值的历史资源利用数据,且该超过预设标准阈值的历史资源利用数据超过其预设标准预设的次数大于预设次数,并确定该超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据,在获取告警物理机并确定该告警物理机的告警数据后,将该告警物理机的该告警数据输入时间序列趋势预测法中自回归模型中,得到该告警数据的预测数值,判断该告警数据的预测数值是否大于预设阈值,若大于,则确定该告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在该告警物理机所有虚拟机中的占比,根据得到的占比得到该告警物理机内各虚拟机的被迁移概率,基于该被迁移概率在该告警物理机所有虚拟机中选取待迁移虚拟机,对该选取出的待迁移虚拟机进行迁移。考虑了虚拟机CPU使用率、内存使用率和带宽使用率三个影响因素,可有效地减少外部其他复杂因素的干扰,保证SLA;当历史资源利用数据中存在超过预设标准阈值大于预设次数的报警数据时,才认为该物理机存在迁移风险,对该报警数据数值进行预测,可有效避免虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作;若某物理机存在告警数据,即若某物理机为告警物理机,则根据该告警数据的预测数值来进行是否对该告警物理机内虚拟机进行迁移的判断,将可在该告警物理机出现过载前对其内虚拟机进行迁移,从而保证该告警物理机持续不间断地正常运转;另一方面,基于告警物理机内各虚拟机被迁移概率选取待迁移虚拟机,并非每次都直接选取物理机内体积最大的虚拟机进行迁移,而是将告警物理机内体积不同的各虚拟机设置为不同的被迁移概率,基于该被迁移概率在告警物理机内选取虚拟机进行迁移,可有效减少虚拟机的迁移成本,同时保证告警物理机在进行虚拟机迁移之后,资源利用率不会过低,避免造成资源浪费。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的虚拟机迁移方法的流程图;
图2为本发明实施例提供的虚拟机迁移方法中在所有非告警物理机中选取目的物理机的方法流程图;
图3为本发明实施例提供的物理机网络拓扑树形结构示意图;
图4为本发明实施例提供的虚拟机迁移方法中选取告警物理机,确定告警数据的方法流程图;
图5为本发明实施例提供的虚拟机迁移方法中得到各虚拟机被迁移概率的方法流程图
图6为本发明实施例提供的虚拟机迁移装置的系统框图;
图7为本发明实施例提供的虚拟机迁移装置的另一系统框图;
图8为本发明实施例提供的虚拟机迁移装置中第二选取模块的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的虚拟机迁移方法的流程图,考虑了虚拟机CPU使用率、内存使用率和带宽使用率三个影响因素,可有效地减少外部其他复杂因素的干扰,保证SLA,当历史资源利用数据中存在超过预设标准阈值大于预设次数的报警数据时才对该报警数据数值进行预测,可有效避免虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作,在告警物理机出现过载前对其内虚拟机进行迁移,保证告警物理机持续不间断地正常运转,基于告警物理机内各虚拟机被迁移概率选取待迁移虚拟机进行迁移,可有效减少虚拟机的迁移成本,同时保证告警物理机在进行虚拟机迁移之后,资源利用率不会过低,避免造成资源浪费;参照图1,该虚拟机迁移方法可以包括:
步骤S100:获取各物理机的历史资源利用数据,其中,所述历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率;
考虑了虚拟机CPU使用率、内存使用率和带宽使用率三个影响因素,相较于只考虑CPU使用率单影响因素而言,可有效地减少外部其他复杂因素的干扰,保证SLA。
步骤S110:在所有所述物理机中,选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据;
若某物理机其历史CPU使用率、历史内存使用率和历史带宽使用率中任一超过其预设标准预设的次数大于其预设次数,则认为该物理机为告警物理机,并将该超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据。只有当某物理机内历史CPU使用率、历史内存使用率和历史带宽使用率均超过其预设标准预设的次数不大于其预设次数,才认为该物理机不为告警物理机,即为非告警物理机。
例如,若某物理机设置的历史CPU使用率、历史内存使用率和历史带宽使用率相对应的预设次数均为3次,而历史CPU使用率超过第一预设标准阈值2次,历史内存使用率超过第二预设标准阈值3次,历史带宽使用率超过第三预设标准阈值4次,则可确定该物理机为告警物理机,该物理机内历史带宽使用率为告警数据。而若该物理机历史CPU使用率超过第一预设标准阈值的次数,历史内存使用率超过第二预设标准阈值的次数,和历史带宽使用率超过第三预设标准阈值的次数均不超过3次,例如,均为2次,则认为该物理机为非告警物理机。
可选的,可以依次对物理机内历史CPU使用率、历史内存使用率和历史带宽使用率进行是否为告警数据的判断,也可同时对物理机内历史CPU使用率、历史内存使用率和历史带宽使用率进行是否为告警数据的判断。其中,当依次对物理机内历史CPU使用率、历史内存使用率和历史带宽使用率进行是否为告警数据的判断时,对物理机内历史CPU使用率、历史内存使用率和历史带宽使用率进行是否为告警数据的判断间没有逻辑顺序关系。
步骤S120:将所述告警物理机的告警数据输入时间序列趋势预测法中自回归模型,得到所述告警数据的预测数值;
可选的,假设告警数据的资源类型v∈(c,m,b),其中,c,m,b分别为告警物理机的CPU使用率、内存使用率和带宽使用率,那么,该告警数据的预测数值xv(t+1)的计算公式可以为:
xv(t+1)=φtxv(t)+φt-1xv(t-1)+…+φkxv(k)+…+φ2xv(2)+φ1xv(1)+ε;
其中,xv(k)为所述告警数据在第k时刻的数值,xv(t)为所述告警数据当前时刻的数值,φk为所述告警数据在第k时刻的自回归参数,φt为所述告警数据当前时刻的自回归参数,ε为服从正态分布的随机变量,ε∈(0,1)。
步骤S130:判断所述预测数值是否大于预设阈值;
通过判断告警数据的预测数值是否大于预设阈值来判断是否对具有该告警数据的告警物理机内的虚拟机进行迁移。
若判定告警数据的预测数值大于预设阈值,则说明具有该告警数据的告警物理机下一时刻将会出现过载,需要在其出现过载前对其内虚拟机进行迁移;反之,若判定该告警数据的预测数值不大于预设阈值,则说明具有该告警数据的告警物理机下一时刻不会出现过载,可对其继续进行监测,而无需对其内虚拟机进行迁移。
步骤S140:若大于,则确定所述告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在所述告警物理机所有虚拟机中的占比,根据所述占比得到所述各虚拟机被迁移概率,基于所述被迁移概率在所述告警物理机所有虚拟机中选取待迁移虚拟机,对所述待迁移虚拟机进行迁移。
可选的,还可在判定告警数据的预测数值大于预设阈值后,在所有物理机中确定所有非告警物理机,在所有所述非告警物理机中选取目的物理机,在得到待迁移虚拟机后,将该待迁移虚拟机迁移至选取的目的物理机中。
可选的,可通过确定各非告警物理机与告警物理机在网络拓扑树形结构中的通信距离,根据该通信距离确定各所述非告警物理机的权值,然后根据各非告警物理机的权值、当前CPU空闲率、当前内存空闲率和当前带宽空闲率,计算得到各所述非告警物理机被选取概率,基于该被选取概率在所有非告警物理机中选取目的物理机,来得到目的物理机。
可选的,可以通过先根据告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在所述告警物理机所有虚拟机中的占比计算得到各虚拟机的当前体积,然后根据各虚拟机的当前体积计算得到各虚拟机被迁移概率。
基于上述技术方案,本发明实施例提供的虚拟机迁移方法和装置,获取各物理机的历史资源利用数据后,其中,该历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率,在所有物理机中选择告警物理机,其中,该告警物理机的历史CPU使用率、历史内存使用率和历史带宽使用率这三个历史资源利用数据中,存在超过预设标准阈值的历史资源利用数据,且该超过预设标准阈值的历史资源利用数据超过其预设标准预设的次数大于预设次数,并确定该超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据,在获取告警物理机并确定该告警物理机的告警数据后,将该告警物理机的该告警数据输入时间序列趋势预测法中自回归模型中,得到该告警数据的预测数值,判断该告警数据的预测数值是否大于预设阈值,若大于,则确定该告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在该告警物理机所有虚拟机中的占比,根据得到的占比得到该告警物理机内各虚拟机的被迁移概率,基于该被迁移概率在该告警物理机所有虚拟机中选取待迁移虚拟机,对该选取出的待迁移虚拟机进行迁移。考虑了虚拟机CPU使用率、内存使用率和带宽使用率三个影响因素,可有效地减少外部其他复杂因素的干扰,保证SLA;当历史资源利用数据中存在超过预设标准阈值大于预设次数的报警数据时,才认为该物理机存在迁移风险,对该报警数据数值进行预测,可有效避免虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作;若某物理机存在告警数据,即若某物理机为告警物理机,则根据该告警数据的预测数值来进行是否对该告警物理机内虚拟机进行迁移的判断,将可在该告警物理机出现过载前对其内虚拟机进行迁移,从而保证该告警物理机持续不间断地正常运转;另一方面,基于告警物理机内各虚拟机被迁移概率选取待迁移虚拟机,并非每次都直接选取物理机内体积最大的虚拟机进行迁移,而是将告警物理机内体积不同的各虚拟机设置为不同的被迁移概率,基于该被迁移概率在告警物理机内选取虚拟机进行迁移,可有效减少虚拟机的迁移成本,同时保证告警物理机在进行虚拟机迁移之后,资源利用率不会过低,避免造成资源浪费。
可选的,图2示出了本发明实施例提供的虚拟机迁移方法中在所有非告警物理机中选取目的物理机的方法流程图,参照图2,该在所有非告警物理机中选取目的物理机的方法可以包括:
步骤S200:确定各所述非告警物理机与所述告警物理机在网络拓扑树形结构中的通信距离,根据所述通信距离确定各所述非告警物理机的权值;
可选的,可以设置将与告警物理机接于同一机架的非告警物理机的权值设为1,将与告警物理机接于同一聚集层交换机的非告警物理机的权值设置为0.25,将与告警物理机接于同一核心层交换机的非告警物理机的权重设置与0.125。
参照图3,物理机网络拓扑树形结构示意图,若告警物理机接于机架1,那么,认为所有接于机架1的非告警物理机的权值为1,所有接于机架2的交换机,即与告警物理机接于同一聚集层交换机1的非告警物理机的权利为0.25,所有接于机架3或机架4等的交换机,即与告警物理机接于同一核心层交换机1的非告警物理机的权利为0.125。
步骤S210:根据各所述非告警物理机的权值、当前CPU空闲率、当前内存空闲率和当前带宽空闲率,计算得到各所述非告警物理机被选取概率,基于所述被选取概率在所有所述非告警物理机中选取目的物理机,得到目的物理机。
可选的,各非告警物理机被选取概率的计算公式可以为:
其中,Sj为第j台非告警物理机的被选取概率,dj为第j台非告警物理机的权值,为第j台非告警物理机当前CPU空闲率,为第j台非告警物理机当前内存空闲率,第j台非告警物理机当前带宽空闲率。
计算得到各非告警物理机被选取概率,基于被选取概率在所有所述非告警物理机中选取目的物理机,得到目的物理机,将待迁移虚拟机迁移至该目标物理机,如此,在迁移虚拟机后,可以保证目的物理机不会出现过载的情况,同时可以保证网络通信的开销较低。
可选的,图4示出了本发明实施例提供的虚拟机迁移方法中选取告警物理机,确定告警数据的方法流程图,参照图4,该选取告警物理机,确定告警数据的方法可以包括:
步骤S300:确定待测物理机的历史CPU利用率,判断所述待测物理机的历史CPU使用率超过第一预设标准阈值的次数是否大于第一预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史CPU使用率为告警数据;
步骤S310:确定待测物理机的历史内存使用率,判断所述待测物理机的历史内存使用率超过第二预设标准阈值的次数是否大于第二预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史内存使用率为告警数据;
步骤S320:确定待测物理机的历史带宽使用率,判断所述待测物理机的历史带宽使用率超过第三预设标准阈值的次数是否大于第三预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史带宽使用率为告警数据。
其中,需要说明的是,步骤S300、步骤S310和步骤S320间没有顺序逻辑关系,可按任意执行顺序执行步骤S300、步骤S310和步骤S320,也可同时执行步骤S300、步骤S310和步骤S320。
只要某物理机内历史CPU使用率、历史内存使用率和历史带宽使用率中任一超过其预设阈值的次数大于预设次数,则认为该物理机为告警物理机,只有当某物理机内历史CPU使用率、历史内存使用率和历史带宽使用率均超过其预设标准预设的次数不大于其预设次数,才认为该物理机不为告警物理机,即为非告警物理机
可选的,图5示出了本发明实施例提供的虚拟机迁移方法中得到各虚拟机被迁移概率的方法流程图,参照图5,该得到各虚拟机被迁移概率的方法可以包括:
步骤S400:根据所述占比计算得到所述各虚拟机的当前体积;
可选的,各虚拟机的当前体积的计算公式可以为:
其中,为第i台虚拟机的当前体积,为第i台虚拟机当前CPU使用率在所述告警物理机所有虚拟机中的占比,为第i台虚拟机当前内存使用率在所述告警物理机所有虚拟机中的占比,为第i台虚拟机当前带宽使用率在所述告警物理机所有虚拟机中的占比。
步骤S410:根据所述各虚拟机的当前体积计算得到所述各虚拟机被迁移的概率。
可选的,各虚拟机被迁移的概率的计算公式可以为:
其中,为第i台虚拟机被迁移的概率,为第i台虚拟机的当前体积。
本发明实施例提供的虚拟机迁移方法,考虑了虚拟机CPU使用率、内存使用率和带宽使用率三个影响因素,可有效地减少外部其他复杂因素的干扰,保证SLA,当历史资源利用数据中存在超过预设标准阈值大于预设次数的报警数据时才对该报警数据数值进行预测,可有效避免虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作,在告警物理机出现过载前对其内虚拟机进行迁移,保证告警物理机持续不间断地正常运转,基于告警物理机内各虚拟机被迁移概率选取待迁移虚拟机进行迁移,可有效减少虚拟机的迁移成本,同时保证告警物理机在进行虚拟机迁移之后,资源利用率不会过低,避免造成资源浪费。
下面对本发明实施例提供的虚拟机迁移装置进行介绍,下文描述的虚拟机迁移装置与上文描述的虚拟机迁移方法可相互对应参照。
图6为本发明实施例提供的虚拟机迁移装置的系统框图,参照图6,该虚拟机迁移装置可以包括:数据获取模块100、第一选取模块200、预测判断模块300和迁移模块400;其中,
数据获取模块100,用于获取各物理机的历史资源利用数据,其中,所述历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率;
第一选取模块200,用于在所有所述物理机中,选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据;
预测判断模块300,用于将所述告警数据输入时间序列趋势预测法中自回归模型,得到所述告警数据的预测数值,判断所述预测数值是否大于预设阈值;
迁移模块400,用于当预测判断模块300判定所述预测数值大于预设阈值时,分别确定所述告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在所述告警物理机所有虚拟机中的占比,根据所述占比得到所述各虚拟机被迁移概率,基于所述被迁移概率在所述告警物理机所有虚拟机中选取待迁移虚拟机,对所述待迁移虚拟机进行迁移。
可选的,图7示出了本发明实施例提供的虚拟机迁移装置的另一系统框图,参照图7,该虚拟机迁移装置还可以包括:第二选取模块500。
第二选取模块500,用于当预测判断模块300判定所述预测数值大于预设阈值时,在所有所述物理机中确定所有非告警物理机,在所有所述非告警物理机中选取目的物理机。
可选的,图8示出了本发明实施例提供的虚拟机迁移装置中第二选取模块500的结构框图,参照图8,该第二选取模块500可以包括:权值确定单元510和计算选取单元520;其中,
权值确定单元510,用于确定各所述非告警物理机与所述告警物理机在网络拓扑树形结构中的通信距离,根据所述通信距离确定各所述非告警物理机的权值;
计算选取单元520,用于根据各所述非告警物理机的权值、当前CPU空闲率、当前内存空闲率和当前带宽空闲率,计算得到各所述非告警物理机被选取概率,基于所述被选取概率在所有所述非告警物理机中选取目的物理机,得到目的物理机。
本发明实施例提供的虚拟机迁移装置,考虑了虚拟机CPU使用率、内存使用率和带宽使用率三个影响因素,可有效地减少外部其他复杂因素的干扰,保证SLA,当历史资源利用数据中存在超过预设标准阈值大于预设次数的报警数据时才对该报警数据数值进行预测,可有效避免虚拟机资源使用率爆发性升高而造成不必要的虚拟机迁移操作,在告警物理机出现过载前对其内虚拟机进行迁移,保证告警物理机持续不间断地正常运转,基于告警物理机内各虚拟机被迁移概率选取待迁移虚拟机进行迁移,可有效减少虚拟机的迁移成本,同时保证告警物理机在进行虚拟机迁移之后,资源利用率不会过低,避免造成资源浪费
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种虚拟机迁移方法,其特征在于,包括:
获取各物理机的历史资源利用数据,其中,所述历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率;
在所有所述物理机中,选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据;
将所述告警物理机的告警数据输入时间序列趋势预测法中自回归模型,得到所述告警数据的预测数值,判断所述预测数值是否大于预设阈值;
若大于,则确定所述告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在所述告警物理机所有虚拟机中的占比,根据所述占比得到所述各虚拟机被迁移概率,基于所述被迁移概率在所述告警物理机所有虚拟机中选取待迁移虚拟机,对所述待迁移虚拟机进行迁移;
其中,所述判断所述预测数值是否大于预设阈值后还包括:若大于,则在所有所述物理机中确定所有非告警物理机,在所有所述非告警物理机中选取目的物理机;
所述对所述待迁移虚拟机进行迁移包括:将所述待迁移虚拟机迁移至所述目的物理机;
其中,所述在所有所述非告警物理机中选取目的物理机包括:
确定各所述非告警物理机与所述告警物理机在网络拓扑树形结构中的通信距离,根据所述通信距离确定各所述非告警物理机的权值;
根据各所述非告警物理机的权值、当前CPU空闲率、当前内存空闲率和当前带宽空闲率,计算得到各所述非告警物理机被选取概率,基于所述被选取概率在所有所述非告警物理机中选取目的物理机,得到目的物理机。
2.根据权利要求1所述的虚拟机迁移方法,其特征在于,所述被选取概率为:
其中,Sj为第j台非告警物理机的被选取概率,dj为第j台非告警物理机的权值,为第j台非告警物理机当前CPU空闲率,为第j台非告警物理机当前内存空闲率,第j台非告警物理机当前带宽空闲率。
3.根据权利要求1所述的虚拟机迁移方法,其特征在于,所述选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据包括:
确定待测物理机的历史CPU利用率,判断所述待测物理机的历史CPU使用率超过第一预设标准阈值的次数是否大于第一预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史CPU使用率为告警数据;
确定待测物理机的历史内存使用率,判断所述待测物理机的历史内存使用率超过第二预设标准阈值的次数是否大于第二预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史内存使用率为告警数据;
确定待测物理机的历史带宽使用率,判断所述待测物理机的历史带宽使用率超过第三预设标准阈值的次数是否大于第三预设次数,若是,则确定所述待测物理机为告警物理机,获取所述待测物理机,并确定所述历史带宽使用率为告警数据。
4.根据权利要求1所述的虚拟机迁移方法,其特征在于,所述告警数据的预测数值xv(t+1)为:
xv(t+1)=φtxv(t)+φt-1xv(t-1)+…+φkxv(k)+…+φ2xv(2)+φ1xv(1)+ε;
其中,xv(k)为所述告警数据在第k时刻的数值,xv(t)为所述告警数据当前时刻的数值,φk为所述告警数据在第k时刻的自回归参数,φt为所述告警数据当前时刻的自回归参数,ε为服从正态分布的随机变量,ε∈(0,1)。
5.根据权利要求1所述的虚拟机迁移方法,其特征在于,所述根据所述占比得到所述各虚拟机被迁移概率包括:
根据所述占比计算得到所述各虚拟机的当前体积:
其中,为第i台虚拟机的当前体积,为第i台虚拟机当前CPU使用率在所述告警物理机所有虚拟机中的占比,为第i台虚拟机当前内存使用率在所述告警物理机所有虚拟机中的占比,为第i台虚拟机当前带宽使用率在所述告警物理机所有虚拟机中的占比;
根据所述各虚拟机的当前体积计算得到所述各虚拟机被迁移的概率:
其中,为第i台虚拟机被迁移的概率,为第i台虚拟机的当前体积。
6.一种虚拟机迁移装置,其特征在于,包括:数据获取模块、第一选取模块、预测判断模块和迁移模块;其中,
所述数据获取模块,用于获取各物理机的历史资源利用数据,其中,所述历史资源利用数据包括历史CPU使用率、历史内存使用率和历史带宽使用率;
所述第一选取模块,用于在所有所述物理机中,选取历史CPU使用率、历史内存使用率和历史带宽使用率任一超过其预设标准阈值的次数大于其预设次数的告警物理机,确定所述超过其预设标准阈值的次数大于其预设次数的历史资源利用数据为告警数据;
所述预测判断模块,用于将所述告警数据输入时间序列趋势预测法中自回归模型,得到所述告警数据的预测数值,判断所述预测数值是否大于预设阈值;
所述迁移模块,用于当所述预测判断模块判定所述预测数值大于预设阈值时,分别确定所述告警物理机内各虚拟机的当前CPU使用率、当前内存使用率和当前带宽使用率在所述告警物理机所有虚拟机中的占比,根据所述占比得到所述各虚拟机被迁移概率,基于所述被迁移概率在所述告警物理机所有虚拟机中选取待迁移虚拟机,对所述待迁移虚拟机进行迁移;
该装置还包括:第二选取模块,用于当所述预测判断模块判定所述预测数值大于预设阈值时,在所有所述物理机中确定所有非告警物理机,在所有所述非告警物理机中选取目的物理机;
其中,所述第二选取模块包括:权值确定单元和计算选取单元;其中,
所述权值确定单元,用于确定各所述非告警物理机与所述告警物理机在网络拓扑树形结构中的通信距离,根据所述通信距离确定各所述非告警物理机的权值;
所述计算选取单元,用于根据各所述非告警物理机的权值、当前CPU空闲率、当前内存空闲率和当前带宽空闲率,计算得到各所述非告警物理机被选取概率,基于所述被选取概率在所有所述非告警物理机中选取目的物理机,得到目的物理机。
CN201510849248.XA 2015-11-27 2015-11-27 一种虚拟机迁移方法和装置 Active CN105279023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510849248.XA CN105279023B (zh) 2015-11-27 2015-11-27 一种虚拟机迁移方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510849248.XA CN105279023B (zh) 2015-11-27 2015-11-27 一种虚拟机迁移方法和装置

Publications (2)

Publication Number Publication Date
CN105279023A CN105279023A (zh) 2016-01-27
CN105279023B true CN105279023B (zh) 2018-06-26

Family

ID=55148074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510849248.XA Active CN105279023B (zh) 2015-11-27 2015-11-27 一种虚拟机迁移方法和装置

Country Status (1)

Country Link
CN (1) CN105279023B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760213B (zh) * 2016-02-22 2019-03-01 东北大学 云环境下虚拟机资源利用率的预警系统及方法
CN107169571A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种特征筛选方法及装置
CN105893113A (zh) * 2016-03-29 2016-08-24 上海携程商务有限公司 虚拟机的管理系统及管理方法
CN107273211B (zh) * 2017-06-19 2020-11-27 北京格林威尔科技发展有限公司 一种云计算环境下基于虚拟机的数据处理方法
CN107277143A (zh) * 2017-06-21 2017-10-20 郑州云海信息技术有限公司 一种资源匹配管理方法及装置
CN109343949B (zh) * 2018-10-12 2021-06-15 武汉斗鱼网络科技有限公司 一种容量迁移方法、装置、电子设备及存储介质
CN111381928B (zh) * 2018-12-28 2021-05-25 中兴通讯股份有限公司 一种虚拟机迁移方法、云计算管理平台和存储介质
CN110647381B (zh) * 2019-09-18 2023-06-06 上海擎创信息技术有限公司 一种虚拟机资源均衡和部署优化方法
CN113626140A (zh) * 2021-06-30 2021-11-09 济南浪潮数据技术有限公司 一种虚拟机调整方法和相关装置
CN115794314B (zh) * 2023-01-29 2023-05-09 国网信息通信产业集团有限公司 一种云计算环境下虚拟机迁移方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593133A (zh) * 2009-06-29 2009-12-02 北京航空航天大学 虚拟机资源负载均衡方法及装置
CN103607459A (zh) * 2013-11-21 2014-02-26 东北大学 一种云计算平台IaaS层的动态资源监测及调度方法
CN104639415A (zh) * 2015-02-06 2015-05-20 杭州华三通信技术有限公司 一种虚拟机的迁移方法和软件定义网络sdn控制器
CN104765642A (zh) * 2015-03-24 2015-07-08 长沙理工大学 云环境下基于动态预测模型的虚拟机部署方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI456502B (zh) * 2011-12-01 2014-10-11 Univ Tunghai 虛擬機叢集之動態資源分配方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593133A (zh) * 2009-06-29 2009-12-02 北京航空航天大学 虚拟机资源负载均衡方法及装置
CN103607459A (zh) * 2013-11-21 2014-02-26 东北大学 一种云计算平台IaaS层的动态资源监测及调度方法
CN104639415A (zh) * 2015-02-06 2015-05-20 杭州华三通信技术有限公司 一种虚拟机的迁移方法和软件定义网络sdn控制器
CN104765642A (zh) * 2015-03-24 2015-07-08 长沙理工大学 云环境下基于动态预测模型的虚拟机部署方法及系统

Also Published As

Publication number Publication date
CN105279023A (zh) 2016-01-27

Similar Documents

Publication Publication Date Title
CN105279023B (zh) 一种虚拟机迁移方法和装置
CN109586952B (zh) 服务器扩容方法、装置
CN109451002B (zh) 一种cdn节点的选择方法及设备
CN108255673B (zh) 应用程序占用资源的检测方法、装置和存储介质
WO2016155835A1 (en) Technique for scaling an application having a set of virtual machines
WO2017084450A1 (zh) 云管理方法和系统
EP3490304A1 (en) Method for identifying access point and hotspot, and related product
CN109962855A (zh) 一种web服务器的限流方法、限流装置及终端设备
CN109800204B (zh) 数据分配方法及相关产品
CN105335229A (zh) 一种业务资源的调度方法和装置
CN106301864B (zh) 一种服务器系统扩容方法、装置及扩容处理设备
CN110134711A (zh) 大数据的处理方法、装置、设备及计算机可读存储介质
EP3531749A1 (en) Management method, management unit and system for network function
CN112559125A (zh) 容器应用迁移方法、装置、电子设备和计算机可读介质
CN114816738A (zh) 算力节点的确定方法、装置、设备及计算机可读存储介质
WO2017019018A1 (en) Virtualized network function autoscaling based on lightweight threshold crossing notifications
US20210288899A1 (en) Method and device for detecting network reliability
CN110995856B (zh) 一种服务器扩展的方法、装置、设备及存储介质
US20150347174A1 (en) Method, Apparatus, and System for Migrating Virtual Machine
CN111143033B (zh) 基于可伸缩操作系统的操作执行方法及装置
CN113886196B (zh) 片上功耗管理方法、电子设备及存储介质
US11785065B2 (en) Dynamic microservice intercommunication configuration
CN107294812B (zh) 网络检测方法、网络检测装置及智能终端
CN110704175A (zh) 容器部署方法和装置
CN109165142A (zh) 服务瓶颈判断方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant