一种基于虚拟IT资源分配技术的数据中心节能系统的方法
技术领域
本发明涉及数据中心虚拟IT资源分配技术,尤其涉及一种基于虚拟IT资源分配技术的数据中心节能系统的方法。
背景技术
社会的发展提高了人类的生活水平,大大加强了社会生产力,同时对能源的需求和使用也大幅提高。全世界范围内的能源正变得越来越紧缺,因此,各行各业开始寻求节约能源,减少能耗的各种方法,以保证能源的可持续发展。
在数据中心中,随着业务需求的不断扩充,其计算规模和应用也在日益增加,IT系统规模逐渐庞大,带来了高能耗、数据中心空间紧张、IT系统总体成本高的问题,并引起了广泛关注。作为全球最大的搜索引擎,Google的数据中心每年消耗的电能为1亿千瓦。据统计,在一个数据中心的运维成本中,能耗占了40%。此外,系统内部因为复杂应用和数据冗余的需求,一部分服务器、存储设备等系统并没有被充分利用起来,也造成了资源的极度浪费。研究显示,数据中心的物理节点在空闲(CPU利用率为0)消耗的电源为满负载时(CPU利用率为100%)消耗的70%左右。虽然目前数据中心在节能优化、实现绿色计算方面的研究和应用取得了一些成果,但仍有所不足。如专利(申请号:CN102096461A),涉及计算机系统结构领域,通过监测模块对物理机和虚拟机的资源利用率及当前各物理服务器资源使用情况进行实时监控,形成待迁移服务器列表,从而进行虚拟机迁移和负载感知整合,实现数据中心节能。专利(申请号:CN102404412A)涉及了互联网技术领域,从物理机上的虚拟机数目从少到多依次进行迁移判断,从而尽快迁空物理机,在不降低计算中心工作性能的基础上,实现了降低能耗。但是这些系统仅仅通过算法进行监测,方法过于单一。对于目前规模庞大的数据中心来讲,这些算法必定占用过多的计算资源,影响工作效率,且对机房环境中的辅助设备没有进行相关操作,能源浪费仍然显而易见。另外,专利(申请号:201210331232.6)主要公布了通过有线和无线采集装置,获取数据中心能耗情况,从而控制数据中心整体环境的一种方法,该发明侧重于数据采集装置的创新,通过对采集的数据进行分析,确定对数据中心环境整体控制的方法,根据局部热点实现局部排风或者降温,从而实现节能的目的,没有考虑虚拟机迁移的进一步降低数据中心能耗的方法。专利(申请号:CN102929687A)通过一种虚拟机的放置方法来实现数据中心的节能。优先选用单个物理服务器来创建虚拟机,再选用同一分区内的物理服务器来创建虚拟机,在前两者都不存在的情况下,最终选用集中程度最高的物理服务器序列来创建虚拟机,最终实现了云计算中心虚拟机的节能放置。但这些方法都仅为单向操作,没有实现闭环反馈机制,即没有采取任何衡量办法进行判定此次节能操作是否有效。
数据中心能源的使用效率常常通过电源使用效率(Power Usage Effectiveness,PUE)值来衡量。PUE值是指数据中心消耗的所有能源与IT负载消耗的能源之比。PUE值越接近1,表示一个数据中心的绿色化程度越高。目前世界上正在运营的数据中心中,最佳的PUE在美国,达到1.046。中国的PUE均值超过1.5。因此,在满足用户服务需求的基础上,保证数据中心的IT资源合理分配,同时降低整体的能耗成本,实现机房的绿色、低碳运维目标,是个迫在眉睫的问题。
发明内容
本发明的目的就是为了解决上述问题,提出了一种基于虚拟IT资源分配技术的数据中心节能系统的方法。该方法通过对数据中心的虚拟化环境,如局部温度、湿度、气流、气压,服务器CPU负载率、内存占用、磁盘存数等信息进行实时监控,获得“智能信息感知末梢”的相关环境数据,根据建模分析结果,结合电源管理系统,对数据中心有限的IT资源进行动态迁移和调度,再将当前的虚拟环境监控数据反馈给后台,判断此次IT资源分配是否合理,最终通过这种闭环反馈机制,使数据中心的资源利用达到了高效、节能的运维目标。
为实现上述目的,本发明是通过以下技术方案实现的:
一种基于虚拟IT资源分配技术的数据中心节能系统,它包括:
数据中心,数据中心设有若干服务器及辅助设备,根据各用户不同的任务分配唯一对应的虚拟机,各虚拟机任务由相应的服务器完成;
主机,它进行虚拟环境监测和虚拟IT资源分配:主机根据各服务器负荷情况,将虚拟机进行迁移以实现IT资源分配,在每次IT资源分配后,均需再次进行虚拟环境资源监控数据的分析,形成一个反馈闭环的监测系统,以确保此次资源调度合理,实现节能运行。
主机通过布置在数据中心的机房各个地方的温湿度传感器、风向风速传感器,机柜自身的采集装置,采集数据中心的局部温度、湿度、气流、气压信息以及服务器运行信息,上传至主机;主机进行温湿度云图、CPU负载的三维绘制,直观确定出数据中心中各服务器的CPU占用情况,为虚拟IT资源分配模块的再次分配、实现数据中心节能提供依据;
虚拟IT资源的迁移分配须遵循以下四个基本原则:
a.节能程度
后台主机根据数据库模型计算当前数据中心的耗能情况,以便与采取迁移分配方法后的耗能情况进行比较,确定该方法的节能程度。但是,在采取迁移方法之前,需要综合考虑以下b、c和d三点,决定是否采取节能措施。
b.整体迁移时间
整体迁移时间是指虚拟机从源主机开始迁移到迁移结束的时间。该时间不宜过长,不能超过设定时间,否则影响完成当前工作计算量的时间。
c.停机时间
停机时间指在虚拟机迁移的过程中,源主机和目的主机同时不可用的时间。跟整体迁移时间类似,该时间不能超过设定时间,不宜过长。
d.对应用程序的性能影响
对应程序的性能影响指虚拟机迁移对于被迁移服务器上运行服务性能的影响程度。当服务器上部分虚拟机迁移到其他服务器上的过程中,被迁移服务器上运行的其他应用程序不能发生变动,即对被迁移服务器服务性能的影响越小越好,否则将造成被迁移服务器业务量的丢失或者错误,失去迁移的意义。
满足上述虚拟IT资源的迁移分配的四项基本原则后,主机即可根据虚拟环境监测系统获得的数据信息,按照迁移规则进行IT资源的动态迁移。若当前服务器计算负荷较低,即处于业务非忙阶段时,将低负荷服务器上的虚拟机,全部迁移到其他未达到负载上限的服务器上,并通过控制将空闲下来的服务器调至待机模式或者节电模式;同时,与这些服务器相对应辅助设备,也将被控制处于关闭状态;若当前服务器计算负荷较高,即处于业务繁忙阶段时,将待机模式或节电模式的服务器唤醒,通过动态调度,将一部分虚拟机迁移至已经启动尚处于空闲状态的服务器上,使IT资源高效使用。
所述机柜自身的采集装置通过IPMI获取服务器CPU、内存、存储空间的使用情况。
一种基于虚拟IT资源分配技术的数据中心节能系统的节能方法,它通过一个反馈闭环的监测系统,进行IT资源的动态调度,使有限的服务器达到有效利用,从而实现绿色节能目标,具体步骤如下:
步骤一:虚拟化环境数据采集
采集数据中心机房的各个位置温、湿度信息、服务器CPU利用率、内存、存储空间使用情况(即服务器运行信息);
步骤二:主机对采集的数据进行分析
将采集的数据进行分析,绘制温湿度云图、CPU负载率曲线,得知数据中心机房中热点的分布情况,然后,重点查看相关区域的服务器运行状况;
步骤三:主机进行IT资源分配
根据步骤二分析的结果,对数据中心中的服务器进行虚拟整合;即利用电源控制机制,对直接处于空闲状态的服务器进行休眠、待机或者关闭操作;将计算负荷较低服务器上的虚拟机进行整合,将其迁移到其他未达到负荷上限的服务器上,释放更多空闲服务器,从而进行节能操作;当计算任务增多时,再唤醒相关的服务器,使其工作负荷实现高效均衡,提高了资源利用率;
步骤四:再次进行虚拟环境数据采集、分析,评估IT资源分配是否合理
重复步骤一和步骤二的过程,判断当前的服务器资源是否得到高效利用,有无空闲服务器。
本发明的有益效果可概括为以下四点:
1)IT资源调度方法可行
从背景技术中提到的专利(申请号:CN102096461A)、专利(申请号:CN102404412A)和专利(申请号:CN102404412A)的内容可知,数据中心的IT资源可以根据一定的算法或者规则进行相应的调度,从而实现机房的节能。本发明中通过虚拟环境监测的闭环反馈算法,实现了IT资源的调度,即该方法可行。
2)虚拟环境监测包括IT设备的运行环境和IT设备自身的运行情况
IT设备的运行环境包括数据中心局部的温度、湿度、气流、气压等信息,是通过布置在数据中心机房各个区域的温湿度传感器、风向风速传感器来采集的,无线基站接收该数据信息后进行简单处理并提交给后台主机。
IT设备自身的运行情况包括数据中心所有服务器的CPU频率,磁盘存数、内存占用等参数信息,是通过承载服务器机柜本身的采集装置获得的,并利用服务器自身的IPMI接口通过通讯网络,提交给后台主机。
主机将数据中心机房及相关设备进行三维建模,并通过采集到虚拟环境的监测信息,绘制各个区域的温湿度云图和CPU负载曲线,从而用户可以直观的确定出数据中心各服务器CPU的占用情况,哪些空闲,哪些繁忙,为后续制定运维人员进行IT资源调度分配提供有效的数据支持。
3)节能系统部署方便
该发明中,虚拟环境的监测方法分两种,即采用无线技术监测IT设备的运行环境和采用网络技术监测IT设备自身的运行情况。与传统单独的有线监测技术相比,虽然无线技术相对监测不到服务器自身的运行情况,但传输信息简单方便,通过天线将采集的信息直接传递给接收基站,避免了有线技术中大量传输线缆布置给数据中心机房带来的额外复杂度。另外,服务器资源的利用情况可以通过网络技术进行监测,并通过有线传输网络将信息上传给后台主机。
4)节能系统扩展方便
数据中心的无线技术及网络技术,不停机即可进行扩展,避免了传统有线技术监测系统中,每次部署范围增加或者变动带来的数据中心停机问题,提高了数据中心机房运维的稳定性和长久性。
最终,本发明根据当前虚拟环境监测的结果,使得数据中心当前运行设备能源使用效率达到最高。该方法用于云计算中心后,能耗节约了13%,PUE值也下降到1.5以下,从而实现了数据中心绿色节能的目的。
附图说明
图1为本发明中数据中心IT资源调度示意图;
图2为本发明中数据中心实现节能的方法框架图;
其中,1.数据中心机房,2.虚拟环境监控系统,3.虚拟IT资源分配,4.后台主机。
图3为本发明中数据中心闭环反馈控制算法示意图。
具体实施方式
下面结合附图与实施例对本发明做进一步说明。
本发明的工作方法为:
通过一个反馈闭环的监测系统,进行IT资源的动态调度,使有限的服务器达到有效利用,从而实现绿色节能目标。具体步骤如下:
步骤一:虚拟化环境数据采集;包括数据中心机房的各个位置温、湿度信息、服务器CPU利用率、磁盘存储量、内存占用空间等数据;
步骤二:后台对采集的数据进行分析;将采集的数据进行分析,绘制温湿度云图、CPU负载率曲线,得知数据中心机房中热点的分布情况,然后,重点查看相关区域的服务器运行状况;
步骤三:后台进行IT资源分配;根据步骤二分析的结果,对数据中心中得服务器进行虚拟整合。结合电源控制机制,对直接处于空闲状态的服务器进行休眠、待机或者关闭操作;将计算负荷较低服务器上的虚拟机进行整合,将其迁移到其他未达到负荷上限的服务器上,释放更多空闲服务器,从而进行节能操作。当计算任务增多时,再唤醒相关的服务器,使其工作负荷实现高效均衡,提高了资源利用率。
步骤四:再次进行虚拟环境数据采集、分析,评估IT资源分配是否合理;继续步骤一和二的过程,判断当前的服务器资源是否得到高效利用,有无空闲服务器。通过这样一个闭环反馈的实时监测、分配系统,使数据中心的IT资源得到了充分利用,同时避免了与IT资源相关的空调、通风等装置无能源浪费问题的出现,实现了数据中心节能的目标。
图1中用户1、用户2到用户n,都有各自很多任务,如用户1的任务11,12,到1m。根据不同的工作任务,分配了对应唯一的虚拟机,虚拟机11,12,到1m。当选择后台服务器时,有较大的随机性,即不同的虚拟机任务可以由任意的后台服务器完成。因此,后台服务器的IT资源分配也具有很大的灵活性。可以根据用户量,工作量的大小,实时进行IT资源的有效分配,最终实现资源的高效利用,同时节约能源损耗。
图2中数据中心机房包括了大量服务器及其相关辅助设备,如供应电源的UPS,保证机房工作环境温湿度的空调、通风装置等。
图2中虚拟化环境监控系统2安装在数据中心机房1中各服务器各监测位置上,比如,利用无线温湿度传感器实时获取服务器所处微环境的温湿度情况,通过无线通讯方式上传给主机;利用服务器自身的采集装置获取服务器CPU、内存、存储空间的使用情况,并将该数据通过有线通讯方式上传给主机3。
图2中主机3上有可视化的环境监控软件,采用了三维虚拟现实技术,实现了数据中心的温湿度云图、CPU负载率的绘制,此外,主机3还对服务器的CPU频率,磁盘存数、内存占用情况等性能参数进行实时监控,如机柜内部出现了局部热点,可以通过三维模型进行快速定位,并重点查看其CPU运行参数,运维人员便很快知道哪些机柜满负荷工作,哪些机柜空闲空转。从而为运维人员合理分配调度IT资源提供可靠的数据依据。
图2中虚拟IT资源分配4由主机3根据虚拟环境监测系统2的结果,将非工作高峰期时,计算负荷较少节点的虚拟资源进行整合,动态迁移到负荷不满的服务器上,获得处于“空转”状态的空闲节点,配合电源控制功能,将其配置为休眠、待机或者关闭模式,以避免不必要的能源损耗。同时,相应的空调、通风装置等进行优化,减少装置空转引起的功耗。当机房工作于高峰期时,逐步唤醒空闲节点,将IT资源重新分配,这种工作方式不仅有助于延长硬件设备的使用寿命,提升硬件设备的稳定性,同时IT资源也得到了充分利用。
此外,图2中虚拟IT资源分配4完成后,再次对机房1进行环境监测,查看当前热点分布状况,服务器的CPU,硬盘、内存等性能参数运行是否合理。如果没有出现局部热点,没有空转的服务器,则表示分配合理,能效最优化。否则,继续进行分配,以达到IT资源分配和能效分配最优。通过这样的反馈闭环工作机制,使数据中心最终实现了能源的高效利用,最终实现数据中心的节能。
本发明已在某云计算机房中心平台上实现。该机房约500平米,布署有2组UPS、96个机柜、7台配电柜、3台空调等。在机柜中,设置有若干服务器。图3为本发明中闭环反馈控制算法的示意图。下面结合云计算中心的实施情况,进行详细介绍。
1)部署虚拟环境监测系统,建立三维分析;
虚拟环境监测的信息包括数据中心机柜内、外的温湿度信息和各个服务器的CPU频率,磁盘存数、内存占用等参数信息。前者是在通过安装在数据中心建筑内部至少一个温湿度传感器和安装在机柜内若干温湿度传感器来采集的,基站接收该信息后进行简单数据处理后上传给后台主机。后者是通过服务器自身板卡对自身内部的运行状态数据进行采集的,并利用服务器自身的IPMI接口通过通讯网络与后台通讯,将采集到的服务器的运行状态数据上传给后台主机。
后台主机上安装有环境监控软件,根据系统建立初期输入的基础数据以及实时接收到的数据进行三维建模,实现了数据中心所有建筑及物理设备具体位置的温湿度云图、服务器CPU负载率的绘制。
2)判断是否发现局部热点;
通过步骤一数据中心三维模型中得温湿度云图,可以直观的看出该机房中,哪个区域热点高,哪个区域热点低。通过分析热点高和热点低区域服务器的CPU负载曲线图,获取CPU满负荷工作的服务器列表和空闲空转的服务器列表,另外,CPU负荷未满的服务器,按照CPU负载率从高到低得到一个列表,为下一步IT资源迁移调度提供可靠的数据依据。
3)根据迁移原则调度资源;
根据步骤二的结果,按照迁移原则进行IT资源的调度。将CPU负载率列表末端,即计算负荷较低服务器的虚拟机,全部迁移到其他未达到负载上限,即处于CPU负载率列表前端的服务器上,并通过控制将空闲下来的服务器及调度之前已经空闲空转的服务器调至待机模式或者节电模式;同时,与这些服务器相对应辅助设备,也将被控制处于关闭状态。当业务增加时,将待机模式或节电模式的服务器唤醒,通过动态调度,将一部分虚拟机迁移至已经启动尚处于空闲状态的服务器上,使IT资源高效使用。
4)重新计算是否存在局部热点。
重复步骤二,若此时没有局部热点,则继续进行虚拟环境监测,如果有,则进行步骤三的操作。
某云计算中心采用本发明的闭环反馈控制算法后,通过IT资源迁移释放出更多的空闲机器,消除了若干服务器空转的状态,同时避免了相应区域辅助设备运行造成的能源浪费,改进后的系统的总能耗仅为之前的87%,节约了13%的能耗,PUE值也下降到1.5以下。此外,该算法使得数据中心的部分服务器实现间歇性的轮转运行,显著延长了设备的使用寿命,提升了硬件设备的系统稳定性,从而保护了用户的长期投资。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。