CN102841579A - 服务器散热控制系统及方法 - Google Patents

服务器散热控制系统及方法 Download PDF

Info

Publication number
CN102841579A
CN102841579A CN2011101728313A CN201110172831A CN102841579A CN 102841579 A CN102841579 A CN 102841579A CN 2011101728313 A CN2011101728313 A CN 2011101728313A CN 201110172831 A CN201110172831 A CN 201110172831A CN 102841579 A CN102841579 A CN 102841579A
Authority
CN
China
Prior art keywords
server
virtual machine
temperature
servers
data center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101728313A
Other languages
English (en)
Inventor
吴鹏
朱小峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2011101728313A priority Critical patent/CN102841579A/zh
Priority to TW100123010A priority patent/TWI492032B/zh
Publication of CN102841579A publication Critical patent/CN102841579A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种服务器散热控制系统,应用于监控主机中,该监控主机通过网络与一个数据中心的服务器通讯连接。该系统包括:温度监控模块,用于实时监控数据中心中每台服务器的温度;区域确定模块,用于根据每台服务器的温度确定数据中心中的热量集中区域,并确定该热量集中区域内的服务器的数量;及虚拟机交换模块,用于根据所述热量集中区域内的服务器的数量,将该区域内的一个或多个服务器上安装的虚拟机与数据中心中温度较低的一个或多个服务器上安装的虚拟机进行位置交换,使得该数据中心中温度较高的服务器在物理位置上两两不相邻。本发明还提供一种服务器散热控制方法。本发明可降低服务器之间发生热量传导带来的不良影响。

Description

服务器散热控制系统及方法
技术领域
本发明涉及服务器的散热控制,尤其涉及一种服务器散热控制系统及方法。
背景技术
数据中心(Data Center)通常包含数台甚至上万台的服务器,该数据中心大多使用刀片服务器(Blade Server)和虚拟机(Virtual Machine)的组合来实现较高的空间利用率和资源利用率。为实现较高的空间利用率,相邻服务器之间的间距会很小,可能导致服务器之间出现热量传导现象,使得整个数据中心的散热系统需要长时间以较高的功率运转,而产生不必要的能源浪费。当有多个相邻的服务器发热量过大时,即使散热系统达到最大功率,如风扇转速达到最高,依然不能达到较好的散热效果,从而给服务器的稳定性带来隐患。
发明内容
鉴于以上内容,有必要提供一种服务器散热控制系统,应用于监控主机中,该监控主机通过网络与一个数据中心的服务器通讯连接。该系统包括:温度监控模块,用于实时监控数据中心中每台服务器的温度;区域确定模块,用于根据每台服务器的温度确定数据中心中的热量集中区域,并确定该热量集中区域内的服务器的数量;及虚拟机交换模块,用于根据所述热量集中区域内的服务器的数量,将该区域内的一个或多个服务器上安装的虚拟机与数据中心中温度较低的一个或多个服务器上安装的虚拟机进行位置交换,使得该数据中心中温度较高的服务器在物理位置上两两不相邻。
还有必要提供一种服务器散热控制方法,应用于监控主机中,该监控主机通过网络与一个数据中心的服务器通讯连接。该方法包括:温度监控步骤,实时监控数据中心中每台服务器的温度;区域确定步骤,根据每台服务器的温度确定数据中心中的热量集中区域,并确定该热量集中区域内的服务器的数量;及虚拟机交换步骤,根据所述热量集中区域内的服务器的数量,将该区域内的一个或多个服务器上安装的虚拟机与数据中心中温度较低的一个或多个服务器上安装的虚拟机进行位置交换,使得该数据中心中温度较高的服务器在物理位置上两两不相邻。
相较于现有技术,所述服务器散热控制系统及方法,利用虚拟机迁移技术将集群服务器中热量集中区域的部分服务器与发热量低的服务器进行虚拟机交换,从而降低服务器之间发生热量传导带来的不良影响,可有效提高服务器运行的稳定性。
附图说明
图1是本发明服务器散热控制系统较佳实施例的运行环境图。
图2是图1中监控主机较佳实施例的架构图。
图3是本发明服务器散热控制方法较佳实施例的流程图。
图4是本发明较佳实施例中数据中心所包含的服务器的示意图。
图5和图6是较佳实施例中进行虚拟机交换的示意图。
主要元件符号说明
监控主机 100
网络 200
数据中心 300
服务器 30
散热控制系统 10
存储器 11
处理器 12
温度监控模块 101
区域确定模块 102
虚拟机交换模块 103
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
如图1所示,是本发明服务器散热控制系统较佳实施例的运行环境图。该散热控制系统10应用于监控主机100中。该监控主机100通过网络200与一个数据中心300中的多个服务器30通讯连接,该多个服务器30在该数据中心300中形成一个服务器集群。
在本实施例中,为提高资源利用率,每个服务器30均安装有一个或多个虚拟机(Virtual Machine)。同时,为了更有效的管理这些虚拟机,每个服务器30上均安装有一个虚拟机管理软件,例如,威睿虚拟机软件(VMware)、Hypervisor软件或Xen虚拟机监控软件等。所述虚拟机管理软件是一种运行在服务器30和该服务器30的操作系统之间的一个中间层软件,可允许多个操作系统和应用共享服务器30上的硬件。该虚拟机管理软件可以访问服务器30上包括CPU、磁盘和内存在内的所有物理设备,其协调着这些硬件资源的访问,也同时在各个虚拟机之间施加防护。当服务器30启动并执行虚拟机管理软件时,该虚拟机管理软件会分配给每一台虚拟机适量的内存、CPU、网络和磁盘等资源,以保证每台虚拟机的独立运行。
如图2所示,是所述监控主机100较佳实施例的架构图。该监控主机100包括所述散热控制系统10、存储器11以及处理器12。在本实施例中,所述监控主机100可以是计算机或服务器等监控终端。在其他实施例中,该监控主机100也可以是所述数据中心300中的任意一个服务器30。
所述散热控制系统10用于通过网络200实时监控每台服务器30的温度,并根据每台服务器30的发热状况通过虚拟机迁移技术来提高数据中心300中的整个服务器集群的散热性能。该散热控制系统10包括温度监控模块101、区域确定模块102以及虚拟机交换模块103。该散热控制系统10可被存储在所述存储器11中,并由所述处理器12执行。
下面结合图3对所述散热控制系统10中的各模块做详细说明。
如图3所示,是本发明服务器散热控制方法较佳实施例的流程图。
步骤S01,所述温度监控模块101实时监控数据中心300中每台服务器30的温度。具体地,该温度监控模块101可通过所述网络200访问每台服务器30的基板管理控制器(Baseboard Management controller,BMC),从该基板管理控制器中读取每台服务器30的温度参数,从而对每台服务器30的温度进行监控。在其他实施例中,当基板管理控制器监测到服务器30的温度过高时,由该基板管理控制器主动将该服务器30的温度参数发送给监控主机100,从而该温度监控模块101可根据监控主机100所接收到的温度参数对该服务器30进行温度监控,而无需由该监控主机100对基板管理控制器进行实时访问。
步骤S02,所述区域确定模块102根据每台服务器30的温度确定数据中心300中的热量集中区域,并确定该热量集中区域内的服务器30的数量。具体而言,该热量集中区域是指数据中心300中温度高于一定阀值(如80度)的相邻两台或两台以上的服务器30所在的区域。如图4所示,当数据中心300中相邻的三台服务器30(Server 1、Server 2以及Server 3)的温度大于80度时,所述热量集中区域即是指该三台服务器30所在的区域。
步骤S03,所述虚拟机交换模块103根据所述热量集中区域内的服务器30的数量,将该区域内的一个或多个服务器30上安装的虚拟机与数据中心300中温度较低的一个或多个服务器30上安装的虚拟机进行位置交换,使得温度较高的服务器30在物理位置上两两不相邻。一般而言,若服务器30的温度过高,通常是由于该服务器30中的虚拟机的资源占用率过高而导致。因此,通过交换虚拟机位置的方法来实现服务器30的温度转移,可起到交换服务器30的物理位置的效果。
在本实施例中,所述虚拟机交换模块103可使用所述虚拟机管理软件来实现虚拟机位置的交换。具体而言,该虚拟机交换模块103可通过以下方法来实现虚拟机的位置交换:首先,该虚拟机交换模块103将所述热量集中区域内的服务器30按照物理摆放顺序使用阿拉伯数字1、2、3…n依次进行编号;若所述热量集中区域内的服务器30的数量为奇数,则将编号为偶数的一个或多个服务器30的虚拟机与数据中心300中温度较低的一个或多个服务器30的虚拟机进行位置交换;若所述热量集中区域内的服务器30的数量为偶数,则将编号为奇数的一个或多个服务器30的虚拟机与数据中心300中温度较低的一个或多个服务器30的虚拟机进行位置交换。
通过实施以上所述的虚拟机位置交换方法,可使得数据中心300中温度较高的服务器30两两不相邻,从而可降低服务器30之间因发生热量传导对数据中心300的散热系统所带来的影响。下面举一个实例对所述虚拟机位置交换的过程进行描述。
参考图4至图6,假设所述热量集中区域内包括图4中的Server 1、Server 2以及Server 3三台服务器30(其中的数字1、2、3分别代表每台服务器30的编号),该区域内的服务器30的数量为奇数,且此时数据中心300中的另一台服务器30(Server 8)的温度较低。因此,如图5所示,所述虚拟机交换模块103则使用所述虚拟管理软件将Server 2的虚拟机A和虚拟机B迁移至Server 8中,然后再将Server 8中的虚拟机C和D迁移至Server 2中,从而实现Server 2与Server 8之间的虚拟机交换。交换后的Server 2与Server 8中的虚拟机如图6所示。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种服务器散热控制方法,应用于监控主机中,该监控主机通过网络与一个数据中心的服务器通讯连接,其特征在于,该方法包括:
温度监控步骤,实时监控数据中心中每台服务器的温度;
区域确定步骤,根据每台服务器的温度确定数据中心中的热量集中区域,并确定该热量集中区域内的服务器的数量;及
虚拟机交换步骤,根据所述热量集中区域内的服务器的数量,将该区域内的一个或多个服务器上安装的虚拟机与数据中心中温度较低的一个或多个服务器上安装的虚拟机进行位置交换,使得该数据中心中温度较高的服务器在物理位置上两两不相邻。
2.如权利要求1所述的服务器散热控制方法,其特征在于,所述温度监控步骤包括:
通过所述网络访问每台服务器的基板管理控制器,从该基板管理控制器中读取每台服务器的温度参数,以对每台服务器的温度进行监控。
3.如权利要求1所述的服务器散热控制方法,其特征在于,所述热量集中区域是指所述数据中心中温度高于一定阀值的相邻两台或两台以上的服务器所在的区域。
4.如权利要求1所述的服务器散热控制方法,其特征在于,所述虚拟机交换步骤包括:
将所述热量集中区域内的服务器按照物理摆放顺序使用阿拉伯数字1、2、3…n依次进行编号;
若所述热量集中区域内的服务器的数量为奇数,将编号为偶数的一个或多个服务器的虚拟机与数据中心中温度较低的一个或多个服务器的虚拟机进行位置交换;或
若所述热量集中区域内的服务器的数量为偶数,将编号为奇数的一个或多个服务器的虚拟机与数据中心中温度较低的一个或多个服务器的虚拟机进行位置交换。
5.如权利要求4所述的服务器散热控制方法,其特征在于,所述虚拟机交换步骤使用每台服务器上安装的虚拟机管理软件实现虚拟机位置的交换。
6.一种服务器散热控制系统,应用于监控主机中,该监控主机通过网络与一个数据中心的服务器通讯连接,其特征在于,该系统包括:
温度监控模块,用于实时监控数据中心中每台服务器的温度;
区域确定模块,用于根据每台服务器的温度确定数据中心中的热量集中区域,并确定该热量集中区域内的服务器的数量;及
虚拟机交换模块,用于根据所述热量集中区域内的服务器的数量,将该区域内的一个或多个服务器上安装的虚拟机与数据中心中温度较低的一个或多个服务器上安装的虚拟机进行位置交换,使得该数据中心中温度较高的服务器在物理位置上两两不相邻。
7.如权利要求6所述的服务器散热控制系统,其特征在于,所述温度监控模块通过所述网络访问每台服务器的基板管理控制器,从该基板管理控制器中读取每台服务器的温度参数,以对每台服务器的温度进行监控。
8.如权利要求6所述的服务器散热控制系统,其特征在于,所述热量集中区域是指所述数据中心中温度高于一定阀值的相邻两台或两台以上的服务器所在的区域。
9.如权利要求6所述的服务器散热控制系统,其特征在于,所述虚拟机交换模块通过以下步骤实现虚拟机位置的交换:
将所述热量集中区域内的服务器按照物理摆放顺序使用阿拉伯数字1、2、3…n依次进行编号;
若所述热量集中区域内的服务器的数量为奇数,将编号为偶数的一个或多个服务器的虚拟机与数据中心中温度较低的一个或多个服务器的虚拟机进行位置交换;或
若所述热量集中区域内的服务器的数量为偶数,将编号为奇数的一个或多个服务器的虚拟机与数据中心中温度较低的一个或多个服务器的虚拟机进行位置交换。
10.如权利要求9所述的服务器散热控制系统,其特征在于,所述虚拟机交换模块使用每台服务器上安装的虚拟机管理软件实现虚拟机位置的交换。
CN2011101728313A 2011-06-24 2011-06-24 服务器散热控制系统及方法 Pending CN102841579A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2011101728313A CN102841579A (zh) 2011-06-24 2011-06-24 服务器散热控制系统及方法
TW100123010A TWI492032B (zh) 2011-06-24 2011-06-30 伺服器散熱控制系統及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101728313A CN102841579A (zh) 2011-06-24 2011-06-24 服务器散热控制系统及方法

Publications (1)

Publication Number Publication Date
CN102841579A true CN102841579A (zh) 2012-12-26

Family

ID=47369048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101728313A Pending CN102841579A (zh) 2011-06-24 2011-06-24 服务器散热控制系统及方法

Country Status (2)

Country Link
CN (1) CN102841579A (zh)
TW (1) TWI492032B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104253828A (zh) * 2013-06-25 2014-12-31 英业达科技有限公司 伺服器系统及监控方法
CN104470331A (zh) * 2014-12-01 2015-03-25 哈尔滨海能达科技有限公司 一种风扇散热控制方法及装置
CN105224756A (zh) * 2015-10-14 2016-01-06 浪潮电子信息产业股份有限公司 一种获取SmartRack整机柜风量的设计方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020004912A1 (en) * 1990-06-01 2002-01-10 Amphus, Inc. System, architecture, and method for logical server and other network devices in a dynamically configurable multi-server network environment
CN1947096A (zh) * 2004-05-08 2007-04-11 国际商业机器公司 虚拟机计算机程序的动态迁移
CN101005747A (zh) * 2006-01-21 2007-07-25 富准精密工业(深圳)有限公司 液冷散热装置及用于该液冷散热装置的热交换器
CN100362453C (zh) * 2004-11-23 2008-01-16 国际商业机器公司 在计算机中心动态重新安排应用及其它服务器资源的方法
CN102057367A (zh) * 2008-04-10 2011-05-11 惠普开发有限公司 依照环境数据的虚拟机迁移

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7460932B2 (en) * 2005-11-29 2008-12-02 International Business Machines Corporation Support of deep power savings mode and partial good in a thermal management system
US7596430B2 (en) * 2006-05-03 2009-09-29 International Business Machines Corporation Selection of processor cores for optimal thermal performance

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020004912A1 (en) * 1990-06-01 2002-01-10 Amphus, Inc. System, architecture, and method for logical server and other network devices in a dynamically configurable multi-server network environment
CN1947096A (zh) * 2004-05-08 2007-04-11 国际商业机器公司 虚拟机计算机程序的动态迁移
CN100362453C (zh) * 2004-11-23 2008-01-16 国际商业机器公司 在计算机中心动态重新安排应用及其它服务器资源的方法
CN101005747A (zh) * 2006-01-21 2007-07-25 富准精密工业(深圳)有限公司 液冷散热装置及用于该液冷散热装置的热交换器
CN102057367A (zh) * 2008-04-10 2011-05-11 惠普开发有限公司 依照环境数据的虚拟机迁移

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104253828A (zh) * 2013-06-25 2014-12-31 英业达科技有限公司 伺服器系统及监控方法
CN104470331A (zh) * 2014-12-01 2015-03-25 哈尔滨海能达科技有限公司 一种风扇散热控制方法及装置
CN104470331B (zh) * 2014-12-01 2017-04-12 哈尔滨海能达科技有限公司 一种风扇散热控制方法及装置
CN105224756A (zh) * 2015-10-14 2016-01-06 浪潮电子信息产业股份有限公司 一种获取SmartRack整机柜风量的设计方法

Also Published As

Publication number Publication date
TW201301008A (zh) 2013-01-01
TWI492032B (zh) 2015-07-11

Similar Documents

Publication Publication Date Title
US11855766B2 (en) Technologies for dynamically managing resources in disaggregated accelerators
US9684364B2 (en) Technologies for out-of-band power-based task scheduling for data centers
US8156358B2 (en) System and method for dynamic modular information handling system power distribution
CN103533063A (zh) 一种可实现web应用资源动态扩展的方法及装置
US11467729B2 (en) Allocating memory and redirecting memory writes in a cloud computing system based on temperature of memory modules
Sammy et al. Energy efficient security preserving vm live migration in data centers for cloud computing
Cao et al. Cooling-aware job scheduling and node allocation for overprovisioned HPC systems
CN104185821B (zh) 多个计算层次结构级别中的工作负荷迁移判断
Mukherjee et al. A detailed study on data centre energy efficiency and efficient cooling techniques
US10405455B2 (en) Fan speed-adjustment policy for entire machine cabinet by placing fan table on node BMC
CN102811141A (zh) 虚拟机运行监测系统及方法
Kaplan et al. Optimizing communication and cooling costs in HPC data centers via intelligent job allocation
CN102841579A (zh) 服务器散热控制系统及方法
US11385972B2 (en) Virtual-machine-specific failover protection
CN107533348B (zh) 热管理高性能计算系统的方法和装置及计算机可读介质
Gao et al. Why" Some" Like It Hot Too: Thermal Attack on Data Centers
US11531572B2 (en) Cross-cluster host reassignment
CN110908863A (zh) Arm引擎集群服务器
US20190068692A1 (en) Management of computing infrastructure under emergency peak capacity conditions
CN109388470A (zh) 一种提供物理主机服务的桌面云计算系统
CN213545193U (zh) 一种高性能计算机服务器系统
CN114828579B (zh) 集装箱数据中心的节能控制方法及相关设备
Liang et al. Thermal-aware workload distribution for clusters
Sood et al. A Coordinated Approach for Energy-Aware Fault Tolerance in Cloud Computing.
NO20230136A1 (en) System for and method of harnessing heat generated from running at least one virtual operative system instance

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121226