TWI492032B - 伺服器散熱控制系統及方法 - Google Patents

伺服器散熱控制系統及方法 Download PDF

Info

Publication number
TWI492032B
TWI492032B TW100123010A TW100123010A TWI492032B TW I492032 B TWI492032 B TW I492032B TW 100123010 A TW100123010 A TW 100123010A TW 100123010 A TW100123010 A TW 100123010A TW I492032 B TWI492032 B TW I492032B
Authority
TW
Taiwan
Prior art keywords
server
servers
virtual machine
data center
temperature
Prior art date
Application number
TW100123010A
Other languages
English (en)
Other versions
TW201301008A (zh
Inventor
Peng Wu
Xiao-Feng Zhu
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201301008A publication Critical patent/TW201301008A/zh
Application granted granted Critical
Publication of TWI492032B publication Critical patent/TWI492032B/zh

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Description

伺服器散熱控制系統及方法
本發明涉及伺服器的散熱控制,尤其涉及一種伺服器散熱控制系統及方法。
資料中心(Data Center)通常包含數台甚至上萬台的伺服器,該資料中心大多使用刀片伺服器(Blade Server)和虛擬機(Virtual Machine)的組合來實現較高的空間利用率和資源利用率。為實現較高的空間利用率,相鄰伺服器之間的間距會很小,可能導致伺服器之間出現熱量傳導現象,使得整個資料中心的散熱系統需要長時間以較高的功率運轉,而產生不必要的能源浪費。當有多個相鄰的伺服器發熱量過大時,即使散熱系統達到最大功率,如風扇轉速達到最高,依然不能達到較好的散熱效果,從而給伺服器的穩定性帶來隱患。
鑒於以上內容,有必要提供一種伺服器散熱控制系統,應用於監控主機中,該監控主機透過網路與一個資料中心的伺服器通訊連接。該系統包括:溫度監控模組,用於即時監控資料中心中每台伺服器的溫度;區域確定模組,用於根據每台伺服器的溫度確定資料中心中的熱量集中區域,並確定該熱量集中區域內的伺服器的數量;及虛擬機交換模組,用於根據所述熱量集中區域內的伺服器的數量,將該區域內的一個或多個伺服器上安裝的虛擬機與資料中心中溫度較低的一個或多個伺服器上安裝的虛擬機進行位置交換,使得該資料中心中溫度較高的伺服器在物理位置上兩兩不相鄰。
還有必要提供一種伺服器散熱控制方法,應用於監控主機中,該監控主機透過網路與一個資料中心的伺服器通訊連接。該方法包括:溫度監控步驟,即時監控資料中心中每台伺服器的溫度;區域確定步驟,根據每台伺服器的溫度確定資料中心中的熱量集中區域,並確定該熱量集中區域內的伺服器的數量;及虛擬機交換步驟,根據所述熱量集中區域內的伺服器的數量,將該區域內的一個或多個伺服器上安裝的虛擬機與資料中心中溫度較低的一個或多個伺服器上安裝的虛擬機進行位置交換,使得該資料中心中溫度較高的伺服器在物理位置上兩兩不相鄰。
相較於習知技術,所述伺服器散熱控制系統及方法,利用虛擬機遷移技術將集群伺服器中熱量集中區域的部分伺服器與發熱量低的伺服器進行虛擬機交換,從而降低伺服器之間發生熱量傳導帶來的不良影響,可有效提高伺服器運行的穩定性。
如圖1所示,係本發明伺服器散熱控制系統較佳實施例的運行環境圖。該散熱控制系統10應用於監控主機100中。該監控主機100透過網路200與一個資料中心300中的多個伺服器30通訊連接,該多個伺服器30在該資料中心300中形成一個伺服器集群。
在本實施例中,為提高資源利用率,每個伺服器30均安裝有一個或多個虛擬機(Virtual machine)。同時,為了更有效的管理這些虛擬機,每個伺服器30上均安裝有一個虛擬機管理軟體,例如,威睿虛擬機軟體(VMware)、Hypervisor軟體或Xen虛擬機監控軟體等。所述虛擬機管理軟體是一種運行在伺服器30和該伺服器30的作業系統之間的一個中間層軟體,可允許多個作業系統和應用共用伺服器30上的硬體。該虛擬機管理軟體可以訪問伺服器30上包括CPU、磁片和記憶體在內的所有物理設備,其協調著這些硬體資源的訪問,也同時在各個虛擬機之間施加防護。當伺服器30啟動並執行虛擬機管理軟體時,該虛擬機管理軟體會分配給每一台虛擬機適量的記憶體、CPU、網路和磁片等資源,以保證每台虛擬機的獨立運行。
如圖2所示,係所述監控主機100較佳實施例的架構圖。該監控主機100包括所述散熱控制系統10、記憶體11以及處理器12。在本實施例中,所述監控主機100可以是電腦或伺服器等監控終端。在其他實施例中,該監控主機100也可以是所述資料中心300中的任意一個伺服器30。
所述散熱控制系統10用於透過網路200即時監控每台伺服器30的溫度,並根據每台伺服器30的發熱狀況透過虛擬機遷移技術來提高資料中心300中的整個伺服器集群的散熱性能。該散熱控制系統10包括溫度監控模組101、區域確定模組102以及虛擬機交換模組103。該散熱控制系統10可被儲存在所述記憶體11中,並由所述處理器12執行。
下面結合圖3對所述散熱控制系統10中的各模組做詳細說明。
如圖3所示,係本發明伺服器散熱控制方法較佳實施例的流程圖。
步驟S01,所述溫度監控模組101即時監控資料中心300中每台伺服器30的溫度。具體地,該溫度監控模組101可透過所述網路200訪問每台伺服器30的基板管理控制器(Baseboard Management controller,BMC),從該基板管理控制器中讀取每台伺服器30的溫度參數,從而對每台伺服器30的溫度進行監控。在其他實施例中,當基板管理控制器監測到伺服器30的溫度過高時,由該基板管理控制器主動將該伺服器30的溫度參數發送給監控主機100,從而該溫度監控模組101可根據監控主機100所接收到的溫度參數對該伺服器30進行溫度監控,而無需由該監控主機100對基板管理控制器進行即時訪問。
步驟S02,所述區域確定模組102根據每台伺服器30的溫度確定資料中心300中的熱量集中區域,並確定該熱量集中區域內的伺服器30的數量。具體而言,該熱量集中區域是指資料中心300中溫度高於一定閥值(如80度)的相鄰兩台或兩台以上的伺服器30所在的區域。如圖4所示,當資料中心300中相鄰的三台伺服器30(Server 1、Server 2以及Server 3)的溫度大於80度時,所述熱量集中區域即是指該三台伺服器30所在的區域。
步驟S03,所述虛擬機交換模組103根據所述熱量集中區域內的伺服器30的數量,將該區域內的一個或多個伺服器30上安裝的虛擬機與資料中心300中溫度較低的一個或多個伺服器30上安裝的虛擬機進行位置交換,使得溫度較高的伺服器30在物理位置上兩兩不相鄰。一般而言,若伺服器30的溫度過高,通常是由於該伺服器30中的虛擬機的資源佔用率過高而導致。因此,透過交換虛擬機位置的方法來實現伺服器30的溫度轉移,可起到交換伺服器30的物理位置的效果。
在本實施例中,所述虛擬機交換模組103可使用所述虛擬機管理軟體來實現虛擬機位置的交換。具體而言,該虛擬機交換模組103可透過以下方法來實現虛擬機的位置交換:首先,該虛擬機交換模組103將所述熱量集中區域內的伺服器30按照物理擺放順序使用阿拉伯數字1、2、3…n依次進行編號;若所述熱量集中區域內的伺服器30的數量為奇數,則將編號為偶數的一個或多個伺服器30的虛擬機與資料中心300中溫度較低的一個或多個伺服器30的虛擬機進行位置交換;若所述熱量集中區域內的伺服器30的數量為偶數,則將編號為奇數的一個或多個伺服器30的虛擬機與資料中心300中溫度較低的一個或多個伺服器30的虛擬機進行位置交換。
透過實施以上所述的虛擬機位置交換方法,可使得資料中心300中溫度較高的伺服器30兩兩不相鄰,從而可降低伺服器30之間因發生熱量傳導對資料中心300的散熱系統所帶來的影響。下面舉一個實例對所述虛擬機位置交換的過程進行描述。
參考圖4至圖6,假設所述熱量集中區域內包括圖4中的Server 1、Server 2以及Server 3三台伺服器30(其中的數字1、2、3分別代表每台伺服器30的編號),該區域內的伺服器30的數量為奇數,且此時資料中心300中的另一台伺服器30(Server 8)的溫度較低。因此,如圖5所示,所述虛擬機交換模組103則使用所述虛擬管理軟體將Server 2的虛擬機A和虛擬機B遷移至Server 8中,然後再將Server 8中的虛擬機C和D遷移至Server 2中,從而實現Server 2與Server 8之間的虛擬機交換。交換後的Server 2與Server 8中的虛擬機如圖6所示。
綜上所述,本發明符合發明專利要件,爰依法提出專利申請。惟,以上所述者僅爲本發明之較佳實施例,本發明之範圍並不以上述實施例爲限,舉凡熟悉本案技藝之人士援依本發明之精神所作之等效修飾或變化,皆應涵蓋於以下申請專利範圍內。
100...監控主機
10...散熱控制系統
101...溫度監控模組
102...區域確定模組
103...虛擬機交換模組
11...記憶體
12...處理器
200...網路
300...資料中心
30...伺服器
圖1係為本發明伺服器散熱控制系統較佳實施例的運行環境圖。
圖2係為圖1中監控主機較佳實施例的架構圖。
圖3係為本發明伺服器散熱控制方法較佳實施例的流程圖。
圖4係為本發明較佳實施例中資料中心所包含的伺服器的示意圖。
圖5和圖6係為較佳實施例中進行虛擬機交換的示意圖。
100...監控主機
10...散熱控制系統
101...溫度監控模組
102...區域確定模組
103...虛擬機交換模組
11...記憶體
12...處理器

Claims (10)

  1. 一種伺服器散熱控制方法,應用於監控主機中,該監控主機透過網路與一個資料中心的伺服器通訊連接,該方法包括:
    溫度監控步驟,即時監控資料中心中每台伺服器的溫度;
    區域確定步驟,根據每台伺服器的溫度確定資料中心中的熱量集中區域,並確定該熱量集中區域內的伺服器的數量;及
    虛擬機交換步驟,根據所述熱量集中區域內的伺服器的數量,將該區域內的一個或多個伺服器上安裝的虛擬機與資料中心中溫度較低的一個或多個伺服器上安裝的虛擬機進行位置交換,使得該資料中心中溫度較高的伺服器在物理位置上兩兩不相鄰。
  2. 如申請專利範圍第1項所述的伺服器散熱控制方法,所述溫度監控步驟包括:
    透過所述網路訪問每台伺服器的基板管理控制器,從該基板管理控制器中讀取每台伺服器的溫度參數,以對每台伺服器的溫度進行監控。
  3. 如申請專利範圍第1項所述的伺服器散熱控制方法,所述熱量集中區域是指所述資料中心中溫度高於一定閥值的相鄰兩台或兩台以上的伺服器所在的區域。
  4. 如申請專利範圍第1項所述的伺服器散熱控制方法,所述虛擬機交換步驟包括:
    將所述熱量集中區域內的伺服器按照物理擺放順序使用阿拉伯數字1、2、3…n依次進行編號;
    若所述熱量集中區域內的伺服器的數量為奇數,將編號為偶數的一個或多個伺服器的虛擬機與資料中心中溫度較低的一個或多個伺服器的虛擬機進行位置交換;或
    若所述熱量集中區域內的伺服器的數量為偶數,將編號為奇數的一個或多個伺服器的虛擬機與資料中心中溫度較低的一個或多個伺服器的虛擬機進行位置交換。
  5. 如申請專利範圍第4項所述的伺服器散熱控制方法,所述虛擬機交換步驟使用每台伺服器上安裝的虛擬機管理軟體實現虛擬機位置的交換。
  6. 一種伺服器散熱控制系統,應用於監控主機中,該監控主機透過網路與一個資料中心的伺服器通訊連接,該系統包括:
    溫度監控模組,用於即時監控資料中心中每台伺服器的溫度;
    區域確定模組,用於根據每台伺服器的溫度確定資料中心中的熱量集中區域,並確定該熱量集中區域內的伺服器的數量;及
    虛擬機交換模組,用於根據所述熱量集中區域內的伺服器的數量,將該區域內的一個或多個伺服器上安裝的虛擬機與資料中心中溫度較低的一個或多個伺服器上安裝的虛擬機進行位置交換,使得該資料中心中溫度較高的伺服器在物理位置上兩兩不相鄰。
  7. 如申請專利範圍第6項所述的伺服器散熱控制系統,所述溫度監控模組透過所述網路訪問每台伺服器的基板管理控制器,從該基板管理控制器中讀取每台伺服器的溫度參數,以對每台伺服器的溫度進行監控。
  8. 如申請專利範圍第6項所述的伺服器散熱控制系統,所述熱量集中區域是指所述資料中心中溫度高於一定閥值的相鄰兩台或兩台以上的伺服器所在的區域。
  9. 如申請專利範圍第6項所述的伺服器散熱控制系統,所述虛擬機交換模組透過以下步驟實現虛擬機位置的交換:
    將所述熱量集中區域內的伺服器按照物理擺放順序使用阿拉伯數字1、2、3…n依次進行編號;
    若所述熱量集中區域內的伺服器的數量為奇數,將編號為偶數的一個或多個伺服器的虛擬機與資料中心中溫度較低的一個或多個伺服器的虛擬機進行位置交換;或
    若所述熱量集中區域內的伺服器的數量為偶數,將編號為奇數的一個或多個伺服器的虛擬機與資料中心中溫度較低的一個或多個伺服器的虛擬機進行位置交換。
  10. 如申請專利範圍第9項所述的伺服器散熱控制系統,所述虛擬機交換模組使用每台伺服器上安裝的虛擬機管理軟體實現虛擬機位置的交換。
TW100123010A 2011-06-24 2011-06-30 伺服器散熱控制系統及方法 TWI492032B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101728313A CN102841579A (zh) 2011-06-24 2011-06-24 服务器散热控制系统及方法

Publications (2)

Publication Number Publication Date
TW201301008A TW201301008A (zh) 2013-01-01
TWI492032B true TWI492032B (zh) 2015-07-11

Family

ID=47369048

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100123010A TWI492032B (zh) 2011-06-24 2011-06-30 伺服器散熱控制系統及方法

Country Status (2)

Country Link
CN (1) CN102841579A (zh)
TW (1) TWI492032B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104253828A (zh) * 2013-06-25 2014-12-31 英业达科技有限公司 伺服器系统及监控方法
CN104470331B (zh) * 2014-12-01 2017-04-12 哈尔滨海能达科技有限公司 一种风扇散热控制方法及装置
CN105224756A (zh) * 2015-10-14 2016-01-06 浪潮电子信息产业股份有限公司 一种获取SmartRack整机柜风量的设计方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200817877A (en) * 2006-05-03 2008-04-16 Ibm Selection of processor cores for optimal thermal performance
TW200819960A (en) * 2006-06-21 2008-05-01 Ibm Support of deep power savings mode and partial good in a thermal management system
US20110107332A1 (en) * 2008-04-10 2011-05-05 Cullen Bash Virtual Machine Migration According To Environmental Data

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396635A (en) * 1990-06-01 1995-03-07 Vadem Corporation Power conservation apparatus having multiple power reduction levels dependent upon the activity of the computer system
US8156490B2 (en) * 2004-05-08 2012-04-10 International Business Machines Corporation Dynamic migration of virtual machine computer programs upon satisfaction of conditions
US20060112286A1 (en) * 2004-11-23 2006-05-25 Whalley Ian N Method for dynamically reprovisioning applications and other server resources in a computer center in response to power and heat dissipation requirements
CN101005747B (zh) * 2006-01-21 2010-05-26 富准精密工业(深圳)有限公司 液冷散热装置及用于该液冷散热装置的热交换器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200817877A (en) * 2006-05-03 2008-04-16 Ibm Selection of processor cores for optimal thermal performance
TW200819960A (en) * 2006-06-21 2008-05-01 Ibm Support of deep power savings mode and partial good in a thermal management system
US20110107332A1 (en) * 2008-04-10 2011-05-05 Cullen Bash Virtual Machine Migration According To Environmental Data

Also Published As

Publication number Publication date
TW201301008A (zh) 2013-01-01
CN102841579A (zh) 2012-12-26

Similar Documents

Publication Publication Date Title
Ilager et al. ETAS: Energy and thermal‐aware dynamic virtual machine consolidation in cloud data center with proactive hotspot mitigation
US11128555B2 (en) Methods and apparatus for SDI support for automatic and transparent migration
EP4002136A1 (en) Shared memory
US7953574B2 (en) Methods and apparatuses for heat management in information systems
US9606588B2 (en) Closed-loop cooling system for high-density clustered computer system
US8200995B2 (en) Information processing system and power-save control method for use in the system
TWI591485B (zh) 用於減少多節點機箱系統之管理埠之電腦可讀取儲存裝置、系統及方法
TW201336264A (zh) 自動擴充虛擬機的方法
US8457806B2 (en) Managing an infrastructure having a 3D package and cooling resource actuators
Cao et al. Cooling-aware job scheduling and node allocation for overprovisioned HPC systems
TWI492032B (zh) 伺服器散熱控制系統及方法
Mukherjee et al. A detailed study on data centre energy efficiency and efficient cooling techniques
US10405455B2 (en) Fan speed-adjustment policy for entire machine cabinet by placing fan table on node BMC
CN104503556A (zh) 基于风冷及液冷结合的冗余备份服务器散热体系
Kaplan et al. Optimizing communication and cooling costs in HPC data centers via intelligent job allocation
TW201324187A (zh) 虛擬機部署系統及方法
Hu et al. Power and environment aware control of Beowulf clusters
EP3295275A2 (en) Managing power in a high performance cpmputing system for resiliency and cooling
CN103375420A (zh) 机柜系统及其风扇控制系统及其控制方法
CN106762771B (zh) 风扇控制系统、散热系统以及风扇控制方法
TW201528001A (zh) 全系統易管理化
TW201339838A (zh) 虛擬機記憶體管理系統及方法
Kodama et al. High efficiency cloud data center management system using live migration
JP2010211259A (ja) 仮想マシンシステム、情報処理装置、リソース管理方法、プログラム及び記録媒体
CN102520770A (zh) 一种服务器系统