CN105868076A - 一种基于智能pdu的集群功耗控制的方法 - Google Patents

一种基于智能pdu的集群功耗控制的方法 Download PDF

Info

Publication number
CN105868076A
CN105868076A CN201610198151.1A CN201610198151A CN105868076A CN 105868076 A CN105868076 A CN 105868076A CN 201610198151 A CN201610198151 A CN 201610198151A CN 105868076 A CN105868076 A CN 105868076A
Authority
CN
China
Prior art keywords
power consumption
cluster
pdu
server end
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610198151.1A
Other languages
English (en)
Inventor
马四腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610198151.1A priority Critical patent/CN105868076A/zh
Publication of CN105868076A publication Critical patent/CN105868076A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明公开一种基于智能PDU的集群功耗控制的方法,属于计算机集群管理技术领域;本发明设置服务器端,对集群采集智能PDU的供电端口的功率数据,根据集群内设备的拓扑结构绘制功耗图,进行功耗展示;获取功耗数据,服务器端按照一定时间内集群消耗的功率数据进行分析,根据集群功耗分析结果,监督集群功耗状态是否正常,并针对功耗状态指令智能PDU对集群设备进行上电或下电;本发明通过采集智能PDU每个输出口的功耗信息来获取单台服务器、机柜及整体集群的功耗信息,并通过采集到的功耗信息来分析集群中各服务器的运行状态,进而实现对这些服务器进行功耗管理。

Description

一种基于智能PDU的集群功耗控制的方法
技术领域
本发明公开一种基于智能PDU的集群功耗控制的方法,属于计算机集群管理技术领域。
背景技术
当前,随着计算机技术的发展和越来越广泛的应用,越来越多的依赖于计算机技术的应用系统走进了我们的工作和生活。尽管计算机技术以日新月异的速度发展,单台计算机的性能和可靠性越来越好,但还是有很多现实的要求是单台计算机难以达到的。而需要计算机集群来实现,计算机集群简称集群是一种计算机系统, 它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,功耗要大很多,因此需要密切关注控制集群功耗。本发明提出了一种基于智能PDU的集群功耗控制方法,主要通过采集智能PDU每个输出口的功耗信息来获取单台服务器、机柜及整体集群的功耗信息,并通过采集到的功耗信息来分析集群中各服务器的运行状态,进而实现对这些服务器进行功耗管理。
远程电源管理器(Reachctrl Power)又叫智能PDU、IP电源、智能电源、机架式电源分配单元,同时兼具电源分配和管理功能。增加了传统PDU、PCU设备所不能提供的智能管理控制模块和控制芯片构成了可远程控制和计划管理的电源分配单元。具有远程控制、集中式管理、自动周期控制、安全性管理、可靠性管理及可扩展性等特点。
发明内容
本发明针对现有技术中的计算机集群进行功耗管理,提供一种基于智能PDU的集群功耗控制的方法,通过在高性能集群中部署智能DPU提供供电,采集智能PDU的每个端口数据,进而达到分析及控制功耗的目的,具有简单,有效,适用性广的特点。
本发明提出的具体方案是:
一种基于智能PDU的集群功耗控制的方法,设置服务器端,对集群采集智能PDU的供电端口的功率数据,根据集群内设备的拓扑结构绘制功耗图,进行功耗展示,
获取功耗数据,服务器端按照一定时间内集群消耗的功率数据进行分析,根据集群功耗分析结果,监督集群功耗状态是否正常,并针对功耗状态指令智能PDU对集群设备进行上电或下电。
服务器端通过SNMP采集智能PDU端口的集群设备功耗数据大小,判断集群设备是否处于开机空闲状态,进而通过远程访问的方式获取集群设备作业运行情况,获取功耗数据。
服务器端判断集群设备处于开机空闲状态,发送指令使集群设备关机,再发送指令使相应PDU接口停止供电。
服务器端得知当前资源不满足计算所需资源,发送指令给相应关机的PDU接口上电,再发送指令使集群设备开机,以保障计算所需资源。
根据集群内设备的拓扑结构,在服务器端以时间为横轴,功耗为纵轴绘制集群内设备的功耗图,进行功耗展示。
本发明的有益之处是:
本发明利用设置服务器端,对集群采集智能PDU的供电端口的功率数据,根据集群内设备的拓扑结构绘制功耗图,进行功耗展示;获取功耗数据,服务器端按照一定时间内集群消耗的功率数据进行分析,根据集群功耗分析结果,监督集群功耗状态是否正常,并针对功耗状态指令智能PDU对集群设备进行上电或下电;
本发明主要通过采集智能PDU每个输出口的功耗信息来获取单台服务器、机柜及整体集群的功耗信息,并通过采集到的功耗信息来分析集群中各服务器的运行状态,进而实现对这些服务器进行功耗管理。
附图说明
图1本发明方法架构示意图。
具体实施方式
一种基于智能PDU的集群功耗控制的方法,设置服务器端,对集群采集智能PDU的供电端口的功率数据,根据集群内设备的拓扑结构绘制功耗图,进行功耗展示,
获取功耗数据,服务器端按照一定时间内集群消耗的功率数据进行分析,根据集群功耗分析结果,监督集群功耗状态是否正常,并针对功耗状态指令智能PDU对集群设备进行上电或下电。
根据上述方法及发明内容,结合附图对本发明做进一步说明。
一种基于智能PDU的集群功耗控制的方法,设置服务器端,对集群采集智能PDU的供电端口的功率数据,根据集群内设备的拓扑结构绘制功耗图,进行功耗展示,
上述信息采集可以通过SNMP采集智能PDU端口的集群设备功耗数据大小,并可以判断集群设备是否处于开机空闲状态,进而通过远程访问的方式获取集群设备作业运行情况,比如通过查看CPU的负载率来判断是否有作业运行,如负载率为0,则表示没有;
其中根据集群内设备的拓扑结构绘制功耗图,进行功耗展示,本发明方法中根据集群内设备的拓扑结构,在服务器端以时间为横轴,功耗为纵轴绘制集群内设备的功耗图,进行功耗展示;当然集群内设备主要指各服务器,各独立机柜等相关设备;
下一步获取功耗数据同时,服务器端将按照一定时间内集群消耗的功率数据进行分析,根据集群功耗分析结果,监督集群功耗状态是否正常,并针对功耗状态指令智能PDU对集群设备进行上电或下电;服务器端对集群功耗的分析,可借助现有分析工具或自主开发的工具进行分析,以便平衡和控制功耗;
其中服务器端会判断集群内设备处于开机空闲状态,发送指令使集群设备关机,再发送指令使相应PDU接口停止供电;
而当服务器端得知当前资源不满足计算所需资源,服务器端会发送指令给相应关机的PDU接口上电,再发送指令使集群设备开机,以保障计算所需资源。

Claims (5)

1.一种基于智能PDU的集群功耗控制的方法,其特征是设置服务器端,对集群采集智能PDU的供电端口的功率数据,根据集群内设备的拓扑结构绘制功耗图,进行功耗展示,
获取功耗数据,服务器端按照一定时间内集群消耗的功率数据进行分析,根据集群功耗分析结果,监督集群功耗状态是否正常,并针对功耗状态指令智能PDU对集群设备进行上电或下电。
2.根据权利要求1所述的方法,其特征是服务器端通过SNMP采集智能PDU端口的集群设备功耗数据大小,判断集群设备是否处于开机空闲状态,进而通过远程访问的方式获取集群设备作业运行情况,获取功耗数据。
3.根据权利要求2所述的方法,其特征是服务器端判断集群设备处于开机空闲状态,发送指令使集群设备关机,再发送指令使相应PDU接口停止供电。
4.根据权利要求3所述的方法,其特征是服务器端得知当前资源不满足计算所需资源,发送指令给相应关机的PDU接口上电,再发送指令使集群设备开机,以保障计算所需资源。
5.根据权利要求1-4任一项所述的方法,其特征是根据集群内设备的拓扑结构,在服务器端以时间为横轴,功耗为纵轴绘制集群内设备的功耗图,进行功耗展示。
CN201610198151.1A 2016-04-01 2016-04-01 一种基于智能pdu的集群功耗控制的方法 Pending CN105868076A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610198151.1A CN105868076A (zh) 2016-04-01 2016-04-01 一种基于智能pdu的集群功耗控制的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610198151.1A CN105868076A (zh) 2016-04-01 2016-04-01 一种基于智能pdu的集群功耗控制的方法

Publications (1)

Publication Number Publication Date
CN105868076A true CN105868076A (zh) 2016-08-17

Family

ID=56626922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610198151.1A Pending CN105868076A (zh) 2016-04-01 2016-04-01 一种基于智能pdu的集群功耗控制的方法

Country Status (1)

Country Link
CN (1) CN105868076A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106685753A (zh) * 2016-12-02 2017-05-17 曙光信息产业(北京)有限公司 一种模拟服务器集群启动的自动化测试方法及装置
CN116820897A (zh) * 2023-08-31 2023-09-29 山东省地质测绘院 一种集群计算机运行调度控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202998169U (zh) * 2011-11-11 2013-06-12 陈树湛 一种智能电源监控装置
CN103293424A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种数据中心能源使用效率pue的测定方法
CN104364992A (zh) * 2012-03-12 2015-02-18 诺曼·R·伯恩 电能管理和监视系统及方法
CN105229561A (zh) * 2013-03-15 2016-01-06 服务器技术股份有限公司 具有无线通信能力的电源分配单元以及用于与其通信的技术

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202998169U (zh) * 2011-11-11 2013-06-12 陈树湛 一种智能电源监控装置
CN104364992A (zh) * 2012-03-12 2015-02-18 诺曼·R·伯恩 电能管理和监视系统及方法
CN105229561A (zh) * 2013-03-15 2016-01-06 服务器技术股份有限公司 具有无线通信能力的电源分配单元以及用于与其通信的技术
CN103293424A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种数据中心能源使用效率pue的测定方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106685753A (zh) * 2016-12-02 2017-05-17 曙光信息产业(北京)有限公司 一种模拟服务器集群启动的自动化测试方法及装置
CN116820897A (zh) * 2023-08-31 2023-09-29 山东省地质测绘院 一种集群计算机运行调度控制方法
CN116820897B (zh) * 2023-08-31 2023-11-21 山东省地质测绘院 一种集群计算机运行调度控制方法

Similar Documents

Publication Publication Date Title
CN109388530B (zh) 一种面向刀片式服务器的自动化测试平台以及测试方法
US9762471B2 (en) Methods and systems for estimating and analyzing flow activity and path performance data in cloud or distributed systems
JP5284469B2 (ja) パワー・アウトレットとit装置との間の物理的接続性の自動発見
TWI433420B (zh) 主動式電源管理架構及其管理方法
CN105426286B (zh) 一种对整机柜服务器进行监控的系统
Menghua et al. A real-time android-based monitoring system for the power Lithium-Ion battery used on EVs
CN103326902A (zh) 可配置的分布式主机性能测试数据监控系统及监控方法
CN103281208B (zh) 一种数据灾备服务及综合监控系统
US20130197895A1 (en) Real-time server management
CN106100939A (zh) 网络设备启动时间测试方法及测试控制台
CN206647250U (zh) 一种基于gprs的空压机远程数据采集及监控系统
CN105868076A (zh) 一种基于智能pdu的集群功耗控制的方法
CN105677534B (zh) 一种基于服务总线的变电站站控层设备状态评估方法
CN117176802B (zh) 一种业务请求的全链路监控方法、装置、电子设备及介质
Ali et al. Redfish-Nagios: A Scalable Out-of-Band Data Center Monitoring Framework Based on Redfish Telemetry Model
CN106209444A (zh) 一种基于统一视图的it资产协同监测系统
CN109474479A (zh) 一种网络设备监控方法及系统
CN103648116B (zh) 基于程序分析的低功耗无线传感器网络优化方法
US20160246270A1 (en) Method of controlling a data center architecture equipment
CN117370053A (zh) 一种面向信息系统业务运行全景监测方法及系统
CN201774541U (zh) 一种便携式网络故障诊断装置
CN110995486B (zh) 一种基于物联网的智能硬件设备监控系统
Savu et al. Efficient network monitoring for large data acquisition systems
CN115129541B (zh) 一种基于飞腾平台的高性能计算资源监控实现方法
CN105676909A (zh) 智能设备远程状态自动报告方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160817

RJ01 Rejection of invention patent application after publication