CN110781125A - 整机柜超融合服务器的管理方法及系统 - Google Patents
整机柜超融合服务器的管理方法及系统 Download PDFInfo
- Publication number
- CN110781125A CN110781125A CN201910862206.8A CN201910862206A CN110781125A CN 110781125 A CN110781125 A CN 110781125A CN 201910862206 A CN201910862206 A CN 201910862206A CN 110781125 A CN110781125 A CN 110781125A
- Authority
- CN
- China
- Prior art keywords
- parameters
- node
- information
- super
- power supply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 58
- 238000001816 cooling Methods 0.000 claims abstract description 45
- 238000004891 communication Methods 0.000 claims abstract description 41
- 238000005265 energy consumption Methods 0.000 claims abstract description 15
- 230000004927 fusion Effects 0.000 claims abstract description 7
- 230000007613 environmental effect Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims 1
- 206010063385 Intellectualisation Diseases 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 12
- 238000012544 monitoring process Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004880 explosion Methods 0.000 description 2
- 230000017525 heat dissipation Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/161—Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/20—Cooling means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/328—Computer systems status display
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明提供了一种整机柜超融合服务器的管理方法及系统,包括:通信控制模块实时获取整机柜超融合服务器BMC和BIOS固件、网络设备NMS中各节点设备的资源、性能指标参数以及运行环境参数;开机时一次性获取和存储参数获取步骤得到的各节点设备的资源、性能指标参数以及运行环境参数;综合各节点设备性能指标参数以及运行环境参数,预测整体的能耗及温度变化趋势,并将预测结果返回给通信控制模块;实时显示参数,并获取手工输入的控制供电系统和冷却系统的目标运行参数。实现了整机柜超融合服务器的供电和冷却系统智能化,有效提高整机柜的供电和冷却系统的效率,在供电和环境温度方面保证各节点的正常运行。
Description
技术领域
本发明涉及数据处理技术领域,具体地,涉及整机柜超融合服务器的管理方法及系统。
背景技术
随着科学技术的进步,人类社会正在进入一个数字信息爆炸的时代。大数据、互联网的普及为传统行业的发展带来了新的增长点,各行各业纷纷开始向信息化转型,数据的总量正在几何级数增长。面对数据的大爆炸而引发的数据中心规模成倍增长,数据中心空间及资源耗费量逐步成为影响到互联网基础设施、大数据处理能力的技术瓶颈。具备低耗能高PUE、省空间高密度等特征的计算存储基础成为现代信息技术的必然要求。
传统的通用服务器规模化应用带来密度低、能耗高、安装和维护工作量大等问题,而且随着互联网和大数据技术的迅猛发展,服务器的规模也越来越大,上述问题愈发突出。为此,各大IT厂商开发出了一系列更高密度的产品(如2in1、3in1、4in1等多节点服务器),但是仍然不能满足实际应用需求。另一方面,从IT建设的趋势来说,融合架构无疑是服务器未来发展的方向之一,它使得设备购买、安装、使用、维护都变得更加简单。与此同时,大型数据中心更需要向云化、分布化和资源聚合化方向发展。因此,一种面向大型数据中心计算、采用开放式硬件设计的整机柜超融合服务器应运而生。整机柜超融合服务器将原有机架+机器分离的架构进行融合,打包成为一个独立的产品,以一个整机柜为最小颗粒度进行交付的服务器。它们主张更为彻底的重构硬件,将原本放在标准化机箱里的元件全拿出来,再在更大尺寸的物理框架进行重新整合,而这个新的物理框架就是原来的机柜——原本用来装载标准化机箱的大型“机箱”,这样设备也将以机柜为单位进行横向扩展(Scale-Out)。
整机柜超融合服务器主要由机柜子系统、网络子系统、供电子系统、服务器节点子系统、集中散热子系统、集中管理子系统等部分组成。服务器内部所有节点之间以万兆以太网相连,以保证并行计算和存储节点之间高速通信的要求,同时采用IIC网络作为管理网络。整机柜超融合服务器除了具备高密度高效能的优势以外,软硬件集中管理是超融合服务器的另外一个重要特征。整机柜超融合服务器可以作为一个独立运行的计算存储整体为上层应用提供计算、存储、网络能力,也可以作为一个更大系统的子系统与其他基础设施共同完成对大系统的基础设施的支撑。上述两个应用场景都对整机柜超融合服务器自身资源占用和动态适配与扩展、系统硬件、软件运行监视等任务的集中统一管理提出了需求。通过统一集中的超融合服务器管理软件,能够配置、监控整机柜超融合服务器中各计算、存储、网络硬件节点以及机柜提供的电源、冷却系统,并通过超融合服务器的各物理节点的操作系统以及云平台等系统软件,对系统平台级别的软硬件资源进行动态扩展、部署和监控管理,已成为整机柜超融合服务器领域亟待解决的问题。
传统的系统运维管理软件主要有两种类型,一是以计算、存储、网络设备单机的所有资源为管理对象的,管理对象要素包括CPU使用率、内存空间、硬盘读取等,更全面的管理软件还包括CPU温度、主板负载以及一些外部设备的性能参数。例如公开号为CN108400886A的专利公开的一种机房范围的机柜及内部服务器的运行状态监控方法,适用于机房多机柜的服务器的运行信息进行集中监控。可监控的运行信息包括:机柜内的温度、湿度、每个服务器的供电信息以及每个服务器的运行状态信息。此专利无法管理监控机柜内网络设备的运行状态;无法形成机柜供电、温度的整体状态信息;缺乏对整机柜单位的供电和冷却系统提供相应的供电及冷却目标参数的能力。此专利缺乏对机柜内部的计算、存储、网络整体的资源管理和监控能力,不适应整机柜超融合服务器的系统管理和监控。
还有一种是整个数据中心的所有硬件基础设施为对象,后者还可以兼顾数据中心机房设施的管理和运行维护。正对整机柜超融合服务器,上述两类管理软件都存在技术上的问题,无法全面管理超融合服务器的各项功能要素,无法最大限度发挥整机柜超融合服务器的高性能、高密度的优势和开发、可扩展的特性。比如,目前所有的系统管理软件无法统筹管理整机柜超融合服务器上所有设备的单位空间的热量排放率,进而无法给出整机柜服务器散热系统正确的输入来调节散热系统的冷却功效。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种整机柜超融合服务器的管理方法及系统。
根据本发明提供的一种整机柜超融合服务器的管理方法,包括:
通信控制步骤:通信控制模块实时获取整机柜超融合服务器BMC和BIOS固件、网络设备NMS中各节点设备的资源、性能指标参数以及运行环境参数;
参数存储步骤:开机时一次性获取和存储参数获取步骤得到的各节点设备的资源、性能指标参数以及运行环境参数;
计算评估步骤:综合各节点设备性能指标参数以及运行环境参数,预测整体的能耗及温度变化趋势,并将预测结果返回给通信控制模块;
管理显示步骤:实时显示整机柜超融合服务器节点及网络构成、各节点设备功能和性能参数及操作系统配置信息、各节点设备实时运行性能参数和功耗及温度信息以及供电冷却系统运行功能参数,获取手工输入的控制供电系统和冷却系统的目标运行参数。
优选地,所述通信控制步骤包括:
通信确立子步骤:确认各节点设备及供电、冷却系统工作状态,并建立通信联系;
配置信息获取子步骤:确认整机柜超融合服务器硬件构成,读取各个节点电设备的BIOS固件、BMC、网络设备NMS、操作系统的配置信息,读取供电系统、冷却系统的配置信息;
运行信息获取子步骤:按预设时间间隔定期读取节点设备构成树中各元素的运行信息和环境温度信息;
指令发送子步骤:向供电系统、冷却系统发送目标运行参数。
优选地,所述参数存储步骤包括:
节点配置信息存储子步骤:将时钟信息、节点设备构成树,各节点设备配置信息存入数据库,并建立相应的索引目录;
实时信息存储子步骤:存储各节点设备的运行参数和环境温度信息,并以时钟数据和节点ID为索引键。
优选地,所述计算评估步骤包括:
计算子步骤:读取节点设备运行和环境温度历史数据,采用趋势移动平均法分别计算运行参数和CPU环境温度变化曲线,获得能耗和CPU环境变化目标预测值,并输出给通信控制模块。
优选地,所述管理显示步骤包括:
实时信息显示子步骤:以节点设备构成为主线,多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
历史信息显示子步骤:以节点设备构成为主线,按时间轴多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
软件配置管理子步骤:提供设置画面,供电、冷却系统手工控制画面。
根据本发明提供的一种整机柜超融合服务器的管理系统,包括:
通信控制模块:通信控制模块实时获取整机柜超融合服务器BMC和BIOS固件、网络设备NMS中各节点设备的资源、性能指标参数以及运行环境参数;
参数存储模块:开机时一次性获取和存储参数获取模块得到的各节点设备的资源、性能指标参数以及运行环境参数;
计算评估模块:综合各节点设备性能指标参数以及运行环境参数,预测整体的能耗及温度变化趋势,并将预测结果返回给通信控制模块;
管理显示模块:实时显示整机柜超融合服务器节点及网络构成、各节点设备功能和性能参数及操作系统配置信息、各节点设备实时运行性能参数和功耗及温度信息以及供电冷却系统运行功能参数,获取手工输入的控制供电系统和冷却系统的目标运行参数。
优选地,所述通信控制模块包括:
通信确立子模块:确认各节点设备及供电、冷却系统工作状态,并建立通信联系;
配置信息获取子模块:确认整机柜超融合服务器硬件构成,读取各个节点电设备的BIOS固件、BMC、网络设备NMS、操作系统的配置信息,读取供电系统、冷却系统的配置信息;
运行信息获取子模块:按预设时间间隔定期读取节点设备构成树中各元素的运行信息和环境温度信息;
指令发送子模块:向供电系统、冷却系统发送目标运行参数。
优选地,所述参数存储模块包括:
节点配置信息存储子模块:将时钟信息、节点设备构成树,各节点设备配置信息存入数据库,并建立相应的索引目录;
实时信息存储子模块:存储各节点设备的运行参数和环境温度信息,并以时钟数据和节点ID为索引键。
优选地,所述计算评估模块包括:
计算子模块:读取节点设备运行和环境温度历史数据,采用趋势移动平均法分别计算运行参数和CPU环境温度变化曲线,获得能耗和CPU环境变化目标预测值,并输出给通信控制模块。
优选地,所述管理显示模块包括:
实时信息显示子模块:以节点设备构成为主线,多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
历史信息显示子模块:以节点设备构成为主线,按时间轴多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
软件配置管理子模块:提供设置画面,供电、冷却系统手工控制画面。
与现有技术相比,本发明具有如下的有益效果:
1)实现了整机柜超融合服务器的供电和冷却系统智能化,有效提高整机柜的供电和冷却系统的效率,在供电和环境温度方面保证各节点的正常运行。
2)实现了各节点的计算、存储、网络功能性能的统一管理和可视化。
3)通过以上两点提高了整机柜超融合服务器的整体功能性能的透明性和运行环境的适应性,进而提高了整机柜超融合服务器的运行可靠性和独立性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的系统构成图;
图2为本发明的工作流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
针对整机柜超融合服务器对系统管理软件的需求和当前系统管理软件存在的问题,本申请提出了利用实时收集节点BIOS固件和BMC固件以及网络设备NMS的节点运行状态等信息的方式来获取整机柜各节点状态,汇总计算并通过整机柜机架RMC单元来控制调节电源和散热系统。
申请人发现,通过整合整机柜超融合服务器各计算、存储、网络节点的硬件运行指标参数,并根据服务器运行环境参数,可计算出机柜冷却系统和供电系统的最佳工作参数,达到降低整体能耗的作用。同时,通过汇总各节点的计算、存储、网络能力,能够更好地实现超融合服务器的整体资源管理和监控。
如图1和图2所示,根据本发明提供的一种整机柜超融合服务器的管理方法,包括:
通信控制步骤:通信控制模块实时获取整机柜超融合服务器BMC和BIOS固件、网络设备NMS中各节点设备的资源、性能指标参数以及运行环境参数;
参数存储步骤:开机时一次性获取和存储参数获取步骤得到的各节点设备的资源、性能指标参数以及运行环境参数;
计算评估步骤:综合各节点设备性能指标参数以及运行环境参数,预测整体的能耗及温度变化趋势,并将预测结果返回给通信控制模块;
管理显示步骤:实时显示整机柜超融合服务器节点及网络构成、各节点设备功能和性能参数及操作系统配置信息、各节点设备实时运行性能参数和功耗及温度信息以及供电冷却系统运行功能参数,获取手工输入的控制供电系统和冷却系统的目标运行参数。
通信控制步骤包括:
通信确立子步骤:确认各节点设备及供电、冷却系统工作状态,并建立通信联系;
配置信息获取子步骤:确认整机柜超融合服务器硬件构成,读取各个节点电设备的BIOS固件、BMC、网络设备NMS、操作系统的配置信息,读取供电系统、冷却系统的配置信息;
运行信息获取子步骤:按预设时间间隔定期读取节点设备构成树中各元素的运行信息和环境温度信息;
指令发送子步骤:向供电系统、冷却系统发送目标运行参数。
参数存储步骤包括:
节点配置信息存储子步骤:将时钟信息、节点设备构成树,各节点设备配置信息存入数据库,并建立相应的索引目录;
实时信息存储子步骤:存储各节点设备的运行参数和环境温度信息,并以时钟数据和节点ID为索引键。
计算评估步骤包括:
计算子步骤:读取节点设备运行和环境温度历史数据,采用趋势移动平均法分别计算运行参数和CPU环境温度变化曲线,获得能耗和CPU环境变化目标预测值,并输出给通信控制模块。
管理显示步骤包括:
实时信息显示子步骤:以节点设备构成为主线,多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
历史信息显示子步骤:以节点设备构成为主线,按时间轴多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
软件配置管理子步骤:提供设置画面,供电、冷却系统手工控制画面。
在上述一种整机柜超融合服务器的管理方法的基础上,还提供一种整机柜超融合服务器的管理系统,包括:
通信控制模块:通信控制模块实时获取整机柜超融合服务器BMC和BIOS固件、网络设备NMS中各节点设备的资源、性能指标参数以及运行环境参数;
参数存储模块:开机时一次性获取和存储参数获取模块得到的各节点设备的资源、性能指标参数以及运行环境参数;
计算评估模块:综合各节点设备性能指标参数以及运行环境参数,预测整体的能耗及温度变化趋势,并将预测结果返回给通信控制模块;
管理显示模块:实时显示整机柜超融合服务器节点及网络构成、各节点设备功能和性能参数及操作系统配置信息、各节点设备实时运行性能参数和功耗及温度信息以及供电冷却系统运行功能参数,获取手工输入的控制供电系统和冷却系统的目标运行参数。
实施例1:基于若干台计算、存储节点和一个网络交换机构成的整机柜超融合服务器中整体部署云计算平台时,可以通过系统管理软件获取超融和服务器整体的硬件资源的功能性能参数和使用状态,结合云平台的虚拟资源管理功能,能够高效合理快速地部署云平台,并方便云计算平台的扩展及资源调配,提高整体的资源利用率和运行可靠性。
实施例2:整机柜超融合服务器在应用于非数据中心(比如野外应急移动机房)环境下时,通过系统管理软件可以依据现场运行环境,智能调节机柜的冷却系统的工作状态,为超融合服务器提供安全可靠的运行温度环境,保证服务器的正常运行。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种整机柜超融合服务器的管理方法,其特征在于,包括:
通信控制步骤:通信控制模块实时获取整机柜超融合服务器BMC和BIOS固件、网络设备NMS中各节点设备的资源、性能指标参数以及运行环境参数;
参数存储步骤:开机时一次性获取和存储参数获取步骤得到的各节点设备的资源、性能指标参数以及运行环境参数;
计算评估步骤:综合各节点设备性能指标参数以及运行环境参数,预测整体的能耗及温度变化趋势,并将预测结果返回给通信控制模块;
管理显示步骤:实时显示整机柜超融合服务器节点及网络构成、各节点设备功能和性能参数及操作系统配置信息、各节点设备实时运行性能参数和功耗及温度信息以及供电冷却系统运行功能参数,获取手工输入的控制供电系统和冷却系统的目标运行参数。
2.根据权利要求1所述的整机柜超融合服务器的管理方法,其特征在于,所述通信控制步骤包括:
通信确立子步骤:确认各节点设备及供电、冷却系统工作状态,并建立通信联系;
配置信息获取子步骤:确认整机柜超融合服务器硬件构成,读取各个节点电设备的BIOS固件、BMC、网络设备NMS、操作系统的配置信息,读取供电系统、冷却系统的配置信息;
运行信息获取子步骤:按预设时间间隔定期读取节点设备构成树中各元素的运行信息和环境温度信息;
指令发送子步骤:向供电系统、冷却系统发送目标运行参数。
3.根据权利要求1所述的整机柜超融合服务器的管理方法,其特征在于,所述参数存储步骤包括:
节点配置信息存储子步骤:将时钟信息、节点设备构成树,各节点设备配置信息存入数据库,并建立相应的索引目录;
实时信息存储子步骤:存储各节点设备的运行参数和环境温度信息,并以时钟数据和节点ID为索引键。
4.根据权利要求1所述的整机柜超融合服务器的管理方法,其特征在于,所述计算评估步骤包括:
计算子步骤:读取节点设备运行和环境温度历史数据,采用趋势移动平均法分别计算运行参数和CPU环境温度变化曲线,获得能耗和CPU环境变化目标预测值,并输出给通信控制模块。
5.根据权利要求1所述的整机柜超融合服务器的管理方法,其特征在于,所述管理显示步骤包括:
实时信息显示子步骤:以节点设备构成为主线,多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
历史信息显示子步骤:以节点设备构成为主线,按时间轴多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
软件配置管理子步骤:提供设置画面,供电、冷却系统手工控制画面。
6.一种整机柜超融合服务器的管理系统,其特征在于,包括:
通信控制模块:通信控制模块实时获取整机柜超融合服务器BMC和BIOS固件、网络设备NMS中各节点设备的资源、性能指标参数以及运行环境参数;
参数存储模块:开机时一次性获取和存储参数获取模块得到的各节点设备的资源、性能指标参数以及运行环境参数;
计算评估模块:综合各节点设备性能指标参数以及运行环境参数,预测整体的能耗及温度变化趋势,并将预测结果返回给通信控制模块;
管理显示模块:实时显示整机柜超融合服务器节点及网络构成、各节点设备功能和性能参数及操作系统配置信息、各节点设备实时运行性能参数和功耗及温度信息以及供电冷却系统运行功能参数,获取手工输入的控制供电系统和冷却系统的目标运行参数。
7.根据权利要求6所述的整机柜超融合服务器的管理系统,其特征在于,所述通信控制模块包括:
通信确立子模块:确认各节点设备及供电、冷却系统工作状态,并建立通信联系;
配置信息获取子模块:确认整机柜超融合服务器硬件构成,读取各个节点电设备的BIOS固件、BMC、网络设备NMS、操作系统的配置信息,读取供电系统、冷却系统的配置信息;
运行信息获取子模块:按预设时间间隔定期读取节点设备构成树中各元素的运行信息和环境温度信息;
指令发送子模块:向供电系统、冷却系统发送目标运行参数。
8.根据权利要求6所述的整机柜超融合服务器的管理系统,其特征在于,所述参数存储模块包括:
节点配置信息存储子模块:将时钟信息、节点设备构成树,各节点设备配置信息存入数据库,并建立相应的索引目录;
实时信息存储子模块:存储各节点设备的运行参数和环境温度信息,并以时钟数据和节点ID为索引键。
9.根据权利要求6所述的整机柜超融合服务器的管理系统,其特征在于,所述计算评估模块包括:
计算子模块:读取节点设备运行和环境温度历史数据,采用趋势移动平均法分别计算运行参数和CPU环境温度变化曲线,获得能耗和CPU环境变化目标预测值,并输出给通信控制模块。
10.根据权利要求6所述的整机柜超融合服务器的管理系统,其特征在于,所述管理显示模块包括:
实时信息显示子模块:以节点设备构成为主线,多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
历史信息显示子模块:以节点设备构成为主线,按时间轴多层次实时显示各节点设备配置参数、运行和环境信息以及资源管理信息;
软件配置管理子模块:提供设置画面,供电、冷却系统手工控制画面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910862206.8A CN110781125A (zh) | 2019-09-12 | 2019-09-12 | 整机柜超融合服务器的管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910862206.8A CN110781125A (zh) | 2019-09-12 | 2019-09-12 | 整机柜超融合服务器的管理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110781125A true CN110781125A (zh) | 2020-02-11 |
Family
ID=69383456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910862206.8A Pending CN110781125A (zh) | 2019-09-12 | 2019-09-12 | 整机柜超融合服务器的管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110781125A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117240806A (zh) * | 2023-11-16 | 2023-12-15 | 北京邮电大学 | 一种超融合架构下网络资源分配及调度方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250291A (zh) * | 2016-08-04 | 2016-12-21 | 浪潮(北京)电子信息产业有限公司 | 一种整机柜服务器的管理装置及整机柜服务器 |
CN107302465A (zh) * | 2017-08-18 | 2017-10-27 | 郑州云海信息技术有限公司 | 一种PCIe Switch服务器整机管理方法 |
CN107817890A (zh) * | 2017-10-31 | 2018-03-20 | 郑州云海信息技术有限公司 | 一种基于bp算法的高密度机柜负载联动能效管理设计方法 |
CN109800066A (zh) * | 2018-12-13 | 2019-05-24 | 中国科学院信息工程研究所 | 一种数据中心节能调度方法及系统 |
CN110224879A (zh) * | 2019-07-12 | 2019-09-10 | 苏州浪潮智能科技有限公司 | 一种整机柜服务器及其节点配置方法、装置和cmc |
-
2019
- 2019-09-12 CN CN201910862206.8A patent/CN110781125A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250291A (zh) * | 2016-08-04 | 2016-12-21 | 浪潮(北京)电子信息产业有限公司 | 一种整机柜服务器的管理装置及整机柜服务器 |
CN107302465A (zh) * | 2017-08-18 | 2017-10-27 | 郑州云海信息技术有限公司 | 一种PCIe Switch服务器整机管理方法 |
CN107817890A (zh) * | 2017-10-31 | 2018-03-20 | 郑州云海信息技术有限公司 | 一种基于bp算法的高密度机柜负载联动能效管理设计方法 |
CN109800066A (zh) * | 2018-12-13 | 2019-05-24 | 中国科学院信息工程研究所 | 一种数据中心节能调度方法及系统 |
CN110224879A (zh) * | 2019-07-12 | 2019-09-10 | 苏州浪潮智能科技有限公司 | 一种整机柜服务器及其节点配置方法、装置和cmc |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117240806A (zh) * | 2023-11-16 | 2023-12-15 | 北京邮电大学 | 一种超融合架构下网络资源分配及调度方法 |
CN117240806B (zh) * | 2023-11-16 | 2024-02-06 | 北京邮电大学 | 一种超融合架构下网络资源分配及调度方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Barroso et al. | The datacenter as a computer: An introduction to the design of warehouse-scale machines | |
US11126242B2 (en) | Time varying power management within datacenters | |
Wu et al. | Dynamo: Facebook's data center-wide power management system | |
AU2010276368B2 (en) | Techniques for power analysis | |
CN107302465B (zh) | 一种PCIe Switch服务器整机管理方法 | |
US9715222B2 (en) | Infrastructure control fabric system and method | |
EP2625614B1 (en) | System and method for monitoring and managing data center resources in real time incorporating manageability subsystem | |
US10061371B2 (en) | System and method for monitoring and managing data center resources in real time incorporating manageability subsystem | |
US7979729B2 (en) | Method for equalizing performance of computing components | |
US8918656B2 (en) | Power supply engagement and method therefor | |
US8107458B1 (en) | Power-based networking path allocation | |
US10324430B2 (en) | Infrastructure control fabric system and method | |
JP6263995B2 (ja) | 情報処理システム、管理装置、情報処理システムの制御方法及び管理装置の制御プログラム | |
CN104834584A (zh) | 一种监测主机硬件负载的方法和系统 | |
CN110781125A (zh) | 整机柜超融合服务器的管理方法及系统 | |
Melo et al. | Models for hyper-converged cloud computing infrastructures planning | |
CN105471986B (zh) | 一种数据中心建设规模评估方法及装置 | |
WO2019213466A1 (en) | Time varying power management within datacenters | |
CN109491867A (zh) | 一种通讯自动恢复方法和装置 | |
US10216606B1 (en) | Data center management systems and methods for compute density efficiency measurements | |
CN113170592B (zh) | 基于监测/控制机制的热控制优化 | |
CN102970183A (zh) | 一种云监控系统及其数据回流方法 | |
US10599204B1 (en) | Performance efficiency monitoring system | |
EP3610337A1 (en) | Infrastructure control fabric system and method | |
CN113342463B (zh) | 计算机程序模块的容量调整方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200211 |