CN108390765B - 一种数据中心整机柜服务器的温度定位方法与装置 - Google Patents

一种数据中心整机柜服务器的温度定位方法与装置 Download PDF

Info

Publication number
CN108390765B
CN108390765B CN201710063768.7A CN201710063768A CN108390765B CN 108390765 B CN108390765 B CN 108390765B CN 201710063768 A CN201710063768 A CN 201710063768A CN 108390765 B CN108390765 B CN 108390765B
Authority
CN
China
Prior art keywords
server
temperature value
position information
topological graph
server node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710063768.7A
Other languages
English (en)
Other versions
CN108390765A (zh
Inventor
马建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201710063768.7A priority Critical patent/CN108390765B/zh
Publication of CN108390765A publication Critical patent/CN108390765A/zh
Application granted granted Critical
Publication of CN108390765B publication Critical patent/CN108390765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers

Abstract

本发明实施例提供了一种数据中心整机柜服务器的温度定位方法和装置,所述方法包括:整机柜服务器上架完毕后,记录所述整机柜服务器中服务器节点的位置信息;读取并解析数据中心整机柜服务器中服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。

Description

一种数据中心整机柜服务器的温度定位方法与装置
技术领域
本发明涉及大数据技术领域,尤其涉及一种数据中心整机柜服务器的温度定位方法与装置。
背景技术
云计算数据中心运营过程中,IT设备能耗与制冷能耗占据数据中心总能耗的90%以上。因此,既要保证IT设备运行环境正常稳定、又要兼顾整体拥有成本(TCO),这使得绿色数据中心、TCO的优化成为当前数据中心领域共同关注和研究的热点。
当前数据中心末端IT设备送风制冷过程存在的主要问题是:制冷不足导致局部热点、过量制冷导致成本增高。数据中心环境监控也存在成本与效率的矛盾:如果部署充足的传感器设备,则能获取更多的监控数据,提升优化效率,但是也面临成本增加的压力,增加安装、设计、维护的复杂度;如果部署的传感器或监控不足,则在数据中心结构优化、提升运行效率、故障定位上又存在无分析数据的局面。
针对上述问题,目前提出了一些解决方案,例如:
(1)在数据中心机房或者机架列安装温度、湿度等传感器,通过无线或有线的方式集中管理。根据已放置的传感器位置设定数据中心空间模型,将监控数据标定到空间模型,以热力图或其他方式显示监控信息。但是,该方案需要设置额外的传感器设备,监控的密度存在不足,而且增加或减少传感器设备需重新更新数据中心空间模型,操作复杂。
(2)通过监控整机柜服务器传感器的数据,与已标定的服务器位置信息匹配,融合成具有位置信息的数据。但是,该种方案仅说明要标定机柜位置,并未给出明确的标定方法;而且,最终得到的数据缺乏直观对比性,不便于维护。
发明内容
有鉴于此,本发明实施例期望提供一种数据中心整机柜服务器的温度定位方法与装置,可直观呈现整机柜服务器的温度分布,不需额外传感器设备。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供一种数据中心整机柜服务器的温度定位方法,该方法包括:
整机柜服务器上架完毕后,记录所述整机柜服务器中服务器节点的位置信息;
读取并解析数据中心整机柜服务器中服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;
定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。
上述方案中,所述记录所述整机柜服务器中服务器节点的位置信息,包括:
基于智能平台管理接口(IPMI)协议,将所述整机柜服务器中服务器节点的位置信息写入基板管理控制器(BMC)的现场可更换单元(FRU)信息中的产品资产标签(ProductAsset Tag)字段;其中,所述服务器节点的位置信息与该服务器节点的IP地址对应写入。
上述方案中,所述读取并解析数据中心整机柜服务器中服务器节点的位置信息,包括:
通过IPMI协议读取BMC的FRU信息,对所述FRU信息中的Product Asset Tag字段进行解析,得到服务器节点的位置信息和对应的IP地址。
上述方案中,所述基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图,包括:
为数据中心每一行整机柜服务器生成一张位置拓扑图,将起始坐标设置在位置拓扑图的左下角,横坐标为服务器节点所属机柜所在的列数,从第一列开始逐一递增;纵坐标为服务器节点位于机柜中的纵向高度,从机柜底部开始逐一递增。
上述方案中,所述定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,包括:
通过IPMI协议读取服务器节点对应的传感器测得的温度值和该服务器节点的IP地址;
依据服务器节点的IP地址与服务器节点的位置信息的对应关系,将读取的所述温度值与服务器节点的位置信息进行匹配;
通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处。
上述方案中,所述通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处,包括:
依据预设的温度值与颜色值的对应转换规则,将所述温度值转换为对应的颜色,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
依据预设的温度值与亮度值的对应转换规则,将所述温度值转换为对应的亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
上述方案中,所述通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处时,该方法还包括:
判断所述温度值是否超过预设的第一阈值,如果超过,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
判断所述温度值是否超过预设的第二阈值、且小于预设的第三阈值,如果是,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
本发明实施例还提供一种数据中心整机柜服务器的温度定位装置,该装置包括:
位置信息记录模块,用于整机柜服务器上架完毕后,记录所述整机柜服务器中服务器节点的位置信息;
拓扑图生成模块,用于读取并解析数据中心整机柜服务器中服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;
热力分布图生成模块,用于定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。
上述方案中,所述拓扑图生成模块包括:
读取解析单元,用于通过IPMI协议读取BMC的FRU信息,对所述FRU信息中的Product Asset Tag字段进行解析,得到服务器节点的位置信息和对应的IP地址;
绘图单元,用于为数据中心每一行整机柜服务器生成一张位置拓扑图,将起始坐标设置在位置拓扑图的左下角,横坐标为服务器节点所属机柜所在的列数,从第一列开始逐一递增;纵坐标为服务器节点位于机柜中的纵向高度,从机柜底部开始逐一递增。
上述方案中,所述热力分布图生成模块包括:
温度确定单元,用于通过IPMI协议读取服务器节点对应的传感器测得的温度值和该服务器节点的IP地址;
温度匹配单元,用于依据服务器节点的IP地址与服务器节点的位置信息的对应关系,将读取的所述温度值与服务器节点的位置信息进行匹配;
标记单元,用于通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处。
上述方案中,所述标记单元,
用于依据预设的温度值与颜色值的对应转换规则,将所述温度值转换为对应的颜色,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
用于依据预设的温度值与亮度值的对应转换规则,将所述温度值转换为对应的亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
上述方案中,所述标记单元,
还用于判断所述温度值是否超过预设的第一阈值,如果超过,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
还用于判断所述温度值是否超过预设的第二阈值、且小于预设的第三阈值,如果是,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
本发明不同的实施例提供的数据中心整机柜服务器的温度定位方法与装置,每台或者一些整机柜服务器上架完毕后,记录所述整机柜服务器中每个或者一些服务器节点的位置信息;读取并解析数据中心所有或一部分整机柜服务器中每个或者一些服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;定期读取所有或者一部分整机柜服务器中每个或者一些服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。本发明实施例基于服务器节点的位置信息生成服务器节点的位置拓扑图,并将读取的服务器节点的温度值对应标记到位置拓扑图上,形成清晰的热力分布图,可将数据中心整机柜服务器的温度分布直观呈现出来,即为IT设备末端冷却送风效果提供直观对比分析图;而且,本发明实施例不需在数据中心或者整机柜服务器侧安装额外传感器设备,从而无需将温度数据进行二次处理分析或对比,操作维护简便。
附图说明
图1为本发明实施例所述数据中心整机柜服务器的温度定位方法实现流程图;
图2为本发明实施例所述数据中心整机柜服务器的温度定位装置结构示意图;
图3为本发明实施例所述拓扑图生成模块的结构示意图;
图4为本发明实施例所述热力分布图生成模块的结构示意图;
图5为本发明场景实施例所述服务器节点位置拓扑图的生成流程示意图;
图6为本发明场景实施例所述服务器节点热力图的形成流程示意图。
具体实施方式
下面结合附图和实施例对本发明进行描述。
图1为本发明实施例所述数据中心整机柜服务器的温度定位方法实现流程图,如图1所示,该方法包括:
步骤101:整机柜服务器上架完毕后,记录所述整机柜服务器中服务器节点的位置信息;
步骤102:读取并解析数据中心整机柜服务器中服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;
步骤103:定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。
这里,所述服务器节点可为:1U服务器、2U服务器、或4U服务器等等。
本发明实施例基于服务器节点的位置信息生成服务器节点的位置拓扑图,并将读取的服务器节点的温度值对应标记到位置拓扑图上,形成清晰的热力分布图,可将数据中心整机柜服务器的温度分布直观呈现出来,即为IT设备末端冷却送风效果提供直观对比分析图;而且,本发明实施例不需在数据中心或者整机柜服务器侧安装额外传感器设备,从而无需将温度数据进行二次处理分析或对比,操作维护简便。
本发明实施例中,所述记录所述整机柜服务器中服务器节点的位置信息,包括:
基于IPMI协议,将所述整机柜服务器中服务器节点的位置信息写入BMC的FRU信息中的Product Asset Tag字段;其中,所述服务器节点的位置信息与该服务器节点的IP地址对应写入。
这里,服务器节点在初始化配置时,可通过带外管理(Out-of-band management)将所述Product Asset Tag字段中的位置信息设为如下格式:Center_Room_Row_Col_Positon_Size_IP,即为:所属数据中心_机房模块_行_列_服务器位置_尺寸_带外管理IP地址(即上述IP地址)。其中,带外管理的最大优势是使用独立管理通道来进行设备的维护,包括远程监控和管理服务器,无论是否处于开机状态或安装操作系统均可实现管理。
本发明实施例中,所述读取并解析数据中心整机柜服务器中服务器节点的位置信息,包括:
通过IPMI协议读取BMC的FRU信息,对所述FRU信息中的Product Asset Tag字段进行解析,得到服务器节点的位置信息和对应的IP地址。
本发明实施例中,所述基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图,包括:
为数据中心每一行整机柜服务器生成一张位置拓扑图,将起始坐标设置在位置拓扑图的左下角,横坐标为服务器节点所属机柜所在的列数,从第一列开始逐一递增;纵坐标为服务器节点位于机柜中的纵向高度,从机柜底部开始逐一递增。
当然,这里也可为数据中心每一列整机柜服务器生成一张位置拓扑图,将起始坐标设置在位置拓扑图的左下角,横坐标为服务器节点所属机柜所在的行数,从第一行开始逐一递增;纵坐标为服务器节点位于机柜中的纵向高度,从机柜底部开始逐一递增。
本发明实施例中,所述定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,包括:
通过IPMI协议读取服务器节点对应的传感器测得的温度值和该服务器节点的IP地址;
依据服务器节点的IP地址与服务器节点的位置信息的对应关系,将读取的所述温度值与服务器节点的位置信息进行匹配;
通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处。
本发明实施例中,所述通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处,包括:
依据预设的温度值与颜色值的对应转换规则,将所述温度值转换为对应的颜色,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
依据预设的温度值与亮度值的对应转换规则,将所述温度值转换为对应的亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
例如:如果通过颜色显示,则可设置代表冷却的蓝色为基色,#CCD6FFF为温度35℃对应色调,#002CDD为温度10℃对应色调,进而可以将监控获取的温度值均转化为对应的热力图颜色;如果通过亮度显示,则可设置温度越低,亮度越低,温度升高,亮度也随之升高。
本发明实施例中,所述通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处时,该方法还包括:
判断所述温度值是否超过预设的第一阈值,如果超过,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
判断所述温度值是否超过预设的第二阈值、且小于预设的第三阈值,如果是,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
这里,对于温度值小于等于预设的第一阈值的温度值可不在热力图上显示,或显示为与超过第一阈值的温度不同的颜色或不同的亮度来区分;同样,
对于温度值小于等于第二阈值或大于等于第三阈值的温度值可不在热力图上显示,或显示为与大于第二阈值、且小于第三阈值的温度不同的颜色或不同的亮度来区分。
可见,本发明实施例可通过设置的阈值(标尺)来筛选或定位局部热点,可实现快速定位热点区域。
本发明实施例还提供了一种数据中心整机柜服务器的温度定位装置,用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。如图2所示,该装置包括:
位置信息记录模块201,用于整机柜服务器上架完毕后,记录所述整机柜服务器中服务器节点的位置信息;
拓扑图生成模块202,用于读取并解析数据中心整机柜服务器中服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;
热力分布图生成模块203,用于定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。
这里,所述服务器节点可为:1U服务器、2U服务器、或4U服务器等等。
本发明实施例基于服务器节点的位置信息生成服务器节点的位置拓扑图,并将读取的服务器节点的温度值对应标记到位置拓扑图上,形成清晰的热力分布图,可将数据中心整机柜服务器的温度分布直观呈现出来,即为IT设备末端冷却送风效果提供直观对比分析图;而且,本发明实施例不需在数据中心或者整机柜服务器侧安装额外传感器设备,从而无需将温度数据进行二次处理分析或对比,操作维护简便。
本发明实施例中,所述位置信息记录模块201,用于整机柜服务器上架完毕后,基于IPMI协议,将所述整机柜服务器中服务器节点的位置信息写入BMC的FRU信息中的Product Asset Tag字段;其中,所述服务器节点的位置信息与该服务器节点的IP地址对应写入。
这里,服务器节点在初始化配置时,可通过Out-of-band management将所述Product Asset Tag字段中的位置信息设为如下格式:Center_Room_Row_Col_Positon_Size_IP,即为:所属数据中心_机房模块_行_列_服务器位置_尺寸_带外管理IP地址(即上述IP地址)。其中,带外管理的最大优势是使用独立管理通道来进行设备的维护,包括远程监控和管理服务器,无论是否处于开机状态或安装操作系统均可实现管理。
本发明实施例中,如图3所示,所述拓扑图生成模块202包括:
读取解析单元2021,用于通过IPMI协议读取BMC的FRU信息,对所述FRU信息中的Product Asset Tag字段进行解析,得到服务器节点的位置信息和对应的IP地址;
绘图单元2022,用于为数据中心每一行整机柜服务器生成一张位置拓扑图,将起始坐标设置在位置拓扑图的左下角,横坐标为服务器节点所属机柜所在的列数,从第一列开始逐一递增;纵坐标为服务器节点位于机柜中的纵向高度,从机柜底部开始逐一递增。
本发明实施例中,如图4所述,所述热力分布图生成模块203包括:
温度确定单元2031,用于通过IPMI协议读取服务器节点对应的传感器测得的温度值和该服务器节点的IP地址;
温度匹配单元2032,用于依据服务器节点的IP地址与服务器节点的位置信息的对应关系,将读取的所述温度值与服务器节点的位置信息进行匹配;
标记单元2033,用于通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处。
本发明实施例中,所述标记单元2033,
用于依据预设的温度值与颜色值的对应转换规则,将所述温度值转换为对应的颜色,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
用于依据预设的温度值与亮度值的对应转换规则,将所述温度值转换为对应的亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
例如:如果通过颜色显示,则可设置代表冷却的蓝色为基色,#CCD6FFF为温度35℃对应色调,#002CDD为温度10℃对应色调,进而可以将监控获取的温度值均转化为对应的热力图颜色;如果通过亮度显示,则可设置温度越低,亮度越低,温度升高,亮度也随之升高。
本发明实施例中,所述标记单元2033,
还用于判断所述温度值是否超过预设的第一阈值,如果超过,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
还用于判断所述温度值是否超过预设的第二阈值、且小于预设的第三阈值,如果是,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
这里,对于温度值小于等于预设的第一阈值的温度值可不在热力图上显示,或显示为与超过第一阈值的温度不同的颜色或不同的亮度来区分;同样,
对于温度值小于等于第二阈值或大于等于第三阈值的温度值可不在热力图上显示,或显示为与大于第二阈值、且小于第三阈值的温度不同的颜色或不同的亮度来区分。
可见,本发明实施例可通过设置的阈值(标尺)来筛选或定位局部热点,可实现快速定位热点区域。
下面结合具体场景实施例对本发明进行描述。
在数据中心整机柜服务器上架放置完毕后,按照从机柜最底部1U服务器(即上文的服务器节点)位置开始逐一加电的方式,通过IPMI协议远程连接服务器BMC管理系统,服务器节点在初始化配置时,通过Out-of-band management,将FRU的信息属性产品资产标签(Product Asset Tag)修改自定义规范的格式,如位置标记信息格式为:Center_Room_Row_Col_Positon_Size_IP,即为所属数据中心、机房模块、行、列、服务器位置、尺寸、带外管理IP地址。
进行服务器节点的位置信息分析与生成拓扑图:
通过IPMI协议规范读取服务器节点的FRU信息,将Product Asset Tag字段读取的信息进行拆分和标记,写入数据中心整机柜服务器位置信息库中。Center属性为一级目录;Room为二级目录;Row是整机柜服务器位置拓扑图的实际展示平面属性,显示该Row的整机柜服务器以及整机柜服务器的位置和尺寸信息。在构建一行整机柜服务器的平面图中,以左侧底角为起始坐标:(0col,0U)。相邻机柜位置在横轴起始值上累加(列数累加),服务器节点位置高度由纵轴起始值上累加。该拓扑图以近似于网格的方式显示,横纵轴标记对应的刻度值,所述服务器节点位置拓扑图的生成流程如图5所示,包括:
步骤501:整机柜上架后,通过IPMI协议规范远程在FRU Product Asset Tag字段中写入服务器节点的位置信息;
步骤502:通过IPMI协议规范读取FRU Product Asset Tag字段,并解析为单独字段写入位置信息库;
步骤503:调取位置信息库中的位置信息,按照设定的坐标规范生成服务器节点的位置拓扑图。
通过该种技术方案,可避免添加额外的辅助存储设备保存服务器的位置信息;并且,IPMI对FRU信息的修改可即时生效、无需重启服务器或关闭电源等措施,支持在线的信息维护以及服务器的调换工作。
监控温度数据的读取与处理:
目前通用服务器BMC芯片支持温度传感器等实时数据读取。采用IPMI协议读取服务器节点的温度传感器入口进风温度,无需在整机柜处设置更多的温度传感器以及辅助设备,可将直接获取的末端冷却送风实时数据并写入历史库中,实现服务器与其温度监控一一对应,监控密度最大化、成本最小化。获得的温度数值以热力图的方式展示,需要建立温度值与颜色值的转化规则。本技术方案中可设置代表冷却的蓝色为基色,#CCD6FFF为温度35℃对应色调,#002CDD为温度10℃对应色调,进而可以将监控获取的温度值均转化为对应的热力图颜色。
这里,所述热力图的形成过程如图6所示,包括:
步骤601:通过IPMI协议规范以及服务器节点的带外管理IP地址,定期读取服务器节点处的温度值;
步骤602:在所述位置信息库中检索所述IP地址对应的位置信息,并将温度值与位置信息进行匹配;
这里,通过带外监控读取的整机柜服务器节点的温度值与服务器节点的IP地址具有对应关系。通过IP地址在位置信息库中检索位置信息,使该IP地址对应的温度值以及历史值均可与位置信息进行关联匹配对应。
步骤603:将所述温度值转换为颜色值,并将所述颜色值对应的颜色填充到位置拓扑图相应位置处。
这里,整机柜服务器位置拓扑图上的每一个已标记的位置点(坐标点),均可以检索到对应的温度数值,将温度数值转换后的热力色(颜色)填充到该位置点。
可选的,在定位热力图显示界面上,设置显示颜色标尺,该标尺可以动态调节当前需要展示的颜色色调范围。若实际检测的服务器传感器进风温度值不在显示颜色标尺范围内,默认其显示为背景的白色#FFFFFF,只保留显示在标尺范围内的温度色系,从而实现定位热力图的筛选和过滤局部热点等功能。
本发明实施例将整机柜服务器位置信息通过IPMI协议写入BMC的FRU字段中,并通过解析后的位置信息库生成位置拓扑图;采用带外监控读取服务器节点内部温度传感器数据,转换成颜色匹配到位置拓扑图上的相应位置,构建热力分布图,还可根据设定的显示颜色标尺范围,实现支持动态热力图局部热点的筛选与定位。
本发明实施例中,由于通过BMC的RFU字段记录服务器节点在数据中心的位置与IP地址信息,因此可支持动态管理服务器更新与调整,支持自动生成服务器的位置拓扑结构;而且,无需额外的位置存储设备、无需预先通过服务序列号构建排列位置信息表、无需预先制定数据中心空间位置模型。
本发明实施例将服务器内部温度传感器的数值转化成颜色色系编码,并匹配服务器节点的位置拓扑图,生成整机柜服务器冷却送风热力图定位显示,支持动态筛选局部热点或者待优化点。本发明实施例无需在数据中心或者整机柜服务器安装额外的传感器设备、无需新增其他汇聚或者管理设备、无需将温度数据进行二次处理分析或对比。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1.一种数据中心整机柜服务器的温度定位方法,其特征在于,该方法包括:
整机柜服务器上架完毕后,基于智能平台管理接口IPMI协议,将所述整机柜服务器中服务器节点的位置信息写入基板管理控制器BMC的现场可更换单元FRU信息中的产品资产标签Product Asset Tag字段;其中,所述服务器节点的位置信息与该服务器节点的IP地址对应写入;所述Product Asset Tag字段中的位置信息设为如下格式:所属数据中心Center_机房模块Room_行Row_列Col_服务器位置Positon_尺寸Size_IP地址;
读取并解析数据中心整机柜服务器中服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;
定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。
2.根据权利要求1所述的方法,其特征在于,所述读取并解析数据中心整机柜服务器中服务器节点的位置信息,包括:
通过IPMI协议读取BMC的FRU信息,对所述FRU信息中的Product Asset Tag字段进行解析,得到服务器节点的位置信息和对应的IP地址。
3.根据权利要求1所述的方法,其特征在于,所述基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图,包括:
为数据中心每一行整机柜服务器生成一张位置拓扑图,将起始坐标设置在位置拓扑图的左下角,横坐标为服务器节点所属机柜所在的列数,从第一列开始逐一递增;纵坐标为服务器节点位于机柜中的纵向高度,从机柜底部开始逐一递增。
4.根据权利要求2所述的方法,其特征在于,所述定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,包括:
通过IPMI协议读取服务器节点对应的传感器测得的温度值和该服务器节点的IP地址;
依据服务器节点的IP地址与服务器节点的位置信息的对应关系,将读取的所述温度值与服务器节点的位置信息进行匹配;
通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处。
5.根据权利要求4所述的方法,其特征在于,所述通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处,包括:
依据预设的温度值与颜色值的对应转换规则,将所述温度值转换为对应的颜色,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
依据预设的温度值与亮度值的对应转换规则,将所述温度值转换为对应的亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
6.根据权利要求5所述的方法,其特征在于,所述通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处时,该方法还包括:
判断所述温度值是否超过预设的第一阈值,如果超过,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
判断所述温度值是否超过预设的第二阈值、且小于预设的第三阈值,如果是,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
7.一种数据中心整机柜服务器的温度定位装置,其特征在于,该装置包括:
位置信息记录模块,用于整机柜服务器上架完毕后,基于智能平台管理接口IPMI协议,将所述整机柜服务器中服务器节点的位置信息写入基板管理控制器BMC的现场可更换单元FRU信息中的产品资产标签Product Asset Tag字段;其中,所述服务器节点的位置信息与该服务器节点的IP地址对应写入;所述Product Asset Tag字段中的位置信息设为如下格式:所属数据中心Center_机房模块Room_行Row_列Col_服务器位置Positon_尺寸Size_IP地址;
拓扑图生成模块,用于读取并解析数据中心整机柜服务器中服务器节点的位置信息,基于解析所得的位置信息和预设的坐标规则生成服务器节点的位置拓扑图;
热力分布图生成模块,用于定期读取整机柜服务器中服务器节点的温度值,并将该温度值对应标记到所述位置拓扑图上,形成热力分布图。
8.根据权利要求7所述的装置,其特征在于,所述拓扑图生成模块包括:
读取解析单元,用于通过IPMI协议读取BMC的FRU信息,对所述FRU信息中的ProductAsset Tag字段进行解析,得到服务器节点的位置信息和对应的IP地址;
绘图单元,用于为数据中心每一行整机柜服务器生成一张位置拓扑图,将起始坐标设置在位置拓扑图的左下角,横坐标为服务器节点所属机柜所在的列数,从第一列开始逐一递增;纵坐标为服务器节点位于机柜中的纵向高度,从机柜底部开始逐一递增。
9.根据权利要求8所述的装置,其特征在于,所述热力分布图生成模块包括:
温度确定单元,用于通过IPMI协议读取服务器节点对应的传感器测得的温度值和该服务器节点的IP地址;
温度匹配单元,用于依据服务器节点的IP地址与服务器节点的位置信息的对应关系,将读取的所述温度值与服务器节点的位置信息进行匹配;
标记单元,用于通过预设的显示规则将所述温度值标记到位置拓扑图上与所述位置信息对应的坐标处。
10.根据权利要求9所述的装置,其特征在于,所述标记单元,
用于依据预设的温度值与颜色值的对应转换规则,将所述温度值转换为对应的颜色,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
用于依据预设的温度值与亮度值的对应转换规则,将所述温度值转换为对应的亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
11.根据权利要求10所述的装置,其特征在于,所述标记单元,
还用于判断所述温度值是否超过预设的第一阈值,如果超过,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处;或者,
还用于判断所述温度值是否超过预设的第二阈值、且小于预设的第三阈值,如果是,则将所述温度值转换为对应的颜色或亮度,并标记到位置拓扑图上与所述位置信息对应的坐标处。
CN201710063768.7A 2017-02-03 2017-02-03 一种数据中心整机柜服务器的温度定位方法与装置 Active CN108390765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710063768.7A CN108390765B (zh) 2017-02-03 2017-02-03 一种数据中心整机柜服务器的温度定位方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710063768.7A CN108390765B (zh) 2017-02-03 2017-02-03 一种数据中心整机柜服务器的温度定位方法与装置

Publications (2)

Publication Number Publication Date
CN108390765A CN108390765A (zh) 2018-08-10
CN108390765B true CN108390765B (zh) 2020-06-05

Family

ID=63076019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710063768.7A Active CN108390765B (zh) 2017-02-03 2017-02-03 一种数据中心整机柜服务器的温度定位方法与装置

Country Status (1)

Country Link
CN (1) CN108390765B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109309633B (zh) * 2018-09-21 2021-06-15 郑州云海信息技术有限公司 一种基于管理交换机的整机柜服务器节点管理方法及装置
US11351682B2 (en) 2019-06-19 2022-06-07 International Business Machines Corporation Environment monitoring and associated monitoring device
CN111580577A (zh) * 2020-05-18 2020-08-25 浪潮电子信息产业股份有限公司 一种机房温度监控方法、装置、设备及介质
CN112556879A (zh) * 2020-12-07 2021-03-26 航天科技控股集团股份有限公司 基于新能源汽车电池热力图分布的设计方法
CN113779718B (zh) * 2021-08-31 2023-12-26 西南电子技术研究所(中国电子科技集团公司第十研究所) 机载电子设备整机拓扑结构优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413202A (zh) * 2011-11-18 2012-04-11 浪潮电子信息产业股份有限公司 一种刀片服务器管理内网ip的自动分配方法
CN103188091A (zh) * 2011-12-28 2013-07-03 英业达股份有限公司 云端服务系统的管理方法及管理系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102217432B (zh) * 2008-11-14 2014-06-11 克尼尔有限责任公司 调节设备机箱中冷却气体的方法和传感器装置
US8489745B2 (en) * 2010-02-26 2013-07-16 International Business Machines Corporation Optimizing power consumption by dynamic workload adjustment
CN102479142A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 一种机架服务器系统及其监控方法
CN103048054A (zh) * 2012-12-27 2013-04-17 德讯科技股份有限公司 一种基于高密度温度采集的数据中心温度处理方法
CN106339013A (zh) * 2016-08-31 2017-01-18 浪潮电子信息产业股份有限公司 一种数据中心机房的温度调控方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413202A (zh) * 2011-11-18 2012-04-11 浪潮电子信息产业股份有限公司 一种刀片服务器管理内网ip的自动分配方法
CN103188091A (zh) * 2011-12-28 2013-07-03 英业达股份有限公司 云端服务系统的管理方法及管理系统

Also Published As

Publication number Publication date
CN108390765A (zh) 2018-08-10

Similar Documents

Publication Publication Date Title
CN108390765B (zh) 一种数据中心整机柜服务器的温度定位方法与装置
US7894944B2 (en) Environmental monitoring in data facilities
CN104052631A (zh) 一种设备信息的采集方法、装置以及系统
CN102833117B (zh) 基于物联网技术的数据中心动力环境监测系统所采用的方法
CN103138971B (zh) 服务器机柜系统
US20060097863A1 (en) Tracking equipment
CN103793238A (zh) 机柜与其同时更新多个基本输入输出系统的方法
CN102761894B (zh) 获取路径的方法、装置及系统
CN111917578A (zh) 多节点网络拓扑管理方法、装置及电子设备和存储介质
CN103138972A (zh) 服务器机柜系统
CN103135732B (zh) 服务器机柜系统
CA3147648C (en) System and method for visually managing computing devices in a data center
CN102313506A (zh) 一种检测设备物理位置的方法、机柜以及设备
CN115862177A (zh) 设备巡检方法及装置
CN111082521A (zh) 一种电网调控系统的运维数据监视方法及运维系统
CN111861221A (zh) 设备故障信息的推送方法和装置、存储介质及电子装置
US20170045931A1 (en) Power Supply Control Apparatus and Method for Controlling Power Supply
CN105159814B (zh) 温度监控方法和装置
CN104240613A (zh) 一种基于led显示屏的led箱体定位方法、装置及led显示屏
US10243373B2 (en) Power control system, power control device, server device, and method for controlling power control system
CN103152198A (zh) 基于微服务器的自动化资产管理方法和装置
CN111402525A (zh) 机柜内设备现场定位系统、方法以及运维管理系统与方法
CN101867488A (zh) 一种单板在位信息监测和记录装置和方法
CN110888949A (zh) 基于三维地图的设备告警屏蔽方法、装置、设备及介质
CN113204592B (zh) 物联网场景下的数据处理方法、系统、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant