CN115686108A - 一种边缘数据机房多层级云管控方法及系统 - Google Patents

一种边缘数据机房多层级云管控方法及系统 Download PDF

Info

Publication number
CN115686108A
CN115686108A CN202310000607.9A CN202310000607A CN115686108A CN 115686108 A CN115686108 A CN 115686108A CN 202310000607 A CN202310000607 A CN 202310000607A CN 115686108 A CN115686108 A CN 115686108A
Authority
CN
China
Prior art keywords
equipment
temperature
managed
temperature range
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310000607.9A
Other languages
English (en)
Other versions
CN115686108B (zh
Inventor
蔡幸波
黄瑞强
潘泽江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dtct Data Technology Co ltd
Original Assignee
Zhejiang Dtct Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dtct Data Technology Co ltd filed Critical Zhejiang Dtct Data Technology Co ltd
Priority to CN202310000607.9A priority Critical patent/CN115686108B/zh
Publication of CN115686108A publication Critical patent/CN115686108A/zh
Application granted granted Critical
Publication of CN115686108B publication Critical patent/CN115686108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Air Conditioning Control Device (AREA)

Abstract

本发明涉及数据中心机房环境管理技术领域,具体而言,涉及一种边缘数据机房多层级云管控方法及系统,本发明解决的问题:数据中心机房进行云管控时无法准确的判断机房内设备的工作温度是否异常的问题,为解决上述问题,本发明提供一种边缘数据机房多层级云管控方法,包括:建立设备管理库,通过监控中心对设备管理库中的待管理设备进行监控;通过环境监控系统检测机房的环境温度,通过动力监控系统检测机房的负载率;通过动力监控系统实时监控待管理设备的运行温度,获取机房的空间利用率以及待管理设备的运行负荷。

Description

一种边缘数据机房多层级云管控方法及系统
技术领域
本发明涉及数据中心机房环境管理技术领域,具体而言,涉及一种边缘数据机房多层级云管控方法及系统。
背景技术
在机房运行的过程中,路由器和服务器等需要全年不间断运行以向互联网用户提供服务,因此,需要精确的判断机房中各个设备的工作情况,并根据工作情况对设备进行预防性维修,以确保设备能够持续的运行。
在感知设备是否发生异常时,设备的温度异常是一项重要的判断指标,目前,数据中心机房的环境感知不够精确,无法精确的识别出设备的工作温度,而采用人工进行温度检测的方式难以及时掌握各机房的设备状况及环境变化情况,造成人员巡视效率较低、耗时长,设备出现故障时也不能及时发现和得到处理。
发明内容
本发明解决的问题:数据中心机房进行云管控时无法准确的判断机房内设备的工作温度是否异常的问题。
为解决上述问题,本发明实施例提供一种边缘数据机房多层级云管控方法,多层级云管控方法包括:建立设备管理库,通过监控中心对设备管理库中的待管理设备进行监控,并将监控信息显示在监控中心的显示屏上,监控中心内设有多个监控系统,监控系统包括:动力监控系统和环境监控系统;通过环境监控系统检测机房的环境温度,获得第一温度结果,通过动力监控系统检测机房的负载率,并从设备管理库中调取机房在负载率下正常工作时的环境温度,得到环境温度范围;通过动力监控系统实时监控待管理设备的运行温度,得到第二温度结果,并从设备管理库中调取待管理设备正常工作时的运行温度,得到设备温度范围;获取机房的空间利用率以及待管理设备的运行负荷,根据空间利用率和运行负荷调整设备温度范围,得到安全温度范围;根据第一温度结果、第二温度结果、环境温度范围、设备温度范围和安全温度范围判断待管理设备是否需要维修;当判定待管理设备需要维修时,对待管理设备的同类设备进行预防性维修,并将维修记录存储在设备管理库中;其中,当根据第一温度结果、第二温度结果、环境温度范围、设备温度范围和安全温度范围判断待管理设备是否需要维修具体包括:当第一温度结果位于环境温度范围内时,将第二温度结果与设备温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修;当第一温度结果位于环境温度范围外时,控制环境监控系统调整第一温度结果,根据调整的结果判断待管理设备是否需要维修;和/或;在第一温度结果调整的过程中,将第二温度结果与安全温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修。
与现有技术相比,采用该技术方案所达到的技术效果:设备管理库的设置让机房内的所有设备可以有规划的进行管控,环境监控系统与动力监控系统的分别检测,让待管理设备在检测温度时能够排除外界环境带来的温度影响,空间利用率和运行负荷的检测,让待管理设备正常工作时的温度范围更加准确,也让环境监控系统在调整机房温度的过程中能够保持对待管理设备的监控,提升了在机房温度调整过程中待管理设备的安全性,通过多层的检测,提升了待管理设备温度检测的准确性,让待管理设备的故障判断更加准确,对同类设备进行预防性维修的设置,让工作人员能够提前对有故障隐患的待管理设备进行检修,避免多次检修影响机房正常工作的情况发生。
在本发明的一个实施例中,将第二温度结果与设备温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修,包括:当第二温度结果多次超出设备温度范围外或超出设备温度范围的持续时间大于第一目标时间时,判定待管理设备需要进行维修;当第二温度结果始终位于设备温度范围内时,判定待管理设备无需维修。
与现有技术相比,采用该技术方案所达到的技术效果:第一目标时间与多次超出设备温度范围的判定条件,能够更加精确的判定待管理设备是否需要维修,避免了监测数据的波动带来的误判,同时又对波动的次数进行限制,进一步的提升了维修判定的准确性。
在本发明的一个实施例中,获取机房的空间利用率以及待管理设备的运行负荷,根据空间利用率和运行负荷调整设备温度范围,得到安全温度范围,包括:根据空间利用率计算机房的换热效率,并获取运行负荷;根据运行负荷与换热强度调整设备温度范围;根据运行负荷与换热强度调整设备温度范围,包括:计算待管理设备的散热面积; 根据散热面积与换热强度计算待管理设备的发热效率;根据发热效率与设备温度范围计算得到安全温度范围。
与现有技术相比,采用该技术方案所达到的技术效果:空间利用率与运行负荷的检测,能够判断待管理设备在当前工作环境的下的温度变化趋势,便于在工作温度发生异常时,更精准的判断待管理设备是否需要维修,安全温度范围的设置,在检测待管理设备的温度时,更加符合机房整体的温度,散热面积和发热系数的计算,让监控系统能够根据不同的待管理设备设置不同的温度增量,让机房对于待管理设备温度的管控更加精确。
在本发明的一个实施例中,计算待管理设备的散热面积,包括:获取待管理设备的安装位置以及待管理设备的散热面;当散热面不与外界接触时,该散热面具有第一散热系数;当散热面靠近机房的壁面或散热面靠近未工作的待管理设备时,该散热面具有第二散热系数;当散热面靠近处于工作状态的待管理设备时,该散热面具有第三散热系数;将各个散热面的面积乘以对应的散热系数后再相加,得到散热面积;其中,第一散热系数<第二散热系数<第三散热系数。
与现有技术相比,采用该技术方案所达到的技术效果:第一散热系数、第二散热系数以及第三散热系数的设置,让待管理设备不同的表面的散热能力能够根据其摆放位置能够得到换算,让散热面积的更加符合待管理设备实际的散热效果。
在本发明的一个实施例中,当第一温度结果位于环境温度范围外时,控制环境监控系统调整第一温度结果,包括:当第一温度结果小于环境温度范围的最小值时,计算第一温度结果与环境温度范围的最小值的差值,得到第一温差结果,根据第一温差结果调整机房的制冷频率和调整制冷的第一持续时间;当第一温度结果大于环境温度范围的最大值时,计算第一温度结果与环境温度范围的最大值的差值,得到第二温差结果,根据第二温差结果调整机房的制冷频率和调整制冷的第一持续时间;根据调整的结果判断待管理设备是否需要维修,包括:经过第一持续时间后,第一温差结果依然小于环境温度范围的最小值,判定待管理设备需要维修;经过第二持续时间后,第一温度结果依然大于环境温度范围的最大值,判定待管理设备需要维修。
与现有技术相比,采用该技术方案所达到的技术效果:根据环境温度范围的边界值来调整制冷效果,在确保第一温度结果调整的准确性,第一持续时间与第二持续时间的设置,限制了调整的时间,当第一温度结果无法通过调整制冷效果进入环境温度范围时,工作人员能够及时的察觉,并针对该情况进行维修。
在本发明的一个实施例中,在第一温度结果调整的过程中,将第二温度结果与安全温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修,包括:当第二温度结果超出安全温度范围时,待管理设备需要进行维修;当第二温度结果位于安全温度范围时,在第一温度结果调整完毕后,将第二温度结果与设备温度范围进行比较,判断待管理设备是否需要维修。
与现有技术相比,采用该技术方案所达到的技术效果:第二温度结果与安全温度范围的比较,可以在第一温度结果调整时对待管理设备进行补充判定,即便机房的温度异常没有直接影响到待管理设备的温度,但是因为安全温度范围的限定,此时的待管理设备也不会因为短时间的修理延迟造成损坏,反之,多层的判定能够排除因为机房温度异常对待管理设备的温度检测造成的影响。
在本发明的一个实施例中,当判定待管理设备需要维修时,对待维修设备的同类设备进行预防性维修,并将维修记录存储在设备管理库中,包括:在设备管理库中调取处于工作状态的同类设备;缩小设备温度范围得到预防温度范围;获取同类设备的运行温度,得到第三温度结果;将第三温度结果与预防温度范围进行比较,根据比较结果判断是否进行预防性维修。
与现有技术相比,采用该技术方案所达到的技术效果:通过调整预防温度范围的极值,并在第二温度结果超出设备温度范围的一侧进行更严格的把控,来检查同类设备是否存在相同故障。
在本发明的一个实施例中,将第三温度结果与预防温度范围进行比较,根据比较结果判断是否进行预防性维修,包括:在预防性维修的过程中,实时更新第三温度结果的极值;若极值没有超出预防温度范围,则同类设备无需进行预防性维修;若极值超出设备温度范围时,判定同类设备需要维修。
与现有技术相比,采用该技术方案所达到的技术效果:通过对同类设备进行检修,当同类设备中有一个发生故障时,其他设备也能够进行复检,避免发生错漏,预防温度范围的设置提高了同类设备在复检的过程中的工作需求,有效的预防了同类设备发生故障。
在本发明的一个实施例中,还提供一种边缘数据机房多层级云管控系统,该边缘数据机房多层级云管控系统用于实现上述的边缘数据机房多层级云管控方法。
附图说明
为了更清楚的说明本发明实施例的技术方案,下面将对实施例描述中待要使用的附图作简单介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;
图1为本发明流程图之一;
图2为本发明流程图之二;
图3为本发明流程图之三;
图4为本发明流程图之四;
图5为本发明流程图之五。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
【第一实施例】
参见图1至图5,在一个具体的实施例中,本发明提供一种边缘数据机房多层级云管控方法,包括:
S100、建立设备管理库,通过监控中心对设备管理库中的待管理设备进行监控,并将监控信息显示在监控中心的显示屏上,监控中心内设有多个监控系统,监控系统包括:动力监控系统和环境监控系统;
S200、通过环境监控系统检测机房的环境温度,获得第一温度结果,通过动力监控系统检测机房的负载率,并从设备管理库中调取机房在负载率下正常工作时的环境温度,得到环境温度范围;
S300、通过动力监控系统实时监控待管理设备的运行温度,得到第二温度结果,并从设备管理库中调取待管理设备正常工作时的运行温度,得到设备温度范围;
S400、获取机房的空间利用率以及待管理设备的运行负荷,根据空间利用率和运行负荷调整设备温度范围,得到安全温度范围;
S500、根据第一温度结果、第二温度结果、环境温度范围、设备温度范围和安全温度范围判断待管理设备是否需要维修;
S600、当判定待管理设备需要维修时,对待管理设备的同类设备进行预防性维修,并将维修记录存储在设备管理库中;
在步骤S100中,将机房内需要检测的设备加入到设备管理库中,在监控中心的显示屏上显示监控信息,监控信息包括但不限于:待管理设备的数量、待管理设备的设备信息、机房空间温度、机房空间湿度、待管理设备的运行温度、待管理设备的运行负荷以及机房整体的空间利用率,工作人员可以从显示屏上直观的观察到待管理设备的各项信息,便于机房内待管理设备的管控。
每个监控系统内都有对应的待管理设备,动力监控系统用于监控待管理设备的运行负荷,监控的待管理设备包括但不限于高压配电、低压配电、超级发电机组、配电柜、UPS、直流电源系统、蓄电池;环境监控系统用于监控机房的环境温度以及各个待管理设备的运行温度,并能够控制机房内部的环境调整装置,包括但不限于,空调、排风扇、除湿机和加湿器。
在步骤S200中,负载率是机房当前处于工作状态的待管理设备的数量,和机房内全部的待管理设备数量之间的比值,第一温度结果为环境监控系统实时检测的机房内部的温度,根据第一温度结果能够判定机房整体的温度是否处于正常范围内,环境温度范围是存储在设备管理库内的数据,在不同的负载率下,机房具有不同的环境温度范围,通常情况下,机房的负载率越高,环境温度范围的上限值和下限值也越高。
在步骤S300中,动力监控系统对正在运行的待管理设备进行实时的检测,将检测到的温度记为第二温度结果,第二温度结果是实时波动的,在设备管理库中记录了该待管理设备正常工作时的设备温度范围,设备温度范围的上限值是在该待管理设备在机房内正常工作,且单独运行一个小时后,在这一小时内的平均温度值,设备温度范围的下限值是在该待管理设备在机房内正常工作,且在机房满负荷率状态下运行一个小时后,在这一小时内的平均温度值。
在步骤S400中,空间利用率是指机房内摆放待管理设备的密度,即机房内未摆放待管理设备的体积与机房整体体积的比值,空间利用率能够表达机房内部摆放设备的密集程度,在相同的制冷条件下,密集程度越大,温度的上升就越容易,动力监控系统能够检测出设备的运行负荷,举例来说,待管理设备为机柜,机柜中设有十个服务器,则服务器运行的数量越多,该机柜的运行负荷就越大,在不同的运行负荷下,结合机房的空间利用率,对设备温度范围进行调整,得到该设备的安全温度范围。
在步骤S500中,待管理设备是否需要维修要结合不同的工作情况进行综合判断,判断步骤具体如下:
S510、当第一温度结果位于环境温度范围内时,将第二温度结果与设备温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修;
S520、当第一温度结果位于环境温度范围外时,控制环境监控系统调整第一温度结果,根据调整的结果判断待管理设备是否需要维修;和/或;在第一温度结果调整的过程中,将第二温度结果与安全温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修。
在步骤S510中,当机房的整体温度正常时,说明待管理设备的工作环境良好,机房的温度不会对待管理设备的温度造成影响,因此,直接将第二温度结果与设备温度范围进行比较。
在步骤S520中,当机房的整体温度偏高或者偏低时,说明待管理设备的工作环境不佳,机房内的温度会对待管理设备的温度造成影响,因此,首先需要调整机房的温度,消除机房内部温度对待管理设备造成的影响后,待管理设备的温度检测才更加的准确,但是因为调整第一温度结果需要一定的时间,在调整的过程中,动力监控系统依然保持第二温度结果的检测,并将第二温度检测结果与安全温度范围进行比较。
在步骤S600中,当步骤S500判定待管理设备需要维修时,将该待管理设备的也进行检测,同类设备为在设备管理库中记载的与进行维修的设备相同或相似的设备,例如,当一个机柜中的MDC用服务器需要维修时,则对其他机柜中的MDC用服务器或是同个机柜中不同的MDC用服务器也进行检测,排查是否存在相同的问题。
设备管理库的设置让机房内的所有设备可以有规划的进行管控,环境监控系统与动力监控系统的分别检测,让待管理设备在检测温度时能够排除外界环境带来的温度影响,空间利用率和运行负荷的检测,让待管理设备正常工作时的温度范围更加准确,也让环境监控系统在调整机房温度的过程中能够保持对待管理设备的监控,提升了在机房温度调整过程中待管理设备的安全性,通过多层的检测,提升了待管理设备温度检测的准确性,让待管理设备的故障判断更加准确,对同类设备进行预防性维修的设置,让工作人员能够提前对有故障隐患的待管理设备进行检修,避免多次检修影响机房正常工作的情况发生。
【第二实施例】
在一个具体的实施例中,将第二温度结果与设备温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修,具体包括:
S511、当第二温度结果多次超出设备温度范围外或超出设备温度范围的持续时间大于第一目标时间时,判定待管理设备需要进行维修;
S512、当第二温度结果始终位于设备温度范围内时,判定待管理设备无需维修。
在步骤S511中,在设备管理库中获取对应该待管理设备的设备温度范围以及第一目标时间,将第一实际参数值与正常范围参数进行比较,举例来说,待管理设备为蓄电池,第一目标时间为1分钟,设备温度范围为15℃至30℃,在第二温度结果检测的过程中,平均温度为28℃,但是蓄电池有2分钟的时间温度大于30℃,因此,蓄电池依然被判定为需要维修;或者,在第二温度结果检测的过程中,平均温度为25℃,但是温度波动频率较高,在检测时间内有共出现5次大于30℃的情况,虽然持续时间未达到1分钟,但是因为波动频繁,依然将蓄电池判定为需要维修。
需要说明的是,第二温度结果是实时检测,但是通常将5分钟定为一个检测周期,在五分钟内不出现异常状态,则进入下一个检测周期。
在步骤S512中,举例来说,待管理设备为蓄电池,检测周期为五分钟,设备温度范围为15℃至30℃,在第二温度结果检测的过程中,蓄电池的最高温度为29℃,最低温度为20℃,因此,在这个检测周期中,蓄电池始终处于设备温度范围内,此时,判定蓄电池无需进行维修。
第一目标时间与多次超出设备温度范围的判定条件,能够更加精确的判定待管理设备是否需要维修,避免了监测数据的波动带来的误判,同时又对波动的次数进行限制,进一步的提升了维修判定的准确性。
【第三实施例】
在一个具体的实施例中,获取机房的空间利用率以及待管理设备的运行负荷,根据空间利用率和运行负荷调整设备温度范围,得到安全温度范围,具体包括:
S410、根据空间利用率计算机房的换热强度,并获取运行负荷;
S420、根据运行负荷与换热强度调整设备温度范围。
在步骤S410中,记机房容积为L1,所述待管理设备的摆放体积为L2,计算得到空间利用率P=(L1-L2)/L1;运行负荷能够在显示屏上直接获取,记运行负荷为X,X的取值范围为0%至100%,换热强度E=X·P。
需要说明的是,换热强度随着空间利用率的提升而提升,即空间利用率越高,同等状态下机房的散热难度就越小,在相同的空间利用率下,换热强度随着机房容积的变化而变化。
当机房容积小于第一阈值时,在相同的空间利用率下,换热强度随着机房容积的提升而降低;
当机房容积大于第二阈值时,在相同的空间利用率下,换热强度随着机房容积的提升而提升;
当机房容积小于第二阈值时且大于第一阈值时,在相同的空间利用率下,换热强度保持不变。
第一阈值通常为400m³,第二阈值通常为4500m³。
需要说明的是,大部分的机房的散热状态可以用空间利用率直观的表达,但是容积过大或是容积过小的机房会出现换热强度的判断误差,因此设置第一阈值和第二阈值来避免因为机房容积不同而带来的影响。
空间利用率与运行负荷的检测,能够判断待管理设备在当前工作环境的下的温度变化趋势,便于在工作温度发生异常时,更精准的判断待管理设备是否需要维修。
在步骤S420中,通过换热强度与运行负荷来调整设备的温度范围,具体包括:
S421、计算待管理设备的散热面积;
S422、根据散热面积与换热强度计算待管理设备的发热系数;
S423、根据发热系数与设备温度范围计算得到安全温度范围。
在步骤S421中,根据待管理设备的大小,计算出待管理设备的表面积,根据待管理设备的表面积换算出散热面积,计散热面积为C1
在步骤S422中,计第一温度结果为T1,第二温度结果为T2,从设备管理库中获取所有正在进行工作的待管理设备的散热面积,记为为C0;计算得发热系数F=E×(T1-T2)×C1/C0
在步骤S433中,根据发热系数和设备温度范围的边界值结合,得到安装温度范围,举例来说,T1=40℃,T2=35℃,C0为1000m²,C1为50m²,空间利用率P为0.7,运行负荷X为70%,计算得到F=70%×0.7×(40-35)×50/1000=12.25%。若此时待管理设备的设备温度范围为30℃至40℃,此时,温度变化量为30×12.25%=3.675℃,取整得3.7℃,因为F>0,因此,将设备温度范围的上限值与下限值同时与温度变化量相加,即安全温度范围为33.7℃至43.7℃。
可以理解的,当T1<T2时,安全温度范围的上限值与下限值会同时降低。
安全温度范围的设置,在检测待管理设备的温度时,更加符合机房整体的温度,散热面积和发热系数的计算,让监控系统能够根据不同的待管理设备设置不同的温度增量,让机房对于待管理设备温度的管控更加精确。
【第四实施例】
在一个具体的实施例中,步骤S421具体包括:
S421a、获取待管理设备的安装位置以及待管理设备的散热面;
S421b、当散热面不与外界接触时,该散热面具有第一散热系数;
当散热面靠近机房的壁面或散热面靠近未工作的待管理设备时,该散热面具有第二散热系数;
当散热面靠近处于工作状态的待管理设备时,该散热面具有第三散热系数;
S421c、将各个散热面的面积乘以对应的散热系数后再相加,得到散热面积;
其中,第一散热系数<第二散热系数<第三散热系数。
在步骤S421a中,散热面为待管理设备的各个表面;
在步骤S421b中,待管理设备在摆放的过程中,会有多个面与其他的待管理设备接触,或是和机房的壁面接触,根据散热面的不同位置,散热面的散热系数也不同相同,当散热面朝向机房中心的通道,或是上表面没有其他待管理设备时,该散热面具有第一散热系数,当散热面与其他待管理设备并排设置时,若并排设置的待管理设备未处于工作状态,则该散热面具有第二散热系数,当散热面与机房的壁面贴合时,该散热面也具有第二散热系数,当并排设置的待管理设备处于工作状态时,该散热面具有第三散热系数。
举例来说,当机房中心有两个并列设置的机柜,且均处于工作状态,机柜的下表面与底面贴合,此时下表面具有第二散热系数,两个机柜的贴合面之间具有第三散热系数,若机柜的顶面与机房的顶部贴合,则顶面具有第二散热系数,若机柜的顶面不与机房的顶部贴合,则顶面具有第一散热系数,两个机柜的其他侧面均为第一散热系数。
在步骤S421c中,具体计算方式如下,假设机柜为正方体,每个面的表面积为C2,计第一散热系数为S1,第二散热系数为S2,第三散热系数为S3,该机柜的一个面与正在工作的待管理设备贴合,一个面与机房的壁面贴合,一个面与机房的底面贴合,剩下三个面不与外界接触,因此,该机柜的散热面积C1=C2×S3+2×S2×C2×+3×S1×C2。S1∈(1.9,2.1),S2∈(1.3,1.7),S3∈(0.9,1.1)。
当C2=25m²,S1=2,S2=1.5,S3=1时,该机柜的散热面积C1=25×1+2×1.5×25+3×2×25=250m²。
第一散热系数、第二散热系数以及第三散热系数的设置,让待管理设备不同的表面的散热能力能够根据其摆放位置能够得到换算,让散热面积的更加符合待管理设备实际的散热效果。
【第五实施例】
在一个具体的实施例中,当第一温度结果位于环境温度范围外时,控制环境监控系统调整第一温度结果,具体包括:
S521、当第一温度结果小于环境温度范围的最小值时,计算第一温度结果与环境温度范围的最小值的差值,得到第一温差结果,根据第一温差结果调整机房的制冷频率和调整制冷的第一持续时间;
S522、当第一温度结果大于环境温度范围的最大值时,计算第一温度结果与环境温度范围的最大值的差值,得到第二温差结果,根据第二温差结果调整机房的制冷频率和调整制冷的第一持续时间。
在步骤S521中,此时机房环境温度过低,说明此时的制冷量过大,需要通过环境监控系统对空调的温度进行调节,在通过温度判断待管理设备是否需要维修时,因为设备管理库中存储的设备温度范围是在机房正常工作下得到,过低的温度环境会影响对待管理设备温度的判定,因此,为了判定的准确性,先将机房的第一温度结果提升至环境温度范围内,随后再将待管理设备的运行温度与设备温度范围进行比较,此时可以控制空调器的出风温度升温,根据第一温差结果来调整空调器的升温温度,空调器的温度通常调整至环境温度范围的最大值,温度调整的时间随着第一温差结果的变化而变化,第一温差结果越大,第一持续时间越长。
在步骤S522中,此时机房环境温度过高,说明此时的制冷量过小,需要通过环境监控系统对空调的温度进行调节,过高的温度环境会影响对待管理设备温度的判定,因此,为了判定的准确性,先将机房的第一温度结果降低至环境温度范围内,随后再将待管理设备的运行温度与设备温度范围进行比较,此时可以控制空调器的出风温度降温,根据第二温差结果来调整空调器的降温温度,空调器的温度通常调整至环境温度范围的最小值,温度调整的时间随着第二温差结果的变化而变化,第二温差结果越大,第二持续时间越长。
根据环境温度范围的边界值来调整制冷效果,在确保第一温度结果调整的准确性,第一持续时间与第二持续时间的设置,限制了调整的时间,当第一温度结果无法通过调整制冷效果进入环境温度范围时,工作人员能够及时的察觉,并针对该情况进行维修。
【第六实施例】
在一个具体的实施例中,在第一温度结果调整的过程中,将第二温度结果与安全温度范围进行比较,根据比较结果判断待管理设备是否需要进行维修,包括:
S523、当第二温度结果超出安全温度范围时,待管理设备需要进行维修;
S524、当第二温度结果位于安全温度范围时,在第一温度结果调整完毕后,将第二温度结果与调整后的第一温度结果进行比较,判断待管理设备是否需要维修。
在步骤S523中,在第一温度结果调整的过程中,依然保持对待管理设备的温度检测,此时,判断待管理设备是否需要维修的标准从设备温度范围调整至安全温度范围,若第二温度结果超出安全温度范围,则无需等待第一持续时间或第二持续时间结束,直接判定待管理设备需要维修。
举例来说,第一温度结果为40℃,第二温度结果为35℃,第一温度范围为37℃至39℃,设备温度范围为30℃至36℃,安全温度范围为31℃至37℃根据步骤S522中的操作,需要先控制空调器以37℃的温度进行降温,持续第二目标时间后再对待管理设备进行判定,但是如果在第二目标时间内,检测到的第二温度结果出现了大于37℃的情况,则直接判定该待管理设备需要维修。
在步骤S524中,在调整的过程中,第二温度结果始终没有超出安全温度范围,则等第一温度结果调整完毕后,再将第二温度结果与设备温度范围进行比较,若第二温度结果位于设备温度范围之外,说明之前机房的温度异常没有直接影响到待管理设备,判定该待管理设备需要维修,若第二温度结果位于设备温度范围之内,判定该待管理设备无需维修。
第二温度结果与安全温度范围的比较,可以在第一温度结果调整时对待管理设备进行补充判定,即便机房的温度异常没有直接影响到待管理设备的温度,但是因为安全温度范围的限定,此时的待管理设备也不会因为短时间的修理延迟造成损坏,反之,多层的判定能够排除因为机房温度异常对待管理设备的温度检测造成的影响。
【第七实施例】
在一个具体的实施例中,根据调整的结果判断待管理设备是否需要维修,包括:
S525、经过第一持续时间后,第一温差结果依然小于环境温度范围的最小值,判定待管理设备需要维修;
S526、经过第二持续时间后,第一温度结果依然大于环境温度范围的最大值,判定待管理设备需要维修。
在步骤S525中,在调整的过程中,经过第一持续时间后第一温差结果没有进入环境温度范围,则说明机房设备出现异常,需要进行维修排查,机房温度过低可能是大量待管理设备没有进行工作或是部分待管理设备的运行负荷没有达到当前的工作需求,导致待管理设备的温度较低,因此造成机房整体温度降低。
在步骤S526中,经过第二持续时间后第一温差结果没有进入环境温度范围,则说明机房设备出现异常,需要进行维修排查,机房温度过高可能是因为大量待管理设备温度过高,整体升温而造成的机房温度升高。
【第八实施例】
在一个具体的实施例中,当判定待管理设备需要维修时,对待维修设备的同类设备进行预防性维修,并将维修记录存储在设备管理库中,包括:
S610、在设备管理库中调取处于工作状态的同类设备;
S620、缩小设备温度范围得到预防温度范围;
S630、获取同类设备的运行温度,得到第三温度结果;
S640、将第三温度结果与预防温度范围进行比较,根据比较结果判断是否进行预防性维修。
在步骤S610中,同类设备为在设备管理库中记载的与待维修设备相同或相似的设备。
在步骤S640中,当有待管理设备被判定为需要维修后,马上对该待管理设备的同类设备进行温度检测,得到第三温度结果,第三温度结果设备管理库中的设备温度范围进行比较,而是将设备温度范围进行缩小,得到预防温度范围,需要说明的是,在缩小设备范围参数时,设备范围参数的两个端值都需要缩小,优选的,第二温度结果超出设备温度范围或安全温度范围的一侧,缩小的幅度更大。
举例来说,被判定为需要修理的待管理设备为机柜中的服务器,服务器的设备温度范围为n℃至2n℃,对机房内与该服务器相同的设备进行预防性检测,预防温度范围为1.3n℃至1.7n℃,当判定维修的服务器的设备温度为0.95n℃时,可以将预防温度范围缩小至1.4n℃至1.7n℃。
通过调整预防温度范围的极值,并在第二温度结果超出设备温度范围的一侧进行更严格的把控,来检查同类设备是否存在相同故障。
【第九实施例】
在一个具体的实施例中,将第三温度结果与预防温度范围进行比较,根据比较结果判断是否进行预防性维修,包括:
S641、在预防性维修的过程中,实时更新第三温度结果的极值;
S642、若极值没有超出预防温度范围,则同类设备无需进行预防性维修;
S643、若极值超出设备温度范围时,判定同类设备需要维修
在步骤S641中,第三温度结果实时检测,但不会将每一次检测的数据都进行记录,每个数据检测出来后与此前检测过程中的极值进行比较,若是极值,则将该数据替换掉此前的极值,若不是,则对该数据不进行处理。
在步骤S643中,若检测到服务器的温度为0.95n℃时,说明当前服务器处于非正常工作状态,需要及时的进行维修。
通过对同类设备进行检修,当同类设备中有一个发生故障时,其他设备也能够进行复检,避免发生错漏,预防温度范围的设置提高了同类设备在复检的过程中的工作需求,有效的预防了同类设备发生故障。
【第十实施例】
在一个具体的实施例中,本发明还提供一种边缘数据机房多层级云管控系统,该边缘数据机房多层级云管控系统用于实现上述的边缘数据机房多层级云管控方法。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (10)

1.一种边缘数据机房多层级云管控方法,其特征在于,所述多层级云管控方法包括:
建立设备管理库,通过监控中心对所述设备管理库中的待管理设备进行监控,并将监控信息显示在所述监控中心的显示屏上,所述监控中心内设有多个监控系统,所述监控系统包括:动力监控系统和环境监控系统;
通过所述环境监控系统检测机房的环境温度,获得第一温度结果,通过所述动力监控系统检测所述机房的负载率,并从所述设备管理库中调取所述机房在所述负载率下正常工作时的环境温度,得到环境温度范围;
通过所述动力监控系统实时监控所述待管理设备的运行温度,得到第二温度结果,并从所述设备管理库中调取所述待管理设备正常工作时的运行温度,得到设备温度范围;
获取所述机房的空间利用率以及所述待管理设备的运行负荷,根据所述空间利用率和所述运行负荷调整所述设备温度范围,得到安全温度范围;
根据所述第一温度结果、第二温度结果、环境温度范围、设备温度范围和安全温度范围判断所述待管理设备是否需要维修;
当判定所述待管理设备需要维修时,对所述待管理设备的同类设备进行预防性维修,并将维修记录存储在所述设备管理库中。
2.根据权利要求1所述的边缘数据机房多层级云管控方法,其特征在于,所述根据所述第一温度结果、第二温度结果、环境温度范围、设备温度范围和安全温度范围判断所述待管理设备是否需要维修,包括:
当第一温度结果位于所述环境温度范围内时,将所述第二温度结果与所述设备温度范围进行比较,根据比较结果判断所述待管理设备是否需要进行维修;
当所述第一温度结果位于所述环境温度范围外时,控制所述环境监控系统调整所述第一温度结果,根据调整的结果判断所述待管理设备是否需要维修;和/或;在所述第一温度结果调整的过程中,将所述第二温度结果与所述安全温度范围进行比较,根据比较结果判断所述待管理设备是否需要进行维修。
3.根据权利要求2所述的边缘数据机房多层级云管控方法,其特征在于,所述将所述第二温度结果与所述设备温度范围进行比较,根据比较结果判断所述待管理设备是否需要进行维修,包括:
当所述第二温度结果多次超出所述设备温度范围外或超出所述设备温度范围的持续时间大于第一目标时间时,判定所述待管理设备需要进行维修;
当所述第二温度结果始终位于所述设备温度范围内时,判定所述待管理设备无需维修。
4.根据权利要求2所述的边缘数据机房多层级云管控方法,其特征在于,所述获取所述机房的空间利用率以及所述待管理设备的运行负荷,根据所述空间利用率和所述运行负荷调整所述设备温度范围,得到安全温度范围,包括:
根据所述空间利用率计算所述机房的换热强度,并获取所述运行负荷;
根据所述运行负荷与所述换热强度调整所述设备温度范围。
5.根据权利要求4所述的边缘数据机房多层级云管控方法,其特征在于,所述根据所述运行负荷与所述换热强度调整所述设备温度范围,包括:
计算所述待管理设备的散热面积;
根据所述散热面积与所述换热强度计算所述待管理设备的发热系数;
根据所述发热系数与所述设备温度范围计算得到所述安全温度范围。
6.根据权利要求5所述的边缘数据机房多层级云管控方法,其特征在于,所述计算所述待管理设备的散热面积,包括:
获取所述待管理设备的安装位置以及所述待管理设备的散热面;
当所述散热面不与外界接触时,所述散热面具有第一散热系数;
当所述散热面靠近所述机房的壁面或所述散热面靠近未工作的所述待管理设备时,所述散热面具有第二散热系数;
当所述散热面靠近处于工作状态的待管理设备时,所述散热面具有第三散热系数;
将各个所述散热面的面积乘以对应的散热系数后再相加,得到所述散热面积;
其中,所述第一散热系数<所述第二散热系数<所述第三散热系数。
7.根据权利要求2至6中任意一项所述的边缘数据机房多层级云管控方法,其特征在于,所述当所述第一温度结果位于所述环境温度范围外时,控制所述环境监控系统调整所述第一温度结果,包括:
当所述第一温度结果小于所述环境温度范围的最小值时,计算所述第一温度结果与所述环境温度范围的最小值的差值,得到第一温差结果,根据所述第一温差结果调整所述机房的制冷频率和调整制冷的第一持续时间;
当所述第一温度结果大于所述环境温度范围的最大值时,计算所述第一温度结果与所述环境温度范围的最大值的差值,得到第二温差结果,根据所述第二温差结果调整所述机房的制冷频率和调整制冷的第二持续时间。
8.根据权利要求7所述的边缘数据机房多层级云管控方法,其特征在于,所述在所述第一温度结果调整的过程中,将所述第二温度结果与所述安全温度范围进行比较,根据比较结果判断所述待管理设备是否需要进行维修,包括:
当所述第二温度结果超出所述安全温度范围时,所述待管理设备需要进行维修;
当所述第二温度结果位于所述安全温度范围时,在所述第一温度结果调整完毕后,将所述第二温度结果与所述设备温度范围进行比较,判断所述待管理设备是否需要维修。
9.根据权利要求8所述的边缘数据机房多层级云管控方法,其特征在于,所述根据调整的结果判断所述待管理设备是否需要维修,包括:
经过所述第一持续时间后,所述第一温差结果依然小于所述环境温度范围的最小值,判定所述待管理设备需要维修;
经过所述第二持续时间后,所述第一温度结果依然大于所述环境温度范围的最大值,判定所述待管理设备需要维修。
10.一种边缘数据机房多层级云管控系统,其特征在于,所述边缘数据机房多层级云管控系统用于实现如权利要求1至9中任意一项所述的边缘数据机房多层级云管控方法。
CN202310000607.9A 2023-01-03 2023-01-03 一种边缘数据机房多层级云管控方法及系统 Active CN115686108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310000607.9A CN115686108B (zh) 2023-01-03 2023-01-03 一种边缘数据机房多层级云管控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310000607.9A CN115686108B (zh) 2023-01-03 2023-01-03 一种边缘数据机房多层级云管控方法及系统

Publications (2)

Publication Number Publication Date
CN115686108A true CN115686108A (zh) 2023-02-03
CN115686108B CN115686108B (zh) 2023-04-07

Family

ID=85057224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310000607.9A Active CN115686108B (zh) 2023-01-03 2023-01-03 一种边缘数据机房多层级云管控方法及系统

Country Status (1)

Country Link
CN (1) CN115686108B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200848667A (en) * 2007-06-12 2008-12-16 Cq Inc Intelligent-type monitoring management control system
WO2012048443A1 (zh) * 2010-10-13 2012-04-19 日滔贸易(上海)有限公司 一种冷冻机房节能优化控制系统及方法
CN102466297A (zh) * 2010-11-16 2012-05-23 秦金红 一种机房、基站实时动态温度控制的方法及装置
US20140096946A1 (en) * 2012-09-24 2014-04-10 Cooper Technologies Company Comfort-Optimized Demand Response
CN104654536A (zh) * 2014-12-29 2015-05-27 杭州精尚投资管理有限公司 一种节能降耗的大型机房系统及控制方法
KR101662066B1 (ko) * 2015-05-27 2016-10-06 (주)아이피티브이코리아 공기 상태 기반 환경 제어 장치 및 방법
CN106321218A (zh) * 2015-06-15 2017-01-11 徐工集团工程机械股份有限公司 散热控制系统、方法以及挖掘机
CN111795488A (zh) * 2020-07-10 2020-10-20 哈尔滨工程大学 一种分布式机房温度的智能调控系统及方法
WO2020215907A1 (zh) * 2019-04-23 2020-10-29 北京海益同展信息科技有限公司 机房巡检系统
CN112507510A (zh) * 2020-10-30 2021-03-16 珠海一多监测科技有限公司 基于温升负荷性能的电力设备状态诊断方法、电子设备、存储介质
CN113339913A (zh) * 2021-06-21 2021-09-03 深圳市英维克科技股份有限公司 空调热管散热系统控制方法、系统、装置及介质
CN113357747A (zh) * 2021-08-11 2021-09-07 浙江德塔森特数据技术有限公司 一种数据机房空调自主诊断控制方法
CN115172026A (zh) * 2022-04-27 2022-10-11 广东电网有限责任公司广州供电局 植物油变压器及其散热方法、设备及计算机可读存储介质
CN115325682A (zh) * 2022-08-26 2022-11-11 河南省建筑科学研究院有限公司 一种高效智能制冷机房性能监测的优化控制方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200848667A (en) * 2007-06-12 2008-12-16 Cq Inc Intelligent-type monitoring management control system
WO2012048443A1 (zh) * 2010-10-13 2012-04-19 日滔贸易(上海)有限公司 一种冷冻机房节能优化控制系统及方法
CN102466297A (zh) * 2010-11-16 2012-05-23 秦金红 一种机房、基站实时动态温度控制的方法及装置
US20140096946A1 (en) * 2012-09-24 2014-04-10 Cooper Technologies Company Comfort-Optimized Demand Response
CN104654536A (zh) * 2014-12-29 2015-05-27 杭州精尚投资管理有限公司 一种节能降耗的大型机房系统及控制方法
KR101662066B1 (ko) * 2015-05-27 2016-10-06 (주)아이피티브이코리아 공기 상태 기반 환경 제어 장치 및 방법
CN106321218A (zh) * 2015-06-15 2017-01-11 徐工集团工程机械股份有限公司 散热控制系统、方法以及挖掘机
WO2020215907A1 (zh) * 2019-04-23 2020-10-29 北京海益同展信息科技有限公司 机房巡检系统
CN111795488A (zh) * 2020-07-10 2020-10-20 哈尔滨工程大学 一种分布式机房温度的智能调控系统及方法
CN112507510A (zh) * 2020-10-30 2021-03-16 珠海一多监测科技有限公司 基于温升负荷性能的电力设备状态诊断方法、电子设备、存储介质
CN113339913A (zh) * 2021-06-21 2021-09-03 深圳市英维克科技股份有限公司 空调热管散热系统控制方法、系统、装置及介质
CN113357747A (zh) * 2021-08-11 2021-09-07 浙江德塔森特数据技术有限公司 一种数据机房空调自主诊断控制方法
CN115172026A (zh) * 2022-04-27 2022-10-11 广东电网有限责任公司广州供电局 植物油变压器及其散热方法、设备及计算机可读存储介质
CN115325682A (zh) * 2022-08-26 2022-11-11 河南省建筑科学研究院有限公司 一种高效智能制冷机房性能监测的优化控制方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢海华: "建设经济实用的广电数字机房动力环境监控系统" *

Also Published As

Publication number Publication date
CN115686108B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US9883009B2 (en) Automatic computer room air conditioning control method
CA2882794C (en) Systems and methods for computer equipment management
CN108592352B (zh) 水冷空调系统运行状态健康度的预测方法、装置及系统
US20120303166A1 (en) System and method of safe and effective engergy usage and conservation for data centers with rack power distribution units
US10510030B2 (en) Techniques for evaluating optimum data center operation
KR101005909B1 (ko) 데이터센터 내부 냉각공기 제어용 풍향조절기
JP2004133553A (ja) 設備診断装置
RU2008102140A (ru) Система и способ централизованого мониторинга и управления режимом работы силовых трансформаторов, установленных на разных подстанциях и в центрах мониторинга
CN104204997A (zh) 信息处理装置、控制方法以及程序
CN111306706B (zh) 一种空调联动控制方法及系统
CN110715814B (zh) 一种开式冷却塔在线综合诊断系统及方法
CN110488896B (zh) 一种机房环境的控制系统及其控制方法
CN116579174A (zh) 一种实现数据机房气流组织节能优化策略及同步的方法
CN115686108B (zh) 一种边缘数据机房多层级云管控方法及系统
KR101830859B1 (ko) 가상 모델을 이용한 인터넷 데이터 센터의 에너지 진단 방법
CN117930772A (zh) 一种电子半导体厂房能耗异常管理方法
CN117318305A (zh) 一种用电负荷监测控制系统
US20220317670A1 (en) Server rack predictive maintenance method
CN116187623A (zh) 一种结合知识图谱论的设备系统安全评价方法
CN116414159A (zh) 温度管理方法、装置、电子设备、存储介质
Tschudi et al. Data Centers and Energy Use–Let’s Look at the Data
CN118400976B (zh) 一种机房节能运维管理方法和系统
CN118657407A (zh) 一种公共建筑数据机房的间接蒸发冷节能调控系统
KR20130122430A (ko) 건물 에너지 관리 장치 및 그의 냉온수 공급 온도 제어 방법
US20230380115A1 (en) Methods and systems for prioritizing maintenance of cooling units of a data center

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant