CN114577400B - 一种液冷服务器漏液检测方法、装置、设备、存储介质 - Google Patents

一种液冷服务器漏液检测方法、装置、设备、存储介质 Download PDF

Info

Publication number
CN114577400B
CN114577400B CN202210109197.7A CN202210109197A CN114577400B CN 114577400 B CN114577400 B CN 114577400B CN 202210109197 A CN202210109197 A CN 202210109197A CN 114577400 B CN114577400 B CN 114577400B
Authority
CN
China
Prior art keywords
historical
temperature
average value
server
utilization rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210109197.7A
Other languages
English (en)
Other versions
CN114577400A (zh
Inventor
刘成平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210109197.7A priority Critical patent/CN114577400B/zh
Publication of CN114577400A publication Critical patent/CN114577400A/zh
Application granted granted Critical
Publication of CN114577400B publication Critical patent/CN114577400B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M3/00Investigating fluid-tightness of structures
    • G01M3/002Investigating fluid-tightness of structures by using thermal means
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本申请公开了一种液冷服务器漏液检测方法、装置、设备及存储介质,包括:分别采集服务器运行过程中的中央处理器利用率以及服务器运行的第一预设时间段内中央处理器利用率对应的液冷箱的目标入水口温度平均值和目标出水口温度平均值;获取在第二预设时间段内服务器正常运行状态下的中央处理器利用率对应的历史入水口温度和历史出水口温度,并计算历史出水口温度与历史入水口温度的历史温度差值,然后根据历史温度差值生成温度基线;计算中央处理器利用率在第一预设时间段内的目标出水口温度平均值与目标入水口温度平均值的目标温度差值,并且与温度基线进行比较以得到漏液检测结果。避免增加物理硬件,实现简单、高效、准确的液冷服务器漏液检测。

Description

一种液冷服务器漏液检测方法、装置、设备、存储介质
技术领域
本发明涉及计算机监控领域,特别涉及一种液冷服务器漏液检测方法、装置、设备、存储介质。
背景技术
当前的数据中心服务器的规模越来越大,数据中心的散热制冷一直是制约数据中心高密度利用的一个瓶颈,随着服务器液冷技术的应用,为数据中心的空间利用提升了一个台阶;液冷服务器是利用工作流体作为中间热量传输的媒介,将热量由热区传递到远处再进行冷却,实现了硬件与冷却液体的分离,且两者不会直接接触。由于液体比空气的比热大,散热速度远远大于空气,因此制冷效率远高于风冷散热,散热效率高达1000倍,有效解决高密度服务器的散热问题,为服务器的高密度应用提供了有效的保障。在当前通用的漏液检测方案中,利用漏液检测模块、或者导热管围绕线圈,利用电阻的变化等方式进行漏液的检查,但这些方式基本上增量了物理硬件,产生了更多的成本,同时也增加了服务器的生成、维护的工作量。
综上所述,在避免增加物理硬件、降低服务器的维护费用和成本的情况下,如何对运行过程中的服务器实现简单、高效、准确的液冷服务器漏液检测,是本领域有待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种液冷服务器漏液检测方法、装置、设备、存储介质,在避免增加物理硬件、降低服务器的维护费用和成本的情况下,如何对运行过程中的服务器实现简单、高效、准确的液冷服务器漏液检测。其具体方案如下:
第一方面,本申请公开了一种液冷服务器漏液检测方法,包括:
控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;
获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;
计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。
可选的,所述获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,包括:
控制冷却液按照预设流量流入液冷箱,并采集服务器稳定运行状态时间段的中央处理器利用率;
对所述第二预设时间段的所述中央处理器利用率取平均,然后分别对所述第二预设时间段的与所述中央处理器利用率对应的所述历史出水口温度和所述历史入水口温度取平均,以得到所述中央处理器利用率平均值、历史出水口温度平均值以及历史入水口温度平均值。
可选的,所述获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,包括:
控制冷却液按照预设流量流入液冷箱,若所述服务器不处于稳定运行状态,则对所述服务器的所述中央处理器进行加压,以控制所述中央处理器利用率达到预设阈值;
分别采集所述第二预设时间段的所述中央处理器利用率相应的所述冷却液的历史入水口温度和历史出水口温度,并分别对所述第二预设时间段的与所述中央处理器利用率对应的所述历史出水口温度和所述历史入水口温度取平均,以得到历史出水口温度平均值以及历史入水口温度平均值。
可选的,所述计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果,包括:
计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值;
从历史预设数据库中找到对应的所述中央处理器利用率的历史温度差值,并将所述目标温度差值与所述历史温度差值进行比较;
如果所述目标温度差值高于所述历史温度差值,则判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。
可选的,所述计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线,包括:
计算所述中央处理器利用率平均值对应的所述历史出水口温度平均值与所述历史入水口温度平均值之间的所述历史温度差值,并将所述历史温度差值保存在历史预设数据库中;
基于所述中央处理器利用率平均值对应的多组所述历史温度差值,生成与所述中央处理器利用率平均值对应的温度基线。
可选的,所述计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线,包括:
获取所述中央处理器利用率在达到不同所述预设阈值时分别对应的所述历史出水口温度平均值与所述历史入水口温度平均值,并计算所述历史出水口温度平均值与所述历史入水口温度平均值之间的历史温度差值,以得到与不同所述预设阈值分别对应的不同历史温度差值,并将所述历史温度差值保存在历史预设数据库中;
获取所述中央处理器利用率在达到不同所述预设阈值时分别对应的所述历史出水口温度平均值与所述历史入水口温度平均值,并计算不同所述预设阈值对应的所述历史出水口温度平均值与所述历史入水口温度平均值之间的历史温度差值;
基于所述中央处理器利用率达到所述预设阈值时对应的所述历史温度差值,生成一条对应的温度基线,可以得到多条不同所述中央处理器利用率在达到不同所述预设阈值时对应的温度基线。
可选的,所述根据所述历史温度差值生成温度基线之后,还包括:
如果所述温度基线呈现持续升高的状态,则判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。
第二方面,本申请公开了一种液冷服务器漏液检测装置,包括:
目标温度采集模块,用于控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;
温度基线生成模块,用于获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率不同预设阈值对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;
漏液检测模块,用于计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的液冷服务器漏液检测方法的步骤。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的液冷服务器漏液检测方法的步骤。
可见,本申请公开了一种液冷服务器漏液检测方法,包括:控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。由此可见,本申请在不额外增加物理硬件的情况下,通过软件测算进行液冷服务器漏液检测,实施过程简单,减少服务器的生成、维护的工作量,检测结果高效准确,可以最大化的避免液冷服务器的漏液问题,降低企业的运维成本和人力成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种液冷服务器漏液检测方法流程图;
图2为本申请公开的一种具体的液冷服务器漏液检测方法流程图;
图3为本申请公开的一种具体的液冷服务器漏液检测方法流程图;
图4为本申请公开的一种液冷服务器漏液智能监控架构结构图;
图5为本申请公开的一种液冷服务器漏液检测装置结构图;
图6为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在当前通用的漏液检测方案中,利用漏液检测模块、或者导热管围绕线圈,利用电阻的变化等方式进行漏液的检查,但这些方式基本上增量了物理硬件,产生了更多的成本,同时也增加了服务器的生成、维护的工作量。
为此,本发明相应的提供了一种液冷服务器漏液检测方案,能够在避免增加物理硬件的情况下,降低服务器的维护费用和成本,对运行过程中的服务器实现简单、高效、准确的液冷服务器漏液检测。
参照图1所示,本发明实施例公开了一种液冷服务器漏液检测方法,包括:
步骤S11:控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值。
本实施例中,控制冷却液按照预设流量流入液冷箱,采集第一预设时间段内的所述中央处理器利用率,以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值,其中,所述第一预设时间段为用户自定义的时间段,具体可以包括:5秒、10秒、30秒、1分钟等,同时,采集与所述中央处理器利用率对应的液冷箱的目标入水口温度在所述第一预设时间段内的平均值和目标出水口温度在所述第一预设时间段内的平均值,可以理解的是,在所述中央处理器利用率在特定值下,通过控制冷却液的流量与历史存储的流量相同,方便进行温度对比判定,由于所述服务器的运行是一个持续变化的状态,所以采集时刻对应的所述中央处理器利用率对应的目标入水口温度值和目标出水口温度值会存在偶然性与误差,因此,本申请采集第一预设时间段内的中央处理器利用率、目标入水口温度平均值和目标出水口温度平均值。
步骤S12:获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线。
本实施例中,控制冷却液按照预设流量流入液冷箱,并获取在所述第二预设时间段内的所述服务器正常运行状态下的所述中央处理器利用率以及对应的历史入水口温度和历史出水口温度,可以理解的是,通过控制冷却液的流量大小,可以防止在发生漏液的情况下,为了保障散热的效果,液冷系统自适应的流量增加,然后计算所述历史温度差值,并基于所述历史温度差值生成对应的温度基线,并将所述历史温度差值与对应的所述中央处理器利用率保存在历史预设数据库中。
步骤S13:计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。
本实施例中,当获取到当前所述中央处理器利用率与对应的所述目标出水口温度平均值与所述目标入水口温度平均值之后,计算所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且将所述目标温度差值与所述温度基线进行比较以得到漏液检测结果。可以理解的是,通过控制冷却液流量,控制变量唯一,直接将所述目标温度差值与所述冷却箱提供与所述中央处理器利用率对应的所述温度基线进行比较,便于所述液冷服务器的漏液监控与检测。
可见,本申请公开了一种液冷服务器漏液检测方法,包括:控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。由此可见,本申请在不额外增加物理硬件的情况下,通过软件测算进行液冷服务器漏液检测,实施过程简单,减少服务器的生成、维护的工作量,检测结果高效准确,可以最大化的避免液冷服务器的漏液问题,降低企业的运维成本和人力成本。
参照图2所示,本发明实施例公开了一种具体的液冷服务器漏液检测方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
步骤S21:控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值。
步骤S22:控制冷却液按照预设流量流入液冷箱,并采集所述服务器稳定运行状态时间段的中央处理器利用率;对所述第二预设时间段的所述中央处理器利用率取平均,然后分别对所述第二预设时间段的与所述中央处理器利用率对应的所述历史出水口温度和所述历史入水口温度取平均,以得到所述中央处理器利用率平均值、历史出水口温度平均值以及历史入水口温度平均值。
本实施例中,采集所述服务器稳定运行状态时间段的中央处理器利用率,可以理解的是,所述服务器在运行状态的过程中,存在所述服务器运行状态一直稳定运行,也即,保持所述中央处理器利用率一直保持在一定的范围之内,对于这类的所述服务器,一般采集所述服务器所述第二预设时间段内的所述中央处理器利用率平均值以及对应的历史出水口温度平均值和历史入水口温度平均值,其中,所述第二预设时间段具体可以包括但不限于:1分钟、5分钟、10分钟等。
步骤S23:计算所述中央处理器利用率平均值对应的所述历史出水口温度平均值与所述历史入水口温度平均值之间的所述历史温度差值,并将所述历史温度差值保存在历史预设数据库中;基于所述中央处理器利用率平均值对应的多组所述历史温度差值,生成与所述中央处理器利用率平均值对应的温度基线。
本实施例中,由于所述服务器为稳定运行状态,计算并存储所述服务器稳定运行状态的所述中央处理器利用率平均值对应的历史温度差值在所述历史预设数据库中,并基于所述中央处理器利用率平均值对应的所述历史温度差值生成对应的温度基线,可以理解的是,通过所述历史温度差值生成的温度基线得到所述服务器在稳定运行状态时的所述中央处理器利用率平均值时对应的温度差值,并且随着历史温度测试数据的不断增加,使所述服务器处于稳定状态时对应的所述中央处理器利用率平均值对应的温度基线更加准确,数据更加具有说服力。
步骤S24:计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值。
步骤S25:从历史预设数据库中找到对应的所述中央处理器利用率的历史温度差值,并将所述目标温度差值与所述历史温度差值进行比较;如果所述目标温度差值高于所述历史温度差值,则判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。
本实施例中,在获取到所述目标温度差值之后,从所述历史预设数据库中找到对应的所述中央处理器利用率的历史温度差值,将所述目标温度差值与所述历史温度差值进行比较,可以理解的是,由于所述冷却液的流量是预设固定的,所以在所述服务器的所述中央处理器利用率平均值与历史的所述中央处理器利用率平均值一致时,所述目标温度差值应该与所述历史温度差值相同,若所述目标温度差值高于所述历史温度差值,则可以直接判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。
可见,本申请实施例中,通过控制变量唯一的方式,控制所述冷却液的流量为固定的预设流量,将所述服务器处于稳定状态的所述中央处理器利用率平均值对应的所述目标温度差值与所述历史温度差值进行比较,进而直接确定所述服务器的液冷箱是否出现漏液情况,这样一来可以实现简单的液冷服务器的检测过程,并且检测结果高效准确,可以最大化的避免液冷服务器的漏液问题,降低企业的运维成本。
参照图3所示,本发明实施例公开了一种具体的液冷服务器漏液检测方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
步骤S31:控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值。
步骤S32:控制冷却液按照预设流量流入液冷箱,若所述服务器不处于稳定运行状态,则对所述服务器的所述中央处理器进行加压,以控制所述中央处理器利用率达到预设阈值。
本实施例中,参照图4所示,一种液冷服务器漏液智能监控架构结构图,基于冷却液控制单元的流量控制功能,控制液冷服务器冷却液的流量,防止在发生漏液的情况下,为了保障散热的效果,液冷系统自适应的流量增加,同时也是为了保障在CPU(中央处理器)利用率在特定值下进行温度对比判定的时,控制冷却液的流量与历史存储的流量相同,然后,当检测到所述服务器一直处于不稳定运行状态,则需要对所述CPU利用率进行稳定化测算,计算每天CPU利用率的平均值CPU_DAY_AVERAGE;当所述CPU_DAY_AVERAGE的值低于预设阈值时,为了保障液冷服务器温度监控效果,需要在空闲时间段,控制冷却液的流量,给CPU加压,使所述CPU_DAY_AVERAGE的值达到不同预设阈值。以实现对所述CPU利用率的稳定化测算,进一步获得运行状态不稳定的所述服务器的CPU利用率平均值。
步骤S33:分别采集第二预设时间段的所述中央处理器利用率相应的所述冷却液的历史入水口温度和历史出水口温度,并分别对所述第二预设时间段的与所述中央处理器利用率对应的所述历史出水口温度和所述历史入水口温度取平均,以得到历史出水口温度平均值以及历史入水口温度平均值。
本实施例中,参照图4所示,当CPU_DAY_AVERAGE的值低于10%,为了保障液冷服务器温度监控效果,需要在空闲时间段,控制冷却液的流量,给CPU加压,控制10%的利用率运行10分钟,前5分钟为稳定系统温度,后5分钟每隔5秒钟采集一次冷却液的入水口、出水口的温度,计算平均值为该服务器10%利用率时,入水口温度平均值In_T_1、出水口温度平均值Out_T_1,并存储在DB(Data Base,数据库)中;当CPU_DAY_AVERAGE的值大于10%,小于40%,控制冷却液的流量,控制CPU利用率为30%,并运行10分钟,前5分钟为稳定系统温度,后5分钟每隔5秒钟采集一次冷却液的入出水口的温度,计算平均值为该服务器30%利用率时,入水口温度平均值In_T_2、出水口温度平均值Out_T_2,并存储在DB中;当CPU_DAY_AVERAGE的值大于40%,小于70%,控制冷却液的流量,控制CPU利用率为60%,运行10分钟,前5分钟为稳定系统温度,后5分钟每隔5秒钟采集一次冷却液的入出水口的温度,计算平均值为该服务器60%利用率时,入水口温度平均值In_T_3、出水口温度平均值Out_T_3,并存储在DB中;当CPU_DAY_AVERAGE的值大于80%,控制冷却液的流量,控制CPU利用率为80%,采集CPU利用率为80%时冷却液入出水口温度值(In_T_4/Out_T_4),并存储在DB中。
步骤S34:计算所述中央处理器利用率达到不同所述预设阈值时的对应的历史出水口温度平均值与所述历史入水口温度平均值的历史温度差值,然后根据所述历史温度差值生成温度基线。
本实施例中,获取所述中央处理器利用率在达到不同所述预设阈值时分别对应的所述历史出水口温度平均值与所述历史入水口温度平均值,并计算所述历史出水口温度平均值与所述历史入水口温度平均值之间的历史温度差值,以得到与不同所述预设阈值分别对应的不同历史温度差值,并将所述历史温度差值保存在历史预设数据库中;获取所述中央处理器利用率在达到不同所述预设阈值时分别对应的所述历史出水口温度平均值与所述历史入水口温度平均值,并计算不同所述预设阈值对应的所述历史出水口温度平均值与所述历史入水口温度平均值之间的历史温度差值;基于所述中央处理器利用率达到所述预设阈值时对应的所述历史温度差值,生成一条对应的温度基线,可以得到多条不同所述中央处理器利用率在达到不同所述预设阈值时对应的温度基线。可以理解的是,参照图4所示,根据所述CPU利用率平均值对应存储在所述历史预设数据库中的所述历史入水口温度平均值与所述历史出水口温度平均值情况,计算每台液冷服务器的温度基线T,如服务器1,CPU利用率为10%,温度基线T=(第1天温度差+第2天温度差+…+第n天温度差)/n天;温度差=出水口温度–入水口温度;统计分析单元记录所述CPU利用率、液冷温度等,并做统计分析,利用每天CPU相对空闲的时间段,做所述服务器的漏液测试。
步骤S35:计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。
本实施例中,计算运行状态不稳定的所述服务器所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并与经过步骤S34得到的所述温度基线进行比较,如果所述目标温度差值远远高于所述温度基线中的历史温度差值,则判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。其中,如果所述温度基线呈现持续升高的状态,也判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。可以理解的是,参照图4所示,告警单元检查每天新生成的温度差值,与温度基线进行对比分析,如有异常,通知客户进行紧急处理,例如:服务器1,在所述CPU利用率10%的情况下的温度基线T为5度;而今天新生成的温度差值为15度,即出水口温度-入水口温度=15度。择判定服务器存在漏液,需要告警通知到用户及时处理;如检测到每天的温度差值呈上升趋势,择判定服务器存在漏液,需要告警单元告警通知到用户及时处理。
可见,本申请实施例,通过对运行状态不稳定的所述服务器的所述CPU利用率进行稳定化测算,然后得到所述CPU利用率达到不同所述预设阈值下对应的历史温度差值和温度基线,能直接利用软件测算的方法实现本方案的液冷服务器的漏液检测,无需额外增加物理硬件,符合用户的预期,同时大大减少了客户运维液冷服务器的工作量,降低运维的复杂度,提高运维效率。
参照图5所示,本申请实施例还公开了一种液冷服务器漏液检测装置,包括:
目标温度采集模块11,用于控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;
温度基线生成模块12,用于获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率不同预设阈值对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;
漏液检测模块13,用于计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。
可见,本申请公开了一种液冷服务器漏液检测方法,包括:控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。由此可见,本申请在不额外增加物理硬件的情况下,通过软件测算进行液冷服务器漏液检测,实施过程简单,减少服务器的生成、维护的工作量,检测结果高效准确,可以最大化的避免液冷服务器的漏液问题,降低企业的运维成本和人力成本。
进一步的,本申请实施例还公开了一种电子设备,图6是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图6为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的液冷服务器漏液检测方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的液冷服务器漏液检测方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的液冷服务器漏液检测方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种液冷服务器漏液检测方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种液冷服务器漏液检测方法,其特征在于,包括:
控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;
获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;
计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。
2.根据权利要求1所述的液冷服务器漏液检测方法,其特征在于,所述获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,包括:
控制冷却液按照预设流量流入液冷箱,并采集服务器稳定运行状态时间段的中央处理器利用率;
对所述第二预设时间段的所述中央处理器利用率取平均,然后分别对所述第二预设时间段的与所述中央处理器利用率对应的所述历史出水口温度和所述历史入水口温度取平均,以得到所述中央处理器利用率平均值、历史出水口温度平均值以及历史入水口温度平均值。
3.根据权利要求1所述的液冷服务器漏液检测方法,其特征在于,所述获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率对应的历史入水口温度和历史出水口温度,包括:
控制冷却液按照预设流量流入液冷箱,若所述服务器不处于稳定运行状态,则对所述服务器的所述中央处理器进行加压,以控制所述中央处理器利用率达到预设阈值;
分别采集所述第二预设时间段的所述中央处理器利用率相应的所述冷却液的历史入水口温度和历史出水口温度,并分别对所述第二预设时间段的与所述中央处理器利用率对应的所述历史出水口温度和所述历史入水口温度取平均,以得到历史出水口温度平均值以及历史入水口温度平均值。
4.根据权利要求1所述的液冷服务器漏液检测方法,其特征在于,所述计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果,包括:
计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值;
从历史预设数据库中找到对应的所述中央处理器利用率的历史温度差值,并将所述目标温度差值与所述历史温度差值进行比较;
如果所述目标温度差值高于所述历史温度差值,则判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。
5.根据权利要求2所述的液冷服务器漏液检测方法,其特征在于,所述计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线,包括:
计算所述中央处理器利用率平均值对应的所述历史出水口温度平均值与所述历史入水口温度平均值之间的所述历史温度差值,并将所述历史温度差值保存在历史预设数据库中;
基于所述中央处理器利用率平均值对应的多组所述历史温度差值,生成与所述中央处理器利用率平均值对应的温度基线。
6.根据权利要求3所述的液冷服务器漏液检测方法,其特征在于,所述计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线,包括:
获取所述中央处理器利用率在达到不同所述预设阈值时分别对应的所述历史出水口温度平均值与所述历史入水口温度平均值,并计算所述历史出水口温度平均值与所述历史入水口温度平均值之间的历史温度差值,以得到与不同所述预设阈值分别对应的不同历史温度差值,并将所述历史温度差值保存在历史预设数据库中;
获取所述中央处理器利用率在达到不同所述预设阈值时分别对应的所述历史出水口温度平均值与所述历史入水口温度平均值,并计算不同所述预设阈值对应的所述历史出水口温度平均值与所述历史入水口温度平均值之间的历史温度差值;
基于所述中央处理器利用率达到所述预设阈值时对应的所述历史温度差值,生成一条对应的温度基线,可以得到多条不同所述中央处理器利用率在达到不同所述预设阈值时对应的温度基线。
7.根据权利要求1至6任一项所述的液冷服务器漏液检测方法,其特征在于,所述根据所述历史温度差值生成温度基线之后,还包括:
如果所述温度基线呈现持续升高的状态,则判定所述服务器的液冷箱出现漏液情况,并将所述漏液情况告警用户。
8.一种液冷服务器漏液检测装置,其特征在于,包括:
目标温度采集模块,用于控制冷却液按照预设流量流入液冷箱,分别采集服务器运行过程中的中央处理器利用率以及所述服务器运行的第一预设时间段内所述中央处理器利用率对应的所述液冷箱的目标入水口温度平均值和目标出水口温度平均值;
温度基线生成模块,用于获取在第二预设时间段内所述服务器正常运行状态下的所述中央处理器利用率不同预设阈值对应的历史入水口温度和历史出水口温度,并计算所述历史出水口温度与所述历史入水口温度的历史温度差值,然后根据所述历史温度差值生成温度基线;
漏液检测模块,用于计算所述中央处理器利用率在所述第一预设时间段内的所述目标出水口温度平均值与所述目标入水口温度平均值的目标温度差值,并且与所述温度基线进行比较以得到漏液检测结果。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的液冷服务器漏液检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的液冷服务器漏液检测方法的步骤。
CN202210109197.7A 2022-01-28 2022-01-28 一种液冷服务器漏液检测方法、装置、设备、存储介质 Active CN114577400B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210109197.7A CN114577400B (zh) 2022-01-28 2022-01-28 一种液冷服务器漏液检测方法、装置、设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210109197.7A CN114577400B (zh) 2022-01-28 2022-01-28 一种液冷服务器漏液检测方法、装置、设备、存储介质

Publications (2)

Publication Number Publication Date
CN114577400A CN114577400A (zh) 2022-06-03
CN114577400B true CN114577400B (zh) 2023-08-29

Family

ID=81769065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210109197.7A Active CN114577400B (zh) 2022-01-28 2022-01-28 一种液冷服务器漏液检测方法、装置、设备、存储介质

Country Status (1)

Country Link
CN (1) CN114577400B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256080A (ja) * 2002-03-01 2003-09-10 Hitachi Ltd 液冷システムにおける冷却液不足の監視装置および冷却液不足の検知方法
CN103162979A (zh) * 2011-12-08 2013-06-19 英业达股份有限公司 测试液冷式热交换器的方法
CN109683687A (zh) * 2018-12-25 2019-04-26 浪潮电子信息产业股份有限公司 一种服务器及其降温控制方法、装置、设备
CN111176406A (zh) * 2019-12-27 2020-05-19 北京比特大陆科技有限公司 液冷服务器及其故障诊断的方法和装置、保护方法和装置
CN111309555A (zh) * 2020-02-14 2020-06-19 苏州浪潮智能科技有限公司 一种液冷回路检测方法、装置、电子设备及可读存储介质
CN111595536A (zh) * 2020-06-28 2020-08-28 中国工商银行股份有限公司 漏液检测装置、漏液处理设备、液冷系统和漏液处理方法
CN111796647A (zh) * 2020-06-30 2020-10-20 联想(北京)有限公司 一种检测方法及电子设备
CN112328442A (zh) * 2020-11-27 2021-02-05 腾讯科技(深圳)有限公司 一种散热器检测方法、装置及计算机可读存储介质
CN113515431A (zh) * 2021-04-08 2021-10-19 上海安畅网络科技股份有限公司 一种基于云平台监控服务器机柜散热状态的方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977062B (zh) * 2017-11-30 2021-05-11 英业达科技有限公司 浸入式冷却系统验证方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256080A (ja) * 2002-03-01 2003-09-10 Hitachi Ltd 液冷システムにおける冷却液不足の監視装置および冷却液不足の検知方法
CN103162979A (zh) * 2011-12-08 2013-06-19 英业达股份有限公司 测试液冷式热交换器的方法
CN109683687A (zh) * 2018-12-25 2019-04-26 浪潮电子信息产业股份有限公司 一种服务器及其降温控制方法、装置、设备
CN111176406A (zh) * 2019-12-27 2020-05-19 北京比特大陆科技有限公司 液冷服务器及其故障诊断的方法和装置、保护方法和装置
CN111309555A (zh) * 2020-02-14 2020-06-19 苏州浪潮智能科技有限公司 一种液冷回路检测方法、装置、电子设备及可读存储介质
CN111595536A (zh) * 2020-06-28 2020-08-28 中国工商银行股份有限公司 漏液检测装置、漏液处理设备、液冷系统和漏液处理方法
CN111796647A (zh) * 2020-06-30 2020-10-20 联想(北京)有限公司 一种检测方法及电子设备
CN112328442A (zh) * 2020-11-27 2021-02-05 腾讯科技(深圳)有限公司 一种散热器检测方法、装置及计算机可读存储介质
CN113515431A (zh) * 2021-04-08 2021-10-19 上海安畅网络科技股份有限公司 一种基于云平台监控服务器机柜散热状态的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王玉刚 等.液冷散热器性能测试系统的研制.《中国测试》.2020,第97-101、142页. *

Also Published As

Publication number Publication date
CN114577400A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
US20160217378A1 (en) Identifying anomalous behavior of a monitored entity
Trihinas et al. AdaM: An adaptive monitoring framework for sampling and filtering on IoT devices
CN111191851B (zh) 一种基于知识图谱的数据中心能效优化方法
CN104901823A (zh) 一种告警阈值生成方法、业务性能指标监控方法及装置
WO2017133455A1 (zh) 液冷设备的控制方法、装置以及系统
CN113032157B (zh) 一种服务器自动智能扩缩容方法及系统
CN112532435B (zh) 一种运维方法、运维管理平台、设备及介质
CN109725220A (zh) 一种变压器油冷却回路的检测方法、系统及装置
CN112070353B (zh) 一种精确检测数据中心能效的方法及系统
CN114577400B (zh) 一种液冷服务器漏液检测方法、装置、设备、存储介质
CN110569170A (zh) 服务器利用率的评价方法、装置、设备及其存储介质
CN116839173A (zh) 一种能耗优化方法、装置、存储介质和电子设备
CN113780717A (zh) 基于网关的偷漏电行为分析方法、装置、智能网关和介质
WO2015059710A2 (en) System and method for monitoring and controlling thermal condition of a data center in real-time
CN104345858A (zh) 服务器硬件设备的功耗管理方法及装置、服务器
CN103346906A (zh) 一种基于云计算的智能运维方法及系统
CN115357421A (zh) 服务器液冷系统漏液处理方法、装置及计算机设备
CN116643844A (zh) 面向电力超算云资源自动扩展的智能化管理系统及方法
CN108184323B (zh) 整机柜服务器的散热调控方法、装置、设备及存储介质
CN116155766A (zh) 一种园区网络质量测评方法及设备
CN113567722B (zh) 一种用电器功率控制方法及装置
CN112838957B (zh) 一种具备智能调度的流量预测系统
GB2517017A (en) Index generation and embedded fusion for controller performance monitoring
CN111198607B (zh) 电子设备功耗管理方法与装置
CN109120439B (zh) 分布式集群告警输出方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant