CN109874276B - 一种用于超级计算机房的冷冻水循环系统的报警系统 - Google Patents

一种用于超级计算机房的冷冻水循环系统的报警系统 Download PDF

Info

Publication number
CN109874276B
CN109874276B CN201910198110.6A CN201910198110A CN109874276B CN 109874276 B CN109874276 B CN 109874276B CN 201910198110 A CN201910198110 A CN 201910198110A CN 109874276 B CN109874276 B CN 109874276B
Authority
CN
China
Prior art keywords
alarm
pressure
pressure sensor
value
chilled water
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910198110.6A
Other languages
English (en)
Other versions
CN109874276A (zh
Inventor
李宇奇
刘光明
徐斌
冯景华
姜博韬
张健
孙福兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Supercomputer Center In Tianjin
Original Assignee
National Supercomputer Center In Tianjin
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Supercomputer Center In Tianjin filed Critical National Supercomputer Center In Tianjin
Priority to CN201910198110.6A priority Critical patent/CN109874276B/zh
Publication of CN109874276A publication Critical patent/CN109874276A/zh
Application granted granted Critical
Publication of CN109874276B publication Critical patent/CN109874276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种用于超级计算机房的冷冻水循环系统的报警系统,包括:位于所述冷冻水循环系统第一位置的第一压力传感器、位于所述冷冻水循环系统第二位置的第二压力传感器和报警服务器,所述报警服务器进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法:步骤S100,获取时刻n的第一压力数据Un=[UDn‑k+1,UDn‑k+2,…,UDn]和第二压力数据Dn=[DDn‑k+1,DDn‑k+2,…,DDn];步骤S200,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure DDA0001996485330000011
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警。

Description

一种用于超级计算机房的冷冻水循环系统的报警系统
技术领域
本发明涉及计算机房冷冻水报警系统,尤其涉及用于超级计算机房的冷冻水循环系统的报警系统。
背景技术
超级计算机房通常具有包含的计算集群规模大且运行时间长、承载的计算任务多的特点,因此,冷冻水循环系统在计算机房尤其是超级计算机房有着及其重要的作用。现有技术中,为了能够确保冷冻水循环系统可以正常运行,需要人为频繁地检查冷冻水循环系统中出现的问题,这样造成了人力和时间上的严重消耗。
发明内容
为解决上述技术问题,本发明公开了一种用于超级计算机房的冷冻水循环系统的报警系统,包括:位于所述冷冻水循环系统第一位置的第一压力传感器、位于所述冷冻水循环系统第二位置的第二压力传感器和报警服务器,所述报警服务器进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法:步骤S100,获取时刻n的第一压力数据Un=[UDn-k+1,UDn-k+2,…,UDn]和第二压力数据Dn=[DDn-k+1,DDn-k+2,…,DDn];步骤S200,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure BDA0001996485310000011
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警。
附图说明
图1是本发明用于超级计算机房的冷冻水循环系统的报警系统示意图;
图2是本发明用于超级计算机房的冷冻水循环系统的报警方法一实施例的流程图;
图3是本发明用于超级计算机房的冷冻水循环系统的报警方法另一实施例的流程图;
图4是本发明用于超级计算机房的冷冻水循环系统的报警方法又一实施例的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,将结合附图对本发明作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本发明的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本发明,在不脱离本发明的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。
图1是本发明用于超级计算机房的冷冻水循环系统的报警系统示意图。如图1所示,该报警系统1包括:位于所述冷冻水循环系统第一位置的第一压力传感器2、位于所述冷冻水循环系统第二位置的第二压力传感器3和报警服务器4。根据本发明,所述第一位置和所述第二位置可以不同,具体地,本领域技术人员可以根据需要,将所述第一位置和所述第二位置设置于所述冷冻水循环系统的任意位置,以便于对两个位置之间的冷冻水循环系统状态进行异常监控,一个优选的实施方式中,所述第一位置为所述冷冻水循环系统的入水口,所述第二位置为所述冷冻水循环系统的出水口,以便于整体监控所述冷冻水循环系统的异常情况。根据本发明,所述报警服务器4可以为现有技术中的任一计算机和/或服务器设备,本领域技术人员知悉,所述报警服务器4的具体品牌、规格等不作为限制本发明保护范围的条件。
根据本发明,所述报警服务器4进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法(如图2所示):
步骤S100,获取时刻n的第一压力数据Un=[UDn-k+1,UDn-k+2,…,UDn]和第二压力数据Dn=[DDn-k+1,DDn-k+2,…,DDn],其中,UDi为所述第一压力传感器在时刻i的压力采样数值,DDi为所述第二压力传感器在时刻i的压力采样数值,n-k+1≤i≤n,k为Un或Dn中包含的压力采样数值个数,k≥1,n≥1。
具体地,在本发明中,所述报警服务器4按照第一预设时间间隔ΔT1分别从第一压力传感器2和第二压力传感器3处获取压力采样数据并保存于所述报警服务器4,且所述报警服务器4保存压力采样数据的方式有多种,例如数据库、Excel表格等,且本领域技术人员可知,压力采样数据的具体保存方式不影响本发明的保护范围。进一步,所述第一预设时间间隔ΔT1可自定义设置,示例性的,所述第一预设时间间隔ΔT1的取值范围为[30秒,90秒],优选为60秒。根据本发明,所述压力采样数据的数据格式可以根据需要设定,例如一个实施方式中,可以只获取压力采样数值,另一个实施方式中,进一步还可以包括采样时间戳,以便于所述报警服务器4在接收到压力采样数据后可以根据时间戳信息进行数据排序等。
根据本发明,所述k值可自定义设置,以使得根据所述Un和/或Dn中的k个采样数值获取的压力变化趋势参数可以在最大程度上准确地反应出冷冻水循环系统不同位置在时刻n的真实运行状况,优选地,所述k的取值范围为[60,480],更优选为240。
步骤S200,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure BDA0001996485310000031
其中,所述第一压力传感器和所述第二压力传感器之间的系统沿程压差函数
Figure BDA0001996485310000032
z表示第一压力传感器和第二压力传感器之间包括的管道段数,z≥1,且本领技术人员可知,对于两段管道来说,如果存在任意一个参数,如λ,d、v、l不同,则两段管道被认为是不同的;lu表示第u段管道的管道长度,单位为m,du表示第u段管道的管道直径,单位为m,vu表示第u段管道的冷冻水流动速度,单位为m/s,g表示重力加速度,单位为m/s2,λu表示第u段管道的管道粘滞系数,单位为kpa/s,跟本段管道的冷冻水循环系统相关,具体地,在本发明中,λ取值可为本领域技术人员的经验阈值;ρ表示第一压力传感器和第二压力传感器之间的管道中的冷冻水密度,单位为kg/m3
根据本发明的一个实施例,所述第一压力变化趋势参数LK1n为根据Un获取的第一压力传感器2在n+1时刻的压力预估值UD'n+1,所述第二压力变化趋势参数LK2n为根据Dn获取的第二压力传感器3在n+1时刻的压力预估值DD'n+1。具体地,获取第一压力传感器在n+1时刻的压力预估值UD'n+1包括:
步骤S001,根据样本压力数据对(UDj,UDj+1)获取线性回归拟合的第一压力变化直线Y1=α01X1,其中n-k+1≤j≤n-1。具体地,在本发明中,将Un中的所述压力采样数据按照相邻两个一组的方式获取用于线性回归拟合的样本数据对,可知,可得到共k-1对压力样本数据对。步骤S002,根据所述第一压力变化直线Y1=α01X1和UDn获取UD'n+1,具体的,UD'n+1=α01UDn
获取第二压力传感器在n+1时刻的压力预估值DD'n+1包括:
步骤S010,根据样本压力数据对(DDj,DDj+1)获取线性回归拟合的第二压力变化直线Y2=β01X2,其中n-k+1≤j≤n-1。具体地,在本发明中,将Dn中的所述压力采样数据按照相邻两个一组的方式获取用于线性回归拟合的样本数据对,可知,可得到共k-1对压力样本数据对。步骤S020,根据所述第二压力变化直线Y2=β01X2和DDn获取DD'n+1,具体的,DD'n+1=β01DDn
根据本发明的另一个实施例,所述第一压力变化趋势参数LK1n为根据Un获取的第一压力传感器2的压力拟合直线斜率,即所述步骤S001获取的α1,所述第二压力变化趋势参数LK2n为根据Dn获取的第二压力传感器3的压力拟合直线斜率,即所述步骤S010获取的β1
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警。
根据本发明,当LK1n或LK2n分别表示压力传感器的压力拟合直线斜率时,所述第一报警阈值的取值范围为[0.65,0.85],优选为0.75。所述第二报警阈值和所述冷冻水循环系统的规模相关,通常情况下,对于一个固定规模的冷冻水循环系统而言,其具有与之相适应的报警阈值,因此,该第二报警阈值的取值可为本领域技术人员的经验阈值;同样,所述第三报警阈值、所述第四报警阈值均和所述冷冻水循环系统的规模相关,其取值可为本领域技术人员的经验阈值。在本发明中,当所述第一拟合直线斜率LK1n或第二拟合直线斜率LK2n大于第一报警阈值、或ALn大于第二报警阈值时,则可判定为有冷冻水压力变化异常,需要运维人员检查是否冷冻水循环基础设备漏水或者设备故障,预警设备老化,当UDn大于第三报警阈值或者DDn大于第四报警阈值,可判断为冷冻水循环内基础设备(例如冷机离心机)出现故障或者有动作变化,需要尽快检查确认设备,以防更大的损失。
进一步地,所述报警系统1设置有听觉报警器(例如声音等)和视觉报警器(例如光和图形等),一个实施例中,所述听觉报警器和视觉报警器为共享的报警器,例如当LK1n大于第一报警阈值或者LK2n大于第一报警阈值时,所述听觉报警器和视觉报警器进行报警;另一个实施例中,可以分别设置多个听觉报警器和视觉报警器对,其中一个听觉报警器和视觉报警器对针对一个报警项进行报警,例如当LK1n大于第一报警阈值时,第一个听觉报警器和视觉报警器对进行报警,当LK2n大于第一报警阈值时,第二个听觉报警器和视觉报警器对进行报警。且本领域技术人员可知,以上报警器的设置方式仅为示例性例子,本领域技术人员可以根据需要设置任何其他形式的报警方式。此外,对于本领域技术人员来说,所述听觉报警器和视觉报警器可以根据需要设置在任意位置,一以便于监控人员方便地对冷冻水循环系统的异常情况进行监控。
综合上述内容可知,本发明通过获取冷冻水循环系统中不同位置处的两个压力传感器在时刻n及其之前的共k个压力传感器采样数值,分别计算出每个压力传感器的压力变化趋势参数、传感器间沿程压差、以及时刻n的压力值,并通过将上述各参数和相关的报警阈值进行比较,从而对冷冻水循环系统的压力趋势和当前压力值进行报警,实现了对冷冻水循环系统的当前发生的异常和将要发生的异常进行报警,使得报警更全面,参考性更高。此外,报警系统节约了运维人员大量的时间和精力,可实现冷冻水异常报警的自动化。
在本发明的一个实施例中,步骤S300可替换为:当50≤UDj+1-UDj≤70或者50≤DDj+1-DDj≤70时,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警;当UDj+1-UDj>70或者DDj+1-DDj>70时,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,n-k+1≤j≤n-1。由于在冷冻水循环的过程中,会根据需要快速进行补水操作,因此,通过上述内容可以减少因为系统补水操作引发的错误报警,提高报警的准确性。
在本发明的另一个实施例中,所述报警系统1还包括存储有计算集群运行状态的存储介质,步骤S300可替换为:当所述计算集群运行状态为空闲状态时,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警;当所述计算集群运行状态为运行状态时,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警。
根据本发明,所述计算集群运行状态用于表示所述超级计算机房中所有计算集群的当前运行状态,且其表示方式可以用多种,示例性的,本领域技术人员可知,可使用数字“0”表示所述超级计算机房中的所有计算集群当前都处于空闲状态,使用数字“1”表示所述超级计算机房中的所有计算集群当前均处于运行状态,且本领技术人员可知,也可以采用其他方式,例如字符的方式,来分别表示所述超级计算机房中的所有计算集群的当前运行状态。
从上述内容可知,通过在报警过程中结合计算集群的当前运行状态,可以有效防止某些错误的报警,使得所述报警系统的报警更准确。
进一步,在本发明的又一实施例中,所述报警服务器4进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法(如图3所示):
步骤S100,获取时刻n的第一压力数据Un=[UDn-k+1,UDn-k+2,…,UDn]和第二压力数据Dn=[DDn-k+1,DDn-k+2,…,DDn],其中,UDi为所述第一压力传感器在时刻i的压力采样数值,DDi为所述第二压力传感器在时刻i的压力采样数值,n-k+1≤i≤n,k为Un或Dn中包含的压力采样数值个数,k≥1,n≥1。
具体地,在本发明中,所述报警服务器4按照第一预设时间间隔ΔT1分别从第一压力传感器2和第二压力传感器3处获取压力采样数据并保存于所述报警服务器4,且所述报警服务器4保存压力采样数据的方式有多种,例如数据库、Excel表格等,且本领域技术人员可知,压力采样数据的具体保存方式不影响本发明的保护范围。进一步,所述第一预设时间间隔ΔT1可自定义设置,示例性的,所述第一预设时间间隔ΔT1的取值范围为[30秒,90秒],优选为60秒。根据本发明,所述压力采样数据的数据格式可以根据需要设定,例如一个实施方式中,可以只获取压力采样数值,另一个实施方式中,进一步还可以包括采样时间戳,以便于所述报警服务器4在接收到压力采样数据后可以根据时间戳信息进行数据排序等。
根据本发明,所述k值可自定义设置,以使得根据所述Un和/或Dn中的k个采样数值获取的压力变化趋势参数可以在最大程度上准确地反应出冷冻水循环系统不同位置在时刻n的真实运行状况,优选地,所述k的取值范围为[60,480],更优选为240。
步骤S200,如果UDj+1-UDj>70或者DDj+1-DDj>70,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure BDA0001996485310000061
执行步骤S300;如果50≤UDj+1-UDj≤70或者50≤DDj+1-DDj≤70,执行步骤S400;其中,n-k+1≤j≤n-1,所述第一压力传感器和所述第二压力传感器之间的系统沿程压差函数
Figure BDA0001996485310000062
z表示第一压力传感器和第二压力传感器之间包括的管道段数,z≥1,且本领技术人员可知,对于两段管道来说,如果存在任意一个参数,如λ,d、v、l不同,则两段管道被认为是不同的;lu表示第u段管道的管道长度,单位为m,du表示第u段管道的管道直径,单位为m,vu表示第u段管道的冷冻水流动速度,单位为m/s,g表示重力加速度,单位为m/s2,λu表示第u段管道的管道粘滞系数,单位为kpa/s,跟本段管道的冷冻水循环系统相关,具体地,在本发明中,λ取值可为本领域技术人员的经验阈值;ρ表示第一压力传感器和第二压力传感器之间的管道中的冷冻水密度,单位为kg/m3
根据本发明的一个实施例,所述第一压力变化趋势参数LK1n为根据Un获取的第一压力传感器2在n+1时刻的压力预估值UD'n+1,所述第二压力变化趋势参数LK2n为根据Dn获取的第二压力传感器3在n+1时刻的压力预估值DD'n+1。具体地,获取第一压力传感器在n+1时刻的压力预估值UD'n+1包括:
步骤S001,根据样本压力数据对(UDj,UDj+1)获取线性回归拟合的第一压力变化直线Y1=α01X1,其中n-k+1≤j≤n-1。具体地,在本发明中,将Un中的所述压力采样数据按照相邻两个一组的方式获取用于线性回归拟合的样本数据对,可知,可得到共k-1对压力样本数据对。步骤S002,根据所述第一压力变化直线Y1=α01X1和UDn获取UD'n+1,具体的,UD'n+1=α01UDn
获取第二压力传感器在n+1时刻的压力预估值DD'n+1包括:
步骤S010,根据样本压力数据对(DDj,DDj+1)获取线性回归拟合的第二压力变化直线Y2=β01X2,其中n-k+1≤j≤n-1。具体地,在本发明中,将Dn中的所述压力采样数据按照相邻两个一组的方式获取用于线性回归拟合的样本数据对,可知,可得到共k-1对压力样本数据对。步骤S020,根据所述第二压力变化直线Y2=β01X2和DDn获取DD'n+1,具体的,DD'n+1=β01DDn
根据本发明的另一个实施例,所述第一压力变化趋势参数LK1n为根据Un获取的第一压力传感器2的压力拟合直线斜率,即所述步骤S001获取的α1,所述第二压力变化趋势参数LK2n为根据Dn获取的第二压力传感器3的压力拟合直线斜率,即所述步骤S010获取的β1
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束。
步骤S400,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束。从上述内容可知,其可以减少因为系统补水操作引发的错误报警,提高报警的准确性。
根据本发明的又一实施例,存储有计算集群运行状态的计算机可读存储介质,其中所述报警服务器4进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法(如图4所示):
步骤S100,获取时刻n的第一压力数据Un=[UDn-k+1,UDn-k+2,…,UDn]和第二压力数据Dn=[DDn-k+1,DDn-k+2,…,DDn],其中,UDi为所述第一压力传感器在时刻i的压力采样数值,DDi为所述第二压力传感器在时刻i的压力采样数值,n-k+1≤i≤n,k为Un或Dn中包含的压力采样数值个数,k≥1,n≥1。
具体地,在本发明中,所述报警服务器4按照第一预设时间间隔ΔT1分别从第一压力传感器2和第二压力传感器3处获取压力采样数据并保存于所述报警服务器4,且所述报警服务器4保存压力采样数据的方式有多种,例如数据库、Excel表格等,且本领域技术人员可知,压力采样数据的具体保存方式不影响本发明的保护范围。进一步,所述第一预设时间间隔ΔT1可自定义设置,示例性的,所述第一预设时间间隔ΔT1的取值范围为[30秒,90秒],优选为60秒。根据本发明,所述压力采样数据的数据格式可以根据需要设定,例如一个实施方式中,可以只获取压力采样数值,另一个实施方式中,进一步还可以包括采样时间戳,以便于所述报警服务器4在接收到压力采样数据后可以根据时间戳信息进行数据排序等。
根据本发明,所述k值可自定义设置,以使得根据所述Un和/或Dn中的k个采样数值获取的压力变化趋势参数可以在最大程度上准确地反应出冷冻水循环系统不同位置在时刻n的真实运行状况,优选地,所述k的取值范围为[60,480],更优选为240。
步骤S200,如果所述计算集群运行状态为运行状态,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure BDA0001996485310000081
执行步骤S300;如果所述计算集群运行状态为空闲状态,执行步骤S400;其中,所述第一压力传感器和所述第二压力传感器之间的系统沿程压差函数
Figure BDA0001996485310000082
z表示第一压力传感器和第二压力传感器之间包括的管道段数,lu表示第u段管道的管道长度,du表示第u段管道的管道直径,vu表示第u段管道的冷冻水流动速度,g表示重力加速度,λu表示第u段管道的管道粘滞系数,ρ表示第一压力传感器和第二压力传感器之间的管道中的冷冻水密度,z≥1。
根据本发明的一个实施例,所述第一压力变化趋势参数LK1n为根据Un获取的第一压力传感器2在n+1时刻的压力预估值UD'n+1,所述第二压力变化趋势参数LK2n为根据Dn获取的第二压力传感器3在n+1时刻的压力预估值DD'n+1。具体地,获取第一压力传感器在n+1时刻的压力预估值UD'n+1包括:
步骤S001,根据样本压力数据对(UDj,UDj+1)获取线性回归拟合的第一压力变化直线Y1=α01X1,其中n-k+1≤j≤n-1。具体地,在本发明中,将Un中的所述压力采样数据按照相邻两个一组的方式获取用于线性回归拟合的样本数据对,可知,可得到共k-1对压力样本数据对。步骤S002,根据所述第一压力变化直线Y1=α01X1和UDn获取UD'n+1,具体的,UD'n+1=α01UDn
获取第二压力传感器在n+1时刻的压力预估值DD'n+1包括:
步骤S010,根据样本压力数据对(DDj,DDj+1)获取线性回归拟合的第二压力变化直线Y2=β01X2,其中n-k+1≤j≤n-1。具体地,在本发明中,将Dn中的所述压力采样数据按照相邻两个一组的方式获取用于线性回归拟合的样本数据对,可知,可得到共k-1对压力样本数据对。步骤S020,根据所述第二压力变化直线Y2=β01X2和DDn获取DD'n+1,具体的,DD'n+1=β01DDn
根据本发明的另一个实施例,所述第一压力变化趋势参数LK1n为根据Un获取的第一压力传感器2的压力拟合直线斜率,即所述步骤S001获取的α1,所述第二压力变化趋势参数LK2n为根据Dn获取的第二压力传感器3的压力拟合直线斜率,即所述步骤S010获取的β1
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束。
步骤S400,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束。
从上述内容可知,通过在报警过程中结合计算集群的当前运行状态,可以有效防止某些错误的报警,使得所述报警系统的报警更准确。
此外,根据公开的本发明的说明书,本发明的其他实现对于本领域的技术人员是明显的。实施方式和/或实施方式的各个方面可以单独或者以任何组合用于本发明的系统和方法中。说明书和其中的示例应该是仅仅看作示例性,本发明的实际范围和精神由所附权利要求书表示。

Claims (9)

1.一种用于超级计算机房的冷冻水循环系统的报警系统,其特征在于,包括:位于所述冷冻水循环系统第一位置的第一压力传感器、位于所述冷冻水循环系统第二位置的第二压力传感器和报警服务器,所述报警服务器进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法:
步骤S100,获取时刻n的第一压力数据Un=[UDn-k+1,UDn-k+2,…,UDn]和第二压力数据Dn=[DDn-k+1,DDn-k+2,…,DDn],其中,UDi为所述第一压力传感器在时刻i的压力采样数值,DDi为所述第二压力传感器在时刻i的压力采样数值,n-k+1≤i≤n,k为Un或Dn中包含的压力采样数值个数,k≥1,n≥1;
步骤S200,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure FDA0002305800780000011
其中,所述第一压力传感器和所述第二压力传感器之间的系统沿程压差函数
Figure FDA0002305800780000012
z表示第一压力传感器和第二压力传感器之间包括的管道段数,lu表示第u段管道的管道长度,du表示第u段管道的管道直径,vu表示第u段管道的冷冻水流动速度,g表示重力加速度,λu表示第u段管道的管道粘滞系数,ρ表示第一压力传感器和第二压力传感器之间的管道中的冷冻水密度,z≥1;
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警;
进一步,第一压力变化趋势参数LK1n为根据样本压力数据对(UDm,UDm+1)进行线性回归拟合获取的第一压力变化直线Y1=α01X1的斜率α1,或者为将UDn作为所述第一压力变化直线Y1=α01X1中X1的取值而获取的第一压力传感器在n+1时刻的压力预估值;第二压力变化趋势参数LK2n为根据样本压力数据对(DDm,DDm+1)进行线性回归拟合获取的第二压力变化直线Y2=β01X2的斜率β1,或者为将DDn作为所述第二压力变化直线Y2=β01X2中X2的取值而获取的第二压力传感器在n+1时刻的压力预估值,n-k+1≤m≤n-1。
2.根据权利要求1所述的报警系统,其特征在于,所述第一位置和所述第二位置不同。
3.根据权利要求1-2中任一项所述的报警系统,其特征在于,所述第一位置为所述冷冻水循环系统的入水口,所述第二位置为所述冷冻水循环系统的出水口。
4.根据权利要求1所述的报警系统,其特征在于,所述第一报警阈值的取值范围为[0.65,0.85]。
5.根据权利要求1所述的报警系统,其特征在于,k的取值范围为[60,480]。
6.根据权利要求1所述的报警系统,其特征在于,所述报警系统还包括存储有计算集群运行状态的计算机可读存储介质,步骤S300可替换为:当所述计算集群运行状态为空闲状态时,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警;当所述计算集群运行状态为运行状态时,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警。
7.根据权利要求1所述的报警系统,其特征在于,步骤S300可替换为:当50≤UDj+1-UDj≤70或者50≤DDj+1-DDj≤70时,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警;当UDj+1-UDj>70或者DDj+1-DDj>70时,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,n-k+1≤j≤n-1。
8.一种用于超级计算机房的冷冻水循环系统的报警系统,其特征在于,包括:位于所述冷冻水循环系统第一位置的第一压力传感器、位于所述冷冻水循环系统第二位置的第二压力传感器、报警服务器和存储有计算集群运行状态的计算机可读存储介质,其中所述报警服务器进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法:
步骤S100,获取时刻n的第一压力数据Un=[UDn-k+1,UDn-k+2,…,UDn]和第二压力数据Dn=[DDn-k+1,DDn-k+2,…,DDn],其中,UDi为所述第一压力传感器在时刻i的压力采样数值,DDi为所述第二压力传感器在时刻i的压力采样数值,n-k+1≤i≤n,k为Un或Dn中包含的压力采样数值个数,k≥1,n≥1;
步骤S200,如果所述计算集群运行状态为运行状态,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure FDA0002305800780000021
执行步骤S300;如果所述计算集群运行状态为空闲状态,执行步骤S400;其中,所述第一压力传感器和所述第二压力传感器之间的系统沿程压差函数
Figure FDA0002305800780000022
z表示第一压力传感器和第二压力传感器之间包括的管道段数,lu表示第u段管道的管道长度,du表示第u段管道的管道直径,vu表示第u段管道的冷冻水流动速度,g表示重力加速度,λu表示第u段管道的管道粘滞系数,ρ表示第一压力传感器和第二压力传感器之间的管道中的冷冻水密度,z≥1;
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束;
步骤S400,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束;
进一步,第一压力变化趋势参数LK1n为根据样本压力数据对(UDm,UDm+1)进行线性回归拟合获取的第一压力变化直线Y1=α01X1的斜率α1,或者为将UDn作为所述第一压力变化直线Y1=α01X1中X1的取值而获取的第一压力传感器在n+1时刻的压力预估值;第二压力变化趋势参数LK2n为根据样本压力数据对(DDm,DDm+1)进行线性回归拟合获取的第二压力变化直线Y2=β01X2的斜率β1,或者为将DDn作为所述第二压力变化直线Y2=β01X2中X2的取值而获取的第二压力传感器在n+1时刻的压力预估值,n-k+1≤m≤n-1。
9.一种用于超级计算机房的冷冻水循环系统的报警系统,其特征在于,包括:位于所述冷冻水循环系统第一位置的第一压力传感器、位于所述冷冻水循环系统第二位置的第二压力传感器和报警服务器,其中所述报警服务器进一步包括处理器和存储有计算机程序的非瞬时性存储介质,当所述计算机程序被所述处理器执行时,实现以下用于超级计算机房的冷冻水循环系统的报警方法:
步骤S100,获取时刻n的第一压力数据Un=[UDn-k+1,UDn-k+2,…,UDn]和第二压力数据Dn=[DDn-k+1,DDn-k+2,…,DDn],其中,UDi为所述第一压力传感器在时刻i的压力采样数值,DDi为所述第二压力传感器在时刻i的压力采样数值,n-k+1≤i≤n,k为Un或Dn中包含的压力采样数值个数,k≥1,n≥1;
步骤S200,如果UDj+1-UDj>70或者DDj+1-DDj>70,根据Un和Dn分别获取所述第一压力传感器的第一压力变化趋势参数LK1n、所述第二压力传感器的第二压力变化趋势参数LK2n以及传感器间沿程偏差
Figure FDA0002305800780000031
执行步骤S300;如果50≤UDj+1-UDj≤70或者50≤DDj+1-DDj≤70,执行步骤S400;其中,n-k+1≤j≤n-1,所述第一压力传感器和所述第二压力传感器之间的系统沿程压差函数
Figure FDA0002305800780000032
z表示第一压力传感器和第二压力传感器之间包括的管道段数,lu表示第u段管道的管道长度,du表示第u段管道的管道直径,vu表示第u段管道的冷冻水流动速度,g表示重力加速度,λu表示第u段管道的管道粘滞系数,ρ表示第一压力传感器和第二压力传感器之间的管道中的冷冻水密度,z≥1;
步骤S300,如果LK1n或LK2n大于第一报警阈值、ALn大于第二报警阈值、UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束;
步骤S400,如果UDn大于第三报警阈值或者DDn大于第四报警阈值,则所述报警系统进行报警,结束;
进一步,第一压力变化趋势参数LK1n为根据样本压力数据对(UDm,UDm+1)进行线性回归拟合获取的第一压力变化直线Y1=α01X1的斜率α1,或者为将UDn作为所述第一压力变化直线Y1=α01X1中X1的取值而获取的第一压力传感器在n+1时刻的压力预估值;第二压力变化趋势参数LK2n为根据样本压力数据对(DDm,DDm+1)进行线性回归拟合获取的第二压力变化直线Y2=β01X2的斜率β1,或者为将DDn作为所述第二压力变化直线Y2=β01X2中X2的取值而获取的第二压力传感器在n+1时刻的压力预估值,n-k+1≤m≤n-1。
CN201910198110.6A 2019-03-15 2019-03-15 一种用于超级计算机房的冷冻水循环系统的报警系统 Active CN109874276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910198110.6A CN109874276B (zh) 2019-03-15 2019-03-15 一种用于超级计算机房的冷冻水循环系统的报警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910198110.6A CN109874276B (zh) 2019-03-15 2019-03-15 一种用于超级计算机房的冷冻水循环系统的报警系统

Publications (2)

Publication Number Publication Date
CN109874276A CN109874276A (zh) 2019-06-11
CN109874276B true CN109874276B (zh) 2020-04-07

Family

ID=66920516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910198110.6A Active CN109874276B (zh) 2019-03-15 2019-03-15 一种用于超级计算机房的冷冻水循环系统的报警系统

Country Status (1)

Country Link
CN (1) CN109874276B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104713411A (zh) * 2015-03-13 2015-06-17 芜湖凯博实业股份有限公司 冷却塔集水盘故障监测系统及其方法
CN105491862A (zh) * 2016-01-20 2016-04-13 北京百度网讯科技有限公司 用于数据中心机柜的液冷装置、液冷机柜和液冷系统
CN105607715A (zh) * 2015-12-15 2016-05-25 曙光信息产业(北京)有限公司 一种服务器的液冷系统
CN106094764A (zh) * 2016-08-01 2016-11-09 南京腾图节能科技有限公司 一种基于云计算的工业循环冷却水系统监测系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8844551B2 (en) * 2011-06-16 2014-09-30 Hamilton Sundstrand Corporation Leak detection logic for closed-volume system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104713411A (zh) * 2015-03-13 2015-06-17 芜湖凯博实业股份有限公司 冷却塔集水盘故障监测系统及其方法
CN105607715A (zh) * 2015-12-15 2016-05-25 曙光信息产业(北京)有限公司 一种服务器的液冷系统
CN105491862A (zh) * 2016-01-20 2016-04-13 北京百度网讯科技有限公司 用于数据中心机柜的液冷装置、液冷机柜和液冷系统
CN106094764A (zh) * 2016-08-01 2016-11-09 南京腾图节能科技有限公司 一种基于云计算的工业循环冷却水系统监测系统

Also Published As

Publication number Publication date
CN109874276A (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
US10598520B2 (en) Method and apparatus for pneumatically conveying particulate material including a user-visible IoT-based classification and predictive maintenance system noting maintenance state as being acceptable, cautionary, or dangerous
JP2019128934A5 (ja) サーバ、プログラム、及び、方法
Kullaa Distinguishing between sensor fault, structural damage, and environmental or operational effects in structural health monitoring
US10060831B2 (en) Method for assessing whether or not a measured value of a physical parameter of an aircraft engine is normal
SE536922C2 (sv) En metod och en apparat för att prediktera tillståndet hos en maskin eller en komponent hos maskinen
KR20160143512A (ko) 머신 러닝을 위한 진보된 분석 기반시설
CN109088775B (zh) 异常监控方法、装置以及服务器
CN107391335B (zh) 一种用于检查集群健康状态的方法和设备
JP6546327B2 (ja) シリンダから収集され、座標面に分布した温度値を解析することによって機器を監視する方法
CN110032490A (zh) 用于检测系统异常的方法及其装置
JP6609689B2 (ja) 異常診断システム
CN103324155A (zh) 系统监控
WO2019239542A1 (ja) 異常検知装置、異常検知方法及び異常検知プログラム
WO2018216197A1 (ja) 異常重要度算出システム、異常重要度算出装置、及び異常重要度算出プログラム
CN110109428B (zh) 一种用于实验室设备的险情监测系统
CN102141948A (zh) 带噪声的监控器检测和间歇故障隔离
CN112506763A (zh) 数据库系统故障根因自动定位方法和装置
CN109874276B (zh) 一种用于超级计算机房的冷冻水循环系统的报警系统
CN105425739B (zh) 使用plc日志数据来预测异常发生的系统
CN114610572A (zh) 服务异常检测方法、装置、计算机设备和存储介质
CN109573095B (zh) 用于维护诸如飞机的交通工具的方法和设备
US10360249B2 (en) System and method for creation and detection of process fingerprints for monitoring in a process plant
CN108535033A (zh) 虚拟传感器及其健康监测智能决策系统
JP2016003875A (ja) モータ異常検知システム、モータ異常検知方法、及びモータ異常検知プログラム
CN116700955A (zh) 作业处理方法、装置、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant