CN115689524A - 一种数据中心机房电气设备预测性维护系统及方法 - Google Patents

一种数据中心机房电气设备预测性维护系统及方法 Download PDF

Info

Publication number
CN115689524A
CN115689524A CN202211290246.8A CN202211290246A CN115689524A CN 115689524 A CN115689524 A CN 115689524A CN 202211290246 A CN202211290246 A CN 202211290246A CN 115689524 A CN115689524 A CN 115689524A
Authority
CN
China
Prior art keywords
data
training
prediction
sequence
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211290246.8A
Other languages
English (en)
Inventor
南国
高岩
郝虹
尹青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong New Generation Information Industry Technology Research Institute Co Ltd
Original Assignee
Shandong New Generation Information Industry Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong New Generation Information Industry Technology Research Institute Co Ltd filed Critical Shandong New Generation Information Industry Technology Research Institute Co Ltd
Priority to CN202211290246.8A priority Critical patent/CN115689524A/zh
Publication of CN115689524A publication Critical patent/CN115689524A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种数据中心机房电气设备预测性维护系统及方法,属于工业设备过程监测与维护技术领域。方法包括:基于多传感器的电气设备运行时间序列数据获取;构建训练用数据集及数据预处理;基于机器学习的预测性维护模型的构建以及模型训练;利用模型对设备进行剩余有效时间的预测;根据上述预测,指定维修策略。本发明分别基于多传感器获取多维时序数据,利用深度学习方法进行学习和趋势预测,进行数据中心机房电气设备的监测和预防性维护,有效的提升了数据中心运维的效率。

Description

一种数据中心机房电气设备预测性维护系统及方法
技术领域
本发明涉及一种数据中心机房电气设备预测性维护系统及方法,属于工业设备过程监测与维护技术领域。
背景技术
数据中心需要进行24小时不间断的运维,以确保数据服务器以及各运行设备正确有序无误运行。数据中心纳入监控的设备中除IT设备之外,最为重要的就是电气设备,其为IT设备的正常运行提供稳定的电力,保障数据中心整体安全、可靠、稳定运行。计算机技术尤其是机器学习技术的快速发展使得数据中心各种类型的设备监测变得日益智能化,由人工运维向无人值守转变,从而极大降低运维成本并提升了整体运维效率。
发明内容
本发明目的是提供了一种数据中心机房电气设备预测性维护系统,提升了数据中心设备的预测性维护的效率。
本发明为实现上述目的,通过以下技术方案实现:
步骤1:基于多传感器的电气设备运行数据获取以及数据处理;
分别在每台列间空调上安装传感器,实时记录各参数数据;设定设备参数采集位置为出风口邻域部位,采集设备振动、噪声、风速、温度、湿度作为监测参数序列,分别标记为:振动Vibration、噪声Noise、风速Wind_speed、温度Temperature、湿度Humidity;选取不同的时间间隔点监测的数据组成多个数据集;
将数据集记录为序列值,并增加序列号和采集时间点,保存为csv文件作为训练数据集和测试数据集;
对每一组各单项数据分别进行进一步预处理,包括归一化处理、去噪处理,将预处理之后的每一组数据集按照8:2的比例并按照时间序划分为训练集和测试集;
步骤2:构建机器学习模型并进行预测模型的训练;
对每一组数据集,输入多维序列数据对LSTM网络进行训练,设定振动和噪声具有累积性质,训练中设定振动和噪声作为预测的参数,风速、温度和湿度作为训练参数的协变量;设置学习率、优化器、训练轮数参数训练LSTM模型;
模型训练分别在训练集上进行,和在全部数据集上进行训练,获取多个训练模型;
步骤3:根据模型输出进行设备异常检测及RUL预测。
在训练集上训练所获取的模型,输入测试集数据,用于对训练模型进行验证;在全部数据集上训练所获取的模型,用于对后续时间点和时间区间内相关参数的预测;
设定所采集参数与局部部位失效或降级存在函数关系,继而与设备RUL存在函数关系,根据训练模型获取异常信息和序列预测值,转换为对RUL的推断;
根据训练模型,预测数据集的下一个时间点的数值和下一个设定窗口周期的数据,设定周期为7天;根据预测值和预测序列数值判定异常值和预测策略;
步骤4:根据预测结果制定维修策略。
预测结果包括参数的异常检测和一定时间段的时间序列预测两个结果;
根据异常值以及所设定阈值,做出决策,采取获取异常信息即及时检修的方式;
根据时间序列预测以及所设定窗口阈值,做出RUL预测,并制定维修策略的方式。
优选的,所述选取不同的时间间隔点的监测周期为每12个小时监测一次,即时间间隔点为t=12h。数据集规模时间长度分别选择T=3m、T=6m、T=9m、T=12m、T=24m;
每一个数据集是由固定时间间隔的多个离散数值组成的序列;经过对数据集采集点数进行初步选择后,多个数据集的采集点数分别为N=180、N=360、N=540、N=720、N=1440。
优选的,所述系统包括数据获取与数据预处理模块、机器学习模型构建与训练模块、设备剩余寿命预测模块、预测反馈与维修策略制定模块;
所述数据获取以及数据预处理模块通过设定设备振动、电压、电流、温度、湿度作为监测参数序列,选取对应的传感器分别采集各参数运行数值;
所述机器学习模型构建与训练模块通过长短期记忆算法解决长序列训练过程中的梯度消失和梯度爆炸问题;机器学习模型基于Tensorflow深度学习框架,利用多维序列数据对LSTM训练,获取训练模型;
所述设备剩余寿命预测模块输入为多维序列数据,输出分别为各单项传感数据的预测值和设备整体的剩余寿命预测值;
所述维修策略制定模块根据上述剩余使用寿命预测值,做出反馈,指定对应的设备维修策略。
本发明的优点在于:本发明基于多传感器获取并记录电气设备各个运行数据,利用多维序列数据以及机器学习方法进行设备剩余寿命的预测,根据反馈指定对应的设备维修策略。利用一般性的传感器即可获得准确有效的参数数值,不需要对设备进行整体机械改动,方法简单、成本较低、实时性好。在一定程度上提升了数据中心设备的预测性维护的效率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为所述方法的流程示意图;
图2为所述各模块组合而成系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如附图1所示方法流程为:
1、基于多传感器的电气设备运行数据获取以及数据处理。
分别在每台列间空调上对应部位部署安装获取相应参数的传感器,用于实时记录各参数数据。
设定设备参数采集位置为出风口邻域部位。设定设备振动、噪声、风速、温度、湿度作为监测参数序列,分别标记为:振动Vibration、噪声Noise、风速Wind_speed、温度Temperature、湿度Humidity。选取对应的传感器分别采集各参数运行数值。
选取不同的时间间隔点监测的数据组成多个数据集,监测周期为每12个小时监测一次,即时间间隔点为t=12h。数据集规模时间长度分别选择T=3m、T=6m、T=9m、T=12m、T=24m。
每一个数据集是由固定时间间隔的多个离散数值组成的序列。经过对数据集采集点数进行初步选择后,多个数据集的采集点数分别为N=180、N=360、N=540、N=720、N=1440,即利用此5组数据集作为训练和测试用数据集。
将上述历史参数值记录为序列值,并增加对应的序列号和采集时间点,保存为csv文件作为训练数据集和测试数据集,文件中标题行各参数分别标记为:vibration、noise、wind_speed、temperature、humidity。
对每一组各单项数据分别进行进一步预处理,包括归一化处理、去噪处理等。
将预处理之后的每一组数据集按照8:2的比例并按照时间序划分为训练集和测试集(验证集)。
2、构建机器学习模型并进行预测模型的训练。
上述数据是严格按照时间顺序采集记录的,所以优选的学习网络不仅是要考虑到所有的输入信息,还要考虑到数据的时序关系。
循环神经网络(RNN: Recurrent Neural Networks)是一种可以在时间上进行线性递归的神经网络,适用于时间序列信息的预测。在RNN中,其表征的是一个序列当前输出与之前各时间点的信息的关系。但同时如果数据序列长度过大,RNN并不能做到充分有效的利用长距离的历史信息。而且模型在T时刻对输出求导的时候会传播到前面各个时刻,从而会引起梯度爆炸和梯度消失的问题。
长短期记忆(LSTM: Long Short-Term Memory)是对RNN进行一定改进的、特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。LSTM是通过对模型结构进行改进,通过增加三个门控单元,相当于增加了单元状态。其表现是,LSTM能够在更长的序列中有更好的表现,即LSTM可以很好的解决长距离依赖的问题。
具体在实际应用中,LSTM机器学习模型基于Tensorflow深度学习框架以及keras、sklearn等人工神经网络库。
对每一组数据集,输入多维序列数据对LSTM网络进行训练,设定振动和噪声具有累积性质,训练中设定振动和噪声作为预测的参数,风速、温度和湿度作为训练参数的协变量。设置合适的学习率、优化器、训练轮数等参数训练LSTM模型。
模型训练分别在训练集上进行,和在全部数据集(包括训练集和测试集/验证集)上进行训练,获取多个训练模型。
3、根据序列数据模型输出进行设备异常检测及RUL预测。
在训练集上训练所获取的模型,输入测试集/验证集的数据,用于对训练模型进行验证。
在全部数据集上训练所获取的模型,用于对后续时间点和时间区间内相关参数的预测。
剩余使用寿命(RUL: Remaining Useful Life),主要指系统运行一段时间后,剩余的使用寿命,准确地预测系统的剩余使用寿命,可以大大地减少因系统宕机引起的损失,提高系统的运行可靠性。
设定所采集参数与局部部位失效或降级存在一定的函数关系,继而与设备RUL存在一定的函数关系,根据训练模型获取异常信息和序列预测值,转换为对RUL的推断。
根据训练模型,预测数据集的下一个时间点的数值和下一个设定窗口周期的数据,设定周期为7天,即
Figure DEST_PATH_IMAGE001
=7d。
根据预测值和预测序列数值判定异常值和预测策略。
4、根据预测结果制定维修策略。
预测结果包括参数的异常检测和一定时间段的时间序列预测两个结果。
根据异常值以及所设定阈值,做出决策,采取获取异常信息即及时检修的方式。
根据时间序列预测以及所设定窗口阈值,做出RUL预测,并制定维修策略的方式。
所述系统包括数据获取与数据预处理模块、机器学习模型构建与训练模块、设备剩余寿命预测模块、预测反馈与维修策略制定模块;
所述数据获取以及数据预处理模块通过设定设备振动、电压、电流、温度、湿度作为监测参数序列,选取对应的传感器分别采集各参数运行数值;
所述机器学习模型构建与训练模块通过长短期记忆算法解决长序列训练过程中的梯度消失和梯度爆炸问题;机器学习模型基于Tensorflow深度学习框架,利用多维序列数据对LSTM训练,获取训练模型;
所述设备剩余寿命预测模块输入为多维序列数据,输出分别为各单项传感数据的预测值和设备整体的剩余寿命预测值;
所述维修策略制定模块根据上述剩余使用寿命预测值,做出反馈,指定对应的设备维修策略。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种数据中心机房电气设备预测性维护方法,其特征在于,包括以下步骤:
步骤1:基于多传感器的电气设备运行数据获取以及数据处理;
分别在每台列间空调上安装传感器,实时记录各参数数据;设定设备参数采集位置为出风口邻域部位,采集设备振动、噪声、风速、温度、湿度作为监测参数序列,分别标记为:振动Vibration、噪声Noise、风速Wind_speed、温度Temperature、湿度Humidity;选取不同的时间间隔点监测的数据组成多个数据集;
将数据集记录为序列值,并增加序列号和采集时间点,保存为csv文件作为训练数据集和测试数据集;
对每一组各单项数据分别进行进一步预处理,包括归一化处理、去噪处理,将预处理之后的每一组数据集按照8:2的比例并按照时间序划分为训练集和测试集;
步骤2:构建机器学习模型并进行预测模型的训练;
对每一组数据集,输入多维序列数据对LSTM网络进行训练,设定振动和噪声具有累积性质,训练中设定振动和噪声作为预测的参数,风速、温度和湿度作为训练参数的协变量;设置学习率、优化器、训练轮数参数训练LSTM模型;
模型训练分别在训练集上进行,和在全部数据集上进行训练,获取多个训练模型;
步骤3:根据模型输出进行设备异常检测及RUL预测;
在训练集上训练所获取的模型,输入测试集数据,用于对训练模型进行验证;在全部数据集上训练所获取的模型,用于对后续时间点和时间区间内相关参数的预测;
设定所采集参数与局部部位失效或降级存在函数关系,继而与设备RUL存在函数关系,根据训练模型获取异常信息和序列预测值,转换为对RUL的推断;
根据训练模型,预测数据集的下一个时间点的数值和下一个设定窗口周期的数据,设定周期为7天;根据预测值和预测序列数值判定异常值和预测策略;
步骤4:根据预测结果制定维修策略;
预测结果包括参数的异常检测和一定时间段的时间序列预测两个结果;
根据异常值以及所设定阈值,做出决策,采取获取异常信息即及时检修的方式;
根据时间序列预测以及所设定窗口阈值,做出RUL预测,并制定维修策略的方式。
2.根据权利要求1所述的数据中心机房电气设备预测性维护系统,其特征在于,所述选取不同的时间间隔点的监测周期为每12个小时监测一次,即时间间隔点为t=12h;
数据集规模时间长度分别选择T=3m、T=6m、T=9m、T=12m、T=24m;
每一个数据集是由固定时间间隔的多个离散数值组成的序列;经过对数据集采集点数进行初步选择后,多个数据集的采集点数分别为N=180、N=360、N=540、N=720、N=1440。
3.一种数据中心机房电气设备预测性维护系统,其特征在于,所述系统包括数据获取与数据预处理模块、机器学习模型构建与训练模块、设备剩余寿命预测模块、预测反馈与维修策略制定模块;
所述数据获取以及数据预处理模块通过设定设备振动、电压、电流、温度、湿度作为监测参数序列,选取对应的传感器分别采集各参数运行数值;
所述机器学习模型构建与训练模块通过长短期记忆算法解决长序列训练过程中的梯度消失和梯度爆炸问题;机器学习模型基于Tensorflow深度学习框架,利用多维序列数据对LSTM训练,获取训练模型;
所述设备剩余寿命预测模块输入为多维序列数据,输出分别为各单项传感数据的预测值和设备整体的剩余寿命预测值;
所述维修策略制定模块根据上述剩余使用寿命预测值,做出反馈,指定对应的设备维修策略。
CN202211290246.8A 2022-10-21 2022-10-21 一种数据中心机房电气设备预测性维护系统及方法 Pending CN115689524A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211290246.8A CN115689524A (zh) 2022-10-21 2022-10-21 一种数据中心机房电气设备预测性维护系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211290246.8A CN115689524A (zh) 2022-10-21 2022-10-21 一种数据中心机房电气设备预测性维护系统及方法

Publications (1)

Publication Number Publication Date
CN115689524A true CN115689524A (zh) 2023-02-03

Family

ID=85066538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211290246.8A Pending CN115689524A (zh) 2022-10-21 2022-10-21 一种数据中心机房电气设备预测性维护系统及方法

Country Status (1)

Country Link
CN (1) CN115689524A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116468427A (zh) * 2023-06-19 2023-07-21 南京祥泰系统科技有限公司 一种基于大数据的设备运维智能监管系统及方法
CN117841028A (zh) * 2024-03-08 2024-04-09 安徽国智数据技术有限公司 一种基于人工智能的综合管廊巡检机器人

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116468427A (zh) * 2023-06-19 2023-07-21 南京祥泰系统科技有限公司 一种基于大数据的设备运维智能监管系统及方法
CN116468427B (zh) * 2023-06-19 2023-08-25 南京祥泰系统科技有限公司 一种基于大数据的设备运维智能监管系统及方法
CN117841028A (zh) * 2024-03-08 2024-04-09 安徽国智数据技术有限公司 一种基于人工智能的综合管廊巡检机器人

Similar Documents

Publication Publication Date Title
CN115689524A (zh) 一种数据中心机房电气设备预测性维护系统及方法
CN111237134B (zh) 一种基于GRA-LSTM-stacking模型的海上双馈风力发电机故障诊断方法
JP2021064370A (ja) デジタル・ツイン・シミュレーション・データを利用した時系列データに基づく、大規模な産業用監視システム向けの半教師あり深層異常検出のための方法およびシステム
CN114819415B (zh) 一种基于数据分析的电力设备故障预测系统
CN105550943A (zh) 一种基于模糊综合评判的风电机组状态参数异常辨识方法
CN112766342A (zh) 一种电气设备的异常检测方法
CN115329812B (zh) 一种基于人工智能的桥梁基础设施异常监测方法
CN113339204B (zh) 一种基于混合神经网络的风力发电机故障识别方法
GB2476246A (en) Diagnosing an operation mode of a machine
CN111950505A (zh) 一种ssa-aann的风力发电机传感器状态评估方法
CN111669123A (zh) 用于对光伏组串进行故障诊断的方法和装置
CN112746934A (zh) 一种自联想神经网络诊断风机故障方法
CN113987294A (zh) 一种基于遗传优化gru神经网络的cvt在线故障诊断方法
CN115809405A (zh) 基于多特征融合的风机主轴齿轮箱温度异常检测方法
CN115060312A (zh) 一种基于人工智能的建筑材料安全监测系统
US11339763B2 (en) Method for windmill farm monitoring
CN116714469A (zh) 充电桩健康监测方法、装置、终端及存储介质
CN116221037A (zh) 一种风电机组监测方法和装置
CN115659249A (zh) 一种智能测站控制系统异常检测方法
CN114320773B (zh) 一种基于功率曲线分析与神经网络的风电机组故障预警方法
CN117113157B (zh) 一种基于人工智能的台区用电故障检测系统
CN117318024A (zh) 基于cnn神经网络的光伏发电功率预测管理方法及系统
CN118017502A (zh) 基于数字孪生的配电算力预测方法、系统及介质
CN114439704A (zh) 基于scada和fissa-dbn模型的风电机组运行状态监测方法
CN117892252A (zh) 基于大数据的智慧园区运营管理平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination