CN116071902A - 一种监控机房动力设备的方法、设备及介质 - Google Patents

一种监控机房动力设备的方法、设备及介质 Download PDF

Info

Publication number
CN116071902A
CN116071902A CN202310361180.5A CN202310361180A CN116071902A CN 116071902 A CN116071902 A CN 116071902A CN 202310361180 A CN202310361180 A CN 202310361180A CN 116071902 A CN116071902 A CN 116071902A
Authority
CN
China
Prior art keywords
fault
preset
machine room
alarm
power equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310361180.5A
Other languages
English (en)
Other versions
CN116071902B (zh
Inventor
包春波
张琳
杨奎军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jinyu Information Technology Group Co Ltd
Original Assignee
Shandong Jinyu Information Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jinyu Information Technology Group Co Ltd filed Critical Shandong Jinyu Information Technology Group Co Ltd
Priority to CN202310361180.5A priority Critical patent/CN116071902B/zh
Publication of CN116071902A publication Critical patent/CN116071902A/zh
Application granted granted Critical
Publication of CN116071902B publication Critical patent/CN116071902B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/185Electrical failure alarms

Abstract

本说明书实施例公开了一种监控机房动力设备的方法、设备及介质,涉及计算机技术领域,用于解决现有机房动力监控方法效率低成本高的问题。方法包括:基于预置传感器获取各动力设备的运行环境数据;根据各动力设备的数据传输时间,确定待监控机房的第一响应时间与第一响应时间;在第一响应时间内,基于主成分分析算法提取回传相关信息和第一运行环境数据中的故障特征,根据故障特征确定动力设备的第一故障告警类型获得相对应的第一告警参数,以生成第一告警信息传输给预置监控服务器;在第二响应时间内,将动力设备的第二运行环境数据与运行日志数据输入预置故障预测模型,基于预测结果生成第二告警信息传输给预置监控服务器。

Description

一种监控机房动力设备的方法、设备及介质
技术领域
本说明书涉及计算机技术领域,尤其涉及一种监控机房动力设备的方法、设备及介质。
背景技术
随着信息技术的发展和普及,计算机系统及通信设备数量与日俱增,规模越来越大,中心机房已成为各大单位业务管理的核心。机房动力设备运行环境监控作为机房的重要监管工作,其需要采集设备、监控服务器和远程监控终端的通信配合实现数据的交互,因此为了保障机房动力设备运行安全,对于机房动力设备的监控是一项重要的环节。
现有方式中对于机房动力设备的监控方法,一般是通过监控服务器对采集设备下发心跳监测指令,然后根据采集设备的响应来生成监测信息,从而形成采集设备监控表和记录其中的心跳时间数据,而随着当前机房动力设备的数量越来越多,仅基于监控服务器主导动力设备进行故障信息上传方式进行排查异常状况,可能会由于监控指令下发不及时的问题,以及监控服务器的故障监控指令无法及时更新导致故障遗漏的问题,使得动力设备的故障信息无法及时获取导致在动力设备故障排查上,需要耗费大量的人力物力。
发明内容
为了解决上述技术问题,本说明书一个或多个实施例提供了一种监控机房动力设备的方法、设备及介质。
本说明书一个或多个实施例采用下述技术方案:
本说明书一个或多个实施例提供一种监控机房动力设备的方法,方法包括:
基于待监控机房中预置传感器,获取所述待监控机房中各动力设备的运行环境数据;
根据各所述动力设备响应于预置监控服务器监控指令的数据传输时间,确定所述待监控机房的第一响应时间与第一响应时间;其中,所述预置监控服务器用于监控所述待监控机房中各所述动力设备的运行状态;
在第一响应时间内,获取所述动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取所述回传相关信息和所述第一运行环境数据中的故障特征,根据所述故障特征确定所述待监控机房中各动力设备的第一故障告警类型;
获取与所述第一故障告警类型相对应的第一告警参数,以基于所述第一告警参数生成第一告警信息传输给所述预置监控服务器;
在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型,以基于预测结果确定是否生成第二告警信息传输给所述预置监控服务器。
可选地,在本说明书一个或多个实施例中,基于待监控机房中预置多类型传感器,获取所述待监控机房中各动力设备的运行环境数据,具体包括:
根据各所述预置传感器的有效检测范围,确定所述有效检测范围下所覆盖的动力设备;
判断所述覆盖的动力设备是否存在于同类型传感器的有效检测范围下;
若是,则基于所述预置传感器的位置与所述覆盖的动力设备的位置,确定第一距离数据,并基于所述同类型传感器的位置与所述覆盖的动力设备的位置,确定第二距离数据;
根据所述第一距离数据与所述第二距离数据的倒数,分别确定所述预置传感器与所述同类型传感器的第一权重值与第二权重值,并分别基于所述预置传感器与所述同类型传感器的检测精度确定所述预置传感器与所述同类型传感器的第三权重值与第四权重值;
基于所述第一权重值与所述第三权重值的乘积确定所述预置传感器的权重值,并基于所述第二权重值与所述第四权重值的乘积确定所述同类型传感器的权重值;
对于所述预置传感器的权重值与所述同类型传感器的权重值,确定与所述覆盖的动力设备相匹配的传感器,以基于所述相匹配的传感器采集获得运行环境数据。
可选地,在本说明书一个或多个实施例中,基于待监控机房中预置多类型传感器,获取所述待监控机房中各动力设备的运行环境数据之前,所述方法还包括:
获取待监控机房的地理位置,以确定所述待监控机房的基本气候变化信息,并基于所述基本气候变化信息,确定所述待监控机房的易变环境参数;其中,所述易变环境参数包括:温度、湿度、灰尘;
根据所述易变环境参数以及所述待监控机房的预置安全防护规则,确定所述待监控机房的待安装传感器类型;
根据各动力设备的位置信息确定所述待监控机房的典型散点位置;其中,所述典型散点位置包括:动力设备机架、动力设备通风口、温度调节设备出风口、机房配电柜;
根据各典型散点位置所对应的环境属性匹配对应的待安装传感器类型,以基于所述典型散点位置与各所述待安装传感器类型的匹配关系布设预置传感器。
可选地,在本说明书一个或多个实施例中,根据所述待监控机房中各所述动力设备,响应于预置监控服务器监控指令的数据传输时间,确定所述待监控机房的第一响应时间与第一响应时间,具体包括:
基于与所述待监控机房相对应的设备数据库调用各所述动力设备的相关故障信息;
根据所述相关故障信息确定各所述动力设备响应于预置监控服务器监控指令的数据传输时间;
将所述待监控机房中各所述动力设备的数据传输时间进行排序,以获取最大数据传输时间,基于所述最大数据传输时间与预设冗余时间生成所述待监控机房中各所述动力设备的响应周期;
将所述响应周期划分为第一响应时间与第一响应时间;所述第一响应时间用于所述动力设备根据所述预置监控服务器的监控指令回传告警信息,所述第二响应时间用于所述动力设备自主向所述预置监控服务器回传告警信息。
可选地,在本说明书一个或多个实施例中,获取所述动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取所述回传相关信息和所述第一运行环境数据中的故障特征,根据所述故障特征确定所述待监控机房中各动力设备的第一故障告警类型,具体包括:
根据预置监控服务器的监控指令,控制所述动力设备基于预设接口查询回传相关信息,并基于所述预置传感器获取所述动力设备在第一响应时间内的第一运行环境数据;
对所述回传相关信息与所述第一运行环境数据进行归一化处理,获得待提取数据;
将所述待提取数据基于预设映射函数,映射到对应的高维特征空间获得所述待提取数据的特征空间数据矩阵;其中,所述预设映射函数为非线性高斯径向基函数;
根据最大方差理论生成所述特征空间数据矩阵获得协方差矩阵,以确定与所述协方差矩阵相对应的雅克比矩阵,并根据所述雅克比矩阵进行特征值分解获得所述待提取数据的特征值以及与所述特征值相对应的特征向量;
根据所述待提取数据的特征值的数值大小进行排序,以提取预设数量的特征值以及与所述特征值相对应的特征向量作为所述回传相关信息和所述第一运行环境数据中的故障特征;
根据选定的故障特征中心对所述故障特征进行迭代聚类,确定所述待监控机房中各动力设备的第一故障告警类型。
可选地,在本说明书一个或多个实施例中,根据选定的故障特征中心对所述故障特征进行迭代聚类,确定所述待监控机房中各动力设备的第一故障告警类型,具体包括:
根据各所述故障特征与所述故障特征中心之间的距离,确定各所述故障特征与所述故障特征中心之间的相似度;
基于所述相似度将各所述故障特征进行集合划分,获得多个故障中心的聚类簇;
获取各所述聚类簇中故障特征的平均值,以确定各所述聚类簇的更新故障特征中心;
若所述更新故障特征中心与所述故障特征中心相对应,则基于各所述故障特征中心所对应的聚类簇确定所述待监控机房中各动力设备的第一故障告警类型。
可选地,在本说明书一个或多个实施例中,获取与所述第一故障告警类型相对应的第一告警参数,以基于所述第一告警参数生成第一告警信息传输给所述预置监控服务器,具体包括:
根据预置故障因果树,确定与所述第一故障告警类型相对应的告警参数名称,以基于所述告警参数名称获取与所述第一故障告警类型相对应的第一告警参数;其中,所述预置故障因果树中存储有与各故障告警类型相对应的告警参数名称;
根据所述第一告警参数中各参数的数值确定对应的第一告警等级,以基于所述第一告警等级、所述第一故障告警类型与所述第一告警参数生成第一告警信息,并将所述第一告警信息加入等待消息队列中;
若基于所述第一告警信息,确定所述第一告警等级小于等于所述等待消息队列中的前序告警信息,则所述第一告警信息在所述第一响应时间内等待传输;
若基于所述第一告警信息,确定所述第一告警等级大于所述等待消息队列中的前序告警信息,则移动所述第一告警信息到对应的位置,确定所述第一告警信息当前的前序告警信息;
基于所述当前的前序告警信息的数据传输长度与数据传输速度,确定所述第一告警信息的传输开始时间,以基于所述传输开始时间将所述第一告警信息传输给所述预置监控服务器。
可选地,在本说明书一个或多个实施例中,在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型,以基于预测结果确定是否生成第二告警信息传输给所述预置监控服务器,具体包括:
在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型;
通过所述预置故障预测模型的滑动窗口对所述运行日志数据以及所述第二运行环境数据进行扫描,获得多个故障特征向量;
根据预设随机森林的决策树对所述多个故障特征向量进行分类,获得多个故障特征类向量,并根据所述滑动窗口对所述多个故障特征类向量进行扫描,获得多维度特征向量;
根据所述预置故障预测模型中的多层级联随机森联对所述多维度特征向量进行预测获得预测结果;
若基于所述预测结果确定所述动力设备不存在故障,则确定不生成第二告警信息;
若基于所述预测结果确定所述动力设备存在故障,则根据所述故障结果确定第二故障告警类型,以基于所述第二故障告警类型生成第二告警信息传输给所述预置监控服务器。
本说明书一个或多个实施例提供一种监控机房动力设备的设备,设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。
本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述可执行指令被计算机执行,以使计算机能够执行上述方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过将响应时间拆分为监控服务器获取告警信息的第一响应时间与动力设备主动上传告警信息的第二响应时间,使得第一响应时间内监控服务器基于指令获取动力设备的告警信息,在第二响应时间内动力设备能够主动上传告警信息,实现监控服务器获取与动力设备主动上传相结合。解决了监控服务器的故障监控指令可能无法及时更新时,所导致的存在故障的动力设备不能及时接收到相应类型的监控指令,使得动力设备故障遗漏的问题,提高了动力设备监控的可靠性。同时在第一响应时间内动力设备根据主成分分析算法提取故障特征,实现了对于主要故障特征的提取实现了数据降维,降低了后续的计算成本。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本说明书实施例提供的一种监控机房动力设备的方法流程示意图;
图2为本说明书实施例提供的一种监控机房动力设备的设备内部结构示意图;
图3为本说明书实施例提供的一种非易失性存储介质的内部结构示意图。
具体实施方式
本说明书实施例提供一种监控机房动力设备的方法、设备及介质。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
如图1所示,本说明书实施例提供了一种监控机房动力设备的方法流程示意图。由图1可知,在本说明书一个或多个实施例中,一种监控机房动力设备的方法,包括以下步骤:
S101:基于待监控机房中预置传感器,获取所述待监控机房中各动力设备的运行环境数据。
为了保证动力设备的正常运行,避免动力设备由于温度、湿度等环境因素导致故障的问题。本说明书实施例中,通过待监控机房中预先设置的多种类型的传感器,对待监控机房中各个动力设备的多种环境数据进行采集获得运行环境数据,通过对于运行环境数据的实时监控,能够及时确定当前环运行环境中超过预设阈值的数据,方便进行后续的分析与处理。
进一步地,在本说明书一个或多个实施例中,根据待监控机房中预先设置的多类型传感器,获取到待监控机房中各动力设备的运行环境数据,具体包括以下步骤:
首先,根据各预置传感器的有效检测范围,确定出各个预置传感器有效检测范围下所覆盖的动力设备。然后判断各个预置传感器所覆盖的动力设备中,该动力设备是否同时还存在于预置传感器同类型传感器的有效检测范围下。即A类型传感器1覆盖范围包括:动力设备1、动力设备2、动力设备3,A类型传感器2覆盖范围包括:动力设备3、动力设备4、动力设备5。那么动力设备位于A类型传感器1的有效检测范围下,且存在于和A类型传感器1同类型传感器A类型传感器2的有效检测范围下。如果动力设备存在有同类型的多个传感器,那么根据预置传感器的位置和覆盖的动力设备的位置,确定出预置传感器和所覆盖的动力设备之间的第一距离数据,并根据同类型传感器的位置与所覆盖的动力设备的位置,确定出同类型传感器和覆盖的动力设备之间的第二距离数据。然后根据第一距离数据和第二距离数据的倒数,分别确定出预置传感器与同类型传感器的第一权重值与第二权重值,并分别基于预置传感器与同类型传感器的检测精度确定出预置传感器和同类型传感器的第三权重值与第四权重值。然后根据第一权重值和第三权重值的乘积确定出预置传感器的权重值,同时,根据第二权重值与第四权重值的乘积确定出同类型传感器的权重值。对于预置传感器的权重值与同类型传感器的权重值,对比确定权重值高的传感器作为和覆盖的动力设备相匹配的传感器,从而根据该相匹配的传感器对运行环境数据进行采集与后续处理。
进一步地,为了提高传感器采集数据的可靠性,需要将传感器安置在对应的位置上。因此,在本说明书一个或多个实施例中,基于待监控机房中预置多类型传感器,获取待监控机房中各动力设备的运行环境数据之前,方法还包括以下步骤:
首先,获取待监控机房的地理位置,从而确定出待监控机房的基本气候变化信息。然后根据获得的基本气候变化信息,确定出待监控机房在该地理位置线所对应的易变环境参数。其中,需要说明的是易变环境参数包括:温度、湿度、灰尘等。根据获得的易变环境参数以及待监控机房的预置安全防护规则例如:火灾防护规则等,确定出待监控机房的待安装传感器类型。然后根据各动力设备的位置信息确定出待监控机房的典型散点位置。其中,需要说明的是典型散点位置包括:动力设备机架、动力设备通风口、温度调节设备出风口、机房配电柜等易出现环境数据变化的位置以及重点监测对象的位置。然后根据各个典型散点位置所对应的环境属性,将待安装传感器类型匹配对应到对应的位置中,从而根据典型散点位置与各待安装传感器类型的匹配关系安装布设预置传感器进行后续运行环境数据的采集。
S102:根据各所述动力设备响应于预置监控服务器监控指令的数据传输时间,确定所述待监控机房的第一响应时间与第一响应时间;其中,所述预置监控服务器用于监控所述待监控机房中各所述动力设备的运行状态。
由于现有的监控服务器主导动力设备进行故障信息上传方式,需要监控服务器对动力设备下发监控指令后,由动力设备响应监控指令采集响应的数据返回服务器,基于该过程一是服务器需要进行大量的处理工作,导致计算内存过高的问题,二是监控服务器的故障监控指令可能无法及时更新,从而导致存在故障的动力设备未接收到相应类型的监控指令,导致动力设备故障遗漏的问题。因此,为了避免上述问题,本说明书实施例中,根据各动力设备响应于预置监控服务器监控指令的数据传输时间,确定出待监控机房的第一响应时间与第一响应时间。其中,需要说明的是,预置监控服务器用于监控待监控机房中各个动力设备的运行状态。
具体地,在本说明书一个或多个实施例中,根据待监控机房中各动力设备,响应于预置监控服务器监控指令的数据传输时间,确定待监控机房的第一响应时间与第一响应时间,具体包括以下步骤:
首先根据与待监控机房相对应的设备数据库调用各动力设备的相关故障信息。然后,根据相关故障信息确定出各动力设备响应于预置监控服务器监控指令的数据传输时间。然后把待监控机房中各个动力设备的数据传输时间进行排序,从而获取待监控机房里各个设备的最大数据传输时间。例如:动力设备的数据发送时间为150μs,传输时间为12μs,那其数据传输时间为发送时间与传输时间的总和即162μs。假设待监控机房中动力设备1对应的数据传输时间为162μs,动力设备2对应的数据传输时间为160μs,动力设备3对应的数据传输时间为170μs,动力设备4对应的数据传输时间为143μs,那么此时待监控机房中设备的最大数据传输时间为170μs。根据上述获得的最大数据传输时间以及预先设置的冗余时间,生成待监控机房中各个动力设备的响应周期,从而将该响应周期平均划分为第一响应时间与第一响应时间。其中,需要说明的是,第一响应时间是用来使动力设备根据预置监控服务器的监控指令回传告警信息的,第二响应时间是用来使动力设备自主向预置监控服务器上传相应告警信息的。通过将响应时间拆分为监控服务器获取告警信息与动力设备主动上传告警信息,解决了监控服务器的故障监控指令可能无法及时更新时,所导致的存在故障的动力设备不能及时接收到相应类型的监控指令,使得动力设备故障遗漏的问题,提高了动力设备监控的可靠性。
S103:在第一响应时间内,获取所述动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取所述回传相关信息和所述第一运行环境数据中的故障特征,根据所述故障特征确定所述待监控机房中各动力设备的第一故障告警类型。
通过上述步骤S102实现对于第一响应时间和第二响应时间的划分之后,为了解决现有故障检测基于监控服务器进行集中检测时,在动力设备过多的场景下将耗费大量计算内存导致故障检测效率较低的问题。本说明书实施例中在第一响应时间内,获取动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息。从而根据主成分分析算法提取回传相关信息和第一运行环境数据中的故障特征,进而根据提取出的故障特征确定待监控机房中各动力设备的第一故障告警类型。根据主成分分析算法提取故障特征,实现了对于主要故障特征的提取实现了数据降维,降低了后续的计算成本。
具体地,在本说明书一个或多个实施例中,获取动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取回传相关信息和第一运行环境数据中的故障特征,根据故障特征确定待监控机房中各动力设备的第一故障告警类型,具体包括以下过程:
首先,根据预置监控服务器将监控指令在第一响应时间发送到各个动力设备上,从而使得各个动力设备能够根据预先设置的接口查询与监控指令相对应的回传相关信息,同时根据预先设置的传感器,获取动力设备在第一响应时间内的第一运行环境数据。对回传相关信息与第一运行环境数据进行归一化处理,从而获得待提取数据。然后把待提取数据根据预先设置的映射函数,映射到对应的高维特征空间获得待提取数据的特征空间数据矩阵。其中,需要说明的是预设映射函数为非线性高斯径向基函数。然后根据最大方差理论生成特征空间数据矩阵获得协方差矩阵,从而确定出和协方差矩阵相对应的雅克比矩阵,并根据该雅克比矩阵进行特征值分解从而获得待提取数据的特征值以及与特征值相对应的特征向量。其中,需要说明的是:基于最大方差理论获取协方差矩阵的过程为现有技术,此处不对其进行进一步解释。在提取出特征值后,根据待提取数据的特征值的数值大小进行排序,从而由大到小在各个特征值中,提取出预置数量的特征值。然后获得与提取出的预设数据的特征值中各个特征值相对应的特征向量,将其作为回传相关信息和第一运行环境数据中的故障特征。为了基于故障特征确定故障类型,本说明书实施例中根据选定的故障特征中心对故障特征进行迭代聚类,确定出待监控机房中各动力设备的第一故障告警类型。
具体地,在本说明书一个或多个实施例中,根据选定的故障特征中心对故障特征进行迭代聚类,确定出待监控机房中各动力设备的第一故障告警类型,具体包括以下步骤:
首先,根据各故障特征与故障特征中心之间的距离,确定出各故障特征与故障特征中心之间的相似度。可以理解的是距离越近则相似度越高,反之距离越远则相似度越低。然后根据确定出的相似度将各故障特征进行集合划分,从而获得多个故障中心的聚类簇。然后获取各聚类簇中故障特征的平均值,以确定出各个聚类簇的更新故障特征中心。通过不断迭代更新故障特征中心,如果更新故障特征中心与上一次的故障特征中心相对应,那么根据各故障特征中心所对应的聚类簇,则根据各个聚类簇的类型汇总确定出待监控机房中各动力设备的第一故障告警类型。
S104:获取与所述第一故障告警类型相对应的第一告警参数,以基于所述第一告警参数生成第一告警信息传输给所述预置监控服务器。
基于上述步骤S103确定第一故障告警类型之后,本说明书实施例中获取和第一故障告警类型相对应的第一告警参数,从而根据第一告警参数生成第一告警信息传输给预先设置的监控服务器。具体地,获取与第一故障告警类型相对应的第一告警参数,从而根据第一告警参数生成第一告警信息传输给所述预置监控服务器,具体包括以下过程:
首先根据预先设置的故障因果树,确定出与第一故障告警类型相对应的告警参数名称,从而根据告警参数名称获取和第一故障告警类型相对应的第一告警参数。其中,需要说明的是预先设置的故障因果树中存储有和各个故障告警类型相对应的告警参数名称。然后根据第一告警参数中各个参数的数值确定出当前动力设备的第一故障告警类型所对应的第一告警等级,从而将第一告警等级、第一故障告警类型和上述的第一告警参数写入到预置回传信息模板中生成第一告警信息,从而将第一告警信息加入等待消息队列中等待传输到监控服务器中。如果根据第一告警信息,确定出第一告警等级小于等于等待消息队列中的其他前序告警信息,那么第一告警信息在第一响应时间内等待传输。反之如果根据第一告警信息,确定出第一告警等级大于等待消息队列中的前序告警信息,那么就移动该第一告警信息到对应的位置上,确定出第一告警信息当前的前序告警信息。然后根据当前的前序告警信息的数据传输长度与数据传输速度,确定第一告警信息的传输开始时间,进而基于传输开始时间将第一告警信息传输给预置监控服务器。
S105:在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型,以基于预测结果确定是否生成第二告警信息传输给所述预置监控服务器。
为了解决监控服务器的故障监控指令可能无法及时更新时,所导致的部分存在故障的动力设备不能及时接收到相应类型的监控指令,使得动力设备发送故障信息未及时上报的问题。本说明书实施例中,在第二响应时间内,获取动力设备的第二运行环境数据与运行日志数据,从而将运行日志数据以及第二运行环境数据输入到预先设置的故障预测模型中,从而根据预测结果确定是否生成第二告警信息传输给预置监控服务器。通过动力设备在第二响应时间内主动上传,减少了动力设备故障信息遗漏的问题,提高了动力设备监控的可靠性。具体地,在本说明书一个或多个实施例中,在第二响应时间内,获取动力设备的第二运行环境数据与运行日志数据,将运行日志数据以及第二运行环境数据输入预置故障预测模型,从而根据预测结果确定是否生成第二告警信息传输给所述预置监控服务器,具体包括以下步骤:
在第二响应时间内,获取动力设备的第二运行环境数据与运行日志数据,从而将运行日志数据以及第二运行环境数据输入到预先设置的故障预测模型中。通过预先设置的故障预测模型的滑动窗口,对运行日志数据以及第二运行环境数据进行滑动扫描,从而获得多个故障特征向量。然后根据预先设置的随机森林的决策树对多个故障特征向量进行分类,获得多个故障特征类向量。然后再根据滑动窗口对多个故障特征类向量进行扫描,获得多维度特征向量。根据预置故障预测模型中的多层级联随机森联,对多维度特征向量进行预测获得预测结果。如果根据预测结果可以确定动力设备不存在故障,那么不生成第二告警信息,即动力设备在第二响应时间内不进行数据传输。如果根据上述获得的预测结果确定动力设备中存在故障,那么就根据预测的故障结果确定出动力设备的第二故障告警类型,根据与上述步骤S104记载的基于第一故障告警类型生成第一告警信息的相同步骤基于所述第二故障告警类型生成第二告警信息传输给所述预置监控服务器。
如图2所示,本说明书一个或多个实施例中提供了一种监控机房动力设备的设备,设备包括:至少一个处理器201;以及,与所述至少一个处理器201通信连接的存储器202;其中,所述存储器202存储有可被所述至少一个处理器201执行的指令,所述指令被所述至少一个处理器201执行,以使所述至少一个处理器201能够执行上述方法实施例。
如图3所示,本说明书实施例提供了一种非易失性存储介质,存储有计算机可执行指令301,所述可执行指令被计算机301执行,以使计算机能够执行上述方法实施例。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,应当理解的是,本说明书以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种监控机房动力设备的方法,其特征在于,所述方法包括:
基于待监控机房中预置传感器,获取所述待监控机房中各动力设备的运行环境数据;
根据各所述动力设备响应于预置监控服务器监控指令的数据传输时间,确定所述待监控机房的第一响应时间与第一响应时间;其中,所述预置监控服务器用于监控所述待监控机房中各所述动力设备的运行状态;
在第一响应时间内,获取所述动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取所述回传相关信息和所述第一运行环境数据中的故障特征,根据所述故障特征确定所述待监控机房中各动力设备的第一故障告警类型;
获取与所述第一故障告警类型相对应的第一告警参数,以基于所述第一告警参数生成第一告警信息传输给所述预置监控服务器;
在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型,以基于预测结果确定是否生成第二告警信息传输给所述预置监控服务器。
2.根据权利要求1所述的一种监控机房动力设备的方法,其特征在于,所述基于待监控机房中预置多类型传感器,获取所述待监控机房中各动力设备的运行环境数据,具体包括:
根据各所述预置传感器的有效检测范围,确定所述有效检测范围下所覆盖的动力设备;
判断所述覆盖的动力设备是否存在于同类型传感器的有效检测范围下;
若是,则基于所述预置传感器的位置与所述覆盖的动力设备的位置,确定第一距离数据,并基于所述同类型传感器的位置与所述覆盖的动力设备的位置,确定第二距离数据;
根据所述第一距离数据与所述第二距离数据的倒数,分别确定所述预置传感器与所述同类型传感器的第一权重值与第二权重值,并分别基于所述预置传感器与所述同类型传感器的检测精度确定所述预置传感器与所述同类型传感器的第三权重值与第四权重值;
基于所述第一权重值与所述第三权重值的乘积确定所述预置传感器的权重值,并基于所述第二权重值与所述第四权重值的乘积确定所述同类型传感器的权重值;
对于所述预置传感器的权重值与所述同类型传感器的权重值,确定与所述覆盖的动力设备相匹配的传感器,以基于所述相匹配的传感器采集获得运行环境数据。
3.根据权利要求1所述的一种监控机房动力设备的方法,其特征在于,所述基于待监控机房中预置多类型传感器,获取所述待监控机房中各动力设备的运行环境数据之前,所述方法还包括:
获取待监控机房的地理位置,以确定所述待监控机房的基本气候变化信息,并基于所述基本气候变化信息,确定所述待监控机房的易变环境参数;其中,所述易变环境参数包括:温度、湿度、灰尘;
根据所述易变环境参数以及所述待监控机房的预置安全防护规则,确定所述待监控机房的待安装传感器类型;
根据各动力设备的位置信息确定所述待监控机房的典型散点位置;其中,所述典型散点位置包括:动力设备机架、动力设备通风口、温度调节设备出风口、机房配电柜;
根据各典型散点位置所对应的环境属性匹配对应的待安装传感器类型,以基于所述典型散点位置与各所述待安装传感器类型的匹配关系布设预置传感器。
4.根据权利要求1所述的一种监控机房动力设备的方法,其特征在于,所述根据所述待监控机房中各所述动力设备,响应于预置监控服务器监控指令的数据传输时间,确定所述待监控机房的第一响应时间与第一响应时间,具体包括:
基于与所述待监控机房相对应的设备数据库调用各所述动力设备的相关故障信息;
根据所述相关故障信息确定各所述动力设备响应于预置监控服务器监控指令的数据传输时间;
将所述待监控机房中各所述动力设备的数据传输时间进行排序,以获取最大数据传输时间,基于所述最大数据传输时间与预设冗余时间生成所述待监控机房中各所述动力设备的响应周期;
将所述响应周期划分为第一响应时间与第一响应时间;所述第一响应时间用于所述动力设备根据所述预置监控服务器的监控指令回传告警信息,所述第二响应时间用于所述动力设备自主向所述预置监控服务器回传告警信息。
5.根据权利要求1所述的一种监控机房动力设备的方法,其特征在于,所述获取所述动力设备的第一运行环境数据,以及根据预置监控服务器的监控指令采集的回传相关信息,并基于主成分分析算法提取所述回传相关信息和所述第一运行环境数据中的故障特征,根据所述故障特征确定所述待监控机房中各动力设备的第一故障告警类型,具体包括:
根据预置监控服务器的监控指令,控制所述动力设备基于预设接口查询回传相关信息,并基于所述预置传感器获取所述动力设备在第一响应时间内的第一运行环境数据;
对所述回传相关信息与所述第一运行环境数据进行归一化处理,获得待提取数据;
将所述待提取数据基于预设映射函数,映射到对应的高维特征空间获得所述待提取数据的特征空间数据矩阵;其中,所述预设映射函数为非线性高斯径向基函数;
根据最大方差理论生成所述特征空间数据矩阵获得协方差矩阵,以确定与所述协方差矩阵相对应的雅克比矩阵,并根据所述雅克比矩阵进行特征值分解获得所述待提取数据的特征值以及与所述特征值相对应的特征向量;
根据所述待提取数据的特征值的数值大小进行排序,以提取预设数量的特征值以及与所述特征值相对应的特征向量作为所述回传相关信息和所述第一运行环境数据中的故障特征;
根据选定的故障特征中心对所述故障特征进行迭代聚类,确定所述待监控机房中各动力设备的第一故障告警类型。
6.根据权利要求5所述的一种监控机房动力设备的方法,其特征在于,所述根据选定的故障特征中心对所述故障特征进行迭代聚类,确定所述待监控机房中各动力设备的第一故障告警类型,具体包括:
根据各所述故障特征与所述故障特征中心之间的距离,确定各所述故障特征与所述故障特征中心之间的相似度;
基于所述相似度将各所述故障特征进行集合划分,获得多个故障中心的聚类簇;
获取各所述聚类簇中故障特征的平均值,以确定各所述聚类簇的更新故障特征中心;
若所述更新故障特征中心与所述故障特征中心相对应,则基于各所述故障特征中心所对应的聚类簇确定所述待监控机房中各动力设备的第一故障告警类型。
7.根据权利要求1所述的一种监控机房动力设备的方法,其特征在于,所述获取与所述第一故障告警类型相对应的第一告警参数,以基于所述第一告警参数生成第一告警信息传输给所述预置监控服务器,具体包括:
根据预置故障因果树,确定与所述第一故障告警类型相对应的告警参数名称,以基于所述告警参数名称获取与所述第一故障告警类型相对应的第一告警参数;其中,所述预置故障因果树中存储有与各故障告警类型相对应的告警参数名称;
根据所述第一告警参数中各参数的数值确定对应的第一告警等级,以基于所述第一告警等级、所述第一故障告警类型与所述第一告警参数生成第一告警信息,并将所述第一告警信息加入等待消息队列中;
若基于所述第一告警信息,确定所述第一告警等级小于等于所述等待消息队列中的前序告警信息,则所述第一告警信息在所述第一响应时间内等待传输;
若基于所述第一告警信息,确定所述第一告警等级大于所述等待消息队列中的前序告警信息,则移动所述第一告警信息到对应的位置,确定所述第一告警信息当前的前序告警信息;
基于所述当前的前序告警信息的数据传输长度与数据传输速度,确定所述第一告警信息的传输开始时间,以基于所述传输开始时间将所述第一告警信息传输给所述预置监控服务器。
8.根据权利要求1所述的一种监控机房动力设备的方法,其特征在于,所述在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型,以基于预测结果确定是否生成第二告警信息传输给所述预置监控服务器,具体包括:
在第二响应时间内,获取所述动力设备的第二运行环境数据与运行日志数据,将所述运行日志数据以及所述第二运行环境数据输入预置故障预测模型;
通过所述预置故障预测模型的滑动窗口对所述运行日志数据以及所述第二运行环境数据进行扫描,获得多个故障特征向量;
根据预设随机森林的决策树对所述多个故障特征向量进行分类,获得多个故障特征类向量,并根据所述滑动窗口对所述多个故障特征类向量进行扫描,获得多维度特征向量;
根据所述预置故障预测模型中的多层级联随机森联对所述多维度特征向量进行预测获得预测结果;
若基于所述预测结果确定所述动力设备不存在故障,则确定不生成第二告警信息;
若基于所述预测结果确定所述动力设备存在故障,则根据所述故障结果确定第二故障告警类型,以基于所述第二故障告警类型生成第二告警信息传输给所述预置监控服务器。
9.一种监控机房动力设备的设备,其特征在于,所述设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述权利要求1-8任一所述的方法。
10.一种非易失性存储介质,存储有计算机可执行指令,其特征在于,所述可执行指令被计算机执行,以使计算机能够执行上述权利要求1-8任一所述的方法。
CN202310361180.5A 2023-04-07 2023-04-07 一种监控机房动力设备的方法、设备及介质 Active CN116071902B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310361180.5A CN116071902B (zh) 2023-04-07 2023-04-07 一种监控机房动力设备的方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310361180.5A CN116071902B (zh) 2023-04-07 2023-04-07 一种监控机房动力设备的方法、设备及介质

Publications (2)

Publication Number Publication Date
CN116071902A true CN116071902A (zh) 2023-05-05
CN116071902B CN116071902B (zh) 2023-06-13

Family

ID=86170137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310361180.5A Active CN116071902B (zh) 2023-04-07 2023-04-07 一种监控机房动力设备的方法、设备及介质

Country Status (1)

Country Link
CN (1) CN116071902B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117155761A (zh) * 2023-11-01 2023-12-01 睿至科技集团有限公司 一种基于智能动环监控管理平台的告警方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120073491A (ko) * 2010-12-27 2012-07-05 주식회사 어니언소프트웨어 인터넷 데이터 센터에서의 항온항습기 운전 최적화 방법
CN110815224A (zh) * 2019-11-14 2020-02-21 华南智能机器人创新研究院 一种机器人的远程故障诊断推送方法及装置
CN112395170A (zh) * 2020-12-07 2021-02-23 平安普惠企业管理有限公司 智能故障分析方法、装置、设备及存储介质
CN112685195A (zh) * 2020-12-21 2021-04-20 交控科技股份有限公司 基于微服务技术的无人值守机房管理方法、服务器和系统
CN113359637A (zh) * 2021-06-22 2021-09-07 中国环境监测总站 一种基于站房运行环境和设备运行状态的数据质量保障系统及方法
CN114995169A (zh) * 2022-05-05 2022-09-02 张昕 一种动力机房综合管控系统及其监控方法
CN115437358A (zh) * 2022-10-27 2022-12-06 中国人民解放军陆军装甲兵学院 工业机器人智能状态监测与故障诊断系统及故障诊断方法
CN115544445A (zh) * 2022-09-22 2022-12-30 南京津码智能科技有限公司 一种电力设备异常事故统计分析方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120073491A (ko) * 2010-12-27 2012-07-05 주식회사 어니언소프트웨어 인터넷 데이터 센터에서의 항온항습기 운전 최적화 방법
CN110815224A (zh) * 2019-11-14 2020-02-21 华南智能机器人创新研究院 一种机器人的远程故障诊断推送方法及装置
CN112395170A (zh) * 2020-12-07 2021-02-23 平安普惠企业管理有限公司 智能故障分析方法、装置、设备及存储介质
CN112685195A (zh) * 2020-12-21 2021-04-20 交控科技股份有限公司 基于微服务技术的无人值守机房管理方法、服务器和系统
CN113359637A (zh) * 2021-06-22 2021-09-07 中国环境监测总站 一种基于站房运行环境和设备运行状态的数据质量保障系统及方法
CN114995169A (zh) * 2022-05-05 2022-09-02 张昕 一种动力机房综合管控系统及其监控方法
CN115544445A (zh) * 2022-09-22 2022-12-30 南京津码智能科技有限公司 一种电力设备异常事故统计分析方法
CN115437358A (zh) * 2022-10-27 2022-12-06 中国人民解放军陆军装甲兵学院 工业机器人智能状态监测与故障诊断系统及故障诊断方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117155761A (zh) * 2023-11-01 2023-12-01 睿至科技集团有限公司 一种基于智能动环监控管理平台的告警方法及系统

Also Published As

Publication number Publication date
CN116071902B (zh) 2023-06-13

Similar Documents

Publication Publication Date Title
CN110493025B (zh) 一种基于多层有向图的故障根因诊断的方法及装置
CN114282434A (zh) 一种工业设备健康管理系统及方法
CN111176879A (zh) 设备的故障修复方法及装置
US10444746B2 (en) Method for managing subsystems of a process plant using a distributed control system
US20160282847A1 (en) System and method for asset fleet monitoring and predictive diagnostics using analytics for large and varied data sources
CN116071902B (zh) 一种监控机房动力设备的方法、设备及介质
US9208677B2 (en) Systems and methods for process alarm reduction
CN113641526B (zh) 告警根因定位方法、装置、电子设备及计算机存储介质
CN114443437A (zh) 告警根因输出方法、装置、设备、介质和程序产品
CN117113135A (zh) 一种可对异常数据整理分类的碳排放异常监测分析系统
CN113472881B (zh) 在线终端设备的统计方法和装置
CN112737120B (zh) 区域电网控制报告的生成方法、装置和计算机设备
CN115964883A (zh) 一种无人艇的状态监测与维修保障系统
CN113570473B (zh) 设备故障监测方法、装置、计算机设备和存储介质
CN112101422B (zh) 电力系统故障案例的典型案例自学习方法
CN114356900A (zh) 一种电力数据异常检测方法、装置、设备及介质
CN117391675B (zh) 一种数据中心基础设施运维管理方法
US20230034061A1 (en) Method for managing proper operation of base station and system applying the method
CN112600705A (zh) 一种网络设备自动化运维的方法
CN113553352A (zh) 一种电力二次设备家族性缺陷辨识方法及系统
CN116541717A (zh) 一种基于云计算和深度学习的大数据分析方法
CN117391675A (zh) 一种数据中心基础设施运维管理方法
CN117171176A (zh) 一种基于人工智能的用电大数据自升级监管平台
CN116701039A (zh) 数据处理方法、装置和电子设备
CN115909203A (zh) 建筑施工安全全景监控系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant