CN117216702A - 变电设备参数处理方法、装置及电子设备 - Google Patents

变电设备参数处理方法、装置及电子设备 Download PDF

Info

Publication number
CN117216702A
CN117216702A CN202311215066.8A CN202311215066A CN117216702A CN 117216702 A CN117216702 A CN 117216702A CN 202311215066 A CN202311215066 A CN 202311215066A CN 117216702 A CN117216702 A CN 117216702A
Authority
CN
China
Prior art keywords
parameter data
data
clusters
parameter
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311215066.8A
Other languages
English (en)
Inventor
张潇
丁建武
黄楠
曹玲玲
纪利军
李多娇
解晓东
衣书伟
赵璧
董光哲
闫付乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Beijing Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202311215066.8A priority Critical patent/CN117216702A/zh
Publication of CN117216702A publication Critical patent/CN117216702A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种变电设备参数处理方法、装置及电子设备。涉及电力设备检测技术领域,该方法包括:获取变电设备的目标数据集,其中,目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;对目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;基于N个簇中分别包括的参数数据,确定N个簇分别对应的平均值和标准差;基于N个簇分别对应的平均值和标准差,确定异常参数数据。本发明解决了相关技术中变电设备参数处理方法考虑因素不全面,导致确定异常参数数据的准确性低的技术问题。

Description

变电设备参数处理方法、装置及电子设备
技术领域
本发明涉及电力设备检测技术领域,具体而言,涉及一种变电设备参数处理方法、装置及电子设备。
背景技术
在传统的变电设备参数处理方法中,常常存在一个关键问题,即可能会忽略一些潜在的异常情况,从而导致问题没有被及时发现或者甚至误报正常情况。这主要源于传统方法通常只能从有限的角度对设备参数进行处理,难以全面捕捉异常的多样性。例如,某些异常可能在多个参数的交互作用下才会显现,然而传统方法可能仅仅关注其中一个参数,从而错过了异常的全貌。
针对相关技术中变电设备参数处理方法考虑因素不全面,导致确定异常参数数据的准确性低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种变电设备参数处理方法、装置及电子设备,以至少解决相关技术中变电设备参数处理方法考虑因素不全面,导致确定异常参数数据的准确性低的技术问题。
根据本发明实施例的一个方面,提供了一种变电设备参数处理方法,包括:获取变电设备的目标数据集,其中,所述目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;对所述目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;基于所述N个簇中分别包括的参数数据,确定所述N个簇分别对应的平均值和标准差;基于所述N个簇分别对应的平均值和标准差,确定异常参数数据。
根据本发明实施例的另一方面,还提供了一种变电设备参数处理装置,包括:第一获取模块,用于获取变电设备的目标数据集,其中,所述目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;第一聚类模块,用于对所述目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;第一确定模块,用于基于所述N个簇中分别包括的参数数据,确定所述N个簇分别对应的平均值和标准差;第二确定模块,用于基于所述N个簇分别对应的平均值和标准差,确定异常参数数据。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现任意一项所述的变电设备参数处理方法。
在本发明实施例中,通过获取变电设备的目标数据集,其中,所述目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;对所述目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;基于所述N个簇中分别包括的参数数据,确定所述N个簇分别对应的平均值和标准差;基于所述N个簇分别对应的平均值和标准差,确定异常参数数据,达到了基于目标参数数据对应的平均值和标准差,准确确定异常参数数据的目的,从而实现了提升变电设备参数处理方法的准确性的技术效果,进而解决了相关技术中变电设备参数处理方法考虑因素不全面,导致确定异常参数数据的准确性低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种变电设备参数处理方法的示意图;
图2是根据本发明实施例的一种变电设备参数处理装置的示意图;
图3是根据本申请实施例提供的电子设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种变电设备参数处理的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的变电设备参数处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取变电设备的目标数据集,其中,目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的。
可选的,变电设备包括输变电设备和配变电设备,其中,输变电设备:主要用于将发电厂产生的高电压电能经过变压器进行变压和输送,将电能从发电厂送往不同地区的变电站。配变电设备:主要用于将输电线路传送来的电能进行进一步的变压和分配,将电能输送到终端用户。输变电设备以及配变电设备是电力系统中的重要组成部分,用于电能的传输、变压、分配和控制,对于保障电力系统的安全、稳定和高效运行具有关键作用。变电设备的相关参数数据包括电流、电压、温度、湿度等,这些参数数据可以从传感器、监测系统或设备控制系统中获取。
在一种可选的实施例中,获取变电设备的目标数据集,包括:获取变电设备的初始数据集,其中,初始数据集中包括多个采样时刻分别采集到的初始参数数据;对初始数据集中包括的参数数据进行第一数据预处理,得到第一数据集,其中,第一数据预处理包括以下至少之一:缺失值处理、异常值处理;对第一数据集中包括的参数数据进行筛选处理,得到第二数据集,其中,筛选处理用于确定出与变电设备状态和性能相关的参数数据;对第二数据集中包括的参数数据进行第二数据预处理,得到目标数据集,其中,第二数据预处理包括以下至少之一:数据标准化处理、数据归一化处理、数据转换处理。
可选的,获取变电设备的初始数据集,由于初始数据集中包括的参数数据可能出现缺失值,因此可以通过填充、删除或插值等方法来处理缺失值。由于初始数据集中包括的参数数据可能出现异常值,其中,异常值可能是由传感器故障、数据采集错误等引起的。这些异常值可能会对后续分析产生负面影响。因此,可以采用统计方法(例如Z分数或箱线图)识别并处理异常值,可以选择剔除、修复或标记这些异常值。初始数据集中包括的参数数据经第一数据预处理操作后,得到第一数据集,对第一数据集中包括的参数数据进行筛选处理,选择与变电设备状态和性能相关的特征,可以帮助减少维度并消除不相关的信息,从而提高后续分析的效率和准确性。可以使用特征选择方法,如相关性分析、方差分析、互信息等,来确定哪些特征与目标最相关。在特征选择的基础上,可以进一步筛选出对变电设备状态和性能影响最大的特征。可以通过领域知识、特征重要性排名(如随机森林的特征重要性)或基于模型的方法(如递归特征消除)来完成,在特征选择及特征筛选的基础上,可以根据特定问题的需求,创建新的特征来捕获数据之间的关系。例如,可以基于电流和电压计算功率因数,从而引入更多的信息。对第一数据集中包括的参数数据进行筛选处理后,得到第二数据集,对第二数据集中包括的参数数据进行数据标准化处理、数据归一化处理、或数据转换处理,以确保不同特征的尺度一致。最终得到的目标数据集中包含与变电设备状态和性能最相关的参数数据,该目标数据集为后续步骤的基础,可以帮助更好地进行聚类分析和异常检测。
步骤S104,对目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数。
可选的,可以使用K均值算法进行聚类分析,将参数数据划分为不同的簇。K均值是一种常用的聚类算法,它将数据点分为K个簇,以便每个数据点与其所在簇的中心点距离最小。对于给定的参数数据xi,其中i=1,2,...,N,以及聚类中心yk,其中k=1,2,...,K,K均值算法的目标是最小化以下损失函数:
其中,wik为指示变量,当第i条参数数据属于簇k时为1,否则为0;||xi-yk||2为第i条参数数据与聚类中心的距离的平方。
在一种可选的实施例中,对目标数据集中包括的参数数据进行聚类处理,得到N个簇,包括:确定簇的数量为N;从目标数据集中包括的参数数据中确定N条目标参数数据;基于N条目标参数数据,确定N个初始聚类中心点,并循环执行以下操作,直至达到预设终止条件:计算目标数据集中,除N条目标参数数据之外的其他参数数据分别到N个初始聚类中心点的距离;基于其他参数数据分别到N个初始聚类中心点的距离,确定其他参数数据归属的簇;计算N个簇中分别包括的参数数据的平均值;基于平均值,对N个初始聚类中心点进行更新处理,N个新的聚类中心点;在满足预设终止条件的情况下,基于N个新的聚类中心点,得到N个簇。
可选的,对目标数据集中包括的参数数据进行聚类处理的步骤如下:
步骤S1041,选择聚类的个数N,即将目标数据集中包括的参数数据划分为N个簇。
步骤S1042,从参数数据中随机选择N条参数数据作为初始聚类中心点。
步骤S1043,对目标数据集中除N条目标参数数据之外的其他参数数据,计算其与每个初始聚类中心点之间的距离,并将参数数据分配给距离最近的初始聚类中心点所属的簇。
步骤S1044,计算每个簇中所有参数数据的平均值,并将其作为新的聚类中心点。
步骤S1045,判断是否达到预设的迭代次数,若没有达到预设迭代次数,则执行步骤S1043,若达到预设迭代次数,则执行步骤S1046。
步骤S1046,最终基于N个新的聚类中心点,得到N个簇,每个簇包含一组相似的参数数据。
在一种可选的实施例中,获取变电设备的新的参数数据;计算新的参数数据分别与N个簇的相似度,得到N个相似度;若N个相似度均大于或等于预设阈值,则确定N个相似度中的相似度最大值,将新的参数数据划分至相似度最大值对应的簇中;若N个相似度中存在任意一个相似度小于预设阈值,则创建一个新的簇,将新的参数数据划分至新的簇中。
可选的,当变电设备有新的参数数据时,可以使用一种用于概念学习的聚类算法(COBWEB算法)来实时监测设备参数的变化。当使用COBWEB算法实时监测设备参数的变化时,算法会根据数据流中新出现的参数数据,动态地更新现有的聚类模型,并将新的参数数据分配到适当的簇中,这允许在不断变化的数据流中识别设备参数的变化并及时作出响应。利用COBWEB算法实时监测设备参数的变化的具体步骤如下:根据现有的聚类模型,COBWEB算法会计算新的参数数据与每个簇的相似度,若新的参数数据与每个簇的相似度均较高,则将新的参数数据分配到相似度最高的簇中;若新的参数数据与每个簇的相似度均较低,则创建一个新的簇,并将新的参数数据划分至新的簇中,随着更多的参数数据的涌入,COBWEB算法将根据新的数据模式逐渐调整簇的位置和大小,以适应数据的变化。通过以上方式,COBWEB算法可以在不断变化的数据流中实时监测变电设备参数的变化,并根据新的参数数据的特点更新聚类模型,从而保持对设备状态的实时感知。
在一种可选的实施例中,在对目标数据集中包括的参数数据进行聚类处理,得到N个簇之后,方法还包括:基于N个簇中分别包括的参数数据,建立N个簇分别对应的参数预测模型,其中,参数预测模型用于预测未来采样时刻的参数值。
可选的,对于每一个簇中分别包括的参数数据,可以使用时间序列分析来构建参数预测模型,可以利用指数平滑模型、自回归移动平均模型、长短时记忆神经网络等方法构建参数预测模型,例如,可以根据如下公式建立基于自回归移动平均模型的参数预测模型:
其中,Xt为在t时刻的变电设备参数值;Xt-1为在t-1时刻,即t时刻的前一个时刻的变电设备参数值;与θ1为参数预测模型的参数;c为常数项;εt为当前时间点的误差项。对参数预测模型进行构建,以便可以根据历史数据的趋势和模式来预测未来可能的参数值。在除了时间序列分析外,还可以考虑其他特征,如设备工作时间、环境因素等。这些特征可能对设备状态的变化产生影响,因此也可以将它们纳入参数预测模型中。
在一种可选的实施例中,方法还包括:获取第二参数数据;确定第二参数数据所属的目标簇;从N个簇分别对应的参数预测模型中确定目标簇对应的第二参数预测模型;基于第二参数数据,采用第二参数预测模型,得到预测结果;基于预测结果,确定变电设备的维修策略。
可选的,若要预测第二参数数据在未来时段的参数值,则需要计算第二参数数据与N个簇之间的相似度,确定出第二参数数据所属的相似度最高的目标簇,从N个簇分别对应的参数预测模型中确定目标簇对应的第二参数预测模型,将第二参数数据输入第二参数预测模型,得到预测结果;如果预测值在正常范围内,则不需要采取特殊维护措施;如果预测值偏离正常范围,可能需要考虑停机维修或设备检查,以避免潜在故障。通过预测性维护,可以更加智能地管理设备状态,及时处理潜在的故障,并最大程度地提高设备的可用性和维护效率。
步骤S106,基于N个簇中分别包括的参数数据,确定N个簇分别对应的平均值和标准差。
可选的,对于每个簇,计算簇内数据的平均值和标准差。这些统计量将作为正常状态的参考,因为在正常情况下,同一簇内的数据应该有相似的参数值。可以通过如下公式计算平均值:
可以通过如下公式计算标准差:
其中,Ck表示属于簇k的参数数据的集合;nk为簇k中包括的参数数据的个数;xi为簇k中第i条参数数据。
步骤S108,基于N个簇分别对应的平均值和标准差,确定异常参数数据。
在一种可选的实施例中,基于N个簇分别对应的平均值和标准差,确定异常参数数据,包括:基于N个簇分别对应的平均值和标准差,确定目标数值范围;将N个簇中分别包括的参数数据中,未在目标数值范围内的参数数据,确定为异常参数数据。
可选的,由于在参数量足够多的情况下,同一簇内的参数数据应该有相似的参数值,因此根据平均值和标准差,可以确定每个簇的目标数值范围,可以将目标数值范围定义为平均值加减几倍标准差,例如平均值加减2倍标准差。对于每个簇中的参数数据,检查其数值是否在目标数值范围内,如果不在范围内,则将其确定为异常参数数据。
在一种可选的实施例中,方法还包括:基于目标数值范围,采用隔离森林算法,确定N个簇分别包括的参数数据分别对应的异常评分,其中,隔离森林算法用于检测与正常状态差异较大的数据;判断N个簇分别包括的参数数据中,是否存在异常评分大于或等于预设评分阈值的第一参数数据;将第一参数数据确定为异常参数数据。
可选的,可以利用隔离森林算法(Isolation Forest算法)通过随机划分数据来孤立异常数据。该算法假设异常数据点往往比正常数据点更容易被分离出来。IsolationForest将数据点随机分配到树的不同分支,通过构建一棵隔离树来识别异常,具体实现过程如下:
步骤S1061,将任意一个簇包括的参数数据作为输入传入算法。
步骤S1062,根据参数数据构造一棵孤立树,其中,孤立树是一种二叉树结构,每个节点都是一个特征,并且树的深度是预先设定好的。
步骤S1063,从参数数据中随机选择一个特征。
步骤S1064,从选定的特征的目标数值范围内随机选择一个分割点作为当前节点的分割点。
步骤S1065,根据选择的特征和分割点将参数数据分为两部分,左子树和右子树。
步骤S1066,对左子树和右子树分别递归地构造孤立树,直到满足停止条件,其中,停止构造孤立树的条件可以是树的深度达到预设的最大深度,或者子树中的样本数小于一个阈值。
步骤S1067,重复执行步骤S1062-步骤S1066,构造多棵孤立树直至达到预设执行次数。
步骤S1068,对于每条参数数据,用其在所有孤立树中的平均路径长度(即从根节点到该数据点的路径长度的平均值)来定义异常评分。
由于数据点的深度越浅,异常得分越高,因此若存在异常评分大于或等于预设评分阈值的第一参数数据,则表示第一参数数据更容易被隔离,是异常参数数据。变电设备参数之间可能存在复杂的非线性关系,Isolation Forest可以在没有先验知识的情况下捕捉到非线性异常模式,这对于侧变电设备的特殊情况非常有用。通过将K均值聚类和Isolation Forest异常检测相结合,可以从不同角度进行异常检测,结合两者能够从多个维度综合检测异常,实现快速识别异常参数,并随时进行维护决策;提高异常检测的全面性,可以更好地适应不同状态下参数的分布变化;可以提升对异常参数检测的准确性。
在一种可选的实施例中,在将N个簇中分别包括的参数数据中,未在目标数值范围内的参数数据,确定为异常参数数据之后,方法还包括:基于异常参数数据,采用预先训练好的决策树故障分类器,确定异常参数数据对应的故障模式,其中,预先训练好的决策树故障分类器是基于变电设备的历史数据集训练得到的,历史数据集中包括的多个历史采样时刻采集到的多条历史参数数据,以及多条历史参数数据分别对应的故障标签,多个历史采样时刻与多条历史参数数据一一对应。
可选的,对于被标记为异常参数数据,可以使用特征工程、统计分析和领域知识来识别潜在的故障模式。这可能包括与特定故障类型相关的特征变化,例如电流突然升高、温度异常波动等。通过分析异常参数数据的特征模式,可以建立基于决策树的故障分类器。决策树是一种常用的分类算法,可以根据数据的特征逐步做出分类决策。在这个步骤中,使用决策树来建立故障分类器,将异常数据分类到不同的故障类型中。可以通过如下方式建立决策树故障分类器:假设有历史数据集作为训练集D,其中包含N条历史参数数据,每条历史参数数据包含M个特征(x1,x2,…,xM)以及对应的标签y(表示故障类型),通过递归地选择最优特征来分裂参数数据,并构建树状结构。在每个节点上,选择一个特征进行分裂,使得划分后的子集尽可能纯净(同一故障类型的数据尽可能多)。例:若建立了一个决策树,其中一个节点的判定规则是“如果电流大于阈值X且温度小于阈值Y,则故障类型为A”。这样的规则可以从数据中学习到,帮助将异常参数数据分为不同的故障类型。通过建立决策树故障分类器,可以根据设备参数数据的特征将异常参数数据分类为不同的故障类型。这为后续的预测性维护提供了更精细的故障诊断信息,帮助工程师更快速地采取适当的维护措施。
通过上述步骤S102至步骤S108,可以达到基于目标参数数据对应的平均值和标准差,准确确定异常参数数据的目的,从而实现提升变电设备参数处理方法的准确性的技术效果,进而解决相关技术中变电设备参数处理方法考虑因素不全面,导致确定异常参数数据的准确性低的技术问题。
基于上述实施例和可选实施例,本发明提出一种可选实施方式,该方法包括:
步骤S1,获取变电设备的初始数据集,其中,初始数据集中包括多个采样时刻分别采集到的初始参数数据。
步骤S2,对初始数据集中包括的参数数据进行第一数据预处理,得到第一数据集,其中,第一数据预处理包括以下至少之一:数据清洗处理、异常值剔除处理。
步骤S3,对第一数据集中包括的参数数据进行筛选处理,得到第二数据集。
步骤S4,对第二数据集中包括的参数数据进行第二数据预处理,得到目标数据集,其中,第二数据预处理包括以下至少之一:数据标准化处理、数据归一化处理、数据转换处理。
步骤S5,对目标数据集中包括的参数数据进行聚类处理,具体实现步骤如下:
步骤S51,确定簇的数量为N。
步骤S52,从目标数据集中包括的参数数据中确定N条目标参数数据。
步骤S53,基于N条目标参数数据,确定N个初始聚类中心点。
步骤S54,计算目标数据集中,除N条目标参数数据之外的其他参数数据分别到N个初始聚类中心点的距离。
步骤S55,基于其他参数数据分别到N个初始聚类中心点的距离,确定其他参数数据归属的簇。
步骤S56,计算N个簇中分别包括的参数数据的平均值。
步骤S57,基于平均值,对N个初始聚类中心点进行更新处理,N个新的聚类中心点。
步骤S58,判断是否达到预设终止条件,若没有达到预设终止条件则执行步骤S54,若达到预设终止条件则执行步骤S59。
步骤S59,基于N个新的聚类中心点,得到N个簇。
步骤S6,获取变电设备的新的参数数据。
步骤S7,计算新的参数数据分别与N个簇的相似度,得到N个相似度。
步骤S8,若N个相似度均大于或等于预设阈值,则确定N个相似度中的相似度最大值,将新的参数数据划分至相似度最大值对应的簇中。
步骤S9,若N个相似度中存在任意一个相似度小于预设阈值,则创建一个新的簇,将新的参数数据划分至新的簇中。
步骤S10,基于N个簇中分别包括的参数数据,建立N个簇分别对应的参数预测模型,其中,参数预测模型用于预测未来采样时刻的参数值。
步骤S11,获取第二参数数据。
步骤S12,确定第二参数数据所属的目标簇。
步骤S13,从N个簇分别对应的参数预测模型中确定目标簇对应的第二参数预测模型。
步骤S14,基于第二参数数据,采用第二参数预测模型,得到预测结果。
步骤S15,基于预测结果,确定变电设备的维修策略。
在本实施例中还提供了一种变电设备参数处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”“装置”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
根据本发明实施例,还提供了一种用于实施上述变电设备参数处理方法的装置实施例,图2是根据本发明实施例的一种变电设备参数处理装置的结构示意图,如图2所示,上述变电设备参数处理装置,包括:第一获取模块202、第一聚类模块204、第一确定模块206、第二确定模块208,其中:
第一获取模块202,用于获取变电设备的目标数据集,其中,目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;
第一聚类模块204,连接于第一获取模块202,用于对目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;
第一确定模块206,连接于第一聚类模块204,用于基于N个簇中分别包括的参数数据,确定N个簇分别对应的平均值和标准差;
第二确定模块208,连接于第一确定模块206,用于基于N个簇分别对应的平均值和标准差,确定异常参数数据。
通过设置第一获取模块202,用于获取变电设备的目标数据集,其中,目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;第一聚类模块204,用于对目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;第一确定模块206,用于基于N个簇中分别包括的参数数据,确定N个簇分别对应的平均值和标准差;第二确定模块208,用于基于N个簇分别对应的平均值和标准差,确定异常参数数据,达到了基于目标参数数据对应的平均值和标准差,准确确定异常参数数据的目的,从而实现了提升变电设备参数处理方法的准确性的技术效果,进而解决了相关技术中变电设备参数处理方法考虑因素不全面,导致确定异常参数数据的准确性低的技术问题。
在一种可选的实施例中,上述第一获取模块,包括:第一获取子模块,用于获取变电设备的初始数据集,其中,初始数据集中包括多个采样时刻分别采集到的初始参数数据;第一处理子模块,用于对初始数据集中包括的参数数据进行第一数据预处理,得到第一数据集,其中,第一数据预处理包括以下至少之一:缺失值处理、异常值处理;第二处理子模块,用于对第一数据集中包括的参数数据进行筛选处理,得到第二数据集,其中,筛选处理用于确定出与变电设备状态和性能相关的参数数据;第三处理子模块,用于对第二数据集中包括的参数数据进行第二数据预处理,得到目标数据集,其中,第二数据预处理包括以下至少之一:数据标准化处理、数据归一化处理、数据转换处理。
在一种可选的实施例中,上述第一聚类模块,包括:第一确定子模块,用于确定簇的数量为N;第二确定子模块,用于从目标数据集中包括的参数数据中确定N条目标参数数据;第三确定子模块,用于基于N条目标参数数据,确定N个初始聚类中心点,并循环执行以下操作,直至达到预设终止条件:第一计算子模块,用于计算目标数据集中,除N条目标参数数据之外的其他参数数据分别到N个初始聚类中心点的距离;第四确定子模块,用于基于其他参数数据分别到N个初始聚类中心点的距离,确定其他参数数据归属的簇;第二计算子模块,用于计算N个簇中分别包括的参数数据的平均值;第一更新子模块,用于基于平均值,对N个初始聚类中心点进行更新处理,N个新的聚类中心点;第五确定子模块,用于在满足预设终止条件的情况下,基于N个新的聚类中心点,得到N个簇。
在一种可选的实施例中,上述第二确定模块,包括:第六确定子模块,用于基于N个簇分别对应的平均值和标准差,确定目标数值范围;第七确定子模块,用于将N个簇中分别包括的参数数据中,未在目标数值范围内的参数数据,确定为异常参数数据。
在一种可选的实施例中,上述装置还包括:第八确定子模块,用于基于目标数值范围,采用隔离森林算法,确定N个簇分别包括的参数数据分别对应的异常评分,其中,隔离森林算法用于检测与正常状态差异较大的数据;第一判断子模块,用于判断N个簇分别包括的参数数据中,是否存在异常评分大于或等于预设评分阈值的第一参数数据;第九确定子模块,用于将第一参数数据确定为异常参数数据。
在一种可选的实施例中,上述装置还包括:第十确定子模块,用于基于异常参数数据,采用预先训练好的决策树故障分类器,确定异常参数数据对应的故障模式,其中,预先训练好的决策树故障分类器是基于变电设备的历史数据集训练得到的,历史数据集中包括的多个历史采样时刻采集到的多条历史参数数据,以及多条历史参数数据分别对应的故障标签,多个历史采样时刻与多条历史参数数据一一对应。
在一种可选的实施例中,上述装置还包括:第二获取子模块,用于获取变电设备的新的参数数据;第三计算子模块,用于计算新的参数数据分别与N个簇的相似度,得到N个相似度;第十一确定子模块,用于若N个相似度均大于或等于预设阈值,则确定N个相似度中的相似度最大值,将新的参数数据划分至相似度最大值对应的簇中;第十二确定子模块,用于若N个相似度中存在任意一个相似度小于预设阈值,则创建一个新的簇,将新的参数数据划分至新的簇中。
在一种可选的实施例中,上述装置还包括:第一建立子模块,用于基于N个簇中分别包括的参数数据,建立N个簇分别对应的参数预测模型,其中,参数预测模型用于预测未来采样时刻的参数值。
在一种可选的实施例中,上述装置还包括:第三获取子模块,用于获取第二参数数据;第十三确定子模块,用于确定第二参数数据所属的目标簇;第十四确定子模块,用于从N个簇分别对应的参数预测模型中确定目标簇对应的第二参数预测模型;第十五确定子模块,用于基于第二参数数据,采用第二参数预测模型,得到预测结果;第十六确定子模块,用于基于预测结果,确定变电设备的维修策略。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;或者,上述各个模块以任意组合的方式位于不同的处理器中。
此处需要说明的是,上述第一获取模块202、第一聚类模块204、第一确定模块206、第二确定模块208对应于实施例中的步骤S102至步骤S108,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在计算机终端中。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例中的相关描述,此处不再赘述。
上述的变电设备参数处理装置还可以包括处理器和存储器,上述第一获取模块202、第一聚类模块204、第一确定模块206、第二确定模块208等均作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序模块来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序模块,上述内核可以设置一个或以上。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
根据本申请实施例,还提供了一种非易失性存储介质的实施例。可选的,在本实施例中,上述非易失性存储介质包括存储的程序,其中,在上述程序运行时控制上述非易失性存储介质所在设备执行上述任意一种变电设备参数处理方法。
可选的,在本实施例中,上述非易失性存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中,上述非易失性存储介质包括存储的程序。
可选的,在程序运行时控制非易失性存储介质所在设备执行以下功能:获取变电设备的目标数据集,其中,目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;对目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;基于N个簇中分别包括的参数数据,确定N个簇分别对应的平均值和标准差;基于N个簇分别对应的平均值和标准差,确定异常参数数据。
根据本申请实施例,还提供了一种处理器的实施例。可选的,在本实施例中,上述处理器用于运行程序,其中,上述程序运行时执行上述任意一种变电设备参数处理方法。
根据本申请实施例,还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有上述任意一种的变电设备参数处理方法步骤的程序。
可选的,上述计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取变电设备的目标数据集,其中,目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;对目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;基于N个簇中分别包括的参数数据,确定N个簇分别对应的平均值和标准差;基于N个簇分别对应的平均值和标准差,确定异常参数数据。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:获取变电设备的初始数据集,其中,初始数据集中包括多个采样时刻分别采集到的初始参数数据;对初始数据集中包括的参数数据进行第一数据预处理,得到第一数据集,其中,第一数据预处理包括以下至少之一:缺失值处理、异常值处理;对第一数据集中包括的参数数据进行筛选处理,得到第二数据集,其中,筛选处理用于确定出与变电设备状态和性能相关的参数数据;对第二数据集中包括的参数数据进行第二数据预处理,得到目标数据集,其中,第二数据预处理包括以下至少之一:数据标准化处理、数据归一化处理、数据转换处理。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:确定簇的数量为N;从目标数据集中包括的参数数据中确定N条目标参数数据;基于N条目标参数数据,确定N个初始聚类中心点,并循环执行以下操作,直至达到预设终止条件:计算目标数据集中,除N条目标参数数据之外的其他参数数据分别到N个初始聚类中心点的距离;基于其他参数数据分别到N个初始聚类中心点的距离,确定其他参数数据归属的簇;计算N个簇中分别包括的参数数据的平均值;基于平均值,对N个初始聚类中心点进行更新处理,N个新的聚类中心点;在满足预设终止条件的情况下,基于N个新的聚类中心点,得到N个簇。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:基于N个簇分别对应的平均值和标准差,确定目标数值范围;将N个簇中分别包括的参数数据中,未在目标数值范围内的参数数据,确定为异常参数数据。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:基于目标数值范围,采用隔离森林算法,确定N个簇分别包括的参数数据分别对应的异常评分,其中,隔离森林算法用于检测与正常状态差异较大的数据;判断N个簇分别包括的参数数据中,是否存在异常评分大于或等于预设评分阈值的第一参数数据;将第一参数数据确定为异常参数数据。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:基于异常参数数据,采用预先训练好的决策树故障分类器,确定异常参数数据对应的故障模式,其中,预先训练好的决策树故障分类器是基于变电设备的历史数据集训练得到的,历史数据集中包括的多个历史采样时刻采集到的多条历史参数数据,以及多条历史参数数据分别对应的故障标签,多个历史采样时刻与多条历史参数数据一一对应。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:获取变电设备的新的参数数据;计算新的参数数据分别与N个簇的相似度,得到N个相似度;若N个相似度均大于或等于预设阈值,则确定N个相似度中的相似度最大值,将新的参数数据划分至相似度最大值对应的簇中;若N个相似度中存在任意一个相似度小于预设阈值,则创建一个新的簇,将新的参数数据划分至新的簇中。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:基于N个簇中分别包括的参数数据,建立N个簇分别对应的参数预测模型,其中,参数预测模型用于预测未来采样时刻的参数值。
可选地,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:获取第二参数数据;确定第二参数数据所属的目标簇;从N个簇分别对应的参数预测模型中确定目标簇对应的第二参数预测模型;基于第二参数数据,采用第二参数预测模型,得到预测结果;基于预测结果,确定变电设备的维修策略。
如图3所示,本发明实施例提供了一种电子设备,该电子设备10包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取变电设备的目标数据集,其中,目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;对目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;基于N个簇中分别包括的参数数据,确定N个簇分别对应的平均值和标准差;基于N个簇分别对应的平均值和标准差,确定异常参数数据。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如上述模块的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块或模块的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取非易失性存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个非易失性存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的非易失性存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种变电设备参数处理方法,其特征在于,包括:
获取变电设备的目标数据集,其中,所述目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;
对所述目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;
基于所述N个簇中分别包括的参数数据,确定所述N个簇分别对应的平均值和标准差;
基于所述N个簇分别对应的平均值和标准差,确定异常参数数据。
2.根据权利要求1所述的方法,其特征在于,所述获取变电设备的目标数据集,包括:
获取所述变电设备的初始数据集,其中,所述初始数据集中包括所述多个采样时刻分别采集到的初始参数数据;
对所述初始数据集中包括的参数数据进行第一数据预处理,得到第一数据集,其中,所述第一数据预处理包括以下至少之一:缺失值处理、异常值处理;
对所述第一数据集中包括的参数数据进行筛选处理,得到第二数据集,其中,所述筛选处理用于确定出与所述变电设备状态和性能相关的参数数据;
对所述第二数据集中包括的参数数据进行第二数据预处理,得到所述目标数据集,其中,所述第二数据预处理包括以下至少之一:数据标准化处理、数据归一化处理、数据转换处理。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标数据集中包括的参数数据进行聚类处理,得到N个簇,包括:
确定簇的数量为所述N;
从所述目标数据集中包括的参数数据中确定N条目标参数数据;
基于所述N条目标参数数据,确定N个初始聚类中心点,并循环执行以下操作,直至达到预设终止条件:
计算所述目标数据集中,除所述N条目标参数数据之外的其他参数数据分别到所述N个初始聚类中心点的距离;
基于所述其他参数数据分别到所述N个初始聚类中心点的距离,确定所述其他参数数据归属的簇;
计算所述N个簇中分别包括的参数数据的平均值;
基于所述平均值,对所述N个初始聚类中心点进行更新处理,N个新的聚类中心点;
在满足所述预设终止条件的情况下,基于所述N个新的聚类中心点,得到所述N个簇。
4.根据权利要求1所述的方法,其特征在于,所述基于所述N个簇分别对应的平均值和标准差,确定异常参数数据,包括:
基于所述N个簇分别对应的平均值和标准差,确定目标数值范围;
将所述N个簇中分别包括的参数数据中,未在所述目标数值范围内的参数数据,确定为所述异常参数数据。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
基于所述目标数值范围,采用隔离森林算法,确定所述N个簇分别包括的参数数据分别对应的异常评分,其中,所述隔离森林算法用于检测与正常状态差异较大的数据;
判断所述N个簇分别包括的参数数据中,是否存在异常评分大于或等于预设评分阈值的第一参数数据;
将所述第一参数数据确定为所述异常参数数据。
6.根据权利要求4所述的方法,其特征在于,在所述将所述N个簇中分别包括的参数数据中,未在所述目标数值范围内的参数数据,确定为所述异常参数数据之后,所述方法还包括:
基于所述异常参数数据,采用预先训练好的决策树故障分类器,确定所述异常参数数据对应的故障模式,其中,所述预先训练好的决策树故障分类器是基于所述变电设备的历史数据集训练得到的,所述历史数据集中包括的多个历史采样时刻采集到的多条历史参数数据,以及所述多条历史参数数据分别对应的故障标签,所述多个历史采样时刻与所述多条历史参数数据一一对应。
7.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述变电设备的新的参数数据;
计算所述新的参数数据分别与所述N个簇的相似度,得到N个相似度;
若所述N个相似度均大于或等于预设阈值,则确定所述N个相似度中的相似度最大值,将所述新的参数数据划分至所述相似度最大值对应的簇中;
若所述N个相似度中存在任意一个相似度小于预设阈值,则创建一个新的簇,将所述新的参数数据划分至所述新的簇中。
8.根据权利要求1至7中任意一项所述的方法,其特征在于,在所述对所述目标数据集中包括的参数数据进行聚类处理,得到N个簇之后,所述方法还包括:
基于所述N个簇中分别包括的参数数据,建立所述N个簇分别对应的参数预测模型,其中,所述参数预测模型用于预测未来采样时刻的参数值。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
获取第二参数数据;
确定所述第二参数数据所属的目标簇;
从所述N个簇分别对应的参数预测模型中确定所述目标簇对应的第二参数预测模型;
基于所述第二参数数据,采用所述第二参数预测模型,得到预测结果;
基于所述预测结果,确定所述变电设备的维修策略。
10.一种变电设备参数处理装置,其特征在于,包括:
第一获取模块,用于获取变电设备的目标数据集,其中,所述目标数据集是基于多个采样时刻分别采集到的初始参数数据获取到的;
第一聚类模块,用于对所述目标数据集中包括的参数数据进行聚类处理,得到N个簇,其中,N为大于或等于2的整数;
第一确定模块,用于基于所述N个簇中分别包括的参数数据,确定所述N个簇分别对应的平均值和标准差;
第二确定模块,用于基于所述N个簇分别对应的平均值和标准差,确定异常参数数据。
11.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至9中任意一项所述的变电设备参数处理方法。
CN202311215066.8A 2023-09-19 2023-09-19 变电设备参数处理方法、装置及电子设备 Pending CN117216702A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311215066.8A CN117216702A (zh) 2023-09-19 2023-09-19 变电设备参数处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311215066.8A CN117216702A (zh) 2023-09-19 2023-09-19 变电设备参数处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN117216702A true CN117216702A (zh) 2023-12-12

Family

ID=89038622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311215066.8A Pending CN117216702A (zh) 2023-09-19 2023-09-19 变电设备参数处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN117216702A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648543A (zh) * 2024-01-30 2024-03-05 金数信息科技(苏州)有限公司 一种自演化的变电站设备学习方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648543A (zh) * 2024-01-30 2024-03-05 金数信息科技(苏州)有限公司 一种自演化的变电站设备学习方法

Similar Documents

Publication Publication Date Title
CN109829236B (zh) 一种基于XGBoost特征提取的压缩机故障诊断方法
CN111047082A (zh) 设备的预警方法及装置、存储介质和电子装置
CN110609759A (zh) 一种故障根因分析的方法及装置
Lokrantz et al. Root cause analysis of failures and quality deviations in manufacturing using machine learning
CN111475680A (zh) 检测异常高密子图的方法、装置、设备及存储介质
CN112529204A (zh) 模型训练方法、装置及系统
CN109840157A (zh) 故障诊断的方法、装置、电子设备和存储介质
CN110493025A (zh) 一种基于多层有向图的故障根因诊断的方法及装置
CN117216702A (zh) 变电设备参数处理方法、装置及电子设备
CN113572625B (zh) 故障预警方法、预警装置、设备及计算机介质
CN110297207A (zh) 智能电表的故障诊断方法、系统及电子装置
CN112905671A (zh) 时间序列异常处理方法、装置、电子设备及存储介质
CN117113233A (zh) 层级能源结构场景构建方法及能耗异常链路追溯方法
CN116030955B (zh) 基于物联网的医疗设备状态监测方法及相关装置
CN114936614B (zh) 一种基于神经网络的作业风险识别方法及系统
KR20210126378A (ko) 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템
CN115859191A (zh) 故障诊断方法、装置、计算机可读存储介质及计算机设备
WO2021140742A1 (ja) 運転管理支援装置及び運転管理支援方法
Lin et al. A method of satellite network fault synthetic diagnosis based on C4. 5 algorithm and expert knowledge database
CN113591897A (zh) 一种监控数据异常的检测方法、装置、设备及可读介质
CN115080286A (zh) 一种网络设备日志异常的发现方法及装置
CN115080965B (zh) 基于历史表现的无监督异常检测方法及系统
Nguyen et al. A new ensemble-feature-selection framework for intrusion detection
CN112991093B (zh) 一种基于边缘计算的窃电检测方法及系统
CN114492877B (zh) 一种业务系统的运维分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination