CN108334894B - 基于无监督机器学习的变压器油温异常识别方法 - Google Patents

基于无监督机器学习的变压器油温异常识别方法 Download PDF

Info

Publication number
CN108334894B
CN108334894B CN201711498252.1A CN201711498252A CN108334894B CN 108334894 B CN108334894 B CN 108334894B CN 201711498252 A CN201711498252 A CN 201711498252A CN 108334894 B CN108334894 B CN 108334894B
Authority
CN
China
Prior art keywords
oil temperature
transformer
cluster
data set
temperature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201711498252.1A
Other languages
English (en)
Other versions
CN108334894A (zh
Inventor
张远来
樊启俊
于程远
徐健锋
赵志宾
何宇凡
王喜秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang University
Tellhow Sci Tech Co Ltd
Original Assignee
Tellhow Sci Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tellhow Sci Tech Co Ltd filed Critical Tellhow Sci Tech Co Ltd
Priority to CN201711498252.1A priority Critical patent/CN108334894B/zh
Publication of CN108334894A publication Critical patent/CN108334894A/zh
Application granted granted Critical
Publication of CN108334894B publication Critical patent/CN108334894B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明涉及变压器顶层油温异常识别领域,公开了一种基于无监督机器学习的变压器油温异常识别方法。其主要步骤包括:首先利用K‑Means算法对变压器的工作状况训练数据集进行聚类,得到变压器设备不同工况类簇划分;然后,统计各类油温对象在其类簇中的条件概率,当条件概率小于给定阈值时,该簇标注为异常油温,反之标注为正常;对标注后的训练数据集实施决策树算法,提取决策规则;应用测试数据集对提取的决策规则进行反复测试;直至提取的决策规则在测试数据集上,油温异常判定的准确率大于等于指定要求。本发明技术方案能够根据变压器工况数据对变压器设备顶层油温异常进行识别,为电网运维管控提供了一种便捷有效的变压器油温异常判定方法。

Description

基于无监督机器学习的变压器油温异常识别方法
技术领域
本发明涉及变压器顶层油温异常识别方法,属于电网设备状态监测与风险预警技术领域。
背景技术
在对此方法的研究和实践过程中,本发明的发明人发现:变压器是电力系统能源传递的核心组件,价格昂贵,技术复杂,而变压器的油温和变压器的使用寿命是密切相关的,油温过高会严重缩短变压器使用寿命。在变压器负载运行过程中,必须保证其油温在相应的温度区间。根据变压器的工作状况和环境温度等特征,分析当前油温在工作状况下是否异常。参考工况属性特征如表1所示。一方面可以保证变压器在安全可靠的前提下,充分利用其负载能力;另一方面可以及时发现变压器过热故障。
表1油温异常工况常见属性特征举例表
特征名 特征描述 特征名 特征描述
YG_YC_G 主变高压侧有功遥测 DLZ_YC_G 主变高压侧电流值遥测
YG_YC_D 主变低压侧有功遥测 DLZ_YC_D 主变低压侧电流值遥测
YG_YC_Z 主变中压侧有功遥测 DLZ_YC_Z 主变中压侧电流值遥测
WG_YC_G 主变高压侧无功遥测 DLFZA_YC_G 主变高压侧A相电流副值
WG_YC_D 主变低压侧无功遥测 DLFZA_YC_D 主变低压侧A相电流副值
WG_YC_Z 主变中压侧无功遥测 DLFZA_YC_Z 主变中压侧A相电流副值
GLYS_YC_G 主变高压侧功率因数遥测 RZWDA_YC 主变A相绕组温度
GLYS_YC_D 主变低压侧功率因数遥测 YW1A_YC 主变A相油温1
GLYS_YC_Z 主变中压侧功率因数遥测 HJWD 环境温度
目前,变压器油温的计算、预测和异常分析,主要采用了基于变压器修正热路模型技术、基于变压器油色谱判别技术和基于顶层油温异常探测技术三大类技术路线,往往存在、设备成本高、通用性差,精度不高、实时性不强等弱点,且不能适应大数据时代国家电网的发展需求。
K-Means算法是一种基于样本间相似性度量的间接聚类方法,属于非监督学习方法。此算法以k为参数,把n个对象分为k个簇,以使簇内具有较高的相似度,而且簇间的相似度较低。K-Means算法具有以下优点:(1)算法能根据较少的已知聚类样本的类别对树进行剪枝确定部分样本的分类;(2)为克服少量样本聚类的不准确性,该算法本身具有优化迭代功能,在已经求得的聚类上再次进行迭代修正剪枝确定部分样本的聚类,优化了无监督学习样本分类不合理的地方;(3)聚类时间复杂度低。
决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的决策规则,然后使用决策规则对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树算法具有以下优点:(1)决策树易于理解和实现,人们在通过解释后都有能力去理解决策树所表达的意义。(2)在相对短的时间内能够对大型数据源做出可行且效果良好的结果。(3)可以处理不相关特征数据(4)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。
发明内容
本发明的目的:提供一种基于无监督机器学习的变压器油温异常识别方法。本方法有效缓解现有的变压器异常状态的识别方法往往存在、设备成本高、通用性差,精度不高、实时性不强等难题。适应大数据时代国家电网的发展需求。
本发明的方案:首先利用无监督机器学习K-Means算法对变压器的工作状况训练数据集进行聚类,得到变压器设备不同工况类簇的划分然后,统计聚类获得的每一类样本数据中的各类油温对象在本类簇中的条件概率。当条件概率小于给定阈值时,该簇中对象标注为异常油温,反之标注为正常。对标注后的训练数据集实施决策树算法,提取决策规则。应用测试数据集对提取的决策规则进行测试,如果油温异常判定的准确率低于指定要求,则调整判定油温异常的条件概率阈值,重新标注数据,并实施决策规则提取算法,重新测试。直至提取的决策规则在测试数据集上,油温异常判定的准确率大于等于指定要求。
本发明的具体步骤如下:
1)输入训练样本数据集X={x1,x2,…xm}。每个对象xi∈X的油温,以指定的温度数值n℃为间隔进行油温离散化标注。例如0℃→n℃区间标注为温度t0,n℃→(2n)℃区间标注为温度t1,以此类推,即油温离散化后的标识集合为T={t0,t1,...ti}。
2)根据除油温以外工况特征向量,对数据集X实施K-Means聚类算法,获得k个类簇集合U。其中第j个类簇记为Uj,其中0<j≤k;
3)统计聚类获得的每一类簇中,各同类油温对象在本类簇中的条件概率P。例如第j个类簇Uj中第j种温度类型ti的对象集占簇Uj所有对象的条件概率记为P(i|j),其中
Figure GDA0002119510250000021
4)将每个聚类中的每个温度分类的条件概率P(i|j)与异常判定阈值α进行比较。如果P≥α的油温样本定义为正常样本POSX,如果P<α则标识为异常样本NEGX
5)将标注后的油温训练集数据集X={x1,x2,…xm}输入决策树算法进行训练,得到决策树模型,并提取油温异常识别决策规则。
6)应用专家已经标注油温异常的测试数据集Xtest对提取的油温异常识别决策规则进行测试。并且统计识别准确率R。
7)设定识别准确率预期目标γ,如果识别准确率R<γ,则令α=α+λ,其中λ为一常数,并且返回步骤4)。如果R≥γ,则输出步骤5)获得的决策规则作为油温异常分离器匹配规则。
本发明的优点是:本发明技术方案能够根据变压器工况数据进行变压器设备顶层油温异常识别规则,不需要另外购置油温异常识别光电设备。为电网运维管控人员提供了一种有效的变压器油温异常判定方法。
附图说明
图1为基于无监督机器学习的变压器油温异常识别方法流程图。
具体实施方式
为使本发明的发明目的、技术方案和优势更加清楚,下面将对本发明的实施方式做出进一步的描述。
1)训练数据集X={x1,x2,…xm}中油温分布区间为(-37℃,150℃),每个对象记录的油温按照每10℃间隔进行油温离散化处理,例如-37℃→-30℃作为取值t0,-30℃→-20℃作为取值t1,以此类推得到温度区间集合T={t0,t1,...,t18}。
2)根据除油温以外工况特征向量,对数据集X实施K-Means聚类算法,获得k个类簇。其中第j个类簇记为Uj,其中0<j≤k;聚类过程如下:
2.1)随机选取k个聚类质心点为u1,u2,…,uk∈X。重复下面过程直到收敛;
2.2)对于每一个样例xi∈X,计算xi与k个质心点向量的欧式距离Dist,uj为第j个质心,1≤j≤k,Dist计算公式如下:
Dist(xi,uj)=||xi-uj||2
其中,与xi距离最小的质心点uj所属类别j为xi的类别,记作ci,计算公式如下:
Figure GDA0002119510250000031
2.3)对于每一个类j,重新计算j类的质心,计算公式如下:
Figure GDA0002119510250000041
其中
Figure GDA0002119510250000042
3)统计聚类获得的每一类簇中,各同类油温对象在本类簇中的条件概率P。例如第j个类簇Uj中第i种温度类型ti的对象集占簇Uj所有对象的条件概率记为P(i|j),其中
Figure GDA0002119510250000043
4)将每个聚类中的每个温度分类的条件概率P与阈值α=0.01进行比较。如果P≥α的油温样本定义为正常样本POSX,如果P<α则标识为异常样本NEGX
5)将标注后的油温训练集数据集X={x1,x2,…xm}输入决策树算法进行训练,得到决策树模型,并提取油温异常识别决策规则。其中决策树训练过程如下:
5.1)将X作为决策树根节点,循环下列过程直至所有节点无需再分裂;
5.2)设D为用类别对X进行的划分,则D的熵表示为:
Figure GDA0002119510250000044
其中Pi表示第i个类别在Xtrain中出现的概率,可以用属于此类别元素的数量除以训练元组元素总数量作为估计。
5.3)将训练元组D按属性A进行划分,则A对D划分的期望信息为
Figure GDA0002119510250000045
其中V为属性A的可能取值,v∈V表示属性A的某一取值,Dv表示D中取值为v的样本,而信息增益即为两者的差值:
gain(A)=inf(D)-infA(D)
5.4)选择增益最大的属性进行分裂。
6)应用专家已经标注油温异常的测试数据集Xtest,其中异常样本集合为
Figure GDA0002119510250000047
对提取的油温异常识别决策规则进行测试。并且统计异常识别准确率R,计算公式如下
Figure GDA0002119510250000046
7)设定异常识别准确率预期目标γ=90%,如果异常识别准确率R<γ,则令α=α+λ,其中λ=0.01为一常数,并且返回步骤4)。如果步骤R≥γ,则输出步骤5)获得的决策规则作为油温异常分离器匹配规则。
综上所述,本发明提供了一种基于无监督机器学习算法的变压器油温异常识别方法。该方法通过K-means聚类对变压器设备工作状态进行建模分析,以各同类油温对象在本类簇中的条件概率作为当前油温在相应工作状态下是否异常的分析指标。同时通过异常识别准确率反馈来不断自适应学习异常判定阈值,提高模型的可靠性和稳定性的同时简化了异常识别决策规则的复杂性。
某主变设备A项油温异常识别实验结果如表2所示。(通过与PMS中报告的异常比对,最后计算异常标注准确率为93.82%。而采用变压器油色谱异常探测的油温预警方法同类实验对象仅有86%的异常识别准确率。因此本算法在识别效果上明显优于传统的油色谱异常探测方法。
表2异常识别阈值与异常识别准确率结果表
Figure GDA0002119510250000051
总之,以上所述仅为本发明的一个应用实例,而并非对实施方式的限定。由本发明所引伸出的明显变化和修饰皆处于本发明的涵盖范围之中。

Claims (1)

1.一种基于无监督机器学习的变压器油温异常识别方法,其特征在于,包括以下步骤:
1)输入训练样本数据集X={x1,x2,…xm},每个对象xi∈X的油温,以指定的温度数值nC0为间隔进行油温离散化标注;其中:0C0→nC0区间标注为温度t0,nC0→(2n)C0区间标注为温度t1,以此类推,即油温离散化后的标识集合为T={t0,t1,...ti};
2)根据除油温以外工况特征向量,对数据集X实施K-Means聚类算法,获得k个类簇集合U,其中第j个类簇记为Uj,其中0<j≤k;
3)统计聚类获得的每一类簇中,各同类油温对象在本类簇中的条件概率P;其中:第j个类簇Uj中第j种温度类型ti的对象集占簇Uj所有对象的条件概率记为P(i|j),其中
Figure FDA0002189983400000011
4)将每个聚类中的每个温度分类的条件概率P(i|j)与异常判定阈值α进行比较;如果P≥α,油温样本定义为正常样本POSX,如果P<α,则标识为异常样本NEGX
5)将标注后的油温训练集数据集X={x1,x2,…xm}输入决策树算法进行训练,得到决策树模型,并提取油温异常识别决策规则;
6)应用专家已经标注油温异常的测试数据集Xtest对提取的油温异常识别决策规则进行测试,并且统计识别准确率R;
7)设定识别准确率预期目标γ,如果识别准确率R<γ,则令α=α+λ,其中λ为一常数,并且返回步骤4),如果R≥γ,则输出步骤5)获得的决策规则作为油温异常分离器匹配规则。
CN201711498252.1A 2017-12-29 2017-12-29 基于无监督机器学习的变压器油温异常识别方法 Expired - Fee Related CN108334894B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711498252.1A CN108334894B (zh) 2017-12-29 2017-12-29 基于无监督机器学习的变压器油温异常识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711498252.1A CN108334894B (zh) 2017-12-29 2017-12-29 基于无监督机器学习的变压器油温异常识别方法

Publications (2)

Publication Number Publication Date
CN108334894A CN108334894A (zh) 2018-07-27
CN108334894B true CN108334894B (zh) 2020-04-10

Family

ID=62924096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711498252.1A Expired - Fee Related CN108334894B (zh) 2017-12-29 2017-12-29 基于无监督机器学习的变压器油温异常识别方法

Country Status (1)

Country Link
CN (1) CN108334894B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376759A (zh) * 2018-09-10 2019-02-22 平安科技(深圳)有限公司 用户信息分类方法、装置、计算机设备和存储介质
CN109507517B (zh) * 2018-12-07 2020-10-27 国网辽宁省电力有限公司鞍山供电公司 基于双侧功率大数据比对的配电变压器运行状态分析方法
CN110738272B (zh) * 2019-10-23 2020-11-03 智洋创新科技股份有限公司 一种输电线路通道可视化机械类连续告警样本的标注方法
CN110991499B (zh) * 2019-11-18 2023-04-07 广东省特种设备检测研究院珠海检测院 一种电梯液压缓冲器隐患识别方法及系统
CN111814302B (zh) * 2020-05-28 2024-03-08 嘉兴市恒光电力建设有限责任公司 一种变压器绝缘油温度采集传输回路故障排除系统及方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512474A (zh) * 2015-12-02 2016-04-20 国网山东省电力公司电力科学研究院 一种变压器状态监测数据的异常检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512474A (zh) * 2015-12-02 2016-04-20 国网山东省电力公司电力科学研究院 一种变压器状态监测数据的异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
电力变压器的智能化故障诊断识别研究;王坤泉;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20150331;第20-39页 *

Also Published As

Publication number Publication date
CN108334894A (zh) 2018-07-27

Similar Documents

Publication Publication Date Title
CN108334894B (zh) 基于无监督机器学习的变压器油温异常识别方法
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN109829497B (zh) 一种基于监督学习的台区用户识别及判别方法
Bashkari et al. Outage cause detection in power distribution systems based on data mining
CN104361414B (zh) 一种基于相关向量机的输电线路覆冰预测方法
CN110610121B (zh) 基于曲线聚类的小时级源荷功率异常数据辨识与修复方法
CN112070128A (zh) 一种基于深度学习的变压器故障诊断方法
CN113987033B (zh) 主变在线监测数据群体偏差识别与校准方法
CN115270965A (zh) 一种配电网线路故障预测方法和装置
CN109409444B (zh) 一种基于先验概率的多元电网故障类型的判别方法
CN110674120A (zh) 一种风电场数据清洗方法及装置
CN111104972A (zh) 基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法
CN110223193A (zh) 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统
CN112147432A (zh) 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统
CN116522268B (zh) 一种配电网的线损异常识别方法
CN104077493A (zh) 一种电力继电保护系统状态评估指标体系的构建方法
CN110766313A (zh) 一种基于运维检修制度的电缆隧道综合状态评价方法
CN110705859A (zh) 基于pca-自组织神经网络的中低压配电网运行状态评估方法
CN109829627A (zh) 一种基于集成学习方案的电力系统动态安全置信评估方法
CN113125903A (zh) 线损异常检测方法、装置、设备及计算机可读存储介质
Fonseca et al. Unsupervised load shape clustering for urban building performance assessment
CN117214637A (zh) 充电枪耐压测试方法、装置、设备及存储介质
CN109784777B (zh) 基于时序信息片段云相似度度量的电网设备状态评估方法
CN113205125A (zh) 一种基于XGBoost的特高压换流阀运行状态评估方法
CN112363012A (zh) 一种电网故障预警装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200728

Address after: 330096 Jiangxi Province, Nanchang city high tech Development Zone, Tellhow building

Co-patentee after: Nanchang University

Patentee after: TELLHOW SOFTWARE Co.,Ltd.

Co-patentee after: TELLHOW SCI-TECH Co.,Ltd.

Address before: 330000 Jiangxi Province, Nanchang City Tsinghua Taihao building high-tech Development Zone

Patentee before: TELLHOW SCI-TECH Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230112

Address after: 330096 Tsinghua Taihao Building, Nanchang High-tech Development Zone, Jiangxi Province

Patentee after: TELLHOW SCI-TECH Co.,Ltd.

Patentee after: Nanchang University

Address before: 330096 Taihao Building, Nanchang High-tech Development Zone, Jiangxi Province

Patentee before: TELLHOW SOFTWARE CO.,LTD.

Patentee before: Nanchang University

Patentee before: TELLHOW SCI-TECH Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200410

CF01 Termination of patent right due to non-payment of annual fee