CN107862409A - 一种基于回归分析的变电站输变电设备大量缺失数据填补方法 - Google Patents

一种基于回归分析的变电站输变电设备大量缺失数据填补方法 Download PDF

Info

Publication number
CN107862409A
CN107862409A CN201711077209.8A CN201711077209A CN107862409A CN 107862409 A CN107862409 A CN 107862409A CN 201711077209 A CN201711077209 A CN 201711077209A CN 107862409 A CN107862409 A CN 107862409A
Authority
CN
China
Prior art keywords
data
mrow
msub
regression model
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711077209.8A
Other languages
English (en)
Other versions
CN107862409B (zh
Inventor
王有元
陈伟根
何怡刚
廖瑞金
杜林�
李剑
赵玉顺
刘航
李后英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Hefei University of Technology
Original Assignee
Chongqing University
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University, Hefei University of Technology filed Critical Chongqing University
Priority to CN201711077209.8A priority Critical patent/CN107862409B/zh
Publication of CN107862409A publication Critical patent/CN107862409A/zh
Application granted granted Critical
Publication of CN107862409B publication Critical patent/CN107862409B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于回归分析的变电站输变电设备大量缺失数据填补方法,主要包括以下步骤:1)确定需要填补缺失数据的变电站输变电设备和待填补的数据类。2)设定所述设备的数据表示为:y={y1,...,yi,...,yj,...,yn}。3)收集所述设备所在的变电站内其余同型设备的相同类型的数据X。4)利用数据X和数据y建立待填补数据的回归分析模型y=f(X)。5)利用非缺失数据{y1,...,yi,...,yj}进行回归模型的训练,得到训练好的回归模型。6)将数据输入训练好的回归模型,得到数据{yj+1,...,yn}的预测结果。7)将所述预测结果作为新值,实现对缺失数据的填补。

Description

一种基于回归分析的变电站输变电设备大量缺失数据填补 方法
技术领域
本发明涉及电力设备数据清洗领域,具体是一种基于回归分析的变电站输变电设备大量缺失数据填补方法。
背景技术
随着变电站输变电设备状态监测技术的发展,可监测的设备种类和数据类型不断增加。然而当监测设备出现故障、通信或数据传输终止、数据上传失败等情况时,将引起数据的大量连续缺失。缺失数据降低了数据的真实性,难以保证数据分析和数据挖掘结果的准确性。常用的缺失数据填补方法往往采用插值方法,人工填充方法、数值替换法等。但他们仅适用于对少量数据的填补。当数据出现大量连续的缺失值时,采用上述填补方法会引起较大的误差,甚至降低数据质量,因此需要提出一种新的有效的缺失数据填补方法。
发明内容
本发明的目的是解决现有技术中存在的问题。
为实现本发明目的而采用的技术方案是这样的,一种基于回归分析的变电站输变电设备大量缺失数据填补方法,其特征在于,主要包括以下步骤:
1)确定需要填补缺失数据的变电站输变电设备。
2)确定所述设备待填补的数据类型。
进一步,数据类型主要包括数值型时间序列数据。数值型时间序列数据主要包括在线监测数据和能量管理系统数据。在线监测数据主要包括油中溶解气体和气体密度。能量管理系统数据主要包括电压、电流、有功功率和无功功率。
设定所述设备的数据表示为:y={y1,...,yi,...,yj,...,yn}。 (1)
式中,n为数据序列的长度。{y1,...,yi,...,yj}为完整数据;{yj+1,...,yn}为缺失数据。
3)收集所述设备所在的变电站内其余同型设备的相同类型的数据X,所述数据X表示如下:
式中,m为所述变电站同型设备台数。xmn为第m台设备的第n条数据。
4)利用数据X和数据y建立待填补数据的回归分析模型。设回归模型的形式为y=A·f(X)+B。 (3)
其中,A和B均为回归模型的参数。
进一步,建立的回归分析模型可以是多元线性回归模型。
5)利用非缺失数据{y1,...,yi,...,yj}进行回归模型的训练。回归模型训练步骤如下:
5.1)将所述数据X的前j条数据设为X'。将所述数据X'和所述完整数据{y1,...,yi,...,yj}输入到建立好的初始回归模型y=A·f(X)+B中。输入数据后的回归模型如下式所示:
yi=A0·f(Xi)+B0i,i=1,...,j.。 (4)
其中,A0和B0定义为回归模型的训练前的初始参数。εi为第i个拟合值的误差。
5.2)以预测误差序列的平方和最小为目标,对回归模型进行训练,直到找到某组参数A’和B’使得下式成立:
此时,回归模型完成训练,得到训练好的回归模型:
y=A'·f(X)+B'。 (6)
6)将数据输入训练好的回归模型,得到数据{yj+1,...,yn}的预测结果。
7)将所述预测结果作为新值,实现对缺失数据的填补。
本发明的技术效果是毋庸置疑的,本发明利用一种基于回归分析的变电站输变电设备大量缺失数据填补方法,收集其它同型设备相同的监测数据,并建立待填补数据的回归分析模型,当该设备的数据出现缺失时,可以利用其他设备的同型数据进行回归预测,并将预测值作为填补值进行数据填补。
附图说明
图1为变压器1、变压器2、变压器3和变压器4在5月份的有功功率数据。
图2为缺失值填补效果对比图。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
一种基于回归分析的变电站输变设备大量缺失数据填补方法,主要包括以下步骤:
1)确定需要填补缺失数据的变电站输变电设备。
优选的,变电站输变电设备主要包括开关、刀闸、母线、CT(TA)、PT(TV)、变压器、电力电缆(高压)、避雷器、避雷针、电力电容、谐波阻抗器、接地电压器、微机保护装置、测控单元、变电站监控后台、计量表计、直流系统、逆变电源、光通设备、CT(二次)、PT(二次)、测温装置、接地选线装置、刀闸开关操作回路(操作箱、操作插件)、二次接地系统、信号和电源防雷模块等。
2)确定所述设备待填补的数据类型。
进一步,数据类型主要包括数值型时间序列数据。数值型时间序列数据主要包括在线监测数据和能量管理系统数据。在线监测数据主要包括油中溶解气体和气体密度。能量管理系统数据主要包括电压、电流、有功功率和无功功率。
设定所述设备的数据表示为:y={y1,...,yi,...,yj,...,yn}。 (1)
式中,n为数据序列的长度。{y1,...,yi,...,yj}为完整数据。{yj+1,...,yn}为缺失数据。
3)收集所述设备所在的变电站内其余同型设备的相同类型的数据X,所述数据X表示如下:
式中,m为所述变电站同型设备台数。xmn为第m台设备的第n条数据。
4)利用数据X和数据y建立待填补数据的回归分析模型。设回归模型的形式为y=A·f(X)+B。 (3)
其中,A和B均为回归模型的参数。
进一步,建立的回归分析模型可以是多元线性回归模型。
5)利用非缺失数据{y1,...,yi,...,yj}进行回归模型的训练。回归模型训练步骤如下:
5.1)将所述数据X的前j条数据设为X'。将所述数据X'和所述完整数据{y1,...,yi,...,yj}输入到建立好的初始回归模型y=A·f(X)+B中。输入数据后的回归模型如下式所示:
yi=A0·f(Xi)+B0i,i=1,...,j.。 (4)
其中,A0和B0定义为回归模型的训练前的初始参数。εi为第i个拟合值的误差。
注:不同回归模型的参数有较大区别。
5.2)以预测误差序列的平方和最小为目标,对回归模型进行训练,直到找到某组参数A’和B’使得下式成立:
此时,模型完成训练,得到训练好的回归模型:
y=A'·f(X)+B'。 (6)
6)将数据输入训练好的回归模型,得到数据{yj+1,...,yn}的预测结果。
7)将所述预测结果作为新值,实现对缺失数据的填补。
进一步,由于同一变电站往往由多种同型设备并联运行,各设备的运行工况十分相近,不同设备的相同类型数据具有较好的关联性和相似的变化规律。因此,填补数据与真实数据具有极高的吻合性。
实施例2:
参见图1和图2,选定一个共有4台500kV电力变压器的变电站。4台变压器分别为变压器1、变压器2、变压器3和变压器4。假设在5月25号至30号期间,变压器4有功功率出现缺失,对缺失的有功功率数据进行填补的主要步骤如下:
1)收集变压器1、变压器2、变压器3和变压器4在5月份的有功功率数据,如附图1所示,各变压器的功率变化趋势十分相近。
2)利用多元线性回归模型建立回归方程,变压器1、变压器2和变压器3的有功功率作为回归模型的输入,变压器4的有功功率作为输出。
3)以变压器1、变压器2、变压器3和变压器4在5月1号至5月24号期间的有功功率数据对回归模型进行训练,得到回归模型训练结果如下所示:
y=3.3535+0.021841·x1+0.033159·x2+0.98432·x3 (7)
式中,x1为变压器1的有功功率。x2为变压器2的有功功率。x3变压器3的有功功率。y为变压器4的有功功率。
4)以变压器1、变压器2和变压器3在5月25号至30号期间的有功功率数据为输入,利用回归模型训练结果对变压器4的有功功率进行计算,并将计算结果作为填补值,完成变压器4在5月25号至30号期间的有功功率缺失数据的填补工作。
填补值与真实值对比如图2所示,结果显示,填补数据与真实数据具有极高的吻合性,验证了本发明的有效性。

Claims (3)

1.一种基于回归分析的变电站输变电设备大量缺失数据填补方法,其特征在于,主要包括以下步骤:
1)确定需要填补缺失数据的变电站输变电设备;
2)确定所述设备待填补的数据类型;数据类型主要针对数值型时间序列数据;
设定所述设备的数据表示为:y={y1,...,yi,...,yj,...,yn}; (1)
式中,n为数据序列的长度;{y1,...,yi,...,yj}为完整数据;{yj+1,...,yn}为缺失数据;
3)收集所述设备所在的变电站内其余同型设备的相同类型的数据X,所述数据X表示如下:
<mrow> <mi>X</mi> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>11</mn> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mn>1</mn> <mi>i</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mn>1</mn> <mi>n</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>21</mn> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mn>2</mn> <mi>i</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mn>2</mn> <mi>n</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>...</mn> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mn>1</mn> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>i</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mi>m</mi> <mi>n</mi> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
式中,m为所述变电站同型设备台数;xmn为第m台设备的第n条数据;
4)利用数据X和数据y建立待填补数据的回归分析模型;设回归模型的形式为y=A·f(X)+B; (3)
其中,A和B均为回归模型的参数;
5)利用非缺失数据{y1,...,yi,...,yj}进行回归模型的训练;回归模型训练步骤如下:
5.1)将所述数据X的前j条数据设为X';将所述数据X'和所述完整数据{y1,...,yi,...,yj}输入到建立好的初始回归模型y=A·f(X)+B中;输入数据后的回归模型如下式所示:
yi=A0·f(Xi)+B0i,i=1,...,j.; (4)
其中,A0和B0定义为回归模型的训练前的初始参数;εi为第i个拟合值的误差;
5.2)以预测误差序列的平方和最小为目标,对回归模型进行训练,直到找到某组参数A’和B’使得下式成立:
<mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>j</mi> </munderover> <msubsup> <mi>&amp;epsiv;</mi> <mi>i</mi> <mn>2</mn> </msubsup> <mo>=</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
此时,模型完成训练,得到训练好的回归模型:
y=A'·f(X)+B'; (6)
6)将数据输入训练好的回归模型y=A'·f(X)+B',得到数据{yj+1,...,yn}的预测结果;
7)将所述预测结果作为新值,实现对缺失数据的填补。
2.根据权利要求1所述的一种基于回归分析的变电站输变电设备大量缺失数据填补方法,其特征在于:回归分析模型可以是多元线性回归模型。
3.根据权利要求1所述的一种基于回归分析的变电站输变电设备大量缺失数据填补方法,其特征在于:数值型时间序列数据主要包括在线监测数据和能量管理系统数据;在线监测数据主要包括油中溶解气体和气体密度;能量管理系统数据主要包括电压、电流、有功功率和无功功率。
CN201711077209.8A 2017-11-06 2017-11-06 一种基于回归分析的变电站输变电设备大量缺失数据填补方法 Active CN107862409B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711077209.8A CN107862409B (zh) 2017-11-06 2017-11-06 一种基于回归分析的变电站输变电设备大量缺失数据填补方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711077209.8A CN107862409B (zh) 2017-11-06 2017-11-06 一种基于回归分析的变电站输变电设备大量缺失数据填补方法

Publications (2)

Publication Number Publication Date
CN107862409A true CN107862409A (zh) 2018-03-30
CN107862409B CN107862409B (zh) 2021-11-02

Family

ID=61700992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711077209.8A Active CN107862409B (zh) 2017-11-06 2017-11-06 一种基于回归分析的变电站输变电设备大量缺失数据填补方法

Country Status (1)

Country Link
CN (1) CN107862409B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563739A (zh) * 2018-04-11 2018-09-21 平安科技(深圳)有限公司 天气数据获取方法及装置、计算机装置及可读存储介质
CN109408767A (zh) * 2018-10-17 2019-03-01 国网四川省电力公司乐山供电公司 一种面向电网缺失数据的填补方法
CN109726503A (zh) * 2019-01-12 2019-05-07 国电联合动力技术有限公司 缺失数据填补方法及装置
CN113704697A (zh) * 2021-08-31 2021-11-26 平安科技(深圳)有限公司 基于多元回归模型的医疗数据缺失处理方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102651116A (zh) * 2012-03-31 2012-08-29 上海市电力公司 一种电力负荷数据精细化处理方法
WO2014013693A1 (ja) * 2012-07-18 2014-01-23 パナソニック株式会社 計測量監視装置、プログラム
CN103793613A (zh) * 2013-12-13 2014-05-14 北京航空航天大学 基于回归分析和rbf神经网络的退化数据缺失插补方法
CN105469123A (zh) * 2015-12-30 2016-04-06 华东理工大学 一种基于k平面回归的缺失数据补全方法
CN107193876A (zh) * 2017-04-21 2017-09-22 美林数据技术股份有限公司 一种基于最近邻knn算法的缺失数据填补方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102651116A (zh) * 2012-03-31 2012-08-29 上海市电力公司 一种电力负荷数据精细化处理方法
WO2014013693A1 (ja) * 2012-07-18 2014-01-23 パナソニック株式会社 計測量監視装置、プログラム
CN103793613A (zh) * 2013-12-13 2014-05-14 北京航空航天大学 基于回归分析和rbf神经网络的退化数据缺失插补方法
CN105469123A (zh) * 2015-12-30 2016-04-06 华东理工大学 一种基于k平面回归的缺失数据补全方法
CN107193876A (zh) * 2017-04-21 2017-09-22 美林数据技术股份有限公司 一种基于最近邻knn算法的缺失数据填补方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563739A (zh) * 2018-04-11 2018-09-21 平安科技(深圳)有限公司 天气数据获取方法及装置、计算机装置及可读存储介质
CN109408767A (zh) * 2018-10-17 2019-03-01 国网四川省电力公司乐山供电公司 一种面向电网缺失数据的填补方法
CN109726503A (zh) * 2019-01-12 2019-05-07 国电联合动力技术有限公司 缺失数据填补方法及装置
CN113704697A (zh) * 2021-08-31 2021-11-26 平安科技(深圳)有限公司 基于多元回归模型的医疗数据缺失处理方法、装置及设备
CN113704697B (zh) * 2021-08-31 2023-12-26 平安科技(深圳)有限公司 基于多元回归模型的医疗数据缺失处理方法、装置及设备

Also Published As

Publication number Publication date
CN107862409B (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN107862409A (zh) 一种基于回归分析的变电站输变电设备大量缺失数据填补方法
CN105608634A (zh) 一种基于贝叶斯网络的电网风险预警评估模型
CN112330117B (zh) 一种配电网规划年供电可靠性评估方法和装置
CN104392083A (zh) 一种基于全网拓朴的停电风险与可靠性分析方法
CN106130781B (zh) 基于配电网拓扑模型的变压器故障累积效应评估方法
CN104037776A (zh) 随机惯性因子粒子群优化算法的电网无功容量配置方法
CN104715423A (zh) 一种配电网风险与可靠性评估方法
CN107633320A (zh) 一种基于气象预测和风险评估的电网线路重要度评估方法
CN110266037A (zh) 基于拓扑自动聚合的分布式新能源全观测建模方法和系统
CN103714491A (zh) 一种基于风险的电网调度操作票最佳序列生成方法
CN107069705A (zh) 一种电网元件连锁故障模拟方法
CN105656036B (zh) 考虑潮流和灵敏度一致性等值的概率静态安全分析方法
CN111079972A (zh) 一种主动配电网可靠性规划方法、设备及介质
CN105375453B (zh) 一种基于连锁故障破坏程度指标的紧急控制方法
CN105514970A (zh) 一种基于图论的upfc监控子站布点算法
CN107147123B (zh) 短期频率稳定的广域实时协调控制系统
CN106356846A (zh) 一种基于时间的初期电网连锁故障模拟仿真方法
Wang et al. Parameter identification for a power distribution network based on MCMC algorithm
CN106845757B (zh) 一种电网潮流转移危害度评估方法
CN104050377A (zh) 一种时变设备故障概率确定方法
CN104732107B (zh) 以介质参数为评估参量的变压器套管剩余寿命预测方法
EP1389819A1 (en) Automatic creation of a design for a high or medium voltage power transmission network
Guo et al. On-line prediction of transient stability using decision tree method—Sensitivity of accuracy of prediction to different uncertainties
Chakraborty et al. Soft computing techniques in voltage security analysis
CN111369388B (zh) 用于城市电网的对抗脆弱性评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant