CN111563077A - 一种电网电压数据缺失填补方法、系统、终端及存储介质 - Google Patents

一种电网电压数据缺失填补方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN111563077A
CN111563077A CN202010399373.6A CN202010399373A CN111563077A CN 111563077 A CN111563077 A CN 111563077A CN 202010399373 A CN202010399373 A CN 202010399373A CN 111563077 A CN111563077 A CN 111563077A
Authority
CN
China
Prior art keywords
time sequence
sequence set
voltage
parameter
timing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010399373.6A
Other languages
English (en)
Other versions
CN111563077B (zh
Inventor
袁飞
叶俊
齐向
王庆
张友泉
张�杰
孙伟
杜鹏
时洪基
高山
宋衍国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202010399373.6A priority Critical patent/CN111563077B/zh
Publication of CN111563077A publication Critical patent/CN111563077A/zh
Application granted granted Critical
Publication of CN111563077B publication Critical patent/CN111563077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供一种电网电压数据缺失填补方法、系统、终端及存储介质,包括:采集电网电压时序集合和与电压相关的参数时序集合;利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合;利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型;将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。本发明通过数据之间的相关性来解决缺失数据填补问题,提高了缺失数据填补的准确性。

Description

一种电网电压数据缺失填补方法、系统、终端及存储介质
技术领域
本发明涉及电网数据分析技术领域,具体涉及一种电网电压数据缺失填补方法、系统、终端及存储介质。
背景技术
近年来,对数据分析和价值研究正越来越受到人们的重视,人们对数据的重视程度正不断提高,而电网的数据纷繁复杂,尤其是随着今年来数据采集点的不断增加,因为通讯状况,人工录入或采集故障导致数据不准确,错误,甚至缺失的情况时有发生,因此在保存数据的数据库中不可避免会有数据缺失现象的发生。
基于以上的问题,本发明提出了一种基于多属性决策联合随机森林优化的电网缺失数据填补方法,用来对缺失数据进行填补或替换,为实现电网数据的完整性和精确性提供支撑,满足电网发展需求。
发明内容
针对现有技术的上述不足,本发明提供一种电网电压数据缺失填补方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种电网电压数据缺失填补方法,包括:
采集电网电压时序集合和与电压相关的参数时序集合;
利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合;
利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型;
将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。
进一步的,所述与电压相关的参数时序集合包括:有功功率时序集合、无功功率时序集合和电流时序集合,且所述与电压相关的参数时序集合的时序与所述电压时序集合的时序同步。
进一步的,所述利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合,包括:
利用皮尔逊相关系数计算方法分别计算电压时序集合与各相关参数时序集合的相关系数;
筛选出相关系数大于预设相关阈值的相关参数时序集合作为初级相关参数时序集合;
分别计算电压时序集合与各初级相关参数时序集合的误差期望,并筛选出误差期望大于预设强相关阈值的初级相关参数时序集合作为强相关参数时序集合并输出电压时序集合与各强相关参数时序集合的强相关系数;
利用熵权法获取电压时序集合与各强相关参数时序集合的权重;
分别计算各强相关系数时序集合与电压时序集合的强相关系数与权重的乘积,得到各强相关参数时序集合与电压时序集合的综合加权值;
筛选出所述综合加权值达到预设综合阈值的强相关参数时序集合作为电压时序集合的关联时序集合。
进一步的,所述利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型,包括:
对历史电压时序集合和关联参数时序集合进行Bootstrap重抽样,得到多个数据集;
生成与所述多个数据集对应的多棵CRAT决策树并通过所述多棵CRAT决策树构建随机森林模型;
利用历史电压时序集合和关联参数时序集合对所述随机森林模型进行训练。
进一步的,在所述将电网电压时序集合的关联参数时序集合输入所述随机森林回归模型之后,所述方法还包括:
采集所述随机森林模型的所有决策树的预测值;
计算所述预测值的平均值作为填补值。
第二方面,本发明提供一种电网电压数据缺失填补系统,包括:
数据采集单元,配置用于采集电网电压时序集合和与电压相关的参数时序集合;
关联筛选单元,配置用于利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合;
模型训练单元,配置用于利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型;
填补预测单元,配置用于将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。
进一步的,所述关联筛选单元包括:
系数计算模块,配置用于利用皮尔逊相关系数计算方法分别计算电压时序集合与各相关参数时序集合的相关系数;
相关筛选模块,配置用于筛选出相关系数大于预设相关阈值的相关参数时序集合作为初级相关参数时序集合;
期望计算模块,配置用于分别计算电压时序集合与各初级相关参数时序集合的误差期望,并筛选出误差期望大于预设强相关阈值的初级相关参数时序集合作为强相关参数时序集合并输出电压时序集合与各强相关参数时序集合的强相关系数;
权值获取模块,配置用于利用熵权法获取电压时序集合与各强相关参数时序集合的权重;
综合加权模块,配置用于分别计算各强相关系数时序集合与电压时序集合的强相关系数与权重的乘积,得到各强相关参数时序集合与电压时序集合的综合加权值;
关联确定模块,配置用于筛选出所述综合加权值达到预设综合阈值的强相关参数时序集合作为电压时序集合的关联时序集合。
进一步的,所述模型训练单元包括:
数据抽样模块,配置用于对历史电压时序集合和关联参数时序集合进行Bootstrap重抽样,得到多个数据集;
模型构建模块,配置用于生成与所述多个数据集对应的多棵CRAT决策树并通过所述多棵CRAT决策树构建随机森林模型;
模型训练模块,配置用于利用历史电压时序集合和关联参数时序集合对所述随机森林模型进行训练。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的电网电压数据缺失填补方法、系统、终端及存储介质,充分利用电网中数据之间的相关性,选取具有强相关的属性数据作为缺失数据填补的参考依据,同时通过动态时间弯曲距离来衡量各属性缺失时刻数据与历史数据的相似程度,找出与缺失时刻最相似时刻的数据来替代缺失时刻数据。本发明通过数据之间的相关性来解决缺失数据填补问题,提高了缺失数据填补的准确性。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的系统的示意性框图。
图3为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种电网电压数据缺失填补系统。
如图1所示,该方法100包括:
步骤110,采集电网电压时序集合和与电压相关的参数时序集合;
步骤120,利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合;
步骤130,利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型;
步骤140,将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。
为了便于对本发明的理解,下面以本发明电网电压数据缺失填补方法的原理,结合实施例中对电网电压数据缺失进行填补的过程,对本发明提供的电网电压数据缺失填补方法做进一步的描述。
具体的,所述电网电压数据缺失填补方法包括:
S1、采集电网电压时序集合和与电压相关的参数时序集合。
本实施例采集需要填补电压值期间内的电压时序集合,例如需要对近一个月内的电压监测值进行填补,则采集一个月内的电压监测值,并按照监测时间对一个月内的电压监测值进行排序,例如每天采集一次监测电压值则得到一个电压时序集合(V1,V2,…,V30),同时采集与电压时序集合同时期且时序完全同步的有功功率时序集合、无功功率时序集合、电流时序集合、频率时序集合、占空比时序集合等等多种与电压相关的参数时序集合。
S2、利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合。
通过皮尔逊相关系数分别计算电压时序集合与各参数时序集合间的相关系数,选择相关系数大于α(α为给定阀值)的参数时序集合存入互相关集合HG。其中皮尔逊相关系数计算方法为现有技术,并非本申请所要保护的内容,不做详细介绍。
进一步计算HG集合中所有参数时序集合与电压时序集合的误差期望EXPError(Xk,Yk)
Figure BDA0002488858460000071
Cov(Xk,Yk)为Xk,Yk的协方差;Var[Xk]为Xk的方差;Var[Yk]为Yk的方差;Xk为电压时序集合;Yk为任意参数时序集合。
若EXPError(Xk,Yk)>β(β为强相关阀值),则为强相关参数时序集合,保留到强相关集合QX中,输出各强相关参数时序集合的强相关系数s,强相关系数s即为误差期望值EXPError(Xk,Yk)。得到强相关系数向量S=[s1,s2,…,sm],其中,m为强相关参数时序集合的个数。
对集合QX中的各属性采用熵权法确立其属性间的权重,得到权重向量如下:
W=[w1,w2,...,wm]
m为强相关参数时序集合的个数。
据强相关系数得到的属性综合加权值SX:
SX[W1S1,W2S1,...,WmSm]
根据各历史断面数据的属性综合加权值按从大到小排序,设置选择阈值,选择阀值较大的强相关参数时序集合作为电压时序集合的关联参数时序集合。
S3、利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型。
采用Bootstrap重抽样处理历史电压时序集合和所述历史电压时序集合的关联参数时序集合,本实施例中历史电压时序集合为填补完成的电压时序集合。形成K个数据集,并由此生成K棵CRAT决策树,CRAT决策树生成方法为现有技术,不做详细介绍。通过K棵CRAT决策树生成随机森林模型,其方法也为现有技术,不做详细介绍。将历史电压时序集合和所述历史电压时序集合的关联参数时序集合划分为训练集和测试集,执行对随机森林模型训练和测试,得到准确的随机森林模型。
S4、将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。
将步骤S1中待填补的电压时序集合的关联参数时序集合输入步骤S3训练出的随机森林模型,可以得到每棵决策树给出的预测值,对所有预测值进行平均值计算,得到一个预测电压时序集合。获取需要填补的电压值的监测时间,从预测电压时序集合中采集相同监测时间下的预测值,将该预测值作为填补电压值。
若需要替换电压时序集合中的错误电压值,则将预测电压时序集合与电压时序集合做差(相同监测时间的电压值做差),若存在差值大于预设阈值的电压,则需要进行替换,将该监测时间下的预测电压值更新为电压时序集合中相同监测时间的监测电压值。
如图2示,该系统200包括:
数据采集单元210,配置用于采集电网电压时序集合和与电压相关的参数时序集合;
关联筛选单元220,配置用于利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合;
模型训练单元230,配置用于利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型;
填补预测单元240,配置用于将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。
可选地,作为本发明一个实施例,所述关联筛选单元包括:
系数计算模块,配置用于利用皮尔逊相关系数计算方法分别计算电压时序集合与各相关参数时序集合的相关系数;
相关筛选模块,配置用于筛选出相关系数大于预设相关阈值的相关参数时序集合作为初级相关参数时序集合;
期望计算模块,配置用于分别计算电压时序集合与各初级相关参数时序集合的误差期望,并筛选出误差期望大于预设强相关阈值的初级相关参数时序集合作为强相关参数时序集合并输出电压时序集合与各强相关参数时序集合的强相关系数;
权值获取模块,配置用于利用熵权法获取电压时序集合与各强相关参数时序集合的权重;
综合加权模块,配置用于分别计算各强相关系数时序集合与电压时序集合的强相关系数与权重的乘积,得到各强相关参数时序集合与电压时序集合的综合加权值;
关联确定模块,配置用于筛选出所述综合加权值达到预设综合阈值的强相关参数时序集合作为电压时序集合的关联时序集合。
可选地,作为本发明一个实施例,所述模型训练单元包括:
数据抽样模块,配置用于对历史电压时序集合和关联参数时序集合进行Bootstrap重抽样,得到多个数据集;
模型构建模块,配置用于生成与所述多个数据集对应的多棵CRAT决策树并通过所述多棵CRAT决策树构建随机森林模型;
模型训练模块,配置用于利用历史电压时序集合和关联参数时序集合对所述随机森林模型进行训练。
图3为本发明实施例提供的一种终端系统300的结构示意图,该终端系统300可以用于执行本发明实施例提供的电网电压数据缺失填补方法。
其中,该终端系统300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器310可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明充分利用电网中数据之间的相关性,选取具有强相关的属性数据作为缺失数据填补的参考依据,同时通过动态时间弯曲距离来衡量各属性缺失时刻数据与历史数据的相似程度,找出与缺失时刻最相似时刻的数据来替代缺失时刻数据。本发明通过数据之间的相关性来解决缺失数据填补问题,提高了缺失数据填补的准确性,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种电网电压数据缺失填补方法,其特征在于,包括:
采集电网电压时序集合和与电压相关的参数时序集合;
利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合;
利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型;
将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。
2.根据权利要求1所述的方法,其特征在于,所述与电压相关的参数时序集合包括:有功功率时序集合、无功功率时序集合和电流时序集合,且所述与电压相关的参数时序集合的时序与所述电压时序集合的时序同步。
3.根据权利要求1所述的方法,其特征在于,所述利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合,包括:
利用皮尔逊相关系数计算方法分别计算电压时序集合与各相关参数时序集合的相关系数;
筛选出相关系数大于预设相关阈值的相关参数时序集合作为初级相关参数时序集合;
分别计算电压时序集合与各初级相关参数时序集合的误差期望,并筛选出误差期望大于预设强相关阈值的初级相关参数时序集合作为强相关参数时序集合并输出电压时序集合与各强相关参数时序集合的强相关系数;
利用熵权法获取电压时序集合与各强相关参数时序集合的权重;
分别计算各强相关系数时序集合与电压时序集合的强相关系数与权重的乘积,得到各强相关参数时序集合与电压时序集合的综合加权值;
筛选出所述综合加权值达到预设综合阈值的强相关参数时序集合作为电压时序集合的关联时序集合。
4.根据权利要求1所述的方法,其特征在于,所述利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型,包括:
对历史电压时序集合和关联参数时序集合进行Bootstrap重抽样,得到多个数据集;
生成与所述多个数据集对应的多棵CRAT决策树并通过所述多棵CRAT决策树构建随机森林模型;
利用历史电压时序集合和关联参数时序集合对所述随机森林模型进行训练。
5.根据权利要求1所述的方法,其特征在于,在所述将电网电压时序集合的关联参数时序集合输入所述随机森林回归模型之后,所述方法还包括:
采集所述随机森林模型的所有决策树的预测值;
计算所述预测值的平均值作为填补值。
6.一种电网电压数据缺失填补系统,其特征在于,包括:
数据采集单元,配置用于采集电网电压时序集合和与电压相关的参数时序集合;
关联筛选单元,配置用于利用基于误差期望的属性加权策略筛选所述电压时序集合的关联参数时序集合;
模型训练单元,配置用于利用历史电压时序集合和所述历史电压时序集合的关联参数时序集合训练随机森林回归模型;
填补预测单元,配置用于将所述电网电压时序集合的关联参数时序集合输入所述随机森林回归模型,获取所述电压时序集合的缺失电压数据。
7.根据权利要求6所述的系统,其特征在于,所述关联筛选单元包括:
系数计算模块,配置用于利用皮尔逊相关系数计算方法分别计算电压时序集合与各相关参数时序集合的相关系数;
相关筛选模块,配置用于筛选出相关系数大于预设相关阈值的相关参数时序集合作为初级相关参数时序集合;
期望计算模块,配置用于分别计算电压时序集合与各初级相关参数时序集合的误差期望,并筛选出误差期望大于预设强相关阈值的初级相关参数时序集合作为强相关参数时序集合并输出电压时序集合与各强相关参数时序集合的强相关系数;
权值获取模块,配置用于利用熵权法获取电压时序集合与各强相关参数时序集合的权重;
综合加权模块,配置用于分别计算各强相关系数时序集合与电压时序集合的强相关系数与权重的乘积,得到各强相关参数时序集合与电压时序集合的综合加权值;
关联确定模块,配置用于筛选出所述综合加权值达到预设综合阈值的强相关参数时序集合作为电压时序集合的关联时序集合。
8.根据权利要求6所述的系统,其特征在于,所述模型训练单元包括:
数据抽样模块,配置用于对历史电压时序集合和关联参数时序集合进行Bootstrap重抽样,得到多个数据集;
模型构建模块,配置用于生成与所述多个数据集对应的多棵CRAT决策树并通过所述多棵CRAT决策树构建随机森林模型;
模型训练模块,配置用于利用历史电压时序集合和关联参数时序集合对所述随机森林模型进行训练。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-5任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
CN202010399373.6A 2020-05-12 2020-05-12 一种电网电压数据缺失填补方法、系统、终端及存储介质 Active CN111563077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010399373.6A CN111563077B (zh) 2020-05-12 2020-05-12 一种电网电压数据缺失填补方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010399373.6A CN111563077B (zh) 2020-05-12 2020-05-12 一种电网电压数据缺失填补方法、系统、终端及存储介质

Publications (2)

Publication Number Publication Date
CN111563077A true CN111563077A (zh) 2020-08-21
CN111563077B CN111563077B (zh) 2023-04-25

Family

ID=72070890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010399373.6A Active CN111563077B (zh) 2020-05-12 2020-05-12 一种电网电压数据缺失填补方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111563077B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112578188A (zh) * 2020-11-04 2021-03-30 深圳供电局有限公司 电气量波形的生成方法、装置、计算机设备和存储介质
CN113468796A (zh) * 2021-04-13 2021-10-01 广西电网有限责任公司南宁供电局 一种基于改进随机森林算法的电压缺失数据辨识方法
CN113781019A (zh) * 2021-11-12 2021-12-10 中国环境监测总站 一种监测数据自动筛选融合的方法及装置
CN114065878A (zh) * 2022-01-17 2022-02-18 国网山东省电力公司泰安供电公司 一种基于多参量物联融合技术的电量缺失值填补方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255480A (zh) * 2018-08-30 2019-01-22 中国平安人寿保险股份有限公司 间佣率预测方法、装置、计算机设备及存储介质
CN109936113A (zh) * 2019-03-29 2019-06-25 国网浙江省电力有限公司 一种基于随机森林算法的保护动作智能诊断方法及系统
CN110135630A (zh) * 2019-04-25 2019-08-16 武汉数澎科技有限公司 基于随机森林回归和多步寻优的短期负荷需求预测方法
CN110597799A (zh) * 2019-09-17 2019-12-20 上海仪电(集团)有限公司中央研究院 一种时序数据缺失值自动填补方法、系统和设备
CN110991696A (zh) * 2019-11-04 2020-04-10 广州丰石科技有限公司 一种客流数据缺失填补的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255480A (zh) * 2018-08-30 2019-01-22 中国平安人寿保险股份有限公司 间佣率预测方法、装置、计算机设备及存储介质
CN109936113A (zh) * 2019-03-29 2019-06-25 国网浙江省电力有限公司 一种基于随机森林算法的保护动作智能诊断方法及系统
CN110135630A (zh) * 2019-04-25 2019-08-16 武汉数澎科技有限公司 基于随机森林回归和多步寻优的短期负荷需求预测方法
CN110597799A (zh) * 2019-09-17 2019-12-20 上海仪电(集团)有限公司中央研究院 一种时序数据缺失值自动填补方法、系统和设备
CN110991696A (zh) * 2019-11-04 2020-04-10 广州丰石科技有限公司 一种客流数据缺失填补的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112578188A (zh) * 2020-11-04 2021-03-30 深圳供电局有限公司 电气量波形的生成方法、装置、计算机设备和存储介质
CN113468796A (zh) * 2021-04-13 2021-10-01 广西电网有限责任公司南宁供电局 一种基于改进随机森林算法的电压缺失数据辨识方法
CN113781019A (zh) * 2021-11-12 2021-12-10 中国环境监测总站 一种监测数据自动筛选融合的方法及装置
CN114065878A (zh) * 2022-01-17 2022-02-18 国网山东省电力公司泰安供电公司 一种基于多参量物联融合技术的电量缺失值填补方法

Also Published As

Publication number Publication date
CN111563077B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN111563077A (zh) 一种电网电压数据缺失填补方法、系统、终端及存储介质
Weron Heavy-tails and regime-switching in electricity prices
CN104424235B (zh) 实现用户信息聚类的方法和装置
CN111314173B (zh) 监控信息异常的定位方法、装置、计算机设备及存储介质
CN111368259B (zh) 一种配网电压数据缺失填补方法及相关装置
CN111198799A (zh) 一种基于lstm的机房功耗预警方法、系统、终端及存储介质
CN113268403A (zh) 时间序列的分析预测方法、装置、设备及存储介质
CN110161300A (zh) 一种低压供电的监测方法及监控装置
CN109492863A (zh) 金融单证的自动生成方法及装置
CN115795329A (zh) 一种基于大数据网格下的用电异常行为分析方法和装置
CN114357811A (zh) 长历时旱涝事件的确定方法、装置和设备
CN113919763A (zh) 一种基于模糊评判矩阵的电网灾害分析方法及装置
CN115361266A (zh) 告警根因定位方法、装置、设备及存储介质
CN111476438A (zh) 一种用户用电量预测方法、系统以及设备
CN111475251A (zh) 一种集群容器调度方法、系统、终端及存储介质
CN111478311A (zh) 一种电网任意分区线损计算方法及系统
CN112039111A (zh) 一种新能源微电网参与电网调峰能力的方法及系统
CN114662832A (zh) 人口流动分析方法、装置及电子设备
CN114764535A (zh) 用于仿真的电力数据处理方法、装置、设备及存储介质
CN114648156A (zh) 一种基于卷积神经网络的时间序列负荷预测方法
CN112511324B (zh) 基于大数据的用户满意度评估方法及装置
CN109492913B (zh) 一种配电终端的模块化风险预测方法、装置及可存储介质
CN112803427A (zh) 基于需求的区域电网调度方法、系统、终端及存储介质
CN111401729A (zh) 一种新增黑启动机组布点确定方法及系统
CN110209713A (zh) 异常网架结构识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant