CN106980874B - 一种面向配网大数据的多时态维度数据融合方法 - Google Patents

一种面向配网大数据的多时态维度数据融合方法 Download PDF

Info

Publication number
CN106980874B
CN106980874B CN201710144803.8A CN201710144803A CN106980874B CN 106980874 B CN106980874 B CN 106980874B CN 201710144803 A CN201710144803 A CN 201710144803A CN 106980874 B CN106980874 B CN 106980874B
Authority
CN
China
Prior art keywords
data
value
period
sliding window
actual monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710144803.8A
Other languages
English (en)
Other versions
CN106980874A (zh
Inventor
邓松
张利平
岳东
付雄
葛辉
黄崇鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201710144803.8A priority Critical patent/CN106980874B/zh
Publication of CN106980874A publication Critical patent/CN106980874A/zh
Application granted granted Critical
Publication of CN106980874B publication Critical patent/CN106980874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Abstract

本发明公开了一种面向配网大数据的多时态维度数据融合方法,包括:根据数据源进行分类;设定统计周期,确定滑动窗口值;计算出第n个周期的平滑系数值和预测值;计算所述第n个周期实际监测值和预测值的偏离度,及与预设偏离度比较:当大于时,计算获得修改后的滑动窗口值;当小于时,取距离第n个周期的监测所得实际监测值,根据周期数进行排序得到窗口数据集合;计算各个数据的权重系数;计算得到上报数据;将计算所得上报数据添加到同类上报数据集合中;由计算得到的同类上报数据集合构成新的数据集合。本发明实现了动态调整滑动窗口值,对窗口内的数据可实时根据权重因子进行融合,保证了更好的数据融合效果,为上层服务提供数据基础。

Description

一种面向配网大数据的多时态维度数据融合方法
技术领域
本发明涉及一种面向配网大数据的多时态维度数据融合方法,属于数据融合的技术领域。
背景技术
数据融合的概念产生于20世纪70年代,但是直接促使其发展的是进入20世纪90年代以后,随着计算机技术、通信技术的快速发展,并且两者之间的关系日益紧密,作为数据处理的新兴技术--数据融合技术,在近几年中以飞快的速度发展。数据融合研究的范围广泛,最初以军事应用为目的的数据融合技术亦可用于工业和农业,如资源管理、城市规划、气象预报、作物及地质分析等领域。数据融合的基本目的是通过一定规则的数据组合而不是任何个别元素,获取更多的信息,这是最佳协调作用的结果,利用多源数据的优势,提高数据的使用率,获得更为准确的结果。与单传感器信号处理或低层次的多传感器数据处理方式相比,多传感器数据融合有效地利用了多传感器资源信息提供的互补性,从而可以获得被探测目标和环境更为全面的信息。其关键在于数据融合所处理的多传感器信息具有更复杂的形式,而且可以在不同的信息层次上出现,信息的抽象层次包括数据层融合、特征层融合和决策层融合。数据融合技术是指利用计算机对按时序获得的若干观测信息,在一定准则下加以自动分析、综合,以完成所需的决策和评估任务而进行的信息处理技术。
配电网处于电力系统的末端,具有地域分布广、电网规模大、设备种类多、网络连接多样、运行方式多变等鲜明特点,随着城镇化建设及智能电网用电需求的增长,配电网一直在不断地改造和扩建,其规模也在不断扩大,配电网中会产生指数级增长的海量异构、多态的数据,数据集合的大小可达到当今信息学界所关注的大数据级别。而大数据具有4V特点,即高容量(Volume)、快速性(Velocity)、多样性(Variety)和价值密度低(Value),大数据带来的挑战在于它的实时处理。针对配电网大数据来源广泛、多态、异构等特点,为了更好地为配电网环境下的各类规划决策服务,研究多时态多维度的配电网大数据融合具有十分重要的意义。
面向配网大数据的多时态多维度数据融合首先要考虑的就是将来自不同数据源的基础数据经数据校验与标准化进入一体化公共数据资源池,按照规划时态进行分类,再对不同规划时态的数据确定融合权重,实现数据融合。
而目前数据融合中,所提出的指数平滑预测算法,平滑系数α是固定不变的,平滑常数α的选择十分重要,一般来说,若数据波动较大则值应取大一些,可以增大近期数据对预测结果的影响,若数据波动平稳值应取小些,使实际观察期的所有数据对预测结果的影响趋于平衡。平滑系数α的固定导致当数据发生严重波动的时候,比如突然的变长、变短,则预测的数据值就存在较大的误差,因此无法实现动态的调整平滑系数。
发明内容
本发明所要解决的技术问题在于克服现有技术的不足,提供一种面向配网大数据的多时态维度数据融合方法,解决现有的数据融合方法中平滑系数的固定导致当数据发生严重波动,使得预测的数据值存在较大的误差的问题。
本发明具体采用以下技术方案解决上述技术问题:
一种面向配网大数据的多时态维度数据融合方法,包括以下步骤:
步骤1、根据数据源进行分类,将每一类数据组成一个由有L个数据构成的集合DATEi,且由各类同类数据集合DATEi组成数据集合DATE;
步骤2、设定统计周期,在每个周期内对数据监测获得实际监测值,及对实际监测值进行融合,确定滑动窗口值Wind;
步骤3、由第n-1个周期监测的实际监测值和预测值,计算出第n个周期的平滑系数值;
步骤4、根据所得第n个周期的平滑系数值和实际监测值,计算出第n个周期的预测值;
步骤5、计算所述第n个周期的实际监测值和预测值的偏离度,及将计算所得偏离度与预设偏离度比较:当计算所得偏离度大于预设偏离度时,执行步骤6;当计算所得偏离度小于预设偏离度时,执行步骤7;
步骤6、根据第n个周期的实际监测值和预测值计算获得修改后的滑动窗口值;
步骤7、取距离第n个周期的若干周期内监测所得实际监测值,根据周期数进行排序得到窗口数据集合;
步骤8、根据所得窗口数据集合,计算修改后的滑动窗口内各个数据的权重系数;
步骤9、根据步骤8所得各个数据的权重系数,计算得到上报数据;
步骤10、将计算所得上报数据添加到同类上报数据集合DATEreporti中;判断数据集合DATE中是否存在未处理数据,将存在未处理的数据转执行步骤2,否则执行步骤11;
步骤11、由计算得到的同类上报数据集合DATEreporti构成新的数据集合DATFreport,以获得融合的数据集合。
进一步地,作为本发明的一种优选技术方案:所述步骤2确定滑动窗口值包括步骤:
选取第n个周期的前k个历史记录的数列Sk
计算获得历史记录数列Sk的平均值:其中表示第i个周期的实际监测值,且k=1,2,3,...,n-1;
结合周期内监测所得实际监测值和该周期内历史记录数列的平均值,计算获得历史记录数列的方差:
选取方差σk最小的一个历史记录数列,及将k作为滑动窗口值Wind的初值。
本发明采用上述技术方案,能产生如下技术效果:
本发明提出面向配网大数据的多时态维度数据融合方法,将来自各不同数据源的规划基础数据分类,再对不同规划时态的数据确定融合权重,实现数据融合。首先根据不同的电力数据源,将数据分成多个数据源集合,采用指数平滑预测法预测出第n个周期的预测值。且本发明利用第n-1周期的预测值和实际监测的值实现动态的调整平滑系数α。还提出了滑动窗口的方法,计算预测值和实际监测值的偏差,查看两者差值是否在设定的偏离度范围内,并根据此结果做出对滑动窗口的调整,然后计算出窗口内数据的权重系数,进而计算出第n个周期上报的数据。
本发明方法的主要优势在于:合理的动态调整平滑系数,指数平滑预测法的平滑系数是动态的,以便获得更准确的预测值,又实现了动态的调整滑动窗口的值,对窗口内的数据可以实时根据权重因子进行融合,保证了更好的数据融合效果,为上层服务提供数据基础。
附图说明
图1为本发明面向配网大数据的多时态维度数据融合方法的流程示意图。
具体实施方式
下面结合说明书附图对本发明的实施方式进行描述。
本发明提出一种面向配网大数据的多时态维度数据融合方法,该方法具体包括以下步骤:
步骤1、根据数据源进行分类,形成不同的数据分类,假设有k类数据,每一类数据都可组成一个集合DATEi,每类数据有L个数据构成同类数据集合DATEi={date1,date2,...,dateL}各类同类数据集合DATEi组成数据集合DATE,DATE={DATE1,DATE2,...,DATEk}。
步骤2、根据系统需求设定统计周期T,在每个周期内对数据监测获得实际监测值,及对实际监测值进行融合,确定滑动窗口值Wind。
若要对第n周期的数据进行预测,首先选取数列 其中Sk表示第n个周期的前k个历史记录的数列,且参数k=(1,2,3,...,n-1)。历史记录数列Sk的平均值由公式(1)计算得出,历史记录数列的方差σk由公式(2)计算得出,选取方差σk最小的一个历史记录数列,将k作为滑动窗口的初值,即Wind=k。
公式中,表示第i个周期的实际监测值。
步骤3、由第n-1个周期监测的实际监测值和预测值,确定平滑系数值α。设定初始值α,其中α∈(0,1),平滑系数的大小表示预测数据对时态变化的反应速度,设定滑动系统是随着统计周期变化的,根据公式(3)计算出第n个周期的平滑系数值。
其中,表示第n-1个周期的实际监测值,表示第n-1个周期的预测值,该数据由第n-1个周期直接已知的数据。
步骤4、根据所得第n个周期的平滑系数值和实际监测值,计算第n个周期的预测值。由步骤3得出的平滑系数α,可以由前面周期的数据,计算出第n个周期的预测数据。指数平滑预测法可以得出公式(4),将公式(4)展开得到公式(5),对公式(5)进行合并得到公式(6),由公式(6)可以计算出第n个周期的预测数据。
其中,表示第n个周期的预测值,表示第i个周期的预测值,表示第i个周期的实际监测值。
步骤5、设定偏离度Dev。由公式(7)计算出第n个周期预测值与实际监测值的偏离度Devn,如果偏离度Devn大于偏离度Dev,则调整滑动窗口值的大小,执行步骤6,否则保持滑动窗口值Wind的大小不变,转执行步骤7。
步骤6、修改窗口值的大小。由步骤5知道,第n个周期内实际监测值和预测值差距比较大,为了更好的实现数据的融合需要对滑动窗口做出改变,由公式(8)得到修改后的滑动窗口值。
步骤7、取距离第n个周期的多个周期内监测的实际监测值数据,根据周期数进行排序得到窗口数据集合其中,Wind表示修改后的滑动窗口值,由步骤6中计算获得。
步骤8、由步骤7得到的窗口数据集合DW,计算滑动窗口内各个数据的权重系数。滑动窗口内共有多个周期数据,每个数据的权重系数由公式(9)计算得出。
其中,Weighti表示滑动窗口内数据的权重系数,其中Wind表示修改后的滑动窗口值,由步骤6中计算获得。
步骤9、根据所述步骤8计算的数据的权重系数计算,计算出上报数据。由公式(10)计算得到要上报的数据。
其中,daten表示第n个周期要上报的数据。
步骤10、将上报的数据daten添加到同类上报数据集合DATEreporti中,判断集合DATE中是否存在未处理的数据,若还存在未处理的数据转执行步骤2,否则执行步骤11。
步骤11、由步骤10计算得到同类数据上报集合DATEreporti,构成新的数据集合DATEreport={DATEreport1,DATEreport2,...,DATEreportk},即为经融合处理后上报的数据,由此获得为上层提供融合的数据集合DATEreport
综上,本发明的方法合理的动态调整平滑系数,指数平滑预测法的平滑系数是动态的,以便获得更准确的预测值,又实现了动态的调整滑动窗口的值,对窗口内的数据可以实时根据权重因子进行融合,保证了更好的数据融合效果,为上层服务提供数据基础。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (6)

1.一种面向配网大数据的多时态维度数据融合方法,其特征在于,包括以下步骤:
步骤1、根据数据源进行分类,将每一类数据组成一个由有L个数据构成的集合DATEi,且由各类同类数据集合DATEi组成数据集合DATE;
步骤2、设定统计周期,在每个周期内对数据监测获得实际监测值,及对实际监测值进行融合,确定滑动窗口值Wind;
步骤3、由第n-1个周期监测的实际监测值和预测值,计算出第n个周期的平滑系数值;
步骤4、根据所得第n个周期的平滑系数值和实际监测值,计算出第n个周期的预测值;
步骤5、计算所述第n个周期的实际监测值和预测值的偏离度,及将计算所得偏离度与预设偏离度比较:当计算所得偏离度大于预设偏离度时,执行步骤6;当计算所得偏离度小于预设偏离度时,执行步骤7;
步骤6、根据第n个周期的实际监测值和预测值计算获得修改后的滑动窗口值;
步骤7、取距离第n个周期的若干周期内监测所得实际监测值,根据周期数进行排序得到窗口数据集合;
步骤8、根据所得窗口数据集合,计算修改后的滑动窗口内各个数据的权重系数;
步骤9、根据步骤8所得各个数据的权重系数,计算得到上报数据;
步骤10、将计算所得上报数据添加到同类上报数据集合DATEreporti中;判断数据集合DATE中是否存在未处理数据,若存在未处理的数据转执行步骤2,否则执行步骤11;
步骤11、由计算得到的同类上报数据集合DATEreporti构成新的数据集合DATEreport,以获得融合的数据集合。
2.根据权利要求1所述面向配网大数据的多时态维度数据融合方法,其特征在于:所述步骤2确定滑动窗口值包括步骤:
选取第n个周期的前k个历史记录的数列Sk,所述
计算获得历史记录数列Sk的平均值:其中表示第i个周期的实际监测值,且k=1,2,3,...,n-1;
结合周期内监测所得实际监测值和该周期内历史记录数列的平均值,计算获得历史记录数列的方差:
选取方差σk最小的一个历史记录数列,及将k作为滑动窗口值Wind的初值。
3.根据权利要求1所述面向配网大数据的多时态维度数据融合方法,其特征在于:所述步骤3计算第n个周期的平滑系数值采用公式:
其中,α表示平滑系数值;表示第n-1个周期的实际监测值,表示第n-1个周期的预测值。
4.根据权利要求1所述面向配网大数据的多时态维度数据融合方法,其特征在于:所述步骤4计算第n个周期的预测值采用公式:
其中,表示第n个周期的预测值,α表示平滑系数值,表示第n-i+1个周期的实际监测值,表示预测值的初始值。
5.根据权利要求1所述面向配网大数据的多时态维度数据融合方法,其特征在于:所述步骤8计算修改后的滑动窗口内各个数据的权重系数采用公式:
其中,Weighti表示滑动窗口内数据的权重系数;其中Wind表示修改后的滑动窗口值。
6.根据权利要求1所述面向配网大数据的多时态维度数据融合方法,其特征在于:所述步骤9中计算上报数据采用公式:
其中,daten表示第n个周期要上报的数据;Weighti表示滑动窗口内数据的权重系数;表示第n-i+1个周期的实际监测值;Wind表示修改后的滑动窗口值。
CN201710144803.8A 2017-03-13 2017-03-13 一种面向配网大数据的多时态维度数据融合方法 Active CN106980874B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710144803.8A CN106980874B (zh) 2017-03-13 2017-03-13 一种面向配网大数据的多时态维度数据融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710144803.8A CN106980874B (zh) 2017-03-13 2017-03-13 一种面向配网大数据的多时态维度数据融合方法

Publications (2)

Publication Number Publication Date
CN106980874A CN106980874A (zh) 2017-07-25
CN106980874B true CN106980874B (zh) 2019-09-10

Family

ID=59338109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710144803.8A Active CN106980874B (zh) 2017-03-13 2017-03-13 一种面向配网大数据的多时态维度数据融合方法

Country Status (1)

Country Link
CN (1) CN106980874B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256724B (zh) * 2017-11-27 2021-12-07 国网浙江省电力公司嵊泗县供电公司 一种基于动态行业系数的配电网可开放容量规划方法
CN108984581B (zh) * 2018-05-04 2023-04-07 中国信息安全研究院有限公司 一种数据融合方法
CN111832034B (zh) * 2019-04-23 2024-04-30 创新先进技术有限公司 多方数据融合方法及装置
CN115859209B (zh) * 2023-02-08 2023-05-16 烟台市福山区动物疫病预防控制中心 基于饲料消耗数据的畜牧业家禽养殖异常识别方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102612065A (zh) * 2012-03-19 2012-07-25 中国地质大学(武汉) 无线传感器网络监控异常事件的快速容错检测方法
CN103473459A (zh) * 2013-09-17 2013-12-25 恒东信息科技无锡有限公司 一种多系统大数据的处理及融合方法
CN103546339A (zh) * 2011-05-04 2014-01-29 成都勤智数码科技股份有限公司 一种利用相关性的it运维指标预报与预测方法
CN104346449A (zh) * 2014-10-28 2015-02-11 用友软件股份有限公司 数据合并方法和数据合并装置
CN104778837A (zh) * 2015-04-14 2015-07-15 吉林大学 一种道路交通运行态势多时间尺度预测方法
CN105677538A (zh) * 2016-01-11 2016-06-15 中国科学院软件研究所 一种基于故障预测的云计算系统自适应监测方法
CN106372402A (zh) * 2016-08-30 2017-02-01 中国石油大学(华东) 一种大数据环境下模糊区域卷积神经网络的并行化方法
CN106410861A (zh) * 2016-11-04 2017-02-15 浙江工业大学 一种基于可调度能力的微电网优化运行实时控制方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546339A (zh) * 2011-05-04 2014-01-29 成都勤智数码科技股份有限公司 一种利用相关性的it运维指标预报与预测方法
CN102612065A (zh) * 2012-03-19 2012-07-25 中国地质大学(武汉) 无线传感器网络监控异常事件的快速容错检测方法
CN103473459A (zh) * 2013-09-17 2013-12-25 恒东信息科技无锡有限公司 一种多系统大数据的处理及融合方法
CN104346449A (zh) * 2014-10-28 2015-02-11 用友软件股份有限公司 数据合并方法和数据合并装置
CN104778837A (zh) * 2015-04-14 2015-07-15 吉林大学 一种道路交通运行态势多时间尺度预测方法
CN105677538A (zh) * 2016-01-11 2016-06-15 中国科学院软件研究所 一种基于故障预测的云计算系统自适应监测方法
CN106372402A (zh) * 2016-08-30 2017-02-01 中国石油大学(华东) 一种大数据环境下模糊区域卷积神经网络的并行化方法
CN106410861A (zh) * 2016-11-04 2017-02-15 浙江工业大学 一种基于可调度能力的微电网优化运行实时控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
物联网车间海量数据融合技术研究;封慧英;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160715(第07期);I138-1148
风速分布预测的指数平滑模型及其在配电网可靠性中的应用;齐雪雯 等;《电力系统保护与控制》;20120616;第40卷(第12期);1-7

Also Published As

Publication number Publication date
CN106980874A (zh) 2017-07-25

Similar Documents

Publication Publication Date Title
WO2022135265A1 (zh) 气候变化影响下水库调度规则的失效预警分析方法
Ali et al. A data-driven approach for multi-scale GIS-based building energy modeling for analysis, planning and support decision making
Li et al. A wind speed interval prediction system based on multi-objective optimization for machine learning method
Ding et al. Forecasting China's electricity consumption using a new grey prediction model
Corizzo et al. Anomaly detection and repair for accurate predictions in geo-distributed big data
CN106980874B (zh) 一种面向配网大数据的多时态维度数据融合方法
CN103218675B (zh) 一种基于聚类和滑动窗口的短期负荷预测方法
CN104657791B (zh) 一种基于相关性分析的风电场群风速分布预测方法
CN107610021A (zh) 环境变量时空分布的综合分析方法
Meng et al. A two-stage short-term traffic flow prediction method based on AVL and AKNN techniques
CN102509173B (zh) 一种基于马尔科夫链的电力系统负荷准确预测方法
CN103559303A (zh) 一种对数据挖掘算法的评估与选择方法
Dong et al. Applying the ensemble artificial neural network-based hybrid data-driven model to daily total load forecasting
Jiang et al. Optimization of fuzzy membership function of runoff forecasting error based on the optimal closeness
CN110969306A (zh) 基于深度学习的配电低压台区负荷预测方法及装置
CN108256693A (zh) 一种光伏发电功率预测方法、装置及系统
CN109460849A (zh) 一种基于智能算法的用户用电偏差分析方法
Song et al. An enhanced clustering-based method for determining time-of-day breakpoints through process optimization
Kim et al. Extracting baseline electricity usage using gradient tree boosting
Yang et al. Sub-minute probabilistic solar forecasting for real-time stochastic simulations
Lin et al. Data-driven prediction of building energy consumption using an adaptive multi-model fusion approach
Wang et al. A new time series prediction method based on complex network theory
Khosravi et al. Wind farm power uncertainty quantification using a mean-variance estimation method
Miao et al. MSFS: multiple spatio-temporal scales traffic forecasting in mobile cellular network
Salcedo-Sanz et al. Wind power field reconstruction from a reduced set of representative measuring points

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant