CN106980874B

CN106980874B - 一种面向配网大数据的多时态维度数据融合方法

Info

Publication number: CN106980874B
Application number: CN201710144803.8A
Authority: CN
Inventors: 邓松; 张利平; 岳东; 付雄; 葛辉; 黄崇鑫
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University
Priority date: 2017-03-13
Filing date: 2017-03-13
Publication date: 2019-09-10
Anticipated expiration: 2037-03-13
Also published as: CN106980874A

Abstract

本发明公开了一种面向配网大数据的多时态维度数据融合方法，包括：根据数据源进行分类；设定统计周期，确定滑动窗口值；计算出第n个周期的平滑系数值和预测值；计算所述第n个周期实际监测值和预测值的偏离度，及与预设偏离度比较：当大于时，计算获得修改后的滑动窗口值；当小于时，取距离第n个周期的监测所得实际监测值，根据周期数进行排序得到窗口数据集合；计算各个数据的权重系数；计算得到上报数据；将计算所得上报数据添加到同类上报数据集合中；由计算得到的同类上报数据集合构成新的数据集合。本发明实现了动态调整滑动窗口值，对窗口内的数据可实时根据权重因子进行融合，保证了更好的数据融合效果，为上层服务提供数据基础。

Description

一种面向配网大数据的多时态维度数据融合方法

技术领域

本发明涉及一种面向配网大数据的多时态维度数据融合方法，属于数据融合的技术领域。

背景技术

数据融合的概念产生于20世纪70年代，但是直接促使其发展的是进入20世纪90年代以后，随着计算机技术、通信技术的快速发展，并且两者之间的关系日益紧密，作为数据处理的新兴技术--数据融合技术，在近几年中以飞快的速度发展。数据融合研究的范围广泛，最初以军事应用为目的的数据融合技术亦可用于工业和农业，如资源管理、城市规划、气象预报、作物及地质分析等领域。数据融合的基本目的是通过一定规则的数据组合而不是任何个别元素，获取更多的信息，这是最佳协调作用的结果，利用多源数据的优势，提高数据的使用率，获得更为准确的结果。与单传感器信号处理或低层次的多传感器数据处理方式相比，多传感器数据融合有效地利用了多传感器资源信息提供的互补性，从而可以获得被探测目标和环境更为全面的信息。其关键在于数据融合所处理的多传感器信息具有更复杂的形式，而且可以在不同的信息层次上出现，信息的抽象层次包括数据层融合、特征层融合和决策层融合。数据融合技术是指利用计算机对按时序获得的若干观测信息，在一定准则下加以自动分析、综合，以完成所需的决策和评估任务而进行的信息处理技术。

配电网处于电力系统的末端，具有地域分布广、电网规模大、设备种类多、网络连接多样、运行方式多变等鲜明特点，随着城镇化建设及智能电网用电需求的增长，配电网一直在不断地改造和扩建，其规模也在不断扩大，配电网中会产生指数级增长的海量异构、多态的数据，数据集合的大小可达到当今信息学界所关注的大数据级别。而大数据具有4V特点，即高容量(Volume)、快速性(Velocity)、多样性(Variety)和价值密度低(Value)，大数据带来的挑战在于它的实时处理。针对配电网大数据来源广泛、多态、异构等特点，为了更好地为配电网环境下的各类规划决策服务，研究多时态多维度的配电网大数据融合具有十分重要的意义。

面向配网大数据的多时态多维度数据融合首先要考虑的就是将来自不同数据源的基础数据经数据校验与标准化进入一体化公共数据资源池，按照规划时态进行分类，再对不同规划时态的数据确定融合权重，实现数据融合。

而目前数据融合中，所提出的指数平滑预测算法，平滑系数α是固定不变的，平滑常数α的选择十分重要，一般来说，若数据波动较大则值应取大一些，可以增大近期数据对预测结果的影响，若数据波动平稳值应取小些，使实际观察期的所有数据对预测结果的影响趋于平衡。平滑系数α的固定导致当数据发生严重波动的时候，比如突然的变长、变短，则预测的数据值就存在较大的误差，因此无法实现动态的调整平滑系数。

发明内容

本发明所要解决的技术问题在于克服现有技术的不足，提供一种面向配网大数据的多时态维度数据融合方法，解决现有的数据融合方法中平滑系数的固定导致当数据发生严重波动，使得预测的数据值存在较大的误差的问题。

本发明具体采用以下技术方案解决上述技术问题：

一种面向配网大数据的多时态维度数据融合方法，包括以下步骤：

步骤1、根据数据源进行分类，将每一类数据组成一个由有L个数据构成的集合DATE_i，且由各类同类数据集合DATE_i组成数据集合DATE；

步骤2、设定统计周期，在每个周期内对数据监测获得实际监测值，及对实际监测值进行融合，确定滑动窗口值Wind；

步骤3、由第n-1个周期监测的实际监测值和预测值，计算出第n个周期的平滑系数值；

步骤4、根据所得第n个周期的平滑系数值和实际监测值，计算出第n个周期的预测值；

步骤5、计算所述第n个周期的实际监测值和预测值的偏离度，及将计算所得偏离度与预设偏离度比较：当计算所得偏离度大于预设偏离度时，执行步骤6；当计算所得偏离度小于预设偏离度时，执行步骤7；

步骤6、根据第n个周期的实际监测值和预测值计算获得修改后的滑动窗口值；

步骤7、取距离第n个周期的若干周期内监测所得实际监测值，根据周期数进行排序得到窗口数据集合；

步骤8、根据所得窗口数据集合，计算修改后的滑动窗口内各个数据的权重系数；

步骤9、根据步骤8所得各个数据的权重系数，计算得到上报数据；

步骤10、将计算所得上报数据添加到同类上报数据集合DATE_reporti中；判断数据集合DATE中是否存在未处理数据，将存在未处理的数据转执行步骤2，否则执行步骤11；

步骤11、由计算得到的同类上报数据集合DATE_reporti构成新的数据集合DATF_report，以获得融合的数据集合。

进一步地，作为本发明的一种优选技术方案：所述步骤2确定滑动窗口值包括步骤：

选取第n个周期的前k个历史记录的数列S_k；

计算获得历史记录数列S_k的平均值：其中表示第i个周期的实际监测值，且k＝1，2，3，...，n-1；

结合周期内监测所得实际监测值和该周期内历史记录数列的平均值，计算获得历史记录数列的方差：

选取方差σ_k最小的一个历史记录数列，及将k作为滑动窗口值Wind的初值。

本发明采用上述技术方案，能产生如下技术效果：

本发明提出面向配网大数据的多时态维度数据融合方法，将来自各不同数据源的规划基础数据分类，再对不同规划时态的数据确定融合权重，实现数据融合。首先根据不同的电力数据源，将数据分成多个数据源集合，采用指数平滑预测法预测出第n个周期的预测值。且本发明利用第n-1周期的预测值和实际监测的值实现动态的调整平滑系数α。还提出了滑动窗口的方法，计算预测值和实际监测值的偏差，查看两者差值是否在设定的偏离度范围内，并根据此结果做出对滑动窗口的调整，然后计算出窗口内数据的权重系数，进而计算出第n个周期上报的数据。

本发明方法的主要优势在于：合理的动态调整平滑系数，指数平滑预测法的平滑系数是动态的，以便获得更准确的预测值，又实现了动态的调整滑动窗口的值，对窗口内的数据可以实时根据权重因子进行融合，保证了更好的数据融合效果，为上层服务提供数据基础。

附图说明

图1为本发明面向配网大数据的多时态维度数据融合方法的流程示意图。

具体实施方式

下面结合说明书附图对本发明的实施方式进行描述。

本发明提出一种面向配网大数据的多时态维度数据融合方法，该方法具体包括以下步骤：

步骤1、根据数据源进行分类，形成不同的数据分类，假设有k类数据，每一类数据都可组成一个集合DATE_i，每类数据有L个数据构成同类数据集合DATE_i＝{date₁,date₂,...,date_L}各类同类数据集合DATE_i组成数据集合DATE，DATE＝{DATE₁,DATE₂,...,DATE_k}。

步骤2、根据系统需求设定统计周期T，在每个周期内对数据监测获得实际监测值，及对实际监测值进行融合，确定滑动窗口值Wind。

若要对第n周期的数据进行预测，首先选取数列其中S_k表示第n个周期的前k个历史记录的数列，且参数k＝(1,2,3,...,n-1)。历史记录数列S_k的平均值由公式(1)计算得出，历史记录数列的方差σ_k由公式(2)计算得出，选取方差σ_k最小的一个历史记录数列，将k作为滑动窗口的初值，即Wind＝k。

公式中，表示第i个周期的实际监测值。

步骤3、由第n-1个周期监测的实际监测值和预测值，确定平滑系数值α。设定初始值α，其中α∈(0,1)，平滑系数的大小表示预测数据对时态变化的反应速度，设定滑动系统是随着统计周期变化的，根据公式(3)计算出第n个周期的平滑系数值。

其中，表示第n-1个周期的实际监测值，表示第n-1个周期的预测值，该数据由第n-1个周期直接已知的数据。

步骤4、根据所得第n个周期的平滑系数值和实际监测值，计算第n个周期的预测值。由步骤3得出的平滑系数α，可以由前面周期的数据，计算出第n个周期的预测数据。指数平滑预测法可以得出公式(4)，将公式(4)展开得到公式(5)，对公式(5)进行合并得到公式(6)，由公式(6)可以计算出第n个周期的预测数据。

其中，表示第n个周期的预测值，表示第i个周期的预测值，表示第i个周期的实际监测值。

步骤5、设定偏离度Dev。由公式(7)计算出第n个周期预测值与实际监测值的偏离度Devⁿ，如果偏离度Devⁿ大于偏离度Dev，则调整滑动窗口值的大小，执行步骤6，否则保持滑动窗口值Wind的大小不变，转执行步骤7。

步骤6、修改窗口值的大小。由步骤5知道，第n个周期内实际监测值和预测值差距比较大，为了更好的实现数据的融合需要对滑动窗口做出改变，由公式(8)得到修改后的滑动窗口值。

步骤7、取距离第n个周期的多个周期内监测的实际监测值数据，根据周期数进行排序得到窗口数据集合其中，Wind表示修改后的滑动窗口值，由步骤6中计算获得。

步骤8、由步骤7得到的窗口数据集合DW，计算滑动窗口内各个数据的权重系数。滑动窗口内共有多个周期数据，每个数据的权重系数由公式(9)计算得出。

其中，Weight_i表示滑动窗口内数据的权重系数，其中Wind表示修改后的滑动窗口值，由步骤6中计算获得。

步骤9、根据所述步骤8计算的数据的权重系数计算，计算出上报数据。由公式(10)计算得到要上报的数据。

其中，dateⁿ表示第n个周期要上报的数据。

步骤10、将上报的数据dateⁿ添加到同类上报数据集合DATE_reporti中，判断集合DATE中是否存在未处理的数据，若还存在未处理的数据转执行步骤2，否则执行步骤11。

步骤11、由步骤10计算得到同类数据上报集合DATE_reporti，构成新的数据集合DATE_report＝{DATE_report1,DATE_report2,...,DATE_reportk}，即为经融合处理后上报的数据，由此获得为上层提供融合的数据集合DATE_report。

综上，本发明的方法合理的动态调整平滑系数，指数平滑预测法的平滑系数是动态的，以便获得更准确的预测值，又实现了动态的调整滑动窗口的值，对窗口内的数据可以实时根据权重因子进行融合，保证了更好的数据融合效果，为上层服务提供数据基础。

上面结合附图对本发明的实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.一种面向配网大数据的多时态维度数据融合方法，其特征在于，包括以下步骤：

步骤10、将计算所得上报数据添加到同类上报数据集合DATE_reporti中；判断数据集合DATE中是否存在未处理数据，若存在未处理的数据转执行步骤2，否则执行步骤11；

步骤11、由计算得到的同类上报数据集合DATE_reporti构成新的数据集合DATE_report，以获得融合的数据集合。

2.根据权利要求1所述面向配网大数据的多时态维度数据融合方法，其特征在于：所述步骤2确定滑动窗口值包括步骤：

选取第n个周期的前k个历史记录的数列S_k，所述

3.根据权利要求1所述面向配网大数据的多时态维度数据融合方法，其特征在于：所述步骤3计算第n个周期的平滑系数值采用公式：

其中，α表示平滑系数值；表示第n-1个周期的实际监测值，表示第n-1个周期的预测值。

4.根据权利要求1所述面向配网大数据的多时态维度数据融合方法，其特征在于：所述步骤4计算第n个周期的预测值采用公式：

其中，表示第n个周期的预测值，α表示平滑系数值，表示第n-i+1个周期的实际监测值，表示预测值的初始值。

5.根据权利要求1所述面向配网大数据的多时态维度数据融合方法，其特征在于：所述步骤8计算修改后的滑动窗口内各个数据的权重系数采用公式：

其中，Weight_i表示滑动窗口内数据的权重系数；其中Wind表示修改后的滑动窗口值。

6.根据权利要求1所述面向配网大数据的多时态维度数据融合方法，其特征在于：所述步骤9中计算上报数据采用公式：

其中，dateⁿ表示第n个周期要上报的数据；Weight_i表示滑动窗口内数据的权重系数；表示第n-i+1个周期的实际监测值；Wind表示修改后的滑动窗口值。