CN113989073A - 一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法 - Google Patents

一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法 Download PDF

Info

Publication number
CN113989073A
CN113989073A CN202111351457.3A CN202111351457A CN113989073A CN 113989073 A CN113989073 A CN 113989073A CN 202111351457 A CN202111351457 A CN 202111351457A CN 113989073 A CN113989073 A CN 113989073A
Authority
CN
China
Prior art keywords
data
distribution network
index
time
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111351457.3A
Other languages
English (en)
Other versions
CN113989073B (zh
Inventor
吴宁
汤程烨
吴含青
黄灵通
陈通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangsu Electric Power Co ltd Zhenjiang Power Supply Branch
Original Assignee
State Grid Jiangsu Electric Power Co ltd Zhenjiang Power Supply Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangsu Electric Power Co ltd Zhenjiang Power Supply Branch filed Critical State Grid Jiangsu Electric Power Co ltd Zhenjiang Power Supply Branch
Priority to CN202111351457.3A priority Critical patent/CN113989073B/zh
Publication of CN113989073A publication Critical patent/CN113989073A/zh
Application granted granted Critical
Publication of CN113989073B publication Critical patent/CN113989073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法涉及的是一种光伏高占比配网电压时空的多维度评估方法,包括如下步骤:步骤1:通过获取光伏高占比配网数据,对数据进行预处理,包括数据标准化处理、异常数据辨识、异常数据重构。步骤2:使用基于K‑means的大数据挖掘技与特征提取技术,针对聚类目标和要求计算样本点与各簇中心间距离。步骤3:根据样本的时间特性和空间特性可以分别计算获得时间维度和空间维度的特征数据。步骤4:根据配网电压时空多维评估指标在全局无功电压中发挥的作用,采用熵值法和有序二元比较量化法的主客观相结合的指标赋权法对指标进行权重赋值。步骤5:运用改进模糊灰关联度评估法,准确评估配网电压状态。

Description

一种基于大数据挖掘的光伏高占比配网电压时空多维评估 方法
技术领域
本发明一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法涉及的是一种光伏高占比配网电压时空的多维度评估方法。
背景技术
在现有技术中,公开日期为2019年8月的文献《计及相关性的分布式光伏接入配电网运行风险评估》(莫菲等,江苏方天电力技术有限公司)考虑了光伏发电受气候影响,对含高比例光伏配电网进行了电压越限等风险评估,为光伏接入配电网提供了规划依据。上述文献存在缺点为:模型未考虑光伏无功管理。公开日期为2019年12月的文献《考虑过电压风险的配电网光伏接纳能力评估方法》(董逸超等,天津大学)引入过电压概念,解决了以往评估较为保守的问题,可以有效量化导致配电网过电压风险的不确定性因素。上述文献存在缺点为:仅从单一维度上量化电压越限风险,不能实时评估电网运行状态。公开日期为2021年9月的文献《含分布式光伏的主动配电网电压分布式优化控制》(姜涛等,东北电力大学)针对光伏高占比配电网电压越限问题,提出一种分布式优化策略,可有效减少电压越限问题,并降低网络损耗。上述文献存在缺点为:仅考虑无功功率对电网的影响,忽略了功率因数和电压偏移。
上述文献并未构建时空多维评估指标体系去评估光伏高占比配电网电压,不能实时展示电压运行状态。所以有必要提供一种新的技术方案来构建时空多维评估指标体系去评估光伏高占比配电网电压。
发明内容
本发明有鉴于此,提供了一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法
本发明一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法利用计算机进行多维评估,包括如下步骤:
步骤1:通过获取光伏高占比配网数据,对数据进行预处理,包括数据标准化处理、异常数据辨识、异常数据重构等,为保证数据处理的准确性对数据重复一次上述处理过程,从而获取标准化样本数据。
步骤2:使用基于K-means的大数据挖掘技与特征提取技术,针对聚类目标和要求计算样本点与各簇中心间距离,并通过设定迭代次数,在达到迭代次数后即可获得样本特征。
步骤3:根据样本的时间特性和空间特性可以分别计算获得时间维度和空间维度的特征数据,这些数据将为后续评估奠定基础。
步骤4:根据配网电压时空多维评估指标在全局无功电压中发挥的作用,采用熵值法和有序二元比较量化法的主客观相结合的指标赋权法对指标进行权重赋值。
步骤5:运用改进模糊灰关联度评估法,准确评估配网电压状态。
具体地,在步骤1中,对数据进行预处理:
(1)数据标准化
将源于配网直接采集获取的数据进行统一归一化处理。
(2)异常数据辨识
对于配网中采集的异常数据,从下面三个维度进行辨识分析:
1)从数学维度,使用工程化的技术对缺失值、越限值等异常数据进行辨识;
2)从时间维度,采用时间序列分析的方法辨析配网在单位时间尺度内波动较大的异常数据;
3)从空间维度,基于配网的“点-区-网”结构,从空间维度使用多源数据相关性来辨析异常数据。
(3)异常数据重构
在辨识异常数据之后需要对数据进行重构,包含以下三种情形:
1)出现单点数据异常时,对数据采用样条插值方法进行填充;
2)出现多点数据异常时,使用时间序列拟合或回归拟合的方法进行填充;
3)出现大片连续数据出现异常时,利用多源数据相关性的方法进行填充。
具体地,在步骤2中,采用基于K-means的大数据挖掘技与特征提取技术获得样本特征,步骤为:
设定样本数据集D={a1,a2,...,am},将这些数据分成k个簇,因为这些数据没有任何标签信息,故选择平方作为标准P·P2。使用K-means算法对聚类得出的簇划分C={C1,C2,...,Ck}最小化平方误差
Figure BDA0003355068910000031
式中的
Figure BDA0003355068910000032
a为簇Ci的均值向量。E值体现了各簇中的样本数据到选择的质心的距离,与样本相似度负相关,即E值越大时,各簇中的样本数据相似度越低。
对于最小化平方误差,需通过遍历D中所有可能的划分情况,来获取其最优解。在K-means算法中采用迭代优化的方法来求取近似值,当选择数据的质心不再大幅度变化或达到预设迭代次数时停止。
具体地,在步骤3中,时间维度和空间维度电压评估指标体系的建立。
(1)时间维度上,通过“日-月-年”三个层级对配网电压在全年内进行特定时间节点进行评估,寻找出配网电压薄弱时间段。
(2)空间维度上,节点评估注重于关键节点的电压控制能力,分区评估注重于分区的调控能力以及互联分区间的互动支撑能力,全网评估注重于电网整体的电压状态。
结合时空维度,配网电压评估从无功裕度、功率因数和电压偏移三个角度来构建光伏高占比配网电压时空多维评估指标体系。
具体地,在步骤5中,熵值法和有序二元比较量化法,具体过程为:
(1)熵值法
熵值法是通过判断某一个指标的离散程度,来确定该指标在整个体系中所占权重大小的方法。设有m个评价指标,n个评价对象所形成的原始指标数据矩阵A=(Xij)m×n,对其标准化处理后得到标准指标数据矩阵B=(bij)m×n,对于指标Xj,指标值Xij的相差越小,则该指标在综合评价中权重值越小。熵值法确定指标权重的过程如下:
1)对指标进行归一化处理
2)计算第i个指标在第j个待评估目标的占比
Figure BDA0003355068910000041
3)定义熵
第i个评价指标的熵值定义为
Figure BDA0003355068910000042
第i个熵权重指数定义为:
Figure BDA0003355068910000043
并满足以下条件
Figure BDA0003355068910000044
(2)有序二元比较量化法
将m个评估对象进行二元比较重要性排序,经过一致性检验判断与调整得到排序一致性二元对比标度矩阵E。根据标度矩阵E各行元素值之和,对各元素进行大小排序,把排序为首位的目标作为基准,通过对其他目标进行重要性程度的比较,可得非归一化目标权向量为:
w′=(w′1,w′2,|||,w′m)
然后进行归一化计算,即可得目标权向量式为:
w=(w1,w2,|||,wm)
并满足以下条件
Figure BDA0003355068910000045
(3)组合赋权法
采用“加法”集成发进行组合赋权,计算公式为:
wi=αai+(1-α)bi,(0≤α≤1)
α通过历史数据和经验来进行确定。
具体地,在计及光储虚拟电厂竞争关系的博弈协调控制方法,其方法为步骤4中,提出一种改进模糊灰关联度评估法,具体过程为:
(1)参考序列与比较序列
确定反映系统行为特征的参考序列x0=(x0(1),x′0(2),L,x′0(m)),和影响系统行为特征的样本序列x1,x2,L,xn,并进行标准化处理为x′0,x′1,L,x′n
(2)计算模糊隶属度
Figure BDA0003355068910000051
(3)计算关联系数
假设某个标准化处理后的指标数据作为参考序列x0'=(x0(1),x′0(2),L,x′0(m)),其它若干标准化处理后的指标数据作为样本序列x′0,x′1,L,x′n与x′1,(i=1,2.,n)在k点时的关联系数为:
Figure BDA0003355068910000052
其中,ρ为分辨系数,取值范围为(0,1);x′0(k),x′i(k)分别为参考数列第k个点的值与第i个比较数列第k个点的值。
(4)计算关联度
将所求的关联系数取平均值,作为比较序列与参考序列间的关联度。标准化后的指标数据序列x′0与x′i的关联度公式如下:
Figure BDA0003355068910000061
(5)计算模糊灰关联度
R0i=λ(r(x0,xi)+r(x′0,x′i))
式中,λ为动态模糊系数,取值范围为(0,1)。
本发明有效解决了如下问题:
1、提出基于K-means的配网电压大数据时空多维挖掘及特征提取方法,加快运行速度,准确提取光伏高占比配网电压数据,然后应用改进模糊灰关联度评估法,评估配网电压状态。
2.针对光伏高占比配网数据量大,维数多,复杂难处理的情况,提出基于K-means的配网电压大数据时空多维挖掘及特征提取方法,可有效降低数据处理难度,为时空多维评估奠定基础。
3.针对常规灰关联度法无法突出数据差异性的问题,提出一种改进模糊灰关联度评估法,可有效评估配网电压状态,提高评估结果的客观性。
附图说明
以下结合附图对本发明作进一步说明
图1是配网电压时空维度挖掘方法流程图;
图2是光伏高占比配网电压时空多维评估指标体系;
图3是光伏高占比配网拓扑图;
图4是时间维度电压幅值图;
图5是空间维度电压幅值图;
图6是各指标权重赋值;
具体实施方式
参照附图1-6,一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,包括如下步骤:
步骤1:通过获取光伏高占比配网数据,对数据进行预处理,包括数据标准化处理、异常数据辨识、异常数据重构等,为保证数据处理的准确性对数据重复一次上述处理过程,从而获取标准化样本数据。
步骤2:使用基于K-means的大数据挖掘技与特征提取技术,针对聚类目标和要求计算样本点与各簇中心间距离,并通过设定迭代次数,在达到迭代次数后即可获得样本特征。
步骤3:根据样本的时间特性和空间特性可以分别计算获得时间维度和空间维度的特征数据,这些数据将为后续评估奠定基础。
步骤4:根据配网电压时空多维评估指标在全局无功电压中发挥的作用,采用熵值法和有序二元比较量化法的主客观相结合的指标赋权法对指标进行权重赋值。
步骤5:运用改进模糊灰关联度评估法,准确评估配网电压状态。
具体地,在步骤1中,对数据进行预处理:
(1)数据标准化
将源于配网直接采集获取的数据进行统一归一化处理。
(2)异常数据辨识
对于配网中采集的异常数据,从下面三个维度进行辨识分析:
1)从数学维度,使用工程化的技术对缺失值、越限值等异常数据进行辨识;
2)从时间维度,采用时间序列分析的方法辨析配网在单位时间尺度内波动较大的异常数据;
3)从空间维度,基于配网的“点-区-网”结构,从空间维度使用多源数据相关性来辨析异常数据。
(3)异常数据重构
在辨识异常数据之后需要对数据进行重构,包含以下三种情形:
1)出现单点数据异常时,对数据采用样条插值方法进行填充;
2)出现多点数据异常时,使用时间序列拟合或回归拟合的方法进行填充;
3)出现大片连续数据出现异常时,利用多源数据相关性的方法进行填充。
具体地,在步骤2中,采用基于K-means的大数据挖掘技与特征提取技术获得样本特征,步骤为:
设定样本数据集D={a1,a2,...,am},将这些数据分成k个簇,因为这些数据没有任何标签信息,故选择平方作为标准P·P2。使用K-means算法对聚类得出的簇划分C={C1,C2,...,Ck}最小化平方误差
Figure BDA0003355068910000081
式中的
Figure BDA0003355068910000082
a为簇Ci的均值向量。E值体现了各簇中的样本数据到选择的质心的距离,与样本相似度负相关,即E值越大时,各簇中的样本数据相似度越低。
对于最小化平方误差,需通过遍历D中所有可能的划分情况,来获取其最优解。在K-means算法中采用迭代优化的方法来求取近似值,当选择数据的质心不再大幅度变化或达到预设迭代次数时停止。
具体地,在步骤3中,时间维度和空间维度电压评估指标体系的建立。
(1)时间维度上,通过“日-月-年”三个层级对配网电压在全年内进行特定时间节点进行评估,寻找出配网电压薄弱时间段。
(2)空间维度上,节点评估注重于关键节点的电压控制能力,分区评估注重于分区的调控能力以及互联分区间的互动支撑能力,全网评估注重于电网整体的电压状态。
结合时空维度,配网电压评估从无功裕度、功率因数和电压偏移三个角度来构建光伏高占比配网电压时空多维评估指标体系。
具体地,在步骤5中,熵值法和有序二元比较量化法,具体过程为:
(1)熵值法
熵值法是通过判断某一个指标的离散程度,来确定该指标在整个体系中所占权重大小的方法。设有m个评价指标,n个评价对象所形成的原始指标数据矩阵A=(Xij)m×n,对其标准化处理后得到标准指标数据矩阵B=(bij)m×n,对于指标Xj,指标值Xij的相差越小,则该指标在综合评价中权重值越小。熵值法确定指标权重的过程如下:
1)对指标进行归一化处理
2)计算第i个指标在第j个待评估目标的占比
Figure BDA0003355068910000091
3)定义熵
第i个评价指标的熵值定义为
Figure BDA0003355068910000092
第i个熵权重指数定义为:
Figure BDA0003355068910000093
并满足以下条件
Figure BDA0003355068910000094
(2)有序二元比较量化法
将m个评估对象进行二元比较重要性排序,经过一致性检验判断与调整得到排序一致性二元对比标度矩阵E。根据标度矩阵E各行元素值之和,对各元素进行大小排序,把排序为首位的目标作为基准,通过对其他目标进行重要性程度的比较,可得非归一化目标权向量为:
w′=(w′1,w′2,|||,w′m)
然后进行归一化计算,即可得目标权向量式为:
w=(w1,w2,|||,wm)
并满足以下条件
Figure BDA0003355068910000095
(3)组合赋权法
采用“加法”集成法进行组合赋权,计算公式为:
wi=αai+(1-α)bi,(0≤α≤1)
α通过历史数据和经验来进行确定。
具体地,在计及光储虚拟电厂竞争关系的博弈协调控制方法,其方法为步骤4中,提出一种改进模糊灰关联度评估法,具体过程为:
(1)参考序列与比较序列
确定反映系统行为特征的参考序列x0=(x0(1),x′0(2),L,x′0(m)),和影响系统行为特征的样本序列x1,x2,L,xn,并进行标准化处理为x′0,x′1,L,x′n
(2)计算模糊隶属度
Figure BDA0003355068910000101
(3)计算关联系数
假设某个标准化处理后的指标数据作为参考序列x0'=(x0(1),x′0(2),L,x′0(m)),其它若干标准化处理后的指标数据作为样本序列x′0,x′1,L,x′n与x′1,(i=1,2.,n)在k点时的关联系数为:
Figure BDA0003355068910000102
其中,ρ为分辨系数,取值范围为(0,1);x′0(k),x′i(k)分别为参考数列第k个点的值与第i个比较数列第k个点的值。
(4)计算关联度
将所求的关联系数取平均值,作为比较序列与参考序列间的关联度。标准化后的指标数据序列x′0与x′i的关联度公式如下:
Figure BDA0003355068910000103
(5)计算模糊灰关联度
R0i=λ(r(x0,xi)+r(x′0,x′i))
式中,λ为动态模糊系数,取值范围为(0,1)。
实施例
1.大数据挖掘与特征提取
选取该配网2019-2020年的历史数据作为原始数据,同时将该配网分成四个区进行分析。采用配网电压时空维度挖掘方法,首先对原始样本数据进行数据预处理,然后采用大数据挖掘和特征提取方法,从时间维度和空间维度进行剖析。以电压幅值为例,通过K-means聚类算法获得300个时间戳数据,分别从日-月-年的时间维度进行分析和特征提取,结果见图4。类似地,以分区2和节点11为例,对该配网进行关键点-分区-全网的空间维度进行分析和特征提取,结果见图5。由图4和图5可见,在对配网大数据分析时,通过时空维度挖掘能够有效降低数据维度,减少冗余无效数据的处理,同时可以根据评估目标的不同选择性地提取对应特征和维度。
2.指标权重赋值
通过熵值法和有序二元比较量化法分别求出权重,最后用主客观相结合的组合赋权法对权重进行计算。各指标权重结果见图6。由图6可知,关键点功率因数指标权重最大,也即受到该指标的影响也最大。
3.评估结果
通过模糊灰关联度来衡量配网电压状态,为了从时空维度对配网电压状态进行评估,先对电压状态进行等级划分,划分标准见表1。
模糊关联度 (0.8,1] (0.6,0.8] (0.4,0.6] (0,0.4]
等级 A B C D
表1
配网电压状态从优、良、中、差分别对应等级A、B、C、D。选取2020年该配网数据作为原始数据。
在时间维度,将12个月作为时间节点进行分析计算;在空间维度,对配网24个节点进行分析计算,计算结果见表2和表3。
Figure BDA0003355068910000121
表2
Figure BDA0003355068910000122
Figure BDA0003355068910000131
表3
由表2和表3可知,从时间维度上来看,1月、2月、7月、8月和12月的电压状态C和D等级较多,说明这几个月份中该配网电压状态较差,为薄弱时间段。从空间维度上来看,分区3和分区4的全年电压状态多为等级C和D,其中节点19、20、21、22和23的电压状态多为等级D,而这些节点都隶属于分区4,由此可见分区4的电压状态较差,为该配网的薄弱环节。
为对该配网薄弱环节进一步溯源分析,对分区4从多时间尺度、多颗粒度空间尺度进行挖掘,给出该分区下各节点在全年每月的电压状态等级,结果见表4。
Figure BDA0003355068910000132
表4
由表4可知:节点19、20、21、22、23在全年有至少3个月为等级D以上,说明在该分区中这5个节点的电压状态普遍较差,而在这5个节点当中电压状态等级D普遍集中在1月、2月、7月和12月,说明在冬夏两季当中该配网受到光伏出力和负荷波动的影响较大,从而导致了节点电压状态较差。节点24在大部分月份时,其电压状态等级均为A,从图3可知节点24作为并网点安装了储能装置,一定程度上能够发挥调节电压能力保障电压状态稳定,故该节点整体电压状态较优。

Claims (6)

1.一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,其特征在于,包括如下步骤:
步骤1:通过获取光伏高占比配网数据,对数据进行预处理,包括数据标准化处理、异常数据辨识、异常数据重构等,为保证数据处理的准确性对数据重复一次上述处理过程,从而获取标准化样本数据;
步骤2:使用基于K-means的大数据挖掘技与特征提取技术,针对聚类目标和要求计算样本点与各簇中心间距离,并通过设定迭代次数,在达到迭代次数后即可获得样本特征;
步骤3:根据样本的时间特性和空间特性可以分别计算获得时间维度和空间维度的特征数据,这些数据将为后续评估奠定基础;
步骤4:根据配网电压时空多维评估指标在全局无功电压中发挥的作用,采用熵值法和有序二元比较量化法的主客观相结合的指标赋权法对指标进行权重赋值;
步骤5:运用改进模糊灰关联度评估法,准确评估配网电压状态。
2.根据权利要求1所述的一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,其特征在于,步骤1中,对数据进行预处理:
(1)数据标准化
将源于配网直接采集获取的数据进行统一归一化处理;
(2)异常数据辨识
对于配网中采集的异常数据,从下面三个维度进行辨识分析:
1)从数学维度,使用工程化的技术对缺失值、越限值等异常数据进行辨识;
2)从时间维度,采用时间序列分析的方法辨析配网在单位时间尺度内波动较大的异常数据;
3)从空间维度,基于配网的“点-区-网”结构,从空间维度使用多源数据相关性来辨析异常数据;
(3)异常数据重构
在辨识异常数据之后需要对数据进行重构,主要包含以下三种情形:
1)出现单点数据异常时,对数据采用样条插值方法进行填充;
2)出现多点数据异常时,使用时间序列拟合或回归拟合的方法进行填充;
3)出现大片连续数据出现异常时,利用多源数据相关性的方法进行填充。
3.根据权利要求1所述的一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,其特征在于,步骤2中,采用基于K-means的大数据挖掘技与特征提取技术获得样本特征,步骤为:
设定样本数据集D={a1,a2,...,am},想要把这些数据分成k个簇,因为这些数据没有任何标签信息,所以必须挑选一个作为标准。我们选择最简单的距离的平方作为标准P·P2;使用K-means算法对聚类得出的簇划分C={C1,C2,...,Ck}最小化平方误差
Figure FDA0003355068900000021
式中的
Figure FDA0003355068900000022
为簇Ci的均值向量。E值体现了各簇中的样本数据到选择的质心的距离,与样本相似度负相关,即E值越大时,各簇中的样本数据相似度越低;
对于这里的最小化平方误差,需要通过遍历D中所有可能的划分情况,来获取其最优解;在K-means算法中采用迭代优化的方法来求取近似值,当选择数据的质心不再大幅度变化或达到预设迭代次数时停止。
4.根据权利要求1所述的一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,其特征在于,步骤3中,时间维度和空间维度电压评估指标体系的建立;
(1)时间维度上,通过“日-月-年”三个层级对配网电压在全年内进行特定时间节点进行评估,寻找出配网电压薄弱时间段;
(2)空间维度上,节点评估注重于关键节点的电压控制能力,分区评估注重于分区的调控能力以及互联分区间的互动支撑能力,全网评估注重于电网整体的电压状态;
结合时空维度,配网电压评估从无功裕度、功率因数和电压偏移三个角度来构建光伏高占比配网电压时空多维评估指标体系。
5.根据权利要求1所述的一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,其特征在于:计及光储虚拟电厂竞争关系的博弈协调控制方法,步骤5中,熵值法和有序二元比较量化法,具体过程为:
(1)熵值法
熵值法是通过判断某一个指标的离散程度,来确定该指标在整个体系中所占权重大小的方法。设有m个评价指标,n个评价对象所形成的原始指标数据矩阵A=(Xij)m×n,对其标准化处理后得到标准指标数据矩阵B=(bij)m×n,对于指标Xj,指标值Xij的相差越小,则该指标在综合评价中权重值越小。熵值法确定指标权重的过程如下:
1)对指标进行归一化处理
2)计算第i个指标在第j个待评估目标的占比
Figure FDA0003355068900000031
3)定义熵
第i个评价指标的熵值定义为
Figure FDA0003355068900000032
第i个熵权重指数定义为:
Figure FDA0003355068900000033
并满足以下条件
Figure FDA0003355068900000034
(2)有序二元比较量化法
将m个评估对象进行二元比较重要性排序,经过一致性检验判断与调整得到排序一致性二元对比标度矩阵E;根据标度矩阵E各行元素值之和,对各元素进行大小排序,把排序为首位的目标作为基准,通过对其他目标进行重要性程度的比较,可得非归一化目标权向量为:
w′=(w′1,w′2,|||,w′m)
然后进行归一化计算,即可得目标权向量式为:
w=(w1,w2,|||,wm)
并满足以下条件
Figure FDA0003355068900000041
(3)组合赋权法
采用“加法”集成发进行组合赋权,计算公式为:
wi=αai+(1-α)bi,(0≤α≤1)
α通过历史数据和经验来进行确定。
6.根据1所述的一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,其特征在于,步骤4中,提出一种改进模糊灰关联度评估法,具体过程为:
(1)参考序列与比较序列
确定反映系统行为特征的参考序列x0=(x0(1),x′0(2),L,x′0(m)),和影响系统行为特征的样本序列x1,x2,L,xn,并进行标准化处理为x′0,x′1,L,x′n
(2)计算模糊隶属度
Figure FDA0003355068900000042
(3)计算关联系数
假设某个标准化处理后的指标数据作为参考序列x0′=(x0(1),x′0(2),L,x′0(m)),其它若干标准化处理后的指标数据作为样本序列x′0,x′1,L,x′n与x′1,(i=1,2.,n)在k点时的关联系数为:
Figure FDA0003355068900000051
其中,ρ为分辨系数,取值范围为(0,1);x′0(k),x′i(k)分别为参考数列第k个点的值与第i个比较数列第k个点的值;
(4)计算关联度
将所求的关联系数取平均值,作为比较序列与参考序列间的关联度。标准化后的指标数据序列x′0与x′i的关联度公式如下:
Figure FDA0003355068900000052
(5)计算模糊灰关联度
R0i=λ(r(x0,xi)+r(x′0,x′i))
式中,λ为动态模糊系数,取值范围为(0,1)。
CN202111351457.3A 2021-11-15 2021-11-15 一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法 Active CN113989073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111351457.3A CN113989073B (zh) 2021-11-15 2021-11-15 一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111351457.3A CN113989073B (zh) 2021-11-15 2021-11-15 一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法

Publications (2)

Publication Number Publication Date
CN113989073A true CN113989073A (zh) 2022-01-28
CN113989073B CN113989073B (zh) 2024-06-21

Family

ID=79748647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111351457.3A Active CN113989073B (zh) 2021-11-15 2021-11-15 一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法

Country Status (1)

Country Link
CN (1) CN113989073B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117041121A (zh) * 2023-10-07 2023-11-10 成都无声讯通科技有限责任公司 基于数据挖掘的物联网异常监测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105186514A (zh) * 2015-10-20 2015-12-23 南京南瑞集团公司 一种大规模分布式光伏并网对配网安全评价及预警方法
CN106339801A (zh) * 2016-08-23 2017-01-18 江苏方天电力技术有限公司 一种光伏电站无功控制能力评估方法
WO2017016726A1 (en) * 2015-07-24 2017-02-02 Equipaggiamenti Elettronici Industriali S.P.A. Method for determining the absolute point of maximum power delivered by a string of photovoltaic panels and device configured to carry out said method
CN106469421A (zh) * 2016-09-23 2017-03-01 国家电网公司 一种风电/光伏发电功率汇集拓扑的评估方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016726A1 (en) * 2015-07-24 2017-02-02 Equipaggiamenti Elettronici Industriali S.P.A. Method for determining the absolute point of maximum power delivered by a string of photovoltaic panels and device configured to carry out said method
CN105186514A (zh) * 2015-10-20 2015-12-23 南京南瑞集团公司 一种大规模分布式光伏并网对配网安全评价及预警方法
CN106339801A (zh) * 2016-08-23 2017-01-18 江苏方天电力技术有限公司 一种光伏电站无功控制能力评估方法
CN106469421A (zh) * 2016-09-23 2017-03-01 国家电网公司 一种风电/光伏发电功率汇集拓扑的评估方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐钢;吴熙;范子恺;顾文;李辰龙;唐一铭;: "基于关联分析的光伏电站无功控制能力评估", 电测与仪表, no. 12, 25 June 2017 (2017-06-25) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117041121A (zh) * 2023-10-07 2023-11-10 成都无声讯通科技有限责任公司 基于数据挖掘的物联网异常监测方法及系统
CN117041121B (zh) * 2023-10-07 2023-12-19 成都无声讯通科技有限责任公司 基于数据挖掘的物联网异常监测方法及系统

Also Published As

Publication number Publication date
CN113989073B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
CN109871860B (zh) 一种基于核主成分分析的日负荷曲线降维聚类方法
CN111199016A (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN109886465B (zh) 一种基于智能电表用户聚类分析的配电网负荷预测方法
CN104809658B (zh) 一种低压配网台区线损的快速分析方法
CN112287018B (zh) 一种台风灾害下10kV杆塔受损风险评估方法及系统
CN105701596A (zh) 一种基于大数据技术的配网抢修精益化方法以及管理系统
CN110930198A (zh) 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备
CN111461921B (zh) 一种基于机器学习的负荷建模典型用户数据库更新方法
CN109299208B (zh) 一种台风灾害下输电杆塔智能可视化风险评估方法
CN109272258B (zh) 基于K-means聚类的区域风光发电资源评估方法
CN113393028A (zh) 一种基于数据挖掘技术的负荷预测方法
Fontanini et al. A data-driven BIRCH clustering method for extracting typical load profiles for big data
CN113379116A (zh) 基于聚类和卷积神经网络的台区线损预测方法
CN114139940A (zh) 一种基于组合赋权-云模型的广义需求侧资源网荷互动水平评估方法
CN108898273A (zh) 一种基于形态分析的用户侧负荷特征聚类评价方法
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
CN113989073A (zh) 一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法
CN115033591A (zh) 一种电费数据异常智能检测方法、系统、存储介质及计算机设备
CN113627674A (zh) 一种分布式光伏电站出力预测方法、装置及存储介质
CN115905319B (zh) 一种海量用户电费异常的自动识别方法及系统
CN112381422A (zh) 光伏电站性能的确定方法和装置
CN109165854B (zh) 空管运行效率等级评估方法及其装置
CN113128811A (zh) 一种基于强降水的电网系统地质灾害风险评估方法及系统
CN114004525A (zh) 基于模糊综合评价法面向用户侧的电能替代效益评价方法
CN111461565A (zh) 一种电力调控下的电源侧发电性能评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant