CN108876039A - 一种基于支持向量机的含分布式电源配电网电能质量预测方法 - Google Patents
一种基于支持向量机的含分布式电源配电网电能质量预测方法 Download PDFInfo
- Publication number
- CN108876039A CN108876039A CN201810644850.3A CN201810644850A CN108876039A CN 108876039 A CN108876039 A CN 108876039A CN 201810644850 A CN201810644850 A CN 201810644850A CN 108876039 A CN108876039 A CN 108876039A
- Authority
- CN
- China
- Prior art keywords
- value
- data
- formula
- prediction
- training set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 71
- 239000013598 vector Substances 0.000 claims abstract description 48
- 238000012360 testing method Methods 0.000 claims abstract description 37
- 238000010606 normalization Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 10
- 238000005286 illumination Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 4
- 230000004075 alteration Effects 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 claims description 4
- 241000208340 Araliaceae Species 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 3
- 238000013459 approach Methods 0.000 claims description 3
- 238000003491 array Methods 0.000 claims description 3
- 235000008434 ginseng Nutrition 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 101150036841 minJ gene Proteins 0.000 claims description 2
- 230000009452 underexpressoin Effects 0.000 claims description 2
- 238000002790 cross-validation Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于支持向量机的含分布式电源配电网电能质量预测方法,包括:PQ数据矩阵输入,并划分为测试集矩阵及验证训练集;验证训练集进一步划分为训练集及验证集;数据归一化处理;基于网格搜索法得到每种集合划分方式下的最优c、g参数,基于K折交叉验证法得到最优集合划分方式,完成支持向量机模型的参数寻优;基于构建的PQ预测最优模型进行电能质量预测;计算预测结果的相对误差值。
Description
技术领域
本发明涉及一种基于支持向量机的含分布式电源配电网电能质量预测方法,属电气工程和电能质量领域。
背景技术
分布式电源(Distributed Generator,DG)通常指发电功率在几千瓦至数百兆瓦的小型模块化、分散式发电单元,一般分布在用户附近。它投资少、占地小、建设周期短、节能环保,在负荷高峰期相比传统方式更加经济、有效。然而,分布式电源并网后可能会引起频率偏差、电压波动、电压闪变、电压不平衡、谐波畸变和直流注入等问题。准确全面地对电能质量(Power Quality,PQ)进行态势要素的提取、理解和预测,对实现分布式电源按电能质量分质定价上网和提高配电网PQ总体水平具有重要意义。
支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的新一代机器学习技术,在解决小样本、非线性问题中具有独特优势,其遵循结构风险最小化原则,预测性能和推广能力突出。态势感知技术是一种对引起态势变化的因素进行获取、理解、显示、预测等活动的新技术,为复杂系统的决策和操作提供了基础。将支持向量机技术应用于电能质量态势感知的预测环节,能够为后继的决策和操作提供依据,进而可尽早解决含分布式电源配电网中潜在的电能质量问题。因此,建立一种合理的含DG配电网电能质量预测方法相当重要。
当前,利用支持向量机对含DG配电网进行电能质量预测的研究成果较少。少量研究将支持向量机运用于电能质量扰动识别、扰动分类方面:如申请号为CN201710580783.9的专利提出一种电能质量扰动分类方法及系统,用双支持向量机对电信号进行扰动分类;申请号为CN201010611026.1的专利提出一种基于支持向量机的电能质量扰动模式判别方法。而大部分研究将支持向量机运用于功率预测、负荷预测方面:如申请号为CN201711473483.7的专利提出一种基于支持向量机的光伏发电功率预测方法;申请号为CN201711492025.8的专利提出的基于同步挤压小波变换的光伏功率多模型综合预测方法也将支持向量机作为预测模型之一,但其预测的对象是光伏功率;申请号为CN201711189088.6的专利提出基于支持向量机的大型城市中长期电力负荷组合预测方法,但主要使用趋势外推法和年均增长率法进行预测,使用支持向量机对趋势外推法和年均增长率法的预测结果进行拟合,其预测对象为电力负荷。本发明专利综合考虑对含DG配电网电能质量具有影响的各种因素,提出一种基于支持向量机的含分布式电源配电网电能质量预测方法。
发明内容
本发明要克服现有含DG配电网电能质量态势感知不足导致其电能质量存在的潜在问题不能被提前发现并及时处理的问题,提供一种基于支持向量机的含分布式电源配电网电能质量预测方法。
本发明综合考虑时间、光照强度、温度和负荷等对DG出力和配电网电能质量有显著影响的因素,利用支持向量机进行机器学习,并用K-CV法,即K折交叉验证法,和网格法进行参数寻优得到可靠稳定的模型,对含DG配电网未来时段的电能质量进行合理预测。
本发明的一种基于支持向量机的含分布式电源配电网电能质量预测方法,如附图1所示,其过程包括如下步骤:
1、数据输入及测试集划分:输入n个含8个特征值的向量数组,组成数据矩阵X,其中8个特征值分别为历史时间、温度、光照、负荷、电压偏差、频率偏差、三相不平衡度和谐波畸变率;这8个特征值中,前四个特征值定义为输入特征值,后四个定义为输出特征值;取其中d个向量数组作为测试集矩阵Z,其余n-d个向量数组作为建模所需的训练验证集Y;考虑到测试集数据必为未来时刻的数据,因此测试集选用按照时间排序规则位于最末尾的d个向量数组;
2、训练集及验证集划分:将训练验证集Y划分为k个同等大小的互斥子集Aj,j=1,2,…,k,并且满足
|A1|=|A2|=…=|Ak| (1)
式中,|Aj|是指集合Aj的元素个数,即集合的势;设定i是集合[1,k]中的任意一个数值,取子集Ai作为验证集合,定义Qi作为训练集合,满足
Qi=Y-Ai (2)
3、数据归一化处理:由于不同特征值的量纲不一样,不能进行直接线性组合,而且其值大小的数量级存在差异,未经处理将其进行线性组合会导致数量级小数值被数量级大数值忽略的情况,因此需要将数据进行归一化处理;归一化处理还能使最优解的寻优过程明显变得平缓,加快求解过程中参数的收敛速度;
步骤301,将训练集中的输入特征值数据按式(3)进行归一化处理:
式中,qin′为训练集中输入特征值归一化处理后的数据,qin为训练集中输入特征值归一化处理前的数据,qin.min为所有qin数据集合中的最小值,qin.max为所有qin数据集合中的最大值;
步骤302,将训练集中输出特征值数据按公式(4)进行归一化处理:
式中,qout′为训练集中输出特征值归一化处理后的数据,qout为训练集中输出特征值归一化处理前的数据,qout.min为所有qout数据集合中的最小值,qout.max为所有qout数据集合中的最大值;
步骤303,利用公式(5)、(6)将训练集中输入特征值归一化处理标准分别应用于验证集和测试集中的输入特征值:
式中,ain′为验证集中输入特征值归一化处理后的数据,ain为验证集中输入特征值归一化处理前的数据;zin′为测试集中输入特征值归一化处理后的数据,zin为测试集中输入特征值归一化处理前的数据;
步骤304,利用公式(7)将训练集中输出特征值归一化处理标准应用于验证集中的输出特征值:
式中,aout′为验证集中输出特征值归一化处理后的数据,aout为验证集中输出特征值归一化处理前的数据;
归一化处理后的训练集、验证集和测试集分别记为Qi′、Ai′、Z′;
4、最优PQ预测模型的构建:支持向量机根据训练集进行机器学习,根据验证集检验学习的正确率;由于学习样本不包含被学习母体的所有分布情况,样本分布不均匀会导致预测模型过拟合或欠拟合;为了得到最优PQ预测模型,需要确定训练集最接近母体样本分布的最优划分方式,以及此划分方式下支持向量机的最优参数;
步骤401,支持向量机的回归过程:
对于给定n组样本数据{xu,yu},u=1,2,···,n,其中xu为输入,yu为输出,利用一个非线性映射,将数据x映射到高维特征空间G,在这个空间进行线性逼近;根据统计学习理论,该逼近函数f(x)形式为:
f(x)=ω·Φ(x)+b (8)
式中,(·)为内积运算,ω是高维空间G内可调的权值向量,Φ(x)为输入x的非线性映射,b为偏置项;ω和b通过最小化泛函进行估计:
式中,Rreg[f]为正则化风险泛函,Remp[f]为经验风险,γ为规则化常数,
||.||表示欧氏范数;
公式(9)等价于求解以下优化问题:
其约束条件为
式中,minJ表示最小化目标函数J,ξt为超平面上、下两个不同的松弛变量,c为正规化常数,其值越大表示数据拟合度越高;系数ε控制回归逼近误差管道的大小,决定了对训练样本的拟合精度,其值越大则支持向量越少,精度越低;
引入核函数方法将公式(10)、公式(11)转化成:
其约束条件为
式中,maxJ表示最大化目标函数J,s定义为用于遍历集合[1,n]的变量;hs,ht为四个Lagrange乘子,即最小化Rreg[f]的解;xs表示下标为s的样本输入;K表示核函数;
求解上述二次规划得到的非线性映射,表示为:
其中,K(xt,xu)=Φ(xt)·Φ(x)是满足Mercer条件的核函数;选用RBF核函数,即径向基核函数,其表达式为:
K(xt,xu)=exp(-g||xt-xu||2),g>0 (15)
式中,exp()指数函数,参数g为gamma函数,即伽玛函数的参数设置;设变量m为属性数目,则g默认为1/m;
由于在计算f(x)时,无需计算ω和Φ(x)的数值,只需计算Lagrange乘子ht以及核函数K(xt,xk),即能解决维数灾难问题;建立SVM回归模型所需的参数优选,关键是选择参数c和g;
步骤402,采用网格搜索法,使参数c和g在一定范围内划分网格,并取定一组c和g的参数组合;
步骤403,对取定的c和g参数值利用K-CV方法,将原始数据均分成k’组,将每个子集数据分别选做一次验证集,其余的k’-1组子集数据作为训练集,将得到k’个模型;采用这k’个模型最终验证集的分类准确率平均数作为此K-CV法分类器的预测准确度,最终选择能够使得训练集预测准确度最高的参数copt、gopt作为最优参数组合;
步骤404,利用训练集Qi′和步骤403所得的最优参数组合copt、gopt,按照步骤401所述回归过程构建基于支持向量机的PQ预测模型;
步骤405,按照步骤402方法,遍历所有c和g划分的网格取值,并将步骤403,步骤404依次循环执行;对于步骤404所得的各预测模型,分别输入验证集Ai′的输入特征值进行预测,获得各次循环对应的PQ指标预测值pv;v为本次预测值编号,其数值的最大值由c和g划分的网格数量决定;
步骤406,将步骤405所得各次循环对应的PQ指标预测值pv与该PQ指标真实值r进行比较,计算其均方误差值:
其中,MSE表示均方误差值,r为验证集A′i的输出特征值;
步骤407,再次利用K-CV法,更替预测模型的训练集和验证集;重复k次,记下获得最小均方误差时所对应的训练集、验证集划分方式,以及对应的最优copt、gopt参数,得到最优PQ预测模型;
5、基于最优模型进行PQ预测:基于步骤407所得的最优PQ预测模型,并以测试集中的时间、温度、光照、负荷四个输入特征值作为模型输入量进行预测,预测模型输出结果即为归一化形式下的PQ预测输出特征集P′;将此预测输出结果按照步骤302中训练集输出值归一化处理标准进行反归一化处理,得到PQ预测输出特征集P:
pout=pout′×(qout.max-qout.min)+qout.min (17)
式中,pout′为未经反归一化处理的预测输出特征值数据,pout为经反归一化处理的预测输出特征值数据;
6、预测结果相对误差计算:将模型的预测输出特征值数据pout与测试集中的实际输出特征值数据zout进行比较,进行PQ预测结果的相对误差值计算:
式中,RE表示相对误差值,|pout-zout|表示pout和zout差值的绝对值。
本发明的有益效果主要表现在:1、利用支持向量机的回归功能对含DG配电网电能质量进行了有效预测;2、用K-CV方法对原始训练验证集进行合理划分,与未划分相比明显缩小了预测误差;3、用网格法对支持向量机模型进行了参数寻优,得到每轮循环中的最优模型。
附图说明
图1为本发明方法的流程框图。
图2为训练集、验证集和测试集的划分示意图。
图3为DG接入的13节点网络拓扑结构图。
图4为预测24小时电压偏差和实际电压偏差曲线图。
图5为预测24小时电压偏差相对误差曲线图。
具体实施方式
下面结合实施例及附图对本发明作进一步的详细说明,但本发明的实施方式不限于此。实施例中含DG配电网电能质量预测方法的总体框图如附图1所示,本发明的一种基于支持向量机的含分布式电源配电网电能质量预测方法,包括以下步骤:
1、数据输入及测试集划分:输入n个含8个特征值的向量数组,组成数据矩阵X,其中8个特征值分别为历史时间、温度、光照、负荷、电压偏差、频率偏差、三相不平衡度和谐波畸变率;这8个特征值中,前四个特征值定义为输入特征值,后四个定义为输出特征值;取其中d个向量数组作为测试集矩阵Z,其余n-d个向量数组作为建模所需的训练验证集Y;考虑到测试集数据必为未来时刻的数据,因此测试集选用按照时间排序规则位于最末尾的d个向量数组;
以如附图2所示拓扑结构的13节点配电网为例进行仿真,其中节点4、7、8、10、11、13为负荷接入节点,节点13为光伏DG接入节点;设置21天24小时的不同温度、光照及各节点的负荷,仿真得到含时间、温度、光照、负荷、电压偏差、频率偏差、三相不平衡度和谐波畸变率8个特征的共504组数据向量,组成数据矩阵X(504×8);取最后一天的24组数据作为测试集矩阵Z(24×8),其余480组数据作为训练验证集Y(480×8);
2、训练集及验证集划分:将训练验证集Y划分为k个同等大小的互斥子集Aj,j=1,2,…,k,并且满足公式(1)所示要求;设定i是集合[1,k]中的任意一个数值,取子集Ai作为验证集合,定义Qi作为训练集合,满足公式(1)所示等式;测试集、验证集和训练集的划分示意图见附图3;
实施例中,按照天数将训练验证集Y划分为20个同等大小的互斥子集A1,A2,…,A20,每个子集包含一天24小时的数据,循环变量i从1遍历到20,在每个循环中依次将这20天中取其中一天作为验证集,剩下的19天数据作为训练集;
3、数据归一化处理:由于不同特征值的量纲不一样,不能进行直接线性组合,而且其值大小的数量级存在差异,未经处理将其进行线性组合会导致数量级小数值被数量级大数值忽略的情况,因此需要将数据进行归一化处理;归一化处理还能使最优解的寻优过程明显变得平缓,加快求解过程中参数的收敛速度;
步骤301,将训练集中的输入特征值数据按式(3)进行归一化处理;
步骤302,将训练集中输出特征值数据按公式(4)进行归一化处理;
步骤303,利用公式(5)、(6)将训练集中输入特征值归一化处理标准分别应用于验证集和测试集中的输入特征值;
步骤304,利用公式(7)将训练集中输出特征值归一化处理标准应用于验证集中的输出特征值;
归一化以后的训练集、验证集和测试集分别记为Qi′、Ai′、Z′,i∈(1,20);实施例中以验证集输出电压偏差数据为例,给出归一化前后的数据对比,见表1:
表1验证集输出电压偏差归一化前后数据对比表
4、最优PQ预测模型的构建:支持向量机根据训练集进行机器学习,根据验证集检验学习的正确率;由于学习样本不包含被学习母体的所有分布情况,样本分布不均匀会导致预测模型过拟合或欠拟合;为了得到最优PQ预测模型,需要确定训练集最接近母体样本分布的最优划分方式,以及此划分方式下支持向量机的最优参数;
步骤401,支持向量机的回归过程:
对于给定n组样本数据{xu,yu},u=1,2,···,n,其中xu为输入,yu为输出,利用一个非线性映射,将数据x映射到高维特征空间G,在这个空间进行线性逼近;根据统计学习理论,该逼近函数f(x)形式如公式(8)、公式(9)所示;
公式(9)等价于求解公式(10)、公式(11)所示的优化问题:
引入核函数方法将公式(10)、公式(11)转化成公式(12)、公式(13),求解上述二次规划得到的非线性映射,如公式(14)、公式(15)所示;
由于在计算f(x)时,无需计算ω和Φ(x)的数值,只需计算Lagrange乘子ht以及核函数K(xt,xk),即能解决维数灾难问题;建立SVM回归模型所需的参数优选,关键是选择参数c和g;
实施例中,c和g的取值范围都为[-10,10],网格步长为1;
步骤402,采用网格搜索法,使参数c和g在一定范围内划分网格,并取定一组c和g的参数组合;
步骤403,对取定的c和g参数值利用K-CV方法,将原始数据均分成k’组,将每个子集数据分别选做一次验证集,其余的k’-1组子集数据作为训练集,将得到k’个模型;采用这k’个模型最终验证集的分类准确率平均数作为此K-CV法分类器的预测准确度,最终选择能够使得训练集预测准确度最高的参数copt、gopt作为最优参数组合;
步骤404,利用训练集Qi′和步骤403所得的最优参数组合copt、gopt,按照步骤401所述回归过程构建基于支持向量机的PQ预测模型;
步骤405,按照步骤402方法,遍历所有c和g划分的网格取值,并将步骤403,步骤404依次循环执行;对于步骤404所得的各预测模型,分别输入验证集Ai′的输入特征值进行预测,获得各次循环对应的PQ指标预测值pv;v为本次预测值编号,其数值的最大值由c和g划分的网格数量决定;
步骤406,将步骤405所得各次循环对应的PQ指标预测值pv与该PQ指标真实值r进行比较,计算其均方误差值如公式(16)所示;
步骤407,再次利用K-CV法,更替预测模型的训练集和验证集;重复k次,记下获得最小均方误差时所对应的训练集、验证集划分方式,以及对应的最优copt、gopt参数,得到最优PQ预测模型;
在实施例中,从前20天数据中取其中一天作为验证集,余下19天作为训练集,重复20次,得到误差最小的划分方式为取第2天的数据为验证集,取第1天及第3~20天的数据为训练集,最佳c为2,最佳g为1,由此训练出最优支持向量机PQ预测模型;
5、基于最优模型进行PQ预测:基于步骤407所得的最优PQ预测模型,并以测试集中的时间、温度、光照、负荷四个输入特征值作为模型输入量进行预测,预测模型输出结果即为归一化形式下的PQ预测输出特征集P′;将此预测输出结果按照步骤302中训练集输出值归一化处理标准进行反归一化处理,得到PQ预测输出特征集P,如公式(17)所示;
6、预测结果相对误差计算:将模型的预测输出特征值数据pout与测试集中的实际输出特征值数据zout进行比较,进行PQ预测结果的相对误差值计算,如公式(18)所示;
实施例中,以电压偏差为例,预测得到第21天每小时电压偏差和实际仿真得到的电压偏差及两者相对误差,如表2和附图4、附图5所示:
表2未来24小时电压偏差预测值和实际值对比表
算例分析显示,本发明所提方法能够实现含DG配电网的电能质量预测,并将预测的误差控制在较小范围内,为下一步含DG配电网的电能质量治理和改善的决策提供有效依据,进而尽早解决目标电网存在的电能质量潜在问题。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (1)
1.一种基于支持向量机的含分布式电源配电网电能质量预测方法,包括如下步骤:
步骤1、数据输入及测试集划分:输入n个含8个特征值的向量数组,组成数据矩阵X,其中8个特征值分别为历史时间、温度、光照、负荷、电压偏差、频率偏差、三相不平衡度和谐波畸变率;这8个特征值中,前四个特征值定义为输入特征值,后四个定义为输出特征值;取其中d个向量数组作为测试集矩阵Z,其余n-d个向量数组作为建模所需的训练验证集Y;考虑到测试集数据必为未来时刻的数据,因此测试集选用按照时间排序规则位于最末尾的d个向量数组;
步骤2、训练集及验证集划分:将训练验证集Y划分为k个同等大小的互斥子集Aj,j=1,2,…,k,并且满足
|A1|=|A2|=…=|Ak| (1)
式中,|Aj|是指集合Aj的元素个数,即集合的势;设定i是集合[1,k]中的任意一个数值,取子集Ai作为验证集合,定义Qi作为训练集合,满足
Qi=Y-Ai (2)
步骤3、数据归一化处理:由于不同特征值的量纲不一样,不能进行直接线性组合,而且其值大小的数量级存在差异,未经处理将其进行线性组合会导致数量级小数值被数量级大数值忽略的情况,因此需要将数据进行归一化处理;归一化处理还能使最优解的寻优过程明显变得平缓,加快求解过程中参数的收敛速度;
步骤301,将训练集中的输入特征值数据按式(3)进行归一化处理:
式中,qin′为训练集中输入特征值归一化处理后的数据,qin为训练集中输入特征值归一化处理前的数据,qin.min为所有qin数据集合中的最小值,qin.max为所有qin数据集合中的最大值;
步骤302,将训练集中输出特征值数据按公式(4)进行归一化处理:
式中,qout′为训练集中输出特征值归一化处理后的数据,qout为训练集中输出特征值归一化处理前的数据,qout.min为所有qout数据集合中的最小值,qout.max为所有qout数据集合中的最大值;
步骤303,利用公式(5)、(6)将训练集中输入特征值归一化处理标准分别应用于验证集和测试集中的输入特征值:
式中,ain′为验证集中输入特征值归一化处理后的数据,ain为验证集中输入特征值归一化处理前的数据;zin′为测试集中输入特征值归一化处理后的数据,zin为测试集中输入特征值归一化处理前的数据;
步骤304,利用公式(7)将训练集中输出特征值归一化处理标准应用于验证集中的输出特征值:
式中,aout′为验证集中输出特征值归一化处理后的数据,aout为验证集中输出特征值归一化处理前的数据;
归一化处理后的训练集、验证集和测试集分别记为Qi′、Ai′、Z′;
步骤4、最优PQ预测模型的构建:支持向量机根据训练集进行机器学习,根据验证集检验学习的正确率;由于学习样本不包含被学习母体的所有分布情况,样本分布不均匀会导致预测模型过拟合或欠拟合;为了得到最优PQ预测模型,需要确定训练集最接近母体样本分布的最优划分方式,以及此划分方式下支持向量机的最优参数;
步骤401,支持向量机的回归过程:
对于给定n组样本数据{xu,yu},u=1,2,···,n,其中xu为输入,yu为输出,利用一个非线性映射,将数据x映射到高维特征空间G,在这个空间进行线性逼近;根据统计学习理论,该逼近函数f(x)形式为:
f(x)=ω·Φ(x)+b (8)
式中,(·)为内积运算,ω是高维空间G内可调的权值向量,Φ(x)为输入x的非线性映射,b为偏置项;ω和b通过最小化泛函进行估计:
式中,Rreg[f]为正则化风险泛函,Remp[f]为经验风险,γ为规则化常数,||.||表示欧氏范数;
公式(9)等价于求解以下优化问题:
其约束条件为
式中,minJ表示最小化目标函数J,ξt为超平面上、下两个不同的松弛变量,c为正规化常数,其值越大表示数据拟合度越高;系数ε控制回归逼近误差管道的大小,决定了对训练样本的拟合精度,其值越大则支持向量越少,精度越低;
引入核函数方法将公式(10)、公式(11)转化成:
其约束条件为
式中,maxJ表示最大化目标函数J,s定义为用于遍历集合[1,n]的变量;hs,ht为四个Lagrange乘子,即最小化Rreg[f]的解;xs表示下标为s的样本输入;K表示核函数;
求解上述二次规划得到的非线性映射,表示为:
其中,K(xt,xu)=Φ(xt)·Φ(x)是满足Mercer条件的核函数;选用RBF核函数,即径向基核函数,其表达式为:
K(xt,xu)=exp(-g||xt-xu||2),g>0 (15)
式中,exp()指数函数,参数g为gamma函数,即伽玛函数的参数设置;设变量m为属性数目,则g默认为1/m;
由于在计算f(x)时,无需计算ω和Φ(x)的数值,只需计算Lagrange乘子ht以及核函数K(xt,xk),即能解决维数灾难问题;建立SVM回归模型所需的参数优选,关键是选择参数c和g;
步骤402,采用网格搜索法,使参数c和g在一定范围内划分网格,并取定一组c和g的参数组合;
步骤403,对取定的c和g参数值利用K-CV方法,将原始数据均分成k’组,将每个子集数据分别选做一次验证集,其余的k’-1组子集数据作为训练集,将得到k’个模型;采用这k’个模型最终验证集的分类准确率平均数作为此K-CV法分类器的预测准确度,最终选择能够使得训练集预测准确度最高的参数copt、gopt作为最优参数组合;
步骤404,利用训练集Qi′和步骤403所得的最优参数组合copt、gopt,按照步骤401所述回归过程构建基于支持向量机的PQ预测模型;
步骤405,按照步骤402方法,遍历所有c和g划分的网格取值,并将步骤403,步骤404依次循环执行;对于步骤404所得的各预测模型,分别输入验证集Ai′的输入特征值进行预测,获得各次循环对应的PQ指标预测值pv;v为本次预测值编号,其数值的最大值由c和g划分的网格数量决定;
步骤406,将步骤405所得各次循环对应的PQ指标预测值pv与该PQ指标真实值r进行比较,计算其均方误差值:
其中,MSE表示均方误差值,r为验证集A′i的输出特征值;
步骤407,再次利用K-CV法,更替预测模型的训练集和验证集;重复k次,记下获得最小均方误差时所对应的训练集、验证集划分方式,以及对应的最优copt、gopt参数,得到最优PQ预测模型;
步骤5、基于最优模型进行PQ预测:基于步骤407所得的最优PQ预测模型,并以测试集中的时间、温度、光照、负荷四个输入特征值作为模型输入量进行预测,预测模型输出结果即为归一化形式下的PQ预测输出特征集P′;将此预测输出结果按照步骤302中训练集输出值归一化处理标准进行反归一化处理,得到PQ预测输出特征集P:
pout=pout′×(qout.max-qout.min)+qout.min (17)
式中,pout′为未经反归一化处理的预测输出特征值数据,pout为经反归一化处理的预测输出特征值数据;
步骤6、预测结果相对误差计算:将模型的预测输出特征值数据pout与测试集中的实际输出特征值数据zout进行比较,进行PQ预测结果的相对误差值计算:
式中,RE表示相对误差值,|pout-zout|表示pout和zout差值的绝对值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810644850.3A CN108876039B (zh) | 2018-06-21 | 2018-06-21 | 一种基于支持向量机的含分布式电源配电网电能质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810644850.3A CN108876039B (zh) | 2018-06-21 | 2018-06-21 | 一种基于支持向量机的含分布式电源配电网电能质量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108876039A true CN108876039A (zh) | 2018-11-23 |
CN108876039B CN108876039B (zh) | 2021-07-27 |
Family
ID=64340193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810644850.3A Active CN108876039B (zh) | 2018-06-21 | 2018-06-21 | 一种基于支持向量机的含分布式电源配电网电能质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108876039B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635292A (zh) * | 2018-12-05 | 2019-04-16 | 杭州东方通信软件技术有限公司 | 基于机器学习算法的工单质检方法和装置 |
CN109659933A (zh) * | 2018-12-20 | 2019-04-19 | 浙江工业大学 | 一种基于深度学习模型的含分布式电源配电网电能质量预测方法 |
CN109871976A (zh) * | 2018-12-20 | 2019-06-11 | 浙江工业大学 | 一种基于聚类及神经网络的含分布式电源配电网电能质量预测方法 |
CN110276497A (zh) * | 2019-06-27 | 2019-09-24 | 河南工业大学 | 一种粮仓建筑气密性指标的点预测方法 |
CN110384507A (zh) * | 2019-07-16 | 2019-10-29 | 西安石油大学 | 一种基于嘴唇光学无创测量血糖浓度的检测方法 |
CN110445191A (zh) * | 2019-08-02 | 2019-11-12 | 浙江大学 | 用支持向量机的电力系统发电机组调频备用功率分配方法 |
CN110808581A (zh) * | 2019-10-25 | 2020-02-18 | 浙江工业大学 | 一种基于dbn-svm的主动配电网电能质量预测方法 |
CN111191815A (zh) * | 2019-11-25 | 2020-05-22 | 清华大学 | 一种用于风电集群的超短期出力预测方法及系统 |
CN111639715A (zh) * | 2020-06-01 | 2020-09-08 | 重庆大学 | 基于ls-svm的汽车仪表组装质量预测方法与系统 |
CN113283534A (zh) * | 2021-06-11 | 2021-08-20 | 浙江工业大学 | 基于支持向量机模型线性逼近的黑盒测试方法及系统 |
CN113642649A (zh) * | 2021-08-16 | 2021-11-12 | 国网山东省电力公司营销服务中心(计量中心) | 一种基于支持向量机的hplc通信模块合格分类方法 |
CN113792490A (zh) * | 2021-09-16 | 2021-12-14 | 国网江苏省电力有限公司营销服务中心 | 一种基于支持向量回归机的水泥搅拌机能耗建模方法 |
CN113822432A (zh) * | 2021-04-06 | 2021-12-21 | 京东科技控股股份有限公司 | 样本数据的处理方法、装置、电子设备及存储介质 |
CN114815931A (zh) * | 2022-06-23 | 2022-07-29 | 中国飞机强度研究所 | 一种极端高温环境下飞机构件热试验温度控制方法 |
CN115022187A (zh) * | 2022-01-20 | 2022-09-06 | 长沙理工大学 | 计及时序相关性的数据驱动电-气综合能源系统态势感知方法与模型 |
CN116401931A (zh) * | 2023-06-08 | 2023-07-07 | 吉林大学 | 一种循环井结构和运行参数优化方法、系统及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605757A (zh) * | 2013-11-25 | 2014-02-26 | 国家电网公司 | 一种基于支持向量机的高铁电能质量数据的分类方法 |
CN105046383A (zh) * | 2015-09-19 | 2015-11-11 | 东北电力大学 | 一种基于集合经验模态分解和相关向量机的风电功率实时预测方法 |
CN107491832A (zh) * | 2017-07-12 | 2017-12-19 | 国网上海市电力公司 | 基于混沌理论的电能质量稳态指标预测方法 |
-
2018
- 2018-06-21 CN CN201810644850.3A patent/CN108876039B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605757A (zh) * | 2013-11-25 | 2014-02-26 | 国家电网公司 | 一种基于支持向量机的高铁电能质量数据的分类方法 |
CN105046383A (zh) * | 2015-09-19 | 2015-11-11 | 东北电力大学 | 一种基于集合经验模态分解和相关向量机的风电功率实时预测方法 |
CN107491832A (zh) * | 2017-07-12 | 2017-12-19 | 国网上海市电力公司 | 基于混沌理论的电能质量稳态指标预测方法 |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635292A (zh) * | 2018-12-05 | 2019-04-16 | 杭州东方通信软件技术有限公司 | 基于机器学习算法的工单质检方法和装置 |
CN109871976B (zh) * | 2018-12-20 | 2020-12-25 | 浙江工业大学 | 一种基于聚类及神经网络的含分布式电源配电网电能质量预测方法 |
CN109659933A (zh) * | 2018-12-20 | 2019-04-19 | 浙江工业大学 | 一种基于深度学习模型的含分布式电源配电网电能质量预测方法 |
CN109871976A (zh) * | 2018-12-20 | 2019-06-11 | 浙江工业大学 | 一种基于聚类及神经网络的含分布式电源配电网电能质量预测方法 |
CN109659933B (zh) * | 2018-12-20 | 2022-03-18 | 浙江工业大学 | 一种基于深度学习模型的含分布式电源配电网电能质量预测方法 |
CN110276497A (zh) * | 2019-06-27 | 2019-09-24 | 河南工业大学 | 一种粮仓建筑气密性指标的点预测方法 |
CN110384507A (zh) * | 2019-07-16 | 2019-10-29 | 西安石油大学 | 一种基于嘴唇光学无创测量血糖浓度的检测方法 |
CN110445191A (zh) * | 2019-08-02 | 2019-11-12 | 浙江大学 | 用支持向量机的电力系统发电机组调频备用功率分配方法 |
CN110808581A (zh) * | 2019-10-25 | 2020-02-18 | 浙江工业大学 | 一种基于dbn-svm的主动配电网电能质量预测方法 |
CN111191815A (zh) * | 2019-11-25 | 2020-05-22 | 清华大学 | 一种用于风电集群的超短期出力预测方法及系统 |
CN111191815B (zh) * | 2019-11-25 | 2022-08-16 | 清华大学 | 一种用于风电集群的超短期出力预测方法及系统 |
CN111639715A (zh) * | 2020-06-01 | 2020-09-08 | 重庆大学 | 基于ls-svm的汽车仪表组装质量预测方法与系统 |
CN113822432A (zh) * | 2021-04-06 | 2021-12-21 | 京东科技控股股份有限公司 | 样本数据的处理方法、装置、电子设备及存储介质 |
CN113822432B (zh) * | 2021-04-06 | 2024-02-06 | 京东科技控股股份有限公司 | 样本数据的处理方法、装置、电子设备及存储介质 |
CN113283534A (zh) * | 2021-06-11 | 2021-08-20 | 浙江工业大学 | 基于支持向量机模型线性逼近的黑盒测试方法及系统 |
CN113283534B (zh) * | 2021-06-11 | 2024-03-19 | 浙江工业大学 | 基于支持向量机模型线性逼近的黑盒测试方法及系统 |
CN113642649A (zh) * | 2021-08-16 | 2021-11-12 | 国网山东省电力公司营销服务中心(计量中心) | 一种基于支持向量机的hplc通信模块合格分类方法 |
CN113792490A (zh) * | 2021-09-16 | 2021-12-14 | 国网江苏省电力有限公司营销服务中心 | 一种基于支持向量回归机的水泥搅拌机能耗建模方法 |
CN115022187B (zh) * | 2022-01-20 | 2023-12-08 | 长沙理工大学 | 一种电-气综合能源系统态势感知方法与装置 |
CN115022187A (zh) * | 2022-01-20 | 2022-09-06 | 长沙理工大学 | 计及时序相关性的数据驱动电-气综合能源系统态势感知方法与模型 |
CN114815931B (zh) * | 2022-06-23 | 2022-09-13 | 中国飞机强度研究所 | 一种极端高温环境下飞机构件热试验温度控制方法 |
CN114815931A (zh) * | 2022-06-23 | 2022-07-29 | 中国飞机强度研究所 | 一种极端高温环境下飞机构件热试验温度控制方法 |
CN116401931A (zh) * | 2023-06-08 | 2023-07-07 | 吉林大学 | 一种循环井结构和运行参数优化方法、系统及设备 |
CN116401931B (zh) * | 2023-06-08 | 2023-08-18 | 吉林大学 | 一种循环井结构和运行参数优化方法、系统及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108876039B (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876039A (zh) | 一种基于支持向量机的含分布式电源配电网电能质量预测方法 | |
Zhou et al. | Prediction of photovoltaic power output based on similar day analysis, genetic algorithm and extreme learning machine | |
Liu et al. | Random forest solar power forecast based on classification optimization | |
Wang et al. | Research on Hybrid Model of Garlic Short-term Price Forecasting based on Big Data. | |
CN106505593B (zh) | 一种基于大数据的配变三相不平衡分析与负荷调整的方法 | |
Dai et al. | LOWESS smoothing and Random Forest based GRU model: A short-term photovoltaic power generation forecasting method | |
CN109659933A (zh) | 一种基于深度学习模型的含分布式电源配电网电能质量预测方法 | |
Guo et al. | Study on short-term photovoltaic power prediction model based on the Stacking ensemble learning | |
CN103106544B (zh) | 一种基于t-s型模糊神经网络的光伏发电预测系统 | |
CN105069236B (zh) | 考虑风电场节点空间相关性的广义负荷联合概率建模方法 | |
CN105069521A (zh) | 一种基于加权fcm聚类算法的光伏电站输出功率预测方法 | |
CN109193649A (zh) | 基于深度信念网络的分布式光伏集群动态等值建模方法 | |
Jović et al. | Solar radiation analyzing by neuro-fuzzy approach | |
Huang et al. | A Bayesian Network model for predicting cooling load of commercial buildings | |
CN107679660A (zh) | 基于支持向量机的逐时建筑能耗预测方法 | |
Haddad et al. | Smart distributed generation systems using artificial neural network-based event classification | |
CN105207573A (zh) | 基于离散概率模型的风光互补供电系统定量优化配置方法 | |
CN115829126A (zh) | 基于多视角自适应特征融合的光伏发电功率预测方法 | |
Gao et al. | Optimal parameter selection for support vector machine based on artificial bee colony algorithm: A case study of grid‐connected PV system power prediction | |
CN115986728A (zh) | 一种计及不确定性因素的电网态势预测方法与终端 | |
Han et al. | A multi-view and multi-scale transfer learning based wind farm equivalent method | |
Natgunanathan et al. | Deakin microgrid digital twin and analysis of AI models for power generation prediction | |
Burianek et al. | Solar irradiance forecasting model based on extreme learning machine | |
Wasesa et al. | Predicting electricity consumption in microgrid-based educational building using Google trends, Google mobility, and COVID-19 data in the context of COVID-19 pandemic | |
CN110059871A (zh) | 光伏发电功率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |