具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本发明实施例提供一种基于粗糙集的无功优化设备动作次数分析方法,依照执行的先后顺序,包括:数据准备和预处理阶段、基于粗糙集理论的设备动作次数增量挖掘阶段,和无功优化设备动作次数获取阶段;
其中,可以参考如图1所示的顺序:
A数据准备和预处理阶段,包括:
步骤A-1,获取本次挖掘所需要的母线负荷预测结果;
步骤A-2,根据峰谷阀值,对所述母线负荷预测结果进行划分;
步骤A-3,根据历史数据转换所述母线负荷预测结果中的字段属性;
B基于粗糙集理论的设备动作次数增量挖掘阶段步骤,包括:
步骤B-1,对第i个时段内的数据集合构建决策表,其中,i为正整数;
步骤B-2,计算i时段内负荷预测曲线和所述历史数据间不同字段属性的相似度;
步骤B-3,采用EQCR-DB聚类评价指标,对连续属性进行离散化处理;
步骤B-4,加载基于隶属度的决策规则增量挖掘程序;
步骤B-5,通过i<li,max判断所有时段是否全部挖掘完成,如果都挖掘完成则转入C-1,否则转入B-1,其中,li,max表示当前时段的最大值;
C无功优化设备动作次数获取阶段,包括:
步骤C-1,采用给定的置信度对不确定性规则进行处理,并得到强关联规则;
步骤C-2,本次挖掘计算结束。
本发明实施例提供的基于粗糙集的无功优化设备动作次数的分析方法,包括:数据预处理和准备阶段、基于粗糙集理论的设备动作次数增量挖掘阶段以及无功优化设备动作次数获取阶段。针对无功优化中设备动作次数设置繁琐且设置结果不易把握的问题,采用基于粗糙集理论的挖掘的方法,实现无功优化中设备动作次数智能划分和精准设置,并在此基础上对新增数据集进行增量挖掘,有效的解决了数据的重复和冗余挖掘问题,提高了挖掘的整体效率;本发明能有效的减轻运行人员在参数设置方面的繁琐工作使设备动作次数设置结果更加合理,并通过基于粗糙集的增量挖掘方法提高求解效率匹配在线控制的实时性需求。
在本实施例中,如图2所示,所述步骤A-2包括:
A-2-1,读入母线负荷预测曲线数据;
A-2-2,设定母线负荷预测曲线的峰谷个数阀值N;
A-2-3,对所述母线负荷预测数据按升序排列,得到所述母线负荷预测数据的升序排列的集合S;
A-2-4,选取集合S中前F个数据存入集合SF中,其中,集合SF为包括了集合 S中的数据的子集,在默认情况下F=3;
A-2-5,按所述A-2-3中所得的排列顺序,计算集合SF中两个数SFi,t和SFi+1,t之间的时间间隔,如果SFi,t-SFi+1,t≤δ(i=1,...,F-1),其中,δ为设定阀值,默认情况下δ=3,则成立且转入A-2-6,否则转入A-2-7,SFi,t表示集合SF中第i个数,SFi+1,t表示集合SF中第i+1个数;
A-2-6,在集合SF中删除SFi+1,t并补充SN+1进入集合SF,转入A-2-5,SN+1表示集合S中第N+1个数;
A-2-7,对所述母线负荷预测数据按降序排列,得到所述母线负荷预测数据的降序排列的集合J;
A-2-8,选取集合J中前G个数据存入集合JG中,其中,集合JF为包括了集合 J中的数据的子集,在默认情况下G=2;
A-2-9,按顺序计算集合JG中两个数JGi,t和JGi+1,t之间的时间间隔,如果 JGi,t-JGi+1,t≤δ(i=1,...,G-1),则成立且转入A-2-10,否则转入A-2-11,JGi,t和JGi+1,t分别表示集合JG中第i和i+1个数;
A-2-10,在集合JG中删除JGi+1,t并补充SN+1进入集合SF,转入A-2-9;
A-2-11,合并集合SF和JG,并按时间排序生成新的集合SHFi,t(i=1,...,G+F),并将集合SHFi,t中相邻两个数之间作为为一个时段划分,转入A-2-12;
A-2-12,所述步骤A-2结束。
在本实施例中,在所述步骤B-1中,被转换的字段属性包括:将“母线电压值”转换为“电压越线次数”和“电压偏差”;
将“变压器档位值”转换为“变压器动作次数”;
将“补偿设备投切状态”转换为“补偿设备动作次数”。
本实施例中,还通过将ED和DTW两种方法进行结合,重新设计了如图3所示一种相似度的比较方法:
通常的,集合间不同属性相似度的计算方法可以采用:
欧式距离Euclidenan(ED)的相似性比较的方法,其中,X,Y为两组序列。
m为序列长度,采用欧式距离计算方法对X,Y进行相似性的比对:
计算X,Y之间的距离D(X,Y)后,当D(X,Y)<δ(δ为给定阀值)时,可以判定两组时间序列相似。该方法计算直观简单,实现容易,但对噪声数据较为敏感且不易处理时间轴的形变问题。考虑到欧式距离在处理时间轴形变上的困难,动态时间弯曲距离DTW(DynamicTime Warping)能有效的解决时间轴形变问题,其主要思想为假设有两个时间序列X和Y
n,m分别是其长度,这里可以是n=m,也可以是n≠m,构造矩阵n×m矩阵D。矩阵中每一组值代表时间序列间点间的距离,当xn,ym之间越相似,其值越接近零;相反值越大。在DTW中各点的对应关系不再是一一对应,为了找到序列间最短距离,设置一个扭曲路径W,W=w1,w2,…,wk,…wK,同时max(m,n)≤K≤m+n+1
满足约束条件的两时间序列间的路径很多,但扭曲路径要求满足最小扭曲代价。
基于动态规划理论可知最小路径只需要对矩阵D做局部搜索,假设点(xi,yi) 在最优路径上,则点(x1,y1)到点(xi,yi)的子路径也是矩阵最优解。因此最优路径可由起始点(x1,y1)到终点(xn,ym)之间通过递归搜索获得。定义两个序列中任意两点间的DTW距离定义为:
D(i,j)={d(xi,yj)2+[min{D(i-1,j-1),D(r-1,j),D(i,j-1)}]2}1/2 (6)
这里d(xi,yj)表示欧式距离,从公式可以看出序列间两个点i,j之间的D(i,j)距离实际是(x1,y1)到(xi,yj)之间的最小累积距离。
由于ED和DTW在曲线相似性比对上都有各自的局限性,本实施例中挖掘对象为日负荷曲线,如果只采用ED进行相似度计算,考虑到日常运行中可能出现的数据缺失,在对历史数据库进行相似度比较时可能会出现较大的精度偏差,这对最终的关联挖掘结果会造成较大影响。但如果采用DTW,虽然在相似度的比对精度上会获得较大提升,但从计算效率来看,由于DTW计算的特点,当数据库采用整年或者多年的数据进行挖掘时,会造成计算量巨大,不利于实际应用。因此本发明首先对传统ED方法进行加权处理,消除曲线振幅平移和伸缩对时间序列相似性产生的影响。标准化的方法主要采用方差和均值进行归一化,假设序列X={x1,x2,…,xn),Y={y1,y2,…,yn)以序列X为例,该序列的均值为方差为D(X)=E(x2)-(E(x))2,标准化采用公式(7)
则原序列X变为X'={x1',x'2,…,x'n),Y变为Y'={y1',y'2,…,y'n),此时采用欧式距离计算两序列的相似度有如下公式:
尽管对序列进行标准化操作有利于序列间的相似度比较,但是在实际数据库中由于通道和数据维护等问题,数据库中常会出现时间点上数据丢失的情况,如果在时间序列比对的相似性计算中只采用标准化ED距离,对一些由于数据点丢失而导致的时间序列不匹配的情况,相似性计算结果可能会出现较大偏差,考虑到DTW在处理时间序列不匹配中的优势,本实施例将ED和DTW两种方法进行结合,重新设计了如图3所示一种相似度的比较方法,即在所述步骤B-2中,包括:
B-2-1,得到母线负荷预测的i个时段划分,并将i个时段内的数据保存到集合 Gi中;
B-2-2,读取历史库记录,并存入集合D中,其中,“历史库”具体指存储历史数据的数据库,或者在存储器上开辟的存储历史数据的存储空间,其中主要记录了历史断面的电压,有功,无功,控制设备动作次数等作为历史数据的信息;
B-2-3,计算Gi集合内元素个数,并记为m_Gi;
B-2-4,获得时段i内,所述集合D中第j条数据集合Dij,并计算Dij中元素个数,并记为m_Dij;
B-2-5,判断m_Gi和m_Dij是否相等,如果m_Gi=m_Dij则采用标准化ED(Euclidenan,欧式距离)距离计算相似度,否则采用标准化DTW(Dynamic Time Warping,动态时间弯曲距离)距离计算相似度;
B-2-6,获得集合间的相似度,如果j<lj,max则令j=j+1,且转入B-2-4,否则转入B-2-7;
B-2-7,完成i时段内所有集合间相似度的计算;
B-2-8,如果i<li,max则令i=i+1,转入B-2-3,否则
转入B-2-9;
B-2-9,所述步骤B-2中的相似度计算结束。
具体的,所述步骤B-3的实现方式,包括:
B-3-1,确定聚类数k的搜索范围,其中,设定为2≤k≤5;
B-3-2,按顺序选取聚类搜索范围内的不同k值,获得初始聚类中心个数;
B-3-3,运用k-均值聚类算法,更新计算关系矩阵和聚类中心;
B-3-4,获得聚类结果并计算聚类优劣评价指标(EQCR-DB)的值,当k≤5时,令k=k+1并转入B-3-2,否则转入B-3-5;
B-3-5,比较各k值对应的EQCR-DB值,取EQCR-DB值最小的聚类作为最佳聚类;
B-3-6,根据最佳聚类数输出聚类结果,根据聚类结果对属性进行离散化处理。
进一步的,所述步骤B-3-5的实现方式,包括:
B-3-5-1获得各个k值下的聚类结果;
B-3-5-2计算Davies-Bouldin(DB)指标,DB指标表示一个类内距离和聚类中心间距的一个测度,表示为:其中,Mij表示类i和 j之间两中心的距离,Si表示类i中所有个体到聚类中心的平均距离,Sj表示类j 中所有个体到聚类中心的平均距离,其中,DB指标越小则表示此时分类的结果越好。尽管DB这个指标能很好的反映聚类中心间和聚类内的差异化,但是这个指标仅从聚类中心的角度来判断聚类的优劣,并没有分析不同聚类内部的紧密关系对聚类结果的影响,当某个聚类中聚类个体较多但是聚类结果不是很紧密的时候,DB指标的判断结果可能会有偏差,因此还需要从另外一个角度分析不同聚类内的个体紧密程度对聚类结果的影响;
B-3-5-3计算在第j个类中的第i个个体到其他不同聚类间平均距离的最小值:
其中,c表示聚类的个数,nk表示k中个体的数量,k和j分别表示第k个聚类和第j个聚类;
B-3-5-4计算第j个类中的第i个个体本类中的平均距离:
其中,j表示第j个聚类,Dj表示第j个类中的样本个数;
B-3-5-5构造EQCR,EQCR的取值范围在(-1,1),EQCR指标定义如下:
其中,聚类的好坏一个重要的评判标准是要实现聚类中个体的距离越小越好,而聚类间的个体距离越大越好,基于这样的考虑,本发明构造一个兼顾聚类间距离和聚类内距离的指标EQCR,EQCR的取值范围在(-1,1),EQCR指标定义如:
B-3-5-6将EQCR指标转换为1/EQCR,得到新的EQCR-DB指标,具体形式如下:
其中,为了能跟好的均衡聚类间和聚类内的差异,以及考虑不同聚类紧密程度对聚类的影响,本发明将两种指标进行线性化组合实现均衡,考虑到构建 EQCR指标是越大越好,而DB指标是越小越好,因此将EQCR指标变为1/EQCR,最终构造新的EQCR-DB指标,具体形式如:
在本实施例中,所述步骤B-4可以执行为如图4所示的基于隶属度函数的决策规则增量挖掘方式:
B-4-1对原决策系统执行属性约简流程,删除条件属性中相对决策属性可以省略的属性,得到原系统决策表S,其中,令IS=S;
B-4-2输入决策表IS,其中,令n=1,此处的n表示属性集中属性的个数;
B-4-3计算不同属性的等价类划分和相应的隶属度,隶属度计算方式为:其中,x为条件属性v的值T所对应的对象,Wi是根据决策属性得到的等价类集合,定义隶属度阀值用于判断规则是否可用;
B-4-4当成立时,获得该决策规则存入规则库Ux,当时,R=R∪Ux同时删除该隶属度;当时,直接删除隶属度;当时,将等价类相同的隶属度中属性集进行扩展,扩展为n+1;
B-4-5可以设定n=n+1,如果n=m+1,则提取决策规则Ux,此时若有则R=R∪Ux,转入B-4-6,否则转入B-4-3;
B-4-6输出规则集合R;
B-4-7如果IS=S,则令原系统规则集合为IRi={IR1,....,IRn},对应隶属度阀值IU0,i={IU0,1,....,IU0,n},则IR=R;如果IS=ZS,令增量系统规则集合为 ZRi={ZR1,....,ZRn},对应隶属度阀值ZU0,i={ZU0,1,....,ZU0,n}则ZR=R;
B-4-8对增量决策系统执行属性约简流程,删除条件属性中相对决策属性可以省略的属性,得到增量系统决策表ZS,令IS=ZS,转入步骤B-4-2;
B-4-9最终的决策规则LRi={IR1,....,IRn}∪{ZR1,....,ZRn},当IRi和ZRi中出现规则不一致的时候,采用判定规则:1)当ZU0,i<IU0,i,即表示原决策规则好于增量决策规则,删除增量决策规则保留原来规则;2)当ZU0,i>IU0,i,即表示增量策规则好于原决决策规则,删除原决策规则,保留增量决策规则;3)当 ZU0,i=IU0,i,即表示两个规则都不可取,删除对应的原决策规则和增量决策规则;
B-4-10最终得到数据库的所有决策规则LRi=IRi∪ZRi。
可选的,在本实施例中,还包括步骤B-4’,包括:基于核属性和属性约束的最优属性,加载约简策略;之后采用分类规则算法得到分类规则。
其中,所述基于核属性和属性约束的最优属性,加载约简策略,包括B-4’-1 至B-4’-7的步骤流程:
B-4’-1,输入决策表Ai,j,令A={A1,…,An},其中,A表示所有属性集合,n表示属性的总个数,令i=1;
B-4’-2,对条件属性集合C中的每一个条件属性Ai进行分析,其中,设置D 为决策属性;
B-4’-3,如果有Card(π(C-A+D))≠Card(π(C-A))成立,则Core=Core∪A, i=i+1;
同时计算属性的关键度M(Ai,C,D)=Card(π(C+Ai))/Card(π(C+Ai+D)),并存入集合M,(π为定义函数);
B-4’-4,当i<n时,转入B-4’-3,否则转入B-4’-5;
B-4’-5,对M={M1,...,Mn}集合按照关键度降序排列,并计算
B-4’-6,获得属性的约束范围[k,W],如果N(Core)<K,则从中按顺序选取 直到N(Core)=K转入步骤B-4’-7;
B-4’-7,获得属性约简结果Core。
需要说明的是,B-4与B-4’可以同时执行,或者B-4与B-4’可以选择其一执行。
在本实施例中,在所述步骤A-2中,还可以对母线负荷预测结果根据峰谷阀值进行自动划分:
A-2’-1,获取相应母线负荷预测结果;
A-2’-2,对曲线进行均等时段划分并计算划分后曲线斜率;
A-2’-3,定义曲线形态;
A-2’-4,加载第i个时间段内曲线Zi形态为L,U,HU,D,HD时的判断程序;
A-2’-5,生成分段曲线合并判断矩阵;
A-2’-6,定义孤立曲线;
A-2’-7,加载孤立曲线形态为L,U,HU,D,HD时的归并程序;
A-2’-8,得到曲线划分个数N;
A-2’-9,本次划分结束。
具体的,在所述步骤A-2’-3中,定义曲线形态的流程包括:
对预测曲线进行等分后,得到n条时间段曲线,为了使曲线的划分更符合峰谷特征,需要对划分后的n条时间段曲线进行相邻时间段之间的归并。首先需要对划分后曲线的趋势进行定义,这里将曲线的趋势分为5种形态,具体见表1:
表1曲线形态定义
形态定义 |
形态表示 |
斜率对应的范围 |
快速上升 |
HU |
[1+tk,+∞] |
上升 |
U |
[tk,1+tk] |
水平 |
L |
[-tk,tk] |
下降 |
D |
[-tk,-1-tk] |
快速下降 |
HD |
[-1-tk,-∞] |
其中,tk的取值为tk∈(0,1)且tk<<1。
步骤A-2’-4,第i个时间段内曲线Zi形态为L,U,HU,D,HD时的判断方法,具体如下:图5(a)描述了第i个时间段内曲线Zi形态为L时的判断,如果相邻曲线Zi+1的形态也为L时,将第i和i+1段曲线进行合并,其他情况则不合并。图5(b)描述了第i个时间段内曲线Zi的形态为U或HU时,此时如果相邻曲线Zi+1的形态为U或HU,两个时间段内的曲线进行合并,其他情况则不合并;图5(c)描述了第i个时间段内曲线Zi形态为D或HD时,此时如果相邻曲线Zi+1的形态为D或 HD,则两个时间段内的曲线进行合并,其他情况则不合并。
步骤A-2’-5中所生成的分段曲线合并判断矩阵,具体矩阵如表2所示:
表2曲线合并判断矩阵
其中,“+”表示可以合并,“-”表示不能合并。
步骤A-2’-6中所定义的孤立曲线具体可以理解为:孤立曲线是指通过线性分段后不能通过相邻时段内的曲线合并判断矩阵进行合并的曲线,并且该曲线是单个时间段内的曲线。
在步骤A-2’-7中,孤立曲线形态为L,U,HU,D,HD时的归并方法;,具体方法如下:
1)若孤立曲线的形态为L(即Zi=L),此时取孤立曲线相邻曲线段Zi-1,Zi+1的形态进行分析,如果Zi-1,Zi+1形态一致,此时将Zi和前后曲线段整体合并得到新的曲线。虑到孤立曲线的不同形态以及归并时前后曲线的形态差异,需要对不同情况逐一分析,表3为孤立曲线合并判断矩阵,表中“+”表示Zi曲线可以和前后曲线进行整体归并。表中Zi+1和Zi-1分别表示Zi曲线合并到指定的一侧,△K则表示此时Zi曲线合并到哪一侧需要根据Zi和前后两段曲线的斜率差进行判断。
表3孤立曲线为L时的合并判断矩阵
其中,“+”表示可以合并,“-”表示不能合并。
表4为Zi+1和Zi-1曲线趋势不一致时的判断矩阵,△Ki-1,i表示Zi和Zi-1曲线间的斜率差,△Ki,i+1表示Zi和Zi+1曲线间的斜率差,如果|△Ki-1,i|>|△Ki,i+1|,则将Zi曲线归并到Zi+1侧中,如果|△Ki-1,i|<|△Ki,i+1|,则将Zi曲线归并到Zi-1侧中,如果|△Ki-1,i|=|△Ki,i+1|,则将Zi归并到Cn,min。Cn,min表示曲线总个数较少的曲线段,归并过程如图5(a)所示。
表4 △K归并判断矩阵
2)若孤立曲线形态为U或HU时,取和孤立曲线相邻曲线段Zi-1,Zi+1的形态进行分析,如果Zi-1,Zi+1形态一致,此时将Zi和前后曲线段整体合并,如果曲线段形态不一致参照表5进行归并,得到如图5(b)所示的曲线段形态,归并过程如图6所示。
表5.孤立曲线为HU或U时的合并判断矩阵
3)若孤立曲线形态为D或HD时,取和孤立曲线相邻曲线段Zi-1,Zi+1的形态进行分析,若Zi-1,Zi+1形态一致,此时将Zi和前后曲线段整体合并,如果曲线段形态不一致参照表6进行归并,得到如图5(c)所示的曲线段形态。
表6.孤立曲线为HD或D时的合并判断矩阵
在本实施例中,从历史数据间的关联性出发分析了无功优化在线控制中设备动作次数的设置问题,首先通过引入短期母线负荷预测结果对预测曲线进行合理划分获得设备的时段分区;其次采用本实施例中提出的EQCR-DB聚类评价指标对连续属性进行离散化处理,并加载基于隶属度的决策规则增量挖掘程序对历史数据进行挖掘,最终通过对数据库的增量挖掘结果进行筛选获得设备动作次数时段内的合理分配次数,从而实现无功优化在线控制中设备动作次数的自动和合理设置,在减轻运行人员工作强度的同时提高了无功优化在线控制的效果。
针对现有技术中无功优化在线控制中设备动作次数设置繁琐且设置结果不合理的实际问题,引入母线负荷预测的结果作为判断基础,提出一种基于粗糙集的无功优化设备动作次数增量挖掘方法,通过对历史数据库采用基于粗糙集的增量挖掘方法解决无功优化设备动作次数的精准设置以及新增数据集的快速挖掘。实现了对无功优化在线控制中设备动作次数进行有效设置,从而解决现有无功优化在线控制中设备动作次数设置繁琐且设置结果不精确的问题,同时通过基于粗糙集的改进增量挖掘算法提高新增数据的挖掘效率避免重复挖掘。在减轻运行人员工作强度的同时满足在线控制需求并提高电网无功优化的整体控制效果,为电网无功优化在线控制效果的进一步提升提供一种切实可行的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。