发明内容
为了解决上述技术问题,本发明提出了一种基于局部离群点因子 的低压窃电用户定位方法,可有效提高反窃电工作效率,从而有效解 决了低压台区反窃电工作效率低下、成本高等技术问题。
本发明采用了以下技术方案:
一种基于局部离群点因子的低压窃电用户定位方法,包括如下步 骤:
步骤1:确定影响台区线损的属性特征;基于所述属性特征搜寻 与监测台区最相似的k个台区,即k个最近邻台区,其中,k为预设 值;
步骤2:对所述监测台区以及所述k个最近邻台区的线损率进行 实时监测,并基于所述k个最近邻台区的所述线损率判断所述监测台 区的所述线损率是否异常;
步骤3:当所述监测台区某段时间的线损率正常时,返回至所述 步骤2;
步骤4:当所述监测台区某段时间的线损率异常时,计算所述监 测台区内所有用户该段时间负荷曲线之间的离散Fréchet距离;
步骤5:基于所述用户负荷曲线之间的离散Fréchet距离计算所 述监测台区内所有用户负荷曲线的局部离群点因子;
步骤6:根据所述用户负荷曲线的局部离群点因子的大小对所述 监测台区所有用户作排序处理,进而判断所述用户窃电的概率;并返 回至所述步骤2。
优选的,在本发明中,在所述步骤1中,影响台区线损的属性特 征包括供电半径、低压线路总长度、负载率、居民用电比例、户均用 电量;
其中,所述供电半径X1(m),所述X1为所述台区最远负荷点距离 供电变压器的线路距离;
所述低压线路总长度X2(m),所述X2为所述台区中所有低压线路 长度之和;
所述负载率X3(%),所述X3为所述台区供电量与供电变压器容量 的比率;
所述居民用电比例X4(%),所述X4为所述台区居民用户的用电量 与台区供电量的比率;
所述户均用电量X5(KW·H),所述X5为所述台区的所述用户的平 均用电量。
优选的,在本发明中,在所述步骤1中,基于所述属性特征搜寻 与监测台区最相似的k个台区,采用欧几里得距离度量,并对所述欧 几里得距离进行从小到大排序,从而确定所述k个最近邻台区;此时, 所述k个最近邻台区的影响线损的属性特征与所述监测台区的影响 线损的属性特征最接近。
优选的,在本发明中,所述欧几里得距离定义为:
其中,To=(Xo1,Xo2,...,Xo5)为所述监测台区影响线损的属性特 征向量,Tj=(Xj1,Xj2,...,Xj5)为所述监测台区所在地区的其它台区影 响线损的属性特征向量,j=1,2,…,m,m为所述监测台区所在地区 的其它台区数量。
优选的,在本发明中,在计算所述欧几里得距离之前,需对每一 个所述影响线损的属性特征值v进行规范化,所述规范化计算公式为:
其中,v表示为所述影响线损的属性特征向量T中的每一项特征 属性值,v′表示为所述特征属性值v进行规范化后的特征属性值,vmin表示同一所述影响线损的特征属性值的最小值,vmax表示同一所述影 响线损的特征属性值的最大值。
优选的,在本发明中,在所述步骤2中,
所述监测台区以及它的k个最近邻台区的所述线损率计算公式 如下:
当所述监测台区的所述线损率超出所述k个最近邻台区的所述 线损率均值的10%时,判定所述监测台区所述线损率异常。
优选的,在本发明中,所述步骤6中,
根据所述用户负荷曲线的局部离群点因子的大小对所述监测台 区所有用户作降序处理,用户负荷曲线的局部离群点因子值大于1的 用户窃电概率大,而且局部离群点因子值越大的用户窃电的概率越大。
本发明的有益效果是:
本发明所提出的方法输出线损率异常台区所有用户窃电概率排 序,只需要检测排序靠前用户即可检测出大部分窃电用户,大大提高 了反窃电工作效率,从而有效解决了低压台区反窃电工作效率低下、 成本高等技术问题。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结 合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整 地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全 部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所 获得的所有其他实施例,都属于本发明保护的范围。
同一台区下相同类型用户(例如城镇居民生活用电)负荷曲线波 动通常情况比较相似;不同类型用户(例如商业用电、城镇居民生活 用电)负荷曲线通常情况下差异比较明显。如何有效度量某个用户的 负荷曲线与同类型其它用户负荷曲线之间的差异,成为准确定位窃电 用户关键。某台区用户负荷曲线相似性分布如图1所示,其中各对象 之间距离代表它们负荷曲线相似性大小,距离越大两个用户负荷曲线 相似性越低。C1和C2是两种不同类型用户簇,U1和U2是两个窃电用 户。从图可以看出,C1和C2簇内用户负荷曲线差异较小,不同簇用 户负荷曲线差异明显;U1、U2两个用户负荷曲线与C1、C2两个簇用 户负荷曲线差异都比较大。该台区窃电用户定位问题,主要是从该台 区所有用户中准确地识别出U1、U2两个用户,本质上是一种局部离 群点检测问题。数据分析挖掘领域中基于距离(相似性)度量的局部 离群点检测技术可以很好地解决低压台区窃电用户定位问题。
图2为本发明一实施例的流程图,具体方法流程如下:
一种基于局部离群点因子的低压窃电用户定位方法,包括如下步 骤:
步骤1:确定影响台区线损的属性特征;基于所述属性特征搜寻 与监测台区最相似的k个台区,即k个最近邻台区,其中,k为预设 值;
所述影响台区线损的属性特征包括供电半径、低压线路总长度、 负载率、居民用电比例、户均用电量;
其中,所述供电半径X1(m),所述X1为所述台区最远负荷点距离 供电变压器的线路距离;
所述低压线路总长度X2(m),所述X2为所述台区中所有低压线路 长度之和;
所述负载率X3(%),所述X3为所述台区供电量与供电变压器容量 的比率;
所述居民用电比例X4(%),所述X4为所述台区居民用户的用电量 与台区供电量的比率;
所述户均用电量X5(KW·H),所述X5为所述台区的所述用户的平 均用电量。
所述基于所述属性特征搜寻与监测台区最相似的k个台区,采用 欧几里得距离度量,并对所述欧几里得距离进行从小到大排序,从而 确定所述k个最近邻台区;此时,所述k个最近邻台区的影响线损的 属性特征与所述监测台区的影响线损的属性特征最接近。
所述欧几里得距离定义为:
其中,To=(Xo1,Xo2,...,Xo5)为所述监测台区影响线损的属性特 征向量,Tj=(Xj1,Xj2,...,Xj5)为所述监测台区所在地区的其它台区影 响线损的属性特征向量,j=1,2,…,m,m为所述监测台区所在地区 的其它台区数量。
在计算所述欧几里得距离之前,需要对每一个所述影响线损的属 性特征值v进行规范化,所述规范化计算公式为:
其中,v表示为所述影响线损的属性特征向量T中的每一项特征 属性值,v′表示为所述特征属性值v进行规范化后的特征属性值,vmin表示同一所述影响线损的特征属性值的最小值,vmax表示同一所述影 响线损的特征属性值的最大值。
步骤2:对所述监测台区以及它的k个最近邻台区的线损率进行 实时监测,并基于所述k个最近邻台区的线损率判断所述监测台区的 线损率是否异常;
所述监测台区以及它的k个最近邻台区的所述线损率计算公式 如下:
当所述监测台区的所述线损率超出所述k个最近邻台区的所述 线损率均值的10%时,判定所述监测台区所述线损率异常。
步骤3:当所述监测台区某段时间的线损率正常时,返回至所述 步骤2;
步骤4:当所述监测台区某段时间的线损率异常时,计算所述监 测台区内所有用户该段时间负荷曲线之间的离散Fréchet距离;
所述离散Fréchet距离是一种曲线关键特征至高点相似性度量方 法,它的具体定义如下:
(1)给定一个有n个至高点的多边形链P=<p
1,p
2,...,p
n>,一 个沿着P的k步(k-walk),分割P的至高点成为k个不相交的非空子 集{P
i}
i=
1,...,
k,使得
和0=n
0<n
1<...<n
k=n。
(2)给定两个多边形链A=<a1,...,am>,B=<b1,...,bn>,一个沿着A 和B的组合步(paired work)是一个沿着A的k步{Ai}i=1,...,k和一个沿着B 的k步{Bi}i=1,...,k组成,使得对于1≤i≤k,要么|Ai|=1,要么|Bi|=1(即Ai, Bi中有一个恰好包含一个至高点)。
(3)一个沿着链A和B的组合步W={(A
i,B
i)}的花费(cost)就是
则链A和B间的离散Fréchet距离为
这个组合步称为链A和B之间的Fréchet排列。
但是,离散Fréchet距离只反映了两条曲线至高点(波峰点)之 间距离,判别两条负荷曲线之间的相似性还不够全面,还需要考虑它 们至低点(波谷点)之间的距离。
设A=<a
1,a
2,...,a
m>,B=<b
1,b
2,...,b
n>为两条由离散点组成的负 荷曲线,
为它们波峰点之间的离散Fréchet距离,
为 它们波谷点之间的离散Fréchet距离,则定义两条负荷曲线之间的离 散Fréchet距离为
具体的在所述步骤4中,包括以下步骤:
步骤41:从用电信息采集系统中提取所述监测台区所有用户该 段时间的用电数据,并将所述每一个用户用电数据转化为{(i,pi)}i=1,...,n, 其中pi表示所述用户的第i个时间间隔的用电量,每个时间间隔相同, n为该段时间包含的时间间隔数量。
步骤42:找出每一个用户负荷曲线的至高点集合和至低点集合; 如果一个时间间隔的用电量比前一个时间间隔的用电量大同时还比 后一个时间间隔的用电量大,就称它为一个至高点;如果一个时间间 隔的用电量比前一个时间间隔的用电量小同时还比后一个时间间隔 的用电量小,就称它为一个至低点;
步骤43:根据所述负荷曲线离散Fréchet距离的定义计算所述用 户负荷曲线之间的所述离散Fréchet距离。
步骤5:基于所述用户负荷曲线之间离散Fréchet距离计算所述 监测台区的所述用户负荷曲线的局部离群点因子。
所述局部离群点因子定义如下:
定义1:对象o的k-距离distk(o):在给定对象集D中,对象o与 另一个对象p∈D之间的距离dist(o,p),满足:
(1)至少存在k个对象o′∈D-{o},满足dist(o,o′)≤dist(o,p);
(2)至少存在k-1个对象o′∈D-{o},满足dist(o,o′)<dist(o,p)。
即distk(o)是o与其第k个最近邻之间的距离;
定义2:对象o的k-距离邻域Nk(o):在给定对象集D中,到对 象o的距离不超过distk(o)的所有对象集合: Nk(o)={o′|o′∈D,dist(o,o′)≤distk(o)},其中Nk(o)中的对象可能 超过k个;
定义3:从对象o到对象o′的可达距离reachdistk(o′←o): reachdistk(o′←o)=max{distk(o′),dist(o,o′)},且 reachdistk(o′←o)≠reachdistk(o←o′)。
定义4:对象o的局部可达密度lrdk(o):对象o与它的Nk(o)对象 的平均可达距离的倒数:
其中,|Nk(o)|为Nk(o)对象的数量;
定义5:对象o的局部离群点因子LOFk(o):
可得出,对象o局部离群点因子是它的k-距离邻域对象的局部可 达密度与它本身的局部可达密度之比的平均值。如图3所示,如果对 象o的离群程度较高,并且o的k-距离邻域对象离群程度较低,则对 象o的相对密度较低。对象o的离群程度越高,它的局部可达密度越 低;对象o的k-距离邻域对象离群度越低,他们的局部可达密度越高, 对象o的局部离群点因子越大。换言之,对象o的相对密度较低, LOFk(o)越高。局部离群点因子恰好捕获了对象o与其k-距离邻域对 象的相对密度,局部离群点的相对密度较低。
局部离群点因子具有很好的性质。首先,对于一个深藏在一致簇 内部对象,如图簇中心的那些点,局部离群点因子接近于1。这一性 质确保,无论簇是稠密的还是稀疏的,簇内的对象永远不会标记为离 群点。
具体的在所述步骤5中,采用所述用户负荷曲线之间的所述离散 Fréchet距离作为用户负荷曲线之间的距离(相似性)度量,根据所 述局部离群点因子的定义计算所述监测台区每个用户负荷曲线的局 部离群点因子。
步骤6:根据所述用户负荷曲线的局部离群点因子的大小对所述 监测台区所有用户作排序处理,进而判断所述用户窃电的概率;并返 回至所述步骤2。
根据所述用户负荷曲线的局部离群点因子的大小对所述监测台 区所有用户作降序处理,用户负荷曲线的局部离群点因子值大于1的 用户窃电概率较大,而且局部离群点因子值越大的用户窃电的概率越 大。
本发明一具体实施例
步骤S1:从电网公司生产管理系统、营销业务系统提取影响台 区线损的属性特征,包括供电半径、低压线路总长度、负载率、居民 用电比例、户均用电量。基于所述影响台区线损的属性特征,采用欧 几里得距离搜寻所述监测台区的k个最近邻台区,此处k=7。
步骤S2:基于k个最近邻台区的线损率,分析监测台区某段时 间线损率是否异常。按照线损率计算公式,某监测台区及其7个最近 邻台区2017年上半年线损率如图4所示。图4为本发明一具体实施 例中的监测台区及其最近邻台区线损率。
监测台区该段时间线损率超过其7个最近邻台区线损率均值的 60%,判定该监测台区该段时间线损率存在异常,可能存在窃电用户。
步骤S3:从用电信息采集系统提取该监测台区2017年上半年所 有用户用电数据,采样间隔为天,部分用户负荷曲线如图5所示。按 照用户负荷曲线离散Fréchet距离定义计算各用户负荷曲线之间的离 散Fréchet距离。部分用户负荷曲线之间离散Fréchet距离如表1所示。 可以看出,用户负荷曲线之间波动规律越相似,二者之间离散Fréchet 距离越小。图5为本发明一具体实施例中的监测台区部分用户负荷曲 线。
表1
步骤S4、基于用户负荷曲线之间离散Fréchet距离,按照局部离 群点因子计算公式,计算该台区该段时间段内用户负荷曲线的局部离 群点因子。按照从大到小顺序对用户负荷曲线的局部离群点因子排序, 局部离群点因子越大的用户窃电概率越大。部分用户负荷曲线局部离 群点因子排序如表2所示。
表2
该供电公司用电检查人员按照局部离群点因子排序重点对局部 离群点因子大于1的用户进行现场检查,发现用户3擅自在公共线路 上接线,绕过计量表用电;发现用户6私自打开铅封,改变计量表内 部结构,致使电量不计量或少计量;用户5没有发现窃电行为。只需 要检测排序靠前用户即可检测出大部分窃电用户,大大提高了反窃电 工作效率和准确性。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限 制,本领域普通技术人员对本发明的技术方案所做的其他修改或者等 同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发 明的权利要求范围当中。