一种基于大数据的疑似窃电用户识别装置及识别方法
技术领域
本发明涉及电网安全技术领域,具体涉及一种基于大数据的疑似窃电用户识别装置及识别方法。
背景技术
人们对电力的需求随着时代与科技的进步而逐日增加,电力生产同样也随着市场对电力的需求而不断发展。与此同时,用户的窃电行为也成了不容忽视的问题,每年都会导致电力生产部门蒙受巨大的经济损失。更为重要的是,窃电用户往往会通过破坏电力设施来进行窃电,这种情况下,遭到破坏的电力设施除了直接造成电力生产部门的经济损失外,还很可能会由于电线外露等问题而导致触电事故以及电气火灾事故等的发生,从而造成人员伤亡事故和其他重大灾害事故等。
目前,为了识别窃电用户以便采取相关的措施,大多数电力生产部门采用的方法基本都是进行线路、用户用电数据的对比,然而,由于用户的用电数据海量且种类繁多,窃电手段也多样,前述比对方法不仅耗时耗力,且精准度也不高,尤其对于一些先进的窃电技术没有很好的识别手段,因而要识别疑似窃电用户是有很大难度的。
发明内容
基于上述现状,本发明的主要目的在于提供一种基于大数据的疑似窃电用户识别装置及识别方法,能够根据实际线路获得的用电信息数据自动评估用户的用电状态,从而方便地识别出疑似窃电用户。
为实现上述目的,本发明采用的技术方案如下:
一种基于大数据的疑似窃电用户识别装置,包括:
样本数据输入模块,用于输入采集到的用户用电信息参数;
变结构神经网络窃电识别系统,用于根据输入的用户用电信息参数,判断用户发生窃电行为的可能性;
其中,所述变结构神经网络窃电识别系统包括:样本数据检测模块、神经网络计算模块和用户分类模块;
所述样本数据检测模块用于检测输入的用户用电信息参数的个数和种类;
所述神经网络计算模块用于根据实际检测到的用电信息参数构建神经网络评估模型,并对用户的用电状态进行评估;
所述用户分类模块用于根据评估结果对用户进行分类,以识别出疑似窃电用户。
优选地,还包括核查单下发模块,用于接收所述变结构神经网络窃电识别系统的输出结果,并针对所述窃电疑似用户下发核查单。
优选地,所述样本数据输入模块以列表的方式输入用电信息参数,其中,所述列表的每一个列作为所述神经网络计算模块的一个输入向量。
优选地,所述神经网络计算模块包括输入层、隐含层和输出层,其中,所述输入层的节点数根据所述用电信息参数的个数自动确定,所述输出层的节点数为1。
优选地,所述神经网络计算模块中,隐含层节点的激活函数为Sigmoid型函数输出层节点的激活函数为线性函数RelU函数
优选地,所述神经网络计算模块的输出结果记为bp,所述用户分类模块用于对所述输出结果作如下处理:
其中,f(bp)表示窃电嫌疑系数:0表示该用户基本没有窃电可能;1表示该用户用电信息非正常,存在窃电嫌疑;2表示该用户的用电信息存在极大问题,具有很大的窃电嫌疑。
优选地,所述用户分类模块还用于根据窃电嫌疑系数f(bp)取值为1的概率P(1)和/或取值为2的概率P(2)对用户进行信用等级的分类。
优选地,还包括用电信息采集系统,用于采集用户的用电信息参数。
一种基于大数据的疑似窃电用户识别方法,采用前面所述的装置进行识别,包括步骤:
S100、获得用户的用电信息参数,并通过所述样本数据输入模块输入至所述变结构神经网络窃电识别系统;
S200、所述变结构神经网络窃电识别系统根据输入的用户用电信息参数,判断用户发生窃电行为的可能性。
优选地,所述步骤S100中,获得的用户用电信息参数包括以下参数中的至少一部分:用户电流参数、用户电压参数、功率因数、三相电流不平衡率、三相电压不平衡率、所在台区线损、用表类型和用户能效等级。
优选地,所述步骤S200包括步骤:
S210、所述样本数据检测模块检测输入的用户用电信息参数的个数和种类,并据此确定输入向量;
S220、所述神经网络计算模块根据已确定的输入向量构建用户用电状态BP神经网络评估模型,并通过所述BP神经网络评估模型的运算对用户的用电状态进行评估;
S230、所述用户分类模块根据评估结果对用户进行分类,识别出疑似窃电用户。
优选地,所述步骤S220包括子步骤:
S221、提取用户的历史数据中与输入向量对应的数据作为输入数据,并对输入数据进行归一化处理;
S222、隐含层设计:设计一个隐含层,其节点数m通过试凑获取,其中,n为输入层的节点数,l为输出层的节点数,常数α在1~10之间;
S223、激活函数选取:选取Sigmoid型函数作为隐含层节点的激活函数;选取线性函数RelU函数作为输出层节点的激活函数;
S224、提取用户的历史数据中表征是否存在窃电行为的数据作为输出数据;
S225、利用输入数据和输出数据对BP神经网络评估模型进行样本训练,获得适用于该用户的BP神经网络评估模型;
S226、将所述样本数据输入模块1输入的用电信息参数输入到经样本训练后的BP神经网络评估模型中,获得输出结果bp。
优选地,所述步骤S230中,所述用户分类模块对所述输出结果作如下处理:
其中,f(bp)表示窃电嫌疑系数:0表示该用户基本没有窃电可能;1表示该用户用电信息非正常,存在窃电嫌疑;2表示该用户的用电信息存在极大问题,具有很大的窃电嫌疑。
优选地,所述步骤S230中,所述用户分类模块还根据窃电嫌疑系数f(bp)取值为1的概率P(1)和/或取值为2的概率P(2)对用户进行信用等级的分类。
优选地,所述步骤S230中,所述用户分类模块根据P(1)和P(2)将用户信用等级分为A、B、C、D四个等级,分类方法为:
A:0≤P(1)+P(2)≤a1&P(2)≤b1
B:
C:
D:
其中,a1、a2、a3、b1、b2、b3为预设阈值;
其中,从A等级到D等级的信用级别依次下降。
优选地,a1=15%,a2=30%,a3=50%,b1=10%,b2=20%,b3=30%。
本发明的识别装置利用历史大数据来分析用户用电信息参数与窃电行为之间的关系,并且特别地能够根据不同用户的不同输入参数构建变结构神经网络评估模型进行判断,从而可有效地识别出疑似窃电用户,有利于保证电网安全和保障电力生产部门的合法利益。
附图说明
以下将参照附图对根据本发明的基于大数据的疑似窃电用户识别装置及识别方法的优选实施方式进行描述。图中:
图1为根据本发明的一种优选实施方式的疑似窃电用户识别装置的系统框图;
图2为本发明的疑似窃电用户识别装置中使用的用户用电状态指标的示例;
图3为本发明的疑似窃电用户识别装置中的神经网络计算模块的结构示意图。
具体实施方式
针对现有技术中对于疑似窃电用户的识别方式所存在的问题,本发明提出了一种基于大数据的疑似窃电用户识别装置及识别方法,能够根据实际线路可获得的数据自动构建变结构神经网络评估模型,从而有效提高用户窃电的识别率,并且实际操作性强。
如图1所示,本发明的基于大数据的疑似窃电用户识别装置包括:
样本数据输入模块1,用于输入采集到的用户用电信息参数,相应的用户用电信息参数优选包括用户用电参数、线路上的电参数以及相关环境参数等;
变结构神经网络窃电识别系统6,用于接收所述样本数据输入模块1的输入,并根据输入的用户用电信息参数判断用户发生窃电行为的可能性。
其中,所述变结构神经网络窃电识别系统6包括:样本数据检测模块2、神经网络计算模块3和用户分类模块4。
所述样本数据检测模块2用于对输入的用户用电信息参数进行检测,以确定输入的用户用电信息参数的个数和种类。
所述神经网络计算模块3用于根据实际检测到的用电信息参数构建BP神经网络评估模型,并通过运算对用户的用电状态进行评估。具体地,在构建BP神经网络评估模型的过程中,所述神经网络计算模块3将实际检测到的用户用电信息参数作为输入层的输入向量,并调取后台存储的该用户的历史数据(例如过去一年或两年的历史数据)对BP神经网络评估模型进行样本训练,获得适用于该用户的BP神经网络评估模型,其中,用户的历史数据包括该用户的作为输入向量的各个用电信息参数的历史记录,并且还包括与该历史记录对应的时段内该用户是否存在窃电行为的相关记录。在随后的运算过程中,所述神经网络计算模块3将所述样本数据输入模块1输入的数据输入到所述BP神经网络评估模型中,即可完成对该用户的用电状态的评估。
由于针对不同的用户采集到的用电信息参数的个数可能不同,导致输入层的节点数不同,因此针对不同的用户构建的BP神经网络评估模型的结构也将是不同的,属于输入层可变的变结构神经网络模型。
所述用户分类模块4用于根据评估结果对用户进行分类,以识别出疑似窃电用户,并且优选可对用户的窃电嫌疑程度进行分级或分类。
本发明的识别装置利用历史大数据来分析用户用电信息参数与窃电行为之间的关系,并且特别地能够根据不同用户的不同输入参数构建变结构神经网络评估模型进行判断,从而可有效地识别出疑似窃电用户,有利于保证电网安全和保障电力生产部门的合法利益。
优选地,如图1所示,本发明的基于大数据的疑似窃电用户识别装置还包括核查单下发模块5,用于接收所述变结构神经网络窃电识别系统6的输出结果,并针对识别出的窃电疑似用户下发核查单,以便进行现场取证等。
优选地,本发明的基于大数据的疑似窃电用户识别装置还包括用电信息采集系统(未示出),用于采集用户的用电信息参数,以作为用户用电状态评价指标,供样本数据输入模块1进行输入。
优选地,如图2所示,本发明合理选择的用户用电信息参数包括以下参数中的至少一部分(优选全部):用户电流参数、用户电压参数、功率因数、三相电流不平衡率、三相电压不平衡率、所在台区线损、用表类型和用户能效等级。本发明已通过大量试验进行验证,试验结果表明,采用上述8个指标的协同评价,能够保证对于疑似窃电用户的识别精度。
优选地,所述样本数据输入模块1以列表的方式输入用电信息参数,其中,所述列表的每一个列作为所述神经网络计算模块3的一个输入向量。具体实施时,可以以excel数据表的方式输入用电信息参数,例如,以所需的用电信息参数作为列名形成excel数据表,样本数据输入模块1将该excel数据表作为输入,样本数据检测模块2通过检测excel数据表的这些列,有多少列就确定BP神经网络有多少个输入向量,并据此构建出相应的BP神经网络评估模型。因此,对应于不同的用户,如果用电信息参数不同,就会形成不同结构的BP神经网络评估模型。
优选地,所述神经网络计算模块3包括输入层、隐含层和输出层,其中,所述输入层的节点数根据所述用电信息参数的个数自动确定,所述输出层的节点数为1。由于输入向量的个数不多,故本发明中仅设计一个隐含层,其节点数m可通过试凑获取,其中,n为输入层的节点数,l为输出层的节点数,常数α在1~10之间。作为一个优选示例,当输入层节点数n为8时,例如当输入向量恰好为图2中所示出的8个参数时,优选可确定m为8,即,相应的BP神经网络的结构为8-8-1,如图3所示。
优选地,所述神经网络计算模块3中,隐含层节点的激活函数为Sigmoid型函数输出层节点的激活函数为线性函数RelU函数所述神经网络计算模块3的输出结果的数值越大,对应的用户的窃电嫌疑程度越高。
优选地,所述神经网络计算模块3的输出结果记为bp,所述用户分类模块4用于对所述输出结果作如下处理:
其中,f(bp)表示窃电嫌疑系数:0表示该用户基本没有窃电可能,即窃电嫌疑程度几乎为零;1表示该用户用电信息非正常,存在窃电嫌疑,应被列入观察范围之内;2表示该用户的用电信息存在极大问题,具有很大的窃电嫌疑,是重点观察对象。
也即,用户分类模块4可以将神经网络计算模块3的输出结果bp按照实际取值的大小取整为0、1和2三个固定值,当然也可以是两个、四个或者其他更多个固定值,固定值越大,相应的窃电嫌疑程度也越高。
考虑到不同窃电用户的窃电手段具有多样性和复杂性,一次评价输出往往难以准确地将其定义为疑似窃电用户,因此,为了提高疑似窃电用户识别的精度,优选地,本发明针对上述BP神经网络评估模型的输出,利用概率将用户进行进一步分类。具体地,在所述神经网络计算模块3运算多次的基础上,所述用户分类模块4还可以根据窃电嫌疑系数f(bp)取值为1的概率P(1)和/或取值为2的概率P(2)对用户进行信用等级的分类,从而更为精确、具体地识别出疑似窃电用户。
具体实施时,可以持续地将用户用电信息参数输入所述变结构神经网络窃电识别系统6中,并使神经网络计算模块3运行一段时间后,用户分类模块4再根据其输出进行用户信用等级分类。
优选地,所述用户分类模块4可以根据神经网络计算模块3运行的时间长短(例如20个工作日或者更长、更短的时间),设定相应的阈值,根据P(1)和P(2)的具体取值情况将用户信用等级分为A、B、C、D四个等级,四个等级划分如下:
A:0≤P(1)+P(2)≤a1&P(2)≤b1
B:
C:
D:
其中,a1、a2、a3、b1、b2、b3为预设阈值;优选地,a1=15%,a2=30%,a3=50%,b1=10%,b2=20%,b3=30%。
其中,从A等级到D等级的信用级别依次下降,例如,A等级为高信用用户;B等级为信用较高用户;C等级用户有窃电嫌疑,需要排查;D等级用户有严重窃电嫌疑,必须进行彻底排查。
以下说明本发明的基于大数据的疑似窃电用户识别方法,该方法采用本发明前面所述的装置进行识别,包括步骤:
S100、获得用户的用电信息参数,并通过所述样本数据输入模块1输入至所述变结构神经网络窃电识别系统6;
S200、所述变结构神经网络窃电识别系统6根据输入的用户用电信息参数,判断用户发生窃电行为的可能性。
优选地,所述步骤S100中,获得的用户用电信息参数包括以下参数中的至少一部分(优选全部):用户电流参数、用户电压参数、功率因数、三相电流不平衡率、三相电压不平衡率、所在台区线损、用表类型和用户能效等级,如图2所示。
优选地,所述步骤S200包括步骤:
S210、所述样本数据检测模块2检测输入的用户用电信息参数的个数和种类,并据此确定输入向量;
S220、所述神经网络计算模块3根据已确定的输入向量构建用户用电状态BP神经网络评估模型,并通过所述BP神经网络评估模型的运算对用户的用电状态进行评估;
S230、所述用户分类模块4根据评估结果对用户进行分类,识别出疑似窃电用户。
优选地,所述步骤S100中,所述样本数据输入模块1以数据列表(如excel数据表)的方式输入用电信息参数,每个用电信息参数占用数据列表的一个列;所述步骤S210中,所述样本数据检测模块2检测所述数据列表的列数和列名,即可检测出输入的用户用电信息参数的个数和种类,由此也就方便地确定输入向量的个数的类型。此过程可由软件自动实现,具体如下:以所需用电参数作为列名形成excel数据表,将该excel数据表作为软件的输入,软件通过检测excel数据表的这些列,有多少列就确定BP神经网络有多少输入。
优选地,所述步骤S220中,构建用户用电状态BP神经网络评估模型的过程包括子步骤:
S221、提取用户的历史数据中与输入向量对应的数据作为输入数据,并对输入数据进行归一化处理,如将数据统一限制在[0,1]或[-1,1]区间内;其中,用户的历史数据中,例如以工作日或者半个工作日或者小时为单位时间,记录了过去一段时间(如两年以上)内多个(最优为每个)单位时间内的用户用电信息参数,并且同时记录有每个对应的单位时间内用户是否存在窃电行为的表征数据,例如,以0来表征该用户没有窃电、以1来表征该用户存在未经确认的窃电可能、以2来表征该用户存在经过确认的窃电行为。
S222、隐含层设计:设计一个隐含层,其节点数m通过试凑获取,其中,n为输入层的节点数,l为输出层的节点数,常数α在1~10之间;
S223、激活函数选取:选取Sigmoid型函数作为隐含层节点的激活函数;选取线性函数RelU函数作为输出层节点的激活函数;
S224、提取用户的历史数据中表征是否存在窃电行为的数据作为输出数据;
S225、利用输入数据和输出数据对BP神经网络评估模型进行样本训练,获得适用于该用户的BP神经网络评估模型。需要说明的是,BP神经网络要能够提取出包含规律性质的训练样本,并且这个样本必须具有一定的代表性,能够使得每个类别的样本数量基本一致,从而均衡样本的类别,当然在同一类别的样本中,要考虑到样本的多样性与均衡性。在确定训练样本数时可参考一个经验规则,即网络连接权总数的5~10倍。这样做才能避免训练学习时不断反复,致使BP网络的训练学习出现动荡。
优选地,所述步骤S220中,通过运算对用户的用电状态进行评估的过程包括子步骤:
S226、将所述样本数据输入模块1输入的用电信息参数输入到经样本训练后的BP神经网络评估模型中,获得输出结果bp。该输出结果bp即为输出层节点函数的结果。
其中,输出结果bp的取值大小能够反映用户当前是否有窃电的嫌疑,取值越大,嫌疑越大,取值越小,嫌疑也越小。
优选地,所述步骤S230中,所述用户分类模块4对所述输出结果作如下处理:
其中,f(bp)表示窃电嫌疑系数:0表示该用户基本没有窃电可能;1表示该用户用电信息非正常,存在窃电嫌疑;2表示该用户的用电信息存在极大问题,具有很大的窃电嫌疑。
考虑到不同窃电用户的窃电手段具有多样性和复杂性,一次评价输出往往难以准确地将其定义为窃电用户,因此,为了提高疑似窃电用户识别的精度,本发明在多次运行或者持续运行一段时间的基础上,针对上述BP神经网络的输出,利用概率将用户进行进一步分类。为此,优选地,所述步骤S230中,所述用户分类模块4还根据窃电嫌疑系数f(bp)取值为1的概率P(1)和/或取值为2的概率P(2)对用户进行信用等级的分类。
优选地,所述步骤S230中,所述用户分类模块4根据P(1)和P(2)将用户信用等级分为A、B、C、D四个等级,分类方法为:
A:0≤P(1)+P(2)≤a1&P(2)≤b1
B:
C:
D:
其中,a1、a2、a3、b1、b2、b3为预设阈值;优选地,a1=15%,a2=30%,a3=50%,b1=10%,b2=20%,b3=30%。
其中,从A等级到D等级的信用级别依次下降。
综上,一方面,本发明的基于大数据的疑似窃电用户识别装置及识别方法在具体工作时,结合实际能采集到的用户用电信息参数,可自动调节其输入层及中间层,自适应调节其神经网络的结构,从而方便、灵活地进行疑似窃电用户的智能识别。
例如,将本发明的识别装置及识别方法用于某一线路上某一用户的窃电检测时,图2中所示的8个参数都能获得,则相应的BP神经网络的结构为8-8-1;将该识别装置及识别方法用于检测同一线路上的其他用户或是其他线路上的用户时,可获得的参数和图2中所示的8个参数不同,可能偏多也可能偏少,即输入数不同,则BP神经网络的结构也就不一样,此时根据实际检测到的参数确定的BP神经网络的输入数n,并根据步骤S222确定中间隐含层的节点数目m,此时BP神经网络结构即为n-m-1。此过程可由软件自动实现,具体如下:以所需用电参数作为列名形成excel数据表,将该excel数据表作为软件的输入,软件通过检测excel数据表的这些列,有多少列就确定BP神经网络有多少输入。于是,本发明的识别装置及识别方法用于不同的用户时,根据实际的输入,可自动构建不同结构的BP神经网络评估模型,从而可精确而灵活地对各种用户进行信用等级的评价,识别出疑似窃电用户。
另一方面,本发明的基于大数据的疑似窃电用户识别装置及识别方法在具体工作时,用于评判用户信用等级的各阈值a1、a2、a3、b1、b2、b3可以根据运行时间的长短进行重置,从而可更好地识别疑似窃电用户。
以下再结合本发明的优选实施例说明本发明的基于大数据的疑似窃电用户识别方法的一种优选实现过程,包括以下步骤:
步骤一:合理选择用户用电信息参数,可通过用电信息采集系统采集用户电流参数、用户电压参数、功率因数、三相电流不平衡率、三相电压不平衡率、所在台区线损、用表类型、用户能效等级等,作为用户用电状态评价指标,即用作输入向量。
步骤二:通过变结构神经网络窃电识别系统6判断用户发生窃电行为的可能性,进一步包括子步骤:
(1)输入向量的确定:通过样本数据输入模块1将用户用电信息参数输入所述变结构神经网络窃电识别系统6中,并由所述样本数据检测模块2确定输入的用户用电信息参数的个数和种类,从而确定BP神经网络的输入向量。本例中,输入向量包括图2中所示的8个参数,因此BP神经网络的输入层节点数为8。
(2)输入数据的归一化处理:提取用户的历史数据(例如此前两年的历史数据)中与输入向量对应的数据作为输入数据,并对所有输入数据归一化处理,例如统一限制在[0,1]或[-1,1]区间内。若统一将数据归一化在[0,1]区间内,可采用形式进行变换,xi为输入或输出数据;xmin、xmax为数据变化范围最小值、最大值。
(3)隐含层的设计:本例的输入向量相对不多,故仅设计一个隐含层,其节点数m可通过试凑获取,其中n为输入层的节点数,l为输出层的节点数,常数α在1~10之间,本例中m选取为8。
(4)激活函数选取:选取Sigmoid型函数作为隐含层节点的激活函数;选取线性函数RelU函数作为输出层节点的激活函数。
(5)提取用户的历史数据中表征是否存在窃电行为的数据作为输出数据。
(6)样本训练:利用输入数据和输出数据对BP神经网络评估模型进行样本训练,获得适用于该用户的BP神经网络评估模型。
(7)输出结果处理:对于经样本训练后的BP神经网络评估模型的输出结果bp,通过用户分类模块4对所述输出结果作如下处理:
其中,f(bp)表示窃电嫌疑系数:0表示该用户基本没有窃电可能,即窃电嫌疑程度几乎为零;1表示该用户用电信息非正常,存在窃电嫌疑,应被列入观察范围之内;2表示该用户的用电信息存在极大问题,具有很大的窃电嫌疑,是重点观察对象。
步骤三:疑似窃电用户的精确识别。为了提高疑似窃电用户识别的精度,本发明在多次运行或者持续运行一段时间的基础上,针对上述BP神经网络评估模型的输出,利用概率将用户进行进一步分类。具体包括以下子步骤:
(1)将步骤一中采集到的用户用电信息参数输入步骤二中训练好的BP神经网络,运行一段时间后根据其输出进行用户分类;
(2)根据模型运行的时间,设定各阈值,将用户划分为A、B、C、D四个等级,本例中,BP神经网络运行20个工作日,四个等级划分如下:
A:0≤P(1)+P(2)≤a1&P(2)≤b1
B:
C:
D:
其中,a1、a2、a3、b1、b2、b3为预设阈值,本例中,a1=15%,a2=30%,a3=50%,b1=10%,b2=20%,b3=30%。
由此便可获得相应用户的信用等级,从而更为精确地识别出疑似窃电用户。
本发明的识别装置及识别方法可节省大量的人力和时间,具有高智能化、高准确度的特点,能够有效识别进而有助于打击窃电行为。
本领域的技术人员容易理解的是,在不冲突的前提下,上述各优选方案可以自由地组合、叠加。
应当理解,上述的实施方式仅是示例性的,而非限制性的,在不偏离本发明的基本原理的情况下,本领域的技术人员可以针对上述细节做出的各种明显的或等同的修改或替换,都将包含于本发明的权利要求范围内。