一种结合人机物的反窃电稽查监控系统及其工作方法
技术领域
本发明涉及电力稽查监控领域,尤其涉及一种结合人机物的反窃电稽查监控系统及其工作方法。
背景技术
窃电用户手段具有智能性、隐蔽性、有规模性和职业性,现有电力工作人员现场发现窃电的难度大、耗时耗力、不及时、无强专业支撑等问题,且因为人力资源的不足,导致的电力企业经济损失。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种结合人机物的反窃电稽查监控系统,以达到及时发现窃电的目的。为此,本发明采取以下技术方案。
一种结合人机物的反窃电稽查监控系统,包括:
一)数据获取处理模块:用于获取用电数据,用电数据包括从用电信息采集系统获取计量数据,从营销业务应用系统获取档案类数据,从一体化线损平台获取的分线、分区线损数据,从95598系统获取的窃电举报数据;计量数据包括曲线数据、冻结数据和/或事件数据;档案类数据包括客户基础信息、信用违窃信息、业务变更信息和/或违窃历史信息;
二)反窃电算法模型库管理模块:用于多种反窃电算法模型的维护、发布,反窃电算法模型库中包括的算法有BP神经网络、XGBoost算法、逻辑回归算法和离群点算法;
三)反窃电预警模型定制模块:与反窃电算法模型库管理模块相连,用于根据不同单位、不同用户类型、不同用电特性选择对应的反窃电算法模型;反窃电预警模型定制模块对多种算法进行组合形成反窃电预警模型,反窃电预警模型为:
窃电嫌疑(P)=λ1fbp+λ2fxgb+λ3flogic+λ4fsubb
其中λi,i∈(1,2,3,4)为算法权重,fbp、fxgb、flogic、fsubb分别为Bp神经网络、XGBoost、逻辑回归算法以及离群点算法;算法权重根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数λi,进行更新,即与稽查结果符合的权重赋予较大值,反之更新权重变小以减小其对结果的贡献度;
四)疑似窃电判断模块:与反窃电预警模型定制模块、数据获取处理模块相连,根据定制的反窃电预警模型及获取的用电数据进行疑似窃电判断;
五)疑似窃电用户判别结果存储模块:与疑似窃电判断模块相连,存储疑似窃电判断模块的输出结果,包括用户基本信息、用电异常报告、佐证数据,用户基本信息包括户号、计量点号、表号;用电异常报告包括嫌疑系数,异常总体描述,用电特性描述;佐证数据用于支撑分析总结内容,包括针对不同模型的相关曲线;
六)工单生成模块:与疑似窃电用户判别结果存储模块相连,用于生成疑似窃电工单;
七)工单处理模块:与工单生成模块、数据采集模块相连,对生成的疑似窃电工单进行处理,同时,实时跟踪进度,包括工单详情和工单流水情况,若确认为存在窃电情况时,发起电费退补流程;
八)数据采集模块:包括现场检测仪和采集运维掌机,所述的现场检测仪用于对疑似窃电工单的处理以及对终端和电能表的现场检测分析,采集运维掌机用于采集疑似窃电用户现场检测数据;
九)工单归档存储模块:与工单处理模块相连,将工单处理模块的反馈结果归档存储;
十)数据反馈模块:与工单归档存储相连,将窃电情况反馈至营销业务应用系统、95598系统、营销辅助分析与决策系统和/或政府征信平台。
作为优选技术手段:还包括:
监控模块:与工单归档存储模块相连,用于监控嫌疑窃电、违约用户分布情况,疑似窃电工单处理情况,反窃电评价指标成效。
设备管理模块:与数据采集模块相连,用于对反窃电监控装置和现场检测仪进行装置安装管理、资产全寿命周期管理;
统计分析模块:与工单归档存储模块相连,用于对数据进行查询和统计,数据包括预警信息、工单处理情况、反窃电处理成效、线损关联分析、算法准确度、反馈征信平台情况数据;
案例知识库:与工单归档存储模块相连,用于对窃电案例形成专用的案例库和知识库,以供不同专业的人员查阅;
配置管理模块:用于负责开展日常维护管理工作,包括用户管理、角色管理、密码管理、权限管理、参数配置管理和日志监控。
作为优选技术手段:BP神经网络算法通过隐含层中非线性函数对反窃电指标的映射,使得其变得线性可分;基于BP神经网络反窃电的算法模型采用具有多输入单输出的三层BP神经网络作为用户窃电嫌疑系统计算模型,该模型定义的损失函数为:
其中,dj为窃电指标线性的组合,参数为w与b,yj为用户是否窃电的真实值,神经网络参数的学习是基于Delta学习准则,使得损失函数E(w,b)最小化;通过神经网络算法输出用户的疑似窃电的概率,即窃电嫌疑系数,其区间范围为[0,1],当窃电嫌疑系数越大时,该用户窃电的可能性就越大。
作为优选技术手段:XGBoost算法用于直观反映出特征的分裂阈值,基于XGBoost的反窃电的模型目标函数为:
其中:
其中,目标函数由损失函数和复杂度组成。损失函数为实际值与预测值的误差,Ω(f)函数为包含参数γ和λ的复杂度函数,复杂度由叶子数量T和L2正则‖w‖2组成。目标函数由损失函数和复杂度组成,复杂度有由叶子数量和L2正则组成,通过设置其复杂度和正则化参数防止过拟合,通过XGBoost模型能够挖掘窃电指标的内在关联关系,并且给出了用户疑似嫌疑的概率。
作为优选技术手段:XGBoost算法对窃电相关的特征指标进行分割,基于GINI指数分割电量下降趋势指标,当电量下降趋势指标≥0.5时,则判断告警类开箱指标,若告警类开箱指标>3,则认为为疑似窃电的概率,若告警类开箱指标<3,则认为正常的概率,输出用户类别的概率。
作为优选技术手段:逻辑回归模型是通过对窃电特征向量进行了非线性映射到[0,1]空间上,且以概率形式给出用户窃电嫌疑的概率,其中非线性Sigmoid函数形式如下所示:
其中Z是输入特征向量的线性组合,模型系数采用的梯度下降法训练得到,为了保证逻辑回归具有较好的鲁棒性,对模型加入含有L2惩罚项;根据通过对特征映射后的图像,得到疑似窃电的概率,概率越大表明了越具有窃电嫌疑。。
作为优选技术手段:离群点算法:通过对已发现窃电的专变用户计算其相应的电量波动率,利用优化的基于距离的离群点算法将窃电嫌疑数据从海量数据中筛选出来进行分析处理,采用电量波动系数:CV=σ/μ,其中σ代表样本的标准差,μ代表样本的均值,电量波动系数用于:
①为离群点算法发现更合适的质心,便于准确挖掘窃电嫌疑点;
②设置合适的波动系数阈值,样本波动系数小于阈值采用离群点算法,大于等于阈值时采用聚类分析,这样做的目的在于解决离群点算法对于波动程度大的样本不适用的问题;
作为优选技术手段:在对数据样本进行必要的预处理后,采用离群点算法挖掘异常嫌疑数据;在此过程中,采用电量波动和求两次均值的方法得到该样本的“标准值”,以“标准值”为条件筛选离群点,筛选出离群点以后,选择最长连续的一段报警时间设置连续7天异常,第7天开始报警的条件得到系数f,报警1天f=0.1;报警2天,f=0.2,……,报警不少于10天,f=1,窃电疑似度Sd=p×f,p为离群点算法参数;
所分析样本的周期为3个月,这是因为样本越长受跨季度导致误报的影响越大,样本周期太短则不能满足算法根据样本变化趋势信息来分析窃电可能的要求。
作为优选技术手段:通过集中多种算法的优势构建了反窃电预警模型,对于每个算法的可靠性判定基于测试集合的ROC曲线,当曲线下面的面积越大表明了分类效果越好。
本发明的另一个目的是提供一种结合人机物的反窃电稽查监控方法,包括以下步骤:
1)数据获取处理:获取用电数据,用电数据包括从用电信息采集系统获取计量数据,从营销业务应用系统获取档案类数据,从一体化线损平台获取的分线、分区线损数据,从95598系统获取的窃电举报数据;计量数据包括曲线数据、冻结数据和/或事件数据;档案类数据包括客户基础信息、信用违窃信息、业务变更信息和/或违窃历史信息;
2)反窃电算法模型库:对多种反窃电算法模型的维护、发布,反窃电算法模型库中包括的算法有BP神经网络、XGBoost算法、逻辑回归算法和离群点算法;
3)反窃电预警模型定制:根据不同单位、不同用户类型、不同用电特性从反窃电算法模型库中选择合适的反窃电算法模型;反窃电预警模型定制对多种算法进行组合形成反窃电预警模型,反窃电预警模型为:
窃电嫌疑(P)=λ1fbp+λ2fxgb+λ3flogic+λ4fsubb
其中λi,i∈(1,2,3,4)为算法权重,fbp、fxgb、flogic、fsubb分别为Bp神经网络、XGBoost、逻辑回归算法以及离群点算法;算法权重根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数λi,进行更新,即与稽查结果符合的权重赋予较大值,反之更新权重变小以减小其对结果的贡献度;
4)疑似窃电判断:根据定制的反窃电预警模型及获取的用电数据进行疑似窃电判断;
5)疑似窃电用户判别结果存储:存储疑似窃电判断模块的输出结果,包括用户基本信息、用电异常报告、佐证数据,用户基本信息包括户号、计量点号、表号;用电异常报告包括嫌疑系数,异常总体描述,用电特性描述;佐证数据用于支撑分析总结内容,包括针对不同模型的相关曲线;
6)工单生成:根据存储的疑似窃电用户判别结果,生成疑似窃电工单;
7)工单处理:对生成的疑似窃电工单进行处理,同时,实时跟踪进度,包括工单详情和工单流水情况,若确认为存在窃电情况时,发起电费退补流程;
8)数据采集:现场检测仪对疑似窃电工单的处理以及对终端和电能表的现场检测分析,采集运维掌机采集疑似窃电用户现场检测数据;
9)工单归档存储:与工单处理的反馈结果归档存储;
10)数据反馈:将窃电情况反馈至营销业务应用系统、95598系统、营销辅助分析与决策系统和/或政府征信平台。
有益效果:本发明融合了用采系统、现场检测仪、采集运维掌机三者,最大可能的提升反窃电工作的及时性,提升用电检查人员的业务水平,最终达到提升反窃电用户抓取准确性。用于应对窃电用户手段的智能性、隐蔽性、有规模性和职业性,解决现有电力工作人员现场发现窃电的难度大、耗时耗力、不及时、无强专业支撑等问题,避免了因为人力资源的不足导致的电力企业经济损失。
附图说明
图1是本发明的连接框图。
图2是本发明的原理框图。
图3是本发明的工作原理框图。
图4是本发明的BP神经网络反窃电预警模型示意图。
图5是本发明的XGBoost算法示意图。
图6是本发明的逻辑回归算法示意图。
图7是本发明的离群点算法流程图。
图8是本发明的ROC曲线图。
图9是本发明的流程图。
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
如图1、2、3所示,本发明包括:
一)数据获取处理模块:用于获取用电数据,用电数据包括从用电信息采集系统获取计量数据,从营销业务应用系统获取档案类数据,从一体化线损平台获取的分线、分区线损数据,从95598系统获取的窃电举报数据;计量数据包括曲线数据、冻结数据和/或事件数据;档案类数据包括客户基础信息、信用违窃信息、业务变更信息和/或违窃历史信息;
二)反窃电算法模型库管理模块:用于多种反窃电算法模型的维护、发布,反窃电算法模型库中包括的算法有BP神经网络、XGBoost算法、逻辑回归算法和离群点算法;
其中:
1)BP神经网络
如图4所示,BP神经网络算法通过隐含层中非线性函数对反窃电指标的映射,使得其变得线性可分;基于BP神经网络反窃电的算法模型采用具有多输入单输出的三层BP神经网络作为用户窃电嫌疑系统计算模型,该模型定义的损失函数为:
其中,dj为窃电指标线性的组合,参数为w与b,yj为用户是否窃电的真实值,神经网络参数的学习是基于Delta学习准则,使得损失函数E(w,b)最小化;通过神经网络算法输出用户的疑似窃电的概率,即窃电嫌疑系数,其区间范围为[0,1],当窃电嫌疑系数越大时,该用户窃电的可能性就越大。
2)XGBoost算法
XGBoost算法用于直观反映出特征的分裂阈值,基于XGBoost的反窃电的模型目标函数为:
其中:
其中,目标函数由损失函数和复杂度组成。损失函数为实际值与预测值的误差,Ω(f)函数为包含参数γ和λ的复杂度函数,复杂度由叶子数量T和L2正则‖w‖2组成。目标函数由损失函数和复杂度组成,复杂度有由叶子数量和L2正则组成,通过设置其复杂度和正则化参数防止过拟合,通过XGBoost模型能够挖掘窃电指标的内在关联关系,并且给出了用户疑似嫌疑的概率。
如图5所示,XGBoost算法对窃电相关的特征指标进行分割,基于GINI指数分割电量下降趋势指标,当电量下降趋势指标≥0.5时,则判断告警类开箱指标,若告警类开箱指标>3,则认为为疑似窃电的概率,若告警类开箱指标<3,则认为正常的概率,输出用户类别的概率。
3)逻辑回归算法
如图6所示,逻辑回归模型是通过对窃电特征向量进行了非线性映射到[0,1]空间上,且以概率形式给出用户窃电嫌疑的概率,其中非线性Sigmoid函数形式如下所示:
其中Z是输入特征向量的线性组合,模型系数采用的梯度下降法训练得到,为了保证逻辑回归具有较好的鲁棒性,对模型加入含有L2惩罚项;根据通过对特征映射后的图像,得到疑似窃电的概率,概率越大表明了越具有窃电嫌疑。。
4)离群点算法
离群点算法:通过对已发现窃电的专变用户计算其相应的电量波动率,利用优化的基于距离的离群点算法将窃电嫌疑数据从海量数据中筛选出来进行分析处理,采用电量波动系数:CV=σ/μ,其中σ代表样本的标准差,μ代表样本的均值,电量波动系数用于:
①为离群点算法发现更合适的质心,便于准确挖掘窃电嫌疑点;
②设置合适的波动系数阈值,样本波动系数小于阈值采用离群点算法,大于等于阈值时采用聚类分析,这样做的目的在于解决离群点算法对于波动程度大的样本不适用的问题;
如图7所示,在对数据样本进行必要的预处理后,采用离群点算法挖掘异常嫌疑数据;在此过程中,采用电量波动和求两次均值的方法得到该样本的“标准值”,以“标准值”为条件筛选离群点,筛选出离群点以后,选择最长连续的一段报警时间设置连续7天异常,第7天开始报警的条件得到系数f,报警1天f=0.1;报警2天,f=0.2,……,报警不少于10天,f=1,窃电疑似度Sd=p×f,p为离群点算法参数;
所分析样本的周期为3个月,这是因为样本越长受跨季度导致误报的影响越大,样本周期太短则不能满足算法根据样本变化趋势信息来分析窃电可能的要求。
三)反窃电预警模型定制模块:与反窃电算法模型库管理模块相连,用于根据不同单位、不同用户类型、不同用电特性选择对应的反窃电算法模型;反窃电预警模型定制模块对多种算法进行组合形成反窃电预警模型,反窃电预警模型为:
窃电嫌疑(P)=λ1fbp+λ2fxgb+λ3flogic+λ4fsubb
其中λi,i∈(1,2,3,4)为算法权重,fbp、fxgb、flogic、fsubb分别为Bp神经网络、XGBoost、逻辑回归算法以及离群点算法;算法权重根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数λi,进行更新,即与稽查结果符合的权重赋予较大值,反之更新权重变小以减小其对结果的贡献度;
通过集中多种算法的优势构建了反窃电预警模型,对于每个算法的可靠性判定是基于测试集合的ROC曲线,如图8所示,其中,曲线下面的面积越大表明了分类效果越好。
四)疑似窃电判断模块:与反窃电预警模型定制模块、数据获取处理模块相连,根据定制的反窃电预警模型及获取的用电数据进行疑似窃电判断;
五)疑似窃电用户判别结果存储模块:与疑似窃电判断模块相连,存储疑似窃电判断模块的输出结果,包括用户基本信息、用电异常报告、佐证数据,用户基本信息包括户号、计量点号、表号;用电异常报告包括嫌疑系数,异常总体描述,用电特性描述;佐证数据用于支撑分析总结内容,包括针对不同模型的相关曲线;
六)工单生成模块:与疑似窃电用户判别结果存储模块相连,用于生成疑似窃电工单;
七)工单处理模块:与工单生成模块、数据采集模块相连,对生成的疑似窃电工单进行处理,同时,实时跟踪进度,包括工单详情和工单流水情况,若确认为存在窃电情况时,发起电费退补流程;
八)数据采集模块:包括现场检测仪和采集运维掌机,所述的现场检测仪用于对疑似窃电工单的处理以及对终端和电能表的现场检测分析,采集运维掌机用于采集疑似窃电用户现场检测数据;
九)工单归档存储模块:与工单处理模块相连,将工单处理模块的反馈结果归档存储;
十)数据反馈模块:与工单归档存储相连,将窃电情况反馈至营销业务应用系统、95598系统、营销辅助分析与决策系统和/或政府征信平台。
为了方便管理,有效提高处理效率,本发明还包括:
监控模块:与工单归档存储模块相连,用于监控嫌疑窃电、违约用户分布情况,疑似窃电工单处理情况,反窃电评价指标成效。
设备管理模块:与数据采集模块相连,用于对反窃电监控装置和现场检测仪进行装置安装管理、资产全寿命周期管理;
统计分析模块:与工单归档存储模块相连,用于对数据进行查询和统计,数据包括预警信息、工单处理情况、反窃电处理成效、线损关联分析、算法准确度、反馈征信平台情况数据;
案例知识库:与工单归档存储模块相连,用于对窃电案例形成专用的案例库和知识库,以供不同专业的人员查阅;
配置管理模块:用于负责开展日常维护管理工作,包括用户管理、角色管理、密码管理、权限管理、参数配置管理和日志监控。
一种结合人机物的反窃电稽查监控方法,如图9所示,包括以下步骤:
1)数据获取处理:获取用电数据,用电数据包括从用电信息采集系统获取计量数据,从营销业务应用系统获取档案类数据,从一体化线损平台获取的分线、分区线损数据,从95598系统获取的窃电举报数据;计量数据包括曲线数据、冻结数据和/或事件数据;档案类数据包括客户基础信息、信用违窃信息、业务变更信息和/或违窃历史信息;
2)反窃电算法模型库管理:对多种反窃电算法模型的维护、发布,反窃电算法模型库中包括的算法有BP神经网络、XGBoost算法、逻辑回归算法和离群点算法;
3)反窃电预警模型定制:根据不同单位、不同用户类型、不同用电特性从反窃电算法模型库中选择合适的反窃电算法模型;反窃电预警模型定制对多种算法进行组合形成反窃电预警模型,反窃电预警模型为:
窃电嫌疑(P)=λ1fbp+λ2fxgb+λ3flogic+λ4fsubb
其中λi,i∈(1,2,3,4)为算法权重,fbp、fxgb、flogic、fsubb分别为Bp神经网络、XGBoost、逻辑回归算法以及离群点算法;算法权重根据不用行业的稽查结果反馈,采用AdaBoost算法中权重更新的方式对参数λi,进行更新,即与稽查结果符合的权重赋予较大值,反之更新权重变小以减小其对结果的贡献度;
4)疑似窃电判断:根据定制的反窃电预警模型及获取的用电数据进行疑似窃电判断;
5)疑似窃电用户判别结果存储:存储疑似窃电判断模块的输出结果,包括用户基本信息、用电异常报告、佐证数据,用户基本信息包括户号、计量点号、表号;用电异常报告包括嫌疑系数,异常总体描述,用电特性描述;佐证数据用于支撑分析总结内容,包括针对不同模型的相关曲线;
6)工单生成:根据存储的疑似窃电用户判别结果,生成疑似窃电工单;
7)工单处理:对生成的疑似窃电工单进行处理,同时,实时跟踪进度,包括工单详情和工单流水情况,若确认为存在窃电情况时,发起电费退补流程;
8)数据采集:现场检测仪对疑似窃电工单的处理以及对终端和电能表的现场检测分析,采集运维掌机采集疑似窃电用户现场检测数据;
9)工单归档存储:与工单处理的反馈结果归档存储;
10)数据反馈:将窃电情况反馈至营销业务应用系统、95598系统、营销辅助分析与决策系统和/或政府征信平台。
以上图1-9所示的一种结合人机物的反窃电稽查监控系统是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行等同修改,均在本方案的保护范围之列。