CN111275576A - 一种电价执行异常用户的识别方法及识别系统 - Google Patents
一种电价执行异常用户的识别方法及识别系统 Download PDFInfo
- Publication number
- CN111275576A CN111275576A CN202010057653.9A CN202010057653A CN111275576A CN 111275576 A CN111275576 A CN 111275576A CN 202010057653 A CN202010057653 A CN 202010057653A CN 111275576 A CN111275576 A CN 111275576A
- Authority
- CN
- China
- Prior art keywords
- electricity
- user
- users
- module
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 234
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004458 analytical method Methods 0.000 claims abstract description 56
- 239000013598 vector Substances 0.000 claims abstract description 51
- 238000011835 investigation Methods 0.000 claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 4
- 230000010354 integration Effects 0.000 claims description 49
- 238000010276 construction Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012552 review Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 230000006399 behavior Effects 0.000 abstract description 22
- 230000000875 corresponding effect Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电价执行异常用户的识别方法,S10、进行用户用电群体划分;S20、构建用电行为特征向量;S30、利用用电行为特征向量进行电价合规性分析;S40、筛选出电价执行异常的用户,输出结果。本发明可以从海量的城镇居民用户中,通过分析其用电行为,有效的识别用电行为明显异于普通城镇居民户、但却错误的执行了城镇居民生活用电电价的个体,大幅度的减少人工排查的工作量。基于上述方法,本发明还公开了一种电价执行异常的识别系统。
Description
技术领域
本发明涉及大数据处理领域,尤其涉及一种电价执行异常用户的识别方法及识别系统。
背景技术
由于供电企业一般根据用户的性质实行分类电价,比如在中国,工商企业用电与城乡居民用电就属于两个不同的用电分类,按不同的价格分别计量收费。
正因为存在电价水平差异,而一般工商业群体与城镇居民又处于同一电网、同一电压等级下,有些工商业用户就会通过各种办法从电力档案、计量点用途等方面做手脚,以达到按照城镇居民生活用电的电价从事生产经营活动从而少缴电费的目的。
以往供电企业在查处这类问题时存在诸多困难:首先是没有明确的、有效的手段去区别一般工商业户和居民用户,因为两者处于公变同一电压等级下;其次是这类用户数量非常庞大,占全部电力用户的90%以上,动辄上百万户对于人工排查是一个庞大的工作量。因此供电企业要么放弃违规使用低电价行为的排查,要么就规定一个用电量阈值来刚性区分一般工商业户和居民户,例如规定执行居民电价的用户如果月电量超过一万度的就需要排查。
但这种刚性阈值的方法存在诸多弊端,例如:有一些小商店、小餐馆,其用电量未必能达到一万度但确实不应该执行居民生活用电。如果将排查的阈值降低,例如规定2000度,则会有大量确实是居民生活用电的用户也被列入排查之列,需要耗费大量的人力。
因此迫切需要有一种行之有效的技术手段,能够有效的区分一般工商业和城镇居民生活用电规律的不同,从而开展电价合规性检查,有效的识别错误执行低水平电价的用户,为供电企业挽回电费损失。
发明内容
本发明所要解决的技术问题是:提供一种电价执行异常用户的识别方法。
为解决上述技术问题,本发明所采用的技术方案是:
一种电价执行异常用户的识别方法,包括以下步骤:
S10、进行用户用电群体划分;
S20、构建用电行为特征向量;
S30、利用步骤S20中构建的用电行为特征向量进行电价合规性分析,所述合规性分析是利用离群分析法实现;
S40、筛选出电价执行异常用户,输出结果。将前述步骤发现的疑似电价执行异常用户及他们的档案特征、用电特征、离群分析结果进行整合数据并输出。
与现有技术相比,本发明具有如下技术效果:
不同行业的用户拥有不同的用电行为特征,如居民的主要用电设备(空调、冰箱、热水器等)均与温度强相关,而工业用户则更多受其工业活动影响,有较大差异。本发明通过对群体的整体用电行为特征及用户个人的用电行为特征进行衡量分析,以发现用电行为特征离群的用户。利用上述方法可以从海量用户中,通过分析其用电行为有效的识别用电行为特征明显异于普通城镇居民用户、错误的执行了城镇居民生活用电电价的个体,大幅度的减少人工排查的工作量。
在上述方案基础上,本方案还可以做如下改进:
进一步地,所述步骤S10进行用户用电群体划分,具体是指根据所有电价代码属性所对应的电价水平、用电性质等用电档案特征对特征相似的电价代码进行归类合并,并标记用电档案特征分类标签;
根据用户所属电价代码所对应的所述用电档案特征分类标签对用户进行群体划分,将拥有相同标签的用户划归为同一用电特征群体。
采用上述进一步方案的有益效果是能将多个类似的电价代码合并为一个,提高每个群体样本数量并减少群体个数,提高分析准确率,减小后续步骤的计算量。
所述用电波动程度v利用以下方差公式进行计算:
所述构建个体用户与同类群体用户用电波动趋势差δ,首先计算群体的整体用电趋势:随机抽选一定比例的用户,取其每个特征月用电量的中位数分别作为对应月的群体普遍用电量mi,n个特征月组合起来形成整体用电趋势向量m'={m1,m2,...,mn};
然后计算个体用户的用电趋势,取个体用户每个特征月用电量xi,n个特征月组合起来形成个体用户的用电趋势向量x'={x1,x2,...,xn};
对整体用电趋势向量m'={m1,m2,...,mn}及个体用户的用电趋势向量x'={x1,x2,...,xn}采用以下公式进行标准化,
上式中,y"i为标准化后的yi,向量Y为个体用户的用电趋势向量x'={x1,x2,...,xn}或整体用电趋势向量m'={m1,m2,...,mn},yi为对应的xi或mi;
标准化后的个体用户的用电趋势向量x"和整体用电趋势向量m"按以下公式计算整体波动趋势差
其中m"i为标准化后的整体用电趋势的第i维,x"i为标准化后的个体用户用电趋势的第i维。
采用上述进一步方案的有益效果是通过多个用电行为特征综合分析用户的用电行为,分析结果更佳准确。
首先,不同用电性质的用户用电量水平不同,对群体内用电量进行离群分析可以有效发现用电水平与同等电价水平的正常用户不符的疑似异常用户,如工商业用电量远大于普通居民。
其次,不同性质的用户在不同月份的用电波动幅度存在差异。如工业用户通常采取人休息机器不休息的“三班倒”式工作方式,其用电波动较小。而居民用电设备较少,夏天开个空调会导致用电飙升。分析用户用电波动可以为离群分析给与有力的支持。
最后,个体用户与同类群体用户用电波动趋势差不考虑用户用电量的波动大小以及用电量大小,仅从波动趋势上分析用户与群体差异而避开波动大小及用电量量的影响,避免了因用电量存在差距而低估该用户与其所处群体间用电波动的相似度,因为该特征仅判断趋势是否相同,具体用电量和波动方面的偏差度由其余特征进行评价。
进一步地,在步骤S10之前还包括数据集成的步骤、用户信息整合步骤;
所述数据集成步骤用于将不同来源、不同格式的数据进行读取、格式转换、异常数据修正、缺失数据填充、重复数据过滤等操作,并统一保存为系统需要的表数据;包括档案数据集成步骤和用电数据集成步骤,所述档案数据集成步骤用于从库表中收集用户信息及电价明细相关的档案;所述用电数据集成步骤用于接收来自各种计量设备传递的用电信息,并进行统一、整合、异常排查;
所述用户信息整合步骤用于将数据集成模块收集的信息进行关联,包括关联用户档案与电价明细、关联用户档案与两期用电数据、计算实际用电量;
采用上述进一步方案的有益效果是可以将现有状态下不同格式的数据进行统一,而无需制定统一格式重新收集数据。
进一步地,所述用电合规性分析采用合规性分析模型进行分析,所述合规性分析模型通过用电合规模型训练步骤进行训练;所述用电合规模型训练步骤通过有放回随机抽样的方式构建多个互不相同的小样本数据集,分别训练出多个用电合规模型;所述用电合规模型对前述数据进行分析、并生成分析结果。
采用上述进一步方案的有益效果是利用人工智能及机器人学习技术,可以训练出高效的用电合规模型,从而大幅度提高对用电合规与否的判断准确度和,大幅度降低人工劳动强度。
进一步地,所述异常系数s是通过建模分析用户所在群体特征空间的用户分布得出每个用户在该特征空间中相对于用户群体的离群程度作为该用户的异常系数s,异常系数s越高则该用户为异常用户的可能性越高。将异常系数s最高的一定比例用户定义为疑似异常用户。
进一步地,在步骤S40中还包括人工复核步骤;
所述人工复核步骤由人工对疑似异常用户的档案、用电性质、计量设备等进行核查。
采用上述进一步方案的有益效果是诊断结果更佳准确。
本发明还提供了一种用电异常用户识别系统,包括依次数据连接的电价分类模块、特征向量构建模块、电价合规性分析模块、结果输出模块;
所述电价分类模块用于根据用户所属电价代码对用户进行群体划分;
所述特征向量构建模块用于计算用户的特征值并构建用于分析的特征向量;
所述电价合规性分析模块对每个用户在其所在群体中的离群情况做分析,得到代表个体用户离群程度的异常系数s;将异常系数s最高的一定比例的用户,定义为疑似异常用户;
所述结果输出模块由用电合规性分析模型发现的疑似异常用户及他们的档案特征、用电特征、模型分析结果进行整合数据并输出。
相对于现有技术而言,本发明具有如下技术效果:
可以从海量的城镇居民用户中,通过分析其用电行为有效的识别用电行为明显异于普通城镇居民户、但却错误的执行了城镇居民生活用电电价的个体,大幅度的减少人工排查的工作量。
进一步地,所述电价分类模块用于根据所有电价代码属性所对应的电价水平、用电性质等用电档案特征对特征相似的电价代码进行归类合并,并标记用电档案特征分类标签;根据用户所属电价代码所对应的所述用电档案特征分类标签对用户进行群体划分,将拥有相同标签的用户归为同一用电特征群体;
所述特征向量构建模块包含平均电量特征构建模块、用电波动幅度特征构建模块、整体波动趋势差特征构建模块,分别计算每个个体用户的这三种用电特征,并构建成用户的特征向量;
在所述电价分类模块之前,还包括依次数据连接的数据集成模块、用户信息整合模块。
所述数据集成模块用于将不同来源、不同格式的数据进行读取、格式转换、异常数据修正、缺失数据填充、重复数据过滤等操作,并统一保存为系统需要的表数据;
所述用户信息整合模块用于将数据集成模块收集的信息进行关联,包括关联用户档案与电价明细、关联用户档案与两期用电数据、计算实际用电量;
经数据集成模块和用户信息整合模块整合后的数据再送入电价分类模块进行处理。
采用上述进一步方案的有益效果是,可以保持各地区现有的数据采集方式不变,通过上述模块对各种不同数据进行整合处理,减小新系统上线对工作习惯的影响。
进一步地,所述电价合规性分析模块包括用有放回随机抽样的方式构建多个小样本数据集,分别训练多个用电合规模型的用电合规模训练模块,以及调用模型进行分析、生成分析结果的合规性分析模块;
还包括人工复核模块,所述人工复核模块在所述结果输出模块之前,由人工对疑似异常用户的档案、用电性质、计量设备等进行核查。
采用上述进一步方案的有益效果是,通过人工复核,进一步提高准确率,并获得新的训练数据以便对分析模型进行训练,不断提高整个系统的准确率。
附图说明
图1为本发明的电价执行异常用户的识别方法的流程图;
图2为本发明的电价执行异常用户的识别系统的功能框图;
图3为某省区2018年7月到2019年5月执行一般居民电价用户的整体用电趋势图;
图4为利用本发明的识别方法从图3对应用户中筛选出来的电价执行异常用户示例。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本发明提供了一种电价执行异常用户的识别方法,如图1所示,包括以下步骤:
S01数据集成;
为了来自不同表的同一用户数据进行整体性分析,需要将来自不同表的数据进行关联,具体是指将不同来源、不同格式的数据进行读取、格式转换、异常数据修正、缺失数据填充、重复数据过滤等操作,并统一保存为系统需要的表数据;进一步分解则包括档案数据集成步骤S011和用电数据集成步骤S012,所述档案数据集成步骤用于从库表中收集用户信息及电价明细相关的档案;所述用电数据集成步骤用于接收来自各种计量设备传递的用电信息,并进行统一、整合、异常排查;
S02用电信息整合;
将数据集成步骤收集的信息进行关联,包括关联用户基础档案各用电档案信息、关联用户档案与电价明细、关联用户档案与近两期用电数据、计算用户实际用电量;
S10进行用户用电群体划分
为了发现用电用户中可能存在的电价不合规用户,减少电价代码过多过于零散、单种电价代码包含用户数量较少带来的计算压力过大、偶然性高效果较差问题,需要将用电性质相似、且电价相似的用户归为一类共同分析,进而通过挖掘离散点的方式找到不合规用户。故而要对执行电价进行分类操作,将用电性质与实际电价水平相似的电价代码归为一类,如城镇居民一户一表、农村一户一表均属居民用电且电价基本相同会被归为一类,合并后分别进行后续分析。
S20构建用电行为特征向量
为了后续分析建模,需要将用户的用电特征构建为特征向量,本发明使用以下能代表自身用电特征及与所处用电群体差异度的特征进行离群分析:
(1)群体用户的平均用电量不同用电性质的用户用电量水平不同,对群体内用电量进行离群分析可以有效发现用电水平与同等电价水平的正常用户不符的疑似异常用户,如工商业用电量远大于普通居民。为了排除个别极端数据对均值的影响,这里根据业务需求从排除一定比例最大值及最小值后采取取均值、取中位数或直接取每月用电量等方法中选择合适的方案构建群体用户平均用电量特征。
(2)用电波动程度v。不同性质的用户在不同月份的用电波动幅度存在差异。如工业用户通常采取人休息机器不休息的“三班倒”式工作方式,其用电波动较小。而居民用电设备较少,夏天开个空调会导致用电飙升。分析用户用电波动可以为离群分析给与有力的支持。
用电波动程度的计算公式为方差公式:
(3)个人与所处群体整体波动趋势差δ。不同行业的用户拥有不同的用电波动趋势,如居民的主要用电设备(空调、冰箱、热水器等)均与温度强相关,而工业用户则更多受其工业活动影响,有较大差异。本发明通过对群体的整体用电趋势及用户个人的用电趋势间的差值进行衡量分析,以发现用电波动离群的用户。该特征不考虑用户用电的波动大小以及用电量大小。
为了计算个人与所处群体整体的波动趋势差,需要计算每个群体的整体趋势,并对整体趋势向量及每个用户的用电特征向量分别标准化。
其中计算整体用电趋势的方法是随机抽选一定比例(本实施例中该比例设为10%,根据用户总量,实验中10%样本约有1万条数据)的用户,取其每个特征月用电量的中位数分别作为对应月的群体普遍用电量mi,n个特征月组合起来形成整体用电趋势向量m'={m1,m2,...,mn};
然后计算个体用户的用电趋势,取个体用户每个特征月用电量xi,n个特征月组合起来形成个体用户的用电趋势向量x'={x1,x2,...,xn};
为了仅从波动趋势上分析用户与群体差异而避开波动大小及用电量量的影响使用以下标准化公式对二者进行标准化:
上式中,y"i为标准化后的yi,向量Y为个体用户的用电趋势向量x'={x1,x2,...,xn}或整体用电趋势向量m'={m1,m2,...,mn},yi为对应的xi或mi。
最后通过标准化后的每个用户的用电特征向量和整体波动趋势向量按以下公式计算整体波动趋势差:
其中m"i为标准化后的整体用电趋势的第i维,x"i为标准化后的个体用户用电趋势的第i维。
本实施例将上述特征作为待分析特征构建向量进行后续分析。
S30电价合规性分析
对每个群体的用户以上述构建的特征向量进行离群分析,通过建模分析用户所在群体特征空间的用户分布发现每个用户在该特征空间中的离群程度作为该用户在与其拥有相似电价用户群体中的离群程度。离群程度较高的用户有更大几率用电性质与其电价不符。本实施例中,离群分析采用孤立森林算法进行异常数据的识别。将异常系数s最高的一定比例用户定义为疑似异常用户,本实施例中该比例设为0.4%。
S40人工复核及结果输出。
机器学习模型给出的疑似异常用户仅是从侧面反映用户的异常可能性较高,需要由人工对疑似异常用户进行核查后才能给出最终结果,并按照业务系统需求进行输出。
请参照图2所示,本发明的电价执行异常用户的识别系统包括依次数据连接的数据集成模块01、用户信息整合模块02、电价分类模块10、特征向量构建模块20、电价合规性分析模块30、人工复核和结果输出模块40;
数据集成模块01用于将不同来源、不同格式的数据进行读取、格式转换、异常数据修正、缺失数据填充、重复数据过滤等操作,并统一保存为系统需要的表数据。该模块包括档案数据集成模块011和用电数据集成模块012两个子模块:档案数据集成模块011用于从库表中收集用户信息及电价明细相关的档案。用电数据集成模块012主要用于接收来自各种计量设备传递的用电信息(如计量电表表码),并进行统一、整合、异常排查。
用户信息整合模块02用于将数据集成模块收集的信息进行关联,包括关联用户档案与电价明细、关联用户档案与两期用电数据、计算实际用电量等。
电价分类模块10用于根据用户电价代码所包含的电价水平及用电性质对电价代码进行归类,如城镇居民一户一表、农村一户一表均属居民用电且电价基本相同会被归为一类。
特征向量构建模块20包含平均电量特征构建模块201、用电波动幅度特征构建模块202、整体波动趋势差特征构建模块203三个子模块,用于构建用于分析电价合规性的用电行为特征向量。
电价合规性分析模块30包括用有放回随机抽样的方式构建多个小样本数据集,分别用来训练多个用电合规模型的用电合规模型训练模块,以及调用用电合规模型对用户用电行为进行分析、生成分析结果的合规性分析模块。
人工复核和结果输出模块40包括人工复核模块401和结果输出模块402,
人工复核模,401对所述电价合规分析模块得到的分析结果进行人工核查。
结果输出模块402由用电合规性分析模型发现的疑似异常用户及他们的档案特征、用电特征、模型分析结果、人工复核结果进行整合数据,以供营销部门进行后期处理。
图3为中国某省区2018年7月到2019年5月执行一般居民电价用户的整体用电趋势图,可以看出普通居民用户的每期用电量普遍在200-400之间,且随着夏季气温的上升有明显的波动趋势。
图4为利用本发明的识别方法从图3对应用户中筛选出来的电价执行异常用户示例。即为图3所示省区2018年7月到2019年5月执行一般居民电价的几万用户中筛选出来的较为异常的用户数据。其中“异常系数”列,为孤立森林算法计算出的对应数据相对于正常居民户的离群系数并进行标准化之后的结果;可以看出,用电水平过大(居民整体趋势在200~400度左右徘徊)、与居民整体用电波动趋势差异较大的用户异常程度较高,很大概率上是电价执行异常的用户。
综上,采用本发明的方法或者系统,可以轻松的从海量数据中筛选出大概率电价执行异常的用户,大幅度降低了筛查电价执行异常用户的工作量。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种电价执行异常用户的识别方法,其特征在于,包括以下步骤:
S10、进行用户用电群体划分;
S20、构建用电行为特征向量;
S30、利用用电行为特征向量进行电价合规性分析;
S40、筛选出电价执行异常的用户,输出结果。
2.根据权利要求1所述的电价执行异常用户的识别方法,其特征在于,所述步骤S10进行用户用电群体划分,包括以下步骤:
根据所有电价代码属性所对应的电价水平、用电性质等用电档案特征对特征相似的电价代码进行归类合并,并标记用电档案特征分类标签;
根据用户所属电价代码所对应的所述用电档案特征分类标签对用户进行群体划分,将拥有相同标签的用户归为同一用电特征群体。
3.根据权利要求1所述的电价执行异常用户的识别方法,其特征在于,所述步骤S20构建用电行为特征向量,包括以下特征:
所述用电波动程度v利用以下方差公式进行计算:
所述个体用户与同类群体用户用电波动趋势差δ,其计算步骤为:
首先计算群体的整体用电趋势,随机抽选一定比例的用户,取其每个特征月用电量的中位数分别作为对应月的群体普遍用电量mi,n个特征月组合起来形成整体用电趋势向量m'={m1,m2,...,mn};
然后计算个体用户的用电趋势,取个体用户每个特征月用电量xi,n个特征月组合起来形成个体用户的用电趋势向量x'={x1,x2,...,xn};
对整体用电趋势向量m'={m1,m2,...,mn}及个体用户的用电趋势向量x'={x1,x2,...,xn}采用以下公式进行标准化,
上式中,y"i为标准化后的yi,向量Y为个体用户的用电趋势向量x'={x1,x2,...,xn}或整体用电趋势向量m'={m1,m2,...,mn},yi为对应的xi或mi;
标准化后的个体用户的用电趋势向量x"和整体用电趋势向量m"按以下公式计算整体波动趋势差
其中m"i为标准化后的整体用电趋势的第i维,x"i为标准化后的个体用户用电趋势的第i维。
4.根据权利要求1或2所述的电价执行异常用户的识别方法,其特征在于,在步骤S10之前还包括数据集成的步骤、用户信息整合步骤;
所述数据集成步骤用于将不同来源、不同格式的数据进行读取、格式转换、异常数据修正、缺失数据填充、重复数据过滤等操作,并统一保存为系统需要的表数据;包括档案数据集成步骤和用电数据集成步骤,所述档案数据集成步骤用于从库表中收集用户信息及电价明细相关的档案;所述用电数据集成步骤用于接收来自各种计量设备传递的用电信息,并进行统一、整合、异常排查;
所述用户信息整合步骤用于将数据集成步骤收集的信息进行关联,包括关联用户基础档案各用电档案信息、关联用户档案与电价明细、关联用户档案与近两期用电数据、计算用户实际用电量。
5.根据权利要求1所述的电价执行异常用户的识别方法,其特征在于,所述用电合规性分析采用合规性分析模型进行分析,所述合规性分析模型通过用电合规模型训练步骤进行训练;所述用电合规模型训练步骤通过有放回随机抽样的方式构建多个小样本数据集,分别训练出多个用电合规模型;所述用电合规模型对前述数据进行分析、并生成分析结果。
6.根据权利要求5所述的电价执行异常用户的识别方法,其特征在于,所述用电合规性分析模型通过建模分析用户所在群体特征空间的用户分布,得出每个用户在该特征空间中相对于用户群体的离群程度作为该用户的异常系数s。
7.根据权利要求1或2所述的电价执行异常用户的识别方法,其特征在于,在步骤S40中还包括人工复核步骤;
所述人工复核步骤由人工对疑似异常用户的档案、用电性质、计量设备等进行核查。
8.一种电价执行异常用户识别系统,其特征在于,包括依次数据连接的电价分类模块、特征向量构建模块、电价合规性分析模块和结果输出模块;
所述电价分类模块用于根据用户所属电价代码对用户进行群体划分;
所述特征向量构建模块用于计算用户的特征值并构建用于分析的特征向量;
所述电价合规性分析模块对每个用户在其所在群体中的离群情况做分析,得到个体用户离群程度作为用户的异常系数s;将异常系数s最高的一定比例的用户,定义为疑似异常用户;
所述结果输出模块由用电合规性分析模型发现的疑似异常用户及他们的档案特征、用电特征、模型分析结果进行整合数据并输出。
9.根据权利要求8所述的电价执行异常用户识别系统,其特征在于,
所述电价分类模块根据所有电价代码属性所对应的电价水平、用电性质等用电档案特征对特征相似的电价代码进行归类合并,并标记用电档案特征分类标签;根据用户所属电价代码所对应的所述用电档案特征分类标签对用户进行群体划分,将拥有相同标签的用户归为同一用电特征群体;
所述特征向量构建模块包含平均电量特征构建模块、用电波动幅度特征构建模块、整体波动趋势差特征构建模块;分别计算三种用电特征;
在所述电价分类模块之前,还包括依次数据连接的数据集成模块和用户信息整合模块,所述数据集成模块用于将不同来源、不同格式的数据进行读取、格式转换、异常数据修正、缺失数据填充、重复数据过滤等操作,并统一保存为系统需要的表数据;
所述用户信息整合模块用于将数据集成模块收集的信息进行关联,包括关联用户基础档案各用电档案信息、关联用户档案与电价明细、关联用户档案与两期用电数据、计算实际用电量;
经数据集成模块和用户信息整合模块整合后的数据再送入电价分类模块进行处理。
10.根据权利要求8或9所述的电价执行异常用户识别系统,其特征在于,所述电价合规性分析模块包括用有放回随机抽样的方式构建多个小样本数据集,分别训练多个用电合规模型的用电合规模训练模块,以及调用模型进行离群分析、生成分析结果的合规性分析模块;
所述结果输出模块之前还包括人工复核模块;
所述人工复核模块由人工对疑似异常用户的档案、用电性质、计量设备等进行核查。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010057653.9A CN111275576A (zh) | 2020-01-19 | 2020-01-19 | 一种电价执行异常用户的识别方法及识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010057653.9A CN111275576A (zh) | 2020-01-19 | 2020-01-19 | 一种电价执行异常用户的识别方法及识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111275576A true CN111275576A (zh) | 2020-06-12 |
Family
ID=70998755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010057653.9A Pending CN111275576A (zh) | 2020-01-19 | 2020-01-19 | 一种电价执行异常用户的识别方法及识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111275576A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190595A (zh) * | 2021-04-20 | 2021-07-30 | 国网江苏省电力有限公司营销服务中心 | 一种小样本驱动的异常用电数据集的构建方法及模块 |
CN113988925A (zh) * | 2021-10-27 | 2022-01-28 | 国网江苏省电力有限公司营销服务中心 | 一种计费参数执行异常自动识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108376346A (zh) * | 2018-02-23 | 2018-08-07 | 南京飞腾电子科技有限公司 | 用户用电行为分析方法和装置 |
CN109308306A (zh) * | 2018-09-29 | 2019-02-05 | 重庆大学 | 一种基于孤立森林的用户用电异常行为检测方法 |
CN109325542A (zh) * | 2018-10-09 | 2019-02-12 | 烟台海颐软件股份有限公司 | 一种基于多阶机器学习的电量异常智能识别方法及系统 |
CN110309134A (zh) * | 2019-05-31 | 2019-10-08 | 国网上海市电力公司 | 基于用电行为迁移与社群演化的配电网用电异常检测方法 |
CN110675020A (zh) * | 2019-08-19 | 2020-01-10 | 国网天津市电力公司 | 一种基于大数据的高价低接用户识别方法 |
-
2020
- 2020-01-19 CN CN202010057653.9A patent/CN111275576A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108376346A (zh) * | 2018-02-23 | 2018-08-07 | 南京飞腾电子科技有限公司 | 用户用电行为分析方法和装置 |
CN109308306A (zh) * | 2018-09-29 | 2019-02-05 | 重庆大学 | 一种基于孤立森林的用户用电异常行为检测方法 |
CN109325542A (zh) * | 2018-10-09 | 2019-02-12 | 烟台海颐软件股份有限公司 | 一种基于多阶机器学习的电量异常智能识别方法及系统 |
CN110309134A (zh) * | 2019-05-31 | 2019-10-08 | 国网上海市电力公司 | 基于用电行为迁移与社群演化的配电网用电异常检测方法 |
CN110675020A (zh) * | 2019-08-19 | 2020-01-10 | 国网天津市电力公司 | 一种基于大数据的高价低接用户识别方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190595A (zh) * | 2021-04-20 | 2021-07-30 | 国网江苏省电力有限公司营销服务中心 | 一种小样本驱动的异常用电数据集的构建方法及模块 |
CN113190595B (zh) * | 2021-04-20 | 2024-03-05 | 国网江苏省电力有限公司营销服务中心 | 一种小样本驱动的异常用电数据集的构建方法及装置 |
CN113988925A (zh) * | 2021-10-27 | 2022-01-28 | 国网江苏省电力有限公司营销服务中心 | 一种计费参数执行异常自动识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110634080B (zh) | 异常用电检测方法、装置、设备及计算机可读存储介质 | |
CN109308571B (zh) | 配电线路线变关系检测方法 | |
CN106570778A (zh) | 一种基于大数据的数据集成与线损分析计算的方法 | |
CN109325542A (zh) | 一种基于多阶机器学习的电量异常智能识别方法及系统 | |
CN111738462A (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN111062620B (zh) | 基于混合计费数据的电力计费公平性智能分析系统及方法 | |
CN112906790B (zh) | 一种基于用电数据的独居老人识别方法和系统 | |
CN111275576A (zh) | 一种电价执行异常用户的识别方法及识别系统 | |
CN111177208A (zh) | 基于大数据分析的用电异常检测方法 | |
TW201917671A (zh) | 用電分析伺服器及其用電分析方法 | |
CN113591899A (zh) | 电力客户画像识别方法、装置及终端设备 | |
CN111984442A (zh) | 计算机集群系统的异常检测方法及装置、存储介质 | |
CN111932070A (zh) | 一种家庭电力用户用电能效分析装置 | |
CN111506635A (zh) | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 | |
CN112686491A (zh) | 一种基于用电行为的企业电力数据分析方法 | |
Razavi et al. | Rethinking the privacy of the smart grid: What your smart meter data can reveal about your household in Ireland | |
CN115617784A (zh) | 一种信息化配电的数据处理系统及其处理方法 | |
CN117114885B (zh) | 一种用于电力交易的数据交互模型构建方法及系统 | |
CN106651630B (zh) | 关键用电行业识别方法和系统 | |
CN110851502B (zh) | 一种基于数据挖掘技术的负荷特征场景分类方法 | |
CN113902485B (zh) | 一种专变电力用户行业识别方法、装置及设备 | |
CN111737763A (zh) | 一种对区块链中存储数据升序排序系统 | |
Tang et al. | Leveraging socioeconomic information and deep learning for residential load pattern prediction | |
CN115908082A (zh) | 基于用电特征指标的企业排污监控方法及装置 | |
CN113269478B (zh) | 一种基于多模型的集中器异常数据提醒方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200612 |
|
RJ01 | Rejection of invention patent application after publication |