CN111008193A - 一种数据清洗与质量评价方法及系统 - Google Patents
一种数据清洗与质量评价方法及系统 Download PDFInfo
- Publication number
- CN111008193A CN111008193A CN201911218991.XA CN201911218991A CN111008193A CN 111008193 A CN111008193 A CN 111008193A CN 201911218991 A CN201911218991 A CN 201911218991A CN 111008193 A CN111008193 A CN 111008193A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- rule
- abnormal
- rules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004140 cleaning Methods 0.000 title claims abstract description 15
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 14
- 230000002159 abnormal effect Effects 0.000 claims abstract description 51
- 230000005611 electricity Effects 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000013145 classification model Methods 0.000 claims abstract description 12
- 238000010801 machine learning Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 9
- 230000010365 information processing Effects 0.000 claims description 7
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 8
- 238000005457 optimization Methods 0.000 abstract description 7
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 230000006872 improvement Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及一种数据清洗与质量评价方法,包括如下步骤:(1)基于营销业务系统的用电信息采集系统内海量的用电数据;(2)采用机器学习算法对采集的海量用电数据进行识别分析,按不同的客户群体根据其用电数据,分别构建数据稀疏矩阵;(3)利用相应的规则对筛选出的异常用户信息进行处理,通过所建立的分类模型评估各项规则对处理结果的影响度,以此来评估各项规则的有效性。本发明通过用电采集数据和营销业务数据,从运行时间、终端应用等方面开展大数据分析,以效果评估及优化实现闭环改进,为业务系统实用化评价提供辅助支撑。
Description
技术领域
本发明属于电能采集大数据治理领域,特别是一种数据清洗与质量评价方法及系统。
背景技术
2014年底全国网覆盖的用电信息采集系统,已实现对所有电力用户和关口的全面覆盖,实现计量装置在线监测和用户负荷、电量、电压等重要信息的实时采集,可及时、完整、准确地为有关系统进行高级分析和辅助决策研究提供基础数据,为实现电能表智能双向互动提供了坚实的信息基础。
当前低压台区数目庞大、建设情况参差不齐的现状使得台区在提升管理水平的过程中面临诸多亟待解决的问题,主要体现在以下4个方面:
(1)受供能侧与用能侧双重影响,缺乏对低压台区智能电能表实际运行状态的科学全面评估手段;
(2)配网结构、用户用电行为、线损等实际因素对低压台区运行状态的影响难以实现实验室物理复现分析;
(3)低压台区智能电能表的运行误差检定精细化程度不够,检定效率低下,检定成本偏高;
(4)低压台区智能电能表的运维派单主要依赖于人工,存在运维资源与运维需求间的矛盾。
发明内容
本发明的目的在于克服现有技术的不足,提供一种数据清洗与质量评价方法及系统。
本发明解决其技术问题是采取以下技术方案实现的:
一种数据清洗与质量评价方法,包括如下步骤:
(1)基于营销业务系统的用电信息采集系统内海量的用电数据;
(2)采用机器学习算法对采集的海量用电数据进行识别分析,按不同的客户群体根据其用电数据,分别构建数据稀疏矩阵,所述的数据稀疏矩阵内包含了异常用户信息、异常规则触发情况信息以及异常处理结果信息三部分;
(3)利用相应的现有规则对筛选出的异常用户信息进行处理,通过所建立的分类模型评估各项规则对处理结果的影响度,以此来评估各项规则的有效性。
而且,所述的营销业务系统的用电信息包括用户基础信息、计量档案信息、计费参数信息、示数信息、功率信息、电压信息、电流信息、计量异常报警信息以及线损数据信息。
而且,所述存在异常的用户信息包括用电异常、计量装置故障、违约用电窃电嫌疑的用户信息。
而且,所述的各项规则的有效性分析方法为:
用户信息与用电数据稀疏矩阵中的异常信息处理结果为因变量,各项核算规则的出发结果为特征值,应用随机森林算法构建用电异常分类模型,并根据分类模型的基尼系数、互信息指标评估各项规则对异常信息处理结果的影响度:
将影响度≤5%的规则判断为疑似无效规则,将该规则剔除后再进一步构建分类模型,并分析模型的查全率、查准率、f1-score较原模型是否下降,若未降低,确认该规则为无效规则;
将模型评价出来的无效规则逐项剔除,用剩余的规则去排查用户的疑似异常数据,若疑似异常情况中核查的真实异常用户未减少,则确认该规则为无效规则,若减少,则认为该规则为有效规则。
本发明的优点和积极效果是:
本数据清洗与质量评价方法,探索数据驱动下的信息系统运行情况诊断技术手段及实现方法,以用电采集数据管理为基础,围绕“聚、炼、用、评”的主线,通过用电采集数据和营销业务数据,从运行时间、终端应用等方面开展大数据分析,以效果评估及优化实现闭环改进,为业务系统实用化评价提供辅助支撑。
附图说明
图1是本发明的流程图;
图2为本发明的箱型图。
具体实施方式
以下结合附图对本发明的实施例做进一步详述:
一种数据清洗与质量评价方法,其创新之处在于:包括如下步骤:
(1)基于营销业务系统的用电信息采集系统内海量的用电数据;
(2)采用机器学习算法对采集的海量用电数据进行识别分析,按不同的客户群体根据其用电数据,分别构建数据稀疏矩阵,所述的数据稀疏矩阵内包含了异常用户信息、异常规则触发情况信息以及异常处理结果信息三部分;
(3)利用相应的规则对筛选出的异常用户信息进行处理,通过所建立的分类模型评估各项规则对处理结果的影响度,以此来评估各项规则的有效性。
基于营销业务系统用电信息采集系统海量用电数据
基于用户基础信息、计量档案、计费参数、示数信息、功率、电压、电流、计量异常报警、线损数据等,采用机器学习算法进行识别分析,从海量数据中筛选存在用电异常、计量装置故障、违约用电窃电嫌疑的用户信处,为用电检查人员提供数据支撑。
用户信息与用电数据稀疏矩阵中的异常信息处理结果为因变量,各项核算规则的出发结果为特征值,应用机器学习算法构建分类模型,并根据模型的基尼系数、互信息等指标评估各项规则对异常信息处理结果的影响度,以此评估各项规则的有效性。
具体步骤如下:
(1)分别基于随机森林、决策树、XGBoost,GDBT算法,构建二分类模型,以查全率、查准率、f1-score为评价指标,筛选最优算法。
示例:
模型算法 | 查确率 | 查全率 | f1-score |
随机森林 | 95% | 98% | 96% |
XGBoost | 92% | 99% | 95% |
决策树 | 92% | 92% | 92% |
Lightgbm | 91% | 93% | 92% |
如上表,根据各算法的查全率、查准率、f1-score,确认随机森林为最优算法。
(2)以最优算法构建分类模型,根据模型的基尼系统、互信息等指标评估各项规则对异常信息处理结果的影响度。
(3)根据各项规则的影响度值,评估规则有效性,将影响度极低的规则判断为疑似无效规则,将该规则剔除后再进一步构建分类模型,并分析模型的查全率、查准率、f1-score较原模型是否下降,若未降低,确认该规则为无效规则。
为确保模型评价结果的有效性,将模型评价出来的无效规则逐项剔除后,用剩余的规则去排查用户近2年的疑似异常数据,若疑似异常情况中核查的真实异常用户未减少,则确认该规则为无效规则,若减少,则认为该规则为有效规则。
示例:
规则名称 | 模型评价结果 | 损失评估检验 | 规则是否有效 |
规则01 | 有效 | 不检验 | 有效 |
规则02 | 有效 | 不检验 | 有效 |
规则03 | 有效 | 不检验 | 有效 |
规则04 | 无效 | 有效 | 有效 |
规则05 | 无效 | 无效 | 无效 |
规则… | … | … | … |
规则N | 无效 | 无效 | 无效 |
2.用户信息与用电特征不匹配主要分析
1)居民照明用户电价行业分类为非居民。
2)临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收。
3)执行大工业、农业、一般工商业电价的行业分类为居民生活。
4)电采暖电价用户冬季用电量偏小。
5)充电电价用电但是用电量较高。
6)合同容量小于110kv户名中含酒店、餐饮、宾馆、饭店、冷库、商城、超市的不应执行分时电价。
7)户名含'学校”幼儿园'没有执行学校电价等特征数据发掘。
8)开表箱记录等。
8)高价执行。
按不同的客户群体根据近两年用电数据,分别构建数据稀疏矩阵。以下表为例:某一客户群体的用能数据矩阵包含了:异常用户信息、异常规则触发情况信息、异常处理结果信息三部分。
上表中每行数据表示经系统基于当前的核算规则查出的异常用户情况,“异常规则触发情况”下各规则的取值为0或1,0代表未触发此项规则,1代表触发了此项规则;“结果标签”的取值为0或1,0代表已处理无异常用户,即审核出的异常客户经人工核查发现并无异常,1代表异常用户,即审核出的异常客户经人工核查发现确有异常,异常情况包括:估抄/抄错、计量装置故障、违约窃电、档案差错等。
3.用电异常特征分析
基于营销业务系统、用电信息采集系统海量数据,通过分析负荷、用电量、线损特征指标,停送电事件等事件与用电数据相关性特征,用户信用度、历史违窃电指标,建立用电异常智能分析特征指标库。对通过构建的异常用电智能诊断模型筛选出的异常用户进行周期性用电行为异常的诊断分析,包括负荷异常诊断,电压异常诊断,电流异常诊断、事件报警、关联分析等,识别出该用户用电异常综合概况,从海量数据中筛选存在用电异常、计量装置故障、违约用电窃电嫌疑的用户。
针对无效规则的阈值优化:基于客户基础信息及用能数据,逐一开展无效规则的阈值优化工作。以用户某一项核算规则为例:考虑该规则近2年曾经被触发,缺没有排查出用户真正存在异常的事实,表明该规则对应的指标数据近2年的波动均为正常,阈值优化的结果应该在近2年指标数据波动的范围之外。基于以上原理,根据该项规则对应指标近2年各月的数据,通过箱型图统计分析该指标的上边缘,下边缘,确认箱体的上限或下限为该规则新阈值参考标准。
针对有效规则的阈值优化:基于客户基础信息及用能数据,逐一开展有效规则的阈值优化工作。以用户某一项【指标突增核】算规则为例:该指标的异常触发规则为,指标大于【阈值】,系统会产生异常共振。根据该规则近2年每月对应的指标数据及异常处理结果数据,以是否为真实异常将指标历月的数据分成合理数值及异常数值两类。通过箱型图分别统计2类数值的上边缘,下边缘。对比2类数据的分布情况,确定最终的阈值参考标准,具体过程如下:
1、若合理数值的上边缘>异常数值的下边缘,则新阈值的上限可参考异常数值的下边缘;若合理数值的上边缘<异常数值的下边缘,则新阈值的上限可参考为合理数值的上边缘
2、若合理数值的下边缘>异常数值的上边缘,则新阈值的下限可参考合理数值的下边缘,若合理数值的下边缘<异常数值的上边缘,则新阈值的下限可参考异常数值的上边缘。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/ 或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (7)
1.一种数据清洗与质量评价方法,其特征在于:包括如下步骤:
(1)基于营销业务系统的用电信息采集系统内的用电数据;
(2)采用机器学习算法对采集的用电数据进行识别分析,按不同的客户群体根据其用电数据,分别构建数据稀疏矩阵;
(3)利用相应的现有规则对构建的数据稀疏矩阵内的数据进行筛选,对筛选出的异常用户信息进行处理,通过所建立的分类模型评估各项规则对处理结果的影响度,根据所述影响度评估各项规则的有效性。
2.根据权利要求1所述的一种数据清洗与质量评价方法,其特征在于:所述的营销业务系统的用电信息包括用户基础信息、计量档案信息、计费参数信息、示数信息、功率信息、电压信息、电流信息、计量异常报警信息以及线损数据信息。
3.根据权利要求1所述的一种数据清洗与质量评价方法,其特征在于:所述存在异常用户信息包括用电异常、计量装置故障、违约用电窃电嫌疑的用户信息。
4.根据权利要求1所述的一种数据清洗与质量评价方法,其特征在于:所述的各项规则的有效性分析方法为:
用户信息与用电数据稀疏矩阵中的异常信息处理结果为因变量,各项核算规则的出发结果为特征值,应用随机森林算法进行异常结果分类,结合分类结果,计算基尼系数、互信息等指标,评估各项规则对异常信息处理结果的影响度:
将影响度≤5%的规则判断为疑似无效规则,将该规则剔除后构建分类模型,并分析模型的查全率、查准率、f1-score较原模型是否下降,若未降低,确认该规则为无效规则;
将模型评价出来的无效规则逐项剔除,用剩余的规则去排查用户的疑似异常数据,若疑似异常情况中核查的真实异常用户未减少,则确认该规则为无效规则,若减少,则认为该规则为有效规则。
5.一种数据清洗与质量评价系统,其特征在于:
包括数据采集模块,用于根据营销业务系统内的用电信息采集系统内的用电数据;
数据识别分析模块,用于采用机器学习算法对采集的用电数据进行识别分析,按不同的客户群体根据其用电数据,分别构建数据稀疏矩阵;
数据处理模块,用于利用相应的现有规则对筛选出的异常用户信息进行处理,通过所建立的分类模型评估各项规则对处理结果的影响度,根据所述影响度评估各项规则的有效性。
6.根据权利要求5所述的一种数据清洗与质量评价系统,其特征在于:所述的营销业务系统的用电信息包括用户基础信息、计量档案信息、计费参数信息、示数信息、功率信息、电压信息、电流信息、计量异常报警信息以及线损数据信息。
7.根据权利要求5所述的一种海量数据清洗与质量评价系统,其特征在于:所述存在异常用户信息包括用电异常、计量装置故障、违约用电窃电嫌疑的用户信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911218991.XA CN111008193B (zh) | 2019-12-03 | 2019-12-03 | 一种数据清洗与质量评价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911218991.XA CN111008193B (zh) | 2019-12-03 | 2019-12-03 | 一种数据清洗与质量评价方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111008193A true CN111008193A (zh) | 2020-04-14 |
CN111008193B CN111008193B (zh) | 2023-10-31 |
Family
ID=70113942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911218991.XA Active CN111008193B (zh) | 2019-12-03 | 2019-12-03 | 一种数据清洗与质量评价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111008193B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112256735A (zh) * | 2020-10-23 | 2021-01-22 | 北京合众伟奇科技股份有限公司 | 一种用电监测方法、装置、计算机设备和存储介质 |
CN112416912A (zh) * | 2020-10-14 | 2021-02-26 | 深圳前海微众银行股份有限公司 | 纵向联邦数据统计的去重方法、装置、终端设备及介质 |
CN113283744A (zh) * | 2021-05-24 | 2021-08-20 | 国网上海市电力公司 | 一种轻量级用电异常特征指纹库设计和更新方法 |
CN115905319A (zh) * | 2022-11-16 | 2023-04-04 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及系统 |
CN117291649A (zh) * | 2023-11-27 | 2023-12-26 | 云南电网有限责任公司信息中心 | 一种集约化的营销数据处理方法及系统 |
CN115905319B (zh) * | 2022-11-16 | 2024-04-19 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156269A (zh) * | 2016-06-01 | 2016-11-23 | 国网河北省电力公司电力科学研究院 | 一种反窃电精准定位在线监测方法 |
US20170236060A1 (en) * | 2015-03-24 | 2017-08-17 | NetSuite Inc. | System and Method for Automated Detection of Incorrect Data |
CN107742127A (zh) * | 2017-10-19 | 2018-02-27 | 国网辽宁省电力有限公司 | 一种改进的防窃电智能预警系统及方法 |
CN109325542A (zh) * | 2018-10-09 | 2019-02-12 | 烟台海颐软件股份有限公司 | 一种基于多阶机器学习的电量异常智能识别方法及系统 |
CN109446231A (zh) * | 2018-03-22 | 2019-03-08 | 北京大学 | 一种基于模式关联分析的实值时间序列规则发现方法和装置 |
CN109615004A (zh) * | 2018-12-07 | 2019-04-12 | 江苏瑞中数据股份有限公司 | 一种多源数据融合的防窃电预警方法 |
CN109634940A (zh) * | 2018-11-12 | 2019-04-16 | 国网天津市电力公司电力科学研究院 | 一种基于海量低压台区用电数据的典型低压台区用电模型构建方法 |
EP3477906A1 (en) * | 2017-10-26 | 2019-05-01 | Accenture Global Solutions Limited | Systems and methods for identifying and mitigating outlier network activity |
WO2019089389A1 (en) * | 2017-11-03 | 2019-05-09 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for prioritizing software vulnerabilities for patching |
CN109815222A (zh) * | 2019-01-16 | 2019-05-28 | 江苏圣通电力新能源科技有限公司 | 一种基于贝叶斯算法的住户用电数据清洗方法 |
-
2019
- 2019-12-03 CN CN201911218991.XA patent/CN111008193B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170236060A1 (en) * | 2015-03-24 | 2017-08-17 | NetSuite Inc. | System and Method for Automated Detection of Incorrect Data |
CN106156269A (zh) * | 2016-06-01 | 2016-11-23 | 国网河北省电力公司电力科学研究院 | 一种反窃电精准定位在线监测方法 |
CN107742127A (zh) * | 2017-10-19 | 2018-02-27 | 国网辽宁省电力有限公司 | 一种改进的防窃电智能预警系统及方法 |
EP3477906A1 (en) * | 2017-10-26 | 2019-05-01 | Accenture Global Solutions Limited | Systems and methods for identifying and mitigating outlier network activity |
WO2019089389A1 (en) * | 2017-11-03 | 2019-05-09 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for prioritizing software vulnerabilities for patching |
CN109446231A (zh) * | 2018-03-22 | 2019-03-08 | 北京大学 | 一种基于模式关联分析的实值时间序列规则发现方法和装置 |
CN109325542A (zh) * | 2018-10-09 | 2019-02-12 | 烟台海颐软件股份有限公司 | 一种基于多阶机器学习的电量异常智能识别方法及系统 |
CN109634940A (zh) * | 2018-11-12 | 2019-04-16 | 国网天津市电力公司电力科学研究院 | 一种基于海量低压台区用电数据的典型低压台区用电模型构建方法 |
CN109615004A (zh) * | 2018-12-07 | 2019-04-12 | 江苏瑞中数据股份有限公司 | 一种多源数据融合的防窃电预警方法 |
CN109815222A (zh) * | 2019-01-16 | 2019-05-28 | 江苏圣通电力新能源科技有限公司 | 一种基于贝叶斯算法的住户用电数据清洗方法 |
Non-Patent Citations (1)
Title |
---|
邵良杉: "改进GSM-RFC 模型在回采巷道围岩 稳定性分级的预测", vol. 37, no. 3, pages 450 - 455 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112416912A (zh) * | 2020-10-14 | 2021-02-26 | 深圳前海微众银行股份有限公司 | 纵向联邦数据统计的去重方法、装置、终端设备及介质 |
CN112256735A (zh) * | 2020-10-23 | 2021-01-22 | 北京合众伟奇科技股份有限公司 | 一种用电监测方法、装置、计算机设备和存储介质 |
CN112256735B (zh) * | 2020-10-23 | 2024-04-09 | 北京合众伟奇科技股份有限公司 | 一种用电监测方法、装置、计算机设备和存储介质 |
CN113283744A (zh) * | 2021-05-24 | 2021-08-20 | 国网上海市电力公司 | 一种轻量级用电异常特征指纹库设计和更新方法 |
CN115905319A (zh) * | 2022-11-16 | 2023-04-04 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及系统 |
CN115905319B (zh) * | 2022-11-16 | 2024-04-19 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及系统 |
CN117291649A (zh) * | 2023-11-27 | 2023-12-26 | 云南电网有限责任公司信息中心 | 一种集约化的营销数据处理方法及系统 |
CN117291649B (zh) * | 2023-11-27 | 2024-02-23 | 云南电网有限责任公司信息中心 | 一种集约化的营销数据处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111008193B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
Angelos et al. | Detection and identification of abnormalities in customer consumptions in power distribution systems | |
CN111008193B (zh) | 一种数据清洗与质量评价方法及系统 | |
US9194899B2 (en) | Utility network and revenue assurance | |
CN110634080B (zh) | 异常用电检测方法、装置、设备及计算机可读存储介质 | |
CN106203832B (zh) | 智能防窃电分析系统及分析方法 | |
CN111103565B (zh) | 一种基于智能电能表计量误差分析的数据变换方法及系统 | |
CN112131441A (zh) | 一种快速识别用电异常行为的方法及系统 | |
CN116882804A (zh) | 一种智能电力监控方法及系统 | |
CN113033617A (zh) | 一种基于大数据台区线损数据深度挖掘分析方法 | |
CN114519514A (zh) | 一种低压台区合理线损值测算方法、系统及计算机设备 | |
CN109409629B (zh) | 基于多属性决策模型的采集终端生产厂商评价方法 | |
CN111178690A (zh) | 基于风控评分卡模型的用电客户窃电风险评估方法 | |
Rathod et al. | Design of electricity tariff plans using gap statistic for K-means clustering based on consumers monthly electricity consumption data | |
CN109215816A (zh) | 蒸汽发生器传热管完整性评估方法、系统及终端设备 | |
CN113095931A (zh) | 贷后风险监控方法、装置及计算机设备 | |
CN112785456A (zh) | 基于向量自回归模型的高损线路窃电检测方法 | |
CN115166625A (zh) | 智能电表误差估计方法及装置 | |
CN110873857B (zh) | 基于多源数据融合的智能电能表运行状态评价方法及系统 | |
CN112633692A (zh) | 查窃电阈值的获取方法和装置、查窃电装置和方法 | |
CN111552686B (zh) | 一种电力数据质量评估方法及其装置 | |
CN109871998B (zh) | 一种基于专家样本库的配电网线损率预测方法及装置 | |
CN112256693A (zh) | 一种预测线路故障停电和用户投诉的方法 | |
CN113627821A (zh) | 一种基于用电行为特征进行异常用电识别的方法及系统 | |
CN112734208A (zh) | 燃煤验收监测装置、方法、设备以及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |