CN112927010A - 基于电费出账风险管控的用电信息采集数据二次研判方法 - Google Patents
基于电费出账风险管控的用电信息采集数据二次研判方法 Download PDFInfo
- Publication number
- CN112927010A CN112927010A CN202110171903.6A CN202110171903A CN112927010A CN 112927010 A CN112927010 A CN 112927010A CN 202110171903 A CN202110171903 A CN 202110171903A CN 112927010 A CN112927010 A CN 112927010A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- month
- judgment
- acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000005611 electricity Effects 0.000 title claims abstract description 38
- 238000011160 research Methods 0.000 title claims abstract description 22
- 238000012954 risk control Methods 0.000 title claims description 4
- 238000004140 cleaning Methods 0.000 claims abstract description 21
- 238000002360 preparation method Methods 0.000 claims abstract description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 230000008014 freezing Effects 0.000 claims description 3
- 238000007710 freezing Methods 0.000 claims description 3
- 230000006872 improvement Effects 0.000 abstract description 9
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 239000000843 powder Substances 0.000 description 5
- 206010063385 Intellectualisation Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- BVPWJMCABCPUQY-UHFFFAOYSA-N 4-amino-5-chloro-2-methoxy-N-[1-(phenylmethyl)-4-piperidinyl]benzamide Chemical group COC1=CC(N)=C(Cl)C=C1C(=O)NC1CCN(CC=2C=CC=CC=2)CC1 BVPWJMCABCPUQY-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于用电数据分析处理应用领域,涉及一种基于电费出账风险管控的用电信息采集数据二次研判方法。包括以下步骤:S1:采集系统获取用户用电信息;S2:营销系统,根据上述用户用电信息进行一次研判,所述一次研判是指判断是否符合CMS出账规则;如果符合,则直接出账;如果不符合,则进行S3;S3:结合用户历史用电数据,开展数据准备、数据清洗、数据预测、数据判别,进行二次研判;S4:二次研判规则符合,则营销系统直接出账;不符合,则发出指令进行人工抄表。本发明结果准确且风险可控,充分利用可用的用户用电信息远程采集数据,充分挖掘数据价值,提升自动化电费出账率,大幅减少人工现场抄表工作量,支撑电网公司“提质增效”工作要求。
Description
技术领域
本发明属于用电数据分析处理应用领域,尤其涉及基于电费出账风险管控的用电信息采集数据二次研判方法。
背景技术
近年,国家电网公司电费采集出账业务的管理在向集约化、标准化、数字化方向发展。提高抄表业务智能化和采集出账成功率也一直是实现国家电网智能化和营销智能化的重要组成部分。现有的营销模式在抄表核算业务环节,优先使用已建成的电力用户用电信息采集系统数据,实施自动化抄表。但由于通信误码、采集设备故障等不可控原因,会偶然发生采集数据为毛刺数据并偏离实际电表实际数据的情况。为避免少数异常数据引起出账错误用户投诉的风险发生,电网公司在出账系统中往往会设置简单、严酷的数据过滤机制,使得每月2%~5%的正确采集数据被弃用,造成了数据价值的严重浪费。被弃用数据的用户,依然会派发人工现场抄表工单,靠人工现场补抄电表完成最终的月电费出账。低压客户的电能量采集数据抄表结算应用率不高,造成了大量的人工浪费和企业运行成本浪费。
国网上海市电力公司向国家知识产权局提交了201811597971.3,公开了一种电费采集出账数据规则优化方法,首先进行了小用户和大用户采集出账规则分析,运用数据分析透彻掌握采集出账失败情况,在此基础上,添加采集数据常态化管控与优化的规则,便于管理和业务人员及时对采集出账失败数据进行优化,对实际业务问题进行改进,有效提升了用户采集出账异常情况的分析能力和业务管理能力,但并未达到有效提升数据出账率的目的。
供电企业对用户采集出账成功率的提升愈加重视,为解决以上问题,亟需开展用户侧用电信息采集数据的有效性甄别,在精准辨识的基础上,提升数据可用率,减少企业成本支出。截止到2020年1月,公司营销部统计在目前在中小用户电费出账业务中,每月约有十万左右的用户电表,采集成功却出账失败,主要原因是无法开展有效准确的数据甄别。
发明内容
针对现有技术存在的问题,本发明提供了一种提升采集出账率、减少人工抄表,达到提质增效为目的的基于电费出账风险管控的用电信息采集数据二次研判方法。
本发明是这样实现的,基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于:
包括以下步骤:
S1:采集系统获取用户用电信息;
S2:营销系统,根据上述用户用电信息进行一次研判,所述一次研判是指判断是否符合CMS出账规则;如果符合,则直接出账;如果不符合,则进行S3;
S3:结合用户历史用电数据,开展数据准备、数据清洗、数据预测、数据判别,进行二次研判;
S4:二次研判规则符合,则营销系统直接出账;不符合,则发出指令进行人工抄表。
所述的用户用电信息为营销系统上月出账标记为“用采出账”的电表数据。
所述的数据透抄包括采集系统首先对本月“结算日冻结数据”进行透抄,得到透抄值x月末透抄,
(1)若|x月末透抄-x月末|≤1kwh,则判定x月末有效,可用于出账;
(2)若|x月末透抄-x月末|>1kwh,则判定x月末无效,不可用于出账;
(3)剩余透抄失败的电表,进入后续“数据准备”判断;
上月出账为采集出账且出账示值为C上月,本月月末一日采集示数为x月末,本月非月末任一日采集示数为xn,本月除月末一日采集示数平均值为x。
所述的二次研判包括以下步骤:数据准备、数据清洗、数据预测、数据判别;
所述的数据准备包括以下步骤:
步骤1:若本月用户发生换表,则该用户剔除,不可采集数据出账;
步骤2:若x月末的各费率之和与总电量的差值的绝对值,大于1kwh,则该用户剔除,不可采集数据出账;
步骤3:若(x月末-C上月)<0、或单相表(x月末-C上月)>1040、或三相表(x月末-C上月)>7000,则该用户剔除,不可采集数据出账;
步骤4:且某日的(xn-C上月)<0、或单相表(xn-C上月)>1040、或三相表(xn-C上月)>7000,则该用户的该日数据剔除,不参与后续计算;
步骤5:经过步骤1-4,若当月剩余的可供计算的xn的采集成功天数,小于12日,则该用户剔除,不可采集数据出账。
用户用电量往往与用户电能表配置、用户用电线路负荷配置有很大关系。经过统计分析,月平均用电量大于1040kwh的低压单相用户不到低压单相总用户数的1%,月平均用电量大于7000kwh的低压三相用户不到低压三相总用户数的1%。而采集系统中的异常突变数据往往也落在此区间内。为确保出账数据风险可控,故设定超出该阈值,不属于本方法适用的范畴。
受远程电量采集成功率的影响,若用户在某月的日电量数据采集成功天数小于N日,通过本方法进行数据预测得到月末一日的预测电量数据,有可能出现偏差较大,导致月末实际采集电量数据准确性的研判规则失效,不利于风险管控。通过对上百万样本的机器学习,为达到数据利用最大化、风险最小化,取N等于12最为合理。
所述的数据清洗包括以下步骤:
步骤7:依据拉依达准则,剔除毛刺数据;
步骤8:验证数据是否发生飞走或倒走,完成毛刺数据剔除后,验证该用户本月剩余可计算的采集示数为xn是否发生飞走或倒走:
(1)飞走判别:平均日用电量,单相表(xn-xn-1)>254kwh,三相表(xn-xn-1)>1268kwh;若上v日连续采集失败,则阈值应乘以v;
飞走判别阈值:依据用户实际使用电能表的额定电压UN、最大电流Imax,计算该用户最大可能用电量:阈值=UN×Imax×24×0.8,其中低压单相表为254kwh,低压三相表为1268kwh
(2)倒走判别:xn与上一采集成功日的差值为负;
步骤9:重复执行步骤6、7、8,完成数据清洗:重复执行步骤6、步骤7、步骤8、直至以下情况:
(1)剔除毛刺数据后,再无飞走或倒走发生,则清洗完毕,进入“数据预测”判断;
(2)数据再无可剔除后,仍有飞走或倒走发生,则清洗完毕,该用户不可采集数据出账;
(3)数据剔除后,该用户本月数据采集成功天数小于12日,则程序执行完毕,该用户不可采集数据出账;12日的判定是为保证下一步数据预测和数据判别,有足够多且正确无误的样本数据。
(4)每次剔除后,再次计算σ和S时,n值应取最新的可计算样本数。
n代表天数,也代表不符合规则的样本被剔除后,剩余样本数量。因此在本方法流程中,每次不合规则样本被剔除后,剩余可算样本数量n是变化的。
所述的数据预测是指:
步骤10:经过数据准备与数据清洗后,对剩余数据合格可计算的电表,使用最小二乘法,计算y=ax+b开展月末冻结数据预测,设预测值是y月末预测。
所述的数据判别是指,
步骤11,判定规则如下,
|y月末预测-x月末|≤k*max[xi-(ai+b)]
阈值k在0.5-2之间,符合条件,则x月末即可用于出账。
本发明的优点及积极效果为:
通过对采集历史数据与CMS出账规则进行深入分析,制定了“人工筛查→数据清洗→数据预测→数据研判”的二次研判技术路线,以及“基于标准偏差法的数据清洗”、“基于最小二乘法的数据预测”等数据处理方法。本发明结果准确,且风险可控。充分利用可用的远程采集数据,大幅减少人工抄表量,降低企业运营成本,支撑公司“提质增效”工作要求。本发明算法已上海市电力公司出账使用七个月,结果证明算法能够准确辨识远程采集异常数据,规避错误出账风险,将人工现场补抄工作量降低80%以上,有效助力公司运营成本降低,达到提质增效目的。
附图说明
图1是本发明的流程框图;
图2是本发明的二次研判方法的流程框图;
图3是本发明的未运行前出账数据;
图4是本发明的运行后出账数据。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。
实施例1:
如图1所示,本发明是这样实现的,基于电费出账风险管控的用电信息采集数据二次研判方法,包括以下步骤:
S1:采集系统获取用户用电信息;
S2:营销系统,根据上述用户用电信息进行一次研判,所述一次研判是指判断是否符合CMS出账规则;如果符合,则直接出账;如果不符合,则进行S3;
S3:采集系统进行数据透抄,进行二次研判;
S4:二次研判规则符合,则营销系统直接出账;不符合,则发出指令进行人工抄表。
用户用电信息为营销系统上月出账标记为“用采出账”的电表数据。
数据透抄包括采集系统首先对本月“结算日冻结数据”进行透抄,得到透抄值x月末透抄,
(1)若|x月末透抄-x月末|≤1kwh,则判定x月末有效,可用于出账;
(2)若|x月末透抄-x月末|>1kwh,则判定x月末无效,不可用于出账;
(3)剩余透抄失败的电表,进入后续“数据准备”判断;
上月出账为采集出账且出账示值为C上月,本月月末一日采集示数为x月末,本月非月末任一日采集示数为xn,本月除月末一日采集示数平均值为x。
二次研判包括以下步骤:数据准备、数据清洗、数据预测、数据判别;
一、数据准备,是指基于专家经验构建的用户侧用电信息采集数据初步筛查决策算法,包括以下步骤:
步骤1:若本月用户发生换表,则该用户剔除,不可采集数据出账;
步骤2:若x月末的各费率之和与总电量的差值的绝对值,大于1kwh,则该用户剔除,不可采集数据出账;
步骤3:若(x月末-C上月)<0、或单相表(x月末-C上月)>1040、或三相表(x月末-C上月)>7000,则该用户剔除,不可采集数据出账;
步骤4:且某日的(xn-C上月)<0、或单相表(xn-C上月)>1040、或三相表(xn-C上月)>7000,则该用户的该日数据剔除,不参与后续计算;
步骤5:经过步骤1-4,若当月剩余的可供计算的xn的采集成功天数,小于12日,则该用户剔除,不可采集数据出账。
为规避数据毛刺发生风险,选取电网单相用户用电量最大1%的用户月用电量1040kwh、低压三相用户用电量最大1%的用户月用电量7000kwh,作为数据初筛依据。
二、数据清洗,运用标准偏差法与拉依达准则构建异常数据甄别与异常数据清洗模型算法,为二次研判构建合理准确的数据依据,包括以下步骤:
步骤7:依据拉依达准则,剔除毛刺数据;
步骤8:验证数据是否发生飞走或倒走,完成毛刺数据剔除后,验证该用户本月剩余可计算的采集示数为xn是否发生飞走或倒走:
(1)飞走判别:平均日用电量,单相表(xn-xn-1)>254kwh,三相表(xn-xn-1)>1268kwh;若上v日连续采集失败,则阈值应乘以v;
单相表、三相表的飞走阈值,是电表在额定电压、最大电流的工作条件下24小时最大可能电量的80%。
(2)倒走判别:xn与上一采集成功日的差值为负。
步骤9:重复执行步骤6、7、8,完成数据清洗:重复执行步骤6、步骤7、步骤8、直至以下情况:
(1)剔除毛刺数据后,再无飞走或倒走发生,则清洗完毕,进入“数据预测”判断;
(2)数据再无可剔除后,仍有飞走或倒走发生,则清洗完毕,该用户不可采集数据出账;
(3)数据剔除后,该用户本月数据采集成功天数小于12日,则程序执行完毕,该用户不可采集数据出账;
(4)每次剔除后,再次计算σ和S时,n值应取最新的可计算样本数。
三、数据预测是指:基于最小二乘法开展用户月末用电数据预测,并以历史预测数据与真值的最大偏差绝对值作为数据是否可用判别依据的算法模型,最终确定月末采集数据是否可用于营销出账,其方法是:
步骤10:经过数据准备与数据清洗后,对剩余数据合格可计算的电表,使用最小二乘法,计算y=ax+b开展月末冻结数据预测,设预测值是y月末预测。
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
根据样本数据,采用最小二乘估计式可以得到简单线性回归模型参数的估计量。但是估计量参数与总体真实参数的接近程度如何,是否存在更好的其它估计式,这就涉及到最小二乘估计式或估计量的最小方差性、线性及无偏性。
1、线性特性是指估计量分别是样本观测值的线性函数,亦即估计量和观测值的线性组合。
2、无偏性是指参数估计量的期望值分别等于总体真实参数。
3、最小方差性是指估计量与用其它方法求得的估计量比较,其方差最小,即最佳。
四、数据判别是指,步骤11:判定规则如下,
|y月末预测-x月末|≤k*max[xi-(ai+b)]
阈值k在0.5-2之间,符合条件,则x月末即可用于出账。
通过对上百万样本的机器学习,将月末预测值与月末采集值的偏差、与当月其他日预测值与日采集值的偏差的最大值作比对,比值k在0.5-2之间时,可满足出账数据准确率100%的要求。
如下表1所示。
表1
实验证明
如图3、4所示,国网上海电力公司计量中心对7个月的出账数据进行了验算,在被过滤的41.59万只电表中,判定有33.27万只采集数据可用于出账,数据经二次研判诊断重新利用出账率为80%,人工抄表量降低80%。在33.27万出账数据中,研判准确率达到了100%。
算法可用性很高,系统资源耗费较少,数据分析研判的效率大致在10分钟/20万户,上海电力公司每月的出账二次研判工作,仅在10分钟内即可执行完毕。
二次研判的算法、阈值,经过不断的验证与调整,目前已非常成熟,上海电力公司每月平均减少5万左右的人工抄表工作量,实际经济效益为600万元/年。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于:包括以下步骤:
S1:采集系统获取用户用电信息;
S2:营销系统,根据上述用户用电信息进行一次研判,所述一次研判是指判断是否符合CMS出账规则;如果符合,则直接出账;如果不符合,则进行S3;
S3:结合用户历史用电数据,开展数据准备、数据清洗、数据预测、数据判别,进行二次研判;
S4:二次研判规则符合,则营销系统直接出账;不符合,则发出指令进行人工抄表。
2.如权利要求1所述的基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于,所述的数据准备是指基于专家经验构建的用户侧用电信息采集数据初步筛查决策算法,包括以下步骤:
步骤1:若本月用户发生换表,则该用户剔除,不可采集数据出账;
步骤2:若x月末的各费率之和与总电量的差值的绝对值,大于1kwh,则该用户剔除,不可采集数据出账;
步骤3:若(x月末-C上月)<0、或单相表(x月末-C上月)>1040、或三相表(x月末-C上月)>7000,则该用户剔除,不可采集数据出账;
步骤4:且某日的(xn-C上月)<0、或单相表(xn-C上月)>1040、或三相表(xn-C上月)>7000,则该用户的该日数据剔除,不参与后续计算;
步骤5:经过步骤1-4,若当月剩余的可供计算的xn的采集成功天数,小于12日,则该用户剔除,不可采集数据出账;
为规避数据毛刺发生风险,选取电网单相用户用电量最大1%的用户月用电量1040kwh、低压三相用户用电量最大1%的用户月用电量7000kwh,作为数据初筛依据。
3.如权利要求1所述的基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于,所述的数据清洗是指:运用标准偏差法与拉依达准则构建异常数据甄别与异常数据清洗模型算法,为二次研判构建合理准确的数据依据,包括以下步骤:
步骤7:依据拉依达准则,剔除毛刺数据;
步骤8:验证数据是否发生飞走或倒走,完成毛刺数据剔除后,验证该用户本月剩余可计算的采集示数为xn是否发生飞走或倒走:
(1)飞走判别:平均日用电量,单相表(xn-xn-1)>254kwh,三相表(xn-xn-1)>1268kwh;若上v日连续采集失败,则阈值应乘以v;
飞走判别阈值:依据用户实际使用电能表的额定电压UN、最大电流Imax,计算该用户最大可能用电量:阈值=UN×Imax×24×0.8,其中低压单相表为254kwh,低压三相表为1268kwh;
(2)倒走判别:xn与上一采集成功日的差值为负;
步骤9:重复执行步骤6、7、8,完成数据清洗:重复执行步骤6、步骤7、步骤8、直至以下情况:
(1)剔除毛刺数据后,再无飞走或倒走发生,则清洗完毕,进入“数据预测”判断;
(2)数据再无可剔除后,仍有飞走或倒走发生,则清洗完毕,该用户不可采集数据出账;
(3)数据剔除后,该用户本月数据采集成功天数小于12日,则程序执行完毕,该用户不可采集数据出账;12日的判定是为保证下一步数据预测和数据判别,有足够多且正确无误的样本数据;
(4)每次剔除后,再次计算σ和S时,n值应取最新的可计算样本数。
4.如权利要求4所述的基于电费出账风险管控的用电信息采集数据二次研判方法,其特征在于,所述的数据预测是指基于最小二乘法开展用户月末用电数据预测,并以历史预测数据与真值的最大偏差绝对值作为数据是否可用判别依据的算法模型,最终确定月末采集数据是否可用于营销出账,其方法是:
步骤10:经过数据准备与数据清洗后,对剩余数据合格可计算的电表,使用最小二乘法,计算y=ax+b开展月末冻结数据预测,设预测值是y月末预测;
步骤11:判定规则如下,
|y月末预测-x月末|≤k*max[xi-(ai+b)]
阈值k在0.5-2之间,符合条件,则x月末即可用于出账。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110171903.6A CN112927010B (zh) | 2021-02-08 | 2021-02-08 | 基于电费出账风险管控的用电信息采集数据二次研判方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110171903.6A CN112927010B (zh) | 2021-02-08 | 2021-02-08 | 基于电费出账风险管控的用电信息采集数据二次研判方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112927010A true CN112927010A (zh) | 2021-06-08 |
CN112927010B CN112927010B (zh) | 2022-05-24 |
Family
ID=76171179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110171903.6A Active CN112927010B (zh) | 2021-02-08 | 2021-02-08 | 基于电费出账风险管控的用电信息采集数据二次研判方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112927010B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106327359A (zh) * | 2016-09-22 | 2017-01-11 | 国网上海市电力公司 | 一种基于用电模式分析的集抄数据异常判定方法 |
CN106651093A (zh) * | 2016-09-22 | 2017-05-10 | 国网上海市电力公司 | 一种用于低压集抄系统的智能复核管控方法 |
CN109685272A (zh) * | 2018-12-26 | 2019-04-26 | 国网上海市电力公司 | 一种电费采集出账数据规则优化方法 |
WO2019212093A1 (ko) * | 2018-05-02 | 2019-11-07 | 옴니시스템주식회사 | 통합 원격검침 오결선 검출 시스템 |
-
2021
- 2021-02-08 CN CN202110171903.6A patent/CN112927010B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106327359A (zh) * | 2016-09-22 | 2017-01-11 | 国网上海市电力公司 | 一种基于用电模式分析的集抄数据异常判定方法 |
CN106651093A (zh) * | 2016-09-22 | 2017-05-10 | 国网上海市电力公司 | 一种用于低压集抄系统的智能复核管控方法 |
WO2019212093A1 (ko) * | 2018-05-02 | 2019-11-07 | 옴니시스템주식회사 | 통합 원격검침 오결선 검출 시스템 |
CN109685272A (zh) * | 2018-12-26 | 2019-04-26 | 国网上海市电力公司 | 一种电费采集出账数据规则优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112927010B (zh) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110659273B (zh) | 分布式大数据采集平台的数据异常监控及修复方法 | |
CN111693795B (zh) | 一种基于智能电表的台区线损率评估以及异常判断方法 | |
CN110991826B (zh) | 一种评价低压电能表运行状态的方法 | |
CN105243609A (zh) | 一种基于模糊层次分析的用户有序用电决策方法 | |
CN104680261A (zh) | 基于重点大客户负荷曲线聚类的电力负荷运行控制方法 | |
CN110298573B (zh) | 基于多属性群决策的用户异常用电及欠费风险评估方法 | |
CN108256723A (zh) | 煤改电接入电网的经济效益评估方法及终端设备 | |
CN110838076B (zh) | 一种月度跨省区可再生能源消纳方法及终端设备 | |
CN107944680A (zh) | 一种基于智能电能表的变电站电能量平衡监测方法 | |
CN114398941A (zh) | 一种用户缴费行为分类方法、装置、设备及可读存储介质 | |
CN109934713A (zh) | 一种电力批发市场结算方法 | |
CN116388293A (zh) | 一种新能源配建储能电站的联合优化调度方法及系统 | |
CN106327359A (zh) | 一种基于用电模式分析的集抄数据异常判定方法 | |
CN108320081A (zh) | 一种基于自动化的抄表业务数据分析处理方法及系统 | |
CN112927010B (zh) | 基于电费出账风险管控的用电信息采集数据二次研判方法 | |
CN116894156B (zh) | 基于mcmc算法的电力采集终端数据预处理方法 | |
CN113722557A (zh) | 一种燃气供销差的确定方法及装置 | |
US20140279314A1 (en) | System and Method for Reducing and Monitoring Energy Utility Bills | |
CN115545240A (zh) | 一种低压配电网台区异常线损诊断方法、系统、设备及介质 | |
CN110827013B (zh) | 一种暂停及减容变压器内小微负荷电量的结算方法及系统 | |
CN112611997B (zh) | 一种台区关口表挂接关系在线校验方法和系统 | |
CN111951122A (zh) | 一种基于蓄热式电采暖负荷参与的市场化交易方法及系统 | |
CN111967896A (zh) | 提高可中断类负荷参与需求响应积极性的方法及系统 | |
CN113706103B (zh) | 一种电力用户的数据筛查方法及系统 | |
CN107196314B (zh) | 基于非连续函数的无功补偿方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |