CN112966163A - 电力用户用电费用的审计方法、系统及电子设备 - Google Patents
电力用户用电费用的审计方法、系统及电子设备 Download PDFInfo
- Publication number
- CN112966163A CN112966163A CN202110374024.3A CN202110374024A CN112966163A CN 112966163 A CN112966163 A CN 112966163A CN 202110374024 A CN202110374024 A CN 202110374024A CN 112966163 A CN112966163 A CN 112966163A
- Authority
- CN
- China
- Prior art keywords
- power
- electricity
- consumers
- abnormal
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 169
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000002159 abnormal effect Effects 0.000 claims abstract description 95
- 238000007635 classification algorithm Methods 0.000 claims abstract description 32
- 238000009826 distribution Methods 0.000 claims abstract description 18
- 238000012935 Averaging Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 15
- 230000005856 abnormality Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 7
- 238000007726 management method Methods 0.000 description 13
- 238000013499 data model Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013079 data visualisation Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007728 cost analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提供了一种电力用户用电费用的审计方法、系统及电子设备,提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;以及,对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。本发明对电力用户的用电费用数据进行处理,以实现电力用户的异常标记。
Description
技术领域
本发明涉及信息服务技术领域,尤其涉及一种电力用户用电费用的审计方法、系统及电子设备。
背景技术
随着经济快速增长,执行两部制电价的用户越来越多,且执行基本电价对象均是用电容量较高的用户,一个月的基本电费会比较多,因此基本电费计算准确与否,对于用户或供电企业均会产生较为明显的影响。
目前对线损的主要分析与管理集中在线损率计算预测与管理改进方面。如吴昊等在文献《大工业用户基本电费结算异常情况分析》中针对大工业用户实际接电日期与系统登记启用日期差异产生基本电费问题开展分析、案例说明,并从管理和技术等方面提出相关建议。李斌在文献《自动抄表核算与电费异常智能诊断技术应用分析》中对抄表核算工作中存在的问题进行了分析,主要包括人工参与较多、核算时间集中、电表数据易受干扰等方面,并提出了通过设置不同核算节点、核算方案等方式,拓展核算范围,提高核算精准度。借助计算机编程与相应信息采集手段,使各个系统中的数据内容得以对比、完善,使电费异常情况得到及时准确的定位、诊断和解决。李欢等在文献《提高电费审核准确性,加强异常数据把控》中阐述郑州供电公司对于电费审核工作中异常电费数据处理的管理模式,分析电费数据把控中需要注重的几个要点,分享了郑州供电公司在电核算业务管理方面取得的一些管理创新成果。
但以上大部分都是从计量、管理的角度分析用电费用异常的问题,而忽略了用户用电费用数据本身蕴含了宝贵信息,特别是高压用户用电,也缺乏相应的系统来进行提醒预警,从而更有效地进行用电费用异常管理。
发明内容
本发明的目的在于提供一种电力用户用电费用的审计方法、系统及电子设备,对电力用户的用电费用数据进行处理,以实现电力用户的异常标记。
为了达到上述目的,本发明提供了一种电力用户用电费用的审计方法,包括:
提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;
利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;
利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;以及,
对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。
可选的,所述用电费用数据包括离散型数据和连续型数据,在计算出电力用户在相邻两月间的用电费用的变异系数之前,还包括:
将所述离散型数据转换为连续型数据,并对所有所述连续型数据进行标准化处理。
可选的,在将所述离散型数据转换为所述连续型数据之后,在对所有所述连续型数据进行标准化处理之前,还包括:
对所有所述连续型数据进行降维处理。
可选的,所述离散型数据包括区县、供电单位、户号、户名、用电类别、用户状态和合同容量;所述连续型数据包括立户日期、用电日期和用电费用。
可选的,所述变异系数为电力用户在相邻两月间的用电费用的方差与用电费用的均值的比值。
可选的,根据所有电力用户的平均值的概率分布标记异常的电力用户的步骤包括:
将每个电力用户的平均值按照大小依次排列;
若按照升序排列,则按照预定比例选取排列在末尾的平均值对应的电力用户标记为异常;若按照降序排列,则按照所述预定比例选取排列在开头的平均值对应的电力用户标记为异常。
可选的,根据所有电力用户的平均值的概率分布标记异常的电力用户之后,还包括:
将异常的电力用户的用电费用数据通过图表形式输出,并将异常结果下发给管理系统。
可选的,所述第一预定分类算法为K领近算法,所述第二预定分类算法为孤立森林算法。
一种电力用户用电费用的审计系统,包括:
数据处理模块,用于提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;
第一分类模块,利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;
第二分类模块,利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;以及,
异常标记模块,对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。
一种电子设备,所述电子设备包括:
一个或多个执行器;以及,
存储器,用于存储一个或多个程序;以及,
当所述一个或多个程序被所述一个或多个执行器执行,使得所述一个或多个执行器实现如上述的电力用户用电费用的审计方法。
一种计算机可读存储介质,其上存储有计算机程序,该程序被执行器执行时实现如上述的电力用户用电费用的审计方法。
在本发明提供的一种电力用户用电费用的审计方法、系统及电子设备中,提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;并利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;再对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。本发明采用两种不同的分类算法对每个电力用户的不同数据进行分类,以得到每个电力用户的两个异常概率值,再取得两个异常概率值的平均值,根据所有电力用户的平均值的概率分布,以实现电力用户的异常标记。
附图说明
图1为本发明一实施例提供的电力用户用电费用的审计方法的流程图;
图2为本发明一实施例提供的电力用户用电费用的审计系统的框图;
其中,附图标记为:
10-数据处理模块;20-第一分类模块;30-第二分类模块;40-异常标记模块;50-数据可视化模块。
具体实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
图1为本实施例提供的电力用户用电费用的审计方法的流程图,请参考图1,本实施例提供了一种电力用户用电费用的审计方法,对电力用户的用电费用数据进行处理,以实现电力用户的异常标记及管理,其中包括:
步骤S1:提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;
步骤S2:利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;
步骤S3:利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;
步骤S4:对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。
下面对本实施例提供的电力用户用电费用的审计方法进行详细的阐述。
执行步骤S1:提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数。
具体的,提供若干电力用户的用电费用数据,用电费用数据包括离散型数据和连续型数据。每个电力用户的用电费用数据均可包括区县、供电单位、户号、户名、电压等级、用电类别、用户状态、合同容量、立户日期、用电日期和用电费用等,其中离散型数据包括区县、供电单位、户号、户名、用电类别、用户状态和合同容量,连续型数据包括立户日期、用电日期和用电费用。
进一步地,对每个电力用户的用电费用数据进行预处理,预处理包括转换、降维及标准化处理。首先,将离散型数据转换为连续型数据,并对所有连续型数据进行归一化处理。由于电力用户的用电费用数据包括很多数据,有些数据对于异常识别没有特别用处,后续将不会用到,为了减轻数据处理繁杂度,因此不需要对所有离散型数据进行转换。在本实施例中,选中区县、用电类别、合同容量及用户状态四个离散型数据进行转换为连续型数据,但不限于此,也可选择所有离散型数据等。在本实施例中,采用One-hot编码(独热编码)对选中的离散型数据进行转换,因为大部分算法是基于向量空间中的度量来进行计算的,为了使非偏序关系的变量取值不具有偏序性,并且到圆点是等距的,因此使用One-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点。在离散型数据进行One-hot编码后,每一维度的离散型数据都可以看做是连续的数据,会让数据之间的距离计算更加合理。因此经过One-hot编码后,区县、用电类别、合同容量及用户状态四个离散型数据均转换为连续型数据。
其次,在将离散型数据转换为连续型数据之后,可对所有连续型数据进行降维处理,由于其中部分连续型数据可能会涉及较多的维度,较为复杂,不利于后续的计算,因此对维度较高的连续型数据进行降维。降维处理是预设维度阈值,当连续型数据的维度高于维度阈值,则将该连续型数据的维度降到维度阈值,当连续型数据的维度小于等于维度阈值,则不进行降维。在本实施例中,可对所有连续型数据进行降维处理,但可以选中其中至少部分的连续型数据进行降维处理。
进而,在对连续型数据进行降维处理后,再对降维后的连续型数据进行标准化处理,以将连续型数据按比例缩放,使之落入一个特定区间。在实施例中,采用Z-Score标准化(零-均值规范化)处理,Z-Score标准化将连续型数据转化为无单位的Z-Score分值,使得数据标准统一化,提高了数据可比性,削弱了数据解释性。
进一步地,对每个电力用户的用电费用数据进行预处理后,即在对降维后的连续型数据进行标准化处理后,获得计算出电力用户在相邻两月间的用电费用的变异系数。从预处理后的数据中获取每个电力用户在一年内每月用电费用、用电费用的年最大值、用电费用的年最小值、用电费用的年均值及用电费用的年最大差值,计算得到每个电力用户在相邻两月间的用电费用的变异系数以及每个电力用户在一年中的用电费用的年变异系数。其中,每个电力用户在一年12个月份中的用电费用的变异系数等于每个电力用户在一年12个月份中的用电费用的方差与其用电费用的均值的比值,每个电力用户在相邻两月间的用电费用的变异系数为电力用户在相邻两月间的用电费用的方差与用电费用的均值的比值;例如一年12个月包括11个相邻两月间的用电费用的变异系数,如1、2月份的用电费用的变异系数,2、3月份的用电费用的变异系数...及11、12月份的用电费用的变异系数。
步骤S2:利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值。
具体的,在对每个电力用户的用电费用数据进行预处理之后,利用预处理后的每个电力用户的用电费用数据训练数据模型,还可以将电力用户的电费趋势数据考虑进行去训练数据模型,电力用户的电费趋势数据包括每个电力用户的用电费用的年最大值、用电费用的年最小值、用电费用的年均值、用电费用的年最大差值及年变异系数。在数据模型训练完成后,将每个电力用户的用电费用数据输入到训练好的数据模型中,以每一电力用户的用电费用数据作为一个用电费用数据点,利用第一预设分类算法对每个电力用户的用电费用数据进行分类。在本实施例中,第一预设分类算法为K领近算法,但不限于此,也可为高斯分布异常检测算法。
K领近算法的过程是:首先,计算任一用电费用数据点与其它用电费用数据点的距离值,计算公式如下:
其中,d为距离值,x为任一用电费用数据点,y为其它用电费用数据点,n为用电费用数据点的维度,n≥1。
然后,以任一用电费用数据点为中心点,获取k个距离其最近的其它用电费用数据点,并计算得到k个其它用电费用数据点与中心点的平均距离值,平均距离值计算公式如下:
步骤S3:利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值。
具体的,利用每个电力用户在相邻两月间的用电费用的变异系数训练数据模型,在数据模型训练完成后,将每个电力用户在相邻两月间的用电费用的变异系数输入到训练好的数据模型中,以一个电力用户在相邻两月间的用电费用的变异系数作为一个变异系数数据点,利用第二预设分类算法对在相邻两月间的用电费用的变异系数进行分类。在本实施例中,第二预设分类算法为孤立森林算法,但不限于此。
孤立森林算法的过程是:以所有电力用户的变异系数数据点形成一个样本集,在样本集中采样,生成N个子集来构建N颗孤立树,N≥1。在构建N颗孤立树时,每次随机设定子集中的一个变异系数数据点为变异系数阈值,根据变异系数阈值将子集内的若干变异系数数据点进行分裂,直到孤立树每一个子节点的变异系数数据点均只剩下一个,则孤立树构建完成。孤立树的每一次分裂,孤立树的层数与高度都会增加,当一个变异系数数据点所处的层数越小或高度越低,代表这个变异系数数据点是最可能出现异常的。
由于所有电力用户的变异系数数据点形成一个样本集,在样本集中采样是随机的,一个所有电力用户的变异系数数据点可能被分到若干个子集中。计算每一变异系数数据点在所有对应的孤立树上的平均层数,平均层数的公式如下:
步骤S4:对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。
具体的,在数据模型中,对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。在本实施例中,将每个电力用户的平均值按照大小依次排列,若按照升序排列,则按照预定比例选取排列在末尾的平均值对应的电力用户标记为异常;若按照降序排列,则按照预定比例选取排列在开头的平均值对应的电力用户标记为异常,空间数据模型输出标记为异常的电力用户。
进一步地,将异常的电力用户的用电费用数据通过图表形式输出,并将异常结果下发给管理系统。
图2为本实施例提供的电力用户用电费用的审计系统的框图,请参考图2,本实施例还提供了一种电力用户用电费用的审计系统,其中包括:
数据处理模块10,用于提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;
第一分类模块20,利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;
第二分类模块30,利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;
异常标记模块40,对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。
进一步地,还包括数据可视化模块50,用于异常的电力用户的用电费用数据通过图表形式输出,并将异常结果下发给管理系统。
通过数据处理模块10提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;数据处理模块10将处理后的数据输出给第一分类模块20和第二分类模块30,第一分类模块20利用第一预设分类算法对每个电力用户的用电费用数据进行分类,第二分类模块30利用第二预设分类算法对每个电力用户的变异系数进行分类;将得到的每个电力用户的第一异常概率值和第二异常概率值输出给异常标记模块40,利用异常标记模块40去标记异常的电力用户;再通过数据可视化模块50将异常的电力用户通过图表形式输出,并将异常结果下发给管理系统。
进一步地,本实施例还提供一种电子设备,用于对电力用户的用电费用数据进行处理,以实现电力用户的异常标记,电子设备包括:
一个或多个执行器;以及,
存储器,用于存储一个或多个程序;以及,
当一个或多个程序被一个或多个执行器执行,使得一个或多个执行器实现如上述实施例提出的电力用户用电费用的审计方法。
本实施例中,执行器及存储器均为一个,执行器和存储器可以通过总线或其他方式连接。
存储器作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的电力用户用电费用的审计方法对应的程序指令/模块。执行器通过运行存储在所述存储器中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的电力用户用电费用的审计方法。
存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,电力用户用电费用的审计方法的存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器可进一步包括相对于执行器远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本实施例提出的电子设备与上述实施例提出的电力用户用电费用的审计方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被执行器执行时实现如上述实施例提出的电力用户用电费用的审计方法。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
综上,在本发明提供的一种电力用户用电费用的审计方法、系统及电子设备中,提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;并利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;再对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。本发明采用两种不同的分类算法对每个电力用户的不同数据进行分类,以得到每个电力用户的两个异常概率值,再取得两个异常概率值的平均值,根据所有电力用户的平均值的概率分布,以实现电力用户的异常标记。
上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。
Claims (11)
1.一种电力用户用电费用的审计方法,其特征在于,包括:
提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;
利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;
利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;以及,
对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。
2.如权利要求1所述电力用户用电费用的审计方法,其特征在于,所述用电费用数据包括离散型数据和连续型数据,在计算出电力用户在相邻两月间的用电费用的变异系数之前,还包括:
将所述离散型数据转换为连续型数据,并对所有所述连续型数据进行标准化处理。
3.如权利要求2所述电力用户用电费用的审计方法,其特征在于,对所有所述连续型数据进行标准化处理之前,还包括:
对所有所述连续型数据进行降维处理。
4.如权利要求2所述电力用户用电费用的审计方法,其特征在于,所述离散型数据包括区县、供电单位、户号、户名、用电类别、用户状态和合同容量;所述连续型数据包括立户日期、用电日期和用电费用。
5.如权利要求1所述电力用户用电费用的审计方法,其特征在于,所述变异系数为电力用户在相邻两月间的用电费用的方差与用电费用的均值的比值。
6.如权利要求1所述电力用户用电费用的审计方法,其特征在于,根据所有电力用户的平均值的概率分布标记异常的电力用户的步骤包括:
将每个电力用户的平均值按照大小依次排列;
若按照升序排列,则按照预定比例选取排列在末尾的平均值对应的电力用户标记为异常;若按照降序排列,则按照所述预定比例选取排列在开头的平均值对应的电力用户标记为异常。
7.如权利要求1所述电力用户用电费用的审计方法,其特征在于,根据所有电力用户的平均值的概率分布标记异常的电力用户之后,还包括:
将异常的电力用户的用电费用数据通过图表形式输出,并将异常结果下发给管理系统。
8.如权利要求1所述电力用户用电费用的审计方法,其特征在于,所述第一预定分类算法为K领近算法,所述第二预定分类算法为孤立森林算法。
9.一种电力用户用电费用的审计系统,其特征在于,包括:
数据处理模块,用于提供若干电力用户的用电费用数据,并计算出电力用户在相邻两月间的用电费用的变异系数;
第一分类模块,利用第一预设分类算法对每个电力用户的用电费用数据进行分类,得到每个电力用户的第一异常概率值;
第二分类模块,利用第二预设分类算法对每个电力用户的变异系数进行分类,得到每个电力用户的第二异常概率值;以及,
异常标记模块,对每个电力用户的第一异常概率值和第二异常概率值取平均值,并根据所有电力用户的平均值的概率分布标记异常的电力用户。
10.一种电子设备,其特征在于,所述电子设备包括:
一个或多个执行器;以及,
存储器,用于存储一个或多个程序;以及,
当所述一个或多个程序被所述一个或多个执行器执行,使得所述一个或多个执行器实现如权利要求1-8中任一所述的电力用户用电费用的审计方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行器执行时实现如权利要求1-8中任一所述的电力用户用电费用的审计方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021103494910 | 2021-03-31 | ||
CN202110349491 | 2021-03-31 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112966163A true CN112966163A (zh) | 2021-06-15 |
Family
ID=76279950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110374024.3A Pending CN112966163A (zh) | 2021-03-31 | 2021-04-07 | 电力用户用电费用的审计方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966163A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115905319A (zh) * | 2022-11-16 | 2023-04-04 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及系统 |
-
2021
- 2021-04-07 CN CN202110374024.3A patent/CN112966163A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115905319A (zh) * | 2022-11-16 | 2023-04-04 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及系统 |
CN115905319B (zh) * | 2022-11-16 | 2024-04-19 | 国网山东省电力公司营销服务中心(计量中心) | 一种海量用户电费异常的自动识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
Zhang et al. | Forecasting electric vehicles sales with univariate and multivariate time series models: The case of China | |
CN108376982B (zh) | 负载相序的识别方法及装置 | |
CN112199367B (zh) | 一种长时间尺度功率平衡校验和大数据分析方法及系统 | |
CN105678398A (zh) | 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统 | |
Radovanovic et al. | A holistic approach to forecasting wholesale energy market prices | |
CN114519514B (zh) | 一种低压台区合理线损值测算方法、系统及计算机设备 | |
Bidoki et al. | Evaluating different clustering techniques for electricity customer classification | |
Lin et al. | Revenue prediction for integrated renewable energy and energy storage system using machine learning techniques | |
CN115409120A (zh) | 一种基于数据驱动的用户窃电行为检测辅助方法 | |
CN112966163A (zh) | 电力用户用电费用的审计方法、系统及电子设备 | |
El Maghraoui et al. | Smart energy management system: A comparative study of energy consumption prediction algorithms for a hotel building | |
CN115859099A (zh) | 样本生成方法、装置、电子设备和存储介质 | |
CN113033089A (zh) | 用电量异常用户识别方法和装置 | |
CN117611190A (zh) | 一种区域电力系统碳排放测算方法、装置及介质 | |
CN111861587A (zh) | 一种基于隐马尔可夫模型和向前算法的居民用电行为分析的系统及方法 | |
CN116433440A (zh) | 一种数据自回归增强的碳排放测算方法、系统及电子设备 | |
Zhang et al. | Load forecasting method based on improved deep learning in cloud computing environment | |
CN114372835B (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 | |
CN112991093B (zh) | 一种基于边缘计算的窃电检测方法及系统 | |
Jiang et al. | Soft computing model using cluster-PCA in port model for throughput forecasting | |
CN113627821A (zh) | 一种基于用电行为特征进行异常用电识别的方法及系统 | |
Liu et al. | Inventory Management of Automobile After-sales Parts Based on Data Mining | |
CN112001551A (zh) | 一种基于大用户电量信息的地市电网售电量预测方法 | |
CN113139673A (zh) | 一种预测空气质量的方法、装置、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |