CN110175167A - 一种适用于低压台区用电数据的数据清洗方法及系统 - Google Patents
一种适用于低压台区用电数据的数据清洗方法及系统 Download PDFInfo
- Publication number
- CN110175167A CN110175167A CN201910387376.5A CN201910387376A CN110175167A CN 110175167 A CN110175167 A CN 110175167A CN 201910387376 A CN201910387376 A CN 201910387376A CN 110175167 A CN110175167 A CN 110175167A
- Authority
- CN
- China
- Prior art keywords
- data
- electricity consumption
- abnormal
- platform area
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004140 cleaning Methods 0.000 title claims abstract description 28
- 230000002159 abnormal effect Effects 0.000 claims abstract description 65
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 230000005856 abnormality Effects 0.000 claims abstract description 5
- 238000013450 outlier detection Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 9
- 230000003203 everyday effect Effects 0.000 claims description 6
- 241001269238 Data Species 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 5
- 238000013499 data model Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000007405 data analysis Methods 0.000 abstract description 4
- 230000003542 behavioural effect Effects 0.000 abstract description 3
- 239000007787 solid Substances 0.000 abstract description 2
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Fuzzy Systems (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Remote Monitoring And Control Of Power-Distribution Networks (AREA)
Abstract
本发明涉及一种适用于低压台区用电数据的数据清洗方法,具体步骤如下:(1)对异常数据进行梳理分类,具体分为两大类四小类;(2)对经过分类的异常数据进行自动标识;(3)在经过梳理分类以及标识之后,针对每一小类异常数据,分别采取针对性的处理措施,剔除异常数据或计算近似值替换异常数据。本发明通过低压台区用电数据清理框架的构建,准确总结不利于数据分析的脏数据类型,并可以通过算法自动识别异常的数据。在此基础上,为每一类的脏数据提出了针对性的处理措施。本发明可以为低压台区的数据分析提供合格高质量的数据,为低压台区智能电能表运行误差远程分析、用户用电行为分析等打下坚实的基础。
Description
技术领域
本发明属于电力计量领域,涉及低压台区的用点数据清洗技术,具体是一种适用于低压台区用电数据的数据清洗方法及系统。
背景技术
2009年以来,国家电网公司大力建设用电信息采集系统,目前已实现全域4.5亿只电表运行。系统经过多年运营,积累了海量的用电数据。通过数据分析,挖掘出有效的用电信息,如电能表运行误差、用户的用电行为模式等,既可以开发出海量数据的潜力,又可以大幅降低运营成本,为电网公司提供决策支持。
然而,用电信息采集系统所采集的海量数据中,是从现实世界中采集到的大量的各种各样的数据,原始数据质量受到多样性、不确定性和复杂性的影响,使得采集到的实际数据比较凌乱,存在着缺失、异常等现象,很多情况下不符合数据挖掘工具进行知识获取的规范要求。所以需要对数据进行预处理,以提供干净、简介、准确的数据,使挖掘过程更有效、更容易,提高挖掘效率和准确性。
发明内容
本发明的目的在于克服现有技术的不足之处,提供一种适用于低压台区用电数据的数据清洗方法及系统,处理原始数据中缺失、异常部分,为基于用电数据的数据分析与挖掘,如电能表误差分析,用户用电行为分析等提供合格高质量的数据。
本发明解决其技术问题是采取以下技术方案实现的:
一种适用于低压台区用电数据的数据清洗方法,其特征在于:具体步骤如下:
(1)对异常数据进行梳理分类,具体分为两大类四小类;
(2)对经过分类的异常数据进行自动标识;
(3)在经过梳理分类以及标识之后,针对每一小类异常数据,分别采取针对性的处理措施,剔除异常数据或计算近似值替换异常数据。
而且,所述步骤(1)中,异常数据梳理分类为缺失值和异常值两大类,缺失值分为负荷数据缺失、互感器变比数据缺失、长时间未用电用户的数据三个小类,异常值为负荷数据异常。
而且,所述步骤(2)中,应用基于相对密度的离群点检测算法实现异常线损检测,对异常数据进行标识。
而且,具体步骤为:
依照如下等式计算出台区每一天的线损率,
(ΔP%)t=(L总,t-∑Lx,t)÷L总,t×100%
式中,(ΔP%)t表示台区在t天的线损率;L总,t表示台区总表在第t天测得的负荷用电量;
将台区线损率作为输入,应用离群点检测算法,标识出线损率异常的日期。
而且,所述离群点检测算法的具体步骤为:
⑴建立以下基础数据模型:
①对于正整数k,对象p的k最近邻距离k_distance(p)定义为:
1)除p外,至少有k个对象o满足distance(p,o)≤k_distance(p);
2)除p外,至多有k-1个对象o满足distance(p,o)<k_distance(p);
②在此基础上,定义对象的局部邻域密度为:
③相对密度定义为:
其中,N(x,k)是不包含x的k-最近邻的集合,|N(x,k)|是该集合的大小,其值大于k;
⑵在建立基础数据模型的基础上,基于相对密度的离群点检测算法由以下三步组成:
首先,对于每一对象x,确定x的k-最近邻集合N(x,k)和密度density(x,k);之后,对于每一对象x,计算其相对密度realtive density(x,k);最后,将各对象的相对密度降序排列,确定相对密度大的,明显偏离的若干对象为离群点。
而且,所述步骤(3)的处理措施,具体为:
①缺失的负荷数据
当缺失数据数量不影响计算时,直接剔除存在缺失值的日期;当缺失的数据数量影响计算时,采用线性插值的方法补全,若用户第t天的负荷数据缺失,则计算该用户第t-1天和第t+1天用电数据的平均值,作为缺失数据的近似值;
②缺失的互感器变比
剔除该类用户数据;
③长期未用电的用户数据
剔除该类用户数据;
④异常的负荷数据
按照步骤(2)的方法计算出每一天的线损率后,利用基于相对密度的离群点检测算法,判别出线损率明显异常的日期,并将异常数据全部剔除,从而过滤数据中的异常值。
一种低压台区用电数据的数据清洗系统,其特征在于:包括数据梳理模块、数据标识模块以及清洗模块,数据梳理模块、数据标识模块以及清洗模块依次顺序连接,数据梳理模块用于对异常数据进行梳理分类,数据标识模块用于对经过分类的异常数据进行自动标识,清洗模块用于针对每一小类异常数据,分别采取针对性的处理措施,剔除异常数据或计算近似值替换异常数据。
而且,所述数据梳理模块将异常数据分类为缺失值和异常值两大类,缺失值分为负荷数据缺失、互感器变比数据缺失、长时间未用电用户的数据三个小类,异常值为负荷数据异常。
而且,所述数据标识模块应用基于相对密度的离群点检测算法实现异常线损检测,对异常数据进行标识。
而且,所述清洗模块具体功能包括处理缺失的负荷数据、缺失的互感器变比、长期未用电的用户数据以及异常的负荷数据的异常数据。
本发明的优点和积极效果是:
本发明通过低压台区用电数据清理框架的构建,准确总结不利于数据分析的脏数据类型,并可以通过算法自动识别异常的数据。在此基础上,为每一类的脏数据提出了针对性的处理措施。本发明可以为低压台区的数据分析提供合格高质量的数据,为低压台区智能电能表运行误差远程分析、用户用电行为分析等打下坚实的基础。
附图说明
图1为低压台区用电脏数据类型及清洗措施对应关系图。
具体实施方式
下面结合附图并通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
一种适用于低压台区用电数据的数据清洗方法,针对用采系统采集到的原始用电数据中,普遍存在着缺失,异常,轻载等现象,梳理出需要进行数据清晰的脏数据类型,利用离群点检测算法标识异常数据,并针对每一类数据针对性提出不同的处理方法,具体步骤如下:
(1)根据用电数据的特点和数据分析的需要,将异常数据进行梳理分类,具体分为缺失值和异常值两大类,在此基础上,缺失值分为负荷数据缺失、互感器变比数据缺失、长时间未用电用户的数据(准缺失数据)三个小类,异常值为负荷数据异常(跳大数,跳小数)一个小类,共计四个小类;
(2)对经过分类的异常数据进行自动标识,具体是应用基于相对密度的离群点检测算法实现异常线损检测,标识出线损率异常的日期;
由于异常的负荷数据难以准确定义其异常的边界,同时也无法准确确定其异常产生的原因,即无法排除是由于用户短期内用电行为的变化导致的异常,考虑台区的每日线损率大致稳定在一定范围内,所以我们考虑通过构造台区线损率这个特征来识别异常数据。
首先,依照如下等式计算出台区每一天的线损率,
(ΔP%)t=(L总,t-∑Lx,t)÷L总,t×100%
式中,(ΔP%)t表示台区在t天的线损率;L总,t表示台区总表在第t天测得的负荷用电量。
在此基础上,将台区线损率作为输入,应用离群点检测算法,标识出线损率异常的日期。
在本实施例中,应用基于相对密度的离群点检测算法来实现异常线损检测。
在应用该算法之前,首先需要定义三个概念:
对于正整数k,对象p的k最近邻距离k_distance(p)定义为:
1)除p外,至少有k个对象o满足distance(p,o)≤k_distance(p);
2)除p外,至多有k-1个对象o满足distance(p,o)<k_distance(p)。
在此基础上,定义对象的局部邻域密度为:
相对密度定义为:
其中,N(x,k)是不包含x的k-最近邻的集合,|N(x,k)|是该集合的大小,其值可能大于k。
在定义概念的基础上,基于相对密度的离群点检测算法由以下三步组成:
首先,对于每一对象x,确定x的k-最近邻集合N(x,k)和密度density(x,k);之后,对于每一对象x,计算其相对密度realtive density(x,k);最后,将各对象的相对密度降序排列,确定相对密度大的,即明显偏离的若干对象为离群点。
(3)在经过梳理分类以及标识之后,针对每一小类异常数据,从数据分析的需要出发,分别提出针对性的处理措施。具体的数据清洗方法如下:
①缺失的负荷数据
有时因为用采系统数据采集失败,会出现负荷数据缺失的情况。当缺失数据较少时,可以直接剔除存在缺失值的日期。当缺失的数据较多时,以至于无法通过直接剔除的方式来处理时,采用线性插值的方法补全,若用户第t天的负荷数据缺失,则计算该用户第t-1天和第t+1天用电数据的平均值,作为缺失数据的近似值。
②缺失的互感器变比
极少数情况下,会出现缺失互感器变比数据的情况。此时,因为无从得知用户的真实用电量,故无法进行该台区的电能表运行误差分析。
③长期未用电的用户数据
考虑实际中,存在着部分用户长时间不用电的情况。此时其电表测量的用电量虽然不为空,但始终为0。由于项目研究基于用电数据进行分析,如果用电量始终为0,研究分析电表的误差也就无从谈起。这类长时间未产生用电数据的电能表,是数据分析的“盲区”。考虑研究需要,将该类用户相关的数据剔除。
④异常的负荷数据(跳大数或跳小数)
所谓异常的负荷数据是指,明显高于或低于相邻时间段的用电数据。考虑到不能完全排除是用户短期内用电行为的改变(如出差,短时间使用大功率用电器等),所以通过构造线损率这个特征来帮助识别异常数据。由于短期内低压台区的理论线损值通常稳定在一定水平,如果某日的理论线损值明显异常,证明该日数据存在异常。所以按照前述方法计算出每一天的线损率后,利用基于相对密度的离群点检测算法,判别出线损率明显异常的日期,并将异常数据全部剔除,从而过滤数据中的异常值。
一种低压台区用电数据的数据清洗系统,其特征在于:包括数据梳理模块、数据标识模块以及清洗模块,数据梳理模块、数据标识模块以及清洗模块依次顺序连接,
数据梳理模块用于对异常数据进行梳理分类,所述数据梳理模块将异常数据分类为缺失值和异常值两大类,缺失值分为负荷数据缺失、互感器变比数据缺失、长时间未用电用户的数据三个小类,异常值为负荷数据异常。
数据标识模块用于对经过分类的异常数据进行自动标识,数据标识模块应用基于相对密度的离群点检测算法实现异常线损检测,对异常数据进行标识。
清洗模块用于针对每一小类异常数据,分别提出针对性的处理措施。清洗模块具体功能包括处理缺失的负荷数据、缺失的互感器变比、长期未用电的用户数据以及异常的负荷数据的异常数据。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种适用于低压台区用电数据的数据清洗方法,其特征在于:具体步骤如下:
(1)对异常数据进行梳理分类,具体分为两大类四小类;
(2)对经过分类的异常数据进行自动标识;
(3)在经过梳理分类以及标识之后,针对每一小类异常数据,分别采取针对性的处理措施,剔除异常数据或计算近似值替换异常数据。
2.根据权利要求1所述的适用于低压台区用电数据的数据清洗方法,其特征在于:所述步骤(1)中,异常数据梳理分类为缺失值和异常值两大类,缺失值分为负荷数据缺失、互感器变比数据缺失、长时间未用电用户的数据三个小类,异常值为负荷数据异常。
3.根据权利要求1所述的适用于低压台区用电数据的数据清洗方法,其特征在于:所述步骤(2)中,应用基于相对密度的离群点检测算法实现异常线损检测,对异常数据进行标识。
4.根据权利要求3所述的适用于低压台区用电数据的数据清洗方法,其特征在于:具体步骤为:
依照如下等式计算出台区每一天的线损率,
(ΔP%)t=(L总,t-∑Lx,t)÷L总,t×100%
式中,(ΔP%)t表示台区在t天的线损率;L总,t表示台区总表在第t天测得的负荷用电量;
将台区线损率作为输入,应用离群点检测算法,标识出线损率异常的日期。
5.根据权利要求4所述的适用于低压台区用电数据的数据清洗方法,其特征在于:所述离群点检测算法的具体步骤为:
⑴建立以下基础数据模型:
①对于正整数k,对象p的k最近邻距离k_distance(p)定义为:
1)除p外,至少有k个对象o满足distance(p,o)≤k_distance(p);
2)除p外,至多有k-1个对象o满足distance(p,o)<k_distance(p);
②在此基础上,定义对象的局部邻域密度为:
③相对密度定义为:
其中,N(x,k)是不包含x的k-最近邻的集合,|N(x,k)|是该集合的大小,其值可能大于k;
⑵在建立基础数据模型的基础上,基于相对密度的离群点检测算法由以下三步组成:
首先,对于每一对象x,确定x的k-最近邻集合N(x,k)和密度density(x,k);之后,对于每一对象x,计算其相对密度realtive density(x,k);最后,将各对象的相对密度降序排列,确定相对密度大的,明显偏离的若干对象为离群点。
6.根据权利要求1所述的适用于低压台区用电数据的数据清洗方法,其特征在于:所述步骤(3)的处理措施,具体为:
①缺失的负荷数据
当缺失数据数量不影响计算时,直接剔除存在缺失值的日期;当缺失的数据影响计算时,采用线性插值的方法补全,若用户第t天的负荷数据缺失,则计算该用户第t-1天和第t+1天用电数据的平均值,作为缺失数据的近似值;
②缺失的互感器变比
剔除该类用户数据;
③长期未用电的用户数据
剔除该类用户数据;
④异常的负荷数据
按照步骤(2)的方法计算出每一天的线损率后,利用基于相对密度的离群点检测算法,判别出线损率明显异常的日期,并将异常数据全部剔除,从而过滤数据中的异常值。
7.一种低压台区用电数据的数据清洗系统,其特征在于:包括数据梳理模块、数据标识模块以及清洗模块,数据梳理模块、数据标识模块以及清洗模块依次顺序连接,数据梳理模块用于对异常数据进行梳理分类,数据标识模块用于对经过分类的异常数据进行自动标识,清洗模块用于针对每一小类异常数据,分别采取针对性的处理措施,剔除异常数据或计算近似值替换异常数据。
8.根据权利要求7所述的低压台区用电数据的数据清洗系统,其特征在于:所述数据梳理模块将异常数据分类为缺失值和异常值两大类,缺失值分为负荷数据缺失、互感器变比数据缺失、长时间未用电用户的数据三个小类,异常值为负荷数据异常。
9.根据权利要求7所述的低压台区用电数据的数据清洗系统,其特征在于:所述数据标识模块应用基于相对密度的离群点检测算法实现异常线损检测,对异常数据进行标识。
10.根据权利要求7所述的低压台区用电数据的数据清洗系统,其特征在于:所述清洗模块具体功能包括处理缺失的负荷数据、缺失的互感器变比、长期未用电的用户数据以及异常的负荷数据的异常数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387376.5A CN110175167A (zh) | 2019-05-10 | 2019-05-10 | 一种适用于低压台区用电数据的数据清洗方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387376.5A CN110175167A (zh) | 2019-05-10 | 2019-05-10 | 一种适用于低压台区用电数据的数据清洗方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110175167A true CN110175167A (zh) | 2019-08-27 |
Family
ID=67690723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910387376.5A Pending CN110175167A (zh) | 2019-05-10 | 2019-05-10 | 一种适用于低压台区用电数据的数据清洗方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110175167A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110713560A (zh) * | 2019-10-12 | 2020-01-21 | 国网北京市电力公司 | 基于电能表低压电力线宽带载波通信的台区管理监控方法 |
CN110750527A (zh) * | 2019-10-24 | 2020-02-04 | 南方电网科学研究院有限责任公司 | 一种电力大数据的数据清洗方法 |
CN110781177A (zh) * | 2019-11-13 | 2020-02-11 | 国网重庆市电力公司电力科学研究院 | 一种电能表用电信息整理方法、装置及可读存储介质 |
CN111125075A (zh) * | 2019-12-17 | 2020-05-08 | 国网天津市电力公司电力科学研究院 | 一种不可算台区数据治理方法及系统 |
CN111141950A (zh) * | 2019-12-03 | 2020-05-12 | 深圳供电局有限公司 | 一种计量自动化系统电表分时表码异常判断与修复方法 |
CN111177138A (zh) * | 2019-12-30 | 2020-05-19 | 深圳市恒泰能源科技有限公司 | 电力需求侧的大数据分析方法、装置、设备及存储介质 |
CN111177128A (zh) * | 2019-12-11 | 2020-05-19 | 国网天津市电力公司电力科学研究院 | 基于改进的离群点检测算法的计量大数据批量处理方法及系统 |
CN111177651A (zh) * | 2019-12-03 | 2020-05-19 | 深圳供电局有限公司 | 一种计量自动化系统电表分时缺失表码拟合方法 |
CN112072789A (zh) * | 2020-09-03 | 2020-12-11 | 国网湖南省电力有限公司 | 低电压台区识别方法、检修方法及其预警方法 |
CN113516192A (zh) * | 2021-07-19 | 2021-10-19 | 国网北京市电力公司 | 一种用户用电异动识别方法、系统、装置及存储介质 |
CN115344567A (zh) * | 2022-10-18 | 2022-11-15 | 国网天津市电力公司营销服务中心 | 一种适用于边缘计算的低压台区数据清洗治理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106161138A (zh) * | 2016-06-17 | 2016-11-23 | 贵州电网有限责任公司贵阳供电局 | 一种智能自动计量方法及装置 |
US20170193078A1 (en) * | 2016-01-06 | 2017-07-06 | International Business Machines Corporation | Hybrid method for anomaly Classification |
CN107247737A (zh) * | 2017-05-10 | 2017-10-13 | 国家电网公司 | 基于用电量的台区违约用电分析与挖掘方法 |
CN108256559A (zh) * | 2017-12-27 | 2018-07-06 | 国网河南省电力公司电力科学研究院 | 一种基于局部离群点因子的低压窃电用户定位方法 |
CN109344144A (zh) * | 2018-09-06 | 2019-02-15 | 葛得辉 | 一种低压台区户变关系识别方法和系统 |
-
2019
- 2019-05-10 CN CN201910387376.5A patent/CN110175167A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170193078A1 (en) * | 2016-01-06 | 2017-07-06 | International Business Machines Corporation | Hybrid method for anomaly Classification |
CN106161138A (zh) * | 2016-06-17 | 2016-11-23 | 贵州电网有限责任公司贵阳供电局 | 一种智能自动计量方法及装置 |
CN107247737A (zh) * | 2017-05-10 | 2017-10-13 | 国家电网公司 | 基于用电量的台区违约用电分析与挖掘方法 |
CN108256559A (zh) * | 2017-12-27 | 2018-07-06 | 国网河南省电力公司电力科学研究院 | 一种基于局部离群点因子的低压窃电用户定位方法 |
CN109344144A (zh) * | 2018-09-06 | 2019-02-15 | 葛得辉 | 一种低压台区户变关系识别方法和系统 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110713560A (zh) * | 2019-10-12 | 2020-01-21 | 国网北京市电力公司 | 基于电能表低压电力线宽带载波通信的台区管理监控方法 |
CN110750527A (zh) * | 2019-10-24 | 2020-02-04 | 南方电网科学研究院有限责任公司 | 一种电力大数据的数据清洗方法 |
CN110781177A (zh) * | 2019-11-13 | 2020-02-11 | 国网重庆市电力公司电力科学研究院 | 一种电能表用电信息整理方法、装置及可读存储介质 |
CN111141950B (zh) * | 2019-12-03 | 2022-06-14 | 深圳供电局有限公司 | 一种计量自动化系统电表分时表码异常判断与修复方法 |
CN111141950A (zh) * | 2019-12-03 | 2020-05-12 | 深圳供电局有限公司 | 一种计量自动化系统电表分时表码异常判断与修复方法 |
CN111177651A (zh) * | 2019-12-03 | 2020-05-19 | 深圳供电局有限公司 | 一种计量自动化系统电表分时缺失表码拟合方法 |
CN111177128B (zh) * | 2019-12-11 | 2023-10-27 | 国网天津市电力公司电力科学研究院 | 基于改进的离群点检测算法的计量大数据批量处理方法及系统 |
CN111177128A (zh) * | 2019-12-11 | 2020-05-19 | 国网天津市电力公司电力科学研究院 | 基于改进的离群点检测算法的计量大数据批量处理方法及系统 |
CN111125075A (zh) * | 2019-12-17 | 2020-05-08 | 国网天津市电力公司电力科学研究院 | 一种不可算台区数据治理方法及系统 |
CN111177138A (zh) * | 2019-12-30 | 2020-05-19 | 深圳市恒泰能源科技有限公司 | 电力需求侧的大数据分析方法、装置、设备及存储介质 |
CN112072789A (zh) * | 2020-09-03 | 2020-12-11 | 国网湖南省电力有限公司 | 低电压台区识别方法、检修方法及其预警方法 |
CN113516192A (zh) * | 2021-07-19 | 2021-10-19 | 国网北京市电力公司 | 一种用户用电异动识别方法、系统、装置及存储介质 |
CN115344567A (zh) * | 2022-10-18 | 2022-11-15 | 国网天津市电力公司营销服务中心 | 一种适用于边缘计算的低压台区数据清洗治理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110175167A (zh) | 一种适用于低压台区用电数据的数据清洗方法及系统 | |
CN110082699A (zh) | 一种低压台区智能电能表运行误差计算方法及其系统 | |
CN110231528A (zh) | 基于负荷特征模型库的变压器户变异常识别方法及装置 | |
CN111967512B (zh) | 一种异常用电检测方法、系统和存储介质 | |
CN106991524A (zh) | 一种台区线损率预估方法 | |
CN111027872B (zh) | 一种区域用户的用电成熟度确定方法及系统 | |
CN102832617B (zh) | 一种基于精确化模式判别的大电网暂态稳定分析方法 | |
CN106372747B (zh) | 基于随机森林的台区合理线损率估计方法 | |
CN105701559A (zh) | 一种基于时间序列的短期负荷预测方法 | |
CN110378510B (zh) | 一种基于时间序列和层次聚合的配网物资需求预测方法 | |
CN109800898A (zh) | 一种智能短期负荷预测方法及系统 | |
CN108876019A (zh) | 一种基于大数据的用电负荷预测方法及系统 | |
CN103793788B (zh) | 一种有序用电管理方法 | |
CN106443244A (zh) | 用电设备类型辨识方法和系统 | |
CN110610121B (zh) | 基于曲线聚类的小时级源荷功率异常数据辨识与修复方法 | |
CN112149873A (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
García Valverde et al. | Water demand estimation and outlier detection from smart meter data using classification and Big Data methods | |
CN110046152A (zh) | 一种处理用电数据缺失值的方法 | |
CN114155072B (zh) | 基于大数据分析的财务预测模型构建方法及系统 | |
CN111177128B (zh) | 基于改进的离群点检测算法的计量大数据批量处理方法及系统 | |
CN106951993A (zh) | 一种电能量数据预估方法 | |
CN107834551A (zh) | 一种基于支持向量机的配电网低电压预测方法 | |
CN110968703B (zh) | 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统 | |
CN108230183A (zh) | 一种基于时标量测的电网设备多维度综合告警的处理方法 | |
CN107590747A (zh) | 基于综合能源大数据分析的电网资产周转率计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |