CN110781177A - 一种电能表用电信息整理方法、装置及可读存储介质 - Google Patents
一种电能表用电信息整理方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN110781177A CN110781177A CN201911106207.6A CN201911106207A CN110781177A CN 110781177 A CN110781177 A CN 110781177A CN 201911106207 A CN201911106207 A CN 201911106207A CN 110781177 A CN110781177 A CN 110781177A
- Authority
- CN
- China
- Prior art keywords
- data
- electric energy
- energy meter
- utilization information
- missing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000004140 cleaning Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 31
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 3
- 238000007596 consolidation process Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Manufacturing & Machinery (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电能表用电信息整理方法、装置及可读存储介质,所述方法包括如下步骤:获取电能表的运行用电信息,并基于所述运行用电信息进行整合以获得用电信息库;基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理。本发明方法通过基于用电信息库的特征指标对用电信息库的电能表数据进行清洗以完成整理,采用特征指标进行数据清洗,提高了电能表数据的可用性。
Description
技术领域
本发明涉及电能表技术领域,特别是一种电能表用电信息整理方法、装置及可读存储介质。
背景技术
随着电力系统的不断发展,供区不断扩大,计量点迅速增加,现有电能计量装置运行管理方式的问题日益突出。电能计量装置是计量供电部门销售和用户使用电能多少的设备,是供用电双方贸易结算的法律依据,其计量结果直接关系到双方贸易结算是否公平公正合理,直接关系到双方的经济利益。随着电网设备技术水平的不断提升,用户对电能质量要求的不断提高,电能计量装置的科学可靠准确,越来越成为电网保障安全生产、维护用户合法权益、提高优质服务水平的重要工作内容。
随着智能电表的普及,公司已经积累了海量的用采数据,但空值、错误、冗余、格式不符合,数据不一致等异动数据普遍存在,用采数据质量成为了困扰进一步深入分析挖掘量测数据的瓶颈。海量的智能电表的管理、监测、轮换带来了巨大的人力物力投入,且运行效率有待提升。电能表状态评价仍然停留在传统的专家打分、权重模型阶段,缺乏科学性和智能化管理手段,电能表大多采用周期性轮换,存在浪费且质量管理水平不高。
发明内容
有鉴于现有技术的上述缺陷,本发明的目的就是提供一种电能表用电信息整理方法、装置及可读存储介质,用以实现电能表用电信息的整理和清洗,提高数据的可用性。
本发明的目的之一是通过这样的技术方案实现的,一种电能表用电信息整理方法,所述方法包括如下步骤:
获取电能表的运行用电信息,并基于所述运行用电信息进行整合以获得用电信息库;
基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理。
可选的,获取电能表的运行用电信息,包括:
从不同的业务系统获取多项关联数据;
基于所述运行用电信息进行整合以获得用电信息库,包括:
按照多项关联数据的属性进行整合以获得用电信息库。
可选的,基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理,包括:
根据业务知识判定所述用电信息库中的数据的合理性以完成数据一致性检查;
对不满足数据一致性的数据进行异常处理以完成整理。
可选的,对不满足数据一致性的数据进行异常处理以完成整理,包括:
在数据一致性检查判定为数据缺失的情况下,对电能表的特征指标的缺失值的比例进行统计;
根据缺失比例统计结果进行对应的数据处理。
可选的,根据缺失比例统计结果进行对应的数据处理,包括:
筛选包含数据缺失的电能表样本,在所述电能表样本中的特征指标的缺失值比例超过第一阈值的情况下,将对应的电能表样本删除;以及,
在所述电能表样本中的特征指标的缺失值比例超过第二阈值的情况下,将对应的电能表样本对应的缺失特征指标删除。
可选的,根据缺失比例统计结果进行对应的数据处理,还包括:
在所述电能表样本中的特征指标的缺失值比例未超过第二阈值的情况下,判断缺失值得类型:
在缺失值类型为数值型的情况下,对缺失值进行数值填充;
在缺失值类型为非数值的情况下,通过类型最多的值进行填充或通过各个类型值随机选择进行填充。
可选的,对不满足数据一致性的数据进行异常处理以完成整理,还包括:
删除电能表样本中重复记录的特征指标。
可选的,对不满足数据一致性的数据进行异常处理以完成整理,还包括:
根据所述业务知识对不符合业务规则的异常特征指标进行删除或通过正常的特征值进行替换;以及,
删除存在明显错误的异常特征指标。
本发明的目的之二是通过这样的技术方案实现的,一种电能表用电信息整理装置,所述装置包括:
采集模块,用于获取电能表的运行用电信息;
整合模块,用于基于所述运行用电信息进行整合以获得用电信息库;
数据处理模块,用于基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理。
本发明的目的之三是通过这样的技术方案实现的,一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现前述的方法的步骤。
由于采用了上述技术方案,本发明具有如下的优点:本发明方法通过基于用电信息库的特征指标对用电信息库的电能表数据进行清洗以完成整理,采用特征指标进行数据清洗,提高了电能表数据的可用性。进一步还可以利用整理和清洗后的电能表数据建立新的计量生产管理模式。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。
附图说明
本发明的附图说明如下:
图1为本发明第一实施例流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例一
本发明第一实施例提出一种电能表用电信息整理方法,如图1所示,所述方法包括如下步骤:
获取电能表的运行用电信息,并基于所述运行用电信息进行整合以获得用电信息库;
基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理。
本发明方法通过基于用电信息库的特征指标对用电信息库的电能表数据进行清洗以完成整理,采用特征指标进行数据清洗,提高了电能表数据的可用性。
可选的,获取电能表的运行用电信息,包括:
从不同的业务系统获取多项关联数据;
基于所述运行用电信息进行整合以获得用电信息库,包括:
按照多项关联数据的属性进行整合以获得用电信息库。
具体的在本实施例中,从不同的业务系统获取多项关联数据,例如,基于电能表运行状态关联性,从用电采集系统、SG186营销业务系统、MDS生产调度平台等不同业务系统遴选多项关联数据,按电能表数据项的性质,整合形成电能表用电信息库,包括到货检定,运行监测和拆回分拣数据,分为非时序数据、时序数据和资产数据,其中时序数据是对电能表开展状态评价的基础数据。
在本实施例中,电能表用电信息库的数据来源为电能表用电信息采集系统、SG186营销业务系统数据项、MDS生产调度平台,其中:
用电信息采集系统:包含电能表信息、日总加组功率曲线、日测量点功率因数/功率/总电能示数值/电压/电流曲线、月冻结最大需量及发生时间、月冻结电能示数、异常分析数据。
SG186营销业务系统:包含客户、计量点、电能表、电能表周期检验数据、电能表轮换数据、电能表故障数据、表龄库龄数据。
MDS生产调度平台:包含招标到货批次、室内检定数据、故障表数据、拆回检定数据。
可选的,基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理,包括:
根据业务知识判定所述用电信息库中的数据的合理性以完成数据一致性检查;
对不满足数据一致性的数据进行异常处理以完成整理。
本实施例中主要进行数据清洗,在一种可选的实施方式中,数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛掉与挖掘主题无关的数据,处理缺失值、异常值等。
具体的说,在本实施例中,数据一致检查:根据业务知识来判断数据的合理性,数据取值范围,各个变量之间的关系判断等,并发现非一致性数据,进行处理。
可选的,在本发明一个可选的实施例中,对不满足数据一致性的数据进行异常处理以完成整理,包括:
在数据一致性检查判定为数据缺失的情况下,对电能表的特征指标的缺失值的比例进行统计;
根据缺失比例统计结果进行对应的数据处理。
可选的,在本发明一个可选的实施例中,根据缺失比例统计结果进行对应的数据处理,包括:
筛选包含数据缺失的电能表样本,在所述电能表样本中的特征指标的缺失值比例超过第一阈值的情况下,将对应的电能表样本删除;以及,
在所述电能表样本中的特征指标的缺失值比例超过第二阈值的情况下,将对应的电能表样本对应的缺失特征指标删除。
具体的说,本方案为缺失值处理,在本实施例中用电信息库包含了数量中多的电能表的数据,而用电信息库保存有对应的电能表的数据,例如以用电信息库包含1万块电能表的数据为例,对于任一电能表样本,该样本中包含有多个该电能表对应的特征指标。
对于数据存在的部分缺失值,需要对缺失值进行处理,首先对电能表的所有变量(特征指标)的缺失值进行总体评估,对各个变量的缺失比例进行统计,再分情况对缺失值进行处理,包括:
(1)筛选样本,若样本的特征变量缺失较多,则直接删除该样本,则上述方法进一步可描述为,例如在1万块电能表样本中筛选出200个电能表存在特征指标缺失,例如某个样本有10个特征变量,其中有6个变量缺失,那么考虑删除该样本。
(2)在(1)的基础上,某个缺失值样本占比达到第二阈值例如50%以上,则进一步将该变量移除,弃用该变量。
可选的,在本发明一个可选的实施例中,根据缺失比例统计结果进行对应的数据处理,还包括:
在所述电能表样本中的特征指标的缺失值比例未超过第二阈值的情况下,判断缺失值得类型:
在缺失值类型为数值型的情况下,对缺失值进行数值填充;
在缺失值类型为非数值的情况下,通过类型最多的值进行填充或通过各个类型值随机选择进行填充。
进一步,在前述实施例的基础上,还包括:
(3)对于某个变量存在少量的缺失值,那么需要对缺失值进行填充,当缺失变量为数值型时,可以通过均值,中位数,众数等方式进行填充。
当缺失值为非数值型时,为类型变量时,则使用类型最多的值进行填充或各个类型值随机选择进行填充。
可选的,对不满足数据一致性的数据进行异常处理以完成整理,还包括:
删除电能表样本中重复记录的特征指标。
具体的,本实施例进行重复值剔除,包括:部分记录可能存在重复入库,若记录相同则需要对重复记录剔除,对各个变量下对应电能表的重复记录剔除。
可选的,在本发明又一个可选的实施例中,对不满足数据一致性的数据进行异常处理以完成整理,还包括:
根据所述业务知识对不符合业务规则的异常特征指标进行删除或通过正常的特征值进行替换;以及,
删除存在明显错误的异常特征指标。
具体的,本实施例进行异常值处理:业务数据中存在部分的错误数据或异常数据,对错误数据进行剔除,以及对异常数据剔除等。主要处理方式如下:
(1)根据业务知识对异常数据进行处理,对不合业务规则和不满足业务条件的样本进行剔除或特征值替换。
(2)明显错误数据进行剔除,例如数值型的变量,但存在字符型数据;未定义的值出现在变量中等。
综上,本发明采用删除记录、数据插补和不处理进行缺失值的处理。采用删除异常值记录、平均值修正等方式进行异常值处理。采用实体识别和冗余属性识别进行数据集成。通过基于用电信息库的特征指标对用电信息库的电能表数据进行清洗以完成整理,采用特征指标进行数据清洗,提高了电能表数据的可用性。
另一方面,市场化售电环境下,建立差异化客户服务体系,提高服务水平,增强客户粘性,也要求把握客户用电特征,提出针对性服务策略。因此,需要基于用电信息采集数据,建立智能化算法模型,分析用电行为特征,支撑需求侧双向互动、能源互联网交互。
实施例二
本发明的目的之二是通过这样的技术方案实现的,一种电能表用电信息整理装置,所述装置包括:
采集模块,用于获取电能表的运行用电信息;
整合模块,用于基于所述运行用电信息进行整合以获得用电信息库;
数据处理模块,用于基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理。
本发明方法通过基于用电信息库的特征指标对用电信息库的电能表数据进行清洗以完成整理,采用特征指标进行数据清洗,提高了电能表数据的可用性。
实施例三
本发明的目的之三是通过这样的技术方案实现的,一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现第一实施例的方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的保护范围之内。
Claims (10)
1.一种电能表用电信息整理方法,其特征在于,所述方法包括如下步骤:
获取电能表的运行用电信息,并基于所述运行用电信息进行整合以获得用电信息库;
基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理。
2.如权利要求1所述的方法,其特征在于,获取电能表的运行用电信息,包括:
从不同的业务系统获取多项关联数据;
基于所述运行用电信息进行整合以获得用电信息库,包括:
按照多项关联数据的属性进行整合以获得用电信息库。
3.如权利要求2所述的方法,其特征在于,基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理,包括:
根据业务知识判定所述用电信息库中的数据的合理性以完成数据一致性检查;
对不满足数据一致性的数据进行异常处理以完成整理。
4.如权利要求3所述的方法,其特征在于,对不满足数据一致性的数据进行异常处理以完成整理,包括:
在数据一致性检查判定为数据缺失的情况下,对电能表的特征指标的缺失值的比例进行统计;
根据缺失比例统计结果进行对应的数据处理。
5.如权利要求4所述的方法,其特征在于,根据缺失比例统计结果进行对应的数据处理,包括:
筛选包含数据缺失的电能表样本,在所述电能表样本中的特征指标的缺失值比例超过第一阈值的情况下,将对应的电能表样本删除;以及,
在所述电能表样本中的特征指标的缺失值比例超过第二阈值的情况下,将对应的电能表样本对应的缺失特征指标删除。
6.如权利要求5所述的方法,其特征在于,根据缺失比例统计结果进行对应的数据处理,还包括:
在所述电能表样本中的特征指标的缺失值比例未超过第二阈值的情况下,判断缺失值得类型:
在缺失值类型为数值型的情况下,对缺失值进行数值填充;
在缺失值类型为非数值的情况下,通过类型最多的值进行填充或通过各个类型值随机选择进行填充。
7.如权利要求3所述的方法,其特征在于,对不满足数据一致性的数据进行异常处理以完成整理,还包括:
删除电能表样本中重复记录的特征指标。
8.如权利要求3所述的方法,其特征在于,对不满足数据一致性的数据进行异常处理以完成整理,还包括:
根据所述业务知识对不符合业务规则的异常特征指标进行删除或通过正常的特征值进行替换;以及,
删除存在明显错误的异常特征指标。
9.一种电能表用电信息整理装置,所述装置包括:
采集模块,用于获取电能表的运行用电信息;
整合模块,用于基于所述运行用电信息进行整合以获得用电信息库;
数据处理模块,用于基于所述用电信息库的特征指标对所述用电信息库的电能表数据进行清洗以完成整理。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911106207.6A CN110781177A (zh) | 2019-11-13 | 2019-11-13 | 一种电能表用电信息整理方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911106207.6A CN110781177A (zh) | 2019-11-13 | 2019-11-13 | 一种电能表用电信息整理方法、装置及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110781177A true CN110781177A (zh) | 2020-02-11 |
Family
ID=69390789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911106207.6A Pending CN110781177A (zh) | 2019-11-13 | 2019-11-13 | 一种电能表用电信息整理方法、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110781177A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111626586A (zh) * | 2020-05-21 | 2020-09-04 | 广西电网有限责任公司 | 数据质量检测方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108663651A (zh) * | 2018-05-04 | 2018-10-16 | 国网上海市电力公司 | 一种基于多源数据融合的智能电能表运行状态评价系统 |
CN109783552A (zh) * | 2018-11-28 | 2019-05-21 | 中国电力科学研究院有限公司 | 一种数据清洗修复方法 |
CN109884576A (zh) * | 2019-04-01 | 2019-06-14 | 国网宁夏电力有限公司电力科学研究院 | 一种电能表状态检验方法 |
CN110175167A (zh) * | 2019-05-10 | 2019-08-27 | 国网天津市电力公司电力科学研究院 | 一种适用于低压台区用电数据的数据清洗方法及系统 |
-
2019
- 2019-11-13 CN CN201911106207.6A patent/CN110781177A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108663651A (zh) * | 2018-05-04 | 2018-10-16 | 国网上海市电力公司 | 一种基于多源数据融合的智能电能表运行状态评价系统 |
CN109783552A (zh) * | 2018-11-28 | 2019-05-21 | 中国电力科学研究院有限公司 | 一种数据清洗修复方法 |
CN109884576A (zh) * | 2019-04-01 | 2019-06-14 | 国网宁夏电力有限公司电力科学研究院 | 一种电能表状态检验方法 |
CN110175167A (zh) * | 2019-05-10 | 2019-08-27 | 国网天津市电力公司电力科学研究院 | 一种适用于低压台区用电数据的数据清洗方法及系统 |
Non-Patent Citations (1)
Title |
---|
林一帆: "基于机器学习的信用评分模型研究"", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111626586A (zh) * | 2020-05-21 | 2020-09-04 | 广西电网有限责任公司 | 数据质量检测方法、装置、计算机设备和存储介质 |
CN111626586B (zh) * | 2020-05-21 | 2023-10-31 | 广西电网有限责任公司 | 数据质量检测方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107239891B (zh) | 一种基于大数据的招投标审核方法 | |
CN102789618B (zh) | 生成市场景气指数的监测系统及方法 | |
CN112730938A (zh) | 一种基于用电采集大数据的窃电用户判断方法 | |
CN113051147A (zh) | 一种数据库集群的监控方法、装置、系统、以及设备 | |
CN108389069A (zh) | 基于随机森林和逻辑回归的优质客户识别方法及装置 | |
CN112308462A (zh) | 电力用户分类方法及装置 | |
CN108364191A (zh) | 基于随机森林和逻辑回归的优质客户优化识别方法及装置 | |
CN113516192A (zh) | 一种用户用电异动识别方法、系统、装置及存储介质 | |
CN111062620A (zh) | 基于混合计费数据的电力计费公平性智能分析系统及方法 | |
CN110781177A (zh) | 一种电能表用电信息整理方法、装置及可读存储介质 | |
CN109766333A (zh) | 数据空值处理方法、装置及终端设备 | |
CN111966733A (zh) | 热点知识生成方法及装置 | |
CN111882289A (zh) | 一种项目数据审核指标区间测算的装置和方法 | |
CN110852621A (zh) | 电力客户负荷特性分析及分类方法、装置及可读存储介质 | |
CN115687788A (zh) | 一种智能化商机推荐方法和系统 | |
CN115689713A (zh) | 异常风险数据处理方法、装置、计算机设备和存储介质 | |
CN110969379A (zh) | 一种替代物料的筛选方法及相关装置 | |
CN112232945B (zh) | 一种确定个人客户授信的方法及装置 | |
CN114510462A (zh) | 软件研发效能的度量方法、平台、系统、设备和介质 | |
CN114519620A (zh) | 基于物联网的电商运营管理系统和方法 | |
CN113326254A (zh) | 一种调研数据清洗方法及系统 | |
CN113393169A (zh) | 基于大数据技术的金融行业交易系统性能指标分析方法 | |
CN105574171A (zh) | 一种客户感知价值的监测方法及监测系统 | |
CN111967671A (zh) | 基于支持向量数据域描述的跨境活跃用户识别方法及装置 | |
CN112488572B (zh) | 一种审计对象推荐方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200211 |
|
RJ01 | Rejection of invention patent application after publication |