CN113297744A - 一种适用于误差监测计算的充电桩数据清洗方法及充电站 - Google Patents
一种适用于误差监测计算的充电桩数据清洗方法及充电站 Download PDFInfo
- Publication number
- CN113297744A CN113297744A CN202110589556.9A CN202110589556A CN113297744A CN 113297744 A CN113297744 A CN 113297744A CN 202110589556 A CN202110589556 A CN 202110589556A CN 113297744 A CN113297744 A CN 113297744A
- Authority
- CN
- China
- Prior art keywords
- data
- charging pile
- charging
- cleaning
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004140 cleaning Methods 0.000 title claims abstract description 91
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004364 calculation method Methods 0.000 title claims abstract description 33
- 238000012544 monitoring process Methods 0.000 title claims abstract description 21
- 238000012937 correction Methods 0.000 claims abstract description 22
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000002159 abnormal effect Effects 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 18
- 238000005259 measurement Methods 0.000 claims description 12
- 230000005611 electricity Effects 0.000 claims description 10
- 230000001174 ascending effect Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000010348 incorporation Methods 0.000 claims description 2
- 238000013139 quantization Methods 0.000 abstract description 22
- 238000004458 analytical method Methods 0.000 abstract description 10
- 238000012795 verification Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 230000005856 abnormality Effects 0.000 abstract 1
- 238000007405 data analysis Methods 0.000 description 11
- 238000005406 washing Methods 0.000 description 8
- 238000013499 data model Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000007596 consolidation process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J7/00—Circuit arrangements for charging or depolarising batteries or for supplying loads from batteries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/04—Power grid distribution networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Geometry (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Power Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种适用于误差监测计算的充电桩数据清洗方法及充电站,属于充电桩数据处理技术领域。本发明的一种适用于误差监测计算的充电桩数据清洗方法,包括以下步骤:第一步,对需求进行分析;第二步,获取需要清洗的充电桩数据;第三步,调用异常检测模型进行预处理;第四步,结合数据的分布曲线,确定数据的清洗规则;第五步,对预处理后的数据进行二次清洗与修正,得到修正数据;第六步,分析结果,验证经过修正数据是否符合预期要求。本发明对充电桩数据,进行需求分析、预处理、确定清洗规则、二次清洗与修正、分析验证;并结合数据合并方法,有效解决充电桩数据中存在的量化噪声和时延噪声等问题,进而有效提升清洗后的数据质量。
Description
技术领域
本发明涉及一种适用于误差监测计算的充电桩数据清洗方法及充电站,属于充电桩数据处理技术领域。
背景技术
数据清洗是整个数据分析过程中不可缺少的一个环节,在实际操作中,数据清洗通常会占据数据分析过程的50%-80%的时间。其结果质量直接关系到模型效果和最终结论。
传统的数据清洗方法主要包括缺失值清洗、噪声数据清洗、不一致数据的清洗和重复数据的清洗。其中,针对噪声数据的处理方法有分箱法,聚类法等。
但充电桩数据存在量化噪声和时延噪声。
量化噪声主要是电能表数字化量化噪声导致。比如采集电能表综合倍率为200,读数数据保留2位小数,则电量(两读数之差)的最大量化误差位0.01,量化噪声为2;如果保留4位有效数字,则量化误差应该为电能表常数决定,比如常数为1000,则最大量化误差位0.001,量化噪声为0.2。
同时,充电桩内总表与分表的高频数据采集时间可能并不完全绝对一致,会存在时钟偏差,这也就给充电桩数据引入了时延噪声。
传统的数据清洗方法并不能有效解决充电桩数据中存在的量化噪声和时延噪声等问题,导致清洗后的数据质量不高,影响后续的数据分析。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种能够有效解决充电桩数据中存在的量化噪声和时延噪声等问题,有效提升清洗后的数据质量,能够满足数据分析要求的适用于误差监测计算的充电桩数据清洗方法及充电站。
为实现上述目的,本发明的技术方案为:
一种适用于误差监测计算的充电桩数据清洗方法,
包括以下步骤:
第一步,对需求进行分析,明确数据的作用域与运用环境,确定有效的充电桩数据格式;
第二步,按照第一步中的充电桩数据格式,获取需要清洗的充电桩数据;
第三步,对第二步中获取的充电桩数据调用异常检测模型进行预处理;
所述异常检测模型,用以剔除因异常故障产生的无效数据;
所述异常故障包括充电设备故障或/和TCU故障或/和违规拔枪或/和BMS通信异常故障;
第四步,对第三步预处理完成的数据进行分析,结合数据的分布曲线,确定数据的清洗规则;所述数据的清洗规则包括数据合并方式以及合并单位;
第五步,根据第四步中确定的清洗规则,对预处理后的数据进行二次清洗与修正,得到修正数据;
第六步,基于原始数据和第五步中二次清洗和修正完成的修正数据进行盲测模型求解,分析结果,验证经过修正数据是否符合预期要求;
若不符合任务要求,重新确定清洗规则,再次进行二次清洗与修正过程,并重新对修正数据进行分析验证,直到修正数据符合预期要求。
本发明经过不断探索以及试验,对充电桩数据,进行需求分析、预处理、确定清洗规则、二次清洗与修正、分析验证;并结合数据合并方法,有效解决充电桩数据中存在的量化噪声和时延噪声等问题,进而有效提升清洗后的数据质量,满足数据分析要求。
进一步,本发明方案简单实用,计算量小,便于编程实现。
作为优选技术措施:
所述第一步中,
充电桩数据具体包括:充电站档案信息、充电桩档案信息、充电枪档案信息、电能表档案信息、用电时序数据;
充电站档案信息包括充电站运行状态、充电站名称;
充电桩档案信息包括充电桩ID、充电桩编号、充电桩类型;
充电枪档案信息包括充电枪ID、充电枪类型;
电能表档案信息包括电能表ID、倍率;
用电时序数据包括采集时间、电流、电压、功率、电量;
同时明确充电站、充电桩、充电枪、电能表之间的关联关系。
作为优选技术措施:
所述第三步中,
异常检测模型为正态分布2sigma原则或四分差IQR或孤立森林算法,其对数据异常情况进行检测,考虑到充电桩数据高频采集的特性,数据量足够大,并对检测出的无效数据直接删除。
作为优选技术措施:
所述第四步中,
数据的清洗规则为采用按小时合并或/和滑动窗口合并(窗口大小设置为4),实现对充电桩数据二次清洗与修正的目的。
作为优选技术措施:
按小时合并的具体方法为:对预处理后的数据,按照日期时间升序排列;对日期时间这一列的数据切分,生成两个新的字段:年:月:日时:分,秒;
然后,对于每个电表,针对年:月:日时:分这一字段取值相同的数据累加合并,得到新的按小时合并后的数据,即得到二次清洗与修正后的修正数据。
作为优选技术措施:
按滑动窗口合并的具体方法:对预处理后的数据,按照日期时间升序排列;窗口大小为N,对于每个电表,每N个相邻的数据累加合并,得到新的按滑动窗口合并后的数据,即得到二次清洗与修正后的修正数据。
优选的,所述N为4。
作为优选技术措施:
所述第五步中,
清洗规则的不同作用于相同的充电桩数据所得到的结果会有差异;
验证修正数据,若误差较大,则需要重新选择清洗规则,再次进行二次清洗与修正。
作为优选技术措施:
所述第六步中,
盲测模型求解具体包括以下内容:
通过某块电能表运行数据的等比例调整,该块电能表的运行误差会产生一定量的变化;将等比例调整后的数据替换该电能表原始数据,则得到该充电站关于该电能表的误差盲测数据;
将盲测数据代入误差计算模型,得到该电能表关于误差盲测数据的计量误差,对比运行误差变化量比例,得到盲测模型对于该电能表运行误差变化的检出灵敏度;
对比分析二次清洗与修正前后盲测模型灵敏度(准确度),验证经过清洗后的修正数据是否符合预期要求;
所述预期要求为数据的计算误差在+5%~-5%之间。
通过数据模拟人为注入+5%/-5%的计量误差,对电能表运行数据进行+5%/-5%等比例调整,将调整后的数据代入模型求解,理想求解结果约为-5%/+5%,验证经过清洗后的数据是否符合预期理想求解结果。
作为优选技术措施:
所述误差计算模型的能量关系为:
充电站总表供电量=∑充电桩分表用电量+充电站固定损耗
其中,充电站固定损耗包括充电桩显示和通信设备、输电线路损耗;
上述能量关系的计算公式为:
其中:y表示充电站总表的供电量,p表示充电桩的个数,φj表示充电桩分表的用电量计量值,ε0表示充电站内固定损耗,εj表示第j个充电桩分表的计量点误差;
作为优选技术措施:
一种具有充电桩数据清洗设备的充电站,
包括至少一个充电桩、充电桩数据清洗设备;
所述充电桩设有至少一个充电枪;
所述充电桩数据清洗设备装配一个或多个处理器以及存储装置;
所述存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的一种适用于误差监测计算的充电桩数据清洗方法。
与现有技术相比,本发明具有以下有益效果:
本发明经过不断探索以及试验,对充电桩数据,进行需求分析、预处理、确定清洗规则、二次清洗与修正、分析验证;并结合数据合并方法,有效解决充电桩数据中存在的量化噪声和时延噪声等问题,进而有效提升清洗后的数据质量,满足数据分析要求。
进一步,本发明方案简单实用,计算量小,便于编程实现。
附图说明
图1为本发明流程示图;
图2为本发明一种实施例的原始数据分布图;
图3为本发明按小时合并之后的数据分布图;
图4为本发明移成异常点的数据分布图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本发明。本文所使用的术语“或/和”包括一个或多个相关的所列项目的任意的和所有的组合。
如图1所示,一种适用于误差监测计算的充电桩数据清洗方法,包括以下步骤:
第一步,对需求进行分析,明确数据的作用域与运用环境,确定有效的充电桩数据格式;
第二步,按照第一步中的充电桩数据格式,获取需要清洗的充电桩数据;
第三步,对第二步中获取的充电桩数据调用异常检测模型进行预处理;
所述异常检测模型,用以剔除因异常故障产生的无效数据;
所述异常故障包括充电设备故障或/和TCU故障或/和违规拔枪或/和BMS通信异常故障;
第四步,对第三步预处理完成的数据进行分析,结合数据的分布曲线,确定数据的清洗规则;所述数据的清洗规则包括数据合并方式以及合并单位;
第五步,根据第四步中确定的清洗规则,对预处理后的数据进行二次清洗与修正,得到修正数据;
第六步,基于原始数据和第五步中二次清洗和修正完成的修正数据进行盲测模型求解,分析结果,验证经过修正数据是否符合预期要求;
若不符合任务要求,重新确定清洗规则,再次进行二次清洗与修正过程,并重新对修正数据进行分析验证,直到修正数据符合预期要求。
本发明经过不断探索以及试验,对充电桩数据,进行需求分析、预处理、确定清洗规则、二次清洗与修正、分析验证;并结合数据合并方法,有效解决充电桩数据中存在的量化噪声和时延噪声等问题,进而有效提升清洗后的数据质量,满足数据分析要求。
进一步,本发明方案简单实用,计算量小,便于编程实现。
本发明的一种最佳实施例:
一种适用于误差监测计算的充电桩数据清洗方法,包括如下清洗步骤:
1)分析数据的作用域与运用环境,明确有效的充电桩数据格式。具体包括为:充电站档案信息如充电站ID、充电站运行状态、充电站名称等;充电桩档案信息如充电桩ID、充电桩编号、充电桩类型等,充电枪档案信息如充电枪ID、充电枪类型等,电能表档案信息如电能表ID、倍率等;用电时序数据如采集时间、电流、电压、功率、电量等;具体的还需要明确充电站、充电桩、充电枪、电能表之间的关联关系。
2)采集需要清洗的充电桩数据。
3)调用异常检测算法,如2sigma,IQR,孤立森林等对数据异常情况进行检测,直接删除除由充电设备故障、TCU故障、违规拔枪、BMS通信异常故障等原因产生的无效数据。
4)通过数据分析技术,结合数据的分布曲线图,确定数据合并方式,合并单位。本发明中采用按小时和滑动窗口(窗口大小设置为4)两种方式合并数据,实现对充电桩数据二次清洗的目的。
5)根据确定的清洗规则,对预处理后的数据进行二次清洗。不同的清洗规则作用于相同的数据集所得到的效果不尽相同。分许清洗后的结果,若结果不尽人意,则可能需要重新选择清洗规则,再次清洗。
6)通过数据分析技术,分别基于原始数据和清洗后数据构建能量守恒方程,形如:
其中:y表示充电站总表的供电量,p表示充电桩的个数,φj表示第j个充电桩分表的用电量计量值,ε0表示充电站内固定损耗,εj表示第j个充电桩分表的计量点误差。
也即是:
通过某块电能表运行数据的等比例调整,该块电能表的运行误差会产生一定量的变化。将等比例调整后的数据替换该电能表原始数据,则得到该充电站关于该电能表的误差盲测数据,将盲测数据代入误差计算模型,得到该电能表关于盲测数据的计量误差,对比运行误差变化量比例,可得到模型对于该电能表运行误差变化的检出灵敏度。
对比分析二次清洗前后模型盲测灵敏度,如我们通过数据模拟人为注入+5%/-5%的计量误差,对电能表运行数据进行+5%/-5%等比例调整,将调整后的数据代入模型求解,理想求解结果约为-5%/+5%,验证经过清洗后的数据是否符合预期理想求解结果。
应用本发明的一种实施例:针对浙江银泰城充电站的数据进行清洗。
一般充电桩内总表倍率和分表倍率相差较大。以浙江银泰城充电站为例,银泰城充电站共九个充电桩,九块交流分表,一块交流总表。
一块交流总表,九块交流分表,电表数据从2020-04-01 00:00:00到2020-05-1914:30:00,每15分钟一次读数。总表缺失04-29到05-07时段数据,各个分表缺失各有不同。首先,对原始的充电桩数据进行预处理工作,删除缺失值以及非公共时段数据。最终,共3824个时段,所有电表都有读数,数据分布参见图2所示。
其中,总表倍率为240,其余分表倍率为1,各电表读数保留2位小数。总表电量(两读数之差)的最大量化误差位0.01,量化噪声为2.4,分表电量(两读数之差)的最大量化误差位0.01,量化噪声为0.01.当在采集时间段内各分表用电量之和小于2.4,此时总表计量数据就不会发生变化,根据总表计量数据,该时间段内总表用电量为0。根据实际采集数据,2020-04-01 05:15:00至2020-04-01 05:30:00,总表计量数据均为4391.69,用电量为0,该15分钟内各分表用电量之和为0.57,小于2.4,此时线损为-0.57,该时段内分表用电量数据就会叠加到下一时刻总表计量上,这时也就产生了时延噪声。
当对数据采用按小时和滑动窗口(窗口大小设置为4)合并数据时,如对2020-04-01 05:00:00至2020-04-01 06:00:00这一个小时的数据进行合并,2020-04-01 05:15:00至2020-04-01 05:30:00由于量化噪声和时延噪声对计量数据产生的影响就会消除,也即是整个合并时间区间内由于量化噪声和时延噪声对计量数据产生的影响就会得到有效解决,在一定程度上解决了量化噪声和时延噪声的影响。
观察数据分布图,发现数据点绝对值较大时经常是成对出现的,分析是总表与分表的高频读数的时间可能并不完全一致引起的。这里针对上述预处理后的3824个时段的数据做二次清洗。
这里,本发明选择按小时和滑动窗口(窗口大小为4)对数据进行合并。由于已有数据是15分钟采集一次的高频数据,所以按小时合并和滑动窗口(窗口大小为4)合并两种方式效果差别不大。
其中,按小时具体的合并方式为:对上述预处理后的数据,按照日期时间升序排列;切分日期这一列的数据生成两个新的字段:年:月:日时:分,秒。然后,对于每个电表,针对年:月:日时:分这一字段取值相同的数据累加合并,得到新的按小时合并后的数据,也即是得到二次清洗后的数据。之后的具体的数据分析建模工作就可以基于二次清洗后的数据来进行。
其中,按滑动窗口(窗口大小为4)具体的合并方式为:对上述预处理后的数据,按照日期时间升序排列;然后对于每个电表,对4个相邻的数据累加合并,得到新的按滑动窗口合并后的数据,也即是得到二次清洗后的数据。之后的具体的数据分析建模工作就可以基于二次清洗后的数据来进行,其中按小时合并之后,数据分布参见图3。
简单移除绝对值大于10的异常点,最终,数据分布参见图4。
分别将原始数据和二次合并清洗后的数据,模型求解盲测,结果下表1。
表1
其中,raw表示原始数据模型盲测结果,hour表示按小时合并后数据模型盲测结果,slide_4表示按滑动窗口(窗口大小为4)数据模型盲测结果,如下表2所示。
表2
其中,raw表示原始数据模型盲测结果,hour表示按小时合并后数据模型盲测结果,slide_4表示按滑动窗口(窗口大小为4)数据模型盲测结果。
根据盲测结果来看,基于二次合并清洗后的数据,模型计算结果更显著,效果更好。
以上,就是本发明通过基于时间单位和滑动窗口合并数据的方法,可以有效减少量化噪声的影响,同时在一定程度上,也能有效减少时延噪声的影响,提高数据质量,进而提高模型的求解精度。
应用本发明方法的一种充电站实施例:
一种具有充电桩数据清洗设备的充电站,其特征在于,
包括至少一个充电桩、充电桩数据清洗设备;
所述充电桩设有至少一个充电枪;
所述充电桩数据清洗设备装配一个或多个处理器以及存储装置;
所述存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的一种适用于误差监测计算的充电桩数据清洗方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,
包括以下步骤:
第一步,对需求进行分析,明确数据的作用域与运用环境,确定有效的充电桩数据格式;
第二步,按照第一步中的充电桩数据格式,获取需要清洗的充电桩数据;
第三步,对第二步中获取的充电桩数据调用异常检测模型进行预处理;
所述异常检测模型,用以剔除因异常故障产生的无效数据;
所述异常故障包括充电设备故障或/和TCU故障或/和违规拔枪或/和BMS通信异常故障;
第四步,对第三步预处理完成的数据进行分析,结合数据的分布曲线,确定数据的清洗规则;所述数据的清洗规则包括数据合并方式以及合并单位;
第五步,根据第四步中确定的清洗规则,对预处理后的数据进行二次清洗与修正,得到修正数据;
第六步,基于原始数据和第五步中二次清洗和修正完成的修正数据进行盲测模型求解,分析结果,验证经过修正数据是否符合预期要求;
若不符合任务要求,重新确定清洗规则,再次进行二次清洗与修正过程,并重新对修正数据进行分析验证,直到修正数据符合预期要求。
2.如权利要求1所述的一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,所述第一步中,
充电桩数据具体包括:充电站档案信息、充电桩档案信息、充电枪档案信息、电能表档案信息、用电时序数据;
充电站档案信息包括充电站运行状态、充电站名称;
充电桩档案信息包括充电桩ID、充电桩编号、充电桩类型;
充电枪档案信息包括充电枪ID、充电枪类型;
电能表档案信息包括电能表ID、倍率;
用电时序数据包括采集时间、电流、电压、功率、电量;
同时明确充电站、充电桩、充电枪、电能表之间的关联关系。
3.如权利要求1所述的一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,所述第三步中,
异常检测模型为正态分布2sigma原则或四分差IQR或孤立森林算法,其对数据异常情况进行检测,考虑到充电桩数据高频采集的特性,数据量足够大,并对检测出的无效数据直接删除。
4.如权利要求1所述的一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,所述第四步中,
数据的清洗规则为采用按小时合并或/和滑动窗口合并,窗口大小设置为4,实现对充电桩数据二次清洗与修正的目的。
5.如权利要求4所述的一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,
按小时合并的具体方法为:对预处理后的数据,按照日期时间升序排列;对日期时间这一列的数据切分,生成两个新的字段:年:月:日时:分,秒;
然后,对于每个电表,针对年:月:日时:分这一字段取值相同的数据累加合并,得到新的按小时合并后的数据,即得到二次清洗与修正后的修正数据。
6.如权利要求4所述的一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,
按滑动窗口合并的具体方法:对预处理后的数据,按照日期时间升序排列;窗口大小为N,对于每个电表,每N个相邻的数据累加合并,得到新的按滑动窗口合并后的数据,即得到二次清洗与修正后的修正数据。
7.如权利要求1所述的一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,所述第五步中,
清洗规则的不同作用于相同的充电桩数据所得到的结果会有差异;
验证修正数据,若误差较大,则需要重新选择清洗规则,再次进行二次清洗与修正。
8.如权利要求1所述的一种适用于误差监测计算的充电桩数据清洗方法,其特征在于,所述第六步中,
盲测模型求解具体包括以下内容:
通过某块电能表运行数据的等比例调整,该块电能表的运行误差会产生一定量的变化;将等比例调整后的数据替换该电能表原始数据,则得到该充电站关于该电能表的误差盲测数据;
将盲测数据代入误差计算模型,得到该电能表关于误差盲测数据的计量误差,对比运行误差变化量比例,得到盲测模型对于该电能表运行误差变化的检出灵敏度;
对比分析二次清洗与修正前后盲测模型灵敏度,验证经过清洗后的修正数据是否符合预期要求;
所述预期要求为数据的计算误差在+5%~-5%之间。
10.一种具有充电桩数据清洗设备的充电站,其特征在于,
包括至少一个充电桩、充电桩数据清洗设备;
所述充电桩设有至少一个充电枪;
所述充电桩数据清洗设备装配一个或多个处理器以及存储装置;
所述存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-9任一所述的一种适用于误差监测计算的充电桩数据清洗方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110589556.9A CN113297744B (zh) | 2021-05-28 | 2021-05-28 | 一种适用于误差监测计算的充电桩数据清洗方法及充电站 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110589556.9A CN113297744B (zh) | 2021-05-28 | 2021-05-28 | 一种适用于误差监测计算的充电桩数据清洗方法及充电站 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113297744A true CN113297744A (zh) | 2021-08-24 |
CN113297744B CN113297744B (zh) | 2023-11-07 |
Family
ID=77325833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110589556.9A Active CN113297744B (zh) | 2021-05-28 | 2021-05-28 | 一种适用于误差监测计算的充电桩数据清洗方法及充电站 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113297744B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116331044A (zh) * | 2023-05-31 | 2023-06-27 | 山东芯演欣电子科技发展有限公司 | 一种用于直流充电桩的充电数据存储系统 |
CN116484805A (zh) * | 2023-05-06 | 2023-07-25 | 国网浙江省电力有限公司 | 结合知识图谱和语义分析的电力报告智能清洗处理方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009216587A (ja) * | 2008-03-11 | 2009-09-24 | Central Res Inst Of Electric Power Ind | 送電線故障箇所標定方法、装置並びにプログラム |
WO2012176723A1 (ja) * | 2011-06-20 | 2012-12-27 | 古野電気株式会社 | Gnss解析装置、gnss解析システム、gnss解析プログラム、及びgnss解析方法 |
CN107665213A (zh) * | 2016-07-29 | 2018-02-06 | 罗晓燕 | 一种电力设备在线数据处理方法 |
CN107679089A (zh) * | 2017-09-05 | 2018-02-09 | 全球能源互联网研究院 | 一种用于电力传感数据的清洗方法、装置和系统 |
CN109801181A (zh) * | 2017-11-17 | 2019-05-24 | 中国电力科学研究院有限公司 | 一种配变数据清洗修补方法及系统 |
US20200081898A1 (en) * | 2017-11-22 | 2020-03-12 | Beijing Kedong Power Control System Co Ltd | A Method for Constructing Electricity Transaction Index System Based on Big Data Technology |
CN111177128A (zh) * | 2019-12-11 | 2020-05-19 | 国网天津市电力公司电力科学研究院 | 基于改进的离群点检测算法的计量大数据批量处理方法及系统 |
CN111382329A (zh) * | 2020-02-17 | 2020-07-07 | 山东外事职业大学 | 一种用于大数据分析的数据挖掘方法及系统 |
AU2020102190A4 (en) * | 2020-09-09 | 2020-10-22 | Chordiya, S. B. Prof.(Dr.) | AML- Data Cleaning: AUTOMATIC DATA CLEANING USING MACHINE LEARNING PROGRAMMING |
CN112527788A (zh) * | 2020-12-17 | 2021-03-19 | 北京中恒博瑞数字电力科技有限公司 | 变压器监测数据异常值检测与清洗的方法及装置 |
CN112527885A (zh) * | 2020-12-23 | 2021-03-19 | 民生科技有限责任公司 | 一种etl中基于规则配置的数据处理的系统和方法 |
CN112667611A (zh) * | 2020-12-23 | 2021-04-16 | 国网江苏省电力有限公司无锡供电分公司 | 一种电动汽车充电行为特征分析方法和系统 |
-
2021
- 2021-05-28 CN CN202110589556.9A patent/CN113297744B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009216587A (ja) * | 2008-03-11 | 2009-09-24 | Central Res Inst Of Electric Power Ind | 送電線故障箇所標定方法、装置並びにプログラム |
WO2012176723A1 (ja) * | 2011-06-20 | 2012-12-27 | 古野電気株式会社 | Gnss解析装置、gnss解析システム、gnss解析プログラム、及びgnss解析方法 |
CN107665213A (zh) * | 2016-07-29 | 2018-02-06 | 罗晓燕 | 一种电力设备在线数据处理方法 |
CN107679089A (zh) * | 2017-09-05 | 2018-02-09 | 全球能源互联网研究院 | 一种用于电力传感数据的清洗方法、装置和系统 |
CN109801181A (zh) * | 2017-11-17 | 2019-05-24 | 中国电力科学研究院有限公司 | 一种配变数据清洗修补方法及系统 |
US20200081898A1 (en) * | 2017-11-22 | 2020-03-12 | Beijing Kedong Power Control System Co Ltd | A Method for Constructing Electricity Transaction Index System Based on Big Data Technology |
CN111177128A (zh) * | 2019-12-11 | 2020-05-19 | 国网天津市电力公司电力科学研究院 | 基于改进的离群点检测算法的计量大数据批量处理方法及系统 |
CN111382329A (zh) * | 2020-02-17 | 2020-07-07 | 山东外事职业大学 | 一种用于大数据分析的数据挖掘方法及系统 |
AU2020102190A4 (en) * | 2020-09-09 | 2020-10-22 | Chordiya, S. B. Prof.(Dr.) | AML- Data Cleaning: AUTOMATIC DATA CLEANING USING MACHINE LEARNING PROGRAMMING |
CN112527788A (zh) * | 2020-12-17 | 2021-03-19 | 北京中恒博瑞数字电力科技有限公司 | 变压器监测数据异常值检测与清洗的方法及装置 |
CN112527885A (zh) * | 2020-12-23 | 2021-03-19 | 民生科技有限责任公司 | 一种etl中基于规则配置的数据处理的系统和方法 |
CN112667611A (zh) * | 2020-12-23 | 2021-04-16 | 国网江苏省电力有限公司无锡供电分公司 | 一种电动汽车充电行为特征分析方法和系统 |
Non-Patent Citations (5)
Title |
---|
刁赢龙;盛万兴;刘科研;何开元;孟晓丽;: "大规模配电网负荷数据在线清洗与修复方法研究", 电网技术, no. 11 * |
娄建楼;胥佳;陆恒;曲朝阳;李韶武;刘瑞华;: "基于功率曲线的风电机组数据清洗算法", 电力系统自动化, no. 10 * |
徐搏超;: "基于参数关联性的电站参数异常点清洗方法", 电力系统自动化, no. 20 * |
李星南;施展;亢中苗;苏卓;: "基于孤立森林算法和BP神经网络算法的电力运维数据清洗方法", 电气应用, no. 16 * |
王行亚,肖先勇,李媛: "基于联合对角化数据分离与筛选的谐波阻抗计算", 电测与仪表 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116484805A (zh) * | 2023-05-06 | 2023-07-25 | 国网浙江省电力有限公司 | 结合知识图谱和语义分析的电力报告智能清洗处理方法 |
CN116484805B (zh) * | 2023-05-06 | 2023-09-15 | 国网浙江省电力有限公司 | 结合知识图谱和语义分析的电力报告智能清洗处理方法 |
CN116331044A (zh) * | 2023-05-31 | 2023-06-27 | 山东芯演欣电子科技发展有限公司 | 一种用于直流充电桩的充电数据存储系统 |
CN116331044B (zh) * | 2023-05-31 | 2023-08-04 | 山东芯演欣电子科技发展有限公司 | 一种用于直流充电桩的充电数据存储系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113297744B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112035784B (zh) | 一种基于用电采集数据确定低压台区的损耗的方法及系统 | |
EP2321657B1 (en) | Improvements in virtual metering | |
CN102377180B (zh) | 基于电能质量监测系统的电力系统负荷建模方法 | |
CN113297744A (zh) | 一种适用于误差监测计算的充电桩数据清洗方法及充电站 | |
CN106569164A (zh) | 一种双芯电能表电量的同步测试方法及系统 | |
CN107832927B (zh) | 基于灰色关联分析法的10kV线路线变关系评价方法 | |
CN106682763B (zh) | 一种用于大量样本数据的电力负荷优化预测方法 | |
CN115267645B (zh) | 一种低功率因数电能表的误差计算方法、监测系统及设备 | |
Müller et al. | Harmonic modeling of electric vehicle chargers in frequency domain | |
Weber et al. | Data-driven copy-paste imputation for energy time series | |
CN114330834A (zh) | 一种基于自更新三次指数平滑法的充电桩用电量预测方法 | |
CN111612371A (zh) | 一种基于层次分析法的智能电表质量评估方法 | |
CN112288594A (zh) | 一种基于实时事件触发的数据质量异动处理方法和系统 | |
CN114265001B (zh) | 一种智能电表计量误差评估方法 | |
CN116933157A (zh) | 一种窃电检测方法 | |
CN108062616A (zh) | 一种具有约束条件的用电异常检测模型 | |
CN109799379B (zh) | 充电检测方法、充电检测装置和插座 | |
CN116384622A (zh) | 基于电力大数据的碳排放监测方法及装置 | |
CN115561697A (zh) | 一种智能电表误差分析方法 | |
CN115374646A (zh) | 在运电表寿命预测方法及在运电表寿命预测装置 | |
CN110717244B (zh) | 基于平均偏离度算法的数据信任度分析计算机仿真方法 | |
CN104133090B (zh) | 三相三线电能表失压时退补电量误差检测方法和系统 | |
CN116136580A (zh) | 一种基于感知设备的线损分级检测方法及装置 | |
CN113743894A (zh) | 一种用于电费账单复核的复核规则模型的建立方法及系统 | |
CN113406555A (zh) | 一种交流充电站的电量计量误差监测方法及充电站 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |