CN109918218A - 一种基于电力收费的错误数据分析方法 - Google Patents
一种基于电力收费的错误数据分析方法 Download PDFInfo
- Publication number
- CN109918218A CN109918218A CN201910078807.XA CN201910078807A CN109918218A CN 109918218 A CN109918218 A CN 109918218A CN 201910078807 A CN201910078807 A CN 201910078807A CN 109918218 A CN109918218 A CN 109918218A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- percentage
- verification
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000007405 data analysis Methods 0.000 title claims abstract description 10
- 238000012795 verification Methods 0.000 claims abstract description 23
- 230000002159 abnormal effect Effects 0.000 claims abstract description 15
- 238000013524 data verification Methods 0.000 claims abstract description 5
- 230000001960 triggered effect Effects 0.000 claims abstract description 5
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 239000013589 supplement Substances 0.000 claims description 3
- 238000007726 management method Methods 0.000 abstract description 21
- 230000005611 electricity Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于电力收费的错误数据分析方法,包括:获取单位时间内的电力收费数据;确定电力收费数据的获取途径,获取途径至少包括从电表设备获取和设备网管获取中的一种;进行数据属性缺失校验,根据获取途径的不同,提取不同来源的数据,形成多个设备的完整数据链,对完整数据链的关键属性完整性进行校验;对经过完整性校验的数据进行数据匹配度校验,判断多个数据来源属性是否一致;当数据分层校验事件被触发后,不同来源的数据由预先设置的重要程度进行可信度分级,分级后对错误信息数据来源进行修正;对修正后的数据进行获取对应的操作日志,判断对应的操作日志的属性信息是否存在异常;剔除错误数据并记录剔除信息。
Description
技术领域
本发明涉及电力收费领域,尤其涉及一种基于电力收费的错误数据分析方法。
背景技术
传统电力行业通过智能电表获取用户的用电数据,通过收费系统进行相应的金额收取;随着网络信息量的增加,海量数据在进行传输发送的过程中会由于网络故障或者数据本身格式等问题出现传输故障,导致传输到收费系统的部分用电数据变成不可识别的错误数据,而用电数据的错误会导致用户的用电计费失常的缺陷,即使这部分数据是极小几率发生的少量数据,但足以给用户或电网企业带来损失。
发明内容
本发明提供了一种基于电力收费的错误数据分析方法,以解决传统的电力收费系统没有对电力数据进行错误数据检测的技术问题,从而对用电数据进行错误数据分析,进而防止用户或电网企业造成损失。
为了解决上述技术问题,本发明实施例提供了一种基于电力收费的错误数据分析方法,包括:
获取单位时间内的电力收费数据;
确定所述电力收费数据的获取途径,所述获取途径至少包括从电表设备获取和设备网管获取中的一种;
进行数据属性缺失校验,根据所述获取途径的不同,对不同的设备提取不同来源的数据,形成多个设备的完整数据链,对所述完整数据链的关键属性完整性进行校验,若校验失败则视为错误数据,若校验成功则视为正常数据;
对经过完整性校验的数据进行数据匹配度校验,判断多个数据来源属性是否一致,若一致则将数据标记为准确数据;若不一致时,则触发数据分层校验事件;
当数据分层校验事件被触发后,不同来源的数据由预先设置的重要程度进行可信度分级,分级后对错误信息数据来源进行修正;
对修正后的数据进行获取对应的操作日志,并判断对应的操作日志的属性信息是否存在异常,若存在异常则确认为错误数据,否则为正常数据;
剔除错误数据并记录剔除信息,实现完成对一个单位时间内的电力数据分析。
作为优选方案,所述对所述完整数据链的关键属性完整性进行校验,至少包括:
判断所述完整数据链中各数据的关键属性是否填写完整,若判断为不完整,则发出属性缺失告警,并记录其来源归属设备和缺失情况,在补充关键属性完成前不再继续进行下一步校验。
作为优选方案,所述对错误信息数据来源进行修正,至少包括填补关键属性数据和修正数据来源属性。
作为优选方案,所述电力收费数据包括用户的电力数据和用户个人信息。
作为优选方案,所述操作日志的属性信息,包括操作日志的报送状态、异常交易逻辑状态、交易信息记录中的一种或多种组合。
作为优选方案,所述交易信息记录包括交易金额、交易量和交易余额。
作为优选方案,所述对不同的设备提取不同来源的数据中的数据包括不同设备的配置信息、告警记录信息、设备性能信息、业务信息、运维信息。
作为优选方案,所述数据匹配度校验通过余弦相似度算法进行匹配度计算。
作为优选方案,在所述对修正后的数据进行获取对应的操作日志,并判断对应的操作日志的属性信息是否存在异常之后,还包括:
依据所述操作日志中目标报送状态的参数和异常交易逻辑的参数,评估所述待分析记录的质量。
作为优选方案,所述依据所述操作日志中目标报送状态的参数和异常交易逻辑的参数,评估所述待分析记录的质量,包括:
确定第一百分比与第二百分比;所述第一百分比为所述目标报送状态的出现次数占总数量的百分比;所述第二百分比为所述异常交易逻辑的出现次数占总数量的百分比;
若所述第一百分比大于预设第一阈值,或者所述第二百分比大于预设第二阈值,则确定所述待分析记录的质量不满足预设质量要求,则确定为错误数据;
若所述第一百分比不大于所述预设第一阈值,且所述第二百分比不大于所述预设第二阈值,则确定所述待分析记录的质量满足所述预设质量要求,则确定为正常数据。
相比于现有技术,本发明实施例具有如下有益效果:
通过对电力收费数据进行错误数据识别,从电力数据的获取途径和操作日志进行分析,提取错误数据并修正、剔除,解决传统的电力收费系统没有对电力数据进行错误数据检测的技术问题,能够防止错误的用电数据在收费系统中给用户或电网企业造成损失。
附图说明
图1:为本发明方法实施例的步骤流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,本发明优选实施例提供了一种基于电力收费的错误数据分析方法,包括:
S1,获取单位时间内的电力收费数据;
在本实施例中,所述电力收费数据包括用户的电力数据和用户个人信息。
S2,确定所述电力收费数据的获取途径,所述获取途径至少包括从电表设备获取和设备网管获取中的一种;
S3,进行数据属性缺失校验,根据所述获取途径的不同,对不同的设备提取不同来源的数据,形成多个设备的完整数据链,对所述完整数据链的关键属性完整性进行校验,若校验失败则视为错误数据,若校验成功则视为正常数据;
在本实施例中,所述对所述完整数据链的关键属性完整性进行校验,至少包括:
判断所述完整数据链中各数据的关键属性是否填写完整,若判断为不完整,则发出属性缺失告警,并记录其来源归属设备和缺失情况,在补充关键属性完成前不再继续进行下一步校验。
S4,对经过完整性校验的数据进行数据匹配度校验,判断多个数据来源属性是否一致,若一致则将数据标记为准确数据;若不一致时,则触发数据分层校验事件;
在本实施例中,所述数据匹配度校验通过余弦相似度算法进行匹配度计算。
S5,当数据分层校验事件被触发后,不同来源的数据由预先设置的重要程度进行可信度分级,分级后对错误信息数据来源进行修正;
在本实施例中,所述对错误信息数据来源进行修正,至少包括填补关键属性数据和修正数据来源属性。
在本实施例中,所述对不同的设备提取不同来源的数据中的数据包括不同设备的配置信息、告警记录信息、设备性能信息、业务信息、运维信息。
S6,对修正后的数据进行获取对应的操作日志,并判断对应的操作日志的属性信息是否存在异常,若存在异常则确认为错误数据,否则为正常数据;
在本实施例中,所述操作日志的属性信息,包括操作日志的报送状态、异常交易逻辑状态、交易信息记录中的一种或多种组合。
在本实施例中,所述交易信息记录包括交易金额、交易量和交易余额。
在本实施例中,在所述对修正后的数据进行获取对应的操作日志,并判断对应的操作日志的属性信息是否存在异常之后,还包括:
依据所述操作日志中目标报送状态的参数和异常交易逻辑的参数,评估所述待分析记录的质量。
在本实施例中,所述依据所述操作日志中目标报送状态的参数和异常交易逻辑的参数,评估所述待分析记录的质量,包括:
确定第一百分比与第二百分比;所述第一百分比为所述目标报送状态的出现次数占总数量的百分比;所述第二百分比为所述异常交易逻辑的出现次数占总数量的百分比;
若所述第一百分比大于预设第一阈值,或者所述第二百分比大于预设第二阈值,则确定所述待分析记录的质量不满足预设质量要求,则确定为错误数据;
若所述第一百分比不大于所述预设第一阈值,且所述第二百分比不大于所述预设第二阈值,则确定所述待分析记录的质量满足所述预设质量要求,则确定为正常数据。
S7,剔除错误数据并记录剔除信息,实现完成对一个单位时间内的电力数据分析。
数据采集针对设备网管、资源管理系统、运行管理系统进行数据采集。专业网管负责提供设备的配置数据,如设备I D、槽位、板卡、端口信息等,该数据一般是由设备网管提供;资源管理系统负责提供设备的维护数据,如所属网络、承载业务信息等,该数据既有从设备采集的数据,也有运行人员手工维护的数据;运行管理系统负责提供设备的运维数据,如检修情况、故障情况信息等,由运行人员手工录入;而多个来源的数据中又有部分相同的数据,如槽位、板卡、端口的占用情况、设备运行状态信息等。上述数据统一纳入数据质量监控系统数据库进行存储,此外,还存储数据来源、采集时间等关键信息。此外,系统还会从网络中定期收集设备自带的信息,避免设备更换后,网管没有及时收集信息。
由数据质量监控系统进行属性缺失校验,根据设备出厂I D提取不同来源的数据,形成单个设备的完整数据链,包括设备的配置信息、告警信息、性能信息、业务信息、运维信息等。在此期间,校验各系统数据关键属性是否填写完整,对于预设关键属性缺失的,发出属性缺失告警,记录其来源系统和缺失情况,并不再继续进行下一步校验。
由数据质量监控系统进行数据匹配度校验,根据本发明配置的校验属性,对设备的数据链信息进行逐一比对。数据匹配完全一致、相似度较高时不扣分,如果出现多个数据来源的属性不一致时,触发数据分层校验事件。
当数据分层校验事件被触发后,不同来源的数据由数据质量监控系统预先设置的重要程度进行可信度分级,如专业网管>资源管理系统>运行管理系统。例如运行管理系统数据无法与资源管理管理系统数据匹配,而专业网管与运行管理系统数据一致,则可判定为资源管理系统数据出现问题,系统发出资源管理系统数据不准确告警。
本发明通过对电力收费数据进行错误数据识别,从电力数据的获取途径和操作日志进行分析,提取错误数据并修正、剔除,解决传统的电力收费系统没有对电力数据进行错误数据检测的技术问题,能够防止错误的用电数据在收费系统中给用户或电网企业造成损失。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于电力收费的错误数据分析方法,其特征在于,包括:
获取单位时间内的电力收费数据;
确定所述电力收费数据的获取途径,所述获取途径至少包括从电表设备获取和设备网管获取中的一种;
进行数据属性缺失校验,根据所述获取途径的不同,对不同的设备提取不同来源的数据,形成多个设备的完整数据链,对所述完整数据链的关键属性完整性进行校验,若校验失败则视为错误数据,若校验成功则视为正常数据;
对经过完整性校验的数据进行数据匹配度校验,判断多个数据来源属性是否一致,若一致则将数据标记为准确数据;若不一致时,则触发数据分层校验事件;
当数据分层校验事件被触发后,不同来源的数据由预先设置的重要程度进行可信度分级,分级后对错误信息数据来源进行修正;
对修正后的数据进行获取对应的操作日志,并判断对应的操作日志的属性信息是否存在异常,若存在异常则确认为错误数据,否则为正常数据;
剔除错误数据并记录剔除信息,实现完成对一个单位时间内的电力数据分析。
2.如权利要求1所述的方法,其特征在于,所述对所述完整数据链的关键属性完整性进行校验,至少包括:
判断所述完整数据链中各数据的关键属性是否填写完整,若判断为不完整,则发出属性缺失告警,并记录其来源归属设备和缺失情况,在补充关键属性完成前不再继续进行下一步校验。
3.如权利要求1所述的方法,其特征在于,所述对错误信息数据来源进行修正,至少包括填补关键属性数据和修正数据来源属性。
4.如权利要求1所述的方法,其特征在于,所述电力收费数据包括用户的电力数据和用户个人信息。
5.如权利要求1所述的方法,其特征在于,所述操作日志的属性信息,包括操作日志的报送状态、异常交易逻辑状态、交易信息记录中的一种或多种组合。
6.如权利要求5所述的方法,其特征在于,所述交易信息记录包括交易金额、交易量和交易余额。
7.如权利要求1所述的方法,其特征在于,所述对不同的设备提取不同来源的数据中的数据包括不同设备的配置信息、告警记录信息、设备性能信息、业务信息、运维信息。
8.如权利要求1所述的方法,其特征在于,所述数据匹配度校验通过余弦相似度算法进行匹配度计算。
9.如权利要求1所述的方法,其特征在于,在所述对修正后的数据进行获取对应的操作日志,并判断对应的操作日志的属性信息是否存在异常之后,还包括:
依据所述操作日志中目标报送状态的参数和异常交易逻辑的参数,评估所述待分析记录的质量。
10.如权利要求9所述的方法,其特征在于,所述依据所述操作日志中目标报送状态的参数和异常交易逻辑的参数,评估所述待分析记录的质量,包括:
确定第一百分比与第二百分比;所述第一百分比为所述目标报送状态的出现次数占总数量的百分比;所述第二百分比为所述异常交易逻辑的出现次数占总数量的百分比;
若所述第一百分比大于预设第一阈值,或者所述第二百分比大于预设第二阈值,则确定所述待分析记录的质量不满足预设质量要求,则确定为错误数据;
若所述第一百分比不大于所述预设第一阈值,且所述第二百分比不大于所述预设第二阈值,则确定所述待分析记录的质量满足所述预设质量要求,则确定为正常数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910078807.XA CN109918218A (zh) | 2019-01-28 | 2019-01-28 | 一种基于电力收费的错误数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910078807.XA CN109918218A (zh) | 2019-01-28 | 2019-01-28 | 一种基于电力收费的错误数据分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109918218A true CN109918218A (zh) | 2019-06-21 |
Family
ID=66960812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910078807.XA Pending CN109918218A (zh) | 2019-01-28 | 2019-01-28 | 一种基于电力收费的错误数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109918218A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111010393A (zh) * | 2019-12-16 | 2020-04-14 | 陕西数图行信息科技有限公司 | 一种用于大数据清洗的异常检测和消除的方法 |
CN111552686A (zh) * | 2020-05-08 | 2020-08-18 | 国网四川省电力公司信息通信公司 | 一种电力数据质量评估方法及其装置 |
CN113111095A (zh) * | 2021-04-02 | 2021-07-13 | 国网北京市电力公司 | 一种智能化信息管理方法及系统 |
CN115330545A (zh) * | 2022-08-17 | 2022-11-11 | 粤港澳国际供应链(广州)有限公司 | 跨境供应链金融的数据核验方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050273281A1 (en) * | 2003-02-07 | 2005-12-08 | Wall Daniel J | System and method for power quality analytics |
JP2007249581A (ja) * | 2006-03-15 | 2007-09-27 | Toshiba Corp | 料金収受システムおよびログ管理方法 |
CN105825318A (zh) * | 2016-03-09 | 2016-08-03 | 国家电网公司 | 一种电力通信网络数据质量监控方法 |
CN108694522A (zh) * | 2018-07-06 | 2018-10-23 | 中国银行股份有限公司 | 一种数据分析方法及装置 |
-
2019
- 2019-01-28 CN CN201910078807.XA patent/CN109918218A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050273281A1 (en) * | 2003-02-07 | 2005-12-08 | Wall Daniel J | System and method for power quality analytics |
JP2007249581A (ja) * | 2006-03-15 | 2007-09-27 | Toshiba Corp | 料金収受システムおよびログ管理方法 |
CN105825318A (zh) * | 2016-03-09 | 2016-08-03 | 国家电网公司 | 一种电力通信网络数据质量监控方法 |
CN108694522A (zh) * | 2018-07-06 | 2018-10-23 | 中国银行股份有限公司 | 一种数据分析方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111010393A (zh) * | 2019-12-16 | 2020-04-14 | 陕西数图行信息科技有限公司 | 一种用于大数据清洗的异常检测和消除的方法 |
CN111010393B (zh) * | 2019-12-16 | 2021-11-05 | 陕西数图行信息科技有限公司 | 一种用于大数据清洗的异常检测和消除的方法 |
CN111552686A (zh) * | 2020-05-08 | 2020-08-18 | 国网四川省电力公司信息通信公司 | 一种电力数据质量评估方法及其装置 |
CN111552686B (zh) * | 2020-05-08 | 2023-05-16 | 国网四川省电力公司信息通信公司 | 一种电力数据质量评估方法及其装置 |
CN113111095A (zh) * | 2021-04-02 | 2021-07-13 | 国网北京市电力公司 | 一种智能化信息管理方法及系统 |
CN113111095B (zh) * | 2021-04-02 | 2021-10-26 | 国网北京市电力公司 | 一种智能化信息管理方法及系统 |
CN115330545A (zh) * | 2022-08-17 | 2022-11-11 | 粤港澳国际供应链(广州)有限公司 | 跨境供应链金融的数据核验方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918218A (zh) | 一种基于电力收费的错误数据分析方法 | |
CN104636352B (zh) | 一种基于质量戳的scada 系统历史数据补数与查询处理方法 | |
CN107612756A (zh) | 一种具有智能故障分析处理功能的运维管理系统 | |
CN105787817B (zh) | 一种考虑老化失效模型的断路器备用方法及系统 | |
CN106124878A (zh) | 集成变压器健康监测架构 | |
CN107862393A (zh) | 一种it运维管理系统 | |
CN108181527A (zh) | 一种基于能量指标的电压暂降综合严重程度的评估方法 | |
CN104850934A (zh) | 一种气象装备维护维修管理系统 | |
CN109710501A (zh) | 一种服务器数据传输稳定性的检测方法和系统 | |
CN109948877B (zh) | 一种基于异常事件组合的用电异常精准分析方法 | |
CN104574219A (zh) | 电网业务信息系统运行工况的监测预警方法及系统 | |
CN111130840A (zh) | 无人值守服务中心管理方法、系统、介质及电子设备 | |
CN110088744A (zh) | 一种数据库维护方法及其系统 | |
CN108919044B (zh) | 一种基于互校验机制的单元制配电网故障主动识别方法 | |
CN107329877A (zh) | 机票业务监控执行系统及方法 | |
CN107808204A (zh) | 一种对设备评价数据自动识别的风险管控系统及方法 | |
CN116011827B (zh) | 一种用于重点小区的停电监测分析与预警系统及方法 | |
CN106403168A (zh) | 用于空调系统的故障诊断系统和方法 | |
CN106789158A (zh) | 一种云服务保险定损方法和系统 | |
CN115080546B (zh) | 一种基于大数据的企业数据诊断系统 | |
CN107220181A (zh) | 一种异常进程定位方法、装置及系统 | |
CN113094244A (zh) | 一种用于数据中心的机房运行智能检测系统 | |
CN107453481B (zh) | 一种快速发现低压台区停电的方法 | |
CN111260150A (zh) | 一种通信设备运行风险预警方法及通信管理系统 | |
CN114675789B (zh) | 一种基于计算机系统的大数据分析存储系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190621 |