CN116502160A - 一种电量数据自动采集系统 - Google Patents

一种电量数据自动采集系统 Download PDF

Info

Publication number
CN116502160A
CN116502160A CN202310252032.XA CN202310252032A CN116502160A CN 116502160 A CN116502160 A CN 116502160A CN 202310252032 A CN202310252032 A CN 202310252032A CN 116502160 A CN116502160 A CN 116502160A
Authority
CN
China
Prior art keywords
data
electric quantity
abnormal
correction
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310252032.XA
Other languages
English (en)
Inventor
张建军
丁雪青
李洪星
徐东方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaneng Qufu Thermal Power Co Ltd
Original Assignee
Huaneng Qufu Thermal Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaneng Qufu Thermal Power Co Ltd filed Critical Huaneng Qufu Thermal Power Co Ltd
Priority to CN202310252032.XA priority Critical patent/CN116502160A/zh
Publication of CN116502160A publication Critical patent/CN116502160A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明提供了一种电量数据自动采集系统,涉及数据采集技术领域,包括数据采集模块,用于采集数据并对采集到的数据信号转换;数据处理模块,用于对数据进行预处理;异常识别模块,用于利用目标历史数据训练得到的电量预测模型对目标实时数据异常识别,并对异常数据进行第一标记;数据传输模块,用于将所述目标实时数据以及第一标记数据传输至控制终端,来对所述第一标记数据进行修正和故障检修。通过对采集的实时数据转换得到第一数据,利用预处理后的历史数据训练模型得到电量预测模型,来对预处理后的第一数据进行预测,从而实现异常数据的在线识别,并基于实际电量数据进行修正,保证智能化采集数据的同时,降低因异常数据产生的损耗。

Description

一种电量数据自动采集系统
技术领域
本发明涉及数据采集技术领域,特别涉及一种电量数据自动采集系统。
背景技术
电量数据是一种重要的参数,可以用来判断工作状态以及统计分析,当前,用电量数据采集系统基本实现了全覆盖,可为多种业务提供数据支撑。
但是,电力市场发展迅速的同时,也面临着由于所需采集数据十分庞大、外界干扰或是通信通道不稳定等原因,频繁出现采集到异常电量数据的现象,从而导致产生巨大的经济损失,阻碍了电力系统的安全,故实现实时智能采集电量数据的的同时也能精准识别到异常数据并做出相应措施就显得尤其重要。
因此,本发明提供一种电量数据自动采集系统。
发明内容
本发明提供一种电量数据自动采集系统,用以通过对采集的实时数据转换得到第一数据,利用预处理后的历史数据训练模型得到电量预测模型,来对预处理后的第一数据进行预测,从而实现异常数据的在线识别,并基于实际电量数据进行修正,保证智能化采集数据的同时,降低因异常数据产生的损耗。
本发明提供一种电量数据自动采集系统,包括:
数据采集模块:用于利用若干电量计算装置实时采集目标参数数据,并将所述目标参数数据进行信号转换,得到第一数据并存储;
数据处理模块:用于对从电量数据库中提取的预设量的历史电量数据以及第一数据分别进行预处理,得到目标历史数据以及目标实时数据;
异常识别模块:用于利用所述目标历史数据训练模型得到的电量预测模型,来对目标实时数据进行异常识别,若目标实时数据中存在异常,则将异常数据进行第一标记;
数据传输模块:用于将所述目标实时数据以及第一标记数据传输至控制终端,来对所述第一标记数据进行修正和故障检修。
优选的,所述第一数据为将所述目标参数数据由模拟信号转化成数字信号的数据。
优选的,所述数据处理模块包括:
数据清洗单元:用于分别对第一数据和历史电量数据进行时序排列,然后分别依次计算得到第一数据与历史电量数据内的相邻两条数据的属性相似度并进行判断,若超过预设相似度,则判定所述相邻两条数据重复,此时任意删除一条重复数据;
数据去噪单元:用于对清洗后的第一数据和历史电量数据做平滑处理,实现去噪,再对去噪后的数据分别进行归一化处理,最终得到目标实时数据和目标历史数据。
优选的,所述异常识别模块包括:
模型训练单元:用于将任意选取的三分之二目标历史数据作为第一关键数据进行点异常初步判断,得到第一异常数据点;
获取第一异常数据点前后时刻的电量数据的平均值,来对第一异常数据点进行校正,得到第一校正数据;
集合所述第一校正数据,得到训练数据集;
基于用电量的趋势成分、季节成分以及外部影响因素对用电量的影响,且结合所述训练数据集训练得到电量预测模型;
异常阈值确定单元:用于对除第一关键数据以外的目标历史数据进行异常数据的人工标注,得到第二关键数据,并根据第二关键数据的异常识别准确率和漏检率来判定异常阈值;
其中,异常阈值求取公式如下:
其中,Y表示为异常阈值;P1表示为识别异常数据的准确率;P2表示为识别异常数据的漏检率;ω1表示为准确率对求取异常阈值的贡献因子;ω2表示为漏检率对求取异常阈值的贡献因子;MTP表示为异常的数据点被判定为异常点的个数;MFP表示为正常的数据点被判定为异常点的个数;MFN表示为异常的数据点被判定为正常点的个数。
异常识别单元:用于基于异常阈值,对利用电量预测模型预测目标实时数据所得到的结果进行异常识别。
优选的,所述异常识别单元,包括:
预测块:用于基于t时刻之前的目标实时数据,利用电量预测模型对t时刻的用电量的概率分布进行预测,得到第一预测结果;
识别块:用于将t时刻采集的用电量与第一预测结果进行对比,得到异常偏差值,其中,异常偏差值的求取公式如下:
其中,Qt表示为t时刻的异常偏差值;dt表示为t时刻采集的实际用电量;表示为t时刻预测电量概率分布的均值;F表示为方差;δ表示为求取异常偏差值过程中的计算损耗系数;
若异常偏差值大于异常阈值,则判定该电量数据为异常数据并进行第一标记,得到第一标记数据。
优选的,所述数据传输模块包括:
数据传输单元:用于基于通信传输通道将目标实时数据以及第一标记数据传输至控制终端;
异常修正单元:用于基于与第一标记数据相同季节下的目标历史数据所对应的日用电量曲线,来对所述第一标记数据进行修正;
反应单元:用于对第一修正数据的修正效果进行判断,若修正效果值小于预设阈值,则将所述第一修正数据标记得到第二标记数据,并将第二标记数据对应的电量计算装置状态设置为禁用,进行人工紧急故障检修。
优选的,所述异常修正单元包括:
判断块:用于判断所述第一标记数据的用户类型以及季节属性;
计算块:用于利用提取的基于第一标记数据的用户类型以及季节属性对应的同时段的目标历史数据,计算得到第一季节性日用电量曲线L=l(i),i=1,2,…n,其中l(i)表示为日用电量曲线对应的第i个时刻的用电量值;
对比块:用于将所述第一标记数据所在日的剩余正常时刻C=c(j),j=1,2,…m,其中c(j)表示为第j个剩余正常时刻对应的用电量值,与第一季节性日用电量曲线L=l(i),i=1,2,…n的用电量值无量化处理后得到的C′=c′(j),j=1,2,…m与L′=l′(i),i=1,2,…m分别进行关联分析,得到若干相关联度;
将所述所有相关联度进行平均求值,得到第一相似度;
修正块:用于利用第一相似度对第一季节性日用电量曲线中第一标记数据出现时刻对应的用电量值加权处理得到修正值并替换对应的第一标记数据,作为第一修正数据输出。
优选的,所述反应单元包括:
效果判断块:用于利用求取所述第一修正数据的修正效果值,对第一修正数据的修正效果进行判断;
其中,修正效果值的求取公式如下:
其中,X(k)表示为第k个第一修正数据的修正效果值;a表示为第一修正数据的总个数;xk表示为第k个真实用电量数据值;zk表示为对应的第k个修正值;θ1表示为均方根误差对修正效果的影响权值系数;θ2表示为平均误差对修正效果的影响权值系数,其中θ1+θ2=1,且θ1>θ2;
故障排查块:用于分析获取的修正效果值,若小于预设阈值,则将对应的第一修正数据标记得到第二标记数据,获取第二标记数据的对应电量计算装置并禁用,再紧急人工检修。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种电量数据自动采集系统的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供一种电量数据自动采集系统,如图1所示,包括:
数据采集模块:用于利用若干电量计算装置实时采集目标参数数据,并将所述目标参数数据进行信号转换,得到第一数据并存储;
数据处理模块:用于对从电量数据库中提取的预设量的历史电量数据以及第一数据分别进行预处理,得到目标历史数据以及目标实时数据;
异常识别模块:用于利用所述目标历史数据训练模型得到的电量预测模型,来对目标实时数据进行异常识别,若目标实时数据中存在异常,则将异常数据进行第一标记;
数据传输模块:用于将所述目标实时数据以及第一标记数据传输至控制终端,来对所述第一标记数据进行修正和故障检修。
该实施例中,电量计算装置由电能表、电压互感器、电流互感器以及二次连接线导线构成的设备,用于测量、发电量和用户用电量;目标参数数据指的是用户的实时用电量数据;第一数据是将所述目标参数数据由模拟信号转化成数字信号得到的数据。
该实施例中,电量数据库主要由历史电量数据、当前电量数据、用户信息以及用户行为信息构成;预设量是基于实时采集到的电量数据量提前设定好的。
该实施例中,目标历史数据和目标实时数据是通过对历史电量数据和第一数据预处理后得到的,其中数据预处理包括数据清洗、数据去噪以及数据归一化处理。
该实施例中,电量预测模型是在综合考虑用电量的趋势成分、季节成分以及外部影响因素对用电量影响的前提下,利用目标历史数据训练得到的模型,用于实时预测未来时刻电量数据的概率分布;异常识别指的是将实际采集到的实施电量与电量预测模型预测到的结果进行对比,实现识别异常数据;第一标记数据指的是被识别为异常数据并标记的目标实时数据。
该实施例中,修正第一标记数据的目的是为了一定程度上的降低因异常数据导致的损耗,利于维持电力系统的安全;故障检修的前提是修正异常数据后,电量数据仍与正常数据存在巨大误差。
上述技术方案的有益效果是:通过对采集的实时数据转换得到第一数据,利用预处理后的历史数据训练模型得到电量预测模型,来对预处理后的第一数据进行预测,从而实现异常数据的在线识别,并基于实际电量数据进行修正,保证智能化采集数据的同时,降低因异常数据产生的损耗。
本发明实施例提供一种电量数据自动采集系统,所述数据处理模块包括:
数据清洗单元:用于分别对第一数据和历史电量数据进行时序排列,然后分别依次计算得到第一数据与历史电量数据内的相邻两条数据的属性相似度并进行判断,若超过预设相似度,则判定所述相邻两条数据重复,此时任意删除一条重复数据;
数据去噪单元:用于对清洗后的第一数据和历史电量数据做平滑处理,实现去噪,再对去噪后的数据分别进行归一化处理,最终得到目标实时数据和目标历史数据。
该实施例中,时序排列指的是按照时间顺序的排列;数据的属性包括数值属性和标签属性,比如时刻、用户名称。
该实施例中,属性相似度是通过先计算相邻数据之间的数值属性值与标签属性值的相似度,再根据属性的权重求加权平均值得到的;预设相似度是提前设定好的,一般为0.85。
该实施例中,比如,存在两对相邻数据数据1和数据2,数据3和数据4;对应的属性相似度分别是0.9和0.65,此时确定相邻数据数据1和数据2重复,任意删除一条数据。
该实施例中,数据去噪是为了降低噪声数据对后续数据分析建模的负面影响;平滑处理主要指的是将数据进行平均,并把所求的平均值作为所有数据的值;归一化处理是为了消除量纲影响;目标实时数据指的是对第一数据预处理后得到的数据;目标历史数据是对历史电量数据预处理后得到的数据,用于训练预测模型以及有助于数据修正。
上述技术方案的有益效果是:通过对第一数据和历史电量数据中的相邻两条数据属性相似度的判断,以删除重复数据来进行数据清洗;对清洗后的第一数据和历史电量数据进行去噪和归一化处理,得到目标实时数据与目标历史数据,为后续训练模型,异常数据识别以及数据修正奠定数据支撑。
本发明实施例提供一种电量数据自动采集系统,所述异常识别模块包括:
模型训练单元:用于将任意选取的三分之二目标历史数据作为第一关键数据进行点异常初步判断,得到第一异常数据点;
获取第一异常数据点前后时刻的电量数据的平均值,来对第一异常数据点进行校正,得到第一校正数据;
集合所述第一校正数据,得到训练数据集;
基于用电量的趋势成分、季节成分以及外部影响因素对用电量的影响,且结合所述训练数据集训练得到电量预测模型;
异常阈值确定单元:用于对除第一关键数据以外的目标历史数据进行异常数据的人工标注,得到第二关键数据,并根据第二关键数据的异常识别准确率和漏检率来判定异常阈值;
其中,异常阈值求取公式如下:
其中,Y表示为异常阈值;P1表示为识别异常数据的准确率;P2表示为识别异常数据的漏检率;ω1表示为准确率对求取异常阈值的贡献因子;ω2表示为漏检率对求取异常阈值的贡献因子;MTP表示为异常的数据点被判定为异常点的个数;MFP表示为正常的数据点被判定为异常点的个数;MFN表示为异常的数据点被判定为正常点的个数。
异常识别单元:用于基于异常阈值,对利用电量预测模型预测目标实时数据所得到的结果进行异常识别。
该实施例中,第一关键数据指的是占比三分之二的目标历史数据;点异常是指基于对第一关键数据的趋势全局考虑,存在电量值远不同于正常的电量值,该电量值为点异常值,也就是第一异常数据点。
该实施例中,比如,存在第一异常数据点A,对应的电量值为a1,且数据点A前后时刻对应的电量值分别是a0、a2,此时对第一异常数据点A进行校正,得到第一校正数据A′的电量值为
该实施例中,训练数据集由所有获得的第一校正数据构成;趋势成分主要是指上升斜率、下降斜率;季节成分包括春夏秋冬四个季节;外部影响因素包括有气温、节假日等因素;电量预测模型是基于目标历史数据训练得到的模型,用于实时预测未来时刻电量数据的概率分布。
该实施例中,第二关键数据指的是除第一关键数据以外的目标历史数据中的经人工标注的异常数据;异常阈值用于对数据进行异常识别;异常识别准确率指的是判定为异常的数据中正确判定的比例;漏检率值得是判定为异常的数据占所有异常数据的比例。
上述技术方案的有益效果是:通过利用三分之二的目标历史数据来训练模型得到电量预测模型,再利用剩余三分之一的目标历史数据中的异常数据来获取异常阈值,两者结合实现对目标实时数据的异常识别,提升了数据质量并增强了数据的识别性能。
本发明实施例提供一种电量数据自动采集系统,所述异常识别单元,包括:
预测块:用于基于t时刻之前的目标实时数据,利用电量预测模型对t时刻的用电量的概率分布进行预测,得到第一预测结果;
识别块:用于将t时刻采集的用电量与第一预测结果进行对比,得到异常偏差值,其中,异常偏差值的求取公式如下:
其中,Qt表示为t时刻的异常偏差值;dt表示为t时刻采集的实际用电量;表示为t时刻预测电量概率分布的均值;F表示为方差;δ表示为求取异常偏差值过程中的计算损耗系数;
若异常偏差值大于异常阈值,则判定该电量数据为异常数据并进行第一标记,得到第一标记数据。
该实施例中,第一预测结果是利用电量预测模型预测得到的,用于与实际用电量对比,来判断是否存在异常。
该实施例中,比如,存在t1时刻采集到的电量数据B与预测结果的异常偏差值大于异常阈值,则此时,对电量数据B进行标记,并作为第一标记数据输出。
上述技术方案的有益效果是:通过利用电量预测模型对当前时刻进行预测的结果与当前时刻的真实用电量数据对比,得到异常偏差值,并基于异常阈值来判断当前时刻采集的数据是否存在异常,有效实现了对异常数据的精准识别。
本发明实施例提供一种电量数据自动采集系统,所述数据传输模块包括:
数据传输单元:用于基于通信传输通道将目标实时数据以及第一标记数据传输至控制终端;
异常修正单元:用于基于与第一标记数据相同季节下的目标历史数据所对应的日用电量曲线,来对所述第一标记数据进行修正;
反应单元:用于对第一修正数据的修正效果进行判断,若修正效果值小于预设阈值,则将所述第一修正数据标记得到第二标记数据,并将第二标记数据对应的电量计算装置状态设置为禁用,进行人工紧急故障检修。
该实施例中,通信传输通道用于将采集到的数据传输至控制终端;控制终端用于;日用电量曲线指的是呈现当天的电量变化趋势的曲线。
该实施例中,第一修正数据是通过将目标历史数据的季节性日用电量曲线与第一标记数据所在日的剩余正常时刻对应的用电量值关联分析后平均求值得到相似度,再进行加权处理得到对应的修正值替换第一标记数据得到的。
该实施例中,修正效果指的是第一修正数据与正常真实数据的接近程度;预设阈值是提前设定好的。
该实施例中,比如,存在第一修正数据C1、C2,对应的修正效果值均小于预设阈值,此时将第一修正数据C1和C2进行标记,作为第二标记数据输出,并将第一修正数据C1和C2对应的电量计算装置禁用,安排人工进行故障检修。
上述技术方案的有益效果是:通过将目标实时数据和第一标记利用通信传输通道传输至控制终端,再基于目标历史数据对第一标记数据进行修正,并根据修正效果做出针对性措施,保证了数据实时智能化采集的同时,精准识别异常数据并做出回应,保证了数据质量,一定程度上提高电力系统安全性,尽量避免造成经济损失。
本发明实施例提供一种电量数据自动采集系统,所述异常修正单元包括:
判断块:用于判断所述第一标记数据的用户类型以及季节属性;
计算块:用于利用提取的基于第一标记数据的用户类型以及季节属性对应的同时段的目标历史数据,计算得到第一季节性日用电量曲线L=l(i),i=1,2,…n,其中lIi)表示为日用电量曲线对应的第i个时刻的用电量值;
对比块:用于将所述第一标记数据所在日的剩余正常时刻C=c(j),j=1,2,…m,其中c(j)表示为第j个剩余正常时刻对应的用电量值,与第一季节性日用电量曲线L=l(i),i=1,2,…n的用电量值无量化处理后得到的C′=c′(j),j=1,2,…m与L′=l′(i),i=1,2,…m分别进行关联分析,得到若干相关联度;
将所述所有相关联度进行平均求值,得到第一相似度;
修正块:用于利用第一相似度对第一季节性日用电量曲线中第一标记数据出现时刻对应的用电量值加权处理得到修正值并替换对应的第一标记数据,作为第一修正数据输出。
该实施例中,用户类型包括居民和非居民,比如商场营业个体户;季节属性主要是指春夏秋冬四个季节;第一季节性日用电量曲线主要用于描述不同季节下的日用电量走势现象,比如秋冬季节典型的用电量曲线走势差别更大、冬天用电量消耗最大,日用电量曲线存在双峰特点;无量化处理指的是消除因单位与量级不同导致的对后续数据分析的负面影响;相关联度指的是各个时刻的紧密程度值。
上述技术方案的有益效果是:通过将目标历史数据的季节性日用电量曲线与第一标记数据所在日的剩余正常时刻的用电量值无量化处理后关联分析,得到第一相似度;通过利用第一相似度对用电量值加权处理得到修正值替换对应的第一标记数据,实现对异常数据的有效修正,提升数据质量。
本发明实施例提供一种电量数据自动采集系统,所述反应单元包括:
效果判断块:用于利用求取所述第一修正数据的修正效果值,对第一修正数据的修正效果进行判断;
其中,修正效果值的求取公式如下:
其中,X(k)表示为第k个第一修正数据的修正效果值;a表示为第一修正数据的总个数;xk表示为第k个真实用电量数据值;zk表示为对应的第k个修正值;θ1表示为均方根误差对修正效果的影响权值系数;θ2表示为平均误差对修正效果的影响权值系数,其中θ1+θ2=1,且θ1>θ2;
故障排查块:用于分析获取的修正效果值,若小于预设阈值,则将对应的第一修正数据标记得到第二标记数据,获取第二标记数据的对应电量计算装置并禁用,再紧急人工检修。
该实施例中,比如,存在第一修正数据C1、C2,对应的修正效果值均小于预设阈值,此时将第一修正数据C1和C2进行标记,作为第二标记数据输出,并将第一修正数据C1和C2对应的电量计算装置禁用,安排人工进行故障检修。
上述技术方案的有益效果是:通过利用公式求取得到的修正效果值与预设阈值进行对比,得到修正效果未达到预设效果的第一修正数据并禁用对应的电量计算装置,再安排人工检修,有效保证数据质量的同时,维护了电力系统的安全,一定程度上降低出现经济损失的可能性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种电量数据自动采集系统,其特征在于,包括:
数据采集模块:用于利用若干电量计算装置实时采集目标参数数据,并将所述目标参数数据进行信号转换,得到第一数据并存储;
数据处理模块:用于对从电量数据库中提取的预设量的历史电量数据以及第一数据分别进行预处理,得到目标历史数据以及目标实时数据;
异常识别模块:用于利用所述目标历史数据训练模型得到的电量预测模型,来对目标实时数据进行异常识别,若目标实时数据中存在异常,则将异常数据进行第一标记;
数据传输模块:用于将所述目标实时数据以及第一标记数据传输至控制终端,来对所述第一标记数据进行修正和故障检修。
2.如权利1所述的一种电量数据自动采集系统,其特征在于,所述第一数据为将所述目标参数数据由模拟信号转化成数字信号的数据。
3.如权利1所述的一种电量数据自动采集系统,其特征在于,所述数据处理模块包括:
数据清洗单元:用于分别对第一数据和历史电量数据进行时序排列,然后分别依次计算得到第一数据与历史电量数据内的相邻两条数据的属性相似度并进行判断,若超过预设相似度,则判定所述相邻两条数据重复,此时任意删除一条重复数据;
数据去噪单元:用于对清洗后的第一数据和历史电量数据做平滑处理,实现去噪,再对去噪后的数据分别进行归一化处理,最终得到目标实时数据和目标历史数据。
4.如权利1所述的一种电量数据自动采集系统,其特征在于,所述异常识别模块包括:
模型训练单元:用于将任意选取的三分之二目标历史数据作为第一关键数据进行点异常初步判断,得到第一异常数据点;
获取第一异常数据点前后时刻的电量数据的平均值,来对第一异常数据点进行校正,得到第一校正数据;
集合所述第一校正数据,得到训练数据集;
基于用电量的趋势成分、季节成分以及外部影响因素对用电量的影响,且结合所述训练数据集训练得到电量预测模型;
异常阈值确定单元:用于对除第一关键数据以外的目标历史数据进行异常数据的人工标注,得到第二关键数据,并根据第二关键数据的异常识别准确率和漏检率来判定异常阈值;
其中,异常阈值求取公式如下:
其中,Y表示为异常阈值;P1表示为识别异常数据的准确率;P2表示为识别异常数据的漏检率;ω1表示为准确率对求取异常阈值的贡献因子;ω2表示为漏检率对求取异常阈值的贡献因子;MTP表示为异常的数据点被判定为异常点的个数;MFP表示为正常的数据点被判定为异常点的个数;MFN表示为异常的数据点被判定为正常点的个数。
异常识别单元:用于基于异常阈值,对利用电量预测模型预测目标实时数据所得到的结果进行异常识别。
5.如权利4所述的一种电量数据自动采集系统,其特征在于,所述异常识别单元,包括:
预测块:用于基于t时刻之前的目标实时数据,利用电量预测模型对t时刻的用电量的概率分布进行预测,得到第一预测结果;
识别块:用于将t时刻采集的用电量与第一预测结果进行对比,得到异常偏差值,其中,异常偏差值的求取公式如下:
其中,Qt表示为t时刻的异常偏差值;dt表示为t时刻采集的实际用电量;表示为t时刻预测电量概率分布的均值;F表示为方差;δ表示为求取异常偏差值过程中的计算损耗系数;
若异常偏差值大于异常阈值,则判定该电量数据为异常数据并进行第一标记,得到第一标记数据。
6.如权利1所述的一种电量数据自动采集系统,其特征在于,所述数据传输模块包括:
数据传输单元:用于基于通信传输通道将目标实时数据以及第一标记数据传输至控制终端;
异常修正单元:用于基于与第一标记数据相同季节下的目标历史数据所对应的日用电量曲线,来对所述第一标记数据进行修正;
反应单元:用于对第一修正数据的修正效果进行判断,若修正效果值小于预设阈值,则将所述第一修正数据标记得到第二标记数据,并将第二标记数据对应的电量计算装置状态设置为禁用,进行人工紧急故障检修。
7.如权利6所述的一种电量数据自动采集系统,其特征在于,所述异常修正单元包括:
判断块:用于判断所述第一标记数据的用户类型以及季节属性;
计算块:用于利用提取的基于第一标记数据的用户类型以及季节属性对应的同时段的目标历史数据,计算得到第一季节性日用电量曲线L=l(i),i=1,2,…n,其中l(i)表示为日用电量曲线对应的第i个时刻的用电量值;
对比块:用于将所述第一标记数据所在日的剩余正常时刻C=c(j),j=1,2,…m,其中c(j)表示为第j个剩余正常时刻对应的用电量值,与第一季节性日用电量曲线L=l(i),i=1,2,…n的用电量值无量化处理后得到的C′=c′(j),j=1,2,…m与L′=l′(i),i=1,2,...m分别进行关联分析,得到若干相关联度;
将所述所有相关联度进行平均求值,得到第一相似度;
修正块:用于利用第一相似度对第一季节性日用电量曲线中第一标记数据出现时刻对应的用电量值加权处理得到修正值并替换对应的第一标记数据,作为第一修正数据输出。
8.如权利6所述的一种电量数据自动采集系统,其特征在于,所述反应单元包括:
效果判断块:用于利用求取所述第一修正数据的修正效果值,对第一修正数据的修正效果进行判断;
其中,修正效果值的求取公式如下:
其中,X(k)表示为第k个第一修正数据的修正效果值;a表示为第一修正数据的总个数;xk表示为第k个真实用电量数据值;zk表示为对应的第k个修正值;θ1表示为均方根误差对修正效果的影响权值系数;θ2表示为平均误差对修正效果的影响权值系数,其中θ1+θ2=1,且θ1>θ2;
故障排查块:用于分析获取的修正效果值,若小于预设阈值,则将对应的第一修正数据标记得到第二标记数据,获取第二标记数据的对应电量计算装置并禁用,再紧急人工检修。
CN202310252032.XA 2023-03-13 2023-03-13 一种电量数据自动采集系统 Pending CN116502160A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310252032.XA CN116502160A (zh) 2023-03-13 2023-03-13 一种电量数据自动采集系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310252032.XA CN116502160A (zh) 2023-03-13 2023-03-13 一种电量数据自动采集系统

Publications (1)

Publication Number Publication Date
CN116502160A true CN116502160A (zh) 2023-07-28

Family

ID=87317389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310252032.XA Pending CN116502160A (zh) 2023-03-13 2023-03-13 一种电量数据自动采集系统

Country Status (1)

Country Link
CN (1) CN116502160A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777305A (zh) * 2023-08-18 2023-09-19 河北思极科技有限公司 电力数据质量提升方法、装置、电子设备及存储介质
CN116908533A (zh) * 2023-09-14 2023-10-20 安徽融兆智能有限公司 一种具有计量功能的电力用户用电信息采集设备
CN117332236A (zh) * 2023-10-30 2024-01-02 国网浙江省电力有限公司乐清市供电公司 一种虚拟电厂的数据跟踪检测方法、装置及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777305A (zh) * 2023-08-18 2023-09-19 河北思极科技有限公司 电力数据质量提升方法、装置、电子设备及存储介质
CN116777305B (zh) * 2023-08-18 2023-11-10 河北思极科技有限公司 电力数据质量提升方法、装置、电子设备及存储介质
CN116908533A (zh) * 2023-09-14 2023-10-20 安徽融兆智能有限公司 一种具有计量功能的电力用户用电信息采集设备
CN116908533B (zh) * 2023-09-14 2023-12-08 安徽融兆智能有限公司 一种具有计量功能的电力用户用电信息采集设备
CN117332236A (zh) * 2023-10-30 2024-01-02 国网浙江省电力有限公司乐清市供电公司 一种虚拟电厂的数据跟踪检测方法、装置及存储介质
CN117332236B (zh) * 2023-10-30 2024-05-07 国网浙江省电力有限公司乐清市供电公司 一种虚拟电厂的数据跟踪检测方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN116502160A (zh) 一种电量数据自动采集系统
CN108446864B (zh) 基于大数据分析的轨道交通设备的故障预警系统及方法
CN110222991B (zh) 基于rf-gbdt的计量装置故障诊断方法
CN110516912B (zh) 一种配电台区户变关系的识别方法
CN103631681A (zh) 一种在线修复风电场异常数据的方法
CN112418687B (zh) 基于用电特征的用户用电异常识别方法、装置和存储介质
CN113884975B (zh) 一种基于改进动态线损估计的超差电表检测方法
CN115954879B (zh) 基于ao算法优化pnn的配电网线变关系精准辨识方法
CN111881961A (zh) 基于数据挖掘的配电网故障风险等级预测方法
CN115358347B (zh) 一种针对不同子系统下智能电表的剩余寿命预测方法
CN113554361B (zh) 一种综合能源系统数据处理计算方法及处理系统
CN111091223A (zh) 一种基于物联网智能感知技术的配变短期负荷预测方法
CN108171397A (zh) 一种配电二次设备状态风险评估方法
CN111179576A (zh) 一种具有归纳学习的用电信息采集故障诊断方法及系统
CN112508254B (zh) 变电站工程项目投资预测数据的确定方法
CN116840765B (zh) 一种基于多元时序分析的电压互感器误差状态评估方法
CN116050940B (zh) 技工平台的劳务派遣优胜劣汰管理系统
CN116756505A (zh) 一种基于大数据的光伏设备智能管理系统及方法
CN114167837B (zh) 一种铁路信号系统的智能故障诊断方法及系统
CN114626758A (zh) 用于医疗设备维修的效果评价系统
CN114118863A (zh) 一种建筑可再生碳中和能源系统
CN117540330B (zh) 基于自学习功能的配电柜系统
CN115994692B (zh) 基于5g和大数据的智慧河湖管理平台
CN117708707B (zh) 大数据下台区线损率异常智能预警方法和系统
CN116845985B (zh) 一种基于数据分析的源网荷储协同调度系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination