CN112381433A - 一种实用的面向现货市场结算的电量数据处理方法 - Google Patents

一种实用的面向现货市场结算的电量数据处理方法 Download PDF

Info

Publication number
CN112381433A
CN112381433A CN202011310408.0A CN202011310408A CN112381433A CN 112381433 A CN112381433 A CN 112381433A CN 202011310408 A CN202011310408 A CN 202011310408A CN 112381433 A CN112381433 A CN 112381433A
Authority
CN
China
Prior art keywords
data
user
electric quantity
users
limit value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011310408.0A
Other languages
English (en)
Other versions
CN112381433B (zh
Inventor
李维劼
严明辉
陈玲
冯莹莹
崔琳童
王熙凯
杨颜梦
吴滇宁
周娜
段沛恒
邹贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming Electric Power Transaction Center Co ltd
Original Assignee
Kunming Electric Power Transaction Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming Electric Power Transaction Center Co ltd filed Critical Kunming Electric Power Transaction Center Co ltd
Priority to CN202011310408.0A priority Critical patent/CN112381433B/zh
Publication of CN112381433A publication Critical patent/CN112381433A/zh
Application granted granted Critical
Publication of CN112381433B publication Critical patent/CN112381433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)

Abstract

本发明涉及一种实用的面向现货市场结算的电量数据处理方法,针对现有电力计量体系不完备与现货市场建设迫切需要的矛盾下存在的不完备计量体系所得计量数据难以用于现货市场结算的问题,提出了包含用户样本电量数据分类、典型电量曲线应用场景划分、用户行业划分、典型日电量曲线提取、异常数据辨识、异常数据修正的全流程的面向现货市场结算的电量数据处理方案,可得到用户修正电量数据作为结算电量数据并用于现货市场结算环节,所提电量数据处理方法完整性高,所得到用于结算的电量数据与真实电力电量数据误差小,将全套流程方法应用于现货市场结算中可以大大提高市场结算环节的准确率和效率。

Description

一种实用的面向现货市场结算的电量数据处理方法
技术领域
本发明涉及现货市场结算领域,具体涉及一种实用的面向现货市场结算的电量数据处理方法。
背景技术
电力结算是电力现货市场的最根本环节,现货市场的建设将对我国电力市场交易中的结算环节的可靠性、及时性、有效性和准确性提出更高要求。而现有电力计量体系的不完备与现货市场建设的迫切需要形成当前现货市场改革下的主要矛盾之一。不完备计量体系下所得到的计量数据难以用于现货市场的结算,因此需要面向现货市场结算环节,对电量数据进行数据处理并给出实用的电量数据处理方法,以得到可用于现货市场结算的电力电量数据。
发明内容
本发明提供了一种实用的面向现货市场结算的电量数据处理方法,用以提高现货市场结算环节的准确度和效率。针对电力计量体系不完备带来的现有计量数据不能满足现货市场结算环节的需要的问题,需要对计量电量数据进行数据处理,以得到可用于现货市场结算的电力电量数据。
为实现上述目的,本发明采用下述技术方案:
一种实用的面向现货市场结算的电量数据处理方法,包括以下步骤:
步骤1:根据用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值,将计量年份y内用户每个月的月用电量均大于等于用户月用电量限值且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将月用电量限值以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
步骤2:对典型电量曲线的应用场景进行划分;对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类;
步骤3:对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线;
步骤4:对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正;对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,并在典型电量曲线应用时进行去归一化操作得到用户的实际分时电量;对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,采用相似日拟合的方法进行多点缺失数据修正;
步骤5:通过步骤4分别得到月用电量限值及以上用户、月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户的修正电量数据作为结算电量数据,并用于现货市场的结算环节。
进一步地,步骤1所述具备分时计量条件用户的计量年份y的日电量数据为:
Uk,y=(Xk,y,1,Xk,y,2,…,Xk,y,n)
k∈[1,N]
其中,N表示所有现货市场用户中具备分时计量条件的用户的数量,Uk,y为月用电量限值及以上用户k在计量年份y的总共n日的日电量数据集,Xk,y,i为月用电量限值及以上用户k在计量年份y的第i日的96点日电量数据集:
Xk,y,i=[xk,y,i,1,xk,y,i,2,…,xk,y,i,m,…,xk,y,i,96]T
i∈[1,L]
其中,L表示计量年份y全年内的总天数,日电量数据为96个点以15分钟为颗粒度,将每日24小时以15分钟为时间段划分即可得到96个日电量计量数据点,xk,y,i,m为月用电量限值及以上用户k在计量年份y的第i日的第m点计量数据,m∈[1,96];
进一步地,步骤2中所述对典型电量曲线的应用场景进行划分,具体划分为:
为提高典型电量曲线的准确性,本发明根据用户实际用电行为和规律,可以将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及春节假期、国庆假期、中秋假期、五一假期、端午假期等节假日,共计S个相应时间段的应用场景;应用场景集合R表示为:
R={r月份工作日,r月份休息日,春节假期、国庆假期等节假日|r∈[1,12]}
进一步地,步骤2中对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线具体方法为:
采用高斯核函数作为非参数核密度估计的核函数K(x),再根据非参数核密度理论计算月用电量限值及以上用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值xk,y,s,i,m对应的概率密度函数fm(xk,y,s,i,m),其表达式为:
Figure BDA0002789643040000021
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,K(x)为高斯核函数,xk,y,s,i,m为用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值,T为计算应用场景s下第m点数据时刻的样本数据点数目,h为窗宽;
使用该式计算月用电量限值及以上用户k计量年份y应用场景s下的各时刻数据点对应的概率密度函数,形成最大概率密度曲线向量为:
Figure BDA0002789643040000022
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,xk,y,i,mp,m为用电量限值及以上用户k计量年份y应用场景s下的第i日第m时刻数据点概率密度函数fm(xk,y,s,i,m)取最大值时xk,y,s,i,m对应的数值;
而后计算参与典型日电量曲线向量提取的月用电量限值及以上用户k在计量年份y应用场景s下的第i日的96点日电量数据集:
Xk,y,s,i=[xk,y,s,i,1,xk,y,s,i,2,…,xk,y,s,i,m,…,xk,y,s,i,96]T相较于最大概率密度曲线向量
Figure BDA0002789643040000031
的权重wk,y,s,i,其计算公式为:
Figure BDA0002789643040000032
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,dk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据与最大概率密度曲线向量数据的差平方的平方根,wk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据相较于最大概率密度曲线向量数据的权重,λ为用以调整dk,y,s,i对wk,y,s,i的影响程度的可调参数,且λ∈[0,1],而dk,y,s,i计算公式为:
Figure BDA0002789643040000033
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数;
最后对参与不同场景下典型日电量曲线提取的各样本日的日电量曲线进行加权叠加以获得该用户相应场景下的典型日电量曲线,其计算公式为:
Figure BDA0002789643040000034
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,Xk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量曲线,
Figure BDA0002789643040000036
表示用户k在计量年份y应用场景s下的典型日电量曲线,其表示如下:
Figure BDA0002789643040000035
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000041
表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量;
进一步地,步骤2中所述对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类,具体分类为:
不同行业的用电行为和规律存在显著差别,据此将用户所在行业根据国民经济行业分类进行划分,具体划分如下:农、林、牧、渔业,工业,建筑业,交通运输、仓储和邮政业,信息传输、软件和信息技术服务业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业,公共服务及管理组织业;
进一步地,步骤3中所述对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据,其具体实现方法为:
首先根据月用电量限值及以上用户的计量年份y的日电量数据Uk,y,计算出月用电量限值及以上用户k在计量年份y检测场景s下的历史电量数据在同一时刻数据点的最大值与最小值:
Figure BDA0002789643040000042
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000043
为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最大值,
Figure BDA0002789643040000044
为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最小值;
通过步骤2所得典型日电量曲线
Figure BDA0002789643040000045
与历史电量数据的最大值和最小值,可计算出检测场景下历史数据域的上下限为:
Figure BDA0002789643040000046
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000047
表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量,
Figure BDA0002789643040000048
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的上限,
Figure BDA0002789643040000049
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的下限;
而后由电力公司结合历史经验确定各检测场景s下用户k允许变化的阈值系数Kk,s,并计算出电量数据可行域的上下限为:
Figure BDA0002789643040000051
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,s表示由电力公司确定的用户k检测场景s下允许变化的阈值系数,
Figure BDA0002789643040000052
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,
Figure BDA0002789643040000053
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限;
继而利用计算出的电量数据可行域上下限形成月用电量限值及以上k在计量年份y检测场景s下的电量数据可行域矩阵为:
Figure BDA0002789643040000054
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000055
表示月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,
Figure BDA0002789643040000056
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限,可行域矩阵的每一列元素
Figure BDA0002789643040000057
代表该时刻正常电量数据所处的阈值范围,
Figure BDA0002789643040000058
Figure BDA0002789643040000059
均为[-Kk,s,+Kk,s]之间的无量纲值;
在进行异常数据识别时,对检测场景s下的待检电量数据
Figure BDA00027896430400000510
Figure BDA00027896430400000511
中第m个分量满足
Figure BDA00027896430400000512
时,计算待检数据上限为:
Figure BDA00027896430400000513
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA00027896430400000514
为月用电量限值及以上用户k检测场景s下的第m数据点时刻待检测电量的数值,
Figure BDA00027896430400000515
为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的上限;
Figure BDA00027896430400000516
中第m个分量满足
Figure BDA00027896430400000517
时,计算待检数据下限为:
Figure BDA00027896430400000518
Figure BDA0002789643040000061
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000062
为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的下限;
当上下限均在可行域范围内时,则认为待检数据正常,无异常数据;当出现数值越限情况时,即可辨识出异常数据;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,其具体计算方法为:
Figure BDA0002789643040000063
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000064
为用户k相应场景s下经步骤3的异常数据辨识后发现的第i个单点异常数据出现时刻的修正电量数据,Kk,w为用户k的表计倍率,
Figure BDA0002789643040000065
为用户k的单点异常数据区间前后计量表码读数;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正,其具体计算方法为:
通过用户k相应场景s下异常数据区间前后计量表码读数相减可算得异常数据区间的总用电量Ek,t为:
Figure BDA0002789643040000066
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,w为用户k的表计倍率,
Figure BDA0002789643040000067
为用户k的多点异常数据区间前后表码读数,
Figure BDA0002789643040000068
表示用户k相应场景s下异常数据区间t内的总用电量;
继而根据步骤2中所得到的用户k在计量年份y相应场景s下的典型日电量曲线
Figure BDA0002789643040000069
对应多点数据异常区间的总用电量计算出缩放比例
Figure BDA00027896430400000610
为:
Figure BDA00027896430400000611
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA00027896430400000612
为用户k相应场景s下的缩放比例,
Figure BDA00027896430400000613
为用户k相应场景s下多点数据异常区间t内的总用电量,
Figure BDA00027896430400000614
为用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,n代表异常数据点个数;
则计算得到用户k相应场景s下在第i个异常时刻的电量数据修正值
Figure BDA0002789643040000071
为:
Figure BDA0002789643040000072
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000073
表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,
Figure BDA0002789643040000074
表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的修正电量数据;
进一步地,步骤4中所述对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,其具体实现方法为:
现货市场结算系统首先根据用户户号在系统中找到其所对应的行业用户分类代码,以此为依据寻找对应行业类型,在匹配到对应的行业之后,根据步骤2中对典型电量曲线应用场景的划分,每一行业用户所对应的典型电量曲线数目有S条,分别代表12个不同月份工作日对应的2条曲线、12个不同月份休息日所对应的2条曲线以及国庆假期、春节假期、中秋假期等节假日各自对应的2条曲线,现货市场结算系统将根据运行日所对应的时间自动匹配到对应的2条典型电量曲线供用户选择确认;
进一步地,步骤4中所述在典型曲线应用时进行去归一化操作得到用户的实际分时电量,其具体计算方法为:
在保证曲线形状不变的情况下,将典型电量曲线归一化后的分时电量根据用户的实际日用电总量还原成用户实际的分时电量:
Figure BDA0002789643040000075
其中,M表示所有现货市场用户中月用电量限值以下且不具备分时计量条件用户的数量,S表示典型电量曲线划分的应用场景数量,λk,s,m表示用户k应用场景s下对应行业典型日电量曲线m时刻数据点所对应的电量,Wk,s为用户k应用场景s下所消耗的相应日用电总量,qk,s,m为用户k应用场景s下使用典型电量曲线计算所得的m数据点时刻实际分时电量;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,其具体方法与采用线性插值的方法进行单点异常数据修正所用的方法相同;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用相似日拟合的方法进行多点缺失数据修正,其具体拟合方法为当月用电量限值以下且具备分时计量条件用户k的计量点连续时间内发生多点数据缺失时,取月用电量限值以下且具备分时计量条件用户k的计量点同期的电量数据进行相似日拟合,用拟合的数据替代缺失数据,以补全日分时计量电量曲线;
本发明优点在于,本发明所提出的包含用户样本电量数据分类、典型电量曲线应用场景划分、用户行业划分、典型日电量曲线提取、异常数据辨识、异常数据修正的全流程的面向现货市场结算的电量数据处理方案完整性高,所得到的用于结算的电量数据与真实电力电量数据误差小,将全套流程方法应用于现货市场结算中可以大大提高市场结算环节的准确率和效率。
附图说明:
图1:本发明方法流程图;
图2:非参数核密度估计提取的样本数据休息日典型日电量曲线;
图3:非参数核密度估计提取的样本数据国庆假期典型日电量曲线;
图4:非参数核密度估计提取的样本数据春节假期典型日电量曲线;
图5:非参数核密度估计提取的样本数据工作日典型日电量曲线;
图6:样本数据提取典型日电量曲线与历史电量数据形成的可行域;
图7:异常数据曲线映射至可行域结果;
图8:住宿和餐饮业2018年12月工作聚类所得典型电量曲线类型1;
图9:住宿和餐饮业2018年12月工作聚类所得典型电量曲线类型2;
图10:租赁和商务服务业2018年12月工作聚类所得典型电量曲线类型1;
图11:租赁和商务服务业2018年12月工作聚类所得典型电量曲线类型2;
图12:采用线性插值修正单点异常数据的效果;
图13:采用典型日电量曲线缩放修正多点异常数据的效果;
图14:采用相似日拟合修正多点数据缺失的效果;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图14介绍本发明的具体实施方式为一种实用的面向现货市场结算的电量数据处理方法,包括以下步骤:
步骤1:根据用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值,将计量年份y内用户每个月的月用电量均大于等于用户月用电量限值且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将月用电量限值以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
步骤1中根据云南省用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值为30万kW·h,将计量年份y内用户每个月的月用电量均大于等于30万kW·h且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将30万kW·h以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
对于月用电量30万kW·h及以上用户,选用属于住宿和餐饮业的某用户的2018年12月工作日的电量数据作为样本数据,该用户该月用电量为375.9万kW·h;对于月用电量30万kW·h以下且具备分时计量条件用户,选用属于住宿和餐饮业的某用户的2018年12月工作日的电量数据作为样本数据,该用户该月用电量为10.8万kW·h;
步骤1所述具备分时计量条件用户的计量年份y的日电量数据为:
Figure BDA0002789643040000081
其中,N表示所有现货市场用户中具备分时计量条件的用户的数量,Uk,y为月用电量限值及以上用户k在计量年份y的总共n日的日电量数据集,Xk,y,i为月用电量限值及以上用户k在计量年份y的第i日的96点日电量数据集:
Figure BDA0002789643040000082
其中,L表示计量年份y全年内的总天数,日电量数据为96个点以15分钟为颗粒度,将每日24小时以15分钟为时间段划分即可得到96个日电量计量数据点,xk,y,i,m为月用电量限值及以上用户k在计量年份y的第i日的第m点计量数据,m∈[1,96];
步骤2:对典型电量曲线的应用场景进行划分;对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类;
进一步地,步骤2中所述对典型电量曲线的应用场景进行划分,具体划分为:
为提高典型电量曲线的准确性,本发明根据用户实际用电行为和规律,可以将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及春节假期、国庆假期、中秋假期、五一假期、端午假期等节假日,共计S个相应时间段的应用场景;应用场景集合R表示为:
R={r月份工作日,r月份休息日,春节假期、国庆假期等节假日|r∈[1,12]}
例如可以将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及春节假期、国庆假期两个典型节假日场景,共计2*12+2=26个相应时间段的应用场景;
对前述属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户2018年12月休息日数据进行提取得到的该用户2018年12月休息日的典型日电量曲线与历史电量数据曲线如图2所示;并以该用户2018年国庆假期数据和春节假期数据提取得到的典型日电量曲线与历史电量数据曲线分别如图3和图4所示;
进一步地,步骤2中对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线具体方法为:
采用高斯核函数作为非参数核密度估计的核函数K(x),再根据非参数核密度理论计算月用电量限值及以上用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值xk,y,s,i,m对应的概率密度函数fm(xk,y,s,i,m),其表达式为:
Figure BDA0002789643040000091
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,K(x)为高斯核函数,xk,y,s,i,m为用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值,T为计算应用场景s下第m点数据时刻的样本数据点数目,h为窗宽;
使用该式计算月用电量限值及以上用户k计量年份y应用场景s下的各时刻数据点对应的概率密度函数,形成最大概率密度曲线向量为:
Figure BDA0002789643040000092
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,xk,y,i,mp,m为用电量限值及以上用户k计量年份y应用场景s下的第i日第m时刻数据点概率密度函数fm(xk,y,s,i,m)取最大值时xk,y,s,i,m对应的数值;
而后计算参与典型日电量曲线向量提取的月用电量限值及以上用户k在计量年份y应用场景s下的第i日的96点日电量数据集:
Xk,y,s,i=[xk,y,s,i,1,xk,y,s,i,2,…,xk,y,s,i,m,…,xk,y,s,i,96]T相较于最大概率密度曲线向量
Figure BDA0002789643040000101
的权重wk,y,s,i,其计算公式为:
Figure BDA0002789643040000102
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,dk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据与最大概率密度曲线向量数据的差平方的平方根,wk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据相较于最大概率密度曲线向量数据的权重,λ为用以调整dk,y,s,i对wk,y,s,i的影响程度的可调参数,且λ∈[0,1],而dk,y,s,i计算公式为:
Figure BDA0002789643040000103
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数;
最后对参与不同场景下典型日电量曲线提取的各样本日的日电量曲线进行加权叠加以获得该用户相应场景下的典型日电量曲线,其计算公式为:
Figure BDA0002789643040000104
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,Xk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量曲线,
Figure BDA0002789643040000105
表示用户k在计量年份y应用场景s下的典型日电量曲线,其表示如下:
Figure BDA0002789643040000106
Figure BDA0002789643040000111
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000112
表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量;
提取出的属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户2018年12月工作日的典型日电量曲线与历史电量数据曲线如图5所示;
进一步地,步骤2中所述对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类,具体分类为:
不同行业的用电行为和规律存在显著差别,据此将用户所在行业根据国民经济行业分类进行划分,具体划分如下:农、林、牧、渔业,工业,建筑业,交通运输、仓储和邮政业,信息传输、软件和信息技术服务业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业,公共服务及管理组织业;如表1所示;
表1用电用户所在行业的十一个大类分类
Figure BDA0002789643040000113
Figure BDA0002789643040000121
步骤3:对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线;
进一步地,步骤3中所述对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据,其具体实现方法为:
首先根据月用电量限值及以上用户的计量年份y的日电量数据Uk,y,计算出月用电量限值及以上用户k在计量年份y检测场景s下的历史电量数据在同一时刻数据点的最大值与最小值:
Figure BDA0002789643040000122
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000123
为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最大值,
Figure BDA0002789643040000124
为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最小值;
通过步骤2所得典型日电量曲线
Figure BDA0002789643040000125
与历史电量数据的最大值和最小值,可计算出检测场景下历史数据域的上下限为:
Figure BDA0002789643040000126
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000127
表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量,
Figure BDA0002789643040000128
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的上限,
Figure BDA0002789643040000129
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的下限;
而后由电力公司结合历史经验确定各检测场景s下用户k允许变化的阈值系数Kk,s,并计算出电量数据可行域的上下限为:
Figure BDA0002789643040000131
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,s表示由电力公司确定的用户k检测场景s下允许变化的阈值系数,
Figure BDA0002789643040000132
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,
Figure BDA0002789643040000133
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限;
继而利用计算出的电量数据可行域上下限形成月用电量限值及以上k在计量年份y检测场景s下的电量数据可行域矩阵为:
Figure BDA0002789643040000134
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000135
表示月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,
Figure BDA0002789643040000136
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限,可行域矩阵的每一列元素
Figure BDA0002789643040000137
代表该时刻正常电量数据所处的阈值范围,
Figure BDA0002789643040000138
Figure BDA0002789643040000139
均为[-Kk,s,+Kk,s]之间的无量纲值;
在进行异常数据识别时,对检测场景s下的待检电量数据
Figure BDA00027896430400001310
Figure BDA00027896430400001311
中第m个分量满足
Figure BDA00027896430400001312
时,计算待检数据上限为:
Figure BDA00027896430400001313
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA00027896430400001314
为月用电量限值及以上用户k检测场景s下的第m数据点时刻待检测电量的数值,
Figure BDA00027896430400001315
为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的上限;
Figure BDA00027896430400001316
中第m个分量满足
Figure BDA00027896430400001317
时,计算待检数据下限为:
Figure BDA00027896430400001318
Figure BDA0002789643040000141
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000142
为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的下限;
当上下限均在可行域范围内时,则认为待检数据正常,无异常数据;当出现数值越限情况时,即可辨识出异常数据;
以所选取属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户2018年12月份工作日数据为例,提取出的典型日电量曲线与历史电量数据形成的可行域如图6所示;并随机选取12月18日的第34至37数据点,将12月18日的第34、36数据点的电量数据放大为实际值的2倍,第35、37数据点的电量数据缩小为实际值的0.2倍作为异常数据点,采用该步骤中的方法进行异常数据的识别;将异常电量数据曲线映射至可行域,其结果如图7所示;
步骤3中所述使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线,以住宿和餐饮业、租赁和商务服务业2018年12月份工作日为例,通过聚类获得的典型电量曲线如图8-11所示;
步骤4:对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正;对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,并在典型电量曲线应用时进行去归一化操作得到用户的实际分时电量;对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,采用相似日拟合的方法进行多点缺失数据修正;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,其具体计算方法为:
Figure BDA0002789643040000143
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000144
为用户k相应场景s下经步骤3的异常数据辨识后发现的第i个单点异常数据出现时刻的修正电量数据,Kk,w为用户k的表计倍率,
Figure BDA0002789643040000145
为用户k的单点异常数据区间前后计量表码读数;
以所选取属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户12月29日第37个数据点出现表码数据单点异常为例,将造成第37与38数据点电量数据异常,采用线性插值的修正效果如图12所示;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正,其具体计算方法为:
通过用户k相应场景s下异常数据区间前后计量表码读数相减可算得异常数据区间的总用电量Ek,t为:
Figure BDA0002789643040000146
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,w为用户k的表计倍率,
Figure BDA0002789643040000151
为用户k的多点异常数据区间前后表码读数,
Figure BDA0002789643040000152
表示用户k相应场景s下异常数据区间t内的总用电量;
继而根据步骤2中所得到的用户k在计量年份y相应场景s下的典型日电量曲线
Figure BDA0002789643040000153
对应多点数据异常区间的总用电量计算出缩放比例
Figure BDA0002789643040000154
为:
Figure BDA0002789643040000155
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA0002789643040000156
为用户k相应场景s下的缩放比例,
Figure BDA0002789643040000157
为用户k相应场景s下多点数据异常区间t内的总用电量,
Figure BDA0002789643040000158
为用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,n代表异常数据点个数;
则计算得到用户k相应场景s下在第i个异常时刻的电量数据修正值
Figure BDA0002789643040000159
为:
Figure BDA00027896430400001510
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure BDA00027896430400001511
表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,
Figure BDA00027896430400001512
表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的修正电量数据;
对步骤3中识别出的多点异常数据进行修正,修正结果与真实电量对比如图13所示;
进一步地,步骤4中所述对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,其具体实现方法为:
现货市场结算系统首先根据用户户号在系统中找到其所对应的行业用户分类代码,以此为依据寻找对应行业类型,在匹配到对应的行业之后,根据步骤2中对典型电量曲线应用场景的划分,每一行业用户所对应的典型电量曲线数目有S条,分别代表12个不同月份工作日对应的2条曲线、12个不同月份休息日所对应的2条曲线以及国庆假期、春节假期、中秋假期等节假日各自对应的2条曲线,现货市场结算系统将根据运行日所对应的时间自动匹配到对应的2条典型电量曲线供用户选择确认;
进一步地,步骤4中所述在典型曲线应用时进行去归一化操作得到用户的实际分时电量,其具体计算方法为:
在保证曲线形状不变的情况下,将典型电量曲线归一化后的分时电量根据用户的实际日用电总量还原成用户实际的分时电量:
Figure BDA00027896430400001513
其中,M表示所有现货市场用户中月用电量限值以下且不具备分时计量条件用户的数量,S表示典型电量曲线划分的应用场景数量,λk,s,m表示用户k应用场景s下对应行业典型日电量曲线m时刻数据点所对应的电量,Wk,s为用户k应用场景s下所消耗的相应日用电总量,qk,s,m为用户k应用场景s下使用典型电量曲线计算所得的m数据点时刻实际分时电量;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,其具体方法与采用线性插值的方法进行单点异常数据修正所用的方法相同;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用相似日拟合的方法进行多点缺失数据修正,其具体拟合方法为当月用电量限值以下且具备分时计量条件用户k的计量点连续时间内发生多点数据缺失时,取月用电量限值以下且具备分时计量条件用户k的计量点同期的电量数据进行相似日拟合,用拟合的数据替代缺失数据,以补全日分时计量电量曲线;具体拟合规则示例如下:
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间在工作日内,则取前推n个同期用户k的计量点日数据,并对n个数据取平均值,以所得平均值拟合替代缺失数据,n的取值在制定规则时根据可实行性、便捷性和可靠性原则选取;
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间在休息日内,则取前推n个同期用户k的计量点日数据,并对n个数据取平均值,以所得平均值拟合替代缺失数据,n的取值在制定规则时根据可实行性、便捷性和可靠性原则选取;
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间在春节假期或者国庆假期内,则取去年春节假期或者国庆假期区间用户k的计量点日数据,以拟合替代缺失数据;
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间无n个同期计量点日数据或去年春节假期或者国庆假期区间计量点日数据,则可采用近m周内的同时段电量数据取平均值,以所得平均值拟合替代缺失数据,m的取值在制定规则时根据可实行性、便捷性和可靠性原则选取;
对所选取属于住宿和餐饮业的2018年12月月用电量10.8万kW·h的用户的多点缺失数据进行相似日拟合,拟合结果与真实电量对比如图14所示;
步骤5:通过步骤4分别得到月用电量限值及以上用户、月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户的修正电量数据作为结算电量数据,并用于现货市场的结算环节。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种实用的面向现货市场结算的电量数据处理方法,其特征在于,包括以下步骤:
步骤1:根据用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值,将计量年份y内用户每个月的月用电量均大于等于用户月用电量限值且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将月用电量限值以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
步骤2:对典型电量曲线的应用场景进行划分;对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类;
步骤3:对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线;
步骤4:对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正;对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,并在典型电量曲线应用时进行去归一化操作得到用户的实际分时电量;对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,采用相似日拟合的方法进行多点缺失数据修正;
步骤5:通过步骤4分别得到月用电量限值及以上用户、月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户的修正电量数据作为结算电量数据,并用于现货市场的结算环节。
2.根据权利要求1所述的实用的面向现货市场结算的电量数据处理方法,其特征在于:
步骤1所述具备分时计量条件用户的计量年份y的日电量数据为:
Uk,y=(Xk,y,1,Xk,y,2,…,Xk,y,n)
k∈[1,N]
其中,N表示所有现货市场用户中具备分时计量条件的用户的数量,Uk,y为月用电量限值及以上用户k在计量年份y的总共n日的日电量数据集,Xk,y,i为月用电量限值及以上用户k在计量年份y的第i日的96点日电量数据集:
Xk,y,i=[xk,y,i,1,xk,y,i,2,…,xk,y,i,m,…,xk,y,i,96]T
i∈[1,L]
其中,L表示计量年份y全年内的总天数,日电量数据为96个点以15分钟为颗粒度,将每日24小时以15分钟为时间段划分即可得到96个日电量计量数据点,xk,y,i,m为月用电量限值及以上用户k在计量年份y的第i日的第m点计量数据,m∈[1,96]。
3.根据权利要求1所述的实用的面向现货市场结算的电量数据处理方法,其特征在于:
步骤2中所述对典型电量曲线的应用场景进行划分,具体划分为:
为提高典型电量曲线的准确性,本发明根据用户实际用电行为和规律,可以将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及春节假期、国庆假期、中秋假期、五一假期、端午假期等节假日,共计S个相应时间段的应用场景;应用场景集合R表示为:
R={r月份工作日,r月份休息日,春节假期、国庆假期等节假日|r∈[1,12]}
步骤2中对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线具体方法为:
采用高斯核函数作为非参数核密度估计的核函数K(x),再根据非参数核密度理论计算月用电量限值及以上用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值xk,y,s,i,m对应的概率密度函数fm(xk,y,s,i,m),其表达式为:
Figure FDA0002789643030000021
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,K(x)为高斯核函数,xk,y,s,i,m为用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值,T为计算应用场景s下第m点数据时刻的样本数据点数目,h为窗宽;
使用该式计算月用电量限值及以上用户k计量年份y应用场景s下的各时刻数据点对应的概率密度函数,形成最大概率密度曲线向量为:
Figure FDA0002789643030000022
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,xk,y,i,mp,m为用电量限值及以上用户k计量年份y应用场景s下的第i日第m时刻数据点概率密度函数fm(xk,y,s,i,m)取最大值时xk,y,s,i,m对应的数值;
而后计算参与典型日电量曲线向量提取的月用电量限值及以上用户k在计量年份y应用场景s下的第i日的96点日电量数据集:
Xk,y,s,i=[xk,y,s,i,1,xk,y,s,i,2,…,xk,y,s,i,m,…,xk,y,s,i,96]T相较于最大概率密度曲线向量
Figure FDA0002789643030000023
的权重wk,y,s,i,其计算公式为:
Figure FDA0002789643030000024
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,dk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据与最大概率密度曲线向量数据的差平方的平方根,wk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据相较于最大概率密度曲线向量数据的权重,λ为用以调整dk,y,s,i对wk,y,s,i的影响程度的可调参数,且λ∈[0,1],而dk,y,s,i计算公式为:
Figure FDA0002789643030000031
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数;
最后对参与不同场景下典型日电量曲线提取的各样本日的日电量曲线进行加权叠加以获得该用户相应场景下的典型日电量曲线,其计算公式为:
Figure FDA0002789643030000032
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,Xk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量曲线,
Figure FDA0002789643030000033
表示用户k在计量年份y应用场景s下的典型日电量曲线,其表示如下:
Figure FDA0002789643030000034
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA0002789643030000035
表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量;
步骤2中所述对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类,具体分类为:
不同行业的用电行为和规律存在显著差别,据此将用户所在行业根据国民经济行业分类进行划分,具体划分如下:农、林、牧、渔业,工业,建筑业,交通运输、仓储和邮政业,信息传输、软件和信息技术服务业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业,公共服务及管理组织业。
4.根据权利要求1所述的实用的面向现货市场结算的电量数据处理方法,其特征在于:
步骤3中所述对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据,其具体实现方法为:
首先根据月用电量限值及以上用户的计量年份y的日电量数据Uk,y,计算出月用电量限值及以上用户k在计量年份y检测场景s下的历史电量数据在同一时刻数据点的最大值与最小值:
Figure FDA0002789643030000041
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA0002789643030000042
为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最大值,
Figure FDA0002789643030000043
为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最小值;
通过步骤2所得典型日电量曲线
Figure FDA0002789643030000044
与历史电量数据的最大值和最小值,可计算出检测场景下历史数据域的上下限为:
Figure FDA0002789643030000045
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA0002789643030000046
表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量,
Figure FDA0002789643030000047
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的上限,
Figure FDA0002789643030000048
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的下限;
而后由电力公司结合历史经验确定各检测场景s下用户k允许变化的阈值系数Kk,s,并计算出电量数据可行域的上下限为:
Figure FDA0002789643030000049
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,s表示由电力公司确定的用户k检测场景s下允许变化的阈值系数,
Figure FDA00027896430300000410
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,
Figure FDA00027896430300000411
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限;
继而利用计算出的电量数据可行域上下限形成月用电量限值及以上k在计量年份y检测场景s下的电量数据可行域矩阵为:
Figure FDA0002789643030000051
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA0002789643030000052
表示月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,
Figure FDA0002789643030000053
为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限,可行域矩阵的每一列元素
Figure FDA0002789643030000054
代表该时刻正常电量数据所处的阈值范围,
Figure FDA0002789643030000055
Figure FDA0002789643030000056
均为[-Kk,s,+Kk,s]之间的无量纲值;
在进行异常数据识别时,对检测场景s下的待检电量数据
Figure FDA0002789643030000057
Figure FDA0002789643030000058
中第m个分量满足
Figure FDA0002789643030000059
时,计算待检数据上限为:
Figure FDA00027896430300000510
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA00027896430300000511
为月用电量限值及以上用户k检测场景s下的第m数据点时刻待检测电量的数值,
Figure FDA00027896430300000512
为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的上限;
Figure FDA00027896430300000513
中第m个分量满足
Figure FDA00027896430300000514
时,计算待检数据下限为:
Figure FDA00027896430300000515
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA00027896430300000516
为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的下限;
当上下限均在可行域范围内时,则认为待检数据正常,无异常数据;当出现数值越限情况时,即可辨识出异常数据。
5.根据权利要求1所述的实用的面向现货市场结算的电量数据处理方法,其特征在于:
步骤4中所述对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,其具体计算方法为:
Figure FDA00027896430300000517
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA0002789643030000061
为用户k相应场景s下经步骤3的异常数据辨识后发现的第i个单点异常数据出现时刻的修正电量数据,Kk,w为用户k的表计倍率,
Figure FDA0002789643030000062
为用户k的单点异常数据区间前后计量表码读数;
步骤4中所述对于月用电量限值及以上用户,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正,其具体计算方法为:
通过用户k相应场景s下异常数据区间前后计量表码读数相减可算得异常数据区间的总用电量Ek,t为:
Figure FDA0002789643030000063
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,w为用户k的表计倍率,
Figure FDA0002789643030000064
为用户k的多点异常数据区间前后表码读数,
Figure FDA0002789643030000065
表示用户k相应场景s下异常数据区间t内的总用电量;
继而根据步骤2中所得到的用户k在计量年份y相应场景s下的典型日电量曲线
Figure FDA0002789643030000066
对应多点数据异常区间的总用电量计算出缩放比例
Figure FDA0002789643030000067
为:
Figure FDA0002789643030000068
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA0002789643030000069
为用户k相应场景s下的缩放比例,
Figure FDA00027896430300000610
为用户k相应场景s下多点数据异常区间t内的总用电量,
Figure FDA00027896430300000611
为用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,n代表异常数据点个数;
则计算得到用户k相应场景s下在第i个异常时刻的电量数据修正值
Figure FDA00027896430300000612
为:
Figure FDA00027896430300000613
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,
Figure FDA00027896430300000614
表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,
Figure FDA00027896430300000615
表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的修正电量数据;
步骤4中所述对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,其具体实现方法为:
现货市场结算系统首先根据用户户号在系统中找到其所对应的行业用户分类代码,以此为依据寻找对应行业类型,在匹配到对应的行业之后,根据步骤2中对典型电量曲线应用场景的划分,每一行业用户所对应的典型电量曲线数目有S条,分别代表12个不同月份工作日对应的2条曲线、12个不同月份休息日所对应的2条曲线以及国庆假期、春节假期、中秋假期等节假日各自对应的2条曲线,现货市场结算系统将根据运行日所对应的时间自动匹配到对应的2条典型电量曲线供用户选择确认;
步骤4中所述在典型曲线应用时进行去归一化操作得到用户的实际分时电量,其具体计算方法为:
在保证曲线形状不变的情况下,将典型电量曲线归一化后的分时电量根据用户的实际日用电总量还原成用户实际的分时电量:
Figure FDA0002789643030000071
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值以下且不具备分时计量条件用户的数量,S表示典型电量曲线划分的应用场景数量,λk,s,m表示用户k应用场景s下对应行业典型日电量曲线m时刻数据点所对应的电量,Wk,s为用户k应用场景s下所消耗的相应日用电总量,qk,s,m为用户k应用场景s下使用典型电量曲线计算所得的m数据点时刻实际分时电量;
步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,其具体方法与采用线性插值的方法进行单点异常数据修正所用的方法相同;
步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用相似日拟合的方法进行多点缺失数据修正,其具体拟合方法为当月用电量限值以下且具备分时计量条件用户k的计量点连续时间内发生多点数据缺失时,取月用电量限值以下且具备分时计量条件用户k的计量点同期的电量数据进行相似日拟合,用拟合的数据替代缺失数据,以补全日分时计量电量曲线。
CN202011310408.0A 2020-11-20 2020-11-20 一种面向现货市场结算的电量数据处理方法 Active CN112381433B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011310408.0A CN112381433B (zh) 2020-11-20 2020-11-20 一种面向现货市场结算的电量数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011310408.0A CN112381433B (zh) 2020-11-20 2020-11-20 一种面向现货市场结算的电量数据处理方法

Publications (2)

Publication Number Publication Date
CN112381433A true CN112381433A (zh) 2021-02-19
CN112381433B CN112381433B (zh) 2023-08-11

Family

ID=74584397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011310408.0A Active CN112381433B (zh) 2020-11-20 2020-11-20 一种面向现货市场结算的电量数据处理方法

Country Status (1)

Country Link
CN (1) CN112381433B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925827A (zh) * 2021-03-04 2021-06-08 南京怡晟安全技术研究院有限公司 一种基于电力采集物联数据的用户性质异常分析方法
CN113379440A (zh) * 2021-03-25 2021-09-10 国电南瑞科技股份有限公司 基于相似日的电力现货市场电量申报信息优化方法及系统
CN113837324A (zh) * 2021-11-25 2021-12-24 四川瑞康智慧能源有限公司 电量数据监测方法、系统、存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583951A (zh) * 2018-11-29 2019-04-05 浙江电力交易中心有限公司 一种电力市场差价合约电量分解技术及分解结果综合评估方法
CN110245972A (zh) * 2019-04-26 2019-09-17 国网浙江省电力有限公司衢州供电公司 一种电网多电价计量及调度系统
CN111125633A (zh) * 2019-11-14 2020-05-08 广东电力交易中心有限责任公司 电力市场交易的分解曲线计算方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583951A (zh) * 2018-11-29 2019-04-05 浙江电力交易中心有限公司 一种电力市场差价合约电量分解技术及分解结果综合评估方法
CN110245972A (zh) * 2019-04-26 2019-09-17 国网浙江省电力有限公司衢州供电公司 一种电网多电价计量及调度系统
CN111125633A (zh) * 2019-11-14 2020-05-08 广东电力交易中心有限责任公司 电力市场交易的分解曲线计算方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925827A (zh) * 2021-03-04 2021-06-08 南京怡晟安全技术研究院有限公司 一种基于电力采集物联数据的用户性质异常分析方法
CN112925827B (zh) * 2021-03-04 2024-05-10 南京怡晟安全技术研究院有限公司 一种基于电力采集物联数据的用户性质异常分析方法
CN113379440A (zh) * 2021-03-25 2021-09-10 国电南瑞科技股份有限公司 基于相似日的电力现货市场电量申报信息优化方法及系统
CN113837324A (zh) * 2021-11-25 2021-12-24 四川瑞康智慧能源有限公司 电量数据监测方法、系统、存储介质和电子设备

Also Published As

Publication number Publication date
CN112381433B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN109445972B (zh) 数据修复方法、装置、设备和存储介质
CN112381433A (zh) 一种实用的面向现货市场结算的电量数据处理方法
Kim The errors in the variables problem in the cross‐section of expected stock returns
Clements et al. Modelling interregional links in electricity price spikes
CN106682763B (zh) 一种用于大量样本数据的电力负荷优化预测方法
JP6009864B2 (ja) 企業評価システム、企業評価方法及び企業評価プログラム
CN110852856A (zh) 一种基于动态网络表征的发票虚开识别方法
Guo et al. The Nelson–Siegel model of the term structure of option implied volatility and volatility components
US8694413B1 (en) Computer-based systems and methods for determining interest levels of consumers in research work product produced by a research department
CN114611738A (zh) 一种基于用户用电行为分析的负荷预测方法
CN108304990B (zh) 一种停电敏感预判方法和系统
CN116050866A (zh) 基于典型负荷曲线的组合式用户缺失电量拟合方法及系统
CN111178690A (zh) 基于风控评分卡模型的用电客户窃电风险评估方法
CN113962504A (zh) 一种配电网规划方案成本效益比计算方法
CN114676931B (zh) 一种基于数据中台技术的电量预测系统
CN111476458A (zh) 一种基于大数据的财务交易风险评估方法
Gürtler et al. Pitfalls in modeling loss given default of bank loans
CN114140176B (zh) 一种负荷聚集平台的可调容量预测方法及装置
Adesi et al. VaR without correlations for portfolios of derivative securities
CN115689713A (zh) 异常风险数据处理方法、装置、计算机设备和存储介质
CN115439265A (zh) 一种保险行业智能赔付异常交易风险控制系统
CN107704723A (zh) 一种基于斜率关联度的显著变量选择方法
CN114154617A (zh) 一种基于vfl的低压居民用户异常用电识别方法及系统
CN113298575A (zh) 一种商标价值批量评估的方法、系统、设备及存储介质
CN113191872A (zh) 一种基于银行流水收支重合度的不规范行为判断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant