CN112381433B - 一种面向现货市场结算的电量数据处理方法 - Google Patents
一种面向现货市场结算的电量数据处理方法 Download PDFInfo
- Publication number
- CN112381433B CN112381433B CN202011310408.0A CN202011310408A CN112381433B CN 112381433 B CN112381433 B CN 112381433B CN 202011310408 A CN202011310408 A CN 202011310408A CN 112381433 B CN112381433 B CN 112381433B
- Authority
- CN
- China
- Prior art keywords
- data
- user
- electric quantity
- limit value
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 238000010276 construction Methods 0.000 claims abstract description 6
- 230000005611 electricity Effects 0.000 claims description 327
- 230000002159 abnormal effect Effects 0.000 claims description 82
- 238000000034 method Methods 0.000 claims description 58
- 238000001514 detection method Methods 0.000 claims description 33
- 238000005259 measurement Methods 0.000 claims description 31
- 238000012937 correction Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 230000006399 behavior Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000000295 complement effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06312—Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种实用的面向现货市场结算的电量数据处理方法,针对现有电力计量体系不完备与现货市场建设迫切需要的矛盾下存在的不完备计量体系所得计量数据难以用于现货市场结算的问题,提出了包含用户样本电量数据分类、典型电量曲线应用场景划分、用户行业划分、典型日电量曲线提取、异常数据辨识、异常数据修正的全流程的面向现货市场结算的电量数据处理方案,可得到用户修正电量数据作为结算电量数据并用于现货市场结算环节,所提电量数据处理方法完整性高,所得到用于结算的电量数据与真实电力电量数据误差小,将全套流程方法应用于现货市场结算中可以大大提高市场结算环节的准确率和效率。
Description
技术领域
本发明涉及现货市场结算领域,具体涉及一种面向现货市场结算的电量数据处理方法。
背景技术
电力结算是电力现货市场的最根本环节,现货市场的建设将对我国电力市场交易中的结算环节的可靠性、及时性、有效性和准确性提出更高要求。而现有电力计量体系的不完备与现货市场建设的迫切需要形成当前现货市场改革下的主要矛盾之一。不完备计量体系下所得到的计量数据难以用于现货市场的结算,因此需要面向现货市场结算环节,对电量数据进行数据处理并给出实用的电量数据处理方法,以得到可用于现货市场结算的电力电量数据。
发明内容
本发明提供了一种面向现货市场结算的电量数据处理方法,用以提高现货市场结算环节的准确度和效率。针对电力计量体系不完备带来的现有计量数据不能满足现货市场结算环节的需要的问题,需要对计量电量数据进行数据处理,以得到可用于现货市场结算的电力电量数据。
为实现上述目的,本发明采用下述技术方案:
一种面向现货市场结算的电量数据处理方法,包括以下步骤:
步骤1:根据用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值,将计量年份y内用户每个月的月用电量均大于等于用户月用电量限值且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将月用电量限值以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
步骤2:对典型电量曲线的应用场景进行划分;对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类;
步骤3:对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线;
步骤4:对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正;对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,并在典型电量曲线应用时进行去归一化操作得到用户的实际分时电量;对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,采用相似日拟合的方法进行多点缺失数据修正;
步骤5:通过步骤4分别得到月用电量限值及以上用户、月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户的修正电量数据作为结算电量数据,并用于现货市场的结算环节。
进一步地,步骤1所述具备分时计量条件用户的计量年份y的日电量数据为:
Uk,y=(Xk,y,1,Xk,y,2,…,Xk,y,n)
k∈[1,N]
其中,N表示所有现货市场用户中具备分时计量条件的用户的数量,Uk,y为月用电量限值及以上用户k在计量年份y的总共n日的日电量数据集,Xk,y,i为月用电量限值及以上用户k在计量年份y的第i日的96点日电量数据集:
Xk,y,i=[xk,y,i,1,xk,y,i,2,…,xk,y,i,m,…,xk,y,i,96]T
i∈[1,L]
其中,L表示计量年份y全年内的总天数,日电量数据为96个点以15分钟为颗粒度,将每日24小时以15分钟为时间段划分即可得到96个日电量计量数据点,xk,y,i,m为月用电量限值及以上用户k在计量年份y的第i日的第m点计量数据,m∈[1,96];
进一步地,步骤2中所述对典型电量曲线的应用场景进行划分,具体划分为:
为提高典型电量曲线的准确性,本发明根据用户实际用电行为和规律,可以将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及春节假期、国庆假期、中秋假期、五一假期、端午假期等节假日,共计S个相应时间段的应用场景;应用场景集合R表示为:
R={r月份工作日,r月份休息日,春节假期、国庆假期等节假日|r∈[1,12]}
进一步地,步骤2中对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线具体方法为:
采用高斯核函数作为非参数核密度估计的核函数K(x),再根据非参数核密度理论计算月用电量限值及以上用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值xk,y,s,i,m对应的概率密度函数fm(xk,y,s,i,m),其表达式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,K(x)为高斯核函数,xk,y,s,i,m为用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值,T为计算应用场景s下第m点数据时刻的样本数据点数目,h为窗宽;
使用该式计算月用电量限值及以上用户k计量年份y应用场景s下的各时刻数据点对应的概率密度函数,形成最大概率密度曲线向量为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,xk,y,i,mp,m为用电量限值及以上用户k计量年份y应用场景s下的第i日第m时刻数据点概率密度函数fm(xk,y,s,i,m)取最大值时xk,y,s,i,m对应的数值;
而后计算参与典型日电量曲线向量提取的月用电量限值及以上用户k在计量年份y应用场景s下的第i日的96点日电量数据集:
Xk,y,s,i=[xk,y,s,i,1,xk,y,s,i,2,…,xk,y,s,i,m,…,xk,y,s,i,96]T相较于最大概率密度曲线向量的权重wk,y,s,i,其计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,dk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据与最大概率密度曲线向量数据的差平方的平方根,wk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据相较于最大概率密度曲线向量数据的权重,λ为用以调整dk,y,s,i对wk,y,s,i的影响程度的可调参数,且λ∈[0,1],而dk,y,s,i计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数;
最后对参与不同场景下典型日电量曲线提取的各样本日的日电量曲线进行加权叠加以获得该用户相应场景下的典型日电量曲线,其计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,Xk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量曲线,表示用户k在计量年份y应用场景s下的典型日电量曲线,其表示如下:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量;
进一步地,步骤2中所述对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类,具体分类为:
不同行业的用电行为和规律存在显著差别,据此将用户所在行业根据国民经济行业分类进行划分,具体划分如下:农、林、牧、渔业,工业,建筑业,交通运输、仓储和邮政业,信息传输、软件和信息技术服务业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业,公共服务及管理组织业;
进一步地,步骤3中所述对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据,其具体实现方法为:
首先根据月用电量限值及以上用户的计量年份y的日电量数据Uk,y,计算出月用电量限值及以上用户k在计量年份y检测场景s下的历史电量数据在同一时刻数据点的最大值与最小值:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最大值,为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最小值;
通过步骤2所得典型日电量曲线与历史电量数据的最大值和最小值,可计算出检测场景下历史数据域的上下限为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的下限;
而后由电力公司结合历史经验确定各检测场景s下用户k允许变化的阈值系数Kk,s,并计算出电量数据可行域的上下限为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,s表示由电力公司确定的用户k检测场景s下允许变化的阈值系数,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限;
继而利用计算出的电量数据可行域上下限形成月用电量限值及以上k在计量年份y检测场景s下的电量数据可行域矩阵为:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限,可行域矩阵的每一列元素代表该时刻正常电量数据所处的阈值范围,和均为[-Kk,s,+Kk,s]之间的无量纲值;
在进行异常数据识别时,对检测场景s下的待检电量数据
当中第m个分量满足时,计算待检数据上限为:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k检测场景s下的第m数据点时刻待检测电量的数值,为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的上限;
当中第m个分量满足时,计算待检数据下限为:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的下限;
当上下限均在可行域范围内时,则认为待检数据正常,无异常数据;当出现数值越限情况时,即可辨识出异常数据;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,其具体计算方法为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为用户k相应场景s下经步骤3的异常数据辨识后发现的第i个单点异常数据出现时刻的修正电量数据,Kk,w为用户k的表计倍率,为用户k的单点异常数据区间前后计量表码读数;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正,其具体计算方法为:
通过用户k相应场景s下异常数据区间前后计量表码读数相减可算得异常数据区间的总用电量Ek,t为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,w为用户k的表计倍率,为用户k的多点异常数据区间前后表码读数,表示用户k相应场景s下异常数据区间t内的总用电量;
继而根据步骤2中所得到的用户k在计量年份y相应场景s下的典型日电量曲线对应多点数据异常区间的总用电量计算出缩放比例为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为用户k相应场景s下的缩放比例,为用户k相应场景s下多点数据异常区间t内的总用电量,为用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,n代表异常数据点个数;
则计算得到用户k相应场景s下在第i个异常时刻的电量数据修正值为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的修正电量数据;
进一步地,步骤4中所述对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,其具体实现方法为:
现货市场结算系统首先根据用户户号在系统中找到其所对应的行业用户分类代码,以此为依据寻找对应行业类型,在匹配到对应的行业之后,根据步骤2中对典型电量曲线应用场景的划分,每一行业用户所对应的典型电量曲线数目有S条,分别代表12个不同月份工作日对应的2条曲线、12个不同月份休息日所对应的2条曲线以及国庆假期、春节假期、中秋假期等节假日各自对应的2条曲线,现货市场结算系统将根据运行日所对应的时间自动匹配到对应的2条典型电量曲线供用户选择确认;
进一步地,步骤4中所述在典型曲线应用时进行去归一化操作得到用户的实际分时电量,其具体计算方法为:
在保证曲线形状不变的情况下,将典型电量曲线归一化后的分时电量根据用户的实际日用电总量还原成用户实际的分时电量:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值以下且不具备分时计量条件用户的数量,S表示典型电量曲线划分的应用场景数量,λk,s,m表示用户k应用场景s下对应行业典型日电量曲线m时刻数据点所对应的电量,Wk,s为用户k应用场景s下所消耗的相应日用电总量,qk,s,m为用户k应用场景s下使用典型电量曲线计算所得的m数据点时刻实际分时电量;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,其具体方法与采用线性插值的方法进行单点异常数据修正所用的方法相同;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用相似日拟合的方法进行多点缺失数据修正,其具体拟合方法为当月用电量限值以下且具备分时计量条件用户k的计量点连续时间内发生多点数据缺失时,取月用电量限值以下且具备分时计量条件用户k的计量点同期的电量数据进行相似日拟合,用拟合的数据替代缺失数据,以补全日分时计量电量曲线;
本发明优点在于,本发明所提出的包含用户样本电量数据分类、典型电量曲线应用场景划分、用户行业划分、典型日电量曲线提取、异常数据辨识、异常数据修正的全流程的面向现货市场结算的电量数据处理方案完整性高,所得到的用于结算的电量数据与真实电力电量数据误差小,将全套流程方法应用于现货市场结算中可以大大提高市场结算环节的准确率和效率。
附图说明:
图1:本发明方法流程图;
图2:非参数核密度估计提取的样本数据休息日典型日电量曲线;
图3:非参数核密度估计提取的样本数据国庆假期典型日电量曲线;
图4:非参数核密度估计提取的样本数据春节假期典型日电量曲线;
图5:非参数核密度估计提取的样本数据工作日典型日电量曲线;
图6:样本数据提取典型日电量曲线与历史电量数据形成的可行域;
图7:异常数据曲线映射至可行域结果;
图8:住宿和餐饮业2018年12月工作聚类所得典型电量曲线类型1;
图9:住宿和餐饮业2018年12月工作聚类所得典型电量曲线类型2;
图10:租赁和商务服务业2018年12月工作聚类所得典型电量曲线类型1;
图11:租赁和商务服务业2018年12月工作聚类所得典型电量曲线类型2;
图12:采用线性插值修正单点异常数据的效果;
图13:采用典型日电量曲线缩放修正多点异常数据的效果;
图14:采用相似日拟合修正多点数据缺失的效果;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图14介绍本发明的具体实施方式为一种面向现货市场结算的电量数据处理方法,包括以下步骤:
步骤1:根据用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值,将计量年份y内用户每个月的月用电量均大于等于用户月用电量限值且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将月用电量限值以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
步骤1中根据云南省用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值为30万kW·h,将计量年份y内用户每个月的月用电量均大于等于30万kW·h且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将30万kW·h以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
对于月用电量30万kW·h及以上用户,选用属于住宿和餐饮业的某用户的2018年12月工作日的电量数据作为样本数据,该用户该月用电量为375.9万kW·h;对于月用电量30万kW·h以下且具备分时计量条件用户,选用属于住宿和餐饮业的某用户的2018年12月工作日的电量数据作为样本数据,该用户该月用电量为10.8万kW·h;
步骤1所述具备分时计量条件用户的计量年份y的日电量数据为:
其中,N表示所有现货市场用户中具备分时计量条件的用户的数量,Uk,y为月用电量限值及以上用户k在计量年份y的总共n日的日电量数据集,Xk,y,i为月用电量限值及以上用户k在计量年份y的第i日的96点日电量数据集:
其中,L表示计量年份y全年内的总天数,日电量数据为96个点以15分钟为颗粒度,将每日24小时以15分钟为时间段划分即可得到96个日电量计量数据点,xk,y,i,m为月用电量限值及以上用户k在计量年份y的第i日的第m点计量数据,m∈[1,96];
步骤2:对典型电量曲线的应用场景进行划分;对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类;
进一步地,步骤2中所述对典型电量曲线的应用场景进行划分,具体划分为:
为提高典型电量曲线的准确性,本发明根据用户实际用电行为和规律,可以将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及春节假期、国庆假期、中秋假期、五一假期、端午假期等节假日,共计S个相应时间段的应用场景;应用场景集合R表示为:
R={r月份工作日,r月份休息日,春节假期、国庆假期等节假日|r∈[1,12]}
例如可以将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及春节假期、国庆假期两个典型节假日场景,共计2*12+2=26个相应时间段的应用场景;
对前述属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户2018年12月休息日数据进行提取得到的该用户2018年12月休息日的典型日电量曲线与历史电量数据曲线如图2所示;并以该用户2018年国庆假期数据和春节假期数据提取得到的典型日电量曲线与历史电量数据曲线分别如图3和图4所示;
进一步地,步骤2中对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线具体方法为:
采用高斯核函数作为非参数核密度估计的核函数K(x),再根据非参数核密度理论计算月用电量限值及以上用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值xk,y,s,i,m对应的概率密度函数fm(xk,y,s,i,m),其表达式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,K(x)为高斯核函数,xk,y,s,i,m为用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值,T为计算应用场景s下第m点数据时刻的样本数据点数目,h为窗宽;
使用该式计算月用电量限值及以上用户k计量年份y应用场景s下的各时刻数据点对应的概率密度函数,形成最大概率密度曲线向量为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,xk,y,i,mp,m为用电量限值及以上用户k计量年份y应用场景s下的第i日第m时刻数据点概率密度函数fm(xk,y,s,i,m)取最大值时xk,y,s,i,m对应的数值;
而后计算参与典型日电量曲线向量提取的月用电量限值及以上用户k在计量年份y应用场景s下的第i日的96点日电量数据集:
Xk,y,s,i=[xk,y,s,i,1,xk,y,s,i,2,…,xk,y,s,i,m,…,xk,y,s,i,96]T相较于最大概率密度曲线向量的权重wk,y,s,i,其计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,dk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据与最大概率密度曲线向量数据的差平方的平方根,wk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据相较于最大概率密度曲线向量数据的权重,λ为用以调整dk,y,s,i对wk,y,s,i的影响程度的可调参数,且λ∈[0,1],而dk,y,s,i计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数;
最后对参与不同场景下典型日电量曲线提取的各样本日的日电量曲线进行加权叠加以获得该用户相应场景下的典型日电量曲线,其计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,Xk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量曲线,表示用户k在计量年份y应用场景s下的典型日电量曲线,其表示如下:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量;
提取出的属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户2018年12月工作日的典型日电量曲线与历史电量数据曲线如图5所示;
进一步地,步骤2中所述对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类,具体分类为:
不同行业的用电行为和规律存在显著差别,据此将用户所在行业根据国民经济行业分类进行划分,具体划分如下:农、林、牧、渔业,工业,建筑业,交通运输、仓储和邮政业,信息传输、软件和信息技术服务业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业,公共服务及管理组织业;如表1所示;
表1用电用户所在行业的十一个大类分类
步骤3:对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线;
进一步地,步骤3中所述对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据,其具体实现方法为:
首先根据月用电量限值及以上用户的计量年份y的日电量数据Uk,y,计算出月用电量限值及以上用户k在计量年份y检测场景s下的历史电量数据在同一时刻数据点的最大值与最小值:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最大值,为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最小值;
通过步骤2所得典型日电量曲线与历史电量数据的最大值和最小值,可计算出检测场景下历史数据域的上下限为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的下限;
而后由电力公司结合历史经验确定各检测场景s下用户k允许变化的阈值系数Kk,s,并计算出电量数据可行域的上下限为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,s表示由电力公司确定的用户k检测场景s下允许变化的阈值系数,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限;
继而利用计算出的电量数据可行域上下限形成月用电量限值及以上k在计量年份y检测场景s下的电量数据可行域矩阵为:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限,可行域矩阵的每一列元素代表该时刻正常电量数据所处的阈值范围,和均为[-Kk,s,+Kk,s]之间的无量纲值;
在进行异常数据识别时,对检测场景s下的待检电量数据当中第m个分量满足时,计算待检数据上限为:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k检测场景s下的第m数据点时刻待检测电量的数值,为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的上限;
当中第m个分量满足时,计算待检数据下限为:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的下限;
当上下限均在可行域范围内时,则认为待检数据正常,无异常数据;当出现数值越限情况时,即可辨识出异常数据;
以所选取属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户2018年12月份工作日数据为例,提取出的典型日电量曲线与历史电量数据形成的可行域如图6所示;并随机选取12月18日的第34至37数据点,将12月18日的第34、36数据点的电量数据放大为实际值的2倍,第35、37数据点的电量数据缩小为实际值的0.2倍作为异常数据点,采用该步骤中的方法进行异常数据的识别;将异常电量数据曲线映射至可行域,其结果如图7所示;
步骤3中所述使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线,以住宿和餐饮业、租赁和商务服务业2018年12月份工作日为例,通过聚类获得的典型电量曲线如图8-11所示;
步骤4:对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正;对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,并在典型电量曲线应用时进行去归一化操作得到用户的实际分时电量;对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,采用相似日拟合的方法进行多点缺失数据修正;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,其具体计算方法为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为用户k相应场景s下经步骤3的异常数据辨识后发现的第i个单点异常数据出现时刻的修正电量数据,Kk,w为用户k的表计倍率,为用户k的单点异常数据区间前后计量表码读数;
以所选取属于住宿和餐饮业的2018年12月月用电量375.9万kW·h的用户12月29日第37个数据点出现表码数据单点异常为例,将造成第37与38数据点电量数据异常,采用线性插值的修正效果如图12所示;
进一步地,步骤4中所述对于月用电量限值及以上用户,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正,其具体计算方法为:
通过用户k相应场景s下异常数据区间前后计量表码读数相减可算得异常数据区间的总用电量Ek,t为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,w为用户k的表计倍率,为用户k的多点异常数据区间前后表码读数,表示用户k相应场景s下异常数据区间t内的总用电量;
继而根据步骤2中所得到的用户k在计量年份y相应场景s下的典型日电量曲线对应多点数据异常区间的总用电量计算出缩放比例为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为用户k相应场景s下的缩放比例,为用户k相应场景s下多点数据异常区间t内的总用电量,为用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,n代表异常数据点个数;
则计算得到用户k相应场景s下在第i个异常时刻的电量数据修正值为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的修正电量数据;
对步骤3中识别出的多点异常数据进行修正,修正结果与真实电量对比如图13所示;
进一步地,步骤4中所述对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,其具体实现方法为:
现货市场结算系统首先根据用户户号在系统中找到其所对应的行业用户分类代码,以此为依据寻找对应行业类型,在匹配到对应的行业之后,根据步骤2中对典型电量曲线应用场景的划分,每一行业用户所对应的典型电量曲线数目有S条,分别代表12个不同月份工作日对应的2条曲线、12个不同月份休息日所对应的2条曲线以及国庆假期、春节假期、中秋假期等节假日各自对应的2条曲线,现货市场结算系统将根据运行日所对应的时间自动匹配到对应的2条典型电量曲线供用户选择确认;
进一步地,步骤4中所述在典型曲线应用时进行去归一化操作得到用户的实际分时电量,其具体计算方法为:
在保证曲线形状不变的情况下,将典型电量曲线归一化后的分时电量根据用户的实际日用电总量还原成用户实际的分时电量:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值以下且不具备分时计量条件用户的数量,S表示典型电量曲线划分的应用场景数量,λk,s,m表示用户k应用场景s下对应行业典型日电量曲线m时刻数据点所对应的电量,Wk,s为用户k应用场景s下所消耗的相应日用电总量,qk,s,m为用户k应用场景s下使用典型电量曲线计算所得的m数据点时刻实际分时电量;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,其具体方法与采用线性插值的方法进行单点异常数据修正所用的方法相同;
进一步地,步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用相似日拟合的方法进行多点缺失数据修正,其具体拟合方法为当月用电量限值以下且具备分时计量条件用户k的计量点连续时间内发生多点数据缺失时,取月用电量限值以下且具备分时计量条件用户k的计量点同期的电量数据进行相似日拟合,用拟合的数据替代缺失数据,以补全日分时计量电量曲线;具体拟合规则示例如下:
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间在工作日内,则取前推n个同期用户k的计量点日数据,并对n个数据取平均值,以所得平均值拟合替代缺失数据,n的取值在制定规则时根据可实行性、便捷性和可靠性原则选取;
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间在休息日内,则取前推n个同期用户k的计量点日数据,并对n个数据取平均值,以所得平均值拟合替代缺失数据,n的取值在制定规则时根据可实行性、便捷性和可靠性原则选取;
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间在春节假期或者国庆假期内,则取去年春节假期或者国庆假期区间用户k的计量点日数据,以拟合替代缺失数据;
如果月用电量限值以下且具备分时计量条件用户k的计量点缺点时间段区间无n个同期计量点日数据或去年春节假期或者国庆假期区间计量点日数据,则可采用近m周内的同时段电量数据取平均值,以所得平均值拟合替代缺失数据,m的取值在制定规则时根据可实行性、便捷性和可靠性原则选取;
对所选取属于住宿和餐饮业的2018年12月月用电量10.8万kW·h的用户的多点缺失数据进行相似日拟合,拟合结果与真实电量对比如图14所示;
步骤5:通过步骤4分别得到月用电量限值及以上用户、月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户的修正电量数据作为结算电量数据,并用于现货市场的结算环节。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (1)
1.一种面向现货市场结算的电量数据处理方法,其特征在于,包括以下步骤:
步骤1:根据用户的用电自然特性以及用户的分时计量条件选取用户月用电量限值,将计量年份y内用户每个月的月用电量均大于等于用户月用电量限值且用户的用电量具备分时计量条件的用户定义为月用电量限值及以上用户,否则定义为月用电量限值以下用户;并根据用户是否具备分时计量条件将月用电量限值以下用户定义为月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户;
步骤2:对典型电量曲线的应用场景进行划分;对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类;
步骤3:对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据;对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,使用一种基于改进kmeans的负荷曲线形态聚类算法,在分类行业中各自挑选样本用户进行分行业内的聚类分析,每个行业获取两条典型电量曲线;
步骤4:对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正;对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,并在典型电量曲线应用时进行去归一化操作得到用户的实际分时电量;对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,采用相似日拟合的方法进行多点缺失数据修正;
步骤5:通过步骤4分别得到月用电量限值及以上用户、月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户的修正电量数据作为结算电量数据,并用于现货市场的结算环节;
步骤1所述具备分时计量条件用户的计量年份y的日电量数据为:
Uk,y=(Xk,y,1,Xk,y,2,…,Xk,y,n)
k∈[1,N]
其中,N表示所有现货市场用户中具备分时计量条件的用户的数量,Uk,y为月用电量限值及以上用户k在计量年份y的总共n日的日电量数据集,Xk,y,i为月用电量限值及以上用户k在计量年份y的第i日的96点日电量数据集:
Xk,y,i=[xk,y,i,1,xk,y,i,2,…,xk,y,i,m,…,xk,y,i,96]T
i∈[1,L]
其中,L表示计量年份y全年内的总天数,日电量数据为96个点以15分钟为颗粒度,将每日24小时以15分钟为时间段划分即可得到96个日电量计量数据点,xk,y,i,m为月用电量限值及以上用户k在计量年份y的第i日的第m点计量数据,m∈[1,96];
步骤2中所述对典型电量曲线的应用场景进行划分,具体划分为:
为提高典型电量曲线的准确性,根据用户实际用电行为和规律,将某年典型电量曲线的应用场景划分为每一个月的工作日与休息日,以及节假日,所述节假日包括:春节假期、国庆假期、中秋假期、五一假期、端午假期;
共计S个相应时间段的应用场景;应用场景集合R表示为:
R={r月份工作日,r月份休息日,节假日|r∈[1,12]}
步骤2中对于月用电量限值及以上用户,采用非参数核密度估计提取计量年份y内每一月份各应用场景下的典型日电量曲线具体方法为:
采用高斯核函数作为非参数核密度估计的核函数K(x),再根据非参数核密度理论计算月用电量限值及以上用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值xk,y,s,i,m对应的概率密度函数fm(xk,y,s,i,m),其表达式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,K(x)为高斯核函数,xk,y,s,i,m为用户k计量年份y应用场景s下的历史电量数据中第i日的第m点数据时刻电量值,T为计算应用场景s下第m点数据时刻的样本数据点数目,h为窗宽;
计算月用电量限值及以上用户k计量年份y应用场景s下的各时刻数据点对应的概率密度函数,形成最大概率密度曲线向量为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,xk,y,i,mp,m为用电量限值及以上用户k计量年份y应用场景s下的第i日第m时刻数据点概率密度函数fm(xk,y,s,i,m)取最大值时xk,y,s,i,m对应的数值;
而后计算参与典型日电量曲线向量提取的月用电量限值及以上用户k在计量年份y应用场景s下的第i日的96点日电量数据集:
Xk,y,s,i=[xk,y,s,i,1,xk,y,s,i,2,…,xk,y,s,i,m,…,xk,y,s,i,96]T相较于最大概率密度曲线向量的权重wk,y,s,i,其计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,dk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据与最大概率密度曲线向量数据的差平方的平方根,wk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量数据相较于最大概率密度曲线向量数据的权重,λ为用以调整dk,y,s,i对wk,y,s,i的影响程度的可调参数,且λ∈[0,1],而dk,y,s,i计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数;
最后对参与不同场景下典型日电量曲线提取的各样本日的日电量曲线进行加权叠加以获得该用户相应场景下的典型日电量曲线,其计算公式为:
k∈[1,M]
s∈[1,S]
i∈[1,LD]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,LD表示计量年份y应用场景s下的总天数,Xk,y,s,i表示用户k在计量年份y应用场景s下的第i日的96点日电量曲线,表示用户k在计量年份y应用场景s下的典型日电量曲线,其表示如下:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量;
步骤2中所述对于月用电量限值以下且具备分时计量条件用户和月用电量限值以下且不具备分时计量条件用户,根据国民经济行业用电分类将所有月用电量限值以下用户所在行业分为十一个大类,具体分类为:
不同行业的用电行为和规律存在显著差别,据此将用户所在行业根据国民经济行业分类进行划分,具体划分如下:农、林、牧、渔业,工业,建筑业,交通运输、仓储和邮政业,信息传输、软件和信息技术服务业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业,公共服务及管理组织业;
步骤3中所述对于月用电量限值及以上用户,通过综合利用典型日电量曲线与历史电量数据中所蕴含的信息,准确辨识电量数据中存在的异常数据,其具体实现方法为:
首先根据月用电量限值及以上用户的计量年份y的日电量数据Uk,y,计算出月用电量限值及以上用户k在计量年份y检测场景s下的历史电量数据在同一时刻数据点的最大值与最小值:
k∈[1,M]
s∈[1,S]
m∈[1,96]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最大值,为月用电量限值及以上用户k在计量年份y检测场景s下的第m点数据点时刻历史电量数据的最小值;
通过步骤2所得典型日电量曲线与历史电量数据的最大值和最小值,可计算出检测场景下历史数据域的上下限为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k在计量年份y应用场景s下的典型日电量曲线上第m时刻数据点电量,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的历史数据域的下限;
而后由电力公司结合历史经验确定各检测场景s下用户k允许变化的阈值系数Kk,s,并计算出电量数据可行域的上下限为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,s表示由电力公司确定的用户k检测场景s下允许变化的阈值系数,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限;
继而利用计算出的电量数据可行域上下限形成月用电量限值及以上k在计量年份y检测场景s下的电量数据可行域矩阵为:
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的上限,为月用电量限值及以上用户k在计量年份y检测场景s下第m时刻数据点的电量数据可行域的下限,可行域矩阵的每一列元素代表该时刻正常电量数据所处的阈值范围,和均为[-Kk,s,+Kk,s]之间的无量纲值;
在进行异常数据识别时,对检测场景s下的待检电量数据
当中第m个分量满足时,计算待检数据上限为:
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k检测场景s下的第m数据点时刻待检测电量的数值,为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的上限;
当中第m个分量满足时,计算待检数据下限为:
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为月用电量限值及以上用户k检测场景s下第m时刻数据点的待检测数据的下限;
当上下限均在可行域范围内时,则认为待检数据正常,无异常数据;当出现数值越限情况时,即可辨识出异常数据;
步骤4中所述对于月用电量限值及以上用户,采用线性插值的方法进行单点异常数据修正,其具体计算方法为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为用户k相应场景s下经步骤3的异常数据辨识后发现的第i个单点异常数据出现时刻的修正电量数据,Kk,w为用户k的表计倍率,为用户k的单点异常数据区间前后计量表码读数;
步骤4中所述对于月用电量限值及以上用户,采用步骤2中所得到的典型日电量曲线进行缩放的方法对多点异常数据修正,其具体计算方法为:
通过用户k相应场景s下异常数据区间前后计量表码读数相减可算得异常数据区间的总用电量Ek,t为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,Kk,w为用户k的表计倍率,为用户k的多点异常数据区间前后表码读数,表示用户k相应场景s下异常数据区间t内的总用电量;
继而根据步骤2中所得到的用户k在计量年份y相应场景s下的典型日电量曲线对应多点数据异常区间的总用电量计算出缩放比例为:
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,为用户k相应场景s下的缩放比例,为用户k相应场景s下多点数据异常区间t内的总用电量,为用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,n代表异常数据点个数;
则计算得到用户k相应场景s下在第i个异常时刻的电量数据修正值为:
k∈[1,M]
s∈[1,S]
其中,M表示所有现货市场用户中月用电量限值及以上用户的数量,S表示典型电量曲线划分的应用场景数量,表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的电量数据,表示用户k相应场景s下的典型日电量曲线中第i个异常数据出现时刻的修正电量数据;
步骤4中所述对于月用电量限值以下且不具备分时计量条件用户,根据运行日所对应的时间和用户所对应的行业匹配到对应的典型电量曲线,其具体实现方法为:
现货市场结算系统首先根据用户户号在系统中找到其所对应的行业用户分类代码,以此为依据寻找对应行业类型,在匹配到对应的行业之后,根据步骤2中对典型电量曲线应用场景的划分,每一行业用户所对应的典型电量曲线数目有S条,分别代表12个不同月份工作日对应的2条曲线、12个不同月份休息日所对应的2条曲线以及节假日各自对应的2条曲线,现货市场结算系统将根据运行日所对应的时间自动匹配到对应的2条典型电量曲线供用户选择确认;
步骤4中所述在典型曲线应用时进行去归一化操作得到用户的实际分时电量,其具体计算方法为:
在保证曲线形状不变的情况下,将典型电量曲线归一化后的分时电量根据用户的实际日用电总量还原成用户实际的分时电量:
其中,M表示所有现货市场用户中月用电量限值以下且不具备分时计量条件用户的数量,S表示典型电量曲线划分的应用场景数量,λk,s,m表示用户k应用场景s下对应行业典型日电量曲线m时刻数据点所对应的电量,Wk,s为用户k应用场景s下所消耗的相应日用电总量,qk,s,m为用户k应用场景s下使用典型电量曲线计算所得的m数据点时刻实际分时电量;
步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用线性插值的方法进行单点缺失数据修正,其具体方法与采用线性插值的方法进行单点异常数据修正所用的方法相同;
步骤4中所述对于月用电量限值以下且具备分时计量条件用户,采用相似日拟合的方法进行多点缺失数据修正,其具体拟合方法为当月用电量限值以下且具备分时计量条件用户k的计量点连续时间内发生多点数据缺失时,取月用电量限值以下且具备分时计量条件用户k的计量点同期的电量数据进行相似日拟合,用拟合的数据替代缺失数据,以补全日分时计量电量曲线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011310408.0A CN112381433B (zh) | 2020-11-20 | 2020-11-20 | 一种面向现货市场结算的电量数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011310408.0A CN112381433B (zh) | 2020-11-20 | 2020-11-20 | 一种面向现货市场结算的电量数据处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112381433A CN112381433A (zh) | 2021-02-19 |
CN112381433B true CN112381433B (zh) | 2023-08-11 |
Family
ID=74584397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011310408.0A Active CN112381433B (zh) | 2020-11-20 | 2020-11-20 | 一种面向现货市场结算的电量数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112381433B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112925827B (zh) * | 2021-03-04 | 2024-05-10 | 南京怡晟安全技术研究院有限公司 | 一种基于电力采集物联数据的用户性质异常分析方法 |
CN113379440B (zh) * | 2021-03-25 | 2022-11-11 | 国电南瑞科技股份有限公司 | 基于相似日的电力现货市场电量申报信息优化方法及系统 |
CN113837324A (zh) * | 2021-11-25 | 2021-12-24 | 四川瑞康智慧能源有限公司 | 电量数据监测方法、系统、存储介质和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583951A (zh) * | 2018-11-29 | 2019-04-05 | 浙江电力交易中心有限公司 | 一种电力市场差价合约电量分解技术及分解结果综合评估方法 |
CN110245972A (zh) * | 2019-04-26 | 2019-09-17 | 国网浙江省电力有限公司衢州供电公司 | 一种电网多电价计量及调度系统 |
CN111125633A (zh) * | 2019-11-14 | 2020-05-08 | 广东电力交易中心有限责任公司 | 电力市场交易的分解曲线计算方法及装置 |
-
2020
- 2020-11-20 CN CN202011310408.0A patent/CN112381433B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583951A (zh) * | 2018-11-29 | 2019-04-05 | 浙江电力交易中心有限公司 | 一种电力市场差价合约电量分解技术及分解结果综合评估方法 |
CN110245972A (zh) * | 2019-04-26 | 2019-09-17 | 国网浙江省电力有限公司衢州供电公司 | 一种电网多电价计量及调度系统 |
CN111125633A (zh) * | 2019-11-14 | 2020-05-08 | 广东电力交易中心有限责任公司 | 电力市场交易的分解曲线计算方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112381433A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112381433B (zh) | 一种面向现货市场结算的电量数据处理方法 | |
Kim | The errors in the variables problem in the cross‐section of expected stock returns | |
CN106682763B (zh) | 一种用于大量样本数据的电力负荷优化预测方法 | |
Ciarreta et al. | Modeling and forecasting realized volatility in German–Austrian continuous intraday electricity prices | |
CN114140176B (zh) | 一种负荷聚集平台的可调容量预测方法及装置 | |
Guler et al. | Mincer–Zarnowitz quantile and expectile regressions for forecast evaluations under aysmmetric loss functions | |
CN108304990B (zh) | 一种停电敏感预判方法和系统 | |
CN116050866A (zh) | 基于典型负荷曲线的组合式用户缺失电量拟合方法及系统 | |
Al-Shboul | An examination of herd behavior in the Jordanian equity market | |
Pavlović et al. | Adequateness of Applying the Zmijewski Model on Serbian Companies. | |
CN116894156A (zh) | 基于mcmc算法的电力采集终端数据预处理方法 | |
CN107704723A (zh) | 一种基于斜率关联度的显著变量选择方法 | |
CN110956318A (zh) | 一种基于预先构建的预测模型进行预测的方法及装置 | |
CN110837980A (zh) | 企业信用评级方法、装置、设备及存储介质 | |
CN116401601A (zh) | 基于逻辑回归模型的停电敏感用户优选处置方法 | |
CN112614005B (zh) | 企业复工状态的处理方法和装置 | |
CN114638638A (zh) | 基于统计学方法的绿色电力环境价值分析方法及系统 | |
CN113627821A (zh) | 一种基于用电行为特征进行异常用电识别的方法及系统 | |
CN114154617A (zh) | 一种基于vfl的低压居民用户异常用电识别方法及系统 | |
Kossov | The rationale for projected prices of demand on electricity for industry in Russia up to 2020 | |
CN112614006A (zh) | 负荷预测方法、装置、计算机可读存储介质以及处理器 | |
CN112330182A (zh) | 一种经济运行状况量化分析方法及装置 | |
Vahedi et al. | Data-Driven Classification for Residential Coincident Peak Demand Contributors Using Actual Power, Sociological, and Meteorological Data | |
US20140279703A1 (en) | Systems and methods for parameter estimation for use in determining value-at-risk | |
Minh Khuong et al. | A statistical approach to identify asynchronous extreme events for multi-regional energy system models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |