CN115600764B - 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法 - Google Patents

基于权重邻域粗糙集快速约简的滚动时域能耗预测方法 Download PDF

Info

Publication number
CN115600764B
CN115600764B CN202211461718.1A CN202211461718A CN115600764B CN 115600764 B CN115600764 B CN 115600764B CN 202211461718 A CN202211461718 A CN 202211461718A CN 115600764 B CN115600764 B CN 115600764B
Authority
CN
China
Prior art keywords
energy consumption
data
time domain
decision
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211461718.1A
Other languages
English (en)
Other versions
CN115600764A (zh
Inventor
刘鑫
侯群
杨志祥
熊筠轲
杨小涛
程佳斌
余将其
皮辉
谈俊
江丹
彭坤
郭朝霞
许雷
范俊甫
蔡烨彬
谢倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Csic Wuhan Lingjiu Hi Tech Co ltd
Original Assignee
Csic Wuhan Lingjiu Hi Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Csic Wuhan Lingjiu Hi Tech Co ltd filed Critical Csic Wuhan Lingjiu Hi Tech Co ltd
Priority to CN202211461718.1A priority Critical patent/CN115600764B/zh
Publication of CN115600764A publication Critical patent/CN115600764A/zh
Application granted granted Critical
Publication of CN115600764B publication Critical patent/CN115600764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于人工智能与能耗预测技术领域,提供一种基于权重邻域粗糙集快速约简的滚动时域能耗预测方法,所述方法包括:收集能耗数据以及与建筑能耗相关联的影响因素数据,对收集到的数据采用相应的预处理方式,形成特征数据集;选取若干能耗数据进行聚类,划分能耗模式,依照聚类结果对所有数据进行分类,形成能耗数据决策集;将决策集与特征数据集结合,得到决策表,通过基于QR分解的权重邻域粗糙集方法对决策表进行快速属性约简;通过基于滚动时域的LSTM网络进行能耗预测。

Description

基于权重邻域粗糙集快速约简的滚动时域能耗预测方法
技术领域
本发明属于人工智能与能耗预测技术领域,尤其涉及一种基于权重邻域粗糙集快速约简的滚动时域能耗预测方法。
背景技术
能耗预测是实现建筑能耗精细化管理,从而支撑建筑运行优化管理的基础,科学精准的能耗预测可使建筑节能评估工作得以顺利开展,从而达到节能减排目的,在商业与环保领域均具有重要意义。传统的能耗预测系统大多为黑箱系统,这些系统无法进行模块化观测与拆分,难以结合关联因素的内部影响关系进行预测,缺乏通用性与实时性。
粗糙集理论被视为机器学习、模式识别、知识发现等领域的强大数学分析工具。经典的Pawlak粗糙集理论需要严格的等价关系,因此只能挖掘具有类别属性的信息系统中的知识。为了挖掘具有实值属性的信息系统中的知识,研究人员将邻域关系引入,形成邻域粗糙集模型。样本之间的相似性可以很好地用邻域关系来描述,并且邻域关系在具有实值属性的信息系统中易于计算并进行属性约简。然而,邻域粗糙集模型并没有考虑属性权重,在实际应用中,每个属性对学习任务的贡献可能并不同等重要。
另外,在深度学习进行能耗预测中,传统的预测方式为将完整的数据集随机划分为训练集与测试集,该做法忽略了在一年中由于时间变化导致的用能相关影响因素(如季节与天气)的变化,缺乏实时性。
发明内容
鉴于上述问题,本发明的目的在于提供一种基于权重邻域粗糙集快速约简的滚动时域能耗预测方法,旨在解决现有能耗预测方法的预测时间和预测精度均不高的技术问题。
本发明采用如下技术方案:
所述基于权重邻域粗糙集快速约简的滚动时域能耗预测方法,包括下述步骤:
步骤S1、收集能耗数据以及与建筑能耗相关联的影响因素数据,对收集到的数据采用相应的预处理方式,形成特征数据集;
步骤S2、选取若干能耗数据进行聚类,划分能耗模式,依照聚类结果对所有数据进行分类,形成能耗数据决策集;
步骤S3、将决策集与特征数据集结合,得到决策表,通过基于QR分解的权重邻域粗糙集方法对决策表进行快速属性约简;
步骤S4、通过基于滚动时域的LSTM网络进行能耗预测。
本发明的有益效果是:本发明提供了一种基于权重邻域粗糙集快速属性约简的滚动时域能耗预测方法对建筑能耗进行预测,首先通过对不同样本数据依据其特征进行分类别处理,能够更好保留数据的属性特征;另外采取先聚类再分类的方法自动化生成决策集,避免人工分类方法存在的误判问题;第三通过给不同特征属性分配不同权重,形成基于权重的邻域粗糙集模型,大大减少冗余属性对能耗预测的影响;第四,同时引入滚动时域的方法更新动态深度学习模型的架构和结构,能够捕捉建筑物能耗负荷的最新特征模式;本发明结合快速属性约简与滚动时域的能耗预测在预测时间上有所减少,在预测精度上有所提高,相对传统能耗预测方法具有更加丰富的应用价值,在预测时间与预测精度上都具有更好效果。
附图说明
图1是本发明实施例提供的基于权重邻域粗糙集快速约简的滚动时域能耗预测方法的流程图;
图2是本发明实施例提供的步骤S3的一种具体实现流程图;
图3是本发明实施例提供的以一年半数据为例的滚动时域训练集、测试集划分示意图;
图4是本发明实施例提供的滚动时域能耗预测LSTMn模型与预测时域表图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种基于权重的邻域粗糙集约简的滚动时域能耗预测方法,用于快速精准预测建筑能耗,为建筑能耗精细化管理、建筑节能减排提供理论依据与数据支撑。为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的基于权重邻域粗糙集快速约简的滚动时域能耗预测方法的流程,为了便于说明仅示出了与本发明实施例相关的部分。
如图1所示,本实施例提供基于权重邻域粗糙集快速约简的滚动时域能耗预测方法包括下述步骤:
步骤S1、收集能耗数据以及与建筑能耗相关联的影响因素数据,对收集到的数据采用相应的预处理方式,形成特征数据集。
能耗数据建筑运行过程中产生的各种能耗集合,建筑能耗相关联的影响因素数据影响建筑能耗的一些外界条件,比如天气、时间等等。本步骤通过对不同种类的数据采用符合其特征的预处理方式形成特征数据集。具体的,本步骤过程如下:
S11、获取建筑能耗大数据集得到能耗数据,收集与建筑能耗相关联的影响因素数据,如天气信息等。
S12、将收集到的建筑能耗关联影响因素数据与能耗数据进行整合,对整合后的原始数据应用四种方法进行预处理,以某实际工程为例,具体预处理方式有:
(1)对于气温T,云层覆盖率ξ,露点温度T dew ,风速Ws,能耗值E,进行线性归一化处理,T标记为α 1 ξ标记为α 2 T dew 标记为α 3 Ws标记为α 4 E标记为α 5 变量α i 与线性归一化处理变换后的α’ i 满足:
Figure 46397DEST_PATH_IMAGE001
(2)对于风向Wd,以45°为一个计量区间,则风向可用8个数字表示:
Figure 239481DEST_PATH_IMAGE002
(3)对于时间变量,包括周几、月、日、是否为节假日,采用OneHot编码进行标准化处理,用2位编码表示是否为节假日;用7位编码表示周几,如0000001表示周一、用0000010表示周二等;用12位的二进制数如000000000001表示一月、000000000010表示二月等;同理用31位的编码表示不同的日。
(4)对于小时数据,将小时转换为对应的sin与cos值作为输入:
Figure 175076DEST_PATH_IMAGE003
Figure 319357DEST_PATH_IMAGE004
通过上述处理方式,最后得到输入的特征数据集包括天气数据(气温,云层覆盖率,露点温度,风向,风速等),天气数据(时间戳,周几,法定假日,月,日,小时等)和能耗数据能耗值。
特征数据集可表示为
Figure 365810DEST_PATH_IMAGE005
,m为经过预处理的属性数量,即上述的天气数据、天气数据、能耗数据能耗值的数据种类数量。q为选取特征对象数量,对于大小为q×m的特征属性矩阵Z q,m
Figure 413400DEST_PATH_IMAGE006
。以上述工程为例,属性数量有13个,
Figure 785476DEST_PATH_IMAGE007
X t 中包含的变量包括:时间戳TsX 1,t = Ts(t),气温TX 2,t = T(t),云层覆盖率ξX 3,t = ξ(t),露点温度T dew X 4,t = T dew (t),风向W d X 5,t = W d (t),风速W s X 6,t = W s (t),周几D wd X 7,t = D wd (t),是否为法定假日D hd X 8,t = D hd (t),年月数mX 9,t = m(t),月天数dX 10,t = d(t),小时正弦值h s X 11,t = h s (t),小时余弦值h c X 12,t = h c (t),能耗值EX 13,t = E(t)。此时的特征属性矩阵为:
Figure 279036DEST_PATH_IMAGE008
其中q为选取特征对象数量,
Figure 129181DEST_PATH_IMAGE009
Figure 31278DEST_PATH_IMAGE010
步骤S2、选取若干能耗数据进行聚类,划分能耗模式,依照聚类结果对所有数据进行分类,形成能耗数据决策集。
本步骤具体过程如下:
S21、按照需要对每个设备能耗数据进行抽样。
按一定规律对各设备的能耗数据抽样千级或万级样本。
S22、利用基于轮廓系数的K-means聚类划分小样本能耗模式。
指定聚类簇数k,k∈[2,T],T为结合实际能耗情况能接受最大类别数的值,T过小会导致聚类结果不准确,T过大则导致后续分析复杂度增加。对不同的k,从特征属性矩阵Z q,m 中取出e行数据(k≤e<n)得到小样本特征属性矩阵
Figure 66930DEST_PATH_IMAGE011
然后进行k-means聚类,得到e行包含k个能耗模式的特征数据M k
Figure 421688DEST_PATH_IMAGE012
,将M k
Figure 341103DEST_PATH_IMAGE011
结合得到具有能耗模式特征的小样本特征集
Figure 97706DEST_PATH_IMAGE013
对于不同的k,分别计算对应的轮廓系数
Figure 47470DEST_PATH_IMAGE014
其中d out (β)为样本β到同一类中其他样本的平均距离,d in (β)为样本β到其他类别所有样本的平均距离,所以,要取类内相似度高,类外相似度低的样本组成一类,即在可接受聚类数k范围内,对应的l(β)越大,聚类效果越好。取l k (β)最大时对应的聚类簇数k与对应的小样本特征集
Figure 889524DEST_PATH_IMAGE013
S23、通过SVM算法得到能耗模式,形成决策集D
利用小样本特征集
Figure 347050DEST_PATH_IMAGE013
对剩余行的特征运用SVM分类算法,得出完整的包含能耗模式的决策集D,该步骤的具体过程为首先利用小样本特征集训练SVM分类器,然后使用训练好的分类器对整体特征数据集进行分类预测。SVM分类算法为行业通用技术,不再赘述其算法原理。
步骤S3、将决策集与特征数据集结合,得到决策表,通过基于QR分解的权重邻域粗糙集方法对决策表进行快速属性约简。
如图2所示,具体实现过程如下:
S31、根据所述决策集、特征数据集建立决策表
Figure 958160DEST_PATH_IMAGE015
,其中U为论域,At为属性特征集,在上述工程实例中,At = Zq,13,D={d}为决策集,∀xU,∀εAtf(x,ε)为样本x相对于特征属性ε的值,设特征系数矩阵为G,决策向量矩阵为H
Figure 607054DEST_PATH_IMAGE016
Figure 936404DEST_PATH_IMAGE017
S32、建立约简矩阵RE并计算特征分配系数υ
约减矩阵为RE,使
Figure 791096DEST_PATH_IMAGE018
,设特征分配系数矩阵
Figure 23757DEST_PATH_IMAGE019
Figure 345017DEST_PATH_IMAGE020
,同时左乘转置矩阵G T ,得
Figure 630504DEST_PATH_IMAGE021
由于υ的计算涉及到矩阵求逆运算,在特征分配系数矩阵过大的情况下存在计算时间过长的情况,结合实际情况,对矩阵G T G采用QR分解方法求逆,计算复杂度,进行快速约简。
对于非稀疏对称矩阵G T G,经过HouseHolder变换后,转化为正交矩阵Q与上三角矩阵R的乘积即
Figure 429833DEST_PATH_IMAGE022
,因此
Figure 519930DEST_PATH_IMAGE023
,得到
Figure 480933DEST_PATH_IMAGE024
S33、计算每个特征属性ε的权重
Figure 784875DEST_PATH_IMAGE025
;其中
Figure 482835DEST_PATH_IMAGE026
Figure 923043DEST_PATH_IMAGE027
的绝对值,
Figure 586106DEST_PATH_IMAGE026
越大,特征与决策内部关联度越大。
S34、计算加权邻域相似关系
Figure 938196DEST_PATH_IMAGE028
BAt的一个特征子集,
Figure 79328DEST_PATH_IMAGE029
,邻域半径阈值为δ,对每一个B,有
Figure 639622DEST_PATH_IMAGE030
S35、计算决策集D对相似关系
Figure 942428DEST_PATH_IMAGE031
的依赖度
Figure 722427DEST_PATH_IMAGE032
依赖度可以表示条件与决策的关系程度,因为依赖度表示包含于正区域的特征与论域特征的比例。当
Figure 667249DEST_PATH_IMAGE033
时,设
Figure 347629DEST_PATH_IMAGE034
,为D关于B在邻域粗糙集下的正区域;
Figure 86915DEST_PATH_IMAGE035
Figure 837701DEST_PATH_IMAGE036
D对应相似关系
Figure 851793DEST_PATH_IMAGE037
的下近似。
S36、对于每个处于特征子集外部的特征属性ε,计算在D决策下外部特征属性ε对约简集RE的外部重要度
Figure 855521DEST_PATH_IMAGE038
Figure 296867DEST_PATH_IMAGE039
,当
Figure 785879DEST_PATH_IMAGE040
时停止计算。当外部重要度
Figure 72504DEST_PATH_IMAGE041
取最大值时,将对应的外部特征
Figure 461897DEST_PATH_IMAGE042
加入约简集RE
S37、对于每个在约简集内部的特征属性μ,计算特征属性μ对约简集RE的内部重要度
Figure 808565DEST_PATH_IMAGE043
其中
Figure 516364DEST_PATH_IMAGE044
μ为约简集RE的内部特征属性,
Figure 606680DEST_PATH_IMAGE045
,当
Figure 116159DEST_PATH_IMAGE046
时,从RE移除非必要内部特征
Figure 836990DEST_PATH_IMAGE047
,得到约简集RE
步骤S4、通过基于滚动时域的LSTM网络进行能耗预测。
本步骤具体过程如下:
S41、将属性约简过后的约简集以年为时域间隔MTo n 、月为间隔移动步长划分训练集与测试集,时域间隔数量为N,具体的,对每个时域间隔MTo n ,划分为m个训练集与m-1个测试集,且将接下来一个月的数据作为预测集。若以1个月为间隔移动步长,
Figure 300595DEST_PATH_IMAGE048
为数据集总月数,则有:
Figure 929022DEST_PATH_IMAGE049
如图3所示,时域间隔可表示为:
Figure 27428DEST_PATH_IMAGE050
其中 Tr ni Te nj 分别为第n个时域间隔的第i个训练集与第j个测试集,为了保证训练精度,
Figure 715899DEST_PATH_IMAGE051
需要满足以下条件:
Figure 404150DEST_PATH_IMAGE052
例如,图4为从2021年一月至2022年七月共18个月数据的滚动时域划分图。
S42、将N个时域间隔MTo n 分别输入LSTM网络训练,得到N个LSTM模型,记为
Figure 836268DEST_PATH_IMAGE053
,并分别用LSTMn模型预测接下来的每个月能耗。以2021年一月至2022年六月数据集为例,预测方式如图4所示。LSTM1模型预测二月到七月的能耗,LSTM2模型预测三月到七月的能耗,依次类推,LSTM6模型预测七月能耗。
S43、将各模型预测值与实际数据进行对比,并分别计算每个模型在不同预测时域所对应的均方根误差RMSE、平均绝对误差MAER 2 值,并从中选取最优预测结果。
综上,本发明提供了一种基于权重的邻域粗糙集约简的滚动时域能耗预测方法,给不同特征属性分配不同权重,形成基于权重的邻域粗糙集模型,大大减少冗余属性对能耗预测的影响;引入滚动时域的方法更新动态深度学习模型的架构和结构,能够捕捉建筑物能耗负荷的最新特征模式,提高建筑能耗预测准确度。相对传统能耗预测方法具有更加丰富的应用价值,在预测时间与预测精度上都具有更好效果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于权重邻域粗糙集快速约简的滚动时域能耗预测方法,其特征在于,所述能耗预测方法包括下述步骤:
步骤S1、收集能耗数据以及与建筑能耗相关联的影响因素数据,对收集到的数据采用相应的预处理方式,形成特征数据集;
步骤S2、选取若干能耗数据进行聚类,划分能耗模式,依照聚类结果对所有数据进行分类,形成能耗数据决策集;
步骤S3、将决策集与特征数据集结合,得到决策表,通过基于QR分解的权重邻域粗糙集方法对决策表进行快速属性约简;
步骤S4、通过基于滚动时域的LSTM网络进行能耗预测;
其中所述步骤S2具体过程如下:
S21、按照需要对每个设备能耗数据进行抽样;
S22、利用基于轮廓系数的K-means聚类划分小样本能耗模式:
指定聚类簇数k,从特征属性矩阵Zn,m中取出e行数据得到小样本特征属性矩阵
Figure FDA0004148079080000011
然后进行k-means聚类,得到e行包含k个能耗模式的特征数据Mk
将Mk
Figure FDA0004148079080000012
结合得到具有能耗模式特征的小样本特征集
Figure FDA0004148079080000013
计算对应的轮廓系数
Figure FDA0004148079080000014
其中dout(β)为样本β到同一类中其他样本的平均距离,din(β)为样本β到其他类别所有样本的平均距离,取lk(β)最大时对应的聚类簇数k与对应的小样本特征集
Figure FDA0004148079080000015
S23、通过SVM算法得到能耗模式,形成决策集D;
其中所述步骤S3具体过程如下:
S31、根据所述决策集、特征数据集建立决策表IDT=(U,At,D),其中U为论域,At为属性特征集,
Figure FDA0004148079080000016
f(x,ε)为样本x相对于特征属性ε的值,特征系数矩阵为G,决策向量矩阵为H;
S32、建立约简矩阵RE并计算特征分配系数υ:
υ=(GTG)-1GTH
对矩阵GTG采用QR分解方法求逆,对于非稀疏对称矩阵GTG,经过HouseHolder变换后,转化为正交矩阵Q与上三角矩阵R的乘积即GTG=QR,因此(GTG)-1=(QR)-1=R-1Q-1=R-1QT,得到υ=R-1QTGTH;
S33、计算每个特征属性ε的权重
Figure FDA0004148079080000021
S34、计算加权邻域相似关系
Figure FDA0004148079080000022
B为At的一个特征子集,
Figure FDA0004148079080000023
邻域半径阈值为δ,对每一个B,有
Figure FDA0004148079080000024
S35、计算决策集D对相似关系
Figure FDA0004148079080000025
的依赖度
Figure FDA0004148079080000026
Figure FDA0004148079080000027
其中
Figure FDA0004148079080000028
为D关于B在邻域粗糙集下的正区域,
Figure FDA0004148079080000029
为D对应相似关系
Figure FDA00041480790800000210
的下近似;
S36、对于每个处于特征子集外部的特征属性ε,计算在D决策下外部特征属性ε对约简集RE的外部重要度iptcout(ε,RE,D):
Figure FDA00041480790800000211
当外部重要度iptcoutj,RE,D)取最大值时,将对应的外部特征εj加入约简集RE;
S37、对于每个在约简集内部的特征属性μ,计算特征属性μ对约简集RE的内部重要度iptcin(μ,RE,D):
Figure FDA00041480790800000212
当iptcinj,RE,D)=0时,从RE移除非必要内部特征μj,得到约简集RE;
其中,所述步骤S4具体过程如下:
S41、将属性约简过后的约简集以年为时域间隔MTon、月为间隔移动步长划分训练集与测试集,时域间隔数量为N,具体的,对每个时域间隔MTon,划分为m个训练集与m-1个测试集,且将接下来一个月的数据作为预测集;其中时域间隔可表示为:
MTon=[Trn1,Ten1,Trn2,Ten2,...,Trnm-1,Tenm-1,Trnm,Ev],n∈[1,2,...,N]
其中Trni,Tenj分别为第n个时域间隔的第i个训练集与第j个测试集,为了保证训练精度,Trn1,Ten1,Trn2,Ten2,...,Trnm-1,Tenm-1,Trnm需要满足以下条件:
Figure FDA0004148079080000031
S42、将N个时域间隔MTon分别输入LSTM网络训练,得到N个LSTM模型,记为LSTMn,n=[1,2,...,N],并分别用LSTMn模型预测接下来的每个月能耗;
S43、将各模型预测值与实际数据进行对比,并分别计算每个模型在不同预测时域所对应的均方根误差RMSE、平均绝对误差MAE和R2值,并从中选取最优预测结果。
2.如权利要求1所述基于权重邻域粗糙集快速约简的滚动时域能耗预测方法,其特征在于,所述预处理方式有线性归一化处理、风向数值化处理、OneHot编码进行标准化处理、正弦余弦转化处理,得到特征数据集,其相应的特征属性矩阵为Zn,m
CN202211461718.1A 2022-11-17 2022-11-17 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法 Active CN115600764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211461718.1A CN115600764B (zh) 2022-11-17 2022-11-17 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211461718.1A CN115600764B (zh) 2022-11-17 2022-11-17 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法

Publications (2)

Publication Number Publication Date
CN115600764A CN115600764A (zh) 2023-01-13
CN115600764B true CN115600764B (zh) 2023-05-05

Family

ID=84852454

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211461718.1A Active CN115600764B (zh) 2022-11-17 2022-11-17 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法

Country Status (1)

Country Link
CN (1) CN115600764B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738319A (zh) * 2020-06-11 2020-10-02 佳都新太科技股份有限公司 一种基于大规模样本的聚类结果评价方法及装置
CN114492768A (zh) * 2022-04-06 2022-05-13 南京众智维信息科技有限公司 一种基于小样本学习的孪生胶囊网络入侵检测方法
CN115208613A (zh) * 2022-05-13 2022-10-18 河北师范大学 一种基于小样本学习的三元cct网络的入侵检测方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717664A (zh) * 2018-04-03 2018-10-30 平安科技(深圳)有限公司 投资组合优化方法、装置及存储介质
CN109766583B (zh) * 2018-12-14 2023-06-20 南京航空航天大学 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN110276497A (zh) * 2019-06-27 2019-09-24 河南工业大学 一种粮仓建筑气密性指标的点预测方法
CN111222698B (zh) * 2020-01-06 2022-12-27 重庆邮电大学 面向物联网的基于长短时记忆网络的积水水位预测方法
CN111737414B (zh) * 2020-06-04 2024-08-09 腾讯音乐娱乐科技(深圳)有限公司 一种歌曲推荐方法及装置、服务器、存储介质
CN112115024B (zh) * 2020-09-03 2023-07-18 上海上讯信息技术股份有限公司 一种用于故障预测神经网络模型的训练方法与设备
CN112190253A (zh) * 2020-09-17 2021-01-08 广东工业大学 一种阻塞性睡眠呼吸暂停症严重程度的分类方法
CN113887136B (zh) * 2021-10-08 2024-05-14 东北大学 一种基于改进GAN和ResNet的电动汽车电机轴承故障诊断方法
CN113743538A (zh) * 2021-10-14 2021-12-03 国网福建省电力有限公司龙岩供电公司 基于ipso-bp神经网络的智能楼宇能耗预测方法、设备和介质
CN113780684A (zh) * 2021-10-15 2021-12-10 国网福建省电力有限公司龙岩供电公司 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法
CN113985496B (zh) * 2021-10-26 2024-04-09 天津大学 一种基于lstm-gm神经网络模型的风暴潮智能预报方法
CN114254554A (zh) * 2021-11-12 2022-03-29 中法渤海地质服务有限公司 基于lstm模型的长时不稳定试井解释方法
CN113935557A (zh) * 2021-12-21 2022-01-14 中船重工(武汉)凌久高科有限公司 一种基于深度学习的相同模式能耗大数据预测方法
CN114291067B (zh) * 2021-12-29 2024-04-02 山东大学 基于预测的混合动力汽车凸优化能量控制方法及系统
CN115049113A (zh) * 2022-05-30 2022-09-13 三峡大学 基于时间窗口和超参数自适应选择的s2s电力负荷预测系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738319A (zh) * 2020-06-11 2020-10-02 佳都新太科技股份有限公司 一种基于大规模样本的聚类结果评价方法及装置
CN114492768A (zh) * 2022-04-06 2022-05-13 南京众智维信息科技有限公司 一种基于小样本学习的孪生胶囊网络入侵检测方法
CN115208613A (zh) * 2022-05-13 2022-10-18 河北师范大学 一种基于小样本学习的三元cct网络的入侵检测方法

Also Published As

Publication number Publication date
CN115600764A (zh) 2023-01-13

Similar Documents

Publication Publication Date Title
CN111199016B (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN108491970B (zh) 一种基于rbf神经网络的大气污染物浓度预测方法
CN110782658B (zh) 一种基于LightGBM算法的交通量预测方法
Poczęta et al. Learning fuzzy cognitive maps using structure optimization genetic algorithm
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN109583635B (zh) 一种面向运行可靠性的短期负荷预测建模方法
CN101127029A (zh) 用于在大规模数据分类问题中训练svm分类器的方法
CN111008726B (zh) 一种电力负荷预测中类图片转换方法
CN110717610A (zh) 一种基于数据挖掘的风电功率预测方法
CN110555459A (zh) 基于模糊聚类和支持向量回归的成绩预测方法
CN109993225A (zh) 一种基于无监督学习的空域复杂度分类方法及装置
CN112330052A (zh) 一种配变负荷预测方法
CN114117852B (zh) 一种基于有限差分工作域划分的区域热负荷滚动预测方法
CN111882114B (zh) 一种短时交通流量预测模型构建方法及预测方法
Khan et al. A new hybrid approach of clustering based probabilistic decision tree to forecast wind power on large scales
CN113193551A (zh) 基于多因素和改进特征筛选策略的短期电力负荷预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN115809719A (zh) 一种基于形态聚类的短期负荷预测修正方法
CN116826737A (zh) 一种光伏功率的预测方法、装置、存储介质及设备
CN103106329B (zh) 一种用于svr短期负荷预测的训练样本分组构造方法
He Rain prediction in Australia with active learning algorithm
CN115600764B (zh) 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法
Gu et al. Employment quality evaluation model based on hybrid intelligent algorithm
CN112330051A (zh) 一种基于Kmeans与FR-DBN的短期负荷预测方法
Xu et al. Multi-layer networks for ensemble precipitation forecasts postprocessing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant