CN116613732A - 一种基于shap值选择策略的多元负荷预测方法及系统 - Google Patents

一种基于shap值选择策略的多元负荷预测方法及系统 Download PDF

Info

Publication number
CN116613732A
CN116613732A CN202310436362.4A CN202310436362A CN116613732A CN 116613732 A CN116613732 A CN 116613732A CN 202310436362 A CN202310436362 A CN 202310436362A CN 116613732 A CN116613732 A CN 116613732A
Authority
CN
China
Prior art keywords
model
tcn
load
prediction
load prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310436362.4A
Other languages
English (en)
Inventor
周磊
李亚飞
李洁
顾水福
刘乙
钱霄杰
李圆琪
朱超群
王波
王聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd filed Critical Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority to CN202310436362.4A priority Critical patent/CN116613732A/zh
Publication of CN116613732A publication Critical patent/CN116613732A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Power Engineering (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于SHAP值选择策略的多元负荷预测方法,该方法利用TCN卷积神经网络对综合能源系统下多种特征参量的多元负荷时间序列数据进行建模,对网络隐藏层状态输出应用全局注意力机制进行处理,突出影响负荷变化的关键特征,然后计算各特征SHAP值进行输入变量筛选,去除相关度较低的特征对模型的干扰,再返回GA‑TCN模型训练学习得到多元负荷预测结果,达到耦合多元负荷预测模型内部解耦、精确计算的目的。本发明所建立的多元负荷预测模型能深度挖掘多元时间序列中的有效信息,通过量化相关影响因素对结果的贡献度提升预测的准确性,与传统预测方法相比具有更优越的性能。

Description

一种基于SHAP值选择策略的多元负荷预测方法及系统
技术领域
本发明属于综合能源技术领域,涉及一种基于SHAP值选择策略的多元负荷预测方法及系统。
背景技术
近年来,随着社会经济的快速发展,工业生产及居民生活对能源的需求量日益增加,能源问题逐渐成为学术界关注的热点话题。传统能源子系统之间的规划、设计与运行往往相互割离,不同类型能源系统之间的耦合性没有得到很好的体现,导致能源利用率与安全性能的下降。综合能源系统(integrated energy system,IES)是一种集电力、制冷、供暖等能源供应为一体的新能源系统,可实现电、冷、热等多种能源的转换利用、协同优化和耦合互补,有效提高能源综合利用率。我国当前的能源使用形态正在逐步向多元化方向发展,而IES作为能源互联网的物理载体,能够满足用户侧各类能源供给的持续多样化需求。
目前,面对综合能源系统下的多能源负荷预测问题,方法主要集中于传统时间序列数据分析和机器学习两个方面。针对各种单一负荷的独立预测,大多采用矢量自回归模型、整合移动平均自回归模型等传统方法,但传统方法基本只考虑了一种负荷的变化规律,对于多元负荷的耦合特性没有对应有效的改善适应机制。目前,基于机器学习方法的预测模型也逐渐应用于多元负荷预测研究中,如广义回归神经网络、支持向量机、极限学习机等。这些方法相比起传统方法有一定成效,但随着新能源的发展,可再生能源的接入比例与用户侧用能需求的复杂性不断提高,很难建立精确数学模型模拟实际供能系统与用能需求响应,因此负荷预测精度还有待提高。近年来,深度学习凭借其良好的学习能力在时间序列的预测研究中得到了越来越广泛的应用,其中的典型模型代表有长短期记忆神经网络(LSTM)、卷积神经网络等。尽管这些循环神经网络对于时间序列特征有一定的学习能力,但它们具有自身的局限性,面对多能源负荷之间的复杂关联性并不能实现深度挖掘及最优表达。
发明内容
为解决现有技术中存在的不足,本发明提供一种基于SHAP值选择策略的多元负荷预测方法,适应于多元负荷预测模型的可解释性研究,对综合能源系统下复杂关联的多维度时间序列负荷数据解耦,分析影响因素的相关性并进行量化处理,实现模型的最优预测性能。
本发明采用如下的技术方案。
本发明第一方面提供一种基于SHAP值选择策略的多元负荷预测方法:
将综合能源系统下多种特征参量的多元负荷时间序列数据输入TCN神经网络,将全局注意力机制应用于TCN神经网络的隐藏层状态输出并构建GA-TCN模型;计算各特征参量的SHAP值以筛选模型输入变量,将筛选后的输入变量输入GA-TCN模型得到多元负荷预测结果。
优选地,方法具体包括:
步骤1,采集多种特征参量的时间序列数据并将数据划分为训练集和测试集;
步骤2,对TCN神经网络的隐藏层状态输出应用注意力机制以构建基于GA-TCN的多元负荷预测模型;
步骤3,利用训练集数据对GA-TCN多元负荷预测模型进行训练优化,判断预测结果的各评价指标是否达到设定预期目标准确率,达到则输出预测结果,反之则执行步骤4;
步骤4,计算各特征SHAP值,筛选模型输入变量并执行步骤3。
优选地,步骤1还包括对多种特征参量的时间序列数据其进行数据预处理;
所述特征参量包括电负荷、冷负荷、热负荷及相关特征影响参量,其中相关特征影响参量包括全球水平辐照度、气温、湿度、平均风速、平均风向、大气压、日历规则。
优选地,步骤2中GA-TCN多元负荷预测模型构建过程包括:
构建TCN神经网络,包括输入层、卷积层、多个依次连接的残差模块以及隐藏层;将特征参量的时间序列数据作为TCN网络输入变量;
对网络隐藏层状态输出应用全局注意力机制进行处理,构建GA-TCN多元负荷预测模型,其中注意力层用于分析不同输入特征参量对预测结果的影响程度,将其量化为特征权重系数。
优选地,步骤3包括:对GA-TCN多元负荷预测模型进行模型训练优化以得到最优GA-TCN多元负荷预测模型;将特征影响参量的时间序列数据输入最优GA-TCN多元负荷预测模型,基于全局注意力机制将网络输入中特征参量赋予权重,对未来时刻的电负荷、冷负荷、热负荷数据进行预测;判断预测结果的各评价指标是否达到设定预期目标准确率,达到则输出预测结果,反之则执行步骤4;其中特征权重系数与特征参量对预测结果的影响程度呈正相关。
优选地,模型训练优化过程包括:
采用网格搜索法确定TCN网络参数取值,并采用残差连接训练TCN网络,其中残差块包含两层卷积和非线性映射,每个卷积层应用了权值规范化,同时,ReLU激活函数被添加到两个卷积层之后的残差块中,为TCN引入非线性;
通过控制变量法确定GA模型的参数取值,计算最小损失函数值以确定Attention层的神经元个数,得到最优GA-TCN多元负荷预测模型。
优选地,判断预测结果的各评价指标是否达到设定预期目标准确率的过程包括:将特征参量的时间序列数据输入最优GA-TCN多元负荷预测模型,分别得到电负荷、冷负荷、热负荷预测结果,基于电负荷、冷负荷、热负荷预测结果与电负荷、冷负荷、热负荷的真实值计算预测评级指标,判断预测评价指标是否满足设定预期目标准确率。
优选地,步骤4包括通过全局样本分别计算电负荷、冷负荷、热负荷预测任务中所有特征参量SHAP值,模型预测结果解释为二元变量的线性函数,筛选对预测结果贡献较大的特征参量作为模型输入变量。
优选地,步骤4包括预测模型的输入变量向量为x=(x1,x2,…,xn),其中n为模型输入变量的个数;xn为特征参量,则基于SHAP值的全局解释模型在最优GA-TCN多元负荷预测模型的基础上表现为:
式中,f(x)为多元负荷预测模型输出,g(x’)为解释模型输出,φ0为预测基准值,即待预测目标所有预测值之和的均值,φi为第i个特征的SHAP值,xi'∈{0,1}n为输入特征的二进制映射变量,表征输入变量向量中第i个特征是否存在。
优选地,步骤1还包括:对采集到的多种特征参量的多元负荷序列数据进行数据预处理,包括空缺数据填补、异常数据修复;
将电负荷、冷负荷作为多元负荷预测模型的每次预测固定的模型输入特征。
本发明第二方面,提供一种基于SHAP值选择策略的多元负荷预测系统,系统包括:
数据采集模块,用于采集多种特征参量的时间序列数据并将数据划分为训练集和测试集;
模型构建模块,用于对TCN神经网络的隐藏层状态输出应用注意力机制以构建基于GA-TCN的多元负荷预测模型;
模型优化模块,用于利用训练集数据对GA-TCN多元负荷预测模型进行训练优化;
计算模块,用于计算预测结果的各评级指标一个各个特征参量的SHAP值;
比较模块,用于判断预测结果的各评价指标是否达到设定预期目标准确率。
本发明的有益效果在于考虑到综合能源系统中多种子能源之间强交互、强耦合的特点,可以通过该联合预测模型分别对电、冷、热负荷的预测结果根据其影响因素的不同相关性进行加权量化处理,从而达到将复杂耦合数据解耦分析、精确高效预测的目的;与传统预测方法相比,本发明提出的多元负荷预测模型各项指标都处于较高水平,且采用了SHAP值输入变量筛选策略,去除了相关度较低的特征对模型的干扰,具有明显的优越性。
附图说明
图1本发明提出的一种基于SHAP值选择策略的多元负荷预测方法;
图2是基于SHAP值的输入变量选择策略;
图3是扩张因子d=1,2,4的因果空洞卷积;
图4是TCN网络中的残差块;
图5是全局注意力模型结构图;
图6是GA-TCN预测模型结构图;
图7是本发明实施例的基于SHAP值选择策略的多元负荷预测模型求解具体流程图;
图8-10分别是电负荷、冷负荷、热负荷预测结果的10维特征变量的全局SHAP值展示图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。本申请所描述的实施例仅仅是本发明一部分的实施例,而不是全部实施例。基于本发明精神,本领域普通技术人员在没有作出创造性劳动前提下所获得的有所其它实施例,都属于本发明的保护范围。
如图1所示,本实施例第一方面提供一种基于SHAP值选择策略的多元负荷预测方法,包括将综合能源系统下多种特征参量的多元负荷时间序列数据输入TCN神经网络,将全局注意力机制应用于TCN神经网络的隐藏层状态输出并构建GA-TCN模型;计算各特征参量的SHAP值以筛选模型输入变量,将筛选后的输入变量输入GA-TCN模型得到多元负荷预测结果。
优选地,上述方法具体包括:
步骤1,采集多种特征参量的时间序列数据并将数据划分为训练集和测试集;
优选地,步骤1还包括对多种特征参量的时间序列数据其进行数据预处理;
所述特征参量包括电负荷、冷负荷、热负荷及相关特征影响参量,其中相关特征影响参量包括全球水平辐照度、气温、湿度、平均风速、平均风向、大气压、日历规则。
优选地,步骤1还包括:对采集到的多种特征参量的多元负荷序列数据进行数据预处理,包括空缺数据填补、异常数据修复;
将电负荷、冷负荷作为多元负荷预测模型的每次预测固定的模型输入特征。
步骤2,对TCN神经网络的隐藏层状态输出应用注意力机制以构建基于GA-TCN的多元负荷预测模型;
优选地,步骤2中GA-TCN多元负荷预测模型构建过程包括:
构建TCN神经网络,包括输入层、卷积层、多个依次连接的残差模块以及隐藏层;将特征参量的时间序列数据作为TCN网络输入变量;
关于本实施例采用的TCN神经网络是一种利用因果卷积和空洞卷积的神经网络模型,可以适应时间序列的时序性并用于广泛的序列建模任务。
1)时间约束模型
TCN网络有两个主要约束:网络输出和输入应具有相同长度,网络应只使用过去步长的信息。TCN中使用了1维全卷积网络(1D FCN)结构,其中每个隐藏层的长度与输入层长度相同,并使用零填充以确保后续层具有相同的长度。此外,对于网络输出,TCN使用因果卷积,即每一层的时间步长t的输出不晚于前一层时间步长t的区域。
2)空洞卷积
空洞卷积为了抓取更长期的相关信息,线性堆叠了很多层,从而实现有限层网络具有指数级别大小的接收域。TCN采用空洞卷积,从距离t的每d步处获取输入:xt-(k-1)d,…,xt-2d,xt-d,xt。其中k是内核大小。空洞卷积让网络回溯到(k-1)d个时间步长以前,使每层数的感受野呈指数级增长,如图3所示。
3)残差连接
残差连接是训练深层网络的有效方法,它使得网络可以以跨层的方式传递信息,从而获得足够大的接收域。这不仅可以加快训练过程,还可以避免深度模型的梯度消失问题。本发明构建的残差块包含两层卷积和非线性映射,并对每个卷积层应用了权值规范化,后通过Dropout引入正则化防止过拟合。同时,ReLU激活函数被添加到两个卷积层之后的残差块中,为TCN引入非线性。图4展示了最终的残差块。
对网络隐藏层状态输出应用全局注意力机制进行处理,构建GA-TCN多元负荷预测模型,其中注意力层用于分析不同输入特征参量对预测结果的影响程度,将其量化为特征权重系数。
注意力机制可以灵活捕捉局部与全局的关系,观察有用信息的权重占比,从而更加关注与输入元素相似的部分,抑制无用信息。本发明采用一种有效的注意力模型:全局注意力模型(GA),模型结构图如图5所示。
全局注意力模型的思想是在推导环境向量ct时考虑编码器的所有隐藏状态。对于每一个时间步t,模型将根据当前神经网络顶层的隐藏状态ht和所有源状态hs导出一个基于文本内容的分数函数score,表达式如下:
其中Wa表示每个源状态所占权重。通过比较当前目标隐藏状态ht和源隐藏状态可以得到一个长度可变的对齐向量ats,也就是每个/>的注意力权重,其大小等于源端的时间步数:
将神经网络的所有源状态作为输入,以对齐向量ats为权重,可以导出一个环境向量ct,该向量可以捕获相关的源端信息,帮助预测当前目标yt。ct计算公式为所有源隐藏状态的加权平均值:
这里使用一个全连接层来组合两个向量的信息,从而产生如下的注意力向量:
ht=f(ct,ht)=tanh(Wc[ct;ht])
最后将注意力向量ht馈入softmax层以产生预测分布,公式如下:
p(yt|y<t,x)=softmax(Wsht)
GA模型在编码器和解码器的神经网络顶层使用隐藏状态,通过 顺序依次对目标yt进行预测,计算路径清晰便捷。
综合上文,本发明结合全局注意力机制与TCN神经网络构造出一个综合能源系统下的多元负荷预测模型,结构图如图6所示。
本实施例中模型构建过程包括将收集到的电、冷、热负荷数据与相关影响特征参量如水平辐照度、气温、气压、湿度等对应的时间序列数据作为TCN网络输入变量;
对网络隐藏层状态输出应用注意力机制进行处理。使用多个全连接层分析不同输入特征参量对预测结果的影响程度,将其量化为特征权重系数,进而分别对电、冷、热负荷的预测结果进行加权求和。
步骤3,利用训练集数据对GA-TCN多元负荷预测模型进行训练优化,判断预测结果的各评价指标是否达到设定预期目标准确率,达到则输出预测结果,反之则执行步骤4;
优选地,步骤3包括:对GA-TCN多元负荷预测模型进行模型训练优化以得到最优GA-TCN多元负荷预测模型;将特征影响参量的时间序列数据输入最优GA-TCN多元负荷预测模型,基于全局注意力机制将网络输入中特征参量赋予权重,对未来时刻的电负荷、冷负荷、热负荷数据进行预测;判断预测结果的各评价指标是否达到设定预期目标准确率,达到则输出预测结果,反之则执行步骤4;其中特征权重系数与特征参量对预测结果的影响程度呈正相关。
优选地,模型训练优化过程包括:
采用网格搜索法确定TCN网络参数取值,并采用残差连接训练TCN网络,其中残差块包含两层卷积和非线性映射,每个卷积层应用了权值规范化,同时,ReLU激活函数被添加到两个卷积层之后的残差块中,为TCN引入非线性;
通过控制变量法确定GA模型的参数取值,计算最小损失函数值以确定Attention层的神经元个数,得到最优GA-TCN多元负荷预测模型。
优选地,判断预测结果的各评价指标是否达到设定预期目标准确率的过程包括:将特征参量的时间序列数据输入最优GA-TCN多元负荷预测模型,分别得到电负荷、冷负荷、热负荷预测结果,基于电负荷、冷负荷、热负荷预测结果与电负荷、冷负荷、热负荷的真实值计算预测评级指标,判断预测评价指标是否满足设定预期目标准确率。
步骤4,计算各特征SHAP值,筛选模型输入变量并执行步骤3。
优选地,步骤4包括通过全局样本分别计算电负荷、冷负荷、热负荷预测任务中所有特征参量SHAP值,模型预测结果解释为二元变量的线性函数,筛选对预测结果贡献较大的特征参量作为模型输入变量。
优选地,步骤4包括预测模型的输入变量向量为x=(x1,x2,…,xn),其中n为模型输入变量的个数,则基于SHAP值的全局解释模型在最优GA-TCN多元负荷预测模型的基础上表现为:
式中,f(x)为多元负荷预测模型输出,g(x’)为解释模型输出,φ0为预测基准值,即所有样本预测值之和的均值,φi为第i个特征的SHAP值,xi'∈{0,1}n为输入特征的二进制映射变量,表征输入变量向量中第i个特征是否存在。
其中,SHAP是一种基于博弈论的可加性特征归因方法,它将机器学习中的所有输入特征视为“贡献者”,通过计算每个特征对预测样本的贡献值来量化输入特征与输出结果之间的关系。其具体的表达式如下:
yi=ybase+f(xi1)+f(xi2)+…f(xin)
式中,yi表示模型对样本xi的预测值,ybase表示所有的样本预测值之和的均值,f(xim)为第i个样本中第m个特征对最终预测结果的贡献值,当f(xim)>1说明该特征对目标值的预测起到了正向作用;反之,则具有反向作用。
本发明采用的基于SHAP值的输入变量选择策略具体为:
SHAP是比较全能的模型可解释性的方法,可用于任意模型的局部和全局解释。其核心思想是计算特征对模型输出的边际贡献,再从局部和全局两个层面对“黑盒模型”进行解释。本发明采用一种基于SHAP值的输入变量选择策略,如图2所示。通过全局样本计算多元负荷预测任务中特征变量的SHAP值,只选取对预测结果贡献较大的特征作为输入变量,以提高预测模型的精确性和有效性。
将SHAP值计算引入多元耦合变量预测的核心是将模型预测结果解释为二元变量的线性函数。假设预测模型的输入变量向量,即特征参量向量为x=(x1,x2,…,xn),其中n为输入变量的个数,那么基于SHAP值的全局解释模型可以在原多元负荷预测模型的基础上表现为:
式中,f(x)为多元负荷预测模型输出,即分别为电负荷、冷负荷、热负荷预测结果,g(x’)为解释模型输出,φ0为预测基准值,一般为预测结果的平均值,即待预测目标所有预测值之和的均值,在本申请中指的是预测目标分别为电、冷、热负荷,则,φ0分别为电、冷、热负荷的多个预测值中的均值,φi为第i个特征的SHAP值,xi'∈{0,1}n为输入特征的二进制映射变量,表征输入变量向量中第i个特征是否存在。
实施例2:本实施例基于SHAP值选择策略对多元负荷预测模型进行求解具体流程如图7所示。
步骤1.针对采集到的IES多元负荷序列数据进行空缺数据填补、异常数据修复等数据预处理工作,同时初步确定对负荷预测结果产生影响的特征参量;电、冷、热负荷主要是受外部环境因素及日历规则的影响而产生波动。如气温的高低会影响人们空调的制冷制热的使用,或工作日与非工作日会影响人们居家使用电能的多少。按照美国国家可再生能源实验室所测量的环境因素,可以初步确定可能对负荷预测结果产生影响的特征参量,其他特征通过后续SHAP值的计算来分析筛选。
步骤2.将电、冷、热负荷及相关特征影响参量的时间序列数据输入GA-TCN多元负荷预测模型,对未来时刻的电、冷、热负荷数据进行预测分析;
步骤3.计算预测结果的各评价指标,与其他多元负荷预测模型进行对比分析,判断是否达到预期目标准确率,达到则输出预测结果,反之则进行下一步骤;
步骤4.计算各特征SHAP值,比较它们对预测结果的贡献度,筛去影响程度较小的特征,保留其余输入参量,再次返回步骤2重新进行负荷预测。优选地,可以在每次循环后都进行预测评价指标的计算,通过数据对比观测排除多少个特征时预测效果最佳,即达到目标准确率。其中电、冷、热负荷是预测目标同时也是预测结果的重要特征参量,其对自己预测结果的影响贡献度是最高的。
本实施例中,特征参量的筛选个数可以根据每次预测的结果进行调整,可以一次排除掉一个,如果同时发现有两个特征参量的SHAP值同样低,也可以一同排除。优选地,最终保留超过5个的特征参量,其中固定包括电负荷、冷负荷。
本发明第二方面,提供一种基于SHAP值选择策略的多元负荷预测系统,系统包括:
数据采集模块,用于采集多种特征参量的时间序列数据并将数据划分为训练集和测试集;
模型构建模块,用于对TCN神经网络的隐藏层状态输出应用注意力机制以构建基于GA-TCN的多元负荷预测模型;
模型优化模块,用于利用训练集数据对GA-TCN多元负荷预测模型进行训练优化;
计算模块,用于计算预测结果的各评级指标一个各个特征参量的SHAP值;
比较模块,用于判断预测结果的各评价指标是否达到设定预期目标准确率。
下面通过一个实施例对本发明做进一步的说明。
以美国亚利桑那州立大学Tempe校区的IES电、冷、热负荷数据作为实验数据,天气因素考虑全球水平辐照度、气温、湿度、平均风速、平均风向(偏离N的角度)、大气压,在美国国家可再生能源实验室(NREL)官网内的测量与仪器数据中心,选择与Tempe校区最近的气象站点进行数据采集。日历规则考虑工作日与节假日情况,天气、日历规则数据共7维。以15min为步长进行数据采集,按7∶2∶1划分训练集、验证集、测试集。实验选用Python语言,在Tensorflow框架下实现。
这里采用网格搜索法确定TCN网络参数取值,通过控制变量法确定GA模型的参数取值。经实验可得,设置TCN网络卷积核个数为128,扩张列表为[1、2、4、8、16、32],选用因果网络,添加残差块跳过连接,添加失活率为0.1的Dropout层防止过拟合,残差块中使用批处理规范化,激活函数选用ReLU。为解决网络稀疏梯度和噪声问题,选用Adam算法进行调参和迭代,它能基于训练数据迭代地更新神经网络权重。TCN网络的超参数设置如表1所示。
表1
TCN网络超参数 取值
卷积层卷积核个数 128
卷积核大小 3
扩张列表 [1、2、4、8、16、32]
输出层神经元个数 3
学习率 0.001
优化求解器 adam
损失函数 mse
精度指标 accuracy
最大迭代次数 300
批样本数量 64
通过多次实验分析Attention层神经元个数对模型预测效果影响如表2所示。通过其损失函数值及模型精度分布可知,Attention层设置为15个神经元时,模型训练效果最佳。
表2
针对10维输入特征,即电负荷、冷负荷、热负荷、全球水平辐照度、气温、湿度、平均风速、平均风向、大气压、日历规则,进行神经网络训练学习,并计算各特征指标的全局SHAP值。由于本申请针对的是多元负荷的预测,此处需单独对电、冷、热负荷分别求取不同特征的SHAP值,从而可以更直接明确观察得到影响不同负荷变化的关键特征参量。10维特征变量的全局SHAP值按照由大到小依次排列,如图8-10所示。
从上图中可以看出,不同预测任务的结果是由不同的特征变量所影响的。负荷预测结果具有很强的自相关性,即某一时刻的负荷预测值与该时刻之前的历史数据密切相关,表明各负荷时间序列在连续时间范围内存在一定的内部规律性与连续性;电、冷、热三种负荷之间存在强相关性,验证了前文所述IES内部能量相互耦合相互关联的特征,证明了本申请提出的多元负荷联合预测模型的优越性;电、冷、热负荷与气象因素和日历规则之间都具有很强的关联性,气温、湿度、水平辐照度等特征变量对该模型下的三类负荷预测结果都有着不可忽略的影响效果。由于本申请建立的是一个多元负荷的综合预测模型,输入变量不能根据单个预测负荷的不同而发生改变,因此这里选取对预测结果综合贡献度最高的7种特征变量,分别是电负荷、冷负荷、热负荷、气温、湿度、全球水平辐照度、日历规则。按照所有特征分别对三种负荷的预测结果贡献度进行从高到低的排序,通过观察可去除同时对三种负荷SHAP值都为最低或偏低的特征量,保留其他特征变量。
表3
将经过SHAP值筛选后的输入特征再次导入模型进行预测,结果与原预测结果的评价指标对比如表3所示,可以明显看出预测误差依次变小,表明筛选过后的特征变量输入对模型的预测精度有了显著提升,证明了基于SHAP值的输入特征筛选策略的有效性。
为验证GA-TCN模型对多元负荷数据预测的精确性与有效性,这里将本发明所提出的模型与其余几组预测模型进行对比分析,对照模型有:目前广泛运用于综合能源系统负荷预测分析的LSTM神经网络模型、加上全局注意力机制的GA-LSTM模型、TCN神经网络模型、普通注意力机制(Attention)与TCN网络结合的AT-TCN模型。不同模型的实验预测结果评价指标如表4所示。
表4
观察上表结果可知,通过LSTM网络与GA-LSTM模型所得的多元负荷预测误差皆大于TCN网络与GA-TCN模型,说明TCN网络相比LSTM网络对于多元负荷的综合预测分析更具优越性。AT-TCN模型相比单纯TCN网络预测精度更高,其电、冷、热负荷的EMAPE分别比原网络高出了0.02%、0.1%、1.2%,表明注意力机制对于各耦合子能源负荷间的加权量化作用是有效的。而本文所提出的GA-TCN模型预测结果与实际值预测误差最小,其电负荷EMAPE为0.7%、冷负荷EMAPE为2.1%、热负荷EMAPE为9.2%,证明对TCN网络隐藏层状态输出应用全局注意力机制,使用多个全连接层分析不同输入特征参量对预测结果的影响程度,可以突出影响该负荷变化的关键特征,弱化相关度较小的特征,从而达到耦合多元负荷预测模型内部解耦、精确计算的目的。
本发明的有益效果在于,与现有技术相比,基于SHAP值选择策略的多元负荷预测方法能深度挖掘多元时间序列中的有效信息,通过量化相关影响因素对结果的贡献度提升预测的准确性,与传统预测方法相比具有更优越的性能。对TCN网络隐藏层状态输出应用全局注意力机制,使用多个全连接层分析不同输入特征参量对预测结果的影响程度,可以突出影响该负荷变化的关键特征,弱化相关度较小的特征,从而达到耦合多元负荷预测模型内部解耦、精确计算的目的。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (13)

1.一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
将综合能源系统下多种特征参量的多元负荷时间序列数据输入TCN神经网络,将全局注意力机制应用于TCN神经网络的隐藏层状态输出并构建GA-TCN模型;计算各特征参量的SHAP值以筛选模型输入变量,将筛选后的输入变量输入GA-TCN模型得到多元负荷预测结果。
2.根据权利要求书1所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:所述方法包括:
步骤1,采集多种特征参量的时间序列数据并将数据划分为训练集和测试集;
步骤2,对TCN神经网络的隐藏层状态输出应用注意力机制以构建基于GA-TCN的多元负荷预测模型;
步骤3,利用训练集数据对GA-TCN多元负荷预测模型进行训练优化,判断预测结果的各评价指标是否达到设定预期目标准确率,达到则输出预测结果,反之则执行步骤4;
步骤4,计算各特征SHAP值,筛选模型输入变量并执行步骤3。
3.根据权利要求书2所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
步骤1还包括对多种特征参量的时间序列数据其进行数据预处理;
所述特征参量包括电负荷、冷负荷、热负荷及相关特征影响参量,其中相关特征影响参量包括全球水平辐照度、气温、湿度、平均风速、平均风向、大气压、日历规则。
4.根据权利要求书2所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
步骤2中GA-TCN多元负荷预测模型构建过程包括:
构建TCN神经网络,包括输入层、卷积层、多个依次连接的残差模块以及隐藏层;将特征参量的时间序列数据作为TCN网络输入变量;
对网络隐藏层状态输出应用全局注意力机制进行处理,构建GA-TCN多元负荷预测模型,其中注意力层用于分析不同输入特征参量对预测结果的影响程度,将其量化为特征权重系数。
5.根据权利要求书2所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
步骤3包括:对GA-TCN多元负荷预测模型进行模型训练优化以得到最优GA-TCN多元负荷预测模型;将特征影响参量的时间序列数据输入最优GA-TCN多元负荷预测模型,基于全局注意力机制将网络输入中特征参量赋予权重,对未来时刻的电负荷、冷负荷、热负荷数据进行预测;判断预测结果的各评价指标是否达到设定预期目标准确率,达到则输出预测结果,反之则执行步骤4;其中特征权重系数与特征参量对预测结果的影响程度呈正相关。
6.根据权利要求书5所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
模型训练优化过程包括:
采用网格搜索法确定TCN网络参数取值,并采用残差连接训练TCN网络,其中残差块包含两层卷积和非线性映射,每个卷积层应用了权值规范化,同时,ReLU激活函数被添加到两个卷积层之后的残差块中,为TCN引入非线性;
通过控制变量法确定GA模型的参数取值,计算最小损失函数值以确定Attention层的神经元个数,得到最优GA-TCN多元负荷预测模型。
7.根据权利要求书5所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
判断预测结果的各评价指标是否达到设定预期目标准确率的过程包括:将特征参量的时间序列数据输入最优GA-TCN多元负荷预测模型,分别得到电负荷、冷负荷、热负荷预测结果,基于电负荷、冷负荷、热负荷预测结果与电负荷、冷负荷、热负荷的真实值计算预测评级指标,判断预测评价指标是否满足设定预期目标准确率。
8.根据权利要求书2所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
步骤4包括通过全局样本分别计算电负荷、冷负荷、热负荷预测任务中所有特征参量SHAP值,模型预测结果解释为二元变量的线性函数,筛选对预测结果贡献较大的特征参量作为预测模型输入变量。
9.根据权利要求书7所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
步骤4包括:预测模型的输入变量向量为x=(x1,x2,…,xn),其中n为模型输入变量的个数;xn为特征参量,则基于SHAP值的全局解释模型在最优GA-TCN多元负荷预测模型的基础上表现为:
式中,f(x)为多元负荷预测模型输出,g(x’)为解释模型输出,φ0为预测基准值,即待预测目标所有预测值之和的均值,φi为第i个特征的SHAP值,xi'∈{0,1}n为输入特征的二进制映射变量,表征输入变量向量第i个特征是否存在。
10.根据权利要求书2所述的一种基于SHAP值选择策略的多元负荷预测方法,其特征在于:
步骤1还包括:对采集到的多种特征参量的多元负荷序列数据进行数据预处理,包括空缺数据填补、异常数据修复;
将电负荷、冷负荷作为多元负荷预测模型的每次预测固定的模型输入特征。
11.一种基于SHAP值选择策略的多元负荷预测系统,其特征在于:
数据采集模块,用于采集多种特征参量的时间序列数据并将数据划分为训练集和测试集;
模型构建模块,用于对TCN神经网络的隐藏层状态输出应用注意力机制以构建基于GA-TCN的多元负荷预测模型;
模型优化模块,用于利用训练集数据对GA-TCN多元负荷预测模型进行训练优化;
计算模块,用于计算预测结果的各评级指标一个各个特征参量的SHAP值;
比较模块,用于判断预测结果的各评价指标是否达到设定预期目标准确率。
12.一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1-10任一项所述方法的步骤。
13.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-10任一项所述方法的步骤。
CN202310436362.4A 2023-04-21 2023-04-21 一种基于shap值选择策略的多元负荷预测方法及系统 Pending CN116613732A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310436362.4A CN116613732A (zh) 2023-04-21 2023-04-21 一种基于shap值选择策略的多元负荷预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310436362.4A CN116613732A (zh) 2023-04-21 2023-04-21 一种基于shap值选择策略的多元负荷预测方法及系统

Publications (1)

Publication Number Publication Date
CN116613732A true CN116613732A (zh) 2023-08-18

Family

ID=87684476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310436362.4A Pending CN116613732A (zh) 2023-04-21 2023-04-21 一种基于shap值选择策略的多元负荷预测方法及系统

Country Status (1)

Country Link
CN (1) CN116613732A (zh)

Similar Documents

Publication Publication Date Title
CN107392368B (zh) 一种基于气象预报的办公建筑动态热负荷组合预测方法
CN112949945A (zh) 一种改进双向长短期记忆网络的风电功率超短期预测方法
CN112100911B (zh) 一种基于深度bilstm的太阳辐射预测方法
Sørensen et al. Recent developments in multivariate wind and solar power forecasting
CN114119273A (zh) 一种园区综合能源系统非侵入式负荷分解方法及系统
Girimurugan et al. Application of deep learning to the prediction of solar irradiance through missing data
Aliberti et al. Forecasting Short-term Solar Radiation for Photovoltaic Energy Predictions.
Rysanek et al. Forecasting the impact of climate change on thermal comfort using a weighted ensemble of supervised learning models
CN115759458A (zh) 基于综合能源数据处理和多任务深度学习的负荷预测方法
CN116169670A (zh) 一种基于改进神经网络的短期非居民负荷预测方法及系统
Zhang et al. All‐factor short‐term photovoltaic output power forecast
Jobayer et al. A systematic review on predicting PV system parameters using machine learning
CN117688846A (zh) 用于建筑能耗的强化学习预测方法及系统、存储介质
Sun et al. A compound structure for wind speed forecasting using MKLSSVM with feature selection and parameter optimization
Huang et al. A decomposition‐based multi‐time dimension long short‐term memory model for short‐term electric load forecasting
Liao et al. Wind power prediction based on periodic characteristic decomposition and multi-layer attention network
Zheng et al. Estimating residential buildings’ energy usage utilising a combination of Teaching–Learning–Based Optimization (TLBO) method with conventional prediction techniques
Ghasvarian Jahromi et al. Wind power prediction based on wind speed forecast using hidden Markov model
CN115936236A (zh) 一种卷烟厂能耗预测方法、系统、设备及介质
CN115310355A (zh) 考虑多能耦合的综合能源系统多元负荷预测方法及系统
Liang et al. ENSONet: a data-driven ENSO forecasting model with concise spatial location learning parameters and temporal embedding
CN116613732A (zh) 一种基于shap值选择策略的多元负荷预测方法及系统
Tong et al. A prediction model for complex equipment remaining useful life using gated recurrent unit complex networks
Gao et al. Integrated Deep Neural Networks‐Based Complex System for Urban Water Management
Sun et al. Optimizing the quality control of multivariate processes under an improved Mahalanobis–Taguchi system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination