CN116468138A - 空调负荷预测方法、系统、电子设备及计算机存储介质 - Google Patents

空调负荷预测方法、系统、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN116468138A
CN116468138A CN202211552702.1A CN202211552702A CN116468138A CN 116468138 A CN116468138 A CN 116468138A CN 202211552702 A CN202211552702 A CN 202211552702A CN 116468138 A CN116468138 A CN 116468138A
Authority
CN
China
Prior art keywords
air conditioner
conditioner load
data
historical
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211552702.1A
Other languages
English (en)
Inventor
徐杰彦
周炳
陈征
张若思
苏子云
夏立峰
马宗中
刘传飞
苟大伟
蒋丽君
许雯旸
薛福霞
尹鹏
高丽丽
尤明升
褚渊
汤江晖
贺凡
王皓
杨一格
赵若丞
张浩然
张少迪
秦超
章晶晶
陈晶鑫
王迎秋
赵猛
李野
田润泽
王凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Beijing Comprehensive Energy Planning And Design Institute Co ltd
State Grid Tianjin Electric Power Co Ltd
Original Assignee
State Grid Beijing Comprehensive Energy Planning And Design Institute Co ltd
State Grid Tianjin Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Beijing Comprehensive Energy Planning And Design Institute Co ltd, State Grid Tianjin Electric Power Co Ltd filed Critical State Grid Beijing Comprehensive Energy Planning And Design Institute Co ltd
Priority to CN202211552702.1A priority Critical patent/CN116468138A/zh
Publication of CN116468138A publication Critical patent/CN116468138A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

本发明涉及一种空调负荷预测方法、系统、电子设备及计算机存储介质,涉及电力需求响应领域,方法包括:获取历史空调负荷数据和历史影响因素数据;对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数;根据所述初始聚类中心和所述聚类数利用权熵法进行K‑means聚类,得到加权欧氏距离和聚类结果;根据所述加权欧氏距离和所述聚类结果确定训练样本集;根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型;根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。本发明能够准确地预测负荷值,提高空调负荷预测的精度。

Description

空调负荷预测方法、系统、电子设备及计算机存储介质
技术领域
本发明涉及电力需求响应领域,特别是涉及一种空调负荷预测方法、系统、电子设备及计算机存储介质。
背景技术
随着科学技术的不断进步和国民经济的不断发展,物联网技术在实现智能楼宇系统的各项功能方面发挥了重要作用,智慧城市建设如火如荼地开展,新建办公楼宇的数量也在逐年递增。而经济发展导致的能源短缺的问题也日益严重,如何有效地节约能源、提高能源的利用效率已成为当前需解决的公共问题。在新型电力系统中,需求侧和电网侧双向互动能力不断提升,需求侧资源逐步成为电网调度运行的重要资源。空调负荷作为重要的需求侧可调控资源,负荷耗能尤为突出。据不完全统计,夏季空调负荷占尖端负荷30%-40%,目前中国各地推行“需求响应管理平台”项目,充分调动用户侧主动参与电力需求响应业务,平台包括负荷预测、资源管理、负荷管理、响应监控、响应结算、响应效果分析等功能,为多场景楼宇参与需求响应提供便利,负荷聚合商通过楼宇量测系统中的温湿度传感器、新风系统计量装置及分项智能电表等终端设备对楼宇运行状态进行监控。通过历史天气、历史负荷等数据对接下来的一段短期时间进行负荷预测,获得空调负荷可调量,即虚拟发电资源发电量,通过预测结果向电力交易中心提交自己的发电量和报价策略。综上所述,基于传统电力负荷预测及多场景的楼宇空调冷负荷预测具有较大的应用价值和应用前景,然而现有的空调负荷预测方法的预测精度有待提高。
发明内容
本发明的目的是提供一种空调负荷预测方法、系统、电子设备及计算机存储介质,能够准确地预测负荷值,提高空调负荷预测的精度。
为实现上述目的,本发明提供了如下方案:
一种空调负荷预测方法,包括:
获取历史空调负荷数据和历史影响因素数据;
对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数;
根据所述初始聚类中心和所述聚类数利用权熵法进行K-means聚类,得到加权欧氏距离和聚类结果;
根据所述加权欧氏距离和所述聚类结果确定训练样本集;
根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型;
根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。
可选地,所述对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数,具体包括:
对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,计算所述历史空调负荷数据和所述历史影响因素数据的密度指标;
选择所述密度指标中最大密度指标对应的历史空调负荷数据和所述历史影响因素数据作为初始聚类中心;
根据所述初始聚类中心确定类内空间距离和类间距离;
根据所述类内空间距离和所述类间距离确定聚类数。
可选地,所述加权欧氏距离的表达式为:
其中,Dik代表第i日日特征样本到第k个聚类中心的距离;ωm为经通径分析方法得到的第i日日特征样本中第m个特征的权值,M为经过因子分析后筛选出的空调负荷关键影响因素的数量;xi,m为第i日的第m个日特征样本;为在聚类过程中第m个样本的第k个聚类中心,C为聚类中心。
可选地,所述根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型,具体包括:
以所述训练样本集中的影响因素训练数据为所述LSTM神经网络的输入,以所述训练样本集中的空调负荷训练数据为所述LSTM神经网络的输出,利用金枪鱼群优化算法对所述LSTM神经网络中的超参数进行寻优计算,直至达到最大迭代次数,选择所述超参数中的最优解对应的LSTM神经网络作为空调负荷预测模型。
本发明还提供一种空调负荷预测系统,包括:
获取模块,用于获取历史空调负荷数据和历史影响因素数据;
因子分析模块,用于对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数;
K-means聚类模块,用于根据所述初始聚类中心和所述聚类数利用权熵法进行K-means聚类,得到加权欧氏距离和聚类结果;
训练样本集确定模块,用于根据所述加权欧氏距离和所述聚类结果确定训练样本集;
训练模块,用于根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型;
预测模块,用于根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。
可选地,所述因子分析模块,具体包括:
计算单元,用于对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,计算所述历史空调负荷数据和所述历史影响因素数据的密度指标;
初始聚类中心确定单元,用于选择所述密度指标中最大密度指标对应的历史空调负荷数据和所述历史影响因素数据作为初始聚类中心;
类内空间距离和类间距离确定单元,用于根据所述初始聚类中心确定类内空间距离和类间距离;
聚类数确定单元,用于根据所述类内空间距离和所述类间距离确定聚类数。
可选地,所述加权欧氏距离的表达式为:
其中,Dik代表第i日日特征样本到第k个聚类中心的距离;ωm为经通径分析方法得到的第i日日特征样本中第m个特征的权值,M为经过因子分析后筛选出的空调负荷关键影响因素的数量;xi,m为第i日的第m个日特征样本;为在聚类过程中第m个样本的第k个聚类中心,C为聚类中心。
可选地,所述训练模块,具体包括:
训练单元,用于以所述训练样本集中的影响因素训练数据为所述LSTM神经网络的输入,以所述训练样本集中的空调负荷训练数据为所述LSTM神经网络的输出,利用金枪鱼群优化算法对所述LSTM神经网络中的超参数进行寻优计算,直至达到最大迭代次数,选择所述超参数中的最优解对应的LSTM神经网络作为空调负荷预测模型。
本发明还提供一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述方法中任意一项所述的方法。
本发明还提供一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述方法中任意一项所述的方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明获取历史空调负荷数据和历史影响因素数据;对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数;根据所述初始聚类中心和所述聚类数利用权熵法进行K-means聚类,得到加权欧氏距离和聚类结果;根据所述加权欧氏距离和所述聚类结果确定训练样本集;根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型;根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。利用初始聚类中心和聚类数对K-means聚类进行改进,利用金枪鱼群优化算法对LSTM神经网络进行优化,提高全局收敛速度和寻优能力,从而准确地预测负荷值,提高空调负荷预测的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的空调负荷预测方法流程示意图;
图2为本发明提供的LSTM记忆单元结构图;
图3为基于TSO优化LSTM空调负荷数据预测框架图;
图4为本发明提供的空调负荷预测方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种空调负荷预测方法、系统、电子设备及计算机存储介质,能够准确地预测负荷值,提高空调负荷预测的精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明公开了一种基于改进K-means算法和金枪鱼群优化算法(Tuna swarmoptimization,TSO)优化长短期记忆网络(Long Short-Term Memory,LSTM)算法的空调负荷预测方法,在具有较高模型输入变量维度的情况下,完成对传统LSTM神经网络的隐含层神经元数量,学习率和训练次数的自动寻优,保证预测模型的鲁棒性,利用优化后的模型进行空调负荷预测。如图1和图4所示,本发明提供的一种空调负荷预测方法,包括:
步骤101:获取历史空调负荷数据和历史影响因素数据。
步骤102:对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数。
步骤102,具体包括:
对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,计算所述历史空调负荷数据和所述历史影响因素数据的密度指标。
选择所述密度指标中最大密度指标对应的历史空调负荷数据和所述历史影响因素数据作为初始聚类中心。
根据所述初始聚类中心确定类内空间距离和类间距离。
根据所述类内空间距离和所述类间距离确定聚类数。
步骤103:根据所述初始聚类中心和所述聚类数利用权熵法进行K-means聚类,得到加权欧氏距离和聚类结果。
步骤104:根据所述加权欧氏距离和所述聚类结果确定训练样本集。
步骤105:根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型。
步骤105,具体包括:
以所述训练样本集中的影响因素训练数据为所述LSTM神经网络的输入,以所述训练样本集中的空调负荷训练数据为所述LSTM神经网络的输出,利用金枪鱼群优化算法对所述LSTM神经网络中的超参数进行寻优计算,直至达到最大迭代次数,选择所述超参数中的最优解对应的LSTM神经网络作为空调负荷预测模型。
步骤106:根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。
本发明提供的方法包括四个部分:信息处理:利用改进K-means算法对历史空调负荷数据与关键影响因素数据做聚类分析,将处理后的数据作为训练集与测试集输入到LSTM神经网络的输入层;模型建立:构建LSTM神经网络预测模型,利用训练集数据训练LSTM神经网络,再使用TSO优化算法对LSTM神经网络进行优化,使得LSTM的超参数得以优化,从而获取优化TSO-LSTM预测组合模型;负荷预测:将测试集数据输入到TSO-LSTM神经网络中,进行负荷预测;结果输出:利用模型的输出单元输出空调负荷预测结果。
本发明还提供空调负荷预测方法在实际应用中的具体工作流程,包括以下步骤:
步骤1:利用改进K-means算法对历史空调负荷数据与关键影响因素数据进行聚类分析。
1.1)计算样本总集X中各样本的皮尔森相关系数。记皮尔森相关系数的计算公式如(1):
式中,ρ(x,y)为皮尔森相关系数;x为空调负荷向量;y为某影响因素时序向量;μx、μy分别为向量x和y的平均值;E为期望值,σx为向量x的方差,σy为向量y的方差,n为变量取值的个数,i为指标变量,值为1到n的整数,xi为第i个向量x的值,yi为第i个向量y的值。
皮尔森相关系数ρ(x,y)的值域为[-1,1],其值反映了负荷时序与某影响因素时序间线性相关的程度。当|ρ(x,y)|→1时,负荷与该影响因素的相关性越强;当|ρ(x,y)|→0时,空调负荷与该影响因素的相关性越弱。通过皮尔森相关系数对全部影响因素做因子分析,确定是否为关键因素,若否则剔除该因素,若是则对关键影响因素做数据化归一化预处理,并构建日特征向量,归一化处理公式如式(2)。
式中,v*代表数据v经过归一化处理后的值,min(v)代表数据v所在样本数据中最小的数据,max(v)表数据v所在样本数据中最大的数据。
1.2)计算样本总集X中各样本的密度指标。记样本Xn所对应的密度指标为Tn,Tn的计算公式如式(3):
式中,N1表示全部样本数目;||||表示计算向量的模值;h1为正整系数;j与n均表示不超过全部样本数目的正整数,Xj为第j个样本。
1.3)计算后得到各样本的密度指标集合为T={T1,T2,...,Tn},取此时集合T中最大值记为最大值所对应的样本作为选取的第一个初始聚类中心/>
1.4)假设已经确定了k-1个初始聚类中心,根据式(5)计算剩余样本密度指标。
式中,hk=1.5hk-1,此处hk的取值是为了规避初始聚类中心的重复选取。k是大于1小于N的正整数,目的是先计算完所有的样本密度指标,选取每次密度指标集合中的最大值进行式(5)的计算。
选取第k次计算所得到的密度指标集合中的最大值记为选取其所对应的样本为第k个初始聚类中心,记为/>
1.5)选取通过上述计算步骤得到的k个初始聚类中心,当满足式(6)时停止。
式中,θ为设置的阈值,已有研究结论显示,当θ≥0.5时,初始聚类中心数较为合理,为第k次计算所得到的密度指标集合中的最大值。
至此,通过上述计算步骤可以最大程度地取得合理的初始聚类中心。传统K-means算法采用随机初始化聚类中心的策略,一定条件下会导致聚类结果陷入局部最优解,从而无法准确的完成聚类。整体步骤1最终得到较为合理的初始聚类中心。
步骤2:选取聚类数K。
2.1)计算聚类后各簇群间的质心直径即为各聚类中心间的距离,计算公式如式(7):
式中,代表第i类和的第j类聚类中心;/>代表第i类和第j类聚类中心的第m个特征。
2.2)计算类内样本间的质心链接,即为类内各样本到该类聚类中心的距离之和的平均值ΔXi,计算公式如式(8):
式中,Ni为第i类总样本个数;为第i类内第n个样本。
2.3)采用DBI评价指标作为选取聚类数K的评判依据,DBI评价指标基于类内空间距离与类间距离之比;通过计算类内样本间的质心链接来度量类内空间距离;计算聚类后各簇群间的质心直径来度量类间距离。DBI评价指标如式(9):
式中,K为聚类数。
根据式(9)可知,DBI指标能够有效反映出在所选取聚类数K下的聚类效果是否合理。具体分析如下:当聚类数K处于较小值时,类间的距离相对较小而类内距离相对较大,此时的DBI值中分母较小、分子较大,故此时DBI值较大;随着聚类数K逐渐上升,DBI值中分母逐渐增大、分子逐渐减小,故DBI值逐渐降低且聚类效果逐渐改善;当DBI评价指标随着K的增加而减小至最小值时,即得到最为合理的聚类数K。在依据DBI评价指标得到的最佳聚类数K下,此时各类的类内距离达到最小值且类间距离达到最大值,聚类效果最优。
步骤3:将加权欧式距离法与相关系数法结合,并通过熵权法将上述二者联系组合,以熵权法组合聚类函数作为改进K-means算法的聚类函数:
3.1)选用加权欧氏距离公式以准确的计算样本总集的各样本间的相似度,假设选择经因子分析得出的前M个空调负荷关键影响因素作为样本的各个特征,则第i日的日特征样本可以表示为Xi={xi,1,xi,2,...,xi,M},在聚类中第k个聚类中心则可以表示为则改进后的加权欧式距离公式如式(10)所示:
式中,Dik代表第i日日特征样本到第k个聚类中心的距离;ωm为经通径分析方法得到的第i日日特征样本中第m个特征的权值,M为经过因子分析后筛选出的空调负荷关键影响因素的数量;xi,m为第i日的第m个日特征样本;为在聚类过程中第m个样本的第k个聚类中心,C为英文Center的缩写,代表聚类中心的含义。其中,日特征样本为关键影响因素。
3.2)通径分析方法通过计算自变量(即日特征向量)与因变量(日节点边际空调负荷向量)之间的通径系数,进而转换得到日特征变量的权值ωm
假设各日特征向量自变量为X1,X2,...,XM,日节点边际空调负荷向量为Y,代表向量Y的共轭矩阵,对其作多元线性回归操作如式(11):
为特征向量自变量XM的共轭矩阵,β0为一个常数值;β1为特征向量自变量X1的系数;β2为特征向量自变量X2的系数;βM为特征向量自变量XM的系数;记Y的标准差为σY,β为向量系数,将Y与/>相减后除以σY,得式(12):
为特征向量自变量XM的标准差;对式(12)进行最小二乘法求解并整理后得到如式(13),该式是由相关系数构成的变式方程组:
式中,rij表示Xi、Xj二者的相关系数;PiY表示Xi、Y二者的偏相关系数,即为自变量Xi与因变量Y之间的直接通径系数;rijPjY表示Xi通过Xj对Y的间接偏相关系数,即为自变量Xi与因变量Y之间的间接通径系数。
由上述计算得到全部日特征变量对于因变量的直接通径系数后,根据式(14)分别计算各个日特征变量的权值ωm
通过加权欧式距离法计算得到两个日特征变量样本间的距离,可以全面的考虑样本中各个特征的影响大小,当计算得到的距离较小时,说明两日的空调负荷关键影响因素较为相似,两日的空调负荷波动规律亦较为相似。
步骤4:筛选最佳相似日,通过加权欧式距离比较待预测日样本的空调负荷向量与某历史日样本的空调负荷向量的相似度,从而在全部历史样本中选取与待预测日的日特征最为相似的历史样本天数。
步骤5:将经过聚类分析筛选后的数据代入LSTM模型的输入层,将采集到的气象数据输入LSTM网络层;经过筛选后的历史数据集,包括气象数据和历史空调负荷数据。其中,所述气象数据为相似日影响因素数据。
如图2所示为LSTM的单元结构图,与传统RNN相比,结构更为复杂,引入遗忘门(Forget Gate)、输入门(Input Gate)、输出门(Output Gate)三个门结构实现。细胞状态ct代表信息传输的通道,通过Sigmoid函数和Tanh函数控制当前输入信息和细胞记忆中信息的选择与丢弃。计算公式如下:
遗忘门ft控制旧信息的遗忘,计算公式为:
ft=σ(Wf·[ht-1,xt]+bf) (15)
输入门it控制输入新信息,计算公式为
it=σ(Wi·[ht-1,xt]+bi) (16)
记忆单元的临时状态可用表示:
输出门ot的计算公式为:
ot=σ(Wo·[ht-1,xt]+bo) (18)
隐藏层ht的计算公式为:
ht=ot·tanh(Ct) (19)
更新记忆单元Ct为:
式中,f为门的激活函数,t时刻的输入向量为xt,σ(t)为Sigmoid函数,Wi、Wf、Wc和Wo为输入门、遗忘门、状态单元以及输出门的输入向量权值矩阵,bi、bf、bc和bo为输入门、遗忘门、状态单元以及输出门的偏置矩阵,tanh为激活函数。各个门控单元计算初始权重及偏置矩阵,获得它们所需输出信息的占比,然后根据调整损失函数得到最优的权重矩阵和偏置矩阵,再获得最终的输出信息占比。
步骤6:将LSTM神经网络进行训练,并采取TSO方法对LSTM神经网络进行优化,使得LSTM的超参数得以优化,从而获取优化TSO-LSTM预测组合模型:
如图3所示为TSO-LSTM的组合模型预测流程:
6.1)初始化TSO参数,包括自由参数、上层界限、下层界限、种群数量、权重系数等,金枪鱼群主要有两种觅食形态,分别为螺旋形觅食和抛物线型合作觅食。假设两种方法选择的概率相等,则两种方法同时进行。首先,假设金枪鱼种群的数量为N,种群在搜索空间内随机初始化,搜索空间的上层界限为u,下层界限为d,利用rand函数创造均匀分布且位于[0,1]之间的随机向量,则金枪鱼种群中第i个个体的初始位置Pt int的计算公式为:
Pi int=d+rand·(u-d),i=1,2,...,N (21)
6.2)搭建LSTM模型,确认超参数寻优区间范围,将参考变量定义为LSTM模型的隐含层神经元数量、学习率以及训练迭代次数。
当金枪鱼群通过形成紧密地螺旋追逐猎物时,群内的每个个体之间会相互交换信息,每条金枪鱼都在前一条鱼的后面,因此可以将前一条鱼的信息与相邻的鱼进行共享,基于上述原理,螺旋觅食策略的数学公式如式(22):
式中,α为代表最佳个体和前一个个体相近程度的常数;Pi ti+1代表第i个个体的第t+1次迭代的位置,Bti是当前离食物位置最近的个体的位置,即最佳个体,w1是控制当前个体向最佳个体移动趋势的权重系数,w2是控制当前个体向前一个个体移动趋势的权重系数计算公式如下:
以上式中,a代表一个用于确定金枪鱼在初始阶段跟随最佳个体和前一个个体的程度的常数,ti代表当前迭代次数,tmax代表最大迭代次数,ρ是均匀分布在0到1之间的随机数。
如果最优个体找不到食物,则盲目跟随最优个体不利于群体觅食,因此考虑在搜索空间设置一个随机坐标作为螺旋搜索的参考点,它的作用是使每一个个体都能在更加广阔的空间范围内进行搜索,使TSO算法具有全局探索能力,具体的数学模型描述如式(22)。
6.3)将超参数代入TSO算法中进行计算并寻找个体最优位置和全局最优位置,更新最优的适应度值,计算公式如式(24)和式(25):TSO算法如其他元启发式算法一样,在早期阶段进行广泛的全局探索,然后逐渐过渡到精确的局部开发。随着迭代次数的增加,TSO算法将螺旋觅食的参考点从随机个体更改为最优个体。综上所述,螺旋觅食策略的最终数学模型如式(26):
当金枪鱼种群以食物作为参照点形成抛物线觅食,具体的数学模型描述如式(27):
式中,Pi t+1代表第i个个体的第t+1次迭代的位置,Bt是当前离食物位置最近的个体的位置,即最佳个体,w1是控制当前个体向最佳个体移动趋势的权重系数,w2是控制当前个体向前一个个体移动趋势的权重系数,TF是一个值为1或-1的随机数。
6.4)判断是否达到最大迭代次数,如果达到最大迭代次数,将得到的最优参数返还给LSTM模型,进行训练和预测,若未达到要求,返回步骤6.1)。TSO是一个寻优算法,对LSTM的超参数进行寻优计算,得出来的最优解为最优参数。
步骤7:一种基于改进K-means算法和TSO-LSTM的空调负荷预测方法与流程,选取均方根误差(RMSE)、平均绝对误差(MAE)、平均相对百分误差(MAPE)和训练所需时间作为参考指标。RMSE、MAE、MAPE的计算公式如下:
式中,fRMSE为RMSE的值;N为预测样本数量;θ为第θ个预测样本;fMAE为MAE的值;fMAPE为MAPE的值;p(θ)代表负荷预测值,o(θ)代表实际负荷值,所预测的结果的RMSE、MAE、MAPE值越小,说明所提出的预测方法效果更好。
本发明提供一种基于改进K-means算法和TSO-LSTM的空调负荷预测方法。本发明采取改进K-means聚类算法的相似日筛选策略,对历史空调负荷数据与关键影响因素数据做聚类分析,寻找与待预测日的负荷波动规律相似度较高历史数据日样本,构建最佳相似日样本集,进而作为组合预测模型的输入数据集进行训练并预测,以进一步在模型预测精度问题上寻优;然后将处理后的数据输入进LSTM模型的输入层,并将输入层所接收到的数据导入LSTM网络层;训练LSTM神经网络,再利用TSO方法优化LSTM神经网络,得到LSTM预测模型;若达到最大迭代次数,则将最优参数赋予LSTM并进行训练,输出预测值,否则继续迭代,直到满足终止条件。本发明在负荷预测的基础上,利用TSO算法全局收敛速度快、寻优能力强的特点,对LSTM神经网络的隐含层神经元数量,学习率和训练次数进行寻优,能更准确的预测负荷值,提高空调负荷预测的精度。
本发明还提供一种空调负荷预测系统,包括:
获取模块,用于获取历史空调负荷数据和历史影响因素数据。
因子分析模块,用于对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数。
K-means聚类模块,用于根据所述初始聚类中心和所述聚类数利用权熵法进行K-means聚类,得到加权欧氏距离和聚类结果。
训练样本集确定模块,用于根据所述加权欧氏距离和所述聚类结果确定训练样本集。
训练模块,用于根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型。
预测模块,用于根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。
作为一种可选地实施方式,所述因子分析模块,具体包括:
计算单元,用于对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,计算所述历史空调负荷数据和所述历史影响因素数据的密度指标。
初始聚类中心确定单元,用于选择所述密度指标中最大密度指标对应的历史空调负荷数据和所述历史影响因素数据作为初始聚类中心。
类内空间距离和类间距离确定单元,用于根据所述初始聚类中心确定类内空间距离和类间距离。
聚类数确定单元,用于根据所述类内空间距离和所述类间距离确定聚类数。
作为一种可选地实施方式,所述加权欧氏距离的表达式为:
其中,Dik代表第i日日特征样本到第k个聚类中心的距离;ωm为经通径分析方法得到的第i日日特征样本中第m个特征的权值,M为经过因子分析后筛选出的空调负荷关键影响因素的数量;xi,m为第i日的第m个日特征样本;为在聚类过程中第m个样本的第k个聚类中心,C为聚类中心。
作为一种可选地实施方式,所述训练模块,具体包括:
训练单元,用于以所述训练样本集中的影响因素训练数据为所述LSTM神经网络的输入,以所述训练样本集中的空调负荷训练数据为所述LSTM神经网络的输出,利用金枪鱼群优化算法对所述LSTM神经网络中的超参数进行寻优计算,直至达到最大迭代次数,选择所述超参数中的最优解对应的LSTM神经网络作为空调负荷预测模型。
本发明还提供一种电子设备,包括:
一个或多个处理器。
存储装置,其上存储有一个或多个程序。
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述中任意一项所述的方法。
本发明还提供一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述中任意一项所述的方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种空调负荷预测方法,其特征在于,包括:
获取历史空调负荷数据和历史影响因素数据;
对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数;
根据所述初始聚类中心和所述聚类数利用权熵法进行K-means聚类,得到加权欧氏距离和聚类结果;
根据所述加权欧氏距离和所述聚类结果确定训练样本集;
根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型;
根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。
2.根据权利要求1所述的空调负荷预测方法,其特征在于,所述对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数,具体包括:
对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,计算所述历史空调负荷数据和所述历史影响因素数据的密度指标;
选择所述密度指标中最大密度指标对应的历史空调负荷数据和所述历史影响因素数据作为初始聚类中心;
根据所述初始聚类中心确定类内空间距离和类间距离;
根据所述类内空间距离和所述类间距离确定聚类数。
3.根据权利要求1所述的空调负荷预测方法,其特征在于,所述加权欧氏距离的表达式为:
其中,Dik代表第i日日特征样本到第k个聚类中心的距离;ωm为经通径分析方法得到的第i日日特征样本中第m个特征的权值,M为经过因子分析后筛选出的空调负荷关键影响因素的数量;xi,m为第i日的第m个日特征样本;为在聚类过程中第m个样本的第k个聚类中心,C为聚类中心。
4.根据权利要求1所述的空调负荷预测方法,其特征在于,所述根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型,具体包括:
以所述训练样本集中的影响因素训练数据为所述LSTM神经网络的输入,以所述训练样本集中的空调负荷训练数据为所述LSTM神经网络的输出,利用金枪鱼群优化算法对所述LSTM神经网络中的超参数进行寻优计算,直至达到最大迭代次数,选择所述超参数中的最优解对应的LSTM神经网络作为空调负荷预测模型。
5.一种空调负荷预测系统,其特征在于,包括:
获取模块,用于获取历史空调负荷数据和历史影响因素数据;
因子分析模块,用于对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,确定初始聚类中心和聚类数;
K-means聚类模块,用于根据所述初始聚类中心和所述聚类数利用权熵法进行K-means聚类,得到加权欧氏距离和聚类结果;
训练样本集确定模块,用于根据所述加权欧氏距离和所述聚类结果确定训练样本集;
训练模块,用于根据所述训练样本集利用金枪鱼群优化算法对LSTM神经网络进行训练,得到空调负荷预测模型;
预测模块,用于根据当前影响因素数据利用所述空调负荷预测模型进行预测,得到空调负荷预测结果。
6.根据权利要求5所述的空调负荷预测系统,其特征在于,所述因子分析模块,具体包括:
计算单元,用于对所述历史空调负荷数据和所述历史影响因素数据利用皮尔森相关系数法进行因子分析,计算所述历史空调负荷数据和所述历史影响因素数据的密度指标;
初始聚类中心确定单元,用于选择所述密度指标中最大密度指标对应的历史空调负荷数据和所述历史影响因素数据作为初始聚类中心;
类内空间距离和类间距离确定单元,用于根据所述初始聚类中心确定类内空间距离和类间距离;
聚类数确定单元,用于根据所述类内空间距离和所述类间距离确定聚类数。
7.根据权利要求5所述的空调负荷预测系统,其特征在于,所述加权欧氏距离的表达式为:
其中,Dik代表第i日日特征样本到第k个聚类中心的距离;ωm为经通径分析方法得到的第i日日特征样本中第m个特征的权值,M为经过因子分析后筛选出的空调负荷关键影响因素的数量;xi,m为第i日的第m个日特征样本;为在聚类过程中第m个样本的第k个聚类中心,C为聚类中心。
8.根据权利要求5所述的空调负荷预测系统,其特征在于,所述训练模块,具体包括:
训练单元,用于以所述训练样本集中的影响因素训练数据为所述LSTM神经网络的输入,以所述训练样本集中的空调负荷训练数据为所述LSTM神经网络的输出,利用金枪鱼群优化算法对所述LSTM神经网络中的超参数进行寻优计算,直至达到最大迭代次数,选择所述超参数中的最优解对应的LSTM神经网络作为空调负荷预测模型。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至4中任意一项所述的方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述的方法。
CN202211552702.1A 2022-12-06 2022-12-06 空调负荷预测方法、系统、电子设备及计算机存储介质 Pending CN116468138A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211552702.1A CN116468138A (zh) 2022-12-06 2022-12-06 空调负荷预测方法、系统、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211552702.1A CN116468138A (zh) 2022-12-06 2022-12-06 空调负荷预测方法、系统、电子设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN116468138A true CN116468138A (zh) 2023-07-21

Family

ID=87183040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211552702.1A Pending CN116468138A (zh) 2022-12-06 2022-12-06 空调负荷预测方法、系统、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN116468138A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116817415A (zh) * 2023-08-28 2023-09-29 国网浙江省电力有限公司宁波供电公司 一种空调负荷管理调节方法、计算设备及存储介质
CN117494866A (zh) * 2023-09-01 2024-02-02 华中科技大学 基于循环神经网络的交通事故严重程度预测方法
CN118014318A (zh) * 2024-04-09 2024-05-10 国网浙江省电力有限公司宁波供电公司 一种基于多能系统的电力能源需求动态管理方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116817415A (zh) * 2023-08-28 2023-09-29 国网浙江省电力有限公司宁波供电公司 一种空调负荷管理调节方法、计算设备及存储介质
CN116817415B (zh) * 2023-08-28 2024-01-12 国网浙江省电力有限公司宁波供电公司 一种空调负荷管理调节方法、计算设备及存储介质
CN117494866A (zh) * 2023-09-01 2024-02-02 华中科技大学 基于循环神经网络的交通事故严重程度预测方法
CN118014318A (zh) * 2024-04-09 2024-05-10 国网浙江省电力有限公司宁波供电公司 一种基于多能系统的电力能源需求动态管理方法及装置

Similar Documents

Publication Publication Date Title
Cai et al. Predicting the energy consumption of residential buildings for regional electricity supply-side and demand-side management
Sun et al. Using Bayesian deep learning to capture uncertainty for residential net load forecasting
CN116468138A (zh) 空调负荷预测方法、系统、电子设备及计算机存储介质
CN110866592B (zh) 模型训练方法、装置、能效预测方法、装置和存储介质
CN111260116A (zh) 一种基于boa-svr和模糊聚类的分时段精细化短期负荷预测方法
CN110348608A (zh) 一种基于模糊聚类算法改进lstm的预测方法
CN113762387B (zh) 一种基于混合模型预测的数据中心站多元负荷预测方法
CN115374995A (zh) 一种分布式光伏、小风电场站功率预测方法
CN112834927A (zh) 锂电池剩余寿命预测方法、系统、设备及介质
CN113869616A (zh) 一种自适应的居民用户负荷预测方法
CN113255900A (zh) 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法
CN115310727B (zh) 一种基于迁移学习的建筑冷热电负荷预测方法及系统
CN115099511A (zh) 基于优化copula的光伏功率概率估计方法及系统
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN115186803A (zh) 一种考虑pue的数据中心算力负荷需求组合预测方法和系统
CN114119273A (zh) 一种园区综合能源系统非侵入式负荷分解方法及系统
CN115600729A (zh) 一种考虑多属性网格电网负荷预测方法
CN113487064A (zh) 基于主成分分析和改进lstm的光伏功率预测方法及系统
CN113836823A (zh) 一种基于负荷分解和优化双向长短期记忆网络的负荷组合预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN115995810A (zh) 一种考虑气象波动自适应匹配的风电功率预测方法及系统
CN110147284A (zh) 基于二维长短期记忆神经网络的超级计算机工作负载预测方法
CN117313795A (zh) 一种基于改进dbo-lstm的智慧楼宇能耗预测方法
CN116911459A (zh) 适应于虚拟电厂的多输入多输出超短期电力负荷预测方法
Yong et al. Short-term building load forecasting based on similar day selection and LSTM network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination