CN110852496A - 一种基于lstm循环神经网络的天然气负荷预测方法 - Google Patents
一种基于lstm循环神经网络的天然气负荷预测方法 Download PDFInfo
- Publication number
- CN110852496A CN110852496A CN201911036346.6A CN201911036346A CN110852496A CN 110852496 A CN110852496 A CN 110852496A CN 201911036346 A CN201911036346 A CN 201911036346A CN 110852496 A CN110852496 A CN 110852496A
- Authority
- CN
- China
- Prior art keywords
- data
- neural network
- recurrent neural
- prediction
- lstm recurrent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明涉及一种基于LSTM循环神经网络的天然气负荷预测方法,涉及短期负荷预测技术领域。本发明包括利用python进行数据采集、整合、预处理和特征子集选择,对训练集数据利用进行LSTM循环神经网络训练,根据验证集的预测效果对模型中各别预测误差较大的数据提出修正方式,最后利用LSTM循环神经网络进行负荷预测。本发明的方法可以对天然气市场提供有力参考。并且本发明针对特征子集的特征筛选使用了三种算法,因此预测结果更加精确。
Description
技术领域
本发明涉及短期负荷预测技术领域,尤其是涉及一种基于LSTM循环神经网络的天然气负荷预测方法。
背景技术
燃气负荷预测是提供城市燃气规划、设计的基础依据,是确定工程系统配置规模大小、设备选型、计算项目经济性和确定建设资金的依据;科学、准确地预测负荷,可实现科学、经济、合理地规划设计。生产运行中各时段的负荷预测,可提供气源生产计划,是实现管网检修计划、输配调度的基础。准确及时的负荷预测,可优化输配调度,提高运行效率,节约能源,降低成本。燃气负荷的准确预测是实现科学调度、精细调度不可缺少的工具,对城市输配系统运行的经济性和可靠性具有重要意义。准确的燃气负荷预测对燃气市场开发投资者的经营管理和利润分配提供参考,为财务计划进度的控制提供参考,准确预测市场价值,决定其投资效益的风险程度,可降低经营成本。
学者对负荷预测方面已有一段时间的研究,新方法也不断涌现。目前常见预测方法主要包括传统数学方法和机器学习方法。传统数学方法结合概率论和统计学等学科对数据进行方程拟合,方程形式有着明确的意义。近年来新兴的机器学习结合影响负荷的外在因素,通过对大量的数据进行数学处理,来进行高精度的预测。
负荷预测领域成果最为显著的可以说是电力行业。但由于天然气和电在物化状态以及生产和使用规律上有着明显的差异,将电力预测方法直接迁移至天然气负荷的预测上是不合理的,因此十分有必要研究适合天然气本身特点的负荷预测方法。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于LSTM循环神经网络的天然气负荷预测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于LSTM循环神经网络的天然气负荷预测方法,该方法包括以下步骤:
步骤1:在互联网上采集与燃气负荷预测相关的信息,并与燃气用量资料相整合,得到历史数据;
步骤2:对所有历史数据进行预处理;
步骤3:通过特征子集选择针对经过预处理的历史数据进行特征筛选,得到作为预测中使用的特征;
步骤4:构建LSTM循环神经网络模型并利用预测中使用的特征的训练集对其进行训练;
步骤5:利用预测中使用的特征的验证集修正优化LSTM循环神经网络模型,得到最终训练完毕的LSTM循环神经网络模型;
步骤6:将待预测日的特征输入值训练完毕的LSTM循环神经网络模型中得到待预测日的燃气负荷预测值。
进一步地,所述的步骤1中的与燃气负荷预测相关的信息包括天气温度、气象条件、风速和节日情况。
进一步地,所述的步骤1中的燃气用量资料包括用气量和各类用户数量。
进一步地,所述的步骤2中的预处理包括属性构造、数据清洗、数据变换。
进一步地,所述的数据清洗具体包括:删除原始数据集中的无关数据、重复数据和平滑噪声数据,并筛选掉与挖掘无关的数据,处理缺失值和异常值。
进一步地,所述的数据变换具体包括:对原始数据集进行规范化处理,即将数据转换成设定的格式。
进一步地,所述的步骤1具体包括通过python在互联网上采集与燃气负荷预测相关的信息,并与燃气用量资料相整合,得到历史数据。
进一步地,所述的步骤3包括以下分步骤:
步骤31:通过最佳子集选择算法、最小角度回归算法和glmnet算法分别针对经过预处理的历史数据选择得到最佳子集;
步骤32:根据三种算法得到的结果确定最终作为预测中使用的特征。
与现有技术相比,本发明具有以下优点:
(1)本发明包括利用python进行数据采集、整合、预处理和特征子集选择,对训练集数据利用进行LSTM循环神经网络训练,根据验证集的预测效果对模型中各别预测误差较大的数据提出修正方式,最后利用LSTM循环神经网络进行负荷预测,预测速度快;
(2)本发明在互联网上采集与燃气负荷预测相关的信息,并与燃气用量资料相整合,得到历史数据,考虑了天然气市场的各个相关的关键数据,因此预测结果更加准确;
(3)本发明方法的步骤3中通过最佳子集选择算法针对经过预处理的历史数据选择得到最佳子集,通过最小角度回归算法和glmnet算法针对经过预处理的历史数据进行子集选取,综合利用了三种算法对经过预处理的历史数据进行特征筛选,因此筛选出的特征更具有代表性,并拥有更好的精确度。
附图说明
图1为本发明的方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
如图1所示为本发明的方法流程示意图,具体过程如下:
通过python在互联网上采集与燃气负荷预测相关的信息(天气温度、气象条件、风速、节日情况等),并与燃气用量资料(包括用气量、各类用户数量等)整合在一起。
对所有历史数据进行预处理,包括属性构造、数据清洗和数据变换。有些特征属于类别变量,有序的类别型变量之间可以相互比较但不能进行运算,无序的类别型变量之间不可相互比较和不能运算。因此,类别型变量不能直接使用,需要将其转换为定量变量。数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘无关的数据,处理缺失值、异常值等。缺失值和异常值采用数据插补的方法进行填充和替代。数据变换主要是对数据进行规范化处理,将数据转换成适当的形式,以适用于挖掘任务及算法的需要。不同评价指标往往具有不同的量纲,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。
由于某些特征对目标值的预测贡献较小,甚至没有用处,因此需要通过特征子集选择来筛选对目标值预测贡献度大的特征作为预测中使用的特征,以提高预测精确度和预测效率。最佳子集选择算法在列的个数上增加一个约束,然后从样本的所有列中抽取特征个数的列构成数据集,在上面执行算法,遍历所有列的组合,找到验证集上取得最佳效果的子集,增加特征数量,重复上述过程。以上过程产生最佳的一系列子集,包括一列子集、两列子集.....所有列子集,对每个子集同样有一个性能与之对应,之后通过每个子集对应的错误率选择最佳子集。再利用最小角度回归算法(LARS算法)和glmnet算法进行子集选取,根据三种方法得到的结果进行分析后确定最终使用的特征子集。
进行系统建模,根据训练样本维数确定LSTM循环神经网络输入节点数,并根据以往经验确定LSTM循环神经网络的时间步长,构建LSTM循环神经网络,然后对LSTM循环神经网络进行初始化。
对LSTM循环神经网络进行训练,在训练过程中不断利用前一次训练的误差对系统参数进行修正,直到达到最大迭代次数。迭代次数越多,训练集的精确度会越高,但容易造成过拟合的情况,导致模型在非训练集上的效果并不好,因此需要合理确定迭代次数。
部分日期的燃气用量会与预测值出现明显偏差,并且在每年的同一类型日期均有相同情况出现,如春节等重大节日。对这些日期进行修正,以前一年该类型日期负荷预测值与实际用气量的误差作为修正指标,得到当年该日的最终预测值。
对待预测日的燃气负荷进行预测,将待预测日的特征输入训练好的LSTM循环神经网络即可获得待预测日的燃气负荷预测值。
实际实施例:
通过python从互联网采集某市近三年的气象资料和日期信息,并与该市近三年每日的用气情况进行整合,获得预测初始数据集。将气象条件等类别型变量转换为定量变量,并进行数据清洗,利用数据插补处理缺失值和异常值,通过归一化对数据进行规范化处理。通过最小角度回归算法(LARS算法)、glmnet算法和枚举特征子集的方法进行特征筛选,得到对目标值的预测贡献较大的特征包括日期类型、日平均气温和各类用户数量,确定最终使用的特征子集。进行系统建模,选取LSTM循环神经网络的时间步长为7,迭代次数为1000,对LSTM循环神经网络进行初始化。训练LSTM循环神经网络,计算特殊日期的修正系数,并对待预测日的燃气负荷进行预测,得到预测精度为0.024,符合市场所需要的最大0.05的预测误差要求。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,该方法包括以下步骤:
步骤1:在互联网上采集与燃气负荷预测相关的信息,并与燃气用量资料相整合,得到历史数据;
步骤2:对所有历史数据进行预处理;
步骤3:通过特征子集选择针对经过预处理的历史数据进行特征筛选,得到作为预测中使用的特征;
步骤4:构建LSTM循环神经网络模型并利用预测中使用的特征的训练集对其进行训练;
步骤5:利用预测中使用的特征的验证集修正优化LSTM循环神经网络模型,得到最终训练完毕的LSTM循环神经网络模型;
步骤6:将待预测日的特征输入值训练完毕的LSTM循环神经网络模型中得到待预测日的燃气负荷预测值。
2.根据权利要求1所述的一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,所述的步骤1中的与燃气负荷预测相关的信息包括天气温度、气象条件、风速和节日情况。
3.根据权利要求1所述的一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,所述的步骤1中的燃气用量资料包括用气量和各类用户数量。
4.根据权利要求1所述的一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,所述的步骤2中的预处理包括属性构造、数据清洗、数据变换。
5.根据权利要求4所述的一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,所述的数据清洗具体包括:删除原始数据集中的无关数据、重复数据和平滑噪声数据,并筛选掉与挖掘无关的数据,处理缺失值和异常值。
6.根据权利要求4所述的一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,所述的数据变换具体包括:对原始数据集进行规范化处理,即将数据转换成设定的格式。
7.根据权利要求1所述的一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,所述的步骤1具体包括通过python在互联网上采集与燃气负荷预测相关的信息,并与燃气用量资料相整合,得到历史数据。
8.根据权利要求1所述的一种基于LSTM循环神经网络的天然气负荷预测方法,其特征在于,所述的步骤3包括以下分步骤:
步骤31:通过最佳子集选择算法、最小角度回归算法和glmnet算法分别针对经过预处理的历史数据选择得到最佳子集;
步骤32:根据三种算法得到的结果确定最终作为预测中使用的特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911036346.6A CN110852496A (zh) | 2019-10-29 | 2019-10-29 | 一种基于lstm循环神经网络的天然气负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911036346.6A CN110852496A (zh) | 2019-10-29 | 2019-10-29 | 一种基于lstm循环神经网络的天然气负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110852496A true CN110852496A (zh) | 2020-02-28 |
Family
ID=69598204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911036346.6A Pending CN110852496A (zh) | 2019-10-29 | 2019-10-29 | 一种基于lstm循环神经网络的天然气负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110852496A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733307A (zh) * | 2021-01-12 | 2021-04-30 | 北京市燃气集团有限责任公司 | 一种供暖季城市天然气负荷预测方法及装置 |
CN114881343A (zh) * | 2022-05-18 | 2022-08-09 | 清华大学 | 基于特征选择的电力系统短期负荷预测方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073785A (zh) * | 2010-11-26 | 2011-05-25 | 哈尔滨工程大学 | 基于广义动态模糊神经网络的燃气日负荷组合预报方法 |
CN102495937A (zh) * | 2011-10-18 | 2012-06-13 | 南京信息工程大学 | 一种基于时间序列的预测方法 |
CN104123591A (zh) * | 2014-07-14 | 2014-10-29 | 上海师范大学 | 基于智能网格分类和模糊神经网络的天然气负荷预测方法 |
CN109214607A (zh) * | 2018-11-13 | 2019-01-15 | 中石化石油工程技术服务有限公司 | 基于小波理论和神经网络的短期天然气负荷预测模型 |
CN110110930A (zh) * | 2019-05-08 | 2019-08-09 | 西南交通大学 | 一种改进鲸鱼算法的循环神经网络短期电力负荷预测方法 |
CN110210993A (zh) * | 2019-05-22 | 2019-09-06 | 重庆大学 | 基于循环神经网络模型的城市短期燃气负荷预测方法 |
-
2019
- 2019-10-29 CN CN201911036346.6A patent/CN110852496A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073785A (zh) * | 2010-11-26 | 2011-05-25 | 哈尔滨工程大学 | 基于广义动态模糊神经网络的燃气日负荷组合预报方法 |
CN102495937A (zh) * | 2011-10-18 | 2012-06-13 | 南京信息工程大学 | 一种基于时间序列的预测方法 |
CN104123591A (zh) * | 2014-07-14 | 2014-10-29 | 上海师范大学 | 基于智能网格分类和模糊神经网络的天然气负荷预测方法 |
CN109214607A (zh) * | 2018-11-13 | 2019-01-15 | 中石化石油工程技术服务有限公司 | 基于小波理论和神经网络的短期天然气负荷预测模型 |
CN110110930A (zh) * | 2019-05-08 | 2019-08-09 | 西南交通大学 | 一种改进鲸鱼算法的循环神经网络短期电力负荷预测方法 |
CN110210993A (zh) * | 2019-05-22 | 2019-09-06 | 重庆大学 | 基于循环神经网络模型的城市短期燃气负荷预测方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733307A (zh) * | 2021-01-12 | 2021-04-30 | 北京市燃气集团有限责任公司 | 一种供暖季城市天然气负荷预测方法及装置 |
CN114881343A (zh) * | 2022-05-18 | 2022-08-09 | 清华大学 | 基于特征选择的电力系统短期负荷预测方法及装置 |
CN114881343B (zh) * | 2022-05-18 | 2023-11-14 | 清华大学 | 基于特征选择的电力系统短期负荷预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106779223B (zh) | 一种光伏系统发电功率实时预测方法及装置 | |
CN105069525B (zh) | 全天候96点日负荷曲线预测及优化修正系统 | |
CN101826090A (zh) | 基于最优模型的web舆情趋势预测方法 | |
CN117236199B (zh) | 城市水网区域河湖水质提升与水安全保障方法及系统 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN113298288A (zh) | 一种融合时间序列和神经网络的供电所运维成本预测方法 | |
CN114792156A (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
CN114742302A (zh) | 基于lstm多变量时序预测的节假日生活垃圾产量反演方法 | |
CN114862032B (zh) | 一种基于XGBoost-LSTM的电网负荷预测方法及装置 | |
CN110852496A (zh) | 一种基于lstm循环神经网络的天然气负荷预测方法 | |
CN115965110A (zh) | 面向产业园区的企业用能画像及碳排放精准测算方法 | |
CN114035468A (zh) | 基于XGBoost算法的风机检修流程预测性监控方法与系统 | |
CN115222106A (zh) | 一种自适应模型的用户日前负荷预测方法 | |
CN114595861A (zh) | 基于mstl和lstm模型的中长期电力负荷预测方法 | |
CN111199298A (zh) | 基于神经网络的洪水预报方法与系统 | |
CN114692981A (zh) | 基于Seq2Seq模型的中长期径流预报方法和系统 | |
CN114626640A (zh) | 基于特征工程和lstm神经网络的天然气负荷预测方法及系统 | |
Cui et al. | Deep learning methods for atmospheric PM2. 5 prediction: A comparative study of transformer and CNN-LSTM-attention | |
CN114154716A (zh) | 一种基于图神经网络的企业能耗预测方法及装置 | |
CN117010942B (zh) | 基于神经网络和线性模型的农产品销售预测方法和系统 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN116703644A (zh) | 一种基于Attention-RNN的短期电力负荷预测方法 | |
CN115860797A (zh) | 一种适应新电价改革形势的电量需求预测方法 | |
CN114997462A (zh) | 一种基于机器学习的电网线路工程造价预测方法 | |
Chuentawat et al. | The forecast of PM10 pollutant by using a hybrid model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |