CN112733307B - 一种供暖季城市天然气负荷预测方法及装置 - Google Patents
一种供暖季城市天然气负荷预测方法及装置 Download PDFInfo
- Publication number
- CN112733307B CN112733307B CN202110037746.XA CN202110037746A CN112733307B CN 112733307 B CN112733307 B CN 112733307B CN 202110037746 A CN202110037746 A CN 202110037746A CN 112733307 B CN112733307 B CN 112733307B
- Authority
- CN
- China
- Prior art keywords
- natural gas
- vector
- predicted value
- temperature
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 title claims abstract description 576
- 239000003345 natural gas Substances 0.000 title claims abstract description 288
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000010438 heat treatment Methods 0.000 title claims description 88
- 239000013598 vector Substances 0.000 claims abstract description 323
- 239000007789 gas Substances 0.000 claims abstract description 175
- 238000003062 neural network model Methods 0.000 claims abstract description 35
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 29
- 230000000306 recurrent effect Effects 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims abstract description 17
- 238000003860 storage Methods 0.000 claims description 38
- 230000002159 abnormal effect Effects 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 21
- 230000007246 mechanism Effects 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 16
- 230000001174 ascending effect Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 30
- 230000008569 process Effects 0.000 abstract description 14
- 238000004519 manufacturing process Methods 0.000 abstract description 8
- 230000002354 daily effect Effects 0.000 description 29
- 238000004364 calculation method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010030 laminating Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/18—Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/08—Fluids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/14—Pipes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Medical Informatics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
Abstract
本申请公开了一种供暖季城市天然气负荷预测方法及装置,该方法获取城市天然气负荷用气原始数据并进行特征提取得到特征向量,将特征向量输入至预设循环神经网络模型得到第一预测值,根据特征向量中的每日历史温度特征向量确定多组温度向量组,根据多组温度向量组确定第二预测值,对第一预测值和第二预测值进行整合得到城市天然气负荷用气预测值。由于是基于实际天然气负荷用气数据进行预测,使得预测过程与实际业务应用场景相结合,且通过对温度变化敏感的预设循环神经网络模型进行预测得到第一预测值,通过多组温度向量组确定第二预测值可适应温度特征变化,达到精确的对城市天然气负荷值进行预测的目的,可以对真实生产环境进行有效的指导。
Description
技术领域
本申请涉及天然气负荷预测技术领域,尤其涉及一种供暖季城市天然气负荷预测方法及装置。
背景技术
在北方城市的天然气负荷预测中,供暖季期间的负荷预测显得尤为重要,主要是由于城市冬季供暖导致的用气量激增给负荷预测带来了极大的挑战。
目前,关于城市天然气负荷预测技术的方法种类较多,负荷预测方法不仅有多元线性回归分析、时间序列法、最小二乘法、灰色模型等传统预测方法,也有基于人工智能的支持向量机、神经网络等机器学习算法。然而这些天然气负荷预测方式仅仅是停留在学术层面进行分析,并没有深入到实际的业务场景应用中,无法精确的对城市天然气负荷值进行预测,导致无法对真实生产环境进行有效的指导。
发明内容
本申请提供一种供暖季城市天然气负荷预测方法及装置,达到精确的对城市天然气负荷值进行预测的目的,可以对真实生产环境进行有效的指导。
第一方面,本申请提供了一种供暖季城市天然气负荷预测方法,包括:
获取城市天然气负荷用气原始数据;
对所述城市天然气负荷用气原始数据进行特征提取,得到特征向量;
将所述特征向量输入至预设循环神经网络模型得到第一预测值,其中,所述预设循环神经网络模型包括门控循环单元GRU隐藏层和注意力机制Attention层;
根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值;
对所述第一预测值和所述第二预测值进行整合,得到城市天然气负荷用气预测值。
可选的,所述城市天然气负荷用气原始数据包括气量数据、气象数据、供暖季数据和节假日数据。
可选的,所述对所述城市天然气负荷用气原始数据进行特征提取,得到特征向量的步骤,包括:
对所述城市天然气负荷用气原始数据进行预处理,得到预处理后数据;
根据所述预处理后数据计算得到管道内天然气的管存变化量,计算所述管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量;
从所述预处理后数据中提取温度特征向量和天气类型特征向量,建立所述天气类型特征向量与影响程度之间的对应关系,其中,所述影响程度为天气类型特征向量对城市天然气负荷的影响程度;
从所述预处理后数据中提取供暖日期类型特征向量,建立所述供暖日期类型特征向量与天然气用气量级别之间的对应关系;
从所述预处理后数据中提取日期类型特征向量,建立所述日期类型特征向量与天然气用气量级别之间的对应关系。
可选的,所述对所述城市天然气负荷用气原始数据进行预处理,得到预处理后数据的步骤,包括:
对所述城市天然气负荷用气原始数据进行缺失值填充得到填充后的城市天然气负荷用气数据;
对填充后的城市天然气负荷用气数据进行异常值检测,将检测到的异常值替换为非异常值;
对替换后的城市天然气负荷用气数据进行归一化处理,得到预处理后数据。
可选的,所述根据所述预处理后数据计算得到管道内天然气的管存变化量,计算所述管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量的步骤,包括:
根据预处理后数据中的当日管道内天然气的管道压力值与昨日管道内天然气的管道压力值计算得到昨日管道内天然气的管存变化量,计算所述昨日管道内天然气的管存变化量与昨日非管道内的天然气用量之和作为昨日城市天然气使用量特征向量。
可选的,所述预设循环神经网络模型还包括输入层、全连接层和输出层,所述将所述特征向量输入至预设循环神经网络模型得到第一预测值的步骤,包括:
将所述特征向量通过所述输入层输入至所述GRU隐藏层得到所述特征向量中的重要特征向量;
将所述重要特征向量输入至所述Attention层进行计算得到权重向量,将所述权重向量与所述处理后向量合并得到新向量;
将所述新向量输入至所述全连接层计算得到第一预测值并通过所述输出层输出所述第一预测值。
可选的,所述根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值的步骤,包括:
按照预设时间步长将所述特征向量中的每日历史温度特征向量分为多个温度向量组;
计算待预测日向量组与每组温度向量组之间的距离,并按照升序规则对计算得到的距离进行排序,选择前预设位数个距离对应的温度向量组;
计算所述待预测日向量组与所选择的每组温度向量组之间的相似度,对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,将所述气量预测值至作为所述第二预测值。
可选的,所述对相似度最大的温度向量组对应的气量进行缩放得到气量预测值的步骤,包括:
根据相似度最大的温度向量组对应的气量、所述待预测日温度向量组对应的气量以及同比系数公式进行计算得到气量预测值。
第二方面,本申请提供了一种供暖季城市天然气负荷预测装置,所述装置包括:
获取模块,用于获取城市天然气负荷用气原始数据;
特征提取模块,用于对所述城市天然气负荷用气原始数据进行特征提取,得到特征向量;
第一预测值确定模块,用于将所述特征向量输入至预设循环神经网络模型得到第一预测值,其中,所述预设循环神经网络模型包括门控循环单元GRU隐藏层和注意力机制Attention层;
第二预测值确定模块,用于根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值;
整合模块,用于对所述第一预测值和所述第二预测值进行整合,得到城市天然气负荷用气预测值。
可选的,所述城市天然气负荷用气原始数据包括气量数据、气象数据、供暖季数据和节假日数据。
可选的,所述特征提取模块,包括:
预处理单元,用于对所述城市天然气负荷用气原始数据进行预处理,得到预处理后数据;
城市天然气使用量特征向量确定单元,用于根据所述预处理后数据计算得到管道内天然气的管存变化量,计算所述管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量;
第一对应关系建立单元,用于从所述预处理后数据中提取温度特征向量和天气类型特征向量,建立所述天气类型特征向量与影响程度之间的对应关系,其中,所述影响程度为天气类型特征向量对城市天然气负荷的影响程度;
第二对应关系建立单元,用于从所述预处理后数据中提取供暖日期类型特征向量,建立所述供暖日期类型特征向量与天然气用气量级别之间的对应关系;
第三对应关系建立单元,用于从所述预处理后数据中提取日期类型特征向量,建立所述日期类型特征向量与天然气用气量级别之间的对应关系。
可选的,所述预处理单元,包括:
缺失值填充子单元,用于对所述城市天然气负荷用气原始数据进行缺失值填充得到填充后的城市天然气负荷用气数据;
检测子单元,用于对填充后的城市天然气负荷用气数据进行异常值检测,将检测到的异常值替换为非异常值;
归一化处理子单元,用于对替换后的城市天然气负荷用气数据进行归一化处理,得到预处理后数据。
可选的,所述城市天然气使用量特征向量确定单元,具体用于:
根据预处理后数据中的当日管道内天然气的管道压力值与昨日管道内天然气的管道压力值计算得到昨日管道内天然气的管存变化量,计算所述昨日管道内天然气的管存变化量与昨日非管道内的天然气用量之和作为昨日城市天然气使用量特征向量。
可选的,所述预设循环神经网络模型还包括输入层、全连接层和输出层,所述第一预测值确定模块,包括:
重要特征向量确定单元,用于将所述特征向量通过所述输入层输入至所述GRU隐藏层得到所述特征向量中的重要特征向量;
新向量确定单元,用于将所述重要特征向量输入至所述Attention层进行计算得到权重向量,将所述权重向量与所述处理后向量合并得到新向量;
输出单元,用于将所述新向量输入至所述全连接层计算得到第一预测值并通过所述输出层输出所述第一预测值。
可选的,所述第二预测值确定模块,包括:
划分单元,用于按照预设时间步长将所述特征向量中的每日历史温度特征向量分为多个温度向量组;
距离计算单元,用于计算待预测日向量组与每组温度向量组之间的距离,并按照升序规则对计算得到的距离进行排序,选择前预设位数个距离对应的温度向量组;
相似度计算单元,用于计算所述待预测日向量组与所选择的每组温度向量组之间的相似度,对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,将所述气量预测值至作为所述第二预测值。
可选的,所述相似度计算单元,具体用于:
根据相似度最大的温度向量组对应的气量、所述待预测日温度向量组对应的气量以及同比系数公式进行计算得到气量预测值。
第三方面,本申请提供了一种可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如第一方面中任一所述的方法。
第四方面,本申请提供了一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如第一方面中任一所述的方法。
由上述技术方案可以看出,本申请提供了一种供暖季城市天然气负荷预测方法,在本方法中,可以获取城市天然气负荷用气原始数据,对城市天然气负荷用气原始数据进行特征提取,得到特征向量,将特征向量输入至预设循环神经网络模型得到第一预测值,其中,预设循环神经网络模型包括门控循环单元GRU隐藏层、注意力机制Attention层,根据特征向量中的每日历史温度特征向量确定多组温度向量组,根据多组温度向量组确定第二预测值,对第一预测值和第二预测值进行整合,得到城市天然气负荷用气预测值。由于在本申请中是基于城市天然气负荷用气原始数据也就是实际天然气负荷用气数据进行预测,使得预测过程与实际业务应用场景相结合,可以深入到实际的业务场景应用中,并且通过对温度变化敏感的预设循环神经网络模型进行预测得到第一预测值,通过多组温度向量组确定第二预测值可以适应温度特征变化,达到精确的对城市天然气负荷值进行预测的目的,可以对真实生产环境进行有效的指导。
上述的非惯用的优选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
为了更清楚地说明本申请实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中的一种供暖季城市天然气负荷预测方法的流程示意图;
图2为城市天然气用气负荷与温度的相关性示意图;
图3为春节期间城市天然气用气负荷变化趋势示意图;
图4为RNN的网络结构示意图;
图5为GRU的单元结构示意图;
图6为Attention机制的结构示意图;
图7为Attention-GRU模型的结构示意图;
图8为本发明实施例提供的相似系数预测算法的结构示意图;
图9为本申请实施例提供的一种城市天然气负荷预测流程图;
图10为本申请实施例中的一种供暖季城市天然气负荷预测装置的结构示意图;
图11为本申请一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本申请的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决现有技术中,天然气负荷预测方式仅仅是停留在学术层面进行分析,并没有深入到实际的业务场景应用中,无法精确的对城市天然气负荷值进行预测,导致无法对真实生产环境进行有效的指导的问题。
本申请提供了一种供暖季城市天然气负荷预测方法,在本方法中,可以获取城市天然气负荷用气原始数据,对城市天然气负荷用气原始数据进行特征提取,得到特征向量,将特征向量输入至预设循环神经网络模型得到第一预测值,其中,预设循环神经网络模型包括门控循环单元GRU隐藏层、注意力机制Attention层,根据特征向量中的每日历史温度特征向量确定多组温度向量组,根据多组温度向量组确定第二预测值,对第一预测值和第二预测值进行整合,得到城市天然气负荷用气预测值。由于在本申请中是基于城市天然气负荷用气原始数据也就是实际天然气负荷用气数据进行预测,使得预测过程与实际业务应用场景相结合,可以深入到实际的业务场景应用中,并且通过对温度变化敏感的预设循环神经网络模型进行预测得到第一预测值,通过多组温度向量组确定第二预测值可以适应温度特征变化,达到精确的对城市天然气负荷值进行预测的目的,可以对真实生产环境进行有效的指导。
下面结合附图,详细说明本申请的各种非限制性实施方式。
参见图1,示出了本申请实施例中的一种供暖季城市天然气负荷预测方法的流程示意图。在本实施例中,所述方法应用于电子设备,所述方法例如可以包括以下步骤:
S101:获取城市天然气负荷用气原始数据。
为了使天然气负荷预测方式不仅仅是停留在学术层面进行分析,电子设别需要获取实际天然气负荷用气数据也就是城市天然气负荷用气原始数据。电子设备可以从燃气集团得到实际天然气负荷用气数据。城市天然气负荷用气原始数据为与燃气相关的实际使用数据。
示例性的,城市天然气负荷用气原始数据包括气量数据、气象数据、供暖季数据和节假日数据。
S102:对城市天然气负荷用气原始数据进行特征提取,得到特征向量。
特征工程是对城市天然气负荷勇气原始数据进行一系列处理,结合业务实际情况将其提炼为特征向量,供后续的算法和模型使用。
进行特征工程的过程,就是将数据属性转换为数据特征的过程。数据属性代表了数据的所有维度,在数据建模时,如果对数据的所有属性进行学习,并不能很好的找到数据的潜在趋势,从而导致模型效果较差。因为,为了提升建模效果,需要特征工程贴合实际,使得模型在训练时能够减少受到噪声的干扰,能够更好的找出趋势。
本发明实施例基于城市天然气负荷用气原始数据,在现有特征工程构建的基础上,结合管压还原、气象特征、供暖季特征以及节假日特征,构建了针对供暖季天然气负荷预测的特征工程,并采用此特征工程对城市天然气负荷用气原始数据进行特征提取,得到特征向量。
其中,步骤S102可以包括:
对城市天然气负荷用气原始数据进行预处理,得到预处理后数据;
根据预处理后数据计算得到管道内天然气的管存变化量,计算管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量;
从预处理后数据中提取温度特征向量和天气类型特征向量,建立天气类型特征向量与影响程度之间的对应关系,其中,影响程度为天气类型特征向量对城市天然气负荷的影响程度;
从预处理后数据中提取供暖季日期类型特征向量,建立供暖季日期类型特征向量与天然气用气量级别之间的对应关系;
从预处理后数据中提取日期类型特征向量,建立日期类型特征向量与天然气用气量级别之间的对应关系。
本发明实施例构建的针对供暖季天然气负荷预测的特征工程包括数据预处理、管压还原方法、气象特征处理、供暖季标识特征处理和节假日特征处理几个部分,下面对各个部分进行详细介绍:
一、数据预处理
针对城市天然气负荷用气原始数据进行预处理,得到处理后数据。具体的,可以结合现有特征工程对城市天然气负荷用气原始数据进行缺失值填充与异常值检测。
上述对城市天然气负荷用气原始数据进行预处理,得到预处理后数据,可以包括:
对城市天然气负荷用气原始数据进行缺失值填充得到填充后的城市天然气负荷用气数据;
对填充后的城市天然气负荷用气数据进行异常值检测,将检测到的异常值替换为非异常值;
将替换后的城市天然气负荷用气数据进行归一化处理,得到预处理后数据。
实际上,城市天然气负荷用气原始数据的数据量可能是相对较少的,故而每一条原始数据都不应该轻易舍弃,并且城市天然气负荷用气原始数据中会存在由于各种原因造成的缺失值,因此,需要对城市天然气负荷用气原始数据进行缺失值填充得到填充后的城市天然气负荷用气数据。其中,填充后的城市天然气负荷用气数据包括两部分:填充的缺失值以及城市天然气负荷用气原始数据。
其中,对城市天然气负荷用气原始数据进行缺失值填充得到填充后的城市天然气负荷用气数据的方式可以为基于城市天然气负荷用气原始数据实际情况,针对缺失值采用手动补全,电子设备接收操作人员所补全的缺失值,将接收到的缺失值与城市天然气负荷用气原始数据作为填充后的城市天然气负荷用气数据。
至于手动如何补全缺失值可以由操作人员深入业务部门,与业务部门人员通过台账检索、多系统核查和会商的方式来确定如何补全缺失值。
由于填充后的城市天然气负荷用气数据可能存在异常的值,因此,需要对填充后的城市天然气负荷用气数据进行异常值检测,将检测到的异常值替换为非异常值。
示例性的,可以对于填充后的城市天然气负荷用气数据采用箱型图法即上下四分位数方式进行异常值检测,并将检测到的异常值替换为非异常值,将异常值替换为非异常值的方式可以为与填充缺失值的方式相同。
由于城市天然气负荷用气数据的数据量级可达到千万级别,与温度特征数据量级差别较大,因此,为了降低后续数据本身对模型带来的噪声干扰,需要对替换后的城市天然气负荷用气数据进行归一化处理,得到预处理后数据。
其中,归一化是将数据都缩放到一个指定的大致相同的数值区间内。对替换后的城市天然气负荷用气数据进行归一化处理,使得得到的预处理后数据中的用气量数据与温度特征向量处于同一纬度下,降低数据本身对模型带来的噪声干扰。
二、管压还原方法
实际中,管道中也存在部分天然气,以往的预测方法往往忽略了管道中的天然气。但对于大城市而言,管网中的管道的天然气存量较大,对于城市天然气的真实用量的分析影响较重。
传统的管道存量计算方法是计算管网长度与管道底面积的乘积,在实际情况中,管网铺设错综复杂,采用传统方法不易估算其每日存量。
针对此情况,本发明实施例提出了管压还原方法,利用管道压力的变化来精确表征管存变化量,具体的,根据预处理后数据计算得到管道内天然气的管存变化量,计算管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量。
由于管道内的天然气每天都会发生变化,因此,需要以日为单位来计算管存变化量,将管道压力值的变化所带来的气量变化还原到城市实际天然气使用数据中。
示例性的,上述根据预处理后数据计算得到管道内天然气的管存变化量,计算管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量,可以包括:
根据预处理后数据中的当日管道内天然气的管道压力值与昨日管道内天然气的管道压力值计算得到昨日管道内天然气的管存变化量,计算昨日管道内天然气的管存变化量与昨日非管道内的天然气用量之和作为昨日城市天然气使用量特征向量。
其中,当日管道内天然气的管道压力值与昨日管道内天然气的管道压力值可以为同一时间点的管道压力值,举例而言,当日八点管道内天然气的管道压力值与昨日八点管道内天然气的管道压力值。
管道压力值数据来源于各个门站,由于每个门站的规模大小均不统一,故而不能将各门站的压力值直接累加平均。本发明实施例中采用更加合理的加权平均法来还原管网真实压力变化值,即通过各门站昨日用气量估算该门站的压力值所占权重,进而得出管网真实压力变化值,计算公式如下:
其中,P为管网压力变化值,P1为门站1今日预设时间点管道压力值,P1z为门站1昨日预设时间点管道压力值,f1为门站1所占权重,Pm为门站m今日预设时间点管道压力值,Pmz为门站m昨日预设时间点管道压力值,fm为门站m所占权重,m为门站总数量。
基于管网压力变化值,可以进一步求出昨日管道内天然气的管存变化量,计算公式如下:
A=nR2LP
其中,A为昨日管道内天然气的管存变化量,单位为m3,π为圆周率,R为管网半径,单位为m,L为管网长度,单位为m,P为管网压力变化值。
然后,将计算得到的昨日管道内天然气的管存变化量与昨日非管道内的天然气用量之和作为昨日城市天然气使用量特征向量。
三、气象特征处理
城市天然气用气负荷受当地气象因素、消费水平、居民生活习惯、节假日和能源价格多种因素共同影响,其中,气象对城市天然气负荷变化的影响最为明显,主要包括温度因素与天气类型因素。
1、温度因素
在冬季用气高峰期间,气温的变化幅度对天然气负荷的影响最为显著,故而可以将温度特征作为后续模型的主要输入特征,因此,需要从预处理后数据中提取温度特征向量,包括最高温度、最低温度与平均温度。
图2为城市天然气用气负荷与温度的相关性示意图,参见图2,横坐标为时间索引,纵坐标为城市天然气用气负荷与温度归一化的值,城市量代表城市天然气用气负荷。图2中三条交织在一起的曲线为最高温度、最低温度、平均温度,另一条曲线为城市量。根据图2可以观察到最高温度、最低温度、平均温度以及天然气用气负荷值随着时间变化而变化的趋势。由图2可知在非供暖季,由于气温高,所以天然气用气负荷一直稳定在低水平,而随着温度的降低,供暖季的天然气用气负荷量越来越高,所以能否精准预测供暖季的天然气用气负荷显得尤为重要。
2、天气类型因素
发明人通过观察城市天然气负荷用气数据的走势,发现在供暖季维度里,下雪天的城市天然气用量会升高,当天气类型为暴雪时,对城市天然气用气负荷影响最大,中雪次之,小雪对城市天然气用气负荷有一定的影响。为了提升此项气象特征在数据集中的重要程度,本发明实施例中从预处理后数据中提取天气类型特征向量,建立天气类型特征向量与影响程度之间的对应关系,其中,影响程度为天气类型特征向量对城市天然气负荷的影响程度。
其中,建立天气类型特征向量与影响程度之间的对应关系可以为:按照不同天气类型对城市天然气用气负荷的影响程度进行序号编码,序号编码代表影响程度。
示例性的,将阴晴雨雪天气类型特征向量进行序号编码,序号编码如下表:
四、供暖季标识特征处理
发明人通过对城市天然气历史用气趋势的探究,发现城市天然气在供暖季用气量级别远大于非供暖季用气量级别。故而要将供暖季与非供暖季两大用气日期区间区分开来。
参照历史政策规定,一般规定供暖季日期为每年的11月15日至次年的3月15日,其余时间为非供暖季日期。发明人通过观察城市天然气用气趋势,每年的11月1日至11月14日气量开始逐步升高,在燃气行业内部将此阶段定义为供暖季过渡期。11月15日至11月18日,虽然日期处于供暖季中,但是城市天然气负荷依旧是在爬坡阶段,因此需要将这三日用气日期单独提出处理。
也就是说在不同的供暖日期类型下,天然气用气量级别是不同的,因此,需要从预处理后数据中提取供暖日期类型特征向量,建立供暖日期类型特征向量与天然气用气量级别之间的对应关系。
由于对于类别型特征,原始文本类型不适合直接作为特征输入后续的模型,因此,可以采用适当的编码方法将原始的文本类型转变成适合机器学习模型输入的序号编码类型。因此,发明人基于城市天然气用气负荷的真实情况,提出将供暖季标识作为输入特征,利用序号编码来标识供暖季与其他类别,提高后续模型的识别能力。
其中,建立供暖日期类型特征向量与天然气用气量级别之间的对应关系可以为:按照不同供暖日期类型对天然气用气量级别进行序号编码,序号编码代表天然气用气量级别。
示例性的,供暖日期类型包括:非供暖季:3月16日-10月31日;供暖季过渡期:11月1日-11月14日,供暖爬坡期:11月15日-11月18日;供暖季:11月18日-次年的3月15日,序号编码如下表:
五、节假日特征处理
在节假日期间,会出现大量人群的流动现象,因此会导致居民用气量有所下降,其中,节假日包括各法定节假日,例如元旦、国庆和春节。
举例而言,在春节期间北京市大量外地人口返乡过节,导致北京市天然气用量下降明显,因此进行城市天然气用气负荷预测时必须考虑节假日这一影响因素。
为了更清晰的查看城市用气量变化趋势,参见图3,图3为春节期间城市天然气用气负荷变化趋势示意图,选取2017年的春节以及2018年的春节,在左上方两条线平行时处于上方的线为2018年的春节天然气用气负荷,处于下方的为2017年的春节天然气用气负荷,由图3观察春节放假时期城市用气量变化趋势,可以发现城市天然气用气负荷从春节放假前出现明显的下降趋势,在春节放假期间城市天然气用气负荷下降速度变缓,并伴随着较弱的浮动,一直持续到节后3至4天趋于平缓。
通过对不同日期类型下城市天然气负荷曲线的分析,发明人发现工作日、周末、一般节假日、国庆节、春节期间的天然气用气负荷值均呈现出各自的分布特点,其中,一般节假日为除周末、国庆节以及春节以外的节日,例如元旦和清明节。这说明不同的日期类型对城市天然气用气负荷具有一定的影响。因此,需要从预处理后数据中提取日期类型特征向量,建立日期类型特征向量与天然气用气量级别之间的对应关系。
由于定性的日期类型描述无法将二者的关系用于预测模型的建立,所以对日期类型特征向量进行序号编码,序号编码代表天然气用气量级别,码值如下表所示:
S103:将特征向量输入至预设循环神经网络模型得到第一预测值,其中,预设循环神经网络模型包括门控循环单元GRU隐藏层和注意力机制Attention层。
为了进行精准的预测,本发明实施例中提出了一种基于Attention-GRU的天然气短周期负荷预测模型,对供暖季温度变化进行重点关注,因此,在通过特征工程进行处理得到特征向量后,可以将特征向量输入至预设循环神经网络模型得到第一预测值,其中,预设循环神经网络模型就是Attention-GRU模型包括门控循环单元GRU隐藏层和注意力机制Attention层。
为了方便理解,下面分别对循环神经网络、门控循环单元、注意力机制以及Attention-GRU模型进行介绍:
一、循环神经网络
RNN(循环神经网络,Recurrent Neuron Network)与常见的多层感知机和可以高效处理空间信息的卷积神经网络有所不同,循环神经网络是为更好地处理时序信息而设计的,其主要用途是处理和预测时间序列数据。循环神经网络引入多个时间步长的状态变量来存储和表示以往的信息,并根据其与当前时刻状态的输入值共同决定当前时刻的输出值。从网络结构上,RNN会存储和记忆之前的信息,并利用之前记忆的信息来影响之后节点的输出状态。
图4为RNN的网络结构示意图,在图4中,X表示输入,t是序列数据的时刻,U为输入层到隐藏层的权重,H表示隐藏层,W是上个时刻隐藏层作为这个时刻输入的权重,V为隐藏层到输出层的权重,Y表示输出。
由图4可以看出Ht的值不仅仅取决于Xt,还取决于Ht-1,RNN的计算方法如下公式所示:
Ht=f(U·Xt+W·Ht-1)
Yt=g(V·Ht)
其中,f为激活函数,Ht为t时刻的隐藏层的值,Xt为t时刻的输入值,Ht-1为t-1时刻的隐藏层的值,U为输入层到隐藏层的权重,W是上个时刻隐藏层作为这个时刻输入的权重,g为激活函数,V为隐藏层到输出层的权重,Yt为t时刻的输出值。
由上述公式可以看出,当前时刻的隐藏层是由当前时刻的输入和上个时刻的隐藏层共同影响的。
示例性的,g为softmax激活函数,决定当前时刻输出的为当前时刻的隐藏层。
RNN网络结构的记忆特性为时序类问题的解决提供了一种新的思路,但是它的缺点也很明显:对于长序列的数据存在梯度消失的问题。
二、门控循环单元
门控循环单元GRU(门控循环单元,Gate Recurrent Unit)是由LSTM(长短型记忆,Long Short-Term Memory)循环神经网络改进的模型。GRU模型中有两个门,分别是更新门update gate和重置门reset gate。
图5为GRU的单元结构示意图,其中,zt和rt分别表示t时刻的更新门和t时刻的重置门。更新门用于控制前一时刻的状态信息带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多。重置门控制前一状态有多少信息被写入到当前的候选集也就是t时刻的候选集上。重置门越小,前一状态的信息被写入的越少。GRU的传播过程可以通过如下公式:
rt=σ(Wr·[ht-1,xt])
zt=σ(WZ·[ht-1,xt])
yt=σ(Wo·ht)
其中,σ为sigmoid激活函数,ht为t时刻的最终状态信息,ht-1为t-1时刻的最终状态信息,xt为t时刻的最初状态信息,Wr、WZ、Wo分别为传播过程中需要学习的参数,zt为t时刻的更新门,rt为t时刻重置门,为t时刻的候选集,yt为t时刻输出层的值。
GRU通过各种门函数筛选保留并传播数据向量中的重要特征向量,将一些不重要的记忆信息剔除。这样就解决了传统循环神经网路的长期记忆和梯度消失的问题,从而提高模型的训练效果。
三、注意力机制
注意力机制Attention Mechanism对于关键信息分配较多的注意力,对于其他不关键或冗余信息分配较少的注意力,达到在高效利用有限的计算资源的同时降低其他干扰因素对于决策判断的影响的目的。
在GRU的网络结构中,同样存在由于输入时间序列长度的增加,使得整个模型存在长程梯度消失的问题,也就是信息遗忘问题。因此,引入注意力机制可以有效的提升整个GRU网络对于关键影响因素的识别,提升预测效果。
参见图6,图6为Attention机制的结构示意图,X1,X2,X3…XT分别表示第1个、第2个、第三个……第T个输入数据,h1,h2,h3…hT分别表示第1个、第2个、第三个……第T个隐藏层的输出状态,在本发明实施例中隐藏层的输出状态为GRU的输出,αti表示t时刻对第i个输入数据的注意力权重,St表示t时刻的输出状态,Yt表示t时刻的输出值。
Attention机制的计算公式如下所示:
eti=G1 tanh(G2ht+G3hi+b)
St=f(St-1,Yt-1,Ct)
其中,G1,G2,G3分别为第一超参数权重矩阵、第二超参数权重矩阵、第三超参数矩阵,b为偏移量,Ct为t时刻的特征向量,αti表示t时刻对第i个输入数据的注意力权重,hi为第i个隐藏层的输出状态,T为输入数据的数量,eti表示t时刻第i个输入数据的匹配程度,etk表示t时刻第k个输入数据的匹配程度,f表示循环神经网络,St表示t时刻的输出状态,St-1表示t-1时刻的输出状态,Yt-1表示t-1时刻的输出值。
由上述公式可见,特征向量Ct是通过注意机制权重与隐藏层输出状态叠加得到的。这样计算得到的特征向量包含了历史输入节点的重要信息,且将无效信息对预测结果的影响进行了降低,突出了重要节点的作用,在进行预测时可以有效提升整个模型的性能。
四、Attention-GRU模型
Attention-GRU模型包括五个组成部分,从训练向量的输入到预测值的输出依次为:输入层、GRU隐藏层、Attention层、全连接层以及输出层。也就是预设循环神经网络模型还包括输入层、全连接层和输出层,步骤S103可以包括:
将特征向量通过输入层输入至GRU隐藏层得到特征向量中的重要特征向量;
将重要特征向量输入至Attention层进行计算得到权重向量,将权重向量与处理后向量合并得到新向量;
将新向量输入至全连接层计算得到第一预测值并通过输出层输出第一预测值。
参见图7,图7为Attention-GRU模型的结构示意图,图7中的气量以及特征1-4均为特征向量,可见将特征向量通过输入层进入模型开始训练,经过两层GRU隐藏层得到特征向量中的重要特征向量,将重要特征向量作为Attention层的输入,在Attention层中首先会依据重要特征向量计算出权重向量,然后将权重向量和当前层输入向量也就是重要特征向量合并得到新向量,再将新向量输入到全连接层中进而计算出输出的第一预测值并通过输出层输出第一预测值,其中,重要特征向量为特征向量中重要信息对应的特征向量。
GRU层的作用是能够记住输入序列中重要的信息,Attention层的作用是将模型学习到的特征权重赋值到下一个时间步长中的输入向量,突出关键特征对预测负荷的影响,最终提升模型预测效果。
S104:根据特征向量中的每日历史温度特征向量确定多组温度向量组,根据多组温度向量组确定第二预测值。
尽管Attention-GRU模型总体表现优秀,但是对于温度剧烈波动的点而言,深度学习和注意力机制还是无法及时适应温度特征的巨变。所以对于温度变动较大的点而言,本发明实施例提出基于小时级温度的相似系数预测算法,根据特征向量中的每日历史温度特征向量确定多组温度向量组,根据多组温度向量组确定第二预测值,可以有效解决供暖季日预测中的温度趋势的累积影响问题,能够消除由于城市发展和用气情况变化所导致的气量量级差异。
其中,步骤S104可以包括:
按照预设时间步长将特征向量中的每日历史温度特征向量分为多个温度向量组;
计算待预测日向量组与每组温度向量组之间的距离,并按照升序规则对计算得到的距离进行排序,选择前预设位数个距离对应的温度向量组;
计算待预测日向量组与所选择的每组温度向量组之间的相似度,对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,将气量预测值至作为第二预测值。
本发明实施例提供的相似系数预测算法通过温度系数和映射系数的组合,能够在供暖季日预测中有效弥补Attention-GRU模型的缺陷,组成一个完整的预测方案。
具体的,参见图8,图8为本发明实施例提供的相似系数预测算法的结构示意图,在图8中,t1、t2……t(n-1)、t0(n-2)、t0(n-1)……t0n表示每日24小时温度向量,q表示向量时间步长,m表示每日用气量,T表示温度组,M表示气量组,Td表示距离相似组,Tr表示相关性相似组,小写字母下标1——(n-1)表示历史数据索引,小写字母下标n表示预测点索引,大写字母下标0表示目标组索引,大写字母下标1——n表示历史数据组索引。
由图8可见,为了解决供暖季日预测的问题,相似系数预测算法共分为5个步骤:
1、按照一定的时间步长对预测日及历史数据进行温度趋势分组,历史数据集长度为n,向量时间步长为s,分组完成可得n-s-1个历史日温度向量和1一个预测日温度向量。也就是按照预设时间步长将特征向量中的每日历史温度特征向量分为多个温度向量组。
2、根据趋势距离公式计算预测日向量与每一组历史日向量的距离,其中Q=q*24,q表示时间步长,也即为向量覆盖的天数,Q表示向量长度,图8趋势距离计算公式中,E表示预测日向量,F表示历史日向量,k表示个数,Ek表示预测日向量的第k个分量,Fk表示历史向量的第k个分量。也就是计算待预测日向量组与每组历史温度向量组之间的距离,计算距离的方式为采用趋势距离公式进行计算。
3、按照升序规则选择前10个距离最近的历史日向量。也就是按照升序规则对计算得到的距离进行排序,选择前预设位数个距离对应的温度向量组,预设位数为10。
4、根据相关系数公式也就是图8中的趋势相似计算公式计算3步骤所得结果中的每一个历史日向量和预测日向量的相关性,其中,E表示预测日温度向量,F表示历史日温度向量,ρEF表示预测日向量与历史日向量之间的相关性,表示预测日温度向量均值,表示历史日温度向量均值,Q表示向量的长度,Er和Fr各表示向量E和向量F中的第r个分量。即计算待预测日向量组与所选择的每组温度向量组之间的相似度,计算相似度的方式为采用趋势相似计算公式进行计算。
5、按照升序规则选择相关系数最高的历史日向量,则该组历史日向量表示与预测日向量距离很近、趋势相似性最高的历史点。使用同比系数公式也就是图8中的气量映射公式对相关系数最高的的历史日组对应的气量做缩放,最终可计算得到目标日的预测值J。其中M1i表示历史日组中第i天的气量,M0i表示目标向量组中第i天的气量,i取值范围是[1,q-1],q表示时间步长,也即为向量覆盖的天数,M1q历史日组中映射点的气量,J表示目标点的预测值。也就是对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,将气量预测值至作为第二预测值。
上述对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,可以包括:
根据相似度最大的温度向量组对应的气量、待预测日温度向量组对应的气量以及同比系数公式进行计算得到气量预测值。
由于现有的预测方法中对温度波动较大的供暖季的预测效果不甚理想,精度较低,难以满足实际业务的需要。为此,本发明实施例基于Attention-GRU的深度学习模型,对供暖季中的重要影响因素温度特征进行全方位解析,使得模型和温度更加相关,对供暖季温度变化更加敏感。同时,结合相似系数算法,弥补深度学习模型在温度突变时预测效果差的缺点,提升预测精确度。
并且,本发明实施例针对供暖季城市天然气负荷波动大、影响因素众多且预测较为复杂的问题,提出了一种基于Attention-GRU模型与相似系数相结合的方法,通过考虑温度趋势对当日用气量的影响,提升模型对温度的敏感度,实现对供暖季城市天然气负荷的精确预测,并通过实际算例进行了分析和验证。
S105:对第一预测值和第二预测值进行整合,得到城市天然气负荷用气预测值。
在得到第一预测值和第二预测值后,即可对第一预测值和第二预测值进行整合,得到城市天然气负荷用气预测值。
其中,步骤S105可以包括:
对第一预测值和第二预测值进行加权融合,得到城市天然气负荷用气预测值。
由此,通过加权融合的方式,通过第一预测值和第二预测值计算得到城市天然气负荷用气预测值。
综上可见,本发明实施例中,可以获取城市天然气负荷用气原始数据,对城市天然气负荷用气原始数据进行特征提取,得到特征向量,将特征向量输入至预设循环神经网络模型得到第一预测值,其中,预设循环神经网络模型包括门控循环单元GRU隐藏层、注意力机制Attention层,根据特征向量中的每日历史温度特征向量确定多组温度向量组,根据多组温度向量组确定第二预测值,对第一预测值和第二预测值进行整合,得到城市天然气负荷用气预测值。由于在本申请中是基于城市天然气负荷用气原始数据也就是实际天然气负荷用气数据进行预测,使得预测过程与实际业务应用场景相结合,可以深入到实际的业务场景应用中,并且通过对温度变化敏感的预设循环神经网络模型进行预测得到第一预测值,通过多组温度向量组确定第二预测值可以适应温度特征变化,达到精确的对城市天然气负荷值进行预测的目的,可以对真实生产环境进行有效的指导。
现有的预测方法中对温度波动较大的供暖季的预测效果不甚理想,精度较低,难以满足实际业务的需要。为此,本发明实施例基于Attention-GRU的深度学习模型,对供暖季中的重要影响因素温度特征进行全方位解析,使得模型和温度更加相关,对供暖季温度变化更加敏感。同时,结合相似系数算法,弥补深度学习模型在温度突变时预测效果差的缺点,提升预测精确度。
并且,本发明实施例基于城市天然气用气负荷数据,在现有特征工程构建的基础上,结合管压还原、气象特征、供暖季特征以及节假日特征,提出一套针对供暖季天然气负荷预测的特征工程构建方法,具体参见步骤S102。利用天然气负荷的时序特性,结合相关特征和历史负荷数据,提出了一种基于Attention-GRU的天然气短周期负荷预测模型,对供暖季温度变化进行重点关注,在供暖季上取得了很好的预测效果,具体参见步骤S103。为了解决Attention-GRU在温度突变点表现不佳的情况,提出了一种基于小时级温度趋势的相似系数法。实验表明,该方法能更好的预测温度跳变较大的点,很好的与Attention-GRU算法结合,可以有效提升供暖季城市天然气负荷预测的精度,具体参见步骤S104。
下面从另一个角度对本发明实施例提供的一种供暖季城市天然气负荷预测方法进行介绍,图9为本申请实施例提供的一种城市天然气负荷预测流程图,参见图9,总体流程分可以为4个步骤。
步骤1:收集原始数据,原始数据主要包括气量数据、气象数据、供暖季数据、节假日数据等,具体参见上文描述,在此不再赘述。
步骤2:通过特征工程进一步处理原始数据集,规范数据格式并使数据能够更好的适应模型。特征工程包括数据预处理、管压还原、气象处理和供暖季处理,具体参见上文描述,在此不再赘述。
步骤3:将处理好的数据集分别输入Attention-GRU模型和相似系数算法,通过实验找寻最佳参数,进而分别对测试集进行预测,具体参见上文描述,在此不再赘述。
步骤4:将Attention-GRU模型和相似系数算法预测的结果进行整合,得到最终预测值,具体参见上文描述,在此不再赘述。
可见,本发明实施例针对燃气集团提供的城市天然气用气负荷数据,结合调度部门业务场景,构建针对供暖季的城市天然气负荷数据的特征工程,并提出管压还原法来精确计算城市天然气用量。基于特征工程处理后的数据,训练对温度变化更加敏感的Attention-GRU模型并对测试集进行初步预测,同时在温度突变点结合相似系数算法进而得到最终预测结果。能够在城市供暖季期间提供精准的预测值,为调度部门相关业务提供强有力的支撑,也为燃气集团的冬季气量调配提供了科学的依据。
并且,本发明实施例针对供暖季城市天然气负荷波动大、影响因素众多且预测较为复杂的问题,提出了一种基于Attention-GRU模型与相似系数相结合的方法,通过考虑温度趋势对当日用气量的影响,提升模型对温度的敏感度,实现对供暖季城市天然气负荷的精确预测,并通过实际算例进行了分析和验证。
在上述供暖季城市天然气负荷预测方法的基础上,参见图10,本申请还提供了一种供暖季城市天然气负荷预测装置,所述装置包括:
获取模块101,用于获取城市天然气负荷用气原始数据;
特征提取模块102,用于对所述城市天然气负荷用气原始数据进行特征提取,得到特征向量;
第一预测值确定模块103,用于将所述特征向量输入至预设循环神经网络模型得到第一预测值,其中,所述预设循环神经网络模型包括门控循环单元GRU隐藏层和注意力机制Attention层;
第二预测值确定模块104,用于根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值;
整合模块105,用于对所述第一预测值和所述第二预测值进行整合,得到城市天然气负荷用气预测值。
可见,本装置可以获取城市天然气负荷用气原始数据,对城市天然气负荷用气原始数据进行特征提取,得到特征向量,将特征向量输入至预设循环神经网络模型得到第一预测值,其中,预设循环神经网络模型包括门控循环单元GRU隐藏层、注意力机制Attention层,根据特征向量中的每日历史温度特征向量确定多组温度向量组,根据多组温度向量组确定第二预测值,对第一预测值和第二预测值进行整合,得到城市天然气负荷用气预测值。由于在本申请中是基于城市天然气负荷用气原始数据也就是实际天然气负荷用气数据进行预测,使得预测过程与实际业务应用场景相结合,可以深入到实际的业务场景应用中,并且通过对温度变化敏感的预设循环神经网络模型进行预测得到第一预测值,通过多组温度向量组确定第二预测值可以适应温度特征变化,达到精确的对城市天然气负荷值进行预测的目的,可以对真实生产环境进行有效的指导。
在一种实现方式中,所述城市天然气负荷用气原始数据包括气量数据、气象数据、供暖季数据和节假日数据。
在一种实现方式中,所述特征提取模块102,可以包括:
预处理单元,用于对所述城市天然气负荷用气原始数据进行预处理,得到预处理后数据;
城市天然气使用量特征向量确定单元,用于根据所述预处理后数据计算得到管道内天然气的管存变化量,计算所述管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量;
第一对应关系建立单元,用于从所述预处理后数据中提取温度特征向量和天气类型特征向量,建立所述天气类型特征向量与影响程度之间的对应关系,其中,所述影响程度为天气类型特征向量对城市天然气负荷的影响程度;
第二对应关系建立单元,用于从所述预处理后数据中提取供暖日期类型特征向量,建立所述供暖日期类型特征向量与天然气用气量级别之间的对应关系;
第三对应关系建立单元,用于从所述预处理后数据中提取日期类型特征向量,建立所述日期类型特征向量与天然气用气量级别之间的对应关系。
在一种实现方式中,所述预处理单元,可以包括:
缺失值填充子单元,用于对所述城市天然气负荷用气原始数据进行缺失值填充得到填充后的城市天然气负荷用气数据;
检测子单元,用于对填充后的城市天然气负荷用气数据进行异常值检测,将检测到的异常值替换为非异常值;
归一化处理子单元,用于对替换后的城市天然气负荷用气数据进行归一化处理,得到预处理后数据。
在一种实现方式中,所述城市天然气使用量特征向量确定单元,可以具体用于:
根据预处理后数据中的当日管道内天然气的管道压力值与昨日管道内天然气的管道压力值计算得到昨日管道内天然气的管存变化量,计算所述昨日管道内天然气的管存变化量与昨日非管道内的天然气用量之和作为昨日城市天然气使用量特征向量。
在一种实现方式中,所述预设循环神经网络模型还包括输入层、全连接层和输出层,所述第一预测值确定模块103,可以包括:
重要特征向量确定单元,用于将所述特征向量通过所述输入层输入至所述GRU隐藏层得到所述特征向量中的重要特征向量;
新向量确定单元,用于将所述重要特征向量输入至所述Attention层进行计算得到权重向量,将所述权重向量与所述处理后向量合并得到新向量;
输出单元,用于将所述新向量输入至所述全连接层计算得到第一预测值并通过所述输出层输出所述第一预测值。
在一种实现方式中,所述第二预测值确定模块104,可以包括:
划分单元,用于按照预设时间步长将所述特征向量中的每日历史温度特征向量分为多个温度向量组;
距离计算单元,用于计算待预测日向量组与每组温度向量组之间的距离,并按照升序规则对计算得到的距离进行排序,选择前预设位数个距离对应的温度向量组;
相似度计算单元,用于计算所述待预测日向量组与所选择的每组温度向量组之间的相似度,对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,将所述气量预测值至作为所述第二预测值。
在一种实现方式中,所述相似度计算单元,可以具体用于:
根据相似度最大的温度向量组对应的气量、所述待预测日温度向量组对应的气量以及同比系数公式进行计算得到气量预测值。
图11是本申请实施例提供的一种电子设备的结构示意图。在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放执行指令。具体地,执行指令即可被执行的计算机程序。存储器可以包括内存和非易失性存储器,并向处理器提供执行指令和数据。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形供暖季城市天然气负荷预测装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本申请任一实施例中提供的供暖季城市天然气负荷预测方法。
上述如本申请图1所示实施例提供的供暖季城市天然气负荷预测方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本申请实施例还提出了一种可读介质,该可读存储介质存储有执行指令,存储的执行指令被电子设备的处理器执行时,能够使该电子设备执行本申请任一实施例中提供的供暖季城市天然气负荷预测方法。
前述各个实施例中所述的电子设备可以为计算机。
本领域内的技术人员应明白,本申请的实施例可提供为方法或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (8)
1.一种供暖季城市天然气负荷预测方法,其特征在于,包括:
获取城市天然气负荷用气原始数据;
对所述城市天然气负荷用气原始数据进行特征提取,得到特征向量;
将所述特征向量输入至预设循环神经网络模型得到第一预测值,其中,所述预设循环神经网络模型包括门控循环单元GRU隐藏层和注意力机制Attention层;
根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值;
对所述第一预测值和所述第二预测值进行整合,得到城市天然气负荷用气预测值;
所述根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值的步骤,包括:
按照预设时间步长将所述特征向量中的每日历史温度特征向量分为多个温度向量组;
计算待预测日向量组与每组温度向量组之间的距离,并按照升序规则对计算得到的距离进行排序,选择前预设位数个距离对应的温度向量组;
计算所述待预测日向量组与所选择的每组温度向量组之间的相似度,对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,将所述气量预测值为所述第二预测值;
所述对相似度最大的温度向量组对应的气量进行缩放得到气量预测值的步骤,包括:
根据相似度最大的温度向量组对应的气量、待预测日温度向量组对应的气量以及同比系数公式进行计算得到气量预测值;
2.根据权利要求1所述的方法,其特征在于,所述城市天然气负荷用气原始数据包括气量数据、气象数据、供暖季数据和节假日数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述城市天然气负荷用气原始数据进行特征提取,得到特征向量的步骤,包括:
对所述城市天然气负荷用气原始数据进行预处理,得到预处理后数据;
根据所述预处理后数据计算得到管道内天然气的管存变化量,计算所述管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量;
从所述预处理后数据中提取温度特征向量和天气类型特征向量,建立所述天气类型特征向量与影响程度之间的对应关系,其中,所述影响程度为天气类型特征向量对城市天然气负荷的影响程度;
从所述预处理后数据中提取供暖日期类型特征向量,建立所述供暖日期类型特征向量与天然气用气量级别之间的对应关系;
从所述预处理后数据中提取日期类型特征向量,建立所述日期类型特征向量与天然气用气量级别之间的对应关系。
4.根据权利要求3所述的方法,其特征在于,所述对所述城市天然气负荷用气原始数据进行预处理,得到预处理后数据的步骤,包括:
对所述城市天然气负荷用气原始数据进行缺失值填充得到填充后的城市天然气负荷用气数据;
对填充后的城市天然气负荷用气数据进行异常值检测,将检测到的异常值替换为非异常值;
对替换后的城市天然气负荷用气数据进行归一化处理,得到预处理后数据。
5.根据权利要求3所述的方法,其特征在于,所述根据所述预处理后数据计算得到管道内天然气的管存变化量,计算所述管存变化量与非管道内的天然气用量之和作为城市天然气使用量特征向量的步骤,包括:
根据预处理后数据中的当日管道内天然气的管道压力值与昨日管道内天然气的管道压力值计算得到昨日管道内天然气的管存变化量,计算所述昨日管道内天然气的管存变化量与昨日非管道内的天然气用量之和作为昨日城市天然气使用量特征向量。
6.根据权利要求1所述的方法,其特征在于,所述预设循环神经网络模型还包括输入层、全连接层和输出层,所述将所述特征向量输入至预设循环神经网络模型得到第一预测值的步骤,包括:
将所述特征向量通过所述输入层输入至所述GRU隐藏层得到所述特征向量中的重要特征向量;
将所述重要特征向量输入至所述Attention层进行计算得到权重向量,将所述权重向量与处理后向量合并得到新向量;
将所述新向量输入至所述全连接层计算得到第一预测值并通过所述输出层输出所述第一预测值。
7.一种供暖季城市天然气负荷预测装置,其特征在于,所述装置包括:
获取模块,用于获取城市天然气负荷用气原始数据;
特征提取模块,用于对所述城市天然气负荷用气原始数据进行特征提取,得到特征向量;
第一预测值确定模块,用于将所述特征向量输入至预设循环神经网络模型得到第一预测值,其中,所述预设循环神经网络模型包括门控循环单元GRU隐藏层和注意力机制Attention层;
第二预测值确定模块,用于根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值;
所述根据所述特征向量中的每日历史温度特征向量确定多组温度向量组,根据所述多组温度向量组确定第二预测值的步骤,包括:
按照预设时间步长将所述特征向量中的每日历史温度特征向量分为多个温度向量组;
计算待预测日向量组与每组温度向量组之间的距离,并按照升序规则对计算得到的距离进行排序,选择前预设位数个距离对应的温度向量组;
计算所述待预测日向量组与所选择的每组温度向量组之间的相似度,对相似度最大的温度向量组对应的气量进行缩放得到气量预测值,将所述气量预测值为所述第二预测值;
整合模块,用于对所述第一预测值和所述第二预测值进行整合,得到城市天然气负荷用气预测值;
所述对相似度最大的温度向量组对应的气量进行缩放得到气量预测值的步骤,包括:
根据相似度最大的温度向量组对应的气量、待预测日温度向量组对应的气量以及同比系数公式进行计算得到气量预测值;
8.一种电子设备,其特征在于,包括:处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110037746.XA CN112733307B (zh) | 2021-01-12 | 2021-01-12 | 一种供暖季城市天然气负荷预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110037746.XA CN112733307B (zh) | 2021-01-12 | 2021-01-12 | 一种供暖季城市天然气负荷预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733307A CN112733307A (zh) | 2021-04-30 |
CN112733307B true CN112733307B (zh) | 2022-07-01 |
Family
ID=75590510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110037746.XA Active CN112733307B (zh) | 2021-01-12 | 2021-01-12 | 一种供暖季城市天然气负荷预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733307B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343589B (zh) * | 2021-06-30 | 2022-07-26 | 西南石油大学 | 一种基于遗传-随机常数的基因表达式编程的酸性天然气水合物生成条件预测方法 |
CN115859554B (zh) * | 2022-10-08 | 2024-04-26 | 常熟理工学院 | 基于大数据的民用天然气动态智能调配方法 |
CN115437416B (zh) * | 2022-10-17 | 2023-07-11 | 杭州市燃气集团有限公司 | 一种天然气透平膨胀发电系统压力控制方法 |
CN118014145A (zh) * | 2024-02-21 | 2024-05-10 | 山东智慧燃气物联网技术有限公司 | 一种燃气用量预测方法、装置、电子设备及存储介质 |
CN118464710B (zh) * | 2024-07-09 | 2024-10-25 | 克拉玛依大越华烁石油科技有限公司 | 油气藏流体的相态检测系统及方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020063689A1 (zh) * | 2018-09-25 | 2020-04-02 | 新智数字科技有限公司 | 一种电力系统热负荷预测的方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123591A (zh) * | 2014-07-14 | 2014-10-29 | 上海师范大学 | 基于智能网格分类和模糊神经网络的天然气负荷预测方法 |
CN110210993B (zh) * | 2019-05-22 | 2023-04-07 | 重庆大学 | 基于循环神经网络模型的城市短期燃气负荷预测方法 |
CN110852496A (zh) * | 2019-10-29 | 2020-02-28 | 同济大学 | 一种基于lstm循环神经网络的天然气负荷预测方法 |
-
2021
- 2021-01-12 CN CN202110037746.XA patent/CN112733307B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020063689A1 (zh) * | 2018-09-25 | 2020-04-02 | 新智数字科技有限公司 | 一种电力系统热负荷预测的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112733307A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112733307B (zh) | 一种供暖季城市天然气负荷预测方法及装置 | |
CN110046743B (zh) | 基于ga-ann的公共建筑能耗预测方法和系统 | |
Wang et al. | Long-term traffic prediction based on lstm encoder-decoder architecture | |
CN111080032A (zh) | 一种基于Transformer结构的负荷预测方法 | |
CN115688579B (zh) | 一种基于生成对抗网络的流域多点水位预测预警方法 | |
CN110991713A (zh) | 基于多图卷积和gru的不规则区域流量预测方法 | |
CN109086926B (zh) | 一种基于组合神经网络结构的短时轨道交通客流预测方法 | |
CN112330077B (zh) | 电力负荷预测方法、装置、计算机设备和存储介质 | |
CN113505923A (zh) | 一种地区电网短期负荷预测方法及系统 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN107704970A (zh) | 一种基于Spark的需求侧负荷预测方法 | |
CN114572229B (zh) | 一种基于图神经网络的车速预测方法、装置、介质及设备 | |
CN115115125B (zh) | 基于深度学习融合模型的光伏功率区间概率预测方法 | |
CN113947182B (zh) | 基于双阶段堆叠图卷积网络的交通流预测模型构建方法 | |
CN114565187A (zh) | 一种基于图时空自编码网络的交通路网数据预测方法 | |
CN113469427A (zh) | 基于卷积lstm的光伏电站日前发电量预测方法及系统 | |
CN115204477A (zh) | 一种上下文感知图递归网络的自行车流量预测方法 | |
Gao et al. | A multifactorial framework for short-term load forecasting system as well as the jinan’s case study | |
CN113344279B (zh) | 基于lstm-sam模型和池化的居民负荷预测方法 | |
CN114880852A (zh) | 一种基于社会感知数据的建模分析方法与系统 | |
CN116913098B (zh) | 一种融合空气质量与车流量数据的短时交通流预测方法 | |
Nizar et al. | Forecasting of temperature by using LSTM and bidirectional LSTM approach: case study in Semarang, Indonesia | |
CN116565850A (zh) | 一种基于qr-blstm的风电功率超短期预测方法 | |
CN114254828B (zh) | 一种基于混合卷积特征提取器和gru的电力负荷预测方法 | |
CN115589369A (zh) | 一种基于双注意力机制的基站流量预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |