CN113326654A - 一种燃气负荷预测模型的构建方法及装置 - Google Patents
一种燃气负荷预测模型的构建方法及装置 Download PDFInfo
- Publication number
- CN113326654A CN113326654A CN202110553558.2A CN202110553558A CN113326654A CN 113326654 A CN113326654 A CN 113326654A CN 202110553558 A CN202110553558 A CN 202110553558A CN 113326654 A CN113326654 A CN 113326654A
- Authority
- CN
- China
- Prior art keywords
- model
- gas
- prediction
- value
- models
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000004927 fusion Effects 0.000 claims abstract description 32
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 13
- 230000035772 mutation Effects 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 4
- 239000007789 gas Substances 0.000 description 150
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 12
- 238000010438 heat treatment Methods 0.000 description 6
- 239000003345 natural gas Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001788 irregular Effects 0.000 description 4
- 238000007500 overflow downdraw method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/08—Fluids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Geometry (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
Abstract
本发明提供一种燃气负荷预测模型的构建方法及装置。所述方法包括:收集历史数据并进行预处理;计算可能影响用气量的因素与用气量的相关系数,选取相关系数大于设定阈值的因素作为模型的输入变量;对燃气用户进行分类,将每类用户的用气量作为输出分别构建预测模型;根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。本发明通过采用与用气量相关度大的因素作为模型的输入变量,对不同类别用户分别建模,选取不同结构的模型或多种模型的融合作为预测模型,能够明显提高预测模型的精度。
Description
技术领域
本发明属于燃气负荷预测技术领域,具体涉及一种燃气负荷预测模型的构建方法及装置。
背景技术
在全球能源日益紧张的大环境下,气源供应也日益紧张。气源紧张,使各企业气源采购周期不断缩短,气源多样化及价格走高,企业对于燃气负荷精准预测的需求日趋迫切。对燃气负荷进行精准预测,可以提高企业对气量计划制定和调配的准确性,减少储气设施投资和成本,降低综合采购成本,同时顺应天然气网销分离和市场化采购的发展趋势。
燃气负荷预测模型的现有构建方法,一般只构建一种预测模型,用于用气规律不同的各类用户不同应用场景、不同预测周期(小时/日/周/月/年)的预测,只关注这一种预测模型的精确度高低,致使预测效果不佳。另外,将一些特殊的燃气用户,如用气量大、用气无明显规律且对燃气负荷预测有较大影响的无规律大用户,与一般燃气用户一视同仁,采用同一模型进行预测,导致预测模型的精度很难达到预测要求。
发明内容
为了解决现有技术中存在的上述问题,本发明提供一种燃气负荷预测模型的构建方法及装置。
为了实现上述目的,本发明采用以下技术方案。
第一方面,本发明提供一种燃气负荷预测模型的构建方法,包括:
收集历史数据,对历史数据进行预处理后用于构建模型的训练数据集;
计算可能影响用气量的因素与用气量的相关系数,选取相关系数大于设定阈值的因素作为模型的输入变量;
分析用气结构,根据用气量分布规律对燃气用户进行分类,将每类用户的用气量作为输出分别构建预测模型,汇总后得到总燃气负荷预测值;
根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。
进一步地,模型输入变量包括:日最高温度,日最低温度,日平均温度,气压,空气质量指数和PM2.5指数,还包括经编码数字化后的节假日。
进一步地,所述方法还包括模型融合步骤:
模型预测值与计划值融合:将剔除大用户用气量后的模型预测值与手工输入的大用户的计划用气量相加,作为融合预测结果;
多模型融合:采用多个模型进行预测,将多个模型的预测结果加权求均值。
进一步地,所述方法还包括针对新增用户对预测模型的修正方法:将模型预测值加上手工输入的新增用户计划用气量,作为模型修正值;新增用户是指用气量没有包含在用于模型训练的历史数据中的新增加的用户。
进一步地,所述方法还包括对预测模型无法拟合的预测结果突变进行校准的步骤,所述突变由历年相同日期范围内发生的必然事件引起;当对所述日期范围内的用气量进行预测时,对预测结果按以下经验公式进行校准:
式中,pi为当前时刻的预测值,pt为当前时刻的校准值,si为历年相同时刻预测值的平均值,st为历年相同时刻真实值的平均值。
第二方面,本发明提供一种燃气负荷预测模型的构建装置,包括:
数据收集模块,用于收集历史数据,对历史数据进行预处理后用于构建模型的训练数据集;
输入确定模块,用于计算可能影响用气量的因素与用气量的相关系数,选取相关系数大于设定阈值的因素作为模型的输入变量;
用户分类模块,用于分析用气结构,根据用气量分布规律对燃气用户进行分类,将每类用户的用气量作为输出分别构建预测模型,汇总后得到总燃气负荷预测值;
模型选取模块,用于根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。
进一步地,模型输入变量包括:日最高温度,日最低温度,日平均温度,气压,空气质量指数和PM2.5指数,还包括经编码数字化后的节假日。
进一步地,所述装置还包括模型融合模块,用于,
将模型预测值与计划值融合:将剔除大用户用气量后的模型预测值与手工输入的大用户的计划用气量相加,作为融合预测结果;
进行多模型融合:采用多个模型进行预测,将多个模型的预测结果加权求均值。
进一步地,所述装置还包括新增用户修正模块,用于将模型预测值加上手工输入的新增用户计划用气量,作为模型修正值;新增用户是指用气量没有包含在用于模型训练的历史数据中的新增加的用户。
进一步地,所述装置还包括校准模块,用于对预测模型无法拟合的预测结果突变进行校准,所述突变由历年相同日期范围内发生的必然事件引起;当对所述日期范围内的用气量进行预测时,对预测结果按以下经验公式进行校准:
式中,pi为当前时刻的预测值,pt为当前时刻的校准值,si为历年相同时刻预测值的平均值,st为历年相同时刻真实值的平均值。
与现有技术相比,本发明具有以下有益效果。
本发明提出的燃气负荷预测模型构建方法,与现有技术相比有以下不同:根据用气量分布规律对用户进行分类,对每类用户的用气量分别建模进行预测,汇总后得到总燃气负荷预测值;通过计算各种影响因素与用气量的相关系数,选取相关系数大的因素作为模型的输入变量;根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。本发明由于采取了以上多种优化模型的措施,相对现有技术明显提高了模型的预测精度。
附图说明
图1为本发明的实施例一种燃气负荷预测模型的构建方法的流程图。
图2为城市燃气体系的构架图。
图3为本发明的实施例一种燃气负荷预测模型的构建装置的方框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明白,以下结合附图及具体实施方式对本发明作进一步说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一种燃气负荷预测模型的构建方法的流程图,包括以下步骤:
步骤101,收集历史数据,对历史数据进行预处理后用于构建模型的训练数据集;
步骤102,计算可能影响用气量的因素与用气量的相关系数,选取相关系数大于设定阈值的因素作为模型的输入变量;
步骤103,分析用气结构,根据用气量分布规律对燃气用户进行分类,将每类用户的用气量作为输出分别构建预测模型,汇总后得到总燃气负荷预测值;
步骤104,根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。
本实施例针对现有燃气负荷预测模型存在的各种问题,在模型输入、输出变量的选取,模型结构的确定及多模型融合等多方面提出改进措施,以提升模型的预测精度。
本实施例中,步骤101主要用于收集历史数据。历史数据的种类由模型的输入输出变量决定,比如,不同种类燃气用户的用气量,温度、湿度、风力等数据。数据收集的方法有两种:一种是自动采集,通过与SCADA系统建立接口以及利用网络爬虫从互联网上自动爬取;一种是手动采集,系统提供人工导入功能,将综合台账、特殊事件等数据人工导入。收集的原始数据一般需要进行预处理。数据预处理主要采取以下方法:补充缺失值,数据归一化,特征降维。在燃气负荷采集中缺失值几乎不可避免,为了尽量减小数据对模型结果造成的影响,需要对缺失值进行填充。在一般情况下,燃气日负荷量不会产生突变,其数值通常与相邻几天的用气量具有一定的连贯性。所以,根据实际情况选择加权平均值填充法,即选择缺失日当天前后几天的数据求加权平均值。燃气负荷预测中采用多维变量数据作为影响因素,其数据来源和表示的内容均不相同,这样的数据在同一模型中实际数值相差悬殊。这种悬殊会导致数值较小的变量无法体现它本身对于模型的影响力。为此,对数据进行归一化处理,将数据大小变换到相同的区间,以减小因各变量数据值相差较大带来的偶然误差,这将对模型预测精度有一定的提高。在原始燃气负荷数据集中,包含冗余信息以及噪音信息,这些数据在实际应用中造成了误差,降低了算法的准确率。通过特征降维,从诸多给定的特征集合中选出相关特征子集,可以减少冗余信息所造成的误差,提高算法精度。
本实施例中,步骤102主要用于确定模型的输入变量。城市燃气体系的构架图如图2所示,主要包含用气量、供气量和影响因素三大部分。供气量等于用气量与储气变化量的和,储气量变化量主要是指球罐、LNG储气罐、管网等储气设施相比上一结算周期的变化量,这个变化量实质上是上一结算周期用气量的一部分。影响用气量的因素有很多,比如当地气象因素、消费水平、居民生活习惯、节假日和能源价格等,其中气象对城市天然气负荷变化的影响最为明显,特别是在冬季用气高峰期间气温的变化幅度对天然气负荷的影响最为显著。除此之外,还受大用户生产计划、环保限产等不可控因素影响明显,此类因素将以计划管理及人工经验调整的方式考虑。由于影响因素很多,不可能将所有的影响因素都作为模型的输入变量,将影响不大的因素作为输入变量,不仅会使模型结构变得更加复杂,而且还会降低预测精度,因此需要对影响因素进行筛选,删除大量影响不大的因素,只保留少数影响明显的因素。可通过计算各种影响因素与用气量(如日均用气量)的相关系数衡量它们的影响程度,相关系数的绝对值越大,表示它们之间的相关程度越高;相关系数为负数时,表示该因素量化值的增加(或减少)可能引起用气量的减少(或增加),这种关系叫做负相关。相关系数的绝对值与影响程度关系为:0.8-1.0为极强相关,0.6-0.8为强相关,0.4-0.6为中等程度相关,0.2-0.4为弱相关,0.0-0.2为极弱相关或无相关。本实施例选取相关系数大于设定阈值的因素作为输入变量,实际上就是选取与用气量相关程度大的因素作输入变量。
本实施例中,步骤103主要用于通过分析用气结构对燃气用户进行分类。对用户分类的目的是对每类用户的用气量分别建模进行预测,汇总后得到总燃气负荷预测值。本实施例通过分析用气结构根据用气量分布规律对用户进行分类。由于不同地区的用气结构不同,因此不同地区的分类结果也不同。比如,A市将用户分为工商户、居民用户、车用CNG三类;B市则将用户分为工商户和居民用户两类。这两个城市2017、2018两年的用气结构分别如表1、2所示。
表1A市用气结构统计(用气量m3)
表2B市用气结构统计(用气量m3)
根据用气量是否有规律,还可将燃气用户分为规律用户和无规律用户。居民用户、车用CNG和中小工商户的用气量都遵循一定的规律,属于规律用户;有些大工商户也属于规律用户;但有些大工商户的用气量呈现无周期性现象、无显著影响因子,属于无规律用户。
本实施例中,步骤104主要用于选择合适的模型结构。如前述,不同类别用户的用气规律不同;相同类别的用户在不同应用场景的用气规律也不同,比如不同地区的用户;即使是相同类别的用户在相同应用场景以不同周期进行预测,用气规律也不同。因此,应根据具体情况采取不同结构的模型,或通过多种模型融合,使模型的预测效果最佳。本实施例采用以下模型:指数平滑,ARIMA,多元线性回归,BP神经网络,LSTM小波分解。各种模型的适用范围如表3所示。
表3算法列表
作为一可选实施例,模型输入变量包括:日最高温度,日最低温度,日平均温度,气压,空气质量指数和PM2.5指数,还包括经编码数字化后的节假日。
本实施例给出了模型的一组具体输入变量。本实施例是根据影响因素与用气量的相关程度确定模型的输入变量。影响用气量的气象因素有温度、湿度、气压、风速、降雨量等。通过计算各种影响因素与用气量的相关系数,发现温度、气压、空气质量指数(AQI)、PM2.5是影响天然气负荷量的主要因素,而湿度、风速、降雨量对于天然气负荷量的影响非常微弱,可以忽略不计。表4是某地区居民用户用气量与几个主要影响因素的相关系数。
因此,本实施例将日最高温度、日最低温度、日平均温度、气压、空气质量指数(AQI)和PM2.5指数作为模型的输入变量。
表4气象因素与用气量的相关系数
影响因素 | 最高温度 | 最低温度 | 平均温度 | 气压 | PM2.5 | AQI |
相关系数 | -0.712 | -0.708 | -0.710 | 0.625 | -0.359 | -0.214 |
另外,节假日与工作日相比,用气量有很大不同,因此日期类影响因素也应作为一种输入变量。当然,需要将日期类型量化后才能作为模型的一个输入变量。表5、表6分别给出了日期类型量化表和日期类型与用气量的相关系数。
表5日期类型量化表
日期类型 | 工作日 | 双休日 | 小长假 | 国庆 | 春节 |
量化值 | 1 | 2 | 3 | 4 | 5 |
表6日期类型与用气量的相关系数
日期类型 | 夏季双休日 | 冬季双休日 | 小长假 | 国庆 | 春节 |
相关系数 | -0.835 | -0.012 | -0.592 | 0.795 | -0.681 |
值得说明的是,本实施例只是给出了一种较佳的实施方式,并不排斥其它可行的实施方式。比如,还可以增加一些与用气量相关度比较高的因素作为输入变量,也可以不必将三个与温度有关的变量全部用作输入变量。
作为一可选实施例,所述方法还包括模型融合步骤:
模型预测值与计划值融合:将剔除大用户用气量后的模型预测值与手工输入的大用户的计划用气量相加,作为融合预测结果;
多模型融合:采用多个模型进行预测,将多个模型的预测结果加权求均值。
本实施例给出了模型融合的一种技术方案。单一模型的预测结果具有局限性,每个模型均有其各自特点和应用范围。为了更好地发挥模型各自的优势,模型融合是天然气负荷预测模型设计的重要组成部分。模型融合的方法很多,本实施例给出了两种比较适合燃气负荷预测模型的融合方法。一种是模型预测值与计划值融合。从燃气业务出发,工商用户中的无规律大用户和规律大用户均采用录入计划的方式进行管理。由于这种大用户用气量占比很大,对预测结果影响很大,因此,在建模过程中首先将此类用户的用气量在总用气量中扣除,目的是在建模时从数据中剔除噪声,这样模型在训练时将获得较为稳定的效果。之后在计算负荷预测结果时将此类用户的用气计划进行叠加,获得最终的预测结果。另一种模型融合方法是多模型融合,采用多模型对同一用气量进行预测,进而对多个模型的预测值进行加权求均值,通过加权系数的调整,可以得到较好的预测效果。
作为一可选实施例,所述方法还包括针对新增用户对预测模型的修正方法:将模型预测值加上手工输入的新增用户计划用气量,作为模型的修正值;新增用户是指用气量没有包含在用于模型训练的历史数据中的新增加的用户。
本实施例给出了对新增用户的一种处理方法。在进行年、月用气量预测时,新增用户的用气量是不容忽视的。由于模型预测值不包含新增用户的用气量,因此需将模型预测的用气量与本年/月的新增用户的计划气量相加。
作为一可选实施例,所述方法还包括对预测模型无法拟合的预测结果突变进行校准的步骤,所述突变由历年相同日期范围内发生的必然事件引起;当对所述日期范围内的用气量进行预测时,对预测结果按以下经验公式进行校准:
式中,pi为当前时刻的预测值,pt为当前时刻的校准值,si为历年相同时刻预测值的平均值,st为历年相同时刻真实值的平均值。
本实施例给出了一种根据经验公式对预测模型进行校准的技术方案。根据历年实际用气规律,发现存在一些模型无法拟合的突变点,例如试供暖期间用气量的骤升使模型无法进行较好地拟合。针对此类情况,通过利用经验公式修正预测值来提高预测精度。即在模型预测结果的基础上,针对预测值用修正经验公式修正,从而得出最终负荷的预测结果。试供暖是每年供暖前的必然事件,而且供暖日期一般情况下都是固定的,因此试供暖时间一般也在固定的日期范围内。所以,可以在每年的所述日期范围内,应用经验公式自动对预测结果进行修正。当然,为了避免失误(如因特殊情况试供暖时间超出了所述日期范围),可以增加突变量的判断步骤,即判断当前时刻(或预测周期)预测结果与上一时刻预测结果相比的变化量是否超过设定阈值,如果超过了就进行校准;否则,不进行校准。
图3为本发明实施例一种燃气负荷预测模型的构建装置的组成示意图,所述装置包括:
数据收集模块11,用于收集历史数据,对历史数据进行预处理后用于构建模型的训练数据集;
输入确定模块12,用于计算可能影响用气量的因素与用气量的相关系数,选取相关系数大于设定阈值的因素作为模型的输入变量;
用户分类模块13,用于分析用气结构,根据用气量分布规律对燃气用户进行分类,将每类用户的用气量作为输出分别构建预测模型,汇总后得到总燃气负荷预测值;
模型选取模块14,用于根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。后面的实施例也是如此,均不再展开说明。
作为一可选实施例,模型输入变量包括:日最高温度,日最低温度,日平均温度,气压,空气质量指数和PM2.5指数,还包括经编码数字化后的节假日。
作为一可选实施例,所述装置还包括模型融合模块,用于,
将模型预测值与计划值融合:将剔除大用户用气量后的模型预测值与手工输入的大用户的计划用气量相加,作为融合预测结果;
进行多模型融合:采用多个模型进行预测,将多个模型的预测结果加权求均值。
作为一可选实施例,所述装置还包括新增用户修正模块,用于将模型预测值加上手工输入的新增用户计划用气量,作为模型修正值;新增用户是指用气量没有包含在用于模型训练的历史数据中的新增加的用户。
作为一可选实施例,所述装置还包括校准模块,用于对预测模型无法拟合的预测结果突变进行校准,所述突变由历年相同日期范围内发生的必然事件引起;当对所述日期范围内的用气量进行预测时,对预测结果按以下经验公式进行校准:
式中,pi为当前时刻的预测值,pt为当前时刻的校准值,si为历年相同时刻预测值的平均值,st为历年相同时刻真实值的平均值。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种燃气负荷预测模型的构建方法,其特征在于,包括以下步骤:
收集历史数据,对历史数据进行预处理后用于构建模型的训练数据集;
计算可能影响用气量的因素与用气量的相关系数,选取相关系数大于设定阈值的因素作为模型的输入变量;
分析用气结构,根据用气量分布规律对燃气用户进行分类,将每类用户的用气量作为输出分别构建预测模型,汇总后得到总燃气负荷预测值;
根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。
2.根据权利要求1所述的燃气负荷预测模型的构建方法,其特征在于,模型输入变量包括:日最高温度,日最低温度,日平均温度,气压,空气质量指数和PM2.5指数,还包括经编码数字化后的节假日。
3.根据权利要求1所述的燃气负荷预测模型的构建方法,其特征在于,所述方法还包括模型融合步骤:
模型预测值与计划值融合:将剔除大用户用气量后的模型预测值与手工输入的大用户的计划用气量相加,作为融合预测结果;
多模型融合:采用多个模型进行预测,将多个模型的预测结果加权求均值。
4.根据权利要求1所述的燃气负荷预测模型的构建方法,其特征在于,所述方法还包括针对新增用户对预测模型的修正方法:将模型预测值加上手工输入的新增用户计划用气量,作为模型修正值;新增用户是指用气量没有包含在用于模型训练的历史数据中的新增加的用户。
6.一种燃气负荷预测模型的构建装置,其特征在于,包括:
数据收集模块,用于收集历史数据,对历史数据进行预处理后用于构建模型的训练数据集;
输入确定模块,用于计算可能影响用气量的因素与用气量的相关系数,选取相关系数大于设定阈值的因素作为模型的输入变量;
用户分类模块,用于分析用气结构,根据用气量分布规律对燃气用户进行分类,将每类用户的用气量作为输出分别构建预测模型,汇总后得到总燃气负荷预测值;
模型选取模块,用于根据不同类别用户在不同应用场景、不同预测周期的用气特点,分别选取不同结构的模型或多种模型的融合作为预测模型。
7.根据权利要求6所述的燃气负荷预测模型的构建装置,其特征在于,模型输入变量包括:日最高温度,日最低温度,日平均温度,气压,空气质量指数和PM2.5指数,还包括经编码数字化后的节假日。
8.根据权利要求6所述的燃气负荷预测模型的构建装置,其特征在于,所述装置还包括模型融合模块,用于,
将模型预测值与计划值融合:将剔除大用户用气量后的模型预测值与手工输入的大用户的计划用气量相加,作为融合预测结果;
进行多模型融合:采用多个模型进行预测,将多个模型的预测结果加权求均值。
9.根据权利要求6所述的燃气负荷预测模型的构建装置,其特征在于,所述装置还包括新增用户修正模块,用于将模型预测值加上手工输入的新增用户计划用气量,作为模型修正值;新增用户是指用气量没有包含在用于模型训练的历史数据中的新增加的用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110553558.2A CN113326654A (zh) | 2021-05-20 | 2021-05-20 | 一种燃气负荷预测模型的构建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110553558.2A CN113326654A (zh) | 2021-05-20 | 2021-05-20 | 一种燃气负荷预测模型的构建方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113326654A true CN113326654A (zh) | 2021-08-31 |
Family
ID=77416095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110553558.2A Pending CN113326654A (zh) | 2021-05-20 | 2021-05-20 | 一种燃气负荷预测模型的构建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113326654A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114462697A (zh) * | 2022-01-28 | 2022-05-10 | 北京东方金信科技股份有限公司 | 一种城市燃气负荷预测的框架实现方法和系统 |
CN114626640A (zh) * | 2022-04-27 | 2022-06-14 | 西安建筑科技大学 | 基于特征工程和lstm神经网络的天然气负荷预测方法及系统 |
CN115081902A (zh) * | 2022-06-30 | 2022-09-20 | 国网北京市电力公司 | 基于源网荷储协同的综合规划方法、装置、设备及介质 |
CN117610720A (zh) * | 2023-11-20 | 2024-02-27 | 武汉城市数字科技有限公司 | 一种基于大数据平台和神经网络的气量负荷预测系统 |
CN117688501A (zh) * | 2024-02-03 | 2024-03-12 | 南京创蓝科技有限公司 | 一种矫正空气质量预报系统的误差方法 |
WO2024131236A1 (zh) * | 2022-12-23 | 2024-06-27 | 浙江苍南仪表集团股份有限公司 | 区域燃气用量预测方法、系统、设备及物联网云平台 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105894113A (zh) * | 2016-03-31 | 2016-08-24 | 中国石油天然气股份有限公司规划总院 | 一种天然气短期需求预测方法 |
CN106127360A (zh) * | 2016-06-06 | 2016-11-16 | 国网天津市电力公司 | 一种基于用户特性分析的多模型负荷预测方法 |
CN107609712A (zh) * | 2017-09-30 | 2018-01-19 | 新智能源系统控制有限责任公司 | 一种基于分类预测的能量对齐方法和装置 |
CN109993364A (zh) * | 2019-04-01 | 2019-07-09 | 北京恒华龙信数据科技有限公司 | 一种天然气用气量的预测方法及装置 |
-
2021
- 2021-05-20 CN CN202110553558.2A patent/CN113326654A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105894113A (zh) * | 2016-03-31 | 2016-08-24 | 中国石油天然气股份有限公司规划总院 | 一种天然气短期需求预测方法 |
CN106127360A (zh) * | 2016-06-06 | 2016-11-16 | 国网天津市电力公司 | 一种基于用户特性分析的多模型负荷预测方法 |
CN107609712A (zh) * | 2017-09-30 | 2018-01-19 | 新智能源系统控制有限责任公司 | 一种基于分类预测的能量对齐方法和装置 |
CN109993364A (zh) * | 2019-04-01 | 2019-07-09 | 北京恒华龙信数据科技有限公司 | 一种天然气用气量的预测方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114462697A (zh) * | 2022-01-28 | 2022-05-10 | 北京东方金信科技股份有限公司 | 一种城市燃气负荷预测的框架实现方法和系统 |
CN114626640A (zh) * | 2022-04-27 | 2022-06-14 | 西安建筑科技大学 | 基于特征工程和lstm神经网络的天然气负荷预测方法及系统 |
CN115081902A (zh) * | 2022-06-30 | 2022-09-20 | 国网北京市电力公司 | 基于源网荷储协同的综合规划方法、装置、设备及介质 |
CN115081902B (zh) * | 2022-06-30 | 2024-04-09 | 国网北京市电力公司 | 基于源网荷储协同的综合规划方法、装置、设备及介质 |
WO2024131236A1 (zh) * | 2022-12-23 | 2024-06-27 | 浙江苍南仪表集团股份有限公司 | 区域燃气用量预测方法、系统、设备及物联网云平台 |
CN117610720A (zh) * | 2023-11-20 | 2024-02-27 | 武汉城市数字科技有限公司 | 一种基于大数据平台和神经网络的气量负荷预测系统 |
CN117688501A (zh) * | 2024-02-03 | 2024-03-12 | 南京创蓝科技有限公司 | 一种矫正空气质量预报系统的误差方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113326654A (zh) | 一种燃气负荷预测模型的构建方法及装置 | |
CN110222882A (zh) | 一种电力系统中长期负荷的预测方法和装置 | |
WO2013102932A2 (en) | System and method facilitating forecasting, optimization and visualization of energy data for an industry | |
CN102509173B (zh) | 一种基于马尔科夫链的电力系统负荷准确预测方法 | |
CN102426674A (zh) | 一种基于马尔科夫链的电力系统负荷预测方法 | |
Gonand et al. | Estimating the impact of energy price reform on Saudi Arabian intergenerational welfare using the MEGIR-SA model | |
JP2006011715A (ja) | 資源消費量の推定方法及び装置 | |
CN106126923B (zh) | 流域梯级龙头水电站效益补偿方法及系统 | |
CN110909958A (zh) | 一种计及光伏并网功率的短期负荷预测方法 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN114372360A (zh) | 用于电力负荷预测的方法、终端及存储介质 | |
CN110866658A (zh) | 一种城市电网中长期负荷预测方法 | |
CN111738506A (zh) | 现金中心现金库存用量预测方法和装置、电子设备及介质 | |
CN113344449A (zh) | 一种预测月尺度工业需水量的方法 | |
CN115271187A (zh) | 物流中转站关键指标的预测方法、装置、设备及存储介质 | |
CN116255665A (zh) | 一种基于热网系统负荷预测的供热联控方法及系统 | |
CN114676896A (zh) | 基于时间分解改进算法的电力运行监测方法及系统 | |
CN111159154A (zh) | 一种能源数据仓库系统 | |
CN116187516A (zh) | 一种基于大数据的分析修正方法 | |
CN113435686B (zh) | 蓄热式电采暖系统评价方法及装置 | |
CN112446519A (zh) | 一种增量配电园区的用电需求预测方法及系统 | |
CN112001551A (zh) | 一种基于大用户电量信息的地市电网售电量预测方法 | |
CN118229116B (zh) | 一种基于国土空间要素的规划空间数据处理方法 | |
CN117610720A (zh) | 一种基于大数据平台和神经网络的气量负荷预测系统 | |
CN118523299A (zh) | 一种时点电量修正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210831 |
|
RJ01 | Rejection of invention patent application after publication |