CN116562583A - 一种多维度水资源供需预测方法及系统 - Google Patents
一种多维度水资源供需预测方法及系统 Download PDFInfo
- Publication number
- CN116562583A CN116562583A CN202310600211.8A CN202310600211A CN116562583A CN 116562583 A CN116562583 A CN 116562583A CN 202310600211 A CN202310600211 A CN 202310600211A CN 116562583 A CN116562583 A CN 116562583A
- Authority
- CN
- China
- Prior art keywords
- function
- water
- svm
- support vector
- vector machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 282
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012706 support-vector machine Methods 0.000 claims abstract description 141
- 239000002245 particle Substances 0.000 claims abstract description 41
- 238000005457 optimization Methods 0.000 claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 31
- 230000006870 function Effects 0.000 claims description 104
- 238000002955 isolation Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 3
- 230000007774 longterm Effects 0.000 abstract description 8
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000011160 research Methods 0.000 description 22
- 238000003973 irrigation Methods 0.000 description 13
- 230000002262 irrigation Effects 0.000 description 13
- 238000013439 planning Methods 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 11
- 241000219122 Cucurbita Species 0.000 description 10
- 235000009852 Cucurbita pepo Nutrition 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 9
- 239000008235 industrial water Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 239000003621 irrigation water Substances 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013468 resource allocation Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000019637 foraging behavior Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Business, Economics & Management (AREA)
- Computational Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Optimization (AREA)
- Tourism & Hospitality (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
Abstract
本发明公开了一种多维度水资源供需预测方法及系统,涉及需水预测技术领域,包括以下步骤:确定待预测区域在多个因素指标影响下的历史序列年的用水量数据,并利用其建立高维特征空间回归方程;通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数;根据支持向量机SVM的函数,构建支持向量机SVM;利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化后,实现对待预测区域的目标年需水量进行预测。本发明实现了准确了解目标年水资源供需形势,有利于制定针对性水资源管控措施,以最大限度提高水资源长期价值。
Description
技术领域
本发明涉及需水预测技术领域,具体为一种多维度水资源供需预测方法及系统。
背景技术
在全球气候变化、经济快速发展、城市化进程加速等因素的综合作用下,则会面临水资源短缺问题(Vairavamoorthy et al.,2008;Fan et al.,2014)。因此,为帮助区域管理者了解目标年水资源供需形势,制定针对性水资源管控措施,以最大限度提高水资源长期价值,准确预测目标年需水量至关重要(Muhammad&Amin,2015)。需水量预测通常可以分为长期(目标年预测间隔超过两年)、中期(预测间隔三个月到两年之间)、短期(预测期少于三个月)(Billings&Jones,2011)。
短期预测对于供水系统的有效运作和维护是必要的,中期预测对于就投资规划和现有水利基础设施的扩大作出战略决定是更有价值的,长期预测则有助于制定政策和战略,切实有效地运作和管理供水系统,并确定有效的节水措施(Firat et al.2009;Haqueet al.,2014a)。
需水量预测是一个非常活跃的研究领域,在水需求预测中,水需求序列的非平稳性和非线性是长期存在的一大挑战,这一问题促使许多研究提出更好的用水需求建模和预测工具,以提高整体预测可靠性。需水预测中采用了多种技术,主要方法可分为统计方法和数据驱动方法。传统的需水量预测模型通常是基于统计方法开发的(Howe&Linaweaver,1967),主要包括回归分析法、指数平滑法、趋势外推法、移动平均法等。因为区域需水量的变化通常是由一组因素驱动的,包括气象参数和社会经济因素(Arbués rt al.,2003)。合理的选择模型的输入变量也是得到准确需水量的关键一步,已有文献表明,需水量预测的影响因素可以从经济、政策和居民习惯等方面入手,对于长期预测,需要考虑的影响因素范围较广泛,包括但不限于区域的经济、气候、人口等较为宏观的信息(Tiwari&Adamowski,2013;Huang,H.et al.,2021;Ghiassi,M.et al.,2017)。因此,各种线性回归模型常用于揭示区域需水量与外部影响参数之间的潜在关系,从而根据外部参数的预测(总人口、人均GDP、城市化率等)提供需水量预测(Jain et al.,2001)。但在认识到简单线性回归模型的潜在局限性时之后,现如今已经开发了许多数据驱动的模型来提高需求预测的准确性(Donkor et al.2014)。自回归模型是一种常见的数据驱动模型,其中时间序列分析通常用于分析历史数据,且已在学术领域和工程界得到广泛应用。经学者对比验证,这些自回归模型,如自回归综合移动平均(ARIMA)模型,在预测短期城市用水需求方面可以表现出比传统线性回归模型更好的性能(Chen&Boccelli,2018;张吉英,2019)。除了自回归模型,许多其他数据驱动模型也已广泛应用于城市用水需求预测且显示出较大优势,如:人工神经网络(ANN),支持向量回归模型(SVR)和随机森林(RF)模型(Ghiassi et al.,2008;Bai et al.,2015;Chen etal.,2017)。这些先进的数据驱动模型比许多传统的预测方法表现出更好的性能。在这些预测方法中,人工神经网络是需水量预测中最广泛使用的方法之一,因为该技术相对简单且易于理解。尽管目前人工神经网络是最为常用的预测方法,但为了进一步扩展研究需水量预测可使用的方法模型,丰富其方法体系,通过总结前人学者文献资料,发现支持向量机模型结合适当的优化算法也能得到较好的预测结果。例如,Chen和Zhang(2006)使用最小二乘支持向量机模型(LS-SVM)以小时为单位预测短期需水量,得出LS-SVM模型性能优于前馈式人工神经网络(FNN-BP),这主要是因为LS-SVM基于结构风险考虑了经验、风险和置信区间的缓解措施,通过风险最小化获得更准确的预测结果。Bai等(2015)将ANN与SVR进行比较,发现RNA模型表现更好(错误率2.95%),尽管SVM模型错误率更高(5.46%)但也能满足需求。Wu和Wang(2012)评估以年度数据为样本集的支持向量机性能,发现对于数据集,评估的相对误差分别为0.91%,1.86%和0.93%,这表明SVM对于需求预测是高度准确的。Yang等人(2010)使用遗传算法优化SVM,以确定SVM的训练参数,并将此优化模型与ANN和灰色模型(GM)进行了比较,发现GA-SVM相对于ANN和GM表现良好。总之,预测方法性能的优越性往往是相对而言的,受不同预测情景下历史需水量序列的不同程度波动以及不同影响因素等的制约。
目前,一些专家学者从不同方面对城市供水量预测进行了研究。部分学者将许多新预测方法应用于水量预测,如利用灰色预测模型、实用动态模型、BP网络组合预测模型等对城市供水量进行了预测(麻凤海等,2004;王弘宇等,2004;杨斌等,2006;戢钢等,2014;方志坚等,2010)。水资源供需分析是水资源优化配置的重要内容,对实现水资源的可持续利用具有重要意义(刘丙军等,2011)。关于水资源供需分析的方法主要分为两大类,一类主要是从统计学角度(王雅竹&石炼,2013)、系统评价角度(任怡等,2017)和水资源系统分析角度(Milano M,et al.,2013)等解决水资源供需平衡,或是在系统动力学理论的基础上建立水资源SD模型,模拟研究区水资源不同方案下的供需变化趋势(XIONG,2015)。此类方法侧重于量化区域供需形势,不能较好的识别非常规水源、跨流域调水等工程在缓解区域缺水情势中所起的作用与程度。另一类是根据《全国水资源综合规划技术细则》以水资源开发利用现状及存在的问题分析为基础,依据各水平年供需水预测的成果拟订方案,进行两到三次供需水量平衡分析,提出推荐方案。三次供需平衡是现代水资源配置理论的核心,是全口径、全流域层面上的平衡计算,被广泛应用于水资源供需平衡分析(洪倩,2016;彭少明等,2014)和水资源配置研究中(付意成,2017;李文忠,2013)。
影响用水需求的因素十分复杂,包括人口、天气、用水习惯、节水意识等,前人学者在预测需水量时,多是直接预测区域用水总量或区域季节性用水总量,较少考虑对具有显著差异性的行业用水进行区分。此外,用水需求具有明显的时空特征,目前的用水需求预测模型大致可以分为两类:单因素模型和多因素模型。单因素模型主要是时间序列模型,以历史需水量数据作为其唯一输入因素,只关注需水变化曲线的自相关而不考虑其他影响因素,属于黑盒模型。多因素预测模型属于灰盒模型,探讨各种外部影响因素对用水需求的影响,适用于实际场景下复杂多变的需水量预测。机器学习算法为开发多因素预测模型提供了有效的工具,它们可以映射到高度非线性的空间并准确估计后续输出空间,具体方法包括人工神经网络(ANN)、随机森林(RF)、支持向量回归(SVR)等。在模型构建设计过程中,需要同时考虑三个目标,即模型结构应尽可能简单、模型应表现良好、计算效率应高。但由于水资源系统是一个存在着大量不确定性因素的复杂系统,预测方法性能的优越性往往是相对而言的,受不同预测情景下历史需水量序列的不同程度波动以及不同影响因素的制约,现如今还未出现公认的普适性预测模型。前人研究表明,支持向量机结合适当的优化算法在水资源需水预测中取得了较好的结果,例如,Chen和Zhang使用最小二乘支持向量机模型(LS-SVM),以小时为单位预测短期需水量,得出LS-SVM模型性能优于前馈式人工神经网络(FNN-BP)。目前我国采取的水资源分配方式是“以供定需”,水资源优化配置的直观意义就是在供水不变的情况下,充分利用有限的水资源,采用优化的技术以及方法,使得综合效益最大。因此,目标年需水量的可靠预测是实现供水可持续管理的前提,综合考量需水量的影响因素,并采取必要的政策和方案,从而实现不同区域需水量和供水量之间的平衡。
发明内容
本发明提出了一种多维度水资源供需预测方法及系统,用于实现可靠的需水量预测,并结合传统的规划年供水预测方法,分别分析现状供水条件与规划年预测供水量下的区域供需形势。
本发明提供一种多维度水资源供需预测方法,包括以下步骤:
确定待预测区域在多个因素指标影响下的历史序列年的用水量数据;
基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程;通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数;根据支持向量机SVM的函数,构建支持向量机SVM;
利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化;
利用优化后的支持向量机SVM对待预测区域的目标年需水量进行预测。
进一步地,所述基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程,包括:
设给定的样本数据集合为{(xi,yi),i=1,2,...,l}∈(Rd×R),其中xi为输入样本值,yi为对应的输出值;xi∈Rn样本集,n为输入变量的维度,l为样本数量;
则所建立的高维特征空间回归方程如下式(1)所示:
式中,C为惩罚因子;||ω||2为惩罚函数;ε为不敏感函数参数;
y为待拟合的预测函数值;
R(C)为结构风险函数;Lε(y)为损失函数;f(x)为基本回归函数。
进一步地,所述通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数,包括以下步骤:
通过引用松弛变量,得到:
式中,δi、δi *为隔离带上下方的松弛变量,对于任意样本,若其都在隔离带里面或边缘上,则δi=0,δi *=0,在隔离带上方则δi>0,δi *=0,在隔离带下方则δi=0,δi *>0。
φ(xi)为输入输出的映射关系;
ω和b分别为回归权重和偏置值;
引入拉格朗日乘子构造Lagrange函数,则将上式(2)转换为:
其中,ai、ai *为每个样本对应的Lagrange乘子对;
K(xi,x)为核函数;
利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数公式为:
其中,σ为核函数参数。
进一步地,所述利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化,包括:
初始化最大迭代次数、目标函数自变量数量和粒子最大速度,随机初始化粒子的速度和位置;
定义适应度函数如式(5)、(6),并利用其更新速度和位置后,更新最优解;
Vid=λVid+c1r(Pid-Xid)+c2r(Pgd-Xid) (5)
Xid=Xid+Vid (6)
其中,λ为惯性权重;c1、c2为学习因子;r为[0,1]之间的随机数;
Pid为第i个粒子搜索到的最优位置;Pgd为群体搜索到的最优位置;
Vid=(vi1,vi2,...,viD)为第i个粒子的当前速度;
Xid=(xi1,xi2,...,xiD)为第i个粒子的当前空间位置;
当达到最大迭代次数或两次迭代之间适应值的最小差值时,达到全局最优解,停止迭代并输出惩罚因子C、核函数参数σ的最优解;
将惩罚因子C、核函数参数σ的最优解带入到支持向量机SVM中,并利用待预测区域在多个因素指标影响下的历史序列年的用水量数据对支持向量机SVM进行优化训练。
进一步地,所述确定待预测区域在多个因素指标影响下的历史需水量数据,包括:
分别获取在农业、工业、生活、生态四个纬度因素指标影响下的待预测区域历史序列年的用水量数据。
本发明还提供一种多维度水资源供需预测系统,包括:
历史数据获取模块,用于确定待预测区域在多个因素指标影响下的历史序列年的用水量数据;
模型构建模块,用于基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程;通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数;根据支持向量机SVM的函数,构建支持向量机SVM;
模型优化模块,用于利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化;
数据预测模块,用于利用优化后的支持向量机SVM对待预测区域的目标年需水量进行预测。
与现有技术相比,本发明的有益效果:
本发明首先获取待预测区域在多个因素指标影响下的历史序列年的用水量数据,再将支持向量机SVM应用于较短序列年数据基础上的需水量预测,利用支持向量机SVM充分挖掘历史序列年的用水量数据中蕴含的特征,进而建立区域需水量与相关影响因素之间可靠的复杂映射关系,以此实现对目标年需水量的预测。此外,本发明将粒子群优化算法PSO应用于支持向量机SVM中惩罚因子、核函数等参数的优化选取,使支持向量机SVM性能达到最佳,克服人为主观因素,利用粒子群优化算法PSO搜寻惩罚因子、核函数等参数的最优参数组合,极大提高数据特征提取能力。本发明实现可靠的需水量预测,并结合传统的规划年供水预测方法,分别分析现状供水条件与规划年预测供水量下的区域供需形势,帮助区域管理者了解目标年水资源供需形势,制定针对性水资源管控措施,以最大限度提高水资源长期价值。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明提取的一种多维度水资源供需预测方法的流程示意图;
图2为本发明的实施例中的PSO-SVM算法流程图;
图3为本发明的实施例中的2012-2020长葫灌区总GDP与第二产业GDP统计图;
图4为本发明的实施例中的2012-2020长葫灌区总GDP与第二产业GDP统计图;
图5为本发明的实施例中的2012-2020自贡市与内江市年径流深与多年平均对照情况;
图6为本发明的实施例中的SVR与PSO-SVM模型拟合情况;
图7为本发明的实施例中的2012-2025长葫灌区需水趋势。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
随着大数据时代的到来,深度学习作为一种高效的数据挖掘方法,具有模型鲁棒性强、泛化能力高、非线性拟合能力强等优势,被广泛应用于各个领域。由于需水时间序列数据具有渐进增长趋势、季节性趋势和不确定性的非线性波动特征,其影响因素复杂多变、相互耦合,常规方法难以有效地建立彼此之间的关系,机器学习方法将有效解决这一难题。考虑不同种类用水情况以及影响因素贡献度的差异性,通过机器学习方法来代替定额法、灰色预测等传统方法,从而实现区域多维度的需水量预测,为区域供需形势分析提供数据支撑前提。
支持向量机SVM是一种基于统计学习理论的数据挖掘方法,在处理回归问题、模式识别等方面都有广泛的应用,其基本原理是通过非线性变换,将低维数据映射到高维空间,以结构风险最小化为目标寻找最大分类边界的超平面,支持小样本数据下的训练预测是SVM的特点之一。支持向量回归SVR是支持向量机的一种,其与分类型支持向量机区别主要在于SVR拓扑结构中引入了不敏感函数。支持向量回归最主要思想是利用核函数将非线性的特征向量映射到一个高维空间,在新空间内寻找最优的决策面使得所有的支持向量离该最优分决策面的距离最小。本发明将支持向量机SVM应用于较短序列年数据基础上的需水量预测,充分挖掘历年数据中蕴含的特征,进而建立区域需水量与相关影响因素之间可靠的复杂映射关系,以此实现对目标年需水量的预测。基于此,支持向量机SVM中超参数的选择尤其重要,决定了模型拟合能力以及泛化能力的好坏,但对于超参数的选择,大多凭借经验或者大量实验来进行设置,但这种方式很难使模型性能达到最佳,而优化算法能克服人为主观因素,搜寻超参数的最优参数组合,极大提高数据特征提取能力。粒子群优化PSO算法是一种典型的智能优化算法,该算法模拟鸟群觅食行为的原理,利用群体智能建立模型,具有优化性能好、操作简单、容易实现的优点。本发明将PSO-SVM应用于区域多维度需水量预测研究中,实现可靠的需水量预测,并结合传统的规划年供水预测方法,分别分析现状供水条件与规划年预测供水量下的区域供需形势,帮助区域管理者了解目标年水资源供需形势,制定针对性水资源管控措施,以最大限度提高水资源长期价值。
实施例1
如图1,本发明提供一种多维度水资源供需预测方法,包括以下步骤:
步骤S1:确定待预测区域在多个因素指标影响下的历史序列年的用水量数据;
步骤S2:基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程;通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数;根据支持向量机SVM的函数,构建支持向量机SVM;
步骤S3:利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化;
步骤S4:利用优化后的支持向量机SVM对待预测区域的目标年需水量进行预测。
在步骤S1中,确定待预测区域在多个因素指标影响下的历史需水量数据,包括:
分别获取在农业、工业、生活、生态四个纬度因素指标影响下的待预测区域历史序列年的用水量数据。
在步骤S2中,支持向量机SVM可拓展为支持向量回归SVR再解决回归问题,被广泛用于建立根据已发生事件预测未来数据的预测模型,支持向量回归SVR基于结构风险最小化原则,引入了特征空间和核函数的概念,将非线性问题通过核函数升高维度转化为线性问题,即通过寻找一个到所有训练样本距离最小的超平面的方式来简化问题。
在步骤S2中基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程,包括:
设给定的样本数据集合为{(xi,yi),i=1,2,...,l}∈(Rd×R),其中xi为输入样本值,yi为对应的输出值;xi∈Rn样本集,n为输入变量的维度,l为样本数量;
则所建立的高维特征空间回归方程如下式(1)所示:
式中,C为惩罚因子;||ω||2为惩罚函数;ε为不敏感函数参数;
y为待拟合的预测函数值;
R(C)为结构风险函数;Lε(y)为损失函数;f(x)为基本回归函数。
在步骤S2中,通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数,包括以下步骤:
通过引用松弛变量,得到:
式中,δi、δi *为隔离带上下方的松弛变量,对于任意样本,若其都在隔离带里面或边缘上,则δi=0,δi *=0,在隔离带上方则δi>0,δi *=0,在隔离带下方则δi=0,δi *>0。
φ(xi)为输入输出的映射关系;
ω和b分别为回归权重和偏置值;
引入拉格朗日乘子构造Lagrange函数,则将上式(2)转换为:
其中,ai、ai *为每个样本对应的Lagrange乘子对;
K(xi,x)为核函数;通过选择合适的核函数,不仅能提高预测模型的精度,而且能降低随机噪声对预测模型的影响和运算量。
选取对样本要求低、应用广泛、灵活性高且收敛域较宽的高斯径向基核函数为例,利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数公式为:
其中,σ为核函数参数,其与惩罚因子C是直接影响支持向量机SVM预测性能的两个重要超参数。
在步骤S3中,为了提高支持向量机SVM精度,应用粒子群优化算法PSO来搜索最佳的惩罚因子C、核函数参数σ,避免拟合过程中易陷入局部最优解的问题。
粒子群优化算法PSO的基本思想是利用群体中个体之间的合作和信息共享来寻找最优解。它被初始化为一组随机粒子,然后通过迭代找到最优解,在每次迭代中,通过跟踪两个极值Pgd和Pid来更新粒子,使用网格搜索大致确定支持向量机SVM的参数范围,具体设置为[e-8,e8]、[e-8,e8],算法流程如图2所示,则利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化,算法步骤如下:
步骤S3.1:初始化最大迭代次数、目标函数自变量数量和粒子最大速度,随机初始化粒子的速度和位置;
步骤S3.2:定义适应度函数如式(5)、(6),并利用其更新速度和位置后,更新最优解;
Vid=λVid+c1r(Pid-Xid)+c2r(Pgd-Xid) (5)
Xid=Xid+Vid (6)
其中,λ为惯性权重;c1、c2为学习因子;r为[0,1]之间的随机数;
Pid为第i个粒子搜索到的最优位置(局部最优);Pgd为群体搜索到的最优位置(全局最优);
Vid=(vi1,vi2,...,viD)为第i个粒子的当前速度;
Xid=(xi1,xi2,...,xiD)为第i个粒子的当前空间位置;
步骤S3.3:当达到最大迭代次数或两次迭代之间适应值的最小差值时,达到全局最优解,停止迭代并输出惩罚因子C、核函数参数σ的最优解;
步骤S3.4:对待预测区域在多个因素指标影响下的历史序列年的用水量数据进行离散及归一化处理,将惩罚因子C、核函数参数σ的最优解带入到支持向量机SVM中,再利用离散及归一化处理后数据对支持向量机SVM进行优化训练。
步骤S4:将待预测地区的目标年的年份的多个因素指标数据集进行离散及归一化处理后,输入到训练后的支持向量机SVM中,再对所输出的数据反归一化处理并重构即获得最终拟合及预测的目标年需水量。
实施例2
本发明还提供一种多维度水资源供需预测系统,包括:
历史数据获取模块,用于确定待预测区域在多个因素指标影响下的历史序列年的用水量数据;
模型构建模块,用于基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程;通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数;根据支持向量机SVM的函数,构建支持向量机SVM;
模型优化模块,用于利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化;
数据预测模块,用于利用优化后的支持向量机SVM对待预测区域的目标年需水量进行预测。
下面结合具体的实施例对本发明中的技术方案做具体实施方式的说明。
本实施例旨在针对典型研究区特点,从农业、工业、生活、生态多维度出发建立一种长期需水量预测方法。考虑研究区不同类别用水的影响因素,结合2012—2020的年度经济、社会和环境等方面的相关指标数据和年度实际用水量,利用支持向量机SVM、粒子群优化算法PSO建立基于PSO-SVM的农业、工业、生活、生态四个维度的需水预测模型,对研究区2025年需水量做出预测,并结合供水量预测值分析规划年供需形势。
本实施例的研究框架如图3所示,具体包括以下4个步骤:
①提取研究区2012-2020年农业、工业、生活、生态四个维度的需水量相关影响因素数据。
②将样本集划分成训练集和验证集,构建支持向量机SVM,并使用粒子群优化算法PSO对超参数惩罚因子C、核函数参数σ进行优化。
③将PSO-SVM模型与SVR模型进行性能对比,通过对样本的拟合程度和RMSE、R2两个评价指标对模型的精确度和鲁棒性进行评估。
④通过本发明构建的基于PSO-SVM需水量预测模型,结合从关于2025年规划文件中收集所得的影响因素数据,预测研究区2025农业、工业、生活、生态需水量。
根据区域水源工程系统现状与2025年前的供水工程发展规划,预测2025年区域可供水量,并在此基础上作出典型区域的供需水形势分析。
1、数据情况:
本实施例以长葫灌区作为典型区域开展水资源需水预测研究,从水资源合理配置的公平性原则出发,将灌区内用水部门划分成农业、工业、生活、生态四个类别,结合研究区的社会经济结构实际情况和数据的可获得性,基于科学性、完整性的原则,较为全面的收集了长葫灌区2012-2020年的农业、工业、生活、生态四个维度的用水数据,建立了需水量预测指标体系。
(1)农业
灌溉用水占农业用水绝大部分的比重,而灌溉用水量又受土壤、水文地质、气候条件、灌溉面积、作物种植情况等因素影响。因此,选取粮食产量、有效灌溉面积、农作物播种面积、种植结构这四个因素作为农业需水量预测的影响因素。
其中,种植结构采用公式(7)进行定量化,即种植结构指数:
式中,ai为作物i的灌溉定额,为第j年作物i的种植面积,y(j)为定量化后的种植结构数,其可体现不同的种植结构下作物整个生长周期所需灌溉用水的差异性。经计算,研究区农作物种植结构指数表示如下表1所示。从表中可以看出,数据波动程度不大,最大值20706.64,最小值19002.33。
表1 2012-2020年种植结构指数计算结果
年份 | 种植结构指数 | 年份 | 种植结构指数 |
2012 | 20333.37 | 2017 | 19054.8 |
2013 | 19920.99 | 2018 | 20556.89 |
2014 | 20105.98 | 2019 | 20706.64 |
2015 | 20231.77 | 2020 | 19002.33 |
2016 | 20487.3 |
(2)工业
综合工业用水量相关的报告和文献,结合研究区的实际概况,选取了工业总产值、第二产业占比、工业增加值、工业固定投资增长率、规模工业总产值五个影响因素。其中,根据如下图4所示的总GDP与第二产业GDP统计情况可知,随着第二产业GDP的下降,地区总GDP增长乏力,这表明以工业为主的第二产业波动是关键。
(3)生活
因城镇、农村之间的用水差异较为明显,基于科学性、公平性、完整性的原则,选取人均GDP、人口密度、人均用水量、城镇居民可支配收入、农村居民可支配收入五个影响因素,并做出与需水量正负相关性的初步判定,如下表2所示。人口密度、人均用水量可较为直接地反映研究区居民用水量情况,人均GDP、城镇居民可支配收入、农村居民可支配收入则反映了当地经济发展水平,以及农村与城镇居民的生活条件,这些评价指标都与生活需水量呈正相关。
表2生活用水评价指标
序号 | 影响因素 | 单位 | 正负向 |
1 | 人均GDP | 万元 | 正向指标 |
2 | 人口密度 | 人/平方公里 | 正向指标 |
3 | 人均用水量 | 升/日 | 正向指标 |
4 | 城镇居民可支配收入 | 元 | 正向指标 |
5 | 农村居民可支配收入 | 元 | 正向指标 |
(5)生态
生态用水主要是指生态环境补水,是生态系统修复的重要举措。研究区河道内和河道外生态环境需水主要由灌区降雨和天然径流解决,再加以长葫水库的水资源作为补充。因此,实施例结合研究区的区域特点,以径流深、绿地面积、降雨量作为衡量生态需水量的指标。由于未收集到研究区径流深的直接数据,通过研究区所包含在的自贡市和内江市的多年平均径流深和历年径流增减率(如图4)估算,两个行政区的年径流量与多年平均比较的增减变化有所不同,因此,对两个行政区的年径流量取均值作为研究区径流深估算值。
2、PSO-SVM需水量预测模型的参数设置
标准的支持向量机SVM选择合适的核函数和超参数依赖于试错的过程,是一种耗时的方法,非线性支持向量机SVM将非线性输入空间映射到高维特征空间所涉及的固有复杂性,使其行为不容易理解和解释,训练速度较慢。粒子群优化算法PSO和支持向量机SVM组合预测方法的引入,可以减少由参数或模型错误识别带来的预测误差。设定粒子群初始参数如下表3所示:
表3粒子群优化算法初始参数设置
参数类型 | 参数取值 |
最大迭代次数 | 50 |
粒子群规模n | 40 |
局部搜索能力c1 | 1.5 |
全局搜索能力c2 | 1.8 |
采用表3中的粒子群初始参数,首先由试验法初步确定C的取值范围和核函数,再采用粒子群优化算法PSO,通过五折交叉验证,找到最优超参数,如表4中数据所示:
表4 PSO-SVM模型超参数表
结合上表中优化所得的超参数可知:农业需水预测模型中,当迭代次数大于25次时,模型均方误差MSE趋于稳定,即模型至最优状态,此时可得到最优的参数C=124;
工业需水预测模型中,迭代次数大于26时,模型的均方误差趋于稳定且数值较小,此时得到优化后的参数组合C=64,σ=0.13971;
生活需水预测模型中,迭代次数大于11时,得到优化后的参数C=213;
生态需水预测模型中,迭代次数大于25时,得到优化后的参数组合为C=467,σ=131.447。
3、SVR需水量预测模型与PSO-SVM需水量预测模型性能比较
将参数优化后的PSO-SVM需水量预测模型和传统的SVR需水量预测模型应用于2012-2020年四个维度的需水量预测,并将预测值与实际值之间的拟合情况可视化,如图5所示。
从图5可知:工业维度PSO-SVM拟合情况明显优于SVR,生活维度SVR与PSO-SVM模型拟合程度相近,以至于不易直接得出哪一模型更优的结论,对农业和生态而言,由于实际值波动幅度较大,拟合数据在一些样本点与实际值差距较大,不易由以上拟合折线图确定哪个模型性能更优。因此,为进一步衡量两个模型的需水量预测性能,使用定量化评价指标均方根误差RMSE、决定系数R2评价两种模型在这四个维度上的综合性能,计算结果如下表5所示。可以看出,PSO-SVM模型在四个维度的评价值都优于SVR模型,其中,农业、工业、生活维度的PSO-SVM的R2都大于0.65,意味着预测数据和真实数据之间具有较强的相关性,并且RMSE相较于SVR模型更低,即实际值与预测值间具有更小的差异。
表5模型性能评价结果表
4、基于PSO-SVM需水量预测模型的目标年多维度需水量预测
由上述确定的参数构建基于PSO-SVM的需水量预测模型,将此模型应用到典型区域2025年用水量预测中,确定相关指标的值后将其输入训练好的PSO-SVM需水量预测模型中,预测出2025年长葫灌区的农业、工业、生活、生态需水量以及总需水量,另外用分段3次埃尔米特插值法(PCHIP)大致确定2021—2024年的各行业需水量数值,进行加和绘制现阶段到目标年的需水量趋势图,见图6。由图6可知,目标年需水量预测值较现状年小幅度下降。分部门而言:
(1)农业多年平均需水量约1391万m3,预测2021-2025需水量呈逐年减少趋势,目标年农业需水量低于多年平均值。长葫灌区作为水资源匮乏地区,近年来严控农业用水量,推进由传统耕园向产业园的转型,推广低耗水、高效益作物,提高地方农业经济产值的同时也将减轻当地的水资源负担。
(2)工业需水量与总需水量历年变化趋势相当,总体呈现较为周期性的阶梯上涨趋势,目标年预测值处于平台阶段,与现状年相比稍有减少。研究区内的威远县是中国西南地区重要的重工业基地,在区域水资源匮乏的背景下,必须通过强化工业节水改造,在保障工业生产的基础前提下最大限度实现工业节水减排。
(3)生活用水是所有部门中需水最多的,且近年来需水量呈现上涨趋势,目标年需水预测值也有所增多,但增长速度(1.47%)较多年平均增长速度(2.41%)有所放缓。
(4)历年生态需水量整体呈上涨趋势,在2020年达到多年生态需水量峰值后,目标年预测值明显减小。生态基本需水量主要用于维持水生生物的正常生长,满足局部盐分排放、入渗供应、污染自净等要求,因此生态需水量会根据不同水文保证率呈现波动。
5、可供水量预测与供需形势分析
长葫水库历年来水量持续减少,经统计,长葫水库1981-2021多年平均系列年来水量8990万m3,2002-2018年多年平均来水量仅7991万m3,预计规划年可供水量1405万m3。主要用于农业和生态需水的小型水库按需水过程供水,根据现状年数据,总可供水量为2631万m3。综上,长葫灌区规划年预计可供水量为12027万m3,去除当地微小型水利设施可供水量后,剩余可供水量为9396万m3。
为进一步了解分时段供需水情况,以此将规划年预计可供水量和需水量按以往经验调配到农业、工业、生活、生态四个维度的各时段,并计算月份缺水情况,其中,由于可用水量预测值中有2631万m3为小型水利设施供水,水质较难保障、取水设施效率较低,所以仅将其部分计划用于农业、生活(多为农村畜牧养殖用水和非食用的生活用水)以及生态供水由于如下表6所示:
由上表6可知,农业供水主要集中在4、5月春灌,规划年未出现缺水情况且供水相对富余;每月工业供水量、需水量都较为均衡,4~10月是工业生产的旺季,因此相应供需水量对比起其他月份有所上涨,并且工业缺水最为严重的月份缺水量达24万m3(9月),占该月需水量的12.3%;生活用水从逐月数据可以看出,夏季供需水量明显增多,每年用水高峰月份集中在6~10月,在非生活用水高峰月中,4月份缺水情况较为明显,推测部分原因是为了保证区内春灌供水,完成规划面积水稻满栽满插目标,适当压缩包括生活供水在内的去其他类别供水量;生态供水、需水以及缺水情况主要集中在冬春两季,这是受灌区自然降雨时空分布不均的影响,冬春两季降雨较少,夏季雨量较为充沛,上表中各月生态供需水数据也印证了这一客观规律。
表6灌区规划年多年平均月供需水分析表
本发明考虑了不同行业需水量以及相关影响因素贡献度的差异性,从农业、工业、生活、生态多维度开展需水量预测和可供水量预测,并在预测结果基础之上进行供需水形式分析。需水量预测方法是本发明着重强调的内容,在传统的支持向量机SVM方法基础上使用粒子群优化算法PSO进行超参数优化,所构建的PSO-SVM需水量预测模型对需水预测输入数据要求较小,训练过程中对样本集的拟合程度和基于RMSE、R2评价指标的综合性能评价结果充分表明在多维度视角下使用PSO-SVM需水量预测模型预测区域需水量具有可靠性和可行性,具有较大的推广应用前景。
最后说明的是:以上公开的仅为本发明的一个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (6)
1.一种多维度水资源供需预测方法,其特征在于,包括以下步骤:
确定待预测区域在多个因素指标影响下的历史序列年的用水量数据;
基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程;通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数;根据支持向量机SVM的函数,构建支持向量机SVM;
利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化;
利用优化后的支持向量机SVM对待预测区域的目标年需水量进行预测。
2.根据权利要求1所述的一种多维度水资源供需预测方法,其特征在于:所述基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程,包括:
设给定的样本数据集合为{(xi,yi),i=1,2,...,l}∈(Rd×R),其中xi为输入样本值,yi为对应的输出值;xi∈Rn样本集,n为输入变量的维度,l为样本数量;
则所建立的高维特征空间回归方程如下式(1)所示:
式中,C为惩罚因子;||ω||2为惩罚函数;ε为不敏感函数参数;
y为待拟合的预测函数值;
R(C)为结构风险函数;Lε(y)为损失函数;f(x)为基本回归函数。
3.根据权利要求2所述的一种多维度水资源供需预测方法,其特征在于:所述通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数,包括以下步骤:
通过引用松弛变量,得到:
式中,δi、δi *为隔离带上下方的松弛变量,对于任意样本,若其都在隔离带里面或边缘上,则δi=0,δi *=0,在隔离带上方则δi>0,δi *=0,在隔离带下方则δi=0,δi *>0。
φ(xi)为输入输出的映射关系;
ω和b分别为回归权重和偏置值;
引入拉格朗日乘子构造Lagrange函数,则将上式(2)转换为:
其中,ai、ai *为每个样本对应的Lagrange乘子对;
K(xi,x)为核函数;
利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数公式为:
其中,σ为核函数参数。
4.根据权利要求1所述的一种多维度水资源供需预测方法,其特征在于:所述利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化,包括:
初始化最大迭代次数、目标函数自变量数量和粒子最大速度,随机初始化粒子的速度和位置;
定义适应度函数如式(5)、(6),并利用其更新速度和位置后,更新最优解;
Vid=λVid+c1r(Pid-Xid)+c2r(Pgd-Xid) (5)
Xid=Xid+Vid (6)
其中,λ为惯性权重;c1、c2为学习因子;r为[0,1]之间的随机数;
Pid为第i个粒子搜索到的最优位置;Pgd为群体搜索到的最优位置;
Vid=(vi1,vi2,...,viD)为第i个粒子的当前速度;
Xid=(xi1,xi2,...,xiD)为第i个粒子的当前空间位置;
当达到最大迭代次数或两次迭代之间适应值的最小差值时,达到全局最优解,停止迭代并输出惩罚因子C、核函数参数σ的最优解;
将惩罚因子C、核函数参数σ的最优解带入到支持向量机SVM中,并利用待预测区域在多个因素指标影响下的历史序列年的用水量数据对支持向量机SVM进行优化训练。
5.根据权利要求1所述的一种多维度水资源供需预测方法,其特征在于:所述确定待预测区域在多个因素指标影响下的历史需水量数据,包括:
分别获取在农业、工业、生活、生态四个纬度因素指标影响下的待预测区域历史序列年的用水量数据。
6.一种多维度水资源供需预测系统,其特征在于:包括:
历史数据获取模块,用于确定待预测区域在多个因素指标影响下的历史序列年的用水量数据;
模型构建模块,用于基于多个因素指标及历史序列年的用水量数据,建立高维特征空间回归方程;通过在高维特征空间的回归方程中引入松弛变量、拉格朗日乘子,得到拉格朗日函数;利用卡罗需库恩塔克KKT条件将拉格朗日函数转换为支持向量机SVM的函数;根据支持向量机SVM的函数,构建支持向量机SVM;
模型优化模块,用于利用粒子群优化算法PSO对支持向量机SVM中的惩罚因子、核函数参数进行优化;
数据预测模块,用于利用优化后的支持向量机SVM对待预测区域的目标年需水量进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310600211.8A CN116562583A (zh) | 2023-05-25 | 2023-05-25 | 一种多维度水资源供需预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310600211.8A CN116562583A (zh) | 2023-05-25 | 2023-05-25 | 一种多维度水资源供需预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116562583A true CN116562583A (zh) | 2023-08-08 |
Family
ID=87494492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310600211.8A Pending CN116562583A (zh) | 2023-05-25 | 2023-05-25 | 一种多维度水资源供需预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116562583A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116739187A (zh) * | 2023-08-10 | 2023-09-12 | 长江三峡集团实业发展(北京)有限公司 | 水库优化调度决策方法、装置、计算机设备及存储介质 |
CN117196115A (zh) * | 2023-09-25 | 2023-12-08 | 中国科学院西北生态环境资源研究院 | 一种用水紧张程度的预测方法 |
CN117236552A (zh) * | 2023-08-17 | 2023-12-15 | 长江勘测规划设计研究有限责任公司 | 一种基于多层级指标体系的区域需水量预测方法 |
CN118246605A (zh) * | 2024-05-20 | 2024-06-25 | 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) | 一种基于arima模型的农村地区需水量预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715292A (zh) * | 2015-03-27 | 2015-06-17 | 上海交通大学 | 基于最小二乘支持向量机模型的城市短期用水量预测方法 |
CN109968355A (zh) * | 2019-03-08 | 2019-07-05 | 北京工业大学 | 一种仿人机器人步态平衡模型建立的方法 |
CN111539156A (zh) * | 2020-05-08 | 2020-08-14 | 安徽工业大学 | 一种基于dp-pso-svr的齿廓偏差测量方法 |
CN112308288A (zh) * | 2020-09-29 | 2021-02-02 | 百维金科(上海)信息科技有限公司 | 一种基于粒子群优化lssvm的违约用户概率预测方法 |
-
2023
- 2023-05-25 CN CN202310600211.8A patent/CN116562583A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715292A (zh) * | 2015-03-27 | 2015-06-17 | 上海交通大学 | 基于最小二乘支持向量机模型的城市短期用水量预测方法 |
CN109968355A (zh) * | 2019-03-08 | 2019-07-05 | 北京工业大学 | 一种仿人机器人步态平衡模型建立的方法 |
CN111539156A (zh) * | 2020-05-08 | 2020-08-14 | 安徽工业大学 | 一种基于dp-pso-svr的齿廓偏差测量方法 |
CN112308288A (zh) * | 2020-09-29 | 2021-02-02 | 百维金科(上海)信息科技有限公司 | 一种基于粒子群优化lssvm的违约用户概率预测方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116739187A (zh) * | 2023-08-10 | 2023-09-12 | 长江三峡集团实业发展(北京)有限公司 | 水库优化调度决策方法、装置、计算机设备及存储介质 |
CN116739187B (zh) * | 2023-08-10 | 2024-01-09 | 长江三峡集团实业发展(北京)有限公司 | 水库优化调度决策方法、装置、计算机设备及存储介质 |
CN117236552A (zh) * | 2023-08-17 | 2023-12-15 | 长江勘测规划设计研究有限责任公司 | 一种基于多层级指标体系的区域需水量预测方法 |
CN117196115A (zh) * | 2023-09-25 | 2023-12-08 | 中国科学院西北生态环境资源研究院 | 一种用水紧张程度的预测方法 |
CN118246605A (zh) * | 2024-05-20 | 2024-06-25 | 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) | 一种基于arima模型的农村地区需水量预测方法 |
CN118246605B (zh) * | 2024-05-20 | 2024-08-30 | 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) | 一种基于arima模型的农村地区需水量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
CN116562583A (zh) | 一种多维度水资源供需预测方法及系统 | |
Tian et al. | Predictive model of energy consumption for office building by using improved GWO-BP | |
CN106951980B (zh) | 一种基于rcp情景的水库群适应性调度方法 | |
CN112765800A (zh) | 一种分布式水资源配置模型的设计方法 | |
CN104715292A (zh) | 基于最小二乘支持向量机模型的城市短期用水量预测方法 | |
Song et al. | Estimate the daily consumption of natural gas in district heating system based on a hybrid seasonal decomposition and temporal convolutional network model | |
CN112182951B (zh) | 一种考虑多重不确定性的土地利用规划方法 | |
CN102495937A (zh) | 一种基于时间序列的预测方法 | |
CN111598724B (zh) | 一种中小水库入库流量日前预测的分时段集成方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
Song et al. | An indoor temperature prediction framework based on hierarchical attention gated recurrent unit model for energy efficient buildings | |
CN105868887A (zh) | 一种基于分项计量的楼宇综合能效分析方法 | |
CN107748940A (zh) | 一种节电潜力量化预测方法 | |
Sun et al. | Predicting and Analyzing CO 2 Emissions Based on an Improved Least Squares Support Vector Machine. | |
Zheng et al. | A factor analysis and self-organizing map based evaluation approach for the renewable energy heating potentials at county level: A case study in China | |
CN118095034B (zh) | 基于水文模型与lstm双重耦合的取用水活动影响下的水文预报方法及系统 | |
Wang | Application of fuzzy linear programming model in agricultural economic management | |
CN109214610A (zh) | 一种基于长短期记忆神经网络的饱和电力负荷预测方法 | |
Shen et al. | Short-term load forecasting based on multi-scale ensemble deep learning neural network | |
CN117236552A (zh) | 一种基于多层级指标体系的区域需水量预测方法 | |
WO2023245399A1 (zh) | 基于土地系统和气候变化耦合的水稻生产潜力模拟方法 | |
CN116485582A (zh) | 一种基于深度学习的供热优化调控方法及装置 | |
CN116128154A (zh) | 一种农业园区综合能源系统的能源优化配置方法及装置 | |
CN113836807B (zh) | 一种基于熵值法和长短期记忆神经网络的河湖生态流量预报预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |