CN116821816A - 一种基于加权随机森林的干热风预测方法 - Google Patents
一种基于加权随机森林的干热风预测方法 Download PDFInfo
- Publication number
- CN116821816A CN116821816A CN202310565412.9A CN202310565412A CN116821816A CN 116821816 A CN116821816 A CN 116821816A CN 202310565412 A CN202310565412 A CN 202310565412A CN 116821816 A CN116821816 A CN 116821816A
- Authority
- CN
- China
- Prior art keywords
- value
- decision tree
- random forest
- hot air
- dry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000003066 decision tree Methods 0.000 claims description 48
- 238000004422 calculation algorithm Methods 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000000875 corresponding effect Effects 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 230000035772 mutation Effects 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000002596 correlated effect Effects 0.000 claims description 2
- 230000002688 persistence Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 241000209140 Triticum Species 0.000 description 25
- 235000021307 Triticum Nutrition 0.000 description 25
- 230000002354 daily effect Effects 0.000 description 13
- 230000006872 improvement Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 208000009084 Cold Injury Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002595 cold damage Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/02—Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
- G01W1/06—Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed giving a combined indication of weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Environmental & Geological Engineering (AREA)
- Business, Economics & Management (AREA)
- Mining & Mineral Resources (AREA)
- Strategic Management (AREA)
- Animal Husbandry (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Marine Sciences & Fisheries (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Agronomy & Crop Science (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于加权随机森林的干热风预测方法,属于农业技术领域,本方案通过特征筛选、参数寻优以及加权随机森林模型的构建提高了对小麦干热风气象灾害发生规律的预测精度,从而根据预测结果及时采取有效措施,减轻干热风对小麦产量的影响,对冬小麦安全生产、防灾减损和提质增效具有重要意义。
Description
技术领域
本发明涉及农业技术领域,具体涉及一种基于加权随机森林的干热风预测方法。
背景技术
干热风是一种出现在小麦生育后期的一种由高温、低湿并伴有一定风力的环境因素引起的农业气象灾害,是对北方冬小麦籽粒灌浆造成严重影响的主要农业气象灾害之一,严重时可造成十分之一以上的减产,近年来全球气温升高,导致小麦生育进程加快,极端气候频发,春季冷害以及夏季干热概率增加,严重影响小麦产量的稳定;
我国对于干热风的相关研究开始于20世纪50年代后期,20世纪80年代初,北方13省(市)小麦干热风科研协作组针对干热风伤害机理、气象指标、气候区划、预报方法、防御技术等进行了联合攻关,为后来开展相关研究奠定了基础;
但是目前在对小麦干热风灾害预测模型方面,缺少针对相关地域性的模型,大多是大面积气象类的单一预测或者是基于GIS的宏观预测模型,利用计算机技术对小麦干热风灾害的预测具有相对滞后性,结合多年灾害数据和物联网采集数据对小麦干热风灾害预测预警模型相对较少,还无法较好的掌握对干热风气象灾害发生规律的判断与干热风的精准预测,无法实现对小麦的安全生产、防灾减损、提质增效做出进一步的积极贡献;
鉴于以上,本方案提供一种基于加权随机森林的干热风预测方法。
发明内容
针对上述情况,为克服现有技术之缺陷,本发明提供一种基于加权随机森林的干热风预测方法,本方案通过特征筛选、参数寻优以及加权随机森林模型的构建提高了对小麦干热风气象灾害发生规律的预测精度,对冬小麦安全生产、防灾减损和提质增效具有重要意义。
一种基于加权随机森林的干热风预测方法,其特征在于,包括以下步骤:
S1:对随机森林算法中决策树权重取舍进行改进,并构建加权随机森林模型;
S2:把干热风与模型所输入各特征间的Spearman、Pearson相关系数及其均值绝对值先计算出来;
S3:以随机森林算法为理论依据,将变量重要性依次计算出来,并且每个变量重要性均值;
S4:剔除变量重要性均值、相关系数均值全部小于预设值的部分特征,以余下特征为依据构建新输入特征组;
S5:将样本数据划分为训练集和测试集,在模型内放入训练集数据信息,以持续性性能参数调节为支撑展开可决系数R2波动观察,找出各性能参数最优值。
上述技术方案有益效果在于:
本方案通过特征筛选、参数寻优以及加权随机森林模型的构建提高了对小麦干热风气象灾害发生规律的预测精度,从而根据预测结果及时采取有效措施,减轻干热风对小麦产量的影响,对冬小麦安全生产、防灾减损和提质增效具有重要意义。
附图说明
图1为本发明1981-2022年滑县小麦干热风发生及分布情况示意图;
图2本发明各影响因素与干热风等级之间的相关散点图;
图3为本发明可决系数R2随各参数取值变化曲线图;
图4为本发明可决系数R2随迭代次数变化曲线图;
图5为本发明各算法可决系数R2随迭代次数变化曲线图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例,以下结合附图对本发明进行详细的描绘,然而应当理解,附图的提供仅为了更好的理解本发明,它们不应该理解成对本发明的限制。
本方案选用河南省安阳市滑县1981-2022年的日最高温度、14时相对温度、日最低温度、日温差、14时相对湿度和14时风速等数据作为研究对象,由于在河南省地区,干热风对冬小麦的影响时期一般在小麦生长后期,即开花灌浆期,所以模型建立时,采用了每年5月10日至6月10日的天数做为样本,并且将样本数据集按8:2划分为训练集和测试集,建立加权随机森林预测模型;
一、干热风预测方法
1.1构建加权随机森林预测模型
从回归问题处理实践来看,随机森林算法大多认为单一决策树性能无差异,基于决策树性能改进、随机森林模型预测精度提升需要,随机森林中的决策树占比应有所提升,基于此,对其决策树权重取舍进行相应改进,具体如下:
确立决策树误差,即实际点与训练集上各决策树预测点间距离方差,决策树误差的倒数同步求出;
利用全部决策树误差倒数总和除以单棵决策树误差倒数,获得单棵决策树权重;
以单棵决策树输出结果为基本支撑,加权处理输出结果,就此将最终预测结果获取;
加权随机森林算法(基于决策树误差)形成,公式(1)即为随机回归森林权重计算方程:
式(1)中,
第i棵决策树权重为w(i);
决策树预测点与训练集实际点(第i棵决策树中)偏差的方差为δ2(i),且该决策树预测环节稳定性、权重与δ2(i)呈负相关关系;
随机森林回归算法的预测值表示为:
式(2)中,Yx为第x棵决策树的预测值
1.2基于相关性分析的特征选择
本次模型输入特征采用的参数指标包括日温差、日最低(高)温度和14:00的风速、相对湿度值、相对温度;
具体求解程序如下:
把小麦干热风与各特征间的Spearman、Pearson相关系数及其均值绝对值先计算出来;
以随机森林算法为理论依据,将变量重要性依次计算出来,并取每个变量重要性均值;
剔除变量重要性均值、相关系数均值全部小于预设值的部分特征,以余下特征为依据构建出新输入特征组;
小麦干热风预测模型的核心环节主要就在于特征选择:
(1)Pearson相关系数(RP)
设X、Y这两个变量服从正态分布,xi、yi(in=1,2,...,n)分别为X、Y的观测值;
据此获得如公式(3)所示的Pearson相关系数RP(X、Y)的求解方程:
式(3)中,和/>表示样本均值,RP的取值范围:-1≤RP≤1;
(2)Spearman相关系数(RS)
RS基于秩次计算,其计算公式为:
式(4)中,Ri和Oi表示xi和yi的秩次差,n为样本的个数,且满足-1≤RS≤1。
1.3参数寻优
从随机森林算法方面来看,预测结果会明显受到算法性能参数取值波动的影响,因此,重要性能参数寻优至关重要,可以有效提升预测结果;
寻优时,将各性能参数最优值分别找出来,组合数个性能参数最优值,模型精度即能获得有效提升,在模型内放进训练集数据信息(数据划分已完成),以持续性性能参数调节为支撑展开可决系数R2波动状态观察,如果R2最大,最优参数组合即为对应的性能参数;
共有17个参数会对随机森林算法性能构成影响,基于算法运算效率与时间考虑,本文参数寻优对象为影响最突出的4个参数,即最大迭代次数、决策树最大深度、内部节点拆分最小样本数和叶子节点所需的最小样本数;
(1)最大迭代次数(n_estimators)
随机森林内部的决策树数量即所谓最大迭代次数。随机森林算法的性能通常会更多的依赖于最大迭代次数取值,取值太小,通常会导致模型欠拟合问题出现,难以获得理想的模型预测效果;问题在于,取值增大虽然可以同步提高算法精度,但也需要更多的时间来求解,会降低计算效率,尤其在取值太高条件下,模型过拟合情况有可能出现。
(2)决策树最大深度(max_depth)
关于决策树最大深度取值,随机森林对其并无约束,通常将默认值NONE作为决策树最大深度值,本质来看,数据量很少或特征不足前提下运行算法更适宜采用默认值,决策树最大深度值在特征较多、数据量大条件下应进行相的调节,只有如此,才能与模型相吻合。
(3)内部节点拆分最小样本数(min_samples_split)
决策树有没有再次划分必要,应通过内部节点拆分最小样本数来形成判断。内部节点拆分最小样本数如果超过节点样本数时,决策树不应再次划分,样本量不大时,内部节点拆分最小样本数通常采用的是默认值2;样本量大时,内部节点拆分最小样本数取值应进行相应的调节。
(4)叶子节点所需的最小样本数(min_samples_leaf)
叶子节点究竟需不需要剪枝,应以叶子节点所需的最小样本数为依据做出判断决策,叶子节点所需的最小样本数如果大于叶子节点样本数,必需剪枝。样本量不大时,叶子节点所需的最小样本数一般采用默认值1;反之,叶子节点所需的最小样本数取值应调节,从随机森林算法上来看,其预测准确程度直接取决于参数取值,发现最优参数组合(基于算法重要参数寻优)有助于模型预测准确性提升,在模型中输入训练数据集信息,对参数组合进行持续调节,模型预测精度用可决系数R2表示,最大R2只要被搜索到,该模型最优参数组合即为对应于R2的参数组合。
以下为其具体程序过程:
①将需调节指标选出,将取值步长与范围设定;
②将有调节需要的其余指标固定,用默认值作为其取值;
③将在不同取值条件下有调节需要的参数模型R2值输出;
④展开不同取值条件下参数R2值对比,特定参数最优取值为对应于其最大值的参数值;
⑤前述四个环节重复进行,至发现有调节需求的全部参数的参数值;
⑥最优参数组合为全部参数的组合(由最优取值组成)。
1.4模型评价
(1)可决系数(R2)
式(5)中,yi为真实值,f(xi)为预测值,为真实值的均值,n为样本数,总变异程度中的自变量解释变异程度占比用可决系数表示,模型准确性与可决系数值接近1的程度呈正相关,[0,1]为R2的一般取值区间,但在模型预测随机值(R2最优值等于1)这个前提下,R2负值情况可能会出现。
(2)均方根误差(RMSE)
式(6)中,yi为真实值,f(xi)为预测值,n为样本数,预测值与实际值的差值平方值与观测次数这两个数据比值的平方根即为均方根误差,测量精度可以基于此值有效反映出来。
(3)平均绝对误差(MAE)
式(7)中,yi为真实值,f(xi)为预测值,n为样本数;
回归模型偏差判断一般采用平均绝对误差,二者呈正相关性。
二、结果与分析
2.1滑县地区干热风发生时间分布
分析河南省滑县地区1981-2022年的气象站记录数据,依据表1(中华人民共和国行业标准(QX/T82-2007)—《小麦干热风灾害等级》)等级指标对轻干热风和重干热风进行判断;
表1北方冬小麦干热风等级指标
分段统计1981-2022年冬小麦成熟前32d内的干热风发生日数及占总天数的比例见图1所示,可以得出,轻度和重度干热风发生概率在6月3日-6月6日和6月7-6月10日最大,轻度干热风在6月3日-6月6日和6月7-6月10日2个统计单元发生概率分别达到8.92%和8.33%,与前几个单元相比发生概率较高。重度干热风主要发生在六月份,在六月份的3个单元内,重干热风的发生概率分别达到2.38%、3.57%和3.57%,发生概率略低于轻度干热风,说明干热风主要对小麦灌浆期危害较大,即小麦成熟前10d是干热风发生的高风险时段;
2.2基于相关性分析的特征选择结果
针对日最高温度、14时相对温度、日最低温度、日温差、14时相对湿度和14时风速等六项特征,绘制其与干热风等级之间的相关散点图,并在散点图中绘制出拟合曲线,标注拟合方程,如附图2所示;
由图2可以看出,干热风等级与14时气温、14时风速、日最高温度、日最低温度、日温差呈现正相关关系,与14时湿度呈现负相关关系。具体来说,干热风等级越高,则14时气温、14时风速、日最高温度、日最低温度、日温差越大;相反,干热风等级越高,14是湿度越低。由拟合方程可以看出,干热风等级与14时气温、14时风速、日最高温度、日最低温度、日温差和14时湿度的相关程度相对高,而与日最低气温的相关程度较低;
在相关性分析中,散点图是可以直观地反映出两个变量之间的相关性方向;而相关系数则是通过数据以最直接的方式反映出两个变量间相关性大小的指标,根据公式(3)和(4)可计算出Pearson相关系数与Spearman相关系数,计算结果如表2所示:
表2Pearson相关系数与Spearman相关系数
根据表2计算结果,求出所有特征与小麦干热风之间的Pearson相关系数和Spearman相关系数的平均值的绝对值R,结果如表3所示;
表3各特征与干热风等级的相关系数及相关系数均值
结合图2和表3中相关系数数据,对相关系数的均值的绝对值R小于0.1的特征进行剔除,因此将日影响因素最低气温进行剔除,剩余特征组成随机森林的输入特征组。
2.3参数寻优结果
本方案对影响随机森林算法性能最大的4个参数进行参数寻优,分别为:最大迭代次数(n_estimators)、决策树最大深度(max_depth)、内部节点拆分最小样本数(min_samples_split)、叶子节点所需的最小样本数(min_samples_leaf);
考虑到算法的处理时间和性能,为了能够保证搜索空间的全面性,能够覆盖到参数的最优取值组合,上述四个参数取值时的步长均为1,可决系数R2随各参数取值的变化曲线如图3所示;
计算各特征与干热风数据集的各参数取值下的可决系数R2,并选择可决系数R2最大时的参数取值为最优参数值,最终取值结果见表4;·
表4参数寻优结果
2.4干热风预测结果与分析
实验一:随机森林算法改进前后的比较
本方案对传统随机森林决策树的权重进行改进权衡,计算各决策树在训练集上预测点与实际点距离的方差,作为本决策树的误差,求其倒数;然后,将每棵决策树的误差倒数与所有决策树的误差倒数之和相除,固定成这棵决策树的权重;最后,根据每个决策树的输出结果,对输出结果进行加权得到最终的预测结果;
图4为改进后随机森林与改进前随机森林模型可决系数R2随迭代次数变化曲线对比图,可以看出,改进前后的R2分别为96.95%和99.26%,改进后的精度有明显的提高。
实验二:多预测模型之间的比较
对改进后的随机森林模型训练集和验证集进行模型评价,如下表5:
表5模型评价
本方案除了对随机森林算法模型与改进的随机森林算法模型进行比较之外,同时对目前相关研究中表现较好的预测模型(BP+SVM和KNN)进行比较,各模型评价结果如表6和图5所示;
表6模型评价对比
从图5可知,各预测算法在迭代次数达到200左右趋于稳定,这也和2.3小节中迭代次数寻优结果保持一致,从表6和图5可以看出,随机森林算法模型在精度和误差方面都比SVM+BP算法模型和KNN算法模型表现出色,SVM+BP和KNN的预测精度比较接近;而在进行加权改进后的随机森林算法模型的预测精度是最高的,比传统随机森林算法模型在精度方面提高了2.29%,在误差方面降低了0.6104,可决系数R2达到99.26%,说明该算法能够达到业务应用水平;
综合实验一和实验二的结果,本方案提出的基于改进随机森林算法预测滑县冬小麦干热风效果是最好的,即预测准确率最高,预测误差最小,预测结果对防御冬小麦干热风气象灾害具有重要意义。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (4)
1.一种基于加权随机森林的干热风预测方法,其特征在于,包括以下步骤:
S1:对随机森林算法中决策树权重取舍进行改进,并构建加权随机森林模型;
S2:把干热风与模型所输入各特征间的Spearman、Pearson相关系数及其均值绝对值先计算出来;
S3:以随机森林算法为理论依据,将变量重要性依次计算出来,并且每个变量重要性均值;
S4:剔除变量重要性均值、相关系数均值全部小于预设值的部分特征,以余下特征为依据构建新输入特征组;
S5:将样本数据划分为训练集和测试集,在模型内放入训练集数据信息,以持续性性能参数调节为支撑展开可决系数R2波动观察,找出各性能参数最优值。
2.根据权利要求1所述的一种基于加权随机森林的干热风预测方法,其特征在于,所述S1中包过以下步骤:
S1-1:确立实际点与训练集上各决策树预测点间距离方差,决策树误差的倒数同步求出,决策树预测点与训练集实际点(第i棵决策树中)的方差为δ2(i),且该决策树预测环节稳定性、权重与δ2(i)呈负相关关系;
S1-2:利用全部决策树误差倒数总和除以单棵决策树误差倒数,获得单棵决策树权重,随机森林权重计算公式如下:
式(1)中,第i棵决策树权重为w(i);
S1-3:以单棵决策树输出结果为基本支撑,加权处理输出结果,获取最终预测结果,其预测值表示为:
式(2)中,Yx为第x棵决策树的预测值。
3.根据权利要求1所述的一种基于加权随机森林的干热风预测方法,其特征在于,设X、Y这两个变量服从正态分布,xi、yi(in=1,2,...,n)分别为X、Y的观测值,据此获得Pearson相关系数RP(X、Y)的求解方程:
式(3)中,和表示样本均值,RP的取值范围:-1≤RP≤1;
Spearman相关系数RS基于秩序次计算,其计算公式为:
式(4)中,Ri和Oi表示xi和yi的秩次差,n为样本的个数,且满足-1≤RS≤1。
4.根据权利要求1所述的一种基于加权随机森林的干热风预测方法,其特征在于,所述S5中可决系数R2表示为:
式(5)中,yi为真实值,f(xi)为预测值,为真实值的均值,n为样本数,总变异程度中的自变量解释变异程度占比用可决系数表示,模型准确性与可决系数值接近1的程度呈正相关,[0,1]为R2的一般取值区间;
寻优过程具体包括以下步骤:
S5-1:将需要调节指标选出,将取值步长与范围设定;
S5-2:将有调节需要的其余指标固定,用默认值作为其取值;
S5-3:将在不同条件下有调节需要的参数模型R2值输出;
S5-4:展开不同取值条件下参数R2值对比,特定参数最优取值为对应于其最大值的参数值;
S5-5:重复进行S5-1至S5-4,直至发现有调节需要的全部参数的参数值;
S5-6:最优参数组合为全部参数的组合(由最优取值组成)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310565412.9A CN116821816B (zh) | 2023-05-17 | 2023-05-17 | 一种基于加权随机森林的干热风预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310565412.9A CN116821816B (zh) | 2023-05-17 | 2023-05-17 | 一种基于加权随机森林的干热风预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116821816A true CN116821816A (zh) | 2023-09-29 |
CN116821816B CN116821816B (zh) | 2024-05-28 |
Family
ID=88121226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310565412.9A Active CN116821816B (zh) | 2023-05-17 | 2023-05-17 | 一种基于加权随机森林的干热风预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116821816B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108898499A (zh) * | 2018-05-31 | 2018-11-27 | 河南省气象科学研究所 | 一种冬小麦干热风保险天气指数计算方法 |
CN110309985A (zh) * | 2019-07-10 | 2019-10-08 | 北京师范大学 | 一种农作物产量预测方法及系统 |
CN110502725A (zh) * | 2019-08-12 | 2019-11-26 | 华南农业大学 | 基于相关性分析与随机森林的耕地定级指标赋权方法 |
CN113657781A (zh) * | 2021-08-23 | 2021-11-16 | 北京师范大学 | 一种适用于极端气候条件下的小麦估产方法及系统 |
CN114004437A (zh) * | 2021-06-28 | 2022-02-01 | 成都信息工程大学 | 干旱风险评估模型及建立方法和系统、干旱风险评估方法 |
CN114139819A (zh) * | 2021-12-07 | 2022-03-04 | 成都理工大学 | 基于地统计加权随机森林的地球化学变量空间预测方法 |
CN114900814A (zh) * | 2022-04-29 | 2022-08-12 | 北京树匠数字科技有限公司 | 一种基于区块链空天地一体化农业大数据管理系统及方法 |
US20230080168A1 (en) * | 2021-08-27 | 2023-03-16 | Institute of Environment and Sustainable Development in Agriculture, CAAS | Method for assessing comprehensive risk of drought and flood disaster on apples |
-
2023
- 2023-05-17 CN CN202310565412.9A patent/CN116821816B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108898499A (zh) * | 2018-05-31 | 2018-11-27 | 河南省气象科学研究所 | 一种冬小麦干热风保险天气指数计算方法 |
CN110309985A (zh) * | 2019-07-10 | 2019-10-08 | 北京师范大学 | 一种农作物产量预测方法及系统 |
CN110502725A (zh) * | 2019-08-12 | 2019-11-26 | 华南农业大学 | 基于相关性分析与随机森林的耕地定级指标赋权方法 |
CN114004437A (zh) * | 2021-06-28 | 2022-02-01 | 成都信息工程大学 | 干旱风险评估模型及建立方法和系统、干旱风险评估方法 |
CN113657781A (zh) * | 2021-08-23 | 2021-11-16 | 北京师范大学 | 一种适用于极端气候条件下的小麦估产方法及系统 |
US20230080168A1 (en) * | 2021-08-27 | 2023-03-16 | Institute of Environment and Sustainable Development in Agriculture, CAAS | Method for assessing comprehensive risk of drought and flood disaster on apples |
CN114139819A (zh) * | 2021-12-07 | 2022-03-04 | 成都理工大学 | 基于地统计加权随机森林的地球化学变量空间预测方法 |
CN114900814A (zh) * | 2022-04-29 | 2022-08-12 | 北京树匠数字科技有限公司 | 一种基于区块链空天地一体化农业大数据管理系统及方法 |
Non-Patent Citations (2)
Title |
---|
LINCHAO LI 等: "Developing machine learning models with multi-source environmental data to predict wheat yield in China", 《COMPUTERS AND ELECTRONICS IN AGRICULTURE》, 20 February 2022 (2022-02-20), pages 1 - 12 * |
张志林: "基于分布式计算的小麦干热风灾害预测研究", 《中国优秀硕士学位论文全文数据库 农业科技辑》, 15 February 2019 (2019-02-15), pages 047 - 117 * |
Also Published As
Publication number | Publication date |
---|---|
CN116821816B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112288164B (zh) | 一种计及空间相关性和修正数值天气预报的风功率组合预测方法 | |
CN111260126B (zh) | 计及天气与气象因子关联度的短期光伏发电预测方法 | |
CN111898820B (zh) | 基于趋势聚类和集成树的pm2.5小时浓度组合预测方法及系统 | |
CN106600037B (zh) | 一种基于主成分分析的多参量辅助负荷预测方法 | |
Chu et al. | Impacts of future climate change on agroclimatic resources in Northeast China | |
CN109214591B (zh) | 一种木本植物地上生物量预测方法及系统 | |
CN112418346B (zh) | 一种数值天气预报总辐射系统误差分类计算方法 | |
CN116187540B (zh) | 一种基于时空偏差修正的风电场站超短期功率预测方法 | |
CN116526478B (zh) | 基于改进的蛇群优化算法的短期风电功率预测方法及系统 | |
CN112818608A (zh) | 一种基于改进的粒子群优化算法与支持向量机的中长期径流预报方法 | |
CN112149905A (zh) | 一种基于小波变换和小波神经网络的光伏电站短期功率预测方法 | |
Shang et al. | Research on intelligent pest prediction of based on improved artificial neural network | |
CN113762387A (zh) | 一种基于混合模型预测的数据中心站多元负荷预测方法 | |
CN111292124A (zh) | 一种基于优化组合神经网络的需水预测方法 | |
CN112926772A (zh) | 一种基于lstm-gpr混合模型的光能预测方法 | |
CN116451823A (zh) | 一种基于气象主控因子的苹果产量预测方法 | |
CN116702937A (zh) | 一种基于K-means均值聚类及优化BP神经网络的光伏出力日前预测方法 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
CN116826737A (zh) | 一种光伏功率的预测方法、装置、存储介质及设备 | |
CN116454870A (zh) | 一种区域分布式光伏短期功率预测方法 | |
CN113095547B (zh) | 一种基于gra-lstm-ice模型的短期风功率预测方法 | |
CN110276478B (zh) | 基于分段蚁群算法优化svm的短期风电功率预测方法 | |
CN116821816B (zh) | 一种基于加权随机森林的干热风预测方法 | |
CN117408833A (zh) | 一种基于负荷辨识的短期负荷预测的方法 | |
CN117522626A (zh) | 一种基于特征选择与异多模型融合光伏出力预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |