CN110443420A - 一种基于机器学习的作物产量预测方法 - Google Patents
一种基于机器学习的作物产量预测方法 Download PDFInfo
- Publication number
- CN110443420A CN110443420A CN201910715296.8A CN201910715296A CN110443420A CN 110443420 A CN110443420 A CN 110443420A CN 201910715296 A CN201910715296 A CN 201910715296A CN 110443420 A CN110443420 A CN 110443420A
- Authority
- CN
- China
- Prior art keywords
- machine learning
- feature
- crop
- production forecast
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000010801 machine learning Methods 0.000 title claims abstract description 20
- 238000012272 crop production Methods 0.000 title claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 31
- 238000004519 manufacturing process Methods 0.000 claims abstract description 17
- 238000003066 decision tree Methods 0.000 claims description 29
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 9
- 238000005286 illumination Methods 0.000 claims description 6
- 238000001556 precipitation Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000005855 radiation Effects 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000003909 pattern recognition Methods 0.000 claims description 2
- 235000013399 edible fruits Nutrition 0.000 claims 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 208000019300 CLIPPERS Diseases 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 238000009395 breeding Methods 0.000 claims 1
- 230000001488 breeding effect Effects 0.000 claims 1
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 claims 1
- 238000010224 classification analysis Methods 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000000611 regression analysis Methods 0.000 claims 1
- 238000012271 agricultural production Methods 0.000 abstract description 7
- 238000007635 classification algorithm Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 238000013138 pruning Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 235000013339 cereals Nutrition 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 208000000509 infertility Diseases 0.000 description 2
- 230000036512 infertility Effects 0.000 description 2
- 231100000535 infertility Toxicity 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Agronomy & Crop Science (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Animal Husbandry (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明为一种基于机器学习的作物产量预测方法,利用作物生长周期内的气候特征,通过机器学习,建立起气候特征与作物产量之间的关联性,利用历史数据对不同的学习模型进行训练,结合当前的气象信息特征对当年产量做出预测,有助于农业从业人员及时了解产量信息,为农业生产决策提供依据。集成使用三种不同的机器学习分类算法对作物产量分别进行预测,并对预测结果进行集成判决,以减少单个学习算法鲁棒性差的问题,提高预测结果的正确率与可信度。易可实现更加及时、准确的产量预测,为实现粮食产量生产与决策提供必要的技术支撑。
Description
技术领域
本发明涉及一种农作物产量的预测技术领域,特别涉及一种基于机器学习的作物产量预测方法。
背景技术
我国是农业大国,粮食产量连年增长,农业生产量和生产方式都进入到了新的阶段,农业生产新要求也随之产生,在农业生产中,注重农产品品质、关注农业灾害预警能力等问题的提出已成为迫在眉睫的需求。我国的农业种植经营模式已不断的从“大农业”形势向“小农业”转变,精细化的生产也对相应的农业装备提出了更高的要求,应运而生的是判断农作物的生长状况,预测作物的产量。
农作物产量易受到不同气象条件的影响,对产量的准确预测将会对农业生产决策产生重要影响。如何对作物产量分别进行预测,并对预测结果进行集成判决,以减少单个学习算法鲁棒性差的问题,提高预测结果的正确率与可信度是本发明研究的重点。
发明内容
为了解决上述技术问题,本发明提供了一种基于机器学习的作物产量预测方法,其技术方案为:
包括如下步骤:
步骤1,获取历史气象特征数据;
步骤2,对特征数据进行简单预处理:按照特征数据的大小关系划分等级,再根据等级把特征数据送入特征选择模型,该模型可以选择出特征数据里对产量预测结果影响较大的特征数据,这些数据被称为关键特征;
步骤3,获取历史作物产量分类:按照实际产量与线性预测产量的大小关系,分为正常和减产两类;
步骤4,搭建集成算法模型:将关键特征划分为两部分,分别用于训练和测试,将训练数据输入到集成分类模型中,使用留一预测法进行历年产量的预测;
步骤5,调节参数,优化模型:观察使用默认参数的集成算法模型的预测结果,判断预测结果是否理想,再决定是否采用网络搜索法进行调整参数,得到理想参数;
步骤6,对于理想参数在集成算法模型中再次预测,其预测结果为最终作物产量预测结果,用于实际分析和使用。
进一步地,所述历史气象特征数据包括光照、温度、湿度。
进一步地,所述集成分类模型由随机森林 RandomForestClassifier、支持向量机svm和决策树 DecisionTreeClassifier三种分类模型组合而成。
进一步地,所述决策树DecisionTreeClassifier,是一种基本的分类与回归方法,由特征选择、决策树生成和决策树剪枝三部分组成;
所述支持向量svm,是一个有监督的学习模型,用来进行模式识别、分类以及回归分析;
所述随机森林RandomForestClassifier,是一种集成算法(Ensemble Learning),它属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能。
进一步地,所述特征选择模型为:决策树特征选择模型。
进一步地,在预测某省某作物产量时,所述关键特征为:5月辐射量、10月降水量、5月降水量、10月平均湿度、全生育期平均湿度、11月最高温这六个特征。
进一步地,所述默认参数为:
RandomForestClassifier(n_estimators=’10’,criterion=’gini’,min_samples_split=2,min_samples_leaf=1,oob_scor e=False,random_state=None);svm.SVC(C=1.0,kernel=’rbf’, degree=3,probability=False,tol=0.001,cache_size=200,cla ss_weight=None,random_state=None);DecisionTreeClassifier(min_samples_split=2,min_samples_leaf=1,min_weight_fraction _leaf=0.0,random_state=None,presort=False)。
本发明的有益效果为:本发明为一种基于机器学习的作物产量预测方法,利用作物生长周期内的气候特征,通过机器学习,建立起气候特征与作物产量之间的关联性,利用历史数据对不同的学习模型进行训练,结合当前的气象信息特征对当年产量做出预测,有助于农业从业人员及时了解产量信息,为农业生产决策提供依据。集成使用三种不同的机器学习分类算法对作物产量分别进行预测,并对预测结果进行集成判决,以减少单个学习算法鲁棒性差的问题,提高预测结果的正确率与可信度。易可实现更加及时、准确的产量预测,为实现粮食产量生产与决策提供必要的技术支撑。
附图说明
图1为本发明农作物产量预测方法的流程图;
图2为本发明方法所预测的结果与作物实际的增、减产结果对比示意图。
具体实施方式
如图所示,本发明为一种基于机器学习的作物产量预测方法,以预测江苏省冬小麦产量时,包括如下步骤:
步骤1,获取历史气象特征数据;所述历史气象特征数据包括光照、温度、湿度。可将影响因素进一步细化为:日累积平均光照、日平均光照、日最大光照、日平均温度、昼平均温度、日最大温度、日最小温度、日平均湿度、昼平均湿度、日最大湿度、日最小湿度。
步骤2,对特征数据进行简单预处理;为表明不同气象特征的影响,将气象数据划分为三个等级:偏低0、正常1和偏高2。其中0 表示在所有年份中,该年度气象特征处于偏低水平(小于1/4),1表示处于正常水平(1/4~3/4之间),2表示处于偏高水平(大于3/4);然后把把特征向量送入特征选择模型,选择出5-7个对产量预测结果影响最大的因子,以提取对作物产量产生影响的关键特征,本实施例采集的关键特征包括:5月辐射量、10月降水量、5月降水量、10月平均湿度、全生育期平均湿度、11月最高温这六个特征。
步骤3,获取历史作物产量分类:按照实际产量与线性预测产量的大小关系,分为正常和减产两类;
步骤4,搭建集成算法模型:将关键特征划分为两部分,分别用于训练和测试,将训练数据输入到集成分类模型中,使用留一预测法进行历年产量的预测。
所述集成分类模型由随机森林RandomForestClassifier、支持向量机svm和决策树DecisionTreeClassifier三种分类模型组合而成。
三种算法模型中,第一个算法模型,决策树 DecisionTreeClassifier,是一种基本的分类与回归方法,由特征选择、决策树生成和决策树剪枝三部分组成;下面具体介绍每一步。
第一步,决策树的特征选择:
如果利用一个特征进行分类的结果与随机分类的结果无异,则该特征不具备分类能力;将该特征去掉,对决策树的分类精度影响不大。一般用信息增益来判定一个特征的分类能力。
首先引入熵的概念,设X是一个有限状态的离散型随机变量,其概率分布为P(X=xi)=pi,i=1,2,3,...,n,则随机变量X的熵定义为:
随机变量X给定的条件下,随机变量Y的条件熵定义为:
其中,pi=P(X=xi)。
信息增益表示的是:得知特征X的信息而使得类Y的信息的不确定性减少的程度。
假设训练数据集为D,样本容量为|D|,有k个类别Ck,|Ck|为类别 Ck的样本个数。某一特征A有n个不同的取值a1,a2,......an。根据特征A 的取值可将数据集D划分为n个子集D1,D2,......Dn,|Di|为Di的样本个数。并记子集Di中属于类Ck的样本集合为Dik,|Dik|为Dik的样本个数。则信息增益的算法如下:
先计算数据集D的经验熵H(D):
然后计算特征A对数据集D的经验条件熵H(D|A):
接着计算信息增益:
g(D,A)=H(D)-H(D|A)
以信息增益作为特征选择准则,会存在偏向于选择取值较多的特征的问题。可以采用信息增益比对这一问题进行校正。
特征A对训练数据集D的信息增益比定义为其信息增益与训练集 D关于特征A的值的熵之比,即:
其中:
根据信息增益准则进行特征选择的方法是:对训练数据集D,计算其每个特征的信息增益,并比它们的大小,从而选择信息增益最大的特征。
第二步,决策树的生成:
分类与回归树(classification and regression tree,CART) 假设决策树是一个二叉树,它通过递归地二分每个特征,将特征空间划分为有限个单元,并在这些单元上确定预测的概率分布。
CART算法中,对于回归树,采用的是平方误差最小化准则;对于分类树,采用基尼指数最小化准则。
平方误差最小化:
假设已将输入空间划分为M个单元R1,R2,......RM,并且在每个单元 Rm上有一个固定的输出值cm,于是回归树可以表示为
当输入空间的划分确定时,可以用平方误差来表示回归树对于训练数据的预测误差。
基尼系数:
分类问题中,假设有K个类别,样本点属于第k类的概率为pk,, 则概率分布的基尼系数定义为:
第三步,决策树的剪枝:
决策树的剪枝通过极小化决策树整体的损失函数来实现。Nt为节点的样本数,T为决策树的子节点集合,t是T中的一个元素,HT(t)为叶子节点内部取k个类的不确定度。在提高信息增益的基础上,通过对模型的复杂度T施加惩罚,便得到了损失函数的定义:
α的大小反映了对模型训练集拟合度和模型复杂度的折衷考虑。剪枝的过程就是当α确定时,选择损失函数最小的模型。具体的算法如下:
1.计算每个节点的经验熵;
2.递归地从树的叶节点向上回缩,如果将某一个父节点的所有叶节点合并,能够使得其损失函数减小,则进行剪枝,将父节点变成新的叶节点;
3.返回2,直到不能继续合并。
第二个算法模型,支持向量svm,ωT表示分割线的斜率,b表示分割线的截距,ρ表示支撑向量到分割线的距离,并让该距离最大:
目标函数是一个极小极大问题:
可以通过缩放w和b,使该不等式右边划归到1。如此,就可以简化目标函数为
s.t.yi(ωTxi+b)≥1 for i=1,2,3,...n
优化问题求解:
目标问题的对偶问题:
s.t.yi(ωTxi+b)≥1 for i=1,2,3,...n
因为目标函数是二次的,而约束在参数w和b上是线性的,因此这个问题是一个凸优化问题,可以通过标准的拉格朗日乘子来求解。
用拉格朗日乘子法:
其中,αi≥0 解这个优化问题的方法是先求关于α的极大,再求关于w和b的极小:
先求极小问题:
令L对w,b求偏导并等于0,有和
然后代入到拉格朗日函数中,最终可以得到:
求极大问题:
ai≥0
将问题转成对偶问题,求解这个问题用到了SMO(sequential minimaloptimization),即每次只挑两个拉格朗日乘子,其他乘子认为是常数,然后每次都化为两变量凸优化问题。
最终通过求得α的值,找到最优的w和b。注意,最后的结果里,只有支撑向量的α>0,对于非支撑向量,其α=0。
松弛变量:
一般用ξ来表示松弛变量。加入松弛变量后的模型优化目标和约束:
s.t.yi(wTxi+b)≥1-ξi
ξ>0
然后先对w,b,ξ求极小,再对α求极大。C越大,我们越倾向于没有松弛变量,即模型会尽可能分对每一个点,反之,C越小,模型的泛化能力越强。
第三个算法模型,随机森林RandomForestClassifier,是一种集成算法(EnsembleLearning),它属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能。其可以取得不错成绩,主要归功于“随机”和“森林”,一个使它具有抗过拟合能力,一个使它更加精准。
Bagging也叫自举汇聚法(bootstrap aggregating),是一种在原始数据集上通过有放回抽样重新选出k个新数据集来训练分类器的集成技术。它使用训练出来的分类器的集合来对新样本进行分类,然后用多数投票或者对输出求均值的方法统计所有分类器的分类结果,结果最高的类别即为最终标签。此类算法可以有效降低bias,并能够降低variance。
随机森林(Random Forest,RF)是Bagging算法的一种。随机森林的弱分类器使用的是CART数,CART决策树又称分类回归树。当数据集的因变量为连续性数值时,该树算法就是一个回归树,可以用叶节点观察的均值作为预测值;当数据集的因变量为离散型数值时,该树算法就是一个分类树,可以很好的解决分类问题。
特征选择目前比较流行的方法是信息增益、增益率、基尼系数和卡方检验。这里主要介绍基于基尼系数(GINI)的特征选择,因为随机森林采用的CART决策树就是基于基尼系数选择特征的。
基尼系数的选择的标准就是每个子节点达到最高的纯度,即落在子节点中的所有观察都属于同一个分类,此时基尼系数最小,纯度最高,不确定度最小。
对于一般的决策树,假如总共有K类,样本属于第k类的概率为 pk,则该概率分布的基尼指数为:
基尼指数越大,说明不确定性就越大;基尼系数越小,不确定性越小,数据分割越彻底,越干净。
对于CART树而言,由于是二叉树,可以通过下面的表示:
Gini(p)=2p(1-p)
在我们遍历每个特征的每个分割点时,当使用特征A=a,将D划分为两部分,即D1(满足A=a的样本集合),D2(不满足A=a的样本集合)。则在特征A=a的条件下D的基尼指数为:
Gini(D):表示集合D的不确定性。
Gini(A,D):表示经过A=a分割后的集合D的不确定性。
随机森林中的每棵CART决策树都是通过不断遍历这棵树的特征子集的所有可能的分割点,寻找Gini系数最小的特征的分割点,将数据集分成两个子集,直至满足停止条件为止。
抗过拟合:
首先,正如Bagging介绍中提到的,每个树选取使用的特征时,都是从全部m个特征中随机产生的,本身已经降低了过拟合的风险和趋势。模型不会被特定的特征值或者特征组合所决定,随机性的增加,将控制模型的拟合能力不会无限提高。
第二,与决策树不同,RF对决策树的建立做了改进。对于普通的决策树,我们会在节点上所有的m个样本特征中选择一个最优的特征来做决策树的左右子树划分。但是RF的每个树,其实选用的特征是一部分,在这些少量特征中,选择一个最优的特征来做决策树的左右子树划分,将随机性的效果扩大,进一步增强了模型的泛化能力。
步骤5,调节参数,优化模型:观察使用前述默认参数的预测结果,判断预测结果是否理想,再决定是否采用网络搜索法进行调整参数,得到理想参数;
步骤6,对于理想参数在集成算法模型中再次预测,调节参数后的模型为:
RandomForestClassifier(random_state=1)
svm.SVC(kernel='linear',C=8,gamma=1e-7)
DecisionTreeClassifier(min_samples_split=2,min_samples_leaf=1,max_features=None)
再次预测后预测精度得到明显的提升,预测结果就可用来实际的分析与使用。
图2为本发明的预测结果,可以看出,三种算法预测的结果都不相同,且三种算法单独预测时精确度不是非常高,普遍在百分之七八十左右,而当把三种算法结合起来做成集成算法之后,算法的精度达到了百分之九十,预测精度高且最近16年的数据全部预测正确,效果良好。
本发明为一种基于机器学习的作物产量预测方法,利用作物生长周期内的气候特征,通过机器学习,建立起气候特征与作物产量之间的关联性,利用历史数据对不同的学习模型进行训练,结合当前的气象信息特征对当年产量做出预测,有助于农业从业人员及时了解产量信息,为农业生产决策提供依据。集成使用三种不同的机器学习分类算法对作物产量分别进行预测,并对预测结果进行集成判决,以减少单个学习算法鲁棒性差的问题,提高预测结果的正确率与可信度。易可实现更加及时、准确的产量预测,为实现粮食产量生产与决策提供必要的技术支撑。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。
Claims (7)
1.一种基于机器学习的作物产量预测方法,其特征在于,包括如下步骤:
步骤1,获取历史气象特征数据;
步骤2,对特征数据进行简单预处理:按照特征数据的大小关系划分等级,再根据等级把特征数据送入特征选择模型,该模型选择出特征数据里对产量预测结果影响较大的特征数据,这些数据被称为关键特征;
步骤3,获取历史作物产量分类:按照实际产量与线性预测产量的大小关系,分为正常和减产两类;
步骤4,搭建集成算法模型:将关键特征划分为两部分,分别用于训练和测试,将训练数据输入到集成分类模型中,使用留一预测法进行历年产量的预测;
步骤5,调节参数,优化模型:观察使用默认参数的集成算法模型的预测结果,判断预测结果是否理想,再决定是否采用网络搜索法进行调整参数,得到理想参数;
步骤6,对于理想参数在集成算法模型中再次预测,其预测结果为最终作物产量预测结果,用于实际分析和使用。
2.如权利要求1所述的一种基于机器学习的作物产量预测方法,其特征在于,所述历史气象特征数据包括光照、温度、湿度。
3.如权利要求1所述的一种基于机器学习的作物产量预测方法,其特征在于,所述集成分类模型由随机森林RandomForestClassifier、支持向量机svm和决策树DecisionTreeClassifier三种分类模型组合而成。
4.如权利要求3所述的一种基于机器学习的作物产量预测方法,其特征在于,所述决策树DecisionTreeClassifier,是一种基本的分类与回归方法,由特征选择、决策树生成和决策树剪枝三部分组成;
所述支持向量svm,是一个有监督的学习模型,用来进行模式识别、分类以及回归分析;
所述随机森林RandomForestClassifier,是一种集成算法(Ensemble Learning),它属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能。
5.如权利要求1所述的一种基于机器学习的作物产量预测方法,其特征在于,所述特征选择模型为:决策树特征选择模型。
6.如权利要求1所述的一种基于机器学习的作物产量预测方法,其特征在于,在预测某省某作物产量时,所述关键特征为:5月辐射量、10月降水量、5月降水量、10月平均湿度、全生育期平均湿度、11月最高温这六个特征。
7.如权利要求1所述的一种基于机器学习的作物产量预测方法,特征在于,所述默认参数为:
RandomForestClassifier(n_estimators=’10’,criterion=’gini’,min_samples_split=2,min_samples_leaf=1,oob_score=False,random_state=None);svm.SVC(C=1.0,kernel=’rbf’,degree=3,probability=False,tol=0.001,cache_size=200,class_weight=None,random_state=None);DecisionTreeClassifier(min_samples_split=2,min_samples_leaf=1,min_weight_fraction_leaf=0.0,random_state=None,presort=False)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910715296.8A CN110443420B (zh) | 2019-08-05 | 2019-08-05 | 一种基于机器学习的作物产量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910715296.8A CN110443420B (zh) | 2019-08-05 | 2019-08-05 | 一种基于机器学习的作物产量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110443420A true CN110443420A (zh) | 2019-11-12 |
CN110443420B CN110443420B (zh) | 2023-05-09 |
Family
ID=68433154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910715296.8A Active CN110443420B (zh) | 2019-08-05 | 2019-08-05 | 一种基于机器学习的作物产量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110443420B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428808A (zh) * | 2020-04-08 | 2020-07-17 | 成都爱科特科技发展有限公司 | 一种利用随机森林进行业务分类的方法 |
CN111507507A (zh) * | 2020-03-24 | 2020-08-07 | 重庆森鑫炬科技有限公司 | 基于大数据的月用水量预测方法 |
CN112070241A (zh) * | 2020-09-11 | 2020-12-11 | 腾讯科技(深圳)有限公司 | 基于机器学习模型的植物生长预测方法、装置和设备 |
CN112148785A (zh) * | 2020-09-24 | 2020-12-29 | 中国科学院空天信息创新研究院 | 一种作物分布制图 |
CN112269878A (zh) * | 2020-11-02 | 2021-01-26 | 成都纬创立科技有限公司 | 可解释法律判决预测方法、装置、电子设备及存储介质 |
CN112580703A (zh) * | 2020-12-07 | 2021-03-30 | 昆明理工大学 | 一种三七病害高发期发病率预测方法 |
CN112785047A (zh) * | 2021-01-06 | 2021-05-11 | 上海信联信息发展股份有限公司 | 农作物的采收量预测方法和装置 |
WO2021098472A1 (zh) * | 2019-11-19 | 2021-05-27 | 浙江大学 | 一种深度时空特征联合学习的农作物产量估测方法 |
CN112860726A (zh) * | 2021-02-07 | 2021-05-28 | 天云融创数据科技(北京)有限公司 | 结构化查询语句分类模型训练方法和装置 |
CN112906298A (zh) * | 2021-02-05 | 2021-06-04 | 重庆邮电大学 | 一种基于机器学习的蓝莓产量预测方法 |
CN113298286A (zh) * | 2021-03-31 | 2021-08-24 | 捷佳润科技集团股份有限公司 | 一种基于机器学习的火龙果上市时间预测的方法 |
CN114780599A (zh) * | 2022-04-06 | 2022-07-22 | 四川农业大学 | 基于小麦品比试验数据的综合分析系统 |
CN115796384A (zh) * | 2022-12-22 | 2023-03-14 | 中国农业科学院农业环境与可持续发展研究所 | 用于小麦面包品质预测的系统 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005151851A (ja) * | 2003-11-21 | 2005-06-16 | Mayekawa Mfg Co Ltd | 農作物需給管理システム、加工食品受発注システム及び農業支援システム |
US20050209897A1 (en) * | 2004-03-16 | 2005-09-22 | Luhr Stanley R | Builder risk assessment system |
US20050234691A1 (en) * | 2004-04-20 | 2005-10-20 | Singh Ramesh P | Crop yield prediction |
JP2010166851A (ja) * | 2009-01-22 | 2010-08-05 | Chiharu Hongo | 作物の収量予測方法及びその装置 |
CN103947401A (zh) * | 2014-04-02 | 2014-07-30 | 山东农业大学 | 利用气象条件提高冬小麦弱势粒的粒重增加产量的方法 |
WO2014203664A1 (ja) * | 2013-06-18 | 2014-12-24 | 株式会社日立製作所 | 収量予測システムおよび収量予測装置 |
CN107341577A (zh) * | 2017-07-25 | 2017-11-10 | 中国农业科学院农业信息研究所 | 一种农作物产量预测方法及系统 |
CN107368687A (zh) * | 2017-07-25 | 2017-11-21 | 中国农业科学院农业信息研究所 | 一种气象单产模型的优选方法及装置 |
CN107766883A (zh) * | 2017-10-13 | 2018-03-06 | 华中师范大学 | 一种基于加权决策树的优化随机森林分类方法及系统 |
CN107909491A (zh) * | 2017-11-30 | 2018-04-13 | 河南云保遥感科技有限公司 | 一种利用空间大数据的产量保险理赔方法 |
CN107957946A (zh) * | 2017-12-01 | 2018-04-24 | 北京理工大学 | 基于邻域嵌入保护算法支持向量机的软件缺陷预测方法 |
WO2018075995A1 (en) * | 2016-10-21 | 2018-04-26 | DataRobot, Inc. | Systems for predictive data analytics, and related methods and apparatus |
CN108287926A (zh) * | 2018-03-02 | 2018-07-17 | 宿州学院 | 一种农业生态多源异构大数据采集、处理与分析架构 |
CN108665107A (zh) * | 2018-05-15 | 2018-10-16 | 中国农业大学 | 农作物产量预测方法和系统 |
CN109325630A (zh) * | 2018-10-12 | 2019-02-12 | 南京农业大学 | 一种基于形态参数的高温胁迫下水稻产量预测方法 |
US20190050948A1 (en) * | 2017-08-08 | 2019-02-14 | Indigo Ag, Inc. | Machine learning in agricultural planting, growing, and harvesting contexts |
CN109754125A (zh) * | 2019-01-18 | 2019-05-14 | 中国农业大学 | 基于作物模型、历史和气象预报数据的作物产量预报方法 |
CN109767038A (zh) * | 2019-01-04 | 2019-05-17 | 平安科技(深圳)有限公司 | 农作物产量预测方法、装置及计算机可读存储介质 |
-
2019
- 2019-08-05 CN CN201910715296.8A patent/CN110443420B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005151851A (ja) * | 2003-11-21 | 2005-06-16 | Mayekawa Mfg Co Ltd | 農作物需給管理システム、加工食品受発注システム及び農業支援システム |
US20050209897A1 (en) * | 2004-03-16 | 2005-09-22 | Luhr Stanley R | Builder risk assessment system |
US20050234691A1 (en) * | 2004-04-20 | 2005-10-20 | Singh Ramesh P | Crop yield prediction |
JP2010166851A (ja) * | 2009-01-22 | 2010-08-05 | Chiharu Hongo | 作物の収量予測方法及びその装置 |
WO2014203664A1 (ja) * | 2013-06-18 | 2014-12-24 | 株式会社日立製作所 | 収量予測システムおよび収量予測装置 |
JP2015000049A (ja) * | 2013-06-18 | 2015-01-05 | 株式会社日立製作所 | 収量予測システムおよび収量予測装置 |
CN103947401A (zh) * | 2014-04-02 | 2014-07-30 | 山东农业大学 | 利用气象条件提高冬小麦弱势粒的粒重增加产量的方法 |
WO2018075995A1 (en) * | 2016-10-21 | 2018-04-26 | DataRobot, Inc. | Systems for predictive data analytics, and related methods and apparatus |
CN107368687A (zh) * | 2017-07-25 | 2017-11-21 | 中国农业科学院农业信息研究所 | 一种气象单产模型的优选方法及装置 |
CN107341577A (zh) * | 2017-07-25 | 2017-11-10 | 中国农业科学院农业信息研究所 | 一种农作物产量预测方法及系统 |
US20190050948A1 (en) * | 2017-08-08 | 2019-02-14 | Indigo Ag, Inc. | Machine learning in agricultural planting, growing, and harvesting contexts |
CN107766883A (zh) * | 2017-10-13 | 2018-03-06 | 华中师范大学 | 一种基于加权决策树的优化随机森林分类方法及系统 |
CN107909491A (zh) * | 2017-11-30 | 2018-04-13 | 河南云保遥感科技有限公司 | 一种利用空间大数据的产量保险理赔方法 |
CN107957946A (zh) * | 2017-12-01 | 2018-04-24 | 北京理工大学 | 基于邻域嵌入保护算法支持向量机的软件缺陷预测方法 |
CN108287926A (zh) * | 2018-03-02 | 2018-07-17 | 宿州学院 | 一种农业生态多源异构大数据采集、处理与分析架构 |
CN108665107A (zh) * | 2018-05-15 | 2018-10-16 | 中国农业大学 | 农作物产量预测方法和系统 |
CN109325630A (zh) * | 2018-10-12 | 2019-02-12 | 南京农业大学 | 一种基于形态参数的高温胁迫下水稻产量预测方法 |
CN109767038A (zh) * | 2019-01-04 | 2019-05-17 | 平安科技(深圳)有限公司 | 农作物产量预测方法、装置及计算机可读存储介质 |
CN109754125A (zh) * | 2019-01-18 | 2019-05-14 | 中国农业大学 | 基于作物模型、历史和气象预报数据的作物产量预报方法 |
Non-Patent Citations (5)
Title |
---|
GERRIT HOOGENBOOM等: "农业气象学在作物生产模拟及其应用中的作用", 《浙江气象科技》 * |
MD. AKTER HOSSAIN: "Predicting rice yield for Bangladesh by exploiting weather conditions" * |
朱会静;孙海波;: "农作物产量及气象预报方法分析" * |
王风云等: "山东省小麦气象灾害风险评估模型群研发", 《中国农学通报》 * |
陈晨等: "基于支持向量回归机的粮食产量预测研究", 《山西农业大学学报(自然科学版)》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11741555B2 (en) | 2019-11-19 | 2023-08-29 | Zhejiang University | Crop yield estimation method based on deep temporal and spatial feature combined learning |
WO2021098472A1 (zh) * | 2019-11-19 | 2021-05-27 | 浙江大学 | 一种深度时空特征联合学习的农作物产量估测方法 |
CN111507507A (zh) * | 2020-03-24 | 2020-08-07 | 重庆森鑫炬科技有限公司 | 基于大数据的月用水量预测方法 |
CN111428808A (zh) * | 2020-04-08 | 2020-07-17 | 成都爱科特科技发展有限公司 | 一种利用随机森林进行业务分类的方法 |
CN112070241A (zh) * | 2020-09-11 | 2020-12-11 | 腾讯科技(深圳)有限公司 | 基于机器学习模型的植物生长预测方法、装置和设备 |
CN112148785A (zh) * | 2020-09-24 | 2020-12-29 | 中国科学院空天信息创新研究院 | 一种作物分布制图 |
CN112269878A (zh) * | 2020-11-02 | 2021-01-26 | 成都纬创立科技有限公司 | 可解释法律判决预测方法、装置、电子设备及存储介质 |
CN112269878B (zh) * | 2020-11-02 | 2024-03-26 | 成都纬创立科技有限公司 | 可解释法律判决预测方法、装置、电子设备及存储介质 |
CN112580703A (zh) * | 2020-12-07 | 2021-03-30 | 昆明理工大学 | 一种三七病害高发期发病率预测方法 |
CN112580703B (zh) * | 2020-12-07 | 2022-07-05 | 昆明理工大学 | 一种三七病害高发期发病率预测方法 |
CN112785047A (zh) * | 2021-01-06 | 2021-05-11 | 上海信联信息发展股份有限公司 | 农作物的采收量预测方法和装置 |
CN112906298A (zh) * | 2021-02-05 | 2021-06-04 | 重庆邮电大学 | 一种基于机器学习的蓝莓产量预测方法 |
CN112860726A (zh) * | 2021-02-07 | 2021-05-28 | 天云融创数据科技(北京)有限公司 | 结构化查询语句分类模型训练方法和装置 |
CN113298286A (zh) * | 2021-03-31 | 2021-08-24 | 捷佳润科技集团股份有限公司 | 一种基于机器学习的火龙果上市时间预测的方法 |
CN114780599A (zh) * | 2022-04-06 | 2022-07-22 | 四川农业大学 | 基于小麦品比试验数据的综合分析系统 |
CN115796384A (zh) * | 2022-12-22 | 2023-03-14 | 中国农业科学院农业环境与可持续发展研究所 | 用于小麦面包品质预测的系统 |
CN115796384B (zh) * | 2022-12-22 | 2023-11-14 | 中国农业科学院农业环境与可持续发展研究所 | 用于小麦面包品质预测的系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110443420B (zh) | 2023-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443420A (zh) | 一种基于机器学习的作物产量预测方法 | |
US11222385B2 (en) | Method and system for forecasting crop yield | |
CN110471950A (zh) | 一种中小河流实时洪水预报智能模型预报方法 | |
CN113229123A (zh) | 农作物智能灌溉方法、装置、设备及存储介质 | |
CN110147825A (zh) | 一种基于经验模态分解模型的草莓温室温度智能检测装置 | |
Narasimhamurthy et al. | Rice crop yield forecasting using random forest algorithm | |
KR102222004B1 (ko) | 과채류 물동량 예측시스템 및 방법 | |
Dipto et al. | Suitable crop suggesting system based on npk values using machine learning models | |
Choudhury et al. | An acquisition based optimised crop recommendation system with machine learning algorithm | |
Ramachandra et al. | Crop Recommendation Using Machine Learning | |
CN113326882A (zh) | 一种基于分类和回归算法的模型集成方法、装置 | |
Israni et al. | Crop-yield prediction and crop recommendation system | |
Junankar et al. | Wheat Yield Prediction using Temporal Fusion Transformers | |
Deng et al. | Crop planting recommendation algorithm based on ensemble learning | |
Ajmera et al. | Crop, Fertilizer, & Irrigation Recommendation using Machine Learning Techniques | |
Rungyaem et al. | Comparison of 3D Rice Organs Point Cloud Classification Techniques | |
Reddy et al. | Crop Yield Prediction Based on Weather and Soil Parameters Using Regression Tree Model | |
CN117765403B (zh) | 提高作物抗倒伏能力和籽粒品质的施肥方法 | |
Shinde et al. | Plant Growth Recommendation System based on Weather Conditions and Soil Patterns using Machine Learning and Deep Learning Techniques | |
Liu et al. | Research on multi-cluster green persimmon detection method based on improved Faster RCNN | |
Antonio et al. | Deep neural networks for the quantile estimation of regional renewable energy production | |
Alcántara et al. | networks for the quantile estimation of regional renewable energy production. Appl Intell (2022). | |
Jose et al. | Crop Recommendation System Using Fusion Model in Machine Learning | |
CN112446339B (zh) | 一种层次深度学习农作物遥感分类方法 | |
Upadhyay | Intelligent Crop Recommendation using Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |