CN116258060A - 基于机器学习的测土配方施肥方法 - Google Patents
基于机器学习的测土配方施肥方法 Download PDFInfo
- Publication number
- CN116258060A CN116258060A CN202211720448.1A CN202211720448A CN116258060A CN 116258060 A CN116258060 A CN 116258060A CN 202211720448 A CN202211720448 A CN 202211720448A CN 116258060 A CN116258060 A CN 116258060A
- Authority
- CN
- China
- Prior art keywords
- soil
- fertilization
- nest
- tree model
- random tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004720 fertilization Effects 0.000 title claims abstract description 105
- 239000002689 soil Substances 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012360 testing method Methods 0.000 title claims abstract description 50
- 238000010801 machine learning Methods 0.000 title claims abstract description 18
- 239000003337 fertilizer Substances 0.000 claims abstract description 33
- 239000000126 substance Substances 0.000 claims abstract description 27
- 241000544061 Cuculus canorus Species 0.000 claims abstract description 25
- 238000010845 search algorithm Methods 0.000 claims abstract description 22
- 235000015097 nutrients Nutrition 0.000 claims abstract description 19
- 238000009331 sowing Methods 0.000 claims abstract description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 32
- 235000005770 birds nest Nutrition 0.000 claims description 27
- 235000005765 wild carrot Nutrition 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 18
- 229910052700 potassium Inorganic materials 0.000 claims description 17
- 229910052757 nitrogen Inorganic materials 0.000 claims description 16
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 15
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 claims description 15
- 229910052698 phosphorus Inorganic materials 0.000 claims description 15
- 239000011574 phosphorus Substances 0.000 claims description 15
- 239000011591 potassium Substances 0.000 claims description 15
- 235000013601 eggs Nutrition 0.000 claims description 12
- 244000068988 Glycine max Species 0.000 claims description 10
- 235000010469 Glycine max Nutrition 0.000 claims description 10
- 240000008042 Zea mays Species 0.000 claims description 10
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000003066 decision tree Methods 0.000 claims description 9
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 8
- 235000005822 corn Nutrition 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 235000010716 Vigna mungo Nutrition 0.000 claims description 5
- 240000001417 Vigna umbellata Species 0.000 claims description 5
- 235000011453 Vigna umbellata Nutrition 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 230000003301 hydrolyzing effect Effects 0.000 claims description 4
- 238000012804 iterative process Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 239000005416 organic matter Substances 0.000 claims description 2
- PSGCRHLFZJRYEA-UHFFFAOYSA-N phosphorus p2o5 Chemical compound P.O1P(O2)(=O)OP3(=O)OP1(=O)OP2(=O)O3 PSGCRHLFZJRYEA-UHFFFAOYSA-N 0.000 claims description 2
- 238000002203 pretreatment Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 claims 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims 1
- 238000009472 formulation Methods 0.000 claims 1
- 239000000203 mixture Substances 0.000 claims 1
- 238000005259 measurement Methods 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 abstract description 2
- 238000004088 simulation Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 9
- 238000011160 research Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 7
- 241000209094 Oryza Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 235000021049 nutrient content Nutrition 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000000618 nitrogen fertilizer Substances 0.000 description 4
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 239000002686 phosphate fertilizer Substances 0.000 description 3
- 229940072033 potash Drugs 0.000 description 3
- 235000015320 potassium carbonate Nutrition 0.000 description 3
- BWHMMNNQKKPAPP-UHFFFAOYSA-L potassium carbonate Substances [K+].[K+].[O-]C([O-])=O BWHMMNNQKKPAPP-UHFFFAOYSA-L 0.000 description 3
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 238000012271 agricultural production Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000002386 leaching Methods 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- KMUONIBRACKNSN-UHFFFAOYSA-N potassium dichromate Chemical compound [K+].[K+].[O-][Cr](=O)(=O)O[Cr]([O-])(=O)=O KMUONIBRACKNSN-UHFFFAOYSA-N 0.000 description 2
- 238000005295 random walk Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- WYWFMUBFNXLFJK-UHFFFAOYSA-N [Mo].[Sb] Chemical compound [Mo].[Sb] WYWFMUBFNXLFJK-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 238000005904 alkaline hydrolysis reaction Methods 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000005048 flame photometry Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 239000002881 soil fertilizer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Animal Husbandry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Agronomy & Crop Science (AREA)
- Geometry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于机器学习的测土配方施肥方法,包括:收集多地块的土壤理化特征、施肥量数据以及多种农作物在各地块中的产量数据;以农作物产量为目标,构建基于土壤理化特征和施肥量的极端随机树模型,优化极端随机树模型的参数;将不同地块的实测土壤理化特征输入到优化后的极端随机树模型中,以作物产量最大化为目标,采用布谷鸟搜索算法对优化后的极端随机树模型进行迭代计算从而得到最优的施肥量参数,根据得到的施肥量参数进而获得同时满足不同地块土壤养分结构特异性和产量最大化的播种前底肥施入方案。本发明省去了繁琐的田间施肥试验,可方便快捷地获取同时满足不同田块土壤养分结构特异性和产量最大化的播种前底肥施入方案。
Description
技术领域
本发明属于农业施肥的技术领域,具体涉及一种基于机器学习的测土配方施肥方法。
背景技术
测土配方施肥是科学合理使用化肥的重要技术之一,它基于土壤养分测定数据和田间施肥试验,综合考虑土壤供肥能力、作物需肥规律、目标产量和肥料效益,针对性地配置肥料种类、比例和施肥量,满足作物的生长需求,进而提高作物产量,达到高效、高产施肥的目的。同时,测土配方施肥技术可以有效降低农民的施肥强度,优化施肥结构,降低施肥成本。此外,该技术还考虑了土壤原有养分含量及其与作物需肥量的差值关系,有利于改善土壤理化性质,提高土壤微生物种群活性,减少肥料流失。传统测土配方施肥技术研究以田间施肥试验和产量统计数据为基础,从考虑作物产量与施肥量的数学关系入手,利用“最小养分律”和“报酬递减律”等原理建立回归方程,拟合最佳施肥量,构建了应用于不同区域及作物的施肥技术指标体系。但是,作为一种节本增产、环境友好的科学施肥技术,测土配方施肥技术在我国大范围推广已近20年,采用率却十分低下。在我国家庭联产承包制责任制下,小规模农户经营是农业生产活动的主要模式,传统的人工施肥占据主导地位,测土配方施肥技术的面向对象仍是广大个体农户。传统测土配方施肥环节复杂,包括土壤测试、田间试验、配方设计、宣传推广、技术培训等多个步骤,技术实现周期长,学习成本高,存在技术门槛。传统测土配方施肥模型本质上属于回归分析模型,它建立在预测变量与自变量存在某种统一的规律线性关系的假设之上。而小农经营模式下,不同农户从事农业生产活动时的个体差异导致田块的养分结构存在较大异质性,这就意味着不同土地上作物产量与施肥量的关系不能用统一的精确公式表示,在大尺度区域实施传统测土配方施肥试验将耗费大量时间和人力物力。因此,如何创新性地使用测土配方施肥技术,提高测土配方施肥的效率和准确性是目前急需解决的技术难题。
发明内容
本发明的目的在于针对现有技术的不足之处,提供一种基于机器学习和群智能搜索的测土配方施肥方法,该方法将机器学习模型和群智能搜索算法应用于测土配方施肥技术中,利用田间历史土壤养分、施肥及作物产量数据智能制定个性化的田块施肥策略,省去了繁琐的田间施肥试验并提高了施肥方案的准确性,可方便快捷地获取同时满足不同田块土壤养分结构特异性和产量最大化的播种前底肥施入方案。
为解决上述技术问题,本发明采用如下技术方案:
一种基于机器学习的测土配方施肥方法,包括如下步骤:
步骤1,收集多地块的土壤理化特征、施肥量数据以及多种农作物在各地块中的产量数据,并对土壤理化特征、施肥量数据进行预处理;
步骤2,以农作物产量为目标,构建基于土壤理化特征和施肥量的极端随机树模型,将步骤1得到的数据划分为训练集和测试集,并将训练集切分为子集并交替作为训练集和验证集对极端随机树模型进行训练,再基于测试集进行评价以从训练后的模型参数中优选出最优的模型参数作为优化后的极端随机树模型参数;
步骤3,将不同地块的实测土壤理化特征输入到优化后的极端随机树模型中,以作物产量最大化为目标,采用布谷鸟搜索算法对优化后的极端随机树模型进行迭代优化计算从而得到最优的施肥量参数,根据得到的施肥量参数进而获得同时满足不同地块土壤养分结构特异性和产量最大化的播种前底肥施入方案。
进一步地,步骤1中土壤理化特征包括土壤的pH值、有机质含量、水解性氮HN含量、有效磷AP含量以及速效钾AK含量。
进一步地,步骤1中施肥量数据包括氮N、磷P2O5、钾K2O三种肥料的施用量。
进一步地,农作物包括玉米、水稻、大豆。
进一步地,步骤1中预处理方法为将土壤理化特征、施肥量数据进行归一化处理得到各参数的相对值。
进一步地,待优化的模型参数包括决策树个数、最大深度、叶子节点最小样本数、分裂最小样本数、分裂最大特征数。
进一步地,步骤2中的评价指标包括决定系数R2、均方根误差RMSE、平均绝对误差MAE、相对均方根误差RRMSE和平均绝对百分比误差MAPE。
进一步地,布谷鸟搜索算法在计算时遵循三种假设:
(1)每只布谷鸟一次只产一枚卵并随机选择一个鸟巢存放;
(2)选择鸟巢时,只有存放优质卵的鸟巢会被保留到下一代;
(3)鸟巢宿主会以一定概率发现外来卵并将该卵丢弃或重新筑巢;
其中,鸟巢的迭代过程由以下公式表示:
进一步地,步骤3中,采用布谷鸟搜索算法确定最优施肥量值的方法为:
(1)确定布谷鸟搜索算法的参数;
(2)以优化后的极端随机树模型作为目标函数,并固定土壤理化特征量值;
(3)生成初始鸟巢位置即施肥特征量值,并计算对应的目标函数值;
(4)基于莱维飞行法更新鸟巢位置并计算新巢的目标函数值,选择函数值最大的巢作为当前最优巢;
(5)以一定概率丢弃当前鸟巢并随机生成新巢,保留目标函数计算结果更高的巢;
(6)重复以上过程直到目标函数满足收敛条件或迭代次数达到最大值,以当前最佳鸟巢位置为最优施肥特征量值。
进一步地,步骤3中,布谷鸟搜索算法的参数包括但不限于阈值范围、迭代次数、丢弃概率、步长比例因子。
与现有技术相比,本发明的有益效果为:
本发明以作物产量最大化为导向,以单位地块土壤养分参数为依据,使用布谷鸟搜索算法优化模型施肥特征量,求解最优施肥方案,为大尺度区域施肥管理提供了更加便捷、高效的解决方案;本发明提出的施肥方法与传统测土配方施肥方法相比,优势在于无需进行繁琐的田间施肥试验,直接利用历史土壤养分参数、施肥量和产量数据驱动模型,即可方便快速地给出作物施肥配方,在保证准确性的前提下,节省了大量人力物力,提高了配方施肥效率;
此外,本发明施肥策略直接考虑与施肥过程关系最为密切的环境因素,以单位地块土壤养分参数为依据,同时以产量最大化为目标推荐氮磷钾三种主要肥料的施肥配方,具有更强的实用性,而以往许多配方施肥研究的推荐施肥量无法充分考虑不同小区试验结果的差异性,只给出整个大区域的平均推荐施肥量,然而不同区域的作物由于土壤中氮、磷、钾残留量的空间差异,肥料需求可能发生很大变化,因此推荐施肥配方时充分考虑土壤养分的空间变异性,避免过量施肥造成肥料流失引起周围农业环境污染。
附图说明
图1为本发明实施例基于机器学习的测土配方施肥方法的流程图;
图2为本发明实施例极端随机树模型的作物产量模拟值与实际值对比图;
图3为本发明实施例使用极端随机树模型进行产量模拟的特征重要性弦图;
图4为发明实施例在推荐施肥量组合下极端随机树模型预测的作物产量模拟值。
具体实施方式
下面将结合本发明实施例对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合具体实施例对本发明作进一步说明,但不作为本发明的限定。
如图1所示,本发明实施例公开了一种基于机器学习的测土配方施肥方法,包括如下步骤:
步骤1,收集多地块的土壤理化特征、施肥量数据以及多种农作物在各地块中的产量数据,并将地块的土壤理化特征、施肥量数据进行预处理;
本实施例在某年4月以田块为单位于某市采集了5000个点位的0-20cm土壤样本,测量了pH、有机质、水解性氮(HN)、有效磷(AP)和速效钾(AK)等土壤理化特征。其中,土壤有机质含量采用外加热重铬酸钾容量法测定;土壤pH使用电子pH计测量(土壤:水=1:4);水解性氮采用碱解扩散法测量;有效磷含量使用0.5mol/L的碳酸氢钠浸提配合钼锑抗比色法测量;速效钾经1mol/L的乙酸铵浸提后,使用火焰光度法测定含量。上述点位包括了该市玉米、水稻和大豆三种主栽作物。并于该年5月和10月通过区域调查的形式收集了每个田块对应的氮(N)、磷(P2O5)、钾(K2O)三种肥料施用量与作物产量。
在本实施例中,基于收集的样点土壤理化特征数据,采用经典统计方法分析某市耕地的主要土壤理化性质分布特征如表1所示,从表1中可以看出,研究区土壤pH平均值为6.23,呈弱酸性。各土壤理化参数变异系数均在10%-100%之间,属于中等变异,有机质、HN和AK的含量变异性相对较小,均为30%左右,空间分布较为稳定;AP的变异系数大于50%,空间离散程度较高。观察土壤养分参数偏度和峰度值,发现偏度均大于0.5,属于正偏分布。
表1本实施例中某市耕地土壤养分描述性统计分析
对某市的地块采样获取土壤理化特征数据以及施肥量数据,并展示了其中三个地块的数据,如表2所示。
表2实施例中三个样点土壤养分含量及施肥量
为便于比较不同作物的土壤理化特征参数的空间变化情况,对研究区样点土壤中的HN、AP和AK含量以及氮、磷、钾三种主要肥料的施用量作归一化处理,得到各参数的相对值(范围从0到1)。
步骤2,以农作物产量为目标,构建基于土壤理化特征和施肥量的极端随机树模型,将步骤1得到的数据划分为训练集和测试集,并将训练集切分为子集并交替作为训练集和验证集对极端随机树模型训练,再基于测试集进行评价以从训练后的模型参数中优选出最优的模型参数作为优化后的极端随机树模型参数;
极端随机树是一种基于决策树方法的机器学习模型,以基于CART算法构建的决策树为基学习器,每个基学习器可以从原始数据集独立有放回地随机抽取样本并构建子集,之后根据样本特征制定分类(回归)规则,若干基学习器共同组成随机森林,最终用投票(取平均值)的方法确定预测结果。它在构建决策树的过程中运用了较为激进的随机策略,其随机性体现在两个方面:首先,在训练每一棵决策树时都用到了所有的原始样本数据;其次,在选择用于决策树节点分裂的最优特征时,极端随机树会随机选择一个特征子集,并且在每个待选特征的取值范围内随机取值而不是最佳阈值点作为该特征的分裂阈值,之后应用均方误差进行评价选出最优特征。更强的随机性使得极端随机树的计算效率显著提升,但基学习器的误差,尤其是方差会因为难以直接逼近决策边界而增大,因此需要合理地设置模型参数,利用bagging方法的特性,通过多次采样取平均的方式充分降低模型整体的方差,提高整个模型的预测准确性。
在本实施例中,以研究区该年三种主要作物的产量为目标值,基于土壤理化特征和施肥量构建用于预测作物产量的极端随机树模型,并按照7:3的比例将原始数据样本划分为训练集和测试集,训练集和测试集中的土壤理化特征、施肥量数据在输入到极端随机树模型前进行了归一化处理,避免了不同特征量之间因量纲或数量级差异对指标权重产生影响。在采用训练集对极端随机树模型进行训练时,为减小因模型训练数据量过小引起的过拟合问题,使用五折交叉验证法将训练集切分为更小的子集,交替作为训练集和验证集对极端随机树模型进行训练和验证。模型训练过程中,结合网格搜索法和手动搜索法调节模型参数,训练的模型参数包括决策树个数(n_estimators)、最大深度(max_depth)、叶子节点最小样本数(min_samples_leaf)、分裂最小样本数(min_samples_split)、分裂最大特征数(max_features)。在给定参数范围内以一定步长遍历所有可能的组合,使模型发挥出最优性能。之后,基于测试集的数据对比训练后的极端随机树模型在不同模型参数下研究区主要作物产量预测结果,并将作物产量预测结果与作物产量实际结果进行评价,优选出预测精度最高的模型参数作为优化后的极端随机树模型参数。检验极端随机树模型预测性能的评价指标包括决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)、相对均方根误差(RRMSE)和平均绝对百分比误差(MAPE),计算公式分别如下:
在本实施例中,极端随机树模型的验证集和测试集模拟的作物产量结果评价如表3所示,其中,玉米、水稻和大豆的R2分别为0.598、0.775和0.655,而RRMSE和MAPE分别为0.086、0.051、0.078和6.792%、3.906%、5.828%,可见极端随机树模型对三种作物产量的预测准确度从高到低依次为水稻>大豆>玉米,整体上极端随机树模型模拟准确性较高,可有效预测作物产量。
表3基于极端随机树模型的作物产量模拟结果评价
为了进一步说明极端随机树模型的模拟精确度,本实施例基于田块产量实地调查结果,将不同作物依据实际产量划分为若干区间,并与极端随机树模型的模拟值进行对比如图2所示(M1-M8区间的范围分别为<6000、6000-6750、6750-7500、7500-8250、8250-9000、9000-9750、9750-10500和10500-11250;P1-P8区间的范围分别为<6375、6375-6750、6750-7125、7125-7500、7500-7875、7875-8250、8250-8625和8625-9000;S1-S8区间的范围分别为<1800、1800-2100、2100-2400、2400-2700、2700-3000、3000-3300、3600-3900和3900-4200,单位均为kg/ha),以反映研究区作物产量分布及模型模拟效果,同时减少现场调查中因农业生产者对产量估算的随机误差产生的干扰。从图2中可以看出不同作物在各区间内的模拟产量均与实际值接近,进一步说明本实施例建立的极端随机树模型可有效预测作物产量。
步骤3,将不同地块的实测土壤理化特征输入到优化后的极端随机树模型中,以作物产量最大化为目标,采用布谷鸟搜索算法对优化后的极端随机树模型不断进行迭代优化计算从而得到最优的施肥量参数,根据得到的施肥量参数进而获得同时满足不同地块土壤养分结构特异性和产量最大化的播种前底肥施入方案。
极端随机树模型作为基于决策树算法的集成模型,使用基尼重要性和排列重要性作为表征特征重要性的两个主要指标,基尼重要性通过评估使用某特征进行划分时所有节点的平均不纯度减少量对特征的重要性进行排序;排列重要性则是将某种特征值排列顺序随机打乱后重新计算模型预测性能,以模型性能的下降程度表征特征值的重要性。图2为使用极端随机树模型分别进行玉米、水稻和大豆产量模拟的特征重要性弦图,为了使两种特征重要性指标具有可比性,对所有计算值进行了归一化处理,得到相对重要性指数。从图中可以看出,不论是基尼重要性指标还是排列重要性指标,三种作物的氮肥施用量都是极端随机树模型模型模拟时的最重要特征,分别为0.25和0.23左右,排名第二和第三的分别为磷肥施用量和钾肥施用量,基尼重要性指数和排列重要性指数分别约为0.17、0.11和0.14、0.13。结果表明,肥料施用量是影响作物产量的重要因素,使用科学合理的施肥配比可以有效提高作物产量。因此,如何制定出合理的施肥配比是增产的关键。
本实施例将优化后的极端随机树模型与布谷鸟搜索算法耦合,利用布谷鸟搜索算法寻找用于产量模拟的施肥量特征值并将其输入极端随机树模型中,得到作物产量模拟值,以产量最大化为目标不断迭代施肥量特征值,最终得到最优施肥量特征值,以作为推荐施肥配方。其中,在使用布谷鸟搜索算法计算时遵循三种假设:(1)每只布谷鸟一次只产一枚卵并随机选择一个鸟巢存放;(2)选择鸟巢时,只有存放优质卵的鸟巢会被保留到下一代;(3)鸟巢宿主会以一定概率发现外来卵并将该卵丢弃或重新筑巢。鸟巢的迭代过程可由以下公式表示:
式中,和/>分别为第i个鸟巢在第t代和第t+1代的位置,⊕为元素乘积,L(s,λ)为服从莱维分布的随机搜索向量。由于布谷鸟搜索算法在迭代时使用莱维飞行法寻找最优解,将较小步长的局部密集性随机游走和较大步长的全局探索性随机游走相结合,可以有效扩大搜索范围,避免陷入局部最优解。
在本实施例中,在基于已知地块的土壤理化特征参数后,采样布谷鸟搜索算法确定最优施肥特征值的方法为:
(1)确定布谷鸟算法的参数,如阈值范围、迭代次数、丢弃概率、步长比例因子等;
(2)输入优化后的极端随机树模型作为目标函数,并输入已知地块HN、AP、AK等土壤理化特征量值;
(3)生成初始鸟巢位置(施肥特征量值)并计算对应的目标函数值(预测产量);
(4)基于莱维飞行法更新鸟巢位置并计算新巢的目标函数值,选择函数值最大的巢作为当前最优巢;
(5)以一定概率丢弃当前鸟巢并随机生成新巢,保留目标函数计算结果更高的巢;
(6)重复以上过程直到目标函数满足收敛条件或迭代次数达到最大值,以当前最佳鸟巢位置为最优施肥特征量值。
为检验上述计算优化后的极端随机树模型以及采样布谷鸟搜索算法计算施肥方案的有效性和稳定性,将其应用于在不同土壤养分含量区域中,运用分层随机抽样法在三种作物中各随机选取100个样点进行测试,输入样点的土壤理化参数,设置优化算法种群规模n=25,切换概率Pa=0.25,迭代次数为300。运行后得到各样点对应的推荐施肥配方和预测产量,记录推荐施肥量组合下产量预测值的统计量并与实际值比较如表4所示。由表4可以发现,极端随机树模型可以在准确预测作物产量的基础上,针对不同区域的土壤理化特征含量搜索最优施肥特征量组合,使每个地块的产量尽可能逼近该种作物产量的最大值。从表4可以看出,玉米、水稻和大豆的产量模拟的平均值分别较观测值提高了23.9%、13.3%和34.9%,分别为对应作物产量最大值的96.8%、96.3%和94.4%,可见优化后的配方施肥方案对于产量提升效果显著。此外,经过参数寻优后的三种作物产量模拟值分布如图3所示,分别有75%以上的模拟值达到了最大值的96.1%、95.5%和92.7%,三种作物的产量模拟值标准差均不超过10,在不同作物及土壤养分情况下表现出了较强的稳定性,能够有效克服研究区田块土壤性质的异质性。
表4本实施例的极端随机树模型模拟值统计量与实际产量对比
通过总结分析大量文献及试验数据,得到本实施例中某市的玉米和水稻的推荐施肥量分别为:玉米的推荐施氮量为150-188kg/ha,施磷量为75-97kg/ha,施钾量为57-60kg/ha;水稻适宜氮肥施用量为116-156kg/ha,磷肥施用量为64-70kg/ha,钾肥施用量为45-59kg/ha;玉米优化施肥量为氮肥176-180kg/ha,磷肥65-70kg/ha,钾肥为75-90kg/ha;水稻最佳施氮量为112.3-150kg/ha,最佳施磷量为46.7-63.1kg/ha,最佳施钾量为38.3-57.5kg/ha。通过开展测土配方施肥试验,认为该市大豆最佳施氮量为28.4-36.3kg/ha,最佳施磷量为38.9-47.7kg/ha,最佳施钾量为43.2-51.2kg/ha;大豆推荐施氮肥为43.5-60kg/ha,,磷肥为55.5-75.0kg/ha,钾肥为46.5-61.5kg/ha。而采样本实施例的方法对100个抽样样点换算后的生育期内推荐施肥配方范围如表5所示,本实施例计算得到的某市玉米氮、磷、钾肥的推荐施用范围分别为133.5-240.0kg/ha、63.0-91.5kg/ha和46.5-112.5kg/ha,水稻氮、磷、钾肥的推荐施用范围分别为111.0-162.0kg/ha、37.5-79.5kg/ha、46.5-79.5kg/ha;大豆的氮、磷、钾肥的推荐施用范围分别为37.5-57.0kg/ha、55.5-105.0kg/ha、46.5-73.5kg/ha。通过对比分析,可以发现本实施例采样布谷鸟搜索算法计算的推荐施肥量与以往该市作物最优施肥配方研究结果基本一致,但推荐的施肥范围普遍更大,主要是因为模型针对不同田块的原有土壤养分含量给出了个性化的施肥方案,在土壤肥力明显偏低/偏高的田块中,推荐施肥量会存在远高于/低于平均水平的情况。基于以上验证分析,本实施例构建的施肥方法可以基于不同田块土壤理化性质给出稳定、高产的推荐施肥配方,尤其是底肥施入阶段。但对于作物生育期全过程的施肥管理方案需要做进一步更加细致的探索。
表5为本实施例研究区作物施肥决策的模拟结果
综上可见,本实施例以作物产量最大化为导向,以单位地块土壤养分参数为依据,使用布谷鸟搜索算法优化模型施肥特征量,求解最优施肥方案,构建了有效的施肥措施。经检验,本实施例使研究区三种作物产量的平均值在原有基础上分别提高23.9%、13.3%和34.9%,为大尺度区域施肥管理提供了更加便捷、高效的解决方案。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (10)
1.一种基于机器学习的测土配方施肥方法,其特征在于,包括如下步骤:
步骤1,收集多地块的土壤理化特征、施肥量数据以及多种农作物在各地块中的产量数据,并对土壤理化特征、施肥量数据进行预处理;
步骤2,以农作物产量为目标,构建基于土壤理化特征和施肥量的极端随机树模型,将步骤1得到的数据划分为训练集和测试集,并将训练集切分为子集并交替作为训练集和验证集对极端随机树模型进行训练,再基于测试集进行评价以从训练后的模型参数中优选出最优的模型参数作为优化后的极端随机树模型参数;
步骤3,将不同地块的实测土壤理化特征输入到优化后的极端随机树模型中,以作物产量最大化为目标,采用布谷鸟搜索算法对优化后的极端随机树模型进行迭代优化计算从而得到最优的施肥量参数,根据得到的施肥量参数进而获得同时满足不同地块土壤养分结构特异性和产量最大化的播种前底肥施入方案。
2.根据权利要求1所述的基于机器学习的测土配方施肥方法,其特征在于,步骤1中土壤理化特征包括土壤的pH值、有机质含量、水解性氮HN含量、有效磷AP含量以及速效钾AK含量。
3.根据权利要求1所述的基于机器学习的测土配方施肥方法,其特征在于,步骤1中施肥量数据包括氮N、磷P2O5、钾K2O三种肥料的施用量。
4.根据权利要求1所述的基于深度学习的测土配方施肥方法,其特征在于,农作物包括玉米、水稻、大豆。
5.根据权利要求1所述的基于深度学习的测土配方施肥方法,其特征在于,步骤1中预处理方法为将土壤理化特征、施肥量数据进行归一化处理得到各参数的相对值。
6.根据权利要求1所述的基于机器学习的测土配方施肥方法,其特征在于,待优化的模型参数包括决策树个数、最大深度、叶子节点最小样本数、分裂最小样本数、分裂最大特征数。
7.根据权利要求1所述的基于机器学习的测土配方施肥方法,其特征在于,步骤2中的评价指标包括决定系数R2、均方根误差RMSE、平均绝对误差MAE、相对均方根误差RRMSE和平均绝对百分比误差MAPE。
9.根据权利要求1所述的基于机器学习的测土配方施肥方法,其特征在于,步骤3中,采用布谷鸟搜索算法确定最优施肥量值的方法为:
(1)确定布谷鸟搜索算法的参数;
(2)以优化后的极端随机树模型作为目标函数,并固定土壤理化特征量值;
(3)生成初始鸟巢位置即施肥特征量值,并计算对应的目标函数值;
(4)基于莱维飞行法更新鸟巢位置并计算新巢的目标函数值,选择函数值最大的巢作为当前最优巢;
(5)以一定概率丢弃当前鸟巢并随机生成新巢,保留目标函数计算结果更高的巢;
(6)重复以上过程直到目标函数满足收敛条件或迭代次数达到最大值,以当前最佳鸟巢位置为最优施肥特征量值。
10.根据权利要求9所述的基于机器学习的测土配方施肥方法,其特征在于,步骤3中,布谷鸟搜索算法的参数包括但不限于阈值范围、迭代次数、丢弃概率、步长比例因子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211720448.1A CN116258060A (zh) | 2022-12-30 | 2022-12-30 | 基于机器学习的测土配方施肥方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211720448.1A CN116258060A (zh) | 2022-12-30 | 2022-12-30 | 基于机器学习的测土配方施肥方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116258060A true CN116258060A (zh) | 2023-06-13 |
Family
ID=86687173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211720448.1A Pending CN116258060A (zh) | 2022-12-30 | 2022-12-30 | 基于机器学习的测土配方施肥方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116258060A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117455066A (zh) * | 2023-11-13 | 2024-01-26 | 哈尔滨航天恒星数据系统科技有限公司 | 一种基于多策略优化随机森林的玉米种植精准配肥方法、电子设备及存储介质 |
CN117480927A (zh) * | 2023-11-17 | 2024-02-02 | 山东省农业科学院 | 一种智能施肥方法及装置 |
CN117976081A (zh) * | 2024-04-02 | 2024-05-03 | 北京市农林科学院 | 基于模型预测优化的堆肥配方方法、系统、设备及介质 |
-
2022
- 2022-12-30 CN CN202211720448.1A patent/CN116258060A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117455066A (zh) * | 2023-11-13 | 2024-01-26 | 哈尔滨航天恒星数据系统科技有限公司 | 一种基于多策略优化随机森林的玉米种植精准配肥方法、电子设备及存储介质 |
CN117480927A (zh) * | 2023-11-17 | 2024-02-02 | 山东省农业科学院 | 一种智能施肥方法及装置 |
CN117480927B (zh) * | 2023-11-17 | 2024-06-11 | 山东省农业科学院 | 一种智能施肥方法及装置 |
CN117976081A (zh) * | 2024-04-02 | 2024-05-03 | 北京市农林科学院 | 基于模型预测优化的堆肥配方方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116258060A (zh) | 基于机器学习的测土配方施肥方法 | |
CN112906298B (zh) | 一种基于机器学习的蓝莓产量预测方法 | |
Kiniry et al. | Rice parameters describing crop performance of four US cultivars | |
CN109374860A (zh) | 一种基于机器学习算法的土壤养分预测及综合评价方法 | |
CN107329511A (zh) | 基于适宜根温区间的水培蔬菜光环境高效调控方法与系统 | |
CN106408132A (zh) | 一种基于种植设备的作物产量预测方法及装置 | |
CN107832892A (zh) | 一种基于组合优化的多块地选种决策优化方法 | |
CN109858180B (zh) | 一种区域作物耗水空间格局优化设计方法 | |
CN109214591B (zh) | 一种木本植物地上生物量预测方法及系统 | |
Sharma et al. | Nitrogen and potassium application effects on productivity, profitability and nutrient use efficiency of irrigated wheat (Triticum aestivum L.) | |
CN110569605A (zh) | 一种基于nsga2-elm的粳稻叶片氮素含量反演模型方法 | |
CN115063252A (zh) | 一种基于神经网络的农作物肥料精准施用方法与系统 | |
Wang et al. | Digital image processing technology under backpropagation neural network and K-Means Clustering algorithm on nitrogen utilization rate of Chinese cabbages | |
Du et al. | Corn variable-rate seeding decision based on gradient boosting decision tree model | |
CN113139717B (zh) | 作物苗情分级遥感监测方法及装置 | |
CN105913326B (zh) | 约束性知识与精英个体策略遗传算法融合的作物生育期模型品种参数优化方法 | |
Mishra et al. | Crop recommendation system using knn and random forest considering indian data set | |
CN111126827A (zh) | 一种基于bp人工神经网络的投入产出核算模型构建方法 | |
CN109472320B (zh) | 不确定条件下作物生育期模型品种参数自动校正方法 | |
CN116595333A (zh) | 土壤-气候智慧型的水稻目标产量与氮肥用量确定方法 | |
Pradeep et al. | Effective Crop Yield Prediction Using Gradient Boosting To Improve Agricultural Outcomes | |
Maksimović et al. | Multi-attribute analysis of orchard according to the integrated production concept | |
CN111257240B (zh) | 基于近地高光谱数据和集成模型的油菜氮磷钾养分诊断方法 | |
Jiao et al. | [Retracted] Prediction Model of Rice Seedling Growth and Rhizosphere Fertility Based on the Improved Elman Neural Network | |
Bhatia | Crop growth simulation modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |