CN117455062A - 一种基于多源异构农业数据的农作物产量预测算法 - Google Patents
一种基于多源异构农业数据的农作物产量预测算法 Download PDFInfo
- Publication number
- CN117455062A CN117455062A CN202311488102.8A CN202311488102A CN117455062A CN 117455062 A CN117455062 A CN 117455062A CN 202311488102 A CN202311488102 A CN 202311488102A CN 117455062 A CN117455062 A CN 117455062A
- Authority
- CN
- China
- Prior art keywords
- data
- yield
- crop
- yield prediction
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 28
- 230000012010 growth Effects 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 22
- 230000007613 environmental effect Effects 0.000 claims abstract description 14
- 241000607479 Yersinia pestis Species 0.000 claims abstract description 8
- 238000003973 irrigation Methods 0.000 claims abstract description 6
- 230000002262 irrigation Effects 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 239000002689 soil Substances 0.000 claims description 32
- 238000012549 training Methods 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000005259 measurement Methods 0.000 claims description 14
- 229930002875 chlorophyll Natural products 0.000 claims description 12
- 235000019804 chlorophyll Nutrition 0.000 claims description 12
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 claims description 12
- 230000010354 integration Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- 238000001556 precipitation Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000009825 accumulation Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 235000013399 edible fruits Nutrition 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 235000021049 nutrient content Nutrition 0.000 claims description 6
- 230000005855 radiation Effects 0.000 claims description 6
- 238000000638 solvent extraction Methods 0.000 claims description 6
- 241000894007 species Species 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000012300 Sequence Analysis Methods 0.000 claims description 3
- 244000038559 crop plants Species 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000003306 harvesting Methods 0.000 claims description 3
- 230000008635 plant growth Effects 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 238000009331 sowing Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 2
- 238000002203 pretreatment Methods 0.000 claims 1
- 230000004720 fertilization Effects 0.000 abstract description 2
- 230000002596 correlated effect Effects 0.000 abstract 1
- 241000196324 Embryophyta Species 0.000 description 20
- 238000012271 agricultural production Methods 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000012272 crop production Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Marine Sciences & Fisheries (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Mining & Mineral Resources (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多源异构农业数据的农作物产量预测算法,包括以下步骤:通过多个来源获取原始农业数据,预处理获取大数据平台农业数据,获取农作物在生长周期内各时间点的原始状态信息和样本状态信息,生成标准数据信息,训练产量预测模型,得到标准预测产量,验证标准预测产量精度和预测能力。本发明在农作物产量预测过程中,同时将农作物当前状态数据和环境数据作物考虑因素,并将两者进行深度关联,大大提高了农作物产量预测的准确度。这种综合考虑农作物状态和环境因素的方法,可以为农业决策提供更准确的决策支持,例如灌溉调度、施肥方案和病虫害防控等,帮助农民优化农田管理,提高农作物产量和经济效益。
Description
技术领域
本发明属于农业生产技术领域,尤其涉及一种基于多源异构农业数据的农作物产量预测算法。
背景技术
随着大数据和物联网技术的迅速发展,农业领域积累了大量的多源异构数据。这些数据可以来源于传感器、卫星遥感技术、气象观测、人工采集等多个渠道,涵盖了农作物生产的各个环节。农业数据的积累和利用对于实现粮食安全至关重要。农作物产量的高低直接影响着粮食供应和人类的生活。
近年来,多源异构农业数据在建立作物性状评估模型方面展现出了较高的预测精度和鲁棒性。多源异构农业数据可以提供丰富的信息,涵盖了作物生长和产量的多个方面。通过结合不同数据源的信息,可以更全面地捕捉作物生长环境、土壤条件、气象变化等因素对作物性状的影响,从而提高预测精度。不同数据源和设备生成的数据具有不同的特征表示,例如遥感数据可以提供空间信息,气象数据可以提供时间序列信息,土壤数据可以提供土壤特性等。这些多样性特征的结合可以增加模型对作物性状的理解和预测能力。不同数据源之间存在互补性。通过将多个数据源的信息进行融合,可以弥补单一数据源的不足,提高模型的鲁棒性和泛化能力。
因此,充分利用农业领域积累的多源异构数据,对农作物产量进行准确预测和管理,对于保障粮食安全和提高农业生产效益具有重要意义。
发明内容
为解决上述技术问题,本发明提供了一种基于多源异构农业数据的农作物产量预测算法。
本发明通过以下技术方案得以实现。
本发明提供的一种基于多源异构农业数据的农作物产量预测算法,包括以下步骤:
步骤S1、通过多个来源获取原始农业数据;
步骤S2、通过对原始农业数据进行预处理,获取大数据平台农业数据;
步骤S3、通过大数据平台农业数据,获取农作物在生长周期内各时间点的原始状态信息和样本状态信息;
步骤S4、根据农作物在生长周期内各时间点的原始状态信息和样本状态信息生成标准数据信息;
步骤S5、根据标准数据信息训练产量预测模型;
步骤S6、通过产量预测模型,结合集成学习算法,得到标准预测产量;
步骤S7、计算标准预测产量与农作物产量实测值之间的误差指标,验证标准预测产量精度和预测能力。
优选地,所述多个来源包括:卫星遥感、地面传感器、气象平台和人工采集;
所述原始农业数据包括:通过卫星遥感获取的数据、通过地面传感器获取的数据、通过气象平台获取的数据、通过人工采集获取的数据;
所述卫星遥感获取的数据包括:农作物类型、农作物分布面积、植被指数、农作物生长状态、叶面积指数、植被覆盖度和叶绿素含量;
所述通过地面传感器获取的数据包括:土壤湿度、土壤温度、棚内温度、土壤酸碱度、土壤养分含量、植物生长水位;
所述通过气象平台获取的数据包括:日最高温度、日最低温度、平均温度、降水频率、降水量、日照时长、辐射强度、风速和风向;
所述通过人工采集获取的数据包括:土壤样本数据、农田面积、播种密度、农作物植株高度、茎粗、施肥量、灌溉量、病虫害防治情况以及用于验证和校正产量预测模型准确性的农作物实际收获情况数据。
优选地,所述预处理包括:数据格式标准化、数据清洗、特征选择、数据转换、数据集成、数据降维和数据划分;
所述数据格式标准化包括统一时间戳格式、数据单位的转换和数据范围的归一化;
所述数据清洗包括填补缺失值、去除异常值和平滑噪声;
所述特征选择指针对不同的数据特征,通过评估特征的重要性或相关性,选择对目标预测有较大影响的特征进行提取,所述评估特征的方法包括统计方法、频域分析和时频分析;
所述数据转换指将不同格式的数据转化为可供产量预测模型使用的数据,所述数据转换包括对文本型数据进行文本处理和特征提取、对图像型数据进行图像处理和特征提取、对时序数据进行序列分析和序列建模;
所述数据集成指将不同来源的数据整合在一起,建立一个综合的数据集,所述数据集成包括数据对齐、数据合并和数据关联;
所述数据降维指对维度较高的数据使用降维技术,所述降维技术包括主成分分析;
所述数据划分指将数据划分为训练集、验证集和测试集,所述训练集用于训练模型过程中调整模型的参数和超参数,所述验证集用于产量预测模型的评估,所述测试集用于评估模型的预测性能。
优选地,所述原始状态信息Mdata包括气象数据、土壤数据、农作物生长数据、其他环境数据;
所述样本状态信息Msample包括农作物生长数据、待预测区域历史产量数据和其他环境数据;
所述气象数据包括气温、降水量、日照时长和辐射强度;
所述土壤数据包括土壤pH值、土壤湿度和土壤养分含量;
所述农作物生长数据包括植株高度、叶面积指数、叶绿素含量、干物质累积量和植株叶片颜色;
所述其他环境数据包括地理位置、海拔高度、倾斜度和病虫害发生情况。
优选地,所述步骤S4具体步骤为:基于待预测区域内农作物生长周期内各时间点的样本状态信息Msample,对农作物在生长周期内各时间点的原始状态信息Mdata进行修正,获得待预测区域内农作物在生长周期内各时间点用来进行产量预测模型训练的标准数据信息MSTD。
所述MSTD是由农作物种类、植株高度、叶面积指数、叶绿素含量、干物质累积量、是否结果、植株叶片颜色、果实尺寸组成的集合,表示为:
其中V为农作物种类;H为植株高度;Sch l为叶面积指数;Rch l为植株叶绿素含量;Ach l为植株干物质累积量;分别表示植株已结果/植株尚未结果;Rch l表示植株叶片颜色;Cf表示已经结果的果实尺寸大小。
优选地,所述步骤S5具体步骤包括:
标准数据信息MSTD通过随机采样得到含m个训练样本的采样集;
基于采样集训练产量预测模型,通过网格搜索方法来获取最优参数组合,根据最优超参数训练最优参数产量预测模型;
所述产量预测模型包括支持向量回归SVR产量预测模型、核岭回归KRR产量预测模型和Lasso产量预测模型。
优选地,所述步骤S6具体步骤为:通过产量预测模型,结合集成学习Bagging算法采用简单平均获取最终预测结果得到标准预测产量,具体表达式如下:
式中,Spre_svr是通过支持向量回归SVR产量预测模型得的预测产量;Spre_krr是通过核岭回归KRR产量预测模型得到的预测产量;Spre_lasso是通过Lasso产量预测模型得到的预测产量;Spre是由Bagging集成学习算法,通过结合产量预测模型得到的标准预测产量。
优选地,所述误差指标包括标准预测产量和农作物产量实测值交叉验证结果的决定系数R2、平均绝对误差MAE和均方根误差MSE;
所述农作物产量实测值通过样本状态信息Msample中的待预测区域历史产量数据获取。
优选地,所述决定系数R2、平均绝对误差MAE和均方根误差RMSE计算公式如下:
式中,yi为农作物产量实测值,为农作物产量实测值的平均值,/>为标准预测产量,m为模型检验样本个数。
本发明的有益效果在于:
该方法在农作物产量预测过程中,同时将农作物当前状态数据和环境数据作物考虑因素,并将两者进行深度关联,大大提高了农作物产量预测的准确度。这种综合考虑农作物状态和环境因素的方法,可以为农业决策提供更准确的决策支持,例如灌溉调度、施肥方案和病虫害防控等,帮助农民优化农田管理,提高农作物产量和经济效益。
附图说明
图1是本发明实施例的方法流程图;
图2是本发明实施例的产量预测模型训练流程图。
具体实施方式
下面进一步描述本发明的技术方案,但要求保护的范围并不局限于所述。
如图1所示,一种基于多源异构农业数据的农作物产量预测算法,包括以下步骤:
步骤S1、通过多个来源获取原始农业数据;
所述多个来源包括:卫星遥感、地面传感器、气象平台和人工采集;
所述原始农业数据包括:通过卫星遥感获取的数据、通过地面传感器获取的数据、通过气象平台获取的数据、通过人工采集获取的数据;
所述卫星遥感获取的数据包括:农作物类型、农作物分布面积、植被指数、农作物生长状态、叶面积指数、植被覆盖度和叶绿素含量;
所述通过地面传感器获取的数据包括:土壤湿度、土壤温度、棚内温度、土壤酸碱度、土壤养分含量、植物生长水位;
对于水田或水稻种植等需要水体管理的农作物,传感器可以测量水位,帮助控制灌溉和排水;
所述通过气象平台获取的数据包括:日最高温度、日最低温度、平均温度、降水频率、降水量、日照时长、辐射强度、风速和风向;
所述通过人工采集获取的数据包括:土壤样本数据、农田面积、播种密度、农作物植株高度、茎粗、施肥量、灌溉量、病虫害防治情况以及用于验证和校正产量预测模型准确性的农作物实际收获情况数据。
这些数据的多样性和异构性为农业生产和决策提供了重要的信息和支持,合理收集、整合和分析这些数据,将有助于优化农业生产过程,提高农产品的质量和产量,有助于农业决策的制定和优化。
步骤S2、通过对原始农业数据进行预处理,获取大数据平台农业数据;
所述预处理包括:数据格式标准化、数据清洗、特征选择、数据转换、数据集成、数据降维和数据划分;
所述数据格式标准化包括统一时间戳格式、数据单位的转换和数据范围的归一化;
对于不同设备源的数据,可以首先进行数据标准化处理,将其转换为统一的数据格式,使其具有一致的结构和字段,这一过程通过编写自定义的数据转换脚本或使用专门的数据处理工具来实现,常用的数据表转化方法包括:Z-score标准化、最小-最大标准化等。通过数据标准化,可以使得不同设备源的数据具有一致的表示方式,方便后续的数据处理和分析。
所述数据清洗包括填补缺失值、去除异常值和平滑噪声;
缺失值通过插值或填充算法进行处理,异常值可以通过统计方法或机器学习算法进行检测和处理,噪声可以通过平滑或滤波技术进行消除。这样将提高数据的质量和准确性,避免对后续模型的影响。如果不同设备源的数据存在时间或空间上的不一致性,可以进行数据对齐或重采样,使得数据具有一致的时间或空间间隔。
所述特征选择指针对不同的数据特征,通过评估特征的重要性或相关性,选择对目标预测有较大影响的特征进行提取,所述评估特征的方法包括统计方法、频域分析和时频分析;
从原始数据中提取出更具有代表性和有效的特征。
所述数据转换指将不同格式的数据转化为可供产量预测模型使用的数据,所述数据转换包括对文本型数据进行文本处理和特征提取、对图像型数据进行图像处理和特征提取、对时序数据进行序列分析和序列建模;
所述数据集成指将不同来源的数据整合在一起,建立一个综合的数据集,所述数据集成包括数据对齐、数据合并和数据关联;
数据集成为后续的模型训练和预测提供统一的数据源。
所述数据降维指对维度较高的数据使用降维技术,所述降维技术包括主成分分析,以减少数据的复杂性和计算负担,并提高模型的效率和准确性;
所述数据划分指将数据划分为训练集、验证集和测试集,所述训练集用于训练模型过程中调整模型的参数和超参数,所述验证集用于产量预测模型的评估,所述测试集用于评估模型的预测性能;合理的数据划分可以帮助评估模型的性能和泛化能力。
步骤S3、通过大数据平台农业数据,获取农作物在生长周期内各时间点的原始状态信息和样本状态信息;
所述原始状态信息Mdata包括气象数据、土壤数据、农作物生长数据、其他环境数据;
所述样本状态信息Msample包括农作物生长数据、待预测区域历史产量数据和其他环境数据;
所述气象数据包括气温、降水量、日照时长和辐射强度;
所述土壤数据包括土壤pH值、土壤湿度和土壤养分含量;
所述农作物生长数据包括植株高度、叶面积指数、叶绿素含量、干物质累积量和植株叶片颜色;
所述其他环境数据包括地理位置、海拔高度、倾斜度和病虫害发生情况。
步骤S4、根据农作物在生长周期内各时间点的原始状态信息和样本状态信息生成标准数据信息;
所述步骤S4具体步骤为:基于待预测区域内农作物生长周期内各时间点的样本状态信息Msample,对农作物在生长周期内各时间点的原始状态信息Mdata进行修正,获得待预测区域内农作物在生长周期内各时间点用来进行产量预测模型训练的标准数据信息MSTD。
所述MSTD是由农作物种类、植株高度、叶面积指数、叶绿素含量、干物质累积量、是否结果、植株叶片颜色、果实尺寸组成的集合,表示为:
其中V为农作物种类;H为植株高度;Sch l为叶面积指数;Rch l为植株叶绿素含量;Ack l为植株干物质累积量;分别表示植株已结果/植株尚未结果;Rch l表示植株叶片颜色;Cf表示已经结果的果实尺寸大小。
步骤S5、根据标准数据信息训练产量预测模型;
如图2所示,所述步骤S5具体步骤包括:
标准数据信息MSTD通过随机采样得到含m个训练样本的采样集;
基于采样集训练产量预测模型,通过网格搜索方法来获取最优参数组合,根据最优超参数训练最优参数产量预测模型;
所述产量预测模型包括支持向量回归SVR产量预测模型、核岭回归KRR产量预测模型和Lasso产量预测模型。
步骤S6、通过产量预测模型,结合集成学习算法,得到标准预测产量;
所述步骤S6具体步骤为:通过产量预测模型,结合集成学习Bagging算法采用简单平均获取最终预测结果得到标准预测产量,具体表达式如下:
式中,Spre_svr是通过支持向量回归SVR产量预测模型得的预测产量;Spre_krr是通过核岭回归KRR产量预测模型得到的预测产量;Spre_lasso是通过Lasso产量预测模型得到的预测产量;Spre是由Bagging集成学习算法,通过结合产量预测模型得到的标准预测产量。
步骤S7、计算标准预测产量与农作物产量实测值之间的误差指标,验证标准预测产量精度和预测能力。
所述误差指标包括标准预测产量和农作物产量实测值交叉验证结果的决定系数R2、平均绝对误差MAE和均方根误差MSE;
所述农作物产量实测值通过样本状态信息Msample中的待预测区域历史产量数据获取。
所述决定系数R2、平均绝对误差MAE和均方根误差RMSE计算公式如下:
式中,yi为农作物产量实测值,为农作物产量实测值的平均值,/>为标准预测产量,m为模型检验样本个数。
本发明中使用多源异构农业数据通过机器学习算法进行模型优化。通过训练和调整模型,可以根据不同数据源的权重和贡献,自动学习和提取最有价值的特征信息,从而提高预测精度和鲁棒性,为农业管理和决策提供了可靠的工具和方法。
Claims (9)
1.一种基于多源异构农业数据的农作物产量预测算法,其特征在于,包括以下步骤:
步骤S1、通过多个来源获取原始农业数据;
步骤S2、通过对原始农业数据进行预处理,获取大数据平台农业数据;
步骤S3、通过大数据平台农业数据,获取农作物在生长周期内各时间点的原始状态信息和样本状态信息;
步骤S4、根据农作物在生长周期内各时间点的原始状态信息和样本状态信息生成标准数据信息;
步骤S5、根据标准数据信息训练产量预测模型;
步骤S6、通过产量预测模型,结合集成学习算法,得到标准预测产量;
步骤S7、计算标准预测产量与农作物产量实测值之间的误差指标,验证标准预测产量精度和预测能力。
2.如权利要求1所述的一种农作物产量预测算法,其特征在于,所述多个来源包括:卫星遥感、地面传感器、气象平台和人工采集;
所述原始农业数据包括:通过卫星遥感获取的数据、通过地面传感器获取的数据、通过气象平台获取的数据、通过人工采集获取的数据;
所述卫星遥感获取的数据包括:农作物类型、农作物分布面积、植被指数、农作物生长状态、叶面积指数、植被覆盖度和叶绿素含量;
所述通过地面传感器获取的数据包括:土壤湿度、土壤温度、棚内温度、土壤酸碱度、土壤养分含量、植物生长水位;
所述通过气象平台获取的数据包括:日最高温度、日最低温度、平均温度、降水频率、降水量、日照时长、辐射强度、风速和风向;
所述通过人工采集获取的数据包括:土壤样本数据、农田面积、播种密度、农作物植株高度、茎粗、施肥量、灌溉量、病虫害防治情况以及用于验证和校正产量预测模型准确性的农作物实际收获情况数据。
3.如权利要求1所述的一种农作物产量预测算法,其特征在于,所述预处理包括:数据格式标准化、数据清洗、特征选择、数据转换、数据集成、数据降维和数据划分;
所述数据格式标准化包括统一时间戳格式、数据单位的转换和数据范围的归一化;
所述数据清洗包括填补缺失值、去除异常值和平滑噪声;
所述特征选择指针对不同的数据特征,通过评估特征的重要性或相关性,选择对目标预测有较大影响的特征进行提取,所述评估特征的方法包括统计方法、频域分析和时频分析;
所述数据转换指将不同格式的数据转化为可供产量预测模型使用的数据,所述数据转换包括对文本型数据进行文本处理和特征提取、对图像型数据进行图像处理和特征提取、对时序数据进行序列分析和序列建模;
所述数据集成指将不同来源的数据整合在一起,建立一个综合的数据集,所述数据集成包括数据对齐、数据合并和数据关联;
所述数据降维指对维度较高的数据使用降维技术,所述降维技术包括主成分分析;
所述数据划分指将数据划分为训练集、验证集和测试集,所述训练集用于训练模型过程中调整模型的参数和超参数,所述验证集用于产量预测模型的评估,所述测试集用于评估模型的预测性能。
4.如权利要求1所述的一种农作物产量预测算法,其特征在于,所述原始状态信息Mdata包括气象数据、土壤数据、农作物生长数据、其他环境数据;
所述样本状态信息Msample包括农作物生长数据、待预测区域历史产量数据和其他环境数据;
所述气象数据包括气温、降水量、日照时长和辐射强度;
所述土壤数据包括土壤pH值、土壤湿度和土壤养分含量;
所述农作物生长数据包括植株高度、叶面积指数、叶绿素含量、干物质累积量和植株叶片颜色;
所述其他环境数据包括地理位置、海拔高度、倾斜度和病虫害发生情况。
5.如权利要求1所述的一种农作物产量预测算法,其特征在于,所述步骤S4具体步骤为:基于待预测区域内农作物生长周期内各时间点的样本状态信息Msample,对农作物在生长周期内各时间点的原始状态信息Mdata进行修正,获得待预测区域内农作物在生长周期内各时间点用来进行产量预测模型训练的标准数据信息MSTD。
所述MSTD是由农作物种类、植株高度、叶面积指数、叶绿素含量、干物质累积量、是否结果、植株叶片颜色、果实尺寸组成的集合,表示为:
其中V为农作物种类;H为植株高度;Schl为叶面积指数;Rchl为植株叶绿素含量;Achl为植株干物质累积量;分别表示植株已结果/植株尚未结果;Rchl表示植株叶片颜色;Cf表示已经结果的果实尺寸大小。
6.如权利要求1所述的一种农作物产量预测算法,其特征在于,所述步骤S5具体步骤包括:
标准数据信息MSTD通过随机采样得到含m个训练样本的采样集;
基于采样集训练产量预测模型,通过网格搜索方法来获取最优参数组合,根据最优超参数训练最优参数产量预测模型;
所述产量预测模型包括支持向量回归SVR产量预测模型、核岭回归KRR产量预测模型和Lasso产量预测模型。
7.如权利要求1所述的一种农作物产量预测算法,其特征在于,所述步骤S6具体步骤为:通过产量预测模型,结合集成学习Bagging算法采用简单平均获取最终预测结果得到标准预测产量,具体表达式如下:
式中,Spre_svr是通过支持向量回归SVR产量预测模型得的预测产量;Spre_krr是通过核岭回归KRR产量预测模型得到的预测产量;Spre_lasso是通过Lasso产量预测模型得到的预测产量;Spre是由Bagging集成学习算法,通过结合产量预测模型得到的标准预测产量。
8.如权利要求1所述的一种农作物产量预测算法,其特征在于,所述误差指标包括标准预测产量和农作物产量实测值交叉验证结果的决定系数R2、平均绝对误差MAE和均方根误差MSE;
所述农作物产量实测值通过样本状态信息Msample中的待预测区域历史产量数据获取。
9.如权利要求8所述的一种农作物产量预测算法,其特征在于:所述决定系数R2、平均绝对误差MAE和均方根误差RMSE计算公式如下:
式中,yi为农作物产量实测值,为农作物产量实测值的平均值,/>为标准预测产量,m为模型检验样本个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311488102.8A CN117455062A (zh) | 2023-11-09 | 2023-11-09 | 一种基于多源异构农业数据的农作物产量预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311488102.8A CN117455062A (zh) | 2023-11-09 | 2023-11-09 | 一种基于多源异构农业数据的农作物产量预测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117455062A true CN117455062A (zh) | 2024-01-26 |
Family
ID=89579792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311488102.8A Pending CN117455062A (zh) | 2023-11-09 | 2023-11-09 | 一种基于多源异构农业数据的农作物产量预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117455062A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726051A (zh) * | 2024-02-08 | 2024-03-19 | 北京市农林科学院智能装备技术研究中心 | 特色农作物产量预测方法、装置及存储介质 |
CN118350515A (zh) * | 2024-06-18 | 2024-07-16 | 浙江天演维真网络科技股份有限公司 | 农作物产量预测方法、装置、设备及存储介质 |
CN118446559A (zh) * | 2024-07-08 | 2024-08-06 | 中国科学院空天信息创新研究院 | 基于数据与知识双重驱动的大豆单产遥感估算方法及装置 |
CN118504795A (zh) * | 2024-07-18 | 2024-08-16 | 安徽省农业科学院经济作物研究所 | 一种适用于经济作物的自动化监测方法及系统 |
CN118731935A (zh) * | 2024-08-31 | 2024-10-01 | 自然资源部第六地形测量队(自然资源部地下管线勘测工程院、四川省第三测绘工程院) | 基于多源遥感技术的耕地资源生态系统服务价值核算方法 |
-
2023
- 2023-11-09 CN CN202311488102.8A patent/CN117455062A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726051A (zh) * | 2024-02-08 | 2024-03-19 | 北京市农林科学院智能装备技术研究中心 | 特色农作物产量预测方法、装置及存储介质 |
CN117726051B (zh) * | 2024-02-08 | 2024-05-10 | 北京市农林科学院智能装备技术研究中心 | 特色农作物产量预测方法、装置及存储介质 |
CN118350515A (zh) * | 2024-06-18 | 2024-07-16 | 浙江天演维真网络科技股份有限公司 | 农作物产量预测方法、装置、设备及存储介质 |
CN118446559A (zh) * | 2024-07-08 | 2024-08-06 | 中国科学院空天信息创新研究院 | 基于数据与知识双重驱动的大豆单产遥感估算方法及装置 |
CN118504795A (zh) * | 2024-07-18 | 2024-08-16 | 安徽省农业科学院经济作物研究所 | 一种适用于经济作物的自动化监测方法及系统 |
CN118731935A (zh) * | 2024-08-31 | 2024-10-01 | 自然资源部第六地形测量队(自然资源部地下管线勘测工程院、四川省第三测绘工程院) | 基于多源遥感技术的耕地资源生态系统服务价值核算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117455062A (zh) | 一种基于多源异构农业数据的农作物产量预测算法 | |
US20220075344A1 (en) | A method of finding a target environment suitable for growth of a plant variety | |
CN110909933B (zh) | 一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法 | |
CN117036088A (zh) | 一种ai识别绿化植物生长态势的数据采集分析方法 | |
CN112819227B (zh) | 一种县级尺度冬小麦单产预测方法及系统 | |
CN118364975B (zh) | 多源数据驱动混合机理学习模型的小麦产量预测方法 | |
CN113111799B (zh) | 一种基于集合经验模态分解的耕地土壤肥力水平监测方法 | |
CN116227758B (zh) | 基于遥感技术和深度学习的农产品成熟度预测方法及系统 | |
CN110069032A (zh) | 一种基于小波神经网络的茄子温室环境智能检测系统 | |
CN116578047B (zh) | 一种用于辣椒生产的精细化智能控制方法及系统 | |
CN117333321B (zh) | 基于机器学习的农业灌溉用水量估算方法、系统及介质 | |
CN117805099A (zh) | 一种耕地质量监测方法及系统 | |
CN117077868A (zh) | 一种基于模型的粮食产量预测系统及方法 | |
CN117694070A (zh) | 养分要素反演评估与智能变量精准施肥决策系统 | |
CN117296538B (zh) | 基于植被土壤成分检测的绿植维护方法、装置与系统 | |
CN116757707B (zh) | 一种农作物果实生长溯源方法及系统 | |
CN111223002A (zh) | 一种玉米区域干物质产量或青储产量评估方法和系统 | |
Ahmed et al. | Micronutrient classification in IoT based agriculture using machine learning (ML) Algorithm | |
CN118333579B (zh) | 一种基于生态农业的智慧管理方法及系统 | |
CN111640039A (zh) | 一种设施蔬菜病害防治推荐系统及方法 | |
CN117172385B (zh) | 一种甘蔗高糖度收获期预测方法及系统 | |
Dodge | Digital Phenotyping in Cotton Breeding Using Growth Rate Modeling Based on Visible Light Data Collected With Unmanned Aerial Systems | |
CN113762773B (zh) | 一种灾害监测预报的关联定位分解方法及系统 | |
CN113640230B (zh) | 一种田间小麦水分利用率快速检测方法及系统 | |
CN118485321B (zh) | 结合气象适宜度的Transformer冬小麦产量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |