CN110147525A - 苗木生长状态预测方法、装置、设备和存储介质 - Google Patents

苗木生长状态预测方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN110147525A
CN110147525A CN201910422436.2A CN201910422436A CN110147525A CN 110147525 A CN110147525 A CN 110147525A CN 201910422436 A CN201910422436 A CN 201910422436A CN 110147525 A CN110147525 A CN 110147525A
Authority
CN
China
Prior art keywords
regression model
nursery stock
data
moisture
status data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910422436.2A
Other languages
English (en)
Other versions
CN110147525B (zh
Inventor
赵泉胜
张波
铁英
杨成林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia Hesheng Ecological Silviculture Co Ltd
Inner Mongolia Mengshu Ecological Environment Co Ltd
Original Assignee
Inner Mongolia Hesheng Ecological Silviculture Co Ltd
Inner Mongolia Mengshu Ecological Environment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia Hesheng Ecological Silviculture Co Ltd, Inner Mongolia Mengshu Ecological Environment Co Ltd filed Critical Inner Mongolia Hesheng Ecological Silviculture Co Ltd
Priority to CN201910422436.2A priority Critical patent/CN110147525B/zh
Publication of CN110147525A publication Critical patent/CN110147525A/zh
Application granted granted Critical
Publication of CN110147525B publication Critical patent/CN110147525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种苗木生长状态预测方法、装置、设备和存储介质,该方法包括:获取样本苗木在各个时刻的茎体水分数据和所处环境的环境状态数据的集合;将状态数据集随机分为样本训练集和样本测试集;根据温度区间,将样本训练集和样本测试集分别根据温度区间处理成多个子测试集和多个子训练集;针对每一个子训练集,建立多个回归模型进行回归分析,应用子测试集对子训练集训练出来的回归模型进行测试,以确定拟合度最高的回归模型作为目标回归模型;将待预测苗木的环境状态数据输入至目标回归模型,以获取待预测苗木的茎体水分数据后预测待预测苗木的生长状态。实现了苗木生长状态的智能监测以及智能化管理,成本和维护费用低。

Description

苗木生长状态预测方法、装置、设备和存储介质
技术领域
本发明涉及智能园林技术领域,具体涉及一种苗木生长状态预测方法、装置、设备和存储介质。
背景技术
监测苗木茎体的水分对于了解描述的生长状态具有指导意义,也即,根据苗木茎体的水分即可判断苗木当前的长势是否良好,或者,需要补充水分等处理。
目前关于苗木茎体水分的监测中,通常一个茎体水分监测站只能监测一类苗木,然而,越来越多的工厂化苗木生产基地的出现,苗木种类多、分级繁琐,这样如果逐一安装茎体水分监测器,则不仅成本高,日常的维护费用也高。此外,也无法实现对现代化苗圃基地的智能化管理。
发明内容
有鉴于此,提供一种苗木生长状态预测方法、装置、设备和存储介质,以解决现有技术中每个茎体水分监测站智能监测一类苗木的生长状态带来的成本高以及维护费用高,且,无法对现代苗圃进行智能化管理的问题。
本发明采用如下技术方案:
第一方面,本申请实施例提供了一种苗木生长状态预测方法,该方法包括:
获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度;
将所述状态数据集随机分为样本训练集和样本测试集;
将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集;
针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型;
应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型;
选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型;
将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
第二方面,本申请实施例提供了一种苗木生长状态预测装置,该预测装置包括:
数据获取模块,用于获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度;
集合分类模块,用于将所述状态数据集随机分为样本训练集和样本测试集;
分布式处理模块,用于将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集;
回归分析模块,用于针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型;
模型优化模块,用于应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型;
目标模型确定模块,用于选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型;
生长状态预测模块,用于将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
第三方面,本申请实施例提供了一种设备,该设备包括:
处理器,以及与所述处理器相连接的存储器;
传感器,用于监测茎体水分数据和环境状态数据,并将所述茎体水分数据和所述环境状态数据发送至所述处理器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行本申请实施例第一方面所述的苗木生长状态预测方法;
所述处理器用于调用并执行所述存储器中的所述计算机程序。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面所述的苗木生长状态预测方法中各个步骤。
本发明采用以上技术方案,首先获取样本苗木在各个时刻的茎体水分数据和样本苗木所处环境的环境状态数据组成的状态数据集合,为了后续对获得的回归模型进行测试,将状态数据集分为样本训练集和样本测试集,应用样本训练集建立多个回归模型进行回归分析,并筛选出大于预设拟合度阈值的第一回归模型,然后再用测试集进行测试,实现对回归模型的进一步筛选,这样得到了拟合度最高的回归模型作为目标回归模型;另外,将将待预测苗木的环境状态数据输入至目标回归模型,就可以获取待预测苗木的茎体水分数据,然后再根据茎体水分数据预测待预测苗木的生长状态。在实现对茎体水分检测站智能监测的同时,还可以实现对现代化苗圃进行智能化管理,无需针对每类苗木安装茎体水分监测站,成本低、维护费用也低。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种苗木生长状态预测方法的流程图;
图2是本发明实施例提供的另一种苗木生长状态预测方法的流程图;
图3是本发明实施例提供的一种苗木生长状态预测装置的结构示意图;
图4是本发明实施例提供的一种设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
实施例
图1为本发明实施例提供的一种苗木生长状态预测方法的流程图,该方法可以由本发明实施例提供的苗木生长状态预测装置来执行,该装置可采用软件和/或硬件的方式实现。参考图1,该方法具体可以包括如下步骤:
S101、获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度。
整体来讲,本申请实施例中应用的苗木包括两类,一类是样本苗木,用来确定目标回归模型,另一类是待预测苗木,为实际应用中通过其状态数据去预测其茎体水分以及生长状态的苗木。其中,应用样本苗木在各个时刻的状态数据去建立回归模型并进行回归分析,得到目标回归模型,然后将待预测苗木的茎体水分数据输入至目标回归模型,得到待预测苗木的生长状态。需要说明的是,在实际的应用过程中,一个苗圃里种的苗木通常为树龄或高度相近的同一个苗木品种,例如,5米高的杨树。
具体的,获取样本苗木在各个时刻的状态数据组成的状态数据集合,针对一个时刻,状态数据包括所述样本苗木的茎体水分数据,和,所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度。可选的,可以应用茎体水分监测器来获取样本苗木的茎体水分数据,应用传感器来获取环境状态数据,例如,应用湿度传感器来检测空气湿度,应用温度传感器来检测空气温度等。需要说明的是,传感器和茎体水分监测器的型号、结构和种类不进行限定,凡是能实现本申请的技术方案即可。
S102、将所述状态数据集随机分为样本训练集和样本测试集。
具体的,在得到目标回归模型的过程中,首先应用样本训练集训练回归模型,得到第一回归模型,然后再用样本测试集对第一回归模型进行优化,得到第二回归模型,再从第二回归模型中确定目标回归模型。因此,这里先将状态数据集分为样本训练集和样本训练集,这个分类过程是随机的,其中,状态数据集中包括多组状态数据。
可选的,所述样本训练集的数据量占所述状态数据集的比例为第一比例,所述样本测试集的数据量占所述状态数据集的比例为第二比例,所述第一比例与所述第二比例之和为100%。例如,状态数据集中包括N组状态数据,则可以随机选取0.55*N组数据作为样本训练集,随机选取0.45*N组数据作为样本测试集。第一比例和第二比例不固定,这里只是用来举例说明。
S103、将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集。
具体的,为了提高预测过程的准确性,需要对状态数据进行分布式处理,可选的,所述温度区间包括第一温度区间、第二温度区间和第三温度区间,其中,所述第一温度区间包括0℃以下,所述第二温度区间包括0℃到5℃,所述第三温度区间包括5℃以上。下面进行简单说明,通过观测发现,苗木在生产过程中,0℃-5℃时大致有一类生长特征,0℃以下有另一类生长特征,5℃以上有再一类生长特征,生长特征也可以称为生长节律。上述应用0℃和5℃分为了三个温度区间,因此,这里需要对状态数据进行分布式处理,也即,根据温度区间将样本训练集和样本测试集进行分布式处理,这样就可以获取多个子测试集。在这个具体的例子中,可分为的是三个子测试集和三个子训练集,分布在0℃以下的子测试集和子训练集,分布在0℃-5℃的子测试集和子训练集,分布在5℃以上的子测试集和子训练集。在一个具体的例子中,上述温度区间中的温度可以是指土壤温度,这样,根据土壤温度进行温度区间的划分,更符合苗圃中的苗木的实际情况。
S104、针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型。
具体的,针对每一个子训练集,建立多个回归模型进行分析,可选的,回归模型是一种预测性的建模技术,它研究的是因变量和自变量之间的关系,这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,就可以应用回归方法。计算多个回归模型的拟合度,预设拟合度阈值记为0.8,筛选出拟合度大于0.8的回归模型,作为第一回归模型。可选的,所述回归模型中的自变量为环境状态数据,所述回归模型中的因变量为茎体水分数据。
S105、应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型。
具体的,在确定了第一回归模型后,应用每一个子测试集对第一回归模型进行测试,因为测试过程和训练过程中的自变量不同,训练过程的自变量为训练样本集,测试过程的自变量为测试样本集,因此,在测试过程中,进一步进行优化,此时,剔除第一回归模型中过拟合的回归模型,这样得到了第二回归模型。这样,实现了对回归模型的进一步优化。
在一个具体的例子中,过拟合是指针对一个回归模型,通过子训练集计算均方残差A,通过子测试集计算均方残差B,计算A和B的绝对值之差,当该绝对值之差大于某个标准数值时,称为过拟合。需要说明的是,苗木不同,上述标准数值不同,例如,A为9,B为10.1,则A和B的绝对值之差为1.1,上述标准数值假设为1,则该种情况为过拟合情况,此时,剔除该种情况对应的回归模型。这里只是用来示例,并不形成具体限定。
S106、选取所述第二回归模型中满足预设均方残差条件的的回归模型作为目标回归模型。
具体的,第二回归模型可以是多个,选取第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型,就可以将目标回归模型应用到实际的预测过程中,以实现对待预测苗木的茎体水分的预测,以及生长状态的预测。
在一个具体的例子中,预设均方残差条件可以是指S105中提到的标准数值最小,也即,选取应用子训练集和子测试集计算得到的两个均方残差之差最小时对应的回归模型作为目标回归模型。
S107、将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
具体的,将待预测苗木的环境状态数据输入至目标回归模型,就可以得到待预测苗木的茎体水分数据,这里的环境状态数据可以是光照强度、空气湿度、空气温度、土壤湿度和土壤温度中的一个或多个。这样,不同的茎体水分数据表征了苗木不同的生长状态,因此,可以通过待预测苗木的茎体水分数据预测苗木的生长状态,其中,苗木的生长状态包括长势良好状态、缺水状态和水分过量状态。
本发明采用以上技术方案,首先获取样本苗木在各个时刻的茎体水分数据和样本苗木所处环境的环境状态数据组成的状态数据集合,为了后续对获得的回归模型进行测试,将状态数据集分为样本训练集和样本测试集,应用样本训练集建立多个回归模型进行回归分析,并筛选出大于预设拟合度阈值的第一回归模型,然后再用测试集进行测试,实现对回归模型的进一步筛选,这样得到了拟合度最高的回归模型作为目标回归模型;另外,将将待预测苗木的环境状态数据输入至目标回归模型,就可以获取待预测苗木的茎体水分数据,然后再根据茎体水分数据预测待预测苗木的生长状态。在实现对茎体水分检测站智能监测的同时,还可以实现对现代化苗圃进行智能化管理,无需针对每类苗木安装茎体水分监测站,成本低、维护费用也低。
此外,根据茎体水分预测苗木的生长状态的准确度较高。本申请中可以用一套或少数几套茎体水分监测站进行多种苗木茎体水分监测,随时知道苗木的生长状态,服务大型苗圃和多种类苗木苗圃基地管理,减少苗木管理的人工成本,降低苗木的死亡率,提高苗圃整体经济效益。与现有技术相中每一类苗木都建立一套茎体水分监测站相比,更加方便管理,成本更低。
图2为本发明又一实施例提供的另一种苗木生长状态预测方法的流程图,本实施例在上述实施例的基础上实现。参考图2,该方法具体可以包括如下步骤:
S201、获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度。
S202、剔除所述状态数据集中的异常数据,其中,所述异常数据包括茎体水分大于第一预设水分阈值的数据和茎体水分小于第二预设水分阈值的数据,所述第一预设水分阈值大于所述第二预设水分阈值。
具体的,在获取到样本苗木在各个时刻的状态数据组成的状态数据集合后,为了提高预测的准确度,需要先提出状态数据中的异常数据,以避免异常数据对预测结果的影响。可选的,异常数据包括茎体水分过大的数据和茎体水分过小的数据,例如,某段时间内监测到的茎体水分数据均为80左右,下一秒出现了一个500或20,则表明该时刻的茎体水分数据过大或过小,为异常数据。
S203、将所述状态数据集随机分为样本训练集和样本测试集。
S204、将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集。
S205、针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型。
S206、应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型。
S207、选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型。
S208、确定所述待预测苗木的环境状态数据对应的温度区间。
具体的,由于不同的温度区间对应不同的目标回归模型,因此,在确定待预测苗木能应用哪个目标回归模型之前,首先确定待预测苗木的环境状态数据对应的温度区间。例如,环境状态数据监测的是土壤在夜间的温度数据,则对应的温度区间可以是0℃以下。
S209、根据所述温度区间确定所述目标回归模型。
具体的,在不同的温度区间对应的不同的目标回归模型中确定对应的目标回归模型,例如,0℃以下对应目标回归模型A,0℃-5℃对应目标回归模型B,5℃以上对应目标回归模型C。
S210、将所述待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据。
具体的,将待预测苗木的环境状态数据输入至目标回归模型,目标回归模型表征了茎体水分数据和环境状态数据的对应关系,这样便可以获取待预测苗木的茎体水分数据,例如,待预测苗木的环境状态数据为光照强度a1、空气湿度a2、空气温度a3、土壤湿度a4和土壤温度a5,则将这五个数据输入至目标回归模型,获取到茎体水分数据。
S211、将所述待预测苗木的茎体水分数据与茎体水分数据与生长状态的对应关系进行匹配。
具体的,预先存储茎体水分数据与生长状态的对应关系,例如,茎体水分数据用W表示,则b1≤W≤b2时,表明生长状态良好;W<b1时,表明茎体处于缺水状态;W>b2时,表明茎体处于水分过量状态。将待预测苗木的茎体水分数据与茎体水分与生长状态的对应关系进行匹配。
S212、从所述匹配结果中识别所述待预测树苗的生长状态。
具体的,通过茎体水分数据,在匹配结果中识别待预测树苗生长状态,例如,茎体水分数据W>b2,则表明此时待预测树苗的生长状态为水分过量状态。
本申请实施例中,在获取到状态数据集后,还剔除了异常数据,提高了预测过程的准确度;此外,在确定了目标回归模型的预测过程中,首先确定待预测苗木的环境状态数据对应的温度区间,以前确定与温度区间对应的目标模型,这样,考虑了苗木生长的一个实际情况,使预测结果更加符合实际苗木的生长状态;另外,在确定了茎体水分数据后,再根据茎体水分数据确定苗木的生长状态,这样,可以直接确定苗木生长状态,实现了对苗圃的智能化管理。
此外,本申请实施例中还可以应用GPRS(General Packet Radio Service)是通用分组无线服务技术)传输监测到的环境状态数据。
图3是本发明是实施例三提供的一种苗木生长状态预测装置的结构示意图,该装置适用于执行本发明实施例提供给的一种苗木生长状态预测方法。如图3所示,该装置具体可以包括:数据获取模块301、集合分类模块302、分布式处理模块303、回归分析模块304、模型优化模块305、目标模型确定模块306和生长状态预测模块307。
其中,数据获取模块301,用于获取样本苗木在各个时刻的状态数据组成的状态数据集合,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度;集合分类模块302,用于将所述状态数据集随机分为样本训练集和样本测试集;分布式处理模块303,用于将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集;回归分析模块304,用于针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型;模型优化模块305,用于应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型;目标模型确定模块306,用于选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型;生长状态预测模块307,用于将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
本发明采用以上技术方案,首先获取样本苗木在各个时刻的茎体水分数据和样本苗木所处环境的环境状态数据组成的状态数据集合,为了后续对获得的回归模型进行测试,将状态数据集分为样本训练集和样本测试集,应用样本训练集建立多个回归模型进行回归分析,并筛选出大于预设拟合度阈值的第一回归模型,然后再用测试集进行测试,实现对回归模型的进一步筛选,这样得到了拟合度最高的回归模型作为目标回归模型;另外,将将待预测苗木的环境状态数据输入至目标回归模型,就可以获取待预测苗木的茎体水分数据,然后再根据茎体水分数据预测待预测苗木的生长状态。在实现对茎体水分检测站智能监测的同时,还可以实现对现代化苗圃进行智能化管理,无需针对每类苗木安装茎体水分监测站,成本低、维护费用也低。
进一步的,还包括数据剔除模块,用于在所述将所述状态数据集随机分为样本训练集和样本测试集之前,剔除所述状态数据集中的异常数据,其中,所述异常数据包括茎体水分大于第一预设水分阈值的数据和茎体水分小于第二预设水分阈值的数据,所述第一预设水分阈值大于所述第二预设水分阈值。
进一步的,生长状态预测模块307具体用于:
确定所述待预测苗木的环境状态数据对应的温度区间;
根据所述温度区间确定所述目标回归模型;
将所述待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据。
进一步的,生长状态预测模块307具体用于:
将所述待预测苗木的茎体水分数据与茎体水分数据与生长状态的对应关系进行匹配;
从所述匹配结果中识别所述待预测树苗的生长状态。
进一步的,所述回归模型中的自变量为环境状态数据,所述回归模型中的因变量为茎体水分数据。
进一步的,所述样本训练集的数据量占所述状态数据集的比例为第一比例,所述样本测试集的数据量占所述状态数据集的比例为第二比例,所述第一比例与所述第二比例之和为100%。
进一步的,所述温度区间包括第一温度区间、第二温度区间和第三温度区间,其中,所述第一温度区间包括0℃以下,所述第二温度区间包括0℃到5℃,所述第三温度区间包括5℃以上。
本发明实施例提供的苗木生长状态预测装置可执行本发明任意实施例提供的苗木生长状态预测方法,具备执行方法相应的功能模块和有益效果。
本发明实施例还提供一种设备,请参阅图4,图4为一种设备的结构示意图,如图4所示,该设备包括:处理器410,以及与处理器410相连接的存储器420;传感器,用于监测茎体水分数据和环境状态数据,并将所述茎体水分数据和所述环境状态数据发送至所述处理器;存储器420用于存储计算机程序,所述计算机程序至少用于执行本发明实施例中的苗木生长状态预测方法;处理器410用于调用并执行所述存储器中的所述计算机程序,苗木生长状态预测方法至少包括:获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度;将所述状态数据集随机分为样本训练集和样本测试集;将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集;针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型;应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型;选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型;将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
本发明实施例还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如本发明实施例中的苗木生长状态预测方法中各个步骤,苗木生长状态预测方法至少包括:获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度;将所述状态数据集随机分为样本训练集和样本测试集;将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集;针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型;应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型;选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型;将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种苗木生长状态预测方法,其特征在于,包括:
获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度;
将所述状态数据集随机分为样本训练集和样本测试集;
将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集;
针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型;
应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型;
选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型;
将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
2.根据权利要求1所述的方法,其特征在于,所述将所述状态数据集随机分为样本训练集和样本测试集之前,还包括:
剔除所述状态数据集中的异常数据,其中,所述异常数据包括茎体水分大于第一预设水分阈值的数据和茎体水分小于第二预设水分阈值的数据,所述第一预设水分阈值大于所述第二预设水分阈值。
3.根据权利要求1所述的方法,其特征在于,将所述待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,包括:
确定所述待预测苗木的环境状态数据对应的温度区间;
根据所述温度区间确定所述目标回归模型;
将所述待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据。
4.根据权利要求1所述的方法,其特征在于,根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态,包括:
将所述待预测苗木的茎体水分数据与茎体水分数据与生长状态的对应关系进行匹配;
从所述匹配结果中识别所述待预测树苗的生长状态。
5.根据权利要求1所述的方法,其特征在于,所述回归模型中的自变量为环境状态数据,所述回归模型中的因变量为茎体水分数据。
6.根据权利要求1所述的方法,其特征在于,所述样本训练集的数据量占所述状态数据集的比例为第一比例,所述样本测试集的数据量占所述状态数据集的比例为第二比例,所述第一比例与所述第二比例之和为100%。
7.根据权利要求1所述的方法,其特征在于,所述温度区间包括第一温度区间、第二温度区间和第三温度区间,其中,所述第一温度区间包括0℃以下,所述第二温度区间包括0℃到5℃,所述第三温度区间包括5℃以上。
8.一种苗木生长状态预测装置,其特征在于,包括:
数据获取模块,用于获取样本苗木在各个时刻的状态数据组成的状态数据集合,其中,每个时刻的状态数据包括所述样本苗木的茎体水分数据和所述样本苗木所处环境的环境状态数据,所述环境状态数据包括光照强度、空气湿度、空气温度、土壤湿度和土壤温度;
集合分类模块,用于将所述状态数据集随机分为样本训练集和样本测试集;
分布式处理模块,用于将所述样本训练集和所述样本测试集分别根据温度区间进行分布式处理,以获取多个子测试集和多个子训练集;
回归分析模块,用于针对每一个子训练集,建立多个回归模型进行回归分析,在所述多个回归模型中筛选出拟合度大于预设拟合度阈值的第一回归模型;
模型优化模块,用于应用每一个子测试集对所述第一回归模型进行测试,剔除所述第一回归模型中过拟合的回归模型,以得到第二回归模型;
目标模型确定模块,用于选取所述第二回归模型中满足预设均方残差条件的回归模型作为目标回归模型;
生长状态预测模块,用于将待预测苗木的环境状态数据输入至所述目标回归模型,以获取所述待预测苗木的茎体水分数据,以根据所述待预测苗木的茎体水分数据预测所述待预测苗木的生长状态。
9.一种移动终端,其特征在于,包括:
处理器,以及与所述处理器相连接的存储器;
传感器,用于监测茎体水分数据和环境状态数据,并将所述茎体水分数据和所述环境状态数据发送至所述处理器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行权利要求1-7任一项所述的苗木生长状态预测方法;
所述处理器用于调用并执行所述存储器中的所述计算机程序。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-7任一项所述的苗木生长状态预测方法中各个步骤。
CN201910422436.2A 2019-05-21 2019-05-21 苗木生长状态预测方法、装置、设备和存储介质 Active CN110147525B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910422436.2A CN110147525B (zh) 2019-05-21 2019-05-21 苗木生长状态预测方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910422436.2A CN110147525B (zh) 2019-05-21 2019-05-21 苗木生长状态预测方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN110147525A true CN110147525A (zh) 2019-08-20
CN110147525B CN110147525B (zh) 2023-02-14

Family

ID=67592549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910422436.2A Active CN110147525B (zh) 2019-05-21 2019-05-21 苗木生长状态预测方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN110147525B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118171784A (zh) * 2024-05-14 2024-06-11 正大农业科学研究有限公司 料肉比预测方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110125477A1 (en) * 2009-05-14 2011-05-26 Lightner Jonathan E Inverse Modeling for Characteristic Prediction from Multi-Spectral and Hyper-Spectral Remote Sensed Datasets
CN105912884A (zh) * 2016-06-13 2016-08-31 江苏大学 一种基于生理效应的作物茎直径生长速率预测方法
US20180053401A1 (en) * 2016-08-22 2018-02-22 Rapidsos, Inc. Predictive analytics for emergency detection and response management
CN108108762A (zh) * 2017-12-22 2018-06-01 北京工业大学 一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法
CN108764517A (zh) * 2018-04-08 2018-11-06 中南大学 一种高炉铁水硅含量变化趋势预测方法、设备和存储介质
CN108982377A (zh) * 2018-07-27 2018-12-11 内蒙古大学 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110125477A1 (en) * 2009-05-14 2011-05-26 Lightner Jonathan E Inverse Modeling for Characteristic Prediction from Multi-Spectral and Hyper-Spectral Remote Sensed Datasets
CN105912884A (zh) * 2016-06-13 2016-08-31 江苏大学 一种基于生理效应的作物茎直径生长速率预测方法
US20180053401A1 (en) * 2016-08-22 2018-02-22 Rapidsos, Inc. Predictive analytics for emergency detection and response management
CN108108762A (zh) * 2017-12-22 2018-06-01 北京工业大学 一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法
CN108764517A (zh) * 2018-04-08 2018-11-06 中南大学 一种高炉铁水硅含量变化趋势预测方法、设备和存储介质
CN108982377A (zh) * 2018-07-27 2018-12-11 内蒙古大学 玉米生育期光谱图像与叶绿素含量相关性及时期划分方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BANU YILMAZ,ET AL: "Estimating suspended sediment load with multivariate adaptive regression spline, teaching-learning based optimization, and artificial bee colony models", 《SCIENCE OF THE TOTAL ENVIRONMENT》 *
杜斌,等: "基于茎秆直径微变化信号强度监测交替沟灌玉米水分状况", 《农业工程学报》 *
杨丹,等: "南京城郊毛竹林内外气温及土壤温度特征", 《东北林业大学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118171784A (zh) * 2024-05-14 2024-06-11 正大农业科学研究有限公司 料肉比预测方法和装置

Also Published As

Publication number Publication date
CN110147525B (zh) 2023-02-14

Similar Documents

Publication Publication Date Title
CN107341577A (zh) 一种农作物产量预测方法及系统
Spekken et al. A simple method for filtering spatial data
US20170295735A1 (en) Improved Methods Of Plant Breeding Using High-Throughput Seed Sorting
CN110147525A (zh) 苗木生长状态预测方法、装置、设备和存储介质
KR20200126849A (ko) 딸기 품질 판별장치 및 이를 이용한 딸기 품질 판별방법
Njoroge et al. A research review of precision farming techniques and technology
CN107844771A (zh) 农作物生产管理的方法、系统、计算机装置及存储介质
Shao et al. Complementary phenotyping of maize root system architecture by root pulling force and X-ray imaging
Vadlamudi Rethinking food sufficiency with smart agriculture using Internet of things
CN107358246A (zh) 一种使用卷积神经网络对物体进行细分类的方法
CN110097473A (zh) 一种农作物生命全周期的数据采集方法、装置及设备
Harjoko et al. Image processing approach for grading tobacco leaf based on color and quality
CN110135310A (zh) 一种基于单变量特征选择方法的农作物遥感识别方法
CN110070558A (zh) 一种基于图像处理和分区检测的统计分拣方法及装置
Chauhan et al. Classification of Nutritional Deficiencies in Cabbage Leave Using Random Forest
CN106874927A (zh) 一种随机强分类器的构建方法和系统
CN109047040A (zh) 一种基于大数据的锂电池筛选系统
CN107895210A (zh) 一种区域农业生产预估系统
CN109634804A (zh) 数据异动分析方法及装置
Kavitha et al. Machine Learning Implementation On Agricultural Datasets For Smart Farm Enhancement To Improve Yield By Predicting Plant Disease And Soil Quality
Soots et al. Determining the dimensional characteristics of blueberries.
CN111679274B (zh) 一种利用超宽带雷达进行农作物长势预测评价方法及装置
Christopher Disease identification in spinach leaves
Škrubej et al. The accuracy of the germination rate of seeds based on image processing and artificial neural networks
Shao et al. Complementary phenotyping of maize root architecture by root pulling force and X-ray computed tomography

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant