CN116910490A - 农业大棚环境调节方法、装置、设备及介质 - Google Patents

农业大棚环境调节方法、装置、设备及介质 Download PDF

Info

Publication number
CN116910490A
CN116910490A CN202311153863.8A CN202311153863A CN116910490A CN 116910490 A CN116910490 A CN 116910490A CN 202311153863 A CN202311153863 A CN 202311153863A CN 116910490 A CN116910490 A CN 116910490A
Authority
CN
China
Prior art keywords
sample
target
agricultural greenhouse
crop
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311153863.8A
Other languages
English (en)
Other versions
CN116910490B (zh
Inventor
李政道
陈飞勇
宋扬
刘汝鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jianzhu University
Original Assignee
Shandong Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jianzhu University filed Critical Shandong Jianzhu University
Priority to CN202311153863.8A priority Critical patent/CN116910490B/zh
Priority claimed from CN202311153863.8A external-priority patent/CN116910490B/zh
Publication of CN116910490A publication Critical patent/CN116910490A/zh
Application granted granted Critical
Publication of CN116910490B publication Critical patent/CN116910490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/25Greenhouse technology, e.g. cooling systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Agronomy & Crop Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供农业大棚环境调节方法、装置、设备及介质,涉及人工智能技术领域,其中方法包括:获取目标农业大棚内的作物生长阶段;在当前时间步结束时,将下一时间步对应的时间段、作物生长阶段以及目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取目标强化学习模型输出的下一时间步的设备调节信息,在下一时间步基于设备调节信息控制环境设备;其中,目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到。本发明可以实现农业大棚内的环境智能自动调节。

Description

农业大棚环境调节方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及农业大棚环境调节方法、装置、设备及介质。
背景技术
大棚内的环境对作物的生长有很大的影响,在现有技术中,可以在大棚内设置各种传感器以采集大棚内的温度、湿度等环境参数,种植人员根据这些环境参数对大棚内的环境调节设备进行调节。但是种植人员根据环境参数对大棚内的环境调节设备进行调节,都是在基于人工经验的基础上进行调节的,无法实现智能自动调节。
发明内容
本发明提供农业大棚环境调节方法、装置、设备及介质,用以解决现有技术中依赖人工经验调节农业大棚内的环境调节设备的缺陷,实现农业大棚内的环境自动调节。
本发明提供农业大棚环境调节方法,包括:
获取目标农业大棚内的作物生长阶段;
在当前时间步结束时,将下一时间步对应的时间段、所述作物生长阶段以及所述目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取所述目标强化学习模型输出的下一时间步的设备调节信息,其中,所述环境变化信息包括所述目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,所述环境设备用于改变所述目标农业大棚内的环境参数,N为大于1的正整数;
在所述下一时间步基于所述设备调节信息控制所述环境设备;
其中,所述目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组所述样本数据包括样本时间段、样本作物生长阶段以及样本环境变化信息,所述样本数据对应的目标奖励值是基于将所述样本数据输入至所述目标强化学习模型后,根据所述目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。
根据本发明提供的农业大棚环境调节方法,所述目标强化学习模型的训练过程包括:
在多组所述样本数据中选择目标样本数据;
将所述目标样本数据输入至所述目标强化学习模型中,获取所述目标强化学习模型输出的所述目标样本数据对应的样本调节信息;
基于所述样本调节信息调节所述样本农业大棚内的样本环境设备,获取调节后的环境参数;
基于所述目标样本数据中的所述样本时间段和所述样本作物生长阶段确定参考环境参数;
基于所述调节后的环境参数和所述参考环境参数确定第一奖励值;
基于所述第一奖励值确定所述目标奖励值;
基于所述目标奖励值更新所述目标强化学习模型。
根据本发明提供的农业大棚环境调节方法,所述基于所述第一奖励值确定所述目标奖励值,包括:
获取当前的训练轮次数值;
当所述训练轮次数值达到预设阈值M+1时,获取所述样本农业大棚中的作物在当前时间步以及当前时间步的前M个时间步中的生长状态数据;
获取针对所述生长状态数据的评价分数,基于所述评价分数确定权重值,基于所述权重值对所述第一奖励值进行加权处理,得到所述目标奖励值,并对所述训练轮次数值进行清零处理;
当所述训练轮次数值未达到所述预设阈值时,将所述第一奖励值作为所述目标奖励值。
根据本发明提供的农业大棚环境调节方法,所述在所述下一时间步基于所述设备调节信息控制所述环境设备,包括:
获取所述目标农业大棚和所述样本农业大棚之间的尺寸差异信息以及环境调节设备配置差异信息;
基于所述尺寸差异信息和所述环境调节设备配置差异信息对所述设备调节信息进行修正,得到修正调节信息;
基于所述修正调节信息控制所述环境设备。
根据本发明提供的农业大棚环境调节方法,所述获取目标农业大棚内的作物生长阶段,包括:
控制图像采集设备对所述目标农业大棚内的种植区域进行图像采集,得到作物图像;
将作物图像序列输入至已训练的神经网络模型中,获取所述神经网络模型输出的所述作物生长阶段,所述作物图像序列包括按时间顺序排序的多张所述作物图像。
根据本发明提供的农业大棚环境调节方法,所述神经网络模型包括目标检测模块、第一特征提取模块、第二特征提取模块、第三特征提取模块、特征融合模块以及预测模块;
所述将作物图像序列输入至已训练的神经网络模型中,获取所述神经网络模型输出的所述作物生长阶段,包括:
将所述作物图像序列中的每张所述作物图像分别输入至所述目标检测模块中,得到所述目标检测模块输出的每张所述作物图像中的目标检测结果,所述目标检测结果包括叶片区域检测结果、花朵区域检测结果以及果实区域检测结果;
将每张所述作物图像对应的所述叶片区域检测结果输入至所述第一特征提取模块中,获取所述作物图像序列对应的叶片区域变化特征;
将每张所述作物图像对应的所述花朵区域检测结果输入至所述第二特征提取模块中,获取所述作物图像序列对应的花朵区域变化特征;
将每张所述作物图像对应的所述果实区域检测结果输入至所述第三特征提取模块中,获取所述作物图像序列对应的果实区域变化特征;
通过所述特征融合模块对所述叶片区域变化特征、所述花朵区域变化特征和所述果实区域变化特征进行融合,得到融合特征;
将所述融合特征输入至所述预测模块中,获取所述预测模块输出的所述作物生长阶段。
根据本发明提供的农业大棚环境调节方法,所述神经网络模型的训练过程包括:
将样本作物图像序列中的每张样本作物图像分别输入至所述目标检测模块中,获取所述目标检测模块输出的样本叶片区域检测结果、样本花朵区域检测结果以及样本果实区域检测结果;
将每张所述样本作物图像对应的所述样本叶片区域检测结果输入至所述第一特征提取模块中,将每张所述样本作物图像对应的所述样本花朵区域检测结果输入至所述第二特征提取模块中,将每张所述样本作物图像对应的所述样本果实区域检测结果输入至所述第三特征提取模块中,得到样本叶片区域变化特征、样本花朵区域变化特征和样本果实区域变化特征;
通过所述特征融合模块对所述样本叶片区域变化特征、所述样本花朵区域变化特征和所述样本果实区域变化特征进行融合,得到第一样本融合特征;
通过所述特征融合模块对所述样本叶片区域变化特征、所述样本花朵区域变化特征和第一预设特征进行融合,得到第二样本融合特征,所述第一预设特征和所述样本果实区域变化特征的尺寸相同,且所述第一预设特征中的每个特征值为1;
通过所述特征融合模块对所述样本叶片区域变化特征、所述样本果实区域变化特征和第二预设特征进行融合,得到第三样本融合特征,所述第二预设特征和所述样本花朵区域变化特征的尺寸相同,且所述第二预设特征中的每个特征值为1;
将所述第一样本融合特征输入至所述预测模块中,得到第一样本作物生长阶段,将所述第二样本融合特征输入至所述预测模块中,得到第二样本作物生长阶段,将所述第三样本融合特征输入至所述预测模块中,得到第三样本作物生长阶段;
根据所述第一样本作物生长阶段和所述样本作物图像序列对应的作物生长阶段标签,得到第一损失,根据所述第二样本作物生长阶段和所述作物生长阶段标签,得到第二损失,根据所述第三样本作物生长阶段和所述作物生长阶段标签,得到第三损失;
根据所述第一损失、所述第二损失和所述第三损失得到训练损失,根据所述训练损失更新神经网络模型的参数。
本发明还提供一种农业大棚环境调节装置,包括:
信息获取模块,用于获取目标农业大棚内的作物生长阶段;
信息预测模块,用于在当前时间步结束时,将下一时间步对应的时间段、所述作物生长阶段以及所述目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取所述目标强化学习模型输出的下一时间步的设备调节信息,其中,所述环境变化信息包括所述目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,所述环境设备用于改变所述目标农业大棚内的环境参数,N为大于1的正整数;
设备控制模块,用于在所述下一时间步基于所述设备调节信息控制所述环境设备;
其中,所述目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组所述样本数据包括样本时间段、样本作物生长阶段以及样本环境变化信息,所述样本数据对应的目标奖励值是基于将所述样本数据输入至所述目标强化学习模型后,根据所述目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述农业大棚环境调节方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述农业大棚环境调节方法。
本发明提供的一种农业大棚环境调节方法、装置、设备及介质,将目标农业大棚内的作物生成阶段、下一时间步对应的时间段以及目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,已训练的目标强化学习模型可以基于输入的数据输出设备调节信息,并在下一时间步基于该设备调节信息控制目标农业大棚内的环境设备,实现了农业大棚内的环境智能自动调节。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的农业大棚环境调节方法的流程示意图;
图2是本发明提供的农业大棚环境调节装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1描述本发明提供的农业大棚环境调节方法,如图1所示,该方法包括步骤:
S100、获取目标农业大棚内的作物生长阶段。
作物在不同的作物生长阶段,例如发芽期、开花期、挂果期等,对于生长环境的要求不同。获取目标农业大棚内的作物生长阶段,包括:
控制图像采集设备对目标农业大棚内的种植区域进行图像采集,得到作物图像;
将作物图像序列输入至已训练的神经网络模型中,获取神经网络模型输出的作物生长阶段,作物图像序列包括按时间顺序排序的多张作物图像。
可以在目标农业大棚内设置图像采集设备,对种植区域进行图像采集,种植区域内种植有作物,因此对种植区域进行图像采集,可以得到反映作物生长情况的图像。多张对种植区域进行图像采集得到的作物图像组成的作物图像序列可以反映作物的生长变化情况,而作物的生长变化情况可以反映作物的生长阶段。本发明提供的方法,将作物图像输入至已训练的神经网络模型中,利用神经网络模型的预测能力,从作物图像序列中提取与作物生长阶段相关的特征,输出作物生长阶段。
具体地,本发明中用于输出作物生长阶段的神经网络模型包括目标检测模块、第一特征提取模块、第二特征提取模块、第三特征提取模块、特征融合模块以及预测模块。将作物图像序列输入至已训练的神经网络模型中,获取神经网络模型输出的作物生长阶段,包括:
将作物图像序列中的每张作物图像分别输入至目标检测模块中,得到目标检测模块输出的每张作物图像中的目标检测结果,目标检测结果包括叶片区域检测结果、花朵区域检测结果以及果实区域检测结果;
将每张作物图像对应的叶片区域检测结果输入至第一特征提取模块中,获取作物图像序列对应的叶片区域变化特征;
将每张作物图像对应的花朵区域检测结果输入至第二特征提取模块中,获取作物图像序列对应的花朵区域变化特征;
将每张作物图像对应的果实区域检测结果输入至第三特征提取模块中,获取作物图像序列对应的果实区域变化特征;
将叶片区域变化特征、花朵区域变化特征和果实区域变化特征进行融合,得到融合特征;
将融合特征输入至预测模块中,获取预测模块输出的作物生长阶段。
作物在不同的生长阶段,叶片、花朵、果实等的状态不同,本发明提供的方法中,首先利用目标检测模块对作物图像序列中的每张作物图像进行目标检测,检测出作物图像序列中的叶片、花朵、果实区域。根据作物图像序列中的每张作物图像中的叶片区域检测结果,可以得到反映作物在作物图像序列对应的这一段时间内的叶片变化情况的叶片区域变化特征,采用类似的方法,可以得到反映作物在作物图像序列对应的这一段时间内的花朵变化情况的花朵区域变化特征,以及反映作物在作物图像序列对应的这一段时间内的果实变化情况的果实区域变化特征,将三者进行融合,基于融合后的特征来推理作物生长阶段。
具体来说,将每张作物图像对应的叶片区域检测结果输入至第一特征提取模块中,获取作物图像序列对应的叶片区域变化特征,包括:
通过第一特征提取模块,执行如下步骤:
将作物图像中叶片区域内的像素点的像素值更新为该叶片区域内的像素点的像素均值,将作物图像中叶片区域外的像素点的像素值更新为0,得到叶片特征图;
分别获取各个叶片特征图中每个相同的像素坐标处的像素值的波动参数,得到叶片区域变化特征。
对于每张作物图像,将作物图像中叶片区域内的像素点的像素值都更新为该叶片区域内的像素值的均值,对于不是叶片区域的像素点,将像素值更新为0,这样就可以得到一张新的图像作为叶片特征图。叶片像素变化矩阵的尺寸与叶片特征图的尺寸一致,例如,叶片特征图宽为w,高为h,那么叶片像素变化矩阵是一个h行w列的矩阵,叶片像素变化矩阵中坐标为(x,y)处的值为每个叶片特征图中坐标为(x,y)处的像素值组成的一个数值序列的波动参数,波动参数反映数值序列的波动程度,波动参数可以选取标准差、方差等。
将每张作物图像对应的花朵区域检测结果输入至第二特征提取模块中,获取作物图像序列对应的花朵区域变化特征,包括:
通过第二特征提取模块,执行如下步骤:
将作物图像中花朵区域内的像素点的像素值更新为该花朵区域内的像素点的像素均值,将作物图像中花朵区域外的像素点的像素值更新为0,得到花朵特征图;
分别获取各个花朵特征图中每个相同的像素坐标处的像素值的波动参数,得到花朵区域变化特征。
将每张作物图像对应的果实区域检测结果输入至第三特征提取模块中,获取作物图像序列对应的果实区域变化特征,包括:
通过第三特征提取模块,执行如下步骤:
将作物图像中果实区域内的像素点的像素值更新为该果实区域内的像素点的像素均值,将作物图像中果实区域外的像素点的像素值更新为0,得到果实特征图;
分别获取各个果实特征图中每个相同的像素坐标处的像素值的波动参数,得到果实区域变化特征。
得到花朵区域变化特征和得到果实区域变化特征的过程与得到叶片区域变化特征的过程类似,在此不再赘述。
通过特征融合模块对叶片区域变化特征、花朵区域变化特征和果实区域变化特征进行融合,得到融合特征后,将融合特征输入至预测模块中,获取预测模块输出的作物生长阶段。
进一步地,该神经网络模型的训练过程包括:
将样本作物图像序列中的每张样本作物图像分别输入至目标检测模块中,获取目标检测模块输出的样本叶片区域检测结果、样本花朵区域检测结果以及样本果实区域检测结果;
将每张样本作物图像对应的样本叶片区域检测结果输入至第一特征提取模块中,得到样本叶片区域变化特征;
将每张样本作物图像对应的样本花朵区域检测结果输入至第二特征提取模块中,得到样本花朵区域变化特征;
将每张样本作物图像对应的样本果实区域检测结果输入至第三特征提取模块中,得到样本果实区域变化特征;
通过特征融合模块对样本叶片区域变化特征、样本花朵区域变化特征和样本果实区域变化特征进行融合,得到第一样本融合特征;
将第一样本融合特征输入至预测模块中,得到第一样本作物生长阶段;
通过特征融合模块对样本叶片区域变化特征、样本花朵区域变化特征和第一预设特征进行融合,得到第二样本融合特征,第一预设特征和样本果实区域变化特征的尺寸相同,且第一预设特征中的每个特征值为1;
将第二样本融合特征输入至预测模块中,得到第二样本作物生长阶段;
通过特征融合模块对样本叶片区域变化特征、样本果实区域变化特征和第二预设特征进行融合,得到第三样本融合特征,第二预设特征和样本花朵区域变化特征的尺寸相同,且第二预设特征中的每个特征值为1;
将第三样本融合特征输入至预测模块中,得到第三样本作物生长阶段;
根据第一样本作物生长阶段和样本作物图像序列对应的作物生长阶段标签,得到第一损失,根据第二样本作物生长阶段和作物生长阶段标签,得到第二损失,根据第三样本作物生长阶段和作物生长阶段标签,得到第三损失;
根据第一损失、第二损失和第三损失得到训练损失,根据训练损失更新神经网络模型的参数。
为了提升神经网络模型中各个模块的性能,本发明提供的方法中,除了按照传统的有监督学习中根据模型的预测结果与标签来得到用于更新模型参数的损失之外,还基于作物的叶片、花朵、果实的变化都可以反映作物生长阶段信息,并且,花朵和果实的变化信息对作物特殊生长阶段的反映程度更高的特性,在训练过程中,将样本叶片区域变化特征和样本花朵区域变化特征融合后用于预测第二样本作物生长阶段,将样本叶片区域变化特征和样本果实区域变化特征融合后用于预测第三样本作物生长阶段。如果目标检测模块的检测结果更准确,融合模块能够保留输入的变化特征中的与作物生长阶段更相关的信息的话,那么第二样本作物生长阶段和第三样本作物生长阶段会更加准确,因此,本发明提供的方法中,结合第一损失、第二损失和第三损失来更新神经网络模型的参数,可以使得神经网络模型的各个模块具有更高的性能,进而使得神经网络模型能够输出更准确的结果。
同时为了满足融合模块对输入的数据的尺寸的要求,设计了第一预设特征和第二预设特征以满足数据尺寸要求,并且将第一预设特征和第二预设特征中的所有元素的值均设置为1,以避免对结果的影响。
如图1所示,本发明提供的农业大棚环境调节方法,还包括步骤:
S200、在当前时间步结束时,将下一时间步对应的时间段、作物生长阶段以及目标农业大棚内的环境辩护信息输入至已训练的目标强化学习模型中,获取目标强化学习模型输出的下一时间步的设备调节信息,其中,环境变化信息包括目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,环境设备用于改变目标农业大棚内的环境参数,N为大于1的正整数。
S300、在下一时间步基于设备调节信息控制环境设备。
目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组样本数据包样本时间段、样本作物生长阶段以及样本环境变化信息,样本数据对应的目标奖励值是基于将样本数据输入至目标强化学习模型后,根据目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。样本农业大棚与目标农业大棚可以是尺寸、环境设备配置相同的农业大棚,也可以是与目标农业大棚的尺寸、环境设备配置不同的农业大棚。
一个时间步可以为一个小时、两个小时等,在当前时间步结束时,通过目标强化学习预测下一时间步应该要怎样控制调节设备。下一时间步对应的时间段指的是下一时间步在一天中的时间段,本发明中,根据作物的生长习性,可以将一天划分为多个时间段,在下一时间步对应的时间段可能为早上、中午、夜间等,当然,还可以对一天做更细致的划分。将当前时间步以及之前的多个时间步的环境变化信息也作为目标强化学习模型的输入,用于预测下一时间步的设备调节信息,有利于输入更加有利于作物生长的设备调节信息。环境设备是用于改变农业大棚内的环境参数的设备,例如灌溉设备、二氧化碳浓度调节设备等。
目标强化学习模型采用强化学习的方式训练,强化学习的过程中强化学习模型为一个智能体,根据其输出的结果执行动作,根据动作的奖励值智能体进行调整。下面对本发明中的目标强化学习模型的具体训练过程进行说明。目标强化学习模型的训练过程包括:
在多组样本数据中选择目标样本数据;
将目标样本数据输入至目标强化学习模型中,获取目标强化学习模型输出的目标样本数据对应的样本调节信息;
基于样本调节信息调节样本农业大棚内的样本环境设备,获取调节后的环境参数;
基于目标样本数据中的样本时间段和样本作物生长阶段确定参考环境参数;
基于调节后的环境参数和参考环境参数确定第一奖励值;
基于第一奖励值确定目标奖励值;
基于目标奖励值更新目标强化学习模型。
本发明提供的方法中,采用目标强化学习模型输出样本农业大棚内的样本调节信息,并基于该样本调节信息调节样本农业大棚内的样本环境设备,根据调节后的环境参数确定目标奖励值,以实现对目标强化学习模型的训练。
具体地,参考环境参数可以通过作物的种植手册来确定,作物的种植手册中可以记载有经验知识,包括作物的什么生长阶段对应的适宜的环境参数范围,根据调节后的环境参数和参考环境参数,可以评价目标强化学习模型输出的样本调节信息的优劣,得到奖励值,用来更新目标强化学习模型。但是,一般来说,经验知识中适宜作物生长的参数往往是一个范围,并且,影响作物生长的多个因素:温度、湿度、土壤养分等互相影响,在适宜作物生长的参数范围内的各个环节参数也可能会导致不同的生长状态,仅仅采用参考环境参数和调节后的环境参数之间的差异确定目标奖励值来更新目标强化学习模型,只能使得目标强化学习模型可以输出在范围之内的数值,而无法让目标强化学习模型输出更加准确的有利于作物生长的调节信息。本发明提供的方法,为了提升目标强化学习模型的性能,使之能够输出更加有利于作物生长的调节信息,还基于训练过程中作物的实际生长状态数据来得到目标奖励值。具体地,基于第一奖励值确定目标奖励值,包括:
获取当前的训练轮次数值;
当训练轮次数值达到预设阈值M+1时,获取样本农业大棚中的作物在当前时间步以及当前时间步的前M个时间步中的生长状态数据;
获取针对生长状态数据的评价分数,基于评价分数确定权重值,基于权重值对第一奖励值进行加权处理,得到目标奖励值,并对训练轮次数值进行清零处理;
当训练轮次数值未达到预设阈值时,将第一奖励值作为目标奖励值,并对训练轮次数值加1。
生长环境对作物的生长状态的影响并非是立刻显现,本发明提供的方法,在训练目标强化学习模型时,每隔一段时间(M+1个时间步)基于作物的生长状态计算目标奖励值,给目标强化学习模型进行反馈,使得目标强化学习模型除了学习到理论上适宜作物生长的环境参数的设备调节信息之外,还可以学习到实际上有利于作物生长状态的环境参数的设备调节信息。
进一步地,在下一时间步基于设备调节信息控制环境设备,包括:
获取目标农业大棚和样本农业大棚之间的尺寸差异信息以及环境调节设备配置差异信息;
基于尺寸差异信息和环境设备配置差异信息对设备调节信息进行修正,得到修正调节信息;
基于修正调节信息控制环境设备。
正如前文所说明的,目标农业大棚和样本农业大棚的尺寸、环境调节设备配置情况可以相同,也可以不同,而由于目标强化学习是基于样本农业大棚进行训练的,本发明提供的方法,为了提升目标强化学习模型的适应性,当目标农业大棚和样本农业大棚的尺寸、环境调节设备配置情况不同时,基于目标农业大棚和样本农业大棚之间的尺寸差异信息以及环境调节设备配置差异信息对目标强化学习模型输出的设备调节信息进行修正,得到修正调节信息,基于修正调节信息控制目标农业大棚内的环境设备。
具体地,尺寸差异信息反映目标农业大棚和样本农业大棚尺寸的差异,环境设备配置差异信息反映目标农业大棚和样本农业大棚内配置的调节环境参数的设备的差异,利于环境设备的数量、型号等。基于尺寸差异信息和环境设备配置差异信息对设备调节信息进行修正,得到修正调节信息,可以是根据预先建立的目标农业大棚和样本农业大棚之间的调节信息映射关系来确定,也就是说,预先建立当环境参数变化量相同时,目标农业大棚和样本农业大棚分别对应的环境设备的调节信息之间的映射关系,这个映射关系可以是线性的,也可以是非线性的。
下面对本发明提供的农业大棚环境调节装置进行描述,下文描述的农业大棚环境调节装置与上文描述的农业大棚环境调节方法可相互对应参照。如图2所示,该装置包括:
信息获取模块210,用于获取目标农业大棚内的作物生长阶段;
信息预测模块220,用于在当前时间步结束时,将下一时间步对应的时间段、作物生长阶段以及目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取目标强化学习模型输出的下一时间步的设备调节信息,其中,环境变化信息包括目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,环境设备用于改变目标农业大棚内的环境参数,N为大于1的正整数;
设备控制模块230,用于在下一时间步基于设备调节信息控制环境设备;
其中,目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组样本数据包括样本时间段、样本作物生长阶段以及样本环境变化信息,样本数据对应的目标奖励值是基于将样本数据输入至目标强化学习模型后,根据目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行农业大棚环境调节方法,该方法包括:获取目标农业大棚内的作物生长阶段;在当前时间步结束时,将下一时间步对应的时间段、作物生长阶段以及目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取目标强化学习模型输出的下一时间步的设备调节信息,其中,环境变化信息包括目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,环境设备用于改变目标农业大棚内的环境参数,N为大于1的正整数;在下一时间步基于设备调节信息控制环境设备;其中,目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组样本数据包括样本时间段、样本作物生长阶段以及样本环境变化信息,样本数据对应的目标奖励值是基于将样本数据输入至目标强化学习模型后,根据目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的农业大棚环境调节方法,该方法包括:获取目标农业大棚内的作物生长阶段;在当前时间步结束时,将下一时间步对应的时间段、作物生长阶段以及目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取目标强化学习模型输出的下一时间步的设备调节信息,其中,环境变化信息包括目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,环境设备用于改变目标农业大棚内的环境参数,N为大于1的正整数;在下一时间步基于设备调节信息控制环境设备;其中,目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组样本数据包括样本时间段、样本作物生长阶段以及样本环境变化信息,样本数据对应的目标奖励值是基于将样本数据输入至目标强化学习模型后,根据目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种农业大棚环境调节方法,其特征在于,包括:
获取目标农业大棚内的作物生长阶段;
在当前时间步结束时,将下一时间步对应的时间段、所述作物生长阶段以及所述目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取所述目标强化学习模型输出的下一时间步的设备调节信息,其中,所述环境变化信息包括所述目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,所述环境设备用于改变所述目标农业大棚内的环境参数,N为大于1的正整数;
在所述下一时间步基于所述设备调节信息控制所述环境设备;
其中,所述目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组所述样本数据包括样本时间段、样本作物生长阶段以及样本环境变化信息,所述样本数据对应的目标奖励值是基于将所述样本数据输入至所述目标强化学习模型后,根据所述目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。
2.根据权利要求1所述的农业大棚环境调节方法,其特征在于,所述目标强化学习模型的训练过程包括:
在多组所述样本数据中选择目标样本数据;
将所述目标样本数据输入至所述目标强化学习模型中,获取所述目标强化学习模型输出的所述目标样本数据对应的样本调节信息;
基于所述样本调节信息调节所述样本农业大棚内的样本环境设备,获取调节后的环境参数;
基于所述目标样本数据中的所述样本时间段和所述样本作物生长阶段确定参考环境参数;
基于所述调节后的环境参数和所述参考环境参数确定第一奖励值;
基于所述第一奖励值确定所述目标奖励值;
基于所述目标奖励值更新所述目标强化学习模型。
3.根据权利要求2所述的农业大棚环境调节方法,其特征在于,所述基于所述第一奖励值确定所述目标奖励值,包括:
获取当前的训练轮次数值;
当所述训练轮次数值达到预设阈值M+1时,获取所述样本农业大棚中的作物在当前时间步以及当前时间步的前M个时间步中的生长状态数据;
获取针对所述生长状态数据的评价分数,基于所述评价分数确定权重值,基于所述权重值对所述第一奖励值进行加权处理,得到所述目标奖励值,并对所述训练轮次数值进行清零处理;
当所述训练轮次数值未达到所述预设阈值时,将所述第一奖励值作为所述目标奖励值。
4.根据权利要求1所述的农业大棚环境调节方法,其特征在于,所述在所述下一时间步基于所述设备调节信息控制所述环境设备,包括:
获取所述目标农业大棚和所述样本农业大棚之间的尺寸差异信息以及环境调节设备配置差异信息;
基于所述尺寸差异信息和所述环境调节设备配置差异信息对所述设备调节信息进行修正,得到修正调节信息;
基于所述修正调节信息控制所述环境设备。
5.根据权利要求1-4中任一项所述的农业大棚环境调节方法,其特征在于,所述获取目标农业大棚内的作物生长阶段,包括:
控制图像采集设备对所述目标农业大棚内的种植区域进行图像采集,得到作物图像;
将作物图像序列输入至已训练的神经网络模型中,获取所述神经网络模型输出的所述作物生长阶段,所述作物图像序列包括按时间顺序排序的多张所述作物图像。
6.根据权利要求5所述的农业大棚环境调节方法,其特征在于,所述神经网络模型包括目标检测模块、第一特征提取模块、第二特征提取模块、第三特征提取模块、特征融合模块以及预测模块;
所述将作物图像序列输入至已训练的神经网络模型中,获取所述神经网络模型输出的所述作物生长阶段,包括:
将所述作物图像序列中的每张所述作物图像分别输入至所述目标检测模块中,得到所述目标检测模块输出的每张所述作物图像中的目标检测结果,所述目标检测结果包括叶片区域检测结果、花朵区域检测结果以及果实区域检测结果;
将每张所述作物图像对应的所述叶片区域检测结果输入至所述第一特征提取模块中,获取所述作物图像序列对应的叶片区域变化特征;
将每张所述作物图像对应的所述花朵区域检测结果输入至所述第二特征提取模块中,获取所述作物图像序列对应的花朵区域变化特征;
将每张所述作物图像对应的所述果实区域检测结果输入至所述第三特征提取模块中,获取所述作物图像序列对应的果实区域变化特征;
通过所述特征融合模块对所述叶片区域变化特征、所述花朵区域变化特征和所述果实区域变化特征进行融合,得到融合特征;
将所述融合特征输入至所述预测模块中,获取所述预测模块输出的所述作物生长阶段。
7.根据权利要求6所述的农业大棚环境调节方法,其特征在于,所述神经网络模型的训练过程包括:
将样本作物图像序列中的每张样本作物图像分别输入至所述目标检测模块中,获取所述目标检测模块输出的样本叶片区域检测结果、样本花朵区域检测结果以及样本果实区域检测结果;
将每张所述样本作物图像对应的所述样本叶片区域检测结果输入至所述第一特征提取模块中,将每张所述样本作物图像对应的所述样本花朵区域检测结果输入至所述第二特征提取模块中,将每张所述样本作物图像对应的所述样本果实区域检测结果输入至所述第三特征提取模块中,得到样本叶片区域变化特征、样本花朵区域变化特征和样本果实区域变化特征;
通过所述特征融合模块对所述样本叶片区域变化特征、所述样本花朵区域变化特征和所述样本果实区域变化特征进行融合,得到第一样本融合特征;
通过所述特征融合模块对所述样本叶片区域变化特征、所述样本花朵区域变化特征和第一预设特征进行融合,得到第二样本融合特征,所述第一预设特征和所述样本果实区域变化特征的尺寸相同,且所述第一预设特征中的每个特征值为1;
通过所述特征融合模块对所述样本叶片区域变化特征、所述样本果实区域变化特征和第二预设特征进行融合,得到第三样本融合特征,所述第二预设特征和所述样本花朵区域变化特征的尺寸相同,且所述第二预设特征中的每个特征值为1;
将所述第一样本融合特征输入至所述预测模块中,得到第一样本作物生长阶段,将所述第二样本融合特征输入至所述预测模块中,得到第二样本作物生长阶段,将所述第三样本融合特征输入至所述预测模块中,得到第三样本作物生长阶段;
根据所述第一样本作物生长阶段和所述样本作物图像序列对应的作物生长阶段标签,得到第一损失,根据所述第二样本作物生长阶段和所述作物生长阶段标签,得到第二损失,根据所述第三样本作物生长阶段和所述作物生长阶段标签,得到第三损失;
根据所述第一损失、所述第二损失和所述第三损失得到训练损失,根据所述训练损失更新所述神经网络模型的参数。
8.一种农业大棚环境调节装置,其特征在于,包括:
信息获取模块,用于获取目标农业大棚内的作物生长阶段;
信息预测模块,用于在当前时间步结束时,将下一时间步对应的时间段、所述作物生长阶段以及所述目标农业大棚内的环境变化信息输入至已训练的目标强化学习模型中,获取所述目标强化学习模型输出的下一时间步的设备调节信息,其中,所述环境变化信息包括所述目标农业大棚在当前时间步以及当前时间步的前N个时间步内的环境参数和环境设备的状态信息,所述环境设备用于改变所述目标农业大棚内的环境参数,N为大于1的正整数;
设备控制模块,用于在所述下一时间步基于所述设备调节信息控制所述环境设备;
其中,所述目标强化学习模型基于多组随机生成的样本数据以及对应的目标奖励值训练得到,每组所述样本数据包括样本时间段、样本作物生长阶段以及样本环境变化信息,所述样本数据对应的目标奖励值是基于将所述样本数据输入至所述目标强化学习模型后,根据所述目标强化学习模型输出的样本调节信息控制样本环境设备后样本农业大棚内的环境参数确定的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述农业大棚环境调节方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述农业大棚环境调节方法。
CN202311153863.8A 2023-09-08 农业大棚环境调节方法、装置、设备及介质 Active CN116910490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311153863.8A CN116910490B (zh) 2023-09-08 农业大棚环境调节方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311153863.8A CN116910490B (zh) 2023-09-08 农业大棚环境调节方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN116910490A true CN116910490A (zh) 2023-10-20
CN116910490B CN116910490B (zh) 2023-12-15

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117598138A (zh) * 2023-12-28 2024-02-27 耀昶嵘相变材料科技(广东)有限公司 农业养殖大棚的供能方法、终端及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117598138A (zh) * 2023-12-28 2024-02-27 耀昶嵘相变材料科技(广东)有限公司 农业养殖大棚的供能方法、终端及系统

Similar Documents

Publication Publication Date Title
JP6261492B2 (ja) 情報処理装置及び情報処理方法及びプログラム
KR20180076766A (ko) 인공지능 스마트팜 관리 시스템
CN115204689B (zh) 一种基于图像处理的智慧农业管理系统
US20220248616A1 (en) Irrigation control with deep reinforcement learning and smart scheduling
CN104750146A (zh) 用于种植植物的调控方法和装置
CN115529987B (zh) 作物设施的风口调控方法、装置、设备及存储介质
JP2019170359A (ja) 植物栽培結果予測システム
KR102265587B1 (ko) 스마트팜 재배이력을 이용한 스마트팜 재배시스템
CN111095314A (zh) 作物植物种植的产量估计
JP2018007630A (ja) 栽培支援装置
US10064347B2 (en) Plant cultivation system, and plant cultivation unit
Tarova et al. Analysis of taxation assessment results and development of a method for applying digital technologies in the assessment of garden agrocenoses stability
JP2020149652A (ja) 営農に最適な潅水と肥料を施す学習型農業システム
CN117252344A (zh) 培育设施的适宜度评估方法、装置、电子设备和存储介质
CN116910490B (zh) 农业大棚环境调节方法、装置、设备及介质
CA3196136A1 (en) Advanced crop manager for crops stress mitigation
JP2020156431A (ja) 農作物の生育評価・作業提案方法および農作物の生育評価・作業提案システム、ならびに地域農業活性システム
CN116910490A (zh) 农业大棚环境调节方法、装置、设备及介质
CN116523149A (zh) 微小害虫防治适期预测方法、装置、电子设备和存储介质
CN116755485A (zh) 一种温室调控方法、装置、系统、设备和存储介质
KR102134397B1 (ko) 작물활성지수 기반 시설원예 복합환경 제어시스템 및 방법
CN106465635A (zh) 基于土壤的农业互联生产方法
CN115081713A (zh) 一种植物产量优化方法及植物种植系统
Van Straten On-line optimal control of greenhouse crop cultivation
KR102440824B1 (ko) 토마토의 최적 생육 환경 학습 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant