CN115016413A - 一种用于植物工厂作物种植的智能环境控制方法 - Google Patents

一种用于植物工厂作物种植的智能环境控制方法 Download PDF

Info

Publication number
CN115016413A
CN115016413A CN202210671302.6A CN202210671302A CN115016413A CN 115016413 A CN115016413 A CN 115016413A CN 202210671302 A CN202210671302 A CN 202210671302A CN 115016413 A CN115016413 A CN 115016413A
Authority
CN
China
Prior art keywords
plant factory
environment control
crop
strategy
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210671302.6A
Other languages
English (en)
Inventor
陈垣毅
王德志
闫鹏全
郑增威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University City College ZUCC
Original Assignee
Zhejiang University City College ZUCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University City College ZUCC filed Critical Zhejiang University City College ZUCC
Priority to CN202210671302.6A priority Critical patent/CN115016413A/zh
Publication of CN115016413A publication Critical patent/CN115016413A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM]
    • G05B19/41885Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32339Object oriented modeling, design, analysis, implementation, simulation language
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/25Greenhouse technology, e.g. cooling systems therefor

Abstract

本发明涉及一种用于植物工厂作物种植的智能环境控制方法,包括:用马尔可夫决策过程对作物种植过程进行建模;构建智能环境控制算法的采样经验池,设计植物工厂采样学习策略;设计指导智能环境控制算法的奖励函数;使用智能环境控制算法学习环境控制策略,通过双通路机制输出环境控制策略。本发明的有益效果是:本发明提供的环境控制策略考虑了海量组合优化空间,且较为精细,进而植物工厂的环境控制效果较好,作物种植产量提升效果也较好。

Description

一种用于植物工厂作物种植的智能环境控制方法
技术领域
本发明涉及植物工厂环境调控领域,更确切地说,它涉及一种用于植物工厂作物种植的智能环境控制方法。
背景技术
近年来,分布不均匀的降水、极端的高温天气以及来自南北极的寒流严重损害了部分地区的农业生产情况,直接导致了粮食的减产与供给不足,故不受外部气候条件影响的的植物工厂成为了保证作物产量的重要手段。通过高精度环境控制让作物种植脱离自然环境的约束,植物工厂涉及多种学科交叉,集生物、材料、农学、计算机科学、人工智能、自动化控制、机械、机器人等技术于一体,实现了周年连续生产的高效农业系统,为我国土地资源需求矛盾提出了新的解决方案。
但植物工厂作物智能环境控制需要准确刻画植物工厂环境中光照、二氧化碳、温湿度等环境因子及不同营养液配比对作物不同阶段生长发育的影响,进而为作物生长提供最优的环境因子及营养液精准管理策略。与传统设施栽培相比,植物工厂作物主要生理过程与环境因子之间的耦合关系更强。另一方面,由于设施的全封闭,使得原植物的地下部、地上部和小气候环境形成连通的封闭的循环系统,传统刻画环境因子与作物生长关系的生长模型已不能适应植物工厂环境下的作物栽培控制。传统基于经验的设定值控制、模糊控制、环境因子耦合控制等环境控制方法,已经不能满足植物工厂中环境控制的需求。其中基于经验的设定值控制无法应对植物工厂中生产目标的变更,当更换种植作物时需要重新进行控制设计,同时非常依赖于设计控制阈值的专家能力;模糊控制也存在设计缺乏系统性,控制精度低的问题,不能充分利用到植物工厂精准控制的环境控制优势;环境因子耦合控制缺少对于单环境因素调节的能力。
发明内容
本发明的目的是克服现有技术中的不足,提供了一种用于植物工厂作物种植的智能环境控制方法,包括:
S1、根据不同的植物工厂的设计结构和种植作物类别,利用马尔可夫决策过程对作物种植过程进行建模;
S2、对植物工厂中现有的专家经验策略和种植数据进行整合,构建智能环境控制算法的采样经验池,设计植物工厂采样学习策略;
S3、确定植物工厂种植目标,并根据所述种植目标,设计指导智能环境控制算法的奖励函数,通过所述奖励函数评估环境控制策略能否实现种植目标;
S4、使用智能环境控制算法学习环境控制策略,通过双通路机制输出环境控制策略,并根据输出的环境控制策略控制植物工厂的内部环境。
作为优选,S1包括:
S101、获取目标植物工厂的状态空间,所述目标植物工厂的状态空间包括目标植物工厂的环境状态维度及其取值范围、种植相应作物的状态维度及其取值范围;
S102、获取目标植物工厂的动作空间,所述目标植物工厂的动作空间包括目标植物工厂中的可调环境参数以及其可调幅度;
S103、将植物工厂环境下作物种植和环境交互过程利用马尔可夫决策过程建模表达。
作为优选,S2包括:
S201、根据植物工厂中现有的专家经验策略和种植数据,构建分层采样经验池,将分层采样经验池划分为专家经验层、重点信息经验层和普通信息经验层;
S202、设计每个经验层数据录入的标准以及最大数据条目容量;
S203、设计不同层采样经验池的采样概率,确定智能环境控制算法从每个经验层中抽取数据样本进行学习的概率。
作为优选,S3包括:
S301、确定主要优化目标以及是否有辅助优化目标,所述主要优化目标包括植物工厂作物的产量优化目标和作物成熟速度的优化目标,拆分大优化任务;
S302、根据主要优化目标设计主干奖励函数,所述为主干奖励函数为正向奖励函数或负向奖励函数;
S303、根据不同作物生长的特性,设计辅助奖励函数。
作为优选,S4包括:
S401、获取智能环境控制算法学习的环境控制策略,所述智能环境控制算法为支持离线学习且支持连续状态和策略空间优化的算法;
S402、设计双通路机制,将智能环境控制算法学习的环境控制策略和已有的专家策略进行比对,当差异化小于设定阈值时采纳智能环境控制算法学习的环境控制策略;
S403、将智能环境控制算法学习的环境控制策略转化为特定植物工厂的控制行为。
作为优选,S101中,植物工厂的状态空间包括作物状态空间Scrop和环境状态空间Senv;所述作物状态空间Scrop包括作物的表型参数数据,表示为:
(DH,DD,DLA,DDW,DFW)
其中,DH表示作物植株的高度,DD表示作物根茎的深度,DLA表示作物叶面积指数的大小,DDW表示作物脱水后的干物质重量,DFW表示作物的鲜重;
所述环境状态空间Senv包括植物工厂的环境状态维度,所述环境状态维度包括湿度、二氧化碳浓度、光照强度、温度和营养液微量元素含量;
S102中,植物工厂的动作空间还包括用于调控环境的设备以及其调控方式。
作为优选,S103中,马尔可夫决策过程表示为:
(S,A,P,R,γ)
其中,S表示状态空间;A表示动作状态空间;P表示状态转移函数;R表示奖励函数;γ表示折扣因子。
作为优选,S201和S202中,专家经验层中具有至少两个存在差异的完整策略链样本;
重点信息经验层具有重点信息样本,所述重点信息样本通过是否会带来高额奖励回报来进行判断,判断标准公式为:
Figure BDA0003694733880000031
Figure BDA0003694733880000032
其中,E表示求期望公式,rn表示第n个时刻获得的奖励数值,K表示重点信息经验层中最近存储的重点信息样本的经验轨迹的数量,Gi表示第i次种植后总累积回报,
Figure BDA0003694733880000033
表示重点信息层中的策略种植得到的平局总奖励。
作为优选,S203中,设计不同层经验池的采样概率,其中专家经验层采样概率的计算公式为:
Figure BDA0003694733880000034
其中,GExport表示使用专家经验策略轨迹完成种植得到的平均累计奖励,GLast表示当前训练轮次前的K轮训练平均奖励,αe为超参数且αe∈[0,1]。
作为优选,S402中,智能环境控制算法学习的环境控制策略和已有的专家策略的差异化评估公式为:
Figure BDA0003694733880000041
其中,Threshold表示整体阈值,A′i表示智能环境控制算法学习的环境控制策略,Ai表示已有的专家策略,n表示控制空间的维度。
本发明的有益效果是:
(1)本发明提出了一种用于植物工厂作物种植的智能环境控制方法,在植物工厂环境下使得作物种植产量得到进一步提升。
(2)本发明提供的环境控制策略考虑了海量组合优化空间,且较为精细,进而植物工厂的环境控制效果较好,作物种植产量提升效果也较好。
(3)本发明通过双通路机制将智能环境控制算法学习的环境控制策略和已有的专家策略进行比对,避免了智能环境控制算法学习的早期环境控制策略稳定性和实用性较差的问题。
附图说明
图1为本申请提供的一种用于植物工厂作物种植的智能环境控制方法的流程图;
图2为本申请提供的植物工厂环境马尔可夫决策过程建模流程图;
图3为本申请提供的构建智能环境控制的采样经验池流程图;
图4为本申请提供的植物工厂优化目标确定和设计奖励函数流程图;
图5为本申请提供的使用智能环境控制算法进行环境控制流程图;
图6为本申请提供的智能环境控制DDPG算法模型结构图。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
实施例1:
为解决传统植物工厂中环境控制策略未考虑海量组合优化空间、控制策略粗放等问题,本申请提供了一种用于植物工厂作物种植的智能环境控制方法,如图1所示,包括:
S1、根据不同的植物工厂的设计结构和种植作物类别,利用马尔可夫决策过程对作物种植过程进行建模。
S2、对植物工厂中现有的专家经验策略和种植数据进行整合,构建智能环境控制算法的采样经验池,设计植物工厂采样学习策略。
S3、确定植物工厂种植目标,并根据种植目标,设计指导智能环境控制算法的奖励函数,通过奖励函数评估环境控制策略能否实现种植目标。
S4、使用智能环境控制算法学习环境控制策略,通过双通路机制输出环境控制策略,并根据输出的环境控制策略控制植物工厂的内部环境。
如图2所示,S1包括:
S101、获取目标植物工厂的状态空间,目标植物工厂的状态空间包括目标植物工厂的环境状态维度及其取值范围、种植相应作物的状态维度及其取值范围。
S102、获取目标植物工厂的动作空间,目标植物工厂的动作空间包括目标植物工厂中的可调环境参数以及其可调幅度。
S103、将植物工厂环境下作物种植和环境交互过程利用马尔可夫决策过程建模表达。
如图3所示,S2包括:
S201、根据植物工厂中现有的专家经验策略和种植数据,构建分层采样经验池,将分层采样经验池划分为专家经验层、重点信息经验层和普通信息经验层。
S202、设计每个经验层数据录入的标准以及最大数据条目容量。
S203、设计不同层采样经验池的采样概率,确定智能环境控制算法从每个经验层中抽取数据样本进行学习的概率。
如图4所示,S3包括:
S301、确定主要优化目标以及是否有辅助优化目标,主要优化目标包括植物工厂作物的产量优化目标和作物成熟速度的优化目标,拆分大优化任务。示例地,在优化目标包括主要优化目标以及辅助优化目标时,将所有优化目标对应的大优化任务拆分为主要优化任务和辅助优化任务。在优化目标不包含辅助优化目标时,本申请也可以不对大优化任务进行拆分。
S302、根据主要优化目标设计主干奖励函数,为主干奖励函数为正向奖励函数或负向奖励函数。
S303、根据不同作物生长的特性,设计辅助奖励函数。
如图5所示,S4包括:
S401、获取智能环境控制算法学习的环境控制策略,如图6所示,智能环境控制算法为深度强化学习这种支持离线学习且支持连续状态和策略空间优化的算法。
S402、设计双通路机制,将智能环境控制算法学习的环境控制策略和已有的专家策略进行比对,当差异化小于设定阈值时采纳智能环境控制算法学习的环境控制策略。
S403、将智能环境控制算法学习的环境控制策略转化为特定植物工厂的控制行为。
S101中,植物工厂的状态空间包括作物状态空间Scrop和环境状态空间Senv
作物状态空间Scrop包括作物的表型参数数据,表示为:
(DH,DD,DLA,DDW,DFW)
其中,DH表示作物植株的高度,DD表示作物根茎的深度,DLA表示作物叶面积指数的大小,DDW表示作物脱水后的干物质重量,DFW表示作物的鲜重;
环境状态空间Senv根据不同植物工厂的采集传感器有不同的环境状态维度,示例地,环境状态维度包括湿度、二氧化碳浓度、光照强度、温度和营养液微量元素含量;
S102中,植物工厂的动作空间还包括用于调控环境的设备以及其调控方式。示例地,植物工厂的动作空间包括采用空调或门窗调控温度和湿度,营养液增添等控制活动,需要根据植物工厂自身因素设计。
S103中,马尔可夫决策过程表示为:
(S,A,P,R,γ)
其中,S表示状态空间,包括作物状态空间Scrop和环境状态空间Senv;A表示植物工厂进行环境调控的动作状态空间;P表示状态转移函数P(st+1|st,at),表示植物工厂状态随着环境控制动作的迁移概率,st表示植物工厂的初始状态,st+1表示植物工厂执行状态转移后的状态;t代表了时间刻度,考虑到植物生长的周期和模型复杂度因素,本申请将一天的时间作为一个时间刻度,当然,一个时间刻度也可以不表示一天的时间,本申请对此不做限定;R表示奖励函数用来评估环境控制的好坏,使用r(st,at)表示立即得到反馈奖励;γ表示折扣因子,用于计算一个决策链的奖励反馈,例如:
Figure BDA0003694733880000061
其中,ε表示的是决策策略链,εt表示一条从状态st开始到作物生长结束时的状态sT决策链,r(st,at)表示立即得到反馈奖数值,T表示策略结束时的时间刻度。
S201和S202中,专家经验层中具有至少两个存在差异的完整策略链样本。需要说明的是,专家经验层是由专家在训练前提前通过记录采集植物工厂的运行数据,得到的基于专家经验的样本条目,其获取相对困难,并未对其的具体数目有要求,但至少需要有两个存在一定差异的完整的策略链样本,整体的数据信息通常要涵盖作物的整个生长种植周期。
重点信息经验层具有重点信息样本,重点信息样本通过是否会带来高额奖励回报来进行判断,具体地,每当植物工厂结束一轮种植,通过奖励函数计算其累积回报,如果该策略链被定义为高额奖励回报策略,则将其全部样本定义为重点信息样本存储在重点信息层,判断标准公式为:
Figure BDA0003694733880000071
Figure BDA0003694733880000072
其中,E表示求期望公式,rn表示第n个时刻获得的奖励数值,K表示重点信息经验层中最近存储的重点信息样本的经验轨迹的数量,Gi表示第i次种植后总累积回报,
Figure BDA0003694733880000073
表示重点信息层中的策略种植得到的平局总奖励。
S203中,设计不同层经验池的采样概率,其中专家经验层采样概率的计算公式为:
Figure BDA0003694733880000074
其中,GExport表示使用专家经验策略轨迹完成种植得到的平均累计奖励,GLast表示当前训练轮次前的K轮训练平均奖励,通常取5就可以满足大部分情况,αe为超参数且αe∈[0,1],通常取0.9比较合适。通过该采样计算公式,在网络训练的初期大部分的训练数据样本都是来自于专家经验,其信息密度远超随机探索,有助于网络的快速学习,当训练到中后期PRxport会大幅度下降,此时会以更大的概率从重点信息层和普通信息层中进行样本抽取。
对于重点信息层和普通信息层中的样本则是在后续的网络训练中得到的数据,其抽样概率为2∶1,也可以根据需要进行相应的修改。
S302中,根据相应的优化目标设计合适的主干奖励函数,其中需要判断使用正向奖励函数或是负向奖励函数。正向的奖励函数会鼓励强化学习的智能体积累奖励,做能够获得更高回报的行为,从而在作物生长过程中最大化作物产量积累,如公式:
Figure BDA0003694733880000075
其中ξ表示每天作物干重增加量,η表示每天作物鲜重的增加量,lg表示以10为底数取对数,r(st,at,st+1)表示从状态st执行动作at达到状态st+1获得的奖励。
与之相对,负向的奖励也可以被称为惩罚。训练强化学习智能体减少会被惩罚的行为,使作物在生长时能尽快进入成熟期,通过无产量的惩罚阶段,开始积累产量,如公式:
Figure BDA0003694733880000076
S303中,据不同作物生长的特性,设计合适的辅助奖励函数,帮助目标的优化。从光合作用的角度出发设计辅助奖励函数,作物需要通过光合作用来进行生长和产量的积累,而光合作用又和作物的叶面积大小成正相关,所以考虑以作物的LAI作为参考设计辅助函数,辅助奖励函数设计如公式,
Figure BDA0003694733880000081
其中xL代表LAI的值,xH代表作物生根的增长量。
S402中,双通路控制策略的输出机制,在智能环境控制算法的早期策略稳定性和实用性较差,通过智能环境控制算法学习到的策略和已有的专家策略进行比对,当差异化小于相应阈值时采纳强化学习的控制策略,智能环境控制算法学习的环境控制策略和已有的专家策略的差异化评估公式为:
Figure BDA0003694733880000082
其中,Threshold表示整体阈值,A′i表示智能环境控制算法学习的环境控制策略,Ai表示已有的专家策略,n表示控制空间的维度。当整体阈值Threshold小于0.6时采用强化学习的策略,否则认为强化学习的策略未进行收敛采用原有策略。
实施例2:
为了验证本发明提出的用于植物工厂作物种植的智能环境控制方法的有效性,在植物工厂仿真种植系统中进行多组仿真对比实验,并且多组仿真对比实验在植物工厂的正常环境以及限制条件下进行,该限制条件包括限制灌溉环境,限制灌溉和限制营养液添加。
结果如下表,其中专家系统采用农业专家在种植指导手册白皮书中提供的植物工厂作物种植环境控制策略,本发明系统采用深度强化学习生成的种植环境控制策略。
表1
Figure BDA0003694733880000083
Figure BDA0003694733880000091
实验结果表明:本发明提出的用于植物工厂作物种植的智能环境控制方法在四种作物的种植实验中都可以起到远超专家经验的作物产量累积,在不同种植环境和种植作物下平均产量有25%以上的提升。其中在马铃薯的正常种植情况下,得到了最高的产量提升,对比专家仿真种植产量,实现39.50%的增产。

Claims (10)

1.一种用于植物工厂作物种植的智能环境控制方法,其特征在于,包括以下步骤:
S1、根据不同的植物工厂的设计结构和种植作物类别,利用马尔可夫决策过程对作物种植过程进行建模;
S2、对植物工厂中现有的专家经验策略和种植数据进行整合,构建智能环境控制算法的采样经验池,设计植物工厂采样学习策略;
S3、确定植物工厂种植目标,并根据所述种植目标,设计指导智能环境控制算法的奖励函数,通过所述奖励函数评估环境控制策略能否实现种植目标;
S4、使用智能环境控制算法学习环境控制策略,通过双通路机制输出环境控制策略,并根据输出的环境控制策略控制植物工厂的内部环境。
2.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S1包括:
S101、获取目标植物工厂的状态空间,所述目标植物工厂的状态空间包括目标植物工厂的环境状态维度及其取值范围、种植相应作物的状态维度及其取值范围;
S102、获取目标植物工厂的动作空间,所述目标植物工厂的动作空间包括目标植物工厂中的可调环境参数以及其可调幅度;
S103、将植物工厂环境下作物种植和环境交互过程利用马尔可夫决策过程建模表达。
3.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S2包括:
S201、根据植物工厂中现有的专家经验策略和种植数据,构建分层采样经验池,将分层采样经验池划分为专家经验层、重点信息经验层和普通信息经验层;
S202、设计每个经验层数据录入的标准以及最大数据条目容量;
S203、设计不同层采样经验池的采样概率,确定智能环境控制算法从每个经验层中抽取数据样本进行学习的概率。
4.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S3包括:
S301、确定主要优化目标以及是否有辅助优化目标,所述主要优化目标包括植物工厂作物的产量优化目标和作物成熟速度的优化目标,拆分大优化任务;
S302、根据主要优化目标设计主干奖励函数,所述为主干奖励函数为正向奖励函数或负向奖励函数;
S303、根据不同作物生长的特性,设计辅助奖励函数。
5.根据权利要求1所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S4包括:
S401、获取智能环境控制算法学习的环境控制策略,所述智能环境控制算法为支持离线学习且支持连续状态和策略空间优化的算法;
S402、设计双通路机制,将智能环境控制算法学习的环境控制策略和已有的专家策略进行比对,当差异化小于设定阈值时采纳智能环境控制算法学习的环境控制策略;
S403、将智能环境控制算法学习的环境控制策略转化为特定植物工厂的控制行为。
6.根据权利要求2所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S101中,植物工厂的状态空间包括作物状态空间Scrop和环境状态空间Senv
所述作物状态空间Scorp包括作物的表型参数数据,表示为:
(DH,DD,DLA,DDW,DFW)
其中,DH表示作物植株的高度,DD表示作物根茎的深度,DLA表示作物叶面积指数的大小,DDW表示作物脱水后的干物质重量,DFW表示作物的鲜重;
所述环境状态空间Senv包括植物工厂的环境状态维度,所述环境状态维度包括湿度、二氧化碳浓度、光照强度、温度和营养液微量元素含量;
S102中,植物工厂的动作空间还包括用于调控环境的设备以及其调控方式。
7.根据权利要求2所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S103中,马尔可夫决策过程表示为:
(S,A,P,R,γ)
其中,S表示状态空间;A表示动作状态空间;P表示状态转移函数;R表示奖励函数;γ表示折扣因子。
8.根据权利要求3所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S201和S202中,专家经验层中具有至少两个存在差异的完整策略链样本;
重点信息经验层具有重点信息样本,所述重点信息样本通过是否会带来高额奖励回报来进行判断,判断标准公式为:
Figure FDA0003694733870000021
Figure FDA0003694733870000022
其中,E表示求期望公式,rn表示第n个时刻获得的奖励数值,K表示重点信息经验层中最近存储的重点信息样本的经验轨迹的数量,Gi表示第i次种植后总累积回报,
Figure FDA0003694733870000023
表示重点信息层中的策略种植得到的平局总奖励。
9.根据权利要求3所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S203中,设计不同层经验池的采样概率,其中专家经验层采样概率的计算公式为:
Figure FDA0003694733870000031
其中,GExport表示使用专家经验策略轨迹完成种植得到的平均累计奖励,GLast表示当前训练轮次前的K轮训练平均奖励,αe为超参数且αe∈[0,1]。
10.根据权利要求5所述的用于植物工厂作物种植的智能环境控制方法,其特征在于,S402中,智能环境控制算法学习的环境控制策略和已有的专家策略的差异化评估公式为:
Figure FDA0003694733870000032
其中,Threshold表示整体阈值,A′i表示智能环境控制算法学习的环境控制策略,Ai表示已有的专家策略,n表示控制空间的维度。
CN202210671302.6A 2022-06-15 2022-06-15 一种用于植物工厂作物种植的智能环境控制方法 Withdrawn CN115016413A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210671302.6A CN115016413A (zh) 2022-06-15 2022-06-15 一种用于植物工厂作物种植的智能环境控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210671302.6A CN115016413A (zh) 2022-06-15 2022-06-15 一种用于植物工厂作物种植的智能环境控制方法

Publications (1)

Publication Number Publication Date
CN115016413A true CN115016413A (zh) 2022-09-06

Family

ID=83075319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210671302.6A Withdrawn CN115016413A (zh) 2022-06-15 2022-06-15 一种用于植物工厂作物种植的智能环境控制方法

Country Status (1)

Country Link
CN (1) CN115016413A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117075547A (zh) * 2023-08-15 2023-11-17 上海市农业科学院 一种植物工厂生菜栽培环境优化调控方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117075547A (zh) * 2023-08-15 2023-11-17 上海市农业科学院 一种植物工厂生菜栽培环境优化调控方法
CN117075547B (zh) * 2023-08-15 2024-03-12 上海市农业科学院 一种植物工厂生菜栽培环境优化调控方法

Similar Documents

Publication Publication Date Title
Chang et al. Artificial intelligence approaches to predict growth, harvest day, and quality of lettuce (Lactuca sativa L.) in a IoT-enabled greenhouse system
CN106292802A (zh) 一种用于鱼菜共生系统的智能预测控制系统及方法
CN104899653B (zh) 基于专家系统及蓝藻生长机理时序模型的湖库蓝藻水华预测方法
CN109583663B (zh) 一种适用于养殖池塘的夜间水质溶氧量预测方法
CN112906298B (zh) 一种基于机器学习的蓝莓产量预测方法
CN114519451B (zh) 智能化孤岛型园区车辆碳排量预测方法和系统
CN115016413A (zh) 一种用于植物工厂作物种植的智能环境控制方法
CN108984995A (zh) 一种计算数值模拟的生态园林景观设计方法
CN110705182A (zh) 耦合作物模型和机器学习的作物育种适应时间预测方法
CN111292124A (zh) 一种基于优化组合神经网络的需水预测方法
CN116883215A (zh) 一种考虑候鸟生境动态需求的湖泊湿地生态水文调控方法
CN117322214B (zh) 一种基于神经网络的农作物肥料精准施用方法与系统
CN114092776A (zh) 应用于智慧农业的多传感器数据融合方法
CN117333321A (zh) 基于机器学习的农业灌溉用水量估算方法、系统及介质
CN116029604B (zh) 一种基于健康舒适度的笼养肉鸭养殖环境调控方法
CN116894514A (zh) 一种基于土壤质量指标的作物产量预测方法及系统
CN115796040A (zh) 一种基于小样本的设施温室温度预测方法
CN115965121A (zh) 一种基于随机森林回归的农田氮淋失预测方法
CN113962819A (zh) 一种基于极限学习机的工厂化水产养殖溶解氧预测方法
CN112364936A (zh) 基于人工智能的温室控制方法、装置、设备及存储介质
CN117575174B (zh) 智能农业监测与管理系统
AU2015200565A1 (en) Environmental monitoring
CN116883221B (zh) 一种流域生态监测方法
CN117784290B (zh) 一种基于贝叶斯神经网络的骤旱预警方法及系统
CN116595333B (zh) 土壤-气候智慧型的水稻目标产量与氮肥用量确定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220906

WW01 Invention patent application withdrawn after publication