CN110084539B - 灌溉决策学习方法、装置、服务器和存储介质 - Google Patents

灌溉决策学习方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN110084539B
CN110084539B CN201910511801.7A CN201910511801A CN110084539B CN 110084539 B CN110084539 B CN 110084539B CN 201910511801 A CN201910511801 A CN 201910511801A CN 110084539 B CN110084539 B CN 110084539B
Authority
CN
China
Prior art keywords
decision
irrigation
period
value function
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910511801.7A
Other languages
English (en)
Other versions
CN110084539A (zh
Inventor
罗玉峰
陈梦婷
吴志炎
崔远来
李丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Publication of CN110084539A publication Critical patent/CN110084539A/zh
Application granted granted Critical
Publication of CN110084539B publication Critical patent/CN110084539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Mining & Mineral Resources (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种灌溉决策学习方法、装置、服务器和存储介质,能够提高灌溉决策制定的准确性与科学性,并有效提高水资源利用率。灌溉决策学习方法包括以下步骤:步骤1.获取目标灌溉区域在当前决策周期的环境参数:步骤2.基于获取到的环境参数和初始化的决策值函数,制定灌溉决策;步骤3.在当前决策周期制定的灌溉决策被执行后,对该灌溉决策进行评估,获得反映该灌溉决策合理程度的回馈奖励,并利用回馈奖励更新决策值函数,得到下一个决策周期的决策值函数;步骤4.利用下一个决策周期的决策值函数,和获取的下一个决策周期的环境参数,制定目标灌溉区域在下一个决策周期的灌溉决策,然后进入步骤3进行下一轮灌溉决策学习和制定过程。

Description

灌溉决策学习方法、装置、服务器和存储介质
技术领域
本发明属于灌溉技术领域,具体涉及一种灌溉决策学习方法、装置、服务器和存储介质。
技术背景
我国水资源紧缺加剧,农田灌溉用水占总用水量的比例不断降低,缺水已成为农业可持续发展的制约因素,故迫切需要提高灌溉用水效率,缓解农业用水供需矛盾,而提高降雨利用率是农业节水的有效途径之一。
目前,根据天气预报中的未来降雨情况制定灌溉决策尽管可提高降雨利用率,减少灌水浪费,但由于天气预报是对未来降水、温度和风速等气象条件的预测,存在不确定性,因此仅仅依赖天气预报确定灌溉决策,存在相应的风险。例如,当农作物需要灌溉时,根据预报未来时间内有降雨而选择不灌溉,可以节约灌溉用水,但同时需要承担实际未降雨而造成作物受旱减产的风险;当天气预报近期无雨而灌溉农作物,但未来时间内实际发生降雨,则需要承担灌水浪费的风险。
因此,针对降水的不确定性,完全依赖气象预报确定是否灌溉农作物的方案存在缺陷。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种灌溉决策学习方法、装置、服务器和存储介质,能够提高灌溉决策制定的准确性与科学性,并有效提高水资源利用率。
本发明为了实现上述目的,采用了以下方案:
<灌溉决策学习方法>
本发明提供一种灌溉决策学习方法,其特征在于,包括以下步骤:步骤1.获取目标灌溉区域在当前决策周期的环境参数:步骤2.基于获取到的环境参数和初始化的决策值函数,制定灌溉决策;步骤3.在当前决策周期制定的灌溉决策被执行后,对该灌溉决策进行评估,获得反映该灌溉决策合理程度的回馈奖励,并利用回馈奖励更新决策值函数,得到下一个决策周期的决策值函数;步骤4.利用下一个决策周期的决策值函数,和获取的下一个决策周期的环境参数,制定目标灌溉区域在下一个决策周期的灌溉决策,然后进入步骤3进行下一轮灌溉决策学习和制定过程。
本发明提供的灌溉决策学习方法,还可以具有这样的特征:在步骤1中,当前环境参数包括天气预报数据、土壤水层深度和作物生长发育时期;相应的,步骤2包括如下子步骤:步骤2-1.根据天气预报数据和作物生长发育时期,确定目标灌溉区域的预报作物蒸散量;步骤2-2.将预报作物蒸散量、土壤水层深度和天气预报数据中的预报降雨量进行向量化表示,得到目标灌溉区域的环境状态向量;进而根据环境状态向量和初始化的决策值函数,制定当前决策周期的灌溉决策。
本发明提供的灌溉决策学习方法,还可以具有这样的特征:在步骤2中,还利用当前生成的随机数与预设探索概率的数值关系,确定目标灌溉区域的当前灌溉决策。
本发明提供的灌溉决策学习方法,还可以具有这样的特征:在步骤3中,更新后得到的下一个决策周期的决策值函数为:
Figure BDA0002093724730000031
Figure BDA0002093724730000032
式中,θ表示参数向量函数,(st;at)表示当前决策周期内的环境参数和灌溉决策的合并向量,γ表示奖赏折扣,α表示更新步长,rt表示当前决策周期的回馈奖励。
本发明提供的灌溉决策学习方法,还可以具有这样的特征:在步骤3中,是基于获取的下一个决策周期的环境参数对当前决策周期的灌溉决策进行评估,水资源的利用率越高,灌溉决策制定的越合理,则奖励值越高。
本发明提供的灌溉决策学习方法,还可以具有这样的特征:在步骤4中,还对获取到的环境参数进行修正,得到修正后的下一个决策周期的环境参数,进而基于修正后的环境参数确定相应灌溉决策。
本发明提供的灌溉决策学习方法,还可以具有这样的特征:在步骤4中,修正后的下一个决策周期的土壤水层深度表示为:
Figure BDA0002093724730000033
式中,ht表示当前决策周期内的土壤水层深度,
Figure BDA0002093724730000034
表示当前决策周期内的实际降雨量,
Figure BDA0002093724730000035
表示当前决策周期内的实际作物蒸散量,pt表示当前决策周期内的渗漏量,at表示对应的当前决策周期的灌溉决策,hmax表示目标灌溉区域的作物适宜水层上限,Hp表示目标灌溉区域内作物雨后允许蓄水深度。
另外,本发明提供的灌溉决策学习方法,还可以具有这样的特征:在步骤3中更新得到的是目标灌溉区域最后一个周期的决策值函数的情况下,若决策值函数该处于收敛状态,则将收敛的决策值函数作为目标决策值函数,通过该目标决策值函数来确定与目标灌溉区域的环境参数对应的灌溉策略。
<灌溉决策学习装置>
进一步,本发明提供了一种灌溉决策学习装置,其特征在于,包括:参数获取模块,用于获取目标灌溉区域的环境参数;第一决策确定模块,基于环境参数和初始化的决策值函数确定当前决策周期的灌溉决策;决策值函数更新模块,在灌溉决策被执行后,基于获取的新环境参数对该灌溉决策进行评估,获得反映该灌溉决策合理程度的回馈奖励,并利用回馈奖励更新决策值函数,得到下一个决策周期的决策值函数;以及第二决策确定模块,用于利用更新后的决策值函数,确定目标灌溉区域在下一个决策周期环境参数下的灌溉决策。
<灌溉决策学习服务器>
进一步,本发明还提供了一种灌溉决策学习服务器,其特征在于,包括:存储介质;和至少一个处理器,通过执行存储装置中存储的程序,实现如上述<灌溉决策学习方法>中所述的灌溉决策学习方法。
<存储介质>
更进一步,本发明还提供了一种存储介质,其特征在于:存储有用于实现上述<灌溉决策学习方法>中所述的灌溉决策学习方法的程序。
发明的作用与效果
本发明首先获取目标灌溉区域在当前决策周期的环境参数,并根据当前环境参数和初始化的决策值函数确定当前灌溉决策;然后对被执行的灌溉决策进行评估,获得相应的回馈奖励,并基于此更新决策值函数,并利用更新后的决策值函数,确定出目标灌溉区域在下一个决策周期的灌溉决策,再进行下一轮灌溉决策学习和制定过程;将强化学习思想应用于灌溉决策的学习过程,解决了完全依赖气象预报制定作物灌溉决策时,由于降水的不确定性导致灌溉决策的制定准确性较低的问题,能够切实提高灌溉决策制定的准确性与科学性,进而有效提高水资源的利用率。
附图说明
图1为本发明实施例一提供的灌溉决策学习方法的流程图;
图2为本发明实施例二提供的灌溉决策学习方法的流程图;
图3为本发明实施例三提供的灌溉决策学习方法的流程图;
图4为本发明实施例四提供的灌溉决策学习装置的结构示意图;
图5为本发明实施例五提供的灌溉决策学习服务器的结构示意图。
具体实施方式
以下结合附图对本发明涉及的灌溉决策学习方法、装置、服务器和存储介质的具体实施方案进行详细地说明。
<实施例一>
如图1所示,本实施例一所提供的灌溉决策学习方法包括如下步骤:
S110、获取目标灌溉区域的当前环境参数,其中,当前环境参数包括天气预报数据。
在灌溉决策学习的初始周期内,获取目标灌溉区域的当前环境参数,进行参数初始化。目标灌溉区域可以是旱田或水田中任意的待灌溉区域,该区域内设置感知模块,例如环境监测传感器,用于采集环境参数。环境参数中的天气预报数据是指未来预设时间内目标灌溉区域公共天气预报数据,包括但不限于日照、温度、风力和降雨量等。天气预报数据是制定灌溉决策过程中不可或缺的参考因素。
S120、利用初始化的决策值函数,根据当前环境参数确定当前灌溉决策。
初始化的决策值函数可以是根据已有的灌溉经验而设置初始函数,也可是由程序自动生成;利用该初始函数,确定当前决策周期的灌溉决策。灌溉决策包括:灌溉、排水或者既不灌溉也不排水。
S130、根据当前灌溉决策的回馈奖励,更新初始化的决策值函数。
确定当前灌溉决策周期的灌溉决策之后,在目标灌溉区域内执行该灌溉决策,通过转移函数更新下一灌溉决策周期的状态参数,对当前灌溉决策进行评估反馈,并利用该回馈奖励更新初始化的决策值函数,以使得基于更新后的决策值函数确定的灌溉决策更加准确。其中,基于决策值函数确定的当前灌溉决策与目标灌溉区域的实际灌溉需求越相符,回馈奖励的值越高。
S140、利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策。
新的环境参数即在下一个灌溉决策周期内获取的环境参数。根据新的环境参数与更新后的决策值函数,确定出对应的灌溉决策,然后再次进行回馈奖励与更新决策值函数。通过多次的学习反馈,可以不断改进灌溉决策的制定,寻找出最优灌溉决策,降低天气预报数据中预测降雨的不确定性对灌溉决策制定的不利影响,逐渐提高灌溉决策制定的准确性、科学性与实时性;同时,提高水资源的利用率,做到按计划适时与适量地用水,做到“以需定供”,避免灌溉后遇雨造成灌水浪费以及不灌等雨而无雨造成的受旱减产两个方面的风险。
可选的,利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策,包括:
重复执行根据灌溉决策的回馈奖励,更新决策值函数的操作;
若更新后的决策值函数处于收敛状态,将收敛的决策值函数作为目标决策值函数,以基于目标决策值函数确定与目标灌溉区域的环境参数对应的灌溉策略;若更新后的决策值函数处于非收敛状态,则返回S120重新修改调整初始函数。
经过多次的反馈学习,使更新后的决策值函数处于收敛状态,则当前决策学习阶段可以结束,并且依据目标灌溉区域的环境参数确定的灌溉决策越稳定,灌溉决策制定的准确性和科学性越高,水资源利用率也越高。
本实施例的技术方案通过首先获取目标灌溉区域的包括天气预报数据在内的当前环境参数,基于初始化的决策值函数,确定当前灌溉决策;然后根据当前灌溉决策的回馈奖励,更新初始化的决策值函数,并利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策;解决了完全依赖气象预报制定作物灌溉决策时,由于降水的不确定性导致灌溉决策的制定准确性较低的问题,将强化学习思想应用于灌溉决策的学习过程,提高了灌溉决策制定的准确性与科学性,提高了水资源利用率。
<实施例二>
本实施例二提供一种灌溉决策学习方法,是在实施例一基础上的进一步优化,如图2所示,该方法包括如下步骤:
S210、获取目标灌溉区域的当前环境参数,本实施例中,当前环境参数包括天气预报数据、土壤水层深度和作物生长发育时期。另外,当前环境参数还可以包括土壤含水量,土壤含水量与土壤水层深度根据换算关系可以相互转换。
S220、根据天气预报数据和作物生长发育时期,确定目标灌溉区域的预报作物蒸散量。预报作物蒸散量表示基于预测天气数据得到的预测性蒸散量。
S230、将天气预报数据中预报降雨量、预报作物蒸散量和土壤水层深度进行向量化表示,得到目标灌溉区域的环境状态向量。
示例性的,目标灌溉区域的当前环境状态向量可以表示为st=(Pt,ht,ETct),例如可以将作物生长发育时期的某一天的环境参数向量化表示。其中,Pt表示当前灌溉决策周期t内的预报降雨量序列,ht表示当前灌溉决策周期t内的土壤水层深度,ETct表示当前灌溉决策周期t内的预报作物蒸散量。t=1,2,3,4……n,n为作物生长发育最后一个周期。
S240、利用初始化的决策值函数(人为或计算机自动设置函数参数),根据环境状态向量确定当前灌溉决策。
具体的,可以将目标灌溉区域的灌溉决策环境抽象化为强化学习环境E={S,A,P,R},其中:
状态空间向量S表示灌溉决策周期内的环境状态向量,例如,当前灌溉决策周期t内的环境状态向量可表示为st=(Pt,ht,ETct);
动作空间向量A表示灌溉决策的选项,例如,可表示为A={“灌溉”、“排水”、“既不灌溉也不排水”};
转移函数P表示在灌溉决策周期内执行灌溉决策后环境从一个状态转移到另一个状态,环境参数的变化包括土壤水层深度或土壤含水量的变化、预报作物蒸散量的变化以及天气预报数据的更新等。例如,由当前灌溉决策周期t环境状态更新为下一个灌溉决策周期t+1的环境状态,转移函数P可表示为:st+1=p(st,at);at表示当前灌溉决策周期t的灌溉决策,选自动作空间向量A中;
奖励函数R为由一个灌溉决策周期转移到另一个灌溉决策周期时,根据对应的环境状态反馈奖赏,包括对正确的灌溉决策赋予较大的奖励值。例如,当前灌溉决策周期内的奖赏函数可表示为:rt=r(st,at)。
基于强化学习环境的向量表示E={S,A,P,R}和初始化的决策值函数,得到当前灌溉决策at
可选的,该方法还包括:利用当前生成的随机数与预设探索概率的数值关系,确定目标灌溉区域的当前灌溉决策。
考虑灌溉决策环境下的状态空间向量S不是有限的向量,故采用值函数近似方法求解值函数,函数可以表示为Vθ(s)=θT(s;a),其中,(s;a)表示环境状态向量s和灌溉决策a的合并向量,θ表示参数向量函数。在灌溉决策学习过程中,基于ε-贪心算法,利用当前生成的随机数与预设探索概率ε的数值关系,确定目标灌溉区域的当前灌溉决策,以实现完善与优化灌溉决策学习过程的效果。具体的,随机生成(0,1)之间的随机数rand,如果rand大于探索概率,即rand≥ε,则选择值函数的函数值最大时对应的灌溉决策,即at=argmaxθT(s;at-1);如果rand小于探索概率,即rand<ε,则以均匀概率随机选择一个灌溉决策。
其中,关于基于初始化的决策值函数确定当前灌溉决策与基于随机数确定当前灌溉决策,可以通过预先设置的学习比例划分进行选择。例如在灌溉决策学习过程中,设置80%的学习过程基于决策值函数确定灌溉决策,剩余20%的学习过程基于随机数确定灌溉决策。
S250、根据当前灌溉决策的回馈奖励,更新初始化的决策值函数。
示例性的,利用奖励函数R计算灌溉决策周期内的奖励,奖励规则如下:
Figure BDA0002093724730000111
其中,at表示当前灌溉决策周期t内的灌溉决策,hmin表示目标灌溉区域内作物生长所需的最小土壤水层深度(灌溉下限),Hp表示目标灌溉区域内作物雨后允许蓄水深度,ht+1表示当前灌溉决策周期t的下一个灌溉决策周期t+1内目标灌溉区域的土壤水层深度。
例如,奖励规则的第一条所表示的含义是:当前确定的灌溉决策是“灌溉”,当前天气预报数据表明未来一段时间内无降雨,获取的下一个灌溉决策周期t+1内目标灌溉区域的土壤水层深度小于作物生长的最小土壤水层深度,则说明“灌溉”决策是准确与合理的,设置较高的奖励值;
奖励规则的第二条所表示的含义是:当前确定的灌溉决策是“灌溉”,当前天气预报数据表明未来一段时间内有降雨,获取的下一个灌溉决策周期t+1内目标灌溉区域的土壤水层深度小于作物生长的最小土壤水层深度,则说明“灌溉”决策有可能造成水资源的浪费,设置稍微降低的奖励值;
奖励规则的第三条所表示的含义是:当前确定的灌溉决策是“灌溉”,而获取的下一个灌溉决策周期t+1内目标灌溉区域的土壤水层深度大于作物生长的最小土壤水层深度,意味着无需进行灌溉,因此“灌溉”决策直接造成水资源的浪费,设置最低的奖励值;
对于其他奖励规则的含义,可以按照与上述规则相同的思路进行理解,即利用下一个决策周期的环境参数对当前灌溉决策进行评估反馈,水资源的利用率越高,灌溉决策制定的越合理,奖励值越高。
需要说明的是,上述示例中具体的奖励值作为示例性说明,不应作为对本实施例的限定,在可以实现对灌溉决策进行奖励区分的基础上,奖励值可以设置为任意形式的数值。
S260、利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策。
本实施例中采用线性值函数近似Q-学习算法,可选的,更新后的决策值函数用如下公式表示:
Figure BDA0002093724730000121
其中,θ表示参数向量函数,(st;at)表示当前环境参数和当前灌溉决策的合并向量,γ表示奖赏折扣,α表示更新步长,rt表示当前灌溉决策的回馈奖励,(st+1;at+1)表示当前灌溉决策周期t的下一个灌溉决策周期t+1内的环境参数和下一个灌溉决策周期中确定的灌溉决策的合并向量。
环境参数st+1=(Pt+1,ht+1,ETct+1),Pt+1表示下一灌溉决策周期t+1内未来一段时间内的预报降雨量序列;ETct+1表示下一灌溉决策周期t+1内的预报作物蒸散量;ht+1表示下一灌溉决策周期t+1内土壤水层深度,环境参数变化后ht+1的表达式为:
Figure BDA0002093724730000131
其中,
Figure BDA0002093724730000132
表示当前灌溉决策周期t内的预报降雨量,ETct表示当前灌溉决策周期t内的预报作物蒸散量,pt表示当前灌溉决策周期t内的渗漏量,hmax表示目标灌溉区域的作物适宜水层上限。
在具体的决策计算过程中,γ与α的值可以适应性设置,本实施例不做具体限定。
可选的,在利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策之前,该方法还包括:
根据执行当前灌溉决策后的环境修正目标灌溉区域的新的环境参数,以便基于修正后的环境参数确定目标灌溉区域的灌溉决策。
预报的天气预报数据与实际的环境参数变化存在偏差,因此,需要根据执行灌溉决策之后的实际环境,对获取的目标灌溉区域在下一个灌溉决策周期内的环境参数进行修正,以保证环境参数可以准确反映目标灌溉区域内作物的生长环境状况,进而保证灌溉决策学习的有效性,保证灌溉决策制定的准确性与科学性。
可选的,修正后的土壤水层深度利用如下公式表示:
Figure BDA0002093724730000133
其中,
Figure BDA0002093724730000134
表示当前灌溉决策周期t内的实际降雨量,
Figure BDA0002093724730000135
表示当前灌溉决策周期t内的实际作物蒸散量。
本实施例二的技术方案通过将环境参数向量化表示,构建出强化学习环境,利用初始化的决策值函数确定当前灌溉决策周期内的灌溉决策,然后根据当前灌溉决策的回馈奖励,更新初始化的决策值函数,并利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策;解决了完全依赖气象预报制定作物灌溉决策时,由于降水的不确定性导致灌溉决策的制定准确性较低的问题,将强化学习思想应用于灌溉决策的学习过程,提高了灌溉决策制定的准确性与科学性,提高了水资源利用率。
<实施例三>
本实施例三提供一种灌溉决策学习方法,在实施例二基础上的进一步优化,如图3所示,该方法包括如下步骤:
S310、获取目标灌溉区域在第t个灌溉决策周期的初始环境参数。
其中,t=1,2,3,4……n,n为作物生长发育最后一个周期。
S320、利用初始化的决策值函数,根据初始环境参数确定在第t个灌溉决策周期的灌溉决策。
S330、在第t个灌溉决策周期内执行确定的灌溉决策,通过转移函数更新第t+1灌溉决策周期的环境参数。
S340、获取第t个灌溉决策周期的灌溉决策的回馈奖励。
S350、根据获取的回馈奖励,更新初始化的决策值函数。
S360、根据在第t个灌溉决策周期内执行灌溉决策后的实际环境,修正更新后的环境参数。
S370、确定是否为最后一个灌溉决策周期。若是,则执行操作S380;若否,则返回操作S330。其中,可以根据经验值设置灌溉决策周期数。
S380、判断更新后的决策值函数是否收敛。若收敛,则执行操作S390,若不收敛,则修改初始函数,或其他参数,如,γ、α、rt,然后返回操作S310。
S390、将收敛的决策值函数确定为目标决策值函数。确定出目标灌溉决策之后,整个灌溉决策的学习过程结束,便可基于该目标决策值函数确定与目标灌溉区域的环境参数对应的灌溉策略。
本实施例三的技术方案通过将强化学习思想应用于灌溉决策的学习过程,利用与环境的交互过程中获得的奖赏指导灌溉决策,在环境中不断地尝试和探索,从而得到目标灌溉区域的最优灌溉决策,解决了完全依赖气象预报制定作物灌溉决策时,由于降水的不确定性导致灌溉决策的制定准确性较低的问题,提高了灌溉决策制定的准确性与科学性,提高了水资源利用率。
<实施例四>
如图4所示,本实施例四提供一种灌溉决策学习装置,包括参数获取模块410、第一决策确定模块420、决策值函数更新模块430和第二决策确定模块440。
参数获取模块410用于获取目标灌溉区域的当前环境参数,其中,当前环境参数包括天气预报数据;
第一决策确定模块420用于利用初始化的决策值函数,根据当前环境参数确定当前灌溉决策;
决策值函数更新模块430用于根据当前灌溉决策的回馈奖励,更新初始化的决策值函数;
第二决策确定模块440用于利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策。
可选的,参数获取模块410中的当前环境参数还包括土壤水层深度和作物生长发育时期;
相应的,第一决策确定模块420包括:
预报作物蒸散量确定单元,用于根据天气预报数据和作物生长发育时期,确定目标灌溉区域的预报作物蒸散量;
环境状态向量确定单元,用于将天气预报数据中预报降雨量、预报作物蒸散量和土壤水层深度进行向量化表示,得到目标灌溉区域的环境状态向量;
当前灌溉决策确定单元,用于利用初始化的决策值函数,根据环境状态向量确定当前灌溉决策。
可选的,该装置还包括环境参数修正模块,用于:
在第二决策确定模块440利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策之前,根据执行当前灌溉决策后的环境修正目标灌溉区域的新的环境参数,以便基于修正后的环境参数确定目标灌溉区域的灌溉决策。
可选的,修正后的土壤水层深度利用如下公式表示:
Figure BDA0002093724730000171
其中,ht表示当前灌溉决策周期内的土壤水层深度,
Figure BDA0002093724730000172
表示当前灌溉决策周期内的实际降雨量,
Figure BDA0002093724730000173
表示当前灌溉决策周期内的实际作物蒸散量,pt表示当前灌溉决策周期内的渗漏量,at表示对应的当前灌溉决策,hmax表示目标灌溉区域的作物适宜水层上限,Hp表示目标灌溉区域内作物雨后允许蓄水深度。
可选的,第一决策确定模块420还包括:
随机决策单元,用于利用当前生成的随机数与预设探索概率的数值关系,确定目标灌溉区域的当前灌溉决策。
可选的,第二决策确定模块440包括:
重复更新单元,用于重复执行根据灌溉决策的回馈奖励,更新决策值函数的操作;
目标决策值函数确定单元,用于若更新后的决策值函数处于收敛状态,则将收敛的决策值函数作为目标决策值函数,以基于目标决策值函数确定与目标灌溉区域的环境参数对应的灌溉策略。
可选的,第二决策确定模块440中更新后的决策值函数用如下公式表示:
Figure BDA0002093724730000174
其中,θ表示参数向量函数,(st;at)表示当前环境参数和当前灌溉决策的合并向量,γ表示奖赏折扣,α表示更新步长,rt表示当前灌溉决策的回馈奖励。
本实施例四所提供的灌溉决策学习装置可执行本发明任意实施例所提供的灌溉决策学习方法,具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考上述方法实施例中的描述。
<实施例五>
如图5所示,服务器512以通用服务器的形式表现。服务器512的组件可以包括但不限于:一个或者多个处理器516,存储装置528,连接不同系统组件(包括存储装置528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
服务器512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)530和/或高速缓存存储器532。服务器512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储装置528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储装置528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
服务器512也可以与一个或多个外部设备514(例如键盘、指向终端、显示器524等)通信,还可与一个或者多个使得用户能与该服务器512交互的终端通信,和/或与使得该服务器512能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,服务器512还可以通过网络适配器520与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide AreaNetwork,WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器520通过总线518与服务器512的其它模块通信。应当明白,尽管图中未示出,可以结合服务器512使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器516通过运行存储在存储装置528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任意实施例所提供的灌溉决策学习方法,该方法可以包括:
获取目标灌溉区域的当前环境参数,其中,当前环境参数包括天气预报数据;
利用初始化的决策值函数,根据当前环境参数确定当前灌溉决策;
根据当前灌溉决策的回馈奖励,更新初始化的决策值函数;
利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策。
<实施例六>
本实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的灌溉决策学习方法,该方法可以包括:
获取目标灌溉区域的当前环境参数,其中,当前环境参数包括天气预报数据;
利用初始化的决策值函数,根据当前环境参数确定当前灌溉决策;
根据当前灌溉决策的回馈奖励,更新初始化的决策值函数;
利用更新后的决策值函数,确定出目标灌溉区域在新的环境参数下的灌溉决策。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
以上实施例仅仅是对本发明技术方案所做的举例说明。本发明所涉及的灌溉决策学习方法、装置、服务器和存储介质并不仅仅限定于在以上实施例中所描述的内容,而是以权利要求所限定的范围为准。本发明所属领域技术人员在该实施例的基础上所做的任何修改或补充或等效替换,都在本发明的权利要求所要求保护的范围内。

Claims (8)

1.一种灌溉决策学习方法,其特征在于,包括以下步骤:
步骤1.获取目标灌溉区域在当前决策周期的环境参数,当前环境参数包括天气预报数据、土壤水层深度和作物生长发育时期;
步骤2.基于获取到的环境参数和初始化的决策值函数,制定灌溉决策;
步骤3.在当前决策周期制定的灌溉决策被执行后,对该灌溉决策进行评估,获得反映该灌溉决策合理程度的回馈奖励,并利用回馈奖励更新决策值函数,得到下一个决策周期的决策值函数:
Figure FDA0003231810210000011
式中,θ表示参数向量函数,θt表示当前决策周期的决策值函数,
Figure FDA0003231810210000012
表示当前决策周期参数向量函数的转置,(st;at)表示当前决策周期内的环境参数和灌溉决策的合并向量,(st+1;at+1)表示下一决策周期内的环境参数和灌溉决策的合并向量,γ表示奖赏折扣,α表示更新步长,rt表示当前决策周期的回馈奖励;
步骤4.利用下一个决策周期的决策值函数,和获取的下一个决策周期的环境参数,制定目标灌溉区域在下一个决策周期的灌溉决策,然后进入步骤3进行下一轮灌溉决策学习和制定过程;
其中,在步骤3中更新得到的是目标灌溉区域最后一个周期的决策值函数的情况下,若决策值函数处于收敛状态,则将收敛的决策值函数作为目标决策值函数,通过该目标决策值函数来确定与目标灌溉区域的环境参数对应的灌溉策略。
2.根据权利要求1所述的灌溉决策学习方法,其特征在于:
其中,步骤2包括如下子步骤:
步骤2-1.根据天气预报数据和作物生长发育时期,确定目标灌溉区域的预报作物蒸散量;
步骤2-2.将预报作物蒸散量、土壤水层深度和天气预报数据中的预报降雨量进行向量化表示,得到目标灌溉区域的环境状态向量;进而根据环境状态向量和初始化的决策值函数,制定当前决策周期的灌溉决策。
3.根据权利要求1所述的灌溉决策学习方法,其特征在于:
其中,在步骤3中,是基于获取的下一个决策周期的环境参数对当前决策周期的灌溉决策进行评估,水资源的利用率越高,灌溉决策制定的越合理,则奖励值越高。
4.根据权利要求1所述的灌溉决策学习方法,其特征在于:
其中,在步骤4中,还对获取到的环境参数进行修正,得到修正后的下一个决策周期的环境参数,进而基于修正后的环境参数确定相应灌溉决策。
5.根据权利要求4所述的灌溉决策学习方法,其特征在于:
其中,在步骤4中,修正后的下一个决策周期的土壤水层深度表示为:
Figure FDA0003231810210000031
Figure FDA0003231810210000032
at=既不灌溉也不排水;
式中,ht表示当前决策周期内的土壤水层深度,
Figure FDA0003231810210000033
表示当前决策周期内的实际降雨量,
Figure FDA0003231810210000034
表示当前决策周期内的实际作物蒸散量,pt表示当前决策周期内的渗漏量,at表示对应的当前决策周期的灌溉决策,hmax表示目标灌溉区域的作物适宜水层上限,Hp表示目标灌溉区域内作物雨后允许蓄水深度。
6.一种灌溉决策学习装置,其特征在于,包括:
参数获取模块,用于获取目标灌溉区域的环境参数,当前环境参数包括天气预报数据、土壤水层深度和作物生长发育时期;
第一决策确定模块,基于环境参数和初始化的决策值函数确定当前决策周期的灌溉决策;
决策值函数更新模块,在灌溉决策被执行后,基于获取的新环境参数对该灌溉决策进行评估,获得反映该灌溉决策合理程度的回馈奖励,并利用回馈奖励更新决策值函数,得到下一个决策周期的决策值函数:
Figure FDA0003231810210000035
式中,θ表示参数向量函数,θt表示当前决策周期的决策值函数,
Figure FDA0003231810210000036
表示当前决策周期参数向量函数的转置,(st;at)表示当前决策周期内的环境参数和灌溉决策的合并向量,(st+1;at+1)表示下一决策周期内的环境参数和灌溉决策的合并向量,γ表示奖赏折扣,α表示更新步长,rt表示当前决策周期的回馈奖励;以及
第二决策确定模块,用于利用更新后的决策值函数,确定目标灌溉区域在下一个决策周期环境参数下的灌溉决策,
其中,在决策值函数更新模块中,在更新得到的是目标灌溉区域最后一个周期的决策值函数的情况下,若决策值函数处于收敛状态,则将收敛的决策值函数作为目标决策值函数,通过该目标决策值函数来确定与目标灌溉区域的环境参数对应的灌溉策略。
7.一种灌溉决策学习服务器,其特征在于,包括:
存储介质;和
至少一个处理器,通过执行存储装置中存储的程序,实现如权利要求1至5中任意一项所述的灌溉决策学习方法。
8.一种存储介质,其特征在于:
存储有用于实现如权利要求1至5中任意一项所述的灌溉决策学习方法的程序。
CN201910511801.7A 2018-11-30 2019-06-13 灌溉决策学习方法、装置、服务器和存储介质 Active CN110084539B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811452733 2018-11-30
CN2018114527333 2018-11-30

Publications (2)

Publication Number Publication Date
CN110084539A CN110084539A (zh) 2019-08-02
CN110084539B true CN110084539B (zh) 2021-10-22

Family

ID=67424304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910511801.7A Active CN110084539B (zh) 2018-11-30 2019-06-13 灌溉决策学习方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN110084539B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126662B (zh) * 2019-11-25 2023-04-28 中工武大设计研究有限公司 基于大数据的灌溉决策制定方法、装置、服务器和介质
CN110999766A (zh) * 2019-12-09 2020-04-14 怀化学院 灌溉决策方法、装置、计算机设备和存储介质
CN112862295B (zh) * 2021-02-02 2022-06-24 上海市城市建设设计研究总院(集团)有限公司 基于q学习的路桥隧养护自主决策方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200080A (zh) * 2014-08-22 2014-12-10 中国科学院遥感与数字地球研究所 一种农业区水资源环境诊断方法及其系统
CN106613790A (zh) * 2017-01-11 2017-05-10 河北泽润信息科技有限公司 一种基于云平台和智能手机的自动灌溉控制系统
CN107103040A (zh) * 2017-03-27 2017-08-29 西北大学 一种灌区基础数据采集系统
CN107479547A (zh) * 2017-08-11 2017-12-15 同济大学 基于示教学习的决策树行为决策算法
CN107728556A (zh) * 2017-10-13 2018-02-23 江苏科沃纺织有限公司 一种太阳能喷灌装置的智能管理系统
CN107945042A (zh) * 2017-11-29 2018-04-20 上海华维节水灌溉股份有限公司 一种作物生长灌溉决策控制系统
CN107950324A (zh) * 2017-12-15 2018-04-24 上海应用技术大学 基于玉米分阶段灌溉需水量计算的灌溉管理系统及灌溉方法
CN108575673A (zh) * 2018-01-17 2018-09-28 中国农业科学院农业资源与农业区划研究所 基于当天气象预报信息的旱区作物灌溉施肥方法及系统
CN108876005A (zh) * 2018-05-07 2018-11-23 中国农业科学院农田灌溉研究所 基于天气信息的冬小麦灌溉预报方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819673B (zh) * 2012-07-26 2015-04-08 中国农业科学院农田灌溉研究所 一种多源灌溉信息融合方法及装置
US8635373B1 (en) * 2012-09-22 2014-01-21 Nest Labs, Inc. Subscription-Notification mechanisms for synchronization of distributed states
CN106613783B (zh) * 2016-10-20 2020-02-14 河北农业大学 一种通用智能灌溉系统及其控制方法
US10509378B2 (en) * 2016-11-07 2019-12-17 FarmX Inc. Systems and methods for soil modeling and automatic irrigation control
CN106688827B (zh) * 2016-12-09 2019-12-03 中国科学院新疆生态与地理研究所 一种基于农业系统模型的灌溉决策系统及方法
CN108681352A (zh) * 2018-04-10 2018-10-19 南京瑞可荣智信息科技有限公司 智能灌溉监测与控制系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200080A (zh) * 2014-08-22 2014-12-10 中国科学院遥感与数字地球研究所 一种农业区水资源环境诊断方法及其系统
CN106613790A (zh) * 2017-01-11 2017-05-10 河北泽润信息科技有限公司 一种基于云平台和智能手机的自动灌溉控制系统
CN107103040A (zh) * 2017-03-27 2017-08-29 西北大学 一种灌区基础数据采集系统
CN107479547A (zh) * 2017-08-11 2017-12-15 同济大学 基于示教学习的决策树行为决策算法
CN107728556A (zh) * 2017-10-13 2018-02-23 江苏科沃纺织有限公司 一种太阳能喷灌装置的智能管理系统
CN107945042A (zh) * 2017-11-29 2018-04-20 上海华维节水灌溉股份有限公司 一种作物生长灌溉决策控制系统
CN107950324A (zh) * 2017-12-15 2018-04-24 上海应用技术大学 基于玉米分阶段灌溉需水量计算的灌溉管理系统及灌溉方法
CN108575673A (zh) * 2018-01-17 2018-09-28 中国农业科学院农业资源与农业区划研究所 基于当天气象预报信息的旱区作物灌溉施肥方法及系统
CN108876005A (zh) * 2018-05-07 2018-11-23 中国农业科学院农田灌溉研究所 基于天气信息的冬小麦灌溉预报方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于作物蒸散量模型的新型滑盖温室智能灌溉系统设计";赵颖 等;《节水灌溉》;20170805(第8期);第83-87+91页 *
"基于神经网络及强化学习的智能控制系统";钟宇平;《西南大学学报(自然科学版)》;20131129(第11期);第172-179页 *

Also Published As

Publication number Publication date
CN110084539A (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
CN110084539B (zh) 灌溉决策学习方法、装置、服务器和存储介质
CN112614009B (zh) 一种基于深度期望q-学习的电网能量管理方法及系统
Adenugba et al. Smart irrigation system for environmental sustainability in Africa: An Internet of Everything (IoE) approach
Hanasusanto et al. Robust data-driven dynamic programming
CN115482467B (zh) 一种智慧园林的自动灌溉系统
CN111126662B (zh) 基于大数据的灌溉决策制定方法、装置、服务器和介质
CN110472840B (zh) 一种基于神经网络技术的农业水利调度方法及系统
CN112766596A (zh) 建筑能耗预测模型的构建方法、能耗预测方法及装置
CN116307191B (zh) 一种基于人工智能算法的水资源配置方法、装置和设备
US11966208B2 (en) Methods and systems for greenspace cultivation and management in smart cities based on Internet of Things
CN116307648B (zh) 变电站多巡检机器人巡检任务分配与遍历优化方法及系统
CN117424293A (zh) 一种智能风力预测与调度方法及系统
CN116596060A (zh) 深度强化学习模型训练方法、装置、电子设备及存储介质
CN106228235B (zh) 一种顾及格局与过程耦合效应的土地利用空间优化配置方法
CN116383768A (zh) 基于多模态信息融合的农作物产量预测方法及装置
Kass et al. Biodiversity modeling advances will improve predictions of nature’s contributions to people
CN114817578B (zh) 科技论文引用关系表示学习方法、系统及存储介质
Bonneuil Maximum under continuous-discrete-time dynamic with target and viability constraints
CN113221446B (zh) 盐渍土水肥策略的获取方法、系统、存储介质和电子设备
CN115941802A (zh) 远程状态估计传感器调度方法、调度器及信息物理系统
CN112950033B (zh) 一种基于水库调度规则合成的水库调度决策方法及系统
Hai et al. Water resource management using remote sensing and coyote optimization algorithms
CN117057255B (zh) 一种用于数字孪生模型在线同步的预训练模型获取方法
Cáceres Rodríguez et al. Economic model predictive control for smart and sustainable agriculture
Subhan et al. Uncovering Price Puzzle in the Wheat Economy of Pakistan: An Application of Artificial Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant