CN117171624A - 一种水禽养殖水质预测方法 - Google Patents
一种水禽养殖水质预测方法 Download PDFInfo
- Publication number
- CN117171624A CN117171624A CN202311274044.9A CN202311274044A CN117171624A CN 117171624 A CN117171624 A CN 117171624A CN 202311274044 A CN202311274044 A CN 202311274044A CN 117171624 A CN117171624 A CN 117171624A
- Authority
- CN
- China
- Prior art keywords
- water quality
- prediction
- water
- waterfowl
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 227
- 241000272517 Anseriformes Species 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 38
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims abstract description 37
- 239000001301 oxygen Substances 0.000 claims abstract description 37
- 229910052760 oxygen Inorganic materials 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 23
- 230000000694 effects Effects 0.000 claims abstract description 20
- 230000001932 seasonal effect Effects 0.000 claims abstract description 10
- 238000012544 monitoring process Methods 0.000 claims abstract description 7
- 238000012216 screening Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 238000007637 random forest analysis Methods 0.000 claims description 16
- 230000002457 bidirectional effect Effects 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 15
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 10
- 238000003066 decision tree Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000009360 aquaculture Methods 0.000 claims description 5
- 244000144974 aquaculture Species 0.000 claims description 5
- 238000013441 quality evaluation Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000004880 explosion Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 210000003608 fece Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001546 nitrifying effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 244000144977 poultry Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 241001148471 unidentified anaerobic bacterium Species 0.000 description 2
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 1
- -1 ammonia hydrogen ions Chemical class 0.000 description 1
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003911 water pollution Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
Abstract
本发明公开了一种水禽养殖水质预测方法,包括以下步骤,选择水体溶解氧、PH、电导率和浊度指标作为监测对象并进行预测;引入季节时变因素、水禽下水活动因素和水禽规模因素作为水质指标时间序列预测的外部特征,并筛选出重要特征;实时获取水体溶解氧、PH、电导率和浊度参数信息,构建原始水质数据集,并结合筛选得到的外部因素数据构成水质多指标时间序列预测数据集;对数据集全部时刻水质进行类别划分,作为分类预测的预测目标;构建多指标时间序列预测模型,进行水体溶解氧、PH、电导率和浊度的预测;进行养殖水质的类别预测;对模型进行更新训练,获得新的最优预测模型;使用本发明能实现对养殖水质的有效预测。
Description
技术领域
本发明涉及水质监测技术领域,特别是一种水禽养殖水质预测方法。
背景技术
水禽养殖过程中水体污染会严重影响水禽的身体健康和生产性能,养殖水体存在的主要问题是微生物超标,酸碱失衡,水体杂质多等。而在规模化养殖过程中,养殖水质数据的变化具有非线性非平稳的特点,且变化相对来说非常快速,水质的调控需要一定的预见期,基于对未来水质进行预测的水质调控具有重要意义。预测目标的确定影响水质等级的准确评估与控制,对于养殖水体存在的主要问题,其中,溶解氧含量与微生物的活动与分布息息相关,水体中有害微生物往往都是厌氧性细菌,溶解氧含量低,厌氧菌会大量繁殖;电导率可以检测水中总离子浓度,还可以反映盐度及总溶解固体其他相关参数;PH值的变化会对许多参数造成影响,其值过高过低都不利于养殖,且过低会影响硝化细菌的硝化作用。而目前的研究仅局限于单一水体指标进行预测调控,而单一指标不足以反映水质的等级,过于片面;且在预测精度和时效方面尚待提高,而为多个指标分别训练模型来完成预测太过繁琐。高效、准确的养殖水质预测对于水质智能调控具有重要的指导意义,可为水质智能化调控设备开发普及应用提供参考价值。且水禽养殖水质在不同季节的变化过程会有较大区别,实际情况也会有所改变,利用之前的水质数据集训练得到的预测模型可能不适用于其他季节的养殖水质预测。水质影响因素是多样性的,养殖水质的变化和水禽的活动有着紧密的联系,以往的研究中都忽略了水禽的活动对水质的影响,水禽的排泄物会增加水体浑浊度,其中含有有机物质,在分解和降解过程中,消耗水体中的溶解氧,排泄物中的氨氮会在经过转化后形成氨氢离子增加水体酸性,盐类和溶解物质会增加水体电导率;水禽在游戏泳和洗澡时会扰动悬浮物,导致水体变得浑浊。现有研究表明,水禽一般具有很好的合群性,且游水等活动通常具有固定的时间并且不会轻易改变,在规模化养殖中,为了方便管理和监测,水禽集群会按照规定的时间表进行饲养和下水,因此水禽下水的活动时间往往具有明显的规律性。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述和/或现有的水质监控中存在的问题,提出了本发明。
因此,本发明的目的是提供一种水禽养殖水质预测方法,其能实现对养殖水质的有效预测。
为解决上述技术问题,本发明提供如下技术方案:一种水禽养殖水质预测方法,其包括以下步骤,
选择水体溶解氧、PH、电导率和浊度指标作为监测对象并进行预测;
通过水质传感器实时获取水体溶解氧、PH、电导率和浊度参数信息,并构建原始水质数据集;
引入季节时变因素、水禽下水活动因素和水禽规模因素作为水质指标时间序列预测的外部特征,并筛选出重要特征;
利用综合水质评价对数据集全部时刻水质进行类别划分,作为分类预测的预测目标;
构建基于多任务学习的多指标时间序列预测模型,同时进行水体溶解氧、PH、电导率和浊度的预测;
构建水质分类模型,进行养殖水质的类别预测;
每隔设定的时间段利用上一时间段的水质数据对模型进行更新训练,获得新的最优预测模型用于下一时间段的水禽养殖水质预测。
作为本发明水禽养殖水质预测方法的一种优选方案,其中:获取参数信息的过程为,
每隔时间s分钟采取一次养殖水样监测水体溶解氧(mg/L)、PH、电导率(s/m)和浊度(ntu)值,使用前t个时刻的水质数据来预测一定时刻的水质数据值。
作为本发明水禽养殖水质预测方法的一种优选方案,其中:季节时变因素包括降雨量、气温、气压、湿度及风速,水禽下水活动因素包括两个时间间隔内的水禽下水活动时长及下水活动水禽平均数量,水禽规模因素包括水禽种群密度;其中,筛选特征因素的过程为,
通过对季节时变因素、水禽下水活动因素、水禽规模因素数据和获得的水质指标数据分别做皮尔逊相关系数分析,将对于所有预测目标均为低相关性的特征因素剔除;保留的特征因素数据与原始水质指标数据共同构建水质多指标时间序列预测数据集。
作为本发明水禽养殖水质预测方法的一种优选方案,其中:按照水体溶解氧、PH、电导率和浊度对水质影响的程度定出权系数,然后将各参数分成若干类别,按质量优劣评分,将评分相加求出综合水质指数,数值越大表示水质越好,将水质按照从好到坏划分为A类水、B类水、C类水、D类水和E类水。
作为本发明水禽养殖水质预测方法的一种优选方案,其中:基于多任务学习的养殖水质多指标时间序列预测步骤为,
使用前t个时刻的水质多指标时间序列预测数据集的数据来预测未来一定时刻的溶解氧、PH、电导率和浊度数据值并输出;使用卷积网络结合双向长短时记忆网络来处理水质数据;水质多指标时间序列预测数据集数据作为卷积神经网络的输入,将经过卷积神经网络处理的输出作为双向长短时神经网络的输入;采用硬参数共享机制,学习多个特征之间的耦合关系;
水质多指标时间序列预测数据集数据输入卷积神经网络后,在卷积层通过卷积核提取特征,
li=f(Wi*X+bi)
其中,li为经过第i个卷积核计算的输出矩阵,卷积过程为一维卷积,X为水质多指标时间序列预测数据集数据的输入矩阵,大小为g×h′,卷积核大小为λ×h′,步长为s′,输出矩阵大小为q×1,其中,q=(g-λ)/s′+1;f表示激活函数,Wi为权重矩阵,bi为偏置,*表示卷积;
以上水质多指标时间序列预测数据集数据经过卷积网络处理后的输出会作为双向长短时神经网络的输入,对于双向长短时神经网络,其中,长短期神经网络为一种循环网络,长短期神经网络利用门控机构解决传统循环神经网络的梯度消失和梯度爆炸问题,包括遗忘门,输入门和输出门;
遗忘门决定记住哪些信息和遗忘哪些信息,ft表示保留多少信息,
ft=σ(wf·[ht-1,xt]+bf)
输入门选择记忆部分,决定保留新信息的哪些部分,要更新的值的概率表示为it,
it=σ(wi.[ht-1,xt]+bi)
创建用于更新状态的候选值向量激活函数为tanh,
当前单元状态ct更新为
输出门用于输出,概率ot决定输出该单元状态ct的哪些部分,
ot=σ(w0·[ht-1,xt]+b0)
ht=ot·tanh(ct)
上述计算公式中,ht-1为上一单元的输出向量ht-1,xt为该单元的输入数据xt,wf,wi和w0为权重矩阵,bf,bi和b0为偏置向量,σ为sigmoid函数,ct-1为上一单元的记忆状态,ht为输出向量;
由前向和后向LSTM构成BiLSTM网络,
ht=LSTM(xt,ht-1)
h′t=LSTM(xt,h′t-1)
其中,ht和h′t分别表示前向和后向的隐节点输出向量,yt为双向长短时记忆神经网络的输出结果,ht-1为前一时刻的隐节点输出向量,xt为当前时刻的输入,why和分别表示前向和后向LSTM的输出权重,bt表示时间t时的偏置向量,LSTM()表示传统LSTM计算;
针对多个水质指标构建多任务注意力层,使用4个注意力模块分别关注溶解氧、PH、电导率和浊度预测4个任务的关键信息,即双向长短时神经网络输出中对该任务预测目标影响较大的信息,4个注意力模块分别计算双向长短时神经网络输出的权重,通过赋予更高的权重使模型关注更关键的信息,加权求和得到最终的输出结果;
et=u tanh(ωht+b)
式中st为t时刻注意层的输出,即水质指标预测数据,ht为t时刻BiLSTM网络层输出向量,et为t时刻ht决定的注意力概率分布值,u和ω为权重系数,b为偏置,tanh为激活函数,αt为注意层的权重系数,j为1到t之间的整数,exp是以自然常数e为底的指数函数,i为需要加权求和的总数;
注意力层不同预测任务的输出结果构成向量P,作为分类器的输入向量;
将多任务学习看作多指标优化问题,避免在训练过程中不同水质指标预测任务间的冲突,优化的目标是寻找帕累托最优解,采用多重梯度下降算法-上界来对整体的损失函数进行多梯度下降,使模型性能达到最优;
将该多任务学习问题定义为如下最小化问题,
其中,K是任务总数,其值为4,即代表了溶解氧、PH、电导率和浊度预测任务,k代表第k个任务,θsh为任务间共享的参数,θk为k任务独立的参数,ck为k任务损失函数的权值,表示任务k的损失函数;
同时处理4个水质指标的预测任务,使用DO,PH,EC,TU分别表示溶解氧、PH、电导率和浊度,
式中L表示各个任务的损失函数;
考虑多目标优化问题,目的是优化一组可能冲突的目标,使如下公式值达到最小,
其满足条件对于任意任务,βDO+βPH+βEC+βTU=1且β≥0;
其中,β是该个任务损失梯度的权值,Z是关于θsh的共享表示函数,表示梯度,通过求解该问题,找到适合所有任务的梯度下降方向,完成对模型的优化。
作为本发明水禽养殖水质预测方法的一种优选方案,其中:基于随机森林模型对养殖水质的类别进行预测,预测时,
将原始水质数据集作为随机森林模型的输入,进行模型训练与测试,参数调优,得到的最优模型作为水质类别分类器,其通过以下步骤确定,
从原始水质数据集中随机且有放回地抽取m个样本生成m个训练集;
对m个训练集,分别训练m个决策树模型;
对于单个决策树模型,每次分裂时根据信息增益,选择最好的特征进行分裂,信息增益最大的特征为最优特征,Z(z1,z2,..,zη)是水质数据特征的随机变量,U(u1,u2,...,uη)是类别的随机变量,有η个取值,
I(Z|U)=H(Z)-H(Z|U)
其中,I(Z|U)为信息增益,H(Z)为随机变量Z的信息熵,H(Z|U)为条件熵,表示给定条件U,随机变量Z的不确定性,P(z)是随机变量Z发生的概率,P(z,u)是联合概率;
将生成的多棵决策树组成随机森林,按照多棵树分类器投票选择最终的预测结果,将训练获得的最优随机森林模型作为水质类别分类器;
将向量P作为随机森林分类器的输入向量进行分类预测,其目标变量是步骤综合水质评价处理时获得的水质分类,最终得到水质等级预测结果,对未来一定时间的水质进行预测评估。
本发明与现有技术相比,具有如下技术效果:利用卷积神经网络和双向长短期神经网络构成硬共享参数层,学习共享特征,基于注意力机制进行优化,使用4个注意力模块分别关注溶解氧、PH、电导率和浊度预测4个任务的关键信息,并使用多重梯度下降算法-上界寻找适合所有任务的梯度下降方向,使模型整体性能最优,可以同时保证水质多指标预测的高效性和准确性,并利用随机森林对水质进行分类预测,以获得未来一定时间的水质类别评估结果;能广泛应用于规模化养殖水体多指标与水质等级预测。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明中的水质预测结构图。
图2为本发明中水质多指标时间序列预测结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
实施例1
参照图1,为本发明的第一个实施例,该实施例提供了一种水禽养殖水质预测方法,使用本系统能有效预测水质。
一种水禽养殖水质预测方法,其包括以下步骤,
S1:选择水体溶解氧、PH、电导率和浊度指标作为监测对象并进行预测;
S2:通过水质传感器实时获取水体溶解氧、PH、电导率和浊度参数信息,并构建原始水质数据集,其中获取参数信息的过程为,
每隔时间s分钟采取一次养殖水样监测水体溶解氧(mg/L)、PH、电导率(s/m)和浊度(ntu)值,采样间隔时间s根据实际养殖规模来确定,前t个时刻的水质数据用来预测未来一定时刻的水质数据值;
S3:引入季节时变因素(降雨量、气温、气压、湿度及风速)、水禽下水活动因素(两个时间间隔内的水禽下水活动时长及下水活动水禽平均数量)和水禽规模因素(水禽种群密度)作为水质指标时间序列预测的外部特征,中季节时变因素数据可以通过气象局官网获取,水禽下水活动因素和水禽规模因素数据通过实时统计获取,并通过对季节时变因素、水禽下水活动因素、水禽规模因素数据和获得的水质指标数据分别做皮尔逊相关系数分析,将对于所有预测目标均为低相关性的特征因素剔除;保留的特征因素数据与原始水质指标数据共同构建水质多指标时间序列预测数据集;皮尔逊相关系数的计算方法如下:
ξε,με表示两个变量的样本,分别是两个样本的平均值,n为样本总数,ε表示第ε个样本,皮尔逊相关系数γ值在-1到1之间,绝对值越大,表示两个变量之间的相关性越强;
S4:利用综合水质评价对数据集全部时刻水质进行类别划分,作为分类预测的预测目标,其中进行类别划分的过程为,按照水体溶解氧、PH、电导率和浊度对水质影响的程度定出权系数,然后将各参数分成若干类别,按质量优劣评分,将评分相加求出综合水质指数,数值越大表示水质越好,将水质按照从好到坏划分为A类水、B类水、C类水、D类水和E类水,将指数的0%~20%区间划分为E类水,20%~40%区间划分为D类水,40%~60%区间划分为C类水,60%~80%区间划分为B类水,80%~100%区间划分为A类水;
S5:对各项水质指标数据进行归一化处理,使数据整体落在[0,1]区间,归一化处理具体如下,
式中,V为水体溶解氧、PH、电导率和浊度归一化后数值,v为归一化前数值,vmin为历史序列最小值,vmax为历史序列最大值;
S6:构建基于多任务学习的多指标时间序列预测模型如图2所示,由卷积神经网络和双向长短时神经网络(BiLSTM)构成共享参数层,采用硬共享机制,并通过多任务注意层分别关注溶解氧、PH、电导率和浊度标预测4个任务的关键信息;使用多重梯度下降算法对整体损失函数进行梯度下降,同时进行水体溶解氧、PH、电导率和浊度的预测,具体步骤为,
S601:使用前t个时刻的水质多指标时间序列预测数据集的数据来预测未来一定时刻的溶解氧、PH、电导率和浊度数据值并输出;水质数据变化具有非线性、非平稳的特点,使用卷积网络结合双向长短时网络来处理水质数据;水质多指标时间序列预测数据集数据作为卷积神经网络的输入,将经过卷积神经网络处理的输出作为双向长短时神经网络的输入,采用硬参数共享机制,学习多个特征之间的耦合关系;
水质多指标时间序列预测数据集数据输入卷积神经网络后,在卷积层通过卷积核提取特征,
li=f(Wi*X+bi)
其中,li为经过第i个卷积核计算的输出矩阵,卷积过程为一维卷积,x为水质多指标时间序列预测数据集数据的输入矩阵,大小为g×h′,卷积核大小为λ×h′,步长为s′,输出矩阵大小为q×1,其中,q=(g-λ)/s′+1;f表示激活函数,Wi为权重矩阵,bi为偏置,*表示卷积;
以上水质多指标时间序列预测数据集数据经过卷积网络处理后的输出会作为BiLSTM网络的输入;
长短期神经网络(LSTM)算法如下,
利用门控机构解决传统循环神经网络的梯度消失和梯度爆炸问题,包括遗忘门,输入门和输出门;
遗忘门决定记住哪些信息和遗忘哪些信息,ft表示保留多少信息,
ft=σ(wf·[ht-1,xt]+bf)
输入门选择记忆部分,决定保留新信息的哪些部分,要更新的值的概率表示为it,
it=σ(wi·[ht-1,xt]+bi)
并创建用于更新状态的候选值向量激活函数为tanh,
当前单元状态ct更新为
输出门用于输出,概率ot决定输出该单元状态ct的哪些部分,
ot=σ(w0·[ht-1,xt]+b0)
ht=ot·tanh(ct)
上述计算公式中,ht-1为上一单元的输出向量ht-1,xt为该单元的输入数据xt,wf,wi和w0为权重矩阵,bf,bi和b0为偏置向量,σ为sigmoid(激活)函数,ct-1为上一单元的记忆状态,ht为输出向量;
由前向和后向LSTM构成BiLSTM网络,
ht=LSTM(xt,ht-1)
h′t=LSTM(xt,h′t-1)
其中,xt为当前时刻BiLSTM网络的输入,其是水质数据经过卷积网络处理后的输出,ht和h′t分别表示前向和后向的隐节点输出,yt为双向长短时记忆神经网络的输出结果,ht-1为前一时刻的隐节点输出,why和分别表示前向和后向LSTM的输出权重,bt表示时间t时的偏置向量,LSTM()表示传统LSTM计算;
S602:针对多个水质指标构建多任务注意力层,使用4个注意力模块分别关注溶解氧、PH、电导率和浊度预测4个任务的关键信息,即BiLSTM输出中对该任务预测目标影响较大的信息,其实现方式是,4个注意力模块分别计算BiLSTM输出的权重,通过赋予更高的权重使模型关注更关键的信息,加权求和得到最终的输出结果;
et=u tanh(ωHt+b)
式中st为t时刻注意层的输出,即水质指标预测数据,Ht为t时刻BiLSTM网络层输出向量,et为t时刻Ht决定的注意力概率分布值,u和ω为权重系数,b为偏置,tanh为激活函数,αt为注意层的权重系数,j为1到t之间的整数,exp是以自然常数e为底的指数函数,i为需要加权求和的总数。
注意力层不同预测任务的输出结果构成向量P,作为分类器的输入向量;
S603:将多任务学习看作多指标优化问题,避免在训练过程中不同水质指标预测任务间的冲突,优化的目标是寻找帕累托最优解,采用多重梯度下降算法-上界来对整体的损失函数进行多梯度下降,使模型性能达到最优;
将该多任务学习问题定义为如下最小化问题:
其中,K是任务总数,其值为4,即代表了溶解氧、PH、电导率和浊度预测任务,k代表第k个任务,θsh为任务间共享的参数,θk为k任务独立的参数,ck为k任务损失函数的权值,表示任务k的损失函数。
同时处理4个水质指标的预测任务,使用DO,PH,EC,TU分别表示溶解氧、PH、电导率和浊度:
式中L表示各个任务的损失函数;
考虑多目标优化问题,目的是优化一组可能冲突的目标,使如下公式值达到最小,
其满足条件对于任意任务,βDO+βPH+βEC+βTU=1且β≥0;
其中,β是该个任务损失梯度的权值,Z是关于θsh的共享表示函数,表示梯度,通过求解该问题,找到适合所有任务的下降方向,完成对模型的优化;
求解该问题,当β1,...,K是该问题的解时,则满足以下两种情况之一,第一种是且结果点是帕累托静止点并满足卡罗需-库恩-塔克条件;第二种是/>为改进所有任务的梯度下降方向。其中,卡罗需-库恩-塔克条件具体为1.存在β≥0,使βDO+βPH+βEC+βTU=1且/>2.对所有任务,/>任意一个满足上述两个条件的为帕累托静止点,每个帕累托最优点满足帕累托静止点的要求;
S7:构建基于随机森林模型的水质分类模型,进行养殖水质的类别预测,具体为,
S701:将原始水质数据集作为随机森林模型的输入,进行模型训练与测试,参数调优,得到的最优模型作为水质等级分类器,其可以通过以下步骤确定:
S701a:从原始水质数据集中随机且有放回地抽取m个样本生成m个训练集;
S701b:对m个训练集,分别训练m个决策树模型,
S701c:对于单个决策树模型,每次分裂时根据信息增益,选择最好的特征进行分裂,信息增益最大的特征为最优特征,Z(z1,z2,...,zη)是水质数据特征的随机变量,U(u1,u2,...,uη)是类别的随机变量,有η个取值,
H(Z)=-∑z∈ZP(z)log(z)
H(Z|U)=-∑z∈Z,u∈U P(z,u)log P(z|u)
I(Z|U)=H(Z)-H(Z|U)
其中,I(Z|U)为信息增益,H(Z)为随机变量Z的信息熵,H(Z|U)为条件熵,表示给定条件u,随机变量Z的不确定性,P(z)是随机变量Z发生的概率,P(z,u)是联合概率。
S701d:将生成的多棵决策树组成随机森林,按照多棵树分类器投票选择最终的预测结果;
S702:将步骤S6中获得的向量P作为随机森林分类器的输入向量进行分类预测,其目标变量是步骤S4中获得的水质分类,最终得到水质等级预测结果,对未来一定时间的水质进行预测评估;
S8:每隔设定的时间段利用上一时间段的水质数据对模型进行更新训练,获得新的最优预测模型用于下一时间段的水禽养殖水质预测,本实施例中,设定的时间段优选为一个月;
本发明利用卷积神经网络和双向长短期神经网络构成硬共享参数层,学习共享特征,同时有利于避免模型过拟合,基于注意力机制进行优化,使用4个注意力模块分别关注溶解氧、PH、电导率和浊度预测4个任务的关键信息,并使用多重梯度下降算法寻找适合所有任务的梯度下降方向,使模型整体性能最优,可以同时保证水质多指标预测的高效性和准确性,并利用随机森林对水质进行分类预测,以获得未来一定时间的水质类别评估结果;并结合了外部影响因素作为水质时间序列预测的输入变量,提高模型预测的稳定性;此外对模型的更新训练可以动态地适应实际情况,能广泛应用于规模化养殖水体多指标与水质等级预测。
应理解的是,在任何实际实施方式的开发过程中,如在任何工程或设计项目中,可做出大量的具体实施方式决定。这样的开发努力可能是复杂的且耗时的,但对于那些得益于此公开内容的普通技术人员来说,不需要过多实验,所述开发努力将是一个设计、制造和生产的常规工作。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种水禽养殖水质预测方法,其特征在于:
选择水体溶解氧、PH、电导率和浊度指标作为监测对象并进行预测;
通过水质传感器实时获取水体溶解氧、PH、电导率和浊度参数信息,并构建原始水质数据集;
引入季节时变因素、水禽下水活动因素和水禽规模因素作为水质指标时间序列预测的外部特征,并筛选出重要特征;
利用综合水质评价对数据集全部时刻水质进行类别划分,作为分类预测的预测目标;
构建基于多任务学习的多指标时间序列预测模型,同时进行水体溶解氧、PH、电导率和浊度的预测;
构建水质分类模型,进行养殖水质的类别预测;
每隔设定的时间段利用上一时间段的水质数据对模型进行更新训练,获得新的最优预测模型用于下一时间段的水禽养殖水质预测。
2.如权利要求1所述的水禽养殖水质预测方法,其特征在于:获取参数信息的过程为,
每隔时间s分钟采取一次养殖水样监测水体溶解氧(mg/L)、PH、电导率(s/m)和浊度(ntu)值,使用前t个时刻的水质数据来预测一定时刻的水质数据值。
3.如权利要求1所述的水禽养殖水质预测方法,其特征在于:季节时变因素包括降雨量、气温、气压、湿度及风速,水禽下水活动因素包括两个时间间隔内的水禽下水活动时长及下水活动水禽平均数量,水禽规模因素包括水禽种群密度;其中,筛选特征因素的过程为,
通过对季节时变因素、水禽下水活动因素、水禽规模因素数据和获得的水质指标数据分别做皮尔逊相关系数分析,将对于所有预测目标均为低相关性的特征因素剔除;保留的特征因素数据与原始水质指标数据共同构建水质多指标时间序列预测数据集。
4.如权利要求1所述的水禽养殖水质预测方法,其特征在于:按照水体溶解氧、PH、电导率和浊度对水质影响的程度定出权系数,然后将各参数分成若干类别,按质量优劣评分,将评分相加求出综合水质指数,数值越大表示水质越好,将水质按照从好到坏划分为A类水、B类水、C类水、D类水和E类水。
5.如权利要求1所述的水禽养殖水质预测方法,其特征在于:基于多任务学习的养殖水质多指标时间序列预测步骤为,
使用前t个时刻的水质多指标时间序列预测数据集的数据来预测未来一定时刻的溶解氧、PH、电导率和浊度数据值并输出;使用卷积网络结合双向长短时记忆网络来处理水质数据;水质多指标时间序列预测数据集数据作为卷积神经网络的输入,将经过卷积神经网络处理的输出作为双向长短时神经网络的输入;采用硬参数共享机制,学习多个特征之间的耦合关系;
水质多指标时间序列预测数据集数据输入卷积神经网络后,在卷积层通过卷积核提取特征,
li=f(Wi*X+bi)
其中,li为经过第i个卷积核计算的输出矩阵,卷积过程为一维卷积,x为水质多指标时间序列预测数据集数据的输入矩阵,大小为g×h′,卷积核大小为λ×h′,步长为s′,输出矩阵大小为q×1,其中,q=(g-λ)/s′+1;f表示激活函数,Wi为权重矩阵,bi为偏置,*表示卷积;
以上水质多指标时间序列预测数据集数据经过卷积网络处理后的输出会作为双向长短时神经网络的输入,对于双向长短时神经网络,其中,长短期神经网络为一种循环网络,长短期神经网络利用门控机构解决传统循环神经网络的梯度消失和梯度爆炸问题,包括遗忘门,输入门和输出门;
遗忘门决定记住哪些信息和遗忘哪些信息,ft表示保留多少信息,
ft=σ(wf·[ht-1,xt]+bf)
输入门选择记忆部分,决定保留新信息的哪些部分,要更新的值的概率表示为it,
it=σ(wi·[ht-1,xt]+bi)
创建用于更新状态的候选值向量激活函数为tanh,
当前单元状态ct更新为
输出门用于输出,概率ot决定输出该单元状态ct的哪些部分,
ot=σ(w0·[ht-1,xt]+b0)
ht=ot·tanh(ct)
上述计算公式中,ht-1为上一单元的输出向量ht-1,xt为该单元的输入数据xt,wf,wi和w0为权重矩阵,bf,bi和b0为偏置向量,σ为sigmoid函数,ct-1为上一单元的记忆状态,ht为输出向量;
由前向和后向LSTM构成BiLSTM网络,
ht=LSTM(xt,ht-1)
h′t=LSTM(xt,h′t-1)
其中,ht和h′t分别表示前向和后向的隐节点输出向量,yt为双向长短时记忆神经网络的输出结果,ht-1为前一时刻的隐节点输出向量,xt为当前时刻的输入,why和分别表示前向和后向LSTM的输出权重,bt表示时间t时的偏置向量,LSTM()表示传统LSTM计算;
针对多个水质指标构建多任务注意力层,使用4个注意力模块分别关注溶解氧、PH、电导率和浊度预测4个任务的关键信息,即双向长短时神经网络输出中对该任务预测目标影响较大的信息,4个注意力模块分别计算双向长短时神经网络输出的权重,通过赋予更高的权重使模型关注更关键的信息,加权求和得到最终的输出结果;
et=u tanh(ωht+b)
式中st为t时刻注意层的输出,即水质指标预测数据,ht为t时刻BiLSTM网络层输出向量,et为t时刻ht决定的注意力概率分布值,u和ω为权重系数,b为偏置,tanh为激活函数,αt为注意层的权重系数,j为1到t之间的整数,exp是以自然常数e为底的指数函数,i为需要加权求和的总数;
注意力层不同预测任务的输出结果构成向量P,作为分类器的输入向量;
将多任务学习看作多指标优化问题,避免在训练过程中不同水质指标预测任务间的冲突,优化的目标是寻找帕累托最优解,采用多重梯度下降算法-上界来对整体的损失函数进行多梯度下降,使模型性能达到最优;
将该多任务学习问题定义为如下最小化问题,
其中,K是任务总数,其值为4,即代表了溶解氧、PH、电导率和浊度预测任务,k代表第k个任务,θsh为任务间共享的参数,θk为k任务独立的参数,ck为k任务损失函数的权值,表示任务k的损失函数;
同时处理4个水质指标的预测任务,使用DO,PH,EC,TU分别表示溶解氧、PH、电导率和浊度,
式中L表示各个任务的损失函数;
考虑多目标优化问题,目的是优化一组可能冲突的目标,使如下公式值达到最小,
其满足条件对于任意任务,βDO+βPH+βEC+βTU=1且β≥0;
其中,β是该个任务损失梯度的权值,Z是关于θsh的共享表示函数,表示梯度,通过求解该问题,找到适合所有任务的梯度下降方向,完成对模型的优化。
6.如权利要求1~3任一项所述的水禽养殖水质预测方法,其特征在于:基于随机森林模型对养殖水质的类别进行预测,预测时,
将原始水质数据集作为随机森林模型的输入,进行模型训练与测试,参数调优,得到的最优模型作为水质类别分类器,其通过以下步骤确定,
从原始水质数据集中随机且有放回地抽取m个样本生成m个训练集;
对m个训练集,分别训练m个决策树模型;
对于单个决策树模型,每次分裂时根据信息增益,选择最好的特征进行分裂,信息增益最大的特征为最优特征,Z(z1,z2,...,zη)是水质数据特征的随机变量,U(u1,u2,...,uη)是类别的随机变量,有η个取值,
I(Z|U)=H(Z)-H(Z|U)
其中,I(Z|U)为信息增益,H(Z)为随机变量Z的信息熵,H(Z|U)为条件熵,表示给定条件U,随机变量Z的不确定性,P(z)是随机变量Z发生的概率,P(z,u)是联合概率;
将生成的多棵决策树组成随机森林,按照多棵树分类器投票选择最终的预测结果,将训练获得的最优随机森林模型作为水质类别分类器;
将向量P作为随机森林分类器的输入向量进行分类预测,其目标变量是步骤综合水质评价处理时获得的水质分类,最终得到水质等级预测结果,对未来一定时间的水质进行预测评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311274044.9A CN117171624A (zh) | 2023-09-28 | 2023-09-28 | 一种水禽养殖水质预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311274044.9A CN117171624A (zh) | 2023-09-28 | 2023-09-28 | 一种水禽养殖水质预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117171624A true CN117171624A (zh) | 2023-12-05 |
Family
ID=88931851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311274044.9A Pending CN117171624A (zh) | 2023-09-28 | 2023-09-28 | 一种水禽养殖水质预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117171624A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117849302A (zh) * | 2024-03-08 | 2024-04-09 | 深圳市朗石科学仪器有限公司 | 一种多参数水质在线监测方法 |
CN117875506A (zh) * | 2024-01-16 | 2024-04-12 | 盐城工学院 | 一种基于lstm神经网络模型的养殖尾水预测处理方法 |
CN118260574A (zh) * | 2024-03-28 | 2024-06-28 | 北京科技大学 | 一种基于深度学习的工业污水的水质预测方法与装置 |
CN118651926A (zh) * | 2024-08-12 | 2024-09-17 | 广东省农业科学院动物科学研究所 | 基于改性桉树生物炭对水产养殖水质处理的调控方法 |
-
2023
- 2023-09-28 CN CN202311274044.9A patent/CN117171624A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875506A (zh) * | 2024-01-16 | 2024-04-12 | 盐城工学院 | 一种基于lstm神经网络模型的养殖尾水预测处理方法 |
CN117849302A (zh) * | 2024-03-08 | 2024-04-09 | 深圳市朗石科学仪器有限公司 | 一种多参数水质在线监测方法 |
CN118260574A (zh) * | 2024-03-28 | 2024-06-28 | 北京科技大学 | 一种基于深度学习的工业污水的水质预测方法与装置 |
CN118260574B (zh) * | 2024-03-28 | 2024-09-13 | 北京科技大学 | 一种基于深度学习的工业污水的水质预测方法与装置 |
CN118651926A (zh) * | 2024-08-12 | 2024-09-17 | 广东省农业科学院动物科学研究所 | 基于改性桉树生物炭对水产养殖水质处理的调控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117171624A (zh) | 一种水禽养殖水质预测方法 | |
CN110728401B (zh) | 基于松鼠杂草混合算法的神经网络短期电力负荷预测方法 | |
Li et al. | Water quality prediction model combining sparse auto-encoder and LSTM network | |
Renken et al. | Modelling the dynamics of coral reef macroalgae using a Bayesian belief network approach | |
Baran et al. | Stochastic models that predict trout population density or biomass on a mesohabitat scale | |
CN116957838A (zh) | 一种基于知识图表示学习的农作物生长环境监测方法 | |
CN116542382A (zh) | 基于混合优化算法的污水处理溶解氧浓度预测方法 | |
Kuang et al. | An enhanced extreme learning machine for dissolved oxygen prediction in wireless sensor networks | |
CN116884523B (zh) | 一种海洋牧场水质多参数预测方法 | |
CN108416460A (zh) | 基于多因素时序—随机深度置信网络模型的蓝藻水华预测方法 | |
CN107992945A (zh) | 基于深度学习和进化计算的特征基因选择方法 | |
Benzer et al. | Evaluation of growth in pike (Esox lucius L., 1758) using traditional methods and artificial neural networks | |
CN113962819A (zh) | 一种基于极限学习机的工厂化水产养殖溶解氧预测方法 | |
CN111062511B (zh) | 基于决策树与神经网络的水产养殖病害预测方法及系统 | |
CN114757433B (zh) | 一种饮用水源抗生素抗性相对风险快速识别方法 | |
CN114004433A (zh) | 一种养殖鱼类生长环境调控方法及装置 | |
Khabusi et al. | A deep learning approach to predict dissolved oxygen in aquaculture | |
Benzer et al. | Growth properties of Pseudorasbora parva in Süreyyabey Reservoir: traditional and artificial intelligent methods | |
CN117035152A (zh) | 一种基于ssa-lstm-am的污水水质预测方法 | |
CN116502903A (zh) | 基于层次分析法的底播扇贝养殖区选址适宜性评价方法 | |
Huang et al. | Port container throughput forecast based on ABC optimized BP neural network | |
Zakir et al. | Soil utilisation prediction for farmers using machine learning | |
Gill et al. | An efficient neural networks based genetic algorithm model for soil temperature prediction | |
Kirilova et al. | Prediction of Temperature Conditions of Autothermal Thermophilic Aerobic Digestion Bioreactors at Wastewater Treatment Plants. | |
Debroy et al. | A Fish Biomass Prediction Model for Aquaponics System Using Machine Learning Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |