CN111915097A - 基于改进遗传算法优化lstm神经网络的水质预测方法 - Google Patents

基于改进遗传算法优化lstm神经网络的水质预测方法 Download PDF

Info

Publication number
CN111915097A
CN111915097A CN202010818549.7A CN202010818549A CN111915097A CN 111915097 A CN111915097 A CN 111915097A CN 202010818549 A CN202010818549 A CN 202010818549A CN 111915097 A CN111915097 A CN 111915097A
Authority
CN
China
Prior art keywords
water quality
data
neural network
lstm neural
genetic algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010818549.7A
Other languages
English (en)
Other versions
CN111915097B (zh
Inventor
施佺
包银鑫
曹阳
茅一波
陈海龙
邵叶秦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202010818549.7A priority Critical patent/CN111915097B/zh
Publication of CN111915097A publication Critical patent/CN111915097A/zh
Application granted granted Critical
Publication of CN111915097B publication Critical patent/CN111915097B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Animal Husbandry (AREA)
  • Quality & Reliability (AREA)
  • Agronomy & Crop Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)

Abstract

本发明公开了一种基于改进遗传算法优化LSTM神经网络的水质预测方法,步骤如下:由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存至HBase数据库中,利用CDH大数据集群Spark计算组件对原始数据进行预处理;再进行Max‑min标准化,利用标准化后数据集构建训练集和测试集;构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进遗传算法的基本结构参数;利用构造的训练集训练模型预测养殖池未来某一时刻的水质数据。本发明在LSTM神经网络中引入遗传算法对神经网络训练的步长进行动态调整,从而降低LSTM神经网络预测水质时的相对误差,提高预测精度。

Description

基于改进遗传算法优化LSTM神经网络的水质预测方法
技术领域
本发明属于水质预测领域,具体为一种基于改进遗传算法优化LSTM神经网络的水质预测方法。
背景技术
我国是全球水产养殖第一大国,其产量约占全球养殖60%。根据对养殖失败原因分析发现,导致养殖失败的主要原因有水质问题、气候环境问题、养殖模式问题、苗种质量问题、塘口管理问题以及病害问题,集中表现就是虾苗长不大或者死虾。由于目前国内对虾养殖虾苗一代苗基本依赖进口,因此期望从种苗选育上提高养虾成功率效果不大,所以当前养殖户主要通过努力改善水产养殖水质参数、预防病虫害及提升塘口管理水平方面降低养殖失败率。因此,建立合适的水质预测模型,可以有效的解决水质突变问题,提高养殖产量。
目前关于水质预测的方法有很多,通常使用神经网络进行水质预测。常见的BP神经网络能够对水质数据变化趋势进行预测,但容易陷入局部最优的情况;LSTM神经网络具有较强的时间捕获性,较好的适应水质数据的时序特征,因此LSTM相比于传统的BP神经网络更加准确。但LSTM存在一定局限性,忽视不同时刻的水质指标对结果存在一定影响,且网络结构固定化,不适应不同的水质数据集。
发明内容
发明目的:针对上述问题,本发明引入一种基于改进遗传算法优化LSTM神经网络的水质预测方法。该方法在LSTM神经网络的基础上,引入改进遗传算法对神经网络的训练步长进行动态调整,赋予不同时刻的神经网络不同的训练步长,从而降低训练的误差,提高预测的准确度。
技术方案:一种基于改进遗传算法优化LSTM神经网络的水质预测方法,包括如下步骤:
步骤1)由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存放至HBase集群数据库中,利用CDH大数据集群中Spark内存计算组件对原始特征数据集进行数据预处理,降低数据冗余度和复杂性;
步骤2)将处理过后的数据进行Max-min标准化处理,利用处理好的数据集构建训练集和测试集;
步骤3)构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进的遗传算法的基本结构参数;
步骤4)利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据。
进一步地,所述步骤1中,利用无人巡航船在养殖池中监测一定时间,获得按时间排序的养殖池温度、溶氧、pH三种原始特征数据集D,
D={(Dtemp1,Dox1,Dph1)1,(Dtemp2,Dox2,Dph2)2,...,(Dtempi,Doxi,Dphi)n},其中n表示原始数据集D的记录数量,Dt empi,Doxi,Dphi为第i个时间节点的养殖池温度、溶氧、pH数据。
进一步地,所述步骤2中,利用Max-min标准化方法对养殖池温度、溶氧、pH三种原始特征数据集进行标准化处理,通过下式计算E*:
Figure BDA0002633627490000021
其中,Etemp,oxy,ph表示Max-min标准化前第i个时间节点的养殖池温度、溶氧、pH数据,Et emp,oxy,ph *表示Max-min标准化后的第i个时间节点的养殖池温度、溶氧、pH数据,Dtemp,oxy,phmin表示养殖池温度、溶氧、pH数据中的样本最小值,Dtemp,oxy,phmax表示养殖池温度、溶氧、pH数据中的样本最大值;
通过对采集的养殖池温度、溶氧、pH数据进行Max-min标准化,获得标准化后的数据集为:
D*={(Dtemp1,Dox1,Dph1)1 *,(Dtemp2,Dox2,Dph2)2 *,...,(Dtempi,Doxi,Dphi)n *},其中n表示原始数据集D在Max-min标准化后的记录数量,Dtempi *,Doxi *,Dphi *为第i个时间节点在Max-min标准化后的养殖池温度、溶氧、pH数据;
标准化处理完成后将数据集D*拆分成训练集Train和测试集Test,训练集的数量为a,则测试集的数量为n-a,在三个特征数据后增加一列新的特征值y,y的值代表当前水质的情况,y的值取值为0或1,0代表水质不正常情况,1代表水质正常的情况,对原始数据集进行水质情况的判断补充。
进一步地,所述步骤3中,构造LSTM神经网络模型和改进遗传算法模型,构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-1:构造LSTM神经网络模型,具体步骤如下:
步骤3-1-1:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长η,确定输出层状态矩阵H=(h1,h2,...,hq);
步骤3-1-2:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V均为随机实数;
步骤3-1-3:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤3-2:构造改进遗传网络模型,具体步骤如下:
步骤3-2-1:采用二进制编码初始化种群,设置各个参数;
步骤3-2-2:设置适应度函数,计算个体的适应度值,保留适应度最大的个体;
步骤3-2-3:判断是否满足算法结束条件,如果满足收敛条件,则输出结果,否则进入步骤3-2-4;
步骤3-2-4:判断
Figure BDA0002633627490000041
是否成立,如果成立,则先执行变异操作,然后进行交叉操作;反之先执行交叉操作,然后执行变异操作,最后执行选择操作;
步骤3-2-5:判断选择操作的结果是否满足算法结束条件,若满足结果则结束算法,否则回到步骤3-2-2;
步骤3-3:构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-3-1:利用步骤3-1构建的LSTM神经网络模型作为水质预测模型的主要架构,输入层层数设置为3,输出层输出状态矩阵H;
步骤3-3-2:确定RMSE作为误差评价标准,将RMSE同时作为步骤3-2改进遗传算法的评价函数;
步骤3-3-3:利用步骤3-2改进遗传算法动态计算每次LSTM训练的步长的适应值,确定适应值最优的步长作为LSTM神经网络训练步长η。
进一步地,所述步骤4中,利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据,具体步骤如下:
步骤4-1:将训练集Train中温度、溶氧、pH数据输入到基于改进遗传算法优化LSTM神经网络的水质预测模型,通过模型得到对应的实际输出
Figure BDA0002633627490000051
步骤4-2:使用均方根误差
Figure BDA0002633627490000052
计算水质情况实际预测值与预期输出值的误差;利用反向传播算法将每次运算的误差传递给LSTM每一个神经元,随后利用随机梯度下降法更新每一个连接权重,更新权重后利用改进遗传算法进行训练步长的调整,调整为适应值最大的作为步长;
步骤4-3:设置迭代1000次,在迭代中不断更新LSTM神经网络连接权重。
步骤4-4:利用测试集数据Test测试模型训练效果,LSTM前向计算输出为h(t):
单元状态:g(t)=tanh(Wgxx(t)+Wghh(t-1)+bg);
输入门:i(t)=σ(Wixx(t)+Wihh(t-1)+bi);
遗忘门:f(t)=σ(Wfxx(t)+Wfhh(t-1)+bf);
输出门:o(t)=σ(Woxx(t)+Wohh(t-1)+bo);
当前状态:s(t)=g(t)*i(t)+s(t-1)*f(t);
输出:h(t)=tanh(s(t))*o(t);
其中i(t)表示当前水质数据中的第t个时间节点的需要更新的信息,
f(t)表示该水质数据中的第t个时间节点需要丢弃的信息,o(t)表示该水质数据中第t个时间节点需要输出的信息,g(t)表示该水质数据在第t个时间节点的单元状态,s(t)表示该水质数据在第t个时间节点的当前状态,
h(t)表示该水质数据中第t个时间节点输出的值;
步骤4-5:将作为测试集的水质数据利用LSTM神经网络前向计算模型进行输出,得到预测的水质数据。
有益效果:本发明的水质预测方法,在LSTM神经网络中引入遗传算法对神经网络训练的步长进行动态调整,从而降低LSTM神经网络预测水质时的相对误差,提高预测精度。
本发明针对LSTM神经网络训练过程中网络结构的固定性,提出一种基于改进遗传算法优化LSTM神经网络的水质预测方法,该方法在LSTM神经网络的基础上,引入改进遗传算法对神经网络的训练步长进行动态调整,赋予不同时刻的神经网络不同的训练步长,从而降低训练的误差,提高预测的准确度,使得水质的预测具有更高的实时性和实用性。
附图说明
图1为本发明的基于改进遗传算法优化LSTM神经网络的水质预测方法步骤示意图;
图2为本发明的基于改进遗传算法优化LSTM神经网络的水质预测方法流程图;
图3为本发明的基于改进遗传算法优化LSTM神经网络模型图;
图4为本发明的基于改进遗传算法优化LSTM神经网络模型测试集数据拟合图。
具体实施方式
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
如图1-4所示,一种基于改进遗传算法优化LSTM神经网络的水质预测方法,包括如下步骤:
步骤1)由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存放至HBase集群数据库中,利用CDH大数据集群中Spark内存计算组件对原始特征数据集进行数据预处理,降低数据冗余度和复杂性;
所述步骤1中,利用无人巡航船在养殖池中监测一定时间,获得按时间排序的养殖池温度、溶氧、pH三种原始特征数据集D,
D={(Dtemp1,Dox1,Dph1)1,(Dtemp2,Dox2,Dph2)2,...,(Dtemp i,Doxi,Dphi)n},其中n表示原始数据集D的记录数量,Dt empi,Doxi,Dphi为第i个时间节点的养殖池温度、溶氧、pH数据。
步骤2)将处理过后的数据进行Max-min标准化处理,利用处理后的数据集构建训练集和测试集;
所述步骤2中,使用Max-min标准化方法对养殖池温度、溶氧、pH三种原始特征数据集进行标准化处理,通过下式计算E*:
Figure BDA0002633627490000071
其中,Etemp,oxy,ph表示Max-min标准化前第i个时间节点的养殖池温度、溶氧、pH数据,Et emp,oxy,ph *表示Max-min标准化后的第i个时间节点的养殖池温度、溶氧、pH数据,Dtemp,oxy,phmin表示养殖池温度、溶氧、pH数据中的样本最小值,Dtemp,oxy,phmax表示养殖池温度、溶氧、pH数据中的样本最大值;
通过对采集的养殖池温度、溶氧、pH数据进行Max-min标准化,获得标准化后的数据集为:
D*={(Dtemp1,Dox1,Dph1)1 *,(Dtemp2,Dox2,Dph2)2 *,...,(Dtempi,Doxi,Dphi)n *},其中n表示原始数据集D在Max-min标准化后的记录数量,Dtempi *,Doxi *,Dphi *为第i个时间节点在Max-min标准化后的养殖池温度、溶氧、pH数据;
标准化处理完成后将数据集D*拆分成训练集Train和测试集Test,训练集的数量为a,则测试集的数量为n-a,在三个特征数据后增加一列新的特征值y,y的值代表当前水质的情况,y的值取值为0或1,0代表水质不正常情况,1代表水质正常的情况,对原始数据集进行水质情况的判断补充。
步骤3)构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进的遗传算法的基本结构参数;
所述步骤3中,构造LSTM神经网络模型和改进遗传算法模型,构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-1:构造LSTM神经网络模型,具体步骤如下:
步骤3-1-1:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长η,确定输出层状态矩阵H=(h1,h2,...,hq);
步骤3-1-2:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V均为随机实数;
步骤3-1-3:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤3-2:构造改进遗传网络模型,具体步骤如下:
步骤3-2-1:采用二进制编码初始化种群,设置各个参数;
步骤3-2-2:设置适应度函数,计算个体的适应度值,保留适应度最大的个体;
步骤3-2-3:判断是否满足算法结束条件,如果满足收敛条件,则输出结果,否则进入步骤3-2-4;
步骤3-2-4:判断
Figure BDA0002633627490000091
是否成立,如果成立,则先执行变异操作,然后进行交叉操作;反之先执行交叉操作,然后执行变异操作,最后执行选择操作;
步骤3-2-5:判断选择操作的结果是否满足算法结束条件,若满足结果则结束算法,否则回到步骤3-2-2;
步骤3-3:构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-3-1:利用步骤3-1构建LSTM神经网络模型作为水质预测模型的主要架构,输入层层数设置为3,输出层输出状态矩阵H;
步骤3-3-2:确定RMSE作为误差评价标准,将RMSE同时作为步骤3-2改进遗传算法的评价函数;
步骤3-3-3:利用步骤3-2改进遗传算法动态计算每次LSTM训练的步长的适应值,确定适应值最优的步长作为LSTM神经网络训练步长η。
步骤4)利用构造的训练集训练构建基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据;
所述步骤4中,利用构造的训练集训练基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据,具体步骤如下:
步骤4-1:将训练集Train中温度、溶氧、pH数据输入到基于改进遗传算法优化LSTM神经网络的水质预测模型,通过模型得到对应的实际输出
Figure BDA0002633627490000101
步骤4-2:使用均方根误差
Figure BDA0002633627490000102
计算水质情况实际预测值与预期输出值的误差;利用反向传播算法将每次运算的误差传递给LSTM每一个神经元,随后利用随机梯度下降法更新每一个连接权重,更新权重后利用改进遗传算法进行训练步长的调整,调整为适应值最大的作为步长;
步骤4-3:设置迭代1000次,在迭代中不断更新LSTM神经网络连接权重。
步骤4-4:利用测试集数据Test测试模型训练效果,LSTM前向计算输出为h(t):
单元状态:g(t)=tanh(Wgxx(t)+Wghh(t-1)+bg);
输入门:i(t)=σ(Wixx(f)+Wihh(t-1)+bi);
遗忘门:f(t)=σ(Wfxx(t)+Wfhh(t-1)+bf);
输出门:o(t)=σ(Woxx(t)+Wohh(t-1)+bo);
当前状态:s(t)=g(t)*i(t)+s(t-1)*f(t);
输出:h(t)=tanh(s(t))*o(t);
其中i(t)表示当前水质数据中的第t个时间节点的需要更新的信息,f(t)表示该水质数据中的第t个时间节点需要丢弃的信息,o(t)表示该水质数据中第t个时间节点需要输出的信息,g(t)表示该水质数据在第t个时间节点的单元状态,s(t)表示该水质数据在第t个时间节点的当前状态,
h(t)表示该水质数据中第t个时间节点输出的值;
步骤4-5:将作为测试集的水质数据利用LSTM神经网络前向计算模型进行输出,得到预测的水质数据。
本发明针对LSTM神经网络训练过程中网络结构的固定性,提出一种基于改进遗传算法优化LSTM神经网络的水质预测方法,该方法在LSTM神经网络的基础上,引入改进遗传算法对神经网络的训练步长进行动态调整,赋予不同时刻的神经网络不同的训练步长,从而降低训练的误差,提高预测的准确度,使得水质的预测具有更高的实时性和实用性。
以上所述仅为本发明的实验室环境下较佳的实施方式,本发明保护范围并不以上述实施方式为限制,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和修饰变化,皆应纳入权利要求书记载的保护范围。

Claims (5)

1.一种基于改进遗传算法优化LSTM神经网络的水质预测方法,其特征在于:所述方法包括如下步骤:
步骤1)由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存放至HBase集群数据库中,利用CDH大数据集群中Spark内存计算组件对原始特征数据集进行数据预处理,降低数据冗余度和复杂性;
步骤2)将处理过后的数据进行Max-min标准化处理,利用处理好的数据集构建训练集和测试集;
步骤3)构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进的遗传算法的基本结构参数;
步骤4)利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据。
2.根据权利要求1所述的基于改进遗传算法优化LSTM神经网络的水质预测方法,其特征在于:所述步骤1中,利用无人巡航船在养殖池中监测一定时间,获得按时间排序的养殖池温度、溶氧、pH三种原始特征数据集D,D={(Dtemp1,Dox1,Dph1)1,(Dtemp2,Dox2,Dph2)2,...,(Dtempi,Doxi,Dphi)n},其中n表示原始数据集D的记录数量,Dtempi,Doxi,Dphi为第i个时间节点的养殖池温度、溶氧、pH数据。
3.根据权利要求1所述的基于改进遗传算法优化LSTM神经网络的水质预测方法:所述步骤2中,使用Max-min标准化方法对养殖池温度、溶氧、pH三种原始特征数据集进行标准化处理,通过下式计算E*:
Figure FDA0002633627480000011
其中,Etemp,oxy,ph表示Max-min标准化前第i个时间节点的养殖池温度、溶氧、pH数据,Etemp,oxy,ph *表示Max-min标准化后的第i个时间节点的养殖池温度、溶氧、pH数据,Dtemp,oxy, phmin表示养殖池温度、溶氧、pH数据中的样本最小值,Dtemp,oxy,phmax表示养殖池温度、溶氧、pH数据中的样本最大值;
通过对采集的养殖池温度、溶氧、pH数据进行Max-min标准化,获得标准化后的数据集为:
D*={(Dtemp1,Dox1,Dph1)1 *,(Dtemp2,Dox2,Dph2)2 *,...,(Dtempi,Doxi,Dphi)n *},其中n表示原始数据集D在Max-min标准化后的记录数量,Dtempi *,Doxi *,Dphi *为第i个时间节点在Max-min标准化后的养殖池温度、溶氧、pH数据;
标准化处理完成后将数据集D*拆分成训练集Train和测试集Test,训练集的数量为a,则测试集的数量为n-a,在三个特征数据后增加一列新的特征值y,y的值代表当前水质的情况,y的值取值为0或1,0代表水质不正常情况,1代表水质正常的情况,对原始数据集进行水质情况的判断补充。
4.根据权利要求1所述的基于改进遗传算法优化LSTM神经网络的水质预测方法,其特征在于:所述步骤3中,构造LSTM神经网络模型和改进遗传算法模型,构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-1:构造LSTM神经网络模型,具体步骤如下:
步骤3-1-1:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长η,确定输出层状态矩阵H=(h1,h2,...,hq);
步骤3-1-2:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V均为随机实数;
步骤3-1-3:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤3-2:构造改进遗传网络模型,具体步骤如下:
步骤3-2-1:采用二进制编码初始化种群,设置各个参数;
步骤3-2-2:设置适应度函数,计算个个体的适应度值,保留适应度最大的个体;
步骤3-2-3:判断是否满足算法结束条件,如果满足收敛条件,则输出结果,否则进入步骤3-2-4;
步骤3-2-4:判断
Figure FDA0002633627480000031
是否成立,如果成立,则先执行变异操作,然后进行交叉操作;反之先执行交叉操作,然后执行变异操作,最后执行选择操作;
步骤3-2-5:判断选择操作的结果是否满足算法结束条件,若满足结果则结束算法,否则回到步骤3-2-2;
步骤3-3:构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-3-1:使用步骤3-1构建的LSTM神经网络模型作为水质预测模型的主要架构,输入层层数设置为3,输出层输出状态矩阵H;
步骤3-3-2:确定RMSE作为误差评价标准,将RMSE同时作为步骤3-2改进遗传算法的评价函数;
步骤3-3-3:使用步骤3-2改进遗传算法动态计算每次LSTM训练的步长的适应值,确定适应值最优的步长作为LSTM神经网络训练步长η。
5.根据权利要求1所述的基于改进遗传算法优化LSTM神经网络的水质预测方法,其特征在于:所述步骤4中,利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据,具体步骤如下:
步骤4-1:将训练集Train中温度、溶氧、pH数据输入到基于改进遗传算法优化LSTM神经网络的水质预测模型,通过模型得到对应的实际输出
Figure FDA0002633627480000041
步骤4-2:使用均方根误差
Figure FDA0002633627480000042
计算水质情况实际预测值与预期输出值的误差;利用反向传播算法将每次运算的误差传递给LSTM每一个神经元,随后利用随机梯度下降法更新每一个连接权重,更新权重后利用改进遗传算法进行训练步长的调整,调整为适应值最大的作为步长;
步骤4-3:设置迭代1000次,在迭代中不断更新LSTM神经网络连接权重。
步骤4-4:利用测试集数据Test测试模型训练效果,LSTM前向计算输出为h(t):
单元状态:g(t)=tanh(Wgxx(t)+Wghh(t-1)+bg);
输入门:i(t)=σ(Wixx(t)+Wihh(t-1)+bi);
遗忘门:f(t)=σ(Wfxx(t)+Wfhh(t-1)+bf);
输出门:o(t)=σ(Woxx(t)+Wohh(t-1)+bo);
当前状态:s(t)=g(t)*i(t)+s(t-1)*f(t);
输出:h(t)=tanh(s(t))*o(t);
其中i(t)表示当前水质数据中的第t个时间节点的需要更新的信息,
f(t)表示该水质数据中的第t个时间节点需要丢弃的信息,o(t)表示该水质数据中第t个时间节点需要输出的信息,g(t)表示该水质数据在第t个时间节点的单元状态,s(t)表示该水质数据在第t个时间节点的当前状态,
h(t)表示该水质数据中第t个时间节点输出的值;
步骤4-5:将作为测试集的水质数据利用LSTM神经网络前向计算模型进行输出,得到预测的水质数据。
CN202010818549.7A 2020-08-14 2020-08-14 基于改进遗传算法优化lstm神经网络的水质预测方法 Active CN111915097B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010818549.7A CN111915097B (zh) 2020-08-14 2020-08-14 基于改进遗传算法优化lstm神经网络的水质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010818549.7A CN111915097B (zh) 2020-08-14 2020-08-14 基于改进遗传算法优化lstm神经网络的水质预测方法

Publications (2)

Publication Number Publication Date
CN111915097A true CN111915097A (zh) 2020-11-10
CN111915097B CN111915097B (zh) 2022-11-11

Family

ID=73283113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010818549.7A Active CN111915097B (zh) 2020-08-14 2020-08-14 基于改进遗传算法优化lstm神经网络的水质预测方法

Country Status (1)

Country Link
CN (1) CN111915097B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112946187A (zh) * 2021-01-22 2021-06-11 西安科技大学 一种基于神经网络的避难硐室实时状态监测方法
CN114386686A (zh) * 2021-12-30 2022-04-22 北京师范大学 一种基于改进lstm的流域水质短期预测方法
CN114548482A (zh) * 2021-12-24 2022-05-27 中铁西北科学研究院有限公司 一种基于蠕变型滑坡动能变化率临滑预警方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050246297A1 (en) * 2004-03-26 2005-11-03 Dingding Chen Genetic algorithm based selection of neural network ensemble for processing well logging data
CN108986470A (zh) * 2018-08-20 2018-12-11 华南理工大学 粒子群算法优化lstm神经网络的行程时间预测方法
CN109243172A (zh) * 2018-07-25 2019-01-18 华南理工大学 基于遗传算法优化lstm神经网络的交通流预测方法
CN110321361A (zh) * 2019-06-15 2019-10-11 河南大学 基于改进的lstm神经网络模型的试题推荐判定方法
CN110428082A (zh) * 2019-05-31 2019-11-08 南京邮电大学 基于注意力神经网络的水质预测方法
CN110633868A (zh) * 2019-07-19 2019-12-31 中国石油化工股份有限公司 遗传算法优化神经网络进行探井试油层油气性质预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050246297A1 (en) * 2004-03-26 2005-11-03 Dingding Chen Genetic algorithm based selection of neural network ensemble for processing well logging data
CN109243172A (zh) * 2018-07-25 2019-01-18 华南理工大学 基于遗传算法优化lstm神经网络的交通流预测方法
CN108986470A (zh) * 2018-08-20 2018-12-11 华南理工大学 粒子群算法优化lstm神经网络的行程时间预测方法
CN110428082A (zh) * 2019-05-31 2019-11-08 南京邮电大学 基于注意力神经网络的水质预测方法
CN110321361A (zh) * 2019-06-15 2019-10-11 河南大学 基于改进的lstm神经网络模型的试题推荐判定方法
CN110633868A (zh) * 2019-07-19 2019-12-31 中国石油化工股份有限公司 遗传算法优化神经网络进行探井试油层油气性质预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李莹等: "基于遗传算法优化的LSTM神经网络期货价格预测模型研究", 《电脑知识与技术》 *
王泽平: "基于GA-BP与多隐层BP网络模型的水质预测及比较分析", 《水资源与水工程学报》 *
闫春 等: "基于改进的遗传算法在函数优化中的应用", 《计算机应用研究》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112946187A (zh) * 2021-01-22 2021-06-11 西安科技大学 一种基于神经网络的避难硐室实时状态监测方法
CN112946187B (zh) * 2021-01-22 2023-04-07 西安科技大学 一种基于神经网络的避难硐室实时状态监测方法
CN114548482A (zh) * 2021-12-24 2022-05-27 中铁西北科学研究院有限公司 一种基于蠕变型滑坡动能变化率临滑预警方法
CN114386686A (zh) * 2021-12-30 2022-04-22 北京师范大学 一种基于改进lstm的流域水质短期预测方法

Also Published As

Publication number Publication date
CN111915097B (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
CN111915097B (zh) 基于改进遗传算法优化lstm神经网络的水质预测方法
CN110378435B (zh) 一种基于卷积神经网络的苹果叶片病害识别的方法
CN104751842B (zh) 深度神经网络的优化方法及系统
CN111898689B (zh) 一种基于神经网络架构搜索的图像分类方法
CN110428082B (zh) 基于注意力神经网络的水质预测方法
CN106228185A (zh) 一种基于神经网络的通用图像分类识别系统及方法
CN109920248B (zh) 一种基于gru神经网络的公交到站时间预测方法
CN111119282A (zh) 一种针对供水管网的压力监测点优化布置方法
CN112906828A (zh) 一种基于时域编码和脉冲神经网络的图像分类方法
CN115034126A (zh) 一种通过灰狼算法优化lstm神经网络模型的方法与系统
CN114861533A (zh) 基于时间卷积网络的风功率超短期预测方法
CN114022693A (zh) 一种基于双重自监督的单细胞RNA-seq数据聚类方法
CN115204035A (zh) 基于多尺度时序数据融合模型的发电机组运行参数预测方法、装置及存储介质
CN111292124A (zh) 一种基于优化组合神经网络的需水预测方法
CN114004152B (zh) 基于图卷积和循环神经网络的多风场风速时空预测方法
CN117349622A (zh) 基于混合深度学习机制的风电场风速预测方法
CN116525135B (zh) 基于气象因素的时空模型对疫情发展态势进行预测的方法
CN112651499A (zh) 一种基于蚁群优化算法和层间信息的结构化模型剪枝方法
CN116630080A (zh) 基于图像识别的水产集约化养殖饲料容量确定方法及系统
CN113188243B (zh) 一种空调能耗的综合预测方法及系统
CN113807005A (zh) 基于改进fpa-dbn的轴承剩余寿命预测方法
CN113011091A (zh) 一种自动分组的多尺度轻量型深度卷积神经网络优化方法
CN110728292A (zh) 一种多任务联合优化下的自适应特征选择算法
CN116881854B (zh) 融合XGBoost计算特征权重的时间序列预测方法
CN117668701B (zh) Ai人工智能机器学习系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant