CN108665100A - 一种水体水质预测方法、系统及装置 - Google Patents
一种水体水质预测方法、系统及装置 Download PDFInfo
- Publication number
- CN108665100A CN108665100A CN201810437486.3A CN201810437486A CN108665100A CN 108665100 A CN108665100 A CN 108665100A CN 201810437486 A CN201810437486 A CN 201810437486A CN 108665100 A CN108665100 A CN 108665100A
- Authority
- CN
- China
- Prior art keywords
- water quality
- parameters
- encoder
- self
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 304
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000015654 memory Effects 0.000 claims abstract description 113
- 230000004927 fusion Effects 0.000 claims abstract description 72
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 26
- 238000010606 normalization Methods 0.000 claims description 26
- 230000004913 activation Effects 0.000 claims description 20
- 210000002569 neuron Anatomy 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 19
- 230000007787 long-term memory Effects 0.000 claims description 17
- 230000002441 reversible effect Effects 0.000 claims description 12
- 230000006403 short-term memory Effects 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 abstract description 10
- 210000004027 cell Anatomy 0.000 description 16
- 230000008859 change Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000009360 aquaculture Methods 0.000 description 8
- 244000144974 aquaculture Species 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 239000001301 oxygen Substances 0.000 description 6
- 229910052760 oxygen Inorganic materials 0.000 description 6
- 229910002651 NO3 Inorganic materials 0.000 description 5
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 5
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 description 5
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000739 chaotic effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- -1 pH value Chemical compound 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical group N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000013505 freshwater Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 238000005276 aerator Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000012851 eutrophication Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000005416 organic matter Chemical group 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 244000144985 peep Species 0.000 description 1
- 239000010452 phosphate Chemical group 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical group [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种水体水质预测方法、系统及装置,所述方法包括:分别对目标水体的多组水质参数和对应的气象参数进行缺失数据处理和归一化处理,获取标准气象参数和标准水质参数;基于所述标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取所述目标水体的预测水质指标;其中,所述自编码器与长短时记忆网络融合预测模型为,预先利用所述目标水体的标准样本水质参数和对应的标准样本气象参数,依次对构建的初始自编码器和初始长短时记忆网络模型进行训练获取的。本发明能够有效挖掘水体多参数之间的相互作用关系,从而对水体水质进行有效预测,揭示水质因子变化的关键规律。
Description
技术领域
本发明涉及信息处理技术领域,更具体地,涉及一种水体水质预测方法、系统及装置。
背景技术
伴随水产养殖规模的日益壮大,集约化养殖正逐渐成为主要的水产养殖生产方式。养殖密度的增加,用药、施饵不科学等均会破坏水质,导致养殖病害频发,影响水产养殖经济效益。另一方面,养殖水体自身净化能力差,养殖过程中长期积累的氮、磷酸盐及有机物残留等无法与外界交换与扩散,容易造成污染物沉积和水体富营养化,污染生态环境。
通过对水体水质的有效预测,可以对养殖产品进行状态判断,从而避免不必要的损失和对生态环境的破坏。水质参数主要包括温度、溶解氧、pH值、氨氮、亚硝酸盐和硝酸盐等,而各影响因子之间相互具有复杂的影响关系,使水体环境具有复杂、多变及非线性等特点,因此很难实现水质的精准预测。
水质精准预测的难点主要在于:多变量非线性水质参数时间序列数据之间的隐含关系学习;处理大量非线性的混沌数据,从中挖掘出适用于预测的水质参数数据特征;以及学习到时间数据间的长期依赖关系,从而预测更长时间的水质变化等。
现有方案多采用传统机器学习方法对水质进行预测,难以发现水体多参数之间的相互作用关系,不足以揭示水质因子变化的关键规律。例如,以气象参数以及淡水养殖中使用的增氧机开关时间作为输入变量,利用遗传算法和3层BP神经网络预测淡水养殖水质的溶解氧变化情况。但是,遗传算法优化的BP神经网络难以学习水体多参数之间的相互作用关系,不足以揭示水质因子变化的关键规律,特别是无法学习时间数据间的长期依赖关系。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明提供一种水体水质预测方法、系统及装置,用以有效挖掘水体多参数之间的相互作用关系,从而对水体水质进行有效预测,揭示水质因子变化的关键规律。
第一方面,本发明提供一种水体水质预测方法,包括:S1,分别对目标水体的水质参数和对应的气象参数进行缺失数据处理和归一化处理,获取标准气象参数和标准水质参数;S2,基于所述标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取所述目标水体的预测水质指标;其中,所述自编码器与长短时记忆网络融合预测模型为,预先利用所述目标水体的标准样本水质参数和对应的标准样本气象参数,依次对构建的初始自编码器和初始长短时记忆网络模型进行训练获取的。
进一步的,在所述S2的步骤之前,所述方法还包括:S01,分别对所述目标水体的多组样本水质参数,以及数据采集时刻的样本气象参数,进行缺失数据处理和归一化处理,获取多组所述标准样本水质参数和对应的所述标准样本气象参数;S02,基于所述标准样本水质参数和对应的所述标准样本气象参数,构建所述初始自编码器,并利用各组所述标准样本水质参数和对应的所述标准样本气象参数,对所述初始自编码器进行迭代训练,获取基于水质参数和气象参数的特征表示,并确定目标自编码器;S03,基于所述目标自编码器,构建所述初始长短时记忆网络模型,并将所述目标自编码器和所述初始长短时记忆网络模型进行模型融合,获取初始融合模型;S04,利用所述标准样本水质参数和对应的所述标准样本气象参数,对所述初始融合模型进行迭代训练,获取目标长短时记忆网络模型参数,并确定所述自编码器与长短时记忆网络融合预测模型。
其中,所述初始自编码器具体为初始稀疏自编码器;相应的,所述目标自编码器具体为目标稀疏自编码器。
其中,步骤S02中所述利用各组所述标准样本水质参数和对应的所述标准样本气象参数,对所述初始自编码器进行迭代训练,获取基于水质参数和气象参数的特征表示,并确定目标自编码器的步骤进一步包括:将所述标准样本水质参数和对应的所述标准样本气象参数输入所述初始稀疏自编码器,进行前向计算,获取损失函数;基于所述初始稀疏自编码器的各隐含层激活输出,定义稀疏性参数;在所述损失函数中加入惩罚因子,并利用所述稀疏性参数,对包含惩罚因子的损失函数进行稀疏性调整;利用误差数据的反向传播,通过对所述稀疏性调整后的损失函数的最小化运算,获取反向修正的网络参数;根据所述反向修正的网络参数,获取所述基于水质参数和气象参数的特征表示,并确定所述目标自编码器。
其中,所述S03的步骤进一步包括:基于所述目标自编码器的隐含层神经元个数和所述水质指标的维数,确定网络模型的输入和输出,并初始化设定网络模型参数,获取所述初始长短时记忆网络模型;按照设定变换系数,将所述目标自编码器的各隐含层神经元激活值输出至所述初始长短时记忆网络模型的对应输入层神经元,进行模型融合,获取所述初始融合模型。
进一步的,所述方法还包括:在所述初始长短时记忆网络模型的设定门限处增加窥视孔连接,用以使所述设定门限可读取对应的单元状态。
其中,所述S04的步骤进一步包括:将所述标准样本水质参数和对应的所述标准样本气象参数输入所述初始融合模型,并利用所述基于水质参数和气象参数的特征表示,计算所述目标自编码器的隐含层激活值;将所述目标自编码器的隐含层激活值输入所述初始长短时记忆网络模型,并采用前向批量随机梯度下降算法和误差反向传播修正算法,对所述初始长短时记忆网络模型进行训练,获取所述目标长短时记忆网络模型参数,并基于所述目标自编码器和所述目标长短时记忆网络模型参数,获取所述自编码器与长短时记忆网络融合预测模型。
其中,步骤S2中所述预测水质指标具体为标准化的预测水质指标;进一步的,在所述S2的步骤之后,所述方法还包括:对所述标准化的预测水质指标进行反归一化处理,并根据预先设定,选择反归一化处理后预测水质指标中的一个或多个维度进行输出。
第二方面,本发明提供一种水体水质预测系统,包括:数据预处理模块,用于分别对目标水体的水质参数和对应的气象参数进行缺失数据处理和归一化处理,获取标准气象参数和标准水质参数;水质预测模块,用于基于所述标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取所述目标水体的预测水质指标;其中,所述自编码器与长短时记忆网络融合预测模型为,预先利用所述目标水体的标准样本水质参数和对应的标准样本气象参数,依次对构建的初始自编码器和初始长短时记忆网络模型进行训练获取的。
第三方面,本发明提供一种水体水质预测装置,包括:至少一个存储器、至少一个处理器、通信接口和总线;所述存储器、所述处理器和所述通信接口通过所述总线完成相互间的通信,所述通信接口用于所述预测装置与水质参数及气象参数获取或存储设备之间的信息传输;所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的水体水质预测方法。
本发明提供的一种水体水质预测方法、系统及装置,通过融合自编码器和长短时记忆网络,利用长短时记忆网络记忆长时间序列数据的能力,学习数据的时序特征和时间累积效应,同时利用自编码器挖掘数据中的隐含信息,改进长短时记忆网络不容易记住最近数据的不足,能够有效挖掘水体参数多变量之间的相互作用关系,从而对水体水质进行有效预测,揭示水质因子变化的关键规律。
附图说明
图1为本发明实施例一种水体水质预测方法的流程图;
图2为根据本发明实施例一种水体水质预测方法中构建融合预测模型的流程图;
图3为本发明实施例一种自编码器的结构示意图;
图4为本发明实施例一种长短时记忆网络模型的结构示意图;
图5为根据本发明实施例一种水体水质预测方法中训练融合预测模型的流程图;
图6为根据本发明实施例一种水体水质预测方法中建立目标自编码器的流程图;
图7为根据本发明实施例一种水体水质预测方法中构建初始融合模型的流程图;
图8为本发明实施例另一种水体水质预测方法的流程图;
图9为本发明实施例一种水体水质预测系统的结构示意图;
图10为本发明实施例一种水体水质预测装置的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
作为本发明实施例的一个方面,本实施例提供一种水体水质预测方法,参考图1,为本发明实施例一种水体水质预测方法的流程图,包括:
S1,分别对目标水体的水质参数和对应的气象参数进行缺失数据处理和归一化处理,获取标准气象参数和标准水质参数。
可以理解为,在机器学习领域中,常存在数据量纲不统一或缺失数据的情况。本发明实施例采取删除缺失值或插值的方式处理缺失数据,而为了消除各指标参数之间的量纲影响,本发明实施例进行数据的归一化处理。具体操作是使预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而减小奇异样本数据导致的不良影响。
因此,对于待预测水质指标的目标水体,预先采集该水体的水质参数,同时获取水质参数获取时刻的气象参数。其中应当理解的是,的水质参数和气象参数可以是一个或者多个不同维度的参数。本步骤则首先对采集到的多组水质参数和对应的气象参数进行删除缺失值或插值的缺失数据处理,然后对经缺失数据处理后的数据进行归一化处理,消除不同参数间的量纲不统一问题,获取无量纲的标准气象参数和标准水质参数。
数据的归一化能够加快梯度下降求最优解的速度,即模型训练的速度,并且有可能提高预测准确度。
其中,在数据的选取方面,气象因素考虑大气压、大气温度和湿度等,水质参数考虑水温、溶解氧、pH值、氨氮含量、亚硝酸盐和硝酸盐含量等。应当理解的是,本发明实施例中可以选取上述气象参数和水质参数中的一种或多种,将气象因素添加到水质预测的自变量中,与原有水质参数一起训练。
S2,基于标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取目标水体的预测水质指标;其中,自编码器与长短时记忆网络融合预测模型为,预先利用目标水体的标准样本水质参数和对应的标准样本气象参数,依次对构建的初始自编码器和初始长短时记忆网络模型进行训练获取的。
可以理解为,在根据上述步骤获取目标水体的标准气象参数和标准水质参数后,利用该标准气象参数和标准水质参数,输入预先建立并训练的自编码器与长短时记忆网络融合预测模型,经过自编码器与长短时记忆网络融合预测模型的内部运算,获取目标水体的预测水质指标。
其中,上述自编码器与长短时记忆网络融合预测模型的其中一种获取流程包括:事先通过模型初始化设定,分别得到初始自编码器和初始长短时记忆网络模型;同时,通过采集目标水体历史时间的多组水质参数及气象参数,并对采集的数据进行与步骤S1中相同的缺失数据处理和归一化处理,得到多组标准样本水质参数和对应的标准样本气象参数;再利用这些标准样本水质参数和对应的标准样本气象参数,首先训练建立的初始自编码器,在获得理想自编码器模型的基础上,通过融合初始长短时记忆网络模型,再对初始长短时记忆网络模型进行训练,最终获取预测精度满足设定条件的融合模型,作为最终的自编码器与长短时记忆网络融合预测模型。
本发明实施例提供的一种水体水质预测方法,通过融合自编码器和长短时记忆网络,利用长短时记忆网络记忆长时间序列数据的能力,学习数据的时序特征和时间累积效应,同时利用自编码器挖掘数据中的隐含信息,改进长短时记忆网络不容易记住最近数据的不足,能够有效挖掘水体参数多变量之间的相互作用关系,从而对水体水质进行有效预测,揭示水质因子变化的关键规律。
进一步的,在S2的步骤之前,方法还包括如图2所示的处理流程,为根据本发明实施例一种水体水质预测方法中构建融合预测模型的流程图,包括:
S01,分别对目标水体的多组样本水质参数,以及数据采集时刻的样本气象参数,进行缺失数据处理和归一化处理,获取多组标准样本水质参数和对应的标准样本气象参数。
可以理解为,在利用融合预测模型对目标水体的水质进行预测之前,先要利用确定的样本数据对融合预测模型进行训练,以得到可靠的预测结果。因此,事先对目标水体的实际水质参数和对应的气象参数进行采集,获取多组样本水质参数和样本气象参数。与上述实施例同理,为了消除数据量纲不统一和缺失数据的问题,对采集的样本水质参数和样本气象参数进行缺失数据处理和归一化处理,获取对应的多组标准样本水质参数和标准样本气象参数。
S02,基于标准样本水质参数和对应的标准样本气象参数,构建初始自编码器,并利用各组标准样本水质参数和对应的标准样本气象参数,对初始自编码器进行迭代训练,获取基于水质参数和气象参数的特征表示,并确定目标自编码器。
可以理解为,自编码器是一种无监督预训练网络,如图3所示,为本发明实施例一种自编码器的结构示意图。自编码器由三层神经网络组成,分别是输入层、隐含层(编码层)和解码层。自动编码器通过虚构一个x->h->x的三层网络,能够学习出一种特征变换h=f(Wx+b),输入x首先通过编码映射为h,之后h通过解码映射为使输出接近于输入x。
标准样本水质参数和对应的标准样本气象参数是成组出现的,一组数据的维数决定了初始自编码器的输入层神经元个数。同时,考虑到精确度因素和实际需求,初始化初始自编码器的结构和网络参数,获取初始自编码器。
然后,利用各组标准样本水质参数和对应的标准样本气象参数,对初始化完成的初始自编码器进行逐步训练,逐步修正初始自编码器的参数。在获取理想网络参数的基础上,确定基于水质参数和气象参数的特征表示以及目标自编码器。
自编码器通过限制隐含层的个数来学到有用的特征,能够表征非线性变换,从而学习到数据中的隐藏特征。一般只需要表征特征的函数h,因为它是在尽量不损失信息量的情况下,对原始数据的另一种表达。其中,当训练结束后,将输出层去掉。
其中可选的,初始自编码器具体为初始稀疏自编码器;相应的,目标自编码器具体为目标稀疏自编码器。
可以理解为,在上述实施例的基础上,可以对隐含单元施加稀疏性限制产生自编码器的变体——稀疏自编码器。稀疏自编码器(Sparse Autoencoder)可以自动从无标注数据中学习特征,可以给出比原始数据更好的特征描述。如果特征之间存在一定的相关性,稀疏自编码器会发现这些相关性。在实际运用时如果可以用稀疏编码器发现的特征取代原始数据。其具体原理是限制神经元在大多数时间下都是不激活的,使用多维且稀疏的特征取代原始数据。
S03,基于目标自编码器,构建初始长短时记忆网络模型,并将目标自编码器和初始长短时记忆网络模型进行模型融合,获取初始融合模型。
可以理解为,自编码器通过限制隐含层的个数来学到有用的特征,能够表征非线性变换,从而学习到数据中的隐藏特征,适合用于逐层预训练,可将其作为基本层用于构建深度学习网络,如本发明实施例的长短时记忆网络模型(LSTM)。
LSTM是一种改进的循环神经网络,通过选择性地记住或遗忘一些数据,解决传统循环神经网络存在的梯度弥散问题,从而拥有较长的短期记忆能力。主要思路是网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐含层的输入由当前时刻的输入和上一时刻隐含层的输出共同组成。在很多方面,如语言模型与文本生成、机器翻译、语音识别及图像描述生成等,LSTM都表现出优良的功用。
如图4所示,为本发明实施例一种长短时记忆网络模型的结构示意图,可见,LSTM网络具有重复模块链的形式,每个重复模块包含四个交互层。LSTM的关键是单元(cell)状态,即图上方的水平线(从Ct-1到Ct)。单元状态有点像传送带,直接贯穿整个链条运行,只有一些较小的线性交互作用。信息很容易在上面以不变的状态保持流动。
因此,首先根据训练完成的目标自编码器,以及实际应用需求,初始化网络结构和网络参数,获取初始长短时记忆网络模型。在进行模型融合时,考虑到自编码器是通过隐含层体现学习到的输入数据间的隐藏特征,将训练完成的目标自编码器的隐含层神经元激活值输入到长短时记忆网络模型,获取初始融合模型。
S04,利用标准样本水质参数和对应的标准样本气象参数,对初始融合模型进行迭代训练,获取目标长短时记忆网络模型参数,并确定自编码器与长短时记忆网络融合预测模型。
可以理解为,在根据上述步骤对目标自编码器和初始长短时记忆网络模型进行模型融合后,需要对初始融合模型进行训练,以获取较优的长短时记忆网络模型参数,从而获取更可靠的预测输出。具体将标准样本水质参数和对应的标准样本气象参数输入到融合模型的输入端,即目标自编码器的输入端,通过训练数据的前向计算和误差数据反向传播,对长短时记忆网络模型的参数逐步进行修正,直至获取理想的网络参数,作为目标长短时记忆网络模型参数,并根据目标长短时记忆网络模型参数,确定最终的自编码器与长短时记忆网络融合预测模型。
其中可选的,S04的进一步处理步骤参考图5,为根据本发明实施例一种水体水质预测方法中训练融合预测模型的流程图,包括:
S041,将标准样本水质参数和对应的标准样本气象参数输入初始融合模型,并利用基于水质参数和气象参数的特征表示,计算目标自编码器的隐含层激活值。
可以理解为,根据上述实施例,目标自编码器是已经训练完成的模型,在对融合模型进行训练时,将标准样本水质参数和对应的标准样本气象参数输入至目标自编码器的输入端,以获取各输入数据之间的隐含特征,即基于水质参数和气象参数的特征表示。因此,本步骤根据输入的标准样本水质参数和对应的标准样本气象参数,利用基于水质参数和气象参数的特征表示,计算所得的结果实际上为目标自编码器的隐含层激活值。
S042,将目标自编码器的隐含层激活值输入初始长短时记忆网络模型,并采用前向批量随机梯度下降算法和误差反向传播修正算法,对初始长短时记忆网络模型进行训练,获取目标长短时记忆网络模型参数,并基于目标自编码器和目标长短时记忆网络模型参数,获取自编码器与长短时记忆网络融合预测模型。
可以理解为,在利用目标自编码器获取隐含层激活值,即各输入数据之间的隐含特征之后,各输入数据之间的隐含特征作为初始长短时记忆网络模型的训练输入数据,对初始长短时记忆网络模型进行训练。具体采用前向批量随机梯度下降算法和误差反向传播修正算法,对初始长短时记忆网络模型进行训练,获取理想的网络模型参数,即目标长短时记忆网络模型参数。然后根据确定的目标自编码器和目标长短时记忆网络模型参数,确定最终融合预测模型,即自编码器与长短时记忆网络融合预测模型。
本发明实施例提供的一种水体水质预测方法,通过对长短时记忆网络模型采用批量随机梯度下降算法进行训练,既考虑到了网络的训练速度,也考虑到了准确度,能够实现水质参数的快速、精准预测。
其中,在一个实施例中,步骤S02中利用各组标准样本水质参数和对应的标准样本气象参数,对初始自编码器进行迭代训练,获取基于水质参数和气象参数的特征表示,并确定目标自编码器的进一步处理步骤参考图6,为根据本发明实施例一种水体水质预测方法中建立目标自编码器的流程图,包括:
S021,将标准样本水质参数和对应的标准样本气象参数输入初始稀疏自编码器,进行前向计算,获取损失函数。
可以理解为,在进行初始稀疏自编码器的训练时,首先进行原始训练数据的前向传播计算。即,利用标准样本水质参数和对应的标准样本气象参数xk训练稀疏自编码器,通过前向计算,获取预测值,并根据预测值与样本标准值,计算损失函数。
S022,基于初始稀疏自编码器的各隐含层激活输出,定义稀疏性参数。
可以理解为,定义表示为给定一个特定的输入x时,稀疏自编码器中隐含单元j的激活值。激活函数一般为sigmoid,sigmoid函数的输出值在[0,1]之间,0代表抑制,1代表激活。定义稀疏性参数为隐含单元j在训练集上的平均激活值,约束如下式所示:
式中,ρ表示稀疏性参数,取值为一个比较接近0的数,如0.05;N表示输入层的神经元个数。
S023,在损失函数中加入惩罚因子,并利用稀疏性参数,对包含惩罚因子的损失函数进行稀疏性调整。
可以理解为,KL散度作为惩罚项添加到损失函数,指导整个网络学习出稀疏的特征表达。稀疏的过程主要是利用惩罚因子来对高维数据进行“剔除”,让该起作用的神经元起作用。KL散度的特性在于越接近ρ则KL越小,用于惩罚那些偏离太多的使在训练过程中越来越接近ρ,如下式所示:
上式也可以写作:
因此,稀疏自编码器的损失函数为:
式中,β表示控制稀疏惩罚项的权重,J(W,b)表示1/2平方误差代价函数,包含权值衰减项,W和b分别表示输入层到隐藏层的连接权重和偏置,M表示隐含层的神经元个数。
S024,利用误差数据的反向传播,通过对稀疏性调整后的损失函数的最小化运算,获取反向修正的网络参数。
可以理解为,对自编码器的训练目标是最小化上述目标损失函数Jsparse(W,b)。通过求取调整后的目标损失函数的各偏导数,对目标损失函数求取最小化过程的网络修正参数。添加KL散度后的损失函数的偏导数计算如下:
式中,δ是误差项。从而:
根据新的偏导数,采用反向传播来优化整个神经网络:
式中,α表示学习率,Wij表示输入层第i个神经元与隐含层第j个神经元连接的权重,bi表示偏置。
S025,根据反向修正的网络参数,获取基于水质参数和气象参数的特征表示,并确定目标自编码器。
可以理解为,在获取理想的网络参数,即反向修正的网络参数之后,则可以根据该理想参数获取基于水质参数和气象参数的特征表示以及目标自编码器。
其中,在另一个实施例中,S03的进一步处理步骤参考图7,为根据本发明实施例一种水体水质预测方法中构建初始融合模型的流程图,包括:
S031,基于目标自编码器的隐含层神经元个数和水质指标的维数,确定网络模型的输入和输出,并初始化设定网络模型参数,获取初始长短时记忆网络模型。
可以理解为,本步骤为初始长短时记忆网络模型的建立,考虑到以目标自编码器的隐含层神经元输出作为长短时记忆网络模型的输入,且需要预测的水质参数维数也是确定的,则据此可确定长短时记忆网络模型的输入输出神经元个数及初始网络模型结构。再根据精确度需求和实际数据处理功能,初始化网络模型参数。则初始网络模型结构和初始化的网络模型参数即可确定初始长短时记忆网络模型。
S032,按照设定变换系数,将目标自编码器的各隐含层神经元激活值输出至初始长短时记忆网络模型的对应输入层神经元,进行模型融合,获取初始融合模型。
可以理解为,本步骤进行两个子模型的融合,根据预先设定的设定变换系数,将目标自编码器的各隐含层神经元连接至初始长短时记忆网络模型的对应输入层神经元,并进行相关参数设定,获取融合而成的初始融合模型。
其中,在上述实施例的基础上,方法还包括:在初始长短时记忆网络模型的设定门限处增加窥视孔连接,用以使设定门限可读取对应的单元状态。
可以理解为,LSTM通过内部设计的“门”结构来给单元状态去除或增加信息。门让信息选择性通过,由一个Sigmoid神经网络层和一个逐点乘法运算(pointwise)组成。Sigmoid层输出0到1之间的数字,描述每个门允许信息通过的程度。0代表“不许任何信息通过”,而1代表“让所有信息通过”。
LSTM有三个门,即输入门、输出门和遗忘门用于保护和控制单元状态。选择性地为部分门限增加窥视孔连接(如图中三个Sigmoid层与单元状态之间的连接线),意味着让“门”也看到单元状态(读取Ct的值),可以增强LSTM的性能。在没有任何短期训练样本的帮助下,增加窥视孔连接的LSTM网络可以从50或49个离散时间步骤中分离出序列之间的细微差别。
本发明实施例提供的一种水体水质预测方法,通过加入窥视孔(peepholes)结构改进传统的LSTM网络。有助于LSTM学习产生非常稳定的高度非线性的序列。
其中,在一个实施例中,步骤S2中预测水质指标具体为标准化的预测水质指标;则在上述实施例的基础上,在S2的步骤之后,方法还包括:对标准化的预测水质指标进行反归一化处理,并根据预先设定,选择反归一化处理后预测水质指标中的一个或多个维度进行输出。
可以理解为,在根据上述实施例进行水体水质预测时,预测模型输出的是标准化的水质参数数据,该数据无量纲,需经过反归一化处理,得到有量纲的实际水质预测数据。然后,可以选择输出水质参数(水温、溶解氧、pH值、氨氮含量、亚硝酸盐、硝酸盐含量)中单一指标预测值或多个指标预测值同时输出,从而实现对水体环境更全面的预测和分析。
本发明实施例提供的一种水体水质预测方法,通过采取单变量输出和多变量输出相结合的方式,可以选择输出的待预测变量为多个,从而实现对水体化境更全面的预测和分析。
为进一步说明本发明的技术方案,提供以下优化的处理流程,但不对本发明的保护范围进行限制。
如图8所示,为本发明实施例另一种水体水质预测方法的流程图,包括:
对输入的水质参数数据和气象参数数据进行数据的预处理,包括删除缺失值和归一化处理。
从预处理后的数据中选取一部分作为训练样本,另一部分作为测试样本。先利用稀疏自编码器(SAE)对输入的训练样本进行计算,即将标准化的数据输入稀疏自编码网络中进行预训练,并通过反向传播误差进行迭代修正。
将上一步学到的隐藏层的激活值输入到长短时记忆网络中,采用批量随机梯度下降和反向传播误差的方式训练,设定预测步长,输出预测值。将真实值与预测值进行比较,计算是否满足迭代条件,迭代条件为误差下降到一定程度或达到迭代次数。
其中,LSTM中信息流通的步骤如下:
1)通过遗忘门来决定从单元状态中丢弃哪些信息。遗忘门读取ht-1,xt和Ct-1,为Ct-1中的每一个数输出一个0到1之间的数。1表示“完全保留”,0表示“完全舍弃”。在每一个时刻t,xt是当前时刻的输入ht-1是上一时刻隐含层的输出,因为增加了窥视孔连接,也需要读取上一时刻的单元状态Ct-1。利用下式求取遗忘门的输出:
ft=σ(Wf·[Ct-1,ht-1,xt]+bf);
式中,ft表示遗忘门的输出,σ表示Sigmoid函数的简称,Wf和bf分别表示遗忘门的权重和偏置。
2)决定在单元状态中存储哪些新信息。包含两个部分:首先,输入门的Sigmoid层来调节需要添加到单元状态的值,其作用就是作为一个滤波器过滤来自ht-1和xt的信息。然后,tanh层创建一个包含所有候选值的向量它可以被添加到单元状态中,输出值为-1到1。分别根据下式,计算输入门的输出和包含所有候选值的向量:
it=σ(Wi·[Ct-1,ht-1,xt]+bi);
式中,it表示输入门的输出,Wi和bi分别是输入门的权重和偏置,表示包含所有候选值的向量,WC和bC分别表示单元状态的权重和偏置。
3)更新旧的单元状态,即Ct-1更新为Ct。将旧的状态与ft相乘,忘记(丢弃)之前决定忘记的信息。然后加上即决定记住的新的信息。在完成上述步骤后,我们基本上确保了添加到单元状态的信息都是重要的,且不是冗余的。表示如下:
其中,Ct表示当前时刻的单元状态。
4)决定输出值。输出的是单元状态经过筛选之后的信息。首先,运行一个Sigmoid层,它决定了单元状态的哪些部分需要输出。然后通过tanh层使单元状态的值处于-1到1之间,并将其与Sigmoid层的输出相乘。输出门的输出和当前时刻隐含层的输出表示如下:
ot=σ(Wo·[Ct,ht-1,xt]+bo);
ht=ot·tanh(Ct);
式中,ot表示输出门的输出,Wo和bo分别表示输出门的权重和偏置,ht表示当前时刻隐含层的输出。
然后,通过上述步骤训练模型后,再将测试样本输入到训练好的模型中,输出预测值,并对输出值进行反归一化。
最后,通过选择输出水质参数(水温、溶解氧、pH值、氨氮含量、亚硝酸盐、硝酸盐含量)中单一指标预测值或多个指标预测值同时输出,从而实现对水体环境更全面的预测和分析。
作为本发明实施例的另一个方面,本实施例提供一种水体水质预测系统,参考图9,为本发明实施例一种水体水质预测系统的结构示意图,包括:数据预处理模块1和水质预测模块2。其中,
数据预处理模块1用于分别对目标水体的多组水质参数和对应的气象参数进行缺失数据处理和归一化处理,获取标准气象参数和标准水质参数;水质预测模块2用于基于标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取目标水体的预测水质指标;其中,自编码器与长短时记忆网络融合预测模型为,预先利用目标水体的标准样本水质参数和对应的标准样本气象参数,依次对构建的初始自编码器和初始长短时记忆网络模型进行训练获取的。
可以理解为,在机器学习领域中,常存在数据量纲不统一或缺失数据的情况。本实施例通过设置数据预处理模块1,采取删除缺失值或插值的方式处理缺失数据。而为了消除各指标参数之间的量纲影响,数据预处理模块1还进行数据的归一化处理,具体操作是使预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而减小奇异样本数据导致的不良影响。
因此,对于待预测水质指标的目标水体,会预先采集该水体的水质参数,同时获取水质参数获取时刻的气象参数。其中应当理解的是,的水质参数和气象参数可以是一个或者多个不同维度的参数。数据预处理模块1首先对采集到的多组水质参数和对应的气象参数进行删除缺失值或插值的缺失数据处理,然后对经缺失数据处理后的数据进行归一化处理,消除不同参数间的量纲不统一问题,获取无量纲的标准气象参数和标准水质参数。
数据的归一化能够加快梯度下降求最优解的速度,即模型训练的速度,并且有可能提高预测准确度。
其中,在数据的选取方面,气象因素考虑大气压、大气温度和湿度等,水质参数考虑水温、溶解氧、pH值、氨氮含量、亚硝酸盐和硝酸盐含量等。应当理解的是,本发明实施例中可以选取上述气象参数和水质参数中的一种或多种,将气象因素添加到水质预测的自变量中,与原有水质参数一起训练。
同时,本实施例还在预测系统中设置水质预测模块2。水质预测模块2将目标水体的标准气象参数和标准水质参数输入预先建立并训练的自编码器与长短时记忆网络融合预测模型,经过自编码器与长短时记忆网络融合预测模型的内部运算,获取目标水体的预测水质指标。
其中,上述自编码器与长短时记忆网络融合预测模型的其中一种获取流程包括:事先通过模型初始化设定,分别得到初始自编码器和初始长短时记忆网络模型;同时,通过采集目标水体历史时间的多组水质参数及气象参数,并对采集的数据进行与步骤S1中相同的缺失数据处理和归一化处理,得到多组标准样本水质参数和对应的标准样本气象参数;再利用这些标准样本水质参数和对应的标准样本气象参数,首先训练建立的初始自编码器,在获得理想自编码器模型的基础上,通过融合初始长短时记忆网络模型,再对初始长短时记忆网络模型进行训练,最终获取预测精度满足设定条件的融合模型,作为最终的自编码器与长短时记忆网络融合预测模型。
应当理解的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例提供的一种水体水质预测系统,通过在预测系统中设置相应的功能模块,融合自编码器和长短时记忆网络,利用长短时记忆网络记忆长时间序列数据的能力,学习数据的时序特征和时间累积效应,同时利用自编码器挖掘数据中的隐含信息,改进长短时记忆网络不容易记住最近数据的不足,能够有效挖掘水体参数多变量之间的相互作用关系,从而对水体水质进行有效预测,揭示水质因子变化的关键规律。
作为本发明实施例的又一个方面,本实施例提供一种水体水质预测装置,参考图10,为本发明实施例一种水体水质预测装置的结构框图,包括:至少一个存储器1001、至少一个处理器1002、通信接口1003和总线1004。
其中,存储器1001、处理器1002和通信接口1003通过总线1004完成相互间的通信,通信接口1003用于预测装置与水质参数及气象参数获取或存储设备之间的信息传输;存储器1001中存储有可在处理器1002上运行的计算机程序,处理器1002执行计算机程序时实现如上述实施例的水体水质预测方法。
可以理解为,的水体水质预测装置中至少包含存储器1001、处理器1002、通信接口1003和总线1004,且存储器1001、处理器1002和通信接口1003通过总线1004形成相互之间的通信连接,并可完成相互间的通信。
通信接口1003实现水体水质预测装置与水质参数及气象参数获取或存储设备之间的通信连接,并可完成相互间信息传输,如通过通信接口1003实现对水质参数及气象参数获取等。
水体水质预测装置运行时,处理器1002调用存储器1001中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:基于标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取目标水体的预测水质指标;以及在初始长短时记忆网络模型的设定门限处增加窥视孔连接,用以使设定门限可读取对应的单元状态等。
本发明另一个实施例中,提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行如上述实施例的水体水质预测方法。
可以理解为,上述的存储器1001中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。或者,实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的水体水质预测装置的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,既可以位于一个地方,或者也可以分布到不同网络单元上。可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上实施方式的描述,本领域的技术人员可以清楚地了解,各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令,用以使得一台计算机设备(如个人计算机,服务器,或者网络设备等)执行上述各方法实施例或者方法实施例的某些部分的方法。
本发明实施例提供的一种水体水质预测装置和一种非暂态计算机可读存储介质,通过融合自编码器和长短时记忆网络,利用长短时记忆网络记忆长时间序列数据的能力,学习数据的时序特征和时间累积效应,同时利用自编码器挖掘数据中的隐含信息,改进长短时记忆网络不容易记住最近数据的不足,能够有效挖掘水体参数多变量之间的相互作用关系,从而对水体水质进行有效预测,揭示水质因子变化的关键规律。
应当理解的是,尽管本发明实施例主要描述了气象参数+水质参数的数据模式,进行目标水体的水质预测。事实上,本发明实施例的方案同样适用于其它形式的数据组合模式,如水质参数自变量+其它可能影响水质参数的环境因素,此处其它可能影响水质参数的环境因素如:水环境生物多样性、人工干预及光照等。
综上而言,本发明实施例提供的一种水体水质预测方法、系统及装置,能够实现对混沌非线性水质数据时间序列的预测,改变传统只能预测单一指标的方法,变为多指标的预测值同时输出,有利于实现对水体化境更全面的预测和分析。提升预测的准确度,同时提升预测的时间步长,即能预测到更远的水质状态,从而可以为水质管理人员提前预警,有利于经济损失的挽回和对生态环境的保护。
另外,本领域内的技术人员应当理解的是,在本发明的申请文件中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明的说明书中,说明了大量具体细节。然而应当理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。
然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种水体水质预测方法,其特征在于,包括:
分别对目标水体的水质参数和对应的气象参数进行缺失数据处理和归一化处理,获取标准气象参数和标准水质参数;
基于所述标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取所述目标水体的预测水质指标;
其中,所述自编码器与长短时记忆网络融合预测模型为,预先利用所述目标水体的标准样本水质参数和对应的标准样本气象参数,依次对构建的初始自编码器和初始长短时记忆网络模型进行训练获取的。
2.根据权利要求1所述的方法,其特征在于,在所述基于所述标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取所述目标水体的预测水质指标的步骤之前,还包括:
分别对所述目标水体的多组样本水质参数,以及数据采集时刻的样本气象参数,进行缺失数据处理和归一化处理,获取多组所述标准样本水质参数和对应的所述标准样本气象参数;
基于所述标准样本水质参数和对应的所述标准样本气象参数,构建所述初始自编码器,并利用各组所述标准样本水质参数和对应的所述标准样本气象参数,对所述初始自编码器进行迭代训练,获取基于水质参数和气象参数的特征表示,并确定目标自编码器;
基于所述目标自编码器,构建所述初始长短时记忆网络模型,并将所述目标自编码器和所述初始长短时记忆网络模型进行模型融合,获取初始融合模型;
利用所述标准样本水质参数和对应的所述标准样本气象参数,对所述初始融合模型进行迭代训练,获取目标长短时记忆网络模型参数,并确定所述自编码器与长短时记忆网络融合预测模型。
3.根据权利要求2所述的方法,其特征在于,所述初始自编码器具体为初始稀疏自编码器;
相应的,所述目标自编码器具体为目标稀疏自编码器。
4.根据权利要求3所述的方法,其特征在于,所述利用各组所述标准样本水质参数和对应的所述标准样本气象参数,对所述初始自编码器进行迭代训练,获取基于水质参数和气象参数的特征表示,并确定目标自编码器的步骤进一步包括:
将所述标准样本水质参数和对应的所述标准样本气象参数输入所述初始稀疏自编码器,进行前向计算,获取损失函数;
基于所述初始稀疏自编码器的各隐含层激活输出,定义稀疏性参数;
在所述损失函数中加入惩罚因子,并利用所述稀疏性参数,对包含惩罚因子的损失函数进行稀疏性调整;
利用误差数据的反向传播,通过对所述稀疏性调整后的损失函数的最小化运算,获取反向修正的网络参数;
根据所述反向修正的网络参数,获取所述基于水质参数和气象参数的特征表示,并确定所述目标自编码器。
5.根据权利要求2所述的方法,其特征在于,所述基于所述目标自编码器,构建所述初始长短时记忆网络模型,并将所述目标自编码器和所述初始长短时记忆网络模型进行模型融合,获取初始融合模型的步骤进一步包括:
基于所述目标自编码器的隐含层神经元个数和所述水质指标的维数,确定网络模型的输入和输出,并初始化设定网络模型参数,获取所述初始长短时记忆网络模型;
按照设定变换系数,将所述目标自编码器的各隐含层神经元激活值输出至所述初始长短时记忆网络模型的对应输入层神经元,进行模型融合,获取所述初始融合模型。
6.根据权利要求5所述的方法,其特征在于,还包括:
在所述初始长短时记忆网络模型的设定门限处增加窥视孔连接,用以使所述设定门限可读取对应的单元状态。
7.根据权利要求2所述的方法,其特征在于,所述利用所述标准样本水质参数和对应的所述标准样本气象参数,对所述初始融合模型进行迭代训练,获取目标长短时记忆网络模型参数,并确定所述自编码器与长短时记忆网络融合预测模型的步骤进一步包括:
将所述标准样本水质参数和对应的所述标准样本气象参数输入所述初始融合模型,并利用所述基于水质参数和气象参数的特征表示,计算所述目标自编码器的隐含层激活值;
将所述目标自编码器的隐含层激活值输入所述初始长短时记忆网络模型,并采用前向批量随机梯度下降算法和误差反向传播修正算法,对所述初始长短时记忆网络模型进行训练,获取所述目标长短时记忆网络模型参数,并基于所述目标自编码器和所述目标长短时记忆网络模型参数,获取所述自编码器与长短时记忆网络融合预测模型。
8.根据权利要求1所述的方法,其特征在于,所述预测水质指标具体为标准化的预测水质指标;
在所述获取所述目标水体的预测水质指标的步骤之后,还包括:
对所述标准化的预测水质指标进行反归一化处理,并根据预先设定,选择反归一化处理后预测水质指标中的一个或多个维度进行输出。
9.一种水体水质预测系统,其特征在于,包括:
数据预处理模块,用于分别对目标水体的水质参数和对应的气象参数进行缺失数据处理和归一化处理,获取标准气象参数和标准水质参数;
水质预测模块,用于基于所述标准气象参数和标准水质参数,利用训练好的自编码器与长短时记忆网络融合预测模型,获取所述目标水体的预测水质指标;
其中,所述自编码器与长短时记忆网络融合预测模型为,预先利用所述目标水体的标准样本水质参数和对应的标准样本气象参数,依次对构建的初始自编码器和初始长短时记忆网络模型进行训练获取的。
10.一种水体水质预测装置,其特征在于,包括:至少一个存储器、至少一个处理器、通信接口和总线;
所述存储器、所述处理器和所述通信接口通过所述总线完成相互间的通信,所述通信接口用于所述预测装置与水质参数及气象参数获取或存储设备之间的信息传输;
所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至8中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810437486.3A CN108665100A (zh) | 2018-05-09 | 2018-05-09 | 一种水体水质预测方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810437486.3A CN108665100A (zh) | 2018-05-09 | 2018-05-09 | 一种水体水质预测方法、系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108665100A true CN108665100A (zh) | 2018-10-16 |
Family
ID=63778951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810437486.3A Pending CN108665100A (zh) | 2018-05-09 | 2018-05-09 | 一种水体水质预测方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108665100A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109558973A (zh) * | 2018-11-15 | 2019-04-02 | 深圳市环境科学研究院 | 一种水质与水生态一体化预警系统、控制设备和存储介质 |
CN110021165A (zh) * | 2019-03-18 | 2019-07-16 | 浙江工业大学 | 一种基于Autoencoder-LSTM融合模型的交通流预测方法 |
CN110163261A (zh) * | 2019-04-28 | 2019-08-23 | 平安科技(深圳)有限公司 | 不平衡数据分类模型训练方法、装置、设备及存储介质 |
CN110576336A (zh) * | 2019-09-11 | 2019-12-17 | 大连理工大学 | 基于ssae-lstm模型的深孔加工刀具磨损量监测方法 |
CN110619418A (zh) * | 2019-07-26 | 2019-12-27 | 重庆大学 | 一种基于混合模型组合算法的多特征水质预测方法 |
CN110852515A (zh) * | 2019-11-15 | 2020-02-28 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
CN111368975A (zh) * | 2020-02-25 | 2020-07-03 | 东北农业大学 | 一种猪舍内多环境因子动态变化预测方法 |
CN111693667A (zh) * | 2020-05-06 | 2020-09-22 | 杭州电子科技大学 | 一种基于门控递归阵列水质检测系统及方法 |
CN111882138A (zh) * | 2020-08-07 | 2020-11-03 | 中国农业大学 | 基于时空融合的水质预测方法、装置、设备及存储介质 |
CN112381292A (zh) * | 2020-11-13 | 2021-02-19 | 福州大学 | 一种顾及时空相关性和气象因素的河流水质预测方法 |
CN112485394A (zh) * | 2020-11-10 | 2021-03-12 | 浙江大学 | 一种基于稀疏自编码和极限学习机的水质软测量方法 |
CN112557307A (zh) * | 2020-12-09 | 2021-03-26 | 武汉新烽光电股份有限公司 | 天空地一体化湖库水质监测融合数据方法 |
CN112858619A (zh) * | 2021-03-03 | 2021-05-28 | 华南农业大学 | 一种对虾养殖水质的预测预警方法 |
CN116823067A (zh) * | 2023-08-29 | 2023-09-29 | 北控水务(中国)投资有限公司 | 管网水质清污状态的确定方法、装置及电子设备 |
CN116773762B (zh) * | 2023-06-28 | 2024-01-23 | 盐城师范学院 | 一种多相催化废水处理监测系统及方法 |
CN117993624A (zh) * | 2024-04-07 | 2024-05-07 | 广东工业大学 | 一种流域水生态环境承载力评估系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737288A (zh) * | 2012-06-20 | 2012-10-17 | 浙江大学 | 一种基于rbf神经网络参数自优化的水质多步预测方法 |
CN104007243B (zh) * | 2014-01-13 | 2016-01-06 | 上海市长宁区卫生局卫生监督所 | 应用反向传播神经网络模型评价游泳池水质的方法 |
CN105912790A (zh) * | 2016-04-15 | 2016-08-31 | 重庆大学 | 基于深度回归模型的遥感水质监测方法 |
CN107292383A (zh) * | 2017-07-06 | 2017-10-24 | 郑保宁 | 基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法 |
CN107688871A (zh) * | 2017-08-18 | 2018-02-13 | 中国农业大学 | 一种水质预测方法和装置 |
US20180082443A1 (en) * | 2016-09-21 | 2018-03-22 | Realize, Inc. | Anomaly detection in volumetric images |
-
2018
- 2018-05-09 CN CN201810437486.3A patent/CN108665100A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737288A (zh) * | 2012-06-20 | 2012-10-17 | 浙江大学 | 一种基于rbf神经网络参数自优化的水质多步预测方法 |
CN104007243B (zh) * | 2014-01-13 | 2016-01-06 | 上海市长宁区卫生局卫生监督所 | 应用反向传播神经网络模型评价游泳池水质的方法 |
CN105912790A (zh) * | 2016-04-15 | 2016-08-31 | 重庆大学 | 基于深度回归模型的遥感水质监测方法 |
US20180082443A1 (en) * | 2016-09-21 | 2018-03-22 | Realize, Inc. | Anomaly detection in volumetric images |
CN107292383A (zh) * | 2017-07-06 | 2017-10-24 | 郑保宁 | 基于深度学习算法与混合整数线性规划相结合的水质波动区间预测方法 |
CN107688871A (zh) * | 2017-08-18 | 2018-02-13 | 中国农业大学 | 一种水质预测方法和装置 |
Non-Patent Citations (2)
Title |
---|
ANDR´E GENSLER等: "Deep Learning for Solar Power Forecasting-An Approach Using Autoencoder and LSTM Neural Networks", 《2016 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN, AND CYBERNETICS (SMC)》 * |
王攀 等: "《优化与控制中的软计算方法研究》", 31 January 2017, 湖北科学技术出版社 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109558973A (zh) * | 2018-11-15 | 2019-04-02 | 深圳市环境科学研究院 | 一种水质与水生态一体化预警系统、控制设备和存储介质 |
CN110021165A (zh) * | 2019-03-18 | 2019-07-16 | 浙江工业大学 | 一种基于Autoencoder-LSTM融合模型的交通流预测方法 |
WO2020220544A1 (zh) * | 2019-04-28 | 2020-11-05 | 平安科技(深圳)有限公司 | 不平衡数据分类模型训练方法、装置、设备及存储介质 |
CN110163261A (zh) * | 2019-04-28 | 2019-08-23 | 平安科技(深圳)有限公司 | 不平衡数据分类模型训练方法、装置、设备及存储介质 |
CN110619418A (zh) * | 2019-07-26 | 2019-12-27 | 重庆大学 | 一种基于混合模型组合算法的多特征水质预测方法 |
CN110576336A (zh) * | 2019-09-11 | 2019-12-17 | 大连理工大学 | 基于ssae-lstm模型的深孔加工刀具磨损量监测方法 |
CN110852515A (zh) * | 2019-11-15 | 2020-02-28 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
CN110852515B (zh) * | 2019-11-15 | 2022-05-06 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
CN111368975A (zh) * | 2020-02-25 | 2020-07-03 | 东北农业大学 | 一种猪舍内多环境因子动态变化预测方法 |
CN111693667A (zh) * | 2020-05-06 | 2020-09-22 | 杭州电子科技大学 | 一种基于门控递归阵列水质检测系统及方法 |
CN111882138A (zh) * | 2020-08-07 | 2020-11-03 | 中国农业大学 | 基于时空融合的水质预测方法、装置、设备及存储介质 |
CN111882138B (zh) * | 2020-08-07 | 2024-02-23 | 中国农业大学 | 基于时空融合的水质预测方法、装置、设备及存储介质 |
CN112485394A (zh) * | 2020-11-10 | 2021-03-12 | 浙江大学 | 一种基于稀疏自编码和极限学习机的水质软测量方法 |
CN112381292A (zh) * | 2020-11-13 | 2021-02-19 | 福州大学 | 一种顾及时空相关性和气象因素的河流水质预测方法 |
CN112557307B (zh) * | 2020-12-09 | 2022-09-27 | 武汉新烽光电股份有限公司 | 天空地一体化湖库水质监测融合数据方法 |
CN112557307A (zh) * | 2020-12-09 | 2021-03-26 | 武汉新烽光电股份有限公司 | 天空地一体化湖库水质监测融合数据方法 |
CN112858619A (zh) * | 2021-03-03 | 2021-05-28 | 华南农业大学 | 一种对虾养殖水质的预测预警方法 |
CN116773762B (zh) * | 2023-06-28 | 2024-01-23 | 盐城师范学院 | 一种多相催化废水处理监测系统及方法 |
CN116823067A (zh) * | 2023-08-29 | 2023-09-29 | 北控水务(中国)投资有限公司 | 管网水质清污状态的确定方法、装置及电子设备 |
CN116823067B (zh) * | 2023-08-29 | 2023-12-19 | 北控水务(中国)投资有限公司 | 管网水质清污状态的确定方法、装置及电子设备 |
CN117993624A (zh) * | 2024-04-07 | 2024-05-07 | 广东工业大学 | 一种流域水生态环境承载力评估系统及方法 |
CN117993624B (zh) * | 2024-04-07 | 2024-06-25 | 广东工业大学 | 一种流域水生态环境承载力评估系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108665100A (zh) | 一种水体水质预测方法、系统及装置 | |
CN108710974B (zh) | 一种基于深度置信网络的水体氨氮预测方法及装置 | |
CN109060001B (zh) | 一种基于特征迁移学习的多工况过程软测量建模方法 | |
CN110852515B (zh) | 基于混合长短时记忆神经网络的水质指标预测方法 | |
CN112488415A (zh) | 基于经验模态分解和长短时记忆网络的电力负荷预测方法 | |
CN106022954B (zh) | 基于灰色关联度的多重bp神经网络负荷预测方法 | |
CN110083125B (zh) | 一种基于深度学习的机床热误差建模方法 | |
CN111260030A (zh) | 基于a-tcn电力负荷预测方法、装置、计算机设备及存储介质 | |
CN114004346B (zh) | 基于门控堆叠同构自编码器的软测量建模方法及存储介质 | |
CN108416460B (zh) | 基于多因素时序—随机深度置信网络模型的蓝藻水华预测方法 | |
CN110824914B (zh) | 一种基于pca-lstm网络的废水处理智能监控方法 | |
CN112215412B (zh) | 溶解氧预测方法及装置 | |
CN116884523B (zh) | 一种海洋牧场水质多参数预测方法 | |
CN116187203A (zh) | 一种流域水质预测方法、系统、电子设备及存储介质 | |
CN113435124A (zh) | 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 | |
CN116484747A (zh) | 一种基于自适应优化算法与深度学习的污水智能监控方法 | |
CN118132964B (zh) | 土壤空间温湿度预测方法、装置、设备、介质及程序产品 | |
CN115982141A (zh) | 一种针对时序数据预测的特征优化方法 | |
CN118312792A (zh) | 一种海洋浮标数据质量人工智能检测方法及系统 | |
CN114004433A (zh) | 一种养殖鱼类生长环境调控方法及装置 | |
CN117251705A (zh) | 一种每日天然气负荷预测方法 | |
CN115482877A (zh) | 一种基于时序图网络的发酵过程软测量建模方法 | |
CN114841412A (zh) | 一种海参生长水质中酸碱度的预测方法 | |
Miao et al. | A hybrid neural network and genetic algorithm model for predicting dissolved oxygen in an aquaculture pond | |
CN112215421A (zh) | 一种基于生成对抗网络的深度学习水质指标预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181016 |