CN113947009B - 基于柯西扰动麻雀优化的稀疏lstm滑坡动态预测方法 - Google Patents
基于柯西扰动麻雀优化的稀疏lstm滑坡动态预测方法 Download PDFInfo
- Publication number
- CN113947009B CN113947009B CN202111015764.4A CN202111015764A CN113947009B CN 113947009 B CN113947009 B CN 113947009B CN 202111015764 A CN202111015764 A CN 202111015764A CN 113947009 B CN113947009 B CN 113947009B
- Authority
- CN
- China
- Prior art keywords
- sparrow
- lstm
- value
- population
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000287127 Passeridae Species 0.000 title claims abstract description 283
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000005457 optimization Methods 0.000 title claims abstract description 37
- 238000006073 displacement reaction Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 25
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 210000005036 nerve Anatomy 0.000 claims abstract description 8
- 230000000739 chaotic effect Effects 0.000 claims description 39
- 238000012360 testing method Methods 0.000 claims description 26
- 238000009826 distribution Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 17
- 244000062645 predators Species 0.000 claims description 15
- 238000012795 verification Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 230000001537 neural effect Effects 0.000 claims description 10
- 235000013305 food Nutrition 0.000 claims description 9
- 230000002431 foraging effect Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000010845 search algorithm Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 7
- 239000002245 particle Substances 0.000 claims description 6
- 230000006698 induction Effects 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 235000015170 shellfish Nutrition 0.000 claims description 4
- 101100457838 Caenorhabditis elegans mod-1 gene Proteins 0.000 claims description 3
- 101150110972 ME1 gene Proteins 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 claims 2
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006403 short-term memory Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 101710154918 Trigger factor Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000003673 groundwater Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于滑坡预测技术领域,公开一种基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法。针对浅层滑坡易受降雨、库水位及自然环境等外部“小样本”因素影响,建立表示稀疏的LSTM模型,抽取致灾因素本质数据特征,降低弱滑坡致灾影响因素选择空间。其次,针对稀疏LSTM训练层级过深和计算复杂度高,设计SSA模型对LSTM中隐层神经单元数、学习率、批处理数、迭代次数四个超参数寻优;同时设计柯西扰动策略开发全局最优解区域,实现基于表示稀疏的LSTM网络结构紧致性优化,提升滑坡位移预测精度。本发明融合了小样本滑坡数据的稀疏表示能力、LSTM动态预测优势、CSSA算法对网络结构的紧致性优化,有效解决滑坡预测中小样本数据预测能力弱与计算复杂代价高昂问题。
Description
技术领域
本发明属于滑坡位移预测技术领域,尤其涉及一种基于柯西扰动麻雀(CauchySparrow Search Algorithm,CSSA)优化的稀疏LSTM滑坡动态预测方法。
背景技术
目前,滑坡是世界上最为频发也是最具破坏性的自然灾害之一,不仅危害人类的生命安全,还会对国家的经济建设、生存环境造成巨大的破坏。提高滑坡位移的预测技术对预防和减少滑坡造成的损失具有重要的现实意义。
滑坡受坡体自身地质条件及降雨、库水、地下水和人类工程活动等多种因素影响,表现出非常复杂的非线性演化特征,是一个十分复杂的非线性动态系统,其形成原因较复杂、影响因素较多、发生的随机性较强。近年来,随着人工智能技术日益革新并大量应用于滑坡灾害的预测,如极限学习机、机器学习、深度学习、群体智能优化等智能算法在非线性映射能力和高精度函数逼近等方面表现出优越性能。但从目前已发表的研究成果分析,现有的一些预测模型大多是基于静态模型的,或是将动态过程分阶段以静态模式进行处理,而基于动态模型的滑坡位移预测的研究成果尚不多见。黄土滑坡滑坡位移预测具有高度的非线性、动态性、随机性和复杂性等特点,因此滑坡位移预测的动态模型研究主要集中在:数据动态性和方法动态性。数据的动态性主要体现在坡体自身地质条件及降雨、库水、地下水、人类工程活动以及自然环境与外部气候等多种因素通过各类传感器所获取的多源异构数据,是研究滑坡位移预测的前提与基础;而方法的动态性则是指针对滑坡非线性演化特征的不同阶段,采用高性能智能计算处理,得到基于智能混合优化模型的滑坡位移动态预测模型,提高滑坡预测的时效性与鲁棒性。
现有的动态预测模型研究主要集中在长短时记忆神经网络(Long Short TermMemory,LSTM)。长短期记忆神经网络(LSTM)由于其门函数机制,具有“时间记忆块”结构,能够在一定程度上保持并传递历史信息。而降雨、库水等影响滑坡灾害的因素和滑坡的形变又存在着明显的滞后效应。利用长短期记忆网络的优势,在网络的隐含层中获取历史降雨和库水信息,可实现更加准确的形变预测。
与此同时,群体智能优化算法作为计算智能理论与方法的重要研究内容之一。而麻雀算法(Sparrow Search Algorithm,SSA)作为群体智能的一种新算法得到了众多学者的追捧。麻雀算法可以在没有集中控制并且缺少全局信息和模型的前提下,通过多特征融合与全局优化策略,为解决LSTM网络结构、层级优化以及随着网络层级加深,抽取到的滑坡致灾因素与冗余信息之间的自适应调整、降低误差积累提供新的解决思路与技术途径。
通过上述分析,现有技术存在的问题及缺陷为:
1、由于浅层滑坡面易受降雨、水库水位以及自然环境与气候等多个外部因素的影响,如何筛选有效滑坡诱发因素,尤其是对滑坡致灾的降水、水库水位等“小样本”因素的本质特征数据提取,剔除随机属性因素,是滑坡位移预测的首要难题。
2、在LSTM网络模型中,理论上层数越多层级越深的网络越能抽取到滑坡诱发因素的数据本质特征,网络表达能力与泛化能力越强,与此同时也会造成网络结构愈加复杂,结构空间呈指数级增长,并产生过拟合现象和计算复杂度高的代价难题。
3、麻雀搜索算法和其他群体智能算法一样,当其接近全局最优时,依旧会出现种群多样性减少、搜索能力不足、易于陷入局部极值的现象,从而导致收敛速度较慢、求解精度较低的问题。
解决以上问题及缺陷的难度为:①针对滑坡致灾因素的“小样本”数据预测难题,引入稀疏理论,如何进行“小样本”稀疏表示与构建合适的稀疏LSTM网络模型,剔除滑坡随机因素,进而实现基于稀疏表示的LSTM滑坡位移预测是具有挑战的;②LSTM模型包含许多设置参数,如果参数设置不当,随着网络层级的加深,在训练过程中会产生大量的冗余数据,无法抽取到滑坡致灾因素的本质数据特征,致使滑坡位移预测失效;③麻雀算法可以对LSTM网络模型进行优化,但由于LSTM网络模型中“小样本”数据训练的层级加深以及超参数设置需要大量试验取最优,使预测效果最佳,并且高复杂度模型参数过多预测速度则越慢,必然带来对高性能计算设备或服务器的需求,显然对于户外作业采用便携笔记本或移动设备进行滑坡位移预测是不现实的。此外,需要计算成本高昂所花费的时间代价对于滑坡位移预测问题也是不满足其时效性的。
解决以上问题及缺陷的意义为:将麻雀搜索算法(SSA)与长短时记忆神经网络(LSTM)模型相结合,构建基于柯西扰动麻雀优化的稀疏LSTM滑坡预测模型。面向浅层滑坡面易受降雨、水库水位以及自然环境与气候等外部诱发的“小样本”因素影响,建立基于表示稀疏的LSTM动态滑坡预测模型,有效降低弱滑坡致灾影响因素选择空间;设计SSA模型对LSTM模型中的超参数寻优,实现LSTM网络中隐层神经单元数、学习率、批处理数、迭代次数四个超参数的自适应调整与协同计算;同时设计柯西扰动策略开发全局最优解区域,实现基于表示稀疏的LSTM网络结构紧致性优化。该方法融合了小样本数据的稀疏表示能力、具有“记忆块”结构的LSTM长时学习网络模型、基于Tent混沌序列与柯西扰动策略的麻雀优化算法,增强了网络输入与输出的紧致性,提升了滑坡位移的预测精度和泛化能力。本发明的技术开展及其预期研究成果可为野外勘探实地滑坡位移预测提供有效的示范和指导作用,揭示触发因子滞后效应下的动态滑坡灾害体形变规律,理论意义显著,应用价值突出。
发明内容
针对现有技术存在的问题,本发明公开了一种基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法(CSSA-LSTM)。
本发明是这样实现的,一种基于柯西扰动麻雀优化的稀疏LSTM滑坡动态预测方法,所述方法包括以下步骤:
步骤一,针对浅层滑坡易受降雨、库水位及自然环境等外部“小样本”因素影响,建立表示稀疏的LSTM模型,抽取致灾因素本质数据特征,建立数据集。将数据集进行归一化处理,并按8:1:1比例划分为训练集、验证集和测试集;
步骤二,设计SSA模型对LSTM模型中的超参数寻优,实现LSTM网络中隐层神经单元数、学习率、批处理数、迭代次数四个超参数的协同计算与自适应调整;
步骤三,将SSA模型中的麻雀个体按照适应度大小进行排序,由此确定最好的麻雀位置和最坏的麻雀位置,并划分发现者和跟随者种群;其中最好的麻雀位置代表整个种群搜索到具有丰富食物的区域,为所有的加入者提供觅食的区域和方向;
步骤四,更新SSA模型中发现者、跟随着、预警者的位置,发现者负责为整个麻雀种群寻找食物并为所有跟随者提供觅食的方向;跟随者会根据发现者的位置获取食物;然后,更新种群中预警者的位置,当意识到危险时,群体边缘的麻雀会迅速向安全区域移动,以获得更好的位置;
步骤五,判断SSA模型中的麻雀个体是否陷入局部极值;若陷入局部极值,将柯西函数引入麻雀位置的更新中,借助柯西算子的变异能力,为算法在迭代寻优的过程中增强种群的多样性。并根据个体扰动前后的适应度,来判断是否更改麻雀个体的位置;若没有陷入局部极值,直接执行步骤六;
步骤六,判断SSA模型是否满足终止条件;若满足,则结合算法搜索的最佳超参数值构建最终的LSTM预测模型,然后用训练数据、验证数据迭代训练该模型,将训练好的迭代模型通过测试数据得到预测数据;若不满足终止条件,则返回步骤三。
进一步,步骤一中,针对浅层滑坡易受降雨、库水位及自然环境等外部“小样本”因素影响,建立表示稀疏的LSTM模型,抽取致灾因素本质数据特征,建立数据集,将数据集进行预处理,并按照8:1:1的比例划分为训练集、验证集、测试集;其中,所述数据集使用的是三峡水库地区白家堡滑坡的公开数据集,该数据集包括2007年1月到2018年10月之间每月的降雨量、每月的平均的水库水位、滑坡测试点每月的位移距离;以降雨量和水库水位作为诱发因子对滑坡位移进行预测。
所述对数据集的预处理是将数据集先进行归一化处理,再构建监督型数据;其中,所述归一化处理是用于消除歧义样本数据、减少模型的训练时间,通过公式(1)对数据进行归一化,将原数据映射到[0,1]之间。
其中,xn为经过归一化的值,xmax为最大值,xmin为最小值。
所述构建监督学习型数据是用于使用前面的时间步作为输入变量,下一个时间步作为输出变量,从而使输入变量和输出变量构成映射关系;在本模型中设置的时间步长TimeStep=3,构成三个输入变量和一个输出变量的映射关系,表示用三个月的数据预测一个月的数据。
构建具有“时间记忆块”的LSTM模型,其中LSTM是一种特殊的RNN结构,LSTM引入特殊的“门”结构,LSTM的神经单元由输入门、遗忘门、输出门和细胞单元构成。其中,所述遗忘门ft如公式(2)所示,用于决定上一时刻的细胞中有多少信息传递到当前时刻;所述输入门it如公式(3)所示,用于控制当前单元嵌入细胞状态的程度;所述记忆单元Ct如公式(5)所示,用于记录不同门结构情况下细胞的状态;所述输出门ht如公式(7)所示。
ft=σ[Wf*(Ct-1,ht-1,xt)+bf] (2)
it=σ[Wi*(Ct-1,ht-1,xt)+bi] (3)
Ot=σ[Wo*(Ct,ht,xt)+bo] (6)
ht=Ot*tanh(Ct) (7)
其中,Wf,Wi,Wc,Wo是各个门的权重,bf,bi,bc,bo是各个门的偏置项。
进一步,步骤二中,设计SSA模型对LSTM模型中的超参数寻优,实现LSTM网络中隐层神经单元数、学习率、批处理数、迭代次数四个超参数的自适应调整与协同计算,包括:
对SSA的参数进行设置,其中麻雀种群Pop_Size数量为20、最大迭代次数Max_iter为50、发现者pNum的数量为4(麻雀种群的20%);预警者sNum的数量为4(麻雀种群的20%)。
设置LSTM模型超参数的解空间。柯西变异的麻雀搜索算法对LSTM中隐层神经单元数、学习率、批处理数、迭代次数四个超参数设置解空间,其中ub={300,0.01,30,800}表示解空间的上限,lb={20,0.001,2,600}表示解空间的下限。
其中,所述ub和lb的每一维分别对应的是LSTM模型隐藏层神经单元、学习率、批处理数、迭代次数的上界和下界。
所述用Tent混沌序列初始化麻雀种群中每个麻雀的初始位置,包括:
(1)根据Tent映射随机性、便利性和规律性的特征,利用这些特征优化种群的初始位置,Tent混沌序列能够有效保持种群寻优的多样性。
Tent混沌映射的表达式如下:
Tent混沌映射通过贝努力移位变换后表示如下:
yi+1=(2yi)mod1 (9)
(2)对Tent混沌映射序列进行随机变异,改进后的Tent混沌映射表达式为:
改进后的Tent混沌映射通过贝努力移位变换的表达式为:
在公式(11)中,N代表的是产生混沌序列的总数,也就是麻雀种群中麻雀的个数,rand(0,1)代表的是[0,1]之间的随机数;
将生成的混沌序列载波到麻雀的求解空间中,公式如下:
xi=xlb+(xub-xlb)*yi (12)
其中,xi表示生成的第i个麻雀的初始位置。xub和xlb分别代表麻雀位置的上限和下限。
经过Tent混沌映射序列得到麻雀的初始位置之后,计算每个麻雀的适应度,包括:
1、将麻雀个体的空间位置解释为LSTM模型的超参数,优化LSTM模型。
2、用训练数据、验证数据迭代训练该模型,将训练好的迭代模型通过测试数据得到预测数据,计算预测值和真实值的均方根误差RMSE,用RMSE的值做为麻雀的适应度。均方根误差RMSE的计算公式如下:
式(13)中,N为预测值和真实值的个数,yi代表真实值,代表预测值。
进一步,步骤三中,所述将将麻雀个体按照适应度大小进行排序,包括:
在每一次迭代过程中将种群中每个麻雀适应度的值按照从小到大进行排序,因为RMSE作为麻雀的适应度,所以麻雀适应度的值越小代表麻雀的位置越好。选出排序过后的最小的麻雀适应度值BestF,最佳的麻雀位置BestX。选出排序过后最大的麻雀适应度值WorseF,最差的麻雀位置WorseX。
进一步,步骤四中,所述更新麻雀种群中的发现者的位置,包括:
发现者的数量占麻雀种群的20%,即为按照适应度值从小到大排序后的前4只麻雀作为发现者;R2的值是[0,1]之间的随机数,表示的是预警值;ST的值设置为0.8,表示的是安全值界限。位置更新公式如下:
其中,t为当前的迭代数,T为总的迭代次数,表示的是在第t次迭代中第i个麻雀的位置信息,α代表的是[0,1]之间的随机数。Q是服从正态分布的随机数,L表示的是1×d的矩阵,其中该矩阵内每个元素全部为1。
当R2<ST时,表明预警值小于安全值,意味着此时的觅食环境周围没有捕食者,发现者可以扩大自己的搜索范围。当R2≥ST时,表示预警值大于安全值,意味着此时种群中的麻雀已经发现了捕食者,并向其他麻雀发出警报,所有的麻雀必须迅速的飞到其它安全的地方。
所述更新麻雀种群中跟随者的位置,包括:
跟随者的数量占麻雀种群的80%,即为按照适应度值从小到大排序后的后32只麻雀作为跟随者。跟随着位置更新公式如下:
其中,n为麻雀种群的数量,Q是服从正态分布的随机数,表示的是在本次迭代中麻雀最差的位置,表示的是在本次迭代中麻雀做好的位置,A是一个1×d的矩阵,A+=AT(AAT)-1,该矩阵中每个元素的值随机为1或-1。
所述更新种群中预警者的位置,包括:
选取sNum只麻雀进行预警,预警者的数量sNum的值为麻雀种群的20%,共有四次麻雀进行预警,fi为在本次迭代中第i个麻雀的适应度,fg表示在本次迭代中最优的适应度值,fw表示在本次迭代中最差的适应度值。预警者位置更新公式如下:
其中,和分别代表在本次迭代中麻雀最好和最差的位置;β的值是服从均值为0,方差为1的正态分布随机数,表示步长的控制参数;K的值是[-1,1]之间的一个随机数,表示麻雀移动的方向,也是麻雀步长的控制参数;e是为了避免分母为0的情况出现,设置为一个极小的值。
当fi≠fg时,表明此时麻雀的位置处于种群的边缘,特别容易受到捕食者的攻击,迅速转移该麻雀的位置,并将该麻雀的位置转移到当前位置和最好位置之间的随机位置。
当fi=fg时,表明此时麻雀的位置处于种群的中间,在意识到捕食者威胁之后,及时向其他麻雀的位置靠拢来避免捕食者的攻击,将该麻雀的位置转移到当前位置和最差位置之间的随机位置。
进一步,步骤五中,所述判断SSA模型是否陷入局部极值,包括:
用群体适应度方差和当前得到的全局最优值来判断粒子是否进入了局部极值状态。群体适应度方差σ2的公式为如下:
f=max{1,max|fi-favg|} (17)
其中,f表示的是归一化因子,max|fi-favg|表示的是找出种群麻雀的适应度fi和种群麻雀平均适应度favg最大的差。
其中,N表示种群中麻雀的数量。σ2的大小表示麻雀的收敛状态,若σ2越小,表明麻雀的聚集程度越大,麻雀趋于收敛状态。
如果群体适应度方差等于零,且得到的最优解不是期望的最优解,则认定麻雀种群陷入局部最优。此时将柯西函数引入麻雀位置的更新中,借助柯西算子的变异能力,在算法迭代寻优的过程中增强种群的多样性。
柯西扰动的过程如下:
(1)使用公式(19)柯西分布产生一个随机值。
Cauchy(0,1)=tan((γ-0.5)×π) (19)
其中,Cauchy(0,1)表示柯西分布产生的随机值,γ表示为[0,1]之间的一个随机数。
(2)使用公式(20)对麻雀个体进行扰动。
其中,表示的是在第t次迭代时,用柯西扰动新生成的第i个麻雀个体。
(3)对新产生的麻雀个体进行边界判断,如果超出边界则就将值设置成边界值,如公式(21)所示。
其中,xub、xlb表示麻雀个体位置的上限值和下限值。
进一步,步骤六中,所述判断是否达到终止条件,包括:
所述终止条件设置如下:(1)是否达到了最大迭代次数;(2)得到期望的全局最优值;
若满足终止条件,将最终麻雀的最优位置解释为LSTM模型的超参数。在本发明中得到最优的适应度值为0.032,得到最优的麻雀位置为x={58,0.0019,8,703}。其中隐藏层单元为158,学习率为0.0019,批处理数为8,迭代次数为703。将这些超参数代入到LSTM模型中,构建完整的LSTM模型。然后用数据集中的训练集和测试集对模型进行训练和验证,最后用训练好的模型对测试集进行预测。
若不满足终止条件,则返回到步骤3。
本发明的另一目的在于提供一种基于柯西扰动麻雀优化的稀疏LSTM滑坡动态预测方法,所述滑坡位移方法包括:
数据集构建模块,用于将产生滑坡的相关因素构建成数据集,将数据集进行预处理,并按照8:1:1的比例划分为训练集、验证集和测试集;
LSTM模型构建模块,用于初步构建LSTM模型,确定预测模型的结构;
适应度计算模块,用于设置麻雀搜索算法的参数值,用Tent混沌序列初始化种群中麻雀个体的初始位置,并计算种群中麻雀个体的适应度;
适应度排序模块,用于对麻雀个体按照适应度进行排序,并选出最好的麻雀位置和最坏的麻雀位置;
位置更新模块,用于更新种群中发现者的位置,更新种群中跟随者的位置,同时更新种群中预警者的位置;
局部最优判断模块,用于判断是否陷入局部极值;若陷入局部极值,则对种群中的麻雀进行柯西扰动;否则执行终止条件判断模块;
终止条件判断模块,用于判断是否满足终止条件;若满足,则构建最终的LSTM预测模型,若不满足,则返回适应度排序模块。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
将产生滑坡的相关因素构建成数据集,将数据集进行预处理,并按照8:1:1的比例划分为训练集、验证集和测试集;初步构建LSTM模型,确定预测模型的结构;设置麻雀搜索算法的参数值,用Tent混沌序列初始化种群中麻雀个体的初始位置,并计算种群中麻雀个体的适应度;对麻雀个体按照适应度进行排序,并选出最好的麻雀位置和最坏的麻雀位置;
更新种群中发现者的位置,更新种群中跟随者的位置,同时更新种群中预警者的位置;判断是否陷入局部极值;若陷入局部极值,则对种群中的麻雀进行柯西扰动;否则执行终止条件判断;判断是否满足终止条件;若满足,则构建最终的LSTM预测模型,若不满足,则返回适应度排序。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的滑坡位移预测方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:针对浅层滑坡面易受降雨、水库水位以及自然环境与气候等外部诱发的“小样本”因素影响,引入稀疏理论,建立基于表示稀疏的LSTM网络模型,降低隐含层结点激活概率、去除随机影响因素,抽取致灾因素本质数据特征,有效降低弱滑坡致灾影响因素选择空间。其次,针对稀疏网络结构的LSTM模型训练层级过深,易产生过拟合和预测滑坡计算复杂度代价高昂问题,设计基于柯西扰动的麻雀优化模型;在该模型中,利用Tent混沌序列对麻雀种群初始化并计算适应度,提升麻雀种群的分布均匀性,通过麻雀算法对LSTM模型中隐层的神经单元数、学习率、批处理数、迭代次数四个超参数寻优,同时设计柯西扰动策略开发可能存在的全局最优解区域,提高种群多样性,进而实现基于表示稀疏的LSTM网络结构紧致性优化,提升滑坡位移预测精度,有效解决滑坡预测中小样本数据预测能力弱与计算复杂代价高昂问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的滑坡位移预测系统流程图。
图2是本发明实施例提供的滑坡位移预测模型图。
图3是本发明实施例提供的滑坡位移预测系统结构框图;
图中:1、数据集构建模块;2、LSTM模型构建模块;3、适应度计算模块;4、适应度排序模块;5、位置更新模块;6、局部最优判断模块;7、终止条件判断模块。
图4是本发明实施例提供的Tent混沌的粒子分布图。可以看出迭代一千次产生的Tent混沌粒子,在[0,1]的范围内呈现出均匀的分布,不会出现粒子在某一范围内聚集的现象,进而使得麻雀种群初始化个体的位置在解空间中的均匀性分布。
图5是本发明实施例提供的标准柯西分布图。可以看出柯西分布两端形状又长又扁,逼近与0的过程比较平缓。因此使用柯西变异扰动麻雀种群,能够产生差异较大的新个体,为麻雀种群增强多样性,有助于算法跳出局部极值。
图6是本发明实施例提供的LSTM神经网络的框架图。
图7是本发明实施例提供的LSTM模型的预测结果图。
图8是本发明实施例提供的SSA-LSTM模型的预测结果图。
图9是本发明实施例提供的CSSA-LSTM模型的预测结果图。
在图7-图9中,分别为LSTM、SSA-LSTM与本发明中CSSA-LSTM模型在相同测试集下的预测值与真实值的仿真结果,通过局部区域放大可以更加直观看出本发明方法与对比方法具有更加显著的预测性能。
图10是本发明实施例三种模型预测值误差的高斯拟合分布图。可以看出CSSA-LSTM模型的正态分布曲线的高峰距离直线x=0的位置最近,且陡峭程度最大。这两个特征说明了该模型的预测值误差的平均数最接近0,且预测值误差的标准差最小,进而说明该模型的预测精度更高。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种滑坡位移预测方法、系统、设备及终端,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的滑坡位移预测方法包括以下步骤:
S101,针对浅层滑坡易受降雨、库水位及自然环境等外部“小样本”因素影响,建立表示稀疏的LSTM模型,抽取致灾因素本质数据特征,建立数据集。对数据集进行归一化处理,并按8:1:1比例划分为训练集、验证集和测试集;
S102,设计SSA模型对LSTM模型中的超参数寻优,实现LSTM网络中隐层神经单元数、学习率、批处理数、迭代次数四个超参数的自适应调整与协同计算;
S103,将SSA模型中的麻雀个体按照适应度大小进行排序,由此确定最好的麻雀位置和最坏的麻雀位置,并划分发现者和跟随者种群;其中最好的麻雀位置代表整个种群中负责搜索到具有丰富食物的区域,为所有的加入者提供觅食的区域和方向;
S104,更新SSA模型中发现者、跟随着、预警者的位置,发现者负责为整个麻雀种群寻找食物并为所有加入者提供觅食的方向;跟随者会根据发现者的位置获取食物;然后,更新种群中预警者的位置,当意识到危险时,群体边缘的麻雀会迅速向安全区域移动,以获得更好的位置;;
S105,判断SSA模型中的麻雀个体是否陷入局部极值;若陷入局部极值,将柯西函数引入麻雀位置的更新中,借助柯西算子的变异能力,为算法在迭代寻优的过程中增强种群的多样性。并根据个体扰动前后的适应度,来判断是否更改麻雀个体的位置;若没有陷入局部极值,直接执行S106;
S106,判断SSA模型是否满足终止条件;若满足,则结合算法搜索的最佳超参数值构建最终的LSTM预测模型,然后用训练数据、验证数据迭代训练该模型,将训练好的迭代模型通过测试数据得到预测数据;若不满足终止条件,则返回S103。
本发明实施例提供的滑坡位移预测方法原理图如图2所示。
如图3所示,本发明实施例提供的滑坡位移预测方法包括:
数据集构建模块1,用于将产生滑坡的相关因素构建成数据集,将数据集进行预处理,并按照8:1:1的比例划分为训练集、验证集和测试集;
LSTM模型构建模块2,用于初步构建LSTM模型,确定预测模型的结构;
适应度计算模块3,用于设置麻雀搜索算法的参数值,用Tent混沌序列初始化种群中麻雀个体的初始位置,并计算种群中麻雀个体的适应度;
适应度排序模块4,用于对麻雀个体按照适应度进行排序,并选出最好的麻雀位置和最坏的麻雀位置;
位置更新模块5,用于更新种群中发现者的位置,更新种群中跟随者的位置,同时更新种群中预警者的位置;
局部最优判断模块6,用于判断是否陷入局部极值;若陷入局部极值,则对种群中的麻雀进行柯西扰动;否则执行终止条件判断模块;
终止条件判断模块7,用于判断是否满足终止条件;若满足,则构建最终的LSTM预测模型,若不满足,则返回适应度排序模块。
下面结合具体实施例对本发明的技术方案作进一步描述。
本发明实施例提供的滑坡位移预测方法包括以下步骤:
步骤1:构建数据集。如图2中(b)部分,针对浅层滑坡易受降雨、库水位及自然环境等外部“小样本”因素影响,建立表示稀疏的LSTM模型,抽取致灾因素本质数据特征,建立数据集,将数据集进行预处理,并按照8:1:1的比例划分为训练集、验证集、测试集;其中,所述数据集使用的是三峡水库地区白家堡滑坡的公开数据集,该数据集包括2007年1月到2018年10月之间每月的降雨量、每月的平均的水库水位、滑坡测试点每月的位移距离;以降雨量和水库水位作为诱发因子对滑坡位移进行预测。
步骤1.1:对数据集的预处理是将数据集先进行归一化处理,再构建监督型数据。其中归一化处理是为了消除歧义样本数据、减少模型的训练时间,通过公式(1)对数据进行归一化,将原数据映射到[0,1]之间。
公式(1)中,xn为经过归一化的值,xmax为最大值,xmin为最小值。
步骤1.2:构建监督学习型数据是为了使用前面的时间步作为输入变量,下一个时间步作为输出变量,从而使输入变量和输出变量构成映射关系。本实例中设置的时间步长TimeStep=3,构成三个输入变量和一个输出变量的映射关系。表示用三个月的数据预测一个月的数据。
步骤1.3:构建具有“时间记忆块”的LSTM模型,LSTM是一种特殊的RNN结构,为了解决传统RNN在长序列训练过程中的梯度弥散问题,LSTM引入了特殊的“门”结构。如图6的LSTM神经网络的框架图所示,LSTM的神经单元由输入门、遗忘门、输出门和细胞单元构成。其中,遗忘门(ft)如公式(2)所示,用来决定上一时刻的细胞中有多少信息传递到当前时刻。输入门(it)如公式(3)所示,用来控制当前单元嵌入细胞状态的程度。记忆单元(Ct)如公式(5)所示,用来记录不同门结构情况下细胞的状态。输出门(ht)如公式(7)所示。
ft=σ[Wf*(Ct-1,ht-1,xt)+bf] (2)
it=σ[Wi*(Ct-1,ht-1,xt)+bi] (3)
Ot=σ[Wo*(Ct,ht,xt)+bo] (6)
ht=Ot*tanh(Ct) (7)
其中,Wf,Wi,Wc,Wo是各个门的权重,bf,bi,bc,bo是各个门的偏置项。
步骤2.1:对CSSA的参数进行设置,其中麻雀种群Pop_Size数量为20、最大迭代次数Max_iter为50、发现者pNum的数量为4(麻雀种群的20%);预警者sNum的数量为4(麻雀种群的20%)。
步骤2.2:设置LSTM模型超参数的解空间。柯西变异的麻雀搜索算法对LSTM中隐层神经单元数、学习率、批处理数、迭代次数四个超参数设置解空间,其中ub={300,0.01,30,800}表示解空间的上限,lb={20,0.001,2,600}表示解空间的下限。其中,所述ub和lb的每一维分别代表要寻找的LSTM模型隐藏层神经单元、学习率、批处理数、迭代次数的上界和下界。
步骤2.3:初始麻雀位置。用Tent混沌序列初始化麻雀种群中每个麻雀的初始位置。
如图4所示,迭代一千次得到的Tent混沌粒子具有随机性、便利性和规律性的特征,在[0,1]的范围内呈现出均匀的分布,不会出现粒子在某一范围内聚集的现象。利用这些特征优化种群的初始位置,Tent混沌序列能够有效保持种群寻优的多样性,从而改善了算法的全局搜素能力。
Tent混沌映射的表达式如下:
Tent混沌映射通过贝努力移位变换后表示如下:
yi+1=(2yi)mod1 (9)
为了防止Tent混沌序列在迭代的过程中有可能落入不稳定或者小的周期点,对Tent混沌映射序列进行随机变异。改进后的Tent混沌映射表达式如下:
改进后的Tent混沌映射通过贝努力移位变换的表达式:
在表达式(11)中,N代表的是产生混沌序列的总数,也就是麻雀种群中麻雀的个数,rand(0,1)代表的是[0,1]之间的随机数。
将生成的混沌序列载波到麻雀的求解空间中,公式如下:
xi=xlb+(xub-xlb)*yi (12)
在公式(12)中,xi表示生成的第i个麻雀的初始位置。xub和xlb分别代表麻雀位置的上限和下限。
经过Tent混沌映射序列得到麻雀的初始位置之后,计算每个麻雀的适应度,包括:
1、将麻雀个体的空间位置解释为LSTM模型的超参数,优化LSTM模型。
2、用训练数据、验证数据迭代训练该模型,将训练好的迭代模型通过测试数据得到预测数据,计算预测值和真实值的均方根误差RMSE,用RMSE的值做为麻雀的适应度。均方根误差RMSE的计算公式如下:
式(13)中,N为预测值和真实值的个数,yi代表真实值,代表预测值。
步骤3:所述将将麻雀个体按照适应度大小进行排序,包括:
在每一次迭代过程中将种群中每个麻雀适应度的值按照从小到大进行排序,因为RMSE作为麻雀的适应度,所以麻雀适应度的值越小代表麻雀的位置越好。选出排序过后的最小的麻雀适应度值BestF,最佳的麻雀位置BestX。选出排序过后最大的麻雀适应度值WorseF,最差的麻雀位置WorseX。
步骤4.1:更新麻雀种群中的发现者的位置。在本发明中发现者的数量占麻雀种群的20%,也就是按照适应度值从小到大排序后的前4只麻雀作为发现者。R2的值是[0,1]之间的随机数,表示的是预警值。在本实例中,ST的值设置为0.8,表示的是安全值界限。位置更新公式如下:
在公式(14)中,t为当前的迭代数,T为总的迭代次数,表示的是在第t次迭代中第i个麻雀的位置信息,α代表的是[0,1]之间的随机数。Q是服从正态分布的随机数,L表示的是1×d的矩阵,其中该矩阵内每个元素全部为1。
当R2<ST时,表明预警值小于安全值,意味着此时的觅食环境周围没有捕食者,发现者可以扩大自己的搜索范围。当R2≥ST时,表示预警值大于安全值,意味着此时种群中的麻雀已经发现了捕食者,并向其他麻雀发出了警报,所有的麻雀必须迅速的飞到其它安全的地方。
步骤4.2:更新麻雀种群中跟随者的位置。在本发明中发现者的数量占麻雀种群的80%,也就是按照适应度值从小到大排序后的后32只麻雀作为跟随者。跟随着位置更新公式如下:
在公式(15)中,n为麻雀种群的数量,Q是服从正态分布的随机数,表示的是在本次迭代中麻雀最差的位置,表示的是在本次迭代中麻雀做好的位置,A是一个1×d的矩阵,A+=AT(AAT)-1。其中该矩阵中每个元素的值随机为1或-1。
步骤4.3:选取sNum只麻雀进行预警。在本发明中,预警者的数量sNum的值为麻雀种群的20%,共有四次麻雀进行预警,fi为在本次迭代中第i个麻雀的适应度,fg表示在本次迭代中最优的适应度值,fw表示在本次迭代中最差的适应度值。预警者位置更新公式如下:
在公式(16)中,和分别代表在本次迭代中麻雀最好和最差的位置。β的值是服从均值为0,方差为1的正态分布随机数,它表示步长的控制参数。K的值是[-1,1]之间的一个随机数,表示麻雀移动的方向,也是麻雀步长的控制参数。e是为了避免分母为0的情况出现,设置为一个极小的值。
当fi≠fg时,表明此时麻雀的位置处于种群的边缘,特别容易受到捕食者的攻击,需要迅速转移该麻雀的位置,然后将该麻雀的位置转移到当前位置和最好位置之间的随机位置。
当fi=fg时,表明此时麻雀的位置处于种群的中间,在意识到捕食者威胁之后,及时向其他麻雀的位置靠拢来避免捕食者的攻击,将该麻雀的位置转移到当前位置和最差位置之间的随机位置。
步骤5:判断SSA模型是否陷入局部极值。用群体适应度方差和当前得到的全局最优值来判断麻雀是否进入了局部极值状态。群体适应度方差σ2的公式为如下:
f=max{1,max|fi-favg|} (17)
式中,f表示的是归一化因子,max|fi-favg|表示的是找出种群麻雀的适应度fi和种群麻雀平均适应度favg最大的差。
其中,N表示种群中麻雀的数量。σ2的大小表示麻雀的收敛状态,若σ2越小,表明麻雀的聚集程度越大,麻雀趋于收敛状态。
如果群体适应度方差等于零,且得到的最优解不是期望的最优解,则认定麻雀种群陷入局部极值。此时将柯西函数引入麻雀位置的更新中,如图5所示,柯西分布两端形状又长又扁,逼近与0的过程比较平缓。因此使用柯西变异扰动麻雀种群,能够产生差异较大的新个体,为麻雀种群增强多样性,有助于算法跳出局部极值。
柯西扰动的过程如下:
第一步:使用公式(19)柯西分布产生一个随机值。
Cauchy(0,1)=tan((γ-0.5)×π) (19)
式中,Cauchy(0,1)表示柯西分布产生的随机值,γ表示为[0,1]之间的一个随机数。
第二步:使用公式(20)对麻雀个体进行扰动。
式中,表示的是在第t次迭代时,用柯西扰动新生成的第i个麻雀个体。
第三步:对新产生的麻雀个体进行边界判断,如果超出边界则就将值设置成边界值,如公式(21)。
式中,xub、xlb表示麻雀个体位置的上限值和下限值。
步骤6:判断是否达到终止条件。终止条件设置为:①是否达到了最大迭代次数。②得到期望的全局最优值。
若满足终止条件,将最终麻雀的最优位置解释为LSTM模型的超参数。在本发明中得到最优的适应度值为0.032,得到最优的麻雀位置为x={58,0.0019,8,703}。其中隐藏层单元为158,学习率为0.0019,批处理数为8,迭代次数为703。将这些超参数代入到LSTM模型中,构建完整的LSTM模型。然后用数据集中的训练集和测试集对模型进行训练和验证,最后用训练好的模型对测试集进行预测。
若不满足终止条件,则返回到步骤3。
表1三个模型在测试集预测值和真实值的均方根误差(RMSE)
模型 | CSSA-LSTM | SSA-LSTM | LSTM |
RMSE(单位:毫米mm) | 16.47 | 24.82 | 37.53 |
如表1所示:三个模型的均方根误差分别为16.47mm、24.82mm、37.53mm。其中CSSA-LSTM模型预测值和真实值的均方根误差最小,可以得出本发明提出的CSSA-LSTM模型,结合CSSA算法出色的参数寻优能力、融合LSTM神经网络的动态预测优势,提高了滑坡位移的预测精度和泛化能力。
如图7,图8,图9所示,分别为LSTM模型、SSA-LSTM模型、CSSA-LSTM模型的预测结果图。从三个图中可以看出,CSSA-LSTM模型的预测结果最优,SSA-LSTM模型的预测结果次优,LSTM模型的预测结果最差。由此得出设计CSSA模型对LSTM中隐层神经单元数、学习率、批处理数、迭代次数四个超参数寻优,可以实现基于表示稀疏的LSTM网络结构紧致性优化,提升滑坡位移预测精度。并有效解决滑坡预测中小样本数据预测能力弱与计算复杂代价高昂问题。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法包括以下步骤:
步骤一,针对浅层滑坡易受降雨、库水位及自然环境外部“小样本”因素影响,建立表示稀疏的LSTM模型,抽取致灾因素本质数据特征,建立数据集;将数据集进行归一化处理,并按8:1:1比例划分为训练集、验证集和测试集;其中,所述数据集使用的是三峡水库地区白家堡滑坡的公开数据集,该数据集包括2007年1月到2018年10月之间每月的降雨量、每月的平均的水库水位、滑坡测试点每月的位移距离;以降雨量和水库水位作为诱发因子对滑坡位移进行预测;
步骤二,设计SSA模型对LSTM模型中的超参数寻优,实现LSTM网络中隐层神经单元数、学习率、批处理数、迭代次数四个超参数的协同计算与自适应调整;
步骤三,将SSA模型中的麻雀个体按照适应度大小进行排序,由此确定最好的麻雀位置和最坏的麻雀位置,并划分发现者和跟随者种群;其中最好的麻雀位置代表整个种群搜索到具有丰富食物的区域,为所有的加入者提供觅食的区域和方向;
步骤四,更新SSA模型中发现者、跟随着、预警者的位置,发现者负责为整个麻雀种群寻找食物并为所有跟随者提供觅食的方向;跟随者会根据发现者的位置获取食物;然后,更新种群中预警者的位置,当意识到危险时,群体边缘的麻雀会迅速向安全区域移动,以获得更好的位置;
步骤五,判断SSA模型中的麻雀个体是否陷入局部极值;若陷入局部极值,将柯西函数引入麻雀位置的更新中,借助柯西算子的变异能力,为算法在迭代寻优的过程中增强种群的多样性;并根据个体扰动前后的适应度,来判断是否更改麻雀个体的位置;若没有陷入局部极值,直接执行步骤六;
步骤六,判断SSA模型是否满足终止条件;若满足,则结合算法搜索的最佳超参数值构建最终的LSTM预测模型,然后用训练数据、验证数据迭代训练该模型,将训练好的迭代模型通过测试数据得到预测数据;若不满足终止条件,则返回步骤三。
2.如权利要求1所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,步骤一中,所述对数据集的预处理是将数据集先进行归一化处理,再构建监督型数据;其中,所述归一化处理是用于消除歧义样本数据、减少模型的训练时间,通过公式(1)对数据进行归一化,将原数据映射到[0,1]之间;
其中,xn为经过归一化的值,xmax为最大值,xmin为最小值;
所述构建监督学习型数据是用于使用前面的时间步作为输入变量,下一个时间步作为输出变量,从而使输入变量和输出变量构成映射关系;在本模型中设置的时间步长TimeStep=3,构成三个输入变量和一个输出变量的映射关系,表示用三个月的数据预测一个月的数据;
构建具有“时间记忆块”的LSTM模型,其中LSTM是一种特殊的RNN结构,LSTM引入特殊的“门”结构,LSTM的神经单元由输入门、遗忘门、输出门和细胞单元构成;其中,所述遗忘门ft如公式(2)所示,用于决定上一时刻的细胞中有多少信息传递到当前时刻;所述输入门it如公式(3)所示,用于控制当前单元嵌入细胞状态的程度;所述记忆单元Ct如公式(5)所示,用于记录不同门结构情况下细胞的状态;所述输出门ht如公式(7)所示;
ft=σ[Wf*(Ct-1,ht-1,xt)+bf] (2)
it=σ[Wi*(Ct-1,ht-1,xt)+bi] (3)
Ot=σ[Wo*(Ct,ht,xt)+bo] (6)
ht=Ot*tanh(Ct) (7)
其中,Wf,Wi,Wc,Wo是各个门的权重,bf,bi,bc,bo是各个门的偏置项。
3.如权利要求1所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,步骤二中,设计SSA模型对LSTM模型中的超参数寻优,实现LSTM网络中隐层神经单元数、学习率、批处理数、迭代次数四个超参数的自适应调整与协同计算,包括:
对SSA的参数进行设置,其中麻雀种群Pop_Size数量为20、最大迭代次数Max_iter为50、发现者pNum的数量为4(麻雀种群的20%);预警者sNum的数量为4(麻雀种群的20%);
设置LSTM模型超参数的解空间;柯西变异的麻雀搜索算法对LSTM中隐层神经单元数、学习率、批处理数、迭代次数四个超参数设置解空间,其中ub={300,0.01,30,800}表示解空间的上限,lb={20,0.001,2,600}表示解空间的下限;
其中,所述ub和lb的每一维分别对应的是LSTM模型隐藏层神经单元、学习率、批处理数、迭代次数的上界和下界;
所述用Tent混沌序列初始化麻雀种群中每个麻雀的初始位置,包括:
(1)根据Tent映射随机性、便利性和规律性的特征,利用这些特征优化种群的初始位置,Tent混沌序列能够有效保持种群寻优的多样性;
Tent混沌映射的表达式如下:
Tent混沌映射通过贝努力移位变换后表示如下:
yi+1=(2yi)mod1 (9)
(2)对Tent混沌映射序列进行随机变异,改进后的Tent混沌映射表达式为:
改进后的Tent混沌映射通过贝努力移位变换的表达式为:
在公式(11)中,N代表的是产生混沌序列的总数,也就是麻雀种群中麻雀的个数,rand(0,1)代表的是[0,1]之间的随机数;
将生成的混沌序列载波到麻雀的求解空间中,公式如下:
xi=xlb+(xub-xlb)*yi (12)
其中,xi表示生成的第i个麻雀的初始位置;xub和xlb分别代表麻雀位置的上限和下限;
经过Tent混沌映射序列得到麻雀的初始位置之后,计算每个麻雀的适应度,包括:
1、将麻雀个体的空间位置解释为LSTM模型的超参数,优化LSTM模型;
2、用训练数据、验证数据迭代训练该模型,将训练好的迭代模型通过测试数据得到预测数据,计算预测值和真实值的均方根误差RMSE,用RMSE的值做为麻雀的适应度;均方根误差RMSE的计算公式如下:
式(13)中,N为预测值和真实值的个数,yi代表真实值,代表预测值。
4.如权利要求1所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,步骤三中,所述将将麻雀个体按照适应度大小进行排序,包括:
在每一次迭代过程中将种群中每个麻雀适应度的值按照从小到大进行排序,因为RMSE作为麻雀的适应度,所以麻雀适应度的值越小代表麻雀的位置越好;选出排序过后的最小的麻雀适应度值BestF,最佳的麻雀位置BestX;选出排序过后最大的麻雀适应度值WorseF,最差的麻雀位置WorseX。
5.如权利要求1所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,步骤四中,所述更新麻雀种群中的发现者的位置,包括:
发现者的数量占麻雀种群的20%,即为按照适应度值从小到大排序后的前4只麻雀作为发现者;R2的值是[0,1]之间的随机数,表示的是预警值;ST的值设置为0.8,表示的是安全值界限;位置更新公式如下:
其中,t为当前的迭代数,T为总的迭代次数,表示的是在第t次迭代中第i个麻雀的位置信息,α代表的是[0,1]之间的随机数;Q是服从正态分布的随机数,L表示的是1×d的矩阵,其中该矩阵内每个元素全部为1;
当R2<ST时,表明预警值小于安全值,意味着此时的觅食环境周围没有捕食者,发现者可以扩大自己的搜索范围;当R2≥ST时,表示预警值大于安全值,意味着此时种群中的麻雀已经发现了捕食者,并向其他麻雀发出警报,所有的麻雀必须迅速的飞到其它安全的地方;
所述更新麻雀种群中跟随者的位置,包括:
跟随者的数量占麻雀种群的80%,即为按照适应度值从小到大排序后的后32只麻雀作为跟随者;跟随着位置更新公式如下:
其中,n为麻雀种群的数量,Q是服从正态分布的随机数,表示的是在本次迭代中麻雀最差的位置,表示的是在本次迭代中麻雀做好的位置,A是一个1×d的矩阵,A+=AT(AAT)-1,该矩阵中每个元素的值随机为1或-1;
所述更新种群中预警者的位置,包括:
选取sNum只麻雀进行预警,预警者的数量sNum的值为麻雀种群的20%,共有四次麻雀进行预警,fi为在本次迭代中第i个麻雀的适应度,fg表示在本次迭代中最优的适应度值,fw表示在本次迭代中最差的适应度值;预警者位置更新公式如下:
其中,和分别代表在本次迭代中麻雀最好和最差的位置;β的值是服从均值为0,方差为1的正态分布随机数,表示步长的控制参数;K的值是[-1,1]之间的一个随机数,表示麻雀移动的方向,也是麻雀步长的控制参数;e是为了避免分母为0的情况出现,设置为一个极小的值;
当fi≠fg时,表明此时麻雀的位置处于种群的边缘,特别容易受到捕食者的攻击,迅速转移该麻雀的位置,并将该麻雀的位置转移到当前位置和最好位置之间的随机位置;
当fi=fg时,表明此时麻雀的位置处于种群的中间,在意识到捕食者威胁之后,及时向其他麻雀的位置靠拢来避免捕食者的攻击,将该麻雀的位置转移到当前位置和最差位置之间的随机位置。
6.如权利要求1所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,步骤五中,所述判断SSA模型是否陷入局部极值,包括:
用群体适应度方差和当前得到的全局最优值来判断粒子是否进入了局部极值状态;群体适应度方差σ2的公式为如下:
f=max{1,max|fi-favg|} (17)
其中,f表示的是归一化因子,max|fi-favg|表示的是找出种群麻雀的适应度fi和种群麻雀平均适应度favg最大的差;
其中,N表示种群中麻雀的数量;σ2的大小表示麻雀的收敛状态,若σ2越小,表明麻雀的聚集程度越大,麻雀趋于收敛状态;
如果群体适应度方差等于零,且得到的最优解不是期望的最优解,则认定麻雀种群陷入局部最优;此时将柯西函数引入麻雀位置的更新中,借助柯西算子的变异能力,在算法迭代寻优的过程中增强种群的多样性;
柯西扰动的过程如下:
(1)使用公式(19)柯西分布产生一个随机值;
Cauchy(0,1)=tan((γ-0.5)×π) (19)
其中,Cauchy(0,1)表示柯西分布产生的随机值,γ表示为[0,1]之间的一个随机数;
(2)使用公式(20)对麻雀个体进行扰动;
其中,表示的是在第t次迭代时,用柯西扰动新生成的第i个麻雀个体;
(3)对新产生的麻雀个体进行边界判断,如果超出边界则就将值设置成边界值,如公式(21)所示:
其中,xub、xlb表示麻雀个体位置的上限值和下限值。
7.如权利要求1所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,步骤六中,所述判断是否达到终止条件,包括:
所述终止条件设置如下:(1)是否达到了最大迭代次数;(2)得到期望的全局最优值;
若满足终止条件,将最终麻雀的最优位置解释为LSTM模型的超参数;在本发明中得到最优的适应度值为0.032,得到最优的麻雀位置为x={58,0.0019,8,703};其中隐藏层单元为158,学习率为0.0019,批处理数为8,迭代次数为703;将这些超参数代入到LSTM模型中,构建完整的LSTM模型;然后用数据集中的训练集和测试集对模型进行训练和验证,最后用训练好的模型对测试集进行预测;
若不满足终止条件,则返回到步骤3。
8.一种实施权利要求1~7任意一项所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法,其特征在于,所述滑坡位移预测方法包括:
数据集构建模块,用于将产生滑坡的相关因素构建成数据集,将数据集进行预处理,并按照8:1:1比例划分为训练集、验证集和测试集;
LSTM模型构建模块,用于初步构建LSTM模型,确定预测模型的结构;
适应度计算模块,用于设置麻雀搜索算法的参数值,用Tent混沌序列初始化种群中麻雀个体的初始位置,并计算种群中麻雀个体的适应度;
适应度排序模块,用于对麻雀个体按照适应度进行排序,并选出最好的麻雀位置和最坏的麻雀位置;
位置更新模块,用于更新种群中发现者的位置,更新种群中跟随者的位置,同时更新种群中预警者的位置;
局部最优判断模块,用于判断是否陷入局部极值;若陷入局部极值,则对种群中的麻雀进行柯西扰动;否则执行终止条件判断模块;
终止条件判断模块,用于判断是否满足终止条件;若满足,则构建最终的LSTM预测模型,若不满足,则返回适应度排序模块。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~7任意一项所述的基于柯西扰动麻雀优化的稀疏LSTM滑坡预测方法的步骤。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求8所述的滑坡位移预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111015764.4A CN113947009B (zh) | 2021-08-31 | 2021-08-31 | 基于柯西扰动麻雀优化的稀疏lstm滑坡动态预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111015764.4A CN113947009B (zh) | 2021-08-31 | 2021-08-31 | 基于柯西扰动麻雀优化的稀疏lstm滑坡动态预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113947009A CN113947009A (zh) | 2022-01-18 |
CN113947009B true CN113947009B (zh) | 2024-03-08 |
Family
ID=79327602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111015764.4A Active CN113947009B (zh) | 2021-08-31 | 2021-08-31 | 基于柯西扰动麻雀优化的稀疏lstm滑坡动态预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113947009B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114595864A (zh) * | 2022-01-19 | 2022-06-07 | 上海电力大学 | 一种电力负荷智能预测模型的优化方法 |
CN115150284B (zh) * | 2022-06-13 | 2023-04-25 | 上海工程技术大学 | 基于改进麻雀算法的通信网拓扑优化方法及系统 |
CN115238850B (zh) * | 2022-06-30 | 2023-05-09 | 西南交通大学 | 一种基于mi-gra与改进pso-lstm的山区边坡位移预测方法 |
CN115526108B (zh) * | 2022-10-11 | 2024-01-16 | 重庆地质矿产研究院 | 一种基于多源监测数据的滑坡稳定性智能动态预测方法 |
CN116339166B (zh) * | 2023-03-30 | 2023-12-19 | 淮阴工学院 | 一种综合能源楼宇能耗智能调控设备 |
CN116662862A (zh) * | 2023-06-05 | 2023-08-29 | 西安工程大学 | 基于油中溶解气体含量预测和诊断的变压器故障预警方法 |
CN116776921B (zh) * | 2023-06-09 | 2024-04-19 | 淮阴工学院 | 一种基于改进patch-informer的太阳辐射预测方法及装置 |
CN117454323B (zh) * | 2023-11-14 | 2024-08-16 | 中国矿业大学(北京) | 一种基于gpr-issa-cnn的煤自燃温度预测方法 |
CN117423067B (zh) * | 2023-12-18 | 2024-03-12 | 成都华芯智云科技有限公司 | 一种基于tof技术的客流统计终端 |
CN118192277B (zh) * | 2024-05-17 | 2024-07-30 | 山东科技大学 | 改进麻雀搜索的快速反射镜自抗扰控制器参数确定方法 |
CN118503657B (zh) * | 2024-07-18 | 2024-09-24 | 北京师范大学珠海校区 | 滑坡风险动态预测方法、装置、介质及电子设备 |
CN118644189A (zh) * | 2024-08-16 | 2024-09-13 | 华能国际电力股份有限公司大连电厂 | 基于大数据的采购方案优化方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020103411A1 (zh) * | 2018-11-22 | 2020-05-28 | 九牧厨卫股份有限公司 | 一种跌倒检测方法、装置及系统 |
AU2020103709A4 (en) * | 2020-11-26 | 2021-02-11 | Daqing Oilfield Design Institute Co., Ltd | A modified particle swarm intelligent optimization method for solving high-dimensional optimization problems of large oil and gas production systems |
CN112880688A (zh) * | 2021-01-27 | 2021-06-01 | 广州大学 | 基于混沌自适应麻雀搜索算法的无人机三维航迹规划方法 |
CN113238666A (zh) * | 2021-05-24 | 2021-08-10 | 江苏科技大学 | 基于麻雀搜索算法优化的gru的船舶运动姿态的预测方法 |
CN113259325A (zh) * | 2021-04-21 | 2021-08-13 | 桂林电子科技大学 | 基于麻雀搜索算法优化Bi-LSTM的网络安全态势预测方法 |
-
2021
- 2021-08-31 CN CN202111015764.4A patent/CN113947009B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020103411A1 (zh) * | 2018-11-22 | 2020-05-28 | 九牧厨卫股份有限公司 | 一种跌倒检测方法、装置及系统 |
AU2020103709A4 (en) * | 2020-11-26 | 2021-02-11 | Daqing Oilfield Design Institute Co., Ltd | A modified particle swarm intelligent optimization method for solving high-dimensional optimization problems of large oil and gas production systems |
CN112880688A (zh) * | 2021-01-27 | 2021-06-01 | 广州大学 | 基于混沌自适应麻雀搜索算法的无人机三维航迹规划方法 |
CN113259325A (zh) * | 2021-04-21 | 2021-08-13 | 桂林电子科技大学 | 基于麻雀搜索算法优化Bi-LSTM的网络安全态势预测方法 |
CN113238666A (zh) * | 2021-05-24 | 2021-08-10 | 江苏科技大学 | 基于麻雀搜索算法优化的gru的船舶运动姿态的预测方法 |
Non-Patent Citations (2)
Title |
---|
基于LSTM循环神经网络的故障时间序列预测;王鑫;吴际;刘超;杨海燕;杜艳丽;牛文生;;北京航空航天大学学报;20171013(第04期);全文 * |
基于果蝇优化算法的滑坡位移预测模型研究;曹斌;;科技视界;20201005(第28期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113947009A (zh) | 2022-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113947009B (zh) | 基于柯西扰动麻雀优化的稀疏lstm滑坡动态预测方法 | |
Dhiman et al. | EMoSOA: a new evolutionary multi-objective seagull optimization algorithm for global optimization | |
Massaoudi et al. | Convergence of photovoltaic power forecasting and deep learning: State-of-art review | |
CN110473592B (zh) | 一种多视角人类协同致死基因预测方法 | |
Kuo et al. | An application of particle swarm optimization algorithm to clustering analysis | |
Tang et al. | Clustering big IoT data by metaheuristic optimized mini-batch and parallel partition-based DGC in Hadoop | |
Zhou et al. | Determining reservoir properties in reservoir studies using a fuzzy neural network | |
Lu et al. | GLR: A graph-based latent representation model for successive POI recommendation | |
Ewees et al. | Improved adaptive neuro-fuzzy inference system using gray wolf optimization: a case study in predicting biochar yield | |
Qamar et al. | Artificial neural networks: An overview | |
CN116526473A (zh) | 基于粒子群优化lstm的电热负荷预测方法 | |
Irfan et al. | Brain inspired lifelong learning model based on neural based learning classifier system for underwater data classification | |
CN112445957A (zh) | 社交网络异常用户检测方法、系统、介质、设备、终端 | |
Zhang et al. | Support vector machine weather prediction technology based on the improved quantum optimization algorithm | |
Zhang et al. | Multi-source big data dynamic compressive sensing and optimization method for water resources based on IoT | |
CN115099461A (zh) | 基于双分支特征提取的太阳辐射预测方法及系统 | |
Arul | Deep learning methods for data classification | |
Kouziokas | Swarm intelligence and evolutionary computation: theory, advances and applications in machine learning and deep learning | |
Tian et al. | A wind speed prediction system based on new data preprocessing strategy and improved multi-objective optimizer | |
CN114006411B (zh) | 一种基于lstm-cnn联合模型的风电功率预测方法和系统 | |
Abusnaina et al. | Self-adaptive mussels wandering optimization algorithm with application for artificial neural network training | |
Ling et al. | Financial Crisis Prediction Based on Long‐Term and Short‐Term Memory Neural Network | |
Lu et al. | Dynamic evolution analysis of desertification images based on BP neural network | |
CN114882288B (zh) | 基于分层图增强堆叠自编码器的多视图图像分类方法 | |
Xia et al. | Efficient synthesis of compact deep neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |