CN117454124B - 一种基于深度学习的船舶运动预测方法及系统 - Google Patents
一种基于深度学习的船舶运动预测方法及系统 Download PDFInfo
- Publication number
- CN117454124B CN117454124B CN202311800936.8A CN202311800936A CN117454124B CN 117454124 B CN117454124 B CN 117454124B CN 202311800936 A CN202311800936 A CN 202311800936A CN 117454124 B CN117454124 B CN 117454124B
- Authority
- CN
- China
- Prior art keywords
- dung
- data
- beetles
- value
- beetle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 104
- 238000013135 deep learning Methods 0.000 title claims abstract description 19
- 238000013528 artificial neural network Methods 0.000 claims abstract description 36
- 238000000605 extraction Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000002708 enhancing effect Effects 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 230000003321 amplification Effects 0.000 claims abstract description 8
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 8
- 210000003608 fece Anatomy 0.000 claims description 190
- 241000254173 Coleoptera Species 0.000 claims description 177
- 230000006870 function Effects 0.000 claims description 64
- 238000004422 calculation algorithm Methods 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 41
- 239000013598 vector Substances 0.000 claims description 36
- 238000005096 rolling process Methods 0.000 claims description 24
- 238000009826 distribution Methods 0.000 claims description 22
- 230000002431 foraging effect Effects 0.000 claims description 18
- 238000005457 optimization Methods 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 14
- 241001229848 Aphodius granarius Species 0.000 claims description 13
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 11
- 230000000739 chaotic effect Effects 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 238000005065 mining Methods 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 7
- 230000019637 foraging behavior Effects 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000010845 search algorithm Methods 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 239000010410 layer Substances 0.000 description 42
- 230000008901 benefit Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 230000001364 causal effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 241000283153 Cetacea Species 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 241000287127 Passeridae Species 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004880 explosion Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000001808 coupling effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000272168 Laridae Species 0.000 description 1
- 241000258241 Mantis Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于深度学习的船舶运动预测方法及系统,属于船舶运动预测技术领域,包括:获取历史船舶运动数据并处理;对历史船舶运动数据进行混类数据增强操作,构建虚拟的数据样本,从而实现数据扩增;对混类数据增强后的历史船舶运动数据进行孤立森林异常值检测并对异常值进行处理;通过TCN层获取深度特征,通过BIGRU网络获取时间特征,然后利用神经网络进行特征融合,并通过注意力增强操作对空间特征进行增强,构建基于神经网络的特征提取模型并训练模型;利用分类器对特征提取模型提取后的样本进行分类并输出分类结果,该分类结果作为船舶运动预测结果。本发明解决了模型训练效果差,识别精度低等问题。
Description
技术领域
本发明涉及一种基于深度学习的船舶运动预测方法及系统,属于船舶运动预测技术领域。
背景技术
船舶在航行时受风、浪、流等复杂外力的作用,各自由度上均会产生不规则的摇荡运动。当摇荡幅度过大时,船舶的航行和作业安全将会受到严峻的挑战。提前预报船舶未来的摇荡运动可为操作人员提供更多的决策时间,提高安全性与稳定性。
船舶对波浪的摇荡运动响应可通过运动幅值响应算子(RAO)求得。RAO是海浪参数、船舶参数到船舶运动时间序列的传递函数。不同的摇荡运动具有不同的传递函数公式,但都与波浪参数、船舶参数相关。因而在已知历史的波浪参数、船舶参数的情况下,可以实现船舶在波浪作用下的运动响应预测。进一步地,摇荡运动彼此之间相互影响,可在已知历史摇荡运动量即时间运动序列,实现船舶在波浪作用下的运动响应预测。
目前已有一些算法能够利用机器学习、神经网络技术对船舶摇荡运动进行预测。如中国专利CN116307273A提出一种基于XGboost机器学习算法的船舶运动实时预报方法及系统,机器学习算法相比神经网络模型训练时间和预测时间大幅缩短,但预测准确度差距较大。同时XGboost算法根本无法直接识别特征之间的交互关系,只是机械的使用数据分裂规则对每一个特征进行分裂。同时,在波浪作用下,船舶的运动量之间具有耦合作用,实际物理试验所得运动量数据均为系统耦合作用的结果,神经网络模型相较于机器学习算法针对这种非线性问题的预测分析具备一定优势。因此,综合来看采取时序神经网络预测船舶运动更为合适。
时序神经网络包括单一时序神经网络、卷积时序神经网络、组合时序神经网络。时序神经网络中单一时序神经网络包括但不限于全连接神经网络(DNN,如BP)、循环神经网络(RNN,如NARX、Transformer、LSTM、GRU、以及改进的Bi-LSTM、BIGRU)、时间卷积神经网络(TCN);卷积时序神经网络即在单一时序神经网络基础上增添传统单维卷积层CNN,如中国专利CN116280094A提出的Conv-Bi-LSTM模型。组合神经网络即将任两种或多种单一时序神经网络组合使用,如BP-LSTM。
中国专利CN116280094A提出一种基于Conv-Bi-LSTM模型的船舶升沉运动预测系统及预测方法。该方法建立了船舶历史运动数据为输入的卷积神经网络和双向长短时记忆网络组合模型,即以时间和横摇、纵摇、艏摇、横荡、纵荡和升沉六个自由度的多特征运动信息数据作为输入,预测船舶未来的升沉运动信息。卷积模型有时具备比单一模型更为全面的能力,该发明的方法能能够自适应多种复杂海况,显著提高预测准确性,尤其是较长时间跨度的时间序列数据,能充分利用船舶其他自由度及反向特征信息。
中国专利CN116861617A提出一种基于IWOA-TCN-Attention模型的船舶姿态预测方法。鲸鱼优化算法(IWOA)作为一种群智能优化算法,与天牛群搜索算法(BSO)、海鸥优化算法(SOA)、飞蛾扑火优化算法(MFO)、蚁群算法(ACO)等群算法相比收敛精度更高,收敛速度更快及稳定性更高。该方法在保留IWOA算法操作简单、参数少、性能优越等优点的基础上,引入非线性收敛因子和差分变异策略改善IWOA算法在高维的维度灾难问题。
然而虽然上述这些方案的创新性较好,上述方法存在以下不足:
(1)RNN主要包括:LSTM、GRU、SNN等,以善于挖掘时序特征著称。单一的LSTM能够规避RNN训练中的梯度不稳定问题,却具备较多的参数,训练耗时长,在处理小数据集易出现过度拟合。GRU是LSTM的简化版本,GRU在预测能力与LSTM相差不大的情况下具备更小的参数,但是无法提取时间序列的单维单向空间特征。
(2)传统的CNN由于卷积核大小限制,往往并不适合被应用于时间序列的建模与回归预测问题。在CNN结构的变体之中,Wavenet、TCN均由CNN改进而来,规避了CNN处理序列时频繁出现的诸多问题。以时间卷积网络(TCN)为代表的序列建模方法,往往具备比RNN更加稳定的梯度与更小的内存。但TCN能够提取时序的单维单向空间特征,却不擅长提取时序元素的顺序特征。
(3)CNN-LSTM混合模型在船舶运动时空特征挖掘方面优势突出,却在单纯的单维时序自回归任务上表现稍差,且LSTM参数较多,朴素的一维CNN在单维时序预测任务上能力不足。
(4)改进鲸鱼优化算法并没有实现鲸鱼优化算法性能大幅提升。而麻雀算法相较于改进鲸鱼优化算法虽耗时增长,但性能更优,稳定性更好,性能明显提高。而蜣螂优化算法(DBO)是2022年提出的全新群智能算法,在麻雀算法(SSA)的基础进一步研究。相较于麻雀算法(SSA)精度更高,收敛速度更快及稳定性更高。但蜣螂算法有4个主要缺点:蜣螂个体的位置分布不均匀、全局探索能力较弱、初始种群多样性低、后期搜索停滞。
因此,亟待一种基于深度学习的船舶运动预测方法及系统来解决现有技术存在的问题。
发明内容
针对现有技术难以进行精准识别与分类、模型训练效果差,识别精度低等问题,本发明提供了一种基于深度学习的船舶运动预测方法及系统。
本发明核心技术是对船舶历史运动数据进行混类数据增强、孤立森林异常值检测、构建特征提取模型及利用分类器分类,其中特征提取模型在对神经网络的参数寻优方法过程中采用基于混合蜣螂优化算法代替传统梯度下降算法,从而避免传统梯度下降算法容易产生的梯度消失和梯度爆炸现象。
本发明采用以下技术方案:
第一方面,本发明提供一种基于深度学习的船舶运动预测方法,包括如下步骤:
(1)获取历史船舶运动数据并进行降噪、归一化处理;
(2)对历史船舶运动数据进行混类数据增强操作,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本,从而实现数据扩增;
(3)对混类数据增强后的历史船舶运动数据进行孤立森林异常值检测并对异常值进行处理;
(4)通过TCN层获取深度特征,通过BIGRU网络获取时间特征,然后利用神经网络进行特征融合,并通过注意力增强操作对空间特征进行增强,构建基于神经网络的特征提取模型并训练模型;
(5)利用分类器对特征提取模型提取后的样本进行分类并输出分类结果,该分类结果作为船舶运动预测结果。
优选的,步骤(1)中,船舶历史运动数据为波浪参数和船舶参数,也可为船舶历史的摇荡运动的运动量时间运动序列,将历史船舶运动数据进行最大最小归一化,以使使数据映射到区间[-1,1]之间,如下式所示:
;
其中,x是输入数据,xmax是取最大输入数据值,xmin是取最小输入数据值,是归一化输出值。
优选的,步骤(2)中的混类数据增强操作基于Mixup,按照设定的权重对历史船舶运动数据中的训练集中随机抽取出的两个样本及其标签进行加权求和,以得到虚拟的数据样本,公式如下:
;
;
;
其中,与是增强前的数据样本,与是增强前的数据样本标签,Beta( )是贝塔函数,x是增强后的数据样本,y是增强后的数据样本标签,符号λ表示组合的权重,超参数γ控制样本-标签对之间的插值强度。通过数据增强操作,获得增强后的船舶运动数据。
优选的,步骤(3)中,采用孤立森林算法筛选出异常的数据值,然后对异常值采用拉格朗日插值法进行修正处理,计算公式如下:
;
其中,tt为数据值异常的时刻;a、b分别为tt时刻前、后一段时间的数据点数;和分别为初始数据序列中tt-i和tt+n时刻的数据值;为修正后的tt时刻的数据值。
优选的,步骤(4)中,深度特征和时间特征通过TCN-BIGRU结构获取,TCN-BIGRU结构包括输入层、TCN层、BIGRU层和输出层;
所述TCN层对时序数据进行首次特征提取,获取深度特征,TCN层由多层残差块组成,利用多层残差块结构降低网络梯度消失的可能性;
BIGRU层对TCN提取后的特征向量进行二次特征提取,获取时间特征,BIGRU层由两个方向的GRU网络组成,一个GRU网络从前向后处理TCN层的输出向量,另一个GRU网络从后向前处理TCN层的输出向量进行学习,得到双向的时序特征。
优选的,步骤(4)中,通过神经网络融合深度特征和时间特征,该神经网络输入层神经元数量与深度特征和时间特征的总数相等;神经网络的参数寻优方法采用基于混合蜣螂优化算法实现。
优选的,混合蜣螂优化算法的参数寻优方法为:
随机生成e个蜣螂位置,对蜣螂种群进行改进后的tent混沌映射初始化,将迭代产生的矢量分别映射到需优化变量的可行域内,设置种群规模、最大迭代次数等算法参数;
改进后的tent混沌映射如下:
;
;
式中,k表示映射次数,表示第k次映射的函数值;
选择适应度函数并计算每个蜣螂位置的适应度函数值,适应度函数为:
;
式中,为船舶运动的拟合值,为船舶运动的期望值,在整个空间区域迭代寻优,使适应度函数值最小处即为空间最优解;
引入亚群策略取适应度值前B个蜣螂个体作为种群初始个体,对B个蜣螂个体进行适应度值降序排列,全局最优蜣螂个体记为B best ,依次平均分配到m个亚群中,每个亚群中的蜣螂个体数为n,按一定比例根据适应度函数值将种群划分为四个子种群:滚球蜣螂、卵球蜣螂、小蜣螂和偷窃蜣螂,记录每个亚群中最好、最差的蜣螂个体B best 与B worse ,则有B=m×n;
迭代前期,正常搜索阶段,蜣螂按照滚球、跳舞、觅食、繁殖和偷窃五种行为更新所有蜣螂的位置,其中,觅食阶段引入Levy飞行策略提高全局搜索能力;
迭代后期,局部寻优阶段,蜣螂用禁忌搜索方式替代蜣螂原有的正切跳舞策略调整其中最差蜣螂个体的位置;如果此局部搜索能够得到一个更好的蜣螂位置,则用其取代原来的蜣螂个体;否则,就按tent混沌映射生成一个新个体取代原来最差的蜣螂个体;
判断各个蜣螂是否在边界外,计算蜣螂适应度函数值,更新当前最优解及其适应度函数值;
利用自适应T分布变异策略,对其他蜣螂的位置进行更新;计算出更新后的蜣螂个体位置最优函数值,利用贪婪规则与前一代最优函数值比较,如果较优,则更改目前适应度函数最优值;
蜣螂种群进行重新汇合、排序、再分类,适应度函数值达到设定精度或迭代到最大次数是否满足要求,若不满足要求则返回继续迭代,否则,输出全局最优个体位置和最优的函数值。
优选的,蜣螂的五种行为如下:
①滚球:
蜣螂在滚动过程中通过外界信息来导航,以保持粪球在直线上滚动;为了模拟滚动球的行为,需要蜣螂在整个搜索空间中沿着给定的方向移动;
迭代前期,蜣螂有目标地进行滚动,处于正常全局探索阶段,按下列公式进行位置更新:
;
;
式中,t表示当前迭代次数,代表第t次迭代蜣螂i的位置信息,为偏转系数是一个常量,b为常数范围在(0,1);α是自然系数,值为1或-1,当α=1时,表示无偏差;当α=-1时,会偏离方向;表示全局最差位置,Δx用于模拟光强的变化;δ=rand(1);ST=(0.5,1];
②跳舞:
蜣螂遇到障碍物无法前进时,需要通过跳舞行为来改变方向,以获得新的路线,使用正切函数进行模拟,如下所示:
;
式中,θ表示偏转角,表示蜣螂i在第t次迭代时,其位置与第t-1次时的位置差,以起到参考历史信息的作用,需要说明的是当θ值为0,π/2,π时,正切函数无值,此时表示不更新位置;
迭代后期,蜣螂没有明确的滚动目标,,但是会通过一种禁忌搜索的方式进行移动从而替代蜣螂原有的正切跳舞策略,对每个蜣螂种群分别进行禁忌搜索来调整其中最差蜣螂个体的位置,如果此局部搜索能够得到一个更好的蜣螂位置,则用其取代原来的蜣螂个体;局部搜索过程中,禁忌搜索算法的主要过程如下:
给定最差蜣螂个体为中心,在其邻域内生成一组候选集,其中为移动的步长;
判断生成的候选集中的解是否满足约束条件,若满足,保留,否则更换值重新生成;
在此组候选集中选择引起适应度函数值变化最大的作为局部最优解,取代初始解成为新的当前解,重复循环这个搜索过程;
将每次搜索得到的局部最优解放入禁忌表中,以避免此解再次被找到;
③繁殖:
蜣螂会滚动粪球到安全位置,繁衍后代,每次繁殖产生一个后代,通过边界选择策略模拟产卵区域,公式如下:
;
;
;
式中,表示当前局部最优位置;和分别表示产卵区域的下界和上界;表示最大迭代次数;Bt和Bl分别表示优化问题的下界和上界分别表示优化问题的下界和上界;需要说明的是,雌性蜣螂产卵区域的边界范围随着迭代次数动态调整。
一旦确定了产卵区域,雌性蜣螂在此区域内进行产卵,每只雌性蜣螂在每次迭代中只会生产一个卵球,边界范围随着R值得变化而变化,所以下一代的卵球位置也会变化,增强了局部搜索能力,下一代的位置信息为:
;
式中:为第i个卵球在第t次迭代时的位置信息;b 1和b 2表示两个大小为1×D的独立随机向量,D表示优化问题的维数;
④觅食:
觅食行为与繁殖行为类似,觅食行为的种群称为小蜣螂,小蜣螂的觅食区域公式如下:
;
;
式中,表示当前全局最优位置;和分别表示最佳觅食区域的下界和上界;表示最大迭代次数;
对于小蜣螂种群,为提高全局搜索能力,引入了Levy飞行策略,由此可知,小蜣螂的位置更新公式如下:
;
式中:是小蜣螂i在第t次迭代的位置信息,C 1是[0,1]之间的随机数,是元素相乘;
Levy飞行策略是一种随机行走策略,多数情况下,模拟的步长较小,偶尔也会有较大步长的情况,可以帮助跳出局部最优的情况,其公式如下:
;
式中,Levy(β)为服从参数β的Levy分布,0<β<2,μ服从分布,v服从N(0,1)分布,σ可以由下列公式计算得到:
;
式中,Γ代表伽马分布函数,β为常数;
⑤偷窃:
偷取其他蜣螂粪球的蜣螂称为偷窃蜣螂,模拟蜣螂的偷窃行为,相当于收敛的过程,围绕展开的位置变化公式如下:
;
式中,代表偷窃蜣螂i在第t次迭代的位置信息,S是常量,g是大小为1×D的服从正态分布的随机向量。
优选的,注意力增强操作能从大量的信息中选出更重要的部分,有利于提高船舶运动的准确率;
注意力增强操作中自注意力机制通过下述公式来计算矩阵输出:
;
式中:Q表示一组查询向量矩,K表示一组键向量矩阵,表示keys的维度,V表示特征的向量矩阵,首先计算Q与KT的点乘,然后为了防止其结果过大,会除以,再利用softmax操作将其结果归一化为概率分布,最后乘以矩阵V得到权重。
第二方面,本发明提供一种基于深度学习的船舶运动预测系统,包括:
采集模块,用于获取历史船舶运动数据并进行降噪、归一化处理;
数据增强模块,用于对历史船舶运动数据进行混类数据增强操作,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本,从而实现数据扩增;
异常值处理模块,用于对混类数据增强后的历史船舶运动数据进行孤立森林异常值检测并对异常值进行处理;
特征提取模型构建模块,用于通过TCN获取深度特征,通过BIGRU网络获取时间特征,然后进行特征融合,并通过注意力增强操作对空间特征进行增强,从而完成特征提取模型的构建;
输出模块,用于利用分类器对特征提取模型提取后的样本进行分类并输出分类结果,该分类结果作为船舶运动预测结果。
第三方面,提供一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述基于深度学习的船舶运动预测方法。
第四方面,本发明提供一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括上述基于深度学习的船舶运动预测方法。
本发明未详尽之处,均可采用现有技术。
本发明的有益效果为:
1、与现有技术相比,本发明能够有效提高船舶运动预测任务中的预测精度,同时在特征提取阶段提出的改进算法有利于算法模型对船舶运动数据特征的充分挖掘和深度提取,此外,本发明的算法模型具有较高的鲁棒性和泛化能力。
2、本发明通过混类数据增强操作增加模型的泛化能力,减少模型对噪声的敏感性,提升模型训练时的稳定性,可以实现对每一类的样本分别进行数据扩增。
3、与现有技术相比,在面对海量数据集的情况下,采用人工处理的方式势必会造成工作量过大。因此,本发明选用孤立森林异常值检测,该方法具有简单易行、相对精确以及适用性广泛的优点。
4、本发明利用TCN层获取深度特征,并利用BIGRU层获取时间特征,然后进行特征融合,并进一步进行注意力增强操作。在特征融合阶段,本发明中对神经网络的参数寻优方法采用基于混合蜣螂优化算法代替传统梯度下降算法,从而避免传统梯度下降算法容易产生的梯度消失和梯度爆炸现象。而且本发明在设计时,采取了构建虚拟的数据样本和数据混类增强的操作,能提高模型的泛化能力,增强模型的鲁棒性,可很好地解决蜣螂群算法本身存在的模型泛化能力受限的问题。
5、与现有技术相比,本发明通过引入注意力模块,通过注意力增强操作可在特征提取时,提高特征自适应细化的能力,从而进一步提升预测效果。
附图说明
图1为本发明实施例的一种基于深度学习的船舶运动预测方法的流程示意图;
图2为本发明的船舶运动响应仿真原理;
图3为本发明中利用神经网络进行特征融合的流程示意图;
图4为本发明实施例的电子装置的硬件结构示意图;
图中,1-存储器,2-处理器,3-传输设备,4-输入输出设备。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述,但不仅限于此,本发明未详尽说明的,均按本领域常规技术。
实施例1
一种基于深度学习的船舶运动预测方法,如图1~图3所示,包括如下步骤:
(1)获取历史船舶运动数据并进行降噪、归一化处理;
在本实施例中,获取船舶的历史运动数据,并对数据进行预处理,按一定比例分为训练集和测试集。船舶历史运动数据包括间接的波浪参数和船舶参数,也可为直接的摇荡运动历史的运动时间序列,二者关系如图2所示。数据预处理可以减小噪音数据对实验结果的影响,便于实验效果的测量。因此,本发明将所用到的数据进行最大最小归一化,使数据映射到区间[-1,1]之间,如下式所示:
;
其中,x是输入数据,xmax是取最大输入数据值,xmin是取最小输入数据值,是归一化输出值。
(2)对历史船舶运动数据进行混类数据增强操作,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本,从而实现数据扩增;
在本实施例中期望增加模型的泛化能力,减少模型对噪声的敏感性,提升模型训练时的稳定性。对此,考虑增加样本的多样性,使得模型能够从丰富的样本数据中学习到一般规律,提升其泛化能力,本发明引入了数据增强策略,可以实现对每一类的样本分别进行数据扩增,属于同类增强,但是这种方法与数据集密切相关,且需要一定的领域知识。为此本发明提出一种独立于数据集的数据扩增方式,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本。本发明引入了Mixup的思想,混类数据增强操作基于Mixup,按照设定的权重对历史船舶运动数据中的训练集中随机抽取出的两个样本及其标签进行加权求和,以得到虚拟的数据样本,公式如下:
;
;
;
其中,与是增强前的数据样本,与是增强前的数据样本标签,Beta( )是贝塔函数,x是增强后的数据样本,y是增强后的数据样本标签,符号λ表示组合的权重,超参数γ控制样本-标签对之间的插值强度。通过数据增强操作,获得增强后的船舶运动数据。
其中,Mixup中原有的方式为线性插值,而本发明改用加权求和的方式,具有鲁棒性更高,模型学习能力好的优点,可增加模型的泛化能力,减少模型对噪声的敏感性,提升模型训练时的稳定性,最终实现船舶运动预测精度的提高。
(3)在本实施例中,采集到的数据有的要素值或大或小,明显偏离了实际情况,即所谓的异常值。但是,在面对海量数据集的情况下,采用人工处理的方式势必会造成工作量过大。孤立森林算法利用了一种“隔离”的思想,利用超平面对各数据点进行随机特征分割,其中异常值较正常值更易被分割并筛选出来,更易被“隔离”,该算法具有实现简单、适用性强、识别准确率高等特点。
对混类数据增强后的历史船舶运动数据进行孤立森林异常值检测并对异常值进行处理,然后对异常值采用拉格朗日插值法进行修正处理,计算公式如下:
;
其中,tt为数据值异常的时刻;a、b分别为tt时刻前、后一段时间的数据点数;和分别为初始数据序列中tt-i和tt+n时刻的数据值;为修正后的tt时刻的数据值。
(4)通过TCN层获取深度特征,通过BIGRU网络获取时间特征,然后利用神经网络进行特征融合,并通过注意力增强操作对空间特征进行增强,构建基于神经网络的特征提取模型并训练模型;
深度特征和时间特征通过TCN-BIGRU结构获取,TCN-BIGRU结构包括输入层、TCN层、BIGRU层和输出层,建立模型如图3所示,具体为:
TCN层对时序数据进行首次特征提取,获取深度特征,TCN层由多层残差块组成,利用多层残差块结构降低网络梯度消失的可能性,单层残差块包括膨胀卷积与因果卷积、Dropout机制、激活函数以及权值规范化机制,其中,因果卷积、膨胀卷积与残差块之间的连接为TCN层的关键特征。
因果卷积应用于时序数据的数据分析任务,在卷积操作中引入因果性,确保输出只依赖于过去和现在的输入数据,不受未来信息的影响。同时这意味着因果卷积容易受到历史数据的影响。这种结构不能为更长的时间序列提供更好的预测。
膨胀卷积则是为了解决因果卷积只能接收短时间历史信息的问题。令输入端能够被间隔采样,感受野大小也会随层数而加倍增长;该模型的逐层采样率由d决定;更正式地说,对于一维序列输入和卷积核f:{0,...,k-1}→R,定义了序列元素s上的膨胀卷积运算F:
;
F(s)表示卷积层的输出值,xs表示输入序列的第s个时间步的值,f(i)是卷积核的第i个参数,d是膨胀率,i是卷积核的索引。
残差块之间的连接:在训练过程中,通常要考虑到降低训练深层网络的难度;加入残差块之间的连接结构降低训练难度的高效方式;残差连接使信息能够跨层传递;残差块运算方式如下:
;
其中,o表示残差块输出值,,F()表示膨胀卷积,Activation表示激活函数。
BIGRU层对TCN提取后的特征向量进行二次特征提取,获取时间特征,BIGRU层由两个方向的GRU网络组成,一个GRU网络从前向后处理TCN层的输出向量,另一个GRU网络从后向前处理TCN层的输出向量进行学习,得到双向的时序特征,并非时序特征的合并。这种双向结构可以同时捕捉到过去和未来的信息,从而更全面地建模时间序列数据中的时序关系。具体的,利用双向GRU的机制,使用前向和反向的两个GRU网络结构对TCN网络的输出向量进行学习,记住t时刻的GRU层的隐层状态为。
GRU网络相对于LSTM结构上进行简化,使得参数更少更容易收敛。GRU网络除了包括两个门控单元、更新门和重置门,还包含隐藏状态和候选隐藏状态。GRU网络的表达式如下:
;
;
;
;
其中,表示t时刻更新门的输出,表示t时刻的重置门的输出,σ表示sigmoid函数,和分别表示隐藏状态和候选隐藏状态的输出,表示输入到更新门的权重矩阵,表示隐藏状态到更新门的权重矩阵,表示输入到候选隐藏状态的权重矩阵,表示更新门的偏置向量,表示重置门的偏置向量,表示候选隐藏状态的偏置向量。
通过神经网络融合深度特征和时间特征,该神经网络输入层神经元数量与深度特征和时间特征的总数相等,可有效地提高模型的性能和泛化能力。
本实施例中对神经网络的参数寻优方法采用基于混合蜣螂优化算法代替传统梯度下降算法,从而避免传统梯度下降算法容易产生的梯度消失和梯度爆炸现象。蜣螂算法(DBO)灵感来自于蜣螂的滚球、跳舞、觅食、偷窃和繁殖行为。该算法同时考虑了全局探索和局部开发,从而具有收敛速度快和准确率高的特点。在蜣螂优化算法中,每个蜣螂种群由四个不同的代表组成,即滚球蜣螂个体、孵卵蜣螂个体(卵球蜣螂)、小蜣螂个体和偷窃蜣螂个体。针对蜣螂优化算法的缺点,融合改进tent混沌映射、Levy飞行策略、禁忌搜索算法和自适应T 分布变异策略、动态亚群策略来改进 DBO,形成混合蜣螂优化算法。其中,改进tent混沌映射能提高种群初始解的多样性,动态亚群策略提高全局搜素能力,禁忌搜索增强局部搜索能力,使全局探索和局部开发能力达到良好的平衡。自适应T分布变异能够避免后期个体快速同化提高后期种群多样性快速跳出局部最优。
混合蜣螂优化算法的参数寻优方法为:
随机生成e个蜣螂位置,对蜣螂种群进行改进后的tent混沌映射初始化,将迭代产生的矢量分别映射到需优化变量的可行域内,设置种群规模、最大迭代次数等算法参数;
改进后的tent混沌映射如下:
;
;
式中,k表示映射次数,表示第k次映射的函数值;
运用初始化后的TCN-BIGRU神经网络进行船舶运动的拟合,得到船舶运动数据的拟合值;选择适应度函数并测试集船舶运动的拟合值和期望值的均方误差MSE作为混合蜣螂优化算法的适应度函数推进算法的空间搜索,此值越小表明预测模型具有更好的准确度,公式表示为:
;
式中,为船舶运动的拟合值,为船舶运动的期望值,在整个空间区域迭代寻优,使适应度函数值最小处即为空间最优解;
选择适应度函数并计算每个蜣螂位置的适应度函数值,引入亚群策略取适应度值前B个蜣螂个体作为种群初始个体,对B个蜣螂个体进行适应度值降序排列,全局最优蜣螂个体记为B best ,依次平均分配到m个亚群中,每个亚群中的蜣螂个体数为n,按一定比例根据适应度函数值将种群划分为四个子种群:滚球蜣螂、卵球蜣螂、小蜣螂和偷窃蜣螂,记录每个亚群中最好、最差的蜣螂个体B best 与B worse ,则有B=m×n;
优选的,初始化后,更新蜣螂位置,通过模拟蜣螂的行为,一共有五种行为,如下:
①滚球:
蜣螂在滚动过程中通过外界信息来导航,以保持粪球在直线上滚动;为了模拟滚动球的行为,需要蜣螂在整个搜索空间中沿着给定的方向移动;
迭代前期,蜣螂有目标地进行滚动,处于正常全局探索阶段,按下列公式进行位置更新:
式中,t表示当前迭代次数,代表第t次迭代蜣螂i的位置信息,为偏转系数是一个常量,b为常数范围在(0,1);α是自然系数,值为1或-1,当α=1时,表示无偏差;当α=-1时,会偏离方向;表示全局最差位置,Δx用于模拟光强的变化;δ=rand(1);ST=(0.5,1];
②跳舞:
蜣螂遇到障碍物无法前进时,需要通过跳舞行为来改变方向,以获得新的路线,使用正切函数进行模拟,如下所示:
;
式中,θ表示偏转角,表示蜣螂i在第t次迭代时,其位置与第t-1次时的位置差,以起到参考历史信息的作用,需要说明的是当θ值为0,π/2,π时,正切函数无值,此时表示不更新位置;
迭代后期,蜣螂没有明确的滚动目标,,但是会通过一种禁忌搜索的方式进行移动从而替代蜣螂原有的正切跳舞策略,对每个蜣螂种群分别进行禁忌搜索来调整其中最差蜣螂个体的位置,如果此局部搜索能够得到一个更好的蜣螂位置,则用其取代原来的蜣螂个体;局部搜索过程中,禁忌搜索算法的主要过程如下:
给定最差蜣螂个体为中心,在其邻域内生成一组候选集,其中为移动的步长;
判断生成的候选集中的解是否满足约束条件,若满足,保留,否则更换值重新生成;
在此组候选集中选择引起适应度函数值变化最大的作为局部最优解,取代初始解成为新的当前解,重复循环这个搜索过程;
将每次搜索得到的局部最优解放入禁忌表中,以避免此解再次被找到;
每个蜣螂亚群都执行了一定的局部搜索(禁忌搜索是一种搜索优化方法,局部搜索与全局搜索对应,可以理解局部最优处搜索,而禁忌搜索是搜索后期局部搜索采取的方法)进化后,将各个亚群合并到整体,保留此时适应度值前20%的蜣螂个体,整体根据觅食、繁殖和偷窃行为进行蜣螂群迭代后替代其中较差的20%,并更新新的全局极值B best 。
若禁忌搜索无法得到更好的螳螂位置,就按tent混沌生成一个新个体取代原来最差的蜣螂个体。
③繁殖:
蜣螂会滚动粪球到安全位置,繁衍后代,每次繁殖产生一个后代,通过边界选择策略模拟产卵区域,公式如下:
;
;
;
式中,表示当前局部最优位置;和分别表示产卵区域的下界和上界;表示最大迭代次数;Bt和Bl分别表示优化问题的下界和上界分别表示优化问题的下界和上界;需要说明的是,雌性蜣螂产卵区域的边界范围随着迭代次数动态调整。
一旦确定了产卵区域,雌性蜣螂在此区域内进行产卵,每只雌性蜣螂在每次迭代中只会生产一个卵球,边界范围随着R值得变化而变化,所以下一代的卵球位置也会变化,增强了局部搜索能力,下一代的位置信息为:
;
式中:为第i个卵球在第t次迭代时的位置信息;b 1和b 2表示两个大小为1×D的独立随机向量,D表示优化问题的维数;
④觅食:
觅食行为与繁殖行为类似,觅食行为的种群称为小蜣螂,小蜣螂的觅食区域公式如下:
;
;
式中,表示当前全局最优位置;和分别表示最佳觅食区域的下界和上界;表示最大迭代次数;
对于小蜣螂种群,为提高全局搜索能力,引入了Levy飞行策略,由此可知,小蜣螂的位置更新公式如下:
式中:是小蜣螂i在第t次迭代的位置信息,C 1是[0 ,1]之间的随机数,是元素相乘;
Levy飞行策略是一种随机行走策略,多数情况下,模拟的步长较小,偶尔也会有较大步长的情况,可以帮助跳出局部最优的情况,其公式如下:
;
式中,Levy(β)为服从参数β的Levy分布,0<β<2,μ服从分布,v服从N(0,1)分布,σ可以由下列公式计算得到:
;
式中,Γ代表伽马分布函数,β为常数;
⑤偷窃:
偷取其他蜣螂粪球的蜣螂称为偷窃蜣螂,由觅食可知,是全局最优值,模拟蜣螂的偷窃行为相当于收敛的过程,围绕展开的位置变化公式如下:
;
式中,代表偷窃蜣螂i在第t次迭代的位置信息,S是常量,g是大小为1×D的服从正态分布的随机向量。
本发明的迭代前期为正常搜索阶段,蜣螂按照滚球、跳舞、觅食、繁殖和偷窃五种行为更新所有蜣螂的位置,其中,觅食阶段引入Levy飞行策略提高全局搜索能力;
迭代后期,局部寻优阶段,蜣螂用禁忌搜索方式替代蜣螂原有的正切跳舞策略调整其中最差蜣螂个体的位置;如果此局部搜索能够得到一个更好的蜣螂位置,则用其取代原来的蜣螂个体;否则,就按tent混沌映射生成一个新个体取代原来最差的蜣螂个体;
判断各个蜣螂是否在边界外,计算蜣螂适应度函数值,更新当前最优解及其适应度函数值;
利用自适应T分布变异策略,对其他蜣螂的位置进行更新;计算出更新后的蜣螂个体位置最优函数值,利用贪婪规则与前一代最优函数值比较,如果较优,则更改目前适应度函数最优值;
蜣螂种群进行重新汇合、排序、再分类,适应度函数值达到设定精度或迭代到最大次数是否满足要求,若不满足要求则返回继续迭代,否则,输出全局最优个体位置和最优的函数值。
进一步的,引入注意力增强模块进行空间特征增强。TCN层和BIGRU层的结合能够使用TCN层做特征提取的同时,使用BIGRU层做序列预测,而注意力机制增强模块,能从大量的信息中选出更重要的部分,有利于提高船舶运动的准确率。注意力增强操作能从大量的信息中选出更重要的部分,有利于提高船舶运动的准确率;
注意力增强操作中自注意力机制通过下述公式来计算矩阵输出:
;
式中:Q表示一组查询向量矩,K表示一组键向量矩阵,表示keys的维度,V表示特征的向量矩阵,首先计算Q与KT的点乘,然后为了防止其结果过大,会除以,再利用softmax操作将其结果归一化为概率分布,最后乘以矩阵V得到权重。
(5)利用分类器对特征提取模型提取后的样本进行分类并输出分类结果,该分类结果作为船舶运动预测结果。
在本实施例中,本申请采用softmax分类函数对特征提取后的样本进行分类。softmax函数为:
;
表示特征向量中的第i个元素,是每个类别的得分,softmax函数将输入向量中的元素映射到(0,1)区间内,得到输入向量的概率向量,则船舶运动预测的输出类别为softmax函数映射得到的概率向量中最大概率值所对应的类别。
实施例2
一种基于深度学习的船舶运动预测系统,包括:
采集模块,用于获取历史船舶运动数据并进行降噪、归一化处理;
数据增强模块,用于对历史船舶运动数据进行混类数据增强操作,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本,从而实现数据扩增;
异常值处理模块,用于对混类数据增强后的历史船舶运动数据进行孤立森林异常值检测并对异常值进行处理;
特征提取模型构建模块,用于通过TCN获取深度特征,通过BIGRU网络获取时间特征,然后进行特征融合,并通过注意力增强操作对空间特征进行增强,从而完成特征提取模型的构建;
输出模块,用于利用分类器对特征提取模型提取后的样本进行分类并输出分类结果,该分类结果作为船舶运动预测结果。
实施例3
一种电子装置,如图4所示,包括存储器1和处理器2,存储器1中存储有计算机程序,处理器2被设置为运行计算机程序以执行实施例1的基于深度学习的船舶运动预测方法。
具体地,处理器2器可以是一种集成电路芯片,具有信号处理能力。在实现过程中,上述实施例1的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。处理器可以是通用处理器、数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器1可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器1可包括硬盘驱动器(HDD)、软盘驱动器、固态驱动器(SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器1可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器1可在数据处理装置的内部或外部。在特定实施例中,存储器1是非易失性存储器。在特定实施例中,存储器1包括只读存储器(ROM)和随机存取存储器(RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM (EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(SRAM)或动态随机存取存储器(DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(FPMDRAM)、扩展数据输出动态随机存取存储器(EDOD RAM)、同步动态随机存取内存(SDRAM)等。
存储器1可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器2所执行的可能的计算机程序指令。
处理器2通过读取并执行存储器1中存储的计算机程序指令,以实现上述实施例1中的基于深度学习的船舶运动预测方法。
可选地,上述电子装置还可以包括传输设备3以及输入输出设备4,其中,该传输设备3和处理器2连接,该输入输出设备4和处理器2连接。
传输设备3可以用来经由一个网络接收或者发送数据。上述的网络具体实例可包括电子装置的通信供应商提供的有线或无线网络。在一个实例中,传输设备包括一个网络适配器(NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备3可以为射频(RF)模块,其用于通过无线方式与互联网进行通讯。
输入输出设备4用于输入或输出信息。在本实施例中,输入的信息可以是船舶升沉位移数据等,输出的信息可以是船舶升沉位移预测结果等。
实施例4
一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括实施例1的基于深度学习的船舶运动预测方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (3)
1.一种基于深度学习的船舶运动预测方法,其特征在于,包括如下步骤:
(1)获取历史船舶运动数据并进行降噪、归一化处理;
(2)对历史船舶运动数据进行混类数据增强操作,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本,从而实现数据扩增;
(3)对混类数据增强后的历史船舶运动数据进行孤立森林异常值检测并对异常值进行处理;
(4)通过TCN层获取深度特征,通过BIGRU网络获取时间特征,然后利用神经网络进行特征融合,并通过注意力增强操作对空间特征进行增强,构建基于神经网络的特征提取模型并训练模型;
(5)利用分类器对特征提取模型提取后的样本进行分类并输出分类结果,该分类结果作为船舶运动预测结果;
步骤(1)中,归一化处理使数据映射到区间[-1,1]之间,如下式所示:
其中,x是输入数据,xmax是取最大输入数据值,xmin是取最小输入数据值,x‘是归一化输出值;
步骤(2)中的混类数据增强操作基于Mixup,按照设定的权重对历史船舶运动数据中的训练集中随机抽取出的两个样本及其标签进行加权求和,以得到虚拟的数据样本,公式如下:
x=λxia+(1-λ)xja
y=λyia+(1-λ)yja
其中,xia与xja是增强前的数据样本,yia与yja是增强前的数据样本标签,Beta()是贝塔函数,x是增强后的数据样本,y是增强后的数据样本标签,符号λ表示组合的权重,超参数γ控制样本-标签对之间的插值强度;
步骤(3)中,采用孤立森林算法筛选出异常的数据值,然后对异常值采用拉格朗日插值法进行修正处理,计算公式如下:
其中,tt为数据值异常的时刻;a、b分别为tt时刻前、后一段时间的数据点数;xtt-i和xtt+n分别为初始数据序列中tt-i和tt+n时刻的数据值;xtt为修正后的tt时刻的数据值;
步骤(4)中,深度特征和时间特征通过TCN-BIGRU结构获取,TCN-BIGRU结构包括输入层、TCN层、BIGRU层和输出层;
所述TCN层对时序数据进行首次特征提取,获取深度特征,TCN层由多层残差块组成;
BIGRU层对TCN提取后的特征向量进行二次特征提取,获取时间特征,BIGRU层由两个方向的GRU网络组成,一个GRU网络从前向后处理TCN层的输出向量,另一个GRU网络从后向前处理TCN层的输出向量进行学习,得到双向的时序特征;
步骤(4)中,通过神经网络融合深度特征和时间特征,该神经网络输入层神经元数量与深度特征和时间特征的总数相等;神经网络的参数寻优方法采用基于混合蜣螂优化算法实现;
混合蜣螂优化算法的参数寻优方法为:
随机生成e个蜣螂位置,对蜣螂种群进行改进后的tent混沌映射初始化,将迭代产生的矢量分别映射到需优化变量的可行域内,设置种群规模、最大迭代次数算法参数;
改进后的tent混沌映射如下:
zk+1=2*(zk+0.1*rand(0,1)),if 0≤zk<0.5
zk+1=2-2*(zk+0.1*rand(0,1)),if 0.5≤zk≤1
式中,k表示映射次数,zk表示第k次映射的函数值;
选择适应度函数并计算每个蜣螂位置的适应度函数值,适应度函数fitnessx为:
式中,yi为船舶运动的拟合值,为船舶运动的期望值,在整个空间区域迭代寻优,使适应度函数值最小处即为空间最优解;
引入亚群策略取适应度值前B个蜣螂个体作为种群初始个体,对B个蜣螂个体进行适应度值降序排列,全局最优蜣螂个体记为Bbest,依次平均分配到m个亚群中,每个亚群中的蜣螂个体数为n,按比例根据适应度函数值将种群划分为四个子种群:滚球蜣螂、卵球蜣螂、小蜣螂和偷窃蜣螂,记录每个亚群中最好、最差的蜣螂个体Bbest与Bworse,则有B=m×n;
迭代前期,正常搜索阶段,蜣螂按照滚球、跳舞、觅食、繁殖和偷窃五种行为更新所有蜣螂的位置,其中,觅食阶段引入Levy飞行策略提高全局搜索能力;
迭代后期,局部寻优阶段,蜣螂用禁忌搜索方式替代蜣螂原有的正切跳舞策略调整其中最差蜣螂个体的位置;如果此局部搜索能够得到一个更好的蜣螂位置,则用其取代原来的蜣螂个体;否则,就按tent混沌映射生成一个新个体取代原来最差的蜣螂个体;
判断各个蜣螂是否在边界外,计算蜣螂适应度函数值,更新当前最优解及其适应度函数值;
利用自适应T分布变异策略,对其他蜣螂的位置进行更新;计算出更新后的蜣螂个体位置最优函数值,利用贪婪规则与前一代最优函数值比较,如果较优,则更改目前适应度函数最优值;
蜣螂种群进行重新汇合、排序、再分类,适应度函数值达到设定精度或迭代到最大次数是否满足要求,若不满足要求则返回继续迭代,否则,输出全局最优个体位置和最优的函数值。
2.根据权利要求1所述的基于深度学习的船舶运动预测方法,其特征在于,蜣螂的五种行为如下:
①滚球:
蜣螂在滚动过程中通过外界信息来导航,以保持粪球在直线上滚动;
迭代前期,蜣螂有目标地进行滚动,处于正常全局探索阶段,按下列公式进行位置更新:
Δx=|xi(t)-Xw|,δ<ST
式中,t表示当前迭代次数,xi(t)代表第t次迭代蜣螂i的位置信息,为偏转系数是一个常量,b为常数范围在(0,1);α是自然系数,值为1或-1,当α=1时,表示无偏差;当α=-1时,会偏离方向;Xw表示全局最差位置,Δx用于模拟光强的变化;δ=rand(1);ST=(0.5,1];
②跳舞:
蜣螂遇到障碍物无法前进时,需要通过跳舞行为来改变方向,以获得新的路线,使用正切函数进行模拟,如下所示:
xi(t+1)=xi(t)+tanθ|xi(t)-xi(t-1)|
式中,θ表示偏转角,|xi(t)-xi(t-1)|表示蜣螂i在第t次迭代时,其位置与第t-1次时的位置差,以起到参考历史信息的作用,当θ值为0,π/2,π时,正切函数无值,此时表示不更新位置;
迭代后期,蜣螂没有明确的滚动目标,δ>ST,通过一种禁忌搜索的方式进行移动从而替代蜣螂原有的正切跳舞策略,对每个蜣螂种群分别进行禁忌搜索来调整其中最差蜣螂个体的位置,如果此局部搜索能够得到一个更好的蜣螂位置,则用其取代原来的蜣螂个体;局部搜索过程中,禁忌搜索算法过程如下:
给定最差蜣螂个体xp为中心,在其邻域内生成一组候选集其中为移动的步长;
判断生成的候选集中的解是否满足约束条件,若满足,保留,否则更换值重新生成;
在此组候选集中选择引起适应度函数值变化最大的作为局部最优解,取代初始解成为新的当前解,重复循环这个搜索过程;
将每次搜索得到的局部最优解放入禁忌表中,以避免此解再次被找到;
③繁殖:
蜣螂会滚动粪球到安全位置,繁衍后代,每次繁殖产生一个后代,通过边界选择策略模拟产卵区域,公式如下:
Bt*=min(x*×(1-R),Bt)
Bl*=max(x*×(1+R),Bl)
式中,x*表示当前局部最优位置;Bt*和Bl*分别表示产卵区域的下界和上界;Tmax表示最大迭代次数;Bt和Bl分别表示优化问题的下界和上界;
一旦确定了产卵区域,雌性蜣螂在此区域内进行产卵,每只雌性蜣螂在每次迭代中只会生产一个卵球,边界范围随着R值得变化而变化,所以下一代的卵球位置也会变化,增强了局部搜索能力,下一代的位置信息为:
Bi(t+1)=x*+b1×(Bi(t)-Bl*)+b2×(Bi(t)-Bt*),
式中:Bi(t)为第i个卵球在第t次迭代时的位置信息;b1和b2表示两个大小为1×D的独立随机向量,D表示优化问题的维数;
④觅食:
觅食行为的种群称为小蜣螂,小蜣螂的觅食区域公式如下:
Bt′=min(x′×(1-R),Bt)
Bl′=max(x′×(1+R),Bl)
式中,x′表示当前全局最优位置;Bt′和Bl′分别表示最佳觅食区域的下界和上界;Tmax表示最大迭代次数;
对于小蜣螂种群,为提高全局搜索能力,引入了Levy飞行策略,由此可知,小蜣螂的位置更新公式如下:
式中:xi(t)是小蜣螂i在第t次迭代的位置信息,C1是[0,1]之间的随机数,是元素相乘;
Levy飞行策略公式如下:
式中,Levy(β)为服从参数β的Levy分布,0<β<2,μ服从N(0,σ2)分布,v服从N(0,1)分布,σ可以由下列公式计算得到:
式中,Γ代表伽马分布函数,β为常数;
⑤偷窃:
偷取其他蜣螂粪球的蜣螂称为偷窃蜣螂,模拟蜣螂的偷窃行为,相当于收敛的过程,围绕x′展开的位置变化公式如下:
xi(t+1)=x′+S×g×(|xi(t)-x*|+|xi(t)-x′|)
式中,xi(t)代表偷窃蜣螂i在第t次迭代的位置信息,S是常量,g是大小为1×D的服从正态分布的随机向量。
3.根据权利要求2所述的基于深度学习的船舶运动预测方法,其特征在于,注意力增强操作中自注意力机制通过下述公式来计算矩阵输出:
式中:Q表示一组查询向量矩,K表示一组键向量矩阵,dk表示keys的维度,V表示特征的向量矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311800936.8A CN117454124B (zh) | 2023-12-26 | 2023-12-26 | 一种基于深度学习的船舶运动预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311800936.8A CN117454124B (zh) | 2023-12-26 | 2023-12-26 | 一种基于深度学习的船舶运动预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117454124A CN117454124A (zh) | 2024-01-26 |
CN117454124B true CN117454124B (zh) | 2024-03-29 |
Family
ID=89593328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311800936.8A Active CN117454124B (zh) | 2023-12-26 | 2023-12-26 | 一种基于深度学习的船舶运动预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117454124B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117668671B (zh) * | 2024-02-01 | 2024-04-30 | 成都工业学院 | 一种基于机器学习的教育资源治理方法 |
CN117828306A (zh) * | 2024-03-01 | 2024-04-05 | 青岛哈尔滨工程大学创新发展中心 | 一种基于船舶运动频谱特征的数据样本扩充方法及系统 |
CN117892886B (zh) * | 2024-03-18 | 2024-05-28 | 青岛哈尔滨工程大学创新发展中心 | 基于置信区间的船舶运动极短期概率预报方法及系统 |
CN118192478B (zh) * | 2024-05-17 | 2024-09-27 | 南通金芸流体设备有限公司 | 一种金属零件加工控制系统 |
CN118228609B (zh) * | 2024-05-23 | 2024-07-16 | 昆明理工大学 | 一种矿山爆破装药结构选择方法和系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900358A (zh) * | 2018-08-01 | 2018-11-27 | 重庆邮电大学 | 基于深度信念网络资源需求预测的虚拟网络功能动态迁移方法 |
CN114399101A (zh) * | 2021-12-30 | 2022-04-26 | 华中科技大学无锡研究院 | 基于tcn-bigru的燃气负荷预测方法和装置 |
WO2022247049A1 (zh) * | 2021-05-24 | 2022-12-01 | 苏州大学 | 基于复数值前向神经网络的风速预测方法 |
CN116110234A (zh) * | 2023-04-11 | 2023-05-12 | 城云科技(中国)有限公司 | 基于人工智能的车流量预测方法、装置及其应用 |
CN116342657A (zh) * | 2023-03-29 | 2023-06-27 | 西安电子科技大学 | 一种基于编码-解码结构的tcn-gru船舶轨迹预测方法、系统、设备及介质 |
CN116861617A (zh) * | 2023-04-27 | 2023-10-10 | 哈尔滨理工大学 | 一种基于IWOA-TCN-Attention模型的船舶姿态预测方法 |
CA3199602A1 (en) * | 2022-05-16 | 2023-11-16 | Royal Bank Of Canada | Multi-scale artificial neural network and a method for operating same for time series forecasting |
CN117096871A (zh) * | 2023-08-29 | 2023-11-21 | 长沙理工大学 | 一种基于时空分布的风电功率概率密度的预测方法 |
CN117131782A (zh) * | 2023-09-20 | 2023-11-28 | 南通大学 | 一种基于改进蜣螂算法的船舶推力分配方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097185B (zh) * | 2019-03-29 | 2021-03-23 | 北京大学 | 一种基于生成对抗网络的优化模型方法及应用 |
CN112653142B (zh) * | 2020-12-18 | 2022-09-02 | 武汉大学 | 优化深度Transformer网络的风电功率预测方法及系统 |
-
2023
- 2023-12-26 CN CN202311800936.8A patent/CN117454124B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900358A (zh) * | 2018-08-01 | 2018-11-27 | 重庆邮电大学 | 基于深度信念网络资源需求预测的虚拟网络功能动态迁移方法 |
WO2022247049A1 (zh) * | 2021-05-24 | 2022-12-01 | 苏州大学 | 基于复数值前向神经网络的风速预测方法 |
CN114399101A (zh) * | 2021-12-30 | 2022-04-26 | 华中科技大学无锡研究院 | 基于tcn-bigru的燃气负荷预测方法和装置 |
CA3199602A1 (en) * | 2022-05-16 | 2023-11-16 | Royal Bank Of Canada | Multi-scale artificial neural network and a method for operating same for time series forecasting |
CN116342657A (zh) * | 2023-03-29 | 2023-06-27 | 西安电子科技大学 | 一种基于编码-解码结构的tcn-gru船舶轨迹预测方法、系统、设备及介质 |
CN116110234A (zh) * | 2023-04-11 | 2023-05-12 | 城云科技(中国)有限公司 | 基于人工智能的车流量预测方法、装置及其应用 |
CN116861617A (zh) * | 2023-04-27 | 2023-10-10 | 哈尔滨理工大学 | 一种基于IWOA-TCN-Attention模型的船舶姿态预测方法 |
CN117096871A (zh) * | 2023-08-29 | 2023-11-21 | 长沙理工大学 | 一种基于时空分布的风电功率概率密度的预测方法 |
CN117131782A (zh) * | 2023-09-20 | 2023-11-28 | 南通大学 | 一种基于改进蜣螂算法的船舶推力分配方法 |
Non-Patent Citations (3)
Title |
---|
An Improved Optimization Dung Beetle Algorithm;Haiyang Zhang 等;《2023 4th International Symposium on Computer Engineering and Intelligent Communications (ISCEIC)》;20231009;全文 * |
Tent Chaotic Map and Population Classification Evolution Strategy-Based Dragonfly Algorithm for Global Optimization;Yu Wang 等;《Mathematical Problems in Engineering》;20220930;全文 * |
基于孤立森林和GRU-CNN-Attention的超短期电力负荷预测;陈雷;《电子设计工程》;20231020;第141页第5-6段 * |
Also Published As
Publication number | Publication date |
---|---|
CN117454124A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117454124B (zh) | 一种基于深度学习的船舶运动预测方法及系统 | |
CN109711529B (zh) | 一种基于值迭代网络的跨领域联邦学习模型及方法 | |
Cui et al. | Efficient human motion prediction using temporal convolutional generative adversarial network | |
CN114548591B (zh) | 一种基于混合深度学习模型和Stacking的时序数据预测方法及系统 | |
Suryo et al. | Improved time series prediction using LSTM neural network for smart agriculture application | |
CN112464996A (zh) | 基于LSTM-XGBoost的智能电网入侵检测方法 | |
CN112070241A (zh) | 基于机器学习模型的植物生长预测方法、装置和设备 | |
CN115034426B (zh) | 一种基于相空间重构与多模型融合Stacking集成学习方式的滚动负荷预测方法 | |
CN116910534A (zh) | 一种不同海域海洋环境要素时空智能预测方法和装置 | |
Avi et al. | Incremental online learning algorithms comparison for gesture and visual smart sensors | |
CN110443347A (zh) | 神经网络方法和装置 | |
Huang et al. | In-Context Decision Transformer: Reinforcement Learning via Hierarchical Chain-of-Thought | |
Xiaowei | An Optimized CNN-SVM Algorithm for UAV Anomaly Detection | |
CN117976047B (zh) | 基于深度学习的关键蛋白质预测方法 | |
CN118228613B (zh) | 一种改进tso优化深度学习模型的软测量方法 | |
CN117057422B (zh) | 一种全局知识汇聚感知的知识追踪系统 | |
CN117784615B (zh) | 一种基于impa-rf的火控系统故障预测方法 | |
CN117972315B (zh) | 基于混合神经网络预测模型的漂流浮标轨迹预测方法 | |
Dong et al. | Soft Sensor Method based on Quality-related Virtual Sample Generation and Sample-weighted Learning | |
CN118865124A (zh) | 一种稻田杂草识别方法、装置、计算机设备及存储介质 | |
Pal et al. | Transfer Learning in Weather Prediction: Why, How, and What Should | |
Zhang et al. | Vessel trajectory prediction with a Gated Spatio-Temporal Graph Aggregation Network | |
CN116401515A (zh) | 一种面向海洋观测数据的洋流预测方法 | |
Anagnostopoulos | Training & acceleration of deep reinforcement learning agents | |
Kovács | Safe reinforcement learning in long-horizon partially observable environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |