CN117114207B - 一种海上人员漂移轨迹预测方法 - Google Patents
一种海上人员漂移轨迹预测方法 Download PDFInfo
- Publication number
- CN117114207B CN117114207B CN202311369008.0A CN202311369008A CN117114207B CN 117114207 B CN117114207 B CN 117114207B CN 202311369008 A CN202311369008 A CN 202311369008A CN 117114207 B CN117114207 B CN 117114207B
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- attention
- track
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 42
- 230000007246 mechanism Effects 0.000 claims abstract description 18
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 230000009977 dual effect Effects 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 65
- 230000006870 function Effects 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims 1
- 238000013135 deep learning Methods 0.000 abstract description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000036544 posture Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000764238 Isis Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Computer Security & Cryptography (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种海上人员漂移轨迹预测方法,属于漂移轨迹预测领域,其步骤为:获取海上人员漂移轨迹数据,并对漂移轨迹数据进行预处理;基于预处理后的数据集构建关于时间序列的训练集和测试集;构建基于双重自注意力机制的空洞卷积‑GRU网络模型,其包括特征多头自注意力模块、空洞卷积网络模块、两层GRU网络模块和时序自注意力模块,使用训练集训练该模型;使用训练好的模型预测海上人员未来时刻的漂移轨迹。本发明采用深度学习的方法,构建双重自注意力机制的空洞卷积‑GRU网络模型,充分提取轨迹特征,通过双重自注意力机制关注重要特征以及关键时刻对预测轨迹的影响,提高海上救援指挥和协调工作的效率与准确性。
Description
技术领域
本发明属于漂移轨迹预测领域,具体涉及一种海上人员漂移轨迹预测方法。
背景技术
随着海上生产活动的增多,人员落水事件频发。通过对海上人员位置的动态监测,能够降低落水事件报警的滞后性,提高落水人员救援的及时性,增强海上生产的安全性。目前海上人员位置监测采用佩戴示位终端的方式,当人员落水后利用卫星定位系统定时发送漂移位置,实现监测漂移轨迹的目的,为后方救援提供信息支持,提高搜救效率。在落水人员海上漂移过程中,示位标卫星定位模块易受海上天气状况、人员落水姿态、示位标佩戴位置等因素的影响,接收到的卫星信号容易出现延迟甚至中断的情况,无法及时发送精确地位置信息,导致后方接收落水人员位置信息误差较大甚至失联,影响救援效率、增加救援工作难度,造成严重的生命财产损失。
近年来,研究人员开展了大量海上人员漂移轨迹预测研究。以概率统计方法为主的漂移估计预测研究,利用大量的实验数据,建立运动学相关方程进行漂移轨迹预测。这类方法非线性能力预测有限,在具有明显的非线性时序特征的海上人员漂移轨迹研究中的预测精度较低。
深度学习的方法能够提取特征并自动关注上下文信息,具有更好的数据拟合和预测性能,在处理非线性时间序列问题上取得了较好的预测精度。目前利用深度学习方法进行海上目标漂移物轨迹预测算法研究的对象多为船只、浮标以及AUV等。海上目标漂移物种类不同,考虑的外部影响因素以及海上漂移特性也不相同,已有算法在海上人员漂移轨迹预测领域的预测效果难以满足需求。实验研究表明,海上人员漂移轨迹主要受到海风,海流以及波浪的影响,当落水目标长度小于50m相对于海浪波长较小时,可以忽略波浪对落水目标的影响。因此对于海上落水人员而言,漂移轨迹主要受到海风与海流两方面因素的影响。其中,海上漂移人员的落水姿态主要分为水平与垂直,在海风与海流相对稳定的前提下,海上漂移人员不同的落水姿态决定海风与海流对其影响的比例,导致漂移轨迹出现明显差异。
现有的海上目标漂移物轨迹预测算法主要分为多输入单输出与多输入多输出两种模式。多输入单输出模式将多个环境变量以及历史轨迹作为输入,将漂移距离作为输出,预测结果缺少漂移方向,难以满足落水人员位置监测的精确定位需要;多输入多输出模式融合参数的多维特征实现对人员轨迹的预测,预测结果为未来一段时间的位置经纬度,但是忽视了对重要特征以及关键时间的关注,导致算法的精度较低、实时性不高。
发明内容
针对现有技术中存在的上述技术问题,本发明提供一种海上人员漂移轨迹预测方法,设计合理,解决了现有技术的不足,具有良好的效果。
本发明采用如下技术方案:
一种海上人员漂移轨迹预测方法,包括以下步骤:
S1、获取海上人员漂移轨迹数据作为数据集,并对漂移轨迹数据进行预处理;
S2、基于预处理后的数据集构建关于时间序列的训练集和测试集;
S3、构建基于双重自注意力机制的空洞卷积-GRU网络模型,其包括特征多头自注意力模块、空洞卷积网络模块、两层GRU网络模块和时序自注意力模块,使用训练集训练该模型,使用测试集对训练好的基于双重自注意力机制的空洞卷积-GRU网络模型进行验证;
S4、使用S3中训练好的基于双重自注意力机制的空洞卷积-GRU网络模型预测海上人员未来时刻的漂移轨迹。
进一步地,所述S1中,所述漂移轨迹数据包括海风数据、海流数据以及历史轨迹数据,其中,海风数据分为海风经纬度坐标以及速度的东分量与北分量,海流数据分为海流经纬度坐标以及速度的东分量与北分量,历史轨迹数据包括经纬度坐标。
进一步地,所述S1中,预处理包括以下子步骤:
S1.1、对于数据集中缺失或异常数据,用该数据时间点前后的平均值进行填充和替换;
S1.2、针对数据集中出现时间间隔不统一的问题,采用线性插值法进行统一时间间隔;
S1.3、对数据进行归一化处理,其表达式为:
;
其中,为数据归一化后的值,为原始数据值,为数据集的最小值,为
数据集的最大值。
进一步地,述S2包括以下子步骤:
S2.1、将数据集中的数据按监测时间先后顺序进行排序,按照8:2的比例划分为训练集和测试集;
S2.2、将训练集和测试集中的输入和输出变量的维度处理为三维,包括batch_size、time_step、input_size、output_size,其中batch_size为一次训练输入的环境变量与轨迹数据的数量,time_step为时间步长,input_size为输入的环境变量与轨迹数据数量,output_size为输出预测的轨迹数据数量。
进一步地,所述S3中,训练过程包括以下子步骤:
S3.1、确定输入层的数据,输入数据为海流经纬度坐标、海流速度东分量、海流速
度北分量、海风经纬度坐标、海风速度东分量、海风速度北分量、历史轨迹经纬度坐标以及
时序特征变量,构建大小为的输入特征矩阵,共有个特征,,个时刻,表示为:;
S3.2、将输入到特征多头自注意力模块中,得到特征多头自注意力模块的权重,其中,计算过程为:
;
;
;
;
;
;
;
其中,为查询矩阵;为键矩阵;为值矩阵;为缩放点积注意力
函数;为的维度;为第组自注意力输出,;为查询矩阵的训练参数
矩阵;为键矩阵待学习的参数矩阵、为值矩阵待学习的参数矩阵、为转换矩阵,
将拼接的矩阵转换为指定长度的输出向量;
对输入特征矩阵X赋权,可得到输入特征加权矩阵;
S3.3、将输入到空洞卷积网络模块中,空洞卷积网络模块由三层扩张率不同的
空洞卷积层构成,确定该模块的多个超参数,超参数包括卷积核大小、卷积核移动步长、填
充大小、卷积核个数、三层空洞卷积层的扩张率大小;输出维度为[batch_size, channel,, ],其中,batch_size为批次,channel为通道数,为特征矩阵高度,为特
征矩阵宽度;
该空洞卷积网络模型输出矩阵;
S3.4、将矩阵经过维度变换为,输入到两层GRU网络模块中,确定两层GRU网
络模块的多个超参数,超参数包括隐藏层层数、隐藏层单元数、输出层层数、输出层单元数;
具体步骤为:
;
;
;
;
其中,代表重置门的值,代表更新门的值,表示输入序列当前时间步的输
入,代表上一个时间步的隐藏状态,表示当前时间步的候选隐藏状态,表示当前时
间步的隐藏状态,表示重置门中的训练参数矩阵,表示更新门中的训练参数矩阵,
表示当前时间步候选隐藏状态中的训练参数矩阵表示重置门中的偏置项,表示更新
门中的偏置项,表示当前时间步候选隐藏状态中的偏置项,为哈达码积运算符;
S3.5、将各个时刻的隐藏层状态输入到时序自注意力模块中,具体步骤为:
;
;
;
其中,是训练参数矩阵,是偏置项,是时刻评分函数的输出值,是经过归一
化之后的注意力概率得分,是时刻的注意力层的输出,将输入到全连接层得到预测结
果;
S3.6、采用Relu函数作为激活函数,使用MSE作为损失函数,采用Adam优化器对学习率进行优化,学习率为0.0001,隐藏层神经元数为64,训练网络直到模型收敛,获取最优超参数,从而获得训练好的双重自注意力的空洞卷积-GRU网络模型。
与现有技术相比,本发明分析海上人员漂移轨迹特性,综合考虑预测方法以及计算耗时等方面,采用深度学习的方法,构建双重自注意力机制的空洞卷积-GRU网络模型,充分提取轨迹特征,通过双重自注意力机制关注重要特征以及关键时刻对预测轨迹的影响,提高海上救援指挥和协调工作的效率与准确性,降低海上事故的生命财产损失。
附图说明
图1为本发明中一种海上人员漂移轨迹预测方法流程图。
图2为本发明中基于双重自注意力机制的空洞卷积-GRU网络模型结构示意图。
具体实施方式
下面结合具体实施例对本发明的具体实施方式做进一步说明:
一种海上人员漂移轨迹预测方法,如图1所示,包括以下步骤:
S1、获取海上人员漂移轨迹数据作为数据集,并对漂移轨迹数据进行预处理;
实验研究表明,海上人员漂移轨迹主要受到海风、海流以及波浪的影响,当落水目标长度小于50m相对于海浪波长较小时,可以忽略波浪对落水目标的影响。因此对于海上落水人员而言,漂移轨迹主要受到海风与海流两方面因素的影响。本发明利用海风与海流的速度与方向上的分量,海风与海流的经纬度坐标,以及当前环境下的历史轨迹共同组成输入变量。因此获取的原始数据集包括漂移轨迹数据包括海风数据、海流数据以及历史轨迹数据,其中,海风数据分为海风经纬度坐标以及速度的东分量与北分量,海流数据分为海流经纬度坐标以及速度的东分量与北分量,历史轨迹数据包括经纬度坐标。
预处理包括以下子步骤:
S1.1、对于数据集中缺失或异常数据,用该数据时间点前后的平均值进行填充和替换;
S1.2、针对数据集中出现时间间隔不统一的问题,采用线性插值法进行统一时间间隔,对时间间隔较大的数据进行填充,保证数据的准确性和完整性,线性插值法是根据插值点到已知数据点的距离分配比重,与平均法直接填充数据相比较更准确;
S1.3、对数据进行归一化处理,其表达式为:
;
其中,为数据归一化后的值,为数据的原始值,为特征输入中的最小值,为特征输入中的最大值。
S2、基于预处理后的数据集构建关于时间序列的训练集和测试集;
本算法选择海流、海风以及历史轨迹作为预测输入数据,漂移轨迹作为输出数据,预测目标是利用前1h的漂移轨迹数据预测后1h的漂移轨迹数据,线性插值处理之后采用的时间间隔为2min。
S2包括以下子步骤:
S2.1、将数据集中的数据按监测时间先后顺序进行排序,按照8:2的比例划分为训练集和测试集;
S2.2、通过滑动时间窗将训练集和测试集中的输入和输出变量的维度处理为三维,包括batch_size,time_step,input_size、output_size,其中batch_size为一次训练输入的环境变量与轨迹数据的数量,设置为30,time_step为时间步长,设置为30,input_size为输入的环境变量与轨迹数据数量,设置为10,output_size为输出预测的轨迹数据数量。
S3、构建基于双重自注意力机制的空洞卷积-GRU网络模型,如图2所示,其包括特征多头自注意力模块、空洞卷积网络模块、两层GRU网络模块和时序自注意力模块,使用训练集训练该模型,使用测试集对训练好的双重自注意力机制的空洞卷积-GRU网络模型进行测试,直到达到迭代次数或精度;
训练过程包括以下子步骤:
S3.1、确定输入层的数据,输入层使用特征自注意力机制,特征自注意力机制具有减少外部信息依赖,捕捉数据间内部相关性的优点。本发明利用特征自注意力机制挖掘历史环境数据以及历史轨迹数据之间的内部关系,实现网络模型自动关注重要特征的目的;
输入数据为海流经纬度坐标、海流速度东分量、海流速度北分量、海风经纬度坐
标、海风速度东分量、海风速度北分量、历史轨迹经纬度坐标以及时序特征变量,构建大小
为 的输入特征矩阵,共有个特征,,个时刻,表示为:。
S3.2、将输入到特征多头自注意力模块中,得到特征多头自注意力模块的权重,其中,计算过程为:
;
;
;
;
;
;
;
为的维度;为第组自注意力输出,;为查询矩阵待学习的
参数矩阵;为键矩阵待学习的参数矩阵、为值矩阵待学习的参数矩阵、为转换矩
阵,将拼接的矩阵转换为指定长度的输出向量;在得到组不同的自注意力输出后,将其拼
接,并通过转换矩阵将拼接的矩阵转换为指定长度的输出向量,即为多
头自注意力权重向量;对输入特征矩阵X赋权,可得到输入特征加权矩阵,其表达式
为:
。
S3.3、GRU网络模型是解决时间序列预测问题的重要深度学习算法,具有参数量少、训练速度快、过拟合风险低的优点,但其梯度消失引起的长期依赖问题没有解决,尤其当网络层数增多时,长期依赖的问题就会更加明显。因此本发明在输入层后引入三层扩张率不同的空洞卷积进行特征与时间上局部特征提取,尽可能扩大卷积范围从而实现时间序列上的短期依赖,提高预测精度;
将输入到空洞卷积网络模块中,空洞卷积网络模块由三层扩张率不同的空洞卷
积层构成,确定该模块的多个超参数,卷积核大小设置为3×3,卷积核移动步长设置为1,填
充大小设置为1,卷积核个数设置为16,三层空洞卷积的扩张率大小分别设置为1、2、3,输出
维度为[batch_size, channel,,],其中,batch_size为批次,channel为通道数,为特征矩阵高度,为特征矩阵宽度;
该空洞卷积网络模块输出矩阵。
S3.4、将矩阵经过维度变换为,依次输入到两层GRU网络模块中,单个GRU网
络模型包括重置门和更新门,确定两层GRU网络模块的多个超参数,设置隐藏层层数为2、隐
藏层单元数为64、输出层层数为2、输出层单元数为64;
具体步骤为:
;
;
;
;
其中,代表重置门的值,代表更新门的值,表示输入序列当前时间步的输
入,代表上一个时间步的隐藏状态,表示当前时间步的候选隐藏状态,表示当前时
间步的隐藏状态,表示重置门中的训练参数矩阵,表示更新门中的训练参数矩阵,
表示当前时间步候选隐藏状态中的训练参数矩阵表示重置门中的偏置项,表示更新
门中的偏置项,表示当前时间步候选隐藏状态中的偏置项,为哈达码积运算符。
S3.5、将各个时刻的隐藏层状态输入到时序自注意力模块中,时序自注意力模块关注不同时刻的隐藏层状态,自主获得不同历史时刻对预测结果的重要程度,最终实现减少时间计算,提高预测精度的目的。具体步骤为:
;
;
;
其中,是训练参数矩阵,是偏置项,是时刻评分函数的输出值,是经过归一
化之后的注意力概率得分,是时刻的注意力层的输出,将输入到全连接层得到预测结
果。
S3.6、采用Relu函数作为激活函数,使用MSE作为损失函数,采用Adam优化器对学习率进行优化,学习率为0.0001,隐藏层神经元数为64,训练网络直到模型收敛,得到最优超参数,从而获得训练好的双重自注意力的空洞卷积-GRU网络模型。
S4、使用S3中训练好的基于双重自注意力机制的空洞卷积-GRU网络模型预测海上人员未来时刻的漂移轨迹。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (3)
1.一种海上人员漂移轨迹预测方法,其特征在于,包括以下步骤:
S1、获取海上人员漂移轨迹数据作为数据集,并对漂移轨迹数据进行预处理;
所述漂移轨迹数据包括海风数据、海流数据以及历史轨迹数据,其中,海风数据分为海风经纬度坐标以及速度的东分量与北分量,海流数据分为海流经纬度坐标以及速度的东分量与北分量,历史轨迹数据包括经纬度坐标;
S2、基于预处理后的数据集构建关于时间序列的训练集和测试集;
S3、构建基于双重自注意力机制的空洞卷积-GRU网络模型,其包括特征多头自注意力模块、空洞卷积网络模块、两层GRU网络模块和时序自注意力模块,使用训练集训练该模型,使用测试集对训练好的双重自注意力机制的空洞卷积-GRU网络模型进行验证;
所述S3中,训练过程包括以下子步骤:
S3.1、确定输入层的数据,输入数据为海流经纬度坐标、海流速度东分量、海流速度北分量、海风经纬度坐标、海风速度东分量、海风速度北分量、历史轨迹经纬度坐标以及时序特征变量,构建大小为k×n的输入特征矩阵X,共有k个特征,1≤k≤10,n个时刻,X表示为:
S3.2、将X输入到特征多头自注意力模块中,得到特征多头自注意力模块的权重am,其中1≤m≤k,计算过程为:
Qm=WQX;
Km=WKX;
Vm=WVX;
headj=Attention(QmWj Q,KmWj K,VmWj V);
MultiHead(Qm,Km,Vm)=Concat(head1,…,headu)WO;
am=MultiHead(Qm,Km,Vm)=[a1,a2,…,ak];
其中,Qm为查询矩阵;Km为键矩阵;Vm为值矩阵;Attention(·)为缩放点积注意力函数;dk为Km的维度;headj为第j组自注意力输出,j∈(1,u);WQ为查询矩阵的训练参数矩阵;Wk为键矩阵待学习的参数矩阵、WV为值矩阵待学习的参数矩阵、WO为转换矩阵,将拼接的矩阵转换为指定长度的输出向量;
对输入特征矩阵X赋权am,可得到输入特征加权矩阵X′;
S3.3、将X′输入到空洞卷积网络模块中,空洞卷积网络模块由三层扩张率不同的空洞卷积层构成,确定该模块的多个超参数,超参数包括卷积核大小、卷积核移动步长、填充大小、卷积核个数、三层空洞卷积层的扩张率大小;输出维度为[batch_size,channel,Hout,Wout],其中,batch_size为批次,channel为通道数,Hout为特征矩阵高度,Wout为特征矩阵宽度;
该空洞卷积网络模型输出矩阵X″;
S3.4、将矩阵X″经过维度变换为Xt,输入到两层GRU网络模块中,确定两层GRU网络模块的多个超参数,超参数包括隐藏层层数、隐藏层单元数、输出层层数、输出层单元数;具体步骤为:
rt=sigmoid(Wr[Xt,ht-1]+br);
zt=sigmoid(Wz[Xt,ht-1]+bz);
其中,rt代表重置门的值,zt代表更新门的值,Xt表示输入序列当前时间步的输入,ht-1代表上一个时间步的隐藏状态,表示当前时间步的候选隐藏状态,ht表示当前时间步的隐藏状态,Wr表示重置门中的训练参数矩阵,Wz表示更新门中的训练参数矩阵,Wh表示当前时间步候选隐藏状态中的训练参数矩阵,br表示重置门中的偏置项,bz表示更新门中的偏置项,bh表示当前时间步候选隐藏状态中的偏置项,⊙为哈达码积运算符;
S3.5、将各个时刻的隐藏层状态输入到时序自注意力模块中,具体步骤为:
et=tanh(wht+b);
其中,w是训练参数矩阵,b是偏置项,et是t时刻评分函数的输出值,at是经过归一化之后的注意力概率得分,ct是t时刻的注意力层的输出,将ct输入到全连接层得到预测结果;
S3.6、采用Relu函数作为激活函数,使用MSE作为损失函数,采用Adam优化器对学习率进行优化,学习率为0.0001,隐藏层神经元数为64,训练网络直到模型收敛,获取最优超参数,从而获得训练好的双重自注意力的空洞卷积-GRU网络模型;
S4、使用S3中训练好的基于双重自注意力机制的空洞卷积-GRU网络模型预测海上人员未来时刻的漂移轨迹。
2.根据权利要求1所述的一种海上人员漂移轨迹预测方法,其特征在于,所述S1中,预处理包括以下子步骤:
S1.1、对于数据集中缺失或异常数据,用该数据时间点前后的平均值进行填充和替换;
S1.2、针对数据集中出现时间间隔不统一的问题,采用线性插值法进行统一时间间隔;
S1.3、对数据进行归一化处理,其表达式为:
其中,x′为数据归一化后的值,x为原始数据值,xmin为数据集的最小值,xmax为数据集的最大值。
3.根据权利要求2所述的一种海上人员漂移轨迹预测方法,其特征在于,所述S2包括以下子步骤:
S2.1、将数据集中的数据按监测时间先后顺序进行排序,按照8:2的比例划分为训练集和测试集;
S2.2、将训练集和测试集中的输入和输出变量的维度处理为三维,包括batch_size、time_step、input_size、output_size,其中batch_size为一次训练输入的环境变量与轨迹数据的数量,time_step为时间步长,input_size为输入的环境变量与轨迹数据数量,output_size为输出预测的轨迹数据数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311369008.0A CN117114207B (zh) | 2023-10-23 | 2023-10-23 | 一种海上人员漂移轨迹预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311369008.0A CN117114207B (zh) | 2023-10-23 | 2023-10-23 | 一种海上人员漂移轨迹预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117114207A CN117114207A (zh) | 2023-11-24 |
CN117114207B true CN117114207B (zh) | 2024-02-06 |
Family
ID=88805903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311369008.0A Active CN117114207B (zh) | 2023-10-23 | 2023-10-23 | 一种海上人员漂移轨迹预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117114207B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117972315B (zh) * | 2024-03-29 | 2024-06-25 | 山东省科学院海洋仪器仪表研究所 | 基于混合神经网络预测模型的漂流浮标轨迹预测方法 |
CN118133000A (zh) * | 2024-05-08 | 2024-06-04 | 山东交通学院 | 基于Conv1d-GRU-MHA网络的漂浮式海上风力机叶片损伤检测方法 |
CN118551338A (zh) * | 2024-06-11 | 2024-08-27 | 北京师范大学 | 一种河流水质单要素预测方法和系统 |
CN118568448A (zh) * | 2024-08-05 | 2024-08-30 | 济南一杯水环保科技有限公司 | 一种供水管道微生物污染动态监测与消毒响应预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021068528A1 (zh) * | 2019-10-11 | 2021-04-15 | 平安科技(深圳)有限公司 | 基于卷积神经网络的注意力权重计算方法、装置及设备 |
CN114842681A (zh) * | 2022-07-04 | 2022-08-02 | 中国电子科技集团公司第二十八研究所 | 一种基于多头注意力机制的机场场面航迹预测方法 |
CN115983475A (zh) * | 2023-01-03 | 2023-04-18 | 南京大学 | 一种海区尺度落水人员漂移轨迹预测方法 |
CN116306790A (zh) * | 2023-01-16 | 2023-06-23 | 西安电子科技大学 | 一种基于cnn-gru和注意力机制的近海船舶轨迹实时预测方法、系统、设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536996B (zh) * | 2021-06-30 | 2022-04-15 | 大连海事大学 | 一种基于大量真实人群运动视频的人群运动仿真方法 |
-
2023
- 2023-10-23 CN CN202311369008.0A patent/CN117114207B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021068528A1 (zh) * | 2019-10-11 | 2021-04-15 | 平安科技(深圳)有限公司 | 基于卷积神经网络的注意力权重计算方法、装置及设备 |
CN114842681A (zh) * | 2022-07-04 | 2022-08-02 | 中国电子科技集团公司第二十八研究所 | 一种基于多头注意力机制的机场场面航迹预测方法 |
CN115983475A (zh) * | 2023-01-03 | 2023-04-18 | 南京大学 | 一种海区尺度落水人员漂移轨迹预测方法 |
CN116306790A (zh) * | 2023-01-16 | 2023-06-23 | 西安电子科技大学 | 一种基于cnn-gru和注意力机制的近海船舶轨迹实时预测方法、系统、设备及介质 |
Non-Patent Citations (2)
Title |
---|
Xu, Guoxia.Dilated-aware discriminative correlation filter for visual tracking.2019,第22卷(第2期),第791-805页. * |
汪雯.《中国博士学位论文电子期刊网》.2022,第6-55页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117114207A (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117114207B (zh) | 一种海上人员漂移轨迹预测方法 | |
Han et al. | Convolutional neural network for convective storm nowcasting using 3-D Doppler weather radar data | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN104049639B (zh) | 一种基于支持向量回归机的无人艇抗浪涌控制装置和方法 | |
CN112116162B (zh) | 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法 | |
CN109917394B (zh) | 一种基于天气雷达的短临智能外推方法 | |
CN112415521A (zh) | 基于cgru的强时空特性雷达回波临近预报方法 | |
Zhang et al. | A bi-directional LSTM ship trajectory prediction method based on attention mechanism | |
CN116937579A (zh) | 一种考虑时空相关性的风电功率区间预测及其可解释方法 | |
Han et al. | An uncertainty-aware hybrid approach for sea state estimation using ship motion responses | |
CN115099296A (zh) | 基于深度学习算法的海浪高度预测方法 | |
Zhang et al. | Trajectory prediction based on AIS and BP neural network | |
CN117391244A (zh) | 一种融合多源信息的船舶轨迹预测方法 | |
CN114492217B (zh) | 一种基于混合时间序列感知机模型的台风浪高预测方法 | |
Wang et al. | CNN-BiLSTM-attention model in forecasting wave height over South-East China Seas | |
CN117893362B (zh) | 一种多时空尺度的海上风电特征筛选及增强的功率预测方法 | |
CN115983475A (zh) | 一种海区尺度落水人员漂移轨迹预测方法 | |
CN116993821B (zh) | 一种基于Transformer-AdaRNN模型的船舶姿态实时预测方法 | |
CN111754033A (zh) | 一种基于循环神经网络的非平稳时序数据预测方法 | |
CN114186483B (zh) | 一种融合浮标数据和海洋卫星遥感图像的反演方法 | |
Yang et al. | A ship trajectory prediction model based on ECA-BiGRU | |
Zhifeng et al. | Comparison of blstm-attention and blstm-transformer models for wind speed prediction | |
CN116865232A (zh) | 一种基于风速误差修正的中长期风电功率预测方法及系统 | |
CN117972315B (zh) | 基于混合神经网络预测模型的漂流浮标轨迹预测方法 | |
Zhang et al. | A three-dimensional convolutional-recurrent network for convective storm nowcasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |