CN114881295A - 一种基于注意力机制的gcn-lstm船舶交通流预测方法 - Google Patents

一种基于注意力机制的gcn-lstm船舶交通流预测方法 Download PDF

Info

Publication number
CN114881295A
CN114881295A CN202210410429.2A CN202210410429A CN114881295A CN 114881295 A CN114881295 A CN 114881295A CN 202210410429 A CN202210410429 A CN 202210410429A CN 114881295 A CN114881295 A CN 114881295A
Authority
CN
China
Prior art keywords
traffic flow
lstm
gcn
model
attention mechanism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210410429.2A
Other languages
English (en)
Inventor
康明才
马强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202210410429.2A priority Critical patent/CN114881295A/zh
Publication of CN114881295A publication Critical patent/CN114881295A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于注意力机制的GCN‑LSTM船舶交通流预测方法,首先获取数据集并进行预处理,之后构建基于注意力机制的GCN‑LSTM船舶交通流预测模型并进行训练,最后基于训练后的船舶交通流预测模型进行船舶交通流的预测。本发明的预测模型利用GCN‑LSTM联合模型获取交通流数据的时空相关性特征,并引入注意力机制解决输入序列长度增加所导致的模型预测性能下降的问题,有效提高船舶交通流预测的准确性,能够对港口交通的规划和调度提供依据,对港口的运输效率和安全提供保障。

Description

一种基于注意力机制的GCN-LSTM船舶交通流预测方法
技术领域
本发明属于交通管理技术领域,具体涉及一种基于注意力机制的GCN-LSTM船舶交通流预测方法。
背景技术
在经济全球化的影响下,世界经济得到日益迅速地发展,船舶运输在现阶段的货物运输体系中依旧拥有无可替代的地位,中国台湾知名航运公司长荣集团旗下巨型货轮“EverGiven”遭到强风袭击而偏离航道,最终在苏伊士运河搁浅并卡在河道中央,致使苏伊士运河南北向全线瘫痪。
而港口区域的拥堵状况更加严峻,一些大港口的吞吐量超过亿吨,但船舶交通航线没有清晰的航线,而且航线有时也可能发生合并或交叉。船舶交通流预测能够对港口交通的规划和调度提供依据;能够对港口的运输效率和安全提供保障。
多年以来在交通流预测领域的研究一直逐步深入,预测模型种类繁多,线性系统模型如卡尔曼滤波方法、历史平均模型等,优点是变化趋势直观,可解释性强,缺点是结构简单,误差较大,有一定的局限性。而神经网络模型具有较强的非线性映射和自适应学习能力,交通数据的非线性、周期性、随机性等特点决定了神经网络模型在交通流预测领域的优势。BP(Back Propagation)神经网络预测模型在船舶交通流预测领域方面的应用广泛,但却存在收敛性低、训练参数敏感度高等问题。循环神经网络(Recurrent Neural Network,RNN)模型引入了时间序列,能够有效地利用时间依赖性,具有更好的适应性,但存在梯度消失问题,在数据间的空间关系方面存在短板。长短期记忆网络(Long Short-term MemoryNetwork,LSTM)模型解决了循环神经网络的梯度消失问题,但是由于港口船舶交通流量易受天气、潮水涨退等多因素影响,预测模型难以准确表征数据的空间特征。
发明内容
基于以上所述的问题,本发明的目的在于提供一种基于注意力机制的GCN-LSTM港口船舶交通流预测方法,能够挖掘港口船舶交通流数据中的时空相关性,根据基于船舶交通流预测的结果识别出船舶交通拥堵产生点,实施管控措施,为解决港口日益严重的交通拥堵问题提供了理论依据和技术支持。船舶交通流预测能够对港口交通的规划和调度提供依据;能够对港口的运输效率和安全提供保障。
实现本发明目的的技术解决方案为:
一种基于注意力机制的GCN-LSTM船舶交通流预测方法,包括以下步骤:
步骤1、获取数据集并进行预处理;
步骤2、构建基于注意力机制的GCN-LSTM船舶交通流预测模型;
步骤3、利用数据集对步骤2构建的模型进行迭代训练,得到训练后的模型;
步骤4、基于训练后的基于注意力机制的GCN-LSTM船舶交通流预测模型进行船舶交通流的预测。
本发明与现有技术相比,其显著优点为:
(1)本发明的技术方案通过构建基GCN-LSTM联合模型,能够挖掘港口船舶交通流数据中的时空相关性,根据基于船舶交通流预测的结果识别出船舶交通拥堵产生点,实施管控措施,为解决港口日益严重的交通拥堵问题提供了理论依据和技术支持;
(2)本发明的技术方案引入注意力机制,解决输入序列长度增加所导致的模型预测性能下降的问题,提高船舶交通流的预测精度。
通过评价指标对不同预测方法的预测输出和实际输出进行对比分析,结果显示基于注意力机制的GCN-LSTM模型预测精度更高;
(2)本发明的
下面结合附图和具体实施方式对本发明作进一步详细描述。
附图说明
图1为本发明的船舶交通流预测方法步骤流程图。
图2为本发明的实施例中引入注意力机制的GCN-LSTM船舶交通流预测模型与不引入注意力机制模型的预测MAE指标对比示意图。
图3为本发明的实施例中引入注意力机制的GCN-LSTM船舶交通流预测模型与不引入注意力机制模型的预测RMSE指标对比示意图。
图4为本发明的实施例中利用基于注意力机制的GCN-LSTM船舶交通流预测模型的预测值与实际值的对比示意图。
具体实施方式
一种基于注意力机制的GCN-LSTM船舶交通流预测方法,包括以下步骤:
步骤1、获取数据集并进行预处理,具体为:
步骤1-1、获取船舶交通流数据,并将样本数据集划分为训练集与测试集;
步骤1-2、将数据集进行归一化处理,形成归一化后的数据集;
采用最小最大规范化(Min-Max)将数据按照属性映射到区间[0,1],便于训练,从而提高整体模型的性能:
Figure BDA0003603939330000031
其中,Xmin为数据集X的最小值,Xmax为数据集X的最大值,x为初始值,x′为规范化后的值。
步骤2、构建基于注意力机制的GCN-LSTM船舶交通流预测模型,具体为:
步骤2-1、获取待预测时间段近期、日周期和周周期的船舶交通流数据:
xr=(xt-r,…,xt-2,xt-1)
xd=(xt-d*m,…,xt-2*m,xt-1*m)
xw=(xt-r*7*m,…,xt-2*7*m,xt-1*7*m)
其中,m表示将一天划分的时间间隔总数;t表示待预测时间段;xt表示t时段的预测区域船舶流量;r,d,w分别表示近期、日周期、周周期的时间间隔数;
步骤2-2、构建GCN图卷积神经网络模型,分别获取三种时间段交通流数据xr、xd和xw的空间关联特征,具体为:
步骤2-2-1、将预测水域划分网格,构造无向图G={V,E,A};
其中V表示网格节点的集合,E表示各个节点之间的连通性,AN×N表示图G的邻接矩阵,每个节点的交通流量作为该节点的数量特征,各个节点的特征构成特征矩阵XN×L,L为交通流时间序列的长度;
步骤2-2-2、构建GCN图卷积神经网络模型:
所述GCN图卷积神经网络模型的输入为邻接矩阵AN×N和特征矩阵XN×L,利用傅立叶变换在谱域上进行图卷积运算,通过傅立叶域中的滤波器捕捉节点之间的空间相关特征:
Figure BDA0003603939330000032
Figure BDA0003603939330000033
Figure BDA0003603939330000041
本发明选取2层的GCN模型,则上式可以表述为:
Figure BDA0003603939330000042
其中,
Figure BDA0003603939330000043
为具有附加自连接的矩阵,IN为单位矩阵,
Figure BDA0003603939330000044
Figure BDA0003603939330000045
的度矩阵,H(n)为第n层的特征,H(1)=X,σ为非线性激活函数,D表示A的度矩阵,W(l)表示第l层的权重矩阵。
步骤2-3、构建长短时记忆LSTM模型,分别获取步骤2-1输出的交通流数据的时间相关性特征,具体为:
经过GCN模块对船舶交通流数据的空间特征提取后,每个节点的特征信息中已经包含对应图上相邻节点的特征信息,再使用LSTM网络不仅能提取到各节点时间维度上的特征信息,而且能融合其他关联节点的特征信息。按照时间顺序对待预测时段的近期片段、日周期片段、周周期片段进行拼接,时间维特征提取能够获取到不同周期片段之间的相关性。
构建一个四层的LSTM模型来获取港口船舶流量的时间依赖特征:
(a)遗忘门:通过遗忘门计算得到上一时刻信息通过的比重:
ft=σ(Wf·[ht-1,xt]+bf)
其中,σ为逻辑回归中的Sigmoid函数,值域为[0,1],Wf表示遗忘门的权重,·表示向量乘积,ht-1表示t-1时刻循环隐藏层的输出,xt表示t时刻LSTM模型的输入,bf表示遗忘门的偏置条件;
(b)输入门:通过输入门中Sigmoid层的计算输出it,决定了需要更新的信息内容,而tanh层生成更新到单元状态的信息,根据计算数据可以得出当前时刻记忆单元的状态值ct
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0003603939330000046
其中,it表示输入门输出值;Wi表示输入门的权重;tanh表示双曲正切激活函数,Wc表示向量
Figure BDA0003603939330000051
的权重矩阵;bi、bc分别表示输入门和单元状态的偏置;
(c)单元状态:通过遗忘门和输入门得出当前时刻记忆单元的状态值ct
Figure BDA0003603939330000052
其中,ct-1表示前一时刻的状态值,ct表示单元状态值,
Figure BDA0003603939330000057
表示哈达玛积,即矩阵元素对应相乘;
(d)输出门:通过输出门得到最后的输出,其中,sigmoid层决定要输出单元状态的信息内容,然后将单元状态通过tanh层,并乘以sigmoid层的输出,得到要输出的信息:
ot=σ(Wo·[ht-1,xt]+bo)
Figure BDA0003603939330000053
其中,ot表示输出门输出值;Wo表示输出门的权重矩阵;bo表示偏置;ht表示LSTM单元的隐藏状态,即LSTM单元的输出。
步骤2-4、构建注意力机制模型,分别确定步骤2-2输出的交通流数据中每个时间节点对预测结果的注意力系数,分别得到三种时间段的预测数据,具体为:
通过注意力机制模块计算每个时间节点对预测目标的注意力系数,描述时间节点对船舶流量预测相关性的紧密程度,在预测最终结果时将这些系数作为权重进行加权,在船舶流量预测时可以关注到变化更为相关的时间节点的船舶流量;
获取长短时记忆LSTM模型输出的交通流数据,将最后一层LSTM网络的输出作为每个时刻的输入,引入不同时间序列yi(i=1,2,…,n),其中n是时间序列的长度,每个时序特征的权重由softmax函数归一化计算得到分别确定待预测时间段近期、日周期和周周期的交通流预测数据:
ei=wa*yi+ba
Figure BDA0003603939330000054
Figure BDA0003603939330000055
其中,wa表示权重,ba是偏置条件,yi(i=1,2,…,n)表示长短时记忆LSTM模型输出的交通流数据,n表示时间序列的长度,
Figure BDA0003603939330000056
表示待预测时间段近期、日周期或周周期的交通流预测数据。
步骤2-5、利用特征融合得到最终的船舶交通流预测结果,具体为:
Figure BDA0003603939330000061
其中,σ表示斜坡激活函数,
Figure BDA0003603939330000064
表示哈达玛乘积,Wr,Wd,Ww为待训练的参数张量,分别表示受最近、每日、每周依赖关系的影响程度,
Figure BDA0003603939330000062
Figure BDA0003603939330000063
分别表示待预测时间段近期、日周期或周周期的交通流预测数据。
步骤3、利用数据集对步骤2构建的模型进行迭代训练,得到训练后的模型,其中,本发明采用梯度下降法训练基于注意力机制的GCN-LSTM船舶交通流预测模型,
步骤4、基于训练后的基于注意力机制的GCN-LSTM船舶交通流预测模型进行船舶交通流的预测。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
步骤1、获取数据集并进行预处理;
步骤2、构建基于注意力机制的GCN-LSTM船舶交通流预测模型;
步骤3、利用数据集对步骤2构建的模型进行迭代训练,得到训练后的模型;
步骤4、基于训练后的基于注意力机制的GCN-LSTM船舶交通流预测模型进行船舶交通流的预测。
一种计算机可存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
步骤1、获取数据集并进行预处理;
步骤2、构建基于注意力机制的GCN-LSTM船舶交通流预测模型;
步骤3、利用数据集对步骤2构建的模型进行迭代训练,得到训练后的模型;
步骤4、基于训练后的基于注意力机制的GCN-LSTM船舶交通流预测模型进行船舶交通流的预测。
下面结合附图和实施例对本发明作进一步的说明。
实施例
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明的一种基于注意力机制的GCN-LSTM船舶交通流预测方法步骤流程图;
1、首先获取数据集并进行预处理:
选取2020年7月1日到2020年7月31日上海宝山港水域的AIS数据,其中包含MMSI、经纬度、定位时间等信息。为了更好的提取船舶流量变化的特征,以30分钟为时间间隔对船舶交通流量进行统计,得到1488个样本数据,其中每个样本数据都包含预测区域内7×7个网格的船舶流入量和船舶流出量。本文按照时间对数据集进行划分,选取2020年7月1日至2020年7月30日的数据作为训练集用于训练模型,共1440个样本数据;选取2020年7月31日的数据作为测试集来评估模型性能,共48个样本数据。
将数据集进行归一化处理,形成归一化后的数据集;
采用最小最大规范化(Min-Max)将数据按照属性映射到区间[0,1],便于训练,从而提高整体模型的性能:
Figure BDA0003603939330000071
其中,Xmin为数据集X的最小值,Xmax为数据集X的最大值,x为初始值,x′为规范化后的值。
2、构建基于注意力机制的GCN-LSTM船舶交通流预测模型并进行训练,具体为:
交通流预测模型在训练过程中,参数设置情况如下:学习率设为0.001;批量大小设置为32;训练轮次设置为100;
由于图卷积层数以及长短时记忆网络层数的设置决定了GCN-LSTM模型的预测精度,为使预测精度达到最高,相同数据集上对图卷积层数以及长短时记忆网络层数的不同情况进行多组对比实验,根据实验结果选择最优模型结构。
Figure BDA0003603939330000072
Figure BDA0003603939330000081
由上表可知,当GCN网络的图卷积层数设置为2且LSTM层数设置为4时,基于RMSE、MAE不同评价指标的值均达到最低,即模型的预测效果达到该模型的最佳情况,因此,本实例中的GCN-LSTM模型和基于注意力的GCN-LSTM模型皆选用2层图卷积层加上4层LSTM的组合模型来进行船舶交通流的预测。
3、实验结果
设船舶交通流真实值为xk.预测值为x′k(k=1,2,3,…,N,其中N为实验组数)。
(1)平均绝对误差(MAE)
Figure BDA0003603939330000082
(2)均方根误差(RMSE)
Figure BDA0003603939330000083
为了验证注意力机制模块的效果,对比分析了基于注意力机制的船舶流量预测模型和不使用注意力机制的模型预测结果实验结果。如下表所示,基于注意力机制的船舶流量预测模型的评价指标MAE和RMSE分别为0.6667、1.0206,其预测性能要明显优于不使用注意力机制的船舶流量预测模型,证明了注意力机制模块的有效性,其示意图如图2和图3所示;
Figure BDA0003603939330000084
为了进一步地验证本文提出的基于注意力机制的船舶流量预测模型的性能,将其与3种常见的预测模型进行比较,分别为支持向量回归(SVR)、LSTM、GRU。下表为这几个模型的比较结果。
Figure BDA0003603939330000085
Figure BDA0003603939330000091
由上表可得,采用传统机器学习方法SVR的预测模型与其他采用深度学习方法的预测模型相比,预测性能较差。在深度学习模型中,本专利所提出的基于注意力机制GCN-LSTM的船舶流量预测模型取得了很好的预测效果,MAE和RMSE分别为0.6667、1.0206,要优于其他的预测模型。
通过上述构建、训练和预测得出图4预测结果,直观展示了测试集2020年7月31日上海宝山港预测区域真实船舶流量值与基于注意力机制GCN-LSTM模型预测结果的比较。图中实线表示真实数据趋势,虚线表示本专利提出的基于注意力机制GCN-LSTM预测方法预测的趋势,纵坐标表示的是某一时间段船舶流量,横坐标表示的是时间点,时间为一天,时间间隔为1小时。
以上是船舶流量预测模型的单步预测性能,为了进一步分析,本文验证了该模型的多步预测性能。在每一步预测时,注意力机制都会对GCN-LSTM网络的各个隐藏状态求取权重,不同的时间步下得到的权重也都不一样,由此来提高多步预测的准确性。下表给出了多步预测的结果对比,即1小时后的预测效果、1.5小时后的预测效果、2小时后的预测效果。
Figure BDA0003603939330000092
通过不同步长下的预测效果对比,当预测步长从0.5小时到2小时变化时,基于注意力机制的GCN-LSTM船舶流量预测模型虽然预测性能有所下降,但整体预测趋势还是较为准确的且优于GCN-LSTM模型。
综上可知,通过评价指标对不同预测方法的预测输出和实际输出进行对比分析,结果显示本专利的基于注意力机制的GCN-LSTM船舶交通流预测方法预测精度更高。

Claims (10)

1.一种基于注意力机制的GCN-LSTM船舶交通流预测方法,其特征在于,包括以下步骤:
步骤1、获取数据集并进行预处理;
步骤2、构建基于注意力机制的GCN-LSTM船舶交通流预测模型;
步骤3、利用数据集对步骤2构建的模型进行迭代训练,得到训练后的模型;
步骤4、基于训练后的基于注意力机制的GCN-LSTM船舶交通流预测模型进行船舶交通流的预测。
2.根据权利要求1所述的基于注意力机制的GCN-LSTM港口船舶交通流预测方法,其特征在于,所述步骤1中的获取数据集并进行预处理,具体为:
步骤1-1、获取船舶交通流数据,并将样本数据集划分为训练集与测试集;
步骤1-2、将数据集进行归一化处理,形成归一化后的数据集;
采用最小最大规范化(Min-Max)将数据按照属性映射到区间[0,1]:
Figure FDA0003603939320000011
其中,Xmin为数据集X的最小值,Xmax为数据集X的最大值,x为初始值,x′为规范化后的值。
3.根据权利要求1所述的基于注意力机制的GCN-LSTM船舶交通流预测方法,其特征在于,所述步骤2中的构建基于注意力机制的GCN-LSTM船舶交通流预测模型,具体为:
步骤2-1、获取待预测时间段近期、日周期和周周期的船舶交通流数据:
xr=(xt-r,…,xt-2,xt-1)
xd=(xt-d*m,…,xt-2*m,xt-1*m)
xw=(xt-r*7*m,…,xt-2*7*m,xt-1*7*m)
其中,m表示将一天划分的时间间隔总数;t表示待预测时间段;xt表示t时段的预测区域船舶流量;r,d,w分别表示近期、日周期、周周期的时间间隔数;
步骤2-2、构建GCN图卷积神经网络模型,分别获取三种时间段交通流数据xr、xd和xw的空间关联特征;
步骤2-3、构建长短时记忆LSTM模型,分别获取步骤2-1输出的交通流数据的时间相关性特征;
步骤2-4、构建注意力机制模型,分别确定步骤2-2输出的交通流数据中每个时间节点对预测结果的注意力系数,分别得到三种时间段的预测数据;
步骤2-5、利用特征融合得到最终的船舶交通流预测结果。
4.根据权利要求3所述的基于注意力机制的GCN-LSTM船舶交通流预测方法,其特征在于,所述步骤2-2中的利用GCN模型获取交通流数据的空间关联特征,具体为:
步骤2-2-1、将预测水域划分网格,构造无向图G={V,E,A};
其中V表示网格节点的集合,E表示各个节点之间的连通性,AN×N表示图G的邻接矩阵,每个节点的交通流量作为该节点的数量特征,各个节点的特征构成特征矩阵XN×L,L为交通流时间序列的长度;
步骤2-2-2、构建GCN图卷积神经网络模型:
所述GCN图卷积神经网络模型的输入为邻接矩阵AN×N和特征矩阵XN×L,利用傅立叶变换在谱域上进行图卷积运算,通过傅立叶域中的滤波器捕捉节点之间的空间相关特征:
Figure FDA0003603939320000021
Figure FDA0003603939320000022
Figure FDA0003603939320000023
其中,
Figure FDA0003603939320000024
为具有附加自连接的矩阵,IN为单位矩阵,
Figure FDA0003603939320000025
Figure FDA0003603939320000026
的度矩阵,H(n)为第n层的特征,H(1)=X,σ为非线性激活函数,D表示A的度矩阵,W(l)表示第l层的权重矩阵。
5.根据权利要求3所述的基于注意力机制的GCN-LSTM船舶交通流预测方法,其特征在于,所述步骤2-3中的利用LSTM模型获取交通流数据的时间相关性特征,具体为:
构建LSTM模型:
(a)遗忘门:通过遗忘门计算得到上一时刻信息通过的比重:
ft=σ(Wf·[ht-1,xt]+bf)
其中,σ为逻辑回归中的Sigmoid函数,值域为[0,1],Wf表示遗忘门的权重,·表示向量乘积,ht-1表示t-1时刻循环隐藏层的输出,xt表示t时刻LSTM模型的输入,bf表示遗忘门的偏置条件;
(b)输入门:通过输入门中Sigmoid层的计算输出it,决定了需要更新的信息内容,而tanh层生成更新到单元状态的信息,根据计算数据可以得出当前时刻记忆单元的状态值ct
it=σ(Wi·[ht-1,xt]+bi)
Figure FDA0003603939320000031
其中,it表示输入门输出值;Wi表示输入门的权重;tanh表示双曲正切激活函数,Wc表示向量
Figure FDA0003603939320000032
的权重矩阵;bi、bc分别表示输入门和单元状态的偏置;
(c)单元状态:通过遗忘门和输入门得出当前时刻记忆单元的状态值ct
Figure FDA0003603939320000033
其中,ct-1表示前一时刻的状态值,ct表示单元状态值,
Figure FDA0003603939320000034
表示哈达玛积,即矩阵元素对应相乘;
(d)输出门:通过输出门得到最后的输出,其中,sigmoid层决定要输出单元状态的信息内容,然后将单元状态通过tanh层,并乘以sigmoid层的输出,得到要输出的信息:
ot=σ(Wo·[ht-1,xt]+bo)
Figure FDA0003603939320000035
其中,ot表示输出门输出值;Wo表示输出门的权重矩阵;bo表示偏置;ht表示LSTM单元的隐藏状态,即LSTM单元的输出。
6.根据权利要求3所述的基于注意力机制的GCN-LSTM船舶交通流预测方法,其特征在于,所述步骤2-4中的利用注意力机制模型确定每个时间节点对预测结果的注意力系数,具体为:
获取长短时记忆LSTM模型输出的交通流数据,分别确定待预测时间段近期、日周期和周周期的交通流预测数据:
ei=wa*yi+ba
Figure FDA0003603939320000036
Figure FDA0003603939320000041
其中,wa表示权重,ba是偏置条件,yi(i=1,2,…,n)表示长短时记忆LSTM模型输出的交通流数据,n表示时间序列的长度,
Figure FDA0003603939320000042
表示待预测时间段近期、日周期或周周期的交通流预测数据。
7.根据权利要求3所述的基于注意力机制的GCN-LSTM船舶交通流预测方法,其特征在于,所述步骤2-5中的利用特征融合得到最终的船舶交通流预测结果,具体为:
Figure FDA0003603939320000043
其中,σ表示斜坡激活函数,
Figure FDA0003603939320000044
表示哈达玛乘积,Wr,Wd,Ww为待训练的参数张量,分别表示受最近、每日、每周依赖关系的影响程度,
Figure FDA0003603939320000045
Figure FDA0003603939320000046
分别表示待预测时间段近期、日周期或周周期的交通流预测数据。
8.根据权利要求1所述的基于注意力机制的GCN-LSTM船舶交通流预测方法,其特征在于,所述步骤3中的利用数据集对构建的模型进行迭代训练,具体为:
利用梯度下降法训练基于注意力机制的GCN-LSTM船舶交通流预测模型。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述方法的步骤。
10.一种计算机可存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法的步骤。
CN202210410429.2A 2022-04-19 2022-04-19 一种基于注意力机制的gcn-lstm船舶交通流预测方法 Pending CN114881295A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210410429.2A CN114881295A (zh) 2022-04-19 2022-04-19 一种基于注意力机制的gcn-lstm船舶交通流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210410429.2A CN114881295A (zh) 2022-04-19 2022-04-19 一种基于注意力机制的gcn-lstm船舶交通流预测方法

Publications (1)

Publication Number Publication Date
CN114881295A true CN114881295A (zh) 2022-08-09

Family

ID=82672082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210410429.2A Pending CN114881295A (zh) 2022-04-19 2022-04-19 一种基于注意力机制的gcn-lstm船舶交通流预测方法

Country Status (1)

Country Link
CN (1) CN114881295A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117292584A (zh) * 2023-11-24 2023-12-26 南京航空航天大学 基于gcn-lstm模型的多机场终端区流量预测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117292584A (zh) * 2023-11-24 2023-12-26 南京航空航天大学 基于gcn-lstm模型的多机场终端区流量预测方法及系统
CN117292584B (zh) * 2023-11-24 2024-02-02 南京航空航天大学 基于gcn-lstm模型的多机场终端区流量预测方法及系统

Similar Documents

Publication Publication Date Title
Qin et al. Red tide time series forecasting by combining ARIMA and deep belief network
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
Kisi et al. River suspended sediment estimation by climatic variables implication: Comparative study among soft computing techniques
CN109658695B (zh) 一种多因素的短时交通流预测方法
CN114220271B (zh) 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
CN115222163B (zh) 港池入口波浪多要素的中长期实时预测方法、系统及应用
CN115240425A (zh) 一种基于多尺度时空融合图网络的交通预测方法
CN114565124A (zh) 一种基于改进图卷积神经网络的船舶交通流预测方法
CN110164129B (zh) 基于gernn的单交叉口多车道交通流量预测方法
JP5023325B2 (ja) リカレントニューラルネットワークを用いた不規則時系列データの学習・予測方法
CN109583588B (zh) 一种短期风速预测方法及系统
CN110942637A (zh) 基于空域图卷积神经网络的scats系统道路交通流预测方法
Yadav et al. Prediction of suspended sediment yield by artificial neural network and traditional mathematical model in Mahanadi river basin, India
CN114692788B (zh) 基于增量学习的厄尔尼诺极端天气预警方法及装置
CN111985719A (zh) 一种基于改进的长短期记忆网络的电力负荷预测方法
CN114881295A (zh) 一种基于注意力机制的gcn-lstm船舶交通流预测方法
CN108631817A (zh) 一种基于时频分析和径向神经网络进行跳频信号频段预测的方法
Guo et al. A multi-step traffic speed forecasting model based on graph convolutional LSTM
Xuan et al. A hybrid approach of support vector machine with particle swarm optimization for water quality prediction
Kisi et al. Wind speed prediction by using different wavelet conjunction models
Royston et al. A linguistic decision tree approach to predicting storm surge
CN117636183A (zh) 一种基于自监督预训练的小样本遥感图像分类方法
Kimura et al. Recurrent neural network predictions for water levels at drainage pumping stations in an agricultural lowland
CN115860231A (zh) 一种基于MCR_BiLSTM的智能洪水预报方法
CN111382761B (zh) 一种基于cnn的检测器、图像检测方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination