CN111858565A - 一种基于线段聚类的多维度高精度航迹智能预测方法 - Google Patents

一种基于线段聚类的多维度高精度航迹智能预测方法 Download PDF

Info

Publication number
CN111858565A
CN111858565A CN202010523201.5A CN202010523201A CN111858565A CN 111858565 A CN111858565 A CN 111858565A CN 202010523201 A CN202010523201 A CN 202010523201A CN 111858565 A CN111858565 A CN 111858565A
Authority
CN
China
Prior art keywords
track
line segment
layer
data
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010523201.5A
Other languages
English (en)
Other versions
CN111858565B (zh
Inventor
胡庆雷
杨懿琳
郑建英
郭雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010523201.5A priority Critical patent/CN111858565B/zh
Publication of CN111858565A publication Critical patent/CN111858565A/zh
Application granted granted Critical
Publication of CN111858565B publication Critical patent/CN111858565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • G01C21/203Specially adapted for sailing ships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Radar, Positioning & Navigation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于线段聚类的多维度高精度航迹智能预测方法,将连续的航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化处理后,使用Douglas‑Peucker算法对航迹数据进行压缩,使用DBSCAN聚类算法对航迹进行聚类,根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,通过航迹预测神经网络模型进行航迹预测,完成多维度高精度航迹预测任务。本发明将原始航迹数据压缩,在保留航迹特征的情况下极大减轻了计算压力,缩短了运算时间,提高了运算效率;采用卷积加LSTM神经网络模型,使用卷积进行特征提取,有利于提高LSTM神经网络模型对航迹预测的精度。

Description

一种基于线段聚类的多维度高精度航迹智能预测方法
技术领域
本发明涉及目标跟踪技术领域,尤其涉及一种基于线段聚类的多维度高精度航迹智能预测方法。
背景技术
针对掌握可疑移动目标航迹的具体任务,一方面要学习可疑移动目标航迹的规律,高精确度地预测出移动目标未来的航迹,另一方面还要考虑现实条件下的多维度因素,例如突发事件、国际热点、天气状况等情况,高精度预测出移动目标的航迹信息。
海洋中移动目标(例如船舶)航迹数据的采集方式,通常是间歇性地获取船舶当前位置的数据信息,根据船舶所处的不同状态以2s一次到数分钟一次不等的频率,向外播发位置信息。由于船舶航迹较长,因此,以2小时为单位进行数据采集。考虑在同一片区域内,每天可能有数百条船舶通行,由此产生的数据量会非常巨大,将它们全部记录下来会带来昂贵的存储开销,并且,还需要将如此庞大的数据加载到内存中进行分析处理,这对可视化平台系统的信息处理能力是一个巨大考验。船舶航迹数据是典型的时空大数据,其在多个领域都有着极其突出且重要的研究和应用价值。作为时序数据的特例,航迹数据具有鲜明的时序特征和突出的空间特征。因此,航迹数据的处理和挖掘方法不能完全照搬时序数据的经验,而应当考虑其特殊性。
当前限制航迹数据处理和挖掘的重要因素之一是移动目标航迹数据海量的数据规模。航迹数据的海量数据规模带来的问题是多方面的,主要表现在:1)数据储存压力大,海量的数据规模和非结构化的数据组织为航迹数据的实时数据存储和快速索引带来了巨大的挑战;2)数据的分析压力大,典型的数据挖掘方法在面对航迹数据时通常无法直接使用,为航迹数据的分析和挖掘带来了挑战。
传统的海上移动目标航迹预测方法不能针对以上缺点灵活地对航迹数据进行处理,在已有的预测方法中也较少考虑到国际热点、天气状况等多维度因素的影响。因此,不能满足日益复杂的航迹预测需求。
发明内容
有鉴于此,本发明提供了一种基于线段聚类的多维度高精度航迹智能预测方法,用于针对海上移动目标航迹数据及现实条件下多维度因素的处理,提供一种计算简单、约束及需求灵活、效率优良的海上移动目标航迹预测方法,解决多维度条件下的航迹预测问题。
因此,本发明提供了一种基于线段聚类的多维度高精度航迹智能预测方法,包括如下步骤:
S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
S3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,所述航迹预测神经网络模型的训练过程,包括如下步骤:
SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
SS3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S1和步骤SS1中,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理,具体包括:
对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:
a=awest+360 (1)
其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度;
经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:
Figure BDA0002532894570000031
其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量;
当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,将航迹点(ai,bi)剔除;
采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:
Figure BDA0002532894570000041
Figure BDA0002532894570000042
其中,
Figure BDA0002532894570000043
表示将经度ai归一化到[0,1]后的值,amin和amax分别表示所有经度数据(a1,a2,...,an)中的最小值和最大值;
Figure BDA0002532894570000044
表示将纬度bi归一化到[0,1]后的值,bmin和bmax分别表示所有纬度数据(b1,b2,...,bn)中的最小值和最大值。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S2和步骤SS2中,利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点,具体包括如下步骤:
S21:将航迹的首尾两个端点连接,构造基线;
S22:计算除航迹的首尾两个端点外的其余航迹点到基线的距离,找到距离基线最远的航迹点,并判断该航迹点距离基线的距离是否大于阈值;若是,则执行步骤S23;若否,则执行步骤S24;
S23:选取该航迹点为特征点,并以该航迹点为界将除该航迹点外的其余航迹点划分为两个航迹;返回步骤S21,在新划分出的航迹中提取特征点;
S24:算法结束。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S3和步骤SS3中,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇,具体包括如下步骤:
S31:遍历航迹片段集,找到所有的核心线段;
S32:根据邻域范围,将所有的核心线段连通聚合成航迹簇;
S33:在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中;
其中,对核心线段和密度相连解释如下:
假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:
ε-邻域集Nε
Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε} (5)
其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;
核心线段:给定邻域范围ε和邻域密度阈值MinLns,若Nε(Lu)中的线段数量大于或等于MinLns,则认为线段Lu为核心线段;
直接密度可达:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv为核心线段,线段Lu在线段Lv的ε-邻域集Nε中,则认为从线段Lu到线段Lv直接密度可达;
密度可达:给定邻域范围ε和邻域密度阈值MinLns,若从线段Lu到线段Lw直接密度可达,且从线段Lw到线段Lv直接密度可达,则认为从线段Lu到线段Lv密度可达;
密度相连:给定邻域范围ε和邻域密度阈值MinLns,若存在线段Lw,且线段Lu和线段Lv都从线段Lw密度可达,则认为线段Lu和线段Lv互相密度相连;
线段距离:先将线段距离分解为垂直距离、水平距离和角度距离,再通过加权求和得到线段距离;线段Lu与线段Lv的垂直距离d(Lu,Lv)定义为:
Figure BDA0002532894570000051
其中,线段Lv的两个端点分别为sv和ev,sv到线段Lu的垂点为ps,ev到线段Lu的垂点为pe;l⊥1表示sv到ps的欧氏距离,l⊥2表示ev到pe的欧氏距离;
线段Lu与线段Lv的水平距离d//(Lu,Lv)定义为:
d//(Lu,Lv)=MIN(l//1,l//2) (7)
其中,线段Lu的两个端点分别为su和eu;l//1表示ps到su和eu的最小欧氏距离;l//2表示pe到su和eu的最小欧氏距离;
线段Lu与线段Lv的角度距离dθ(Lu,Lv)定义为:
Figure BDA0002532894570000061
其中,||Lv||为线段Lv的长度,θ为线段Lv和线段Lu之间的最小夹角;
线段距离ddist(Lu,Lv)计算公式如下:
ddist(Lu,Lv)=ω·d(Lu,Lv)+ω//·d//(Lu,Lv)+ωθ·dθ(Lu,Lv) (9)
其中,w表示垂直距离的权重值,w//表示水平距离的权重值,wθ表示角度距离的权重值。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,所述航迹预测神经网络模型的网络架构如下:
基于卷积和LSTM神经网络模型,由年、月、日、时、经度、纬度以及时间步长建立样本矩阵,作为输入数据;所述航迹预测神经网络模型包括卷积层、LSTM层、Flatten层和Dense层;
随机设置卷积核权值矩阵,定义第一层卷积层具有20个卷积核,每个卷积核的大小为3*3,步长为3;经过第一层卷积层的训练后,将第一层卷积层的输出结果输入到第二层卷积层中,定义卷积核的大小为40;加入第三层卷积层,卷积核的个数为80;将提取航迹特征后的带有年、月、日、时、经度和纬度6个特征的数据输入LSTM神经网络中,LSTM层的前向传播公式如下:
Figure BDA0002532894570000062
Figure BDA0002532894570000063
Figure BDA0002532894570000071
Figure BDA0002532894570000072
Figure BDA0002532894570000073
其中,calc_gate表示门的计算操作,ct表示移动目标在t时刻的LSTM单元航迹序列状态,ct-1表示移动目标在t-1时刻的LSTM单元航迹序列状态,
Figure BDA0002532894570000074
表示移动目标在LSTM层中的暂存航迹序列状态,f、r和o分别表示LSTM层中遗忘门、输入门和输出门经过门的前向计算过程后得到的输出状态;
Figure BDA0002532894570000075
表示按元素乘的运算;x为输入状态,表示LSTM层中输入的历史航迹;br、bf、bo表示偏置参数;h表示LSTM层的输出航迹状态;ht-1表示LSTM层在t-1时刻的输出航迹状态;σg和σ(c)表示遗忘门、输入门、输出门和输出状态计算过程中的激活函数;Wrh,Wfh,Woh表示与h连接的权重矩阵;Wrx,Wfx,Wox表示与x连接的权重矩阵;
Flatten层的Flatten操作将LSTM层输出的经度时间序列和纬度时间序列拉伸,得到的输出序列为单维的时间序列;Dense层的结构为普通神经元;Dense1层的前向传播公式如下:
Figure BDA0002532894570000076
Dense1层的输入为Flatten层的输出向量h',Dense1层的神经元个数为200,输出向量由(H1,H2...H200)表示;W1表示Dense1层中的权重矩阵,σ1表示Dense1层的激活函数,
Figure BDA0002532894570000077
表示Dense1层的偏置参数;
Dense2层的前向传播公式如下:
Figure BDA0002532894570000078
其中,W2表示Dense2层中的权重矩阵;Dense2层作为所述航迹预测神经网络模型的输出层,Dense2层的输入为Dense1层的输出向量y1,Dense2层的神经元的个数为2,输出航迹点中经度和纬度二维元素;σ2表示Dense2层的激活函数,
Figure BDA0002532894570000081
表示Dense2层的偏置参数;
在所述航迹预测神经网络模型中,对于真实航迹点序列{(a1,b1),(a2,b2),...,(an,bn)}和预测航迹点序列
Figure BDA0002532894570000082
利用均方误差loss的形式来定义损失函数:
Figure BDA0002532894570000083
Figure BDA0002532894570000084
其中,loss表示航迹预测神经网络模型的损失函数,为真实航迹点序列与预测航迹点序列之间欧氏距离的平方函数;Batch_size表示一次训练中的样本数量;(ak,bk)表示一次训练中第k个真实航迹点,
Figure BDA0002532894570000085
表示一次训练中第k个预测航迹点;
Figure BDA0002532894570000086
表示航迹预测神经网络模型中连接各层之间的权重矩阵中t时刻第p行第q列的元素,
Figure BDA0002532894570000087
表示航迹预测神经网络模型中连接各层之间的权重矩阵中t-1时刻第p行第q列的元素;η表示航迹预测过程中的学习率,用于控制航迹预测神经网络模型更新的步长;
Figure BDA0002532894570000088
表示损失函数在ωpq处的梯度;
采用离散下降法在训练过程中随着训练次数的增加而减小学习率,每隔训练50次,学习率减小一半;
将搭建好的航迹预测神经网络模型反复训练三次,每次训练完成后,将得到的最佳权值矩阵进行保存,并重新设置初始学习率,加载到下一次的训练中;第一次训练中使用Adam优化器进行训练,后面两次训练中使用SGD优化器进行训练。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S5,采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理,具体包括:
采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理:
Figure BDA0002532894570000091
Figure BDA0002532894570000092
本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法,首先将连续的航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化处理后,使用Douglas-Peucker算法对航迹数据进行压缩,在尽可能保留航迹数据内在特性的基础上减少数据量,然后,使用DBSCAN聚类算法根据航迹特征对航迹进行聚类,最后,根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,通过航迹预测神经网络模型进行航迹预测,完成多维度高精度航迹预测任务。本发明将原始航迹数据压缩,在保留航迹特征的情况下极大减轻了计算压力,缩短了运算时间,提高了运算效率;根据国际热点、天气状况等因素进行航迹聚类划分,实现了多维度因素下的预测功能;采用卷积加LSTM神经网络模型,考虑到时间因素在航迹中同样具有规律性,使用卷积进行特征提取,有利于提高LSTM神经网络模型对航迹预测的精度。
附图说明
图1为本发明提供的一种基于线段聚类的多维度高精度航迹智能预测方法的流程图;
图2为航迹数据压缩原理示意图;
图3为线段间距离的计算原理示意图。
具体实施方式
下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整的描述,显然,所描述的实施方式仅仅是作为例示,并非用于限制本发明。
本发明提供的一种基于线段聚类的多维度高精度航迹智能预测方法,如图1所示,包括如下步骤:
S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
S3:将提取的各特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇;
S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。
在具体实施时,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,航迹预测神经网络模型的训练过程,可以包括如下步骤:
SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
SS3:将提取的各特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇;
SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
需要说明的是,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,在进行航迹预测之前需要预先训练航迹预测神经网络模型,待训练完成后,每次进行航迹预测无需再重复训练航迹预测神经网络模型。实际应用时航迹预测过程中的步骤S1~步骤S3与航迹预测神经网络模型训练过程中的步骤SS1~步骤SS3的具体实施类似,区别在于两个过程的处理对象不同,实际应用时航迹预测过程是对待预测航迹数据进行处理,航迹预测神经网络模型训练过程是对历史航迹数据进行处理。
下面通过一个具体的实施例对本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法的具体实施进行详细说明。
实施例1:
第一步,训练航迹预测神经网络模型。
(1)根据海上移动目标的航迹特性,选择合适的时间间隔将原始连续的历史航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化后,形成原始训练集。
由于在对历史航迹数据进行模型训练时所使用的神经网络算法的输入、输出通常为离散数据,因此,需要采用等距离散的方法将原始连续的历史航迹数据进行离散化,以便于后续输入航迹预测神经网络模型中进行训练,时间间隔为Δt。若Δt取值过大,航迹数据会损失较多的航迹信息;若Δt取值过小,又会使航迹数据过于密集,增大计算压力,因此,需要根据实际航迹数据的特点,选择合适的时间间隔。离散后的航迹数据按照TLL(time,latitude,longitude)的格式导出。
180度经线是本初子午线向东180度的经线,既为东经180度,又为西经180度。在利用工具将航迹数据进行文件格式转化时,会将东经的经度取为正值,将西经的经度取为负值。航迹数据在经过经度为180度的经线时会发生突变,影响到数据在时间上的连续性,不利于使用航迹预测神经网络模型对航迹序列进行时间上的预测,因此,需要对发生突变的航迹序列进行处理。具体地,可以利用公式(1)对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:
a=awest+360 (1)
其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度。
在航迹数据传输过程中,传输过程出错、读错数据、记错数据和操作不当等现象经常发生,会造成部分航迹数据异常或数据丢失等问题,从而使航迹预测结果精度受到影响,无法得出科学的结论。这些异常数据被定义为野值,野值数据通常与正常数据之间差别较大,需要将野值数据删除。经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:
Figure BDA0002532894570000121
其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量。当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,应该将航迹点(ai,bi)剔除;野值数据判定值ld的选取规则应该以移动目标在正常情况下的航迹点(ai,bi)与相邻航迹点(ai-1,bi-1)、(ai+1,bi+1)之间的欧氏距离为标准。
航迹预测神经网络模型中所需要的经纬度时间序列包括移动目标的经度时间序列和纬度时间序列两列。为了同等程度地看待经度时间序列和纬度时间序列两个特征,将经度时间序列和纬度时间序列两个特征量化到统一的区间,需要在航迹预测神经网络模型中的输入层前面加入归一化层结构,使航迹预测过程中的经度时间序列和纬度时间序列量化到(0,1)的范围内。具体地,采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:
Figure BDA0002532894570000122
Figure BDA0002532894570000123
其中,
Figure BDA0002532894570000131
表示将经度ai归一化到[0,1]后的值,amin和amax分别表示所有经度数据(a1,a2,...,an)中的最小值和最大值;
Figure BDA0002532894570000132
表示将纬度bi归一化到[0,1]后的值,bmin和bmax分别表示所有纬度数据(b1,b2,...,bn)中的最小值和最大值。
(2)使用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点。在尽可能保留航迹数据内在特性(提取航迹中变速变向的特征点)的基础上,通过航迹压缩技术减少数据量。
为了直观地描述本发明选取特征点的原理,下面以一具体航迹为例进行说明,如图2所示。1)无条件选取航迹的首尾两个端点为特征点,即图2中的A点和B点,并连接首尾两个端点(A点和B点)构造基线;2)遍历计算除A点和B点外剩余航迹点到基线的距离,找到距离基线最远的航迹点,即图2中C点,并判断C点到基线的距离是否大于阈值Dmax;若C点到基线的距离大于阈值,则选取C点为特征点,并以C点为界将剩余航迹点划分为两个航迹,图2中划分为航迹A~C和航迹C~B,否则,算法结束;3)对新划分出的航迹A~C和航迹C~B再次从1)步骤开始处理,直到所有新划分出的航迹再也选取不出新的特征点为止,图2中E点为航迹C~B的特征点。最终所有特征点的连线,即所有基线就是划分后的航迹。具体算法如下:
Figure BDA0002532894570000133
Figure BDA0002532894570000141
(3)将提取的各特征点依次连接,得到一个个的航迹片段集,由于去往不同地点的航线具有很大特征上的不同,因此,通过聚类实现对不同特征航迹的划分,具体利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇。
假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:
ε-邻域集Nε
Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε} (5)
其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;
核心线段:给定邻域范围ε和邻域密度阈值MinLns,若Nε(Lu)中的线段数量大于或等于MinLns,则认为线段Lu为核心线段;
直接密度可达:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv为核心线段,线段Lu在线段Lv的ε-邻域集Nε中,则认为从线段Lu到线段Lv直接密度可达;
密度可达:给定邻域范围ε和邻域密度阈值MinLns,若从线段Lu到线段Lw直接密度可达,且从线段Lw到线段Lv直接密度可达,则认为从线段Lu到线段Lv密度可达;
密度相连:给定邻域范围ε和邻域密度阈值MinLns,若存在线段Lw,且线段Lu和线段Lv都从线段Lw密度可达,则认为线段Lu和线段Lv互相密度相连;
噪声线段:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv与航迹片段集D内所有线段都不密度相连,则认为Lv为噪声线段;
线段距离:先将线段距离分解为垂直距离、水平距离和角度距离,再通过加权求和得到线段距离,如图3所示;
线段Lu与线段Lv的垂直距离d(Lu,Lv)定义为:
Figure BDA0002532894570000151
其中,线段Lv的两个端点分别为sv和ev,sv到线段Lu的垂点为ps,ev到线段Lu的垂点为pe;l⊥1表示sv到ps的欧氏距离,l⊥2表示ev到pe的欧氏距离;
线段Lu与线段Lv的水平距离d//(Lu,Lv)定义为:
d//(Lu,Lv)=MIN(l//1,l//2) (7)
其中,线段Lu的两个端点分别为su和eu;l//1表示ps到su和eu的最小欧氏距离;l//2表示pe到su和eu的最小欧氏距离;
线段Lu与线段Lv的角度距离dθ(Lu,Lv)定义为:
Figure BDA0002532894570000161
其中,||Lv||为线段Lv的长度,θ为线段Lv和线段Lu之间的最小夹角;
线段距离ddist(Lu,Lv)计算公式如下:
ddist(Lu,Lv)=ω·d(Lu,Lv)+ω//·d//(Lu,Lv)+ωθ·dθ(Lu,Lv) (9)
其中,w表示垂直距离的权重值,w//表示水平距离的权重值,wθ表示角度距离的权重值;w、w//和wθ都大于零,可根据航迹对各权值的敏感程度进行调节。
DBSCAN聚类算法的思路为:1)遍历航迹片段集,找到所有的核心线段;2)根据邻域范围,将所有的核心线段连通聚合成航迹簇;3)在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中,最终无法加入到航迹簇中的线段为噪声线段。简而言之,就是找到航迹数据中所有密度相连的线段,各自为簇。具体算法如下:
Figure BDA0002532894570000162
Figure BDA0002532894570000171
(4)将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
具体地,航迹预测神经网络模型的网络架构如下:
基于卷积和LSTM神经网络模型,由年、月、日、时、经度、纬度以及时间步长建立样本矩阵,作为输入数据;整个航迹预测神经网络模型使用真实航迹点和预测航迹点之间欧氏距离的平方作为损失函数来测试训练结果;航迹预测神经网络模型包括卷积层、LSTM层、Flatten层和Dense层。
随机设置卷积核权值矩阵,在进行卷积时卷积核权值矩阵随卷积次数更新而优化。定义第一层卷积层具有20个卷积核,每个卷积核的大小为3*3,步长为3;经过第一层卷积层的训练后,将第一层卷积层的输出结果输入到第二层卷积层中,定义卷积核的大小为40;为了学习更深层次的特征,加入第三层卷积层,卷积核的个数为80;将提取航迹特征后的带有年、月、日、时、经度和纬度6个特征的数据输入LSTM神经网络中,LSTM层的前向传播公式如下:
Figure BDA0002532894570000181
Figure BDA0002532894570000182
Figure BDA0002532894570000183
Figure BDA0002532894570000184
Figure BDA0002532894570000185
其中,calc_gate表示门的计算操作,ct表示移动目标在t时刻的LSTM单元航迹序列状态,ct-1表示移动目标在t-1时刻的LSTM单元航迹序列状态,
Figure BDA0002532894570000186
表示移动目标在LSTM层中的暂存航迹序列状态,f、r和o分别表示LSTM层中遗忘门、输入门和输出门经过门的前向计算过程后得到的输出状态;
Figure BDA0002532894570000187
表示按元素乘的运算;由于LSTM层中单元航迹序列状态和输入门、遗忘门的输出状态分别为向量格式,因此,f与ct-1之间以及r与
Figure BDA0002532894570000188
之间的运算采用按元素乘的格式;x为输入状态,表示LSTM层中输入的历史航迹;br、bf、bo表示偏置参数;h表示LSTM层的输出航迹状态;ht-1表示LSTM层在t-1时刻的输出航迹状态;σg和σ(c)表示遗忘门、输入门、输出门和输出状态计算过程中的激活函数;Wrh,Wfh,Woh表示与h连接的权重矩阵;Wrx,Wfx,Wox表示与x连接的权重矩阵;
Flatten层的Flatten操作将LSTM层输出的经度时间序列和纬度时间序列拉伸,得到的输出序列为单维的时间序列;Dense层的结构为普通神经元;Dense1层的前向传播公式如下:
Figure BDA0002532894570000191
Dense1层的输入为Flatten层的输出向量h',Dense1层的神经元个数为200,输出向量由(H1,H2...H200)表示;W1表示Dense1层中的权重矩阵,σ1表示Dense1层的激活函数,
Figure BDA0002532894570000192
表示Dense1层的偏置参数;
Dense2层的前向传播公式如下:
Figure BDA0002532894570000193
其中,W2表示Dense2层中的权重矩阵;Dense2层作为航迹预测神经网络模型的输出层,Dense2层的输入为Dense1层的输出向量y1,Dense2层的神经元的个数为2,输出航迹点中经度和纬度二维元素;σ2表示Dense2层的激活函数,
Figure BDA0002532894570000194
表示Dense2层的偏置参数;
在航迹预测神经网络模型中,对于真实航迹点序列{(a1,b1),(a2,b2),...,(an,bn)}和预测航迹点序列
Figure BDA0002532894570000195
利用均方误差loss的形式来定义损失函数:
Figure BDA0002532894570000196
Figure BDA0002532894570000197
其中,loss表示航迹预测神经网络模型的损失函数,为真实航迹点序列与预测航迹点序列之间欧氏距离的平方函数;Batch_size表示一次训练中的样本数量;(ak,bk)表示一次训练中第k个真实航迹点,
Figure BDA0002532894570000198
表示一次训练中第k个预测航迹点;
Figure BDA0002532894570000199
表示航迹预测神经网络模型中连接各层之间的权重矩阵中t时刻第p行第q列的元素,
Figure BDA00025328945700001910
表示航迹预测神经网络模型中连接各层之间的权重矩阵中t-1时刻第p行第q列的元素;η表示航迹预测过程中的学习率,用于控制航迹预测神经网络模型更新的步长;
Figure BDA0002532894570000201
表示损失函数在ωpq处的梯度;
采用离散下降法在训练过程中随着训练次数的增加而减小学习率,每隔训练50次,学习率减小一半;训练时学习率在回调函数中不断调整,进而合理控制训练速率。
选取多层次训练的策略,将搭建好的航迹预测神经网络模型反复训练三次,每次训练完成后,将得到的最佳权值矩阵进行保存,并重新设置初始学习率,加载到下一次的训练中;第一次训练中使用Adam优化器进行训练,后面两次训练中使用SGD优化器进行训练。
第二步,利用训练好的航迹预测神经网络模型进行航迹预测。
(1)采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
(2)利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
(3)将提取的各特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇;
上述三个步骤的具体实施与第一步中前三个步骤的具体实施类似,在此不做赘述。
(4)根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
(5)采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。反归一化处理为归一化处理的逆运算。具体地,需要在航迹预测神经网络模型中的输出层后加入反归一化层结构,使得归一化的经度时间序列和纬度时间序列由(0,1)的范围映射回原始大小。具体可以采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理:
Figure BDA0002532894570000211
Figure BDA0002532894570000212
由此,可以得到多维度因素下的航迹预测结果。
本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法,首先将连续的航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化处理后,使用Douglas-Peucker算法对航迹数据进行压缩,在尽可能保留航迹数据内在特性的基础上减少数据量,然后,使用DBSCAN聚类算法根据航迹特征对航迹进行聚类,最后,根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,通过航迹预测神经网络模型进行航迹预测,完成多维度高精度航迹预测任务。本发明将原始航迹数据压缩,在保留航迹特征的情况下极大减轻了计算压力,缩短了运算时间,提高了运算效率;根据国际热点、天气状况等因素进行航迹聚类划分,实现了多维度因素下的预测功能;采用卷积加LSTM神经网络模型,考虑到时间因素在航迹中同样具有规律性,使用卷积进行特征提取,有利于提高LSTM神经网络模型对航迹预测的精度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,包括如下步骤:
S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
S3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。
2.如权利要求1所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,所述航迹预测神经网络模型的训练过程,包括如下步骤:
SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
SS3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
3.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S1和步骤SS1中,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理,具体包括:
对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:
a=awest+360 (1)
其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度;
经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:
Figure FDA0002532894560000021
其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量;
当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,将航迹点(ai,bi)剔除;
采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:
Figure FDA0002532894560000022
Figure FDA0002532894560000023
其中,
Figure FDA0002532894560000024
表示将经度ai归一化到[0,1]后的值,amin和amax分别表示所有经度数据(a1,a2,...,an)中的最小值和最大值;
Figure FDA0002532894560000025
表示将纬度bi归一化到[0,1]后的值,bmin和bmax分别表示所有纬度数据(b1,b2,...,bn)中的最小值和最大值。
4.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S2和步骤SS2中,利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点,具体包括如下步骤:
S21:将航迹的首尾两个端点连接,构造基线;
S22:计算除航迹的首尾两个端点外的其余航迹点到基线的距离,找到距离基线最远的航迹点,并判断该航迹点距离基线的距离是否大于阈值;若是,则执行步骤S23;若否,则执行步骤S24;
S23:选取该航迹点为特征点,并以该航迹点为界将除该航迹点外的其余航迹点划分为两个航迹;返回步骤S21,在新划分出的航迹中提取特征点;
S24:算法结束。
5.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S3和步骤SS3中,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇,具体包括如下步骤:
S31:遍历航迹片段集,找到所有的核心线段;
S32:根据邻域范围,将所有的核心线段连通聚合成航迹簇;
S33:在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中;
其中,对核心线段和密度相连解释如下:
假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:
ε-邻域集Nε
Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε} (5)
其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;
核心线段:给定邻域范围ε和邻域密度阈值MinLns,若Nε(Lu)中的线段数量大于或等于MinLns,则认为线段Lu为核心线段;
直接密度可达:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv为核心线段,线段Lu在线段Lv的ε-邻域集Nε中,则认为从线段Lu到线段Lv直接密度可达;
密度可达:给定邻域范围ε和邻域密度阈值MinLns,若从线段Lu到线段Lw直接密度可达,且从线段Lw到线段Lv直接密度可达,则认为从线段Lu到线段Lv密度可达;
密度相连:给定邻域范围ε和邻域密度阈值MinLns,若存在线段Lw,且线段Lu和线段Lv都从线段Lw密度可达,则认为线段Lu和线段Lv互相密度相连;
线段距离:先将线段距离分解为垂直距离、水平距离和角度距离,再通过加权求和得到线段距离;线段Lu与线段Lv的垂直距离d(Lu,Lv)定义为:
Figure FDA0002532894560000041
其中,线段Lv的两个端点分别为sv和ev,sv到线段Lu的垂点为ps,ev到线段Lu的垂点为pe;l⊥1表示sv到ps的欧氏距离,l⊥2表示ev到pe的欧氏距离;
线段Lu与线段Lv的水平距离d//(Lu,Lv)定义为:
d//(Lu,Lv)=MIN(l//1,l//2) (7)
其中,线段Lu的两个端点分别为su和eu;l//1表示ps到su和eu的最小欧氏距离;l//2表示pe到su和eu的最小欧氏距离;
线段Lu与线段Lv的角度距离dθ(Lu,Lv)定义为:
Figure FDA0002532894560000042
其中,||Lv||为线段Lv的长度,θ为线段Lv和线段Lu之间的最小夹角;
线段距离ddist(Lu,Lv)计算公式如下:
ddist(Lu,Lv)=ω·d(Lu,Lv)+ω//·d//(Lu,Lv)+ωθ·dθ(Lu,Lv) (9)
其中,w表示垂直距离的权重值,w//表示水平距离的权重值,wθ表示角度距离的权重值。
6.如权利要求1~5任一项所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,所述航迹预测神经网络模型的网络架构如下:
基于卷积和LSTM神经网络模型,由年、月、日、时、经度、纬度以及时间步长建立样本矩阵,作为输入数据;所述航迹预测神经网络模型包括卷积层、LSTM层、Flatten层和Dense层;
随机设置卷积核权值矩阵,定义第一层卷积层具有20个卷积核,每个卷积核的大小为3*3,步长为3;经过第一层卷积层的训练后,将第一层卷积层的输出结果输入到第二层卷积层中,定义卷积核的大小为40;加入第三层卷积层,卷积核的个数为80;将提取航迹特征后的带有年、月、日、时、经度和纬度6个特征的数据输入LSTM神经网络中,LSTM层的前向传播公式如下:
Figure FDA0002532894560000051
Figure FDA0002532894560000052
Figure FDA0002532894560000053
Figure FDA0002532894560000054
Figure FDA0002532894560000055
其中,calc_gate表示门的计算操作,ct表示移动目标在t时刻的LSTM单元航迹序列状态,ct-1表示移动目标在t-1时刻的LSTM单元航迹序列状态,
Figure FDA0002532894560000056
表示移动目标在LSTM层中的暂存航迹序列状态,f、r和o分别表示LSTM层中遗忘门、输入门和输出门经过门的前向计算过程后得到的输出状态;
Figure FDA0002532894560000057
表示按元素乘的运算;x为输入状态,表示LSTM层中输入的历史航迹;br、bf、bo表示偏置参数;h表示LSTM层的输出航迹状态;ht-1表示LSTM层在t-1时刻的输出航迹状态;σg和σ(c)表示遗忘门、输入门、输出门和输出状态计算过程中的激活函数;Wrh,Wfh,Woh表示与h连接的权重矩阵;Wrx,Wfx,Wox表示与x连接的权重矩阵;
Flatten层的Flatten操作将LSTM层输出的经度时间序列和纬度时间序列拉伸,得到的输出序列为单维的时间序列;Dense层的结构为普通神经元;Dense1层的前向传播公式如下:
Figure FDA0002532894560000061
Dense1层的输入为Flatten层的输出向量h',Dense1层的神经元个数为200,输出向量由(H1,H2...H200)表示;W1表示Dense1层中的权重矩阵,σ1表示Dense1层的激活函数,
Figure FDA0002532894560000062
表示Dense1层的偏置参数;
Dense2层的前向传播公式如下:
Figure FDA0002532894560000063
其中,W2表示Dense2层中的权重矩阵;Dense2层作为所述航迹预测神经网络模型的输出层,Dense2层的输入为Dense1层的输出向量y1,Dense2层的神经元的个数为2,输出航迹点中经度和纬度二维元素;σ2表示Dense2层的激活函数,
Figure FDA0002532894560000064
表示Dense2层的偏置参数;
在所述航迹预测神经网络模型中,对于真实航迹点序列{(a1,b1),(a2,b2),...,(an,bn)}和预测航迹点序列
Figure FDA0002532894560000065
利用均方误差loss的形式来定义损失函数:
Figure FDA0002532894560000066
Figure FDA0002532894560000067
其中,loss表示航迹预测神经网络模型的损失函数,为真实航迹点序列与预测航迹点序列之间欧氏距离的平方函数;Batch_size表示一次训练中的样本数量;(ak,bk)表示一次训练中第k个真实航迹点,
Figure FDA0002532894560000071
表示一次训练中第k个预测航迹点;
Figure FDA0002532894560000072
表示航迹预测神经网络模型中连接各层之间的权重矩阵中t时刻第p行第q列的元素,
Figure FDA0002532894560000073
表示航迹预测神经网络模型中连接各层之间的权重矩阵中t-1时刻第p行第q列的元素;η表示航迹预测过程中的学习率,用于控制航迹预测神经网络模型更新的步长;
Figure FDA0002532894560000074
表示损失函数在ωpq处的梯度;
采用离散下降法在训练过程中随着训练次数的增加而减小学习率,每隔训练50次,学习率减小一半;
将搭建好的航迹预测神经网络模型反复训练三次,每次训练完成后,将得到的最佳权值矩阵进行保存,并重新设置初始学习率,加载到下一次的训练中;第一次训练中使用Adam优化器进行训练,后面两次训练中使用SGD优化器进行训练。
7.如权利要求1所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S5,采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理,具体包括:
采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理:
Figure FDA0002532894560000075
Figure FDA0002532894560000076
CN202010523201.5A 2020-06-10 2020-06-10 一种基于线段聚类的多维度高精度航迹智能预测方法 Active CN111858565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010523201.5A CN111858565B (zh) 2020-06-10 2020-06-10 一种基于线段聚类的多维度高精度航迹智能预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010523201.5A CN111858565B (zh) 2020-06-10 2020-06-10 一种基于线段聚类的多维度高精度航迹智能预测方法

Publications (2)

Publication Number Publication Date
CN111858565A true CN111858565A (zh) 2020-10-30
CN111858565B CN111858565B (zh) 2023-04-21

Family

ID=72987455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010523201.5A Active CN111858565B (zh) 2020-06-10 2020-06-10 一种基于线段聚类的多维度高精度航迹智能预测方法

Country Status (1)

Country Link
CN (1) CN111858565B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418521A (zh) * 2020-11-23 2021-02-26 青岛科技大学 一种短时海洋鱼群和鱼量的预测方法
CN112906858A (zh) * 2021-01-26 2021-06-04 武汉工程大学 一种船舶运动轨迹实时预测方法
CN113887590A (zh) * 2021-09-22 2022-01-04 中国电子科技集团公司第二十九研究所 一种目标典型航迹及区域分析方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017067624A (ja) * 2015-09-30 2017-04-06 三菱電機株式会社 目標追尾装置及びレーダ装置
CN106877875A (zh) * 2017-01-22 2017-06-20 齐鲁工业大学 一种基于阈值结合算法的车辆运行轨迹压缩方法
CN109508812A (zh) * 2018-10-09 2019-03-22 南京航空航天大学 一种基于深度记忆网络的航空器航迹预测方法
CN110210537A (zh) * 2019-05-22 2019-09-06 中国电子科技集团公司第二十八研究所 一种基于无监督聚类的船舶历史航迹规律提取方法
CN110309383A (zh) * 2019-06-17 2019-10-08 武汉科技大学 基于改进的dbscan算法的船舶轨迹聚类分析方法
CN110675418A (zh) * 2019-09-26 2020-01-10 深圳市唯特视科技有限公司 一种基于ds证据理论的目标轨迹优化方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017067624A (ja) * 2015-09-30 2017-04-06 三菱電機株式会社 目標追尾装置及びレーダ装置
CN106877875A (zh) * 2017-01-22 2017-06-20 齐鲁工业大学 一种基于阈值结合算法的车辆运行轨迹压缩方法
CN109508812A (zh) * 2018-10-09 2019-03-22 南京航空航天大学 一种基于深度记忆网络的航空器航迹预测方法
CN110210537A (zh) * 2019-05-22 2019-09-06 中国电子科技集团公司第二十八研究所 一种基于无监督聚类的船舶历史航迹规律提取方法
CN110309383A (zh) * 2019-06-17 2019-10-08 武汉科技大学 基于改进的dbscan算法的船舶轨迹聚类分析方法
CN110675418A (zh) * 2019-09-26 2020-01-10 深圳市唯特视科技有限公司 一种基于ds证据理论的目标轨迹优化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DEJUN CHEN ET.AL: "Research on Ship Collision Avoidance Method Based on Track Prediction", 《APCIM & ICTTE 2018: PROCEEDINGS OF THE ASIA-PACIFIC CONFERENCE ON INTELLIGENT MEDICAL 2018 & INTERNATIONAL CONFERENCE ON TRANSPORTATION AND TRAFFIC ENGINEERING 2018》 *
马文耀: "船舶异常行为的一致性检测", 《中国博士学位论文全文数据库 (工程科技Ⅱ辑)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418521A (zh) * 2020-11-23 2021-02-26 青岛科技大学 一种短时海洋鱼群和鱼量的预测方法
CN112418521B (zh) * 2020-11-23 2023-02-24 青岛科技大学 一种短时海洋鱼群和鱼量的预测方法
CN112906858A (zh) * 2021-01-26 2021-06-04 武汉工程大学 一种船舶运动轨迹实时预测方法
CN113887590A (zh) * 2021-09-22 2022-01-04 中国电子科技集团公司第二十九研究所 一种目标典型航迹及区域分析方法

Also Published As

Publication number Publication date
CN111858565B (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
CN109508812B (zh) 一种基于深度记忆网络的航空器航迹预测方法
CN109142171B (zh) 基于特征扩张的融合神经网络的城市pm10浓度预测方法
CN111858565A (zh) 一种基于线段聚类的多维度高精度航迹智能预测方法
CN113642225B (zh) 一种基于attention机制的CNN-LSTM短期风电功率预测方法
CN111784041B (zh) 一种基于图卷积神经网络的风电功率预测方法及系统
CN112906858A (zh) 一种船舶运动轨迹实时预测方法
CN111815033A (zh) 一种基于rcnn和气象时序特征的海上风电功率预测方法
CN111695299B (zh) 一种中尺度涡轨迹预测方法
CN108346293B (zh) 一种实时交通流短时预测方法
CN111292525A (zh) 基于神经网络的交通流预测方法
CN109920248B (zh) 一种基于gru神经网络的公交到站时间预测方法
CN113554060B (zh) 一种融合dtw的lstm神经网络轨迹预测方法
CN113743011A (zh) 一种基于pso-bp神经网络的设备寿命预测方法和系统
CN115048870A (zh) 基于残差网络和注意力机制的目标轨迹识别方法
CN110929951B (zh) 一种用于电网告警信号的关联分析和预测方法
CN114022812B (zh) 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法
CN114912666A (zh) 一种基于ceemdan算法和注意力机制的短时客流量预测方法
Postaire et al. A fast algorithm for nonparametric probability density estimation
CN115862319A (zh) 一种面向时空图自编码器的交通流量预测方法
CN113076686A (zh) 一种基于社会长短期记忆网络的航空器轨迹预测方法
CN116612664A (zh) 基于改进时空图注意力神经网络的船舶交通流量预测方法
CN117390506A (zh) 一种基于网格编码与TextRCNN的船舶路径分类方法
CN117636183A (zh) 一种基于自监督预训练的小样本遥感图像分类方法
CN117786396A (zh) 一种基于CSA-ConvLSTM模型的短期海面温度预测方法及系统
CN115618988A (zh) 基于深度神经网络的海水温度、盐度与流速的三维时空场联合预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant