CN111858565A - 一种基于线段聚类的多维度高精度航迹智能预测方法 - Google Patents
一种基于线段聚类的多维度高精度航迹智能预测方法 Download PDFInfo
- Publication number
- CN111858565A CN111858565A CN202010523201.5A CN202010523201A CN111858565A CN 111858565 A CN111858565 A CN 111858565A CN 202010523201 A CN202010523201 A CN 202010523201A CN 111858565 A CN111858565 A CN 111858565A
- Authority
- CN
- China
- Prior art keywords
- track
- line segment
- layer
- data
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000003062 neural network model Methods 0.000 claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 40
- 238000010606 normalization Methods 0.000 claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims description 63
- 239000011159 matrix material Substances 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 14
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 101000878595 Arabidopsis thaliana Squalene synthase 1 Proteins 0.000 claims description 3
- 101000713575 Homo sapiens Tubulin beta-3 chain Proteins 0.000 claims description 3
- 102100036790 Tubulin beta-3 chain Human genes 0.000 claims description 3
- 238000011438 discrete method Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 abstract description 4
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
- G01C21/203—Specially adapted for sailing ships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Radar, Positioning & Navigation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Quality & Reliability (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于线段聚类的多维度高精度航迹智能预测方法,将连续的航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化处理后,使用Douglas‑Peucker算法对航迹数据进行压缩,使用DBSCAN聚类算法对航迹进行聚类,根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,通过航迹预测神经网络模型进行航迹预测,完成多维度高精度航迹预测任务。本发明将原始航迹数据压缩,在保留航迹特征的情况下极大减轻了计算压力,缩短了运算时间,提高了运算效率;采用卷积加LSTM神经网络模型,使用卷积进行特征提取,有利于提高LSTM神经网络模型对航迹预测的精度。
Description
技术领域
本发明涉及目标跟踪技术领域,尤其涉及一种基于线段聚类的多维度高精度航迹智能预测方法。
背景技术
针对掌握可疑移动目标航迹的具体任务,一方面要学习可疑移动目标航迹的规律,高精确度地预测出移动目标未来的航迹,另一方面还要考虑现实条件下的多维度因素,例如突发事件、国际热点、天气状况等情况,高精度预测出移动目标的航迹信息。
海洋中移动目标(例如船舶)航迹数据的采集方式,通常是间歇性地获取船舶当前位置的数据信息,根据船舶所处的不同状态以2s一次到数分钟一次不等的频率,向外播发位置信息。由于船舶航迹较长,因此,以2小时为单位进行数据采集。考虑在同一片区域内,每天可能有数百条船舶通行,由此产生的数据量会非常巨大,将它们全部记录下来会带来昂贵的存储开销,并且,还需要将如此庞大的数据加载到内存中进行分析处理,这对可视化平台系统的信息处理能力是一个巨大考验。船舶航迹数据是典型的时空大数据,其在多个领域都有着极其突出且重要的研究和应用价值。作为时序数据的特例,航迹数据具有鲜明的时序特征和突出的空间特征。因此,航迹数据的处理和挖掘方法不能完全照搬时序数据的经验,而应当考虑其特殊性。
当前限制航迹数据处理和挖掘的重要因素之一是移动目标航迹数据海量的数据规模。航迹数据的海量数据规模带来的问题是多方面的,主要表现在:1)数据储存压力大,海量的数据规模和非结构化的数据组织为航迹数据的实时数据存储和快速索引带来了巨大的挑战;2)数据的分析压力大,典型的数据挖掘方法在面对航迹数据时通常无法直接使用,为航迹数据的分析和挖掘带来了挑战。
传统的海上移动目标航迹预测方法不能针对以上缺点灵活地对航迹数据进行处理,在已有的预测方法中也较少考虑到国际热点、天气状况等多维度因素的影响。因此,不能满足日益复杂的航迹预测需求。
发明内容
有鉴于此,本发明提供了一种基于线段聚类的多维度高精度航迹智能预测方法,用于针对海上移动目标航迹数据及现实条件下多维度因素的处理,提供一种计算简单、约束及需求灵活、效率优良的海上移动目标航迹预测方法,解决多维度条件下的航迹预测问题。
因此,本发明提供了一种基于线段聚类的多维度高精度航迹智能预测方法,包括如下步骤:
S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
S3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,所述航迹预测神经网络模型的训练过程,包括如下步骤:
SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
SS3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S1和步骤SS1中,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理,具体包括:
对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:
a=awest+360 (1)
其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度;
经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:
其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量;
当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,将航迹点(ai,bi)剔除;
采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:
其中,表示将经度ai归一化到[0,1]后的值,amin和amax分别表示所有经度数据(a1,a2,...,an)中的最小值和最大值;表示将纬度bi归一化到[0,1]后的值,bmin和bmax分别表示所有纬度数据(b1,b2,...,bn)中的最小值和最大值。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S2和步骤SS2中,利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点,具体包括如下步骤:
S21:将航迹的首尾两个端点连接,构造基线;
S22:计算除航迹的首尾两个端点外的其余航迹点到基线的距离,找到距离基线最远的航迹点,并判断该航迹点距离基线的距离是否大于阈值;若是,则执行步骤S23;若否,则执行步骤S24;
S23:选取该航迹点为特征点,并以该航迹点为界将除该航迹点外的其余航迹点划分为两个航迹;返回步骤S21,在新划分出的航迹中提取特征点;
S24:算法结束。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S3和步骤SS3中,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇,具体包括如下步骤:
S31:遍历航迹片段集,找到所有的核心线段;
S32:根据邻域范围,将所有的核心线段连通聚合成航迹簇;
S33:在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中;
其中,对核心线段和密度相连解释如下:
假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:
ε-邻域集Nε:
Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε} (5)
其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;
核心线段:给定邻域范围ε和邻域密度阈值MinLns,若Nε(Lu)中的线段数量大于或等于MinLns,则认为线段Lu为核心线段;
直接密度可达:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv为核心线段,线段Lu在线段Lv的ε-邻域集Nε中,则认为从线段Lu到线段Lv直接密度可达;
密度可达:给定邻域范围ε和邻域密度阈值MinLns,若从线段Lu到线段Lw直接密度可达,且从线段Lw到线段Lv直接密度可达,则认为从线段Lu到线段Lv密度可达;
密度相连:给定邻域范围ε和邻域密度阈值MinLns,若存在线段Lw,且线段Lu和线段Lv都从线段Lw密度可达,则认为线段Lu和线段Lv互相密度相连;
线段距离:先将线段距离分解为垂直距离、水平距离和角度距离,再通过加权求和得到线段距离;线段Lu与线段Lv的垂直距离d⊥(Lu,Lv)定义为:
其中,线段Lv的两个端点分别为sv和ev,sv到线段Lu的垂点为ps,ev到线段Lu的垂点为pe;l⊥1表示sv到ps的欧氏距离,l⊥2表示ev到pe的欧氏距离;
线段Lu与线段Lv的水平距离d//(Lu,Lv)定义为:
d//(Lu,Lv)=MIN(l//1,l//2) (7)
其中,线段Lu的两个端点分别为su和eu;l//1表示ps到su和eu的最小欧氏距离;l//2表示pe到su和eu的最小欧氏距离;
线段Lu与线段Lv的角度距离dθ(Lu,Lv)定义为:
其中,||Lv||为线段Lv的长度,θ为线段Lv和线段Lu之间的最小夹角;
线段距离ddist(Lu,Lv)计算公式如下:
ddist(Lu,Lv)=ω⊥·d⊥(Lu,Lv)+ω//·d//(Lu,Lv)+ωθ·dθ(Lu,Lv) (9)
其中,w⊥表示垂直距离的权重值,w//表示水平距离的权重值,wθ表示角度距离的权重值。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,所述航迹预测神经网络模型的网络架构如下:
基于卷积和LSTM神经网络模型,由年、月、日、时、经度、纬度以及时间步长建立样本矩阵,作为输入数据;所述航迹预测神经网络模型包括卷积层、LSTM层、Flatten层和Dense层;
随机设置卷积核权值矩阵,定义第一层卷积层具有20个卷积核,每个卷积核的大小为3*3,步长为3;经过第一层卷积层的训练后,将第一层卷积层的输出结果输入到第二层卷积层中,定义卷积核的大小为40;加入第三层卷积层,卷积核的个数为80;将提取航迹特征后的带有年、月、日、时、经度和纬度6个特征的数据输入LSTM神经网络中,LSTM层的前向传播公式如下:
其中,calc_gate表示门的计算操作,ct表示移动目标在t时刻的LSTM单元航迹序列状态,ct-1表示移动目标在t-1时刻的LSTM单元航迹序列状态,表示移动目标在LSTM层中的暂存航迹序列状态,f、r和o分别表示LSTM层中遗忘门、输入门和输出门经过门的前向计算过程后得到的输出状态;表示按元素乘的运算;x为输入状态,表示LSTM层中输入的历史航迹;br、bf、bo表示偏置参数;h表示LSTM层的输出航迹状态;ht-1表示LSTM层在t-1时刻的输出航迹状态;σg和σ(c)表示遗忘门、输入门、输出门和输出状态计算过程中的激活函数;Wrh,Wfh,Woh表示与h连接的权重矩阵;Wrx,Wfx,Wox表示与x连接的权重矩阵;
Flatten层的Flatten操作将LSTM层输出的经度时间序列和纬度时间序列拉伸,得到的输出序列为单维的时间序列;Dense层的结构为普通神经元;Dense1层的前向传播公式如下:
Dense1层的输入为Flatten层的输出向量h',Dense1层的神经元个数为200,输出向量由(H1,H2...H200)表示;W1表示Dense1层中的权重矩阵,σ1表示Dense1层的激活函数,表示Dense1层的偏置参数;
Dense2层的前向传播公式如下:
其中,W2表示Dense2层中的权重矩阵;Dense2层作为所述航迹预测神经网络模型的输出层,Dense2层的输入为Dense1层的输出向量y1,Dense2层的神经元的个数为2,输出航迹点中经度和纬度二维元素;σ2表示Dense2层的激活函数,表示Dense2层的偏置参数;
其中,loss表示航迹预测神经网络模型的损失函数,为真实航迹点序列与预测航迹点序列之间欧氏距离的平方函数;Batch_size表示一次训练中的样本数量;(ak,bk)表示一次训练中第k个真实航迹点,表示一次训练中第k个预测航迹点;表示航迹预测神经网络模型中连接各层之间的权重矩阵中t时刻第p行第q列的元素,表示航迹预测神经网络模型中连接各层之间的权重矩阵中t-1时刻第p行第q列的元素;η表示航迹预测过程中的学习率,用于控制航迹预测神经网络模型更新的步长;表示损失函数在ωpq处的梯度;
采用离散下降法在训练过程中随着训练次数的增加而减小学习率,每隔训练50次,学习率减小一半;
将搭建好的航迹预测神经网络模型反复训练三次,每次训练完成后,将得到的最佳权值矩阵进行保存,并重新设置初始学习率,加载到下一次的训练中;第一次训练中使用Adam优化器进行训练,后面两次训练中使用SGD优化器进行训练。
在一种可能的实现方式中,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S5,采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理,具体包括:
采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理:
本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法,首先将连续的航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化处理后,使用Douglas-Peucker算法对航迹数据进行压缩,在尽可能保留航迹数据内在特性的基础上减少数据量,然后,使用DBSCAN聚类算法根据航迹特征对航迹进行聚类,最后,根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,通过航迹预测神经网络模型进行航迹预测,完成多维度高精度航迹预测任务。本发明将原始航迹数据压缩,在保留航迹特征的情况下极大减轻了计算压力,缩短了运算时间,提高了运算效率;根据国际热点、天气状况等因素进行航迹聚类划分,实现了多维度因素下的预测功能;采用卷积加LSTM神经网络模型,考虑到时间因素在航迹中同样具有规律性,使用卷积进行特征提取,有利于提高LSTM神经网络模型对航迹预测的精度。
附图说明
图1为本发明提供的一种基于线段聚类的多维度高精度航迹智能预测方法的流程图;
图2为航迹数据压缩原理示意图;
图3为线段间距离的计算原理示意图。
具体实施方式
下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整的描述,显然,所描述的实施方式仅仅是作为例示,并非用于限制本发明。
本发明提供的一种基于线段聚类的多维度高精度航迹智能预测方法,如图1所示,包括如下步骤:
S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
S3:将提取的各特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇;
S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。
在具体实施时,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,航迹预测神经网络模型的训练过程,可以包括如下步骤:
SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
SS3:将提取的各特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇;
SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
需要说明的是,在本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,在进行航迹预测之前需要预先训练航迹预测神经网络模型,待训练完成后,每次进行航迹预测无需再重复训练航迹预测神经网络模型。实际应用时航迹预测过程中的步骤S1~步骤S3与航迹预测神经网络模型训练过程中的步骤SS1~步骤SS3的具体实施类似,区别在于两个过程的处理对象不同,实际应用时航迹预测过程是对待预测航迹数据进行处理,航迹预测神经网络模型训练过程是对历史航迹数据进行处理。
下面通过一个具体的实施例对本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法的具体实施进行详细说明。
实施例1:
第一步,训练航迹预测神经网络模型。
(1)根据海上移动目标的航迹特性,选择合适的时间间隔将原始连续的历史航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化后,形成原始训练集。
由于在对历史航迹数据进行模型训练时所使用的神经网络算法的输入、输出通常为离散数据,因此,需要采用等距离散的方法将原始连续的历史航迹数据进行离散化,以便于后续输入航迹预测神经网络模型中进行训练,时间间隔为Δt。若Δt取值过大,航迹数据会损失较多的航迹信息;若Δt取值过小,又会使航迹数据过于密集,增大计算压力,因此,需要根据实际航迹数据的特点,选择合适的时间间隔。离散后的航迹数据按照TLL(time,latitude,longitude)的格式导出。
180度经线是本初子午线向东180度的经线,既为东经180度,又为西经180度。在利用工具将航迹数据进行文件格式转化时,会将东经的经度取为正值,将西经的经度取为负值。航迹数据在经过经度为180度的经线时会发生突变,影响到数据在时间上的连续性,不利于使用航迹预测神经网络模型对航迹序列进行时间上的预测,因此,需要对发生突变的航迹序列进行处理。具体地,可以利用公式(1)对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:
a=awest+360 (1)
其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度。
在航迹数据传输过程中,传输过程出错、读错数据、记错数据和操作不当等现象经常发生,会造成部分航迹数据异常或数据丢失等问题,从而使航迹预测结果精度受到影响,无法得出科学的结论。这些异常数据被定义为野值,野值数据通常与正常数据之间差别较大,需要将野值数据删除。经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:
其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量。当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,应该将航迹点(ai,bi)剔除;野值数据判定值ld的选取规则应该以移动目标在正常情况下的航迹点(ai,bi)与相邻航迹点(ai-1,bi-1)、(ai+1,bi+1)之间的欧氏距离为标准。
航迹预测神经网络模型中所需要的经纬度时间序列包括移动目标的经度时间序列和纬度时间序列两列。为了同等程度地看待经度时间序列和纬度时间序列两个特征,将经度时间序列和纬度时间序列两个特征量化到统一的区间,需要在航迹预测神经网络模型中的输入层前面加入归一化层结构,使航迹预测过程中的经度时间序列和纬度时间序列量化到(0,1)的范围内。具体地,采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:
其中,表示将经度ai归一化到[0,1]后的值,amin和amax分别表示所有经度数据(a1,a2,...,an)中的最小值和最大值;表示将纬度bi归一化到[0,1]后的值,bmin和bmax分别表示所有纬度数据(b1,b2,...,bn)中的最小值和最大值。
(2)使用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点。在尽可能保留航迹数据内在特性(提取航迹中变速变向的特征点)的基础上,通过航迹压缩技术减少数据量。
为了直观地描述本发明选取特征点的原理,下面以一具体航迹为例进行说明,如图2所示。1)无条件选取航迹的首尾两个端点为特征点,即图2中的A点和B点,并连接首尾两个端点(A点和B点)构造基线;2)遍历计算除A点和B点外剩余航迹点到基线的距离,找到距离基线最远的航迹点,即图2中C点,并判断C点到基线的距离是否大于阈值Dmax;若C点到基线的距离大于阈值,则选取C点为特征点,并以C点为界将剩余航迹点划分为两个航迹,图2中划分为航迹A~C和航迹C~B,否则,算法结束;3)对新划分出的航迹A~C和航迹C~B再次从1)步骤开始处理,直到所有新划分出的航迹再也选取不出新的特征点为止,图2中E点为航迹C~B的特征点。最终所有特征点的连线,即所有基线就是划分后的航迹。具体算法如下:
(3)将提取的各特征点依次连接,得到一个个的航迹片段集,由于去往不同地点的航线具有很大特征上的不同,因此,通过聚类实现对不同特征航迹的划分,具体利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇。
假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:
ε-邻域集Nε:
Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε} (5)
其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;
核心线段:给定邻域范围ε和邻域密度阈值MinLns,若Nε(Lu)中的线段数量大于或等于MinLns,则认为线段Lu为核心线段;
直接密度可达:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv为核心线段,线段Lu在线段Lv的ε-邻域集Nε中,则认为从线段Lu到线段Lv直接密度可达;
密度可达:给定邻域范围ε和邻域密度阈值MinLns,若从线段Lu到线段Lw直接密度可达,且从线段Lw到线段Lv直接密度可达,则认为从线段Lu到线段Lv密度可达;
密度相连:给定邻域范围ε和邻域密度阈值MinLns,若存在线段Lw,且线段Lu和线段Lv都从线段Lw密度可达,则认为线段Lu和线段Lv互相密度相连;
噪声线段:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv与航迹片段集D内所有线段都不密度相连,则认为Lv为噪声线段;
线段距离:先将线段距离分解为垂直距离、水平距离和角度距离,再通过加权求和得到线段距离,如图3所示;
线段Lu与线段Lv的垂直距离d⊥(Lu,Lv)定义为:
其中,线段Lv的两个端点分别为sv和ev,sv到线段Lu的垂点为ps,ev到线段Lu的垂点为pe;l⊥1表示sv到ps的欧氏距离,l⊥2表示ev到pe的欧氏距离;
线段Lu与线段Lv的水平距离d//(Lu,Lv)定义为:
d//(Lu,Lv)=MIN(l//1,l//2) (7)
其中,线段Lu的两个端点分别为su和eu;l//1表示ps到su和eu的最小欧氏距离;l//2表示pe到su和eu的最小欧氏距离;
线段Lu与线段Lv的角度距离dθ(Lu,Lv)定义为:
其中,||Lv||为线段Lv的长度,θ为线段Lv和线段Lu之间的最小夹角;
线段距离ddist(Lu,Lv)计算公式如下:
ddist(Lu,Lv)=ω⊥·d⊥(Lu,Lv)+ω//·d//(Lu,Lv)+ωθ·dθ(Lu,Lv) (9)
其中,w⊥表示垂直距离的权重值,w//表示水平距离的权重值,wθ表示角度距离的权重值;w⊥、w//和wθ都大于零,可根据航迹对各权值的敏感程度进行调节。
DBSCAN聚类算法的思路为:1)遍历航迹片段集,找到所有的核心线段;2)根据邻域范围,将所有的核心线段连通聚合成航迹簇;3)在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中,最终无法加入到航迹簇中的线段为噪声线段。简而言之,就是找到航迹数据中所有密度相连的线段,各自为簇。具体算法如下:
(4)将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
具体地,航迹预测神经网络模型的网络架构如下:
基于卷积和LSTM神经网络模型,由年、月、日、时、经度、纬度以及时间步长建立样本矩阵,作为输入数据;整个航迹预测神经网络模型使用真实航迹点和预测航迹点之间欧氏距离的平方作为损失函数来测试训练结果;航迹预测神经网络模型包括卷积层、LSTM层、Flatten层和Dense层。
随机设置卷积核权值矩阵,在进行卷积时卷积核权值矩阵随卷积次数更新而优化。定义第一层卷积层具有20个卷积核,每个卷积核的大小为3*3,步长为3;经过第一层卷积层的训练后,将第一层卷积层的输出结果输入到第二层卷积层中,定义卷积核的大小为40;为了学习更深层次的特征,加入第三层卷积层,卷积核的个数为80;将提取航迹特征后的带有年、月、日、时、经度和纬度6个特征的数据输入LSTM神经网络中,LSTM层的前向传播公式如下:
其中,calc_gate表示门的计算操作,ct表示移动目标在t时刻的LSTM单元航迹序列状态,ct-1表示移动目标在t-1时刻的LSTM单元航迹序列状态,表示移动目标在LSTM层中的暂存航迹序列状态,f、r和o分别表示LSTM层中遗忘门、输入门和输出门经过门的前向计算过程后得到的输出状态;表示按元素乘的运算;由于LSTM层中单元航迹序列状态和输入门、遗忘门的输出状态分别为向量格式,因此,f与ct-1之间以及r与之间的运算采用按元素乘的格式;x为输入状态,表示LSTM层中输入的历史航迹;br、bf、bo表示偏置参数;h表示LSTM层的输出航迹状态;ht-1表示LSTM层在t-1时刻的输出航迹状态;σg和σ(c)表示遗忘门、输入门、输出门和输出状态计算过程中的激活函数;Wrh,Wfh,Woh表示与h连接的权重矩阵;Wrx,Wfx,Wox表示与x连接的权重矩阵;
Flatten层的Flatten操作将LSTM层输出的经度时间序列和纬度时间序列拉伸,得到的输出序列为单维的时间序列;Dense层的结构为普通神经元;Dense1层的前向传播公式如下:
Dense1层的输入为Flatten层的输出向量h',Dense1层的神经元个数为200,输出向量由(H1,H2...H200)表示;W1表示Dense1层中的权重矩阵,σ1表示Dense1层的激活函数,表示Dense1层的偏置参数;
Dense2层的前向传播公式如下:
其中,W2表示Dense2层中的权重矩阵;Dense2层作为航迹预测神经网络模型的输出层,Dense2层的输入为Dense1层的输出向量y1,Dense2层的神经元的个数为2,输出航迹点中经度和纬度二维元素;σ2表示Dense2层的激活函数,表示Dense2层的偏置参数;
其中,loss表示航迹预测神经网络模型的损失函数,为真实航迹点序列与预测航迹点序列之间欧氏距离的平方函数;Batch_size表示一次训练中的样本数量;(ak,bk)表示一次训练中第k个真实航迹点,表示一次训练中第k个预测航迹点;表示航迹预测神经网络模型中连接各层之间的权重矩阵中t时刻第p行第q列的元素,表示航迹预测神经网络模型中连接各层之间的权重矩阵中t-1时刻第p行第q列的元素;η表示航迹预测过程中的学习率,用于控制航迹预测神经网络模型更新的步长;表示损失函数在ωpq处的梯度;
采用离散下降法在训练过程中随着训练次数的增加而减小学习率,每隔训练50次,学习率减小一半;训练时学习率在回调函数中不断调整,进而合理控制训练速率。
选取多层次训练的策略,将搭建好的航迹预测神经网络模型反复训练三次,每次训练完成后,将得到的最佳权值矩阵进行保存,并重新设置初始学习率,加载到下一次的训练中;第一次训练中使用Adam优化器进行训练,后面两次训练中使用SGD优化器进行训练。
第二步,利用训练好的航迹预测神经网络模型进行航迹预测。
(1)采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
(2)利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
(3)将提取的各特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对航迹片段集进行聚类,得到多个航迹簇;
上述三个步骤的具体实施与第一步中前三个步骤的具体实施类似,在此不做赘述。
(4)根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
(5)采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。反归一化处理为归一化处理的逆运算。具体地,需要在航迹预测神经网络模型中的输出层后加入反归一化层结构,使得归一化的经度时间序列和纬度时间序列由(0,1)的范围映射回原始大小。具体可以采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理:
由此,可以得到多维度因素下的航迹预测结果。
本发明提供的上述基于线段聚类的多维度高精度航迹智能预测方法,首先将连续的航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化处理后,使用Douglas-Peucker算法对航迹数据进行压缩,在尽可能保留航迹数据内在特性的基础上减少数据量,然后,使用DBSCAN聚类算法根据航迹特征对航迹进行聚类,最后,根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,通过航迹预测神经网络模型进行航迹预测,完成多维度高精度航迹预测任务。本发明将原始航迹数据压缩,在保留航迹特征的情况下极大减轻了计算压力,缩短了运算时间,提高了运算效率;根据国际热点、天气状况等因素进行航迹聚类划分,实现了多维度因素下的预测功能;采用卷积加LSTM神经网络模型,考虑到时间因素在航迹中同样具有规律性,使用卷积进行特征提取,有利于提高LSTM神经网络模型对航迹预测的精度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (7)
1.一种基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,包括如下步骤:
S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
S3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。
2.如权利要求1所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,所述航迹预测神经网络模型的训练过程,包括如下步骤:
SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
SS3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。
3.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S1和步骤SS1中,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理,具体包括:
对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:
a=awest+360 (1)
其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度;
经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:
其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量;
当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,将航迹点(ai,bi)剔除;
采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:
4.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S2和步骤SS2中,利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点,具体包括如下步骤:
S21:将航迹的首尾两个端点连接,构造基线;
S22:计算除航迹的首尾两个端点外的其余航迹点到基线的距离,找到距离基线最远的航迹点,并判断该航迹点距离基线的距离是否大于阈值;若是,则执行步骤S23;若否,则执行步骤S24;
S23:选取该航迹点为特征点,并以该航迹点为界将除该航迹点外的其余航迹点划分为两个航迹;返回步骤S21,在新划分出的航迹中提取特征点;
S24:算法结束。
5.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S3和步骤SS3中,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇,具体包括如下步骤:
S31:遍历航迹片段集,找到所有的核心线段;
S32:根据邻域范围,将所有的核心线段连通聚合成航迹簇;
S33:在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中;
其中,对核心线段和密度相连解释如下:
假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:
ε-邻域集Nε:
Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε} (5)
其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;
核心线段:给定邻域范围ε和邻域密度阈值MinLns,若Nε(Lu)中的线段数量大于或等于MinLns,则认为线段Lu为核心线段;
直接密度可达:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv为核心线段,线段Lu在线段Lv的ε-邻域集Nε中,则认为从线段Lu到线段Lv直接密度可达;
密度可达:给定邻域范围ε和邻域密度阈值MinLns,若从线段Lu到线段Lw直接密度可达,且从线段Lw到线段Lv直接密度可达,则认为从线段Lu到线段Lv密度可达;
密度相连:给定邻域范围ε和邻域密度阈值MinLns,若存在线段Lw,且线段Lu和线段Lv都从线段Lw密度可达,则认为线段Lu和线段Lv互相密度相连;
线段距离:先将线段距离分解为垂直距离、水平距离和角度距离,再通过加权求和得到线段距离;线段Lu与线段Lv的垂直距离d⊥(Lu,Lv)定义为:
其中,线段Lv的两个端点分别为sv和ev,sv到线段Lu的垂点为ps,ev到线段Lu的垂点为pe;l⊥1表示sv到ps的欧氏距离,l⊥2表示ev到pe的欧氏距离;
线段Lu与线段Lv的水平距离d//(Lu,Lv)定义为:
d//(Lu,Lv)=MIN(l//1,l//2) (7)
其中,线段Lu的两个端点分别为su和eu;l//1表示ps到su和eu的最小欧氏距离;l//2表示pe到su和eu的最小欧氏距离;
线段Lu与线段Lv的角度距离dθ(Lu,Lv)定义为:
其中,||Lv||为线段Lv的长度,θ为线段Lv和线段Lu之间的最小夹角;
线段距离ddist(Lu,Lv)计算公式如下:
ddist(Lu,Lv)=ω⊥·d⊥(Lu,Lv)+ω//·d//(Lu,Lv)+ωθ·dθ(Lu,Lv) (9)
其中,w⊥表示垂直距离的权重值,w//表示水平距离的权重值,wθ表示角度距离的权重值。
6.如权利要求1~5任一项所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,所述航迹预测神经网络模型的网络架构如下:
基于卷积和LSTM神经网络模型,由年、月、日、时、经度、纬度以及时间步长建立样本矩阵,作为输入数据;所述航迹预测神经网络模型包括卷积层、LSTM层、Flatten层和Dense层;
随机设置卷积核权值矩阵,定义第一层卷积层具有20个卷积核,每个卷积核的大小为3*3,步长为3;经过第一层卷积层的训练后,将第一层卷积层的输出结果输入到第二层卷积层中,定义卷积核的大小为40;加入第三层卷积层,卷积核的个数为80;将提取航迹特征后的带有年、月、日、时、经度和纬度6个特征的数据输入LSTM神经网络中,LSTM层的前向传播公式如下:
其中,calc_gate表示门的计算操作,ct表示移动目标在t时刻的LSTM单元航迹序列状态,ct-1表示移动目标在t-1时刻的LSTM单元航迹序列状态,表示移动目标在LSTM层中的暂存航迹序列状态,f、r和o分别表示LSTM层中遗忘门、输入门和输出门经过门的前向计算过程后得到的输出状态;表示按元素乘的运算;x为输入状态,表示LSTM层中输入的历史航迹;br、bf、bo表示偏置参数;h表示LSTM层的输出航迹状态;ht-1表示LSTM层在t-1时刻的输出航迹状态;σg和σ(c)表示遗忘门、输入门、输出门和输出状态计算过程中的激活函数;Wrh,Wfh,Woh表示与h连接的权重矩阵;Wrx,Wfx,Wox表示与x连接的权重矩阵;
Flatten层的Flatten操作将LSTM层输出的经度时间序列和纬度时间序列拉伸,得到的输出序列为单维的时间序列;Dense层的结构为普通神经元;Dense1层的前向传播公式如下:
Dense1层的输入为Flatten层的输出向量h',Dense1层的神经元个数为200,输出向量由(H1,H2...H200)表示;W1表示Dense1层中的权重矩阵,σ1表示Dense1层的激活函数,表示Dense1层的偏置参数;
Dense2层的前向传播公式如下:
其中,W2表示Dense2层中的权重矩阵;Dense2层作为所述航迹预测神经网络模型的输出层,Dense2层的输入为Dense1层的输出向量y1,Dense2层的神经元的个数为2,输出航迹点中经度和纬度二维元素;σ2表示Dense2层的激活函数,表示Dense2层的偏置参数;
其中,loss表示航迹预测神经网络模型的损失函数,为真实航迹点序列与预测航迹点序列之间欧氏距离的平方函数;Batch_size表示一次训练中的样本数量;(ak,bk)表示一次训练中第k个真实航迹点,表示一次训练中第k个预测航迹点;表示航迹预测神经网络模型中连接各层之间的权重矩阵中t时刻第p行第q列的元素,表示航迹预测神经网络模型中连接各层之间的权重矩阵中t-1时刻第p行第q列的元素;η表示航迹预测过程中的学习率,用于控制航迹预测神经网络模型更新的步长;表示损失函数在ωpq处的梯度;
采用离散下降法在训练过程中随着训练次数的增加而减小学习率,每隔训练50次,学习率减小一半;
将搭建好的航迹预测神经网络模型反复训练三次,每次训练完成后,将得到的最佳权值矩阵进行保存,并重新设置初始学习率,加载到下一次的训练中;第一次训练中使用Adam优化器进行训练,后面两次训练中使用SGD优化器进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010523201.5A CN111858565B (zh) | 2020-06-10 | 2020-06-10 | 一种基于线段聚类的多维度高精度航迹智能预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010523201.5A CN111858565B (zh) | 2020-06-10 | 2020-06-10 | 一种基于线段聚类的多维度高精度航迹智能预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111858565A true CN111858565A (zh) | 2020-10-30 |
CN111858565B CN111858565B (zh) | 2023-04-21 |
Family
ID=72987455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010523201.5A Active CN111858565B (zh) | 2020-06-10 | 2020-06-10 | 一种基于线段聚类的多维度高精度航迹智能预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111858565B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418521A (zh) * | 2020-11-23 | 2021-02-26 | 青岛科技大学 | 一种短时海洋鱼群和鱼量的预测方法 |
CN112906858A (zh) * | 2021-01-26 | 2021-06-04 | 武汉工程大学 | 一种船舶运动轨迹实时预测方法 |
CN113887590A (zh) * | 2021-09-22 | 2022-01-04 | 中国电子科技集团公司第二十九研究所 | 一种目标典型航迹及区域分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017067624A (ja) * | 2015-09-30 | 2017-04-06 | 三菱電機株式会社 | 目標追尾装置及びレーダ装置 |
CN106877875A (zh) * | 2017-01-22 | 2017-06-20 | 齐鲁工业大学 | 一种基于阈值结合算法的车辆运行轨迹压缩方法 |
CN109508812A (zh) * | 2018-10-09 | 2019-03-22 | 南京航空航天大学 | 一种基于深度记忆网络的航空器航迹预测方法 |
CN110210537A (zh) * | 2019-05-22 | 2019-09-06 | 中国电子科技集团公司第二十八研究所 | 一种基于无监督聚类的船舶历史航迹规律提取方法 |
CN110309383A (zh) * | 2019-06-17 | 2019-10-08 | 武汉科技大学 | 基于改进的dbscan算法的船舶轨迹聚类分析方法 |
CN110675418A (zh) * | 2019-09-26 | 2020-01-10 | 深圳市唯特视科技有限公司 | 一种基于ds证据理论的目标轨迹优化方法 |
-
2020
- 2020-06-10 CN CN202010523201.5A patent/CN111858565B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017067624A (ja) * | 2015-09-30 | 2017-04-06 | 三菱電機株式会社 | 目標追尾装置及びレーダ装置 |
CN106877875A (zh) * | 2017-01-22 | 2017-06-20 | 齐鲁工业大学 | 一种基于阈值结合算法的车辆运行轨迹压缩方法 |
CN109508812A (zh) * | 2018-10-09 | 2019-03-22 | 南京航空航天大学 | 一种基于深度记忆网络的航空器航迹预测方法 |
CN110210537A (zh) * | 2019-05-22 | 2019-09-06 | 中国电子科技集团公司第二十八研究所 | 一种基于无监督聚类的船舶历史航迹规律提取方法 |
CN110309383A (zh) * | 2019-06-17 | 2019-10-08 | 武汉科技大学 | 基于改进的dbscan算法的船舶轨迹聚类分析方法 |
CN110675418A (zh) * | 2019-09-26 | 2020-01-10 | 深圳市唯特视科技有限公司 | 一种基于ds证据理论的目标轨迹优化方法 |
Non-Patent Citations (2)
Title |
---|
DEJUN CHEN ET.AL: "Research on Ship Collision Avoidance Method Based on Track Prediction", 《APCIM & ICTTE 2018: PROCEEDINGS OF THE ASIA-PACIFIC CONFERENCE ON INTELLIGENT MEDICAL 2018 & INTERNATIONAL CONFERENCE ON TRANSPORTATION AND TRAFFIC ENGINEERING 2018》 * |
马文耀: "船舶异常行为的一致性检测", 《中国博士学位论文全文数据库 (工程科技Ⅱ辑)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418521A (zh) * | 2020-11-23 | 2021-02-26 | 青岛科技大学 | 一种短时海洋鱼群和鱼量的预测方法 |
CN112418521B (zh) * | 2020-11-23 | 2023-02-24 | 青岛科技大学 | 一种短时海洋鱼群和鱼量的预测方法 |
CN112906858A (zh) * | 2021-01-26 | 2021-06-04 | 武汉工程大学 | 一种船舶运动轨迹实时预测方法 |
CN113887590A (zh) * | 2021-09-22 | 2022-01-04 | 中国电子科技集团公司第二十九研究所 | 一种目标典型航迹及区域分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111858565B (zh) | 2023-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508812B (zh) | 一种基于深度记忆网络的航空器航迹预测方法 | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN111858565A (zh) | 一种基于线段聚类的多维度高精度航迹智能预测方法 | |
CN113642225B (zh) | 一种基于attention机制的CNN-LSTM短期风电功率预测方法 | |
CN111784041B (zh) | 一种基于图卷积神经网络的风电功率预测方法及系统 | |
CN112906858A (zh) | 一种船舶运动轨迹实时预测方法 | |
CN111815033A (zh) | 一种基于rcnn和气象时序特征的海上风电功率预测方法 | |
CN111695299B (zh) | 一种中尺度涡轨迹预测方法 | |
CN108346293B (zh) | 一种实时交通流短时预测方法 | |
CN111292525A (zh) | 基于神经网络的交通流预测方法 | |
CN109920248B (zh) | 一种基于gru神经网络的公交到站时间预测方法 | |
CN113554060B (zh) | 一种融合dtw的lstm神经网络轨迹预测方法 | |
CN113743011A (zh) | 一种基于pso-bp神经网络的设备寿命预测方法和系统 | |
CN115048870A (zh) | 基于残差网络和注意力机制的目标轨迹识别方法 | |
CN110929951B (zh) | 一种用于电网告警信号的关联分析和预测方法 | |
CN114022812B (zh) | 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法 | |
CN114912666A (zh) | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 | |
Postaire et al. | A fast algorithm for nonparametric probability density estimation | |
CN115862319A (zh) | 一种面向时空图自编码器的交通流量预测方法 | |
CN113076686A (zh) | 一种基于社会长短期记忆网络的航空器轨迹预测方法 | |
CN116612664A (zh) | 基于改进时空图注意力神经网络的船舶交通流量预测方法 | |
CN117390506A (zh) | 一种基于网格编码与TextRCNN的船舶路径分类方法 | |
CN117636183A (zh) | 一种基于自监督预训练的小样本遥感图像分类方法 | |
CN117786396A (zh) | 一种基于CSA-ConvLSTM模型的短期海面温度预测方法及系统 | |
CN115618988A (zh) | 基于深度神经网络的海水温度、盐度与流速的三维时空场联合预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |