CN112052873B - 基于通用转换器的异常轨迹检测方法及装置 - Google Patents
基于通用转换器的异常轨迹检测方法及装置 Download PDFInfo
- Publication number
- CN112052873B CN112052873B CN202010752616.XA CN202010752616A CN112052873B CN 112052873 B CN112052873 B CN 112052873B CN 202010752616 A CN202010752616 A CN 202010752616A CN 112052873 B CN112052873 B CN 112052873B
- Authority
- CN
- China
- Prior art keywords
- track
- sequence
- embedding
- universal converter
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 56
- 238000001514 detection method Methods 0.000 title claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/01—Satellite radio beacon positioning systems transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/13—Receivers
- G01S19/14—Receivers specially adapted for specific applications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/393—Trajectory determination or predictive tracking, e.g. Kalman filtering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明公开了一种基于通用转换器的异常轨迹检测方法及装置,其中,方法包括以下步骤:采集包含轨迹点序列的原始数据集;对原始数据集进行预处理,得到轨迹序列和遮罩序列,并将轨迹序列和遮罩序列输入通用转换器,以训练轨迹嵌入;通过通用转换器的两层的全连接神经网络分类轨迹判定当前轨迹是否异常。该方法通过使用通用转换器,有效的利用了完整的轨迹序列信息以及关键位置点在轨迹上下文中的作用,提升了异常轨迹检测模型的训练速度,并提升了其检测的效果,同时具备了解决数据稀疏性问题潜质。
Description
技术领域
本发明涉及轨迹检测技术领域,特别涉及一种基于通用转换器的异常轨迹检测方法及装置。
背景技术
相关技术中,可以通过基于子轨迹的距离和密度、基于距离的多维数据集、基于分段轨迹的多维特征、分析每个时间片段内的常见子轨迹、基于生成TS-片段的计算、基于轨迹的隔离性特征、基于图计算方法、基于时空语义的神经网络算法或基于循环神经网络和轨迹嵌入等技术进行异常轨迹检测。
然而,相关技术存在如下的缺点:
1、对完整轨迹序列信息的利用不足:
大量的现有技术主要关注于对固定起始地-目的地轨迹(或其轨迹片段)的密度、方向、隔离性特征进行计算,并没有将完整序列的重要性加以充分考量和关注。
2、对完整轨迹序列信息的利用不足:
大量的现有技术主要关注于对固定起始地-目的地轨迹(或其轨迹片段)的密度、方向、隔离性特征进行计算,并没有将完整序列的重要性加以充分考量和关注。
3、数据稀疏性和计算复杂度问题:
现有大多数方法主要基于固定的起始地-目的地点对进行计算。但是二维地图上的起始地-目的地点对数量是不可能被穷举和归纳完毕的,由此带来了二维地图上轨迹数据稀疏性问题。随着起始地-目的地点对的数据量的增加,基于对比数据库中轨迹相似性等特征的方法将会面临与数据量成正比的计算复杂度问题。导致了现有方法的泛化性和拓展性不足。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一目的在于提出一种基于通用转换器的异常轨迹检测方法,通过使用通用转换器,有效的利用了完整的轨迹序列信息以及关键位置点在轨迹上下文中的作用,提升了异常轨迹检测模型的训练速度,并提升了其检测的效果,同时具备了解决数据稀疏性问题潜质。
本发明的第二个目的在于提出一种基于通用转换器的异常轨迹检测装置。
为达到上述目的,本发明第一方面实施例提供一种基于通用转换器的异常轨迹检测方法,包括以下步骤:采集包含轨迹点序列的原始数据集;对所述原始数据集进行预处理,得到轨迹序列和遮罩序列,并将所述轨迹序列和所述遮罩序列输入通用转换器,以训练轨迹嵌入;通过所述通用转换器的两层的全连接神经网络分类轨迹判定当前轨迹是否异常。
根据本发明实施例的基于通用转换器的异常轨迹检测方法,极大提升模型的训练速度;具备在多个起始地-目的地点对数据间的泛化性和拓展性能力,具备解决轨迹数据稀疏性问题的潜质;不局限于固定点对历史数据进行计算,一定程度解决了计算复杂性问题;充分利用了轨迹的全部序列信息和关键上下文轨迹位置信息,获得了优异的异常轨迹分类准确率。
另外,根据本发明上述实施例的基于通用转换器的异常轨迹检测方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述采集包含轨迹点序列的原始数据集,包括:将GPS(GlobalPositioning System,全球定位系统)装置设置于多辆行驶车辆,并设定预设GPS采样频率,以采集所述原始数据集。
进一步地,在本发明的一个实施例中,所述对所述原始数据集进行预处理,包括:对二维地图划分100mX100m的网格,并将每个网格单独编号,并对每个坐落于所述网格内的所有GPS定位点赋予当前网格的编号,以对所述原始数据进行离散序列化,得到多个离散一维化的轨迹点;对所述多个离散一维化的轨迹点进行聚类形成轨迹簇;基于所述轨迹簇,获取所有轨迹中最长序列的长度,将所有的轨迹都填充到所述长度,同时对应于每个轨迹序列也生成对应的遮罩序列,其中,原始数据部分遮罩为真,填充的部分遮罩为假。
进一步地,在本发明的一个实施例中,所述将所述轨迹序列和所述遮罩序列输入通用转换器,以训练轨迹嵌入,包括:对于离散序列化轨迹通过当前位置预测上下文,以获取到关键位置点在轨迹上下文中的相关信息,得到指定嵌入维度的对于每个轨迹点的预嵌入;将填充后的离散序列化轨迹、所述遮罩序列、轨迹点预嵌入输入到通用转换器的编码器中,并使用时间自适应计算方法提升训练性能。
进一步地,在本发明的一个实施例中,在判定所述当前轨迹是否异常之前,还包括:使用sigmod激活函数以及BCE损失函数,并和所述通用转换器进行联合训练,得到最终通用转换器。
为达到上述目的,本发明第二方面实施例提供一种基于通用转换器的异常轨迹检测装置,包括:采集模块,用于采集包含轨迹点序列的原始数据集;预处理模块,用于对所述原始数据集进行预处理,得到轨迹序列和遮罩序列;轨迹嵌入训练模块,用于将所述轨迹序列和所述遮罩序列输入通用转换器,以训练轨迹嵌入;判定模块,用于通过所述通用转换器的两层的全连接神经网络分类轨迹判定当前轨迹是否异常。
根据本发明实施例的基于通用转换器的异常轨迹检测装置,极大提升模型的训练速度;具备在多个起始地-目的地点对数据间的泛化性和拓展性能力,具备解决轨迹数据稀疏性问题的潜质;不局限于固定点对历史数据进行计算,一定程度解决了计算复杂性问题;充分利用了轨迹的全部序列信息和关键上下文轨迹位置信息,获得了优异的异常轨迹分类准确率。
另外,根据本发明上述实施例的基于通用转换器的异常轨迹检测装置还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述采集模块进一步用于将GPS装置设置于多辆行驶车辆,并设定预设GPS采样频率,以采集所述原始数据集。
进一步地,在本发明的一个实施例中,所述预处理模块进一步用于对二维地图划分100mX100m的网格,并将每个网格单独编号,并对每个坐落于所述网格内的所有GPS定位点赋予当前网格的编号,以对所述原始数据进行离散序列化,得到多个离散一维化的轨迹点;对所述多个离散一维化的轨迹点进行聚类形成轨迹簇;基于所述轨迹簇,获取所有轨迹中最长序列的长度,将所有的轨迹都填充到所述长度,同时对应于每个轨迹序列也生成对应的遮罩序列,其中,原始数据部分遮罩为真,填充的部分遮罩为假。
进一步地,在本发明的一个实施例中,所述轨迹嵌入训练模块包括:轨迹嵌入预训练单元,用于对于离散序列化轨迹通过当前位置预测上下文,以获取到关键位置点在轨迹上下文中的相关信息,得到指定嵌入维度的对于每个轨迹点的预嵌入;轨迹嵌入训练单元,用于将填充后的离散序列化轨迹、所述遮罩序列、轨迹点预嵌入输入到通用转换器的编码器中,并使用时间自适应计算方法提升训练性能。
进一步地,在本发明的一个实施例中,还包括:转换器训练模块,用于在判定所述当前轨迹是否异常之前,使用sigmod激活函数以及BCE损失函数,并和所述通用转换器进行联合训练,得到最终通用转换器。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例提供的基于通用转换器的异常轨迹检测方法的流程示意图;
图2为根据本发明一个实施例提供的基于通用转换器的异常轨迹检测方法的流程示意图;
图3为根据本发明一个实施例提供的基于通用转换器的异常轨迹检测的系统框图;
图4为根据本发明实施例的基于通用转换器的异常轨迹检测装置的示例图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
随着智能终端的普及,使用GPS的成本越来越低,大量的轨迹数据出现,轨迹数据挖掘成为了重点研究内容,其中异常轨迹检测占有很重要的地位。异常轨迹检测可以在两类任务中起到重要作用:
(1)在出租车行为检测中,检测出租车行为,避免乘客因司机的绕道行为而多缴纳乘车费用;
(2)在运输任务安全检测中,检测运输车辆的轨迹是否异常,可作为运输物品安全评估的重要指标。
本发明通过使用通用转换器,有效的利用了完整的轨迹序列信息以及关键位置点在轨迹上下文中的作用,提升了异常轨迹检测模型的训练速度,并提升了其检测的效果,同时具备了解决数据稀疏性问题潜质。
下面参照附图描述根据本发明实施例提出的基于通用转换器的异常轨迹检测方法及装置,首先将参照附图描述根据本发明实施例提出的基于通用转换器的异常轨迹检测方法。
具体而言,图1为本发明实施例所提供的一种基于通用转换器的异常轨迹检测方法的流程示意图。
如图1所示,该基于通用转换器的异常轨迹检测方法包括以下步骤:
在步骤S101中,采集包含轨迹点序列的原始数据集。
可以理解的是,如图2和图3所示,首先进行数据采样,获取数据集。
在本发明的一个实施例中,采集包含轨迹点序列的原始数据集,包括:将GPS装置设置于多辆行驶车辆,并设定预设GPS采样频率,以采集原始数据集。
可以理解的是,通过对行驶车辆安装GPS装置,并设定GPS采样频率,可以获取到大量轨迹点序列的原始数据集。其中,GPS采样频率可以根据实际情况进行设置,在此不做具体限定。
在步骤S102中,对原始数据集进行预处理,得到轨迹序列和遮罩序列,并将轨迹序列和遮罩序列输入通用转换器,以训练轨迹嵌入。
在本发明的一个实施例中,对原始数据集进行预处理,包括:对二维地图划分100mX100m的网格,并将每个网格单独编号,并对每个坐落于网格内的所有GPS定位点赋予当前网格的编号,以对原始数据进行离散序列化,得到多个离散一维化的轨迹点;对多个离散一维化的轨迹点进行聚类形成轨迹簇;基于轨迹簇,获取所有轨迹中最长序列的长度,将所有的轨迹都填充到长度,同时对应于每个轨迹序列也生成对应的遮罩序列,其中,原始数据部分遮罩为真,填充的部分遮罩为假。
具体而言,如图2和图3所示,数据预处理包括:
(1)轨迹离散序列化:通过对二维地图划分100mX100m的网格,并将每个网格单独编号。对每个坐落于网格内的所有GPS定位点赋予当前网格的编号。对所有轨迹数据应用此方法进行离散序列化,可以得到保留了轨迹点时序信息的一维轨迹序列。离散一维化的轨迹点更容易被预嵌入进行训练,而且相比数量众多的二维数据可以降低嵌入计算时间和空间复杂度。
(2)寻找轨迹簇:对于所有具备相同的起始地-目的地网格编号的轨迹进行聚类形成轨迹簇。并对每个轨迹簇运行分层聚类方法,辅佐手工标注可以得到用于训练模型的原始数据集。
(3)轨迹填充和遮罩:对于训练数据集的所有已经离散序列化的轨迹,首先获取到所有轨迹中最长序列的长度,之后将所有的轨迹都填充到这个长度。同时对应于每个轨迹序列也生成对应的遮罩序列,其中原始数据部分遮罩为真,填充的部分遮罩为假。填充后的轨迹序列和遮罩序列主要作为通用转换器的输入来训练轨迹嵌入。
进一步地,在本发明的一个实施例中,将轨迹序列和遮罩序列输入通用转换器,以训练轨迹嵌入,包括:对于离散序列化轨迹通过当前位置预测上下文,以获取到关键位置点在轨迹上下文中的相关信息,得到指定嵌入维度的对于每个轨迹点的预嵌入;将填充后的离散序列化轨迹、遮罩序列、轨迹点预嵌入输入到通用转换器的编码器中,并使用时间自适应计算方法提升训练性能。
具体而言,如图2和图3所示,训练轨迹嵌入包括轨迹点嵌入预训练和使用通用转换器训练轨迹嵌入,其中,
1、轨迹点嵌入预训练
对于得到的离散序列化轨迹,运行word2vec的skip-gram方法(可以通过当前位置预测上下文),以此初步获取到关键位置点在轨迹上下文中的重要信息,得到指定嵌入维度的对于每个轨迹点的预嵌入。预嵌入主要用于提升通用转换器的训练效率。
2、使用通用转换器训练轨迹嵌入
将填充后的离散序列化轨迹、遮罩序列、轨迹点预嵌入输入到通用转换器的编码器中,同时使用时间自适应计算技术提升训练性能。通用转换器的并行化机制可以在快速运算的同时完整利用到整个轨迹的全部信息,其中使用的多头自注意力机制可以更好考量到关键位置点在轨迹上下文中的信息。经过训练后(通用转换器将与后续的多层感知机进行联合训练),通用转换器的编码器将会输出对于轨迹的指定维度的嵌入。通过训练轨迹的嵌入,能够非常有效的表达各个轨迹的信息,同时具备了解决轨迹数据稀疏性问题和计算复杂度问题的能力。
需要说明的是,通用转换器是转换器的升级版本,具有图灵完备性,可以使用于多种任务中。通用转换器由可以循环指定步数的转换器模块构成,其中转换器模块将轨迹序列经嵌入层嵌入后的向量和位置编码(由轨迹序列经三角函数计算得出)作为输入,经过多头自注意力机制的计算后,提供给具备ReLU激活函数的前向反馈神经网络计算得出结果。
在步骤S103中,通过通用转换器的两层的全连接神经网络分类轨迹判定当前轨迹是否异常。
可以理解的是,如图2和图3所示,本发明实施例将一个两层的全连接神经网络用于分类轨迹是否异常,以实现轨迹分类。
在本发明的一个实施例中,在判定当前轨迹是否异常之前,还包括:使用sigmod激活函数以及BCE损失函数,并和通用转换器进行联合训练,得到最终通用转换器。
可以理解的是,本发明实施例使用了sigmod激活函数以及BCE损失函数并和上述的通用转换器进行联合训练,最终可以输出轨迹是否异常。
根据本发明实施例提出的基于通用转换器的异常轨迹检测方法,极大提升模型的训练速度;具备在多个起始地-目的地点对数据间的泛化性和拓展性能力,具备解决轨迹数据稀疏性问题的潜质;不局限于固定点对历史数据进行计算,一定程度解决了计算复杂性问题;充分利用了轨迹的全部序列信息和关键上下文轨迹位置信息,获得了优异的异常轨迹分类准确率。
其次参照附图描述根据本发明实施例提出的基于通用转换器的异常轨迹检测装置。
图4是本发明实施例的基于通用转换器的异常轨迹检测装置的方框示意图。
如图4所示,该基于通用转换器的异常轨迹检测装置10包括:采集模块100、预处理模块200、轨迹嵌入训练模块300和判定模块400。
其中,采集模块100用于采集包含轨迹点序列的原始数据集;预处理模块200用于对原始数据集进行预处理,得到轨迹序列和遮罩序列;轨迹嵌入训练模块300用于将轨迹序列和遮罩序列输入通用转换器,以训练轨迹嵌入;判定模块400用于通过通用转换器的两层的全连接神经网络分类轨迹判定当前轨迹是否异常。本发明实施例的装置10通过使用通用转换器,有效的利用了完整的轨迹序列信息以及关键位置点在轨迹上下文中的作用,提升了异常轨迹检测模型的训练速度,并提升了其检测的效果,同时具备了解决数据稀疏性问题潜质。
进一步地,在本发明的一个实施例中,采集模块100进一步用于将GPS装置设置于多辆行驶车辆,并设定预设GPS采样频率,以采集原始数据集。
进一步地,在本发明的一个实施例中,预处理模块200进一步用于对二维地图划分100mX100m的网格,并将每个网格单独编号,并对每个坐落于网格内的所有GPS定位点赋予当前网格的编号,以对原始数据进行离散序列化,得到多个离散一维化的轨迹点;对多个离散一维化的轨迹点进行聚类形成轨迹簇;基于轨迹簇,获取所有轨迹中最长序列的长度,将所有的轨迹都填充到长度,同时对应于每个轨迹序列也生成对应的遮罩序列,其中,原始数据部分遮罩为真,填充的部分遮罩为假。
进一步地,在本发明的一个实施例中,轨迹嵌入训练模块300包括:轨迹嵌入预训练单元和轨迹嵌入训练单元。
其中,轨迹嵌入预训练单元用于对于离散序列化轨迹通过当前位置预测上下文,以获取到关键位置点在轨迹上下文中的相关信息,得到指定嵌入维度的对于每个轨迹点的预嵌入;轨迹嵌入训练单元用于将填充后的离散序列化轨迹、遮罩序列、轨迹点预嵌入输入到通用转换器的编码器中,并使用时间自适应计算方法提升训练性能。
进一步地,在本发明的一个实施例中,本发明实施例的装置10还包括:转换器训练模块。其中,转换器训练模块用于在判定当前轨迹是否异常之前,使用sigmod激活函数以及BCE损失函数,并和通用转换器进行联合训练,得到最终通用转换器。
需要说明的是,前述对基于通用转换器的异常轨迹检测方法实施例的解释说明也适用于该实施例的基于通用转换器的异常轨迹检测装置,此处不再赘述。
根据本发明实施例提出的基于通用转换器的异常轨迹检测装置,极大提升模型的训练速度;具备在多个起始地-目的地点对数据间的泛化性和拓展性能力,具备解决轨迹数据稀疏性问题的潜质;不局限于固定点对历史数据进行计算,一定程度解决了计算复杂性问题;充分利用了轨迹的全部序列信息和关键上下文轨迹位置信息,获得了优异的异常轨迹分类准确率。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
Claims (4)
1.一种基于通用转换器的异常轨迹检测方法,其特征在于,包括以下步骤:
采集包含轨迹点序列的原始数据集;
对所述原始数据集进行预处理,得到轨迹序列和遮罩序列,并将所述轨迹序列和所述遮罩序列输入通用转换器,以训练轨迹嵌入;以及
通过所述通用转换器的两层的全连接神经网络分类轨迹判定当前轨迹是否异常;
所述对所述原始数据集进行预处理,包括:
对二维地图划分100mX100m的网格,并将每个网格单独编号,并对每个坐落于所述网格内的所有GPS定位点赋予当前网格的编号,以对所述原始数据进行离散序列化,得到多个离散一维化的轨迹点;
对所述多个离散一维化的轨迹点进行聚类形成轨迹簇;
基于所述轨迹簇,获取所有轨迹中最长序列的长度,将所有的轨迹都填充到所述长度,同时对应于每个轨迹序列也生成对应的遮罩序列,其中,原始数据部分遮罩为真,填充的部分遮罩为假;
所述将所述轨迹序列和所述遮罩序列输入通用转换器,以训练轨迹嵌入,包括:
对于离散序列化轨迹通过当前位置预测上下文,以获取到关键位置点在轨迹上下文中的相关信息,得到指定嵌入维度的对于每个轨迹点的预嵌入;
将填充后的离散序列化轨迹、所述遮罩序列、轨迹点预嵌入输入到通用转换器的编码器中,并使用时间自适应计算方法提升训练性能;
在判定所述当前轨迹是否异常之前,还包括:
使用sigmod激活函数以及BCE损失函数,并和所述通用转换器进行联合训练,得到最终通用转换器。
2.根据权利要求1所述的方法,其特征在于,所述采集包含轨迹点序列的原始数据集,包括:
将GPS装置设置于多辆行驶车辆,并设定预设GPS采样频率,以采集所述原始数据集。
3.一种基于通用转换器的异常轨迹检测装置,其特征在于,包括:
采集模块,用于采集包含轨迹点序列的原始数据集;
预处理模块,用于对所述原始数据集进行预处理,得到轨迹序列和遮罩序列;
轨迹嵌入训练模块,用于将所述轨迹序列和所述遮罩序列输入通用转换器,以训练轨迹嵌入;以及
判定模块,用于通过所述通用转换器的两层的全连接神经网络分类轨迹判定当前轨迹是否异常;
所述预处理模块用于对二维地图划分100mX100m的网格,并将每个网格单独编号,并对每个坐落于所述网格内的所有GPS定位点赋予当前网格的编号,以对所述原始数据进行离散序列化,得到多个离散一维化的轨迹点;对所述多个离散一维化的轨迹点进行聚类形成轨迹簇;基于所述轨迹簇,获取所有轨迹中最长序列的长度,将所有的轨迹都填充到所述长度,同时对应于每个轨迹序列也生成对应的遮罩序列,其中,原始数据部分遮罩为真,填充的部分遮罩为假;
所述轨迹嵌入训练模块包括:
轨迹嵌入预训练单元,用于对于离散序列化轨迹通过当前位置预测上下文,以获取到关键位置点在轨迹上下文中的相关信息,得到指定嵌入维度的对于每个轨迹点的预嵌入;
轨迹嵌入训练单元,用于将填充后的离散序列化轨迹、所述遮罩序列、轨迹点预嵌入输入到通用转换器的编码器中,并使用时间自适应计算方法提升训练性能;
还包括:
转换器训练模块,用于在判定所述当前轨迹是否异常之前,使用sigmod激活函数以及BCE损失函数,并和所述通用转换器进行联合训练,得到最终通用转换器。
4.根据权利要求3所述的装置,其特征在于,所述采集模块用于将GPS装置设置于多辆行驶车辆,并设定预设GPS采样频率,以采集所述原始数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010752616.XA CN112052873B (zh) | 2020-07-30 | 2020-07-30 | 基于通用转换器的异常轨迹检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010752616.XA CN112052873B (zh) | 2020-07-30 | 2020-07-30 | 基于通用转换器的异常轨迹检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112052873A CN112052873A (zh) | 2020-12-08 |
CN112052873B true CN112052873B (zh) | 2022-10-21 |
Family
ID=73601140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010752616.XA Expired - Fee Related CN112052873B (zh) | 2020-07-30 | 2020-07-30 | 基于通用转换器的异常轨迹检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112052873B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114841316A (zh) * | 2022-04-25 | 2022-08-02 | 西安交通大学 | 基于循环神经网络和差分自编码器的异常轨迹检测方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105955290B (zh) * | 2016-04-27 | 2019-05-24 | 腾讯科技(深圳)有限公司 | 无人飞行器控制方法及装置 |
CN108133611A (zh) * | 2016-12-01 | 2018-06-08 | 中兴通讯股份有限公司 | 车辆行驶轨迹监测方法及系统 |
CN108345666B (zh) * | 2018-02-06 | 2020-06-19 | 南京航空航天大学 | 一种基于时间-空间孤立点的车辆异常轨迹检测方法 |
CN110276409A (zh) * | 2019-06-27 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 一种时间序列异常检测方法、装置、服务器和存储介质 |
CN111461426A (zh) * | 2020-03-30 | 2020-07-28 | 南京邮电大学 | 一种基于深度学习的高精度行程时长预测方法 |
-
2020
- 2020-07-30 CN CN202010752616.XA patent/CN112052873B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN112052873A (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Real-time crash risk prediction on arterials based on LSTM-CNN | |
Simoncini et al. | Vehicle classification from low-frequency GPS data with recurrent neural networks | |
CN103839409B (zh) | 基于多断面视觉传感聚类分析的交通流状态判别方法 | |
EP2255347B1 (en) | Travel pattern information obtaining device, travel pattern information obtaining method, travel pattern information obtaining program and computer readable medium | |
Morris et al. | Real-time video-based traffic measurement and visualization system for energy/emissions | |
CN110363984A (zh) | 交通流量预测方法和设备 | |
Xu et al. | A study of vehicle driving condition recognition using supervised learning methods | |
Aqib et al. | A deep learning model to predict vehicles occupancy on freeways for traffic management | |
Xue et al. | A context-aware framework for risky driving behavior evaluation based on trajectory data | |
CN112052873B (zh) | 基于通用转换器的异常轨迹检测方法及装置 | |
Sadeghian et al. | A stepwise methodology for transport mode detection in GPS tracking data | |
Sathruhan et al. | Emergency vehicle detection using vehicle sound classification: A deep learning approach | |
Hashemi et al. | A new comparison framework to survey neural networks‐based vehicle detection and classification approaches | |
Li et al. | A novel one-stage approach for pointwise transportation mode identification inspired by point cloud processing | |
CN112435466B (zh) | 混合交通流环境下cacc车辆退变为传统车的接管时间预测方法及系统 | |
US20210174664A1 (en) | System and method for detecting risk using pattern analysis of layered tags in user log data | |
Joseph et al. | Investigation of deep learning methodologies in intelligent green transportation system | |
CN110555425A (zh) | 一种视频流实时行人检测方法 | |
KR102296025B1 (ko) | 거리 레이저 파형 및 차량번호인식 결과를 이용한 교통정보 수집장치 | |
Grigoropoulos et al. | Detection and classification of bicyclist group behavior for automated vehicle applications | |
Li | A deep learning approach for real-time crash risk prediction at urban arterials | |
Karnati et al. | Machine Learning Algorithms for Traffic Interruption Detection | |
Sharmila et al. | Mode-Wise Corridor Level Travel-Time Estimation Using Machine Learning Models | |
Abdelhalim et al. | Computer vision for transit travel time prediction: an end-to-end framework using roadside urban imagery | |
Wang | Knowledge discovery and data mining for shared mobility and connected and automated vehicle applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20221021 |