CN104778355B - 基于广域分布交通系统的异常轨迹检测方法 - Google Patents

基于广域分布交通系统的异常轨迹检测方法 Download PDF

Info

Publication number
CN104778355B
CN104778355B CN201510159009.1A CN201510159009A CN104778355B CN 104778355 B CN104778355 B CN 104778355B CN 201510159009 A CN201510159009 A CN 201510159009A CN 104778355 B CN104778355 B CN 104778355B
Authority
CN
China
Prior art keywords
data
traffic
point data
track
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510159009.1A
Other languages
English (en)
Other versions
CN104778355A (zh
Inventor
李小平
陈湉
朱夏
陈龙
胡苇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201510159009.1A priority Critical patent/CN104778355B/zh
Publication of CN104778355A publication Critical patent/CN104778355A/zh
Application granted granted Critical
Publication of CN104778355B publication Critical patent/CN104778355B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于广域分布交通系统的异常轨迹检测方法。本发明考虑到广域分布交通系统的实际情况,将异常轨迹检测分为两部分:数据源节点分别对所采集到的交通轨迹点数据进行无监督聚类,并将聚类完成后无法归入任何簇集的交通轨迹点数据作为候选异常交通轨迹点数据;各数据源节点将各自的无监督聚类中心以及候选异常交通轨迹点数据发送至中心节点;以接收到的所有无监督聚类中心作为初始聚类中心,中心节点对接收到的所有候选异常交通轨迹点数据进行聚类,在聚类完成后将无法归入任何簇集的候选异常交通轨迹点数据作为最终的全局异常交通轨迹点数据输出。本发明还公开了一种广域分布交通系统。本发明可有效降低计算、存储及通信的开销。

Description

基于广域分布交通系统的异常轨迹检测方法
技术领域
本发明涉及一种异常轨迹检测方法,尤其涉及一种基于广域分布交通系统的异常轨迹检测方法。
背景技术
随着现代社会生活节奏的加快和人们生活水平的提高,汽车逐渐成为人们出行的代步工具。汽车在道路上行驶产生了交通数据,其中最典型的就是道路上摄像头抓拍处理后产生的车辆轨迹数据。这些数据经过图像处理、图像识别等技术后,转化成为具有固定格式的时空轨迹数据。分布在城市各处的摄像头不间断的对道路上所有经过的车辆进行数据采集,数据量十分庞大。时空轨迹数据不仅总量巨大,同时分布式存储在个数据源端处,因此对数据的分析和挖掘提出了新的挑战。
交通轨迹数据能够反映人们行为特征[潘纲,李石坚,齐观德,等.移动轨迹数据分析与智慧城市[J].2012],对于车辆时空轨迹大数据的挖掘和分析具有重要意义。在车辆时空轨迹大数据的问题中,车辆轨迹的异常检测问题与实际应用息息相关。
异常检测通常指从给定数据集中找出不符合正常行为模式定义的特定模式的问题[Chandola V,Banerjee A,Kumar V.Anomaly detection:A survey[J].ACM ComputingSurveys(CSUR),2009,41(3):15]。在车辆轨迹大数据中,异常轨迹的出现通常意味着车辆所对应的行为人的行为与正常行为或我们所预期的行为不符,在实际的社会治安和监管中,尤其应当引起人们的重视和关注。
由于关于车辆轨迹数据的异常检测问题的重要性和挑战性,许多研究者都提出过关于车辆轨迹的异常检测方法[Lee J G,Han J,Li X.Trajectory outlier detection:Apartition-and-detect framework[C]//Data Engineering,2008.ICDE 2008.IEEE 24thInternational Conference on.IEEE,2008:140-149]、[Bu Y,Chen L,Fu A W C,etal.Efficient anomaly monitoring over moving object trajectory streams[C]//Proceedings of the 15th ACM SIGKDD international conference on Knowledgediscovery and data mining.ACM,2009:159-168]。
在这些已有的异常检测方法中,所针对的通常是假定数据集中存储在某一数据中心,并且所包含的数据都是表示车辆完整行驶路径的轨迹向量。然而,实际应用中的所采集的数据结构和数据的存储环境常常并非如此。由于城市道路交通监控系统本身就呈现分布在城市各处道路的特点,且数据的汇总通常也以某一地区为单位(如以城市为单位),因此当出现针对更大地区(如针对全省)的异常轨迹检测需求时,现有异常检测方法不得不首先将分散在各数据源节点的原始数据汇总至中心数据节点,然后在全量原始数据上开展数据的分析。这样的操作不仅会产生巨大的通信开销,而且十分耗时,并且也对中心数据节点的数据存储和实时处理能力提出了近乎苛刻的要求。与此同时,在实际城市道路交通监控系统中,采集的数据通常以车辆在某时刻通过某处的形式出现,从中抽象出的数据是反映车辆在道路某点状态的点数据向量,而并非现有异常轨迹检测方法所考虑的车辆完整行驶路径的轨迹向量。因此,现有异常轨迹检测方法实际不能很好适应广域分布的车辆轨迹大数据的异常检测问题。
发明内容
本发明所要解决的技术问题在于克服现有技术的不足,考虑到车辆时空轨迹数据的大规模、分布式存储在数据源端、传输数据的通信开销制约和实际采集数据的格式,提出一种基于广域分布交通系统的异常轨迹检测方法,更符合交通系统的实际情况,并可大幅减少数据源节点至中心节点的数据传输量,在保证算法效果的前提下提高算法的效率。
本发明具体采用以下技术方案解决上述技术问题:
基于广域分布交通系统的异常轨迹检测方法,所述广域分布交通系统包括中心节点以及一系列空间分散分布的数据源节点,所述数据源节点可对所在区域的交通轨迹点数据进行采集,并可与中心节点进行数据交互;所述异常轨迹检测方法包括以下步骤:
步骤A、各数据源节点分别对所采集到的交通轨迹点数据进行无监督聚类,并将聚类完成后无法归入任何簇集的交通轨迹点数据作为候选异常交通轨迹点数据;各数据源节点将各自的无监督聚类中心以及候选异常交通轨迹点数据发送至中心节点;
步骤B、以接收到的所有无监督聚类中心作为初始聚类中心,中心节点对接收到的所有候选异常交通轨迹点数据进行聚类,在聚类完成后将无法归入任何簇集的候选异常交通轨迹点数据作为最终的全局异常交通轨迹点数据输出。
为了进一步降低数据处理及传输所需资源,各数据源节点在对所采集到的交通轨迹点数据进行无监督聚类之前,首先对其进行以下预处理:将同一个对象的交通轨迹点数据按照时间先后排列为时间序列,并判断该时间序列中是否存在多个连续数据在实际地理位置上构成直线段,如存在,则将所述多个连续数据中间部分的数据删除,仅保留两端的两个数据。
根据相同的发明思路还可得到一种广域分布交通系统,具体如下:
一种广域分布交通系统,包括中心节点以及一系列空间分散分布的数据源节点,所述数据源节点可对所在区域的交通轨迹点数据进行采集,并可与中心节点进行数据交互;每个数据源节点均包括一候选异常轨迹选择单元,用于对所采集到的交通轨迹点数据进行无监督聚类,并将聚类完成后无法归入任何簇集的交通轨迹点数据作为候选异常交通轨迹点数据与所得到的无监督聚类中心一起发送至中心节点;中心节点包括全局异常轨迹检测单元,用于以接收到的所有无监督聚类中心作为初始聚类中心,对接收到的所有候选异常交通轨迹点数据进行进一步聚类,在聚类完成后将无法归入任何簇集的候选异常交通轨迹点数据作为最终的全局异常交通轨迹点数据输出。
进一步地,每个数据源节点还包括一数据预处理单元,用于对所采集到的交通轨迹点数据进行预处理并将预处理后的数据发送至候选异常轨迹选择单元,预处理方法具体如下:将同一个对象的交通轨迹点数据按照时间先后排列为时间序列,并判断该时间序列中是否存在多个连续数据在实际地理位置上构成直线段,如存在,则将所述多个连续数据中间部分的数据删除,仅保留两端的两个数据。
相比现有技术,本发明具有以下有益效果:
本发明的异常轨迹检测方法所针对的处理对象是原始的轨迹点数据,而非复杂的车辆的行驶路径轨迹向量数据,并通过简单的聚类方式进行数据处理,算法更简单,所需的计算及数据传输资源更少,实时性更好;
本发明针对广域分布交通系统的实际情况,通过在数据源节点对数据聚类和在中心节点对聚类结果汇总,考虑了大量轨迹数据分布式存储、数据传输通信开销大的实际问题,能够更好适应分布式大数据环境,具有更好的实用性。
附图说明
图1为本发明广域分布交通系统的一个优选实施例的基本架构示意图,其中11为中心节点,12为数据源节点;
图2为优选实施例中数据源节点对交通轨迹点数据进行处理的流程示意图;
图3为优选实施例中中心节点对接收到的数据行处理的流程示意图。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明:
图1显示了本发明广域分布交通系统一个优选实施例的基本架构。如图1所示,整个系统包括中心节点11和以数据源节点12为代表的z个数据源节点,图中由数据源节点12指向中心节点11的虚线箭头表示广域网中的数据传输。数据源节点12可对所在区域的交通轨迹点数据进行采集,并可通过广域网与中心节点11实现信息交互。数据源节点12包括数据预处理单元和候选异常轨迹选择单元,数据预处理单元可根据车辆的轨迹的几何特征,删除车辆轨迹点集合中对车辆行驶轨迹特征的表现作用较小的车辆轨迹点,组成新的有待分析挖掘的数据集,减小原有车辆轨迹点集合的规模;候选异常轨迹选择单元可通过聚类的方法对预处理后的车辆轨迹点集合进行分析处理,将聚类完成后无法归入任何簇集的交通轨迹点数据作为候选异常交通轨迹点数据与所得到的聚类中心一起发送至中心节点11。中心节点11包括全局异常轨迹检测单元,用于以各数据源节点12所得到的所有聚类中心作为初始聚类中心,对各数据源节点12所筛选出的所有候选异常交通轨迹点数据进行聚类,在聚类完成后将无法归入任何簇集的候选异常交通轨迹点数据作为最终的全局异常交通轨迹点数据输出。
为了便于公众理解本发明异常轨迹检测方法的技术方案,以某省道路交通监控系统采集的车辆轨迹数据为例,数据源节点即各城市道路交通监控系统。各城市道路交通监控系统获取并存储实际应用环境中的轨迹数据后,在本地即可展开对轨迹数据的挖掘和分析,得到本地数据处理的中间结果。所有的数据源节点对本地数据处理的中间结果将汇总到省道路交通数据系统,在全部初步聚类结果的基础上,对数据展开进一步全局的挖掘和分析,最终得出全局的异常轨迹集合。由此,对于轨迹数据的处理分为数据源节点对轨迹数据进行聚类过程以及中心节点对聚类结果进一步合并以及判断异常轨迹过程两部分。
整个系统中包含z个分布存储的数据源节点{S1,S2,…,Sz}和一个中心节点S;在每个数据源节点Si中(i=1,2,…,z),存储有采集到的车辆轨迹点数据集Ti={T1,T2,…,Tn},本实施例中用四元组Tj=(lj,tj,pj,dj)表示一个车辆轨迹点数据,(j=1,2,…,n),其中lj表示车牌号,tj、pj和dj分别表示车辆通过的时间、地点和方向。
图2是本发明实施例中数据源节点对轨迹点数据进行处理的流程图。如图2所示,数据源节点对轨迹点数据进行处理的具体步骤如下:
步骤s201,将轨迹点数据依据车牌号分成m组,每组内的数据记录均具有相同的车牌号;第i组记为Γ[i]
步骤s202,初始化组号计数器i=1;
步骤s203,将Γ[i]内的数据记录根据属性车辆通过的时间t进行升序排序得到时间序列πj=(π[1][2],…,π[k]);
步骤s204,判断πi内是否有连续轨迹记录构成直线段,即是否有多个连续轨迹记录(π[i][i+1],…,π[i+r])在实际地理位置上构成直线段(1≤i<i+r≤k);若是,则转步骤s205,否则转步骤s206;
步骤s205,自Γ[i]内删除该直线段内除起始和结束轨迹外的其他轨迹,即从Γi[j]中删去中间轨迹记录集{π[i+1][i+2],…,π[i+r-1]},仅保留线段所对应的起始轨迹记录π[i]和结束轨迹记录π[i+r]
步骤s206,i=i+1;
步骤s207,判断组号计数器i是否大于组数m;若是,则转步骤s208,否则转步骤s203;
步骤s208,合并各轨迹记录组,得到有待分析的车辆轨迹数据集Γ′;
步骤s209,定义任意两个待聚类数据记录的距离函数为d(Ti,Tj);
步骤s210,对有待分析的车辆轨迹数据集Γ′进行随机抽样;
步骤s211,初始化样本中的每个轨迹记录为一个簇集;
步骤s212,计算各簇集半径为D的邻域所包含的轨迹记录;
步骤s213,合并邻域中轨迹记录重合度最高的簇集;
步骤s214,判断是否满足停止条件;若是,则转步骤s215,否则,转步骤s212;
步骤s215,选中Γ′未被抽样或未被选中的一条轨迹记录;
步骤s216,计算该轨迹记录距离其最近聚类中心的距离d;
步骤s217,判断是否距离d小于给定的阈值δ;若是,则转步骤s218,否则转步骤s220;
步骤s218,将该轨迹记录归并入距离其最近的簇集中;
步骤s219,更新被归并的簇集的聚类中心,转步骤s222;
步骤s220,将该轨迹记录标记为候选异常轨迹;
步骤s221,将该轨迹加入候选异常轨迹记录集合P;
步骤s222,判断轨迹是否已全部选取过;若是,转步骤s223,否则转步骤s215;
步骤s223,将聚类结果(聚类中心集合)R和候选异常轨迹集合P传送至中心节点;结束。
图3是本发明实施例中心节点对聚类结果进一步合并以及判断异常轨迹过程的流程图。如图3所示,中心节点对聚类结果进一步合并以及判断异常轨迹过程的具体步骤如下:
步骤s301,合并各数据源节点的聚类结果为初步全局聚类结果集合R;
步骤s302,合并候选异常轨迹记录集合为全局候选异常轨迹记录集合P;
步骤s303,初始化全局异常轨迹集合
步骤s304,对R中的各簇集,根据聚类数据记录的距离函数,计算两两簇集聚类中心之间的距离d(Ci,Cj);
步骤s305,判断是否d(Ci,Cj)小于给定的阈值δ;若是,转步骤s306,否则转步骤s307;
步骤s306,合并Ci和Cj为新的簇集,更新簇集的聚类中心;
步骤s307,判断是否R中全部聚类中心距离均大于阈值δ;若是,转步骤s308,否则转步骤s304;
步骤s308,选取P中尚未选的一个候选异常轨迹记录;
步骤s309,计算该轨迹距离其最近聚类中心的距离d;
步骤s310,判断是否距离d小于给定的阈值δ;若是,转步骤s311,否则转步骤s313;
步骤s311,将该轨迹记录归并入距离其最近的簇集中;
步骤s312,更新簇集的聚类中心;转步骤s315;
步骤s313,认定该轨迹记录为异常轨迹;
步骤s314,将该轨迹加入全局异常轨迹集合Ω;
步骤s315,判断P中是否还有没被选取的异常轨迹记录;若是,转步骤s308,否则转步骤s316;
步骤s316,输出全局异常轨迹集合Ω,结束。

Claims (2)

1.基于广域分布交通系统的异常轨迹检测方法,所述广域分布交通系统包括中心节点以及一系列空间分散分布的数据源节点,所述数据源节点可对所在区域的交通轨迹点数据进行采集,并可与中心节点进行数据交互;其特征在于,所述异常轨迹检测方法包括以下步骤:
步骤A、各数据源节点分别对所采集到的交通轨迹点数据进行无监督聚类,并将聚类完成后无法归入任何簇集的交通轨迹点数据作为候选异常交通轨迹点数据;各数据源节点将各自的无监督聚类中心以及候选异常交通轨迹点数据发送至中心节点;
步骤B、以接收到的所有无监督聚类中心作为初始聚类中心,中心节点对接收到的所有候选异常交通轨迹点数据进行聚类,在聚类完成后将无法归入任何簇集的候选异常交通轨迹点数据作为最终的全局异常交通轨迹点数据输出;
各数据源节点在对所采集到的交通轨迹点数据进行无监督聚类之前,首先对其进行以下预处理:将同一个对象的交通轨迹点数据按照时间先后排列为时间序列,并判断该时间序列中是否存在多个连续数据在实际地理位置上构成直线段,如存在,则将所述多个连续数据中间部分的数据删除,仅保留两端的两个数据。
2.一种广域分布交通系统,包括中心节点以及一系列空间分散分布的数据源节点,所述数据源节点可对所在区域的交通轨迹点数据进行采集,并可与中心节点进行数据交互;其特征在于,每个数据源节点均包括一候选异常轨迹选择单元,用于对所采集到的交通轨迹点数据进行无监督聚类,并将聚类完成后无法归入任何簇集的交通轨迹点数据作为候选异常交通轨迹点数据与所得到的无监督聚类中心一起发送至中心节点;中心节点包括全局异常轨迹检测单元,用于以接收到的所有无监督聚类中心作为初始聚类中心,对接收到的所有候选异常交通轨迹点数据进行进一步聚类,在聚类完成后将无法归入任何簇集的候选异常交通轨迹点数据作为最终的全局异常交通轨迹点数据输出;每个数据源节点还包括一数据预处理单元,用于对所采集到的交通轨迹点数据进行预处理并将预处理后的数据发送至候选异常轨迹选择单元,预处理方法具体如下:将同一个对象的交通轨迹点数据按照时间先后排列为时间序列,并判断该时间序列中是否存在多个连续数据在实际地理位置上构成直线段,如存在,则将所述多个连续数据中间部分的数据删除,仅保留两端的两个数据。
CN201510159009.1A 2015-04-03 2015-04-03 基于广域分布交通系统的异常轨迹检测方法 Expired - Fee Related CN104778355B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510159009.1A CN104778355B (zh) 2015-04-03 2015-04-03 基于广域分布交通系统的异常轨迹检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510159009.1A CN104778355B (zh) 2015-04-03 2015-04-03 基于广域分布交通系统的异常轨迹检测方法

Publications (2)

Publication Number Publication Date
CN104778355A CN104778355A (zh) 2015-07-15
CN104778355B true CN104778355B (zh) 2017-06-13

Family

ID=53619815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510159009.1A Expired - Fee Related CN104778355B (zh) 2015-04-03 2015-04-03 基于广域分布交通系统的异常轨迹检测方法

Country Status (1)

Country Link
CN (1) CN104778355B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049286A (zh) * 2015-07-21 2015-11-11 国家计算机网络与信息安全管理中心 基于层次聚类的云平台测速数据判定方法
CN107944475B (zh) * 2017-11-09 2021-05-14 安徽师范大学 基于公共分片子序列的轨迹离群点检测方法
CN111079776A (zh) * 2018-10-22 2020-04-28 百度在线网络技术(北京)有限公司 障碍车轨迹异常的判别方法和装置
CN114822040B (zh) * 2022-06-23 2022-11-11 南京城建隧桥智慧管理有限公司 一种辅助移动节点位置异常检测的良邻居集构造方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855638A (zh) * 2012-08-13 2013-01-02 苏州大学 基于谱聚类的车辆异常行为检测方法
CN103605362A (zh) * 2013-09-11 2014-02-26 天津工业大学 基于车辆轨迹多特征的运动模式学习及异常检测方法
CN103853900A (zh) * 2012-11-29 2014-06-11 深圳先进技术研究院 一种异常轨迹数据的修正方法、装置及交通管理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855638A (zh) * 2012-08-13 2013-01-02 苏州大学 基于谱聚类的车辆异常行为检测方法
CN103853900A (zh) * 2012-11-29 2014-06-11 深圳先进技术研究院 一种异常轨迹数据的修正方法、装置及交通管理系统
CN103605362A (zh) * 2013-09-11 2014-02-26 天津工业大学 基于车辆轨迹多特征的运动模式学习及异常检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于归一化编辑距离和谱聚类的轨迹模式学习方法;袁和金,等.;《计算机辅助设计与图形学学报》;20080630;第20卷(第6期);第753-758页 *
基于轨迹分析的交通目标异常行为识别;李明之,等.;《视频应用与工程》;20121231;第36卷(第1期);第106-112页 *
面向道路交通监控网的异构大数据语义融合方法;杨杰,等.;《东南大学学报(自然科学版)》;20140930;第44卷(第5期);第907-911页 *

Also Published As

Publication number Publication date
CN104778355A (zh) 2015-07-15

Similar Documents

Publication Publication Date Title
Kang et al. Understanding operation behaviors of taxicabs in cities by matrix factorization
Fan et al. Citymomentum: an online approach for crowd behavior prediction at a citywide level
AU2020101023A4 (en) A Novel Deep Learning Approach for Distributed Traffic Flow Forecasting
Deng et al. Graph convolutional adversarial networks for spatiotemporal anomaly detection
Zheng et al. Online discovery of gathering patterns over trajectories
Zhu et al. The impact of urban characteristics and residents’ income on commuting in China
CN105206048A (zh) 一种基于交通od数据的城市居民群体换乘模式发现系统及方法
CN104778355B (zh) 基于广域分布交通系统的异常轨迹检测方法
CN104462190A (zh) 一种基于海量空间轨迹挖掘的在线的位置预测方法
CN113326974B (zh) 一种基于多任务超图卷积网络的多源交通流预测方法
CN105913668A (zh) 一种基于海量交通数据统计的定向套牌车检测方法
Dai et al. Spatio-temporal deep learning framework for traffic speed forecasting in IoT
Peixoto et al. FogJam: a fog service for detecting traffic congestion in a continuous data stream VANET
CN110837973A (zh) 一种基于交通出行数据的人类出行选择信息挖掘方法
Kong et al. The method and application of big data mining for mobile trajectory of taxi based on MapReduce
Niu et al. On a clustering-based mining approach for spatially and temporally integrated traffic sub-area division
Hassan et al. Intelligent transportation systems in smart city: a systematic survey
CN112052405B (zh) 一种基于司机经验的寻客区域推荐方法
He et al. Crowd-sensing enhanced parking patrol using sharing bikes’ trajectories
CN116665448A (zh) 一种基于图卷积网络的交通速度实时预测方法及系统
Liu et al. Co-prediction of multimodal transportation demands with self-learned spatial dependence
Li et al. Graph neural networks in urban intelligence
Chen et al. Online discovery of congregate groups on sparse spatio-temporal data
Li et al. MGC-GAN: Multi-graph convolutional generative adversarial networks for accurate citywide traffic flow prediction
Zhou et al. Discovery of stay area in indoor trajectories of moving objects

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170613

Termination date: 20210403