CN107944628A - 一种路网环境下的聚集模式发现方法及系统 - Google Patents
一种路网环境下的聚集模式发现方法及系统 Download PDFInfo
- Publication number
- CN107944628A CN107944628A CN201711203467.6A CN201711203467A CN107944628A CN 107944628 A CN107944628 A CN 107944628A CN 201711203467 A CN201711203467 A CN 201711203467A CN 107944628 A CN107944628 A CN 107944628A
- Authority
- CN
- China
- Prior art keywords
- track
- distance
- data
- segments
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000009825 accumulation Methods 0.000 title abstract 5
- 230000033001 locomotion Effects 0.000 claims abstract description 31
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000007405 data analysis Methods 0.000 claims abstract description 9
- 230000002123 temporal effect Effects 0.000 claims abstract description 4
- 230000002776 aggregation Effects 0.000 claims description 58
- 238000004220 aggregation Methods 0.000 claims description 58
- 239000013598 vector Substances 0.000 claims description 16
- 238000009499 grossing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000000007 visual effect Effects 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000012800 visualization Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 238000007418 data mining Methods 0.000 description 5
- 244000144992 flock Species 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种路网环境下的聚集模式发现方法及系统,该方法利用路网环境下的车辆、行人等移动对象的运动轨迹数据,发现他们运动的聚集模式。包括:步骤1:对轨迹进行简化,并通过轨迹结构相似度得到相似轨迹段;步骤2:通过抽取轨迹的结构特征,对轨迹的运动方向、运动速度等特征进行比较,识别相似的运动轨迹;步骤3:通过距离对相似轨迹段进行聚类,找到满足聚类要求的候选聚集模式轨迹集;步骤4:利用时间聚类筛选出符合时空条件的轨迹集合,得到聚集模式轨迹集。系统包括3个模块:数据预处理模块、聚集模式发现模块和可视化数据分析展示模块。
Description
技术领域
本发明属于时空数据挖掘领域,特别是涉及一种路网环境下的聚集模式发现方法及系统。
背景技术
近年来,GPS设备、RFID传感器和无线网络等技术的快速发展和广泛应用,使得移动对象得到了有效地追踪,由此产生了海量的位置数据。这些位置数据中蕴含着大量的信息,需要研究人员对其进行有效地分析。由此移动对象数据挖掘这一研究方向应运而生。目前,针对移动对象运动的轨迹数据、交通轨迹数据等一系列跟踪数据,国内外的学者进行了大量地研究和分析。但是随着研究的深入,需求也在不断的增大,面临的问题也会增多,移动对象数据挖掘已经成为数据挖掘领域中最主要的挑战之一。
移动对象轨迹模式挖掘作为移动对象数据挖掘中一个刚刚兴起并且快速发展的研究方向,其主要目的是从时空数据中发现具有相似运动的轨迹组。从轨迹数据集中识别出具有相似运动模式的轨迹组在很多领域中得到了应有。例如在交通分析领域中,可以利用轨迹组来研究交通的拥堵和异常情况,如:一个包含大量轨迹的轨迹组有可能表示出现了拥堵情况,而那些不属于任何轨迹组的轨迹有可能代表了异常情况,可以用来分析异常情况。通过研究这些轨迹可以发现拥堵的产生原因,并通过规划交通来避免拥堵的出现。
在移动对象微观和宏观分析的基础上,通过研究对象活动时间和空间的特点可以发现移动对象的活动规律,这种活动规律称之为活动模式。周期模式可以发现移动对象的活动周期;频繁模式可以检测移动对象在时空领域频繁发生的活动和频繁访问的路径;群体模式可以发现群体活动的特点并且群体模式的个体都具有相似的运动。除了这些基于传统的数据模式挖掘分析,还有更加适应实际情况的对象活动模式。不同模式具有不同的活动特点和规律,例如,群体模式表示对象在某个区域内一起运动。根据不同的活动特点和规律,可以分析和预测移动对象在未来的活动情况以及移动方向、交通网络规划等。
Flock(m,r,k)表示至少m个对象在半径为r的圆形区域一起运动连续的k段时间。Flock模式能够较好地识别出一起运动的群组对象。虽然Flock模式限制在固定的区域内一起运动,但轨迹进入区域内的时间不一定一致,内部轨迹也不一定相似地运动,只是要求轨迹在这个区域内运动连续的k时间段。由于移动对象是独立的个体,移动对象运动轨迹是不受限制的,所以对固定的区域大小比较敏感,这就使得Flock模式容易产生lossy-flock的现象。图1中,O1,O2,O3,O4为4个移动对象,图1左边为一组对象一起运动的轨迹,而从图1右边可以看出,虽然O4的运动轨迹和其他三条轨迹非常相似,但是O4没有在固定的圆形区域内运动,没有被发现,导致结果存在误差。
发明内容
为了避免模式发现过程中对区域大小和形状的限制,本发明给出了一种路网环境下的聚集模式发现方法及系统。
本发明公开了一种路网环境下的聚集模式发现方法,包括如下步骤:
步骤1,数据预处理:去除原始轨迹中的冗余数据、噪声等信息,并对原始轨迹进行简化和平滑处理;
步骤2,计算轨迹之间的结构相似度计算,根据结构相似度查询得到具有相似运动模式的轨迹段;
步骤3,以步骤2中的相似运动模式的轨迹段为基础,计算轨迹段之间的距离,利用距离特征对相似运动模式的轨迹段进行聚类,将满足一定空间要求轨迹段聚成一个簇,不同类簇的轨迹段即是候选聚集模式轨迹集合;
步骤4,对步骤3中产生的类簇进行时间聚类,从时间角度对候选聚集模式轨迹集合中的轨迹进行分组,得到轨迹聚集模式的轨迹段集合。
步骤1包括如下步骤:
步骤1-1,对轨迹数据进行预处理,通过计算轨迹的平均速度及偏差,结合路网匹配技术对轨迹进行去噪和平滑处理;
步骤1-2,设定距离阈值d,原始轨迹中的一条轨迹记为O1,p1、p2和p3为O1上的三个轨迹点,p2位于p1和p3之间,以p2为顶点,向线段p1p3上作垂线,垂足为p2’,计算p2和p2’的距离D(p2,p2’),如果D(p2,p2’)>d,则保留轨迹点p2,如果D(q2,q2’)<d,则将轨迹O1上的轨迹点q2删除;d的选择没有固定的标准,但取决于对轨迹的环境,如路网数据中,d一般设置为小于等于50米。
步骤1-3,采用步骤1-1和步骤1-2的方法对原始轨迹中的所有轨迹进行处理,从而去除原始轨迹中的冗余轨迹数据和噪声,实现轨迹的简化和平滑处理。
步骤2包括如下步骤:
步骤2-1,设定权重向量:定义W={WD,WS}为特征权重向量,WD表示轨迹的结构特征向量中的方向向量,WS表示轨迹的结构特征向量中的速度向量,WD,WS满足:WD,WS取值均大于或等于零,并且WD+WS=1;
步骤2-2,比较方向信息:轨迹K由轨迹点k1,k2,…,kn组成,轨迹H由轨迹点h1,h2,…,hm组成,m和n的取值为自然数,DirDist(K,H)表示轨迹K和轨迹H在运动趋势上的偏转度,计算公式如下,
其中是轨迹K和轨迹H的方向夹角,两轨迹偏转程度最好的情况是轨迹K和轨迹H的方向相同,并且夹角无限小,即DirDist(K,H)≈0,方向距离最差的情况是轨迹K和轨迹H的方向相反,约为180,这时DirDist(K,H)为轨迹K和轨迹H两者中较短的那条轨迹的长度;
步骤2-3,比较速度信息:SpeedDist(K,H)表示轨迹K和轨迹H移动速度的差异值,计算公式如下:
SpeedDist(K,H)=|Vavg(K)-Vavg(H)|,
其中,Vavg(K)表示轨迹K的移动速度,Vavg(H)表示轨迹H的移动速度;
步骤2-4,根据如下公式计算轨迹K和轨迹H的结构距离SDIST(K,H):
SDIST(K,H)=DirDist(K,H)×WD+SpeedDist(K,H)×WS;
步骤2-5,计算轨迹K和轨迹H的结构相似度SSIM(K,H),公式如下:
SSIM(K,H)=1-Normalized(SDIST(K,H)),
其中,Normalized()为结构距离的归一化函数;由于轨迹结构中每一个特征值的值域是不一样的,因此,需要将每个特征距离进行归一化。结构相似度表示1减去归一化结构距离。
步骤2-6,将得到的结构相似度SSIM(K,H)与设定的结构相似度阈值SM相比,如果SSIM>SM,则为满足结构相似度的轨迹段。
当利用结构相似度(SSIM)进行轨迹相似度对比时,要对不同轨迹的每个分段进行对比。SSIM表示两条轨迹段的差异,SSIM值之和越大,两条轨迹段差异越小,轨迹就越相似,反之两条轨迹段就越不相似。
步骤3包括如下步骤:
步骤3-1,给定两个轨迹点的集合T={t1,t2,t3…te},Y={y1,y2,y3…yr},te表示集合T中第e个轨迹点,yr表示集合Y中第r个轨迹点,e和r取值为自然数,采用哈斯道夫Hausdorff距离衡量集合T和Y之间的距离,公式如下:
LocDist(T,Y)=max(h(T,Y),h(Y,T)),
其中,LocDist(T,Y)表示集合T和Y的双向哈斯道夫Hausdorff距离,
h(T,Y)为集合T到集合Y的单向哈斯道夫Hausdorff距离,即集合T中的轨迹点到最近集合Y中的最大距离,dist(a,b)表示轨迹点b到轨迹点a之间的欧式距离,通过步骤3-1能够体现轨迹在空间上密集程度;
步骤3-2,在步骤3-1的基础上,采用哈斯道夫Hausdorff距离计算步骤2-6中产生的所有相似轨迹之间的距离,并形成距离矩阵;
步骤3-3,对轨迹段进行密度聚类,设定距离阈值dc和聚类近邻个数mn,将在结构上相似的轨迹段在空间距离上较近的轨迹聚为一个类似,反复迭代,直到在剩余轨迹段之间的距离均大于dc,或近邻个数小于mn;
步骤3-4,统计步骤3-3的聚类结果,并根据类簇信息生成候选聚集模式轨迹集合。
步骤4包括:
步骤4-1,在步骤3-4的基础上,统计每一个类簇中轨迹段的出现时间、离开时间、以及运动时间长度信息;
步骤4-2,计算候选聚集模式类簇中轨迹段之间的时间距离,假设i和j为类簇中的两个轨迹段,给定tsi和tei分别表示第i个轨迹段的开始时间和结束时间,tsj和tej分别表示第j个轨迹段的开始时间和结束时间,tdi表示轨迹段i的持续运动时间,以分钟为单位,tdj表示第j个轨迹段的持续运动时间,则轨迹段i和j之间的时间距离用TemporalDist(i,j)表示,计算公式如下:
步骤4-3,根据步骤4-2的方式计算类簇中的两两轨迹段的时间距离,形成时间距离矩阵;
步骤4-4,对轨迹段进行密度聚类,以时间距离矩阵为依据,对类簇中的轨迹段进行时间聚类,则新生成的每一个类簇即为轨迹的一个聚集模式,新类簇中的轨迹称为聚集模式的轨迹集。
本发明还公开了一种路网环境下的聚集模式发现系统,包括数据预处理模块、聚集模式发现模块和可视化数据分析展示模块;
数据预处理模块用于去除原始轨迹数据中的冗余轨迹数据,并对原始轨迹数据进行简化;
聚集模式发现模块是路网环境下的聚集模式发现方法的载体,实现了用于提取聚集模式集合;
可视化数据分析展示模块用于用户和系统进行交互。用户通过输入不同的参数,对系统的展示结果进行调整。
所述聚集模式发现模块计算每个轨迹段之间的结构相似度,找到相似轨迹段,并进行分段;
然后找到满足距离要求的候选聚集模式轨迹集;
最后通过时间聚类,将候选聚集模式中的轨迹集合进行时间聚合,得到最终的聚集模式轨迹集。
所述可视化数据分析展示模块以最终的聚集模式轨迹集为基础,将零散琐碎的轨迹采样数据转化为可视化的轨迹数据并展示给用户。比如显示距离阈值对简化的影响;相似度对实验结果影响图;距离阈值对实验结果影响图等。
路网环境下的聚集模式发现方法及系统在公共安全管理、城市智能交通、城市位置服务等多个领域均有广阔的应用前景。
本发明解决了轨迹区域大小和形状限制,以及轨迹的时空相关性的问题。为了在路网中对移动对象的轨迹进行聚集模式发现,本发明公开了一种路网环境下的聚集模式发现方法及系统,主要包括聚集模式发现方法和系统两个部分,其中所述方法能够捕捉任意形状、大小的区域内的相似运动轨迹,并通过系统对轨迹的聚集模式进行展示。
有益效果:本发明有效解决了轨迹活动区域大小和形状的限制对聚集模式发现结果有影响的问题。聚集模式发现技术可以应用在发现具有相似运动轨迹的移动对象群体中,一个典型的应用就是城市交通,很多地方政府鼓励低碳出行,将聚集模式的发现用于公交车路线的调度,或者推荐具有相同线路的用户来拼车,从而可以减少拥堵、污染和二氧化碳的排放。另一个典型的应用时城市安全管理,通过对路网上的车辆轨迹进行跟踪监测,结合时间聚类,能够识别城市人流的方向和区域,为城市安全管理的决策者提供数据支撑和技术支持。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1为lossy-flock模式示意图。
图2为本发明时间对齐示意图。
图3为本发明总体框架图。
图4为本发明流程图。
图5为本发明轨迹简化示意图。
图6为本发明轨迹方向信息比较示意图。
图7相似度对实验结果影响图。
图8距离阈值对实验结果影响图。
图9为本发明系统总体框架图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
图3为本发明公开的一种路网环境下的聚集模式发现方法的总体框架图,图4为本发明公开的一种路网环境下的聚集模式发现方法的流程图。主要包括如下步骤:
步骤1,数据预处理:去除原始轨迹中的冗余数据、噪声等信息,并对原始轨迹进行简化和平滑处理;
步骤2,计算轨迹之间的结构相似度计算,根据结构相似度查询得到具有相似运动模式的轨迹段;
步骤3,以步骤2中的相似运动模式的轨迹段为基础,计算轨迹段之间的距离,利用距离特征对相似运动模式的轨迹段进行聚类,将满足一定空间要求轨迹段聚成一个簇,不同类簇的轨迹段即是候选聚集模式轨迹集合;
步骤4,对步骤3中产生的类簇进行时间聚类,从时间角度对候选聚集模式轨迹集合中的轨迹进行分组,得到轨迹聚集模式的轨迹段集合。
步骤1包括如下步骤:
步骤1-1,对轨迹数据进行预处理,通过计算轨迹的平均速度及偏差,结合路网匹配技术对轨迹进行去噪和平滑处理;
步骤1-2,设定距离阈值d,原始轨迹中的一条轨迹记为O1,p1、p2和p3为O1上的三个轨迹点,p2位于p1和p3之间,以p2为顶点,向线段p1p3上作垂线,垂足为p2’,计算p2和p2’的距离D(p2,p2’),如果D(p2,p2’)>d,则保留轨迹点p2,如果D(q2,q2’)<d,则将轨迹O1上的轨迹点q2删除;d的选择没有固定的标准,但取决于对轨迹的环境,如路网数据中,d一般设置为小于等于50米。
步骤1-3,采用步骤1-1和步骤1-2的方法对原始轨迹中的所有轨迹进行处理,从而去除原始轨迹中的冗余轨迹数据和噪声,实现轨迹的简化和平滑处理。轨迹简化的结果如图5所示。
步骤2包括如下步骤:
步骤2-1,设定权重向量:定义W={WD,WS}为特征权重向量,WD表示轨迹的结构特征向量中的方向向量,WS表示轨迹的结构特征向量中的速度向量,WD,WS满足:WD,WS取值均大于或等于零,并且WD+WS=1;
步骤2-2,比较方向信息:轨迹K由轨迹点k1,k2,…,kn组成,轨迹H由轨迹点h1,h2,…,hm组成,m和n的取值为自然数,DirDist(K,H)表示轨迹K和轨迹H在运动趋势上的偏转度,计算公式如下,
其中是轨迹K和轨迹H的方向夹角,两轨迹偏转程度最好的情况是轨迹K和轨迹H的方向相同,并且夹角无限小,即DirDist(K,H)≈0,方向距离最差的情况是轨迹K和轨迹H的方向相反,约为180,这时DirDist(K,H)为轨迹K和轨迹H两者中较短的那条轨迹的长度;
步骤2-3,比较速度信息:SpeedDist(K,H)表示轨迹K和轨迹H移动速度的差异值,计算公式如下:
SpeedDist(K,H)=|Vavg(K)-Vavg(H)|,
其中,Vavg(K)表示轨迹K的移动速度,Vavg(H)表示轨迹H的移动速度;
步骤2-4,根据如下公式计算轨迹K和轨迹H的结构距离SDIST(K,H):
SDIST(K,H)=DirDist(K,H)×WD+SpeedDist(K,H)×WS;
步骤2-5,计算轨迹K和轨迹H的结构相似度SSIM(K,H),公式如下:
SSIM(K,H)=1-Normalized(SDIST(K,H)),
其中,Normalized()为结构距离的归一化函数;由于轨迹结构中每一个特征值的值域是不一样的,因此,需要将每个特征距离进行归一化。结构相似度表示1减去归一化结构距离。
步骤2-6,将得到的结构相似度SSIM(K,H)与设定的结构相似度阈值SM相比,如果SSIM>SM,则为满足结构相似度的轨迹段。
当利用结构相似度(SSIM)进行轨迹相似度对比时,要对不同轨迹的每个分段进行对比。SSIM表示两条轨迹段的差异,SSIM值之和越大,两条轨迹段差异越小,轨迹就越相似,反之两条轨迹段就越不相似。
步骤3包括如下步骤:
步骤3-1,给定两个轨迹点的集合T={t1,t2,t3…te},Y={y1,y2,y3…yr},te表示集合T中第e个轨迹点,yr表示集合Y中第r个轨迹点,e和r取值为自然数,采用哈斯道夫Hausdorff距离衡量集合T和Y之间的距离,公式如下:
LocDist(T,Y)=max(h(T,Y),h(Y,T)),
其中,LocDist(T,Y)表示集合T和Y的双向哈斯道夫Hausdorff距离,h(T,Y)为集合T到集合Y的单向哈斯道夫Hausdorff距离,即集合T中的轨迹点到最近集合Y中的最大距离,dist(a,b)表示轨迹点b到轨迹点a之间的欧式距离,轨迹的方向比较如图6所示。通过步骤3-1能够体现轨迹在空间上密集程度;
步骤3-2,在步骤3-1的基础上,采用哈斯道夫Hausdorff距离计算步骤2-6中产生的所有相似轨迹之间的距离,并形成距离矩阵;
步骤3-3,利用基于密度的聚类思想,设定距离阈值dc和聚类近邻个数mn,将在结构上相似的轨迹段在空间距离上较近的轨迹聚为一个类似,反复迭代,直到在剩余轨迹段之间的距离均大于dc,或近邻个数小于mn;
步骤3-4,统计步骤3-3的聚类结果,并根据类簇信息生成候选聚集模式轨迹集合。
如图2所示,图2中L1,L2,L3,L4为4条移动对象轨迹,以10秒为时间段对轨迹段L1,L2,L3,L4进行划分。在0-10秒内,由于L2轨迹的时间段并没有超过5秒,这段轨迹并不存储,所以该时间段内有两条轨迹,并存储L1,L4这两条轨迹段的[1,10]时间内的轨迹点。10-20秒内,存储轨迹段L1,L2,L3,L4在这时间段内的轨迹点以及轨迹数量为4。同理分段进行存储轨迹段以及轨迹数量。
在图2中,设定满足聚集模式的移动对象数量为4。则从存储的轨迹数量中找到3,从而找到[10,20]与[20,30]这两个时间段内的轨迹数量满足要求,则输出[10,20]与[20,30]中的轨迹段集合即为符合聚集模式的轨迹集。
步骤4包括:
步骤4-1,在步骤3-4的基础上,统计每一个类簇中轨迹段的出现时间、离开时间、以及运动时间长度信息;
步骤4-2,计算候选聚集模式类簇中轨迹段之间的时间距离,假设i和j为类簇中的两个轨迹段,给定tsi和tei分别表示第i个轨迹段的开始时间和结束时间,tsj和tej分别表示第j个轨迹段的开始时间和结束时间,tdi表示轨迹段i的持续运动时间,以分钟为单位,tdj表示第j个轨迹段的持续运动时间,则轨迹段i和j之间的时间距离用TemporalDist(i,j)表示,计算公式如下:
步骤4-3,根据步骤4-2的方式计算类簇中的两两轨迹段的时间距离,形成时间距离矩阵;
步骤4-4,对轨迹段进行密度聚类,以时间距离矩阵为依据,对类簇中的轨迹段进行时间聚类,则新生成的每一个类簇即为轨迹的一个聚集模式,新类簇中的轨迹称为聚集模式的轨迹集。图7给出本发明的相似度对路网聚集模式识别结果的影响。图8给出本发明的距离阈值对路网聚集模式识别结果的影响。
图9为本发明的一种路网环境下的聚集模式发现系统的框架图,图9给出本发明中路网环境下的聚集模式发现系统的总体框架图,包括数据预处理模块、聚集模式发现模块、可视化数据分析模块。
(1)数据预处理模块,对原始轨迹数据进行预处理,去除轨迹中冗余数据。
Step 1:对原始轨迹数据进行降噪和清洗,过滤掉异常数据;
Step 2:对轨迹进行简化,去除掉冗余轨迹数据;
(2)聚集模式发现模块,对预处理后的轨迹进行模式发现。
Step 3:通过给出的轨迹结构相似度计算函数来计算每个轨迹段之间的结构相似度找到相似轨迹段,并进行分段;
Step 4:找到满足距离要求的候选聚集模式轨迹集;
Step 5:通过时间聚类,将候选聚集模式中的轨迹段按照时间聚集的特性进行聚合,得到最终的聚集模式轨迹集;
(3)可视化数据分析模块。用户通过参数输入界面修改实验参数、调整实验结果,利用多种方式对用户之间的社交关系分析结果进行可视化的展示。
Step 6:用户和系统进行交互,用户通过输入不同的参数,对系统的展示结果进行调整;
Step 7:以聚集模式发现结果集为基础,将虚拟的数据转化为可视化的数据并展示给用户,如距离阈值对简化的影响;相似度对实验结果影响图;距离阈值对实验结果影响图。
本发明提供了一种路网环境下的聚集模式发现方法及系统,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (8)
1.一种路网环境下的聚集模式发现方法,其特征在于,包括如下步骤:
步骤1,数据预处理:去除原始轨迹中的冗余数据和噪声,并对原始轨迹进行简化和平滑处理;
步骤2,计算轨迹之间的结构相似度,根据结构相似度查询得到具有相似运动模式的轨迹段;
步骤3,以步骤2中的相似运动模式的轨迹段为基础,计算轨迹段之间的距离,利用距离特征对相似运动模式的轨迹段进行聚类,将满足一定空间要求轨迹段聚成一个簇,不同类簇的轨迹段即是候选聚集模式轨迹集合;
步骤4,对步骤3中产生的类簇进行时间聚类,从时间角度对候选聚集模式轨迹集合中的轨迹进行分组,得到轨迹聚集模式的轨迹段集合。
2.根据权利要求1所述的方法,其特征在于,步骤1包括如下步骤:
步骤1-1,对轨迹数据进行预处理,通过计算轨迹的平均速度及偏差,结合路网匹配技术对轨迹进行去噪和平滑处理;
步骤1-2,设定距离阈值d,原始轨迹中的一条轨迹记为O1,p1、p2和p3为O1上的三个轨迹点,p2位于p1和p3之间,以p2为顶点,向线段p1p3上作垂线,垂足为p2’,计算p2和p2’的距离D(p2,p2’),如果D(p2,p2’)>=d,则保留轨迹点p2,如果D(q2,q2’)<d,则将轨迹O1上的轨迹点q2删除;
步骤1-3,采用步骤1-1和步骤1-2的方法对原始轨迹数据集中的所有轨迹进行处理,从而去除原始轨迹中的冗余轨迹数据和噪声,实现轨迹的简化和平滑处理。
3.根据权利要求2所述的方法,其特征在于,步骤2包括如下步骤:
步骤2-1,设定权重向量:定义W={WD,WS}为特征权重向量,WD表示轨迹的方向权重向量,WS表示轨迹的速度权重向量,WD,WS满足:WD,WS取值均大于或等于零,并且WD+WS=1;
步骤2-2,比较方向信息:轨迹K由轨迹点k1,k2,…,kn组成,轨迹H由轨迹点h1,h2,…,hm组成,m和n的取值为自然数,DirDist(K,H)表示轨迹K和轨迹H在运动趋势上的偏转度,计算公式如下,
其中是轨迹K和轨迹H的方向夹角,两轨迹偏转程度最好的情况是轨迹K和轨迹H的方向相同,并且夹角无限小,即DirDist(K,H)≈0,方向距离最差的情况是轨迹K和轨迹H的方向相反,约为180,这时DirDist(K,H)为轨迹K和轨迹H两者中较短的那条轨迹的长度;
步骤2-3,比较速度信息:SpeedDist(K,H)表示轨迹K和轨迹H移动速度的差异值,计算公式如下:
SpeedDist(K,H)=|Vavg(K)-Vavg(H)|,
其中,Vavg(K)表示轨迹K的运动速度,Vavg(H)表示轨迹H的运动速度;
步骤2-4,根据如下公式计算轨迹K和轨迹H的结构距离SDIST(K,H):
SDIST(K,H)=DirDist(K,H)×WD+SpeedDist(K,H)×WS;
步骤2-5,计算轨迹K和轨迹H的结构相似度SSIM(K,H),公式如下:
SSIM(K,H)=1-Normalized(SDIST(K,H)),
其中,Normalized()为结构距离的归一化函数;
步骤2-6,将得到的结构相似度SSIM(K,H)与设定的结构相似度阈值SM相比,如果SSIM>SM,则为满足结构相似度的轨迹段。
4.根据权利要求3所述的方法,其特征在于,步骤3包括如下步骤:
步骤3-1,给定两个轨迹点的集合T={t1,t2,t3…te},Y={y1,y2,y3…yr},te表示集合T中第e个轨迹点,yr表示集合Y中第r个轨迹点,e和r取值为自然数,采用哈斯道夫Hausdorff距离衡量集合T和Y之间的距离,公式如下:
LocDist(T,Y)=max(h(T,Y),h(Y,T)),
其中,LocDist(T,Y)表示集合T和Y的双向哈斯道夫Hausdorff距离,h(T,Y)为集合T到集合Y的单向哈斯道夫Hausdorff距离,即集合T中的轨迹点到最近集合Y中的最大距离,dist(a,b)表示轨迹点b到轨迹点a之间的欧式距离;
步骤3-2,在步骤3-1的基础上,采用哈斯道夫Hausdorff距离计算步骤2-6中产生的所有相似轨迹之间的距离,并形成距离矩阵;
步骤3-3,利用基于密度的聚类思想,设定距离阈值dc和聚类近邻个数mn,将在结构上相似的轨迹段在空间距离上较近的轨迹聚为一个类似,反复迭代,直到在剩余轨迹段之间的距离均大于dc,或近邻个数小于mn;
步骤3-4,统计步骤3-3的聚类结果,并根据类簇信息生成候选聚集模式轨迹集合。
5.根据权利要求4所述的方法,其特征在于,步骤4包括:
步骤4-1,在步骤3-4的基础上,统计每一个类簇中轨迹段的出现时间、离开时间、以及运动时间长度信息;
步骤4-2,计算候选聚集模式类簇中轨迹段之间的时间距离,假设i和j为类簇中的两个轨迹段,给定tsi和tei分别表示第i个轨迹段的开始时间和结束时间,tsj和tej分别表示第j个轨迹段的开始时间和结束时间,tdi表示轨迹段i的持续运动时间,以分钟为单位,tdj表示第j个轨迹段的持续运动时间,则轨迹段i和j之间的时间距离用TemporalDist(i,j)表示,计算公式如下:
<mrow>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mi>o</mi>
<mi>r</mi>
<mi>a</mi>
<mi>l</mi>
<mi>D</mi>
<mi>i</mi>
<mi>s</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mi>&infin;</mi>
</mtd>
<mtd>
<mrow>
<msub>
<mi>te</mi>
<mi>j</mi>
</msub>
<mo>></mo>
<msub>
<mi>ts</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>te</mi>
<mi>i</mi>
</msub>
<mo>></mo>
<msub>
<mi>ts</mi>
<mi>j</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>|</mo>
<msub>
<mi>ts</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>ts</mi>
<mi>j</mi>
</msub>
<mo>|</mo>
<mo>+</mo>
<mo>|</mo>
<msub>
<mi>td</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>td</mi>
<mi>j</mi>
</msub>
<mo>|</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>s</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>,</mo>
</mrow>
步骤4-3,根据步骤4-2的方式计算类簇中的两两轨迹段的时间距离,形成时间距离矩阵;
步骤4-4,对轨迹段进行密度聚类,以时间距离矩阵为依据,对类簇中的轨迹段进行时间聚类,则新生成的每一个类簇即为轨迹的一个聚集模式,新类簇中的轨迹称为聚集模式的轨迹集。
6.一种路网环境下的聚集模式发现系统,其特征在于,包括数据预处理模块、聚集模式发现模块和可视化数据分析展示模块;
数据预处理模块用于去除原始轨迹数据中的冗余数据和噪声,并对原始轨迹数据进行简化和平滑处理;
聚集模式发现模块用于提取聚集模式集合;
可视化数据分析展示模块用于用户和系统进行交互。
7.根据权利要求6所述的一种路网环境下的聚集模式发现系统,其特征在于,所述聚集模式发现模块计算每个轨迹段之间的结构相似度,找到相似轨迹段,并进行分段;然后找到满足距离要求的候选聚集模式轨迹集;最后通过时间聚类,从候选聚集模式的类簇中对轨迹段进行时间聚合,得到最终的聚集模式轨迹集。
8.根据权利要求7所述的一种路网环境下的聚集模式发现系统,其特征在于,所述可视化数据分析展示模块以最终的聚集模式轨迹集为基础,将虚拟的数据转化为可视化的数据并展示给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711203467.6A CN107944628A (zh) | 2017-11-27 | 2017-11-27 | 一种路网环境下的聚集模式发现方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711203467.6A CN107944628A (zh) | 2017-11-27 | 2017-11-27 | 一种路网环境下的聚集模式发现方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107944628A true CN107944628A (zh) | 2018-04-20 |
Family
ID=61949024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711203467.6A Pending CN107944628A (zh) | 2017-11-27 | 2017-11-27 | 一种路网环境下的聚集模式发现方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107944628A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564788A (zh) * | 2018-06-07 | 2018-09-21 | 重庆邮电大学 | 一种基于流式大数据的同行车辆发现方法 |
CN109446286A (zh) * | 2018-09-28 | 2019-03-08 | 山东中创软件商用中间件股份有限公司 | 一种高速公路路网图的可视化方法及装置 |
CN110139221A (zh) * | 2019-05-09 | 2019-08-16 | 特斯联(北京)科技有限公司 | 一种基于手机信号微卡口的人口集群动态监测方法与系统 |
CN110443311A (zh) * | 2019-08-07 | 2019-11-12 | 长安大学 | 一种基于形状因素调整的交通轨迹聚类相似性计算方法 |
CN110457315A (zh) * | 2019-07-19 | 2019-11-15 | 国家计算机网络与信息安全管理中心 | 一种基于用户轨迹数据的群体聚集模式分析方法和系统 |
CN112770252A (zh) * | 2020-12-31 | 2021-05-07 | 深圳前海中电慧安科技有限公司 | 基于单点相似度的人车关联方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103246706A (zh) * | 2013-04-09 | 2013-08-14 | 哈尔滨工程大学 | 一种道路网络空间中车辆对象移动轨迹聚类的方法 |
CN103593430A (zh) * | 2013-11-11 | 2014-02-19 | 胡宝清 | 一种基于移动对象时空信息轨迹分段聚类的方法 |
CN106446960A (zh) * | 2016-10-10 | 2017-02-22 | 太原理工大学 | 一种密度聚类划分时间段的动态热度路网构建方法 |
CN107194434A (zh) * | 2017-06-16 | 2017-09-22 | 中国矿业大学 | 一种基于时空数据的移动对象相似度计算方法及系统 |
-
2017
- 2017-11-27 CN CN201711203467.6A patent/CN107944628A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103246706A (zh) * | 2013-04-09 | 2013-08-14 | 哈尔滨工程大学 | 一种道路网络空间中车辆对象移动轨迹聚类的方法 |
CN103593430A (zh) * | 2013-11-11 | 2014-02-19 | 胡宝清 | 一种基于移动对象时空信息轨迹分段聚类的方法 |
CN106446960A (zh) * | 2016-10-10 | 2017-02-22 | 太原理工大学 | 一种密度聚类划分时间段的动态热度路网构建方法 |
CN107194434A (zh) * | 2017-06-16 | 2017-09-22 | 中国矿业大学 | 一种基于时空数据的移动对象相似度计算方法及系统 |
Non-Patent Citations (1)
Title |
---|
袁冠等: "基于结构相似度的轨迹聚类算法", 《通信学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564788A (zh) * | 2018-06-07 | 2018-09-21 | 重庆邮电大学 | 一种基于流式大数据的同行车辆发现方法 |
CN109446286A (zh) * | 2018-09-28 | 2019-03-08 | 山东中创软件商用中间件股份有限公司 | 一种高速公路路网图的可视化方法及装置 |
CN109446286B (zh) * | 2018-09-28 | 2022-01-04 | 山东中创软件商用中间件股份有限公司 | 一种高速公路路网图的可视化方法及装置 |
CN110139221A (zh) * | 2019-05-09 | 2019-08-16 | 特斯联(北京)科技有限公司 | 一种基于手机信号微卡口的人口集群动态监测方法与系统 |
CN110139221B (zh) * | 2019-05-09 | 2020-02-14 | 特斯联(北京)科技有限公司 | 一种基于手机信号微卡口的人口集群动态监测方法与系统 |
CN110457315A (zh) * | 2019-07-19 | 2019-11-15 | 国家计算机网络与信息安全管理中心 | 一种基于用户轨迹数据的群体聚集模式分析方法和系统 |
CN110443311A (zh) * | 2019-08-07 | 2019-11-12 | 长安大学 | 一种基于形状因素调整的交通轨迹聚类相似性计算方法 |
CN110443311B (zh) * | 2019-08-07 | 2022-10-04 | 长安大学 | 一种基于形状因素调整的交通轨迹聚类相似性计算方法 |
CN112770252A (zh) * | 2020-12-31 | 2021-05-07 | 深圳前海中电慧安科技有限公司 | 基于单点相似度的人车关联方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107944628A (zh) | 一种路网环境下的聚集模式发现方法及系统 | |
CN107766808B (zh) | 道路网络空间中车辆对象移动轨迹聚类的方法及系统 | |
CN111539454B (zh) | 一种基于元学习的车辆轨迹聚类方法及系统 | |
CN110059581A (zh) | 基于场景深度信息的人群计数方法 | |
CN103258203B (zh) | 遥感影像的道路中线自动提取方法 | |
CN108153867B (zh) | 基于时间规律性的用户轨迹预测方法和装置 | |
CN111582380B (zh) | 一种基于时空特征的船舶轨迹密度聚类方法及装置 | |
CN108985380B (zh) | 一种基于聚类集成的转辙机故障识别方法 | |
CN110415523A (zh) | 一种基于车辆出行轨迹数据的信号控制子区划分方法 | |
CN103377555A (zh) | 用于自动检测交通交叉路口的异常的方法和系统 | |
CN103854027A (zh) | 一种人群行为识别方法 | |
CN102378992A (zh) | 关节状区域检测装置及其方法 | |
CN108986453A (zh) | 一种基于情境信息的交通状况预测方法、系统及装置 | |
CN110443287B (zh) | 一种基于稀疏轨迹数据的人群移动流绘制方法 | |
CN113516105B (zh) | 一种车道检测方法、装置及计算机可读存储介质 | |
Sawas et al. | Tensor methods for group pattern discovery of pedestrian trajectories | |
Priambodo et al. | Predicting traffic flow propagation based on congestion at neighbouring roads using hidden Markov model | |
CN107958260A (zh) | 一种基于多特征融合的群体行为分析方法 | |
Li et al. | A top–bottom clustering algorithm based on crowd trajectories for small group classification | |
CN114742280B (zh) | 路况预测方法及相应的模型训练方法、装置、设备及介质 | |
CN113033899A (zh) | 无人驾驶邻近车辆轨迹预测方法 | |
Chen et al. | Comogcn: Coherent motion aware trajectory prediction with graph representation | |
Thu et al. | Multi-source data analysis for bike sharing systems | |
CN117664168A (zh) | 一种园区车辆导航路径规划方法、介质及系统 | |
CN110909037A (zh) | 一种频繁轨迹模式的挖掘方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180420 |