CN105825672A - 一种基于浮动车数据的城市指引区域提取方法 - Google Patents

一种基于浮动车数据的城市指引区域提取方法 Download PDF

Info

Publication number
CN105825672A
CN105825672A CN201610224826.5A CN201610224826A CN105825672A CN 105825672 A CN105825672 A CN 105825672A CN 201610224826 A CN201610224826 A CN 201610224826A CN 105825672 A CN105825672 A CN 105825672A
Authority
CN
China
Prior art keywords
data
bunch
floating car
point
hot spot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610224826.5A
Other languages
English (en)
Other versions
CN105825672B (zh
Inventor
黄敏
潘嘉杰
刘芳
郑健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201610224826.5A priority Critical patent/CN105825672B/zh
Publication of CN105825672A publication Critical patent/CN105825672A/zh
Application granted granted Critical
Publication of CN105825672B publication Critical patent/CN105825672B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/0112Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明从城市兴趣点指路标志布设的角度出发,提出一种基于浮动车数据的城市指引区域提取方法,包括一下步骤:提取浮动车行驶轨迹中载客路径的上下车位置数据,构建OD数据集;基于改进密度聚类算法对浮动车OD数据聚类得到出行热点簇,计算热点簇质心表示出行热点的地理位置;对出行热点质心进行二次聚类得到出行热点密度包,搜索密度包凸集构建几何形状的热点区域;计算热点区域热度表示出行需求程度,根据热度划分热点区域指引等级;根据指引等级提取兴趣点群和指引区域;指引区域是出行热点区域,能为城市指路标志指引布设提供参考。

Description

一种基于浮动车数据的城市指引区域提取方法
技术领域
本发明涉及数据提取和道路交通规划领域,特别是涉及一种基于浮动车数据的城市指引区域提取方法。
背景技术
兴趣点指电子地图上的地标或景点,用以标示出该地所代表的政府部门、商业机构、旅游景点、名胜古迹和交通设施等处所。《广州市道路交通指路标志系统设计技术指引研究》指出,道路上需要对具有普遍公众服务性或交通集散量相对较大的重要场所和旅游景区等兴趣点增设指路标志,具体包括重要政府机关单位、大型医院、重点学院、市级商业中心、大型文体设施、会议展览中心、交通枢纽、著名园区和著名旅游区等九大类。指引中规定,对机场、火车站交通枢纽和重要著名园区须提前设置,而政府机关、医院、重点学院、一般大型文体设施和一般著名旅游区不提前设施,而其他类型的兴趣点可提前设施。
从指引中看出,对兴趣点是否需要提前设置的规范是比较含糊的。仅仅依靠兴趣点的类型和规模大小决定指路标志的提前设置不一定能满足实际人们的出行需求。因此,对兴趣点的指路标志布设,应当参考兴趣点实际的交通吸引量大小和指引等级。热点区域是兴趣点聚集且人们出行频繁的区域,存在较大的交通吸引量。因此兴趣点指引应考虑对出行热度更大的区域内的兴趣点进行指路标志布设。浮动车数据记录了车辆的行驶位置,可通过浮动车行驶轨迹中频繁的上下乘客地点来发现热点区域。有学者对浮动车上下客数据进行聚类挖掘出租车打车位置点和出行目的地热门区域。热门区域通常由沿道路分布的带状聚类簇表示,未能有效表达热门区域的形状范围。有学者对浮动车轨迹中的停留点进行聚类挖掘出行热点区域,通常由单个聚类簇的质心表示。也有学者基于改进的K-means算法对百度地图上的兴趣点数据进行聚类得到兴趣点群信息,未能考虑到兴趣点实际的交通出行访问量。而采用数据匹配的方法进行兴趣点群的更新和提取,并未对众多的兴趣点进行聚类得到兴趣点群。不包含区域和形状信息的单个兴趣点或出行热点难以得出兴趣点群信息。出行热点的密度分布情况反映了附近出行热门区域的情况,因此需要将出行热点信息转化为区域信息。目前对热点区域的挖掘研究主要为出租车载客位置和出行目的地作推荐服务,较少从城市指路标志布设方面构建热点区域并提取指引区域。
发明内容
本发明针对城市兴趣点指路标志布设进行研究,考虑兴趣点的交通吸引量大小,为城市兴趣点指引布设寻找指引等级更高的区域,提供一种基于浮动车数据的城市指引区域提取方法。
为了实现上述发明目的,本发明采用的技术方案如下:
一种基于浮动车数据的城市指引区域提取方法,包含以下步骤:
S1.提取浮动车行驶轨迹中载客路径的上下车位置数据,构建OD数据集;
S2.基于改进密度聚类算法对浮动车OD数据聚类得到出行热点簇,计算出行热点簇质心;
S3.对出行热点质心进行二次聚类得到出行热点密度包,搜索密度包凸集构建几何形状的热点区域;
S4.计算热点区域热度,划分热点区域指引等级,得到基于浮动车数据的城市指引区域图;
优选地,所述步骤S1中,提取浮动车行驶轨迹中载客路径的上下车位置数据,构建OD数据集。其具体实现过程是,对于原始的浮动车数据定义为结构P:
P={l,lon,lat,t,s}
其中l是车辆牌照,lon、lat是经、纬度,t是定位时间,s是浮动车行驶状态标识,主要包括空车和重车;而对于车辆k,每个定位时间t的浮动车数据定义为:
Pt k={lon,lat,s}
根据定位时间t对浮动车k的定位数据排序并构建全局路径序列GTrk
GTrk={Pt k|t=1,…,n}
利用全局路径序列中行驶状态的变化,可提取出浮动车在不同行驶状态下的出行路径。浮动车出行路径主要包括空车状态下的路径和重车状态下的路径;
浮动车出行路径主要包括空车状态下的路径和重车状态下的路径,提取重车状态下路径的OD数据作热点区域挖掘,在全局路径序列GTrk中,假设定位时间a<b,如果满足以下三个条件:
①Pa k的行驶状态为空车状态,Pa+1 k行驶状态为重车状态;
②Pb+1 k中行驶状态为空车状态;
③Pa+1 k和Pb k间的行驶状态相同;
则提取数据Pa+1 k和Pb k作为载客路径中的OD对(PO k,PD k),提取浮动车k全局路径序列GTrk中的所有载客OD数据,构成浮动车k的OD数据集Sk
S k = { ( P O j k , P D j k ) | j = 1 , . . . , m }
其中:j代表浮动车k在全局路径序列中的不同重车路径,分别表示不同重车路径的起点和终点位置。
优选地,所述步骤S2中,对浮动车OD数据聚类得到出行热点簇,计算出行热点簇质心。其实现过程是:
1)遍历数据集,如果数据对象p未被处理,则判断对象p是否为核心对象,如果是则建立新簇C;判断其他点是否在对象p的Eps邻域内,将对象p的Eps邻域内的所有对象添加到簇C中;
2)搜索簇C中未处理的对象。如果对象q未被处理,则判断对象q是否为核心对象,如果是核心对象则将q的Eps邻域内未被划分到任何簇的对象添加到簇C中;
3)若簇C中所有的数据对象都被判断过,则该簇的聚类完成,标记该簇内所有对象为已处理;
4)重新搜索数据集中未被处理的点对象,判断是否核心点,开始新簇的聚类;直到所有的数据点都被划分到某个簇或者不被划分到任何一个簇,不属于任何簇的数据点标记为噪声点,算法结束;
当对象p的Eps邻域内的数据点不小于能构成聚类簇的最小点数量MinPts时,说明在该对象p的Eps半径内点密度较高,是人们出行频繁的地点,认为该对象的邻域内的数据点构成的聚类簇为出行热点簇;
其中,在基于改进密度聚类算法的聚类过程中,建立参数dmax限制聚类簇的空间尺寸,dmax是指聚类簇的所有点对象与当前聚类簇质心的最大距离,即聚类簇中的任意对象pi必须满足公式(1):
dis(pi,pc)<dmax(1)
其中dis表示两点距离,pc(xc,yc)为聚类过程中的当前聚类簇质心,计算如公式(2):
x c = 1 N c &Sigma; i = 1 N c x i y c = 1 N c &Sigma; i = 1 N c y i ( x i , y i ) &Element; C - - - ( 2 )
Nc为簇C包含的点数量,xi和yi分别为对象pi的经度和纬度;
而对于核心对象p的聚类簇Cp,定义聚类簇Cp中最左、最右、最上和最下的对象p1、p2、p3、p4为主要判断对象。在聚类簇扩展中,只对主要判断对象进行扩展,聚类簇内非主要判断对象不进行扩展。
对于二维空间中的点a和b,坐标分别为(xa,ya)和(xb,yb),则a与b的欧拉距离de(a,b),即两点的直线距离,计算如公式(3):
d e ( a , b ) = ( x a - x b ) 2 + ( y a - y b ) 2 - - - ( 3 )
聚类完成后,得到多个出行热点的聚类簇C(pc,Nc),利用公式(2)计算其质心pc反映出行热点聚集的几何位置,其关联的浮动车数量Nc反映该簇的出行吸引热度。
优选地,所述步骤S3中,对出行热点质心进行二次聚类得到出行热点密度包,搜索密度包凸集构建几何形状的热点区域。具体方式是,利用密度聚类方法对出行热点质心进行聚类,把空间密集的出行热点聚合成簇,成为出行热点密度包。构建具有几何形状的热点区域,将聚类结果转换为地理几何数据,并以多边形来表示。利用Graham扫描法获取聚类簇的凸包,凸包是指点集的最小凸多边形,依次连接凸包中的点从而构建热点区域。Graham扫描法的步骤如下:
1)首先找到所有点中y坐标最小的点,如果y坐标相同,则找x坐标最小的点;
2)以该点为基准求所有点的极角,并按照极角大小排序得到点序列S={s1,s2,…,sn};
3)建立一个堆栈,初始点s1、s2和s3进栈,对于点s1至sn,若栈顶的两个点与它不构成“向左转关系”则将栈顶的点出栈,直至没有点需要出栈以后将当前点进栈;
4)所有点处理完后堆栈中保存的点为凸包。
由于出行热点分布不同路段中,在路网拓扑中并非是直线可达的,路网距离与欧拉距离有很大的差别。考虑道路网络可达性,在热点区域聚类过程中采用路网拓扑距离。道路网络用无向图G=(V,E)表示,其中V为结点集,E为路段集。根据对象p与路网中路段的距离,选择距离最短的路段为对象p的所属路段。
对于同一路段中的对象p和q,定义de(p,q)为两对象的路段投影点的距离。de(p,q)可通过式(4)计算,其中de(p,vi)表示p与路段结点vi的路段距离。
de(p,q)=|de(p,vi)-de(q,vi)|(4)
对于不同路段中的对象p和q,定义dt(p,q)为对象p和q在路网上的最短路径距离。最短路径距离可表示为式(5)所示,其中dmin(vp,vq)由Dijkstra算法获得。
dt(p,q)=de(p,vp)+dmin(vp,vq)+de(vq,q)(5)
经过对出行热点质心的聚类和几何形状构建得到出行热点区域,反映出行热点的密集程度。
优选地,所述步骤S4中,计算热点区域热度表示出行需求程度,根据热度划分热点区域指引等级。具体方式是,令Qk代表第k个热点区域,Mk为其所含出行热点簇的数量。对于热点区域k,定义区域内关联的浮动车数量比率为区域指引热度hk,计算参考公式(6)。其中为第k个热点区域内的浮动车数量,N为所有热点区域的浮动车数量,计算分别参考式(7)和(8)。
h k = N ~ k N - - - ( 6 )
N ~ k = &Sigma; c = 1 M k N c , p c &Element; Q k - - - ( 7 )
N = &Sigma; k N ~ k - - - ( 8 )
将区域的指引等级划分为四个等级,并通过式(9)把热度进行归一化处理,将结果映射到[0-1]之间。指引热度反映了热点区域对人们出行的需求度,可以确定不同热点区域的指引等级。即指引热度(0.75,1]为一级指引,(0.5,0.75]为二级指引,(0.25,0.5]为三级指引,(0,0.25]为四级指引。
h &prime; = h - h m i n h m a x - h min - - - ( 9 )
附图说明
图1是本发明的提取城市指引区域的总流程图。
图2是本发明密度聚类主要判断对象示意图。
图3是本发明浮动车载客下车数据点分布示意图。
图4是本发明浮动车载客下车数据点聚类示意图。
图5是本发明对同一路段对象的路网距离示意图。
图6是本发明对不同路段对象的路网距离示意图。
图7是本发明出行热点聚类示意图。
图8是本发明具体实施案例示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和具体实施方式对本发明作进一步详细的说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
如图1所示,为本发明一种基于浮动车数据的城市指引区域提取方法具体实施例的流程图。参见图1,本具体实施例的具体步骤包括:
步骤一:提取浮动车行驶轨迹中载客路径的上下车位置数据,构建OD数据集。首先,定义原始的浮动车数据结构为P:
P={l,lon,lat,t,s}
其中l是车辆牌照,lon、lat是经、纬度,t是定位时间,s是浮动车行驶状态标识,主要包括空车和重车;而对于车辆k,每个定位时间t的浮动车数据定义为:
Pt k={lon,lat,s}
根据定位时间t对浮动车k的定位数据排序并构建全局路径序列GTrk
GTrk={Pt k|t=1,…,n}
利用全局路径序列中行驶状态的变化,可提取出浮动车在不同行驶状态下的出行路径。浮动车出行路径主要包括空车状态下的路径和重车状态下的路径,提取重车状态下路径的OD数据作热点区域挖掘,在全局路径序列GTrk中,假设定位时间a<b,如果满足以下三个条件:
①Pa k的行驶状态为空车状态,Pa+1 k行驶状态为重车状态;
②Pb+1 k中行驶状态为空车状态;
③Pa+1 k和Pb k间的行驶状态相同;
则提取数据Pa+1 k和Pb k作为载客路径中的OD对(PO k,PD k),提取浮动车k全局路径序列GTrk中的所有载客OD数据,构成浮动车k的OD数据集Sk
S k = { ( P O j k , P D j k ) | j = 1 , . . . , m }
其中:j代表浮动车k在全局路径序列中的不同重车路径,分别表示不同重车路径的起点和终点位置。
最终提取所有车辆的OD数据集并构建浮动车OD数据库,如表1所示。Type标识数据类型,1表示为起点,2为终点。经过经纬度范围的判断,落在研究区域内的OD数据会转化为具有几何特征的地理数据,在GIS地图中以点要素的方式显示。
表1浮动车OD数据库
步骤二:对浮动车OD数据聚类得到出行热点簇,计算热点簇质心表示出行热点的地理位置。浮动车以相对稳定的速度在道路上行驶,到达目的地后停靠在道路旁边,浮动车的定位点一般沿着道路分布。出行热点是人们日常出行频繁的目的地,在热点附近产生的浮动车下车数据较多,容易呈现聚集分布的现象。如图3是浮动车载客下车数据点分布情况,在某些路段中有密度较大的数据点,形成明显的点簇。利用改进的密度聚类算法对浮动车OD数据聚类得到出行热点聚类簇。首先,建立参数dmax限制聚类簇的空间尺寸,dmax是指聚类簇的所有点对象与当前聚类簇质心的最大距离。使聚类簇中的任意对象pi必须满足以下条件:
dis(pi,pc)<dmax(1)
其中dis表示两点距离,pc(xc,yc)为聚类过程中的当前聚类簇质心,计算公式如(2)所示:
x c = 1 N c &Sigma; i = 1 N c x i y c = 1 N c &Sigma; i = 1 N c y i ( x i , y i ) &Element; C - - - ( 2 )
其中Nc为簇C包含的点数量,xi和yi分别为对象pi的经度和纬度;
然后,如图2所示,对于核心对象p的聚类簇Cp,定义聚类簇Cp中最左、最右、最上和最下的对象p1、p2、p3、p4为主要判断对象。在聚类簇扩展中,只对主要判断对象进行扩展,聚类簇内非主要判断对象不进行扩展。
出行热点聚类的范围和规模较小,聚类簇通常位于同一路段上,考虑算法简便聚类过程采用欧拉距离。对于二维空间中的点a和b,坐标分别为(xa,ya)和(xb,yb),则a与b的欧拉距离de(a,b)即两点的直线距离,计算公式为:
d e ( a , b ) = ( x a - x b ) 2 + ( y a - y b ) 2 - - - ( 3 )
如图4所示,聚类完成后,得到多个出行热点的聚类簇C(pc,Nc),其质心pc可以反映出行热点聚集的几何位置,其关联的浮动车数量Nc反映该簇的出行吸引热度。
步骤三:利用密度聚类方法对出行热点质心进行聚类,把空间密集的出行热点聚合成簇,得到出行热点密度包。构建具有几何形状的热点区域,将聚类结果转换为地理几何数据,并以多边形来表示。利用Graham扫描法获取密度包的凸包,凸包是指点集的最小凸多边形,依次连接凸包中的点从而构建热点区域。Graham扫描法的步骤如下:
1)首先找到所有点中y坐标最小的点,如果y坐标相同,则找x坐标最小的点;
2)以该点为基准求所有点的极角,并按照极角大小排序得到点序列S={s1,s2,…,sn};
3)建立一个堆栈,初始点s1、s2和s3进栈,对于点s1至sn,若栈顶的两个点与它不构成“向左转关系”则将栈顶的点出栈,直至没有点需要出栈以后将当前点进栈;
4)所有点处理完后堆栈中保存的点为凸包。
由于出行热点分布不同路段中,在路网拓扑中并非是直线可达的,路网距离与欧拉距离有很大的差别。考虑道路网络可达性,在热点区域聚类过程中采用路网拓扑距离。道路网络用无向图G=(V,E)表示,其中V为结点集,E为路段集。根据对象p与路网中路段的距离,选择距离最短的路段为对象p的所属路段。
如图5所示,对于同一路段中的对象p和q,定义de(p,q)为两对象的路段投影点的距离。de(p,q)可通过式(4)计算,其中de(p,vi)表示p与路段结点vi的路段距离。
de(p,q)=|de(p,vi)-de(q,vi)|(4)
如图6所示,对于不同路段中的对象p和q,定义dt(p,q)为对象p和q在路网上的最短路径距离。最短路径距离可表示为式(5)所示,其中dmin(vp,vq)由Dijkstra算法获得。
dt(p,q)=de(p,vp)+dmin(vp,vq)+de(vq,q)(5)
如图7所示,经过对出行热点质心的聚类和Graham扫描法的几何形状构建得到出行热点区域,反映出行热点的密集程度。
步骤四:计算热点区域热度表示出行需求程度,根据热度划分热点区域指引等级。具体方式是,令Qk代表第k个热点区域,Mk为其所含出行热点簇的数量。对于热点区域k,定义区域内关联的浮动车数量比率为区域指引热度hk,如式(6)。其中为第k个热点区域内的浮动车数量,N为所有热点区域的浮动车数量,计算分别如式(7)和(8)所示。最后通过式(9)归一化处理,将结果映射到[0-1]之间。指引热度反映了热点区域对人们出行的需求度,可以以此确定不同热点区域的指引等级,为指引布设提供参考。
h k = N ~ k N - - - ( 6 )
N ~ k = &Sigma; c = 1 M k N c , p c &Element; Q k - - - ( 7 )
N = &Sigma; k N ~ k - - - ( 8 )
将区域的指引等级划分为四个等级,并通过式(9)把热度进行归一化处理,将结果映射到[0-1]之间。指引热度反映了热点区域对人们出行的需求度,可以以此确定不同热点区域的指引等级。即指引热度(0.75,1]为一级指引,(0.5,0.75]为二级指引,(0.25,0.5]为三级指引,(0,0.25]为四级指引。
h &prime; = h - h m i n h m a x - h m i n - - - ( 9 )
经过热点区域热度值的计算和指引等级划分,可以确定热点区域内兴趣点群间的指引等级大小,最终为城市兴趣点指路标志指引信息提供布设参考。
最后以图8所示,具体实施案例选择了广州市天河区。选取天河区的珠江新城区域及其2014年12月15日-12月19日共5天的浮动车数据为例,图8(a)是对OD数据聚类后得到的出行热点,8(b)是对出行热点聚类得到的热点区域,根据每个热点区域计算的指引热度分级显示区域范围。利用基于浮动车OD数据的指引区域提取方法,可得出天河区一级指引区域2个,二级指引区域1个,三级指引区域2个,四级指引区域4个。
本发明是以提取城市热点区域作为兴趣点指引布设参考为目标,通过对浮动车上下车数据的聚类得到出行热点,利用Graham扫描法对出行热点的二次聚类结果进行热点区域的构建。根据热点区域的热度计算值,划分热点区域的指引等级。通过本发明挖掘城市兴趣点指引区域是一种科学方法,对工程应用具有指导意义。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (5)

1.一种基于浮动车数据的城市指引区域提取方法,其特征在于,包含以下步骤:
S1.提取浮动车行驶轨迹中载客路径的上下车位置数据,构建OD数据集;
S2.基于改进密度聚类算法对浮动车OD数据聚类得到出行热点簇,计算出行热点簇质心;
S3.对出行热点质心进行二次聚类得到出行热点密度包,搜索密度包凸集构建几何形状的热点区域;
S4.计算热点区域热度,划分热点区域指引等级,得到基于浮动车数据的城市指引区域图。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,提取浮动车行驶轨迹中载客路径的上下车位置数据,构建OD数据集;其具体实现过程是,对于原始的浮动车数据定义为结构P:
P={l,lon,lat,t,s}
其中l是车辆牌照,lon、lat是经、纬度,t是定位时间,s是浮动车行驶状态标识,主要包括空车和重车;而对于车辆k,每个定位时间t的浮动车数据定义为:
Pt k={lon,lat,s}
根据定位时间t对浮动车k的定位数据排序并构建全局路径序列GTrk
GTrk={Pt k|t=1,…,n}
利用全局路径序列中行驶状态的变化,可提取出浮动车在不同行驶状态下的出行路径;
浮动车出行路径主要包括空车状态下的路径和重车状态下的路径,提取重车状态下路径的OD数据作热点区域挖掘,在全局路径序列GTrk中,假设定位时间a<b,如果满足以下三个条件:
①Pa k的行驶状态为空车状态,Pa+1 k行驶状态为重车状态;
②Pb+1 k中行驶状态为空车状态;
③Pa+1 k和Pb k间的行驶状态相同;
则提取数据Pa+1 k和Pb k作为载客路径中的OD对(PO k,PD k),提取浮动车k全局路径序列GTrk中的所有载客OD数据,构成浮动车k的OD数据集Sk
S k = { ( P O j k , P D j k ) | j = 1 , ... , m }
其中:j代表浮动车k在全局路径序列中的不同重车路径,分别表示不同重车路径的起点和终点位置。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,对浮动车OD数据聚类得到出行热点簇,其实现过程是:
1)遍历数据集,如果数据对象p未被处理,则判断对象p是否为核心对象,如果是则建立新簇C;判断其他点是否在对象p的Eps邻域内,是则将对象p的Eps邻域内的所有对象添加到簇C中;
2)搜索簇C中未处理的对象,如果对象q未被处理,则判断对象q是否为核心对象,如果是核心对象则将q的Eps邻域内未被划分到任何簇的对象添加到簇C中;
3)若簇C中所有的数据对象都被判断过,则该簇的聚类完成,标记该簇内所有对象为已处理;
4)重新搜索数据集中未被处理的点对象,判断是否核心点,开始新簇的聚类;直到所有的数据点都被划分到某个簇或者不被划分到任何一个簇,不属于任何簇的数据点标记为噪声点,算法结束;
当对象p的Eps邻域内的数据点不小于能构成聚类簇的最小点数量MinPts时,说明在该对象p的Eps半径内点密度较高,是人们出行频繁的地点,认为该对象的邻域内的数据点构成的聚类簇为出行热点簇;
其中,在基于改进密度聚类算法的聚类过程中,建立参数dmax限制聚类簇的空间尺寸,dmax是指聚类簇的所有点对象与当前聚类簇质心的最大距离,即聚类簇中的任意对象pi必须满足公式(1):
dis(pi,pc)<dmax(1)
其中dis表示两点距离,pc(xc,yc)为聚类过程中的当前聚类簇质心,计算如公式(2):
x c = 1 N c &Sigma; i = 1 N c x i
y c = 1 N c &Sigma; i = 1 N c y i - - - ( 2 )
(xi,yi)∈C
Nc为簇C包含的点数量,xi和yi分别为对象pi的经度和纬度;
而对于核心对象p的聚类簇Cp,定义聚类簇Cp中最左、最右、最上和最下的对象p1、p2、p3、p4为主要判断对象;在聚类簇扩展中,只对主要判断对象进行扩展,聚类簇内非主要判断对象不进行扩展;
对于二维空间中的点a和b,坐标分别为(xa,ya)和(xb,yb),则a与b的欧拉距离de(a,b),即两点的直线距离,计算如公式(3):
d e ( a , b ) = ( x a - x b ) 2 + ( y a - y b ) 2 - - - ( 3 )
最后当聚类收敛时,再利用公式(2)计算每个聚类簇的质心表示出行热点的地理位置。
4.根据权利要求1所述的方法,其特征在于,所述步骤S3中,对出行热点簇质心进行二次聚类得到出行热点密度包,搜索密度包凸集构建几何形状的热点区域;具体方式是,利用密度聚类方法对出行热点簇质心进行聚类,把空间密集的出行热点聚合成簇,称为出行热点密度包;构建具有几何形状的热点区域,将聚类结果转换为地理几何数据,并以多边形来表示;利用Graham扫描法获取聚类簇的凸包,凸包是指点集的最小凸多边形,依次连接凸包中的点从而构建热点区域;Graham扫描法的步骤如下:
1)首先找到所有点中y坐标最小的点,如果y坐标相同,则找x坐标最小的点;
2)以该点为基准求所有点的极角,并按照极角大小排序得到点序列S={s1,s2,…,sn};
3)建立一个堆栈,初始点s1、s2和s3进栈,对于点s1至sn,若栈顶的两个点与它不构成“向左转关系”则将栈顶的点出栈,直至没有点需要出栈以后将当前点进栈;
4)所有点处理完后堆栈中保存的点为凸包;
由于出行热点分布不同路段中,在路网拓扑中并非是直线可达的,路网距离与欧拉距离有很大的差别;考虑道路网络可达性,在热点区域聚类过程中采用路网拓扑距离;道路网络用无向图G=(V,E)表示,其中V为结点集,E为路段集;根据对象p与路网中路段的距离,选择距离最短的路段为对象p的所属路段;
对于同一路段中的对象p和q,定义de(p,q)为两对象的路段投影点的距离;de(p,q)可通过式(4)计算,其中de(p,vi)表示p与路段结点vi的路段距离;
de(p,q)=|de(p,vi)-de(q,vi)|(4)
对于不同路段中的对象p和q,定义dt(p,q)为对象p和q在路网上的最短路径距离;最短路径距离可表示为式(5)所示,其中dmin(vp,vq)由Dijkstra算法获得;
dt(p,q)=de(p,vp)+dmin(vp,vq)+de(vq,q)(5)。
5.根据权利要求1所述的方法,其特征在于,所述步骤S4中,计算热点区域热度,根据热度划分热点区域指引等级;具体方式是,首先令Qk代表第k个热点区域,Mk为其所含出行热点簇的数量;对于热点区域k,定义区域内关联的浮动车数量比率为区域指引热度hk,参考公式(6);其中为第k个热点区域内的浮动车数量,N为所有热点区域的浮动车数量,计算分别参考式(7)和(8);
h k = N ~ k N - - - ( 6 )
N ~ k = &Sigma; c = 1 M k N c , p c &Element; Q k - - - ( 7 )
N = &Sigma; k N ~ k - - - ( 8 )
将区域的指引等级划分为四个等级,并通过式(9)把热度进行归一化处理,将结果映射到[0-1]之间;指引热度反映了热点区域对人们出行的需求度,可以以此确定不同热点区域的指引等级;即指引热度(0.75,1]为一级指引,(0.5,0.75]为二级指引,(0.25,0.5]为三级指引,(0,0.25]为四级指引;
h &prime; = h - h m i n h m a x - h m i n - - - ( 9 ) .
CN201610224826.5A 2016-04-11 2016-04-11 一种基于浮动车数据的城市指引区域提取方法 Expired - Fee Related CN105825672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610224826.5A CN105825672B (zh) 2016-04-11 2016-04-11 一种基于浮动车数据的城市指引区域提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610224826.5A CN105825672B (zh) 2016-04-11 2016-04-11 一种基于浮动车数据的城市指引区域提取方法

Publications (2)

Publication Number Publication Date
CN105825672A true CN105825672A (zh) 2016-08-03
CN105825672B CN105825672B (zh) 2019-06-14

Family

ID=56525913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610224826.5A Expired - Fee Related CN105825672B (zh) 2016-04-11 2016-04-11 一种基于浮动车数据的城市指引区域提取方法

Country Status (1)

Country Link
CN (1) CN105825672B (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446960A (zh) * 2016-10-10 2017-02-22 太原理工大学 一种密度聚类划分时间段的动态热度路网构建方法
CN106528597A (zh) * 2016-09-23 2017-03-22 百度在线网络技术(北京)有限公司 兴趣点的标注方法以及装置
CN106991525A (zh) * 2017-03-22 2017-07-28 浙江工商大学 基于大数据驱动的空气质量与居民出行可视分析方法与系统
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
CN109145180A (zh) * 2018-06-27 2019-01-04 东华大学 一种基于增量聚类的企业热点事件挖掘方法
CN109254861A (zh) * 2018-09-17 2019-01-22 江苏智通交通科技有限公司 基于轨迹数据的od需求提取及其可靠性分析方法
CN109472433A (zh) * 2018-05-31 2019-03-15 重庆大学 一种基于机动车电子标识数据的城市出行热点提取方法
CN110390144A (zh) * 2019-07-02 2019-10-29 北京建筑大学 导向标识布设信息的确定方法、装置、设备及存储介质
CN110556049A (zh) * 2018-06-04 2019-12-10 百度在线网络技术(北京)有限公司 一种地图数据处理方法、装置、服务器和存储介质
CN110689804A (zh) * 2019-10-10 2020-01-14 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN110866559A (zh) * 2019-11-14 2020-03-06 上海中信信息发展股份有限公司 一种家禽的行为分析方法及装置
CN111209457A (zh) * 2019-12-24 2020-05-29 中国科学院电子学研究所苏州研究院 一种目标典型活动模式偏离告警方法
CN111351499A (zh) * 2018-12-24 2020-06-30 北京嘀嘀无限科技发展有限公司 路径识别方法、装置、计算机设备和计算机可读存储介质
CN111380541A (zh) * 2018-12-29 2020-07-07 沈阳美行科技有限公司 兴趣点确定方法、装置、计算机设备和存储介质
CN111760290A (zh) * 2020-06-11 2020-10-13 网易(杭州)网络有限公司 一种信息处理方法、装置、计算机设备和存储介质
US10846314B2 (en) 2017-12-27 2020-11-24 ANI Technologies Private Limited Method and system for location clustering for transportation services
CN112129315A (zh) * 2020-09-28 2020-12-25 北京百度网讯科技有限公司 用于推荐停车场的方法、装置、电子设备和存储介质
CN113051410A (zh) * 2019-12-27 2021-06-29 南京理工大学 一种基于密度聚类的科研合作团体发现方法
CN113775929A (zh) * 2021-09-28 2021-12-10 上海天麦能源科技有限公司 一种城市燃气管网布局区域划分方法
US11468536B2 (en) 2018-05-18 2022-10-11 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending a personalized pick-up location
CN115855095A (zh) * 2022-12-01 2023-03-28 酷黑科技(北京)有限公司 一种自主导航方法、装置及电子设备
CN118195177A (zh) * 2024-05-16 2024-06-14 天津市城市规划设计研究总院有限公司 一种空间数据治理领域基于od数据的动态区域划分方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079843A (ja) * 2008-09-29 2010-04-08 Nissan Motor Co Ltd カーナビゲーションシステム、交通情報配信装置、車載ナビゲーション装置、及び経路案内方法
CN104269057A (zh) * 2014-09-29 2015-01-07 银江股份有限公司 一种基于浮动车od数据的卡口传感器部署方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079843A (ja) * 2008-09-29 2010-04-08 Nissan Motor Co Ltd カーナビゲーションシステム、交通情報配信装置、車載ナビゲーション装置、及び経路案内方法
CN104269057A (zh) * 2014-09-29 2015-01-07 银江股份有限公司 一种基于浮动车od数据的卡口传感器部署方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘盼盼: "基于空间聚类和Weka平台的出租车载客热点区域挖掘研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
宋乐怡: "海量出租车轨迹数据分析与位置推荐服务", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528597A (zh) * 2016-09-23 2017-03-22 百度在线网络技术(北京)有限公司 兴趣点的标注方法以及装置
CN106528597B (zh) * 2016-09-23 2019-07-05 百度在线网络技术(北京)有限公司 兴趣点的标注方法以及装置
CN106446960B (zh) * 2016-10-10 2019-05-21 太原理工大学 一种密度聚类划分时间段的动态热度路网构建方法
CN106446960A (zh) * 2016-10-10 2017-02-22 太原理工大学 一种密度聚类划分时间段的动态热度路网构建方法
CN106991525A (zh) * 2017-03-22 2017-07-28 浙江工商大学 基于大数据驱动的空气质量与居民出行可视分析方法与系统
US10846314B2 (en) 2017-12-27 2020-11-24 ANI Technologies Private Limited Method and system for location clustering for transportation services
CN108427965B (zh) * 2018-03-05 2022-08-23 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
US11468536B2 (en) 2018-05-18 2022-10-11 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending a personalized pick-up location
CN109472433A (zh) * 2018-05-31 2019-03-15 重庆大学 一种基于机动车电子标识数据的城市出行热点提取方法
CN109472433B (zh) * 2018-05-31 2021-11-09 重庆大学 一种基于机动车电子标识数据的城市出行热点提取方法
CN110556049A (zh) * 2018-06-04 2019-12-10 百度在线网络技术(北京)有限公司 一种地图数据处理方法、装置、服务器和存储介质
CN109145180A (zh) * 2018-06-27 2019-01-04 东华大学 一种基于增量聚类的企业热点事件挖掘方法
CN109145180B (zh) * 2018-06-27 2021-07-20 东华大学 一种基于增量聚类的企业热点事件挖掘方法
CN109254861B (zh) * 2018-09-17 2021-10-29 江苏智通交通科技有限公司 基于轨迹数据的od需求提取及其可靠性分析方法
CN109254861A (zh) * 2018-09-17 2019-01-22 江苏智通交通科技有限公司 基于轨迹数据的od需求提取及其可靠性分析方法
CN111351499A (zh) * 2018-12-24 2020-06-30 北京嘀嘀无限科技发展有限公司 路径识别方法、装置、计算机设备和计算机可读存储介质
CN111380541A (zh) * 2018-12-29 2020-07-07 沈阳美行科技有限公司 兴趣点确定方法、装置、计算机设备和存储介质
CN110390144B (zh) * 2019-07-02 2023-10-10 北京建筑大学 导向标识布设信息的确定方法、装置、设备及存储介质
CN110390144A (zh) * 2019-07-02 2019-10-29 北京建筑大学 导向标识布设信息的确定方法、装置、设备及存储介质
CN110689804A (zh) * 2019-10-10 2020-01-14 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN110866559A (zh) * 2019-11-14 2020-03-06 上海中信信息发展股份有限公司 一种家禽的行为分析方法及装置
CN111209457A (zh) * 2019-12-24 2020-05-29 中国科学院电子学研究所苏州研究院 一种目标典型活动模式偏离告警方法
CN113051410A (zh) * 2019-12-27 2021-06-29 南京理工大学 一种基于密度聚类的科研合作团体发现方法
CN111760290A (zh) * 2020-06-11 2020-10-13 网易(杭州)网络有限公司 一种信息处理方法、装置、计算机设备和存储介质
CN111760290B (zh) * 2020-06-11 2024-06-14 网易(杭州)网络有限公司 一种信息处理方法、装置、计算机设备和存储介质
CN112129315A (zh) * 2020-09-28 2020-12-25 北京百度网讯科技有限公司 用于推荐停车场的方法、装置、电子设备和存储介质
CN113775929A (zh) * 2021-09-28 2021-12-10 上海天麦能源科技有限公司 一种城市燃气管网布局区域划分方法
CN115855095A (zh) * 2022-12-01 2023-03-28 酷黑科技(北京)有限公司 一种自主导航方法、装置及电子设备
CN118195177A (zh) * 2024-05-16 2024-06-14 天津市城市规划设计研究总院有限公司 一种空间数据治理领域基于od数据的动态区域划分方法

Also Published As

Publication number Publication date
CN105825672B (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN105825672A (zh) 一种基于浮动车数据的城市指引区域提取方法
EP3457085B1 (en) Lane-centric road network model for navigation
US11062602B1 (en) Method and apparatus for recommending temporary parking
CN102788584B (zh) 道路坡度数据生成装置及生成方法、车辆用控制装置及车辆的能量消耗量预测装置
EP3452783B1 (en) Stitching mixed-version map tiles in hybrid navigation for partial map updates
Novaes et al. Solving continuous location–districting problems with Voronoi diagrams
CN110068343A (zh) 构建和更新多层道路网络高清数字地图的行为层
US11964669B2 (en) System, method, and computer program product for topological planning in autonomous driving using bounds representations
CN102052926B (zh) 减少燃料消耗和成本的方法
CN107490384B (zh) 一种基于城市路网的最优静态路径选择方法
CN103542858A (zh) 车辆到达目标能力评估方法,数据库生成方法、导航系统
US20200134054A1 (en) Method and apparatus for context based map data retrieval
EP3742123B1 (en) Bloom filter route encoding
CN103376119A (zh) 执行路网搜索的方法和用于估计车辆续航里程的系统
EP3742122B1 (en) Decoding bloom-encoded shortest path routes from known start and target
JP4141007B2 (ja) ナビゲーション装置
CN107527105B (zh) 一种拼车组单方法
CN104574966B (zh) 可变信息标识装置及可变信息标识方法
CN103748432B (zh) 图像处理装置、图像处理管理装置、终端、处理装置以及图像处理方法
JP2008191157A (ja) ナビゲーション装置
KR101254708B1 (ko) 복합 환승 경로 탐색 방법 및 그 방법에 대한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
KR20120092361A (ko) 개선된 경로 찾기 서비스 제공 방법 및 시스템
JP6180749B2 (ja) 探索結果生成システム、サーバ装置、端末装置、探索結果生成方法、および、プログラム
JP6165457B2 (ja) 探索結果生成システム、サーバ装置、端末装置、探索結果生成方法、および、プログラム
Debinska et al. The application of multimodal network for the modeling of movement in public transport

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190614