CN104240507B - 一种基于多视角融合的交通小区划分方法 - Google Patents

一种基于多视角融合的交通小区划分方法 Download PDF

Info

Publication number
CN104240507B
CN104240507B CN201410476845.8A CN201410476845A CN104240507B CN 104240507 B CN104240507 B CN 104240507B CN 201410476845 A CN201410476845 A CN 201410476845A CN 104240507 B CN104240507 B CN 104240507B
Authority
CN
China
Prior art keywords
data
bayonet socket
longitude
matrix
traffic zone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410476845.8A
Other languages
English (en)
Other versions
CN104240507A (zh
Inventor
李建元
陈涛
吴越
张书浆
王兴武
薛益赵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yinjiang Technology Co.,Ltd.
Original Assignee
Enjoyor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enjoyor Co Ltd filed Critical Enjoyor Co Ltd
Priority to CN201410476845.8A priority Critical patent/CN104240507B/zh
Publication of CN104240507A publication Critical patent/CN104240507A/zh
Application granted granted Critical
Publication of CN104240507B publication Critical patent/CN104240507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

一种基于多视角融合的交通小区划分方法,包括以下步骤:(1)读取浮动车数据,并进行数据预处理,整理浮动车数据,并在其中提取浮动车经纬度数据并存储为X1;(2)读取卡口数据,并进行数据预处理,提取卡口经纬度数据并存储为X2;(3)结合交通小区划分原则,采集自然约束信息,存储为X3;(4)计算约束矩阵,(5)基于可伸缩的约束谱聚类的聚类分析;(6)根据聚类结果,获得最终交通小区划分方案。本发明提供了一种融合多源数据,在定量化的影响因素的约束下进行聚类分析,全面地反映交通出行情况的基于多视角融合的交通小区划分方法。

Description

一种基于多视角融合的交通小区划分方法
技术领域
本发明属于智能交通领域,涉及一种交通小区划分方法。
背景技术
交通小区一般指具有一定交通关联度和交通相似程度的节点或连线的组合,将一个城市的交通网络覆盖区域划分为若干个交通小区,便于从中观层次上理解交通出行规律,从而有助于制定合理的交通管理措施。交通小区划分能够有效降低城市交通系统控制与管理的复杂性,并且能够直接影响到交通调查、分析、预测的工作量及精度和整个交通规划的成功。因此合适的交通小区划分方法具有重要的研究与应用意义。
目前已有的交通小区划分方法可以概括为以下几类:
1、基于聚类分析的交通小区划分方法。该类方法根据交通小区内的用地性质、土地利用以及出行情况等要素,运用系统聚类的方法,选取科学的指标,将性质相近的归为一类,从而实现交通小区划分。基于聚类分析的交通小区划分方法优点在于使交通调查、分析与预测的工作量和成本都大大减少,同时也能满足一定的精度要求。缺点是计算复杂,使得数据的统计工作量较大,且不同的方法产生的效果也有好坏之分。
2、面向控制的交通小区划分。该类方法主要是在交通路网拖布结构特点的分析基础上,采取动态划分与静态划分相结合的交通小区划分策略,已形成交通小区划分方法。其优点是充分考虑了交叉口之间的物理关联和交通流的路径关联,结合路网的拓补结构进行交通小区划分。缺点是对于交通小区影响因素分析上有缺陷。
3、基于区内出行比例的交通小区划分方法。该类方法以区内居民出行距离分布和出行比例为约束条件来确定交通小区半径。其优点是能够有效反映交通源的流向状况。不足之处是没有考虑到实际交通小区划分中行政区划、自然屏障等因素的影响。
4、扇形分割方法。该类方法以找出可以利用的城市道路节点,然后为每个节点划分扇形势力圈来完成交通小区划分。目前较少用到。
从现有的方法来看,主要集中于对单一来源的道路交通数据进行分析,然后采用人工的方式根据交通小区划分原则对分析结果进行修正,例如专利《基于空间聚类分析的城市路网交通小区动态划分方法》、专利《一种交通小区划分方法及装置》,以及文献《基于出租车GPS数据的南京市交通小区的划分》、《基于模糊聚类的交通小区划分方法研究》等。考虑到城市交通的复杂性和交通小区划分特点,单一来源的交通数据无法全面地反映交通小区的内在联系,人工方式对交通小区划分进行过多修正,会影响划分结果的客观性。如何利用多源数据,在多源数据的共同影响下来更加客观全面地反映交通出行情况,研究人员关注的较少;此外,将交通小区划分原则以数据形式进行量化,并在聚类分析中作为约束条件来制约区域划分,目前也还未有方法涉及。
发明内容
为了解决已有的基于聚类方法的交通小区划分技术的数据源单一、不能全面地反映交通出行情况的不足,本发明提供了一种融合多源数据,在定量化的影响因素的约束下进行聚类分析,全面地反映交通出行情况的基于多视角融合的交通小区划分方法。
本发明解决其技术问题所采用的技术方案是:
一种基于多视角融合的交通小区划分方法,包括以下步骤:
(1)读取浮动车数据,并进行数据预处理,步骤如下:
(1.1)读取浮动车数据,并判断浮动车数据中的经纬度数据是否为空值或者为0,如果是空值(null)或者为0,则删除该条数据;如果不是,则保留这条数据;
(1.2)判断浮动车数据的空载状态,0表示空车,1表示载客,保留车辆状态从0变化到1和车辆状态从1变化到0的数据,删除其他数据;
(1.3)判断浮动车载客状态持续时间,删除不正常载客时间的浮动车数据,所述不正常载客时间即超过预设时间阈值;
(1.4)完成数据预处理,整理浮动车数据,并在其中提取浮动车经纬度数据并存储为X1
(2)读取卡口数据,并进行数据预处理,主要步骤如下:
(2.1)判断卡口数据中是否有字段缺失,如果有,则删除该条数据;如果没有,则保留该条数据;
(2.2)判断卡口数据中的车牌信息,如果车牌信息为“0”或者仅为字符“车牌”,则删除该条数据;如果不是,则保留该条数据;
(2.3)筛选出所需要时间段之间的卡口数据;
(2.4)完成数据预处理,整理并存储卡口数据;
(2.5)提取卡口经纬度数据并存储为X2
(3)结合交通小区划分原则,采集自然约束信息,步骤如下:
(3.1)采集城市各个行政区域边界经纬度点;
(3.2)采集交通矛盾突出区域边界经纬度点;
(3.3)采集自然障碍物边界经纬度点;
(3.4)采集主干道两侧区域经纬度点;
(3.5)采集预设所需划分区域边界的经纬度点。
(3.6)整理步骤(3.1)~步骤(3.5)采集的点的经纬度数据并存储为X3
(4)计算约束矩阵,过程如下:
(4.1)读取步骤(2.4)整理的卡口数据,寻找每辆车的行驶轨迹;
(4.2)记录每辆车行驶轨迹中经过的两两卡口组合;
(4.3)计算两两卡口间通过相同车辆次数,并生成一个m×m的卡口关联矩阵。其中m为卡口数量;
(4.4)根据步骤(3)中采集的自然约束信息点个数,结合步骤(4.3)中计算得到的卡口关联矩阵,生成一个(m+n)×(m+n)的约束矩阵Q,并将自然约束信息点所代表的值取为-1,其中m为卡口数量,n为采集的自然约束信息点个数;
(4.5)整理并存储约束矩阵;
(5)基于可伸缩的约束谱聚类的聚类分析,步骤如下:
(5.1)输入待聚类数据集X∈Rd×n,其中R表示实数,d表示数据集X的维度,n表示数据集X包含数据个数。X={X1,X2,X3},包括步骤(1.4)中整理的浮动车经纬度数据集X1,步骤(2.5)中整理的卡口经纬度数据集X2,以及步骤(3.5)中整理的自然约束点经纬度数据集X3,基向量个数p,步骤(4.4)中得到的约束矩阵Q,参数β,以及期望聚类类簇数k;
(5.2)从待聚类数据集X中选择p个向量作为基向量,并形成基向量矩阵U∈Rd×p
(5.3)对待聚类数据集X进行稀疏编码,得到稀疏矩阵Z∈Rp×n,Z的计算公式为:
Z ij = K σ ( x j , u i ) Σ i ∈ rNB ( j ) K σ ( x j , u i ) ,
然后计算其中xj,ui分别表示矩阵X和U中第j个和第i个向量,Kσ(.,.)为高斯核函数,i∈rNB(j)表示基向量ui是xj中r个最近的基向量,Dii=ΣjZij
(5.4)计算矩阵 S ^ = Z ^ Z ^ T , 以及矩阵 Q ^ = Z ^ Q Z ^ T ;
(5.5)利用求最大特征值γmax
(5.6)如果β≥γmax,则返回{v*}=φ;如果β<γmax,则进行后续计算。利用公式求得所有的特征向量{ui},其中ui表示第i个特征向量,并且1≤i≤p;
(5.7)找到{ui}中为正的特征值,以及对应的特征向量{ui}+
(5.8)将特征向量集{ui}+中的每个特征向量ui乘以以进行归一化;
(5.9)去除特征向量集{ui}+中与不正交的向量;
(5.10)在特征向量集{ui}+中寻找m个能使ui TAui最小的特征向量,其中m=min{k-1,|{ui}+},并将它们存入矩阵V中;
(5.11)计算 V ( r ) = Z ^ T V ( I - V T AV ) ;
(5.12)归一化矩阵V(r)的行,然后导入到k-means聚类算法中进行聚类;
(5.13)得到聚类结果;
(6)根据聚类结果,获得最终交通小区划分方案。
进一步,所述步骤(6)中,包括以下过程:
(6.1)对部分浮动车聚类结果进行小幅修正,小幅修正包括:对两个或多个相邻类簇进行合并,将其划入同一个交通小区内;
(6.2)划分交通小区,并命名该交通小区,完成对交通小区的划分。
本发明的技术构思为:通过计算先后通过成对卡口车辆数来量化卡口之间的关联度,关联度高的卡口在空间上一般邻近,以此来约束浮动车GPS数据的聚类分析,使得聚类结果能够更加准确地反映同一交通小区内部关联性。
通过对城市地理环境、行政区划、交通复杂区域进行量化采样,并以此来约束浮动车GPS数据的聚类分析,使得聚类结果能够遵循交通小区划分原则,减少后续的人工修正工作,也使得本发明方法适用性更广。
相比其他的聚类方法,该方法具有很强的伸缩性,能够用于大数据的计算,同时也具有更好的聚类效果。
本发明的有益效果主要表现在:融合多源数据,在定量化的影响因素的约束下进行聚类分析,全面地反映交通出行情况。
附图说明
图1是本发明的总体流程图。
图2是本发明浮动车数据预处理流程图和预处理后结果的局部示意图,其中图2(a)是本发明浮动车数据预处理流程图,图2(b)是本发明实施例中实际浮动车数据经步骤(1.2)处理后结果的局部示意图。
图3是本发明卡口数据预处理流程图。
图4是本发明实施例中计算约束矩阵过程中产生结果的局部示意图。其中图4(a)是本发明实施例实际卡口数据中经步骤(4.3)计算得到的卡口关联矩阵局部示意图,图4(b)是本发明实施例中经步骤(4.4)计算得到的约束矩阵结果的局部示意图
图5是可伸缩谱聚类方法流程图。
图6是杭州市路网分布示意图。
图7是本发明将聚类结果显示到arcmap中,在主要类簇的基础上划分交通小区示意图。
图8是本发明对杭州各个交通小区进行命名的示意图。
图9是本发明方法与DBSCAN聚类算法效果对比图,其中图9(a)是本发明方法聚类效果图,图9(b)是DBSCAN算法聚类效果图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图9,一种基于多视角融合的交通小区划分方法,包括以下步骤:
(1)读取浮动车数据,并进行数据预处理,步骤如下:
(1.1)读取浮动车数据,并判断浮动车数据中的经纬度数据是否为空值(null)或者为0。如果是空值(null)或者为0,则删除该条数据;如果不是,则保留这条数据。
(1.2)判断浮动车数据的空载(0表示空车,1表示载客)状态,保留车辆状态从0变化到1和车辆状态从1变化到0的数据,其他数据为车辆状态错误的数据,删除车辆状态错误的数据。
(1.3)判断浮动车载客状态持续时间,删除不正常载客时间的浮动车数据(如载客超过5小时)。
(1.4)完成数据预处理,整理浮动车数据,并在其中提取浮动车经纬度数据并存储为X1,以用作后面步骤使用。
(2)读取卡口数据,并进行数据预处理。主要步骤如下:
(2.1)判断卡口数据中是否有字段缺失。如果有,则删除该条数据;如果没有,则保留该条数据。
(2.2)判断卡口数据中的车牌信息,如果车牌信息为“0”或者仅为字符“车牌”,则删除该条数据;如果不是,则保留该条数据。
(2.3)筛选出所需要时间段之间的卡口数据。
(2.4)完成数据预处理,整理并存储卡口数据。
(2.5)提取卡口经纬度数据并存储为X2,以用作后面步骤使用。
(3)结合交通小区划分原则,采集自然约束信息。主要步骤如下:
(3.1)采集城市各个行政区域边界经纬度点。
(3.2)采集交通矛盾突出区域边界经纬度点,所述交通矛盾突出区域包括商业中心区域、客运中心区域、密集住宅区等。
(3.3)采集自然障碍物边界经纬度点,所述自然障碍物包括城市的主要河流,铁道等构造物或天然分隔带。
(3.4)根据交通小区划分原则,主干道两侧区域尽可能划分到一个交通小区,因此需要采集主干道两侧区域经纬度点。
(3.5)结合城市实际情况,采集所需划分区域边界的经纬度点。
(3.6)整理步骤(3.1)~步骤(3.5)采集的点的经纬度数据并存储为X3,以用作后面步骤使用。
(4)计算约束矩阵。主要过程如下:
(4.1)读取步骤(2.4)整理的卡口数据,寻找每辆车的行驶轨迹。例如对于车辆①,寻找到其行驶轨迹为卡口A→卡口C→卡口B→卡口D,对于车辆②,寻找到其行驶轨迹为卡口A→卡口B→卡口D→卡口B。
(4.2)记录每辆车行驶轨迹中经过的两两卡口组合。例如对于步骤(4.1)中的车辆①,记录其经过的两两卡口组合分别为:AC、AB、AD、CB、CD、BD;对于步骤(4.1)中的车辆②,记录其经过的两两卡口组合分别为:AB、AD、BD、DB。
(4.3)计算两两卡口间通过相同车辆次数,并生成一个m×m的卡口关联矩阵。其中m为卡口数量。例如对于步骤(4.1)中的卡口A、卡口B、卡口C、卡口D,可以对应为一个4×4关联矩阵,其形式和对应的值为:
(4.4)根据步骤(3)中采集的自然约束信息点个数,结合步骤(4.3)计算得到的卡口关联矩阵,生成一个(m+n)×(m+n)的约束矩阵Q,并将自然约束信息点所代表的值取为-1。其中其中m为卡口数量,n为采集的自然约束信息点个数。例如对步骤(4.3)例子中的卡口管理矩阵增加两个自然约束信息点,生成一个6×6的矩阵,其形式和对应的值为:
(4.5)整理并存储约束矩阵,以用作后面步骤使用。
(5)基于可伸缩的约束谱聚类的聚类分析,主要步骤如下:
(5.1)输入待聚类数据集X∈Rd×n(X={X1,X2,X3},包括步骤(1.4)中整理的浮动车经纬度数据集X1,步骤(2.5)中整理的卡口经纬度数据集X2,以及步骤(3.5)中整理的自然约束点经纬度数据集X3),基向量个数p,步骤(4.4)中得到的约束矩阵Q,参数β,以及期望聚类类簇数k。
(5.2)从待聚类数据集X中选择p个向量作为基向量,并形成基向量矩阵U∈Rd×p
(5.3)对待聚类数据集X进行稀疏编码,得到稀疏矩阵Z∈Rp×n。Z的计算公式为:
Z ij = K σ ( x j , u i ) Σ i ∈ rNB ( j ) K σ ( x j , u i ) ,
然后计算其中xj,ui分别表示矩阵X和U中第j个和第i个向量,Kσ(.,.)为高斯核函数,i∈rNB(j)表示基向量ui是xj中r个最近的基向量,Dii=ΣjZij
(5.4)计算矩阵 S ^ = Z ^ Z ^ T , 以及矩阵 Q ^ = Z ^ Q Z ^ T .
(5.5)利用求最大特征值γmax
(5.6)如果β≥γmax,则返回{v*}=φ;如果β<γmax,则进行后续计算。利用公式求得所有的特征向量{ui},其中ui表示第i个特征向量,并且1≤i≤p。
(5.7)找到{ui}中为正的特征值,以及对应的特征向量{ui}+
(5.8)将特征向量集{ui}+中的每个特征向量ui乘以以进行归一化。
(5.9)去除特征向量集{ui}+中与不正交的向量。
(5.10)在特征向量集{ui}+中寻找m个能使ui TAui最小的特征向量,其中m=min{k-1,|{ui}+},并将它们存入矩阵V中。
(5.11)计算 V ( r ) = Z ^ T V ( I - V T AV ) .
(5.12)归一化矩阵V(r)的行,然后导入到k-means聚类算法中进行聚类。
(5.13)得到聚类结果。
(6)获得最终交通小区划分方案,主要步骤如下:
(6.1)结合交通小区划分原则与城市实际情况,对部分浮动车聚类结果进行小幅修正。小幅修正包括:根据当地城市实际情况和需求,对两个或多个相邻类簇进行合并,将其划入同一个交通小区内。
(6.2)划分交通小区,并命名该交通小区。
至此,完成对交通小区的划分。
本实施例以杭州2013年6月1号早晚高峰的浮动车数据,以及2013年6月1号——2013年6月7号的卡口数据为例。
一种基于多视角融合的交通小区划分方法,其总体流程如附图1所示,包括如下步骤:
(1)读取浮动车数据,并进行数据预处理。数据预处理的步骤如附图2(a)所示,主要包括:
(1.1)读取浮动车数据,并判断浮动车数据中的经纬度数据是否为空值或者为0,如果不是,则保留这条数据,否则删除该条数据。
(1.2)判断浮动车数据的空载状态,如果是连续的0,1状态,则保留这些数据,如果出现0,0状态或者1,1状态,则删除这些数据。本步骤数据处理后部分结果如附图2(b)所示。附图2(b)中,第一列表示日期,第二列表示浮动车编号,从第三列开始每4列为一个单位,分别表示时间、状态(0表示空车,1表示载客)、该状态发生的经度、该状态发生的纬度。
(1.3)在处理后的数据中提取某天浮动车数据的经纬度数据并存储为X1,在本实施例中,共计获得65345条浮动车经纬度数据。
(2)读取卡口数据,并进行数据预处理。数据预处理的步骤如附图3所示,主要包括:
(2.1)判断卡口数据中是否有字段缺失。如果有,则删除该条数据;如果没有,则保留该条数据。
(2.2)判断卡口数据中的车牌信息,如果车牌信息为“0”或者仅为字符“车牌”,则删除该条数据;如果不是,则保留该条数据。
(2.3)筛选出所需要时间段之间的卡口数据。
(2.4)完成数据预处理,整理并存储卡口数据。
(2.5)提取卡口经纬度数据并存储为X2,以用作后面步骤使用。
在本实施例中,共计获得709个有效卡口数据。
(3)结合交通小区划分原则,采集自然约束信息。主要步骤如下:
(3.1)采集城市各个行政区域边界经纬度点。
(3.2)采集交通矛盾突出区域边界经纬度点,如商业中心区域、客运中心区域、密集住宅区等。
(3.3)采集自然障碍物边界经纬度点,如主要河流,铁道等构造物或天然分隔带。
(3.4)根据交通小区划分原则,主干道两侧区域尽可能划分到一个交通小区,因此需要采集主干道两侧区域经纬度点。
(3.5)结合城市实际情况,采集所需划分区域边界的经纬度点。
(3.6)整理步骤(3.1)~步骤(3.5)采集的点的经纬度数据并存储为X3,以用作后面步骤使用。
在本实施例中,共采集455个自然约束信息点。主要包括杭州钱塘江、运河沿岸,武林商圈周边,以及杭州城站火车站周边。
(4)计算约束矩阵。主要过程如下:
(4.1)读取步骤(2.4)整理的卡口数据,寻找每辆车的行驶轨迹。
(4.2)记录每辆车行驶轨迹中经过的两两卡口组合。
(4.3)计算两两卡口间通过相同车辆次数,并生成一个709×709的卡口关联矩阵。其中709为本实施例中卡口数量。在本实施例中,前6个卡口两两之间通过相同车辆次数如附图4(a)所示。
(4.4)根据步骤(3)中采集的自然约束信息点个数,结合步骤(4.3)中计算得到的卡口关联矩阵,生成一个1164×1164的约束矩阵Q,并将自然约束信息点所代表的值取为-1。约束矩阵部分元素如附图4(b)所示。
(5)基于可伸缩的约束谱聚类算法的聚类分析。计算过程如附图5所示,主要步骤如下:
(5.1)输入待聚类数据集X∈Rd×n(X={X1,X2,X3},包括步骤(1.4)中整理的浮动车经纬度数据集X1,步骤(2.5)中整理的卡口经纬度数据集X2,以及步骤(3.5)中整理的自然约束点经纬度数据集X3,在本实施例中,d=2,n=66504),基向量个数p,步骤(4.4)中得到的约束矩阵Q,参数β,以及期望聚类类簇数k。在本实施例中,取基向量个数p=1164,参数β=0.005,期望聚类类簇数k=30。
(5.2)从待聚类数据集X中选择p个向量作为基向量,并形成基向量矩阵U∈Rd×p
(5.3)对待聚类数据集X进行稀疏编码,得到稀疏矩阵Z∈Rp×n。Z的计算公式为:
Z ij = K σ ( x j , u i ) Σ i ∈ rNB ( j ) K σ ( x j , u i ) ,
然后计算其中xj,ui分别表示矩阵X和U中第j个和第i个向量,Kσ(.,.)为高斯核函数,i∈rNB(j)表示基向量ui是xj中r个最近的基向量,Dii=ΣjZij
(5.4)计算矩阵 S ^ = Z ^ Z ^ T , 以及矩阵 Q ^ = Z ^ Q Z ^ T .
(5.5)利用求最大特征值γmax
(5.6)如果β≥γmax,则返回{v*}=φ;如果β<γmax,则进行后续计算。利用公式求得所有的特征向量{ui},其中ui表示第i个特征向量,并且1≤i≤p。
(5.7)找到{ui}中为正特征值,以及对应的特征向量{ui}+
(5.8)将特征向量集{ui}+中的每个特征向量ui乘以以进行归一化。
(5.9)去除特征向量集{ui}+中与不正交的向量
(5.10)在特征向量集{ui}+中寻找m个能使ui TAui最小的特征向量,其中m=min{k-1,|{ui}+},并将它们存入矩阵V中。
(5.11)计算 V ( r ) = Z ^ T V ( I - V T AV ) .
(5.12)归一化矩阵V(r)的行,然后导入到k-means聚类算法中进行聚类。
(5.13)得到聚类结果。
(6)获得最终交通小区划分方案,主要步骤如下:
(6.1)杭州市路网分布示意图如附图6所示,结合交通小区划分原则与城市实际情况,对部分浮动车聚类结果进行小幅修正并进行划分。小幅修正包括:根据当地城市实际情况和需求,对两个或多个相邻类簇进行合并,将其划入同一个交通小区内。在本实施例中,只考虑杭州市主城区的交通小区划分,按照杭州市实际情况进行小幅修正,并形成最终划分结果。划分效果如附图7所示。
(6.2)划分交通小区,并命名各个交通小区。如附图8所示。
至此,完成对本实施例中城市的交通小区划分。
在本实施例中66509条数据,本发明所采用技术方案与DBSCAN聚类算法在运行时间和效果的对比如下表1:
表1
从表1中可以看出,本发明所采用的的可伸缩聚类方法不仅在运行时间上要比DBSCAN聚类方法快,同时在效果上也要优于DBSCAN。如附图9(a)所示,聚类结果基本遵循“交通矛盾突出区域,交通区划分小一些,反之则划分大一些”这一原则,并且小区大小比较均衡,符合习惯。DBSCAN聚类方法虽然能够去除“噪声”,将郊区与主城区明显划分,给交通小区划分带来一定便利,但是主城区未能被进一步有效划分,如附图9(b)中多边形画出区域所示。这是因为DBSCAN是一种基于密度的聚类算法,由于主要城区交通活动密度比较均匀,导致DBSCAN聚类效果较差,不能完全满足交通小区划分需求。

Claims (2)

1.一种基于多视角融合的交通小区划分方法,其特征在于:包括以下步骤:
(1)读取浮动车数据,并进行数据预处理,步骤如下:
(1.1)读取浮动车数据,并判断浮动车数据中的经纬度数据是否为空值或者为0,如果是空值(null)或者为0,则删除该条数据;如果不是,则保留这条数据;
(1.2)判断浮动车数据的空载状态,0表示空车,1表示载客,保留车辆状态从0变化到1和车辆状态从1变化到0的数据,删除其他数据;
(1.3)判断浮动车载客状态持续时间,删除不正常载客时间的浮动车数据,所述不正常载客时间即超过预设时间阈值;
(1.4)完成数据预处理,整理浮动车数据,并在其中提取浮动车经纬度数据并存储为X1
(2)读取卡口数据,并进行数据预处理,步骤如下:
(2.1)判断卡口数据中是否有字段缺失,如果有,则删除该条数据;如果没有,则保留该条数据;
(2.2)判断卡口数据中的车牌信息,如果车牌信息为“0”或者仅为字符“车牌”,则删除该条数据;如果不是,则保留该条数据;
(2.3)筛选出所需要时间段之间的卡口数据;
(2.4)完成数据预处理,整理并存储卡口数据;
(2.5)提取卡口经纬度数据并存储为X2
(3)结合交通小区划分原则,采集自然约束信息,步骤如下:
(3.1)采集城市各个行政区域边界经纬度点;
(3.2)采集交通矛盾突出区域边界经纬度点;
(3.3)采集自然障碍物边界经纬度点;
(3.4)采集主干道两侧区域经纬度点;
(3.5)采集预设所需划分区域边界的经纬度点;
(3.6)整理步骤(3.1)~步骤(3.5)采集的点的经纬度数据并存储为X3
(4)计算约束矩阵,过程如下:
(4.1)读取步骤(2.4)整理的卡口数据,寻找每辆车的行驶轨迹;
(4.2)记录每辆车行驶轨迹中经过的两两卡口组合;
(4.3)计算两两卡口间通过相同车辆次数,并生成一个m×m的卡口关联矩阵,其中m为卡口数量;
(4.4)根据步骤(3)中采集的自然约束信息点个数,结合步骤(4.3)中计算得到的卡口关联矩阵,生成一个(m+n)×(m+n)的约束矩阵Q,并将自然约束信息点所代表的值取为-1,其中m为卡口数量,n为采集的自然约束信息点个数;
(4.5)整理并存储约束矩阵;
(5)基于可伸缩的约束谱聚类的聚类分析,步骤如下:
(5.1)输入待聚类数据集X∈Rd×n,其中R表示实数,d表示数据集X的维度,n表示数据集X包含数据个数,X={X1,X2,X3},包括步骤(1.4)中整理的浮动车经纬度数据集X1,步骤(2.5)中整理的卡口经纬度数据集X2,以及步骤(3.6)中整理的自然约束点经纬度数据集X3,基向量个数p,步骤(4.4)中得到的约束矩阵Q,参数β,以及期望聚类类簇数k;
(5.2)从待聚类数据集X中选择p个向量作为基向量,并形成基向量矩阵U∈Rd×p
(5.3)对待聚类数据集X进行稀疏编码,得到稀疏矩阵Z∈Rp×n,Z的计算公式为:
Z i j = K σ ( x j , u i ) Σ i ∈ r N B ( j ) K σ ( x j , u i ) ,
然后计算其中xj,ui分别表示待聚类数据集X和基向量矩阵U中第j个和第i个向量,Kσ(·,·)为高斯核函数,i∈rNB(j)表示基向量ui是xj中r个最近的基向量,Dii=∑jZij
(5.4)计算矩阵以及矩阵
(5.5)利用求最大特征值γmax
(5.6)如果β≥γmax,则返回{v*}=φ;如果β<γmax,则进行后续计算,利用公式求得所有的特征向量{ui},其中ui表示第i个特征向量,并且1≤i≤p;
(5.7)找到{ui}中为正的特征值,以及对应的特征向量{ui}+
(5.8)将特征向量集{ui}+中的每个特征向量ui乘以以进行归一化;
(5.9)去除特征向量集{ui}+中与不正交的向量;
(5.10)在特征向量集{ui}+中寻找m个能使ui TAui最小的特征向量,其中m=min{k-1,|{ui}+},并将它们存入矩阵V中;
(5.11)计算
(5.12)归一化矩阵V(r)的行,然后导入到k-means聚类算法中进行聚类;
(5.13)得到聚类结果;
(6)根据聚类结果,获得最终交通小区划分方案。
2.如权利要求1所述的一种基于多视角融合的交通小区划分方法,其特征在于:所述步骤(6)中,包括以下过程:
(6.1)对部分浮动车聚类结果进行小幅修正,小幅修正包括:对两个或多个相邻类簇进行合并,将其划入同一个交通小区内;
(6.2)划分交通小区,并命名该交通小区,完成对交通小区的划分。
CN201410476845.8A 2014-09-18 2014-09-18 一种基于多视角融合的交通小区划分方法 Active CN104240507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410476845.8A CN104240507B (zh) 2014-09-18 2014-09-18 一种基于多视角融合的交通小区划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410476845.8A CN104240507B (zh) 2014-09-18 2014-09-18 一种基于多视角融合的交通小区划分方法

Publications (2)

Publication Number Publication Date
CN104240507A CN104240507A (zh) 2014-12-24
CN104240507B true CN104240507B (zh) 2016-08-24

Family

ID=52228494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410476845.8A Active CN104240507B (zh) 2014-09-18 2014-09-18 一种基于多视角融合的交通小区划分方法

Country Status (1)

Country Link
CN (1) CN104240507B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537830B (zh) * 2014-12-29 2016-09-28 上海电科智能系统股份有限公司 一种基于出行热点路网影响评估的交通指数区域划分方法
CN105513370B (zh) * 2015-12-29 2017-11-24 浙江大学 基于稀疏车牌识别数据挖掘的交通小区划分方法
CN105912598A (zh) * 2016-04-05 2016-08-31 中国农业大学 一种确定城市街道占道经营高发区域的方法及系统
CN107798865B (zh) * 2016-09-07 2020-11-03 阿里巴巴(中国)有限公司 一种公交线路行驶时间预估方法及装置
CN107808518B (zh) * 2017-10-26 2020-02-18 东南大学 一种基于多路谱聚类理论的交通小区划分方法
CN108648454A (zh) * 2018-05-18 2018-10-12 中山大学 一种基于出行数据的交通小区动态划分方法
CN109508734B (zh) * 2018-10-26 2022-03-11 北京交通大学 基于谱聚类的路网能力瓶颈识别方法
CN110232398A (zh) * 2019-04-24 2019-09-13 广东交通职业技术学院 一种基于Canopy+Kmeans聚类的路网子区划分及其评估方法
CN110555544B (zh) * 2019-07-16 2022-04-08 广东工业大学 一种基于gps导航数据的交通需求估计方法
CN113706875B (zh) * 2021-10-29 2022-03-18 深圳市城市交通规划设计研究中心股份有限公司 一种道路功能研判方法
CN115942246B (zh) * 2023-03-10 2023-05-12 成都睿的欧科技有限公司 基于lte无线信号小区的地铁车辆精细化定位方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7026958B2 (en) * 2003-11-07 2006-04-11 The Boeing Company Method and system of utilizing satellites to transmit traffic congestion information to vehicles
US7246007B2 (en) * 2004-03-24 2007-07-17 General Motors Corporation System and method of communicating traffic information
CN101216858B (zh) * 2008-01-14 2011-12-07 浙江大学 分割式相似度传播数据聚类方法
CN101571997A (zh) * 2009-05-31 2009-11-04 上海宝康电子控制工程有限公司 多源交通信息融合处理方法及其装置
CN103544841B (zh) * 2013-10-22 2015-10-21 银江股份有限公司 交通控制区域动态划分方法
CN103839409B (zh) * 2014-02-27 2015-09-09 南京大学 基于多断面视觉传感聚类分析的交通流状态判别方法

Also Published As

Publication number Publication date
CN104240507A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN104240507B (zh) 一种基于多视角融合的交通小区划分方法
Rediske et al. Multi-criteria decision-making model for assessment of large photovoltaic farms in Brazil
Zhu et al. Flood disaster risk assessment based on random forest algorithm
CN113642849B (zh) 考虑空间分布特征的地质灾害危险性综合评价方法及装置
CN106780089B (zh) 基于神经网络元胞自动机模型的永久性基本农田划定方法
CN110852532A (zh) 一种自然保护地体系整合及边界划定方法
CN109146204A (zh) 一种多层次综合评估的风电场升压站自动选址方法
CN112990976B (zh) 基于开源数据挖掘的商业网点选址方法、系统、设备及介质
CN106446281B (zh) 一种结合陆域因素和水体因素进行流域四级分区的方法
CN110781267A (zh) 一种基于地理国情的多尺度空间分析评价方法及系统
CN107330422A (zh) 一种基于高精度数字高程模型对半干旱地区进行微地形分类的方法
Mahmoud et al. Spatiotemporal variation analysis of urban land expansion in the establishment of new communities in Upper Egypt: A case study of New Asyut city
CN104200387A (zh) 一种顾及地理实体语义相似度的土地用途分区方法
CN104269057A (zh) 一种基于浮动车od数据的卡口传感器部署方法
CN107766825A (zh) 基于空间功能单元的陆域省市县空间规划三区识别方法
Zhang et al. Using street view images to identify road noise barriers with ensemble classification model and geospatial analysis
CN116911055A (zh) 一种基于数字孪生的智慧城市规划治理系统
Liu RETRACTED ARTICLE: Application of remote sensing and GIS technology in urban ecological environment investigation
Lin et al. Slope unit-based genetic landform mapping on Tibetan plateau-a terrain unit-based framework for large spatial scale landform classification
Liu et al. An integrated method used to value recreation land–a case study of Sweden
Foroutan et al. Semiautomatic morphometric land surface segmentation of an arid mountainous area using DEM and self-organizing maps
Bobrowski et al. Using spatial elimination and ranking methods in the renewable energy investment parcel search process
Gao et al. Integrating multi-source geographic big data to delineate urban growth boundary: A case study of Changsha
CN116644809B (zh) 一种集成地理大数据和机器学习的城镇开发边界划定方法
CN117235556B (zh) 一种面向交通管理者的多模式交通复合网络构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 310012 floor 1, building 1, No. 223, Yile Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: Yinjiang Technology Co.,Ltd.

Address before: 310012 floor 1, building 1, No. 223, Yile Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee before: ENJOYOR Co.,Ltd.

CP01 Change in the name or title of a patent holder