CN114495484A - 基于多源数据层次图聚类算法的公交站点位置推荐方法 - Google Patents
基于多源数据层次图聚类算法的公交站点位置推荐方法 Download PDFInfo
- Publication number
- CN114495484A CN114495484A CN202111549811.3A CN202111549811A CN114495484A CN 114495484 A CN114495484 A CN 114495484A CN 202111549811 A CN202111549811 A CN 202111549811A CN 114495484 A CN114495484 A CN 114495484A
- Authority
- CN
- China
- Prior art keywords
- node
- interest
- urban
- bus
- clustering algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000010586 diagram Methods 0.000 claims abstract description 18
- 230000000694 effects Effects 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000002955 isolation Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 2
- 238000003379 elimination reaction Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 description 8
- 238000005065 mining Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000005484 gravity Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0133—Traffic data processing for classifying traffic situation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于多源数据层次图聚类算法的公交站点位置推荐方法,本发明首先利用城市兴趣点(POI)信息和出租车客流需求记录,生成城市POI吸引力图网络;然后根据生成的城市地点吸引力图网络,通过层次图聚类方法,提取具有步行规模约束、高人流密度的兴趣区域(WROI);最后将具有步行规模约束、高人流密度的兴趣区域与公交网络图对比,为空白服务区域推荐公交站点位置安排。本发明可以优化当前公交网络中低效能、客流密度低的公交站点,还可以对空白服务城市区域推荐新站点位置安排,并根据城市功能给出预判的公交客流规律和密度。
Description
技术领域
本发明涉及公交站点位置选择优化领域,具体提供了一种基于多源数据层次图聚类算法的公交站点位置推荐方法。
背景技术
公交网络的优化与发展对现代城市交通至关重要,由于其灵活性高、易部署、绿色环保等特点,目前是城市出行的主要模式之一。但目前公交出行分担率却在不断下降,其中阻碍居民选择公交出行的主要原因包含(1)由于城市发展速度快,发展中的新区域公交服务配置不及时,导致出发步行区域内没有合适公交站点可供出行;(2)公交站点安排不均衡,部分区域客流密度过大导致公交客舱拥挤,体验不佳。因此,对当前公交网络站点位置的合理优化和空白服务区域公交新站点位置的及时推荐,是提高公交吸引力的重要方法。其进而还可以帮助减少交通拥堵,构建合理的城市立体交通网络,助力绿色出行发展。
目前,大部分公交车站点安排主要依靠空白服务区域人员申请和专业人员调查来了解居民出行需求。虽然这种方法被证明是可行的,但调查过程中花费的时间和成本是相当大的。近几年,普适传感、通信和大数据计算可以实时低成本的感知城市脉动,为城市规划带来新方法和应用。例如,现在很多城市的出租车都配备了GPS设备,可以收集乘客上下车的位置和行程的线路选择信息,等等。利用这些私人交通信息数据,可以获取乘客在城市中随时间变化的移动模式。在与公交出行分布的对比下,有可能通过挖掘私人交通出行的热点地区来确定公交服务空白区域,从而进行有效优化和新站点位置推荐,将尽可能多的人从私人交通转换为公共交通。
现有的利用城市出行大数据进行城市交通规划的方法工作,主要基于聚类方法挖掘城市中具有高人口流动密度的热点/兴趣地区,称之为ROI,然后对目标网络的缺陷地区定位,从而进行优化。但目前的相关工作有两方面主要缺陷。(1)由于公交站的服务范围通常是具有高人流密度的城市步行大小区域,但基于密度的聚类方法,如DBSCAN、K-means聚类,在寻找适合作为公交服务区域的ROI时,在保持高活动/高密度和ROI大小的平衡方面存在局限,这导致挖掘的ROI无法控制聚类大小,经常需要切割操作,既不能精确推荐公交服务区域,又不能保障客流密度;2)由于公交站点设置遵循时空需求响应原则,即一区域内的乘客OD流在时间和起点-终点上具有一定的集中性才适合设置公交站,单纯利用出租客流的聚类挖掘出的ROI会集中在道路上,不能确定服务覆盖区域并获取随时间变化的乘客出行流动模式,对推荐公交站点的位置准确性和客流预判都有很大的影响。因此,对于利用多源数据挖掘城市中有大小限制的兴趣区域(ROI),并准确揭示这些ROI中人口流动模式与城市区域功能(办公、住宅、商业等)的关系,对确定公交服务缺陷区域和优化推荐公交站点位置安排具有重要意义。
发明内容
为增加公交系统的吸引力,解决公交站点位置的优化推荐问题,本发明提供了一种基于多源数据层次图聚类算法的公交站点位置推荐方法。针对公交站点的设置特点,本发明首先使用出租车客流数据的基于层次图的聚类方法(Hierarchical Graph-basedClustering Algorithm-HGCA),挖掘城市内具有步行范围限制的兴趣区域(WalkableRegion of Interest-WROI)。该方法可以自动发现具有步行大小限制,且具有高集中人流密度的WROI,并可同时捕捉到WROI中人口时空流动模式。实现有效挖掘适合公交服务范围的城市兴趣区域,精准确定公共交通网络中的服务空白区域,并根据服务区域内的出行模式对公交客流密度进行预判,对当前网络中的站点位置优化,最终对公交新路线站点位置进行推荐。
本发明解决其技术问题所采用的技术方案是:
本发明提供了一种基于多源数据层次图聚类算法的公交站点位置推荐方法,其包括如下步骤:
1)利用城市兴趣点(Point of Interest-POI)信息和出租车客流需求记录,生成城市POI吸引力图网络;
所述的城市POI吸引力图网络以城市兴趣点作为图中节点,利用每个城市兴趣点周围出租车上下客密度获取节点访问强度作为节点特征;为表示节点之间相关性,设计构建一个层次化的边图,将邻居节点根据地理隔离分为直接邻居和间接邻居,边图的邻接矩阵是通过考虑社会功能和访问人气上的相似性,确定的两种类型邻居(直接和间接)的边缘权重。
2)根据公交站点通常服务区域为步行范围大小,且区域内人流密度高,在时间、起点-终点具有一定集中性的特征,利用层次图聚类算法通过选择相似且活跃的节点,结合边缘权重和地理距离约束,提取具有步行规模约束、高人流密度的适合作为公交服务区域的城市兴趣区域(Walkable Region of Interest-WROI);
3)将具有步行规模约束、高人流密度的兴趣区域与公交网络图对比,过滤掉聚类结果中已有公交站的,人流在时间和空间上不集中的WROI,精准推荐可以安排公交站点的空白服务区域。
作为本发明的优选方案,所述的节点访问强度通过节点空间吸引力和节点时间吸引力估计得到;其中,节点空间吸引力表示为节点pi对各出租车下车点dop的空间吸引力;节点时间吸引力表示为在某一时间段t内、某一节点pi通过社交网络签到的人数。
作为本发明的优选方案,所述的节点空间吸引力表示为节点pi对各出租车下车点dop的空间吸引力,其中,节点pi对出租车下车点dopi的空间吸引力记为prs(pi|dopi),
其中,δ为空间吸引力阈值,表示乘客的最大到达距离;β是距离衰减参数;dist(dopi,pi)为dopi和pi之间的距离。
作为本发明的优选方案,当节点pi和pj所表示的两个城市兴趣点有共享的出租车下车点dop时,节点pj作为节点pi的直接邻居;当节点pi和pl所表示的两个城市兴趣点虽然没有共享的出租车下车点,但节点pi和pl有相同的直接邻居pj时,节点pl作为节点pi的间接邻居;分别估计直接邻居的边权重和间接邻居的边权重。
作为本发明的优选方案,所述的步骤2)中,聚类得到的WROI的大小根据城市特点设置,且WROI中两个节点的步行距离小于最大步行距离。
作为本发明的优选方案,使用该城市的最小出租车行程距离作为最大步行距离。
作为本发明的优选方案,利用层次聚类算法将步行距离小于最大步行距离的节点聚在一起;其中pi与pj之间的步行距离wdist(pi,pj)表示为:
dist(pi,pj)表示pi与pj之间的欧氏距离,α是控制加权邻接矩阵W对步行距离影响的参数,α越大,加权邻接矩阵W对步行距离的影响就越大;corr(pi,pj)为pi与pj之间的边权重。
作为本发明的优选方案,所述的步骤2)还包括对得到的WROI进行初筛的步骤,具体为:定义WROI的社会功能的活跃度为所有属于该WROI的POI的访问强度之和;则当一个WROI的活跃度小于设定阈值时,将这个WROI视为噪音剔除。
作为本发明的优选方案,当一个WROI中存在访问强度低于设定阈值的不活跃POI时,对该POI进行剔除。
作为本发明的优选方案,所述的步骤3)为:根据公交网络现状,将聚类结果中已有公交站点的WROI剔除;并将每个时间段内客流小于公交客流平均值的WROI进行剔除;剩余的WROI作为适合公交站点安排推荐的服务区域。
与现有技术相比,本发明首先利用城市兴趣点(POI)信息和出租客流需求记录生成一个城市POI吸引力图网络,用于确定城市中各个地点公交服务以外的人口流量。为此,本发明提出了一种基于重力吸引的贝叶斯算法,通过纳入出租客流空间和时间上的活跃度和POI的距离来估计POI的访问人气,并为POI节点构建了一个层次化的边图,以表示POI之间的地理距离和功能相关性。根据公交站点设置的常识与基本规则,本发明提出一个具有步行规模约束、高人流密度的兴趣区域(WROI)概念,用于发现适合公交服务的城市区域。为精准挖掘WROI,提出一种层次图聚类算法(HGCA),利用建立的城市吸引力图中POI访问人气和邻居POI间的地理距离与功能相关性,通过选择距离近且访问人气高的节点(POI)生成具有规模控制参数的子图,来自动发现城市中WROI,并提供WROI的人口时空流动模式。最终与公交网络图对比,为空白服务区域推荐公交站点位置安排,为安排的站点提供客流预估。本发明可以优化当前公交网络中低效能、客流密度低的公交站点,还可以对空白服务城市区域推荐新站点位置安排,并根据城市功能给出预判的公交客流规律和密度。
附图说明
图1为基于层次图聚类的公交站点位置推荐方法流程示意图;
图2为直接邻居和间接邻居示意图;
图3为公交站站点推荐过程的伪代码示意图;
图4为多种聚类方法挖掘WROI的效果对比图;其中(a)DBSCAN by taxi(b)DBSCANby POIs(c)K-Means by multi-data(d)HGCA为本发明方法;
图5为某地区公交位置推荐图。
具体实施方式
下面结合具体实施方式对本发明做进一步阐述和说明。本发明中各个实施方式的技术特征在没有相互冲突的前提下,均可进行相应组合。
如图1所示,本发明的总体流程为:首先,利用城市兴趣点(POI)信息和出租客流需求记录生成一个城市地点吸引力图网络G。具体来说,将POI作为图中节点,提出了一种基于重力吸引的贝叶斯算法,利用每个POI周围出租车上下客密度来生成节点(POI)特征向量Pr(p),以表示在某一特定时间t内的访问人气。其特征是通过纳入出租客流空间和时间上的活跃度和POI的距离估计出的。为表示节点之间相关性,设计构建了一个层次化的边图,将邻居节点根据地理隔离分为直接邻居和间接邻居,边图的邻接矩阵是通过考虑社会功能和访问人气上的相似性,确定的两种类型邻居(直接和间接)的边缘权重。然后,根据公交站点通常服务区域为步行范围大小,且区域内人流密度高,在时间、起点-终点具有一定集中性的特征,本发明基于此规则,提出一种层次图的聚类算法可以通过选择相似且活跃的节点(POI),结合边缘权重和地理距离约束,生成具有步行规模控制参数的子图,自动发现适合作为公交服务区域的WROI,并提供WROI的人口时空流动模式。最终与公交网络图对比,为空白服务区域推荐公交站点位置安排,并提供推荐公交站点在不同时间段内的客流密度预判。
以下对本发明的各部分做详细介绍:
一、城市吸引力图网络的构建方法
为了准确表达研究城市区域内各个地点的客流吸引力,首先利用异质数据生成城市吸引力网络图G=(P,E,W),其中P={p(经度、维度)}是由研究区的所有兴趣点POI构成的节点集。每个节点都有一个相关的特征向量,即节点访问强度Pr(p),以表示在某一特定时间t内的访问人气。E是一组边,表示节点之间的联系;W∈RN×N表示带有权重的图G的邻接矩阵,如地理距离和社会功能类别的相似度,被视为它们之间的加权边。这一部分有两个任务,分别是节点和节点特征的发现以及层次边和边的加权发现。首先,本发明利用出租车下车的GPS记录和社会功能的时间活跃度模式来估计和存储这些信息,作为每个POI(节点)的访问人气(节点特征)。其次,本发明生成一个带有权重的层次化边缘图,以表示POI之间的关联性。每个POI都有两种类型的设计邻居,即直接邻居和间接邻居。邻居的类型是根据它们之间的距离和共享游客的数量来决定的。对于不同的邻居,边缘权重是根据每对POI的社会功能和受欢迎程度的相似性(相关度)来估计的。城市网络图的这种结构可以有效地用于灵活地选择受欢迎和活跃的POI,并控制WROI的大小。
(1)城市吸引力图网络的节点与其特征建立
本发明不直接使用出租车GPS记录来生成WROI,而是使用POI数据作为聚类目标来发现WROI。原因是POI有特定的位置和社会功能信息,可以避免ROI以道路交叉口为中心分布,也可以准确地代表具有相关功能信息的ROI的覆盖区域。然而,仅使用POI数据很难直接发现热门区域,因为它们没有热门程度或每个地点的游客数量的信息。因此,本发明将出租客流信息dop(经度、维度、时间戳)转换为每个POI(节点)的特征,来表示城市不同位置的访问强度(受欢迎程度)。所以,这一部分的主要任务是估计城市图中节点的访问强度Pr(p)。在现实世界中,一个地方的受欢迎程度通常由访问这个地方的人数来反映。POI的访问强度具有空间和时间上的动态性。例如,一家公司通常在早高峰时有较多的访问量。因此,除了考虑POI周围的下车人数外,还包括POI的社会功能类型和时间上的活跃性模式同样影响POI的访问强度。
考虑到这两个方面,本发明利用出租车落客数据和社会功能流行模式来确定POI的空间吸引力prs(p)和时间吸引力prt(p)。
从空间上看,出租车落客分布代表了游客数量的分布。它可以揭示出某一时间段POI在城市地区的人气分布。在某一地点附近下车的乘客越多,该地点就越有可能受到欢迎和被访问。通常,出租车司机会在尽可能将乘客送到接近目的地的地方下车。因此,下车的距离越近,乘客访问该地点的可能性就越大。基于这一观察,提出空间功率衰减函数被用来量化POI(以节点pi为例)访问强度和距离之间的关系,如公式(1)所示。
其中prs(pi|dopi)表示pi对出租车下车点dopi的空间吸引力。当出租车下车点dopi离POI(节点pi)太远时,乘客就没有可能访问该处。因此,最大到达距离δ被用来确定pi对dopi的空间吸引力阈值,当dopi和pi之间的距离达到最大距离时,这个距离就变成了零。β是距离衰减参数。离中心的POI越远,乘客访问POI的可能性就越小。
从时间上考虑,在不同的时间,每个社会功能根据其特点表现出不同的吸引力。利用社交网络签到数据,在某一时间段在一POI签到的人数可以被视为该POI的时间吸引力。由于需要考虑两类因素,本发明使用贝叶斯理论来估计每个节点的特征,也就是POI的访问人气。估算从一个下车点dopi到一个POI(节点pi)的访问强度的公式如公式(2)所示。
(2)城市吸引力图网络的层次边图建立
在这一部分,本发明提出一个层次化的边图来连接节点,并提供每条边的加权邻接矩阵来表示节点(POI)之间的关联性。
首先,建立城市吸引力图的节点间的边。根据城市地区各出租车下客信息的空间分布,一个下车地点周围通常有一个以上的POI。这些兴趣点POI共享来自几个相同的下客点dops(以复数dops表示多个下车点)的访问可能性。这意味着它们在地理上是接近的,而不是相互隔离的。基于有无共享下车点,本发明为节点构建了两种类型的邻居,即直接邻居和间接邻居,以代表不同的关联性。
图2给出了一个例子。当两个POI,pi和pj有共享下车点时,pj被称为可直接从pi到达。pi和pj被定义为直接邻居,公共区域的下客点dops,称为sharingdop(图2中的黑叉)。如果所有的dop都位于图3中的两个POI非重叠区域,说明它们没有sharingdop。在这种情况下,pi和pj之间可能有地理上的隔离,pi和pj不是邻居。另一个例子,其中pi和pj是直接邻居,pj和pl是直接邻居。可以看出,pi和pl不能直接到达,因为它们没有sharingdop。但是pi和pl都是可以直接到达pj的。换句话说,它们有相同的直接邻居,这种关系被定义为桥接可达。由一些POI连接的sharingdop意味着pi和pl在地理上不是孤立的。虽然它们不是直接的邻居,但它们仍然有可能从pi到pl,如果它们都有很高的人气且地理位置近,很可能为一个公交站点服务。因此,与直接邻居的相关性不同,pi和pl是可以桥接的,这被定义为间接邻居。在图2中,pj和pk被称为桥式POI。
然后,构建边的加权邻接矩阵来表示边之间的相关性,这有助于有效地将类似的热门POI聚类为一个WROI,并对公交站点位置进行推荐安排。从活跃度的角度来看,位于两个POI之间的dop越多,它们之间的地理联系就越高。从社会功能的角度来看,如果两个相邻的POI具有相同的社会功能,那么它们就有更大的可能共享类似的人员流动数量、持续时间模式和跨区域流动。通过考虑这两个方面的影响,采用余弦相似度算法来估计邻居间的边权重,用于聚类的参考,首先,直接邻居的边权重,如公式(3)所示。
其中,pi和pj是直接邻居,corr(pi,pj)表示pi和pj之间的社会和活跃度关系。Pr(pi)是一个向量,代表所有到pi的出租车下车点的访问强度分布。pi和pj之间的关系范围是0至1。当两个POI间没有sharingdop时,corr(pi,pj)为零。
间接邻居的社会-活跃度关系,与直接邻居类似,如图2所示,桥梁POI(pi和pl)的共享程度越高,间接邻居的空间连接可能性就越大。根据距离功率衰减定律,桥梁POI的位置也会影响间接邻居的关联性。桥梁POI和间接邻居之间的距离越远,对关联性越小。根据桥梁POI的不同分布,引入重力模型来估计间接邻居的边权重(corr),如公式(4)所示。
其中,pi和pl是间接邻居,k是决定pi和pl的连接权重的参数,f(d)是距离衰减函数,用于决定桥梁POI的影响权重,如公式(5)所示。
Let:dist=dist(pi,pb)+dist(pb,pl)
其中,dist(pi,pb)是pi和pb之间的欧氏距离,wb表示桥梁POI(pb)对一对间接邻居pi和pl的影响权重,权重范围是0至1。当dist等于2dist(pi,pl)时,pb到间接邻居的距离超过σ,这意味着pk没有可能成为pi和pb的桥梁POI。最终,基于引力理论的一对间接邻居之间的边权重公式可以写成公式(6)。
二、基于层次图聚类的WROI挖掘方法
公交站点的服务区域一般是步行范围大小,且区域内客流具有一定的时空集中性,因此传统聚类方法得到城市兴趣区域(ROI)大小不一,也无法保证人流密度,不适合作为公交站点服务区域推荐。根据公交站点的安置特性,本发明提出一种基于层次图聚类(HGCA)的有步行范围限制的城市兴趣区域(WROI)挖掘方法,用于自动适应公交服务区域推荐过程。根据公交站点的设置特点,HGCA需要满足两个规则:
(1)针对一个公交站的服务区域为步行范围大小,WROI需要根据城市特点,自适应设置聚类的规模大小;
(2)针对公交站点设置需要响应出行时间、地点集中、乘客人数较多的大众化需求,WROI的人流密度需要达到一定标准、人流规律具有集中性。
因此,根据生成的城市网络图G=(P,E,W),WROI的提取可被定义为将G中活跃度高的POI分组聚类为有步行范围大小限制的子图过程,需要同时考虑到POI的受欢迎程度和聚类后族群规模。
针对规则(1),根据城市结构或不同城市的人类行为偏好,步行规模的确定是不同的。基于常识,此处使用最小出租车行程距离来决定基本步行范围。提出的HGCA原理是将地理距离和邻接矩阵中每条边的权重合并为一个步行距离参数,并利用层次聚类算法(HCA)的理论将距离小于最大步行距离的节点聚在一起。步行距离函数如公式(7)所示。
其中,wdist(pi,pj)表示pi与pj之间的步行距离,针对规则(2),设置参数α,它是控制加权邻接矩阵W对步行距离影响的参数。α越大,W对步行距离的影响就越大。一般来说,如果pi和pj的关联性高于平均值,地理距离就会减少;如果低于平均值,地理距离将被增加。这有助于将具相似人流规律(社会属性)的高访问人气POI聚集到一个WROI中,并将不受欢迎的POI作为噪音进行过滤,达到推荐服务区域内人流密度高,且具有时空集中性。
如果WROI太小,即如果一个集群中的POI访问强度小于σ,那么这个集群将被视为噪音。HGCA表示为max{wdist<lk},其中max表示它是使用的完全链接聚类方法,lk是ROI的可行走尺寸参数。
对于一个WROI(例如ri)的社会功能fi,其活跃度被定义为ri所有属于社会功能的POI的访问强度之和。fi的活跃度A(fi)的估计公式如公式(8)所示。
其中,pi(f)代表一个POI(pi属于ri)在ri的社会功能分类。对WROI中不活跃POI的剔除,可以对WROI中的城市功能判断会更加准确,从而可以精准预判推荐站点的客流是否具有时空集中性及其流动规律。
三.公交站点位置推荐
基于HGCA方法得到的为频繁乘坐出租车区域的聚类结果WROIs,这些WROIs大小和客流强度都可根据上一步α和σ对相应实际城市的公交服务距离和客流平均值做调整,最终适合作为公交站点。然而,尽管这些适合公交服务区域的乘车人数很高,但并不是每一个集群都适合潜在的公共汽车服务的新站点。如图3所示,一些WROIs由于与已有的公交站点重复或客流较少,应该进一步被过滤掉。在过滤掉这些不合适的WROIs后,具有较高访问人气的WROI作为服务空白区域可被推荐新公交站点位置设置和优化。图3中,输出WROIbus为最终适合公交站点安排推荐的服务区域,步骤3-6,为根据公交网络现状,将聚类结果中已有的公交站点的WROIs剔除;步骤7-9,为根据上一部分制定的规则(2),公交站点服务的起始点和终点需要在时间和空间上存在一定交集,以控制企业运输成本,响应多数需求。即如果一个WROI中的服务社会功能过于分散,导致每个时间段内的客流小于公交客流平均值;且客流起始点来自于过多分散的不同区域,导致公交线路不能高效安排,此WROI将会被剔除。
四、技术验证
分别采用(a)DBSCAN by taxi(b)DBSCAN by POIs(c)K-Means by multi-data(d)本发明HGCA,对WROI的挖掘效果进行对比,结果如图4所示,据观察,(a)仅使用出租车GPS数据,DBCAN的聚类结果主要集中在道路上。它不能显示准确的覆盖区域和不同大小的聚类。(b)由于POI不具有密度的特点。只显示城市中的位置,基于密度的方法的聚类结果效果差。通过对POI数据的处理,将游客数量视为其受欢迎程度,(c)k-means的结果仍然难以找到合适的群组/WROI大小。(d)层次聚类(HGCA)在识别适当大小的WROI方面效果很好。
为直接展示所提出的HGCA方法的性能,在图5中展示了纽约中心地区公交交通地图上对公交站点位置的推荐聚类结果(图中深灰色区域为聚类结果,黑色圆形为公交站点分布)。它表明,根据曼哈顿地区成熟公共交通系统的设计,所发现的区域与曼哈顿地区的人类流动分布一致。
在对纽约市POI的功能信息进行分类后,城市功能属性被分为八个类别(住宅、办公、餐饮、娱乐、商业、休闲、教育和健康)。本发明可以对城市不同目的公交OD客流作出预测,并与三种不同方法作出对比,结果如下表所示:
GT(%) | TF-IDF(%) | KDE(%) | AIF(%) | HGCA(%) | |
1.Home | 10.5 | 3.0 | 6.5 | 7.3 | 8.7 |
2.work | 28.5 | 18.9 | 20.3 | 21.4 | 33.2 |
3.Eating | 11.5 | 40.0 | 16.8 | 16.5 | 11.1 |
4.Entertain | 2.0 | 4.0 | 7.8 | 6.4 | 3.8 |
5.Shopping | 24.5 | 3.0 | 17.7 | 18.9 | 22.0 |
6.Leisure | 14.2 | 27.0 | 23.7 | 20.4 | 13.3 |
7.Education | 4.8 | 4.0 | 5.2 | 5.1 | 4.9 |
8.Health | 4.0 | 0.1 | 2.0 | 2.6 | 3.0 |
表中,GT代表真实数据。根据观察对比可知,HGCA对公交客流的预判效果最佳。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,包括如下步骤:
1)利用城市兴趣点信息和出租车客流需求记录,生成城市兴趣点吸引力图网络;
所述的城市兴趣点吸引力图网络以城市兴趣点作为图中节点,利用每个城市兴趣点周围出租车下客密度获取节点访问强度作为节点特征;为表示节点之间相关性,设计构建一个层次化的带权重边图,将邻居节点根据地理隔离分为直接邻居和间接邻居,边图的邻接矩阵是通过考虑社会功能和访问人气上的相似性,确定的两种类型邻居的边缘权重;
2)利用层次图聚类算法通过选择相似且活跃的节点,结合边缘权重和地理距离约束,提取具有步行规模约束、高人流密度的适合作为公交服务区域的城市兴趣区域;
3)将具有步行规模约束、高人流密度的兴趣区域与公交网络图对比,过滤掉聚类结果中已有公交站的和人流在时间和空间上不集中的城市兴趣区域,精准推荐可以安排公交站点的空白服务区域。
2.根据权利要求1所述的基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,所述的节点访问强度通过节点空间吸引力和节点时间吸引力估计得到;其中,节点空间吸引力表示为节点pi对各出租车下车点dop的空间吸引力;节点时间吸引力表示为在某一时间段t内、某一节点pi通过社交网络签到的人数。
4.根据权利要求1所述的基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,当节点pi和pj所表示的两个城市兴趣点有共享的出租车下车点dop时,节点pj作为节点pi的直接邻居;当节点pi和pl所表示的两个城市兴趣点虽然没有共享的出租车下车点,但节点pi和pl有相同的直接邻居pj时,节点pl作为节点pi的间接邻居;分别估计直接邻居的边权重和间接邻居的边权重。
5.根据权利要求1所述的基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,所述的步骤2)中,聚类得到的城市兴趣区域的大小根据城市特点设置,且城市兴趣区域中两个节点的步行距离小于最大步行距离。
6.根据权利要求5所述的基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,使用该城市的最小出租车行程距离作为最大步行距离。
8.根据权利要求1所述的基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,所述的步骤2)在聚类过程中,层次图聚类算法可实现对城市兴趣区域适合作为公交服务区域进行初筛的步骤,具体为:定义城市兴趣区域的社会功能的活跃度为所有属于该城市兴趣区域的兴趣点的访问强度之和;则当一个城市兴趣区域的活跃度小于设定阈值时,将这个城市兴趣区域视为噪音剔除。
9.根据权利要求8所述的基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,聚类后得到的城市兴趣区域中的客流规律由对应兴趣点的访问规律表示,从而预判公交客流规律,不受城市兴趣区域中低访问强度兴趣点的影响;当一个城市兴趣区域中存在访问强度低于设定阈值的不活跃兴趣点时,对该兴趣点进行剔除。
10.根据权利要求1所述的基于多源数据层次图聚类算法的公交站点位置推荐方法,其特征在于,所述的步骤3)为:
根据公交网络现状,将聚类结果中已有公交站点的城市兴趣区域剔除;并将每个时间段内客流小于公交客流平均值的城市兴趣区域进行剔除;剩余的城市兴趣区域作为适合公交站点安排推荐的服务区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111549811.3A CN114495484B (zh) | 2021-12-17 | 2021-12-17 | 基于多源数据层次图聚类算法的公交站点位置推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111549811.3A CN114495484B (zh) | 2021-12-17 | 2021-12-17 | 基于多源数据层次图聚类算法的公交站点位置推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114495484A true CN114495484A (zh) | 2022-05-13 |
CN114495484B CN114495484B (zh) | 2023-10-27 |
Family
ID=81494125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111549811.3A Active CN114495484B (zh) | 2021-12-17 | 2021-12-17 | 基于多源数据层次图聚类算法的公交站点位置推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114495484B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116776011A (zh) * | 2023-05-10 | 2023-09-19 | 中国测绘科学研究院 | 一种顾及poi空间同位模式的roi提取方法及系统 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080027772A1 (en) * | 2006-07-31 | 2008-01-31 | Gernega Boris | System and method for optimizing a transit network |
US20130103697A1 (en) * | 2011-10-12 | 2013-04-25 | Mapquest, Inc. | Systems and Methods for Ranking Points of Interest |
CN103914536A (zh) * | 2014-03-31 | 2014-07-09 | 北京百度网讯科技有限公司 | 一种用于电子地图的兴趣点推荐方法及系统 |
CN105489000A (zh) * | 2015-09-08 | 2016-04-13 | 同济大学 | 一种夜班公交车站点及路径选择方法 |
CN105608153A (zh) * | 2015-12-18 | 2016-05-25 | 晶赞广告(上海)有限公司 | 一种通用的poi信息关联方法 |
CN109670240A (zh) * | 2018-12-18 | 2019-04-23 | 南京林业大学 | 一种城市多模式公交网络初始线路生成方法 |
CN110782098A (zh) * | 2019-11-01 | 2020-02-11 | 南京航空航天大学 | 一种基于出租车载客数据的定制公交规划方法 |
US20200309552A1 (en) * | 2019-04-01 | 2020-10-01 | Here Global B.V. | Method and apparatus for determining a ride hailing pickup point based on step count information |
CN112132236A (zh) * | 2020-11-20 | 2020-12-25 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种基于聚类算法的需求子区划分、线路规划方法及装置 |
CN112257970A (zh) * | 2019-07-22 | 2021-01-22 | 山东科技大学 | 一种基于兴趣点大数据的城市功能区自动划分方法 |
CN112288048A (zh) * | 2020-12-28 | 2021-01-29 | 湖南师范大学 | 一种基于多源数据驱动的城市人群出行识别方法 |
US20210108941A1 (en) * | 2019-10-10 | 2021-04-15 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method, apparatus, device and storage medium for determining point of interest area |
CN113220815A (zh) * | 2021-05-19 | 2021-08-06 | 北京百度网讯科技有限公司 | 区域信息处理方法及装置 |
CN113470365A (zh) * | 2021-09-01 | 2021-10-01 | 北京航空航天大学杭州创新研究院 | 一种面向有缺失数据的公交车到站时间预测方法 |
US20210334326A1 (en) * | 2020-04-24 | 2021-10-28 | Naver Corporation | Method of Locating Points of Interest in a Geographic Area |
-
2021
- 2021-12-17 CN CN202111549811.3A patent/CN114495484B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080027772A1 (en) * | 2006-07-31 | 2008-01-31 | Gernega Boris | System and method for optimizing a transit network |
US20130103697A1 (en) * | 2011-10-12 | 2013-04-25 | Mapquest, Inc. | Systems and Methods for Ranking Points of Interest |
CN103914536A (zh) * | 2014-03-31 | 2014-07-09 | 北京百度网讯科技有限公司 | 一种用于电子地图的兴趣点推荐方法及系统 |
CN105489000A (zh) * | 2015-09-08 | 2016-04-13 | 同济大学 | 一种夜班公交车站点及路径选择方法 |
CN105608153A (zh) * | 2015-12-18 | 2016-05-25 | 晶赞广告(上海)有限公司 | 一种通用的poi信息关联方法 |
CN109670240A (zh) * | 2018-12-18 | 2019-04-23 | 南京林业大学 | 一种城市多模式公交网络初始线路生成方法 |
US20200309552A1 (en) * | 2019-04-01 | 2020-10-01 | Here Global B.V. | Method and apparatus for determining a ride hailing pickup point based on step count information |
CN112257970A (zh) * | 2019-07-22 | 2021-01-22 | 山东科技大学 | 一种基于兴趣点大数据的城市功能区自动划分方法 |
US20210108941A1 (en) * | 2019-10-10 | 2021-04-15 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method, apparatus, device and storage medium for determining point of interest area |
CN110782098A (zh) * | 2019-11-01 | 2020-02-11 | 南京航空航天大学 | 一种基于出租车载客数据的定制公交规划方法 |
US20210334326A1 (en) * | 2020-04-24 | 2021-10-28 | Naver Corporation | Method of Locating Points of Interest in a Geographic Area |
CN112132236A (zh) * | 2020-11-20 | 2020-12-25 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种基于聚类算法的需求子区划分、线路规划方法及装置 |
CN112288048A (zh) * | 2020-12-28 | 2021-01-29 | 湖南师范大学 | 一种基于多源数据驱动的城市人群出行识别方法 |
CN113220815A (zh) * | 2021-05-19 | 2021-08-06 | 北京百度网讯科技有限公司 | 区域信息处理方法及装置 |
CN113470365A (zh) * | 2021-09-01 | 2021-10-01 | 北京航空航天大学杭州创新研究院 | 一种面向有缺失数据的公交车到站时间预测方法 |
Non-Patent Citations (4)
Title |
---|
"基于POI承载可达指数的常规公交线网优化设计", 中国优秀硕士学位论文全文数据库 * |
MANJU MANOHAR MANJALAVIL ET ALL: "Topological properties of bus transit networks considering demand and service utilization weight measures", PHYSICA A * |
王锦升;蒋志豪;房鹏程;李星颖;: "基于数据挖掘对城市公交站点优化的数学建模", 数学建模及其应用, no. 04 * |
禹文豪;艾廷华;刘鹏程;何亚坤;: "设施POI分布热点分析的网络核密度估计方法", 测绘学报, no. 12 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116776011A (zh) * | 2023-05-10 | 2023-09-19 | 中国测绘科学研究院 | 一种顾及poi空间同位模式的roi提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114495484B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Revealing intra-urban travel patterns and service ranges from taxi trajectories | |
Vanoutrive et al. | What determines carpooling to workplaces in Belgium: location, organisation, or promotion? | |
Zhong et al. | Inferring building functions from a probabilistic model using public transportation data | |
Mamun et al. | A method to define public transit opportunity space | |
Krykewycz et al. | Defining a primary market and estimating demand for major bicycle-sharing program in Philadelphia, Pennsylvania | |
CN110472999B (zh) | 基于地铁和共享单车数据的客流模式分析方法及装置 | |
CN109102114B (zh) | 一种基于数据融合的公交出行下车站点估计方法 | |
Bao et al. | Spatial analysis of bikeshare ridership with smart card and POI data using geographically weighted regression method | |
CN110555544B (zh) | 一种基于gps导航数据的交通需求估计方法 | |
CN110442715A (zh) | 一种基于多元大数据的综合城市地理语义挖掘方法 | |
Yang et al. | Investigation on structural and spatial characteristics of taxi trip trajectory network in Xi’an, China | |
CN110545558A (zh) | 基于Wi-Fi数据的高速服务区人群密度估计系统 | |
CN115062873A (zh) | 交通出行方式预测方法和装置、存储介质及电子设备 | |
Yamagata et al. | Evaluating walkability using mobile GPS data | |
Mao et al. | Customer attractiveness evaluation and classification of urban commercial centers by crowd intelligence | |
CN114548811A (zh) | 一种机场可达性的检测方法、装置、电子设备及存储介质 | |
CN114495484B (zh) | 基于多源数据层次图聚类算法的公交站点位置推荐方法 | |
Salih et al. | Measuring transit accessibility: A dispersion factor to recognise the spatial distribution of accessible opportunities | |
Bikdeli et al. | Accessibility modeling for land use, population and public transportation in Mashhad, NE Iran | |
CN113573238A (zh) | 一种基于手机信令的联程旅客出行链识别方法 | |
Bi et al. | Mining Taxi Pick‐Up Hotspots Based on Grid Information Entropy Clustering Algorithm | |
Zhou et al. | Big data for intrametropolitan human movement studies A case study of bus commuters based on smart card data | |
Sert et al. | Determination of transportation networks base on the optimal public transportation policy using spatial and network analysis methods: a case of the Konya, Turkey | |
Yao et al. | Trip segmentation and mode detection for human mobility data | |
CN111931968B (zh) | 一种应用手机gps数据来优化公共自行车站点布局的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |