CN108664995A - 基于DBScan的多粒度城市公共自行车调度方法及系统 - Google Patents
基于DBScan的多粒度城市公共自行车调度方法及系统 Download PDFInfo
- Publication number
- CN108664995A CN108664995A CN201810348597.7A CN201810348597A CN108664995A CN 108664995 A CN108664995 A CN 108664995A CN 201810348597 A CN201810348597 A CN 201810348597A CN 108664995 A CN108664995 A CN 108664995A
- Authority
- CN
- China
- Prior art keywords
- level
- radius
- cluster
- clustering
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000009826 distribution Methods 0.000 claims description 20
- 238000009472 formulation Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000005303 weighing Methods 0.000 abstract 1
- 238000003064 k means clustering Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 230000000869 mutational effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009828 non-uniform distribution Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Finance (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于DBScan的多粒度城市公共自行车调度方法及系统,所述调度方法基于下述聚类方法实现,包括:S110以站点为聚类对象,绘制聚类对象的k‑dist图;S120提取k‑dist图曲线的拐点,所有拐点对应的区域半径构成邻域半径值集;S130对每一个邻域半径值,分别采用DBScan法对对应层级的聚类对象进行聚类,获得各不同层级的簇。本发明根据聚类结果,分别获得各层级对应的所有簇所形成的区域,即调度单元;按照层级从高到低,依次制定各层级的城市公共自行车调度方案。本发明可有效解决公共自行车站点分布不均衡所导致的聚类质量差的问题,有利于提高聚类质量,进而提高调度的有效性。
Description
技术领域
本发明属于城市公共自行车系统管理、运营维护及相关的应用领域,尤其涉及基于DBScan(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)的多粒度城市公共自行车调度方法及系统。
背景技术
面对不断加剧的城市交通问题和日益恶化的生态环境,大力发展城市的公共交通已经成为社会各界的共识。公共自行车作为一种绿色低碳的出行方式,正越来越受到人们的青睐。然而,由于城市交通流的不对称性和用户需求的不确定性,公共自行车无法自发地在各个租赁点之间形成相对均衡的分布,许多租赁点经常出现“无车可借”或者“无位可还”的现象,导致许多市民放弃使用公共自行车出行,这就大大降低了人们使用公共自行车的概率。为了提升城市公共自行车的服务水平,提高市民对公共自行车的满意度,仅仅通过简单的增加公共自行车设施已经不能从根本上解决问题,如何有效地将空余的自行车调度到有需求的租赁点逐渐成为越来越多研究学者公共关注的话题,在国内外的学术界也有了许多有意义的研究成果。
与此同时,随着城市公共自行车系统的日渐成熟与完善,不少研究学者开始利用各种聚类算法,结合公共自行车站点的历史借车和还车数据,对城市公共自行车站点进行聚类分析,形成不同划分粒度下的自行车站点区域,利用这些划分区域对公共自行车进行有效的调度,可以在一定程度上减小相关管理部门制定自行车调度方案的复杂性。PatrickVogel等人通过分析公共自行车的历史使用数据来挖掘城市公共自行车复杂的活动模式,该研究不仅揭示了城市公共自行车车辆分布的不均衡性,并且为公共自行车系统的运营和管理提供了决策支持。Etienne等人提出对城市公共自行车数据的挖掘可以揭示出潜在的城市动态现象,并利用一种统计模型分析公共自行车系统的行程数据,根据公共自行车站点的使用情况,对站点进行聚类划分。Martin ZaltzAustwick等采用可视化方法,结合空间统计分析工具来探索城市公共自行车的使用情况,利用空间分布的位置特征来揭示不同的站点之间的相似之处。
国内的研究水平相对落后,但也有不少可喜的研究成果。周素静等对借车、还车高峰时段的历史数据进行了统计分析,建立了用车高峰时段的聚类分析模型,对城市公共自行车的统一调度提出了合理的建议。陈艳艳等根据公共自行车使用者的刷卡记录来分析自行车站点的运营模式,利用公共自行车的租/还特征和使用强度结合聚类分析方法,将公共自行车站点进行划分,通过自行车站点呈现出的特点,为规划人员调整站点周边的教育布局提供有效的依据。张晶等利用一种改进的K-means聚类算法,对城市的公共自行车站点进行二次聚类,生成区域划分方案,使得各个区域内调度需求量的绝对值尽可能最小,且各个区域数据集的相似度尽可能高,从而有效提高调度效率,减少过度调度,达到降低成本的作用。刘路美首先对整个城市的自行车站点进行了调度区域的划分,在此基础上提出了一种新的将关联规则与聚类分析相结合的划分方法,通过三次聚类,将城市所有站点划分成不同的静态调度区域。
然而传统的聚类方法通常只使用一个全局的参数对聚类对象进行划分,并没有考虑到城市公共自行车站点在整个城市范围内分布的不均衡性。不仅如此,许多传统的聚类方法还需要预先知道簇的数量。因此,利用传统的聚类方法对城市公共自行车站点进行聚类划分并不十分有效,得到的聚类结果也过于粗糙,很难有效的辅助相关部门制定合理的公共自行车调度方案,设计一种高效灵活的城市公共自行车站点聚类方法已迫在眉睫。
涉及参考文献:
[1]Austwick,M.Z.and O.O Brien,et al.(2013)."The structure of spatialnetworks and communities in bicycle sharing systems."PloS one 8(9):e74685.
[2]Dockhorn,A.and C.Braune,et al.(2015).An alternating optimizationapproach based on hierarchical adaptations of dbscan.ComputationalIntelligence,2015IEEE Symposium Series on,IEEE.
[3]Gaonkar,M.N.and K.Sawant(2013)."AutoEpsDBSCAN:DBSCAN with Epsautomatic for large dataset."International Journal on Advanced ComputerTheory and Engineering 2(2):11-16.
[4]Indaco,F.A.and T.Moh(2014).Hierarchical Density-Based ClusteringUsing Level-Sets.Cloud Computing Technology and Science(CloudCom),2014IEEE6th International Conference on,IEEE.
[5]Vogel,P.and T.Greiser,et al.(2011)."Understanding bike-sharingsystems using data mining:Exploring activity patterns."Procedia-Social andBehavioral Sciences 20:514-523.
[6]Wang,B.and W.Perrizo(2006).A Hierarchical Approach for Clusters inDifferent Densities.SEDE.
发明内容
针对传统城市公共自行车站点聚类方法存在的未考虑城市公共自行车站点分布不均衡性的问题,本发明提供了基于DBScan的多粒度城市公共自行车调度方法及系统。
传统的城市公共自行车站点聚类方法,大多使用一个全局不变的Eps值(邻域半径值)对城市公共自行车站点进行聚类,未考虑城市公共自行车站点在整个城市范围内分布的不均衡性。本发明则不再使用全局不变的Eps值进行聚类,而是利用排序的k-dist图,找出数据集存在的具有不同密度等级的子集,分别找出对应的Eps值,并对原始数据集进行不同密度级别的聚类分析,将原始数据集划分成基于不同密度等级的簇,并基于不同密度等级的簇进行城市公共自行车车辆的调度。
本发明提供的基于DBScan的多粒度城市公共自行车站点聚类方法,包括:
S110以站点为聚类对象,基于站点数据的空间位置分布,绘制聚类对象的k-dist图;
所述k-dist图中,横坐标表示样本容量,纵坐标表示具有k个邻居点的任意聚类对象的最小区域半径;
S120提取k-dist图曲线的拐点,拐点对应的纵坐标值即区域半径,所有拐点对应的区域半径构成邻域半径值集;
S130按照邻域半径值从小到大遍历邻域半径值集,对每一个邻域半径值,分别采用DBScan法对当前未被聚类的聚类对象进行聚类,从而获得各不同层级的簇,其中,邻域半径值越大,所对应的层级越高。
进一步的,所述的绘制聚类对象的k-dist图,进一步包括:
S111将所有聚类对象逐一作为聚类中心,对各聚类中心逐一执行:计算聚类中心与其k邻近聚类对象的距离,最大的距离即该聚类中心的最小区域半径;
执行完毕,获得所有聚类对象的最小区域半径;
S112按照最小区域半径从小到大对对应的聚类对象排序,并绘制k-dist图。
本发明提供的基于DBScan的多粒度城市公共自行车站点聚类系统,包括:
k-dist图绘制模块,用来以站点为聚类对象,基于站点数据的空间位置分布,利用DBScan法绘制聚类对象的k-dist图;所述k-dist图中,横坐标表示样本容量,纵坐标表示具有k个邻居点的任意聚类对象的最小区域半径;
邻域半径值集获取模块,用来提取k-dist图曲线的拐点,拐点对应的纵坐标值即区域半径,所有拐点对应的区域半径构成邻域半径值集;
聚类模块,用来按照邻域半径值从小到大遍历邻域半径值集,对每一个邻域半径值,分别采用DBScan法对当前未被聚类的聚类对象进行聚类,从而获得各不同层级的簇,其中,邻域半径值越大,所对应的层级越高。
本发明提供的基于DBScan的多粒度城市公共自行车调度方法,包括:
S210根据前述聚类结果,分别获得各层级对应的所有簇所形成的区域,即各层级的调度单元;
S220按照层级从高到低,利用各层级调度单元所包含各簇中站点间的历史借车还车数据,依次制定各层级的城市公共自行车车辆调度方案;
S230整合每一层级的城市公共自行车调度方案,形成树状的调度策略;
S240根据树状的调度策略进行调度。
进一步的,所述的制定各层级的城市公共自行车车辆调度方案,包括:
对同一层级的调度单元,将调度单元中各簇所形成的区域作为该层级车辆调度的基本单元;
根据各基本单元所包括站点的历史借车还车数据,分别获取预设时段内各基本单元整体的借车还车情况;
根据同一层级调度单元中站点的借车还车情况以及站点总数,制定城市公共自行车在同一层级调度单元之间的调度方案,所述调度方案至少包括城市公共自行车调出和调入的基本单元以及调派自行车的数量。
进一步的,所述的预设时段内各基本单元内的借车还车情况采用各基本单元的度d=(a-b)/n表示,其中,a表示基本单元内所有站点的借车总次数,b表示基本单元内所有站点的还车总次数,n表示基本单元内站点总数。
本发明提供的基于DBScan的多粒度城市公共自行车调度系统,包括:
调度单元获取模块,用来根据聚类结果,分别获得各层级对应的所有簇所形成的区域,即各层级的调度单元;
层级调度方案制定模块,用来按照层级从高到低,利用各层级调度单元所包含各簇中站点间的历史借车还车数据,依次制定各层级的城市公共自行车车辆调度方案;
调度方案整合模块,用来整合每一层级的城市公共自行车调度方案,形成树状的调度策略;
调度模块,用来根据树状的调度策略进行调度。
和现有技术相比,本发明具有如下优点和有益效果:
本发明结合计算机视觉领域中的多细节层次模型,设计了一种多划分粒度的城市公共自行车站点聚类方法,还基于该聚类方法提供了一种多粒度城市公共自行车调度方案。经试验证明,本发明不仅可自动确定DBScan聚类算法中所涉及的关键参数,而且还可以不同的划分粒度对城市不同区域范围内的城市公共自行车进行合理的调度,从而为相关部分制定合理的调度方案提供有效的数据基础和方法支撑。
本发明通过引入排序的k-dist图,可有效地找出数据集中具有不同分布密度的簇所对应的Eps值的大小,而不再利用一个全局的Eps对数据进行一次聚类,这样就可以更加准确的找出数据内部的空间分布关系。在一定程度上有效解决了当空间聚类密度分布不均匀、聚类间距相差很大时聚类质量较差的问题,有利于密度分布不均的站点区域划分。
附图说明
图1为实施例中排序的k-dist图的示意图;
图2为实施例中K-means聚类法的聚类结果,其中,图(a)、图(b)、图(c)分别表示K取4、6、10的聚类结果;
图3为实施例中传统的DBScan法的聚类结果,其中,图(a)、图(b)、图(c)分别表示Minpts值一定、Eps值分别取0.4、0.45、0.5的聚类结果;
图4为实施例中本发明方法的聚类结果,其中,图(a)、图(b)、图(c)、图(d)分别为Eps值取0.44、0.5、0.55、0.65的聚类结果。
具体实施方式
为了更清楚地说明本发明和/或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
需要说明的是,为了描述更简洁,后文中将“城市公共自行车站点”均简化为“站点”。
本发明提供的基于DBScan的多粒度城市公共自行车站点聚类方法,其一种具体实施方式包括步骤:
S110以站点为聚类对象,基于站点数据的空间位置分布,绘制聚类对象的k-dist图,所述站点数据至少包括站点的位置数据信息。
本具体实施方式中,站点数据主要包括站点ID、站点名称以及站点位置的数据,站点数据的具体格式见表1。
表1城市公共自行车的站点数据表
为便于理解,下面将提供本步骤的具体实施过程:
S111将所有聚类对象逐一作为聚类中心,对各聚类中心逐一执行如下:
计算聚类中心与其k邻近聚类对象的距离,最大的距离定义为该聚类中心的最小区域半径,最大的距离所对应的k邻近聚类对象记为聚类中心的第k个最邻近聚类对象。
执行完毕,即获得所有聚类对象的最小区域半径。
S112按照最小区域半径从小到大对聚类对象排序,并绘制k-dist图。k-dist图中,横坐标表示样本容量,纵坐标表示具有k个邻居点的任意聚类中心的最小区域半径,具体参见图1。
S120根据k-dist图,提取k-dist图曲线的拐点,拐点对应的纵坐标值,即区域半径,也即Eps值(邻域半径值),所有Eps值构成Eps值集。
下面将结合一实施例,进一步说明本步骤的原理和实施过程。见图1,所示为k-dist图的示意图,从图中可以看出,曲线上两个拐点将曲线分成三段曲线,三段曲线分别代表三个不同的密度等级。图1中曲线a、曲线c和曲线e为三段平滑曲线,同一段平滑曲线表示相同密度等级的站点集合;其中,曲线a表示最密集的站点的集合,曲线e表示最稀疏的站点的集合。曲线b、曲线d和曲线f为突变部分,曲线的突变部分则表示站点的密度分布发生了变化,突变部分用来连接两段分别代表不同密度等级的平滑曲线。因此,可以使用不同的Eps值来对不同密度等级的站点进行聚类。
根据曲线a和曲线b确定邻域半径值Eps1,具体的,过曲线b拐点处做水平线,该水平线所对应的最小区域半径即邻域半径值Eps1。由于邻域半径值的确定为业内常规技术,因此不再赘述。类似地,根据曲线c和曲线d确定邻域半径值Eps2,根据曲线e和曲线f确定邻域半径值Eps3。
S130遍历Eps值集中各Eps值,对每一个Eps值,采用DBScan法对各当前Eps值对应层级的聚类对象进行聚类。
本步骤中,不同密度等级的聚类对象采用不同Eps值进行聚类,这样可确保相同密度等级的站点被准确地划分到同一簇,最终可获得不同密度等级的簇,相同密度等级的簇为同一层级。
本具体实施方式中,按照Eps值从小到大遍历Eps值集。首先,从最小的Eps值开始进行聚类,得到最低层级的簇,即最密集的簇,将已被聚类的站点标记为defined,以保证不参与后续的聚类。然后,利用下一个Eps值对未标记的站点再次进行聚类,循环进行,直到Eps值集中所有Eps被遍历。随着Eps值的增大,对应的层级越高,但其所对应的簇的密度相应减小,直到最后一个Eps值所对应层级的簇,其密度最稀疏。通过这种聚类方式,能够以密度递减的顺序有效地确定多密度分布数据集中的所有簇。
本发明通过引入排序的k-dist图,可有效地找出数据集中具有不同分布密度的簇所对应的Eps值的大小,而不再利用一个全局的Eps对数据进行一次聚类,这样就可以更加准确的找出数据内部的空间分布关系。在一定程度上有效解决了当空间聚类密度分布不均匀、聚类间距相差很大时聚类质量较差的问题,有利于密度分布不均的站点区域划分。
根据上述基于DBScan的多粒度城市公共自行车站点聚类方法,本发明还设计了对应的基于DBScan的多粒度城市公共自行车调度方法。基于DBScan的多粒度城市公共自行车站点聚类方法其实是一种聚类划分粒度由细到粗的过程,即,首先,在局部地区划分公共自行车站点所形成的簇;然后,在较大区域范围找到更大的簇,依次进行;最后,在整个城市范围内形成几个比较大的自行车站点的聚簇。而基于DBScan的多粒度城市公共自行车调度方法则是与聚类方法相反的过程,即,按照大到小制定出调度方案。
下面将提供基于DBScan的多粒度城市公共自行车调度方法的一种具体实施过程,包括步骤:
S210遍历各层级的聚类结果,分别获得各层级对应的簇所形成的区域,即各层级的调度单元。
S220按照层级从高到低,利用各层级调度单元中各簇所包含站点之间的历史借车还车数据,依次分别制定各层级的城市公共自行车调度方案。
本具体实施方式中,历史借车还车数据主要包括借车时间、借车站点名称、还车时间、还车站点名称以及借车时长的数据,历史借车还车数据的具体格式见表2。
表2历史借车还车数据表
从最高层级的调度单元开始制定,具体为:对最高层级的调度单元中各簇,利用每一个簇中站点间的历史借车还车数据,制定最高层级的城市公共自行车调度方案。对本具体实施方式而言,最高层级的城市公共自行车调度方案即图4(d)中簇1#、2#、3#、4#站点间的自行车调度。
对最高层级的调度单元中覆盖区域面积大于预设面积阈值的簇,例如图4(d)中簇1#,还需对其进行进一步划分。于是,获得下一层级的聚类结果,见图4(c),显然,该下一层级的聚类结果比其上一层级的聚类结果更为精细;获取该下一层级对应的所有簇所形成的区域,即该层级的调度单元,利用该层级的调度单元中各簇中站点间的历史借车还车数据,制定该层级的城市公共自行车调度方案。
类似的,按照层级从高到低,分别依次制定各层级调度单元相应的城市公共自行车调度方案,直至最低层级。
S230整合每一层级的城市公共自行车调度方案,形成树状的调度方案。
S240根据树状的调度方案进行调度。
公共自行车调度方案的制定方法多样,下面将提供一种具体的调度方案制定方法,但不限于该方法。
本具体实施方式所采用的公共自行车调度方案制定方法,包括:
(a)对同一层级调度单元,将调度单元中各簇所形成的区域分别作为该层级调度单元的各基本单元。
(b)对同一层级调度单元中的各基本单元,分别计算各基本单元的度,具体为:
根据基本单元所包含站点的历史借车还车数据,分别计算预设时段内基本单元内所有站点的借车次数和还车次数,从而获得基本单元的度d=(a-b)/n,其中,a表示基本单元内所有站点的借车总次数,b表示基本单元内所有站点的还车总次数,n表示基本单元内站点总数。
(c)根据同一层级调度单元中各基本单元的度以及站点总数,制定城市公共自行车在同一层级调度单元所包含各基本单元间的调度方案。
例如:对一包含10个站点的基本单元,预设时段内,共借出50辆车,还车20辆,那么就认为该时段内,该基本单元的度d=(50-20)/10=3,而且是借出去的车比还回来的车多,所以出度为3;若借出去的车比还回来的车少,则是入度。按照该规则,分别计算所有基本单元的度,相关部门管理者根据度即可制定相应的调度方案。简单来说,入度高的区域要往出度高的区域进行调度,具体调派多少车辆则根据计算出来的出入度以及调度单元内站点的数量,并利用已有的公共自行车调度算法计算获得。
下面将结合实施例进一步说明本发明的有益效果。
本实施例使用宁波市公共自行车的站点数据以及历史借车还车数据作为样本,数据记录共1000条,站点总数617个。分别采用传统的K-means聚类法、传统的DBScan法以及本发明方法对宁波市公共自行车的站点进行聚类,并通过分析聚类结果,来验证本发明方法的有效性和高效性。
K-means聚类法是一种典型的基于距离的聚类法,采用距离作为相似性的评价指标,即认为两个聚类对象间的距离越近,其相似度就越大,而簇正是由距离靠近的聚类对象所组成。但是K-means聚类法需要预先给定聚簇数量K,选择不同的聚簇数量,将得到不同的聚类结果。然而K值的选定非常难估计,很多时候往往不知道给定的数据集应分成多少个簇才最合适。另外,K-means聚类法中,还需要根据初始聚类中心来确定初始划分,之后对初始划分不断优化。初始聚类中心的选择对聚类结果也有较大影响,一旦初始聚类中心选择不好,可能无法得到有效的聚类结果。从图2中可以看出,随着K值增大,划分得到的簇数逐渐增加,所有存在来往记录的站点均能归入聚类,只是在K值的变化中归入的聚类发生改变。在无法预知站点密度分布的情况下,很难对结果的准确性进行验证,因此也难以确定合适的K值并得到相对合适的聚类结果。
类似的,对于传统的DBScan法,也需要预先确定邻域半径Eps和最小对象数MinPts,最小对象数MinPts即邻域样本数阈值,当样本数据集的密度分布不均匀,聚类间距相差较大时,聚类质量会较差。而通过人工的调参相对于传统的DBScan法等聚类方法而言要复杂的多,主要需要对邻域半径Eps、邻域样本数阈值MinPts联合调参,不同的参数组合对最后的聚类效果有较大影响。从图3可以看出,Minpts值一定的情况下,随着Eps值的变化归入类的站点数逐渐增加,且产生聚簇数也在逐渐增加,不同密度的簇被划分出来。同样的,这样的结果根据不同的参数Minpts值和Eps值会得到不同的聚类分布,参数值的选取有一定难度,或多或少都会对结果产生一定影响。
而对于本发明,首先,利用k-dist图找出所有的Eps值;然后,依次取各Eps值分别进行聚类。对于最小的Eps值,在整个城区范围内,找到密度分布最大的一些簇,见图4(a)所示。从图4可以看出,由最小的Eps值找到的聚簇,所占据的空间范围较小,所包含的站点数量也相对少,但是相比较而言拥有较高的密度分布,在空间范围上来看,这些站点排列较紧密,且站点间相似度也最高,因此,可以作为局部地区站点车辆调度的基本单元。
同时,由最小的Eps值找到的这些簇,也是本发明站点划分的最底层,如图4(a)。随着Eps值的增大,可得到较大范围的簇,如图4(c)。从图4可以看出,随着Eps值的增大,每一个簇中站点的数量在增加,同一个簇中不同站点间的平均相似度却在逐渐降低;如此继续,直到获取最大的Eps值,这时候再进行DBScan聚类,就可以在整个城市范围内得到两个最大的站点簇,这两个簇基本覆盖了整个宁波市的所有站点,这样就完成了最高层级的聚类划分。
通过上述三种聚类方法的对比,不难发现,K-means聚类法由于需要预先知道聚类数,并且不同的聚类数对于得到的聚类结果有较大影响,所以K-means聚类法很难应用到城市公共自行车的调度领域。传统的DBScan法由于难以准确的设置参数值,不同的参数值对聚类结果会产生一定的影响和偏差,而且得到的聚类效果过于粗糙,也难以准确地为城市公共自行车的调度提供决策。而本发明方法,能够识别不同密度等级的簇,而且不需要事先知道簇的数量,也不需要人工输入初始参数,通过对站点数据进行统计分析,就可得到准确的聚类层级特性。该方法能较好适应城市中公共自行车站点非均匀分布的特点,从而为城市公共自行车车辆的调度奠定了基础。
上述实施例所述是用以具体说明本发明,文中虽通过特定的术语进行说明,但不能以此限定本发明的保护范围,熟悉此技术领域的人士可在了解本发明的精神与原则后对其进行变更或修改而达到等效目的,而此等效变更和修改,皆应涵盖于权利要求范围所界定范畴内。
Claims (7)
1.基于DBScan的多粒度城市公共自行车站点聚类方法,其特征是,包括:
S110以站点为聚类对象,基于站点数据的空间位置分布,绘制聚类对象的k-dist图;
所述k-dist图中,横坐标表示样本容量,纵坐标表示具有k个邻居点的任意聚类对象的最小区域半径;
S120提取k-dist图曲线的拐点,拐点对应的纵坐标值即区域半径,所有拐点对应的区域半径构成邻域半径值集;
S130按照邻域半径值从小到大遍历邻域半径值集,对每一个邻域半径值,分别采用DBScan法对当前未被聚类的聚类对象进行聚类,从而获得各不同层级的簇,其中,邻域半径值越大,所对应的层级越高。
2.如权利要求1所述的基于DBScan的多粒度城市公共自行车站点聚类方法,其特征是:
所述的绘制聚类对象的k-dist图,进一步包括:
S111将所有聚类对象逐一作为聚类中心,对各聚类中心逐一执行:计算聚类中心与其k邻近聚类对象的距离,最大的距离即该聚类中心的最小区域半径;
执行完毕,获得所有聚类对象的最小区域半径;
S112按照最小区域半径从小到大对对应的聚类对象排序,并绘制k-dist图。
3.基于DBScan的多粒度城市公共自行车站点聚类系统,其特征是,包括:
k-dist图绘制模块,用来以站点为聚类对象,基于站点数据的空间位置分布,绘制聚类对象的k-dist图;所述k-dist图中,横坐标表示样本容量,纵坐标表示具有k个邻居点的任意聚类对象的最小区域半径;
邻域半径值集获取模块,用来提取k-dist图曲线的拐点,拐点对应的纵坐标值即区域半径,所有拐点对应的区域半径构成邻域半径值集;
聚类模块,用来按照邻域半径值从小到大遍历邻域半径值集,对每一个邻域半径值,分别采用DBScan法对当前未被聚类的聚类对象进行聚类,从而获得各不同层级的簇,其中,邻域半径值越大,所对应的层级越高。
4.基于DBScan的多粒度城市公共自行车调度方法,其特征是,包括:
S210根据权利要求1的聚类结果,分别获得各层级对应的所有簇所形成的区域,即各层级的调度单元;
S220按照层级从高到低,利用各层级调度单元所包含各簇中站点间的历史借车还车数据,依次制定各层级的城市公共自行车车辆调度方案;
S230整合每一层级的城市公共自行车调度方案,形成树状的调度策略;
S240根据树状的调度策略进行调度。
5.如权利要求4所述的基于DBScan的多粒度城市公共自行车调度方法,其特征是:
所述的制定各层级的城市公共自行车车辆调度方案,包括:
对同一层级的调度单元,将调度单元中各簇所形成的区域作为该层级车辆调度的基本单元;
根据各基本单元所包括站点的历史借车还车数据,分别获取预设时段内各基本单元整体的借车还车情况;
根据同一层级调度单元中站点的借车还车情况以及站点总数,制定城市公共自行车在同一层级调度单元之间的调度方案,所述调度方案至少包括城市公共自行车调出和调入的基本单元以及调派自行车的数量。
6.如权利要求5所述的基于DBScan的多粒度城市公共自行车调度方法,其特征是:
所述的预设时段内各基本单元内的借车还车情况采用各基本单元的度d=(a-b)/n表示,其中,a表示基本单元内所有站点的借车总次数,b表示基本单元内所有站点的还车总次数,n表示基本单元内站点总数。
7.基于DBScan的多粒度城市公共自行车调度系统,其特征是,包括:
调度单元获取模块,用来根据聚类结果,分别获得各层级对应的所有簇所形成的区域,即各层级的调度单元;
层级调度方案制定模块,用来按照层级从高到低,利用各层级调度单元所包含各簇中站点间的历史借车还车数据,依次制定各层级的城市公共自行车车辆调度方案;
调度方案整合模块,用来整合每一层级的城市公共自行车调度方案,形成树状的调度策略;
调度模块,用来根据树状的调度策略进行调度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810348597.7A CN108664995A (zh) | 2018-04-18 | 2018-04-18 | 基于DBScan的多粒度城市公共自行车调度方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810348597.7A CN108664995A (zh) | 2018-04-18 | 2018-04-18 | 基于DBScan的多粒度城市公共自行车调度方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108664995A true CN108664995A (zh) | 2018-10-16 |
Family
ID=63780023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810348597.7A Pending CN108664995A (zh) | 2018-04-18 | 2018-04-18 | 基于DBScan的多粒度城市公共自行车调度方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108664995A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110149347A (zh) * | 2019-06-18 | 2019-08-20 | 中国刑事警察学院 | 利用拐点半径实现动态自适应聚类的网络入侵检测方法 |
CN110298558A (zh) * | 2019-06-11 | 2019-10-01 | 欧拉信息服务有限公司 | 车辆资源部署方法和装置 |
CN110929783A (zh) * | 2019-11-21 | 2020-03-27 | 同济大学 | 基于共享对象的租还数据的用地属性分类方法 |
CN111881939A (zh) * | 2020-06-24 | 2020-11-03 | 东南大学 | 一种基于聚类算法的共享单车停车区布设方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426997A (zh) * | 2015-11-18 | 2016-03-23 | 西南交通大学 | 城市公共自行车智能调度与运用管理系统及其实现方法 |
CN105719083A (zh) * | 2016-01-21 | 2016-06-29 | 华南理工大学 | 一种基于多层次分区的公共自行车高峰期调度方法 |
CN106910103A (zh) * | 2017-01-09 | 2017-06-30 | 杭州电子科技大学 | 一种公共自行车系统租赁点功能聚类方法 |
CN107688955A (zh) * | 2016-08-03 | 2018-02-13 | 浙江工业大学 | 一种基于自适应dbscan密度聚类的城市商业圈群簇划分方法 |
CN107730876A (zh) * | 2017-10-21 | 2018-02-23 | 淮阴工学院 | 一种城市共享单车关键调度点数量和位置确定方法 |
-
2018
- 2018-04-18 CN CN201810348597.7A patent/CN108664995A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426997A (zh) * | 2015-11-18 | 2016-03-23 | 西南交通大学 | 城市公共自行车智能调度与运用管理系统及其实现方法 |
CN105719083A (zh) * | 2016-01-21 | 2016-06-29 | 华南理工大学 | 一种基于多层次分区的公共自行车高峰期调度方法 |
CN107688955A (zh) * | 2016-08-03 | 2018-02-13 | 浙江工业大学 | 一种基于自适应dbscan密度聚类的城市商业圈群簇划分方法 |
CN106910103A (zh) * | 2017-01-09 | 2017-06-30 | 杭州电子科技大学 | 一种公共自行车系统租赁点功能聚类方法 |
CN107730876A (zh) * | 2017-10-21 | 2018-02-23 | 淮阴工学院 | 一种城市共享单车关键调度点数量和位置确定方法 |
Non-Patent Citations (2)
Title |
---|
徐建闽,等: "公共自行车多层次分区调度方法研究", 《交通运输系统工程与信息》 * |
胡继华,等: "适于营运车辆超速时空特征分析的改进DBSCAN算法", 《运输与物流》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298558A (zh) * | 2019-06-11 | 2019-10-01 | 欧拉信息服务有限公司 | 车辆资源部署方法和装置 |
CN110149347A (zh) * | 2019-06-18 | 2019-08-20 | 中国刑事警察学院 | 利用拐点半径实现动态自适应聚类的网络入侵检测方法 |
CN110149347B (zh) * | 2019-06-18 | 2021-07-09 | 中国刑事警察学院 | 利用拐点半径实现动态自适应聚类的网络入侵检测方法 |
CN110929783A (zh) * | 2019-11-21 | 2020-03-27 | 同济大学 | 基于共享对象的租还数据的用地属性分类方法 |
CN110929783B (zh) * | 2019-11-21 | 2023-04-07 | 同济大学 | 基于共享对象的租还数据的用地属性分类方法 |
CN111881939A (zh) * | 2020-06-24 | 2020-11-03 | 东南大学 | 一种基于聚类算法的共享单车停车区布设方法 |
CN111881939B (zh) * | 2020-06-24 | 2021-03-09 | 东南大学 | 一种基于聚类算法的共享单车停车区布设方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108664995A (zh) | 基于DBScan的多粒度城市公共自行车调度方法及系统 | |
Lv et al. | Optimization of recyclable MSW recycling network: A Chinese case of Shanghai | |
CN109636137A (zh) | 基于层次分析的电动汽车充电站规划布局方法和系统 | |
CN101807222A (zh) | 基于站点的城市公交线网优化配置方法 | |
CN105956621A (zh) | 一种基于进化欠抽样集成学习的航班延误预警方法 | |
CN110728421B (zh) | 一种基于充电需求大数据的路网充电优化方法 | |
CN108961758A (zh) | 一种基于梯度提升决策树的路口展宽车道探测方法 | |
CN105005942A (zh) | 一种智能配电网差异化建设模式选择方法 | |
CN107944755A (zh) | 一种基于城市计算的产业模型设计方法及系统 | |
CN113762784B (zh) | 污水处理系统布局规划方案的定量化综合评价方法及系统 | |
CN112580951B (zh) | 基于乘客出行的城市地面公交运行监测关键指标筛选方法 | |
CN108830436B (zh) | 基于分形树自平衡划分的共享自行车调度方法 | |
CN110659774A (zh) | 大数据方法驱动的停车需求预测方法 | |
Bao et al. | Spatiotemporal clustering analysis of shared electric vehicles based on trajectory data for sustainable urban governance | |
CN115810271B (zh) | 一种基于刷卡数据判断客流走廊位置的方法 | |
CN106126739A (zh) | 一种处理业务关联数据的装置 | |
CN113592246B (zh) | 一种基于pca-topsis模型的道路施工期公交线网评价方法 | |
CN111738624B (zh) | 一种用于解决供求关系平衡的区域划分方法及系统 | |
CN108629522B (zh) | 一种基于聚类分析的公共自行车调度方法 | |
Wei et al. | A Cross‐Regional Scheduling Strategy of Waste Collection and Transportation Based on an Improved Hierarchical Agglomerative Clustering Algorithm | |
CN115456372A (zh) | 一种农村低效建设用地识别标准体系构建方法 | |
CN110942260B (zh) | 一种基于贝叶斯最大熵的高校交通安全评价方法 | |
CN109523146B (zh) | 一种基于复杂网络的调度区域划分方法 | |
CN114579748A (zh) | 一种构建自主式交通系统功能架构的方法 | |
CN114511110A (zh) | 一种基于物联网的智慧运维系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |