CN110472999B - 基于地铁和共享单车数据的客流模式分析方法及装置 - Google Patents

基于地铁和共享单车数据的客流模式分析方法及装置 Download PDF

Info

Publication number
CN110472999B
CN110472999B CN201910644711.5A CN201910644711A CN110472999B CN 110472999 B CN110472999 B CN 110472999B CN 201910644711 A CN201910644711 A CN 201910644711A CN 110472999 B CN110472999 B CN 110472999B
Authority
CN
China
Prior art keywords
data
subway
passenger flow
subway station
shared bicycle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910644711.5A
Other languages
English (en)
Other versions
CN110472999A (zh
Inventor
陈量
朱宇
郑晏群
阮鸿柱
董昊元
黄凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Beidou Intelligence Technology Co ltd
Shenzhen Comprehensive Transportation Operation Command Center
Original Assignee
Shenzhen Beidou Intelligence Technology Co ltd
Shenzhen Comprehensive Transportation Operation Command Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Beidou Intelligence Technology Co ltd, Shenzhen Comprehensive Transportation Operation Command Center filed Critical Shenzhen Beidou Intelligence Technology Co ltd
Priority to CN201910644711.5A priority Critical patent/CN110472999B/zh
Publication of CN110472999A publication Critical patent/CN110472999A/zh
Application granted granted Critical
Publication of CN110472999B publication Critical patent/CN110472999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明公开了基于地铁和共享单车数据的客流模式分析方法及装置。涉及公共交通客流数据分析领域,其中,方法包括:获取包括地铁到站时刻、地铁刷卡数据和共享单车使用数据的客流数据,根据客流数据获取地铁和共享单车的接驳数据,并采用聚类算法获取地铁站POI数据分析地铁站属性信息,结合地铁站属性信息和接驳数据,分析得到客流模式。克服了现有技术中,没有将慢行交通客流数据纳入公共客流移动模式中进行研究,忽略慢行交通客流与公共交通客流之间潜在关联性的问题。本发明分析得到的客流模式作为后续慢行交通规划分析的理论依据,能更快更方便的辅助公共交通系统管理者进行相关决策,提高公共交通系统运营水平。

Description

基于地铁和共享单车数据的客流模式分析方法及装置
技术领域
本发明涉及公共交通客流数据分析领域,尤其是一种基于地铁和共享单车数据的客流模式分析方法及装置。
背景技术
目前越来越多的人研究公共交通系统获取的客流数据,并对其进行合理分析用于解决相关问题,大量的研究关于地铁客流或公交客流分析,但是关于慢行交通,例如自行车通行分析,受限于设备限制,很难去统计乘客使用自行车的数据研究的相对较少,近些年由于共享单车的普及使用,可以获取更加多元的数据去研究慢行交通的客流模式,例如进行人群移动模式的空间和时间分析,代表性的有:使用的聚类方法是将设定好的相关度高的地区作为集合,然后绘制相关图像直接输出表明相关区域之间的人群流动;或者通过空间约束的图形分割方法,首先将空间上划分出来相邻的集合组,然后对组内数据进行分组,这样可以使得数据的关联性更加高,代表个体的数据移动,可以在通过空间聚类的方法进行分类。
但是并没有将慢行交通客流数据纳入公共客流移动模式中进行研究,由于慢行交通客流与公共交通客流之间有潜在关联性,因此需要提出一种基于慢行交通(如共享单车)和公共交通(如地铁)的客流分析方法,从而作为慢行交通规划分析的依据。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的目的是提供一种基于共享单车和地铁的客流分析方法。
本发明所采用的技术方案是:
第一方面,本发明提供一种基于地铁和共享单车数据的客流模式分析方法,包括:
获取客流数据,所述客流数据包括:地铁到站时刻、地铁刷卡数据和共享单车使用数据,所述刷卡数据包括:刷卡站点、刷卡ID和刷卡时间,所述共享单车使用数据包括:共享单车运行轨迹数据和共享单车使用时间,所述共享单车运行轨迹数据包括运行轨迹起点和运行轨迹终点;
根据所述客流数据获取地铁和共享单车的接驳数据;
分析地铁站属性信息,根据聚类算法,获取地铁站POI数据分析地铁站属性信息;
结合所述地铁站属性信息和所述接驳数据,分析得到所述客流模式。
进一步地,所述接驳数据包括到达接驳数据和始发接驳数据;
获取所述运行轨迹终点在地铁站第一阈值距离范围内的共享单车使用数据,作为所述到达接驳数据;
获取所述刷卡时间、所述地铁到站时刻与所述共享单车使用时间互相匹配,并且所述运行轨迹起点在地铁站第二阈值距离范围内的共享单车使用数据,作为所述始发接驳数据。
进一步地,获取所述始发接驳数据具体为:
根据所述地铁到站时刻、预设行人步行速度、预计扫码所需时间和所述第二阈值距离,计算得到预计接驳时间;
根据所述共享单车使用时间和所述地铁到站时刻计算单车接驳时间;
选取所述运行轨迹起点小于所述第二阈值距离,并且所述单车接驳时间大于所述预计接驳时间的共享单车使用数据,作为所述始发接驳数据。
进一步地,还包括改变所述第二阈值距离进行迭代优化。
进一步地,所述分析地铁站属性信息具体为:
获取地铁站信息组成的地铁站样本集,设定邻域参数以及聚类簇数;
根据所述POI数据对地铁站进行簇划分,得到所述地铁站的属性信息;
所述聚类簇数为所述地铁站样本集中地铁站的数量。
进一步地,所述簇划分具体为:
设定地铁站位置作为核心点集合,并对所述POI数据进行编号;
获取每个地铁站的经纬度信息,并加入所述POI数据的经纬度信息;
将所述地铁站的位置作为聚类中心,并根据所述邻域参数,将位于所述地铁站的聚类范围内的POI数据归类;
如果一个POI数据的位置与多个地铁站的距离均小于所述邻域参数,则所述POI点归类在所述多个地铁站的聚类范围内。
进一步地,还包括根据评价方法轮廓系数进行聚类迭代,具体为:
计算所述POI数据到同簇的其他POI数据的簇内平均距离;
计算所述POI数据到其他簇的所有POI数据的簇外平均距离;
根据所述簇内平均距离和所述簇外平均距离计算评价方法轮廓系数;
根据所述评价方法轮廓系数判断所述POI数据聚类的偏差,并判断是否需要重新迭代。
第二方面,本发明还提供一种基于地铁和共享单车数据的客流模式分析装置,包括:
获取客流数据模块,用于获取客流数据,所述客流数据包括:地铁到站时刻、地铁刷卡数据和共享单车使用数据,所述刷卡数据包括:刷卡站点、刷卡ID和刷卡时间,所述共享单车使用数据包括:共享单车运行轨迹数据和共享单车使用时间,所述共享单车运行轨迹数据包括运行轨迹起点和运行轨迹终点;
获取接驳数据模块,用于根据所述客流数据获取地铁和共享单车的接驳数据;
分析地铁站属性信息模块,用于分析地铁站属性信息,指采用聚类算法,获取地铁站POI数据分析地铁站属性信息;
客流模式分析模块,用于结合所述地铁站属性信息和所述接驳数据,分析得到所述客流模式。
第三方面,本发明还提供一种基于地铁和共享单车数据的客流模式分析设备,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如第一方面任一项所述的方法。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面任一项所述的方法。
本发明的有益效果是:
本发明通过获取包括地铁到站时刻、地铁刷卡数据和共享单车使用数据的客流数据,根据客流数据获取地铁和共享单车的接驳数据,并采用聚类算法获取地铁站POI数据分析地铁站属性信息,结合地铁站属性信息和接驳数据,分析得到客流模式。克服了现有技术中,没有将慢行交通客流数据纳入公共客流移动模式中进行研究,忽略慢行交通客流与公共交通客流之间潜在关联性的问题。本发明分析得到的客流模式作为后续慢行交通规划分析的理论依据,能更快更方便的辅助公共交通系统管理者进行相关决策,提高公共交通系统运营水平,并且结合慢行交通和公共交通的客流分析模式,得到的多元数据能准确反映出交通运营情况,使运营管理者能直观监测公共交通系统的客运流量变化,制定相对应的处理方案。
附图说明
图1是本发明中基于地铁和共享单车数据的客流模式分析方法的一具体实施例的实现流程图;
图2是本发明中基于地铁和共享单车数据的客流模式分析方法的一具体实施例的客流模式分析示意图;
图3是本发明中基于地铁和共享单车数据的客流模式分析装置一具体实施例的结构框图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一:
本发明实施例一提供一种基于地铁和共享单车数据的客流模式分析方法。其中,考虑到共享单车与城市公共自行车有以下区别:公共自行车有固定的使用者ID、使用模式和使用信息,并且其在各个站点的车辆数目有限,相较于共享单车的使用频次较低,因此公共自行车的使用数据规模相较于共享单车来说,数据量较少。因此本实施例中,慢行交通客流数据选取共享单车数据,公共交通客流数据选取地铁客流数据,以通过大量的客流数据得到较为精确的客流模式分析结果。
图1为本发明实施例提供的一种基于地铁和共享单车数据的客流模式分析方法的实现流程图,如图1所示,该方法可以包括以下步骤:
S1:获取客流数据,其中,客流数据包括:地铁到站时刻、地铁刷卡数据和共享单车使用数据,具体的,刷卡数据包括:刷卡站点、刷卡ID和刷卡时间,共享单车使用数据包括:共享单车运行轨迹数据和共享单车使用时间,共享单车运行轨迹数据包括运行轨迹起点和运行轨迹终点。
本实施例中,获取的客流数据的数据量相对较大,因此可选的,采用基于Hadoop的大数据处理平台进行相关的数据处理。例如数据储存使用HBASE算法,HBASE算法是一种采用分布式架构存储大数据量数据的算法,数据处理运用map-reduce算法,该算法主要思路就是把数据分割之后再合并。现有技术中有详细的描述,在此不做赘述。
另外,每一个地铁刷卡ID会有两条刷卡记录(进地铁站和出地铁站),本实施例中,选取时间较晚的一条进入后续客流模式分析。
S2:根据客流数据获取地铁和共享单车的接驳数据,本实施例中,接驳数据包括到达接驳数据和始发接驳数据,具体的根据接驳方式,将接驳数据划分成两类,第一类是使用共享单车到达地铁站,即共享单车运行轨迹终点是地铁站附近的作为到达接驳数据。第二类是地铁站出站后使用共享单车数据,即共享单车运行轨迹起点是地铁站附近的作为始发接驳数据。
S3:分析地铁站属性信息,指采用聚类算法,获取地铁站POI数据分析地铁站属性信息,POI是“Point of Interest”的缩写,翻译为“兴趣点”。在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。
S4:结合地铁站属性信息和接驳数据,分析得到客流模式。
下面描述步骤S2中,获取接驳数据的详细过程。
本实施例中,由于共享单车整个过程并不能将地铁刷卡ID与单车使用ID匹配,所以只能利用概率统计算法获得接驳数据。如上所述,接驳数据包括到达接驳数据和始发接驳数据。
对于到达接驳数据而言,选择所有享单车运行轨迹终点在地铁站第一阈值距离范围内的所有共享单车使用数据,作为到达接驳数据。由于共享单车使用数据并不需要跟刷卡数据进行匹配,因此本实施例中,主要是根据各个地铁站的位置,选择合适的第一阈值距离,并随时检测是否遗漏大量的共享单车运行轨迹终点是地铁站的共享单车使用数据,对第一阈值距离进行迭代,即可完成算法结果的优化。在一种实施方式中,第一阈值距离的初始迭代值可选的为500m。
对于始发接驳数据而言,获取刷卡时间、地铁到站时刻与共享单车使用时间互相匹配,并且共享单车运行轨迹起点在地铁站第二阈值距离范围内的共享单车使用数据,作为始发接驳数据。
本实施例中,由于慢行交通普遍通勤距离较短,因此第二阈值距离首先选择一个较小的值,方便后续进行迭代优化,如果在迭代完成后,发现依旧存在大量的相邻时刻共享单车使用记录,则进一步增大第二阈值距离,以扩大选择范围。并且根据相关研究,用户普遍步行换乘区为1.23km左右,因此,本实施例一种实施方式中,第二阈值距离的最大迭代值可选的为1.23km。另一方面,这部分客流数据需要与列车时刻进行匹配,因为使用共享单车前往地铁站的用户目的地相对来说较为固定,但是对地铁出站后使用共享单车的情况来说,有很多通勤距离较近或者前往较近公交车站换乘的用户,会在地铁出站后使用共享单车,因此需要将刷卡时间、地铁到站时刻与共享单车使用时间进行匹配。
本实施例中,匹配过程包括下面步骤:
S21:根据地铁到站时刻、预设行人步行速度、预计扫码所需时间和第二阈值距离,计算得到预计接驳时间,该预计接驳时间可以理解为用户地铁出站后使用共享单车接驳的最短时间,以任一地铁到站为例,预计接驳时间表示为:
tj=t+(a/v)+b (1)
上式中,tj表示预计接驳时间,t表示当前地铁的到站时刻,a表示第二阈值距离(该值迭代时,由小到大变化),v表示预设行人步行速度,b表示预计扫码所需时间,其中,预计扫码所需时间表示一个容差范围值,包括用户拿出手机、解锁手机、打开APP等操作时间。
S22:根据共享单车使用时间和地铁到站时刻计算单车接驳时间,表示为:
tg=ts-t (2)
上式中,tg表示单车接驳时间,t表示当前地铁的到站时刻,ts表示共享单车使用时间。
S23:选取运行轨迹起点小于第二阈值距离,并且单车接驳时间大于预计接驳时间的共享单车使用数据,作为始发接驳数据,表示为:
上式中,a表示第二阈值距离,c表示共享单车运行轨迹起点,tg表示单车接驳时间,tj表示预计接驳时间。
可以理解为,计算地铁到站时刻和共享单车使用时间的时间差(即单车接驳时间),如果该时间差大于当前到站地铁的预计接驳时间,并且共享单车的运行轨迹起点在当前地铁站的第二预设距离内,则判断该共享单车使用数据与地铁客流数据有关联,即时间匹配。
本实施例中,需要根据实际情况对匹配算法进行优化,主要体现在对第二阈值距离的优化,通常有以下几种情况:
第一种情况:根据地铁站环境进行优化,由于各个地铁站位置、地形不同,有可能出现距离较近但从地铁接驳共享单车的时间远大于经验值的情况,这时需要重新选择第二阈值范围进行迭代。
第二种情况:根据通勤时间进行优化,通勤时间一般分为:上班-空闲、周末-周内、高峰-低谷等多种情况,需要针对不同情况设定不同的第二阈值距离,例如周内相较于周末,在需要通勤时,倾向于选择第二阈值距离较大的值进行判断等。
第三种情况:比如在某个第二阈值距离选择后,选定的数值变化不大但统计的数目出现了比较大的波动,则需要判断变化究竟属于地铁接驳的乘客,还是有大量的非地铁接驳的用户使用了共享单车,需要针对具体情况进行分析。
本实施例步骤S2根据概率统计算法得到接驳数据之后,根据聚类算法分析地铁站属性信息,即可结合地铁站属性信息和接驳数据进行客流模式分析。现有的慢行交通无法分析用户使用共享单车的目的地移动模式,根据本实施例能够判断出哪些用户使用共享单车后到达或离开地铁站。
步骤S3中,为了分析客流模式,首先对各个地铁站进行空间区域的功能属性信息划分。本实施例采用聚类算法根据获取的POI数据进行地铁站属性信息分析,具体如下所述。
本实施例一种实施方式中,选取来自百度地图服务器提供的POI数据,百度地图将POI数据分为19类(一类),并根据一级分类结果划分二级行业分类,一类分类包括:美食、酒店、购物、生活服务、丽人、旅游景点等,一类分类美食的二级行业分类包括:中餐厅、外国餐厅、小吃快餐店、蛋糕甜品店、咖啡厅、茶座、酒吧等,该分类能够公开查询到,在此不做赘述。
聚类过程可以描述为:首先选择所有的地铁站点,并获取所有POI数据,根据POI数据的分类信息给每个地铁站聚类出属性信息,考虑到每个POI数据与地铁站点的距离远近不同,为不同的POI数据添加不同的权重(聚类算法体现在哪)。
本实施例中,聚类算法可选的为DBSCAN算法,该算法主要依靠空间点密度分类,每个聚类有其核心对象确定,算法流程如下所述。
S31:获取地铁站组成的地铁站样本集,并设定邻域参数和聚类簇数,本实施例中,聚类簇数即地铁站数目。
S32:根据POI数据对地铁站进行簇划分,得到地铁站的属性信息。
簇划分具体为:
S321:设定地铁站位置作为核心点集合,并对所有的POI数据进行编号,同时去除冗余数据,即没有具体定位的POI数据。
S322:获取每个地铁站的经纬度信息,在此基础上加入POI数据的经纬度信息。
S323:将地铁站的位置作为聚类中心,并根据邻域参数,将位于地铁站聚类范围内的POI数据归类,即POI数据到地铁站的距离小于邻域参数的POI就分类到该地铁站,其分类属性作为该地铁站的属性信息之一,并且根据距离远近,不同的POI数据有不同的权重,其在地铁站属性信息中占比不同。
S234:如果一个POI数据的位置与多个地铁站的位置均小于邻域参数,则POI点归类在多个地铁站的聚类范围内,即该POI数据位于两个或多个地铁站的邻域距离内,其行分类属性为多个地铁站共有。
S235:对所有地铁站进行遍历,然后输出所有地铁站的属性信息。
根据上述聚类算法即可得到POI数据聚类结果,对聚类点进行分类,从而得到各地铁站的属性信息,用于后续与接驳数据结合进行客流模式分析。
本实施例中,为了评估聚类效果,引入评价方法轮廓系数进行聚类迭代以提高聚类的准确性,具体过程为:
1)计算当前POI数据到同簇的其他POI数据的簇内平均距离和当前POI数据到其他簇的所有POI数据的簇外平均距离,其中,簇内平均距离也称为簇内不相似度,其值越小,说明当前POI数据越应该被聚类到该簇内(即该地铁站的属性信息内),簇外平均距离又称为簇间不相似度。
2)根据簇内平均距离和簇外平均距离计算评价方法轮廓系数,表示为;
b(i)=min(b1(i),b2(i),...,bn(i)) (5)
上式中,i表示POI数据样本,a(i)表示簇内不相似度,b(i)表示簇间不相似度,bn(i)表示第n个簇的簇间不相似度,s(i)表示评价方法轮廓系数。
3)根据评价方法轮廓系数判断POI数据聚类的偏差,并判断是否需要重新迭代,判断标准为:
若s(i)接近1,则说明POI数据样本i聚类合理;
若s(i)接近-1,则说明POI数据样本i应该分类到另外的簇;
若s(i)近似为0,则说明POI数据样本i在两个簇的边界上;
如果计算得到的s(i)整体偏差过大,则需要重新迭代聚类。
根据上述得到的各地铁站的属性信息结合接驳数据进行客流模式分析,根据客流模式分析结果进行相应的规划,将共享单车的接驳数据跟地铁站的属性信息联系起来,例如下面几种应用场景:1)根据共享单车的骑行数量和地铁接驳数量分析共享单车投放区域是否合理,并根据地铁站接驳情况对地铁站周边共享单车进行相应的管理。2)结合地铁出站共享单车接驳数据和地铁站周边道路情况修建对应的自行车道。3)结合共享单车在地铁站周边属性区域的移动模式,分析目标区域的属性以及用户的移动意愿,还可以结合用户画像判断其兴趣点。4)结合共享单车使用次数和使用情况,例如不同天气、不同时间段、不同道路环境(如地铁周边环境)等对客运模式进行分析。以上仅说明本实施例的客流模式分析相关应用,并不对其进行应用范围限定,凡是本实施例得到的客流模式信息(包括:接驳数据、地铁站属性信息以及两者结合)能够应用的场景均在本实施例的保护范围之内。
另外,本实施例中,如果出现共享单车使用频繁且并没有明显的POI数据差异,则需要把重新划分该地铁站第二阈值距离进行迭代并标注其属性信息类别。
如图2所示,为本实施例中客流模式分析示意图,本图仅用于说明本实施例的客流模式分析,并不限定其应用范围,本图为雷达图,即每个射线表示一个属性维度,雷达视图的中心是地铁站,其值为0,往外逐渐增大,根据POI信息分类后,每个聚类项权重是不相同的。可以直观的显示出各个地铁站的属性信息,例如美食、购物、生活服务、便捷交通、科教文化、便民工程、公司企业等(仅选择几类属性信息示意,不做属性分类限定),以及该地铁站的接驳数据对应的接驳区域信息,虚线区域表示到达接驳数据用户的分布区域信息,实线区域表示始发接驳数据的用户去向区域信息。接驳数据结合地铁站的属性信息以及POI数据,能够从共享单车使用频繁的地方,判断是属于正常通勤、住宅、还是商业因素影响的客流移动模式,也可以分析出哪些用途会使得用户更加青睐使用共享单车。
本实施例克服了现有技术中,没有将慢行交通客流数据纳入公共客流移动模式中进行研究,忽略慢行交通客流与公共交通客流之间潜在关联性的问题。并且本实施例分析得到的客流模式作为后续慢行交通规划分析的理论依据,能更快更方便的辅助公共交通系统管理者进行相关决策,提高公共交通系统运营水平,并且结合慢行交通和公共交通的客流分析模式,得到的多元数据能准确反映出交通运营情况,使运营管理者能直观监测公共交通系统的客运流量变化,制定相对应的处理方案。
实施例二:
如图3所示,为本实施例的一种基于地铁和共享单车数据的客流模式分析装置结构框图,包括:
获取客流数据模块10,用于获取客流数据,所述客流数据包括:地铁到站时刻、地铁刷卡数据和共享单车使用数据,所述刷卡数据包括:刷卡站点、刷卡ID和刷卡时间,所述共享单车使用数据包括:共享单车运行轨迹数据和共享单车使用时间,所述共享单车运行轨迹数据包括运行轨迹起点和运行轨迹终点;
获取接驳数据模块20,用于根据所述客流数据获取地铁和共享单车的接驳数据;
分析地铁站属性信息模块30,用于分析地铁站属性信息,指采用聚类算法,获取地铁站POI数据分析地铁站属性信息;
客流模式分析模块40,用于结合所述地铁站属性信息和所述接驳数据,分析得到所述客流模式。
本实施例用于执行如实施例一所述的方法。
另外,本发明还提供一种的设备,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如实施例一所述的方法。
另外,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,其中计算机可执行指令用于使计算机执行如实施例一所述的方法。
以上各实施例仅用以说明本发明的技术方案,而非对其限制,尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (9)

1.一种基于地铁和共享单车数据的客流模式分析方法,其特征在于,包括:
获取客流数据,所述客流数据包括:地铁到站时刻、地铁刷卡数据和共享单车使用数据,所述刷卡数据包括:刷卡站点、刷卡ID和刷卡时间,所述共享单车使用数据包括:共享单车运行轨迹数据和共享单车使用时间,所述共享单车运行轨迹数据包括运行轨迹起点和运行轨迹终点;
根据所述客流数据获取地铁和共享单车的接驳数据,所述接驳数据包括到达接驳数据和始发接驳数据,所述到达接驳数据为所述运行轨迹终点在地铁站第一阈值距离范围内的共享单车使用数据,所述始发接驳数据为所述刷卡时间、所述地铁到站时刻与所述共享单车使用时间互相匹配,并且所述运行轨迹起点在地铁站第二阈值距离范围内的共享单车使用数据;
获取地铁站POI数据以及所述地铁站POI数据对应的分类信息,结合聚类算法和所述分类信息对每个所述地铁站进行聚类,得到每个所述地铁站的地铁站属性信息;其中,所述地铁站属性信息包括美食、购物、生活服务、便捷交通、科教文化、便民工程以及公司企业;
结合所述地铁站属性信息和所述接驳数据绘制雷达视图,并根据所述雷达视图进行分析,得到所述客流模式;其中,所述雷达视图的中心为所述地铁站,所述雷达视图的每条射线表示所述地铁站属性信息的属性维度,所述雷达视图的实线区域表示所述始发接驳数据的用户去向区域信息,所述雷达视图的虚线区域表示所述到达接驳数据的用户分布区域信息。
2.根据权利要求1所述的一种基于地铁和共享单车数据的客流模式分析方法,其特征在于,获取所述始发接驳数据具体为:
根据所述地铁到站时刻、预设行人步行速度、预计扫码所需时间和所述第二阈值距离,计算得到预计接驳时间;
根据所述共享单车使用时间和所述地铁到站时刻计算单车接驳时间;
选取所述运行轨迹起点小于所述第二阈值距离,并且所述单车接驳时间大于所述预计接驳时间的共享单车使用数据,作为所述始发接驳数据。
3.根据权利要求2所述的一种基于地铁和共享单车数据的客流模式分析方法,其特征在于,还包括改变所述第二阈值距离进行迭代优化。
4.根据权利要求1至3任一项所述的一种基于地铁和共享单车数据的客流模式分析方法,其特征在于,所述得到每个所述地铁站的地铁站属性信息,包括:
获取地铁站信息组成的地铁站样本集,设定邻域参数以及聚类簇数;
根据所述POI数据对地铁站进行簇划分,得到所述地铁站的属性信息;
所述聚类簇数为所述地铁站样本集中地铁站的数量。
5.根据权利要求4所述的一种基于地铁和共享单车数据的客流模式分析方法,其特征在于,所述簇划分具体为:
设定地铁站位置作为核心点集合,并对所述POI数据进行编号;
获取每个地铁站的经纬度信息,并加入所述POI数据的经纬度信息;
将所述地铁站的位置作为聚类中心,并根据所述邻域参数,将位于所述地铁站的聚类范围内的POI数据归类;
如果一个POI数据的位置与多个地铁站的距离均小于所述邻域参数,则所述POI数据归类在所述多个地铁站的聚类范围内。
6.根据权利要求5所述的一种基于地铁和共享单车数据的客流模式分析方法,其特征在于,还包括根据评价方法轮廓系数进行聚类迭代,具体为:
计算所述POI数据到同簇的其他POI数据的簇内平均距离;
计算所述POI数据到其他簇的所有POI数据的簇外平均距离;
根据所述簇内平均距离和所述簇外平均距离计算评价方法轮廓系数;
根据所述评价方法轮廓系数判断所述POI数据聚类的偏差,并判断是否需要重新迭代。
7.一种基于地铁和共享单车数据的客流模式分析装置,其特征在于,包括:
获取客流数据模块,用于获取客流数据,所述客流数据包括:地铁到站时刻、地铁刷卡数据和共享单车使用数据,所述刷卡数据包括:刷卡站点、刷卡ID和刷卡时间,所述共享单车使用数据包括:共享单车运行轨迹数据和共享单车使用时间,所述共享单车运行轨迹数据包括运行轨迹起点和运行轨迹终点;
获取接驳数据模块,用于根据所述客流数据获取地铁和共享单车的接驳数据,所述接驳数据包括到达接驳数据和始发接驳数据,所述到达接驳数据为所述运行轨迹终点在地铁站第一阈值距离范围内的共享单车使用数据,所述始发接驳数据为所述刷卡时间、所述地铁到站时刻与所述共享单车使用时间互相匹配,并且所述运行轨迹起点在地铁站第二阈值距离范围内的共享单车使用数据;
分析地铁站属性信息模块,用于获取地铁站POI数据以及所述地铁站POI数据对应的分类信息,结合聚类算法和所述分类信息对每个所述地铁站进行聚类,得到每个所述地铁站的地铁站属性信息;其中,所述地铁站属性信息包括美食、购物、生活服务、便捷交通、科教文化、便民工程以及公司企业;
客流模式分析模块,用于结合所述地铁站属性信息和所述接驳数据绘制雷达视图,并根据所述雷达视图进行分析,得到所述客流模式;其中,所述雷达视图的中心为所述地铁站,所述雷达视图的每条射线表示所述地铁站属性信息的属性维度,所述雷达视图的实线区域表示所述始发接驳数据的用户去向区域信息,所述雷达视图的虚线区域表示所述到达接驳数据的用户分布区域信息。
8.一种基于地铁和共享单车数据的客流模式分析设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如权利要求1至6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至6任一项所述的方法。
CN201910644711.5A 2019-07-17 2019-07-17 基于地铁和共享单车数据的客流模式分析方法及装置 Active CN110472999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910644711.5A CN110472999B (zh) 2019-07-17 2019-07-17 基于地铁和共享单车数据的客流模式分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910644711.5A CN110472999B (zh) 2019-07-17 2019-07-17 基于地铁和共享单车数据的客流模式分析方法及装置

Publications (2)

Publication Number Publication Date
CN110472999A CN110472999A (zh) 2019-11-19
CN110472999B true CN110472999B (zh) 2024-01-23

Family

ID=68508133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910644711.5A Active CN110472999B (zh) 2019-07-17 2019-07-17 基于地铁和共享单车数据的客流模式分析方法及装置

Country Status (1)

Country Link
CN (1) CN110472999B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111121803B (zh) * 2019-11-27 2021-12-03 北京中交兴路信息科技有限公司 获取道路常用停靠点的方法及装置
CN112665596A (zh) * 2020-12-29 2021-04-16 哈尔滨理工大学 一种基于自行车位置数据下的人群移动轨迹算法
CN113340320A (zh) * 2021-08-09 2021-09-03 江西鹭鹭行科技有限公司 结合地铁和出租车出行的路线规划方法及系统
CN113919860A (zh) * 2021-09-02 2022-01-11 杭州电子科技大学 一种地铁站周边共享单车需求分析方法
CN114021883A (zh) * 2021-09-28 2022-02-08 淮阴工学院 一种高峰时期地铁接驳共享单车的调度方法
CN115619051A (zh) * 2022-12-19 2023-01-17 北京阿帕科蓝科技有限公司 一种共享车辆调配方法、系统及计算机存储介质
CN116756200B (zh) * 2023-05-29 2024-05-07 人工智能与数字经济广东省实验室(深圳) 一种共享单车接驳轨道交通工具的识别方法和相关装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914744A (zh) * 2014-04-23 2014-07-09 北京市市政工程设计研究总院有限公司 一种地铁站地下商业客流预测方法及装置
WO2016045195A1 (zh) * 2014-09-22 2016-03-31 北京交通大学 一种城轨路网客流估算方法
CN107590239A (zh) * 2017-09-11 2018-01-16 东南大学 一种基于ic卡数据测定地铁站点公共自行车接驳半径的方法
CN107909180A (zh) * 2017-09-30 2018-04-13 百度在线网络技术(北京)有限公司 公共交通出行用时的处理方法、设备及可读介质
CN108022426A (zh) * 2017-12-25 2018-05-11 东南大学 一种识别高峰时段内公共自行车接驳轨道交通客流的方法
CN108876033A (zh) * 2018-06-13 2018-11-23 华南理工大学 一种基于多源数据融合的客流爆点人流量预测方法
CN109034474A (zh) * 2018-07-26 2018-12-18 北京航空航天大学 一种基于poi数据和客流数据的地铁站聚类与回归分析方法及系统
CN109460937A (zh) * 2018-11-23 2019-03-12 东南大学 评价轨道站点周边慢行交通系统接驳水平的流程与方法
CN109508865A (zh) * 2018-10-19 2019-03-22 东南大学 基于时空使用模式的地铁站辐射范围内共享单车的部署方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914744A (zh) * 2014-04-23 2014-07-09 北京市市政工程设计研究总院有限公司 一种地铁站地下商业客流预测方法及装置
WO2016045195A1 (zh) * 2014-09-22 2016-03-31 北京交通大学 一种城轨路网客流估算方法
CN107590239A (zh) * 2017-09-11 2018-01-16 东南大学 一种基于ic卡数据测定地铁站点公共自行车接驳半径的方法
CN107909180A (zh) * 2017-09-30 2018-04-13 百度在线网络技术(北京)有限公司 公共交通出行用时的处理方法、设备及可读介质
CN108022426A (zh) * 2017-12-25 2018-05-11 东南大学 一种识别高峰时段内公共自行车接驳轨道交通客流的方法
CN108876033A (zh) * 2018-06-13 2018-11-23 华南理工大学 一种基于多源数据融合的客流爆点人流量预测方法
CN109034474A (zh) * 2018-07-26 2018-12-18 北京航空航天大学 一种基于poi数据和客流数据的地铁站聚类与回归分析方法及系统
CN109508865A (zh) * 2018-10-19 2019-03-22 东南大学 基于时空使用模式的地铁站辐射范围内共享单车的部署方法
CN109460937A (zh) * 2018-11-23 2019-03-12 东南大学 评价轨道站点周边慢行交通系统接驳水平的流程与方法

Also Published As

Publication number Publication date
CN110472999A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
CN110472999B (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
Kondor et al. Estimating savings in parking demand using shared vehicles for home–work commuting
CN105788260B (zh) 一种基于智能公交系统数据的公交乘客od推算方法
US9355063B2 (en) Parking lot detection using probe data
CN104064028B (zh) 基于多元信息数据的公交到站时间预测方法及系统
US20140089036A1 (en) Dynamic city zoning for understanding passenger travel demand
CN113763700B (zh) 信息处理方法、装置、计算机设备及存储介质
US20160125307A1 (en) Air quality inference using multiple data sources
WO2021082464A1 (zh) 预测车辆的目的地的方法和装置
CN112418696A (zh) 城市交通动态知识图谱的构建方法及装置
CN110021161B (zh) 一种交通流向的预测方法及系统
Li et al. Using smart card data trimmed by train schedule to analyze metro passenger route choice with synchronous clustering
CN112507624A (zh) 一种城际公路出行方式识别模型构建、识别方法及装置
Li et al. Public transportation mode detection from cellular data
Li et al. Estimating crowd flow and crowd density from cellular data for mass rapid transit
CN113573238B (zh) 一种基于手机信令的联程旅客出行链识别方法
Schoier et al. Individual movements and geographical data mining. Clustering algorithms for highlighting hotspots in personal navigation routes
CN111008730B (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置
Zhu et al. Urban principal traffic flow analysis based on taxi trajectories mining
Wei et al. Data-driven energy and population estimation for real-time city-wide energy footprinting
CN107622467A (zh) 一种通勤出行模式提取方法及装置
CN114492544B (zh) 模型训练方法及装置、交通事件发生概率评估方法及装置
Yao et al. Trip segmentation and mode detection for human mobility data
CN114495484B (zh) 基于多源数据层次图聚类算法的公交站点位置推荐方法
CN115759660A (zh) 一种无人驾驶车辆的调度方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant