CN111414719A - 地铁站周边特征提取、交通需求估计方法及装置 - Google Patents

地铁站周边特征提取、交通需求估计方法及装置 Download PDF

Info

Publication number
CN111414719A
CN111414719A CN202010350467.4A CN202010350467A CN111414719A CN 111414719 A CN111414719 A CN 111414719A CN 202010350467 A CN202010350467 A CN 202010350467A CN 111414719 A CN111414719 A CN 111414719A
Authority
CN
China
Prior art keywords
subway
traffic demand
station
subway station
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010350467.4A
Other languages
English (en)
Other versions
CN111414719B (zh
Inventor
王璞
王开鹏
黄智仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202010350467.4A priority Critical patent/CN111414719B/zh
Publication of CN111414719A publication Critical patent/CN111414719A/zh
Priority to DE202020106457.6U priority patent/DE202020106457U1/de
Application granted granted Critical
Publication of CN111414719B publication Critical patent/CN111414719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明公开了一种地铁站周边特征提取、交通需求估计方法及装置,所述方法包括以下步骤:首先,针对已有的地铁网络,采集其中各个地铁站在不同时段的周边特征,并获取其中各个地铁站OD对间不同时段的交通需求数据;然后,基于采集的数据构建训练集,其中每个样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,标签为相应地铁站OD在相应时段的交通需求;最后,构建基于机器学习算法的交通需求估计模型,基于训练集对其进行训练,得到d个特征的重要性评分,提取重要性较大的d′个特征来估计地铁网络中各待测地铁站OD对各时段的交通需求。本发明可以准确快速估计地铁站间、站点交通需求。

Description

地铁站周边特征提取、交通需求估计方法及装置
技术领域
本发明属于交通技术领域,具体涉及一种地铁站周边特征提取、交通需求估计方法及装置。
背景技术
地铁作为一种大运量的城市交通工具,获得了城市规划设计者们的青睐。为了满足日益增长的城市交通需求,许多城市开始新建地铁。而交通需求估计是地铁网络建设规划的依据。可以说,交通需求在很大程度上决定着是否进行地铁建设以及建设地铁的规模大小。扩张地铁网络的交通需求估计本身就是一项很有难度的任务,因为往往没有历史数据和经验可循,这增加了估计的难度和不确定性。传统的交通需求估计方法主要是四阶段法和时间序列法。四阶段法即交通生成、交通分布、交通方式划分、交通量分配,这种方法往往需要对城市进行大量的交通调查,人力物力以及时间成本消耗较大。时间序列法是根据估计对象历史数据的变化规律推测其未来的变化趋势。但是,目前采用这两种方法的地铁交通需求估计存在以下不足:
1、主要用于对已建成地铁系统的交通需求估计,即估计已建成的地铁站的交通需求,并不适用于对准备新建的地铁站交通需求进行估计。
2、只估计了地铁进出站的交通需求,无法估计地铁站之间的交通需求。
因此,有必要设计一种地铁站周边特征提取及交通需求估计方法,能够实现对已建成和新建的地铁站,以及地铁站之间的交通需求进行估计。
发明内容
本发明所解决的技术问题是,针对现有技术的不足,提供一种地铁站周边特征提取及交通需求估计方法,能够基于提取的地铁站周边特征,实现对已建成和新建的地铁站,以及地铁站间交通需求的准确快速地估计。
本发明所提供的技术方案为:
一方面,提供一种地铁站周边特征提取方法,包括以下步骤:
步骤11:针对已有的地铁网络,采集其中各个地铁站在不同时段(包括高峰时段和平峰时段)的周边特征,并获取其中各个地铁站OD对间不同时段的交通需求(交通流量)数据;
步骤12:构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征组合而成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
步骤13:构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型,得到d个特征对于交通需求估计的重要性评分,提取重要性较大的d′个特征用于估计地铁网络(已有的/扩建后的地铁网络)中未进行交通需求数据采集的各地铁站OD对各时段的交通需求。
进一步地,所述步骤11中,地铁站的周边特征包括通行效率,其计算公式为:
Figure BDA0002471760710000021
其中,ε(i,j)表示ε(i,j)表示从地铁站i到地铁站j的通行效率,T(i,j)表示从地铁站i到地铁站j的旅行时间(行车时间),area(i)表示地铁站i周围一定范围内的地铁站集合。
上式通行效率的含义是,从起点站周边一定范围内各个地铁站到目的地铁站的最短旅行时间与从起点站到终点站的旅行时间之比。数值越接近0表示通行效率越低,越接近1则表示通行效率越高。
进一步地,所述步骤12中,交通需求数据基于刷卡数据获取,包括以下步骤:
1)对每天的地铁刷卡记录进行预处理:根据闸机编号修复刷卡记录中缺失的站点名称,并清洗不完整的刷卡数据,例如只有进站没有出站或只有出站没有进站的数据;
2)获取出行记录:按照刷卡ID和刷卡时间对每天的刷卡记录进行排序,获得每一位乘客按照时间排序的刷卡记录,并将其时间相邻的进站记录和出站记录进行拼接,获得一次完整的出行记录,包括进站时间地点和出站时间地点;
3)统计出行记录:统计一段时间内(如一个月内)每个地铁站OD对间每一天不同时段(包括高峰时段和平峰时段)的出行记录次数Num,获得该段时间内地铁站OD对间每天的交通需求;
4)计算各个地铁站OD对间不同时段(包括高峰时段和平峰时段)的交通需求:通过计算Num/(该段时间包含的天数×一天中相应时段包含的小时数),得到相应地铁站OD对间相应时段平均每小时的交通需求。
进一步地,所述步骤13中,机器学习算法为XGBoost算法。
在XGBoost算法中,特征的重要性评分可以通过将特征被选择为非叶节点的次数除以非叶节点的总数来量化。评分较高的特征可以作为优先特征,因为这些特征相对于评分低的特征对交通需求更具有影响力。在构建估计模型时可以只使用这些优先特征,这时候需要重新使用这些特征训练交通需求估计模型,并在估计过程中,使用这些特征进行估计。
另一方面,提供一种交通需求估计方法,包括以下步骤:
步骤21:针对已有的/扩建后的地铁网络,采集其中各个地铁站在不同时段的周边特征,并获取其中各个地铁站OD对间不同时段的交通需求数据;
步骤22:构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征构成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
步骤23:构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型;
步骤24:对于未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
另一方面,提供一种交通需求估计方法,包括以下步骤:
首先,基于上述的特征提取方法,提取出重要性较大的d′个特征;
然后,以训练集D中训练样本的这d′个特征为输入,以训练集D中训练样本的标签为输出,重新训练交通需求估计模型;
最后,对于未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d′个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
通过上述方案,可以估计得到的交通需求可以包括新建站点到新建站点、新建站点到既有站点、既有站点到新建站点、既有站点到既有站点这四种类型的地铁站OD对间不同时段的交通需求。
进一步地,将得到的地铁站OD对间(站间)交通需求数据按照地铁站OD对中的起点站(进站)和终点站(出站)进行汇总,可得不同地铁站不同时段的进站交通需求和出站交通需求。
另一方面,提供一种交通需求估计装置,包括以下模块:
特征采集模块,用于针对已有的地铁网络,采集其中各个地铁站在不同时段的周边特征;
针对已有的地铁网络,获取其中各个地铁站OD对间不同时段的交通需求数据;
训练集构建模块,用于构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征构成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
模型训练及特征提取模块,用于构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型,得到d个特征对于交通需求估计的重要性评分,提取出重要性较大的d′个特征;以训练集D中训练样本的这d′个特征为输入,以训练样本的标签为输出,重新训练交通需求估计模型;
估计模块,用于对未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d′个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
另一方面,提供一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现上述的方法。
另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
有益效果:
本发明通过采集地铁站周边特征数据,根据地铁站的现有进出站刷卡记录获取不同时段(高峰和平峰时段)的站间交通需求,使用机器学习模型建立地铁站OD对的周边特征与地铁站间交通需求间的映射关系,用于对未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段的交通需求进行估计,准确性高,且弥补了传统地铁交通需求估计方法的不足,并且节省了大量的交通调查时间,降低了传统估计所需的人力物力成本,有益于地铁的规划和建设;并对地铁站周边各项特征对于交通需求估计的重要性进行了评分,在构建评估模型时,可以基于重要性较高的特征作为输入数据,从而在保证准确性的前提小,减小了估计模型的规模,提高了估计模型进行交通流量估计的速度。
附图说明
图1为交通需求估计流程图;
图2为站间高峰和平峰时段的交通需求(11号线开通后)估计结果;
图3为站间高峰和平峰时段的交通需求(7、9号线开通后)估计结果;
图4为高峰时间段进站交通需求(11号线开通后)估计结果;
图5为高峰时间段进站交通需求(7、9号线开通后)估计结果。
具体实施方式
以下结合附图和具体实施例对本发明进行进一步具体说明。
实施例1:
本实施例提供一种地铁站周边特征提取方法,包括以下步骤:
步骤11:针对已有的地铁网络,采集其中各个地铁站在不同时段(包括高峰时段和平峰时段)的周边特征,并获取其中各个地铁站OD对间不同时段的交通需求(交通流量)数据;
本实施例中,时段分为高峰时段和平峰时段,将已有的地铁网络中各个地铁站在不同时段的周边特征记为特征集X=(X11,X12,X21X22…,Xn1,Xn2),其中Xi1和Xi2分别表示第i个地铁站在高峰时段和平峰时段的周边特征,为多维向量,n表示地铁站的数量,因为分为高峰和平峰两个时段,所以特征集中元素个数是地铁站数量的两倍;
本实施例中,将已有的地铁网络中各个地铁站OD对间不同时段的交通需求记为标签集Y=(y11,y12,y21,y22,…,yn(n-1)1,yn(n-1)2),其中yi1和yi2分别表示第i个地铁站OD对间高峰时段和平峰时段的交通需求,n表示地铁站数量,n(n-1)表示地铁站OD对的数量;同上,因为分为高峰和平峰两个时段,所以标签集的元素个数是地铁站OD对数量的两倍;
步骤12:构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征组合而成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
本实施例中,训练集D={(x11,y11),(x12,y12),(x21y21),(x22y22),…,(xn(n-1)1,yn(n-1)1),(xn(n-1)2,yn(n-1)2)},其中,xi1和xi2分别表示第i个地铁站OD对在高峰时段和平峰时段的周边特征;yi1和yi2分别表示第i个地铁站OD对间高峰时段和平峰时段的交通需求;矩阵(x11,x12,x21x22…,xn(n-1)1,,xn(n-1)2),xi1,xi2∈Rd,作为训练样本的特征(模型的输入),d表示特征的维度(数量),矩阵(y11,y12,y21,y22,…,yn(n-1)1,yn(n-1)2),作为训练样本的标签(模型的输出)。
步骤13:构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型,得到d个特征对于交通需求估计的重要性评分,提取重要性较大的d′个特征用于估计地铁网络(已有的/扩建后的地铁网络)中未进行交通需求数据采集的各地铁站0D对各时段的交通需求。
实施例2:
本实施例在实施例1的基础上,所述步骤11中,地铁站周边特征包括:人口数量、公交线路数量、公交站数量、POI(信息点)分布、周围(如1000m以内)地铁站数量、地铁站出口数量、通行效率、地铁发车间隔、地铁开通年数、通行时间。这些特征大都容易获取,基于这些特征可以快速容易地对地铁网络站间、站点交通需求进行估计,降低了传统交通调查成本。
表1.地铁站周边特征说明
Figure BDA0002471760710000071
这些特征数据的提取方式如下:
1)人口数量:获取城市人口栅格数据,以地铁站为圆心,做半径为500m的圆域,并统计每个圆域内的人口数量;
2)公交线路数量、公交站数量、地铁站出口数量、地铁发车间隔:从城市地铁的官网中获取详细的数据;
3)地铁开通年数:使用维基百科或者百度百科,查询城市地铁的建成时间并推算开通年数;
4)通行时间:对于既有线可以从地铁刷卡记录中获得两站之间的通行时间;对于新开通的地铁站,可以通过规划数据或试运营的方式得到通行时间;
5)POI数量:通过互联网地图,分别统计地铁站周边公司企业、医疗保健服务、商务住宅、科教文化服务、购物服务、金融保险服务、餐饮服务的POI数量;
6)周围地铁站数量:统计出每个地铁站周围1000m内的地铁站数量;
7)通行效率:根据地铁刷卡数据,计算从地铁站周围1000m范围内所有地铁站到目的地所用的最短时间与从此地铁站出发所用的时间之比。
实施例3:
本实施例在实施例2的基础上,所述步骤11中,交通需求数据基于刷卡数据获取,包括以下步骤:
1)对每天的地铁刷卡记录进行预处理:根据闸机编号修复刷卡记录中缺失的站点名称,并清洗不完整的刷卡数据,例如只有进站没有出站或只有出站没有进站的数据;
2)获取出行记录:按照刷卡ID和刷卡时间对每天的刷卡记录进行排序,获得每一位乘客按照时间排序的刷卡记录,并将其时间相邻的进站记录和出站记录进行拼接,获得一次完整的出行记录,包括进站时间地点和出站时间地点;
3)统计出行记录:统计一段时间内(如一个月内)每个地铁站OD对间每一天不同时段(包括高峰时段和平峰时段)的出行记录次数Num,获得该段时间内地铁站OD对间每天的交通需求;
4)计算各个地铁站OD对间不同时段(包括高峰时段和平峰时段)的交通需求:通过计算Num/(该段时间包含的天数×一天中相应时段包含的小时数),得到相应地铁站OD对间相应时段平均每小时的交通需求。本实施例中,一天中高峰时段包含5小时,平峰时段包含13小时;某一时段的交通需求取该时段平均每小时的交通需求。
实施例4:
本实施例在实施例3的基础上,所述步骤13中,机器学习算法为XGBoost算法。
进一步地,在XGBoost算法中,特征的重要性评分可以通过将特征被选择为非叶节点的次数除以非叶节点的总数来量化。评分较高的特征可以作为优先特征,因为这些特征相对于评分低的特征对交通需求更具有影响力。在构建估计模型时可以只使用这些优先特征,这时候需要重新使用这些特征训练交通需求估计模型,并在估计过程中,使用这些特征进行估计。
实施例5:
本实施例提供一种交通需求估计方法,包括以下步骤:
步骤21:针对已有的/扩建后的地铁网络,采集其中各个地铁站在不同时段的周边特征,并获取其中各个地铁站OD对间不同时段的交通需求数据;
步骤22:构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征构成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
步骤23:构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型;
步骤24:对于未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
实施例6:
本实施例提供一种交通需求估计方法,包括以下步骤:
首先,基于实施例4中所述的特征提取方法,提取出重要性较大的d′个特征;
然后,以训练集D中训练样本的这d′个特征为输入,以训练集D中训练样本的标签为输出,重新训练交通需求估计模型;
最后,对于未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d′个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
通过上述方案,可以估计得到的交通需求可以包括新建站点-新建站点、新建站点-既有站点、既有站点-新建站点、既有站点-既有站点这四种类型的地铁站OD对间不同时段的交通需求。
实施例7:
本实施例在实施例6的基础上,将得到的地铁站OD对间(站间)交通需求数据按照地铁站OD对中的起点站(进站)和终点站(出站)进行汇总,可得不同地铁站不同时段的进站交通需求和出站交通需求。
本实施例中以依据扩建后的地铁网络中地铁站周边特征数据,估计扩建后的地铁网络中站间的交通需求以及进出站交通需求为例进行说明。对于扩建后的地铁网络,将其特征集记为
Figure BDA0002471760710000101
带入训练好的交通需求估计模型,估计扩建后的地铁网络中的任一地铁站OD对任一时段的交通需求
Figure BDA0002471760710000102
其中,
Figure BDA0002471760710000103
Figure BDA0002471760710000104
分别表示第i个地铁站OD对在高峰时段和平峰时段的周边特征;
Figure BDA0002471760710000105
Figure BDA0002471760710000106
分别表示估计得到的第i个地铁站OD对间高峰时段和平峰时段的交通需求;N表示扩建后的地铁网络中地铁站的总数,N(N-1)表示扩建后的地铁网络地铁站点OD对的数量。将
Figure BDA0002471760710000107
中的数据按照地铁站OD对中的起点站和终点站进行汇总,可得不同地铁站不同时段的进站交通需求和出站交通需求,分别记为FIN=(fin(11),fin(12),fin(21),fin(22),…,fin(N1),fin(N2)),FOUT=(fout(11),fout(12),fout(21),fout(22),…,fout(N1),fout(N2);其中fin(i1)和fin(i2)分别表示第i个地铁站高峰时段和平峰时段的进站交通需求;fout(i1)和fout(i2)分别表示第i个地铁站高峰时段和平峰时段的进站交通需求。
实施例8:
本实施例提供一种交通需求估计装置,包括以下模块:
特征采集模块,用于针对已有的地铁网络,采集其中各个地铁站在不同时段的周边特征;
针对已有的地铁网络,获取其中各个地铁站OD对间不同时段的交通需求数据;
训练集构建模块,用于构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征构成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
模型训练及特征提取模块,用于构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型,得到d个特征对于交通需求估计的重要性评分,提取出重要性较大的d′个特征;以训练集D中训练样本的这d′个特征为输入,以训练样本的标签为输出,重新训练交通需求估计模型;
估计模块,用于对未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d′个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
本实施例中各个模块实现其功能的工作原理参见上述方法实施例中各个相应步骤的具体实现方式。
实施例9:
本实施例提供一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如实施例1~7中任一项所述的方法。
实施例10:
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如实施例1~7中任一项所述的方法。
实验验证:
本部分以深圳市地铁站周边特征提取和交通需求估计为例,选取两次扩张后的站间交通需求以及进出站交通需求的估计进行说明,并用实际开通后的交通需求验证估计结果。其中,深圳地铁11号线于2016年6月28日开通,深圳地铁7、9号线于2016年10月28日开通,截至2016年底深圳地铁有1、2、3、4、5、7、9、11共计8条地铁线路。从2016年选取三个时间段的地铁刷卡记录,即2016年4月地铁11号线开通前的刷卡记录(用于训练11号线的交通需求估计模型)、2016年8月地铁11号线开通后(7、9号线开通前)的地铁刷卡记录(用于验证11号线的交通需求估计结果以及训练7、9号线的交通需求估计模型),2016年12月地铁7、9号线开通后的地铁刷卡记录(用于验证7、9号线的交通需求估计结果)。
首先,采用实施例7提供的交通需求估计方案估计两次扩张后地铁网络的站间交通需求以及进出站交通需求。
本部分得到的地铁站周边特征重要性评分如表2和表3所示。
表2.估计扩张11号线交通需求时的地铁站周边特征评分
Figure BDA0002471760710000121
表3.估计扩张7、9号线交通需求时的地铁站周边评分
Figure BDA0002471760710000122
Figure BDA0002471760710000131
从表2、表3可以得出,餐饮服务数量、商务住宅数量、科技文化服务数量、公交线路数、地铁站开通年数、周边地铁站数量、通行效率、发车间隔、通行时间这几个特征,在特征数据采集困难的情况下可选择这几个特征作为估计模型的优先特征。
然后,使用实际的交通需求数据分别验证模型的有效性和估计结果准确性。
采用PCC(相关系数)、SMAPE(对称平均绝对百分比误差)、MAE(平均绝对误差)这三种常用的误差估计方法,将所估计的四种站间交通需求与实际交通需求进行比较,将汇总的站点进出站交通需求与实际交通需求进行比较,对两次扩张后地铁网络的站间交通需求以及进出站交通需求估计误差进行分析,验证估计模型的有效性和准确性。各项误差如下:
表4.站间交通需求估计误差
Figure BDA0002471760710000132
Figure BDA0002471760710000141
表5.进出站交通需求估计误差
Figure BDA0002471760710000142
表4中,(a)、(b)、(c)、(d)分别代表新建站点到新建站点、新建站点到既有站点、既有站点到新建站点、既有站点到既有站点这四种类型的地铁站OD对。
交通需求估计误差分析结果显示,针对深圳地铁扩建11号线和扩建7、9号线的情况,通过本发明实施例中提供的交通需求估计方法,都能根据地铁站周边特征有效地估计出扩张后地铁网络的站间交通需求以及进出站交通需求,且准确性较高。

Claims (10)

1.一种地铁站周边特征提取方法,其特征在于,包括以下步骤:
步骤11:针对已有的地铁网络,采集其中各个地铁站在不同时段的周边特征,并获取其中各个地铁站OD对间不同时段的交通需求数据;
步骤12:构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征组合而成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
步骤13:构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型,得到d个特征对于交通需求估计的重要性评分,提取重要性较大的d′个特征用于估计地铁网络中未进行交通需求数据采集的各地铁站OD对各时段的交通需求。
2.根据权利要求1所述的地铁站周边特征提取方法,其特征在于,所述步骤11中,地铁站的周边特征包括通行效率,其计算公式为:
Figure FDA0002471760700000011
其中,ε(i,j)表示ε(i,j)表示从地铁站i到地铁站j的通行效率,T(i,j)表示从地铁站i到地铁站j的旅行时间(行车时间),area(i)表示地铁站i周围一定范围内的地铁站集合。
3.根据权利要求1所述的地铁站周边特征提取方法,其特征在于,所述步骤12中,交通需求数据基于刷卡数据获取,包括以下步骤:
1)对每天的地铁刷卡记录进行预处理:根据闸机编号修复刷卡记录中缺失的站点名称,并清洗不完整的刷卡数据,例如只有进站没有出站或只有出站没有进站的数据;
2)获取出行记录:按照刷卡ID和刷卡时间对每天的刷卡记录进行排序,获得每一位乘客按照时间排序的刷卡记录,并将其时间相邻的进站记录和出站记录进行拼接,获得一次完整的出行记录,包括进站时间地点和出站时间地点;
3)统计出行记录:统计一段时间内每个地铁站OD对间每一天不同时段的出行记录次数Num,获得该段时间内地铁站OD对间每天的交通需求;
4)计算各个地铁站OD对间不同时段的交通需求:通过计算Num/(该段时间包含的天数×一天中相应时段包含的小时数),得到相应地铁站OD对间相应时段平均每小时的交通需求。
4.根据权利要求1所述的地铁站周边特征提取方法,其特征在于,所述步骤13中,机器学习算法为XGBoost算法。
5.一种交通需求估计方法,其特征在于,包括以下步骤:
步骤21:针对已有的/扩建后的地铁网络,采集其中各个地铁站在不同时段的周边特征,并获取其中各个地铁站OD对间不同时段的交通需求数据;
步骤22:构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征构成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
步骤23:构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型;
步骤24:对于未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
6.一种交通需求估计方法,其特征在于,包括以下步骤:
首先,基于权利要求1~4中任一项所述的特征提取方法,提取出重要性较大的d′个特征;
然后,以训练集D中训练样本的这d′个特征为输入,以训练集D中训练样本的标签为输出,重新训练交通需求估计模型;
最后,对于未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d′个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
7.根据权利要求6所述的交通需求估计方法,其特征在于,将得到的地铁站OD对间交通需求数据按照地铁站OD对中的起点站和终点站进行汇总,可得不同地铁站不同时段的进站交通需求和出站交通需求。
8.一种交通需求估计装置,其特征在于,包括以下模块:
特征采集模块,用于针对已有的地铁网络,采集其中各个地铁站在不同时段的周边特征;
针对已有的地铁网络,获取其中各个地铁站OD对间不同时段的交通需求数据;
训练集构建模块,用于构建训练集D,其中每个训练样本的特征为已有的地铁网络中一个地铁站OD对在一个时段的d个特征,其由已有的地铁网络中该地铁站OD对中两个地铁站在相应时段的周边特征构成;每个训练样本的标签为相应地铁站OD在相应时段的交通需求;
模型训练及特征提取模块,用于构建基于机器学习算法的交通需求估计模型;基于训练集D,以训练样本的特征为输入,以训练样本的标签为输入,训练交通需求估计模型,得到d个特征对于交通需求估计的重要性评分,提取出重要性较大的d′个特征;以训练集D中训练样本的这d′个特征为输入,以训练样本的标签为输出,重新训练交通需求估计模型;
估计模块,用于对未获取交通需求数据的已有的/扩建后的地铁网络中的任一地铁站OD对任一时段,将该地铁站OD对在相应时段的d′个特征输入训练好的交通需求估计模型,得到相应的交通需求数据。
9.一种电子设备,包括存储器及处理器,所述存储器中存储有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器实现如权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~7中任一项所述的方法。
CN202010350467.4A 2020-04-28 2020-04-28 地铁站周边特征提取、交通需求估计方法及装置 Active CN111414719B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010350467.4A CN111414719B (zh) 2020-04-28 2020-04-28 地铁站周边特征提取、交通需求估计方法及装置
DE202020106457.6U DE202020106457U1 (de) 2020-04-28 2020-11-11 Einrichtung zum Extrahieren peripherer Merkmale einer U-Bahnstation und zum Schätzen des Verkehrsbedarfs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010350467.4A CN111414719B (zh) 2020-04-28 2020-04-28 地铁站周边特征提取、交通需求估计方法及装置

Publications (2)

Publication Number Publication Date
CN111414719A true CN111414719A (zh) 2020-07-14
CN111414719B CN111414719B (zh) 2021-02-02

Family

ID=71493823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010350467.4A Active CN111414719B (zh) 2020-04-28 2020-04-28 地铁站周边特征提取、交通需求估计方法及装置

Country Status (2)

Country Link
CN (1) CN111414719B (zh)
DE (1) DE202020106457U1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580889B (zh) * 2020-12-25 2024-08-02 北京嘀嘀无限科技发展有限公司 服务资源预估方法、装置、电子设备及存储介质
CN113779663B (zh) * 2021-07-30 2023-12-01 安徽数智建造研究院有限公司 基于bim的地铁车站围护结构三维建模方法、系统和介质
CN114862206A (zh) * 2022-05-10 2022-08-05 北京明略软件系统有限公司 站点重要度的评估方法和装置、存储介质、电子装置
CN116206452B (zh) * 2023-05-04 2023-08-15 北京城建交通设计研究院有限公司 一种城市交通出行的稀疏数据特征分析方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170076511A1 (en) * 2015-09-15 2017-03-16 Cubic Corporation Transit vehicle sensor system
CN107067076A (zh) * 2017-05-27 2017-08-18 重庆大学 一种基于时滞narx神经网络的客流预测方法
CN107180278A (zh) * 2017-05-27 2017-09-19 重庆大学 一种轨道交通实时客流预测方法
CN107886189A (zh) * 2017-10-19 2018-04-06 东南大学 一种基于地铁刷卡数据进行路径旅行时间推断的方法
CN109686090A (zh) * 2019-01-17 2019-04-26 中南大学 一种基于多源数据融合的虚拟交通流量计算方法
CN110222873A (zh) * 2019-05-14 2019-09-10 重庆邮电大学 一种基于大数据的地铁站客流量预测方法
CN110533214A (zh) * 2019-07-12 2019-12-03 北京航空航天大学 一种基于XGBoost算法的地铁客流量短时预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170076511A1 (en) * 2015-09-15 2017-03-16 Cubic Corporation Transit vehicle sensor system
CN107067076A (zh) * 2017-05-27 2017-08-18 重庆大学 一种基于时滞narx神经网络的客流预测方法
CN107180278A (zh) * 2017-05-27 2017-09-19 重庆大学 一种轨道交通实时客流预测方法
CN107886189A (zh) * 2017-10-19 2018-04-06 东南大学 一种基于地铁刷卡数据进行路径旅行时间推断的方法
CN109686090A (zh) * 2019-01-17 2019-04-26 中南大学 一种基于多源数据融合的虚拟交通流量计算方法
CN110222873A (zh) * 2019-05-14 2019-09-10 重庆邮电大学 一种基于大数据的地铁站客流量预测方法
CN110533214A (zh) * 2019-07-12 2019-12-03 北京航空航天大学 一种基于XGBoost算法的地铁客流量短时预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王大蕾: "成网条件下城市轨道交通OD分布预测模型研究", 《中国优秀硕士学位论文全文库》 *

Also Published As

Publication number Publication date
DE202020106457U1 (de) 2020-12-08
CN111414719B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN111414719B (zh) 地铁站周边特征提取、交通需求估计方法及装置
CN106897420B (zh) 一种基于手机信令数据的用户出行驻留行为识别方法
US9726502B2 (en) Route planner for transportation systems
CN107563566B (zh) 一种基于支持向量机的公交站间运行时间区间预测方法
Wang et al. A big data approach for smart transportation management on bus network
CN104318324B (zh) 基于出租车gps记录的机场巴士站点及路线规划方法
CN110276977B (zh) 一种公交站点匹配方法、装置、设备及可读存储介质
CN110222959B (zh) 一种基于大数据的城市就业可达性测算方法及系统
CN106844624A (zh) 一种可视化的公交大数据分析系统
CN113380043B (zh) 一种基于深度神经网络计算的公交到站时间预测方法
CN114363842B (zh) 基于手机信令数据的公交乘客下车站点预测方法及装置
CN110599236A (zh) 一种基于gru模型的短时停车需求预测方法
CN104599002B (zh) 预测订单价值的方法及设备
CN110889092A (zh) 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法
CN111598333A (zh) 客流数据的预测方法及装置
CN113537626B (zh) 一种聚合信息差异的神经网络结合时间序列预测的方法
WO2022142418A1 (zh) 一种基于gis地图信息的交通拥堵指数预测方法及装置
CN114328675A (zh) 基于双注意力机制和双向双层lstm的公交行程时间预测方法
CN112036757A (zh) 基于手机信令和浮动车数据的停车换乘停车场的选址方法
CN110021161B (zh) 一种交通流向的预测方法及系统
Ma et al. Public transportation big data mining and analysis
CN112258029A (zh) 地铁站周边共享单车的需求预测方法
CN109493601B (zh) 一种公交支线设置方法
CN105933463B (zh) 基于智能设备标识信息的城市人员进出城监测方法与系统
US20240265409A1 (en) Methods for determining locations of passenger flow corridors based on card swiping data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant