CN110533215A - 一种基于gps数据的巡游出租车寻客行为预测方法 - Google Patents

一种基于gps数据的巡游出租车寻客行为预测方法 Download PDF

Info

Publication number
CN110533215A
CN110533215A CN201910627260.4A CN201910627260A CN110533215A CN 110533215 A CN110533215 A CN 110533215A CN 201910627260 A CN201910627260 A CN 201910627260A CN 110533215 A CN110533215 A CN 110533215A
Authority
CN
China
Prior art keywords
grid
taxi
cruising
gps data
objective behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910627260.4A
Other languages
English (en)
Inventor
于滨
郝梦妍
郭震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Beijing University of Aeronautics and Astronautics
Original Assignee
Beijing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Aeronautics and Astronautics filed Critical Beijing University of Aeronautics and Astronautics
Priority to CN201910627260.4A priority Critical patent/CN110533215A/zh
Publication of CN110533215A publication Critical patent/CN110533215A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/123Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Remote Sensing (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于GPS数据的巡游出租车寻客行为预测方法,该方法首先网格化研究区域,根据GPS数据中经纬度信息建立网格索引,通过预期收益率和路程延误这两个因素来刻画巡游出租车司机的寻客行为。然后,基于效用最大化原理和Logit模型构建巡游出租车司机寻客行为模型。最后,收集并处理出租车GPS数据,提取网格间巡游轨迹,标定模型参数。本发明提供的预测方法,能够反映出租车驾驶员的真实决策过程,有效提高了预测水平,为城市交通管理提供了决策依据。

Description

一种基于GPS数据的巡游出租车寻客行为预测方法
技术领域
本发明涉及巡游出租车寻客行为预测方法,特别是涉及了一种基于GPS数据和Logit模 型的巡游出租车寻客行为预测方法。
背景技术
目前,城市公共交通道路拥堵已经成为我国社会发展过程中面临的焦点问题。由交通拥 堵造成的社会经济损失每年高达数百万元;随着机动车数量的增加,城市污染问题也不断加 剧。在许多城市中,出租车是其道路交通流中重要的组成部分,出租车驾驶员的路径选择行 为对于城市整体的交通网络运行状况有着较大的影响。
一般来说,出租车的运行过程可分为载客和巡游两个阶段。空载即巡游出租车对城市道 路资源的大量占据会给人流较密集的地段带来巨大的交通压力,同时会导致燃油资源的过多 消耗,排出的汽车尾气也将加剧环境污染。因此,出租车驾驶员在巡游过程中的路径选择行 为会对城市交通产生较大的影响。然而国内城市中仍有大量普通出租车以扫街巡游的方式寻 找客人,出租车驾驶员的路径选择一般是依靠驾驶员的经验,其选择行为是难以预估的,成 为解决城市拥堵问题过程中的难点。
发明内容
发明目的:本发明的目的是设计一种基于GPS数据的巡游出租车寻客行为预测方法,综 合考虑出租车的运行特征,基于Logit模型构建路径选择效用函数,用于预测未来巡游出租 车的轨迹趋势,有助于分析城市交通流时空分布规律,从而为城市管理部门制定交通规划措 施提供有益参考和借鉴,也为解决城市道路拥堵问题供新的视角。
技术方案:为了实现上述设计要求,本发明采取以下技术方案:(1)网格化研究区域, 建立网格索引,简化数据处理过程,确定巡游出租车的路线可选方案;(2)计算影响变量, 通过预期收益率和路程延误这两个因素来刻画巡游出租车司机的寻客行为;(3)构建巡游路 线选择行为模型,综合考虑预期收益率和总路程延误程度建立了网格路线效用函数,基于效 用最大化原理和Logit模型计算巡游出租车司机选择各路线方案的概率;(4)收集并处理出 租车GPS数据,提取网格间巡游轨迹,标定模型参数,确定巡游出租车寻客行为模型。
所述步骤(4)包括如下步骤:(4-1)收集一定范围内的出租车GPS数据,包括经纬度、 车辆ID、行驶状态(如位置坐标、航向、速度等)及营运状态(空驶、载客等)等信息;(4-2) 从限定研究范围、数据错误、数据噪点、数据冗余四个方面对原始数据进行数据清洗;(4-3) 基于网格变化点的时间序列巡游轨迹匹配算法,提取网格间巡游轨迹;(4-4)通过极大似然 估计法标定网格路线效用函数中变量的影响权重系数。
有益效果:
本发明提供的基于GPS数据的巡游出租车寻客行为预测方法,具有以下优点:1、基于 GPS数据对模型进行标定,能够反映出租车驾驶员的真实决策过程;2、综合考虑了预期收益 率和总路程延误程度两个影响因素进行建模,有效提高预测水平,真实刻画出租车驾驶员寻 客过程的心理过程;3、给决策者提供了很好的决策依据,并且可以应用到智能化的交通系统 中。
附图说明
图1为本发明的流程图,图2为本发明的网格划分示意图。
具体实施方式
下面结合附图对本发明进行详细的描述。
如图1所示,本发明包括以下步骤:
1)网格化研究区域,建立网格索引,简化数据处理过程,确定巡游出租车的路线可选方 案。
A、网格划分
通过将研究区域划分成网格的方式对巡游出租车寻客行为进行建模。如图2所示,位于 网格i的空载出租车可能选择其毗邻的网格jn(n=1,2,3...8)继续巡游寻找乘客。相邻网格间存 在着双向虚拟连接,代表着出租车在网格间的路径选择。
B、建立网格索引
GridLon=(LONMAX-LONMIN)/N1
GridLat=(LATMAX-LATMIN)/N2
X=FLOOR((LON-LONMIN)/GridLon)
Y=FLOOR((LAT-LATMIN)/GridLat)
将研究区域划分成N1*N2个均等网格,根据GPS数据中经纬度信息建立网格索引(X,Y)。其中LONMAX和LONMIN分别为研究区域所在范围的经度最大值和最小值, LATMAX和LATMIN分别为研究区域所在范围的纬度最大值和最小值;N1和N2分别为在横 坐标方向和纵坐标方向上划分的网格数;GridLon和GridLat分别为网格的经、纬度范围; FLOOR(x)意为取不大于x的最大整数,例如FLOOR(5.3)=5;X和Y分别所网格索引 下的横、纵坐标。
2)计算影响变量,通过预期收益率和路程延误这两个因素来刻画巡游出租车司机的寻客 行为。
巡游出租车司机的寻客行为是一系列综合当前交通状况和司机以往驾驶经验的决策过 程。在此考虑了巡游出租车寻客时8种网格路径选择可能,这8种选择是独立不相关的,且 受到预期收益率和路程延误这两个因素的影响,根据下面步骤对这两个因素进行计算。
A、预期收益率
预期收益率综合考虑了消耗时间、消耗成本和预期收益三个主要因素。
其中,Rij为从网格i到网格j的预期收益率,Cij为从网格i到网格j的消耗成本,Pj为目 标网格j的预期收益,CTij为从网格i到网格j的消耗时间成本。
其中,CTij为从网格i到网格j的消耗时间,为从网格i到网格j的平均路程时间,为网格j出发的空载出租车的平均巡游时间。Cij为从网格i到网格j的消耗成本,Cr为出租 车单位时间的租赁成本,Cf为出租车单位距离的油耗成本,Tij为从网格i到网格j的平均路 程时间,为网格j出发的空载出租车的平均巡游时间,为网格j出发的空载出租车的 平均巡游距离。
其中,Pj为目标网格j的预期收益,Fj为从网格j出发的载客轨迹的净收益均值,Cr为 出租车单位时间的租赁成本,Cf为出租车单位距离的油耗成本,为从网格j出发的载客 出租车轨迹的平均行程时间,为从网格j出发的载客出租车轨迹的平均行程距离。F为 一条载客轨迹的净收益,D为载客轨迹起终点的距离及里程数,D1为起步里程数,D2为远程里程标准,f0为起步价,f1为正常每公里单价,f2为远程每公里单价。
B、总路程延误程度
巡游出租车司机会根据自身驾驶经验,倾向于选择行程时间较为确定即标准差较小的路 径。通过行程时间标准差来衡量路程延误程度关注的是时间本身,而不是只考虑影响时间的 某些因素,因此能够较为全面反应真实的路程延误情况。
TTDij=TDij+TDj
其中,TTDij为从网格i到网格j的总路程延误程度,TDij为从网格i到网格j的路程延误 程度,TDj为从网格j出发的预期路程延误程度。
其中,TDij为从网格i到网格j的路程延误程度,N为从网格i到网格j的轨迹数,Tijk为 一条从网格i到网格j的轨迹消耗的路程时间,为从网格i到网格j的轨迹的平均路程时 间。
其中,TDj为从网格j出发的预期路程延误程度,M为从网格j出发至下一个网格的轨 迹数,Tjk为网格j出发至下一个网格的每条轨迹的行程时间,为网格j出发至下一个网格 的所有轨迹的行程时间均值
3)构建巡游路线选择行为模型,综合考虑预期收益率和总路程延误程度建立了网格路线 效用函数,基于效用最大化原理和Logit模型计算巡游出租车司机选择各路线方案的概率。
A、网格路线效用函数
基于线型效用函数构建网格路线效用函数:
Uij=αRij+βTTDij
其中,Uij为位于网格i的巡游出租车司机选择网格j路线方案的效用值,Rij为从网格i到 网格j的预期收益率,TTDij为从网格i到网格j的总路程延误程度,ε为代表不可观测因素影 响的常数项,α和β为不同变量对于效用值的影响权重系数。
B、巡游路线选择行为模型构建
位于网格i的巡游出租车司机有8种不同的选择,根据Multinomial Logit(MNL)模型公 式,位于网格i的巡游出租车司机在寻客时选择网格j(j∈Ki)的概率可以表示为以下公式。 其中,Uij为位于网格i的巡游出租车司机选择网格j这一路线方案的效用值,Ki为位于网格i 的巡游出租车司机可选的网格集合。
4)收集并处理出租车GPS数据,提取网格间巡游轨迹,标定模型参数,确定巡游出租 车寻客行为模型。
A、数据收集
收集一定范围内的出租车GPS数据,包括经纬度、车辆ID、行驶状态(如位置坐标、航 向、速度等)及营运状态(空驶、载客等)等信息。
B、数据清洗
由于出租车行驶过程中可能出现的信号较差、硬件设备故障等影响因素,GPS原始数据 中存在部分错误数据、冗余数据,因此从限定研究范围、数据错误、数据噪点、数据冗余四 个方面对原始数据进行数据清洗。
C、网格间巡游轨迹提取
基于网格变化点的时间序列巡游轨迹匹配算法,主要包括两个部分。第一部分旨在获取 网格变化点,网格变化点即出租车跨越网格边界时的轨迹点;第二部分旨在将网格变化点进 行匹配,将同一辆车的相邻网格变化点对应起来即可得到一段网格巡游轨迹。
D、模型参数标定
网格路线效用函数中变量的影响权重系数可以通过极大似然估计法求解似然函数的最大 值来进行标定。似然函数如下所示,其中N为研究区域内的网格数,K为在一个网格内巡游 出租车可选择的路线方案数,δin为选择结果,当选择结果为i时,δin的值为1,否则δin等于 0。
通过求解L*的最大值,可以标定出效用函数中的权重系数,然后可通过t检验或者Wald 检验等来检验模型的精度,进一步对解释变量进行筛选,最终确定效用函数的形式。
以上所述仅是本发明的优选实施方式,不用于限制本发明的范围,在阅读了本发明之后,本 领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

Claims (5)

1.一种基于GPS数据的巡游出租车寻客行为预测方法,其特征在于网格化研究区域,通过预期收益率和路程延误这两个因素来刻画巡游出租车司机的寻客行为,基于效用最大化原理和Logit模型进行建模并基于GPS数据标定模型,能够有效提高巡游出租车寻客行为预测水平;该方法包括如下步骤:
(1)网格化研究区域,建立网格索引,简化数据处理过程,确定巡游出租车的路线可选方案;
(2)计算影响变量,通过预期收益率和路程延误这两个因素来刻画巡游出租车司机的寻客行为;
(3)构建巡游路线选择行为模型,综合考虑预期收益率和总路程延误程度建立了网格路线效用函数,基于效用最大化原理和Logit模型计算巡游出租车司机选择各路线方案的概率;
(4)收集并处理出租车GPS数据,提取网格间巡游轨迹,标定模型参数,确定巡游出租车寻客行为模型。
2.根据权利要求1所述的基于GPS数据的巡游出租车寻客行为预测方法,其特征在于:所述步骤(1)包括如下步骤:
(1-1)通过将研究区域划分成网格的方式对巡游出租车寻客行为进行建模,位于网格i的空载出租车可能选择其毗邻的网格jn(n=1,2,3...8)继续巡游寻找乘客;
(1-2)将研究区域划分成N1*N2个均等网格,根据GPS数据中经纬度信息建立网格索引(X,Y)。
3.根据权利要求1所述的基于GPS数据的巡游出租车寻客行为预测方法,其特征在于:所述步骤(2)包括如下步骤:
(2-1)综合考虑消耗时间、消耗成本和预期收益三个主要因素,计算预期收益率:其中,Rij为从网格i到网格j的预期收益率,Cij为从网格i到网格j的消耗成本,Pj为目标网格j的预期收益,CTij为从网格i到网格j的消耗时间成本;
(2-2)通过行程时间标准差来衡量路程延误程度,计算总路程延误程度:TTDij=TDij+TDj,其中,TTDij为从网格i到网格j的总路程延误程度,TDij为从网格i到网格j的路程延误程度,TDj为从网格j出发的预期路程延误程度。
4.根据权利要求1所述的基于GPS数据的巡游出租车寻客行为预测方法,其特征在于:所述步骤(3)包括如下步骤:
(3-1)基于线型效用函数构建网格路线效用函数:Uij=αRij+βTTDij+ε,其中,Uij为位于网格i的巡游出租车司机选择网格j路线方案的效用值,Rij为从网格i到网格j的预期收益率,TTDij为从网格i到网格j的总路程延误程度,ε为代表不可观测因素影响的常数项,α和β为不同变量对于效用值的影响权重系数;
(3-2)构建巡游路线选择行为模型:其中,Uij为位于网格i的巡游出租车司机选择网格j这一路线方案的效用值,Ki为位于网格i的巡游出租车司机可选的网格集合。
5.根据权利要求1所述的基于GPS数据的巡游出租车寻客行为预测方法,其特征在于:所述步骤(4)包括如下步骤:
(4-1)收集一定范围内的出租车GPS数据,包括经纬度、车辆ID、行驶状态(如位置坐标、航向、速度等)及营运状态(空驶、载客等)等信息;
(4-2)从限定研究范围、数据错误、数据噪点、数据冗余四个方面对原始数据进行数据清洗;
(4-3)基于网格变化点的时间序列巡游轨迹匹配算法提取网格间巡游轨迹,第一部分旨在获取网格变化点,第二部分旨在将网格变化点进行匹配;
(4-3)网格路线效用函数中变量的影响权重系数可以通过极大似然估计法求解似然函数的最大值来进行标定,似然函数为其中N为研究区域内的网格数,K为在一个网格内巡游出租车可选择的路线方案数,δin为选择结果,当选择结果为i时,δin的值为1,否则δin等于0。
CN201910627260.4A 2019-07-12 2019-07-12 一种基于gps数据的巡游出租车寻客行为预测方法 Pending CN110533215A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910627260.4A CN110533215A (zh) 2019-07-12 2019-07-12 一种基于gps数据的巡游出租车寻客行为预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910627260.4A CN110533215A (zh) 2019-07-12 2019-07-12 一种基于gps数据的巡游出租车寻客行为预测方法

Publications (1)

Publication Number Publication Date
CN110533215A true CN110533215A (zh) 2019-12-03

Family

ID=68659676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910627260.4A Pending CN110533215A (zh) 2019-07-12 2019-07-12 一种基于gps数据的巡游出租车寻客行为预测方法

Country Status (1)

Country Link
CN (1) CN110533215A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784000A (zh) * 2021-01-27 2021-05-11 长沙理工大学 基于出租车轨迹数据的寻客方法
CN115526387A (zh) * 2022-09-16 2022-12-27 暨南大学 基于强化学习和动态定价机制的寻客路径推荐方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784000A (zh) * 2021-01-27 2021-05-11 长沙理工大学 基于出租车轨迹数据的寻客方法
CN115526387A (zh) * 2022-09-16 2022-12-27 暨南大学 基于强化学习和动态定价机制的寻客路径推荐方法

Similar Documents

Publication Publication Date Title
CN110298500B (zh) 一种基于出租车数据和城市路网的城市交通轨迹数据集生成方法
WO2021212866A1 (zh) 一种车辆出行量预测模型构建方法及预测方法和系统
CN104157139B (zh) 一种交通拥堵预测方法及可视化方法
CN109686090B (zh) 一种基于多源数据融合的虚拟交通流量计算方法
CN110288212B (zh) 基于改进的mopso的电动出租车新建充电站选址方法
CN109993223A (zh) 路面使用性能预测方法、存储介质、电子设备
CN113902011A (zh) 基于循环神经网络的城市轨道交通短时客流预测方法
CN107919014B (zh) 面向多载客里程的出租车运行线路优化方法
CN110390349A (zh) 基于XGBoost模型的公交车客流量预测建模方法
CN107729938B (zh) 一种基于公交接驳辐射区特征的轨道站点分类方法
CN109544929A (zh) 一种基于大数据的车辆低碳控制与诱导方法、系统、设备和存储介质
CN107832779B (zh) 一种轨道站点分类系统
CN112784000B (zh) 基于出租车轨迹数据的寻客方法
CN111583628B (zh) 基于数据质量控制的道路网重型货车交通流量预测方法
CN114187766B (zh) 一种基于饱和率的道路服务水平评价方法
CN116720997A (zh) 一种基于大数据分析的公交线路评价体系及优化方法
CN109840272B (zh) 一种共享电动汽车站点用户需求预测方法
CN110533215A (zh) 一种基于gps数据的巡游出租车寻客行为预测方法
CN109493449A (zh) 一种基于货车gps轨迹数据和高速交易数据的货车载货状态估计方法
CN109489679A (zh) 一种导航路径中的到达时间计算方法
CN116502781A (zh) 基于gps数据的公交线路规划与影响因素可视分析方法
CN111723871B (zh) 一种公交车实时车厢满载率的估算方法
CN113408833A (zh) 一种公共交通重点区域识别方法、装置及电子设备
CN111126878B (zh) 一种基于生态指数的城市交通运行评价方法
CN106682759B (zh) 针对电动出租车的电池供应系统及网络优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191203