CN110197293A - 基于浮动车数据的分时租赁汽车出行需求预测方法和系统 - Google Patents

基于浮动车数据的分时租赁汽车出行需求预测方法和系统 Download PDF

Info

Publication number
CN110197293A
CN110197293A CN201910299537.5A CN201910299537A CN110197293A CN 110197293 A CN110197293 A CN 110197293A CN 201910299537 A CN201910299537 A CN 201910299537A CN 110197293 A CN110197293 A CN 110197293A
Authority
CN
China
Prior art keywords
data
car
intermediate data
timesharing
timesharing rent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910299537.5A
Other languages
English (en)
Inventor
李晔
骆晓
沈智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201910299537.5A priority Critical patent/CN110197293A/zh
Publication of CN110197293A publication Critical patent/CN110197293A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled

Abstract

一种基于浮动车数据的分时租赁汽车出行需求预测方法,包括步骤:对从浮动车接收到的OD数据进行洗牌操作,获得第一中间数据;对第一中间数据进行预处理,剔除不可用数据,获得第二中间数据;根据分时租赁汽车的分时数据对第二中间数据进行切分,对应每个分时数据,将第二中间数据分割为多个数据集;根据每个数据集中的样本建立对应的预测模型;利用获得的预测模型对分时租赁汽车的出行需求进行预测。

Description

基于浮动车数据的分时租赁汽车出行需求预测方法和系统
技术领域
本发明属于交通大数据技术领域,特别涉及一种基于浮动车数据的分时租赁汽车出行需求预测方法和系统。
背景技术
随着经济的快速发展,越来越多的人选择机动车作为交通工具,机动车数量的急剧增长给城市交通带来巨大的压力,造成频繁的交通拥堵。“智能”的交通系统是缓解交通拥堵的有效方式。如何对出行需求进行测定缓解交通问题,逐渐成为当下关注问题之一。
其中,由于出租车是道路行车的重要组成部分,出租车的很多出行特征,很适合用于收集道路行车数据,出租车的出行数据也能在很大程度上代表着交通的一些特征。因此,出租车作为浮动车,可以为智能交通控制和交通诱导提供必须要的实时路况感知信息。通过对获取的交通数据进行实时采集和分析,不仅可以及时得到路网各处的实时交通状况,还能准确发现拥堵区域,掌握路网态势,从而为城市交通系统提供诱导及控制策略。
浮动车技术作为近年来快速发展的交通数据采集技术,由于其数据的数据量大,时效性强,准确性高,和相对的客观性等优点,在交通数据的采集中应用越来越广。其中,OD数据交通数据中一项关键的基础数据,它可以反映实际交通路网中的真实交通分布。OD数据即交通起止点数据,又称OD交通量数据,OD数据就是指起终点间的交通出行数据。“O”来源于英文ORIGIN,指出行的出发地点,“D”来源于英文DESTINATION,指出行的目的地。无论是进行交通网的规划,还是对城市进行合理的交通控制,OD数据所表达的OD矩阵起着很重要的作用。此外,在交通仿真系统中,OD矩阵也是基本的仿真输入数据。早期的静态OD矩阵估计方法都是采用交通调查问卷,电话询问方式进行,这种方法时效性差,耗费巨大。
现有的关于公共交通OD矩阵的估计的研究重点在于,如何得到一个通用并且有效的算法。在动态OD矩阵估计方面常用的算法有:最大似然法、广义最小二乘法、极大熵法,BP-神经网络法等。1991年,基于交通控制中心和车辆之间的相互通信规定,使得有效的动态OD矩阵的连续估计称为可能。2000年交通控制以及交通信息服务在很大程度上依赖路网信息的精确性,通过浮动车技术,精确的测量了城市内复杂的道路网络中以及高速公路网络中车辆的行驶时间以及获取精确的OD矩阵。2015年提出了两阶段的过程,来获取所调查路网中的OD矩阵。在数据采集方面,非人工调查法逐渐兴起,由于非人工调查法收集的数据一般为实时数据,所以时效性较强,其应用越来越广。
发明内容
本发明实施例之一,一种基于浮动车数据的分时租赁汽车出行需求预测方法,包括以下步骤:
对从浮动车接收到的OD数据进行洗牌操作,获得第一中间数据;
对第一中间数据进行预处理,剔除不可用数据,获得第二中间数据;
根据分时租赁汽车的分时数据对第二中间数据进行切分,对应每个分时数据,将第二中间数据分割为多个数据集;
根据每个数据集中的样本建立对应的预测模型;
利用获得的预测模型对分时租赁汽车的出行需求进行预测。
本发明与现有技术相比的优势:
(1)在数据的处理方面使用数据的洗牌使数据更易操作,更有代表性,对于模型来说减少了过拟合的可能。
(2)过往的浮动数据大多是利用全数据,但由于需求的不同,本发明采用了分时情况下的数据,并建立分时高斯生成模型,使利用的数据更加集中,预测精确更好。
(3)根据需求建立的分时高斯生成模型,相比于其他能更好的适应分时租赁汽车出行需求。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1根据本发明实施例之一的方法流程示意图。
图2根据本发明实施例之一的分时模型示意图。
图3根据本发明实施例之一的单个-分时高斯模型图例
具体实施方式
如图1所示,本方法基于浮动车数据,得到分时租赁汽车OD数据(上、下车点)信息,即根据上下车的OD数据推测可能的交通出行。使用浮动车数据,建立预测模型,根据已有的分时租赁的数据进行预测。主要包括如下几个步骤;
1.浮动车数据的处理。以出租车为例,由于出租车机动、灵活,不受道路约束,可以认为乘客的上下车点为出行的始终点。对于出租车的GPS数据进行研究和处理,以此来获得OD点信息。因为每天的数据量过多,使用数据的洗牌操作,也可以称为shuffle操作(shuffle的中文翻译为洗牌),使得数据方便处理,同时具有整体数据的代表性。可以假设洗牌-[30%]的数据。
2.浮动车的OD数据预处理。由于GPS存在精确度不够,大气层会对信息传输具有影响,或者建筑物或其他人为、非人为因素影响,造成些许误差。实施需将样本数据的经纬度更加严格的控制在一定范围内,如确切的控制经度在(121.111,121.112)之间,另外删除以下因传输问题导致的某属性数据缺失的数据,同时对于洗牌(35%)的数据,若具有数据的损失(如,有O没有D等数据)进行删除。
3.对于不可用数据的处理和特殊情况数据的处理,如一些空载等情况的处理;
4.将根据分时数据对OD数据按照时间间隔进行切分,即出行起点到出行终点所花费的时间进行切分,如所有的时间间隔为1切分为一个数据集,实现对应的每个分时数据成为一个数据集dataset;对每个数据集dataset中具有一定样本数量的样本抽出建立一个单独的模型。
5.建立分时的预测模型(生成模型)。
6.利用模型对分时租赁数据进行预测。
由于按照时间间隔进行数据分割,并对分割好的数据单独建立模型,能够通过模型了解在每个时间段中到在每个O点去往D点的概率,通过求取均值便能获取在该起点,该时间段的行驶平均距离,和终点的热力分布,由于面对分时租赁,能够获取到租赁的时长,故能大致了解到分时租赁的行驶距离需求以及行驶终点需求等;方便租赁站点的设立等决策。
其中,步骤4中,对于根据分时数据对OD数据按照时间间隔切分,如表1所示的切分方法。
表1分时数据切割
DataSet(按时间分类) Data(*)
dataset-1(time-length=1)
.........
dataset-n(time-length=n)
time–length为时间长度。对于表1中的分时数据切割-Data(*)如表2所示。
表2分时数据Data
Data O(起点) D(终点)
data-1(index=1)
.........
data-m(index=m)
结合表2和图2,每个dataset-i中有不同的O(起点),以起点建立模型,选择具有一定样本数量的数据,抽出建立模型。对于少数数据中只有O(起点)的情况,则省略操作,原因如下:
若只有一个O(起点),则说明这是特例样本,没有说明性;
若只有一个O(起点),很难建立模型;
若只有一个O(起点),则建立模型数量太多;计算数量过大。
进一步,对分时高斯模型有如下假设。
如果对于图2的分时模型,满足高斯分布,即对于每个起点,其终点的选择具有高斯分布的特征;
对于个人的选择具有自主性,自由性;
样本数据的数量满足一定数目,以免一些特殊样本造成影响。
分时高斯模型图例如图3所示。对于每个高斯模型,利用似然性,利用已知数据(样本)使用最大似然函数求出高斯模型的均差和方差,同时可利用条件概率,贝叶斯定理,求出相应的参数P(X|Y)。图2和图3中的Model-i,是指第i个模型。
对于步骤6,用模型进行预测。对于每个输入,根据对应的分时,找到对应的O(起点),更具建立的模型,输出结果即可。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (3)

1.一种基于浮动车数据的分时租赁汽车出行需求预测方法,其特征在于,包括以下步骤:
对从浮动车接收到的OD数据进行洗牌操作,获得第一中间数据;
对第一中间数据进行预处理,剔除不可用数据,获得第二中间数据;
根据分时租赁汽车的分时数据对第二中间数据进行切分,对应每个分时数据,将第二中间数据分割为多个数据集;
根据每个数据集中的样本建立对应的预测模型;
利用获得的预测模型对分时租赁汽车的出行需求进行预测。
2.根据权利要求1所述的基于浮动车数据的分时租赁汽车出行需求预测方法,其特征在于,对第二中间数据进行切分时,采用高斯模型。
3.一种基于浮动车数据的分时租赁汽车出行需求预测系统,其特征在于,预测系统包括:
数据接收模块,用于从浮动车接收到的OD数据;
数据处理模块,对从浮动车接收到的OD数据进行洗牌操作,获得第一中间数据;对第一中间数据进行预处理,剔除不可用数据,获得第二中间数据;根据分时租赁汽车的分时数据对第二中间数据进行切分,对应每个分时数据,将第二中间数据分割为多个数据集;
模型建立模块,根据每个数据集中的样本建立对应的预测模型;
预测模块,利用获得的预测模型对分时租赁汽车的出行需求进行预测。
CN201910299537.5A 2019-04-15 2019-04-15 基于浮动车数据的分时租赁汽车出行需求预测方法和系统 Pending CN110197293A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910299537.5A CN110197293A (zh) 2019-04-15 2019-04-15 基于浮动车数据的分时租赁汽车出行需求预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910299537.5A CN110197293A (zh) 2019-04-15 2019-04-15 基于浮动车数据的分时租赁汽车出行需求预测方法和系统

Publications (1)

Publication Number Publication Date
CN110197293A true CN110197293A (zh) 2019-09-03

Family

ID=67751940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910299537.5A Pending CN110197293A (zh) 2019-04-15 2019-04-15 基于浮动车数据的分时租赁汽车出行需求预测方法和系统

Country Status (1)

Country Link
CN (1) CN110197293A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295326A (zh) * 2008-05-30 2008-10-29 同济大学 基于gps数据生成od矩阵的方法及其交通仿真的方法
CN103927872A (zh) * 2014-04-28 2014-07-16 武汉大学 一种基于浮动车数据预测多时段行程时间分布的方法
CN105117595A (zh) * 2015-08-19 2015-12-02 大连理工大学 一种基于浮动车数据的私家车出行数据集成方法
CN106023588A (zh) * 2016-06-15 2016-10-12 重庆云途交通科技有限公司 一种基于交通大数据的行程时间提取、预测及查询方法
WO2018122585A1 (zh) * 2016-12-30 2018-07-05 同济大学 一种基于浮动车数据的城市道路交通异常检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295326A (zh) * 2008-05-30 2008-10-29 同济大学 基于gps数据生成od矩阵的方法及其交通仿真的方法
CN103927872A (zh) * 2014-04-28 2014-07-16 武汉大学 一种基于浮动车数据预测多时段行程时间分布的方法
CN105117595A (zh) * 2015-08-19 2015-12-02 大连理工大学 一种基于浮动车数据的私家车出行数据集成方法
CN106023588A (zh) * 2016-06-15 2016-10-12 重庆云途交通科技有限公司 一种基于交通大数据的行程时间提取、预测及查询方法
WO2018122585A1 (zh) * 2016-12-30 2018-07-05 同济大学 一种基于浮动车数据的城市道路交通异常检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
乔少杰 等: "一种基于高斯混合模型的轨迹预测算法", 《软件学报》 *
唐克双 等: "《基于多元数据融合的城市道路交通控制与管理》", 30 September 2015 *
杜雨: "机器学习笔记——数据集分割", 《知乎》 *
杨东援 等: "《大数据环境下城市交通分析技术》", 31 January 2015 *
陈金升: "新能源汽车分时租赁需求预测及调度方法研究", 《武汉大学硕士学位论文》 *

Similar Documents

Publication Publication Date Title
CN107241512B (zh) 基于手机数据的城际交通出行方式判断方法和设备
CN103593974B (zh) 一种基于定位信息的公交载客量采集方法
Ma et al. Transit smart card data mining for passenger origin information extraction
CN108198425A (zh) 一种电动汽车行驶工况的构建方法
CN102024325B (zh) 基于浮动车技术的交通堵塞点识别方法
CN103226892B (zh) 一种优化型的道路拥塞状态发现方法
CN104424812B (zh) 一种公交到站时间预测系统和方法
CN102968494B (zh) 通过微博采集交通信息的系统及方法
CN111932925A (zh) 一种公共交通站点的出行客流的确定方法、装置及系统
CN115436972A (zh) 基于重载货车gps轨迹识别停留点的方法、系统及介质
CN107564290A (zh) 一种城市道路交叉口饱和流率计算方法
CN106931981A (zh) 一种导航剩余时间的生成方法及装置
CN110807917A (zh) 一种基于云计算的高速公路智能安防系统
CN109360420B (zh) 一种公共交通大数据处理系统与方法
CN110021161B (zh) 一种交通流向的预测方法及系统
CN109410576A (zh) 多源数据融合的路况分析方法、装置、存储介质及系统
CN111524353A (zh) 一种交通文本数据用于速度预测及行程规划方法
CN110889444B (zh) 一种基于卷积神经网络的驾驶轨迹特征分类方法
CN108876064A (zh) 基于客流量的城市轨道交通网络关键车站识别方法
CN111724593A (zh) 一种基于rfid考虑交通流转移率的公交行程时间预测方法
CN114596709A (zh) 数据处理方法、装置、设备以及存储介质
CN111444286B (zh) 一种基于轨迹数据的远距离交通节点关联性挖掘方法
CN112699955A (zh) 一种用户分类方法、装置、设备及存储介质
CN112669595A (zh) 一种基于深度学习的网约车流量预测方法
CN110197293A (zh) 基于浮动车数据的分时租赁汽车出行需求预测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190903