CN110264744A - 一种基于多元数据的交通流量预测算法 - Google Patents

一种基于多元数据的交通流量预测算法 Download PDF

Info

Publication number
CN110264744A
CN110264744A CN201910511038.8A CN201910511038A CN110264744A CN 110264744 A CN110264744 A CN 110264744A CN 201910511038 A CN201910511038 A CN 201910511038A CN 110264744 A CN110264744 A CN 110264744A
Authority
CN
China
Prior art keywords
data
sample
section
traffic
taxi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910511038.8A
Other languages
English (en)
Other versions
CN110264744B (zh
Inventor
骆晓
沈智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201910511038.8A priority Critical patent/CN110264744B/zh
Publication of CN110264744A publication Critical patent/CN110264744A/zh
Application granted granted Critical
Publication of CN110264744B publication Critical patent/CN110264744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/04Detecting movement of traffic to be counted or controlled using optical or ultrasonic detectors
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多元数据的交通流量预测算法,本次方法基于路口红外仿真数据、出租车GPS数据、手机信令数据针对低数据量样本对交通流量进行预测,方法需要使用非参数回归与仿真数据。本发明与现有技术相比的优势:本方法比较适合数据样本较小的情况;对于数据的利用,利用仿真数据与其他多元数据相结合,在样本较小的情况下具有较大可靠性;对于神经网络,该方式具有较强的推广性,不仅仅局限在某一数据集。

Description

一种基于多元数据的交通流量预测算法
技术领域
本发明涉及一种交通流量预测算法,具体为一种基于多元数据的交通流量预测算法。
背景技术
交通流量预测在智能交通系统中占有重要地位,是实现交通诱导的前提。准确实时的短时交通流预测有助于更好的分析路网交通状况,对路网交通规划和交通优化控制有非常重要的作用。随着交通数据采集技术的不断发展,及时获取路网中实时的交通数据已成为可能。
目前,世界各国专家与学者利用各领域的方法,开发出了各种预测模型用于交通流预测,大概可以分成七类模型:基于统计方法的模型、动态交通分配的模型、交通仿真模型、非参数回归模型、神经网络模型、基于混沌理论的模型、综合模型等。对于基于统计方法的模型,会利用历史数据进行预测,并且假设预测的数据与过去的数据具有相同的特性,但大部分模型是基于线性的基础,当交通流变化较大时,预测效果会比较低,对于动态交通分配模型,该模型是通过采集到的交通数据和出行者出行选择的行为来估计时间变换的网络状态,但缺点是,信息获取困难,并且有些模型无法求解并且优化时间较长。对于神经网络模型,神经网络具有识别复杂非线性问题的特性,交通系统复杂很适合此模型,但是缺点是训练过程中需要大量的原始数据,数据不足预测效果较差,并且训练完成的网络推广能力差。
通过上述分析,可以看出任何一个模型都具有其优势和缺点,单个模型都存在其局限性,基于传统的统计理论已经不能满足复杂的交通系统的精度要求,为了提高预测的精度和可靠性,应博采众长,选取适合我国交通流特性的交通流预测综合模型。
发明内容
本发明的目的是为了提供一种基于多元数据的交通流量预测算法,以解决现有技术的上述问题。
本发明的目的是通过以下技术方案来实现的。
本次方法基于路口红外仿真数据、出租车GPS数据、手机信令数据针对低数据量样本对交通流量进行预测,方法需要使用非参数回归与仿真数据。
一种基于多元数据的交通流量预测算法,其步骤为:
(9)在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;
(10)将计数器的值以5取整;
(11)根据zipf定理,对多个计数器数据进行处理,zipf定率提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中(简单的说,多个计数器中的值将出现多次,如130将出现多次)称这些出些频率高的数据为“真”数据,确定数量K(小于计数器数量),在计算器中找出频率最高的K个数作为该路段的有效交通流量基础数据;
(12)对于上述求解K个频率最高的数,利用基数桶与MG算法进行空间与时间的优化,具体描述如流程图与简要说明所示;
(13)根据K个数据值计算均值A作为该路段的交通流量;
(14)由于利用红外计算器精度与现实存在误差ε,ε=|A-y|,y代表真实值,一般的,y≥A,本次方法使用出租车GPS数据与分时租赁的OD等数据作为弥补误差的差值项,出租车的GPS数据等可以得到在样本数据中该类汽车出现在该路段的可能性。例如在出租车样本中,在该路段只出现10次,则出现在该类样本中出现出租车的概率为m为样本数。先得到该地的全部出租车与分时租赁车辆为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;
(15)样本交通流量样本变更为A+M+N;
(16)利用非参数回归(局部加权回归方式)对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律(即只利用前T分钟的数据对该时间该路段的交通路段进行预测),预测结果为R1。
本发明与现有技术相比的优势:
(1)本方法比较适合数据样本较小的情况;
(2)对于数据的利用,利用仿真数据与其他多元数据相结合,
在样本较小的情况下具有较大可靠性;
(3)对于神经网络,该方式具有较强的推广性,不仅仅局限在某一数据集。
附图说明
图1为本发明的具体操作流程图;
图2为基数桶数据结构图;
图3为检测器检测结果模型图。
具体实施方式
下面结合具体实施例与附图进一步阐述本发明的技术特点。
如图1所示的一种基于多元数据的交通流量预测算法,其步骤为:在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;将计数器的值以5取整;根据zipf定理,对多个计数器数据进行处理,zipf定率提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中(简单的说,多个计数器中的值将出现多次,如130将出现多次)称这些出些频率高的数据为“真”数据,确定数量K(小于计数器数量),在计算器中找出频率最高的K个数作为该路段的有效交通流量基础数据;对于上述求解K个频率最高的数,利用基数桶与MG算法进行空间与时间的优化,具体描述如流程图与简要说明所示;根据K个数据值计算均值A作为该路段的交通流量;由于利用红外计算器精度与现实存在误差ε,ε=|A-y|,y代表真实值,一般的,y≥A,本次方法使用出租车GPS数据与分时租赁的OD等数据作为弥补误差的差值项,出租车的GPS数据等可以得到在样本数据中该类汽车出现在该路段的可能性。例如在出租车样本中,在该路段只出现10次,则出现在该类样本中出现出租车的概率为m为样本数。先得到该地的全部出租车与分时租赁车辆为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;样本交通流量样本变更为A+M+N;利用非参数回归(局部加权回归方式)对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律(即只利用前T分钟的数据对该时间该路段的交通路段进行预测),预测结果为R1。
基数桶与MG算法:道路上存放N个检测器,分别检测到的数据将依次存放至基数桶中。根据Zipf定理,可以确定基数桶结构是有效的。基数是集合论中的一个概念,将相似的数据放入一个基数桶,并保证基数桶中各集合各自保证非递减有序,数据i进入基数桶中只需进入该对应集合,数据i进入基数桶时对数据的最高位进行划分,如:10最的高位是1,则进入1号基数桶,20的最高位是2,则进入2号基数桶,其优势在于与其他数据保持独立性,当有新的数据进入基数桶如40进入基数桶,只需考虑基数4中集合所存在的元素,由于非递减有序特性,利用插入排序对数据进行增加或者更新,具体的基数桶数据结构图如下2所示:
利用红外检测器检测道路流动车流量,并做出如下假设:1、道路是单向的;2、道路没有交叉口;
根据上述假设可以得出:在单向无交叉口的一段连续的道路上的检测器在单位时间内测定的数据值大部分是相同的或是相似连续的(车流量并不能突变)下图3表示在以上假设下检测器检测结果模型图:
当a测出值为5,那么b测出的值应与a的检测值相同或相差车道数m的倍数,且a,b检测值差值不大。根据以上假设推论:如果道路拥有交叉口,那在两条交叉口之间的检测器中的数据大部分是相同的。利用Zipf定理可以得到一个大致的模型,大部分(以90%为例)的道路情况的数据占所有道路情况数据值的10%(10%的数据值分布在不同的路口,有岔路等地),我们可以称这90%的数据是有效数据,剩下10%的数据是无效数据,但这90%的数据中不同的数字只占全部数据的10%,根据以上论述可以得出随机化的合理性和有效性,算法描述如下1所示:
算法1 MG替换算法
实施例:
对数据进行整理,所需数据集样表如下所示,选区K为5,样本例表如下所示:
表1实验数据样表
上述求取平均值为(30+35+45+50+55)/5=43,则一个时间的车流量为43辆,对于非参数回归,只选取T分钟前的数据作为训练样本,这里T取20;
将20组数据传入以下代码进行回归计算,得到结果即可:
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (1)

1.一种基于多元数据的交通流量预测算法,其特征在于:其步骤为:
(1)在路口放置多个红外线计数器,车辆每通过一次路口,红外计数器加一;
(2)将计数器的值以5取整;
(3)根据zipf定理,对多个计数器数据进行处理,zipf定率提到:一个单词出现的次数与它在频率表里的排名成反比,即少数数量值将出现在多数的数据中称这些出些频率高的数据为“真”数据,确定数量K,在计算器中找出频率最高的K个数作为该路段的有效交通流量基础数据;
(4)对于上述求解K个频率最高的数,利用基数桶与MG算法进行空间与时间的优化,具体描述如流程图与简要说明所示;
(5)根据K个数据值计算均值A作为该路段的交通流量;
(6)由于利用红外计算器精度与现实存在误差ε,ε=|A-y|,y代表真实值,一般的,y≥A,本次方法使用出租车GPS数据与分时租赁的OD等数据作为弥补误差的差值项,出租车的GPS数据等可以得到在样本数据中该类汽车出现在该路段的可能性。例如在出租车样本中,在该路段只出现10次,则出现在该类样本中出现出租车的概率为m为样本数。先得到该地的全部出租车与分时租赁车辆为M1,N1,乘上该路段的出行概率为出现在该路段的车辆数M,N;
(7)样本交通流量样本变更为A+M+N;
(8)利用非参数回归对该路段交通流量进行预测:确定该时间该路段的交通流量只与前T分钟的历史数据具有相同统计规律,预测结果为R1。
CN201910511038.8A 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法 Active CN110264744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910511038.8A CN110264744B (zh) 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910511038.8A CN110264744B (zh) 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法

Publications (2)

Publication Number Publication Date
CN110264744A true CN110264744A (zh) 2019-09-20
CN110264744B CN110264744B (zh) 2022-05-27

Family

ID=67918103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910511038.8A Active CN110264744B (zh) 2019-06-13 2019-06-13 一种基于多元数据的交通流量预测算法

Country Status (1)

Country Link
CN (1) CN110264744B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881162A (zh) * 2012-09-29 2013-01-16 北京市交通信息中心 大规模交通信息的数据处理及融合方法
CN103280098A (zh) * 2013-05-23 2013-09-04 北京交通发展研究中心 交通拥堵指数计算方法
CN105261212A (zh) * 2015-09-06 2016-01-20 中山大学 一种基于出租车gps数据地图匹配的出行时空分析方法
CN107481533A (zh) * 2017-09-23 2017-12-15 山东交通学院 一种交通流预测系统及方法
DE102018000016A1 (de) * 2017-01-10 2018-07-12 Scania Cv Ab Verfahren und System zum Abschätzen von Verkehrsfluss

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881162A (zh) * 2012-09-29 2013-01-16 北京市交通信息中心 大规模交通信息的数据处理及融合方法
CN103280098A (zh) * 2013-05-23 2013-09-04 北京交通发展研究中心 交通拥堵指数计算方法
CN105261212A (zh) * 2015-09-06 2016-01-20 中山大学 一种基于出租车gps数据地图匹配的出行时空分析方法
DE102018000016A1 (de) * 2017-01-10 2018-07-12 Scania Cv Ab Verfahren und System zum Abschätzen von Verkehrsfluss
CN107481533A (zh) * 2017-09-23 2017-12-15 山东交通学院 一种交通流预测系统及方法

Also Published As

Publication number Publication date
CN110264744B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN114091359B (zh) 一种水库水沙预测模型训练、水库水沙预测方法及装置
Zheng et al. U-air: When urban air quality inference meets big data
CN107529651A (zh) 一种基于深度学习的城市交通客流预测方法和设备
Nagle et al. Accuracy of networkwide traffic states estimated from mobile probe data
CN104408924B (zh) 一种基于耦合隐马尔可夫模型的城市道路异常交通流检测方法
CN105741549B (zh) 一种基于空间copula理论的交通流量预测方法
CN110264711A (zh) 一种交通事故概率的确定方法及装置
CN106845768A (zh) 基于生存分析参数分布的公交车旅行时间模型构建方法
CN104636828A (zh) 基于马尔科夫链的公共自行车站点供需预测方法
CN101465059B (zh) 城市道路交通安全态势鉴判预警系统
CN103163278A (zh) 基于数值模式与统计分析结合的大气重污染预报方法
CN106898142B (zh) 一种考虑路段相关性的路径行程时间可靠度计算方法
CN106228808A (zh) 基于浮动车时空网格数据的城市快速路旅行时间预测方法
CN105405293A (zh) 一种道路旅行时间短期预测方法和系统
CN105976077A (zh) 一种输变电工程造价动态控制目标计算系统及计算方法
CN105243503A (zh) 基于空间变量和logistic回归的海岸带生态安全评估方法
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
Chen Analysis and forecast of traffic accident big data
Cheng et al. Developing a travel time estimation method of freeway based on floating car using random forests
Lin et al. Air quality forecasting based on cloud model granulation
CN108765961A (zh) 一种基于改进型限幅平均滤波的浮动车数据处理方法
CN104077483A (zh) 城轨车辆部件故障模式和故障原因综合影响度的确定方法
CN105303835B (zh) 一种道路交通流状态的短时预测方法
CN106228268A (zh) 一种基于收费数据的高速公路旅行时间的预测方法
CN105825675B (zh) 一种基于大数据的路段旅行时间计算方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant