CN111860621B - 一种数据驱动的分布式交通流量预测方法及系统 - Google Patents
一种数据驱动的分布式交通流量预测方法及系统 Download PDFInfo
- Publication number
- CN111860621B CN111860621B CN202010630479.2A CN202010630479A CN111860621B CN 111860621 B CN111860621 B CN 111860621B CN 202010630479 A CN202010630479 A CN 202010630479A CN 111860621 B CN111860621 B CN 111860621B
- Authority
- CN
- China
- Prior art keywords
- data
- traffic flow
- time interval
- road section
- target road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012545 processing Methods 0.000 claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 51
- 238000007781 pre-processing Methods 0.000 claims abstract description 31
- 230000008569 process Effects 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000009499 grossing Methods 0.000 claims description 22
- 239000003638 chemical reducing agent Substances 0.000 claims description 11
- 239000000203 mixture Substances 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 38
- 238000013528 artificial neural network Methods 0.000 description 17
- 230000009286 beneficial effect Effects 0.000 description 14
- 238000013075 data extraction Methods 0.000 description 9
- 230000010354 integration Effects 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 4
- 238000005315 distribution function Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 244000207667 Rumex vesicarius Species 0.000 description 1
- 235000002905 Rumex vesicarius Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0133—Traffic data processing for classifying traffic situation
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/065—Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据驱动的分布式交通流量预测方法及系统,其中方法包括以下步骤:S1:获取车辆的移动轨迹数据;S2:对所述移动轨迹数据进行预处理,获得训练数据;S3:根据所述训练数据构建分布式TWND‑LSTM模型;S4:分别在Map、Combine和Reduce阶段实现所述分布式TWND‑LSTM模型,并输出预测结果。通过在Hadoop分布式计算平台下,基于MapReduce并行处理框架,获得训练数据,构建分布式TWND‑LSTM模型,并分别在Map、Combine和Reduce阶段实现所述分布式TWND‑LSTM模型,输出预测结果,有效提高了预测的精确性、鲁棒性和实时性,解决了交通流量大数据的分布式存储和并行计算的技术问题。
Description
技术领域
本发明涉及交通流量预测领域,尤其涉及一种数据驱动的分布式交通流量预测方法及系统。
背景技术
在大数据驱动的智能交通时代,交通流量预测是城市交通系统诱导和城市交通管控的关键技术,是利用当前和历史的交通流量信息对未来的交通流量进行预测,进而帮助出行者进行路径规划,缓解交通拥堵和减少环境污染等城市问题。
传统的交通流量预测方法存在预测精度低,适应性差等缺陷,尤其是随着交通大数据的爆炸式增长,现有集中式学习模型在基于传统单机串行计算平台的交通流量预测时存在“内存消耗与I/O开销高、处理效率低和扩展性能差”的技术问题。同时,现有技术在交通流量预测中仅考虑时间维度而忽略目标路段上下游的交通状况,以及并未充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
目前,长短期记忆神经网络(LSTM)模型适合处理时效数据,在交通流量预测模型中备受青睐。但是现有传统的集中式LSTM模型在交通流量预测中(尤其是在基于大规模移动轨迹数据的交通流量预测中)存在“内存消耗高、I/O开销大、数据传输耗时、计算性能低”等问题,无法有效解决交通流量大数据的分布式存储和并行计算的技术问题。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种数据驱动的分布式交通流量预测方法及系统,具有预测精度高,能有效解决交通流量大数据的分布式存储和并行计算的技术问题。
本发明解决上述技术问题的技术方案如下:一种数据驱动的分布式交通流量预测方法,包括以下步骤:
S1:获取车辆的移动轨迹数据;
S2:对所述移动轨迹数据进行预处理,获得训练数据;
S3:根据所述训练数据构建分布式TWND-LSTM模型;
S4:分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果。
本发明的有益效果是,获得移动轨迹构建分布式TWND-LSTM模型并分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,输出预测结果,有效提高预测精确性、鲁棒性和实时性,解决了交通流量大数据的分布式存储和并行计算的技术问题。
进一步,在Hadoop分布式计算平台下,基于MapReduce并行处理框架,所述S2具体包括:
S201:根据所述移动轨迹数据提取目标路段在当前时间间隔t内出现感兴趣区域的车辆轨迹;
S202:根据所述车辆轨迹统计目标路段在当前时间间隔t内的车辆数量;
S203:将所述目标路段在当前时间间隔t内的车辆总数进行平滑处理获得训练数据。
采用上述进一步方案的有益效果是,将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响,通过在Hadoop分布式计算平台下,基于MapReduce并行处理框架解决了交通流量大数据的分布式存储和并行计算的技术问题。
进一步,所述S2中S201在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map阶段,定义键值对<key1,value1>,其中key1表示时间和车辆ID,value1表示区域位置的编号;
在Reduce阶段,首先对所述时间和所述车辆ID进行排序,接着去除所述当前时间间隔t内同一车辆的重复数据,获得所述当前时间间隔t内出现感兴趣区域的车辆轨迹。
采用上述进一步方案的有益效果是,将采集的移动轨迹数据在Hadoop分布式计算平台下,基于MapReduce并行处理框架进行预处理,去除重复数据,有效提高预测精度,减少计算量,解决交通流量大数据的分布式存储和并行计算的技术问题。
进一步,所述S2中S202在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map阶段,读取所述当前时间间隔t内出现感兴趣区域的车辆轨迹,并定义键值对<key2,value2>,其中key2表示时间和所述区域位置的编号,value2则增加计数1;
在Reduce阶段,统计所述当前时间间隔t内的车辆数量。
进一步,所述S2中S203在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map任务中,读取所述当前时间间隔t内的车辆数量,并定义键值对<key3,value3>,其中key3表示时间间隔,value3表示各目标路段的车辆总数,接着被直接输入到Reduce阶段的HDFS中并进行平滑处理,处理后的数据作为所述训练数据。
采用上述进一步方案的有益效果是,将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响。
进一步,所述S3具体包括:
S301:通过正态分布对所述训练数据进行计算获得权重;
S302:将所述权重引入LSTM模型,对所述LSTM进行加权求代价获得流量时序数据;
S303:采用窗口平滑方法处理所述流量时序数据,并通过目标路段i在当前时间间隔t内的交通流量提取目标路段在历史相邻时间间隔t内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,训练好的模型为所述TWND-LSTM模型。
采用上述进一步方案的有益效果是,先通过正态分布对LSTM神经网络进行加权求代价获得流量时序数据,组成随时间单一变量序列以预测变量在未来时间间隔的交通流量,以提高交通流量预测的鲁棒性和准确性;其次,任意目标路段在未来时间间隔t内的交通流量,均可由该目标路段及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,以解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
进一步,所述S301具体包括:
S3011:设正态分布u均值为目标路段i的交通流量,δ为经验值,x为各路段交通流量离散值,则计算权重的表达式为:
采用上述进一步方案的有益效果是,根据正态分布的分布函数可知,当用来预测的数据越靠近均值u时,预测的结果越准,则权值越大,将正态分布与LSTM神经网络相结合,利用正态分布计算出的权值对LSTM神经网络进行加权求代价,有效提高预测精度。
进一步,所述S303具体包括:
S3031:设目标路段i在当前时间间隔t的交通流量为提取目标路段在历史相邻时间间隔内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,则公式表达式为:
采用上述进一步方案的有益效果是,提取目标路段在历史相邻时间间隔t内的交通流量组成大小为4的窗口,任意目标路段i在未来时间间隔t内的交通流量,均可由该目标路段i及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
进一步,所述S4具体包括:
S401:在所述Map阶段,使用Mapper函数从所述HDFS中接收每行数据集为不同的键值对<key,value>,并且输出中间数据至Combiner函数;
S402:在所述Combine阶段,使用Combiner函数提取所述Mapper函数的计算结果,并根据同样key值对所述中间数据进行排序,并且输出结果至Reducer函数;
S403:在所述Reduce阶段,使用Reducer函数首先获取Combiner函数的局部结果,接着从所述中间数据中聚合同样key值的value值,最后输出全局结果,所述全局结果为所述预测结果。
采用上述进一步方案的有益效果是,在Hadoop分布式计算平台下,基于MapReduce并行处理框架在Map阶段、Combine阶段、Reduce阶段进行模型实现,解决交通流量大数据的分布式存储和并行计算的技术问题。
一种交通流量预测系统,包括数据获取模块、预处理模块、模型建立模块和预测模块;
所述数据获取模块用于获取车辆的移动轨迹数据并发送至所述预处理模块;
所述预处理模块用于对所述移动轨迹数据进行预处理,获得训练数据并将所述训练数据发送至所述模型建立模块;
所述模型建立模块用于根据所述训练数据构建分布式TWND-LSTM模型;
所述预测模块用于分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果。
本发明的有益效果是,获取移动轨迹建分布式TWND-LSTM模型并分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,输出预测结果,有效提高了预测精度,解决了交通流量大数据的分布式存储和并行计算的技术问题。
进一步,所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架,对所述移动轨迹数据进行预处理的过程为:
S201:根据所述移动轨迹数据提取目标路段在当前时间间隔t内出现感兴趣区域的车辆轨迹;
S202:根据所述车辆轨迹统计目标路段在当前时间间隔t内的车辆数量;
S203:将所述目标路段在当前时间间隔t内的车辆总数进行平滑处理获得训练数据。
将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响,通过在Hadoop分布式计算平台下,基于MapReduce并行处理框架解决了交通流量大数据的分布式存储和并行计算的技术问题。
进一步,所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架获得车辆轨迹的过程为:
在Map阶段,定义键值对<key1,value1>,其中key1表示时间和车辆ID,value1表示区域位置的编号;
在Reduce阶段,首先对所述时间和所述车辆ID进行排序,接着去除所述当前时间间隔t内同一车辆的重复数据,获得所述当前时间间隔t内出现感兴趣区域的车辆轨迹。
采用上述进一步方案的有益效果是,将采集的移动轨迹数据在Hadoop分布式计算平台下,基于MapReduce并行处理框架进行预处理,去除重复数据,有效提高预测精度,减少计算量,解决交通流量大数据的分布式存储和并行计算的技术问题。
进一步,所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架获得当前时间间隔t内的车辆数量的过程为:
在Map阶段,读取所述当前时间间隔t内出现感兴趣区域的车辆轨迹,并定义键值对<key2,value2>,其中key2表示时间和所述区域位置的编号,value2则增加计数1;
在Reduce阶段,统计所述当前时间间隔t内的车辆数量。
所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架基于所述当前时间间隔t内的车辆数量获得所述训练数据的过程为:
在Map任务中,读取所述当前时间间隔内t的车辆数量,并定义键值对<key3,value3>,其中key3表示时间间隔,value3表示各目标路段的车辆总数,接着被直接输入到Reduce阶段的HDFS中并进行平滑处理,处理后的数据作为所述训练数据。
采用上述进一步方案的有益效果是,将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响。
进一步,模型建立模块根据所述训练数据构建分布式TWND-LSTM模型的具体过程为:
S301:通过正态分布对所述训练数据进行计算获得权重;
S302:将所述权重引入LSTM模型,对所述LSTM进行加权求代价获得流量时序数据;
S303:采用窗口平滑方法处理所述流量时序数据,并通过目标路段i在当前时间间隔t内的交通流量提取目标路段在历史相邻时间间隔t内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,训练好的模型为所述TWND-LSTM模型。
采用上述进一步方案的有益效果是,先通过正态分布对LSTM神经网络进行加权求代价获得流量时序数据,组成随时间单一变量序列以预测变量在未来时间间隔的交通流量,以提高交通流量预测的鲁棒性和准确性;其次,任意目标路段在未来时间间隔t内的交通流量,均可由该目标路段及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,以解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
进一步,所述模型建立模块获得权重的过程包括:
S3011:设正态分布u均值为目标路段i的交通流量,δ为经验值,x为各路段交通流量离散值,则计算权重的表达式为:
采用上述进一步方案的有益效果是,根据正态分布的分布函数可知,当用来预测的数据越靠近均值u时,预测的结果越准,则权值越大,将正态分布与LSTM神经网络相结合,利用正态分布计算出的权值对LSTM神经网络进行加权求代价,有效提高预测精度。
进一步,所述模型建立模块提取所述目标路段在历史相邻时间间隔t内的交通流量组成大小为4的窗口的过程包括:
S3031:设目标路段i在当前时间间隔t的交通流量为提取目标路段在历史相邻时间间隔内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,则公式表达式为:
采用上述进一步方案的有益效果是,提取目标路段在历史相邻时间间隔t内的交通流量组成大小为4的窗口,任意目标路段i在未来时间间隔t内的交通流量,均可由该目标路段i及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
进一步,所述预测模块分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果的过程包括:
S401:在所述Map阶段,使用Mapper函数从所述HDFS中接收每行数据集为不同的键值对<key,value>,并且输出中间数据至Combiner函数;
S402:在所述Combine阶段,使用Combiner函数提取所述Mapper函数的计算结果,并根据同样key值对所述中间数据进行排序,并且输出结果至Reducer函数;
S403:在所述Reduce阶段,使用Reducer函数首先获取Combiner函数的局部结果,接着从所述中间数据中聚合同样key值的value值,最后输出全局结果,所述全局结果为所述预测结果。
采用上述进一步方案的有益效果是,在Hadoop分布式计算平台下,基于MapReduce并行处理框架在Map阶段、Combine阶段、Reduce阶段进行模型实现,解决交通流量大数据的分布式存储和并行计算的技术问题。本发明中名词解释如表1所示:
表1
附图说明
图1为本发明一种数据驱动的分布式交通流量预测方法流程图;
图2为本发明一个实施例的流程图;
图3为本发明一种数据驱动的分布式交通流量预测系统框架图;
图4为本发明Hadoop通过HDFS、MapReduce分别实现分布式存储和并行计算的功能图;
图5为本发明HDFS进程通信框架图;
图6为本发明MapReduce计算任务流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参照图1,一种数据驱动的分布式交通流量预测方法,包括以下步骤:
S1:获取车辆的移动轨迹数据;
S2:对所述移动轨迹数据进行预处理,获得训练数据;
S3:根据所述训练数据构建分布式TWND-LSTM模型;
S4:分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果。
获得移动轨迹构建分布式TWND-LSTM模型并分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,输出预测结果,有效提高预测精确性、鲁棒性和实时性,解决了交通流量大数据的分布式存储和并行计算的技术问题。
在本实施例中,采用出租车GPS轨迹数据,定义为目标路段在时间间隔t所采集的交通流量值。利用交通流量序列t时间间隔预测t+1时间间隔的交通流量/>采样时间间隔为5分钟,则交通流量序列表示为/> 采用分布式TWND-LSTM模型,任意目标路段在未来时间间隔的交通流量,可由该目标路段及其相邻路段在历史和当前时间间隔的交通流量而进行预测。在分布式WND-LSTM模型中,若i路段为目标路段,t+1为未来时间间隔,则预测模型输入的表达公式为X=(O1,O2,…,OR),输出的公式表达式分别为:/>
在Hadoop分布式计算平台下,基于MapReduce并行处理框架,所述S2具体包括:
S201:根据所述移动轨迹数据提取目标路段在当前时间间隔t内出现感兴趣区域的车辆轨迹;
S202:根据所述车辆轨迹统计目标路段在当前时间间隔t内的车辆数量;
S203:将所述目标路段在当前时间间隔t内的车辆总数进行平滑处理获得训练数据。
将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响,在本实施例中,采用卡尔曼滤波实现数据的平滑处理。
在本实施例中,所述S2中S201在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map阶段,定义键值对<key1,value1>,其中key1表示时间和车辆ID,value1表示区域位置的编号;
在Reduce阶段,首先对所述时间和所述车辆ID进行排序,接着去除所述当前时间间隔t内同一车辆的重复数据,获得所述当前时间间隔t内出现感兴趣区域的车辆轨迹,最后写入Hadoop分布式文件系统(HDFS)。将采集的移动轨迹数据在Hadoop分布式计算平台下,基于MapReduce并行处理框架进行预处理,去除重复数据,有效提高预测精度,减少计算量,解决交通流量大数据的分布式存储和并行计算的技术问题。
在本实施例中,所述S2中S202在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map阶段,读取所述当前时间间隔t内出现感兴趣区域的车辆轨迹,并定义键值对<key2,value2>,其中key2表示时间和所述区域位置的编号,value2则增加计数1;
在Reduce阶段,统计所述当前时间间隔t内的车辆数量。该任务统计可能会由于上一任务中某一特定时刻没有车辆信息而导致数据库中当前时间间隔t内的数据缺失,从而影响数据的维度。为此,在这个时刻加入一个键值对<key,value>作为标志,进而确保每天均有一个固定时间点。
所述S2中S203在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map任务中,读取所述当前时间间隔t内的车辆数量,并定义键值对<key3,value3>,其中key3表示时间间隔,value3表示各目标路段的车辆总数,接着被直接输入到Reduce阶段的HDFS中并进行平滑处理,处理后的数据作为所述训练数据。将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响,通过在Hadoop分布式计算平台下,基于MapReduce并行处理框架解决了交通流量大数据的分布式存储和并行计算的技术问题。
Apache Hadoop架构:
Apache Hadoop是一种可靠、可扩展的开源分布式计算架构,能在由大量廉价硬件所组成的集群中为应用程序提供稳定可靠的接口。它充分利用集群的计算与存储能力,构建可靠性高、容错性强、可伸缩和可扩展的大数据批量处理架构,实现大规模数据的分布式存储与并行计算。
HDFS和MapReduce是Hadoop架构的核心组件,也是基于GFS(Google File System,谷歌文件系统)和Google MapReduce的开源实现。Hadoop通过HDFS、MapReduce分别实现分布式存储和并行计算,并由NameNode和DataNode完成HDFS功能、JobTracker和TaskTracker完成MapReduce功能参照图4。此外,Hadoop还包括Hadoop Common、Hadoop YARN、Ambari、Avro、Cassandra、Chukwa、HBase、Hive、Mahout、Pig、Spark、Tez和ZooKeeper等。
Hadoop分布式文件系统(HDFS):
HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)是一种可部署在廉价硬件上实现高吞吐量并行数据访问的分布式文件系统,能提供高性能、强容错、可靠的存储大规模数据。参照图5,HDFS采用Master(服务器)/Slave(客户端)运行模式,由一个NameNode(管理者)节点、多个DataNode(工作者)节点和HDFS Client组成,并通过Hadoop的RPC机制实现NameNode、DataNode与HDFS Client进程之间的通信。
MapReduce并行编程模型:
MapReduce是一种能处理大规模数据集的并行编程模型(常称为“MapReduce并行处理框架”),能在由成百上千台服务器所组成的Hadoop集群上执行并行计算任务。MapReduce由JobTracker和TaskTracker两大服务模块所构成,JobTracker负责管理调度作业(系统任务分配的核心),TaskTracker负责执行用户所定义的操作。MapReduce将计算逻辑分配至各数据节点进行数据计算和价值发现,并将运行在大规模集群中的并行计算过程抽象为Map(映射)和Reduce(化简)。MapReduce作业被分割成Map任务和Reduce任务并分别执行在Map阶段和Reduce阶段,每个阶段都有键值对<key,value>作为输入和输出,其类型由程序员在定义Map函数和Reduce函数时进行选择。参照图6,Map函数将整个计算任务分解成多个子任务(即,将一组键值对<key,value>映射成一组新的中间键值对<key,value>),Reduce函数将多个子任务处理的结果进行聚合(即,接收Map函数的输出,聚合中间结果中相同key值的所有value值,并输出键值对<key,value>),进而产生最终结果。
参照图2,所述S3具体包括:
S301:通过正态分布对所述训练数据进行计算获得权重;
S302:将所述权重引入LSTM模型,对所述LSTM进行加权求代价获得流量时序数据;
S303:采用窗口平滑方法处理所述流量时序数据,并通过目标路段i在当前时间间隔t内的交通流量提取目标路段在历史相邻时间间隔t内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,训练好的模型为所述TWND-LSTM模型。
先通过正态分布对LSTM神经网络进行加权求代价获得流量时序数据,组成随时间单一变量序列以预测变量在未来时间间隔的交通流量,以提高交通流量预测的鲁棒性和准确性;其次,任意目标路段在未来时间间隔t内的交通流量,均可由该目标路段及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,以解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
LSTM模型具有独特的结构,是递归神经网络(RNN)的一种变体,它具有足够的能力解决长期依赖问题且可以解决梯度爆炸和梯度消失问题。LSTM结构中的记忆细胞是模型的核心部分,它替代了传统神经元的隐含层,尤其是该细胞可以保留有用的信息而丢弃其余信息以及能自动确定时间序列中的最佳时间。LSTM主要由输入门、输出门和遗忘门而组成,可以实现信息的增加或者删除,输入门主要将处理过的数据增加到细胞中;遗忘门决定什么时候忘记输出结果,从而为输入序列选择最佳的时间延迟;输出门获取所有计算结果,并为LSTM神经网络单元生成输出。在LSTM神经网络中,设输入时间序列为x=(x1,x2,…,xt),隐含层中的时间序列为h=(h1,h2,…,ht),输出层中的时间序列为y=(y1,y2,…,yt),则可以通过以下公式进行计算:
y=Whyhy+by
ht=H(Wxhxt+Whhhh-1+bh)
其中,W为权值矩阵,b为偏置向量。
LSTM模型中的隐含层函数可以通过以下公式进行计算:
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ct=ftct-1+itg(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
ht=oth(ct)
其中,it,ot,ft,ct分别表示输入门、输出门、遗忘门和记忆细胞,σ,g,h分别表示门、输入和输出激活函数。
在本实施例中,所述S301具体包括:
S3011:设正态分布u均值为目标路段i的交通流量,δ为经验值,在本实施例中取0.6,x为各路段交通流量离散值,则计算权重的表达式为:
根据正态分布的分布函数可知,当用来预测的数据越靠近均值u时,预测的结果越准,则权值越大,将正态分布与LSTM神经网络相结合,利用正态分布计算出的权值对LSTM神经网络进行加权求代价,有效提高预测精度。
在本实施例中,所述S303具体包括:
S3031:设目标路段i在当前时间间隔t的交通流量为提取目标路段在历史相邻时间间隔t内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,则公式表达式为:/>
其中,n为时间间隔的个数。
提取目标路段在历史相邻时间间隔t内的交通流量组成大小为4的窗口,任意目标路段i在未来时间间隔t内的交通流量,均可由该目标路段i及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
所述S4具体包括:
S401:在所述Map阶段,使用Mapper函数从所述HDFS中接收每行数据集为不同的键值对<key,value>,并且输出中间数据至Combiner函数;
S402:在所述Combine阶段,使用Combiner函数提取所述Mapper函数的计算结果,并根据同样key值对所述中间数据进行排序,并且输出结果至Reducer函数;
S403:在所述Reduce阶段,使用Reducer函数首先获取Combiner函数的局部结果,接着从所述中间数据中聚合同样key值的value值,最后输出全局结果,所述全局结果为所述预测结果。
在Hadoop分布式计算平台下,基于MapReduce并行处理框架在Map阶段、Combine阶段、Reduce阶段进行模型实现,解决交通流量大数据的分布式存储和并行计算的技术问题。
本实施例的实施原理为:参照图2,首先,数据采集。定义Vt i为目标路段i在时间间隔t所采集的交通流量值,利用交通流量序列t时间间隔预测下一时间间隔t+1的交通流量,以得到交通流量序列。其次,数据预处理。在Hadoop分布式计算平台下,基于MapReduce并行处理框架,采用Kalman滤波对移动轨迹大数据(如大规模出租车GPS轨迹数据)进行数据预处理(包括数据提取、数据统计和数据集成等),以解决大规模交通流量数据的分布式存储、并行计算和数据平滑等问题。接着,数据建模,基于MapReduce并行处理框架,构建分布式TWND-LSTM模型,以提高交通流量预测的鲁棒性和准确性。该模型利用时间窗口和正态分布对长短时记忆(LSTM)神经网络进行加权求代价,通过代价转化为时间序列预测交通流量问题,并组成随时间单一变量序列以预测变量在未来时间间隔的交通流量。最后,模型实现。基于MapReduce并行处理框架,通过Mapper、Combiner和Reducer函数分别在Map、Combine和Reduce阶段实现分布式TWND-LSTM模型的并行化(分布式训练和并行预测),以提高交通流量预测的实时性和可扩展性。
实施例2
参照图2和图3,在实施例1的基础上,一种交通流量预测系统,包括数据获取模块、预处理模块、模型建立模块和预测模块;
所述数据获取模块用于获取车辆的移动轨迹数据并发送至所述预处理模块;
所述预处理模块用于对所述移动轨迹数据进行预处理,获得训练数据并将所述训练数据发送至所述模型建立模块;
所述模型建立模块用于根据所述训练数据构建分布式TWND-LSTM模型;
所述预测模块用于分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果。
获取移动轨迹建分布式TWND-LSTM模型并分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,输出预测结果,有效提高了预测精度,解决了交通流量大数据的分布式存储和并行计算的技术问题。
所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架,对所述移动轨迹数据进行预处理的过程为:
S201:根据所述移动轨迹数据提取目标路段在当前时间间隔t内出现感兴趣区域的车辆轨迹;
S202:根据所述车辆轨迹统计目标路段在当前时间间隔t内的车辆数量;
S203:将所述目标路段在当前时间间隔t内的车辆总数进行平滑处理获得训练数据。
将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响。
所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架获得车辆轨迹的过程为:
在Map阶段,定义键值对<key1,value1>,其中key1表示时间和车辆ID,value1表示区域位置的编号;
在Reduce阶段,首先对所述时间和所述车辆ID进行排序,接着去除所述当前时间间隔t内同一车辆的重复数据,获得所述当前时间间隔t内出现感兴趣区域的车辆轨迹。
将采集的移动轨迹数据在Hadoop分布式计算平台下,基于MapReduce并行处理框架进行预处理,去除重复数据,有效提高预测精度,减少计算量,解决交通流量大数据的分布式存储和并行计算的技术问题。
所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架获得当前时间间隔t内的车辆数量的过程为:
在Map阶段,读取所述当前时间间隔t内出现感兴趣区域的车辆轨迹,并定义键值对<key2,value2>,其中key2表示时间和所述区域位置的编号,value2则增加计数1;
在Reduce阶段,统计所述当前时间间隔t内的车辆数量。
所述预处理模块在Hadoop分布式计算平台下,基于MapReduce并行处理框架基于所述当前时间间隔t内的车辆数量获得所述训练数据的过程为:
在Map任务中,读取所述当前时间间隔内t的车辆数量,并定义键值对<key3,value3>,其中key3表示时间间隔,value3表示各目标路段的车辆总数,接着被直接输入到Reduce阶段的HDFS中并进行平滑处理,处理后的数据作为所述训练数据。
将所述移动轨迹数据依次进行数据提取、数据统计和数据集成并进行平滑处理,降低零点数据对网络模型的影响。
进一步,模型建立模块根据所述训练数据构建分布式TWND-LSTM模型的具体过程为:
S301:通过正态分布对所述训练数据进行计算获得权重;
需要说明的是,TWND-LSTM利用正态分布计算相邻路段对目标路段的影响权重,然后将其作为时间序列预测问题,从而形成一个具有时间的单一变量序列,预测变量在当前时间间隔的状态。
S302:将所述权重引入LSTM模型,对所述LSTM进行加权求代价获得流量时序数据;
通过正态分布,考虑相邻路段间相互影响权重的交通流量,生成时间间隔,从而获得流量时序数据,将每个时间间隔对应的加权交通流量输入LSTM模型获得预测结果在下一个时间间隔。
S303:采用窗口平滑方法处理所述流量时序数据,并通过目标路段i在当前时间间隔t内的交通流量提取目标路段在历史相邻时间间隔t内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,训练好的模型为所述TWND-LSTM模型。
先通过正态分布对LSTM神经网络进行加权求代价获得流量时序数据,组成随时间单一变量序列以预测变量在未来时间间隔的交通流量,以提高交通流量预测的鲁棒性和准确性;其次,任意目标路段在未来时间间隔t内的交通流量,均可由该目标路段及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,以解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
所述模型建立模块获得权重的过程包括:
S3011:设正态分布u均值为目标路段i的交通流量,δ为经验值,x为各路段交通流量离散值,则计算权重的表达式为:
根据正态分布的分布函数可知,当用来预测的数据越靠近均值u时,预测的结果越准,则权值越大,将正态分布与LSTM神经网络相结合,利用正态分布计算出的权值对LSTM神经网络进行加权求代价,有效提高预测精度。
所述模型建立模块提取所述目标路段在历史相邻时间间隔t内的交通流量组成大小为4的窗口的过程包括:
S3031:设目标路段i在当前时间间隔t的交通流量为提取目标路段在历史相邻时间间隔内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,则公式表达式为:
n表示为时间间隔的个数。
提取目标路段在历史相邻时间间隔t内的交通流量组成大小为4的窗口,任意目标路段i在未来时间间隔t内的交通流量,均可由该目标路段i及其相邻路段在历史和当前时间间隔的交通流量而进行预测,以提高交通流量预测的实时性和可扩展性,解决现有交通流量预测方法仅考虑时间维度而忽略目标路段上下游的交通状况,以及没有充分考虑交通流量潜在的趋势调整特征,从而导致交通流量预测精度低的技术问题。
所述预测模块分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果的过程包括:
S401:在所述Map阶段,使用Mapper函数从所述HDFS中接收每行数据集为不同的键值对<key,value>,并且输出中间数据至Combiner函数;
S402:在所述Combine阶段,使用Combiner函数提取所述Mapper函数的计算结果,并根据同样key值对所述中间数据进行排序,并且输出结果至Reducer函数;
S403:在所述Reduce阶段,使用Reducer函数首先获取Combiner函数的局部结果,接着从所述中间数据中聚合同样key值的value值,最后输出全局结果,所述全局结果为所述预测结果。
在Hadoop分布式计算平台下,基于MapReduce并行处理框架在Map阶段、Combine阶段、Reduce阶段进行模型实现,解决交通流量大数据的分布式存储和并行计算的技术问题。
以上对本发明实施例所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明实施例的原理以及实施方式进行了阐述,以上实施例的说明只适用于帮助理解本发明实施例的原理;同时,对于本领域的一般技术人员,依据本发明实施例,在具体实施方式以及应用范围上均会有改变之处,即应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。
Claims (7)
1.一种数据驱动的分布式交通流量预测方法,其特征在于,包括以下步骤:
S1:获取车辆的移动轨迹数据;
S2:对所述移动轨迹数据进行预处理,获得训练数据;
S3:根据所述训练数据构建分布式TWND-LSTM模型;
S4:分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果;
所述S3具体包括:
S301:通过正态分布对所述训练数据进行计算获得权重;
S302:将所述权重引入LSTM模型,对所述LSTM进行加权求代价获得流量时序数据;
S303:采用窗口平滑方法处理所述流量时序数据,并通过目标路段i在当前时间间隔t内的交通流量提取目标路段在历史相邻时间间隔t内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,训练好的模型为所述TWND-LSTM模型;
所述S301具体包括:
S3011:设正态分布u均值为目标路段i的交通流量,δ为经验值,x为各路段交通流量离散值,则计算权重的表达式为:
所述S303具体包括:
S3031:设目标路段i在当前时间间隔t的交通流量为提取目标路段在历史相邻时间间隔的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,则公式表达式为:
其中,n表示为时间间隔的个数。
2.根据权利要求1所述的方法,其特征在于,在Hadoop分布式计算平台下,基于MapReduce并行处理框架,所述S2具体包括:
S201:根据所述移动轨迹数据提取目标路段在当前时间间隔t内出现感兴趣区域的车辆轨迹;
S202:根据所述车辆轨迹统计目标路段在当前时间间隔t内的车辆数量;
S203:将所述目标路段在当前时间间隔t内的车辆总数进行平滑处理获得训练数据。
3.根据权利要求2所述的方法,其特征在于,所述S2中S201在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map阶段,定义键值对<key1,value1>,其中key1表示时间和车辆ID,value1表示区域位置的编号;
在Reduce阶段,首先对所述时间和所述车辆ID进行排序,接着去除所述当前时间间隔t内同一车辆的重复数据,获得所述当前时间间隔t内出现感兴趣区域的车辆轨迹。
4.根据权利要求3所述的方法,其特征在于,所述S2中S202在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map阶段,读取所述当前时间间隔t内出现感兴趣区域的车辆轨迹,并定义键值对<key2,value2>,其中key2表示时间和所述区域位置的编号,value2则增加计数1;
在Reduce阶段,统计所述当前时间间隔t内的车辆数量。
5.根据权利要求4所述的方法,其特征在于,所述S2中S203在Hadoop分布式计算平台下,基于MapReduce并行处理框架的具体过程为:
在Map任务中,读取所述当前时间间隔t内的车辆数量,并定义键值对<key3,value3>,其中key3表示时间间隔,value3表示各目标路段的车辆总数,接着被直接输入到Reduce阶段的HDFS中并进行平滑处理,处理后的数据作为所述训练数据。
6.根据权利要求5所述的方法,其特征在于,所述S4具体包括:
S401:在所述Map阶段,使用Mapper函数从所述HDFS中接收每行数据集为不同的键值对<key,value>,并且输出中间数据至Combiner函数;
S402:在所述Combine阶段,使用Combiner函数提取所述Mapper函数的计算结果,并根据同样key值对所述中间数据进行排序,并且输出结果至Reducer函数;
S403:在所述Reduce阶段,使用Reducer函数首先获取Combiner函数的局部结果,接着从所述中间数据中聚合同样key值的value值,最后输出全局结果,所述全局结果为所述预测结果。
7.一种数据驱动的分布式交通流量预测系统,其特征在于,包括数据获取模块、预处理模块、模型建立模块和预测模块;
所述数据获取模块用于获取车辆的移动轨迹数据并发送至所述预处理模块;
所述预处理模块用于对所述移动轨迹数据进行预处理,获得训练数据并将所述训练数据发送至所述模型建立模块;
所述模型建立模块用于根据所述训练数据构建分布式TWND-LSTM模型;
所述预测模块用于分别在Map、Combine和Reduce阶段实现所述分布式TWND-LSTM模型,并输出预测结果;
所述模型建立模块的具体执行步骤如下:
S301:通过正态分布对所述训练数据进行计算获得权重;
S302:将所述权重引入LSTM模型,对所述LSTM进行加权求代价获得流量时序数据;
S303:采用窗口平滑方法处理所述流量时序数据,并通过目标路段i在当前时间间隔t内的交通流量提取目标路段在历史相邻时间间隔t内的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,训练好的模型为所述TWND-LSTM模型;
所述S301具体包括:
S3011:设正态分布u均值为目标路段i的交通流量,δ为经验值,x为各路段交通流量离散值,则计算权重的表达式为:
所述S303具体包括:
S3031:设目标路段i在当前时间间隔t的交通流量为提取目标路段在历史相邻时间间隔的交通流量/>组成大小为4的窗口送入所述LSTM模型进行训练,则公式表达式为:
其中,n表示为时间间隔的个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010630479.2A CN111860621B (zh) | 2020-06-30 | 2020-06-30 | 一种数据驱动的分布式交通流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010630479.2A CN111860621B (zh) | 2020-06-30 | 2020-06-30 | 一种数据驱动的分布式交通流量预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111860621A CN111860621A (zh) | 2020-10-30 |
CN111860621B true CN111860621B (zh) | 2024-05-03 |
Family
ID=73152908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010630479.2A Active CN111860621B (zh) | 2020-06-30 | 2020-06-30 | 一种数据驱动的分布式交通流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860621B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112967495B (zh) * | 2021-01-29 | 2023-05-09 | 贵州民族大学 | 一种基于移动轨迹大数据的短时交通流量预测方法及系统 |
CN115273499B (zh) * | 2022-06-30 | 2023-11-10 | 华东师范大学 | 一种基于车流量的信号灯动态配时方法与系统 |
CN116074209A (zh) * | 2023-02-20 | 2023-05-05 | 中移动信息技术有限公司 | 数据预测方法、装置、设备及计算机存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106128100A (zh) * | 2016-06-30 | 2016-11-16 | 华南理工大学 | 一种基于Spark平台的短时交通流量预测方法 |
CN106875670A (zh) * | 2017-03-07 | 2017-06-20 | 重庆邮电大学 | Spark平台下基于GPS数据的出租车调配方法 |
CN107704970A (zh) * | 2017-10-24 | 2018-02-16 | 上海电器科学研究所(集团)有限公司 | 一种基于Spark的需求侧负荷预测方法 |
KR101951595B1 (ko) * | 2018-05-18 | 2019-02-22 | 한양대학교 산학협력단 | 모듈형 순환 신경망 구조 기반 차량 경로 예측 시스템 및 방법 |
CN109659933A (zh) * | 2018-12-20 | 2019-04-19 | 浙江工业大学 | 一种基于深度学习模型的含分布式电源配电网电能质量预测方法 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN111292525A (zh) * | 2019-12-30 | 2020-06-16 | 南京艾特斯科技有限公司 | 基于神经网络的交通流预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10636524B2 (en) * | 2016-08-26 | 2020-04-28 | TCL Research America Inc. | Method and system for optimized wake-up strategy via sleeping stage prediction with recurrent neural networks |
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
CN109410575B (zh) * | 2018-10-29 | 2020-05-01 | 北京航空航天大学 | 一种基于胶囊网络和嵌套式长短时记忆神经网络的路网状态预测方法 |
-
2020
- 2020-06-30 CN CN202010630479.2A patent/CN111860621B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106128100A (zh) * | 2016-06-30 | 2016-11-16 | 华南理工大学 | 一种基于Spark平台的短时交通流量预测方法 |
CN106875670A (zh) * | 2017-03-07 | 2017-06-20 | 重庆邮电大学 | Spark平台下基于GPS数据的出租车调配方法 |
CN107704970A (zh) * | 2017-10-24 | 2018-02-16 | 上海电器科学研究所(集团)有限公司 | 一种基于Spark的需求侧负荷预测方法 |
KR101951595B1 (ko) * | 2018-05-18 | 2019-02-22 | 한양대학교 산학협력단 | 모듈형 순환 신경망 구조 기반 차량 경로 예측 시스템 및 방법 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN109659933A (zh) * | 2018-12-20 | 2019-04-19 | 浙江工业大学 | 一种基于深度学习模型的含分布式电源配电网电能质量预测方法 |
CN111292525A (zh) * | 2019-12-30 | 2020-06-16 | 南京艾特斯科技有限公司 | 基于神经网络的交通流预测方法 |
Non-Patent Citations (4)
Title |
---|
Traffic flow prediction using LSTM with feature enhancement;Bailin Yang etal.;《Neurocomputing》;20191231;第332卷(第C期);第320-327页 * |
基于MapReduce的移动轨迹大数据挖掘方法与应用研究;夏大文;《中国博士学位论文全文数据库 信息科技辑》;20170115;第101-124页 * |
基于Spark 框架的实时交通流量预测方法;章茂庭 等;《现代信息科技》;20200225;第4卷(第4期);第01-08页 * |
基于长短期记忆网络的电网动态轨迹趋势预测方法;杨少波;刘道伟;安军;李宗翰;杨红英;赵高尚;;中国电机工程学报;20200505(09);第134-146页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111860621A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860621B (zh) | 一种数据驱动的分布式交通流量预测方法及系统 | |
Jiang et al. | Deepurbanmomentum: An online deep-learning system for short-term urban mobility prediction | |
Lin et al. | An efficient deep reinforcement learning model for urban traffic control | |
AU2020101023A4 (en) | A Novel Deep Learning Approach for Distributed Traffic Flow Forecasting | |
CN112948123B (zh) | 一种基于Spark的网格水文模型分布式计算方法 | |
CN116468186B (zh) | 一种航班链延误时间预测方法、电子设备及存储介质 | |
Wang et al. | Research on parallelized real-time map matching algorithm for massive GPS data | |
CN113112791A (zh) | 一种基于滑动窗口长短时记忆网络的交通流量预测方法 | |
Rajeh et al. | Modeling multi-regional temporal correlation with gated recurrent unit and multiple linear regression for urban traffic flow prediction | |
Dai et al. | Spatio-temporal deep learning framework for traffic speed forecasting in IoT | |
Zhao et al. | Unifying Uber and taxi data via deep models for taxi passenger demand prediction | |
Zhang et al. | Method of predicting bus arrival time based on MapReduce combining clustering with neural network | |
CN112070280B (zh) | 实时交通流量并行预测方法、系统、终端及存储介质 | |
Zhang et al. | Travel time prediction of urban public transportation based on detection of single routes | |
Sen | Time series prediction based on improved deep learning | |
CN112967495B (zh) | 一种基于移动轨迹大数据的短时交通流量预测方法及系统 | |
CN112070529A (zh) | 载客热点并行预测方法、系统、终端及计算机存储介质 | |
CN116612633A (zh) | 一种基于车路协同感知下的自适应动态路径规划方法 | |
Nguyen et al. | Real-time traffic congestion forecasting using prophet and spark streaming | |
Niu et al. | Highway Temporal‐Spatial Traffic Flow Performance Estimation by Using Gantry Toll Collection Samples: A Deep Learning Method | |
CN114021847A (zh) | 基于isgu混合模型的短期电力负荷预测方法及系统 | |
Xu et al. | MCA-TFP Model: A Short-Term Traffic Flow Prediction Model Based on Multi-characteristic Analysis | |
Yin et al. | Real-time Distributed Optimization of Traffic Signal Timing | |
Xie et al. | Qdn: An efficient value decomposition method for cooperative multi-agent deep reinforcement learning | |
Liu et al. | OD demand forecasting for the large-scale dockless sharing bike system: a deep learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |