CN116894512A - 基于时空特征深度学习的公交车到站时间预测方法 - Google Patents
基于时空特征深度学习的公交车到站时间预测方法 Download PDFInfo
- Publication number
- CN116894512A CN116894512A CN202310826694.3A CN202310826694A CN116894512A CN 116894512 A CN116894512 A CN 116894512A CN 202310826694 A CN202310826694 A CN 202310826694A CN 116894512 A CN116894512 A CN 116894512A
- Authority
- CN
- China
- Prior art keywords
- time
- bus
- data
- vehicle
- station
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013135 deep learning Methods 0.000 title claims abstract description 17
- 230000004927 fusion Effects 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000010219 correlation analysis Methods 0.000 claims abstract description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 238000013480 data collection Methods 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/109—Time management, e.g. calendars, reminders, meetings or time accounting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/123—Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/42—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for mass transport vehicles, e.g. buses, trains or aircraft
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/44—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for communication between vehicles and infrastructures, e.g. vehicle-to-cloud [V2C] or vehicle-to-home [V2H]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Radar, Positioning & Navigation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Remote Sensing (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Signal Processing (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Mathematics (AREA)
- Analytical Chemistry (AREA)
- Educational Administration (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Game Theory and Decision Science (AREA)
Abstract
本发明涉及基于时空特征深度学习的公交车到站时间预测方法,属于交通信息大数据领域,包含以下步骤:S1、生成公交车到站出站时刻表和车辆每站打卡人数表;S2、采用特征相关性分析提取时间特征和空间特征;S3、利用Pearson相关系数对所述的时间特征和空间特征进行特征选择,并进行数据融合,得到融合预测数据;S4、对应的融合预测数据进行排序,得到时间序列预测数据;S5、搭建公交车到站时间预测模型;S6:利用公交车到站时间预测模型对时间序列预测数据进行处理,得到公交车到站时间预测值。本发明保留了数据的时域信息和频域信息,对数据进行全局时空特征信息的学习,能够有效提高对公交车到站时间预测的准确率。
Description
技术领域
本发明涉及基于时空特征深度学习的公交车到站时间预测方法,属于交通信息大数据领域,尤其适用于基于时空特征的深度学习公交车到站时间预测。
背景技术
随着国家社会和经济的快速发展,城市化进程不断加快,人民生活水平提升和居民出行需求增长,私家车的数量激增。城市内道路空间有限,道路上的交通量过饱和,不但造成了严重的交通拥堵和交通事故,还因为汽车排放污染物增多造成了很大的环境污染。在各种解决城市交通问题的方法中,大力发展公共交通是一个主要手段,也是实现城市交通可持续发展和保障城市健康运行的重要举措。考虑各类公共交通的适用性范围,城市常规公交在大中小城市均承担着重要的作用,在大城市作为轨道交通的重要补充,在中等城市作为承担公共交通客运的主体,在小城市提供多样化服务,因此大力发展公交十分有必要。由于道路状况复杂,公交车的行驶速度不确定,无法获得正确的到达时间,导致乘客在等待较长的时间后,产生急躁情绪,下一次选择其他出行方式。长期循环往复,造成了轨道交通客流压力大,地面公共交通出现空载现象,严重浪费社会资源。准确可靠的公交车到站时间预测是提高公交服务质量,吸引乘客选择公交出行的关键。准确预测公交车的到站时间,还可以提高车辆运行效率,为车辆调度和管理提供决策依据,减少交通压力,减少污染,节约能源。
现有的公交车到站时间预测算法主要有历史数据平均模型,卡尔曼滤波模型,支持向量机模型,时间序列回归方法,神经网络模型和组合模型。这些模型较为单一,不能对复杂运行环境进行学习。且随着公交车装载的信息收集设备的越来越完善,得到的数据量越来越大,这些模型越来越无法适应对大数据特征的学习。
综上所述,现有的公交车到站时间预测方法预测的准确度较差,不能对乘客进行较好的服务,引导乘客便捷的公交车出行。
发明内容
有鉴于此,本发明针对公交车到站时间预测准确性问题,提供一种基于时空特征深度学习的公交车到站时间预测方法,意在基于公交数据的时空特征,分别利用卷积神经网络、快速傅里叶变换和注意力机制实现对公交车历史数据的建模和训练得到准确预测的公交车到站时间预测模型,从而实现准确的公交车到站时间预测。
为达到上述目的,本发明提供如下技术方案:
基于时空特征深度学习的公交车到站时间预测方法,由公交数据收集系统实现,所述的由公交数据收集系统包括安装在公交车上的GPS信号收发器、安装在公交车上的上车打卡装置,安装在公交车上的无线网卡,本地端的无线网络设备,以及云端服务器构成;其特征在于,所述的GPS信号收发器、上车打卡装置与无线网卡相连,实时上传GPS数据和乘客上车打卡数据;所述的无线网卡与无线网络设备通过无线网络连接,传输数据;所述的网络设备与云端服务器相连,将数据传输给云端服务器进行分析处理,并将云端服务器的处理结果通过网络设备发送给乘客的手机终端。
所述的GPS数据包含:车牌号、线路号、数据传回时间、车辆实时经度、车辆实时纬度、车辆编号;所述的打卡数据包含:卡号、刷卡时间、线路号、车辆编码。
包括以下步骤:
S1:对公交车GPS数据以及乘客上车打卡数据进行时间维度上的统计,生成公交车到站出站时刻表和车辆每站打卡人数表;
S2:采用特征相关性分析分别提取公交车到站出站时刻表和车辆每站打卡人数表的时间特征和利用地图信息获取车站空间特征;
S3:利用Pearson相关系数对所述的时间特征和空间特征进行特征选择,筛选出预测时空特征,根据预测时空特征将公交车到站出站时刻表、车辆每站打卡人数表和空间特征进行数据融合,得到融合预测数据;
S4:按照公交班次优先的顺序将公交车车站依次对应的融合预测数据进行排序,得到时间序列预测数据;
S5:利用串联的快速傅里叶变换、卷积神经网络、快速傅里叶逆变换、Transformer编码器、全连接层模块搭建公交车到站时间预测模型;
S6.:利用公交车到站时间预测模型对时间序列预测数据进行处理,得到公交车到站时间预测值。
所述的时间特征包含:当前车辆的前A辆公交车在当前车站到下一车站的平均运行时间;当前班次的历史前B周中相同车站间的运行时间均值;当前车辆运行在一天内的高峰期或平峰期;当前车辆运行在是工作日还是节假日;当前车辆在某车站的实时打卡人数、历史平均打卡人数、停留时间的历史均值。其中,当前班次为同一时间段发车的公交车;当前车辆为需要进行时间预测的特定某一公交车;其中,A、B为大于1的正整数。
可优选的,选取A=B=3。
所述的空间特征包含:当前公交车站包含的公交线路数、轨道交通数量、路段的道路等级;当前公交车车站到下一公交车车站之间路线上的交叉口数量、红绿灯数量、桥梁数量。
进一步,所述的步骤S1具体为:
S11:将公交车的运行轨迹数据与公交车站的GPS数据进行距离匹配,生成公交车到站出站时刻表;
S12:根据车辆到站出站时刻表和车辆原始打卡数据,生成车辆每站打卡人数表。
更进一步,所述的步骤S11具体为:
S1101:读取一条GPS数据,计算GPS车辆实时经度、车辆实时纬度对应的位置与该车辆的目标车站经度、纬度对应的位置之间的距离;如果该距离小于阈值,则该车辆到达目标车站,将GPS的数据传回时间记录为目标车站的到站时间;
S1102:如果距离大于阈值且该车辆已经有了到站时间,则该车辆离开车站,将GPS的数据传回时间记录为目标车站的出站时间,并修改车辆的目标车站为下一站;
S1103:通过计算同一车站到站时间和出站时间之差以及相邻两个车站之间出站时间和到站时间之差,得到车辆在该车站的停留时间和两站之间的行驶时间,并记录到公交车到站出站时刻表中;
S1104:如果车辆到达最后一站,则通过计算车辆到达最后一站的时间与到达第一站的时间差,得到该车辆全程时间并记录到公交车到站出站时刻表中。
更进一步,所述的步骤S12具体为:
S1201:读取一条乘客上车打卡数据,根据该数据的车辆编号和传回时间,在公交车到站出站时刻表中寻找对应车辆和车站;
S1202:统计所有车辆在路线上所有车站的所有上车打卡人数,生成车辆每站打卡人数表。
进一步,所述的步骤S3所述的根据预测时空特征将公交车到站出站时刻表和车辆每站打卡人数表进行数据融合具体为:
S31:对公交车到站出站时刻表数据进行相关时间特征提取;其中相关时间特征包含:当前车辆的前A辆公交车在当前车站到下一车站的平均运行时间;当前班次的历史前B周中相同车站间的运行时间均值;当前车辆运行在一天内的高峰期或平峰期;当前车辆运行在是工作日还是节假日。可优选的,A=B=3。
S32:对车辆每站打卡人数表进行相关时间特征提取;其中相关时间特征包含:当前车辆在某车站的实时打卡人数、历史平均打卡人数。
S33:给相邻的两个车站添加空间特征;即当前公交车站包含的公交线路数、轨道交通数量、路段的道路等级;当前公交车车站到下一公交车车站之间路线上的交叉口数量、红绿灯数量、桥梁数量。
S34:逐个车站的将步骤S31~步骤S33提取的时间特征和添加的空间特征进行连接融合,得到融合预测数据。
进一步,步骤S5所述的公交车到站时间预测模型由快速傅里叶变换、卷积神经网络、快速傅里叶逆变换、transformer编码器、全连接层模块串联连接构成;所述的快速傅里叶变换和快速傅里叶逆变换为离散形式;所述的卷积神经网络中卷积核的大小和个数设置要根据输入数据的规格进行设置,要保证进行卷积操作后的数据规格大小不发生改变;所述的transformer编码器为多个多头注意力网络串行的网络;所述的全连接层为单一神经元输出。
进一步,所述的步骤S6具体为:
S61:将时间序列预测数据X∈RN×m作为输入,利用快速傅里叶变换进行处理,得到FFT(X);
S62:设计卷积神经网络的参数,将卷积核的个数设置为m,大小为m×m,对FFT(X)进行卷积操作Conv(),得到Conv(FTT(X));
S63:对卷积操作的结果进行激活函数ReLU的操作,得到ReLU(Conv(FTT(X)));
S64:利用快速傅里叶逆变换将步骤S63的结果从时域转换为频域信号,得到X′=IFFT(ReLU(Conv(FTT(X))));
S65:为保留时域信号的信息,将输入X与上一步得到的结果X′进行对应位置的向量相加,得到X′+X;
S66:将X′+X输入transformer编码器进行时间序列的知识学习;
S67:将transformer编码器的学习结果,经过一层全连接神经网络计算得到预测值Y′。
本发明的有益效果在于:本发明提供了基于时空特征深度学习的公交车到站时间预测方法,采用特征相关性分析提取数据的时间特征和空间特征,通过对数据按特征进行融合和排序得到时间序列预测数据,并利用结合了时域频域信息的公交车到站时间预测模型对时间序列预测数据进行预测处理,得到公交车到站时间预测值。本发明方法保留了数据的时域信息和频域信息,对数据进行全局时空特征信息的学习,能够有效提高对公交车到站时间预测的准确率。
附图说明
为了使本发明的目的、技术方案,本发明提供如下附图进行说明:
图1为本发明实例中公交数据收集系统架构图;
图2为本发明实例中基于时空特征深度学习的公交车到站时间预测方法的流程图;
图3为本发明实例中公交车到站时间预测模型示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
实施例:以某城市的某公交线路为例,用户希望通过手机客户端查询当前所在公交车站对应班车公交车的到账时间情况,需要对当前时刻的公交到站时间进行预测,本发明提供一种“基于时空特征深度学习的公交车到站时间预测方法”。
结合图1,由公交数据收集系统实现,所述的公交数据收集系统由安装在公交车上的GPS信号收发器(1),安装在公交车上的上车打卡装置(2),安装在公交车上的无线网卡(3),本地端的无线网络设备(4),以及云端服务器(5)构成;其特征在于,所述的GPS信号收发器(1)、上车打卡装置(2)与无线网卡(3)相连,实时上传GPS数据和乘客上车打卡数据;所述的无线网卡(3)与无线网络设备(4)通过无线网络连接,传输数据;所述的网络设备(4)与云端服务器(5)相连,将数据传输给云端服务器(5)进行分析处理,并将云端服务器(5)的处理结果通过网络设备(4)发送给乘客的手机终端。
结合图2,基于时空特征深度学习的公交车到站时间预测方法,其步骤如下:
步骤一:云端服务器(5)按照用户需求收集数据信息,并对公交车GPS数据以及乘客上车打卡数据进行时间维度上的统计,生成公交车到站出站时刻表和车辆每站打卡人数表。
具体的,对于公交车到站出站时刻表,具体为:
(1)读取一条GPS数据,计算GPS车辆实时经度、车辆实时纬度对应的位置与该车辆的目标车站经度、纬度对应的位置之间的距离;如果该距离小于50米,则该车辆到达目标车站,将GPS的数据传回时间记录为目标车站的到站时间;
(2)如果距离大于50米且该车辆已经有了到站时间,则该车辆离开车站,将GPS的数据传回时间记录为目标车站的出站时间,并修改车辆的目标车站为下一站;
(3)通过计算同一车站到站时间和出站时间之差以及相邻两个车站之间出站时间和到站时间之差,得到车辆在该车站的停留时间和两站之间的行驶时间,并记录到公交车到站出站时刻表中;
(4)如果车辆到达最后一站,则通过计算车辆到达最后一站的时间与到达第一站的时间差,得到该车辆全程时间并记录到公交车到站出站时刻表中。
对于车辆每站打卡人数表,具体为:
(1)读取一条乘客上车打卡数据,根据该数据的车辆编号和传回时间,在公交车到站出站时刻表中寻找对应车辆和车站;
(2)然后根据该班车辆在每个车辆的到站时间和出站时间判断该条数据为哪个车站的上车打卡数据,统计所有车辆在路线上所有车站的所有上车打卡人数,生成车辆每站打卡人数表。
其中,公交车GPS数据的格式和乘客上车打卡数据的结构分别如表1、表2所示。
表1公交车GPS数据结构
表2乘客上车打卡数据结构
步骤二:云端服务器(5)采用特征相关性分析分别提取公交车到站出站时刻表和车辆每站打卡人数表的时间特征和利用地图信息获取车站空间特征。
所述的时间特征包含:当前车辆的前三辆公交车在当前车站到下一车站的平均运行时间;当前班次的历史前三周中相同车站间的运行时间均值;当前车辆运行在一天内的高峰期或平峰期;当前车辆运行在是工作日还是节假日;当前车辆在某车站的实时打卡人数、历史平均打卡人数、停留时间的历史均值。其中,当前班次为同一时间段发车的公交车;当前车辆为需要进行时间预测的特定某一公交车。
所述的空间特征包含:当前公交车站包含的公交线路数、轨道交通数量、路段的道路等级;当前公交车车站到下一公交车车站之间路线上的交叉口数量、红绿灯数量、桥梁数量。
步骤三:云端服务器(5)利用Pearson相关系数计算特征和真实值的相关度,选取其中相关度较高的几个特征作为预测时空特征,根据预测时空特征将公交车到站出站时刻表、车辆每站打卡人数表和空间特征进行数据融合,得到融合预测数据。
步骤四:云端服务器(5)按照公交班次优先的顺序将公交车车站依次对应的融合预测数据进行排序,得到时间序列预测数据。
步骤五:结合图3,云端服务器(5)利用串联的快速傅里叶变换、卷积神经网络、快速傅里叶逆变换、Transformer编码器、全连接层模块搭建公交车到站时间预测模型。
所述的快速傅里叶变换和快速傅里叶逆变换为离散形式;所述的卷积神经网络中卷积核的大小和个数设置要根据输入数据的规格进行设置,要保证进行卷积操作后的数据规格大小不发生改变;所述的transformer编码器为多个多头注意力网络串行的网络;所述的全连接层为单一神经元输出。
步骤六:云端服务器(5)利用公交车到站时间预测模型对时间序列预测数据进行处理,得到公交车到站时间预测值,并将公交车到站时间预测值通过网络设备(4)发送给乘客的手机终端。
具体为:
(1)将时间序列预测数据X∈RN×m作为输入,利用快速傅里叶变换进行处理,得到FFT(X);
(2)设计卷积神经网络的参数,将卷积核的个数设置为m,大小为m×m,对FFT(X)进行卷积操作Conv(),得到Conv(FTT(X));
(3)对卷积操作的结果进行激活函数ReLU的操作,得到ReLU(Conv(FTT(X)));
(4)利用快速傅里叶逆变换将步骤S63的结果从时域转换为频域信号,得到X′=IFFT(ReLU(Conv(FTT(X))));
(5)为保留时域信号的信息,将输入X与上一步得到的结果X′进行对应位置的向量相加,得到X′+X;
(6)将X′+X输入transformer编码器进行时间序列的知识学习;
(7)将transformer编码器的学习结果,经过一层全连接神经网络计算得到预测值Y′。
其中,时域和频域之间的相互转换用的FFT的具体实现为:IFFT的具体实现为:/>其中,N为X的长度。
Transformer编码器的整体结构使用多头注意力机制对输入序列进行特征的学习。在数据进入编码器之前需要对数据进行编码和位置编码,然后编码器Encoder设计M个相同结构主要对输入进行多头注意力机制的操作。输入序列X′+X可通过一个可训练的线性模块生成三个权重矩阵Wq、Wk、Wv,由输入序列和权重矩阵可以得到查询向量q,键向量k,值向量v所对应的矩阵Q、K、V:
Q=Wq(X′+X)
K=WK(X′+X)
V=WV(X′+X)
将Q和K相乘得到全局相似度得分,然后经过softmax处理后和V进行加权,得到最后输出,整个自注意力计算过程为:
Attention()为自注意力计算,softmax()为归一化操作,dk是缩放系数与键向量k的长度有关。
为了学习不同子空间的特征,使用多头自注意力机制,即用p个Q、K、V矩阵并行计算:
i∈[1,2,......,p],最终多头自注意力的结果为:
MultiHead(Q,K,V)=Concat(Attention(Qi,Ki,Vi))Wout
MultiHead()为多头自注意力计算,Concat()是将不同头注意力计算的结果矩阵对应位置进行相加。
Add&Norm是对数据进行残差计算和层归一化处理。Feed Forward的设计为两层全连接层加非线性的激活函数ReLU,对数据进行更深层次的学习。
全连接层将transformer编码器学习到的结果转化为公交车到站时间预测值Y′:
Y′=Linear(Encoder(X+X′))
输出公交车到站时间预测值。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其做出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (8)
1.基于时空特征深度学习的公交车到站时间预测方法,其特征在于,该方法包含以下步骤:
S1:对公交车GPS数据以及乘客上车打卡数据进行时间维度上的统计,生成公交到站出站时刻表和车辆每站打卡人数表;
S2:采用特征相关性分析分别提取公交到站出站时刻表和车辆每站打卡人数表的时间特征和利用地图信息获取车站空间特征;
S3:利用Pearson相关系数对所述的时间特征和空间特征进行特征选择,筛选出预测时空特征,根据预测时空特征将公交到站出站时刻表、车辆每站打卡人数表和空间特征进行数据融合,得到融合预测数据;
S4:按照公交班次优先的顺序将公交车车站依次对应的融合预测数据进行排序,得到时间序列预测数据;
S5:利用串联的快速傅里叶变换、卷积神经网络、快速傅里叶逆变换、Transformer编码器、全连接层模块搭建公交车到站时间预测模型;
S6:利用公交车到站时间预测模型对时间序列预测数据进行处理,得到公交车到站时间预测值;
所述的时间特征包含:当前车辆的前A辆公交车在当前车站到下一车站的平均运行时间;当前班次的历史前B周中相同车站间的运行时间均值;当前车辆运行在一天内的高峰期或平峰期;当前车辆运行在是工作日还是节假日;当前车辆在某车站的实时打卡人数、历史平均打卡人数、停留时间的历史均值;其中,A、B为大于1的正整数;
所述的空间特征包含:当前公交车站包含的公交线路数、轨道交通数量、路段的道路等级;当前公交车车站到下一公交车车站之间路线上的交叉口数量、红绿灯数量、桥梁数量。
2.根据权利要求1所述的基于时空特征深度学习的公交车到站时间预测方法,其特征在于,所述的步骤
S1具体为:
S11:将公交车的运行轨迹数据与公交车站的GPS数据进行距离匹配,生成公交到站出站时刻表;
S12:根据车辆到站出站时刻表和车辆原始打卡数据,生成车辆每站打卡人数表。
3.根据权利要求2所述的基于时空特征深度学习的公交车到站时间预测方法,其特征在于,所述的步骤
S11具体为:
S1101:读取一条GPS数据,计算GPS车辆实时经度、车辆实时纬度对应的位置与该车辆的目标车站经度、纬度对应的位置之间的距离;如果该距离小于阈值,则该车辆到达目标车站,将GPS的数据传回时间记录为目标车站的到站时间;
S1102:如果距离大于阈值且该车辆已经有了到站时间,则该车辆离开车站,将GPS的数据传回时间记录为目标车站的出站时间,并修改车辆的目标车站为下一站;
S1103:通过计算同一车站到站时间和出站时间之差以及相邻两个车站之间出站时间和到站时间之差,得到车辆在该车站的停留时间和两站之间的行驶时间,并记录到公交到站出站时刻表中;
S1104:如果车辆到达最后一站,则通过计算车辆到达最后一站的时间与到达第一站的时间差,得到该车辆全程时间并记录到公交到站出站时刻表中。
4.根据权利要求2所述的基于时空特征深度学习的公交车到站时间预测方法,其特征在于,所述的步骤
S12具体为:
S1201:读取一条乘客上车打卡数据,根据该数据的车辆编号和传回时间,在公交到站出站时刻表中寻找对应车辆和车站;
S1202:统计所有车辆在路线上所有车站的所有上车打卡人数,生成车辆每站打卡人数表。
5.根据权利要求1所述的基于时空特征深度学习的公交车到站时间预测方法,其特征在于,所述的步骤
S3所述的根据预测时空特征将公交到站出站时刻表和车辆每站打卡人数表进行数据融合具体为:
S31:对公交到站出站时刻表数据进行相关时间特征提取;
S32:对车辆每站打卡人数表进行相关时间特征提取;
S33:给相邻的两个车站添加空间特征;
S34:逐个车站的重复将步骤S31~步骤S33提取的时间特征和添加的空间特征进行连接融合,得到融合预测数据。
6.根据权利要求1所述的基于时空特征深度学习的公交车到站时间预测方法,其特征在于,步骤S5中所述的快速傅里叶变换和快速傅里叶逆变换为离散形式;所述的卷积神经网络中卷积核的大小和个数设置要根据输入数据的规格进行设置,要保证进行卷积操作后的数据规格大小不发生改变;所述的transformer编码器为多个多头注意力网络串行的网络;所述的全连接层为单一神经元输出。
7.根据权利要求1所述的基于时空特征深度学习的公交车到站时间预测方法,其特征在于,所述的步骤
S6具体为:
S61:将时间序列预测数据X∈RN×m作为输入,利用快速傅里叶变换进行处理,得到FFT(X);
S62:设计卷积神经网络的参数,将卷积核的个数设置为m,大小为m×m,对FFT(X)进行卷积操作Conv(),得到Conv(FTT(X));
S63:对卷积操作的结果进行激活函数ReLU的操作,得到ReLU(Conv(FTT(X)));
S64:利用快速傅里叶逆变换将步骤S63的结果从时域转换为频域信号,得到X′=IFFT(ReLU(Conv(FTT(X))));
S65:为保留时域信号的信息,将输入X与上一步得到的结果X′进行对应位置的向量相加,得到X′+X;
S66:将X′+X输入transformer编码器进行时间序列的知识学习;
S67:将transformer编码器的学习结果,经过一层全连接神经网络计算得到预测值Y′。
8.应用于上述任一项权利要求所述的公交数据收集系统,其特征在于,由安装在公交车上的GPS信号收发器(1),安装在公交车上的上车打卡装置(2),安装在公交车上的无线网卡(3),本地端的无线网络设备(4),以及云端服务器(5)构成;其特征在于,所述的GPS信号收发器(1)、上车打卡装置(2)与无线网卡(3)相连,实时上传GPS数据和乘客上车打卡数据;所述的无线网卡(3)与无线网络设备(4)通过无线网络连接,传输数据;所述的网络设备(4)与云端服务器(5)相连,将数据传输给云端服务器(5)进行分析处理,并将云端服务器(5)的处理结果通过网络设备(4)发送给乘客的手机终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310826694.3A CN116894512A (zh) | 2023-07-03 | 2023-07-03 | 基于时空特征深度学习的公交车到站时间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310826694.3A CN116894512A (zh) | 2023-07-03 | 2023-07-03 | 基于时空特征深度学习的公交车到站时间预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116894512A true CN116894512A (zh) | 2023-10-17 |
Family
ID=88313093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310826694.3A Pending CN116894512A (zh) | 2023-07-03 | 2023-07-03 | 基于时空特征深度学习的公交车到站时间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116894512A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117910660A (zh) * | 2024-03-18 | 2024-04-19 | 华中科技大学 | 基于gps数据及时空关联性的公交到站时间预测方法及系统 |
CN118966803A (zh) * | 2024-10-16 | 2024-11-15 | 南京知麻软件技术有限公司 | 基于大数据的企业数字化风控方法与平台 |
-
2023
- 2023-07-03 CN CN202310826694.3A patent/CN116894512A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117910660A (zh) * | 2024-03-18 | 2024-04-19 | 华中科技大学 | 基于gps数据及时空关联性的公交到站时间预测方法及系统 |
CN118966803A (zh) * | 2024-10-16 | 2024-11-15 | 南京知麻软件技术有限公司 | 基于大数据的企业数字化风控方法与平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104778834B (zh) | 一种基于车辆gps数据的城市道路交通拥堵判别方法 | |
CN103198104B (zh) | 一种基于城市智能公交系统的公交站点od获取方法 | |
CN116894512A (zh) | 基于时空特征深度学习的公交车到站时间预测方法 | |
CN112150207B (zh) | 基于时空上下文注意力网络的网约车订单需求预测方法 | |
CN103594000B (zh) | 基于移动网络服务的停车位搜索平台 | |
CN104157139B (zh) | 一种交通拥堵预测方法及可视化方法 | |
CN114202120B (zh) | 一种针对多源异构数据的城市交通行程时间预测方法 | |
CN103606299B (zh) | 基于智能手机的停车位信息共享方法 | |
CN105809962A (zh) | 一种基于手机数据的交通出行方式划分的方法 | |
Li et al. | Public bus arrival time prediction based on traffic information management system | |
CN108288321A (zh) | 基于ic卡数据与车辆gps信息的公交站点上下客流量确定方法 | |
CN113762338B (zh) | 一种基于多重图注意力机制的交通流预测方法、设备及介质 | |
CN110728772A (zh) | 一种有轨电车典型行驶工况构建方法 | |
CN112036757B (zh) | 基于手机信令和浮动车数据的停车换乘停车场的选址方法 | |
CN104778508A (zh) | 一种基于多源数据融合的公共自行车租借预测方法 | |
CN101908275A (zh) | 基于多网络的公共交通优化出行方法 | |
CN115204478A (zh) | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 | |
CN115063978B (zh) | 一种基于数字孪生的公交到站时间预测方法 | |
CN107392389A (zh) | 基于arima模型的出租车调度处理方法 | |
CN110570656A (zh) | 定制公共交通线路方法及装置 | |
CN115985104A (zh) | 一种交通流量预测装置、预测方法及预测模型构建方法 | |
CN112017436A (zh) | 城市市内交通旅行时间的预测方法及系统 | |
CN114328675A (zh) | 基于双注意力机制和双向双层lstm的公交行程时间预测方法 | |
CN116153125A (zh) | 一种基于ida-rnn模型的空间维度公交到达时间预测方法 | |
CN115394083A (zh) | 一种基于深度学习的高速公路交通拥堵预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |