CN116542391A - 一种基于大数据的城市区域客流量预测方法 - Google Patents

一种基于大数据的城市区域客流量预测方法 Download PDF

Info

Publication number
CN116542391A
CN116542391A CN202310587950.8A CN202310587950A CN116542391A CN 116542391 A CN116542391 A CN 116542391A CN 202310587950 A CN202310587950 A CN 202310587950A CN 116542391 A CN116542391 A CN 116542391A
Authority
CN
China
Prior art keywords
feature
representing
features
passenger flow
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310587950.8A
Other languages
English (en)
Other versions
CN116542391B (zh
Inventor
王进
蒋诗琪
杨添善
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Winner Electronic Technology Co ltd
Yami Technology Guangzhou Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202310587950.8A priority Critical patent/CN116542391B/zh
Publication of CN116542391A publication Critical patent/CN116542391A/zh
Application granted granted Critical
Publication of CN116542391B publication Critical patent/CN116542391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • G06F18/21324Rendering the within-class scatter matrix non-singular involving projections, e.g. Fisherface techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于机器学习领域,具体涉及一种基于大数据的城市区域客流量预测方法,包括:建立基于AutoFM模块、基于注意力机制的双通道LSTM模块、基于转移权重的卷积神经网络模块、基于树模型的特征选择模块的城市区域客流量预测模型,并训练城市区域客流量预测模型,采用训练完成的城市区域客流量预测模型对城市区域客流量进行预测,得到预测结果;本发明通过建立城市区域客流量预测模型,不仅考虑了时间上的特点,还关注了空间特征,对客流量的移动趋势做出预测,解决了传统方法受到外部环境变化的影响,准确度较低的问题。

Description

一种基于大数据的城市区域客流量预测方法
技术领域
本发明属于机器学习领域,具体涉及一种基于大数据的城市区域客流量预测方法。
背景技术
随着经济的不断发展,城市规模的不断扩大,城市交通拥堵问题已经成为制约城市发展和居民生活质量的重要问题之一,城市交通管理也需要有更加科学的方法。而城市客流量预测城市交通管理的一个重要任务,如何准确地预测城市客流量对于优化城市交通管理和提高交通效率非常重要。
传统的客流量预测方法主要是基于历史数据进行分析和预测,但是这种方法容易受到外部环境变化的影响,准确度较低,而且对于城市区域客流量预测不仅要考虑时间上的特点,还需要关注空间特征,并对之后客流量的移动趋势做出预测。因此,开发高效的城市区域客流量预测方法具有重要的现实意义。
发明内容
为解决上述技术问题,本发明提出一种基于大数据的城市区域客流量预测方法,其特征在于,包括:
建立城市区域客流量预测模型,训练建立的城市区域客流量预测模型,采用训练完成的城市区域客流量预测模型对城市区域客流量进行预测,得到预测结果;
所述城市区域客流量预测模型,包括:AutoFM模块、基于注意力机制的双通道LSTM模块、基于转移权重的卷积神经网络模块、基于树模型的特征选择模块;
所述城市区域客流量预测模型的训练过程,包括:
S1:对原始数据进行处理,按照特征类型,将数据划分为属性特征,时间特征和空间特征;
S2:将属性特征Fa输入AutoFM模块,将属性特征经过One-Hot编码变成向量特征,向量特征通过自适应特征交互,得到交叉属性特征F′a
S3:将交叉属性特征F′a分别与时间特征Ft和空间特征Fs进行拼接送入基于注意力机制的双通道LSTM模块和基于转移权重的卷积神经网络模块,提取到卷积时间特征F′t和卷积空间特征F′s
S4:将交叉属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入基于树模型的特征选择模块进行客流量预测,得到客流量预测,并采用平均绝对值误差计算损失值进行梯度回传,完成模型训练。
本发明的有益效果:本发明通过自适应的AutoFM模块动态优化提取交叉类别特征,更好地挖掘了特征之间的相关性;设计基于注意力机制的双通道LSTM学习长期时间特征和突发事件特征,并对突发事件特征施以更短期的关注,解决了常规方法无法对突发特征进行有效拟合的问题;采用基于转移权重的卷积神经网络,提取空间区域特征以及趋势特征,将空间特征融入到模型中,更加符合真实的道路情况;采用基于树模型的特征选择模块融合特征重要性,进一步提升了预测准确性。
附图说明
图1为本发明的城市区域客流量预测模型训练流程图;
图2为本发明的AutoFM模块结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于大数据的城市区域客流量预测方法,如图1所示,包括:
建立城市区域客流量预测模型,训练建立的城市区域客流量预测模型,采用训练完成的城市区域客流量预测模型对城市区域客流量进行预测,得到预测结果;
所述城市区域客流量预测模型,包括:AutoFM模块、基于注意力机制的双通道LSTM模块、基于转移权重的卷积神经网络模块、基于树模型的特征选择模块;
所述城市区域客流量预测模型的训练过程,包括:
S1:对原始数据进行处理,按照特征类型,将数据划分为属性特征,时间特征和空间特征;
S2:将属性特征Fa输入AutoFM模块,将属性特征经过One-Hot编码变成向量特征,向量特征通过自适应特征交互,得到交叉属性特征F′a
S3:将交叉属性特征F′a分别与时间特征Ft和空间特征Fs进行拼接送入基于注意力机制的双通道LSTM模块和基于转移权重的卷积神经网络模块,提取到卷积时间特征F′t和卷积空间特征F′s
S4:将交叉属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入基于树模型的特征选择模块进行客流量预测,得到客流量预测,并采用平均绝对值误差计算损失值进行梯度回传,完成模型训练。
从公开数据集(北京出租车数据集TaxiBJ和北京气象信息BJ_Meteorology)获取原始数据,原始数据集有以下字段:节假日,天气,时间,日期,经纬度,客流量;属性特征(节假日,天气),时间特征(时间,日期),空间特征(经纬度),标签(客流量);
所述AutoFM模块:传统的FM有两部分,线性部分和交叉部分;线性部分是给与每个特征一个权重,然后进行加权和;交叉部分是对特征进行两两相乘,然后赋予权重加权求和;然后将两部分结果累加在一起即为FM Layer的输出;FM原公式为为了改变FM在稀疏特征中提取交叉特征困难,于是加入/>项,为每个特征学习一个自动范式,来弥补稀疏特征,得到改进的AutoFM模块,如图2所示。
所述基于注意力机制的双通道LSTM模块:设计了一个双通道LSTM,解决了传统LSTM并行性低且只能训练一条样本的问题;双通道LSTM共用一个细胞状态,并在隐藏状态上做差异性操作;在一个通道突发事件特征使用自注意力机制,让模型更关注短期的数据变化,另一个LSTM通道提取长期时间特征。
所述基于转移权重的卷积神经网络模块:在传统卷积神经网络中加入转移权重矩阵,用于表示人群的移动趋势;通过空间数值特征和空间趋势特征,多维度的评价客流量未来的分布。
所述基于树模型的特征选择模块:使用现有的LightGBM模型,结合特征重要性对三种特征加权并且投影到一个向量空间中。
向量特征通过自适应特征交互,得到交叉属性特征F′a,包括:
其中,F′a表示交叉属性特征,Fa表示属性特征,w0、wi分别表示AutoFM模块的初始可学习权重和第i阶段可学习权重,Fai和Faj分别表示Fa中第i个特征和第j个特征,vi、vj分别表示Fai和Faj的隐向量,pi(i∈[1,n])表示当前特征最优自动范式,n表示属性特征Fa包含的特征总量。
通过基于注意力机制的双通道LSTM模块提取时间特征F′t,包括:
将attention机制加入双通道LSTM中,将交叉属性特征F′a与时间特征Ft拼接后输入双通道LSTM中,通过attention机制区分提取长期时间特征和突发事件特征,通过筛选函数对突发事件特征进行筛选,将筛选出来的突发事件特征与长期时间特征进行融合,得到融合后的时间特征输出F′t
将交叉属性特征F′a与时间特征Ft拼接:
x=[F′a;Ft]
其中,x表示将交叉属性特征F′a与时间特征Ft拼接后的特征向量,[;]表示两个向量进行拼接。
拼接后的特征采用双通道LSTM区分提取长期时间特征和突发事件特征,包括:
长期时间特征:
f长期时间=Mm,i∈[1,m]
突发事件特征:
f突发事件=Nm,i∈[1,m]
其中,f长期时间表示长期时间特征,f突发事件表示突发事件特征,Mi表示第i步LSTMcell1输出的隐藏状态,Ni表示第i步LSTMcell2输出的隐藏状态,LSTMcell1和LSTMcell2分别表示LSTM的通道1和通道2,表示第i步通道1的细胞状态,/>表示第i步通道2的细胞状态,xi-1表示拼接后的特征x在双通道LSTM中第i-1步的特征向量,attention()表示注意力机制。
通过筛选函数对突发事件特征进行筛选,包括:
f′突发事件=mask·f突发事件
其中,f′突发事件表示筛选出来的突发事件特征,f突发事件表示突发事件特征,mask表示,tanh示双曲正切函数,max_num是设定的异常阈值,func表示筛选函数。
将筛选出来的突发事件特征与长期时间特征进行融合,包括:
F′t=k1f′突发事件+k2f长期时间
其中,F′t表示卷积时间特征,k1、k2分别表示突发事件特征与长期时间特征的可学习权重,f′突发事件表示筛选后的突发事件特征,f长期时间表示长期时间特征。
将交叉属性特征F′a与空间特征Fs拼接后的特征输入基于转移权重的卷积神经网络模块的CNN层并结合均值池化,得到空间区域特征f1
所述空间区域特征f1,表示为:
f1=meanpooling(ReLU(conv(Input)))
其中,meanpooling表示均值池化,ReLU表示线性整流函数,conv表示卷积层,Input表示输入的将交叉属性特征F′a与空间特征Fs拼接后的特征;
采用转移权重矩阵表示客流量的移动方向,得到可学习参数矩阵空间表示的趋势特征f2,f2中元素(i,j)表示第i个地点到第j个地点的移动概率;
所述空间趋势特征f2,表示为:
f2=f1-f1 T
其中,f1表示空间区域特征,f2表示空间趋势特征,f1 T表示f1的转置;
将f2与f1按位相乘,并提取i行和i列的向量进行拼接得到卷积空间特征F′s,i表示当前样本的地点;
将f2与f1按位相乘,并提取i行和i列的向量进行拼接得到F′s,表示为:
F′s=[[f1·f2]...i;[f1·f2]i...]
其中,F′s表示卷积空间特征,[;]表示拼接,[f1·f2]i...表示i行,[f1·f2]...i表示i列。
将属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入基于树模型的特征选择模块进行客流量预测,得到客流量预测,包括:
将属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入树模型LightGBM中进行特征分裂,根据特征分裂结果结合属性特征、时间特征和空间特征的类别,得到每一类特征的平均特征重要性(w1,w2,w3);
将每一类特征的平均特征重要性与交叉属性特征F′a、卷积时间特征F′t和卷积空间特征F′s进行交互,并通过线性层得到预测结果。
将平均特征重要性与属性特征F′a、时间特征F′t和空间特征F′s进行交互,并通过线性层得到预测结果,包括:
output=c4[tanh(c1w1F′a+t1),tanh(c2w2F′t+t2),tanh(c3w3F′s+t3)]+t4
其中,output表示输出的预测结果,tanh表示双曲正切函数,F′a表示交叉属性特征,F′t表示卷积时间特征,F′s表示卷积空间特征,c1表示交叉属性特征权重,w1表示属性特征重要性,t1表示属性特征偏置,c2表示卷积时间特征权重,w2表示卷积时间特征重要性,t2表示卷积时间特征偏置,c3表示卷积空间特征权重,w3表示卷积空间特征重要性,t3表示卷积空间特征偏置,t4表示总偏置,c4表示总权重。
采用平均绝对值误差计算损失值,公式yi表示预测值,/>表示真实值。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种基于大数据的城市区域客流量预测方法,其特征在于,包括:
建立城市区域客流量预测模型,训练建立的城市区域客流量预测模型,采用训练完成的城市区域客流量预测模型对城市区域客流量进行预测,得到预测结果;
所述城市区域客流量预测模型,包括:AutoFM模块、基于注意力机制的双通道LSTM模块、基于转移权重的卷积神经网络模块、基于树模型的特征选择模块;
所述城市区域客流量预测模型的训练过程,包括:
S1:对原始数据进行处理,按照特征类型,将数据划分为属性特征,时间特征和空间特征;
S2:将属性特征Fa输入AutoFM模块,将属性特征经过One-Hot编码变成向量特征,向量特征通过自适应特征交互,得到交叉属性特征F′a
S3:将交叉属性特征F′a分别与时间特征Ft和空间特征Fs进行拼接送入基于注意力机制的双通道LSTM模块和基于转移权重的卷积神经网络模块,提取到卷积时间特征F′t和卷积空间特征F′s
S4:将交叉属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入基于树模型的特征选择模块进行客流量预测,得到客流量预测,并采用平均绝对值误差计算损失值进行梯度回传,完成模型训练。
2.根据权利要求1所述的一种基于大数据的城市区域客流量预测方法,其特征在于,向量特征通过自适应特征交互,得到交叉属性特征F′a,包括:
其中,F′a表示交叉属性特征,Fa表示属性特征,w0、wi分别表示AutoFM模块的初始可学习权重和第i阶段可学习权重,Fai和Faj分别表示Fa中第i个特征和第j个特征,vi、vj分别表示Fai和Faj的隐向量,pi(i∈[1,n])表示当前特征最优自动范式,n表示属性特征Fa包含的特征总量。
3.根据权利要求1所述的一种基于大数据的城市区域客流量预测方法,其特征在于,通过基于注意力机制的双通道LSTM模块提取卷积时间特征F′t,包括:
将attention机制加入双通道LSTM中,将交叉属性特征F′a与时间特征Ft拼接后输入双通道LSTM中,通过attention机制区分提取长期时间特征和突发事件特征,通过筛选函数对突发事件特征进行筛选,将筛选出来的突发事件特征与长期时间特征进行融合,得到融合后的卷积时间特征F′t
4.根据权利要求3所述的一种基于大数据的城市区域客流量预测方法,其特征在于,拼接后的特征采用双通道LSTM区分提取长期时间特征和突发事件特征,包括:
长期时间特征:
f长期时间=Mm,i∈[1,m]
突发事件特征:
f突发事件=Nm,i∈[1,m]
其中,f长期时间表示长期时间特征,f突发事件表示突发事件特征,Mi表示第i步LSTMcell1输出的隐藏状态,Ni表示第i步LSTMcell2输出的隐藏状态,LSTMcell1和LSTMcell2分别表示LSTM的通道1和通道2,表示第i步通道1的细胞状态,/>表示第i步通道2的细胞状态,xi-1表示拼接后的特征x在双通道LSTM中第i-1步的特征向量,attention()表示注意力机制。
5.根据权利要求3所述的一种基于大数据的城市区域客流量预测方法,其特征在于,通过筛选函数对突发事件特征进行筛选,包括:
f′突发事件=mask·f突发事件
其中,f′突发事件表示筛选出来的突发事件特征,f突发事件表示突发事件特征,mask表示筛选矩阵,tanh表示双曲正切函数,max_num表示设定的异常阈值,func表示筛选函数。
6.根据权利要求3所述的一种基于大数据的城市区域客流量预测方法,其特征在于,将筛选出来的突发事件特征与长期时间特征进行融合,包括:
F′t=k1f′突发事件+k2f长期时间
其中,F′t表示卷积时间特征,k1、k2分别表示突发事件特征与长期时间特征的可学习权重,f′突发事件表示筛选后的突发事件特征,f长期时间表示长期时间特征。
7.根据权利要求1所述的一种基于大数据的城市区域客流量预测方法,其特征在于,通过基于转移权重的卷积神经网络模块进行空间特征F′s提取,包括:
将交叉属性特征F′a与空间特征Fs拼接后的特征输入基于转移权重的卷积神经网络模块的CNN层并结合均值池化,得到空间区域特征f1
所述空间区域特征f1,表示为:
f1=meanpooling(ReLU(conv(Input)))
其中,meanpooling表示均值池化,ReLU表示线性整流函数,conv表示卷积层,Input表示输入的将交叉属性特征F′a与空间特征Fs拼接后的特征;
采用转移权重矩阵表示客流量的移动方向,得到可学习参数矩阵空间表示的趋势特征f2,f2中元素(i,j)表示第i个地点到第j个地点的移动概率;
所述空间趋势特征f2,表示为:
f2=f1-f1 T
其中,f1表示空间区域特征,f2表示空间趋势特征,f1 T表示f1的转置;
将f2与f1按位相乘,并提取i行和i列的向量进行拼接得到卷积空间特征F′s,i表示当前样本的地点;
将f2与f1按位相乘,并提取i行和i列的向量进行拼接得到F′s,表示为:
F′s=[[f1·f2]...i;[f1·f2]i...]
其中,F′s表示卷积空间特征,[;]表示拼接,[f1·f2]i…表示i行,[f1·f2]…i表示i列。
8.根据权利要求1所述的一种基于大数据的城市区域客流量预测方法,其特征在于,将属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入基于树模型的特征选择模块进行客流量预测,得到客流量预测,包括:
将属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入树模型LightGBM中进行特征分裂,根据特征分裂结果结合属性特征、时间特征和空间特征的类别,得到每一类特征的平均特征重要性(w1,w2,w3);
将每一类特征的平均特征重要性与交叉属性特征F′a、卷积时间特征F′t和卷积空间特征F′s进行交互,并通过线性层得到预测结果。
9.根据权利要求8所述的一种基于大数据的城市区域客流量预测方法,其特征在于,将平均特征重要性与属性特征F′a、时间特征F′t和空间特征F′s进行交互,并通过线性层得到预测结果,包括:
0utput=C4[tanh(Clw1F′a+t1),tanh(C2w2F′t+t2),tanh(C3w3F′s+t3)]+t4
其中,output表示输出的预测结果,tanh表示双曲正切函数,F′a表示交叉属性特征,F′t表示卷积时间特征,F′s表示卷积空间特征,c1表示交叉属性特征权重,w1表示属性特征重要性,t1表示属性特征偏置,c2表示卷积时间特征权重,w2表示卷积时间特征重要性,t2表示卷积时间特征偏置,c3表示卷积空间特征权重,w3表示卷积空间特征重要性,t3表示卷积空间特征偏置,t4表示总偏置,c4表示总权重。
CN202310587950.8A 2023-05-24 2023-05-24 一种基于大数据的城市区域客流量预测方法 Active CN116542391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310587950.8A CN116542391B (zh) 2023-05-24 2023-05-24 一种基于大数据的城市区域客流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310587950.8A CN116542391B (zh) 2023-05-24 2023-05-24 一种基于大数据的城市区域客流量预测方法

Publications (2)

Publication Number Publication Date
CN116542391A true CN116542391A (zh) 2023-08-04
CN116542391B CN116542391B (zh) 2024-01-05

Family

ID=87454112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310587950.8A Active CN116542391B (zh) 2023-05-24 2023-05-24 一种基于大数据的城市区域客流量预测方法

Country Status (1)

Country Link
CN (1) CN116542391B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583656A (zh) * 2018-12-06 2019-04-05 重庆邮电大学 基于a-lstm的城市轨道交通客流量预测方法
CN115081717A (zh) * 2022-06-27 2022-09-20 北京建筑大学 融合注意力机制和图神经网络的轨道交通客流预测方法
US20230153608A1 (en) * 2021-11-15 2023-05-18 East China Jiaotong University Method for predicting remaining useful life of railway train bearing based on can-lstm

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583656A (zh) * 2018-12-06 2019-04-05 重庆邮电大学 基于a-lstm的城市轨道交通客流量预测方法
US20230153608A1 (en) * 2021-11-15 2023-05-18 East China Jiaotong University Method for predicting remaining useful life of railway train bearing based on can-lstm
CN115081717A (zh) * 2022-06-27 2022-09-20 北京建筑大学 融合注意力机制和图神经网络的轨道交通客流预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591919A (zh) * 2024-01-17 2024-02-23 北京工业大学 客流预测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN116542391B (zh) 2024-01-05

Similar Documents

Publication Publication Date Title
CN110570651B (zh) 一种基于深度学习的路网交通态势预测方法及系统
CN109034448B (zh) 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法
Qin et al. A novel combined prediction scheme based on CNN and LSTM for urban PM 2.5 concentration
CN109142171B (zh) 基于特征扩张的融合神经网络的城市pm10浓度预测方法
CN106650767B (zh) 基于聚类分析和实时校正的洪水预报方法
CN112767682A (zh) 一种基于图卷积神经网络的多尺度交通流量预测方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN113487066A (zh) 基于多属性增强图卷积-Informer模型的长时序货运量预测方法
CN116542391B (zh) 一种基于大数据的城市区域客流量预测方法
CN111932026A (zh) 基于数据融合和知识图谱嵌入的城市流量模式挖掘方法
Bao et al. Spatial–temporal complex graph convolution network for traffic flow prediction
CN116721537A (zh) 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法
CN109086926B (zh) 一种基于组合神经网络结构的短时轨道交通客流预测方法
Sampathkumar et al. Majority voting based hybrid ensemble classification approach for predicting parking availability in smart city based on IoT
Xayasouk et al. Air pollution prediction system using deep learning
CN114692984A (zh) 基于多步耦合图卷积网络的交通预测方法
CN116307103A (zh) 一种基于硬参数共享多任务学习的交通事故预测方法
CN115204477A (zh) 一种上下文感知图递归网络的自行车流量预测方法
CN113920379B (zh) 一种基于知识辅助的零样本图像分类方法
CN116153125A (zh) 一种基于ida-rnn模型的空间维度公交到达时间预测方法
CN116738192A (zh) 一种基于数字孪生的安全数据评估方法及系统
CN115035334A (zh) 多尺度融合双时相遥感图像的多分类变化检测方法及系统
Bao et al. Forecasting network-wide multi-step metro ridership with an attention-weighted multi-view graph to sequence learning approach
CN117116048A (zh) 基于知识表示模型和图神经网络的知识驱动交通预测方法
CN112201036A (zh) 一种基于Inception-CNN的城市快速路行程速度短时预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231211

Address after: 701B, 7th Floor, No. 518 Jiangchang West Road, Jing'an District, Shanghai 200040

Applicant after: SHANGHAI WINNER ELECTRONIC TECHNOLOGY CO.,LTD.

Address before: Room 801, No. 85, Kefeng Road, Huangpu District, Guangzhou, Guangdong 510000 (office only)

Applicant before: Yami Technology (Guangzhou) Co.,Ltd.

Effective date of registration: 20231211

Address after: Room 801, No. 85, Kefeng Road, Huangpu District, Guangzhou, Guangdong 510000 (office only)

Applicant after: Yami Technology (Guangzhou) Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Applicant before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

GR01 Patent grant
GR01 Patent grant