CN112801360A - 一种出租车需求预测方法、系统和设备 - Google Patents
一种出租车需求预测方法、系统和设备 Download PDFInfo
- Publication number
- CN112801360A CN112801360A CN202110097592.3A CN202110097592A CN112801360A CN 112801360 A CN112801360 A CN 112801360A CN 202110097592 A CN202110097592 A CN 202110097592A CN 112801360 A CN112801360 A CN 112801360A
- Authority
- CN
- China
- Prior art keywords
- information
- neural network
- historical
- weather
- taxi demand
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000013528 artificial neural network Methods 0.000 claims abstract description 70
- UKTFKFNAQNTBGK-WAYWQWQTSA-N (z)-4-[1-(2-methylprop-2-enoyloxy)butan-2-yloxy]-4-oxobut-2-enoic acid Chemical compound CC(=C)C(=O)OCC(CC)OC(=O)\C=C/C(O)=O UKTFKFNAQNTBGK-WAYWQWQTSA-N 0.000 claims abstract description 28
- 230000007246 mechanism Effects 0.000 claims abstract description 28
- 238000000605 extraction Methods 0.000 claims description 49
- 238000003062 neural network model Methods 0.000 claims description 37
- 238000006243 chemical reaction Methods 0.000 claims description 27
- 238000013527 convolutional neural network Methods 0.000 claims description 23
- 230000009466 transformation Effects 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000013277 forecasting method Methods 0.000 abstract description 5
- 230000005540 biological transmission Effects 0.000 abstract description 2
- 238000011176 pooling Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G06Q50/40—
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
本申请公开了一种出租车需求预测方法、系统和设备,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
Description
本申请要求申请日为2020年12月30日,申请号为202011622036.5的优先权
技术领域
本申请涉及智能交通技术领域,尤其涉及一种出租车需求预测方法、系统和设备。
背景技术
作为智慧城市的重要组成部分,出租车需求预测影响着民众的日常生活。有效的出租车预测方法能够促使线上出租车平台的成功,准确的出租车需求预测能够带来巨大好处。首先,基于出租车需求预测,服务提供方可以派遣更多的出租车到需求多的区域以减少乘客的等待时间。第二,能够提升出租车司机的收入和减少能源的消耗。第三,出租车需求预测有助于高效的城市交通管理和提升交通资源的利用率。
出租车需求预测本质上是一个时序特征处理的任务,即根据历史时刻的出租车需求量预测未来时刻的出租车需求量。随着交通领域大数据的出现以及深度学习的发展,现有的出租车需求预测方式采用深度学习方法进行预测,,使用卷积神经网络(CNN,Convolution Neural Network)以及长短时记忆网络(LSTM,Long Short-Term Memory)等搭建深度学习模型来预测出租车需求,但是需求预测准确性还有待进一步提高。
发明内容
本申请提供了一种出租车需求预测方法、系统和设备,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
有鉴于此,本申请第一方面提供了一种出租车需求预测方法,包括:
对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
可选地,所述对历史时刻的多模态信息进行特征提取,得到多模态特征,包括:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
可选地,所述图神经网络的节点表示为:
Node={(Di,Wi,Ei,Ti)|i∈[1,n]}
所述图神经网络的边表示为:
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
可选地,所述将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接,包括:
将每个历史时刻提取的多模态特征作为图神经网络的节点,按照时序顺序将相邻节点连接,并将第n个节点连向第1个节点,构造图神经网络。
可选地,
所述基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,包括:
对第n个时刻的节点进行更新:
通过注意力机制增加强相关性特征的权重:
其中,||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,为权重与模态特征加权后的第j+1层候选的出租车需求特征;
通过一个线性转换层和relu激活函数输出第j+1层是需求特征表示,更新图神经网络的节点:
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
可选地,训练的图神经网络模型和损失函数分别为:
其中,wpred∈Rnh×1,bpred∈R1分别为预测时涉及的可训练矩阵和偏置项,表示在顶层第J层连接所有节点的出租车需求特征,N为时间步的数量,yi为第i时刻的真实出租车需求量,为第i时刻的预测出租车需求量。
可选地,所述训练好的图神经网络模型为损失函数最小时对应的图神经网络模型。
本申请第二方面提供了一种出租车需求预测系统,包括:
特征提取单元,用于对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
构造图单元,用于将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
更新训练单元,用于基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
输出单元,用于将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
可选地,所述特征提取单元具体用于:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
本申请第三方面提供了一种出租车需求预测设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的出租车需求预测方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中提供了一种出租车需求预测方法,包括:对历史时刻的多模态信息进行特征提取,得到多模态特征,多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;基于多模态注意力的消息传递机制MMPM对图神经网络的节点进行更新,对图神经网络模型进行训练;将当前时刻的多模态信息输入训练好的图神经网络模型,得到图神经网络模型输出的出租车需求预测结果。本申请提供的出租车需求预测方法,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种出租车需求预测方法的流程示意图;
图2为MIFGNN模型结构示意图;
图3为1D-CNN模型结构示意图;
图4结合注意力机制的MMPM示意图;
图5为本申请实施例提供的一种出租车需求预测系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例1
为了便于理解,请参阅图1至图4,本申请提供了一种出租车需求预测方法的实施例,包括:
步骤101、对历史时刻的多模态信息进行特征提取,得到多模态特征,多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,多模态特征包括出租车需求特征、天气特征、事件特征和文本特征。
需要说明的是,本申请实施中,需要获取历史时刻的多模态信息,包括历史出租车需求信息,比如某个时刻目标区域的出租车需求量,历史事件信息,比如演唱会、体育活动等,以及每个事件发生的时间,历史天气信息,即某时间段目标区域附件的气象台发布的天气预报情况,历史文本信息,比如从互联网中自动抓取的目标区域内的新闻信息。事件信息和文本信息可以通过爬虫程序从互联网中进行爬取。事件的发生、天气状况的影响和新闻信息等都会对目标区域的出租车需求产生影响,因此,需要获取历史时刻的出租车需求信息、天气信息、事件信息和文本信息,对这些信息进行分析,有利于提高出租车需求预测的准确性。在获取到信息数据之后,对数据进行预处理,包括数据清洗、规范化处理、去除停用词、分词、文本向量化表示等。然后对出租车需求信息、天气信息、事件信息和文本信息进行特征提取,得到出租车需求特征、天气特征、事件特征和文本特征。
步骤102、将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造图神经网络的边连接。
需要说明的是,搭建如图2所示的MIFGNN(Multi-modal Information FusionGraph Neural Network,多模态信息和图神经网络)结构,以每个历史时刻的出租车需求特征Dn、天气特征Wn、事件特征En和文本特征Tn,即图2中的(Di,Wi,Ei,Ti)作为图神经网络架构的节点特征表示,根据节点的时序关系构造图神经网络的边连接。
步骤103、基于多模态注意力的消息传递机制MMPM对图神经网络的节点进行更新,对图神经网络模型进行训练。
需要说明的是,为了构造多模态信息和出租车需求的相关性,本申请实施例提出了结合注意力的消息传递机制(Multi-modal Message Passing Mechanism,MMPM)更新节点特征,如图4所示,MMPM通过收集来自邻近节点的特征更新自身的节点表示。通过梯度下降算法进行图神经网络的参数优化,训练得到出租车需求预测的图神经网络模型。
步骤104、将当前时刻的多模态信息输入训练好的图神经网络模型,得到图神经网络模型输出的出租车需求预测结果。
需要说明的是,将训练得到的图神经网络模型部署紧传统的Web架构中,当接收到实时传来的历史出租车需求信息、天气信息、事件信息和文本信息时,输入到训练好的图神经网络模型,模型返回下一时刻的出租车需求预测结果。
本申请实施例提供的出租车需求预测方法,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
实施例2
本申请中提供了一种出租车需求预测方法的另一个实施例,包括:
步骤201、采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征,采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征。
需要说明的是,由于多模态信息中各种模态信息的表示空间是不相同的,因此有必要对多个模态信息进行特征转换,使得表示空间统一。对历史时刻的出租车需求信息、天气信息和事件信息采取以下的特征提取方式,得到出租车需求特征、天气特征和事件特征;
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
对于文本信息特征提取,采用一维卷积神经网络1D-CNN(One-dimensionalConvolutional Neural Network)对文本信息进行特征提取,得到文本特征;如图3所示,先通过词嵌入层(word embedding layer)把文本中的词转化成向量化表示,由于词嵌入层的参数是经过大量语料库训练得到的,因此可以反映文本特征的相关性和词的相关性,之后经过一维卷积层进行特征提取,最后通过时间维度的池化层(max-over-time pooling)进行特征降维。假设1D-CNN包含h个过滤器,那么经过max-over-time pooling后,可得到第n个时刻的文本特征Tn∈Rh。
步骤202、将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造图神经网络的边连接。
n个时刻的多模态特征可表示为:
f={(D1,W1,E1,T1),...,(Di,Wi,Ei,Ti),...,(Dn,Wn,En,Tn)},
在给定的特征下,本申请实施例将每个时刻作为图神经网络的节点,如图2所示,通过时序关系构造边连接,构造方式为:
Node={Di,Wi,Ei,Ti)|i∈[1,n]}
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
在图2中,P=2,图中的所有的边均为有向边,节点特征表示均使用多模态特征进行初始化,通过P个邻近节点的连接,模拟前面P个时刻对当前时刻的影响。为了使得第n时刻的特征能够在整个图中进行传递,将第n时刻节点与第1时刻节点进行相连。
步骤203、基于多模态注意力的消息传递机制MMPM对图神经网络的节点进行更新,对图神经网络模型进行训练。
为了构造多模态信息和出租车需求的相关性,本申请实施例提出了结合注意力的消息传递机制(Multi-modal Message Passing Mechanism,MMPM)更新节点特征,如图4所示,MMPM通过收集来自邻近节点的特征更新自身的节点表示。通过梯度下降算法进行图神经网络的参数优化,训练得到出租车需求预测的图神经网络模型。第n个时刻的节点更新为:
其中,为第n个时刻的p个邻近节点,j为网络的层数,为第j+1层第n个节点的出租车需求特征,为第j+1层第n个节点的天气特征,为第j+1层第n个节点的事件特征,为第j+1层第n个节点的文本特征。第0层的节点特征分别通过Dn=wDDemandn+bD、Wn=wWWeathern+bW和En=wEEventn+bE以及1D-CNN输出的结果进行初始化,即
通过注意力机制增加强相关性特征的权重:
其中,||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,为权重与模态特征加权后的第j+1层候选的出租车需求特征。
接着,通过一个线性转换层和relu激活函数可输出第j+1层是需求特征表示,即:
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
在顶层(设为第J层)连接所有节点的出租车需求特征,可以获得:
通过全连接层FC可以对n+1时刻的需求量进行预测:
其中,wpred∈Rnh×1,bpred∈R1分别为预测时涉及的可训练矩阵和偏置项。
为了迭代优化模型参数,本申请实施例中采用的损失函数为:
最后通过反向传播和梯度下降法最小化损失函数,输出训练好的图神经网络模型。
步骤204、将当前时刻的多模态信息输入训练好的图神经网络模型,得到图神经网络模型输出的出租车需求预测结果。
将训练过程得到的模型部署进传统的Web架构中,当接收到实时传来的历史出租车需求、天气、事件和文本信息数据时,将数据经过预处理后,输入训练好的模型中,模型返回下一时刻的出租车需求预测结果。
本申请实施例提供的出租车需求预测方法,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
实施例3
为了便于理解,请参阅图5,本申请中提供了一种出租车需求预测系统的实施例,包括:
特征提取单元,用于对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
构造图单元,用于将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
更新训练单元,用于基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
输出单元,用于将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
特征提取单元具体用于:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
由于多模态信息中各种模态信息的表示空间是不相同的,因此有必要对多个模态信息进行特征转换,使得表示空间统一。对历史时刻的出租车需求信息、天气信息和事件信息采取以下的特征提取方式,得到出租车需求特征、天气特征和事件特征;
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
对于文本信息特征提取,采用一维卷积神经网络1D-CNN(One-dimensionalConvolutional Neural Network)对文本信息进行特征提取,得到文本特征;如图3所示,先通过词嵌入层(word embedding layer)把文本中的词转化成向量化表示,由于词嵌入层的参数是经过大量语料库训练得到的,因此可以反映文本特征的相关性和词的相关性,之后经过一维卷积层进行特征提取,最后通过时间维度的池化层(max-over-time pooling)进行特征降维。假设1D-CNN包含h个过滤器,那么经过max-over-time pooling后,可得到第n个时刻的文本特征Tn∈Rh。
n个时刻的多模态特征可表示为:
f={(D1,W1,E1,T1),...,(Di,Wi,Ei,Ti),...,(Dn,Wn,En,Tn)},
在给定的特征下,本申请实施例将每个时刻作为图神经网络的节点,如图2所示,通过时序关系构造边连接,构造方式为:
Node={(Di,Wi,Ei,Ti)|i∈[1,n]}
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
在图2中,P=2,图中的所有的边均为有向边,节点特征表示均使用多模态特征进行初始化,通过P个邻近节点的连接,模拟前面P个时刻对当前时刻的影响。为了使得第n时刻的特征能够在整个图中进行传递,将第n时刻节点与第1时刻节点进行相连。
为了构造多模态信息和出租车需求的相关性,本申请实施例提出了结合注意力的消息传递机制(Multi-modal Message Passing Mechanism,MMPM)更新节点特征,如图4所示,MMPM通过收集来自邻近节点的特征更新自身的节点表示。通过梯度下降算法进行图神经网络的参数优化,训练得到出租车需求预测的图神经网络模型。第n个时刻的节点更新为:
其中,为第n个时刻的p个邻近节点,j为网络的层数,为第j+1层第n个节点的出租车需求特征,为第j+1层第n个节点的天气特征,为第j+1层第n个节点的事件特征,为第j+1层第n个节点的文本特征。第0层的节点特征分别通过Dn=wDDemandn+bD、Wn=wWWeathern+bW和En=wEEventn+bE以及1D-CNN输出的结果进行初始化,即
通过注意力机制增加强相关性特征的权重:
其中,||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,为权重与模态特征加权后的第j+1层候选的出租车需求特征。
接着,通过一个线性转换层和relu激活函数可输出第j+1层是需求特征表示,即:
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
在顶层(设为第J层)连接所有节点的出租车需求特征,可以获得:
通过全连接层FC可以对n+1时刻的需求量进行预测:
其中,wpred∈Rnh×1,bpred∈R1分别为预测时涉及的可训练矩阵和偏置项。
为了迭代优化模型参数,本申请实施例中采用的损失函数为:
最后通过反向传播和梯度下降法最小化损失函数,输出训练好的图神经网络模型。
将训练过程得到的模型部署进传统的Web架构中,当接收到实时传来的历史出租车需求、天气、事件和文本信息数据时,将数据经过预处理后,输入训练好的模型中,模型返回下一时刻的出租车需求预测结果。
本申请实施例提供的出租车需求预测系统,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
实施例4
本申请中提供了一种出租车需求预测设备的实施例,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给所述处理器;
处理器用于根据程序代码中的指令执行实施例1或实施例2中的出租车需求预测方法。
本申请实施例提供的出租车需求预测设备,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种出租车需求预测方法,其特征在于,包括:
对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
2.根据权利要求1所述的出租车需求预测方法,其特征在于,所述对历史时刻的多模态信息进行特征提取,得到多模态特征,包括:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wwWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq ×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
3.根据权利要求2所述的出租车需求预测方法,其特征在于,所述图神经网络的节点表示为:
Node={(Di,Wi,Ei,Ti)|i∈[1,n]}
所述图神经网络的边表示为:
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
4.根据权利要求3所述的出租车需求预测方法,其特征在于,所述将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接,包括:
将每个历史时刻提取的多模态特征作为图神经网络的节点,按照时序顺序将相邻节点连接,并将第n个节点连向第1个节点,构造图神经网络。
5.根据权利要求4所述的出租车需求预测方法,其特征在于,所述基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,包括:
对第n个时刻的节点进行更新:
通过注意力机制增加强相关性特征的权重:
其中,||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,为权重与模态特征加权后的第j+1层候选的出租车需求特征;
通过一个线性转换层和relu激活函数输出第j+1层是需求特征表示,更新图神经网络的节点:
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
7.根据权利要求6所述的出租车需求预测方法,其特征在于,所述训练好的图神经网络模型为损失函数最小时对应的图神经网络模型。
8.一种出租车需求预测系统,其特征在于,包括:
特征提取单元,用于对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
构造图单元,用于将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
更新训练单元,用于基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
输出单元,用于将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
9.根据权利要求8所述的出租车需求预测系统,其特征在于,所述特征提取单元具体用于:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wwWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq ×h,为历史天气信息进行特征转换时所涉及的可训练参数,wW∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
10.一种出租车需求预测设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-7任一项所述的出租车需求预测方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020116220365 | 2020-12-30 | ||
CN202011622036 | 2020-12-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112801360A true CN112801360A (zh) | 2021-05-14 |
CN112801360B CN112801360B (zh) | 2022-05-17 |
Family
ID=75811601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110097592.3A Active CN112801360B (zh) | 2020-12-30 | 2021-01-25 | 一种出租车需求预测方法、系统和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112801360B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570172A (zh) * | 2021-09-23 | 2021-10-29 | 南京明德产业互联网研究院有限公司 | 一种出租车空载巡航路线推荐的方法、装置和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019220128A1 (en) * | 2018-05-18 | 2019-11-21 | Benevolentai Technology Limited | Graph neutral networks with attention |
CN110969854A (zh) * | 2019-12-13 | 2020-04-07 | 深圳先进技术研究院 | 一种交通流量的预测方法、系统及终端设备 |
CN111340543A (zh) * | 2020-02-25 | 2020-06-26 | 上海大学 | 一种基于注意力机制的细粒度打车需求预测方法 |
CN111612122A (zh) * | 2019-02-25 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 实时需求量的预测方法、装置及电子设备 |
CN111667158A (zh) * | 2020-05-26 | 2020-09-15 | 南开大学 | 一种基于多图神经网络联合学习的工作技能预测方法 |
CN111915057A (zh) * | 2020-06-28 | 2020-11-10 | 厦门大学 | 一种基于深度学习和群智感知的单车需求预测与调度方法 |
US20200394499A1 (en) * | 2019-06-12 | 2020-12-17 | Sri International | Identifying complex events from hierarchical representation of data set features |
-
2021
- 2021-01-25 CN CN202110097592.3A patent/CN112801360B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019220128A1 (en) * | 2018-05-18 | 2019-11-21 | Benevolentai Technology Limited | Graph neutral networks with attention |
CN111612122A (zh) * | 2019-02-25 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 实时需求量的预测方法、装置及电子设备 |
US20200394499A1 (en) * | 2019-06-12 | 2020-12-17 | Sri International | Identifying complex events from hierarchical representation of data set features |
CN110969854A (zh) * | 2019-12-13 | 2020-04-07 | 深圳先进技术研究院 | 一种交通流量的预测方法、系统及终端设备 |
CN111340543A (zh) * | 2020-02-25 | 2020-06-26 | 上海大学 | 一种基于注意力机制的细粒度打车需求预测方法 |
CN111667158A (zh) * | 2020-05-26 | 2020-09-15 | 南开大学 | 一种基于多图神经网络联合学习的工作技能预测方法 |
CN111915057A (zh) * | 2020-06-28 | 2020-11-10 | 厦门大学 | 一种基于深度学习和群智感知的单车需求预测与调度方法 |
Non-Patent Citations (1)
Title |
---|
吴钉捷等: "基于实时出行需求和交通路况的电动汽车充电负荷预测", 《电力建设》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570172A (zh) * | 2021-09-23 | 2021-10-29 | 南京明德产业互联网研究院有限公司 | 一种出租车空载巡航路线推荐的方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112801360B (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492103B (zh) | 标签信息获取方法、装置、电子设备及计算机可读介质 | |
WO2024041479A1 (zh) | 一种数据处理方法及其装置 | |
CN111242395B (zh) | 用于od数据的预测模型构建方法及装置 | |
WO2023207411A1 (zh) | 一种基于时空数据的流量确定方法、装置、设备和介质 | |
CN113112791A (zh) | 一种基于滑动窗口长短时记忆网络的交通流量预测方法 | |
CN112419096A (zh) | 基于nlp信息萃取与少样本自学习的用户用电诉求工单自动流转方法 | |
CN112801360B (zh) | 一种出租车需求预测方法、系统和设备 | |
CN114692984A (zh) | 基于多步耦合图卷积网络的交通预测方法 | |
CN116106988A (zh) | 天气预测方法、装置、电子设备及存储介质 | |
CN114091361B (zh) | 基于气象事件的transformer模型构建方法 | |
Liao et al. | Taxi demand forecasting based on the temporal multimodal information fusion graph neural network | |
CN114372830A (zh) | 一种基于时空多图神经网络的网约车需求预测方法 | |
KR102359902B1 (ko) | 빅데이터 및 인공지능 기반 교차로 서비스수준 예측방법, 그리고 이를 포함하는 저장매체 | |
CN113159371A (zh) | 基于跨模态数据融合的未知目标特征建模与需求预测方法 | |
CN117116048A (zh) | 基于知识表示模型和图神经网络的知识驱动交通预测方法 | |
CN115456238A (zh) | 一种基于动态多视图耦合图卷积的城市出行需求预测方法 | |
CN116089595A (zh) | 基于科技成果的数据处理推送方法、装置及介质 | |
CN115423162A (zh) | 一种车流量预测方法、装置、电子设备及存储介质 | |
CN115618079A (zh) | 会话推荐方法、装置、电子设备及存储介质 | |
CN114418606A (zh) | 基于时空卷积网络的网约车订单需求预测方法 | |
CN113988267A (zh) | 用户意图识别模型的生成方法、用户意图识别方法和设备 | |
CN112528938A (zh) | 车辆检测模型训练及其检测方法、装置及计算机存储介质 | |
Zhang et al. | Boundary-aware bias loss for transformer-based aerial image segmentation model | |
CN111260403A (zh) | 一种中介市场收房定价的方法及系统 | |
CN117034780B (zh) | 一种基于深度学习的多尺度次季节降水量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |