CN112801360A - 一种出租车需求预测方法、系统和设备 - Google Patents

一种出租车需求预测方法、系统和设备 Download PDF

Info

Publication number
CN112801360A
CN112801360A CN202110097592.3A CN202110097592A CN112801360A CN 112801360 A CN112801360 A CN 112801360A CN 202110097592 A CN202110097592 A CN 202110097592A CN 112801360 A CN112801360 A CN 112801360A
Authority
CN
China
Prior art keywords
information
neural network
historical
weather
taxi demand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110097592.3A
Other languages
English (en)
Other versions
CN112801360B (zh
Inventor
廖文雄
曾碧
刘建圻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Publication of CN112801360A publication Critical patent/CN112801360A/zh
Application granted granted Critical
Publication of CN112801360B publication Critical patent/CN112801360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • G06Q50/40
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本申请公开了一种出租车需求预测方法、系统和设备,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。

Description

一种出租车需求预测方法、系统和设备
本申请要求申请日为2020年12月30日,申请号为202011622036.5的优先权
技术领域
本申请涉及智能交通技术领域,尤其涉及一种出租车需求预测方法、系统和设备。
背景技术
作为智慧城市的重要组成部分,出租车需求预测影响着民众的日常生活。有效的出租车预测方法能够促使线上出租车平台的成功,准确的出租车需求预测能够带来巨大好处。首先,基于出租车需求预测,服务提供方可以派遣更多的出租车到需求多的区域以减少乘客的等待时间。第二,能够提升出租车司机的收入和减少能源的消耗。第三,出租车需求预测有助于高效的城市交通管理和提升交通资源的利用率。
出租车需求预测本质上是一个时序特征处理的任务,即根据历史时刻的出租车需求量预测未来时刻的出租车需求量。随着交通领域大数据的出现以及深度学习的发展,现有的出租车需求预测方式采用深度学习方法进行预测,,使用卷积神经网络(CNN,Convolution Neural Network)以及长短时记忆网络(LSTM,Long Short-Term Memory)等搭建深度学习模型来预测出租车需求,但是需求预测准确性还有待进一步提高。
发明内容
本申请提供了一种出租车需求预测方法、系统和设备,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
有鉴于此,本申请第一方面提供了一种出租车需求预测方法,包括:
对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
可选地,所述对历史时刻的多模态信息进行特征提取,得到多模态特征,包括:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
可选地,所述图神经网络的节点表示为:
Node={(Di,Wi,Ei,Ti)|i∈[1,n]}
所述图神经网络的边表示为:
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
可选地,所述将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接,包括:
将每个历史时刻提取的多模态特征作为图神经网络的节点,按照时序顺序将相邻节点连接,并将第n个节点连向第1个节点,构造图神经网络。
可选地,
所述基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,包括:
对第n个时刻的节点进行更新:
Figure BDA0002914462860000031
Figure BDA0002914462860000032
Figure BDA0002914462860000033
Figure BDA0002914462860000034
其中,
Figure BDA0002914462860000035
为第n个时刻的p个邻近节点,j为网络的层数,
Figure BDA0002914462860000036
为第j+1层第n个节点的出租车需求特征,
Figure BDA0002914462860000037
为第j+1层第n个节点的天气特征,
Figure BDA0002914462860000038
为第j+1层第n个节点的事件特征,
Figure BDA0002914462860000039
为第j+1层第n个节点的文本特征;
通过注意力机制增加强相关性特征的权重:
Figure BDA00029144628600000310
Figure BDA00029144628600000311
Figure BDA00029144628600000312
其中,
Figure BDA00029144628600000313
||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,
Figure BDA00029144628600000314
v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,
Figure BDA00029144628600000315
为权重与模态特征加权后的第j+1层候选的出租车需求特征;
通过一个线性转换层和relu激活函数输出第j+1层是需求特征表示,更新图神经网络的节点:
Figure BDA0002914462860000041
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
Figure BDA0002914462860000042
可选地,训练的图神经网络模型和损失函数分别为:
Figure BDA0002914462860000043
Figure BDA0002914462860000044
其中,wpred∈Rnh×1,bpred∈R1分别为预测时涉及的可训练矩阵和偏置项,
Figure BDA0002914462860000045
表示在顶层第J层连接所有节点的出租车需求特征,N为时间步的数量,yi为第i时刻的真实出租车需求量,
Figure BDA0002914462860000046
为第i时刻的预测出租车需求量。
可选地,所述训练好的图神经网络模型为损失函数最小时对应的图神经网络模型。
本申请第二方面提供了一种出租车需求预测系统,包括:
特征提取单元,用于对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
构造图单元,用于将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
更新训练单元,用于基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
输出单元,用于将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
可选地,所述特征提取单元具体用于:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
本申请第三方面提供了一种出租车需求预测设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的出租车需求预测方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中提供了一种出租车需求预测方法,包括:对历史时刻的多模态信息进行特征提取,得到多模态特征,多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;基于多模态注意力的消息传递机制MMPM对图神经网络的节点进行更新,对图神经网络模型进行训练;将当前时刻的多模态信息输入训练好的图神经网络模型,得到图神经网络模型输出的出租车需求预测结果。本申请提供的出租车需求预测方法,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种出租车需求预测方法的流程示意图;
图2为MIFGNN模型结构示意图;
图3为1D-CNN模型结构示意图;
图4结合注意力机制的MMPM示意图;
图5为本申请实施例提供的一种出租车需求预测系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例1
为了便于理解,请参阅图1至图4,本申请提供了一种出租车需求预测方法的实施例,包括:
步骤101、对历史时刻的多模态信息进行特征提取,得到多模态特征,多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,多模态特征包括出租车需求特征、天气特征、事件特征和文本特征。
需要说明的是,本申请实施中,需要获取历史时刻的多模态信息,包括历史出租车需求信息,比如某个时刻目标区域的出租车需求量,历史事件信息,比如演唱会、体育活动等,以及每个事件发生的时间,历史天气信息,即某时间段目标区域附件的气象台发布的天气预报情况,历史文本信息,比如从互联网中自动抓取的目标区域内的新闻信息。事件信息和文本信息可以通过爬虫程序从互联网中进行爬取。事件的发生、天气状况的影响和新闻信息等都会对目标区域的出租车需求产生影响,因此,需要获取历史时刻的出租车需求信息、天气信息、事件信息和文本信息,对这些信息进行分析,有利于提高出租车需求预测的准确性。在获取到信息数据之后,对数据进行预处理,包括数据清洗、规范化处理、去除停用词、分词、文本向量化表示等。然后对出租车需求信息、天气信息、事件信息和文本信息进行特征提取,得到出租车需求特征、天气特征、事件特征和文本特征。
步骤102、将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造图神经网络的边连接。
需要说明的是,搭建如图2所示的MIFGNN(Multi-modal Information FusionGraph Neural Network,多模态信息和图神经网络)结构,以每个历史时刻的出租车需求特征Dn、天气特征Wn、事件特征En和文本特征Tn,即图2中的(Di,Wi,Ei,Ti)作为图神经网络架构的节点特征表示,根据节点的时序关系构造图神经网络的边连接。
步骤103、基于多模态注意力的消息传递机制MMPM对图神经网络的节点进行更新,对图神经网络模型进行训练。
需要说明的是,为了构造多模态信息和出租车需求的相关性,本申请实施例提出了结合注意力的消息传递机制(Multi-modal Message Passing Mechanism,MMPM)更新节点特征,如图4所示,MMPM通过收集来自邻近节点的特征更新自身的节点表示。通过梯度下降算法进行图神经网络的参数优化,训练得到出租车需求预测的图神经网络模型。
步骤104、将当前时刻的多模态信息输入训练好的图神经网络模型,得到图神经网络模型输出的出租车需求预测结果。
需要说明的是,将训练得到的图神经网络模型部署紧传统的Web架构中,当接收到实时传来的历史出租车需求信息、天气信息、事件信息和文本信息时,输入到训练好的图神经网络模型,模型返回下一时刻的出租车需求预测结果。
本申请实施例提供的出租车需求预测方法,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
实施例2
本申请中提供了一种出租车需求预测方法的另一个实施例,包括:
步骤201、采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征,采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征。
需要说明的是,由于多模态信息中各种模态信息的表示空间是不相同的,因此有必要对多个模态信息进行特征转换,使得表示空间统一。对历史时刻的出租车需求信息、天气信息和事件信息采取以下的特征提取方式,得到出租车需求特征、天气特征和事件特征;
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
对于文本信息特征提取,采用一维卷积神经网络1D-CNN(One-dimensionalConvolutional Neural Network)对文本信息进行特征提取,得到文本特征;如图3所示,先通过词嵌入层(word embedding layer)把文本中的词转化成向量化表示,由于词嵌入层的参数是经过大量语料库训练得到的,因此可以反映文本特征的相关性和词的相关性,之后经过一维卷积层进行特征提取,最后通过时间维度的池化层(max-over-time pooling)进行特征降维。假设1D-CNN包含h个过滤器,那么经过max-over-time pooling后,可得到第n个时刻的文本特征Tn∈Rh
步骤202、将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造图神经网络的边连接。
n个时刻的多模态特征可表示为:
f={(D1,W1,E1,T1),...,(Di,Wi,Ei,Ti),...,(Dn,Wn,En,Tn)},
在给定的特征下,本申请实施例将每个时刻作为图神经网络的节点,如图2所示,通过时序关系构造边连接,构造方式为:
Node={Di,Wi,Ei,Ti)|i∈[1,n]}
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
在图2中,P=2,图中的所有的边均为有向边,节点特征表示均使用多模态特征进行初始化,通过P个邻近节点的连接,模拟前面P个时刻对当前时刻的影响。为了使得第n时刻的特征能够在整个图中进行传递,将第n时刻节点与第1时刻节点进行相连。
步骤203、基于多模态注意力的消息传递机制MMPM对图神经网络的节点进行更新,对图神经网络模型进行训练。
为了构造多模态信息和出租车需求的相关性,本申请实施例提出了结合注意力的消息传递机制(Multi-modal Message Passing Mechanism,MMPM)更新节点特征,如图4所示,MMPM通过收集来自邻近节点的特征更新自身的节点表示。通过梯度下降算法进行图神经网络的参数优化,训练得到出租车需求预测的图神经网络模型。第n个时刻的节点更新为:
Figure BDA0002914462860000091
Figure BDA0002914462860000092
Figure BDA0002914462860000101
Figure BDA0002914462860000102
其中,
Figure BDA0002914462860000103
为第n个时刻的p个邻近节点,j为网络的层数,
Figure BDA0002914462860000104
为第j+1层第n个节点的出租车需求特征,
Figure BDA0002914462860000105
为第j+1层第n个节点的天气特征,
Figure BDA0002914462860000106
为第j+1层第n个节点的事件特征,
Figure BDA0002914462860000107
为第j+1层第n个节点的文本特征。第0层的节点特征分别通过Dn=wDDemandn+bD、Wn=wWWeathern+bW和En=wEEventn+bE以及1D-CNN输出的结果进行初始化,即
Figure BDA0002914462860000108
Figure BDA0002914462860000109
通过注意力机制增加强相关性特征的权重:
Figure BDA00029144628600001010
Figure BDA00029144628600001011
Figure BDA00029144628600001012
其中,
Figure BDA00029144628600001013
||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,
Figure BDA00029144628600001014
v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,
Figure BDA00029144628600001015
为权重与模态特征加权后的第j+1层候选的出租车需求特征。
接着,通过一个线性转换层和relu激活函数可输出第j+1层是需求特征表示,即:
Figure BDA00029144628600001016
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
Figure BDA00029144628600001017
在顶层(设为第J层)连接所有节点的出租车需求特征,可以获得:
Figure BDA00029144628600001018
通过全连接层FC可以对n+1时刻的需求量进行预测:
Figure BDA00029144628600001019
其中,wpred∈Rnh×1,bpred∈R1分别为预测时涉及的可训练矩阵和偏置项。
为了迭代优化模型参数,本申请实施例中采用的损失函数为:
Figure BDA0002914462860000111
其中,N为时间步的数量,yi为第i时刻的真实出租车需求量,
Figure BDA0002914462860000112
为第i时刻的预测出租车需求量。
最后通过反向传播和梯度下降法最小化损失函数,输出训练好的图神经网络模型。
步骤204、将当前时刻的多模态信息输入训练好的图神经网络模型,得到图神经网络模型输出的出租车需求预测结果。
将训练过程得到的模型部署进传统的Web架构中,当接收到实时传来的历史出租车需求、天气、事件和文本信息数据时,将数据经过预处理后,输入训练好的模型中,模型返回下一时刻的出租车需求预测结果。
本申请实施例提供的出租车需求预测方法,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
实施例3
为了便于理解,请参阅图5,本申请中提供了一种出租车需求预测系统的实施例,包括:
特征提取单元,用于对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
构造图单元,用于将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
更新训练单元,用于基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
输出单元,用于将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
特征提取单元具体用于:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
由于多模态信息中各种模态信息的表示空间是不相同的,因此有必要对多个模态信息进行特征转换,使得表示空间统一。对历史时刻的出租车需求信息、天气信息和事件信息采取以下的特征提取方式,得到出租车需求特征、天气特征和事件特征;
Dn=wDDemandn+bD
Wn=wWWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
对于文本信息特征提取,采用一维卷积神经网络1D-CNN(One-dimensionalConvolutional Neural Network)对文本信息进行特征提取,得到文本特征;如图3所示,先通过词嵌入层(word embedding layer)把文本中的词转化成向量化表示,由于词嵌入层的参数是经过大量语料库训练得到的,因此可以反映文本特征的相关性和词的相关性,之后经过一维卷积层进行特征提取,最后通过时间维度的池化层(max-over-time pooling)进行特征降维。假设1D-CNN包含h个过滤器,那么经过max-over-time pooling后,可得到第n个时刻的文本特征Tn∈Rh
n个时刻的多模态特征可表示为:
f={(D1,W1,E1,T1),...,(Di,Wi,Ei,Ti),...,(Dn,Wn,En,Tn)},
在给定的特征下,本申请实施例将每个时刻作为图神经网络的节点,如图2所示,通过时序关系构造边连接,构造方式为:
Node={(Di,Wi,Ei,Ti)|i∈[1,n]}
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
在图2中,P=2,图中的所有的边均为有向边,节点特征表示均使用多模态特征进行初始化,通过P个邻近节点的连接,模拟前面P个时刻对当前时刻的影响。为了使得第n时刻的特征能够在整个图中进行传递,将第n时刻节点与第1时刻节点进行相连。
为了构造多模态信息和出租车需求的相关性,本申请实施例提出了结合注意力的消息传递机制(Multi-modal Message Passing Mechanism,MMPM)更新节点特征,如图4所示,MMPM通过收集来自邻近节点的特征更新自身的节点表示。通过梯度下降算法进行图神经网络的参数优化,训练得到出租车需求预测的图神经网络模型。第n个时刻的节点更新为:
Figure BDA0002914462860000141
Figure BDA0002914462860000142
Figure BDA0002914462860000143
Figure BDA0002914462860000144
其中,
Figure BDA0002914462860000145
为第n个时刻的p个邻近节点,j为网络的层数,
Figure BDA0002914462860000146
为第j+1层第n个节点的出租车需求特征,
Figure BDA0002914462860000147
为第j+1层第n个节点的天气特征,
Figure BDA0002914462860000148
为第j+1层第n个节点的事件特征,
Figure BDA0002914462860000149
为第j+1层第n个节点的文本特征。第0层的节点特征分别通过Dn=wDDemandn+bD、Wn=wWWeathern+bW和En=wEEventn+bE以及1D-CNN输出的结果进行初始化,即
Figure BDA00029144628600001410
Figure BDA00029144628600001411
通过注意力机制增加强相关性特征的权重:
Figure BDA00029144628600001412
Figure BDA00029144628600001413
Figure BDA00029144628600001414
其中,
Figure BDA00029144628600001415
||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,
Figure BDA00029144628600001416
v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,
Figure BDA00029144628600001417
为权重与模态特征加权后的第j+1层候选的出租车需求特征。
接着,通过一个线性转换层和relu激活函数可输出第j+1层是需求特征表示,即:
Figure BDA00029144628600001418
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
Figure BDA00029144628600001419
在顶层(设为第J层)连接所有节点的出租车需求特征,可以获得:
Figure BDA0002914462860000151
通过全连接层FC可以对n+1时刻的需求量进行预测:
Figure BDA0002914462860000152
其中,wpred∈Rnh×1,bpred∈R1分别为预测时涉及的可训练矩阵和偏置项。
为了迭代优化模型参数,本申请实施例中采用的损失函数为:
Figure BDA0002914462860000153
其中,N为时间步的数量,yi为第i时刻的真实出租车需求量,
Figure BDA0002914462860000154
为第i时刻的预测出租车需求量。
最后通过反向传播和梯度下降法最小化损失函数,输出训练好的图神经网络模型。
将训练过程得到的模型部署进传统的Web架构中,当接收到实时传来的历史出租车需求、天气、事件和文本信息数据时,将数据经过预处理后,输入训练好的模型中,模型返回下一时刻的出租车需求预测结果。
本申请实施例提供的出租车需求预测系统,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
实施例4
本申请中提供了一种出租车需求预测设备的实施例,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给所述处理器;
处理器用于根据程序代码中的指令执行实施例1或实施例2中的出租车需求预测方法。
本申请实施例提供的出租车需求预测设备,将各个时间步作为图中的节点,通过时序关系构造图神经网络边的连接,使用多模态信息初始化节点特征,并且通过基于多模态注意力的消息传递机制MMPM更新节点信息,通过图神经网络的输出层预测下一时刻的出租车需求量,提高了出租车需求预测的准确性。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种出租车需求预测方法,其特征在于,包括:
对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
2.根据权利要求1所述的出租车需求预测方法,其特征在于,所述对历史时刻的多模态信息进行特征提取,得到多模态特征,包括:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wwWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq ×h,为历史天气信息进行特征转换时所涉及的可训练参数,wE∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
3.根据权利要求2所述的出租车需求预测方法,其特征在于,所述图神经网络的节点表示为:
Node={(Di,Wi,Ei,Ti)|i∈[1,n]}
所述图神经网络的边表示为:
Edge={eil|l∈[2,n];i∈[l-p,l-1]}
其中,Node为图神经网络节点的集合,Edge为图神经网络边的集合,(Di,Wi,Ei,Ti)为第i个节点的特征表示,p为邻近节点的连接数量,eil为第l个节点和第i个节点之间的边连接。
4.根据权利要求3所述的出租车需求预测方法,其特征在于,所述将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接,包括:
将每个历史时刻提取的多模态特征作为图神经网络的节点,按照时序顺序将相邻节点连接,并将第n个节点连向第1个节点,构造图神经网络。
5.根据权利要求4所述的出租车需求预测方法,其特征在于,所述基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,包括:
对第n个时刻的节点进行更新:
Figure FDA0002914462850000021
Figure FDA0002914462850000022
Figure FDA0002914462850000023
Figure FDA0002914462850000024
其中,
Figure FDA0002914462850000025
为第n个时刻的p个邻近节点,j为网络的层数,
Figure FDA0002914462850000026
为第j+1层第n个节点的出租车需求特征,
Figure FDA0002914462850000027
为第j+1层第n个节点的天气特征,
Figure FDA0002914462850000028
为第j+1层第n个节点的事件特征,
Figure FDA0002914462850000029
为第j+1层第n个节点的文本特征;
通过注意力机制增加强相关性特征的权重:
Figure FDA00029144628500000210
Figure FDA00029144628500000211
Figure FDA00029144628500000212
其中,
Figure FDA0002914462850000031
||代表连接操作,αk为第k个模态特征的权重,uk∈Rq为多模态注意力的隐藏层特征的第k个模态分量,ui∈Rq为多模态注意力的隐藏层特征的第i个模态分量,
Figure FDA0002914462850000032
v(j)∈Rq均为可训练参数,q为注意力机制的隐藏层大小,
Figure FDA0002914462850000033
为权重与模态特征加权后的第j+1层候选的出租车需求特征;
通过一个线性转换层和relu激活函数输出第j+1层是需求特征表示,更新图神经网络的节点:
Figure FDA0002914462850000034
其中,wfusion∈R4h×h,bfusion∈Rh为可训练参数;
经过MMPM处理后,得到第j+1层的第n个节点特征表示为:
Figure FDA0002914462850000035
6.根据权利要求5所述的出租车需求预测方法,其特征在于,训练的图神经网络模型和损失函数分别为:
Figure FDA0002914462850000036
Figure FDA0002914462850000037
其中,wpred∈Rnh×1,bpred∈R1分别为预测时涉及的可训练矩阵和偏置项,
Figure FDA0002914462850000038
表示在顶层第J层连接所有节点的出租车需求特征,N为时间步的数量,yi为第i时刻的真实出租车需求量,
Figure FDA0002914462850000039
为第i时刻的预测出租车需求量。
7.根据权利要求6所述的出租车需求预测方法,其特征在于,所述训练好的图神经网络模型为损失函数最小时对应的图神经网络模型。
8.一种出租车需求预测系统,其特征在于,包括:
特征提取单元,用于对历史时刻的多模态信息进行特征提取,得到多模态特征,所述多模态信息包括出租车需求信息、天气信息、事件信息和文本信息,所述多模态特征包括出租车需求特征、天气特征、事件特征和文本特征;
构造图单元,用于将每个历史时刻提取的多模态特征作为图神经网络的节点,通过时序关系构造所述图神经网络的边连接;
更新训练单元,用于基于多模态注意力的消息传递机制MMPM对所述图神经网络的节点进行更新,对图神经网络模型进行训练;
输出单元,用于将当前时刻的多模态信息输入训练好的图神经网络模型,得到所述图神经网络模型输出的出租车需求预测结果。
9.根据权利要求8所述的出租车需求预测系统,其特征在于,所述特征提取单元具体用于:
采用预置特征提取公式对历史时刻的出租车需求信息、天气信息和事件信息进行特征提取,得到出租车需求特征、天气特征和事件特征;
采用一维卷积神经网络1D-CNN对文本信息进行特征提取,得到文本特征;
所述预置特征提取公式包括:
Dn=wDDemandn+bD
Wn=wwWeathern+bW
En=wEEventn+bE
其中,h为转换后特征空间维度大小,1、q、m分别为历史出租车需求、天气、事件信息的原始特征维度,wD∈R1×h,为历史出租车需求进行特征转换时所涉及的可训练参数,wW∈Rq ×h,为历史天气信息进行特征转换时所涉及的可训练参数,wW∈Rm×h,为历史事件信息进行特征转换时所涉及的可训练参数,bD∈Rh为历史出租车需求信息进行特征转换的偏置项,bW∈Rh为历史天气信息进行特征转换的偏置项,bE∈Rh为历史事件信息进行特征转换的偏置项,Demandn∈R1、Weathern∈Rq和Eventn∈Rm分别为第n个时刻的出租车需求信息、天气信息和事件信息,Dn∈Rh为第n个时刻的出租车需求特征,Wn∈Rh为第n个时刻的天气特征,En∈Rh为第n个时刻的事件特征。
10.一种出租车需求预测设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-7任一项所述的出租车需求预测方法。
CN202110097592.3A 2020-12-30 2021-01-25 一种出租车需求预测方法、系统和设备 Active CN112801360B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020116220365 2020-12-30
CN202011622036 2020-12-30

Publications (2)

Publication Number Publication Date
CN112801360A true CN112801360A (zh) 2021-05-14
CN112801360B CN112801360B (zh) 2022-05-17

Family

ID=75811601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110097592.3A Active CN112801360B (zh) 2020-12-30 2021-01-25 一种出租车需求预测方法、系统和设备

Country Status (1)

Country Link
CN (1) CN112801360B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113570172A (zh) * 2021-09-23 2021-10-29 南京明德产业互联网研究院有限公司 一种出租车空载巡航路线推荐的方法、装置和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019220128A1 (en) * 2018-05-18 2019-11-21 Benevolentai Technology Limited Graph neutral networks with attention
CN110969854A (zh) * 2019-12-13 2020-04-07 深圳先进技术研究院 一种交通流量的预测方法、系统及终端设备
CN111340543A (zh) * 2020-02-25 2020-06-26 上海大学 一种基于注意力机制的细粒度打车需求预测方法
CN111612122A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 实时需求量的预测方法、装置及电子设备
CN111667158A (zh) * 2020-05-26 2020-09-15 南开大学 一种基于多图神经网络联合学习的工作技能预测方法
CN111915057A (zh) * 2020-06-28 2020-11-10 厦门大学 一种基于深度学习和群智感知的单车需求预测与调度方法
US20200394499A1 (en) * 2019-06-12 2020-12-17 Sri International Identifying complex events from hierarchical representation of data set features

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019220128A1 (en) * 2018-05-18 2019-11-21 Benevolentai Technology Limited Graph neutral networks with attention
CN111612122A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 实时需求量的预测方法、装置及电子设备
US20200394499A1 (en) * 2019-06-12 2020-12-17 Sri International Identifying complex events from hierarchical representation of data set features
CN110969854A (zh) * 2019-12-13 2020-04-07 深圳先进技术研究院 一种交通流量的预测方法、系统及终端设备
CN111340543A (zh) * 2020-02-25 2020-06-26 上海大学 一种基于注意力机制的细粒度打车需求预测方法
CN111667158A (zh) * 2020-05-26 2020-09-15 南开大学 一种基于多图神经网络联合学习的工作技能预测方法
CN111915057A (zh) * 2020-06-28 2020-11-10 厦门大学 一种基于深度学习和群智感知的单车需求预测与调度方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴钉捷等: "基于实时出行需求和交通路况的电动汽车充电负荷预测", 《电力建设》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113570172A (zh) * 2021-09-23 2021-10-29 南京明德产业互联网研究院有限公司 一种出租车空载巡航路线推荐的方法、装置和系统

Also Published As

Publication number Publication date
CN112801360B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN109492103B (zh) 标签信息获取方法、装置、电子设备及计算机可读介质
WO2024041479A1 (zh) 一种数据处理方法及其装置
CN111242395B (zh) 用于od数据的预测模型构建方法及装置
WO2023207411A1 (zh) 一种基于时空数据的流量确定方法、装置、设备和介质
CN113112791A (zh) 一种基于滑动窗口长短时记忆网络的交通流量预测方法
CN112419096A (zh) 基于nlp信息萃取与少样本自学习的用户用电诉求工单自动流转方法
CN112801360B (zh) 一种出租车需求预测方法、系统和设备
CN114692984A (zh) 基于多步耦合图卷积网络的交通预测方法
CN116106988A (zh) 天气预测方法、装置、电子设备及存储介质
CN114091361B (zh) 基于气象事件的transformer模型构建方法
Liao et al. Taxi demand forecasting based on the temporal multimodal information fusion graph neural network
CN114372830A (zh) 一种基于时空多图神经网络的网约车需求预测方法
KR102359902B1 (ko) 빅데이터 및 인공지능 기반 교차로 서비스수준 예측방법, 그리고 이를 포함하는 저장매체
CN113159371A (zh) 基于跨模态数据融合的未知目标特征建模与需求预测方法
CN117116048A (zh) 基于知识表示模型和图神经网络的知识驱动交通预测方法
CN115456238A (zh) 一种基于动态多视图耦合图卷积的城市出行需求预测方法
CN116089595A (zh) 基于科技成果的数据处理推送方法、装置及介质
CN115423162A (zh) 一种车流量预测方法、装置、电子设备及存储介质
CN115618079A (zh) 会话推荐方法、装置、电子设备及存储介质
CN114418606A (zh) 基于时空卷积网络的网约车订单需求预测方法
CN113988267A (zh) 用户意图识别模型的生成方法、用户意图识别方法和设备
CN112528938A (zh) 车辆检测模型训练及其检测方法、装置及计算机存储介质
Zhang et al. Boundary-aware bias loss for transformer-based aerial image segmentation model
CN111260403A (zh) 一种中介市场收房定价的方法及系统
CN117034780B (zh) 一种基于深度学习的多尺度次季节降水量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant