CN111275225B - 空车轨迹预测方法、预测装置、服务器和可读存储介质 - Google Patents

空车轨迹预测方法、预测装置、服务器和可读存储介质 Download PDF

Info

Publication number
CN111275225B
CN111275225B CN201811472924.6A CN201811472924A CN111275225B CN 111275225 B CN111275225 B CN 111275225B CN 201811472924 A CN201811472924 A CN 201811472924A CN 111275225 B CN111275225 B CN 111275225B
Authority
CN
China
Prior art keywords
track
road
road section
network
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811472924.6A
Other languages
English (en)
Other versions
CN111275225A (zh
Inventor
吴航
姚京韬
施韩原
王凡
李佳骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201811472924.6A priority Critical patent/CN111275225B/zh
Publication of CN111275225A publication Critical patent/CN111275225A/zh
Application granted granted Critical
Publication of CN111275225B publication Critical patent/CN111275225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种空车轨迹预测方法、预测装置、服务器和可读存储介质,其中,网约车空车轨迹的预测方法,包括:在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径。通过本发明的技术方案,能够保留已行驶轨迹的记忆性,从而有利于提升预测的准确性,并且能够优化网约车的行驶路径与行驶计划,从而有利于提升网约车的接单效率。

Description

空车轨迹预测方法、预测装置、服务器和可读存储介质
技术领域
本发明涉及调度运力技术领域,具体而言,涉及一种网约车空车轨迹的预测方法、一种网约车空车轨迹的预测装置、一种移动终端、一种服务器和一种计算机可读存储介质。
背景技术
相关技术中,空车的轨迹预测主要应用于出租车的轨迹预测上,但出租车和网约车的行为本身就有着较大差别,比如,空车状态下,出租车司机由于需要搜索潜在的顾客,因此需要保持高速运行状态,而网约车司机可通过网约车平台自动被指派订单,不需要人为地搜索顾客,且有时出于节省油费等意识和行为的限制,大部分网约车司机会采取停在原地或是慢速行驶的策略,因此,在网约车的场景下,无法直接套用出租车的空车轨迹预测模型。
另外,再考虑现有的出租车预测模型,主要包括:(1)基于贝叶斯或马尔科夫过程的模型,司机的运行轨迹将取决当前位置,以及司机在此前一段时间内的行为,但这类模型不具备记忆性,即不能够保留司机历史的轨迹信息和特征。
(2)基于深度神经网络的模型,但模型的优化目标更偏向于对单步决策的预测,例如预测的是在红绿灯口上司机会往哪个方向继续行驶,无法预测司机在接下来的一段时间内连续的轨迹路径。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的目的在于提供一种网约车空车轨迹的预测方法、一种网约车空车轨迹的预测装置、一种服务器和一种计算机可读存储介质。
为了实现上述目的,本发明的第一方面的技术方案提供了一种网约车空车轨迹的预测方法,包括:在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径。
在该技术方案中,通过设置基于长短时记忆(Long Short-Term Memory,LSTM)的轨迹预测模型,以预测网约车在接收到订单之前的持续空车行驶轨迹,一方面,与现有技术中采用基于贝叶斯或马尔科夫过程的预测模型的预测方案相比,能够保留已行驶轨迹的记忆性,从而有利于提升预测的准确性,另一方面,与现有技术中基于深度神经网络的预测模型的预测方案相比,能够实现对接下来时间段内的连续路径的预测,从而实现更好的交通拥堵控制,并且能够优化网约车的行驶路径与行驶计划,从而有利于提升网约车的接单效率。
在上述技术方案中,优选地,在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型前,还包括:收集多个网约车的行驶GPS轨迹,并对行驶GPS轨迹执行预处理操作,以生成训练样本;将训练样本输入包括长短期记忆网络的神经网络模型,以对包括长短期记忆网络的神经网络模型执行模型训练;根据模型训练的训练结果生成预设的基于长短时记忆的神经网络预测模型。
在该技术方案中,通过对行驶GPS轨迹进行预处理,以满足包括长短期记忆网络的神经网络模型的输入要求,通过采用行驶GPS轨迹的大数据以及长期短期记忆(LSTM)网络来学习轨迹数据,由于行驶GPS轨迹具有随机性,有利于提升整个生成的轨迹的准确度。
在上述任一技术方案中,优选地,对行驶GPS轨迹执行预处理操作,具体包括以下步骤:行驶GPS轨迹包括GPS位置点序列,对每个行驶GPS轨迹进行离群点轨迹检测,以删除错误位置信息;对原始路网数据中度为2的点连接的两条路段执行合并操作,以生成简化路网路线;将删除错误位置信息的GPS位置点序列映射至简化路网路线上,以生成映射路网轨迹,映射路网轨迹包括多条映射路段;将同一条映射路段上的GPS位置点子序列合并为单向矢量,以根据单向矢量将映射路网轨迹转化为单向矢量序列,以将单向矢量序列确定为训练样本。
在该技术方案中,预处理操作可以包括有效轨迹检测,路网简化,轨迹到路网的映射,以及路径与数据生成四部分,其中,通过进行轨迹检测可以去除GPS信息中一些错误的记录,比如轨迹漂移数据等,将路网进行简化,主要指把使用的四维图新的路网数据进行若干处理,包括在原始路网数据上,存在非常非常多的长度<10m的路段,将度为2的点所连接的两条路段进行不断的合并一条通常意义上的路,以提高模型准确度并能够加速模型训练和预测的速度,通过执行轨迹到路网的映射,以将GPS轨迹信息映射到简化过的路网上,通过将映射到路网上的路段进行整合,以得到道路表达式,P={r0,r1,r2… … rn}的形式,如果把r视为单词,那么P可以视为一个句子,进而实现了将行驶轨迹问题转化为文本分析问题,以实现在神经网络模型中的训练与预测。
具体地,预处理将路网和原始数据(行驶GPS轨迹)作为输入值,将轨迹表示为一系列有序的GPS位置p1→p2→......pn,其中pi是由经度,纬度和时间戳组成的GPS点,并且计算每个GPS点pi处的平均速度作为pi-1和pi+1之间的持续时间的欧几里得距离,通过删除包括速度非常大(系统中为50m/s)的GPS点的轨迹,以及从多元正态分布中提取的轨迹,实现轨迹异常的剔除,因为GPS位置可能存在错误,或者汽车根本没有移动,另外也可以放弃持续时间少于5分钟的轨迹,因为太短的轨迹可能不能包括足够的信息,将路段视为“单词”,多条连续路段可以相应地转换为“句子”,即采用映射到的道路索引代替每个GPS点,从而将映射到同一条路段上的GPS点的子序列合并为一个单词,以使空车轨迹生成问题转化为文本生成问题,进而降低轨迹预测的复杂度。
在上述任一技术方案中,优选地,将删除错误位置信息的GPS位置点序列映射至简化路网路线上,具体包括以下步骤:采用ST-Matching地图映射算法,将删除错误位置信息的GPS位置点序列映射至简化路网路线上。
在该技术方案中,由于司机驾驶乘客时尽可能快地驾驶,因此每条路段的速度约束可以使用非空车驾驶轨迹的数据来计算,通过采用ST-Matching算法将轨迹映射到数字路线图上,以避免浮点精度问题。
在上述任一技术方案中,优选地,对包括长短期记忆网络的神经网络模型执行模型训练,具体包括以下步骤:采用随机梯度下降算法和Adam优化器执行模型训练。
在该技术方案中,采用随机梯度下降算法和Adam优化器进行模型训练,其中Adam优化器是适应性矩估计的缩写,是具有动量的RMSprop优化器的变种,它使用梯度的一阶近似,然后采用二阶矩近似来动态调整每个参数的学习率,Adam优化器利用Adagrad和RMSprop的优势,分别能够处理稀疏梯度和随机目标。
在上述任一技术方案中,优选地,还包括:将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径,具体包括以下步骤:将至少一条路段轨迹转换为单向矢量序列;将单向矢量序列输入嵌入层,以将单向矢量转化为固定维数的实值矢量;将实值矢量输入长短时记忆层,以根据实值矢量与实值矢量的先前隐藏状态生成隐藏状态向量;将隐藏状态向量输入全连接层,以将隐藏状态向量映射至维度为映射路段数量的向量空间中;将映射结果输入交叉熵损失回归层,以计算至少一条路段轨迹的下一条路段的概率分布;根据概率分布确定下一条路段;根据下一条路段的迭代结果,确定连续路径。
在该技术方案中,神经网络预测模型可以由四层构成,第一层是嵌入层(embedding layer),把输入数据(路径中的路段)转化为一个低维向量,以实现文本类型的数据预测,另外,还可以使用one-hot vector作为输入值,第二层是LSTM层,路径的历史信息通过LSTM cell中的神经元从起点到终点传输,第三层是全连接层(Fully ConnectedLayer),通过全连接层把hidden unit的向量映射到了维度为路的总数的向量空间上,最后是交叉熵损失回归层(SoftMax Layer),用以计算每条路作为后续路段的概率,从而能够保留已行驶轨迹的记忆性,并能够实现对接下来时间段内的连续路径的预测,满足了网约车空车状态下的预测要求,通过设置长短期记忆网络,实现了从大型语料库中学习单词模式,它能够用给定的开始单词生成单词序列,对应的,则实现了采用给定的启示路段生成后续的连续路径,实现了长期相关性的预测功能。
具体地,嵌入层将表示道路指标的单向矢量输入转化为固定维数的实值矢量,表示输入路段的嵌入,通过设置嵌入层实现了训练过程更快地收敛,并且采用实值向量表示也降低了维数并降低了训练的复杂度,在嵌入层之后,为LSTM-RNN(Recurrent NeuralNetworks,循环神经网络)层,可使用的空车驱动策略将受到许多因素的影响。例如,下一个订单利润最高,或不希望在等待乘客时驾驶时间过长等,空车司机搜索下一个乘客的方法通常由实际位置和来自网约车应用平台的信息决定,司机决定在哪里寻找下一位乘客后,会牢记这一轨迹,长短时记忆网络能够结合长期信息,因此作为第二层,LSTM网络的输出被传递到一个完全连通的层,其中隐藏单元的尺寸被转换回与输入单热矢量相同的尺寸。最后,使用softmax激活功能层来计算给定司机空车行驶时的下一路径的不同道路的概率分布。
比如,采用给定的开始路段r0作为输入,以得到预测模型预测的空车行驶的第二路段的概率分布D0,第二条道路r1从分布D0采样,将r0和r1作为新输入并将其馈入预测模型中以获得概率分布D1,并对下一个路段进行采样,从形式上讲,在迭代i≥1时,从Di-1中抽取一个新的路段ri,并将{r0,r1,r2… … ri}馈入预测模型中以获得Di,重复上述步骤直到生成的预测轨迹足够长,进而实现了完整的连续路径轨迹的预测。
在上述任一技术方案中,优选地,将至少一条路段轨迹输入预设的神经网络预测模型,具体包括以下步骤:采用滑窗算法确定至少一条路段轨迹的输入数量,以输入神经网络预测模型。
在该技术方案中,在时间点k,把rl-k+1,……,rk放入网络,用以预测rk+1,其中l为滑窗的大小,通过限定各个时间窗口内的输入的矢量数量,解决了神经网络预测时预测长度过长的问题。
本发明的第二方面的技术方案提供了一种网约车空车轨迹的预测装置,包括:输入单元,用于在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径。
在该技术方案中,通过设置基于长短时记忆(Long Short-Term Memory,LSTM)的轨迹预测模型,以预测网约车在接收到订单之前的持续空车行驶轨迹,一方面,与现有技术中采用基于贝叶斯或马尔科夫过程的预测模型的预测方案相比,能够保留已行驶轨迹的记忆性,从而有利于提升预测的准确性,另一方面,与现有技术中基于深度神经网络的预测模型的预测方案相比,能够实现对接下来时间段内的连续路径的预测,从而实现更好的交通拥堵控制,并且能够优化网约车的行驶路径与行驶计划,从而有利于提升网约车的接单效率。
在上述技术方案中,优选地,还包括:预处理单元,用于收集多个网约车的行驶GPS轨迹,并对行驶GPS轨迹执行预处理操作,以生成训练样本;训练单元,用于将训练样本输入包括长短期记忆网络的神经网络模型,以对包括长短期记忆网络的神经网络模型执行模型训练;生成单元,用于根据模型训练的训练结果生成预设的基于长短时记忆的神经网络预测模型。
在该技术方案中,通过对行驶GPS轨迹进行预处理,以满足包括长短期记忆网络的神经网络模型的输入要求,通过采用行驶GPS轨迹的大数据以及长期短期记忆(LSTM)网络来学习轨迹数据,由于行驶GPS轨迹具有随机性,有利于提升整个生成的轨迹的准确度。
在上述任一技术方案中,优选地,预处理单元包括:删除子单元,行驶GPS轨迹包括GPS位置点序列,用于对每个行驶GPS轨迹进行离群点轨迹检测,以删除错误位置信息;第一合并子单元,用于对原始路网数据中度为2的点连接的两条路段执行合并操作,以生成简化路网路线;第一映射子单元,用于将删除错误位置信息的GPS位置点序列映射至简化路网路线上,以生成映射路网轨迹,映射路网轨迹包括多条映射路段;第二合并子单元,用于将同一条映射路段上的GPS位置点子序列合并为单向矢量,以根据单向矢量将映射路网轨迹转化为单向矢量序列,以将单向矢量序列确定为训练样本。
在该技术方案中,预处理操作可以包括有效轨迹检测,路网简化,轨迹到路网的映射,以及路径与数据生成四部分,其中,通过进行轨迹检测可以去除GPS信息中一些错误的记录,比如轨迹漂移数据等,将路网进行简化,主要指把使用的四维图新的路网数据进行若干处理,包括在原始路网数据上,存在非常非常多的长度<10m的路段,将度为2的点所连接的两条路段进行不断的合并一条通常意义上的路,以提高模型准确度并能够加速模型训练和预测的速度,通过执行轨迹到路网的映射,以将GPS轨迹信息映射到简化过的路网上,通过将映射到路网上的路段进行整合,以得到道路表达式,P={r0,r1,r2… … rn}的形式,如果把r视为单词,那么P可以视为一个句子,进而实现了将行驶轨迹问题转化为文本分析问题,以实现在神经网络模型中的训练与预测。
具体地,预处理将路网和原始数据(行驶GPS轨迹)作为输入值,将轨迹表示为一系列有序的GPS位置p1→p2→......pn,其中pi是由经度,纬度和时间戳组成的GPS点,并且计算每个GPS点pi处的平均速度作为pi-1和pi+1之间的持续时间的欧几里得距离,通过删除包括速度非常大(系统中为50m/s)的GPS点的轨迹,以及从多元正态分布中提取的轨迹,实现轨迹异常的剔除,因为GPS位置可能存在错误,或者汽车根本没有移动,另外也可以放弃持续时间少于5分钟的轨迹,因为太短的轨迹可能不能包括足够的信息,将路段视为“单词”,多条连续路段可以相应地转换为“句子”,即采用映射到的道路索引代替每个GPS点,从而将映射到同一条路段上的GPS点的子序列合并为一个单词,以使空车轨迹生成问题转化为文本生成问题,进而降低轨迹预测的复杂度。
在上述任一技术方案中,优选地,映射子单元还用于:采用ST-Matching地图映射算法,将删除错误位置信息的GPS位置点序列映射至简化路网路线上。
在该技术方案中,由于司机驾驶乘客时尽可能快地驾驶,因此每条路段的速度约束可以使用非空车驾驶轨迹的数据来计算,通过采用ST-Matching算法将轨迹映射到数字路线图上,以避免浮点精度问题。
在上述任一技术方案中,优选地,训练单元还用于:采用随机梯度下降算法和Adam优化器执行模型训练。
在该技术方案中,采用随机梯度下降算法和Adam优化器进行模型训练,其中Adam优化器是适应性矩估计的缩写,是具有动量的RMSprop优化器的变种,它使用梯度的一阶近似,然后采用二阶矩近似来动态调整每个参数的学习率,Adam优化器利用Adagrad和RMSprop的优势,分别能够处理稀疏梯度和随机目标。
在上述任一技术方案中,优选地,输入单元包括:转换子单元,用于将至少一条路段轨迹转换为单向矢量序列;转化子单元,用于将单向矢量序列输入嵌入层,以将单向矢量转化为固定维数的实值矢量;生成子单元,用于将实值矢量输入长短时记忆层,以根据实值矢量与实值矢量的先前隐藏状态生成隐藏状态向量;第二映射子单元,用于将隐藏状态向量输入全连接层,以将隐藏状态向量映射至维度为映射路段数量的向量空间中;计算子单元,用于将映射结果输入交叉熵损失回归层,以计算映射路段作为下一条路段的概率分布;确定子单元,用于根据概率分布确定下一条路段;确定子单元还用于:根据下一条路段的迭代结果,确定连续路径。
在该技术方案中,神经网络预测模型可以由四层构成,第一层是嵌入层(embedding layer),把输入数据(路径中的路段)转化为一个低维向量,以实现文本类型的数据预测,另外,还可以使用one-hot vector作为输入值,第二层是LSTM层,路径的历史信息通过LSTM cell中的神经元从起点到终点传输,第三层是全连接层(Fully ConnectedLayer),通过全连接层把hidden unit的向量映射到了维度为路的总数的向量空间上,最后是交叉熵损失回归层(SoftMax Layer),用以计算每条路作为后续路段的概率,从而能够保留已行驶轨迹的记忆性,并能够实现对接下来时间段内的连续路径的预测,满足了网约车空车状态下的预测要求,通过设置长短期记忆网络,实现了从大型语料库中学习单词模式,它能够用给定的开始单词生成单词序列,对应的,则实现了采用给定的启示路段生成后续的连续路径,实现了长期相关性的预测功能。
具体地,嵌入层将表示道路指标的单向矢量输入转化为固定维数的实值矢量,表示输入路段的嵌入,通过设置嵌入层实现了训练过程更快地收敛,并且采用实值向量表示也降低了维数并降低了训练的复杂度,在嵌入层之后,为LSTM-RNN(Recurrent NeuralNetworks,循环神经网络)层,可使用的空车驱动策略将受到许多因素的影响。例如,下一个订单利润最高,或不希望在等待乘客时驾驶时间过长等,空车司机搜索下一个乘客的方法通常由实际位置和来自网约车应用平台的信息决定,司机决定在哪里寻找下一位乘客后,会牢记这一轨迹,长短时记忆网络能够结合长期信息,因此作为第二层,LSTM网络的输出被传递到一个完全连通的层,其中隐藏单元的尺寸被转换回与输入单热矢量相同的尺寸。最后,使用softmax激活功能层来计算给定司机空车行驶时的下一路径的不同道路的概率分布。
比如,采用给定的开始路段r0作为输入,以得到预测模型预测的空车行驶的第二路段的概率分布D0,第二条道路r1从分布D0采样,将r0和r1作为新输入并将其馈入预测模型中以获得概率分布D1,并对下一个路段进行采样,从形式上讲,在迭代i≥1时,从Di-1中抽取一个新的路段ri,并将{r0,r1,r2… … ri}馈入预测模型中以获得Di,重复上述步骤直到生成的预测轨迹足够长,进而实现了完整的连续路径轨迹的预测。
在上述任一技术方案中,优选地,确定子单元还用于:采用滑窗算法确定至少一条路段轨迹的输入数量,以输入神经网络预测模型。
在该技术方案中,在时间点k,把rl-k+1,……,rk放入网络,用以预测rk+1,其中l为滑窗的大小,通过限定各个时间窗口内的输入的矢量数量,解决了神经网络预测时预测长度过长的问题。
本发明的第三方面的技术方案提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明第一方面的技术方案提出的任一项的网约车空车轨迹的预测方法的步骤,或包括本发明第二方面的技术方案提出的任一项的网约车空车轨迹的预测装置。
本发明的第四方面的技术方案提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本发明第一方面和/或第二方面技术方案提出的任一项的网约车空车轨迹的预测方法。
在该技术方案中,计算机可读存储介质上存储的计算机程序被处理器执行时实现本发明的第一方面技术方案提出的任一项的网约车空车轨迹的预测方法,因此具有上述本发明的第一方面技术方案提出的任一项的网约车空车轨迹的预测方法的全部有益效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了根据本发明的一个实施例的网约车空车轨迹的预测方法的示意流程图;
图2示出了根据本发明的一个实施例的网轨迹与路网映射方法的映射结果示意图;
图3示出了根据本发明的另一个实施例的网约车空车轨迹的预测方案的结构示意图;
图4示出了根据本发明的一个实施例的网约车空车轨迹的预测装置的示意框图;
图5出了根据本发明的一个实施例的服务器的示意框图;
图6出了根据本发明的再一个实施例的网约车空车轨迹的预测方案的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例1
图1示出了根据本发明的一个实施例的网约车空车轨迹的预测方法的示意流程图。
如图1所示,根据本发明的一个实施例的网约车空车轨迹的预测方法,包括:步骤102,在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径。
在该实施例中,通过设置基于长短时记忆(Long Short-Term Memory,LSTM)的轨迹预测模型,以预测网约车在接收到订单之前的持续空车行驶轨迹,一方面,与现有技术中采用基于贝叶斯或马尔科夫过程的预测模型的预测方案相比,能够保留已行驶轨迹的记忆性,从而有利于提升预测的准确性,另一方面,与现有技术中基于深度神经网络的预测模型的预测方案相比,能够实现对接下来时间段内的连续路径的预测,从而实现更好的交通拥堵控制,并且能够优化网约车的行驶路径与行驶计划,从而有利于提升网约车的接单效率。
在上述实施例中,优选地,在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型前,还包括:收集多个网约车的行驶GPS轨迹,并对行驶GPS轨迹执行预处理操作,以生成训练样本;将训练样本输入包括长短期记忆网络的神经网络模型,以对包括长短期记忆网络的神经网络模型执行模型训练;根据模型训练的训练结果生成预设的基于长短时记忆的神经网络预测模型。
在该实施例中,通过对行驶GPS轨迹进行预处理,以满足包括长短期记忆网络的神经网络模型的输入要求,通过采用行驶GPS轨迹的大数据以及长期短期记忆(LSTM)网络来学习轨迹数据,由于行驶GPS轨迹具有随机性,有利于提升整个生成的轨迹的准确度。
在上述任一实施例中,优选地,对行驶GPS轨迹执行预处理操作,具体包括以下步骤:行驶GPS轨迹包括GPS位置点序列,对每个行驶GPS轨迹进行离群点轨迹检测,以删除错误位置信息;对原始路网数据中度为2的点连接的两条路段执行合并操作,以生成简化路网路线;将删除错误位置信息的GPS位置点序列映射至简化路网路线上,以生成映射路网轨迹,映射路网轨迹包括多条映射路段;将同一条映射路段上的GPS位置点子序列合并为单向矢量,以根据单向矢量将映射路网轨迹转化为单向矢量序列,以将单向矢量序列确定为训练样本。
实施例2
在该实施例中,预处理操作可以包括有效轨迹检测,路网简化,轨迹到路网的映射,以及路径与数据生成四部分,其中,通过进行轨迹检测可以去除GPS信息中一些错误的记录,比如轨迹漂移数据等,将路网进行简化,主要指把使用的四维图新的路网数据进行若干处理,包括在原始路网数据上,存在非常非常多的长度<10m的路段,将度为2的点所连接的两条路段进行不断的合并一条通常意义上的路,以提高模型准确度并能够加速模型训练和预测的速度,通过执行轨迹到路网的映射,以将GPS轨迹信息映射到简化过的路网上,通过将映射到路网上的路段进行整合,以得到道路表达式,P={r0,r1,r2… … rn}的形式,如果把r视为单词,那么P可以视为一个句子,进而实现了将行驶轨迹问题转化为文本分析问题,以实现在神经网络模型中的训练与预测。
具体地,预处理将路网和原始数据(行驶GPS轨迹)作为输入值,将轨迹表示为一系列有序的GPS位置p1→p2→......pn,其中pi是由经度,纬度和时间戳组成的GPS点,并且计算每个GPS点pi处的平均速度作为pi-1和pi+1之间的持续时间的欧几里得距离,通过删除包括速度非常大(系统中为50m/s)的GPS点的轨迹,以及从多元正态分布中提取的轨迹,实现轨迹异常的剔除,因为GPS位置可能存在错误,或者汽车根本没有移动,另外也可以放弃持续时间少于5分钟的轨迹,因为太短的轨迹可能不能包括足够的信息,将路段视为“单词”,多条连续路段可以相应地转换为“句子”,即采用映射到的道路索引代替每个GPS点,从而将映射到同一条路段上的GPS点的子序列合并为一个单词,以使空车轨迹生成问题转化为文本生成问题,进而降低轨迹预测的复杂度。
在上述任一实施例中,优选地,将删除错误位置信息的GPS位置点序列映射至简化路网路线上,具体包括以下步骤:采用ST-Matching地图映射算法,将删除错误位置信息的GPS位置点序列映射至简化路网路线上。
在该实施例中,由于司机驾驶乘客时尽可能快地驾驶,因此每条路段的速度约束可以使用非空车驾驶轨迹的数据来计算,通过采用ST-Matching算法将轨迹映射到数字路线图上,以避免浮点精度问题,如图3所示,302为映射前的实际轨迹,304为映射后的映射轨迹,通过匹配映射操作,实现了待输入的路段的平滑处理。
在上述任一实施例中,优选地,对包括长短期记忆网络的神经网络模型执行模型训练,具体包括以下步骤:采用随机梯度下降算法和Adam优化器执行模型训练。
在该实施例中,采用随机梯度下降算法和Adam优化器进行模型训练,其中Adam优化器是适应性矩估计的缩写,是具有动量的RMSprop优化器的变种,它使用梯度的一阶近似,然后采用二阶矩近似来动态调整每个参数的学习率,Adam优化器利用Adagrad和RMSprop的优势,分别能够处理稀疏梯度和随机目标。
实施例3
如图4所示,在上述任一实施例中,优选地,还包括:将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径,具体包括以下步骤:将至少一条路段轨迹转换为单向矢量序列,以作为输入值402;将单向矢量序列输入嵌入层404,以将单向矢量转化为固定维数的实值矢量;将实值矢量输入长短时记忆层406,以根据实值矢量与实值矢量的先前隐藏状态生成隐藏状态向量;将隐藏状态向量输入全连接层408,以将隐藏状态向量映射至维度为映射路段数量的向量空间中;将映射结果输入交叉熵损失回归层410,以计算至少一条路段轨迹的下一条路段的概率分布;根据概率分布确定下一条路段;根据下一条路段的迭代结果,确定连续路径。
在该实施例中,神经网络预测模型可以由四层构成,第一层是嵌入层(embeddinglayer),把输入数据(路径中的路段)转化为一个低维向量,以实现文本类型的数据预测,另外,还可以使用one-hot vector作为输入值,第二层是LSTM层,路径的历史信息通过LSTMcell中的神经元从起点到终点传输,第三层是全连接层(Fully Connected Layer),通过全连接层把hidden unit的向量映射到了维度为路的总数的向量空间上,最后是交叉熵损失回归层(SoftMax Layer),用以计算每条路作为后续路段的概率,从而能够保留已行驶轨迹的记忆性,并能够实现对接下来时间段内的连续路径的预测,满足了网约车空车状态下的预测要求,通过设置长短期记忆网络,实现了从大型语料库中学习单词模式,它能够用给定的开始单词生成单词序列,对应的,则实现了采用给定的启示路段生成后续的连续路径,实现了长期相关性的预测功能。
具体地,嵌入层将表示道路指标的单向矢量输入转化为固定维数的实值矢量,表示输入路段的嵌入,通过设置嵌入层实现了训练过程更快地收敛,并且采用实值向量表示也降低了维数并降低了训练的复杂度,在嵌入层之后,为LSTM-RNN(Recurrent NeuralNetworks,循环神经网络)层,可使用的空车驱动策略将受到许多因素的影响。例如,下一个订单利润最高,或不希望在等待乘客时驾驶时间过长等,空车司机搜索下一个乘客的方法通常由实际位置和来自网约车应用平台的信息决定,司机决定在哪里寻找下一位乘客后,会牢记这一轨迹,长短时记忆网络能够结合长期信息,因此作为第二层,LSTM网络的输出被传递到一个完全连通的层,其中隐藏单元的尺寸被转换回与输入单热矢量相同的尺寸。最后,使用softmax激活功能层来计算给定司机空车行驶时的下一路径的不同道路的概率分布。
比如,采用给定的开始路段r0作为输入,以得到预测模型预测的空车行驶的第二路段的概率分布D0,第二条道路r1从分布D0采样,将r0和r1作为新输入并将其馈入预测模型中以获得概率分布D1,并对下一个路段进行采样,从形式上讲,在迭代i≥1时,从Di-1中抽取一个新的路段ri,并将{r0,r1,r2… … ri}馈入预测模型中以获得Di,重复上述步骤直到生成的预测轨迹足够长,进而实现了完整的连续路径轨迹的预测。
在上述任一实施例中,优选地,将至少一条路段轨迹输入预设的神经网络预测模型,具体包括以下步骤:采用滑窗算法确定至少一条路段轨迹的输入数量,以输入神经网络预测模型。
在该实施例中,在时间点k,把rl-k+1,……,rk放入网络,用以预测rk+1,其中l为滑窗的大小,通过限定各个时间窗口内的输入的矢量数量,解决了神经网络预测时预测长度过长的问题。
实施例4
图2出了根据本发明的一个实施例的网约车空车轨迹的预测装置的示意框图。
如图2示,根据本发明的一个实施例的网约车空车轨迹的预测装置200,包括:输入单元202,用于在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径。
在该实施例中,通过设置基于长短时记忆(Long Short-Term Memory,LSTM)的轨迹预测模型,以预测网约车在接收到订单之前的持续空车行驶轨迹,一方面,与现有技术中采用基于贝叶斯或马尔科夫过程的预测模型的预测方案相比,能够保留已行驶轨迹的记忆性,从而有利于提升预测的准确性,另一方面,与现有技术中基于深度神经网络的预测模型的预测方案相比,能够实现对接下来时间段内的连续路径的预测,从而实现更好的交通拥堵控制,并且能够优化网约车的行驶路径与行驶计划,从而有利于提升网约车的接单效率。
在上述实施例中,优选地,还包括:预处理单元204,用于收集多个网约车的行驶GPS轨迹,并对行驶GPS轨迹执行预处理操作,以生成训练样本;训练单元206,用于将训练样本输入包括长短期记忆网络的神经网络模型,以对包括长短期记忆网络的神经网络模型执行模型训练;生成单元208,用于根据模型训练的训练结果生成预设的基于长短时记忆的神经网络预测模型。
在该实施例中,通过对行驶GPS轨迹进行预处理,以满足包括长短期记忆网络的神经网络模型的输入要求,通过采用行驶GPS轨迹的大数据以及长期短期记忆(LSTM)网络来学习轨迹数据,由于行驶GPS轨迹具有随机性,有利于提升整个生成的轨迹的准确度。
在上述任一实施例中,优选地,预处理单元204包括:删除子单元2042,行驶GPS轨迹包括GPS位置点序列,用于对每个行驶GPS轨迹进行离群点轨迹检测,以删除错误位置信息;第一合并子单元2044,用于对原始路网数据中度为2的点连接的两条路段执行合并操作,以生成简化路网路线;第一映射子单元2028,用于将删除错误位置信息的GPS位置点序列映射至简化路网路线上,以生成映射路网轨迹,映射路网轨迹包括多条映射路段;第二合并子单元2048,用于将同一条映射路段上的GPS位置点子序列合并为单向矢量,以根据单向矢量将映射路网轨迹转化为单向矢量序列,以将单向矢量序列确定为训练样本。
在该实施例中,预处理操作可以包括有效轨迹检测,路网简化,轨迹到路网的映射,以及路径与数据生成四部分,其中,通过进行轨迹检测可以去除GPS信息中一些错误的记录,比如轨迹漂移数据等,将路网进行简化,主要指把使用的四维图新的路网数据进行若干处理,包括在原始路网数据上,存在非常非常多的长度<10m的路段,将度为2的点所连接的两条路段进行不断的合并一条通常意义上的路,以提高模型准确度并能够加速模型训练和预测的速度,通过执行轨迹到路网的映射,以将GPS轨迹信息映射到简化过的路网上,通过将映射到路网上的路段进行整合,以得到道路表达式,P={r0,r1,r2… … rn}的形式,如果把r视为单词,那么P可以视为一个句子,进而实现了将行驶轨迹问题转化为文本分析问题,以实现在神经网络模型中的训练与预测。
具体地,预处理将路网和原始数据(行驶GPS轨迹)作为输入值,将轨迹表示为一系列有序的GPS位置p1→p2→......pn,其中pi是由经度,纬度和时间戳组成的GPS点,并且计算每个GPS点pi处的平均速度作为pi-1和pi+1之间的持续时间的欧几里得距离,通过删除包括速度非常大(系统中为50m/s)的GPS点的轨迹,以及从多元正态分布中提取的轨迹,实现轨迹异常的剔除,因为GPS位置可能存在错误,或者汽车根本没有移动,另外也可以放弃持续时间少于5分钟的轨迹,因为太短的轨迹可能不能包括足够的信息,将路段视为“单词”,多条连续路段可以相应地转换为“句子”,即采用映射到的道路索引代替每个GPS点,从而将映射到同一条路段上的GPS点的子序列合并为一个单词,以使空车轨迹生成问题转化为文本生成问题,进而降低轨迹预测的复杂度。
在上述任一实施例中,优选地,映射子单元2028还用于:采用ST-Matching地图映射算法,将删除错误位置信息的GPS位置点序列映射至简化路网路线上。
在该实施例中,由于司机驾驶乘客时尽可能快地驾驶,因此每条路段的速度约束可以使用非空车驾驶轨迹的数据来计算,通过采用ST-Matching算法将轨迹映射到数字路线图上,以避免浮点精度问题。
在上述任一实施例中,优选地,训练单元206还用于:采用随机梯度下降算法和Adam优化器执行模型训练。
在该实施例中,采用随机梯度下降算法和Adam优化器进行模型训练,其中Adam优化器是适应性矩估计的缩写,是具有动量的RMSprop优化器的变种,它使用梯度的一阶近似,然后采用二阶矩近似来动态调整每个参数的学习率,Adam优化器利用Adagrad和RMSprop的优势,分别能够处理稀疏梯度和随机目标。
在上述任一实施例中,优选地,输入单元202包括:转换子单元2022,用于将至少一条路段轨迹转换为单向矢量序列;转化子单元2024,用于将单向矢量序列输入嵌入层,以将单向矢量转化为固定维数的实值矢量;生成子单元2026,用于将实值矢量输入长短时记忆层,以根据实值矢量与实值矢量的先前隐藏状态生成隐藏状态向量;第二映射子单元2028,用于将隐藏状态向量输入全连接层,以将隐藏状态向量映射至维度为映射路段数量的向量空间中;计算子单元2030,用于将映射结果输入交叉熵损失回归层,以计算映射路段作为下一条路段的概率分布;确定子单元2032,用于根据概率分布确定下一条路段;确定子单元2032还用于:根据下一条路段的迭代结果,确定连续路径。
在该实施例中,神经网络预测模型可以由四层构成,第一层是嵌入层(embeddinglayer),把输入数据(路径中的路段)转化为一个低维向量,以实现文本类型的数据预测,另外,还可以使用one-hot vector作为输入值,第二层是LSTM层,路径的历史信息通过LSTMcell中的神经元从起点到终点传输,第三层是全连接层(Fully Connected Layer),通过全连接层把hidden unit的向量映射到了维度为路的总数的向量空间上,最后是交叉熵损失回归层(SoftMax Layer),用以计算每条路作为后续路段的概率,从而能够保留已行驶轨迹的记忆性,并能够实现对接下来时间段内的连续路径的预测,满足了网约车空车状态下的预测要求,通过设置长短期记忆网络,实现了从大型语料库中学习单词模式,它能够用给定的开始单词生成单词序列,对应的,则实现了采用给定的启示路段生成后续的连续路径,实现了长期相关性的预测功能。
具体地,嵌入层将表示道路指标的单向矢量输入转化为固定维数的实值矢量,表示输入路段的嵌入,通过设置嵌入层实现了训练过程更快地收敛,并且采用实值向量表示也降低了维数并降低了训练的复杂度,在嵌入层之后,为LSTM-RNN(Recurrent NeuralNetworks,循环神经网络)层,可使用的空车驱动策略将受到许多因素的影响。例如,下一个订单利润最高,或不希望在等待乘客时驾驶时间过长等,空车司机搜索下一个乘客的方法通常由实际位置和来自网约车应用平台的信息决定,司机决定在哪里寻找下一位乘客后,会牢记这一轨迹,长短时记忆网络能够结合长期信息,因此作为第二层,LSTM网络的输出被传递到一个完全连通的层,其中隐藏单元的尺寸被转换回与输入单热矢量相同的尺寸。最后,使用softmax激活功能层来计算给定司机空车行驶时的下一路径的不同道路的概率分布。
比如,采用给定的开始路段r0作为输入,以得到预测模型预测的空车行驶的第二路段的概率分布D0,第二条道路r1从分布D0采样,将r0和r1作为新输入并将其馈入预测模型中以获得概率分布D1,并对下一个路段进行采样,从形式上讲,在迭代i≥1时,从Di-1中抽取一个新的路段ri,并将{r0,r1,r2… … ri}馈入预测模型中以获得Di,重复上述步骤直到生成的预测轨迹足够长,进而实现了完整的连续路径轨迹的预测。
在上述任一实施例中,优选地,确定子单元2032还用于:采用滑窗算法确定至少一条路段轨迹的输入数量,以输入神经网络预测模型。
在该实施例中,在时间点k,把rl-k+1,……,rk放入网络,用以预测rk+1,其中l为滑窗的大小,通过限定各个时间窗口内的输入的矢量数量,解决了神经网络预测时预测长度过长的问题。
实施例5
图5示出了根据本发明的一个实施例的服务器50的示意框图。
如图5所示,根据本发明的一个实施例的服务器50,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明的实施例的任一项的网约车空车轨迹的预测方法的步骤,或包括本发明实施例的任一项的网约车空车轨迹的预测装置200。
在该实施例中,服务器50的处理器执行计算机程序时实现本发明的实施例1提出的任一项的网约车空车轨迹的预测方法的步骤或包括本发明的实施例2提出的任一项的网约车空车轨迹的预测装置200,因此具有上述本发明实施例1提出的任一项的网约车空车轨迹的预测方法的全部有益效果或上述本发明实施例2提出的任一项的网约车空车轨迹的预测装200的全部有益效果,在此不再赘述。
实施例6
根据本发明的一个实施例的计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径。
在该技术方案中,通过设置基于长短时记忆(Long Short-Term Memory,LSTM)的轨迹预测模型,以预测网约车在接收到订单之前的持续空车行驶轨迹,一方面,与现有技术中采用基于贝叶斯或马尔科夫过程的预测模型的预测方案相比,能够保留已行驶轨迹的记忆性,从而有利于提升预测的准确性,另一方面,与现有技术中基于深度神经网络的预测模型的预测方案相比,能够实现对接下来时间段内的连续路径的预测,从而实现更好的交通拥堵控制,并且能够优化网约车的行驶路径与行驶计划,从而有利于提升网约车的接单效率。
在上述技术方案中,优选地,在采集到网约车处于空车状态经过的至少一条路段轨迹时,将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型前,还包括:收集多个网约车的行驶GPS轨迹,并对行驶GPS轨迹执行预处理操作,以生成训练样本;将训练样本输入包括长短期记忆网络的神经网络模型,以对包括长短期记忆网络的神经网络模型执行模型训练;根据模型训练的训练结果生成预设的基于长短时记忆的神经网络预测模型。
在该技术方案中,通过对行驶GPS轨迹进行预处理,以满足包括长短期记忆网络的神经网络模型的输入要求,通过采用行驶GPS轨迹的大数据以及长期短期记忆(LSTM)网络来学习轨迹数据,由于行驶GPS轨迹具有随机性,有利于提升整个生成的轨迹的准确度。
在上述任一技术方案中,优选地,对行驶GPS轨迹执行预处理操作,具体包括以下步骤:行驶GPS轨迹包括GPS位置点序列,对每个行驶GPS轨迹进行离群点轨迹检测,以删除错误位置信息;对原始路网数据中度为2的点连接的两条路段执行合并操作,以生成简化路网路线;将删除错误位置信息的GPS位置点序列映射至简化路网路线上,以生成映射路网轨迹,映射路网轨迹包括多条映射路段;将同一条映射路段上的GPS位置点子序列合并为单向矢量,以根据单向矢量将映射路网轨迹转化为单向矢量序列,以将单向矢量序列确定为训练样本。
在该技术方案中,预处理操作可以包括有效轨迹检测,路网简化,轨迹到路网的映射,以及路径与数据生成四部分,其中,通过进行轨迹检测可以去除GPS信息中一些错误的记录,比如轨迹漂移数据等,将路网进行简化,主要指把使用的四维图新的路网数据进行若干处理,包括在原始路网数据上,存在非常非常多的长度<10m的路段,将度为2的点所连接的两条路段进行不断的合并一条通常意义上的路,以提高模型准确度并能够加速模型训练和预测的速度,通过执行轨迹到路网的映射,以将GPS轨迹信息映射到简化过的路网上,通过将映射到路网上的路段进行整合,以得到道路表达式,P={r0,r1,r2… … rn}的形式,如果把r视为单词,那么P可以视为一个句子,进而实现了将行驶轨迹问题转化为文本分析问题,以实现在神经网络模型中的训练与预测。
具体地,预处理将路网和原始数据(行驶GPS轨迹)作为输入值,将轨迹表示为一系列有序的GPS位置p1→p2→......pn,其中pi是由经度,纬度和时间戳组成的GPS点,并且计算每个GPS点pi处的平均速度作为pi-1和pi+1之间的持续时间的欧几里得距离,通过删除包括速度非常大(系统中为50m/s)的GPS点的轨迹,以及从多元正态分布中提取的轨迹,实现轨迹异常的剔除,因为GPS位置可能存在错误,或者汽车根本没有移动,另外也可以放弃持续时间少于5分钟的轨迹,因为太短的轨迹可能不能包括足够的信息,将路段视为“单词”,多条连续路段可以相应地转换为“句子”,即采用映射到的道路索引代替每个GPS点,从而将映射到同一条路段上的GPS点的子序列合并为一个单词,以使空车轨迹生成问题转化为文本生成问题,进而降低轨迹预测的复杂度。
在上述任一技术方案中,优选地,将删除错误位置信息的GPS位置点序列映射至简化路网路线上,具体包括以下步骤:采用ST-Matching地图映射算法,将删除错误位置信息的GPS位置点序列映射至简化路网路线上。
在该技术方案中,由于司机驾驶乘客时尽可能快地驾驶,因此每条路段的速度约束可以使用非空车驾驶轨迹的数据来计算,通过采用ST-Matching算法将轨迹映射到数字路线图上,以避免浮点精度问题。
在上述任一技术方案中,优选地,对包括长短期记忆网络的神经网络模型执行模型训练,具体包括以下步骤:采用随机梯度下降算法和Adam优化器执行模型训练。
在该技术方案中,采用随机梯度下降算法和Adam优化器进行模型训练,其中Adam优化器是适应性矩估计的缩写,是具有动量的RMSprop优化器的变种,它使用梯度的一阶近似,然后采用二阶矩近似来动态调整每个参数的学习率,Adam优化器利用Adagrad和RMSprop的优势,分别能够处理稀疏梯度和随机目标。
在上述任一技术方案中,优选地,还包括:将至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以根据神经网络预测模型的输出结果,预测网约车在接收到派单之前的连续路径,具体包括以下步骤:将至少一条路段轨迹转换为单向矢量序列;将单向矢量序列输入嵌入层,以将单向矢量转化为固定维数的实值矢量;将实值矢量输入长短时记忆层,以根据实值矢量与实值矢量的先前隐藏状态生成隐藏状态向量;将隐藏状态向量输入全连接层,以将隐藏状态向量映射至维度为映射路段数量的向量空间中;将映射结果输入交叉熵损失回归层,以计算至少一条路段轨迹的下一条路段的概率分布;根据概率分布确定下一条路段;根据下一条路段的迭代结果,确定连续路径。
在该技术方案中,神经网络预测模型可以由四层构成,第一层是嵌入层(embedding layer),把输入数据(路径中的路段)转化为一个低维向量,以实现文本类型的数据预测,另外,还可以使用one-hot vector作为输入值,第二层是LSTM层,路径的历史信息通过LSTM cell中的神经元从起点到终点传输,第三层是全连接层(Fully ConnectedLayer),通过全连接层把hidden unit的向量映射到了维度为路的总数的向量空间上,最后是交叉熵损失回归层(SoftMax Layer),用以计算每条路作为后续路段的概率,从而能够保留已行驶轨迹的记忆性,并能够实现对接下来时间段内的连续路径的预测,满足了网约车空车状态下的预测要求,通过设置长短期记忆网络,实现了从大型语料库中学习单词模式,它能够用给定的开始单词生成单词序列,对应的,则实现了采用给定的启示路段生成后续的连续路径,实现了长期相关性的预测功能。
具体地,嵌入层将表示道路指标的单向矢量输入转化为固定维数的实值矢量,表示输入路段的嵌入,通过设置嵌入层实现了训练过程更快地收敛,并且采用实值向量表示也降低了维数并降低了训练的复杂度,在嵌入层之后,为LSTM-RNN(Recurrent NeuralNetworks,循环神经网络)层,可使用的空车驱动策略将受到许多因素的影响。例如,下一个订单利润最高,或不希望在等待乘客时驾驶时间过长等,空车司机搜索下一个乘客的方法通常由实际位置和来自网约车应用平台的信息决定,司机决定在哪里寻找下一位乘客后,会牢记这一轨迹,长短时记忆网络能够结合长期信息,因此作为第二层,LSTM网络的输出被传递到一个完全连通的层,其中隐藏单元的尺寸被转换回与输入单热矢量相同的尺寸。最后,使用softmax激活功能层来计算给定司机空车行驶时的下一路径的不同道路的概率分布。
比如,采用给定的开始路段r0作为输入,以得到预测模型预测的空车行驶的第二路段的概率分布D0,第二条道路r1从分布D0采样,将r0和r1作为新输入并将其馈入预测模型中以获得概率分布D1,并对下一个路段进行采样,从形式上讲,在迭代i≥1时,从Di-1中抽取一个新的路段ri,并将{r0,r1,r2… … ri}馈入预测模型中以获得Di,重复上述步骤直到生成的预测轨迹足够长,进而实现了完整的连续路径轨迹的预测。
在上述任一技术方案中,优选地,将至少一条路段轨迹输入预设的神经网络预测模型,具体包括以下步骤:采用滑窗算法确定至少一条路段轨迹的输入数量,以输入神经网络预测模型。
在该技术方案中,在时间点k,把rl-k+1,……,rk放入网络,用以预测rk+1,其中l为滑窗的大小,通过限定各个时间窗口内的输入的矢量数量,解决了神经网络预测时预测长度过长的问题。
实施例7
图6示出了根据本发明的再一个实施例的网约车空车轨迹的预测方案的示意图。
如图6所示,根据本发明的实施例的网约车空车轨迹的预测方案,包括,将网约车平台中采集的轨迹以及路网数据库同的路网数据输入预处理模块,对发现的轨迹进行预处理,对路网进行简化处理后,执行轨迹与路网之间的映射匹配操作,并将匹配的结果转换为矢量单元输入到空车轨迹预测模块,采用LSTM模型,实现预测操作,并获得预测结果。
以上结合附图详细说明了本发明的技术方案,本发明提出了一种网约车空车轨迹的预测方法、网约车空车轨迹的预测装置、服务器和计算机可读存储介质,通过设置基于长短时记忆(Long Short-Term Memory,LSTM)的轨迹预测模型,以预测网约车在接收到订单之前的持续空车行驶轨迹,一方面,与现有技术中采用基于贝叶斯或马尔科夫过程的预测模型的预测方案相比,能够保留已行驶轨迹的记忆性,从而有利于提升预测的准确性,另一方面,与现有技术中基于深度神经网络的预测模型的预测方案相比,能够实现对接下来时间段内的连续路径的预测,从而实现更好的交通拥堵控制,并且能够优化网约车的行驶路径与行驶计划,从而有利于提升网约车的接单效率。
本发明方法中的步骤可根据实际需要进行顺序调整、合并和删减。
本发明装置中的单元可根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种网约车空车轨迹的预测方法,其特征在于,包括:
在采集到网约车处于空车状态经过的至少一条路段轨迹时,将所述至少一条路段轨迹作为开始路段r0输入预设的基于长短时记忆的神经网络预测模型,以计算所述开始路段的下一路段的概率分布;
根据所述开始路段的下一路段的概率分布确定第一路段r1
将r0和r1作为新输入并将其馈入预设的基于长短时记忆的神经网络预测模型中以计算所述第一路段的下一路段的概率分布;
根据所述第一路段的下一路段的概率分布确定第二路段r2
根据所述下一路段的迭代结果,预测所述网约车具体在接收到派单之前的连续路径,具体包括:将{ r0, r1,r2,…,ri}作为新输入馈入预设的基于长短时记忆的神经网络预测模型中以计算第i路段的下一路段的概率分布,根据所述第i路段的下一路段的概率分布确定第i+1路段ri+1;直至预测得到所述网约车在接收到派单之前的连续路径。
2.根据权利要求1所述的网约车空车轨迹的预测方法,其特征在于,所述在采集到网约车处于空车状态经过的至少一条路段轨迹时,将所述至少一条路段轨迹作为开始路段r0输入预设的基于长短时记忆的神经网络预测模型前,还包括:
收集多个网约车的行驶GPS轨迹,并对所述行驶GPS轨迹执行预处理操作,以生成训练样本;
将所述训练样本输入包括长短期记忆网络的神经网络模型,以对所述神经网络模型执行模型训练;
根据所述模型训练的训练结果生成所述预设的基于长短时记忆的神经网络预测模型。
3.根据权利要求2所述的网约车空车轨迹的预测方法,其特征在于,所述对所述行驶GPS轨迹执行预处理操作,具体包括以下步骤:
所述行驶GPS轨迹包括GPS位置点序列,对每个所述行驶GPS轨迹进行离群点轨迹检测,以删除错误位置信息;
对原始路网数据中度为2的点连接的两条路段执行合并操作,以生成简化路网路线;
将删除所述错误位置信息的所述GPS位置点序列映射至所述简化路网路线上,以生成映射路网轨迹,所述映射路网轨迹包括多条映射路段;
将同一条所述映射路段上的GPS位置点子序列合并为单向矢量,以根据所述单向矢量将所述映射路网轨迹转化为单向矢量序列,以将所述单向矢量序列确定为所述训练样本。
4.根据权利要求3所述的网约车空车轨迹的预测方法,其特征在于,所述将删除所述错误位置信息的所述GPS位置点序列映射至所述简化路网路线上,具体包括以下步骤:
采用ST-Matching地图映射算法,将删除所述错误位置信息的所述GPS位置点序列映射至所述简化路网路线上。
5.根据权利要求3所述的网约车空车轨迹的预测方法,其特征在于,所述对所述神经网络模型执行模型训练,具体包括以下步骤:
采用随机梯度下降算法和Adam优化器执行所述模型训练。
6.根据权利要求3所述的网约车空车轨迹的预测方法,其特征在于,所述将所述至少一条路段轨迹作为开始路段r0输入预设的基于长短时记忆的神经网络预测模型,以计算所述开始路段的下一路段的概率分布,具体包括以下步骤:
将所述至少一条路段轨迹转换为所述单向矢量序列;
将所述单向矢量序列输入嵌入层,以将所述单向矢量转化为固定维数的实值矢量;
将所述实值矢量输入长短时记忆层,以根据所述实值矢量与所述实值矢量的先前隐藏状态生成隐藏状态向量;
将所述隐藏状态向量输入全连接层,以将所述隐藏状态向量映射至维度为所述映射路段数量的向量空间中,得到映射结果;
将所述映射结果输入交叉熵损失回归层。
7.根据权利要求1至6中任一项所述的网约车空车轨迹的预测方法,其特征在于,将所述至少一条路段轨迹作为开始路段r0输入预设的神经网络预测模型,具体包括以下步骤:
采用滑窗算法确定所述至少一条路段轨迹的输入数量,以输入所述神经网络预测模型。
8.一种网约车空车轨迹的预测装置,其特征在于,包括:
输入单元,用于在采集到网约车处于空车状态经过的至少一条路段轨迹时,将所述至少一条路段轨迹输入预设的基于长短时记忆的神经网络预测模型,以预测所述网约车在接收到派单之前的连续路径;
所述输入单元,包括确定子单元;
所述确定子单元用于,
将所述至少一条路段轨迹作为开始路段r0输入预设的基于长短时记忆的神经网络预测模型,以计算所述开始路段的下一路段的概率分布;
根据所述开始路段的下一路段的概率分布确定第一路段r1
将r0和r1作为新输入并将其馈入预设的基于长短时记忆的神经网络预测模型中以计算所述第一路段的下一路段的概率分布;
根据所述第一路段的下一路段的概率分布确定第二路段r2
根据下一路段的迭代结果,预测所述网约车具体在接收到派单之前的连续路径,具体包括:将{ r0, r1,r2,…,ri}作为新输入馈入预设的基于长短时记忆的神经网络预测模型中以计算第i路段的下一路段的概率分布,根据所述第i路段的下一路段的概率分布确定第i+1路段ri+1;直至预测得到所述网约车在接收到派单之前的连续路径。
9.根据权利要求8所述的网约车空车轨迹的预测装置,其特征在于,还包括:
预处理单元,用于收集多个网约车的行驶GPS轨迹,并对所述行驶GPS轨迹执行预处理操作,以生成训练样本;
训练单元,用于将所述训练样本输入包括长短期记忆网络的神经网络模型,以对所述神经网络模型执行模型训练;
生成单元,用于根据所述模型训练的训练结果生成所述预设的基于长短时记忆的神经网络预测模型。
10.根据权利要求9所述的网约车空车轨迹的预测装置,其特征在于,所述预处理单元包括:
删除子单元,所述行驶GPS轨迹包括GPS位置点序列,用于对每个所述行驶GPS轨迹进行离群点轨迹检测,以删除错误位置信息;
第一合并子单元,用于对原始路网数据中度为2的点连接的两条路段执行合并操作,以生成简化路网路线;
第一映射子单元,用于将删除所述错误位置信息的所述GPS位置点序列映射至所述简化路网路线上,以生成映射路网轨迹,所述映射路网轨迹包括多条映射路段;
第二合并子单元,用于将同一条所述映射路段上的GPS位置点子序列合并为单向矢量,以根据所述单向矢量将所述映射路网轨迹转化为单向矢量序列,以将所述单向矢量序列确定为所述训练样本。
11.根据权利要求10所述的网约车空车轨迹的预测装置,其特征在于,
所述第一映射子单元还用于:采用ST-Matching地图映射算法,将删除所述错误位置信息的所述GPS位置点序列映射至所述简化路网路线上。
12.根据权利要求10所述的网约车空车轨迹的预测装置,其特征在于,
所述训练单元还用于:采用随机梯度下降算法和Adam优化器执行所述模型训练。
13.根据权利要求10所述的网约车空车轨迹的预测装置,其特征在于,所述输入单元还包括:转换子单元、转化子单元、生成子单元、第二映射子单元和计算子单元;
所述转换子单元,用于将所述至少一条路段轨迹转换为所述单向矢量序列;
所述转化子单元,用于将所述单向矢量序列输入嵌入层,以将所述单向矢量转化为固定维数的实值矢量;
所述生成子单元,用于将所述实值矢量输入长短时记忆层,以根据所述实值矢量与所述实值矢量的先前隐藏状态生成隐藏状态向量;
所述第二映射子单元,用于将所述隐藏状态向量输入全连接层,以将所述隐藏状态向量映射至维度为所述映射路段数量的向量空间中,得到映射结果;
所述计算子单元,还用于将所述映射结果输入交叉熵损失回归层。
14.根据权利要求8至13中任一项所述的网约车空车轨迹的预测装置,其特征在于,
所述确定子单元还用于:采用滑窗算法确定所述至少一条路段轨迹的输入数量,以输入所述神经网络预测模型。
15.一种服务器,其特征在于,所述服务器包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任一项所述的网约车空车轨迹的预测方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的网约车空车轨迹的预测方法的步骤。
CN201811472924.6A 2018-12-04 2018-12-04 空车轨迹预测方法、预测装置、服务器和可读存储介质 Active CN111275225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811472924.6A CN111275225B (zh) 2018-12-04 2018-12-04 空车轨迹预测方法、预测装置、服务器和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811472924.6A CN111275225B (zh) 2018-12-04 2018-12-04 空车轨迹预测方法、预测装置、服务器和可读存储介质

Publications (2)

Publication Number Publication Date
CN111275225A CN111275225A (zh) 2020-06-12
CN111275225B true CN111275225B (zh) 2022-07-19

Family

ID=70999908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811472924.6A Active CN111275225B (zh) 2018-12-04 2018-12-04 空车轨迹预测方法、预测装置、服务器和可读存储介质

Country Status (1)

Country Link
CN (1) CN111275225B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985662B (zh) * 2020-06-30 2024-01-12 北京百度网讯科技有限公司 网络约车方法、装置、电子设备和存储介质
CN112183589B (zh) * 2020-09-14 2022-04-22 西北工业大学 一种低采样率下的实时车辆k近邻查询方法
CN112667763B (zh) * 2020-12-29 2022-09-13 电子科技大学 一种基于自适应时间戳与多尺度特征提取的轨迹预测方法
CN112733452B (zh) * 2021-01-13 2024-03-29 北京嘀嘀无限科技发展有限公司 轨迹预测方法、装置、电子设备和可读存储介质
CN113449062B (zh) * 2021-06-30 2024-04-12 北京百度网讯科技有限公司 轨迹处理方法、装置、电子设备和存储介质
CN116151493B (zh) * 2023-04-24 2023-07-25 之江实验室 基于头部效应和循环神经网络的交通拥堵预测方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389980A (zh) * 2015-11-09 2016-03-09 上海交通大学 基于长短时记忆递归神经网络的短时交通流预测方法
CN105760958A (zh) * 2016-02-24 2016-07-13 电子科技大学 一种基于车联网的车辆轨迹预测方法
CN108022012A (zh) * 2017-12-01 2018-05-11 兰州大学 基于深度学习的车辆位置预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9989964B2 (en) * 2016-11-03 2018-06-05 Mitsubishi Electric Research Laboratories, Inc. System and method for controlling vehicle using neural network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389980A (zh) * 2015-11-09 2016-03-09 上海交通大学 基于长短时记忆递归神经网络的短时交通流预测方法
CN105760958A (zh) * 2016-02-24 2016-07-13 电子科技大学 一种基于车联网的车辆轨迹预测方法
CN108022012A (zh) * 2017-12-01 2018-05-11 兰州大学 基于深度学习的车辆位置预测方法

Also Published As

Publication number Publication date
CN111275225A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN111275225B (zh) 空车轨迹预测方法、预测装置、服务器和可读存储介质
Chen An arrival time prediction method for bus system
CN108197739B (zh) 一种城市轨道交通乘客流量预测方法
CN110597086B (zh) 仿真场景生成方法、无人驾驶系统测试方法以及装置
CN112700072B (zh) 交通状况预测方法、电子设备和存储介质
Yin et al. Data-driven models for train control dynamics in high-speed railways: LAG-LSTM for train trajectory prediction
CN108417038B (zh) 一种公交客流量的预测方法及系统
CN114493191B (zh) 一种基于网约车数据的驾驶行为建模分析方法
Reddy et al. Bus travel time prediction under high variability conditions
CN110738855A (zh) 一种数据稀疏时间段的道路交通流状况预测方法
CN115049009A (zh) 基于语义融合表征的轨迹预测方法
Reich et al. Survey of ETA prediction methods in public transport networks
Xu et al. A study of vehicle driving condition recognition using supervised learning methods
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
Hori et al. Driver confusion status detection using recurrent neural networks
CN112990536B (zh) 一种基于分位数卷积网络的公交到站时间预测方法
CN113128766A (zh) 目的地预判方法、装置、电子设备和存储介质
CN111126311B (zh) 城市道路的潜在危险区域识别方法、装置及电子设备
CN110944295B (zh) 位置预测方法、装置、存储介质及终端
CN109598933B (zh) 一种基于数据驱动的k邻近非参数回归的交通流预测方法
CN116805449A (zh) 一种考虑个体先验数据的交通信号模糊控制方法及系统
CN116663742A (zh) 基于多因素和模型融合的区域运力预测方法
Liu et al. Modeling trajectories with multi-task learning
CN115394083A (zh) 一种基于深度学习的高速公路交通拥堵预测方法
CN114463978A (zh) 一种基于轨道交通信息处理终端的数据监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant