CN116151489A - 基于多任务学习的车辆停留行为分析与预测方法、系统 - Google Patents

基于多任务学习的车辆停留行为分析与预测方法、系统 Download PDF

Info

Publication number
CN116151489A
CN116151489A CN202310417213.3A CN202310417213A CN116151489A CN 116151489 A CN116151489 A CN 116151489A CN 202310417213 A CN202310417213 A CN 202310417213A CN 116151489 A CN116151489 A CN 116151489A
Authority
CN
China
Prior art keywords
stay
vehicle
time
prediction
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310417213.3A
Other languages
English (en)
Other versions
CN116151489B (zh
Inventor
陈红阳
刘晨曦
肖竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202310417213.3A priority Critical patent/CN116151489B/zh
Publication of CN116151489A publication Critical patent/CN116151489A/zh
Application granted granted Critical
Publication of CN116151489B publication Critical patent/CN116151489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Analytical Chemistry (AREA)
  • Economics (AREA)
  • Chemical & Material Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于多任务学习的车辆停留行为分析与预测方法、系统,包括以下步骤:采集包括车辆脱敏后的车辆ID、行程开始时间、开始经度、开始纬度、结束时间、结束经度和结束纬度在内的车辆GPS和OBD数据;对车辆GPS和OBD数据进行预处理,得到包括停留地点和停留时长在内的车辆停留行为数据;并利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取;将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为并通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测。本发明方法可以为兴趣点推荐、个性化出行制定、定向广告投放、智慧停车等应用场景提供支持。

Description

基于多任务学习的车辆停留行为分析与预测方法、系统
技术领域
本发明主要涉及轨迹数据挖掘、智能交通优化领域,具体涉及一种基于多任务学习的车辆停留行为分析与预测方法、系统。
背景技术
车辆停留行为分析,是指在获得车辆停留行为数据的情况下,对有关数据进行统计、分析,从中发现用户的出行意图和活动属性的规律,并将这些规律与城市路网交通运行优化等策略结合,对于兴趣点推荐、防范道路安全事件、个性化推荐路线、规划城市道路和提高交通效率等方面起到关键作用。
近些年来,如何分析和挖掘交通大数据的深度特征并对其进行建模和预测,已逐渐成为城市计算领域的一大热点,并受到许多国内外专家及公司的关注。现有的工作主要通过挖掘单个预测任务如交通流、速度、行程时间等的内部时空关联,通过引入深度学习方法对交通数据进行建模,并预测交通数据。这些工作都忽略了不同预测任务之间的时空关联和任务依赖性,而仅仅对单个任务进行预测,丢失了任务间的任务依赖性,如,车辆的停留地点和停留时长,如果能够捕捉这种多任务之间的依赖性从而更好地建模交通数据,将大大提高预测的精度。因此,考虑将多任务学习引入车辆停留行为分析与预测系统中是十分有必要的。
发明内容
本发明的目的在于针对现有技术不足,提出了一种基于多任务学习的车辆停留行为分析与预测方法、系统。
为实现上述技术目的,本发明的技术方案为:
根据本发明实施例的第一方面提供了一种基于多任务学习的车辆停留行为分析与预测方法,所述方法包括以下步骤:
S1,采集包括车辆脱敏后的车辆ID、行程开始时间、开始经度、开始纬度、结束时间、结束经度和结束纬度在内的车辆GPS和OBD数据;
S2,对车辆GPS和OBD数据进行预处理,得到包括停留地点和停留时长在内的车辆停留行为数据;并利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取;
S3,将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测。
进一步地,对车辆GPS和OBD数据进行预处理,得到停留时长包括:
对车辆GPS和OBD数据按开始时间进行排序;
删除前一项结束时间晚于等于后一项开始时间的车辆GPS和OBD数据,删除停止时间小于等于开始时间的车辆GPS和OBD数据,删除开始和停止地点不一致的车辆GPS和OBD数据;
将车辆GPS和OBD数据前一项的结束时间减去后一项的开始时间,即得停留时长。
进一步地,对车辆GPS和OBD数据进行预处理,得到停留地点包括:
根据用户id对车辆GPS数据和OBD数据按时间戳进行对齐与合并,按照用户id进行排序,得到车辆轨迹数据;
判断车辆轨迹数据中任意一轨迹点与其相邻的轨迹点的间距是否小于间距阈值;
若小于间距阈值,则计算两轨迹点的时间差;若时间差大于时间差阈值,且该轨迹点的速度为0,则在停留开始时间处标记该轨迹点的停留状态,直至停留结束时间处标记车辆启动,记录停留点;
获取每一用户的停留点集合;
获取所有用户的停留点集合。
进一步地,利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取包括:
将车辆停留行为数据按时间间隔划分为若干层次的车辆停留行为数据;
通过第一层次循环神经网络处理某一层次的车辆停留行为数据;
通过第二层次循环神经网络处理层次间的车辆停留行为数据;
将车辆停留行为数据在第一层次循环神经网络和第二层次循环神经网络间进行变换,实现对车辆停留行为数据进行编码,得到时空特征。
进一步地,通过第一层次循环神经网络处理某一层次的车辆停留行为数据包括:
Figure SMS_1
其中,⊕表示将向量拼接,
Figure SMS_2
为用户车辆停留地点的经度,/>
Figure SMS_3
为用户车辆停留地点的维度,/>
Figure SMS_4
表示第/>
Figure SMS_5
次迭代第一层次循环神经网络的运行状态表示;
通过第二层次循环神经网络处理层次间的车辆停留行为数据包括:
Figure SMS_6
其中,eu表示唯一标识用户id的向量信息,hn表示由第一层次循环神经网络迭代后得到的隐藏状态信息,
Figure SMS_7
表示第/>
Figure SMS_8
次迭代第二层次循环神经网络的运行状态表示。
进一步地,将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测包括:
将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为基于长短期记忆网络分别构建停留地点任务模型和停留时长任务模型,通过多任务学习预测网络使停留地点任务模型和停留时长任务模型同时学习,挖掘停留地点预测任务与停留时长预测任务间的相关性,预测得到未来时间段内的停留地点和停留时长;
其中,多任务学习的过程包括:选用relu函数作为激活函数,采用均方误差函数作为预测停留时长的损失函数,采用交叉熵函数作为预测停留地点的损失函数;多任务深度学习网络的损失函数为均方误差函数和交叉熵函数之和,对均方误差函数和交叉熵函数同时优化,学习预测得到未来时间段内的停留地点和停留时长。
根据本发明实施例的第二方面提供了一种基于多任务学习的车辆停留行为分析与预测系统,包括:
数据采集模块,采集包括车辆脱敏后的车辆ID、行程开始时间、开始经度、开始纬度、结束时间、结束经度和结束纬度在内的车辆GPS和OBD数据;
车辆停留行为数据获取模块,对车辆GPS和OBD数据进行预处理,得到包括停留地点和停留时长在内的车辆停留行为数据;并利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取;
多任务学习预测模块,将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测。
进一步地,还包括:
用户终端,包括预测结果接收模块和用户匹配模块;
预测结果接收模块,接收多任务学习预测模块输出的车辆停留行为预测结果,并传输给用户匹配模块;
用户匹配模块,将停留行为预测结果与用户进行匹配,将匹配结果反馈至用户。
根据本发明实施例的第三方面提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的基于多任务学习的车辆停留行为分析与预测方法。
根据本发明实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的基于多任务学习的车辆停留行为分析与预测方法。
与现有技术相比,本发明的有益效果是:本发明提供了一种基于多任务学习的车辆停留行为分析与预测方法,本发明方法在考虑车辆的历史停留行为之外,还考虑了停留地点预测任务与停留时长预测任务间的相关性,本发明将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测,可以的对车辆停留行为的时空依赖关系进行分析,提高了停留行为预测的准确度。本发明为兴趣点推荐、个性化出行制定、定向广告投放、智慧停车等应用提供支持。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提出的一种基于多任务学习的车辆停留行为分析与预测方法的流程图;
图2为本发明实施例提供的提取停留时长的步骤流程图;
图3为本发明实施例提供的提取停留地点的步骤流程图;
图4为本发明实施例提供的深度循环神经网络的示意图;
图5为本发明实施例提供的一种基于多任务学习的车辆停留行为分析与预测系统的示意图;
图6为本发明实施例提供的多任务预测网络与LSTM网络的正确率对比图;
图7为本发明实施例提供的一种电子设备的示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。
下面结合附图对本发明具体实施方式做进一步详细说明。在不冲突的情况下,下述的实施例及实施方式中的特征可以相互组合。
如图1所示,本发明实施例还提供了一种基于多任务学习的车辆停留行为分析与预测方法,包括如下步骤:
步骤S1,采集车辆GPS(Global Positioning System, 全球定位系统)和OBD(On-Board Diagnostics, 车载诊断系统)数据,所述车辆GPS和OBD数据包括车辆脱敏后的车辆ID、行程开始时间、开始经度、开始纬度、结束时间、结束经度和结束纬度等信息。
步骤S2,对步骤S1采集到的车辆GPS和OBD数据进行预处理,得到包括停留地点和停留时长在内的车辆停留行为数据;并利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取。
进一步地,所述步骤S2具体包括以下步骤:
步骤S201,对步骤S1采集到的车辆GPS和OBD数据进行预处理,得到包括停留地点和停留时长在内的车辆停留行为数据。
其中,如图2所示,获取停留时长的具体步骤如下:
S2011,对车辆GPS和OBD数据按开始时间进行排序。
S2012,删除前一项结束时间晚于等于后一项开始时间的车辆GPS和OBD数据,删除停止时间小于等于开始时间的车辆GPS和OBD数据。
S2013,根据排序好的车辆GPS和OBD数据,用前一项的结束时间减去后一项的开始时间,即得到停留时长。此外,还需剔除开始和停止地点不一致的车辆GPS和OBD数据,删除停留时长小于停留时长阈值的车辆GPS和OBD数据。在本实例中,所述停留时长阈值设置为5分钟。
如图3所示,获取停留地点的具体提取步骤如下:
S2014,根据用户id对车辆GPS数据和OBD数据按时间戳进行对齐与合并,并按照用户id进行排序,得到车辆轨迹数据T。
S2015,判断车辆轨迹数据中任意一轨迹点与其相邻的轨迹点的间距是否小于间距阈值;在本实例,所述间距阈值设置为50m。
若小于间距阈值,则计算两轨迹点的时间差,将时间差记为
Figure SMS_9
;若时间差大于时间差阈值(在本实例,所述时间差阈值设置为150s),且该轨迹点的速度为0,则在停留开始时间处标记该轨迹点的停留状态,直至停留结束时间处标记车辆启动,记录第i个停留点为
Figure SMS_10
,其中,id为用户id,lon为停留点经度,lat为停留点纬度,ts为停留开始时间,te为停留结束时间。
获取每一用户的停留点集合,将第j个用户停留点集合记为
Figure SMS_11
获取所有用户的停留点集合,记为
Figure SMS_12
步骤S202,利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取。
假车辆用户的停留行为数据是
Figure SMS_13
,具体到每一个停留点/>
Figure SMS_14
,其代表的是一个由经纬度和时间组成的元组,即/>
Figure SMS_15
,分布表示用户id、停留经度、停留纬度、年、月、日、时、分、秒和停留时长。深度循环神经网络如图4所示,通过一个嵌入层可以提取位置和时间的信息,并且将这个信息在第一层次循环神经网络中传播,获得停留行为的隐藏状态。而在第二层次循环神经网络,其输入来自于第一层次循环神经网络的输出,通过车辆停留行为数据在第一层次循环神经网络和第二层次循环神经网络间进行变换,可以很好的表示用户的停留行为,具体包括:
将用户的停留行为按时间间隔从天到周划分为不同层次的移动轨迹,在第一层次循环神经网络和第二层次循环神经网络间进行变换编码。
通过第一层次循环神经网络处理某一层次的车辆停留行为数据的过程具体如下:
Figure SMS_16
其中,⊕表示将向量拼接,
Figure SMS_17
表示第/>
Figure SMS_18
次迭代第一层次循环神经网络的运行状态表示。如果将时间间隔小于一段大小的移动记录,迭代地将用户的这些信息输入,可以获得一段时间内用户移动记录的表示。
通过第二层次循环神经网络处理层次间的车辆停留行为数据的过程具体为:
当遇到的下一个用户移动记录大的时候,则需要将低层次的状态输入到高层次的循环神经网络,来一起表示用户的移动记录,公式的具体细节如下:
Figure SMS_19
其中eu表示可以唯一标识用户的向量信息,hn表示由低层次RNN迭代表示后送来的隐藏状态信息,hj-1表示高层次循环神经网络的上一次运行结果。
将不同层次的停留行为的用不同层次的循环神经网络进行编码,可提取第一层次停留行为的移动特征,并在第二层次循环神经网络中进行处理,最大限度的保留用户的停留行为特征。
将用户的停留行为划分不同层次,即第一层次和第二层次。通过对不同停留行为的编码,在整体上处理用户的停留行为记录,从而简化用户复杂的停留行为模式。el, et为用户停留行为地点的经纬度,第i层的第一层次嵌入如下:
Figure SMS_20
其中⊕表示将向量拼接,
Figure SMS_21
表示上一次循环神经网络的运行状态表示,当i=1时,其为初始输入停留行为/>
Figure SMS_22
。迭代地将用户的这些信息输入,可以获得一段时间内用户停留行为的表示。
第二层嵌入将一段时间内用户停留行为的表示的第一层次状态输入到高层次的循环神经网络,整合表示用户的停留行为:
Figure SMS_23
其中,eu表示可以唯一标识用户的向量信息,
Figure SMS_24
表示由第一层次循环神经网络迭代表示后送来的隐藏状态信息,/>
Figure SMS_25
表示第二层次循环神经网络的上一次运行结果。
现在知道如何使用具有层次结构的循环神经网络处理用户的停留行为之后,就可以直观的理解用户的停留行为是分段式的记录,在第一层次的循环神经网络中,处理的就是一段停留行为记录,而在不同的停留行为记录之间,通常会出现时间间隔大的情况。而第二层次的循环神经网络就是处理不同停留行为之间的情况。通过将用户的停留行为在两个不同层次之间的循环神经网络进行变换,能够处理更长的用户停留行为记录。这种使用层次结构的方法,能够更好的保留不同层次用户停留行为的信息,从而更好的对用户停留行为建模。
S3,将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测。
将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为基于长短期记忆网络分别构建停留地点任务模型和停留时长任务模型,通过多任务学习预测网络使停留地点任务模型和停留时长任务模型同时学习,挖掘停留地点预测任务与停留时长预测任务间的相关性,预测得到未来时间段内的停留地点和停留时长;
在本实例中,停留地点任务模型和停留时长任务模型均是基于长短期记忆网络来实现的,这停留地点任务模型和停留时长任务模型的不同之处在于,预测停留时长是一个回归问题,而预测停留地点是一个分类问题。
在预测停留时长任务时,本发明将停留行为数据按照时间顺序进行排序,得到车辆停留行为的时序数据。然后,分别将下一次车辆停留时长和地点类别作为标签,以训练得到下一次停留时长和地点类别的信息。然后在长短期记忆网络任务学习过程中,参数变化过程下所示:
Figure SMS_26
(3)
其中,
Figure SMS_27
表示sigmoid激活函数。
停留时长任务模型在参数学习过程中,不仅用到了上一层的输入x,还用到了本层中上一个时间点的输入h,还有各种门控的输入,来组成新的向量。这样保证了停留时长任务模型能记住以前车辆停留行为的情况,以此预测下一次停留的行为。
Figure SMS_28
其中,
Figure SMS_29
为输入门,/>
Figure SMS_30
为遗忘门,/>
Figure SMS_31
为输出门,/>
Figure SMS_32
为候选内部状态,/>
Figure SMS_33
为状态单元,Wxi,Whi,Wxf,Whf,Wxo,Who,Wxc和Whc表示线性变换矩阵的权重。
停留时长任务模型使用relu函数对预测停留时长的任务进行激活,这是因为预测停留时长是一个回归问题,relu激活函数普遍情况下有着更良好的表现。relu激活函数是一个取最大值的函数。它会输出大于0的值,也就是神经元在大于0时会被激活。会抑制输出小于0 的值,在输入为负数时,会输出0。这可以使停留时长任务模型抛弃掉一部分值从而变得稀疏,有着更好的预测效果。
在预测停留地点时,由于这是一个分类问题,分类标签就是通过聚类算法对车辆轨迹数据中的车辆轨迹点进行聚类得到的地点类别,所以预测停留地点模型采用softmax激活函数。softmax激活函数的公式如下所示,通常被用于多分类问题中。softmax将每个标签的值映射到(0,1)区间,这些标签的值加起来为1,标签的值代表概率,概率最大的标签即为预测的结果。
Figure SMS_34
在预测停留时长时,预测停留时长模型采用的损失函数为均方误差(Meansquared error,MSE),MSE是真实值与预测值的差值的平方然后求和平均,公式如下:
Figure SMS_35
在预测停留地点时,预测停留地点模型采用的损失函数是交叉熵。一般情况下,描述概率值的差异情况通常使用交叉熵。当两个概率分布就接近时,交叉熵的值一般更小。计算方法如下所示:
Figure SMS_36
在本发明中,多任务深度学习模型的损失函数正是公式(6)和(7)加起来得到的结果,通过同时优化这两个损失函数,多任务深度学习模型就能同时学习停留地点预测任务与停留时长预测任务,对未来时间段内的停留行为进行预测。
如图5所示,本发明还提供了一种基于多任务学习的车辆停留行为分析与预测系统,包括数据采集终端、停留行为建模终端、多任务预测终端和用户终端:
所述数据采集终端包括车辆GPS和OBD数据采集模块和数据传输模块。所述车辆GPS(Global Positioning System, 全球定位系统)和OBD(On-Board Diagnostics, 车载诊断系统)数据采集模块主要采集由GPS和OBD组合的车辆轨迹数据,并将采集到的轨迹数据都传输到数据传输模块;所述数据传输模块即将采集到的车辆轨迹数据传输到停留行为建模终端中的数据预处理模块。所述车辆GPS和OBD数据采集模块采集到的数据包括车辆脱敏后的车辆ID、行程开始时间、开始经度、开始纬度、结束时间、结束经度和结束纬度等信息,将其车辆GPS和OBD数据统称为车辆轨迹数据,传送到数据预处理模块。
所述停留行为建模终端包括数据预处理模块和停留行为建模模块;所述数据预处理模块先接收数据传输模块所传输的车辆轨迹数据,然后车辆轨迹数据提取车辆停留行为数据,具体包括停留地点和停留时长;所述停留行为模块利用深度循环神经网络方法对预处理后的车辆停留行为进行时空特征提取,为多任务预测终端打下基础。所述数据预处理模块接受车辆轨迹数据,进行数据预处理得到车辆停留行为数据,具体包括车辆脱敏后的车辆ID、停留开始时间、停留经度、停留纬度和停留结束时间。
所述多任务预测终端包括停留地点分类模块和停留时长回归模块,该终端基于多任务学习捕捉多个任务间的相关性并对任务进行预测,基于车辆的历史停留行为和多个任务之间的相关性预测未来时间段内的停留行为。
所述用户终端包括预测结果接收模块和用户匹配模块。所述预测结果接收模块接收多任务预测终端输出的车辆停留行为预测结果,并传输给用户匹配模块。所述用户匹配模块将得到的停留行为预测结果与个人用户进行匹配,将匹配结果输出到个人用户端。
原始数据如下表1,预测结果如下表2所示。
表1:原始数据表
Figure SMS_37
原始数据如上,该数据表示车辆停留在经纬度(108.3646, 22.82886)的地点上,该地点的地点类别为12,时间是2017年6月,星期一,早上八点钟,在该地点停留了5分钟。
表2:预测结果表
Figure SMS_38
/>
从表2中的数据可以看到,预测结果有一定的误差,不过在可接受的范围内,最后一项表示的是停留时长,原始数据是5,预测到的结果是5.58。观察到数据的第三项sub_class,这一项表示的是地点标号,预测的地点分类标号为12,这代表这个地点属于地点12附近的某一点,预测的结果也是地点12,基本准确。
对多任务学习预测网络训练100次,得到的多任务学习预测网络正确结果如图6所示,可以看到,多任务学习预测网络在经历了少量的训练后正确率就趋于不变了,这是因为多任务学习预测网络的数据量过少的原因,由于多任务学习预测网络只能针对每个车辆用户进行建模,所以只能使用一辆私家车的数据。然后根据图6可以看到,多任务深度学习模型的正确率很快达到了90%以上,这是由于多任务深度学习神经网络更深,对数据拟合得更好的结果。
综上所述,本发明方法在考虑车辆的历史停留行为之外,还考虑了停留地点预测任务与停留时长预测任务间的相关性,本发明将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测,可以的对车辆停留行为的时空依赖关系进行分析,提高了停留行为预测的准确度。本发明为兴趣点推荐、个性化出行制定、定向广告投放、智慧停车等应用提供支持。
与前述基于多任务学习的车辆停留行为分析与预测方法的实施例相对应,本发明还提供了基于多任务学习的车辆停留行为分析与预测装置的实施例。
参见图7,本发明实施例提供的一种基于多任务学习的车辆停留行为分析与预测装置,包括一个或多个处理器,用于实现上述实施例中的基于多任务学习的车辆停留行为分析与预测方法。
本发明基于多任务学习的车辆停留行为分析与预测装置的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图7所示,为本发明基于多任务学习的车辆停留行为分析与预测装置所在任意具备数据处理能力的设备的一种硬件结构图,除了图7所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的基于多任务学习的车辆停留行为分析与预测方法。
所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备,例如所述设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、SD卡、闪存卡(Flash Card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (10)

1.一种基于多任务学习的车辆停留行为分析与预测方法,其特征在于,所述方法包括以下步骤:
S1,采集包括车辆脱敏后的车辆ID、行程开始时间、开始经度、开始纬度、结束时间、结束经度和结束纬度在内的车辆GPS和OBD数据;
S2,对车辆GPS和OBD数据进行预处理,得到包括停留地点和停留时长在内的车辆停留行为数据;并利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取;
S3,将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测。
2.根据权利要求1所述的基于多任务学习的车辆停留行为分析与预测方法,其特征在于,对车辆GPS和OBD数据进行预处理,得到停留时长包括:
对车辆GPS和OBD数据按开始时间进行排序;
删除前一项结束时间晚于等于后一项开始时间的车辆GPS和OBD数据,删除停止时间小于等于开始时间的车辆GPS和OBD数据,删除开始和停止地点不一致的车辆GPS和OBD数据;
将车辆GPS和OBD数据前一项的结束时间减去后一项的开始时间,即得停留时长。
3.根据权利要求1所述的基于多任务学习的车辆停留行为分析与预测方法,其特征在于,对车辆GPS和OBD数据进行预处理,得到停留地点包括:
根据用户id对车辆GPS数据和OBD数据按时间戳进行对齐与合并,按照用户id进行排序,得到车辆轨迹数据;
判断车辆轨迹数据中任意一轨迹点与其相邻的轨迹点的间距是否小于间距阈值;
若小于间距阈值,则计算两轨迹点的时间差;若时间差大于时间差阈值,且该轨迹点的速度为0,则在停留开始时间处标记该轨迹点的停留状态,直至停留结束时间处标记车辆启动,记录停留点;
获取每一用户的停留点集合;
获取所有用户的停留点集合。
4.根据权利要求1所述的基于多任务学习的车辆停留行为分析与预测方法,其特征在于,利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取包括:
将车辆停留行为数据按时间间隔划分为若干层次的车辆停留行为数据;
通过第一层次循环神经网络处理某一层次的车辆停留行为数据;
通过第二层次循环神经网络处理层次间的车辆停留行为数据;
将车辆停留行为数据在第一层次循环神经网络和第二层次循环神经网络间进行变换,实现对车辆停留行为数据进行编码,得到时空特征。
5.根据权利要求4所述的基于多任务学习的车辆停留行为分析与预测方法,其特征在于,通过第一层次循环神经网络处理某一层次的车辆停留行为数据包括:
Figure QLYQS_1
其中,⊕表示将向量拼接,
Figure QLYQS_2
为用户车辆停留地点的经度,/>
Figure QLYQS_3
为用户车辆停留地点的维度,/>
Figure QLYQS_4
表示第/>
Figure QLYQS_5
次迭代第一层次循环神经网络的运行状态表示;
通过第二层次循环神经网络处理层次间的车辆停留行为数据包括:
Figure QLYQS_6
其中,eu表示唯一标识用户id的向量信息,hn表示由第一层次循环神经网络迭代后得到的隐藏状态信息,
Figure QLYQS_7
表示第/>
Figure QLYQS_8
次迭代第二层次循环神经网络的运行状态表示。
6.根据权利要求1所述的基于多任务学习的车辆停留行为分析与预测方法,其特征在于,将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测包括:
将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为基于长短期记忆网络分别构建停留地点任务模型和停留时长任务模型,通过多任务学习预测网络使停留地点任务模型和停留时长任务模型同时学习,挖掘停留地点预测任务与停留时长预测任务间的相关性,预测得到未来时间段内的停留地点和停留时长;
其中,多任务学习的过程包括:选用relu函数作为激活函数,采用均方误差函数作为预测停留时长的损失函数,采用交叉熵函数作为预测停留地点的损失函数;多任务深度学习网络的损失函数为均方误差函数和交叉熵函数之和,对均方误差函数和交叉熵函数同时优化,学习预测得到未来时间段内的停留地点和停留时长。
7.一种基于多任务学习的车辆停留行为分析与预测系统,其特征在于,包括:
数据采集模块,采集包括车辆脱敏后的车辆ID、行程开始时间、开始经度、开始纬度、结束时间、结束经度和结束纬度在内的车辆GPS和OBD数据;
车辆停留行为数据获取模块,对车辆GPS和OBD数据进行预处理,得到包括停留地点和停留时长在内的车辆停留行为数据;并利用深度循环神经网络对预处理后的车辆停留行为进行时空特征提取;
多任务学习预测模块,将时空特征输入多任务学习预测网络中,基于车辆的历史停留行为通过多任务学习预测网络获取停留地点预测任务与停留时长预测任务间的相关性,以对停留地点与停留时长进行预测。
8.根据权利要求7所述的基于多任务学习的车辆停留行为分析与预测系统,其特征在于,还包括:
用户终端,包括预测结果接收模块和用户匹配模块;
预测结果接收模块,接收多任务学习预测模块输出的车辆停留行为预测结果,并传输给用户匹配模块;
用户匹配模块,将停留行为预测结果与用户进行匹配,将匹配结果反馈至用户。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述权利要求1-6任一项所述的基于多任务学习的车辆停留行为分析与预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的基于多任务学习的车辆停留行为分析与预测方法。
CN202310417213.3A 2023-04-19 2023-04-19 基于多任务学习的车辆停留行为分析与预测方法、系统 Active CN116151489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310417213.3A CN116151489B (zh) 2023-04-19 2023-04-19 基于多任务学习的车辆停留行为分析与预测方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310417213.3A CN116151489B (zh) 2023-04-19 2023-04-19 基于多任务学习的车辆停留行为分析与预测方法、系统

Publications (2)

Publication Number Publication Date
CN116151489A true CN116151489A (zh) 2023-05-23
CN116151489B CN116151489B (zh) 2023-07-21

Family

ID=86362137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310417213.3A Active CN116151489B (zh) 2023-04-19 2023-04-19 基于多任务学习的车辆停留行为分析与预测方法、系统

Country Status (1)

Country Link
CN (1) CN116151489B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040032342A1 (en) * 2002-08-14 2004-02-19 Dunning Anne E. Method and system for projecting dynamic parking availability based on an ongoing survey for remote lots with high demand
CN105608889A (zh) * 2015-09-07 2016-05-25 华迪计算机集团有限公司 一种车辆停留分析方法
CN110555990A (zh) * 2019-08-29 2019-12-10 桂林电子科技大学 一种基于lstm神经网络的有效停车时空资源预测方法
CN112529284A (zh) * 2020-12-08 2021-03-19 湖南大学 基于神经网络的私家车停留时间预测方法、设备及介质
CN112862177A (zh) * 2021-02-02 2021-05-28 湖南大学 一种基于深度神经网络的城市区域聚集度预测方法、设备及介质
CN112967493A (zh) * 2021-01-16 2021-06-15 北京工业大学 一种基于神经网络的车辆通过交叉口行程时间的预测方法
CN113470352A (zh) * 2021-06-17 2021-10-01 之江实验室 一种基于多任务学习的交通大数据分析与预测系统及方法
CN113723646A (zh) * 2021-09-06 2021-11-30 宁波小遛共享信息科技有限公司 车辆停放方法、装置及终端设备
CN113780665A (zh) * 2021-09-15 2021-12-10 湖南大学 一种基于增强循环神经网络的私家车停留位置预测方法和系统
CN113938817A (zh) * 2021-09-10 2022-01-14 哈尔滨工业大学(威海) 一种基于车辆位置信息的车主出行位置预测方法
CN114333094A (zh) * 2021-12-31 2022-04-12 宁波小遛共享信息科技有限公司 车辆调度方法、装置、终端设备及介质
CN114802296A (zh) * 2022-03-17 2022-07-29 浙江工业大学 一种基于动态交互图卷积的车辆轨迹预测方法
CN115062713A (zh) * 2022-06-24 2022-09-16 中国矿业大学 一种基于gcn-gru的露天矿卡车停留区域活动识别方法
CN115083161A (zh) * 2022-06-15 2022-09-20 平安国际融资租赁有限公司 车辆停留点的评估方法、装置、电子设备及可读存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040032342A1 (en) * 2002-08-14 2004-02-19 Dunning Anne E. Method and system for projecting dynamic parking availability based on an ongoing survey for remote lots with high demand
CN105608889A (zh) * 2015-09-07 2016-05-25 华迪计算机集团有限公司 一种车辆停留分析方法
CN110555990A (zh) * 2019-08-29 2019-12-10 桂林电子科技大学 一种基于lstm神经网络的有效停车时空资源预测方法
CN112529284A (zh) * 2020-12-08 2021-03-19 湖南大学 基于神经网络的私家车停留时间预测方法、设备及介质
CN112967493A (zh) * 2021-01-16 2021-06-15 北京工业大学 一种基于神经网络的车辆通过交叉口行程时间的预测方法
CN112862177A (zh) * 2021-02-02 2021-05-28 湖南大学 一种基于深度神经网络的城市区域聚集度预测方法、设备及介质
CN113470352A (zh) * 2021-06-17 2021-10-01 之江实验室 一种基于多任务学习的交通大数据分析与预测系统及方法
CN113723646A (zh) * 2021-09-06 2021-11-30 宁波小遛共享信息科技有限公司 车辆停放方法、装置及终端设备
CN113938817A (zh) * 2021-09-10 2022-01-14 哈尔滨工业大学(威海) 一种基于车辆位置信息的车主出行位置预测方法
CN113780665A (zh) * 2021-09-15 2021-12-10 湖南大学 一种基于增强循环神经网络的私家车停留位置预测方法和系统
CN114333094A (zh) * 2021-12-31 2022-04-12 宁波小遛共享信息科技有限公司 车辆调度方法、装置、终端设备及介质
CN114802296A (zh) * 2022-03-17 2022-07-29 浙江工业大学 一种基于动态交互图卷积的车辆轨迹预测方法
CN115083161A (zh) * 2022-06-15 2022-09-20 平安国际融资租赁有限公司 车辆停留点的评估方法、装置、电子设备及可读存储介质
CN115062713A (zh) * 2022-06-24 2022-09-16 中国矿业大学 一种基于gcn-gru的露天矿卡车停留区域活动识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曾展秀: "群智迁移研究及其在智慧停车场景下的应用", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》, no. 4 *
陈慧玲: "基于语义感知的私家车出行行为预测研究", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》, no. 9 *

Also Published As

Publication number Publication date
CN116151489B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
Du et al. Deep irregular convolutional residual LSTM for urban traffic passenger flows prediction
Wang et al. Learning to estimate the travel time
Yan et al. Semantic trajectories: Mobility data computation and annotation
CN109035761B (zh) 基于辅助监督学习的行程时间估计方法
CN107977734B (zh) 一种时空大数据下基于移动马尔可夫模型的预测方法
Sari Aslam et al. A high-precision heuristic model to detect home and work locations from smart card data
CN108632097A (zh) 异常行为对象的识别方法、终端设备及介质
CN108986453A (zh) 一种基于情境信息的交通状况预测方法、系统及装置
Chen et al. CEM: A convolutional embedding model for predicting next locations
CN107230108A (zh) 业务数据的处理方法及装置
Ren et al. St-siamesenet: Spatio-temporal siamese networks for human mobility signature identification
Yi et al. Citytraffic: Modeling citywide traffic via neural memorization and generalization approach
CN114418175A (zh) 一种人员管理方法、装置、电子设备及存储介质
CN115827974A (zh) 基于时空信息表示的下一兴趣点推荐系统
Bermingham et al. Mining place-matching patterns from spatio-temporal trajectories using complex real-world places
CN115062713A (zh) 一种基于gcn-gru的露天矿卡车停留区域活动识别方法
Yu et al. Using information entropy and a multi-layer neural network with trajectory data to identify transportation modes
Baral et al. CAPS: Context aware personalized POI sequence recommender system
CN116151489B (zh) 基于多任务学习的车辆停留行为分析与预测方法、系统
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
Buroni et al. A tutorial on network-wide multi-horizon traffic forecasting with deep learning.
CN114398462B (zh) 一种基于多源异构信息网络的目的地推荐方法及系统
Xu et al. MM-UrbanFAC: Urban functional area classification model based on multimodal machine learning
Liu et al. Real-time return demand prediction based on multisource data of one-way carsharing systems
Seneviratne et al. Urban feature analysis from aerial remote sensing imagery using self-supervised and semi-supervised computer vision

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant