CN111524354B - 基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备 - Google Patents
基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备 Download PDFInfo
- Publication number
- CN111524354B CN111524354B CN202010355985.5A CN202010355985A CN111524354B CN 111524354 B CN111524354 B CN 111524354B CN 202010355985 A CN202010355985 A CN 202010355985A CN 111524354 B CN111524354 B CN 111524354B
- Authority
- CN
- China
- Prior art keywords
- path
- time
- probability distribution
- traffic
- language model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000009826 distribution Methods 0.000 claims abstract description 187
- 230000006399 behavior Effects 0.000 claims abstract description 31
- 238000009499 grossing Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 55
- 238000004590 computer program Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 238000012216 screening Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0108—Measuring and analyzing of parameters relative to traffic conditions based on the source of data
- G08G1/0112—Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备,基于实证数据,通过地图匹配算法得到出行者的真实路径选择行为,在路径筛选后,得到路径流量分布的时间序列,利用平滑处理后的n阶语言模型预测路径流量分布的时变特性并检验效果,本发明能为出行者提供全局出行行为信息,方便出行者根据他人的出行行为调整自身路径,达到缓解交通拥堵的目的。与基于路段流量分布进行预测的方法相比,本发明能够获得拥堵源头信息。
Description
技术领域
本发明属于交通技术领域,特别涉及一种基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备。
背景技术
随着科技社会的发展和居民生活水平的提高,城市交通拥堵问题的影响范围不断扩大。交通拥堵不仅使居民出行时间增加,还会消耗大量燃料,排放污染气体,在影响出行体验的同时更造成资源浪费和环境破坏。如何更好地认识交通拥堵,更好地把握居民出行的潜在规律,对节约资源和保护环境都有重要意义。虽然宏观上交通拥堵是由城市各区域出行需求不断增长引起的,但在微观上,出行者选择的出行路径也对交通拥堵的范围和程度有决定性影响。如果出行者能够掌握全局的路径选择行为,则可通过适当调整自身出行路径规避拥堵路段,达到缓解城市交通拥堵的目的。当前对路径选择行为的认识主要通过对路径选择过程建模、优化路径选择策略、基于历史数据确定路段流量等。
但是,现有的交通网络路径选择预测存在如下的问题:
1)基于路段流量分布进行预测,仅能得到发生交通拥堵路段的时间窗,而无法得到拥堵的源头,对交通管理措施的制定和实施帮助较小。
2)基于模拟仿真研究路径选择行为,难以反映出行者的实际路径选择行为,对交通拥堵疏导策略的制定缺乏实际指导作用。
3)基于传统的交通调查研究路径选择行为,不仅成本高,而且覆盖范围小,更重要的是难以反映出行者路径选择的时变特征。
综上所述,目前的路径选择预测方法仍有很多不足,即或研究路段流量分布,无法得知拥堵源头,或基于模拟仿真、交通调查等方法预测路径选择行为,难以反映实际情况。随着大数据时代的到来,数据的获取更为容易,数据存储的信息也更为丰富和精确,因此有必要设计一种新的路径选择预测方法。
发明内容
本发明所解决的技术问题是,针对现有技术的不足,提供一种基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备,基于实际的交通出行数据,预测城市交通网络中路径流量分布,通过调整出行者出行路径,有效缓解交通拥堵,可行性和实用性高。
本发明所述的技术方案如下:
一方面,一种基于语言模型的城市交通网络路径选择行为的预测方法,包括:
步骤1:构建目标城市道路交通网络;
依据目标城市交通网络拓扑关系图,连接城市交通中的路口对应的节点和节点之间的路段形成有向边;
步骤2:获取目标城市在指定D天内的浮动车行驶数据,并对每辆浮动车的行驶数据按照采集时间先后顺序排序;
所述行驶数据包括采集时间t、浮动车车牌号plate、载客状态s、浮动车所处的经度坐标lng、纬度坐标lat;
步骤3:将浮动车行驶数据按照经度和纬度坐标与目标城市道路交通网络匹配,获得以交叉路口对应的节点编号表示的浮动车轨迹点序列,提取有乘客时的浮动车轨迹路径;
步骤4:对指定D天进行时间窗划分,从浮动车轨迹路径中提取在指定时间窗中,经过指定起点O和终点D的浮动车目标点路径,获得每个时间窗的浮动车目标点路径集合;
步骤6:将所有已知时间窗的OD间的路径流量概率分布的时间序列作为训练数据计算n 阶语言模型的条件概率,训练n阶语言模型;
步骤7:进行预测时,将时间窗T-n+1至时间窗T-1的OD间路径流量概率分布的时间序列输入到训练好的n阶语言模型中,得到目标时间窗T的路径流量概率分布。
预测得到的是在下个时间窗里面,每条路径被选中的概率,就是说每条路径被浮动车经过的概率;
随着阶数n的增大,训练语言模型所需的数据和时间呈指数级增长,且当n≥4时,阶数n越高并不意味着模型的效果会越好,因此无论在科学研究或工程运用中,普遍采用的是2阶或 3阶语言模型;
要训练n阶语言模型,需要获取两个序列,一个是路径流量分布训练序列 表示在阶数为n时,由需要预测的时间窗(时间窗t)和用于预测的时间窗(时间窗t-t0+1到时间窗t)的路径流量概率分布构成的时间子序列;另一个是路径流量分布历史序列表示在阶数为n时,由用于预测的时间窗(时间窗t-t0+1到时间窗t)的路径流量概率分布构成的时间子序列。
进一步地,所述n阶语言模型的训练过程如下:
表示在阶数为n时,从时间窗t-t0+1到时间窗t-1的路径流量概率分布构成的时间子序列;t0≤t≤Ntrain,t0表示可用于训练的最小时间窗,与阶数n的取值相同,Ntrain表示训练数据中时间窗的总数;
其中为中路径流量概率分布时间子序列为的个数;表示在前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗的路径流量的概率分布为第k类概率分布;0≤k≤kmax,其中kmax为前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗路径流量的概率分布类别总数;
在现实场景中,对于n≥2的语言模型,预测集中都可能存在训练数据中未出现的时间子序列,本专利利用低阶语言模型对高阶语言模型平滑处理的方法解决这一问题;要预测nmax阶语言模型的条件概率时,需要分别计算1阶,2阶直至nmax阶语言模型的条件概率;
进一步地,所述n的取值大于或等于2。
进一步地,OD间路径流量概率分布的时间序列获取过程如下:
进一步地,用以训练n阶语言模型条件概率的时间窗为所有历史时间窗的前70%。
另一方面,一种基于语言模型的城市交通网络路径选择行为的预测系统,包括:
目标城市道路交通网络构建模块,依据目标城市交通网络拓扑关系图,连接城市交通中的路口对应的节点和节点之间的路段形成有向边;
浮动车行驶数据采集与排序模块,用于获取目标城市在指定D天内的浮动车行驶数据,并对每辆浮动车的行驶数据按照采集时间先后顺序排序;
所述行驶数据包括采集时间t、浮动车车牌号plate、载客状态s、浮动车所处的经度坐标lng、纬度坐标lat;
浮动车轨迹路径提取模块,用于将浮动车行驶数据按照经度和纬度坐标与目标城市道路交通网络匹配,获得以交叉路口对应的节点编号表示的浮动车轨迹点序列,提取有乘客时的浮动车轨迹路径;
浮动车目标点路径集合获取模块,用于对指定D天进行时间窗划分,从浮动车轨迹路径中提取在指定时间窗中,经过指定起点O和终点D的浮动车目标点路径,获得每个时间窗的浮动车目标点路径集合;
n阶语言模型训练模块,用于将所有已知时间窗的OD间的路径流量概率分布的时间序列作为训练数据计算n阶语言模型的条件概率,训练n阶语言模型;
预测模块,用于将时间窗T-n+1至时间窗T-1中的OD间的路径流量概率分布的时间序列输入到训练好的n阶语言模型中,得到下一个时间窗T的路径流量概率分布。
另一方面,所述n阶语言模型的训练模块采用如下单元对n阶语言模型进行训练:
表示在阶数为n时,从时间窗t-t0+1到时间窗t-1中的路径流量概率分布构成的时间子序列;t0≤t≤Ntrain,t0表示可用于训练的最小时间窗,与阶数n的取值相同,Ntrain表示训练数据中时间窗的总数;
其中为中路径流量概率分布时间子序列为的个数;表示在前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗的路径流量的概率分布为第k类概率分布;0≤k≤kmax,其中kmax为前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗路径流量的概率分布类别总数;
另一方面,一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述基于语言模型的城市交通网络路径选择行为的预测方法。
另一方面,一种基于语言模型的城市交通网络路径选择行为的预测设备,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述基于语言模型的城市交通网络路径选择行为的预测设备执行所述基于语言模型的城市交通网络路径选择行为的预测方法。
有益效果
本发明技术方案提供了一种基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备,不同于以往的建模仿真和交通调查,本发明基于实证数据,通过地图匹配算法得到出行者的真实路径选择行为,在路径筛选后,得到路径流量分布的时间序列,进一步利用平滑处理后的n阶语言模型预测路径流量分布的时变特性并检验效果,本发明能为出行者提供全局出行行为信息,方便出行者根据他人的出行行为调整自身路径,达到缓解交通拥堵的目的。与基于路段流量分布进行预测的方法相比,本发明能够获得拥堵源头信息。
附图说明
图1为本发明流程示意图;
图2为从出租车轨迹点数据提取出行时间序列的示意图;
图3为根据出行时间序列计算路径流量分布时间序列的示意图;
图4为根据OD对间的路径流量分布时间序列得到2阶语言模型的条件概率的示意图;
图5为深圳市罗湖区路径流量分布的预测准确率分布。
具体实施方式
下面将结合附图和实例对本发明做进一步地说明。
n阶语言模型是自然语言处理领域常用的根据已知信息推测未知信息的概率模型,该模型在机器翻译、语音识别等领域效果显著;由于时间序列中同样存在已知信息(已发生事件或训练集)和未知信息(未发生事件或测试集),因此也被广泛用于时序预测;在本方案中,n阶语言模型用于在给定前序n-1个时间窗(时间窗t-n+1至时间窗t-1)对应的路径流量概率分布(ωt-n+1,…,ωt-1)时,预测时间窗t对应的路径流量概率分布ωt;
在现实出行应用场景中,通常取每一小时作为一个时间窗,对任意OD,出行者在前几个小时的实际出行数据(即用户出行的起点、终点、出行时间和选择的路径等)便构成了一个时间子序列,由时间子序列可计算出时间窗t-n+1至时间窗t-1对应的路径流量概率分布 (ωt-n+1,…,ωt-1),进而预测下一个时间窗t对应的路径流量概率分布ωt;其潜在应用包括至少三个方面:对于高德地图等导航软件,可以根据软件用户前几个小时的实际出行数据,预测未来一个小时OD对间各条路径的选择概率,从而给用户出行提供建议;对于用户,则可根据自身情况,结合软件给出的出行建议,自主选择适合的出行路径;对于城市管理者,则可以根据长期的出行规律,确定途径拥堵路段的车辆的来源,从而为拥堵疏解决策提供支持,同时也有助于确定城市建设方案,如在用户选择概率大的路径上安装摄像机以监控交通流量等。
本发明实例提供了一种基于语言模型的城市交通网络路径选择行为的预测方法,实现的具体步骤如图1所示。本实例使用了深圳市罗湖区2014年10月1日至2014年10月31日的出租车GPS数据。具体实施方式包括以下步骤:
步骤一:提取深圳市交通网络拓扑关系,构建罗湖区道路交通网络;
对深圳市罗湖区道路交通网络进行建模,构建罗湖区道路交通网络;所述的道路交通网络由节点和节点间的有向边组成,所述有向边是指路段,所述节点是指作为路段与路段分界点的交叉口;深圳市罗湖区的道路交通网络共包括节点1125个,路段1711条。
步骤二:获取罗湖区31天的出租车GPS数据,并对每辆出租车的行驶数据按照采集时间先后顺序排序;
所述行驶数据包括采集时间t、出租车车牌号plate、载客状态s、出租车所处的经度坐标lng、纬度坐标lat;
出租车的GPS数据可表示为:
步骤三:基于地图匹配算法将出租车行驶轨迹数据按照GPS坐标与罗湖区道路交通网络相匹配,获得以交叉路口对应的节点编号表示的出租车轨迹点序列;如图2所示,筛选出车上有乘客时(即出租车GPS数据中载客状态s=1时)的轨迹点,舍弃车上无乘客时(即出租车GPS数据中载客状态s=0时)的轨迹点,据此提取有乘客时的出租车轨迹路径,第i条路径可表示为其中为路径i中的第k个交叉口,m为路径i包含的交叉口数;
步骤四:以每一小时为一个时间窗,本实例的研究周期2014年10月1日至2014年10月31日共有24(小时/天)×31(天)×1(时间窗/小时)=744个时间窗;对起点为交叉口O,终点为交叉口D的出行对OD,从出租车轨迹路径中提取包含所研究OD对的路径集 此即为OD对间的出行时间序列;其中NOD为研究周期内包含所研究OD对的路径总数;对SOD所有的路径Vi中的节点进行筛选,得到调整后的路径集S′OD=(V′1,…,V′i,…,V′OD),使V′i中的第一个点最后一个点进一步地,以时间窗为单位,按照出租车经过交叉口O的时间将S′OD中的各路径分别划分至各时间窗t对应的路径集中,获得每个时间窗的出租车目标点路径集合;注意到S′OD为的并集;
5.2)计算时间窗t内所有路径的频率NOD表示OD对间的路径种类数,以此作为时间窗t对应的路径流量概率分布;进一步得到OD对间路径流量概率分布的时间序列(ω1,ω2,…,ω744),如图3所示;其中路径k的频率的计算公式如下:
所述OD对间路径流量分布的时间序列可表示为:
步骤六:将步骤五得到的路径流量概率分布的时间序列中前70%的路径流量概率分布(即 (ω1,…,ω520))作为训练数据ωtrain用以计算n阶语言模型的条件概率,训练n阶语言模型,本实例以(ω1,…,ω6)为例展示2阶语言模型的处理过程,具体步骤如下:
步骤6.2)统计路径流量分布训练序列和路径流量分布历序列中各类时间子序列的个数和其中中包含三种不同的即({0.5,0.4,0.1},{0.7,0.2,0.1}), ({0.7,0.2,0.1},{0.5,0.4,0.1})和({0.5,0.4,0.1},{0.6,0.3,0.1}),因此中的i=1,2,3;中包含两种不同的即({0.5,0.4,0.1})和({0.7,0.2,0.1}),因此中的 i=1,2;
其中为中路径流量概率分布时间子序列为的个数;表示在前序1个时间窗的路径流量概率分布时间子序列为时,当前时间窗的路径流量的概率分布为第k类概率分布;1≤k≤kmax,其中kmax为前序1个时间窗的路径流量概率分布时间子序列为时,当前时间窗路径流量的概率分布类别总数;以为例,首先筛选出中(ωt-1)=({0.5,0.4,0.1})的共有3个,其对应的共有{0.7,0.2,0.1}和{0.6,0.3,0.1}两种情况,即因此kmax=2,从而对于前序1个时间窗的路径流量概率分布时间子序列为只需计算和即可;
步骤6.4)本实例以2阶语言模型为例,因此平滑处理需要计算阶数n≤2的所有语言模型,即1阶和2阶语言模型;2阶语言模型已在步骤6.3)中计算,1阶语言模型的计算方法如下:
图4为通过上述步骤根据OD对间的路径流量分布得到2阶语言模型的条件概率的示意图。
步骤七:将步骤五得到的路径流量概率分布时间序列中最后30%的路径流量概率分布(即 (ω521,…,ω744))作为测试数据ωpredict,用步骤六中训练好的2阶语言模型对测试数据ωpredict进行预测并验证结果,具体步骤如下:
7.1)对测试集中时间窗t≥523的所有路径流量概率分布,根据路径流量概率分布时间序列(ω521,…,ω744)中时间窗t-1的路径流量概率分布计算所有可能的对应的条件概率并得到时间窗t的路径流量概率分布的预测结果 的计算方法为:
7.2)计算预测结果的准确性,其计算公式为:
图5为深圳市罗湖区路径流量概率分布的预测准确率分布。基于31天的出租车GPS数据,通过2阶语言模型能够准确预测40%的路径流量概率分布,且预测不完全准确的路径流量分布也多与实际情况相差不超过0.1,表明所用的语言模型能够有效预测路径流量分布,提供全局的路径选择行为,为出行者出行路径选择提供有益参考,进而缓解交通拥堵。
基于上述方法,本发明实施例还提供一种基于语言模型的城市交通网络路径选择行为的预测系统,包括:
目标城市道路交通网络构建模块,依据目标城市交通网络拓扑关系图,连接城市交通中的路口对应的节点和节点之间的路段形成有向边;
浮动车行驶数据采集与排序模块,用于获取目标城市在指定D天内的浮动车行驶数据,并对每辆浮动车的行驶数据按照采集时间先后顺序排序;
所述行驶数据包括采集时间t、浮动车车牌号plate、载客状态s、浮动车所处的经度坐标lng、纬度坐标lat;
浮动车轨迹路径提取模块,用于将浮动车行驶数据按照经度和纬度坐标与目标城市道路交通网络匹配,获得以交叉路口对应的节点编号表示的浮动车轨迹点序列,提取有乘客时的浮动车轨迹路径;
浮动车目标点路径集合获取模块,用于对指定D天进行时间窗划分,从浮动车轨迹路径中提取在指定时间窗中,经过指定起点O和终点D的浮动车目标点路径,获得每个时间窗的浮动车目标点路径集合;
n阶语言模型训练模块,用于将所有已知时间窗的OD间的路径流量概率分布的时间序列作为训练数据计算n阶语言模型的条件概率,训练n阶语言模型;
预测模块,用于将时间窗T-n+1至时间窗T-1中的OD间的路径流量概率分布的时间序列输入到训练好的n阶语言模型中,得到下一个时间窗T的路径流量概率分布。
应当理解,本发明各个实施例中的功能单元模块可以集中在一个处理单元中,也可以是各个单元模块单独物理存在,也可以是两个或两个以上的单元模块集成在一个单元模块中,可以采用硬件或软件的形式来实现。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述基于语言模型的城市交通网络路径选择行为的预测方法,其有益效果参见方法部分的有益效果,在此不再赘述。
本发明实施例还提供一种基于语言模型的城市交通网络路径选择行为的预测设备,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述基于语言模型的城市交通网络路径选择行为的预测设备执行所述基于语言模型的城市交通网络路径选择行为的预测方法,其有益效果参见方法部分的有益效果,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和 /或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (8)
1.一种基于语言模型的城市交通网络路径选择行为的预测方法,其特征在于,包括:
步骤1:构建目标城市道路交通网络;
步骤2:获取目标城市在指定D天内的浮动车行驶数据,并对每辆浮动车的行驶数据按照采集时间先后顺序排序;
所述行驶数据包括采集时间t、浮动车车牌号plate、载客状态s、浮动车所处的经度坐标lng、纬度坐标lat;
步骤3:将浮动车行驶数据按照经度和纬度坐标与目标城市道路交通网络匹配,获得以交叉路口对应的节点编号表示的浮动车轨迹点序列,提取有乘客时的浮动车轨迹路径;
步骤4:对指定D天进行时间窗划分,从浮动车轨迹路径中提取在指定时间窗中,经过指定起点O和终点D的浮动车目标点路径,获得每个时间窗的浮动车目标点路径集合;
步骤6:将所有已知时间窗的OD间的路径流量概率分布的时间序列作为训练数据计算n阶语言模型的条件概率,训练n阶语言模型;
步骤7:进行预测时,将时间窗T-n+1至时间窗T-1的OD间路径流量概率分布的时间序列输入到训练好的n阶语言模型中,得到目标时间窗T的路径流量概率分布;
所述n阶语言模型的训练过程如下:
表示在阶数为n时,从时间窗t-t0+1到时间窗t-1的路径流量概率分布构成的时间子序列;t0≤t≤Ntrain,t0表示可用于训练的最小时间窗,与阶数n的取值相同,Ntrain表示训练数据中时间窗的总数;
其中为中路径流量概率分布时间子序列为的个数;表示在前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗的路径流量的概率分布为第k类概率分布;0≤k≤kmax,其中kmax为前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗路径流量的概率分布类别总数;
3.根据权利要求2所述的方法,其特征在于,所述n的取值大于或等于2。
5.根据权利要求4所述的方法,其特征在于,用以训练n阶语言模型条件概率的时间窗为所有历史时间窗的前70%。
6.一种基于语言模型的城市交通网络路径选择行为的预测系统,其特征在于,包括:
目标城市道路交通网络构建模块,依据目标城市交通网络拓扑关系图,连接城市交通中的路口对应的节点和节点之间的路段形成有向边;
浮动车行驶数据采集与排序模块,用于获取目标城市在指定D天内的浮动车行驶数据,并对每辆浮动车的行驶数据按照采集时间先后顺序排序;
所述行驶数据包括采集时间t、浮动车车牌号plate、载客状态s、浮动车所处的经度坐标lng、纬度坐标lat;
浮动车轨迹路径提取模块,用于将浮动车行驶数据按照经度和纬度坐标与目标城市道路交通网络匹配,获得以交叉路口对应的节点编号表示的浮动车轨迹点序列,提取有乘客时的浮动车轨迹路径;
浮动车目标点路径集合获取模块,用于对指定D天进行时间窗划分,从浮动车轨迹路径中提取在指定时间窗中,经过指定起点O和终点D的浮动车目标点路径,获得每个时间窗的浮动车目标点路径集合;
n阶语言模型训练模块,用于将所有已知时间窗的OD间的路径流量概率分布的时间序列作为训练数据计算n阶语言模型的条件概率,训练n阶语言模型;
预测模块,用于将时间窗T-n+1至时间窗T-1中的OD间的路径流量概率分布的时间序列输入到训练好的n阶语言模型中,得到下一个时间窗T的路径流量概率分布;
所述n阶语言模型的训练模块采用如下单元对n阶语言模型进行训练:
表示在阶数为n时,从时间窗t-t0+1到时间窗t-1中的路径流量概率分布构成的时间子序列;t0≤t≤Ntrain,t0表示可用于训练的最小时间窗,与阶数n的取值相同,Ntrain表示训练数据中时间窗的总数;
其中为中路径流量概率分布时间子序列为的个数;表示在前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗的路径流量的概率分布为第k类概率分布;0≤k≤kmax,其中kmax为前序n-1个时间窗的路径流量概率分布时间子序列为时,当前时间窗路径流量的概率分布类别总数;
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5中任一项所述基于语言模型的城市交通网络路径选择行为的预测方法。
8.一种基于语言模型的城市交通网络路径选择行为的预测设备,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述基于语言模型的城市交通网络路径选择行为的预测设备执行如权利要求1至5中任一项所述基于语言模型的城市交通网络路径选择行为的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010355985.5A CN111524354B (zh) | 2020-04-29 | 2020-04-29 | 基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010355985.5A CN111524354B (zh) | 2020-04-29 | 2020-04-29 | 基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111524354A CN111524354A (zh) | 2020-08-11 |
CN111524354B true CN111524354B (zh) | 2021-02-05 |
Family
ID=71904964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010355985.5A Active CN111524354B (zh) | 2020-04-29 | 2020-04-29 | 基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111524354B (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101373559B (zh) * | 2007-08-24 | 2010-08-18 | 同济大学 | 基于浮动车数据评估城市路网交通状态的方法 |
US20130110499A1 (en) * | 2011-10-27 | 2013-05-02 | Casio Computer Co., Ltd. | Information processing device, information processing method and information recording medium |
CN103646560B (zh) * | 2013-11-27 | 2015-12-02 | 福建工程学院 | 出租车行车轨迹经验知识路径的提取方法 |
CN103942953A (zh) * | 2014-03-13 | 2014-07-23 | 华南理工大学 | 一种基于浮动车数据的城市路网动态交通拥挤预测方法 |
CN105575113A (zh) * | 2015-12-14 | 2016-05-11 | 清华大学 | 一种交通运行状态感知方法 |
CN108718306B (zh) * | 2018-05-10 | 2020-09-01 | 北京邮电大学 | 一种异常流量行为判别方法和装置 |
CN110555992B (zh) * | 2019-09-11 | 2021-05-28 | 中国矿业大学(北京) | 一种基于gps轨迹数据的出租车行驶路径信息提取方法 |
-
2020
- 2020-04-29 CN CN202010355985.5A patent/CN111524354B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111524354A (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038478B (zh) | 路况预测方法及装置、计算机设备与可读介质 | |
Ma et al. | Multi-lane short-term traffic forecasting with convolutional LSTM network | |
CN111696355A (zh) | 动态图卷积交通速度预测方法 | |
CN109377752A (zh) | 短时交通流变化预测方法、装置、计算机设备及存储介质 | |
KR20200023697A (ko) | 교통상태정보를 예측하는 장치, 교통상태정보를 예측하는 방법 및 교통상태정보를 예측하는 프로그램을 저장하는 저장매체 | |
CN112242060B (zh) | 交通流量预测方法及装置、计算机设备及可读存储介质 | |
Echenique | Models: a discussion | |
CN114881356A (zh) | 基于粒子群算法优化bp神经网络的城市交通碳排预测方法 | |
CN115457766B (zh) | 一种用于预测道路拥堵状态的方法及系统 | |
CN110021161B (zh) | 一种交通流向的预测方法及系统 | |
CN112907970A (zh) | 一种基于车辆排队长度变化率的可变车道转向控制方法 | |
Kalair et al. | Dynamic and interpretable hazard-based models of traffic incident durations | |
CN114996659A (zh) | 一种具有持续学习能力的车辆轨迹预测方法及系统 | |
CN117671979B (zh) | 一种基于知识图谱的智慧城市数据管理系统与方法 | |
CN111260927A (zh) | 一种公路路网流量预测方法 | |
CN117272849B (zh) | 区域停车场饱和度的预测方法、系统及可读存储介质 | |
CN111524354B (zh) | 基于语言模型的城市交通网络路径选择行为的预测方法、系统、介质及设备 | |
Treboux et al. | A predictive data-driven model for traffic-jams forecasting in smart santader city-scale testbed | |
CN115691140B (zh) | 一种汽车充电需求时空分布的分析与预测方法 | |
CN116989801A (zh) | 一种面向复杂路网低频长轨迹的地图匹配方法及装置 | |
CN113344239B (zh) | 一种基于两级谱聚类的交通拥堵状况预测方法及系统 | |
CN112785044B (zh) | 公共交通工具的实时满载率预测方法、装置、设备和介质 | |
Gamarra et al. | Deep learning for traffic prediction with an application to traffic lights optimization | |
CN112634620B (zh) | 基于Encoder-Decoder深度神经网络的路网动态交通分配方法 | |
Bowman et al. | Microscopic Vehicular Traffic Simulation: Comparison of Calibration Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |