CN106910199B - 面向城市空间信息采集的车联网众包方法 - Google Patents

面向城市空间信息采集的车联网众包方法 Download PDF

Info

Publication number
CN106910199B
CN106910199B CN201710058021.2A CN201710058021A CN106910199B CN 106910199 B CN106910199 B CN 106910199B CN 201710058021 A CN201710058021 A CN 201710058021A CN 106910199 B CN106910199 B CN 106910199B
Authority
CN
China
Prior art keywords
vehicle
place
indicate
tensor
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710058021.2A
Other languages
English (en)
Other versions
CN106910199A (zh
Inventor
礼欣
周猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201710058021.2A priority Critical patent/CN106910199B/zh
Publication of CN106910199A publication Critical patent/CN106910199A/zh
Application granted granted Critical
Publication of CN106910199B publication Critical patent/CN106910199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • H04W4/046
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/18Self-organising networks, e.g. ad-hoc networks or sensor networks

Abstract

本发明涉及一种面向城市空间信息采集的车联网众包方法,属于车载自组织网络技术领域;本发明利用轨迹预测算法挖掘车辆行驶习惯,根据车辆行驶习惯选择特定车辆执行任务,在不影响车辆正常行驶的情况下完成相关任务信息的收集。本发明提出基于张量分解的地点预测算法,根据历史轨迹数据构建三元组,根据三元组构建三阶张量,通过PITF方式对张量依据BPRC规范进行分解,迭代优化参数补全张量元素,根据张量元素值排序完成预测。接下来根据预测的结果构建车辆与道路任务二分图,根据Kuhn‑Munkres算法求解车辆与道路任务的最大匹配,使得匹配成功的概率最大。对比现有技术,本发明方法很好的结合了车辆行驶特性,减少了信息收集的冗余,提高了信息收集的效率。

Description

面向城市空间信息采集的车联网众包方法
技术领域
本发明涉及一种车联网众包方法,具体涉及一种面向城市空间信息采集的车联网众包方法,属于车载自组织网络技术领域。
背景技术
随着城市化进程的不断推进和车辆智能化应用的不断增强,车载自组织网络一直是智能交通系统研究的热点问题。车载自组织网络不仅能够使车辆之间实现互联,同样能实现车辆与外界基础设施互联。类似于移动网络,将车辆视为网络中的节点,能够进行信息的传递,实现车辆与外界的通信。通过车辆网络属性对城市空间进行优化,实现智能出行。移动众包作为一种新的技术手段吸引着人们的关注,在这种机制下众包参与者可以被理解为“移动传感器节点”潜移默化地完成相应任务,有效降低传统规模较大的工作导致的资源浪费,提高工作完成效率。移动众包机制的低消耗特性和高覆盖特性,使得移动手机用户作为参与者在环境污染检测,道路交通通行状况检测,无线信号强度检测,停车位检测等数据检测收集中得到了实际的应用。将众包机制与车载自组织网络相结合,利用车辆作为移动传感器节点进行信息的采集,能够高效的利用车辆资源,辅助智能交通的实现。
目前将众包机制应用到车联网中的研究较少,本发明的面向城市空间信息采集的车联网众包方法主要涉及到了车辆轨迹预测和众包两方面的内容,在车辆轨迹预测领域,应用比较多的预测算法是基于马尔科夫链的序列预测,这种算法不能解决预测问题中常见冷启动问题,利用马尔科夫链预测必须有历史行为数据支撑,否则就退化成为随机预测。在众包机制方面,目前研究主要集中在移动社交网络领域,可以分为不考虑地理位置影响的众包机制、当前地理位置有关的众包机制、考虑未来地理位置影响的众包机制三种,研究最多的是与当前地理位置有关的众包机制,由于众包任务的执行与地理位置和车辆的行为习惯有很强的联系,因此不仅需要考虑车辆的当前地理位置,而且还要结合用户的未来行驶方向,才能使得任务执行更加高效。
发明内容
本发明的目的在于,要充分利用车辆的行驶轨迹信息和众包机制的高覆盖、低消耗特性,将众包机制应用到车联网中,利用车辆代替移动手机,对车载自组织网络中所出现的信息进行探测收集,减少重复数据的收集,合理的规划车辆资源,让车辆变为移动的传感器,让数据的收集更加便捷。
本发明为了解决上述技术问题,提出了一种面向城市空间信息采集的车联网众包方法。本方法技术方案的思想是根据车辆历史轨迹数据,构建车辆,具有马尔科夫性质的三阶地点链以及下一时刻地点之间的三阶张量,根据基于置信系数的贝叶斯个性化排序规范进行张量分解,利用随机梯度下降算法迭代求解参数,得到车辆去往下一地点的概率;根据求得的概率构建车辆与任务的二分图,利用KM算法求解二分图的最大匹配,最终得到车辆执行道路任务的指派最优方案。
本发明的具体实现步骤如下:
一种面向城市空间信息采集的车辆网众包方法,该方法包括以下步骤:
步骤一、利用车辆历史轨迹数据,根据车辆地点转移的马尔科夫性质,设计一种基于张量分解的地点预测方法,该过程包括以下步骤:
(1)构建车辆行驶的道路网模型,G=(I,R),其中i∈I表示路口,rij∈R表示由路口i与邻接路口j确定的路段;
(2)构建<车辆序号(v),三阶马尔科夫地点链(c),下一时刻地点(l)>三元组;
(3)根据三元组构建三阶张量,利用Pairwise Interaction TensorFactorization(PITF)算法表示张量中的元素,其中元素的参数设为Θ,表示如下:
其中,表示所有车辆的特征向量形成的矩阵,大小为 表示所有车辆的总数量,为车辆三阶马尔科夫地点链的特征向量形成的矩阵,大小为LV为车辆v下一次将要去的地点的特征向量形成的矩阵,由于其刻画的是与车辆之间的联系,因此用来表示,其大小为 的意义相同,因其刻画的是与三阶马尔科夫地点链之间的联系,因此用表示,其大小为F为特征向量的维度;
(4)对三阶张量依照基于置信权重的贝叶斯个性化规范进行张量分解;
(5)利用随机梯度下降算法迭代求解最优的参数Θ;
步骤二、根据步骤一中求解的最优参数还原三阶张量中每一个元素值,对张量中由车辆序号,三阶马尔科夫地点链两个维度确定的数据进行归一化处理转化为概率形式;
步骤三、根据步骤二地点预测概率值,通过如下基于地点预测的车辆网众包选择方法进行车辆网众包:
(1)给定时间点t以及小时间槽Δt,获取车辆在道路网上的静态分布;
(2)根据道路rij与车辆v构建二分图得到车辆执行任务的概率矩阵:
其中vj表示第j辆车,1≤j≤m,m表示车辆总数,ti表示第i项任务,1≤i≤n,n表示任务总数,rj表示第j辆车执行任务时的消耗,rj>0,pij表示车辆vj执行任务ti的概率,每项任务ti都倾向于选择正在驶向路口i的车辆vj,因此利用数学公式定义车辆vj执行任务ti的效率为pij/rj
根据效率对车辆进行选择执行相应道路的任务使得安排成功的概率最大,其目标函数为P,
s.t.
(3)对上述目标函数P进行求解,得到最优方案使得选中车辆执行众包任务成功的概率最大。
作为优选,所述步骤一(2)三元组的三阶马尔科夫地点链(c)为:当前时刻t所处位置,上一时刻t-1所处位置,以及t-2时刻所处位置的组合。
作为优选,所述步骤一(3)中利用PITF表示张量中元素即车辆v在三阶马尔科夫地点链c情况下转移到地点l的评估分值,具体表示如下:
其中:表示的是车辆自身行驶偏好与下一时刻地点之间相互关系,表示车辆对下一时刻地点的f维隐式特征向量,表示下一时刻地点对车辆的f维隐式特征向量;表示的是三阶马尔科夫序列与下一时刻地点之间相互关系,表示对三阶马尔科夫序列下一时刻地点的f维隐式特征向量,表示下一时刻地点对三阶马尔科夫序列的f维隐式特征向量。
作为优选,步骤一(4)所述依照基于置信权重的贝叶斯个性化规范(BPRC)进行张量分解,其目标函数为:
其中BPRC-obj表示的是利用基于置信权重的贝叶斯个性化规范对张量中元素分解还原的目标函数,v表示车辆,V表示所有车辆的集合,Lv表示车辆v经过的所有地点的集合,Lv t表示车辆v在t时刻可能出现地点的集合,li与lj分别表示两个地点,为车辆v在三阶马尔科夫地点链c下倾向于转移到地点li的张量元素值,为车辆v在三阶马尔科夫地点链c下倾向于转移到地点lj的张量元素值,置信权重Cvij表示车辆v相比较于lj地点更倾向于去往li地点的成立程度,其通过下式计算:Ti和Tj分别表示在历史数据中车辆v处于当前三阶马尔科夫地点链时,转移到li和lj两个地点的次数,σ(x)为sigmod函数‖Θ‖2表示所述张量元素的参数集合的二范式,λΘ为与模型有关的正则化参数。
作为优选,对步骤一(5)中所述的参数Θ利用随机梯度下降算法求解最优值时,参数Θ的初始化选取为高斯分布,选取的高斯分布符合Θ~N(0,σΘI),为了减少未知的超参数的数量方便后续求解,使用高斯分布的方差直接设定为λΘI,λΘ为与模型有关的正则化参数,I为单位矩阵。
作为优选,步骤二所述归一化处理采用top one归一化算法将数值转化为概率,具体如下:对张量中还原后的数据,利用top one概率方法对同一车辆,同一三阶马尔科夫地点链所确定的下一时刻所有地点数据通过如下公式进行归一化处理:
其中si表示张量中的元素值,φ(si)=exp(si),n表示同一车辆,同一三阶马尔科夫地点链所确定的下一时刻所有地点的数量。
作为优选,步骤三(3)所述对目标函数P求解得到车辆与道路任务的最大匹配采用Kuhn-Munkres算法。
有益效果:
本发明针对车载自组织网络领域的信息收集问题,综合考虑车辆行驶习惯信息,根据车辆的行驶意愿指派相应的道路信息收集任务,能够节约信息收集的成本,减少数据收集的冗余;提出的张量预测算法能够较为准确的预测出车辆未来行驶动向,根据车辆的行驶来指派任务提高了工作的效率,让车辆变为移动的传感器,让数据的收集更加便捷。
附图说明
图1是本发明面向城市空间信息采集的车联网众包方法的流程图。
图2是本发明基于张量分解的地点预测方法的流程图。
图3是本发明实施例中道路网结构示意图。
图4是本发明实施例中转移矩阵的创建示意图。
图5是本发明实施例中转移张量的创建示意图。
图6是本发明基于地点预测的众包车辆选择方法的流程图。
图7是本发明实施例中实验选定区域以及路口示意图。
图8是本发明实施例中3阶马尔科夫链预测结果对比。
图9是本发明实施例中2阶马尔科夫链预测结果对比。
图10是本发明实施例中1阶马尔科夫链预测结果对比。
图11是本发明实施例中阶数对马尔科夫链预测准确率影响对比图。
图12是本发明实施例中阶数对马尔科夫链张量预测准确率影响对比图。
图13是本发明实施例中二阶与三阶马尔科夫链张量预测在时刻上的对比图。
图14是本发明实施例中不同预测算法结果对比图。
图15是本发明实施例中不同算法下车辆选择准确率对比图。
具体实施方式
下面结合附图与实施例对本发明进行详细介绍。
如图1所示为一种面向城市空间信息采集的车联网众包方法流程示意图,从图中可以看出,根据车辆行驶轨迹构建三阶张量,然后对张量元素进行分解还原,根据还原结果得到车辆去往下一点的概率,通过概率构建车辆与任务之间的二分图,然后利用二分图最大匹配算法得到最优的车辆选择方案。下面对该流程进行详细介绍。
图2是本发明实施例中基于张量分解预测方法流程图,具体流程如下:
对应图2中的第一步,首先,获取车辆历史轨迹数据,对轨迹数据进行处理并且对单个用户的轨迹数据按照时间先后进行排序,得到单一车辆正常行驶的轨迹链。
对应图2中的第二步,然后,对每条轨迹链的三个点分别进行组合,形成三阶马尔科夫链并用唯一的数字来表示,该三阶马尔科夫链用来描述车辆当前位置维度信息,本实施例选取三阶马尔科夫链作为三阶张量的第二个维度,不仅是因为三阶马尔科夫链能够拟合车辆的轨迹信息,更是出于对道路结构的考虑,车辆不可能越过道路行驶,因此道路结构信息在轨迹预测中也必须考虑在内,通过一些道路限制能够更好的辅助轨迹的预测。如图3所示,车辆即将出现在路口C处。利用一阶马尔科夫链,那么只需要考虑当前C位置,则下一时刻的地点将会是候选集合(B,E,F,G)中的一个。如果增加马尔科夫链的序列长度,从该车辆的轨迹链中再向前拓展一个位置,知道这辆车来自位置E,那么根据常识可以判断车辆不太可能回到E位置。利用序列(E,C)进行预测,则下一时刻的地点将极有可能会是候选集合(B,F,G)中的一个。此外,如果将马尔科夫链的长度扩展到三阶,知道该车辆行驶的轨迹序列是(D,E,C),则基于二阶马尔科夫链回到位置E的概率将进一步降低。并且车辆具有较少的概率去到位置B,这是因为车辆的高速性,通过图示可以发现D点与B点的距离大于从D到E再到C的距离,也就是说如果车辆倾向于去往B地点时,在D点的时候就会发生转移,而不必绕路到C点。因此,通过三阶马尔科夫链能够很好的捕捉到路网的结构,提升预测的精准度。
本发明中使用vi表示车辆i,因此V={v1,v2,...,v|V|}表示的是整个车辆轨迹数据中所有车辆的集合,并且车辆的总数量是|V|。令L表示车辆轨迹数据集中所有的地点的集合,lt∈L表示某一车辆当前时刻所处的地点,lt+1∈L表示的是车辆的下一时刻将要去向的地点,在算法中这个地点就是最终预测的地点,t表示时刻。C={c1,c2,...,c|C|}代表车辆轨迹所组成的三阶马尔科夫链所有情况的集合,ci∈C表示i情况下的马尔科夫链,|C|表示三阶马尔科夫链的总数量;Lv表示的是车辆v历史数据中经过的所有地点的集合,表示所有车辆的轨迹集合。
接下来,对应图2中第三步,对车辆轨迹数据进行预处理,构建成<车辆序号,三阶马尔科夫链数学表示,下一时刻地点>的三元组,用此三元组作为输入数据,通过该输入数据按照下述过程构建张量:
首先根据马尔科夫链序列预测模型,已知当前三阶马尔科夫链所属的地点信息,计算下一时刻出现地点的概率,公式如下所示。
p(lt+1|lt,lt-1,lt-2)
c={lt,lt-1,lt-2},用来表示三阶马尔科夫链,则C表示所有的三阶马尔科夫链的集合,Cv表示车辆v所有的三阶马尔科夫地点链的集合,因此概率形式变成了如下所示,
p(Lv|Cv)
公式中表示的是马尔科夫链集合与地点集合之间转移概率,在地点预测中,最关键的是要表示出给定了目标车辆访问地点的三阶马尔科夫链后,计算下一次某一个地点可能被访问的概率。为了清楚的表示这一思想,公式中预测下一时刻地点集合的式子改写成预测某一地点的被访问概率,而某一地点被访问概率可以看成是当前三阶马尔科夫链集合到下一地点的概率的平均值,因此公式可以被重写为如下形式,
用xv,c,l来表示车辆v在三阶马尔科夫链为c的情况下转移到地点l的转移概率值。给定了整个地点的集合Lv那么xv,c,l的表示可以按照如下方式计算,
其中|{(Lv):lt+1^lt^lt-1^lt-2}|表示的是在全部行驶轨迹数据集中当前车辆前面三个时刻访问地点是lt,lt-1,lt-2,下一个访问地点是lt+1所组成的访问序列的数目,而|{(Lv):lt^lt-1^lt-2}|表示的是轨迹数据集中所有的访问地点三阶序列是lt,lt-1,lt-2的数目。图4表示的是单一车辆的转移矩阵的构建,该车辆v在历史轨迹中挖掘的信息,在轨迹点组成为A,B,C时即车辆从A地点转移到了B地点然后转移到了C地点,在这种序列组合情形下,一共找到了两种情形即频数为2。这两次转移中分别取了E地点1次,F地点1次。同样在轨迹序列为D,B,C情形下该车辆一共发生了5次,其中转移到了E地点一次,F地点一次,G地点三次。具体计算过程为:根据图4的地点转移访问记录,然后根据上述公式计算序列与地点之间的转移概率。以三阶马尔科夫链序列D,B,C发生的转移概率为例,计算过程以及计算结果如下。
通过上述公式对单一车辆构建转移矩阵,得到了图4的结果。将矩阵叠加到车辆维度,便构成了如图5所示的张量。其中?代表缺失值,表示该车辆在轨迹数据中找不到这样的地点转移。
对应图2中第四步,最后需要对张量数据进行补全,则需要对张量进行分解还原,张量分解模型有很多,TD分解模型,CP分解模型,PITF分解模型。Tucker Decomposition(TD)是一种高阶主成分分析方法,它的主要核心思想是:对于一个高维N维张量,将其分解为一个核张量(Core Tensor)和沿每个维度方向上的N个因子矩阵的乘积。CP分解是TD分解的特殊条件下的表示,核心张量的差别是CP分解中与TD分解的主要差异,CP分解核心张量对应为对角矩阵并且所有的元素相等。Rendle S和Schmidt-Thieme L在Canonical分解基础上提出了Pairwise Interaction Tensor Factorization(PITF)的分解模型,PITF分解考虑因子矩阵两两维度之间的相互关系,应用到本发明地点预测问题,构建地点转移张量
其中,v代表车辆,c代表三阶马尔科夫地点链,l代表车辆下一时刻地点,而就代表车辆v在行驶轨迹为三阶马尔科夫地点链c的情况下,下一时刻去向l地点的可能性。在张量中就表示车辆v的矩阵行为c,列为l所确定的三维小方块所对应的区域值。f表示特征潜在因子的维度。因此,PITF考虑的是车辆和三阶地点链,车辆和下一时刻地点,三阶地点链和下一时刻地点之间的两两关系。表示的是车辆自身行驶偏好与下一时刻地点之间相互关系。表示车辆对下一时刻地点的f维隐式特征向量,表示下一时刻地点对车辆的f维隐式特征向量。表示的是三阶马尔科夫序列与下一时刻地点之间相互关系。表示对三阶马尔科夫序列下一时刻地点的f维隐式特征向量,表示下一时刻地点对三阶马尔科夫序列的f维隐式特征向量。表示的是车辆自身行驶偏好与三阶马尔科夫序列之间相互关系。表示车辆对三阶马尔科夫序列的f维隐式特征向量,表示对三阶马尔科夫序列车辆的f维隐式特征向量。需要注意的是,对上式主要关注的是以及之间的关系,因为对计算并不会产生影响,从直观上考虑,车辆和当前序列信息是已经发生的事实,不对其他维度造成影响,因此可以得到最终的三维张量元素表示为,
因此三阶张量模型的的参数Θ为四个因子矩阵形式,
其中,F表示特征向量的维度。接下来利用BPRC算法对参数Θ进行学习,贝叶斯个性化排序算法(Bayesian Personalized Ranking,BPR)的优化算法提出的“排序”概念,就是将不可见数据融入到训练模型。利用数据中的隐反馈来优化排序结果。结合地点预测的概念可以理解为:张量中已经存在的地点转移序列在以后出现的概率比未出现的序列要大。以及,张量中已存在的地点转移序列次数多的在以后出现的概率比出现次数小的地点转移序列出现的概率大。将数据集由三维的<v,li,lj>集合来表示,表示含义:相对于地点lj,车辆v更倾向于转移到地点li,在BPR中,对于地点集合L内的任意两个地点li,lj都满足如下性质,
完全性
反对称性
传递性
>v是自定义的地点之间的序关系符号,表示的是在车辆用户当前地点确定的情况下,序关系符号之前的地点出现的可能性大于序关系符号之后地点出现的可能性。∨表示逻辑或运算,∧表示逻辑与运算。BPR算法首先有两个独立性假设:每个车辆用户之间是相互独立的,对单一车辆用户不同地点之间的偏序关系也是独立的。其算法的推导主要是基于最大化后验概率。BPR的目标就是根据已知历史数据中确立的偏序关系,迭代求解参数,使得这种偏序关系成立的可能性最大;其利用贝叶斯公式进行表示如下:
p(Θ|>v)∝p(>v|Θ)p(Θ)
其中Θ为所要优化的参数也就是PITF中所有两两维度之间关系的隐式特征向量。根据BPR的独立性假设:用户之间的独立性和偏序关系的独立性对上述公式进一步分解然后根据伯努利方程优化,最终可以得到如下公式:
v∈Vp(Θ|>v)=∏v∈Vp(li>vlj|Θ)
其中p(li>vlj|Θ)表示在两个候选地点li和lj,车辆选择转移到li地点的概率,因为数学概念中概率的形式都是在区间0~1上的,因此需要对数值进行归一化。BPR选择性质较好的逻辑斯蒂函数(logistic function)来将数值转换成概率的形式,既:
公式中是一个与选择的优化模型相关的实值函数,这个函数表达的意思是对于车辆v来讲,相比较于地点li和地点lj选择地点li可能性的分值。其中为用户倾向于转移到地点li的张量值,即为用户倾向于转移到地点lj的张量值,即x表示张量中三个维度确定点的元素值,上面公式进而可以表示为,
为了求出后验概率以及避免训练过程中出现过拟合和迭代速度过慢,关于参数Θ的先验函数选取为高斯分布,使用的先验概率p(Θ)初始化参数数据,Θ~N(0,σθI)。
BPR算法只适用于隐反馈情况,即偏序关系对建立在历史数据中转移过的地点大于历史数据中没有转移过的地点,但是放在显式关系中时,从历史数据中可以挖掘出两个地点转移的次数,假设在历史数据中用户v从地点A转移到地点B 5次,但同时3次转移到地点C,转移到D地点0次。利用BPR进行衡量时能够建立关系对B>C,B>D。但是两种情况所成立的程度是不一样的,从直观上讲,对B>C关系成立的程度要大于B>D关系成立的程度。这种情况需要被衡量进来。因此,需要使用基于置信权重的BPRC算法,是在BPR的基础上,把不同情形下偏序关系成立置信度考虑在内。
本发明中提出的置信权重Cvij用来表示车辆v相比较于lj地点更倾向于li地点的成立程度,计算公式如下所示:
其中,Ti和Tj分别表示i和j两个地点在历史数据中出现的转移次数。
最终得到求解的目标函数如下所示:
v表示车辆,V表示所有车辆的集合,Lv表示车辆v经过的所有地点的集合,Lv t表示车辆v在t时刻可能出现地点的集合。参数Θ求解过程中需要首先进行参数的初始化,本实施例中关于参数Θ的初始化选取为高斯分布,选取的高斯分布符合Θ~N(0,σΘI),为了减少未知的超参数的数量方便后续求解,使用高斯分布的方差直接设定为λΘI,λΘ为与模型有关的正则化参数,I为单位矩阵。当然,本领域技术人员知道,根据目标的不同,也可以对参数Θ进行其它方式的初始化,如均匀分布初始化等。
利用随机梯度下降算法对参数Θ进行求解,其中,θ表示参数的集合,Θ表示参数集合的集合,求解公式如下,
参数更新公式如下,λ为步长
迭代求解最优参数,并根据最优参数还原张量的元素值。
下面,需要将张量元素值转换成概率,这样才能够进行不同车辆之间的对比,这也是进行选择时最关注的点。采用top one概率方法进行概率的转换,计算公式如下
其中si表示目标的得分即张量中的元素,φ(si)=exp(si),n表示相同车辆相同三阶马尔科夫链所确定的张量元素的总个数。通过概率的转换后就能够得到每一辆车处于某一地点时下一时刻去往不同地点的概率。
当然,本领域技术人员亦可采用其它方法进行张量元素的归一化,如min-max标准化,Z-score标准化方法等。
图6是本发明实施例中基于地点预测的众包车辆选择方法流程图。具体流程如下:
首先,给定时间点t以及小时间槽Δt,获取车辆在道路网上的静态分布,车辆网中车辆是动态改变的,因此需要有一个时间槽Δt来缓冲车辆网车辆的位置。例如,在早上8:00钟进行车辆选择分发众包任务,则需要在几分钟之前来获取车辆的位置,车辆不一定都处于路口处,但是由于道路网的限制,车辆在行驶后必将出现在某一路口。通过提前量就可以固定当前位置处的所拥有车辆(在某一时刻其真实位置不一定处于这里)。根据车辆的静态分布得到道路行驶候选车辆下一时刻去往各地点的概率的预测结果。利用道路rij来表征任务t,假定每一条道路会有相同或不同的众包任务需要执行。构建二维车辆与任务的二分图,其概率矩阵表示为,
其中vj表示第j辆车,1≤j≤m,m表示车辆总数,ti表示第i项任务,1≤i≤n,n表示任务总数,rj表示第j辆车执行任务时的消耗,rj>0,pij表示车辆vj执行任务ti的概率,每项任务ti都倾向于选择正在驶向路口i的车辆vj,因此利用数学公式定义车辆vj执行任务ti的效率为pij/rj
根据效率对车辆进行选择执行相应道路的任务使得安排成功的概率最大,其目标函数为P,
s.t.
本实施例中利用Kuhn-Munkres算法求解车辆与道路任务的最大匹配,KM算法是以匈牙利算法基础并融合进了可行顶点标记,KM算法最重要的是可行顶点标记的概念,通过权值的转换得到可行顶点标记,然后利用经典的匈牙利算法来寻找匹配,如果没有找到,则对可行地点标记进行修改,一直到找到一种完美匹配方式,这时的匹配方式为最佳匹配。匈牙利算法是解决运筹学中指派问题最经典的算法,该算法的主要理念就是增广路径,通过增广路径来找到顶点之间的匹配,最终找到一种最优的车辆选择方案。
当然,不限于KM算法,本领域技术人员根据目标函数的特点,亦可选用其它方法进行求解,如贪心算法,匈牙利算法等。
评价指标:
本发明对地点预测准确率和众包车辆选择准确率进行评价,因此需要对两种准确率进行评价指标的设定。对于地点预测的准确率进行评价借用推荐系统的思想,利用Top-N进行评价。即对N个预测结果返还给车辆如果车辆下一时刻真实行驶地点会出现在这N个结果内时,则将此次返回结果标记为正确。由于本文中涉及的地点预测是一个静态的概念,即固定某一时刻,统计该时刻时车辆的空间分布,根据当前位置进行地点的预测,因此需要对数据集进行采样。在本实验中选取24个整点时刻,计算这24个整点时刻时出现在道路网的车辆的下一地点的准确率,然后取均值代表算法的准确率。定义数学公式如下,
其中|V|表示数据集中车辆的总数量,|T|表示选取的采样时刻的总数量,本文中是24。Sv和Nv分别表示正确预测的总数量和所有参与众包机制的车辆的总数量。
接下来是对众包车辆选择评价指标的定义,本文中众包机制对于车辆选择是指定相应的车辆到相应的道路上执行任务,因此评价指标用来衡量安排的准确性,数学定义如下,
其中Nright表示众包对车辆选择后车辆正确执行任务的总数量。Ntotal表示所有被选择的车辆的总数量。
数据集:
选取上海市中心区域的12.6km×12.9km的区域作为实验区域,如图7所示,选取了此区域中的主次干道及比较大的道路,单独制作了区域的路网图,并将每一个交叉路口标出,这些交叉路口就是实验所用到的重要信息,用路口来表征轨迹点的转移,地点的预测也是利用路口来表示,并且任务就是两个路口所确定道路上的任务。
在本发明中对车辆的消耗定义为rj,其中消耗包括油耗,时间消耗等等,在本实验中选取出租车作为实验对象,因此将车辆的消耗设置为相同的值,在现实情况中可以根据车辆反馈的消耗信息得到相应的rj值。
在本发明进行的实验中,选取了4天的数据作为训练集(Strain),选取一天的数据作为测试集(Stest),对于基本的信息统计见表1。
表1实验数据的基本统计
实验结果:
在发明中,利用的是两步来完成众包车辆选择工作,首先使用的是地点预测类型,然后再利用二分图最大匹配对车辆完成选择,因此,本实验将从这两个角度来进行实验结果的比较。
首先,使用常规马尔科夫链和随机预测(RANDOM)的方式进行实验结果的对比。对道路结构进行分析得到,不同的马尔科夫链的阶数对实验的结果是有影响的。因此实验中对不同马尔科夫阶数与不同的方法进行了对比,实验结果如图8、9、10所示。从图中可以看出,本文提出的基于张量分解的预测方法的预测精准度要高于常规的马尔科夫链算法以及随机预测算法,从而证明了本文中预测算法的有效性。
同样从图中可以看到随着候选地点个数的增加预测的准确率也在增加,当候选集中候选地点的个数增大到5个时,预测准确率基本上能到100%,这是由于道路相邻的路口基本控制在4个左右,也就是常识中的十字路口。因此,该预测算法同样符合现实情况。
图11、12体现马尔科夫链阶数对实验结果的影响,三阶马尔科夫链能够很好的描述道路网结构,规避掉一些不合理的情况。从图中可以看到2阶情况都要比一阶高20%左右,但是在本文提出的算法中2阶马尔科夫链预测与3阶马尔科夫链预测的准确率相当。为了验证这种情况出现的原因,对比两种情况做了相关的实验如图13所示。
本发明中是对24个整点时刻进行采样然后求平均,为了找到原因,对24个时刻的预测准确率进行对比,通过图13可以发现3阶预测的波动要比2阶大,这是因为当利用历史轨迹数据组成3阶张量时,数据会变的十分稀疏即数据集中能够找到这种组合的转移相对较少,有的有可能就只有一次,但是2阶的情况则比较多。通过3阶马尔科夫链进行张量分解预测得到结果与2阶马尔科夫链进行张量分解预测得到结果相当从侧面也可以印证,本算法能够在稀疏数据集中得到不错的结果。
为了验证算法的优越性,实验中还与非马尔科夫链的预测算法做了对比,预测结果如图14所示。
通过对比发现马尔科夫链更适合轨迹数据的预测,这是因为地点转移具有很强的马尔科夫性质。本文中所提出的基于张量分解的轨迹预测算法所得到的结果是最好的,从而证明了三阶马尔科夫链与张量分解相结合的算法的有效性。
本发明最终的任务是对车辆选择准确率的判断,由于本文中所介绍的算法是分两步完成的,第一步是基于张量分解的地点预测算法,第二步是基于预测的众包车辆选择算法。上述内容已经完成了对地点预测的实验对比,下面将对最终的车辆选择准确率进行对比。结果如图15所示。
其中张量预测+KM代表的是本文所提出的基于三阶张量的地点预测算法和二分图KM最大匹配算法的结合,常规MC预测+KM代表的是普通的三阶马尔科夫链与二分图KM最大匹配算法的结合,随机预测+KM代表的是随机预测与KM算法的结合,张量预测+贪心代表的是本发明提出的基于三阶张量的地点预测算法和贪心选择算法的结合,最优一项说明的是车辆选择存在的最优情况,由于车辆的自主行驶的特性,因此并不是所有时刻的车辆都能覆盖所有的道路,比如一条道路上会存在没有车辆行驶的实际情况,但是车辆选择算法会有安排。因此根据实际的车辆行驶情况,会存在一种最优的情况即无论如何安排准确率存在一个最高的限制。从图中可以看出本文所提出的算法具有较高的准确率,验证了算法结合的有效性。
对KM算法与贪心算法的对比,可以看到本文所提出的算法要优于贪心算法,由于在某些时刻的数据稀疏性例如凌晨,这些时候KM算法会退化成贪心算法,本实验中所应用的贪心算法也是考虑实际应用后的算法,因此两个算法差距并不大,但仍可以说明KM算法要优于贪心算法,这个结论也在其他应用中得到证实。
综上所述,本文中所提出的基于张量分解的地点预测算法和基于预测的众包车辆选择算法都分别优于其他对比算法,从而证明了本发明方法的有效性,能够应用到众包任务执行中。
为了说明本发明的内容及实施方法,本说明书给出了一个具体实施例。在实施例中引入细节的目的不是限制权利要求书的范围,而是帮助理解本发明所述方法。本领域的技术人员应理解:在不脱离本发明及其所附权利要求的精神和范围内,对最佳实施例步骤的各种修改、变化或替换都是可能的。因此,本发明不应局限于最佳实施例及附图所公开的内容。

Claims (7)

1.一种面向城市空间信息采集的车辆网众包方法,该方法包括以下步骤:
步骤一、利用车辆历史轨迹数据,根据车辆地点转移的马尔科夫性质,设计一种基于张量分解的地点预测方法,该过程包括以下步骤:
(1)构建车辆行驶的道路网模型,G=(I,R),其中i∈I表示路口,rij∈R表示由路口i与邻接路口j确定的路段;
(2)构建<车辆序号(v),三阶马尔科夫地点链(c),下一时刻地点(l)>的三元组;
(3)根据三元组构建三阶张量,利用Pairwise Interaction Tensor Factorization(PITF)算法表示张量中的元素,其中元素的参数设为Θ,表示如下:
其中,表示所有车辆的特征向量形成的矩阵,大小为 表示所有车辆的总数量,为车辆三阶马尔科夫地点链的特征向量形成的矩阵,大小为LV为车辆v下一次将要去的地点的特征向量形成的矩阵,由于其刻画的是与车辆之间的联系,因此用来表示,其大小为 的意义相同,因其刻画的是与三阶马尔科夫地点链之间的联系,因此用表示,其大小为F为特征向量的维度;
(4)对三阶张量依照基于置信权重的贝叶斯个性化规范进行张量分解;
(5)利用随机梯度下降算法迭代求解最优的参数Θ;
步骤二、根据步骤一中求解的最优参数还原三阶张量中每一个元素值,对张量中由车辆序号,三阶马尔科夫地点链两个维度确定的数据进行归一化处理转化为概率形式;
步骤三、根据步骤二获得的概率值,通过如下基于地点预测的车辆网众包选择方法进行车辆网众包:
(1)给定时间点t以及小时间槽Δt,获取车辆在道路网上的静态分布;
(2)根据道路rij与车辆v构建二分图得到车辆执行任务的概率矩阵:
其中vj表示第j辆车,1≤j≤m,m表示车辆总数,ti表示第i项任务,1≤i≤n,n表示任务总数,rj表示第j辆车执行任务时的消耗,rj>0,pij表示车辆vj执行任务ti的概率,每项任务ti都倾向于选择正在驶向路口i的车辆vj,因此利用数学公式定义车辆vj执行任务ti的效率为pij/rj
根据效率对车辆进行选择执行相应道路的任务使得安排成功的概率最大,其目标函数为P,
s.t.
(3)对上述目标函数P进行求解,得到最优方案使得选中车辆执行众包任务成功的概率最大。
2.根据权利要求1所述的一种面向城市空间信息采集的车辆网众包方法,其特征在于,所述步骤一(2)三元组的三阶马尔科夫地点链(c)为:当前时刻t所处位置,上一时刻t-1所处位置,以及t-2时刻所处位置的组合。
3.根据权利要求1所述的一种面向城市空间信息采集的车辆网众包方法,其特征在于,所述步骤一(3)中利用PITF表示张量中元素即车辆v在三阶马尔科夫地点链c情况下转移到地点l的评估分值,具体表示如下:
其中:表示的是车辆自身行驶偏好与下一时刻地点之间相互关系,表示车辆对下一时刻地点的f维隐式特征向量,表示下一时刻地点对车辆的f维隐式特征向量;表示的是三阶马尔科夫序列与下一时刻地点之间相互关系,表示对三阶马尔科夫序列下一时刻地点的f维隐式特征向量,表示下一时刻地点对三阶马尔科夫序列的f维隐式特征向量。
4.根据权利要求1所述的一种面向城市空间信息采集的车辆网众包方法,其特征在于,步骤一(4)所述依照基于置信权重的贝叶斯个性化规范(BPRC)进行张量分解,其目标函数为:
其中BPRC-obj表示的是利用基于置信权重的贝叶斯个性化规范对张量中元素分解还原的目标函数,v表示车辆,V表示所有车辆的集合,Lv表示车辆v经过的所有地点的集合,Lv t表示车辆v在t时刻可能出现地点的集合,li与lj分别表示两个地点,为车辆v在三阶马尔科夫地点链c下倾向于转移到地点li的张量元素值,为车辆v在三阶马尔科夫地点链c下倾向于转移到地点lj的张量元素值,置信权重Cvij表示车辆v相比较于lj地点更倾向于去往li地点的成立程度,其通过下式计算:Ti和Tj分别表示在历史数据中车辆v处于当前三阶马尔科夫地点链时,转移到li和lj两个地点的次数,σ(x)为sigmod函数‖Θ‖2表示所述张量元素的参数集合的二范式,λΘ为与模型有关的正则化参数。
5.根据权利要求1所述的一种面向城市空间信息采集的车辆网众包方法,其特征在于,对步骤一(5)中所述的参数Θ利用随机梯度下降算法求解最优值时,参数Θ的初始化选取为高斯分布,选取的高斯分布符合Θ~N(0,σΘI),为了减少未知的超参数的数量方便后续求解,使用高斯分布的方差直接设定为λΘI,λΘ为与模型有关的正则化参数,I为单位矩阵。
6.根据权利要求1所述的一种面向城市空间信息采集的车辆网众包方法,其特征在于,步骤二所述归一化处理采用top one归一化算法将数值转化为概率,具体如下:对张量中还原后的数据,利用top one概率方法对同一车辆,同一三阶马尔科夫地点链所确定的下一时刻所有地点数据通过如下公式进行归一化处理:
其中si表示张量中的元素值,φ(si)=exp(si),n表示同一车辆,同一三阶马尔科夫地点链所确定的下一时刻所有地点的数量。
7.根据权利要求1-6任一所述的一种面向城市空间信息采集的车辆网众包方法,其特征在于,步骤三(3)所述对目标函数P求解得到车辆与道路任务的最大匹配采用Kuhn-Munkres算法。
CN201710058021.2A 2017-01-23 2017-01-23 面向城市空间信息采集的车联网众包方法 Active CN106910199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710058021.2A CN106910199B (zh) 2017-01-23 2017-01-23 面向城市空间信息采集的车联网众包方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710058021.2A CN106910199B (zh) 2017-01-23 2017-01-23 面向城市空间信息采集的车联网众包方法

Publications (2)

Publication Number Publication Date
CN106910199A CN106910199A (zh) 2017-06-30
CN106910199B true CN106910199B (zh) 2019-07-09

Family

ID=59207542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710058021.2A Active CN106910199B (zh) 2017-01-23 2017-01-23 面向城市空间信息采集的车联网众包方法

Country Status (1)

Country Link
CN (1) CN106910199B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10726311B2 (en) * 2017-09-13 2020-07-28 Hrl Laboratories, Llc Independent component analysis of tensors for sensor data fusion and reconstruction
CN108600938B (zh) * 2018-03-29 2020-09-22 南京邮电大学 一种车联网中感知服务节点智能选择方法
CN110020228B (zh) * 2019-04-08 2021-04-13 浙江大学城市学院 一种用于物联网物品信息搜索排序的相关性评估方法
CN110572789B (zh) * 2019-08-12 2022-05-24 东北大学秦皇岛分校 基于Hankel变换的无线传感网高维数据补全方法
CN110621005B (zh) * 2019-09-26 2020-06-23 电子科技大学 实现基于众包应用的车联网隐私保护方法
CN111008672B (zh) * 2019-12-23 2022-06-10 腾讯科技(深圳)有限公司 样本提取方法、装置、计算机可读存储介质和计算机设备
CN112269385B (zh) * 2020-10-23 2021-09-07 北京理工大学 云端无人车动力学控制系统和方法
CN112819176B (zh) * 2021-01-22 2022-11-08 烽火通信科技股份有限公司 一种适用于机器学习的数据管理方法和数据管理装置
CN113240189B (zh) * 2021-06-01 2022-10-14 青岛科技大学 基于信誉值的动态车辆任务与算力匹配方法
CN113395664B (zh) * 2021-08-16 2021-11-05 智道网联科技(北京)有限公司 用于高精地图绘制的车辆位置信息确定方法、装置及设备
CN115033717B (zh) * 2022-08-12 2022-11-08 杭州恒生聚源信息技术有限公司 三元组抽取模型训练方法、三元组抽取方法、装置及设备
CN117496476B (zh) * 2024-01-02 2024-03-26 安徽蔚来智驾科技有限公司 路网生成方法、可读存储介质及智能设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103680196A (zh) * 2013-11-15 2014-03-26 上海喜泊客信息技术有限公司 基于众包模式的停车泊位引导的方法及系统
CN104408203A (zh) * 2014-12-18 2015-03-11 西安电子科技大学宁波信息技术研究院 一种预测移动对象轨迹终点的方法
CN105181898A (zh) * 2015-09-07 2015-12-23 李岩 基于大密度部署传感器的大气污染监控及管理方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014145088A1 (en) * 2013-03-15 2014-09-18 SHIMANOVSKY, Boris Apparatus, systems, and methods for batch and realtime data processing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103680196A (zh) * 2013-11-15 2014-03-26 上海喜泊客信息技术有限公司 基于众包模式的停车泊位引导的方法及系统
CN104408203A (zh) * 2014-12-18 2015-03-11 西安电子科技大学宁波信息技术研究院 一种预测移动对象轨迹终点的方法
CN105181898A (zh) * 2015-09-07 2015-12-23 李岩 基于大密度部署传感器的大气污染监控及管理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
实时路况的众包--移动互联网时代的车联网内容;董振宁;《卫星与网络》;20131231;论文第1-2页

Also Published As

Publication number Publication date
CN106910199A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
CN106910199B (zh) 面向城市空间信息采集的车联网众包方法
Chen et al. A novel fuzzy deep-learning approach to traffic flow prediction with uncertain spatial–temporal data features
Liu et al. Urban traffic prediction from mobility data using deep learning
CN108256914A (zh) 一种基于张量分解模型的兴趣点种类预测方法
CN114897444B (zh) 一种城市分区域内服务设施需求识别方法及系统
Ahmed et al. Knowledge graph based trajectory outlier detection in sustainable smart cities
Yamamoto et al. Structured random walk parameter for heterogeneity in trip distance on modeling pedestrian route choice behavior at downtown area
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
Zhao et al. Incorporating spatio-temporal smoothness for air quality inference
Alizadeh et al. On the role of bridges as anchor points in route choice modeling
Arjona et al. A deep learning approach to real-time parking availability prediction for smart cities
Xue et al. Forecasting hourly attraction tourist volume with search engine and social media data for decision support
Huang et al. A time-dependent attention convolutional LSTM method for traffic flow prediction
Liao et al. Fusing geographic information into latent factor model for pick-up region recommendation
CN113159371B (zh) 基于跨模态数据融合的未知目标特征建模与需求预测方法
Xu et al. An intelligent adaptive spatiotemporal graph approach for GPS-data-based travel-time estimation
Wu et al. A flood-discharge-based spatio-temporal diffusion method for multi-target traffic hotness construction from trajectory data
CN108764518B (zh) 一种基于物联网大数据的交通资源动态优化方法
Lentzakis et al. Predictive distance-based road pricing—Designing tolling zones through unsupervised learning
Bibliográfico Intersecting geostatistics with transport demand modeling: a bibliographic survey
Vankdoth et al. Deep intelligent transportation system for travel time estimation on spatio-temporal data
Guo et al. Fine-grained dynamic price prediction in ride-on-demand services: Models and evaluations
Xu et al. TAML: A traffic-aware multi-task learning model for estimating travel time
Zhou et al. Refined taxi demand prediction with ST-Vec
Li et al. Route restoration method for sparse taxi GPS trajectory based on Bayesian network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant