CN114120635B - 基于张量分解的城市路网线状缺失流量估计方法及系统 - Google Patents

基于张量分解的城市路网线状缺失流量估计方法及系统 Download PDF

Info

Publication number
CN114120635B
CN114120635B CN202111308250.8A CN202111308250A CN114120635B CN 114120635 B CN114120635 B CN 114120635B CN 202111308250 A CN202111308250 A CN 202111308250A CN 114120635 B CN114120635 B CN 114120635B
Authority
CN
China
Prior art keywords
data
tensor
matrix
mobile phone
road section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111308250.8A
Other languages
English (en)
Other versions
CN114120635A (zh
Inventor
邢吉平
柳伟
李荣成
汪磊
张爱华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xingmin Zhitong Wuhan Automobile Technology Co ltd
Original Assignee
Xingmin Zhitong Wuhan Automobile Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xingmin Zhitong Wuhan Automobile Technology Co ltd filed Critical Xingmin Zhitong Wuhan Automobile Technology Co ltd
Priority to CN202111308250.8A priority Critical patent/CN114120635B/zh
Publication of CN114120635A publication Critical patent/CN114120635A/zh
Application granted granted Critical
Publication of CN114120635B publication Critical patent/CN114120635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/017Detecting movement of traffic to be counted or controlled identifying vehicles
    • G08G1/0175Detecting movement of traffic to be counted or controlled identifying vehicles by photographing vehicles, e.g. when violating traffic rules
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/065Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/027Services making use of location information using location based information parameters using movement velocity, acceleration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种基于张量分解的城市路网线状缺失流量估计方法及系统,获取待分析路网中安装车牌照片识别的路段;获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量;采用获取的车流量和车载手机用户的流量填充所构建的4维张量模型;进行对DFCP张量模型进行分解和重构,完成缺失车流量的估计。本发明使用作为一种全时空覆盖的移动检测器中的手机定位数据,并基于多源数据之间的时空相关性,来填充固定检测器中LPR检测器出现交通量线状缺失的情况,获取了完整的全时空覆盖的LPR数据,保证了数据完整性和准确性。

Description

基于张量分解的城市路网线状缺失流量估计方法及系统
技术领域
本发明涉及定位方法技术领域,尤其涉及一种基于张量分解的城市路网线状缺失流量估计方法及系统。
背景技术
近年来,数字化智能交通和车联网系统在各大城市快速兴起,而支撑该系统正常运行需要大量准确及时的交通信息数据。例如,城市智能交通控制系统需要充分的交通流数据(流量、密度和速度)来制定合理的城市交通管理策略。城市交通规划诱导系统在进行交通预测时,当出现信息数据缺失时,预测精度将受到较大影响。然而,由于检测设备的软件或硬件故障,信息通信网络受阻,供电设备故障,以及定期维护缺失等问题,在交通领域的信息数据获取过程中,出现丢失数据的问题是难以避免的。
缺失数据问题却广泛存在于统计学、社会学和流行病学等领域。然而,缺失数据问题却广泛存在于统计学、社会学和流行病学等领域。同样该问题也一直困扰着交通领域的深入研究,如交通流,出行时间,尾气排放,车辆噪音等缺失数据。
在交通领域的数据缺失问题研究中,可以根据缺失数据的模式和缺失数据的机理进一步划分。其中,按交通数据缺失位置的不同,具体可划分为完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(MNAR)三种类型。并按缺失数据长度的不同,同样将其划分为点状缺失、线状缺失、面状缺失三类。以往的研究中,针对非随机缺失模式的研究中主要通过针对基于交通历史数据来进行预测,而针对完全随机缺失模式和随机缺失模式的研究较少。并且,总结以往在考虑缺失数据长度情形的研究,针对线状缺失情形的研究较少。此外,在针对城市路网中缺失流量的估计研究中,需要考虑复杂的道路网络结构以及缺失流量所在路网中的位置不固定的影响。
在以往针对缺失数据填充的研究方法中可以分为基于机器学习方法、基于时空插值方法和基于统计学习方法三类。存在如下问题:
(1)在进行大规模缺失数据的研究中,多数研究集中在数据缺失率对流量估计的影响,较少所针对的缺失模式中进行划分。在不同缺失模式的研究中,针对路段出现线状缺失场景的研究较少。而这种现象在LPR检测器出现检测、存储故障时尤为普遍。
(2)在进行复杂城市路网中部分缺失流量估计研究中,使用不同固定检测器所获取的真实数据来构建张量分解模型时,并没有考虑固定检测器间所在路段之间的差异。当检测器布设稀疏时,固定检测器之间的差异性较大,此时输入张量内的数据中的空间维度的相关性较差,进而对插值准确性造成一定的影响。
(3)在建立CP张量分解模型来进行缺失值填充中,往往基于数据之间的相似性来选择相邻路段数据构建同一维度内张量。但是并没有比较不同张量维度间的相似性。如将不同天数间,不同路段间,不同月份间的数据构建张量时,出现不同路段间的相似性相较于另外两个相似性较差,则CP张量模型中并没用差异化的权重。此外,在搭建张量模型中不同维度的结构时,并没有进行在同一维度内进行预筛选后决定张量结构,而在复杂城市路网中不同路段间的影响尤为重要。
发明内容
针对现有技术中存在的问题,本发明提供一种基于张量分解的城市路网线状缺失流量估计方法及系统,获取全时空的LPR数据,保证了数据完整性和准确性。
为达到上述目的,本发明提供了一种基于张量分解的城市路网线状缺失流量估计方法,其特征在于,包括:
获取待分析路网中安装车牌照片识别的路段;
获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量;
构建4维张量模型,维度包括天数、时段、路段以及数据类型;所述数据类型包括车流量及车载手机用户的流量;采用获取的车流量和车载手机用户的流量填充所述4维张量模型;
重复进行张量分解和恢复,完成缺失车流量的估计。
进一步地,进行数据预处理获取车流量,包括:
进行图像识别,获取车牌号和驶过时间;
选择车牌号识别准确的数据,剔除冗余数据,进行数据格式转换存储在数据库中;LPR检测器映射到路网的待分析路网打点地图中,获取各天各个路段各个时段内的车流量。
进一步地,进行预处理获得路段车载手机用户的流量,包括:将手机定位数据映射到路网地图中,计算单位时间内的平均速度,如果低于设定阈值则剔除该手机定位数据;基于剩余的手机定位数据,统计各天各个路段各个时段内的车载手机用户的流量。
进一步地,平均速度计算如下:
Figure BDA0003341001390000041
其中,m表示在单位时段T内的手机用户的定位点个数,Tk表示第k个时刻与上一时刻的时间段,x(k)表示在第k个时刻所在位置的经纬度坐标信息。
进一步地,将手机定位数据映射到路网地图中后,还包括计算最大瞬时速度,剔除每条路段中最大瞬时速度超过该路段最高限速的手机定位数据。
进一步地,计算最大瞬时速度如下:
Figure BDA0003341001390000042
其中,Tk表示手机用户在第k个时刻与第k-1个时刻内的时段,x(k)与x(k-1)分别表示手机用户的第k个时刻与第k-1个时刻的地理位置经纬度。
进一步地,重复进行张量分解和恢复包括:
基于张量矩阵χ构建加权原始矩阵:
Figure BDA0003341001390000043
加权矩阵ω,张量矩阵χ数据缺失位置的元素值为0,反之为1;
对张量矩阵χ进行CP分解,获得
Figure BDA0003341001390000044
其中A为分解后的时间因子矩阵,B为分解后的路段因子矩阵,C为分解后的天数因子矩阵,D为分解后的数据类别因子矩阵;
相同尺寸恢复后的加权张量为:
Figure BDA0003341001390000051
其中xijkl为张量矩阵χ第i个天数,第j个时段,第k个路段的手机定位数据或车牌数据,l为1表示手机定位数据,l为2表示车牌数据;ωijkl为加权矩阵ω第i个天数,第j个时段第k个路段的手机或车牌数据的权值;air,bjr,ckr,dlr分别为时间因子矩阵A,路段因子矩阵B,天数因子矩阵C以及数据因子矩阵D的元素;R为张量分解的秩数;n1,n2,n3,n4分别为天数总数、时段总个数、路段总数以及数据类型总数;
更新梯度G(n)=-2Y(n)A(-n)+2Z(n)A(-n)
式中:Y(n)为加权原始矩阵y的第n个张量的原始值,Z(n)为恢复后的加权张量
Figure BDA0003341001390000052
第n个张量的恢复值;G(n)为第n个张量的更新梯度;
A(-n)=D⊙C⊙B⊙A,其中⊙表示矩阵的Khatri-Rao积;
计算损失函数,如果满足精度要求,则完成迭代,否则返回对张量矩阵χ进行CP分解步骤。
进一步地,CP分解过程的损失函数为:
Figure BDA0003341001390000053
其中,TA为相应时间维度内的平均每个路段各个天内所有数据类别的交通量矩阵,TB为相应路段维度内平均每天中各个时段内所有数据类别的交通量矩阵,TC为相应天数维度内平均每个路段中各个时段内所有数据类别的交通量矩阵,Ttype为相应的数据类别维度内平均每个路段中各个天内所有时段内的交通量矩阵,λ1,λ2,λ3,λ4,p是各部分正则化项的权重稀疏;所述交通量为车流量和车载手机用户的流量的均值。
第二方面挺一种基于张量分解的城市路网线状缺失流量估计系统,包括:
路段选择模块,获取待分析路网中安装车牌照片识别的路段;
数据获取模块,获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量;
张量构建模块,构建4维张量模型,维度包括天数、时段、路段以及数据类型;所述数据类型包括车流量及车载手机用户的流量;采用获取的车流量和车载手机用户的流量填充所述4维张量模型;
张量分解模块,重复进行张量分解和恢复,完成缺失车流量的估计。
第三方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有程序指令,当所述程序指令由处理器运行时,实现所述的基于张量分解的城市路网线状缺失流量估计方法。
本发明的上述技术方案具有如下有益的技术效果:
(1)本发明使用作为一种全时空覆盖的移动检测器中的手机定位数据,以及多源数据之间的时空相关性,来填充固定检测器中LPR检测器出现交通量线状缺失的情况,获取了完整的全时空覆盖的LPR数据,保证了数据完整性和准确性。
(2)本发明通过选用张量分解方法来进行交通缺失流量填充,不仅可以保持张量分解方法优点,而且还能更好的挖掘多维度的交通数据内在相关性。
(3)本发明通过在所构建的张量模型中添加正则化惩罚系数,更好的考虑了在流量填充估计中的数据间权重与时空权重的关系。
(4)本发明针对城市路网中出现流量线状缺失的路段进行插值估计,其中考虑了不同缺失长度,以及不同缺失率下的流量插值准确性研究。此外,对比使用不同张量方法下流量插值的准确率,并尝试建立不同维数下的张量估计模型。
附图说明
图1是基于张量分解的城市路网线状缺失流量估计流程示意图;
图2是基于张量分解的城市路网线状缺失流量估计系统示意图;
图3为路网中LPR点位布设示意图;
图4为路网中手机定位分布示意图;
图5为四维张量的表示形式。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
根据数据缺失位置的分布情况分为完全随机缺失,随机缺失以及非随机缺失三种。
在随机缺失模式下,数据缺失点与其相邻数据点之间是相关的。根据缺失数据的长度类型,同样将数据缺失模式进一步划分。将缺失流量的类型分别划分为点状缺失,线状缺失,以及面状缺失3种类型。其每种类型的定义如下所示:
点状缺失:表示路段中所获取的交通流数据只在某个时刻下存在缺失,且其他相邻位置为完整数据;
线状缺失:表示所获取的交通流数据中出现连续个时刻中流量数据缺失,且其余位置为完整数据;
面状缺失:表示所获取的数据中有连续个时刻中流量数据缺失,且其相邻位置数据也存在缺失。
通过对装有LPR检测器设备的路段研究发现,部分路段存在连续线状缺失流量与点状缺失流量。
通过手机数据与LPR数据,采集的同一时空范围内的路段的流量数据,而其中LPR数据能够获得路网中完整的交通量,而手机数据由于所获取数据的市场占有率限制,其只能获取部分流量数据,但由于手机数据具有全路网时空范围均匀分布的性质,因此两种数据之间存在高度相似性,可将两种数据看作同构数据。当LPR数据出现线状缺失时,手机数据具有在任何时刻内都能记录出行数据的完整性,可更好的填补缺失的LPR数据。
在一些实施例中,提供一种基于张量分解的城市路网线状缺失流量估计方法,包括如下步骤:
S100获取待分析路网中安装车牌照片识别的路段。
路网中,部分路段安装有车牌照片识别LPR,针对安装车牌照片识别LPR的路段中缺失的流量进行估计。
S200获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量。
进行数据预处理获取车流量,包括:
(1)进行图像识别,获取车牌号和驶过时间。
(2)选择车牌号识别准确的数据,剔除冗余数据,进行数据格式转换存储在数据库中;LPR检测器映射到路网的待分析路网打点地图中,获取各天各个路段各个时段内的车流量。
进行预处理获得路段车载手机用户的流量,包括:将手机定位数据映射到路网地图中,计算单位时间内的平均速度,如果低于设定阈值则剔除该手机定位数据;计算最大瞬时速度,剔除每条路段中最大瞬时速度超过该路段最高限速的手机定位数据;基于剩余的手机定位数据,统计各天各个路段各个时段内的车载手机用户的流量。
将手机定位数据映射到路网地图中,具体包括:先将手机定位数据在考虑其定位误差精度情况下将其映射至研究路网中各路段上,即为手机定位数据的路网映射过程。该步骤作为获得交通参数信息的前提,主要是一个将包含地理位置信息的手机定位数据与路网地图信息相关联的过程。
使用的手机三角定位数据采用的原始坐标系为GCJ-02,它是一种由中国国家测绘局制定的地理信息坐标系统。采用Github中所公开的坐标转换算法,将基于GCI-02坐标下的手机定位数据转换为WGS84坐标场景。在一个实施例中,选用由Python工具包开发的Transform_utils模块来实现两种坐标系的转换操作。
由于手机三角定位数据只记录了手机的经纬度位置信息,并没有任何与路段位置信息相关的标签。因此,需要将手机定位数据与电子地图中路网进行匹配,完成手机定位数据与路网地理坐标信息相互关联。拓扑算法,自动打点法,概率法等方法实现该匹配。
选择先计算手机用户的平均移动速度,并通过设定不同出行方式的速度阈值来进行筛选出非机动车的出行模式。然后通过评估手机用户的瞬时速度最大值是否满足所在道路的最大限速要求,从而判断是否为错误或者漂移数据。其中,如果超过最大限速的阈值,可能为手机用户的漂移或错误数据,同样需要剔除该手机用户的数据。
基于手机定位数据的平均速度计算公式如下所示:
Figure BDA0003341001390000101
其中,k表示每个手机用户在第k个时刻,m表示在时段T内的手机用户的定位点个数,Tk表示第k个时刻与上一时刻的时间段,x(k)表示在第k个时刻所在位置的经纬度坐标信息。
考虑到研究所在南京市的城市路网实际交通运行状况,本章设定步行出行的速度阈值范围为0-7km/h,自行车出行的速度阈值范围在0-15km/h之间。而当城市路网内路段不出现交通拥堵的状况下,车辆的平均速度一般都大于16km/h。因此,选择16km/h的平均速度作为车载手机用户数出行的最低速度阈值。如果所计算的平均速度大于16km/h,则我们可认为该手机定位数据是由车载手机用户发送的。
此外,还使用手机数据的最大瞬时速度来判断该手机定位数据是否来自行驶车辆中所发送的连续信号。最大瞬时速度计算公式如下所示:
Figure BDA0003341001390000111
其中,Tk表示手机用户在第k个时刻与第k-1个时刻内的时段。x(k)与x(k-1)分别表示手机用户的第k个时刻与第k-1个时刻的地理位置经纬度。
城市中所有道路划分为主干路,次干路,支路。而不同道路等级下所要求的最大速度要求也不同。在一个实施例中选择80km/h的手机用户瞬时速度作为最大速度阈值。如果最大速度超过80km/h,则认为该手机用户的定位数据是不连续的,进而需要剔除。
S300构建4维张量模型,维度包括天数、时段、路段以及数据类型;所述数据类型包括车流量及车载手机用户的流量;采用获取的车流量和车载手机用户的流量填充所述4维张量模型。
结合图5,形成4维张量模型,维度为天数×时段×路段×数据类型。将步骤S200获取的数据填充到4维张量模型,获取原始张量矩阵χ。
天数例如可以选择一个星期;时段为每日内的时段划分,例如选择15分钟为一个时段,则全天划分为96个时段;路段为步骤(1)选出的各个路段。获取的车流量和车载手机用户的流量为每个时段内的数据,填充至对应位置。
S400重复进行张量分解和恢复,完成缺失车流量的估计。
本发明基于交通流量数据填补中的先验信息,并对CP分解方法进行改进。通过引入了正则化惩罚系数的来描述不同天数,不同路段以及不同数据的因子矩阵的权重,提出了基于一种基于数据融合的CP分解方法(Data fusion based CP tensor decompositionmethod,简称DFCP)。
首先,对张量矩阵χ进行分解:
Figure BDA0003341001390000121
采用CP张量分解形式进行分解,获得因子矩阵A,B,C,D。
本方法将基于对稀疏张量分解中的优化方法,将该低秩逼近问题转化为一个无约束优化问题,将恢复后的张量与真实值的残差平方和作为一个无约束优化问题,并使用梯度下降法求解目标函数,其形式为:
Figure BDA0003341001390000122
对目标函数中的决策变量air,bir,cir,dlr分别求偏导数,得到:
Figure BDA0003341001390000123
Figure BDA0003341001390000124
Figure BDA0003341001390000125
Figure BDA0003341001390000126
其中xijkl为张量矩阵χ第i个天数,第j个时段,第k个路段的手机定位数据或车牌数据,l为1表示手机定位数据,l为2表示车牌数据;ωijkl为加权矩阵ω第i个天数,第j个时段第k个路段的手机或车牌数据的权值;air,bjr,ckr,dlr分别为时间因子矩阵A,路段因子矩阵B,天数因子矩阵C以及数据因子矩阵D的元素;R为张量分解的秩数;n1,n2,n3,n4分别为天数总数、时段总个数、路段总数以及数据类型总数;根据梯度下降法,在每次迭代过程中的更新公式为:
Figure BDA0003341001390000131
Figure BDA0003341001390000132
Figure BDA0003341001390000133
Figure BDA0003341001390000134
这里的α表示梯度下降的步长,又称学习率。正常的稠密矩阵即可按照上述的更新公式逐步更新air,bir,ckr,dlr等参数,在目标函数小于某个值的时候终止迭代,从而输出全部结果。
此后,依据所分解的因子矩阵A,B,C,D,依据原始张量
Figure BDA0003341001390000135
对张量
Figure BDA0003341001390000136
进行填充。假设ω是与原始张量矩阵χ尺寸相同的加权矩阵,则加权后的张量y为:
Figure BDA0003341001390000137
式中,*表示矩阵对应元素相乘的Hadamard积,在加权矩阵ω中,数据缺失位置的元素值为0,反之为1。
CP方法的是使用上述目标函数,利用原始数据张量中存在观测值位置的估计误差来进行优化,而对于其他的缺失位置则不单独进行更新。
假定
Figure BDA0003341001390000138
为加权后的原始矩阵,
Figure BDA0003341001390000139
为相同尺寸的恢复后的加权张量矩阵,原始的CP分解计算损失函数如下:
Figure BDA00033410013900001310
DFCP方法依据交通流数据中不同维度之间的相关性方式,在CP分解方法基础上加入了正则化项约束。其核心思想是由于城市网络中各路段之间相互连接,路段之间的交通量在时空范围内具有一定的相关性。依据这种路段间的时空相关性,使调节待填充流量的路段与相似路段权重更大一些,而与不相似路段的权重更小一些,从而保证所填充的流量保持在合理范围内。因此,假定A为分解后的时间因子矩阵,B为分解后的路段因子矩阵,C为分解后的天数因子矩阵,D为分解后的数据类别因子矩阵,在考虑原目标函数的基础上加入体现路段的时变特征的正则化项,包括拟合时段特性||A-TA||、路段特性||B-TB||,天数特性||C-TC||以及数据类别特性||D-Ttype||四种约束,此外还需要加入防止过拟合的正则项||A||2+||B||2+||C||2+||D||2,以提升算法在未知数据的补全效果。在加入多种上述正则化项后的损失函数可以表示为:
Figure BDA0003341001390000141
其中,TA为相应时间维度内的平均每个路段各个天内所有数据类别的交通量矩阵,TB为相应路段维度内平均每天中各个时段内所有数据类别的交通量矩阵,TC为相应天数维度内平均每个路段中各个时段内所有数据类别的交通量矩阵,Ttype为相应的数据类别维度内平均每个路段中各个天内所有时段内的交通量矩阵,λ1,λ2,λ3,λ4,p是各部分正则化项的权重系数。交通量为手机用户的流量与车流量求和后除以2,为二者均值。
利用研究路段中的手机定位数据所获取部分流量与LPR检测器所获取真实流量的相关性,以及移动检测器数据在时空范围内的连续性与完整性,能更好描述线状缺失的数据信息。进而有效弥补了路网中固定检测器布设稀疏的影响。
采用公式(15)恢复的张量矩阵χ,
Figure BDA0003341001390000151
每次迭代过程中对每个分解后的张量A(n)重新计算梯度如下:
G(n)=-2Y(n)A(-n)+2Z(n)A(-n) (16)
式中:G(n)为第n个张量的更新梯度,Y(n)为加权原始矩阵y第n个张量的原始值,Z(n)为恢复后的加权张量
Figure BDA0003341001390000152
第n个张量的恢复值。
其中的A(-n)的计算方法如下:A(-n)D⊙C⊙B⊙A
⊙表示矩阵的Khatri-Rao积。逐渐迭代更新矩阵,并且在目标函数达到要求时可以提前终止程序。
完成迭代的过程即完成了张量矩阵的填充,可以读取完整的流量数据,根据天数、时段、路段进行数据读取。
本发明提供一种基于张量分解的城市路网线状缺失流量估计系统,结合图2,包括路段选择模块、数据获取模块、张量构建模块以及张量分解模块。
路段选择模块,获取待分析路网中安装车牌照片识别的路段。
数据获取模块,获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量。
张量构建模块,构建4维张量模型,维度包括天数、时段、路段以及数据类型;所述数据类型包括车流量及车载手机用户的流量;采用获取的车流量和车载手机用户的流量填充所述4维张量模型。
张量分解模块,重复进行张量分解和恢复,完成缺失车流量的估计。
提供一种计算机可读存储介质,所述计算机可读存储介质中存储有程序指令,当所述程序指令由处理器运行时,实现所述的基于张量分解的城市路网线状缺失流量估计方法。
计算机可读存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。
实施例
选取江苏省南京南站中北面3公里范围内的城市路网来作为研究对象,其中所在路网中路段等级具有多样性,其包含了主干路,次干路,支路等不同道路等级的路段。该研究路网中共有36条双向路段,其中装有LPR检测器设备的路段为20条,其中,路网中的LPR布设点位置如下图3所示。这些LPR检测器所布设的路段被当作能获取真实流量的路段,而其中针对这些路段中出现线状缺失流量的填补,即为估计对象。同时该研究路网中所有也覆盖与LPR数据的时段相同的手机定位数据。手机定位数据的分布如图4所示。
本发明基于DFCP的方式进行分解重构,作为对比的方法选择最小二乘法的CP分解算法(CP-ALS),高精度低秩张量填充算法(high accuracy low rank tensor completion,简称HaLRTC)和Tucker分解填充算法。
在Python软件平台,借助tensorly开源软件包实现,计算机配置为Intel(R)Corei7-6500U CPU@2.50GHz 2.59GHZ,安装内存为8GB。为了确保实验结果的可信度,对于每种实验,均运行10次,最终得到10次的平均值。
不同线状缺失长度的流量填补MAPE估计结果参见表1。由表1不同线状缺失长度在不同缺失率下的MAPE估计结果可知,其中,从整体结果上看出,本发明所提出的DFCP分解方法要明显好于另外三种方法的估计结果。且依次是CP-ALS估计方法,Tucker(5,5,5)估计方法,以及HaLRTC估计方法。其中,随着缺失长度以及缺失率的增加,四种方法的估计误差都有所增加,但是相比较DFCP估计估计结果相对比较稳定。而Tucker(5,5,5)与HaLRTC估计方法随着缺失长度的不同,准确率变化较大,其中出现了当缺失长度为3的缺失率为50%时出现较大的误差,反而在缺失长度增加但是缺失率减少的情况下,MAPE的准确率估计结果有所下降。这反应了这两种方法受到缺失率影响的相对于较大。当出现缺失率较高,本章所提出的DFCP分解方法更有优势。其中,从本章的估计结果可得,当缺失长度在12个单位且缺失率为10%时,DFCP方法估计结果相对其他估计方法优势更大。
表1不同线状缺失长度的流量填补MAPE估计结果
Figure BDA0003341001390000171
Figure BDA0003341001390000181
综上所述,本发明涉及一种基于张量分解的城市路网线状缺失流量估计方法及系统,获取待分析路网中安装车牌照片识别的路段;获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量;构建4维张量模型;采用获取的车流量和车载手机用户的流量填充所述4维张量模型;重复进行张量分解和恢复,完成缺失车流量的估计。本发明使用作为一种全时空覆盖的移动检测器中的手机定位数据,以及多源数据之间的时空相关性,来填充固定检测器中LPR检测器出现交通量线状缺失的情况,获取全时空的LPR数据,保证了数据完整性和准确性。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (9)

1.一种基于张量分解的城市路网线状缺失流量估计方法,其特征在于,包括:
获取待分析路网中安装车牌照片识别的路段;
获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量;
构建4维张量模型,维度包括天数、时段、路段以及数据类型;所述数据类型包括车流量及车载手机用户的流量;采用获取的车流量和车载手机用户的流量填充所述4维张量模型;
重复进行张量分解和恢复,完成缺失车流量的估计;
重复进行张量分解和恢复包括:
基于张量矩阵χ构建加权原始矩阵:
Figure FDA0004039722940000011
加权矩阵ω,张量矩阵χ数据缺失位置的元素值为0,反之为1;
对张量矩阵χ进行CP分解,获得
Figure FDA0004039722940000012
其中A为分解后的时间因子矩阵,B为分解后的路段因子矩阵,C为分解后的天数因子矩阵,D为分解后的数据类别因子矩阵;
相同尺寸恢复后的加权张量为:
Figure FDA0004039722940000013
其中xijkl为张量矩阵χ第i个天数,第j个时段,第k个路段的手机定位数据或车牌数据,l为1表示手机定位数据,l为2表示车牌数据;ωijkl为加权矩阵ω第i个天数,第j个时段第k个路段的手机或车牌数据的权值;air,bjr,ckr,dlr分别为时间因子矩阵A,路段因子矩阵B,天数因子矩阵C以及数据因子矩阵D的元素;R为张量分解的秩数;n1,n2,n3,n4分别为天数总数、时段总个数、路段总数以及数据类型总数;
更新梯度G(n)=-2Y(n)A(-n)+2Z(n)A(-n)
式中:Y(n)为加权原始矩阵y的第n个张量的原始值,Z(n)为恢复后的加权张量Z第n个张量的恢复值;G(n)为第n个张量的更新梯度;
A(-n)=D⊙C⊙B⊙A,其中⊙表示矩阵的Khatri-Rao积;
计算损失函数,如果满足精度要求,则完成迭代,否则返回对张量矩阵X进行CP分解步骤。
2.根据权利要求1所述的基于张量分解的城市路网线状缺失流量估计方法,其特征在于,进行数据预处理获取车流量,包括:
进行图像识别,获取车牌号和驶过时间;
选择车牌号识别准确的数据,剔除冗余数据,进行数据格式转换存储在数据库中;LPR检测器映射到路网的待分析路网打点地图中,获取各天各个路段各个时段内的车流量。
3.根据权利要求1或2所述的基于张量分解的城市路网线状缺失流量估计方法,其特征在于,进行预处理获得路段车载手机用户的流量,包括:将手机定位数据映射到路网地图中,计算单位时间内的平均速度,如果低于设定阈值则剔除该手机定位数据;基于剩余的手机定位数据,统计各天各个路段各个时段内的车载手机用户的流量。
4.根据权利要求3所述的基于张量分解的城市路网线状缺失流量估计方法,其特征在于,平均速度计算如下:
Figure FDA0004039722940000031
其中,m表示在单位时段T内的手机用户的定位点个数,Tk表示第k个时刻与上一时刻的时间段,x(k)表示在第k个时刻所在位置的经纬度坐标信息。
5.根据权利要求4所述的基于张量分解的城市路网线状缺失流量估计方法,其特征在于,将手机定位数据映射到路网地图中后,还包括计算最大瞬时速度,剔除每条路段中最大瞬时速度超过该路段最高限速的手机定位数据。
6.根据权利要求5所述的基于张量分解的城市路网线状缺失流量估计方法,其特征在于,计算最大瞬时速度如下:
Figure FDA0004039722940000032
其中,Tk表示手机用户在第k个时刻与第k-1个时刻内的时段,x(k)与x(k-1)分别表示手机用户的第k个时刻与第k-1个时刻的地理位置经纬度。
7.根据权利要求1或2所述的基于张量分解的城市路网线状缺失流量估计方法,其特征在于,CP分解过程的损失函数为:
Figure FDA0004039722940000033
其中,TA为相应时间维度内的平均每个路段各个天内所有数据类别的交通量矩阵,TB为相应路段维度内平均每天中各个时段内所有数据类别的交通量矩阵,TC为相应天数维度内平均每个路段中各个时段内所有数据类别的交通量矩阵,Ttype为相应的数据类别维度内平均每个路段中各个天内所有时段内的交通量矩阵,λ1,λ2,λ3,λ4,p是各部分正则化项的权重稀疏;所述交通量为车流量和车载手机用户的流量的均值。
8.一种基于张量分解的城市路网线状缺失流量估计系统,其特征在于,包括:
路段选择模块,获取待分析路网中安装车牌照片识别的路段;
数据获取模块,获取所述路段特定时段的车牌照片识别数据,进行数据预处理获取车流量;获取所述路段特定时段的手机定位数据,进行预处理获得路段车载手机用户的流量;
张量构建模块,构建4维张量模型,维度包括天数、时段、路段以及数据类型;所述数据类型包括车流量及车载手机用户的流量;采用获取的车流量和车载手机用户的流量填充所述4维张量模型;
张量分解模块,重复进行张量分解和恢复,完成缺失车流量的估计;
所述张量分解模块中,重复进行张量分解和恢复包括:
基于张量矩阵χ构建加权原始矩阵:y=w*χ;加权矩阵ω,张量矩阵χ数据缺失位置的元素值为0,反之为1;
对张量矩阵χ进行CP分解,获得χ=[A,B,C,D],其中A为分解后的时间因子矩阵,B为分解后的路段因子矩阵,C为分解后的天数因子矩阵,D为分解后的数据类别因子矩阵;
相同尺寸恢复后的加权张量为:
Figure FDA0004039722940000051
其中xijkl为张量矩阵χ第i个天数,第j个时段,第k个路段的手机定位数据或车牌数据,l为1表示手机定位数据,l为2表示车牌数据;ωijkl为加权矩阵ω第i个天数,第j个时段第k个路段的手机或车牌数据的权值;air,bjr,ckr,dlr分别为时间因子矩阵A,路段因子矩阵B,天数因子矩阵C以及数据因子矩阵D的元素;R为张量分解的秩数;n1,n2,n3,n4分别为天数总数、时段总个数、路段总数以及数据类型总数;
更新梯度G(n)=-2Y(n)A(-n)+2Z(n)A(-n)
式中:Y(n)为加权原始矩阵y的第n个张量的原始值,Z(n)为恢复后的加权张量Z第n个张量的恢复值;G(n)为第n个张量的更新梯度;
A(-n)=D⊙C⊙B⊙A,其中⊙表示矩阵的Khatri-Rao积;
计算损失函数,如果满足精度要求,则完成迭代,否则返回对张量矩阵χ进行CP分解步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,当所述程序指令由处理器运行时,实现权利要求1至7之一所述的基于张量分解的城市路网线状缺失流量估计方法。
CN202111308250.8A 2021-11-05 2021-11-05 基于张量分解的城市路网线状缺失流量估计方法及系统 Active CN114120635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111308250.8A CN114120635B (zh) 2021-11-05 2021-11-05 基于张量分解的城市路网线状缺失流量估计方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111308250.8A CN114120635B (zh) 2021-11-05 2021-11-05 基于张量分解的城市路网线状缺失流量估计方法及系统

Publications (2)

Publication Number Publication Date
CN114120635A CN114120635A (zh) 2022-03-01
CN114120635B true CN114120635B (zh) 2023-03-03

Family

ID=80380954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111308250.8A Active CN114120635B (zh) 2021-11-05 2021-11-05 基于张量分解的城市路网线状缺失流量估计方法及系统

Country Status (1)

Country Link
CN (1) CN114120635B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115376309B (zh) * 2022-06-29 2024-04-26 华南理工大学 一种基于多视角时间矩阵分解的缺失交通数据修复方法
CN115964621B (zh) * 2023-03-17 2023-05-09 中国科学技术大学 区域路网尾气排放数据补全方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093621A (zh) * 2013-01-07 2013-05-08 北京世纪高通科技有限公司 一种多源交通信息融合的处理方法和装置
CN105679022A (zh) * 2016-02-04 2016-06-15 北京工业大学 一种基于低秩的多源交通数据的补全方法
CN107992536A (zh) * 2017-11-23 2018-05-04 中山大学 基于张量分解的城市交通缺失数据填补方法
CN112820104A (zh) * 2020-12-31 2021-05-18 北京航空航天大学 一种基于时空聚类张量分解的交通数据补全方法
CN112988760A (zh) * 2021-04-27 2021-06-18 北京航空航天大学 一种基于张量分解的交通时空大数据缺失补全方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111243277B (zh) * 2020-03-09 2021-08-20 山东大学 基于车牌识别数据的通勤车辆时空轨迹重构方法及系统
CN112419712B (zh) * 2020-11-04 2021-12-10 同盾控股有限公司 道路断面车速检测方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093621A (zh) * 2013-01-07 2013-05-08 北京世纪高通科技有限公司 一种多源交通信息融合的处理方法和装置
CN105679022A (zh) * 2016-02-04 2016-06-15 北京工业大学 一种基于低秩的多源交通数据的补全方法
CN107992536A (zh) * 2017-11-23 2018-05-04 中山大学 基于张量分解的城市交通缺失数据填补方法
CN112820104A (zh) * 2020-12-31 2021-05-18 北京航空航天大学 一种基于时空聚类张量分解的交通数据补全方法
CN112988760A (zh) * 2021-04-27 2021-06-18 北京航空航天大学 一种基于张量分解的交通时空大数据缺失补全方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Traffic Volume Estimation in Multimodal Urban Networks Using Cellphone Location Data";邢吉平等;《IEEE INTELLIGENT TRANSPORTATION SYSTEMS MAGAZINE》;20190625;第93-104页 *

Also Published As

Publication number Publication date
CN114120635A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN109658695B (zh) 一种多因素的短时交通流预测方法
CN114120635B (zh) 基于张量分解的城市路网线状缺失流量估计方法及系统
Zheng et al. U-air: When urban air quality inference meets big data
Ren et al. Mtrajrec: Map-constrained trajectory recovery via seq2seq multi-task learning
CN107103753A (zh) 交通时间预测系统、交通时间预测方法以及交通模型建立方法
US20160125307A1 (en) Air quality inference using multiple data sources
CN107516417A (zh) 一种挖掘时空关联关系的实时高速公路流量估计方法
CN113792929B (zh) 交通流量预测方法、电子设备及存储介质
CN109840660A (zh) 一种车辆特征数据处理方法及车辆风险预测模型训练方法
CN111582559B (zh) 一种到达时间的预估方法及装置
JP7157620B2 (ja) 予測システムおよび予測方法
EP2104081A1 (en) Method for providing a traffic pattern for navigation map data and navigation map data
CN105091889A (zh) 一种热点路径的确定方法及设备
CN110414732A (zh) 一种出行未来轨迹预测方法、装置、储存介质及电子设备
CN110598917B (zh) 一种基于路径轨迹的目的地预测方法、系统及存储介质
JP2022022106A (ja) コンピュータが実施する、ルートのエネルギ使用を予測する方法
WO2023277814A2 (en) Computer-implemented apparatus and method for predicting traffic conditions in a route planning application
Chen et al. UVLens: Urban village boundary identification and population estimation leveraging open government data
CN111861017A (zh) 一种基于现网数据的充电站网络优化方法
CN115099328A (zh) 基于对抗网络的交通流量预测方法、系统、设备及存储介质
CN112541621B (zh) 一种移动预测方法、智能终端及存储介质
Cai et al. Bicycle sharing station planning: From free-floating to geo-fencing
Yue et al. Simulation and prediction of land use change in Dongguan of China based on ANN cellular automata-Markov chain model
CN115691140B (zh) 一种汽车充电需求时空分布的分析与预测方法
CN108712317B (zh) 一种基于移动社交网络的城市人群时空动态感知方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant